KR20230069135A - 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 - Google Patents

헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 Download PDF

Info

Publication number
KR20230069135A
KR20230069135A KR1020237011164A KR20237011164A KR20230069135A KR 20230069135 A KR20230069135 A KR 20230069135A KR 1020237011164 A KR1020237011164 A KR 1020237011164A KR 20237011164 A KR20237011164 A KR 20237011164A KR 20230069135 A KR20230069135 A KR 20230069135A
Authority
KR
South Korea
Prior art keywords
sequence
double
primer
stranded
adapter
Prior art date
Application number
KR1020237011164A
Other languages
English (en)
Inventor
앤드류 슬래터
Original Assignee
일루미나 케임브리지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나 케임브리지 리미티드 filed Critical 일루미나 케임브리지 리미티드
Publication of KR20230069135A publication Critical patent/KR20230069135A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/319Exonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/531Glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/313Branched oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

이중 가닥 핵산 단편을 포함하는 시퀀싱 라이브러리를 농축시키는 방법으로서, 이중 가닥 단편의 말단에 하나 이상의 어댑터를 갖는 이중 가닥 단편의 라이브러리를 제작하는 단계; 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체의 표적 서열에 결합하고, 비표적 서열에 결합하지 않는 연장 프라이머를 혼성화시키는 단계를 포함하는 방법이 본원에 개시된다. 일 구현예에서, 어댑터는 헤어핀 어댑터이며, 5'→3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여 연장 프라이머로부터 연장시켜 증폭 프라이머 서열에 적어도 부분적으로 상보적인 헤어핀 어댑터의 서열의 전부 또는 일부를 제거한다.

Description

헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
관련 출원의 교차 참조
본 출원은 2020년 9월 11일자 출원된 "METHODS OF ENRICHING A TARGET SEQUENCE FROM A SEQUENCING LIBRARY USING HAIRPIN ADAPTORS"라는 발명의 명칭의 미국 임시 출원 제63/077,271호에 대한 우선권 및 이익을 주장하며, 상기 문헌의 개시내용은 그 전문이 본원에 참조로 인용된다.
서열 목록
본 출원은 ASCII 형식으로 전자문서로 제출된 서열목록을 포함하며, 이는 그 전체가 본원에 참조로 인용된다. 2021년 9월 8일자 생성된 상기 ASCII 사본의 명칭은 IP-2043-PCT_SL.txt이고, 크기는 806바이트이다.
기술분야
본 개시내용은 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 제작에 관한 것이다.
시퀀싱 라이브러리에서 표적 서열을 농축시키는 것은 느리고 복잡한 워크플로우에 의해 방해를 받을 수 있다. 예를 들어, 혼성화 포획 방법을 사용한 라이브러리 농축은 혼성화 포획 단계 전 전체 라이브러리의 증폭을 필요로 한다. 또한, 표적화된 증폭을 이용한 통상의 농축 방식은 단편 말단 정보를 손실할 수 있다.
본 발명의 방법은 시퀀싱 라이브러리에서 표적 서열을 농축시키기 위해 헤어핀 어댑터를 사용한다. 일부 경우에, 단일 증폭 단계로 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 헤어핀 어댑터를 이용하는 이러한 방법은 무세포 DNA의 분석과 단편 중복제거 접근법에 도움이 될 수 있는 단편 말단 정보의 손실을 회피할 수 있다.
상세한 설명에 따르면, 이중 가닥 라이브러리 단편의 한쪽 또는 양쪽 가닥의 5' 말단에서 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 본원에 기재된다. 분기형(forked) 어댑터, 및 분기형 어댑터를 이용하여 시퀀싱 라이브러리를 생성하는 방법 및 이를 위한 키트가 또한 본원에 기재된다.
핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터로서, 5' 말단과 3' 말단을 갖는 제1 서열과, 5' 말단과 3' 말단을 갖는 제2 서열을 포함하며; 여기서 제1 서열의 3' 말단의 일부와 제2 서열의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고; 제1 서열의 5' 말단의 일부와 제2 서열의 3' 말단의 일부는 비상보적이고; 제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함하는 어댑터가 본원에 개시된다.
일부 구현예에서, 제2 이중 가닥 영역은 헤어핀 구조이다. 일부 구현예에서, 제2 이중 가닥 영역은 비핵산 부분을 포함한다. 일부 구현예에서, 비핵산 부분은 링커이다. 일부 구현예에서, 제1 가닥의 5' 말단은 엑소뉴클레아제에 의해 분해되지 않는 부분을 포함한다. 일부 구현예에서, 제1 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 가닥의 5' 말단은 인산화된다. 일부 구현예에서, 제1 가닥과 제2 가닥의 모든 시토신 염기는 메틸화된다. 일부 구현예에서, 어댑터는 포획 모이어티를 추가로 포함한다.
핵산 시퀀싱 라이브러리를 제작하는 방법으로서, 복수의 이중 가닥 핵산 단편을 생성하는 단계와, 하나 이상의 분기형 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계를 포함하는 방법이 또한 본원에 개시된다. 일부 구현예에서, 어댑터는 태그먼트화(tagmentation)를 통해 부착된다. 일부 구현예에서, 어댑터는 결찰을 통해 부착된다.
핵산 시퀀싱 라이브러리를 제작하기 위한 키트로서, 분기형 어댑터; 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머; 적어도 하나의 효소; 및 dNTP를 포함하는 키트가 또한 본원에 기재된다.
일부 구현예에서, 적어도 하나의 효소는 엑소뉴클레아제 활성을 갖는다. 일부 구현예에서, 적어도 하나의 효소는 폴리머라아제이다. 일부 구현예에서, 적어도 하나의 구성요소는 동결건조된 또는 건조된 형태이다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체(insert)와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 본원에 개시된다.
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 상기 링커는 엑소뉴클레아제에 의해 분해되지 않는다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제는 연장 후 제거된다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거는, 고체상 가역적 고정화(SPRI: solid-phase reversible immobilization) 비드 및/또는 열감응성 폴리머라아제의 변성을 이용하여 이루어진다.
일부 구현예에서, 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 우라실을 포함하는 반응 혼합물을 이용하여 수행된다. 일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 하나 이상의 우라실 특이적 절단 시약(USER: uracil-specific excision reagent)에 의해 절단된다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII이다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소이다.
일부 구현예에서, 라이브러리 내 복수의 이중 가닥 단편은 표적 서열을 포함하지 않는다. 일부 구현예에서, 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있다. 일부 구현예에서, 상기 방법은, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함한다.
일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 제한 엔도뉴클레아제 소화에 대해 저항성이 있다. 일부 구현예에서, 우라실을 핵산 가닥에 혼입시키면 이전에 제한 엔도뉴클레아제 절단 부위였던 서열이 변경되어, 이러한 가닥과 이의 상보체를 절단으로부터 보호한다. 일부 구현예에서, 제한 엔도뉴클레아제는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함); 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며, 여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함), (2) 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계; 제1 연장 프라이머를 제거하는 단계; USER을 제공하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 또한 본원에 개시된다.
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다. 일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 엑소뉴클레아제에 의해 분해되지 않는다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 우라실을 포함한다.
일부 구현예에서, 상기 방법은 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다.
일부 구현예에서, USER은 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단한다.
일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 상이한 서열에 결합한다. 일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 이중 가닥 핵산의 동일한 가닥에 결합한다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 폴리머라아제는 단편을 증폭시키는 단계 전에 제거된다.
일부 구현예에서, 제2 연장 프라이머는 상기 프라이머를 사용하여 핵산 가닥을 생성한 후에 제거된다. 일부 구현예에서, 폴리머라아제 및/또는 제2 연장 프라이머는 SPRI 비드를 사용하고/하거나 열감응성 폴리머라아제를 변성시키는 방식으로 제거된다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성을 갖는 효소 또는 효소들을 사용하여, (1) 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함), (2) 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계; 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계; 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함하는 방법이 또한 본원에 개시된다.
이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 또한 본원에 개시된다. 상기 방법은 시퀀싱 라이브러리를 제작하는 단계를 포함하며, 여기서 이중 가닥 단편의 각각의 단편은 말단 어댑터 사이에 배치된 삽입체를 포함하고, 여기서 각각의 말단 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함)와, 뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열을 포함한다. 상기 방법은 또한 이중 가닥 단편을 변성시켜 분리된 가닥을 형성하는 단계(각각의 분리된 가닥은 삽입체의 단일 가닥 부분을 포함함); 서열 특이적 연장 프라이머를 삽입체의 단일 가닥 부분 내 상보적 서열에 어닐링하는 단계; 어닐링된 연장 프라이머에서 상보적 가닥을 연장시켜 이중 가닥 말단을 갖는 상보적 가닥과 분리된 가닥의 듀플렉스(duplex)를 형성하는 단계(여기서, 이중 가닥 말단은 상보적 가닥의 3' 말단과 분리된 가닥의 5' 말단을 포함함); 이중 가닥 어댑터를 듀플렉스의 각각의 이중 가닥 말단에 결찰시키는 단계; 듀플렉스를 변성시키는 단계; 및 듀플렉스의 변성된 가닥을 증폭시켜 증폭된 생성물을 생성하는 단계를 포함한다.
일부 구현예에서, 차단된 제2 연장 프라이머는, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없다. 일부 구현예에서, 차단된 제2 연장 프라이머는 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다. 일부 구현예에서, 차단된 제2 연장 프라이머는 60℃ 미만의 용융 온도로 삽입체에 결합한다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도는 제2 연장 프라이머의 용융 온도보다 높다. 일부 구현예에서, 제2 연장 프라이머는 증폭시키는 단계 전에 제거된다. 일부 구현예에서, 제2 연장 프라이머는 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거된다.
일부 구현예에서, 하나 이상의 연장 프라이머는 유전자 특이적 프라이머이다.
일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 결찰 또는 태그먼트화에 의해 혼입된다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 적어도 14개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 14개 내지 60개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 헤어핀 어댑터는 안정성을 증가시키기 위한 하나 이상의 증강을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 하나 이상의 변형된 또는 잠금된 핵산을 포함한다. 일부 구현예에서, 변형된 핵산은 8-아자-7-데아자구아노신을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지한다.
일부 구현예에서, 증폭 프라이머 서열은 A14, A14', B15 또는 B15' 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열이 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열과 회합되어 있을 때, 증폭 프라이머는 헤어핀 어댑터에 포함된 증폭 프라이머 서열에 결합할 수 없다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체를 포함한다.
일부 구현예에서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥은 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함한다. 일부 구현예에서, 이중 가닥 단편은 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함한다. 일부 구현예에서, 헤어핀 어댑터의 3'에 있는 하나 이상의 추가 어댑터 및/또는 한쪽 또는 양쪽 가닥의 3' 말단에 있는 하나 이상의 어댑터는 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함한다.
일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계는 헤어핀 어댑터를 파괴하지 못한다. 일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에는 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제는 가닥 치환 폴리머라아제가 아니다. 일부 구현예에서, 단편을 증폭시키는 데 사용되는 폴리머라아제는 Q5이다. 일부 구현예에서, 증폭은 브릿지 증폭이다.
일부 구현예에서, 상기 방법은 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 삽입체의 전체 서열의 시퀀싱을 가능하게 한다.
일부 구현예에서, 이중 가닥 핵산은 DNA 또는 RNA를 포함한다. 일부 구현예에서, 이중 가닥 핵산은 무세포 DNA를 포함한다. 일부 구현예에서, 상기 방법은 단편 중복제거에 사용된다.
부가적인 목적 및 이점은 하기 상세한 설명에서 부분적으로 설명될 것이며, 부분적으로는 상세한 설명으로부터 명백해지거나, 실시에 의해 학습될 수 있다. 이러한 목적 및 이점은 특히 첨부된 청구범위에 언급된 요소 및 조합에 의해 실현되고 달성될 것이다.
상기 일반적인 설명 및 하기 상세한 설명은 단지 예시적이고 설명적이며, 청구범위를 제한하고자 하는 것이 아님을 이해해야 한다.
본 명세서에 통합되고 본 명세서의 일부를 구성하는 첨부된 도면은 하나의(여러) 구현예(들)를 예시하며, 해당 설명과 함께 본원에 기재된 원리를 설명하는 역할을 한다.
도 1은, 비표적 서열과 대조되는, 단편의 한쪽 또는 양쪽 5' 말단에 있는 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 대표적인 방법을 보여준다.
도 2는, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 증폭 프라이머 서열로부터의 증폭을 차단시킬 수 있는 방법을 보여준다.
도 3은, 본 개시내용의 양태에 따라, 헤어핀 어댑터가 적어도 부분적으로 상보적인 뉴클레오타이드 서열 2 세트(A14/A14' 및 X/X')를 포함하는 방법을 보여준다.
도 4는, 본 개시내용의 양태에 따라, 제1 연장 프라이머와 제2 연장 프라이머(각각 상이한 표적 서열에 결합함)가 링커를 통해 연결되는 방법을 보여준다.
도 5는, 본 개시내용의 양태에 따라, 표적 삽입체를 함유하지 않는 단편에서 어댑터가 결찰되지 않아 양방향 증폭이 없는 것과 대조되는, 표적 삽입체 함유 단편의 말단에 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 대표적인 방법을 보여준다.
도 6은, 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과를 보여준다.
도 7은, 도 6의 라이브러리 증폭에 사용된 헤어핀 어댑터와 대조군 어댑터를 보여준다.
서열의 설명
표 1은 본원에 언급된 특정 서열의 목록을 제공한다.
[표 1]
Figure pct00001

구현예의 설명
I. 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터 및 라이브러리 제작
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 어댑터가 사용된다.
일부 구현예에서, 이러한 어댑터는 분기형 어댑터이다. 본원에 사용된 "분기형 어댑터"라는 용어는, 2개의 가닥이 서로 어닐링된 제1 말단과 2개의 가닥이 서로 어닐링되지 않은 제2 말단을 갖는 이중 가닥 핵산을 의미한다. 즉, 분기형 어댑터는 이중 가닥 영역과 단일 가닥 영역을 포함한다. 일 구현예에서, 분기형 어댑터의 말단은 이중 가닥이다. 분기형 또는 Y형 어댑터의 예는, 예를 들어 미국 특허 제7,741,463호, 미국 특허 제10253359호 및 미국 특허 제9,868,982호에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터는 5' 말단과 3' 말단을 갖는 제1 서열과, 5' 말단과 3' 말단을 갖는 제2 서열을 포함하며; 여기서 제1 서열의 3' 말단의 일부와 제2 서열의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고; 제1 서열의 5' 말단의 일부와 제2 서열의 3' 말단의 일부는 비상보적이고; 제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함한다.
일부 구현예에서, 제2 이중 가닥 영역은 헤어핀 구조이다. 일부 구현예에서, 제2 이중 가닥 영역은 비핵산 부분을 포함한다. 일부 구현예에서, 비핵산 부분은 링커이다. 일부 구현예에서, 제1 가닥의 5' 말단은 엑소뉴클레아제에 의해 분해되지 않는 부분을 포함한다. 즉, 제1 가닥의 5' 말단은 엑소뉴클레아제에 저항성이 있을 수 있다. 일부 구현예에서, 제1 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 이중 가닥 영역은 적어도 5개의 연속된 뉴클레오타이드이다. 일부 구현예에서, 제2 가닥의 5' 말단은 인산화된다. 일부 구현예에서, 제1 가닥과 제2 가닥의 모든 시토신 염기는 메틸화된다. 일부 구현예에서, 어댑터는 포획 모이어티를 추가로 포함한다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하는 방법은 복수의 이중 가닥 핵산 단편을 생성하는 단계와, 분기형 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계를 포함한다. 일부 구현예에서, 하나 이상의 어댑터는 태그먼트화를 통해 부착된다. 일부 구현예에서, 하나 이상의 어댑터는 결찰을 통해 부착된다.
다양한 라이브러리 제작이 당업계에 공지되어 있으며, 본 발명의 방법은 라이브러리 생성 수단에 의해 제한되지 않는다. 일부 구현예에서, 라이브러리는 태그먼트화 또는 결찰을 사용하여 제작된다. 예를 들어, 태그먼트화 또는 결찰 방법은 라이브러리 단편의 말단에 어댑터, 예를 들어 헤어핀 어댑터, 단일 가닥 어댑터 및/또는 이중 가닥 어댑터를 혼입시키는 데 사용될 수 있다.
일부 구현예에서, 트랜스포존 기반 기술은, 예를 들어 Nextera™ DNA 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시된 바와 같이 DNA를 단편화하는 데 사용될 수 있으며, 여기서 게놈 DNA는 입력 DNA를 단편화하고 동시에 태그 지정("태그먼트화")하는 조작된 트랜스포좀에 의해 단편화되어, 단편의 말단에 고유한 어댑터 서열을 포함하는 단편화된 핵산 분자 집단을 생성할 수 있다.
전위를 통한 분기형 어댑터의 부가를 통해 시퀀싱 라이브러리를 제작하는 것은 미국 특허 제10,246,746호에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
본원에 사용된 "태그먼트화"라는 용어는, 트랜스포존 말단 서열을 포함하는 어댑터와 복합체화된 트랜스포사아제(transposase) 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 나타낸다. 태그먼트화는 DNA의 단편화와 동시에 듀플렉스 단편의 양쪽 가닥의 5' 말단에의 어댑터의 결찰을 유도한다. 트랜스포사아제 효소를 제거하기 위한 정제 단계 후, 예를 들어 PCR, 결찰, 또는 당업자에게 공지된 임의의 다른 적합한 방법에 의해 조작된 단편의 말단에 추가 서열이 부가될 수 있다.
본원에 사용된 "트랜스포좀 복합체"는 적어도 하나의 트랜스포사아제(또는 본원에 기재된 바와 같은 다른 효소)와 트랜스포존 인식 서열로 구성된다. 일부 이러한 시스템에서, 트랜스포사아제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉진시킬 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중 가닥 트랜스포존 말단 서열이다. 트랜스포사아제는 이중 가닥 핵산 내 트랜스포사아제 인식 부위에 결합하여, 트랜스포존 인식 서열을 이중 가닥 핵산에 삽입한다. 일부 이러한 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 한쪽 가닥이 이중 가닥 핵산으로 전달되어, 절단 사건이 일어난다. 트랜스포사아제와 함께 사용하기 위해 쉽게 조작될 수 있는 예시적인 전위 절차 및 시스템.
태그먼트화는 고정된 또는 용액상 트랜스포좀 복합체를 이용하여 수행될 수 있다.
결찰에 의한 어댑터의 혼입이 또한 널리 공지되어 있으며, Truseq 샘플 제조 키트(Illumina, Inc.)의 워크플로우에 예시되어 있다.
일부 구현예에서, 핵산 시퀀싱 라이브러리를 제작하기 위한 키트는 분기형 어댑터; 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머; 적어도 하나의 효소; 및 dNTP를 포함한다. 일부 구현예에서, 적어도 하나의 효소는 엑소뉴클레아제 활성을 갖는다. 일부 구현예에서, 적어도 하나의 효소는 폴리머라아제이다. 일부 구현예에서, 키트의 적어도 하나의 구성요소는 동결건조된 또는 건조된 형태이다.
II. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법이 본원에 개시된다. 하기 기재되는 바와 같이, 표적 서열에 결합하는 연장 프라이머와 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 헤어핀 어댑터를 특이적으로 "잠금 해제"하고, 표적 서열을 포함하는 단편을 증폭시키는 데 사용될 수 있다(도 1 참조).
일부 구현예에서, 본 발명의 방법을 사용하면, 단편 말단을 회수할 수 없는 농축 방법(예컨대, 멀티플렉스 PCR을 사용하는 직접 표적화된 증폭)과 비교하여, 농축 동안 단편 말단을 회수할 수 있기 때문에, 시퀀싱 결과가 개선된다.
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함한다.
본 발명의 방법은 무세포 DNA와 같은 단편화된 핵산의 전체 서열을 생성하는 것과 같은 다양한 용도에 사용된다. 나아가, 본 발명의 방법은 단편 중복제거에 사용될 수 있다.
A. 표적 서열 및 시퀀싱 라이브러리에서 표적 서열의 농축
본원에 사용된 "표적 서열"은 임의의 관심 서열을 나타낸다. 예를 들어, 표적 서열은 관심 유전자에 포함된 서열, 관심있는 특정 돌연변이, 또는 사용자가 관심있는 임의의 다른 서열을 포함할 수 있다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 본 발명의 방법이 없는 경우, 이중 가닥 핵산으로부터 생성된 라이브러리 단편 중 상대적으로 낮은 비율이 표적 서열을 포함할 수 있다.
일부 구현예에서, 라이브러리 내 복수의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다. 일부 구현예에서, 라이브러리 내 대부분의 이중 가닥 단편은 농축시키기 전에 표적 서열을 포함하지 않는다.
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시킨다는 것은, 표적 서열을 포함하는 단편이 농축시키기 전에 비해 농축시킨 후 라이브러리에 2배 이상, 5배 이상, 10배 이상, 20배 이상, 50배 이상, 100배 이상, 1,000배 이상, 10,000배 이상 또는 100,000배 이상 더 많이 포함되어 있음을 의미한다. 따라서, 본 발명의 방법은 "농축된 라이브러리"를 생성하는 데 사용될 수 있다. 일부 구현예에서, 본 발명의 방법은 샘플에 포함된 이중 가닥 DNA의 작은 영역(즉, 몇 킬로베이스)을 고도로 농축시킬 수 있다.
일부 구현예에서, 표적 서열은 라이브러리 제작에 사용되는 이중 가닥 핵산에 포함되어 있다. 일부 구현예에서, 이중 가닥 핵산은 표적 농축을 필요로 하거나 표적 농축이 유익할 수 있는 임의의 샘플 유형에 포함되어 있을 수 있다. 일부 구현예에서, 표적 서열은 무세포 DNA(cfDNA)에 포함되어 있다. 일부 구현예에서, 표적 서열은 액체 생검 샘플과 같은 종양학 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 엑솜(exome) 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 미진단 희귀 질환(RUGD: rare and undiagnosed disease) 엑솜 샘플에 포함되어 있다. 일부 구현예에서, 표적 서열은 RNA 또는 cDNA 라이브러리에 포함되어 있다. 일부 구현예에서, 표적 서열은 메틸화 라이브러리에 포함되어 있다.
B. 증폭 프라이머 서열을 포함하는 헤어핀 어댑터
본원에 사용된 "헤어핀"은, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열을 포함하는 핵산을 나타낸다. 적어도 부분적으로 상보적인 이러한 2개의 핵산 서열은 서로 결합하여 핵산의 접힘(folding)을 매개할 수 있다. 일부 구현예에서, 적어도 부분적으로 상보적인 2개의 핵산 서열은 헤어핀 2차 구조를 갖는 핵산을 생성한다.
본원에 사용된 "헤어핀 어댑터"는, 서로 적어도 부분적으로 상보적인 적어도 한 쌍의 핵산 서열을 포함하는 어댑터를 나타낸다. 일부 구현예에서, 헤어핀 어댑터는 접힌 2차 구조를 갖는다.
도 1은, 각 가닥의 5' 말단에 헤어핀 어댑터를 갖는 이중 가닥 삽입체(삽입체 및 삽입체의 서열)를 포함하는 라이브러리 단편을 보여준다. 도 1의 대표적인 구현예에서, 각각의 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열(A14/A14')을 포함한다. 일부 구현예에서, 서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성은 어댑터를 헤어핀 2차 구조로 "잠금한다". 이러한 방법에서, 표적 서열을 포함하는 단편을 증폭시키는 방법의 특이성을 개선시키기 위해 사용되는 연장 프라이머의 길이를 증가시킬 수 있다.
일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 한 쌍 초과의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 서로 적어도 부분적으로 상보적인 2쌍 초과의 핵산 서열을 포함한다. 도 2는, 서로 적어도 부분적으로 상보적인 2쌍의 핵산 서열(A14/14' 쌍과 X/X' 쌍)을 포함하는 헤어핀 어댑터를 보여준다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 모든 부분이 제거되지 않는 한, 헤어핀 어댑터는 (서로 적어도 부분적으로 상보적인 한 쌍의 핵산 서열 사이의 염기쌍 형성을 통해) "잠금된다". 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 본 발명의 방법은 헤어핀 어댑터에 부착되지 않은 단편의 증폭을 차단하는데, 이는 헤어핀 어댑터가 이후 증폭 단계에 사용될 수 있는 증폭 프라이머 서열을 포함하기 때문이다.
이러한 방식으로, 본 발명의 방법은 "잠금 해제된" 헤어핀 어댑터에 부착되는 라이브러리 단편의 증폭만 가능하게 한다. 헤어핀 어댑터에 부착되지 않은 라이브러리 단편과 "잠금된" 헤어핀 어댑터에 부착된 라이브러리 단편은 증폭되지 않는다. 바람직하지 않은 단편(즉, 표적 서열을 포함하지 않는 단편)의 증폭을 저해하는 이러한 수단은 다운스트림 방법과 관련된 비용과 사용자 시간을 회피할 수 있다.
일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있다. 일부 구현예에서, 헤어핀 어댑터는 결찰 또는 태그먼트화에 의해 혼입된다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 적어도 14개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 각각 14개 내지 60개의 뉴클레오타이드를 포함한다. 일부 구현예에서, 헤어핀 어댑터는 안정성을 증가시키기 위한 하나 이상의 증강을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 하나 이상의 변형된 또는 잠금된 핵산을 포함한다. 일부 구현예에서, 변형된 핵산은 8-아자-7-데아자구아노신을 포함한다. 일부 구현예에서, 헤어핀 어댑터는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지한다.
일부 구현예에서, 증폭 프라이머 서열은 A14 서열(서열번호 1) 또는 B15 서열(서열번호 2), 또는 이들의 상보체(각각, A14' 또는 B15')를 포함한다.
일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열은 증폭 프라이머 서열의 상보체를 포함한다.
1. 어댑터
일부 구현예에서, 라이브러리 단편은, 헤어핀 어댑터에 더하여 또는 이에 대한 대안으로, 이중 가닥 라이브러리 단편의 양쪽 5' 말단 또는 양쪽 3' 말단에만 제공되는 대칭 단일 어댑터와 같은 하나 이상의 어댑터를 포함한다(도 5). 일 구현예에서, 대칭 단일 어댑터는 이중 가닥 라이브러리 단편의 단일 가닥 말단을 생성한다. 일 구현예에서, 대칭 단일 어댑터는 B15 또는 B15' 어댑터이다. 일 구현예에서, 대칭 단일 어댑터는 A14 또는 A14' 어댑터이다.
일부 구현예에서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥은 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함한다. 일부 구현예에서, 이중 가닥 단편은 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함한다.
일부 구현예에서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함한다. 본원에 사용된 시퀀싱 관련 서열은 이후 시퀀싱 단계와 관련된 임의의 서열일 수 있다. 시퀀싱 관련 서열은 다운스트림 시퀀싱 단계를 단순화시키는 역할을 할 수 있다. 예를 들어, 시퀀싱 관련 서열은, 다르게는 어댑터를 핵산 단편에 결찰시키는 단계를 통해 혼입될 수 있는 서열일 수 있다. 일부 구현예에서, 어댑터 서열은 특정 시퀀싱 방법에서 플로우셀(flow cell)에의 결합을 용이하게 하기 위해 P5 또는 P7 서열(또는 이들의 상보체)을 포함한다.
일부 구현예에서, 헤어핀에 포함된 증폭 프라이머 서열은 범용 프라이머 서열이다. 범용 서열은 둘 이상의 핵산 분자에 공통적인, 즉, 이들이 공유하는 뉴클레오타이드 서열의 영역이다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 뉴클레오타이드 링커이다. 일부 구현예에서, 이러한 링커는 비뉴클레오타이드(non-nucleotide) 링커이다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않기 때문에(즉, 링커는 엑소뉴클레아제에 저항성이 있음), 엑소뉴클레아제 활성은 링커에서 종결된다.
C. 이중 가닥 핵산
일부 구현예에서, 라이브러리를 생성하는 데 사용되는 이중 가닥 핵산은 DNA, RNA, 또는 이들의 유사체로 구성된다. 일부 구현예에서, 산의 공급원은 게놈 DNA, 메신저 RNA, 또는 천연 공급원으로부터의 다른 핵산이다. 일부 구현예에서, 이러한 공급원에서 유도된 핵산은 본원에 기재된 방법에 사용되기 전 증폭될 수 있다.
이중 가닥 핵산이 유도될 수 있는 예시적인 생물학적 샘플에는, 예를 들어 설치류, 마우스, 래트, 토끼, 기니피그, 유제류, 말, 양, 돼지, 염소, 소, 고양이, 개, 영장류, 인간 또는 비인간 영장류와 같은 포유류; 아라비돕시스 탈리아나(Arabidopsis thaliana), 옥수수, 수수, 귀리, 밀, 벼, 카놀라 또는 대두와 같은 식물; 클라미도모나스 레인하르디티(Chlamydomonas reinhardtii)와 같은 조류(algae); 카에노르하브디티스 엘레간스(Caenorhabditis elegans)와 같은 선충류; 드로소필라 멜라노가스테르(Drosophila melanogaster), 모기, 초파리, 꿀벌 또는 거미와 같은 곤충; 제브라피쉬(zebrafish)와 같은 어류; 파충류; 개구리 또는 제노푸스 라에비스(Xenopus laevis)와 같은 양서류; 딕티오스텔리움 디스코이데움(dictyostelium discoideum); 뉴모시스티스 카리니(Pneumocystis carinii), 타키푸구 루브리페스(Takifugu rubripes), 효모, 사카로마이세스 세레비시아(Saccharamoyces cerevisiae) 또는 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)와 같은 진균류; 또는 열대열 말리리아 원충(Plasmodium falciparum)에서 유래된 것들이 포함된다. 이중 가닥 핵산은 또한 대장균, 포도상구균 또는 마이코플라즈마 폐렴균과 같은 박테리아; 고세균(archae); C형 간염 바이러스 또는 인간 면역결핍 바이러스와 같은 바이러스; 또는 비로이드와 같은 원핵생물에서 유도될 수 있다. 이중 가닥 핵산은 상기 유기체의 균질한 배양물 또는 집단에서, 또는 대안적으로, 예를 들어 공동체 또는 생태계에서 몇몇 상이한 유기체의 집합체에서 유도될 수 있다. 핵산은, 예를 들어 문헌[Sambrook et al, Molecular Cloning: A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory, New York (2001)] 또는 문헌[Ausubel et al, Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1998)]에 기재된 것들을 포함하는 당업계에 공지된 방법을 사용하여 단리될 수 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예에서, 이중 가닥 핵산은 하나 이상의 더 큰 핵산의 단편으로 수득될 수 있다. 단편화는, 예를 들어 분무화, 초음파처리, 화학적 절단, 효소적 절단 또는 물리적 전단을 포함하는 당업계에 공지된 다양한 기술 중 임의의 것을 사용하여 수행될 수 있다.
이중 가닥 핵산의 집단 또는 이의 앰플리콘은, 본원에 제시된 방법 또는 조성물의 특정한 적용에 바람직하거나 적합한 평균 가닥 길이를 가질 수 있다. 예를 들어, 평균 가닥 길이는 100,000개 뉴클레오타이드, 50,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 1,000개 뉴클레오타이드, 500개 뉴클레오타이드, 100개 뉴클레오타이드 또는 50개 뉴클레오타이드 미만일 수 있다. 대안적으로 또는 부가적으로, 평균 가닥 길이는 10개 뉴클레오타이드, 50개 뉴클레오타이드, 100개 뉴클레오타이드, 500개 뉴클레오타이드, 1,000개 뉴클레오타이드, 5,000개 뉴클레오타이드, 10,000개 뉴클레오타이드, 50,000개 뉴클레오타이드 또는 100,000개 뉴클레오타이드 초과일 수 있다. 이중 가닥 핵산의 집단 또는 이의 앰플리콘의 평균 가닥 길이는 상기 제시된 최댓값과 최솟값 사이의 범위일 수 있다. 증폭 부위에서 생성된(또는 본원에서 달리 제조되거나 사용된) 앰플리콘의 평균 가닥 길이는, 상기 예시된 값에서 선택되는 상한과 하한 사이의 범위일 수 있음을 이해할 것이다.
일부 구현예에서, 이중 가닥 핵산은 200개 미만의 뉴클레오타이드, 150개 미만의 뉴클레오타이드, 100개 미만의 뉴클레오타이드, 75개 미만의 뉴클레오타이드, 50개 미만의 뉴클레오타이드 또는 36개 미만의 뉴클레오타이드와 같이 비교적 짧은 평균 가닥 길이를 갖는다. 평균 가닥 길이가 비교적 짧은 샘플 유형의 예는 무세포 DNA(cfDNA) 및 엑솜 시퀀싱 샘플이다.
일부 구현예에서, 이중 가닥 핵산은 모체 혈액 샘플의 무세포 DNA(cfDNA)이다. 일부 구현예에서, cfDNA는 모체 혈장 샘플에서 추출된다. 일부 구현예에서, cfDNA는 비침습성 산전 검사(NIPT: noninvasive prenatal testing)를 위한 것이다. 일부 구현예에서, 이중 가닥 핵산은 엑솜이다. 일부 구현예에서, 엑솜은 의심되는 미진단 희귀 질환(RUGD) 환자의 샘플에서 유래된다.
D. 연장 프라이머
본원에 사용된 "연장"은, 프라이머와 관련하여 사용될 때, 하나 이상의 뉴클레오타이드가 (예를 들어, 폴리머라아제 활성을 통해) 프라이머에 부가되거나, 하나 이상의 올리고뉴클레오타이드가 (예를 들어, 리가아제 활성을 통해) 프라이머에 부가되는 과정을 포함하는 것으로 의도된다.
일부 구현예에서, 하나 이상의 연장 프라이머는 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 방법은 (1) 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 헤어핀 어댑터에서 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함할 수 있다(도 1에 제시된 바와 같음). 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다. 따라서, 연장 프라이머를 표적 서열을 포함하는 삽입체에 결합시키는 것은 이러한 단편에 대한 헤어핀 어댑터의 선택적인 "잠금 해제"를 가능하게 한다.
일부 구현예에서, 하나 이상의 연장 프라이머는 유전자 특이적 프라이머이다. 예를 들어, 연장 프라이머는 암 유전자의 표적 서열에 결합하여 시퀀싱 라이브러리에서 이러한 표적 서열을 농축시킬 수 있다.
일부 구현예에서, 상기 방법은 단일 연장 프라이머를 사용한다. 일부 구현예에서, 상기 방법은 하나 초과의 연장 프라이머를 사용한다.
일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상이다. 일부 구현예에서, 연장 프라이머의 용융 온도는 60℃ 이상, 65℃ 이상 또는 70℃ 이상이다. 일부 구현예에서, 용융 온도가 60℃ 이상인 연장 프라이머는 "핫 스타트(hot start)" 반응이 비특이적 결합을 감소시키는 것을 가능하게 한다. 일부 구현예에서, 연장 프라이머의 용융 온도는 프라이머 길이, GC 함량, 또는 당업자에게 널리 공지된 다른 인자에 의해 제어된다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단일 단계에 하나 초과의 연장 프라이머가 사용된다. 일부 구현예에서, 상기 방법의 단일 단계에 다중 연장 프라이머가 사용된다. 예를 들어, 다중 연장 프라이머는 관심 유전자 내 상이한 표적 서열 또는 상이한 관심 유전자에 결합할 수 있다.
일부 구현예에서, 다중 연장 프라이머가 하나 이상의 링커를 통해 연결된다(즉, 도 4에 제시된 바와 같음). 일부 구현예에서, 2개의 연장 프라이머가 링커를 통해 연결된다. 일부 구현예에서, 하나 이상의 링커를 통해 연결되는 다중 연장 프라이머는 더 높은 용융 온도를 갖는다. 일부 구현예에서, 하나 이상의 링커를 통해 연결된 다중 연장 프라이머는 각각의 연장 프라이머(예를 들어, 도 4에 제시된 바와 같은 fwd1' 및 fwd2')에 결합할 수 있는 표적 서열을 포함하는 삽입체에 결합한다.
일부 구현예에서, 2개의 연장 프라이머는 상기 방법 동안 하기 기재되는 바와 같이 함께 결찰될 수 있다.
일부 구현예에서, 상기 방법의 상이한 단계에 상이한 연장 프라이머가 사용된다.
E. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제
일부 구현예에서, 상기 방법은, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성하고, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 폴리머라아제의 5'-3' 엑소뉴클레아제 활성은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 것을 매개한다. 일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 절단한다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 생성된 핵산 가닥 내 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 Taq이다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제는 연장 후 제거된다. 일부 구현예에서, 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거는, 고체상 가역적 고정화(SPRI) 비드를 이용하여 이루어진다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
F. 증폭
일부 구현예에서, 상기 방법은 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함한다. 일부 구현예에서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 제거된 단편만 증폭될 수 있다. 일부 구현예에서, 잠금된 헤어핀은 폴리머라아제가 증폭 프라이머 서열의 상보체를 연장시키고 생성하는 것을 방지한다.
일부 구현예에서, 증폭 프라이머는 인덱스 서열(예를 들어, 도 1의 i5 및 i7 인덱스 서열 참조)을 포함할 수 있다. 이러한 인덱스 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있다. 일부 구현예에서, 인덱스 서열은 고유 분자 식별자(UMI: unique molecular identifier)를 포함한다. UMI는 특허 출원 WO 2016/176091, WO 2018/197950, WO 2018/197945, WO 2018/200380 및 WO 2018/204423에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계는 헤어핀 어댑터를 파괴하지 못한다. 일부 구현예에서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에는 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제는 가닥 치환 폴리머라아제가 아니다. 일부 구현예에서, 단편을 증폭시키는 데 사용되는 폴리머라아제는 Q5이다. 일부 구현예에서, 증폭은 브릿지 증폭이다.
일부 구현예에서, 샘플은 고체 지지체 상에서 증폭된다.
예를 들어, 일부 구현예에서, 샘플은 미국 특허 제7,985,565호 및 제7,115,400호의 개시내용에 예시된 바와 같은 클러스터 증폭 방법을 사용하여 증폭되며, 상기 문헌들 각각의 내용은 그 전체가 본원에 참조로 인용된다. 미국 특허 제7,985,565호 및 제7,115,400호의 통합된 자료에는, 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 생성물이 고체 지지체 상에 고정되게 하는 고체상 핵산 증폭 방법이 기재되어 있다. 이러한 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오타이드 가닥과 복수의 동일한 고정된 상보적 폴리뉴클레오타이드 가닥으로 형성된다. 이와 같이 형성된 어레이는 일반적으로 "클러스터링된 어레이"로 본원에서 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 바와 같은 고체상 증폭 반응의 생성물은, 고정된 폴리뉴클레오타이드 가닥과 고정된 상보적 가닥의 쌍의 어닐링에 의해 형성된 소위 "브릿지된" 구조이며, 여기서 양쪽 가닥은, 일부 구현예에서 공유결합 부착을 통해 5' 말단에서 고체 지지체 상에 고정되어 있다. 클러스터 증폭 방법은, 고정된 핵산 주형을 사용하여 고정된 앰플리콘을 생성하는 방법의 예이다. 본원에 제공된 방법에 따라 생성된 고정된 DNA 단편으로부터 고정된 앰플리콘을 생성하기 위해 다른 적합한 방법이 또한 사용될 수 있다. 예를 들어, 각 쌍의 증폭 프라이머의 한쪽 또는 양쪽 프라이머가 고정되어 있는지 여부에 관계없이, 고체상 PCR을 통해 하나 이상의 클러스터 또는 콜로니가 형성될 수 있다.
다른 구현예에서, 샘플은 용액 중에서 증폭된다. 예를 들어, 일부 구현예에서, 샘플이 고체 지지체로부터 절단되거나 달리 유리된 후, 증폭 프라이머가 용액 중에서 유리된 분자에 혼성화된다. 다른 구현예에서, 증폭 프라이머는 하나 이상의 초기 증폭 단계 동안 목적하는 샘플에 혼성화되고, 용액 중에서 후속 증폭 단계가 이어진다. 일부 구현예에서, 고정된 핵산 주형이 용액상 앰플리콘을 생성하는 데 사용될 수 있다.
본원에 기재된 또는 당업계에 일반적으로 공지된 증폭 방법 중 임의의 것을 범용 또는 표적 특이적 프라이머와 함께 이용하여 목적하는 샘플을 증폭시킬 수 있음을 이해할 것이다. 증폭에 적합한 방법에는, 비제한적으로, 미국 특허 제8,003,354호에 기재된 바와 같은 폴리머라아제 연쇄 반응(PCR), 가닥 치환 증폭(SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)이 포함되며, 상기 문헌은 그 전문이 본원에 참조로 인용된다. 상기 증폭 방법을 이용하여 하나 이상의 관심 핵산을 증폭시킬 수 있다. 예를 들어, 멀티플렉스 PCR, SDA, TMA, NASBA 등을 포함하는 PCR을 이용하여 고정된 DNA 단편을 증폭시킬 수 있다. 일부 구현예에서, 관심 핵산에 특이적으로 지시된 프라이머가 증폭 반응에 포함된다.
핵산을 증폭시키는 다른 적합한 방법은 올리고뉴클레오타이드 연장 및 결찰, 롤링 서클 증폭(RCA: rolling circle amplification)(문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)], 이는 본원에 참조로 인용됨) 및 올리고뉴클레오타이드 결찰 검정(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696; 및 WO 89/09835 참조, 상기 모든 문헌은 본원에 참조로 인용됨) 기술을 포함할 수 있다. 이러한 증폭 방법이 고정된 DNA 단편을 증폭시키도록 설계될 수 있음을 이해할 것이다. 예를 들어, 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 결찰 프로브 증폭 또는 올리고뉴클레오타이드 결찰 검정(OLA) 반응을 포함할 수 있다. 일부 구현예에서, 증폭 방법은 관심 핵산에 특이적으로 지시된 프라이머를 함유하는 프라이머 연장-결찰 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 결찰 프라이머의 비제한적인 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 바와 같은 GoldenGate 검정(Illumina, Inc., San Diego, CA)에 사용되는 프라이머를 포함할 수 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다.
본 개시내용의 방법에 사용될 수 있는 예시적인 등온 증폭 방법에는, 비제한적으로, 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 예시된 바와 같은 다중 치환 증폭(MDA), 또는 예를 들어 미국 특허 제6,214,587호에 예시된 바와 같은 등온 가닥 치환 핵산 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 본 개시내용에 사용될 수 있는 다른 비PCR 기반 방법에는, 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 치환 증폭(SDA), 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 과분지형 가닥 치환 증폭이 포함되며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥 치환 Phi 29 폴리머라아제 또는 Bst DNA 폴리머라아제 대형 단편, 5'→3' exo-와 함께 사용될 수 있다. 이러한 폴리머라아제의 사용은 높은 진행성(processivity) 및 가닥 치환 활성을 이용한다. 높은 진행성은 폴리머라아제가 10 kb 내지 20 kb 길이의 단편을 생성하는 것을 가능하게 한다. 상기 제시된 바와 같이, 등온 조건 하에서 Klenow 폴리머라아제와 같이 낮은 진행성 및 가닥 치환 활성을 갖는 폴리머라아제를 사용한 경우에는 더 작은 단편이 생성될 수 있다. 증폭 반응, 조건 및 구성요소에 대한 추가 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로 인용된다.
G. 시퀀싱
일부 구현예에서, 상기 방법은 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 구현예에서, 상기 방법은 삽입체의 전체 서열의 시퀀싱을 가능하게 한다. 삽입체의 전체 서열을 생성하는 능력은, 프라이머가 결합하는 부분을 넘어서는 삽입체의 일부가 직접 표적화된 증폭으로 손실될 수 있기 때문에, 직접 표적화된 증폭(예컨대, 멀티플렉스 PCR)을 이용한 방법과 대조적이다.
본원에 기재된 농축 방법 후, 다수의 상이한 방법을 사용하여 시퀀싱이 수행될 수 있다.
하나의 예시적인 시퀀싱 방법은 합성에 의한 시퀀싱(SBS: sequencing-by-synthesis)이다. SBS에서, 주형 내 뉴클레오타이드의 서열을 결정하기 위해 핵산 주형을 따라 핵산 프라이머의 연장을 모니터링한다. 기본 화학 공정은 (예를 들어, 폴리머라아제 효소에 의해 촉진되는) 중합일 수 있다. 특정 폴리머라아제 기반 SBS 구현예에서, 프라이머에 부가되는 뉴클레오타이드의 순서와 유형의 검출이 주형의 서열을 결정하는 데 사용될 수 있도록, 형광 표지된 뉴클레오타이드가 주형 의존적 방식으로 프라이머에 부가된다(이에 따라, 프라이머가 연장됨).
플로우셀은 시퀀싱에 편리한 고체 지지체를 제공한다. 예를 들어, 제1 SBS 사이클을 개시하기 위해, 하나 이상의 표지된 뉴클레오타이드, DNA 폴리머라아제 등을 하나 이상의 증폭된 핵산 분자를 수용하는 플로우셀 내로/플로우셀을 통해 흐르게 할 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오타이드가 혼입되는 부위를 검출할 수 있다. 선택적으로, 뉴클레오타이드는 뉴클레오타이드가 프라이머에 부가되면 추가의 프라이머 연장을 종결시키는 가역적 종결 특성을 추가로 포함할 수 있다. 예를 들어, 차단 해제제가 전달되어 모이어티가 제거될 때까지 후속 연장이 발생할 수 없도록, 가역적 종결인자 모이어티를 갖는 뉴클레오타이드 유사체를 프라이머에 부가할 수 있다. 따라서, 가역적 종결을 사용하는 구현예의 경우, 차단 해제 시약을 (검출 전 또는 후에) 플로우셀에 전달할 수 있다. 다양한 전달 단계 사이에서 세척을 수행할 수 있다. 이어서, 사이클을 n회 반복하여 프라이머를 n개 뉴클레오타이드만큼 연장시켜, 길이 n의 서열을 검출할 수 있다. 본 개시내용의 방법으로 생성된 앰플리콘과 함께 사용하기 위해 용이하게 조작될 수 있는 예시적인 SBS 절차, 유체 시스템 및 검출 플랫폼은, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], WO 04/018497; US 7,057,026; WO 91/06678; WO 07/123744; US 7,329,492; US 7,211,414; US 7,315,019; US 7,405,281 및 US 2008/0108082에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
순환 반응을 사용하는 다른 시퀀싱 절차, 예컨대 파이로시퀀싱(pyrosequencing)이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오타이드가 초기 핵산 가닥에 혼입됨에 따라 무기 피로포스페이트(PPi)가 방출되는 것을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; 문헌[Ronaghi, Genome Res. 11(1), 3-11 (2001)]; 문헌[Ronaghi et al. Science 281(5375), 363 (1998)]; US 6,210,891; US 6,258,568 및 US 6,274,320, 상기 문헌들은 각각 본원에 참조로 인용됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설푸릴라아제에 의해 아데노신 트리포스페이트(ATP)로 즉시 전환됨에 따라 검출될 수 있으며, 생성된 ATP 수준은 루시퍼라아제 생성 광자를 통해 검출될 수 있다. 따라서, 시퀀싱 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용되는 여기 방사선원은 파이로시퀀싱 절차에 필요하지 않다. 본 개시내용에 따라 생성된 앰플리콘에 파이로시퀀싱을 적용하기 위해 조작될 수 있는 유용한 유체 시스템, 검출기 및 절차는, 예를 들어 WIPO 특허 출원 공개공보 WO 2012058096, US 2005/0191698 A1, US 7,595,883 및 US 7,244,559에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
일부 구현예는 DNA 폴리머라아제 활성을 실시간 모니터링하는 것을 포함하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오타이드 혼입은 형광단 함유 폴리머라아제와 γ-포스페이트 표지된 뉴클레오타이드 사이의 형광 공명 에너지 전달(FRET: fluorescence resonance energy transfer) 상호작용을 통해, 또는 제로모드 도파관(ZMW: zeromode waveguide)을 이용하여 검출될 수 있다. FRET 기반 시퀀싱을 위한 기술 및 시약은, 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; 문헌[Lundquist et al. Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 상기 문헌들의 개시내용은 본원에 참조로 인용된다.
일부 SBS 구현예는 뉴클레오타이드가 연장 생성물에 혼입될 때 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 시퀀싱은 Ion Torrent(Guilford, CT, a Life Technologies subsidiary)에서 상업적으로 입수 가능한 전기 검출기 및 관련 기술, 또는 하기 문헌에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있다: US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; 또는 US 2010/0282617 A1(상기 문헌들은 각각 본원에 참조로 인용됨). 운동역학적 배제(kinetic exclusion)를 사용하여 핵산을 증폭시키는 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 기질에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 앰플리콘의 클론 집단을 생성하는 데 사용될 수 있다.
또 다른 유용한 시퀀싱 기술은 나노포어 시퀀싱이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer et al. Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li et al. Nat. Mater. 2:611-615 (2003)](상기 문헌들의 개시내용은 본원에 참조로 인용됨) 참조). 일부 나노포어 구현예에서, 핵산 또는 핵산에서 제거된 개별 뉴클레오타이드는 나노포어를 통과한다. 핵산 또는 뉴클레오타이드가 나노포어를 통과할 때, 공극의 전기 전도도 변동을 측정하는 방식으로 각각의 뉴클레오타이드 유형을 식별할 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)](상기 문헌들의 개시내용은 본원에 참조로 인용됨)).
본 개시내용에 따른 검출에 적용될 수 있는 어레이 기반 발현 및 유전자형 분석을 위한 예시적인 방법은, 미국 특허 제7,582,420호; 제6,890,741호; 제6,913,884호 또는 6,355,431호, 또는 미국 특허 공개공보 제2005/0053980 A1호; 제2009/0186349 A1호 또는 제2005/0181440 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다.
본원에 제시된 방법의 이점은, 복수의 핵산을 병렬로 신속하고 효율적으로 검출할 수 있다는 점이다. 따라서, 본 개시내용은 상기 예시된 것들과 같은 당업계에 공지된 기술을 사용하여 핵산을 제조하고 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 개시내용의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편에 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 상기 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우셀은 핵산의 검출을 위한 통합 시스템으로 구성되고/되거나 이에 사용될 수 있다. 예시적인 플로우셀은, 예를 들어 US 2010/0111768 A1 및 미국 특허 공개공보 제2012/0270305 A1호에 기재되어 있으며, 상기 문헌들은 각각 본원에 참조로 인용된다. 플로우셀에 대해 예시된 바와 같이, 통합 시스템의 유체 구성요소 중 하나 이상이 증폭 방법과 검출 방법에 사용될 수 있다. 핵산 시퀀싱 구현예를 예로 들면, 통합 시스템의 유체 구성요소 중 하나 이상이 본원에 제시된 증폭 방법과, 상기 예시된 바와 같은 시퀀싱 방법에서 시퀀싱 시약의 전달에 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하고 검출 방법을 수행하기 위해 별도의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예에는, 비제한적으로, MiSeq™ 플랫폼(Illumina, Inc., San Diego, CA), 및 미국 특허 공개공보 제2012/0270305호에 기재된 장치가 포함되며, 상기 문헌은 본원에 참조로 인용된다.
III. 헤어핀 어댑터와, 우라실 특이적 절단 시약 또는 제한 엔도뉴클레아제를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 기재된 헤어핀 어댑터는 다수의 상이한 워크플로우에 사용될 수 있다. 예를 들어, 표적 서열을 포함하는 단편의 존재를 증가시키고/시키거나 표적 서열을 포함하지 않는 단편의 존재를 감소시키기 위해 다수의 상이한 워크플로우가 사용될 수 있다.
A. 우라실을 포함하는 핵산 가닥과 우라실 특이적 절단 시약
일부 제한 효소는 우라실을 포함하는 핵산 가닥을 절단할 수 없다. 일부 구현예에서, 제한 엔도뉴클레아제 절단 부위 내 티민을 대체하면 엔도뉴클레아제에 의한 절단이 저해된다. (문헌[Glenn et al. Biotechniques 17(6): 1086-1090] 참조.) 일부 구현예에서, 상기 방법은, 도 2에 제시된 바와 같이, 제한 효소 소화에 대해 저항성이 있는 우라실을 포함하는 핵산 가닥을 생성하는 단계를 포함한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥 내 우라실은 제한 엔도뉴클레아제 절단 부위 내 티민을 대체한다.
일부 구현예에서, 우라실을 포함하는 핵산 가닥은 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 포함하기 때문에, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는 이중 가닥 핵산을 제한 엔도뉴클레아제 절단에 대해 저항성이 있도록 만든다.
일부 구현예에서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제는 우라실을 포함할 수 있다.
일부 구현예에서, 상기 방법은 하나 이상의 우라실 특이적 절단 시약(USER)을 사용하는 것을 포함한다. USER은 우라실을 포함하는 핵산 가닥을 절단할 수 있다.
일부 구현예에서, 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 우라실을 포함하는 반응 혼합물을 이용하여 수행된다. 일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 하나 이상의 USER에 의해 절단된다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII이다. 일부 구현예에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소이다.
일부 구현예에서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥은 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
B. 제한 엔도뉴클레아제
일부 구현예에서, 상기 방법은, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함한다.
일부 구현예에서, 제한 엔도뉴클레아제는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다.
일부 구현예에서, 제한 엔도뉴클레아제는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단한다(예를 들어, 도 2에서의 A14/A14'의 절단 참조).
일부 구현예에서, 제한 엔도뉴클레아제에 의한 절단 효율은 엔도뉴클레아제의 절단 부위를 포함하는 이중 가닥 DNA 서열로 구성된 우라실의 양이 증가함에 따라 감소한다. 일부 구현예에서, 제한 엔도뉴클레아제는 우라실을 포함하는 하나 이상의 이중 가닥 핵산을 절단할 수 없다.
일부 구현예에서, 제한 엔도뉴클레아제의 절단 부위는 티민을 포함한다. 일부 구현예에서, 우라실을 핵산 가닥에 혼입시키면 이전에 제한 엔도뉴클레아제 절단 부위였던 서열이 변경되어, 이러한 가닥과 이의 상보체를 절단으로부터 보호한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 오버행을 생성한다. 일부 구현예에서, 제한 효소는 헤어핀 어댑터를 절단하고 평활 말단을 생성한다.
C. 적어도 부분적으로 상보적인 하나 초과의 서열 세트를 포함하는 헤어핀 어댑터와 USER을 포함하는 방법
일부 구현예에서, 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함); 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며, 여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함), 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계; 제1 연장 프라이머를 제거하는 단계; USER을 제공하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다. 이러한 방법의 대표적인 예가 도 2에 제시되어 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 엑소뉴클레아제에 저항성이 있다.
일부 구현예에서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커는 우라실을 포함한다.
일부 구현예에서, 상기 방법은 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하고, 우라실을 포함하지 않는 라이브러리의 이중 가닥 단편에 포함되어 있다.
일부 구현예에서, 제1 프라이머 연장을 사용하여 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 소화에 대해 저항성이 있다.
일부 구현예에서, 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함한다. 일부 구현예에서, 이러한 링커는 엑소뉴클레아제에 의해 분해되지 않는다. 일부 구현예에서, 이러한 링커는 합성 링커이다. 일부 구현예에서, 이러한 링커는 우라실을 포함하거나 다르게는 폴리머라아제 활성을 중지시키는 역할을 한다.
일부 구현예에서, USER은 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단한다. 일부 구현예에서, 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열은 하나 이상의 우라실을 포함한다.
일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 상이한 서열에 결합한다. 일부 구현예에서, 제1 연장 프라이머와 제2 연장 프라이머는 이중 가닥 핵산의 동일한 가닥에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 상기 프라이머를 사용하여 핵산 가닥을 생성한 후에 제거된다. 일부 구현예에서, 폴리머라아제 및/또는 제2 연장 프라이머는 SPRI 비드를 사용하여 제거된다. 일부 구현예에서, 폴리머라아제는 변성에 의해 제거되는 열감응성 폴리머라아제이다. 일부 구현예에서, 열감응성 폴리머라아제는 전장 Bst 또는 DNA 폴리머라아제 I이다.
IV. 다중 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
일부 구현예에서, 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법은, 시퀀싱 라이브러리를 제작하는 단계(여기서, 각각의 단편은 이중 가닥 핵산을 포함하는 삽입체와, 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하고, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함함); 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성을 갖는 효소 또는 효소들을 사용하여, 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함), 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계; 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계; 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계를 포함한다.
일부 구현예에서, 차단된 제2 연장 프라이머는, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없다. 일부 구현예에서, 차단된 제2 연장 프라이머는 차단이 제거되지 않는 한 연장이 일어날 수 없도록 차단을 포함한다. 일부 구현예에서, 차단은 차단된 제2 프라이머 상의 3' 포스페이트의 존재이다. 일부 구현예에서, 차단된 제2 프라이머는 3' 포스페이트를 절단하는 키나아제에 의해 차단 해제된다. 일부 구현예에서, 차단 해제된 제2 연장 프라이머는 핵산 가닥을 생성할 수 있다.
일부 구현예에서, 차단된 제2 연장 프라이머는 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합한다.
일부 구현예에서, 제2 연장 프라이머는 60℃ 미만의 용융 온도로 삽입체에 결합한다. 즉, 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 약할 수 있다. 즉, 제2 연장 프라이머는, 제2 연장 프라이머가 차단되었는지 여부에 관계없이, 삽입체에 대한 결합이 상대적으로 약할 수 있다. 일부 구현예에서, 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체로부터 해리된다.
일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, "핫 스타트" 연장 프로토콜이 사용되는 경우, 표준 연장 프로토콜과 비교하여 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는, 온도가 60℃ 초과, 65℃ 초과 또는 70℃ 초과인 경우, 더 적은 핵산 가닥을 생성한다. 일부 구현예에서, 제2 연장 프라이머와 폴리머라아제는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 핵산 가닥을 생성할 수 없다.
일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 이상의 용융 온도로 삽입체에 결합한다. 즉, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 삽입체에 대한 결합이 상대적으로 강할 수 있다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머는 60℃ 초과, 65℃ 초과 또는 70℃ 초과의 온도에서 삽입체와 회합된 상태로 유지된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계는 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 수행된다. 일부 구현예에서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도는 제2 연장 프라이머의 용융 온도보다 높다.
일부 구현예에서, 제2 연장 프라이머는 증폭시키는 단계 전에 제거된다. 일부 구현예에서, 제2 연장 프라이머는 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거된다.
실시예
실시예 1. 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
헤어핀 어댑터를 이용한 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 도 1은, 각각의 상이한 삽입체(14)를 갖는 복수의 단편(12)으로 형성된 시퀀싱 라이브러리의 대표적인 단편인 이중 가닥 단편(12)의 예를 보여준다. 각각의 단편(12)은 양쪽 말단에 어댑터(18)를 포함한다. 예시된 구현예에서, 어댑터(18)는 동일하다. 어댑터는 제1 가닥(22)과 제2 가닥(23)을 갖는 분기형 어댑터이다. 제1 가닥(22)과 제2 가닥(23)은 이중 가닥 영역(24)을 형성한다. 제1 가닥은 또한 헤어핀 이중 가닥 영역(26)과 이러한 이중 가닥 영역(26)의 자가 상보적 부분 사이에 배치된 링커(27)를 갖는 헤어핀 영역(25)을 포함한다.
도 1의 특정 예에서, 헤어핀 영역(25)은 A14와 이의 상보체 A14'를 포함한다. 이중 가닥 영역(26) 내 A14/A14'의 염기쌍 형성은, 헤어핀 영역(25)이 온전한 경우, A14 프라이머 서열이 증폭 프라이머에 결합할 수 없음을 의미한다. 이러한 예에서, 헤어핀 영역(25)의 이중 가닥 영역(26)은 A14 프라이머 서열과 이의 상보체(A14')를 포함한다.
도 1에 제시된 워크플로우는 단편(12)을 변성시켜 양성 및 음성 가닥을 생성하는 단계를 포함한다. 예시된 예에서, 음성 가닥(28)이 도시되어 있다. 하지만, 워크플로우 단계는 구현예에서 양성 가닥에도 적용됨을 이해해야 한다. 단편(12)이 관심있는 표적화된 삽입체(14a)를 함유하는 경우, 가닥(28a)은 표적화된 삽입체(14a)의 일부에 상보적인 연장 프라이머(29)에 결합한다. 헤어핀 영역(25)의 A14' 서열은 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(30)(예컨대, Taq)를 사용하여 제거된다. 폴리머라아제(30)는 이전의 이중 가닥 영역(26)을 단일 가닥으로 만들어, A14 서열을 이용 가능하게 만든다.
이어서, 폴리머라아제(30)가 제거된다. 제1 증폭 프라이머(36)로부터 전체 연장은 가닥(28a)을 카피할 수 있으며, 제2 증폭 프라이머(38)는 생성된 핵산 가닥 내 A14'에 결합하여 표적 서열을 포함하는 삽입체를 포함하는 단편을 특이적으로 증폭시킨다. 이러한 방법에서, (단편 생성 실패를 통해) 헤어핀 어댑터가 없는 단편, 또는 헤어핀 어댑터와 헤어핀 영역(25)이 "잠금된"(즉, 헤어핀의 A14 서열과 A14' 서열이 서로 회합되어 있는) 가닥(28b)과 같은 단편 또는 가닥은 증폭되지 않는다. 잠금된 헤어핀은 폴리머라아제가 A14에 이르도록 연장되는 것을 방지하기 때문에; 헤어핀을 포함하는 단편은 A14'를 포함하는 핵산 가닥을 생성할 수 없고, 따라서 A14 프라이머에 의해 증폭될 수 없다. 이러한 방법에서 연장 프라이머의 길이는 삽입체 서열을 포함하는 삽입체에의 결합에 대한 특이성을 보장하기 위해 증가될 수 있다. i5 서열과 i7 서열은 어레이에서 샘플 및 위치를 식별하는 데 사용될 수 있는 인덱스 서열을 나타낸다. ME = 모자이크 말단 서열(트랜스포사아제가 트랜스포존을 표적 서열에 통합시키는 데 필요한 트랜스포존 내 서열) 및 ME' = 모자이크 말단 서열의 상보체. 증폭은 각각의 말단에 상이한 시퀀싱 프라이머와 인덱스를 갖는 표적화된 삽입체(14)를 포함하는 전장 생성물(50)을 생성한다.
시퀀싱 라이브러리에서 표적 서열을 농축시키기 위해, 사용자는 이중 가닥 DNA 내 하나 이상의 표적 서열에 결합하는 연장 프라이머(즉, 표적 프로브)를 생성할 수 있다. 공지된 라이브러리 생성 및 태그 지정 수단(예컨대, Nextera, Truseq 등)을 사용하여, 헤어핀 함유 어댑터(18)를 이중 가닥 단편의 한쪽 또는 양쪽 5' 말단에 부가할 수 있다.
라이브러리의 이중 가닥 단편을 변성시킬 수 있다. 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 연장 프라이머를 사용하여 핵산 가닥을 생성할 수 있고, (2) A14' 서열의 전부 또는 일부를 제거할 수 있다.
헤어핀의 A14' 서열이 제거된(즉, 헤어핀이 잠금 해제된) 단편에서, 증폭 프라이머를 사용하여 잠금 해제된 헤어핀 어댑터로 단편을 이어서 선택적으로 증폭시킬 수 있다. 이러한 방법을 사용하면, 잠금 해제된 헤어핀을 갖는 단편만 증폭되게 된다. 헤어핀의 A14' 서열의 전부 또는 일부가 온전한 헤어핀을 포함하는 단편은 증폭되지 않는다. 도 1에 도시된 비표적 삽입체(14b)를 포함하는 증폭되지 않은 예에서, 헤어핀 어댑터 내 A14 서열은 상보적 A14' 서열과 염기쌍을 형성한다. 헤어핀 어댑터가 온전한 경우, 증폭 프라이머는 "잠금된" 헤어핀 2차 구조로 인해 증폭 프라이머 서열에 결합할 수 없다. 따라서, 비표적 삽입체는 증폭되지 않는다.
도 1에 도시된 방법에서, 제1 가닥이 (B15'를 포함하는 프라이머를 사용하여) 증폭되는 경우, A14'를 포함하는 핵산 가닥이 생성된다(점선으로 표시되어 있음). 라이브러리 단편에서 새로 생성된 가닥을 변성시킨 후, A14를 포함하는 증폭 프라이머가 증폭을 위해 A14'에 결합할 수 있다(A14가 도 1의 점선 가닥에 결합하는 것으로 표시되어 있음).
실시예 2. 헤어핀 어댑터와 USER 시약을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
"이중 잠금 해제" 방법을 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다(도 2). 이러한 대표적인 방법에서, 헤어핀 영역(25)은 X' 서열 내 우라실, 또는 우라실을 포함하는 것과 같은 합성 링커(60)인 링커(27)를 포함한다. 표적화된 삽입체(14a) 내 표적 서열에 결합하는 2개의 연장 프라이머(fwd1(62)과 fwd2(64))의 순차적 사용은, "이중 잠금 해제"(A14'의 제거, 이어서 X'의 순차적 제거)를 사용하는 방식으로 시퀀싱 라이브러리에서 표적 서열의 농축을 증가시키는 것을 가능하게 한다. 이러한 순차적 방법에서, 제1 핵산 가닥은 우라실을 포함한다. 제한 엔도뉴클레아제를 사용하여 헤어핀 어댑터 내 A14/A14' 서열을 절단할 수 있으며, 여기서 A14' 서열이 제거되지 않고 우라실을 포함하는 서열로 대체된다. 제한 엔도뉴클레아제 단계를 사용하여 표적 서열을 포함하지 않는 삽입체(즉, "표적화되지 않은 삽입체"를 포함하는 단편)를 제거할 수 있다.
이러한 방법을 사용하면, 특이성을 증가시키는 이러한 방법의 단계에 기반하여, 시퀀싱 라이브러리에서 표적 서열이 고도로 농축되는 것을 확인할 수 있다. 이러한 방법은 단일 삽입체에 포함될 수 있는 표적 서열에 결합할 수 있는 2개의 연장 프라이머(fwd1과 fwd2)를 사용한다. 즉, fwd1과 fwd2는 이중 가닥 DNA 샘플에서 공간적으로 근접한 표적 서열에 결합할 수 있다.
이러한 방법에서 헤어핀 어댑터는 2 세트의 상보적 핵산(도 2의 A14/A14' 및 X/X')을 포함한다. 이러한 구현예에서, A14는 어댑터이고(A14'는 이의 상보체임), X는 증폭 프라이머 서열이다(X'는 이의 상보체임). 나아가, X' 및/또는 X'와 A14' 사이의 링커는 우라실을 포함하거나, 다르게는 엑소뉴클레아제에 저항성이 있다.
라이브러리 단편을 변성시키고, 연장 프라이머를 부가한다(fwd1). 이어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) fwd1을 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실 NTP를 포함함), (2) A14'의 전부 또는 일부를 제거한다. 따라서, 생성된 핵산 가닥은 우라실을 포함하며, 제한 엔도뉴클레아제 절단에 대해 저항성이 있다.
fwd1 프라이머를 (엑소뉴클레아제 또는 SPRI 비드를 사용하여) 제거한다.
또한, 제한 효소는 임의의 헤어핀 어댑터를 절단할 수 있으며, 여기서 A14'가 제거되지 않고 우라실을 포함하는 핵산 가닥으로 대체된다. 도 2에 도시된 바와 같이, 우라실을 포함하는 핵산 가닥은 A14 서열이 제한 엔도뉴클레아제에 의해 절단되는 것을 차단할 수 있다. 대조적으로, 우라실을 포함하는 핵산 가닥이 생성되지 않은 라이브러리 단편(즉, fwd1 프라이머에 결합하지 않았던 삽입체를 포함하는 단편) 상의 헤어핀 어댑터는 제한 엔도뉴클레아제에 의해 절단된다.
이어서, USER을 사용하여 우라실을 포함하는 핵산 가닥, 및/또는 합성 링커(A14'와 X' 사이) 또는 X' 내 우라실을 절단할 수 있다. 이어서, fwd2 프라이머가 결합할 수 있고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제(예컨대, Taq)를 사용하여, (1) 표적 서열에 결합하는 fwd2를 사용하여 핵산 가닥을 생성하고, (2) X'의 전부 또는 일부를 제거한다. 이제, X'가 제거되었으므로, X에 결합하는 증폭 프라이머를 사용하여 fwd1과 fwd2 모두에 결합할 수 있는 삽입체를 포함하는 단편을 선택적으로 증폭시킬 수 있다. 이러한 방법은, fwd1 프라이머와 fwd2 프라이머에 의해 매개되는 별도의 차단 해제 단계(A14'를 제거한 후, X'를 제거함)를 포함하고, 또한 우라실 없이 A14/A14'를 포함하는 온전한 헤어핀 어댑터의 제한 엔도뉴클레아제 절단을 포함하기 때문에, 특이성이 증가되었다.
실시예 3. 2개의 연장 프라이머의 결찰과 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
이러한 방법에서, 2개의 연장 프라이머(80, 82)(fwd1과 fwd2)를 사용하며, 이들 프라이머는 모두 관심 삽입체 내 표적 서열에 결합한다. 즉, 도 3에 도시된 바와 같이, fwd1 연장 프라이머와 fwd2 연장 프라이머는 각각 개별 표적화된 삽입체 서열(14a)의 상이한, 예를 들어 비연속 영역에 결합한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 사용하여, 결찰된 fwd1 및 fwd2 구조(84)를 생성한다. fwd2가 차단 해제된 후, 이러한 결찰된 프라이머를 핫 스타트 연장 반응에 사용할 수 있다. 즉, fwd2 프라이머가 차단되어, 연장을 매개할 수 없다. 이러한 경우, 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제를 포함하는 효소 믹스를 이용하여 초기 연장을 수행한다. 엑소뉴클레아제 활성이 없는 폴리머라아제와 리가아제의 이러한 믹스는 ELM 믹스일 수 있다(예컨대, Illumina DNA PCR-Free Library Prep kit #1000000086922에 제공되어 있음). 따라서, fwd1로부터의 연장은 fwd2를 절단하지 않고 fwd1과 fwd2 사이의 핵산 가닥을 결찰시킨다.
결찰된 fwd1-fwd2 프라이머는, 결찰된 프라이머와 삽입체 사이에 있는 다수의 쌍을 이룬 뉴클레오타이드에 기반하여 삽입체에 고친화도 결합하게 된다. 이어서, fwd2에 대한 차단을 제거할 수 있다.
fwd2 프라이머는 표적 서열에 대해 상대적으로 낮은 친화도를 갖도록, 용융 온도가 60℃ 미만이 되도록 설계될 수 있다. 이러한 방식으로, "핫 스타트" 연장 반응(60℃ 이상의 온도에서 개시됨)은, fwd2 프라이머가 핵산 가닥의 생성 전에 삽입체로부터 해리될 수 있음을 의미한다. 대조적으로, 결찰된 fwd1-fwd2 차단 해제된 프라이머는 더 높은 온도에서 결합된 상태를 유지하고, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여, (1) 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고, (2) A14'의 전부 또는 일부를 제거하는 것을 매개할 수 있다.
이러한 방법을 사용하면, fwd1과 fwd2 둘 모두를 이용하여 시퀀싱 라이브러리에서 표적 서열을 농축시킬 수 있다. 따라서, 이러한 방법은 fwd1에 결합하는 표적 서열과 fwd2에 결합하는 표적 서열을 포함하는 관심 단편을 선택적으로 증폭시키는 데 있어서 더 큰 특이성을 나타낸다.
실시예 4. 연결된 연장 프라이머와 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
도 4에 도시된 또 다른 예에서, 2개의 프라이머(90, 92)는, 일 구현예에서, 표적화된 삽입체 서열에 상보적이지 않은 링커(94)를 통해 연결되어, 연결된 연장 프라이머 구조(96)를 형성한다. 도 4에서 fwd1과 fwd2로 예시된 프라이머(90, 92)는 표적화된 삽입체 서열의 2개의 상이한 비연속 영역에 상보적이다. 연결된 연장 프라이머 구조의 용융 온도는, 링커가 혼성화되지 않아, 용융 온도에 유의하게 기여하지 않기 때문에, 도 4에 도시된 바와 같이 fwd1' 프라이머 및 fwd2' 프라이머에 대한 상보적 서열에 혼성화될 때의 용융 온도에 의해 결정된다.
어닐링과 연장은 fwd1 연장 프라이머 또는 fwd2 연장 프라이머 단독의 용융 온도보다 높은 용융 온도에서 일어날 수 있다. 용융 온도는, fwd1 프라이머 또는 fwd2 프라이머 중 하나만 상보적 서열을 갖는 경우, 연결된 연장 프라이머 구조가 결합할 수 없을 정도로 충분히 높다. 2개의 프라이머가 모두 표적화된 삽입체 서열에 결합할 수 있는 경우, 연결된 연장 프라이머 구조는 연장을 위해 결합된 상태를 유지할 수 있다. 따라서, 2개의 별개의 서열이 존재해야 하는 더 높은 특이성 요건이 실현된다. 결합된 연결된 연장 프라이머 구조는, 헤어핀 어댑터의 이중 가닥 부분을 제거하여 도시된 바와 같이 5' A14 서열을 드러내거나 잠금 해제하기 위해, 본원에 일반적으로 논의된 바와 같은 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하는 연장 반응에 사용될 수 있다.
링커는 2개의 상이한 프라이머를 연결하는 범용 서열일 수 있다. 복수의 상이한 표적화된 삽입체 서열을 위한 반응 혼합물을 생성하기 위해, 제1 프라이머와 제2 프라이머의 각각의 상이한 세트는 각각의 관심 표적 서열에 특이적일 수 있다. 따라서, 각각의 상이한 표적 서열은 특정 제1 프라이머와 특정 제2 연장 프라이머를 가질 수 있다. 하지만, 모든 세트에 대한 연결 서열은 각각의 제1 프라이머를 이의 상응하는 제2 프라이머와 연결하는 데 사용되는 동일한 서열일 수 있다. 이러한 배열은 공통 링커 서열에 의해 연결되는 더 짧은 특정 서열을 상대적으로 덜 비싸게 맞춤형으로 제조하는 것을 가능하게 한다. 링커는, 링커가 어떠한 표적화된 삽입체 서열에도 결합하지 않도록 설계될 수 있다.
실시예 5. 결찰된 이중 가닥 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
본원에 논의된 특정 구현예는 헤어핀 어댑터에 관한 것이지만, 도 5에 예시된 바와 같이 연장 매개 이중 가닥 어댑터 결찰을 이용하여 다른 구현예를 구현할 수 있다. 도 5는 삽입체(14)를 갖는 라이브러리 단편(12) 사이의 비교를 나타내며, 여기서 일부 단편(12)은 표적화된 삽입체 서열을 갖고(14a), 다른 단편(12)은 표적화된 삽입체 서열을 갖지 않는다(14b).
단편(12)은 말단 어댑터(100)를 갖는다. 각각의 말단 어댑터는 제1 가닥(101)과 제2 가닥(102)을 포함한다. 제1 가닥(101)과 제2 가닥(102)의 부분은 상보적이며, 함께 이중 가닥 영역(103)을 형성한다. 제2 가닥(102)의 또 다른 부분은 이중 가닥 영역(103)의 3' 말단으로부터 멀리 연장되는 단일 가닥 3' 말단 영역(104)을 포함한다. 도 5의 예시된 예에서 어댑터(100)는 헤어핀을 포함하지 않는다.
단편을 변성시켜 분리된 가닥을 형성하면, 표적화된 삽입체(14a)를 함유하는 가닥(112a)에 특이적으로 혼성화되는 표적 특이적 연장 프라이머(110)의 결합이 가능해진다. 표적 서열을 포함하지 않는 삽입체(14b)를 갖는 다른 가닥(112b)은 반응 조건 하에서 프라이머(110)에 결합하지 않는다. 일 구현예에서, 상기 방법은 각각의 상이한 표적 서열에 대해 상이한 서열을 갖는 복수의 표적 특이적 연장 프라이머(110)와 함께 사용될 수 있다.
프라이머(110)로부터 상보적 가닥을 연장시키면, 비표적 삽입체(14b)를 갖는 다른 가닥(112b) 상에 존재하지 않는 이중 가닥 말단(120)을 갖는 가닥(112a)과 상보적 가닥의 듀플렉스가 생성된다. 이중 가닥 말단(120)은 이중 가닥 어댑터(124)에 후속으로 결찰되게 되는 A-오버행을 부가하기 위해 연장될 수 있다. 가닥(112a)의 5' 말단에서의 결찰로 5' 말단을 조작하고, 이어서 이를 증폭시켜 표적화된 삽입체(14a)를 함유하는 본원에 제공된 바와 같은 상이한 말단 어댑터를 갖는 전장 생성물(130)을 생성할 수 있다. 예를 들어, 전장 생성물의 각각의 가닥은 5' 말단에 제1 증폭 프라이머 서열과 3' 말단에 제2 증폭 프라이머 서열을 가질 수 있다. 증폭은 본원에 논의된 바와 같은 인덱스된 프라이머를 사용할 수 있다. 예시된 예는 A-오버행 결찰을 나타내지만, 이중 가닥 말단(120)은 또한 평활한 이중 가닥 어댑터에 대한 평활한 이중 가닥 비주형 결찰일 수 있다.
예시된 방법에서, 비표적 삽입체(14b)를 갖는 가닥(112b)은 증폭되지 않는다. 프라이머(110)에 대한 결합 사건이 없기 때문에, 이중 가닥 말단을 생성하는 연장이 없다. 따라서, 프라이머 세트의 단일 프라이머(36)만 비표적 가닥(112b)에 결합할 수 있으며, 비표적 가닥은 증폭되지 않는다.
실시예 6. 헤어핀 어댑터와 대조군 어댑터를 사용한 라이브러리 증폭 결과
헤어핀 영역 내 결합하는 프라이머와 분기형 영역 내 결합하는 프라이머(양성 대조군)를 사용하여 결찰된 헤어핀 어댑터의 PCR 증폭 효과를 시험하기 위해 실험을 설계하였다. 인산화된 5' 말단을 갖는 3' 단일 A-오버행을 포함하도록 모델 80mer 올리고뉴클레오타이드 이중 가닥 DNA 주형을 합성하였다. 이러한 모델 주형은 이중 가닥 DNA 샘플 삽입체에 대한 단순화된 모델의 역할을 했다. 이러한 주형에, Illumina LIG2 시약을 사용하여 30℃에서 10분 동안 2개의 상이한 어댑터 유형을 결찰시켰다. 대조군 듀플렉스 올리고는 1 uM이었고, 어댑터는 9 uM이었다. 먼저, 듀플렉스 ME 영역, 한쪽 분기에 내부 서열 CPH4' 및 B15', 및 다른 쪽 분기에 A14를 함유하는 대조군 어댑터 유형을 사용하였다(도 7 대조군 어댑터 참조). 다른 어댑터 유형은 동일한 ME 듀플렉스 영역, 대조군 어댑터와 동일한 상부 가닥, 하지만 추가 내부 서열(CPH3)을 함유하는 분기의 하부 가닥, 및 A14의 헤어핀을 함유하고 있었다. 어댑터를 95℃에서 변성시킨 후, 얼음 위에서 급속 냉각시켜 Tris-HCl(pH 8), 10 mM NaCl 중에 50 uM의 스톡을 형성하였다. A14와 A14' 사이의 헤어핀 서열은 5개 염기 길이였음에 유의한다. 각각의 어댑터를 별도의 결찰 반응에 부가하여, 듀플렉스의 각각의 말단에 대조군 어댑터 또는 헤어핀 어댑터로 결찰된 듀플렉스를 생성하였다. 내부 프라이머(대조군 분기형 어댑터의 경우 CPH4-ME와 A14-i5-P5, 헤어핀 어댑터의 경우 CPH4-ME와 CPH3-ME) 또는 외부 프라이머(두 가지 어댑터의 경우 모두 A14-i5-P5와 B15-i7-P7)를 사용하여 PCR 증폭을 수행하였다. 결찰된 주형을 7.5배로 희석하고, Illumina PCR 믹스(EPM) 중 PCR 시약과 혼합하였다. 95℃에서의 초기 3분 변성, 이어서 95℃에서 20초, 60℃에서 15초의 8회 사이클을 사용하여, 연장 온도를 위한 온도 구배(72℃ 내지 60℃)로 증폭을 수행하였다. 72℃에서 5분 동안 최종 연장시킨 후, 4℃로 만들었다. Agilent D1000 HS Tapestation을 사용하여 증폭 생성물을 정량화하였다.
도 6은 연장 온도 대 피크 몰농도의 4개 패널을 보여주고, 도 7은 도 6의 결과를 생성하기 위해 사용된 대조군 어댑터 구조와 헤어핀 어댑터 구조를 보여준다. 연장 온도 구배에 대한 영향은 거의 없는 것으로 보이지만, 외부 프라이머로 증폭된 경우 헤어핀 어댑터에서 가장 낮은 증폭 생성물이 생성되었음이 명확하게 나타난다(하부 우측 패널). 헤어핀 어댑터에 대한 대조군 내부 프라이머는, 생성물이 내부 프라이머로 결찰된 어댑터 주형으로부터 증폭될 수 있음을 명확하게 보여주며, 이는 헤어핀 어댑터 결찰을 확인시켜 준다. 비헤어핀 어댑터 라이브러리의 경우, 내부 및 외부 프라이머 쌍에서 PCR을 사용하는 경우 유사한 수율이 관찰되었다. 이러한 데이터는, 헤어핀에 포함된 프라이머 쌍(이러한 경우 A14)이 사용되는 경우, 헤어핀 어댑터 서열이 PCR 증폭을 저해함을 시사한다. 즉, 헤어핀의 잠금된 구성은 증폭을 방지한다.
등가물
전술한 명세서는 당업자가 구현예를 실시할 수 있게 하기에 충분한 것으로 간주된다. 전술한 설명 및 실시예는 특정 구현예를 상세하게 설명하며, 발명자가 고려된 최상의 방식을 설명한다. 전술한 내용이 본문에서 아무리 상세하게 설명되었다 하더라도, 구현예는 다수의 방식으로 실시될 수 있으며, 첨부된 청구범위 및 이의 임의의 등가물에 따라 해석되어야 함을 이해할 것이다.
본원에 사용된 약이라는 용어는, 명시적으로 표시되는지 여부에 관계없이, 예를 들어 정수, 분수 및 백분율을 포함하는 수치값을 나타낸다. 약이라는 용어는 일반적으로, 당업자가 인용된 값과 동등한(예를 들어, 동일한 기능 또는 결과를 갖는) 것으로 간주하는 수치값의 범위(예를 들어, 인용된 범위의 +/- 5% 내지 10%)를 나타낸다. 적어도 및 약과 같은 용어가 수치값 또는 범위의 목록에 선행하는 경우, 이러한 용어는 목록에 제공된 모든 값 또는 범위를 조정한다. 일부 경우에, 약이라는 용어는 가장 가까운 유효숫자로 반올림된 수치값을 포함할 수 있다.
SEQUENCE LISTING <110> ILLUMINA CAMBRIDGE LIMITED <120> METHODS OF ENRICHING A TARGET SEQUENCE FROM A SEQUENCING LIBRARY USING HAIRPIN ADAPTORS <130> IP-2043-PCT <140> <141> <150> 63/077,271 <151> 2020-09-11 <160> 2 <170> PatentIn version 3.5 <210> 1 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 1 tcgtcggcag cgtc 14 <210> 2 <211> 15 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 2 gtctcgtggg ctcgg 15

Claims (91)

  1. 핵산 시퀀싱 라이브러리를 제작하는 데 사용되는 어댑터로서,
    a. 5' 말단과 3' 말단을 갖는 제1 가닥과,
    b. 5' 말단과 3' 말단을 갖는 제2 가닥을 포함하며;
    여기서 제1 가닥의 3' 말단의 일부와 제2 가닥의 5' 말단의 일부는 상보적이며, 함께 제1 이중 가닥 영역을 형성하고;
    제1 가닥의 5' 말단의 일부와 제2 가닥의 3' 말단의 일부는 비상보적이고;
    제1 가닥의 5' 말단 부분은 제2 이중 가닥 영역을 포함하는, 어댑터.
  2. 제1항에 있어서, 제2 이중 가닥 영역이 헤어핀 구조인, 어댑터.
  3. 제1항 또는 제2항에 있어서, 제2 이중 가닥 영역이 비핵산 부분을 포함하는, 어댑터.
  4. 제3항에 있어서, 비핵산 부분이 링커인, 어댑터.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서, 제1 가닥의 5' 말단이 엑소뉴클레아제에 의해 분해되지 않는 링커 부분을 포함하는, 어댑터.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 이중 가닥 영역이 적어도 5개의 연속된 뉴클레오타이드인, 어댑터.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 제2 이중 가닥 영역이 적어도 5개의 연속된 뉴클레오타이드인, 어댑터.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 제2 가닥의 5' 말단이 인산화된 것인, 어댑터.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 제1 가닥과 제2 가닥의 모든 시토신 염기가 메틸화된 것인, 어댑터.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 포획 모이어티를 추가로 포함하는, 어댑터.
  11. 핵산 시퀀싱 라이브러리를 제작하는 방법으로서,
    a. 복수의 이중 가닥 핵산 단편을 생성하는 단계; 및
    b. 제1항 내지 제10항 중 어느 한 항의 어댑터를 복수의 이중 가닥 핵산 단편의 적어도 하나의 말단에 부착시키는 단계
    를 포함하는, 방법.
  12. 제11항에 있어서, 어댑터가 태그먼트화(tagmentation)를 통해 부착되는, 방법.
  13. 제11항에 있어서, 어댑터가 결찰을 통해 부착되는, 방법.
  14. 핵산 시퀀싱 라이브러리를 제작하기 위한 키트로서,
    a. 제1항 내지 제10항 중 어느 한 항의 어댑터;
    b. 어댑터의 일부와 혼성화 가능한 적어도 하나의 프라이머;
    c. 적어도 하나의 효소; 및
    d. dNTP
    를 포함하는, 키트.
  15. 제14항에 있어서, 적어도 하나의 효소가 엑소뉴클레아제 활성을 갖는, 키트.
  16. 제14항 또는 제15항에 있어서, 적어도 하나의 효소가 폴리머라아제인, 키트.
  17. 제14항 내지 제16항 중 어느 한 항에 있어서, 적어도 하나의 구성요소가 동결건조된 또는 건조된 형태인, 키트.
  18. 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
    a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
    i. 이중 가닥 핵산을 포함하는 삽입체와,
    ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는, 상기 제작하는 단계;
    b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계; 및
    c. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
    i. 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 하나 이상의 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
    ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
    를 포함하는, 방법.
  19. 제18항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
  20. 제18항 또는 제19항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하고/하거나, 하나 초과의 연장 프라이머가 링커를 통해 부착되는, 방법.
  21. 제20항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
  22. 제18항 내지 제21항 중 어느 한 항에 있어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제가 Taq인, 방법.
  23. 제18항 내지 제22항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제가 연장 후 제거되는, 방법.
  24. 제23항에 있어서, 하나 이상의 연장 프라이머 및/또는 연장 프라이머를 사용하여 핵산 가닥을 생성하는 데 사용되는 폴리머라아제의 제거가, 고체상 가역적 고정화(SPRI: solid-phase reversible immobilization) 비드 및/또는 열감응성 폴리머라아제의 변성을 이용하여 이루어지는, 방법.
  25. 제18항 내지 제24항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계가 우라실을 포함하는 반응 혼합물을 이용하여 수행되는, 방법.
  26. 제25항에 있어서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥이 하나 이상의 우라실 특이적 절단 시약(USER: uracil-specific excision reagent)에 의해 절단되는, 방법.
  27. 제26항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII인, 방법.
  28. 제27항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소인, 방법.
  29. 제18항 내지 제28항 중 어느 한 항에 있어서, 라이브러리 내 복수의 이중 가닥 단편이 표적 서열을 포함하지 않는, 방법.
  30. 제18항 내지 제29항 중 어느 한 항에 있어서, 상기 헤어핀 어댑터가, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있는, 방법.
  31. 제30항에 있어서, 표적 서열을 포함하지 않는 라이브러리 내 복수의 이중 가닥 단편에서, 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하는, 방법.
  32. 제25항 내지 제31항 중 어느 한 항에 있어서, 우라실을 포함하는 반응 혼합물을 이용하여 생성된 핵산 가닥이 제한 엔도뉴클레아제 소화에 대해 저항성이 있는, 방법.
  33. 제32항에 있어서, 제한 엔도뉴클레아제가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합에 의해 형성된 이중 가닥 핵산에서 절단하는, 방법.
  34. 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
    a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
    i. 이중 가닥 핵산을 포함하는 삽입체와,
    ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는
    1. 뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함);
    2. 뉴클레오타이드 서열의 제2 세트(여기서, 뉴클레오타이드 서열의 제2 세트는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하며,
    여기서 뉴클레오타이드 서열의 제1 세트는 뉴클레오타이드 서열의 제2 세트보다 삽입체에 더 가까움); 및
    3. 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커를 포함하는, 상기 제작하는 단계;
    b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계;
    c. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
    i. 시퀀싱 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 핵산 가닥을 생성하기 위한 반응 혼합물은 우라실을 포함함),
    ii. 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계;
    d. 제1 연장 프라이머를 제거하는 단계;
    e. USER을 제공하는 단계; 및
    f. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
    i. 이중 가닥 단편의 라이브러리 내 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
    ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
    를 포함하는, 방법.
  35. 제34항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
  36. 제34항 또는 제35항에 있어서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
  37. 제36항에 있어서, 증폭 프라이머 서열의 상보체 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이의 링커가 우라실을 포함하는, 방법.
  38. 제34항 내지 제37항 중 어느 한 항에 있어서, 제1 프라이머를 사용하여 핵산 가닥을 생성한 후 제한 엔도뉴클레아제를 이용하여 헤어핀 어댑터를 절단하는 단계를 추가로 포함하며, 여기서 상기 헤어핀 어댑터는, 어댑터 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부가 존재하는 라이브러리의 이중 가닥 단편에 포함되어 있는, 방법.
  39. 제34항 내지 제38항 중 어느 한 항에 있어서, 제1 프라이머 연장을 사용하여 생성된 핵산 가닥이 우라실을 포함하며, 제한 엔도뉴클레아제 소화에 대해 저항성이 있는, 방법.
  40. 제34항 내지 제39항 중 어느 한 항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하는, 방법.
  41. 제40항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
  42. 제34항 내지 제41항 중 어느 한 항에 있어서, USER이 제1 프라이머 연장에 의해 생성된 핵산 가닥, 헤어핀 어댑터에 포함된 링커 및/또는 어댑터 서열에 적어도 부분적으로 상보적인 서열을 절단하는, 방법.
  43. 제42항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII인, 방법.
  44. 제42항에 있어서, USER이 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII의 활성을 갖는 단일 효소인, 방법.
  45. 제34항 내지 제44항 중 어느 한 항에 있어서, 제1 연장 프라이머와 제2 연장 프라이머가 상이한 서열에 결합하는, 방법.
  46. 제45항에 있어서, 제1 연장 프라이머와 제2 연장 프라이머가 이중 가닥 핵산의 동일한 가닥에 결합하는, 방법.
  47. 제34항 내지 제46항 중 어느 한 항에 있어서, 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제가 Taq인, 방법.
  48. 제34항 내지 제47항 중 어느 한 항에 있어서, 폴리머라아제가 단편을 증폭시키는 단계 전에 제거되는, 방법.
  49. 제34항 내지 제48항 중 어느 한 항에 있어서, 제2 연장 프라이머가 상기 프라이머를 사용하여 핵산 가닥을 생성한 후 제거되는, 방법.
  50. 제48항 또는 제49항에 있어서, 폴리머라아제 및/또는 제2 연장 프라이머가 SPRI 비드를 사용하고/하거나 열감응성 폴리머라아제를 변성시키는 방식으로 제거되는, 방법.
  51. 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
    a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 각각의 단편은
    i. 이중 가닥 핵산을 포함하는 삽입체와,
    ii. 이중 가닥 단편의 한쪽 또는 양쪽 가닥의 5' 말단에 있는 헤어핀 어댑터를 포함하며, 여기서 헤어핀 어댑터는 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열을 포함하는, 상기 제작하는 단계;
    b. 이중 가닥 단편을 변성시켜 단일 가닥 단편을 형성하는 단계;
    c. 프라이머 믹스와, 5'-3' 엑소뉴클레아제 활성 없이 결찰 활성과 폴리머라아제 활성이 있는 효소 믹스를 사용하여,
    i. 프라이머 믹스의 제1 연장 프라이머를 사용하여 핵산 가닥을 생성하고(여기서, 프라이머 믹스는 제1 연장 프라이머와 차단된 제2 연장 프라이머를 포함하고, 여기서 제1 연장 프라이머와 차단된 제2 연장 프라이머는 이중 가닥 핵산에 포함된 상이한 관심 서열에 결합함),
    ii. 제1 연장 프라이머를 사용하여 생성된 핵산 가닥을 차단된 제2 연장 프라이머에 결찰시키는 단계;
    d. 삽입체에 결합되지 않은 프라이머 믹스를 제거하는 단계;
    e. 차단된 제2 연장 프라이머를 차단 해제하는 단계; 및
    f. 5'-3' 엑소뉴클레아제 활성을 갖는 폴리머라아제를 사용하여,
    i. 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하고,
    ii. 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 전부 또는 일부를 제거하는 단계
    를 포함하는, 방법.
  52. 제51항에 있어서, 증폭 프라이머 서열에 결합하는 증폭 프라이머를 사용하여 단편을 증폭시키는 단계를 추가로 포함하는, 방법.
  53. 제51항 또는 제52항에 있어서, 헤어핀 어댑터가 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열 사이에 링커를 추가로 포함하는, 방법.
  54. 제53항에 있어서, 링커가 엑소뉴클레아제에 의해 분해되지 않는, 방법.
  55. 제51항 내지 제54항 중 어느 한 항에 있어서, 차단된 제2 연장 프라이머가, 차단 해제되지 않는 한, 핵산 가닥을 생성할 수 없는, 방법.
  56. 제55항에 있어서, 차단된 제2 연장 프라이머가 제1 연장 프라이머에 의해 결합된 서열의 5' 및 적어도 하나의 삽입체에 포함된 표적 서열에 결합하는, 방법.
  57. 제51항 내지 제56항 중 어느 한 항에 있어서, 결찰된 제1 연장 프라이머와 제2 연장 프라이머의 어닐링 및 연장 온도가 제2 연장 프라이머의 용융 온도보다 높은, 방법.
  58. 제57항에 있어서, 차단된 제2 연장 프라이머가 60℃ 미만의 용융 온도로 삽입체에 결합하고/하거나 결찰된 제1 연장 프라이머와 제2 연장 프라이머를 사용하여 핵산 가닥을 생성하는 단계가 60℃ 이상의 온도에서 수행되는, 방법.
  59. 제51항 내지 제58항 중 어느 한 항에 있어서, 제2 연장 프라이머가 증폭시키는 단계 전에 제거되는, 방법.
  60. 제59항에 있어서, 제2 연장 프라이머가 SPRI 비드 또는 엑소뉴클레아제를 사용하여 제거되는, 방법.
  61. 제18항 내지 제60항 중 어느 한 항에 있어서, 하나 이상의 연장 프라이머가 유전자 특이적 프라이머인, 방법.
  62. 제18항 내지 제61항 중 어느 한 항에 있어서, 헤어핀 어댑터가 이중 가닥 단편의 한쪽 가닥의 5' 말단에 있는, 방법.
  63. 제18항 내지 제62항 중 어느 한 항에 있어서, 헤어핀 어댑터가 이중 가닥 단편의 양쪽 가닥의 5' 말단에 있는, 방법.
  64. 제18항 내지 제63항 중 어느 한 항에 있어서, 헤어핀 어댑터가 결찰 또는 태그먼트화에 의해 혼입되는, 방법.
  65. 제18항 내지 제64항 중 어느 한 항에 있어서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 각각 적어도 14개의 뉴클레오타이드를 포함하는, 방법.
  66. 제18항 내지 제65항 중 어느 한 항에 있어서, 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 각각 14개 내지 60개의 뉴클레오타이드를 포함하는, 방법.
  67. 제18항 내지 제66항 중 어느 한 항에 있어서, 헤어핀 어댑터가 안정성을 증가시키기 위한 하나 이상의 증강을 포함하며, 선택적으로 여기서 증강은 하나 이상의 변형된 또는 잠금된 핵산을 포함하는, 방법.
  68. 제18항 내지 제67항 중 어느 한 항에 있어서, 헤어핀 어댑터가 60℃ 이상, 65℃ 이상 또는 70℃ 이상의 온도에서 증폭 프라이머 서열과 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열의 회합을 유지하는, 방법.
  69. 제18항 내지 제68항 중 어느 한 항에 있어서, 증폭 프라이머 서열이 A14, A14', B15 또는 B15' 서열을 포함하는, 방법.
  70. 제18항 내지 제69항 중 어느 한 항에 있어서, 증폭 프라이머 서열이 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열과 회합되어 있을 때, 증폭 프라이머가 헤어핀 어댑터에 포함된 증폭 프라이머 서열에 결합할 수 없는, 방법.
  71. 제18항 내지 제70항 중 어느 한 항에 있어서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 증폭 프라이머 서열의 상보체와 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상 또는 99% 이상의 서열 동일성을 갖는 서열을 포함하는, 방법.
  72. 제71항에 있어서, 증폭 프라이머 서열에 적어도 부분적으로 상보적인 서열이 증폭 프라이머 서열의 상보체를 포함하는, 방법.
  73. 제18항 내지 제72항 중 어느 한 항에 있어서, 이중 가닥 단편의 한쪽 또는 양쪽 가닥이 헤어핀 어댑터의 3'에 하나 이상의 추가 어댑터를 포함하는, 방법.
  74. 제18항 내지 제73항 중 어느 한 항에 있어서, 이중 가닥 단편이 한쪽 또는 양쪽 가닥의 3' 말단에 하나 이상의 어댑터를 포함하는, 방법.
  75. 제73항 또는 제74항에 있어서, 하나 이상의 어댑터가 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열 또는 시퀀싱 관련 서열, 또는 이들의 조합을 포함하는, 방법.
  76. 제19항 내지 제75항 중 어느 한 항에 있어서, 증폭 프라이머를 사용하여 단편을 증폭시키는 단계가 헤어핀 어댑터를 파괴하지 못하는, 방법.
  77. 제76항에 있어서, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제에 5'-3' 엑소뉴클레아제 활성이 결여되어 있거나, 증폭 프라이머를 사용하여 단편을 증폭시키는 데 사용되는 폴리머라아제가 가닥 치환 폴리머라아제가 아닌, 방법.
  78. 제77항에 있어서, 단편을 증폭시키는 데 사용되는 폴리머라아제가 Q5인, 방법.
  79. 제19항 내지 제78항 중 어느 한 항에 있어서, 증폭이 브릿지 증폭인, 방법.
  80. 제19항 내지 제79항 중 어느 한 항에 있어서, 증폭된 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
  81. 제80항에 있어서, 삽입체의 전체 서열의 시퀀싱을 가능하게 하는, 방법.
  82. 제18항 내지 제81항 중 어느 한 항에 있어서, 이중 가닥 핵산이 DNA 또는 RNA를 포함하는, 방법.
  83. 제81항에 있어서, 이중 가닥 핵산이 무세포 DNA 또는 엑솜 샘플을 포함하는, 방법.
  84. 제18항 내지 제83항 중 어느 한 항에 있어서, 단편 중복제거에 사용되는, 방법.
  85. 이중 가닥 단편의 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법으로서,
    a. 시퀀싱 라이브러리를 제작하는 단계로서, 여기서 이중 가닥 단편의 각각의 단편은 말단 어댑터 사이에 배치된 삽입체를 포함하고, 여기서 각각의 말단 어댑터는
    뉴클레오타이드 서열의 제1 세트(여기서, 뉴클레오타이드 서열의 제1 세트는 어댑터 서열과 어댑터 서열에 적어도 부분적으로 상보적인 서열을 포함함)와,
    뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열을 포함하는, 상기 제작하는 단계;
    b. 이중 가닥 단편을 변성시켜 분리된 가닥을 형성하는 단계(각각의 분리된 가닥은 삽입체의 단일 가닥 부분을 포함함);
    c. 서열 특이적 연장 프라이머를 삽입체의 단일 가닥 부분 내 상보적 서열에 어닐링하는 단계;
    d. 어닐링된 연장 프라이머에서 상보적 가닥을 연장시켜 이중 가닥 말단을 갖는 상보적 가닥과 분리된 가닥의 듀플렉스(duplex)를 형성하는 단계(여기서, 이중 가닥 말단은 상보적 가닥의 3' 말단과 분리된 가닥의 5' 말단을 포함함);
    e. 이중 가닥 어댑터를 듀플렉스의 각각의 이중 가닥 말단에 결찰시키는 단계;
    f. 듀플렉스를 변성시키는 단계; 및
    g. 듀플렉스의 변성된 가닥을 증폭시켜 증폭된 생성물을 생성하는 단계
    를 포함하는, 방법.
  86. 제85항에 있어서, 증폭된 생성물을 시퀀싱하는 단계를 추가로 포함하는, 방법.
  87. 제86항에 있어서, 증폭된 생성물을 시퀀싱하기 위해 인덱스 서열을 갖는 프라이머를 사용하는 것을 포함하는, 방법.
  88. 제85항 또는 제86항에 있어서, 이중 가닥 말단에 A 오버행을 부가하는 단계를 추가로 포함하며, 여기서 이중 가닥 어댑터는 상보적 T 오버행을 포함하는, 방법.
  89. 제85항 내지 제87항 중 어느 한 항에 있어서, 이중 가닥 어댑터가 제2 증폭 프라이머 서열과 제2 증폭 프라이머 서열에 상보적인 서열을 포함하는, 방법.
  90. 제88항에 있어서, 뉴클레오타이드 서열의 제1 세트의 3' 말단에서부터 멀리 연장되는 증폭 프라이머 서열이 제2 증폭 프라이머 서열과 상이한 서열을 포함하는, 방법.
  91. 제85항 내지 제89항 중 어느 한 항에 있어서, 서열 특이적 연장 프라이머가 각각의 상이한 표적 서열에 대해 복수의 상이한 서열을 포함하는, 방법.
KR1020237011164A 2020-09-11 2021-09-10 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법 KR20230069135A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063077271P 2020-09-11 2020-09-11
US63/077,271 2020-09-11
PCT/EP2021/074931 WO2022053610A1 (en) 2020-09-11 2021-09-10 Methods of enriching a target sequence from a sequencing library using hairpin adaptors

Publications (1)

Publication Number Publication Date
KR20230069135A true KR20230069135A (ko) 2023-05-18

Family

ID=77910787

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237011164A KR20230069135A (ko) 2020-09-11 2021-09-10 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법

Country Status (10)

Country Link
US (1) US20230416803A1 (ko)
EP (1) EP4211261A1 (ko)
JP (1) JP2023540177A (ko)
KR (1) KR20230069135A (ko)
CN (1) CN116323970A (ko)
AU (1) AU2021339945A1 (ko)
CA (1) CA3188197A1 (ko)
IL (1) IL300983A (ko)
MX (1) MX2023001400A (ko)
WO (1) WO2022053610A1 (ko)

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
JP2801051B2 (ja) 1988-06-24 1998-09-21 アムジエン・インコーポレーテツド 核酸塩基配列を検出するための方法及び試薬
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
KR950013953B1 (ko) 1990-01-26 1995-11-18 애보트 래보라토리즈 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
AU694187B2 (en) 1994-02-07 1998-07-16 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis TM of single nucleotide polymorphisms and its use in genetic analysis
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US20050191698A1 (en) 1999-04-20 2005-09-01 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
JP2003521252A (ja) 2000-02-07 2003-07-15 イルミナ インコーポレイテッド ユニバーサルプライミングを用いる核酸検出方法
US6913884B2 (en) 2001-08-16 2005-07-05 Illumina, Inc. Compositions and methods for repetitive use of genomic DNA
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
EP1975251A3 (en) 2000-07-07 2009-03-25 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
ES2407681T3 (es) 2002-08-23 2013-06-13 Illumina Cambridge Limited Nucleótidos modificados para la secuenciación de polinucleótidos.
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
US7670810B2 (en) 2003-06-20 2010-03-02 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
CA2579150C (en) 2004-09-17 2014-11-25 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP3373174A1 (en) 2006-03-31 2018-09-12 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
EP4134667A1 (en) 2006-12-14 2023-02-15 Life Technologies Corporation Apparatus for measuring analytes using fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
WO2008096146A1 (en) 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
WO2009133466A2 (en) * 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
WO2012058096A1 (en) 2010-10-27 2012-05-03 Illumina, Inc. Microdevices and biosensor cartridges for biological or chemical analysis and systems and methods for the same
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
EP3083994B1 (en) 2013-12-20 2021-08-18 Illumina, Inc. Preserving genomic connectivity information in fragmented genomic dna samples
EP3180448A4 (en) * 2014-08-14 2018-01-17 Abbott Molecular Inc. Multifunctional oligonucleotides
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US20170283864A1 (en) * 2016-03-31 2017-10-05 Agilent Technologies, Inc. Use of transposase and y adapters to fragment and tag dna
GB201609221D0 (en) * 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
EP3507365A4 (en) * 2016-08-30 2020-05-06 Metabiotech Corporation METHOD AND COMPOSITIONS FOR PHASE CONTROLLED SEQUENCING
ES2929281T3 (es) * 2017-03-23 2022-11-28 Univ Washington Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores
AU2018259202B2 (en) 2017-04-23 2022-03-24 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
WO2018197950A1 (en) 2017-04-23 2018-11-01 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
DK3872187T3 (da) 2017-04-23 2022-12-05 Illumina Cambridge Ltd Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker
US11028435B2 (en) 2017-05-01 2021-06-08 Illumina, Inc. Optimal index sequences for multiplex massively parallel sequencing

Also Published As

Publication number Publication date
AU2021339945A1 (en) 2023-03-02
WO2022053610A1 (en) 2022-03-17
JP2023540177A (ja) 2023-09-22
EP4211261A1 (en) 2023-07-19
CA3188197A1 (en) 2022-03-17
MX2023001400A (es) 2023-04-25
US20230416803A1 (en) 2023-12-28
IL300983A (en) 2023-04-01
CN116323970A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US20230137106A1 (en) Methods and compositions for paired end sequencing using a single surface primer
CN112689673A (zh) 转座体使能的dna/rna测序(ted rna-seq)
US8795968B2 (en) Method to produce DNA of defined length and sequence and DNA probes produced thereby
KR20230091116A (ko) 다수의 삽입체를 포함하는 시퀀싱 주형, 및 시퀀싱 처리량을 개선하기 위한 조성물 및 방법
US20160348152A1 (en) Compositions and Methods for Preparing Sequencing Libraries
WO2018227025A1 (en) Creation and use of guide nucleic acids
US11667953B2 (en) Methods and compositions for cluster generation by bridge amplification
CA3101648A1 (en) Compositions and methods for making guide nucleic acids
CN113366115A (zh) 高覆盖率stlfr
KR20230051508A (ko) 핵산의 서열-특이적 표적화된 전위 및 선택과 분류
CN112654715A (zh) 改进多核苷酸簇克隆性优先性的方法
KR20230069135A (ko) 헤어핀 어댑터를 사용하여 시퀀싱 라이브러리에서 표적 서열을 농축시키는 방법
WO2022251510A2 (en) Oligo-modified nucleotide analogues for nucleic acid preparation