KR20210114918A - 복합체 표면-결합 트랜스포좀 복합체 - Google Patents

복합체 표면-결합 트랜스포좀 복합체 Download PDF

Info

Publication number
KR20210114918A
KR20210114918A KR1020217009366A KR20217009366A KR20210114918A KR 20210114918 A KR20210114918 A KR 20210114918A KR 1020217009366 A KR1020217009366 A KR 1020217009366A KR 20217009366 A KR20217009366 A KR 20217009366A KR 20210114918 A KR20210114918 A KR 20210114918A
Authority
KR
South Korea
Prior art keywords
sequence
complex
transposon
transposomal
solid support
Prior art date
Application number
KR1020217009366A
Other languages
English (en)
Inventor
앤드류 슬래터
브라운 에스더 머스그레이브
수잔 씨 베리티
나일 곰리
Original Assignee
일루미나 케임브리지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나 케임브리지 리미티드 filed Critical 일루미나 케임브리지 리미티드
Publication of KR20210114918A publication Critical patent/KR20210114918A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/507Recombinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 PCR 증폭을 이용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하기 위한 방법, 조성물, 및 키트에 관한 것이며, 이는 고체 지지체 상에 고정된 트랜스포좀 복합체를 사용하여 핵산(예를 들어, DNA)을 단편화 및 태깅하기 위한 방법 및 조성물을 포함한다.

Description

복합체 표면-결합 트랜스포좀 복합체
임의의 우선권 출원에 대한 참조에 의한 원용
본 출원은 2019년 1월 11일자로 출원된 미국 가특허 출원 제62/791,509호, 및 2019년 4월 30일자로 출원된 미국 가특허 출원 제62/840,610호에 대한 우선권의 이익을 주장하며, 이들은 전체적으로 본 명세서에 참조에 의해 원용된다.
기술분야
본 발명은 PCR 증폭을 이용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하기 위한 방법, 조성물, 및 키트에 관한 것이며, 이는 고체 지지체 상에 고정된 트랜스포좀 복합체를 사용하여 핵산(예를 들어, DNA)을 단편화 및 태깅하기 위한 방법 및 조성물을 포함한다.
핵산 샘플의 차세대 서열분석(next-generation sequencing: NGS)을 위한 현재의 프로토콜은 DNA 또는 RNA를 서열분석될 수 있는 단편화된 주형의 라이브러리로 전환하는 샘플 제조 과정을 일상적으로 채용한다. 샘플 제조 방법은 흔히 다수의 단계 및 재료 전달 그리고 단편화를 달성하기 위한 고가의 기기를 필요로 하며, 이는 이러한 방법을 어렵고, 지루하고, 비용이 많이 들고, 비효율적이게 만들 수 있다. 또한, 프라이머를 사용한 증폭은 라이브러리 콘텐츠 및 그에 따라 생성된 서열분석 데이터에 편향(bias)을 도입한다. 예를 들어, PCR 증폭 단계는 GC 풍부 영역을 효율적으로 복사하기 위한 폴리머라제의 불능으로 인해 GC 풍부 영역에서 악화되는 갭을 생성할 수 있다. 이들 갭은 라이브러리로부터 생성된 서열분석 데이터에서 편향을 생성한다. PCR 증폭 단계를 갖는 라이브러리 제조 공정은 상당히 감소된 삽입 및 결실(인델(indel)) 호출 성능을 가질 수 있다. 다수의 확장된 반복을 갖는 일부 영역은 정확하게 서열분석하기가 어려울 수 있고, GC-풍부 프로모터를 갖는 DNA는 게놈 내에서 낮은 커버리지를 나타낼 수 있다. 더욱이, 다수의 라이브러리 제조 방법이 샘플 인덱스의 포함과 호환되지 않거나, 그러한 인덱스를 도입하기 위해 다수의 추가 단계를 필요로 한다.
짧고, 효율적이며, 정확한 라이브러리 제조 절차가 필요하다. 이들 문제를 다루고 단일 및 이중 인덱싱 접근법을 수용하는 다양한 방법, 조성물 및 키트가 본 명세서에 기술되어 있다.
본 발명은 단편 태그, 예를 들어, 프라이머 서열 및/또는 인덱스 서열을 포함시키기 위해 PCR 증폭을 이용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하기 위한 방법, 조성물, 및 키트에 관한 것이며, 이는 고체 지지체 상에 고정된 트랜스포좀 복합체를 사용하여 핵산(예를 들어, DNA)을 단편화 및 태깅하기 위한 방법 및 조성물을 포함한다.
본 명세서에 제공된 일부 실시 형태는 부착 폴리뉴클레오타이드를 포함하는 트랜스포좀 복합체에 관한 것이다. 일부 태양에서, 본 발명은: (a) 트랜스포사제; (b) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; (c) 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존 - 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열의 적어도 일부분에 상보적임 -; 및 (d) 부착 폴리뉴클레오타이드를 포함하고, 부착 폴리뉴클레오타이드는 (i) 2개의 어댑터 서열들 중 하나에 혼성화된 부착 어댑터 서열 및 (ii) 결합 요소를 포함하는, 트랜스포좀 복합체에 관한 것이다. 전형적으로, 트랜스포존 말단 서열들은 함께 어닐링되어, 트랜스포사제에 의해 인식되는 이중-가닥 트랜스포존 말단 서열을 형성한다. 일부 태양에서, 결합 요소는 고체 지지체에 고정되어 고정된 트랜스포좀 복합체를 제공한다.
일부 태양에서, 본 발명은 제1 트랜스포존, 제2 트랜스포존, 및 부착 폴리뉴클레오타이드를 포함하는 어닐링된 트랜스포존/부착 폴리뉴클레오타이드 하이브리드에 관한 것이다.
일부 태양에서, 본 발명은 제1 트랜스포존, 제2 트랜스포존, 및 부착 폴리뉴클레오타이드를 어닐링하는 단계를 포함하는 트랜스포좀 복합체를 포함하는 어닐링된 트랜스포존/부착 폴리뉴클레오타이드 하이브리드의 제조 방법에 관한 것이다. 일부 태양에서, 본 발명은 어닐링된 트랜스포존/부착 폴리뉴클레오타이드 하이브리드를 트랜스포사제로 처리하는 단계를 포함하는 트랜스포좀 복합체의 제조 방법에 관한 것이다. 일부 태양에서, 본 방법은 결합 요소를 통해 고체 지지체에 트랜스포좀 복합체를 고정함으로써 고정된 트랜스포좀 복합체를 제조하는 방법을 제공한다.
일부 태양에서, 본 발명은: (a) 트랜스포사제; (b) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; (c) 3' 트랜스포존 말단 서열의 적어도 일부분에 상보적인 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존; 및 (d) 절단가능한 링커를 통해 5' 어댑터 서열에 부착된 결합 요소를 포함하는, 트랜스포좀 복합체에 관한 것이다. 일부 태양에서, 결합 요소는 고체 지지체에 고정되어 고정된 트랜스포좀 복합체를 제공한다. 일부 태양에서, 본 발명은 제1 트랜스포존, 제2 트랜스포존, 및 결합 요소를 포함하는 어닐링된 올리고뉴클레오타이드 구조물에 관한 것이다.
일부 태양에서, 본 발명은 표적 핵산을 복수의 표적 단편으로 단편화하고 3' 트랜스포존 말단 서열의 3' 말단을 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 표적 핵산을 본 명세서에 기재된 바와 같은 복수의 고정된 트랜스포좀 복합체와 접촉시키는 단계를 포함하는, 태깅된 핵산 단편의 라이브러리를 생성하는 방법에 관한 것이다.
본 명세서에 제공된 일부 실시 형태는 PCR 증폭을 사용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하기 위한 키트에 관한 것이다. 일부 실시 형태에서, 키트는 본 명세서에 기재된 바와 같은 고정된 트랜스포좀 복합체를 포함한다.
일부 태양에서, 본 발명은 태깅된 핵산 단편의 라이브러리를 생성하는 방법에 관한 것이며, 이 방법은 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 표적 핵산을 고정된 트랜스포좀 복합체와 접촉시키는 단계; 미결합 핵산을 제거하도록 고체 지지체를 처리하는 단계; 또는 선택적으로 (a) 고체 지지체를 가열하고/하거나 (b) 고체 지지체를 효소 변성제로 세척함으로써, 복합체로부터 트랜스포사제를 제거하도록 고체 지지체를 처리하는 단계 - 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함함 -; 5' 태깅된 표적 단편을 연장 및 라이게이션하여 완전 이중-가닥 태깅된 단편을 생성하도록 복수의 5' 태깅된 표적 단편을 폴리머라제 및 리가제로 처리하는 단계 - 선택적으로 폴리머라제 및 리가제로 처리하는 단계는 DNA 2차 구조 파괴물질(disruptor)의 존재 하에 수행되며, 파괴물질은 선택적으로 DMSO임 -; 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 제거하는 단계 - 선택적으로 제거하는 단계는 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 절단하기에 충분한 열 및/또는 변성제를 적용하는 것을 포함하며, 선택적으로 변성제는 NaOH임 -; 및 포획 비드를 사용하여 완전 이중-가닥 태깅된 단편을 선택하는 단계 - 선택적으로 포획 비드는 자성 비드이고, 추가로 선택적으로 2개의 별개의 선택 단계가 수행됨 - 를 포함한다.
일부 실시 형태에서, 고정된 트랜스포좀 복합체는 고체 지지체; 및 고체 지지체에 고정된 트랜스포좀 복합체를 포함하며, 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포존 말단 서열 및 앵커 서열(앵커)을 포함하는 제1 트랜스포존; 5' 트랜스포존 말단 서열 및 B15' 서열을 포함하는 제2 트랜스포존; 및 앵커 서열 상보체(앵커'), A14' 서열, 스페이서, 및 P5' 서열 그리고 비오틴을 포함하는 결합 요소를 포함하는 부착 폴리뉴클레오타이드를 포함하며, 비오틴은 고체 지지체에 고정된다. 일부 실시 형태에서, 방법은 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함한다.
일부 실시 형태에서, 방법은 표적 핵산을 복수의 표적 단편으로 단편화하고, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 결합시켜 제1 고정된 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태깅된 표적 단편 및 제2 고정된 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 제1 고정된 트랜스포좀 복합체 및 제2 고정된 트랜스포좀 복합체를 표적 핵산과 접촉시키는 단계를 포함한다. 일부 실시 형태에서, 제1 고정된 트랜스포좀 복합체는 고체 지지체 및 고체 지지체에 고정된 제1 트랜스포좀 복합체를 포함하며, 제1 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포존 말단 서열 및 앵커 서열을 포함하는 제1 트랜스포존; 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존; 및 (i) 앵커 서열 상보체, A14' 서열, 스페이서 및 P5' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 제1 부착 폴리뉴클레오타이드를 포함하며, 비오틴은 고체 지지체에 고정된다. 일부 실시 형태에서, 제2 고정된 트랜스포좀 복합체는 고체 지지체 및 고체 지지체에 고정된 제2 트랜스포좀 복합체를 포함하며, 제2 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포존 말단 서열 및 앵커 서열을 포함하는 제1 트랜스포존; 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존; 및 (i) 앵커 서열 상보체, B15' 서열, 스페이서 및 P7' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 제2 부착 폴리뉴클레오타이드를 포함하며, 비오틴은 고체 지지체에 고정된다. 일부 실시 형태에서, 본 방법은, 인덱싱 올리고뉴클레오타이드에 라이게이션된 복수의 5' 태깅된 표적 단편을 생성하도록, 5' 태깅된 표적 단편을 제1 및 제2 인덱싱 올리고뉴클레오타이드의 풀(pool)과 접촉시킴으로써 각각의 5' 태깅된 표적 단편을 제1 인덱싱 올리고뉴클레오타이드 또는 제2 인덱싱 올리고뉴클레오타이드 중 어느 하나에 라이게이션시키도록 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 단계 - 각각의 제1 인덱싱 올리고뉴클레오타이드는 A14 서열, i5 서열, 및 P5 서열을 포함하며 제1 5' 태깅된 표적 단편과 결합할 수 있고, 각각의 제2 인덱싱 올리고뉴클레오타이드는 B15 서열, i7 서열, 및 P7 서열을 포함하며 제2 5' 태깅된 표적 단편과 결합할 수 있음 -; 선택적으로 (a) 고체 지지체를 가열하고/하거나 (b) 고체 지지체를 효소 변성제로 세척함으로써, 복합체로부터 트랜스포사제를 제거하도록 고체 지지체를 처리하는 단계 - 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함함 -; 및 인덱싱 올리고뉴클레오타이드에 라이게이션된 복수의 5' 태깅된 표적 단편을 폴리머라제로 처리하여 완전 이중-가닥 태깅된 단편을 연장 및 생성하는 단계를 포함한다. 일부 실시 형태에서, 제1 고정된 트랜스포좀 복합체 및 제2 고정된 트랜스포좀 복합체를 접촉시키는 단계 및 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 단계는 단일 반응에서 수행된다. 일부 실시 형태에서, 이중-가닥 태깅된 단편은 용액 중에서 생성된다.
도 1은 PCR 증폭을 이용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하는 방법의 일 실시 형태를 도시한 흐름도이다. 제1 단계에서, 고체 지지체 상에 고정된, 본 명세서에 기재된 바와 같은 트랜스포좀 복합체가 제공된다. 표적 핵산은 고체 지지체에 적용되고, 태그멘테이션(tagmentation) 반응이 일어나서, 태깅되고 단편화된 핵산이 생성된다. 인덱스 서열을 갖는 인덱스 혼합물이 적용되고, 연장 및 라이게이션이 일어난다. 마지막으로, 태깅된 핵산 단편의 인덱싱이 일어난다. 일부 실시 형태에서, 인덱싱은 연장 및 라이게이션과 동시에 일어나며, 다른 실시 형태에서, 인덱싱은 연장 및 라이게이션 후에 일어난다. 다른 실시 형태에서, 단계들의 배열은 실시예 9에 도시된 것과 같이 상이하다.
도 2a 및 도 2b는 PCR 증폭을 사용하지 않고서 태깅된 핵산 단편의 라이브러리를 제조하는 개략도 및 방법을 도시한다. 도 2a는 절단가능한 링커를 통해 하나의 트랜스포존에 부착된 비오틴(B)을 갖는 트랜스포좀 복합체의 예시적인 구성이다. 이러한 예시적인 실시 형태에서, 트랜스포좀 복합체는 트랜스포사제, 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 3' 트랜스포존 말단 서열의 적어도 일부분에 상보적인 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존; 및 절단가능한 링커를 통해 5' 어댑터 서열에 부착된 결합 요소를 포함한다(도 2a). 도 2b는 고체 지지체(고체 지지체는 도시되지 않음)에 고정된 도 2a의 예시적인 트랜스포좀 복합체를 사용하여, PCR 증폭을 사용하지 않고서 태깅된 핵산 단편의 라이브러리를 제조하는 방법의 예시적인 단계들을 개략적으로 도시하며, 이는 태그멘테이션 및 세척 단계, 연장 및 라이게이션 단계 및 비드 제거 단계를 포함한다. 도 2b는 표적 핵산으로부터의 삽입체가 태그에 덧붙여지는 태그멘테이션 단계, 연장 및 라이게이션 단계, 및 고체 지지체로부터의 절단 단계를 나타낸다.
도 3a 내지 도 3c는 PCR 증폭을 사용하지 않고서 태깅된 핵산 단편들의 라이브러리를 생성하는 방법의 예시적인 단계들을 도시한다. 도 3a는 비오틴(B, 고체 지지체는 도시되지 않음)을 보유하는 부착 폴리뉴클레오타이드를 통해 고체 지지체에 고정된 트랜스포좀 복합체를 도시한다. 단순화를 위해, 도 3a에는 이량체가 도시되어 있지만, 도 3b 내지 도 3c에는 도시되어 있지 않다. 도 3b는 트랜스포사제에 여전히 복합체화되어 있는 태그되고 단편화된 핵산(상부 패널) 및 트랜스포사제의 제거 후 구조(하부 패널)를 도시한다. 도 3b는 제1 트랜스포존에 결합된 핵산 단편(삽입체)을 갖는 트랜스포좀 복합체를 도시하며, 삽입체의 5' 말단은 3' 트랜스포존 말단 서열에 부착된다. 트랜스포사제는 예를 들어, 소듐 도데실 설페이트(SDS)와 같은, 트랜스포사제를 제거하기 위한 제제를 사용하여 본 명세서에 기재된 방법을 사용하여 제거된다. 도 3c는 갭 충전 및 연장(연장 및 라이게이션)후의 구조(상부 패널), 및 생성된 단편을 고체 지지체로부터 제거하기 위한 탈혼성화 후의 구조(하부 패널)를 도시한다. 도 3c에 도시된 바와 같이, 인덱스는 고체 지지체에 첨가되고, 제2 트랜스포존의 부착 폴리뉴클레오타이드에 혼성화된다. 구체적으로, 도 3c의 실시 형태에 나타나 있는 바와 같이, 프라이머 서열(P5 서열), 인덱스 서열(i5 서열), 및 앵커 서열을 갖는 i5 인덱스는, P5가 P5'에 혼성화되고 앵커가 앵커'에 혼성화되도록, 상보적 서열에서 부착 폴리뉴클레오타이드에 혼성화된다. 유사하게, 도 3c의 실시 형태에서, 프라이머 서열(P7), 인덱스 서열(i7), 및 어댑터 서열(B15 서열)을 갖는 i7 인덱스는, P7이 P7'에 혼성화되고, i7이 i7'에 혼성화되고, B15가 B15'에 혼성화되도록, 상보적 서열에서 제2 트랜스포존에 혼성화된다. 고체 지지체를 인덱스와 접촉시킨 후, 단편은 연장 및 라이게이션 믹스(extension and ligation mix, ELM)를 사용하여 연장 및 라이게이션된다. 이어서, 고체 지지체를 NaOH와 같은, 가닥 서열을 변성시키기 위한 제제로 처리하여, 태깅된 핵산 단편을 생성한다. 제1 및 제2 트랜스포존을 갖는 Tn5 트랜스포사제를 갖는, 트랜스포좀 복합체의 실시 형태가 도시된다. 제1 트랜스포존은 제2 트랜스포존의 5' 트랜스포존 말단 서열(ME' 서열)에 혼성화된 3' 트랜스포존 말단 서열(ME 서열)을 포함한다. 제2 트랜스포존은 또한 3' 어댑터 서열(B15' 서열)을 포함한다. 제1 트랜스포존은 부착 폴리뉴클레오타이드의 부착 어댑터 서열(A14' 서열)에 혼성화된 것으로 표시되는 5' 어댑터 서열(A14 서열)을 포함한다. 부착 폴리뉴클레오타이드는 또한 앵커 서열(앵커'), 스페이서 영역, 프라이머 서열(P5' 서열), 및 결합 요소(B)에 부착된 링커를 포함한다. 트랜스포좀 복합체는 이량체화된 2개의 트랜스포좀 단량체를 갖는 이량체이다.
도 4a 내지 도 4e는 PCR 증폭을 이용하지 않고서 트랜스포좀 복합체의 변형을 사용하여, 태깅된 핵산 단편의 라이브러리를 생성하는 방법의 실시 형태에 대해, 각각 단일 인덱싱 및 이중 인덱싱 모드 둘 모두로 도시된, 인덱싱된 비드 및 유니버설 비드를 포함하는, 예시적인 비오틴(B, 고체 지지체는 도시되지 않음)을 통해 고체 지지체에 고정된 트랜스포좀 복합체의 다양한 구성들을 비교하는 개략도를 도시하며, 여기서, 트랜스포존 및/또는 부착 폴리뉴클레오타이드의 구성요소는 서로 비교하여 변경, 배열, 또는 변화된다. 도 4a는 고체 지지체에 부착된 트랜스포좀 복합체의 다양한 구성을 도시한다. 도 4a는 제1 및 제2 트랜스포존을 갖는 트랜스포사제를 나타내고 부착 폴리뉴클레오타이드를 통해 고체 지지체에 부착된, 트랜스포좀 복합체의 실시형태를 도시한다. 도 4b는 태그멘테이션 후의 다양한 구성을 도시한다. 도 4b는 단일 또는 이중 인덱싱을 갖는, 인덱싱된 비드 또는 유니버설 비드에 대한 태그멘테이션 반응을 도시하며, 여기서 고체 지지체는 제1 트랜스포존의 3' 트랜스포존 말단에 결합하는 핵산 단편(삽입체)과 접촉한다. 도 4c는 연장 및 라이게이션 후의 다양한 구성들을 도시한다. 도 4c는 단일 또는 이중 인덱싱을 갖는, 인덱싱된 또는 유니버설 비드에 대한 연장 및 라이게이션을 도시하며, 여기서 고체 지지체는 트랜스포존 또는 부착 폴리뉴클레오타이드에 혼성화되는 인덱스 믹스와 접촉하고, 핵산 단편은 연장된다. 도 4d는 인덱싱 후의 다양한 구성을 도시한다(인덱싱이 도 4c의 이러한 구성에 대해 완료되었기 때문에, 단일 인덱싱을 위한 인덱싱된 비드는 도시되지 않음). 도 4d는 이중 인덱싱을 갖는 인덱싱된 비드 또는 단일 또는 이중 인덱싱을 갖는 유니버설 비드에 대한 인덱싱을 도시한다. 도 4d에 도시된 바와 같이, 단일 인덱싱을 갖는 인덱싱된 비드가 도 4c의 연장-라이게이션 단계에서 완성되었다. 고체 지지체는 인덱싱 믹스와 접촉되고, 핵산 단편은 인덱싱을 위해 태깅된다. 도 4e는 삽입체 크기의 함수로서 정규화된 리드 빈도(read frequency)를 보여주는, 다양한 구성의 예시적인 결과를 도시한다. 도 4e는 단일 또는 이중 인덱싱을 갖는, 인덱싱된 비드 또는 유니버설 비드로부터의 태깅된 핵산 단편의 정규화된 리드 빈도를 도시한다. 특히 도 4a 내지 도 4e는 단일 인덱싱을 위한 인덱싱된 비드(상부 좌측), 단일 인덱싱을 위한 유니버설 비드(상부 우측), 이중 인덱싱을 위한 인덱싱된 비드(하부 좌측), 및 이중 인덱싱을 위한 유니버설 비드로서 배열된 트랜스포좀 복합체의 실시 형태를 도시한다. 도 4a 내지 도 4e에 도시된 인덱싱된 비드의 실시 형태의 경우, 단일 및 이중 인덱싱 둘 모두(좌측)에 대해, 부착 폴리뉴클레오타이드는 3' 어댑터 서열(B15' 서열)에서 제2 트랜스포존에 혼성화된다. 도 4a 내지 도 4e에 도시된 유니버설 비드의 실시 형태의 경우, 단일 및 이중 인덱싱 둘 모두(우측)에 대해, 부착 폴리뉴클레오타이드는 5' 어댑터 서열(A14 서열)에서 제1 트랜스포존에 혼성화된다. 일부 실시 형태에서, 정규화된 라이브러리는 원시 샘플로부터 제조될 수 있으므로, 핵산이 원시 샘플로부터 추출되고 본 명세서에 기재된 시스템 또는 방법으로 직접 입력되며, 여기서 자기-정규화된(self-normalized) 샘플은 다양한 샘플 유형에 걸쳐 타이트한 CV를 제공한다.
도 5a 및 도 5b는 P7 서열-포함 트랜스포존(도 5a) 또는 P5 서열-포함 트랜스포존(도 5b) 중 어느 하나에 혼성화된 부착 폴리뉴클레오타이드를 나타내는, 비-인덱싱을 위한 예시적인 트랜스포좀 복합체의 개략도를 도시한다. 구체적으로, 도 5a 및 도 5b는 제1 트랜스포존 상의 5' 어댑터 서열(A14 서열)에 결합된 프라이머 서열(P5 서열), 및 제2 트랜스포존 상의 3' 어댑터 서열(B15' 서열)에 결합된 프라이머 서열(P7' 서열)을 도시하여, 비-인덱싱 트랜스포좀 복합체를 제공한다. 부착 폴리뉴클레오타이드는 5'결합 요소(B)를 사용하여 제2 트랜스포존에 혼성화될 수 있거나 (도 5a), 또는 3' 결합 요소(B)를 사용하여 제1 트랜스포존에 혼성화될 수 있다(도 5b).
도 6a 내지 도 6d는 i5 인덱싱 서열을 포함하는 예시적인 트랜스포좀 복합체의 개략도를 도시한다. 도 6a는 나이트로 서열 및 앵커 서열을 포함하는 부착 폴리뉴클레오타이드가 인덱싱 올리고뉴클레오타이드에 혼성화될 수 있는 복합체를 도시하는데, 인덱싱 올리고뉴클레오타이드는 이어서 제1 트랜스포존의 5' 말단에 라이게이션될 수 있다. 도 6a에서, 트랜스포좀 복합체는 3 '트랜스포존 말단 서열(ME) 및 5' 어댑터 서열(A14)을 포함하는 제1 트랜스포존, 5' 트랜스포존 말단 서열(ME') 및 3' 어댑터 서열(B15')을 포함하는 제2 트랜스포존, 및 제1 트랜스포존에서 A14에 혼성화된 부착 어댑터 서열(A14'), 및 결합 요소(비오틴)를 포함하는 부착 폴리뉴클레오타이드를 포함한다. 이러한 경우에, 부착 폴리뉴클레오타이드는 나이트로인돌 서열(임의의 i5 인덱스 영역에 결합하는 유니버설 서열) 및 프라이머 서열(P5')을 추가로 포함한다. 제2 트랜스포존의 B15'영역은 상보체(B15), 인덱스 영역, 및 그 자체로 P7' -i7' 인덱스 분자로 어닐링되는 P7 프라이머 서열을 포함하는 폴리뉴클레오타이드에 혼성화될 수 있다. 3' 어댑터 서열의 3' 말단에 대한 i7' 인덱스 영역의 5' 말단의 라이게이션은 완전 이중-가닥 영역을 생성하는 역할을 한다.
도 6b는 인덱싱 올리고뉴클레오타이드에 혼성화될 수 있는, 앵커 서열 및 스페이서 영역을 포함하는 부착 폴리뉴클레오타이드를 도시하는데, 인덱싱 올리고뉴클레오타이드는 이어서 제1 트랜스포존의 5' 말단에 라이게이션될 수 있다. 도 6b에서, 제1 트랜스포존은 3' 트랜스포존 말단 서열(ME) 및 5' 어댑터 서열(A14)을 포함하고, 제2 트랜스포존은 도 6a에서와 같이 5' 트랜스포존 말단 서열(ME') 및 3' 어댑터 서열(B15')을 포함한다. 그러나, 이러한 경우에, 부착 폴리뉴클레오타이드는 어댑터 상보체(A14'), 앵커' 서열, 2 × sp 18 스페이서 영역, 프라이머 상보체(P5'), 및 비오틴 결합 요소를 포함한다. i5 인덱스는 (앵커'에 상보적인) 앵커 서열, i5 인덱스 영역, 및 프라이머 서열(P5)을 포함한다. i5 인덱스는 스페이서를 가로질러 부착 폴리뉴클레오타이드 상의 상보성 앵커 및 프라이머 서열에 혼성화된다.
도 6c는 인덱싱 올리고뉴클레오타이드에 혼성화될 수 있는, 스페이서 및 A14' 서열을 포함하는 부착 폴리뉴클레오타이드를 도시하는데, 인덱싱 올리고뉴클레오타이드는 이어서 제1 트랜스포존의 5' 말단에서 서열 X로 라이게이션될 수 있다. 도 6c에서, 제1 트랜스포존은 3' 트랜스포존 말단 서열(ME) 및 5' 어댑터 서열 X를 포함하고, 제2 트랜스포존은 5' 트랜스포존 말단 서열(ME') 및 3' 어댑터 서열(B15')을 포함한다. 부착 폴리뉴클레오타이드는 5' 어댑터 서열에 대한 상보체(X'), 제2 어댑터 서열(A14'), 스페이서 영역(2 × sp18), 프라이머 상보체(P5'), 및 비오틴 결합 요소를 포함한다. 5' 어댑터 서열(X')은 제1 트랜스포존 5' 어댑터 서열(X)에 혼성화된다. i5 인덱스는 제2 어댑터 서열에 대한 상보체(A14), 2 × sp18 스페이서 영역, 및 프라이머 서열(P5)을 포함한다. i5 인덱스는 스페이서 영역을 가로질러 부착 폴리뉴클레오타이드 상의 제2 어댑터 서열 및 프라이머 상보체에 혼성화되고, 제2 어댑터 서열에 대한 상보체의 3' 말단은 서열 X로 라이게이션된다. 또한, 5' 프라이머 서열(P7), i7 인덱스 영역, 및 3' 어댑터 서열에 대한 상보체(B15)를 포함하는 i7 인덱스가 어닐링되고, 3' 어댑터 서열의 3' 말단은 연장되어 이중-가닥 영역을 생성한다.
도 6d는 인덱싱 올리고뉴클레오타이드에 혼성화될 수 있는, 스페이서 및 A14' 서열을 포함하는 부착 폴리뉴클레오타이드를 도시하는데, 인덱싱 올리고뉴클레오타이드는 이어서 제1 트랜스포존의 5' 말단에서 서열 X로 라이게이션될 수 있다. 이러한 경우에, 인덱싱 올리고뉴클레오타이드는 이중-가닥 프라이머 영역을 포함한다. 도 6d에서, 제1 트랜스포존, 제2 트랜스포존, 및 부착 폴리뉴클레오타이드는 도 6c에서와 같다. i7 인덱스는 이중-가닥 프라이머(P7/P7'), i7 인덱스 영역, 및 3' 어댑터 서열에 대한 상보체(B15)를 포함한다. i7 인덱스 내의 이중-가닥 영역은 연장 라이게이션 반응 동안 생성(어닐링)될 수 있으며, 예를 들어, 반응 자체 전에 i7 인덱스가 어닐링될 필요는 없다. P7' 올리고가 반응 혼합물에 포함될 수 있다. i7 인덱스는 B15 영역을 통해 어닐링되고, 제2 트랜스포존으로부터의 연장 및 라이게이션은 이중-가닥 영역을 생성한다. 이 방법의 일례가 실시예 5에 기술되어 있다.
도 7a 및 도 7b는 개선된 인델 정밀도 및 리콜(recall)(도 7a) 및 GC 풍부 프로모터에서의 커버리지의 개선(도 7b)에 대한 결과를 포함하는, PCR 증폭을 이용하여 그리고 이용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성하는 방법을 수행한 예시적인 결과를 도시한다. 이들 데이터를 생성하기 위해 4가지 방법이 사용되었으며, 2가지는 PCR(TruSeq™ 나노(TruSeq™ Nano) 및 넥스테라™ DNA 플렉스(Nextera™ DNA Flex))을 사용하고 2가지는 PCR-프리(본 발명의 방법 및 TruSeq™ PCR-프리(TruSeq™ PCR-Free))였다. 방법당 2개의 복제물이 있었으며, 총 8개의 라이브러리가 생성되었다. 데이터를 서열분석 후 25X로 다운-샘플링하였다. 도 7a는 본 명세서에 기재된 PCR-프리 방법에 대한 높은 백분율의 인델 정밀도 및 리콜을 나타낸다. 좌측으로부터 우측으로, 샘플은 (2회 반복): TruSeq™ 나노(흑색); 넥스테라™ DNA 플렉스(백색); 본 명세서에 기재된 본 발명의 PCR-프리 방법(줄무늬); 및 TruSeq™ PCR-프리(체크무늬)를 포함한다. 도 7b는 다른 방법과 비교하여 본 명세서에 기재된 본 발명의 PCR-프리 방법에 대한 GC 풍부 프로모터에서의 커버리지의 개선을 나타내며, 넥스테라™ DNA 플렉스(상부 좌측); TruSeq™ 나노(상부 우측); 본 명세서에 기재된 본 발명의 PCR-프리 방법(하부 좌측); 및 TruSeqTM PCR-프리(하부 우측)를 포함한다.
도 8은 실시예 3에 기술된 바와 같은 본 명세서에 기재된 방법(4회 반복, 샘플 1 내지 4)과 비교하여, 넥스테라™ DNA 플렉스 또는 TruSeq™ DNA PCR-프리 라이브러리 제조 키트(Library Prep Kit)를 사용하여 제조된 공지된 100% GC 반복 확장(FMR1)을 함유하는 샘플로부터의 라이브러리를 서열분석한 결과를 도시한다.
도 9a 내지 도 9c는 실시예 5에 기술된 바와 같이, 도 6c(도 9a의 데이터) 및 도 6d(도 9b 및 도 9c의 2가지 반응 조건에 대한 데이터)의 시스템과 함께 8개의 인덱스 쌍을 사용하여 제조된 라이브러리에 대한 %CV 결과를 도시한다.
도 10은 PCR 라이브러리 제조 방법(넥스테라 플렉스 또는 튜브-기반 넥스테라)에 대해서는 유전자 RNPEPL1의 영역 내에 갭이 있지만, 본 명세서에 기재된 PCR-프리 방법(2개의 하부 패널)을 사용하면 갭이 적음을 나타내는 서열분석 커버리지의 도해적인 표현을 도시한다.
단편화된 핵산의 라이브러리는 종종 차세대 서열분석(NGS) 어플리케이션에 사용하기 위한 게놈 핵산으로부터 생성된다. 본 발명은 증폭에 의해 서열을 추가하기 위해 PCR을 사용하지 않고서 인덱스를 포함하는, 서열분석 작업을 수행하는 데 필요한 서열을 부가하는 단편화된 핵산의 라이브러리를 생성하기 위한 방법, 조성물 및 키트를 제공한다(본 명세서에서 PCR-프리 라이브러리 생성 또는 PCR-프리 라이브러리 제조로도 지칭됨). 이러한 PCR-프리 트랜스포좀 라이브러리 제조 방법은 라이브러리 제조를 위한 현재의 태그멘테이션 접근법에서 PCR에 의해 야기되는 편향을 감소 및/또는 제거할 수 있다.
태그멘테이션은 단편 및 태그 핵산에 대한 트랜스포사제의 사용을 지칭한다. 태그멘테이션은 트랜스포존 말단 서열을 포함하는 어댑터(본 명세서에서 트랜스포존으로 지칭됨)와 복합체화된 트랜스포사제 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 포함한다. 태그멘테이션은 동시적인 DNA 단편화 및 듀플렉스 단편의 양쪽 가닥의 5' 말단에 대한 어댑터의 라이게이션을 초래한다. 대체적으로, 트랜스포사제 효소를 제거하기 위한 정제 단계 후에, 조정된 단편의 말단에 PCR에 의해 추가 서열이 추가된다.
본 명세서에 기재된 방법, 조성물, 시스템, 및 키트는 복합체 혼성화된 올리고뉴클레오타이드, 및 표면 상에 고정된 복합체를 비롯한, 이들 하이브리드를 포함하는 트랜스포좀 복합체, 및 PCR-프리 라이브러리 생성을 위한 트랜스포좀 복합체의 용도에 관한 것이다. 본 명세서에 기재된 바와 같이, 트랜스포좀 복합체는 표적 DNA 분자를 단편화하고 태깅하는 트랜스포사제와 관련 트랜스포존을 포함한다. 일부 태양에서, 복합체 혼성화된 올리고뉴클레오타이드는 절단가능하며 결합 요소를 포함하고, 다른 태양에서, 복합체 혼성화된 올리고뉴클레오타이드는 결합 요소를 갖는 부착 폴리뉴클레오타이드를 포함한다. 일부 태양에서, 부착 폴리뉴클레오타이드는, 트랜스포좀 복합체에서 트랜스포존에 혼성화되고 슬라이드, 플로우 셀 또는 비드와 같은 고체 지지체 상에 고정된 핵산 서열이다. 트랜스포존에 대한 부착 폴리뉴클레오타이드의 혼성화에 의해, 트랜스포좀 복합체는 부착 폴리뉴클레오타이드를 통해 간접적으로 고체 지지체 상에 고정될 수 있다. 고체 지지체에 대한 부착 폴리뉴클레오타이드의 결합은 부착 폴리뉴클레오타이드 상의 결합 요소를 통해 일어난다. 표적 핵산은 트랜스포좀 복합체에 의해 포획되고, 이어서 핵산은 단편화되고 태깅된다("태그멘테이션"). 올리고뉴클레오타이드 시스템은 PCR 증폭 없이 태그멘테이션, 연장 및/또는 라이게이션 단계를 통한 인덱싱 및 서열분석에 필요한 임의의 태그를 포함할 수 있도록 설계된다. 따라서, 일부 태양에서, PCR 증폭을 이용하지 않고서 핵산 단편의 라이브러리를 생성하기 위해, 태깅된 단편은 증폭 없이 연장되고 라이게이션되고 인덱싱될 수 있다.
용액-기반 태그멘테이션은 결점을 가지며 몇몇 노동-집약적 단계를 필요로 한다. 추가적으로, 태그 서열들을 도입하는 데 사용되는 PCR 증폭 단계들 동안 편향이 도입될 수 있다. 예를 들어, 감소된 인델은 폴리머라제 미끄러짐(slippage)으로 인한 PCR의 결과일 수 있다. 또한, PCR 폴리머라제는 일부 영역, 예를 들어 높은 GC 영역 또는 AT 또는 다른 서열 반복 영역에서 어려움을 가지며, 이는 게놈에서의 갭 또는 거짓 구조적 분산 호출, 또는 누락된 반복 확장으로 이어진다.
본 명세서에 제시된 방법, 조성물, 시스템, 및 키트는 이러한 단점을 극복하고 샘플 조작 또는 전달을 위한 최소한의 요건으로 편향되지 않은 샘플 제조 및 서열분석이 일어나도록 한다. 본 명세서에 기재된 방법, 조성물, 시스템, 및 키트는 PCR 증폭을 사용하지 않고서 라이브러리를 생성하는 것에 관한 것이다. PCR-프리 접근법은, PCR에 의해 야기되는 편향을 감소시키고/시키거나 제거하고, 다음을 포함한다: 특히 PCR이 어려운 GC 풍부 영역에서, 갭의 개수 및 빈도를 감소시키는 것; 인델 리콜 및 인델 정밀도 향상을 포함하는 인델 호출 성능을 개선하는 것; 반복 확장의 호출을 개선하는 것; 및 GC 풍부 프로모터에서 커버리지를 개선하는 것. 본 출원은 핵산 라이브러리 생성의 개선을 위해 PCR-프리 태그멘테이션을 수행하기 위한 다양한 트랜스포좀 복합체 설계를 개시한다.
더욱이, 본 명세서에 기재된 방법, 조성물, 시스템, 및 키트는 PCR 기반 방법과 같은 다른 방법을 사용하는 핵산 샘플 제조 및 분석보다 적은 시간 동안 수행될 수 있다. 따라서, 일부 실시 형태에서, 본 명세서에 기재된 바와 같은 태깅된 핵산 단편의 라이브러리를 생성하는 방법은 약 5시간 미만의 기간 내에, 예를 들어 5시간 미만, 4시간 미만, 3시간 미만, 또는 2시간 미만 내에 수행될 수 있다. 일부 실시 형태에서, 본 명세서에 기재된 바와 같은 태깅된 핵산 단편의 라이브러리를 생성하는 방법은 약 90분 내지 약 300분 범위의 기간 내에, 예를 들어 90, 105, 120, 135, 150, 165, 180, 195, 210, 225, 240, 255, 270, 285, 또는 300분, 또는 전술한 값들 중 임의의 2개의 값에 의해 한정되는 범위 내의 시간의 양 동안 수행될 수 있다.
또한, 일부 실시 형태에서, 본 명세서에 기재된 방법, 조성물, 시스템, 및 키트의 사용은, 시간 의존적이지 않은 핵산의 단편화를 초래하고, 트랜스포좀의 고정은 일관된 삽입체 크기를 초래하고, 포화는 통합적인 추출 및 정량화-프리 라이브러리 제조를 가능하게 한다.
본 명세서에 기재된 방법, 조성물, 시스템, 및 키트의 추가의 이점은 고형 표면 상에서의 트랜스포좀 복합체의 고정화에 관한 것이며, 예를 들어, 핸즈-온(hands-on) 및 전체 라이브러리 제조 시간, 비용, 및 시약 요건을 감소시키고, 샘플 투입 요건을 낮추고, 라이브러리 제조를 위한 시작점으로서의 정제되지 않거나 열화된 샘플의 사용을 가능하게 한다. 또한, 본 명세서에 기재된 트랜스포좀 복합체는 또한 다양한 샘플 입력 농도가 사용될 때에도 용액-상 방법에 비해 더욱 일관된 삽입체 크기를 갖는 라이브러리를 생성한다.
일부 실시 형태에서, 본 명세서에 개시된 방법에 의해 얻어진 핵산 라이브러리를, 임의의 적합한 핵산 서열분석 플랫폼을 사용하여 서열분석하여 표적 서열의 핵산 서열을 결정할 수 있다. 일부 측면에서, 관심 서열은 하나 이상의 선천성 또는 유전성 장애, 병원성, 항생제 내성, 또는 유전적 변형과 상관관계가 있거나 연관된다. 서열분석은 짧은 직렬 반복(short tandem repeat), 단일 뉴클레오타이드 다형성, 유전자, 엑손, 코딩 영역, 엑솜, 또는 이들의 일부분의 핵산 서열을 결정하는 데 사용될 수 있다. 이와 같이, 본 명세서에 기재된 방법 및 조성물은 암 및 질환 진단, 예후 및 치료제, DNA 핑거프린팅(fingerprinting) 응용(예를 들어, DNA 데이터뱅킹, 형사사건), 메타게놈 연구 및 발견, 농업 유전체학 응용, 및 병원균 식별 및 모니터링에 유용하지만 이에 한정되지 않는 서열분석가능한 라이브러리를 생성하는 것에 관한 것이다.
일부 실시 형태에서, 부착 어댑터 서열은 5' 어댑터 서열의 적어도 일부분에 혼성화되고, 결합 요소는 부착 폴리뉴클레오타이드의 3' 말단에 있다. 일부 실시형태에 있어서, 부착 어댑터 서열은 3' 어댑터 서열의 적어도 일부분에 혼성화되고, 결합 요소는 부착 올리고뉴클레오타이드의 5' 말단에 있다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 용어 및 과학 용어는 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 본 명세서에 참조된 모든 특허, 출원, 공개 출원 및 다른 간행물은 달리 언급되지 않는 한 전체적으로 참고로 포함된다. 본 명세서에서 용어에 대한 복수의 정의가 있는 경우, 달리 언급되지 않는 한 이 섹션에서의 정의가 우세하다. 명세서 및 첨부된 청구범위에 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥이 명확하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다. 달리 명시되지 않는 한, 질량 분석법, NMR, HPLC, 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법이 이용된다. 달리 언급되지 않는 한, "또는" 또는 "및"의 사용은 "및/또는"을 의미한다. 또한, 용어 "포함하는"뿐만 아니라 다른 형태, 예를 들어 "포함한다", "포함하다", 및 "포함된"의 사용은 제한되지 않는다. 본 명세서에 사용되는 바와 같이, 청구항의 전제부에서든 또는 본문에서든, 용어 "포함한다" 및 "포함하는"은 개방형(open-ended) 의미를 갖는 것으로 해석되어야 한다. 즉, 이 용어는 "적어도 갖는" 또는 "적어도 포함하는"과 동의어로 해석되어야 한다. 공정과 관련하여 사용될 때, 용어 "포함하는"은 공정이 적어도 언급된 단계를 포함하지만 추가의 단계를 포함할 수 있음을 의미한다. 화합물, 조성물, 또는 장치와 관련하여 사용될 때, 용어 "포함하는"은 화합물, 조성물, 또는 장치가 적어도 언급된 특징 또는 구성요소를 포함하지만 추가의 특징 또는 구성요소도 포함할 수 있음을 의미한다.
본 명세서에 사용되는 섹션 제목은 단지 구성 목적을 위한 것이며, 기술된 주제를 제한하는 것으로 해석되어서는 안 된다.
트랜스포좀 복합체
본 명세서에 제공된 일부 실시 형태는 PCR 증폭 없이 태깅된 핵산 단편의 라이브러리를 생성하기 위한 조성물에 관한 것이다. 일부 실시 형태에서, 조성물은 고체 지지체 및 고체 지지체에 고정된 트랜스포좀 복합체를 포함한다. 일부 실시 형태에서, 트랜스포좀 복합체는 트랜스포사제, 제1 트랜스포존, 부착 폴리뉴클레오타이드, 및 제2 트랜스포존을 포함한다. 일부 실시 형태에서, 제1 트랜스포존은 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함한다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드는 5' 어댑터 서열에 혼성화된 부착 어댑터 서열 및 결합 요소를 포함한다. 일부 실시 형태에서, 제2 트랜스포존은 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함한다. 일부 실시 형태에서, 트랜스포좀 복합체는 부착 폴리뉴클레오타이드를 통해 고체 지지체에 고정된다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드는 프라이머 서열을 추가로 포함한다.
일부 실시 형태에서, 결합 요소는 선택적으로 치환된 비오틴을 포함하거나 또는 선택적으로 치환된 비오틴이다. 일부 실시 형태에서, 결합 요소는 링커를 통해 부착 폴리뉴클레오타이드에 연결된다. 일부 실시 형태에서, 결합 요소는 비오틴 링커를 포함하거나 또는 비오틴 링커이다. 일부 실시 형태에서, 결합 요소는 3', 5', 또는 내부 비오틴을 포함하거나 또는 3', 5', 또는 내부 비오틴이다.
일부 실시 형태에서, 3' 트랜스포존 말단 서열은 모자이크 말단(ME) 서열을 포함하고 5' 트랜스포존 말단 서열은 ME' 서열을 포함한다. 일부 실시형태에서, 5' 어댑터 서열은 A14 서열을 포함하고, 부착 어댑터 서열은 A14' 서열을 포함한다. 일부 실시 형태에서, 3' 어댑터 서열은 B15' 서열을 포함한다. 일부 실시 형태에서, 3' 어댑터 서열은 인덱스 어댑터 서열의 적어도 일부분에 상보적이다. 일부 실시 형태에서, 인덱스 어댑터 서열은 B15 서열을 포함한다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드의 일부분은 P5' 프라이머 서열과 같은 프라이머 서열을 포함한다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드의 프라이머 서열은 P5 프라이머 서열과 같은 인덱싱 올리고뉴클레오타이드 서열의 적어도 일부분에 상보적이다.
일부 실시 형태에서, 트랜스포좀 복합체는 본 명세서에 기재된 바와 같은 결합 요소 (및 선택적 링커)를 통해 고체 지지체 상에 고정된다. 일부 실시 형태에서, 고체 지지체는 비드, 상자성 비드, 플로우셀, 미세유체 장치의 표면, 튜브, 플레이트의 웰, 슬라이드, 패턴화된 표면, 또는 미세입자이다. 일부 실시 형태에서, 고체 지지체는 비드를 포함하거나 비드이다. 일 실시 형태에서, 비드는 상자성 비드이다. 일부 실시 형태에서, 고체 지지체는 복수의 고체 지지체를 포함한다. 일부 실시 형태에서, 트랜스포좀 복합체는 복수의 고체 지지체 상에 고정된다. 일부 실시 형태에서, 복수의 고체 지지체는 복수의 비드를 포함한다. 일부 실시 형태에서, 복수의 트랜스포좀 복합체는 ㎟ 당 적어도 103, 104, 105, 106개의 복합체의 밀도로 고체 지지체 상에 고정된다. 일부 실시 형태에서, 고체 지지체는 비드 또는 상자성 비드이고, 각각의 비드에는 10,000, 20,000, 30,000, 40,000, 50,000, 또는 60,000개 초과의 트랜스포좀 복합체가 결합되어있다.
예를 들어 넥스테라™ 플렉스 DNA 샘플 제조 키트(일루미나, 인크.(Illumina, Inc.))의 워크플로우에 예시된 바와 같이, 트랜스포존 기반 기술이 DNA를 단편화하는 데 사용될 수 있으며, 여기서 게놈 DNA와 같은 표적 핵산은 표적을 동시에 단편화하고 태깅("태그멘테이션")하는 트랜스포좀 복합체로 처리되어 단편의 말단에서 고유한 어댑터 서열로 태깅된 단편화된 핵산 분자 집단을 생성한다.
전위 반응은 하나 이상의 트랜스포존이 무작위 부위 또는 거의 무작위 부위에서 표적 핵산 내로 삽입되는 반응이다. 전위 반응에서의 구성요소는 트랜스포사제(또는 본 명세서에 기재된 바와 같은 핵산을 단편화하고 태깅할 수 있는 다른 효소, 예컨대, 인테그라제) 및 트랜스포사제 (또는 본 명세서에 기재된 바와 같은 다른 효소)에 결합하는 이중-가닥 트랜스포존 말단 서열, 및 2개의 트랜스포존 말단 서열 중 하나에 부착된 어댑터 서열을 포함하는 트랜스포존 요소를 포함한다. 이중-가닥 트랜스포존 말단 서열의 한 가닥은 표적 핵산의 한 가닥으로 전달되고, 상보적 트랜스포존 말단 서열 가닥은 그렇지 않다(전달되지 않은 트랜스포존 서열). 어댑터 서열은 필요한 대로 또는 원하는 대로 하나 이상의 기능적 서열 또는 구성요소(예컨대, 프라이머 서열, 앵커 서열, 유니버설 서열, 스페이서 영역, 또는 인덱스 태그 서열)를 포함할 수 있다.
"트랜스포좀 복합체"는 적어도 하나의 트랜스포사제(또는 본 명세서에 기재된 바와 같은 다른 효소) 및 트랜스포존 인식 서열로 구성된다. 일부 그러한 시스템에서, 트랜스포사제는 트랜스포존 인식 서열에 결합하여, 전위 반응을 촉매할 수 있는 기능성 복합체를 형성한다. 일부 태양에서, 트랜스포존 인식 서열은 이중-가닥 트랜스포존 말단 서열이다. 트랜스포사제는 표적 핵산 내의 트랜스포사제 인식 부위에 결합하고, 트랜스포존 인식 서열을 표적 핵산 내로 삽입한다. 일부 그러한 삽입 이벤트에서, 트랜스포존 인식 서열(또는 말단 서열)의 한 가닥이 표적 핵산 내로 전달되어, 절단 이벤트를 초래한다. 트랜스포사제와 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 전위 절차 및 시스템.
본 명세서에 제공된 특정 실시 형태와 함께 사용될 수 있는 예시적인 트랜스포사제는 다음을 포함한다: Tn5 트랜스포사제, 슬리핑 뷰티(Sleeping Beauty, SB) 트랜스포사제, 비브리오 하베야이(Vibrio harveyi), MuA 트랜스포사제 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포사제 인식 부위, 황색 포도상구균(Staphylococcus aureus) Tn552, Ty1, Tn7 트랜스포사제, Tn/O 및 IS10, 마리너(Mariner) 트랜스포사제, Tc1, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존. 더 많은 예는 IS5, Tn10, Tn903, IS911, 및 조작된 버전의 트랜스포사제 패밀리 효소를 포함한다. 본 명세서에 기재된 방법은 또한 단지 단일 트랜스포사제가 아니라 트랜스포사제의 조합을 포함할 수 있다.
일부 실시 형태에서, 트랜스포사제는 Tn5, Tn7, MuA, 또는 비브리오 하베야이 트랜스포사제, 또는 이의 활성 돌연변이체이다. 다른 실시 형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 돌연변이체이다. 다른 실시 형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 돌연변이체이다. 다른 실시 형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 활성 돌연변이체이다. 일부 실시 형태에서, Tn5 트랜스포사제는 과활성 Tn5 트랜스포사제, 또는 이의 활성 돌연변이체이다. 일부 태양에서, Tn5 트랜스포사제는 본 명세서에 참고로 포함된 국제 특허 공개 WO2015/160895호에 기재된 Tn5 트랜스포사제이다. 일부 태양에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제에 대하여 위치 54, 56, 372, 212, 214, 251, 및 338에서 돌연변이를 갖는 과활성 Tn5이다. 일부 태양에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제에 대하여 하기 돌연변이를 갖는 과활성 Tn5 이다: E54K, M56A, L372P, K212R, P214R, G251R, 및 A338V. 일부 실시 형태에서, Tn5 트랜스포사제는 융합 단백질이다. 일부 실시 형태에서, Tn5 트랜스포사제 융합 단백질은 융합 신장 인자 Ts(Tsf) 태그를 포함한다. 일부 실시 형태에서, Tn5 트랜스포사제는 야생형 서열에 대하여 아미노산 54, 56 및 372에서 돌연변이를 포함하는 과활성 Tn5 트랜스포사제이다. 일부 실시형태에서, 과활성 Tn5 트랜스포사제는 융합 단백질이며, 선택적으로 융합 단백질은 신장 인자 Ts(Tsf)이다. 일부 실시 형태에서, 인식 부위는 Tn5-형 트랜스포사제 인식 부위이다(문헌[Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998]참조). 일 실시 형태에서, 과활성 Tn5 트랜스포사제와 복합체를 형성하는 트랜스포사제 인식 부위(예를 들어, EZ-Tn5™ 트랜스포사제, 미국 위스콘신주 매디슨 소재의 에피센터 바이오테크놀로지스(Epicentre Biotechnologies))가 사용된다. 일부 실시 형태에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제이다.
일부 실시 형태에서, 트랜스포좀 복합체는 트랜스포사제의 2개의 분자의 이량체를 포함한다. 일부 실시 형태에서, 트랜스포좀 복합체는 동형이량체(homodimer)이며, 여기서 트랜스포사제의 두 분자는 각각 동일한 유형의 제1 및 제2 트랜스포존에 결합된다(예를 들어, 각 단량체에 결합된 2개의 트랜스포존의 서열이 동일하여, "동형이량체"를 형성한다). 일부 실시 형태에서, 본 명세서에 기재된 조성물 및 방법은 2개 집단의 트랜스포좀 복합체를 이용한다. 일부 실시 형태에서, 각각의 집단에서의 트랜스포사제는 동일하다. 일부 실시 형태에서, 각각의 집단에서의 트랜스포좀 복합체는 동형이량체이며, 첫 번째 집단은 각 단량체 내에 제1 어댑터 서열을 갖고, 두 번째 집단은 각 단량체 내에 상이한 어댑터 서열을 갖는다.
일부 실시 형태에서, 트랜스포사제 복합체는 제1 단량체 및 제2 단량체를 포함하는 트랜스포사제(예를 들어, Tn5 트랜스포사제) 이량체를 포함한다. 일부 태양에서, 각각의 단량체는 제1 트랜스포존, 제2 트랜스포존, 및 부착 폴리뉴클레오타이드를 포함하며, 제1 트랜스포존은 그의 3' 말단에서의 트랜스포존 말단 서열(3' 트랜스포존 말단 서열로도 지칭됨) 및 그의 5' 말단에서의 어댑터 서열(5' 어댑터 서열로도 지칭됨)을 포함하고; 제2 트랜스포존은 그의 5' 말단에서의 트랜스포존 말단 서열(5' 트랜스포존 말단 서열로도 지칭됨) 및 그의 3' 말단에서의 어댑터 서열(3' 어댑터 서열로도 지칭됨)을 포함하고; 부착 폴리뉴클레오타이드는 제1 트랜스포존의 5' 어댑터 서열에 혼성화된 부착 어댑터 서열, 프라이머 서열 및 링커를 포함한다. 일부 실시 형태에서, 제2 트랜스포존의 5' 트랜스포존 말단 서열은 제1 트랜스포존의 3' 트랜스포존 말단 서열에 적어도 부분적으로 상보적이다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드의 부착 어댑터 서열은 제1 트랜스포존의 5' 어댑터 서열에 적어도 부분적으로 상보적이다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드의 링커는 결합 요소를 포함한다.
말단 서열
본 명세서에 기재된 방법의 임의의 실시 형태에서, 제1 트랜스포존은 3' 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 5' 트랜스포존 말단 서열을 포함한다. 일부 실시 형태에서, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 적어도 부분적으로 상보적이다. 일부 실시 형태에서, 상보적인 트랜스포존 말단 서열은 혼성화되어 트랜스포사제(또는 본 명세서에 기재된 바와 같은 다른 효소)에 결합하는 이중-가닥 트랜스포존 말단 서열을 형성한다. 일부 실시 형태에서, 트랜스포존 말단 서열은 모자이크 말단(ME) 서열이다. 따라서, 일부 실시 형태에서, 3' 트랜스포존 말단 서열은 ME 서열이고 5' 트랜스포존 말단 서열은 ME' 서열이다.
어댑터 서열
본 명세서에 기재된 방법의 임의의 실시 형태에서, 제1 트랜스포존은 5' 어댑터 서열을 포함하고, 제2 트랜스포존은 3' 어댑터 서열을 포함한다. 어댑터 서열은 프라이머 서열, 앵커 서열, 유니버설 서열, 스페이서 영역, 인덱스 서열, 포획서열, 바코드 서열, 절단 서열, 서열분석-관련 서열 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 기능적 서열 또는 구성요소를 포함할 수 있다. 일부 실시 형태에서, 어댑터 서열은 프라이머 서열을 포함한다. 다른 실시 형태에서, 어댑터 서열은 프라이머 서열 및 인덱스 또는 바코드 서열을 포함한다. 프라이머 서열은 또한 유니버설 서열일 수 있다. 본 발명은 사용될 수 있는 어댑터 서열의 유형에 제한되지 않으며, 당업자는 라이브러리 제조 및 차세대 서열분석을 위해 사용될 수 있는 추가의 서열을 인식할 것이다. 유니버설 서열은 2개 이상의 핵산 단편에 공통인 뉴클레오타이드 서열의 영역이다. 선택적으로, 2개 이상의 핵산 단편은 또한 서열 차이의 영역을 갖는다. 복수의 핵산 단편의 상이한 구성원에 존재할 수 있는 유니버설 서열은 유니버설 서열에 상보적인 단일 유니버설 프라이머를 사용하여 다수의 상이한 서열의 복제 또는 증폭을 가능하게 할 수 있다.
일부 실시 형태에서, 부착 폴리뉴클레오타이드는 5' 어댑터 서열에 혼성화된 부착 어댑터 서열을 포함한다. 일부 실시 형태에서, 부착 어댑터 서열은 5' 어댑터 서열에 적어도 부분적으로 상보적이다. 일부 실시 형태에서, 어댑터 서열은 A14 서열 또는 B15 서열이다. 따라서, 일부 실시 형태에서, 5' 어댑터 서열은 A14 서열이고, 부착 어댑터 서열은 A14' 서열이다. 일부 실시 형태에서, 3' 어댑터 서열은 B15' 서열이다. 일부 실시 형태에서, 어댑터 서열은 혼성화를 위한 임의의 서열(본 명세서에서 서열 X로 지칭됨)이다. 일부 실시 형태에서, 서열 X는 16 내지 20개의 뉴클레오타이드를 포함한다. 일부 실시 형태에서, 서열 X는 어댑터 서열과 유사한 용융 온도(Tm)를 갖는다. 일부 실시 형태에서, 서열 X의 Tm이 어댑터 서열의 용융 온도와 유사한 용융 온도를 가질 때 서열분석 결과가 개선된다. 일부 실시 형태에서, 서열 X는 A14 서열 또는 B15 서열과 유사한 용융 온도를 갖는다. 일부 실시 형태에서, 서열 X의 Tm은 53° 내지 56°이다. 일부 실시형태에서, 어댑터 서열은 태그멘테이션 반응에 의해 핵산 단편의 5' 말단으로 전달된다.
임의의 실시 형태에서, A14-ME, ME, B15-ME, ME', A14, B15, 및 ME를 포함하는, 어댑터 서열 또는 트랜스포존 말단 서열이 하기에 제공된다:
A14-ME: 5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′ (서열 번호 1)
B15-ME: 5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′ (서열 번호 2)
ME': 5′-phos-CTGTCTCTTATACACATCT-3' (서열 번호 3)
A14: 5′-TCGTCGGCAGCGTC-3′ (서열 번호 4)
B15: 5′-GTCTCGTGGGCTCGG-3' (서열 번호 5)
ME: AGATGTGTATAAGAGACAG (서열 번호 6)
부착 폴리뉴클레오타이드
본 명세서에 기재된 트랜스포좀 복합체의 실시 형태는 부착 폴리뉴클레오타이드를 포함한다. 본 명세서에 사용되는 바와 같이, 부착 폴리뉴클레오타이드는 하나의 말단에서 트랜스포존에 혼성화되고 제2 말단에서 표면에 결합하는 폴리뉴클레오타이드이다. 따라서, 본 명세서에 기재된 트랜스포좀 복합체는 부착 폴리뉴클레오타이드를 통해 고체 지지체에 고정된다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드는 제1 트랜스포존의 어댑터 서열 또는 제2 트랜스포존의 어댑터 서열에 혼성화된 부착 어댑터 서열, 프라이머 서열 및 링커를 포함한다. 일부 실시 형태에서, 링커는 결합 요소를 포함한다.
본 명세서에 기술된 바와 같이, 부착 어댑터 서열은 제1 또는 제2 트랜스포존의 어댑터 서열에 적어도 부분적으로 상보적일 수 있다. 일부 실시 형태에서, 부착 어댑터 서열은 5' 어댑터 서열에 혼성화된다. 부착 어댑터 서열이 5' 어댑터 서열에 혼성화되는 실시 형태에서, 5' 어댑터 서열은 A14 서열이고, 부착 어댑터 서열은 A14' 서열이다. 일부 실시형태에서, 어댑터 서열은 서열 X이다. 일부 실시형태에서, 부착 어댑터 서열은 3' 어댑터 서열에 혼성화된다. 부착 어댑터 서열이 3' 어댑터 서열에 혼성화되는 실시 형태에서, 3' 어댑터 서열은 B15' 서열이고, 부착 어댑터 서열은 B15 서열이다. 이들 실시 형태 중 임의의 것에서, 부착 어댑터 서열은 제1 또는 제2 트랜스포존의 어댑터 서열에 완전히 상보적이거나 또는 제1 또는 제2 트랜스포존의 어댑터 서열에 부분적으로 상보적일 수 있다.
일부 실시 형태에서, 부착 폴리뉴클레오타이드는 프라이머 서열을 포함한다. 일부 실시 형태에서, 프라이머 서열은 P5 프라이머 서열 또는 P7 프라이머 서열 또는 이들의 상보체(예를 들어, P5' 또는 P7')이다. P5 및 P7 프라이머는 다양한 일루미나 플랫폼에 대한 서열분석을 위해, 일루미나, 인크.에 의해 판매되는 상업적 플로우 셀의 표면에 사용된다. 프라이머 서열은 미국 특허 출원 공개 제2011/0059865호에 기재되어 있으며, 이는 전체적으로 본 명세서에 참고로 포함된다. 5' 말단에서 알킨으로 종결될 수 있는 P5 및 P7 프라이머의 예에는 다음이 포함된다:
P5: AATGATACGGCGACCACCGAGAUCTACAC (서열 번호 7)
P7: CAAGCAGAAGACGGCATACGAG*AT (서열 번호 8)
및 이들의 유도체. 일부 예에서, P7 서열은 G* 위치에서 변형된 구아닌, 예를 들어 8-옥소-구아닌을 포함한다. 다른 예에서, *는 G*와 인접 3' A 사이의 결합이 포스포로티오에이트 결합임을 나타낸다. 일부 예에서, P5 및/또는 P7 프라이머는 비천연 링커를 포함한다. 선택적으로, P5 및 P7 프라이머 중 하나 또는 둘 모두는 폴리 T 테일을 포함할 수 있다. 폴리 T 테일은 대체적으로 상기에 나타낸 서열의 5' 말단에, 예를 들어, 5' 염기와 말단 알킨 단위 사이에 위치하지만, 일부 경우에 3' 말단에 위치할 수 있다. 폴리 T 서열은 임의의 수의 T 뉴클레오타이드, 예를 들어, 2 내지 20개를 포함할 수 있다. P5 및 P7 프라이머가 예로서 주어지지만, 본 명세서에 제시된 실시예에서 임의의 적합한 프라이머가 사용될 수 있음이 이해되어야 한다. P5 및 P7 프라이머 서열을 포함하는 프라이머 서열을 갖는 인덱스 서열은 서열분석을 위한 라이브러리를 활성화시키기 위해 P5 및 P7을 첨가하는 역할을 한다. P5 및 P7 프라이머가 예로서 주어지지만, 임의의 적합한 증폭 프라이머가 본 명세서에 제시된 실시예에서 사용될 수 있음이 이해되어야 한다.
본 명세서에 사용되는 바와 같이, 링커의 일 예는, 결합 요소를 부착 폴리뉴클레오타이드의 뉴클레오타이드 부분의 말단에 공유적으로 연결하고 부착 폴리뉴클레오타이드를 고체 지지체에 고정화하는 데 사용될 수 있는 모이어티이다. 링커는 절단가능한 링커, 예를 들어, 부착 폴리뉴클레오타이드, 및 따라서 트랜스포좀 복합체 또는 태그멘테이션 산물을 고체 지지체로부터 제거하기 위해 절단될 수 있는 링커일 수 있다. 본 명세서에 사용되는 바와 같은 절단가능한 링커는, 예를 들어 광분해, 화학적 절단, 열적 절단, 또는 효소적 절단과 같은 화학적 또는 물리적 수단을 통해 절단될 수 있는 링커이다. 일부 실시 형태에서, 절단은 생화학적, 화학적, 효소적, 친핵성, 환원 민감성 제제 또는 다른 수단에 의해 이루어질 수 있다. 절단가능한 링커는 다음으로 이루어진 군으로부터 선택되는 모이어티를 포함할 수 있다: 제한 엔도뉴클레아제 부위; RNAse로 절단가능한 적어도 하나의 리보뉴클레오타이드; 소정의 화학적 제제(들)의 존재 하에서 절단가능한 뉴클레오타이드 유사체; 광-절단가능한 링커 단위; (예를 들어) 과요오드산염을 이용한 처리에 의해 절단가능한 다이올 결합; 화학적 환원제로 절단가능한 다이설파이드 기; 광화학적 절단을 받을 수 있는 절단가능한 모이어티; 및 펩티다제 효소 또는 다른 적합한 수단에 의해 절단가능한 펩티드. 절단은 절단가능한 뉴클레오타이드 또는 핵염기를 우라실 또는 8-옥소-구아닌과 같은 절단가능한 링커 내에 포함시킴으로써 효소적으로 매개될 수 있다.
일부 실시 형태에서, 본 명세서에 기재된 링커는 부착 폴리뉴클레오타이드에 공유적으로 직접 부착되어, 예를 들어 -O- 결합을 형성할 수 있거나, 포스페이트 또는 에스테르와 같은 다른 기를 통해 공유적으로 부착될 수 있다. 대안적으로, 본 명세서에 기재된 링커는 부착 폴리뉴클레오타이드의 포스페이트 기에 공유적으로 부착될 수 있으며, 예를 들어 포스페이트 기를 통해 3 '하이드록실에 공유적으로 부착되어, -O-P(O)3- 결합을 형성할 수 있다.
본 명세서에 사용되는 바와 같이, 결합 요소는 결합 파트너에 공유적으로 또는 비공유적으로 결합하는 데 사용될 수 있는 모이어티이다. 일부 태양에서, 결합 요소는 트랜스포좀 복합체 상에 있고 결합 파트너는 고체 지지체 상에 있다. 일부 실시 형태에서, 결합 요소는 고체 지지체 상의 결합 파트너에 결합하거나 비공유적으로 결합됨으로써, 트랜스포좀 복합체를 고체 지지체에 비공유적으로 부착시킬 수 있다. 일부 실시 형태에서, 결합 요소는 고체 지지체 상의 결합 파트너에 (공유적으로 또는 비공유적으로) 결합할 수 있다. 일부 태양에서, 결합 요소는 고체 지지체 상의 결합 파트너에 (공유적으로 또는 비공유적으로) 결합되어, 고정된 트랜스포좀 복합체를 생성한다.
그러한 실시 형태에서, 결합 요소는 예를 들어 비오틴을 포함하거나 또는 비오틴이고, 결합 파트너는 아비딘 또는 스트렙타비딘을 포함하거나 아비딘 또는 스트렙타비딘이다. 다른 실시 형태에서, 결합 요소/결합 파트너 조합은 FITC/항-FITC, 디곡시게닌/디곡시게닌 항체, 또는 합텐/항체를 포함하거나 FITC/항-FITC, 디곡시게닌/디곡시게닌 항체, 또는 합텐/항체이다. 추가의 적합한 결합 쌍은 다이티오비오틴-아비딘, 이미노비오틴-아비딘, 비오틴-아비딘, 다이티오비오틴-석시닐화 아비딘, 이미노비오틴-석시닐화 아비딘, 비오틴-스트렙타비딘, 및 비오틴-석시닐화 아비딘을 포함하지만 이에 한정되지 않는다. 일부 실시 형태에서, 결합 요소는 비오틴이고 결합 파트너는 스트렙타비딘이다.
일부 실시 형태에서, 결합 요소는 화학 반응을 통해 결합 파트너에 결합할 수 있거나, 고체 지지체 상의 결합 파트너와의 반응에 의해 공유 결합됨으로써, 트랜스포좀 복합체를 고체 지지체에 공유적으로 부착시킬 수 있다. 일부 태양에서, 결합 요소/결합 파트너 조합은 아민/카르복실산을 포함하거나 또는 아민/카르복실산이다(예를 들어, EDC 또는 NHS-매개 커플링과 같은 당업자에게 공지된 조건 하에서 표준 펩티드 커플링 반응을 통한 결합). 두 성분의 반응은 아미드 결합을 통해 결합 요소와 결합 파트너를 결합시킨다. 대안적으로, 결합 요소 및 결합 파트너는 2개의 클릭 화학 파트너(예를 들어, 반응하여 트라이아졸 결합을 형성하는 아자이드/알킨)일 수 있다.
일부 실시 형태에서, 부착 폴리뉴클레오타이드는 추가의 서열 또는 구성요소, 예를 들어 유니버설 서열, 스페이서 영역, 앵커 서열, 또는 인덱스 태그 서열, 또는 이들의 조합을 추가로 포함한다. 유니버설 서열은 2개 이상의 핵산 단편에 공통인 뉴클레오타이드 서열의 영역이다. 선택적으로, 2개 이상의 핵산 단편은 또한 서열 차이의 영역을 갖는다. 복수의 핵산 단편의 상이한 구성원에 존재할 수 있는 유니버설 서열은 유니버설 서열에 상보적인 단일 유니버설 프라이머를 사용하여 다수의 상이한 서열의 복제 또는 증폭을 가능하게 할 수 있다.
일부 실시 형태에서, 제1 트랜스포존은 5' 어댑터 서열의 프라이머 서열 5'를 추가로 포함하고, 부착 폴리뉴클레오타이드는 (i) 5' 어댑터 서열과 상보적이고 이에 혼성화되는 부분 및 (ii) 상보적 프라이머 서열을 포함한다(예를 들어, 도 4a, 단일 인덱스, 유니버설 비드 참조). 그러한 구조물은 사용되는 인덱스 태그 서열이 없기 때문에 단일 인덱싱 응용을 위한 유니버설 비드로서 유용하다.
일부 실시 형태에서, 제1 트랜스포존은 5' 어댑터 서열의 프라이머 서열 5'를 추가로 포함하고, 부착 폴리뉴클레오타이드는 인덱스 태그 서열 및 프라이머 서열을 포함한다(예를 들어, 도 4a, 단일 인덱싱, 인덱싱된 비드 참조).
일부 실시 형태에서, 제1 트랜스포존은 5' 어댑터 서열을 포함하고, 부착 폴리뉴클레오타이드는 (i) 5' 어댑터 서열과 상보적이고 이에 혼성화되는 부분, (ii) 스페이서 영역, 및 (iii) 프라이머 서열을 포함한다(예를 들어, 도 4a, 유니버설 비드, 이중 인덱싱 참조).
일부 실시 형태에서, 제2 트랜스포존은 3' 어댑터 서열을 포함하고, 부착 폴리뉴클레오타이드는 (i) 3' 어댑터 서열과 상보적이고 이에 혼성화되는 부분, (ii) 인덱스 태그 서열, 및 (iii) 프라이머 서열을 포함한다(예를 들어, 도 4a, 이중 인덱싱, 인덱싱된 비드 참조).
일부 실시 형태에서, 부착 폴리뉴클레오타이드는 스페이서 영역(예를 들어, 도 4a 참조) 또는 스페이서 영역과 앵커 영역(예컨대, 도 3 참조)을 포함한다. 본 명세서에 사용되는 바와 같이, 스페이서 영역은 공지된 유전자 기능에 대한 임의의 구조적 또는 암호화 정보를 운반하지 않는 핵산 서열을 지칭한다. 부착 폴리뉴클레오타이드 상의 스페이서 영역은 다양한 서열을 갖는(예를 들어, 다양한 i5 서열을 갖는) 인덱싱 올리고뉴클레오타이드와 정렬될 수 있다. 일부 실시 형태에서, 스페이서 영역은 유니버설 서열이다. 일부 실시 형태에서, 스페이서 영역은 비-DNA 스페이서이다. 일부 실시 형태에서, 스페이서 영역은 유니버설 염기, 예를 들어 이노신 또는 나이트로인돌을 포함한다. 일부 실시 형태에서, 스페이서는 sp18 링커를 포함한다. 본 명세서에 사용되는 바와 같이, sp18 링커는 C18 스페이서(18-원자의 헥사-에틸렌 글리콜 스페이서)를 갖는 표준 변형 링커이며, 길이가 4개의 염기쌍과 동등하다. 따라서, 2 × sp18 링커는 길이가 8개의 염기쌍과 동등하다. 일부 실시 형태에서, 스페이서 영역은 2 × sp18 합성 링커를 포함한다. 일부 실시 형태에서, 스페이서 영역은 하나 이상의 C18 스페이서, 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 또는 그 이상의 C18 스페이서를 포함한다. 일부 실시 형태에서, 스페이서 영역은 2개의 C18 스페이서(길이가 8개의 뉴클레오타이드와 동등함)를 포함한다. 일부 실시형태에서, 스페이서는 길이가 2개의 염기쌍과 동등한 C9 스페이서이다. 일부 실시형태에서, 스페이서 영역은 하나 이상의 C9 스페이서(트라이에틸렌글리콜 스페이서), 예를 들어 1개, 2개, 3개, 4개, 5개, 6개 또는 그 이상의 C9 스페이서를 포함한다. 일부 실시 형태에서, 스페이서는 10개의 염기쌍의 스페이서와 같은, 기존의 인덱스와 함께 사용되는 통상적인 스페이서이다. 일부 실시 형태에서, 스페이서 영역은 스페이서의 조합, 예를 들어 하나 이상의 C18 스페이서와 하나 이상의 C9 스페이서의 조합, 또는 본 명세서에 기재된 임의의 스페이서의 임의의 조합이다. 일부 실시 형태에서, 스페이서 영역은 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20, 또는 30개의 염기쌍과 동등한 길이이다. 일부 실시 형태에서, 스페이서 영역은 8개 또는 10개의 염기쌍 또는 뉴클레오타이드와 대략 동등한 길이이다. 일부 실시 형태에서, 스페이서 영역은 구체적으로 인덱스 영역과 동일한 길이로 선택된다. 일부 실시 형태에서, 인덱스 영역은 8개의 뉴클레오타이드의 길이이고, 스페이서 영역은 2개의 C18 스페이서를 포함한다. 일부 실시 형태에서, 인덱스 영역은 10개의 뉴클레오타이드의 길이이고, 스페이서 영역은 2개의 C18 스페이서 및 하나의 C9 스페이서를 포함한다.
일부 태양에서, 부착 폴리뉴클레오타이드는 앵커 서열을 포함한다. 일부 실시 형태에서, 앵커 서열은 GGATATGCTCGG(서열 번호 22)이다. 일부 실시 형태에서, 앵커 서열은 A14 서열(서열번호 4)이다. 본 명세서에 사용되는 바와 같이, 앵커 영역은 인덱싱 올리고뉴클레오타이드 내의 앵커 상보 영역에 상보적이고 2개의 구성요소의 혼성화를 가능하게 하는 DNA 서열을 의미한다(예를 들어, 도 3b 참조). 일부 태양에서, 앵커 영역은 인덱싱 올리고뉴클레오타이드의 앵커 상보 영역의 일부분에 상보적이며, 인덱싱 올리고뉴클레오타이드는 앵커 영역 상보체 및 인덱스 태그 서열(--앵커'-인덱스 태그 서열-)을 포함한다. 일부 실시 형태에서, 앵커 서열은 복수의 인덱싱 올리고뉴클레오타이드에 공통인 앵커 상보 영역에 상보적이다. 일부 실시 형태에서, 복수의 인덱싱 올리고뉴클레오타이드에서의 각 인덱스 태그 서열은 동일하거나(인덱싱되지 않음) 또는 상이하다(인덱싱됨). 일부 실시 형태에서, 인덱스 태그 서열은 i5 서열이다. 부착 폴리뉴클레오타이드는, 예를 들어, 프라이머 서열, 앵커 서열, 유니버설 서열, 스페이서 영역, 인덱스 서열, 포획 서열, 바코드 서열, 절단 서열, 서열분석-관련 서열, 및 이들의 조합을 포함하는, 인덱스에 결합하기 위한 부착 폴리뉴클레오타이드의 효율성 및 기능성을 개선하기 위한 추가의 서열 요소 및 구성요소를 추가로 포함할 수 있다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드는 A14' 서열을 포함한다.
트랜스포사제, 트랜스포존, 및 부착 폴리뉴클레오타이드를 포함하는 트랜스포좀 복합체의 변형이 실현될 수 있다. 예를 들어, 트랜스포좀 복합체의 구성, 설계, 혼성화, 구조적 요소, 및 전체 배열의 변형이 실현될 수 있다. 본 명세서에 제공된 개시 내용 및 도면은 몇몇 변형을 제공하지만, 본 발명의 범주 내의 추가의 변형이 용이하게 실현될 수 있음이 이해된다.
고체 지지체
용어 "고체 표면", "고체 지지체" 및 다른 문법적 등가물은, 트랜스포좀 복합체의 부착에 적절하거나 적절하도록 변형될 수 있는 임의의 재료를 지칭한다. 당업자에 의해 이해되는 바와 같이, 가능한 기재(substrate)의 수는 다수이다. 가능한 기재에는 유리 및 개질 또는 기능화된 유리, 플라스틱(아크릴, 폴리스티렌 및 스티렌과 다른 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, 테플론(TEFLON) 등을 포함함), 다당류, 다면체 유기 실세스퀴옥산(POSS) 재료, 나일론 또는 나이트로셀룰로오스, 세라믹, 수지, 실리카, 또는 규소 및 개질된 규소를 포함하는 실리카-기반 재료, 탄소, 금속, 무기 유리, 플라스틱, 광섬유 다발(bundle), 비드, 상자성 비드, 및 다양한 다른 중합체가 포함되지만 이에 한정되지 않는다.
적합한 비드 조성물에는 플라스틱, 세라믹, 유리, 폴리스티렌, 메틸스티렌, 아크릴 중합체, 상자성 재료, 토리아 졸, 탄소 흑연, 이산화티타늄, 라텍스 또는 가교결합된 덱스트란, 예를 들어 세파로스(Sepharose), 셀룰로오스, 나일론, 가교결합된 미셀 및 테플론뿐만 아니라, 고체 지지체에 대해 본 명세서에 약술된 임의의 다른 재료가 포함되지만 이에 한정되지 않는다. 소정 실시 형태에서, 미소구체는 자성 미소구체 또는 비드, 예를 들어 상자성 입자, 구체 또는 비드이다. 비드는 구형일 필요는 없으며; 불규칙한 입자가 사용될 수 있다. 대안적으로 또는 추가적으로, 비드는 다공성일 수 있다. 비드 크기는 나노미터, 예를 들어 100 nm 내지 수 밀리미터, 예를 들어 1 mm의 범위이고, 약 0.2 마이크로미터 내지 약 200 마이크로미터의 비드가 바람직하고, 약 0.5 내지 약 5 마이크로미터가 특히 바람직하지만, 일부 실시 형태에서는 더 작거나 더 큰 비드가 사용될 수 있다. 비드는 결합 파트너로 코팅될 수 있으며, 예를 들어 비드는 스트렙타비딘으로 코팅될 수 있다. 일부 실시 형태에서, 비드는 스트렙타비딘 코팅된 상자성 비드, 예를 들어 다이나비즈 마이원(Dynabeads MyOne) 스트렙타비딘 C1 비드(써모 사이언티픽(Thermo Scientific) 카탈로그 # 65601), 스트렙타비딘 마그네스피어(MagneSphere) 상자성 입자(프로메가(Promega) 카탈로그 # Z5481), 스트렙타비딘 자성 비드(NEB 카탈로그 # S1420S) 및 맥스비드(MaxBead) 스트렙타비딘(애브노바(Abnova) 카탈로그 # U0087)이다. 고체 지지체는 또한 슬라이드, 예를 들어, 플로우셀일 수 있거나 트랜스포좀 복합체가 그 위에 고정될 수 있도록 변형된 다른 슬라이드일 수 있다.
일부 실시 형태에서, 결합 파트너는 1000 내지 약 6000 pmol/mg, 또는 약 2000 내지 약 5000 pmol/mg, 또는 약 3000 내지 약 5000 pmol/mg, 또는 약 3500 내지 약 4500 pmol/mg의 밀도로 고체 지지체 또는 비드 상에 존재한다.
일 실시 형태에서, 고체 표면은 샘플 튜브의 내부 표면이다. 다른 실시 형태에서, 고체 표면은 포획 막이다. 일 예에서, 포획 막은 (예를 들어, 프로메가 코포레이션(Promega Corporation)으로부터 입수가능한) 비오틴-포획 막이다. 다른 예에서, 포획 막은 여과지이다. 본 발명의 일부 실시 형태에서, 고체 지지체는, 예를 들어, 폴리뉴클레오타이드와 같은 분자에 대한 공유 부착을 허용하는 반응성 기를 포함하는 중간 재료의 층 또는 코팅의 적용에 의해 기능화된 불활성 기재 또는 매트릭스(예를 들어, 유리 슬라이드, 중합체 비드 등)로 구성된다. 그러한 지지체의 예에는 유리와 같은 불활성 기재 상에 지지된 폴리아크릴아미드 하이드로겔, 특히 국제 특허 공개 WO2005/065814호 및 미국 특허 출원 공개 제2008/0280773호(이들의 내용은 전체적으로 본 명세서에 참고로 포함됨)에 기재된 바와 같은 폴리아크릴아미드 하이드로겔이 포함되지만 이에 한정되지 않는다. 태그멘테이션된 DNA 라이브러리의 구성을 위해 고체 표면 상의 DNA를 태그멘테이션(단편화 및 태깅)하는 방법이 국제 특허 공개 WO2016/189331호 및 미국 특허 출원 공개 제2014/0093916A1호에 기재되어 있으며, 이들은 전체적으로 본 명세서에 참고로 포함된다. 일부 실시 형태에서, 본 명세서에 기재된 트랜스포좀 복합체는 결합 요소를 통해 고체 지지체에 고정된다. 그러한 일부 실시 형태에서, 고체 지지체는 스트렙타비딘을 결합 파트너로서 포함하고, 결합 요소는 비오틴이다.
일부 실시 형태에서, 트랜스포좀 복합체는 특정 밀도 또는 밀도 범위로, 비드와 같은 고체 지지체 상에 고정된다. 일부 실시 형태에서, 고체 지지체 상의 복합체의 밀도는 고정화 반응 동안 용액 중의 트랜스포좀 복합체의 농도를 지칭한다. 복합체 밀도는 고정화 반응이 정량적이라고 가정한다. 일단 복합체가 특정 밀도로 형성되면, 표면-결합된 트랜스포좀 복합체의 배치(batch)에 대해 밀도가 일정하게 유지된다. 생성된 비드는 희석될 수 있고, 희석된 용액 중의 복합체의 결과적인 농도는 비드에 대해 준비된 밀도를 희석 계수로 나눈 값이다. 희석된 비드 스톡은 그의 제조로부터 복합체 밀도를 유지하지만, 복합체는 희석된 용액 중에 더 낮은 농도로 존재한다. 희석 단계는 비드 상의 복합체의 밀도를 변화시키지 않으며, 따라서 라이브러리 수율에는 영향을 미치지만 삽입체(단편) 크기에는 영향을 미치지 않는다. 일부 실시 형태에서, 밀도는 약 5 nM 내지 약 1000 nM, 또는 약 5 내지 150 nM, 또는 약 10 nM 내지 800 nM이다. 다른 실시 형태에서, 밀도는 약 10 nM, 또는 약 25 nM, 또는 약 50 nM, 또는 약 100 nM, 또는 약 200 nM, 또는 약 300 nM, 또는 약 400 nM, 또는 약 500 nM, 또는 약 600 nM, 또는 약 700 nM, 또는 약 800 nM, 또는 약 900 nM, 또는 약 1000 nM이다. 일부 실시 형태에서, 밀도는 약 100 nM이다. 일부 실시 형태에서, 밀도는 약 300 nM이다. 일부 실시 형태에서, 밀도는 약 600 nM이다. 일부 실시 형태에서, 밀도는 약 800 nM이다. 일부 실시 형태에서, 밀도는 약 100 nM이다. 일부 실시 형태에서, 밀도는 약 1000 nM이다.
본 명세서에 제공된 일부 실시 형태는 본 명세서에 기재된 바와 같은 트랜스포좀 복합체, 및 인덱스 서열을 포함하는 인덱스 믹스를 포함하는 키트에 관한 것이다. 본 명세서에 제공된 일부 실시 형태는 본 명세서에 기재된 바와 같은, 트랜스포좀 복합체가 상부에 고정된 고체 지지체를 갖는 조성물, 및 인덱스 서열을 포함하는 인덱스 믹스를 포함하는 키트에 관한 것이다. 일부 실시형태에서, 인덱스 믹스는 i5 인덱스 서열 및 i7 인덱스 서열을 포함하며, 여기서 i5 인덱스 서열은 부착 폴리뉴클레오타이드에 상보적이고 이에 혼성화되고, 여기서 i7 인덱스 서열은 3' 어댑터 서열에 상보적이고 이에 혼성화된다.
고정된 트랜스포좀 복합체/태깅된 핵산 단편을 생성하는 방법
본 발명은 본 명세서에 기재된 바와 같은 고정된 트랜스포좀 복합체의 제조 방법을 추가로 제공한다. 본 명세서에 제공된 일부 실시 형태는 태깅된 핵산 단편의 라이브러리를 생성하는 방법에 관한 것이다. 일부 실시 형태에서, 본 방법은 트랜스포좀 복합체가 상부에 고정된 고체 지지체를 제공하는 단계, 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 표적 핵산을 고체 지지체에 적용하는 단계, 및 서열분석을 위한 라이브러리를 활성화시키기 위해 인덱스 서열을 포함하는 인덱스 믹스를 적용하는 단계를 포함한다. 일부 실시 형태에서, 트랜스포좀 복합체는 제1 및 제2 트랜스포존에 결합된 트랜스포사제, 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존, 부착 어댑터 서열 및 결합 요소를 포함하는 부착 폴리뉴클레오타이드, 및 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존을 포함한다.
일부 실시 형태에서, 방법은, 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 상기 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서, 고정된 트랜스포좀 복합체를 표적 핵산과 접촉시키는 단계를 포함하는, 태깅된 핵산 단편의 라이브러리를 생성하는 단계를 포함한다.
일부 태양에서, 본 방법은, 미결합 핵산을 제거하도록 고체 지지체를 처리하는 단계; 또는 선택적으로 (a) 고체 지지체를 가열하고/하거나 (b) 고체 지지체를 효소 변성제로 세척함으로써, 복합체로부터 트랜스포사제를 제거하도록 고체 지지체를 처리하는 단계를 추가로 포함하며, 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함한다.
일부 실시 형태에서, 접촉시키는 단계는 생물학적 샘플을 트랜스포좀 복합체에 첨가하는 것을 포함한다. 일부 실시 형태에서, 생물학적 샘플은 세포 용해물 또는 전세포를 포함하거나, 혈액, 혈장, 혈청, 림프액, 점액, 객담, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변, 침연 조직, 및 고정된 조직 FFPE로부터 선택된다.
일부 태양에서, 접촉시키는 단계는 복수의 인덱싱 올리고뉴클레오타이드를 부착 폴리뉴클레오타이드에 혼성화하는 것을 추가로 포함하며, 복수의 인덱싱 올리고뉴클레오타이드는 동일하거나 상이한 인덱스 서열을 포함한다.
일부 태양에서, 본 방법은 가닥을 연장 및 라이게이션하여 완전 이중-가닥 태깅된 단편을 생성하도록 상기 복수의 5' 태깅된 표적 단편을 폴리머라제 및 리가제로 처리하는 단계를 추가로 포함한다. 일부 태양에서, 폴리머라제 및 리가제로 처리하는 단계는 DNA 2차 구조 파괴물질의 존재 하에 수행되며, 파괴물질은 선택적으로 DMSO이다. 일부 태양에서, 폴리머라제 및 리가제로 처리하는 단계는 프라이머 서열의 상보체인 올리고뉴클레오타이드의 존재 하에서 수행되며, 올리고뉴클레오타이드는 P7' 올리고뉴클레오타이드이고, 프라이머 서열은 P7 서열이다. 일부 실시 형태에서, 폴리머라제는 엑소뉴클레아제 활성이 결여된 T4 DNA 폴리머라제 돌연변이체를 포함한다.
일부 태양에서, 본 방법은 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 제거하는 단계를 추가로 포함한다. 일부 태양에서, 제거하는 단계는 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 절단하기에 충분한 열 및/또는 변성제를 적용하는 것을 포함한다.
일부 태양에서, 본 방법은 5' 태깅된 표적 단편 또는 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함한다. 일부 태양에서, 단편은 접촉시키는 단계 후에 그리고 서열분석하는 단계 전에 PCR에 의해 정량화되지 않는다. 일부 태양에서, 핵산은 DNA 또는 RNA이다. 일부 태양에서, 3' 어댑터 서열은 인덱스 어댑터 서열의 적어도 일부분에 상보적이다. 일부 태양에서, 부착 폴리뉴클레오타이드의 프라이머 서열은 인덱스 프라이머 서열의 적어도 일부분에 상보적이다. 일부 태양에서, 부착 폴리뉴클레오타이드의 프라이머 서열은 인덱싱 폴리뉴클레오타이드의 인덱스 프라이머 서열에 상보적이다.
일부 실시 형태에서, 본 방법은 미결합 핵산을 제거하도록 고체 지지체를 세척하는 단계를 추가로 포함한다. 일부 실시 형태에서, 본 방법은 트랜스포사제를 제거하도록 고체 지지체를 처리하는 단계를 추가로 포함한다. 일부 실시 형태에서, 고체 지지체를 처리하는 단계는 고체 지지체를 효소 변성제로 세척하는 것을 포함한다. 일부 실시 형태에서, 효소 변성제에는 아세트산, 다이메틸 설폭사이드(DMSO), 다이티오트레이톨, 에탄올, 포름알데하이드, 포름아미드, 글루타르알데하이드, 구아니딘 하이드로클로라이드, 리튬 퍼클로레이트, 메르캅토에탄올, 프로필렌 글리콜, 프로테이나제, 중탄산나트륨, 소듐 도데실 설페이트(SDS), 살리실산나트륨, 설포살리실산, 트라이클로로아세트산, 트리스(2-카르복시에틸)포스핀(TCEP), 또는 우레아가 포함된다. 일부 실시 형태에서, 고체 지지체를 처리하는 단계는 고체 지지체를 가열하여 트랜스포사제를 제거하는 것을 포함한다. 일부 실시형태에서, 표적 핵산을 적용하는 단계는 생물학적 샘플을 트랜스포좀 복합체와 혼합하는 것을 포함한다. 핵산은 완전히 정제될 필요가 없거나 전혀 정제될 필요가 없으며, 생물학적 샘플의 일부일 수 있거나 단백질, 다른 핵산 종, 다른 세포 성분, 및/또는 임의의 다른 오염물과의 혼합물일 수 있다. 일부 실시 형태에서, 생물학적 샘플은 세포 용해물을 포함한다. 일부 실시 형태에서, 생물학적 샘플은 전세포를 포함한다. 일부 실시 형태에서, 생물학적 샘플은 체액, 혈액, 혈장, 혈청, 림프액, 점액, 객담, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변, 침연 조직, 및 고정된 조직 포르말린-고정 파라핀-포매된 조직(formalin-fixed paraffin-embedded tissue, FFPE)으로부터 선택된다.
일부 실시 형태에서, 인덱스 믹스를 적용하는 단계는 인덱스 서열을 부착 폴리뉴클레오타이드 및 제2 트랜스포존에 혼성화하는 것을 포함한다. 일부 실시 형태에서, 인덱스 믹스는 연장-라이게이션 믹스(ELM)를 포함한다. 일부 실시 형태에서, ELM은 폴리머라제 및 리가제를 포함한다. 일부 실시 형태에서, ELM은 인덱스의 분리 라이게이션을 위한 스플릿(split) ELM이다. 일부 실시 형태에서, 폴리머라제는 T4 DNA 폴리머라제 또는 이의 돌연변이체(예를 들어 엑소뉴클레아제 활성이 결여된 T4 DNA 폴리머라제, 또는 돌연변이 T4 DNA 폴리머라제, 또는 엑소뉴클레아제 활성이 결여된 돌연변이 T4 DNA 폴리머라제)를 포함한다. 일부 실시 형태에서, 리가제는 이.콜라이(E. coli) DNA 리가제를 포함한다. 일부 실시 형태에서, 연장-라이게이션 반응은 DNA 2차 구조 파괴물질, 예컨대 DMSO의 존재 하에 수행된다. 일부 실시 형태에서, 본 방법은 고체 지지체로부터 복수의 5' 태깅된 표적 단편을 변성시키는 단계를 추가로 포함한다. 일부 실시 형태에서, 변성은 고체 지지체로부터 5' 태깅된 표적 단편을 절단하기에 충분한 열 및/또는 변성제를 적용함으로써 달성될 수 있다. 일부 실시 형태에서, 본 방법은 5' 태깅된 표적 단편 또는 그의 라이게이션 생성물 중 하나 이상을 서열분석하는 단계를 추가로 포함한다. 일부 실시 형태에서, 핵산은 DNA 또는 RNA이다.
일부 태양에서, 그러한 방법은 부착 폴리뉴클레오타이드를 제1 또는 제2 트랜스포존에 혼성화하기에 적합한 조건 하에서, 본 명세서에 기재된 바와 같은 제1 및 제2 트랜스포존을 표면에 결합된 부착 폴리뉴클레오타이드와 접촉시키는 단계를 포함한다. 일부 태양에서, 고체 지지체-결합된 트랜스포좀 복합체의 제조 방법은 결합 요소가 결합 파트너와 (공유적으로 또는 비공유적으로) 결합하기에 충분한 조건 하에서 결합 파트너를 포함하는 고체 지지체와 함께 본 명세서에 기재된 바와 같은 트랜스포좀 복합체를 인큐베이션하는 단계를 포함한다. 이어서, 부착 폴리뉴클레오타이드 및 제1 및 제2 트랜스포존을 포함하는 고정된 혼성화된 폴리뉴클레오타이드는 트랜스포좀 복합체를 형성하기에 적합한 조건 하에서 트랜스포사제와 접촉된다.
일부 실시 형태에서, 본 명세서에 기재된 바와 같은 제1 및 제2 트랜스포존은 서로 어닐링되고, 제1 트랜스포존은 부착 폴리뉴클레오타이드에 어닐링된다. 이어서, 어닐링된 폴리뉴클레오타이드는 Tn5 트랜스포사제와 같은 트랜스포사제 상에 로딩되어, 트랜스포좀 복합체를 형성하고, 이어서 이는 비드와 같은 고체 지지체와 접촉되고 결합된다. 일부 실시 형태에서, 어닐링된 트랜스포존은 비드와 같은 고체 지지체에 결합되고 이어서 트랜스포사제는 트랜스포존과 복합체화되어, 고체 지지체에 결합된 트랜스포좀을 생성한다.
일부 태양에서, 표적 핵산으로부터 단편을 제조하는 방법이 제공되며, 본 방법은 본 명세서에 기재된 바와 같이 상부에 고정된 트랜스포좀 복합체를 포함하는 고체 지지체를 제공하는 단계; 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 표적 핵산을 고체 지지체에 적용하는 단계를 포함한다. 일부 태양에서, 본 방법은 인덱스 서열을 포함하는 인덱스 믹스를 적용하는 단계를 추가로 포함한다. 일부 실시 형태에서, 단편 조건은 트랜스포좀 복합체를 사용하여 표적 핵산을 단편화하고 태깅하는 것에 의한 태그멘테이션에 적합한 조건이다.
본 명세서에 기재된 방법의 일부 실시 형태에서, 단편화 및 태깅 후에, 본 방법은 고체 지지체를 세척하여 미결합 핵산을 제거하는 단계를 추가로 포함한다. 본 명세서에 기재된 방법의 일부 실시 형태에서, 단편화 및 태깅 후에, 본 방법은 트랜스포사제를 제거하는 단계를 추가로 포함한다. 트랜스포사제의 제거는 고체 지지체를 제제로 세척하여 트랜스포사제를 제거하는 것과 같은 화학적 조건 하에서 수행될 수 있다. 일부 실시 형태에서, 제제는 소듐 도데실 설페이트(SDS)이다.
일부 실시 형태에서, 본 방법은 고체 지지체를 인덱스 믹스와 접촉시키는 단계를 추가로 포함한다. 인덱스 믹스와 접촉시키는 단계는 특정 인덱스로 단편을 태깅하고 서열분석을 위한 라이브러리를 활성화시키는 역할을 한다. 일부 실시 형태에서, 인덱스 믹스는 트랜스포존 또는 부착 폴리뉴클레오타이드에 혼성화되어 핵산 단편을 태깅 또는 인덱싱하는 올리고뉴클레오타이드를 포함한다. 따라서, 예를 들어 올리고뉴클레오타이드는 인덱스를 포함하고, 올리고뉴클레오타이드의 다른 영역은 트랜스포존 또는 부착 폴리뉴클레오타이드에 상보적이고 이에 혼성화된다. 예로서, 일 실시 형태에서, 프라이머 서열(P5 서열), 인덱스 서열(i5 서열), 및 앵커 서열을 갖는 i5 인덱스는, P5가 P5'에 혼성화되고 앵커가 앵커'에 혼성화되도록, 상보적 서열에서 부착 폴리뉴클레오타이드에 혼성화된다. 일부 실시 형태에서, i5 서열은 부착 폴리뉴클레오타이드의 나이트로인돌(나이트로) 서열에 결합한다. 일부 실시 형태에서, 나이트로인돌 서열은 임의의 i5 인덱스 서열에 상보적이고 그에 혼성화된다. 일 실시 형태에서, 프라이머 서열(P7), 인덱스 서열(i7), 및 어댑터 서열(B15 서열)을 갖는 i7 인덱스는, P7이 P7'에 혼성화되고, i7이 i7'에 혼성화되고, B15가 B15'에 혼성화되도록, 상보적 서열에서 제2 트랜스포존에 혼성화된다. 일부 실시 형태에서, 인덱스 믹스는 이중 가닥 인덱스를 포함한다. 고체 지지체를 인덱스 믹스와 접촉시킨 후, 연장 및 라이게이션 믹스(ELM)를 사용하여 단편을 라이게이션 및 연장시킨다. ELM은 예를 들어, T4 DNA 폴리머라제 및 대장균 DNA 리가제를 포함할 수 있다. 예시적인 폴리머라제에는 Bst DNA 폴리머라제 I의 Bst 라지(large) 단편, 대장균 DNA 폴리머라제 I(클레노브(Klenow) 단편), 클레노브 단편(3′-5′ 엑소-), T4 DNA 폴리머라제, T7 DNA 폴리머라제, 딥 벤트알(Deep VentR) (엑소-) DNA 폴리머라제, 딥 벤트알 DNA 폴리머라제, 써미네이터(Therminator) II DNA 폴리머라제, 앰플리썸(AmpliTherm) DNA 폴리머라제, SP6 DNA 폴리머라제, 또는 Taq 폴리머라제, 또는 임의의 전술한 폴리머라제의 돌연변이체, 유사체, 또는 유도체가 포함되지만 이에 한정되지 않는다. 예시적인 리가제에는 T4 DNA 리가제, T4 RNA 리가제, Taq DNA 리가제, 대장균 DNA 리가제, Pfu DNA 리가제 및 Tth DNA 리가제가 포함되지만 이에 한정되지 않는다. 일부 실시 형태에서, ELM은 차이 인덱스들의 인덱스 라이게이션 및 인덱스 연장을 허용하여, 예를 들어 별개의 i5 라이게이션 및 i7 연장을 허용하는 스플릿 ELM 반응이다. 이어서, 고체 지지체를 NaOH와 같은, 가닥 서열을 변성시키기 위한 제제로 처리하여, 태깅된 핵산 단편을 생성한다.
일부 실시 형태에서, 단편은 플로우 셀 상에 침착된다. 일부 실시 형태에서, 단편은 플로우 셀 또는 표면에 그래프팅된 상보적 프라이머에 혼성화된다. 일부 실시 형태에서, 서열분석 단편의 서열은 합성에 의한 서열분석(sequencing-by-synthesis)과 같은 어레이 서열분석 또는 차세대 서열분석 방법에 의해 검출된다.
표 1은 태깅된 핵산 단편의 라이브러리를 생성하기 위해 트랜스포좀 복합체에 사용되는 예시적인 서열을 나타낸다.
Figure pct00001
일부 태양에서, 태깅된 핵산 단편의 라이브러리를 생성하는 방법은, 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서, 고정된 트랜스포좀 복합체를 표적 핵산과 접촉시키는 단계; 미결합 핵산을 제거하도록 고체 지지체를 처리하는 단계; 또는 선택적으로 (a) 고체 지지체를 가열하고/하거나 (b) 고체 지지체를 효소 변성제로 세척함으로써, 복합체로부터 트랜스포사제를 제거하도록 고체 지지체를 처리하는 단계 - 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함함 -; 5' 태깅된 표적 단편을 연장 및 라이게이션하여 완전 이중-가닥 태깅된 단편을 생성하도록 복수의 5' 태깅된 표적 단편을 폴리머라제 및 리가제로 처리하는 단계 - 선택적으로 폴리머라제 및 리가제로 처리하는 단계는 DNA 2차 구조 파괴물질의 존재 하에 수행되며, 파괴물질은 선택적으로 DMSO임 -; 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 제거하는 단계 - 선택적으로 제거하는 단계는 고체 지지체로부터 완전 이중-가닥 태깅된 단편을 절단하기에 충분한 열 및/또는 변성제를 적용하는 것을 포함하며, 선택적으로 변성제는 NaOH임 -; 및 포획 비드를 사용하여 완전 이중-가닥 태깅된 단편을 선택하는 단계 - 선택적으로 포획 비드는 자성 비드이고, 추가로 선택적으로 2개의 별개의 선택 단계가 수행됨 - 를 포함한다.
일부 실시 형태에서, 고정된 트랜스포좀 복합체는 고체 지지체; 및 고체 지지체에 고정된 트랜스포좀 복합체를 포함하며, 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포존 말단 서열 및 앵커 서열(앵커)을 포함하는 제1 트랜스포존; 5' 트랜스포존 말단 서열 및 B15' 서열을 포함하는 제2 트랜스포존; 및 앵커 서열 상보체(앵커'), A14' 서열, 스페이서, 및 P5' 서열 그리고 비오틴을 포함하는 결합 요소를 포함하는 부착 폴리뉴클레오타이드를 포함하며, 비오틴은 고체 지지체에 고정된다. 일부 실시 형태에서, 방법은 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함한다.
조합된 태그멘테이션 및 인덱싱에 의해 태깅된 핵산 단편을 생성하는 방법
일부 실시 형태에서, 조합된 태그멘테이션 및 인덱싱 단계를 사용하여 DNA 샘플로부터, 이중-인덱싱된(dual-indexed) 페어드-엔드(paired-end) 라이브러리가 제조될 수 있다. 별도의 태그멘테이션 및 인덱싱 단계를 회피함으로써, 이러한 프로토콜은 사용이 용이하고 지속시간이 짧다는 이점을 갖는다. 또한, 이러한 프로토콜은 변성 단계를 피할 수 있고, 변성된 단일-가닥 샘플로부터 이중-가닥 샘플을 생성하기 위한 별도의 단계가 필요 없이 이중-가닥 라이브러리를 생성할 수 있다. 이러한 프로토콜은 또한 소정의 세척 단계를 피할 수 있어서, 워크플로우에 필요한 시간을 추가로 감소시킨다.
이 방법은 제1 고정된 트랜스포존 복합체 및 제2 고정된 트랜스포존 복합체를 사용한다. 제1 고정된 트랜스포존 복합체에서, 제1 트랜스포존에서의 서열 X는 앵커 서열이고, 부착 폴리뉴클레오타이드에서의 서열 X'는 앵커 서열 상보체이다. 제2 고정된 트랜스포존 복합체에서, 제1 트랜스포존에서의 서열 X는 앵커 서열이고, 부착 폴리뉴클레오타이드에서의 서열 X'는 앵커 서열 상보체이다. 제1 및 제2 고정된 트랜스포존 복합체의 앵커 서열은 교차-혼성화를 피하기 위해 비-상보적일 수 있다. 제1 트랜스포존 복합체는 (i) 앵커 서열 상보체, A14' 서열, 스페이서 및 P5' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 예시적인 제1 부착 폴리뉴클레오타이드를 포함할 수 있고, 제2 트랜스포존 복합체는 (i) 앵커 서열 상보체, B15' 서열, 스페이서 및 P7' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 예시적인 제2 부착 폴리뉴클레오타이드를 포함할 수 있다.
조합된 태그멘테이션 및 인덱싱에서, 제1 및 제2 트랜스포좀 복합체를 포함하는 고체 지지체-연결된 트랜스포좀(BLT, 즉, 고정된 트랜스포존 복합체)의 현탁액을 각 웰에 첨가할 수 있다. 이어서, 인덱스 1(i7) 어댑터, 인덱스 2(i5) 어댑터, 및 태그멘테이션과 동일한 반응 용액 중에서 라이게이션된 서열분석 클러스터 생성에 필요한 서열을 갖는 단일 반응 용액에서 인덱싱 단계를 수행할 수 있다. 제1 인덱싱 올리고뉴클레오타이드는 A14 서열, i5 서열, 및 P5 서열을 포함할 수 있고, 제2 인덱싱 올리고뉴클레오타이드는 B15 서열, i7 서열, 및 P7 서열을 포함할 수 있다. 태그멘테이션/라이게이션 단계를 위한 조건은 표적 DNA, 제1 및 제2 트랜스포좀 복합체, 및 제1 및 제2 인덱싱 올리고뉴클레오타이드의 혼합물에 첨가되는 대장균 DNA 리가제 및 태그멘테이션 완충제를 포함한다. 이러한 결합된 태그멘테이션 및 인덱싱 단계는 다양한 시간, 예를 들어 1분 이상 내지 15분 이상, 또는 5분 이상 내지 15분 이상 동안 진행될 수 있다.
이어서, 태그멘테이션 및 인덱싱 반응은, 고체 지지체를 가열하고/하거나, 효소 변성제로 고체 지지체를 세척하는 것, 예를 들어 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 사용하는 것을 포함하는 다양한 방법을 사용하여 정지될 수 있다. 가열함으로써 및/또는 세척 단계를 통해 반응을 정지시키는 시간은 1분 이상에서 5분 이상까지 다양할 수 있다.
인덱싱 올리고뉴클레오타이드에 라이게이션된 5' 태깅된 표적 단편을 폴리머라제로 처리하여 완전 이중-가닥 태깅된 단편을 연장 및 생성할 수 있다. 연장 반응은 다양한 시간 동안, 예컨대 1분 이상 내지 10분 이상, 또는 2분 이상 내지 10분 이상 동안 진행될 수 있다.
또한, 조합된 태그멘테이션 및 인덱싱을 포함하는 라이브러리 제조는, 최종 생성물이 용액 중의 이중-가닥 DNA 라이브러리이기 때문에, qPCR 단계를 또한 피할 수 있다.
일부 실시 형태에서, 제1 고정된 트랜스포좀 복합체 및 제2 고정된 트랜스포좀 복합체를 접촉시키는 단계 및 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 단계는 단일 반응에서 수행된다.
일부 실시 형태에서, 이중-가닥 태깅된 단편은 용액 중에서 생성된다.
일부 실시 형태는 포획 비드를 사용하여 완전 이중-가닥 태깅된 단편을 선택하는 단계를 추가로 포함하며, 선택적으로 포획 비드는 자성 비드이고, 추가로 선택적으로 2개의 별개의 선택 단계가 수행된다.
일부 실시 형태에서, 본 방법은 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함한다.
표적 핵산
표적 핵산은 DNA, RNA, cDNA 등을 포함하는 임의의 유형일 수 있다. 예를 들어, 표적 핵산은 정제된 핵산을 비롯한, 다양한 정제 상태의 것일 수 있다. 일부 실시 형태에서, 생물학적 샘플은 생체 내에서 발견되는 것과 대략 동일한 비율로 존재하는 핵산(예를 들어, DNA), 단백질, 다른 핵산 종, 다른 세포 성분, 및/또는 임의의 다른 오염물의 혼합물을 포함한다. 예를 들어, 일부 실시 형태에서, 성분들은 온전한 세포에서 발견되는 것과 동일한 비율로 발견된다. 본 명세서에 제공된 방법은 핵산 또는 DNA가 태그멘테이션 공정을 통해 고체 지지체에 결합되게 하기 때문에, 태그멘테이션이 일어난 후에 고체 지지체를 세척함으로써 다른 오염물을 제거할 수 있다. 생물학적 샘플은, 예를 들어 조(crude) 세포 용해물 또는 전세포를 포함할 수 있다. 예를 들어, 본 명세서에 기술된 방법에서 고체 지지체에 적용되는 조 세포 용해물은 다른 세포 성분으로부터 핵산을 단리하는 데 전통적으로 사용되는 하나 이상의 분리 단계를 거칠 필요가 없다.
따라서, 일부 실시형태에서, 생물학적 샘플은 임의의 공급원으로부터 정제된 핵산뿐만 아니라, 예를 들어 혈액, 혈장, 혈청, 림프액, 점액, 객담, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변, 및 침연 조직, 또는 이들의 용해물에서 발견되는 바와 같은 정제되지 않은 핵산, 또는 핵산 또는 DNA 재료를 포함하는 임의의 다른 생물학적 시료를 포함할 수 있다. 표적 핵산은 조직 샘플, 종양 샘플, 암 세포 또는 생검 샘플로부터 유래될 수 있다. 표적 핵산은 무세포 DNA(cfDNA)일 수 있다.
표적 핵산은 임의의 종으로부터, 종들의 혼합물로부터 유래될 수 있다. 예를 들어, 표적 핵산은 포유류(예를 들어, 인간, 개, 고양이, 소, 돼지, 양 또는 다른 가축 동물), 또는 다른 종, 예컨대 어류, 박테리아, 바이러스, 진균, 또는 고세균(archaea)으로부터 유래될 수 있다. 핵산은 환경 샘플, 예를 들어 토양 또는 물로부터 유래될 수 있다.
일부 실시 형태에서, 표적 핵산은 DNA이다. 그러한 일 실시형태에서, DNA는 이중-가닥이다. 일부 추가의 실시 형태에서, 이중-가닥 DNA는 게놈 DNA를 포함한다. 일부 다른 실시형태에서, 표적 핵산은 RNA 또는 이의 유도체, 또는 cDNA이다. 일부 실시 형태에서, 표적 핵산은 상류 반응, 예를 들어 증폭 또는 복제 이벤트의 생성물, 예를 들어 앰플리콘이다. 일부 실시 형태에서, 표적 핵산은 바이설파이트 처리된 DNA이다.
일부 실시 형태에서, 생물학적 샘플(원시 샘플 또는 추출물)은 본 명세서에 기재된 태그멘테이션 방법 전에 표적 핵산을 정제하도록 처리된다. 일부 실시 형태에서, 생물학적 샘플은 원시 샘플 또는 원시 샘플 용해물(예를 들어, 혈액, 타액, 세포 또는 세포들)이다. 일부 실시 형태에서, 처리 방법은 원시 샘플, 원시 샘플 용해물, 또는 전처리된 샘플(예를 들어, 혈액 또는 타액 샘플)을 제공하는 단계, 샘플을 용해 완충제 및 프로테이나제 K와 혼합하는 단계, 혼합물을 인큐베이션하여 샘플 내의 세포를 용해시키고 세포로부터 DNA를 방출시키는 단계를 포함하며, 이에 의해 본 명세서에 기재된 태그멘테이션 방법을 위한 표적 핵산(들)이 제공된다. 생물학적 샘플이 분석을 위해 충분한 핵산을 함유하는 한, 생물학적 샘플의 양은 특별히 요구되지 않는다. 따라서, 생물학적 샘플의 양은 약 1㎕ 내지 약 500㎕, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80 90, 100, 150, 200, 250, 300, 350, 400, 450, 또는 500㎕, 또는 전술한 값들 중 임의의 2개의 값에 의해 한정되는 범위 내의 양을 포함할 수 있다.
혈액과 같은 원시 샘플 또는 원시 샘플 용해물의 성분, 또는 오라진(Oragene) 수집 튜브에 수집된 타액과 같은 전처리된 샘플 내의 첨가제(수집 튜브 내의 안정화제)가 태그멘테이션 반응을 억제할 수 있다. 따라서, 이러한 문제를 극복하기 위해 원시 샘플, 원시 샘플 용해물, 또는 전처리된 샘플을 처리하기 위한 방법이 본 명세서에 제공된다. 일부 실시 형태에서, 본 방법은 원시 샘플, 원시 샘플 용해물, 또는 전처리된 샘플(예를 들어, 혈액 또는 타액 샘플)을 제공하는 단계, 샘플을 용해 완충제, 프로테이나제 K, 및 DNA 포획 또는 정제 비드(예를 들어, SPRI 비드, 비드가 선택적으로 자성 비드인 경우, 카르복실 기를 포함하는 비드)와 혼합하는 단계, 혼합물을 인큐베이션하여 샘플 내의 세포를 용해시키고 세포로부터 DNA를 방출시키는 단계, 이에 의해 DNA 정제 또는 SPRI 비드에서 DNA를 포획하는 단계, 및 포획된 DNA를 포함하는 비드를 혼합물로부터 분리하는 단계를 포함한다. 분리하는 단계는 상청액에 존재하는 잠재적인 태그멘테이션 억제제를 제거하는 역할을 한다. 본 방법은 선택적으로, 포획된 DNA를 포함하는 비드를 세척하는 단계, 및 비드로부터 DNA를 용출시켜 표적 핵산(들)을 제공하는 단계를 추가로 포함한다.
일부 실시 형태에서, 표적 핵산은 서열분석을 위한 라이브러리를 생성하기에 충분한 양으로 존재한다. 일부 실시 형태에서, 표적 핵산의 양은 10 내지 500 ng, 예컨대 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 또는 500 ng의 gDNA의 양, 또는 전술한 값들 중 임의의 2개의 값에 의해 한정되는 범위 내의 양이다. 일부 실시 형태에서, 표적 핵산은 50 ng의 양으로 존재하는 gDNA이다.
서열분석 방법
본 명세서에 제공된 방법들 중 일부는 핵산을 분석하는 방법을 포함한다. 그러한 방법은 표적 핵산의 주형 핵산의 라이브러리를 제조하는 단계, 주형 핵산의 라이브러리로부터 서열 데이터를 얻는 단계, 및 선택적으로 표적 핵산의 서열 표현을 조립하는 단계를 포함한다. 트랜스포좀 매개 태그멘테이션에 의해 생성된 DNA 단편은 직접 서열분석, 또는 합성에 의한 서열분석, 라이게이션에 의한 서열분석, 혼성화에 의한 서열분석, 이온 토렌트(Ion Torrent)(미국 코네티컷주 길포드 소재의 라이프 테크놀로지스(Life Technologies)의 자회사)로부터 구매가능한 전기 검출기 및 관련 기술을 사용할 수 있는 방출된 양성자의 검출에 기초한 서열분석, 나노기공 서열분석(nanopore sequencing) 등을 포함하는 차세대 서열분석과 같은 임의의 적합한 서열분석 방법론에 따라 서열분석될 수 있다. 일부 형태에서, DNA 단편은 플로우 셀과 같은 고체 지지체 상에서 서열분석된다. 본 발명의 방법에 의해 생성된 핵산 라이브러리와 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 SBS 절차, 유체 시스템, 및 검출 플랫폼이, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제 특허 공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제 특허 공개 WO 91/06678호; 국제 특허 공개 WO 07/123744호; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호, 및 미국 특허 출원 공개 제2008/0108082호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
본 명세서에 기재된 방법은 사용되는 임의의 특정 유형의 서열분석 기기에 한정되지 않는다.
실시예
하기 실시예는 본 명세서에 제공된 본 발명을 기술하지만 제한하는 것은 아니다.
실시예 1: 사용자 절단가능한 링커를 갖는 부착 올리고뉴클레오타이드 없음
PCR 서열분석 데이터와 PCR-프리 서열분석 데이터를 비교하기 위하여 실험을 수행하였다. TruSeq PCR-프리, TruSeq 나노(+PCR), 넥스테라 플렉스(+PCR), 및 본 발명의 방법을 사용하여 라이브러리를 제조한 다음, 25X 커버리지로 서열분석하였다. 각각의 방법에 대해 2개의 복제물이 있었으며, 총 8개의 라이브러리가 있었다. 도 7a는 PCR-프리 방법(각각 본 발명의 방법 및 TruSeq PCR-프리를 나타내는, 줄무늬 막대 및 체크무늬 막대)이 PCR을 사용한 방법(각각 TruSeq 나노 및 넥스테라 플렉스를 나타내는, 흑색 막대 및 백색 막대)과 비교하여 개선된 인델 정밀도 및 리콜을 갖는다는 것을 보여준다. 도 7b는 GC-풍부 프로모터 영역의 커버리지가 PCR-프리 방법(하부 2개의 패널, 하부 좌측 패널은 본 발명의 방법이고 하부 우측 패널은 TruSeq PCR-프리임)에서도 개선됨을 보여준다.
실시예 2: PCR 증폭을 사용하지 않고서 태깅된 핵산 단편의 라이브러리를 생성
단계 A1. 고정된 트랜스포좀 복합체 - 인덱싱된 비드의 형성. (1) 3' 모자이크 말단(ME) 서열(서열 번호 6), 제1 태그 서열(A14), 및 5' 프라이머 서열(P5')을 갖는 제1 트랜스포존(최종 농도 25 μM); (2) 5' 상보적 모자이크 말단 서열(ME'; 서열 번호 3) 및 제2 태그 서열(B15')을 갖는 제2 트랜스포존 (최종 농도 37.5 μM); 및 (3) 제2 태그 서열에 상보적인 3' 서열(B15), 인덱스 서열(이 경우, 표 1의 i701), 및 5' 말단에 비오틴을 갖는 5' 프라이머 서열(P7) (최종 농도 25 μM)을 포함하는 부착 폴리뉴클레오타이드의 혼합물을, 10 mM Tris-HCl(pH 8.0), 1 mM EDTA 및 25 mM NaCl로 처리하고, 95℃에서 10분 동안 가열한 다음, 약 15분에 걸쳐 10℃로 냉각함으로써 어닐링하였다. 이어서, 어닐링된 트랜스포존/부착 폴리뉴클레오타이드(부착 폴리뉴클레오타이드를 기준으로 최종 농도 2 μM)를 트랜스포사제 효소(최종 농도 6.1 μM)와 혼합하고 37℃에서 하룻밤 인큐베이션하여 용액-상 트랜스포좀 복합체를 형성하였다(도 4a, 인덱싱된 비드 도면). 이어서, 용액-상 트랜스포좀 복합체를 스트렙타비딘-코팅된 비드와 혼합함으로써 고체 지지체 상에 고정시켰다. 일부 예에서, 고정화는 비오틴-스트렙타비딘 결합의 형성을 돕는 고 염 완충제인 HT1 완충제(일루미나)의 존재 하에 수행될 수 있다. HT1에서 1시간 동안 회전시킨 후, 비드를 펠렛화하고, HT1 완충제와 50% 글리세롤 표준 저장 완충제(일루미나)(9:1)의 혼합물 중에서 1회 세척하였다. 이어서, 50 mM Tris pH 7.5, 30 mM NaCl, 및 0.1% 트윈(Tween) 20을 함유하는 완충제 360㎕ 중에 비드를 재현탁시켰다. 40㎕의 EPX2(일루미나)를 첨가하고 비드를 추가로 10분 동안 실온에서 회전시켰다. 비드를 다시 펠렛화한 다음, 396㎕의 동일한 완충제 중에 재현탁시키고, 4㎕의 단일-가닥 결합 단백질(5 mg/㎖)로 처리하고, 다시 10분 동안 회전시켰다. 비드를 다시 펠렛화하고, 9:1 HT1:표준 저장 완충제 혼합물로 1회 세척하고, 15% 글리세롤 표준 저장 완충제(일루미나) 중에 재현탁시켰다. 생성된 인덱싱된 비드를 단일 인덱싱 및 이중 인덱싱 태그멘테이션 프로토콜에서 사용하였다.
단계 A2. 고정된 트랜스포좀 복합체 - 유니버설 비드의 형성 부착 폴리뉴클레오타이드가 제1 태그 서열에 상보적인 5' 서열(A14') 및 3' 말단에 비오틴을 갖는 3' 프라이머 서열(P5')(단일 인덱싱의 경우), 및 선택적으로 개재 유니버설 나이트로인돌 서열(이중 인덱싱의 경우)을 포함하는 것을 제외하고는, 단계 A1에 기재된 바와 같이 어닐링된 트랜스포존을 제조하였다. 어닐링된 트랜스포존으로부터 트랜스포좀 복합체를 제조하고, 단계 A1에 대해 기재된 바와 같이 고체 지지체 상에 고정시켰다. 생성된 유니버설 비드를 지시된 바와 같이 단일 인덱싱 및 이중 인덱싱 태그멘테이션 프로토콜에서 사용하였다.
단계 B. 태그멘테이션. DNA(예를 들어, 약 50 pg 내지 5 ㎍)를 고정된 트랜스포좀 복합체 및 50㎕의 태그멘테이션 완충제(각각이 참고로 포함된 미국 특허 제9,080,211호, 제9,085,801호, 및 제9,115,396호에 기재된 바와 같이, 10 mM Tris 아세테이트(pH 7.6), 5 mM 마그네슘 아세테이트, 및 10% 다이메틸포름아미드)와 혼합하고, 생성된 혼합물을 55℃에서 5분 동안 인큐베이션하였다. 비드 상에 고정된 태깅된 DNA 단편의 라이브러리를 생성하였다. 태그멘테이션 반응 혼합물을, 5% SDS, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 포함하는 10㎕의 정지 완충제로 처리하고, 생성된 혼합물을 37℃에서 5분 동안 인큐베이션하여 트랜스포좀 복합체로부터 트랜스포사제 효소를 변성시켰다. 이어서, 고정된 DNA 단편을 갖는 비드를 자석 상에서 펠렛화하고 세척 완충제(100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈) 중에서 3회 세척하여 임의의 잔류 SDS를 제거하였다. 비드를 자성 포획에 의해 상청액으로부터 분리하고, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 사용하여 추가로 세척하였다. 4가지 접근법 모두에 대해 생성된 태그멘테이션된 단편이 도 4b에 도시되어 있다.
단계 C. 연장, 라이게이션, 및 인덱싱. 비드를, T4 DNA 폴리머라제(엑소뉴클레아제 마이너스) 및 대장균 DNA 리가제를 포함하는 연장 및 라이게이션 믹스(ELM)와 접촉시키고 30℃에서 15분 동안, 이어서 16℃에서 15분 동안 인큐베이션함으로써 연장 및 라이게이션을 수행하고, 이에 의해 단편의 3' 말단과 ME' 서열의 5' 말단 사이의 DNA 단편의 갭을 충전하고 단일-가닥 영역을 연장시켜, 부착 폴리뉴클레오타이드로부터의 나머지 서열을 포함시킴으로써 완전 이중-가닥 생성물을 생성하였다(도 4c). 특정 경우에, 이 단계 동안 인덱스가 또한 추가되었다. 도 4d의 상부 우측 도에 도시된 바와 같이, 이중-가닥 프라이머 서열(P7/P7'), 이중-가닥 인덱스 서열(이 경우에, i701/i701'), 및 제2 태그 서열에 상보적인 3' 서열(B15)을 갖는 단일-가닥 오버행 영역을 갖는 올리고뉴클레오타이드를 첨가함으로써 유니버설 비드/단일 인덱스 구조물에 인덱스를 첨가하였다. 인덱싱된 비드/이중 인덱싱 접근법(도 4d, 하부 좌측 도)의 경우, 인덱스 시약은 이중-가닥 프라이머 서열(P5/P5'), 이중-가닥 인덱스 서열(이 경우에, i501/i501'), 및 제1 서열 태그에 상보적인 5' 서열(A14')을 갖는 단일 가닥 오버행 영역을 포함하였다. 유니버설 비드/이중 인덱싱 접근법(도 4d, 하단 우측 도)의 경우, 인덱스 시약은 유니버설 비드/단일 인덱스에 대한 것과 동일하였지만, 상보적 프라이머 서열(P5) 및 인덱스 서열(i5)을 포함하는 추가의 제2 인덱스 시약을 A14 서열의 5' 말단에 혼성화하고 라이게이션시켰다.
반응 혼합물을, 5% SDS, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 포함하는 10㎕의 정지 완충제로 처리하였고, 생성된 혼합물을 37℃에서 5분 동안 인큐베이션하여 트랜스포좀 복합체로부터 트랜스포사제 효소를 변성시켰다. 이어서, 고정된 DNA 단편을 갖는 비드를 자석 상에서 펠렛화하고 세척 완충제(100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈) 중에서 3회 세척하여 임의의 잔류 SDS를 제거하였다. 비드를 자성 포획에 의해 상청액으로부터 분리하고, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 사용하여 추가로 세척하였다.
단계 D. 태깅된 단편의 방출. 세 번째 세척 후에, 100㎕의 0.2 N NaOH 중에 비드를 재현탁시켜 라이브러리 단편을 변성시키고 비드로부터 방출시켰다. 표준 SPRI 정제 프로토콜에 따라, 100㎕의 상청액을 180㎕의 SPRI 비드에 직접 첨가하고 15㎕의 일루미나 재현탁 완충제 중에서 용출시킴으로써 라이브러리를 정제하였다. 라이브러리를 qPCR에 의해 정량화한 다음, 약 3200 pM의 5㎕로 희석하고 실온에서 5분 동안 5㎕의 0.2 N NaOH로 변성시킴으로써 MiSeq(등록상표)에서의 서열분석을 위해 준비하였다. 냉각된 일루미나 HT1 완충제(990㎕)를 첨가하고, 전체 1㎖ 혼합물을 MiSeq(등록상표) 카트리지 내에 로딩하였다.
단일 또는 이중 인덱싱을 갖는 인덱싱된 비드 또는 유니버설 비드에 대해, 결과가 도 4e에 나타나 있으며 하기 표 2에 요약되어 있다.
Figure pct00002
본 명세서에 기재된 방법을 사용하여, PCR에 의해 전형적으로 도입되는 서열분석 데이터에서의 편향이 극복되었다. 예를 들어, 본 명세서에 기재된 PCR-프리 방법을 사용하여, 핵산 단편의 생성된 라이브러리를 서열분석하였고, 서열은 PCR이 사용될 때 전형적으로 관찰되는 바와 같은 GC 풍부 영역에서의 상당한 갭을 갖지 않았다.
실시예 3: 시험 라이브러리의 서열분석 비교
본 실시예에서는, 넥스테라™ DNA 플렉스(PCR을 포함함) 및 TruSeq™ PCR-프리 라이브러리 제조 키트를 사용하여, 공지된 100% GC 반복 확장(FMR1)을 함유하는 샘플로부터 2개의 비교 라이브러리를 제조하였고, 도 4d에 나타나 있는 바와 같이, 유니버설 비드/이중 인덱싱 방법을 사용하여 본 명세서에 기재된 바와 같이 4개의 시험 라이브러리를 제조하였다. 도 8에 나타나 있는 바와 같이, 넥스테라™ DNA 플렉스를 사용하여 제조된 라이브러리로부터의 서열분석 데이터에서는 반복이 호출되지 않았다(첫 번째 컬럼, 결과가 0이어서 바가 표시되지 않음). TruSeq™ PCR-프리(컬럼 2) 및 본 명세서에 기재된 방법을 사용한 4개의 시험 라이브러리(샘플 1 내지 샘플 4, 컬럼 3 내지 컬럼 6)를 사용하여 반복을 호출하였다. 따라서, 본 발명의 방법은 100% GC 영역을 갖는 반복 확장 샘플의 개선된 호출을 나타낸다.
실시예 4: 절단가능한 링커를 갖는 포크형(forked) 올리고뉴클레오타이드
단계 1. 트랜스포좀 복합체의 형성. 5' 비오틴, 3개의 T 잔기, 이어서 3개의 U 잔기, P5, A14, 및 Me를 포함하고, 서열: /5Biosg/TTUUUAATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAGACA (서열 번호 20)을 갖는 비오티닐화된 올리고뉴클레오타이드(50 μM)
및 ME'_B15'_P7' (75 μM)을 포함하고 서열: CTGTCTCTTATACACATCTCCGAGCCCACGAGACATCTCGTATGCCGTCTTCTGCTTG (서열 번호 21)을 갖는 올리고뉴클레오타이드
를 10 mM Tris-HCl(pH 8.0), 1 mM EDTA, 및 25 mM NaCl로 처리하고, 10분 동안 95℃로 가열하고, 이어서 초당 -0.1℃로 10℃로 냉각하였다. 이어서, 어닐링된 트랜스포존을 트랜스포사제 효소와 혼합하여 비오티닐화된 올리고의 최종 농도가 2 μM이 되고 트랜스포사제 농도가 4 μM이 되도록 하였다. 혼합물을 37℃에서 하룻밤 인큐베이션하여 용액-상 트랜스포좀 복합체를 형성하였다. 이어서, 용액-상 트랜스포좀 복합체를 스트렙타비딘-코팅된 비드 및 HT1 완충제(일루미나)와 혼합하고 실온에서 1시간 동안 회전시킴으로써 고체 지지체 상에 고정시켰다. 이어서, 비드를 HT1 완충제 중에서 3회 세척한 후에 15% 글리세롤 표준 저장 완충제(일루미나) 중에 재현탁시켰다(도 2a).
단계 2. 태그멘테이션. DNA(예를 들어, 약 50 pg 내지 5 ㎍)를 고정된 트랜스포좀 복합체 및 50㎕의 태그멘테이션 완충제(각각이 참고로 포함된 미국 특허 제9,080,211호, 제9,085,801호, 및 제9,115,396호에 기재된 바와 같이, 10 mM Tris 아세테이트(pH 7.6), 5 mM 마그네슘 아세테이트, 및 10% 다이메틸포름아미드)와 혼합하고, 생성된 혼합물을 55℃에서 5분 동안 인큐베이션하였다. 비드 상에 고정된 태깅된 DNA 단편의 라이브러리를 생성하였다. 태그멘테이션 반응 혼합물을, 5% SDS, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 포함하는 10㎕의 정지 완충제로 처리하고, 생성된 혼합물을 37℃에서 5분 동안 인큐베이션하여 트랜스포좀 복합체로부터 트랜스포사제 효소를 변성시켰다. 이어서, 고정된 DNA 단편을 갖는 비드를 자석 상에서 펠렛화하고 세척 완충제(100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈) 중에서 3회 세척하여 임의의 잔류 SDS를 제거하였다. 비드를 자성 포획에 의해 상청액으로부터 분리하고, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 사용하여 추가로 세척하였다.
단계 3. 연장 및 라이게이션. 비드를, T4 DNA 폴리머라제(엑소뉴클레아제 마이너스) 및 대장균 DNA 리가제를 포함하는 연장 및 라이게이션 믹스(ELM)와 접촉시키고 30℃에서 15분 동안, 이어서 16℃에서 15분 동안 인큐베이션함으로써 연장 및 라이게이션을 수행하고, 이에 의해 단편의 3' 말단과 ME' 서열의 5' 말단 사이의 DNA 단편의 갭을 충전하였다. 반응 혼합물을, 5% SDS, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 포함하는 10㎕의 세척 완충제로 처리하였고, 생성된 혼합물을 37℃에서 5분 동안 인큐베이션하여 트랜스포좀 복합체로부터 트랜스포사제 효소를 변성시켰다. 이어서, 고정된 DNA 단편을 갖는 비드를 자석 상에서 펠렛화하고 세척 완충제(100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈) 중에서 3회 세척하여 임의의 잔류 SDS를 제거하였다. 비드를 자성 포획에 의해 상청액으로부터 분리하고, 100 mM Tris-HCl(pH 7.5), 100 mM NaCl, 및 0.1% 트윈 20을 사용하여 추가로 세척하였다.
단계 4. 태깅된 단편의 방출. 세 번째 세척 후에, 50 mM 포타슘 아세테이트, 20 mM Tris-아세테이트, 10 mM 마그네슘 아세테이트, 및 100 ㎍/㎖ BSA를 함유하는 완충제 중에 비드를 재현탁시켰다. 우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII을 함유하는 효소 혼합물 5㎕을 첨가하고, 라이브러리를 37℃에서 30 분 동안 인큐베이션하였다. 효소들은 함께 작용하여 부착 올리고뉴클레오타이드에서 U'를 절단하고 라이브러리 단편을 용액 내로 방출시켰다. 표준 크기 선택 SPRI 정제 프로토콜(0.5x 우측 및 0.7 내지 0.8x 좌측)에 따라, 100㎕의 상청액을 SPRI 비드에 직접 첨가하고, 15㎕의 일루미나 재현탁 완충제 중에서 용출시킴으로써 라이브러리를 정제하였다. 생성된 라이브러리를 qPCR에 의해 정량화하였다(도 2b).
실시예 5: 변형된 연장-라이게이션 프로토콜
인덱싱된 변형 연장-라이게이션 반응(실시예 2C)에 대한 대안적인 프로토콜이 사용될 수 있다. 일부 경우에, i7 인덱스의 연장은 특정 인덱스 서열에서의 2차 구조로 인해 비효율적이다. 따라서, 도 6c의 구조물의 경우, 8개의 상이한 인덱스 쌍을 조사하였다. 도 9a에 나타나 있는 바와 같이, 인덱스 풀의 %CV는 76%였다. 연장-인덱싱 반응 동안 P7' 올리고뉴클레오타이드의 첨가는, 아마도 2차 구조 형성을 방해하거나 방지할 수 있는 P7 서열에 대한 혼성화로 인해, 특정 인덱스 쌍의 성능을 향상시킨다는 것이 발견되었다. 이러한 경우에, 연장-인덱싱 반응은 또한 라이게이션을 포함한다. (라이게이션을 위한 5' 포스페이트를 갖는) P7'을 연장-라이게이션-인덱싱 반응 동안 2.5 μM로 첨가하였다. 도 6d에 도시된 구조물의 경우, 도 9b는 8개의 인덱스 쌍에 대해 30% 미만의 %CV를 나타낸다.
P7' 올리고 연장-라이게이션-인덱싱 반응에 대한 DMSO의 첨가는 %CV를 추가로 개선한다. 본 실시예에서, 도 6d의 구조물의 경우, 연장-라이게이션-인덱싱 반응에 DMSO를 5%로 첨가한다. 연장-라이게이션 반응은 연장 및 라이게이션에 필요한 모든 효소 및 성분을 포함한다. 정상적으로 워크플로우를 진행하기 전에 반응물을 37℃에서 30분 동안 인큐베이션한다. 도 9c에 나타나 있는 바와 같이, 8개의 상이한 인덱스 쌍에 대한 %CV는 20% 미만이었다. 이 결과를 통해 각 샘플에 대한 라이브러리로부터의 DNA 출력을 정량화하지 않고도 시스템을 사용하여 인덱싱 성능의 변화를 조정할 수 있다.
실시예 6: 튜브 내 PCR 프리 고정 트랜스포좀
본 실시예는 PCR 프리 전장 게놈 서열분석을 위해, PCR 튜브와 같은 튜브에서 트랜스포좀 복합체를 고정하는 방법 및 시스템을 나타낸다. 본 방법은 실시예 2에 기재된 방법과 유사하게 수행되며, 동일한 튜브에서 전체 제조가 수행될 수 있다.
튜브에서의 고정된 트랜스포좀 복합체의 형성 (1) 3' 모자이크 말단(ME) 서열(서열 번호 6), 제1 태그 서열(A14), 및 5' 프라이머 서열(P5)을 갖는 제1 트랜스포존 (최종 농도 25 μM); (2) 5' 상보적 모자이크 말단 서열(ME'; 서열 번호 3) 및 제2 태그 서열(B15')을 갖는 제2 트랜스포존 (최종 농도 37.5 μM); 및 (3) 제2 태그 서열에 상보적인 3' 서열(B15), 인덱스 서열, 및 5' 말단에 비오틴을 갖는 5' 프라이머 서열(P7) (최종 농도 25 μM)을 포함하는 부착 폴리뉴클레오타이드의 혼합물을, 10 mM Tris-HCl (pH 8.0), 1 mM EDTA 및 25 mM NaCl로 처리하고, 95℃에서 10분 동안 가열한 다음, 약 15분에 걸쳐 10℃로 냉각하여 어닐링하였다. 부착 폴리뉴클레오타이드는 제1 태그 서열에 상보적인 5' 서열(A14') 및 3' 말단에 비오틴을 갖는 3' 프라이머 서열(P5')(단일 인덱싱의 경우)을 포함하였다. 일부 실시 형태에서, 부착 폴리뉴클레오타이드는 개재 유니버설 나이트로인돌 서열(이중 인덱싱의 경우)을 포함하였다. 이어서, 어닐링된 트랜스포존/부착 폴리뉴클레오타이드(부착 폴리뉴클레오타이드를 기준으로 최종 농도 2 μM)를 트랜스포사제 효소(최종 농도 6.1 μM)와 혼합하고, 37℃에서 하룻밤 인큐베이션하여 용액-상 트랜스포좀 복합체를 형성하였다. 이어서, 스트렙타비딘-코팅된 표면을 갖는 PCR 튜브 내에서 (비오틴을 갖는) 용액-상 트랜스포좀 복합체를 혼합하여 PCR 튜브의 표면 상에 복합체를 고정시켰다. 일부 예에서, 고정화는 비오틴-스트렙타비딘 결합의 형성을 돕는 고 염 완충제인 HT1 완충제(미국 캘리포니아주 샌디에고 소재의 일루미나)의 존재 하에 수행될 수 있다. 1시간 동안 인큐베이션 후, PCR 튜브를 TWB 완충제(미국 캘리포니아주 샌디에고 소재의 일루미나)의 혼합물로 세척하였다. 트랜스포좀이 상부에 고정되어 있는 생성된 튜브를 단일 인덱싱 및 이중 인덱싱 태그멘테이션 프로토콜에 사용하였다.
태그멘테이션, 연장, 라이게이션, 및 인덱싱의 단계들을 포함하는 라이브러리 제조 워크플로우를 실시예 2에 요약된 바와 같이 수행하였다. 실시예 2에 요약된 바와 같은 단계의 완료 후에, 튜브의 표면에 고정된 라이브러리 단편이 생성되었다. 튜브를 50㎕의 0.2 N NaOH로 헹구어 라이브러리 단편을 변성시키고 튜브의 표면으로부터 방출시켰다. 라이브러리를 qPCR에 의해 정량화한 다음, 약 3200 pM의 5㎕로 희석하고 실온에서 5분 동안 5㎕의 0.2 N NaOH로 변성시킴으로써 MiSeq(등록상표)에서의 서열분석을 위해 준비하였다. 냉각된 일루미나 HT1 완충제(990㎕)를 첨가하고, 전체 1㎖ 혼합물을 MiSeq(등록상표) 카트리지 내에 로딩하였다.
서열분석의 결과가 도 10에 나타나 있으며, 이는 서열분석이 어려운 것으로 알려진 게놈 영역(유전자 RNPEPL1)에서의 커버리지를 나타낸다. PCR을 이용한 두 가지 라이브러리 제조 방법(넥스테라 플렉스 및 튜브-기반 넥스테라)은, 직사각형 경계 박스로 표시된, 유전자의 영역을 커버하는 서열이 없는 갭을 나타낸다. 두 가지 PCR-프리 방법은 도 10에 "PCR-프리 플렉스" 및 "PCR-프리 튜브-기반 넥스테라"로 표시된 섹션들에 의해 나타나는 바와 같이 이 영역에서 우수한 커버리지를 갖는 것으로 밝혀졌다.
실시예 7: 절단가능한 링커가 없는 PCR-프리 제조
하기 실시예는 PCR 프리 전장 게놈 서열분석을 위해, PCR 튜브와 같은 튜브에서 트랜스포좀 복합체를 고정하는 방법 및 시스템을 나타낸다. 본 방법은 실시예 2에 기재된 방법과 유사하게 수행되지만, 절단가능한 링커를 포함하는 부착 뉴클레오타이드 또는 링커를 절단하는 단계 없이 수행된다. 이 방법은 3개의 별개의 올리고뉴클레오타이드를 이용한다. 본 방법의 추가 구성요소는 Tn5 트랜스포존, SDS, 연장-라이게이션 믹스(ELM), 및 스트렙타비딘-코팅된 표면(예를 들어, 비드 또는 플레이트)을 포함한다.
(1) ME 서열, 제1 태그 서열(A14), i5 서열, 및 5' 프라이머 서열(P5)을 갖는 제1 트랜스포존; (2) 5' 상보적 모자이크 말단 서열(ME'), 제2 태그(B15'), i7' 서열, 및 3' 프라이머 서열(P7')을 갖는 제2 트랜스포존; 및 (3) P7 서열 및 결합 요소(예를 들어, 비오틴)를 포함하는 부착 폴리뉴클레오타이드의 혼합물을 제조하여 표면(예를 들어, 스트렙타비딘-코팅된 플레이트 또는 비드)에 부착시킬 수 있다. 트랜스포좀을 태그멘테이션 완충제 내에서 주형 핵산의 존재 하에 단일 단계로 구축하고 표면에 부착할 수 있다.
55℃에서 5분 동안 태그멘테이션을 수행한다. PEG가 태그멘테이션 반응에 포함될 수 있다. 혼합물을 SDS로 처리하여 Tn5 트랜스포사제를 제거한다. ELM을 수행하고 상청액을 제거한다. 이 방법에는 SPRI 포획 비드가 필요하지 않으며, 따라서 비드-로딩 밀도를 통해 삽입체 크기를 조정할 필요가 없다. 서열분석 준비를 위해 단편을 NaOH 중에서 용출시킬 수 있다.
실시예 8: 96-웰 라이브러리의 PCR-프리 제조
하기 실시예는 DNA 샘플로부터 최대 96개의 이중-인덱싱된 페어드-엔드 라이브러리를 제조하기 위한 방법 및 시스템을 나타낸다. 본 방법은 실시예 2에 기재된 방법과 유사하게 수행되지만, 최종 qPCR 단계 없이 제조할 수 있도록 포획 비드와 함께 2 단계의 인큐베이션을 사용한다. qPCR은 시간 소모적일 수 있기 때문에(최대 2시간), 이 프로토콜은 사용이 간편하고 지속시간이 더 짧다는 장점이 있다. 이 방법은 25 내지 1000 ng의 DNA 투입과 상용성이 있었다. 인간 DNA 샘플 및 다른 큰 복합체 게놈의 경우, DNA 투입은 200 ng 초과일 수 있다. 200 내지 1000 ng의 DNA 투입의 경우, 초기 DNA 샘플의 정량화 및 정규화가 필요하지 않다. 25 내지 200 ng DNA 투입의 경우, 서열분석 전에 라이브러리를 정량화 및 정규화한다.
이 방법은 도 6d에 기재된 바와 같은 제1 트랜스포존을 사용하며, 제1 트랜스포존에서의 서열 X는 ATCTGACTATCCCCTGCG (서열 번호 23)이고, 부착 폴리뉴클레오타이드에서의 서열 X'는 CGCAGGGGATAGTCAGAT (서열 번호 24)이다. 앵커 서열은 A14이고, 스페이서 영역은 2개의 C18 및 1개의 C9 탄소 스페이서(비-DNA 서열)로 구성된다.
태그멘테이션. 10 mM Tris-HCl(약 2 내지 30㎕) 중의 DNA를, 총 투입량(ng)이 원하는 범위 내에 있도록 96-웰 PCR 플레이트의 각각의 웰에 첨가한다. DNA 부피가 30㎕ 미만인 경우, DNA 샘플에 뉴클레아제-무함유 물을 첨가하여 총 부피를 30㎕로 만든다. 비드-연결된 트랜스포좀(BLT)(10㎕)의 현탁액을 각각의 웰에 첨가하고, 이어서 10㎕의 태그멘테이션 완충제를 첨가한다. BLT를 약 50 내지 1000 nM의 농도로 비드 상에 로딩한다. 이를 15% 글리세롤, 100 mM NaCl, 50 mM Tris HCl pH 7.5, 0.1 mM EDTA, 1 mM DTT, 0.1% 트리톤 X-100으로 이루어진 15% 글리세롤 표준 저장 완충제 중에 재현탁시킨다. 비드가 완전히 재현탁될 때까지 샘플을 피펫팅하여 혼합하고, 플레이트를 밀봉하고, 열순환기(thermal cycler) 상에 41℃에서 5분 동안 두고, 이어서 10℃에서 유지한다. 15, 30, 45, 60, 75, 90, 105, 120, 및 300초의 태그멘테이션 시간은 유사한 수율을 제공하는데, 더 짧은 인큐베이션 시간에 대해 더 긴 삽입체 길이로 변화한다(예를 들어, 15초는 60, 120, 또는 300초보다 더 긴 삽입체 크기를 생성하였다). 일부 예에서, 태그멘테이션 시간은 1분으로 감소된다.
각각의 웰에 SDS를 포함하는 10㎕의 정지 태그멘테이션 완충제를 첨가하고, 생성된 혼합물을 비드가 완전히 재현탁될 때까지 피펫팅하고, 혼합물을 1 내지 5분 동안 인큐베이션한다. 플레이트를 2 내지 5분 동안 자성 스탠드 상에 놓고, 상청액을 제거하고 폐기한다. 플레이트를 자석으로부터 제거하고, 150㎕의 태그멘테이션 세척 완충제를 각각의 웰 내의 비드 상에 직접 첨가한다. 샘플을 피펫으로 혼합하고, 용액이 투명해질 때까지 플레이트를 자성 스탠드 상에 둔다(대략 2 내지 5분). 이 단계는 샘플로부터 SDS를 제거하였다.
연장/라이게이션. 인덱스 1(i7) 어댑터, 인덱스 2(i5) 어댑터, 및 서열분석 클러스터 생성에 필요한 서열을 연장/라이게이션에 의해 첨가한다. 플레이트가 여전히 자성 스탠드 상에 있는 동안, 상청액을 제거하고 폐기한다. 플레이트를 자성 스탠드로부터 제거하고, 45㎕의 연장 라이게이션 믹스를 각각의 웰에 첨가하고, 이어서 피펫팅하여 비드를 재현탁시킨다. 다음으로, 적절한 인덱스 어댑터(5㎕)를 각각의 샘플에 첨가하고, 플레이트를 밀봉하고, 열순환기 상에 37℃에서 5분 동안, 50℃에서 5분 동안 두고, 이어서 10℃에서 유지한다. 37℃ 및 50℃ 인큐베이션 기간은 각각 1, 3, 또는 5분으로 수행될 수 있으며, 모든 변형이 유사한 라이브러리 수율을 생성한다. 인큐베이션 기간이 짧을수록 증가된 단편 크기를 갖는 라이브러리가 생성되는 반면, 인큐베이션 기간이 길수록 라이게이션 생성물의 농도가 높아진다. 이어서, 플레이트를 2 내지 5분 동안 자성 스탠드 상에 두고, 이어서 상청액을 제거한다.
웰에 75㎕의 태그멘테이션 세척 완충제를 첨가하고, 혼합물을 피펫팅하여 태그멘테이션 비드를 재현탁시킨다. 상청액을 폐기하고, 플레이트를 스핀 다운하고 2 내지 5분 동안 자석 상에 둔다. 각각의 웰에 45㎕의 0.2 N NaOH를 첨가하여 단편을 변성시킨다. 각 웰 내의 혼합물을 피펫팅하여 태그멘테이션 비드를 재현탁시키고, 플레이트를 실온에서 1 내지 5분 동안 인큐베이션한다.
라이브러리 클린-업 각각의 웰에 36㎕의 포획 비드(예를 들어, 앰퓨어(Ampure) XP 비드)를 첨가하고, 웰 내용물을 혼합하여 비드를 재현탁시킨 다음, 1, 3, 또는 5분 동안 인큐베이션한다. 상청액이 투명해질 때까지 플레이트를 대략 1 내지 5분 동안 자성 스탠드 상에 둔다.
제2 96-웰 플레이트의 각각의 웰에 42㎕의 포획 비드를 첨가한다. 이어서, 제1 96-웰 플레이트의 각각의 웰로부터의 76㎕의 상청액을 포획 비드를 갖는 제2 96-웰 플레이트에 첨가한다. 샘플을 피펫으로 혼합하고, 1, 3, 또는 5분 동안 인큐베이션하고, 이어서 상청액이 투명해질 때까지(대략 1 내지 5분) 자성 스탠드 상에 둔다. 일부 예에서, 제2 포획 비드 단계는 생략된다.
각각의 비드 클린-업 단계에 대해, 단일 또는 이중 포획 비드 클린-업 프로토콜, 및 1, 3, 또는 5분 인큐베이션이 적합하다.
포획 비드 정제 후에, 상청액을 폐기하고, 포획 비드를 혼합 없이 180㎕의 신선한 80% 에탄올로 2회 세척하고, 실온에서 인큐베이션한 후, 상청액을 폐기한다. 피펫으로 잔류 에탄올을 제거하고, 플레이트를 공기 건조시키고 자성 스탠드로부터 제거한다.
각각의 웰에 15㎕ 내지 22㎕의 재현탁 완충제를 첨가하고, 웰 내용물을 피펫으로 혼합하여 비드를 재현탁시킨다. 플레이트를 실온에서 2분 동안 인큐베이션하고, 이어서 상청액이 투명해질 때까지(대략 2분) 자성 스탠드 상에 둔다. 각각의 웰로부터의 총 14㎕ 내지 20㎕의 상청액을 제3 96-웰 PCR 플레이트로 옮긴다. 이 플레이트는 최종 DNA 라이브러리이며, 전술한 바와 같이 서열분석을 위해 준비된다.
이 프로토콜은 포획 비드를 이용한 2개의 정제 단계를 이용하고, qPCR 단계를 제거하여, 더 짧은 시간에 라이브러리 제조를 완료할 수 있다. 예를 들어, 총 20분의 짧은 자석 인큐베이션 단계를 사용할 때 이러한 방법을 30분 이내로 사용하여 샘플이 제조된다.
프로토콜은 마이크로원심분리 튜브와 같은 다른 용기에서 수행될 수 있다.
일부 실시 형태에서, 최적의 클러스터 밀도를 달성하기 위하여, 동일한 라이브러리 부피를 풀링하고, 풀을 서열분석 전에 정량화한다. 200 내지 1000 ng DNA 투입량을 사용하는 경우, 경우에 따라, 1.7㎖ 마이크로원심분리 튜브 내에서 각각의 라이브러리로부터 등량 부피를 풀링하고, 와류형성하여 혼합하고, 이어서 원심분리함으로써 라이브러리를 조합한다. ssDNA 큐빗(Qubit) 키트를 사용하여 라이브러리 풀을 정량화하여 풀의 농도를 결정한다. 25 내지 200 ng DNA 투입량을 사용하는 경우, 일부 예에서, ssDNA 큐빗 키트를 사용하여 각각의 라이브러리를 개별적으로 정량화한다.
일부 예에서, 서열분석은 NovaSeq6000 카트리지 상에서 수행된다.
실시예 9: 조합된 태그멘테이션 및 인덱싱을 통한 라이브러리의 제조
하기 실시예는 조합된 태그멘테이션 및 인덱싱 단계를 사용하여 DNA 샘플로부터 이중-인덱싱된 페어드-엔드 라이브러리를 제조하기 위한 방법 및 시스템을 나타낸다. 본 방법은 실시예 2에 기재된 방법과 유사하게 수행되었지만, 태그멘테이션과 인덱싱을 한 단계로 조합하였다. 별도의 태그멘테이션 및 인덱싱 단계를 회피함으로써, 이러한 프로토콜은 사용이 용이하고 지속시간이 더 짧다는 이점을 갖는다. 또한, 이러한 프로토콜은 변성 단계를 피할 수 있고, 변성된 단일-가닥 샘플로부터 이중-가닥 샘플을 생성하기 위한 별도의 단계가 필요 없이 이중-가닥 라이브러리를 생성할 수 있다. 이러한 프로토콜은 또한 소정의 세척 단계를 피할 수 있어서, 워크플로우에 필요한 시간을 추가로 감소시킨다.
긴 처리 기간, 중간 처리 기간 또는 짧은 처리 기간 중 어느 하나가 주어진 반응을 사용하여 이들 라이브러리가 제조될 수 있음을 보여주기 위해, 3세트의 샘플을 각각 정상 워크프로우 속도, 고속 워크플로우 속도, 및 초고속 워크플로우 속도로 처리할 수 있다.
이 방법은 제1 고정된 트랜스포존 복합체 및 제2 고정된 트랜스포존 복합체를 사용한다. 제1 고정된 트랜스포존 복합체에서, 제1 트랜스포존에서의 서열 X는 앵커 서열이고, 부착 폴리뉴클레오타이드에서의 서열 X'는 앵커 서열 상보체이다. 제2 고정된 트랜스포존 복합체에서, 제1 트랜스포존에서의 서열 X는 앵커 서열이고, 부착 폴리뉴클레오타이드에서의 서열 X'는 앵커 서열 상보체이다. 제1 및 제2 고정된 트랜스포존 복합체에 포함된 앵커 서열은 교차-혼성화를 피하기 위해 비상보적일 수 있다. 제1 트랜스포존 복합체는 (i) 앵커 서열 상보체, A14' 서열, 스페이서 및 P5' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 예시적인 제1 부착 폴리뉴클레오타이드를 포함할 수 있고, 제2 트랜스포존 복합체는 (i) 앵커 서열 상보체, B15' 서열, 스페이서 및 P7' 서열, 및 (ii) 비오틴을 포함하는 결합 요소를 포함하는 예시적인 제2 부착 폴리뉴클레오타이드를 포함할 수 있다.
태그멘테이션 및 인덱싱. 10 mM Tris-HCl(약 2 내지 30㎕) 중의 DNA를, 총 투입량(ng)이 원하는 범위 내에 있도록 96-웰 PCR 플레이트의 각각의 웰에 첨가한다. 제1 및 제2 트랜스포좀 복합체를 포함하는 비드-연결된 트랜스포좀(BLT, 즉, 고정된 트랜스포존 복합체)의 현탁액을 각 웰에 첨가한다. 인덱스 1(i7) 어댑터, 인덱스 2(i5) 어댑터, 및 태그멘테이션과 동일한 반응 용액 중에서 라이게이션된 서열분석 클러스터 생성에 필요한 서열을 갖는 단일 반응 용액에서 인덱싱 단계를 수행한다. 본 실시예에서, 제1 인덱싱 올리고뉴클레오타이드는 A14 서열, i5 서열 및 P5 서열을 포함하고, 제2 인덱싱 올리고뉴클레오타이드는 B15 서열, i7 서열 및 P7 서열을 포함한다. 태그멘테이션/라이게이션 단계를 위한 조건은 20㎕의 총 부피에 대해 표적 DNA, 제1 및 제2 트랜스포좀 복합체, 및 제1 및 제2 인덱싱 올리고뉴클레오타이드의 혼합물에 첨가된 태그멘테이션 완충제 및 대장균 DNA 리가제를 포함한다. (3개의 상이한 샘플에 대해) 3개의 상이한 시간 간격: 15분(정상 워크플로우), 5분(고속 워크플로우), 및 1분(초고속 워크플로우) 동안 41℃의 온도에서 태그멘테이션 및 인덱싱 반응을 수행한다.
조합된 태그멘테이션 및 인덱싱 반응 후에, SDS로 세척하여 트랜스포사제를 변성시킴으로써 태그멘테이션 반응을 정지시키기 위해 각각의 웰에 5㎕의 0.6% SDS를 첨가하고 37℃에서 인큐베이션한다. (3개의 상이한 샘플에 대해) 3개의 상이한 시간 간격: 5분(정상 워크플로우), 5분(고속 워크플로우), 및 1분(초고속 워크플로우) 동안 정지 단계를 수행하였다. 정상 및 고속 워크플로우에 대해 동일한 기간 동안 정지 단계를 수행하지만, 고속 워크플로우에 대한 전체 시간은 다른 단계들에서의 시간 차이로 인해 여전히 더 짧다.
연장. 각각의 웰에 75㎕의 연장 믹스(DNA 폴리머라제, dNTP, 및 완충제)를 첨가하고, 100㎕ 반응 부피로 68℃ 미만에서 연장 반응을 진행한다. (3개의 상이한 샘플에 대해) 3개의 상이한 시간 간격: 10분(정상 워크플로우), 2분(고속 워크플로우), 및 1분(초고속 워크플로우) 동안 연장 단계를 수행한다. 이러한 연장 단계는 용액 중에서 이중-가닥 DNA 라이브러리를 생성할 수 있다. 포획 비드로 라이브러리 클린-업을 수행할 수 있다.
전체적으로, 정상 및 고속 워크플로우의 라이브러리 수율은 별개의 태그멘테이션 단계 및 인덱싱 단계를 갖는 방법과 비슷하지만, 초고속 워크플로우의 라이브러리 수율은 특히 훨씬 더 빠른 워크플로우의 추가된 편의성을 고려할 때 다수의 용도에 적합할 것이다. 태그멘테이션과 인덱싱이 조합된 방법은 인덱싱 올리고뉴클레오타이드가 DNA 샘플을 성공적으로 단편화하지 못한 트랜스포사제(즉, 태그멘테이션 부산물)와 결합하게 할 수 있다. 또한, 조합된 태그멘테이션 및 인덱싱은 양측 말단에 P5/P5 서열 또는 P7/P7 서열을 갖는 라이브러리 생성물을 생성할 수 있으며, 동형접합성 말단을 갖는 이러한 라이브러리 생성물은 적절하게 서열분석되지 않을 수 있다. 그러나, 많은 응용의 경우, 출발 DNA 샘플의 양은, 일부 부산물이 생성되더라도, 서열분석 결과를 가능하게 하기에 충분하다.
다수의 실시 형태들이 기술되었다. 그럼에도 불구하고, 다양한 변경이 이루어질 수 있음이 이해될 것이다. 따라서, 다른 실시 형태들이 하기의 청구범위의 범주 내에 있다.
서열 목록
서열 번호 1 - A14-ME
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG
서열 번호 2 - B15-ME
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG
서열 번호 3 - ME'
phos-CTGTCTCTTATACACATCT
서열 번호 4 - A14
TCGTCGGCAGCGTC
서열 번호 5 - B15
GTCTCGTGGGCTCGG
서열 번호 6 - ME
AGATGTGTATAAGAGACAG
서열 번호 7 - P5
AATGATACGGCGACCACCGAGAUCTACAC
서열 번호 8 - P7
CAAGCAGAAGACGGCATACGAG*A
서열 번호 9 - P5_A14_ME
AATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAGACAG
서열 번호 10 - P_ME'_B15'
5Phos/CTGTCTCTTATACACATCTCCGAGCCCACGAGAC
서열 번호 11 - Bio_P7_i701_B1_5_ddC
5Biosg/CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGG/3ddC/
서열 번호 12 - A14'_P5'_bio
GACGCTGCCGACGAGTGTAGATCTCGGTGGTCGCCGTATCATT/3Bio/
서열 번호 13 - P_A14_ME
5Phos/TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG
서열 번호 14 - A14'_nitro_P5'_bio
GACGCTGCCGACGACCC/i5NitInd//i5NitInd//i5NitInd//i5NitInd//i5NitInd//i5NitInd//i5NitInd//i5NitInd/GTGTAGATCTCGGTGGTCGCCGTATCATT/3Bio/
서열 번호 15 - A14'_12anc'_2sp_P5'_bio
GACGCTGCCGACGACCGAGCATATCC/iSp18//iSp18/GTGTAGATCTCGGTGGTCGCCGTATCATT/3BioTEG/
서열 번호 16 - P5_i501
AATGATACGGCGACCACCGAGATCTACACTAGATCGC
서열 번호 17 - P_i701'_P7_ddC
5Phos/TAAGGCGAATCTCGTATGCCGTCTTCTGCTTG/3ddC/
서열 번호 18 - P7_i701_B15_ddC
CAAGCAGAAGACGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGG/3ddC/
서열 번호 19 - P5_i501_12anc
AATGATACGGCGACCACCGAGATCTACACTAGATCGCGGATATGCTCGG
서열 번호 20 - 비오티닐화 올리고뉴클레오타이드
/5Biosg/TTUUUAATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTCAGATGTGTATAAGAGACA
서열 번호 21 - ME'_B15'_P7'
CTGTCTCTTATACACATCTCCGAGCCCACGAGACATCTCGTATGCCGTCTTCTGCTTG
서열 번호 22 - 예시적인 앵커 서열
GGATATGCTCGG
서열 번호 23: 예시적인 서열 X
ATCTGACTATCCCCTGCG
서열 번호 24: 예시적인 서열 X'
CGCAGGGGATAGTCAGAT
SEQUENCE LISTING <110> ILLUMINA CAMBRIDGE LIMITED <120> COMPLEX SURFACE-BOUND TRANSPOSOME COMPLEXES <130> WO2020144373 <150> PCT/EP2020/050612 <151> 2020-01-20 <150> US 62/840,610 <151> 2019-04-30 <150> US 62/791,509 <151> 2019-01-11 <160> 24 <170> PatentIn version 3.5 <210> 1 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <400> 1 tcgtcggcag cgtcagatgt gtataagaga cag 33 <210> 2 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <400> 2 gtctcgtggg ctcggagatg tgtataagag acag 34 <210> 3 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <220> <221> misc_feature <222> (1)..(1) <223> 5' phosphate group <400> 3 ctgtctctta tacacatct 19 <210> 4 <211> 14 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment adaptor sequence <400> 4 tcgtcggcag cgtc 14 <210> 5 <211> 15 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment adaptor sequence <400> 5 gtctcgtggg ctcgg 15 <210> 6 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <400> 6 agatgtgtat aagagacag 19 <210> 7 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Exemplary primer <400> 7 aatgatacgg cgaccaccga gauctacac 29 <210> 8 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Exemplary primer <220> <221> misc_feature <222> (22)..(22) <223> Optionally modified guanine, e.g., 8-oxo-guanine <220> <221> misc_feature <222> (22)..(23) <223> Optional phosphorothioate bond <400> 8 caagcagaag acggcatacg agat 24 <210> 9 <211> 62 <212> DNA <213> Artificial sequence <220> <223> Exemplary 5' transposon arm <400> 9 aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60 ag 62 <210> 10 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Exemplary 3' transposon arm <220> <221> misc_feature <222> (1)..(1) <223> 5' phosphate group <400> 10 ctgtctctta tacacatctc cgagcccacg agac 34 <210> 11 <211> 48 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment oligonucleotide <220> <221> misc_feature <222> (1)..(1) <223> 5' Biotin <220> <221> misc_feature <222> (48)..(48) <223> 3' Dideoxy-C <400> 11 caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggn 48 <210> 12 <211> 43 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment oligonucleotide <220> <221> misc_feature <222> (43)..(43) <223> 3' Biotin <400> 12 gacgctgccg acgagtgtag atctcggtgg tcgccgtatc att 43 <210> 13 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Exemplary 5' transposon arm <220> <221> misc_feature <222> (1)..(1) <223> 5' phosphate group <400> 13 tcgtcggcag cgtcagatgt gtataagaga cag 33 <210> 14 <211> 54 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment oligonucleotide <220> <221> misc_feature <222> (18)..(25) <223> Int 5-Nitroindole <220> <221> misc_feature <222> (54)..(54) <223> 3' Biotin <400> 14 gacgctgccg acgacccnnn nnnnngtgta gatctcggtg gtcgccgtat catt 54 <210> 15 <211> 57 <212> DNA <213> Artificial sequence <220> <223> Exemplary attachment oligonucleotide <220> <221> misc_feature <222> (27)..(28) <223> Int Spacer 18 <220> <221> misc_feature <222> (57)..(57) <223> 3' Biotin-TEG <400> 15 gacgctgccg acgaccgagc atatccnngt gtagatctcg gtggtcgccg tatcatt 57 <210> 16 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Exemplary i501 indexing oligonucleotide <400> 16 aatgatacgg cgaccaccga gatctacact agatcgc 37 <210> 17 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Exemplary i701 indexing oligonucleotide <220> <221> misc_feature <222> (1)..(1) <223> 5' phosphate group <220> <221> misc_feature <222> (33)..(33) <223> 3' Dideoxy-C <400> 17 taaggcgaat ctcgtatgcc gtcttctgct tgn 33 <210> 18 <211> 48 <212> DNA <213> Artificial sequence <220> <223> Exemplary i701 indexing oligonucleotide <220> <221> misc_feature <222> (48)..(48) <223> 3' Dideoxy-C <400> 18 caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggn 48 <210> 19 <211> 49 <212> DNA <213> Artificial sequence <220> <223> Exemplary i501 indexing oligonucleotide <400> 19 aatgatacgg cgaccaccga gatctacact agatcgcgga tatgctcgg 49 <210> 20 <211> 66 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <220> <221> misc_feature <222> (1)..(1) <223> 5' biotin <400> 20 ttuuuaatga tacggcgacc accgagatct acactcgtcg gcagcgtcag atgtgtataa 60 gagaca 66 <210> 21 <211> 58 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence used in a transposome complex <400> 21 ctgtctctta tacacatctc cgagcccacg agacatctcg tatgccgtct tctgcttg 58 <210> 22 <211> 12 <212> DNA <213> Artificial sequence <220> <223> Exemplary anchor sequence <400> 22 ggatatgctc gg 12 <210> 23 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence X <400> 23 atctgactat cccctgcg 18 <210> 24 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Exemplary sequence X' <400> 24 cgcaggggat agtcagat 18

Claims (52)

  1. 어닐링된 트랜스포존/부착 폴리뉴클레오타이드 하이브리드로서,
    (a) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존;
    (b) 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존으로서, 상기 5' 트랜스포존 말단 서열은 상기 3' 트랜스포존 말단 서열에 상보적인, 상기 제2 트랜스포존; 및
    (c) 부착 폴리뉴클레오타이드
    를 포함하되, 상기 부착 폴리뉴클레오타이드는
    (i) 2개의 어댑터 서열들 중 하나에 혼성화된 부착 어댑터 서열; 및
    (ii) 결합 요소
    를 포함하는, 어닐링된 트랜스포존/부착 폴리뉴클레오타이드 하이브리드.
  2. 트랜스포좀 복합체로서,
    (a) 트랜스포사제;
    (b) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존;
    (c) 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존으로서, 상기 5' 트랜스포존 말단 서열은 상기 3' 트랜스포존 말단 서열에 상보적인, 상기 제2 트랜스포존; 및
    (d) 부착 폴리뉴클레오타이드
    를 포함하되, 상기 부착 폴리뉴클레오타이드는
    (i) 2개의 어댑터 서열들 중 하나에 혼성화된 부착 어댑터 서열; 및
    (ii) 결합 요소
    를 포함하는, 트랜스포좀 복합체.
  3. 고정된 트랜스포좀 복합체로서,
    고체 지지체; 및
    상기 고체 지지체에 고정된 트랜스포좀 복합체
    를 포함하되,
    상기 트랜스포좀 복합체는,
    (a) 트랜스포사제;
    (b) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존;
    (c) 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존으로서, 상기 5' 트랜스포존 말단 서열은 상기 3' 트랜스포존 말단 서열의 적어도 일부분에 상보적인, 상기 제2 트랜스포존; 및
    (d) 부착 폴리뉴클레오타이드
    를 포함하고, 상기 부착 폴리뉴클레오타이드는
    (i) 2개의 어댑터 서열들 중 하나에 혼성화된 부착 어댑터 서열; 및
    (ii) 결합 요소
    를 포함하고,
    상기 결합 요소는 상기 고체 지지체에 고정되는, 고정된 트랜스포좀 복합체.
  4. 고정된 트랜스포좀 복합체로서,
    (a) 트랜스포사제;
    (b) 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존;
    (c) 상기 3' 트랜스포존 말단 서열의 적어도 일부분에 상보적인 5' 트랜스포존 말단 서열 및 3' 어댑터 서열을 포함하는 제2 트랜스포존; 및
    (d) 절단가능한 링커를 통해 상기 5' 어댑터 서열에 부착된 결합 요소
    를 포함하되;
    상기 결합 요소는 고체 지지체에 고정되는, 고정된 트랜스포좀 복합체.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서, 상기 부착 폴리뉴클레오타이드는 스페이서 영역, 앵커 영역, 프라이머 서열, 또는 인덱스 태그 서열, 또는 이들의 조합을 추가로 포함하며, 선택적으로 포획 서열, 바코드 서열, 절단 서열, 또는 서열분석-관련 서열, 또는 이들의 조합을 추가로 포함하는, 트랜스포좀 복합체.
  6. 제5항에 있어서, 상기 제1 트랜스포존은 상기 5' 어댑터 서열의 프라이머 서열 5'를 추가로 포함하고, 상기 부착 폴리뉴클레오타이드는 (i) 상기 5' 어댑터 서열과 상보적이고 이에 혼성화되는 부분 및 (ii) 상보적 프라이머 서열을 포함하는, 트랜스포좀 복합체.
  7. 제5항에 있어서, 상기 제1 트랜스포존은 상기 5' 어댑터 서열의 프라이머 서열 5'를 추가로 포함하고, 상기 부착 폴리뉴클레오타이드는 인덱스 태그 서열 및 프라이머 서열을 포함하는, 트랜스포좀 복합체.
  8. 제5항에 있어서, 상기 제2 트랜스포존은 상기 3' 어댑터 서열을 포함하고, 상기 부착 폴리뉴클레오타이드는 (i) 상기 3' 어댑터 서열에 상보적이고 이와 혼성화되는 부분, (ii) 인덱스 태그 서열, 및 (iii) 프라이머 서열을 포함하는, 트랜스포좀 복합체.
  9. 제5항에 있어서, 상기 부착 폴리뉴클레오타이드는 스페이서 영역 또는 스페이서 영역과 앵커 영역을 포함하는, 트랜스포좀 복합체.
  10. 제9항에 있어서, 상기 제1 트랜스포존은 상기 5' 어댑터 서열을 포함하고, 상기 부착 폴리뉴클레오타이드는 (i) 상기 5' 어댑터 서열과 상보적이고 이에 혼성화되는 부분, (ii) 스페이서 영역, 및 (iii) 프라이머 서열을 포함하는, 트랜스포좀 복합체.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 부착 폴리뉴클레오타이드는 A14' 서열을 포함하는, 트랜스포좀 복합체.
  12. 제9항 내지 제11항 중 어느 한 항에 있어서, 상기 스페이서 영역은 비-DNA 스페이서인, 트랜스포좀 복합체.
  13. 제9항 내지 제12항 중 어느 한 항에 있어서, 상기 스페이서 영역은 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20, 또는 30개의 염기쌍과 대략 동등한 길이이며, 선택적으로 상기 스페이서 영역은 8개 또는 10개의 염기쌍 또는 뉴클레오타이드와 대략 동등한 길이인, 트랜스포좀 복합체.
  14. 제9항 내지 제13항 중 어느 한 항에 있어서, 상기 스페이서 영역은 유니버설 염기를 포함하며, 선택적으로 상기 유니버설 염기는 이노신 또는 나이트로인돌 서열을 포함하는, 트랜스포좀 복합체.
  15. 제9항 내지 제13항 중 어느 한 항에 있어서, 상기 스페이서 영역은 하나 이상의 C18 스페이서, 하나 이상의 C9 스페이서, 또는 이들의 조합을 포함하는, 트랜스포좀 복합체.
  16. 제15항에 있어서, 상기 스페이서 영역은 2 × sp18 합성 링커, 2개의 C18 스페이서, C9 스페이서, 또는 2개의 C18 스페이서 및 하나의 C9 스페이서를 포함하는, 트랜스포좀 복합체.
  17. 제5항 내지 제16항 중 어느 한 항에 있어서, 상기 앵커 영역은 인덱싱 올리고뉴클레오타이드의 앵커 영역 상보체에 상보적이며, 상기 인덱싱 올리고뉴클레오타이드는 상기 앵커 영역 상보체 및 인덱스 태그 서열(-앵커'-인덱스 태그 서열-)을 포함하는, 트랜스포좀 복합체.
  18. 제17항에 있어서, 상기 앵커 영역 상보체는 복수의 인덱싱 올리고뉴클레오타이드에 공통인, 트랜스포좀 복합체.
  19. 제17항에 있어서, 상기 복수의 인덱싱 올리고뉴클레오타이드의 각각의 인덱스 태그 서열은 동일하거나 상이한, 트랜스포좀 복합체.
  20. 제2항 내지 제19항 중 어느 한 항에 있어서, 상기 결합 요소는 비오틴을 포함하는, 트랜스포좀 복합체.
  21. 제20항에 있어서, 상기 결합 요소는 3' 비오틴 링커인, 트랜스포좀 복합체.
  22. 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 트랜스포사제는 Tn5 트랜스포사제, 야생형 Tn5 트랜스포사제, 또는 과활성 Tn5 트랜스포사제, 또는 이들의 돌연변이체인, 트랜스포좀 복합체.
  23. 제2항 내지 제22항 중 어느 한 항에 있어서, 상기 부착 폴리뉴클레오타이드의 프라이머 서열은 상기 인덱싱 폴리뉴클레오타이드의 인덱스 프라이머 서열에 상보적인, 트랜스포좀 복합체.
  24. 제3항 내지 제23항 중 어느 한 항에 있어서, 상기 고체 지지체는 비드, 상자성 비드, 플로우 셀, 미세유체 장치의 표면, 튜브, 플레이트의 웰, 슬라이드, 패턴화된 표면, 또는 미세입자인, 트랜스포좀 복합체.
  25. 제24항에 있어서, 상기 고체 지지체는 복수의 고체 지지체를 포함하는, 트랜스포좀 복합체.
  26. 제25항에 있어서, 상기 복수의 고체 지지체는 복수의 비드를 포함하는, 트랜스포좀 복합체.
  27. 키트로서,
    제2항 내지 제26항 중 어느 한 항의 트랜스포좀 복합체; 및
    인덱스 서열을 포함하는 인덱스 믹스
    를 포함하는, 키트.
  28. 제27항에 있어서, 상기 인덱스 믹스는 i5 인덱스 서열 및 i7 인덱스 서열을 포함하고, 상기 i5 인덱스 서열은 상기 부착 폴리뉴클레오타이드에 혼성화되고, 상기 i7 인덱스 서열은 상기 3' 어댑터 서열에 혼성화되는, 키트.
  29. 태깅된 핵산 단편의 라이브러리를 생성하는 방법으로서,
    표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 상기 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 제3항 내지 제26항 중 어느 한 항의 고정된 트랜스포좀 복합체를 상기 표적 핵산과 접촉시키는 단계를 포함하는, 방법.
  30. 제29항에 있어서,
    미결합 핵산을 제거하도록 상기 고체 지지체를 처리하는 단계; 또는
    선택적으로
    (a) 상기 고체 지지체를 가열하고/하거나
    (b) 상기 고체 지지체를 효소 변성제로 세척함으로써, 상기 복합체로부터 상기 트랜스포사제를 제거하도록 상기 고체 지지체를 처리하는 단계를 추가로 포함하며,
    상기 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함하는, 방법.
  31. 제29항 또는 제30항에 있어서, 상기 접촉시키는 단계는 생물학적 샘플을 상기 트랜스포좀 복합체와 혼합하는 것을 포함하는, 방법.
  32. 제31항에 있어서, 상기 생물학적 샘플은 세포 용해물 또는 전세포를 포함하거나, 혈액, 혈장, 혈청, 림프액, 점액, 객담, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변, 침연 조직, 및 고정된 조직 FFPE로부터 선택되는, 방법.
  33. 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 접촉시키는 단계는 복수의 인덱싱 올리고뉴클레오타이드를 상기 부착 폴리뉴클레오타이드에 혼성화하는 것을 추가로 포함하며, 상기 복수의 인덱싱 올리고뉴클레오타이드는 동일하거나 상이한 인덱스 서열을 포함하는, 방법.
  34. 제29항 내지 제33항 중 어느 한 항에 있어서, 가닥을 연장 및 라이게이션하여 완전 이중-가닥 태깅된 단편을 생성하도록 상기 복수의 5' 태깅된 표적 단편을 폴리머라제 및 리가제로 처리하는 단계를 추가로 포함하는, 방법.
  35. 제34항에 있어서, 폴리머라제 및 리가제로 처리하는 상기 단계는 DNA 2차 구조 파괴물질(disruptor)의 존재 하에 수행되며, 상기 파괴물질은 선택적으로 DMSO인, 방법.
  36. 제34항 또는 제35항에 있어서, 폴리머라제 및 리가제로 처리하는 상기 단계는 상기 프라이머 서열의 상보체인 올리고뉴클레오타이드의 존재 하에 수행되며, 상기 올리고뉴클레오타이드는 P7' 올리고뉴클레오타이드이고, 상기 프라이머 서열은 P7 서열인, 방법.
  37. 제34항 내지 제36항 중 어느 한 항에 있어서, 상기 폴리머라제는 엑소뉴클레아제 활성이 결여된 T4 DNA 폴리머라제 돌연변이체를 포함하는, 방법.
  38. 제29항 내지 제37항 중 어느 한 항에 있어서, 상기 고체 지지체로부터 상기 완전 이중-가닥 태깅된 단편을 제거하는 단계를 추가로 포함하는, 방법.
  39. 제38항에 있어서, 상기 제거하는 단계는 상기 고체 지지체로부터 상기 완전 이중-가닥 태깅된 단편을 절단하기에 충분한 열 및/또는 변성제를 적용하는 것을 포함하는, 방법.
  40. 제29항 내지 제39항 중 어느 한 항에 있어서, 상기 5' 태깅된 표적 단편 또는 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함하는, 방법.
  41. 제40항에 있어서, 상기 단편은 상기 접촉시키는 단계 후에 그리고 상기 서열분석하는 단계 전에 PCR에 의해 정량화되지 않는, 방법.
  42. 제29항 내지 제41항 중 어느 한 항에 있어서, 상기 핵산은 DNA 또는 RNA인, 방법.
  43. 제29항에 있어서, 상기 3' 어댑터 서열은 인덱스 어댑터 서열의 적어도 일부분에 상보적인, 방법.
  44. 제29항에 있어서, 상기 부착 폴리뉴클레오타이드의 프라이머 서열은 인덱스 프라이머 서열의 적어도 일부분에 상보적인, 방법.
  45. 태깅된 핵산 단편의 라이브러리를 생성하는 방법으로서,
    a) 표적 핵산을 복수의 표적 단편으로 단편화하고 제1 트랜스포존의 3' 말단을 상기 표적 단편의 5' 말단에 결합시켜 복수의 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 제3항 내지 제26항 중 어느 한 항의 고정된 트랜스포좀 복합체를 상기 표적 핵산과 접촉시키는 단계;
    b) 미결합 핵산을 제거하도록 고체 지지체를 처리하는 단계; 또는 선택적으로 (a) 상기 고체 지지체를 가열하고/하거나 (b) 상기 고체 지지체를 효소 변성제로 세척함으로써, 상기 복합체로부터 상기 트랜스포사제를 제거하도록 상기 고체 지지체를 처리하는 단계로서, 상기 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함하는, 상기 고체 지지체를 처리하는 단계;
    c) 상기 5' 태깅된 표적 단편을 연장 및 라이게이션하여 완전 이중-가닥 태깅된 단편을 생성하도록 상기 복수의 5' 태깅된 표적 단편을 폴리머라제 및 리가제로 처리하는 단계로서, 선택적으로 폴리머라제 및 리가제로 처리하는 단계는 DNA 2차 구조 파괴물질의 존재 하에 수행되며, 상기 파괴물질은 선택적으로 DMSO인, 상기 폴리머라제 및 리가제로 처리하는 단계;
    d) 상기 고체 지지체로부터 상기 완전 이중-가닥 태깅된 단편을 제거하는 단계로서, 선택적으로 상기 제거하는 단계는 상기 고체 지지체로부터 상기 완전 이중-가닥 태깅된 단편을 절단하기에 충분한 열 및/또는 변성제를 적용하는 것을 포함하며, 선택적으로 상기 변성제는 NaOH인, 상기 제거하는 단계; 및
    e) 포획 비드를 사용하여 상기 완전 이중-가닥 태깅된 단편을 선택하는 단계로서, 선택적으로 상기 포획 비드는 자성 비드이고, 추가로 선택적으로 2개의 별개의 선택하는 단계가 수행되는, 상기 선택하는 단계
    를 포함하는, 방법.
  46. 제45항에 있어서, 상기 고정된 트랜스포좀 복합체는,
    고체 지지체; 및
    상기 고체 지지체에 고정된 트랜스포좀 복합체
    를 포함하며,
    상기 트랜스포좀 복합체는
    (a) 트랜스포사제;
    (b) 3' 트랜스포존 말단 서열 및 앵커 서열(앵커)을 포함하는 제1 트랜스포존;
    (c) 5' 트랜스포존 말단 서열 및 B15' 서열을 포함하는 제2 트랜스포존; 및
    (d) 부착 폴리뉴클레오타이드를 포함하고, 상기 부착 폴리뉴클레오타이드는
    (i) 앵커 서열 상보체(앵커'), A14' 서열, 스페이서, 및 P5' 서열, 및
    (ii) 상기 고체 지지체에 고정되는 비오틴을 포함하는 결합 요소
    를 포함하는, 방법.
  47. 제45항 또는 제46항에 있어서, 상기 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함하는, 방법.
  48. 태깅된 핵산 단편의 라이브러리를 생성하는 방법으로서,
    a. 표적 핵산을 복수의 표적 단편으로 단편화하고 각각의 제1 트랜스포존의 3' 말단을 상기 표적 단편의 5' 말단에 결합시켜 제1 고정된 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태깅된 표적 단편 및 제2 고정된 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태깅된 표적 단편을 생성하기에 충분한 조건 하에서 제3항 내지 제26항 중 어느 한 항의 제1 고정된 트랜스포좀 복합체 및 제3항 내지 제26항 중 어느 한 항의 제2 고정된 트랜스포좀 복합체를 상기 표적 핵산과 접촉시키는 단계로서,
    상기 제1 고정된 트랜스포좀 복합체는 고체 지지체 및 상기 고체 지지체에 고정된 제1 트랜스포좀 복합체를 포함하고, 상기 제1 트랜스포좀 복합체는
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 앵커 서열을 포함하는 제1 트랜스포존;
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존; 및
    iv. 제1 부착 폴리뉴클레오타이드를 포함하고, 상기 제1 부착 폴리뉴클레오타이드는 (i) 앵커 서열 상보체, A14' 서열, 스페이서, 및 P5' 서열, 및 (ii) 상기 고체 지지체에 고정된 비오틴을 포함하는 결합 요소를 포함하고,
    상기 제2 고정된 트랜스포좀 복합체는 고체 지지체 및 상기 고체 지지체에 고정된 제2 트랜스포좀 복합체를 포함하고, 상기 제2 트랜스포좀 복합체는
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 앵커 서열을 포함하는 제1 트랜스포존;
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존; 및
    iv. 제2 부착 폴리뉴클레오타이드를 포함하고, 상기 제2 부착 폴리뉴클레오타이드는 (i) 앵커 서열 상보체, B15' 서열, 스페이서, 및 P7' 서열, 및 (ii) 상기 고체 지지체에 고정된 비오틴을 포함하는 결합 요소를 포함하는, 상기 접촉시키는 단계;
    b. 인덱싱 올리고뉴클레오타이드에 라이게이션된 복수의 5' 태깅된 표적 단편을 생성하도록, 상기 5' 태깅된 표적 단편을 제1 및 제2 인덱싱 올리고뉴클레오타이드의 풀(pool)과 접촉시킴으로써 각각의 5' 태깅된 표적 단편을 제1 인덱싱 올리고뉴클레오타이드 또는 제2 인덱싱 올리고뉴클레오타이드 중 어느 하나에 라이게이션시키도록 상기 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 단계로서, 각각의 제1 인덱싱 올리고뉴클레오타이드는 A14 서열, i5 서열, 및 P5 서열을 포함하며 제1 5' 태깅된 표적 단편과 결합할 수 있고, 각각의 제2 인덱싱 올리고뉴클레오타이드는 B15 서열, i7 서열, 및 P7 서열을 포함하며 제2 5' 태깅된 표적 단편과 결합할 수 있는, 상기 상기 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 단계;
    c. 선택적으로 (a) 상기 고체 지지체를 가열하고/하거나 (b) 상기 고체 지지체를 효소 변성제로 세척함으로써, 상기 복합체로부터 상기 트랜스포사제를 제거하도록 상기 고체 지지체를 처리하는 단계로서, 상기 효소 변성제는 선택적으로 소듐 도데실 설페이트(SDS), 구아니딘 하이드로클로라이드, 우레아, 또는 프로테이나제를 포함하는, 상기 고체 지지체를 처리하는 단계; 및
    d. 인덱싱 올리고뉴클레오타이드에 라이게이션된 상기 복수의 5' 태깅된 표적 단편을 폴리머라제로 처리하여 완전 이중-가닥 태깅된 단편을 연장 및 생성하는 단계
    를 포함하는, 방법.
  49. 제48항에 있어서, 제1 고정된 트랜스포좀 복합체 및 제2 고정된 트랜스포좀 복합체를 접촉시키는 상기 단계 및 복수의 5' 태깅된 표적 단편을 리가제로 처리하는 상기 단계는 단일 반응에서 수행되는, 방법.
  50. 제48항 또는 제49항에 있어서, 상기 이중-가닥 태깅된 단편은 용액 중에서 생성되는, 방법.
  51. 제48항 내지 제50항 중 어느 한 항에 있어서, 포획 비드를 사용하여 상기 완전 이중-가닥 태깅된 단편을 선택하는 단계를 추가로 포함하며, 선택적으로 상기 포획 비드는 자성 비드이고, 추가로 선택적으로 2개의 별개의 선택 단계가 수행되는, 방법.
  52. 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 완전 이중-가닥 태깅된 단편 중 하나 이상을 서열분석하는 단계를 추가로 포함하는, 방법.
KR1020217009366A 2019-01-11 2020-01-10 복합체 표면-결합 트랜스포좀 복합체 KR20210114918A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962791509P 2019-01-11 2019-01-11
US62/791,509 2019-01-11
US201962840610P 2019-04-30 2019-04-30
US62/840,610 2019-04-30
PCT/EP2020/050612 WO2020144373A1 (en) 2019-01-11 2020-01-10 Complex surface-bound transposome complexes

Publications (1)

Publication Number Publication Date
KR20210114918A true KR20210114918A (ko) 2021-09-24

Family

ID=69172787

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217009366A KR20210114918A (ko) 2019-01-11 2020-01-10 복합체 표면-결합 트랜스포좀 복합체

Country Status (12)

Country Link
US (3) US11685946B2 (ko)
EP (1) EP3908672A1 (ko)
JP (1) JP2022516821A (ko)
KR (1) KR20210114918A (ko)
CN (1) CN112930405A (ko)
AU (1) AU2020206443A1 (ko)
BR (1) BR112021006038A2 (ko)
CA (1) CA3114732A1 (ko)
IL (1) IL281664B1 (ko)
MX (2) MX2021003625A (ko)
SG (1) SG11202102918WA (ko)
WO (1) WO2020144373A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022031955A1 (en) * 2020-08-06 2022-02-10 Illumina, Inc. Preparation of rna and dna sequencing libraries using bead-linked transposomes
CN112795563A (zh) * 2021-03-23 2021-05-14 上海欣百诺生物科技有限公司 生物素化的转座体在回收CUT&Tag或ATAC-seq产物中的用途及方法
MX2023010814A (es) * 2021-03-29 2023-09-27 Illumina Inc Metodos mejorados de preparacion de genotecas.
JP2024511760A (ja) 2021-03-31 2024-03-15 イルミナ インコーポレイテッド エラー補正のための固有分子識別子を有するトランスポゾンベースの技術を使用した指向性タグメンテーション配列決定ライブラリーの調製方法
WO2022216133A1 (ko) * 2021-04-09 2022-10-13 주식회사 셀레믹스 간소화된 차세대 염기서열 분석 라이브러리 전처리 방법
WO2023225095A1 (en) * 2022-05-18 2023-11-23 Illumina Cambridge Limited Preparation of size-controlled nucleic acid fragments
WO2024024583A1 (ja) * 2022-07-25 2024-02-01 東洋紡株式会社 次世代シーケンサー解析等のための断片化及びタグメント化方法
CN116515977B (zh) * 2023-06-28 2024-04-16 浙江大学 基于单端接头转座酶的单细胞基因组测序试剂盒和方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
AU2002227156A1 (en) 2000-12-01 2002-06-11 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP3002289B1 (en) 2002-08-23 2018-02-28 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
ES2949821T3 (es) 2004-01-07 2023-10-03 Illumina Cambridge Ltd Matrices moleculares
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CN101460953B (zh) 2006-03-31 2012-05-30 索雷克萨公司 用于合成分析的序列的系统和装置
EP2089517A4 (en) 2006-10-23 2010-10-20 Pacific Biosciences California POLYMERASEENZYME AND REAGENTS FOR ADVANCED NUCKIC ACID SEQUENCING
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP2670894B1 (en) * 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
US9644199B2 (en) 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
US9683230B2 (en) * 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
US20150051088A1 (en) 2013-08-19 2015-02-19 Abbott Molecular Inc. Next-generation sequencing libraries
US9790476B2 (en) * 2014-04-15 2017-10-17 Illumina, Inc. Modified transposases for improved insertion sequence bias and increased DNA input tolerance
WO2016037361A1 (zh) * 2014-09-12 2016-03-17 深圳华大基因科技有限公司 试剂盒及其在核酸测序中的用途
US11873480B2 (en) * 2014-10-17 2024-01-16 Illumina Cambridge Limited Contiguity preserving transposition
US11453875B2 (en) 2015-05-28 2022-09-27 Illumina Cambridge Limited Surface-based tagmentation
US20170283864A1 (en) * 2016-03-31 2017-10-05 Agilent Technologies, Inc. Use of transposase and y adapters to fragment and tag dna
US10907204B2 (en) * 2016-07-12 2021-02-02 Roche Sequencing Solutions, Inc. Primer extension target enrichment
IL311544A (en) 2017-02-21 2024-05-01 Illumina Inc Tegumentation using fixed transpososomes with linkers
WO2018208699A1 (en) 2017-05-08 2018-11-15 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US20180340169A1 (en) * 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
EP4180534A1 (en) * 2017-11-02 2023-05-17 Bio-Rad Laboratories, Inc. Transposase-based genomic analysis
EP3707273B1 (en) * 2017-11-08 2024-04-10 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters

Also Published As

Publication number Publication date
MX2023008931A (es) 2023-08-10
IL281664B1 (en) 2024-03-01
MX2021003625A (es) 2021-05-27
SG11202102918WA (en) 2021-04-29
BR112021006038A2 (pt) 2021-10-26
US11306348B2 (en) 2022-04-19
WO2020144373A1 (en) 2020-07-16
US20230340568A1 (en) 2023-10-26
CA3114732A1 (en) 2020-07-16
US11685946B2 (en) 2023-06-27
US20210269856A1 (en) 2021-09-02
AU2020206443A1 (en) 2021-04-15
EP3908672A1 (en) 2021-11-17
IL281664A (en) 2021-05-31
JP2022516821A (ja) 2022-03-03
CN112930405A (zh) 2021-06-08
US20200224246A1 (en) 2020-07-16

Similar Documents

Publication Publication Date Title
CN109415758B (zh) 使用含接头的经固定化的转座体进行的标签片段化
US11685946B2 (en) Complex surface-bound transposome complexes
JP2022172158A (ja) 連続性を維持した転位
JP2024511766A (ja) 改善されたライブラリ調製方法
US20080274904A1 (en) Method of target enrichment
EP3423598A1 (en) Methods and kits for tracking nucleic acid target origin for nucleic acid sequencing
US20070141604A1 (en) Method of target enrichment
JP2023547366A (ja) 複数のインサートを含む配列決定鋳型、並びに配列決定スループットを改善するための組成物及び方法
CN114096678A (zh) 多种核酸共标记支持物及其制作方法与应用
RU2790295C2 (ru) Сложные комплексы связанной на поверхности транспосомы
JP4755974B2 (ja) 核酸の選択的断片化によるdna断片の作製方法およびその適用
JP2021526367A (ja) 核酸増幅法
RU2798952C2 (ru) Получение библиотеки нуклеиновых кислот с использованием электрофореза
TWI837127B (zh) 用於準確及具成本效益之定序、單倍體分類及組裝的基於單管珠之dna共條碼編輯
AU2022280886A1 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
CN117062910A (zh) 改进的文库制备方法