KR20230161979A - 개선된 라이브러리 제조 방법 - Google Patents

개선된 라이브러리 제조 방법 Download PDF

Info

Publication number
KR20230161979A
KR20230161979A KR1020237032795A KR20237032795A KR20230161979A KR 20230161979 A KR20230161979 A KR 20230161979A KR 1020237032795 A KR1020237032795 A KR 1020237032795A KR 20237032795 A KR20237032795 A KR 20237032795A KR 20230161979 A KR20230161979 A KR 20230161979A
Authority
KR
South Korea
Prior art keywords
transposon
modified
sequence
seq
transposome complex
Prior art date
Application number
KR1020237032795A
Other languages
English (en)
Inventor
앨리슨 융한즈
안젤리카 마리 바 샬렘비어
카일라 버스비
스티븐 엠. 그로스
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20230161979A publication Critical patent/KR20230161979A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/507Recombinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Abstract

본원에는, 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열이 개시되며, 모자이크 말단 서열은 야생형 모자이크 말단 서열에 비해 하나 이상의 돌연변이를 포함하고, 돌연변이는 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 또는 변형된 피리미딘과의 치환을 포함한다. 또한 이러한 변형된 트랜스포존 말단 서열을 포함하는 트랜스포좀 복합체 및 이러한 변형된 트랜스포존 말단 서열을 사용하는 라이브러리 제조 방법이 개시된다.

Description

개선된 라이브러리 제조 방법
관련 출원의 교차 참조
본 출원은 2021년 3월 29일자 출원된 미국 임시 출원 제63/167,150호 및 2021년 7월 21일자 출원된 미국 임시 출원 제63/224,201호에 대한 우선권의 이익을 주장하며, 이의 내용은 각각 어떠한 목적으로든 이의 전문이 본원에 참조로 포함된다.
서열 목록
본 출원은 전자 형식의 서열 목록과 함께 제출된다. 서열 목록은 2022년 3월 25일자에 생성된 크기 5,634 바이트의 "2022-03-25_01243-0027-00PCT_Sequence_Listing_ST25.txt"라는 제목의 파일로 제공된다. 전자문서 형식의 서열 목록의 정보는 그 전체가 본원에 참조로 포함된다.
기술분야
본 개시내용은 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열에 관한 것으로서, 모자이크 말단 서열은 야생형 모자이크 말단 서열에 비해 하나 이상의 돌연변이를 포함하고, 돌연변이는 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 또는 변형된 피리미딘과의 치환을 포함한다. 본 개시내용은 또한 이러한 변형된 트랜스포존 말단 서열을 포함하는 트랜스포좀 복합체 및 이러한 변형된 트랜스포존 말단 서열을 사용하는 라이브러리 제조 방법에 관한 것이다.
DNA 샘플의 단편화는 NGS에 필요하지만, 현재의 방법은 (A) 값비싼 자본 장비가 필요한 기계적 접근법, (B) 샘플 농도와 시간에 따라 성능이 가변적인 효소적 전략, 및 (C) 라이브러리 어댑터 구조에 대해 제한을 두는 태그먼트화-기반 접근법에 제한된다.
NGS용 라이브러리를 제조하는 첫 번째 단계는 DNA 단편화이며, 일반적으로 수백 개의 염기쌍 범위로, 최적 길이를 중심으로 크기 분포를 갖는 DNA 단편이 생성된다. 기계적 또는 효소적 중 어느 하나로 분류될 수 있는 DNA 단편화에 대한 다양한 방법이 존재한다. 기계적 방법은 초음파처리, 어쿠스틱 전단, 및 네뷸라이제이션(nebulization)을 포함한다(문헌[Maria S. Poptsova et al., Scientific Reports 4 (2014)] 참조). 이러한 기계적 방법은 모두 특수화된 자본 장비가 필요하며 DNA 손상을 일으킬 가능성을 갖는다. 대조적으로, 효소는 특수화된 장비를 필요로 하지 않아, 사용자의 초기 비용을 절감시킨다. 이로 인해, 사용자는 효소적 단편화에 의존하는 라이브러리 제조 제품을 선호할 수 있다.
일부 Illumina 라이브러리 제조 제품에 포함된 것과 같은 트랜스포사아제 이외에, DNA 단편화에 사용될 수 있는 대체 부류의 효소는 제한 효소와 닉-형성(nicking) 효소를 포함한다. 제한 효소는 특정 부위를 인식하고 절단하여, 단편화 편향을 야기하며, 이에 따라 이는 NGS 적용에서 일반적으로 이용되지 않는다. 대조적으로, 닉-형성 효소는 DNA 기질에서 무작위 단일가닥 절단물을 도입한다. 닉-형성 효소 기반 효소적 단편화를 가능하게 하는 제품의 예는 NEBNext 단편화효소이다. 이러한 제품에서, 하나의 효소는 기질 DNA 내에서 무작위 닉을 생성하고, 개별 효소는 상보적 가닥을 절단하여, DNA 단편화를 야기한다. 이러한 방법을 사용하는 예시적인 프로토콜은 NEBNext dsDNA 단편화효소일 것이다(Illumina Platform, NEB, 2019에 대한 DNA 샘플 제조용 NEBNext® 참조).
NEB 단편화효소가 어댑터 서열을 추가하지 않고서 DNA를 단편화하기 때문에, 이러한 워크플로우는 PCR이 없는(PCR-free) 접근법을 포함한 다양한 기존의 결찰-기반 라이브러리 제조 워크플로우와 호환가능하다. 그러나, 이러한 단편화효소는 수 회 전환될 수 있어, 단편화를 시간 및 농도-의존적으로 만들고, 이에 따라 사용자의 특정 샘플 유형에 대한 이러한 반응의 최적화는 흔히 적절한 단편 크기 분포를 획득하기 위해 필수적이다(문헌[Joseph P. Dunham and Maren L. Friesen, Cold Spring Harbor Protocols 9:820-34 (2013)] 참조). 대조적으로, 트랜스포사아제-매개 단편화는 사전로딩된 트랜스포존 기질에 대한 이의 의존성을 기반으로 하나의 전환으로 제한되지만, 트랜스포사아제-매개 단편화는 모자이크 말단 서열의 DNA 단편으로의 도입을 필요로 한다.
요약하면, 효소적 단편화 방법은 특수화된 장비를 필요로 하지 않고, 고 처리량 적용에 더 적합하기 때문에 다수의 사용자들에게 선호된다. 그러나, 본 발명의 효소적 단편화 방법은 DNA 정량화 및 BLT를 이용한 라이브러리 정규화와 같은 BLT의 이점을 갖지 않기 때문에, 단편화효소를 사용하는 방법과 BLT-기반 방법을 차별화한다.
트랜스포존 Tn5의 전위에 대한 중요한 요건은 Tn5 트랜스포사아제에 의해 특이적으로 인식되며 이의 전위 활성에 요구되는 "모자이크 말단"(ME: mosaic end)이다. Tn5 트랜스포사아제는 "외부 말단"(OE) 및 "내부 말단"(IE) 서열을 천연적으로 인식하며, 이는 돌연변이에 대해 매우 내성이 없는 것으로 나타났고, 이때 대부분의 돌연변이는 감소된 활성을 야기한다. 이후의 연구는 돌연변이 Tn5 효소와 함께 "모자이크 말단"(ME)으로 지칭된 IE 및 OE에서 유래된 키메라 서열이, 천연 시스템에 대해 대략 100배로 전위 활성을 증가시켰음을 입증하였다. 이러한 과활성 시스템은 이전에 Illumina의 Nextera 기술로 알려진 Illumina DNA Flex PCR-Free 기술(연구 목적, RUO)을 위한 기반을 형성한다. DNA 기질과 복합체를 이루는 Tn5 트랜스포사아제의 결정 구조는 19개의 염기쌍 중 13개가 핵염기-특이적 결정 접촉을 갖는 반면, 다른 염기는 촉매작용에서 역할을 하는 것으로 보임을 나타낸다.
Tn5 트랜스포사아제 및 비드-연결 트랜스포좀(BLT)은 NGS 라이브러리 제조를 위한, 동시 효소적 DNA 단편화 및 어댑터 결찰, 또는 태그먼트화를 매개하는 강력한 도구이다. 태그먼트화 과정은 샘플 DNA의 기계적 또는 효소적 단편화, 효소적 말단-복구, 및 어댑터 결찰에 대한 요건을 제거하여 용이한 라이브러리 제조 방법을 유발한다. 그러나, 이러한 시스템의 제약은 단일가닥 19-뉴클레오티드 모자이크 말단 서열이 라이브러리 삽입물의 5' 말단에 인접하게 혼입되어야 한다는 요건이다. 이것이 표준 라이브러리 제조에 용이하게 활용될 수 있지만, 표준 시퀀싱 방법과 호환성을 유지하면서 분기형 어댑터, 바코드, 및 고유 분자 식별자(UMI: unique molecular identifier)와 같은 추가적 특징부를 갖는 라이브러리의 형성은 어렵다.
라이브러리 삽입물에 인접한 정의된 19-염기쌍 서열을 요구하는 이전의 태그먼트화 접근법의 제약을 추가적으로 제거하면서, 본원에 기재된 단편화효소 BLT(fBLT) 기술은 BLT의 고유한 이점을 활용하여 이러한 기술적 문제를 극복한다. 효소적 단편화 및 어댑터 태깅 단계를 분리함으로써, 분기형 어댑터, 바코드 및 UMI와 같은 특징부의 추가는 표준 시퀀싱 방법과 호환성을 유지하면서 가능해질 수 있다. 이러한 고유한 이점을 기반으로, fBLT는 UMI 라이브러리 제조 및 PCR이 없는 라이브러리 제조와 같은 다양한 적용에서 이용될 수 있다.
본원에 개시된 변형된 트랜스포존 말단 서열은 라이브러리 삽입물에 인접한 19-bp 모자이크 말단 서열을 필요로 하는 제약을 제거할 수 있고, 혼성 Tn5-결찰 라이브러리 제조 접근법을 가능하게 하여, 이에 따라 결찰 화학을 기반으로 개발된 라이브러리 제조 워크플로우에서 BLT가 활용될 수 있도록 한다. 본 개시내용은 Tn5가 모자이크 말단 기질 내에서 다수의 돌연변이 및 핵염기 변형을 용인할 수 있음을 기재한다.
설명에 따르면, 라이브러리 제조 방법은 비드-연결 트랜스포좀(BLT)에 의한 전위, 트랜스포존 말단에 포함된 변형된 모자이크 말단 서열의 절단, 및 어댑터 결찰을 포함할 수 있다.
실시형태 1. 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열로서, 모자이크 말단 서열은 야생형 모자이크 말단 서열에 비해 하나 이상의 돌연변이를 포함하고, 돌연변이는 하기와의 치환을 포함하는, 변형된 트랜스포존 말단 서열:
a. 우라실;
b. 이노신;
c. 리보오스;
d. 8-옥소구아닌;
e. 티민 글리콜;
f. 변형된 퓨린; 또는
g. 변형된 피리미딘.
실시형태 2. 실시형태 1에 있어서, 야생형 모자이크 말단 서열은 서열 번호 1을 포함하고, 추가로 하나 이상의 돌연변이는 A16, C17, A18, 및/또는 G19에서 치환을 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 3. 실시형태 1 또는 2에 있어서, 모자이크 말단 서열은 야생형 서열에 비해 8개 이하의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 4. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 하나 이상의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 5. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 6. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 7. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 2개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 8. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 3개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 9. 실시형태 2에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 10. 실시형태 2 내지 9 중 어느 하나에 있어서,
a. A16에서의 치환은 A16T, A16C, A16G, A16U, A16이노신, A16리보오스, A16-8-옥소구아닌, A16티민 글리콜, A16변형된 퓨린, 또는 A16변형된 피리미딘이고;
b. C17에서의 치환은 C17T, C17A, C17G, C17U, C17이노신, C17리보오스, C17-8-옥소구아닌, C17티민 글리콜, C17변형된 퓨린, 또는 C17변형된 피리미딘이고;
c. A18에서의 치환은 A18G, A18T, A18C, A18U, A18이노신, A18리보오스, A18-8-옥소구아닌, A18티민 글리콜, A18변형된 퓨린, 또는 A18변형된 피리미딘이고; 그리고/또는
d. G19에서의 치환은 G19T, G19C, G19A, G19U, G19이노신, G19리보오스, G19-8-옥소구아닌, G19티민 글리콜, G19변형된 퓨린, 또는 G19변형된 피리미딘인, 변형된 트랜스포존 말단 서열.
실시형태 11. 실시형태 2 내지 9 중 어느 하나에 있어서, 돌연변이는 하기와의 치환을 포함하는, 변형된 트랜스포존 말단 서열:
a. 우라실;
b. 이노신;
c. 리보오스;
d. 8-옥소구아닌;
e. 티민 글리콜;
f. 변형된 퓨린; 및/또는
g. 변형된 피리미딘.
실시형태 12. 실시형태 2 내지 11 중 어느 하나에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 13. 실시형태 2 내지 11 중 어느 하나에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 2개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 14. 실시형태 2 내지 11 중 어느 하나에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 3개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 15. 실시형태 2 내지 11 중 어느 하나에 있어서, A16, C17, A18, 및 G19에서의 4개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
실시형태 16. 실시형태 2 내지 11 중 어느 하나에 있어서, A16, C17, A18, 및/또는 G19에서의 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 17. 실시형태 1 내지 11 중 어느 하나에 있어서, 야생형 서열에 비해 1개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 18. 실시형태 1 내지 11 중 어느 하나에 있어서, 야생형 서열에 비해 2개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 19. 실시형태 1 내지 11 중 어느 하나에 있어서, 야생형 서열에 비해 3개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 20. 실시형태 1 내지 11 중 어느 하나에 있어서, 야생형 서열에 비해 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
실시형태 21. 실시형태 1 내지 20 중 어느 하나에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 변형된 트랜스포존 말단 서열.
실시형태 22. 실시형태 1 내지 20 중 어느 하나에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 변형된 트랜스포존 말단 서열.
실시형태 23. 하기를 포함하는, 트랜스포좀 복합체:
a. 트랜스포사아제;
b. 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하는 변형된 트랜스포존 말단 서열을 포함하는 제1 트랜스포존; 및
c. 제1 트랜스포존 말단 서열의 적어도 일부분과 상보적인 제2 트랜스포존 말단 서열을 포함하는 제2 트랜스포존.
실시형태 24. 실시형태 23에 있어서, 제1 트랜스포존은 리보오스, 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 용액 중에 있는, 트랜스포좀 복합체.
실시형태 25. 실시형태 23에 있어서, 제1 트랜스포존은 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 고체 지지체 상에서 고정되는, 트랜스포좀 복합체.
실시형태 26. 실시형태 23 내지 25 중 어느 하나에 있어서, 제1 트랜스포존은 제1항 내지 제22항 중 어느 한 항의 변형된 트랜스포존 말단 서열을 포함하는, 트랜스포좀 복합체.
실시형태 27. 실시형태 23 내지 26 중 어느 하나에 있어서, 트랜스포사아제는 Tn5인, 트랜스포좀 복합체.
실시형태 28. 실시형태 23 내지 27 중 어느 하나에 있어서, 제1 트랜스포존은 이전된 가닥(transferred strand)인, 트랜스포좀 복합체.
실시형태 29. 실시형태 23 내지 28 중 어느 하나에 있어서, 제2 트랜스포존은 비(non)이전된 가닥인, 트랜스포좀 복합체.
실시형태 30. 실시형태 23 내지 29 중 어느 하나에 있어서, 제1 트랜스포존의 우라실은 제2 트랜스포존의 A와 염기쌍을 형성하는, 트랜스포좀 복합체.
실시형태 31. 실시형태 23 내지 30 중 어느 하나에 있어서, 제1 트랜스포존의 이노신은 제2 트랜스포존의 C와 염기쌍을 형성하는, 트랜스포좀 복합체.
실시형태 32. 실시형태 23 내지 31 중 어느 하나에 있어서, 제1 트랜스포존의 리보오스는 제2 트랜스포존의 A, C, T, 또는 G와 염기쌍을 형성하는, 트랜스포좀 복합체.
실시형태 33. 실시형태 23 내지 32 중 어느 하나에 있어서, 제1 트랜스포존의 티민 글리콜은 제2 트랜스포존의 A와 염기쌍을 형성하는, 트랜스포좀 복합체.
실시형태 34. 실시형태 23 내지 33 중 어느 하나에 있어서, 변형된 퓨린은 제2 트랜스포존의 T와 염기쌍을 형성하는 제1 트랜스포존의 3-메틸아데닌인, 트랜스포좀 복합체.
실시형태 35. 실시형태 23 내지 34 중 어느 하나에 있어서, 변형된 퓨린은 제2 트랜스포존의 C와 염기쌍을 형성하는 제1 트랜스포존의 7-메틸구아닌인, 트랜스포좀 복합체.
실시형태 36. 실시형태 23 내지 34 중 어느 하나에 있어서, 변형된 피리미딘은 제2 트랜스포존의 G와 염기쌍을 형성하는 제1 트랜스포존의 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 트랜스포좀 복합체.
실시형태 37. 실시형태 23 내지 36 중 어느 하나에 있어서, 제1 또는 제2 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
실시형태 38. 실시형태 37에 있어서, 제1 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
실시형태 39. 실시형태 38에 있어서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착되는, 트랜스포좀 복합체.
실시형태 40. 실시형태 38 또는 39에 있어서, 표적화된 트랜스포좀 복합체 내에 포함된 제1 트랜스포존은 링커를 포함하는, 트랜스포좀 복합체.
실시형태 41. 실시형태 40에 있어서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 트랜스포좀 복합체.
실시형태 42. 실시형태 37에 있어서, 제2 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
실시형태 43. 실시형태 42에 있어서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착되는, 트랜스포좀 복합체.
실시형태 44. 실시형태 43에 있어서, 제2 트랜스포존은 서열 번호 13을 포함하는, 트랜스포좀 복합체.
실시형태 45. 실시형태 44에 있어서, 제2 트랜스포존은 링커를 포함하는, 트랜스포좀 복합체.
실시형태 46. 실시형태 45에 있어서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 트랜스포좀 복합체.
실시형태 47. 실시형태 37 내지 46 중 어느 하나에 있어서, 친화성 요소는 비오틴, 아비딘, 스트렙타비딘, 항체, 또는 올리고뉴클레오티드를 포함하는, 트랜스포좀 복합체.
실시형태 48. 실시형태 23 내지 47 중 어느 하나에 있어서, 제2 트랜스포존은 하기를 포함하는, 트랜스포좀 복합체.
a. 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열; 또는
b. 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단.
실시형태 49. 실시형태 48에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
실시형태 50. 실시형태 48에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
실시형태 51. 실시형태 48에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
실시형태 52. 실시형태 48에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
실시형태 53. 실시형태 23 내지 52 중 어느 하나에 있어서, 트랜스포좀 복합체는 용액 중에 있는, 트랜스포좀 복합체.
실시형태 54. 상부에 고정된 실시형태 23 내지 52 중 어느 하나의 트랜스포좀 복합체를 갖는 고체 지지체.
실시형태 55. 이중가닥 핵산을 포함하는 샘플을 실시형태 23 내지 53 중 어느 하나의 트랜스포좀 복합체 또는 실시형태 54의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계를 포함하는, 이중가닥 핵산의 단편화 방법.
실시형태 56. 하기를 포함하는, 제1 트랜스포존 말단의 전부 또는 일부가 결여된 이중가닥 핵산 단편의 제조 방법:
a. 핵산을 포함하는 샘플을 실시형태 23 내지 53 중 어느 하나의 트랜스포좀 복합체 또는 실시형태 54의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계; 및
b. 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성(abasic) 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계.
실시형태 57. 실시형태 56에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
실시형태 58. 실시형태 56에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
실시형태 59. 실시형태 57 또는 58에 있어서, 단편으로부터 제1 트랜스포존 말단의 전부 또는 일부를 제거한 후 단편을 시퀀싱하는 단계를 추가로 포함하는, 제조 방법.
실시형태 60. 실시형태 59에 있어서, 시퀀싱 전에 단편의 증폭을 필요로 하지 않는, 제조 방법.
실시형태 61. 실시형태 59에 있어서, 단편은 시퀀싱 전에 증폭되는, 제조 방법.
실시형태 62. 실시형태 59 내지 61 중 어느 하나에 있어서, 어댑터 결찰 후에 그리고 시퀀싱 전에 논의되는 단편을 농축하는 단계를 추가로 포함하는, 제조 방법.
실시형태 63. 하기를 포함하는, 어댑터를 포함하는 이중가닥 핵산 단편의 제조 방법:
a. 핵산을 포함하는 샘플을 실시형태 23 내지 53 중 어느 하나의 트랜스포좀 복합체 또는 실시형태 54의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계;
b. 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 말단 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계; 및
c. 어댑터를 단편의 5' 및/또는 3' 말단 상에 결찰하는 단계.
실시형태 64. 실시형태 63에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
실시형태 65. 실시형태 63에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
실시형태 66. 실시형태 56 내지 65 중 어느 하나에 있어서, 핵산은 이중가닥 DNA인, 제조 방법.
실시형태 67. 실시형태 56 내지 65 중 어느 하나에 있어서, 핵산은 RNA이고, 이중가닥 cDNA 또는 DNA:RNA 듀플렉스는 트랜스포좀 복합체와 조합되기 전에 생성되는, 제조 방법.
실시형태 68. 실시형태 56 내지 67 중 어느 하나에 있어서, 절단되는 제1 트랜스포존 말단의 전부 또는 일부는 샘플의 나머지로부터 분리되는, 제조 방법.
실시형태 69. 실시형태 63 내지 68 중 어느 하나에 있어서, 결찰 전에, 단편의 3' 말단에서의 필링(filling) 단계 및 키나아제로 단편의 3' 말단을 인산화하는 단계를 추가로 포함하는, 제조 방법.
실시형태 70. 실시형태 69에 있어서, 필링은 T4 DNA 폴리머라아제로 수행되는, 제조 방법.
실시형태 71. 실시형태 70에 있어서, 단편의 3' 말단에 단일 A 오버행을 추가하는 단계를 추가로 포함하는, 제조 방법.
실시형태 72. 실시형태 71에 있어서, 폴리머라아제는 단일 A 오버행을 추가하는, 제조 방법.
실시형태 73. 실시형태 72에 있어서, 폴리머라아제는 (i) Taq 또는 (ii) 클레나우(Klenow) 단편, 엑소-인, 제조 방법.
실시형태 74. 실시형태 56 내지 73 중 어느 하나에 있어서, 단편은 모자이크 말단 서열의 0 내지 3개의 염기를 포함하는, 제조 방법.
실시형태 75. 실시형태 56 내지 74 중 어느 하나에 있어서, 단편의 제조 단계는 서열 번호 1을 포함하는 야생형 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열을 포함하는 제1 트랜스포존을 포함하는 트랜스포좀 복합체를 갖는 단편의 제조에 비해, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%의 단편 수의 제조를 야기하는, 제조 방법.
실시형태 76. 실시형태 63 내지 75 중 어느 하나에 있어서, 어댑터 결찰 후에 단편을 시퀀싱하는 단계를 추가로 포함하는, 제조 방법.
실시형태 77. 실시형태 76에 있어서, 시퀀싱 전에 단편의 증폭을 필요로 하지 않는, 제조 방법.
실시형태 78. 실시형태 77에 있어서, 단편은 시퀀싱 전에 증폭되는, 제조 방법.
실시형태 79. 실시형태 76 내지 78 중 어느 하나에 있어서, 어댑터 결찰 후에 그리고 시퀀싱 전에 논의되는 단편을 농축하는 단계를 추가로 포함하는, 제조 방법.
실시형태 80. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형된 트랜스포존 말단 서열은 우라실을 포함하고, DNA 글리코실라아제와 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 우라실-특이적 절제 시약(USER: uracil-specific excision reagent)인, 제조 방법.
실시형태 81. 실시형태 80에 있어서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III의 혼합물인, 제조 방법.
실시형태 82. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형 트랜스포존 말단 서열은 이노신을 포함하고, 엔도뉴클레아제는 엔도뉴클레아제 V인, 제조 방법.
실시형태 83. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형 트랜스포존 말단 서열은 리보오스를 포함하고, 엔도뉴클레아제는 RNAse HII인, 제조 방법.
실시형태 84. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형 트랜스포존 말단 서열은 8-옥소구아닌을 포함하고, 엔도뉴클레아제는 포름아미도피리미딘-DNA 글리코실라아제(FPG) 또는 옥소구아닌 글리코실라아제(OGG)인, 제조 방법.
실시형태 85. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형 트랜스포존 말단 서열은 티민 글리콜을 포함하고, DNA 글리코실라아제는 엔도뉴클레아제 EndoIII(Nth) 또는 Endo VIII인, 제조 방법.
실시형태 86. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형된 트랜스포존 말단 서열은 변형된 퓨린을 포함하고, DNA 글리코실라아제는 인간 3-알킬아데닌 DNA 글리코실라아제이고, 엔도뉴클레아제는 엔도뉴클레아제 III 또는 VIII인, 제조 방법.
실시형태 87. 실시형태 86에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
실시형태 88. 실시형태 56 내지 79 중 어느 하나에 있어서, 변형된 트랜스포존 말단 서열은 변형된 피리미딘을 포함하고 (1) DNA 글리코실라아제는 티민-DNA 글리코실라아제(TDG) 또는 포유류 DNA 글리코실라아제-메틸-CpG 결합 도메인 단백질 4(MBD4)이고, 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제는 엔도뉴클레아제 III 또는 VIII이거나; (2) 엔도뉴클레아제는 DNA 글리코실라아제/리아아제 ROS1(ROS1)인, 제조 방법.
실시형태 89. 실시형태 88에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
실시형태 90. 실시형태 56 내지 89 중 어느 하나에 있어서, 제1 트랜스포존은 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 또는 변형된 피리미딘으로부터 선택된 하나 초과의 돌연변이를 포함하는 변형된 트랜스포존 말단 서열을 포함하고, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 효소 혼합물인, 제조 방법.
실시형태 91. 실시형태 90에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
실시형태 92. 실시형태 90에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
실시형태 93. 실시형태 63 내지 92 중 어느 하나에 있어서, 제1 트랜스포존 말단의 절단 단계는 어댑터를 결찰하기 위한 점착성 말단을 생성하는, 제조 방법.
실시형태 94. 실시형태 93에 있어서, 점착성 말단은 하나의 염기보다 더 긴, 제조 방법.
실시형태 95. 실시형태 63 내지 94 중 어느 하나에 있어서, 어댑터는 이중가닥 어댑터를 포함하는, 제조 방법.
실시형태 96. 실시형태 63 내지 95 중 어느 하나에 있어서, 어댑터는 단편의 5' 및 3' 말단에 추가되는, 제조 방법.
실시형태 97. 실시형태 96에 있어서, 단편의 5' 및 3' 말단에 추가된 어댑터는 상이한, 제조 방법.
실시형태 98. 실시형태 63 내지 97 중 어느 하나에 있어서, 어댑터는 고유 분자 식별자(UMI), 프라이머 서열, 앵커 서열, 범용 서열, 스페이서 영역, 인덱스 서열, 캡쳐 서열, 바코드 서열, 절단 서열, 시퀀싱 관련 서열, 및 이의 조합을 포함하는, 제조 방법.
실시형태 99. 실시형태 98에 있어서, 어댑터는 UMI를 포함하는, 제조 방법.
실시형태 100. 실시형태 99에 있어서, UMI를 포함하는 어댑터는 단편의 3' 및 5' 말단 모두에 결찰되는, 제조 방법.
실시형태 101. 실시형태 63 내지 100 중 어느 하나에 있어서, 어댑터는 분기형 어댑터인, 제조 방법.
실시형태 102. 실시형태 63 내지 101 중 어느 하나에 있어서, 결찰은 DNA-리가아제로 수행되는, 제조 방법.
실시형태 103. 실시형태 63 내지 102 중 어느 하나에 있어서, 단일 반응 용기 내에서 수행되는, 제조 방법.
실시형태 104. 실시형태 56 내지 103 중 어느 하나에 있어서, 고체 표면 상에 고정된 트랜스포좀의 밀도는 고정된 단편의 라이브러리 수율 및 단편 크기를 조절하도록 선택되는, 제조 방법.
실시형태 105. 실시형태 56 내지 104 중 어느 하나에 있어서, 비드-기반 정규화를 허용하는, 제조 방법.
실시형태 106. 실시형태 56 내지 105 중 어느 하나에 있어서, 샘플은 부분적으로 단편화된 DNA를 포함하는, 제조 방법.
실시형태 107. 실시형태 56 내지 106 중 어느 하나에 있어서, 샘플은 포르말린 고정된 파라핀 내장 조직 또는 무세포 DNA인, 제조 방법.
실시형태 108. 실시형태 56 내지 107 중 어느 하나에 있어서, 라이브러리는 단일 태그먼트화 사건에 의해 제조된 단편을 포함하는, 제조 방법.
실시형태 109. 제1 트랜스포존과 제2 트랜스포존을 갖는 트랜스포존 쌍으로서, 제1 트랜스포존은 실시형태 1 내지 22 중 어느 하나의 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 하기를 포함하는, 트랜스포존 쌍:
a. 야생형 모자이크 말단 서열과 상보적인 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열; 또는
b. 제1 트랜스포존 말단과 전부 상보적인 트랜스포존 말단 서열.
실시형태 110. 실시형태 109에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
실시형태 111. 실시형태 109에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
실시형태 112. 실시형태 109에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
실시형태 113. 실시형태 109에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
부가적인 목적 및 이점은 하기 상세한 설명에서 부분적으로 설명될 것이며, 부분적으로는 상세한 설명으로부터 이해되거나, 실시에 의해 학습될 수 있다. 이러한 목적 및 이점은 특히 첨부된 청구범위에 언급된 요소 및 조합에 의해 실현되고 달성될 것이다.
전술한 일반적인 설명 및 하기 상세한 설명은 단지 예시적이고 설명적이며, 청구범위를 제한하고자 하는 것이 아님을 이해해야 한다.
본 명세서에 통합되고 본 명세서의 일부를 구성하는 첨부된 도면은 하나의(여러) 실시형태(들)를 예시하며, 해당 설명과 함께 본원에 기재된 원리를 설명하는 역할을 한다.
도 1a 및 1b는 단편화 방법의 개요를 보여준다. (a) 본 발명의 단편화-Tn5 접근법은 Tn5-모자이크 말단 기질의 변형을 사용하여 모자이크 말단 및 후속 어댑터 결찰의 선택적 절단을 가능하게 함. (b) 주입 DNA가 기계적으로 전단되거나 후속 말단 복구 및 어댑터 결찰과 함께 효소적으로 단편화되는 표준 경쟁 워크플로우. 도 1a 및 1b 둘 모두에서, Illumina 시퀀싱에 대한 모든 표준 어댑터 서열을 함유하는 Y-형 어댑터(P5-i5-A14-ME 및 ME'-B15'-i7'-P7')의 부착이 도시되어 있다. 대체 구성에서, 단지 A14-ME 및 ME'-B15'만을 함유하는 짧은 Y-형 어댑터가 사용될 수 있고, 본원에 이의 전문이 참조로 포함되는 미국 특허출원공개 US 20180201992 A1호의 도 2에 기재된 것과 같은 방법에서 PCR에 의해 추가적 어댑터 서열이 추가될 수 있다.
도 2는 표준 태그먼트화 라이브러리 제조에서 Tn5 트랜스포사아제의 메커니즘을 요약한다. Tn5 트랜스포사아제 효소는 추가된 어댑터 서열(예컨대, Illumina 방법의 경우 A14 및 B15) 및 동족 "모자이크 말단"으로 이루어진 트랜스포존 DNA 기질이 사전로딩된다. 태그먼트화 동안, 이러한 트랜스포좀은 게놈 DNA에 대해 작용하여 동시 단편화 및 어댑터 서열로의 태깅을 야기한다. A14 및 B15 서열은 각각 서열 번호 11 및 12이다. ME 서열과 이의 상보체(ME')는 각각 서열 번호 1 및 4이다.
도 3은 비드-연결 트랜스포좀(BLT)이 어떻게 정규화 없는 워크플로우를 가능하게 하는지를 요약한다. 자성 비드에 트랜스포좀을 접합함으로써, 라이브러리로 전환되는 DNA의 양이 정규화된다. 추가적으로, 라이브러리 단편 크기의 일부 제어는 트랜스포좀 밀도 선택을 통해 획득된다. 라이브러리는 단편 크기의 추가 제어를 획득하기 위해 고체상 가역적 고정화(SPRI)-기반 크기 선택에 적용될 수도 있다. gDNA = 게놈 DNA.
도 4는 단편화효소를 이용한 효소적 단편화를 요약한다. 도시된 방법에서, 효소 1은 한 가닥으로 무작위 닉을 도입하고, 효소 2는 닉과 반대편에 절단물을 도입하여 dsDNA 브레이크를 생성한다. 생성된 DNA 단편은 일반적으로 5' 말단에 1 내지 4개의 염기 오버행을 갖는다. 이러한 방법을 사용하는 예시적인 프로토콜은 NEBNext dsDNA 단편화효소(Illumina Platform용 DNA 샘플 제조를 위한 NEBNext®, NEB, 2019 및 NEBNext dsDNA 단편화효소 제품, 2021년 3월 17일자에 접속된 www.nebj.jp/products/detail/1020.com에서 세부사항 확인가능)일 것이다.
도 5는 모자이크 말단 서열의 제거를 위한 잠재적인 메커니즘을 보여준다. 가능한 효소적 전략은 제한 효소, 단일가닥 DNAse, 또는 DNA 복구 효소 사용을 포함한다. 일부 실시형태에서, DNA 복구 효소는 이들의 특이성으로 인해 매력적이다.
도 6a 및 6b는 돌연변이된 모자이크 말단 서열을 갖는 Tn5v3 활성의 분석을 보여준다. (a) 이전된 가닥 서열(서열 번호 1)에 기반으로 다양한 위치에서의 정규 치환이 보고되어 있고, 이때 이전된 가닥에서만 치환이 이루어지고, 야생형 비이전된 가닥은 어닐링됨을 나타내는 *로 표시된 염기를 제외하고 비이전된 가닥(서열 번호 4)에서 상응하는 치환을 가짐. 위치 16A에서, T, C, G가 치환되었다. 위치 17C에서, T, A 및 G가 치환되었다. 위치 18A에서, G, T 및 C가 치환되었다. 위치 19G에서, T, C, 및 A가 치환되었다. 서열 번호 1에 대한 다른 치환이 표시된 것처럼 이루어졌다. (b) TS에서 DNA 변형에 의해 제조된 Tn5v3 트랜스포좀의 활성. 우라실은 A와 염기쌍을 형성하였고, 이노신은 C와 염기쌍을 형성하였다. 도시된 서열은 이전된 가닥, TS(서열 번호 1) 및 비이전된 가닥, NTS(서열 번호 4)이다. AU = 임의 단위.
도 7a 내지 7c는 Tn5-단편화효소 접근법을 사용하는 라이브러리 제조를 보여준다. (a) 라이브러리 제조에 이용된 워크플로우의 다이어그램. (b) 변형 특이적 엔도뉴클레아제가 1 단계 반응에서 변형된 염기를 어떻게 절단할 수 있거나 변형 특이적 글리코실라아제 후 AP 리아아제/엔도뉴클레아제 또는 열이 2 단계 반응에서 변형된 염기를 어떻게 절단할 수 있는지에 대한 다이어그램. (c) DNA 변형에 의해 제조된 라이브러리의 전기영동도. 제조사의 프로토콜(NEB)에 따라 라이브러리를 USER, 엔도뉴클레아제 V, 또는 RNAse HII 중 어느 하나로 처리하였다. 본 실험에서, 다량의 어댑터 이량체(약 160 bp에서 피크)가 관찰되었는데, 이는 아마 최적이 아닌 결찰 어댑터 농도로 인한 것이다. ATL = A 테일링. LIG = 결찰.
도 8a 및 8b는 ME 내의 우라실 변형 부위의 비교를 보여준다. (a) 대체 모자이크 말단에 의해 생성된 라이브러리의 전기영동도. (b) 대체 ME를 갖는 라이브러리의 Qubit 수율. 20분 및 60분의 USER 인큐베이션 시간을 시험하였다.
도 9는 단편화효소 라이브러리가 라이브러리 삽입물에 인접한 예측된 ME "스카(scar)"를 보임을 요약한다. 가변적인 UMI 길이로 인해, 일부 라이브러리는 1 bp만큼 이동한다. 각 변형 부위에 대한 ME 스카가 예측대로 존재한다. A16U 이전된 가닥 서열 및 T16A 비이전된 가닥 서열은 각각 서열 번호 5 및 6이다. C17U 이전된 가닥 서열 및 G17A 비이전된 가닥 서열은 각각 서열 번호 7 및 8이다. A18U 이전된 가닥 서열 및 T18A 비이전된 가닥 서열은 각각 서열 번호 9 및 10이다.
도 10a 내지 10c는 대표적인 fBLT 라이브러리 제조를 보여준다. (a) 본 연구에 사용된 워크플로우. (b) 농축 BLT(eBLT) 및 단편화효소(fBLT) 라이브러리 제조의 라이브러리 수율. (c) eBLT 및 fBLT 라이브러리의 대표적인 Bioanalyzer 추적. fBLT에 의한 추가적 워크플로우가 본원에 개시될 것이다.
도 11은 fBLT의 개요를 보여주며, 이때 대표적인 변형된 트랜스포존 말단은 트랜스포좀을 고정하기 위해 사용될 수 있는, 비오티닐화된 비이전된 가닥(서열 번호 13) 및 G19I 돌연변이를 갖는 이전된 가닥(서열 번호 14)을 포함한다. B = 비오틴.
도 12는 제1 트랜스포존의 모자이크 말단(ME 서열)에서 상이한 변형된 염기를 갖는 fBLT에 의한 결과를 보여준다. 16 내지 19는 서열 번호 1로부터의 변형 위치를 나타낸다. oxoG = 옥소구아닌; AU = 활성 단위.
도 13a 내지 13c는 상이한 유형의 fBLT에 의한 결과를 보여준다. (a) A18이노신(I18), C17-8-옥소구아닌(O17), 및 G19U(U19) 돌연변이에 의한 백분율 전환 결과. (b) I18, O17 및 U19에 의한 변이체 콜링(calling) 성능 결과. (c) I18, G19I(I19), O17, A18O(O18), 및 G19O(O19)에 의한 백분율 전환 결과. 결과는 일반적으로 G19I(I19)의 최고 성능을 갖는 이노신으로 치환된 모자이크 말단을 갖는 BLT의 고성능을 나타냈다.
도 14는 키메라 리드(read)에 대한 데이터를 나타낸다. 우라실을 포함하는 변형된 트랜스포존 말단의 사용은 이노신 또는 옥소구아닌을 포함하는 변형된 트랜스포존 말단에 비해 보다 높은 키메라 리드의 백분율을 야기할 수 있다.
도 15a 및 15b는 fBLT와 다른 라이브러리 제조 단편화 방법(즉, 표준 절차에 따라 Covaris 초음파처리기로 수행된 초음파처리 또는 NEBNext® dsDNA Fragmentase®)의 비교를 나타낸다. (a) 워크플로우 개요. (b) NA12878 백그라운드로의 NA12877의 50 ng 주입 gDNA 1% 혼합물을 측정(84개의 이형접합 변이체 및 0.5% 변이 대립유전자 빈도(VAF) 포함)하는 상이한 방법에 의한 변이체 콜링 성능의 감도 및 특이도 요약.
도 16은 초음파처리에 의해 제조된 샘플에 대해 실질적으로 오류율이 더 높은 것을 포함하여, 단편화에 의한 라이브러리 제조의 상이한 방법의 오류율을 보여준다.
도 17은 상이한 단편화 방법의 라이브러리 전환 효율을 보여준다. 전체적으로, fBLT는 다른 라이브러리 전환 방법보다 탁월하였다. 샘플 1은 NA12878 백그라운드 중 NA12877의 게놈 DNA 1% 혼합물이다. 샘플 2 내지 6은 포르말린 고정된 파라핀 내장(FFPE) 조직이다. dCq는 보다 낮은 품질의 샘플에 해당하는 상승된 값의, DNA 품질의 척도이다. 따라서, 다른 샘플에 비해 샘플 1의 전환 효율이 더 높다는 것은, FFPE 조직의 DNA 품질이 더 낮기 때문에, 라이브러리 전환이 일반적으로 FFPE 조직으로부터 감소된다는 사실을 강조한다.
도 18a 및 18b는 FFPE 조직 샘플로부터 단편을 생성하기 위해 fBLT를 이용하는 단일 태그먼트화 사건을 포함하는 방법을 요약한다. (a) 워크플로우 개요. (b) 상이한 조직으로부터 구제된(rescue) 단편 백분율. 샘플 번호는 도 17에 요약된 것과 동일하다. dCq는 보다 낮은 품질의 샘플에 해당하는 상승된 값의, DNA 품질의 척도이다. 따라서, 샘플 1에 대해 구제된 단편의 더 낮은 백분율은 FFPE 조직을 이용한 샘플 2 내지 6에 비해 이러한 게놈 DNA 샘플에서 더 높은 품질을 나타낸다(즉, 단일 태그먼트화 사건으로부터 더 적은 단편이 존재하고, 대부분의 단편은 2개의 태그먼트화 사건으로부터임). 게놈 DNA와 대조적으로 FFPE 조직으로부터 더 높은 비율의 샘플을 구제하였는데, 이는 이의 보다 낮은 품질로 인해 FFPE 조직에서 더 많은 단일 태그먼트화 사건이 있을 수 있기 때문이다.
도 19는 fBLT를 사용하는 태그먼트화 프로토콜의 일부 이점과 유연성을 요약한다. 특히, 방법은 사용자가 추구할 수 있는 상이한 워크플로우를 허용하는 어댑터의 결찰을 허용한다. 도시된 것과 같이, 어댑터는 동일한 단편의 앰플리콘으로부터 상이한 고유 단편을 결정하기 위한 고유 분자 식별자(UMI)를 포함할 수 있다. 대안적으로, 분기형 어댑터는 인덱스를 혼입하기 위해 PCR과 워크플로우에서 사용될 수 있거나, 인덱싱된 분기형 어댑터는 PCR이 없는 워크플로우에서 사용될 수 있다.
도 20은 fBLT 및 선택적 농축을 사용하는 라이브러리 제조를 위한 표준 워크플로우를 요약한다. 사각형과 삼각형은 사용자가 반응 샘플을 처리해야 할 단계를 나타낸다. 대략 5.5시간의 전체 라이브러리 제조 시간은 다른 결찰-기반 라이브러리 제조 방법과 유사하다. 선택적 농축은 예를 들어 암 환자의 FFPE 조직 샘플로부터 라이브러리를 제조하는 경우, 암-관련 패널로 농축하도록 사용될 수 있다.
서열의 설명
하기 표 1은 본원에 참조된 특정 서열의 목록을 제공한다. 표 내에서, /3BiotinN/ 및 /5Phos/은 각각 3' 비오틴 및 5' 포스페이트를 나타낸다. /i8oxodG/는 내부 8-oxoG 뉴클레오티드를 나타내고, /38oxodG/는 3' 위치에서의 8-oxoG 뉴클레오티드를 나타낸다.
[표 1]

실시형태들의 설명
I. 모자이크 말단 서열에 돌연변이를 갖는 변형된 트랜스포존 말단
본원에 기재된 것은 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열이다. 일부 실시형태에서, 이러한 변형된 트랜스포존 말단 서열은 전위 후 모자이크 말단 서열의 절단 및 제거를 허용하는 모자이크 말단 서열을 포함한다. 전위에 대한 중요한 요건은 Tn5에 의해 특이적으로 인식되며 이의 전위 활성에 요구되는 "모자이크 말단"(ME)이다. Tn5는 "외부 말단"(OE) 및 "내부 말단"(IE) 서열(표 2에 도시된 것과 같음)을 천연적으로 인식하며, 이는 돌연변이에 대해 매우 내성이 없는 것으로 나타났고, 이때 대부분의 돌연변이는 감소된 활성을 야기한다(문헌[J. C. Makris et al. PNAS 85(7):2224-28 (1988)] 참조). 이후의 연구는 돌연변이 Tn5 효소와 함께 "모자이크 말단"으로 지칭된 IE 및 OE에서 유래된 키메라 서열(표 2)이, 천연 시스템에 대해 대략 100배로 전위 활성을 증가시켰음을 입증하였다(문헌[Maggie Zhou et al., Journal of Molecular Biology 276(5): 913-25 (1998)] 참조). 이러한 과활성 시스템은 Illumina의 Illumina DNA Flex PCR-Free(RUO) 제품에서 사용된다. DNA 기질과 복합체를 이루는 Tn5의 결정 구조는 19개의 염기쌍 중 13개가 핵염기-특이적 결정 접촉을 갖는 반면(문헌[Douglas R. Davies et al., Science 289 5476:77-85 (2000)] 참조), 다른 염기는 촉매작용에서 역할을 하는 것으로 보임을 나타낸다(문헌[Mindy Steiniger-White et al., Journal of Molecular Biology 322(5): 971-82 (2002)] 참조). 일반적으로, Tn5의 활성은 생체내 리포터 시스템에 의해 평가되었다(문헌[Zhou et al. J . Mol . Biol . 276:913-925 (1998)]에 기재된 돌기형성(papillation) 검정).
[표 2]

표 2에서, 일반 폰트의 서열은 공유 서열을 나타내고, 이중 밑줄표시된 이탤릭체의 서열은 천연 OE 기질로부터 유래된 것이고 , 볼드 이탤릭체의 서열은 천연 IE 기질로부터 유래된 것이다.
대표적인 야생형 모자이크 말단 서열(이전된 가닥)은 서열 번호 1이다. 다양한 돌연변이 Tn5 및 트랜스포존 말단은 국제공개 WO 2015160895호 및 미국 특허 제9080211호에 기재되어 있고, 이들 각각은 이의 전문이 본원에 참조로 포함되며, 본원에 기재된 방법에 사용하기에 적절할 수 있다.
여러 DNA 효소 또는 효소 조합은 그 중에서 우라실, 이노신, 리보오스 염기, 8-oxoG, 티민 글리콜, 변형된 퓨린, 및 변형된 피리미딘과 같은 변형된 염기의 선택적 제거를 매개할 수 있다(표 3 및 www.international.neb.com/tools-and-resources/selection-charts에서 2022년 1월 20일자에 다운로드된 문헌[Properties of DNA Repair Enzymes and Structure-specific Endonucleases] 및 [Jacobs and Schr Chromosoma 121:1-20 (2012)] 참조). 상기 효소는 변형 특이적 엔도뉴클레아제 또는 변형 특이적 글리코실라아제를 포함한다. 변형 특이적 글리코실라아제와의 사용을 위한 변형된 퓨린은 3-메틸아데닌(3mA) 및 7-메틸구아닌(7mG)을 포함한다. 변형 특이적 글리코실라아제와 함께 사용하기 위한 변형된 피리미딘은 5-메틸시토신(5mC), 5-포르밀시토신(5fC), 및 5-카르복시시토신(5caC)을 포함할 수 있다. DNA 복구 효소를 사용하는 우라실 및 8-oxoG의 선택적인 제거가 특정 시퀀싱 플랫폼에서 이미 사용되고 있다.
"이전된 가닥"으로 지칭된 모자이크 말단의 단 한 가닥만이 전위 중 라이브러리 삽입물에 공유 결합되기 때문에, 이와 같은 변형된 염기의 특히 모자이크 말단 이전된 가닥으로의 혼입은 모자이크 말단 이전된 가닥의 선택적 절단 및 제거를 가능하게 할 수 있다. 그러나, 이러한 유형의 모자이크 말단 절단 및 제거는 이의 기준 서열(서열 번호 1)로부터 모자이크 말단 서열의 돌연변이를 요구할 것이다.
[표 3]

표 3에서, Endo = 엔도뉴클레아제, FPG = 포름아미도피리미딘-DNA 글리코실라아제, OGG = 옥소구아닌 글리코실라아제(OGG), hAAG = 인간 3-알킬아데닌 DNA 글리코실라아제, UNG = 우라실-N-글리코실라아제, Nth = 클로닝된 n번째 유전자, TDG = 티민-DNA 글리코실라아제, MBD4 = 포유류 DNA 글리코실라아제-메틸-CpG 결합 도메인 단백질 4, 및 ROS1 = 엔도뉴클레아제 ROS1(이관능성 DNA 글리코실라아제/리아아제 활성을 가짐).
본원에 개시된 것은 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열로서, 모자이크 말단 서열은 야생형 모자이크 말단 서열에 비해 하나 이상의 돌연변이를 포함하고, 돌연변이는 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린(예컨대, 3mA 또는 7mG); 또는 변형된 피리미딘과의 치환을 포함한다. 일부 실시형태에서, 이러한 치환은 하기 기재된 것과 같이 전위 후 트랜스포존 말단을 절단하기 위한 방법에서 사용된다.
일부 실시형태에서, 모자이크 말단 서열은 Tn5 트랜스포사아제와 함께 사용하기 위한 모자이크 말단 서열일 수 있다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 서열 번호 1에 비해 모자이크 말단 서열에 돌연변이를 갖는다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 서열 번호 1에 비해 하나 이상의 돌연변이를 포함하는 모자이크 말단 서열을 포함하고, 여기서 하나 이상의 돌연변이는 A16, C17, A18, 및/또는 G19에서의 치환을 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16에서의 치환을 포함하는 모자이크 말단 서열을 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 C17에서의 치환을 포함하는 모자이크 말단 서열을 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A18에서의 치환을 포함하는 모자이크 말단 서열을 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 G19에서의 치환을 포함하는 모자이크 말단 서열을 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 서열 번호 5, 7, 9, 또는 14 내지 22를 포함한다. 대표적인 변형된 트랜스포존 말단 서열을 갖는 데이터는 도 6a(용액 중 전위) 및 도 12(fBLT에 의해 매개된 전위)에 도시되어 있다.
일부 실시형태에서, 모자이크 말단 서열은 하나 초과의 돌연변이를 포함한다. 일부 실시형태에서, 모자이크 말단 서열은 야생형 서열(일부 실시형태에서, 서열 번호 1)에 비해 8개 이하의 돌연변이를 포함한다.
A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 추가의 돌연변이가 모자이크 말단 서열에 존재할 수도 있다. 일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 하나 이상의 돌연변이를 포함한다. 일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 포함한다.
일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 2개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 3개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 4개의 치환 돌연변이를 갖는다.
일부 실시형태에서, A16에서의 치환은 A16T, A16C, A16G, A16U, A16이노신, A16리보오스, A16-8-옥소구아닌, A16티민 글리콜, A16변형된 퓨린, 또는 A16변형된 피리미딘이고; C17에서의 치환은 C17T, C17A, C17G, C17U, C17이노신, C17리보오스, C17-8-옥소구아닌, C17티민 글리콜, C17변형된 퓨린, 또는 C17변형된 피리미딘이고; A18에서의 치환은 A18G, A18T, A18C, A18U, A18이노신, A18리보오스, A18-8-옥소구아닌, A18티민 글리콜, A18변형된 퓨린, 또는 A18변형된 피리미딘이고; 그리고/또는 G19에서의 치환은 G19T, G19C, G19A, G19U, G19이노신, G19리보오스, G19-8-옥소구아닌, G19티민 글리콜, G19변형된 퓨린, 또는 G19변형된 피리미딘이다. 일부 실시형태에서, 변형된 퓨린은 3mA 또는 7mG이다. 일부 실시형태에서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신이다.
일부 실시형태에서, 돌연변이는 우라실; 이노신; 리보오스; 8-옥소구아닌; 티민 글리콜; 변형된 퓨린; 및/또는 변형된 피리미딘으로의 치환을 포함한다. 일부 실시형태에서, 이러한 돌연변이는 전위 후 모자이크 말단 서열을 절단하기 위한 방법을 허용한다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 또는 G19에서의 돌연변이를 포함한다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 2개의 돌연변이를 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 3개의 돌연변이를 포함한다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 및 G19에서의 4개의 돌연변이를 포함한다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 및/또는 G19에서의 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 야생형 서열(일부 실시형태에서, 서열 번호 1)에 비해 1개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 야생형 서열(일부 실시형태에서, 서열 번호 1)에 비해 2개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 야생형 서열(일부 실시형태에서, 서열 번호 1)에 비해 3개의 치환 돌연변이를 갖는다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 야생형 서열(일부 실시형태에서, 서열 번호 1)에 비해 4개의 치환 돌연변이를 갖는다.
II. 전위-결찰 라이브러리 제조 방법
본원에 개시된 것은 어댑터의 결찰과 전위를 결합하는 라이브러리 제조 방법이다. 따라서, 이러한 라이브러리 제조 방법은 "혼성 전위-결찰 라이브러리 제조"로 지칭될 수 있다. 상기 방법은 전위 후 이전된 트랜스포존 말단의 절단을 허용하는 변형된 Tn5-모자이크 말단 서열을 사용할 수 있다(도 1a에 도시된 것과 같음). 본원에서 사용된, "혼성 Tn5-결찰 접근법"은 전위, 모자이크 말단 서열의 절단, 및 어댑터의 결찰을 수반하는 방법을 나타낸다.
일부 실시형태에서, 모자이크 말단 서열의 절단은 라이브러리 단편으로부터의 이의 제거를 허용한다. 본 발명의 방법이 모자이크 말단 서열의 절단 후 결찰을 사용하지만, 잠재적인 다운스트림 시퀀싱 방법을 위한 어댑터를 혼입하기 위해 본 발명의 방법은 어댑터 서열의 결찰을 필요로 하는 실시형태에 제한되지 않는다.
모자이크 말단 서열의 단편화를 위해 설계된 BLT는 "단편화효소 BLT"(fBLT)로 지칭될 수 있다. fBLT 그 자체는 단편화효소를 포함하지 않지만, fBLT는 생성된 단편이 모자이크 말단 서열의 전부 또는 일부가 결여되는 점에서 단편화효소로 제조된 것과 유사한 단편을 제조하도록 설계된다. fBLT는 전위를 통한 단편 생성 후 모자이크 말단 서열의 전부 또는 일부를 제거하기 위해 절단(전위 후)을 위해 설계된다.
본 발명의 방법은 라이브러리 단편으로부터 모자이크 말단 서열의 프로그래밍된 절단을 통해, Tn5 트랜스포사아제와 같은 트랜스포사아제의 어댑터 결찰 활성과 효소적 단편화를 분리할 수 있다. 본원에 기재된 것과 같이, 트랜스포사아제, 일부 실시형태에서 Tn5는 모자이크 말단 기질 내에서 다수의 돌연변이 및 핵염기 변형을 용인할 수 있다. 모자이크 말단의 이전된 가닥 내에 변형된 염기를 혼입함으로써, 효소는 선택적 절단과 제거를 가능하게 할 수 있다. 이러한 기술은 라이브러리 삽입물에 인접한 19-bp 모자이크 말단 서열을 필요로 하는 제약을 제거하고, 혼성 트랜스포사아제-결찰 라이브러리 제조 접근법을 가능하게 하여, 이에 따라 결찰 화학을 기반으로 개발된 라이브러리 제조 워크플로우에서 fBLT가 활용될 수 있도록 한다. 따라서, 본 발명의 방법은 dsDNA를 기계적으로 전단하거나 효소적으로 단편화한 후, 말단 복구 및 어댑터 결찰을 위한 이전의 워크플로우를 개선한다(도 1b).
본원에 기재된 것은, 핵산을 포함하는 샘플을 트랜스포좀 복합체와 조합하는 단계와 단편을 제조하는 단계; 샘플을, 효소 또는 효소 혼합물과 조합하는 단계 및 모자이크 말단 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계; 및 어댑터를 단편의 5' 및/또는 3' 말단 상에 결찰하는 단계를 포함하는, 어댑터를 포함하는 이중가닥 핵산 단편의 제조 방법이다. 일부 실시형태에서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌이다. 일부 실시형태에서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신이다. 일부 실시형태에서, 효소 또는 효소 혼합물은 변형 특이적 엔도뉴클레아제 또는 변형 특이적 DNA 글리코실라아제이다. 일부 실시형태에서, 변형 특이적 DNA 글리코실라아제는 변형 특이적일 필요가 없는 엔도뉴클레아제/리아아제와 함께 사용된다. 대신, 엔도뉴클레아제/리아아제는 무염기성 부위를 인식한다.
일부 실시형태에서, 효소 또는 효소 혼합물은 (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합이다.
일부 실시형태에서, 방법은 단일 반응 용기에서 수행된다. 즉, 방법은 반응 생성물을 서로 분리할 필요 없이 수행될 수 있다.
A. 트랜스포좀 복합체
본원에서 사용된 "트랜스포좀 복합체" 또는 "트랜스포좀"은 적어도 하나의 트랜스포사아제(또는 본원에 기재된 다른 효소) 및 트랜스포존 인식 서열로 구성된다. 본 발명은 특정 트랜스포사아제에 제한되지 않는다.
"트랜스포좀 복합체"는 적어도 하나의 트랜스포사아제 효소 및 트랜스포존 인식 서열로 구성된다. 일부 상기 시스템에서, 트랜스포사아제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉매화할 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중가닥 트랜스포존 말단 서열이다. 트랜스포사아제 또는 인테그라아제는 표적 핵산 내의 트랜스포사아제 인식 부위에 결합하고, 트랜스포존 인식 서열을 표적 핵산에 삽입한다. 일부 상기 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 한 가닥이 표적 핵산에 이전되어, 절단 사건도 야기한다. 본 개시내용의 트랜스포사아제와 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 전위 절차 및 시스템은 예를 들어 국제출원 WO10/048605호, 미국 특허출원공개 US 2012/0301925호, US 2012/13470087호, 또는 US 2013/0143774호에 기재되어 있으며, 이들 각각은 이의 전문이 본원에 참조로 포함된다.
일부 상기 시스템에서, 트랜스포사아제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉매화할 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중가닥 트랜스포존 말단 서열이다. 트랜스포사아제는 표적 핵산 내 트랜스포사아제 인식 부위에 결합하여, 트랜스포존 인식 서열을 표적 핵산에 삽입한다. 일부 상기 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 하나의 가닥이 표적 핵산으로 이전되어, 절단 사건이 일어난다. 트랜스포사아제와 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 전위 절차 및 시스템.
"트랜스포사아제"는 트랜스포존 말단 함유 조성물(예를 들어, 트랜스포존, 트랜스포존 말단, 트랜스포존 말단 조성물)과 기능성 복합체를 형성할 수 있고, 트랜스포존 말단 함유 조성물의 이중가닥 표적 핵산으로의 삽입 또는 전위를 촉매화할 수 있는 효소를 의미한다. 본원에 제시된 것과 같은 트랜스포사아제는 또한 레트로트랜스포존 및 레트로바이러스 유래의 인테그라아제를 포함할 수 있다.
본원에 제공된 특정 실시형태와 사용될 수 있는 예시적 트랜스포사아제는 다음을 포함한다(또는 이에 의해 인코딩됨): Tn5 트랜스포사아제, 슬리핑 뷰티(SB: sleeping beauty) 트랜스포사아제, 비브리오 하베이(Vibrio harveyi), R1 및 R2 말단 서열을 포함하는 Mu 트랜스포사아제 인식 부위 및 MuA 트랜스포사아제, 황색 포도상구균 Tn552, Ty1, Tn7 트랜스포사아제, Tn/O 및 IS10, 마리너 트랜스포사아제, Tc1, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존. 추가의 예는 IS5, Tn10, Tn903, IS911, 및 트랜스포사아제 패밀리 효소의 조작된 버전을 포함한다. 본원에 기재된 방법은 단지 단일 트랜스포사아제가 아니라, 트랜스포사아제의 조합도 포함할 수 있다.
일부 실시형태에서, 트랜스포사아제는 Tn5, Tn7, MuA, 또는 비브리오 하베이 트랜스포사아제, 또는 이의 활성 돌연변이체이다. 다른 실시형태에서, 트랜스포사아제는 Tn5 트랜스포사아제 또는 이의 돌연변이체이다. 다른 실시형태에서, 트랜스포사아제는 Tn5 트랜스포사아제 또는 이의 돌연변이체이다. 다른 실시형태에서, 트랜스포사아제는 Tn5 트랜스포사아제 또는 이의 활성 돌연변이체이다. 일부 실시형태에서, Tn5 트랜스포사아제는 과활성 Tn5 트랜스포사아제 또는 이의 활성 돌연변이체이다. 일부 양태에서, Tn5 트랜스포사아제는 국제공개 WO 2015/160895호에 기재된 바와 같은 Tn5 트랜스포사아제이며, 이는 본원에 참조로 포함된다. 일부 양태에서, Tn5 트랜스포사아제는 야생형 Tn5 트랜스포사아제에 비해 위치 54, 56, 372, 212, 214, 251, 및 338에서 돌연변이를 갖는 과활성 Tn5이다. 일부 양태에서, Tn5 트랜스포사아제는 야생형 Tn5 트랜스포사아제에 비해 하기 돌연변이를 갖는 과활성 Tn5이다: E54K, M56A, L372P, K212R, P214R, G251R 및 A338V. 일부 실시형태에서, Tn5 트랜스포사아제는 융합 단백질이다. 일부 실시형태에서, Tn5 트랜스포사아제 융합 단백질은 융합된 신장 인자 Ts(Tsf) 태그를 포함한다. 일부 실시형태에서, Tn5 트랜스포사아제는 야생형 서열에 비해 54, 56, 및 372 아미노산에 돌연변이를 포함하는 과활성 Tn5 트랜스포사아제이다. 일부 실시형태에서, 과활성 Tn5 트랜스포사아제는 융합 단백질이며, 선택적으로 융합된 단백질은 신장 인자 Ts(Tsf)이다. 일부 실시형태에서, 인식 부위는 Tn5형 트랜스포사아제 인식 부위이다(문헌[Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998]). 일 실시형태에서, 과활성 Tn5 트랜스포사아제와 복합체를 형성하는 트랜스포사아제 인식 부위가 사용된다(예를 들어, EZ-Tn5TM 트랜스포사아제, 위스콘신주 매디슨 소재 Epicentre Biotechnologies). 일부 실시형태에서, Tn5 트랜스포사아제는 야생형 Tn5 트랜스포사아제이다.
전반에 걸쳐서 사용된 용어 트랜스포사아제는 트랜스포존-함유 조성물(예를 들어, 트랜스포존, 트랜스포존 조성물)과 기능성 복합체를 형성할 수 있으며, 시험관 내 전위 반응에서 인큐베이션되는 이중가닥 표적 핵산 내로의 트랜스포존-함유 조성물의 삽입 또는 전위를 촉매화할 수 있는 효소를 지칭한다. 제공된 방법의 트랜스포사아제는 레트로트랜스포존 및 레트로바이러스로부터의 인테그라아제도 포함한다. 제공된 방법에 사용될 수 있는 예시적 트랜스포사아제는 Tn5 트랜스포사아제 및 MuA 트랜스포사아제의 야생형 또는 돌연변이 형태를 포함한다.
"전위 반응"은 하나 이상의 트랜스포존이 무작위 부위 또는 거의 무작위 부위에서 표적 핵산 내로 삽입되는 반응이다. 전위 반응에서의 필수 구성성분은 이전된 트랜스포존 서열 및 이의 상보체(즉, 비이전된 트랜스포존 말단 서열)뿐만 아니라 기능성 전위 또는 트랜스포좀 복합체를 형성하는 데 필요한 기타 구성성분을 포함하는 트랜스포존의 뉴클레오티드 서열을 나타내는 DNA 올리고뉴클레오티드 및 트랜스포사아제이다. 본 개시내용의 방법은 과활성 Tn5 트랜스포사아제 및 Tn5형 트랜스포존 말단에 의해, 또는 MuA 또는 HYPERMu 트랜스포사아제 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포존 말단에 의해 형성된 전위 복합체를 이용함으로써 예시된다(예를 들어, 문헌[Goryshin, I. and Reznikoff, W. S., J. Biol. Chem., 273: 7367, 1998]; 및 [Mizuuchi, Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995]을 참조하며, 이들은 이의 전문이 본원에 참조로 포함됨). 그러나, 이의 의도된 목적을 위해 표적 핵산을 태깅하기에 충분한 효율로 무작위 또는 거의 무작위 방식으로 트랜스포존 말단을 삽입할 수 있는 임의의 전위 시스템이 제공된 방법에서 사용될 수 있다. 제공된 방법에 사용될 수 있는 공지된 전위 시스템의 다른 예는 스타필로코쿠스 아우레우스 Tn552, Tyl, 트랜스포존 Tn7, Tn/O 및 IS 10, 마리너 트랜스포사아제, Tel, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존을 포함하지만 이에 제한되지 않는다(예를 들어, 문헌[Colegio O R et al, J. Bacteriol., 183: 2384-8, 2001]; [Kirby C et al, Mol. Microbiol., 43: 173-86, 2002]; [Devine S E, and Boeke J D., Nucleic Acids Res., 22: 3765- 72, 1994]; 국제공개 WO 95/23875호; [Craig, N L, Science. 271 : 1512, 1996]; [Craig, N L, Review in: Curr Top Microbiol Immunol., 204: 27-48, 1996]; [Kleckner N, et al., Curr Top Microbiol Immunol., 204: 49-82, 1996]; [Lampe D J, et al., EMBO J., 15: 5470-9, 1996] [Plasterk R H, Curr Top Microbiol Immunol, 204: 125-43, 1996]; [Gloor, G B, Methods Mol. Biol, 260: 97-1 14, 2004]; [Ichikawa H, and Ohtsubo E., J Biol. Chem. 265: 18829-32, 1990]; [Ohtsubo, F and Sekine, Y, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996]; [Brown P O, et al, Proc Natl Acad Sci USA, 86: 2525-9, 1989]; [Boeke J D and Corces V G, Annu Rev Microbiol. 43: 403-34, 1989]를 참조하고; 이들은 모두 이의 전문이 본원에 참조로 포함됨).
트랜스포존을 표적 서열 내로 삽입하기 위한 방법은 적합한 시험관 내 전위 시스템이 이용 가능하거나, 당업계의 지식을 기반으로 개발될 수 있는 임의의 적합한 트랜스포존 시스템을 사용하여 시험관 내에서 수행될 수 있다. 일반적으로, 본 개시내용의 방법에 사용하기에 적합한 시험관내 전위 시스템은 충분한 순도, 충분한 농도와 충분한 시험관 내 전위 활성의 트랜스포사아제 효소, 및 트랜스포사아제가 전위 반응을 촉매화할 수 있는 각각의 트랜스포사아제와 기능성 복합체를 형성하는 트랜스포존을 최소한 필요로 한다. 사용될 수 있는 적합한 트랜스포사아제 트랜스포존 말단 서열은 트랜스포사아제의 야생형, 유도체, 또는 돌연변이 형태 중에서 선택된 트랜스포사아제와 복합체를 형성하는 야생형, 유도체, 또는 돌연변이 트랜스포존 말단 서열을 포함하지만 이에 제한되지는 않는다.
일부 실시형태에서, 트랜스포사아제는 Tn5 트랜스포사아제를 포함한다. 일부 실시형태에서, Tn5 트랜스포사아제는 과활성 Tn5 트랜스포사아제이다.
일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사아제의 2개의 분자의 이량체를 포함한다. 일부 실시형태에서, 트랜스포좀 복합체는 동종이량체이며, 여기서 트랜스포사아제의 2개의 분자는 각각 동일한 유형의 제1 트랜스포존과 제2 트랜스포존에 결합된다(예를 들어, 각각의 단량체에 결합된 2개의 트랜스포존의 서열은 동일하여, "동종이량체"를 형성함). 일부 실시형태에서, 본원에 기재된 조성물 및 방법은 트랜스포좀 복합체의 2개 집단을 이용한다. 일부 실시형태에서, 각각의 집단 내 트랜스포사아제는 동일하다. 일부 실시형태에서, 각각의 집단 내 트랜스포좀 복합체는 동종이량체이며, 여기서 제1 집단은 각각의 단량체에 제1 어댑터 서열을 갖고, 제2 집단은 각각의 단량체에 상이한 어댑터 서열을 갖는다.
용어 "트랜스포존 말단"은 시험관내 전위 반응에서 기능성인 트랜스포사아제 또는 인테그라아제 효소와 복합체를 형성하는 데 필요한 뉴클레오티드 서열("트랜스포존 말단 서열")만을 나타내는 이중가닥 핵산 DNA를 지칭한다. 일부 실시형태에서, 트랜스포존 말단은 전위 반응에서 트랜스포사아제와 기능성 복합체를 형성할 수 있다. 비제한적인 예로서, 트랜스포존 말단은 야생형 또는 돌연변이 Tn5 트랜스포사아제에 의해 인식된 19-bp 외부 말단("OE") 트랜스포존 말단, 내부 말단("IE") 트랜스포존 말단 또는 "모자이크 말단"("ME") 트랜스포존 말단, 또는 미국 특허출원공개 US 2010/0120098호의 개시내용에 제시된 바와 같은 R1 트랜스포존 말단과 R2 트랜스포존 말단을 포함할 수 있으며, 이의 내용은 이의 전문이 본원에 참조로 포함된다. 트랜스포존 말단은 시험관내 전위 반응에서 트랜스포사아제 또는 인테그라아제 효소와 기능성 복합체를 형성하기에 적합한 임의의 핵산 또는 핵산 유사체를 포함할 수 있다. 예를 들어, 트랜스포존 말단은 DNA, RNA, 변형된 염기, 비천연 염기, 변형된 백본을 포함할 수 있으며, 한 가닥 또는 양 가닥에 닉을 포함할 수 있다. "DNA"라는 용어가 트랜스포존 말단의 조성과 관련하여 본 개시내용의 전반에 걸쳐 사용되지만, 임의의 적합한 핵산 또는 핵산 유사체가 트랜스포존 말단에 이용될 수 있음을 이해해야 한다.
용어 "이전된 가닥"은 전위 반응 동안 샘플로부터 핵산의 단편으로 이전되는 한 쌍의 트랜스포존의 일부를 지칭한다. 유사하게, 용어 "비이전된 가닥"은 전위 반응 동안 샘플로부터 핵산의 단편으로 이전되지 않는 한 쌍의 트랜스포존의 일부를 지칭한다. 한 쌍의 트랜스포존 내에, 이전된 가닥 및 비이전된 가닥은 전부 또는 일부 상보적일 수 있다. 이전된 가닥의 3'-말단은 시험관내 전위 반응에서 표적 DNA에 접합되거나, 이로 이전된다. 이전된 트랜스포존 말단 서열과 전부 또는 일부 상보적인 트랜스포존 말단 서열을 나타내는 비이전된 가닥은 시험관내 전위 반응에서 표적 DNA에 접합되지 않거나 이전되지 않는다.
일부 실시형태에서, 이전된 가닥 및 비이전된 가닥은 공유 결합된다. 예를 들어, 일부 실시형태에서, 이전된 가닥 및 비이전된 가닥 서열은 예를 들어 헤어핀 배열로 단일 올리고뉴클레오티드 상에 제공된다. 이와 같이, 비이전된 가닥의 자유 말단은 전위 반응에 의해 직접 표적 DNA에 접합되지는 않지만, 비이전된 가닥은 헤어핀 구조의 루프에 의해 이전된 가닥에 연결되기 때문에, 비이전된 가닥은 간접적으로 DNA 단편에 부착되게 된다. 트랜스포좀 구조 및 트랜스포좀을 제조하고 사용하는 방법의 추가적 예는 미국 특허출원공개 US 2010/0120098호의 개시내용에서 확인될 수 있으며, 이의 내용은 이의 전문이 본원에 참조로 포함된다.
본원에서 사용된, "트랜스포좀 복합체" 및 "트랜스포좀"은 등가이다.
일부 실시형태에서, 제1 트랜스포존은 전위 반응에 이전된 가닥을 포함한다. 일부 실시형태에서, 제2 트랜스포존은 전위 반응에서 비이전된 가닥을 포함한다.
일부 실시형태에서, 트랜스포좀은 모자이크 말단 서열에서 돌연변이를 갖는 변형된 트랜스포존 말단을 포함한다.
일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사아제; 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린 및/또는 변형된 피리미딘을 포함하는 변형된 트랜스포존 말단 서열을 포함하는 제1 트랜스포존; 및 제1 트랜스포존 말단 서열의 적어도 일부와 상보적인 제2 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 리보오스를 포함하고, 트랜스포좀 복합체는 용액 중에 있다. 일부 실시형태에서, 제1 트랜스포존은 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 고체 지지체 상에 고정된다.
일부 실시형태에서, 제1 트랜스포존은 변형된 트랜스포존 말단 서열을 포함한다. 일부 실시형태에서, 트랜스포사아제는 Tn5이다. 일부 실시형태에서, 제1 트랜스포존은 이전된 가닥이다. 일부 실시형태에서, 제2 트랜스포존은 비이전된 가닥이다.
일부 실시형태에서, 제1 트랜스포존의 우라실은 제2 트랜스포존의 A와 염기쌍을 형성한다. 일부 실시형태에서, 제1 트랜스포존의 이노신은 제2 트랜스포존의 C와 염기쌍을 형성한다. 일부 실시형태에서, 제1 트랜스포존의 리보오스는 제2 트랜스포존의 A, C, T, 또는 G와 염기쌍을 형성한다. 일부 실시형태에서, 제1 트랜스포존의 티민 글리콜은 제2 트랜스포존의 A와 염기쌍을 형성한다. 일부 실시형태에서, 변형된 퓨린은 제2 트랜스포존의 T와 염기쌍을 형성하는 제1 트랜스포존의 3-메틸아데닌이다. 일부 실시형태에서, 변형된 퓨린은 제2 트랜스포존의 C와 염기쌍을 형성하는 제1 트랜스포존의 7-메틸구아닌이다. 일부 실시형태에서, 변형된 피리미딘은 제2 트랜스포존의 G와 염기 쌍형성하는 제1 트랜스포존의 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신이다.
일부 실시형태에서, 제2 트랜스포존은 서열 번호 1과 상보적인 서열을 포함한다. 일부 실시형태에서, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열을 포함한다. 일부 실시형태에서, 제2 트랜스포존은 서열 번호 4를 포함한다.
일부 상황에서, 제2 트랜스포존 말단은 제1 트랜스포존 말단과 전부 상보적일 수 있는 반면, 다른 상황에서, 이는 부분 상보적일 수 있다. 이론에 의해 구속되지 않으면서, 트랜스포사아제는 한 쌍의 트랜스포존 말단(즉, 제1 트랜스포존과 제2 트랜스포존)이 적은 돌연변이를 포함할 때 더 큰 활성을 가질 수 있다. 예를 들어, 서열 번호 1과 상보적인 서열(즉, 야생형 모자이크 말단 서열의 상보체)을 포함하는 제2 트랜스포존을 포함하는 트랜스포좀 복합체는 본원에 기재된 것과 같은 변형된 트랜스포존 말단 서열을 포함하는 제1 트랜스포존 말단과 상보적인 제2 트랜스포존 말단을 포함하는 트랜스포좀 복합체보다 큰 활성을 매개할 수 있다. 다른 상황에서, 제2 트랜스포존은 트랜스포존 쌍의 보다 타이트한 어닐링을 촉진하기 위해 제1 트랜스포존과 전부 상보적일 수 있다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌, 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 트랜스포좀 복합체는 제1 트랜스포존 및 제2 트랜스포존을 포함하는 한 쌍의 트랜스포존을 포함하고, 제1 트랜스포존은 본원에 기재된 것과 같은 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 야생형 모자이크 말단 서열과 상보적인 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열을 포함한다. 한 쌍의 트랜스포존은 본원에 기재된 임의의 변형된 트랜스포존 말단 서열을 포함할 수 있다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌, 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함한다.
일부 실시형태에서, 제1 트랜스포존이 야생형 모자이크 말단 서열에 비해 돌연변이를 포함하는 위치에서 제1 트랜스포존과 제2 트랜스포존 사이에 미스매치가 존재한다. 즉, 제1 트랜스포존 및 제2 트랜스포존은 전부 상보적일 필요가 없다(즉, 제1 트랜스포존에서의 U는 제2 트랜스포존에서의 A와 염기쌍을 형성할 필요가 없음).
1. 용액 중 트랜스포좀 복합체
일부 실시형태에서, 용액상 트랜스포좀 복합체 또는 가용성 트랜스포좀 복합체로 지칭될 수 있는 트랜스포좀 복합체는 용액 중에 있다. 일부 실시형태에서, 용액상 트랜스포좀 복합체에 결합된 이중가닥 핵산(예컨대, DNA)은 용액 중 유리 상태인 핵산 단편을 산출하기 위한 태그먼트화를 수행한다. 본원에서 "태그먼트화"라고 지칭된 이와 같은 과정은 종종 트랜스포존 말단 서열을 포함하는 어댑터와 복합체화된 트랜스포사아제 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 수반한다. 일부 실시형태에서, 용액은 태그먼트화 완충제이다.
가용성 태그먼트화로 이용가능한 프로토콜은 Illumina DNA Nextera® XT DNA 라이브러리 제조 키트(Nextera XT 참조 지침, 문서 770-2012-011 참조)에 기재된 것과 같이 당업계에 잘 알려져 있다. 가용성 태그먼트화를 이용한 대표적인 데이터는 도 7c 내지 9에 도시되어 있다.
일부 실시형태에서, 특정 변형된 트랜스포존 말단은 전위 반응이 용액 중에서 수행될 때 더 잘 수행될 수 있다. 예를 들어, 리보오스를 포함하는 변형된 트랜스포존 말단은 트랜스포좀 복합체가 고체 지지체 상에 고정될 때에 비해 용액 중 트랜스포좀 복합체에 포함될 때 더 잘 수행될 수 있다.
일부 실시형태에서, 용액상 트랜스포좀에 포함된 변형된 트랜스포존 말단은 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함한다. 일부 실시형태에서, 용액상 트랜스포좀 복합체에 포함된 변형된 트랜스포존 말단은 리보오스를 포함한다.
다른 예에서, 서열 번호 1의 위치 16에서 변형을 포함하는 변형된 트랜스포존 말단은 고체 지지체 상에 고정된 트랜스포좀 복합체에 포함될 때에 비해 용액 중 트랜스포좀 복합체에 포함될 때 더 잘 수행될 수 있다. 이러한 차이는 트랜스포사아제에 대한 상이한 변형된 트랜스포존 말단의 친화성과 비드-연결 트랜스포좀의 제조에 사용된 절차와 같은 다수의 인자로 인한 것일 수 있다.
2. 고정된 트랜스포좀 복합체 및 비드-연결 트랜스포좀
일부 실시형태에서, 트랜스포좀 복합체는 고체 지지체 상에 고정된다. 일부 실시형태에서, 고체 지지체는 태그먼트화 완충제 내에 포함된다. 일부 실시형태에서, 고정된 트랜스포좀 복합체에 결합된 이중가닥 핵산(예컨대, DNA)은 고정된 핵산 단편을 산출하기 위한 태그먼트화를 수행한다. 단편화에 사용될 수 있는 상기 비드-고정된 트랜스포좀 복합체는 "fBLT"로 지칭될 수 있다. fBLT로 라이브러리 제조를 수행하기 위한 대표적인 프로토콜은 도 20에 도시되어 있다.
일부 실시형태에서, 제1 트랜스포존은 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 고체 지지체 상에 고정된다.
일부 실시형태에서, 고체 표면 상에 고정된 트랜스포좀의 밀도는 고정된 단편의 라이브러리 수율 및 단편 크기를 조절하도록 선택된다. 일부 실시형태에서, 트랜스포좀 복합체는 mm2당 적어도 103, 104, 105, 또는 106개의 복합체의 밀도로 고체 지지체 상에 존재한다.
일부 실시형태에서, 고정된 라이브러리 내의 이중가닥 핵산 단편의 길이는 고체 지지체 상의 트랜스포좀 복합체의 밀도를 증가 또는 감소시킴으로써 조절된다.
다수의 상이한 유형의 고정된 트랜스포좀이 미국 특허 제9683230호에 기재된 바와 같이 이들 방법에 사용될 수 있으며, 이는 이의 전문이 본원에 포함된다.
본원에 제시된 방법 및 조성물에서, 트랜스포좀 복합체는 고체 지지체에 고정된다. 일부 실시형태에서, 트랜스포좀 복합체 및/또는 캡쳐 올리고뉴클레오티드는 트랜스포존 말단 서열을 포함하는 폴리뉴클레오티드와 같은 하나 이상의 폴리뉴클레오티드를 통해 지지체에 고정된다. 일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사아제 효소를 고체 지지체에 결합시키는 링커 분자를 통해 고정될 수 있다. 일부 실시형태에서, 트랜스포사아제 효소 및 폴리뉴클레오티드 둘 모두는 고체 지지체에 고정된다. 고체 지지체에 대한 분자(예를 들어, 핵산)의 고정을 언급할 때, 용어 "고정된" 및 "부착된"은 본원에서 상호 교환적으로 사용되며, 둘 모두의 용어는 명백하게 또는 문맥에 의해 달리 명시되지 않는 한, 직접적 또는 간접적, 공유 또는 비-공유 부착을 포함하도록 의도된다. 일부 실시형태에서, 공유 부착이 사용될 수 있으나, 일반적으로 필요한 모든 것은 분자(예를 들어, 핵산)가 예를 들어 핵산 증폭 및/또는 시퀀싱이 필요한 적용 분야에서 지지체를 사용하도록 의도된 조건 하에 지지체에 고정되거나 부착된 상태로 유지되는 것이다.
특정 실시형태는 예를 들어 폴리뉴클레오티드와 같은 생체분자에 대한 공유적 부착을 허용하는 반응성 기를 포함하는 중간 물질의 층 또는 코팅의 적용에 의해, 기능화되었던 불활성 기재 또는 매트릭스(예를 들어, 유리 슬라이드, 중합체 비드 등)로 구성된 고체 지지체를 사용하도록 할 수 있다. 상기 지지체의 예는 유리와 같은 불활성 기재 상에 지지된 폴리아크릴아미드 하이드로겔, 특히 국제공개 WO 2005/065814호 및 미국 특허출원공개 US 2008/0280773호에 기재된 폴리아크릴아미드 하이드로겔을 포함하지만 이에 제한되지는 않으며, 이의 내용은 이의 전문이 본원에 참조로 포함된다. 그러한 실시형태에서, 생체분자(예를 들어, 폴리뉴클레오티드)는 중간 물질(예를 들어, 하이드로겔)에 직접 공유적으로 부착될 수 있지만, 중간 물질 자체는 기재 또는 매트릭스(예를 들어, 유리 기재)에 비-공유적으로 부착될 수 있다. 따라서, 용어 "고체 지지체에 대한 공유 부착"은 이러한 유형의 배열을 포함하는 것으로 해석되어야 한다.
용어 "고체 표면", "고체 지지체", 및 본원의 다른 문법적 균등물은 트랜스포좀 복합체의 부착에 적절하거나, 적절하도록 변형될 수 있는 임의의 물질을 지칭한다. 당업자에 의해 인식될 것인 바와 같이, 가능한 기재의 수는 매우 많다. 가능한 기재는 유리 및 개질 또는 기능화된 유리, 플라스틱(예를 들어, 아크릴, 폴리스티렌, 및 스티렌과 다른 물질의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, TeflonTM 등을 포함함), 다당류, 나일론 또는 니트로셀룰로오스, 세라믹, 수지, 실리카 또는 규소 및 개질된 규소를 포함하는 실리카-기반 물질, 탄소, 금속, 무기 유리, 플라스틱, 광섬유 다발, 및 다양한 다른 중합체를 포함하지만 이에 제한되지는 않는다. 일부 실시형태에 특히 유용한 고체 지지체 및 고체 표면은 플로우 셀 장치 내에 위치한다. 예시적인 플로우 셀은 하기 추가로 상세히 제시된다.
일부 실시형태에서, 고체 지지체는 트랜스포좀 복합체를 정렬된 패턴으로 고정시키기에 적합한 패턴화 표면을 포함한다. "패턴화된 표면"은 고체 지지체의 노출된 층 내부 또는 그 상에서의 상이한 영역의 배열을 지칭한다. 예를 들어, 하나 이상의 영역은 하나 이상의 트랜스포좀 복합체가 존재하는 특징부일 수 있다. 특징부는 트랜스포좀 복합체가 존재하지 않는 개재성 영역에 의해 분리될 수 있다. 일부 실시형태에서, 패턴은 행과 열로 존재하는 x-y 형식의 특징부일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 개재성 영역의 반복 배열일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 개재성 영역의 무작위 배열일 수 있다. 일부 실시형태에서, 트랜스포좀 복합체는 고체 지지체 상에 무작위로 분포된다. 일부 실시형태에서, 트랜스포좀 복합체는 패턴화 표면 상에 분포된다. 본원에 제시된 방법 및 조성물에 사용될 수 있는 예시적 패턴화 표면은 미국 출원 제13/661,524호 또는 미국 특허출원공개 US 2012/0316086 A1호에 기재되어있으며, 이들 각각은 본원에 참조로 포함된다.
일부 실시형태에서, 고체 지지체는 표면에서의 웰 또는 함몰부의 어레이를 포함한다. 이는 비제한적으로 포토리소그래피, 스탬핑 기술, 몰딩 기술, 및 마이크로에칭 기술을 포함하는 다양한 기술을 사용하여 당업계에 일반적으로 알려진 바와 같이 제작될 수 있다. 당업자에 의해 인식될 것인 바와 같이, 사용된 기술은 어레이 기재의 조성 및 형상에 따라 다를 것이다.
고체 지지체의 조성 및 기하학적 구조는 이의 용도에 따라 달라질 수 있다. 일부 실시형태에서, 고체 지지체는 슬라이드, 칩, 마이크로칩, 및/또는 어레이와 같은 평면형 구조이다. 따라서, 기재의 표면은 평면 층의 형태로 존재할 수 있다. 일부 실시형태에서, 고체 지지체는 플로우 셀의 하나 이상의 표면을 포함한다. 본원에서 사용된 용어 "플로우 셀"은 하나 이상의 유체 시약이 흐를 수 있는 고체 표면을 포함하는 챔버를 지칭한다. 본 개시내용의 방법에서 용이하게 사용될 수 있는 플로우 셀 및 관련 유체 시스템 및 검출 플랫폼의 예는 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제공개 WO 91/06678호; WO 07/123744호; 미국 특허 제7,329,492호; 제7,211,414호; 제7,315,019호; 제7,405,281호 및 미국 특허출원공개 US 2008/0108082호에 기재되어 있으며, 이들 각각은 본원에서 참조로 포함된다.
일부 실시형태에서, 고체 지지체 또는 이의 표면은 튜브 또는 용기의 내부 또는 외부 표면과 같이 비-평면형이다. 일부 실시형태에서, 고체 지지체는 미세구 또는 비드를 포함한다. 본원에서 "미세구" 또는 "비드" 또는 "입자" 또는 문법적 균등물은 작은 개별 입자를 의미한다. 적합한 비드 조성물은 비제한적으로 플라스틱, 세라믹, 유리, 폴리스티렌, 메틸스티렌, 아크릴계 중합체, 상자성 물질, 토리아 졸, 탄소 흑연, 이산화티타늄, 라텍스 또는 가교된 덱스트란, 예컨대 세파로오스, 셀룰로오스, 나일론, 가교된 마이셀 및 테플론을 포함할 뿐만 아니라 고체 지지체에 대해 본원에 개괄된 임의의 다른 물질이 모두 사용될 수 있다. Bangs Laboratories, Fishers Ind.로부터의 "미세구 선택 지침"은 유용한 지침이다. 특정 실시형태에서, 미세구는 자성 미세구 또는 비드이다.
비드는 구형일 필요는 없으며; 불규칙한 입자가 사용될 수 있다. 대안적으로 또는 부가적으로, 비드는 다공성일 수 있다. 비드 크기는 나노미터, 즉, 100 nm 내지 밀리미터, 즉, 1 mm의 범위이며, 비드는 0.2 마이크론 내지 200 마이크론, 또는 0.5 내지 5 마이크론이되, 일부 실시형태에서는, 더 작거나, 더 큰 비드가 사용될 수 있다.
일부 실시형태에서, 온-비드 태그먼트화는 용액 중 태그먼트화 반응에 비해 보다 균일한 태그먼트화 반응을 허용한다.
이들 표면에 결합된 트랜스포좀의 밀도는 제1 폴리뉴클레오티드의 밀도를 변경하는 것에 의해 또는 고체 지지체에 추가된 트랜스포사아제의 양에 의해 조절될 수 있다. 예를 들어, 일부 실시형태에서, 트랜스포좀 복합체는 mm2당 적어도 103, 104, 105, 또는 106개의 복합체의 밀도로 고체 지지체 상에 존재한다.
강성 또는 반-강성인지 여부와 상관 없이, 지지체에 대한 핵산의 부착은 공유 또는 비-공유 결합(들)을 통해 발생할 수 있다. 예시적인 결합은 미국 특허 제6,737,236호; 제7,259,258호; 제7,375,234호 및 제7,427,678호; 및 미국 특허출원공개 2011/0059865 A1호에 설명되어 있고, 이들 각각은 본원에 참조로 포함된다. 일부 실시형태에서, 핵산 또는 다른 반응 구성성분은 겔 또는 다른 반고체 지지체에 부착될 수 있으며, 이는 차례로 고체상 지지체에 부착 또는 점착성된다. 그러한 실시형태에서, 핵산 또는 다른 반응 구성성분은 고체상인 것으로 이해될 것이다.
일부 실시형태에서, 고체 지지체는 마이크로입자, 비드, 평면형 지지체, 패턴화 표면, 또는 웰을 포함한다. 일부 실시형태에서, 평면형 지지체는 튜브의 내부 또는 외부 표면이다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 태깅된 DNA 단편의 라이브러리가 제조되어 있다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 캡쳐 올리고뉴클레오티드 및 제1 폴리뉴클레오티드를 포함하며, 제1 폴리뉴클레오티드는 트랜스포존 말단 서열을 포함하는 3' 부분 및 제1 태그를 포함한다.
일부 실시형태에서, 고체 지지체는 제1 폴리뉴클레오티드에 결합된 트랜스포사아제를 추가로 포함하여 트랜스포좀 복합체를 형성한다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 캡쳐 올리고뉴클레오티드 및 제2 폴리뉴클레오티드를 포함하며, 제2 폴리뉴클레오티드는 트랜스포존 말단 서열을 포함하는 3' 부분 및 제2 태그를 포함한다.
일부 실시형태에서, 고체 지지체는 제2 폴리뉴클레오티드에 결합된 트랜스포사아제를 추가로 포함하여 트랜스포좀 복합체를 형성한다.
일부 실시형태에서, 키트는 본원에 기재된 고체 지지체를 포함한다. 일부 실시형태에서, 키트는 트랜스포사아제를 추가로 포함한다. 일부 실시형태에서, 키트는 역전사효소 폴리머라아제를 추가로 포함한다. 일부 실시형태에서, 키트는 DNA를 고정시키기 위한 제2 고체 지지체를 추가로 포함한다.
국제공개 WO 2018/156519호에 기재된 것들과 같은 트랜스포좀 복합체를 고정시키는 광범위하게 다양한 상이한 수단이 기재되었으며, 이는 이의 전문이 본원에 참조로 포함된다. 일부 실시형태에서, 트랜스포좀 복합체에 포함된 제1 트랜스포존은 친화성 요소를 포함한다. 일부 실시형태에서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착된다. 일부 실시형태에서, 제1 트랜스포존은 링커를 포함한다. 일부 실시형태에서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는다.
일부 실시형태에서, 트랜스포좀 복합체는 제1 트랜스포존 말단 서열의 적어도 일부에 상보적인 제2 트랜스포존을 추가로 포함한다. 일부 실시형태에서, 제2 트랜스포존은 친화성 요소를 포함한다. 일부 실시형태에서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착된다. 일부 실시형태에서, 제2 트랜스포존은 서열 번호 13을 포함한다. 일부 실시형태에서, 제2 트랜스포존은 링커를 포함한다. 일부 실시형태에서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는다.
일부 실시형태에서, 친화성 요소는 비오틴, 아비딘, 스트렙타비딘, 항체, 또는 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 친화성 요소는 비오틴이다. 일부 실시형태에서, 친화성 요소는 고체 지지체의 표면 상에 포함된 캡쳐 올리고뉴클레오티드에 결합할 수 있는 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 친화성 요소는 고체 지지체의 표면 상에 포함된 리간드에 결합할 수 있는 항체를 포함한다.
본원에서 사용된, "BLT"의 "비드-연결된 트랜스포좀"은 비드 상에 고정된 트랜스포좀을 지칭한다. 비드-연결 트랜스포좀(BLT)은 Illumina의 라이브러리 제조 제품과 같은 특정 NGS 라이브러리 제조 방법의 핵심 기술이다. 비드-연결 트랜스포좀은 라이브러리 정규화를 제공하고, 주입 DNA 정량화의 필요성을 제거하는 추가적인 이점과 함께, 효소적 Tn5-매개 태그먼트화의 고유한 이점을 활용한다(도 3 및 문헌[Stephen Bruinsma et al., BMC Genomics 19(1):1-16 (2018)]). 용액-기반 태그먼트화 프로토콜의 단점은 게놈 DNA 기질과 Tn5 효소 간의 비의 제어가 라이브러리 단편 크기에 직접적으로 영향을 미쳐 성능 변동의 원인이 된다는 점이다. 사전결정된 양의 트랜스포좀을 고체 지지체에 접합함으로써, BLT는 라이브러리 단편 크기를 더 잘 제어할 수 있다. 추가로, 비드에 결합된 알려진 양의 트랜스포좀은 라이브러리로 전환될 수 있는 DNA 기질의 양에 상한을 제공하여 라이브러리 정규화를 유발한다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 본원에 기재된 트랜스포좀 복합체를 포함한다. 일부 실시형태에서, 고체 지지체는 비드(즉, fBLT)를 포함한다. fBLT로 생성된 대표적인 데이터는 도 10a 내지 18b에 도시되어 있다.
B. 단편화를 위한 전위 반응
전위는 DNA 서열이 게놈 내에서 삽입, 결실 및 복제되는 효소 매개 과정이다. 이러한 과정은 단편화된 이중가닥 핵산(예컨대, 이중가닥 DNA 및 DNA:RNA 듀플렉스)에서 광범위하게 사용되도록 조정되었다. 전위는 도 4에 개괄된 표준 단편화효소 프로토콜을 사용하지 않으면서 DNA 단편을 생성할 수 있다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열을 사용하는 라이브러리 단편의 제조 방법은 고체 지지체 상에 고정된 트랜스포좀으로 수행된다(예컨대, 도 19에 도시된 것과 같은 fBLT). fBLT로의 라이브러리 제조 방법은 대략 5.5시간이 소요될 수 있고(도 20에 도시된 것과 같음), 이는 다른 결찰-기반 라이브러리 제조 방법과 유사하다.
일부 실시형태에서, 변형된 트랜스포존 말단으로의(예컨대, fBLT로의) 본 발명의 방법에 의한 단편의 생성은 초음파처리 동안 산화와 관련된 DNA 손상을 방지한다. 초음파처리로부터 생성된 상기 산화적 DNA 손상은 당업계에 잘 알려져 있다(예를 들어, 문헌[Costello Nucleic Acids Research 41(6):e67 (2013)] 참조). 예를 들어, fBLT의 사용은 이러한 전환(transversion)이 초음파처리 동안 구아닌에 대한 산화적 손상에 의해 구동될 수 있기 때문에, 위양성 G>T 전환의 대략 50배 감소를 야기하였다.
이러한 전위 반응이 Tn5를 이용하여 기재될 것이지만, 다른 트랜스포사아제(하기 기재된 것과 같음)는 유사 반응을 매개할 수 있다.
잘 연구된 E. 콜라이(E. coli) Tn5 트랜스포존은 "컷-앤-페이스트(cut-and-paste)" 전위 메커니즘에 의해 동원된다. 첫째, Tn5 트랜스포사아제 Tnp(이하에서, Tn5로 지칭됨)는 트랜스포존 DNA의 양 측에서 보존된 기질 서열을 인식한 후 게놈으로부터 절제되거나(excise) "컷"된다. 이후, Tn5는 이러한 트랜스포존 DNA를 표적 DNA로 삽입하거나 "페이스트"한다.
Tn5는 게놈 DNA를 "태그먼트화", 즉 동시에 "태깅" 및 "단편화"하기 위한 능력을 위한 다수의 라이브러리 제조 시약(예컨대, Illumina 사제)에서 활용되었고, 따라서 종래의 초음파처리/결찰-기반 라이브러리 제조 프로토콜에 수반된 시간과 복잡성을 크게 감소시킨다. 라이브러리 제조에서의 이의 사용을 지원하기 위해, Tn5는 어댑터 서열(예를 들어, Illumina의 A14 및 B15 어댑터 서열)에 첨가된 "모자이크 말단" 또는 "말단 서열"로 지칭된 보존된 기질 서열로 이루어지는 트랜스포존으로 사전로딩된다. 이후, Tn5 트랜스포사아제 및 어댑터-보유 트랜스포존 서열을 포함하는 이러한 트랜스포좀 복합체는 게놈 DNA 샘플과 혼합된다. 생성된 라이브러리 제조 트랜스포존은 단지 짧은 어댑터 서열만을 가져, 따라서 동시에 게놈 DNA의 단편화와 짧은 어댑터 서열로의 태깅을 야기한다(도 2).
일부 실시형태에서, 본원에 기재된 변형된 트랜스포존 말단으로의 전위는 야생형(즉, 본원에 기재된 돌연변이를 포함하지 않는 트랜스포존 말단)으로의 전위와 유사한 결과를 제공한다. 일부 실시형태에서, 본원에 기재된 트랜스포좀 복합체를 갖는 단편을 제조하는 것은, 서열 번호 1을 포함하는 야생형 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열을 포함하는 제1 트랜스포존을 포함하는 트랜스포좀 복합체를 갖는 단편의 제조에 비해, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%의 단편 수의 제조를 야기한다.
일부 실시형태에서, 전위 반응은 이전된 가닥의 3' 말단에서 변형된 트랜스포존 말단을 포함하는 트랜스포좀 복합체로 수행된다.
1. 단일 태그먼트화 사건에 의해 생성된 라이브러리 단편
일반적으로, 라이브러리 제조를 위한 태그먼트화 방법은 시퀀싱 방법에 사용된 어댑터 서열을 혼입하기 위해 단편의 양 말단을 태깅할 필요가 있다. 그러나, 본 발명의 단편화 방법(예컨대, fBLT로의)은 단일 태그먼트화 사건에 의해 단편을 제조할 가능성을 허용하며, 여기서 모자이크 말단 서열은 단편의 한 말단에만 추가된다. 단일 태그먼트화 사건에 의한 태그먼트화/절단 후, 단편의 두 말단은 도 18a에 도시된 것과 같이 말단-복구 후 어댑터의 결찰을 수행할 수 있다. 단일 태그먼트화 사건은 일반적으로 표준 방법으로 시퀀싱될 수 없는 단편을 산출하기 때문에(어댑터 서열이 한 말단에서만 혼입될 것이기 때문에), 단일 태그먼트화 사건 후 단편을 시퀀싱하는 능력은 단일 태그먼트화 사건의 "구제"로 지칭될 수 있다(도 18b의 데이터에 도시된 것과 같음).
일부 실시형태에서, 단편화를 위한 전위 반응은 부분 단편화된 핵산을 포함하는 샘플로부터의 라이브러리 제조를 개선한다. 일부 실시형태에서, 단편화를 위한 전위 반응은 DNA 분자의 한 말단을 단편화한 후 분자의 단편화된 말단 및 단편화되지 않은 말단 둘 모두에서 말단 복구 및 어댑터 결찰을 수행하기 위해 사용될 수 있다. 이와 같은 워크플로우에서, 도 18a에 도시된 것과 같이, ME 서열의 절단은 단편의 한 말단에서만 수행되지만, 단편의 다른 말단도 말단 복구된 후 어댑터 결찰이 수행될 수 있다. 이러한 방식으로, 어댑터는 단편의 양 말단에 결찰된다.
일부 실시형태에서, fBLT 워크플로우는 단일 태그먼트화 사건으로 제조된 라이브러리 단편의 구제를 허용한다. 단일 태그먼트화 사건으로 제조된 라이브러리 단편의 구제는 특히 부분 단편화된 DNA를 포함하는 샘플에 대한 결과를 개선할 수 있다. 이는 부분 단편화된 DNA로부터 2개의 단편화 사건에 의해 제조된 단편이 시퀀싱에 바람직한 길이보다 짧아 성공적인 시퀀싱이 손실될 수 있기 때문이다. 이러한 효과는 본원에 기재된 방법을 사용하여 단일 태그먼트화 사건을 구제하는 능력에 의해 부분적으로 상쇄될 수 있다.
일부 실시형태에서, 샘플은 부분 단편화된 DNA를 포함한다. 일부 실시형태에서, 부분 단편화된 DNA를 포함하는 샘플은 포르말린 고정된 파라핀 내장(FFPE) 조직 또는 무세포 DNA이다. 일부 실시형태에서, 라이브러리는 단일 태그먼트화 사건에 의해 제조된 단편을 포함한다.
2. fBLT를 이용한 정규화
본원에 기재된 fBLT는 라이브러리 정규화에 사용될 수 있다. 본원에서 사용된, "정규화" 또는 "라이브러리 정규화"는 부피 풀링 전에 가변 441농도의 라이브러리를 동일하거나 유사한 농도로 희석하는 과정을 지칭한다.
일부 실시형태에서, 정규화는 시퀀싱 동안 모든 샘플에 대해 균일한 리드 분포를 보장하는 것을 보조한다. 즉, 라이브러리 정규화는 최종 시퀀싱 데이터에서 균일한 표현을 보장하는 것을 보조할 수 있다. 일부 실시형태에서, 라이브러리 정규화를 위해 fBLT를 사용하는 것은 수동 정규화 프로토콜의 다운스트림 단계를 회피한다.
라이브러리 농도의 수동 정규화에 대한 요건은 당업계에 잘 알려져 있다(예를 들어, 문헌[Best Practices for Manually Normalizing Library Concentrations, Illumina, 2021년 4월 22일] 참조). 일부 실시형태에서, fBLT를 이용한 정규화 방법은 라이브러리 농도의 계산을 필요로 하지 않는다. 이러한 방식으로, 사용자는 정규화 동안 시간 소모적이고 번거로운 계산과 희석을 회피할 수 있다.
일부 비드-연결 트랜스포좀(BLT) 방법은 Illumina® DNA Prep, (M) 태그먼트화(이전에 Nextera DNA Flex로 알려짐)와 같은 비드-기반 정규화를 허용한다. 일부 실시형태에서, fBLT는 유사하게 비드-기반 정규화를 허용한다. 비드-기반 방법을 이용한 정규화 능력은 라이브러리 제조 후 별도의 정규화 프로토콜을 수행하여 시간 및 잠재적인 샘플 손실을 회피한다.
C. fBLT를 사용하는 조정가능한 라이브러리 단편 사이징
일부 실시형태에서, fBLT(용액상 트랜스포좀 대신)는 균일한 단편 크기 및 라이브러리 수율을 생성한다. 미국 특허 제9,683,230호 및 미국 특허출원공개 US 2018-0155709호는 라이브러리 단편 크기를 제어하기 위한 BLT의 용도를 기재하며, 이들 각각은 이의 전문이 본원에 참조로 포함된다.
단편 크기는 DNA의 양 및 크기와 반응 지속시간에 대한 트랜스포좀의 비의 함수이다. 그러나, 이러한 파라미터가 용액상 태그먼트화 반응에서 제어된다 하더라도, 크기 선택 분획화는 일반적으로 과량의 작은 단편들을 제거하기 위한 추가 단계로서 필요하다. 즉, 단편 크기 제어는 용액상 태그먼트화에 비해 BLT로 더 잘 관리될 수 있다.
일부 실시형태에서, fBLT는 태그먼트화 반응에 추가된 트랜스포좀 비드의 양과 관계 없이, 결합된 트랜스포좀의 공간적 분리 함수로서 최종 단편 크기의 선택을 허용한다. 용액-기반 태그먼트화의 추가적인 한계는 일반적으로 PCR 증폭 전 및 후에 태그먼트화 반응의 생성물의 일부 형태의 정제를 수행하는 것이 필요하다는 것이다. 이는 일반적으로 튜브로부터 튜브로의 반응의 일부 이동을 필요로 한다. 대조적으로, fBLT에서의 태그먼트화 생성물은 세척되고 추후 증폭 또는 다른 다운스트림 처리를 위해 방출될 수 있어서, 샘플 이동에 대한 필요성을 회피한다. 예를 들어, 트랜스포좀이 상자성 비드 상에 조립되는 실시형태에서, 태그먼트화 반응 생성물의 정제는 비드를 자석으로 고정하고 세척함으로써 용이하게 달성될 수 있다. 따라서, 일부 실시형태에서, 태그먼트화 및 다른 다운스트림 처리, 예컨대 PCR 증폭은 모두 단일 튜브, 용기, 액적 또는 다른 용기에서 수행될 수 있다.
일부 실시형태에서, 고체 표면 상에 고정된 트랜스포좀의 밀도는 고정된 단편의 라이브러리 수율 및 단편 크기를 조절하도록 선택된다. 일부 실시형태에서, fBLT의 비드 표면 상의 활성 트랜스포좀의 간격은 삽입물 크기 분포를 제어하기 위해 사용될 수 있다. 예를 들어, 비드 표면 상의 갭은 불활성 트랜스포좀(예를 들어, 불활성 트랜스포존을 갖는 트랜스포좀)으로 필링될 수 있다.
D. 모자이크 말단 제거
Tn5를 단편화효소 시스템으로 변환하기 위해, 전위 후 모자이크 말단 서열의 선택적 제거를 위한 메커니즘이 필수적이다. 상기 잠재적 메커니즘은 (1) 모자이크 말단 내의 서열을 인식하는 제한 효소, (2) 전위 후 삽입물의 양 측 상에 존재하는 9-뉴클레오티드 갭을 이용하는 단일가닥 DNAse, 및 (3) (a) 엔도뉴클레아제 또는 (b) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합을 포함할 수 있다(도 5 참조). 제한 효소는 게놈 DNA 내 다른 동족 부위를 절단하여 편향을 야기할 것이기 때문에 불리하다. 단일가닥 뉴클레아제는 모자이크 말단 서열을 제거하기 위해 잠재적으로 사용될 수도 있다. 그러나, 이중가닥 DNA는 이의 말단에서 "브리드(breathe)"하는 것으로 알려져 있고, 이는 흔히 이중가닥 DNA의 오프타겟 분해를 야기하고, 이는 제어가 어렵다(문헌[Neelam A. Desai and Vepatu Shankar, FEMS Microbiology Reviews 26(5):457-91 (2003)] 참조).
효소를 사용하는 모자이크 말단의 선택적 절단을 이용한 본 발명의 방법은 단편화효소 시스템으로의 Tn5의 변환을 위한(즉, 모자이크 말단이 결여된 단편을 생성하기 위한) 매우 매력적인 메커니즘이다. 본원에서 사용된, "염기 변형" 또는 "DNA 염기 변형"은 효소(예컨대, (a) 엔도뉴클레아제 또는 (b) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합)에 의해 인식되어 변형된 염기에서 절단을 유발하는 이중가닥 핵산에서 이러한 변형된 염기의 위치(예컨대, 표 3에 기재된 것)를 지칭한다. 일부 실시형태에서, 엔도뉴클레아제 또는 DNA 글리코실라아제는 변형 특이적이다.
일부 실시형태에서, 염기 변형은 (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합을 사용하여 절단된다. 예를 들어, DNA 글리코실라아제는 무염기성 부위를 생성할 수 있고, 이는 이후 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제에 의해 작용한다. USER 시약은 DNA 글리코실라아제 및 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제를 포함하는 예시적인 효소 믹스이다. 사용자는 선호하는 워크플로우에 따라 무염기성 부위에서 절단하는 방식을 선택할 수 있다. 도 7b는 변형 특이적 엔도뉴클레아제가 1 단계 반응에서 변형된 염기를 어떻게 절단할 수 있거나 변형 특이적 글리코실라아제 후 AP 리아아제/엔도뉴클레아제 또는 열이 2 단계 반응에서 변형된 염기를 어떻게 절단할 수 있는지를 요약한다.
이와 같은 전위 반응 후 변형된 염기에서의 절단으로부터 제조된 단편은 서열 번호 1의 위치 16 내지 19 중 하나 이상에서의 변형 부위에 따라, ME 서열의 0 내지 3개의 염기, 및 5' 포스페이트 및 3'-OH를 갖는 5' 오버행을 갖는 삽입물을 포함할 것이다.
일부 실시형태에서, 변형된 모자이크 말단 서열의 절단은 (a) 엔도뉴클레아제 또는 (b) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합에 의해 매개된다. 일부 실시형태에서, (a) 엔도뉴클레아제 또는 (b) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 절단을 매개할 수 있다.
일부 실시형태에서, (a) 엔도뉴클레아제 또는 (b) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 USER, 엔도뉴클레아제 V, RNAse HII, 포름아미도피리미딘-DNA 글리코실라아제(FPG), 옥소구아닌 글리코실라아제(OGG), 엔도뉴클레아제 III(Nth), 엔도뉴클레아제 VIII, 인간 알킬 아데닌 DNA 글리코실라아제 + 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III의 혼합물, 티민-DNA 글리코실라아제 (TDG) 또는 포유류 DNA 글리코실라아제-메틸-CpG 결합 도메인 단백질 4 (MBD4) + 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III, 또는 DNA 글리코실라아제/리아아제 ROS1(ROS1)의 혼합물이다. 일부 실시형태에서, ROS1은 이관능성 글리코실라아제/리아아제 활성을 기반으로 변형-엔도뉴클레아제로서 기능할 수 있다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 우라실을 포함하고, 혼합물은 N-글리코실라아제이고, 아퓨린 또는 아피리미딘 부위(AP) 리아아제/엔도뉴클레아제는 우라실-특이적 절제 시약(USER)이다. 일부 실시형태에서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III의 혼합물이다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 이노신을 포함하고, 엔도뉴클레아제는 엔도뉴클레아제 V이다. 일부 실시형태에서, 변형된 트랜스포존 말단 서열은 리보오스를 포함하고, 엔도뉴클레아제는 RNAse HII이다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 8-옥소구아닌을 포함하고, 엔도뉴클레아제는 포름아미도피리미딘-DNA 글리코실라아제(FPG) 또는 옥소구아닌 글리코실라아제(OGG)이다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 티민 글리콜을 포함하고, DNA 엔도뉴클레아제는 엔도뉴클레아제 III(Nth) 또는 엔도뉴클레아제 VIII이다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 변형된 퓨린을 포함하고, DNA 글리코실라아제 및 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제는 인간 알킬 아데닌 DNA 글리코실라아제(hAAG) + 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III의 혼합물이다.
일부 실시형태에서, 변형된 트랜스포존 말단 서열은 변형된 피리미딘을 포함하고, DNA 글리코실라아제는 TDG 또는 MBD4이고, 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제는 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III이다. 변형된 피리미딘을 포함하는 변형된 트랜스포존 말단과의 사용을 위한 대체 변형 특이적 엔도뉴클레아제는 ROS1이다.
일부 실시형태에서, 제1 트랜스포존은 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘으로부터 선택된 하나 초과의 돌연변이를 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 엔도뉴클레아제 또는 DNA 글리코실라아제 및 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제는 혼합물에 포함된다. 일부 실시형태에서, 엔도뉴클레아제 또는 DNA 글리코실라아제 및 무염기성 부위 혼합물을 인식하는 엔도뉴클레아제/리아아제는 USER, 엔도뉴클레아제 V, RNAse HII, 포름아미도피리미딘-DNA 글리코실라아제(FPG), 옥소구아닌 글리코실라아제(OGG), 엔도뉴클레아제 III(Nth), 엔도뉴클레아제 VIII, hAAG + 엔도뉴클레아제 VIII/엔도뉴클레아제 III의 혼합물, 또는 TDG 또는 MBD4와 엔도뉴클레아제 VIII/엔도뉴클레아제 III, 또는 ROS1의 혼합물로부터 선택된 효소 이외의 것을 포함한다. 일부 실시형태에서, 하나 초과의 돌연변이 및 엔도뉴클레아제 및/또는 DNA 글리코실라아제 및 무염기성 부위 혼합물을 인식하는 엔도뉴클레아제/리아아제의 조합을 포함하는 변형된 트랜스포존 말단 서열을 이용한 방법은 단일 돌연변이 및 단일 엔도뉴클레아제 또는 DNA 글리코실라아제 및 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합을 포함하는 변형된 트랜스포존 말단 서열을 이용한 방법에 비해 모자이크 말단 서열의 절단 효율을 개선한다. ROS1의 경우, 단일 엔도뉴클레아제는 글리코실라아제 및 리아아제 기능 둘 모두를 갖는다.
일부 실시형태에서, 이중가닥 핵산의 단편화 방법은, 이중가닥 핵산을 포함하는 샘플을 트랜스포좀 복합체와 조합하는 단계 및 단편을 제조하는 단계를 포함한다.
일부 실시형태에서, 제1 트랜스포존 말단의 전부 또는 일부가 결여된 이중가닥 핵산 단편의 제조 방법은, 핵산을 포함하는 샘플을 트랜스포좀 복합체와 조합하는 단계 및 단편을 제조하는 단계; 및 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계를 포함한다. 일부 실시형태에서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌이다. 일부 실시형태에서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신이다. 일부 실시형태에서, 이러한 방법은 단편으로부터 제1 트랜스포존 말단(이전된 가닥)의 전부 또는 일부를 절단한다.
일부 실시형태에서, 제1 트랜스포존 말단의 절단은 어댑터를 결찰하기 위한 점착성 말단을 생성한다. 본원에서 사용된, "점착성 말단"은 한 가닥이 다른 것보다 길고(즉, 오버행이 존재함), 오버행이 상보적 오버행을 포함하는 어댑터의 결찰을 허용하는 이중가닥 단편의 말단이다.
일부 실시형태에서, 어댑터는 단편으로부터 제1 트랜스포존 말단의 전부 또는 일부를 제거한 후 추가된다. 일부 실시형태에서, 어댑터는 결찰에 의해 추가된다. 일부 실시형태에서, 말단 복구와 A-테일링 믹스는 어댑터의 결찰을 가능하게 한다. 당업자는 PCR 증폭 또는 클릭 화학과 같은 어댑터를 추가하기 위한 다른 수단을 인식할 것이다.
E. 어댑터 결찰
일부 실시형태에서, 어댑터를 포함하는 이중가닥 핵산 단편의 제조 방법은, 핵산을 포함하는 샘플을 본원에 기재된 트랜스포좀 복합체와 조합하는 단계 및 단편을 제조하는 단계; 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 말단 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계; 및 어댑터를 단편의 5' 및/또는 3' 말단 상에 결찰하는 단계를 포함한다. 단계의 대표적인 요약은 도 7a에 도시되어 있다.
일부 실시형태에서, 서열을 포함하는 어댑터는 모자이크 말단 서열의 전부 또는 일부를 제거한 후 라이브러리 단편 상에 결찰된다. 단편의 5' 및/또는 3' 말단에 어댑터를 결찰시킨 단편은 "태깅된 단편"으로 지칭될 수 있다.
일부 실시형태에서, 결찰은 DNA 리가아제에 의해 수행된다.
일부 실시형태에서, 어댑터는 이중가닥 어댑터를 포함한다.
일부 실시형태에서, 어댑터는 단편의 5' 및 3' 말단에 추가된다. 일부 실시형태에서, 단편의 5' 및 3' 말단에 추가된 어댑터는 상이하다.
TruSeq 및 TruSight Oncology 500(예를 들어, 문헌[TruSeq® RNA Sample Preparation v2 Guide, 15026495 Rev. F, Illumina, 2014] 참조)과 같은 어댑터 결찰 단계를 포함하는 다양한 라이브러리 제조 방법이 당업계에 알려져 있다. 다른 결찰 방법과 사용된 어댑터가 본 발명의 방법에서 사용될 수 있다(예를 들어, 문헌[Illumina Adapter Sequences, Illumina, 2021] 참조). 본 발명에서 사용하기 위한 어댑터는 국제공개 WO 2008/093098호, WO 2008/096146호, WO 2018/208699호, 및 WO 2019/055715호에 기재된 것도 포함하고, 이는 각각 이의 전문이 본원에 참조로 포함된다.
일부 실시형태에서, 어댑터 결찰은 태그먼트화를 통해 단편을 태깅하는 방법(어댑터 서열이 전위 반응 동안 단편에 혼입됨)과 비교할 때, 어댑터의 보다 유연한 혼입(예컨대, 보다 긴 길이의 어댑터)을 허용할 수 있다. 태그먼트화를 수반하는 일부 방법에서, 추가적 어댑터 서열이 PCR 반응(예컨대, 미국 특허출원공개 US 20180201992 A1호에 기재된 것)에 의해 혼입될 수 있고, 본 발명의 방법은 추가적 어댑터 서열을 혼입하기 위해 추가적인 PCR 단계에 대한 필요성을 제거할 수 있다.
결찰 기술은 시퀀싱을 위한 NGS 라이브러리 제조를 위해 일반적으로 사용된다. 일부 실시형태에서, 결찰 단계는 효소를 사용하여 특화된 어댑터를 DNA 단편의 양 말단에 연결한다. 일부 실시형태에서, A-염기가 각 가닥의 평활 말단에 추가되어, 시퀀싱 어댑터에 대한 결찰을 위해 이들을 준비시킨다. 일부 실시형태에서, 각각의 어댑터는 T-염기 오버행을 함유하여, 어댑터를 A-테일링된 단편화 DNA에 결찰하기 위한 상보적인 오버행을 제공한다.
어댑터 결찰 프로토콜은 다른 방법에 비해 이점이 있는 것으로 알려져 있다. 예를 들어, 어댑터 결찰은 단일, 쌍형성-말단, 및 인덱싱된 리드를 위한 시퀀싱 프라이머 혼성화 부위의 전체 상보성을 생성하는 데 사용될 수 있다. 일부 실시형태에서, 어댑터 결찰은 인덱스 태그 및 인덱스 프라이머 부위를 추가하기 위한 추가적인 PCR 단계에 대한 필요성을 제거한다.
일부 실시형태에서, 어댑터는 고유 분자 식별자(UMI), 프라이머 서열, 앵커 서열, 범용 서열, 스페이서 영역, 인덱스 서열, 캡쳐 서열, 바코드 서열, 절단 서열, 시퀀싱 관련 서열, 및 이의 조합을 포함한다. 본원에서 사용된, "바코드 서열"은 샘플을 구별하는 데 사용될 수 있는 서열을 지칭한다. 본원에서 사용된, 시퀀싱-관련 서열은 나중의 시퀀싱 단계와 관련된 임의의 서열일 수 있다. 시퀀싱-관련 서열은 다운스트림 시퀀싱 단계를 단순화하기 위해 작동할 수 있다. 예를 들어, 시퀀싱-관련 서열은 어댑터를 핵산 단편에 결찰하는 단계를 통해 달리 혼입될 서열일 수 있다. 일부 실시형태에서, 어댑터 서열은 특정 시퀀싱 방법에서 플로우 셀에 대한 결합이 용이하도록 P5 또는 P7 서열(또는 이들의 상보체)을 포함한다.
일부 실시형태에서, 어댑터는 UMI를 포함한다. 일부 실시형태에서, UMI를 포함하는 어댑터는 단편의 3' 및 5' 말단 모두에 결찰된다.
일부 실시형태에서, 어댑터는 분기형 어댑터일 수 있다. 본원에서 사용된, "분기형 어댑터"는 핵산의 2개의 가닥을 포함하는 어댑터로서, 여기서 2개의 가닥은 각각 다른 가닥과 상보적인 영역과 다른 가닥과 상보적이지 않은 영역을 포함하는 어댑터를 지칭한다. 일부 실시형태에서, 분기형 어댑터 내 핵산의 2개의 가닥은 상보적 영역에 기반한 어닐링을 이용하여 결찰 전에 함께 어닐링된다. 일부 실시형태에서, 상보적 영역은 각각 12개의 뉴클레오티드를 포함한다. 일부 실시형태에서, 분기형 어댑터는 이중가닥 DNA 단편의 말단에서 양 가닥에 결찰된다. 일부 실시형태에서, 분기형 어댑터는 이중가닥 DNA 단편의 한 말단에 결찰된다. 일부 실시형태에서, 분기형 어댑터는 이중가닥 DNA 단편의 양 말단에 결찰된다. 일부 실시형태에서, 단편의 반대편 말단에 있는 분기형 어댑터는 상이하다. 일부 실시형태에서, 분기형 어댑터의 하나의 가닥은 단편에의 결찰을 촉진하기 위해 이의 5' 말단에서 인산화된다. 일부 실시형태에서, 분기형 어댑터의 하나의 가닥은 3' T 바로 앞에 포스포로티오에이트 결합을 갖는다. 일부 실시형태에서, 3' T는 오버행이다(즉, 분기형 어댑터의 다른 가닥에서 뉴클레오티드와 쌍을 형성하지 않음). 일부 실시형태에서, 3' T 오버행은 라이브러리 단편 상에 존재하는 A-테일과 염기쌍을 형성할 수 있다. 일부 실시형태에서, 포스포로티오에이트 결합은 3' T 오버행의 엑소뉴클레아제 분해를 차단한다. 일부 실시형태에서, 부분 상보적 프라이머를 사용한 PCR은 말단을 연장하고 분기를 분해하기 위해 어댑터 결찰 후에 사용된다.
일부 실시형태에서, 어댑터는 태그를 포함할 수 있다. 본원에서 사용된 용어 "태그"는 목적하는 의도된 목적 또는 적용을 위한 서열을 나타내는 폴리뉴클레오티드의 일부 또는 도메인을 지칭한다. 태그 도메인은 임의의 소기의 목적을 위해 제공되는 임의의 서열을 포함할 수 있다. 예를 들어, 일부 실시형태에서, 태그 도메인은 하나 이상의 제한 엔도뉴클레아제 인식 부위를 포함한다. 일부 실시형태에서, 태그 도메인은 클러스터 증폭 반응을 위한 프라이머와의 혼성화에 적합한 하나 이상의 영역을 포함한다. 일부 실시형태에서, 태그 도메인은 시퀀싱 반응을 위한 프라이머와의 혼성화에 적합한 하나 이상의 영역을 포함한다. 임의의 다른 적합한 특징부가 태그 도메인 내에 혼입될 수 있음을 인식할 것이다. 일부 실시형태에서, 태그 도메인은 5 bp 내지 200 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 10 bp 내지 100 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 20 bp 내지 50 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 또는 200 bp의 길이를 갖는 서열을 포함한다.
태그는 필요하거나, 목적하는 하나 이상의 기능성 서열 또는 구성성분(예를 들어, 프라이머 서열, 앵커 서열, 범용 서열, 스페이서 영역, 또는 인덱스 태그 서열)을 포함할 수 있다.
일부 실시형태에서, 태그는 클러스터 증폭을 위한 영역을 포함한다. 일부 실시형태에서, 태그는 시퀀싱 반응을 프라이밍하기 위한 영역을 포함한다.
일부 실시형태에서, 방법은 태그의 일부에 상응하는 증폭 프라이머와 폴리머라아제를 반응시킴으로써 고체 지지체 상의 단편을 증폭시키는 단계를 추가로 포함한다. 일부 실시형태에서, 모자이크 말단 서열의 전부 또는 일부를 제거한 후 단편 상에 결찰된 어댑터의 일부는 증폭 프라이머를 포함한다. 일부 실시형태에서, 제1 트랜스포존의 태그는 증폭 프라이머를 포함한다.
일부 실시형태에서, 태그는 A14 프라이머 서열을 포함한다. 일부 실시형태에서, 태그는 B15 프라이머 서열을 포함한다.
일부 실시형태에서, 개별 비드 상의 트랜스포좀은 고유한 인덱스를 가지며, 상기 다수의 인덱싱된 비드가 이용되는 경우, 위상화 전사물이 수득될 것이다.
라이브러리 단편 상에 결찰되는 어댑터는 태그먼트화 중 혼입되는 어댑터에 비해 이점을 가질 수 있다. 예를 들어, 고유 분자 식별자(UMI)는 PCR 전에 고유 서열 태그에 의해 단일 단편을 라벨링함으로써 고감도 변이체 검출을 가능하게 하도록 사용될 수 있다(문헌[Jesse J. Salk, et al., Nature Reviews Genetics 19(5) : 269-85 (2018)] 참조). 일부 라이브러리 제조 제품, 예컨대 TSO 500(Illumina)은 UMI 서열이 라이브러리 삽입물에 인접하게 혼입되어 삽입물 리드의 일부로서 동시 시퀀싱을 가능하게 하는 결찰-기반 UMI 제공물을 포함한다. 따라서, fBLT의 개발은 기존 결찰-기반 제품을 활용할 수 있으면서(예컨대, 기존 어댑터와 프로토콜 사용), 동시에 기존 농축 워크플로우 및 온보드 시퀀싱 프라이머와의 호환성을 가능하게 한다.
도 19는 사용자가 fBLT를 이용하고자 할 수 있는 일부 대표적인 상이한 어댑터 워크플로우를 나타낸다. 예를 들어, 고감도 UMI 워크플로우가 사용될 수 있으며, 어댑터는 UMI를 혼입한다. 대안적으로, PCR 증폭 동안 UMI를 추가하는 PCR 워크플로우는 표준 분기형 어댑터와 사용될 수 있다. 또한, PCR이 없는 워크플로우가 PCR에 대한 필요성을 회피하는 인덱스 분기형 어댑터와 사용될 수 있다. 따라서, fBLT의 이점은 이들이 사용자에게 특정 라이브러리 제조에 가장 관심이 높은 어댑터를 선택할 수 있게 한다는 점이다. 태그먼트화와 같은 다른 라이브러리 제조 방법은 사용될 수 있는 어댑터 서열의 조성에서 더 높은 엄격성을 갖는다.
F. 샘플 및 표적 핵산
일부 실시형태에서, 샘플은 핵산을 포함한다. 샘플에 포함된 핵산은 "표적 핵산"으로 지칭될 수 있다. 일부 실시형태에서, 샘플은 DNA를 포함한다. 일부 실시형태에서, DNA는 게놈 DNA이다. 일부 실시형태에서, 표적 핵산은 이중가닥 DNA이다.
일부 실시형태에서, 샘플은 RNA를 포함한다. 일부 실시형태에서, RNA는 이중가닥 cDNA 또는 DNA:RNA 듀플렉스로 전환될 수 있다(즉, cDNA의 단일가닥에 혼성화된 RNA).
일부 실시형태에서, 핵산은 이중가닥 DNA이다. 일부 실시형태에서, 핵산은 RNA이고, 이중가닥 cDNA 또는 DNA:RNA 듀플렉스는 트랜스포좀 복합체와 조합되기 전에 생성된다.
생물학적 샘플은 핵산을 포함하는 임의의 유형일 수 있다. 예를 들어, 샘플은 정제된 핵산을 포함하여 다양한 정제 상태의 핵산을 포함할 수 있다. 그러나, 샘플은 완전히 정제될 필요는 없으며, 이는 예를 들어 단백질, 다른 핵산 종, 다른 세포 구성성분 및/또는 임의의 다른 오염물과 혼합된 핵산을 포함할 수 있다. 일부 실시형태에서, 생물학적 샘플은 생체내에서 발견된 것과 대략적으로 동일한 비율로 존재하는 핵산, 단백질, 다른 핵산 종, 다른 세포 구성성분 및/또는 임의의 다른 오염물의 혼합물을 포함한다. 예를 들어, 일부 실시형태에서, 구성성분은 온전한 세포에서 발견되는 바와 동일한 비율로 발견된다. 일부 실시형태에서, 생물학적 샘플의 260/280 흡광도 비는 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4, 1.3, 1.2, 1.1, 1.0, 0.9, 0.8, 0.7 또는 0.60 이하이다. 일부 실시형태에서, 생물학적 샘플의 260/280 흡광도 비는 적어도 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4, 1.3, 1.2, 1.1, 1.0, 0.9, 0.8, 0.7 또는 0.60이다. 본원에 제공된 방법은 핵산이 고체 지지체에 결합되게 할 수 있기 때문에, 다른 오염물은 표면 결합 전위가 일어난 후 단지 고체 지지체를 세척하는 방식으로 제거될 수 있다. 생물학적 샘플은 예를 들어 미정제 세포 용해물 또는 전세포를 포함할 수 있다. 예를 들어, 본원에 제시된 방법에서 고체 지지체에 적용되는 미정제 세포 용해물은 다른 세포 구성성분으로부터 핵산을 단리하는 데 통상적으로 사용되는 하나 이상의 분리 단계에 적용될 필요가 없다. 예시적인 분리 단계는 문헌[Maniatis et al., Molecular Cloning: A Laboratory Manual, 2d Edition, 1989] 및 [Short Protocols in Molecular Biology, ed. Ausubel, et al]에 제시되어 있으며, 이는 본원에 참조로 포함된다.
일부 실시형태에서, 고체 지지체에 적용되는 샘플의 260/280 흡광도 비는 1.7 이하이다.
따라서, 일부 실시형태에서, 생물학적 샘플은 예를 들어 혈액, 혈장, 혈청, 림프, 점액, 가래, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변 및 침연 조직, 또는 이들의 용해물, 또는 핵산을 포함하는 임의의 다른 생물학적 시편을 포함할 수 있다.
일부 실시형태에서, 샘플은 혈액이다. 일부 실시형태에서, 샘플은 세포 용해물이다. 일부 실시형태에서, 세포 용해물은 미정제 세포 용해물이다. 일부 실시형태에서, 방법은 세포 용해물을 생성하기 위해 샘플을 고체 지지체에 적용한 후 샘플에서 세포를 용해시키는 단계를 추가로 포함한다.
일부 실시형태에서, 샘플은 생검 샘플이다. 일부 실시형태에서, 생검 샘플은 액체 또는 고체 샘플이다. 일부 실시형태에서, 대상이 예측 유전자에 특정 돌연변이체 또는 변이체를 갖는지 여부를 결정하기 위해 관심 서열을 평가하는 데 암 환자 유래의 생검 샘플이 사용된다.
본원에 제시된 방법 및 조성물의 한 가지 이점은 생물학적 샘플이 플로우 셀에 추가될 수 있으며, 후속 용해 및 정제 단계가 단순히 필수적 시약을 플로우 셀 내로 흘려보냄으로써 추가의 이동 또는 처리 단계 없이 모두 플로우 셀 내에서 발생할 수 있다는 것이다.
G. 갭-필 결찰, 인산화, 및 A-테일링
일부 실시형태에서, 전위 사건 후에 남은 DNA 서열 내의 갭은 또한 가닥 치환 연장 반응을 사용하여 필링될 수 있으며, 이러한 것은 Bst DNA 폴리머라아제 및 dNTP 믹스를 포함한다. 일부 실시형태에서, 갭-필 결찰은 연장-결찰 믹스 완충제를 사용하여 수행된다.
일부 실시형태에서, 방법은 복수의 5' 단편을 폴리머라아제 및 리가아제로 처리하여 가닥을 연장 및 결찰하여 완전한 이중가닥 단편을 생성하는 단계를 포함한다.
이후, 이중가닥 DNA 단편의 라이브러리는 선택적으로 (예컨대, 클러스터 증폭과 같이) 증폭되고, 시퀀싱 프라이머로 시퀀싱될 수 있다.
일부 실시형태에서, 절단되는 제1 트랜스포존 말단의 전부 또는 일부는 샘플의 나머지로부터 분리된다.
일부 실시형태에서, 방법은 결찰 전에, 단편의 3' 말단에서의 필링 단계 및 단편의 3' 말단과 키나아제의 인산화 단계를 추가로 포함한다. 일부 실시형태에서, 모자이크 말단 서열의 절단에 의해 생성된 말단은 평활이 아니다(즉, 이중가닥 단편의 한 가닥은 다른 말단에 비해 점착성 오버행을 가짐). 일부 실시형태에서, 점착성 오버행은 필링되지 않으며, 어댑터는 점착성 오버행 상에 결찰되고, 어댑터는 상보적 점착성 말단을 갖는다.
일부 실시형태에서, 단편은 모자이크 말단 서열의 0 내지 3개의 염기를 포함한다. 일부 실시형태에서, 이중가닥 단편의 가닥은 다른 가닥에 비해 모자이크 말단 서열로부터 상이한 수의 염기를 갖는다(즉, 단편의 말단은 오버행을 갖고 평활 말단이 아님). 일부 실시형태에서, 모자이크 말단 서열의 절단에 의해 생성된 오버행은 필링된다. 일부 실시형태에서, 모자이크 말단 서열의 절단에 의해 생성된 말단의 필링은 T4 DNA 폴리머라아제로 수행된다.
일부 실시형태에서, 방법은 단편의 3' 말단에 단일 A 오버행을 추가하는 단계를 추가로 포함한다. 일부 실시형태에서, 단일 A 오버행 추가는 "A-테일링"으로서 지칭될 수 있다. 일부 실시형태에서, A-테일링은 분기형 어댑터와 같은 어댑터의 결찰을 개선한다. 일부 실시형태에서, 분기형 어댑터의 한 가닥은 단편 상의 A-테일과 염기쌍 형성할 수 있는 T 오버행을 포함한다.
일부 실시형태에서, 폴리머라아제는 단일 A 오버행을 추가한다. 일부 실시형태에서, 폴리머라아제는 (i) Taq 또는 (ii) 클레나우 단편, 엑소-이다.
H. 증폭
본 개시내용은 추가로 본원에 제공된 방법에 따라 생성된 단편의 증폭에 관한 것이다. 일부 실시형태에서, 단편은 어댑터의 결찰에 의해 또는 단편의 한 말단 또는 양 말단에서 태깅된다. 일부 실시형태에서, 고정된 단편은 고체 지지체 상에서 증폭된다. 일부 실시형태에서, 고체 지지체는 표면 결합된 전위가 발생하는 동일한 고체 지지체이다. 그러한 실시형태에서, 본원에 제공된 방법 및 조성물은 샘플 제조가 증폭을 통해 그리고 선택적으로 시퀀싱 단계를 통해 초기 샘플 도입 단계로부터의 동일한 고체 지지체 상에서 진행되도록 한다.
일부 실시형태에서, 단편은 시퀀싱 전에 증폭된다.
예를 들어, 일부 실시형태에서, 고정된 단편은 미국 특허 제7,985,565호 및 제7,115,400호의 개시내용에 의해 예시된 클러스터 증폭 방법을 사용하여 증폭되며, 이들 각각의 내용은 이의 전문이 본원에 참조로 포함된다. 미국 특허 제7,985,565호 및 제7,115,400호의 포함된 자료에는, 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 산물이 고체 지지체 상에 고정되게 하는 고체상 핵산 증폭 방법이 기재되어 있다. 이와 같은 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오티드 가닥과 복수의 동일한 고정된 상보적 폴리뉴클레오티드 가닥으로부터 형성된다. 이와 같이 형성된 어레이는 일반적으로 "클러스터화 어레이"로 본원에서 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 것과 같은 고체상 증폭 반응의 산물은 고정된 폴리뉴클레오티드 가닥과 고정된 상보적 가닥 쌍의 어닐링에 의해 형성된 소위 "브릿지" 구조이며, 두 가닥은 일부 실시형태에서 공유 부착을 통해, 5' 말단에서 고체 지지체 상에 고정된다. 클러스터 증폭 방법은 고정된 핵산 주형을 사용하여 고정된 앰플리콘을 생성하는 방법의 예이다. 다른 적합한 방법도 본원에 제공된 방법에 따라 생성된 고정된 DNA 단편으로부터 고정된 앰플리콘을 생성하는 데 사용될 수 있다. 예를 들어, 각 쌍의 증폭 프라이머의 하나 또는 두 프라이머 모두가 고정되어 있는지 여부에 관계 없이, 고체상 PCR을 통해 하나 이상의 클러스터 또는 콜로니가 형성될 수 있다.
다른 실시형태에서, 단편은 용액 중에서 증폭된다. 예를 들어, 일부 실시형태에서, 단편은 고체 지지체로부터 절단되거나 아니면 유리된 후 증폭 프라이머는 용액 중에서 유리된 분자에 혼성화된다. 다른 실시형태에서, 증폭 프라이머는 하나 이상의 초기 증폭 단계 동안 태깅된 단편에 혼성화된 다음, 용액 중에서 후속 증폭 단계가 이어진다. 일부 실시형태에서, 고정된 핵산 주형을 사용하여 용액상 앰플리콘을 생성할 수 있다.
본원에 기재되거나 당업계에 일반적으로 알려진 임의의 증폭 방법이 범용 또는 표적-특이적 프라이머와 함께 이용되어 태깅된 단편을 증폭시킬 수 있음을 인식할 것이다. 증폭에 적합한 방법은 미국 특허 제8,003,354호에 기재된 폴리머라아제 연쇄 반응(PCR), 가닥 치환 증폭(SDA), 전사 매개 증폭(TMA), 및 핵산 서열 기반 증폭(NASBA)을 포함하지만, 이에 제한되지는 않으며, 이는 이의 전문이 본원에 참조로 포함된다. 상기 증폭 방법이 하나 이상의 관심 핵산을 증폭시키기 위해 이용될 수 있다. 예를 들어, 다중 PCR을 포함한 PCR, SDA, TMA, NASBA 등이 고정된 DNA 단편을 증폭시키기 위해 이용될 수 있다. 일부 실시형태에서, 관심 핵산에 특이적으로 유도된 프라이머가 증폭 반응에 포함된다.
핵산을 증폭시키는 다른 적합한 방법은 올리고뉴클레오티드 연장 및 결찰, 롤링 서클 증폭(RCA)(문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)], 이는 본원에 참조로 포함됨) 및 올리고뉴클레오티드 결찰 검정(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; 유럽 특허 EP 0 320 308 B1호; EP 0 336 731 B1호; EP 0 439 182 B1호; 국제공개 WO 90/01069호; WO 89/12696호; 및 WO 89/09835호 참조, 이들 모두는 참조로 포함됨) 기술을 포함할 수 있다. 이들 증폭 방법은 고정된 DNA 단편을 증폭시키도록 설계될 수 있음을 인식할 것이다. 예를 들어, 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 유도된 프라이머를 함유하는 결찰 프로브 증폭 또는 올리고뉴클레오티드 결찰 검정(OLA) 반응을 포함할 수 있다. 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 유도된 프라이머를 함유하는 프라이머 연장-결찰 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특별히 설계될 수 있는 프라이머 연장 및 결찰 프라이머의 비제한적 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 GoldenGate 검정(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.)에 사용된 프라이머를 포함할 수 있으며, 이들 각각은 이의 전문이 본원에 참조로 포함된다.
본 개시내용의 방법에서 사용될 수 있는 예시적인 등온 증폭 방법은 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 의해 예시된 바와 같은 다중 치환 증폭(MDA) 또는 예를 들어 미국 특허 제6,214,587호에 의해 예시된 등온 가닥 치환 핵산 증폭을 포함할 수 있지만 이에 제한되지 않으며, 이들 각각은 이의 전문이 본원에 참조로 포함된다. 본 개시내용에 사용될 수 있는 다른 비-PCR-기반 방법은 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호, 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 치환 증폭(SDA) 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 초분지 가닥 치환 증폭을 포함하며, 이들 각각은 이의 전문이 본원에 참조로 포함된다. 등온 증폭 방법은 게놈 DNA의 무작위 프라이머 증폭을 위해 가닥 치환 Phi 29 폴리머라아제 또는 Bst DNA 폴리머라아제 큰 단편, 5'→ 3' 엑소-와 함께 사용될 수 있다. 이러한 폴리머라아제의 사용은 이의 높은 가공성 및 가닥 치환 활성의 이점을 이용한다. 높은 가공성은 폴리머라아제가 10 내지 20 kb의 길이인 단편을 생성하도록 한다. 상기 설명된 바와 같이, 클레나우 폴리머라아제와 같은 낮은 가공성 및 가닥 치환 활성을 갖는 폴리머라아제를 사용하여 등온 조건 하에서는 보다 작은 단편이 생성될 수 있다. 증폭 반응, 조건, 및 구성성분의 추가의 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 제시되어 있으며, 이는 이의 전문이 본원에 참조로 포함된다.
본 개시내용에 유용한 다른 핵산 증폭 방법은 예를 들어 문헌[Grothues et al. Nucleic Acids Res. 21(5):1321-2 (1993)]에 기재된 바와 같은 불변 5' 영역 다음에 무작위 3' 영역을 갖는 2-도메인 프라이머의 집단을 사용하는 태깅된 PCR이며, 이는 이의 전문이 본원에 참조로 포함된다. 제1 라운드의 증폭은 무작위로 합성된 3' 영역으로부터의 개별 혼성화에 기반한 열 변성 DNA에 대한 다수의 개시를 허용하기 위해 수행된다. 3' 영역의 성질로 인해, 개시 부위는 게놈 전체에 걸쳐 무작위한 것으로 고려된다. 이후, 결합되지 않은 프라이머는 제거될 수 있고, 추가의 복제가 불변 5' 영역에 상보적인 프라이머를 사용하여 일어날 수 있다.
I. 시퀀싱
일부 실시형태에서, 방법은 단편으로부터 제1 트랜스포존 말단의 전부 또는 일부를 제거한 후 단편을 시퀀싱하는 단계를 추가로 포함한다.
일부 실시형태에서, 방법은 어댑터 결찰 후에 단편을 시퀀싱하는 단계를 추가로 포함한다. 일부 실시형태에서, 방법은 시퀀싱 전에 단편의 증폭을 필요로 하지 않는다. 일부 실시형태에서, 단편은 시퀀싱 전에 증폭된다.
일부 실시형태에서, 방법은 어댑터 결찰 후에 그리고 시퀀싱 전에 논의되는 단편을 농축하는 단계를 추가로 포함한다. 농축은 RNA Prep with Enrichment 참조 지침(Illumina 문서 번호: 1000000124435)과 같은 상업적으로 이용가능한 다양한 시약으로 수행될 수 있다.
본 개시내용은 추가로 본원에 제공된 방법에 따라 생성된 태깅된 단편의 시퀀싱에 관한 것이다. 일부 실시형태에서, 방법은 단편의 한 말단 또는 양 말단에서 어댑터의 결찰 후 하나 이상의 5' 태깅된 및/또는 3' 태깅된 단편 또는 완전 이중가닥 태깅된 단편의 시퀀싱을 포함한다. 일부 실시형태에서, 어댑터는 시퀀싱을 용이하게 하기 위해 서열 프라이머 결합 서열을 포함한다.
태깅된 단편은 임의의 적합한 시퀀싱 방법, 예를 들어 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 나노기공 시퀀싱 등을 포함하는 직접 시퀀싱에 따라 시퀀싱될 수 있다. 일부 실시형태에서, 태깅된 단편은 고체 지지체 상에서 시퀀싱된다. 일부 실시형태에서, 시퀀싱을 위한 고체 지지체는 어댑터 결찰이 발생하는 동일한 고체 지지체이다. 일부 실시형태에서, 시퀀싱을 위한 고체 지지체는 증폭이 발생하는 동일한 고체 지지체이다.
일 예시적 시퀀싱 방법은 합성에 의한 시퀀싱(SBS: sequencing-by-synthesis)이다. SBS에서, 핵산 주형(예를 들어, 표적 핵산 또는 이의 앰플리콘)을 따라 핵산 프라이머의 연장은 주형의 뉴클레오티드의 서열을 결정하기 위해 모니터링된다. 근본적 화학적 과정은 중합(예를 들어, 폴리머라아제 효소에 의해 촉매작용됨)일 수 있다. 특정 폴리머라아제-기반 SBS 실시형태에서, 형광 표지된 뉴클레오티드를 주형 의존적 방식으로 프라이머에 추가하여(이로 인해 프라이머를 연장시킴), 프라이머에 추가된 뉴클레오티드의 순서 및 유형의 검출을 사용하여 주형의 서열을 결정할 수 있도록 한다.
플로우 셀은 본 개시내용의 방법에 의해 생성된 증폭된 DNA 단편을 수용하기 위한 편리한 고체 지지체를 제공한다. 이러한 형식의 하나 이상의 증폭된 DNA 단편은 수차례의 시약의 반복된 전달을 수반하는 SBS 또는 다른 검출 기술에 적용될 수 있다. 예를 들어, 제1 SBS 주기를 개시하기 위하여, 하나 이상의 표지된 뉴클레오티드, DNA 폴리머라아제 등이 하나 이상의 증폭된 핵산 분자를 수용하는 플로우 셀 내로/플로우 셀을 통해 흐를 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오티드가 혼입되는 이들 부위가 검출될 수 있다. 선택적으로, 일단 뉴클레오티드가 프라이머에 추가되었다면, 뉴클레오티드는 추가 프라이머 연장을 종결시키는 가역적 종결 속성을 추가로 포함할 수 있다. 예를 들어, 가역적 종결자 모이어티를 갖는 뉴클레오티드 유사체가 프라이머에 추가되어, 탈블록킹제가 모이어티를 제거하기 위해 전달될 때까지, 후속 연장이 발생할 수 없도록 할 수 있다. 따라서, 가역적 종결을 사용하는 실시형태의 경우, 탈블록킹 시약은 (검출이 일어나기 전에 또는 후에) 플로우 셀로 전달될 수 있다. 다양한 전달 단계들 사이에 세척이 수행될 수 있다. 이후, 주기는 n회 반복되어 n개의 뉴클레오티드만큼 프라이머를 연장하여, 이로써 길이 n의 서열을 검출할 수 있다. 본 개시내용의 방법으로 생성된 앰플리콘과 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 SBS 절차, 유체 시스템 및 검출 플랫폼은 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제공개 WO 91/06678호; WO 07/123744호; 미국 특허 제7,329,492호; 제7,211,414호; 제7,315,019호; 제7,405,281호 및 미국 특허출원공개 US 2008/0108082호에 기재되어 있으며, 이들 각각은 본원에서 참조로 포함된다.
순환 반응을 사용하는 다른 시퀀싱 절차, 예컨대 파이로시퀀싱(pyrosequencing)이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오티드가 초기 핵산 가닥에 혼입됨에 따라 무기 파이로포스페이트(PPi)가 방출되는 것을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; [Ronaghi, Genome Res. 11(1), 3-11 (2001)]; [Ronaghi et al. Science 281(5375), 363 (1998)]; 미국 특허 제6,210,891호; 제6,258,568호 및 제6,274,320호, 이들 각각은 본원에 참조로 포함됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설퍼릴라아제에 의해 아데노신 트리포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 수준은 루시퍼라아제-생성 광자를 통해 검출될 수 있다. 따라서, 시퀀싱 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용된 여기 방사선 공급원은 파이로시퀀싱 절차에는 필요하지 않다. 본 개시내용에 따라 생성된 앰플리콘에 파이로시퀀싱을 적용하도록 조정될 수 있는 유용한 유체 시스템, 검출기 및 절차는 예를 들어 국제공개 WO 2012058096호, 미국 특허출원공개 US 2005/0191698 A1호, 미국 특허 제7,595,883호, 및 제7,244,559호에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다.
일부 실시형태는 DNA 폴리머라아제 활성의 실시간 모니터링을 수반하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오티드 혼입은 형광단-보유 폴리머라아제와 γ-포스페이트-표지된 뉴클레오티드 사이의 형광 공명 에너지 전달(FRET) 상호작용을 통해 또는 제로모드 도파관(ZMW: zeromode waveguide)을 이용하여 검출될 수 있다. FRET-기반 시퀀싱을 위한 기술 및 시약은 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; [Lundquist et al. Opt. Lett. 33, 1026-1028 (2008)]; [Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 이의 개시내용은 본원에 참조로 포함된다.
일부 SBS 실시형태는 뉴클레오티드의 연장 생성물로의 혼입 시 방출된 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 시퀀싱은 Ion Torrent(미국 코네티컷주 길포드 소재, Life Technologies subsidiary)에서 상업적으로 입수가능한 전기 검출기 및 관련 기술, 또는 미국 특허출원공개 US 2009/0026082 A1호; US 2009/0127589 A1호; US 2010/0137143 A1호; 또는 US 2010/0282617 A1호에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있고, 이들 각각은 본원에 참조로 포함된다. 역학적 배제를 사용하여 표적 핵산을 증폭하기 위한 본원에 제시된 방법은 양성자를 검출하는 데 사용된 기재에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하기 위해 사용되는 앰플리콘의 클론 집단을 생성하는 데 사용될 수 있다.
다른 유용한 시퀀싱 기술은 나노포어 시퀀싱이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; [Deamer et al. Acc. Chem. Res. 35:817-825 (2002)]; [Li et al. Nat. Mater. 2:611-615 (2003)] 참조, 이의 개시내용은 본원에 참조로 포함됨). 일부 나노기공 실시형태에서, 표적 핵산 또는 표적 핵산으로부터 제거된 개별 뉴클레오티드는 나노기공을 통과한다. 핵산 또는 뉴클레오티드가 나노기공을 통과할 때, 각각의 뉴클레오티드 유형은 기공의 전기 전도도의 변동을 측정함으로써 식별될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001 (2007)]; [Healy, Nanomed. 2, 459-481 (2007)]; [Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)], 이의 개시내용은 본원에 참조로 포함됨).
본 개시내용에 따른 검출에 적용될 수 있는 어레이 기반 발현 및 유전자형 분석을 위한 예시적인 방법은 미국 특허 제7,582,420호; 제6,890,741호; 제6,913,884호 또는 제6,355,431호 또는 미국 특허출원공개 US 2005/0053980 A1호; US 2009/0186349 A1호 또는 US 2005/0181440 A1호에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다.
본원에 제시된 방법의 한 가지 이점은 이들이 병렬로 복수의 표적 핵산의 신속하고, 효율적인 검출을 제공한다는 것이다. 따라서, 본 개시내용은 상기 예시된 것들과 같은 당업계에 알려진 기술을 사용하여 핵산을 제조 및 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 개시내용의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편으로 전달할 수 있는 유체 구성성분을 포함할 수 있으며, 상기 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성성분을 포함한다. 플로우 셀은 표적 핵산의 검출을 위한 통합 시스템으로 구성되고/되거나 이에 사용될 수 있다. 예시적인 플로우 셀은 예를 들어 미국 특허출원공개 US 2010/0111768 A1호 및 US 2012/0270305 A1호에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다. 플로우 셀에 대한 예시된 것과 같이, 통합 시스템의 유체 구성성분 중 하나 이상이 증폭 방법과 검출 방법에 사용될 수 있다. 핵산 시퀀싱 실시형태를 예로 들면 통합 시스템의 유체 구성성분 중 하나 이상이 본원에 제시된 증폭 방법과 상기 예시된 것과 같은 시퀀싱 방법에서 시퀀싱 시약의 전달에 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하고 검출 방법을 수행하기 위한 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고, 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예는 비제한적으로 MiSeqTM 플랫폼(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.) 및 미국 특허출원공개 US 2012/0270305호에 기재된 장치를 포함하며, 이는 본원에 참조로 포함된다.
실시예
실시예 1. fBLT를 사용하는 대표적인 라이브러리 제조 방법
fBLT와 Tn5를 사용하는 방법은 하기 단계를 포함할 수 있다.
1. Tn5 효소는 이전된 가닥의 3' 말단 주변에 인코딩된 DNA 염기 변형(예를 들어, 우라실, 8-oxoG 등)을 함유하는 돌연변이된 모자이크 말단(ME) 트랜스포존과 복합체화된다. 필요에 따라서, 트랜스포존 DNA는 비드-연결 트랜스포좀(BLT, 이러한 경우에 fBLT)의 형성을 촉진하기 위해 비오티닐화될 수 있다.
2. 생성된 트랜스포좀은 게놈 DNA와 같은 주입 DNA를 단편화하기 위해 사용된다.
3. 생성된 단편화된 DNA는 (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합(예를 들어, USER 또는 Fpg)인 적절한 효소로 처리되어 이전된 가닥의 절단을 생성한다. 변형된 염기의 부위와 절단을 위한 효소(들)의 아이덴티티에 따라, 모자이크 말단의 일부 염기는 라이브러리 단편에 부착된 상태로 유지될 수 있다.
4. DNA 폴리머라아제는 라이브러리 단편의 3' 말단에 필링하기 위해 사용된다. 사용된 효소에 따라, 키나아제는 결찰을 위한 적절한 인산화를 보장하기 위해 필수적일 수도 있다.
5. A-테일링 폴리머라아제(예를 들어, Taq, 클레나우 엑소-)를 사용하여 라이브러리 단편의 3' 말단에 단일 A 오버행을 추가한다.
6. 적절한 라이브러리 어댑터는 DNA 리가아제로 라이브러리 삽입물에 결찰된다.
이러한 방식으로, 라이브러리 단편은 전위를 사용하여 생성될 수 있고, 어댑터는 결찰에 의해 라이브러리 단편에 추가된다. 이러한 방법은 어댑터의 결찰 전 단편으로부터 제1 트랜스포존 말단의 전부 또는 일부의 제거를 허용한다. 일부 실시형태에서, 제1 트랜스포존 말단의 전부 또는 일부는 결찰 전 샘플의 나머지로부터 분리된다.
이러한 프로토콜의 다른 변형이 가능할 수 있고; 예를 들어, 화학적 접근법과 같은 대체 전략이 선택적으로 모자이크 말단을 절단하는 데 사용될 수 있다. 추가로, 잔류하는 "모자이크 말단"의 짧은 서열은 잠재적으로 샘플 DNA의 A-테일링에 대한 대안으로서 결찰 전 샘플과 어댑터 사이의 단일 염기 오버행의 보다 약한 혼성화에 의존하는 1 bp 초과의 강력한 "점착성 말단" 결찰을 촉진하기 위해 사용될 수 있다.
실시예 2. Tn5v3에 의한 모자이크 말단의 돌연변이 분석
이전된 가닥의 3' 말단에서 4개의 염기쌍에 초점을 맞춘, 돌연변이 스크리닝 실험을 수행하였다. FRET 활성 검정을 이용하여 돌연변이된 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단으로 Tn5v3의 활성을 측정하였다.
도 6a에 도시된 것과 같이, Tn5v3은 모자이크 말단 서열 내 다양한 정규 치환을 인식할 수 있었고, 이때 활성은 약간만 감소하였다. 비록 활성이 대략 2배 손실되었지만, 심지어 다중 돌연변이를 갖는 모자이크 말단도 용인되었다. 흥미롭게도, A18C 돌연변이는 불량한 활성을 초래했지만, 돌연변이된 이전된 가닥이 야생형 비이전된 가닥에 어닐링됐을 때 활성은 구제되었다.
Tn5v3이 모자이크 말단 내에서, 특히 이전된 가닥의 3' 말단에 근접한 위치에서 정규 돌연변이를 용인할 수 있음을 입증한 후, 표 3에 열거된 것과 같은 변형된 염기도 용인될 수 있는지를 조사하였다. 트랜스포존은 단일 우라실, 이노신, 또는 리보오스와 제조되었고, FRET 활성 검정을 사용하여 검정되었다. 활성이 약간 감소하였으나 시험된 변형된 염기-함유 ME 모두는 Tn5에 의해 용인되었다(도 6b).
실시예 3. 전위-결찰을 사용하는 라이브러리 제조 및 시퀀싱
ME 이전된 가닥의 우라실, 이노신, 및 리보오스 변형이 Tn5v3에 의해 잘 용인된다는 사실을 기반으로, 단편화효소-Tn5 접근법을 사용하는 라이브러리 제조가 가용성 트랜스포좀(도 7a에 요약된 방법과 같이 용액상 트랜스포좀으로도 알려짐)을 사용하여 시도되었다. Illumina DNA Nextera® XT DNA 라이브러리 제조 키트에 기재된 것과 같은 가용성 태그먼트화에 이용가능한 프로토콜(Nextera XT 참조 지침, 문서 770-2012-011 참조)을 기반으로, 1 ng 람다 DNA(NEB N3011S)로 변형된 염기를 갖는 트랜스포좀을 인큐베이션하였다. 후속하여, DNA 라이브러리는 적절한 효소, 즉 (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합으로 처리되고, 이어서 T4 DNA 폴리머라아제로 처리되어 라이브러리 단편의 3' 말단에 필링하였다. 이후, 라이브러리를 Illumina A-테일링 및 결찰 믹스로 처리하여 UMI-함유 분기형 어댑터를 결찰하였다. PCR 증폭 후, 생성된 라이브러리를 Bioanalyzer를 통해 분석하였다. 모든 3개의 변형된 염기-효소 쌍은 라이브러리 형성을 야기했고, 이때 USER는 300 내지 400 bp의 단편 피크를 통해 최고 전환을 보였다(도 7c).
실시예 4: 대체 변형 부위와 USER-단편화효소 라이브러리의 비교
우라실-USER 쌍(즉, 모자이크 말단 서열에서의 우라실 치환 및 전위 후 모자이크 말단 서열의 절단을 위한 효소로서 USER)을 단편화효소 라이브러리 제조 워크플로우의 추가 특징분석을 위해 선택하였다. 모자이크 말단의 U16, U17, U18, 및 U19 변형을 갖는 트랜스포좀을 야생형(WT) 모자이크 말단(서열 번호 1)과 함께 시험하였다. 생성된 라이브러리의 전기영동 분석은 단편 크기 분포가 변형 부위에 따라 다르다는 것을 보였다(도 8a). 추가로, 라이브러리 수율의 Qubit 정량화는 수율이 U16 ME에 대해 가장 높았고, 우라실 변형이 3' 말단에 더 가깝게 이동함에 따라 수율이 감소한 것을 보였다(도 8b). 트랜스포좀은 라이브러리 제조에 사용하기 위해 FRET 활동에 의해 정규화되었기 때문에, 이러한 차이는 이들 대체 ME 기질의 USER-인식의 변동성으로 인한 것일 수 있다. 흥미롭게도, 야생형 트랜스포좀은 라이브러리 형성을 야기하지 않으며, 이는 모자이크 말단 이전된 가닥의 절단이 T4 DNA 폴리머라아제를 이용한 갭-필링 단계로 인해, 결찰과 호환가능한 라이브러리 단편을 생성하는 데 필수적이라는 것을 시사한다. 즉, 어댑터는 모자이크 말단 서열이 절단되지 않는 한, 라이브러리 단편 상에 결찰되지 않는다.
USER 효소 믹스는 우라실 염기를 절제하여 작용하기 때문에, 따라서 이러한 변형 부위에 대해, 모자이크 말단의 0 내지 3개의 염기가 생성된 라이브러리에 남아 있을 것으로 예측될 것이다. U16, U17, 및 U18 라이브러리 시퀀싱 후, 라이브러리 삽입물에 인접한 이러한 ME "스카"의 증거를 평가하였다. 본 연구에서 사용된 UMI 결찰 어댑터는 "T" 오버행에 인접한 가변 6 내지 7개의 염기쌍 UMI 서열을 함유하기 때문에, 따라서 1개의 염기쌍만큼 이동하는 라이브러리 단편의 분포가 예측되었다. 각 라이브러리 유형으로부터의 100,000개의 서열의 샘플링은 각 ME 변형 부위에 대해 예측된 서열 시그니쳐를 보였다(도 9).
실시예 5. 단편화효소 비드-연결 트랜스포좀(fBLT)
비드-연결 트랜스포좀은 일반적으로 트랜스포존 DNA의 비오티닐화에 의해 제조되며, 이는 스트렙타비딘 비드에 생성된 트랜스포좀의 결합을 가능하게 한다. U16 트랜스포좀을 고정하기 위한 초기 노력은 예측된 것보다 상당히 낮은 BLT 활성을 야기하였다(데이터는 나타내지 않음). 이러한 결과를 기반으로, U16-이전된 가닥과 야생형 비이전된 가닥으로 이루어진 혼합된 트랜스포존을 BLT의 개선된 성능으로 인해 파일럿 연구에 사용하였다. 이러한 fBLT는 Illumina DNA Prep for Enrichment에 사용된 농축 BLT(eBLT)와 유사한 라이브러리 단편 분포를 달성하기 위해 66 활성 단위/μL(AU/μL)의 트랜스포좀 밀도로 로딩되었다.
fBLT-기반 라이브러리 제조의 타당성을 평가하기 위해 예비 연구를 실시하였다. 주입 DNA는 등몰 농도(각각 대략 15,000개의 게놈 복제물, 50 ng 인간 gDNA 균등물)의 NA12877 및 NA12878 인간 gDNA 및 SspI-선형화된 phiX DNA의 혼합물로 이루어졌다.
USER 절단, 말단 복구, 및 A-테일링 단계가 조합되는 간소화된 워크플로우를 사용하여 단편화효소-BLT 라이브러리를 제조하였다(도 10a). 비교를 위해, DNA Prep with Enrichment 참조 지침(1000000048041)에 설명된 프로토콜에 따라 eBLT로 라이브러리도 제조하였다. 생성된 fBLT 라이브러리는 eBLT 라이브러리에 비해 대략 300 ng의 라이브러리 수율 중앙값 및 유사한 단편 크기 분포를 갖는다(도 10b 및 10c). fBLT 라이브러리의 약간 더 큰 단편 크기는 잠재적으로 어댑터 결찰 후 이용된 0.8X SPRI에 기인할 수 있다.
라이브러리 제조 후, PhiX의 전체 게놈을 표적화하는 맞춤형 패널 및 TruSight Cancer로 이루어진 조합된 패널을 사용하여, RNA Prep with Enrichment 참조 지침(Illumina 문서 번호: 1000000124435)에 설명된 농축 프로토콜에 따라 라이브러리를 농축하였다. 라이브러리를 시퀀싱하고, FASTQ 파일을 트리밍하여 fBLT 샘플로부터 UMI 서열을 제거하였다. TruSight Cancer 패널에 의한 성능을 특징분석하기 위해, Dragen Enrichment v3.7.5를 사용하여 UMI 없이 fBLT 및 eBLT의 비교 분석을 수행하였다. NA12878의 백그라운드의 10% NA12877로 이루어진 복제 샘플을 각 라이브러리 유형에 대해 분석하였다. fBLT 라이브러리는, 평균 표적 적용범위 심도가 더 낮더라도, eBLT 라이브러리와 유사한 성능을 보였다(표 4). fBLT 성능은 워크플로우 및 BLT 최적화를 통해 개선될 가능성이 있다.
[표 4]

표 4에서, 데이터는 2회 반복의 평균으로 보고된다. 샘플은 NA12878 gDNA의 백그라운드로 10% 스파이크의 NA12877 gDNA를 포함하였고, TruSight Cancer 패널을 사용하여 농축되었다.
이러한 방법은 NGS 라이브러리 제조를 위한 DNA 샘플의 단편화에 대한 효소적 접근법을 허용하고, 생성된 단편은 어댑터 결찰에 이용가능하다. 사용자에 대한 이점은 값비싼 초음파처리기를 자본 장비로서 구매할 필요가 없고, 샘플 핵산의 단편화를 위한 높은 처리량 효소적 방법을 사용하여 용이하고 신속해진다는 점이다. fBLT 기술은 BLT 기술의 고유한 이점을 활용하고, 다양한 결찰-기반 접근법을 포함하고 재사용하기 위해 호환성을 확장한다. 이러한 발전을 가능하게 하는 주요 혁신은 Tn5에 의한 인식을 유지하면서, 이전된 제1 트랜스포존 말단의 부위-특이적 절단을 허용하는 변형된 염기를 생성하기 위해 모자이크 말단 서열로 돌연변이를 혼입하는 것이다. 라이브러리 제조 프로토콜의 효소적 단편화 및 어댑터 태깅 단계를 분리함으로써, 분기형 어댑터, 바코드 및 UMI와 같은 특징부의 추가는 표준 시퀀싱 방법과 호환성을 유지하면서 가능해질 수 있다. 이러한 고유한 이점을 기반으로, fBLT는 UMI 라이브러리 제조 및 PCR이 없는 라이브러리 제조와 같은 다양한 적용에서 이용될 수 있다.
실시예 6. fBLT를 이용한 방법에 대한 조건 최적화
상이한 변형된 트랜스포존 말단을 포함하는 다양한 fBLT를 조사하였다. 상이한 변형된 트랜스포존 말단은 서열 번호 1에 비해 모자이크 말단 서열 내 위치 A16, C17, A18, 또는 G19에서의 치환을 포함하였다.
Illumina DNA Prep with Enrichment 라이브러리 제조 키트(Illumina DNA Prep with Enrichment 참조 지침, 문서 1000000048041 참조)에 대해 기재된 것과 같은 BLT 태그먼트화에 이용가능한 프로토콜을 기반으로 10 내지 50 ng 인간 샘플 DNA로 변형된 모자이크 말단(fBLT)을 갖는 비드-연결된 트랜스포좀을 인큐베이션하였다. 후속하여, DNA 라이브러리를 적절한 DNA 엔도뉴클레아제로 처리하여 모자이크 말단을 절단하였다. 이후, 샘플을 결찰-기반 라이브러리 제조 워크플로우에 적용하였다. 단편화된 샘플 DNA를 Illumina 말단 복구, A-테일링, 및 결찰 시약으로 처리하여 어댑터 결찰을 가능하게 하였다.
상이한 fBLT를 이용한 라이브러리 전환에 대한 결과는 도 12에 도시되어 있다. 다운스트림 시퀀싱을 필요로 하지 않으면서 BLT 활성을 직접 평가하기 위한 실험을 수행하였다. 위치 A16에서의 이노신, 옥소-구아닌, 및 우라실 돌연변이 모두는 위치 C17, A18, 및 G19에서의 동일한 돌연변이에 비해 보다 낮은 BLT 활성을 유도하였다. 따라서, 서열 번호 1의 위치 A16에서의 변형이 가용성 트랜스포좀에서 잘 용인된 한편, 다른 위치에서의 변형은 보다 높은 BLT 활성을 산출하였다. 따라서, 위치 A16에서의 변형을 갖는 트랜스포존 말단은 가용성 트랜스포좀을 이용한 방법에 대해 더 높은 가치를 가질 수 있다.
이후, 도 13a 내지 13c에 도시된 것과 같이 위치 C17, A18, 및 G19에서의 이노신, 옥소-구아닌, 또는 우라실 돌연변이를 갖는 다양한 상이한 fBLT를 평가하였다. 데이터는 이노신 변형이 라이브러리 전환 효율 및 변이체 콜링 메트릭에 의해 측정된 것과 같이 최상의 성능을 가짐을 보였다. 특히, G19I(I19) 변형은 높은 성능을 가졌고, fBLT에 고정화를 허용하기 위해 비오티닐화되는 비이전된 가닥과 함께 사용될 수 있다(도 11에 개괄된 것과 같음).
G19I가 탁월한 프로파일을 보였지만, G19U(U19)는 리드 일부가 A18I(I18) 및 C17O(O17) 변형에 비해 상이한 염색체에 맵핑되는 비교적 높은 개수의 키메라 리드를 유도하였다(도 14). 이러한 키메라 리드는 상이한 엔도뉴클레아제의 성능과 같은 다수의 잠재적 인자에 인한 것일 수 있다(예를 들어, USER 시약에 의한 우라실의 절단은 각각 엔도뉴클레아제에 의한 다른 변형된 뉴클레오티드의 절단보다 덜 강력할 수 있음). 키메라 리드는 목적하지 않은 시퀀싱 아티팩트이며, 따라서 사용자는 키메라 리드의 위험을 감소시키기 위한 특정 방법에 대해 우라실 변형(및 USER 시약에 의한 모자이크 말단 서열의 후속 절단)을 회피하는 것을 선호할 수 있다.
종합하자면, 이러한 데이터는 G19I 및 A18I와 같은 A18 및 G19 변형이 fBLT에 의해 높은 활성을 보일 수 있음을 시사한다.
실시예 7. fBLT와 다른 단편화 방법의 비교
A18I(I18) fBLT를 이용한 단편화를 도 15a에 도시된 워크플로우를 사용하여 NEBNext® dsDNA Fragmentase® 또는 초음파처리를 통한 단편화와 비교하였다.
초음파처리 샘플을 175 bp 단편에 대해 설계된 제조사의 권장된 프로토콜에 따라 Covaris 초음파처리기(LE220 모델)로 전단하였다(예를 들어, 문헌[Quick Guide to DNA Shearing with LE220, Covaris, May 2020] 참조).
NEBNExt dsDNA 단편화효소에 의한 샘플 단편화를 제조사의 프로토콜과 시약에 따라 수행하였다. 다양한 논의된 샘플을 사용하여 최적의 샘플 인큐베이션 조건을 사전결정하기 위해 시간 경과 연구를 수행하였다. 실온(대략 20℃)에서 10분 인큐베이션은 모든 논의된 샘플에 이용할 수 있는 최상의 단일 조건이었다.
fBLT를 이용한 단편화를 실시예 6에 기재된 것과 같이 수행하였다.
말단 복구 및 A-테일링을 Illumina 시약을 사용하는 모든 단편에 대하여 동일한 방식으로 수행하였다. UMI-함유 분기형 어댑터의 동일한 풀을 각 방법에 의해 제조된 단편으로 결찰하였다. 이는 본 발명의 fBLT 방법의 이점이 결찰-기반 라이브러리 제조의 다른 유형을 위해 개발된 기존 어댑터를 사용할 수 있다는 점을 요약한다.
PCR 증폭 후, 생성된 라이브러리를 TruSight Cancer 패널을 사용하여 RNA Prep with Enrichment 참조 지침(Illumina 문서 번호: 1000000124435)에 설명된 농축 프로토콜에 따라 농축하였다.
평가에 사용된 샘플은 NA12878 백그라운드의 NA12877의 50 ng 주입 게놈 DNA(gDNA) 1% 혼합물(50 ng 주입)이었다. 이러한 혼합물을 기반으로, 84개의 예측된 이형접합 변이체가 존재하였다(0.5% 변이 대립유전자 빈도(VAF: variant allele frequency)를 야기함). 결과는 도 15b에 도시되어 있고, 이때 fBLT 방법은 NEBNext® dsDNA Fragmentase® 또는 초음파처리 프로토콜 중 어느 하나에 비해 보다 높은 감도 및 특이도를 보였다.
상이한 단편화 방법을 이용하여 오류율도 평가하였다. 도 16에 도시된 것과 같이, fBLT 또는 NEBNext® dsDNA Fragmentase®로 제조된 샘플에 비해, 초음파처리된 샘플의 경우 실질적으로 보다 높은 듀플렉스 오류율 및 심플렉스 순방향 오류율(simplex forward error rate)이 확인되었다. 오류율의 상기 증가는 일반적으로 데이터에 더 큰 노이즈가 존재함을 나타내고, 즉 시퀀싱된 라이브러리 단편에 변동성이 더 많음을 나타낸다.
fBLT를 사용하여 제조된 샘플에 대한 가닥화 G>T 오류율은 1.4X10-5인 반면, 초음파처리를 통해 제조된 샘플의 경우 이러한 오류율은 70X10-5였다. 이러한 데이터는 초음파처리 방법에 비해 fBLT 방법에 대한 위양성 G>T 전환이 대략 50배 감소하였음을 나타낸다. fBLT에 의해 개선된 오류율은 fBLT 방법이 초음파처리에 의해 유도될 수 있는 구아닌에 대한 산화적 손상을 회피하기 때문일 가능성이 크다.
도 17은 샘플 범위에 걸쳐 fBLT 방법이 효소적 NEBNext® dsDNA Fragmentase® 방법보다 탁월하였고, 초음파처리 프로토콜과 유사한 라이브러리 전환 효율을 제공하였음을 보여준다.
따라서, fBLT는 현재 사용되는 단편화를 이용한 라이브러리 제조의 다른 방법에 비해 감도/특이도가 개선되고 오류율이 감소된다는 이점을 갖는 라이브러리의 제조 수단이다. 도 17의 샘플 1은 게놈 DNA 샘플을 나타내는 반면, 샘플 2 내지 6은 포르말린-고정된 파라핀 내장(FFPE) 샘플을 나타낸다. 다른 샘플에 비해 샘플 1의 보다 높은 전환 효율은 당해 분야에 잘 알려진 바와 같이, FFPE 샘플에 비해 게놈 DNA 샘플에서 보다 높은 품질의 DNA의 함수이다. 샘플 2 내지 6에서 dCq의 증가는 샘플 품질이 높은 번호의 샘플에서 더 불량하였고, 품질이 게놈 DNA를 갖는 샘플 1의 경우 더 높았음을 보여준다.
도 19는 사용자가 바람직한 다운스트림 워크플로우를 기반으로 fBLT를 이용하여 제조된 단편 상에 결찰하도록 다양한 상이한 어댑터를 선택할 수 있음을 포함하는, fBLT 방법의 일부 이점을 요약한다. 예를 들어, 간소화된 워크플로우를 원하는 사용자는 인덱스 서열을 혼입하기 위해 다운스트림 PCR을 회피할 수 있는 인덱싱된 분기형 어댑터를 사용할 수 있다. 유사하게, 상이한 단편을 콜링하기 위해 고감도를 원하는 사용자는 UMI를 포함하는 어댑터(UMI 어댑터)를 사용하여, 동일한 단편의 앰플리콘이 PCR 증폭 후 시퀀싱 결과로부터 식별될 수 있도록 할 수 있다. 따라서, fBLT는 라이브러리 제조를 위한 태그먼트화의 이점과 결찰-기반 프로토콜의 유연성을 조합할 수 있으며, 여기서 광범위한 상이한 어댑터가 라이브러리 단편으로 혼입될 수 있다.
실시예 8. 포르말린-고정된 파라핀 내장 샘플과의 사용을 위한 fBLT
fBLT를 사용하여 포르말린-고정된 파라핀 내장(FFPE) 샘플에서 라이브러리 단편을 제조하기 위한 프로토콜이 개발되었다. FFPE 샘플은 종양 샘플로부터의 프로파일과 같은 중요한 정보를 함유할 수 있지만, FFPE 물질은 흔히 고도로 단편화되어, 표준 라이브러리 제조 프로토콜을 방해할 수 있다.
도 18a에 도시된 것과 같이, DNA는 흔히 FFPE 조직 내에서 부분 단편화된다. 표준 태그먼트화 프로토콜은 라이브러리 단편 당 2개의 태그먼트화 사건을 필요로 한다(즉, 단편의 각 말단에서 태그먼트화 사건). 그러나, FFPE 조직으로부터 DNA를 이용한 2개의 태그먼트화 사건은, FFPE 샘플의 개시 DNA의 이러한 부분 단편화로 인해 시퀀싱에 바람직하지 않은 높은 비의 매우 작은 단편을 야기할 수 있다.
대조적으로, fBLT는 단일 태그먼트화된 단편, 즉 fBLT가 어댑터 결찰에 의해 구제될 수 있는 단편의 하나의 태그먼트화된 말단만을 갖는 단편을 제조하기 위해 사용될 수 있다. 모자이크 말단 절단 후, 단편의 양 말단은 복구될 수 있고, 어댑터 결찰될 수 있다. 이러한 방식으로, FFPE 조직으로부터의 라이브러리 단편은 단편의 양 말단에서의 결찰 후 단일 태그먼트화 사건에 의해 생성될 수 있어, 이러한 단편의 구제를 야기할 수 있다.
도 18b에 도시된 것과 같이, FFPE 내 DNA로부터 제조된 단편은 fBLT에 의한 단일 태그먼트화 사건에 의해 제조된 경우 구제될 수 있다. 따라서, fBLT 워크플로우는 FFPE 조직 및 부분 단편화된 DNA를 포함할 수 있는 다른 샘플로부터의 라이브러리 제조를 개선할 수 있다.
실시예 9. fBLT 라이브러리 제조 및 선택적 농축에 대한 워크플로우
최적화 실험을 기반으로, fBLT 라이브러리 제조 후 농축에 대한 예비 워크플로우를 개발하였다. 이러한 워크플로우는 도 20에 도시되어 있다. 요약하면, BLT로의 태그먼트화 후, 태그먼트화 산물을 정리한 후 모자이크 말단(ME)을 절단한다. 말단 복구 및 A-테일링 후, 어댑터를 결찰한다(여기서, 사용자는 UMI를 포함하는 것과 같은 어댑터를 선택할 수 있음). 이후, 필요에 따라서 사용자는 고체상 가역적 고정화(SPRI) 비드 정제 후 PCR 인덱싱 및 다른 SPRI 비드 정제를 수행할 수 있다. 이와 같은 워크플로우는 대략 5.5시간이 소요될 수 있다. 이러한 워크플로우의 시간은 다른 결찰-기반 라이브러리 제조 프로토콜과 유사하다.
사용자가 라이브러리를 농축하고자 하는 경우, 이는 혼성화 후 캡쳐와 같이 수행될 수 있다. 이와 같은 방법은 대략 5시간이 소요될 수 있다.
균등물
전술한 명세서는 당업자가 실시형태를 실시할 수 있게 하기에 충분한 것으로 간주된다. 전술한 설명 및 실시예는 특정 실시형태를 상세하게 설명하며, 발명자가 고려된 최상의 방식을 설명한다. 전술한 내용이 본문에서 아무리 상세하게 설명되었다 하더라도, 실시형태는 다수의 방식으로 실시될 수 있으며, 첨부된 청구범위 및 이의 임의의 균등물에 따라 해석되어야 함을 이해할 것이다.
본원에서 사용된 약이라는 용어는, 명시적으로 표시되는지 여부에 관계없이, 예를 들어 정수, 분수 및 백분율을 포함하는 수치값을 나타낸다. 약이라는 용어는 일반적으로, 당업자가 언급된 값과 동등한(예를 들어, 동일한 기능 또는 결과를 갖는) 것으로 간주하는 수치 값의 범위(예를 들어, 언급된 범위의 +/- 5% 내지 10%)를 나타낸다. 적어도 및 약과 같은 용어가 수치 값 또는 범위의 목록에 선행하는 경우, 용어는 목록에 제공된 모든 값 또는 범위를 조정한다. 일부 경우에, 약이라는 용어는 가장 가까운 유효숫자로 반올림된 수치 값을 포함할 수 있다.
SEQUENCE LISTING <110> ILLUMINA, INC. <120> IMPROVED METHODS OF LIBRARY PREPARATION <130> 01243-0027-00PCT <140> PCT/US2022/022167 <141> 2022-03-28 <150> US 63/167,150 <151> 2021-03-29 <150> US 63/224,201 <151> 2021-07-21 <160> 22 <170> PatentIn version 3.5 <210> 1 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Mosaic End (ME) Sequence <400> 1 agatgtgtat aagagacag 19 <210> 2 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Outside End (OE) Sequence <400> 2 ctgactctta tacacaagt 19 <210> 3 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Inside End (IE) Sequence <400> 3 ctgtctcttg atcagatct 19 <210> 4 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Mosaic End (ME') (non-transferred strand) <400> 4 ctgtctctta tacacatct 19 <210> 5 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME with A16U substitution (transferred strand) <400> 5 agatgtgtat aagagucag 19 <210> 6 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME' (non-transferred strand) <400> 6 ctgactctta tacacatct 19 <210> 7 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME with C17U substitution (transferred strand) <400> 7 agatgtgtat aagagauag 19 <210> 8 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME' (non-transferred strand) <400> 8 ctatctctta tacacatct 19 <210> 9 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME with A18U substitution (transferred strand) <400> 9 agatgtgtat aagagacug 19 <210> 10 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Modified ME' (non-transferred strand) with T18A substitution <400> 10 cagtctctta tacacatct 19 <210> 11 <211> 14 <212> DNA <213> Artificial sequence <220> <223> A14 primer sequence <400> 11 tcgtcggcag cgtc 14 <210> 12 <211> 15 <212> DNA <213> Artificial sequence <220> <223> B15 primer sequence <400> 12 gtctcgtggg ctcgg 15 <210> 13 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Biotinylated ME <220> <221> modified_base <222> (1)..(1) <223> 5' phosphate <220> <221> modified_base <222> (19)..(19) <223> 3 biotin <400> 13 ctgtctctta tacacatct 19 <210> 14 <211> 19 <212> DNA <213> Artificial sequence <220> <223> I19 TS, Modified ME with G19I substitution <220> <221> misc_feature <222> (19)..(19) <223> n is inosine <400> 14 agatgtgtat aagagacan 19 <210> 15 <211> 19 <212> DNA <213> Artificial sequence <220> <223> U19 TS Modified ME with G19U substitution <400> 15 agatgtgtat aagagacau 19 <210> 16 <211> 19 <212> DNA <213> Artificial sequence <220> <223> O16 TS, Modified ME with A16O substitution <220> <221> modified_base <222> (16)..(16) <223> 8-oxo-guanine <400> 16 agatgtgtat aagaggcag 19 <210> 17 <211> 19 <212> DNA <213> Artificial sequence <220> <223> O17 TS, Modified ME with C17O substitution <220> <221> modified_base <222> (17)..(17) <223> 8-oxo-guanine <400> 17 agatgtgtat aagagagag 19 <210> 18 <211> 19 <212> DNA <213> Artificial sequence <220> <223> O18 TS, Modified ME with A18O substitution <220> <221> modified_base <222> (18)..(18) <223> 8-oxo-guanine <400> 18 agatgtgtat aagagacgg 19 <210> 19 <211> 19 <212> DNA <213> Artificial sequence <220> <223> O19 TS Modified ME with G19O substitution <220> <221> modified_base <222> (19)..(19) <223> 8-oxo-guanine <400> 19 agatgtgtat aagagacag 19 <210> 20 <211> 19 <212> DNA <213> Artificial sequence <220> <223> I16 TS, Modified ME with A16I substitution <220> <221> misc_feature <222> (16)..(16) <223> n is inosine <400> 20 agatgtgtat aagagncag 19 <210> 21 <211> 19 <212> DNA <213> Artificial sequence <220> <223> I17 TS, Modified ME with C17I substitution <220> <221> misc_feature <222> (17)..(17) <223> n is inosine <400> 21 agatgtgtat aagaganag 19 <210> 22 <211> 19 <212> DNA <213> Artificial sequence <220> <223> I18 TS, Modified ME with A18I substitution <220> <221> misc_feature <222> (18)..(18) <223> n is inosine <400> 22 agatgtgtat aagagacng 19

Claims (113)

  1. 모자이크 말단 서열을 포함하는 변형된 트랜스포존 말단 서열로서, 모자이크 말단 서열은 야생형 모자이크 말단 서열에 비해 하나 이상의 돌연변이를 포함하고, 돌연변이는 하기와의 치환을 포함하는, 변형된 트랜스포존 말단 서열:
    a. 우라실;
    b. 이노신;
    c. 리보오스;
    d. 8-옥소구아닌;
    e. 티민 글리콜;
    f. 변형된 퓨린; 또는
    g. 변형된 피리미딘.
  2. 제1항에 있어서, 야생형 모자이크 말단 서열은 서열 번호 1을 포함하고, 추가로 하나 이상의 돌연변이는 A16, C17, A18, 및/또는 G19에서 치환을 포함하는, 변형된 트랜스포존 말단 서열.
  3. 제1항 또는 제2항에 있어서, 모자이크 말단 서열은 야생형 서열에 비해 8개 이하의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  4. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 하나 이상의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  5. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  6. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 1개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  7. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 2개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  8. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 3개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  9. 제2항에 있어서, 모자이크 말단 서열은 A16, C17, A18, 및/또는 G19에서의 하나 이상의 돌연변이에 더하여, 서열 번호 1에 비해 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  10. 제2항 내지 제9항 중 어느 한 항에 있어서,
    a. A16에서의 치환은 A16T, A16C, A16G, A16U, A16이노신, A16리보오스, A16-8-옥소구아닌, A16티민 글리콜, A16변형된 퓨린, 또는 A16변형된 피리미딘이고;
    b. C17에서의 치환은 C17T, C17A, C17G, C17U, C17이노신, C17리보오스, C17-8-옥소구아닌, C17티민 글리콜, C17변형된 퓨린, 또는 C17변형된 피리미딘이고;
    c. A18에서의 치환은 A18G, A18T, A18C, A18U, A18이노신, A18리보오스, A18-8-옥소구아닌, A18티민 글리콜, A18변형된 퓨린, 또는 A18변형된 피리미딘이고; 그리고/또는
    d. G19에서의 치환은 G19T, G19C, G19A, G19U, G19이노신, G19리보오스, G19-8-옥소구아닌, G19티민 글리콜, G19변형된 퓨린, 또는 G19변형된 피리미딘인, 변형된 트랜스포존 말단 서열.
  11. 제2항 내지 제9항 중 어느 한 항에 있어서, 돌연변이는 하기와의 치환을 포함하는, 변형된 트랜스포존 말단 서열:
    a. 우라실;
    b. 이노신;
    c. 리보오스;
    d. 8-옥소구아닌;
    e. 티민 글리콜;
    f. 변형된 퓨린; 및/또는
    g. 변형된 피리미딘.
  12. 제2항 내지 제11항 중 어느 한 항에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  13. 제2항 내지 제11항 중 어느 한 항에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 2개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  14. 제2항 내지 제11항 중 어느 한 항에 있어서, A16, C17, A18, 또는 G19에서의 돌연변이로부터 선택된 3개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  15. 제2항 내지 제11항 중 어느 한 항에 있어서, A16, C17, A18, 및 G19에서의 4개의 돌연변이를 포함하는, 변형된 트랜스포존 말단 서열.
  16. 제2항 내지 제11항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 A16, C17, A18, 및/또는 G19에서의 서열 번호 1에 비해 1 내지 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  17. 제1항 내지 제11항 중 어느 한 항에 있어서, 야생형 서열에 비해 1개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  18. 제1항 내지 제11항 중 어느 한 항에 있어서, 야생형 서열에 비해 2개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  19. 제1항 내지 제11항 중 어느 한 항에 있어서, 야생형 서열에 비해 3개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  20. 제1항 내지 제11항 중 어느 한 항에 있어서, 야생형 서열에 비해 4개의 치환 돌연변이를 갖는, 변형된 트랜스포존 말단 서열.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 변형된 트랜스포존 말단 서열.
  22. 제1항 내지 제20항 중 어느 한 항에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 변형된 트랜스포존 말단 서열.
  23. 하기를 포함하는, 트랜스포좀 복합체:
    a. 트랜스포사아제;
    b. 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하는 변형된 트랜스포존 말단 서열을 포함하는 제1 트랜스포존; 및
    c. 제1 트랜스포존 말단 서열의 적어도 일부분과 상보적인 제2 트랜스포존 말단 서열을 포함하는 제2 트랜스포존.
  24. 제23항에 있어서, 제1 트랜스포존은 리보오스, 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 용액 중에 있는, 트랜스포좀 복합체.
  25. 제23항에 있어서, 제1 트랜스포존은 우라실, 이노신, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘을 포함하고, 트랜스포좀 복합체는 고체 지지체 상에서 고정되는, 트랜스포좀 복합체.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 제1 트랜스포존은 제1항 내지 제22항 중 어느 한 항의 변형된 트랜스포존 말단 서열을 포함하는, 트랜스포좀 복합체.
  27. 제23항 내지 제26항 중 어느 한 항에 있어서, 트랜스포사아제는 Tn5인, 트랜스포좀 복합체.
  28. 제23항 내지 제27항 중 어느 한 항에 있어서, 제1 트랜스포존은 이전된 가닥(transferred strand)인, 트랜스포좀 복합체.
  29. 제23항 내지 제28항 중 어느 한 항에 있어서, 제2 트랜스포존은 비(non)이전된 가닥인, 트랜스포좀 복합체.
  30. 제23항 내지 제29항 중 어느 한 항에 있어서, 제1 트랜스포존의 우라실은 제2 트랜스포존의 A와 염기쌍을 형성하는, 트랜스포좀 복합체.
  31. 제23항 내지 제30항 중 어느 한 항에 있어서, 제1 트랜스포존의 이노신은 제2 트랜스포존의 C와 염기쌍을 형성하는, 트랜스포좀 복합체.
  32. 제23항 내지 제31항 중 어느 한 항에 있어서, 제1 트랜스포존의 리보오스는 제2 트랜스포존의 A, C, T, 또는 G와 염기쌍을 형성하는, 트랜스포좀 복합체.
  33. 제23항 내지 제32항 중 어느 한 항에 있어서, 제1 트랜스포존의 티민 글리콜은 제2 트랜스포존의 A와 염기쌍을 형성하는, 트랜스포좀 복합체.
  34. 제23항 내지 제33항 중 어느 한 항에 있어서, 변형된 퓨린은 제2 트랜스포존의 T와 염기쌍을 형성하는 제1 트랜스포존의 3-메틸아데닌인, 트랜스포좀 복합체.
  35. 제23항 내지 제34항 중 어느 한 항에 있어서, 변형된 퓨린은 제2 트랜스포존의 C와 염기쌍을 형성하는 제1 트랜스포존의 7-메틸구아닌인, 트랜스포좀 복합체.
  36. 제23항 내지 제34항 중 어느 한 항에 있어서, 변형된 피리미딘은 제2 트랜스포존의 G와 염기쌍을 형성하는 제1 트랜스포존의 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 트랜스포좀 복합체.
  37. 제23항 내지 제36항 중 어느 한 항에 있어서, 제1 또는 제2 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
  38. 제37항에 있어서, 제1 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
  39. 제38항에 있어서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착되는, 트랜스포좀 복합체.
  40. 제38항 또는 제39항에 있어서, 표적화된 트랜스포좀 복합체 내에 포함된 제1 트랜스포존은 링커를 포함하는, 트랜스포좀 복합체.
  41. 제40항에 있어서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 트랜스포좀 복합체.
  42. 제37항에 있어서, 제2 트랜스포존은 친화성 요소를 포함하는, 트랜스포좀 복합체.
  43. 제42항에 있어서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착되는, 트랜스포좀 복합체.
  44. 제43항에 있어서, 제2 트랜스포존은 서열 번호 13을 포함하는, 트랜스포좀 복합체.
  45. 제44항에 있어서, 제2 트랜스포존은 링커를 포함하는, 트랜스포좀 복합체.
  46. 제45항에 있어서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 트랜스포좀 복합체.
  47. 제37항 내지 제46항 중 어느 한 항에 있어서, 친화성 요소는 비오틴, 아비딘, 스트렙타비딘, 항체, 또는 올리고뉴클레오티드를 포함하는, 트랜스포좀 복합체.
  48. 제23항 내지 제47항 중 어느 한 항에 있어서, 제2 트랜스포존은 하기를 포함하는, 트랜스포좀 복합체.
    a. 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열; 또는
    b. 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단.
  49. 제48항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
  50. 제48항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
  51. 제48항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
  52. 제48항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌, 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포좀 복합체.
  53. 제23항 내지 제52항 중 어느 한 항에 있어서, 트랜스포좀 복합체는 용액 중에 있는, 트랜스포좀 복합체.
  54. 상부에 고정된 제23항 내지 제52항 중 어느 한 항의 트랜스포좀 복합체를 갖는 고체 지지체.
  55. 이중가닥 핵산을 포함하는 샘플을 제23항 내지 제53항 중 어느 한 항의 트랜스포좀 복합체 또는 제54항의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계를 포함하는, 이중가닥 핵산의 단편화 방법.
  56. 하기를 포함하는, 제1 트랜스포존 말단의 전부 또는 일부가 결여된 이중가닥 핵산 단편의 제조 방법:
    a. 핵산을 포함하는 샘플을 제23항 내지 제53항 중 어느 한 항의 트랜스포좀 복합체 또는 제54항의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계; 및
    b. 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계.
  57. 제56항에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
  58. 제56항에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
  59. 제57항 또는 제58항에 있어서, 단편으로부터 제1 트랜스포존 말단의 전부 또는 일부를 제거한 후 단편을 시퀀싱하는 단계를 추가로 포함하는, 제조 방법.
  60. 제59항에 있어서, 시퀀싱 전에 단편의 증폭을 필요로 하지 않는, 제조 방법.
  61. 제59항에 있어서, 단편은 시퀀싱 전에 증폭되는, 제조 방법.
  62. 제59항 내지 제61항 중 어느 한 항에 있어서, 어댑터 결찰 후에 그리고 시퀀싱 전에 논의되는 단편을 농축하는 단계를 추가로 포함하는, 제조 방법.
  63. 하기를 포함하는, 어댑터를 포함하는 이중가닥 핵산 단편의 제조 방법:
    a. 핵산을 포함하는 샘플을 제23항 내지 제53항 중 어느 한 항의 트랜스포좀 복합체 또는 제54항의 고체 지지체와 조합하는 단계 및 단편을 제조하는 단계;
    b. 샘플을, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합과 조합하는 단계 및 모자이크 말단 서열 내 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 및/또는 변형된 피리미딘에서 제1 트랜스포존 말단을 절단하여 단편으로부터의 제1 트랜스포존 말단의 전부 또는 일부를 제거하는 단계; 및
    c. 어댑터를 단편의 5' 및/또는 3' 말단 상에 결찰하는 단계.
  64. 제63항에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
  65. 제63항에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
  66. 제56항 내지 제65항 중 어느 한 항에 있어서, 핵산은 이중가닥 DNA인, 제조 방법.
  67. 제56항 내지 제65항 중 어느 한 항에 있어서, 핵산은 RNA이고, 이중가닥 cDNA 또는 DNA:RNA 듀플렉스는 트랜스포좀 복합체와 조합되기 전에 생성되는, 제조 방법.
  68. 제56항 내지 제67항 중 어느 한 항에 있어서, 절단되는 제1 트랜스포존 말단의 전부 또는 일부는 샘플의 나머지로부터 분리되는, 제조 방법.
  69. 제63항 내지 제68항 중 어느 한 항에 있어서, 결찰 전에, 단편의 3' 말단에서의 필링(filling) 단계 및 키나아제로 단편의 3' 말단을 인산화하는 단계를 추가로 포함하는, 제조 방법.
  70. 제69항에 있어서, 필링은 T4 DNA 폴리머라아제로 수행되는, 제조 방법.
  71. 제70항에 있어서, 단편의 3' 말단에 단일 A 오버행을 추가하는 단계를 추가로 포함하는, 제조 방법.
  72. 제71항에 있어서, 폴리머라아제는 단일 A 오버행을 추가하는, 제조 방법.
  73. 제72항에 있어서, 폴리머라아제는 (i) Taq 또는 (ii) 클레나우(Klenow) 단편, 엑소-인, 제조 방법.
  74. 제56항 내지 제73항 중 어느 한 항에 있어서, 단편은 모자이크 말단 서열의 0 내지 3개의 염기를 포함하는, 제조 방법.
  75. 제56항 내지 제74항 중 어느 한 항에 있어서, 단편의 제조 단계는 서열 번호 1을 포함하는 야생형 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열을 포함하는 제1 트랜스포존을 포함하는 트랜스포좀 복합체를 갖는 단편의 제조에 비해, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%의 단편 수의 제조를 야기하는, 제조 방법.
  76. 제63항 내지 제75항 중 어느 한 항에 있어서, 어댑터 결찰 후에 단편을 시퀀싱하는 단계를 추가로 포함하는, 제조 방법.
  77. 제76항에 있어서, 시퀀싱 전에 단편의 증폭을 필요로 하지 않는, 제조 방법.
  78. 제77항에 있어서, 단편은 시퀀싱 전에 증폭되는, 제조 방법.
  79. 제76항 내지 제78항 중 어느 한 항에 있어서, 어댑터 결찰 후에 그리고 시퀀싱 전에 논의되는 단편을 농축하는 단계를 추가로 포함하는, 제조 방법.
  80. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 우라실을 포함하고, DNA 글리코실라아제와 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 우라실-특이적 절제 시약(USER: uracil-specific excision reagent)인, 제조 방법.
  81. 제80항에 있어서, USER은 우라실 DNA 글리코실라아제 및 엔도뉴클레아제 VIII 또는 엔도뉴클레아제 III의 혼합물인, 제조 방법.
  82. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 이노신을 포함하고, 엔도뉴클레아제는 엔도뉴클레아제 V인, 제조 방법.
  83. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 리보오스를 포함하고, 엔도뉴클레아제는 RNAse HII인, 제조 방법.
  84. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 8-옥소구아닌을 포함하고, 엔도뉴클레아제는 포름아미도피리미딘-DNA 글리코실라아제(FPG) 또는 옥소구아닌 글리코실라아제(OGG)인, 제조 방법.
  85. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 티민 글리콜을 포함하고, DNA 글리코실라아제는 엔도뉴클레아제 EndoIII(Nth) 또는 Endo VIII인, 제조 방법.
  86. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 변형된 퓨린을 포함하고, DNA 글리코실라아제는 인간 3-알킬아데닌 DNA 글리코실라아제이고, 엔도뉴클레아제는 엔도뉴클레아제 III 또는 VIII인, 제조 방법.
  87. 제86항에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
  88. 제56항 내지 제79항 중 어느 한 항에 있어서, 변형된 트랜스포존 말단 서열은 변형된 피리미딘을 포함하고:
    a. DNA 글리코실라아제는 티민-DNA 글리코실라아제(TDG) 또는 포유류 DNA 글리코실라아제-메틸-CpG 결합 도메인 단백질 4(MBD4)이고, 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제는 엔도뉴클레아제 III 또는 VIII이거나;
    b. 엔도뉴클레아제는 DNA 글리코실라아제/리아아제 ROS1(ROS1)인, 제조 방법.
  89. 제88항에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
  90. 제56항 내지 제89항 중 어느 한 항에 있어서, 제1 트랜스포존은 우라실, 이노신, 리보오스, 8-옥소구아닌, 티민 글리콜, 변형된 퓨린, 또는 변형된 피리미딘으로부터 선택된 하나 초과의 돌연변이를 포함하는 변형된 트랜스포존 말단 서열을 포함하고, (1) 엔도뉴클레아제 또는 (2) DNA 글리코실라아제와 열, 염기성 조건, 또는 무염기성 부위를 인식하는 엔도뉴클레아제/리아아제의 조합은 효소 혼합물인, 제조 방법.
  91. 제90항에 있어서, 변형된 퓨린은 3-메틸아데닌 또는 7-메틸구아닌인, 제조 방법.
  92. 제90항에 있어서, 변형된 피리미딘은 5-메틸시토신, 5-포르밀시토신, 또는 5-카르복시시토신인, 제조 방법.
  93. 제63항 내지 제92항 중 어느 한 항에 있어서, 제1 트랜스포존 말단의 절단 단계는 어댑터를 결찰하기 위한 점착성 말단을 생성하는, 제조 방법.
  94. 제93항에 있어서, 점착성 말단은 하나의 염기보다 더 긴, 제조 방법.
  95. 제63항 내지 제94항 중 어느 한 항에 있어서, 어댑터는 이중가닥 어댑터를 포함하는, 제조 방법.
  96. 제63항 내지 제95항 중 어느 한 항에 있어서, 어댑터는 단편의 5' 및 3' 말단에 추가되는, 제조 방법.
  97. 제96항에 있어서, 단편의 5' 및 3' 말단에 추가된 어댑터는 상이한, 제조 방법.
  98. 제63항 내지 제97항 중 어느 한 항에 있어서, 어댑터는 고유 분자 식별자(UMI: unique molecular identifier), 프라이머 서열, 앵커 서열, 범용 서열, 스페이서 영역, 인덱스 서열, 캡쳐 서열, 바코드 서열, 절단 서열, 시퀀싱 관련 서열, 및 이의 조합을 포함하는, 제조 방법.
  99. 제98항에 있어서, 어댑터는 UMI를 포함하는, 제조 방법.
  100. 제99항에 있어서, UMI를 포함하는 어댑터는 단편의 3' 및 5' 말단 모두에 결찰되는, 제조 방법.
  101. 제63항 내지 제100항 중 어느 한 항에 있어서, 어댑터는 분기형 어댑터인, 제조 방법.
  102. 제63항 내지 제101항 중 어느 한 항에 있어서, 결찰은 DNA-리가아제로 수행되는, 제조 방법.
  103. 제63항 내지 제102항 중 어느 한 항에 있어서, 단일 반응 용기에서 수행되는, 제조 방법.
  104. 제56항 내지 제103항 중 어느 한 항에 있어서, 고체 표면 상에 고정된 트랜스포좀의 밀도는 고정된 단편의 라이브러리 수율 및 단편 크기를 조절하도록 선택되는, 제조 방법.
  105. 제56항 내지 제104항 중 어느 한 항에 있어서, 비드-기반 정규화를 허용하는, 제조 방법.
  106. 제56항 내지 제105항 중 어느 한 항에 있어서, 샘플은 부분적으로 단편화된 DNA를 포함하는, 제조 방법.
  107. 제56항 내지 제106항 중 어느 한 항에 있어서, 샘플은 포르말린 고정된 파라핀 내장 조직 또는 무세포 DNA인, 제조 방법.
  108. 제56항 내지 제107항 중 어느 한 항에 있어서, 라이브러리는 단일 태그먼트화 사건에 의해 제조된 단편을 포함하는, 제조 방법.
  109. 제1 트랜스포존과 제2 트랜스포존을 갖는 트랜스포존 쌍으로서, 제1 트랜스포존은 제1항 내지 제22항 중 어느 한 항의 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 하기를 포함하는, 트랜스포존 쌍:
    a. 야생형 모자이크 말단 서열과 상보적인 모자이크 말단 서열을 포함하는 트랜스포존 말단 서열; 또는
    b. 제1 트랜스포존 말단과 전부 상보적인 트랜스포존 말단 서열.
  110. 제109항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A16U, A16-8-옥소구아닌, 또는 A16이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
  111. 제109항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 C17-8-옥소구아닌 또는 C17이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
  112. 제109항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 A18-8-옥소구아닌 또는 A18이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
  113. 제109항에 있어서, 제1 트랜스포존은 서열 번호 1에 비해 G19-8-옥소구아닌, 또는 G19이노신 치환을 포함하는 변형된 트랜스포존 말단 서열을 포함하고, 제2 트랜스포존은 서열 번호 1과 상보적인 제2 트랜스포존 말단 서열 또는 제1 트랜스포존 말단과 전부 상보적인 제2 트랜스포존 말단을 포함하는, 트랜스포존 쌍.
KR1020237032795A 2021-03-29 2022-03-28 개선된 라이브러리 제조 방법 KR20230161979A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163167150P 2021-03-29 2021-03-29
US63/167,150 2021-03-29
US202163224201P 2021-07-21 2021-07-21
US63/224,201 2021-07-21
PCT/US2022/022167 WO2022212269A1 (en) 2021-03-29 2022-03-28 Improved methods of library preparation

Publications (1)

Publication Number Publication Date
KR20230161979A true KR20230161979A (ko) 2023-11-28

Family

ID=81346345

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237032795A KR20230161979A (ko) 2021-03-29 2022-03-28 개선된 라이브러리 제조 방법

Country Status (8)

Country Link
EP (1) EP4314279A1 (ko)
JP (1) JP2024511766A (ko)
KR (1) KR20230161979A (ko)
AU (1) AU2022252197A1 (ko)
BR (1) BR112023019898A2 (ko)
CA (1) CA3214278A1 (ko)
IL (1) IL307195A (ko)
WO (1) WO2022212269A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3894590A2 (en) 2018-12-10 2021-10-20 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
AU2021275906A1 (en) 2020-05-22 2022-12-22 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
WO2023225519A1 (en) * 2022-05-17 2023-11-23 10X Genomics, Inc. Modified transposons, compositions and uses thereof

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
AU3539089A (en) 1988-04-08 1989-11-03 Salk Institute For Biological Studies, The Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
ATE144556T1 (de) 1988-06-24 1996-11-15 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
DE68926504T2 (de) 1988-07-20 1996-09-12 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
KR950013953B1 (ko) 1990-01-26 1995-11-18 애보트 래보라토리즈 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
DE69531542T2 (de) 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
WO1998030575A1 (en) 1997-01-08 1998-07-16 Proligo Llc Bioconjugation of macromolecules
DE69837913T2 (de) 1997-04-01 2008-02-07 Solexa Ltd., Saffron Walden Verfahren zur vervielfältigung von nukleinsäure
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US20050191698A1 (en) 1999-04-20 2005-09-01 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US6913884B2 (en) 2001-08-16 2005-07-05 Illumina, Inc. Compositions and methods for repetitive use of genomic DNA
AU2001238068A1 (en) 2000-02-07 2001-08-14 Illumina, Inc. Nucleic acid detection methods using universal priming
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
WO2002004680A2 (en) 2000-07-07 2002-01-17 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
AU2003240482B2 (en) 2002-05-30 2009-03-12 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US7259258B2 (en) 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP3373174A1 (en) 2006-03-31 2018-09-12 Illumina, Inc. Systems and devices for sequence by synthesis analysis
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
CA2672315A1 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2008096146A1 (en) 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP2376517B1 (en) 2008-10-24 2013-01-16 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP2632593B1 (en) 2010-10-27 2021-09-29 Illumina, Inc. Flow cells for biological or chemical analysis
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US9005935B2 (en) 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
WO2012170936A2 (en) 2011-06-09 2012-12-13 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
US20130143774A1 (en) 2011-12-05 2013-06-06 The Regents Of The University Of California Methods and compositions for generating polynucleic acid fragments
US9683230B2 (en) * 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
JP2015045836A (ja) 2013-08-02 2015-03-12 富士フイルム株式会社 パターン形成方法及びそれに用いられる表面処理剤、並びに、電子デバイスの製造方法及び電子デバイス
US10287622B2 (en) * 2013-11-07 2019-05-14 Agilent Technologies, Inc. Plurality of transposase adapters for DNA manipulations
JP6490710B2 (ja) 2014-04-15 2019-03-27 イラミーナ インコーポレーテッド 改善された挿入配列バイアスおよび拡大されたdnaインプット許容差のための修正トランスポザーゼ
US11453875B2 (en) 2015-05-28 2022-09-27 Illumina Cambridge Limited Surface-based tagmentation
AU2018210188B2 (en) 2017-01-18 2023-11-09 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
AU2018225503A1 (en) 2017-02-21 2018-12-13 Illumina Cambridge Limited Tagmentation using immobilized transposomes with linkers
WO2018208699A1 (en) 2017-05-08 2018-11-15 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
MX2021003625A (es) * 2019-01-11 2021-05-27 Illumina Cambridge Ltd Complejos de transposoma ligados a superficie de complejo.

Also Published As

Publication number Publication date
EP4314279A1 (en) 2024-02-07
WO2022212269A1 (en) 2022-10-06
CA3214278A1 (en) 2022-10-06
AU2022252197A1 (en) 2023-09-21
IL307195A (en) 2023-11-01
JP2024511766A (ja) 2024-03-15
BR112023019898A2 (pt) 2023-11-07

Similar Documents

Publication Publication Date Title
KR20230161979A (ko) 개선된 라이브러리 제조 방법
KR102628035B1 (ko) 메틸화 서열결정을 위한 단일 세포 전체 게놈 라이브러리
EP3615671B1 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
JP2020508083A (ja) 標的ヌクレオチド配列の富化及び決定方法
IL302207A (en) Sequencing templates that include several additions and compositions and methods to improve sequencing output
KR20210114918A (ko) 복합체 표면-결합 트랜스포좀 복합체
CN112739830A (zh) 使用单一表面引物进行配对末端测序的方法和组合物
US11667953B2 (en) Methods and compositions for cluster generation by bridge amplification
US20230183682A1 (en) Preparation of RNA and DNA Sequencing Libraries Using Bead-Linked Transposomes
KR20230051508A (ko) 핵산의 서열-특이적 표적화된 전위 및 선택과 분류
US20240150753A1 (en) Methods of isothermal complementary dna and library preparation
CN117062910A (zh) 改进的文库制备方法
RU2798952C2 (ru) Получение библиотеки нуклеиновых кислот с использованием электрофореза
US20240026348A1 (en) Methods of Preparing Directional Tagmentation Sequencing Libraries Using Transposon-Based Technology with Unique Molecular Identifiers for Error Correction
KR20220031539A (ko) 전기영동을 이용한 핵산 라이브러리 제조