KR20230154078A - CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정 - Google Patents

CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정 Download PDF

Info

Publication number
KR20230154078A
KR20230154078A KR1020237034433A KR20237034433A KR20230154078A KR 20230154078 A KR20230154078 A KR 20230154078A KR 1020237034433 A KR1020237034433 A KR 1020237034433A KR 20237034433 A KR20237034433 A KR 20237034433A KR 20230154078 A KR20230154078 A KR 20230154078A
Authority
KR
South Korea
Prior art keywords
cas
composition
grna
base pairs
fragment
Prior art date
Application number
KR1020237034433A
Other languages
English (en)
Inventor
앤드루 케네디
사라 슐차베르거
에머 벨
올리버 밀러
킴 슈나이더
에스더 머스그레이브-브라운
니얼 곰리
앤드루 슬래터
펑 천
Original Assignee
일루미나, 인코포레이티드
일루미나 케임브리지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드, 일루미나 케임브리지 리미티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20230154078A publication Critical patent/KR20230154078A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

Cas-gRNA RNP를 사용하는 게놈 라이브러리 제작 및 표적화된 후성적 검정이 본원에 제공된다. 일부 조성물은 제1 종으로부터의, 실질적으로 오직 단일 가닥 폴리뉴클레오타이드; 제2 종으로부터의, 실질적으로 오직 이중 가닥 폴리뉴클레오타이드; 및 제2 이중 가닥 폴리뉴클레오타이드의 말단에 결찰되고, 제1 이중 가닥 폴리뉴클레오타이드의 임의의 말단에 실질적으로 결찰되지 않은 증폭 프라이머를 포함한다. 일부 조성물은 서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자를 포함하며, 제1 분자는 제1 하위서열에서 제1 말단을 갖고, 제2 분자는 제2 하위서열에서 제1 말단을 갖고, 제1 하위서열은 제2 하위서열과 오직 부분적으로 중첩된다. 일부 예는 표적 폴리뉴클레오타이드 및 커플링된 증폭 어댑터를 갖는 트랜스포사제에 커플링된 Cas-gRNA RNP를 포함하는 제1 융합 단백질을 포함하는 조성물을 제공한다. Cas-gRNA RNP는 표적 폴리뉴클레오타이드의 하위서열에 혼성화될 수 있다.

Description

CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정
관련 출원의 교차 참조
본 출원은 다음 출원의 이익을 주장하며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다:
2021년 3월 9일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정(Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins)"인 미국 임시 특허 출원 제63/158,492호,
2021년 3월 18일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정"인 미국 임시 특허 출원 제63/162,775호,
2021년 3월 19일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정"인 미국 임시 특허 출원 제63/163,381호,
2021년 8월 2일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정"인 미국 임시 특허 출원 제63/228,344호,
2021년 9월 22일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정"인 미국 임시 특허 출원 제63/246,879호, 및
2021년 12월 30일자로 출원되고, 발명의 명칭이 "Cas-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정"인 미국 임시 특허 출원 제63/295,432호.
기술분야
본 출원은 게놈 라이브러리 제작 및 표적화된 후성적 검정을 위해 Cas-gRNA RNP를 사용하는 조성물 및 방법에 관한 것이다.
서열 목록에 관한 설명
본 출원과 연관된 서열 목록은 서류 사본 대신에 텍스트 형식으로 제공되며, 본 명세서에 인용되어 포함된다. 서열 목록을 포함하는 텍스트 파일의 명칭은 8549102416_SL.txt로 명명된다. 텍스트 파일은 약 1.29 KB이고, 2022년 3월 4일자로 생성되었으며, EFS-Web을 통해 전자 제출된다.
클러스터형의 규칙적인 간격의 짧은 회문구조 반복체(CRISPR: clustered regularly interspaced short palindromic repeat)는 세포를 박테리오파지 및 다수의 세균과 고세균에서의 접합 플라스미드로부터 보호하는 간섭 경로에 관여된다. 예를 들어, 문헌[Marraffini et al., "CRISPR interference: RNA-directed adaptive immunity in bacteria and archaea," Nat Rev Genet. 11(3): 181-190 (2010)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다. CRISPR 서열은 대개 파지 또는 플라스미드 DNA로부터 유래하는 스페이서라고 불리는 유사한 크기의 고유한 가변 DNA 서열이 사이에 배치된 짧은 반복 서열 배열을 포함하며; 예를 들어 다음 참고문헌을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다: 문헌[Barrangou et al., "CRISPR provides acquired resistances against viruses in prokaryotes," Science 315:1709-1712 (2007)]; 문헌[Bolotin et al., "Clustered regularly interspersed short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin," Microbiology 151:2551-1561 (2005)]; 및 문헌[Mojica et al., "Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements," J Mol Evol. 60:174-82 (2005)]. 따라서, CRISPR 서열은 지난 감염의 순응적 유전성 기록을 제공하며, CRISPR RNA(crRNA)-침습성 폴리뉴클레오타이드를 표적으로 하는 작은 RNA로 전사될 수 있다(예를 들어, 상기 인용된 문헌[Marraffini et al] 참조). CRISPR은 대개 CRISPR과 관련된 단백질을 코딩하는 CRISPR-연관 (Cas) 유전자와 연관된다. Cas 단백질은 crRNA에 의해 표적화되는 침입 외래 폴리뉴클레오타이드를 파괴하기 위한 메커니즘을 제공할 수 있다. Cas 유전자와 함께 CRISPR은 세균 및 고세균에서 침입 외래 폴리뉴클레오타이드에 대한 획득 내성을 제공하는 순응적 면역 체계를 제공한다(예를 들어, 상기 인용된 문헌[Barrangou et al] 참조).
단일 분자 시퀀싱 연구는 Cas9를 이용한 직접적 메틸화 시퀀싱을 위한 CRISPR-표적화된 방법을 제안하였으며; 예를 들어, 문헌[Gilpatrick et al., "Targeted nanopore sequencing with Cas9 for studies of methylation, structural variants and mutations," https://doi.org/10.1101/604173, 1-14 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다. 그러나, DNA 메틸화 외에, 표적화된 DNA 유전자좌에서의 후성적 변화의 민감한 특성화를 가능하도록 하는 방법에 대한 미충족 요구가 존재한다. 염색질 접근성(ATAC-seq에 의함) 및 DNA 유전자좌와 연관된 단백질(들)(ChIP-seq에 의함)은 현존하는 하이브리드 포획 기술로 표적화하기 어려운 후성적 요소의 예이다. 일반적으로, DNA 서열을 농축하는 검정은 후성적 특성과 연관된다. 그러나, 이들 서열은 선험적으로 알려져 있지 않기 때문에, 관심의 특정 게놈 영역(예를 들어 유전자좌)에 대한 후성적 검정 결과를 효율적으로 농축하는 적절한 하이브리드 포획 올리고뉴클레오타이드를 설계하는 것은 어려운 일이다.
표적화된 유전자좌-특이적 단백질 단리를 위해 비활성화된 Cas(dCas9)를 사용하여 히스톤 유전자 조절자를 식별하는 이전의 방법이 제시되었고; 예를 들어, 문헌[Tsui et al., "dCas9-targeted locus-specific protein isolation method identifies histone gene regulators," PNAS 115(2): E2734-E2741 (2018)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다. 이러한 방법은 dCas9-기반 유전자좌 농축이 질량 분석법에 의해 이후 검정될 수 있는 염색질을 단리할 수 있음을 입증하였다. 그러나, 이 방법은 오직 각각의 실험에서 검정되는 단일 염색질 유전자좌를 허용한다. 또한, 이러한 이전 작업은 2개의 별도의 결과, 즉, DNA 유전자좌의 서열 및 DNA 연관 단백질을 식별하기 위한 질량 분석법을 제공한다. 유전자좌-표적화된 후성적 분석에 대한 개선된 방법이 필요하다.
Cas-gRNA 리보핵단백질(RNP)을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정이 본원에 제공된다.
본원의 일부 예는 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물의 처리 방법을 제공하며, 방법은 제1 이중 가닥 폴리뉴클레오타이드의 말단 및 제2 이중 가닥 폴리뉴클레오타이드의 임의의 말단을 보호하는 단계를 포함할 수 있다. 방법은 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단의 보호 후, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단을 선택적으로 생성하는 단계를 포함할 수 있다. 방법은 제1 이중 가닥 폴리뉴클레오타이드를 자유 말단으로부터 보호된 말단을 향해 분해하는 단계를 포함할 수 있다.
일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단을 선택적으로 생성하는 단계는 제1 이중 가닥 폴리뉴클레오타이드 내에 존재하고 제2 이중 가닥 폴리뉴클레오타이드 내에 존재하지 않는 서열에 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 혼성화하는 단계 및 서열을 Cas-gRNA RNP로 절단하는 단계를 포함한다. 일부 예에서, 서열은 포유동물 특이적 반복 요소를 포함한다. 일부 예에서, 포유동물 특이적 반복 요소는 인간 특이적 반복 요소를 포함한다. 일부 예에서, 제2 종은 세균, 진균, 또는 바이러스이다. 일부 예에서, 제1 이중 가닥 뉴클레오타이드는 제1 종으로부터의 복수의 염색체를 포함한다.
일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 헤어핀 어댑터를 말단에 결찰하는 단계를 포함한다. 일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 말단을 5'-탈인산화하는 단계를 포함한다. 일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 변형된 염기를 말단에 부가하는 단계를 포함한다. 일부 예에서, 변형된 염기는 포스포로티오에이트 결합을 포함한다. 일부 예에서, 변형된 염기는 말단 트랜스퍼라제(terminal transferase)를 사용하여 부가된다.
일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 엑소뉴클레아제를 사용하여 수행된다.
일부 예에서, 자유 말단은 3' 말단을 포함한다. 일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 엑소뉴클레아제 III을 사용하여 수행된다. 일부 예에서, 자유 말단은 5' 말단을 포함한다. 일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 람다 엑소뉴클레아제를 사용하여 수행된다.
일부 예에서, 방법은 이후 증폭 어댑터를 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드의 말단에 결찰하는 단계를 추가로 포함한다. 일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI: unique molecular identifier)를 포함한다. 일부 예에서, 방법은 이후 이중 가닥 폴리뉴클레오타이드를 증폭 및 시퀀싱하는 단계를 추가로 포함한다.
일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, 제2 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, 제2 이중 가닥 폴리뉴클레오타이드는 원형 DNA를 포함한다.
일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드를 포함할 수 있다. 제1 이중 가닥 폴리뉴클레오타이드의 말단은 보호될 수 있다. 조성물은 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드를 포함할 수 있다. 제2 이중 가닥 폴리뉴클레오타이드의 임의의 말단은 보호될 수 있다. 조성물은 또한 제1 이중 가닥 폴리뉴클레오타이드 내에 존재하고, 제2 이중 가닥 폴리뉴클레오타이드 내에 존재하는 않는 서열에 혼성화된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. Cas-gRNA RNP는 제1 이중 가닥 폴리뉴클레오타이드 내에 자유 말단을 선택적으로 생성하도록 서열을 절단하기 위한 것일 수 있다.
일부 예에서, 서열은 포유동물 특이적 반복 요소를 포함한다. 일부 예에서, 포유동물 특이적 반복 요소는 인간 반복 요소를 포함한다. 일부 예에서, 제2 종은 세균, 진균, 또는 바이러스이다.
일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 헤어핀 어댑터를 사용하여 보호된다. 일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 5'-탈인산화를 사용하여 보호된다. 일부 예에서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 변형된 염기를 사용하여 보호된다. 일부 예에서, 변형된 염기는 포스포로티오에이트 결합을 포함한다.
일부 예에서, 자유 말단은 3' 말단을 포함한다. 일부 예에서, 자유 말단은 5' 말단을 포함한다.
일부 예에서, 제1 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, 제2 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, 제2 이중 가닥 폴리뉴클레오타이드는 원형 DNA를 포함한다.
일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물의 처리 방법을 제공한다. 방법은 혼합물 중의 제1 이중 가닥 폴리뉴클레오타이드를 선택적으로 단일 가닥으로 만드는 단계를 포함할 수 있다. 방법은 이후 증폭 프라이머를 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드에 선택적으로 결찰하는 단계를 포함할 수 있다. 방법은 이후 증폭 프라이머가 결찰되었던 혼합물 중의 임의의 이중 가닥 폴리뉴클레오타이드를 증폭하는 단계를 포함할 수 있다.
본원의 일부 예는 조성물을 제공한다. 조성물은 제1 종으로부터의, 실질적으로 오직 단일 가닥 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 제2 종으로부터의, 실질적으로 오직 이중 가닥 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 제2 이중 가닥 폴리뉴클레오타이드의 말단에 결찰되고, 제1 이중 가닥 폴리뉴클레오타이드의 임의의 말단에 실질적으로 결찰되지 않은 증폭 프라이머를 포함할 수 있다.
본원의 일부 예는 전장 게놈(WG)의 단편의 생성 방법을 제공한다. 방법은 WG의 제1 샘플 내에서, 제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화하는 단계를 포함할 수 있다. 방법은 WG의 제1 샘플 내에서, 제2 세트의 Cas-gRNA RNP를 대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화하는 단계를 추가로 포함할 수 있다. 방법은 WG의 제1 샘플 내에서, 제1 및 제2 서열을 제1 샘플 내의 제1 및 제2 세트의 Cas-gRNA RNP로 각각 절단하여 제1 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 추가로 포함할 수 있다.
일부 예에서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일하다. 일부 예에서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개이다. 일부 예에서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700개이다. 일부 예에서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다.
일부 예에서, 방법은 WG의 제2 샘플 내에서, 제1 세트의 Cas-gRNA RNP를 WG 내의 제1 서열에 혼성화하는 단계를 추가로 포함한다. 방법은 WG의 제2 샘플 내에서, 제2 세트의 Cas-gRNA RNP를 WG 내의 제2 서열에 혼성화하는 단계를 추가로 포함할 수 있다. 방법은 WG의 제2 샘플 내에서, 제3 세트의 Cas-gRNA RNP를 대략 제3 염기쌍 수만큼 서로 이격된 WG에서의 제3 서열에 혼성화하는 단계를 추가로 포함할 수 있다. 방법은 WG의 제2 샘플 내에서, 제1, 제2, 및 제3 서열을 제1, 제2, 및 제3 세트의 Cas-gRNA RNP로 각각 절단하여 제2 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 추가로 포함할 수 있다.
일부 예에서, 제3 염기쌍 수는 제1 염기쌍 수와 상이하다. 일부 예에서, 제3 염기쌍 수는 제2 염기쌍 수와 상이하다. 일부 예에서, 제3 염기쌍 수는 약 100개 내지 약 2000개이다. 일부 예에서, 제3 염기쌍 수는 약 200개 내지 약 400개이다. 일부 예에서, 제2 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제1 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이하다. 일부 예에서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다.
일부 예에서, 방법은 WG의 제3 샘플 내에서, 제1, 제2, 또는 제3 세트의 Cas-gRNA RNP를 WG 내의 제1, 제2, 또는 제3 서열에 각각 혼성화하는 단계를 추가로 포함한다. 방법은 제1, 제2, 및 제3 서열을 제1, 제2, 및 제3 세트의 Cas-gRNA RNP로 각각 절단하여 제3 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 추가로 포함할 수 있다.
일부 예에서, 제3 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제1 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이하다. 일부 예에서, 제3 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제2 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이하다. 일부 예에서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다.
일부 예에서, 방법은 증폭 어댑터를 제3 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계를 추가로 포함한다. 방법은 결찰된 증폭 어댑터를 갖는 제3 세트의 WG 단편의 WG 단편 앰플리콘(amplicon)을 생성하는 단계를 추가로 포함할 수 있다. 방법은 제3 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함할 수 있다. 일부 예에서, 제2 및 제3 세트의 WG 단편의 WG 단편 앰플리콘은 시퀀싱하기 위해 함께 혼합된다. 일부 예에서, 제1 및 제3 세트의 WG 단편의 WG 단편 앰플리콘은 증폭 및 시퀀싱하기 위해 함께 혼합된다.
일부 예에서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 500개 내지 약 700개이다.
일부 예에서, 제3 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다.
일부 예에서, 방법은 증폭 어댑터를 제2 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계를 추가로 포함한다. 방법은 결찰된 증폭 어댑터를 갖는 제2 세트의 WG 단편의 WG 단편 앰플리콘을 생성하는 단계를 추가로 포함할 수 있다. 방법은 제2 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함할 수 있다.
일부 예에서, 제1 및 제2 세트의 WG 단편의 WG 단편 앰플리콘은 증폭 및 시퀀싱하기 위해 함께 혼합된다.
일부 예에서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개이다.
일부 예에서, 방법은 증폭 어댑터를 제1 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계를 추가로 포함한다. 방법은 결찰된 증폭 어댑터를 갖는 제1 세트의 WG 단편의 WG 단편 앰플리콘을 생성하는 단계를 추가로 포함할 수 있다. 방법은 제1 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함할 수 있다.
일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 200개 내지 약 400개이다.
일부 예에서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다. 일부 예에서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 전장 게놈(WG) 샘플을 포함할 수 있다. 조성물은 대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화된 제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 조성물은 대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화된 제2 세트의 Cas-gRNA RNP를 포함할 수 있다. 제1 및 제2 세트의 Cas-gRNA RNP는 각각 샘플 내의 제1 및 제2 서열을 절단하여, 각각 서로 대략 동일한 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것일 수 있다.
일부 예에서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일하다. 일부 예에서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개이다. 일부 예에서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700개이다.
일부 예에서, WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다. 일부 예에서, WG 단편에서의 염기쌍 수는 약 100개의 염기쌍 내지 약 1000개의 염기쌍이다. 일부 예에서, WG 단편에서의 염기쌍 수는 약 200개의 염기쌍 내지 약 400개의 염기쌍이다.
일부 예에서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다. 일부 예에서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 전장 게놈(WG) 샘플을 포함할 수 있다. 조성물은 대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화된 제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 조성물은 대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화된 제2 세트의 Cas-gRNA RNP를 포함할 수 있다. 조성물은 대략 제3 염기쌍 수만큼 서로 이격된 WG에서의 제3 서열에 혼성화된 제3 세트의 Cas-gRNA RNP를 포함할 수 있다. 제1, 제2, 및 제3 세트의 Cas-gRNA RNP는 각각 샘플 내의 제1, 제2, 및 제3 서열을 절단하여, 각각 서로 대략 동일한 수의 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것일 수 있다.
일부 예에서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일하다. 일부 예에서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개이고, 제3 염기쌍 수는 약 100개 내지 약 2000개이다. 일부 예에서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700개이고, 제3 염기쌍 수는 약 200개 내지 약 400개이다. 일부 예에서, 제3 염기쌍 수는 제1 염기쌍 수와 상이하다. 일부 예에서, 제3 염기쌍 수는 제2 염기쌍 수와 상이하다.
일부 예에서, WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다. 일부 예에서, WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개이다.
일부 예에서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다. 일부 예에서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다. 일부 예에서, 제3 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함한다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 전장 게놈(WG)의 단편의 생성 방법을 제공한다. 방법은 대략 소정 수의 염기쌍만큼 서로 이격된 WG에서의 서열에 혼성화된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 세트를 포함할 수 있다. 방법은 서열을 Cas-gRNA RNP 세트로 각각 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 생성하는 단계를 포함할 수 있다.
일부 예에서, 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, 염기쌍 수는 약 500개 내지 약 700개, 또는 약 200개 내지 약 400개, 또는 약 100개 내지 약 200개이다.
일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개, 또는 약 200개 내지 약 400개, 또는 약 500개 내지 약 700개이다.
일부 예에서, 방법은 증폭 어댑터를 WG 단편 세트의 WG 단편 말단에 결찰하는 단계를 추가로 포함한다. 방법은 결찰된 증폭 어댑터를 갖는 WG 단편 세트의 WG 단편 앰플리콘을 생성하는 단계를 추가로 포함할 수 있다. 방법은 WG 단편 세트의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함할 수 있다.
일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 전장 게놈(WG) 샘플을 포함할 수 있다. 조성물은 대략 소정 수의 염기쌍만큼 서로 이격된 WG에서의 서열에 혼성화된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 세트를 포함할 수 있다. Cas-gRNA RNP 세트는 각각 샘플 내의 서열을 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하기 위한 것일 수 있다.
일부 예에서, 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, 염기쌍 수는 약 500개 내지 약 700개, 또는 약 200개 내지 약 400개, 또는 약 100개 내지 약 200개이다.
일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개이다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개, 또는 약 200개 내지 약 400개, 또는 약 500개 내지 약 700개이다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 적어도 약 1,000,000개의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 포함할 수 있다.
일부 예에서, 염기쌍 수는 약 100개 내지 약 200개이다. 일부 예에서, 염기쌍 수는 약 200개 내지 약 400개이다. 일부 예에서, 염기쌍 수는 약 500개 내지 약 700개이다.
일부 예에서, WG는 이중 가닥 DNA를 포함한다.
일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 10% 미만만큼 달라진다. 일부 예에서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 5% 미만만큼 달라진다.
이러한 조성물은 상기 기재된 바와 같은 방법에 따라 제조될 수 있다.
본원의 일부 예는 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법을 제공한다. 방법은 제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)과 유체 중에서 접촉시키는 단계를 포함할 수 있다. 방법은 제1 Cas-gRNA RNP 중 하나를 제1 분자에서의 제1 하위서열에 혼성화하는 단계를 포함할 수 있다. 방법은 제2 Cas-gRNA RNP 중 하나를 제2 분자에서의 제2 하위서열에 혼성화하는 단계를 포함할 수 있다. 제2 하위서열은 제1 하위서열과 오직 부분적으로 중첩될 수 있다. 방법은 제1 Cas-gRNA RNP 중 하나에 의해, 임의의 제2 Cas-gRNA RNP가 제1 분자에서의 제2 하위서열에 혼성화하는 것을 억제하는 단계를 포함할 수 있다. 방법은 제2 Cas-gRNA RNP 중 하나에 의해, 임의의 제1 Cas-gRNA RNP가 제2 분자에서의 제1 하위서열에 혼성화하는 것을 억제하는 단계를 포함할 수 있다. 방법은 제1 분자를 제1 하위서열에서 절단하는 단계를 포함할 수 있다. 방법은 제2 분자를 제2 하위서열에서 절단하는 단계를 포함할 수 있다.
일부 예에서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 제2 분자에서의 절단과 상이한 위치에서 이루어진다. 일부 예에서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 절단으로부터 벗어난다(offset).
일부 예에서, 제1 분자는 제1 Cas-gRNA RNP 중 하나를 사용하여 절단되고, 제2분자는 제2 Cas-gRNA RNP 중 하나를 사용하여 절단된다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9 또는 dCas9를 포함한다.
일부 예에서, 방법은 제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제3 및 제4 Cas-gRNA RNP와 유체 중에서 접촉시키는 단계를 추가로 포함한다. 방법은 제3 Cas-gRNA RNP 중 하나를 제1 분자에서의 제3 하위서열에 혼성화하는 단계를 추가로 포함할 수 있다. 방법은 제3 Cas-gRNA RNP 중 하나에 의해, 임의의 제4 Cas-gRNA RNP가 제1 분자에서의 제4 하위서열에 혼성화하는 것을 억제하는 단계를 추가로 포함할 수 있다. 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩될 수 있다. 방법은 제1 분자를 제3 Cas-gRNA RNP 중 하나를 사용하여 제3 하위서열에서 절단하여 제1 단편을 생성하는 단계를 포함할 수 있다.
일부 예에서, 방법은 제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제3 및 제4 Cas-gRNA RNP와 유체 중에서 접촉시키는 단계를 추가로 포함한다. 방법은 제4 Cas-gRNA RNP 중 하나를 제1 분자에서의 제4 하위서열에 혼성화하는 단계를 포함할 수 있다. 방법은 제4 Cas-gRNA RNP 중 하나에 의해, 임의의 제3 Cas-gRNA RNP가 제1 분자에서의 제3 하위서열에 혼성화하는 것을 억제하는 단계를 포함할 수 있다. 방법은 제1 분자를 제4 Cas-gRNA RNP 중 하나를 사용하여 제4 하위서열에서 절단하여 제1 단편을 생성하는 단계를 포함할 수 있다.
일부 예에서, 방법은 제3 Cas-gRNA RNP 중 하나를 제2 분자에서의 제3 하위서열에 혼성화하는 단계를 추가로 포함한다. 방법은 제3 Cas-gRNA RNP 중 하나에 의해, 임의의 제4 Cas-gRNA RNP가 제2 분자에서의 제4 하위서열에 혼성화하는 것을 억제하는 단계를 추가로 포함할 수 있다. 방법은 제2 분자를 제3 Cas-gRNA RNP 중 하나를 사용하여 제3 하위서열에서 절단하여 제2 단편을 생성하는 단계를 추가로 포함할 수 있다.
일부 예에서, 방법은 제4 Cas-gRNA RNP 중 하나를 제2 분자에서의 제4 하위서열에 혼성화하는 단계를 추가로 포함한다. 방법은 제4 Cas-gRNA RNP 중 하나에 의해, 임의의 제3 Cas-gRNA RNP가 제2 분자에서의 제3 하위서열에 혼성화하는 것을 억제하는 단계를 추가로 포함할 수 있다. 방법은 제2 분자를 제4 Cas-gRNA RNP 중 하나를 사용하여 제4 하위서열에서 절단하여 제2 단편을 생성하는 단계를 추가로 포함할 수 있다.
일부 예에서, 방법은 제1 Cas-gRNA RNP 중 하나 및 제3 또는 제4 Cas-gRNA RNP 중 하나가 제1 분자에 혼성화되는 동안, 제1 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않은 제1 분자의 임의의 부분을 분해하는 단계를 추가로 포함한다.
일부 예에서, 방법은 제2 Cas-gRNA RNP 중 하나 및 제3 또는 제4 Cas-gRNA RNP 중 하나가 제2 분자에 혼성화되는 동안, 제2 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않은 제2 분자의 임의의 부분을 분해하는 단계를 추가로 포함한다. 일부 예에서, 분해 단계는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 수행된다.
일부 예에서, 제1 분자는 제3 또는 제4 Cas-gRNA RNP 중 하나를 사용하여 절단되고, 제2분자는 제3 또는 제4 Cas-gRNA RNP 중 하나를 사용하여 절단된다.
일부 예에서, 제1 및 제2 단편은 서로 상이한 수의 염기쌍을 포함한다. 일부 예에서, 제1 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
본원의 일부 예는 표적 폴리뉴클레오타이드의 시퀀싱 방법을 제공한다. 방법은 표적 폴리뉴클레오타이드의 제1 및 제2 단편을 상기 기재된 방법을 사용하여 생성하는 단계를 포함할 수 있다. 방법은 증폭 어댑터를 제1 및 제2 단편의 말단에 결찰하는 단계를 추가로 포함할 수 있다. 방법은 결찰된 증폭 어댑터를 갖는 제1 및 제2 단편의 앰플리콘을 각각 생성하는 단계를 추가로 포함할 수 있다. 방법은 제1 및 제2 단편의 앰플리콘을 시퀀싱하는 단계를 추가로 포함할 수 있다.
일부 예에서, 방법은 제1, 제2, 제3, 및 제4 하위서열을 사용하여, 제1 분자로부터 유래된 제1 단편의 앰플리콘을 식별하고, 제2 분자로부터 유래된 제2 단편의 앰플리콘을 식별하는 단계를 추가로 포함한다.
일부 예에서, 방법은 앰플리콘을 생성하기 전에 고유한 분자 식별자(UMI)를 제1 및 제2 단편의 말단에 결찰하는 단계를 추가로 포함한다. 방법은 UMI를 사용하여 제1 분자로부터 유래된 제1 단편의 앰플리콘을 식별하고, 제2 분자로부터 유래된 제2 단편의 앰플리콘을 식별하는 단계를 추가로 포함할 수 있다. 일부 예에서, UMI는 증폭 어댑터와 동일한 작업으로 제1 및 제2 단편의 말단에 커플링 및 결찰된다.
본원의 일부 예는 조성물을 제공한다. 조성물은 서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자를 포함할 수 있다. 조성물은 복수의 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 제1 Cas-gRNA RNP 중 하나는 제1 분자에서의 제1 하위서열에 혼성화될 수 있고, 임의의 제2 Cas-gRNA RNP가 제1 분자에서의 제2 하위서열에 혼성화하는 것을 억제할 수 있다. 제2 하위서열은 제1 하위서열과 오직 부분적으로 중첩될 수 있다. 제2 Cas-gRNA RNP 중 하나는 제2 분자에서의 제2 하위서열에 혼성화될 수 있고, 임의의 제1 Cas-gRNA RNP가 제2 분자에서의 제1 하위서열에 혼성화하는 것을 억제할 수 있다.
일부 예에서, 제1 분자에서의 절단은, 제2 분자에서의 절단과 표적 폴리뉴클레오타이드 서열에서, 상이한 위치에서 이루어진다. 일부 예에서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 절단으로부터 벗어난다.
일부 예에서, 제1 Cas-gRNA RNP 중 하나는 제1 분자를 절단하기 위한 것이고, 제2 Cas-gRNA RNP 중 하나는 제2 분자를 절단하기 위한 것이다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다. 일부 예에서, Cas는 Cas9 또는 dCas9를 포함한다.
일부 예에서, 조성물은 복수의 제3 및 제4 Cas-gRNA RNP를 추가로 포함한다. 제3 Cas-gRNA RNP 중 하나는 제1 분자에서의 제3 하위서열에 혼성화될 수 있고, 임의의 제4 Cas-gRNA RNP가 제1 분자에서의 제4 하위서열에 혼성화하는 것을 억제할 수 있고, 제1 분자를 제3 하위서열에서 절단하여 제1 단편을 생성하기 위한 것일 수 있다. 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩될 수 있다.
일부 예에서, 조성물은 복수의 제3 및 제4 Cas-gRNA RNP를 추가로 포함한다. 제4 Cas-gRNA RNP 중 하나는 제1 분자에서의 제4 하위서열에 혼성화될 수 있고, 임의의 제3 Cas-gRNA RNP가 제1 분자에서의 제3 하위서열에 혼성화하는 것을 억제할 수 있고, 제1 분자를 제4 하위서열에서 절단하여 제1 단편을 생성하기 위한 것일 수 있다. 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩될 수 있다.
일부 예에서, 제3 Cas-gRNA RNP 중 하나는 제2 분자에서의 제3 하위서열에 혼성화될 수 있고, 임의의 제4 Cas-gRNA RNP가 제2 분자에서의 제4 하위서열에 혼성화하는 것을 억제할 수 있고, 제2 분자를 제3 하위서열에서 절단하여 제2 단편을 생성하기 위한 것일 수 있다.
일부 예에서, 제4 Cas-gRNA RNP 중 하나는 제2 분자에서의 제4 하위서열에 혼성화될 수 있고, 임의의 제3 Cas-gRNA RNP가 제2 분자에서의 제3 하위서열에 혼성화하는 것을 억제할 수 있고, 제2 분자를 제4 하위서열에서 절단하여 제2 단편을 생성하기 위한 것일 수 있다.
일부 예에서, 조성물은 제1 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않는 제1 분자의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함한다.
일부 예에서, 조성물은 제2 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않는 제2 분자의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함한다.
일부 예에서, 엑소뉴클레아제는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 포함한다.
일부 예에서, 제3 또는 제4 Cas-gRNA RNP 중 하나는 제1 분자를 절단하기 위한 것이고, 제3 또는 제4 Cas-gRNA RNP 중 하나는 제2 분자를 절단하기 위한 것이다.
일부 예에서, 제1 및 제2 단편은 서로 상이한 수의 염기쌍을 포함한다. 일부 예에서, 제1 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
본원의 일부 예는 조성물을 제공한다. 조성물은 서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자를 포함할 수 있다. 제1 분자는 제1 하위서열에서 제1 말단을 가질 수 있다. 제2 분자는 제2 하위서열에서 제1 말단을 가질 수 있다. 제1 하위서열은 제2 하위서열과 오직 부분적으로 중첩될 수 있다.
일부 예에서, 제1 분자의 제1 말단은 제2 분자의 제1 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치이다. 일부 예에서, 제1 분자에서의 제1 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 제1 말단으로부터 벗어난다.
일부 예에서, 제1 분자는 제3 하위서열에서 제2 말단을 추가로 갖는다. 제2 분자는 제3 하위서열 또는 제4 하위서열에서 제2 말단을 추가로 가질 수 있다. 제3 하위서열은 제4 하위서열과 오직 부분적으로 중첩될 수 있다. 일부 예에서, 제1 분자의 제2 말단은 제2 분자의 제2 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치이다. 일부 예에서, 제1 분자의 제2 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자의 제2 말단으로부터 벗어난다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
일부 예에서, 제1 및 제2 분자는 서로 상이한 수의 염기쌍을 포함한다. 일부 예에서, 제1 분자는 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 분자는 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
본원의 일부 예는 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법을 제공한다. 방법은 표적 폴리뉴클레오타이드를 제1 및 제2 융합 단백질과 유체 중에서 접촉시키는 단계를 포함할 수 있다. 제1 융합 단백질은 커플링된 제1 증폭 어댑터를 갖는 제1 트랜스포사제에 커플링된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 제2 융합 단백질은 커플링된 제2 증폭 어댑터를 갖는 제2 트랜스포사제에 커플링된 제2 Cas-gRNA RNP를 포함할 수 있다. 방법은 제1 및 제2 Cas-gRNA RNP의 활성은 촉진하고, 제1 및 제2 트랜스포사제의 활성은 억제하는 동안, 제1 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 하위서열에 혼성화하고, 제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제2 하위서열에 혼성화하는 단계를 포함할 수 있다. 방법은 이어서 제1 및 제2 트랜스포사제의 활성을 촉진하는 동안, 제1 트랜스포사제를 사용하여 제1 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제1 위치에 부가하고, 제2 트랜스포사제를 사용하여 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가하는 단계를 포함할 수 있다.
일부 예에서, 유체의 제1 조건을 사용하여, Cas-gRNA RNP의 활성은 촉진되고, 트랜스포사제의 활성은 억제된다. 일부 예에서, 유체의 제1 조건은 Cas-gRNA RNP의 활성을 위해 충분한 양의 칼슘 이온, 망간 이온, 또는 칼슘 이온과 망간 이온 둘 모두의 존재를 포함한다. 일부 예에서, 유체의 제1 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함한다.
일부 예에서, 트랜스포사제의 활성은 유체의 제2 조건을 사용하여 촉진된다. 일부 예에서, 유체의 제2 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함한다.
일부 예에서, 방법은 제1 융합 단백질의 Cas-gRNA RNP가 제1 하위서열에 혼성화되고, 제2 융합 단백질의 Cas-gRNA RNP가 제2 하위서열에 혼성화되는 동안, 제1 및 제2 융합 단백질의 Cas-gRNA RNP들 사이에 존재하지 않는 표적 폴리뉴클레오타이드의 임의의 부분을 분해하는 단계를 추가로 포함한다. 일부 예에서, 분해 단계는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 수행된다.
일부 예에서, 방법은 제1 및 제2 융합 단백질로부터 표적 폴리뉴클레오타이드를 방출하여 일 말단에서 제1 증폭 어댑터 및 다른 말단에서 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드 단편을 제공하는 단계를 추가로 포함한다. 일부 예에서, 방출 단계는 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 사용하여 수행된다.
일부 예에서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
일부 예에서, Cas는 dCas9를 포함한다. 일부 예에서, 트랜스포사제는 Tn5를 포함한다.
일부 예에서, 제1 증폭 어댑터는 P5 어댑터를 포함하고, 제2 증폭 어댑터는 P7 어댑터를 포함한다.
일부 예에서, 제1 증폭 어댑터는 제1 고유한 분자 식별자(UMI)를 포함하고, 제2 증폭 어댑터는 제2 UMI를 포함한다.
일부 예에서, 제1 위치는 제1 하위서열의 약 10개의 염기 내에 존재하고, 제2 위치는 제2 하위서열의 약 10개의 염기 내에 존재한다.
일부 예에서, 각각의 제1 및 제2 융합 단백질에서, Cas-gRNA RNP는 공유 연결을 통해 트랜스포사제에 커플링된다.
일부 예에서, 각각의 제1 및 제2 융합 단백질에서, Cas-gRNA RNP는 비-공유 연결을 통해 트랜스포사제에 커플링된다. 일부 예에서, Cas-gRNA RNP는 항체에 공유 커플링되고, 트랜스포사제는 항체가 비-공유 커플링되는 항원에 공유 커플링되거나, Cas-gRNA RNP는 항원에 공유 커플링되고, 트랜스포사제는 항원이 비-공유 커플링되는 항체에 공유 커플링된다. 일부 예에서, Cas-gRNA는 gRNA와 제1 또는 제2 증폭 어댑터 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링된다. 일부 예에서, Cas-gRNA는 gRNA와 트랜스포사제 내의 올리고뉴클레오타이드 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링된다.
일부 예에서, 제1 융합 단백질에서, 제1 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖고, 제2 융합 단백질에서, 제2 하위서열에 혼성화하는 gRNA 중 일부는 약 15 내지 약 18개의 뉴클레오타이드 길이를 갖는다.
일부 예에서, 제1 및 제2 융합 단백질은 표적 폴리뉴클레오타이드에 대해 대략 화학량론적 비율로 존재한다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
일부 예에서, 제1 태그는 제1 Cas-gRNA RNP에 커플링되고, 제2 태그는 제2 Cas-gRNA RNP에 커플링된다. 일부 예에서, 방법은 제1 태그를 기재에 커플링된 제1 태그 파트너에 커플링시키는 단계 및 제2 태그를 기재에 커플링된 제2 태그 파트너에 커플링시키는 단계를 포함한다. 일부 예에서, 커플링 단계는 제1 및 제2 Cas-gRNA RNP가 각각 제1 및 제2 하위서열에 혼성화된 후에 수행된다. 일부 예에서, 제1 및 증폭 어댑터는 제1 및 제2 태그가 각각 제1 및 제2 태그 파트너에 부가된 후에 부가된다.
일부 예에서, 제1 및 제2 태그는 비오틴을 포함한다. 일부 예에서, 제1 및 제2 태그 파트너는 스트렙타비딘을 포함한다. 일부 예에서, 기재는 비드를 포함한다. 일부 예에서, Cas-gRNA RNP는 Cas12k를 포함한다. 일부 예에서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함한다.
본원의 일부 예는 표적 폴리뉴클레오타이드의 시퀀싱 방법을 제공한다. 방법은 전술한 방법 중 하나를 사용하여 표적 폴리뉴클레오타이드 단편을 생성하는 단계, 단편의 앰플리콘을 생성하는 단계, 및 앰플리콘을 시퀀싱하는 단계를 포함할 수 있다.
본원의 일부 예는 조성물을 제공한다. 조성물은 서열을 갖는 표적 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 커플링된 제1 증폭 어댑터를 갖는 제1 트랜스포사제에 커플링된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하는 제1 융합 단백질을 포함할 수 있다. 제1 Cas-gRNA RNP는 표적 폴리뉴클레오타이드에서 제1 하위서열에 혼성화될 수 있다.
일부 예에서, 조성물은 커플링된 제2 증폭 어댑터를 갖는 제2 트랜스포사제에 커플링된 제2 Cas-gRNA RNP를 포함하는 제2 융합 단백질을 포함할 수 있다. 제2 Cas-gRNA RNP는 표적 폴리뉴클레오타이드에서 제2 하위서열에 혼성화될 수 있다.
일부 예에서, 조성물은 제1 Cas-gRNA RNP의 활성은 촉진하고, 제1 트랜스포사제의 활성은 억제하는 조건을 갖는 유체를 추가로 포함한다. 일부 예에서, 유체의 조건은 제1 Cas-gRNA RNP의 활성을 위해 충분한 양의 칼슘 이온, 망간 이온, 또는 칼슘 이온과 망간 이온 둘 모두의 존재를 포함한다. 일부 예에서, 유체의 조건은 제1 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함한다.
일부 예에서, 조성물은 제1 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 추가로 포함하며, 제1 트랜스포사제는 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제1 위치에 부가한다. 일부 예에서, 유체의 조건은 제1 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함한다.
일부 예에서, 방법은 제1 및 제2 융합 단백질로부터 표적 폴리뉴클레오타이드를 방출하여 일 말단에서 제1 증폭 어댑터 및 다른 말단에서 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드 단편을 제공하기 위한 제제를 추가로 포함한다. 일부 예에서, 제제는 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 포함한다.
일부 예에서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
일부 예에서, 조성물은 제1 Cas-gRNA RNP와 제2 Cas-gRNA RNP 사이에 존재하지 않는 표적 폴리뉴클레오타이드의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함한다. 일부 예에서, 엑소뉴클레아제는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 포함한다.
일부 예에서, Cas는 dCas9를 포함한다. 일부 예에서, 트랜스포사제는 Tn5를 포함한다.
일부 예에서, 제1 어댑터는 P5 어댑터를 포함하고, 제2 어댑터는 P7 어댑터를 포함한다.
일부 예에서, 제1 증폭 어댑터는 제1 고유한 분자 식별자(UMI)를 포함하고, 제2 증폭 어댑터는 제2 UMI를 포함한다.
일부 예에서, 제1 위치는 제1 하위서열의 약 10개의 염기 내에 존재하고, 제2 위치는 제2 하위서열의 약 10개의 염기 내에 존재한다.
일부 예에서, 제1 Cas-gRNA RNP는 공유 연결을 통해 제1 트랜스포사제에 커플링된다.
일부 예에서, 제1 Cas-gRNA RNP는 비-공유 연결을 통해 제1 트랜스포사제에 커플링된다. 일부 예에서, 제1 Cas-gRNA RNP는 항체에 공유 커플링되고, 제1 트랜스포사제는 항체가 비-공유 커플링되는 항원에 공유 커플링되거나, Cas-gRNA RNP는 항원에 공유 커플링되고, 제1 트랜스포사제는 항원이 비-공유 커플링되는 항체에 공유 커플링된다. 일부 예에서, 제1 Cas-gRNA는 gRNA와 제1 또는 제2 증폭 어댑터 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링된다. 일부 예에서, 제1 Cas-gRNA는 gRNA와 트랜스포사제 내의 올리고뉴클레오타이드 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링된다.
일부 예에서, 제1 융합 단백질에서, 제1 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖는다. 제2 융합 단백질을 포함하는 예에서, 제2 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖는다.
일부 예에서, 제1 융합 단백질은 표적 폴리뉴클레오타이드에 대해 대략 화학량론적 비율로 존재한다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
일부 예는 제1 Cas-gRNA RNP에 커플링된 제1 태그를 추가로 포함한다. 일부 예는 기재 및 기재와 제1 태그에 커플링된 제1 태그 파트너를 추가로 포함한다.
일부 예는 제2 Cas-gRNA RNP에 커플링된 제2 태그를 추가로 포함한다. 일부 예는 기재, 기재와 제1 태그에 커플링된 제1 태그 파트너, 및 기재와 제2 태그에 커플링된 제2 태그 파트너를 추가로 포함한다.
일부 예에서, 제1 및 제2 태그는 비오틴을 포함한다. 일부 예에서, 제1 및 제2 태그 파트너는 스트렙타비딘을 포함한다. 일부 예에서, 기재는 비드를 포함한다. 일부 예에서, Cas-gRNA RNP는 Cas12k를 포함한다. 일부 예에서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함한다.
본원의 일부 예는 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성화 방법을 제공한다. 방법은 표적 폴리뉴클레오타이드를 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNPs)과 접촉시키는 단계를 포함할 수 있다. 방법은 제1 및 제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계를 포함할 수 있으며, 단백질은 제1 하위서열과 제2 하위서열 사이의 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링될 수 있다. 방법은 표적 폴리뉴클레오타이드를 제1 Cas-gRNA RNP를 사용하여 제1 하위서열에서 그리고 제2 Cas-gRNA RNP를 사용하여 제2 하위서열에서 절단하여 단편을 형성하는 단계를 포함할 수 있다. 단백질은 단편의 각각의 유전자좌에 커플링될 수 있다. 방법은 상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하는 단계를 포함할 수 있다. 방법은 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계를 포함할 수 있다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하기 전에 단편을 농축하는 단계를 포함한다. 일부 예에서, 제1 및 제2 Cas-gRNA RNP는 각각 태그에 커플링되어 단편이 제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링되도록 한다. 농축 단계는 제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링된 단편을 태그 파트너에 커플링된 기재와 접촉시키는 단계를 포함할 수 있다. 농축 단계는 태그를 태그 파트너에 커플링시켜서 단편을 기재에 커플링시키는 단계를 포함할 수 있다. 농축 단계는 기재에 커플링되지 않은 표적 폴리뉴클레오타이드 중 임의의 일부를 제거하는 단계를 포함할 수 있다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드를 사용하여 단백질을 식별하는 단계를 포함한다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드를 사용하여 유전자좌를 식별하는 단계를 포함한다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드를 사용하여 단백질을 정량화하는 단계를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는 단편을 상이한 단백질에 특이적인 항체 혼합물과 접촉시키는 단계를 포함한다. 각각의 항체는 상응하는 올리고뉴클레오타이드에 커플링될 수 있다. 단편의 각각의 유전자좌에 커플링된 단백질에 특이적인 혼합물 중의 임의의 항체의 경우, 이들 항체 및 상응하는 올리고뉴클레오타이드는 이들 단백질에 커플링될 수 있다. 일부 예에서, 복수의 단백질은 유전자좌의 각각의 하나에 커플링되고, 혼합물 중의 복수의 항체는 해당 유전자좌에서의 단백질에 커플링된다.
일부 예에서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드를 비드 어레이에 혼성화하는 단계를 포함한다. 일부 예에서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드에 대한 합성에 의한 시퀀싱을 수행하는 단계를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드의 각각의 존재를 사용하여 단백질을 식별하는 단계를 포함한다.
일부 예에서, 방법은 상응하는 올리고뉴클레오타이드의 각각의 양을 사용하여 단백질을 정량화하는 단계를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는 단편을 복수의 트랜스포사제와 접촉시키는 단계 - 각각의 트랜스포사제는 상응하는 올리고뉴클레오타이드에 커플링됨 -; 단편의 각각의 유전자좌에 커플링된 단백질에 의해 트랜스포사제의 활성을 당해 유전자좌에서 억제하는 단계; 및 당해 유전자좌 이외의 위치에서, 트랜스포사제를 사용하여 상응하는 올리고뉴클레오타이드를 단편에 부가하는 단계를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드가 부가된 단편에 대한 합성에 의한 시퀀싱을 수행하는 단계를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드의 단편에서의 각각의 위치를 사용하여 단백질의 각각의 유전자좌를 식별한다.
일부 예에서, 트랜스포사제는 단편을 하위단편으로 분할하고, 합성에 의한 시퀀싱은 하위단편에 대해 수행된다.
일부 예에서, 상응하는 올리고뉴클레오타이드는 증폭 어댑터를 포함한다. 일부 예에서, 증폭 어댑터는 P5 및 P7 어댑터를 포함한다.
일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, Cas는 Cas9를 포함한다.
일부 예에서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 표적 폴리뉴클레오타이드의 단편을 포함할 수 있다. 단백질은 단편의 각각의 유전자좌에 커플링될 수 있다. 조성물은 상이한 단백질에 특이적인 항체 혼합물을 포함할 수 있다. 각각의 항체는 상응하는 올리고뉴클레오타이드에 커플링될 수 있다. 단편의 각각의 유전자좌에 커플링된 단백질에 특이적인 혼합물 중의 임의의 항체의 경우, 이들 항체 및 상응하는 올리고뉴클레오타이드는 이들 단백질에 커플링된다.
일부 예에서, 복수의 단백질은 유전자좌의 각각의 하나에 커플링되고, 혼합물 중의 복수의 항체는 해당 유전자좌에서의 단백질에 커플링된다.
일부 예에서, 상응하는 올리고뉴클레오타이드는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, 상응하는 올리고뉴클레오타이드의 각각의 존재는 단백질을 식별하는 데 사용 가능하다.
일부 예에서, 상응하는 올리고뉴클레오타이드의 각각의 존재는 단백질을 정량화하는 데 사용 가능하다.
일부 예에서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 표적 폴리뉴클레오타이드의 단편을 포함할 수 있다. 단백질은 단편의 각각의 유전자좌에 커플링될 수 있다. 조성물은 복수의 트랜스포사제를 포함할 수 있다. 각각의 트랜스포사제는 상응하는 올리고뉴클레오타이드에 커플링될 수 있다. 단편의 각각의 유전자좌에 커플링된 단백질은 트랜스포사제의 활성을 당해 유전자좌에서 억제한다. 트랜스포사제는 상응하는 올리고뉴클레오타이드를 당해 유전자좌 이외의 위치에서 단편에 부가할 수 있다.
일부 예에서, 상응하는 올리고뉴클레오타이드의 단편에서의 각각의 위치를 단백질의 각각의 유전자좌를 식별하는 데 사용 가능하다.
일부 예에서, 트랜스포사제는 단편을 하위단편으로 분할한다.
일부 예에서, 상응하는 올리고뉴클레오타이드는 증폭 어댑터를 포함한다. 일부 예에서, 증폭 어댑터는 P5 및 P7 어댑터를 포함한다. 일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, 트랜스포사제는 Tn5를 포함한다.
일부 예에서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는다. 일부 예에서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는다.
일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
본원의 일부 예는 복수의 하위서열을 갖는 표적 폴리뉴클레오타이드를 포함하는 조성물을 제공한다. 조성물은 가이드 RNA(gRNA)에 커플링된 ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제)를 각각 포함하는 복수의 복합체를 포함할 수 있다. ShCAST는 이에 커플링된 증폭 어댑터를 가질 수 있다. 각각의 복합체는 표적 폴리뉴클레오타이드에서의 상응하는 하나의 하위서열에 혼성화될 수 있다.
일부 예에서, 조성물은 하위서열에 대한 복합체의 혼성화는 촉진하고, 트랜스포사제의 결합은 억제하는 조건을 갖는 유체를 추가로 포함한다. 일부 예에서, 유체의 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함한다.
일부 예에서, 조성물은 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 추가로 포함하며, 트랜스포사제는 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 위치에 부가한다. 일부 예에서, 유체의 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함한다.
일부 예에서, ShCAST는 Cas12k를 포함한다. 일부 예에서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함한다. 일부 실시형태에서, 어댑터는 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함한다. 일부 예에서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함한다.
일부 예에서, gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화된다. 조성물은 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나가 커플링되는 스트렙타비딘-코팅된 비드를 추가로 포함할 수 있다.
본원의 일부 예는 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법을 제공한다. 방법은 이중 가닥 폴리뉴클레오타이드를 기재에 커플링시키는 단계를 포함할 수 있다. 방법은 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 닉카제(nickase)를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계를 포함할 수 있다. 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'일 수 있다. 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'일 수 있다. 방법은 제1 가닥을 제1 Cas-gRNA RNP 닉카제를 사용하여 제1 하위서열에서 절단하는 단계를 포함할 수 있다. 방법은 제2 가닥을 제2 Cas-gRNA RNP 닉카제를 사용하여 제2 하위서열에서 절단하는 단계를 포함할 수 있다. 방법은 폴리머라제(polymerase)를 사용하여 각각의 절단으로부터 제1 및 제2 가닥을 연장하는 단계 및 기재로부터 표적 서열을 용출시키는 단계를 포함할 수 있다. 방법은 용출된 표적 서열을 시퀀싱하는 단계를 포함할 수 있다.
일부 예에서, 기재는 비드, 예를 들어 상자성 비드를 포함한다.
일부 예에서, 이중 가닥 폴리뉴클레오타이드의 3' 말단은 태그에 커플링되고, 기재는 태그 파트너에 커플링되며, 커플링 단계는 태그를 태그 파트너에 커플링시키는 단계를 포함한다. 일부 예에서, 태그는 비오틴을 포함하고, 태그 파트너는 스트렙타비딘을 포함한다.
일부 예에서, 제1 및 제2 Cas-gRNA RNP 닉카제는 Cas9를 포함한다.
일부 예에서, 폴리머라제는 가닥 치환 폴리머라제를 포함한다. 일부 예에서, 폴리머라제는 벤트(Vent) 또는 Bsu를 포함한다.
일부 예에서, 폴리머라제는 5' 엑소뉴클레아제 활성을 갖는다. 일부 예에서, 폴리머라제는 Taq, Bst, 또는 DNA 폴리머라제 I을 포함한다.
일부 예는 조성물을 제공한다. 방법은 기재에 커플링된 이중 가닥 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화된 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 닉카제를 포함할 수 있다. 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'일 수 있다. 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'일 수 있다.
일부 예에서, 기재는 비드, 예를 들어 상자성 비드를 포함한다.
일부 예에서, 이중 가닥 폴리뉴클레오타이드의 3' 말단은 태그에 커플링되고, 기재는 태그에 커플링된 태그 파트너에 커플링된다. 일부 예에서, 태그는 비오틴을 포함하고, 태그 파트너는 스트렙타비딘을 포함한다.
일부 예에서, 제1 및 제2 Cas-gRNA RNP 닉카제는 Cas9를 포함한다.
일부 예는 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법을 제공한다. 방법은 제1 및 제2 복합체를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계를 포함할 수 있다. 각각의 제1 및 제2 복합체는 증폭 어댑터에 커플링된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 방법은 혼성화된 제1 및 제2 복합체의 증폭 어댑터를 이중 가닥 폴리뉴클레오타이드의 제1 및 제2 말단에 각각 결찰하는 단계를 포함할 수 있다. 방법은 제1 및 제2 복합체의 Cas-gRNA RNP를 이중 가닥 폴리뉴클레오타이드로부터 제거하는 단계를 포함할 수 있다. 방법은 결찰된 증폭 어댑터를 갖는 이중 가닥 폴리뉴클레오타이드를 시퀀싱하는 단계를 포함할 수 있다.
일부 예에서, 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'이다.
일부 예에서, 증폭 어댑터는 Y-형상이다.
일부 예에서, 각각의 복합체는 Cas-gRNA RNP를 증폭 어댑터에 커플링시키는 링커를 추가로 포함한다. 일부 예에서, 링커는 Cas-gRNA RNP의 Cas에 커플링된다. 일부 예에서, 링커는 gRNA에 커플링된다. 일부 예에서, 링커는 단백질, 폴리뉴클레오타이드, 또는 중합체를 포함한다. 일부 예에서, 링커는 Cas-gRNA RNP이 제거될 때, 증폭 어댑터에 커플링된다.
일부 예에서, 결찰 단계는 리가제(ligase)를 사용하는 단계를 포함한다. 일부 예에서, 리가제는 혼성화 동안 존재한다. 일부 예에서, 리가제는 혼성화 동안 불활성이고, 결찰을 위해 ATP를 사용하여 활성화된다. 일부 예에서, 리가제는 혼성화 후에 부가된다.
일부 예에서, 방법은 혼성화 전에 이중 가닥 폴리뉴클레오타이드를 A-테일링(tailing)하는 단계를 포함하며, 증폭 어댑터는 A-테일과 혼성화하기 위한 쌍을 이루지 않는 T를 포함한다. 대안적으로, 증폭 어댑터는 블런트 말단(blunt end)에 결찰될 수 있다.
일부 예에서, 증폭 어댑터는 고유한 분자 식별자를 포함한다. 예를 들어, 증폭 어댑터는 듀플렉스의 고유한 분자 식별자를 포함한다.
일부 예에서, Cas-gRNA RNP는 dCas9를 포함한다.
일부 예는 조성물을 제공한다. 조성물은 이중 가닥 폴리뉴클레오타이드 단편을 포함할 수 있다. 조성물은 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 혼성화된 제1 및 제2 복합체를 포함할 수 있다. 각각의 제1 및 제2 복합체는 증폭 어댑터에 커플링된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다.
일부 예에서, 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'이다.
일부 예에서, 증폭 어댑터는 Y-형상이다.
일부 예에서, 각각의 복합체는 Cas-gRNA RNP를 증폭 어댑터에 커플링시키는 링커를 추가로 포함한다. 일부 예에서, 링커는 Cas-gRNA RNP의 Cas에 커플링된다. 일부 예에서, 링커는 gRNA에 커플링된다. 일부 예에서, 링커는 단백질, 폴리뉴클레오타이드, 또는 중합체를 포함한다.
일부 예에서, 이중 가닥 폴리뉴클레오타이드는 A-테일을 포함하고, 증폭 어댑터는 A-테일과 혼성화하기 위한 쌍을 이루지 않는 T를 포함한다. 대안적으로, 증폭 어댑터는 블런트 말단에 결찰될 수 있다.
일부 예에서, 증폭 어댑터는 고유한 분자 식별자를 포함한다. 예를 들어, 증폭 어댑터는 듀플렉스의 고유한 분자 식별자를 포함한다.
일부 예에서, Cas-gRNA RNP는 dCas9를 포함한다.
본원의 일부 예는 폴리뉴클레오타이드의 단편의 생성 방법을 제공한다. 방법은 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 폴리뉴클레오타이드에서의 제1 서열에 혼성화하는 단계를 포함할 수 있다. 방법은 제2 Cas-gRNA RNP를 제1 서열로부터 적어도 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 제2 서열에 혼성화하는 단계를 포함할 수 있다. 방법은 제1 및 제2 서열을 제1 및 제2 Cas-gRNA RNP로 절단하여 제1 및 제2 말단 및 이들 사이의 표적 서열을 포함하는 단편을 생성하는 단계를 포함할 수 있다. 제1 말단은 적어도 하나의 염기의 제1 5' 오버행(overhang)을 가질 수 있다. 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다.
일부 예에서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이이다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이이다.
일부 예에서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는다.
일부 예는 제1 증폭 어댑터를 단편의 제1 말단에 결찰하는 단계 및 제2 증폭 어댑터를 단편의 제2 말단에 결찰하는 단계를 추가로 포함한다. 제1 증폭 어댑터는 제1 5' 오버행에 상보적인 제3 5' 오버행을 가질 수 있다. 제2 증폭 어댑터는 제2 5' 오버행에 상보적인 제4 5' 오버행을 가질 수 있다. 제3 및 제4 5' 오버행은 서로 상이한 서열을 가질 수 있다. 일부 예는 결찰된 제1 및 제2 증폭 어댑터를 갖는 단편의 앰플리콘을 생성하는 단계; 앰플리콘을 시퀀싱하는 단계; 및 시퀀싱을 기반으로 표적 폴리뉴클레오타이드를 식별하는 단계를 추가로 포함한다. 일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, Cas는 Cas12a를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 폴리뉴클레오타이드에서의 제1 서열에 혼성화된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 조성물은 제1 서열로부터 적어도 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 제2 서열에 혼성화된 제2 Cas-gRNA RNP를 포함할 수 있다. 제1 및 제2 Cas-gRNA RNP는 각각 폴리뉴클레오타이드의 제1 및 제2 서열을 절단하여, 사이에 표적 서열이 있는 제1 및 제2 말단을 갖는 단편을 생성하기 위한 것일 수 있다. 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 가질 수 있다. 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다.
일부 예에서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이이다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이이다.
일부 예에서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는다.
일부 예에서, Cas는 Cas12a를 포함한다.
본원의 일부 예는 조성물을 제공한다. 조성물은 폴리뉴클레오타이드 단편을 포함할 수 있으며, 각각은 사이에 표적 서열을 갖는 제1 및 제2 말단을 갖는다. 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 가질 수 있다. 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다. 제1 및 제2 5' 오버행은 서로 상이한 서열을 가질 수 있다. 조성물은 제1 5' 오버행에 상보적이고, 제2 5'오버행에 상보적이지 않은 제3 5'오버행을 갖는 제1 증폭 어댑터를 포함할 수 있다. 조성물은 제2 5' 오버행에 상보적이고, 제1 5'오버행에 상보적이지 않은 제4 5'오버행을 갖는 제2 증폭 어댑터를 포함할 수 있다.
일부 예는 제1 증폭 어댑터를 제1 말단에 결찰하고, 제2 증폭 어댑터를 제2 말단에 결찰하기 위한 적어도 하나의 리가제를 추가로 포함한다.
일부 예에서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이이다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이이다.
일부 예에서, 제1 및 제2 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다.
일부 예에서, 리가제는 T4 DNA 리가제를 포함한다.
본원의 일부 예는 복수의 폴리뉴클레오타이드 단편을 포함할 수 있으며, 각각은, 사이에 표적 서열이 있는 제1 및 제2 말단을 갖는다. 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 가질 수 있다. 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다. 제1 및 제2 5' 오버행은 서로 상이한 그리고 다른 단편의 제1 및 제2 5' 오버행과 상이한 서열을 가질 수 있다.
일부 예는 복수의 제1 증폭 어댑터를 추가로 포함한다. 각각의 제1 증폭 어댑터는 상응하는 단편의 제1 5' 오버행에 상보적이고, 해당 단편의 제2 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않는 제3 5' 오버행을 가질 수 있다. 본원의 일부 예는 복수의 제2 증폭 어댑터를 추가로 포함한다. 각각의 제2 증폭 어댑터는 상응하는 단편의 제2 5' 오버행에 상보적이고, 해당 단편의 제1 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않는 제4 5' 오버행을 가질 수 있다.
일부 예는 제1 증폭 어댑터를 제1 및 제3 5' 오버행이 상보적인 제1 말단에 결찰하고, 제2 증폭 어댑터를 제2 및 제4 5' 오버행이 상보적인 제2 말단에 결찰하기 위한 리가제를 추가로 포함한다. 일부 예에서, 리가제는 T4 DNA 리가제를 포함한다.
일부 예에서, 제1 및 제2 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이이다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이이다.
본원의 일부 예는 조성물을 제공한다. 조성물은 복수의 폴리뉴클레오타이드를 포함할 수 있다. 조성물은 폴리뉴클레오타이드에서의 각각의 제1 서열에 혼성화된 복수의 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 조성물은 각각의 제1 서열로부터 적어도 각각의 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 각각의 제2 서열에 혼성화된 복수의 제2 Cas-gRNA RNP를 포함할 수 있다. 제1 및 제2 복수의 Cas-gRNA RNP는 각각, 각각의 폴리뉴클레오타이드의 제1 및 제2 서열을 절단하여, 사이에 표적 서열이 있는 제1 및 제2 말단을 각각 갖는 단편을 생성하기 위한 것일 수 있다. 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 가질 수 있다. 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다.
일부 예에서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이이다. 일부 예에서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이이다.
일부 예에서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는다.
일부 예에서, Cas는 Cas12a를 포함한다.
본원의 일부 예는 가이드 RNA를 제공한다. 가이드 RNA는 프라이머 결합 부위, 증폭 어댑터 부위, 및 CRISPR 프로토스페이서(protospacer)를 포함할 수 있다.
일부 예에서, 프라이머 결합 부위는 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적이다.
일부 예에서, 증폭 어댑터 부위는 프라이머 결합 부위와 CRISPR 프로토스페이서 사이에 위치한다.
일부 예에서, 가이드 RNA는 적어도 하나의 루프(loop)를 포함한다. 일부 예에서, 제1 루프는 증폭 어댑터 부위와 CRISPR 프로토스페이서 사이에 위치한다. 일부 예에서, 제2 루프는 증폭 어댑터 부위와 CRISPR 프로토스페이서 사이에 위치한다.
본원의 일부 예는 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 제공한다. Cas-gRNA RNP는 전술한 gRNA 중 임의의 하나 및 CRISPR 프로토스페이서와 결합하는 Cas 단백질을 포함할 수 있다.
일부 예에서, Cas 단백질은 이중 가닥 폴리뉴클레오타이드 분해를 수행하도록 구성된다. 일부 예에서, Cas는 Cas9, Cas 12a, 또는 Cas12f를 포함한다.
일부 예에서, 프라이머 결합 부위 및 증폭 어댑터 부위는 Cas 단백질 외부로 연장된다.
본원의 일부 예는 복합체를 제공한다. 복합체는 제1 및 제2 가닥을 포함하는 폴리뉴클레오타이드를 포함할 수 있다. 복합체는 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 제1 Cas-gRNA RNP는 제1 프라이머 결합 부위, 제1 증폭 어댑터 부위, 및 제1 CRISPR 프로토스페이서를 포함하는 제1 가이드 RNA; 및 제1 CRISPR 프로토스페이서와 결합하는 제1 Cas 단백질을 포함할 수 있다. 제1 CRISPR 프로토스페이서는 제1 가닥에 혼성화될 수 있고, 제1 프라이머 결합 부위는 제2 가닥에 혼성화될 수 있다.
일부 예에서, 제1 및 제2 가닥은 제1 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP에 의해 절단된다. 일부 예에서, 제1 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함한다.
일부 예에서, 복합체는 제1 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하기 위한 제1 역전사 효소를 추가로 포함한다. 일부 예에서, 제1 역전사 효소는 제1 Cas 단백질에 커플링된다. 일부 예에서, 제1 역전사 효소 및 제1 Cas 단백질은 제1 융합 단백질의 구성요소이다.
일부 예에서, 제1 프라이머 결합 부위는 제1 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적이다.
일부 예에서, 제1 증폭 어댑터 부위는 제1 프라이머 결합 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다.
일부 예에서, 제1 gRNA는 적어도 하나의 루프를 추가로 포함한다. 일부 예에서, 제1 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다. 일부 예에서, 제2 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다.
일부 예는 제2 Cas-gRNA RNP를 추가로 포함한다. 제2 Cas-gRNA RNP는 제2 프라이머 결합 부위, 제2 증폭 어댑터 부위, 및 제2 CRISPR 프로토스페이서를 포함하는 제2 가이드 RNA를 포함할 수 있다. 제2 Cas-gRNA RNP는 제2 CRISPR 프로토스페이서와 결합하는 제2 Cas 단백질을 포함할 수 있다. 제2 CRISPR 프로토스페이서는 제1 가닥에 혼성화될 수 있고, 제2 프라이머 결합 부위는 제2 가닥에 혼성화될 수 있다.
일부 예에서, 제1 및 제2 가닥은 제2 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제2 Cas-gRNA RNP에 의해 절단된다. 일부 예에서, 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열만큼 이격된다. 일부 예에서, 제2 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함한다.
일부 예에서, 복합체는 제2 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하기 위한 제2 역전사 효소를 추가로 포함한다. 일부 예에서, 제2 역전사 효소는 제2 Cas 단백질에 커플링된다. 일부 예에서, 제2 역전사 효소 및 제2 Cas 단백질은 제2 융합 단백질의 구성요소이다.
일부 예에서, 제2 프라이머 결합 부위는 제2 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적이다.
일부 예에서, 제2 증폭 어댑터 부위는 제2 프라이머 결합 부위와 제2 CRISPR 프로토스페이서 사이에 위치한다.
본원의 일부 예는 복수의 이중 가닥 폴리뉴클레오타이드의 단편을 제공한다. 단편은 제1 3' 오버행을 포함하는 제1 말단; 제2 말단; 및 제1 말단과 제2 말단 사이에 위치하는 표적 서열을 포함할 수 있다.
일부 예에서, 제1 3' 오버행은 제1 증폭 어댑터를 포함한다.
일부 예에서, 제2 말단은 제2 3' 오버행을 포함한다.
일부 예에서, 제2 3' 오버행은 제2 증폭 어댑터를 포함한다.
본원의 일부 예는 방법을 제공한다. 방법은 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 제1 및 제2 가닥을 포함하는 폴리뉴클레오타이드와 접촉시키는 단계를 포함할 수 있다. 제1 Cas-gRNA는 제1 프라이머 결합 부위, 제1 증폭 어댑터 부위, 및 제1 CRISPR 프로토스페이서를 포함하는 제1 가이드 RNA; 및 제1 CRISPR 프로토스페이서와 결합하는 제1 Cas 단백질을 포함할 수 있다. 방법은 제1 CRISPR 프로토스페이서를 제1 가닥에 혼성화하는 단계를 포함할 수 있다. 방법은 제1 프라이머 결합 부위를 제2 가닥에 혼성화하는 단계를 포함할 수 있다.
일부 예에서, 방법은 제1 및 제2 가닥을 제1 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP에 의해 절단하는 단계를 추가로 포함한다. 일부 예에서, 제1 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함한다.
일부 예에서, 방법은 제1 역전사 효소를 사용하여 제1 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 단계를 추가로 포함한다. 일부 예에서, 제1 역전사 효소는 제1 Cas 단백질에 커플링된다. 일부 예에서, 제1 역전사 효소 및 제1 Cas 단백질은 제1 융합 단백질의 구성요소이다.
일부 예에서, 제1 프라이머 결합 부위는 제1 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적이다.
일부 예에서, 제1 증폭 어댑터 부위는 제1 프라이머 결합 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다.
일부 예에서, 제1 gRNA는 적어도 하나의 루프를 추가로 포함한다. 일부 예에서, 제1 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다. 일부 예에서, 제2 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치한다.
일부 예에서, 방법은 폴리뉴클레오타이드를 제2 Cas-gRNA RNP와 접촉시키는 단계를 추가로 포함한다. 제2 Cas-gRNA RNP는 제2 프라이머 결합 부위, 제2 증폭 어댑터 부위, 및 제2 CRISPR 프로토스페이서를 포함하는 제2 가이드 RNA; 및 제2 CRISPR 프로토스페이서와 결합하는 제2 Cas 단백질을 포함할 수 있다. 방법은 제2 CRISPR 프로토스페이서를 제1 가닥에 혼성화하는 단계를 포함할 수 있다. 방법은 제2 프라이머 결합 부위를 제2 가닥에 혼성화하는 단계를 포함할 수 있다.
일부 예에서, 방법은 제1 및 제2 가닥을 제2 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제2 Cas-gRNA RNP에 의해 절단하는 단계를 포함할 수 있다. 일부 예에서, 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열만큼 이격된다. 일부 예에서, 제2 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함한다.
일부 예에서, 방법은 제2 역전사 효소를 사용하여 제2 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 단계를 추가로 포함한다. 일부 예에서, 제2 역전사 효소는 제2 Cas 단백질에 커플링된다. 일부 예에서, 제2 역전사 효소 및 제2 Cas 단백질은 제2 융합 단백질의 구성요소이다.
일부 예에서, 제2 프라이머 결합 부위는 제2 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적이다.
일부 예에서, 제2 증폭 어댑터 부위는 제2 프라이머 결합 부위와 제2 CRISPR 프로토스페이서 사이에 위치한다.
일부 예에서, 제1 및 제2 Cas-gRNA RNP 및 제1 및 제2 역전사 효소는 제1 말단 및 제2 말단을 갖는 부분적 이중 가닥 폴리뉴클레오타이드의 단편을 생성한다. 제1 말단은 제1 3' 오버행을 포함한다. 제2 말단은 제2 3' 오버행을 포함한다. 표적 서열은 제1 말단과 제2 말단 사이에 위치한다. 일부 예에서, 제1 3' 오버행은 제1 증폭 어댑터 부위의 앰플리콘을 포함한다. 일부 예에서, 제2 3' 오버행은 제2 증폭 어댑터 부위의 앰플리콘을 포함한다. 일부 예에서, 방법은 제3 증폭 어댑터를 제1 말단의 5' 기에 결찰하는 단계; 제4 증폭 어댑터를 제2 말단에서의 5' 기에 결찰하는 단계; 단편을 제1, 제2, 제3, 및 제4 증폭 어댑터를 사용하여 증폭하는 단계; 및 증폭된 단편을 시퀀싱하는 단계를 추가로 포함한다.
본원에 기재된 개시내용의 각각의 양태의 임의의 각각의 특성/예는 임의의 적절한 조합으로 함께 구현될 수 있으며, 임의의 하나 이상의 이들 양태로부터의 임의의 특성/예는 임의의 적절한 조합으로 본원에 기재된 다른 양태(들)의 임의의 특성과 함께 구현되어 본원에 기재된 이익을 획득할 수 있음이 이해되어야 한다.
도 1a 내지 도 1k는 Cas-gRNA RNP 매개 디호스팅(dehosting)에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 2a 내지 도 2k는 상이한, 정의된 단편 크기로의 WG 단편화에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 도시한다.
도 3a 내지 도 3e는 절단을 사용하여 폴리뉴클레오타이드를 표지하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 4a 내지 도 4j는 증폭 어댑터를 폴리뉴클레오타이드에 커플링시키기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 5a 내지 도 5k는 표적화된 후성적 검정에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 6a 및 도 6b는 ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제) 표적화된 라이브러리 제작 및 농축을 위한 프로세스 공정에서의 조성물 및 작업 과정을 개략적으로 예시한다.
도 7a 내지 도 7h는 증폭 어댑터를 폴리뉴클레오타이드에 커플링시키기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 8a 내지 도 8h는 Cas-gRNA RNP 닉카제를 사용하여 선택된 폴리뉴클레오타이드 단편을 농축하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 9a는 증폭 어댑터를 dsDNA 라이브러리의 단편에 결찰하기 위한 이전에 알려진 공정에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 9b 내지 도 9f는 증폭 어댑터를 Cas-gRNA RNP를 사용하여 선택된 폴리뉴클레오타이드 단편에 결찰하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 10a 내지 도 10c는 단편을 Cas-gRNA RNP를 사용하여 생성하고, 이에 어댑터를 커플링하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
도 11a 내지 도 11g는 단편을 Cas-gRNA RNP를 사용하여 생성하고, 이에 어댑터를 커플링하기 위한 프로세스 흐름에서의 추가의 조성물 및 작업을 개략적으로 도시한다.
도 12는 태그먼트화(tagmentation), 중단, TWB 세정 후의 표적 DNA 단편을 개략적으로 도시한다.
도 13은 갭 충전 및 ELM에 의한 결찰 후의 표적 DNA 단편을 개략적으로 도시한다.
도 14는 PAM 부위의 반대편을 절단하는 Cas9 닉카제(D10A)를 개략적으로 도시한다.
도 15는 3' 닉(nick)을 보유하는 표적 DNA를 개략적으로 도시한다.
도 16은 표적 단편을 용출시킬 3'-말단의 폴리머라제 연장을 개략적으로 도시한다.
도 17은 4개의 람다 표적의 농축을 보여주는 IGV 기록의 일예를 도시한다.
Cas-gRNA 리보핵단백질(RNP)을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정이 본원에 제공된다.
게놈 라이브러리 제작과 관련하여, 본원의 일부 예는 Cas-gRNA RNP 매개 디호스팅에 관한 것이고; 본원의 일부 예는 상이한, 정의된 단편 크기로의 전장 게놈(WG)의 단편화에 관한 것이고; 본원의 일부 예는 폴리뉴클레오타이드 절단에 관한 것이고; 본원의 일부 예는 폴리뉴클레오타이드에 대한 증폭 어댑터의 커플링에 관한 것이다. 게놈 라이브러리 제작에 관한 이러한 임의의 예의 하나 이상의 양태는 게놈 라이브러리 제작에 관한 이러한 임의의 다른 예의 하나 이상의 양태와 조합하여 사용될 수 있음이 인식될 것이다.
표적화된 후성적 검정과 관련하여, 본원의 일부 예는 Cas-gRNA RNP를 사용하여 후성적 특성(예를 들어, 염색질)을 보유하는 DNA 영역(소 또는 대)을 농축하고, 이는 이후 후성적 NGS 검정에서 처리되는 것에 관한 것이다. 이러한 접근법은 매우 상세한 후성적 검정이 가능하도록 하여 미세한 후성적 변화(예를 들어, ATAC-seq 또는 ChIP-seq와 비교하여) 및 복잡한 네트워크(예를 들어, 유전자좌 연관 단백질체학)의 분석을 개선하며, 이는 예컨대 중요한 연구 또는 임상적 개발일 수 있는 후성적 메커니즘을 더 잘 이해하도록 할 수 있다. 표적화된 후성적 검정에 관한 이러한 임의의 예의 하나 이상의 양태는 게놈 라이브러리 제작에 관한 임의의 예의 하나 이상의 양태와 조합하여 사용될 수 있으며, 그 반대로 마찬가지임이 인식될 것이다.
먼저, 본원에 사용되는 일부 용어가 간략하게 설명될 것이다. 이어서, Cas-RNP를 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정에 대한 일부 예시 조성물 및 예시 방법이 설명될 것이다.
용어
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 당업자에 의해 일반적으로 이해하는 것과 동일한 의미를 갖는다. 용어 "포함하는(including)"뿐만 아니라 "포함하다(include, includes)" 및 "포함된(included)"과 같은 다른 형태의 사용은 제한적이지 않다. 용어 "갖는(having)"뿐만 아니라 "갖다(have, has)" 및 "가졌다(had)"와 같은 다른 형태의 사용은 제한적이지 않다. 본 명세서에 사용된 바와 같이, 전이 문구 또는 청구범위의 중심부에서든, 용어 "포함한다(comprise(s))" 및 "포함하는(comprising)"은 개방 말단형 의미를 갖는 것으로 해석되어야 한다. 즉, 상기 용어는 문구 "적어도 ~ 갖는(having at least)" 또는 "적어도 ~ 포함하는(including at least)"과 동의어로 해석되어야 한다. 예를 들어, 프로세스의 맥락에서 사용될 때, 용어 "포함하는(comprising)"은 프로세스가 적어도 나열된 단계를 포함하지만, 추가 단계를 포함할 수 있음을 의미한다. 화합물, 조성물, 또는 장치의 맥락에서 사용될 때, 용어 "포함하는(comprising)"은 화합물, 조성물, 또는 장치가 적어도 나열된 특성 또는 구성요소를 포함하지만, 또한 추가 특성 또는 구성요소를 포함할 수 있음을 의미한다.
본원에 사용된, 단수 형태("a", "an" 및 "the")는 문맥이 달리 분명하게 지시하지 않는 한, 복수의 지시대상을 포함한다.
본 명세서 전반에 걸쳐 사용되는 용어 "실질적으로", "대략", 및 "약"은 예컨대 처리에서의 변경으로 인한 작은 변동을 기재하고, 설명하는 데 사용된다. 예를 들어, 이들은 ±10% 이하, 예컨대 ±5% 이하, 예컨대 ±2% 이하, 예컨대 ±1% 이하, 예컨대 ±0.5% 이하, 예컨대 ±0.2% 이하, 예컨대 ±0.1% 이하, 예컨대 ±0.05% 이하를 지칭할 수 있다.
본원에 사용된 "혼성화하다" 및 "혼성화"와 같은 용어는 이들 폴리뉴클레오타이드의 길이를 따라 폴리뉴클레오타이드를 서로 비공유적으로 회합하여 이중 가닥 "듀플렉스", 세가닥 "트리플렉스", 또는 더 높은 차수의 구조를 형성함을 의미하도록 의도되며, 예를 들어, 2개의 DNA 폴리뉴클레오타이드 가닥은 상보적 염기 짝짓기를 통해 회합하여 듀플렉스를 형성할 수 있다. 폴리뉴클레오타이드 가닥들 사이의 1차 상호작용은 전형적으로 왓슨-크릭 및 후그스틴 유형 수소 결합에 의해 뉴클레오타이드 염기 특이적이며, 예를 들어 A:T, A:U, 및 G:C이다. 염기 중첩 및 소수성 상호작용이 또한 듀플렉스 안정성에 기여할 수 있다. 혼성화 조건은 약 1 M 미만, 보다 일반적으로는 약 500 mM 미만, 또는 약 200 mM 미만의 염 농도를 포함할 수 있다. 혼성화 완충액은 5% SSPE와 같은 완충 염 용액 또는 당업계에 알려진 다른 적합한 완충액을 포함할 수 있다. 혼성화 온도는 5℃만큼 낮을 수 있지만, 전형적으로는 22℃ 초과 그리고 보다 전형적으로는 약 30℃ 초과 그리고 전형적으로는 37℃ 초과이다. 제1 폴리뉴클레오타이드와 제2 폴리뉴클레오타이드 사이의 회합 강도는 이들 폴리뉴클레오타이드 내의 뉴클레오타이드 서열들 사이의 상보성에 따라 증가한다. 폴리뉴클레오타이드들 사이의 혼성화 강도는 듀플렉스의 50%가 서로 해리되는 폴리뉴클레오타이드 가닥을 갖는 용융 온도(Tm)를 특징으로 할 수 있다.
본원에 사용된 용어 "뉴클레오타이드"는 당 및 적어도 하나의 포스페이트 기를 포함하고, 일부 예에서는 핵염기를 또한 포함하는 분자를 의미하도록 의도한다. 핵 염기가 없는 뉴클레오타이드는 "염기결손"으로 지칭될 수 있다 뉴클레오타이드는 데옥시리보뉴클레오타이드, 변형된 데옥시리보뉴클레오타이드, 리보뉴클레오타이드, 변형된 리보뉴클레오타이드, 펩타이드 뉴클레오타이드, 변형된 펩타이드 뉴클레오타이드, 변형된 포스페이트 당 골격 뉴클레오타이드, 및 이의 혼합물을 포함한다. 뉴클레오타이드의 예는 아데노신 모노포스페이트(AMP), 아데노신 디포스페이트(ADP), 아데노신 트리포스페이트(ATP), 티미딘 모노포스페이트(TMP), 티미딘 디포스페이트(TDP), 티미딘 트리포스페이트(TTP), 시티딘 모노포스페이트(CMP), 시티딘 디포스페이트(CDP), 시티딘 트리포스페이트(CTP), 구아노신 모노포스페이트(GMP), 구아노신 디포스페이트(GDP), 구아노신 트리포스페이트(GTP), 우리딘 모노포스페이트(UMP), 우리딘 디포스페이트(UDP), 우리딘 트리포스페이트(UTP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시아데노신 디포스페이트(dADP), 데옥시아데노신 트리포스페이트(dATP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시티미딘 디포스페이트(dTDP), 데옥시티미딘 트리포스페이트(dTTP), 데옥시시티딘 디포스페이트 (dCDP), 데옥시티딘 트리포스페이트(dCTP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시구아노신 디포스페이트(dGDP), 데옥시구아노신 트리포스페이트(dGTP), 데옥시우리딘 모노포스페이트(dUMP), 데옥시우리딘 디포스페이트(dUDP), 및 데옥시우리딘 트리포스페이트(dUTP)를 포함한다.
본원에 사용된 용어 "뉴클레오타이드"는 또한 자연 발생 뉴클레오타이드와 비교하여 변형된 핵 염기, 당, 골격, 및/또는 포스페이트 모이어티를 포함하는 뉴클레오타이드의 유형인 임의의 뉴클레오타이드 유사체를 포함하도록 의도된다. 뉴클레오타이드 유사체는 또한 "변형된 핵산"으로 지칭될 수 있다 예시 변형된 핵 염기는 이노신, 잔타닌, 하이포잔틴, 이소시토신, 이소구아닌, 2-아미노퓨린, 5-메틸시토신, 5-하이드록시메틸 시토신, 2-아미노아데닌, 6-메틸 아데닌, 6-메틸 구아닌, 2-프로필 구아닌, 2-프로필 아데닌, 2-티오우라실, 2-티오티민, 2-티오시토신, 15-할로우라실, 15-할로시토신, 5-프로피닐 우라실, 5-프로피닐 시토신, 6-아조 우라실, 6-아조 시토신, 6-아조 티민, 5-우라실, 4-티오우라실, 8-할로 아데닌 또는 구아닌, 8-아미노 아데닌 또는 구아닌, 8-티올 아데닌 또는 구아닌, 8-티오알킬 아데닌 또는 구아닌, 8-하이드록실 아데닌 또는 구아닌, 5-할로 치환 우라실 또는 시토신, 7-메틸구아닌, 7-메틸아데닌, 8-아자구아닌, 8-아자아데닌, 7-데아자구아닌, 7-데아자아데닌, 3-데아자구아닌, 3-데아자아데닌 등을 포함한다. 당업계에 알려진 바와 같이, 특정 뉴클레오타이드 유사체, 예를 들어 아데노신 5'-포스포설페이트와 같은 뉴클레오타이드 유사체는 폴리뉴클레오타이드 내로 혼입될 수 없다. 뉴클레오타이드는 임의의 적합한 수의 포스페이트, 예를 들어 3개, 4개, 5개, 6개, 또는 6개 초과의 포스페이트를 포함할 수 있다. 뉴클레오타이드 유사체는 또한 잠금 핵산(LNA), 펩타이드 핵산(PNA), 및 5-하이드록실부티닐-2'-데옥시우리딘("수퍼 T")을 포함한다.
본원에 사용된 용어 "폴리뉴클레오타이드"는 서로 결합된 뉴클레오타이드 서열을 포함하는 분자를 지칭한다. 폴리뉴클레오타이드는 중합체의 비제한적 일예이다. 폴리뉴클레오타이드의 예는 데옥시리보핵산(DNA), 리보핵산(RNA), 및 이의 유사체, 예컨대 잠금 핵산(LNA) 및 펩타이드 핵산(PNA)을 포함한다. 폴리뉴클레오타이드는 뉴클레오타이드의 단일 가닥 서열, 예컨대 RNA 또는 단일 가닥 DNA, 뉴클레오타이드의 이중 가닥 서열, 예컨대 이중 가닥 DNA일 수 있거나, 뉴클레오타이드의 단일 가닥과 이중 가닥 서열의 혼합물을 포함할 수 있다. 이중 가닥 DNA(dsDNA)는 게놈 DNA 및 PCR와 증폭 생성물을 포함한다. 단일 가닥 DNA(ssDNA)는 dsDNA로 전환될 수 있으며, 그 반대도 마찬가지이다. 폴리뉴클레오타이드는 비-자연 발생 DNA, 예컨대 거울상 이성질체 DNA, LNA, 또는 PNA를 포함할 수 있다. 폴리뉴클레오타이드에서의 뉴클레오타이드의 정확한 서열은 알려지거나, 알려지지 않을 수 있다. 다음은 폴리뉴클레오타이드의 예이다: 유전자 또는 유전자 단편(예를 들어, 프로브, 프라이머, 발현된 서열 태그(EST), 또는 유전자 발현의 연속 분석(SAGE) 태그), 게놈 DNA, 게놈 DNA 단편, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA, 리보좀 RNA, 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 합성 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 프라이머, 또는 전술한 것 중 임의의 것의 증폭된 복제물.
본원에 사용된 "폴리머라제"는 뉴클레오타이드를 폴리뉴클레오타이드로 중합시킴으로써 폴리뉴클레오타이드를 조립하는 활성 부위를 갖는 효소를 의미하도록 의도된다. 폴리머라제는 프라이밍된 단일 가닥 표적 폴리뉴클레오타이드에 결합할 수 있고, 성장하는 프라이머에 뉴클레오타이드를 순차적으로 부가하여 표적 폴리뉴클레오타이드의 서열에 상보적인 서열을 갖는 "상보적 복제물" 폴리뉴클레오타이드를 형성할 수 있다. 이어서, 또 다른 폴리머라제 또는 동일한 폴리머라제가 해당 상보적 복제물 폴리뉴클레오타이드의 상보적 복제물을 형성함으로써 표적 뉴클레오타이드의 복제물을 형성할 수 있다. 임의의 이러한 복제물은 본원에서 "앰플리콘"으로 지칭될 수 있다. DNA 폴리머라제는 표적 폴리뉴클레오타이드에 결합하고, 이어서 성장하는 폴리뉴클레오타이드 가닥(성장 앰플리콘)의 3' 말단에서의 유리 하이드록실기에 뉴클레오타이드를 순차적으로 부가하여 표적 폴리뉴클레오타이드 아래로 이동할 수 있다. DNA 폴리머라제는 DNA 주형으로부터 상보적 DNA 분자를 합성할 수 있고, RNA 폴리머라제는 DNA 주형으로부터 RNA 분자를 합성할 수 있다(전사). 폴리머라제는 가닥 성장을 시작하기 위해 짧은 RNA 또는 DNA 가닥(프라이머)을 사용할 수 있다. 일부 폴리머라제는 이들이 사슬에 염기를 부가하고 있는 부위의 상류 가닥을 치환할 수 있다. 이러한 폴리머라제는 이들이 폴리머라제에 의해 판독되는 주형 가닥으로부터 상보적 가닥을 제거하는 활성을 갖는 것을 의미하는 가닥 치환으로 불릴 수 있다.
예시 폴리머라제는 Bst DNA 폴리머라제, 9° Nm DNA 폴리머라제, Phi29 DNA 폴리머라제, DNA 폴리머라제(대장균), DNA 폴리머라제 I(대), (클레나우) 단편, 클레나우 단편(3′-5′ 엑소-), T4 DNA 폴리머라제, T7 DNA 폴리머라제, Deep VentR™(엑소-) DNA 폴리머라제, Deep VentR™ DNA 폴리머라제, DyNAzyme™ EXT DNA, DyNAzyme™ II 핫 스타트 DNA 폴리머라제, Phusion™ 고적합도 DNA 폴리머라제, Therminator™ DNA 폴리머라제, Therminator™ II DNA 폴리머라제, VentR® DNA 폴리머라제, VentR® (엑소-) DNA 폴리머라제, RepliPHI™ Phi29 DNA 폴리머라제, rBst DNA 폴리머라제, rBst DNA 폴리머라제(대), 단편(IsoTherm™ DNA 폴리머라제), MasterAmp™ AmpliTherm™, DNA 폴리머라제, Taq DNA 폴리머라제, Tth DNA 폴리머라제, Tfl DNA 폴리머라제, Tgo DNA 폴리머라제, SP6 DNA 폴리머라제, Tbr DNA 폴리머라제, DNA 폴리머라제 베타, 및 ThermoPhi DNA 폴리머라제를 포함한다. 구체적 비제한적 예에서, 폴리머라제는 Bst, Bsu, 및 Phi29로 구성된 군으로부터 선택된다. 폴리머라제가 혼성화된 가닥을 연장할 때, 단일 가닥 결합 단백질(SSB)을 포함하는 것이 이로울 수 있다. SSB는 치환된(비-주형) 가닥을 안정화시킬 수 있다. 가닥 치환 활성을 갖는 예시 폴리머라제는 제한 없이 벤트 폴리머라제, Bsu 폴리머라제, Bst(바실루스 스테아로써모필루스) 폴리머라제의 큰 단편, 엑소-클레나우 폴리머라제, 또는 시퀀싱 등급 T7 엑소-폴리머라제를 포함한다. 일부 폴리머라제는 이들 전방의 가닥을 분해하여, 이를 후방의 성장하는 사슬로 효과적으로 대체한다(5' 엑소뉴클레아제 활성). 5' 엑소뉴클레아제 활성을 갖는 예시 폴리머라제는 Taq, Bst, 및 DNA 폴리머라제 I을 포함한다. 일부 폴리머라제는 이들 후방의 가닥을 분해하는 활성을 갖는다(3' 엑소뉴클레아제 활성). 일부 유용한 폴리머라제는 돌연변이에 의해 또는 달리 변형되어 3' 및/또는 5' 엑소뉴클레아제 활성을 감소 또는 제거하였다. 폴리머라제는 역전사 효소(RT)를 포함할 수 있다. RT의 비제한적 예는 예를 들어 문헌[Anzalone et al., "Search-and-replace genome editing without double-strand breaks or donor DNA," Nature 576: 149-157 (2019)]에 기재된 바와 같은 MMLV 및 이의 돌연변이를 포함하며, 이의 전체 내용은 본원에 인용되어 포함된다.
본원에 사용된 용어 "프라이머"는 뉴클레오타이드가 유리 3' OH 기를 통해 부가될 수 있는 폴리뉴클레오타이드로 정의된다. 프라이머는 블록이 제거될 때까지 중합을 방지하는 3' 블록을 포함할 수 있다. 프라이머는 커플링 반응을 허용하거나, 프라이머를 또 다른 모이어티에 커플링시키기 위해 5' 말단에서의 변형을 포함할 수 있다. 프라이머는 UV 광, 화학물질, 효소 등과 같은 적합한 조건 하에서 절단될 수 있는 8-옥소-G와 같은 하나 이상의 모이어티를 포함할 수 있다. 프라이머 길이는 임의의 적합한 수의 염기 길이일 수 있으며, 임의의 적합한 천연 및 비-천연 뉴클레오타이드의 조합을 포함할 수 있다. 표적 폴리뉴클레오타이드는 프라이머에 혼성화하는 (이에 상보적인 서열을 갖는) "증폭 어댑터" 또는 보다 간단하게 "어댑터"를 포함할 수 있으며, 프라이머의 유리 3' OH 기에 뉴클레오타이드를 부가함으로써 상보적 복제물 폴리뉴클레오타이드를 생성하도록 증폭될 수 있다. "포획 프라이머"는 기재에 커플링되고, 표적 폴리뉴클레오타이드의 제1 어댑터에 혼성화될 수 있는 프라이머를 의미하도록 의도되는 한편, "직교 포획 프라이머"는 기재에 커플링되고, 해당 표적 폴리뉴클레오타이드의 제2 어댑터에 혼성화될 수 있는 프라이머를 의미하도록 의도된다. 제1 어댑터는 포획 프라이머의 서열에 상보적인 서열을 가질 수 있고, 제2 어댑터는 직교 포획 프라이머의 서열에 상보적인 서열을 가질 수 있다. 포획 프라이머 및 직교 포획 프라이머는 서로 상이하고, 독립적인 서열을 가질 수 있다. 추가적으로, 포획 프라이머 및 직교 포획 프라이머는 적어도 하나의 다른 특성에서 서로 상이할 수 있다. 예를 들어, 포획 프라이머 및 직교 포획 프라이머는 서로 상이한 길이를 가질 수 있거나; 포획 프라이머 또는 직교 포획 프라이머는 다른 포획 프라이머 또는 직교 포획 프라이머에는 없는 비-핵산 모이어티(예컨대, 차단 기 또는 제거 모이어티)를 포함할 수 있거나; 이러한 특성의 임의의 적합한 조합을 포함할 수 있다. 변형된 포획 프라이머는 추가적으로 복수의 자연 발생 핵산, 예컨대 비제한적으로 DNA를 포함할 수 있다.
일부 예에서, 포획 프라이머는 Illumina, Inc로부터 상업적으로 입수 가능한 P5 또는 P7 프라이머이다. P5 또는 P7 프라이머는 서로 직교인 프라이머의 비제한적 예이다. P5 및 P7 프라이머 서열은 일부 예에서 다음 서열을 가질 수 있다:
쌍 판독물 세트:
P5: 5'-AATGATACGGCGACCACCGAGAUCTACAC-3' (서열번호 1)
P7: 5'-CAAGCAGAAGACGGCATACGAG*AT-3'(서열번호 2)
단일 판독물 세트:
P5: 5'-AATGATACGGCGACCACCGA-3' (서열번호 3)
P7: 5'-CAAGCAGAAGACGGCATACGA3'(서열번호 4)
여기서, G*는 G 또는 8-옥소구아닌이다.
본원에 사용된 용어 "복수"는 둘 이상의 상이한 구성원의 집단을 의미하도록 의도된다. 복수는 소, 중, 대에서 극대 크기의 범위일 수 있다. 소 복수의 크기는 예를 들어 수 개의 구성원 내지 수십 개의 구성원의 범위일 수 있다. 중간 크기의 복수는 예를 들어 수십 개의 구성원 내지 약 100개의 구성원 또는 수백 개의 구성원의 범위일 수 있다. 대 복수는 예를 들어 약 수백 개의 구성원 내지 약 1000개의 구성원, 수천 개의 구성원, 및 최대 수만 개의 구성원의 범위일 수 있다. 극대 복수는 예를 들어 수만 개의 구성원 내지 약 수십만, 백만, 수백만, 수천만, 및 최대 수억 초과의 구성원의 범위일 수 있다. 따라서, 복수는 2개 내지 1억 개를 훨씬 넘는 구성원의 크기뿐만 아니라 상기 예시적 범위 사이 및 그 초과의 구성원 수에 의해 측정된 모든 크기 범위일 수 있다. 예시적 폴리뉴클레오타이드 복수는 예를 들어 약 1×105개 이상, 5×105개 이상, 또는 1×106개 이상의 상이한 폴리뉴클레오타이드의 집단을 포함한다. 따라서, 해당 용어의 정의는 2를 초과하는 모든 정수 값을 포함하도록 의도된다. 복수의 상한은 예를 들어 샘플 내의 폴리뉴클레오타이드 서열의 이론적 다양성에 의해 설정될 수 있다.
본원에 사용된 용어 "이중 가닥"은 폴리뉴클레오타이드와 관련하여 사용될 때, 폴리뉴클레오타이드에서의 모든 또는 실질적으로 모든 뉴클레오타이드가 상보적 폴리뉴클레오타이드에서의 각각의 뉴클레오타이드에 수소 결합됨을 의미하도록 의도된다. 이중 가닥 폴리뉴클레오타이드는 또한 "듀플렉스"로 지칭될 수 있다. 본원에 사용된 용어 "단일 가닥"은 폴리뉴클레오타이드와 관련하여 사용될 때, 본질적으로 폴리뉴클레오타이드에서의 뉴클레오타이드 중 어느 것도 상보적 폴리뉴클레오타이드에서의 각각의 뉴클레오타이드에 수소 결합되지 않음을 의미한다.
본원에 사용된 용어 "표적 폴리뉴클레오타이드"는 분석 또는 작용의 대상인 폴리뉴클레오타이드를 의미하도록 의도되며, 또한 "라이브러리 폴리뉴클레오타이드", "주형 폴리뉴클레오타이드", 또는 "라이브러리 주형"과 같은 사용 용어로 지칭될 수 있다. 분석 또는 작용은 폴리뉴클레오타이드를 포획, 증폭, 시퀀싱, 및/또는 기타 절차에 적용하는 것을 포함한다. 표적 폴리뉴클레오타이드는 분석되는 표적 서열에 추가적인 뉴클레오타이드 서열을 포함할 수 있다. 예를 들어, 표적 폴리뉴클레오타이드는 분석되어야 하는 표적 폴리뉴클레오타이드 서열의 측면에 배치하는 프라이머 결합 부위로서 작용하는 증폭 어댑터를 포함하는 하나 이상의 어댑터를 포함할 수 있다. 포획 프라이머에 혼성화되는 표적 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드 전부가 연장 처리되지는 않는 방식으로 포획 올리고뉴클레오타이드의 5' 또는 3' 말단을 넘어 연장되는 뉴클레오타이드를 포함할 수 있다. 특정 예에서, 표적 폴리뉴클레오타이드는 서로 상이한 서열을 가질 수 있지만, 서로 동일한 제1 및 제2 어댑터를 가질 수 있다. 특정 표적 폴리뉴클레오타이드 서열의 측면에 배치될 수 있는 2개의 어댑터는 서로 동일한 서열 또는 서로 상보적 서열을 가질 수 있거나, 2개의 어댑터는 상이한 서열을 가질 수 있다. 따라서, 복수의 표적 폴리뉴클레오타이드에서의 종은 예를 들어 시퀀싱(예를 들어, SBS)에 의해 평가되어야 하는 알려지지 않은 서열의 영역 측면에 배치되는 알려진 서열의 영역을 포함할 수 있다. 일부 예에서, 표적 폴리뉴클레오타이드는 단일 말단에 증폭 어댑터를 보유하고, 이러한 어댑터는 표적 폴리뉴클레오타이드의 3' 말단 또는 5' 말단에 위치할 수 있다. 표적 폴리뉴클레오타이드는 임의의 어댑터 없이 사용될 수 있으며, 이러한 경우, 프라이머 결합 서열은 표적 폴리뉴클레오타이드에서 발견되는 서열로부터 직접 유래할 수 있다.
용어 "폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"는 본원에서 상호 교환적으로 사용된다. 상이한 용어는 달리 구체적으로 명시되지 않는 한, 크기, 서열, 또는 기타 특성의 임의의 특정 차이를 나타내도록 의도되지 않는다. 설명의 명확성을 위해, 해당 용어는 몇몇의 폴리뉴클레오타이드 종을 포함하는 특정 방법 또는 조성물을 설명할 때, 하나의 폴리뉴클레오타이드의 종을 또 다른 것으로부터 구별하기 위해 사용될 수 있다.
용어 "서열" 및 "하위서열"은 일부 경우 본원에서 상호 교환적으로 사용된다. 예를 들어, 서열은 그 내부에 하나 이상의 하위서열을 포함할 수 있다. 이러한 하위서열 각각은 또한 서열로 지칭될 수 있다.
본원에 사용된 용어 "앰플리콘"은 폴리뉴클레오타이드와 관련하여 사용될 때, 폴리뉴클레오타이드의 복제 산물을 의미하도록 의도되며, 여기서, 산물은 폴리뉴클레오타이드의 뉴클레오타이드 서열의 적어도 일부와 실질적으로 동일하거나, 실질적으로 상보적인 뉴클레오타이드 서열을 갖는다. "증폭" 및 "증폭하는"은 폴리뉴클레오타이드의 앰플리콘을 제조하는 프로세스를 지칭한다. 표적 폴리뉴클레오타이드의 제1 앰플리콘은 상보적 복제물일 수 있다. 추가 앰플리콘은 제1 앰플리콘의 생성 후에, 표적 폴리뉴클레오타이드로부터 또는 제1 앰플리콘으로부터 생성된 복제물이다. 후속 앰플리콘은 표적 폴리뉴클레오타이드에 실질적으로 상보적이거나, 표적 폴리뉴클레오타이드와 실질적으로 동일한 서열을 가질 수 있다. 폴리뉴클레오타이드의 소수의 돌연변이(예를 들어, 증폭 인공물로 인함)가 해당 폴리뉴클레오타이드의 앰플리콘을 생성할 때, 발생할 수 있음이 이해될 것이다.
본원에 사용된 용어 "보호 요소"는 폴리뉴클레오타이드의 5' 또는 3' 말단과 관련하여 사용될 때, 폴리뉴클레오타이드의 해당 말단의 변형을 억제하는 요소를 의미하도록 의도된다. 예시적으로, 보호 요소는 5' 또는 3' 엑소뉴클레아제의 작용과 같은 폴리뉴클레오타이드의 해당 말단에 대한 하나 이상의 효소의 작용을 억제할 수 있다. 보호 요소의 비제한적 예는 이중 가닥 폴리뉴클레오타이드, 변형된 염기(예를 들어, 포스포로티오에이트 결합 또는 3' 포스페이트 포함), 또는 탈인산화 염기의 5' 및 3' 가닥 말단에 결찰되는 헤어핀 서열을 포함한다.
본원에 사용된 "CRISPR-Cas 시스템", "Cas-gRNA 리보핵단백질", 및 Cas-gRNA RNP와 같은 용어는 표적 폴리뉴클레오타이드 내의 서열에 상보적이거나, 실질적으로 상보적인 올리고뉴클레오타이드 서열을 포함하는 가이드 RNA(gRNA) 서열 및 Cas 단백질을 포함하는 효소 시스템을 지칭한다. CRISPR-Cas 시스템은 일반적으로 3개의 주요 유형을 분류될 수 있고, 추가로 코어 요소 함량 및 서열을 기준으로 10개의 하위 유형으로 하위분할되며; 예를 들어, 문헌[Makarova et al., "Evolution and classification of the CRISPR-Cas systems," Nat Rev Microbiol. 9(6): 467-477 (2011)]을 참조한다. Cas 단백질은 다양한 활성, 예를 들어 뉴클레아제 활성을 가질 수 있다. 따라서, CRISPR-Cas 시스템은 (예를 들어, gRNA를 통해) 특정 서열뿐만 아니라 (예를 들어, Cas 단백질을 통해) 서열 상의 특정 효소 활성을 표적화하기 위한 메커니즘을 제공한다.
유형 I CRISPR-Cas 시스템은 별도의 헬리카제 및 DNase 활성을 갖는 Cas3 단백질을 포함할 수 있다. 예를 들어, 유형 1-E 시스템에서, crRNA는 표적 DNA에 결합하고, Cas3 단백질에 의한 분해를 유발하는 캐스케이드(항바이러스 방어를 위한 CRISPR-연관 복합체)라 불리는 다중 하위유닛 이펙터 복합체 내로 혼입되며; 예를 들어, 문헌[Brouns et al., "Small CRISPR RNAs guide antiviral defense in prokaryotes," Science 321(5891): 960--964 (2008)]; 문헌[Sinkunas et al., "Cas3 is a single-stranded DNA nuclease and ATP-dependent helicase in the CRISPR-Cas immune system," EMBO J 30:1335--1342 (2011)]; 및 문헌[Beloglazova et al., "Structure and activity of the Cas3 HD nuclease MJ0384, an effector enzyme of the CRISPR interference, EMBO J 30:4616-4627 (2011)]을 참조한다. 유형 II CRISPR-Cas 시스템은 crRNA를 생성하고, 표적 DNA를 절단할 수 있는 시그니처 Cas9 단백질, 단일 단백질(약 160 KDa)을 포함한다. Cas9 단백질은 전형적으로 2개의 뉴클레아제 도메인, 아미노 말단 근처의 RuvC-유사 뉴클레아제 도메인, 및 단백질의 중간 근처의 HNH(또는 McrA-유사) 뉴클레아제 도메인을 포함한다. Cas9 단백질의 각각의 뉴클레아제 도메인은 이중 헬릭스의 일 가닥을 절단하도록 특화되며; 예를 들어, 문헌[Jinek et al., "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity, Science 337(6096): 816-821 (2012)]을 참조한다. 유형 III CRISPR-Cas 시스템은 폴리머라제 및 RAMP 모듈을 포함한다. 유형 III 시스템은 하위 유형 III-A 및 III-B로 추가로 분할될 수 있다. 유형 III-A CRISPR-Cas 시스템은 플라스미드를 표적화하는 것으로 밝혀졌고, 유형 III-A 시스템의 폴리머라제-유사 단백질은 표적 DNA의 절단에 관여하며; 예를 들어, 문헌[Marraffini et al., "CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA," Science 322(5909):1843-1845 (2008)]을 참조한다. 유형 III-B CRISPR-Cas 시스템은 또한 RNA를 표적화하는 것으로 밝혀졌으며; 예를 들어, 문헌[Hale et al., "RNA-guided RNA cleavage by a CRISPR-RNA-Cas protein complex," Cell 139(5): 945-956 (2009)]을 참조한다. CRISPR-Cas 시스템은 자연적으로 축적되는 CRISPR-Cas 시스템으로부터 유래되는 엔지니어링되고/되거나 프로그래밍된 뉴클레아제 시스템을 포함한다. CRISPR-Cas 시스템은 엔지니어링되고/되거나 돌연변이된 Cas 단백질을 포함할 수 있다. CRISPR-Cas 시스템은 엔지니어링되고/되거나 프로그래밍된 가이드 RNA를 포함할 수 있다.
일부 구체적 예에서, 본 Cas-gRNA RNP 중 하나에서의 Cas 단백질은 다음 참고문헌에 기재된 바와 같은 방식으로 gRNA가 상보적인 서열에서 표적 폴리뉴클레오타이드를 절단할 수 있는 Cas9 또는 다른 적합한 Cas를 포함할 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Nachmanson et al., "Targeted genome fragmentation with CRISPR/Cas9 enables fast and efficient enrichment of small genomic regions and ultra-accurate sequencing with low DNA input (CRISPR-DS)," Genome Res. 28(10): 1589-1599 (2018)]; 문헌[Vakulskas et al., "A high-fidelity Cas9 mutant delivered as a ribonucleoprotein complex enables efficient gene editing in human hematopoietic stem and progenitor cells," Nature Medicine 24: 1216-1224 (2018)]; 문헌[Chatterjee et al., "Minimal PAM specificity of a highly similar SpCas9 ortholog," Science Advances 4(10): eaau0766, 1-10 (2018)]; 문헌[Lee et al., "CRISPR-Cap: multiplexed double-stranded DNA enrichment based on the CRISPR system," Nucleic Acids Research 47(1): e1, 1-13 (2019)]. S. 써모필루스(S. thermophilus) CRISPR-Cas 시스템으로부터 단리된 Cas9-crRNA 복합체뿐만 아니라 별도의 구성요소로부터 시험관 내에서 조립된 복합체는 이것이 crRNA에 상보적인 뉴클레오타이드 서열을 보유하는 합성 올리고데옥시뉴클레오타이드 및 플라스미드 DNA 둘 모두에 결합함을 입증한다. Cas9는 RuvC- 및 HNH-활성 부위/뉴클레아제 도메인이라는 2개의 뉴클레아제 도메인을 가지며, 이들 2개의 뉴클레아제 도메인은 대향 DNA 가닥의 절단을 담당하는 것으로 밝혀졌다. 일부 예에서, Cas9 단백질은 S. 써모필루스 CRISPR-Cas 시스템의 Cas9 단백질로부터 유래된다. 일부 예에서, Cas9 단백질은 약 1,409개의 아미노산 잔기를 갖는 다중-도메인 단백질이다.
다른 실시형태에서, Cas는 예를 들어 다음 참고문헌에 기재된 바와 같은 방식으로 gRNA가 상보적인 서열에서 표적 폴리뉴클레오타이드를 절단하지 않도록 엔지니어링될 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Guilinger et al., "Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification," Nature Biotechnology 32: 577-582 (2014)]; 문헌[Bhatt et al., "Targeted DNA transposition using a dCas9-transposase fusion protein," https://doi.org/10.1101/571653, pages 1-89 (2019)]; 문헌[Xu et al., "CRISPR-assisted targeted enrichment-sequencing (CATE-seq)," available at URL www.biorxiv.org/content/10.1101/672816v1, 1-30 (2019)]; 및 문헌[Tijan et al., "dCas9-targeted locus-specific protein isolation method identifies histone gene regulators," PNAS 115(12): E2734-E2741 (2018)]. 뉴클레아제 활성이 결여된 Cas는 비활성화 Cas(dCas)로 지칭될 수 있다. 일부 예에서, dCas는 Cas9 단백질의 뉴클레아제-부재 변이체(nuclease-null variant)를 포함할 수 있으며, RuvC- 및 HNH-활성 부위/뉴클레아제 도메인은 둘 모두 돌연변이가 된다. Cas9 단백질의 뉴클레아제-부재 변이체(dCas9)는 이중 가닥 DNA에 결합하지만, DNA를 절단하지는 않는다. Cas9 단백질의 또 다른 변이체는 crRNA에 상보적인 가닥을 절단하는 도메인에서의 제1 돌연변이 및 crRNA에 비-상보적인 가닥을 절단하는 도메인에서의 제2 돌연변이를 갖는 2개의 비활성화 뉴클레아제 도메인을 갖는다. 일부 예에서, Cas9 단백질은 제1 돌연변이 D10A 및 제2 돌연변이 H840A를 갖는다.
또 다른 예에서, Cas 단백질은 캐스케이드 단백질을 포함한다. 대장균 내의 캐스케이드 복합체는 서열-특이적 방식으로 이중 가닥 DNA(dsDNA) 표적을 인식한다. 대장균 캐스케이드 복합체는 5개의 기능적으로 필수적인 CRISPR-연관 (Cas) 단백질(CasA1B2C6D1E1, 캐스케이드 단백질로도 불림) 및 61개의 뉴클레오타이드 crRNA를 포함하는 405-kDa 복합체이다. crRNA는 비상보적 가닥을 치환하여 R-루프를 형성하는 한편, 상보적 DNA 가닥과 염기쌍을 형성함으로써 캐스케이드 복합체를 dsDNA 표적 서열로 가이드한다. 캐스케이드는 ATP를 소비하지 않으면서 표적 DNA를 인식하고, 이는 연속적 침입자 DNA 감시(continuous invader DNA surveillance)가 에너지 투자 없이 발생함을 시사하며; 예를 들어, 문헌[Matthijs et al., "Structural basis for CRISPR RNA-guided DNA recognition by Cascade," Nature Structural & Molecular Biology 18(5): 529-536 (2011)]을 참조한다. 또 다른 예에서, Cas 단백질은 Cas3 단백질을 포함한다. 예시적으로, 대장균 Cas3은 R-루프를 형성하는 DNA와 함께 RNA의 ATP-의존적 어닐링 및 RNA 염기쌍의 듀플렉스 DNA로의 혼성화를 촉매 작용할 수 있다. Cas3 단백질은 Cas9에 대한 gRNA보다 더 긴 gRNA를 사용할 수 있으며; 예를 들어, 문헌[Howard et al., "Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein," Biochem J. 439(1): 85-95 (2011)]을 참조한다. 이러한 더 긴 gRNA는 표적 DNA에 대한 다른 요소의 더 용이한 접근, 예를 들어 폴리머라제에 의해 연장되는 프라이머의 접근을 허용할 수 있다. Cas3 단백질에 의해 제공되는 또 다른 특성은 Cas3 단백질이 Cas9와 같이 PAM 서열을 필요로 하지 않으며, 따라서 소기의 서열을 표적화하는 데 더 많은 유연성을 제공한다는 것이다. Cas3에 의한 R-루프 형성은 마그네슘을 보조인자로서 이용할 수 있으며; 예를 들어, 문헌[Howard et al., "Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein," Biochem J. 439(1): 85-95 (2011)]을 참조한다. PAM 서열에 대한 필요를 감소 또는 피하는 Cas9 변이체가 또한 개발되었으며: 예를 들어, 문헌[Walton et al., "Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants," Science 368(6488): 290-296 (2020)]을 참조하고, 이의 전체 내용은 본원에 인용되어 포함된다. 양이온과 같은 임의의 적합한 보조인자가 본 조성물 및 방법에 사용되는 Cas 단백질과 함께 사용될 수 있음이 인식될 것이다.
이중 가닥 폴리뉴클레오타이드를 붕괴시키고, 루프 구조를 생성할 수 있는 임의의 CRISPR-Cas 시스템이 사용될 수 있음이 또한 인식되어야 한다. 예를 들어, Cas 단백질은 다음 참고문헌에 기재된 바와 같은 Cas 단백질을 포함할 수 있지만, 이로 제한되지는 않으며, 이들 각각의 전체 내용은 본원에 인용되어 포함되고: 문헌[Haft et al., "A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes," PLoS Comput Biol. 1(6): e60, 1-10 (2005)]; 문헌[Zhang et al., "Expanding the catalog of cas genes with metagenomes," Nucl. Acids Res. 42(4): 2448-2459 (2013)]; 및 문헌[Strecker et al., "RNA-guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)], 여기서, Cas 단백질은 Cas12k를 포함할 수 있다. 이들 CRISPR-Cas 시스템 중 일부는 표적 서열을 인식하고, 결합하기 위해 특정 서열을 이용할 수 있다. 예를 들어, Cas9는 5'-NGG 프로토스페이서-인접 모티프(PAM)의 존재를 이용할 수 있다.
일부 예에서, Cas 단백질은 예를 들어 하나 이상의 염기, 예시적으로 2 내지 5개의 염기의 dsDNA 분해 이후 단일 가닥 DNA 오버행 영역을 남기도록 선택될 수 있다. 예를 들어, CRISPR-Cas12a(Cpf1)는 Integrated DNA Technologies, Inc(미국 아이오와주 코럴빌 소재)로부터 상업적으로 입수 가능하다. 제조업체에 따르면, CRISPR-Cas12a(Cpf1)는 5' 오버행을 갖는 엇갈린 절단(staggered cut)을 생성하며, CRISPR-Cas9와 상이한 부위를 표적으로 할 수 있다. 일부 예에서, 5' 오버행은 5개의 염기 길이일 수 있다. 이들 CRISPR-Cas 시스템 중 일부는 PAM을 이용할 수 있다. 예를 들어, Cas12a(Cpf1 또는 C2c1) 또는 FnCas12a는 절단 부위의 TTTN 상류의 PAM을 사용할 수 있는 한편, 신흥 Cas12a 동원체는 문헌[Teng et al., "Enhanced mammalian genome editing by new Cas12a orthologs with optimized crRNA scaffolds," Genome Biology 20: 15 (2019)]에 기재된 바와 같은 방식으로 감소된 PAM 요건(예를 들어, YTN)을 가질 수 있으며, 이의 전체 내용은 본원에 인용되어 포함된다. Cas12는 프란시셀라 노비시다(Francisella novicida), 애싸드아미노코커스(Acidaminococcus) sp., 락노스피라과(Lachnospiraceae) sp., 및 프레보텔라(Prevotella) sp.와 같은 유기체로부터 유래될 수 있다. Cas12a에 관한 추가의 상세 내용을 위해서는, 문헌[Covsky et al., "CRISPR-Cas12a exploits R-loop asymmetry to form double-strand breaks," eLife, 9: e55143 (2020)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
CRISPR-Cas 시스템은 또한 엔지니어링되고/되거나 프로그래밍된 가이드 RNA(gRNA)를 포함할 수 있다. 본원에 사용된 용어 "가이드 RNA" 및 "gRNA"(그리고 때때로 당업계에서 단일 가이드 RNA 또는 sgRNA로 지칭됨)는 표적 DNA 서열의 영역에 상보적이거나, 실질적으로 상보적이며, Cas 단백질을 해당 영역으로 가이드하는 서열을 포함하는 RNA를 의미하도록 의도된다. 가이드 RNA는 표적 DNA 서열의 영역에 상보적이거나, 실질적으로 상보적인 서열 이외에도 뉴클레오타이드 서열을 포함할 수 있다. gRNA를 설계하기 위한 방법은 당업계에 잘 알려져 있으며, 비제한적 예는 다음 참고문헌에 제공되고, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Stevens et al., "A novel CRISPR/Cas9 associated technology for sequence-specific nucleic acid enrichment," PLoS ONE 14(4): e0215441, pages 1-7 (2019)]; 문헌[Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs, Nature Biotechnology 32(3): 279-284 (2014)]; 문헌[Kocak et al., "Increasing the specificity of CRISPR systems with engineered RNA secondary structures," Nature Biotechnology 37: 657-666 (2019)]; 문헌[Lee et al., "CRISPR-Cap: multiplexed double-stranded DNA enrichment based on the CRISPR system," Nucleic Acids Research 47(1): e1, 1-13 (2019)]; 문헌[Quan et al., "FLASH: a next-generation CRISPR diagnostic for multiplexed detection of antimicrobial resistance sequences," Nucleic Acids Research 47(14): e83, 1-9 (2019)]; 및 문헌[Xu et al., "CRISPR-assisted targeted enrichment-sequencing (CATE-seq)," https://doi.org/10.1101/672816, 1-30 (2019)].
일부 예에서, gRNA는 키메라, 예를 들어 트랜스-활성화 CRISPR RNA(tracrRNA)에 융합된 CRISPR RNA(crRNA)를 포함한다. 이러한 키메라 단일-가이드 RNA(sgRNA)는 문헌[inek et al., "A programmable dual-RNA-guided endonuclease in adaptive bacterial immunity," Science 337 (6096): 816-821 (2012)]에 기재되어 있다. Cas 단백질은 키메라 sgRNA에 의해 임의의 게놈 유전자좌에 이어서 5'-NGG 프로토스페이서-인접 모티프(PAM)로 향할 수 있다. 일 비제한적 예에서, crRNA 및 tracrRNA는 T7 프로모터를 포함하는 합성 이중 가닥 DNA 주형을 사용하여 시험관내 전사에 의해 합성될 수 있다. tracrRNA는 고정된 서열을 가질 수 있는 반면, 표적 서열은 crRNA 서열 중 일부를 좌우할 수 있다. crRNA 및 tracrRNA의 동일한 몰농도가 혼합되고, 55℃에서 30초 동안 가열될 수 있다. Cas9는 37℃에서 동일한 몰농도로 부가되고, RNA 믹스와 함께 10분 동안 인큐베이션될 수 있다. 이어서, 수득된 Cas9-gRNA RNP의 10 내지 20배의 몰 과량이 표적 DNA에 부가될 수 있다. 결합 반응은 15분 내에 발생할 수 있다. 다른 적합한 반응 조건이 용이하게 사용될 수 있다.
본원에 사용된 용어 "융합 단백질" 및 "키메라 단백질"은 서로 상이한 기능적 특성(예컨대, 상이한 효소 활성)을 갖는 둘 이상의 폴리펩타이드 도메인을 포함하는 요소를 의미하도록 의도된다. 도메인은 서로 공유적으로 또는 비-공유적으로 커플링될 수 있다. 융합 단백질은 선택적으로 하나 이상의 다른 폴리펩타이드 도메인에 작용적으로 연결된 제3, 제4 또는 제5 또는 다른 폴리펩타이드 도메인을 포함할 수 있다. 융합 단백질은 동일한 폴리펩타이드 도메인의 다수의 복제물을 포함할 수 있다. 융합 단백질은 또한 또는 대안적으로 하나 이상의 폴리펩타이드에서 하나 이상의 돌연변이를 포함할 수 있다. 융합 단백질은 하나 이상의 비-단백질 요소, 예컨대 폴리뉴클레오타이드(예시적으로, gRNA) 및/또는 도메인을 서로 커플링시키는 링커를 포함할 수 있다. 융합 단백질의 비제한적 예의 경우, 다음 참고문헌을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다: 문헌[Guilinger et al., "Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification," Nature Biotechnology 32: 577-582 (2014)]; 문헌[Bhatt et al., "Targeted DNA transposition using a dCas9-transposase fusion protein," https://doi.org/10.1101/571653, pages 1-89 (2019)]; 및 문헌[Strecker et al., "RNA-guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]. 또 다른 예시 융합 단백질은 ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제)이며, Cas12k 및 Tn7 유사 트랜스포사제를 포함한다. 내부에 Cas12k 및 Tn7을 포함하는 ShCAST에 관한 추가의 상세 내용의 경우, 문헌[Strecker et al., "RNA-Guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
본원에 사용된 용어 "트랜스포사제"는 올리고뉴클레오타이드를 폴리뉴클레오타이드에 커플링시킬 수 있는 효소를 의미하도록 의도된다. 일부 예에서, 올리고뉴클레오타이드는 증폭 어댑터를 포함할 수 있으며, 선택적으로 고유한 분자 식별자(UMI)를 포함할 수 있다. 트랜스포사제는 폴리뉴클레오타이드에 올리고뉴클레오타이드를 부가하는 동안, 폴리뉴클레오타이드를 절단할 수 있다. 트랜스포사제의 일 비제한적 예는 Tn5이다. 또 추가의 예에서, 트랜스포사제는 레트로트랜스포존 또는 레트로바이러스로부터의 인테그라제(integrase)를 포함할 수 있다. 트랜스포사제, 트랜스포존, 및 트랜스포존 복합체는 미국 특허 US 2010/0120098호의 개시내용에 의해 예시된 바와 같이 일반적으로 당업자에게 알려지며, 이는 전체 내용은 본원에 인용되어 포함된다.
본원에 제공된 바와 같은 방식으로 사용될 수 있는 트랜스포사제의 추가의 비제한적 예의 경우, 다음 참고문헌을 참조하며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Strecker et al., "RNA-guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]; 문헌[Klompe et al., "Transposon-encoded CRISPR-Cas systems direct RNA-guided DNA integration," Nature 571: 219-225 (2019)]; 및 문헌[Bhatt et al., "Targeted DNA transposition using a dCas9-transposase fusion protein," https://doi.org/10.1101/571653, pages 1-89 (2019)]. 제공된 방법에 사용될 수 있는 알려진 전위 시스템의 다른 예는 황색포도상구균 Tn552, Tyl, 트랜스포존 Tn7, Tn/O 및 IS10, 마리너 트랜스포사제, Tel, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존을 포함하지만, 이로 제한되지는 않는다(예를 들어, 문헌[Colegio et al., 2001, J. Bacteriol. 183: 2384-8]; 문헌[Kirby et al., 2002, Mol. Microbiol. 43: 173-86]; 문헌[Devine and Boeke, 1994, Nucleic Acids Res., 22: 3765-72]; 국제 출원 WO 95/23875호; 문헌[Craig, 1996, Science 271: 1512]; 문헌[Craig, 1996, Review in: Curr Top Microbiol Immunol. 204: 27-48]; 문헌[Kleckner et al., 1996, Curr Top Microbiol Immunol. 204: 49-82]; 문헌[Lampe et al., 1996, EMBO J. 15: 5470-9]; 문헌[Plasterk, 1996, Curr Top Microbiol Immunol 204: 125-43]; 문헌[Gloor, 2004, Methods Mol. Biol. 260: 97-114]; 문헌[Ichikawa and Ohtsubo, 1990, J Biol. Chem. 265: 18829-32]; 문헌[Kleckner et al., 1996, Curr Top Microbiol Immunol. 204: 1-26]; 문헌[Brown et al., 1989, Proc Natl Acad Sci USA 86: 2525-9]; 및 문헌[Boeke and Corces, 1989, Annu Rev Microbiol. 43: 403-34] 참조). 또 다른 예로서, ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제)는 Tn7 유사 트랜스포사제를 포함하고; 추가의 상세 내용의 경우, 문헌[Strecker et al., "RNA-Guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
일부 예에서, 트랜스포사제는 예를 들어 미국 특허 US 2010/0120098호 또는 국제 공개 WO 2010/04860호에 기재된 바와 같은 방식으로 표적 폴리뉴클레오타이드의 단편화 및 이중 가닥 DNA 단편의 양쪽 가닥의 5' 말단 또는 5' 및 3' 말단에 대한 어댑터의 결찰을 수득하는 "태그먼트화" 또는 "전위"로 지칭될 수 있는 프로세스를 수행할 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다.
트랜스포사제는 트랜스포사제, 트랜스포존 말단 포함 조성물, 및 이중 가닥 폴리뉴클레오타이드를 포함하는 "전위 복합체"를 형성할 수 있으며, 트랜스포존 말단 포함 조성물의 이중 가닥 표적 폴리뉴클레오타이드 내로의 삽입 또는 전위를 촉매 작용할 수 있다. 예시 전위 복합체는 과활성 Tn5 트랜스포사제 및 TN5 유형 트랜스포존 말단에 의해 또는 MnA 트랜스포사제 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포존 말단에 의해 형성된 것들을 포함하지만, 이로 제한되지는 않고; 예를 들어, 다음 참고문헌을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다: 문헌[Barrangou et al., "CRISPR provides acquired resistances against viruses in prokaryotes," Science 273: 7367-7394 (1998)]; 문헌[Mizuuchi, "In vitro transposition of bacteriophage Mu: a biochemical approach to a novel replication reaction," Cell 35(3 pt 2): 785-794 (1983)]; 및 문헌[Savilahti et al., "The phage Mu transposomes core: DNA requirements for assembly and function," EMBO J. 14(19): 4893-4903 (1995)]. 트랜스포사제 및 트랜스포존 말단의 조합은 "트랜스포좀"으로 지칭될 수 있다.
트랜스포사제 및 다른 적합한 전위 시스템의 또 추가의 예는 황색포도상구균 Tn552를 포함한다(예를 들어, 문헌[Colegio et al., "In vitro transposition system for efficient generation of random mutants of Campylobacter jejuni," J Bacteriol. 183: 2384-2388 (2001)] 및 문헌[Kirby et al., "Cryptic plasmids of Mycobacterium avium: Tn552 to the rescue," Mol Microbiol., 43(1): 173-186 (2002)]); TyI(문헌[Devine et al., "Efficient integration of artificial transposons into plasmid targets in vitro: a useful tool for DNA mapping, sequencing and genetic analysis," Nucleic Acids Res. 22(18): 3765-3772 (1994)] 및 국제 공개 WO 95/23875호); 트랜스포존 Tn7(문헌[Craig, "V(D)J recombination and transposition: Closer than expected," Science 271(5255): 1512 (1996)] 및 문헌[Craig, Review in: Curr Top Microbiol Immunol, 204: 27-48 (1996)]); TnIO 및 ISlO(문헌[Kleckner et al., Curr Top Microbiol Immunol, 204: 49-82 (1996)]); 마리너 트랜스포사제(문헌[Lampe et al., "A purified mariner transposase is sufficient to mediate transposition in vitro," EMBO J. 15(19): 5470-5479 (1996)]); Tci(문헌[Plasterk, Curr Top Microbiol Immunol, 204: 125-143 (1996)), P Element (Gloor, "Gene targeting in Drosophila," Methods Mol Biol 260: 97-114 (2004)]); TnJ(문헌[Ichikawa et al., "In vitro transposition of transposon Tn3," J Biol Chem. 265(31): 18829-18832 (1990)]); 세균 삽입 서열(문헌[Ohtsubo et al., "Bacterial insertion sequences," Curr. Top. Microbiol. Immunol. 204:1-26 (1996)]); 레트로바이러스(문헌[Brown et al., "Retroviral integration: Structure of the initial covalent product and its precursor, and a role for the viral IN protein," Proc Natl Acad Sci USA, 86: 2525-2529 (1989)]); 및 효모의 레트로트랜스포존(문헌[Boeke et al., "Transcription and reverse transcription of retrotransposons," Annu Rev Microbiol. 43: 403-434 (1989)]).
본원에 사용된 용어 "뉴클레아제"는 폴리뉴클레오타이드의 뉴클레오타이드 하위단위들 사이의 포스포디에스테르 결합을 절단할 수 있는 효소를 의미하도록 의도된다. 용어 "엔도뉴클레아제"는 폴리뉴클레오타이드 사슬 내의 포스포디에스테르 결합을 절단할 수 있는 효소를 지칭한다.
본원에 사용된 용어 "닉카제"는 오직 DNA 듀플렉스의 단일 사슬을 절단하는 엔도뉴클레아제를 지칭한다. 일부 CRISPR-Cas 시스템은 오직 이중 가닥 폴리뉴클레오타이드의 일 가닥을 절단할 수 있으며, 따라서 CRISPR 닉카제 또는 Cas-gRNA RNP 닉카제로 지칭될 수 있다. 예를 들어, 용어 "Cas9 닉카제"는 전형적으로 Cas9 단백질의 하나의 뉴클레아제 도메인을 비활성화시킴으로써 Cas9 단백질로부터 유래된 닉카제를 지칭한다. CRISPR 닉카제의 비제한적 예는 제1 돌연변이 D10A 및 제2 돌연변이 H840A를 갖는 화농연쇄구균 Cas9를 포함한다.
"폴리펩타이드" 맥락에서, 본원에 사용된 용어 "변이체" 및 "유도체"는 아미노산 잔기의 치환, 결실, 또는 부가의 도입에 의해 변경되었던 폴리펩타이드 또는 폴리펩타이드 단편의 아미노산 서열을 포함하는 폴리펩타이드를 지칭한다. 폴리펩타이드의 변이체 또는 유도체는 폴리펩타이드의 아미노산 서열 중 일부를 보유하는 융합 단백질일 수 있다. 본원에 사용된 용어 "변이체" 또는 "유도체"는 또한 예를 들어 폴리펩타이드에 대한 임의의 유형의 분자의 공유 부착에 의해 화학적으로 변형되었던 폴리펩타이드 또는 폴리펩타이드 단편을 지칭한다. 예를 들어, 제한적이지는 않지만, 폴리펩타이드 또는 폴리펩타이드 단편은 예를 들어 글리코실화, 아세틸화, 페길화, 인산화, 아미드화, 알려진 보호/차단 기에 의한 유도, 단백질 가수 분해 절단, 세포 리간드 또는 다른 단백질에 대한 연결 등에 의해 화학적으로 변형될 수 있다. 변이체 또는 유도체는 부착된 분자의 유형 또는 위치에서 자연 발생 또는 출발 펩타이드 또는 폴리펩타이드와 상이한 방식으로 변형된다. 변이체 또는 유도체는 펩타이드 또는 폴리펩타이드 상에 자연적으로 존재하는 하나 이상의 화학기의 결실을 추가로 포함한다. 폴리펩타이드 또는 폴리펩타이드 단편의 변이체 또는 유도체는 비제한적으로 특정 화학적 절단, 아세틸화, 제형화, 튜니카마이신의 대사 합성 등을 포함하는 당업자에게 알려진 기술을 사용하는 화학적 변형에 의해 화학적으로 변형될 수 있다. 추가로, 폴리펩타이드 또는 폴리펩타이드 단편의 변이체 또는 유도체는 하나 이상의 비-전통적 아미노산을 함유할 수 있다. 폴리펩타이드 변이체 또는 유사체는 본원에 기재된 폴리펩타이드 또는 폴리펩타이드 단편과 유사하거나, 동일한 기능을 보유할 수 있다. 폴리펩타이드 변이체 또는 유사체는 본원에 기재된 폴리펩타이드 또는 폴리펩타이드 단편과 비교하여 추가 또는 상이한 기능을 가질 수 있다.
본원에 사용된 용어 "시퀀싱"은 폴리뉴클레오타이드의 서열을 결정하는 것을 의미하도록 의도된다. 시퀀싱은 합성에 의한 시퀀싱, 브릿지 PCR, 사슬 종결 시퀀싱, 혼성화에 의한 시퀀싱, 나노기공 시퀀싱, 및 결찰에 의한 시퀀싱 중 하나 이상을 포함할 수 있다.
본원에 사용된 용어 "디호스팅"은 또 다른 종의 폴리뉴클레오타이드에 대한 하나의 종의 폴리뉴클레오타이드의 선택적 비활성화 또는 분해를 의미하도록 의도된다. 예를 들어, 포유동물(예를 들어, 인간)과 같은 제1 종은 세균, 진균, 및 바이러스와 같은 수많은 다른 종에 대한 숙주로서 작용할 수 있다. 제1 종의 폴리뉴클레오타이드를 선택적으로 비활성화 또는 분해하여 하나 이상의 다른 종의 폴리뉴클레오타이드가 증폭 및 시퀀싱될 수 있도록 하는 것이 바람직할 수 있다.
본원에 사용된 요소에 대해 "선택적"인 것은 표적에는 커플링하고, 상이한 요소에는 커플링되지 않는 것을 의미하도록 의도된다. 예를 들어, 종 특이적 반복 요소에 대해 선택적인 Cas-gRNA RNP는 해당 종 특이적 반복 요소에는 커플링하고, 상이한 종 특이적 반복 요소에는 커플링하지 않을 수 있다.
본원에 사용된 용어 "종 특이적 반복 요소"는 소정의 종의 폴리뉴클레오타이드 내에서는 발생하고, 또 다른 종의 폴리뉴클레오타이드 내에서는 발생하지 않을 수 있는 반복 서열을 의미하도록 의도된다. 다수의 염색체를 갖는 종(예컨대, 포유동물, 예를 들어 인간)은 각각의 염색체 상에 상이한 종 특이적 요소를 포함할 수 있거나, 각각의 염색체 상에 동일한 종 특이적 요소를 포함할 수 있거나, 각각의 염색체 상에 동일하고, 상이한 종 특이적 요소의 혼합물을 포함할 수 있다. 종 특이적 반복 요소의 일예는 프로토스페이서 인접 모티프 또는 PAM 서열, 예컨대 NGG이다. Cas-gRNA RNP의 gRNA는 종 특이적 반복 요소에 혼성화되는 서열을 가질 수 있다.
본원에 사용된 용어 "고유한 분자 식별자" 및 "UMI"는 폴리뉴클레오타이드에 커플링될 수 있는 올리고뉴클레오타이드를 의미하도록 의도되며, 이를 통해 폴리뉴클레오타이드가 식별될 수 있다. 예를 들어, 상이한 UMI 세트가 복수의 상이한 폴리뉴클레오타이드에 커플링될 수 있으며, 각각의 이들 폴리뉴클레오타이드는 해당 폴리뉴클레오타이드에 커플링된 특정 UMI를 사용하여 식별될 수 있다.
본원에 사용된 용어 종의 "전장 게놈" 또는 "WG"는 해당 종의 세포 프로세스에 의해 사용되는 대다수의 폴리뉴클레오타이드를 함께 제공하는 하나 이상의 폴리뉴클레오타이드 세트를 의미하도록 의도된다. 종의 전장 게놈은 종의 염색체 DNA 및/또는 미토콘드리아 DNA의 임의의 적합한 조합을 포함할 수 있으며, 식물 종의 경우, 엽록체 내에 함유된 DNA를 포함할 수 있다. 하나 이상의 폴리뉴클레오타이드 세트는 함께 해당 종의 세포 프로세스에 의해 사용되는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 98%, 또는 적어도 약 99%의 폴리뉴클레오타이드를 제공할 수 있다.
본원에 사용된 용어 "단편"은 폴리뉴클레오타이드 중 일부를 의미하도록 의도된다. 예를 들어, 폴리뉴클레오타이드는 염기의 총 수 길이일 수 있고, 해당 폴리뉴클레오타이드 단편은 염기의 총 수 길이 미만일 수 있다.
본원에 사용된 용어 "샘플"은 하나 이상의 폴리뉴클레오타이드를 포함하는 방대한 유체를 의미하도록 의도된다. 샘플 내의 폴리뉴클레오타이드(들)는 전장 게놈을 포함할 수 있거나, 오직 전장 게놈 중 일부를 포함할 수 있다. 샘플은 단일 종 또는 다수의 종으로부터의 폴리뉴클레오타이드를 포함할 수 있다.
본원에 사용된 용어 "항체"는 단클론 항체(전체 길이 단클론 항체 포함), 다클론 항체, 다중 특이적 항체(예를 들어, 이중 특이적 항체), 및 항체 단편이 관심의 표적 항원 부위 및 이의 이소 형태에 결합하는 소기의 생물학적 활성을 나타내는 한, 항체 단편을 포함한다. 용어 "항체 단편"은 전체 길이 항체 중 일부, 일반적으로는 이의 항원 결합 또는 가변 영역을 포함한다. 본원에 사용된 용어 "항체"는 비제한적으로 인간 항체, 래트 항체, 마우스 항체, 토끼 항체 등을 포함하는 임의의 종 및 자원으로부터 유래된 임의의 항체를 포함하며, 합성 제조되거나, 자연 발생일 수 있다.
본원에 사용된 용어 "단클론 항체"는 실질적으로 균일한 항체 집단으로부터 수득된 항체를 지칭한다. 즉, 집단을 포함하는 개별적 항체는 소량으로 존재할 수 있는 가능한 자연 발생 돌연변이를 제외하고 동일하다. 단클론 항체는 단일 항원 부위에 대해 고도로 특이적이다. 또한, 전형적으로 상이한 결정 인자(에피토프)에 대해 상이한 항체를 포함하는 종래(다클론) 항체 조합물과 대조적으로, 각각의 단클론 항체는 항원 상의 단일 결정 인자로 향한다. "단클론 항체"는 또한 당업계에 알려진 기술을 사용하여 파지 항체 라이브러리로부터 단리될 수 있다. 다클론 항체는, 해당 용어가 본원에 사용될 때, "키메라" 항체(면역글로불린)를 포함할 수 있으며, 여기서, 중쇄 및/또는 경쇄 중 일부는 특정 종으로부터 유래되거나, 특정 항체 클래스 또는 하위 클래스에 속하는 항체에서의 상응하는 서열과 동일하거나, 균일한 한편, 사슬(들) 중 나머지는 또 다른 종으로부터 유래되거나, 또 다른 항체 클래스 또는 하위 클래스에 속하는 항체에서의 상응하는 서열뿐만 아니라 이러한 항체의 단편이 소기의 생물학적 활성을 나타내는 한, 이러한 항체의 단편과 동일하거나, 균일하다.
본원에 사용된 "표적 특이적" 및 "선택적"과 같은 용어는 가이드 RNA 또는 다른 폴리뉴클레오타이드와 관련하여 사용될 때, 또 다른 폴리뉴클레오타이드 내의 서열에 특이적인 (실질적으로 상보적이고, 이에 혼성화될 수 있는) 서열을 포함하는 폴리뉴클레오타이드를 의미하도록 의도된다.
본원에 사용된 용어 "상보적" 및 "실질적으로 상보적"은 폴리뉴클레오타이드와 관련하여 사용될 때, 폴리뉴클레오타이드가 특정 조건 하에서 또 다른 폴리뉴클레오타이드에서의 서열에 선택적으로 혼성화할 수 있는 서열을 포함함을 의미하도록 의도된다.
본원에 사용된 "증폭" 및 "증폭하다"와 같은 용어는 임의의 적합한 증폭 방법을 사용하여 폴리뉴클레오타이드의 앰플리콘을 생성하는 것을 지칭한다. 폴리머라제 사슬 반응(PCR)은 하나의 비제한적인 증폭 방법이다. 당업계에 알려진 다른 적합한 증폭은 회전 바퀴형 증폭; 리보프라이머 증폭(riboprimer amplification)(예를 들어, 미국 특허 제7,413,857호에 기재된 바와 같음); ICAN; UCAN; 리보스피아(ribospia); 말단 태깅(terminal tagging)(예를 들어, 미국 특허출원공개 US 2005/0153333호에 기재된 바와 같음); 및 에버와인 유형(Eberwine-type) aRNA 증폭 또는 가닥 치환 증폭을 포함하지만, 이로 제한되지는 않는다. 증폭 방법의 추가적인 비제한적 예는 국제 공개 WO 02/16639호; 국제 공개 WO 00/56877호; 호주 특허 AU 00/29742호; 미국 특허 제5,523,204호; 미국 특허 제5,536,649호; 미국 특허 제5,624,825호; 미국 특허 제5,631,147호; 미국 특허 제5,648,211호; 미국 특허 제5,733,752호; 미국 특허 제5,744,311호; 미국 특허 제5,756,702호; 미국 특허 제5,916,779호; 미국 특허 제6,238,868호; 미국 특허 제6,309,833호; 미국 특허 제6,326,173호; 미국 특허 제5,849,547호; 미국 특허 제5,874,260호; 미국 특허 제6,218,151호; 미국 특허 제5,786,183호; 미국 특허 제6,087,133호; 미국 특허 제6,214,587호; 미국 특허 제6,063,604호; 미국 특허 제6,251,639호; 미국 특허 제6,410,278호; 국제 공개 WO 00/28082호; 미국 특허 제5,591,609호; 미국 특허 제5,614,389호; 미국 특허 제5,773,733호; 미국 특허 제5,834,202호; 미국 특허 제6,448,017호; 미국 특허 제6,124,120호; 및 미국 특허 제6,280,949호에 기재되어 있다.
본원에 사용된 용어 "폴리머라제 사슬 반응" "PCR"은 소량의 폴리뉴클레오타이드, 예를 들어 RNA 및/또는 DNA가 증폭되는 절차를 지칭한다. 일반적으로, 증폭 프라이머는 PCR 동안 사용하기 위해 폴리뉴클레오타이드에 커플링된다. 예를 들어, 다음 참고문헌을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다: Mullis의 미국 특허 제4,683,195호; 문헌[Mullis et al., Cold Spring Harbor Symp. Quant. Biol., 51: 263 (1987)]; 및 문헌[Erlich, ed., PCR Technology, (Stockton Press, NY, 1989)]. 광범위하게 다양한 효소 및 키트가 당업자에게 알려진 PCR를 수행하기 위해 입수 가능하다. 예를 들어, 일부 예에서, PCR 증폭은 제조업체에 의해 기재된 바와 같이 미국 위스콘신주 매디슨 소재의 EPICENTRE Biotechnologies로부터의 FAILSAFE™ PCR 시스템 또는 MASTERAMP™ Extra-Long PCR 시스템을 사용하여 수행된다.
본원에 사용된 "결찰" 및 "결찰하는"과 같은 용어는 둘 이상의 폴리뉴클레오타이드의 말단들 사이에 공유 결합 또는 연결을 형성하는 것을 의미하도록 의도된다. 결합 또는 연결의 성질은 광범위하게 달라질 수 있으며, 결찰은 효소적으로 또는 화학적으로 수행될 수 있다. 결찰은 하나의 올리고뉴클레오타이드의 5' 탄소 말단 뉴클레오타이드와 또 다른 뉴클레오타이드의 3' 탄소 사이에 포스포디에스테르 연결을 형성하도록 효소적으로 수행될 수 있다. 주형 유도 결찰 반응은 다음 참고문헌에 기재되어 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 미국 특허 제4,883,750호; 미국 특허 제5,476,930호; 미국 특허 제5,593,826호; 및 미국 특허 제5,871,921호. 결찰은 또한 포스포디에스테르 결합의 비-효소적 형성 또는 포스포로티오에이트 결합, 디설파이드 결합 등과 같은 폴리뉴클레오타이드의 말단들 사이의 비-포스포디에스테르 공유 결합의 형성을 사용하여 수행될 수 있다.
본원에 사용된 용어 "기재"는 본원에 기재된 조성물에 대한 지지체로서 사용되는 재료를 지칭한다. 예시 기재 재료는 유리, 실리카, 플라스틱, 석영, 금속, 금속 산화물, 유기-실리케이트(예를 들어, 다면체 유기 실세스퀴옥산(POSS)), 폴리아크릴레이트, 산화탄탈륨, 상보적 금속 산화물 반도체(CMOS), 또는 이의 조합을 포함할 수 있다. POSS의 예는 문헌[Kehagias et al., Microelectronic Engineering 86 (2009), pp. 776-778]에 기재된 것일 수 있으며, 이는 그 전체 내용이 인용되어 포함된다. 일부 예에서, 본 출원에 사용된 기재는 유리, 용융 실리카, 또는 다른 실리카-함유 재료와 같은 실리카계 기재를 포함한다. 일부 예에서, 실리카계 기재는 규소, 이산화규소, 질화규소, 또는 실리콘 하이드라이드를 포함할 수 있다. 일부 예에서, 본 출원에 사용된 기재는 플라스틱 재료 또는 성분, 예컨대 폴리에틸렌, 폴리스티렌, 폴리(비닐 클로라이드), 폴리프로필렌, 나일론, 폴리에스테르, 폴리카보네이트, 및 폴리(메틸 메타크릴레이트)를 포함한다. 예시 플라스틱 재료는 폴리(메틸 메타크릴레이트), 폴리스티렌, 및 사이클릭 올레핀 중합체 기재를 포함한다. 일부 예에서, 기재는 실리카계 재료 또는 플라스틱 재료 또는 이의 조합이거나, 이를 포함한다. 특정 예에서, 기재는 유리 또는 규소계 중합체를 포함하는 적어도 하나의 표면을 갖는다. 일부 예에서, 기재는 금속을 포함할 수 있다. 이러한 일부 실시예에서, 금속은 금이다. 일부 예에서, 기재는 금속 산화물을 포함하는 적어도 하나의 표면을 갖는다. 일예에서, 표면은 산화탄탈륨 또는 산화주석을 포함한다. 아크릴아미드, 에논, 또는 아크릴레이트가 또한 기재 재료 또는 성분으로서 사용될 수 있다. 다른 기재 재료는 갈륨 비소, 인화인듐, 알루미늄, 세라믹, 폴리이미드, 석영, 수지, 중합체, 및 공중합체를 포함할 수 있지만, 이로 제한되지는 않는다. 일부 예에서, 기재 및/또는 기재 표면은 석영일 수 있거나, 이를 포함할 수 있다. 일부 다른 예에서, 기재 및/또는 기재 표면은 GaAs 또는 ITO와 같은 반도체일 수 있거나, 이를 포함할 수 있다. 전술한 목록은 본 출원을 예시하는 것으로 의도되며, 제한하고자 함이 아니다. 기재는 단일 재료 또는 복수의 상이한 재료를 포함할 수 있다. 기판들은 복합체 또는 라미네이트일 수 있다. 일부 예에서, 기재는 유기-실리케이트 재료를 포함한다.
기재는 평평하거나, 반구형이거나, 구형이거나, 막대형이거나, 또는 임의의 다른 적합한 형태일 수 있다. 기재는 강성 또는 가요성일 수 있다. 일부 실시예에서, 기재는 비드 또는 플로우 셀이다.
기재는 기재의 하나 이상의 표면 상에서 패턴화되지 않거나, 텍스처화되거나, 패턴화될 수 있다. 일부 예에서, 기재는 패턴화된다. 이러한 패턴은 포스트(post), 패드, 웰, 리지(ridge), 채널, 또는 다른 3차원의 오목하거나, 볼록한 구조를 포함할 수 있다. 패턴은 기재 표면 전체에 걸쳐 규칙적이거나, 불규칙적일 수 있다. 패턴은 예를 들어 나노임프린트 리소그래피(nanoimprint lithography)에 의해 또는 예를 들어 비금속 표면 상에 특징부를 형성하는 금속 패드의 사용에 의해 형성될 수 있다.
일부 예에서, 본원에 기재된 기재는 플로우 셀 중 적어도 일부를 형성하거나, 플로우 셀 내에 위치하거나, 이에 커플링된다. 플로우 셀은 복수의 레인 또는 복수의 섹터로 분할되는 플로우 챔버를 포함할 수 있다. 본원에 제시된 방법 및 조성물에 사용될 수 있는 예시 플로우 셀 및 플로우 셀의 제조를 위한 기재는 Illumina, Inc.(미국 캘리포니아주 샌디에이고 소재)로부터 상업적으로 입수 가능한 것들을 포함하지만, 이로 제한되지는 않는다.
Cas-gRNA RNP 매개 디호스팅을 위한 조성물 및 방법
본원의 일부 예는 Cas-gRNA RNP 매개 디호스팅에 관한 것이다. 예를 들어, 도 1a 내지 도 1k는 Cas-gRNA RNP 매개 디호스팅에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다.
보다 복잡한 종, 예시적으로 포유동물은 복수의 다른 보다 단순한 종, 예컨대 세균, 진균, 및 바이러스를 호스팅할 수 있다. 호스팅되고 있는 종의 폴리뉴클레오타이드(예컨대, DNA)를 시퀀싱하는 것이 바람직할 수 있지만, 숙주 종의 폴리뉴클레오타이드로부터 이러한 폴리뉴클레오타이드를 충분히 분리하는 것은 어려울 수 있다. 예를 들어, 숙주로부터의 체액 또는 조직으로부터 정제된 폴리뉴클레오타이드 샘플은 주로 숙주로부터의 폴리뉴클레오타이드(예를 들어, 약 99% 이상) 및 다른 종으로부터의 상대적으로 적은 양의 폴리뉴클레오타이드(예를 들어, 약 1% 이하)를 포함할 수 있다. 따라서, 해당 샘플을 시퀀싱하는 것은 주로 숙주의 서열을 수득할 수 있으며, 다른 종의 서열에 대해서는 상대적으로 정보를 거의 수득하지 않을 수 있다. 본원에 제공된 바와 같이, 소정의 종(예컨대, 숙주)의 폴리뉴클레오타이드는 해당 샘플 내의 하나 이상의 다른 종의 폴리뉴클레오타이드를 시퀀싱하는 능력을 강화하기 위한 이러한 방식으로 샘플로부터 제거될 수 있다.
예를 들어, 도 1a에 나타낸 바와 같이, 제1 종으로부터 수득된 샘플은 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 하나 이상의 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물을 포함할 수 있다. 예시적으로, 제1 종(S1)은 세균, 진균, 및 바이러스(S2, S3 등)와 같은 수많은 다른 종에 대한 숙주로서 작용할 수 있는 포유동물(예를 들어, 인간)일 수 있다. 도 1a에 나타낸 비제한적 예에서, 조성물(101)은 제1 종으로부터의 폴리뉴클레오타이드(S1-1, S1-2, S1-3); 제2 종으로부터의 폴리뉴클레오타이드(S2-1); 및 제3 종으로부터의 폴리뉴클레오타이드(S3-1)의 혼합물을 포함한다. 제1 종으로부터의 각각의 폴리뉴클레오타이드(S1-1, S1-2, S1-3)는 도 1a에 예시된 바와 같은 종 특이적 반복 요소(140)를 포함할 수 있다. 예를 들어, 제1 종이 포유동물인 경우, 해당 종으로부터의 폴리뉴클레오타이드는 포유동물 특이적 반복 요소를 포함할 수 있다. 예를 들어, 제1 종이 인간인 경우, 해당 인간으로부터의 각각의 폴리뉴클레오타이드는 하나 이상의 인간 특이적 반복 요소(140)를 포함할 수 있다.
각각의 소정의 종으로부터의 농도, 수, 및 유형은 각각의 특정 샘플에 대해 달라질 수 있음이 인식될 것이다. 예를 들어, 제1 종이 제2 및 제3 종에 대한 숙주인 경우, 샘플은 제2 및 제3 종보다 제1 종으로부터의 유의하게 더 높은 농도의 폴리뉴클레오타이드를 함유할 수 있다. 추가적으로, 제1 종은 더 높은 유전적 복잡성을 가질 수 있으며, 예를 들어, 인간에 대한 23개의 상대적으로 긴 염색체 S1-1, S1-2, S1-3…S1-23과 같은 다수의 폴리뉴클레오타이드를 갖는 게놈을 포함할 수 있는 한편, 제2 및/또는 제3 종은 유전적으로 더 단순할 수 있으며, 예를 들어 오직 단일의 상대적으로 짧은 폴리뉴클레오타이드를 갖는 게놈을 포함할 수 있다. 추가적으로, 혼합물 중의 하나 이상의 종의 폴리뉴클레오타이드(들)는, 이들 종이 생체내에서의 정상적인 생리학적 프로세스 동안 전형적으로 사용될 것보다 더 짧은 조각으로 생체외에서 단편화될 수 있다. 추가적으로, 혼합물 중의 하나 이상의 종의 폴리뉴클레오타이드(들)는 원형(예컨대, S3-1)일 수 있으며, 따라서 임의의 말단을 갖지 않을 수 있다.
도 1a에 예시된 바와 같이, 혼합물 중의 각각의 폴리뉴클레오타이드는 이중 가닥일 수 있다. 예를 들어, 폴리뉴클레오타이드(S1-1)는 제1 가닥(111) 및 상보적 제2 가닥(111')을 포함할 수 있고; 폴리뉴클레오타이드(S1-2)는 제1 가닥(112) 및 상보적 제2 가닥(112')을 포함할 수 있고; 폴리뉴클레오타이드(S1-3)는 제1 가닥(113) 및 상보적 제2 가닥(113')을 포함할 수 있고; 폴리뉴클레오타이드(S2-1)는 제1 가닥(121) 및 상보적 제2 가닥(121')을 포함할 수 있고; 폴리뉴클레오타이드(S3-1)는 제1 가닥(131) 및 상보적 제2 가닥(131')을 포함할 수 있다. 일부 예에서, 제1, 제2, 및/또는 제3 종으로부터의 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함할 수 있다.
제1 이중 가닥 폴리뉴클레오타이드의 말단 및 존재하는 경우, 제2 이중 가닥 폴리뉴클레오타이드의 말단은 보호될 수 있다. 예를 들어, 도 1b에 예시된 바와 같이, 조성물(102)은 혼합물 중의 이중 가닥 폴리뉴클레오타이드의 임의의 말단을 보호하는 보호 요소(150)를 포함한다. 예시적으로, 보호 요소(150)는 제1 종의 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3)의 말단 및 제2 종으로부터의 폴리뉴클레오타이드(S2-1)의 말단에 커플링되고, 이를 보호한다. 제3 종의 폴리뉴클레오타이드(S3-1)는 원형이기 때문에, 이러한 폴리뉴클레오타이드는 보호 요소(150)가 커플링될 수 있는 임의의 말단(들)을 갖지 않을 수 있다. 보호 요소(150)는 이러한 보호 요소가 커플링되는 이중 가닥 폴리뉴클레오타이드의 말단 상에 하나 이상의 효소(예컨대, 엑소뉴클레아제)의 작용을 억제하는 임의의 적합한 화학적 모이어티를 포함할 수 있다. 예를 들어, 도 1b의 삽입부에 예시된 바와 같이, 보호 요소(150)는 변형된 염기(151), 말단에 결찰되는 헤어핀 어댑터(152), 또는 5' 탈인산화 말단을 포함할 수 있다. 변형된 염기(151)는 예를 들어 포스포로티오에이트 결합 또는 3' 포스페이트를 포함할 수 있으며, 말단 트랜스퍼라제를 사용하여 부가될 수 있다. 헤어핀 어댑터(152)는 서로 혼성화되는 줄기 서열 및 줄기 서열들 사이에 연장되는 루프 서열을 포함하는 올리고뉴클레오타이드를 포함할 수 있으며, 당업계에 알려진 바와 같은 방식, 예를 들어 임의의 오버행을 충전하는 말단 복구를 수행하고, 이어서 A 오버행("A-테일")을 부가하고(예를 들어, 클레나우 단편 엑소-와 같은 엑소뉴클레아제 사용), 이후 헤어핀 어댑터(152)를 말단에 결찰하는 것에 의해 부가될 수 있다. 이중 가닥 폴리뉴클레오타이드의 5' 말단은 적합한 포스페이트 효소를 사용하여 탈인산화될 수 있다.
제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호한 후, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단이 선택적으로 생성될 수 있다. 예를 들어, 도 1c는 Cas-gRNA RNP(160)가 제1 이중 가닥 폴리뉴클레오타이드 내에 존재하고, 제2 이중 가닥 폴리뉴클레오타이드 내에 존재하지 않는 서열, 예를 들어 종 특이적 반복 요소(140)에 혼성화하는 조성물(103)을 예시한다. 서열은 이어서 Cas-gRNA RNP로 절단되어 조성물(104)을 포함하여 도 1d예 예시된 바와 같은 방식으로 자유 말단을 생성할 수 있으며, 여기서, 자유 말단(141, 141')은 폴리뉴클레오타이드(S1-1) 가닥에서 생성되고, 자유 말단(142, 142')은 폴리뉴클레오타이드(S1-2) 가닥에서 생성되고, 자유 말단(143, 143')은 폴리뉴클레오타이드(S1-3) 가닥에서 생성되지만, 자유 말단은 폴리뉴클레오타이드(S2-1 및 S3-1)에서는 생성되지 않으며, 이는 이들 폴리뉴클레오타이드가 Cas-gRNA RNP(160)가 선택적으로 혼성화하는 종 특이적 반복 요소(150)를 포함하지 않았기 때문이다. Cas는 예를 들어 Cas9를 포함할 수 있다.
제1 이중 가닥 폴리뉴클레오타이드는 이후 Cas-gRNA RNP(160)에 의해 생성되었던 자유 말단으로부터 보호된 말단을 향해 분해될 수 있다. 예를 들어, 도 1e에 예시된 조성물(105)은 제1 이중 가닥 폴리뉴클레오타이드(S1-1, S1-2, S1-3)를 분해하기 위한 엑소뉴클레아제(170)를 포함한다. 임의의 적합한 엑소뉴클레아제(170)가 사용될 수 있다. 예시적으로, 자유 말단은 도 1e의 삽입부의 상부 부분에서 나타낸 바와 같은 방식으로 3' 말단을 포함할 수 있으며, 제1 이중 가닥 폴리뉴클레오타이드(S1-1, S1-2, S1-3)는 엑소뉴클레아제 III을 사용하여 분해될 수 있다. 또 다른 순수하게 예시적 예로서, 자유 말단은 도 1e의 삽입부의 하부 부분에서 나타낸 바와 같은 방식으로 5' 말단을 포함할 수 있으며, 각각의 제1 이중 가닥 폴리뉴클레오타이드(S1-1, S1-2, S1-3)의 일 가닥은 람다 엑소뉴클레아제를 사용하여 분해될 수 있다. 사용되는 보호 요소(150)의 특정 유형에 따라, 엑소뉴클레아제의 사용은 각각의 폴리뉴클레오타이드(S1-1, S1-2, S1-3)의 양쪽 가닥이 분해되는 도 1f에 예시된 조성물(106) 또는 폴리뉴클레오타이드(S1-1, S1-2, S1-3)가 단일 가닥이 되는 도 1g에 예시된 조성물(107)을 수득할 수 있다. 예시적으로, 보호 요소(150)가 헤어핀 올리고뉴클레오타이드를 포함하는 경우, 이어서 일 가닥이 분해된 후, 엑소뉴클레아제는 헤어핀을 따라 다른 가닥을 분해하여 양쪽 가닥을 분해할 수 있다. 또 다른 예로서, 보호 요소(150)가 변형된 염기 또는 5'-탈인산화 염기를 포함하는 경우, 이어서 엑소뉴클레아제가 일 가닥을 분해한 후, 보호 요소는 엑소뉴클레아제가 다른 가닥을 분해하는 것을 억제할 수 있다. 사용되는 특정 엑소뉴클레아제 및 제1 종의 폴리뉴클레오타이드가 완전히 분해되거나, 단일 가닥이 되는지 여부와 상관없이, 폴리뉴클레오타이드(S2-1 및 D3-1)는 엑소뉴클레아제에 의해 분해되지 않을 수 있으며, 이는 폴리뉴클레오타이드(S2-1)의 말단이 보호 요소(150)에 의해 보호되고, 폴리뉴클레오타이드3(S3-1)은 말단이 없기 때문이다.
제1 종의 폴리뉴클레오타이드의 분해 이후, 증폭 어댑터가 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드의 말단에 결찰될 수 있다. 예를 들어, 도 1h는 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3)가 분해되고(예를 들어, 양쪽 가닥이 도 1f에 예시된 바와 같이 분해되거나, 폴리뉴클레오타이드는 도 1g 및 도 1h에 예시된 바와 같이 단일 가닥이 됨), 보호기(150)가 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드, 예를 들어 폴리뉴클레오타이드(S2-1)로부터 제거되는 조성물(108)을 예시한다. 제1 종의 폴리뉴클레오타이드의 임의의 잔여 부분에 커플링된 임의의 잔여 보호기(150)가 또한 제거될 수 있다. 도 1i에 예시된 바와 같이, 임의의 원형 폴리뉴클레오타이드(예를 들어, 제3 종의 S3-1)는 예를 들어 태그먼트화, 전단, 또는 다른 적합한 단편화 기술을 사용하여 열릴 수 있으며, 이는 또한 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드, 예를 들어 S2-1을 단편화할 수 있다. 이어서, 증폭 어댑터가 잔여 이중 가닥 폴리뉴클레오타이드, 예를 들어 제2 및 제3 종의 것들에 결찰될 수 있거나, 잔여 이중 가닥 폴리뉴클레오타이드는 태그화되어 도 1j에 예시된 조성물(109)을 수득할 수 있다. 조성물(109)은 제1 종으로부터의, 실질적으로 오직 단일 가닥 폴리뉴클레오타이드(S1-1, S1-2, S1-3)를 포함하고; 제2 및/또는 제3 종으로부터의, 실질적으로 오직 이중 가닥 폴리뉴클레오타이드(S2-1, S3-1); 및 제2 이중 가닥 폴리뉴클레오타이드(S2-1, S3-1)의 단편 말단에 결찰되고, 제1 이중 가닥 폴리뉴클레오타이드(S1-1, S1-2, S1-3)의 임의의 말단에 실질적으로 결찰되지 않은 증폭 프라이머(180)를 포함한다. 제1 종의 폴리뉴클레오타이드가 도 1f와 관련하여 기재된 바와 같은 방식으로 완전히 분해되는 경우, 조성물(109)은 대신에 제1 종으로부터의 임의의 폴리뉴클레오타이드를 포함하지 않을 수 있음이 인식될 것이다. 도 1j에 예시된 바와 같은 방식으로, 증폭 어댑터(180)는 Y-형상일 수 있으며, 예컨대 다음 참고문헌에 기재된 것과 같은 고유한 분자 식별자(UMI)를 포함할 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함한다: 문헌[Kennedy et al., "Detecting ultralow-frequency mutations by Duplex Sequencing," Nat Protoc. 9: 2586-2606 (2014)]; 및 문헌[Kivioja et al., "Counting absolute numbers of molecules using unique molecular identifiers," Nature Methods 9:72-42 (2012)]. 이중 가닥 폴리뉴클레오타이드(S2-1 및 S3-1)는 이후 제1 종으로부터의 임의의 폴리뉴클레오타이드를 실질적으로 시퀀싱하지 않으면서 증폭(예를 들어, PCR 사용) 및 시퀀싱될 수 있다. 따라서, 폴리뉴클레오타이드(S2-1 및 S3-1)의 서열은 제2 및 제3 종을 호스팅할 수 있었던 제1 종으로부터의 상대적으로 적은 백그라운드 신호 또는 심지어 실질적으로 백그라운드 신호 없이 수득될 수 있다.
제1 종의 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3)가 이들 폴리뉴클레오타이드가 증폭 및 시퀀싱에 이용 가능하지 않도록 반드시 완전히 분해될 필요는 없음을 유의한다. 예를 들어, 증폭 어댑터(180)는 임의의 이중 가닥 폴리뉴클레오타이드에 선택적으로 결찰되고, 따라서 임의의 단일 가닥 폴리뉴클레오타이드에는 실질적으로 결찰되지 않도록 구성될 수 있다. 따라서, 증폭 어댑터가 결찰되었던 혼합물 중의 임의의 이중 가닥 폴리뉴클레오타이드는 증폭 및 이어서 시퀀싱될 수 있는 반면, 임의의 단일 가닥 폴리뉴클레오타이드는 적합한 증폭 어댑터가 없기 때문에 증폭되지 않을 수 있다. 예시적으로, 태그먼트화는 오직 dsDNA에 어댑터를 부가할 수 있고, ssDNA에는 어댑터를 부가하지 않을 수 있다. 또 다른 예로서, T4 DNA 리가제는 오직 dsDNA에 대해 작동할 수 있다. 이와 관련하여, 증폭 어댑터(180)는 이러한 접근법에서 블런트이거나, A 테일일 수 있음을 유의한다.
도 1k는 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물의 처리 방법에서의 예시 작업 흐름을 예시한다. 도 1k에 예시된 방법(1000)은 혼합물 중의 제1 이중 가닥 폴리뉴클레오타이드의 말단 및 제2 이중 가닥 폴리뉴클레오타이드의 임의의 말단을 보호하는 단계(작업(1001))를 포함할 수 있다. 예를 들어, 도 1b와 관련하여 기재된 바와 같은 방식으로, 보호 요소(150)는 제1 이중 가닥 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3) 및 제2 이중 가닥 폴리뉴클레오타이드(S2-1)의 말단에 부가될 수 있는 한편, 이중 가닥 폴리뉴클레오타이드(S3-1)는 말단이 없으며, 따라서 보호 요소(150)에 커플링되지 않을 수 있다.
도 1k에 예시된 방법(1000)은 또한 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호한 후, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단을 선택적으로 생성하는 단계(작업(1002))를 포함할 수 있다. 예를 들어, 도 1c와 관련하여 기재된 바와 같은 방식으로, Cas-gRNA RNP(160)는 제1 종의 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3) 내에 존재하고, 제2 종의 폴리뉴클레오타이드(S2-1)(또는 제3 종의 폴리뉴클레오타이드(S3-1)) 내에 존재하지 않는 서열, 예컨대 종 특이적 반복 요소에 선택적으로 혼성화될 수 있다. Cas-gRNA RNP(160)는 제1 종의 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3)를 절단하여 도 1d와 관련하여 기재된 바와 같은 자유 말단을 생성할 수 있다. 도 1k에 예시된 방법(1000)은 또한 제1 이중 가닥 폴리뉴클레오타이드를 자유 말단으로부터 보호된 말단을 향해 분해하는 단계(작업(1003))를 포함할 수 있다. 예를 들어, 도 1e 내지 도 1g와 관련하여 기재된 바와 같은 방식으로, 엑소뉴클레아제가 사용되어 각각의 자유 말단(141, 141', 142, 142', 및 143, 143')으로부터 제1 종의 폴리뉴클레오타이드(S1-1, S1-2, 및 S1-3)를 분해할 수 있다. 증폭 어댑터가 이후 도 1i 내지 도 1j와 관련하여 기재된 바와 같은 방식으로 제2 종의 폴리뉴클레오타이드(S2-1)에 커플링될 수 있고(증폭 어댑터를 부가하기 전에 선택적으로 단편화 포함), 폴리뉴클레오타이드는 이어서 증폭 및 시퀀싱된다.
따라서, 본원에 제공된 바와 같이, Cas-gRNA RNP가 사용되어 소기의 종의 폴리뉴클레오타이드에서 자유 말단을 선택적으로 생성할 수 있으며, 증폭 및 시퀀싱될 수 있는 하나 이상의 다른 종의 폴리뉴클레오타이드를 위해 이들 폴리뉴클레오타이드는 이후 이들을 실질적으로 증폭 또는 시퀀싱에 이용 가능하지 않도록 만드는 이러한 방식으로 분해된다.
상이한, 정의된 단편 크기로의 전장 게놈(WG)의 단편화
본원의 일부 예는 상이한, 정의된 단편 크기로의 전장 게놈(WG)의 단편화에 관한 것이다. 예를 들어, 도 2a 내지 도 2k는 상이한, 정의된 단편 크기로의 WG 단편화에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 도시한다.
종에 따라, 해당 종의 WG는 잘 정의된 수의 염색체를 포함한다. 각각의 인간 염색체의 일반적 서열은 잘 특성 규명되었으나, 각각의 개체의 염색체의 서열은 해당 개체에 특이적인 유전자 변이를 포함한다. 추가적으로, 예를 들어, 개체가 해당 개체의 정상적 조직과 상이한 유전자 변이를 갖는 종양을 갖는 경우, 하나 이상의 염색체에 대한 서열은 때때로 심지어 개체 내에서 달라질 수 있다. 종양은 심지어 상이한 위치에서 상이한 유전자 변이를 가질 수 있다. 이들 및 다른 유형의 유전자 변이는 WG 시퀀싱을 수행하는 것이 바람직하도록 만든다. 전형적으로, WG 시퀀싱은 개체로부터의 혈액 또는 다른 체액 또는 조직의 분취액을 수득하는 단계, 해당 분취액 내의 DNA를 정제하는 단계, 및 이어서 해당 DNA를 시퀀싱하기에 적합한 크기의 것인 더 작은 단편으로 단편화하는 단계에 의해 시작한다. DNA를 시퀀싱하는 데 사용되는 특정 기기에 따라, 오직 특정 크기 범위(예를 들어, 약 100개 내지 약 1000개의 염기쌍)의 단편이 적합하게는 시퀀싱될 수 있다. 그러나, 기계적 프로세스, 예컨대 초음파 처리 또는 효소적 단편화를 사용하는 이전에 알려진 DNA 단편화 방법은 상대적으로 광범위한 분포의 상이한 단편 크기를 생성한다. 해당 분포(예를 들어, 약 20%) 내의 단편의 오직 작은 부분이 시퀀싱에 적합한 범위의 크기를 가질 수 있으며, WG의 나머지 부분(예를 들어, 약 80%)은 폐기될 수 있다. 본원에 제공된 바와 같이, WG - 또는 임의의 적합한 폴리뉴클레오타이드 또는 폴리뉴클레오타이드 집합 -은 임의의 소기의 수의 상이한 단편 크기로 단편화될 수 있으며, 각각의 단편 크기는 상대적으로 잘 제어될 수 있다.
예를 들어, 도 2a에 예시된 바와 같이, 소정의 종의 염색체 중 일부 또는 심지어 전부를 포함하는 WG의 제1 정제된 샘플(201)이 수득될 수 있다. 도 2a에 예시된 비제한적 예에서, 샘플(201)은 인간의 WG를 포함하며, 따라서 23개의 DNA 염색체(C1, C2, …C23)를 포함한다. 본원에 제공된 바와 같이 처리될 수 있는 소정의 샘플은 임의의 적합한 수의 임의의 적합한 유형의 폴리뉴클레오타이드를 포함할 수 있음이 인식될 것이다. 샘플(201) 내의 염색체(C1, C2, …C23)는 이들의 길이를 따라 상이한 서열(210, 220)을 포함하며, 이들 서열의 상이한 부분은 사용되는 Cas-gRNA RNP를 위한 사전 정의된 표적으로 사용되어 대략 균일한 크기의 단편을 형성하기 위해 대략 균일한 간격의 위치에서 염색체를 절단할 수 있다. 예시적으로, 제1 서열(210)은 대략 제1 염기쌍 수만큼 서로 이격될 수 있고, 제2 서열(220)은 대략 제2 염기쌍 수만큼 서로 이격될 수 있다. 서열(210)은 각각의 개별적 위치에서 동일한 특정 서열을 포함할 필요가 없으며, 유사하게 서열(220)은 각각의 개별적 위치에서 동일한 특정 서열을 포함할 필요가 없음을 유의한다. 대신에, 서열(210)은 제1 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용되는 상이한 염색체 내의 제1 세트의 선택된 위치를 나타내며, 각각의 RNP는 서열(210)의 특이적 하나를 표적으로 할 수 있고, 서열(220)은 제2 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용되는 상이한 염색체 내의 제2 세트의 선택된 위치를 나타내며, 각각의 RNP는 서열(220)의 특이적 하나를 표적으로 할 수 있다.
도 2b에 예시된 조성물(202)은 제1 서열(210)에 혼성화되는 제1 세트의 Cas-gRNA RNP(251)를 포함하고, 제2 서열(220)에 혼성화되는 제2 세트(252)의 Cas-gRNA RNP(252)를 포함한다. 제1 세트(251)및 제2 세트(252)의 Cas-gRNA RNP는 각각 샘플 내의 제1 및 제2 서열을 절단하여, 각각 서로 대략 동일한 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것일 수 있다. Cas는 Cas9를 포함할 수 있다. 제1 세트(251)및 제2 세트(252)의 Cas-gRNA RNP는 각각 임의의 적합한 수의 Cas-gRNA RNP를 포함할 수 있다. 제1 세트(251)의 RNP 중 각각의 소정의 하나는 제1 세트 또는 제2 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210 또는 220)을 표적으로 할 수 있거나, 제1 세트 또는 제2 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다. 유사하게, 제2 세트(252)의 RNP 중 각각의 소정의 하나는 제1 세트 또는 제2 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210 또는 220)을 표적으로 할 수 있거나, 제1 세트 또는 제2 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다.
각각의 제1 및 제2 세트(251, 252)의 Cas-gRNA RNP에서의 RNP의 수는 적합하게는 소기의 폴리뉴클레오타이드(예를 들어, 하나 이상의 이중 가닥 DNA 염색체 또는 이중 가닥 DNA 염색체의 전체 세트)를 단편화하도록 선택될 수 있다. 예시적으로, 제1 세트(251)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다. 예시적으로, 제2 세트(252)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다.
도 2c에 예시된 조성물(203)은 제1 세트(251) 및 제2 세트(252)의 Cas-gRNA RNP에 의한 이러한 절단으로부터 비롯되며, 단편 세트(260)를 포함하거나, 이로 본질적으로 구성되고, 각각은 대략 X개의 염기쌍을 포함한다. 따라서, 실질적으로 제1 샘플(201) 내의 전체 WG(또는 임의의 적합한 폴리뉴클레오타이드(들))는 정의된 크기의 단편(260)으로 단편화될 수 있다. 제1 및 제2 세트(251, 252)의 Cas-gRNA RNP에 의해 각각 표적화되는 염색체(C1, C2, …C23)를 따라 서열(210, 220)의 특정 위치는 임의의 적합한 길이의 단편(260)을 제공하도록 선택될 수 있음이 인식될 것이다. 이러한 특정 예에서, 서열(210)이 이격되는 제1 염기쌍 수는 서열(220)에 의한 제2 염기쌍 수와 대략 동일하여 서열(210 및 220)이 실질적으로 각각의 염색체의 길이를 따라 교호되도록 한다. 예시적으로, 제1 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 500개 내지 약 700개)일 수 있고, 제2 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 500개 내지 약 700개)일 수 있거나, 제1 염기쌍 수는 약 1000개의 염기쌍 내지 약 3000개의 염기쌍(예시적으로, 약 2000개의 염기쌍)일 수 있고, 제1 염기쌍 수는 약 1000개의 염기쌍 내지 약 3000개의 염기쌍(예시적으로, 약 2000개의 염기쌍)일 수 있다.
서열(210 및 220)이 집합적으로 적합하게는 사전 정의되고, 상대적으로 균일한 간격의 위치에 존재하기 때문에, 각각의 단편(260)에서의 염기쌍 수는 상대적으로 엄격한 분포를 가질 수 있다. 예를 들어, WG 단편(260)에서의 염기쌍 수는 약 20% 미만, 또는 약 10% 미만, 또는 약 5% 미만, 또는 약 2% 미만, 또는 심지어 약 1% 미만만큼 달라질 수 있다. 각각의 WG 단편(260)에서의 염기쌍 수(X)는 예시적으로 약 100개의 염기쌍 및 약 1000개의 염기쌍, 예를 들어 약 200개의 염기쌍 내지 약 400개의 염기쌍(예를 들어, 약 300개의 염기쌍)일 수 있거나, 약 1000개의 염기쌍 및 약 3000개의 염기쌍(예시적으로, 약 2000개의 염기쌍)일 수 있다.
제1 및/또는 제2 세트의 Cas-gRNA RNP는 다른 길이를 갖는 WG 단편을 생성하는 데 사용될 수 있음을 유의한다. 실제로, 소정의 WG의 경우, 서로 상이한 정의된 길이를 갖는 단편을 생성하고, 이어서 이러한 각각의 상이한 정의된 길이를 사용하여 수득되는 서열을 비교하는 것이 바람직할 수 있다. 본원에 제공된 바와 같이, 상이한 단편 길이는 WG의 상이한 샘플(또는 다른 폴리뉴클레오타이드의 상이한 샘플) 내에서 생성될 수 있다. 예를 들어, 도 2d에 예시된 바와 같이, WG의 제2 정제된 샘플(204)은 도 2a에 예시된 샘플(201)과 같이, 대략 제1 염기쌍 수만큼 서로 이격된 제1 서열(210) 및 대략 제2 염기쌍 수만큼 서로 이격된 제2 서열(220)을 갖는 23개의 DNA 염색체(C1, C2, …C23)를 포함하여 수득될 수 있다. 도 2a에 구체적으로 예시되지는 않았지만, 염색체(C1, C2, …C23)는 제1 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용될 수 있는 상이한 염색체 내의 다른 세트의 선택된 위치를 나타낼 수 있는 다른 서열을 포함할 수 있다. 예를 들어, 도 2d에 예시된 서열(230)은 제3 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용되는 상이한 염색체 내의 제3 세트의 선택된 위치를 나타내며, 각각의 RNP는 서열(230)의 특이적 하나를 표적으로 할 수 있다.
도 2e에 예시된 조성물(205)은 제1 서열(210)에 혼성화된 제1 세트의 Cas-gRNA RNP(251) 및 제2 서열(220)에 혼성화된 제2 세트(252)의 Cas-gRNA RNP(252)뿐만 아니라 제3 서열(230)에 혼성화된 제3 세트의 Cas-gRNA RNP(253)를 포함한다. 도 2b와 관련하여 기재된 것과 유사한 방식으로, 제1 세트(251), 제2 세트(252), 및 제3 세트(253)의 Cas-gRNA RNP는 각각 샘플 내의 제1, 제2, 및 제3 서열을 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하기 위한 것일 수 있다. Cas는 Cas9를 포함할 수 있다. 도 2b와 관련하여 기재된 것과 유사한 방식으로, 제1 세트(251), 제2 세트(252), 및 제3 세트(253)의 Cas-gRNA RNP는 각각 임의의 적합한 수의 Cas-gRNA RNP를 포함할 수 있다. 제1 세트(251)의 RNP 중 각각의 소정의 하나는 제1 세트, 제2 세트, 또는 제3 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210, 220, 또는 230)을 표적으로 할 수 있거나, 제1 세트, 제2 세트, 또는 제3 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다. 유사하게, 제2 세트(252)의 RNP 중 각각의 소정의 하나는 제1 세트, 제2 세트, 또는 제3 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210, 220, 또는 230)을 표적으로 할 수 있거나, 제1 세트, 제2 세트, 또는 제3 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다. 유사하게, 제3 세트(253)의 RNP 중 각각의 소정의 하나는 제1 세트, 제2 세트, 또는 제3 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210, 220, 또는 230)을 표적으로 할 수 있거나, 제1 세트, 제2 세트, 또는 제3 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다.
각각의 제1, 제2, 또는 제3 세트(251, 252, 253)의 Cas-gRNA RNP에서의 RNP의 수는 적합하게는 소기의 폴리뉴클레오타이드(예를 들어, 하나 이상의 이중 가닥 DNA 염색체 또는 이중 가닥 DNA 염색체의 전체 세트)를 단편화하도록 선택될 수 있다. 예시적으로, 제1 세트(251)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 염색체, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다. 예시적으로, 제2 세트(252)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 염색체, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다. 예시적으로, 제3 세트(253)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 염색체, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다.
도 2f에 예시된 조성물(206)은 제1 세트(251), 제2 세트(252), 및 제3 세트(253)의 Cas-gRNA RNP에 의한 이러한 절단으로부터 비롯되며, 단편 세트(270)를 포함하거나, 이로 본질적으로 구성되고, 각각은 대략 Y개의 염기쌍(X ≠ Y)을 포함한다. 따라서, 실질적으로 제2 샘플(204) 내의 전체 WG(또는 임의의 적합한 폴리뉴클레오타이드(들))는 정의된 크기의 단편(270)으로 단편화될 수 있다. 제1, 제2, 및 제3 세트(251, 252, 253)의 Cas-gRNA RNP에 의해 각각 표적화되는 염색체(C1, C2, …C23)를 따라 서열(210, 220, 230)의 특정 위치는 임의의 적합한 길이의 단편(270)을 제공하도록 선택될 수 있음이 인식될 것이다. 이러한 특정 예에서, 서열(210)이 이격되는 제1 염기쌍 수는 서열(220)에 의한 제2 염기쌍 수와 대략 동일하여 서열(210 및 220)이 도 2a 내지 도 2c와 관련하여 기재된 것과 유사한 방식으로 실질적으로 각각의 염색체의 길이를 따라 교호되도록 한다. 그러나, 서열(230)이 이격되는 제3 염기쌍 수는 제1 및/또는 제2 염기쌍 수와 상이할 수 있다. 따라서, 서열(210 및 220)은 각각의 염색체의 길이를 따라 실질적으로 교호될 수 있지만, 서열(230)은 도 2e에 예시된 바와 같은 방식으로 서열(210 및 220)의 상이한 것들 사이에 규칙적으로 삽입될 수 있다. 예시적으로, 제1 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 500개 내지 약 700개)일 수 있고, 제2 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 500개 내지 약 700개)일 수 있고, 제3 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 200개 내지 약 400개)일 수 있거나, 제1 염기쌍 수는 약 1000개 내지 약 3000개(예를 들어, 약 2000개)일 수 있고, 제2 염기쌍 수는 약 1000개 내지 약 3000개(예를 들어, 약 2000개)일 수 있고, 제3 염기쌍 수는 약 500개 내지 약 2000개(예를 들어, 약 1000개)일 수 있다.
서열(210, 220, 230)이 집합적으로 적합하게는 사전 정의되고, 상대적으로 균일한 간격의 위치에 존재하기 때문에, 각각의 단편(270)에서의 염기쌍 수는 상대적으로 엄격한 분포를 가질 수 있다. 예를 들어, WG 단편(270)에서의 염기쌍 수는 약 20% 미만, 또는 약 10% 미만, 또는 약 5% 미만, 또는 약 2% 미만, 또는 심지어 약 1% 미만만큼 달라질 수 있다. 각각의 WG 단편(270)에서의 염기쌍 수(Y)는 예시적으로 약 100개의 염기쌍 및 약 1000개의 염기쌍, 예를 들어 약 100개의 염기쌍 내지 약 200개의 염기쌍(예를 들어, 약 150개의 염기쌍)일 수 있다.
샘플(201)을 사용하여 수행된 처리를 샘플(204)을 사용하여 수행된 처리에 대해 비교하면, 동일한 세트의 Cas-gRNA RNP를 사용하여 서로 상이한 길이를 갖는 WG 단편을 생성할 수 있음이 인식될 수 있다. 예를 들어, 제1 및 제2 세트(251, 252)의 Cas-gRNA RNP는 길이 X를 갖는 단편(260)을 생성하는 데 사용할 수 있으며, 또한 길이 Y(X ≠ Y)를 갖는 단편(270)을 생성하는 데 사용될 수 있다(제3 세트(253)의 Cas-gRNA RNP와 조합하여). 제1, 제2, 및/또는 제3 세트의 Cas-gRNA RNP는 유사하게 또 추가의 상이한 세트의 Cas-gRNA RNP를 제공할 필요 없이 WG의 다른 샘플에 대해 또 다른 정의된 길이의 단편을 생성하는 데 사용될 수 있다.
예를 들어, 도 2g에 예시된 바와 같이, WG의 제3 정제된 샘플(207)이 도 2a에 예시된 샘플(201) 및 도 2d에 예시된 샘플(204)과 같이, 대략 제1 염기쌍만큼 서로 이격된 제1 서열(210)을 갖는 23개의 DNA 염색체(C1, C2, …C23)를 포함하여 수득될 수 있다. 도 2g에 구체적으로 예시되지는 않았지만, 염색체(C1, C2, …C23)는 다른 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용될 수 있는 상이한 염색체 내의 다른 세트의 선택된 위치를 나타낼 수 있는 다른 서열을 포함할 수 있다. 예를 들어, 도 2a에 예시된 서열(220) 및 도 2d에 예시된 서열(230)은 다른 세트의 Cas-gRNA RNP에 대한 사전 정의된 표적으로서 사용될 수 있는 상이한 염색체 내의 다른 세트의 선택된 위치를 나타낸다. 도 2h에 예시된 조성물(208)은 제1 서열(210)에 혼성화된 제1 세트(251)의 Cas-gRNA RNP를 포함한다. 도 2b와 관련하에 기재된 것과 유사한 방식으로, 제1 세트(251)의 Cas-gRNA RNP는 샘플 내의 제1 서열(210)을 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하기 위한 것일 수 있다. Cas는 Cas9를 포함할 수 있다. 도 2b와 관련하여 기재된 것과 유사한 방식으로, 제1 세트(251)의 Cas-gRNA RNP는 각각 임의의 적합한 수의 Cas-gRNA RNP를 포함할 수 있다. 제1 세트(251)의 RNP 중 각각의 소정의 하나는 제1 세트에서의 하나 이상의 다른 RNP와 동일할 수 있으며, 이 경우, 이러한 RNP는 서로 동일한 특이적 서열(210)을 표적으로 할 수 있거나, 제1 세트에서의 복수의 다른 RNP와 상이할 수 있으며, 이 경우, 해당 RNP는 이러한 다른 RNP와 상이한 특이적 서열을 표적으로 한다. 제1 세트(251)의 Cas-gRNA RNP에서의 RNP의 수는 적합하게는 소기의 폴리뉴클레오타이드(예를 들어, 하나 이상의 이중 가닥 DNA 염색체 또는 이중 가닥 DNA 염색체의 전체 세트)를 단편화하도록 선택될 수 있다. 예시적으로, 제1 세트(251)의 Cas-gRNA RNP는 적어도 약 50,000개의 상이한 Cas-gRNA RNP 또는 적어도 약 100,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 1,000,000개의 상이한 염색체, 또는 적어도 약 10,000,000개의 상이한 Cas-gRNA RNP, 또는 적어도 약 20,000,000개의 상이한 Cas-gRNA RNP를 포함할 수 있다.
도 2i에 예시된 조성물(209)은 제1 세트(251)의 Cas-gRNA RNP(도 2h에 예시됨)에 의한 이러한 절단으로부터 비롯되며, 단편 세트(280)를 포함하거나, 이로 본질적으로 구성되고, 각각은 대략 Z개의 염기쌍(X ≠ Y ≠ Z)을 포함한다. 따라서, 실질적으로 제3 샘플(207) 내의 전체 WG(또는 임의의 적합한 폴리뉴클레오타이드(들))는 정의된 크기의 단편(280)으로 단편화될 수 있다. 제1 세트(251)의 Cas-gRNA RNP에 의해 각각 표적화되는 염색체(C1, C2, …C23)를 따라 서열(210)의 특정 위치는 임의의 적합한 길이의 단편(280)을 제공하도록 선택될 수 있음이 인식될 것이다. 예시적으로, 제1 염기쌍 수는 약 100개 내지 약 2000개(예를 들어, 약 500개 내지 약 700개, 예를 들어 약 600개, 또는 약 200개 내지 약 400개, 예를 들어 약 300개)일 수 있거나, 약 1000개의 염기쌍 내지 약 3000개의 염기쌍, 예를 들어 약 2000개일 수 있다. 서열(210)이 집합적으로 적합하게는 사전 정의되고, 상대적으로 균일한 간격의 위치에 존재하기 때문에, 각각의 단편(280)에서의 염기쌍 수는 상대적으로 엄격한 분포를 가질 수 있다. 예를 들어, WG 단편(280)에서의 염기쌍 수는 약 20% 미만, 또는 약 10% 미만, 또는 약 5% 미만, 또는 약 2% 미만, 또는 심지어 약 1% 미만만큼 달라질 수 있다. 각각의 WG 단편(280)에서의 염기쌍 수(Z)는 예시적으로 약 100개의 염기쌍 및 약 1000개의 염기쌍, 예를 들어 약 500개 내지 약 700개의 염기쌍(예를 들어, 약 600개)일 수 있거나, 약 200개 내지 약 400개의 염기쌍(예를 들어, 약 300개)일 수 있거나, 약 1000개의 염기쌍 및 약 3000개의 염기쌍, 예를 들어 약 2000개일 수 있다.
제3 샘플(207)을 갖는 제1 세트(251)의 Cas-gRNA RNP를 사용하는 대신에, 제2 세트(252) 또는 제3 세트(253)가 다른 길이를 갖는 단편을 제공할 수 있는 서열(220 또는 230)을 대신에 표적화하도록 제1 세트(251) 대신에 사용될 수 있음이 인식될 것이다. 임의의 적합한 수의 폴리뉴클레오타이드(하나의 폴리뉴클레오타이드 포함)의 임의의 적합한 수의 샘플(하나의 샘플 포함)이 임의의 적합한 수의 Cas-gRNA RNP(한 세트 포함)를 사용하여 제작될 수 있음이 또한 인식될 것이다. 예를 들어, 도 2j는 WG의 단편의 생성 방법에서의 작업 흐름을 예시한다. 도 2j에 예시된 방법(2000)은 Cas-gRNA RNP 세트를 대략 소정 수의 염기쌍만큼 서로 이격된 WG에서의 서열에 혼성화하는 단계(작업(2001))를 포함한다. 수득된 조성물은 대략 당해 수의 염기쌍 수만큼 서로 이격된 WG 샘플에서의 서열에 혼성화된 Cas-gRNA RNP 세트를 포함할 수 있다. Cas-gRNA RNP 세트는 각각 샘플 내의 서열을 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하기 위한 것일 수 있다. 예를 들어, 도 2j에 예시된 방법(2000)은 서열을 Cas-gRNA RNP 세트로 각각 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 생성하는 단계를 포함할 수 있다(작업(2002)). 서열들 사이의 염기쌍 수는 약 100개 내지 약 2000개, 예를 들어, 약 500개 내지 약 700개(예를 들어 약 600개), 또는 약 200개 내지 약 400개(예를 들어 약 300개), 또는 약 100개 내지 약 200개(예를 들어, 150개)일 수 있거나, 약 1000개의 염기쌍 내지 약 3000개의 염기쌍, 예를 들어 약 2000개일 수 있다. 일부 예에서, WG 단편에서의 염기쌍 수는 약 100개 내지 약 2000개, 예를 들어, 약 100개 내지 약 200개(예를 들어 약 150개), 또는 약 200개 내지 약 400개(예를 들어 약 300개), 또는 약 500개 내지 약 700개(예를 들어, 약 600개)일 수 있거나, 약 1000개의 염기쌍 내지 약 3000개의 염기쌍, 예를 들어 약 2000개일 수 있다. WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라진다.
추가적으로 또는 대안적으로, 다른 샘플에서, 하나 이상의 다른 세트의 Cas-gRNA RNP가 서로 조합되어 사용되어 WG 단편을 생성할 수 있다. 예를 들어, 도 2k는 WG 샘플 내의 WG 단편을 생성하는 또 다른 방법에서의 작업 흐름을 예시한다. 도 2k에 예시된 방법(2010)은 제1 세트의 Cas-gRNA RNP를 대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화하는 단계(작업(2011))를 포함할 수 있다. 도 2k에 예시된 방법(2010)은 또한 제2 세트의 Cas-gRNA RNP를 대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화하는 단계(작업(2012))를 포함할 수 있다. 작업(2011 및 2012)은 예를 들어 WG 샘플을 제1 및 제2 세트의 Cas-gRNA RNP와 접촉시킴으로써 서로 동시에 수행될 수 있다. 대안적으로, 샘플은 제1 세트의 Cas-gRNA RNP와 접촉되고, 이후 제2 세트의 Cas-gRNA RNP와 접촉될 수 있거나, 반대도 마찬가지이다. 도 2k에 예시된 방법(2010)은 제1 및 제2 서열을 제1 샘플 내의 제1 및 제2 세트의 Cas-gRNA RNP로 각각 절단하여 제1 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 포함할 수 있다. 제1 및 제2 서열은 서로 동시에 절단될 수 있으며; 대안적으로, 제1 서열은 제1 세트의 Cas-gRNA RNP로 절단되고, 이후 제2 세트의 Cas-gRNA RNP로 절단될 수 있거나, 반대도 마찬가지이다. 도 2k는 적합하게는 하나 이상의 추가 세트의 Cas-gRNA RNP를 사용하여 예를 들어 도 2d 내지 도 2f와 관련하여 기재된 바와 같은 방식으로 추가의 서열을 절단하도록 변형될 수 있음이 인식될 것이다.
소정의 샘플 내의 폴리뉴클레오타이드(들)를 절단하는 데 사용되는 Cas-gRNA RNP 세트의 특정 수와 상관없이, 수득되는 단편은 증폭 및 시퀀싱될 수 있음이 인식될 것이다. 예를 들어, 증폭 어댑터는 도 1j와 관련하여 기재된 바와 유사한 방식으로 단편의 말단에 결찰될 수 있으며, 결찰된 증폭 어댑터를 갖는 단편에서 앰플리콘이 생성될 수 있고, 앰플리콘은 시퀀싱된다. 예를 들어, 증폭 어댑터는 단편(260), 단편(270), 및/또는 단편(280)의 말단에 결찰될 수 있으며, 이러한 단편은 이후 증폭 및 시퀀싱된다. 일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함한다. 상이한 세트의 단편은 서로 별도로 증폭 및 시퀀싱될 수 있거나, 증폭 및/또는 시퀀싱을 위해 함께 혼합될 수 있다. 예시적으로, 단편(260, 270, 및/또는 280)의 임의의 적합한 것의 앰플리콘은 증폭 및/또는 시퀀싱을 위해 함께 혼합될 수 있다.
따라서, 적어도 약 1,000,000개의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 포함하거나, 이로 본질적으로 구성된 조성물이 본원에 제공된다. 예시적으로, 염기쌍 수는 약 100개 내지 약 200개(예를 들어, 약 150개), 또는 약 200개 내지 약 400개(예를 들어, 약 300개), 또는 약 500개 내지 약 700개(예를 들어, 약 600개), 또는 약 1000개 내지 약 3000개, 예를 들어 약 2000개일 수 있다. 조성물은 종의 전장 게놈으로부터 유래될 수 있으며, 전장 게놈의 서열을 제공하도록 증폭 및 시퀀싱될 수 있다. WG 단편의 크기는 사용되는 시퀀싱 기술로 사용하기 위해 조정될 수 있으며, WG의 상대적으로 낮은 부분이 시퀀싱을 위해 사용 가능한 길이의 것일 수 있는 기계적 단편화 기술과 비교하여 소정의 샘플 내의 실질적으로 전체 WG가 시퀀싱될 수 있다.
절단을 사용한 폴리뉴클레오타이드 표지
본원의 다른 곳에 언급된 바와 같이, 고유한 분자 식별자(UMI)가 시퀀싱을 위한 이들 폴리뉴클레오타이드를 표지하기 위한 방법으로 각각의 폴리뉴클레오타이드에 커플링될 수 있다. 예시적으로, 소정의 UMI에 커플링된 소정의 폴리뉴클레오타이드 분자의 임의의 앰플리콘은 또한 해당 UMI를 포함할 수 있으며, 이를 통해 이들 앰플리콘은 다른 UMI에 커플링된 다른 폴리뉴클레오타이드 분자와 비교하여 해당 폴리뉴클레오타이드 분자로부터 유래된 것으로 고유하게 식별될 수 있다. 그러나, 이러한 UMI는 증폭 프로세스 동안 돌연변이될 수 있으며, 이러한 돌연변이는 앰플리콘이 유래된 폴리뉴클레오타이드 분자를 식별하는 능력을 억제할 수 있다. 본원에 제공된 바와 같이, 이러한 UMI가 선택적으로 본원에 제공된 바와 같은 방식으로 절단되는 폴리뉴클레오타이드에 커플링될 수 있지만, Cas-gRNA RNP는 UMI에 대한 필요 없이 이들 폴리뉴클레오타이드 분자 및 시퀀싱을 위한 이들의 앰플리콘을 표지하기 위한 이러한 방식으로 폴리뉴클레오타이드 분자를 절단하는 데 사용될 수 있다.
예를 들어, 도 3a 내지 도 3e는 절단을 사용하여 폴리뉴클레오타이드를 표지하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 3a는 표적 폴리뉴클레오타이드, 예컨대 이중 가닥 DNA의 제1 및 제2 분자(M1, M2)를 포함하는 조성물(301)을 예시한다. 각각의 분자 M1, M2는 실질적으로 동일한 서열을 가질 수 있으며, 따라서 분자는 "제1"인 것으로 간주되며, "제2"는 임의적이다. 표적 폴리뉴클레오타이드의 서열은 서로 상이한 하나 이상의 위치에서 폴리뉴클레오타이드 분자 M1, M2를 절단하는 데 사용될 수 있는 상이한 하위서열을 포함할 수 있으며, 이러한 절단의 각각의 위치는 각각의 폴리뉴클레오타이드 분자를 표지하기 위한 것으로 간주될 수 있다. 예를 들어, 각각의 폴리뉴클레오타이드 분자는 제1 Cas-gRNA RNP가 표적화될 수 있는 제1 하위서열(311)(즉, gRNA의 관련 부분에 상보적인 서열을 가짐), 제2 Cas-gRNA RNP가 표적화될 수 있는 제2 하위서열(312), 제3 Cas-gRNA RNP가 표적화될 수 있는 제3 하위서열(313), 및 제4 Cas-gRNA RNP가 표적화될 수 있는 제4 하위서열(314)을 포함할 수 있다. 제1 및 제2 하위서열(311, 312)은 서로 오직 부분적으로 중첩될 수 있고, 제3 및 제4 하위서열(313, 314)은 서로 오직 부분적으로 중첩될 수 있다.
도 3b에 예시된 조성물(302)에서, 표적 폴리뉴클레오타이드의 제1 및 제2 분자(M1, M2)는 복수의 각각의 제1 및 제2 Cas-gRNA RNP(351, 352)와 유체 중에서 접촉되고, 또한 복수의 각각의 제3 및 제4 Cas-gRNA RNP(353, 354)와 접촉될 수 있다. RNP가 초기에 각각의 분자 M1, M2 내의 상응하는 하위서열과 혼성화되는 것에 따라, 다른 RNP는 도 3b에 예시된 바와 같은 이러한 방식으로 이들 분자 내의 다른 하위서열과 혼성화되는 것이 억제될 수 있다. 일 비제한적 예에서, 제1 Cas-gRNA RNP(351) 중 하나는 제1 분자(M1)에서의 제1 하위서열(311)에 혼성화될 수 있고, 제2 Cas-gRNA RNP는 제2 분자(M2)에서의 제2 하위서열(312)에 혼성화될 수 있다. 제1 및 제2 하위서열(311, 312)은 서로 오직 부분적으로 중첩되기 때문에, 제1 분자(M1)에 혼성화되는 제1 Cas-gRNA RNP(351) 중 하나는 제1 분자(M1)에서의 제2 하위서열(312)에 대한 임의의 제2 Cas-gRNA RNP(351)의 혼성화를 억제할 수 있고, 제2분자(M2)에 혼성화되는 제2 Cas-gRNA RNP(352) 중 하나는 제2 분자(M2)에서의 제1 하위서열(311)에 대한 임의의 제1 Cas-gRNA RNP(351)의 혼성화를 억제할 수 있다. 즉, 제1 Cas-gRNA RNP(351) 중 하나가 분자 중 하나에 혼성화하면, 제2 Cas-gRNA RNP(352)는 또한 해당 분자에 혼성화할 수 없고, 제2 Cas-gRNA RNP(352) 중 하나가 분자 중 하나에 혼성화하면, 제1 Cas-gRNA RNP(351)는 또한 해당 분자에 혼성화할 수 없다. 도 3c와 관련하여 보다 상세하게 기재된 바와 같은 방식으로, 분자는 이어서 제1 및 제2 Cas-gRNA RNP(351, 352)가 혼성화되는 제1 또는 제2 하위서열(311, 312)에서 절단될 수 있다. 따라서, 절단은 서로 상이한 위치에서 이루어질 수 있다. 예시적으로, 제1 분자(M1)에서의 절단은 제2 분자(M2)에서의 절단과 표적 폴리뉴클레오타이드의 서열에서 상이한 위치에서 이루어진다. 일부 경우, 동일한 유형의 RNP가 제1 및 제2 분자(M1, M2) 둘 모두에 혼성화할 수 있고, 이 경우, 분자는 동일한 위치에서 절단될 수 있음이 인식될 것이다.
도 3b에 예시된 바와 같은 방식으로, 제3 및 제4 Cas-gRNA RNP(353, 354)는 유사하게 제3 또는 제4 하위서열(313, 314)에 혼성화될 수 있고, 이들 하위서열에 대한 다른 RNP의 혼성화를 억제할 수 있다. 예를 들어, 제3 Cas-gRNA RNP(353) 중 하나는 제1 분자(M1)에서의 제3 하위서열(313)에 혼성화할 수 있고, 제1 분자(M1)에서의 제4 하위서열(314)에 대한 임의의 제4 Cas-gRNA RNP의 혼성화를 억제할 수 있다. 도 3c와 관련하여 보다 상세하게 기재된 바와 같은 방식으로, 제1 분자(M1)는 이어서 제3 Cas-gRNA RNP(353) 중 하나를 사용하여 제3 하위서열에서 절단되어 단편을 생성할 수 있다. 대안적으로, 제4 Cas-gRNA RNP(354) 중 하나는 제1 분자(M1)에서의 제4 하위서열(354)에 혼성화될 수 있고, 제1 분자에서의 제3 하위서열에 대한 임의의 제3 Cas-gRNA RNP의 혼성화를 억제할 수 있다. 도 3c와 관련하여 보다 상세하게 기재된 바와 같은 방식으로, 제1 분자(M1)는 이어서 제4 Cas-gRNA RNP(354) 중 하나를 사용하여 제4 하위서열에서 절단되어 단편을 생성할 수 있다. RNP는 유사한 방식으로 제2 분자(M2)의 상이한 하위서열에 혼성화할 수 있다. 예를 들어, 제3 Cas-gRNA RNP(353) 중 하나는 제2 분자(M2)에서의 제3 하위서열(313)에 혼성화할 수 있고, 제2 분자(M2)에서의 제4 하위서열(314)에 대한 임의의 제4 Cas-gRNA RNP(354)의 혼성화를 억제할 수 있다. 도 3c와 관련하여 보다 상세하게 기재된 바와 같은 방식으로, 제2 분자(M1)는 이어서 제3 Cas-gRNA RNP(354) 중 하나를 사용하여 제3 하위서열(313)에서 절단되어 단편을 생성할 수 있다. 대안적으로, 제4 Cas-gRNA RNP(354) 중 하나는 제2 분자에서의 제4 하위서열(314)에 혼성화할 수 있고, 제2 분자(M2)에서의 제3 하위서열(313)에 대한 임의의 제3 Cas-gRNA RNP(353)의 혼성화를 억제할 수 있다. 도 3c와 관련하여 보다 상세하게 기재된 바와 같은 방식으로, 제2 분자(M2)는 이어서 제4 Cas-gRNA RNP(354) 중 하나를 사용하여 제4 하위서열에서 절단되어 단편을 생성할 수 있다. 일부 경우, 동일한 유형의 RNP가 제1 및 제2 분자(M1, M2) 둘 모두에 혼성화할 수 있고, 이 경우, 분자는 동일한 위치에서 절단될 수 있음이 인식될 것이다. 그러나, 통계적으로 제1 및 제2 분자에서의 적어도 하나의 절단은 표적 폴리뉴클레오타이드의 서열에서 서로 상이한 위치에서 이루어질 수 있는 가능성이 크다.
이제 도 3c로 돌아가서, 제1 및 제2 분자(M1, M2)는 Cas-gRNA RNP를 사용하여 절단되어 조성물(303)을 생성할 수 있다. 예시적으로, 제1 분자(M1)는 혼성화된 제1 Cas-gRNA RNP(351) 중 하나를 사용하여 위치(341)에서 절단될 수 있고, 제2 분자(M2)는 제2 Cas-gRNA RNP 중 하나를 사용하여 위치(342)에서 절단될 수 있다. 유사하게, 제1 분자(M1)는 혼성화된 제3 또는 제4 Cas-gRNA RNP(353, 354) 중 하나를 사용하여 위치(343 또는 344)에서 절단될 수 있고, 제2 분자(M2)는 혼성화된 제3 또는 제4 Cas-gRNA RNP(353, 354) 중 하나를 사용하여 위치(343, 344)에서 절단될 수 있다. 그러나, 표적 폴리뉴클레오타이드의 임의의 분자는 임의의 적합한 위치, 예를 들어 Cas-gRNA RNP가 혼성화할 수 있는 위치에서 절단될 수 있음이 인식되어야 한다. 일 분자 내의 위치(341)에서의 절단은 예를 들어 표적 폴리뉴클레오타이드 서열에서 2개의 염기쌍 내지 약 40개의 염기쌍(예를 들어, 약 2 내지 20개의 염기쌍 또는 약 5 내지 10개의 염기쌍)만큼 또 다른 분자에서의 위치(342)에서의 절단으로부터 벗어날 수 있다. 유사하게, 일 분자 내의 위치(343)에서의 절단은 예를 들어 표적 폴리뉴클레오타이드 서열에서 2개의 염기쌍 내지 약 40개의 염기쌍(예를 들어, 약 2 내지 20개의 염기쌍 또는 약 5 내지 10개의 염기쌍)만큼 또 다른 분자에서의 위치(344)에서의 절단으로부터 벗어날 수 있다. 따라서, 도 3c에 예시된 바와 같이, 각각의 제1 및 제2 분자(M1, M2)에서 이루어진 절단(341 또는 342 및 343 또는 344)의 특정 조합에 따라, 상이한 길이 및 상이한 염기쌍 수를 갖는 단편이 형성될 수 있다. 예를 들어, 단편(331)은 절단(341) 내지 절단(343) 위치의 길이를 가질 수 있고; 단편(332)은 절단(342) 내지 절단(344) 위치의 길이를 가질 수 있고; 단편(333)은 절단(341) 내지 절단(344) 위치의 길이를 가질 수 있고; 단편(334)은 절단(342) 내지 절단(343) 위치의 길이를 가질 수 있다. 단편(331 및 332)은 서로 대략 동일한 길이를 가질 수 있지만, 다양한 단편에서의 절단의 특정 위치로 인해 단편(333)보다 더 짧고, 단편(334)보다 더 길 수 있음을 유의한다. 각각의 단편(331, 332, 333, 334)은 약 100개의 염기쌍 내지 약 1000개의 염기쌍, 예를 들어 약 500개의 염기쌍 내지 약 700개의 염기쌍(예시적으로, 약 600개의 염기쌍), 또는 약 200개의 염기쌍 내지 약 400개의 염기쌍(예시적으로, 약 300개의 염기쌍), 또는 약 100개의 염기쌍 내지 약 200개의 염기쌍(예시적으로, 약 150개의 염기쌍), 또는 약 1000개 내지 약 3000개의 염기쌍, 예를 들어 약 2000개의 염기쌍 길이를 가질 수 있다.
따라서, 도 3c에 예시된 조성물(303)은 서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자(M1, M2)를 포함할 수 있다. 제1 분자(예를 들어, 단편(331) 또는 단편(333))는 제1 하위서열(311)에서 제1 말단을 가질 수 있고, 제2 분자(예를 들어, 단편(332 또는 334))는 제2 하위서열(312)에서 제1 말단을 가질 수 있다. 도 4와 관련하여 기재된 바와 같은 방식으로, 제1 하위서열(311, 312)은 제2 하위서열과 오직 부분적으로 중첩될 수 있다. 제1 분자의 제1 말단은 제2 분자의 제1 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치일 수 있다. 제1 분자에서의 제1 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 말단으로부터 벗어날 수 있다. 제1 분자(예를 들어, 단편(331))는 제3 하위서열(313)에서 제2 말단을 추가로 가질 수 있고, 제2 분자(예를 들어, 단편(332 또는 334))는 제3 하위서열(313) 또는 제4 하위서열(314)에서 제2 말단을 추가로 가질 수 있다. 제3 하위서열은 제4 하위서열과 오직 부분적으로 중첩될 수 있다. 제1 분자의 제2 말단은 제2 분자의 제2 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치일 수 있다. 제1 분자에서의 제2 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 제2 말단으로부터 벗어날 수 있다. 제1 및 제2 분자는 서로 상이한 수의 염기쌍을 포함할 수 있거나, 서로 동일한 수의 염기쌍을 가질 수 있다.
일부 예에서, Cas는 각각의 Cas-gRNA RNP(351, 352, 353, 및/또는 354)가 혼성화되는 분자를 절단하는 Cas9를 포함한다. 다른 예에서, Cas는 비활성화 Cas9(dCas9)를 포함한다. 비제한적 일예에서, 제1 Cas-gRNA RNP(351) 중 하나 및 제3 또는 제4 Cas-gRNA RNP(353, 354) 중 하나가 제1 분자(M1)에 혼성화되는 동안, 해당 제1 Cas-gRNA RNP와 해당 제3 또는 제4 Cas-gRNA RNP 사이에 존재하지 않는 제1 분자 중 임의의 부분은 예를 들어 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 분해될 수 있다. 비제한적 또 다른 예에서, 제2 Cas-gRNA RNP(352) 중 하나 및 제3 또는 제4 Cas-gRNA RNP(353, 354) 중 하나가 제2 분자(M2)에 혼성화되는 동안, 해당 제2 Cas-gRNA RNP와 해당 제3 또는 제4 Cas-gRNA RNP 사이에 존재하지 않는 제2 분자 중 임의의 부분은 예를 들어 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 분해될 수 있다. 즉, 적합한 엑소뉴클레아제가 사용되어 분자에 결합된 Cas-gRNA RNP들 사이에 위치하지 않은 분자 중 일부를 분해할 수 있다. 따라서, Cas-gRNA RNP는 이들 사이의 분자 중 일부를 보호하는 것으로 간주될 수 있다.
본 방법을 사용하여 생성된 단편은 증폭 및 시퀀싱될 수 있다. 예를 들어, 도 3d에 예시된 바와 같이, 증폭 어댑터(360)는 도 1j와 관련하여 기재된 바와 유사한 방식으로 단편의 말단에 결찰될 수 있으며, 결찰된 증폭 어댑터를 갖는 단편에서 앰플리콘이 생성될 수 있고, 앰플리콘은 시퀀싱된다. 예를 들어, 증폭 어댑터(360)는 단편(331, 332, 333, 334)의 말단에 결찰될 수 있으며, 이러한 단편은 이후 증폭 및 시퀀싱된다. 일부 예에서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하지만, 이러한 UMI는 순수하게 선택적이다. 임의의 UMI는 증폭 어댑터와 동일한 작업으로 제1 및 제2 단편의 말단에 커플링 및 결찰된다.
제1 하위서열(311), 제2 하위서열(312), 제3 하위서열(313), 및 제4 하위서열(314)은 제1 및 제2 분자(M1, M2) 중 상이한 것으로부터 유래된 상이한 단편의 앰플리콘을 식별하는 데 사용될 수 있다. 예시적으로, 단편(331) 및 이의 앰플리콘은 하위서열(311) 내에 속하는 위치(341)에서의 제1 말단 및 하위서열(313) 내에 속하는 위치(342)에서의 제2 말단을 가질 수 있고; 단편(332) 및 이의 앰플리콘은 하위서열(312) 내에 속하는 위치(342)에서의 제1 말단 및 하위서열(314) 내에 속하는 위치(344)에서의 제2 말단을 가질 수 있고; 단편(333) 및 이의 앰플리콘은 하위서열(311) 내에 속하는 위치(341)에서의 제1 말단 및 하위서열(314) 내에 속하는 위치(344)에서의 제2 말단을 가질 수 있고; 단편(334) 및 이의 앰플리콘은 하위서열(312) 내에 속하는 위치(342)에서의 제1 말단 및 하위서열(313) 내에 속하는 위치(332)에서의 제2 말단을 가질 수 있다. 따라서, 하위서열(311, 312, 313, 314) 내의 소정의 앰플리콘의 각각의 말단 위치를 기준으로, 이러한 앰플리콘이 분자(M1 또는 M2) 중 특정의 하나로부터 유래됨이 결정될 수 있다. 임의의 UMI는 유사하게 분자(M1 또는 M2) 중 특정 하나로부터 유래된 앰플리콘을 식별하는 데 사용된다. 특정 분자로부터 유래된 모든 판독물을 식별하는 이러한 능력은 원래 분자의 실제 서열을 결정하기 위해 이들 판독물이 축소(collapse)되도록 한다. 실제로, 이는 오류 보정 및 증가된 정확성을 제공하여 제작 및 시퀀싱 동안 도입되었을 수 있는 오류가 아니라 실제 변이체를 식별하도록 한다. 이는 UMI를 부가하는 매우 효율적인 방법을 제공한다. 대조적으로, 증폭 전에 결찰된 UMI는 불량한 전환 효율을 겪을 수 있다. 본 방법은 UMI 식별을 라이브러리 절단에 넣을 수 있고, PCR 동안 도입되는 오류에 덜 적용될 수 있고, 따라서 보다 정확할 수 있다.
도 3e는 폴리뉴클레오타이드의 절단 방법에서의 예시 작업 흐름을 예시한다. 도 3e에 예시된 방법(3000)은 표적 폴리뉴클레오타이드의 제1 및 제2 분자를 복수의 제1 및 제2 Cas-gRNA RNP와 유체 중에서 접촉시키는 단계(작업(3001))를 포함한다. 도 3e에 예시된 방법(3000)은 제1 Cas-gRNA RNP 중 하나를 제1 분자에서의 제1 하위서열에 혼성화하는 단계(작업(3002))를 포함한다. 예를 들어, 도 3b와 관련하여 기재된 바와 같은 방식으로, 제1 Cas-gRNA RNP(351) 중 하나는 분자(M1)에서의 제1 하위서열(311)에 혼성화할 수 있다. 도 3e에 예시된 방법(3000)은 제2 Cas-gRNA RNP 중 하나를 제2 분자에서의 제2 하위서열에 혼성화하는 단계를 포함하며, 제2 하위서열은 제1 하위서열과 오직 부분적으로 중첩된다(작업(3003)). 예를 들어, 도 3b와 관련하여 기재된 바와 같은 방식으로, 제2 Cas-gRNA RNP(352) 중 하나는 분자(M2)에서의 제2 하위서열(312)에 혼성화할 수 있다. 도 3e에 예시된 방법(3000)은 제1 Cas-gRNA RNP 중 하나에 의해, 임의의 제2 Cas-gRNA RNP가 제1 분자에서의 제2 하위서열에 혼성화하는 것을 억제하는 단계(작업(3004))를 포함한다. 예를 들어, 분자(M1)에 혼성화된 제1 Cas-gRNA RNP(351)는 제2 Cas-gRNA RNP(352)가 또한 해당 분자에 혼성화하는 것을 억제할 수 있다. 도 3e에 예시된 방법(3000)은 제2 Cas-gRNA RNP 중 하나에 의해, 임의의 제1 Cas-gRNA RNP가 제2 분자에서의 제1 하위서열에 혼성화하는 것을 억제하는 단계(작업(3005))를 포함한다. 예를 들어, 분자(M2)에 혼성화된 제2 Cas-gRNA RNP(352)는 제1 Cas-gRNA RNP(351)가 또한 해당 분자에 혼성화하는 것을 억제할 수 있다. 도 3e에 예시된 방법(3000)은 제1 분자를 제1 하위서열에서 절단하는 단계(작업(3006)) 및 제2 분자를 제2 하위서열에서 절단하는 단계(작업(3007))를 포함한다. 이러한 분자를 Cas-gRNA RNP를 사용하여 절단하는 예시 작업은 도 3c와 관련하여 제공된다.
따라서, 표적 폴리뉴클레오타이드의 상이한 분자는 다양한 위치에서 말단을 생성하도록 정의된 위치에서 절단될 수 있으며, 증폭 및 시퀀싱 이후, 표적 폴리뉴클레오타이드 서열에서의 이러한 말단의 위치는 앰플리콘이 유래된 분자를 식별하는 데 사용될 수 있음이 이해될 수 있다.
폴리뉴클레오타이드에 대한 증폭 어댑터 커플링
폴리뉴클레오타이드에 대한 증폭 어댑터 커플링은 이들의 증폭 및 시퀀싱을 용이하게 한다. 본원에 제공된 바와 같이, 증폭 어댑터는 Cas-gRNA RNP 및 트랜스포사제 둘 모두를 포함하는 융합 단백질을 사용하여 폴리뉴클레오타이드에 커플링될 수 있다. 예를 들어, 도 4a 내지 도 4j는 증폭 어댑터를 폴리뉴클레오타이드 내에 결합시키기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 4a에 예시된 바와 같이, 조성물(401)은 제1 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제1 하위서열(410)(즉, Cas-gRNA RNP의 gRNA가 혼성화할 수 있는 서열 포함)을 포함하는 표적 폴리뉴클레오타이드 P1(예컨대, 이중 가닥 DNA)을 포함할 수 있다. 선택적으로, 조성물(401)은 제2 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제2 하위서열(420)을 추가로 포함할 수 있다. 도 4b에 예시된 바와 같이, 표적 폴리뉴클레오타이드(P1)는 제1 융합 단백질(430) 및 선택적 제2 융합 단백질(440)과 유체 중에서 접촉될 수 있다. 제1 융합 단백질(430)(및 존재하는 경우, 제2 융합 단백질(440))은 유체 중에서 표적 폴리뉴클레오타이드(P1)에 대해 대략 화학량론적 비율로 존재할 수 있다.
제1 융합 단백질(430)은 커플링된 제1 증폭 어댑터(파선으로 표시됨)를 갖는 제1 트랜스포사제(432)에 커플링된 제1 Cas-gRNA RNP(431)를 포함할 수 있다. 선택적 제2 융합 단백질(440)은 커플링된 제2 증폭 어댑터(점선으로 표시됨)를 갖는 제2 트랜스포사제(442)에 커플링된 제2 Cas-gRNA RNP(441)를 포함할 수 있다. Cas-gRNA RNP를 트랜스포사제에 커플링하기 위한 비제한적 예는 도 4f 내지 도 4i와 관련하여 하기 추가로 제공된다. 임의의 적합한 증폭 어댑터는 트랜스포사제(432, 442)를 사용하여 표적 폴리뉴클레오타이드에 커플링될 수 있음이 인식될 것이다. 예시적으로, 제1 증폭 어댑터는 P5 어댑터를 포함할 수 있고, 제2 증폭 어댑터는 P7 어댑터를 포함할 수 있다. 선택적으로, 제1 증폭 어댑터는 또한 제1 고유한 분자 식별자(UMI)를 포함할 수 있고, 제2 증폭 어댑터는 제2 UMI를 포함할 수 있다. UMI는 본원의 다른 곳에 기재된 바와 같은 방식으로 시퀀싱 동안 사용될 수 있다.
제1 Cas-gRNA RNP(431)(및 존재하는 경우, 제2 Cas-gRNA RNP(441))의 활성은 촉진하고, 제1 트랜스포사제(432)(및 존재하는 경우, 제2 트랜스포사제(442))의 활성은 억제하는 동안, 도 4b에 예시된 조성물(402)이 제공될 수 있으며, 여기서, 제1 Cas-gRNA RNP(431)는 표적 폴리뉴클레오타이드(P1)에서의 제1 하위서열(410)에 혼성화되고, 존재하는 경우, 제2 Cas-gRNA RNP(441)는 표적 폴리뉴클레오타이드에서의 제2 하위서열(420)에 혼성화된다. 일부 예에서, 유체의 조건을 사용하여 제1 및 제2 Cas-gRNA RNP(431, 441)의 활성은 촉진될 수 있고, 트랜스포사제(432, 442)의 활성은 억제될 수 있다. 예를 들어, 상이한 효소는 특정 이온을 사용하여 작용할 수 있음이 잘 알려져 있다. 예시적으로, Cas-gRNA RNP(431, 441)는 칼슘 이온(Ca2+), 망간 이온(Mn2+), 또는 칼슘 이온과 망간 이온 둘 모두를 사용하여 예를 들어 서열(420, 430)에 각각 혼성화하도록 작용할 수 있다. 대조적으로, 트랜스포사제(432, 442)는 마그네슘 이온(Mg2+)을 사용하여 예를 들어 증폭 어댑터를 표적 폴리뉴클레오타이드(P)에 커플링시키도록 작용할 수 있다. 따라서, 표적 폴리뉴클레오타이드(P1)를 Cas-gRNA RNP(431, 441)의 활성을 위해 충분한 양의 칼슘 이온, 망간 이온, 또는 칼슘 이온과 망간 이온 둘 모두의 존재 및 트랜스포사제(432, 442)의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함하는 조건을 갖는 유체 중에서 제1 및 제2 융합 단백질(430, 440)과 접촉시킴으로써, Cas-gRNA RNP는 적절하게 작용할 수 있는 한편, 트랜스포사제는 작용하지 않을 수 있다. 추가적으로 또는 대안적으로, 표적 폴리뉴클레오타이드에 대한 트랜스포사제의 결합은 예를 들어 트랜스포사제 상의 결합 부위를 역차단하고/하거나 트랜스포사제에 대해 사용되는 것과 상이한 온도를 Cas-gRNA RNP를 혼성화는 데 사용하고/하거나 표적 폴리뉴클레오타이드에 결합하는 트랜스포사제의 능력을 지연시키기 위해 Cas-gRNA가 표적 폴리뉴클레오타이드에 혼성화되었던 후까지 트랜스포사제에 대한 트랜스포사제 어댑터의 결합을 지연시키는 것 등의 임의의 적합한 방식으로 억제될 수 있다. 선택적으로, 제1 융합 단백질(430)의 Cas-gRNA RNP(431)가 제1 하위서열(410)에 혼성화되고, 제2 융합 단백질(440)의 Cas-gRNA RNP(441)가 제2 하위서열(420)에 혼성화되는 동안, Cas-gRNA RNP들(431, 441) 사이에 존재하지 않는 표적 폴리뉴클레오타이드(P1) 중 임의의 부분은 예를 들어 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 분해될 수 있다.
이후, 제1 및 제2 트랜스포사제(432, 442)의 활성을 촉진하는 동안, 제1 트랜스포사제를 사용하여 제1 증폭 어댑터를 표적 폴리뉴클레오타이드(P1)에서의 제1 위치에 부가할 수 있고, 제2 트랜스포사제를 사용하여 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가할 수 있다. 예를 들어, 트랜스포사제(432, 442)의 활성은 유체의 제2 조건, 예컨대 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 사용하여 촉진될 수 있다. 예시적으로, 마그네슘 이온은 유체 중에 혼합될 수 있다. 따라서, 도 4c에 예시된 조성물(403)이 제공될 수 있으며, 여기서, 트랜스포사제(432, 442)는 표적 폴리뉴클레오타이드(P1) 상에 작용하여 이에 제1 및 제2 증폭 어댑터를 커플링시킨다. 표적 폴리뉴클레오타이드(P1)는 제1 및 제2 융합 단백질(430, 440)로부터 방출되어 일 말단에 제1 증폭 어댑터 및 다른 말단에 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드(P1)의 단편(450)을 포함하는 도 4d에 예시된 조성물(404)을 제공할 수 있다. 이러한 방출은 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 사용하여 수행될 수 있다. 커플링된 증폭 어댑터를 갖는 단편(450)은 증폭 및 시퀀싱될 수 있다.
단편(450)의 길이는 예를 들어 제1 서열(410)과 제2 서열(420) 사이의 대략적 거리와 밀접하게 관련될 수 있다. 예를 들어, 4c에 예시된 바와 같이, 융합 단백질(430)의 제1 Cas-gRNA RNP(431)는 링커(433)를 통해 제1 트랜스포사제(432)에 커플링될 수 있고, 융합 단백질(440)의 제2 Cas-gRNA RNP(441)는 링커(443)를 통해 제1 트랜스포사제(442)에 커플링될 수 있다. 링커(433, 443)의 비제한적 예는 도 4f 내지 도 4i와 관련하여 하기 보다 상세하게 제공된다. 링커(433, 443)는 잘 정의된 길이를 가질 수 있으며, 따라서 트랜스포사제는 각각의 Cas-gRNA RNP로부터 이동할 수 있는 정의된 길이를 제공할 수 있다. 따라서, Cas-gRNA RNP(431, 441)가 표적 폴리뉴클레오타이드(P1)에서의 이들의 각각의 서열(410, 420)에 혼성화되고, 트랜스포사제(432, 442)가 활성화될 때(예를 들어, 유체 조건 사용), 트랜스포사제는 각각 링커(433, 443)의 길이에 의해 허용될 수 있는 임의의 위치에서 Cas-gRNA RNP에 상대적으로 가까운 표적 폴리뉴클레오타이드의 영역에 커플링될 수 있다. 그러나, 트랜스포사제는 (Cas-gRNA RNP가 그러하는 바와 같이) 표적 폴리뉴클레오타이드(P1)에서의 특이적 서열에 커플링할 수 없기 때문에, 트랜스포사제가 각각 커플링할 수 있는 위치의 범위가 존재할 수 있다. 예시적으로, 트랜스포사제(432)가 제1 어댑터를 부가하는 제1 위치는 제1 하위서열(410)의 약 10개의 염기 내에 존재할 수 있고, 트랜스포사제(442)가 제2 어댑터를 부가하는 제2 위치는 제2 하위서열(420)의 약 10개의 염기 내에 존재할 수 있다.
도 4d에 예시된 단편(450)은 예를 들어 서열들(410, 420) 사이의 거리에 의해 대략적으로 정의된 임의의 적합한 길이를 가질 수 있음이 인식될 것이다(도 4a 내지 도 4c에 나타냄). 예를 들어, 단편(450)은 약 100개의 염기쌍 내지 약 1000개의 염기쌍, 예를 들어 약 500개의 염기쌍 내지 약 700개의 염기쌍(예시적으로, 약 600개의 염기쌍), 또는 약 200개의 염기쌍 내지 약 400개의 염기쌍(예시적으로, 약 300개의 염기쌍), 또는 약 100개의 염기쌍 내지 약 200개의 염기쌍(예시적으로, 약 150개의 염기쌍) 길이, 또는 약 1000개 내지 약 3000개의 염기쌍, 예를 들어 약 2000개의 염기쌍 길이를 가질 수 있다.
4e에 예시된 바와 같이, 제1 및 제2 융합 단백질(430, 440) 내의 gRNA(434, 444)는 각각 임의의 적합한 길이 및 각각의 서열(410, 420)에 대한 이의 혼성화를 촉진하는 서열을 가질 수 있다. 예를 들어, 제1 또는 제2 하위서열(410, 420)에 혼성화하는 gRNA(434, 444)의 5' 말단은 Cas-gRNA RNP에서 보다 전형적으로 사용되는 gRNA의 것에 비해 축소될 수 있다. 예시적으로, 4e에 나타낸 바와 같이, 전형적 gRNA는 길이 x의 5' 말단을 가질 수 있으며, 여기서, x는 약 20개의 뉴클레오타이드일 수 있는 한편, gRNA(434, 444)는 길이 y의 5' 말단을 가질 수 있으며, 여기서, y는 x 미만이다. 일부 예에서, 제1 하위서열(410)에 혼성화하는 gRNA(434)의 부분 y는 약 15개 내지 약 18개의 뉴클레오타이드의 길이를 가질 수 있고, 제2 하위서열(420)에 혼성화하는 gRNA(444)의 부분 y는 약 15개 내지 약 18개의 뉴클레오타이드의 길이를 가질 수 있다. 축소 gRNA와 관련하여 추가의 상세 내용의 경우, 문헌[Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs," Nat. Biotechnol. 32(3): 279-284 (2014)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
임의의 적합한 Cas 및 임의의 적합한 트랜스포사제가 융합 단백질(430, 440)에서 사용될 수 있음이 인식될 것이다. 예시적으로, Cas는 dCas9를 포함할 수 있고(예를 들어, 트랜스포사제가 활성화되기 전에 Cas가 표적 폴리뉴클레오타이드(P1)를 절단하는 것을 억제하기 위함), 트랜스포사제는 Tn5를 포함할 수 있다(트랜스포사제의 활성이 충분한 양의 마그네슘 이온을 부가하는 것과 같은 유체 조건을 통해 잘 제어될 수 있도록 하기 위함). Cas 및 트랜스포사제는 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 서로 커플링될 수 있다. 공유 연결은 예시적으로 구리(I)-촉매 작용된 클릭 반응 또는 스트레인 촉진된 아지드-알킨 고리화 부가(strain-promoted azide-alkyne cycloaddition)에 의해 형성될 수 있다. 비-공유 연결은 임의의 적합한 방식으로 형성될 수 있다. 예를 들어, 도 4f에 예시된 바와 같은 방식으로, Cas-gRNA RNP는 항체(461)에 공유 커플링될 수 있고, 트랜스포사제는 항체가 비-공유 커플링되는 항원(462)에 공유 커플링될 수 있거나, 도 4g에 예시된 바와 같은 방식으로, Cas-gRNA RNP는 항원(461)에 공유 커플링될 수 있고, 트랜스포사제는 항원이 비-공유 커플링되는 항체(462)에 공유 커플링될 수 있다. 대안적으로, 4h에 예시된 바와 같은 방식으로, Cas-gRNA는 gRNA의 일부(463)와 제1 또는 제2 증폭 어댑터 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링될 수 있다. 또 다른 예로서, 4i에 예시된 바와 같은 방식으로, Cas-gRNA는 gRNA의 일부(464)와 트랜스포사제 내의 올리고뉴클레오타이드(465) 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링될 수 있다. Cas가 또 다른 단백질에 커플링할 수 있는 방식의 추가의 예의 경우, 다음 참고문헌을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다: 문헌[Guilinger et al., "Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification," Nature Biotechnology 32: 577-582 (2014)]; 및 문헌[Bhatt et al., "Targeted DNA transposition in vitro using a dCas9-transposase fusion protein, Nucleic Acids Res. 47: 8126-8135 (2019)].
도 4j는 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법에서의 예시 작업 흐름을 예시한다. 도 4j에 예시된 방법(4000)은 표적 폴리뉴클레오타이드를 제1 및 제2 융합 단백질과 유체 중에서 접촉시키는 단계를 포함하며, 각각은 커플링된 증폭 어댑터를 갖는 트랜스포사제에 커플링된 Cas-gRNA RNP를 포함한다(작업(4001)). 예를 들어, 표적 폴리뉴클레오타이드(P1)는 도 4b와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 융합 단백질(430, 440)과 접촉될 수 있다. 도 4j에 예시된 방법(4000)은 Cas-gRNA RNP의 활성은 촉진하고, 트랜스포사제의 활성은 억제하는 동안, (i) 제1 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 하위서열에 혼성화하고, (ii) 제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제2 하위서열에 혼성화하는 단계(작업(4002))를 포함한다. 예를 들어, 유체는 도 4b와 관련하여 기재된 바와 같은 방식으로 트랜스포사제(432 및 442)의 활성은 억제하면서, 제1 하위서열(410)에 대한 제1 Cas-gRNA RNP(431) 및 제2 하위서열(420)에 대한 제2 Cas-gRNA RNP(442)의 이러한 혼성화를 촉진하는 제1 조건(예시적으로, 충분한 양의 Ca2+ 및/또는 Mn2+의 존재 및 충분한 양의 Mg2+의 부재)을 가질 수 있다. 도 4j에 예시된 방법(4000)은 제1 및 제2 트랜스포사제의 활성을 촉진하는 동안, (i) 제1 트랜스포사제를 사용하여 제1 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제1 위치에 부가하고, (ii) 제2 트랜스포사제를 사용하여 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가하는 단계(작업(4003))를 포함한다. 예를 들어, 유체는 도 4c와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 트랜스포사제(432 및 442)의 활성을 촉진하는 제2 조건(예시적으로, 충분한 양의 Mg2+의 존재)을 가질 수 있다.
일부 구현예에서, ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제) 표적화된 라이브러리 제작 및 농축이 사용될 수 있다.
라이브러리 제작 후에 별도의 농축 단계를 사용하는 특정 유전자의 표적화된 시퀀싱은 시간 소모적일 수 있다. 예를 들어, 이러한 별도의 농축 단계는 올리고뉴클레오타이드 프로브를 라이브러리 DNA에 혼성화하는 단계 및 혼성화된 DNA를 스트렙타비딘-코팅된 비드 상에서 단리하는 단계를 포함할 수 있다. 효율 및 필요한 시간에서의 유의한 개선에도 불구하고, 이러한 별도의 농축 프로토콜은 약 2시간이 소요될 수 있으며, 이러한 프로토콜을 자동화하기에 어렵게 만들 수 있는 다수의 시약을 취할 수 있다.
대조적으로, 본원의 일부 예는 제작 및 농축 둘 모두를 위한 단일 단계를 사용하여 특정 유전자의 표적화된 시퀀싱을 위한 라이브러리를 제작 및 농축하는 데 사용될 수 있다.
예를 들어, 도 7a 내지 도 7h는 증폭 어댑터를 폴리뉴클레오타이드에 커플링시키기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 7a를 먼저 참조하면, 조성물(701)은 제1 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제1 하위서열(710)(즉, Cas-gRNA RNP의 gRNA가 혼성화할 수 있는 서열 포함)을 포함하는 표적 폴리뉴클레오타이드 P3(예컨대, 이중 가닥 DNA)을 포함할 수 있다. 선택적으로, 조성물(701)은 제2 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제2 하위서열(720)을 추가로 포함할 수 있다. 표적 폴리뉴클레오타이드(P3)는 부분적으로 단편화된 dsDNA, 예컨대 무세포 DNA 또는 본원에 다른 곳에 기재된 바와 같은 방식으로 단편화되었던 DNA를 포함할 수 있다. 대안적으로, 표적 폴리뉴클레오타이드(P3)는 전체 염색체의 DNA를 포함할 수 있다. 7b에 예시된 바와 같이, 표적 폴리뉴클레오타이드(P3)는 도 4a 내지 도 4d와 관련하여 기재된 것과 유사한 방식으로 제1 융합 단백질(730) 및 선택적 제2 융합 단백질(740)과 유체 중에서 접촉될 수 있다. 제1 융합 단백질(730)(및 존재하는 경우, 제2 융합 단백질(740))은 유체 중에서 표적 폴리뉴클레오타이드(P3)에 대해 대략 화학량론적 비율로 존재할 수 있다.
제1 융합 단백질(730)은 태그(733)를 포함하고, 커플링된 제1 증폭 어댑터(파선으로 표시됨)를 갖는 제1 트랜스포사제(732)에 커플링된 제1 Cas-gRNA RNP(731)를 포함할 수 있다. 선택적 제2 융합 단백질(740)은 태그(733)를 포함하고, 커플링된 제2 증폭 어댑터(점선으로 표시됨)를 갖는 제2 트랜스포사제(742)에 커플링된 제2 Cas-gRNA RNP(741)를 포함할 수 있다. 태그(733)는 임의의 적합한 방식으로 각각의 Cas-gRNA RNP의 임의의 적합한 부분에 커플링될 수 있다. Cas-gRNA RNP를 트랜스포사제에 커플링하기 위한 비제한적 예는 도 4f 내지 도 4i와 관련하여 상기 추가로 제공된다. 임의의 적합한 증폭 어댑터는 트랜스포사제(732, 742)를 사용하여 표적 폴리뉴클레오타이드에 커플링될 수 있음이 인식될 것이다. 예시적으로, 제1 증폭 어댑터는 P5 어댑터를 포함할 수 있고, 제2 증폭 어댑터는 P7 어댑터를 포함할 수 있다. 선택적으로, 제1 증폭 어댑터는 또한 제1 고유한 분자 식별자(UMI)를 포함할 수 있고, 제2 증폭 어댑터는 제2 UMI를 포함할 수 있다. UMI는 본원의 다른 곳에 기재된 바와 같은 방식으로 시퀀싱 동안 사용될 수 있다.
제1 Cas-gRNA RNP(731)(및 존재하는 경우, 제2 Cas-gRNA RNP(741))의 활성은 촉진하고, 제1 트랜스포사제(732)(및 존재하는 경우, 제2 트랜스포사제(742))의 활성은 억제하는 동안, 도 7b에 예시된 조성물(702)이 제공될 수 있으며, 여기서, 제1 Cas-gRNA RNP(731)는 표적 폴리뉴클레오타이드(P3)에서의 제1 하위서열(710)에 혼성화되고, 존재하는 경우, 제2 Cas-gRNA RNP(741)는 표적 폴리뉴클레오타이드에서의 제2 하위서열(720)에 혼성화된다. 일부 예에서, 도 4a 내지 도 4d와 관련하여 기재된 바와 같은 방식으로 유체의 조건을 사용하여 제1 및 제2 Cas-gRNA RNP(731, 741)의 활성은 촉진될 수 있고, 트랜스포사제(732, 742)의 활성은 억제될 수 있다.
표적 폴리뉴클레오타이드(P3)는 태그(733)를 사용하여 농축될 수 있다. 예를 들어, 도 7c에 예시된 조성물(703)에서, 혼성화된 제1 및 제2 Cas-gRNA RNP(731, 732)(각각 태그(733) 및 트랜스포사제(732, 742)에 커플링됨)를 갖는 표적 폴리뉴클레오타이드는 각각의 링커를 통해 태그 파트너(751)에 커플링된 기재(750)와 접촉하게 될 수 있다. 태그 파트너(751)는 태그(733)에 공유 또는 비-공유 커플링되도록 선택되어, 도 7d에 예시된 바와 같은 조성물(704)을 형성할 수 있으며, 여기서, 표적 폴리뉴클레오타이드(P3)는 태그(733) 및 태그 파트너(751)를 통해 기재(750)에 커플링된다. 기재(750)에 커플링되지 않은 임의의 다른 폴리뉴클레오타이드는 세척될 수 있다.
이후, 제1 및 제2 트랜스포사제(732, 742)의 활성을 촉진하는 동안, 제1 트랜스포사제를 사용하여 제1 증폭 어댑터를 표적 폴리뉴클레오타이드(P3)에서의 제1 위치에 부가할 수 있고, 제2 트랜스포사제를 사용하여 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가할 수 있다. 예를 들어, 트랜스포사제(732, 742)의 활성은 도 4a 내지 도 4d와 관련하여 기재된 바와 같은 방식으로 유체의 제2 조건을 사용하여 촉진될 수 있다. 따라서, 도 7e에 예시된 조성물(705)이 제공될 수 있으며, 여기서, 트랜스포사제(732, 742)는 표적 폴리뉴클레오타이드(P3) 상에 작용하여 이에 제1 및 제2 증폭 어댑터를 커플링시킨다. 폴리뉴클레오타이드(P3)는 제1 및 제2 융합 단백질(730, 740)로부터 방출되어 일 말단에 제1 증폭 어댑터 및 다른 말단에 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드(P3)의 단편(760)을 포함하는 도 7f 예시된 조성물(706)을 제공할 수 있다. 이러한 방출은 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 사용하여 Cas-gRNA RNP(731, 741)를 변성시키는 것에 의해, 태그(733)를 태그 파트너(751)로부터 디커플링하는 것, 태그 파트너(751)와 기재(750) 사이의 링커를 절단하는 것 등에 의해 수행될 수 있다. 대안적으로, 단편(760)은 후속 처리를 위해 기재(750)에 커플링된 상태로 유지될 수 있다. 각각의 예에서, 7f에 예시된, 수득된 농축된 단편(760)(구체적으로 예시되지 않은 기재(750)에 대한 선택적 커플링)은 도 5g 내지 도 5h, 또는 도 5i 내지 도 5j와 관련하여 기재된 바와 같은 방식으로 추가로 분석될 수 있다.
커플링된 증폭 어댑터를 갖는 단편(760)은 증폭 및 시퀀싱될 수 있다. 도 4a 내지 도 4e와 관련하여 기재된 바와 같은 방식으로, 단편(760)의 길이는 예를 들어 제1 서열(710)과 제2 서열(720) 사이의 대략적 거리에 밀접하게 관련될 수 있다. 도 7g에 예시된 단편(760)은 예를 들어 서열들(710, 720) 사이의 거리에 의해 대략적으로 정의된 임의의 적합한 길이를 가질 수 있음이 인식될 것이다. 예를 들어, 단편(760)은 약 100개의 염기쌍 내지 약 1000개의 염기쌍, 예를 들어 약 500개의 염기쌍 내지 약 700개의 염기쌍(예시적으로, 약 600개의 염기쌍), 또는 약 200개의 염기쌍 내지 약 700개의 염기쌍(예시적으로, 약 300개의 염기쌍), 또는 약 100개의 염기쌍 내지 약 200개의 염기쌍(예시적으로, 약 150개의 염기쌍) 길이, 또는 약 1000개 내지 약 3000개의 염기쌍(예시적으로, 약 2000개의 염기쌍) 길이를 가질 수 있다.
임의의 적합한 태그(733) 및 태그 파트너(751)가 표적 폴리뉴클레오타이드(P3)를 기재(750)로 끌어내리는 데 사용될 수 있음이 인식될 것이다. 예를 들어, 태그 파트너(751)는 SNAP 단백질을 포함할 수 있고, 태그(733)는 O-벤질구아닌을 포함할 수 있고; 태그 파트너는 CLIP 단백질을 포함할 수 있고, 태그는 O-벤질시토신을 포함할 수 있거나; 태그 파트너는 SpyTag를 포함할 수 있고, 태그는 SpyCatcher를 포함할 수 있거나; 태그 파트너는 SpyCatcher를 포함할 수 있고, 태그는 SpyTag를 포함할 수 있거나; 태그 파트너는 비오틴을 포함할 수 있고, 태그는 스트렙타비딘을 포함할 수 있거나; 태그 파트너는 스트렙타비딘을 포함할 수 있고, 태그는 비오틴을 포함할 수 있거나; 태그 파트너는 NTA를 포함할 수 있고, 태그는 His-Tag를 포함할 수 있거나; 태그 파트너는 His-Tag를 포함할 수 있고, 태그는 NTA를 포함할 수 있거나; 태그 파트너는 항체(예컨대, 항-FLAG 항체)를 포함할 수 있고, 태그는 항체가 선택적인 항원(예컨대, FLAG 태그)을 포함할 수 있거나; 태그 파트너는 항원(예컨대, FLAG 태그)을 포함할 수 있고, 태그는 항원에 대해 선택적인 항체(예컨대, 항-FLAG 항체)를 포함할 수 있거나; 태그 파트너는 제1 올리고뉴클레오타이드를 포함할 수 있고, 태그는 제1 올리고뉴클레오타이드에 상보적이고, 이에 혼성화하는 제2 올리고뉴클레오타이드를 포함할 수 있다. 태그 파트너(751)는 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 기재(750)에 커플링될 수 있다. 유사하게, 태그(733)는 각각 예를 들어 도 4f 내지 도 4i와 관련하여 기재된 것과 유사한 방식으로 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 Cas-gRNA RNP(731, 732)에 커플링될 수 있다. 일부 예에서, 제1 및 제2 융합 단백질(730, 740) 내의 각각의 gRNA(734, 744)는 도 7g에 예시된 바와 같은 방식으로 태그(733)에 커플링될 수 있다. 예를 들어, 태그에 커플링되는 RNA 올리고뉴클레오타이드는 상업적으로 구매될 수 있으며, 이들의 제작은 당업계에 알려져 있다.
임의의 적합한 Cas 및 임의의 적합한 트랜스포사제가 융합 단백질(730, 740)에서 사용될 수 있음이 인식될 것이다. 예시적으로, Cas는 dCas9를 포함할 수 있고(예를 들어, 트랜스포사제가 활성화되기 전에 Cas가 표적 폴리뉴클레오타이드(P3)를 절단하는 것을 억제하기 위함), 트랜스포사제는 Tn5를 포함할 수 있다(트랜스포사제의 활성이 충분한 양의 마그네슘 이온을 부가하는 것과 같은 유체 조건을 통해 잘 제어될 수 있도록 하기 위함). 다른 예에서, Cas는 Cas12k를 포함할 수 있고, 트랜스포사제는 Tn7 또는 Tn7 유사 트랜스포사제를 포함할 수 있다(예를 들어, 트랜스포사제의 활성이 충분한 양의 마그네슘 이온을 부가하는 것과 같은 유체 조건을 통해 잘 제어될 수 있도록 하기 위함). Cas 및 트랜스포사제는 예를 들어 도 4f 내지 도 4i 또는 문헌[Strecker et al]과 관련하여 기재된 것과 유사한 방식으로 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 서로 커플링될 수 있다.
예를 들어, 도 6a 및 6b는 ShCAST(사이토네마 호프마니 CRISPR 연관 트랜스포사제) 표적화된 라이브러리 제작 및 농축을 위한 프로세스에서의 예시 조성물 및 작업을 개략적으로 예시한다. ShCAST(6000)는 RNA 가이드(6004)를 사용하여 DNA(6003)를 대장균 게놈에서의 특정 부위 내로 삽입할 수 있는 Cas12k(6001) 및 Tn7 유사 트랜스포사제(6002)를 포함한다. 본원에 제공된 일부 예는 ShCAST 또는 특정 유전자의 표적화된 증폭을 위해 Tn5 트랜스포사제를 혼입하는 ShCAST의 변형된 버전(ShCAST-Tn5)을 이용한다. 따라서, 라이브러리 제작 및 농축 단계가 조합되며, 따라서 표적 라이브러리 시퀀싱 작업 흐름의 효율을 단순화 및 개선하고, 자동화를 용이하게 한다.
예시적으로, gRNA(6004)는 특정 유전자(서열)를 표적화하도록 설계될 수 있으며, gRNA들의 간격은 삽입 크기를 제어할 수 있다. 일부 예에서, gRNA(6004) 및/또는 ShCAST/ShCAST-Tn5(6002)는 태그(6005)에 커플링될 수 있으며, 예를 들어 비오틴화될 수 있다. 도 6a에 예시된 바와 같은 방식으로, gRNA(6004) 및 어댑터(6003)(예를 들어, Illumina 어댑터)를 갖는 전이성 인자는 ShCAST의 트랜스포사제(6002) 상에 로딩되어 복합체(6000)를 수득할 수 있다. 도 6b의 프로세스 흐름(6010)에 예시된 바와 같은 방식으로, 수득된 ShCAST/ShCAST-Tn5 복합체(6000)는 태그먼트화를 억제하는 유체 조건 하에서(예를 들어, 낮은 마그네슘 또는 무-마그네슘, Mg2+) 게놈 DNA(표적 폴리뉴클레오타이드)(6011)와 혼합될 수 있는 한편, 도 4a 내지 도 4j, 및 도 7a 내지 도 7g와 관련하여 기재된 것과 유사한 방식으로 복합체를 표적 DNA에서의 각각의 서열에 결합되도록 한다. 이어서, 복합체는 태그화(예를 들어, 비오틴화) gRNA 및/또는 ShCAST/ShCAST-Tn5가 커플링되는 스트렙타비딘 비드(6012)와 같은 태그 파트너에 커플링된 기재를 사용하여 단리될 수 있다. 임의의 결합되지 않은 DNA는 예를 들어 표적 외 태그먼트화를 감소 또는 최소화하도록 세척될 수 있다. 이후, 유체 조건은 변경되어(예를 들어, 마그네슘을 충분히 증가시킴) 도 4a 내지 도 4j와 관련하여 기재된 것과 유사한 방식으로 태그먼트화를 촉진할 수 있다. 갭-충전 결찰 단계에 이어서 열 분리가 사용되어 시퀀싱을 위한 제작에서 비드로부터 라이브러리를 방출할 수 있다.
도 6a 및 도 6b에 예시된 바와 같은 조성물 및 작업에서, 복합체(6000)의 트랜스포사제 부분(6002)은 DNA 내로 랜덤하게 삽입될 수 있음을 유의한다. 이러한 삽입은 태그먼트화를 억제하는 유체 조건(예를 들어, 낮은 마그네슘 또는 무-마그네슘) 하에서 ShCAST/ShCAST-Tn5 복합체와 게놈 DNA를 혼합함으로써 억제 또는 최소화될 수 있으며, 따라서 표적이 결합되도록 한다.
내부에 Cas12k 및 Tn7을 포함하는 ShCAST에 관한 추가의 상세 내용의 경우, 문헌[Strecker et al., "RNA-Guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
태그(733) 또는 태그(6005)는 임의의 적합한 시간에서 태그 파트너(및 따라서 기재)에 커플링될 수 있으며, 이러한 커플링은 반드시 융합 단백질 또는 복합체가 표적 폴리뉴클레오타이드에 결합된 후에 발생할 필요는 없고, 실제로 융합 단백질 또는 복합체가 표적 폴리뉴클레오타이드에 결합되기 전에 발생할 수 있음이 인식되어야 한다. 예시적으로, 도 7g에 예시된 바와 같은 방식으로 태그(733)에 커플링된 gRNA(734, 744)는 태그(733)와 태그 파트너(751) 사이의 상호작용을 사용하여 기재(750)에 커플링될 수 있다. 트랜스포사제를 또한 포함하는 융합 단백질 또는 복합체의 Cas는 이어서 기재-결합된 gRNA에 커플링될 수 있다. 표적 폴리뉴클레오타이드는 이후 Cas에 커플링될 수 있으며, 따라서 표적 폴리뉴클레오타이드를 기재에 커플링시킨다.
도 4j와 관련하여 기재된 프로세스 흐름은 도 6a 및 도 6b 그리고 도 7a 내지 도 7g와 관련하여 기재된 바와 같은 방식으로 태그의 사용을 포함하도록 변형될 수 있음이 또한 인식되어야 한다. 예를 들어, 작업(4001 및 4002)에 대한 임의의 적합한 시기에서, Cas-gRNA RNP에 각각 커플링된 태그는 표적 폴리뉴클레오타이드를 기재 상에 끌어내리는 데 사용될 수 있다. 도 7a 내지 도 7f와 관련하여 기재된 바와 같은 방식으로, 태그는 폴리뉴클레오타이드를 Cas-gRNA RNP와 접촉시키기 전에 Cas-gRNA RNP에 커플링될 수 있고; 대안적으로, 태그는 gRNA 및 기재에 커플링된 태그 파트너에 커플링될 수 있으며, Cas-트랜스포사제 융합 단백질 또는 복합체는 gRNA와 접촉하게 된다. 이후 작업(4003)은 트랜스포사제의 활성을 촉진하고, 증폭 어댑터를 표적 폴리뉴클레오타이드에 부가하도록 수행될 수 있다.
따라서, 폴리뉴클레오타이드는 임의의 적합한 위치의 쌍에서 절단되어 단편을 형성할 수 있으며, 임의의 적합한 증폭 프라이머가 Cas-gRNA RNP/트랜스포사제 융합 단백질을 사용하여 단편의 수득된 말단에 커플링될 수 있음이 이해될 수 있다. 이어서, 단편은 증폭 및 시퀀싱될 수 있다.
표적화된 후성적 검정을 위한 조성물 및 방법
본원의 일부 예는 후성적 관심의 단편을 생성하는 폴리뉴클레오타이드(예컨대, DNA)의 농축 및 Cas-gRNA RNP를 사용하여 이들 단편을 따라 유전자좌에서 단백질을 검정하는 것을 제공한다. 몇몇의 비제한적 검정의 예가 특정 작업흐름의 작업 및 배치로 제공되지만, 다른 예가 용이하게 계획될 수 있다. 본 예에서, 단편을 따라 단백질은 이후 시퀀싱되는 올리고뉴클레오타이드를 사용하여 표지될 수 있고, 올리고뉴클레오타이드는 단백질을 특성분석하는 데 사용될 수 있다. 예를 들어, 올리고뉴클레오타이드 서열은 소정의 단편의 유전자좌에서의 단백질의 존재에 대한 정보를 제공할 수 있거나, 소정의 단편의 유전자좌에서의 단백질의 위치에 대한 정보를 제공할 수 있거나, 소정의 단편의 유전자좌에서의 단백질의 양에 대한 정보를 제공할 수 있거나, 이러한 정보의 임의의 적합한 조합을 제공할 수 있다. 단편은 농축되고, 예를 들어 소정의 폴리뉴클레오타이드로부터 특별히 선택될 수 있는 한편, 해당 폴리뉴클레오타이드의 다른 부분 및 다른 폴리뉴클레오타이드 중 일부는 폐기될 수 있다. 이러한 유전자좌-연관 단백질체 분석이 예시적으로 사용되어 전장 게놈 시퀀싱을 보완하여 유전자형 표현형 사이의 관계의 강화된 특성화를 제공하거나, 특정 유전자좌와 연관된 후성적 특성을 보다 잘 특성화하고, 연구 또는 임상적 적용 및 요법을 위해서 중요한 후성적 메커니즘을 이해하도록 하는 게놈 전체의 단백질체 지도(genome-wide proteomic atlas)를 제공할 수 있다.
예를 들어, 도 5a 내지 도 5k는 표적화된 후성적 검정에 대한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 5a에 예시된 바와 같이, 조성물(501)은 제1 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제1 하위서열(511)(즉, Cas-gRNA RNP의 gRNA가 혼성화할 수 있는 서열 포함) 및 제2 Cas-gRNA RNP를 사용하여 표적화될 수 있는 제2 하위서열(512)을 포함하는 표적 폴리뉴클레오타이드 P2(예컨대, 이중 가닥 DNA)를 포함할 수 있다. 표적 폴리뉴클레오타이드(P2)는 예를 들어 도 2a 내지 도 2k, 도 3a 내지 도 3e, 또는 도 4a 내지 도 4j와 관련하여 본원의 다른 곳에 보다 상세하게 기재된 바와 같은 방식으로 생성된 단편을 포함할 수 있거나, 전체 염색체 또는 이의 일부를 포함할 수 있다. 단백질(521, 522) 및 염색질(523)은 제1 및 제2 하위서열(511, 512) 사이의 표적 폴리뉴클레오타이드(P2)의 각각의 유전자좌에 커플링될 수 있다. 선택적으로, 단백질(521, 522)은 예를 들어 이들을 표적 폴리뉴클레오타이드(P2)를 따라 제자리에 남겨두는 것과 같이 후기 처리 작업 동안 이들의 안정성을 강화하는 한편, 하기 기재되는 바와 같은 방식으로 상응하는 항체에 의해 선택적으로 표적화되는 이들의 능력을 보존하기 위해 가교될 수 있다.
도 5b에 예시된 예시 조성물(502)에서, 표적 폴리뉴클레오타이드(P2)는 제1 Cas-gRNA RNP(531) 및 제2 Cas-gRNA RNP(532)와 유체 중에서 접촉될 수 있다. 제1 Cas-gRNA RNP(531) 및 제2 Cas-gRNA RNP(532)는 각각 제1 및 제2 하위서열(511, 512) 사이의 표적 폴리뉴클레오타이드(P2) 중 일부를 선택적으로 끌어내리는 데 사용될 수 있는 각각의 태그(533)를 포함할 수 있으며, 따라서, 도 5d 내지 도 f와 관련하여 하기 보다 상세하게 기재되는 바와 같은 방식으로 폴리뉴클레오타이드 중 해당 부분을 농축한다. 비제한적 예에서, Cas는 표적 폴리뉴클레오타이드(P2)를 절단할 수 있는 Cas9 또는 다른 적합한 Cas를 포함한다. 제1 및 제2 Cas-gRNA RNP(531, 532)는 표적 폴리뉴클레오타이드(P2)에서의 제1 및 제2 하위서열(511, 512)에 혼성화하고, 제1 및 제2 하위서열에서 표적 폴리뉴클레오타이드를 각각 절단하여 단편을 형성한다. 예시적으로, 도 5c에 예시된, 수득된 조성물(503)은 이의 각각의 유전자좌에 커플링된 하나의 제1 단백질(521), 2개의 제2 단백질(522), 및 염색질(523)뿐만 아니라 태그(533)에 각각 커플링되고, 하위서열(511, 512)에 각각 혼성화되며, 따라서 태그(533)를 단편(540)에 커플링시키는 제1 및 제2 Cas-gRNA RNP(531, 532)를 갖는 단편(540)을 포함한다. 단편(540)은 예를 들어 약 100개의 염기쌍 내지 약 1000개의 염기쌍, 예컨대 약 500개의 염기쌍 내지 약 700개의 염기쌍, 또는 약 200개의 염기쌍 내지 약 400개의 염기쌍, 또는 약 100개의 염기쌍 내지 약 200개의 염기쌍의 임의의 적합한 길이, 또는 약 1000개 내지 약 3000개의 염기쌍(예시적으로, 약 2000개의 염기쌍) 길이를 가질 수 있다. 폴리뉴클레오타이드(P2)의 나머지 부분(541, 542)은 임의의 길이를 가질 수 있고, 일부 예에서, 단편(540)의 제거 후에 염색체의 잔부(balance)를 형성할 수 있다.
단편(540)은 태그(533)를 사용하여 농축될 수 있다. 예를 들어, 도 5d에 예시된 바와 같이, 혼성화된 제1 및 제2 Cas-gRNA RNP(531, 532)(각각 태그(533)에 커플링됨)를 갖는 단편(540)뿐만 아니라 폴리뉴클레오타이드(P2)의 나머지 부분(541, 542)은 각각의 링커를 통해 태그 파트너(551)에 커플링된 기재(550)와 접촉하게 될 수 있다. 태그 파트너(551)는 태그(533)에 공유 또는 비-공유 커플링하도록 선택되어 도 5e에 예시된 바와 같은 조성물을 형성할 수 있으며, 여기서, 단편(540)은 태그(533) 및 태그 파트너(551)를 통해 기재(550)에 커플링되는 한편, 나머지 부분(541, 542)은 기재(550)에 커플링되지 않고, 세정될 수 있다. 이어서, 단편(540)은 예를 들어 Cas-gRNA RNP(531, 532)를 변성하는 것에 의해(이 경우, 단백질(521, 522)은 이들의 변성을 억제하기 위해 이전에 가교되었을 수 있음), 태그(533)를 태그 파트너(551)로부터 디커플링하거나, 태그 파트너(551)와 기재 사이의 링커를 절단하는 것 등에 의해 기재(550)로부터 방출될 수 있다. 대안적으로, 단편(540)은 후속 처리를 위해 기재(550)에 커플링된 상태로 유지될 수 있다. 각각의 예에서, 5f에 예시된, 수득된 농축된 단편(540)(구체적으로 예시되지 않은 기재(550)에 대한 선택적 커플링)은 도 5g 내지 도 5h, 또는 도 5i 내지 도 5j와 관련하여 기재된 바와 같은 방식으로 추가로 분석될 수 있다.
임의의 적합한 태그(533) 및 태그 파트너(551)는 단편(540)을 끌어내리는 데 사용될 수 있음이 인식될 것이다. 예를 들어, 태그 파트너(551)는 SNAP 단백질을 포함할 수 있고, 태그(533)는 O-벤질구아닌을 포함할 수 있거나; 태그 파트너는 CLIP 단백질을 포함할 수 있고, 태그는 O-벤질시토신을 포함할 수 있거나; 태그 파트너는 SpyTag를 포함할 수 있고, 태그는 SpyCatcher를 포함할 수 있거나; 태그 파트너는 SpyCatcher를 포함할 수 있고, 태그는 SpyTag를 포함할 수 있거나; 태그 파트너는 비오틴을 포함할 수 있고, 태그는 스트렙타비딘을 포함할 수 있거나; 태그 파트너는 스트렙타비딘을 포함할 수 있고, 태그는 비오틴을 포함할 수 있거나; 태그 파트너는 NTA를 포함할 수 있고, 태그는 His-Tag를 포함할 수 있거나; 태그 파트너는 His-Tag를 포함할 수 있고, 태그는 NTA를 포함할 수 있거나; 태그 파트너는 항체(예컨대, 항-FLAG 항체)를 포함할 수 있고, 태그는 항체가 선택적인 항원(예컨대, FLAG 태그)을 포함할 수 있거나; 태그 파트너는 항원(예컨대, FLAG 태그)을 포함할 수 있고, 태그는 항원에 대해 선택적인 항체(예컨대, 항-FLAG 항체)를 포함할 수 있거나; 태그 파트너는 제1 올리고뉴클레오타이드를 포함할 수 있고, 태그는 제1 올리고뉴클레오타이드에 상보적이고, 이에 혼성화하는 제2 올리고뉴클레오타이드를 포함할 수 있다. 태그(533)는 각각 예를 들어 도 4f 내지 도 4i, 또는 도 7g와 관련하여 기재된 것과 유사한 방식으로 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 Cas-gRNA RNP(531, 532)에 커플링될 수 있다. 유사하게, 태그 파트너(551)는 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 기재(550)에 커플링될 수 있다.
본원에 제공된 바와 같이, 상응하는 올리고뉴클레오타이드가 단편(단편은 도 5a 내지 도 5f와 관련하여 기재된 바와 같은 방식으로 제작 및 농축될 수 있음)의 각각의 유전자좌에 커플링된 각각의 단백질(521, 522)을 각각 표지하기 위해 사용될 수 있으며, 이러한 올리고뉴클레오타이드는 이어서 시퀀싱될 수 있다. 상응하는 올리고뉴클레오타이드를 사용하여 단백질은 식별될 수 있고/있거나 유전자좌는 식별될 수 있고/있거나 단백질을 정량화될 수 있다.
이제 도 5g 내지 도 5h와 관련하여 설명될 일부 예에서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는 농축된 단편(540)을 상이한 단백질에 특이적인 항체들 혼합물과 접촉시키는 단계를 포함할 수 있으며, 각각의 항체는 단백질을 특성화하기 위한 이러한 방식으로 단백질을 표지하는 데 사용될 수 있는 상응하는 올리고뉴클레오타이드에 커플링된다. 예를 들어, 도 5g에 예시된 조성물(504)은 상응하는 제1, 제2, 제3, 및 제4 올리고뉴클레오타이드에 각각 커플링되는 복수의 각각의 제1, 제2, 제3, 및 제4 항체(551, 552, 553, 554)와 접촉하는 농축된 단편(540)을 포함한다. 각각의 항체(551, 552, 553, 554)는 상이한 단백질에 특이적이다. 농축된 단편(540)은, 잠재적으로 해당 단편을 따라 유전자좌에 커플링할 수 있으며, 후성적 관심의 것일 수 있는 상이한 단백질 또는 다른 염색질에 특이적인 임의의 적합한 수 및 유형의 상이한 항체와 접촉될 수 있음이 인식될 것이다. 농축된 단편(540)의 각각의 유전자좌에 커플링된 단백질에 특이적인 혼합물 중의 임의의 항체의 경우, 이들 항체 및 상응하는 올리고뉴클레오타이드는 항체/표적 결합을 통해 이들 단백질에 비-공유 커플링될 수 있다. 도 5e에 예시된 비제한적 예시 조성물(505)에서, 제1 항체(551)는 제1 단백질(521)에 특이적이고, 커플링되는 한편, 제2 항체(552)는 제2 단백질(522)에 특이적이고, 커플링된다. 복수의 제2 단백질(522)은 유전자좌의 각각의 하나에 커플링되고, 혼합물 중의 복수의 제2 항체(552)는 해당 유전자좌에서 단백질에 커플링됨을 유의한다. 이 예에서, 농축된 단편(540)은 제3 및 제4 항체(553, 554)가 특이적인 단백질을 포함하지 않으며, 따라서 이들 항체(및 이들의 각각의 올리고뉴클레오타이드)는 단편에 커플링되지 않는다.
맞춤 올리고뉴클레오타이드-컨쥬게이트된 항체는 상업적으로 입수 가능하거나, 예를 들어 다음 참고문헌에 기재된 바와 같은 알려진 기술을 사용하여 제작될 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Gong et al., "Simple method to prepare oligonucleotide-conjugated antibodies and its application to multiplex protein detection in single cells," Bioconjugate Chem. 27: 217-225 (2016)] 및 문헌[Stoeckius et al., "Simultaneous epitope and transcriptome measurement in single cells," Nature Methods 14: 865-868 (2017)].
항체(551, 552)에 각각 커플링된 제1 및 제2 올리고뉴클레오타이드는 시퀀싱되고, 농축된 단편(540) 내의 단백질(521, 522)의 존재 및 선택적으로 양을 식별하는 데 각각 사용될 수 있다. 일부 예에서, 제1 및 제2 올리고뉴클레오타이드는 예를 들어 단백질(521, 522) 및 항체(551, 552)를 소화하는 프로테아제를 적용하여 단편(540)으로부터 방출되고, 이어서 증폭 및 시퀀싱될 수 있다. 이러한 시퀀싱은 임의의 적합한 방식으로 수행될 수 있다. 예를 들어, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드를 예를 들어 llumina BeadArray™ 기술(미국 캘리포니아주 샌디에이고 소재)을 사용하여 비드 어레이에 혼성화하는 단계 또는 상응하는 올리고뉴클레오타이드 상의 합성에 의한 시퀀싱(SBS)을 수행하는 단계를 포함할 수 있다. 올리고뉴클레오타이드는 선택적으로 증폭 어댑터(예를 들어, P5 및 P7 어댑터 또는 Y-형상 어댑터) 및/또는 UMU를 포함할 수 있거나, 이러한 어댑터 및/또는 UMI는 증폭 및 시퀀싱 전에 PCR와 같은 알려진 기술을 사용하여 올리고뉴클레오타이드에 부가될 수 있다.
사용되는 특정 시퀀싱 방법과 상관없이, 상응하는 올리고뉴클레오타이드의 각각의 존재는 농축된 단편(540)에 커플링된 단백질을 식별 및 선택적으로 정량화하는 데 사용될 수 있다. 예를 들어, 제1 및 제2 올리고뉴클레오타이드의 존재는 비드 어레이 또는 SBS를 사용하여 검출될 수 있고, 이러한 존재를 바탕으로, 제1 및 제2 단백질(521, 522)이 단편(540)에서 존재하였음이 추정될 수 있다. 상응하는 올리고뉴클레오타이드의 각각의 양은 또한 단백질을 정량화하는 데 사용될 수 있다. 예를 들어, 농축된 단편(540)은 2개의 제2 단백질(522)을 포함하였기 때문에, 제1 항체(551)의 하나의 복제물 및 제1 올리고뉴클레오타이드의 하나의 복제물에 커플링된 하나의 제1 단백질(521)과 대조적으로, 제2 항체(552)의 2개의 복제물은 제2 올리고뉴클레오타이드의 2개의 복제물과 함께 이에 커플링되었다. 제1 올리고뉴클레오타이드(하나의 복제물) 및 제2 올리고뉴클레오타이드(2개의 복제물)의 상대적 양은 농축된 단편(540) 내의 제1 단백질(521)(하나의 복제물) 및 제2 단백질(522)(2개의 복제물)의 상대적 양을 나타낸다. 제3 및 제4 올리고뉴클레오타이드의 부재는 제3 및 제4 항체(553, 554)가 각각 선택적인 단백질이 농축된 단편(540)에서 존재하지 않았음을 나타낸다. 따라서, 본 방법은 농축된 단편(540), 보다 구체적으로는 농축된 단편(540)을 따라 유전자좌에 커플링된 단백질의 후성적 특성의 검정을 제공한다.
이제 도 5i 내지 도 5j와 관련하여 설명될 다른 예에서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는 단편을 복수의 트랜스포사제와 접촉시키는 단계를 포함할 수 있으며, 각각의 트랜스포사제는 단백질을 특성화하기 위한 이러한 방식으로 단백질을 표지하는 데 사용될 수 있는 상응하는 올리고뉴클레오타이드에 커플링된다. 예를 들어, 도 5i에 예시된 조성물(506)은 각각 올리고뉴클레오타이드를 포함하는 복수의 트랜스포사제(561)와 접촉하는 농축된 단편(540)(도 5a 내지 도 5f와 관련하여 기재된 이러한 방식으로 제작될 수 있음)을 포함한다. 비제한적 예에서, 트랜스포사제는 Tn5를 포함한다.
농축된 단편의 각각의 유전자좌에 커플링된 단백질은 트랜스포사제의 활성을 당해 유전자좌에서 억제한다. 따라서, 트랜스포사제(561)는 당해 유전자좌 이외의 위치에서 단편(540)에 커플링될 수 있다. 트랜스포사제(561)가 단편(540)에 커플링되는 위치에서, 트랜스포사제는 상응하는 올리고뉴클레오타이드를 단편에 커플링시킬 수 있다. 이러한 프로세스는 단편(540)을 하위단편으로 분할할 수 있다. 도 5j에 예시된 비제한적 예시 조성물(507)에서, 하위단편(571)은 제1 단백질(521) 및 올리고뉴클레오타이드를 포함하고, 하위단편(572)은 염색질(523) 및 올리고뉴클레오타이드를 포함하고, 하위단편(573)은 단백질(522) 및 올리고뉴클레오타이드를 포함한다. 이와 관련하여, 트랜스포사제(561)(도 5i에 예시됨)는 단백질(521, 522) 또는 염색질(523)의 존재에 의해 억제되지 않은 임의의 위치(즉, 단편의 소정의 단백질 또는 일부에 특이적이지 않음)에서 단편(540)에 커플링될 수 있기 때문에, 이러한 트랜스포사제는 이들의 각각의 올리고뉴클레오타이드를 이러한 임의의 위치에 부가할 수 있음을 유의한다.
제2, 제1, 및 제3 단편(571, 572, 573)에 각각 커플링된 올리고뉴클레오타이드는 시퀀싱되고, 예를 들어 도 5g 내지 도 5h와 관련하여 기재된 바와 같은 방식으로 단백질(521, 522) 및 염색질(523)의 존재 및 선택적으로 양을 식별하는 데 각각 사용될 수 있다. 올리고뉴클레오타이드의 단편(571, 572, 573)에서의 각각의 위치는 단백질 및/또는 염색질의 각각의 유전자좌를 식별하는 데 사용될 수 있다. 예를 들어, 도 5i 및 도 5j에 나타낸 순수하게 예시적 관점에서, 단백질(521)은 임의의 트랜스포사제가 해당 단백질의 유전자좌에서 작용하는 것을 억제하고, 단백질(522)은 임의의 트랜스포사제가 이들 단백질의 유전자좌에서 작용하는 것을 억제하고, 염색질(523)은 임의의 트랜스포사제가 해당 염색질이 위치하는 곳에서 작용하는 것을 억제한다. 따라서, 단편의 제2, 제1, 및 제3 올리고뉴클레오타이드(572, 571, 573)에서의 단백질(522, 521) 및/또는 염색질(523)의 각각의 위치는 올리고뉴클레오타이드가 부가되었던 위치 이외의 위치일 수 있음이 이해될 수 있다.
도 5k는 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성화 방법(5000)에서의 예시 작업 흐름을 예시한다. 방법(5000)은 표적 폴리뉴클레오타이드를 예를 들어 도 5a 내지 도 5c와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 Cas-gRNA RNP와 접촉시키는 단계(작업(5001))를 포함할 수 있다. 선택적으로 방법(5000)은 상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하기 전에 단편을 농축하는 단계를 포함할 수 있다. 일부 예에서, 제1 및 제2 Cas-gRNA RNP는 각각 태그에 커플링될 수 있어서 단편이 예를 들어 도 5b 내지 도 5c와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링되도록 한다. 농축 단계는 예를 들어 도 5d와 관련하여 기재된 바와 동일한 방식으로 제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링된 단편을 태그 파트너에 커플링된 기재와 접촉시키는 단계를 포함할 수 있다. 농축 단계는 예를 들어 도 5e와 관련하여 기재된 바와 동일한 방식으로 태그를 태그 파트너에 커플링시켜서 단편을 기재에 커플링시키는 단계를 추가로 포함할 수 있다. 농축 단계는 예를 들어 도 5f와 관련하여 기재된 바와 동일한 방식으로 기재에 커플링되지 않은 표적 폴리뉴클레오타이드 중의 임의의 부분을 제거하는 단계를 추가로 포함할 수 있다.
방법(5000)은 제1 및 제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계를 포함할 수 있으며, 단백질은 예를 들어 도 5a 내지 도 5c와 관련하여 기재된 바와 같은 방식으로 제1 하위서열과 제2 하위서열 사이의 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된다(작업(5002)). 방법(5000)은 표적 폴리뉴클레오타이드를 제1 Cas-gRNA RNP를 사용하여 제1 하위서열에서 그리고 제2 Cas-gRNA RNP를 사용하여 제2 하위서열에서 절단하여 단편을 형성하는 단계를 포함할 수 있으며, 단백질은 예를 들어 도 5a 내지 도 5c와 관련하여 기재된 바와 같은 방식으로 단편의 각각의 유전자좌에 커플링된다(작업(5003)). 방법(5000)은 상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하는 단계(작업(5004)) 및 예를 들어 도 5g 내지 도 5h와 관련하여 기재된 바와 같은 방식 및/또는 도 5i 내지 도 5j와 관련하여 기재된 바와 같은 방식으로 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계(작업(5005))를 포함할 수 있다.
도 5g 내지 도 5h 및 도 5i 내지 도 5j와 관련하여 각각 기재된 바와 같은 프로세스 흐름은 임의의 적합한 길이의 폴리뉴클레오타이드를 사용하여 수행될 수 있으며, 도 5a 내지 도 5c와 관련하여 기재된 바와 같은 프로세스 흐름을 사용하여 생성되었던 단편을 사용하여 반드시 수행될 필요는 없음이 인식될 것이다. 따라서, 도 5k와 관련하여 기재된 방법(5000)의 작업(5001 내지 5003)은 선택적인 것으로 이해되어야 한다.
따라서, 도 5a 내지 도 5k로부터, 본원의 일부 예에서, Cas-gRNA RNP는 단백질에 커플링된 폴리뉴클레오타이드 단편을 생성 및 농축하고, 이들 단백질의 위치, 양, 및/또는 식별이 본원에 기재된 바와 같은 후성적 검정을 사용하여 특성화될 수 있음이 이해될 수 있다.
Cas-gRNA RNP 닉카제를 사용한 폴리뉴클레오타이드의 선택된 단편의 농축
본원에 제공된 일부 방법은 온전한 dsDNA 단편의 표적화된 시퀀싱을 위한 길고, 힘든 작업 흐름의 문제를 해결한다. 본 개시내용으로부터 분명할 것인 바와 같이, Cas-gRNA RNP는 폴리뉴클레오타이드, 예를 들어 dsDNA에서의 표적 영역의 신속하고, 특이적 절단을 제공할 수 있다. 이제 도 8a 내지 도 8h와 관련하여 기재될 것인 바와 같이, Cas-gRNA RNP 닉카제 및 폴리머라제 연장이 사용되어 기재로부터의 용출을 통해 dsDNA 단편을 선택적으로 농축할 수 있다. 이러한 방법 및 조성물은 온전화 원래 단편을 회수하는 데 사용될 수 있다. 이는 특히 Cas-gRNA RNP에 의한 전체 dsDNA 절단이 예를 들어 무세포 DNA(cfDNA: cell free DNA)를 시퀀싱하는 데 바람직하지 않을 수 있는 적용에서 유용하다. 이는 또한 또는 대안적으로 시퀀싱 라이브러리의 기저 크기가 CRISPR 절단에 의해 변하지 않으며, 이는 매우 짧은 산물의 생성을 감소 또는 방지함을 의미할 때 유용할 수 있다.
보다 구체적으로, 도 8a 내지 도 8h는 Cas-gRNA RNP 닉카제를 사용하여 선택된 폴리뉴클레오타이드 단편을 농축하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 8a는 표적 영역의 선택적 용출을 위한 CRISPR 닉카제 연장에 대한 예시 프로세스 흐름의 개요를 예시한다. 프로세스 흐름의 작업 A에서, dsDNA 단편(P4)(본원에 다른 곳에 기재된 바와 같은 방식으로 선택적으로 생성될 수 있음)은 비드에 대한 단편의 커플링을 용이하게 하도록 3' 기능화("B")될 수 있다. 예를 들어, 단편은 도 8c와 관련하여 하기 기재되는 바와 같은 방법을 사용하여 3' 비오틴화될 수 있다. 단편(P4) 중 일부는 농축 및 검출하기 원하는 각각의 표적 서열(들)을 포함할 수 있는 한편, 다른 단편은 이러한 서열(들)을 반드시 포함하지 않을 수도 있다. 예를 들어, 도 8a에 예시된 단편(P4)은 표적 서열(810)을 포함하는 한편, 다른 단편은 다른 표적 서열을 포함할 수 있거나, 이러한 임의의 표적 서열을 포함하지 않을 수 있다.
도 8a에 예시된 프로세스 흐름의 작업 B에서, 3' 기능화된 단편(P4)은 하나 이상의 기재, 예를 들어 3' 기능화된 단편(P4)에 커플링되도록 이러한 방식으로 기능화된 비드에 커플링될 수 있다. 비제한적 일예에서, 비드(820)는 3' 비오틴화 단편(P4)이 커플링되는 스트렙타비딘을 포함할 수 있다. 예시된 예에서, dsDNA 단편(P4)의 각각의 기능화된 3' 말단은 상이한 비드(820)에 커플링되지만, 다른 예에서, 소정의 단편(P4)의 3' 기능화된 말단은 서로 동일한 비드에 커플링될 수 있음이 이해될 것이다. 비드(820)는 용액으로부터 꺼낼 수 있으며(예를 들어, 비드는 강자성 또는 상자성일 수 있으며, 외부 자석을 사용하여 용액으로부터 꺼낼 수 있음), 비드는 이어서 세정되어 비드에 커플링된 정제된 dsDNA 단편(P4)을 제공하는 한편, 임의의 다른 dsDNA는 실질적으로 세정될 수 있다.
도 8a에 예시된 바와 같이, 작업 C에서, 비드-커플링된 단편(P4)은 복수의 Cas-gRNA RNP 닉카제(본원에서 CRISPR 닉카제로도 지칭됨)와 접촉될 수 있다. 각각의 Cas-gRNA RNP 닉카제의 gRNA는 dsDNA의 각각의 단일 가닥 내의 특이적 영역(하위서열)을 표적으로 할 수 있으며, 영역은 닉카제가 서로 벗어나고, 농축하기를 원하는 이중 가닥 표적 영역(810)의 대향 측면 상에 존재하는 위치에서 각각의 가닥을 절단하도록 엇갈릴 수 있다. 예를 들어, 도 8a의 작업 C에 예시된 바와 같은 방식으로, 제1 Cas-gRNA RNP 닉카제(851)의 gRNA는 표적 서열(810)의 전방("전방")인 영역을 표적으로 할 수 있고, 제2 Cas-gRNA RNP 닉카제(852)의 gRNA는 표적 서열(810)의 후방("후방")인 영역을 표적으로 할 수 있다. 따라서, 제1 및 제2 닉카제(851, 852)의 가이드 서열은 전방 및 후방 방향에서 표적 서열(810)의 "측면에 배치"되는 것으로 간주될 수 있다. 제1 Cas-gRNA RNP 닉카제(851)는 비드-커플링된 dsDNA 단편(P4)의 일 가닥에서의 닉(nick)(절단)을 생성하고, 제2 Cas-gRNA RNP 닉카제(852)는 닉카제(851)에 의해 생성된 것으로부터 벗어난 위치에서 비드-커플링된 dsDNA 단편(P4)의 다른 가닥에서의 닉(절단)을 생성한다. 임의의 적합한 수의 gRNA가 상응하는 Cas-gRNA RNP 닉카제가 dsDNA 단편 내의 특정 서열 측면에 배치되는 위치에서 각각의 가닥을 절단하도록 설계될 수 있음이 인식될 것이다. 예를 들어, 다수의 상이한 gRNA(예를 들어, 1000개 내지 100,000개의 gRNA 또는 100,000개 초과의 gRNA)가 샘플 내의 관심의 다수의 상이한 서열을 동시에 농축하도록 사용될 수 있다. gRNA가 소정의 표적 서열(810)의 "측면에 배치"되는 것이 반드시 필요하지는 않되, 오히려 표적 서열당 적어도 2개의 가이드가 소정의 단편(P4) 내의 대향 가닥 상에 결합하고, 닉을 생성할 수 있음을 유의한다.
도 8a의 작업 D에 예시된 바와 같이, Cas-gRNA RNP 닉카제(851, 852)는 Cas-gRNA RNP 닉카제를 파괴하기 위한 예를 들어 온화한 열 및/또는 시약, 예컨대 프로테이나제 K, 프로테아제, 또는 SDS 세정제를 사용하여 닉의 3' 말단을 노출시키도록 제거된다. 각각의 소정의 dsDNA 단편(P4)의 가닥은 서로 혼성화된 상태로 유지되기 때문에, 단편은 실질적으로 상응하는 비드(들)(820)에 커플링된 상태로 유지된다.
dsDNA의 가닥에서의 대향 닉의 측면에 배치되는 표적 서열(810)은 이어서 선택적으로 용액 내로 용출될 수 있는 한편, 단편(P4)의 나머지 부분은 비드(들)(820)에 커플링된 상태로 유지된다. 예를 들어, 닉형성된 단편(nicked fragment)(P4)은 폴리머라제 및 뉴클레오타이드(구체적으로 예시되지 않음)와 접촉될 수 있다. 도 8a의 작업 E에 예시된 바와 같은 방식으로, 폴리머라제는 닉에 의해 노출된 3' 말단으로부터 단편의 각각의 가닥을 연장시킬 수 있으며, 이러한 연장은 결합된 가닥을 치환시켜서 표적 서열(810)을 용출시킬 수 있다. 비-표적화된 영역은 비드(들)(820)에 커플링된 상태로 유지되고, 예를 들어 자석 또는 다른 분리 기술을 사용하여 용출된 표적 서열(810)로부터 분리된다. 폴리머라제 연장은 닉이 단편(P4) 내에서 발생하였던 위치와 상관없이 온전한 서열(810)을 용출시킨다.
Cas9 닉카제 및 폴리머라제 연장을 사용하여 람다 DNA에서의 표적을 농축하여 기재로부터 용출시키기 위한 예시 작업흐름
도 8a는 Cas9 닉카제를 사용하여 람다 DNA에서의 표적을 농축하는 데 사용될 수 있는 예시적 작업흐름을 예시한다. 람다 게놈의 4개의 영역을 표적화하는 특정 가이드 RNA 서열이 사용된다. 도 12 내지 도 16은 하기 보다 상세하게 기재되는 다양한 단계의 작업흐름 후의 라이브러리 구조의 개략도를 제공한다. 표 1은 가이드 RNA 서열뿐만 아니라 이들이 표적화하는 영역을 제공하고 있다.
[표 1]
Cas9 효소가 가이드 RNA 서열과 함께 로딩된다. 가이드 서열은 1 uM의 가이드, 1 uM의 Cas9 닉카제(Integrated DNA Technologies, Alt-R® S.p. Cas9 D10A 닉카제 V3, 1081062), 및 1x 인산 완충 생리 식염수를 함유하는 50 uL의 최종 부피 중의 Cas9 상에 별도로 로딩된다. 구성요소들을 실온에서 10분 동안 그대로 두고, 이어서 동일한 부피 중에 풀링(pool)하여 Cas9 닉형성 믹스를 제조한다. 용액은 사용 전까지 얼음 상에 저장된다.
비드-연결된 트랜스포좀을 이용한 태그먼트화에 의한 라이브러리 제작
3' 말단에 의해 작은 표면에 부착된 라이브러리가 비드-연결된 트랜스포좀을 사용하여 제조되었다.
단계 1: 500 ng의 람다 DNA는 50 uL의 총 부피 중의 농축 키트를 이용한 Illumina DNA 제작으로부터의 10 uL의 TB1과 10 uL의 eBLT로 인큐베이션되었다. 혼합물은 41℃에서 5시간 동안 가열되었다.
단계 2: Tn5는 10 uL의 ST2를 첨가하고, 37℃에서 5분 동안 가열하여 제거되었다.
도 12는 단계 2 후의 라이브러리 구조를 보여준다. 요소(1200)는 DNA 삽입물에서의 PAM 부위를 보여준다.
단계 3: 반응 플레이트가 자석 스탠드 상에 배치되고, 비드가 펠릿화되도록 하였다. 상청액이 제거되고, 150 uL의 TWB를 첨가하여 비드가 세정되었다. 이어서, 자석이 제거되고, 용액은 피펫팅을 통해 혼합되었다. 비드는 자석 상에서 다시 펠릿화되고, 이후 자석이 제거되었다. 상청액은 폐기되었다.
단계 4: 50 uL의 ELM(Illumina DNA 제작 PCR 자유 키트)가 용액에 첨가되었다. 용액은 37℃에서 15분 동안 인큐베이션되어 갭을 충전하고, 삽입물의 3' 말단과 트랜스포존의 비-전달된 가닥 사이를 결찰하였다.
도 13은 단계 4 후의 라이브러리 구조를 보여준다. 요소(1200)는 DNA 삽입물에서의 PAM 부위를 보여준다.
단계 5: 비드는 자석 상에 펠릿화된다. 상청액이 제거되고, TWB로 세정되었다.
단계 6: 백그라운드에 원인이 될 수 있는 임의의 불완전하게 충전된 갭 및 결찰된 단편은 50 uL 부피의 1x NEBuffer 1(New England Biolabs) 중의 0.5 uL의 엑소뉴클레아제 III(New England Biolabs, M0206)를 첨가하여 제거되었다. 비드는 피펫 혼합 및 37℃으로의 10분 동안의 가열에 의해 재현탁되었다.
Cas9 닉형성 반응(nicking reaction)
단계 1: 상청액은 20 uL의 총 부피의 1x NEBuffer 2.1(New England Biolabs)을 갖는 2 uL의 풀링된, 로딩된 Cas9 닉카제를 첨가하여 제거되었다. 비드는 피펫 혼합 및 37℃으로의 30분 동안의 가열에 의해 재현탁되었다.
도 14는 Cas9가 각각의 가닥 상의 표적 단편은 닉형성한 방식을 보여준다.
단계 2: Cas9는 10 uL의 ST2를 첨가하고, 37℃에서 5분 동안 가열하여 제거되었다. 비드가 펠릿화되고, TWB로 두 차례 세정되었다. 상청액은 폐기되었다.
도 15는 각각의 가닥에 하나의 닉을 갖는 이 지점에서의 라이브러리 구조를 보여준다. 요소(1200)는 DNA 삽입물에서의 PAM 부위를 보여준다.
비드로부터 표적 단편을 용출하기 위한 폴리머라제 연장
0.5 uL의 DNA 폴리머라제 I(New England Biolabs, M0210) 또는 Bsu DNA 폴리머라제(New England Biolabs, M0330)가 용액에 첨가되었다. 1x NEBuffer 2(New England Biolabs)가 사용되고, 200 uM의 각각의 dNTP가 50 uL의 총 부피로 첨가되었다. 용액은 37℃에서 10시간 동안 가열되었다.
도 16은 폴리머라제 연장 후의 것을 보여준다. 나타낸 바와 같이, 단편은 더 이상 3' 비오틴을 갖지 않으며, 따라서 용액 내로 방출된다. 요소(1200)는 DNA 삽입물에서의 PAM 부위를 보여준다.
정제 및 PCR
단계 1: 비드는 펠릿화되고, 40 uL의 선택된 표적 단편을 함유하는 상청액은 신규 튜브 내로 옮겨졌다. 비드는 Illumina Purification Beads(IPB)를 사용하여 100 uL의 ITB를 첨가하고, 잘 혼합하고, 실온에서 5분 동안 인큐베이션함으로써 정제되었다. 비드는 자석 상에서 펠릿화되고, 180 uL의 80%의 에탄올로 두 차례 세정되었다. 상청액은 제거되고, 2분 동안 건조되도록 하고, 이어서 27 uL의 물 중에 재현탁되었다. 용액은 잘 혼합되고, 비드는 펠릿화되고, 25 uL의 상청액은 신규 튜브로 옮겨졌다.
단계 2: 다음 PCR 프로그램을 사용하여 20 uL의 EPM 및 5 uL의 인덱싱 프라이머 믹스를 첨가함으로써 라이브러리가 증폭되었다.
- 1분 동안 98℃
- 20초 동안 98℃의 12 주기
- 30초 동안 60℃
- 30초 동안 72℃
- 10℃로 냉각
시퀀싱
라이브러리는 Qubit 키트(dsDNA BR 검정 키트, Thermo Scientific) 및 형광측정계를 사용하여 정량화되고, 이어서 12 pM 로딩 농도에서의 MiSeq 상에서 시퀀싱되었다.
도 17은 4개의 표적의 농축 후의 람다 게놈 전반에 걸친 시퀀싱 깊이를 보여준다.
도 8b는 도 8a와 관련하여 기재된 바와 같은 선택적 용출을 유발하는 단편 P4 상의 적어도 2개의 CRISPR 사건의 사용에 관한 추가의 상세 내용을 예시한다. 도 8b에 예시된 작업 A에서, 닉형성 사건은 발생하지 않았고, 따라서 단편 P4는 비드(들)(820)에 커플링된 상태로 유지된다. 도 8b에 예시된 작업 B에서, 2개의 닉형성 사건이 도 8a와 관련하여 기재된 작업 C와 관련하여 기재된 바와 같은 방식으로 발생하였으며, 폴리머라제를 사용한 닉의 후속 연장은 각각의 비드에 커플링되었던 양쪽 말단을 치환하여, 따라서 표적 서열(810)을 용출시키는 것으로 보일 수 있다. 도 8c에 예시된 작업 C에서, 예를 들어, Cas-gRNA RNP 닉카제가 단편(P4)의 표적 외 서열(811)에서 닉을 생성하였기 때문에 오직 단일 닉형성 사건이 발생하였으며, 따라서, 상응하는 닉카제는 서열(811) 측면에 배치되는 단편(P4)의 대향 부분에 닉을 형성하지 않았다. 폴리머라제를 사용한 닉의 후속 3' 연장은 각각의 비드에 커플링되었던 말단 중 하나를 치환하지만, 다른 말단은 비드에 커플링된 상태로 유지되고, 따라서 용출되지 않는 것으로 보일 수 있다. 따라서, 표적 서열(810)의 각각의 측면 상의 대향 가닥 상에서 닉형성된 단편은 닉형성되지 않거나, 오직 단일 가닥 상에 닉형성된 단편에 대해 우선적으로 용출될 수 있음이 도 8b로부터 이해될 수 있다. gRNA는 상응하는 닉카제가 표적 서열(810)의 3'인 각각의 위치에서 닉을 생성할 수 있고, 따라서 폴리머라제 연장을 사용하여 성공적으로 용출될 수 있는 영역에 커플링되도록 설계될 수 있는 반면, 표적 서열의 5'인 위치에서 생성된 임의의 닉은 예를 들어 도 8g와 관련하여 하기 보다 상세하게 기재되는 바와 같은 방식으로 주형 가닥 상에 이전의 닉을 연장할 수 없음을 유의한다. Cas-gRNA RNP 닉카제는 선택적으로 상이한 가닥을 표적화할 수 있음을 유의한다. 도면은 gRNA와 혼성화된 가닥을 표적화하는 단일 닉카제를 예시할 수 있지만, 다른 가닥을 닉형성하는 또 다른 닉카제가 사용될 수 있다. 이는 게놈에서의 양쪽 가닥이 사용될 수 있기 때문에 닉형성을 위한 서열의 개선된 선택을 제공할 수 있다.
도 8c는 도 8a 및 도 8b와 관련하여 기재된 바와 같은 닉형성 및 연장 작업 전에 PCR 증폭을 겪었던 시퀀싱 라이브러리로부터의 dsDNA 단편을 농축하기 위한 예시 프로세스 흐름을 예시한다. 예를 들어, Cas-gRNA RNP 닉카제 결합 및 닉형성 단계가 100% 효율적이지 않는 경우 및/또는 상대적으로 낮은 수의 dsDNA 단편이 존재하는 경우, 예를 들어, dsDNA가 세포 유리 DNA(cfDNA) 시퀀싱 라이브러리로부터 수득되는 경우, 이러한 PCR 증폭은 민감도를 강화하고/하거나 작은 패널로부터 품질 관리를 수행하고, 시퀀싱하기에 충분한 재료를 증폭하는 데 유용할 수 있다. 도 8c에 예시된 작업 A에서, 증폭 어댑터는 예를 들어 도 1j, 도 3d, 도 4a 내지 도 4j, 도 6a 및 도 6b, 또는 도 7a 내지 도 7g와 관련하여 기재된 바와 같은 임의의 적합한 방법을 통해 부가된다. 증폭 어댑터는 선택적으로 도 1j 및 도 3d와 관련하여 기재된 바와 같은 방식으로 Y-형상일 수 있으며, 각각 판독물 1 및 판독물 2 시퀀싱 프라이머를 제공할 수 있다. 비제한적 일예에서, 증폭 어댑터는 이중 가닥 ME, ME' 영역 이외에 A14 및 B15 증폭 어댑터(A14' 및 B15'인 상보체)를 포함할 수 있다. 예를 들어, 도 8c의 작업 A에 예시된 바와 같이, dsDNA 단편(P4)의 제1 가닥의 3' 말단은 ME' 서열을 통해 B15' 증폭 어댑터에 커플링될 수 있고, 해당 가닥의 5' 말단은 ME 서열을 통해 A14 증폭 어댑터에 커플링될 수 있다. 단편(P4)의 제2 가닥의 3' 말단은 ME' 서열을 통해 B15' 증폭 어댑터에 커플링될 수 있고, 해당 가닥의 5' 말단은 ME 서열을 통해 A14 증폭 어댑터에 커플링될 수 있다. 그러나, 임의의 다른 서열 및/또는 증폭 어댑터, 예를 들어 UMI, 샘플 인덱스, 클러스터 증폭 프라이머 등이 가닥에 부가될 수 있음이 인식될 것이다.
증폭 어댑터를 이용한 라이브러리 제작 이후, PCT 증폭이 수행되어 도 8c의 작업 B에 예시된 초기 단편(P4)의 양쪽 가닥을 개별적으로 증폭한다. 이 작업 동안 또는 종료 시, 단편은 도 8a의 작업 A와 관련하여 기재된 것과 유사한 방식으로 3' 말단에서 기능화(예를 들어, 비오틴화)될 수 있다. 예시적으로, 비-주형 부가(예를 들어, Taq 폴리머라제 사용) 또는 말단 트랜스퍼라제가 사용되어 도 8c의 작업 B에 기재된 바와 같이 비오틴화 뉴클레오타이드를 증폭된 가닥의 3' 말단에 부가할 수 있다. 후속 작업은 도 8a와 관련하여 기재된 바와 유사하게 수행될 수 있다. 예를 들어, 도 8c의 작업 C에 기재된 바와 같이, 전장 라이브러리는 도 8a의 작업 B와 관련하여 기재된 바와 같은 방식으로 단편(P4)의 3' 작용기를 통해 하나 이상의 기재(예컨대, 비드(들))(820)에 커플링될 수 있으며, Cas-gRNA RNP 닉카제를 사용하여 도 8a의 작업 C와 관련하여 기재된 바와 같은 방식으로 각각의 표적 서열(810)의 3' 측면에 배치되는 닉을 생성한다. 도 8c의 작업 D에 예시된 바와 같이, Cas-gRNA RNP 닉카제는 이어서 도 8a의 작업 D와 관련하여 기재된 바와 같은 방식으로 제거될 수 있으며, 폴리머라제가 첨가되어 도 8a의 작업 E와 관련하여 기재된 바와 같은 방식으로 닉으로부터 연장하고, 표적 서열(810)이 용출되도록 한다. 용출된 표적 서열은 이후 예를 들어 PCR 또는 클러스터 증폭을 사용하여 추가로 증폭될 수 있으며, 증폭 UMI, 샘플 인덱스, 및/또는 클러스터링 어댑터가 이러한 서열(들)이 도 8c의 작업 A 동안 부가되지 않았던 경우, 추가적으로 부가될 수 있다. 샘플 인덱스의 비제한적 예는 Illumina i5 및 i7 인덱스를 포함한다. 클러스터링 어댑터의 비제한적 예는 P5 및 P7 프라이머를 포함한다. 커플링된 임의의 적합한 서열을 갖는 용출된 단편은 표적화된 시퀀싱 검정의 일부로서 임의의 적합한 플랫폼(예를 들어, Illumina 합성에 의한 시퀀싱 플랫폼) 상에서 시퀀싱될 수 있다.
PCR이 Cas-gRNA 매개 용출 이전에 적합한 어댑터를 단편(P4)에 커플링시키고, 단편을 증폭시키는 데 사용될 수 있지만, PCR은 반드시 이와 같이 사용될 필요는 없음이 인식될 것이다. 예를 들어, 도 8d는 PCR 없이 단편화되고, 결찰된 시퀀싱 라이브러리로부터의 단편을 농축시키기 위한 프로세스 흐름을 예시한다. 여기서, 도 8d의 작업 A에서, 단편(P4)이 생성되고, 증폭 어댑터(예를 들어, ME/ME' 영역 및 5' 증폭 어댑터)가 예를 들어 도 1j, 도 3d, 도 4a 내지 도 4j, 도 6a 및 도 6b, 또는 도 7a 내지 도 7g와 관련하여 기재된 바와 같은 임의의 적합한 방법을 통해 부가된다. 도 8d에 예시된 비제한적 예에서, 3' 작용기(예컨대, 비오틴)는 예를 들어 ME/ME' 및 단일 A14 어댑터를 포함하는 간소화된 어댑터를 사용한 어댑터 결찰을 통해 부가될 수 있다. 어댑터는 도 8d의 작업 C 및 D와 관련하여 하기 추가로 기재된 바와 같은 방식으로 폴리머라제 연장을 멈출 수 있는 우라실(U)을 포함하도록 변형될 수 있다. 도 8d의 작업 B에서, 3' 작용기는 도 8a의 작업 B와 관련하여 기재된 바와 같은 방식으로 기재, 예컨대 비드(820)에 커플링될 수 있으며, Cas-gRNA RNP 닉카제를 사용하여 도 8a의 작업 C와 관련하여 기재된 바와 같은 방식으로 각각의 표적 서열(810)의 3' 측면에 배치되는 닉을 생성한다. 도 8d의 작업 C에 예시된 바와 같이, Cas-gRNA RNP 닉카제는 이어서 도 8a의 작업 D와 관련하여 기재된 바와 같은 방식으로 제거될 수 있으며, 폴리머라제가 첨가되어 도 8a의 작업 E와 관련하여 기재된 바와 같은 방식으로 닉으로부터 연장하고, 표적 서열(810)이 용출되도록 한다. 그러나, 변형된 어댑터 내의 우라실(예를 들어, A14-U)은 폴리머라제가 해당 우라실의 위치에서 멈추도록 한다. 도 8d의 작업 C에 예시된 바와 같이, 제2 시퀀싱 프라이머(예를 들어, B15)를 포함하는 주형 스위치 올리고뉴클레오타이드는 멈춘 연장 산물이 프라이밍 오프(prime off)되도록 하고, 3' 증폭 어댑터를 용출된 표적 단편에 부가한다. 이어서, 용출된 표적 단편(810)은 선택적으로 본원의 다른 곳에 기재된 바와 같은 방식으로 클러스터 증폭 어댑터(예를 들어, P5 및 P7), UMI, 및/또는 샘플 인덱스의 부가를 포함하여 PCR 증폭될 수 있다. 그러나, PCR 없는 프로세스 흐름은 적합하게는 예를 들어 도 8d에 예시된 프로세스 흐름의 작업 A 및 D에서 전체 시퀀싱/클러스터 증폭 어댑터 및 샘플 인덱스를 부가함으로써 구현될 수 있음이 인식될 것이다. 도 8d와 관련하여 기재된 선택된 작업에 관한 추가의 세부 사항을 경우, 발명의 명칭이 "시퀀싱 라이브러리의 수율을 증가시키기 위한 방법"인 국제 공개 WO 2021/252617호를 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
도 8a 내지 도 8d와 관련하여 기재된 바와 같은 프로세스 흐름은 적합하게는 임의의 유형의 라이브러리, 기기, 또는 작업흐름과 사용하기 위해 조정될 수 있음이 인식될 것이다. 도 8e는 Illumina Nextera 작업흐름과 사용하기 위한 프로세스 흐름의 비제한적 예를 예시한다. 여기서, 샘플 라이브러리는 Nextera 시스템을 사용하여 동시적 단편화 및 5' 어댑터 부가를 통해 제조될 수 있다. Nextera 시스템은 도 8a의 작업 B와 관련하여 기재된 바와 같은 방식으로 기재(예를 들어, 비드(들)(820))에 커플링될 수 있어서 초기 단편화 사건이 단편(P4)을 기재에 결합시키는데 사용될 수 있도록 한다. 도 8e의 작업 A에 예시된 바와 같이, 예를 들어 3' 작용기, 예컨대 비오틴을 통해 비드(들)(820)에 커플링된 Nextera 라이브러리가 생성될 수 있다. 일부 예에서, 라이브러리는 각각의 증폭 어댑터, 예컨대 A14 및 B15 어댑터를 포함하는 트랜스포좀의 혼합물을 사용하여 생성될 수 있으며, 이 경우, 단편(P4) 중 일부(예를 들어, 약 절반)는 각각의 말단에 A14 및 B15 어댑터를 포함할 수 있다(여기에 도시된 바와 같음). 다른 단편은 반드시 A14 및 B15 어댑터를 포함하지 않을 수 있지만 - 예를 들어 B15 어댑터가 없을 수 있지만 -, 2개의 A14를 포함하거나, A14 어댑터가 없을 수 있지만, 2개의 B15 어댑터를 포함한다.
Nextera 단편화 프로세스의 결과로서, 각각의 단편(P4)은 3' 말단과 ME 영역 사이에 약 9개의 염기쌍 길이인 갭을 포함할 수 있다. 도 8e의 작업 B에 예시된 바와 같이, 갭은 예를 들어 폴리머라제 및 리가제를 사용한 연장 결찰에 의해 밀봉될 수 있다. 닉을 밀봉하는 것은 폴리머라제에 의한 임의의 비-특이적 연장 및 용출을 억제할 수 있음을 유의한다. 대안적으로, 종결된 염기가 TdT 또는 폴리머라제에 의한 원하지 않는 연장 및 이후 용출, 그리고 디데옥시 염기(dideoxy base)를 억제하도록 부가될 수 있다. 이어서, 도 8a의 작업 C와 관련하여 기재된 바와 유사한 방식으로, Cas-gRNA RNP 닉카제가 기재(들) 상의 단편에 적용되어 도 8e의 작업 C에 예시된 바와 같은 방식으로 표적 서열(810) 측면에 배치되는 표적화된 닉을 생성할 수 있다. 이후, 도 8a의 작업 E와 관련하여 기재된 유사한 방식으로, 폴리머라제가 첨가되어 도 8e의 작업 D에 예시된 바와 같은 방식으로 표적 서열이 용출되도록 할 수 있다. 용출 이후, 추가의 증폭 어댑터 및/또는 샘플 인덱스가 시퀀싱 전에 예를 들어 PCR 또는 클러스터 증폭을 사용하여 본원의 다른 곳에 기재된 바와 같은 방식으로 단편에 커플링될 수 있다. 이와 관련하여, 2개의 B15 어댑터 또는 2개의 A14 어댑터를 갖는 임의의 단편(P4)은 이러한 PCR 증폭 동안 증폭되지 않을 수 있으며, 따라서 시퀀싱되지 않을 수 있다. 도 8d의 작업 D와 관련하여 기재된 바와 같은 주형 스위치 메커니즘이 사용되어 A14 및 B15 둘 모두의 어댑터를 제공하도록 어댑터를 교체함으로써 이러한 B15-B15 단편 및 A14-A14 단편의 손실을 감소시킬 수 있어서 단편이 PCR 또는 클러스터 증폭을 사용하여 증폭되고, 이후 시퀀싱될 수 있도록 함이 인식될 것이다.
도 8f는 도 8a의 작업 E, 도 8b의 작업 B, 도 8c의 작업 D, 도 8d의 작업 C, 및 도 8e의 작업 D와 관련하여 기재된 바와 같은 닉 연장 용출 작업을 위한 폴리머라제 선택 사항을 예시한다. 도 8f의 예 A에서, 가닥 치환 폴리머라제의 사용은 표적 서열(810)로부터 3' 기능화된(예를 들어, 3' 비오틴화된) 가닥을 치환시켜서 표적화된 용출을 수득한다. 도 8f의 예 B에서, 5' 엑소뉴클레아제 활성을 갖는 폴리머라제의 사용을 포함하는 닉 번역 접근법은 3' 기능화된(예를 들어, 3' 비오틴화된) 가닥의 5'에서 3'까지 분해시켜서 표적 서열(810)의 표적화된 용출을 수득한다.
도 8g는 표적 서열의 3'인 닉의 사용(작업 A)을 표적 서열의 5'인 닉의 사용(작업 B)과 비교한다. 작업 A로부터 이해될 것인 바와 같이, 표적 서열(810)의 3'인 2개의 닉형성 사건은 기재(들), 예를 들어 비드(들)(820)로부터 표적 서열을 용출시킨다. 작업 B로부터 이해될 것인 바와 같이, 표적 서열(810)의 5'인 2개의 닉형성 사건은 폴리머라제가 닉에서 멈추도록 하여 표적 서열이 기재(들), 예를 들어 비드(들)(820)에 결합된 상태로 유지되도록 할 수 있다.
수많은 분리 기술이 도 8a 내지 도 8g와 관련하여 기재된 바와 같은 프로세스 흐름과 상용성이며, 기재된 바와 같은 비드의 자성 분리의 사용으로 제한되지 않음을 유의한다. 예를 들어, 기재(들)는 패킹 컬럼 또는 플로우 셀과 같은 흐름 시스템 내에서 제공될 수 있다. 표적 단편은 이러한 시스템에서의 흐름을 사용하여 용출될 수 있다.
단편(P4)은 임의의 적합한 태그를 포함하도록 기능화될 수 있으며, 기재(들)는 임의의 적합한 태그 파트너를 포함하도록 기능화되어 단편(P4)을 기재(들)로 끌어내릴 수 있음이 추가로 인식될 것이다. 예를 들어, 태그 파트너는 SNAP 단백질을 포함할 수 있고, 태그는 O-벤질구아닌을 포함할 수 있거나; 태그 파트너는 CLIP 단백질을 포함할 수 있고, 태그는 O-벤질시토신을 포함할 수 있거나; 태그 파트너는 SpyTag를 포함할 수 있고, 태그는 SpyCatcher를 포함할 수 있거나; 태그 파트너는 SpyCatcher를 포함할 수 있고, 태그는 SpyTag를 포함할 수 있거나; 태그 파트너는 비오틴을 포함할 수 있고, 태그는 스트렙타비딘을 포함할 수 있거나; 태그 파트너는 스트렙타비딘을 포함할 수 있고, 태그는 비오틴을 포함할 수 있거나; 태그 파트너는 NTA를 포함할 수 있고, 태그는 His-Tag를 포함할 수 있거나; 태그 파트너는 His-Tag를 포함할 수 있고, 태그는 NTA를 포함할 수 있거나; 태그 파트너는 항체(예컨대, 항-FLAG 항체)를 포함할 수 있고, 태그는 항체가 선택적인 항원(예컨대, FLAG 태그)을 포함할 수 있거나; 태그 파트너는 항원(예컨대, FLAG 태그)을 포함할 수 있고, 태그는 항원에 대해 선택적인 항체(예컨대, 항-FLAG 항체)를 포함할 수 있거나; 태그 파트너는 제1 올리고뉴클레오타이드를 포함할 수 있고, 태그는 제1 올리고뉴클레오타이드에 상보적이고, 이에 혼성화하는 제2 올리고뉴클레오타이드를 포함할 수 있다. 태그 파트너는 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 기재에 커플링될 수 있다. 유사하게, 태그는 각각 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 단편(P4)에 3' 커플링될 수 있다.
도 8a 내지 도 8g를 참조하여 기재된 바와 같은 조성물 및 작업은 임의의 적합한 방법 또는 맥락에서 사용될 수 있다. 예를 들어, 도 8h는 이중 가닥 폴리뉴클레오타이드의 단편을 생성하는 예시 방법(8000)에서의 작업 흐름을 예시한다. 방법(8000)은 특정 폴리뉴클레오타이드 상에서 수행되는 작업을 기술할 수 있지만, 방법은 기재된 방식으로 동시에 작동될 수 있는 몇몇의 상이한 폴리뉴클레오타이드를 포함하는 혼합물에 적용될 수 있다. 일부 예에서, 이중 가닥 폴리뉴클레오타이드는 dsDNA를 포함할 수 있고, 선택적으로 cfDNA를 포함할 수 있다.
방법(8000)은 이중 가닥 폴리뉴클레오타이드를 기재에 커플링시키는 단계(작업(8001))를 포함할 수 있다. 예를 들어, 도 8a의 작업 A, 도 8c의 작업 B, 도 8d의 작업 A, 또는 도 8e의 작업 A와 관련하여 기재된 바와 같은 방식으로, 이중 가닥 폴리뉴클레오타이드의 3' 말단은 기능화될 수 있으며, 예를 들어 태그 또는 태그 파트너에 커플링될 수 있다. 추가적으로, 도 8a의 작업 B, 도 8c의 작업 C, 도 8d의 작업 B, 또는 도 8e의 작업 A와 관련하여 기재된 바와 같은 방식으로, 이중 가닥 폴리뉴클레오타이드의 3' 기능화된 말단은 기재에 커플링될 수 있으며, 예를 들어 태그 파트너 또는 태그에 커플링된 기재는 이중 가닥 폴리뉴클레오타이드의 태그 또는 태그 파트너에 커플링된다. 도 8a 내지 도 8g와 관련하여 기재된 일부 예는 기재로서의 스트랩타비딘 비드 및 3' 작용기로서의 비오틴을 포함할 수 있지만, 기재 및 태그/태그 파트너의 다수의 다른 예가 용이하게 계획될 수 있다.
도 8h에 예시된 방법(8000)은 또한 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 닉카제를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계(작업(8002))를 포함할 수 있다. 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'일 수 있고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'일 수 있다. 예를 들어, 도 8a의 작업 C, 도 8b의 작업 B, 도 8c의 작업 C, 도 8d의 작업 B, 도 8e의 작업 C, 도 8f의 예 A, 도 8f의 예 B, 및 도 8g의 예 A와 관련하여 기재된 바와 같은 방식으로, 제1 Cas-gRNA RNP 닉카제(851)의 gRNA는 선택적으로 "전방" 3' 위치에서 이중 가닥 폴리뉴클레오타이드(P4)의 제1 가닥에 커플링될 수 있고, 제2 Cas-gRNA RNP 닉카제(852)의 gRNA는 선택적으로 "후방" 3' 위치에서 이중 가닥 폴리뉴클레오타이드(P4)의 제2 가닥에 커플링될 수 있다. 닉카제는 표적 서열의 3' "측면에 배치"되는 것으로 간주될 수 있다. 상기 언급된 바와 같이, 닉카제는 gRNA 혼성화된 가닥 또는 대향 가닥을 표적화할 수 있다.
도 8h에 예시된 방법(8000)은 또한 제1 가닥을 제1 Cas-gRNA RNP 닉카제를 사용하여 제1 하위서열에서 절단하는 단계 및 제2 가닥을 제2 Cas-gRNA RNP 닉카제를 사용하여 제2 하위서열에서 절단하는 단계(작업(8003))를 포함할 수 있다. 예를 들어, 도 8a의 작업 C, 도 8b의 작업 B, 도 8c의 작업 C, 도 8d의 작업 B, 도 8e의 작업 C, 도 8f의 예 A, 도 8f의 예 B, 및 도 8g의 예 A와 관련하여 기재된 바와 같은 방식으로, 제1 Cas-gRNA RNP 닉카제(851)의 닉카제는 닉카제의 gRNA가 커플링하는 하위서열로 정의된 위치에서 이중 가닥 폴리뉴클레오타이드(P4)의 제1 가닥을 닉형성할 수 있고, 제2 Cas-gRNA RNP 닉카제(852)의 닉카제는 닉카제의 gRNA가 커플링하는 하위서열로 정의된 위치에서 이중 가닥 폴리뉴클레오타이드(P4)의 제2 가닥을 닉형성할 수 있다. 수득된 절단은 표적 서열의 3' "측면에 배치"되는 것으로 간주될 수 있다. 이러한 절단의 두 가지 예는 동시에 수행될 수 있거나, 서로 상이한 시기에 발생할 수 있다. 예를 들어, 제1 및 제2 가닥 CRISPR 닉카제 복합체의 큰 풀은 한꺼번에 샘플과 인큐베이션될 수 있다. 작업(8002 및 8003)은 임의의 적합한 Cas-gRNA RNP 닉카제, 예시적으로 제1 돌연변이 D10A 및 제2 돌연변이 H840A를 갖는 화농연쇄구균 Cas9를 사용하여 수행될 수 있음이 인식될 것이다.
방법(8000)은 또한 폴리머라제를 사용하여 각각의 절단으로부터 제1 및 제2 가닥을 연장하고, 기재로부터 표적 서열을 용출시키는 단계(작업(8004))를 포함할 수 있다. 예를 들어, 도 8a의 작업 D 및 E, 도 8b의 작업 B, 도 8c의 작업 D, 도 8d의 작업 C, 도 8e의 작업 D, 도 8f의 예 A, 도 8f의 예 B, 및 도 8g의 예 A와 관련하여 기재된 바와 같은 방식으로, Cas-gRNA RNP 닉카제는 제거되어 작업(8003)에서 생성된 닉의 3' 말단을 노출시킬 수 있고, 적합한 폴리머라제가 첨가되어 이중 가닥인 표적 서열을 3' 말단으로부터 연장한다. 이러한 연장은 기재에 결합된 상태로 유지되는 기재에 커플링된 이중 가닥 폴리뉴클레오타이드 중 일부를 치환하고, 표적 서열을 용출시킨다. 따라서, 표적 서열은 기재로부터 방출된다. 작업(8004)은 임의의 적합한 폴리머라제를 사용하여 수행될 수 있음이 인식될 것이다. 예를 들어, 폴리머라제는 도 8f의 예 A와 관련하여 기재된 바와 같은 가닥 치환 폴리머라제, 예시적으로 벤트 또는 Bsu를 포함할 수 있다. 또는 예를 들어, 폴리머라제, 예시적으로 Taq, Bst, 및 DNA 폴리머라제 I은 5' 엑소뉴클레아제 활성을 가질 수 있다.
방법(8000)은 또한 용출된 표적 서열을 시퀀싱하는 단계(작업(8005))를 포함할 수 있다. 이러한 시퀀싱은 임의의 적합한 방식 및 임의의 적합한 기기, 예를 들어 Illumina, Inc로부터 상업적으로 입수 가능한 기기로 수행될 수 있다. 시퀀싱 이전의 임의의 적합한 시기에, 표적 서열은 예를 들어 도 8c의 작업 A 내지 D, 도 8d의 작업 A 내지 D, 또는 도 8e의 작업 A 내지 D를 참조하여 기재된 바와 같은 방식으로 적합하게는 증폭 어댑터에 커플링될 수 있다. 이러한 증폭 어댑터는 작업(8001, 8002, 8003, 및 8004) 중 임의의 적합한 것 전 또는 후에 부가될 수 있다. 추가적으로, 시퀀싱 이전의 임의의 적합한 시기에, 표적 서열은 예를 들어 PCR 또는 클러스터 증폭을 사용하여 증폭될 수 있다. 이러한 증폭 어댑터는 작업(8001, 8002, 8003, 및 8004) 중 임의의 적합한 것 전 또는 후에 수행될 수 있다.
Cas-gRNA RNP를 사용하여 선택된 폴리뉴클레오타이드 단편에 대한 증폭 어댑터의 결찰
본원에 제공된 일부 방법은 온전한 dsDNA 단편의 표적화된 시퀀싱을 위한 길고, 힘든 작업 흐름의 문제를 해결한다. 본 개시내용으로부터 분명할 것인 바와 같이, Cas-gRNA RNP는 폴리뉴클레오타이드, 예를 들어 dsDNA에서의 표적 영역에 대한 신속하고, 특이적 혼성화를 제공할 수 있다. 이제 도 9a 내지 도 9f와 관련하여 기재될 것인 바와 같이, Cas-gRNA RNP 및 증폭 어댑터를 포함하는 복합체가 사용되어 증폭 어댑터를 선택된 단편에 결찰할 수 있어서 이들 단편이 이후 증폭 및 시퀀싱될 수 있도록 하는 한편, 다른 단편은 이러한 어댑터에 결찰되지 않으며, 따라서 증폭 및 시퀀싱되지 않는다. 따라서, 선택된 단편은 간소화된 방식으로 농축 및 시퀀싱될 수 있다. 이는 특히 예를 들어 무세포 DNA(cfDNN)의 시퀀싱에서 어댑터 결찰 동안 이중 가닥 폴리뉴클레오타이드를 보존 및 농축하는 것이 바람직할 수 있는 적용에 유용할 수 있는 반면, 이전의 알려진 농축 접근법은 단일 가닥 폴리뉴클레오타이드를 수반할 수 있다. 추가적으로 또는 대안적으로, 추가의 정확도를 위해 cfDNA 분자의 양쪽 가닥을 듀플렉스 UMI로 표지하는 것이 유용할 수 있다.
이전에 알려진 일부 결찰 접근법이 이중 가닥 폴리뉴클레오타이드와 상용성일 수는 있지만, 이러한 접근법은 선택된 단편의 임의의 농축을 제공하지 않을 수 있다. 예를 들어, 도 9a는 증폭 어댑터를 dsDNA 라이브러리의 단편에 결찰하기 위한 이전에 알려진 공정에서의 예시 조성물 및 작업을 개략적으로 예시한다. 작업 A에 예시된 바와 같이, dsDNA 라이브러리는 단편화될 수 있다. 이러한 단편화는 예를 들어 cfDNA의 경우 자연적으로 발생할 수 있거나, 기계적으로 또는 효소적으로 수행될 수 있거나, RNA 라이브러리로부터 생성될 수 있다. 수득된 복수의 단편은 균일하지 않은 말단을 가질 수 있으며, 이는 도 9a의 작업 B에 예시된 바와 같은 방식으로 말단 복구를 사용하여 블런트화될 수 있다. 이어서, 5' 말단은 도 9a의 작업 C에 예시된 바와 같은 방식으로 인산화될 수 있다. 비-주형 A 뉴클레오타이드가 이후 도 9a의 작업 D에 예시된 바와 같은 방식으로 A-테일링을 사용하여 3' 말단에 부가된다. Y-형상(포크화) 증폭 어댑터가 이어서 도 9a의 작업 E에 예시된 바와 같은 방식으로 어댑터 결찰을 사용하여 단편에 커플링될 수 있다. 어댑터는 PCT 증폭 후에 원래의 양쪽 가닥을 식별하도록 하는 서열을 가질 수 있다. 도 9a의 작업 F에 예시된 바와 같이, 단편은 이후 PCR을 사용하여 증폭될 수 있으며, 그 동안 샘플 인덱스가 부가될 수 있다. 이어서, 증폭된 단편은 시퀀싱될 수 있다. 도 9a에 예시된 프로세스 흐름으로부터, 작업 A에서 존재하는 실질적으로 각각의 dsDNA 단편은 결국 이에 결찰되는 증폭 어댑터를 가질 수 있으며, 따라서 증폭 및 시퀀싱될 수 있음이 이해될 것이다. 일부 경우, 소정의 샘플 내의 실질적으로 모든 dsDNA 단편의 서열을 수득하는 것이 바람직할 수 있지만, 다른 경우, 단편의 오직 작은 선택된 하위세트, 예를 들어 cfDNA 단편을 시퀀싱하는 것을 원할 수 있다.
도 9a와 관련하여 기재된 이전에 알려진 프로세스 흐름과 대조적으로, 도 9b 내지 도 9f는 증폭 어댑터를 Cas-gRNA RNP를 사용하여 선택된 폴리뉴클레오타이드 단편에 결찰하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 작업 A에 예시된 바와 같이, dsDNA 라이브러리는 단편화될 수 있다. 이러한 단편화는 예를 들어 cfDNA의 경우 자연적으로 발생할 수 있거나, 기계적으로 또는 효소적으로 수행될 수 있거나, RNA 라이브러리로부터 생성될 수 있다. 단편 중 일부는 농축 및 검출하기 원하는 각각의 표적 서열(들)을 포함할 수 있는 한편, 다른 단편은 이러한 단편(들)을 반드시 포함하지 않을 수도 있다. 예를 들어, 도 9a에 예시된 단편(P5)은 표적 서열(910)을 포함하는 한편, 다른 단편은 다른 표적 서열을 포함할 수 있거나, 이러한 임의의 표적 서열을 포함하지 않을 수 있다.
도 9a와 관련하여 기재된 것과 유사한 방식으로, 수득된 복수의 단편은 균일하지 않은 말단을 가질 수 있으며, 이는 도 9a의 작업 B에 예시된 바와 같은 방식으로 말단 복구를 사용하여 블런트화될 수 있다. 이어서, 5' 말단은 도 9a의 작업 C에 예시된 바와 같은 방식으로 인산화될 수 있다. 비-주형 A 뉴클레오타이드가 이후 도 9a의 작업 D에 예시된 바와 같은 방식으로 A-테일링을 사용하여 3' 말단에 부가된다. 도 9c와 관련하여 하기 보다 상세하게 기재되는 바와 같은 방식으로, Y-형상(포크화) 증폭 어댑터는 이어서 표적 서열(910)을 포함하는 단편에 선택적으로 커플링될 수 있는 한편, 도 9b의 작업 E예 예시된 바와 같은 방식으로 이러한 어댑터는 해당 서열이 없는 임의의 단편에는 부가되지 않는다. 어댑터는 PCT 증폭 후에 원래의 양쪽 가닥을 식별하도록 하는 서열을 가질 수 있다. 예를 들어, 어댑터는 듀플렉스 UMI를 포함할 수 있다. 도 9b의 작업 F에 예시된 바와 같이, 어댑터가 결찰되었던 단편은 이후 PCR을 사용하여 증폭될 수 있으며, 그 동안 샘플 인덱스가 부가될 수 있는 한편, 어댑터가 결찰되지 않았던 단편은 증폭되지 않는다. 증폭된 단편은 이어서 시퀀싱될 수 있는 한편, 어댑터가 결찰되지 않았던 단편은 시퀀싱되지 않는다. 도 9a에 예시된 프로세스 흐름으로부터, 실질적으로, 표적 서열(910)을 포함하는 작업 A에서 존재하는 폴리뉴클레오타이드 단편만이, 최종적으로 이에 결찰되는 증폭 어댑터를 가질 수 있으며, 이에 따라 증폭되고 시퀀싱될 수 있음이 이해될 것이다. 따라서, 도 9b에 예시된 프로세스 흐름은 소정의 샘플 내의 단편의 하위세트, 예를 들어 cfDNA 단편을 선택적으로 시퀀싱하는 간소화된 방식을 제공한다.
도 9c는 어댑터가 표적 서열(910)을 포함하는 단편(P6)에 선택적으로 커플링될 수 있는 방식에 관한 추가의 상세 내용을 개략적으로 예시한다. 도 9c에 예시된 바와 같이, 작업 A에서, 단편(P6)은 링커(953)를 통해 증폭 어댑터(들)(952)에 커플링된 효소적으로 비활성화된 Cas-gRNA RNP(951)를 각각 포함하는 제1 및 제2 복합체(950, 950')와 접촉될 수 있다. 예를 들어, 복수의 복합체(950, 950')는 단편화된 A-테일화 샘플 dsDNA와 혼합될 수 있다. 각각의 Cas-gRNA RNP(951)의 gRNA는 dsDNA의 각각의 단일 가닥 내의 특이적 영역(하위서열)을 표적으로 할 수 있으며, 영역은 Cas-gRNA RNP가 서로 벗어나고, 농축하기를 원하는 이중 가닥 표적 영역(910)의 대향 측면 상에 존재하는 위치에서 각각의 가닥에 혼성화하도록 엇갈릴 수 있다. 예를 들어, 도 9c의 작업 A에 예시된 바와 같은 방식으로, 복합체(950)의 Cas-gRNA RNP(951)의 gRNA는 표적 서열(910)의 전방("전방")인 영역을 표적으로 할 수 있고, 복합체(950')의 Cas-gRNA RNP(951)의 gRNA 표적 서열(910)의 후방("후방")인 영역을 표적으로 할 수 있다. 따라서, 제1 및 제2 복합체(950, 950')의 가이드 서열은 전방 및 후방 방향에서 표적 서열(910)의 "측면에 배치"되는 것으로 간주될 수 있다. 임의의 적합한 수의 gRNA는 복합체의 상응하는 Cas-gRNA RNP가 dsDNA 단편 내의 특이적 서열 측면에 배치되는 위치에서 각각의 가닥에 혼성화되도록 설계될 수 있음이 인식될 것이다. 예를 들어, 다수의 상이한 gRNA(예를 들어, 1000개 내지 100,000개의 gRNA 또는 100,000개 초과의 gRNA)가 샘플 내의 관심의 다수의 상이한 서열을 동시에 농축하도록 사용될 수 있다. gRNA가 소정의 표적 서열(910) "측면에 배치"되는 것이 반드시 필요하지는 않되, 오히려 표적 서열당 적어도 2개의 가이드가 소정의 단편(P6) 내의 대향 가닥 상에 결합할 수 있음을 유의한다. gRNA 및 상응하는 복합체는 이러한 gRNA가 표적화하는 서열이 없는 임의의 단편에 결합하지 않을 수 있다. 각각의 말단에서 어댑터를 수용하기 위해 각각의 단편에 대해 적어도 2개의 Cas-gRNA RNP를 사용하는 것이 특이성에 도움이 될 것으로 예상됨을 유의한다.
일부 예에서, 복합체(950, 950')의 어댑터(952)는 도 3d, 도 8c, 또는 도 8d와 관련하여 기재된 것들과 유사하게 Y-형상의 어댑터 쌍일 수 있거나, 이를 포함할 수 있다. 선택적으로, 어댑터는 도 9d와 관련하여 기재된 바와 같은 방식으로 UMI를 포함할 수 있다. 추가적으로 또는 대안적으로, 어댑터는 단편 상의 임의의 A-테일에 혼성화할 수 있는 쌍을 이루지 않은 T를 포함할 수 있다. 이와 관련하여, 단편의 각각의 하위서열에 대한 Cas-gRNA RNP(951)의 특이적 결합은 상대적으로 신속하고, 강력할 것으로 예상되며, 따라서 단편의 A-테일에 대한 T-염기 어댑터 페어링의 비-특이적 결합에 비해 유리함을 유의한다. 이러한 선택성은 Cas-gRNA RNP(951)를 승온에서 각각의 하위서열에 혼성화함으로써 강화될 수 있다. 추가적으로, 원하지 않는 백그라운드 결찰은 복합체(950, 950')의 농도를 감소시킴으로써 감소될 수 있고, 표준 결찰 조건과 비교하여 유의하게 감소될 수 있다. 예를 들어, 이전에 알려진 방법에서, 어댑터는 보통 주형에 대해 과량(예를 들어, 주형에 대해 10 내지 1000배)으로 존재하는 반면, 본 예에서, 어댑터(952)는 총 단편의 오직 하위부분이 표적화되기 때문에 낮은 백그라운드를 제공하기 위해 주형보다 유의하게 더 낮은 농도(예를 들어, 주형에 대해 0.001 내지 0.1배)로 제공될 수 있다.
도 9c에 예시된 작업 A로부터, 제1 및 제2 복합체(950, 950')의 gRNA가 소정의 단편의 각각의 하위서열에 혼성화될 때, 이들 복합체의 어댑터(952)는 해당 단편의 말단과 근접하게 되는 것으로 추가로 인식될 것이다. 따라서, 도 9c의 작업 B에 예시된 바와 같이, 복합체 및 단편이 작업 B 동안 접촉되는 리가제(구체적으로 예시되지 않음)를 사용하여 제1 복합체(950)의 증폭 어댑터(들)(952)는 단편(P6)의 제1 말단에 결찰될 수 있고, 제2 복합체(950')의 증폭 어댑터(들)(952)는 단편(P6)의 제2 말단에 결찰될 수 있다. 리가제는 어댑터와 단편의 말단 사이의 결합을 추가로 밀봉할 수 있다. 비제한적 일예에서, 리가제는 T4 DNA 리가제를 포함한다. Cas-gRNA RNP(951)의 gRNA가 특이적인 하위서열의 측면에 배치되는 표적 서열을 포함하는 단편(P6)의 각각의 말단에 대한 어댑터(952)의 결찰 이후, Cas-gRNA RNP(951)는 열사되고, 제거되거나, 프로테이나제 K, SDS, 또는 프로테아제와 같은 적합한 시약을 사용하여 제거될 수 있다. 임의의 잔여 링커(953)는 어댑터(952)에 커플링된 상태로 유지될 수 있으며, 따라서 도 9c에 예시된 바와 같은 방식으로 표적 서열(910)을 포함하는 단편에 커플링된 상태로 유지될 수 있다. 어댑터(들)(952)에 커플링된 단편은 이어서 본원의 다른 곳에 기재된 바와 같은 방식으로 증폭 및 시퀀싱될 수 있다. 표적 서열(910)이 없는 임의의 단편은 어댑터(들)(952)에 커플링되지 않을 수 있으며, 따라서 증폭 및 시퀀싱되지 않을 수 있다. 따라서, 표적 서열(910)을 포함하는 단편이 농축된다.
도 9c에 예시된 작업은 임의의 적합한 순서로 수행될 수 있음이 인식될 것이다. 일부 예에서, Cas-gRNA RNP(951)는 각각의 하위서열에 혼성화되고, 따라서 리가제가 첨가되고, 이들 어댑터를 해당 단편의 말단에 결찰하는 데 사용되기 전에 수행된 별도의 작업에서 어댑터(952)가 상응하는 단편(P6)의 말단에 근접하게 된다. 다른 예에서, Cas-gRNA RNP(951)는 리가제의 존재 하에 각각의 하위서열에 혼성화되어 리가제가 이들 어댑터를 해당 단편의 말단에 상대적으로 빨리 결찰시킬 수 있도록 한다. 대안적으로, 이러한 예에서, ATP가 Cas-gRNA RNP 혼성화 작업으로부터 결찰 작업을 분리하는 "스위치"로서의 기간 후에 첨가될 수 있어서 혼성화는 (신규 첨가된 ATP에 의해 활성화된 리가제의 존재 하에) 실질적으로 결찰이 수행되기 전에 (불활성 리가제의 존재 하에) 수행될 수 있도록 한다.
추가적으로 또는 대안적으로, 일부 예에서, 표적 서열(910)을 포함하는 단편은 선택적으로 도 8a 내지 도 8h와 관련하여 기재된 것과 유사한 방식으로 기재(들)에 커플링될 수 있다. 예를 들어, 복합체(950, 950'), 예컨대 gRNA, Cas-gRNA RNP(951), 또는 어댑터(952)의 임의의 적합한 부분은 기능화될 수 있으며, 따라서 이러한 기능화를 통해 기재에 커플링될 수 있다. 예를 들어, 복합체는 태그 또는 태그 파트너에 커플링될 수 있으며, 기재는 복합체를 기재에 커플링시키도록 반응하는 태그 파트너 또는 태그에 커플링된다. 표적 서열(910)을 포함하지 않으며, 따라서 복합체(950, 950')에 커플링되지 않는 임의의 단편은 또한 기재에 커플링되지 않는다(예를 들어, 이들은 기재에서 태그 파트너 또는 태그와 반응하는 태그 또는 태그 파트너가 없기 때문임). 예시적으로, 태그 파트너는 SNAP 단백질을 포함할 수 있고, 태그는 O-벤질구아닌을 포함할 수 있거나; 태그 파트너는 CLIP 단백질을 포함할 수 있고, 태그는 O-벤질시토신을 포함할 수 있거나; 태그 파트너는 SpyTag를 포함할 수 있고, 태그는 SpyCatcher를 포함할 수 있거나; 태그 파트너는 SpyCatcher를 포함할 수 있고, 태그는 SpyTag를 포함할 수 있거나; 태그 파트너는 비오틴을 포함할 수 있고, 태그는 스트렙타비딘을 포함할 수 있거나; 태그 파트너는 스트렙타비딘을 포함할 수 있고, 태그는 비오틴을 포함할 수 있거나; 태그 파트너는 NTA를 포함할 수 있고, 태그는 His-Tag를 포함할 수 있거나; 태그 파트너는 His-Tag를 포함할 수 있고, 태그는 NTA를 포함할 수 있거나; 태그 파트너는 항체(예컨대, 항-FLAG 항체)를 포함할 수 있고, 태그는 항체가 선택적인 항원(예컨대, FLAG 태그)을 포함할 수 있거나; 태그 파트너는 항원(예컨대, FLAG 태그)을 포함할 수 있고, 태그는 항원에 대해 선택적인 항체(예컨대, 항-FLAG 항체)를 포함할 수 있거나; 태그 파트너는 제1 올리고뉴클레오타이드를 포함할 수 있고, 태그는 제1 올리고뉴클레오타이드에 상보적이고, 이에 혼성화하는 제2 올리고뉴클레오타이드를 포함할 수 있다. 태그 파트너는 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 기재에 커플링될 수 있다. 유사하게, 태그는 각각 임의의 적합한 연결, 예를 들어 공유 연결을 통해 또는 비-공유 연결을 통해 복합체(950, 950')에 커플링될 수 있다.
복합체(950, 950')는 임의의 적합한 방식으로 제작될 수 있음이 인식될 것이다. 도 9b와 관련하여 상기 언급된 바와 같이, 복합체(950, 950')는 특정 하위서열에 표적화된 gRNA를 포함하며, 링커(953)를 통해 어댑터(들)(952)에 커플링되는 Cas-gRNA RNP(951)를 포함할 수 있다. 도 9d는 복합체(950)의 예시 구성을 개략적으로 예시한다. 도 9d에 예시된 예 A 및 예 B 둘 모두에서, Cas-gRNA RNP(951)의 Cas는 gRNA가 상보적인 서열에서 표적 뉴클레오타이드를 절단하지 않도록 엔지니어링될 수 있으며, 예를 들어 dCas9를 포함할 수 있다. 도 9d에 예시된 예 A 및 예 B 둘 모두에서, Y-형상의 증폭 어댑터(952)는 도 8a 내지 도 8h와 관련하여 기재된 것과 유사한 방식으로 판독물 1(A14) 및 판독물 2(B15) 어댑터 및 ME/ME' 영역을 포함할 수 있다. 선택적으로, 어댑터(952)는 단편의 A-테일에 혼성화하는 쌍을 이루지 않는 T를 포함할 수 있다. 대안적으로, 어댑터(952)는 블런트 말단에 결찰될 수 있다. 추가적으로 또는 대안적으로, 어댑터(952)는 도 9d에 예시된 이중 가닥 듀플렉스 UMI를 포함할 수 있다. 도 9d에 예시된 예 A에서, 어댑터(952)는 링커(953), 예를 들어 단백질-기반 링커를 통해 Cas-gRNA RNP(951)의 Cas 단백질에 컨쥬게이트된다. 예를 들어, Cas 단백질 및 사슬(tether)(953)은 공동 발현되거나, 적합하게는 본원의 다른 곳에서 기재된 바와 같은 방식으로 또는 문헌[Aird et al., "Increasing Cas-9 mediated homology-directed repair efficiency through covalent tethering of DNA repair template," Communications Biology 1, 54 (2018), doi.org/10.1038/s42003-018-0054-2]에 기재된 바와 같은 방식으로 발현 후에 서로 커플링될 수 있다. 도 9d에 예시된 예 B에서, 어댑터(952)는 본원의 다른 곳에서 기재된 바와 같은 방식으로 링커(953), 예를 들어 올리고뉴클레오타이드-기반 링커를 통해 Cas-gRNA RNP(951)의 gRNA에 커플링된다. 그러나, 링커(953)는 임의의 적합한 단백질, 폴리뉴클레오타이드, 또는 중합체(예를 들어, PEG)를 포함할 수 있음이 인식될 것이다.
복수의 상이한 하위서열이 소기의 표적 서열(910)을 포함하는 단편을 농축하는 데 사용될 수 있음이 추가로 인식될 것이다. 예를 들어, 도 9e의 작업 A는 다수의 gRNA("가이드")가 단편(P6)의 표적 서열(910) 상에 그리고 그 주변에 타일링(tile)하도록 설계될 수 있는 방식을 예시한다. 단편에서의 각각의 하위서열에 대해 결합 시, 이러한 gRNA를 포함하는 복합체(950)는 해당 단편을 도 9e의 작업 B에 예시된 바와 같은 방식으로 일부 또는 모든 표적 서열(910)에 걸쳐 포화시킬 수 있다. 이러한 전략은 복합체(950)를 해당 서열에 커플링시킬 가능성을 증가시키고, 따라서 각각의 어댑터(952)를 이들 말단에 대한 결찰을 위해 해당 단편의 말단에 충분히 근접하게 배치하여 단편이 이후 증폭 및 시퀀싱될 수 있도록 함으로써 랜덤하게 단편화되고/되거나 표적 서열(910) 내에 틈(break)을 포함할 수 있는 단편을 농축시키도록 도울 수 있다. 예를 들어, 링커(953)의 길이를 바탕으로, 어댑터(952)는 각각의 복합체의 Cas-gRNA RNP가 커플링되는 하위서열의 정의된 수의 염기쌍, 예를 들어 약 5개 내지 30개의 염기쌍, 또는 약 10개 내지 25개의 염기쌍, 또는 약 15개 내지 20개의 염기쌍 내에 존재하는 단편 말단에 결찰될 수 있다.
예를 들어, 도 9f는 이중 가닥 폴리뉴클레오타이드의 단편을 생성하는 예시 방법(9000)에서의 작업 흐름을 예시한다. 도 9f에 예시된 방법(9000)은 제1 및 제2 복합체를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계(작업(9001))를 포함할 수 있다. 각각의 제1 및 제2 복합체는 증폭 어댑터에 커플링된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함할 수 있다. 예를 들어, 도 9c의 작업 A와 관련하여 기재된 바와 같은 방식으로, 복합체(950, 950')는 각각 증폭 어댑터(952)에 커플링된 Cas-gRNA RNP(951)를 포함할 수 있다. 비제한적 예에서, Cas-gRNA RNP는 dCas9를 포함한다.
선택적으로, 각각의 복합체는 Cas-gRNA RNP를 증폭 어댑터에 커플링시키는 링커(953)를 추가로 포함할 수 있다. 일부 예에서, 복합체는 도 9d와 관련하여 기재된 바와 같은 방식으로 제작될 수 있다. 일부 예에서, 링커는 Cas-gRNA RNP의 Cas에 커플링될 수 있다. 또는 일부 예에서, 링커는 gRNA에 커플링될 수 있다. 일부 예에서, 링커는 단백질, 폴리뉴클레오타이드, 또는 중합체를 포함할 수 있다. 일부 예에서, 증폭 어댑터는 Y-형상이다. 추가적으로 또는 대안적으로, 증폭 어댑터는 각각 고유한 분자 식별자를 포함할 수 있다. 추가적으로 또는 대안적으로, 방법(9000)은 혼성화 전에 이중 가닥 폴리뉴클레오타이드를 A-테일링하는 단계를 추가로 포함할 수 있으며, 증폭 어댑터는 A-테일과 혼성화하기 위한 쌍을 이루지 않는 T를 포함한다. 대안적으로, 증폭 어댑터는 블런트 말단에 결찰될 수 있다.
복합체(950, 950')의 gRNA는 폴리뉴클레오타이드의 각각의 말단에 충분히 가까운 위치에서 예를 들어 표적 서열(910)의 측면에 배치되는 이중 가닥 폴리뉴클레오타이드(P6)의 각각의 가닥 상의 하위 서열에 혼성화하도록 선택될 수 있으며, 증폭 어댑터는 이러한 말단에 결찰될 수 있다. 일부 예에서, 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'이다.
도 9f에 예시된 방법(9000)은 혼성화된 제1 및 제2 복합체의 증폭 어댑터를 이중 가닥 폴리뉴클레오타이드의 제1 및 제2 말단에 각각 결찰하는 단계(작업(9002))를 추가로 포함할 수 있다. 예를 들어, 도 9c의 작업 B와 관련하여 기재된 바와 같은 방식으로, 각각의 하위서열에 대한 복합체(950, 950')의 혼성화는 상응하는 증폭 어댑터(952)가 폴리뉴클레오타이드의 각각의 말단에 충분히 근접하도록 하여 이에 결찰된다. 결찰은 리가제를 사용하는 것을 포함할 수 있다. 도 9c의 작업 B와 관련하여 기재된 바와 같은 방식으로, 리가제는 선택적으로 혼성화 동안 존재할 수 있다. 리가제는 혼성화 동안 비활성화일 수 있고, 결찰을 위해 ATP를 사용하여 활성화될 수 있다. 대안적으로, 리가제는 혼성화제 후에 첨가될 수 있다.
도 9f에 예시된 방법(9000)은 예를 들어 도 9c의 작업 C와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 복합체의 Cas-gRNA RNP를 이중 가닥 폴리뉴클레오타이드로부터 제거하는 단계(작업(9003))를 추가로 포함할 수 있다. 복합체가 링커(953)를 포함하는 예에서, 링커는 예를 들어 도 9c와 관련하여 기재된 바와 같은 방식으로 Cas-gRNA RNP가 제거될 때, 선택적으로 증폭 어댑터에 커플링된 상태로 유지될 수 있다.
도 9f에 예시된 방법(9000)은 예를 들어 본원의 다른 곳에 기재된 바와 같은 방식으로 결찰된 증폭 어댑터를 갖는 이중 폴리뉴클레오타이드를 시퀀싱하는 단계(작업(9004))를 포함할 수 있다.
5' 오버행을 갖는 단편 생성 및 이에 대한 어댑터 커플링
일부 예에서, 본원에 제공된 방법 및 조성물은 표적화된 증폭 및/또는 표적화된 시퀀싱을 위한 길고, 힘든 작업흐름의 문제를 해결한다. 본 개시내용으로부터 명백해질 것인 바와 같이, Cas-gRNA RNP는 표적 농축 방법의 일부로서 폴리뉴클레오타이드 단편을 생성하는 데 사용될 수 있다. 증폭 어댑터는 예를 들어 본원의 다른 곳에 기재된 바와 같은 방식으로 말단 복구, A-테일링, 및 어댑터 결찰을 사용하는 다수의 추가 단계를 사용하여 부가될 수 있다. 이제 도 10a 내지 도 10c와 관련하여 기재될 것인 바와 같이, Cas-gRNA RNP는 5' 오버행을 갖는 단편을 생성하는 데 사용될 수 있으며, 이에 5' 오버행을 또한 갖는 증폭 어댑터가 상대적으로 적고, 간단한 단계에 의해 용이하게 결찰될 수 있다. 본원에 제공된 바와 같이, 단편화에 의한 신속한 Cas-gRNA RNP 기반 농축과 간소화된 어댑터 부가의 조합은 표적화된 시퀀싱 적용을 위한 더 빠르고, 더 용이한 완전한 작업흐름을 제공한다. 특히, 특정 유형의 Cas-gRNA RNP가 말단 복구 또는 A-테일링에 대한 필요 없이 어댑터 결찰을 위해 준비된 단편을 생성하는 데 사용될 수 있다.
도 10a 내지 도 10c는 단편을 Cas-gRNA RNP를 사용하여 생성하고, 이에 어댑터를 커플링하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 먼저 도 10a를 참조하면, 작업 A에서, 폴리뉴클레오타이드(P8)는 농축, 증폭, 및 시퀀싱하기를 원하는 표적 서열(1010)을 포함할 수 있다. 예시적으로, 표적 서열(1010)은 약 150개 내지 600개의 염기쌍 길이 또는 본원에 예시된 바와 같은 임의의 다른 길이일 수 있다. 본원의 다른 곳에 제공된 것과 유사한 방식으로, 작업 B에서, 폴리뉴클레오타이드(P8)는 표적 서열(1010)의 측면에 배치되는 폴리뉴클레오타이드(P8)에서의 제1("전방") 및 제2("후방") 서열에 특이적으로 혼성화하는 가이드 RNA 서열을 갖는 제1 및 제2 Cas-gRNA RNP(1051, 1051')와 접촉될 수 있다. 제1 및 제2 Cas-gRNA RNP(1051, 1051')는 각각 폴리뉴클레오타이드의 제1 및 제2 서열을 절단하여, 사이에 표적 서열이 있는 제1 및 제2 말단을 갖는 단편을 생성하기 위한 것일 수 있다. 예를 들어, 도 10a의 작업 C에 예시된 바와 같이, 제1 Cas-gRNA RNP(1051)는 폴리뉴클레오타이드(P8)에서의 제1 서열("전방")에 혼성화될 수 있고, 제2 Cas-gRNA RNP(1051')는 폴리뉴클레오타이드에서의 제2 서열("후방")에 혼성화될 수 있다. 본원의 다른 곳에서 기재된 바와 같은 방식으로, 제1 및 제2 Cas-gRNA RNP(1051, 1051')는 폴리뉴클레오타이드(P8)를 표적 서열(1010) 측면에 배치되는 위치에서 절단하여 표적 서열(1010)을 포함하는 단편을 생성할 수 있다. 선택적으로, 도 10b와 관련하여 기재될 것인 바와 같은 방식으로, 작업 C에서 생성된 단편의 제1 말단은 선택적으로 적어도 하나의 염기의 제1 5' 오버행을 가질 수 있고, 단편의 제2 말단은 선택적으로 적어도 하나의 염기의 제2 5' 오버행을 가질 수 있다. 즉, 예를 들어 도 10b와 관련하여 기재된 바와 같이 이러한 오버행을 생성하는 특정 유형의 Cas-gRNA RNP가 선택적으로 사용될 수 있다.
도 10a의 작업 D에 예시된 바와 같이 그리고 도 10b와 관련하여 하기 기재될 것인 바와 같은 방식으로, 증폭 어댑터(예를 들어, Y-형상의 어댑터에서의 A14 및 B15 서열)가 단편의 제1 및 제2 말단에 결찰될 수 있다. 선택적으로, 도 10b와 관련하여 기재된 바와 같은 방식으로, 제1 증폭 어댑터는 선택적으로 단편의 제1 말단에서의 5' 오버행에 상보적인 5' 오버행을 가질 수 있고, 제2 증폭 어댑터는 단편의 제2 말단에서의 5' 오버행에 상보적인 5' 오버행을 가질 수 있다. 도 10a의 작업 E에 예시된 바와 같이, 커플링된 어댑터를 갖는 단편은 샘플 인덱스(i7 및 이의 상보체) 및 시퀀싱 어댑터(예를 들어, P5 및 P7 어댑터, 및 이의 상보체)를 부가하도록 증폭될 수 있다(예를 들어, PCR 사용). 증폭 동안, 표적화된 영역의 "상부" 및 "하부" 가닥은 포크화 어댑터 구조의 결찰로 인해 상이한 배향을 생성하기 때문에 각각의 단편은 양방향성 시퀀싱 판독에 사용하기 위한 양방향성 앰플리콘을 생성한다. 이는 2개의 시퀀싱 판독물이 표적 서열(1010)의 각각의 말단으로부터 수행되어 추가의 커버리지(coverage)를 제공할 수 있음을 의미한다. 증폭은 또한 다중 시퀀싱에서 사용하기 위한 추가의 클러스터링 서열(예를 들어, P5, P7) 및 샘플 인덱스 서열(예를 들어, i5, i7)을 부가한다. 도 10a 및 도 10b에 나타낸 어댑터 서열(예를 들어, A14, B15, ME)은 Illumina 시퀀싱에 사용될 수 있지만, 원하는 임의의 다른 적합한 서열을 위해 바뀔 수 있는 예이다. 커플링된 증폭 및 시퀀싱 어댑터를 갖는 수득된 농축된 단편은 이어서 시퀀싱되어 표적 서열(1010)을 식별할 수 있다.
단일 폴리뉴클레오타이드(P8) 및 상응하는 제1 및 제2 Cas-gRNA RNP(1051, 1051')가 도 10a에 예시되지만, 이러한 접근법은 예를 들어 복수의 상이한 폴리뉴클레오타이드를 이들 폴리뉴클레오타이드를 갖는 표적 서열의 측면에 배치되는 폴리뉴클레오타이드의 선택된 것에서의 제1 또는 제2 서열에 특이적으로 혼성화하는 각각의 가이드 RNA 서열을 갖는 제1 및 제2 복수의 Cas-gRNA RNP와 접촉시킴으로써 본원의 다른 곳에 제공된 바와 같은 방식으로 용이하게 스케일링(scale)될 수 있음이 인식될 것이다.
도 10b는 Cas-gRNA RNP를 사용하여 5' 오버행을 갖는 단편을 생성하고, 어댑터를 이에 커플링하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 도 10b의 작업 A에 예시된 조성물에서, 제1 Cas-gRNA RNP(1051)는 폴리뉴클레오타이드(P8)에서의 제1 서열에 혼성화되고, 제2 Cas-gRNA RNP(1051')는 제1 서열로부터 적어도 표적 서열(1010)만큼 이격된 폴리뉴클레오타이드에서의 제2 서열에 혼성화된다. 제1 Cas-gRNA RNP는 폴리뉴클레오타이드(P8)를 제1 가닥 상에서 부위(1011)에서 그리고 제2 가닥 상에서 부위(1011)로부터 적어도 하나의 염기만큼, 예를 들어 2 내지 5개의 염기, 또는 약 5개의 염기만큼 5' 방향으로 벗어난 부위(1012)에서 절단하도록 구성 및 사용될 수 있다. 유사하게, 제2 Cas-gRNA(1051')는 폴리뉴클레오타이드(P8)를 제1 가닥 상에서 부위(1011')에서 그리고 제2 가닥 상에서 부위(1011')로부터 적어도 하나의 염기만큼, 예를 들어 2 내지 5개의 염기, 또는 약 5개의 염기만큼 5' 방향으로 벗어난 부위(1012')에서 절단하도록 구성 및 사용될 수 있다. Cas-gRNA RNP(1051, 1051')는 임의의 적합한 Cas-gRNA RNP를 포함할 수 있으며, dsDNA 절단 이후 적어도 하나의 염기의 단일 가닥 5' 오버행 영역을 남기도록 사용될 수 있다. 예시적으로, Cas는 문헌[Teng et al., "Enhanced mammalian genome editing by new Cas12a orthologs with optimized crRNA scaffolds," Genome Biology 20: 15 (2019)]에 기재된 바와 같은 Cas12a, 예를 들어 Cas12a(Cpf1 또는 C2c1) 또는 FnCas12a, 또는 Cas12a 동원체를 포함할 수 있으며, 이의 전체 내용은 본원에 인용되어 포함된다.
도 10b의 작업 B에 예시된 조성물에서, 작업 A에 의해 생성된 단편의 제1 말단(1050)은 적어도 하나의 염기의 제1 5' 오버행(1015)을 가질 수 있고, 단편의 제2 말단은 적어도 하나의 염기의 제2 5' 오버행(1016)을 가질 수 있다. 예를 들어, 제1 및 제2 5' 오버행은 각각 약 2개 내지 5개의 염기 길이, 예시적으로 약 5개의 염기 길이일 수 있다. 오버행은 서로 동일한 길이일 수 있지만, 반드시 그러할 필요는 없다. 단편의 제1 말단에서, 오버행(1015)을 포함하는 가닥은 5' 포스페이트 기를 포함할 수 있고, 다른 가닥은 3' OH 기를 포함할 수 있다. 유사하게, 단편의 제2 말단에서, 오버행(1016)을 포함하는 가닥은 5' 포스페이트 기를 포함할 수 있고, 다른 가닥은 3' OH 기를 포함할 수 있다. 제1 및 제2 5' 오버행(1015, 1016)은 예를 들어 제1 및 제2 Cas-gRNA RNP(1051, 1051')의 gRNA가 각각 혼성화하는 폴리뉴클레오타이드(P8) 내의 특정 서열의 결과로서 서로 상이한 서열을 가질 수 있다.
도 10b의 작업 C에 예시된 조성물에서, 단편(1050)은 5' 오버행(1015, 1016)에 각각 상보적인 각각의 5' 오버행(1065, 1066)을 포함하는 어댑터(1060, 1060')와 접촉된다. 5' 오버행(1065, 1066)은 서로 동일한 길이를 가질 수 있거나, 서로 상이한 길이를 가질 수 있다. 도 10b에 나타낸 비제한적 예에서, "전방" 어댑터(1060)의 5' 오버행(1065)은 단편(1050)의 5' 오버행(1015)에서의 복수의 염기에 상보적인 복수의 염기를 포함할 수 있거나, 이로 본질적으로 구성될 수 있다. 5' 오버행(1065)은 5' 오버행(1015)과 동일한 길이를 가질 수 있으며, 예를 들어 약 2개 내지 5개의 염기 길이일 수 있고, 예를 들어 약 5개의 염기 길이일 수 있다. "후방" 어댑터(1060)의 5' 오버행(1066)은 단편(1050)의 5' 오버행(1016)에서의 복수의 염기에 상보적인 복수의 염기를 포함할 수 있거나, 이로 본질적으로 구성될 수 있다. 5' 오버행(1066)은 5' 오버행(1016)과 동일한 길이를 가질 수 있으며, 예를 들어 약 2개 내지 5개의 염기 길이일 수 있고, 예를 들어 약 5개의 염기 길이일 수 있다. 어댑터(1060, 1060')는 예를 들어 본원의 다른 곳에 기재된 바와 같은 임의의 다른 적합한 서열을 포함할 수 있다. 예를 들어, 각각의 어댑터(1060, 1060')는 선택적 UMI를 갖는 Y-형상 어댑터 쌍을 포함할 수 있다. 도 10b에 예시된 비제한적 예에서, 어댑터(1060, 1060')는 전방 증폭 어댑터(예를 들어, A14, A14'), 후방 증폭 어댑터(예를 들어, B15, B15')를 포함하며, 선택적으로 ME/ME' 서열 및/또는 UMI/UMI' 서열을 포함할 수 있다.
단편(1050)의 제1 및 제2 5' 오버행(1015, 1016)은 서로 상이한 서열을 가질 수 있기 때문에, 어댑터(1060, 1060')의 오버행(1065, 1066)은 서로 상이하며, 각각의 단편 오버행(1015, 1016)에 상보적인 서열을 가질 수 있다. 예를 들어, 증폭 어댑터(1060)는 제1 5' 오버행(1015)에 상보적이고, 제2 5' 오버행(1016)에 상보적이지 않은 5' 오버행(1065)을 가질 수 있고; 증폭 어댑터(1060')는 제2 5' 오버행(1016)에 상보적이고, 제1 5' 오버행(1015)에 상보적이지 않은 5' 오버행을 가질 수 있다. 따라서, 증폭 어댑터(1060)는 특이적으로 5' 오버행(1015)에 혼성화될 수 있고, 증폭 어댑터(1060')는 특이적으로 5' 오버행(1016)에 혼성화될 수 있다. 예시적으로, 5' 오버행(1015)은 5' 오버행(1065)의 5-염기 서열 GCTGA이 혼성화할 수 있는 5-염기 서열 CGACT를 포함할 수 있고, 5' 오버행(1016)은 오버행(1066)의 5-염기 서열 AACGT가 혼성화할 수 있는 5-염기 서열 TTGCA를 포함할 수 있다. 이들 5-염기 서열은 순수하게 예시적인 것으로 의도됨이 인식될 것이다.
어댑터(1060, 1060')는 임의의 적합한 방식으로 단편(1050)에 결찰되어 도 10b의 작업 D에 예시된 바와 같이 이에 커플링된 어댑터를 갖는 단편을 형성할 수 있다. 예를 들어, 도 10b의 작업 C에 예시된 조성물은 제1 증폭 어댑터(1060)를 단편(1050)의 제1 말단에 결찰하고, 제2 증폭 어댑터(1060')를 단편의(1050) 제2 말단에 결찰하기 위한 적어도 하나의 리가제를 포함할 수 있다. 비제한적 일예에서, 리가제는 T4 DNA 리가제를 포함할 수 있지만, 다른 적합한 리가제가 사용될 수 있음이 인식될 것이다. 이러한 결찰 이후, 도 10b의 작업 E에 예시된 바와 같이, 커플링된 어댑터를 갖는 단편은 샘플 인덱스(i7 및 이의 상보체) 및 시퀀싱 어댑터(예를 들어, P5 및 P7 어댑터, 및 이의 상보체)를 부가하도록 증폭될 수 있다(예를 들어, PCR 사용). 커플링된 증폭 및 시퀀싱 어댑터를 갖는 수득된 농축된 단편은 이어서 시퀀싱되어 표적 서열(1010)을 식별할 수 있다.
단일 폴리뉴클레오타이드(P8), 상응하는 제1 및 제2 Cas-gRNA RNP(1051, 1051'), 및 상응하는 어댑터(1060, 1060')가 도 10b에 예시되지만, 이러한 접근법은 본원의 다른 곳에 제공된 바와 같은 방식으로 용이하게 스케일링될 수 있음이 인식될 것이다. 예를 들어, 도 10b와 관련하여 기재된 작업 A가 복수의 폴리뉴클레오타이드 단편을 생성하기 위해 사용될 수 있다. 도 10b의 작업 B에 예시된 바와 같이, 각각의 단편은, 사이에 표적 서열이 있는 제1 및 제2 말단을 가질 수 있으며, 제1 말단은 적어도 하나의 염기의 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖는다. 제1 및 제2 5' 오버행은 서로 상이한 그리고 다른 단편의 제1 및 제2 5' 오버행과 상이한 서열을 가질 수 있다. 복수의 단편은 도 10b의 작업 C와 관련하여 기재된 바와 같은 방식으로 복수의 제1 증폭 어댑터 및 복수의 제2 증폭 어댑터와 접촉될 수 있다. 각각의 제1 증폭 어댑터는 상응하는 단편의 제1 5' 오버행에 상보적이고, 해당 단편의 제2 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않는 제3 5' 오버행을 가질 수 있다. 각각의 제2 증폭 어댑터는 상응하는 단편의 제2 5' 오버행에 상보적이고, 해당 단편의 제1 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않는 제4 5' 오버행을 가질 수 있다. 증폭 어댑터와 관련하여 용어 "제3" 또는 "제4" 5' 오버행의 사용은 임의의 증폭 어댑터가 3개 또는 4개의 5' 오버행을 갖는 것을 시사하기 보다는 이들의 각각의 오버행을 단편의 제1 및 제2 오버행과 구별하도록 돕기 위한 것으로 의도된다. 리가제는 예를 들어 도 10b의 작업 D와 관련하여 기재된 바와 같은 방식으로 제1 증폭 어댑터를 제1 및 제3 5' 오버행이 상보적인 제1 말단에 결찰하고, 제2 증폭 어댑터를 제2 및 제4 5' 오버행이 상보적인 제2 말단에 결찰하기 위해 추가로 사용될 수 있다.
도 10c는 폴리뉴클레오타이드의 단편을 생성하는 예시 방법(10000)에서의 작업 흐름을 예시한다. 방법(10000)은 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 폴리뉴클레오타이드의 제1 서열에 혼성화하는 단계(작업(10001))를 포함할 수 있고, 제2 Cas-gRNA RNP를 제2 서열로부터 적어도 표적 서열만큼 이격된 폴리뉴클레오타이드의 제2 서열에 혼성화하는 단계(작업(10002))를 포함할 수 있다. 예를 들어, 도 10a의 작업 C 및 도 10b의 작업 A와 관련하여 기재된 바와 같은 방식으로, 제1 및 제2 Cas-gRNA RNP는 표적 서열(1010)의 측면에 배치되도록 선택될 수 있다. 작업(10001 및 10002)은 서로 동일한 시기에 수행될 수 있음을 유의한다. 방법(10000)은 또한 제1 및 제2 서열을 제1 및 제2 Cas-gRNA RNP로 절단하여 제1 및 제2 말단을 갖는 단편 및 이들 사이의 표적 서열을 생성하는 단계를 포함할 수 있으며, 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖는다(작업(10003)). 예를 들어, Cas는 Cas12a를 포함할 수 있다. 도 10b와 관련하여 기재된 바와 같은 방식으로, 상보적인 5' 오버행을 갖는 제1 증폭 어댑터는 단편의 제1 말단에 결찰될 수 있고, 상보적인 5' 오버행을 갖는 제2 증폭 어댑터는 단편의 제2 말단에 결찰될 수 있다.
따라서, 임의의 적합한 수의 폴리뉴클레오타이드 내의 표적 서열은 Cas-gRNA RNP가 특이성을 갖는 관심의 표적 서열의 측면에 배치되고, 5' 오버행을 갖는 단편을 생성하는 데 사용되고, 이어서 상보적인 5' 오버행을 갖는 증폭 어댑터가 단편이 단편의 오버행에 특이적으로 커플링하여 단편이 선택적으로 증폭될 수 있도록 하는 프로세스를 통해 농축될 수 있음이 인식될 것이다. 2층의 특이성(Cas-gRNA RNP를 통해 그리고 증폭 어댑터에 대한 상보적인 5' 오버행 결찰을 통해)은 수득된 단편을 시퀀싱할 때 유용할 수 있는 특히 높은 수준의 농축을 제공할 수 있다.
어댑터를 포함하는 3' 오버행을 갖는 단편 생성 및 폴리머라제 연장
일부 예에서, 본원에 제공된 방법 및 조성물은 표적화된 증폭 및/또는 표적화된 시퀀싱을 위한 길고, 힘든 작업흐름의 문제를 해결한다. 본 개시내용으로부터 명백해질 것인 바와 같이, Cas-gRNA RNP는 표적 농축 방법의 일부로서 폴리뉴클레오타이드 단편을 생성하는 데 사용될 수 있다. 증폭 어댑터는 예를 들어 본원의 다른 곳에 기재된 바와 같은 방식으로 말단 복구, A-테일링, 및 어댑터 결찰을 사용하는 다수의 추가 단계를 사용하여 부가될 수 있다. 이제 도 11a 내지 도 11g와 관련하여 기재된 것인 바와 같이, gRNA가 프라이머 결합 부위 및 증폭 어댑터 부위를 포함하는 변형된 gRNA를 포함하는 Cas-gRNA RNP가 증폭 어댑터를 포함하는 3' 오버행을 갖는 단편을 생성하는 데 사용될 수 있다. 본원에 제공된 바와 같이, 단편화에 의한 신속한 Cas-gRNA RNP 기반 농축과 간소화된 어댑터 부가의 조합은 표적화된 시퀀싱 적용을 위한 더 빠르고, 더 용이한 완전한 작업흐름을 제공한다. 특히, Cas-gRNA RNP는 말단 복구, A-테일링, 또는 전체 세트의 어댑터 결찰에 대한 필요 없이 증폭을 위해 필요한 적어도 하위세트의 어댑터를 포함하는 단편을 생성하는 데 사용될 수 있다.
도 11a 내지 도 11g는 단편을 Cas-gRNA RNP를 사용하여 생성하고, 이에 어댑터를 커플링하기 위한 프로세스 흐름에서의 예시 조성물 및 작업을 개략적으로 예시한다. 먼저 도 11a를 참조하면, 작업 A에서, 프라이머 결합 부위(1101), 증폭 어댑터 부위(1102), 및 CRISPR 프로토스페이서(1103)를 포함하는 적어도 하나의 gRNA(1100)가 제공된다. 도 11a에 예시된 비제한적 예에서, 증폭 어댑터 부위(1102)는 프라이머(1101)와 CRISPR 프로토스페이서(1103) 사이에 위치한다. 프라이머 결합 부위(1101)는 CRISPR 프로토스페이서(1103) 중 적어도 일부에 대략 상보적일 수 있어서 예를 들어 프라이머 결합 부위 및 CRISPR 프로토스페이서가 본원에 보다 상세하게 기재된 바와 같은 방식으로 폴리뉴클레오타이드의 상보적 가닥에 혼성화할 수 있도록 한다. gRNA는 선택적으로 증폭 어댑터 부위(1102)와 CRISPR 프로토스페이서(1103) 사이에 위치할 수 있는 루프(1104 및/또는 1105)를 포함할 수 있다. 루프 및 CRISPR 프로토스페이서를 포함하는 연장된 gRNA에 관한 추가의 상세 내용의 경우, 문헌[Anzalone et al., "Search-and-replace genome editing without double-strand breaks or donor DNA," Nature 576: 149-157 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
도 11a의 작업 B에 예시된 바와 같이, 작업 A의 gRNA의 CRISPR 프로토스페이서(1103)는 제1 Cas-gRNA RNP(1150)의 Cas 단백질(1151)에 의해 결합될 수 있다. 도 11a의 작업 B에 예시된 바와 같은 방식으로, 프라이머 결합 부위(1101) 및 증폭 어댑터 부위(1102)는 Cas 단백질의 외부로 연장될 수 있다. Cas 단백질(1151)은 이중 가닥 폴리뉴클레오타이드 절단을 수행하도록 구성될 수 있으며, 예를 들어 Cas9, Cas12a, 또는 Cas12f를 포함할 수 있다. Cas-gRNA RNP(1150)는 폴리뉴클레오타이드(P9)와 복합체를 형성할 수 있으며, 제1 CRISPR 프로토스페이서(1103)는 폴리뉴클레오타이드(P9)의 제1 가닥에 혼성화되고, 제1 프라이머 결합 부위(1101)는 폴리뉴클레오타이드의 제2 가닥에 혼성화된다. 제1 및 제2 가닥은 제1 CRISPR 프로토스페이서(1103)의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP에 의해 절단된다. 이러한 절단은 예를 들어 적어도 제1 CRISPR 프로토스페이서(1103)를 폴리뉴클레오타이드(P9)의 제1 가닥에 혼성화한 이후 수행될 수 있다. 일부 예에서, 이러한 절단에 후속적으로, 이어서 제1 프라이머 결합 부위(1101)가 폴리뉴클레오타이드(P9)의 제2 가닥에 혼성화한다.
Cas-gRNA RNP(1150)의 gRNA(1100)는 본원의 특정 다른 예에서 사용될 수 있는 gRNA와 비교하여 상대적으로 긴 3' 연장을 포함하며, 증폭 어댑터를 제2 폴리뉴클레오타이드 가닥의 절단된 3' 말단을 부착하는 데 사용될 수 있는 프라이머 결합 부위(1101) 및 어댑터 부위(1102)를 포함한다. 보다 구체적으로, 도 11a의 작업 C에 예시된 바와 같이, 프라이머 결합 부위(1101)가 제2 가닥의 일부(1155)에 혼성화할 때, Cas(1151)에 의해 절단되었던 3' 말단 근처에, 어댑터 부위(1102)가 프라이머 결합 부위(1101)와 일부(1155) 사이의 듀플렉스의 3'인 위치에 배치된다. 폴리머라제(예컨대, 역전사 효소(RT))가 프라이머로서 듀플렉스의 일부(1155)를 사용하여 어댑터 부위(1102)의 서열을 기준으로 3' 말단을 연장하는 작업 C에 포함될 수 있다. 따라서, 폴리머라제는 Cas 단백질(1151)에 의해 유발되었던 제2 가닥에서의 절단에서 어댑터 부위(1102)의 앰플리콘(1156)을 생성할 수 있으며, 앰플리콘은 증폭 어댑터로서 사용될 수 있다. 폴리머라제(예를 들어, RT)는 선택적으로 예를 들어 문헌[Anzalone et al]에 기재된 것과 유사한 방식으로 Cas 단백질(1151)에 커플링될 수 있다. 예를 들어, RT 및 Cas 단백질(1151)은 제1 융합 단백질의 구성요소일 수 있거나, 서로 달리 적합하게 커플링될 수 있다. 대안적으로, RT는 임의의 적합한 작업 동안, 예를 들어 도 11a에 예시된 작업 B 또는 작업 C 동안 부가될 수 있다.
작업 B에서의 폴리뉴클레오타이드(P9)의 이중 가닥 절단 및 작업 C에서의 증폭 어댑터(1156)의 생성 이후, RT 및 Cas 단백질(1151)은 예를 들어 열 또는 임의의 다른 방법(예를 들어, 프로테이나제 K, 프로테아제, 또는 SDS와 같은 시약 사용)을 사용하여 폴리뉴클레오타이드(P9)로부터 분리되어 도 11a의 작업 D에 예시된 단편(1160)을 수득할 수 있다. 단편(1160)은 증폭 어댑터(1156)를 포함하거나, 이로 본질적으로 구성된 3' 오버행을 포함할 수 있다. 이어서, 5' 증폭 어댑터(1157)가 어댑터(1156)의 반대편의 단편(1160)의 절단된 5' 말단에 커플링될 수 있다. 예를 들어, 증폭 어댑터(1157)는 어댑터(1156)의 상응하는 하위서열에 상보적이고, 따라서 이에 혼성화되는 하위서열(1158)을 포함할 수 있다. 혼성화된 증폭 어댑터(1157)는 단편(1160)의 절단된 5' 말단에 DNA 리가제로 밀봉되어 신규 5' 말단을 형성할 수 있다.
도 11a는 폴리뉴클레오타이드가 제1 영역에서 절단될 수 있으며, 수득된 절단 말단에 증폭 어댑터가 부가되는 방식을 상세하게 기재하지만, 폴리뉴클레오타이드는 또한 제2 영역에서 절단될 수 있으며, 수득된 절단 말단에 증폭 어댑터가 부가됨이 인식되어야 한다. 즉, 절단 세트가 증폭 및 시퀀싱에 적합한 단편을 형성하는 데 사용될 수 있다. 단편은 표적 서열을 포함할 수 있고, 절단 및 증폭 단계는 본원의 다른 곳에 기재된 것과 유사한 방식으로 표적 서열을 농축할 수 있다.
예를 들어, 도 11b의 작업 A에 예시된 바와 같이, 폴리뉴클레오타이드(P9)는 도 11a와 관련하여 기재된 바와 유사하게 구성된 제1 Cas-gRNA RNP(1150) 및 제2 gRNA(1100')를 포함하는 제2 Cas-gRNA RNP(1150')와 접촉될 수 있다. 제2 gRNA(1100')는 가이드 RNA(1100)에 대해 기재된 바와 유사하게 구성된 제2 프라이머 결합 부위(1101'), 제2 증폭 어댑터 부위(1102'), 및 제2 CRISPR 프로토스페이서(1103')를 포함할 수 있다. 본원의 다른 곳에 기재된 것과 유사한 방식으로, 제1 및 제2 CRISPR 프로토스페이서(1103, 1103')는 표적 서열(1110)에 측면에 배치되는 서열을 표적화할 수 있다. 도 11b에 예시된 바와 같이, 제2 CRISPR 프로토스페이서(1103')는 제1 가닥(즉, 제1 CRISPR 프로토스페이서(1103)가 혼성화하는 것의 대향 가닥)에 혼성화될 수 있고, 제2 결합 부위(1101')는 제2 가닥(즉, 프라이머 결합 부위(1101)가 혼성화는 것의 대향 가닥)에 혼성화된다. 도 11a와 관련하여 기재된 것과 유사한 방식으로, 제2 Cas 단백질(1151')은 제2 CRISPR 프로토스페이서(1103')에 결합하고, 선택적으로 이중 가닥 폴리뉴클레오타이드에서 절단을 생성할 수 있는 Cas9 또는 다른 적합한 Cas 단백질을 포함할 수 있다.
도 11a와 관련하여 기재된 것과 유사한 방식으로, 폴리뉴클레오타이드(P9)의 제1 및 제2 가닥은 제1 CRISPR 프로토스페이서(1103)의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP(1150)에 의해 절단될 수 있고, 제2 CRISPR 프로토스페이서(1103')의 서열을 기준으로 각각의 위치에서 제2 Cas-gRNA RNP(1150')에 의해 또한 절단될 수 있다. 도 11b의 작업 A로부터 이해될 수 있는 바와 같이, 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열(1110)만큼 이격된다. 도 11b의 작업 B에서, 도 11a의 작업 C와 관련하여 기재된 바와 같은 방식으로, 제1 폴리머라제(예를 들어, RT)는 제1 Cas 단백질(1151)에 의해 유발된 제1 가닥에서의 절단에서 증폭 어댑터 부위(1102)의 앰플리콘을 생성하기 위해 제공될 수 있고, 제2 폴리머라제(예를 들어, RT)는 제2 Cas 단백질에 의해 유발된 제1 가닥에서의 절단에서 증폭 어댑터 부위(1102')의 앰플리콘을 생성하기 위해 제공될 수 있다. 일부 예에서, 제2 폴리머라제(예를 들어, RT)는 제2 Cas 단백질에 커플링될 수 있다. 예를 들어, 제2 폴리머라제 및 제2 Cas 단백질(1151')은 선택적으로 제2 융합 단백질의 구성요소일 수 있다.
도 11b에 예시된 작업 C에서, Cas-gRNA RNP(1150, 1150') 및 폴리머라제는 제거되어 제1 말단, 제2 말단, 및 제1 말단과 제2 말단 사이에 위치하는 표적 서열(1110)을 포함하는 부분적 이중 가닥 폴리뉴클레오타이드 단편(1170)을 수득할 수 있다. 제1 말단은 제1 증폭 어댑터(1156)(예를 들어, A14' 및 선택적 ME' 서열 또는 제1 어댑터 부위(1102)에 포함되었던 다른 적합한 서열)를 포함할 수 있는 제1 3' 오버행(1115)을 포함할 수 있다. 제2 말단은 제2 증폭 어댑터(1156')(예를 들어, A14' 및 선택적 ME' 서열 또는 제2 어댑터 부위에 포함되었던 다른 적합한 서열)를 포함할 수 있는 제2 3' 오버행(1115')을 포함할 수 있다. 도 11b의 작업 D에 예시된 바와 같이, 5' 증폭 어댑터(1157)는 이어서 어댑터(1156)의 반대편의 단편(1170)의 절단된 5' 말단에 커플링될 수 있다. 예를 들어, 증폭 어댑터(1157)는 어댑터(1156)의 상응하는 ME'(또는 다른) 서열에 상보적이고, 따라서 이에 혼성화되는 ME(또는 다른) 서열을 포함할 수 있다. 유사하게, 증폭 어댑터(1157')는 어댑터(1156')의 상응하는 ME'(또는 다른) 서열에 상보적이고, 따라서 이에 혼성화되는 ME'(또는 다른) 서열을 포함할 수 있다. 혼성화된 증폭 어댑터(1157, 1157')는 단편(1160)의 절단된 5' 말단에 DNA 리가제로 밀봉되어 신규 5' 말단을 형성할 수 있다.
도 11b의 작업 E에 예시된 바와 같이, 커플링된 어댑터(1156, 1157, 1156', 1157')를 갖는 단편은 샘플 인덱스(i5 및 i7, 및 이의 상보체) 및 시퀀싱 어댑터(예를 들어, P5 및 P7 어댑터, 및 이의 상보체)를 부가하도록 증폭될 수 있다(예를 들어, PCR 사용). 증폭 동안, 표적화된 영역의 "상부" 및 "하부" 가닥은 포크화 어댑터 구조의 결찰로 인해 상이한 배향을 생성하기 때문에 각각의 단편은 양방향성 시퀀싱 판독에 사용하기 위한 양방향성 앰플리콘을 생성한다. 이는 2개의 시퀀싱 판독물이 표적 서열(1110)의 각각의 말단으로부터 수행되어 추가의 커버리지를 제공할 수 있음을 의미한다. 증폭은 또한 다중 시퀀싱에서 사용하기 위한 추가의 클러스터링 서열(예를 들어, P5, P7) 및 샘플 인덱스 서열(예를 들어, i5, i7)을 부가한다. 도 11b에 나타낸 어댑터 서열(예를 들어, A14, B15, ME)은 Illumina 시퀀싱에 사용될 수 있지만, 원하는 임의의 다른 적합한 서열을 위해 바뀔 수 있는 예이다. 커플링된 증폭 및 시퀀싱 어댑터를 갖는 수득된 농축된 단편은 이어서 시퀀싱되어 표적 서열(1110)을 식별할 수 있다.
단일 폴리뉴클레오타이드(P9) 및 상응하는 제1 및 제2 Cas-gRNA RNP(1150, 1150')가 도 11a 및 도 11b에 예시되지만, 이러한 접근법은 예를 들어 복수의 상이한 폴리뉴클레오타이드를 이들 폴리뉴클레오타이드를 갖는 표적 서열의 측면에 배치되는 폴리뉴클레오타이드의 선택된 것에서의 제1 또는 제2 서열에 특이적으로 혼성화하는 각각의 가이드 RNA(특히, CRISPR 프로토스페이서)를 갖는 제1 및 제2 복수의 Cas-gRNA RNP와 접촉시킴으로써 본원의 다른 곳에 제공된 바와 같은 방식으로 용이하게 스케일링될 수 있음이 인식될 것이다.
도 11b는 증폭 어댑터를 농축되는 단편의 양쪽 말단에 부가하기 위한 프로세스 흐름의 비제한적 예를 예시하며, 다른 프로세스 흐름이 적합하게는 사용될 수 있음이 인식될 것이다. 도 11c는 Cas-gRNA RNP(1150)가 도 11a의 작업 A 및 B, 및 도 11b의 작업 A와 관련하여 기재된 바와 같은 방식으로 폴리뉴클레오타이드(P10)에서 절단을 생성하는 데 사용될 수 있는 작업 A를 포함하는 예를 예시한다. 도 11c의 작업 B에서, 폴리머라제(예를 들어, RT)가 프라이머로서의 gRNA(1100)의 프라이머 결합 부위(1101)에 혼성화되는 가닥 중 일부를 사용하고, 주형으로서 어댑터 부위(1102)를 사용하여 도 11a의 작업 C 및 도 11b의 작업 B와 관련하여 기재된 바와 같은 방식으로 Cas-gRNA RNP(1150)에 의해 절단되었던 3' 말단을 연장하는 데 사용되어 절단되었던 3' 말단에 커플링되고, 어댑터 부위(1102)에 상보적인 서열을 갖는 앰플리콘을 생성한다. 도 11c의 작업 C에서, Cas-gRNA RNP 및 폴리머라제는 제거되어 도 11a의 작업 D 및 도 11b의 작업 C와 관련하여 기재된 바와 같은 방식으로 3' 어댑터(예를 들어, A14' 및 ME' 서열)를 노출시킨다.
도 11c의 작업 D에서, 폴리뉴클레오타이드는 5' 어댑터를 포함하는 트랜스포좀(예를 들어, Tn5 또는 Tn7)과 접촉될 수 있으며, 트랜스포좀은 본원에 다른 곳에 기재된 바와 같은 방식으로 폴리뉴클레오타이드를 절단하고, 어댑터를 이의 절단된 5'에 부가할 수 있다. 이 예에서, 트랜스포좀 활성은 비특이적일 수 있으며, 따라서 랜덤 위치에서 폴리뉴클레오타이드를 태그먼트화할 수 있음을 유의한다. 이러한 작업은 임의의 작업 A 내지 C와 동시에, 전에, 또는 후에 수행될 수 있다. 이어서, 트랜스포좀은 도 11c의 작업 E에서 예시된 바와 같이 제거될 수 있으며, 수득된 단편은 5' 및 3' 어댑터(예를 들어, B15 및 A14')를 포함하는 제1 가닥 및 증폭 어댑터가 없는 제2 가닥을 포함할 수 있지만, 이 가닥은 태그먼트화 동안 트랜스포좀에 의해 부가된 ME' 서열을 포함할 수 있다. 단편은 이후 도 11c의 작업 F에 예시된 바와 같이, 샘플 인덱스(i5 및 i7, 및 이의 상보체) 및 시퀀싱 어댑터(예를 들어, P5 및 P7 어댑터, 및 이의 상보체)를 부가하도록 증폭될 수 있다(예를 들어, PCR 사용). 증폭 동안, A14 및 B15를 포함하는 단편은 기하급수적으로 증폭한다. 커플링된 증폭 및 시퀀싱 어댑터를 갖는 수득된 농축된 단편은 이어서 시퀀싱되어 표적 서열(1110)을 식별할 수 있다.
도 11d는 도 11c와 관련하여 기재된 방식으로 실시될 수 있는 작업 A, B, 및 C를 또한 포함하는 대안적 예를 예시한다. 도 11d의 작업 D에서, 폴리뉴클레오타이드는 도 4a 내지 도 4j, 또는 도 6a 내지 도 6b와 관련하여 기재된 바와 같은 Cas-gRNA RNP/트랜사포사제 융합 단백질과 접촉될 수 있다. Cas-gRNA RNP는 폴리뉴클레오타이드에서의 특이적 서열에 혼성화하지만, 폴리뉴클레오타이드를 절단하지 않도록 비활성화될 수 있다(예를 들어, dCas9 또는 Cas12k를 포함할 수 있음). 폴리뉴클레오타이드에 혼성화하는 융합 단백질의 Cas-gRNA RNP에 반응하여, 융합 단백질의 트랜스포사제는 5' 증폭 어댑터를 포함하도록 폴리뉴클레오타이드를 태그먼트화할 수 있다. 유체 및/또는 생화학적 조건은 선택적으로 Cas-gRNA RNP가 폴리뉴클레오타이드가 혼성화되었던 후까지 트랜스포사제의 활성을 억제하도록 본원의 다른 곳에 기재된 바와 같은 방식으로 제어될 수 있다. 이 예에서, 트랜스포좀 활성은 비특이적일 수 있지만, Cas-gRNA RNP는 서열 특이적이며, 따라서 작업 B 동안 해당 절단으로부터 다른 측면 상의 표적 서열의 측면에 배치되도록 선택되는 위치에서 폴리뉴클레오타이드를 태그먼트화할 수 있음을 유의한다. 이러한 작업은 도 11d의 임의의 작업 A 내지 C와 동시에, 전에, 또는 후에 수행될 수 있다. 이어서, 트랜스포좀은 도 11D의 작업 E에서 예시된 바와 같이 제거될 수 있으며, 수득된 단편은 5' 및 3' 어댑터(예를 들어, B15 및 A14')를 포함하는 제1 가닥 및 증폭 어댑터가 없는 제2 가닥을 포함할 수 있지만, 이 가닥은 태그먼트화 동안 트랜스포좀에 의해 부가된 ME' 서열을 포함할 수 있다. 단편은 이후 도 11d의 작업 F에 예시된 바와 같이, 샘플 인덱스(i5 및 i7, 및 이의 상보체) 및 시퀀싱 어댑터(예를 들어, P5 및 P7 어댑터, 및 이의 상보체)를 부가하도록 증폭될 수 있다(예를 들어, PCR 사용). 증폭 동안, A14 및 B15를 포함하는 단편은 기하급수적으로 증폭한다. 커플링된 증폭 및 시퀀싱 어댑터를 갖는 수득된 농축된 단편은 이어서 시퀀싱되어 표적 서열(1110)을 식별할 수 있다.
도 11e 및 도 11f는 각각 도 11c 및 도 11d의 프로세스 흐름을 사용하여 생성될 수 있는 단편을 예시한다. 도 11c에 예시된 바와 같이, 비특이적 태그먼트화가 폴리뉴클레오타이드의 길이를 따라 랜덤 위치에서 수행되어 표적 서열(1110)을 포함하지 않는 다수의 단편 크기 및 하위세트의 단편을 초래할 수 있다. 대조적으로, 도 11d에 예시된 바와 같이, Cas-gRNA RNP/트랜스포사제 융합 단백질을 사용하는 특이적 태그먼트화는 표적 서열(1110)을 포함하는 실질적으로 균일한 크기의 단편을 수득할 수 있다.
전술한 것으로부터, 다양한 상이한 기술이 간소화된 방식으로 증폭 및 시퀀싱에서 사용하기에 적합한 어댑터를 갖는 단편을 생성하는 데 사용될 수 있음이 이해될 것이다. 방법(11000)은 방법에서의 단계의 흐름을 예시한다. 방법은 Cas-gRNA RNP를 제1 및 제2 가닥을 포함하는 폴리뉴클레오타이드와 접촉시키는 단계(작업(11001))를 포함할 수 있다. Cas-gRNA RNP는 프라이머, 증폭 어댑터 부위, 및 CRISPR 프로토스페이서를 포함하는 가이드 RNA를 포함할 수 있다. Cas-gRNA RNP는 또한 CRISPR 프로토스페이서와 결합하는 Cas 단백질을 포함할 수 있다. 방법(11000)은 또한 CRISPR 프로토스페이서를 제1 가닥에 혼성화는 단계(작업(11002))를 포함할 수 있다. 방법(11000)은 또한 프라이머를 제2 가닥에 혼성화하는 단계(작업(11003))를 포함할 수 있다. gRNA, Cas 단백질, 이러한 Cas-gRNA RNP와 폴리뉴클레오타이드의 접촉, 및 폴리뉴클레오타이드의 선택된 영역에 대한 특정 gRNA 성분의 혼성화의 비제한적 예가 도 11a 내지 도 11d와 관련하여 제공된다.
선택적으로, 방법(11000)은 예를 들어 도 11a 내지 도 11d와 관련하여 기재된 바와 같은 방식으로 제1 및 제2 가닥을 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 Cas-gRNA RNP에 의해 절단하는 단계를 포함할 수 있다. 선택적으로, 방법(11000)은 예를 들어 도 11a 내지 도 11d와 관련하여 기재된 바와 같은 방식으로 제1 역전사 효소를 사용하여 제1 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 단계를 추가로 포함할 수 있다.
선택적으로, 방법(11000)은 폴리뉴클레오타이드를 제2 Cas-gRNA RNP와 접촉시키는 단계를 추가로 포함할 수 있다. 제2 Cas-gRNA RNP는 제2 프라이머, 제2 증폭 어댑터 부위, 및 제2 CRISPR 프로토스페이서를 포함하는 제2 가이드 RNA; 및 제2 CRISPR 프로토스페이서와 결합하는 제2 Cas 단백질을 포함할 수 있다. 방법(11000)은 제2 CRISPR 프로토스페이서를 제1 가닥에 혼성화하는 단계; 및 제2 프라이머를 제2 가닥에 혼성화하는 단계를 포함할 수 있다. 제2 Cas-gRNA RNP는 선택적으로 제2 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제1 및 제2를 절단할 수 있다. 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열만큼 이격될 수 있다. 제2 역전사 효소가 제2 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 데 사용될 수 있다. 제1 및 제2 Cas-gRNA RNP 및 제1 및 제2 역전사 효소는 예를 들어 도 11b와 관련하여 기재된 바와 같은 방식으로 제1 말단 및 제2 말단을 갖는 부분적 이중 가닥 폴리뉴클레오타이드 단편을 생성할 수 있으며, 제1 말단은 제1 3' 오버행을 포함하고; 제2 말단은 제2 3' 오버행을 포함하고; 표적 서열은 제1 말단과 제2 말단 사이에 위치한다. 제1 3' 오버행은 제1 증폭 어댑터 부위의 앰플리콘을 포함할 수 있고, 제2 3' 오버행은 제2 증폭 어댑터 부위의 앰플리콘을 포함할 수 있다. 방법(11000)은 예를 들어 도 11b와 관련하여 기재된 바와 같은 방식으로 제3 증폭 어댑터를 제1 말단에서의 5' 기에 결찰하는 단계; 제4 증폭 어댑터를 제2 말단에서의 5' 기에 결찰하는 단계; 제1, 제2, 제3, 및 제4 증폭 어댑터를 사용하여 단편을 증폭시키는 단계; 및 증폭된 단편을 시퀀싱하는 단계를 추가로 포함할 수 있다.
추가 논의
본원에 제공된 프로세스 흐름의 임의의 적합한 양태는 서로의 임의의 적합한 조합으로 수행될 수 있음이 인식될 것이다. 예를 들어, 도 1k와 관련하여 기재된 방법(1000)의 임의의 적합한 작업(들), 도 2j와 관련하여 기재된 방법(2000)의 임의의 적합한 작업(들), 도 2k와 관련하여 기재된 방법(2010)의 임의의 적합한 작업(들), 도 3e와 관련하여 기재된 방법(3000)의 임의의 적합한 작업(들), 도 4j와 관련하여 기재된 방법(4000)의 임의의 적합한 작업(들), 도 5k와 관련하여 기재된 방법(5000)의 임의의 적합한 작업(들), 도 6a 및 도 6b와 관련하여 기재된 임의의 적합한 작업(들), 도 7a 내지 도 7g와 관련하여 기재된 임의의 적합한 작업(들), 도 8h와 관련하여 기재된 방법(8000)의 임의의 적합한 작업(들), 도 9f와 관련하여 기재된 방법(9000)의 임의의 적합한 작업(들), 도 10c와 관련하여 기재된 방법(10000)의 임의의 적합한 작업(들), 및/또는 도 11g와 관련하여 기재된 방법(11000)의 임의의 적합한 작업(들). 순수하게 예시적인 일 예로서, 방법(1000)은 샘플로부터의 일 종의 유전 물질을 실질적으로 제거하는 데 사용될 수 있으며, 방법(2000, 2010, 3000, 4000, 8000, 9000, 10000, 또는 11000)으로부터의 작업은 시퀀싱을 위해 잔여 폴리뉴클레오타이드를 제작하는 데 사용될 수 있고, 방법(5000)으로부터의 작업은 이들 폴리뉴클레오타이드에 대한 후성적 검정을 수행하는 데 사용될 수 있다. 순수하게 예시적인 또 다른 예로서, 방법(1000)은 샘플로부터의 일 종의 유전 물질을 실질적으로 제거하는 데 사용될 수 있고, 방법(5000)으로부터의 작업은 잔여 폴리뉴클레오타이드에 대한 후성적 검정을 수행하는 데 사용될 수 있다. 순수하게 예시적인 또 다른 예로서, 방법(2000, 2010, 3000, 4000, 8000, 9000, 10000, 및/또는 11000)으로부터의 작업은 시퀀싱을 위해 폴리뉴클레오타이드를 제작하는 데 사용될 수 있으며, 방법(5000)으로부터의 이들 폴리뉴클레오타이드에 대한 후성적 검정을 수행하는 데 사용될 수 있다. 후성적 검정의 결과는 폴리뉴클레오타이드 서열과 비교될 수 있다.
따라서, 본 개시내용은 회합된 후성적 단백질을 갖는 폴리뉴클레오타이드를 포함하는 조성물을 제공하는 단계; 폴리뉴클레오타이드를 폴리뉴클레오타이드의 별개의 제1 표적 영역 및 제2 표적 영역에 각각 특이적으로 혼성화하며, 폴리뉴클레오타이드를 절단하여 이들 사이의 혼성화된 폴리뉴클레오타이드 단편을 제공하는 제1 Cas-gRNA RNP 및 제2 Cas-gRNA RNP와 혼성화하는 단계 - 제1 및/또는 제2 RNP는 이에 결합하는 표지를 가짐 -; 및 혼성화된 폴리뉴클레오타이드 단편 및 RNP를 표지에 결합하는 포획 요소로 정제하며, 이로 인해 조성물을 회합된 후성적 단백질을 갖는 폴리뉴클레오타이드에 대해 농축하는 단계를 포함할 수 있는 유전자좌 표적화된 후성적 식별을 제공함이 이해될 수 있다.
일부 예에서, 본 개시내용은 폴리뉴클레오타이드로부터 RNP를 제거하는 단계를 추가로 제공한다. 일부 예에서, 본 개시내용은 폴리뉴클레오타이드 및 회합된 후성적 단백질을 검정하는 단계를 추가로 제공한다. 일부 예에서, 본 개시내용은 폴리뉴클레오타이드 및 회합된 후성적 단백질을 유전자좌 표적화된 고다중 단백질체 올리고-연결된 항체 검정 및/또는 유전자좌 표적화된 ATAC 시퀀싱 검정 및/또는 ChIP 시퀀싱 검정으로 검정하는 단계를 제공한다. 일부 예에서, 본 개시내용은 후성적 단백질의 유전자좌 특이적 표시를 제공한다.
일부 예에서, 본 개시내용은 하나 초과의 후성적 단백질의 유전자좌 특이적 식별을 제공한다. 일부 예에서, 본 개시내용은 폴리뉴클레오타이드를 한쌍 초과의 Cas-gRNA RNP에 혼성화하는 단계를 제공하며, 제2 Cas-gRNA RNP는 폴리뉴클레오타이드의 별개의 제1 표적 영역 및 제2 표적 영역에 각각 특이적으로 혼성화하고, 폴리뉴클레오타이드를 절단하여 사이에 혼성화된 폴리뉴클레오타이드의 다수의 단편을 제공한다. 일부 예에서, Cas-gRNA RNP의 각각의 쌍의 제1 및/또는 제2 RNP는 표지에 결합하는 포획 요소로 혼성화된 폴리뉴클레오타이드 단편 및 RNP를 정제하기 위해 이에 결합된 표지를 가지며, 이로 인해 조성물을 회합된 후성적 단백질을 갖는 폴리뉴클레오타이드에 대해 농축한다.
일부 예에서, 본 개시내용은 동일한 염색체 상의 하나 초과의 후성적 단백질의 유전자좌 특이적 식별을 제공한다. 일부 예에서, 본 개시내용은 Cas-gRNA RNP 쌍이 동일한 게놈의 폴리뉴클레오타이드에는 혼성화하지만, 상이한 염색체 상에는 혼성화하지 않는 것을 제공한다. 일부 예에서, 본 개시내용은 게놈에서의 하나 초과의 후성적 단백질의 유전자좌 특이적 식별을 제공한다.
일부 예에서, 본 개시내용은 폴리뉴클레오타이드 및 회합된 후성적 단백질을 후성적 단백질에 상응하는 올리고뉴클레오타이드 표지로 표지된 항-후성적 단백질 항체와 접촉시키는 것을 포함하는, 폴리뉴클레오타이드 및 회합된 후성적 단백질을 유전자좌 표적화된 고다중 단백질체 올리고-연결된 항체 검정으로 검정하는 것을 제공한다.
일부 예에서, 본 개시내용은 예를 들어 도 5i 내지 도 5j와 관련하여 기재된 바와 같이 폴리뉴클레오타이드 및 회합된 후성적 단백질을 유전자좌 표적화된 ATAC 서열 검정으로 검정하는 것을 제공한다.
이전에 알려진 ATAC 시퀀싱은 검정 단순성 및 염색질 접근성의 광범위한 게놈 전체의 평가로 인해 NGS 기반 후성적 연구가 가능하다. 그러나, 이전의 ATAC 시퀀싱은 각각의 DNA 부위에 결합된 단백질을 직접 식별할 수도 없고, 연구 및 임상적 마커(예를 들어, 액체 생검)에 중요한 결합 부위 및 후성적 변화를 상세하게 분석할 수도 없다. 이전에 알려진 ChIP 시퀀싱 방법은 관심의 단백질에 결합된 항체에 의한 Tn5 단백질A 태그먼트화를 수반하는 방법을 사용하여 특정 단백질의 DNA 결합 부위를 직접 분석한다. 이전에 알려진 후성적 검정에 관한 추가의 상세 내용의 경우, 예를 들어 다음 참고문헌을 참조하며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Kaya-Okur et al., "CUT&Tag for efficient epigenomic profiling of small samples and single cells," Nat Comm 10: 1930, 1-10 (2019)]; 문헌[Wang et al., "CoBATCH for high-throughput single-cell epigenomic profiling," Mol Cell 76(1): 206-216.e7 (2019)]; 문헌[Ai et al., "Profiling chromatin states using single cell itCHIP-seq," Nat Cell Biol 21: 1164-1172 (2019)]; 및 문헌[Carter et al., "Mapping histone modifications in low cell number and single cells using antibody-guided chromatin tagmentation (ACT-seq)," Nat Comm 10: 3747, 1-5 (2019)].
일부 예에서, 본 개시내용은 예를 들어 도 3a 내지 도 3e와 관련하여 기재된 바와 같이 폴리뉴클레오타이드 단편을 외인성 고유한 분자 식별자(UMI)로 강화하는 것을 제공한다. 일부 예에서, 본 개시내용은 외인성 UMI를 갖는 표적화된 시퀀싱 라이브러리 생성을 제공한다. 일부 예에서, UMI는 예를 들어 도 4a 내지 도 4j와 관련하여 기재된 바와 같이 중첩 DNA 결합 풋프린트(footprint)를 갖는 다수의 Cas 뉴클레아제를 표적화함으로써 폴리뉴클레오타이드 단편의 말단 상에 생성되어 단편 말단에서의 다양성을 생성하며; 이와 관련하여, 다양한 단편 말단 자체는 단편 말단에 커플링될 수 있는 별도의 UMI 서열로부터 구별되는 UMI를 제공하는 것으로 간주될 수 있다. 다양한 단편 말단은 임의의 적합한 시퀀싱 또는 검정 기술, 예컨대 Cas9 매개 음성 농축, CRISPR-DS, 또는 다른 이중 Cas9 기반 CRISPR 표적화된 LP 방법과 결합하여 사용될 수 있다.
일부 예에서, 본 개시내용은 Cas9 매개 음성 농축 방법을 제공하며, 여기서, 게놈 DNA 출발 물질로부터 Cas-gRNA RNP는 폴리뉴클레오타이드 영역에 결합하고, 절단하고, 엑소뉴클레아제(III, VII)로부터 보호한다. 대안적으로, dCas9는 엑소뉴클레아제 활성을 차단하는 데 사용되어 보다 유연한 서열 표적화를 허용할 수 있으며, 여기서, 임의의 dCas9 배향은 표적화된 영역을 엑소뉴클레아제 활성에 노출시키지 않을 것이기 때문에 허용된다. 도 4a 내지 도 4j와 관련하여 기재된 바와 같은 Cas 뉴클레아제 풋프린트 중첩은 오직 하나의 Cas 뉴클레아제가 각각의 단편 말단 상에 작용할 수 있도록 보장할 수 있다. 일부 예에서, 본 개시내용은 비-랜덤의 UMI Y-어댑터를 사용하여 가닥 결찰 기반 LP(ER, A-테일, 리그(lig))를 제공한다. 일부 예에서, 본 개시내용은 표적화된 비-PCR이 가능하도록 전체 길이 어댑터를 사용하는 것을 제공한다. 일부 예에서, 방법은 또한 UMI 없이 사용되어 비-랜덤의 고유한 단편 말단에 의존하여 분자를 분석할 수 있다. 이 방법은 보다 Cas9 엇갈린 절단을 포함하여 대부분의 검정 적용에 대한 적절한 단편 말단 복잡성을 획득한다. 일부 예에서, 본 개시내용은 단편 말단 배위와 UMI의 조합을 사용하여 고유하게 분자를 식별하는 것을 제공한다.
일부 예에서, 본 개시내용은 예를 들어 도 1a 내지 도 1j와 관련하여 기재된 바와 같은 방식으로 숙주 반복 요소를 절단하고, 이어서 이들을 엑소뉴클레아제를 사용하여 분해하는 CRISPR/Cas를 사용하는 Cas-gRNA RNP 매개 DNA 디호스팅을 제공한다. 일부 예에서, 본 개시내용은 전형적으로 게놈 폴리뉴클레오타이드의 50% 초과를 구성하고, 인간 게놈 전반에 걸쳐 분포된 반복 요소를 표적화하는 Cas-gRNA RNP의 레버리지 프로그래밍 가능한(leveraging programmable) 뉴클레아제 활성을 제공한다. 일부 예에서, 본 개시내용은 한 차례 초과로 각각 인간 염색체를 특이적으로 절단하는 Cas-gRNA RNP 세트(예를 들어, 10개 내지 1,000,000개의 Cas-gRNA RNP)를 사용하는 것을 제공한다. 일부 예에서, 본 개시내용은 숙주 DNA 단편을 선택적으로 분해하는 한편, 절단되지 않은 비-숙주/미생물 DNA 단편을 유지하기 위한 방법을 제공한다.
도 1a 내지 도 1k와 관련하여 기재된 일부 예에서, 본 개시내용은 다음 단계를 포함하는 Cas-gRNA RNP DNA 디호스팅 방법을 제공한다. (a) 샘플 믹스 중의 DNA를 변형하여 엑소뉴클레아제 처리로부터 말단을 보호하는 단계; (b) 폴리뉴클레오타이드를 숙주(예를 들어, 인간) 반복 요소에 표적화된 Cas-gRNA RNP로 절단하고, 비보호된 숙주 DNA 단편 말단을 노출하는 단계; 및 (c) 하나 이상의 엑소뉴클레아제를 적용하여 비보호된 DNA 말단을 갖는 숙주 DNA를 선택적으로 분해하는 단계. 일부 예에서, 작업 (a)에서, 선형 비-숙주 DNA의 엑소뉴클레아제 매개 분해를 억제하기 위해, DNA 샘플은 다음 방법의 하나 이상으로 Cas-gRNA RNP 전에 사전 처리된다. 일부 예에서, 본 개시내용은 엑소뉴클레아제-보호 DNA 어댑터, 예컨대 헤어핀 어댑터 또는 엑소뉴클레아제 활성에 내성인 염기 변형(예를 들어, 포스포티오에이트 결합 또는 3' 포스페이트는 ExoIII을 포함하는 다수의 엑소뉴클레아제 활성에 대한 보호를 제공함)을 포함하는 DNA 어댑터를 DNA 분자의 말단 상에 결찰함으로써 선형 비-숙주 DNA의 엑소뉴클레아제 매개 분해를 억제하는 것을 제공한다. 일부 예에서, 본 개시내용은 DNA 단편의 5' 말단을 탈인산화하여 오직 5' 포스페이트로 dsDNA 상의 5'→3'에 작용하는 람다 엑소뉴클레아제 활성에 대해 보호함으로써 선형 비-숙주 DNA의 엑소뉴클레아제 매개 분해를 억제하는 것을 제공한다. 이 예에서, 숙주 DNA 부위에서의 Cas-gRNA RNP 절단은 5' 포스페이트, 람다 엑소뉴클레아제 절단에 대한 기재를 노출시킬 것이다. 일부 예에서, 본 개시내용은 뉴클레오타이드를 엑소뉴클레아제 보호 변형 뉴클레오타이드의 말단 트랜스퍼라제 3' 부가로 보호함으로써 선형 비-숙주 DNA의 엑소뉴클레아제 매개 분해를 억제하는 것을 제공한다. 일부 예에서, Taq DNA 폴리머라제는 비-주형 뉴클레오타이드를 dsDNA에 부가하는 데 사용되며, 포스포로티오에이트 연결 뉴클레오타이드를 혼입시킨다.
일부 예에서, 본 개시내용은 예를 들어 도 2a 내지 도 2k와 관련하여 기재된 바와 같이 Cas-gRNA RNP 뉴클레아제를 사용하여 정확한 위치에서 DNA를 절단하는 단계, DNA 단편화의 길이 및 균일성을 제어하는 단계를 포함하여 예컨대 후속 유전자좌 표적화된 후성적 식별을 위해 게놈 DNA를 균일하게 단편화하는 방법을 제공한다. 이 방법은 듀플렉스 시퀀싱(DS)을 사용하여 고유한 분자를 분리하는 단계를 포함할 수 있으며, 전장 게놈 DNA 분석을 위해 여기에 이용될 수 있다. 듀얼 sgRNA 풀은 메타 유전자/혼합된 샘플에 적용될 때, 숙주 DNA 고갈에 사용될 수 있다. 예를 들어, 비오틴화/태그화 Cas9를 이용한 Legacy RiboZero-스타일 풀 다운-로드(pull down-load) sgRNA 풀 또는 숙주 라이브러리 분자 포스트 라이브러리 제작의 낮은 입력 상용성 'DASH'-스타일 고갈 Cas9 절단은 문헌[Crawford et al., "Depletion of abundant sequences by hybridization (DASH): using Cas9 to remove unwanted high-abundance species in sequencing libraries and molecular counting applications," Genome Biology 17: 41, 1-13 (2016)]에 기재된 바와 같이 사용될 수 있으며, 이의 전체 내용은 본원에 인용되어 포함된다.
숙주 라이브러리 분자 포스트 라이브러리 제작의 Cas-gRNA RNP 절단에 의해 크기 제어된 전장 게놈 단편화를 위한 예시 방법은 도 2a 내지 도 2k와 관련하여 기재되어 있다. 다수의 Cas-gRNA RNP 소화를 기반으로 하는 표적화된 게놈 단편화 접근법은 유사한 길이의 DNA 단편을 생성한다. 이들 단편은 단순한 크기 선택에 의해 농축되어 표적화된 농축을 수득할 수 있다. 추가적으로, 균일한 길이의 단편은 유의하게 PCR 증폭 편향성을 감소시킬 수 있고, 판독 사용성을 강화시킬 수 있다. 본 개시내용은 시퀀싱 오류를 보정하기 위해 이중 가닥 분자 태깅을 사용하는 듀플렉스 시퀀싱과 함께 표적 농축을 제공한다. CRISPR-DS 기술은 작은 게놈 영역의 효율적 표적 농축, 균일한 커버리지, 초정확한 시퀀싱, 및 감소된 DNA 입력이 가능하도록 한다. 일부 예에서, 본 개시내용은 다수의 Cas-gRNA RNP를 표적화된 영역에 표적화함으로써 DNA 단편 말단 다양성을 생성하는 UMI 접근법과 공동으로, 이러한 CRISPR-DS 표적화 접근법이 소정의 수의 UMI와 함께 분석 가능한 라이브러리 복잡성을 증가시키고, 개별적 Cas 절단 부위의 시퀀싱 커버리지를 증가시키는 데 이용될 수 있음을 제공한다.
Cas-gRNA RNP 커버리지는 대개 블런트 말단뿐만 아니라, 작은 오버행을 수득하는 것으로 알려져 있다. 라이브러리 제작의 말단 복구 작업 동안 엑소뉴클레아제 활성은 절단 부위에서/근처에서의 정보의 손실을 초래할 수 있다. 일부 예에서, 예를 들어 도 3a 내지 도 3e와 관련하여 기재된 바와 같은 방식으로 다수의 가이드 RNA를 이용한 표적에서의 엇갈린 절단 부위는 국소적 커버리지 손실을 감소시킬 수 있다. Cas-gRNA RNP 표적화의 높은 서열 특이성으로 인해, 절단 부위에서 또는 근처에서의 염기의 식별은 확실하게 추론 가능함을 유의한다.
일부 예에서, 본원에 제공된 방법은 적어도 하나의 트랜스포사제 및 올리고뉴클레오타이드를 포함하는 적어도 하나의 트랜스포존 말단 조성물을 표적 폴리뉴클레오타이드 및 트랜스포존 말단 조성물이 전위 반응을 겪어서 혼합물을 생성하는 조건 하에 표적 폴리뉴클레오타이드를 포함하는 샘플에 적용하는 단계를 포함하며, 여기서, 표적 폴리뉴클레오타이드는 단편화되어 복수의 표적 폴리뉴클레오타이드 단편을 생성하고, 따라서 올리고뉴클레오타이드 서열을 각각의 복수의 표적 폴리뉴클레오타이드 단편 내에 혼입시킨다.
추가 주석
본 개시내용의 실행은 달리 명시되지 않는 한, 당업계의 기술 내에 있는 분자 생물학(재조합 기술 포함), 미생물학, 세포 생물학, 생화학, 및 면역학의 종래의 기술을 이용할 수 있다. 이러한 기술은 문헌, 예컨대 문헌[Molecular Cloning: A Laboratory Manual, 2nd ed. (Sambrook et al., 1989)]; 문헌[Oligonucleotide Synthesis (M. J. Gait, ed., 1984)]; 문헌[Animal Cell Culture (R. I. Freshney, ed., 1987)]; 문헌[Methods in Enzymology (Academic Press, Inc.)]; 문헌[Current Protocols in Molecular Biology (F. M. Ausubel et al., eds., 1987, and periodic updates)]; 문헌[PCR: The Polymerase Chain Reaction (Mullis et al., eds., 1994)]; 문헌[Remington, The Science and Practice of Pharmacy, 20th ed., (Lippincott, Williams & Wilkins 2003)], 및 문헌[Remington, The Science and Practice of Pharmacy, 22th ed., (Pharmaceutical Press and Philadelphia College of Pharmacy at University of the Sciences 2012)]에 충분히 설명되어 있다.
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별적 간행물, 특허, 및 특허 출원이 인용되어 포함된 것으로 구체적으로 그리고 개별적으로 명시되었던 것과 동일한 정도로 본원에 인용되어 포함된다.
다양한 예시적 예가 상기 기재되지만, 다양한 변화 및 변경이 본 발명을 벗어나지 않고 이루어질 수 있음이 당업자에게 명백할 것이다. 첨부된 청구범위는 본 발명의 진정한 사상 및 범위 내에 속하는 이러한 모든 변화 및 변경을 포함하도록 의도된다.
본원에 기재된 개시내용의 각각의 양태의 임의의 각각의 특성/예는 임의의 적절한 조합으로 함께 구현될 수 있으며, 임의의 하나 이상의 이들 양태로부터의 임의의 특성/예는 임의의 적절한 조합으로 본원에 기재된 다른 양태(들)의 임의의 특성과 함께 구현되어 본원에 기재된 이익을 획득할 수 있음이 이해되어야 한다.
SEQUENCE LISTING <110> ILLUMINA, INC. ILLUMINA CAMBRIDGE LIMITED <120> GENOMIC LIBRARY PREPARATION AND TARGETED EPIGENETIC ASSAYS USING CAS-gRNA RIBONUCLEOPROTEINS <130> IP-2061-PCT <150> US 63/158,492 <151> 2021-03-09 <150> US 63/162,775 <151> 2021-03-18 <150> US 63/163,381 <151> 2021-03-19 <150> US 63/228,344 <151> 2021-08-02 <150> US 63/246,879 <151> 2021-09-22 <150> US 63/295,432 <151> 2021-12-30 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 1 aatgatacgg cgaccaccga gauctacac 29 <210> 2 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> misc_feature <222> (22)..(22) <223> n = G or 8-oxoguanine <400> 2 caagcagaag acggcatacg anat 24 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 3 aatgatacgg cgaccaccga 20 <210> 4 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 4 caagcagaag acggcatacg a 21 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 5 tttgtccgtg gaatgaacaa 20 <210> 6 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 6 uuuguccgug gaaugaacaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 7 ggcataccat tttatgacgg 20 <210> 8 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 8 ggcauaccau uuuaugacgg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 9 ttacatgaga ctctgcctga 20 <210> 10 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 10 uuacaugaga cucugccuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 11 ggtcatacca ccggccccaa 20 <210> 12 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 12 ggucauacca ccggccccaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 13 gcgcttaccc caaccaacag 20 <210> 14 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 14 gcgcuuaccc caaccaacag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 15 caccaccaaa gctaactgac 20 <210> 16 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 16 caccaccaaa gcuaacugac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 17 tgtcctatat caccacaaaa 20 <210> 18 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 18 uguccuauau caccacaaaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Guide Sequence (target portion) <400> 19 agtagttggt aacctgacaa 20 <210> 20 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Full guide RNA sequence <220> <221> modified_base <222> (1)..(3) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (1)..(4) <223> phosphorothioate linkage between bases 1 and 2, 2 and 3, and 3 and 4 <220> <221> modified_base <222> (97)..(99) <223> 2prime-O-Methyl modification <220> <221> misc_feature <222> (97)..(100) <223> phosphorothioate linkage between bases 97 and 98, 98 and 99, and 99 and 100 <400> 20 aguaguuggu aaccugacaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

Claims (443)

  1. 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물의 처리 방법으로서,
    제1 이중 가닥 폴리뉴클레오타이드의 말단 및 제2 이중 가닥 폴리뉴클레오타이드의 임의의 말단을 보호하는 단계;
    제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단의 보호 후, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단을 선택적으로 생성하는 단계; 및
    제1 이중 가닥 폴리뉴클레오타이드를 자유 말단으로부터 보호된 말단을 향해 분해하는 단계를 포함하는, 혼합물의 처리 방법.
  2. 제1항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드 내의 자유 말단을 선택적으로 생성하는 단계는, 제1 이중 가닥 폴리뉴클레오타이드 내에 존재하고 제2 이중 가닥 폴리뉴클레오타이드 내에 존재하지 않는 서열에 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 혼성화하는 단계, 및 상기 서열을 Cas-gRNA RNP로 절단하는 단계를 포함하는, 혼합물의 처리 방법.
  3. 제2항에 있어서, 서열은 포유동물 특이적 반복 요소를 포함하는, 혼합물의 처리 방법.
  4. 제3항에 있어서, 포유동물 특이적 반복 요소는 인간 특이적 반복 요소를 포함하는, 혼합물의 처리 방법.
  5. 제1항에 있어서, 제1 이중 가닥 뉴클레오타이드는 제1 종으로부터의 복수의 염색체를 포함하는, 혼합물의 처리 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제2 종은 세균, 진균, 또는 바이러스인, 혼합물의 처리 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 헤어핀 어댑터를 말단에 결찰하는 단계를 포함하는, 혼합물의 처리 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 말단을 5'-탈인산화하는 단계를 포함하는, 혼합물의 처리 방법.
  9. 제1항 내지 제6항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단을 보호하는 단계는 변형된 염기를 말단에 부가하는 단계를 포함하는, 혼합물의 처리 방법.
  10. 제9항에 있어서, 변형된 염기는 포스포로티오에이트 결합을 포함하는, 혼합물의 처리 방법.
  11. 제9항 또는 제10항에 있어서, 변형된 염기는 말단 트랜스퍼라제(terminal transferase)를 사용하여 부가되는, 혼합물의 처리 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 엑소뉴클레아제를 사용하여 수행되는, 혼합물의 처리 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 자유 말단은 3' 말단을 포함하는, 혼합물의 처리 방법.
  14. 제13항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 엑소뉴클레아제 III을 사용하여 수행되는, 혼합물의 처리 방법.
  15. 제1항 내지 제12항 중 어느 한 항에 있어서, 자유 말단은 5' 말단을 포함하는, 혼합물의 처리 방법.
  16. 제15항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드를 분해하는 단계는 람다 엑소뉴클레아제를 사용하여 수행되는, 혼합물의 처리 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 이후 증폭 어댑터를 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드의 말단에 결찰하는 단계를 추가로 포함하는, 혼합물의 처리 방법.
  18. 제17항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI: unique molecular identifier)를 포함하는, 혼합물의 처리 방법.
  19. 제17항 또는 제18항에 있어서, 이후 이중 가닥 폴리뉴클레오타이드를 증폭 및 시퀀싱하는 단계를 추가로 포함하는, 혼합물의 처리 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 혼합물의 처리 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 제2 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 혼합물의 처리 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 제2 이중 가닥 폴리뉴클레오타이드는 원형 DNA를 포함하는, 혼합물의 처리 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 혼합물의 처리 방법.
  24. 조성물로서,
    제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드 - 제1 이중 가닥 폴리뉴클레오타이드의 말단은 보호됨 -;
    제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드 - 제2 이중 가닥 폴리뉴클레오타이드의 임의의 말단은 보호됨 -; 및
    제1 이중 가닥 폴리뉴클레오타이드 내에 존재하고 제2 이중 가닥 폴리뉴클레오타이드 내에 존재하는 않은 서열에 혼성화되는 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하며, Cas-gRNA RNP는 제1 이중 가닥 폴리뉴클레오타이드 내에 자유 말단을 선택적으로 생성하기 위해 상기 서열을 절단하기 위한 것인, 조성물.
  25. 제24항에 있어서, 서열은 포유동물 특이적 반복 요소를 포함하는, 조성물.
  26. 제25항에 있어서, 포유동물 특이적 반복 요소는 인간 특이적 반복 요소를 포함하는, 조성물.
  27. 제24항 내지 제26항 중 어느 한 항에 있어서, 제2 종은 세균, 진균, 또는 바이러스인, 조성물.
  28. 제24항 내지 제27항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 헤어핀 어댑터를 사용하여 보호되는, 조성물.
  29. 제24항 내지 제28항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 5'-탈인산화를 사용하여 보호되는, 조성물.
  30. 제24항 내지 제29항 중 어느 한 항에 있어서, 제1 및 제2 이중 가닥 폴리뉴클레오타이드의 말단은 변형된 염기를 사용하여 보호되는, 조성물.
  31. 제30항에 있어서, 변형된 염기는 포스포로티오에이트 결합을 포함하는, 조성물.
  32. 제24항 내지 제31항 중 어느 한 항에 있어서, 자유 말단은 3' 말단을 포함하는, 조성물.
  33. 제24항 내지 제31항 중 어느 한 항에 있어서, 자유 말단은 5' 말단을 포함하는, 조성물.
  34. 제24항 내지 제33항 중 어느 한 항에 있어서, 제1 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  35. 제24항 내지 제34항 중 어느 한 항에 있어서, 제2 이중 가닥 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  36. 제24항 내지 제35항 중 어느 한 항에 있어서, 제2 이중 가닥 폴리뉴클레오타이드는 원형 DNA를 포함하는, 조성물.
  37. 제24항 내지 제36항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 조성물.
  38. 제1 종으로부터의 제1 이중 가닥 폴리뉴클레오타이드와 제2 종으로부터의 제2 이중 가닥 폴리뉴클레오타이드의 혼합물의 처리 방법으로서,
    혼합물 중의 제1 이중 가닥 폴리뉴클레오타이드를 선택적으로 단일 가닥으로 만드는 단계;
    이후 증폭 프라이머를 혼합물 중의 임의의 잔여 이중 가닥 폴리뉴클레오타이드에 선택적으로 결찰하는 단계; 및
    이후 증폭 프라이머가 결찰되었던 혼합물 중의 임의의 이중 가닥 폴리뉴클레오타이드를 증폭하는 단계를 포함하는, 혼합물의 처리 방법.
  39. 조성물로서,
    제1 종으로부터의, 실질적으로 오직 단일 가닥 폴리뉴클레오타이드;
    제2 종으로부터의, 실질적으로 오직 이중 가닥 폴리뉴클레오타이드; 및
    제2 이중 가닥 폴리뉴클레오타이드의 말단에 결찰되고, 제1 이중 가닥 폴리뉴클레오타이드의 임의의 말단에 실질적으로 결찰되지 않은 증폭 프라이머를 포함하는, 조성물.
  40. 전장 게놈(WG)의 단편의 생성 방법으로서,
    WG의 제1 샘플 내에서:
    제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화하는 단계;
    제2 세트의 Cas-gRNA RNP를 대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화하는 단계; 및
    제1 및 제2 서열을 제1 샘플 내의 제1 및 제2 세트의 Cas-gRNA RNP로 각각 절단하여 제1 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  41. 제40항에 있어서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일한, 전장 게놈(WG)의 단편의 생성 방법.
  42. 제40항 또는 제41항에 있어서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개인, 전장 게놈(WG)의 단편의 생성 방법.
  43. 제42항에 있어서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700인, 전장 게놈(WG)의 단편의 생성 방법.
  44. 제40항 내지 제43항 중 어느 한 항에 있어서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 전장 게놈(WG)의 단편의 생성 방법.
  45. 제40항 내지 제44항 중 어느 한 항에 있어서,
    WG의 제2 샘플 내에서:
    제1 세트의 Cas-gRNA RNP를 WG에서의 제1 서열에 혼성화하는 단계;
    제2 세트의 Cas-gRNA RNP를 WG에서의 제2 서열에 혼성화하는 단계;
    제3 세트의 Cas-gRNA RNP를 대략 제3 염기쌍 수만큼 서로 이격된 WG에서의 제3 서열에 혼성화하는 단계; 및
    제1, 제2, 및 제3 서열을 제1, 제2, 및 제3 세트의 Cas-gRNA RNP로 각각 절단하여 제2 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  46. 제45항에 있어서, 제3 염기쌍 수는 제1 염기쌍 수와 상이한, 전장 게놈(WG)의 단편의 생성 방법.
  47. 제45항 또는 제46항에 있어서, 제3 염기쌍 수는 제2 염기쌍 수와 상이한, 전장 게놈(WG)의 단편의 생성 방법.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, 제3 염기쌍 수는 약 100개 내지 약 2000개인, 전장 게놈(WG)의 단편의 생성 방법.
  49. 제48항에 있어서, 제3 염기쌍 수는 약 200개 내지 약 400개인, 전장 게놈(WG)의 단편의 생성 방법.
  50. 제45항 내지 제49항 중 어느 한 항에 있어서, 제2 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제1 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이한, 전장 게놈(WG)의 단편의 생성 방법.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 전장 게놈(WG)의 단편의 생성 방법.
  52. 제45항 내지 제51항 중 어느 한 항에 있어서,
    WG의 제3 샘플 내에서:
    제1, 제2, 또는 제3 세트의 Cas-gRNA RNP를 WG에서의 제1, 제2, 또는 제3 서열에 각각 혼성화하는 단계; 및
    제1, 제2, 및 제3 서열을 제1, 제2, 및 제3 세트의 Cas-gRNA RNP로 각각 절단하여 제3 세트의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편을 생성하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  53. 제52항에 있어서, 제3 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제1 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이한, 전장 게놈(WG)의 단편의 생성 방법.
  54. 제52항 또는 제53항에 있어서, 제3 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수는 제2 세트의 WG 단편의 WG 단편에서의 대략적 염기쌍 수와 상이한, 전장 게놈(WG)의 단편의 생성 방법.
  55. 제52항 내지 제54항 중 어느 한 항에 있어서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 전장 게놈(WG)의 단편의 생성 방법.
  56. 제52항 내지 제55항 중 어느 한 항에 있어서,
    증폭 어댑터를 제3 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계;
    결찰된 증폭 어댑터를 갖는 제3 세트의 WG 단편의 WG 단편 앰플리콘(amplicon)을 생성하는 단계; 및
    제3 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  57. 제56항에 있어서, 제2 및 제3 세트의 WG 단편의 WG 단편 앰플리콘은 시퀀싱하기 위해 함께 혼합되는, 전장 게놈(WG)의 단편의 생성 방법.
  58. 제56항 또는 제57항에 있어서, 제1 및 제3 세트의 WG 단편의 WG 단편 앰플리콘은 증폭 및 시퀀싱하기 위해 함께 혼합되는, 전장 게놈(WG)의 단편의 생성 방법.
  59. 제52항 내지 제58항 중 어느 한 항에 있어서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 전장 게놈(WG)의 단편의 생성 방법.
  60. 제52항 내지 제59항 중 어느 한 항에 있어서, 제3 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 500개 내지 약 700개인, 전장 게놈(WG)의 단편의 생성 방법.
  61. 제52항 내지 제60항 중 어느 한 항에 있어서, 제3 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  62. 제45항 내지 제61항 중 어느 한 항에 있어서,
    증폭 어댑터를 제2 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계;
    결찰된 증폭 어댑터를 갖는 제2 세트의 WG 단편의 WG 단편 앰플리콘을 생성하는 단계; 및
    제2 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  63. 제62항에 있어서, 제1 및 제2 세트의 WG 단편의 WG 단편 앰플리콘은 증폭 및 시퀀싱하기 위해 함께 혼합되는, 전장 게놈(WG)의 단편의 생성 방법.
  64. 제45항 내지 제63항 중 어느 한 항에 있어서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 전장 게놈(WG)의 단편의 생성 방법.
  65. 제40항 내지 제64항 중 어느 한 항에 있어서, 제2 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개인, 전장 게놈(WG)의 단편의 생성 방법.
  66. 제40항 내지 제65항 중 어느 한 항에 있어서,
    증폭 어댑터를 제1 세트의 WG 단편의 WG 단편 말단에 결찰하는 단계;
    결찰된 증폭 어댑터를 갖는 제1 세트의 WG 단편의 WG 단편 앰플리콘을 생성하는 단계; 및
    제1 세트의 WG 단편의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  67. 제40항 내지 제66항 중 어느 한 항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  68. 제40항 내지 제67항 중 어느 한 항에 있어서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 전장 게놈(WG)의 단편의 생성 방법.
  69. 제40항 내지 제68항 중 어느 한 항에 있어서, 제1 세트의 WG 단편의 WG 단편에서의 염기쌍 수는 약 200개 내지 약 400개인, 전장 게놈(WG)의 단편의 생성 방법.
  70. 제40항 내지 제69항 중 어느 한 항에 있어서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  71. 제40항 내지 제70항 중 어느 한 항에 있어서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  72. 제40항 내지 제71항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  73. 제40항 내지 제72항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  74. 조성물로서,
    전장 게놈(WG) 샘플;
    대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화된 제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP); 및
    대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화된 제2 세트의 Cas-gRNA RNP를 포함하며,
    제1 및 제2 세트의 Cas-gRNA RNP는 각각 샘플 내의 제1 및 제2 서열을 절단하여, 각각 서로 대략 동일한 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것인, 조성물.
  75. 제74항에 있어서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일한, 조성물.
  76. 제74항 또는 제75항에 있어서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개인, 조성물.
  77. 제76항에 있어서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700인, 조성물.
  78. 제74항 내지 제77항 중 어느 한 항에 있어서, WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 조성물.
  79. 제74항 내지 제78항 중 어느 한 항에 있어서, WG 단편에서의 염기쌍 수는 약 100개의 염기쌍 내지 약 1000개의 염기쌍인, 조성물.
  80. 제74항 내지 제79항 중 어느 한 항에 있어서, WG 단편에서의 염기쌍 수는 약 200개의 염기쌍 내지 약 400개의 염기쌍인, 조성물.
  81. 제74항 내지 제80항 중 어느 한 항에 있어서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 조성물.
  82. 제74항 내지 제81항 중 어느 한 항에 있어서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 조성물.
  83. 제74항 내지 제82항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 조성물.
  84. 제74항 내지 제83항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 조성물.
  85. 조성물로서,
    전장 게놈(WG) 샘플;
    대략 제1 염기쌍 수만큼 서로 이격된 WG에서의 제1 서열에 혼성화된 제1 세트의 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP);
    대략 제2 염기쌍 수만큼 서로 이격된 WG에서의 제2 서열에 혼성화된 제2 세트의 Cas-gRNA RNP; 및
    대략 제3 염기쌍 수만큼 서로 이격된 WG에서의 제3 서열에 혼성화된 제3 세트의 Cas-gRNA RNP를 포함하며,
    제1, 제2, 및 제3 세트의 Cas-gRNA RNP는 각각 샘플 내의 제1, 제2, 및 제3 서열을 절단하여, 각각 서로 대략 동일한 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것인, 조성물.
  86. 제85항에 있어서, 제1 염기쌍 수는 제2 염기쌍 수와 대략 동일한, 조성물.
  87. 제85항 또는 제86항에 있어서, 제1 염기쌍 수는 약 100개 내지 약 2000개이고, 제2 염기쌍 수는 약 100개 내지 약 2000개이고, 제3 염기쌍 수는 약 100개 내지 약 2000개인, 조성물.
  88. 제87항에 있어서, 제1 염기쌍 수는 약 500개 내지 약 700개이고, 제2 염기쌍 수는 약 500개 내지 약 700개이고, 제3 염기쌍 수는 약 200개 내지 약 400개인, 조성물.
  89. 제85항 내지 제88항 중 어느 한 항에 있어서, 제3 염기쌍 수는 제1 염기쌍 수와 상이한, 조성물.
  90. 제85항 내지 제89항 중 어느 한 항에 있어서, 제3 염기쌍 수는 제2 염기쌍 수와 상이한, 조성물.
  91. 제85항 내지 제90항 중 어느 한 항에 있어서, WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 조성물.
  92. 제85항 내지 제91항 중 어느 한 항에 있어서, WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 조성물.
  93. 제92항에 있어서, WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개인, 조성물.
  94. 제85항 내지 제93항 중 어느 한 항에 있어서, 제1 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 조성물.
  95. 제85항 내지 제94항 중 어느 한 항에 있어서, 제2 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 조성물.
  96. 제85항 내지 제95항 중 어느 한 항에 있어서, 제3 세트의 Cas-gRNA RNP는 적어도 약 1,000,000개의 상이한 Cas-gRNA RNP를 포함하는, 조성물.
  97. 제85항 내지 제96항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 조성물.
  98. 제85항 내지 제97항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 조성물.
  99. 전장 게놈(WG)의 단편의 생성 방법으로서,
    CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 세트를 대략 소정 수의 염기쌍만큼 서로 이격된 WG에서의 서열에 혼성화하는 단계; 및
    상기 서열을 상기 Cas-gRNA RNP 세트로 각각 절단하여, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 생성하는 단계를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  100. 제99항에 있어서, 염기쌍 수는 약 100개 내지 약 1000개인, 전장 게놈(WG)의 단편의 생성 방법.
  101. 제99항 또는 제100항에 있어서, 제1 염기쌍 수는 약 500개 내지 약 700개, 또는 약 200개 내지 약 400개, 또는 약 100개 내지 약 200개인, 전장 게놈(WG)의 단편의 생성 방법.
  102. 제99항 내지 제101항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 전장 게놈(WG)의 단편의 생성 방법.
  103. 제99항 내지 제102항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 전장 게놈(WG)의 단편의 생성 방법.
  104. 제99항 또는 제103항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개, 또는 약 200개 내지 약 400개, 또는 약 500개 내지 약 700개인, 전장 게놈(WG)의 단편의 생성 방법.
  105. 제99항 내지 제104항 중 어느 한 항에 있어서,
    증폭 어댑터를 WG 단편 세트의 WG 단편 말단에 결찰하는 단계;
    결찰된 증폭 어댑터를 갖는 WG 단편 세트의 WG 단편 앰플리콘을 생성하는 단계; 및
    WG 단편 세트의 WG 단편 앰플리콘을 시퀀싱하는 단계를 추가로 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  106. 제105항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  107. 제99항 내지 제106항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  108. 제99항 내지 제107항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 전장 게놈(WG)의 단편의 생성 방법.
  109. 조성물로서,
    전장 게놈(WG) 샘플; 및
    대략 소정 수의 염기쌍만큼 서로 이격된 WG에서의 서열에 혼성화된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 세트를 포함하며,
    Cas-gRNA RNP 세트는 각각 샘플 내의 서열을 절단하여, 각각 서로 대략 동일한 염기쌍 수를 갖는 WG 단편을 생성하기 위한 것인, 조성물.
  110. 제109항에 있어서, 염기쌍 수는 약 100개 내지 약 1000개인, 조성물.
  111. 제109항 또는 제110항에 있어서, 염기쌍 수는 약 500개 내지 약 700개, 또는 약 200개 내지 약 400개, 또는 약 100개 내지 약 200개인, 조성물.
  112. 제109항 내지 제111항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 조성물.
  113. 제109항 내지 제112항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 1000개인, 조성물.
  114. 제109항 내지 제113항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 100개 내지 약 200개, 또는 약 200개 내지 약 400개, 또는 약 500개 내지 약 700개인, 조성물.
  115. 제109항 내지 제114항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 조성물.
  116. 제109항 내지 제115항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 조성물.
  117. 조성물로서, 적어도 약 1,000,000개의, 각각 서로 대략 동일한 수의 염기쌍을 갖는 WG 단편 세트를 포함하는, 조성물.
  118. 제117항에 있어서, 염기쌍 수는 약 100개 내지 약 200개인, 조성물.
  119. 제117항에 있어서, 염기쌍 수는 약 200개 내지 약 400개인, 조성물.
  120. 제117항에 있어서, 염기쌍 수는 약 500개 내지 약 700개인, 조성물.
  121. 제117항 내지 제120항 중 어느 한 항에 있어서, WG는 이중 가닥 DNA를 포함하는, 조성물.
  122. 제117항 내지 제121항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 20% 미만만큼 달라지는, 조성물.
  123. 제117항 내지 제122항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 10% 미만만큼 달라지는, 조성물.
  124. 제117항 내지 제123항 중 어느 한 항에 있어서, WG 단편 세트의 WG 단편에서의 염기쌍 수는 약 5% 미만만큼 달라지는, 조성물.
  125. 제117항 내지 제124항 중 어느 한 항에 있어서, 제99항 내지 제108항 중 어느 한 항의 방법을 사용하여 제조되는, 조성물.
  126. 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법으로서,
    제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)과 유체 중에서 접촉시키는 단계;
    제1 Cas-gRNA RNP 중 하나를 제1 분자에서의 제1 하위서열에 혼성화하는 단계;
    제2 Cas-gRNA RNP 중 하나를 제2 분자에서의 제2 하위서열에 혼성화하는 단계 - 제2 하위서열은 제1 하위서열과 오직 부분적으로 중첩됨 -;
    제1 Cas-gRNA RNP 중 하나에 의해, 임의의 제2 Cas-gRNA RNP가 제1 분자에서의 제2 하위서열에 혼성화하는 것을 억제하는 단계;
    제2 Cas-gRNA RNP 중 하나에 의해, 임의의 제1 Cas-gRNA RNP가 제2 분자에서의 제1 하위서열에 혼성화하는 것을 억제하는 단계;
    제1 분자를 제1 하위서열에서 절단하는 단계; 및
    제2 분자를 제2 하위서열에서 절단하는 단계를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  127. 제126항에 있어서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 제2 분자에서의 절단과 상이한 위치에서 이루어지는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  128. 제126항 또는 제127항에 있어서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 절단으로부터 벗어나는(offset), 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  129. 제126항 내지 제128항 중 어느 한 항에 있어서, 제1 분자는 제1 Cas-gRNA RNP 중 하나를 사용하여 절단되고, 제2 분자는 제2 Cas-gRNA RNP 중 하나를 사용하여 절단되는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  130. 제126항 내지 제129항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  131. 제126항 내지 제130항 중 어느 한 항에 있어서, Cas는 Cas9 또는 dCas9를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  132. 제126항 내지 제131항 중 어느 한 항에 있어서,
    제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제3 및 제4 Cas-gRNA RNP와 유체 중에서 접촉시키는 단계;
    제3 Cas-gRNA RNP 중 하나를 제1 분자에서의 제3 하위서열에 혼성화하는 단계;
    제3 Cas-gRNA RNP 중 하나에 의해, 임의의 제4 Cas-gRNA RNP가 제1 분자에서의 제4 하위서열에 혼성화하는 것을 억제하는 단계 - 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩됨 -; 및
    제1 분자를 제3 Cas-gRNA RNP 중 하나를 사용하여 제3 하위서열에서 절단하여 제1 단편을 생성하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  133. 제126항 내지 제132항 중 어느 한 항에 있어서,
    제1 및 제2 표적 폴리뉴클레오타이드 분자를 복수의 제3 및 제4 Cas-gRNA RNP와 유체 중에서 접촉시키는 단계;
    제4 Cas-gRNA RNP 중 하나를 제1 분자에서의 제4 하위서열에 혼성화하는 단계;
    제4 Cas-gRNA RNP 중 하나에 의해, 임의의 제3 Cas-gRNA RNP가 제1 분자에서의 제3 하위서열에 혼성화하는 것을 억제하는 단계; 및
    제1 분자를 제4 Cas-gRNA RNP 중 하나를 사용하여 제4 하위서열에서 절단하여 제1 단편을 생성하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  134. 제132항 또는 제133항에 있어서,
    제3 Cas-gRNA RNP 중 하나를 제2 분자에서의 제3 하위서열에 혼성화하는 단계;
    제3 Cas-gRNA RNP 중 하나에 의해, 임의의 제4 Cas-gRNA RNP가 제2 분자에서의 제4 하위서열에 혼성화하는 것을 억제하는 단계; 및
    제2 분자를 제3 Cas-gRNA RNP 중 하나를 사용하여 제3 하위서열에서 절단하여 제2 단편을 생성하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  135. 제132항 또는 제133항에 있어서,
    제4 Cas-gRNA RNP 중 하나를 제2 분자에서의 제4 하위서열에 혼성화하는 단계;
    제4 Cas-gRNA RNP 중 하나에 의해, 임의의 제3 Cas-gRNA RNP가 제2 분자에서의 제3 하위서열에 혼성화하는 것을 억제하는 단계; 및
    제2 분자를 제4 Cas-gRNA RNP 중 하나를 사용하여 제4 하위서열에서 절단하여 제2 단편을 생성하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  136. 제132항 내지 제135항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP 중 하나 및 제3 또는 제4 Cas-gRNA RNP 중 하나가 제1 분자에 혼성화되는 동안, 제1 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않은 제1 분자의 임의의 부분을 분해하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  137. 제134항 내지 제136항 중 어느 한 항에 있어서, 제2 Cas-gRNA RNP 중 하나 및 제3 또는 제4 Cas-gRNA RNP 중 하나가 제2 분자에 혼성화되는 동안, 제2 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않은 제2 분자의 임의의 부분을 분해하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  138. 제136항 또는 제137항에 있어서, 분해 단계는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 수행되는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  139. 제134항 내지 제138항 중 어느 한 항에 있어서, 제1 분자는 제3 또는 제4 Cas-gRNA RNP 중 하나를 사용하여 절단되고, 제2 분자는 제3 또는 제4 Cas-gRNA RNP 중 하나를 사용하여 절단되는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  140. 제134항 내지 제139항 중 어느 한 항에 있어서, 제1 및 제2 단편은 서로 상이한 수의 염기쌍을 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  141. 제134항 내지 제140항 중 어느 한 항에 있어서, 제1 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  142. 제134항 내지 제141항 중 어느 한 항에 있어서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  143. 제134항 내지 제142항 중 어느 한 항에 있어서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  144. 제134항 내지 제143항 중 어느 한 항에 있어서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드 분자의 절단 방법.
  145. 표적 폴리뉴클레오타이드의 시퀀싱 방법으로서,
    표적 폴리뉴클레오타이드의 제1 및 제2 단편을 제134항 내지 제144항 중 어느 한 항의 방법을 사용하여 생성하는 단계;
    증폭 어댑터를 제1 및 제2 단편의 말단에 결찰하는 단계;
    결찰된 증폭 어댑터를 갖는 제1 및 제2 단편의 앰플리콘을 각각 생성하는 단계; 및
    제1 및 제2 단편의 앰플리콘을 시퀀싱하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 시퀀싱 방법.
  146. 제145항에 있어서, 제1, 제2, 제3, 및 제4 하위서열을 사용하여, 제1 분자로부터 유래된 제1 단편의 앰플리콘을 식별하고, 제2 분자로부터 유래된 제2 단편의 앰플리콘을 식별하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 시퀀싱 방법.
  147. 제145항 또는 제146항에 있어서,
    앰플리콘을 생성하기 전에 고유한 분자 식별자(UMI)를 제1 및 제2 단편의 말단에 결찰하는 단계; 및
    UMI를 사용하여 제1 분자로부터 유래된 제1 단편의 앰플리콘을 식별하고, 제2 분자로부터 유래된 제2 단편의 앰플리콘을 식별하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 시퀀싱 방법.
  148. 제147항에 있어서, UMI는 증폭 어댑터와 동일한 작업으로 제1 및 제2 단편의 말단에 커플링 및 결찰되는, 표적 폴리뉴클레오타이드의 시퀀싱 방법.
  149. 조성물로서,
    서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자; 및
    복수의 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하며,
    제1 Cas-gRNA RNP 중 하나는 제1 분자에서의 제1 하위서열에 혼성화되고, 임의의 제2 Cas-gRNA RNP가 제1 분자에서의 제2 하위서열에 혼성화하는 것을 억제하고, 제2 하위서열은 제1 하위서열과 오직 부분적으로 중첩되고,
    제2 Cas-gRNA RNP 중 하나는 제2 분자에서의 제2 하위서열에 혼성화되고, 임의의 제1 Cas-gRNA RNP가 제2 분자에서의 제1 하위서열에 혼성화하는 것을 억제하는, 조성물.
  150. 제149항에 있어서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 제2 분자에서의 절단과 상이한 위치에서 이루어지는, 조성물.
  151. 제149항 또는 제150항에 있어서, 제1 분자에서의 절단은, 표적 폴리뉴클레오타이드 서열에서, 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자에서의 절단으로부터 벗어나는, 조성물.
  152. 제149항 내지 제151항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP 중 하나는 제1 분자를 절단하기 위한 것이고, 제2 Cas-gRNA RNP 중 하나는 제2 분자를 절단하기 위한 것인, 조성물.
  153. 제149항 내지 제152항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  154. 제149항 내지 제153항 중 어느 한 항에 있어서, Cas는 Cas9 또는 dCas9를 포함하는, 조성물.
  155. 제149항 내지 제154항 중 어느 한 항에 있어서,
    복수의 제3 및 제4 Cas-gRNA RNP를 추가로 포함하며,
    제3 Cas-gRNA RNP 중 하나는 제1 분자에서의 제3 하위서열에 혼성화되고, 임의의 제4 Cas-gRNA RNP가 제1 분자에서의 제4 하위서열에 혼성화하는 것을 억제하고, 제1 분자를 제3 하위서열에서 절단하여 제1 단편을 생성하기 위한 것이고, 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩되는, 조성물.
  156. 제149항 내지 제154항 중 어느 한 항에 있어서,
    복수의 제3 및 제4 Cas-gRNA RNP를 추가로 포함하며,
    제4 Cas-gRNA RNP 중 하나는 제1 분자에서의 제4 하위서열에 혼성화되고, 임의의 제3 Cas-gRNA RNP가 제1 분자에서의 제3 하위서열에 혼성화하는 것을 억제하고, 제1 분자를 제4 하위서열에서 절단하여 제1 단편을 생성하기 위한 것이고, 제4 하위서열은 제3 하위서열과 오직 부분적으로 중첩되는, 조성물.
  157. 제155항 또는 제156항에 있어서, 제3 Cas-gRNA RNP 중 하나는 제2 분자에서의 제3 하위서열에 혼성화되고, 임의의 제4 Cas-gRNA RNP가 제2 분자에서의 제4 하위서열에 혼성화하는 것을 억제하고, 제2 분자를 제3 하위서열에서 절단하여 제2 단편을 생성하기 위한 것인, 조성물.
  158. 제155항 또는 제156항에 있어서, 제4 Cas-gRNA RNP 중 하나는 제2 분자에서의 제4 하위서열에 혼성화되고, 임의의 제3 Cas-gRNA RNP가 제2 분자에서의 제3 하위서열에 혼성화하는 것을 억제하고, 제2 분자를 제4 하위서열에서 절단하여 제2 단편을 생성하기 위한 것인, 조성물.
  159. 제155항 내지 제158항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않는 제1 분자의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함하는, 조성물.
  160. 제157항 내지 제159항 중 어느 한 항에 있어서, 제2 Cas-gRNA RNP 중 하나와 제3 또는 제4 Cas-gRNA RNP 중 하나 사이에 존재하지 않는 제2 분자의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함하는, 조성물.
  161. 제159항 또는 제160항에 있어서, 엑소뉴클레아제는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 포함하는, 조성물.
  162. 제158항 내지 제161항 중 어느 한 항에 있어서, 제3 또는 제4 Cas-gRNA RNP 중 하나는 제1 분자를 절단하기 위한 것이고, 제3 또는 제4 Cas-gRNA RNP 중 하나는 제2 분자를 절단하기 위한 것인, 조성물.
  163. 제158항 내지 제162항 중 어느 한 항에 있어서, 제1 및 제2 단편은 서로 상이한 수의 염기쌍을 포함하는, 조성물.
  164. 제158항 내지 제163항 중 어느 한 항에 있어서, 제1 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 조성물.
  165. 제158항 내지 제164항 중 어느 한 항에 있어서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 조성물.
  166. 제158항 내지 제164항 중 어느 한 항에 있어서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 조성물.
  167. 제158항 내지 제164항 중 어느 한 항에 있어서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 조성물.
  168. 조성물로서,
    서열을 갖는 표적 폴리뉴클레오타이드의 제1 및 제2 분자를 포함하며,
    제1 분자는 제1 하위서열에서 제1 말단을 갖고,
    제2 분자는 제2 하위서열에서 제1 말단을 갖고, 제1 하위서열은 제2 하위서열과 오직 부분적으로 중첩되는, 조성물.
  169. 제168항에 있어서, 제1 분자의 제1 말단은 제2 분자의 제1 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치인, 조성물.
  170. 제168항 또는 제169항에 있어서, 제1 분자의 제1 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자의 제1 말단으로부터 벗어나는, 조성물.
  171. 제168항 내지 제170항 중 어느 한 항에 있어서,
    제1 분자는 제3 하위서열에서 제2 말단을 추가로 갖고,
    제2 분자는 제3 하위서열 또는 제4 하위서열에서 제2 말단을 추가로 가지며, 제3 하위서열은 제4 하위서열과 오직 부분적으로 중첩되는, 조성물.
  172. 제171항에 있어서, 제1 분자의 제2 말단은 제2 분자의 제2 말단과 표적 폴리뉴클레오타이드 서열에서 상이한 위치인, 조성물.
  173. 제171항 또는 제172항에 있어서, 제1 분자의 제2 말단은 표적 폴리뉴클레오타이드 서열에서 약 2개의 염기쌍 내지 약 10개의 염기쌍만큼 제2 분자의 제2 말단으로부터 벗어나는, 조성물.
  174. 제168항 내지 제173항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  175. 제168항 내지 제174항 중 어느 한 항에 있어서, 제1 및 제2 분자는 서로 상이한 수의 염기쌍을 포함하는, 조성물.
  176. 제168항 내지 제175항 중 어느 한 항에 있어서, 제1 분자는 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖고, 제2 분자는 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 조성물.
  177. 제168항 내지 제176항 중 어느 한 항에 있어서, 제1 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖고, 제2 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 조성물.
  178. 제168항 내지 제176항 중 어느 한 항에 있어서, 제1 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖고, 제2 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 조성물.
  179. 제168항 내지 제176항 중 어느 한 항에 있어서, 제1 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖고, 제2 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 조성물.
  180. 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법으로서,
    표적 폴리뉴클레오타이드를 제1 및 제2 융합 단백질과 유체 중에서 접촉시키는 단계,
    - 제1 융합 단백질은 커플링된 제1 증폭 어댑터를 갖는 제1 트랜스포사제에 커플링된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하고,
    제2 융합 단백질은 커플링된 제2 증폭 어댑터를 갖는 제2 트랜스포사제에 커플링된 제2 Cas-gRNA RNP를 포함함 -;
    제1 및 제2 Cas-gRNA RNP의 활성은 촉진하고, 제1 및 제2 트랜스포사제의 활성은 억제하는 동안:
    제1 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 하위서열에 혼성화하는 단계; 및
    제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제2 하위서열에 혼성화하는 단계; 그리고 이어서
    제1 및 제2 트랜스포사제의 활성을 억제하는 동안:
    제1 트랜스포사제를 사용하여 제1 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제1 위치에 부가하는 단계; 및
    제2 트랜스포사제를 사용하여 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가하는 단계를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  181. 제180항에 있어서, 유체의 제1 조건을 사용하여, Cas-gRNA RNP의 활성은 촉진되고, 트랜스포사제의 활성은 억제되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  182. 제181항에 있어서, 유체의 제1 조건은 Cas-gRNA RNP의 활성을 위해 충분한 양의 칼슘 이온, 망간 이온, 또는 칼슘 이온과 망간 이온 둘 모두의 존재를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  183. 제181항 또는 제182항에 있어서, 유체의 제1 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  184. 제180항 내지 제183항 중 어느 한 항에 있어서, 트랜스포사제의 활성은 유체의 제2 조건을 사용하여 촉진되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  185. 제184항에 있어서, 유체의 제2 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  186. 제180항 내지 제185항 중 어느 한 항에 있어서, 제1 융합 단백질의 Cas-gRNA RNP는 제1 하위서열에 혼성화되고, 제2 융합 단백질의 Cas-gRNA RNP는 제2 하위서열에 혼성화되는 동안, 제1 및 제2 융합 단백질의 Cas-gRNA RNP들 사이에 존재하지 않는 표적 폴리뉴클레오타이드의 임의의 부분을 분해하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  187. 제188항에 있어서, 분해 단계는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 사용하여 수행되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  188. 제180항 내지 187항 중 어느 한 항에 있어서, 제1 및 제2 융합 단백질로부터 표적 폴리뉴클레오타이드를 방출하여 일 말단에서 제1 증폭 어댑터 및 다른 말단에서 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드의 단편을 제공하는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  189. 제188항에 있어서, 방출 단계는 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 사용하여 수행되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  190. 제188항 또는 제189항에 있어서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  191. 제188항 내지 제190항 중 어느 한 항에 있어서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  192. 제188항 내지 제190항 중 어느 한 항에 있어서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  193. 제188항 내지 제190항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  194. 제180항 내지 제193항 중 어느 한 항에 있어서, Cas는 dCas9를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  195. 제180항 내지 제194항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  196. 제180항 내지 195항 중 어느 한 항에 있어서, 제1 증폭 어댑터는 P5 어댑터를 포함하고, 제2 증폭 어댑터는 P7 어댑터를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  197. 제180항 내지 196항 중 어느 한 항에 있어서, 제1 증폭 어댑터는 제1 고유한 분자 식별자(UMI)를 포함하고, 제2 증폭 어댑터는 제2 UMI를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  198. 제180항 내지 제197항 중 어느 한 항에 있어서, 제1 위치는 제1 하위서열의 약 10개의 염기 내에 존재하고, 제2 위치는 제2 하위서열의 약 10개의 염기 내에 존재하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  199. 제180항 내지 198항 중 어느 한 항에 있어서, 각각의 제1 및 제2 융합 단백질에서, Cas-gRNA RNP는 공유 연결을 통해 트랜스포사제에 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  200. 제180항 내지 198항 중 어느 한 항에 있어서, 각각의 제1 및 제2 융합 단백질에서, Cas-gRNA RNP는 비-공유 연결을 통해 트랜스포사제에 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  201. 제200항에 있어서, Cas-gRNA RNP는 항체에 공유 커플링되고, 트랜스포사제는 항체가 비-공유 커플링되는 항원에 공유 커플링되거나, Cas-gRNA RNP는 항원에 공유 커플링되고, 트랜스포사제는 항원이 비-공유 커플링되는 항체에 공유 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  202. 제200항에 있어서, Cas-gRNA는 gRNA와 제1 또는 제2 증폭 어댑터 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  203. 제200항에 있어서, Cas-gRNA는 gRNA와 트랜스포사제 내의 올리고뉴클레오타이드 사이의 혼성화를 통해 트랜스포사제에 비-공유 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  204. 제180항 내지 제203항 중 어느 한 항에 있어서,
    제1 융합 단백질에서, 제1 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖고,
    제2 융합 단백질에서, 제2 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  205. 제180항 내지 제204항 중 어느 한 항에 있어서, 제1 및 제2 융합 단백질은 표적 폴리뉴클레오타이드에 대해 대략 화학량론적 비율로 존재하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  206. 제180항 내지 제205항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  207. 표적 폴리뉴클레오타이드의 시퀀싱 방법으로서,
    표적 폴리뉴클레오타이드의 단편을 제188항 내지 제206항, 또는 제294항 내지 제302항 중 어느 한 항의 방법을 사용하여 생성하는 단계;
    단편의 앰플리콘을 생성하는 단계;
    앰플리콘을 시퀀싱하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 시퀀싱 방법.
  208. 조성물로서,
    서열을 갖는 표적 폴리뉴클레오타이드; 및
    커플링된 제1 증폭 어댑터를 갖는 제1 트랜스포사제에 커플링된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하는 제1 융합 단백질을 포함하며, 제1 Cas-gRNA RNP는 표적 폴리뉴클레오타이드에서의 제1 하위서열에 혼성화되는, 조성물.
  209. 제208항에 있어서,
    커플링된 제2 증폭 어댑터를 갖는 제2 트랜스포사제에 커플링된 제2 Cas-gRNA RNP를 포함하는 제2 융합 단백질을 추가로 포함하며, 제2 Cas-gRNA RNP는 표적 폴리뉴클레오타이드에서의 제2 하위서열에 혼성화되는, 조성물.
  210. 제208항 또는 제209항에 있어서, 제1 Cas-gRNA RNP의 활성은 촉진하고, 제1 트랜스포사제의 활성은 억제하는 조건을 갖는 유체를 추가로 포함하는, 조성물.
  211. 제210항에 있어서, 유체의 조건은 제1 Cas-gRNA RNP의 활성을 위해 충분한 양의 칼슘 이온, 망간 이온, 또는 칼슘 이온과 망간 이온 둘 모두의 존재를 포함하는, 조성물.
  212. 제210항 또는 제211항에 있어서, 유체의 조건은 제1 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함하는, 조성물.
  213. 제208항 또는 제209항에 있어서, 제1 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 추가로 포함하며, 제1 트랜스포사제는 제1 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제1 위치에 부가하는, 조성물.
  214. 제213항에 있어서, 제2 트랜스포사제는 제2 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 제2 위치에 부가하는 단계를 포함하는, 조성물.
  215. 제214항에 있어서, 유체의 조건은 제1 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함하는, 조성물.
  216. 제214항에 있어서, 제1 및 제2 융합 단백질로부터 표적 폴리뉴클레오타이드를 방출하여 일 말단에서 제1 증폭 어댑터 및 다른 말단에서 제2 증폭 어댑터를 갖는 표적 폴리뉴클레오타이드 단편을 제공하기 위한 제제를 추가로 포함하는, 조성물.
  217. 제216항에 있어서, 제제는 프로테이나제 K, 나트륨 도데실 설페이트(SDS), 또는 프로테이나제 K와 SDS 둘 모두를 포함하는, 조성물.
  218. 제216항 또는 제217항에 있어서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 조성물.
  219. 제216항 내지 제218항 중 어느 한 항에 있어서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 조성물.
  220. 제216항 내지 제218항 중 어느 한 항에 있어서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 조성물.
  221. 제216항 내지 제218항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 조성물.
  222. 제209항 내지 제221항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP와 제2 Cas-gRNA RNP 사이에 존재하지 않는 표적 폴리뉴클레오타이드의 임의의 부분을 분해하기 위한 엑소뉴클레아제를 추가로 포함하는, 조성물.
  223. 제222항에 있어서, 엑소뉴클레아제는 엑소뉴클레아제 III 또는 엑소뉴클레아제 VII을 포함하는, 조성물.
  224. 제208항 내지 제223항 중 어느 한 항에 있어서, Cas는 dCas9를 포함하는, 조성물.
  225. 제208항 내지 제224항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5를 포함하는, 조성물.
  226. 제209항 내지 제225항 중 어느 한 항에 있어서, 제1 어댑터는 P5 어댑터를 포함하고, 제2 어댑터는 P7 어댑터를 포함하는, 조성물.
  227. 제209항 내지 제226항 중 어느 한 항에 있어서, 제1 증폭 어댑터는 제1 고유한 분자 식별자(UMI)를 포함하고, 제2 증폭 어댑터는 제2 UMI를 포함하는, 조성물.
  228. 제209항 내지 제227항 중 어느 한 항에 있어서, 제1 위치는 제1 하위서열의 약 10개의 염기 내에 존재하고, 제2 위치는 제2 하위서열의 약 10개의 염기 내에 존재하는, 조성물.
  229. 제208항 내지 제228항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP는 공유 연결을 통해 제1 트랜스포사제에 커플링되는, 조성물.
  230. 제208항 내지 제229항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP는 비-공유 연결을 통해 제1 트랜스포사제에 커플링되는, 조성물.
  231. 제230항에 있어서, 제1 Cas-gRNA RNP는 항체에 공유 커플링되고, 제1 트랜스포사제는 항체가 비-공유 커플링되는 항원에 공유 커플링되거나, 제1 Cas-gRNA RNP는 항원에 공유 커플링되고, 제1 트랜스포사제는 항원이 비-공유 커플링되는 항체에 공유 커플링되는, 조성물.
  232. 제231항에 있어서, 제1 Cas-gRNA는 gRNA와 제1 증폭 어댑터 사이의 혼성화를 통해 제1 트랜스포사제에 비-공유 커플링되는, 조성물.
  233. 제231항에 있어서, 제1 Cas-gRNA는 gRNA와 제1 트랜스포사제 내의 올리고뉴클레오타이드 사이의 혼성화를 통해 제1 트랜스포사제에 비-공유 커플링되는, 조성물.
  234. 제208항 내지 제233항 중 어느 한 항에 있어서,
    제1 융합 단백질에서, 제1 하위서열에 혼성화하는 gRNA 중 일부는 약 15개 내지 약 18개의 뉴클레오타이드 길이를 갖는, 조성물.
  235. 제208항 내지 제234항 중 어느 한 항에 있어서, 제1 융합 단백질은 표적 폴리뉴클레오타이드에 대해 대략 화학량론적 비율로 존재하는, 조성물.
  236. 제208항 내지 제235항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  237. 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법으로서,
    표적 폴리뉴클레오타이드를 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNPs)과 접촉시키는 단계;
    제1 및 제2 Cas-gRNA RNP를 표적 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계 - 단백질은 제1 하위서열과 제2 하위서열 사이의 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링됨 -;
    표적 폴리뉴클레오타이드를 제1 Cas-gRNA RNP를 사용하여 제1 하위서열에서 그리고 제2 Cas-gRNA RNP를 사용하여 제2 하위서열에서 절단하여 단편을 형성하는 단계 - 단백질은 단편의 각각의 유전자좌에 커플링됨 -;
    상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하는 단계; 및
    상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  238. 제237항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 단편의 각각의 유전자좌에 커플링된 각각의 단백질을 각각 표지하기 전에 단편을 농축하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  239. 제238항에 있어서, 제1 및 제2 Cas-gRNA RNP는 각각 태그에 커플링되어 단편이 제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링되도록 하고;
    농축 단계는,
    제1 및 제2 Cas-gRNA RNP를 통해 태그에 커플링된 단편을 태그 파트너에 커플링된 기재와 접촉시키는 단계;
    태그를 태그 파트너에 커플링시켜서 단편을 기재에 커플링시키는 단계; 및
    기재에 커플링되지 않은 표적 폴리뉴클레오타이드 중 임의의 일부를 제거하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  240. 제237항 내지 제239항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 단백질을 식별하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  241. 제237항 내지 제240항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 유전자좌를 식별하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  242. 제237항 내지 제241항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 단백질을 정량화하는 단계를 추가로 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  243. 제237항 내지 제242항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는,
    단편을 상이한 단백질에 특이적인 항체 혼합물과 접촉시키는 단계 - 각각의 항체는 상응하는 올리고뉴클레오타이드에 커플링됨 -; 및
    단편의 각각의 유전자좌에 커플링된 단백질에 특이적인 혼합물 중의 임의의 항체의 경우, 이들 항체 및 상응하는 올리고뉴클레오타이드를 이들 단백질에 각각 커플링시키는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  244. 제243항에 있어서, 복수의 단백질은 유전자좌의 각각의 하나에 커플링되고, 혼합물 중 복수의 항체는 해당 유전자좌에서 단백질에 커플링되는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  245. 제243항 또는 제244항에 있어서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드를 비드 어레이에 혼성화하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  246. 제243항 또는 제244항에 있어서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드에 대한 합성에 의한 시퀀싱을 수행하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  247. 제243항 내지 제246항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드는 고유한 분자 식별자(UMI)를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  248. 제243항 내지 제247항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드의 각각의 존재를 사용하여 단백질을 식별하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  249. 제243항 내지 제248항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드의 각각의 양을 사용하여 단백질을 정량화하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  250. 제237항 내지 제242항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드를 사용하여 각각의 단백질을 각각 표지하는 단계는,
    단편을 복수의 트랜스포사제와 접촉시키는 단계 - 각각의 트랜스포사제는 상응하는 올리고뉴클레오타이드에 커플링됨 -;
    단편의 각각의 유전자좌에 커플링된 단백질에 의해 트랜스포사제의 활성을 당해 유전자좌에서 억제하는 단계; 및
    당해 유전자좌 이외의 위치에서, 트랜스포사제를 사용하여 상응하는 올리고뉴클레오타이드를 단편에 부가하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  251. 제250항에 있어서, 상응하는 올리고뉴클레오타이드를 시퀀싱하는 단계는 상응하는 올리고뉴클레오타이드가 부가되는 단편에 대한 합성에 의한 시퀀싱을 수행하는 단계를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  252. 제250항 또는 제251항에 있어서, 상응하는 올리고뉴클레오타이드의 단편에서의 각각의 위치를 사용하여 단백질의 각각의 유전자좌를 식별하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  253. 제250항 내지 제252항에 있어서, 트랜스포사제는 단편을 하위단편으로 분할하고, 합성에 의한 시퀀싱은 하위단편에 대해 수행되는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  254. 제250항 내지 제253항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드는 증폭 어댑터를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  255. 제254항에 있어서, 증폭 어댑터는 P5 및 P7 어댑터를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  256. 제254항 또는 제255항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  257. 제237항 내지 제256항 중 어느 한 항에 있어서, Cas는 Cas9를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  258. 제237항 내지 제257항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  259. 제237항 내지 제258항 중 어느 한 항에 있어서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  260. 제237항 내지 제259항 중 어느 한 항에 있어서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  261. 제237항 내지 제260항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  262. 제237항 내지 제261항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 표적 폴리뉴클레오타이드의 각각의 유전자좌에 커플링된 단백질의 특성분석 방법.
  263. 조성물로서,
    표적 폴리뉴클레오타이드의 단편 - 단백질은 단편의 각각의 유전자좌에 커플링됨 -; 및
    상이한 단백질에 특이적인 항체 혼합물 - 각각의 항체는 상응하는 올리고뉴클레오타이드에 커플링됨 -을 포함하며,
    단편의 각각의 유전자좌에 커플링된 단백질에 특이적인 혼합물 중의 임의의 항체의 경우, 이들 항체 및 상응하는 올리고뉴클레오타이드는 이들 단백질에 커플링되는, 조성물.
  264. 제263항에 있어서, 복수의 단백질은 유전자좌의 각각의 하나에 커플링되고, 혼합물 중의 복수의 항체는 해당 유전자좌에서의 단백질에 커플링되는, 조성물.
  265. 제263항 또는 제264항에 있어서, 상응하는 올리고뉴클레오타이드는 고유한 분자 식별자(UMI)를 포함하는, 조성물.
  266. 제263항 내지 제265항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드의 각각의 존재는 단백질을 식별하는 데 사용 가능한, 조성물.
  267. 제263항 내지 제266항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드의 각각의 양은 단백질을 정량화하는 데 사용 가능한, 조성물.
  268. 제263항 내지 제267항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 조성물.
  269. 제263항 내지 제268항 중 어느 한 항에 있어서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 조성물.
  270. 제263항 내지 제268항 중 어느 한 항에 있어서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 조성물.
  271. 제263항 내지 제268항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 조성물.
  272. 제263항 내지 제271항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  273. 조성물로서,
    표적 폴리뉴클레오타이드의 단편 - 단백질은 단편의 각각의 유전자좌에 커플링됨 -; 및
    복수의 트랜스포사제 - 각각의 트랜스포사제는 상응하는 올리고뉴클레오타이드에 커플링됨 -를 포함하며,
    단편의 각각의 유전자좌에 커플링된 단백질은 트랜스포사제의 활성을 당해 유전자좌에서 억제하고;
    트랜스포사제는 상응하는 올리고뉴클레오타이드를 당해 유전자좌 이외의 위치에서 단편에 부가하는, 조성물.
  274. 제273항에 있어서, 상응하는 올리고뉴클레오타이드의 단편에서의 각각의 위치는 단백질의 각각의 유전자좌를 식별하는 데 사용 가능한, 조성물.
  275. 제273항 또는 제274항에 있어서, 트랜스포사제는 단편을 하위단편으로 분할하는, 조성물.
  276. 제273항 내지 제275항 중 어느 한 항에 있어서, 상응하는 올리고뉴클레오타이드는 증폭 어댑터를 포함하는, 조성물.
  277. 제276항에 있어서, 증폭 어댑터는 P5 및 P7 어댑터를 포함하는, 조성물.
  278. 제276항 또는 제277항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 조성물.
  279. 제273항 내지 제278항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5를 포함하는, 조성물.
  280. 제273항 내지 제279항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 1000개의 염기쌍 길이를 갖는, 조성물.
  281. 제273항 내지 제280항 중 어느 한 항에 있어서, 단편은 약 500개의 염기쌍 내지 약 700개의 염기쌍 길이를 갖는, 조성물.
  282. 제273항 내지 제280항 중 어느 한 항에 있어서, 단편은 약 200개의 염기쌍 내지 약 400개의 염기쌍 길이를 갖는, 조성물.
  283. 제273항 내지 제280항 중 어느 한 항에 있어서, 단편은 약 100개의 염기쌍 내지 약 200개의 염기쌍 길이를 갖는, 조성물.
  284. 제273항 내지 제283항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  285. 조성물로서,
    복수의 하위서열을 갖는 표적 폴리뉴클레오타이드; 및
    각각 가이드 RNA(gRNA)에 커플링된 ShCAST(스키토네마 호프마니 CRISPR 연관 트랜스포사제)를 포함하는 복수의 복합체를 포함하며, ShCAST는 이에 커플링된 증폭 어댑터를 가지고,
    각각의 복합체는 표적 폴리뉴클레오타이드에서의 상응하는 하나의 하위서열에 혼성화되는, 조성물.
  286. 제285항에 있어서, 하위서열에 대한 복합체의 혼성화는 촉진하고, 트랜스포사제의 결합은 억제하는 조건을 갖는 유체를 추가로 포함하는, 조성물.
  287. 제286항에 있어서, 유체의 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 부재를 포함하는, 조성물.
  288. 제285항에 있어서, 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 추가로 포함하며, 트랜스포사제는 증폭 어댑터를 표적 폴리뉴클레오타이드에서의 위치에 부가하는, 조성물.
  289. 제288항에 있어서, 유체의 조건은 트랜스포사제의 활성을 위해 충분한 양의 마그네슘 이온의 존재를 포함하는, 조성물.
  290. 제285항 내지 제289항 중 어느 한 항에 있어서, ShCAST는 Cas12k를 포함하는, 조성물.
  291. 제285항 내지 제290항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함하는, 조성물.
  292. 제285항 내지 제291항 중 어느 한 항에 있어서, 어댑터는 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함하는, 조성물.
    [청구항 292]
    제285항 내지 제292항 중 어느 한 항에 있어서, 표적 폴리뉴클레오타이드는 이중 가닥 DNA를 포함하는, 조성물.
  293. 제285항 내지 제292항 중 어느 한 항에 있어서, gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된 gRNA 및 트랜스포사제 중 적어도 하나가 커플링되는 스트렙타비딘-코팅된 비드를 추가로 포함하는 조성물.
  294. 제180항 내지 제206항 중 어느 한 항에 있어서, 제1 태그는 제1 Cas-gRNA RNP에 커플링되고, 제2 태그는 제2 Cas-gRNA RNP에 커플링되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  295. 제294항에 있어서, 제1 태그를 기재에 커플링된 제1 태그 파트너에 커플링시키는 단계 및 제2 태그를 기재에 커플링된 제2 태그 파트너에 커플링시키는 단계를 추가로 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  296. 제295항에 있어서, 커플링 단계는 제1 및 제2 Cas-gRNA RNP가 각각 제1 및 제2 하위서열에 혼성화된 후에 수행되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  297. 제295항 또는 제296항에 있어서, 제1 및 증폭 어댑터는 제1 및 제2 태그가 각각 제1 및 제2 태그 파트너에 부가된 후에 부가되는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  298. 제294항 내지 제297항 중 어느 한 항에 있어서, 제1 및 제2 태그는 비오틴을 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  299. 제298항에 있어서, 제1 및 제2 태그 파트너는 스트렙타비딘을 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  300. 제295항 내지 제299항 중 어느 한 항에 있어서, 기재는 비드를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  301. 제294항 내지 제300항 중 어느 한 항에 있어서, Cas-gRNA RNP는 Cas12k를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  302. 제294항 내지 제301항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함하는, 서열을 갖는 표적 폴리뉴클레오타이드의 단편의 생성 방법.
  303. 제208항 내지 제236항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP에 커플링된 제1 태그를 추가로 포함하는 조성물.
  304. 제303항에 있어서, 기재 및 기재와 제1 태그에 커플링된 제1 태그 파트너를 추가로 포함하는 조성물.
  305. 제209항 내지 제236항 중 어느 한 항에 있어서, 제1 Cas-gRNA RNP에 커플링된 제1 태그 및 제2 Cas-gRNA RNP에 커플링된 제2 태그를 추가로 포함하는 조성물.
  306. 제305항에 있어서, 기재, 기재와 제1 태그에 커플링된 제1 태그 파트너, 및 기재와 제2 태그에 커플링된 제2 태그 파트너를 추가로 포함하는 조성물.
  307. 제306항에 있어서, 제1 및 제2 태그는 비오틴을 포함하는, 조성물.
  308. 제307항에 있어서, 제1 및 제2 태그 파트너는 스트렙타비딘을 포함하는, 조성물.
  309. 제303항 내지 제308항 중 어느 한 항에 있어서, 기재는 비드를 포함하는, 조성물.
  310. 제303항 내지 제309항 중 어느 한 항에 있어서, Cas-gRNA RNP는 Cas12k를 포함하는, 조성물.
  311. 제303항 내지 제309항 중 어느 한 항에 있어서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함하는, 조성물.
  312. 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법으로서,
    이중 가닥 폴리뉴클레오타이드를 기재에 커플링하는 단계;
    제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 닉카제(nickase)를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계,
    - 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고,
    제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'임 -;
    제1 가닥을 제1 Cas-gRNA RNP 닉카제를 사용하여 제1 하위서열에서 절단하는 단계;
    제2 가닥을 제2 Cas-gRNA RNP 닉카제를 사용하여 제2 하위서열에서 절단하는 단계;
    폴리머라제(polymerase)를 사용하여 각각의 절단으로부터 제1 및 제2 가닥을 연장하고, 기재로부터 표적 서열을 용출시키는 단계; 및
    용출된 표적 서열을 시퀀싱하는 단계를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  313. 제312항에 있어서, 기재는 비드를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  314. 제312항 또는 제313항에 있어서, 이중 가닥 폴리뉴클레오타이드의 3' 말단은 태그에 커플링되고, 기재는 태그 파트너에 커플링되며, 커플링 단계는 태그를 태그 파트너에 커플링시키는 단계를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  315. 제314항에 있어서, 태그는 비오틴을 포함하고, 태그 파트너는 스트렙타비딘을 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  316. 제312항 내지 제315항 중 어느 한 항에 있어서, 제1 및 제2 Cas-gRNA RNP 닉카제는 Cas9를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  317. 제312항 내지 제316항 중 어느 한 항에 있어서, 폴리머라제는 가닥 치환 폴리머라제를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  318. 제317항에 있어서, 폴리머라제는 벤트(Vent) 또는 Bsu를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  319. 제312항 내지 제316항 중 어느 한 항에 있어서, 폴리머라제는 5' 엑소뉴클레아제 활성을 갖는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  320. 제319항에 있어서, 폴리머라제는 Taq, Bst, 또는 DNA 폴리머라제 I을 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  321. 제312항 내지 제320항 중 어느 한 항에 있어서, 이중 가닥 폴리뉴클레오타이드는 시퀀싱 라이브러리 중 일부를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  322. 제312항 내지 제321항 중 어느 한 항에 있어서, 시퀀싱 어댑터를 용출된 표적 서열에 부가하는 단계를 추가로 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  323. 조성물로서,
    기재에 커플링된 이중 가닥 폴리뉴클레오타이드; 및
    이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화된 제1 및 제2 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP) 닉카제를 포함하며,
    제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고,
    제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'인, 조성물.
  324. 제323항에 있어서, 기재는 비드를 포함하는, 조성물.
  325. 제323항 또는 제324항에 있어서, 이중 가닥 폴리뉴클레오타이드의 3' 말단은 태그에 커플링되고, 기재는 태그에 커플링된 태그 파트너에 커플링되는, 조성물.
  326. 제325항에 있어서, 태그는 비오틴을 포함하고, 태그 파트너는 스트렙타비딘을 포함하는, 조성물.
  327. 제323항 내지 제326항 중 어느 한 항에 있어서, 제1 및 제2 Cas-gRNA RNP 닉카제는 Cas9를 포함하는, 조성물.
  328. 제323항 내지 제327항 중 어느 한 항에 있어서, 이중 가닥 폴리뉴클레오타이드는 시퀀싱 라이브러리 중 일부를 포함하는, 조성물.
  329. 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법으로서,
    제1 및 제2 복합체를 이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 각각 혼성화하는 단계,
    - 각각의 제1 및 제2 복합체는 증폭 어댑터에 커플링된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함함 -;
    혼성화된 제1 및 제2 복합체의 증폭 어댑터를 이중 가닥 폴리뉴클레오타이드의 제1 및 제2 말단에 각각 결찰하는 단계;
    제1 및 제2 복합체의 Cas-gRNA RNP를 이중 가닥 폴리뉴클레오타이드로부터 제거하는 단계; 및
    결찰된 증폭 어댑터를 갖는 이중 가닥 폴리뉴클레오타이드를 시퀀싱하는 단계를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  330. 제329항에 있어서, 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'인, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  331. 제329항 또는 제330항에 있어서, 증폭 어댑터는 Y-형상인, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  332. 제329항 내지 제331항 중 어느 한 항에 있어서, 각각의 복합체는 Cas-gRNA RNP를 증폭 어댑터에 커플링시키는 링커를 추가로 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  333. 제332항에 있어서, 링커는 Cas-gRNA RNP의 Cas에 커플링되는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  334. 제332항에 있어서, 링커는 gRNA에 커플링되는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  335. 제332항 내지 제334항 중 어느 한 항에 있어서, 링커는 단백질, 폴리뉴클레오타이드, 또는 중합체를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  336. 제332항 내지 제335항 중 어느 한 항에 있어서, 링커는 Cas-gRNA RNP가 제거될 때, 증폭 어댑터에 커플링된 상태로 유지되는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  337. 제329항 내지 제336항 중 어느 한 항에 있어서, 결찰 단계는 리가제(ligase)를 사용하는 단계를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  338. 제337항에 있어서, 리가제는 혼성화 동안 존재하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  339. 제338항에 있어서, 리가제는 혼성화 동안 불활성이고, 결찰을 위해 ATP를 사용하여 활성화되는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  340. 제337항에 있어서, 리가제는 혼성화 후에 첨가되는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  341. 제329항 내지 제340항 중 어느 한 항에 있어서, 혼성화 전에 이중 가닥 폴리뉴클레오타이드를 A-테일링(tailing)하는 단계를 추가로 포함하며, 증폭 어댑터는 A-테일과 혼성화하기 위한 쌍을 이루지 않는 T를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  342. 제329항 내지 제341항 중 어느 한 항에 있어서, 증폭 어댑터는 고유한 분자 식별자를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  343. 제329항 내지 제342항 중 어느 한 항에 있어서, Cas-gRNA RNP는 dCas9를 포함하는, 이중 가닥 폴리뉴클레오타이드의 단편의 생성 방법.
  344. 조성물로서,
    이중 가닥 폴리뉴클레오타이드의 단편; 및
    이중 가닥 폴리뉴클레오타이드에서의 제1 및 제2 하위서열에 혼성화된 제1 및 제2 복합체를 포함하며,
    각각의 제1 및 제2 복합체는 증폭 어댑터에 커플링된 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하는, 조성물.
  345. 제344항에 있어서, 제1 하위서열은 이중 가닥 폴리뉴클레오타이드의 제1 가닥을 따라 표적 서열의 3'이고, 제2 하위서열은 이중 가닥 폴리뉴클레오타이드의 제2 가닥을 따라 표적 서열의 3'인, 조성물.
  346. 제344항 또는 제345항에 있어서, 증폭 어댑터는 Y-형상인, 조성물.
  347. 제344항 내지 제346항 중 어느 한 항에 있어서, 각각의 복합체는 Cas-gRNA RNP를 증폭 어댑터에 커플링시키는 링커를 추가로 포함하는, 조성물.
  348. 제347항에 있어서, 링커는 Cas-gRNA RNP의 Cas에 커플링되는, 조성물.
  349. 제348항에 있어서, 링커는 gRNA에 커플링되는, 조성물.
  350. 제347항 내지 제349항 중 어느 한 항에 있어서, 링커는 단백질, 폴리뉴클레오타이드, 또는 중합체를 포함하는, 조성물.
  351. 제344항 내지 제348항 중 어느 한 항에 있어서, 이중 가닥 폴리뉴클레오타이드는 A-테일을 포함하고, 증폭 어댑터는 A-테일과 혼성화하기 위한 쌍을 이루지 않는 T를 포함하는, 조성물.
  352. 제344항 내지 제351항 중 어느 한 항에 있어서, 증폭 어댑터는 고유한 분자 식별자를 포함하는, 조성물.
  353. 제344항 내지 제352항 중 어느 한 항에 있어서, Cas-gRNA RNP는 dCas9를 포함하는, 조성물.
  354. 폴리뉴클레오타이드의 단편의 생성 방법으로서,
    제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 폴리뉴클레오타이드에서의 제1 서열에 혼성화하는 단계;
    제2 Cas-gRNA RNP를 제1 서열로부터 적어도 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 제2 서열에 혼성화하는 단계; 및
    제1 및 제2 서열을 제1 및 제2 Cas-gRNA RNP로 절단하여 제1 및 제2 말단 및 이들 사이의 표적 서열을 포함하는 단편을 생성하는 단계를 포함하며, 제1 말단은 적어도 하나의 염기의 제1 5' 오버행(overhang)을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖는, 폴리뉴클레오타이드의 단편의 생성 방법.
  355. 제354항에 있어서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이인, 폴리뉴클레오타이드의 단편의 생성 방법.
  356. 제354항에 있어서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이인, 폴리뉴클레오타이드의 단편의 생성 방법.
  357. 제354항 내지 제356항 중 어느 한 항에 있어서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는, 폴리뉴클레오타이드의 단편의 생성 방법.
  358. 제357항에 있어서, 제1 증폭 어댑터를 단편의 제1 말단에 결찰하는 단계 및 제2 증폭 어댑터를 단편의 제2 말단에 결찰하는 단계를 추가로 포함하며,
    제1 증폭 어댑터는 제1 5' 오버행에 상보적인 제3 5' 오버행을 갖고,
    제2 증폭 어댑터는 제2 5' 오버행에 상보적인 제4 5' 오버행을 갖고,
    제3 및 제4 5' 오버행은 서로 상이한 서열을 갖는, 폴리뉴클레오타이드의 단편의 생성 방법.
  359. 제358항에 있어서, 결찰된 제1 및 제2 증폭 어댑터를 갖는 단편의 앰플리콘을 생성하는 단계;
    앰플리콘을 시퀀싱하는 단계; 및
    시퀀싱을 기반으로 표적 폴리뉴클레오타이드를 식별하는 단계를 추가로 포함하는, 폴리뉴클레오타이드의 단편의 생성 방법.
  360. 제358항 또는 제359항에 있어서, 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 폴리뉴클레오타이드의 단편의 생성 방법.
  361. 제354항 내지 제360항 중 어느 한 항에 있어서, Cas는 Cas12a를 포함하는, 폴리뉴클레오타이드의 단편의 생성 방법.
  362. 조성물로서,
    폴리뉴클레오타이드;
    폴리뉴클레오타이드에서의 제1 서열에 혼성화된 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP); 및
    제1 서열로부터 적어도 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 제2 서열에 혼성화된 제2 Cas-gRNA RNP를 포함하며,
    제1 및 제2 Cas-gRNA RNP는 각각 폴리뉴클레오타이드의 제1 및 제2 서열을 절단하여, 사이에 표적 서열이 있는 제1 및 제2 말단을 갖는 단편을 생성하기 위한 것이고, 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖는, 조성물.
  363. 제362항에 있어서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이인, 조성물.
  364. 제362항에 있어서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이인, 조성물.
  365. 제362항 내지 제364항 중 어느 한 항에 있어서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는, 조성물.
  366. 제362항 내지 제365항 중 어느 한 항에 있어서, Cas는 Cas12a를 포함하는, 조성물.
  367. 조성물로서,
    사이에 표적 서열이 있는 제1 및 제2 말단을 각각 갖는 폴리뉴클레오타이드 단편 - 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖고, 제1 및 제2 5' 오버행은 서로 상이한 서열을 가짐 -;
    제1 5' 오버행에 상보적이고 제2 5'오버행에 상보적이지 않은 제3 5'오버행을 갖는 제1 증폭 어댑터; 및
    제2 5' 오버행에 상보적이고 제1 5'오버행에 상보적이지 않은 제4 5'오버행을 갖는 제2 증폭 어댑터를 포함하는, 조성물.
  368. 제367항에 있어서, 제1 증폭 어댑터를 제1 말단에 결찰하고, 제2 증폭 어댑터를 제2 말단에 결찰하기 위한 적어도 하나의 리가제를 추가로 포함하는, 조성물.
  369. 제367항 또는 제368항에 있어서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이인, 조성물.
  370. 제367항 또는 제368항에 있어서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이인, 조성물.
  371. 제367항 내지 제370항 중 어느 한 항에 있어서, 제1 및 제2 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 조성물.
  372. 제368항 내지 제371항 중 어느 한 항에 있어서, 리가제는 T4 DNA 리가제를 포함하는, 조성물.
  373. 조성물로서,
    사이에 표적 서열이 있는 제1 및 제2 말단을 각각 갖는 복수의 폴리뉴클레오타이드 단편을 포함하며, 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖고, 제1 및 제2 5' 오버행은 서로 상이한 그리고 다른 단편의 제1 및 제2 5' 오버행과 상이한 서열을 갖는, 조성물.
  374. 제373항에 있어서, 복수의 제1 증폭 어댑터 - 각각은 상응하는 단편의 제1 5' 오버행에 상보적이고, 해당 단편의 제2 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않음 -; 및
    복수의 제2 증폭 어댑터 - 각각은 상응하는 단편의 제2 5' 오버행에 상보적이고, 해당 단편의 제1 5' 오버행에 상보적이지 않고, 다른 단편의 제1 또는 제2 5' 오버행에 상보적이지 않음 -를 추가로 포함하는, 조성물.
  375. 제374항에 있어서, 제1 증폭 어댑터를 제1 및 제3 5' 오버행이 상보적인 제1 말단에 결찰하고, 제2 증폭 어댑터를 제2 및 제4 5' 오버행이 상보적인 제2 말단에 결찰하기 위한 리가제를 추가로 포함하는, 조성물.
  376. 제375항에 있어서, 리가제는 T4 DNA 리가제를 포함하는, 조성물.
  377. 제375항 또는 제376항에 있어서, 제1 및 제2 증폭 어댑터는 고유한 분자 식별자(UMI)를 포함하는, 조성물.
  378. 제373항 내지 제377항 중 어느 한 항에 있어서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이인, 조성물.
  379. 제373항 내지 제377항 중 어느 한 항에 있어서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이인, 조성물.
  380. 조성물로서,
    복수의 폴리뉴클레오타이드;
    폴리뉴클레오타이드에서의 각각의 제1 서열에 혼성화된 복수의 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP); 및
    각각의 제1 서열로부터 적어도 각각의 표적 서열만큼 이격된 폴리뉴클레오타이드에서의 각각의 제2 서열에 혼성화된 복수의 제2 Cas-gRNA RNP를 포함하며,
    제1 및 제2 복수의 Cas-gRNA RNP는 각각, 각각의 폴리뉴클레오타이드의 제1 및 제2 서열을 절단하여, 사이에 표적 서열이 있는 제1 및 제2 말단을 각각 갖는 단편을 생성하기 위한 것이고, 제1 말단은 적어도 하나의 염기의 제1 5' 오버행을 갖고, 제2 말단은 적어도 하나의 염기의 제2 5' 오버행을 갖는, 조성물.
  381. 제380항에 있어서, 제1 및 제2 5' 오버행은 각각 약 2 내지 5개의 염기 길이인, 조성물.
  382. (없음)
  383. 제380항에 있어서, 제1 및 제2 5' 오버행은 각각 약 5개의 염기 길이인, 조성물.
  384. 제380항 내지 제383항 중 어느 한 항에 있어서, 제1 및 제2 5' 오버행은 서로 상이한 서열을 갖는, 조성물.
  385. 제380항 내지 제384항 중 어느 한 항에 있어서, Cas는 Cas12a를 포함하는, 조성물.
  386. 프라이머 결합 부위, 증폭 어댑터 부위, 및 CRISPR 프로토스페이서(protospacer)를 포함하는, 가이드 RNA.
  387. 제386항에 있어서, 프라이머 결합 부위는 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적인, 가이드 RNA.
  388. 제386항 또는 제387항에 있어서, 증폭 어댑터 부위는 프라이머 결합 부위와 CRISPR 프로토스페이서 사이에 위치하는, 가이드 RNA.
  389. 제386항 내지 제388항 중 어느 한 항에 있어서, 적어도 하나의 루프(loop)를 추가로 포함하는, 가이드 RNA.
  390. 제389항에 있어서, 제1 루프는 프라이머 결합 부위와 CRISPR 프로토스페이서 사이에 위치하는, 가이드 RNA.
  391. 제390항에 있어서, 제2 루프는 프라이머 결합 부위와 CRISPR 프로토스페이서 사이에 위치하는, 가이드 RNA.
  392. CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)로서,
    제386항 내지 제391항 중 어느 한 항의 gRNA; 및
    CRISPR 프로토스페이서와 결합하는 Cas 단백질을 포함하는, CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP).
  393. 제392항에 있어서, Cas 단백질은 이중 가닥 폴리뉴클레오타이드 절단을 수행하도록 구성된, Cas-gRNA RNP.
  394. 제393항에 있어서, Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함하는, Cas-gRNA RNP.
  395. 제392항 내지 제394항 중 어느 한 항에 있어서, 프라이머 결합 부위 및 증폭 어댑터 부위는 Cas 단백질 외부로 연장되는, Cas-gRNA RNP.
  396. 복합체로서,
    제1 및 제2 가닥을 포함하는 폴리뉴클레오타이드; 및
    다음을 포함하는 제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 포함하는, 복합체:
    제1 프라이머 결합 부위, 제1 증폭 어댑터 부위, 및 제1 CRISPR 프로토스페이서를 포함하는 제1 가이드 RNA; 및
    제1 CRISPR 프로토스페이서와 결합하는 제1 Cas 단백질,
    여기서 제1 CRISPR 프로토스페이서는 제1 가닥에 혼성화되고, 제1 프라이머 부위는 제2 가닥에 혼성화됨.
  397. 제396항에 있어서, 제1 및 제2 가닥은 제1 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP에 의해 절단되는, 복합체.
  398. 제397항에 있어서, 제1 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함하는, 복합체.
  399. 제397항 또는 제398항에 있어서, 제1 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하기 위한 제1 역전사 효소를 추가로 포함하는, 복합체.
  400. 제399항에 있어서, 제1 역전사 효소는 제1 Cas 단백질에 커플링되는, 복합체.
  401. 제400항에 있어서, 제1 역전사 효소 및 제1 Cas 단백질은 제1 융합 단백질의 구성요소인, 복합체.
  402. 제396항 내지 제401항 중 어느 한 항에 있어서, 제1 프라이머 결합 부위는 제1 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적인, 복합체.
  403. 제396항 내지 제402항 중 어느 한 항에 있어서, 제1 증폭 어댑터 부위는 제1 프라이머 결합 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 복합체.
  404. 제396항 내지 제403항 중 어느 한 항에 있어서, 제1 gRNA는 적어도 하나의 루프를 추가로 포함하는, 복합체.
  405. 제404항에 있어서, 제1 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 복합체.
  406. 제405항에 있어서, 제2 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 복합체.
  407. 제396항 내지 제406항 중 어느 한 항에 있어서,
    제2 프라이머 결합 부위, 제2 증폭 어댑터 부위, 및 제2 CRISPR 프로토스페이서를 포함하는 제2 가이드 RNA; 및
    제2 CRISPR 프로토스페이서와 결합하는 제2 Cas 단백질
    을 포함하는 제2 Cas-gRNA RNP를 추가로 포함하며,
    제2 CRISPR 프로토스페이서는 제1 가닥에 혼성화되고, 제2 프라이머 결합 부위는 제2 가닥에 혼성화되는, 복합체.
  408. 제407항에 있어서, 제1 및 제2 가닥은 제2 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제2 Cas-gRNA RNP에 의해 절단되는, 복합체.
  409. 제408항에 있어서, 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열만큼 이격되는, 복합체.
  410. 제408항 또는 제409항에 있어서, 제2 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함하는, 복합체.
  411. 제408항 내지 제410항 중 어느 한 항에 있어서, 제2 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하기 위한 제2 역전사 효소를 추가로 포함하는, 복합체.
  412. 제411항에 있어서, 제2 역전사 효소는 제2 Cas 단백질에 커플링되는, 복합체.
  413. 제412항에 있어서, 제2 역전사 효소 및 제2 Cas 단백질은 제2 융합 단백질의 구성요소인, 복합체.
  414. 제407항 내지 제413항 중 어느 한 항에 있어서, 제2 프라이머 결합 부위는 제2 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적인, 복합체.
  415. 제396항 내지 제414항 중 어느 한 항에 있어서, 제2 증폭 어댑터 부위는 제2 프라이머 결합 부위와 제2 CRISPR 프로토스페이서 사이에 위치하는, 복합체.
  416. 부분적 이중 가닥 폴리뉴클레오타이드의 단편으로서,
    제1 3' 오버행을 포함하는 제1 말단;
    제2 말단; 및
    제1 말단과 제2 말단 사이에 위치한 표적 서열을 포함하는, 부분적 이중 가닥 폴리뉴클레오타이드의 단편.
  417. 제416항에 있어서, 제1 3' 오버행은 제1 증폭 어댑터를 포함하는, 부분적 이중 가닥 폴리뉴클레오타이드의 단편.
  418. 제416항 또는 제417항에 있어서, 제2 말단은 제2 3' 오버행을 포함하는, 부분적 이중 가닥 폴리뉴클레오타이드의 단편.
  419. 제418항에 있어서, 제2 3' 오버행은 제2 증폭 어댑터를 포함하는, 부분적 이중 가닥 폴리뉴클레오타이드의 단편.
  420. 다음 단계를 포함하는 방법:
    제1 CRISPR-연관 단백질 가이드 RNA 리보핵단백질(Cas-gRNA RNP)을 제1 및 제2 서열을 포함하는 폴리뉴클레오타이드와 접촉시키는 단계로서,
    제1 Cas-gRNA는
    제1 프라이머 결합 부위, 제1 증폭 어댑터 부위, 및 제1 CRISPR 프로토스페이서를 포함하는 제1 가이드 RNA; 및
    제1 CRISPR 프로토스페이서와 결합하는 제1 Cas 단백질을 포함하는, 단계;
    제1 CRISPR 프로토스페이서를 제1 가닥에 혼성화하는 단계; 및
    제1 프라이머 결합 부위를 제2 가닥에 혼성화하는 단계.
  421. 제420항에 있어서, 제1 및 제2 가닥을 제1 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제1 Cas-gRNA RNP에 의해 절단하는 단계를 추가로 포함하는, 방법.
  422. 제421항에 있어서, 제1 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함하는, 방법.
  423. 제421항 또는 제422항에 있어서, 제1 역전사 효소를 사용하여 제1 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 단계를 추가로 포함하는, 방법.
  424. 제423항에 있어서, 제1 역전사 효소는 제1 Cas 단백질에 커플링되는, 방법.
  425. 제424항에 있어서, 제1 역전사 효소 및 제1 Cas 단백질은 제1 융합 단백질의 구성요소인, 방법.
  426. 제420항 내지 제425항 중 어느 한 항에 있어서, 제1 프라이머 결합 부위는 제1 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적인, 방법.
  427. 제420항 내지 제426항 중 어느 한 항에 있어서, 제1 증폭 어댑터 부위는 제1 프라이머 결합 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 방법.
  428. 제420항 내지 제427항 중 어느 한 항에 있어서, 제1 gRNA는 적어도 하나의 루프를 추가로 포함하는, 방법.
  429. 제428항에 있어서, 제1 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 방법.
  430. 제429항에 있어서, 제2 루프는 제1 증폭 어댑터 부위와 제1 CRISPR 프로토스페이서 사이에 위치하는, 방법.
  431. 제420항 내지 제430항 중 어느 한 항에 있어서,
    폴리뉴클레오타이드를 제2 Cas-gRNA RNP와 접촉시키는 단계로서,
    제2 Cas-gRNA RNP는
    제2 프라이머 결합 부위, 제2 증폭 어댑터 부위, 및 제2 CRISPR 프로토스페이서를 포함하는 제2 가이드 RNA; 및
    제2 CRISPR 프로토스페이서와 결합하는 제2 Cas 단백질을 포함하는, 단계;
    제2 CRISPR 프로토스페이서를 제1 가닥에 혼성화하는 단계; 및
    제2 프라이머 결합 부위를 제2 가닥에 혼성화하는 단계를 추가로 포함하는, 방법.
  432. 제431항에 있어서, 제1 및 제2 가닥을 제2 CRISPR 프로토스페이서의 서열을 기준으로 각각의 위치에서 제2 Cas-gRNA RNP에 의해 절단하는 단계를 추가로 포함하는, 방법.
  433. 제432항에 있어서, 제2 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단은 제1 Cas-gRNA RNP에 의한 제1 및 제2 가닥에서의 절단으로부터 적어도 표적 서열만큼 이격되는, 방법.
  434. 제432항 또는 제433항에 있어서, 제2 Cas 단백질은 Cas9, Cas 12a, 또는 Cas12f를 포함하는, 방법.
  435. 제432항 내지 제434항 중 어느 한 항에 있어서, 제2 역전사 효소를 사용하여 제2 Cas 단백질에 의해 유발된 제2 가닥에서의 절단에서 증폭 어댑터 부위의 앰플리콘을 생성하는 단계를 추가로 포함하는, 방법.
  436. 제435항에 있어서, 제2 역전사 효소는 제2 Cas 단백질에 커플링되는, 방법.
  437. 제436항에 있어서, 제2 역전사 효소 및 제2 Cas 단백질은 제2 융합 단백질의 구성요소인, 방법.
  438. 제431항 내지 제437항 중 어느 한 항에 있어서, 제2 프라이머 결합 부위는 제2 CRISPR 프로토스페이서 중 적어도 일부에 대략 상보적인, 방법.
  439. 제431항 내지 제438항 중 어느 한 항에 있어서, 제2 증폭 어댑터 부위는 제2 프라이머 결합 부위와 제2 CRISPR 프로토스페이서 사이에 위치하는, 방법.
  440. 제435항 내지 제439항 중 어느 한 항에 있어서, 제1 및 제2 Cas-gRNA RNP 및 제1 및 제2 역전사 효소는 제1 말단 및 제2 말단을 갖는 부분적 이중 가닥 폴리뉴클레오타이드의 단편을 생성하고,
    제1 말단은 제1 3' 오버행을 포함하고;
    제2 말단은 제2 3' 오버행을 포함하고;
    표적 서열은 제1 말단과 제2 말단 사이에 위치하는, 방법.
  441. 제440항에 있어서, 제1 3' 오버행은 제1 증폭 어댑터 부위의 앰플리콘을 포함하는, 방법.
  442. 제440항 또는 제441항에 있어서, 제2 3' 오버행은 제2 증폭 어댑터 부위의 앰플리콘을 포함하는, 방법.
  443. 제442항에 있어서,
    제3 증폭 어댑터를 제1 말단에서의 5' 기에 결찰하는 단계;
    제4 증폭 어댑터를 제2 말단에서의 5' 기에 결찰하는 단계;
    단편을 제1, 제2, 제3, 및 제4 증폭 어댑터를 사용하여 증폭하는 단계; 및
    증폭된 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
KR1020237034433A 2021-03-09 2022-03-08 CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정 KR20230154078A (ko)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US202163158492P 2021-03-09 2021-03-09
US63/158,492 2021-03-09
US202163162775P 2021-03-18 2021-03-18
US63/162,775 2021-03-18
US202163163381P 2021-03-19 2021-03-19
US63/163,381 2021-03-19
US202163228344P 2021-08-02 2021-08-02
US63/228,344 2021-08-02
US202163246879P 2021-09-22 2021-09-22
US63/246,879 2021-09-22
US202163295432P 2021-12-30 2021-12-30
US63/295,432 2021-12-30
PCT/US2022/019252 WO2022192186A1 (en) 2021-03-09 2022-03-08 Genomic library preparation and targeted epigenetic assays using cas-grna ribonucleoproteins

Publications (1)

Publication Number Publication Date
KR20230154078A true KR20230154078A (ko) 2023-11-07

Family

ID=80937135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237034433A KR20230154078A (ko) 2021-03-09 2022-03-08 CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정

Country Status (8)

Country Link
EP (1) EP4305163A1 (ko)
JP (1) JP2024510206A (ko)
KR (1) KR20230154078A (ko)
AU (1) AU2022234741A1 (ko)
BR (1) BR112023018152A2 (ko)
CA (1) CA3209074A1 (ko)
IL (1) IL305444A (ko)
WO (1) WO2022192186A1 (ko)

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5614389A (en) 1992-08-04 1997-03-25 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
US5834202A (en) 1992-08-04 1998-11-10 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
WO1994003624A1 (en) 1992-08-04 1994-02-17 Auerbach Jeffrey I Methods for the isothermal amplification of nucleic acid molecules
US6261808B1 (en) 1992-08-04 2001-07-17 Replicon, Inc. Amplification of nucleic acid molecules via circular replicons
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
DE69433010T2 (de) 1993-04-12 2004-06-09 Northwestern University, Evanston Verfahren zur darstellung von oligonukleotiden
US5422252A (en) 1993-06-04 1995-06-06 Becton, Dickinson And Company Simultaneous amplification of multiple targets
CA2122203C (en) 1993-05-11 2001-12-18 Melinda S. Fraiser Decontamination of nucleic acid amplification reactions
KR100189229B1 (ko) 1993-07-23 1999-06-01 다니엘 엘. 캐시앙, 헨리 엘. 노르호프 핵산 증폭을 강화하는 방법
FR2708288B1 (fr) 1993-07-26 1995-09-01 Bio Merieux Procédé d'amplification d'acides nucléiques par transcription utilisant le déplacement, réactifs et nécessaire pour la mise en Óoeuvre de ce procédé.
US5523204A (en) 1993-12-10 1996-06-04 Becton Dickinson And Company Detection of nucleic acids in cells by strand displacement amplification
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
FR2726277B1 (fr) 1994-10-28 1996-12-27 Bio Merieux Oligonucleotide utilisable comme amorce dans une methode d'amplification basee sur une replication avec deplacement de brin
US5631147A (en) 1995-09-21 1997-05-20 Becton, Dickinson And Company Detection of nucleic acids in cells by thermophilic strand displacement amplification
US5916779A (en) 1995-09-21 1999-06-29 Becton, Dickinson And Company Strand displacement amplification of RNA targets
WO1997035026A1 (en) 1996-03-18 1997-09-25 Molecular Biology Resources, Inc. Target nucleic acid sequence amplification
US5773733A (en) 1996-04-12 1998-06-30 National Science Council Alumina-aluminum nitride-nickel composites
US6124120A (en) 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
EP2287338B1 (en) 1998-11-09 2012-09-05 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
US6155972A (en) 1999-02-02 2000-12-05 Acorn Cardiovascular, Inc. Cardiac constraint jacket construction
ATE362532T1 (de) 1999-03-19 2007-06-15 Takara Bio Inc Verfahren zur amplifizierung einer nukleinsäuresequenz unter verwendung eines chimären primers
US6238868B1 (en) 1999-04-12 2001-05-29 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences using ligation-dependant strand displacement amplification and bioelectronic chip technology
US6326173B1 (en) 1999-04-12 2001-12-04 Nanogen/Becton Dickinson Partnership Electronically mediated nucleic acid amplification in NASBA
US6309833B1 (en) 1999-04-12 2001-10-30 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences on a bioelectronic microchip using asymmetric structures
CN102586228A (zh) 1999-09-13 2012-07-18 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
AU2001278783B2 (en) 2000-08-23 2006-04-27 Takara Bio Inc. Method of amplifying nucleic acid
US6927028B2 (en) * 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
AU2003294447A1 (en) 2002-11-21 2004-06-18 Epicentre Technologies Preparation and use of single-stranded transcription substrates for synthesis of transcription products corresponding to target sequences
US20050153333A1 (en) 2003-12-02 2005-07-14 Sooknanan Roy R. Selective terminal tagging of nucleic acids
JP2010021219A (ja) 2008-07-09 2010-01-28 Nec Schott Components Corp パッケージングデバイス装置およびパッケージ用ベース部材
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
DE102012219142B4 (de) * 2012-10-19 2016-02-25 Analytik Jena Ag Verfahren zum Trennen, Erfassen oder Anreichern von unterschiedlichen DNA-Spezies
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries

Also Published As

Publication number Publication date
BR112023018152A2 (pt) 2023-10-31
AU2022234741A1 (en) 2023-09-14
CA3209074A1 (en) 2022-09-15
WO2022192186A1 (en) 2022-09-15
IL305444A (en) 2023-10-01
EP4305163A1 (en) 2024-01-17
JP2024510206A (ja) 2024-03-06

Similar Documents

Publication Publication Date Title
US20200325471A1 (en) Compositions and methods for detecting nucleic acid regions
EP3337898B1 (en) Capture of nucleic acids using a nucleic acid-guided nuclease-based system
EP3234200B1 (en) Method for targeted depletion of nucleic acids using crispr/cas system proteins
US9988674B2 (en) Full interrogation of nuclease DSBs and sequencing (find-seq)
EP2235217B1 (en) Method of making a paired tag library for nucleic acid sequencing
US11384383B2 (en) In vitro isolation and enrichment of nucleic acids using site-specific nucleases
JP7405485B2 (ja) 部位特異的核酸を用いた核酸濃縮と続いての捕捉方法
US7579155B2 (en) Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule
US20130123117A1 (en) Capture probe and assay for analysis of fragmented nucleic acids
US20210388414A1 (en) Optimization of in vitro isolation of nucleic acids using site-specific nucleases
KR20230154078A (ko) CAS-gRNA 리보핵단백질을 사용한 게놈 라이브러리 제작 및 표적화된 후성적 검정
CN117255856A (zh) 使用CAS-gRNA核糖核蛋白的基因组文库制备和靶向表观遗传测定
US20210198718A1 (en) Method of attaching adaptors to single-stranded regions of double-stranded polynucleotides
US20240124921A1 (en) Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
CN117881796A (zh) 使用靶向表观遗传测定、邻近诱导标签化、链侵入、限制或连接来检测分析物
EP4305164A1 (en) Analyzing expression of protein-coding variants in cells