KR20230051508A - 핵산의 서열-특이적 표적화된 전위 및 선택과 분류 - Google Patents

핵산의 서열-특이적 표적화된 전위 및 선택과 분류 Download PDF

Info

Publication number
KR20230051508A
KR20230051508A KR1020237005622A KR20237005622A KR20230051508A KR 20230051508 A KR20230051508 A KR 20230051508A KR 1020237005622 A KR1020237005622 A KR 1020237005622A KR 20237005622 A KR20237005622 A KR 20237005622A KR 20230051508 A KR20230051508 A KR 20230051508A
Authority
KR
South Korea
Prior art keywords
nucleic acid
transposon
transposase
targeted
sample
Prior art date
Application number
KR1020237005622A
Other languages
English (en)
Inventor
프랭크 제이. 스티머스
조나단 마크 부텔
라프란코니 피에트로 가티
올리버 존 밀러
엠마 벨
세바스티앙 조지 가브리엘 리쿨트
나일 앤서니 곰리
킴 슈나이더
Original Assignee
일루미나, 인코포레이티드
일루미나 케임브리지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드, 일루미나 케임브리지 리미티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20230051508A publication Critical patent/KR20230051508A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

핵산의 서열-특이적 표적화된 전위를 매개하는 데 사용될 수 있는 표적화된 트랜스포좀 복합체의 다수의 상이한 유형이 본원에 기재된다. 또한, 이중 가닥화 핵산으로부터 시퀀싱 데이터를 제작하기 위해, 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리를 초기 시퀀싱하는 단계 - 여기서 각각의 핵산 라이브러리는 단일 샘플로부터의 핵산 및 라이브러리 내의 다른 샘플로부터의 핵산으로부터 단일 샘플로부터의 핵산을 구별하기 위한 고유한 샘플 바코드를 포함함 -; 시퀀싱 데이터를 분석하고, 소기의 샘플로부터의 시퀀싱 데이터와 연관된 고유한 샘플 바코드를 식별하는 단계; 소기의 샘플로부터의 핵산 샘플을 농축하는 단계 및/또는 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계를 포함하는 라이브러리에 대한 선택 단계를 수행하는 단계; 및 핵산 라이브러리를 재시퀀싱하는 단계를 포함하는, 소기의 샘플과 원하지 않는 샘플 둘 모두를 포함하는 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법이 본원에 기재된다.

Description

핵산의 서열-특이적 표적화된 전위 및 선택과 분류
관련 출원에 대한 상호 참조
본 출원은 각각 2020년 8월 18일자로 출원된 미국 임시 출원 제63/066,905호 및 제63/066,906호; 2021년 3월 18일자로 출원된 미국 임시 출원 제63/162,775호; 2021년 3월 19일자로 출원된 미국 임시 출원 제63/163,381호; 2021년 3월 31일자로 출원된 미국 임시 출원 제63/168,753호; 및 2021년 8월 2일자로 출원된 미국 임시 출원 제63/228,344호의 우선권의 이익을 주장하며, 이들 각각은 임의의 목적을 위해 그 전체 내용이 본원에 인용되어 포함된다.
서열 목록
본 출원은 전자 형식의 서열 목록과 함께 제출된다. 서열 목록은 4,096 바이트 크기의, 2021년 7월 28일자로 작성된 "2021-07-28_01243-0020-00PCT_Seq_List_ST25"란 명칭의 파일로서 제공된다. 서열 목록의 전자 형식의 정보는 그 전체 내용이 본원에 인용되어 포함된다.
설명
기술 분야
본 개시내용은 핵산의 서열-특이적 표적화된 전위(transposition)에 관한 것이다. 표적화된 트랜스포좀 복합체는 서열-특이적 표적화된 전위를 매개하는 데 사용될 수 있다. 본 개시내용은 소기의 샘플을 평가하기 위한 초기 시퀀싱 단계(initial sequencing), 선택 단계, 및 재시퀀싱 단계를 포함하는 방법에 관한 것이다. 본원에 기재된 바와 같이, 초기 시퀀싱 단계는 혼합된 샘플의 풀 내의 관심 샘플을 식별할 수 있고, 원하지 않는 샘플은 이어서 고갈될 수 있거나, 소기의 샘플은 고유한 샘플 바코드를 기반으로 농축될 수 있다. 이후, 소기의 샘플에 대해 재시퀀싱 단계가 수행될 수 있다.
다수의 상이한 적용 분야에서 표적 핵산의 선택된 영역의 라이브러리 생성을 원할 수 있다. 예를 들어, 플랫폼 결과물이 제한적인 경우(예를 들어, PacBio, ONT, 또는 iSeq), 게놈 DNA의 선택된 영역으로부터 라이브러리를 제작하는 능력을 원한다. 또한, 액체 생검 샘플에서의 희귀 체세포 돌연변이에 대한 스크리닝과 같이 매우 높은 커버리지가 필요할 때, 게놈 DNA의 선택된 영역에 대한 라이브러리가 유리하다.
게놈 DNA의 선택된 영역으로부터의 라이브러리를 획득하는 현재의 방법은 올리고뉴클레오티드 혼성화-기반 농축 키트(예를 들어, 농축을 위한 TruSeq Exome, Nextera Flex)를 포함한다. 또한, 이러한 라이브러리를 생성하기 위한 CRISPR-기반 시스템이 최근에 공개되었다. 특히, CRISPR-기반 시스템은 수십 내지 수백 킬로베이스의 영역을 끌어내는 데 사용되었으며, 이는 PacBio 및 ONT와 같은 긴 판독 기술에 적합하다.
본 개시내용은 게놈 DNA의 소기의 영역의 표적화된 라이브러리 제작의 신규 방식을 기술한다. 이들 방법은 다수의 고유한 방식으로 상이한 표적화 기술과 트랜스포좀을 조합한다. 또한, 본 개시내용은 태그먼트화(tagmentation) 전에 히스톤을 제거할 필요 없이, 세포 유리 DNA(cfDNA: cell-free DNA)로부터 표적화된 라이브러리를 제작하는 수단을 기술한다.
본 개시내용은 또한 세포의 벌크 집단을 연구할 때, 결정하기 어려운 세포 차이를 분석하는 데 사용될 수 있는 단일 세포 분석 방법을 기술한다. 희귀 세포의 특성화는 종양학(액체 또는 종양 생검, 최소 잔류 질환(minimum residual disease) 또는 초기 질환 검출, 종양 진화, 또는 종양 내성), 면역학(면역 또는 T 세포 수용체 레퍼토리), 및 메타 유전체학(metagnomics)(배양 가능하지 않은 유기체 게놈 조립체)에서와 같이 다수의 사용자에서 중요할 수 있다. 도 1은 관심있을 수 있는 메타 유전체학 및 종양학 샘플의 일부 대표적 예를 제공하며, 여기서, 희귀 세포에 특히 관심이 있다. 단일 세포 시퀀싱의 현재의 방법은 예컨대 개별 세포의 게놈, 전사체, 또는 에피게놈 특성을 연구하기 위해, 병렬로 수백만 개의 단일 세포의 세포-분석 '오믹(omic)' 특성화가 가능하도록 한다.
그러나, 집단 내의 희귀 세포의 포괄적 시퀀싱-기반 특성화는 비용이 많이 들고, 소기의 샘플을 선택하지 않고서는 어렵다. 또한, 세포 분류-기반 농축 방법은 분할 가능한 세포 특성의 이용 가능성을 기반으로 제한된다. 예를 들어, FACS는 특정 세포 크기, 형태, 및 표면 단백질 발현에 대해 농축될 수 있지만, 다른 특징은 FACS에 의해 분할 가능하지 않을 수 있다. 이는 특정 '오믹' 특성(예를 들어, 종, 세포 유형, 또는 변이의 존재를 기반으로 하는 농축)을 기반으로 세포를 농축하는 데 매우 유용할 것이다. 이들 특성은 선험적(a priori)(최신 기술 기반)으로나 드노보(de novo)(초기 시퀀싱 분석에 의해 결정됨)로 알려질 수 있다. 이는 또한 초기 시퀀싱 후에 관심있는 것으로 식별된 단일 세포로부터의 샘플 재시퀀싱에 의해 후속, 포괄적/직교(orthogonal) '오믹' 특성화를 수행하는 데 매우 가치가 있을 것이다.
상이한 단일 세포로부터 생성된 라이브러리를 포함하는 복수의 세포 DNA 라이브러리로 구성된 "단일 세포 시퀀싱 라이브러리" 또는 "sc 라이브러리"로부터 개별 세포의 DNA 라이브러리의 선택, 농축, 및 시퀀싱-기반 특성화에 대한 방법론이 본원에 개시된다. sc-라이브러리의 초기 시퀀싱(즉, 개별 세포로부터의 모든 DNA 라이브러리의 시퀀싱)이 수행될 수 있으며, 생물정보학 분석이 사용되어 관심 특정 '오믹' 특성에 대하여 개별 세포를 분류할 수 있다. 이러한 방법을 사용하여, 상이한 개별 세포로부터 생성된 라이브러리는 고유한 세포 DNA 바코드(UBC)에 의해 식별된다. 분류에 사용되는 '-오믹' 특성은 상대적으로 적은 표적화 시퀀싱 패널을 이용하여 세포 유형(예를 들어, 발현, 후성적 패턴, 또는 면역 유전자 재조합), 종 유형(예를 들어, 박테리아로부터의 16s, 18s, 또는 ITS rRNA/rDNA 시퀀싱 사용), 또는 질환 상태/위험(예를 들어, 암에 중요한 생식세포계열 또는 체세포 변이)을 정의할 수 있다. 바꾸어 말하면, 초기 시퀀싱의 범위(footprint)는 적을 수 있고, 재시퀀싱은 보다 포괄적이지만, 관심 서열에 더 집중할 수 있다. 따라서, 당업자는 샘플을 소기의 샘플과 원하지 않는 샘플로 분류하는 단일 초기 시퀀싱 실행에 이어서 원하는 샘플의 표적화 재시퀀싱을 사용하여 예시적 특성에 대해 수백만 또는 수십억의 세포를 검사할 수 있다.
대안적으로, 초기 시퀀싱 실행은 후속 분석을 위해 드노보로 예시적 '오믹' 세포 특성(들)을 식별하는 데 사용될 수 있다. 예를 들어, 초기 시퀀싱 실행은 신규 세포 특성을 식별할 수 있으며, 이어서 분류에 사용될 수 있다.
본 방법에서의 농축 또는 고갈은 알려진 핵산 표적 농축 방법(예를 들어, 혼성 포획, 고유한 샘플 바코드-특이적 증폭, 또는 CRISPR 분해)에 의해 수행될 수 있다. 이어서, 관심 세포로부터의 개별 세포 DNA가 재시퀀싱되고, 전체 sc-라이브러리로부터 별개로 특성화될 수 있다. 따라서, 본 방법은 세포를 분류하는 역할을 하는 초기 시퀀싱 실행 후에 보다 포괄적 및/또는 직교 재시퀀싱 및 분석이 가능하도록 할 수 있다.
본 개시내용은 트랜스포좀 복합체가 표적 핵산 내의 하나 이상의 관심 핵산 서열에 결합하도록 유도하는 하나 이상의 요소를 포함하는 다수의 상이한 표적화된 트랜스포좀 복합체를 기술한다. 또한, 이들 표적화된 트랜스포좀 복합체를 사용하는 다수의 방법이 본원에 기재된다.
본 상세한 설명에 따르면, 소기의 샘플과 원하지 않는 샘플 둘 모두를 포함하는 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법이 또한 기술된다.
실시형태 1. 표적화된 트랜스포좀 복합체로서, 트랜스포사제, 3' 트랜스포존 말단 서열; 5' 어댑터 서열; 및 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 제1 트랜스포존 - 여기서 표적화 올리고뉴클레오티드는 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인, 표적화된 트랜스포좀 복합체.
실시형태 2. 실시형태 1에 있어서, 표적화 올리고뉴클레오티드의 서열은 하나 이상의 관심 핵산 서열과 완전히 또는 일부 상보적인, 트랜스포좀 복합체.
실시형태 3. 실시형태 1 또는 실시형태 2에 있어서, 하나 이상의 표적화 올리고뉴클레오티드는 어댑터 서열의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 4. 실시형태 1 내지 실시형태 3 중 어느 하나에 있어서, 하나 이상의 표적화 올리고뉴클레오티드는 어댑터 서열의 5' 말단에 직접적으로 연결되는, 트랜스포좀 복합체.
실시형태 5. 실시형태 1 내지 실시형태 4 중 어느 하나에 있어서, 하나 이상의 표적화 올리고뉴클레오티드는 링커를 통해 어댑터 서열의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 6. 실시형태 1 내지 실시형태 5에 있어서, 링커는 올리고뉴클레오티드 링커인, 트랜스포좀 복합체.
실시형태 7. 실시형태 1 내지 실시형태 6에 있어서, 링커는 비-올리고뉴클레오티드 링커인, 트랜스포좀 복합체.
실시형태 8. 실시형태 1 내지 실시형태 7에 있어서, 어댑터 서열의 5' 말단 및 표적화 올리고뉴클레오티드는 둘 모두 비오틴화되고, 스트렙타비딘을 통해 연결되는, 트랜스포좀 복합체.
실시형태 9. 실시형태 1 내지 실시형태 8 중 어느 하나에 있어서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열, 또는 시퀀싱-관련 서열, 또는 이의 조합을 포함하는, 트랜스포좀 복합체.
실시형태 10. 실시형태 1 내지 실시형태 9에 있어서, 어댑터 서열은 P5 또는 P7 서열을 포함하는, 트랜스포좀 복합체.
실시형태 11. 실시형태 1 내지 실시형태 10 중 어느 하나에 있어서, 재조합효소는 UVSX, Rec233, 또는 RecA인, 트랜스포좀 복합체.
실시형태 12. 실시형태 1 내지 실시형태 11 중 어느 하나에 있어서, 트랜스포좀 복합체는 용액 중에 존재하는, 트랜스포좀 복합체.
실시형태 13. 실시형태 1 내지 실시형태 12 중 어느 하나에 있어서, 트랜스포좀 복합체는 고체 지지체에 고정되는, 트랜스포좀 복합체.
실시형태 14. 실시형태 1 내지 실시형태 13에 있어서, 고체 지지체는 비드인, 트랜스포좀 복합체.
실시형태 15. 키트 또는 조성물로서, 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 제1 트랜스포좀 복합체, 및 트랜스포사제; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하는 제2 트랜스포좀 복합체를 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인, 키트 또는 조성물.
실시형태 16. 키트 또는 조성물로서, 각각 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 표적화 올리고뉴클레오티드를 포함하는, 키트 또는 조성물.
실시형태 17. 표적 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 트랜스포좀 복합체를 조합하는 단계; 재조합효소에 의해 상기 핵산의 가닥 침입(strand invasion)을 개시하는 단계; 및 상기 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 18. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 제1 트랜스포좀 복합체와, 트랜스포사제; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하는 제2 트랜스포좀 복합체를 조합하는 단계, - 여기서 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 재조합효소에 의해 상기 핵산의 가닥 침입을 개시하는 단계; 및 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 19. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 제1 트랜스포좀 복합체와, 표적화된 트랜스포좀 복합체인 실시형태 1 내지 실시형태 14 중 어느 하나의 제2 트랜스포좀 복합체를 조합하는 단계; 재조합효소에 의해 상기 핵산의 가닥 침입을 개시하는 단계; 및 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 20. 실시형태 17 내지 실시형태 19 중 어느 하나의 방법, 또는 실시형태 15 또는 실시형태 16의 키트 또는 조성물에 있어서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체 내에 포함된 5' 어댑터 서열은 상이한, 방법 또는 키트 또는 조성물.
실시형태 21. 실시형태 19에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드는 상이한, 방법.
실시형태 22. 실시형태 21에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드는 표적 핵산에서 소정의 관심 영역 내의 상이한 관심 서열에 결합하는, 방법.
실시형태 23. 실시형태 22에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드는 이중 가닥화 핵산의 대향 가닥에 결합하는, 방법.
실시형태 24. 실시형태 17 내지 실시형태 23 중 어느 하나에 있어서, 재조합효소에 의해 핵산의 가닥 침입을 개시하는 단계는 재조합효소 로딩 인자(recombinase loading factor)의 존재 하에 수행되고; 선택적으로, 재조합효소 로딩 인자는 단편화 전에 제거되거나, 비활성화되는, 방법.
실시형태 25. 실시형태 17 내지 실시형태 24 중 어느 하나에 있어서, 가닥 침입을 개시하는 단계는 대치 루프 형성을 통해 발생하는, 방법.
실시형태 26. 실시형태 17 내지 실시형태 25 중 어느 하나에 있어서, 가닥 침입은 하나 이상의 관심 서열에 대한 표적화 올리고뉴클레오티드의 결합 부위의 40, 30, 20, 15, 10, 또는 5개의 염기 내에서 개시되는, 방법.
실시형태 27. 실시형태 17 내지 실시형태 26 중 어느 하나에 있어서, 가닥 침입을 개시하기 위해 사용되는 온도는 트랜스포사제에 의한 단편화를 위한 최적 온도와 상이한, 방법.
실시형태 28. 실시형태 27에 있어서, 가닥 침입을 개시하기 위해 사용되는 온도는 트랜스포사제에 의한 단편화를 위한 최적 온도 미만인, 방법.
실시형태 29. 실시형태 28에 있어서, 가닥 침입을 개시하는 단계는 27℃ 내지 47℃에서 수행되는, 방법.
실시형태 30. 실시형태 29에 있어서, 가닥 침입을 개시하는 단계는 32℃ 내지 42℃에서 수행되는, 방법.
실시형태 31. 실시형태 30에 있어서, 가닥 침입을 개시하는 단계는 37℃에서 수행되는, 방법.
실시형태 32. 실시형태 28에 있어서, 단편화 단계는 45℃ 내지 65℃에서 수행되는, 방법.
실시형태 33. 실시형태 32에 있어서, 단편화 단계는 50℃ 내지 60℃에서 수행되는, 방법.
실시형태 34. 실시형태 33에 있어서, 단편화 단계는 55℃에서 수행되는, 방법.
실시형태 35. 실시형태 17 내지 실시형태 34 중 어느 하나에 있어서, 트랜스포사제에 대한 보조인자는 침입 개시 후 그리고 단편화 전에 트랜스포좀 복합체에 첨가되는, 방법.
실시형태 36. 실시형태 35에 있어서, 보조인자는 Mg++인, 방법.
실시형태 37. 실시형태 36에 있어서, Mg++ 농도는 10 mM 내지 18 mM인, 방법.
실시형태 38. 실시형태 17 내지 실시형태 37 중 어느 하나에 있어서, 단편화 단계는 표적화 올리고뉴클레오티드에 의해 결합된 핵산 서열 내의 하나 이상의 관심 서열의 40, 30, 20, 15, 10 또는 5개의 염기 내에서 발생하는, 방법.
실시형태 39. 실시형태 17 내지 실시형태 38 중 어느 하나에 있어서, 복수의 5' 태그화 단편을 중합효소 및 리가아제로 처리하여 가닥을 연장 및 리게이션(ligation)함으로써 완전한 이중 가닥화 태그화 단편을 제작하는 단계를 추가로 포함하는, 방법.
실시형태 40. 실시형태 17 내지 실시형태 39 중 어느 하나에 있어서, 하나 이상의 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
실시형태 41. 표적 핵산을 시퀀싱할 때, 근접성 정보(contiguity information)를 보존하는 방법으로서, 실시형태 17 내지 실시형태 40 중 어느 하나의 방법에 따라 표적 핵산의 태그화 단편을 제작하는 단계; 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계; 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 단편들의 서열을 그룹화하는 단계; 및 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계를 포함하는 방법.
실시형태 42. 표적 핵산을 시퀀싱할 때, 근접성 정보를 보존하는 방법으로서, 실시형태 17 내지 실시형태 40 중 어느 하나의 방법에 따라 표적 핵산의 태그화 단편을 제작하는 단계 - 여기서 하나 이상의 어댑터 서열은 단일 표적화 올리고뉴클레오티드 서열과 회합된 고유한 분자 식별자(UMI)를 포함함 -; 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계; 동일한 UMI의 서열을 포함하는 단편들의 서열을 그룹화하는 단계; 및 동일한 UMI의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계를 포함하는 방법.
실시형태 43. 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서, 하나 이상의 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계 - 여기서 하나 이상의 표적화 올리고뉴클레오티드는 각각 핵산 내의 관심 서열에 결합할 수 있음 -; 트랜스포사제; 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하는 트랜스포좀 복합체를 적용하는 단계, - 여기서 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 및 상기 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는, 방법.
실시형태 44. 실시형태 43에 있어서, 이중 가닥화 DNA가 변성되어 단일 가닥화 DNA를 생성하는, 방법.
실시형태 45. 실시형태 43 또는 실시형태 44에 있어서, 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계는 단편화될 수 있는 이중 가닥화 핵산 영역을 생성하는, 방법.
실시형태 46. 실시형태 43 내지 실시형태 45 중 어느 하나에 있어서, 상이한 서열을 갖는 2개 이상의 표적화 올리고뉴클레오티드가 혼성화되는, 방법.
실시형태 47. 실시형태 43 내지 실시형태 45 중 어느 하나에 있어서, 단일 표적화 올리고뉴클레오티드의 다수의 복제물이 혼성화되는, 방법.
실시형태 48. 실시형태 47에 있어서, 단일 표적화 올리고뉴클레오티드는 단일 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 것에 의해 생성된 이중 가닥화 핵산에 2개의 트랜스포좀 복합체를 결합시킬 만큼 충분히 긴, 방법.
실시형태 49. 실시형태 47 또는 실시형태 48에 있어서, 단일 표적화 올리고뉴클레오티드는 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200개의 염기쌍을 포함하는, 방법.
실시형태 50. 실시형태 43 내지 실시형태 49 중 어느 하나에 있어서, 단편화 단계는 하나 이상의 표적화 올리고뉴클레오티드에 의해 결합된 핵산 서열 내의 하나 이상의 관심 서열 내에서 발생하는, 방법.
실시형태 51. 실시형태 43 내지 실시형태 50 중 어느 하나에 있어서, 복수의 5' 태그화 단편을 중합효소 및 리가아제로 처리하여 가닥을 연장 및 리게이션함으로써 완전한 이중 가닥화 태그화 단편을 제작하는 단계를 추가로 포함하는 방법.
실시형태 52. 실시형태 43 내지 실시형태 51 중 어느 하나에 있어서, 하나 이상의 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하는 단계를 추가로 포함하는 방법.
실시형태 53. 표적화된 트랜스포좀 복합체로서, 트랜스포사제; 3' 트랜스포존 말단 서열, 5' 어댑터 서열, 및 가이드 RNA와 회합된 촉매적으로 비활성인 엔도뉴클레아제를 포함하는 제1 트랜스포존 - 여기서 가이드 RNA는 엔도뉴클레아제를 하나 이상의 관심 핵산 서열에 결합하도록 유도할 수 있음 -; 및 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존을 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 54. 실시형태 53에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 핵산에 결합하지만, 절단을 개시하지는 않는, 트랜스포좀 복합체.
실시형태 55. 실시형태 53 또는 실시형태 54에 있어서, 가이드 RNA는 단일 가이드 RNA인, 트랜스포좀 복합체.
실시형태 56. 실시형태 53 내지 실시형태 55 중 어느 하나에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제와 회합되는, 트랜스포좀 복합체.
실시형태 57. 실시형태 56에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제에 연결되는, 트랜스포좀 복합체.
실시형태 58. 실시형태 53 내지 실시형태 57 중 어느 하나에 있어서, 트랜스포사제 및 촉매적으로 비활성인 엔도뉴클레아제는 CRISPR-회합된 트랜스포사제 내에 포함되는, 트랜스포좀 복합체.
실시형태 59. 실시형태 58에 있어서, CRISPR-회합된 트랜스포사제는 시아노박테리아 사이토네마 호프마니(Scytonema hofmanni)(ShCAST)로부터 유래되며, 선택적으로,
a. ShCAST는 가이드 RNA에 결합되고, 선택적으로 gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나는 스트렙타비딘-코팅된 비드에 결합할 수 있고;
b. ShCAST는 Cas12K를 포함하고;
c. 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하고, 선택적으로 제1 트랜스포존은 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함하는, 트랜스포좀 복합체.
실시형태 60. 실시형태 57에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 61. 실시형태 57에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제의 3' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 62. 실시형태 57에 있어서, 트랜스포사제는 촉매적으로 비활성인 엔도뉴클레아제의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 63. 실시형태 57에 있어서, 트랜스포사제는 촉매적으로 비활성인 엔도뉴클레아제의 3' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 64. 실시형태 53 내지 실시형태 63 중 어느 하나에 있어서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 융합 단백질 내에 포함되는, 트랜스포좀 복합체.
실시형태 65. 실시형태 64에 있어서, 촉매적으로 비활성인 및 트랜스포사제는 링커를 통해 연결되는, 트랜스포좀 복합체.
실시형태 66. 실시형태 53 내지 실시형태 56 중 어느 하나에 있어서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 별개의 단백질 내에 포함되는, 트랜스포좀 복합체.
실시형태 67. 실시형태 66에 있어서, 별개의 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 결합 파트너의 페어링(pairing)을 통해 함께 회합될 수 있으며, 제1 결합 파트너는 촉매적으로 비활성인 엔도뉴클레아제에 결합되고, 제2 결합 파트너는 트랜스포사제에 결합되는, 트랜스포좀 복합체.
실시형태 68. 실시형태 67에 있어서, 결합 파트너는 비오틴 및 스트렙타비딘/아비딘인, 트랜스포좀 복합체.
실시형태 69. 실시형태 55 내지 실시형태 68 중 어느 하나에 있어서, 단일 가이드 RNA는 제1 및/또는 제2 트랜스포존을 포함하는 올리고뉴클레오티드 내에 포함되는, 트랜스포좀 복합체.
실시형태 70. 실시형태 69에 있어서, 올리고뉴클레오티드는 5' 단일 가이드 RNA 및 3' 제1 및/또는 제2 트랜스포존을 포함하는, 트랜스포좀 복합체.
실시형태 71. 실시형태 53 내지 실시형태 70 중 어느 하나에 있어서, 단일 가이드 RNA는 20개 미만의 뉴클레오티드를 포함하는, 트랜스포좀 복합체.
실시형태 72. 실시형태 71에 있어서, 단일 가이드 RNA 서열은 15, 16, 17, 18, 또는 19개의 뉴클레오티드를 포함하는, 트랜스포좀 복합체.
실시형태 73. 실시형태 53 내지 실시형태 72 중 어느 하나에 있어서, 단일 가이드 RNA는 헤어핀 2차 구조를 포함하는, 트랜스포좀 복합체.
실시형태 74. 실시형태 53 내지 실시형태 73 중 어느 하나에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 Cas9 단백질인, 트랜스포좀 복합체.
실시형태 75. 실시형태 74에 있어서, Cas9 단백질은 연쇄상구균 카니스(Streptococcus canis) Cas9인, 트랜스포좀 복합체.
실시형태 76. 실시형태 53 내지 실시형태 75 중 어느 하나에 있어서, 연쇄상구균 카니스 Cas9는 최소 서열 제약을 갖는, 트랜스포좀 복합체.
실시형태 77. 표적화된 트랜스포좀 복합체로서, 트랜스포사제, 3' 트랜스포존 말단 서열; 5' 어댑터 서열; 및 아연 집게 DNA-결합 도메인을 포함하는 제1 트랜스포존 - 여기서 아연 집게 DNA-결합 도메인은 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존을 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 78. 실시형태 77에 있어서, 아연 집게 DNA-결합 도메인은 아연 집게 뉴클레아제 내에 포함되는, 표적화된 트랜스포좀 복합체.
실시형태 79. 실시형태 78에 있어서, 아연 집게 뉴클레아제는 촉매적으로 비활성인, 표적화된 트랜스포좀 복합체.
실시형태 80. 실시형태 77 내지 실시형태 79 중 어느 하나에 있어서, 하나 이상의 관심 핵산 서열은 히스톤과 회합된 DNA 내에 포함되는, 표적화된 트랜스포좀 복합체.
실시형태 81. 실시형태 80에 있어서, 히스톤과 회합된 DNA는 세포 유리 DNA인, 표적화된 트랜스포좀 복합체.
실시형태 82. 실시형태 77 내지 실시형태 81 중 어느 하나에 있어서, 제1 트랜스포존은 친화성 요소를 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 83. 실시형태 82에 있어서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착되는, 표적화된 트랜스포좀 복합체.
실시형태 84. 실시형태 82 또는 실시형태 83에 있어서, 제1 트랜스포존은 링커를 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 85. 실시형태 84에 있어서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 표적화된 트랜스포좀 복합체.
실시형태 86. 실시형태 77 내지 실시형태 85 중 어느 하나에 있어서, 제2 트랜스포존은 친화성 요소를 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 87. 실시형태 86에 있어서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착되는, 표적화된 트랜스포좀 복합체.
실시형태 88. 실시형태 82 내지 실시형태 85 중 어느 하나에 있어서, 제2 트랜스포존은 링커를 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 89. 실시형태 88에 있어서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 표적화된 트랜스포좀 복합체.
실시형태 90. 실시형태 82 내지 실시형태 89 중 어느 하나에 있어서,친화성 요소는 비오틴인, 표적화된 트랜스포좀 복합체.
실시형태 91. 실시형태 77 내지 실시형태 90 중 어느 하나에 있어서, 아연 집게 DNA-결합 도메인 어레이를 포함하는, 표적화된 트랜스포좀 복합체.
실시형태 92. 실시형태 77 내지 실시형태 91에 있어서, 아연 집게 DNA-결합 도메인은 트랜스포사제와 회합되는, 트랜스포좀 복합체.
실시형태 93. 실시형태 92에 있어서, 아연 집게 DNA-결합 도메인은 트랜스포사제에 연결되는, 트랜스포좀 복합체.
실시형태 94. 실시형태 93에 있어서, 아연 집게 DNA-결합 도메인은 트랜스포사제의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 95. 실시형태 93에 있어서, 아연 집게 DNA-결합 도메인은 트랜스포사제의 3' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 96. 실시형태 94 또는 실시형태 95에 있어서, 트랜스포사제는 아연 집게 DNA-결합 도메인의 5' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 97. 실시형태 94 또는 실시형태 95에 있어서, 트랜스포사제는 아연 집게 DNA-결합 도메인의 3' 말단에 연결되는, 트랜스포좀 복합체.
실시형태 98. 실시형태 77 내지 실시형태 97 중 어느 하나에 있어서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 융합 단백질 내에 포함되는, 트랜스포좀 복합체.
실시형태 99. 실시형태 77 내지 실시형태 98 중 어느 하나에 있어서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 링커를 통해 연결되는, 트랜스포좀 복합체.
실시형태 100. 실시형태 77 내지 실시형태 92 중 어느 하나에 있어서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 별개의 단백질 내에 포함되는, 트랜스포좀 복합체.
실시형태 101. 실시형태 100에 있어서, 별개의 아연 집게 DNA-결합 도메인 및 트랜스포사제는 결합 파트너의 페어링을 통해 함께 회합될 수 있으며, 제1 결합 파트너는 촉매적으로 비활성인 엔도뉴클레아제에 결합되고, 제2 결합 파트너는 트랜스포사제에 결합되는, 트랜스포좀 복합체.
실시형태 102. 실시형태 101에 있어서, 결합 파트너는 (i) 비오틴 및 (ii) 스트렙타비딘 또는 아비딘인, 트랜스포좀 복합체.
실시형태 103. 실시형태 53 내지 실시형태 102 중 어느 하나에 있어서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열, 또는 시퀀싱-관련 서열, 또는 이의 조합을 포함하는, 트랜스포좀 복합체.
실시형태 104. 실시형태 53 내지 실시형태 103에 있어서, 어댑터 서열은 P5 또는 P7 서열을 포함하는, 트랜스포좀 복합체.
실시형태 105. 실시형태 53 내지 실시형태 104 중 어느 하나에 있어서, 트랜스포좀 복합체는 용액 중에 존재하는, 트랜스포좀 복합체.
실시형태 106. 실시형태 53 내지 실시형태 105 중 어느 하나에 있어서, 트랜스포좀 복합체는 고체 지지체에 고정되는, 트랜스포좀 복합체.
실시형태 107. 실시형태106에 있어서, 고체 지지체는 비드인, 트랜스포좀 복합체.
실시형태 108. 키트 또는 조성물로서, 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 제1 트랜스포좀 복합체, 및 트랜스포사제; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인 제2 트랜스포좀 복합체를 포함하는 키트 또는 조성물.
실시형태 109. 실시형태 108에 있어서, 각각 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 가이드 RNA를 포함하는, 키트 또는 조성물.
실시형태 110. 키트 또는 조성물로서, 각각 표적화된 트랜스포좀 복합체인 실시형태 108 또는 실시형태 109의 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 아연 집게 DNA-결합 도메인을 포함하는, 키트 또는 조성물.
실시형태 111. 표적 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 트랜스포좀 복합체를 조합하는 단계; 및 상기 핵산을 트랜스포좀에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 112. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 제1 트랜스포좀 복합체와, 트랜스포사제; 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하는 제2 트랜스포좀 복합체를 조합하는 단계, - 여기서 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 및 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 113. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서, 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 제1 트랜스포좀 복합체와, 표적화된 트랜스포좀 복합체인 실시형태 53 내지 실시형태 107 중 어느 하나의 제2 트랜스포좀 복합체를 조합하는 단계; 및 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함하는 방법.
실시형태 114. 실시형태 111 내지 실시형태 113 중 어느 하나에 있어서, 제1 및/또는 제2 표적화된 트랜스포좀 복합체는 아연 집게 DNA-결합 도메인을 포함하는, 방법.
실시형태 115. 실시형태 114에 있어서, 아연 집게 DNA-결합 도메인은 아연 집게 뉴클레아제 내에 포함되는, 방법.
실시형태 116. 실시형태 115에 있어서, 아연 집게 뉴클레아제는 촉매적으로 비활성인, 방법.
실시형태 117. 실시형태 111 내지 실시형태 116 중 어느 하나에 있어서, 표적화된 트랜스포좀 복합체 내에 포함된 제1 트랜스포존은 친화성 요소를 포함하는, 방법.
실시형태 118. 실시형태 117에 있어서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착되는, 방법.
실시형태 119. 실시형태 118에 있어서, 표적화된 트랜스포좀 복합체 내에 포함된 제1 트랜스포존은 링커를 포함하는, 방법.
실시형태 120. 실시형태 119에 있어서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 방법.
실시형태 121. 실시형태 111 내지 실시형태 120 중 어느 하나에 있어서, 제2 트랜스포존은 친화성 요소를 포함하는, 방법.
실시형태 122. 실시형태 121에 있어서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착되는, 방법.
실시형태 123. 실시형태 121에 있어서, 제2 트랜스포존은 링커를 포함하는, 방법.
실시형태 124. 실시형태 123에 있어서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는, 방법.
실시형태 125. 실시형태 117 내지 실시형태 124 중 어느 하나에 있어서, 친화성 요소는 비오틴인, 방법.
실시형태 126. 실시형태 111 내지 실시형태 125 중 어느 하나에 있어서, 이중 가닥화 핵산은 DNA를 포함하는, 방법.
실시형태 127. 실시형태 126에 있어서, DNA는 히스톤과 회합된 DNA를 포함하는, 방법.
실시형태 128. 실시형태 127에 있어서, 히스톤과 회합된 DNA는 세포 유리 DNA인, 방법.
실시형태 129. 실시형태 127 또는 실시형태 128에 있어서, 세포 유리 DNA는 아연 집게 DNA-결합 도메인과 조합하기 전에 프로테아제로 처리되지 않는, 방법.
실시형태 130. 실시형태 111 내지 실시형태 129 중 어느 하나에 있어서, 단편화 후에 친화성 결합 파트너를 고체 지지체 상에 첨가하는 단계를 추가로 포함하며, 태그화 표적 단편은 고체 지지체에 결합되는, 방법.
실시형태 131. 실시형태 130에 있어서, 단편화는 고체 지지체 상에 친화성 요소를 첨가하기 전에 중단되는, 방법.
실시형태 132. 실시형태 131에 있어서, 단편화는 프로테이나제 K 및/또는 SDS를 포함하는 용액의 첨가에 의해 중단되는, 방법.
실시형태 133. 실시형태 111 내지 실시형태 132 중 어느 하나에 있어서, 이중 가닥화 핵산을 포함하는 샘플을 표적화된 하나 이상의 트랜스포좀 복합체와 조합하는 단계는, 샘플을 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제와 조합하는 단계 - 여기서 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제는 제1 결합 파트너에 결합됨 -; 및 트랜스포사제와 제1 및 제2 트랜스포존을 첨가하는 단계 - 여기서 트랜스포사제는 제2 결합 파트너에 결합됨 -;를 포함하며, 트랜스포사제는 제1 및 제2 결합 파트너의 페어링에 의해 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제에 결합할 수 있는, 방법.
실시형태 134. 실시형태 133에 있어서, 샘플은 아연 집게 DNA-결합 도메인과 조합되는, 방법.
실시형태 135. 실시형태 134에 있어서, 아연 집게 DNA-결합 도메인은 아연 집게 뉴클레아제 내에 포함되는, 방법.
실시형태 136. 실시형태 135에 있어서, 아연 집게 뉴클레아제는 촉매적으로 비활성인, 방법.
실시형태 137. 실시형태 133 내지 실시형태 136 중 어느 하나에 있어서, 이중 가닥화 핵산은 DNA를 포함하는, 방법.
실시형태 138. 실시형태 137에 있어서, 이중 가닥화 핵산은 히스톤과 회합된 DNA를 포함하는, 방법.
실시형태 139. 실시형태 138에 있어서, 히스톤과 회합된 DNA는 세포 유리 DNA인, 방법.
실시형태 140. 실시형태 139에 있어서, 세포 유리 DNA는 아연 집게 DNA-결합 도메인과 조합하기 전에 프로테아제로 처리되지 않는, 방법.
실시형태 141. 실시형태 133 내지 실시형태 140 중 어느 하나에 있어서, 조합 후 그리고 첨가 전에 세척하는 단계를 포함하는 방법.
실시형태 142. 실시형태 133 내지 실시형태 141 중 어느 하나에 있어서, 표적화된 제1 트랜스포좀 복합체 및 표적화된 제2 트랜스포존 복합체는 이중 가닥화 핵산의 대향 가닥에 결합하며, 제1 트랜스포좀 복합체는 제1 트랜스포좀 복합체 결합 부위에 결합하고, 제2 트랜스포좀 복합체는 제2 트랜스포좀 복합체 결합 부위에 결합하는, 방법.
실시형태 143. 실시형태 142에 있어서, 제1 5' 태그화 표적 단편 및 제2 5' 태그화 표적화 단편은 제1 트랜스포좀 복합체 결합 부위와 제2 트랜스포좀 복합체 결합 부위 사이의 이중 가닥화 핵산의 영역 내에 포함된 핵산 서열을 포함하는, 방법.
실시형태 144. 실시형태 143에 있어서, 제1 5' 태그화 표적 단편 및 제2 5' 태그화 단편은 적어도 일부가 상보적인, 방법.
실시형태 145. 실시형태 133 내지 실시형태 144 중 어느 하나에 있어서, 트랜스포좀 복합체는 표적 DNA와 대략 동일한 화학량론으로 존재하는, 방법.
실시형태 146. 실시형태 133 내지 실시형태 145 중 어느 하나에 있어서, 2가 양이온은 조합 동안 존재하지 않는, 방법.
실시형태 147. 실시형태 133 내지 실시형태 145 중 어느 하나에 있어서, Ca2+ 및/또는 Mn2+는 조합 동안 존재하는, 방법.
실시형태 148. 실시형태 133 내지 실시형태 145 중 어느 하나에 있어서, 조합 후 그리고 단편화 전에 하나 이상의 2가 양이온을 샘플에 첨가하는 단계를 추가로 포함하는, 방법.
실시형태 149. 실시형태 148에 있어서, 2가 양이온은 Mg2+인, 방법.
실시형태 150. 실시형태 133 내지 실시형태 149 중 어느 하나에 있어서, 조합 후 그리고 단편화 전에 샘플을 엑소뉴클레아제로 처리하는 단계를 추가로 포함하는, 방법.
실시형태 151. 실시형태 150에 있어서, 샘플을 엑소뉴클레아제로 처리한 후 그리고 단편화 전에 Mg2+를 첨가하는 단계를 포함하는 방법.
실시형태 152. 실시형태 133 내지 실시형태 151 중 어느 하나에 있어서, 태그화 단편을 프로테이나제 K 및/또는 SDS를 이용하여 방출하는 단계를 추가로 포함하는 방법.
실시형태 153. 실시형태 111 내지 실시형태 152 중 어느 하나의 방법, 또는 실시형태 108 내지 실시형태 110의 키트 또는 조성물에 있어서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체 내에 포함된 5' 어댑터 서열은 상이한, 방법 또는 키트 또는 조성물.
실시형태 154. 실시형태 111 내지 실시형태 153 중 어느 하나에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인은 상이한, 방법.
실시형태 155. 실시형태 111 내지 실시형태 154 중 어느 하나에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인은 표적 핵산에서 소정의 관심 영역 내의 상이한 관심 서열에 결합하는, 방법.
실시형태 156. 실시형태 111 내지 실시형태 155 중 어느 하나에 있어서, 단편화 단계는 45℃ 내지 65℃에서 수행되는, 방법.
실시형태 157. 실시형태 156에 있어서, 단편화 단계는 50℃ 내지 60℃에서 수행되는, 방법.
실시형태 158. 실시형태 157에 있어서, 단편화 단계는 55℃에서 수행되는, 방법.
실시형태 159. 실시형태 111 내지 실시형태 158 중 어느 하나에 있어서, 복수의 5' 태그화 단편을 중합효소 및 리가아제로 처리하여 가닥을 연장 및 리게이션함으로써 완전한 이중 가닥화 태그화 단편을 제작하는 단계를 추가로 포함하는, 방법.
실시형태 160. 실시형태 111 내지 실시형태 159 중 어느 하나에 있어서, 하나 이상의 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
실시형태 161. 소기의 샘플과 원하지 않는 샘플 둘 모두를 포함하는 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법으로서, 이중 가닥화 핵산으로부터 시퀀싱 데이터를 제작하기 위해, 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리를 초기 시퀀싱하는 단계 - 여기서 각각의 핵산 라이브러리는 단일 샘플로부터의 핵산 및 라이브러리 내의 다른 샘플로부터의 핵산으로부터 단일 샘플로부터의 핵산을 구별하기 위한 고유한 샘플 바코드를 포함함 -; 시퀀싱 데이터를 분석하고, 소기의 샘플로부터의 시퀀싱 데이터와 연관된 고유한 샘플 바코드를 식별하는 단계; 소기의 샘플로부터의 핵산 샘플을 농축하는 단계 및/또는 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계를 포함하는 라이브러리에 대한 선택 단계를 수행하는 단계; 및 핵산 라이브러리를 재시퀀싱하는 단계를 포함하는 방법.
실시형태 162. 실시형태 161에 있어서, 샘플의 혼합된 풀은 세포의 혼합된 풀, 핵의 혼합된 풀, 또는 고분자량 DNA의 혼합된 풀을 포함하는, 방법.
실시형태 163. 실시형태 161 또는 실시형태 162에 있어서, 샘플은 세포, 핵, 또는 고분자량 DNA인, 방법.
실시형태 164. 실시형태 161 내지 실시형태 163 중 어느 하나에 있어서, 고유한 샘플 바코드는 고유한 세포 바코드인, 방법.
실시형태 165. 실시형태 161 내지 실시형태 164 중 어느 하나에 있어서, 농축 단계는 혼성 포획, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획, 또는 고유한 샘플 바코드-특이적 증폭을 포함하는, 방법.
실시형태 166. 실시형태 165에 있어서, 고유한 샘플 바코드-특이적 증폭은 고유한 샘플 바코드-표적화 PCR 증폭인, 방법.
실시형태 167. 실시형태 161 내지 실시형태 164 중 어느 하나에 있어서, 고갈 단계는 혼성 포획, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획, CRISPR 분해, 또는 가이드 RNA(gRNA)에 결합된 ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제)를 포함하는 복합체에 의한 절단을 포함하는, 방법.
실시형태 168. 실시형태 167에 있어서, 혼성화 포획은 혼성화 포획 올리고뉴클레오티드를 고유한 샘플 바코드에 혼성화하는 단계를 포함하는, 방법.
실시형태 169. 실시형태 168에 있어서, 혼성화 포획 올리고뉴클레오티드는 고체 지지체에 직접적으로 또는 간접적으로 결합되는, 방법.
실시형태 170. 실시형태 169에 있어서, 혼성화 포획 올리고뉴클레오티드는 비오틴-스트렙타비딘 상호작용을 통해 고체 지지체에 결합되는, 방법.
실시형태 171. 실시형태 167에 있어서, CRISPR 분해는 촉매적으로 활성 엔도뉴클레아제를 통한 절단인, 방법.
실시형태 172. 실시형태 171에 있어서, 엔도뉴클레아제는 Cas9인, 방법.
실시형태 173. 실시형태 172에 있어서, Cas9는 연쇄상구균 카니스 Cas9인, 방법.
실시형태 174. 실시형태 173에 있어서, 연쇄상구균 카니스 Cas9는 최소 서열 제약을 갖는, 방법.
실시형태 175. 실시형태 171 내지 실시형태 174 중 어느 하나에 있어서, 엔도뉴클레아제는 보다 높은 충실도의 돌이변이체(higher-fidelity mutant)인, 방법.
실시형태 176. 실시형태 171에 있어서, gRNA에 결합된 ShCAST를 포함하는 복합체에 의한 절단을 포함하는, 방법.
실시형태 177. 실시형태 171 내지 실시형태 176 중 어느 하나에 있어서, 엔도뉴클레아제는 FokI 뉴클레아제와 함께 융합 단백질 내에 포함되는, 트랜스포좀 복합체.
실시형태 178. 실시형태 171 내지 실시형태 177 중 어느 하나에 있어서, 엔도뉴클레아제는 하나 이상의 고유한 샘플 바코드에 결합하는 가이드 RNA와 회합되는, 방법.
실시형태 179. 실시형태 178에 있어서, 가이드 RNA는 원하지 않는 샘플의 핵산과 회합된 고유한 샘플 바코드를 향하는, 방법.
실시형태 180. 실시형태 178에 있어서, 가이드 RNA는 소기의 샘플의 핵산과 회합된 고유한 샘플 바코드를 향하는, 방법.
실시형태 181. 실시형태 178 내지 실시형태 180 중 어느 하나에 있어서, 가이드 RNA는 단일 가이드인, 트랜스포좀 복합체.
실시형태 182. 실시형태 181에 있어서, 단일 가이드 RNA는 20개 미만의 뉴클레오티드를 포함하는, 트랜스포좀 복합체.
실시형태 183. 실시형태 182에 있어서, 단일 가이드 RNA 서열은 15, 16, 17, 18, 또는 19개의 뉴클레오티드를 포함하는, 트랜스포좀 복합체.
실시형태 184. 실시형태 178 내지 실시형태 183 중 어느 하나에 있어서, 단일 가이드 RNA는 헤어핀 2차 구조를 포함하는, 트랜스포좀 복합체.
실시형태 185. 실시형태 171 내지 실시형태 184 중 어느 하나에 있어서, 엔도뉴클레아제는 고체 지지체에 직접적으로 또는 간접적으로 결합되는, 방법.
실시형태 186. 실시형태 185에 있어서, 엔도뉴클레아제는 비오틴-스트렙타비딘 상호작용을 통해 고체 지지체에 결합되는, 방법.
실시형태 187. 실시형태 161 내지 실시형태 186 중 어느 하나에 있어서, 소기의 샘플은 샘플의 혼합된 풀의 1%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 0.000001%, 0.0000001%, 0.00000001%, 또는 0.000000001% 이하로 존재하는 희귀 샘플인, 방법.
실시형태 188. 실시형태 161 내지 실시형태 186에 있어서, 소기의 샘플은 세포의 혼합된 풀의 1%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 0.000001%, 0.0000001%, 0.00000001%, 또는 0.000000001% 이하로 존재하는 소기의 세포인, 방법.
실시형태 189. 실시형태 161 내지 실시형태 188 중 어느 하나에 있어서, 재시퀀싱 전에 증폭 단계를 포함하는 방법.
실시형태 190. 실시형태 189에 있어서, 증폭 단계는 범용 프라이머를 사용하는, 방법.
실시형태 191. 실시형태 161 내지 실시형태 190 중 어느 하나에 있어서, 핵산 라이브러리는 태그먼트화에 의해 제작되는, 방법.
실시형태 192. 실시형태 161 내지 실시형태 191 중 어느 하나에 있어서, 고유한 샘플 바코드를 혼입하기 전에 핵산 샘플을 공간적으로 분리하는 단계를 포함하는 방법.
실시형태 193. 실시형태 161 내지 실시형태 192 중 어느 하나에 있어서, 샘플의 혼합된 풀로부터의 복수의 핵산 샘플을 시퀀싱하기 이전에 태그먼트화를 포함하는 방법.
실시형태 194. 실시형태 161 내지 실시형태 193 중 어느 하나에 있어서, 고유한 샘플 바코드가 각각의 핵산 샘플 내로 혼입되는, 방법.
실시형태 195. 실시형태 161 내지 실시형태 194 중 어느 하나에 있어서, i5 및 i7 서열이 각각의 핵산 샘플 내로 혼입되는, 방법.
실시형태 196. 실시형태 161 내지 실시형태 195 중 어느 하나에 있어서, 범용 프라이머가 각각의 핵산 샘플 내로 혼입되는, 방법.
실시형태 197. 실시형태 196에 있어서, 범용 프라이머는 P5 및/또는 P7 프라이머인, 방법.
실시형태 198. 실시형태 161 내지 실시형태 197 중 어느 하나에 있어서, 고유한 샘플 바코드는 단일 연속적 바코드인, 방법.
실시형태 199. 실시형태 198에 있어서, 고유한 샘플 바코드는 다수의 불연속적 바코드인, 방법.
실시형태 200. 실시형태 199에 있어서, 다수의 불연속적 바코드는 고정된 서열에 의해 분리되는, 방법.
실시형태 201. 실시형태 161 내지 실시형태 200 중 어느 하나에 있어서, 증폭 및 재시퀀싱 단계는 한 차례 반복되는, 방법.
실시형태 202. 실시형태 161 내지 실시형태 200 중 어느 하나에 있어서, 증폭 및 재시퀀싱 단계는 한 차례 초과로 반복되는, 방법.
실시형태 203. 실시형태 161 내지 실시형태 202 중 어느 하나에 있어서, 상기 핵산은 DNA인, 방법.
실시형태 204. 실시형태 161 내지 실시형태 202 중 어느 하나에 있어서, 상기 핵산은 RNA인, 방법.
실시형태 205. 실시형태 204에 있어서, 상기 핵산은 rRNA인, 방법.
실시형태 206. 실시형태 205에 있어서, 상기 핵산은 16s rRNA인, 방법.
실시형태 207. 실시형태 205에 있어서, 상기 핵산은 18s rRNA인, 방법.
실시형태 208. 실시형태 203에 있어서, 상기 핵산은 rDNA인, 방법.
실시형태 209. 실시형태 161 내지 실시형태 208 중 어느 하나에 있어서, 상기 핵산은 내부 전사된 스페이서 핵산(internal transcribed spacer nucleic acid)인, 방법.
실시형태 210. 실시형태 161 내지 실시형태 209 중 어느 하나에 있어서, 초기 시퀀싱 단계는 전체 게놈 시퀀싱을 포함하지 않고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하는, 방법.
실시형태 211. 실시형태 161 내지 실시형태 209 중 어느 하나에 있어서, 초기 시퀀싱 단계는 표적화된 시퀀싱을 포함하고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하는, 방법.
실시형태 212. 실시형태 211에 있어서, 초기 시퀀싱 단계는 하나 이상의 유전자-특이적 프라이머를 이용하는 표적화된 시퀀싱을 포함하는, 방법.
실시형태 213. 실시형태 212에 있어서, 유전자-특이적 프라이머는 범용 프라이머 꼬리를 포함하는, 방법.
실시형태 214. 실시형태 161 내지 실시형태 210 중 어느 하나에 있어서, 초기 시퀀싱 단계는 리보좀 시퀀싱을 포함하고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하는, 방법.
실시형태 215. 실시형태 214에 있어서, 리보좀 시퀀싱은 16s, 18s, 또는 내부 전사된 스페이서 시퀀싱을 포함하는, 방법.
실시형태 216. 실시형태 161 내지 실시형태 215 중 어느 하나에 있어서, 소기의 샘플은 세포 또는 핵인, 방법.
실시형태 217. 실시형태 216에 있어서, 소기의 샘플은 세포인, 방법.
실시형태 218. 실시형태 161 내지 실시형태 217 중 어느 하나에 있어서, 소기의 샘플은 세포로부터의 핵인, 방법.
실시형태 219. 실시형태 161 내지 실시형태 217 중 어느 하나에 있어서, 소기의 샘플은 인간 세포 또는 인간 세포로부터의 핵인, 방법.
실시형태 220. 실시형태 161 내지 실시형태 217 중 어느 하나에 있어서, 소기의 샘플은 암 세포 또는 암 세포로부터의 핵인, 방법.
실시형태 221. 실시형태 161 내지 실시형태 220 중 어느 하나에 있어서, 소기의 세포 또는 핵은 소기의 특정 세포 유형이거나, 이로부터 유래되는, 방법.
실시형태 222. 실시형태 161 내지 실시형태 221 중 어느 하나에 있어서, 소기의 샘플은 풀 내의 다른 샘플에 대한 돌연변이를 갖는, 방법.
실시형태 223. 실시형태 161 내지 실시형태 222 중 어느 하나에 있어서, 소기의 샘플은 암 세포 또는 면역 세포이거나, 이로부터 유래되는, 방법.
실시형태 224. 실시형태 223에 있어서, 소기의 샘플은 암 줄기 세포이거나, 이로부터 유래되는, 방법.
실시형태 225. 실시형태 223에 있어서, 소기의 샘플은 액체 또는 종양 생검 시료 내의 암 세포이거나, 이로부터 유래되는, 방법.
실시형태 226. 실시형태 220에 있어서, 소기의 샘플은 약물 치료에 내성인 암 세포이거나, 이로부터 유래되는, 방법.
실시형태 227. 실시형태 220에 있어서, 소기의 샘플은 세포의 풀 내의 다른 암 세포에 대해 적어도 하나의 돌연변이를 갖는 암 세포이거나, 이로부터 유래되는, 방법.
실시형태 228. 실시형태 161 내지 실시형태 227 중 어느 하나에 있어서, 암 진화를 추적하는 데 사용되는 방법.
실시형태 229. 실시형태 161 내지 실시형태 228 중 어느 하나에 있어서, 소기의 샘플은 체세포 드라이버 돌연변이를 갖는 세포이거나, 이로부터 유래되는, 방법.
실시형태 230. 실시형태 161 내지 실시형태 218 중 어느 하나에 있어서, 메타 유전체학에 사용되는 방법.
실시형태 231. 실시형태 230에 있어서, 환경 샘플로부터의 미생물을 시퀀싱하는 데 사용되는 방법.
실시형태 232. 실시형태 231에 있어서, 환경 샘플로부터의 미생물을 배양하는 단계를 포함하지 않는, 방법.
실시형태 233. 실시형태 230 내지 232 중 어느 하나에 있어서, 미생물은 박테리아, 진균, 고세균, 진균, 조류, 원생동물, 또는 바이러스를 포함하는, 방법.
실시형태 234. 실시형태 161 내지 실시형태 233 중 어느 하나에 있어서, 소기의 샘플은 단일 뉴클레오티드 변이(SNV)를 갖는, 방법.
실시형태 235. 실시형태 161 내지 실시형태 234 중 어느 하나에 있어서, 소기의 샘플은 복제수 변이(CNV)를 갖는, 방법.
실시형태 236. 실시형태 161 내지 실시형태 235 중 어느 하나에 있어서, 소기의 샘플은 소기의 메틸화 패턴을 갖는, 방법.
실시형태 237. 실시형태 161 내지 실시형태 236 중 어느 하나에 있어서, 소기의 샘플은 소기의 발현 패턴을 갖는, 방법.
실시형태 238. 실시형태 161 내지 실시형태 237 중 어느 하나에 있어서, 소기의 샘플은 소기의 후성적 패턴을 갖는, 방법.
실시형태 239. 실시형태 161 내지 실시형태 229, 또는 실시형태 234 내지 실시형태 238 중 어느 하나에 있어서, 소기의 샘플은 소기의 면역 유전자 재조합을 갖는, 방법.
실시형태 240. 실시형태 161 내지 실시형태 229, 또는 실시형태 234 내지 실시형태 239 중 어느 하나에 있어서, TCR 레퍼토리 특성화를 포함하는 방법.
실시형태 241. 실시형태 161 내지 실시형태 240 중 어느 하나에 있어서, 소기의 샘플은 특정 종 유형을 갖는, 방법.
실시형태 242. 실시형태 230 내지 실시형태 238 중 어느 하나에 있어서, 소기의 샘플은 병원체인, 방법.
실시형태 243. 실시형태 242에 있어서, 소기의 샘플은 박테리아, 진균, 고세균, 진균, 조류, 원생동물, 또는 바이러스이거나, 이로부터 유래되는, 방법.
실시형태 244. 실시형태 161 내지 실시형태 243 중 어느 하나에 있어서, 세포 분류-기반 농축 방법을 이용하지 않는, 방법.
실시형태 245. 실시형태 244에 있어서, FACS를 이용하지 않는, 방법.
실시형태 246. 실시형태 245에 있어서, 세포 크기, 형태, 또는 표면 단백질 발현을 기반으로 하는 FACS를 이용하지 않는, 방법.
실시형태 247. 실시형태 161 내지 실시형태 246 중 어느 하나에 있어서, 미세유체공학을 이용하지 않는, 방법.
실시형태 248. 실시형태 161 내지 실시형태 247 중 어느 하나에 있어서, 전체 게놈 증폭을 이용하지 않는, 방법.
실시형태 249. 실시형태 176에 있어서,
a. ShCAST는 Cas12K를 포함하고;
b. 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하고; 그리고/또는
c. gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나는 스트렙타비딘-코팅된 비드에 결합될 수 있는, 방법.
실시형태 250. 실시형태 176 또는 실시형태 249에 있어서, 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계는 이중 가닥화 핵산에 대한 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건을 갖는 유체 중에서 수행되는, 방법.
실시형태 251. 실시형태 250에 있어서, 이중 가닥화 핵산에 대한 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건은 15 mM 이하의 마그네슘 농도인, 방법.
실시형태 252. 실시형태 250 또는 실시형태 251에 있어서, 이중 가닥화 핵산에 대한 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건은 50 nM 이하의 트랜스포사제의 농도인, 방법.
실시형태 253. 실시형태 176 또는 실시형태 249에 있어서, 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계는 다음을 포함하는, 방법:
a. 상기 복합체 내에 포함된 트랜스포사제에 의한 핵산의 결합을 억제하는 조건 하에서 상기 복합체를 이중 가닥화 핵산에 결합시키는 단계; 및
b. 결합 후, 상기 복합체에 의한 상기 핵산의 절단을 촉진시키는 단계.
실시형태 254. 실시형태 253에 있어서, (1) 트랜스포사제는 결합 동안 존재하지 않고, (2) 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함하는, 방법.
실시형태 255. 실시형태 253에 있어서, (1) 트랜스포사제는 결합 동안 낮은 수준이고, (2) 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함하는, 방법.
실시형태 256. 실시형태 252 내지 실시형태 255 중 어느 하나에 있어서, (1) 트랜스포사제는 결합 동안 가역적으로 비활성화되고, (2) 절단을 촉진하는 단계는 트랜스포사제를 활성화시키는 단계를 포함하는, 방법.
실시형태 257. 실시형태 256에 있어서, (1) 트랜스포사제는 하나 이상의 트랜스포존의 결여로 인해 가역적으로 비활성화되고, (2) 트랜스포사제를 활성화시키는 단계는 하나 이상의 트랜스포존을 제공하는 단계를 포함하는, 방법.
실시형태 258. 조성물로서, (1) 하나 이상의 관심 핵산 서열을 포함하는 표적 핵산 및 (2) gRNA에 결합된 ShCAST를 각각 포함하는 실시형태 59에 따른 복수의 표적화된 트랜스포좀 복합체를 포함하며, ShCAST는 이에 결합된 증폭 어댑터를 갖고, 각각의 표적화된 트랜스포좀 복합체는 관심 핵산 서열에 혼성화되는, 조성물.
실시형태 259. 실시형태 258에 있어서, ShCAST는 Cas12K를 포함하며, 상기 복합체 내에 포함된 Cas12K의 하나 이상의 관심 핵산 서열에 대한 혼성화를 촉진하고, 상기 복합체 내에 포함된 트랜스포사제의 결합을 억제하는 조건을 갖는 유체를 추가로 포함하는 조성물.
실시형태 260. 실시형태 259에 있어서, 유체의 조건은 트랜스포사제의 활성을 위한 충분한 양의 마그네슘 이온의 부재를 추가로 포함하며, 선택적으로 상기 마그네슘 농도는 15 mM 이하인, 조성물.
실시형태 261. 실시형태 258에 있어서, 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 포함하며, 여기서, 트랜스포사제는 증폭 어댑터를 표적 핵산 내의 위치에 첨가할 수 있는, 조성물.
실시형태 262. 실시형태 261에 있어서, 유체의 조건은 트랜스포사제의 활성을 위한 충분한 양의 마그네슘 이온의 존재를 포함하며, 선택적으로 상기 마그네슘 농도는 15 mM 이상인, 조성물.
실시형태 263. 실시형태 258 내지 실시형태 262 중의 어느 하나에 있어서, ShCAST는 Cas12K를 포함하는, 조성물.
실시형태 264. 실시형태 258 내지 실시형태 263 중 어느 하나에 있어서, 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하는, 조성물.
실시형태 265. 실시형태 258 내지 실시형태 264 중 어느 하나에 있어서, 어댑터는 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함하는, 조성물.
실시형태 266. 실시형태 258 내지 실시형태 265 중 어느 하나에 있어서, 표적 핵산은 이중 가닥화 DNA를 포함하는, 조성물.
실시형태 267. 실시형태 258 내지 실시형태 266 중 어느 하나에 있어서, gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나가 결합되는 스트렙타비딘-코팅된 비드를 추가로 포함하는, 조성물.
실시형태 268. 실시형태 111 내지 실시형태 113 중 어느 하나에 있어서, 제1 및/또는 제2 표적화된 트랜스포좀 복합체는 실시형태 59의 표적화된 트랜스포좀 복합체를 포함하는, 방법.
실시형태 269. 실시형태 268에 있어서, 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건을 갖는 유체 중에 수행되는, 방법.
실시형태 270. 실시형태 269에 있어서, 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건은 15 mM 이하의 마그네슘 농도인, 방법.
실시형태 271. 실시형태 269 또는 실시형태 270에 있어서, 상기 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건은 50 nM 이하의 트랜스포사제의 농도인, 방법.
실시형태 272. 실시형태 268에 있어서,
a. 상기 복합체 내에 포함된 트랜스포사제에 의한 이중 가닥화 핵산의 결합을 억제하는 조건 하에서 상기 복합체를 이중화 가닥 핵산에 결합시키는 단계; 및
b. 결합 후, 상기 복합체에 의한 이중 가닥화 핵산의 절단을 촉진시키는 단계를 포함하는, 방법.
실시형태 273. 실시형태 272에 있어서, (1) 트랜스포사제는 결합 동안 존재하지 않고, (2) 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함하는, 방법.
실시형태 274. 실시형태 271 내지 실시형태 273 중 어느 하나에 있어서, (1) 트랜스포사제는 결합 동안 낮은 수준이고, (2) 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함하는, 방법.
실시형태 275. 실시형태 271 내지 실시형태 274 중 어느 하나에 있어서, (1) 트랜스포사제는 결합 동안 가역적으로 비활성화되고, (2) 절단을 촉진하는 단계는 트랜스포사제를 활성화시키는 단계를 포함하는, 방법.
실시형태 276. 실시형태 275에 있어서, (1) 트랜스포사제는 하나 이상의 트랜스포존의 결여로 인해 가역적으로 비활성화되고, (2) 트랜스포사제를 활성화시키는 단계는 하나 이상의 트랜스포존을 제공하는 단계를 포함하는, 방법.
실시형태 277, 실시형태 268 내지 실시형태 276 중 어느 하나에 있어서, 트랜스포사제는 증폭 어댑터를 이중 가닥화 핵산 내의 위치에 첨가하는, 방법.
추가의 목적 및 이점은 다음의 설명에서 일부 기술될 것이며, 부분적으로 상세한 설명으로부터 명백할 것이거나, 실시에 의해 알 수 있다. 목적 및 이점은 첨부된 청구범위에 특히 지적되는 요소 및 조합에 의해 실현되고, 달성될 것이다.
전술한 일반적 설명 및 다음의 상세한 설명은 모두 단지 예시적이고, 설명을 위한 것이며, 청구범위를 제한하지 않는 것으로 이해되어야 한다.
본 명세서 내에 포함되며, 이의 일부를 구성하는 첨부 도면은 상세한 설명과 함께 하나의(몇몇) 실시형태(들)를 예시하며, 본원에 기재된 원리를 설명하는 역할을 한다.
도 1은 본 방법과 함께 사용될 수 있는 샘플의 예시적 집단을 제공한다. 메타 유전체학 샘플에서, 관심 희귀 샘플은 특정 플라스미드(음영 삽도)를 발현하는 박테리아 또는 샘플 내의 희귀 바이러스의 존재(흑색 삽도)일 수 있다. 종양학 샘플에서, 관심 희귀 샘플은 체세포 드라이버 돌연변이를 발현하는 세포(삽도)일 수 있다. 일반적으로, 풍부한 샘플로부터의 데이터가 시퀀싱 결과를 압도할 것이기 때문에, 이들 희귀 샘플로부터의 데이터는 평가하기 어려울 수 있다.
도 2는 메타 유전체학 사용을 위한 대표적 방법을 보여준다. 단일 세포로부터의 복수의 라이브러리를 포함하는 단일 세포 라이브러리(sc-라이브러리)가 생성된다. 본 방법을 사용하여, 단일 세포로부터의 각각의 라이브러리 내의 단편은 예컨대 고유한 세포 바코드(UBC)에 의해 고유하게 태그화된다. 소기의 샘플(예컨대, 관심 희귀 세포로부터의 것들)과 연관된 UBC를 식별하기 위한 초기 시퀀싱 후, 소기의 샘플의 선택 및 재시퀀싱이 수행된다. 이러한 방법은 관심 세포로부터의 데이터가 풍부한 샘플로부터 생성된 다량의 시퀀싱 데이터에 의해 손실되거나, 압도되는 것을 피한다. 본 품질 관리 방법이 없는 경우, 관심 희귀 샘플은 생물정보학 분석으로부터 손실될 수 있다.
도 3은 희귀 단일 세포로부터의 라이브러리의 시퀀싱-기반 분류 및 선택의 대표적 방법을 보여준다. 라이브러리가 구축된 후, 초기 시퀀싱이 소기의 샘플을 결정하기 위해 수행될 수 있다(예컨대, 16s 시퀀싱). 이들 소기의 샘플은 단일 세포의 총 집단 내의 희귀 세포로부터 생성된 라이브러리일 수 있다. 이어서, 소기의 샘플의 선택이 관심 단일 세포로부터의 라이브러리 단편들과 회합된 UBC를 기반으로 농축 또는 고갈에 의해 수행된다. 선택은 예컨대 고유한 샘플 바코드-특이적 PCR 또는 혼성화 포획 또는 촉매적으로 비활성인 Cas9에 의한 포획을 사용하는 것에 의해, 다수의 상이한 수단을 통해 수행될 수 있다. 소기의 샘플의 선택 후, 포괄적 시퀀싱이 관심 희귀 세포의 특징을 보다 잘 이해하기 위해 수행될 수 있다.
도 4는 Sci-RNA3 방법을 통해 혼합된 집단으로부터 생성된 라이브러리와 함께 사용하기 위한 선택 방법을 보여준다. 유사한 방법이 다른 수단에 의해 생성된 라이브러리와 함께 사용될 수 있다.
도 5는 연속적 바코드를 수득하기 위해 변형된 SCI-seq 방법을 사용하여 라이브러리를 생성하는 방법을 보여준다.
도 6은 물리적으로 다룰 수 있는 바코드로 구축된 합성 연결된 DNA 라이브러리를 사용하여 라이브러리를 생성하기 위한 방법을 보여준다.
도 7은 초기 표적화된 시퀀싱을 수행하는 방법을 보여준다.
도 8은 선택에 사용될 수 있는 엔도뉴클레아제(예컨대, Cas9)의 특이성을 증가시키는 다양한 수단을 보여준다.
도 9는 재조합효소-매개 표적화된 전위의 개요를 제공한다. 재조합효소(Rec)-코팅된 표적화 올리고뉴클레오티드(올리고)는 표적화되는 게놈 DNA에 결합할 수 있다. 재조합효소는 가닥 침입을 매개하여 트랜스포좀을 관심 영역에 국소화한다. 후속 전위는 P5/P7 서열을 게놈 DNA 내로 삽입할 수 있고, 이후 관심 영역의 단편이 생성될 수 있다.
도 10은 표적화된 올리고뉴클레오티드를 기반으로 하는 표적화된 전위의 개요를 보여준다. 단일 가닥화 게놈 표적 DNA는 변성될 수 있고, 이후 표적화된 올리고뉴클레오티드는 단일 가닥화 DNA(ssDNA) 내의 하나 이상의 관심 핵산 서열에 혼성화(hyb)할 수 있다. 이어서, 트랜스포사제 및 트랜스포존이 첨가될 수 있다. 트랜스포사제가 이중 가닥화 핵산의 영역에 결합함에 따라, 표적화된 올리고뉴클레오티드가 결합되었던 영역에 전위가 표적화된다. 대조적으로, 트랜스포사제는 ssDNA의 다른 영역에 결합하지 않을 것이다. 전위는 P5/P7 서열을 게놈 DNA 내로 삽입할 수 있고, 이후 관심 영역의 단편이 생성될 수 있다.
도 11은 트랜스포사제(이 실시형태에서, Tn5)에 연결된 촉매적으로 비활성인 엔도뉴클레아제(비활성화됨 또는 이 실시형태에서, dCas9)의 융합 단백질을 포함하는 표적화된 트랜스포좀 복합체를 사용하여 라이브러리를 생성하는 방법을 보여준다. dCas9와 회합되는 단일 가이드 RNA(sgRNA)는 표적 핵산 내의 특정 뉴클레오티드 서열에 결합하기 위해 융합 단백질을 표적화한다. 이러한 결합은 dCas9 결합은 활성이되, 트랜스포사제는 비활성인 조건 하에서(예를 들어,Ca2+ 및/또는 Mn2+의 존재 하에서) 수행될 수 있다. 융합 단백질의 결합 후, 트랜스포사제를 통한 태그먼트화는 Mg2+로 활성화되어 Nextera 제작을 위한 것과 유사한 프로토콜을 사용하여 태그화 라이브러리 단편들이 생성되도록 할 수 있다. 이어서, 수득된 단편이 시퀀싱될 수 있다.
도 12a 내지 도 12d는 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제를 포함하는 표적화된 트랜스포좀 복합체를 제작하기 위한 다양한 수단을 제시한다. 표적화된 트랜스포좀 복합체는 융합 단백질을 포함할 수 있으며, 여기서, 엔도뉴클레아제 및 트랜스포사제는 하나의 단백질로서 발현된다(a). 이러한 융합 단백질은 엔도뉴클레아제와 트랜스포사제 사이에 링커를 포함할 수 있다. 대안적으로, 결합 쌍(예컨대, 스트렙타비딘 및 비오틴)이 사용되어 트랜스포사제와 엔도뉴클레아제를 회합시킬 수 있다(b). 본원에 기재된 임의의 실시형태에서, 가이드 RNA는 17개의 뉴클레오티드를 포함하는 것과 같이 단축될 수 있으며(예를 들어, 20 미만의 뉴클레오티드를 포함함), 이는 단축된 가이드 RNA가 표적 핵산 내의 하나 이상의 관심 서열에 대한 특이성을 증가시킬 수 있기 때문이다. 단일 가이드 RNA(sgRNA)는 트랜스포존 말단 서열 및 Tn5 어댑터, 예컨대 A14 및 B15를 포함하는 트랜스포존과 회합된 sgRNA와 같이 트랜스포존과 회합될 수 있다(c). sgRNA 및 트랜스포존의 회합은 상보적 서열의 영역에 의해 매개될 수 있다. 또한, 연속적 sgRNA-전이 가닥 올리고뉴클레오티드(단일 올리고뉴클레오티드)가 사용될 수 있다(d).
도 13은 촉매적으로 비활성인 엔도뉴클레아제를 포함하는 표적화된 트랜스포좀 복합체의 특이성을 증가시킬 수 있는 다양한 실시형태를 보여준다. 단축된 가이드 RNA는 표적 핵산 내의 관심 특이적 서열에 대한 특이성을 증가시킬 수 있으며, 특정 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif)에 대한 최소 서열 제약을 갖는 엔도뉴클레아제는 더 큰 표적 설계 공간을 허용할 수 있다. 토홀드-차단된 가이드 RNA(toehold-blocked guide RNA)와 같은 헤어핀 2차 구조가 또한 특이성을 증가시키기 위해 사용될 수 있다.
도 14a 내지 도 14c는 dCas9 및 트랜스포사제의 융합 단백질을 포함하는 표적화된 트랜스포좀 복합체가 농축 표적 영역의 단편화를 매개하는 데 사용될 수 있는 방법을 보여준다. 융합 단백질은 표적 핵산(예컨대, DNA)을 스캔하여 PAM에 근접한 dCas9의 가이드 RNA에 결합하는 관심 서열을 찾을 것이다(a). 일단 관심 서열을 발견하면, dCas9의 고특이성 결합이 태그먼트화와 함께 획득될 수 있다(예컨대, 트랜스포사제에 의해 태그먼트화되도록 하지 않고, 2가 이온 부재 하에 또는 Ca2+ 또는 Mn2+와 초기 접촉하여 sgRNA-Cas9의 결합 및 형태 변화가 가능하도록 함). dCas9의 결합을 허용한 후, 트랜스포사제(예컨대 Tn5)를 통한 태그먼트화는 Mg2+를 첨가하여 개시된다. Mg2+ 첨가 전의 엑소뉴클레아제의 처리는 표적 DNA의 비-Cas9 보호된 영역을 제거함으로써 추가의 특이성을 허용할 수 있다. 절단 후, DNA 단편은 프로테이나제 K 및/또는 SDS에 의해 방출될 수 있다. 이들 방법은 농축 표적 영역을 포함하는 라이브러리 내의 높은 백분율의 단편을 수득하도록 할 수 있다. DNA의 방출 후, 연장 및 갭-충전 리게이션(gap-fill ligation)이 수행될 수 있다(c).
도 15는 혈장 내의 세포 유리 DNA(cfDNA)로부터 표적화된 라이브러리를 생성하기 위한 아연 집게 뉴클레아제(ZNF)-회합된 트랜스포좀의 사용을 보여준다. 아연 집게 DNA-결합 도메인 또는 ZNF는 심지어 cfDNA가 히스톤과 회합될 때도, 트랜스포좀 복합체를 cfDNA 내의 부위로 표적화할 수 있다.
도 16a 및 도 16b는 ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제) 표적화된 라이브러리 제작 및 농축을 위한 예시 조성물 (a) 및 공정 흐름 (b)에서의 작업 과정을 개략적으로 예시한다.
하기 표 2는 표지된 성분에 대한 설명을 제공한다.
[표 2]
Figure pct00001

서열의 설명
표 1은 본원에 언급된 특정 서열의 목록을 제공한다.
[표 1]
Figure pct00002
다양한 표적화된 트랜스포좀 복합체가 본원에 기재된다. 본원에 사용된 "표적화된 트랜스포좀 복합체"는 표적 핵산 내의 하나 이상의 관심 핵산 서열에 표적화되는 트랜스포좀 복합체를 지칭한다.
I. 표적화된 트랜스포좀 복합체
본 출원은 다수의 상이한 표적화된 트랜스포좀 복합체를 기재하며, 트랜스포좀은 표적 핵산 내의 핵산 서열에 표적화된다. 일부 실시형태에서, 표적화된 트랜스포좀 복합체는 표적 핵산 내의 하나 이상의 관심 핵산 서열에 결합할 수 있는 구성요소를 포함한다. 이러한 결합을 기반으로, 표적화된 트랜스포좀 복합체는 표적 핵산 내의 관심 영역에서의 전위를 매개할 수 있다.
표적화된 트랜스포좀 복합체는 표적 핵산에 비-랜덤 결합을 갖는 임의의 트랜스포좀 복합체일 수 있다. 따라서, 표적화된 트랜스포좀 복합체는 표적 핵산 내의 서열에 랜덤하게 결합하는 비-표적화된 트랜스포좀 복합체와 상이할 수 있다. 예를 들어, 표적화된 트랜스포좀 복합체는 표적 핵산 내의 하나 이상의 관심 핵산 서열에 결합하는 구성요소를 포함할 수 있다. 이들 표적화된 트랜스포좀 복합체를 사용하는 방법은 표적화된 라이브러리를 생성하는 데 사용될 수 있으며, 단편은 표적 핵산 내의 관심 영역을 포함한다.
다수의 상이한 유형의 표적화된 트랜스포좀 복합체가 본원에 기재된다.
A. 트랜스포좀 복합체
일반적으로, 본 트랜스포존 복합체는 하나 이상의 관심 핵산 서열에 대한 표적화를 매개하는 하나 이상의 구성요소와 함께 트랜스포사제와 제1 및 제2 트랜스포존을 포함한다.
본원에 사용된 "트랜스포좀 복합체"는 적어도 하나의 트랜스포사제(또는 본원에 기재된 다른 효소) 및 트랜스포존 인식 서열로 구성된다. 이러한 일부 시스템에서, 트랜스포사제는 트랜스포존 인식 서열에 결합하여 전위 반응을 촉매 작용할 수 있는 기능성 복합체를 형성한다. 일부 양태에서, 트랜스포존 인식 서열은 이중 가닥화 트랜스포존 말단 서열이다. 트랜스포사제는 표적 핵산 내의 트랜스포사제 인식 부위에 결합하고, 트랜스포존 인식 서열을 표적 핵산 내로 삽입한다. 이러한 일부 삽입 사건에서, 트랜스포존 인식 서열(또는 말단 서열)의 일 가닥은 표적 핵산 내로 전이되어 절단 사건을 일으킨다. 트랜스포사제와 사용하기에 용이하게 적합할 수 있는 예시적 전위 절차 및 시스템.
"트랜스포사제"는 트랜스포존 말단-함유 조성물(예를 들어, 트랜스포존, 트랜스포존 말단, 트랜스포존 말단 조성물)과 기능성 복합체를 형성할 수 있으며, 트랜스포존 말단-함유 조성물의 이중 가닥화 표적 핵산 내로의 삽입 또는 전위를 촉매 작용할 수 있는 효소를 의미한다. 본원에 제시된 트랜스포사제는 또한 레트로트랜스포존 및 레트로바이러스로부터의 인테그라제(integrase)를 포함할 수 있다.
본원에 제공된 특정 실시형태와 사용될 수 있는 예시적 트랜스포사제는 다음을 포함한다(또는 이에 의해 인코딩됨): Tn5 트랜스포사제, 슬리핑 뷰티(SB: sleeping beauty) 트랜스포사제, 비브리오 하베이(Vibrio harveyi), R1 및 R2 말단 서열을 포함하는 Mu 트랜스포사제 인식 부위 및 MuA 트랜스포사제, 황색 포도상구균 Tn552, Ty1, Tn7 트랜스포사제, Tn/O 및 IS10, 마리네르 트랜스포사제(Mariner transposase), Tc1, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존. 보다 많은 예는 IS5, Tn10, Tn903, IS911, 및 트랜스포사제 패밀리 효소의 조작처리된 버전(engineered version)을 포함한다. 본원에 기재된 방법은 또한 트랜스포사제의 조합을 포함할 수 있으며, 단지 단일 트랜스포사제를 포함하지 않을 수 있다.
일부 실시형태에서, 트랜스포사제는 Tn5, Tn7, MuA, 또는 비브리오 하베이 트랜스포사제, 또는 이의 활성 돌연변이체이다. 다른 실시형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 돌연변이체이다. 다른 실시형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 돌연변이체이다. 다른 실시형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 활성 돌연변이체이다. 일부 실시형태에서, Tn5 트랜스포사제는 과활성 Tn5 트랜스포사제 또는 이의 활성 돌연변이체이다. 일부 양태에서, Tn5 트랜스포사제는 국제 공개 WO 2015/160895호에 기재된 Tn5 트랜스포사제이며, 상기 특허는 본원에 인용되어 포함된다. 일부 양태에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제에 대하여 위치 54, 56, 372, 212, 214, 251, 및 338에서 돌연변이를 갖는 과활성 Tn5이다. 일부 양태에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제에 대하여 다음의 돌연변이를 갖는 과활성 Tn5 이다: E54K, M56A, L372P, K212R, P214R, G251R, 및 A338V. 일부 실시형태에서, Tn5 트랜스포사제는 융합 단백질이다. 일부 실시형태에서, Tn5 트랜스포사제 융합 단백질은 융합된 연장 인자 Ts(Tsf) 태그를 포함한다. 일부 실시형태에서, Tn5 트랜스포사제는 야생형 서열에 대하여 아미노산 54, 56, 및 372에서 돌연변이를 포함하는 과활성 Tn5 트랜스포사제이다. 일부 실시형태에서, 과활성 Tn5 트랜스포사제는 융합 단백질이며, 선택적으로 융합 단백질은 연장 인자 Ts(Tsf)이다. 일부 실시형태에서, 인식 부위는 Tn5-유형 트랜스포사제 인식 부위이다(문헌[Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998]). 일 실시형태에서, 과활성 Tn5 트랜스포사제와 복합체를 형성하는 트랜스포사제 인식 부위가 사용된다(예를 들어, EZ-Tn5TM 트랜스포사제, 미국 위스콘신주 매디슨 소재의 Epicentre Biotechnologies). 일부 실시형태에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제이다.
전반에 걸쳐서 사용된 용어 트랜스포사제는 트랜스포존-함유 조성물(예를 들어, 트랜스포존, 트랜스포존 조성물)과 기능성 복합체를 형성할 수 있으며, 시험관 내 전위 반응에서 인큐베이션되는 이중 가닥화 표적 핵산 내로의 트랜스포존-함유 조성물의 삽입 또는 전위를 촉매 작용할 수 있는 효소를 지칭한다. 제공된 방법의 트랜스포사제는 또한 레트로트랜스포존 및 레트로바이러스로부터의 인테그라제를 포함할 수 있다. 제공된 방법에 사용될 수 있는 예시적 트랜스포사제는 Tn5 트랜스포사제 및 MuA 트랜스포사제의 야생형 또는 돌연변이 형태를 포함한다.
"전위 반응"은 하나 이상의 트랜스포존이 랜덤한 부위 또는 거의 랜덤한 부위에서 표적 핵산 내로 삽입되는 반응이다. 전위 반응에서의 필수 구성요소는 전이된 트랜스포존 서열 및 이의 상보체(즉, 비-전이된 트랜스포존 말단 서열)뿐만 아니라 기능성 전위 또는 트랜스포좀 복합체를 형성하는 데 필요한 기타 구성요소를 포함하는 트랜스포존의 뉴클레오티드 서열을 나타내는 DNA 올리고뉴클레오티드 및 트랜스포사제이다. 본 개시내용의 방법은 과활성 Tn5 트랜스포사제 및 Tn5-유형 트랜스포존 말단에 의해, 또는 MuA 또는 HYPERMu 트랜스포사제, 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포존에 의해 형성된 전위 복합체를 이용하는 것에 의해 예시된다(예를 들어, 문헌[Goryshin, I. and Reznikoff, W. S., J. Biol. Chem., 273: 7367, 1998]; 및 문헌[Mizuuchi, Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995]을 참조하며, 이들은 그 전체 내용이 본원에 인용되어 포함됨). 그러나, 이의 의도된 목적을 위해 표적 핵산을 태그화하기에 충분한 효율로 랜덤 또는 거의 랜덤 방식으로 트랜스포좀 말단을 삽입할 수 있는 임의의 전위 시스템이 제공된 방법에서 사용될 수 있다. 제공된 방법에 사용될 수 있는 알려진 전위 시스템의 다른 예는 황색 포도상구균 Tn552, Tyl, 트랜스포존 Tn7, Tn/O 및 IS 10, 마리네르 트랜스포사제, Tel, P 요소, Tn3, 박테리아 삽입 서열, 레트로바이러스, 및 효모의 레트로트랜스포존을 포함하지만, 이로 제한되지는 않는다(예를 들어, 문헌[Colegio O R et al, J. Bacteriol., 183: 2384-8, 2001]; 문헌[Kirby C et al, Mol. Microbiol., 43: 173-86, 2002]; 문헌[Devine S E, and Boeke J D., Nucleic Acids Res., 22: 3765- 72, 1994]; 국제 특허 출원 번호 WO 95/23875호; 문헌[Craig, N L, Science. 271 : 1512, 1996]; 문헌[Craig, N L, Review in: Curr Top Microbiol Immunol., 204: 27-48, 1996]; 문헌[Kleckner N, et al., Curr Top Microbiol Immunol., 204: 49-82, 1996]; 문헌[Lampe D J, et al., EMBO J., 15: 5470-9, 1996]; 문헌[Plasterk R H, Curr Top Microbiol Immunol, 204: 125-43, 1996]; 문헌[Gloor, G B, Methods Mol. Biol, 260: 97-1 14, 2004]; 문헌[Ichikawa H, and Ohtsubo E., J Biol. Chem. 265: 18829-32, 1990]; 문헌[Ohtsubo, F and Sekine, Y, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996]; 문헌[Brown P O, et al, Proc Natl Acad Sci USA, 86: 2525-9, 1989]; 문헌[Boeke J D and Corces V G, Annu Rev Microbiol. 43: 403-34, 1989]을 참조하며, 이들은 그 전체 내용이 본원에 인용되어 포함됨).
트랜스포존을 표적 서열 내로 삽입하기 위한 방법은 적합한 시험관 내 전위 시스템이 이용 가능하거나, 당업계의 지식을 기반으로 개발될 수 있는 임의의 적합한 트랜스포존 시스템을 사용하여 시험관 내에서 수행될 수 있다. 일반적으로, 본 개시내용의 방법에 사용하기에 적합한 시험관 내 전위 시스템은 충분한 순도와 충분한 농도와 충분한 시험관 내 전위 활성의 트랜스포사제 효소 및 전위 반응을 촉매 작용할 수 있는 각각의 트랜스포사제와 기능성 복합체를 형성하는 트랜스포존을 최소한 필요로 한다. 사용될 수 있는 적합한 트랜스포사제 트랜스포존 말단 서열은 트랜스포사제의 야생형, 유도체, 또는 돌연변이 형태 중에서 선택되는 트랜스포사제와 복합체를 형성하는 야생형, 유도체, 또는 돌연변이 트랜스포존 말단 서열을 포함하지만, 이로 제한되지는 않는다.
일부 실시형태에서, 트랜스포사제는 Tn5 트랜스포사제를 포함한다. 일부 실시형태에서, Tn5 트랜스포사제는 과활성 Tn5 트랜스포사제이다.
일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사제의 2개의 분자의 이량체를 포함한다. 일부 실시형태에서, 트랜스포좀 복합체는 동형이량체(homodimer)이며, 트랜스포사제의 두 분자는 동일한 유형의 제1 및 제2 트랜스포존에 각각 결합된다(예를 들어, 각각의 단량체에 결합된 2개의 트랜스포존의 서열은 동일하여 "동형이량체"를 형성함). 일부 실시형태에서, 본원에 기재된 조성물 및 방법은 2개 집단의 트랜스포좀 복합체를 이용한다. 일부 실시형태에서, 각각의 집단에서의 트랜스포사제는 동일하다. 일부 실시형태에서, 각각의 집단에서의 트랜스포좀 복합체는 동형이량체이며, 제1 집단은 각각의 단량체 내에 제1 어댑터 서열을 갖고, 제2 집단은 각각의 단량체 내에 상이한 어댑터 서열을 갖는다.
용어 "트랜스포존 말단"은 시험관 내 전위 반응에서 기능성인 트랜스포사제 또는 인테그라제 효소와 복합체를 형성하는 데 필요한 뉴클레오티드 서열("트랜스포존 말단 서열")만을 나타내는 이중 가닥화 핵산 DNA를 지칭한다. 일부 실시형태에서, 트랜스포존 말단은 전위 반응에서 트랜스포사제와 기능적 복합체를 형성할 수 있다. 비제한적 예로서, 트랜스포존 말단은 미국 특허출원공개 US 2010/0120098호의 개시내용에 제시된, 야생형 또는 돌연변이 Tn5 트랜스포사제에 의해 인식되는 19-bp 외부 말단("OE") 트랜스포존 말단, 내부 말단("IE") 트랜스포존 말단, 또는 "모자이크 말단"("ME") 트랜스포존 말단, 또는 R1 및 R2 트랜스포존 말단을 포함할 수 있으며, 상기 특허의 내용은 그 전체 내용이 본원에 인용되어 포함된다. 트랜스포존 말단은 시험관 내 전위 반응에서 트랜스포사제 또는 인테그라제 효소와 기능성 복합체를 형성하기에 적합한 임의의 핵산 또는 핵산 유사체를 포함할 수 있다. 예를 들어, 트랜스포존 말단은 DNA, RNA, 변형된 염기, 비-천연 염기, 변형된 골격을 포함할 수 있으며, 일 가닥 또는 둘 모두의 가닥에서 닉(nick)을 포함할 수 있다. 용어 "DNA"는 트랜스포존 말단 조성물과 관련하여 본 개시내용 전반에 걸쳐 사용되지만, 임의의 적합한 핵산 또는 핵산 유사체가 트랜스포존 말단에 이용될 수 있음을 이해해야 한다.
용어 "전이된 가닥"은 트랜스포존의 둘 모두의 말단의 전이된 부분을 지칭한다. 유사하게, 용어 "비-전이된 가닥"은 둘 모두의 "트랜스포존 말단"의 비-전이된 부분을 지칭한다. 전이된 가닥의 3'-말단은 시험관 내 전위 반응에서 표적 DNA에 접합되거나, 이로 전이된다. 전이된 트랜스포존 말단 서열과 상보적인 트랜스포존 말단 서열을 나타내는 비-전이된 가닥은 시험관 내 전위 반응에서 표적 DNA에 접합되거나, 이로 전이되지 않는다.
일부 실시형태에서, 전이된 가닥 및 비-전이된 가닥은 공유 접합된다. 예를 들어, 일부 실시형태에서, 전이된 그리고 비-전이된 가닥 서열은 예를 들어 헤어핀 배열로 단일 올리고뉴클레오티드 상에 제공된다. 따라서, 비-전이된 가닥의 자유 말단은 전위 반응에 의해 직접 표적 DNA에 접합되지는 않지만, 비-전이된 가닥은 헤어핀 구조의 루프에 의해 전이된 가닥에 연결되기 때문에, 비-전이된 가닥은 간접적으로 DNA 단편에 부착되게 된다. 트랜스포좀 구조 및 트랜스포좀을 제작하고, 사용하는 방법의 추가적 예는 미국 특허출원공개 US 2010/0120098호의 개시내용에서 확인될 수 있으며, 이의 내용은 그 전체 내용이 본원에 인용되어 포함된다.
일부 실시형태에서, 트랜스포좀 복합체는 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존을 포함한다. 일부 실시형태에서, 트랜스포좀 복합체는 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적이다.
따라서, 일부 실시형태에서, 트랜스포존 조성물은 전이된 트랜스포존 서열, 예를 들어 어댑터 서열의 하나 이상의 다른 뉴클레오티드 서열 5'를 갖는 전이된 가닥을 포함한다. 일부 실시형태에서, 어댑터 서열은 태그 서열이다. 전이된 트랜스포존 서열 이외에, 태그는 하나 이상의 다른 태그 부분 또는 태그 도메인을 가질 수 있다.
본원에 사용된 "태그먼트화"는 단편 및 태그 핵산에 대한 트랜스포사제의 사용을 지칭한다. 태그먼트화는 트랜스포존 말단 서열(본원에서 트랜스포존으로 지칭됨)을 포함하는 하나 이상의 태그(예컨대, 어댑터 서열)와 복합체화된 트랜스포사제 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 포함한다. 따라서, 태그먼트화는 동시적인 DNA 단편화 및 듀플렉스 단편의 둘 모두의 가닥의 5' 말단에 대한 어댑터의 리게이션을 일으킬 수 있다.
다수의 표적화된 트랜스포좀 복합체가 본 출원에 기재되지만, 일부 방법은 표적화된 트랜스포좀 복합체 및 비-표적화된 트랜스포좀 복합체 둘 모두를 이용할 수 있는 것으로 이해된다.
B. 고정된 트랜스포좀 복합체
일부 실시형태에서, 트랜스포좀 복합체는 고체 지지체 상에 고정된다.
일부 실시형태에서, 트랜스포좀 복합체는 ㎟당 적어도 103, 104, 105, 또는 106개의 복합체의 밀도로 고체 지지체 상에 존재한다.
일부 실시형태에서, 고정된 라이브러리 내의 이중 가닥화 단편의 길이는 고체 지지체 상의 트랜스포좀 복합체의 밀도를 증가 또는 감소시킴으로써 조절된다.
다수의 상이한 유형의 고정된 트랜스포좀이 미국 특허 제9683230에 기재된 바와 같이 이들 방법에 사용될 수 있으며, 상기 특허는 그 전체 내용이 본원에 포함된다.
본원에 제시된 방법 및 조성물에서, 트랜스포좀 복합체는 고체 지지체에 고정된다. 일부 실시형태에서, 트랜스포좀 복합체 및/또는 포획 올리고뉴클레오티드는 트랜스포존 말단 서열을 포함하는 폴리뉴클레오티드와 같은 하나 이상의 폴리뉴클레오티드를 통해 지지체에 고정된다. 일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사제 효소를 고체 지지체에 결합시키는 링커 분자를 통해 고정될 수 있다. 일부 실시형태에서, 트랜스포사제 효소 및 폴리뉴클레오티드 둘 모두는 고체 지지체에 고정된다. 고체 지지체에 대한 분자(예를 들어, 핵산)의 고정을 언급할 때, 용어 "고정된" 및 "부착된"은 본원에서 상호 교환적으로 사용되며, 둘 모두의 용어는 명백하게 또는 문맥에 의해 달리 명시되지 않는 한, 직접적 또는 간접적, 공유 또는 비-공유 부착을 포함하도록 의도된다. 일부 실시형태에서, 공유 부착이 사용될 수 있으나, 일반적으로 필요한 모든 것은 분자(예를 들어, 핵산)가 예를 들어 핵산 증폭 및/또는 시퀀싱이 필요한 적용 분야에서 지지체를 사용하도록 의도된 조건 하에 지지체에 고정되거나, 부착된 상태로 유지되는 것이다.
특정 실시형태는 예를 들어 폴리뉴클레오티드와 같은 생체분자에 대한 공유적 부착을 허용하는 반응성 기를 포함하는 중간 재료의 층 또는 코팅의 적용에 의해, 기능화되었던 불활성 기재 또는 매트릭스(예를 들어, 유리 슬라이드, 중합체 비드 등)로 구성된 고체 지지체를 사용하도록 할 수 한다. 이러한 지지체의 예는 유리와 같은 불활성 기재 상에 지지된 폴리아크릴아미드 하이드로겔, 특히 국제 공개 WO 2005/065814호 및 미국 특허출원공개 US 2008/0280773호에 기재된 폴리아크릴아미드 하이드로겔을 포함하지만, 이로 제한되지는 않으며, 상기 특허의 내용은 그 전체 내용이 본원에 포함된다. 이러한 실시형태에서, 생체분자(예를 들어, 폴리뉴클레오티드)는 중간 재료(예를 들어, 하이드로겔)에 직접 공유적으로 부착될 수 있지만, 중간 재료 자체는 기재 또는 매트릭스(예를 들어, 유리 기재)에 비-공유적으로 부착될 수 있다. 따라서, 용어 "고체 지지체에 대한 공유 부착"은 이러한 유형의 배열을 포함하는 것으로 해석되어야 한다.
용어 "고체 표면", "고체 지지체", 및 본원의 다른 문법적 등가물은 트랜스포좀 복합체의 부착에 적절하거나, 적절하도록 변형될 수 있는 임의의 재료를 지칭한다. 당업자에 의해 인식될 것인 바와 같이, 가능한 기재의 수는 매우 많다. 가능한 기재는 유리 및 개질 또는 기능화된 유리, 플라스틱(예를 들어, 아크릴, 폴리스티렌, 및 스티렌과 다른 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, TeflonTM 등을 포함함), 다당류, 나일론 또는 니트로셀룰로스, 세라믹, 수지, 실리카 또는 규소 및 개질된 규소를 포함하는 실리카-기반 재료, 탄소, 금속, 무기 유리, 플라스틱, 광섬유 다발, 및 다양한 다른 중합체를 포함하지만, 이로 제한되지는 않는다. 일부 실시형태에 특히 유용한 고체 지지체 및 고체 표면은 플로우셀 장치 내에 위치한다. 예시적 플로우셀은 하기 추가로 상세하게 제시된다.
일부 실시형태에서, 고체 지지체는 트랜스포좀 복합체를 정렬된 패턴으로 고정시키기에 적합한 패턴화 표면을 포함한다. "패턴화 표면"은 고체 지지체의 노출된 층 내부 또는 그 상에서의 상이한 영역의 배열을 지칭한다. 예를 들어, 하나 이상의 영역은 하나 이상의 트랜스포좀 복합체가 존재하는 특징부(feature)일 수 있다. 특징부는 트랜스포좀 복합체가 존재하지 않는 개재성 영역에 의해 분리될 수 있다. 일부 실시형태에서, 패턴은 행과 열로 존재하는 x-y 형식의 특징부일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 개재성 영역의 반복 배열일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 개재성 영역의 랜덤 배열일 수 있다. 일부 실시형태에서, 트랜스포좀 복합체는 고체 지지체 상에 랜덤하게 분포된다. 일부 실시형태에서, 트랜스포좀 복합체는 패턴화 표면 상에 분포된다. 본원에 제시된 방법 및 조성물에 사용될 수 있는 예시적 패턴화 표면은 미국 출원 제13/661,524호 또는 미국 특허출원공개 US 2012/0316086 A1호에 기재되어 있으며, 이들 각각은 본원에 인용되어 포함된다.
일부 실시형태에서, 고체 지지체는 표면에서의 웰 또는 함몰부의 어레이를 포함한다. 이는 비제한적으로 포토리소그래피, 스탬핑 기술, 몰딩 기술, 및 마이크로에칭 기술을 포함하는 다양한 기술을 사용하여 당업계에 일반적으로 알려진 바와 같이 제작될 수 있다. 당업자에 의해 인식될 것인 바와 같이, 사용되는 기술은 어레이 기재의 조성 및 형상에 좌우될 것이다.
고체 지지체의 조성 및 기하학적 구조는 그의 용도에 따라 달라질 수 있다. 일부 실시형태에서, 고체 지지체는 슬라이드, 칩, 마이크로칩, 및/또는 어레이와 같은 평면형 구조이다. 따라서, 기재의 표면은 평면 층의 형태로 존재할 수 있다. 일부 실시형태에서, 고체 지지체는 플로우셀의 하나 이상의 표면을 포함한다. 본원에 사용된 용어 "플로우셀"은 하나 이상의 유체 시약이 흐를 수 있는 고체 표면을 포함하는 챔버를 지칭한다. 본 개시내용의 방법에서 용이하게 사용될 수 있는 플로우셀 및 관련 유체 시스템 및 검출 플랫폼의 예는 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제 공개 WO 91/06678호; 국제 공개 WO 07/123744; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호, 및 미국 특허출원공개 US 2008/0108082호에 기재되어 있으며, 이들 각각은 본원에 인용되어 포함된다.
일부 실시형태에서, 고체 지지체 또는 이의 표면은 튜브 또는 용기의 내부 또는 외부 표면과 같이 비-평면형이다. 일부 실시형태에서, 고체 지지체는 미세구 또는 비드를 포함한다. 본원에서 "미세구" 또는 "비드" 또는 "입자" 또는 문법적 등가물이란, 작은 개별적 입자를 의미한다. 적합한 비드 조성물은 비제한적으로 플라스틱, 세라믹, 유리, 폴리스티렌, 메틸스티렌, 아크릴계 중합체, 상자성 재료, 토리아 졸, 탄소 흑연, 이산화티타늄, 라텍스 또는 가교된 덱스트란, 예컨대 세파로스, 셀룰로스, 나일론, 가교된 마이셀 및 테플론을 포함할 뿐만 아니라 고체 지지체에 대해 본원에 약술된 임의의 다른 재료가 모두 사용될 수 있다. Bangs Laboratories, Fishers Ind.로부터의 "미세구 선택 가이드"는 도움이 되는 가이드이다. 특정 실시형태에서, 미세구는 자성 미세구 또는 비드이다.
비드는 구형일 필요는 없으며; 불규칙한 입자가 사용될 수 있다. 대안적으로 또는 추가적으로, 비드는 다공성일 수 있다. 비드 크기는 나노미터, 즉, 100 nm 내지 밀리미터, 즉, 1 mm의 범위이며, 비드는 0.2 마이크론 내지 200 마이크론, 또는 0.5 내지 5 마이크론이되, 일부 실시형태에서는, 더 작거나, 더 큰 비드가 사용될 수 있다.
이들 표면에 결합된 트랜스포좀의 밀도는 제1 폴리뉴클레오티드의 밀도를 변경하는 것에 의해 또는 고체 지지체에 첨가되는 트랜스포사제의 양에 의해 조절될 수 있다. 예를 들어, 일부 실시형태에서, 트랜스포좀 복합체는 ㎟당 적어도 103, 104, 105, 또는 106개의 복합체의 밀도로 고체 지지체 상에 존재한다.
강성 또는 반-강성(semi-rigid)인지 여부와 상관 없이, 지지체에 대한 핵산의 부착은 공유 또는 비-공유 결합(들)을 통해 발생할 수 있다. 예시적 연결은 미국 특허 제6,737,236호; 제7,259,258호; 제7,375,234호, 및 제7,427,678호; 및 미국 특허출원공개 US 2011/0059865 A1호에 제시되어 있으며, 이들 각각은 본원에 인용되어 포함된다. 일부 실시형태에서, 핵산 또는 다른 반응 구성요소는 겔 또는 다른 반고체 지지체(semisolid support)에 부착될 수 있으며, 이는 차례로 고체상 지지체에 부착 또는 접착된다. 이러한 실시형태에서, 핵산 또는 다른 반응 구성요소는 고체상인 것으로 이해될 것이다.
일부 실시형태에서, 고체 지지체는 마이크로입자, 비드, 평면형 지지체, 패턴화 표면, 또는 웰을 포함한다. 일부 실시형태에서, 평면형 지지체는 튜브의 내부 또는 외부 표면이다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 태그화 DNA 단편들의 라이브러리가 제작되어 있다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 포획 올리고뉴클레오티드 및 제1 폴리뉴클레오티드를 포함하며, 제1 폴리뉴클레오티드는 트랜스포존 말단 서열을 포함하는 3' 부분 및 제1 태그를 포함한다.
일부 실시형태에서, 고체 지지체는 제1 폴리뉴클레오티드에 결합된 트랜스포사제를 추가로 포함하여 트랜스포좀 복합체를 형성한다.
일부 실시형태에서, 고체 지지체는 상부에 고정된 포획 올리고뉴클레오티드 및 제2 폴리뉴클레오티드를 포함하며, 제2 폴리뉴클레오티드는 트랜스포존 말단 서열을 포함하는 3' 부분 및 제2 태그를 포함한다.
일부 실시형태에서, 고체 지지체는 제2 폴리뉴클레오티드에 결합된 트랜스포사제를 추가로 포함하여 트랜스포좀 복합체를 형성한다.
일부 실시형태에서, 키트는 본원에 기재된 고체 지지체를 포함한다. 일부 실시형태에서, 키트는 트랜스포사제를 추가로 포함한다. 일부 실시형태에서, 키트는 역전사효소 중합효소를 추가로 포함한다. 일부 실시형태에서, 키트는 DNA를 고정시키기 위한 제2 고체 지지체를 추가로 포함한다.
국제 공개 WO 2018/156519호에 기재된 것들과 같은 트랜스포좀 복합체를 고정시키는 광범위하게 다양한 상이한 수단이 기재되었으며, 상기 특허는 그 전체 내용이 본원에 인용되어 포함된다. 일부 실시형태에서, 표적화된 트랜스포좀 복합체 내에 포함된 제1 트랜스포존은 친화성 요소를 포함한다. 일부 실시형태에서, 친화성 요소는 제1 트랜스포존의 5' 말단에 부착된다. 일부 실시형태에서, 제1 트랜스포존은 링커를 포함한다. 일부 실시형태에서, 링커는 제1 트랜스포존의 5' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 제1 트랜스포존 말단 서열의 적어도 일부에 상보적인 제2 트랜스포존을 추가로 포함한다. 일부 실시형태에서, 제2 트랜스포존은 친화성 요소를 포함한다. 일부 실시형태에서, 친화성 요소는 제2 트랜스포존의 3' 말단에 부착된다. 일부 실시형태에서, 제2 트랜스포존은 링커를 포함한다. 일부 실시형태에서, 링커는 제2 트랜스포존의 3' 말단에 부착된 제1 말단 및 친화성 요소에 부착된 제2 말단을 갖는다.
일부 실시형태에서, 친화성 요소는 비오틴이다.
C. 용액상 트랜스포좀 복합체
표적화된 트랜스포좀 복합체는 용액상 트랜스포좀 복합체일 수 있다. 이들 용액상 트랜스포좀 복합체는 이동성이며, 고체 지지체에 고정되지 않을 수 있다. 일부 실시형태에서, 용액상 표적화된 트랜스포좀 복합체를 사용하여 용액 중에 태그화 단편을 생성한다.
또한, 본 방법은 용액상 트랜스포좀 복합체를 수반하는 단계를 포함할 수 있다. 예를 들어, 본원에 제시된 방법은 용액 중의 트랜스포좀 복합체를 제공하는 단계 및 DNA가 트랜스포좀 복합체 용액에 의해 단편화되는 조건 하에서 용액상 트랜스포좀 복합체를 고정된 단편과 접촉시키는 단계를 추가로 포함할 수 있으며; 이로 인해, 일 말단을 갖는 고정된 핵산 단편을 용액 중에 수득한다. 일부 실시형태에서, 용액 중의 트랜스포좀 복합체는 제2 태그를 포함하여 본 방법이 제2 태그를 갖는 고정된 핵산 단편을 생성할 수 있도록 하며, 제2 태그는 용액 중에 존재한다. 제1 및 제2 태그들은 상이하거나, 동일할 수 있다.
일부 실시형태에서, 본 방법은 DNA 단편이 용액상 트랜스포좀 복합체에 의해 추가로 단편화되는 조건 하에서 용액상 트랜스포좀 복합체를 고정된 DNA 단편과 접촉시키는 단계를 추가로 포함하며; 일 말단을 갖는 고정된 핵산 단편을 용액 중에 수득한다.
일부 실시형태에서, 용액상 트랜스포좀 복합체는 제2 태그를 포함함으로써, 제2 태그를 갖는 고정된 핵산 단편을 용액 중에 생성한다. 일부 실시형태에서, 제1 태그 및 제2 태그는 상이하다. 일부 실시형태에서, 용액상 트랜스포좀 복합체의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%는 제2 태그를 포함한다.
일부 실시형태에서, 표면 결합된 트랜스포좀의 일 형태는 주로 고체 지지체 상에 존재한다. 예를 들어, 일부 실시형태에서, 상기 고체 지지체 상에 존재하는 태그의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%는 동일한 태그 도메인을 포함한다. 이러한 실시형태에서, 표면 결합된 트랜스포좀과 초기 태그먼트화 반응 후, 브릿지 구조(bridge structure)의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99는 브릿지의 각각의 말단에서 동일한 태그 도메인을 포함한다. 제2 태그먼트화 반응은 브릿지를 추가로 단편화하는, 용액으로부터의 트랜스포좀을 첨가함으로써 수행될 수 있다. 일부 실시형태에서, 용액상 트랜스포좀의 대부분 또는 전부는 제1 태그먼트화 반응에서 생성된 브릿지 구조 상에 존재하는 태그 도메인과 상이한 태그 도메인을 포함한다. 예를 들어, 일부 실시형태에서, 용액상 트랜스포좀 내에 존재하는 태그의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99%는 제1 태그먼트화 반응에서 생성된 브릿지 구조 상에 존재하는 태그 도메인과 상이한 태그 도메인을 포함한다.
일부 실시형태에서, 주형의 길이는 표준 클러스터 화학을 사용하여 적합하게 증폭될 수 있는 것보다 더 길다. 예를 들어, 일부 실시형태에서, 주형의 길이는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1100 bp, 1200 bp, 1300 bp, 1400 bp, 1500 bp, 1600 bp, 1700 bp, 1800 bp, 1900 bp, 2000 bp, 2100 bp, 2200 bp, 2300 bp, 2400 bp, 2500 bp, 2600 bp, 2700 bp, 2800 bp, 2900 bp, 3000 bp, 3100 bp, 3200 bp, 3300 bp, 3400 bp, 3500 bp, 3600 bp, 3700 bp, 3800 bp, 3900 bp, 4000 bp, 4100 bp, 4200 bp, 4300 bp, 4400 bp, 4500 bp, 4600 bp, 4700 bp, 4800 bp, 4900 bp, 5000 bp, 10000 bp, 30000 bp, 또는 100,000 bp이다. 이러한 실시형태에서, 그 때의 제2 태그먼트화 반응은 미국 특허 제9683230호에 기재된 바와 같이 브릿지를 추가로 단편화하는, 용액으로부터의 트랜스포좀을 첨가함으로써 수행될 수 있으며, 상기 특허는 그 전체 내용이 본원에 포함된다. 따라서, 제2 태그먼트화 반응은 브릿지의 내부 경간(internal span)을 제거하여 추가의 시퀀싱 단계를 위해 준비된 클러스터로 전환될 수 있는 표면에 고정된 짧은 스텀프(stump)를 남길 수 있다. 특정 실시형태에서, 주형의 길이는 상기 예시된 것들로부터 선택되는 상한 및 하한에 의해 정의되는 범위 내에 존재할 수 있다.
D. 어댑터 및 태그
일부 실시형태에서, 제1 트랜스포존은 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함한다. 일부 실시형태에서, 5' 어댑터 서열은 태그 서열이다. 3' 트랜스포존 말단 서열 및 5' 태그를 포함하는 제1 트랜스포존을 포함하는 트랜스포좀 복합체에 의해 매개된 단편화가 태그화된 단편들의 라이브러리를 생성하는 방법에서 사용될 수 있다.
일부 실시형태에서, 어댑터 서열은 프라이머 서열, 인덱스 태그 서열, 포획 서열, 바코드 서열, 절단 서열, 또는 시퀀싱-관련 서열, 또는 이의 조합을 포함한다. 본원에 사용된 시퀀싱-관련 서열은 나중의 시퀀싱 단계와 관련된 임의의 서열일 수 있다. 시퀀싱-관련 서열은 다운스트림 시퀀싱 단계를 단순화하기 위해 작동할 수 있다. 예를 들어, 시퀀싱-관련 서열은 어댑터를 핵산 단편에 리게이션하는 단계를 통해 달리 혼입될 서열일 수 있다. 일부 실시형태에서, 어댑터 서열은 특정 시퀀싱 방법에서 플로우셀에 대한 결합이 용이하도록 P5 또는 P7 서열(또는 이들의 상보체)을 포함한다.
본원에 사용된 용어 "태그"는 소기의 의도된 목적 또는 적용을 위한 서열을 나타내는 폴리뉴클레오티드의 일부 또는 도메인을 지칭한다. 태그 도메인은 임의의 소기의 목적을 위해 제공되는 임의의 서열을 포함할 수 있다. 예를 들어, 일부 실시형태에서, 태그 도메인은 하나 이상의 제한 엔도뉴클레아제 인식 부위를 포함한다. 일부 실시형태에서, 태그 도메인은 클러스터 증폭 반응을 위한 프라이머와의 혼성화에 적합한 하나 이상의 영역을 포함한다. 일부 실시형태에서, 태그 도메인은 시퀀싱 반응을 위한 프라이머와의 혼성화에 적합한 하나 이상의 영역을 포함한다. 임의의 다른 적합한 특징부가 태그 도메인 내에 혼입될 수 있음을 인식할 것이다. 일부 실시형태에서, 태그 도메인은 5 bp 내지 200 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 10 bp 내지 100 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 20 bp 내지 50 bp의 길이를 갖는 서열을 포함한다. 일부 실시형태에서, 태그 도메인은 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 또는 200 bp의 길이를 갖는 서열을 포함한다.
태그는 필요하거나, 원하는 하나 이상의 기능성 서열 또는 구성요소(예를 들어, 프라이머 서열, 앵커 서열(anchor sequence), 범용 서열(universal sequence), 스페이서 영역, 또는 인덱스 태그 서열)를 포함할 수 있다.
일부 실시형태에서, 태그는 클러스터 증폭을 위한 영역을 포함한다. 일부 실시형태에서, 태그는 시퀀싱 반응을 프라이밍하기 위한 영역을 포함한다.
일부 실시형태에서, 본 방법은 제1 트랜스포존의 일부에 상응하는 증폭 프라이머와 중합효소를 반응시킴으로써 고체 지지체 상의 단편을 증폭시키는 단계를 추가로 포함한다. 일부 실시형태에서, 제1 트랜스포존의 일부는 증폭 프라이머를 포함한다. 일부 실시형태에서, 제1 트랜스포존의 태그는 증폭 프라이머를 포함한다.
일부 실시형태에서, 태그는 A14 프라이머 서열을 포함한다. 일부 실시형태에서, 태그는 B15 프라이머 서열을 포함한다.
일부 실시형태에서, 개별 비드 상의 트랜스포좀은 고유한 인덱스를 가지며, 이러한 다수의 인덱스화 비드가 이용되는 경우, 위상화 전사물(phased transcript)이 수득될 것이다.
E. 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 표적화 올리고뉴클레오티드를 포함한다. 본원에 사용된 "표적화 올리고뉴클레오티드"는 하나 이상의 관심 핵산 서열에 결합할 수 있는 올리고뉴클레오티드이다. 일부 실시형태에서, 표적화 올리고뉴클레오티드는 재조합효소로 코팅된다. 표적화 올리고뉴클레오티드는 표적 핵산 내의 하나 이상의 관심 핵산 서열에 대한 트랜스포좀 복합체의 결합을 유도하는 데 사용될 수 있다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 트랜스포사제, 3' 트랜스포존 말단 서열, 5' 어댑터 서열, 및 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 제1 트랜스포존 - 여기서 표적화 올리고뉴클레오티드는 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적이다.
1. 표적화 올리고뉴클레오티드
표적화 올리고뉴클레오티드는 표적 핵산 내의 하나 이상의 관심 핵산 서열에 대해 친화성을 갖는 임의의 유형의 핵일 수 있다. 일부 실시형태에서, 표적화 올리고뉴클레오티드는 표적 핵산 내에 포함된 서열에 대한 상보적 서열을 기반으로 표적 핵산에 혼성화할 수 있다.
일부 실시형태에서, 표적화 올리고뉴클레오티드는 표적 핵산 내에 포함된 하나 이상의 서열에 완전히 또는 일부 상보적인 핵산 서열을 포함한다. 일부 실시형태에서, 표적화 올리고뉴클레오티드의 서열은 하나 이상의 관심 핵산 서열에 완전히 또는 일부 상보적이다.
일부 실시형태에서, 표적화 올리고뉴클레오티드는 표적 핵산 내에 포함된 서열에 대해 80%, 85%, 90%, 95%, 97%, 99%, 또는 100% 상보적이다.
당업자는 표적 핵산 내의 관심 핵산 서열에 결합하는 표적화 올리고뉴클레오티드를 개발하기 위해 임의의 수의 서열 데이터베이스를 사용할 수 있다. 예를 들어, 당업자는 소정의 유전자 내의 관심 핵산 서열을 선택하며, 관심 서열에 상보적인 표적화 올리고뉴클레오티드를 개발할 수 있다. 이러한 방식으로, 트랜스포좀 복합체는 소정의 유전자에 표적화될 것이다.
일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드는 어댑터 서열의 5' 말단에 연결된다. 일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드는 어댑터 서열의 5' 말단에 직접적으로 연결된다. 일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드는 링커를 통해 어댑터 서열의 5' 말단에 연결된다. 일부 실시형태에서, 링커는 올리고뉴클레오티드 링커이다. 일부 실시형태에서, 링커는 비-올리고뉴클레오티드 링커이다. 일부 실시형태에서, 어댑터 서열의 5' 말단 및 표적화 올리고뉴클레오티드는 둘 모두 비오틴화되고, 스트렙타비딘을 통해 연결된다.
2. 재조합효소
재조합효소는 핵산의 가닥 침입을 매개할 수 있다. 이러한 가닥 침입은 이중 가닥화 표적 DNA와 같은 이중 가닥화 핵산 내로의 재조합효소의 침입일 수 있다.
표적화 올리고뉴클레오티드를 재조합효소로 코팅함으로써, 이들 코팅된 올리고뉴클레오티드는 이중 가닥화 핵산의 가닥 침입을 매개한 다음, 하나 이상의 관심 핵산 서열에 대한 표적화 올리고뉴클레오티드의 결합이 이어질 수 있다. 올리고뉴클레오티드의 이중 가닥화 표적 핵산 내로의 재조합효소-매개 삽입은 가닥 침입 기반 증폭(SIBA, 예를 들어 문헌[Hoser et al. PLoS ONE 9(11): e112656] 참조)에 문서화되었다. 재조합효소는 이중 가닥화 핵산의 듀플렉스 영역을 해리시켜서 표적 핵산의 단일 가닥화 영역에 표적화 올리고뉴클레오티드가 결합되도록 할 수 있다. 도 9에 나타낸 바와 같이, 재조합효소-코팅된 표적화 올리고뉴클레오티드의 결합은 트랜스포좀을 표적 핵산 내의 관심 영역에 국소화시킬 수 있다.
일부 실시형태에서, 재조합효소는 UVSX, Rec233, 또는 RecA이다.
F. 촉매적으로 비활성인 엔도뉴클레아제를 포함하는 표적화된 트랜스포좀 복합체
표적화된 트랜스포좀 복합체가 본원에 기재되어 있으며, 상기 복합체는 촉매적으로 비활성인 엔도뉴클레아제를 포함한다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포좀 복합체를 표적화하는 역할을 한다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 촉매적으로 비활성인 엔도뉴클레아제를 포함한다. 본원에 사용된 "촉매적으로 비활성인 엔도뉴클레아제"는 핵산에 결합할 수 있지만, 절단을 매개하지는 않는 엔도뉴클레아제이다(이는 엔도뉴클레아제가 임의의 절단 활성을 갖지 않는 것을 의미할 수 있거나, 엔도뉴클레아제가 오직 최소의 절단 활성을 가져서 절단에 의해 손실되는 핵산의 양이 실질적으로 태그먼트화를 방해하지 않음을 의미할 수 있음). 촉매적으로 비활성인 엔도뉴클레아제는 또한 비활성화 엔도뉴클레아제(예컨대, "dCas" 단백질)로 지칭될 수 있다. 예시적인 촉매적으로 비활성인 엔도뉴클레아제는 도 11에 나타낸 dCas9이다. 보통, 엔도뉴클레아제는 핵산에 결합하고, 절단을 매개할 수 있다. 따라서, 촉매적으로 비활성인 엔도뉴클레아제는 절단 활성을 갖지 않으면서 핵산 결합 기능을 보유하는 것이다. 촉매적으로 비활성인 엔도뉴클레아제를 사용하여 트랜스포좀 복합체를 표적 핵산 내의 하나 이상의 관심 핵산 서열로 표적화할 수 있다. 대표적인 촉매적으로 비활성인 Cas9 단백질은 미국 특허 제10457969호에 개시된 것들을 포함하며, 이는 그 전체 내용이 본원에 포함된다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포존 말단 서열, 5' 어댑터 서열, 및 가이드 RNA와 회합된 촉매적으로 비활성인 엔도뉴클레아제를 포함하는 제1 트랜스포존 - 여기서 가이드 RNA는 엔도뉴클레아제를 하나 이상의 관심 핵산 서열에 결합하도록 유도할 수 있음 -; 및 상기 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존을 포함한다.
본원에 사용된 "가이드 RNA"는 표적 핵산에 대한 엔도뉴클레아제의 결합에 특이성을 부여하는 RNA 서열이다. 촉매적으로 비활성인 엔도뉴클레아제는 가이드 RNA에 의해 하나 이상의 관심 핵산 서열에 표적화될 수 있다.
다양한 가이드 RNA가 촉매적으로 비활성인 엔도뉴클레아제와 함께 사용될 수 있다. 일부 실시형태에서, 가이드 RNA는 트랜스-활성화 CRISPR RNA(tracrRNA) 및 CRISPR RNA(crRNA)를 포함한다. 일부 실시형태에서, 가이드 RNA는 오직 tracrRNA를 포함한다. 일부 실시형태에서, 가이드 RNA는 tracrRNA 및 crRNA 둘 모두를 포함하는 단일 가이드 RNA(또는 sgRNA)이다.
당업자는 입수 가능한 다수의 설계 도구(예컨대, Synthego 또는 Benchling로부터 입수 가능한 것들) 중 하나를 사용하여 하나 이상의 관심 서열에 결합하는 특이성을 갖는 가이드 RNA를 개발할 수 있다. 가이드 RNA의 선택은 또한 표적 핵산 내의 프로토스페이서 인접 모티프(PAM)의 존재를 기반으로 하지만; 설계된 가이드 RNA에서 보다 큰 유연성을 허용하는 최소 PAM 특이성을 갖는 엔도뉴클레아제가 기재되었다(도 13에 나타낸 바와 같음).
본원에 기재된 단일 가이드 RNA 서열은 트랜스포존을 또한 포함하는 올리고뉴클레오티드 내에 포함될 수 있다. 이러한 올리고뉴클레오티드의 개발은 표준 분자 생물학 기술을 사용하여 수행될 수 있다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제와 회합된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제에 연결된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제에 직접적으로 또는 간접적으로 연결된다.
일부 실시형태에서, 트랜스포사제 및 촉매적으로 비활성인 엔도뉴클레아제는 CRISPR-회합된 트랜스포사제 내에 포함된다. 본원에 사용된 "CRISPR-회합된 트랜스포사제"는 엔도뉴클레아제 및 트랜스포사제를 포함하는 다중-단백질 복합체를 지칭한다.
Tn7-유사 트랜스포존이 공동-선택된 뉴클레아제 결핍 CRISPR-Cas 시스템을 가져서 CRISPR-회합된 트랜스포사제를 생성하는 다른 시스템이 또한 기재되었다(문헌[Klompe et al., Nature 571:219-225 (2019)] 참조). 본원에 기재된 표적화된 트랜스포좀은 임의의 유형의 CRISPR-Cas 시스템을 포함할 수 있다.
촉매적으로 비활성인 엔도뉴클레아제는 또한 다수의 상이한 방식으로 트랜스포사제에 연결될 수 있다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제의 5' 말단에 연결된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 트랜스포사제의 3' 말단에 연결된다. 일부 실시형태에서, 트랜스포사제는 촉매적으로 비활성인 엔도뉴클레아제의 5' 말단에 연결된다. 일부 실시형태에서, 트랜스포사제는 촉매적으로 비활성인 엔도뉴클레아제의 3' 말단에 연결된다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 도 12a에 나타낸 바와 같이 융합 단백질 내에 포함된다. 융합 단백질이란, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제가 단일 단백질 내에 포함됨을 의미한다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제를 포함하는 융합 단백질은 핵산 구조물을 사용하는 단일 단백질이 숙주 세포에 의해 발현되는 바와 같이 발현된다.
일부 실시형태에서, 촉매적으로 비활성인 및 트랜스포사제는 직접적으로 연결된다. 일부 실시형태에서, 촉매적으로 비활성인 및 트랜스포사제는 링커를 통해 연결된다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 별개의 단백질 내에 포함된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 숙주 세포 내의 별개의 단백질로서 발현된다.
일부 실시형태에서, 별개의 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제는 결합 파트너의 페어링을 통해 함께 회합될 수 있으며, 여기서, 제1 결합 파트너는 촉매적으로 비활성인 엔도뉴클레아제에 결합되고, 제2 결합 파트너는 트랜스포사제에 결합된다. 일부 실시형태에서, 결합 파트너는 도 12b에 나타낸 바와 같이 비오틴 및 스트렙타비딘/아비딘이다.
일부 실시형태에서, sgRNA는 제1 및/또는 제2 트랜스포존을 포함하는 올리고뉴클레오티드 내에 포함된다. 일부 실시형태에서, 상기 올리고뉴클레오티드는 5' 단일 가이드 RNA 및 3' 제1 및/또는 제2 트랜스포존을 포함한다. 일부 실시형태에서, sgRNA 및 제1 및/또는 제2 트랜스포존은 상보적 서열의 페어링을 통해 서로 회합된다(도 12c). 일부 실시형태에서, sgRNA 및 제1 및/또는 제2 트랜스포존은 별개의 올리고뉴클레오티드 내에 포함된다. 일부 실시형태에서, sgRNA는 연속적 sgRNA-전이 가닥 올리고뉴클레오티드 내에 포함된다(도 12d).
촉매적으로 비활성인 엔도뉴클레아제의 특이성을 증가시키는 다수의 상이한 수단은 도 12a 내지 도 12d 및 도 13에서 보여준다. 촉매적으로 비활성인 엔도뉴클레아제의 특이성을 증가시키는 임의의 수단은 또한 촉매적으로 활성 엔도뉴클레아제의 특이성을 증가시키는 데 사용될 수 있다.
일부 실시형태에서, 단일 가이드 RNA는 20개 미만의 뉴클레오티드(예컨대, 도 12b에서 17개의 뉴클레오티드를 갖는 실시형태 또는 도 13에서 18개의 뉴클레오티드를 갖는 실시형태)를 포함한다. 20개 미만의 뉴클레오티드를 포함하는 이러한 단일 가이드 RNA는 단축된 가이드 RNA로 지칭될 수 있다. 일부 실시형태에서, 단일 가이드 RNA 서열은 15, 16, 17, 18, 또는 19개의 뉴클레오티드를 포함한다. 보다 짧은 단일 가이드 RNA는 sgRNA의 서열에 완전히 또는 고도로 상보적이지 않는 표적 핵산 내의 서열에 대한 단일 가이드 RNA의 결합 가능성을 감소시킨다.
일부 실시형태에서, 단일 가이드 RNA는 헤어핀 2차 구조를 포함한다(문헌[Kocak et al., Nat Biotechnol. 37(6): 657-666 (2019)]). 일부 실시형태에서, 헤어핀 2차 구조는 토홀드-차단된 가이드 RNA와 같은 트리거 가닥(trigger strand)의 부재 하에 표적 핵산에 대한 결합을 차단하는 데 사용된다(문헌[Siu et al. Nat Chem Biol 15(3):217-220 (2019)]).
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 Cas9 단백질(비활성화된Cas9 또는 dCas9로 지칭될 수 있음)이다. 광범위하게 다수의 상이한 Cas9 단백질이 본원에 기재된 표적화된 트랜스포좀 복합체 내에 포함될 수 있다. 또한, 당업자는 엔도뉴클레아제의 촉매 도메인을 인식할 수 있을 것이며, 야생형 엔도뉴클레아제로부터 촉매적으로 비활성인 엔도뉴클레아제를 생성하도록 돌연변이를 설계할 수 있을 것이다(문헌[Maeder et al., Nat Methods 10(10): 977-979 (2013)] 참조). 이러한 설계된 촉매적으로 비활성인 엔도뉴클레아제는 이의 절단 활성의 결여를 확인하기 위해 시험될 수 있다.
일부 실시형태에서, Cas9 단백질은 도 13에 나타낸 연쇄상구균 카니스 Cas9이다. 일부 실시형태에서, 연쇄상구균 카니스 Cas9는 최소 서열 제약을 갖는다(문헌[Chatterjee et al., Sci. Adv. 4:eaau0766 (2018)] 참조). 일부 실시형태에서, 연쇄상구균 카니스 Cas9는 가이드 RNA에 결합할 수 있는 표적 핵산 내의 서열에 근접한 특정 프로토스페이서 인접 모티프(PAM)에 대한 감소된 요건을 갖는다. 예를 들어, 연쇄상구균 카니스 Cas9는 NRG PAM 서열 대신에 NNG PAM 서열이 필요할 수 있으며(도 13에 나타낸 바와 같음), 이는 특정 PAM에 대한 요건을 감소시키고, 가이드 RNA에 결합하기 위한 관심 서열을 선택하는 능력을 증가시킨다. 최소 서열 제약을 갖는 엔도뉴클레아제의 보다 낮은 서열 제약은 개선된 표적 설계 공간을 허용할 수 있으며, 이는 표적 핵산 내의 관심 서열에 근접한 특정 PAM 서열에 대한 요건을 낮추기 때문이다.
일부 실시형태에서, CRISPR-회합된 트랜스포사제는 시아노박테리아 사이토네마 호프마니(ShCAST)로부터 유래된다. ShCAST는 Tn7-유사 트랜스포사제 하위유닛 및 유형 V-K CRISPR 이펙터(Cas12k)에 의해 매개되는 RNA-유도(sgRNA) DNA-전위를 위한 4-단백질 시스템이다(Strecker의 도 5에서 보여주는 실시형태를 포함하여 문헌[Strecker et al., Science. 365(6448): 48-53 (2019)]을 참조하며, 이들 모두는 ShCAST에 관한 교시를 위해 인용되어 포함됨). 이는 Tn7-유사 트랜스포존 및 CRISPR-Cas 시스템을 포함하는 이들 시스템이 CRISPR 이펙터를 이용하여 표적 부위에서 R-루프를 생성하며, 플라스미드 및 파지를 통한 트랜스포존의 확산이 용이하도록 할 수 있음을 시사하였다. ShCAST는 RNA-가이드된 Tn7-유사 트랜스포존을 통해 표적 핵산에서의 고유한 부위 내로의 삽입을 일으킬 수 있다. 따라서, 일부 실시형태에서, 표적화된 트랜스포좀 복합체는 표적화된 전위가 가능하도록 ShCAST 내에 촉매적으로 비활성인 엔도뉴클레아제 및 트랜스포사제를 포함한다.
1. Cas 엔도뉴클레아제를 포함하는 표적화된 트랜스포좀 복합체
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 Cas 엔도뉴클레아제를 포함한다.
본원에 사용된 "CRISPR-Cas 시스템", "Cas-gRNA 리보핵산단백질", 및 Cas-gRNA RNP와 같은 용어는 표적 핵산 내의 서열에 상보적이거나, 실질적으로 상보적인 올리고뉴클레오티드 서열을 포함하는 가이드 RNA(gRNA) 서열 및 Cas 단백질을 포함하는 효소 시스템을 지칭한다. CRISPR-Cas 시스템은 일반적으로 코어 요소 함량 및 서열을 기반으로 10개의 하위유형으로 추가로 세분되는 3개의 주요 유형으로 분류될 수 있으며; 예를 들어, 문헌[Makarova et al., "Evolution and classification of the CRISPR-Cas systems," Nat Rev Microbiol. 9(6): 467-477 (2011)]을 참조한다. Cas 단백질은 다양한 활성, 예를 들어 뉴클레아제 활성을 가질 수 있다. 따라서, CRISPR-Cas 시스템은 (예를 들어, gRNA를 통해) 특정 서열 뿐만 아니라 (예를 들어, Cas 단백질을 통해) 서열 상의 특정 효소 활성을 표적화하기 위한 메커니즘을 제공한다.
유형 I CRISPR-Cas 시스템은 별개의 헬리카제 및 DNase 활성을 갖는 Cas3 단백질을 포함할 수 있다. 예를 들어, 유형 1-E 시스템에서, crRNA는 표적 DNA에 결합하며, Cas3 단백질에 의한 분해를 유발하는 캐스케이드(항바이러스 방어를 위한 CRISPR-회합 복합체)라 불리는 다중 하위유닛 이펙터 복합체 내로 혼입되며; 예를 들어, 문헌[Brouns et al., "Small CRISPR RNAs guide antiviral defense in prokaryotes," Science 321(5891): 960-964 (2008)]; 문헌[Sinkunas et al., "Cas3 is a single-stranded DNA nuclease and ATP-dependent helicase in the CRISPR-Cas immune system," EMBO J 30:1335-1342 (2011)]; 및 문헌[Beloglazova et al., "Structure and activity of the Cas3 HD nuclease MJ0384, an effector enzyme of the CRISPR interference, EMBO J 30:4616-4627 (2011)]을 참조한다. 유형 II CRISPR-Cas 시스템은 crRNA를 생성하며, 표적 DNA를 절단할 수 있는 단일 단백질(약 160 KDa), 시그니처 Cas9 단백질을 포함한다. Cas9 단백질은 전형적으로 2개의 뉴클레아제 도메인, 아미노 말단 근처의 RuvC-유사 뉴클레아제 도메인, 및 단백질의 중간 근처의 HNH(또는 McrA-유사) 뉴클레아제 도메인을 포함한다. Cas9 단백질의 각각의 뉴클레아제 도메인은 이중 헬릭스의 일 가닥을 절단하도록 특화되며; 예를 들어, 문헌[Jinek et al., "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity, Science 337(6096): 816-821 (2012)]을 참조한다. 유형 III CRISPR-Cas 시스템은 중합효소 및 RAMP 모듈을 포함한다. 유형 III 시스템은 하위유형 III-A 및 III-B로 추가로 분할될 수 있다. 유형 III-A CRISPR-Cas 시스템은 플라스미드를 표적화하는 것으로 나타났으며, 유형 III-A 시스템의 중합효소-유사 단백질은 표적 DNA의 절단에 관여하고; 예를 들어, 문헌[Marraffini et al., "CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA," Science 322(5909):1843-1845 (2008)]을 참조한다. 유형 III-B CRISPR-Cas 시스템이 또한 RNA를 표적화하는 것으로 나타났으며; 예를 들어, 문헌[Hale et al., "RNA-guided RNA cleavage by a CRISPR-RNA-Cas protein complex," Cell 139(5): 945-956 (2009)]을 참조한다. CRISPR-Cas 시스템은 자연적으로 축적되는 CRISPR-Cas 시스템으로부터 유래되는, 조작처리되고/되거나 프로그래밍된 뉴클레아제 시스템을 포함한다. CRISPR-Cas 시스템은 조작처리되고/되거나 돌연변이된 Cas 단백질을 포함할 수 있다. CRISPR-Cas 시스템은 조작처리되고/되거나 프로그래밍된 가이드 RNA를 포함할 수 있다.
일부 실시형태에서, 본 Cas-gRNA RNP 중 하나에서의 Cas 단백질은 다음 참조문헌에 기재된 바와 같은 방식으로 gRNA에 상보적인 서열에서 표적 핵산을 절단할 수 있는 Cas9 또는 다른 적합한 Cas를 포함할 수 있으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Nachmanson et al., "Targeted genome fragmentation with CRISPR/Cas9 enables fast and efficient enrichment of small genomic regions and ultra-accurate sequencing with low DNA input (CRISPR-DS)," Genome Res. 28(10): 1589-1599 (2018)]; 문헌[Vakulskas et al., "A high-fidelity Cas9 mutant delivered as a ribonucleoprotein complex enables efficient gene editing in human hematopoietic stem and progenitor cells," Nature Medicine 24: 1216-1224 (2018)]; 문헌[Chatterjee et al., "Minimal PAM specificity of a highly similar SpCas9 ortholog," Science Advances 4(10): eaau0766, 1-10 (2018)]; 문헌[Lee et al., "CRISPR-Cap: multiplexed double-stranded DNA enrichment based on the CRISPR system," Nucleic Acids Research 47(1): 1-13 (2019)]. S. 써모필루스(S. thermophilus) CRISPR-Cas 시스템으로부터 단리된 Cas9-crRNA 복합체뿐만 아니라 별개의 구성요소로부터 시험관 내에서 조립된 복합체는 이것이 crRNA에 상보적인 뉴클레오티드 서열을 보유하는 플라스미드 DNA 및 합성 올리고데옥시뉴클레오티드 둘 모두에 결합하는 것을 입증한다. Cas9는 2개의 뉴클레아제 도메인- RuvC- 및 HNH-활성 부위/뉴클레아제 도메인을 가지며, 이들 2개의 뉴클레아제 도메인은 대향 DNA 가닥의 절단을 담당하는 것으로 밝혀졌다. 일부 예에서, Cas9 단백질은 S. 써모필루스 CRISPR-Cas 시스템의 Cas9 단백질로부터 유래된다. 일부 예에서, Cas9 단백질은 약 1,409개의 아미노산 잔기를 갖는 다중-도메인 단백질이다.
다른 실시형태에서, Cas는 gRNA가 상보적인 서열에서 표적 핵산을 절단하지 않도록 조작처리되어 예를 들어 다음 참조문헌에 기재된 방식으로 비활성화 Cas(dCas)를 제작할 수 있으며, 이들 전체 내용은 본원에 인용되어 포함된다: 문헌[Guilinger et al., "Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification," Nature Biotechnology 32: 577-582 (2014)]; 문헌[Bhatt et al., "Targeted DNA transposition using a dCas9-transposase fusion protein," https://doi.org/10.1101/571653, pages 1-89 (2019)]; 문헌[Xu et al., "CRISPR-assisted targeted enrichment-sequencing (CATE-seq)," available at URL www.biorxiv.org/content/10.1101/672816v1, 1-30 (2019)]; 및 문헌[Tijan et al., "dCas9-targeted locus-specific protein isolation method identifies histone gene regulators," PNAS 115(12): E2734-E2741 (2018)]. 뉴클레아제 활성이 결여된 Cas는 비활성화 Cas(dCas)로 지칭될 수 있다. 일부 실시형태에서, dCas는 Cas9 단백질의 뉴클레아제-비존재 변이체(nuclease-null variant)를 포함할 수 있으며, RuvC- 및 HNH-활성 부위/뉴클레아제 도메인은 둘 모두 돌연변이가 된다. Cas9 단백질의 뉴클레아제-비존재 변이체(dCas9)는 이중 가닥화 DNA에 결합하지만, DNA를 절단하지는 않는다. Cas9 단백질의 다른 변이체는 crRNA에 대해 상보적인 가닥을 절단하는 도메인에서의 제1 돌연변이 및 crRNA에 비-상보적인 가닥을 절단하는 도메인에서의 제2 돌연변이를 갖는 2개의 비활성화 뉴클레아제 도메인을 갖는다. 일부 실시형태에서, Cas9 단백질은 제1 돌연변이 D10A 및 제2 돌연변이 H840A를 갖는다.
일부 실시형태에서, Cas 단백질은 캐스케이드 단백질을 포함한다. 대장균 내의 캐스케이드 단백질은 서열-특이적 방식으로 이중 가닥화 DNA(dsDNA) 표적을 인식한다. 대장균 캐스케이드 복합체는 5개의 기능적으로 필수적인 CRISPR-회합된 (Cas) 단백질(CasA1B2C6D1E1, 캐스케이드 단백질로도 불림) 및 61개의 뉴클레오티드 crRNA를 포함하는 405-kDa 복합체이다. crRNA는 비상보적 가닥을 이동시켜서 R-루프를 형성하는 한편, 상보적 DNA 가닥과 염기쌍을 형성함으로써 캐스케이드 복합체를 dsDNA 표적 서열로 가이드한다. 캐스케이드는 ATP를 소비하지 않으면서 표적 DNA를 인식하고, 이는 연속적 침입자 DNA 감시(continuous invader DNA surveillance)가 에너지 투자 없이 발생함을 시사하며; 예를 들어, 문헌[Matthijs et al., "Structural basis for CRISPR RNA-guided DNA recognition by Cascade," Nature Structural & Molecular Biology 18(5): 529-536 (2011)]을 참조한다. 일부 실시형태에서, Cas 단백질은 Cas3 단백질을 포함한다. 예시적으로, 대장균 Cas3은 R-루프를 형성하는 DNA와 함께 RNA의 ATP-의존적 어닐링 및 RNA 염기쌍의 듀플렉스 DNA로의 혼성화를 촉매 작용할 수 있다. Cas3 단백질은 Cas9에 대한 gRNA보다 더 긴 gRNA를 사용할 수 있으며; 예를 들어, 문헌[Howard et al., "Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein," Biochem J. 439(1): 85-95 (2011)]을 참조한다. 이러한 더 긴 gRNA는 표적 DNA에 대한 다른 요소의 더 용이한 접근, 예를 들어 중합효소에 의해 연장되는 프라이머의 접근을 허용할 수 있다. Cas3 단백질에 의해 제공되는 다른 특성은 Cas3 단백질이 Cas9와 같이 PAM 서열을 필요로 하지 않으며, 따라서 소기의 서열을 표적화하는 데 더 많은 유연성을 제공한다는 것이다. Cas3에 의한 R-루프 형성은 마그네슘을 보조인자로서 이용할 수 있으며; 예를 들어, 문헌[Howard et al., "Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein," Biochem J. 439(1): 85-95 (2011)]을 참조한다. 양이온과 같은 임의의 적합한 보조인자가 본 조성물 및 방법에 사용되는 Cas 단백질과 함께 사용될 수 있음을 인식할 것이다.
이중 가닥화 폴리뉴클레오티드를 붕괴시키며, 루프 구조를 생성할 수 있는 임의의 CRISPR-Cas 시스템이 사용될 수 있음을 또한 인식해야 한다. 예를 들어, Cas 단백질은 다음 참조문헌에 기재된 것과 같은 Cas 단백질을 포함하지만, 이로 제한되지는 않으며, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Haft et al., "A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes," PLoS Comput Biol. 1(6): e60, 1-10 (2005)]; 문헌[Zhang et al., "Expanding the catalog of cas genes with metagenomes," Nucl. Acids Res. 42(4): 2448-2459 (2013)]; 및 문헌[Strecker et al., "RNA-guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)], 여기서, Cas 단백질은 Cas12k를 포함할 수 있음. 일부 이들 CRISPR-Cas 시스템은 표적 서열을 인식하고, 결합하기 위해 특정 서열을 이용할 수 있다. 예를 들어, Cas9는 5'-NGG 프로토스페이서-인접 모티프(PAM)의 존재를 이용할 수 있다.
CRISPR-Cas 시스템은 또한 조작처리되고/되거나 프로그래밍된 가이드 RNA(gRNA)를 포함할 수 있다. 본원에 사용된 용어 "가이드 RNA" 및 "gRNA"(그리고 때때로 당업계에서 단일 가이드 RNA 또는 sgRNA로 지칭됨)는 표적 DNA 서열의 영역에 상보적이거나, 실질적으로 상보적이며, Cas 단백질을 해당 영역으로 유도하는 서열을 포함하는 RNA를 의미하도록 의도된다. 가이드 RNA는 표적 DNA 서열의 영역에 상보적이거나, 실질적으로 상보적인 것 이외의 뉴클레오티드 서열을 포함할 수 있다. gRNA를 설계하기 위한 방법은 당업계에 잘 알려져 있으며, 비제한적 예는 다음 참조문헌에 제공되고, 이들 각각의 전체 내용은 본원에 인용되어 포함된다: 문헌[Stevens et al., "A novel CRISPR/Cas9 associated technology for sequence-specific nucleic acid enrichment," PLoS ONE 14(4): e0215441, pages 1-7 (2019)]; 문헌[Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs, Nature Biotechnology 32(3): 279-284 (2014)]; 문헌[Kocak et al., "Increasing the specificity of CRISPR systems with engineered RNA secondary structures," Nature Biotechnology 37: 657-666 (2019)]; 문헌[Lee et al., "CRISPR-Cap: multiplexed double-stranded DNA enrichment based on the CRISPR system," Nucleic Acids Research 47(1): e1, 1-13 (2019)]; 문헌[Quan et al., "FLASH: a next-generation CRISPR diagnostic for multiplexed detection of antimicrobial resistance sequences," Nucleic Acids Research 47(14): e83, 1-9 (2019)]; 및 문헌[Xu et al., "CRISPR-assisted targeted enrichment-sequencing (CATE-seq)," https://doi.org/10.1101/672816, 1-30 (2019)].
일부 실시형태에서, gRNA는 키메라, 예를 들어 트랜스-활성화 CRISPR RNA(tracrRNA)에 융합된 CRISPR RNA(crRNA)를 포함한다. 이러한 키메라 단일-가이드된 RNA(sgRNA)는 문헌[inek et al., "A programmable dual-RNA-guided endonuclease in adaptive bacterial immunity," Science 337 (6096): 816-821 (2012)]에 기재되어 있다. Cas 단백질은 키메라 sgRNA에 의해 임의의 게놈 유전자좌에 이어서 5'-NGG 프로토스페이서-인접 모티프(PAM)로 향할 수 있다. 일 비제한적 예에서, crRNA 및 tracrRNA는 T7 프로모터를 포함하는 합성 이중 가닥화 DNA 주형을 사용하여 시험관 내 전사에 의해 합성될 수 있다. tracrRNA는 고정된 서열을 가질 수 있는 반면, 표적 서열은 crRNA의 서열의 일부를 좌우할 수 있다. crRNA 및 tracrRNA의 동일한 몰농도가 혼합되고, 55℃에서 30초 동안 가열될 수 있다. Cas9는 37℃에서 동일한 몰농도로 첨가되고, RNA 혼합물과 함께 10분 동안 인큐베이션될 수 있다. 이어서, 수득된 Cas9-gRNA RNP의 10 내지 20배의 몰 과량이 표적 DNA에 첨가될 수 있다. 결합 반응은 15분 내에 발생할 수 있다. 다른 적합한 반응 조건이 용이하게 사용될 수 있다.
2. ShCAST를 포함하는 표적화된 트랜스포좀 복합체
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 ShCAST 내에 포함된다.
본원의 일부 예는 하나 이상의 관심 서열을 포함하는 표적 핵산(예컨대, 이중 가닥화 핵산)을 포함하는 조성물을 제공한다. 본 조성물은 가이드 RNA(gRNA)에 결합된 ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제)를 각각 포함하는 복수의 복합체를 포함할 수 있다. ShCAST는 이에 결합된 증폭 어댑터를 가질 수 있다. 각각의 복합체는 표적 핵산 내의 상응하는 하나의 하위서열(예컨대, 하나 이상의 관심 핵산 서열)에 혼성화될 수 있다. 이러한 복합체는 미국 임시 출원 제63/162,775호 및 미국 특허 제63/163,381호에 개시되어 있으며, 이들 각각은 그 전체 내용이 본원에 인용되어 포함된다.
일부 실시형태에서, 조성물은 (1) 하나 이상의 관심 핵산 서열을 포함하는 표적 핵산 및 (2) gRNA에 결합된 ShCAST를 각각 포함하는 본원에 기재된 복수의 표적화된 트랜스포좀 복합체를 포함하며, ShCAST는 이에 결합된 증폭 어댑터를 갖고, 각각의 표적화된 트랜스포좀 복합체는 관심 핵산 서열에 혼성화된다.
일부 실시형태에서, ShCAST는 촉매적으로 비활성인 엔도뉴클레아제(예컨대, Cas12K) 및 트랜스포사제(예컨대, Tn5)를 포함한다. 일부 양태에서, ShCAST에 의한 핵산의 절단은 1) 하나 이상의 관심 서열에 결합된 gRNA에 대한 촉매적으로 비활성인 엔도뉴클레아제의 회합을 기반으로 하는 핵산의 결합 및 2) 트랜스포사제에 의해 절단을 갖는 2단계 공정으로 간주될 수 있다. 일부 실시형태에서, 핵산에 대한 트랜스포사제의 비-특이적 결합을 제한하는 것은 표적화된 단편(즉, 촉매적으로 비활성인 엔도뉴클레아제와 gRNA의 회합 후의 절단으로부터 생성된 단편)의 제작 빈도를 증가시킨다.
일부 실시형태에서, 본 조성물은 하위서열에 대한 복합체의 혼성화를 촉진하고, 트랜스포사제의 결합을 억제하는 조건을 갖는 유체를 추가로 포함한다. 일부 예에서, 유체의 조건은 트랜스포사제의 활성을 위한 충분한 양의 마그네슘 이온의 부재를 포함한다.
트랜스포사제에 의한 결합을 억제함으로써, ShCAST에 의한 절단은 ShCAST 내에 포함된 Cas12K가 핵산 내의 관심 서열에 결합된 gRNA와 회합되는 부위로 제한된다. 이러한 방식으로, 비-특이적 절단(핵산에 대한 트랜스포사제의 비-특이적 결합으로 인함)이 제한되며, 핵산의 대부분의 절단은 관심 서열 내부 또는 그 근처의 부위에서 이루어진다.
일부 실시형태에서, 복합체 내에 포함된 트랜스포사제의 결합을 제한하기 위한 조건은 15 mM 이하의 마그네슘 농도 및/또는 50 nM 이하의 트랜스포사제의 농도를 갖는다. 트랜스포사제의 결합을 억제하는 이러한 조성물은 ShCAST 내에 포함된 트랜스포사제에 의한 비-특이적 절단을 억제하는 역할을 할 수 있으며, 대부분의 절단은 핵산 내의 관심 서열에 결합된 gRNA에 대한 CasK12의 결합을 기반으로 발생한다.
일부 예에서, 본 조성물은 트랜스포사제의 활성을 촉진하는 조건을 갖는 유체를 추가로 포함하며, 여기서, 트랜스포사제는 증폭 어댑터를 표적 핵산 내의 위치에 첨가한다. 일부 예에서, 상기 유체의 조건은 트랜스포사제의 활성을 위한 충분한 양의 마그네슘 이온의 존재를 포함한다. 트랜스포사제의 활성을 촉진하는 이러한 실시형태는 예컨대 태그먼트화에 의해, gRNA에 의해 결합된 관심 서열에서 또는 그 근처에서 단편을 제작하기 위한 것들일 수 있다. 이러한 조건은 15 mM 이상의 마그네슘 농도일 수 있다.
일부 실시형태에서, ShCAST는 Cas12K를 포함한다. 일부 실시형태에서, 트랜스포사제는 Tn5 또는Tn7-유사 트랜스포사제를 포함한다. 일부 실시형태에서, 어댑터는 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함한다. 일부 실시형태에서, 표적 핵산은 이중 가닥화 DNA를 포함한다.
일부 예에서, gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화된다. 본 조성물은 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나가 결합되는 스트렙타비딘-코팅된 비드를 추가로 포함할 수 있다.
예를 들어, 도 16a 및 도 16b는 ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제) 표적화된 라이브러리 제작 및 농축을 위한 예시 조성물 및 공정 흐름에서의 작업 과정을 개략적으로 예시한다. ShCAST(6000)는 RNA 가이드(6004)를 사용하여 DNA(6003)를 대장균 게놈 내의 특정 부위 내로 삽입할 수 있는 Cas12k(6001) 및 Tn7-유사 트랜스포사제(6002)를 포함한다. 본원에 제공된 일부 예는 특정 유전자의 표적화된 증폭을 위해 Tn5 트랜스포사제를 혼입하는 ShCAST의 변형된 버전(ShCAST-Tn5) 또는 ShCAST를 이용한다. 이와 같이, 라이브러리 제작 및 농축 단계가 조합되며, 따라서 표적 라이브러리 시퀀싱 작업 흐름의 효율을 단순화하고, 개선하며, 자동화가 용이하도록 한다.
예시적으로, gRNA(6004)는 특정 유전자(서열)를 표적화하도록 설계될 수 있으며, gRNA들의 간격은 삽입 크기를 제어할 수 있다. 일부 예에서, gRNA(6004) 및/또는 ShCAST/ShCAST-Tn5(6002)는 태그(6005)에 결합될 수 있으며, 예를 들어 비오틴화될 수 있다. 도 16a에 예시된 바와 같은 방식으로, gRNA(6004) 및 어댑터(6003)(예를 들어, Illumina 어댑터)를 갖는 전이성 인자는 ShCAST의 트랜스포사제(6002) 상에 로딩되어 복합체(6000)를 수득할 수 있다. 도 16b의 공정 흐름(6010)에 예시된 바와 같은 방식으로, 수득된 ShCAST/ShCAST-Tn5 복합체(6000)는 태그먼트화를 억제하는 유체 조건 하에서(예를 들어, 낮은 마그네슘 또는 무-마그네슘) 게놈 DNA(표적 핵산)(6011)와 혼합될 수 있는 한편, 복합체를 표적 DNA 내의 각각의 서열에 결합되도록 한다. 이어서, 복합체는 태그화(예를 들어, 비오틴화) gRNA 및/또는 ShCAST/ShCAST-Tn5가 결합되는 스트렙타비딘 비드(6012)와 같은 태그 파트너에 결합된 기재를 사용하여 단리될 수 있다. 임의의 결합되지 않은 DNA는 예를 들어 표적외 태그먼트화(off-target tagmentation)를 감소 또는 최소화하기 위해 세척될 수 있다. 이후, 유체 조건이 변경(예를 들어, 마그네슘을 충분히 증가시킴)되어 태그먼트화를 촉진할 수 있다. 갭-충전 리게이션 단계에 이어서 열 해리가 사용되어 시퀀싱을 위한 제작에서 비드로부터 라이브러리를 방출할 수 있다.
도 16a 및 도 16b에 예시된 바와 같은 조성물 및 작업 과정에서, 복합체(6000)의 트랜스포사제 부분(6002)은 DNA 내로 랜덤하게 삽입될 수 있음을 유의한다. 이러한 삽입은 태그먼트화를 억제하는 유체 조건(예를 들어, 낮은 마그네슘 또는 무-마그네슘) 하에서 ShCAST/ShCAST-Tn5 복합체와 게놈 DNA를 혼합함으로써 억제 또는 최소화될 수 있으며, 따라서 표적이 결합되도록 한다.
일부 실시형태에서, 방법은 표적외 태그먼트화를 제한하도록 설계된다. 일부 실시형태에서, ShCAST에 의한 표적화된 전위 방법 동안 저농도의 Tn5는 표적외 태그먼트화를 제한한다. 일부 실시형태에서, 저농도의 Tn5는 ShCAST가 핵산에 비-특이적으로 결합되는 정도를 제한한다.
일부 실시형태에서, gRNA는 표적 핵산 내의 하나 이상의 관심 유전자좌에서의 ShCAST(그리고 따라서 트랜스포사제)의 결합을 표적화하며, 이는 사용자가 정방향 및 역방향 프라이머 둘 모두를 갖는 증폭 가능한 PCR 생성물을 생성할 수 있도록 한다. 일부 실시형태에서, 상이한 gRNA는 관심 유전자좌에서의 상이한 서열에 결합하며, 즉, 상이한 gRNA는 관심 유전자좌 내의 하나 초과의 관심 서열에 결합한다. 이러한 관심 유전자좌는 예를 들어 관심 유전자 내부 또는 이에 근접한 서열일 수 있다.
본 방법을 사용하여 생성된 단편은 둘 모두의 말단에서 적절한 어댑터를 갖는 단편의 제작을 위해 모두에 대한 2개의 트랜스포좀 복합체에 의한 태그먼트화가 필요하다. 단편이 (gRNA에 의해) 관심 유전자좌에 표적화되는 하나의 표적화된 트랜스포좀 복합체를 사용하여 생성되고, 다른 트랜스포좀 복합체는 랜덤하게 결합되는 경우, 단편은 본 방법을 사용하여 적절하게 증폭되기에는 너무 클 가능성이 있다. 일부 실시형태에서, 트랜스포사제 농도가 매우 낮을 때, 이것이 증폭 가능한/시퀀싱 가능한 단편을 생성하기에 충분히 근접하게 다른 Tn5 다음에 게놈에 걸쳐서 랜덤하게 결합할 가능성은 낮다. 대안적으로, ShCAST에 의한 결합 및 절단은 저온(예컨대, 37℃ 미만)에서 수행될 수 있다. 따라서, ShCAST를 이용한 표적외 결합 및 태그먼트화를 통해 생성된 단편은 증폭 가능한 PCR 생성물이 아닐 수 있을 것이다. 오직 트랜스포사제가 (관심 유전자좌를 표적화하도록 설계된 gRNA를 사용하여 표적화된 ShCAST 복합체와 같이) 상대적으로 근접하게 클러스터될 때, PCR 농축을 겪을 수 있는 단편이 생성될 것이다.
본원에서 Cas12k 및 Tn7를 포함하는 ShCAST에 관한 추가의 상세한 설명을 위해, 문헌[Strecker et al., Science. 365(6448): 48-53 (2019)]을 참조하며, 이는 그 전체 내용이 본원에 인용되어 포함된다.
G. 아연 집게 DNA-결합 도메인을 포함하는 표적화된 트랜스포좀
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 아연 집게 DNA-결합 도메인을 포함한다. 이러한 아연 집게 DNA-결합 도메인은 트랜스포좀 복합체를 표적 핵산 내의 관심 서열로 표적화하는 역할을 할 수 있다.
일부 실시형태에서, 아연 집게 DNA-결합 도메인은 표적 핵산 내의 하나 이상의 관심 서열에 결합하도록 설계된다. 특정 서열에 결합하도록 아연 집게 DNA-결합 도메인을 설계하는 수단은 당해 분야에 잘 알려져 있다(문헌[Wei et al., BMC Biotechnology 8:28 (2008)] 참조).
일부 실시형태에서, 표적화된 트랜스포좀 복합체는 트랜스포사제, 3' 트랜스포존 말단 서열; 5' 어댑터 서열; 및 아연 집게 DNA-결합 도메인을 포함하는 제1 트랜스포존 - 여기서 아연 집게 DNA-결합 도메인은 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및 상기 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존을 포함한다.
일부 실시형태에서, 복합체는 아연 집게 DNA-결합 도메인 어레이를 포함한다. 본원에 사용된 "아연 집게 DNA-결합 어레이"는 하나 초과의 아연 집게 DNA-결합 도메인을 포함하는 도메인이다.
일부 실시형태에서, 아연 집게 DNA-결합 도메인은 트랜스포사제와 회합된다. 일부 실시형태에서, 아연 집게 DNA-결합 도메인은 트랜스포사제에 연결된다.
일부 실시형태에서, 아연 집게 DNA-결합 도메인은 트랜스포사제의 5' 말단에 연결된다. 일부 실시형태에서, 아연 집게 DNA-결합 도메인은 트랜스포사제의 3' 말단에 연결된다. 일부 실시형태에서, 트랜스포사제는 아연 집게 DNA-결합 도메인의 5' 말단에 연결된다. 일부 실시형태에서, 트랜스포사제는 아연 집게 DNA-결합 도메인의 3' 말단에 연결된다. 일부 실시형태에서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 융합 단백질 내에 포함된다.
일부 실시형태에서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 링커를 통해 연결된다.
일부 실시형태에서, 아연 집게 DNA-결합 도메인 및 트랜스포사제는 별개의 단백질 내에 포함된다. 일부 실시형태에서, 별개의 아연 집게 DNA-결합 도메인 및 트랜스포사제는 결합 파트너의 페어링을 통해 함께 회합될 수 있으며, 여기서, 제1 결합 파트너는 촉매적으로 비활성인 엔도뉴클레아제에 결합되고, 제2 결합 파트너는 트랜스포사제에 결합된다.
II. 표적화된 트랜스포좀을 포함하는 키트 또는 조성물
다양한 키트 또는 조성물이 표적화된 트랜스포좀 복합체를 포함할 수 있다.
일부 실시형태에서, 키트 또는 조성물은 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 트랜스포사제; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인 제2 트랜스포좀 복합체를 포함한다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체는 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 키트 또는 조성물은 각각 표적화된 트랜스포좀 복합체인 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 표적화 올리고뉴클레오티드를 포함한다.
일부 실시형태에서, 키트 또는 조성물은 각각 표적화된 트랜스포좀 복합체인 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 가이드 RNA를 포함한다.
일부 실시형태에서, 키트 또는 조성물은 각각 표적화된 트랜스포좀 복합체인 2개의 트랜스포좀 복합체를 포함하며, 2개의 표적화된 트랜스포좀 복합체는 상이한 아연 집게 DNA-결합 도메인을 포함한다.
III. 표적화된 전위를 위해 표적화된 트랜스포좀 복합체를 사용하는 방법
표적화된 트랜스포좀 복합체를 사용하는 방법은 표적화된 트랜스포좀 복합체가 표적 핵산에 결합되는 곳에 근접한 표적 핵산의 영역 내에서 전위를 매개할 수 있다. 바꾸어 말하면, 표적화된 트랜스포좀 복합체는 핵산의 서열-특이적 표적화된 전위를 매개할 수 있다. 서열-특이적 전위는 표적 핵산을 단편화하고, 표적 핵산의 특정 부분을 포함하는 태그화 단편을 생성하기 위해 사용될 수 있다. 표적화된 트랜스포좀 복합체를 사용하는 대표적 방법은 도 14a 내지 도 14c에서 보여주며, 여기서, 표적화된 트랜스포좀 복합체는 비-절단 엔도뉴클레아제 돌연변이체, 예컨대, dCas9를 포함한다.
일반적으로, 트랜스포좀 복합체는 이중 가닥화 핵산에 랜덤하게 결합함으로써 전위를 매개한다. 그러나, 일부 용도의 경우, 당업자는 표적 핵산의 소기의 부분을 포함하는 단편들을 포함하는 라이브러리를 제작하는 것을 선호할 수 있다. 이러한 소기의 부분은 도 14a에 나타낸 바와 같은 농축 표적 영역이라 칭할 수 있다.
표적 핵산의 특정 부분을 포함하는 단편들을 포함하는 라이브러리의 확률을 증가시키는 방법을 통해 생성된 라이브러리는 "표적화된 라이브러리"라 칭할 수 있다. 표적화된 트랜스포좀 복합체를 사용하는 본 방법은 표적화된 라이브러리를 생성하는 데 사용될 수 있다. 본원에 사용된 "비-표적화된 라이브러리"는 표적 핵산의 랜덤 단편들을 포함하는 라이브러리(예를 들어, 표준 태그먼트화 방법에 의한 것과 같이 랜덤 단편으로 생성된 라이브러리)를 지칭한다.
일부 실시형태에서, 표적화된 트랜스포좀을 사용할 때, 표적 핵산 내의 소기의 부위 주위에서의 전위 빈도는 더 높다. 일부 실시형태에서, 본 방법을 통해 생성된 표적화된 라이브러리는 또한 표적 핵산의 다른 부분을 포함하는 단편들을 포함할 수 있다. 바꾸어 말하면, 표적화된 라이브러리는 또한 표적 핵산의 다른 부분을 포함하는 단편들을 포함할 수 있다.
일부 실시형태에서, 본 방법을 통해 생성된 단편들의 라이브러리 내에 포함된 태그화 단편들의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 100%는 표적 핵산의 소기의 부분의 단편들을 포함한다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체를 사용하는 본 방법을 통해 생성된 단편들의 라이브러리는 표적화된 트랜스포좀 복합체 또는 다른 농축 방법을 통해 생성되지 않았던 라이브러리와 비교하여 표적 핵산의 소기의 부분을 포함하는 2X, 5X, 10X, 20X, 50X, 100X, 또는 1000X 이상의 태그화 단편들을 포함한다. 일부 실시형태에서, 비-표적화된 또는 비-농축된 라이브러리는 표적 핵산에 랜덤하게 결합하며, 단편화하는 트랜스포좀 복합체를 사용하는 방법을 통해 생성되었을 수 있다.
일부 실시형태에서, 본 방법을 통해 생성된 단편들의 라이브러리는 표적 핵산의 소기의 부분을 포함하는 태그화 단편들에 대해 2X, 5X, 10X, 20X, 50X, 100X, 또는 1000X로 농축된다. 바꾸어 말하면, 표적화된 트랜스포좀 복합체를 사용하는 본 방법을 통해 생성된 단편들의 라이브러리는 비-표적화된 또는 비-농축된 라이브러리 내의 이들 단편들의 빈도와 비교하여, 표적 핵산의 소기의 부분을 포함하는 태그화 단편을 더 높은 빈도로 가질 수 있다.
표적화된 라이브러리는 다수의 중요한 이점을 갖는다. 표적화된 라이브러리는 표적 핵산 내의 관심 영역에 초점을 맞추어 다운스트림 적용, 예컨대 시퀀싱에서 더 작고, 더 처리하기 쉬운 데이터 세트를 생성한다. 표적화된 라이브러리를 사용하는 방법은 또한 비-표적화된 라이브러리를 사용하는 방법과 비교하여, 시퀀싱 비용 및 데이터 분석 부담을 감소시킬 뿐만 아니라 턴어라운드 시간(turnaround time)을 감소시킬 수 있다.
표적 핵의 선택된 영역을 포함하는 라이브러리("표적화된 라이브러리")는 다수의 적용 분야에 중요할 수 있다. 일반적으로, 특정 관심 유전자(즉, 맞춤 내용물), 유전자 내부 표적, 또는 미토콘트리아 DNA의 표적화된 분석을 위한 방법이 또한 표적화된 라이브러리를 생성하기 위한 본 방법에 적합할 수 있다. 플랫폼 결과물이 제한적인 경우 또는 매우 높은 커버리지가 요구될 때, 표적화된 라이브러리를 원할 수 있다. 예를 들어, 표적화된 라이브러리는 희귀한 변이체의 식별을 위해 높은 커버리지 수준에서의 심층 시퀀싱(deep sequencing)이 가능하도록 할 수 있다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체를 사용하는 방법은 비-표적화된 트랜스포좀 복합체와 비교하여 표적 핵산의 양 대비 더 낮은 농도의 트랜스포좀 복합체의 사용을 허용한다. 일부 실시형태에서, 표적화된 트랜스포좀 복합체는 표적 DNA에 대해 대략 동일한 화학량론으로 사용된다.
바꾸어 말하면, 과량의 몰의 표적화된 트랜스포좀 복합체가 표적 핵산으로부터의 관심 영역을 포함하는 충분한 단편들을 갖는 라이브러리를 생성하는 데 필요하지 않을 수 있다. 대조적으로, 비-표적화된 라이브러리로 생성된 단편들은 랜덤하게 제작되기 때문에, 비-표적화된 라이브러리(즉, 트랜스포좀 복합체를 하나 이상의 관심 핵산 서열로 표적화하지 않는 라이브러리 생성 방법)에서 충분한 단편들을 얻기 위해서는, 더 많은 트랜스포좀 복합체가 필요할 수 있다. 따라서, 표적화된 트랜스포좀에 의해, 라이브러리 내의 더 많은 단편들이 관심 서열을 함유할 수 있으며, 이는 더 적은 양의 표적화된 트랜스포좀 복합체 및 더 적은 양의 표적 핵산이 사용되도록 한다.
본원에 기재된 표적화된 트랜스포좀 복합체는 비-표적화된 트랜스포좀 복합체와 함께 사용될 수 있다. 일부 실시형태에서, 태그화 핵산 단편들의 라이브러리를 생성하는 방법은 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체와, 트랜스포사제; 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하는 제2 트랜스포좀 복합체를 조합하는 단계, - 여기서 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 및 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함한다.
방법은 또한 2개의 표적화된 트랜스포좀 복합체를 사용할 수 있다.
일부 실시형태에서, 태그화 핵산 단편들의 라이브러리를 생성하는 방법은 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체와, 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체를 조합하는 단계; 및 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함한다.
방법에 사용된 표적화된 트랜스포좀은 촉매적으로 비활성인 엔도뉴클레아제를 포함하거나, 아연 집게 DNA-결합 도메인을 포함하는 것들과 같은 본원에 기재된 임의의 것들일 수 있다.
본원에 기재된 방법은 단편화 전에 표적화된 트랜스포좀 복합체를 표적 핵산과 조합하는 것을 촉진하도록 설계될 수 있다. 일부 실시형태에서, 트랜스포사제의 단편화 활성을 촉진하는 제제는 조합 단계 동안 존재하지 않거나, 낮은 수준으로 존재한다. 일부 실시형태에서, 2가 양이온은 조합 동안 존재하지 않는다. 일부 실시형태에서, Ca2+ 및/또는 Mn2+는 조합 동안 존재한다. 일부 실시형태에서, Ca2+ 및/또는 Mn2+는 조합 동안 존재하지만, Mg2+는 존재하지 않는다.
일부 실시형태에서, 방법은 조합 후 그리고 단편화 전에 하나 이상의 2가 양이온을 샘플에 첨가하는 단계를 추가로 포함한다. 일부 실시형태에서, 2가 양이온은 Mg2+이다.
일부 실시형태에서, 방법은 조합 후 그리고 단편화 전에 샘플을 엑소뉴클레아제로 처리하는 단계를 추가로 포함한다. 엑소뉴클레아제는 단일 가닥화 DNA의 분해를 촉진할 수 있다. 일부 실시형태에서, 방법은 샘플을 엑소뉴클레아제로 처리한 후 그리고 단편화 전에 Mg2+를 첨가하는 단계를 추가로 포함한다.
일부 실시형태에서, 방법은 태그화 단편을 프로테이나제 K 및/또는 SDS를 이용하여 방출하는 단계를 포함한다.
본 방법은 생성된 단편의 둘 모두의 단부를 어댑터로 태그화하는 데 사용될 수 있다. 이는 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체를 이용하는 방법을 사용함으로써 획득될 수 있다. 일부 실시형태에서, 본 방법은 단편화에 의해 생성되는 단편의 각각의 말단 상에 상이한 태그를 혼입한다. 일부 실시형태에서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체 내에 포함된 5' 어댑터 서열은 상이하다.
A. 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체를 사용하는 방법
일부 실시형태에서, 방법은 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체를 사용한다. 예시적 실시형태는 도 9에서 보여준다.
일부 실시형태에서, 표적 핵산의 5' 태그화 단편의 표적화된 생성 방법은 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 트랜스포좀 복합체를 조합하는 단계를 포함한다. 일부 실시형태에서, 표적화된 트랜스포좀 복합체는 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 핵산의 가닥 침입은 재조합효소에 의해 개시된다. 일부 실시형태에서, 가닥 침입 후, 핵산은 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화된다.
일부 실시형태에서, 태그화 핵산 단편들의 라이브러리를 생성하는 방법은 이중 가닥화 핵산을 포함하는 샘플과, 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체와, 트랜스포존; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인 제2 트랜스포좀 복합체를 조합하는 단계; 재조합효소에 의해 상기 핵산의 가닥 침입을 개시하는 단계; 및 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함한다.
일부 실시형태에서, 태그화 핵산 단편들의 라이브러리를 생성하는 방법은 이중 가닥화 핵산을 포함하는 샘플과, 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체와, 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체를 조합하는 단계; 재조합효소에 의해 상기 핵산의 가닥 침입을 개시하는 단계; 및 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함한다.
일부 실시형태에서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체 내에 포함된 5' 어댑터 서열은 상이하다.
일부 실시형태에서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드는 상이하다. 일부 실시형태에서, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체의 표적화 올리고뉴클레오티드는 표적 핵산에서 소정의 관심 영역 내의 상이한 관심 서열에 결합한다. 이러한 방식으로, 제1 트랜스포좀 복합체 및 제2 트랜스포좀 복합체는 소기의 관심 서열을 포함하는 단편을 생성할 수 있다. 당업자는 이러한 관심 서열을 포함하는 단편을 생성하기 위해 관심 서열의 말단에서, 말단 근처에서, 또는 말단을 넘어서 결합하는 표적화 올리고뉴클레오티드를 설계할 수 있다. 이러한 방식으로, 표적화된 라이브러리가 관심 서열을 포함하는 단편의 증가된 빈도로 생성될 수 있다.
일부 실시형태에서, 제2 트랜스포좀 복합체는 제1 트랜스포좀 복합체와 비교하여 이중 가닥화 핵산의 대향 가닥에 결합한다.
일부 실시형태에서, 재조합효소에 의해 핵산의 가닥 침입을 개시하는 단계는 재조합효소 로딩 인자의 존재 하에 수행된다. 일부 실시형태에서, 재조합효소 로딩 인자는 단편화 전에 제거되거나, 비활성화된다.
일부 실시형태에서, 가닥 침입을 개시하는 단계는 대치 루프 형성을 통해 발생한다.
일부 실시형태에서, 가닥 침입은 하나 이상의 관심 서열에 대한 표적화 올리고뉴클레오티드의 결합 부위의 40, 30, 20, 15, 10, 또는 5개의 염기 내에서 개시된다. 바꾸어 말하면, 가닥 침입은 표적화 올리고뉴클레오티드의 결합 부위에 근접하게 발생할 수 있다.
일부 실시형태에서, 본 방법은 방법 동안 온도에서의 변화를 기반으로 상이한 단계를 통해 진행된다. 일부 실시형태에서, 가닥 침입을 개시하기 위해 사용되는 온도는 트랜스포사제에 의한 단편화를 위한 최적 온도와 상이하다. 일부 실시형태에서, 가닥 침입을 개시하기 위해 사용되는 온도는 트랜스포사제에 의한 단편화를 위한 최적 온도 미만이다. 일부 실시형태에서, 더 낮은 온도에서 가닥 침입을 개시하는 것은 단편화가 온도에서의 증가에 의해 개시되기 전에 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 기반으로 하는 트랜스포좀 복합체의 적절한 표적화를 촉진한다. 이러한 온도 변화는 단편화 전에 표적 핵산 내의 관심 서열에 대한 표적화된 트랜스포좀 복합체의 결합을 촉진하는 데 도움이 될 수 있다.
일부 실시형태에서, 가닥 침입을 개시하는 단계는 27℃ 내지 47℃에서 수행된다. 일부 실시형태에서, 가닥 침입을 개시하는 단계는 32℃ 내지 42℃에서 수행된다. 일부 실시형태에서, 가닥 침입을 개시하는 단계는 37℃에서 수행된다.
일부 실시형태에서, 단편화 단계는 45℃ 내지 65℃에서 수행된다. 일부 실시형태에서, 단편화 단계는 50℃ 내지 60℃에서 수행된다. 일부 실시형태에서, 단편화 단계는 55℃에서 수행된다.
일부 실시형태에서, 가닥 침입을 개시하는 단계는 반응 용액이 트랜스포사제 활성을 위한 구성요소가 결여되는 동안 수행된다. 예를 들어, 일부 실시형태에서, 트랜스포사제에 대한 보조인자는 침입을 개시한 후 그리고 단편화 전에 트랜스포좀 복합체에 첨가된다. 일부 실시형태에서, 상기 보조인자는 Mg++이다. 일부 실시형태에서, Mg++ 농도는 10 mM 내지 18 mM이다.
재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체를 사용하는 방법은 표적화 올리고뉴클레오티드가 표적 핵산에 결합되었던 곳에서 근접하게 단편화가 발생할 확률을 증가시킬 수 있다. 일부 실시형태에서, 단편화는 표적화 올리고뉴클레오티드에 의해 결합된 핵산 서열 내의 하나 이상의 관심 서열의 40, 30, 20, 15, 10, 또는 5개의 염기 내에서 발생한다.
B. 단일 가닥화 핵산에 대한 표적화 올리고뉴클레오티드의 혼성화를 사용하는 방법
트랜스포사제는 이중 가닥화 핵산의 전위 및 단편화를 매개할 수 있다. 따라서, 단일 가닥화 DNA와 같은 단일 가닥 핵산에 대한 표적화 올리고뉴클레오티드의 결합을 통한 이중 가닥화 핵산 영역의 선택적 생성이 태그화 단편을 생성하는 방법에서 사용될 수 있다. 표적화 올리고뉴클레오티드를 사용하는 예시적 방법은 도 10에서 보여준다.
핵산의 5' 태그화 단편의 표적화된 생성 방법은 하나 이상의 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계를 포함할 수 있다. 일부 실시형태에서, 이중 가닥화 표적 핵산은 변성되어 단일 가닥화 핵산을 생성할 수 있다. 일부 실시형태에서, 이중 가닥화 DNA는 변성되어 단일 가닥화 DNA를 생성한다. 일부 실시형태에서, 변성은 온도에서의 증가를 통해 수행된다. 일부 실시형태에서, 이중 가닥화 핵산은 온도를 핵산의 용융 온도(Tm) 초과로 증가시킴으로써 변성된다. 일부 실시형태에서, 이중 가닥화 DNA를 포함하는 샘플은 이중 가닥화 DNA의 단일 가닥화 DNA로의 변성을 촉진하도록 70℃ 초과의 온도로 가열된다. 일부 실시형태에서, 이중 가닥화 핵산은 우레아 및/또는 pH 변화로 처리되어 단일 가닥화 DNA를 생성한다.
일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계는 단일 가닥화 핵산을 포함하는 샘플의 온도를 감소시켜서 하나 이상의 표적화 올리고뉴클레오티드가 단일 가닥화 핵산에 결합되도록 함으로써 수행된다.
일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드는 각각 핵산 내의 관심 서열에 결합될 수 있다. 일부 실시형태에서, 표적화 올리고뉴클레오티드는 핵산 내의 관심 서열에 완전히 또는 일부 상보적이다.
일부 실시형태에서, 하나 이상의 표적화 올리고뉴클레오티드를 단일 가닥화 핵산에 혼성화하는 단계는 이중 가닥화 핵산 영역을 생성한다. 트랜스포사제는 단일 가닥화 핵산 영역에 결합하지 않을 것인 반면, 트랜스포사제는 표적화 올리고뉴클레오티드를 단일 가닥화 핵산에 혼성화함으로써 생성되는 이중 가닥화 영역에는 결합할 수 있다. 일부 실시형태에서, 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계는 단편화될 수 있는 이중 가닥화 핵산 영역을 생성한다.
일부 실시형태에서, 방법은 하나 이상의 표적화 올리고뉴클레오티드를 샘플에 혼성화한 후, 트랜스포좀 복합체를 적용하는 단계를 포함한다. 일부 실시형태에서, 트랜스포좀 복합체는 트랜스포사제; 3' 트랜스포사존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적이다. 일부 실시형태에서, 방법은 이어서 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계를 포함한다.
일부 실시형태에서, 상이한 서열을 갖는 2개 이상의 표적화 올리고뉴클레오티드가 혼성화된다. 일부 실시형태에서, 2개 이상의 표적화 올리고뉴클레오티드를 이용하는 방법은 표적 핵산 내의 2개 이상의 부위에서 단편화를 매개할 수 있다. 예를 들어, 2개 이상의 표적화 올리고뉴클레오티드는 표적 핵산 내의 관심 영역의 말단들에서 결합할 수 있어서, 단편화가 관심 영역을 포함하는 단편을 생성하도록 한다. 바꾸어 말하면, 2개 이상의 표적화 올리고뉴클레오티드를 이용하는 방법은 표적화된 라이브러리를 생성할 수 있다.
일부 실시형태에서, 단일 표적화 올리고뉴클레오티드의 다수의 복제물이 혼성화된다.
일부 실시형태에서, 단지 하나의 유형의 표적화 올리고뉴클레오티드가 혼성화된다. 이러한 방식으로, 표적 핵산은 특정 영역에서 단편화된다. 일부 실시형태에서, 단일 표적화 올리고뉴클레오티드는 단일 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 것에 의해 생성된 이중 가닥화 핵산에 2개의 트랜스포좀 복합체를 결합할 만큼 충분히 길다. 일부 실시형태에서, 단일 표적화 올리고뉴클레오티드는 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200개의 염기쌍을 포함한다.
일부 실시형태에서, 단편화는 하나 이상의 표적화 올리고뉴클레오티드에 의해 결합된 핵산 서열 내의 하나 이상의 관심 서열 내에서 발생한다.
C. ShCAST를 사용하는 방법
일부 구현예에서, ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제) 표적화된 라이브러리 제작 및 농축은 도 16a 및 도 16b에 요약된 바와 같이 사용될 수 있다.
라이브러리 제작 후에 별도의 농축 단계를 사용하는 특정 유전자의 표적화된 시퀀싱은 시간 소모적일 수 있다. 예를 들어, 이러한 별도의 농축 단계는 올리고뉴클레오티드 프로브를 라이브러리 DNA에 혼성화하는 단계 및 스트렙타비딘-코팅된 비드 상에 혼성화된 DNA를 단리하는 단계를 포함할 수 있다. 효율 및 필요한 시간에서의 유의한 개선에도 불구하고, 이러한 별도의 농축 프로토콜은 약 2시간이 소요될 수 있으며, 이러한 프로토콜을 자동화하기에 어렵게 만들 수 있는 다수의 시약이 필요할 수 있다.
대조적으로, 본원에 기재된 ShCAST를 사용하는 방법은 제작 및 농축 둘 모두를 위한 단일 단계를 사용하여 특정 유전자의 표적화된 시퀀싱을 위한 라이브러리를 제작하고, 농축하는 데 사용될 수 있다.
일부 실시형태에서, 제1 및/또는 제2 표적화된 트랜스포좀 복합체는 ShCAST를 포함하는 표적화된 트랜스포좀 복합체를 포함한다.
일부 실시형태에서, gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 조성물은 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나가 결합되는 스트렙타비딘-코팅된 비드를 추가로 포함한다. 이러한 방식으로, ShCAST를 포함하는 표적화된 트랜스포좀 복합체를 사용하여 생성된 태그화 단편은 스트렙타비딘-코팅된 비드 상에 고정될 수 있다.
일부 실시형태에서, 방법의 일부 또는 모든 단계는 ShCAST 내에 포함된 트랜스포사제에 의한 핵산의 비-특이적 결합을 제한하거나, 억제하는 반응 유체 중에서 수행된다. 일부 실시형태에서, ShCAST 내에 포함된 트랜스포사제의 비-특이적 결합을 제한하거나, 억제하는 것은 ShCAST 내에 포함된 트랜스포사제에 의해 매개되는 표적외 전위 반응을 감소시킨다. ShCAST 내에 포함된 트랜스포사제가 핵 자체에 랜덤하게 결합하는 경우, ShCAST가 관심 서열에 결합된 gRNA에 의해 관심 서열을 표적화하는 대신에, 이러한 표적외 전위가 발생할 수 있다. 표적외 절단이 감소될 때, 대부분의 단편은 표적화된 트랜스포좀 복합체에 의해 매개된 절단으로부터 생성될 것이다. 이러한 방식으로, 대부분의 태그화 단편은 하나 이상의 관심 유전자좌(하나 이상의 gRNA에 결합할 수 있는 하나 이상의 관심 서열 포함)로부터 제작될 것이다. 또한, 태그화 단편이 2개의 표적화된 트랜스포좀 복합체로부터 제작되는 경우, 이는 시퀀싱 및/또는 증폭될 수 있는 크기의 것일 가능성이 있을 것이다. 대조적으로, 단편을 제작하는 데 사용되는 하나 또는 둘 모두의 트랜스포좀 복합체가 적절하게 표적화되지 않을 때(예를 들어, ShCAST 내에 포함된 트랜스포사제가 gRNA에 의한 표적화 없이 핵산에 직접 결합하는 경우), 단편은 증폭 및/또는 시퀀싱하기에 너무 클 가능성이 있을 것이다.
일부 실시형태에서, 방법은 트랜스포사제에 의한 직접적인 복합체의 결합을 제한하기 위한 조건을 갖는 유체 중에서 수행된다. 일부 실시형태에서, 트랜스포사제에 의한 직접적인 복합체의 결합을 제한하기 위한 조건은 15 mM 이하의 마그네슘 농도 및/또는 50 nM 이하의 Cas12K 및/또는 트랜스포사제의 농도를 갖는다.
일부 실시형태에서, 방법의 상이한 단계는 상이한 조건 하에서 수행된다. 일부 실시형태에서, 복합체의 결합은 이중 가닥화 핵산에 대한 트랜스포사제의 결합을 억제하는 조건 하에서 수행된다. 이러한 방식으로, 트랜스포사제에 의한 핵산에 대한 직접적인 ShCAST의 비-표적화된 결합이 제한되며, 대부분의 ShCAST는 핵산 내의 하나 이상의 관심 서열에 표적화된 gRNA와 Cas12K의 회합을 기반으로 핵산에 결합될 것이다.
일부 실시형태에서, 결합 후, 조건은 ShCAST 내에 포함된 트랜스포사제에 의한 절단을 촉진하도록 변경될 수 있다. 일부 실시형태에서, 방법은 복합체 내에 포함된 트랜스포사제에 의한 이중 가닥화 핵산의 결합을 억제하는 조건 하에서 복합체를 이중 가닥화 핵산에 결합하는 단계; 및 결합 후, 복합체에 의한 이중 가닥화 핵산의 절단을 촉진하는 단계를 포함한다.
일부 실시형태에서, 트랜스포사제는 결합 동안 존재하지 않거나, 낮은 농도로 존재하고, 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함한다.
일부 실시형태에서, 활성화 가능한 트랜스포사제는 ShCAST 내에 포함된다. 본원에 사용된 "활성화 가능한 트랜스포사제"는 가역적으로 비활성화되며, 나중 시간에 가역적으로 활성화될 수 있는 것이다. 예를 들어, 가역적으로 비활성화된 트랜스포사제는 핵산의 적절한 절단을 위한 구성요소가 결여될 수 있고, 이러한 구성요소는 방법에서 나중 단계 동안 첨가될 수 있다.
일부 실시형태에서, 트랜스포사제는 결합 동안 가역적으로 비활성화되고, 절단을 촉진하는 단계는 트랜스포사제를 활성화시키는 단계를 포함한다.
일부 실시형태에서, 트랜스포사제는 하나 이상의 트랜스포존의 결여로 인해 가역적으로 비활성화되고, 트랜스포사제를 활성화시키는 단계는 하나 이상의 트랜스포존을 제공하는 단계를 포함한다.
일부 실시형태에서, 트랜스포사제는 증폭 어댑터를 이중 가닥화 핵산 내의 위치에 첨가한다. 본원에 사용된 "증폭 어댑터"는 증폭에 유용한 임의의 서열(예컨대, 증폭 프라이머에 대한 결합 부위)이다. 이러한 방식으로, 생성된 태그화 단편은 추가의 증폭 어댑터를 혼입할 필요 없이 증폭될 수 있다. 일부 실시형태에서, 증폭 어댑터는 태그화 단편을 제작한 후, 단편에 첨가될 수 있다(예컨대, 증폭 어댑터의 리게이션에 의함).
D. 결합 파트너의 페어링을 포함하는 방법
제1 페어링된 결합 파트너가 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인에 결합되며, 제2 결합 파트너가 트랜스포사제에 결합될 때, 고분해능의 시퀀싱 라이브러리가 생성될 수 있다.
결합 파트너의 페어링을 포함하는 방법은 CUT&태그 방법과 유사할 수 있다(문헌[Kaya-Okur et al., Nature Communications 10:1930 (2019)]참조). 이러한 방법에서, 제1 결합 파트너를 포함하는 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인은 표적 핵산에 결합된다. 일부 실시형태에서, 반응은 이러한 결합 후에 세척된다. 이어서, 제2 결합 파트너를 포함하는 트랜스포사제가 첨가된다. 트랜스포사제는 제1 결합 파트너에 대한 제2 결합 파트너의 친화성을 기반으로 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인에 국소화될 것이다. 이들 방법은 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인에 의해 이미 결합되었던 부위에 트랜스포사제가 결합되도록 한다.
일부 실시형태에서, 방법은 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인의 결합을 제한하는 조건 하에서 수행된다. 이들 조건은 표적외 트랜스포사제 결합을 제한할 수 있다. 일부 실시형태에서, 저농도의 마그네슘 또는 저농도의 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합이 표적외 트랜스포사제 결합을 감소시키기 위해 사용된다. 일부 실시형태에서, 표적외 결합으로부터 증폭 가능한 PCR 생성물을 생성할 가능성은 감소된다. 일부 실시형태에서, 제한된 표적외 트랜스포사제 결합은 랜덤(즉, 비-표적화된) 트랜스포사제 결합이 낮은 빈도로 발생하는 것을 의미하며, 일반적으로 증폭 및/또는 시퀀싱되기에 너무 큰 단편을 수득한다. 대조적으로, 표적화된 트랜스포좀 복합체의 사용은 증폭 및/또는 시퀀싱하기에 적절한 크기의 단편을 제작하도록 설계될 수 있다.
본원에 사용된 제1 결합 파트너 및 제2 결합 파트너는 "태그"로 지칭될 수 있다. 일부 실시형태에서, 제1 태그는 제1 Cas-gRNA 리보핵산단백질(Cas 및 해당 gRNA를 포함하는 RNP)에 결합되고, 제2 태그는 제2 Cas-gRNA RNP에 결합된다. 일부 예에서, 방법은 제1 태그를 기재에 결합된 제1 태그 파트너에 결합시키는 단계 및 제2 태그를 기재에 결합된 제2 태그 파트너에 결합시키는 단계를 포함한다. 일부 예에서, 결합은 제1 및 제2 Cas-gRNA RNP가 각각 제1 및 제2 하위서열에 혼성화된 후에 수행된다. 일부 예에서, 제1 및 증폭 어댑터는 제1 및 제2 태그가 각각 제1 및 제2 태그 파트너에 첨가된 후에 첨가된다.
일부 예에서, 제1 및 제2 태그는 비오틴을 포함한다. 일부 예에서, 제1 및 제2 태그 파트너는 스트렙타비딘을 포함한다. 일부 예에서, 기재는 비드를 포함한다. 일부 예에서, Cas-gRNA RNP는 Cas12k를 포함한다. 일부 예에서, 트랜스포사제는 Tn5 또는 Tn7 유사 트랜스포사제를 포함한다.
일부 실시형태에서, 이중 가닥화 핵산을 포함하는 샘플을 표적화된 하나 이상의 트랜스포좀 복합체와 조합하는 단계는, 샘플을 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제와 조합하는 단계 - 여기서 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제는 제1 결합 파트너에 결합됨 -; 및 트랜스포사제와 제1 및 제2 트랜스포존을 첨가하는 단계 - 여기서 트랜스포사제는 제2 결합 파트너에 결합됨 -;를 포함하며, 트랜스포사제는 제1 및 제2 결합 파트너를 페어링하는 것에 의해 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제에 결합할 수 있다.
일부 실시형태에서, 방법은 조합 후 그리고 첨가 전에 세척하는 단계를 포함한다. 일부 실시형태에서, 세포 유리 DNA는 아연 집게 DNA-결합 도메인과 조합하기 전에 프로테아제로 처리되지 않는다.
E. 표적화된 단편을 2개의 표적화된 트랜스포좀 복합체를 이용하여 생성하는 방법
일부 실시형태에서, 폴리뉴클레오티드(예컨대, 표적 핵산)는 임의의 적합한 위치쌍에서 절단되어 단편을 형성할 수 있다. 본원에 개시된 방법을 사용하여 단편을 형성한 후, 임의의 적합한 증폭 프라이머가 단편의 수득된 말단에 결합될 수 있다. 이어서, 단편은 증폭되고, 시퀀싱될 수 있다.
둘 모두 표적화된, 제1 및 제2 트랜스포좀 복합체를 이용하는 방법에서, 복합체는 소기의 특정 단편을 제작하도록 설계될 수 있다. 일부 실시형태에서, 둘 모두 표적화된, 제1 및 제2 트랜스포좀 복합체를 이용하는 방법은 표적화된 또는 농축된 라이브러리를 생성할 수 있다. 이러한 표적화된 또는 농축된 라이브러리는 농축 표적 영역을 포함하는 라이브러리 단편들을 더 높은 백분율로 포함할 수 있다. 이러한 농축 표적 영역은 예를 들어 시퀀싱을 위한 관심 유전자일 수 있다.
일부 실시형태에서, 표적화된 제1 트랜스포좀 복합체 및 표적화된 제2 트랜스포존 복합체는 이중 가닥화 핵산의 대향 가닥에 결합하며, 제1 트랜스포좀 복합체는 제1 트랜스포좀 복합체 결합 부위에 결합하고, 제2 트랜스포좀 복합체는 제2 트랜스포좀 복합체 결합 부위에 결합한다. 일부 실시형태에서, 제1 5' 태그화 표적 단편 및 제2 5' 태그화 표적 단편은 제1 트랜스포좀 복합체 결합 부위와 제2 트랜스포좀 복합체 결합 부위 사이의 이중 가닥화 핵산 영역 내에 포함된 핵산 서열을 포함한다. 일부 실시형태에서, 제1 5' 태그화 표적 단편 및 제2 5' 태그화 단편은 적어도 일부가 상보적이다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인은 상이하다. 촉매적으로 비활성인 엔도뉴클레아제를 포함하는 2개의 표적화된 트랜스포좀 복합체를 사용하는 대표적 방법은 도 11에서 보여준다.
일부 실시형태에서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체의 촉매적으로 비활성인 엔도뉴클레아제 또는 아연 집게 DNA-결합 도메인은 표적 핵산에서 소정의 관심 영역 내의 상이한 관심 서열에 결합한다.
F. 샘플 및 표적 핵산
일부 실시형태에서, 샘플은 표적 핵산을 포함한다. 일부 실시형태에서, 샘플은 DNA을 포함한다. 일부 실시형태에서, DNA는 게놈 DNA이다. 일부 실시형태에서, 표적 핵산은 이중 가닥화 DNA이다.
일부 실시형태에서, 표적 핵산은 단일 가닥화 DNA이다. 단일 가닥화 DNA는 트랜스포사제에 의해 단편화될 수 없지만, 본원에 기재된 방법은 예컨대 표적화 올리고뉴클레오티드를 단일 가닥화 DNA에 혼성화하는 것에 의해, 이중 가닥화 DNA 영역을 생성하는 수단을 설명한다.
생물학적 샘플은 핵산을 포함하는 임의의 유형일 수 있다. 예를 들어, 샘플은 정제된 핵산을 포함하여 다양한 정제 상태의 핵산을 포함할 수 있다. 그러나, 샘플은 완전히 정제될 필요는 없으며, 예를 들어 단백질, 다른 핵산 종, 다른 세포 성분, 및/또는 임의의 다른 오염물질과 혼합된 핵산을 포함할 수 있다. 일부 실시형태에서, 생물학적 샘플은 생체 내에서 발견되는 것과 대략 동일한 비율로 존재하는 핵산, 단백질, 다른 핵산 종, 다른 세포 성분, 및/또는 임의의 다른 오염물질의 혼합물을 포함한다. 예를 들어, 일부 실시형태에서, 상기 성분들은 온전한 세포에서 발견되는 것과 동일한 비율로 발견된다. 일부 실시형태에서, 생물학적 샘플은 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4, 1.3, 1.2, 1.1, 1.0, 0.9, 0.8, 0.7, 또는 0.60 이하의 260/280 흡광도 비를 갖는다. 일부 실시형태에서, 생물학적 샘플은 적어도 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4, 1.3, 1.2, 1.1, 1.0, 0.9, 0.8, 0.7, 또는 0.60의 260/280 흡광도 비를 갖는다. 본원에 제공된 방법은 핵산이 고체 지지체에 결합되도록 하기 때문에, 다른 오염물질은 표면 결합된 태그먼트화가 발생한 후에 단지 고체 지지체를 세척함으로써 제거될 수 있다. 생물학적 샘플은 예를 들어 미정제 세포 용해물 또는 전세포를 포함할 수 있다. 예를 들어, 본원에 제시된 방법에서 고체 지지체에 적용되는 미정제 세포 용해물은 다른 세포 성분으로부터 핵산을 단리하는 데 전통적으로 사용되는 하나 이상의 분리 단계에 적용되었을 필요가 없다. 예시적 분리 단계는 본원에 인용되어 포함된 문헌[Maniatis et al., Molecular Cloning: A Laboratory Manual, 2d Edition, 1989] 및 문헌[Short Protocols in Molecular Biology, ed. Ausubel, et al]에 제시되어 있다.
일부 실시형태에서, 고체 지지체에 적용되는 샘플은 1.7 이하인 260/280 흡광도 비를 갖는다.
따라서, 일부 실시형태에서, 생물학적 샘플은 예를 들어 혈액, 혈장, 혈청, 림프, 점액, 객담, 소변, 정액, 뇌척수액, 기관지 흡인물, 대변, 및 침연 조직, 또는 이의 용해물, 또는 핵산을 포함하는 임의의 다른 생물학적 시편을 포함할 수 있다.
일부 실시형태에서, 샘플은 혈액이다. 일부 실시형태에서, 샘플은 세포 용해물이다. 일부 실시형태에서, 세포 용해물은 미정제 세포 용해물이다. 일부 실시형태에서, 본 방법은 샘플을 고체 지지체에 적용한 후에 샘플 내의 세포를 용해시켜서 세포 용해물을 생성하는 단계를 추가로 포함한다.
일부 실시형태에서, 샘플은 생검 샘플이다. 일부 실시형태에서, 생검 샘플은 액체 또는 고체 샘플이다. 일부 실시형태에서, 암 환자로부터의 생검 샘플은 대상체가 예측 유전자에서 특정 돌연변이 또는 변이체를 갖는지를 결정하기 위해 관심 서열을 평가하는 데 사용된다.
본원에 제시된 방법 및 조성물의 한 가지 이점은 생물학적 샘플이 플로우셀에 첨가될 수 있으며, 후속 용해 및 정제 단계가 단순히 필수적 시약을 플로우셀 내로 흘려 보냄으로써 추가의 이동 또는 처리 단계 없이 모두 플로우셀 내에서 발생할 수 있다는 것이다.
일부 실시형태에서, 보호 요소(protective element)가 폴리뉴클레오티드(예컨대, 표적 핵산 또는 태그먼트화에 의해 생성된 이중 가닥화 단편) 내로 혼입될 수 있다. 예를 들어, 보호 요소는 태그먼트화 전에 표적 핵산에 첨가되거나, 본원에 기재된 임의의 방법에서의 태그먼트화 후에 이중 가닥화 핵산 단편에 첨가될 수 있다. 본원에 사용된 용어 "보호 요소"는 폴리뉴클레오티드의 5' 또는 3' 말단과 관련하여 사용될 때, 폴리뉴클레오티드의 해당 말단의 변형을 억제하는 요소를 의미하도록 의도된다. 예시적으로, 보호 요소는 5' 또는 3' 엑소뉴클레아제의 작용과 같은 폴리뉴클레오티드의 해당 말단에 대한 하나 이상의 효소의 작용을 억제할 수 있다. 보호 요소의 비제한적 예는 이중 가닥화 폴리뉴클레오티드, 변형된 염기(예를 들어, 포스포로티오에이트 결합 또는 3' 포스페이트 포함), 또는 탈인산화 염기의 5' 및 3' 가닥 말단에 리게이션되는 헤어핀 서열을 포함한다.
G. 갭-충전 리게이션
일부 실시형태에서, 전위 사건 후에 남은 DNA 서열 내의 갭은 또한 가닥 치환 연장 반응을 사용하여 충전될 수 있으며, 이러한 것은 Bst DNA 중합효소 및 dNTP 혼합물을 포함한다. 일부 실시형태에서, 갭-충전 리게이션은 연장-리게이션 혼합 완충액을 사용하여 수행된다.
일부 실시형태에서, 방법은 복수의 5' 태그화 단편을 중합효소 및 리가아제로 처리하여 가닥을 연장 및 리게이션하여 완전한 이중 가닥화 태그화 단편을 제작하는 단계를 포함한다.
이어서, 이중 가닥화 DNA 단편들의 라이브러리는 선택적으로 (예컨대, 클러스터 증폭과 같이) 증폭되고, 시퀀싱 프라이머로 시퀀싱될 수 있다.
H. 증폭
본 개시내용은 추가로 본원에 제공된 방법에 따라 제작된 태그화 단편의 증폭에 관한 것이다. 일부 실시형태에서, 고정된 태그화 단편은 고체 지지체 상에서 증폭된다. 일부 실시형태에서, 고체 지지체는 표면 결합된 태그먼트화가 발생하는 동일한 고체 지지체이다. 이러한 실시형태에서, 본원에 제공된 방법 및 조성물은 샘플 제작이 증폭을 통해 그리고 선택적으로 시퀀싱 단계를 통해 초기 샘플 도입 단계로부터의 동일한 고체 지지체 상에서 진행되도록 한다.
예를 들어, 일부 실시형태에서, 고정된 태그화 단편은 미국 특허 제7,985,565호 및 제7,115,400호의 개시내용에 의해 예시된 클러스터 증폭 방법론을 사용하여 증폭되며, 상기 특허의 각각의 내용은 그 전체 내용이 본원에 인용되어 포함된다. 미국 특허 제7,985,565호 및 제7,115,400호의 포함된 자료는 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위해 증폭 생성물이 고체 지지체 상에 고정되도록 하는 고체상 핵산 증폭 방법을 기술한다. 이러한 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오티드 가닥 및 복수의 동일한 고정된 상보적 폴리뉴클레오티드 가닥으로부터 형성된다. 이와 같이 형성된 어레이는 일반적으로 "클러스터화 어레이"로 본원에서 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 것들과 같은 고체상 증폭 반응의 생성물은 고정된 폴리뉴클레오티드 가닥과 고정된 상보적 가닥 쌍의 어닐링에 의해 형성된 소위 "브릿지" 구조이며, 둘 모두의 가닥은 일부 실시형태에서, 공유 부착을 통해, 5' 말단에서 고체 지지체 상에 고정된다. 클러스터 증폭 방법은 고정된 핵산 주형을 사용하여 고정된 앰플리콘(amplicon)을 제작하는 방법의 예이다. 다른 적합한 방법론이 또한 본원에 제공된 방법에 따라 제작된, 고정된 DNA 단편으로부터 고정된 앰플리콘을 제작하는 데 사용될 수 있다. 예를 들어, 각각의 증폭 프라이머 쌍 중 하나 또는 둘 모두의 프라이머가 고정되는지 여부와 상관 없이, 하나 이상의 클러스터 또는 콜로니가 고체상 PCR을 통해 형성될 수 있다.
다른 실시형태에서, 태그화 단편은 용액 중에서 증폭된다. 예를 들어, 일부 실시형태에서, 태그화 단편은 고체 지지체로부터 절단되거나, 달리 유리되고, 이어서 증폭 프라이머는 용액 중에서 유리된 분자에 혼성화된다. 다른 실시형태에서, 증폭 프라이머는 하나 이상의 초기 증폭 단계 동안 태그화 단편에 혼성화된 다음, 용액 중에서 후속 증폭 단계가 이어진다. 일부 실시형태에서, 고정된 핵산 주형을 사용하여 용액상 앰플리콘을 제작할 수 있다.
본원에 기재되거나, 당업계에 일반적으로 알려진 임의의 증폭 방법론이 범용 또는 표적-특이적 프라이머와 함께 이용되어 태그화 단편을 증폭시킬 수 있음을 인식할 것이다. 증폭에 적합한 방법은 미국 특허 제8,003,354호에 기재된 중합효소 연쇄 반응(PCR), 가닥 이동 증폭(SDA), 전사 매개 증폭(TMA), 및 핵산 서열 기반 증폭(NASBA)을 포함하지만, 이로 제한되지는 않으며, 상기 특허는 그 전체 내용이 본원에 인용되어 포함된다. 상기 증폭 방법은 하나 이상의 관심 핵산을 증폭시키기 위해 이용될 수 있다. 예를 들어, 다중 PCR을 포함한 PCR, SDA, TMA, NASBA 등이 고정된 DNA 단편을 증폭시키는 데 이용될 수 있다. 일부 실시형태에서, 관심 핵산에 특이적으로 향하는 프라이머가 증폭 반응에 포함된다.
핵산의 증폭을 위한 다른 적합한 방법은 올리고뉴클레오티드 연장 및 리게이션, 회전 바퀴형 증폭(RCA: rolling circle amplification)(본원에 인용되어 포함되는 문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)]), 및 올리고뉴클레오티드 리게이션 분석(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호, 및 제5,573,907호; 유럽 특허 제0 320 308 B1호; 유럽 특허 제0 336 731 B1호; 유럽 특허 제0 439 182 B1호; 국제 공개 WO 90/01069호; 국제 공개 WO 89/12696호; 및 국제 공개 WO 89/09835호를 참조하며, 이들 모두는 인용되어 포함됨) 기술을 포함할 수 있다. 이들 증폭 방법론은 고정된 DNA 단편을 증폭시키도록 설계될 수 있음을 인식할 것이다. 예를 들어, 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 향하는 프라이머를 함유하는 리게이션 프로브 증폭 또는 올리고뉴클레오티드 리게이션 분석(OLA) 반응을 포함할 수 있다. 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 향하는 프라이머를 함유하는 프라이머 연장-리게이션 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특별히 설계될 수 있는 프라이머 연장 및 리게이션 프라이머의 비제한적 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 GoldenGate 검정(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.)에 사용된 프라이머를 포함할 수 있으며, 상기 특허는 그 전체 내용이 본원에 인용되어 포함된다.
본 개시내용의 방법에 사용될 수 있는 예시적 등온 증폭 방법은 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 의해 예시된 다중 이동 증폭(MDA) 또는 예를 들어 미국 특허 제6,214,587호에 의해 예시된 등온 가닥 이동 핵산 증폭을 포함하지만, 이로 제한되지는 않으며, 이들은 각각 그 전체 내용이 본원에 인용되어 포함된다. 본 개시내용에 사용될 수 있는 다른 비-PCR 기반 방법은 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 예를 들어 가닥 이동 증폭(SDA) 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 과분지형 가닥 이동 증폭을 포함하며, 이들은 각각 그 전체 내용이 본원에 인용되어 포함된다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥 이동 Phi 29 중합효소 또는 Bst DNA 중합효소 큰 단편, 5'→ 3' 엑소(exo)-와 함께 사용될 수 있다.
이들 중합효소의 사용은 그들의 높은 진행성(processivity) 및 가닥 이동 활성을 이용한다. 높은 진행성은 중합효소가 10 내지 20 kb의 길이인 단편을 제작하도록 한다. 상기 제시된 바와 같이, Klenow 중합효소와 같은 낮은 진행성 및 가닥 이동 활성을 갖는 중합효소를 사용하여 등온 조건 하에서는 보다 작은 단편이 제작될 수 있다. 증폭 반응, 조건, 및 구성요소에 대한 추가의 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 제시되어 있으며, 이는 그 전체 내용이 본원에 인용되어 포함된다.
본 개시내용에 유용한 다른 핵산 증폭 방법은 예를 들어 문헌[Grothues, et al. Nucleic Acids Res. 21(5):1321-2 (1993)]에 기재된 불변 5' 영역 다음에 랜덤 3' 영역을 갖는 2-도메인 프라이머 집단을 사용하는 태그화 PCR이며, 이는 그 전체 내용이 본원에 인용되어 포함된다. 증폭의 제1 라운드는 랜덤으로 합성된 3' 영역으로부터의 개별적 혼성화를 기반으로 열 변성된 DNA에 대한 다수의 개시가 가능하도록 수행된다. 3' 영역의 성질로 인해, 개시 부위는 게놈 전체에 걸쳐 랜덤한 것으로 고려된다. 이후, 결합되지 않은 프라이머는 제거될 수 있고, 추가의 복제가 불변 5' 영역에 상보적인 프라이머를 사용하여 일어날 수 있다.
I. 시퀀싱 및 재시퀀싱
초기 시퀀싱(그리고 잠재적 재시퀀싱)은 다수의 상이한 방법을 사용하여 수행될 수 있다.
본 개시내용은 추가로 본원에 제공된 방법에 따라 제작된 태그화 단편의 시퀀싱에 관한 것이다. 일부 실시형태에서, 방법은 하나 이상의 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하는 단계를 포함한다.
트랜스포좀-매개 태그먼트화에 의해 제작된 태그화 단편은 임의의 적합한 시퀀싱 방법론, 예컨대 합성에 의한 시퀀싱, 리게이션에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 나노기공 시퀀싱 등을 포함하는 직접적 시퀀싱에 따라 시퀀싱될 수 있다. 일부 실시형태에서, 태그화 단편은 고체 지지체 상에서 시퀀싱된다. 일부 실시형태에서, 시퀀싱을 위한 고체 지지체는 표면 결합된 태그먼트화가 발생하는 동일한 고체 지지체이다. 일부 실시형태에서, 시퀀싱을 위한 고체 지지체는 증폭이 발생하는 동일한 고체 지지체이다.
일 예시적 시퀀싱 방법론은 합성에 의한 시퀀싱(SBS: sequencing-by-synthesis)이다. SBS에서, 핵산 주형(예를 들어, 표적 핵산 또는 이의 앰플리콘)을 따라 핵산의 연장은 주형 내의 뉴클레오티드의 서열을 결정하기 위해 모니터링된다. 근본적 화학적 공정은 중합(예를 들어, 중합효소에 의해 촉매 작용됨)일 수 있다. 특정 중합효소-기반 SBS 실시형태에서, 형광 표지된 뉴클레오티드를 주형 의존적 방식으로 프라이머에 첨가하여(이로 인해 프라이머를 연장시킴), 프라이머에 첨가된 뉴클레오티드의 순서 및 유형의 검출을 사용하여 주형의 서열을 결정할 수 있다.
플로우셀은 본 개시내용의 방법에 의해 제작된, 증폭된 DNA 단편을 수용하기 위한 편리한 고체 지지체를 제공한다. 이러한 형식의 하나 이상의 증폭된 DNA 단편은 수차례의 시약의 반복된 전달을 수반하는 SBS 또는 다른 검출 기술에 적용된다. 예를 들어, 제1 SBS 사이클을 개시하기 위하여, 하나 이상의 표지된 뉴클레오티드, DNA 중합효소 등이 하나 이상의 증폭된 핵산 분자를 수용하는 플로우셀 내로/플로우셀을 통해 흐를 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오티드가 혼입되는 이들 부위가 검출될 수 있다. 선택적으로, 일단 뉴클레오티드가 프라이머에 첨가되었다면, 뉴클레오티드는 추가 프라이머 연장을 종결시키는 가역적 종결 속성을 추가로 포함할 수 있다. 예를 들어, 가역적 종결자 모이어티를 갖는 뉴클레오티드 유사체가 프라이머에 첨가될 수 있으며, 탈블록킹제(deblocking agent)가 상기 모이어티를 제거하기 위해 전달될 때까지, 후속 연장이 발생할 수 없도록 한다. 따라서, 가역적 종결을 사용하는 실시형태의 경우, 탈블로킹 시약은 (검출이 일어나기 전에 또는 후에) 플로우셀로 전달될 수 있다. 다양한 전달 단계들 사이에 세척이 수행될 수 있다. 이어서, 사이클을 n번 반복하여 n개의 뉴클레오티드만큼 프라이머를 연장함으로써, 길이 n개의 서열을 검출할 수 있다. 본 개시내용의 방법에 의해 제작된 앰플리콘과 함께 사용하기에 용이하게 적합할 수 있는 예시적 SBS 절차, 유체 시스템, 및 검출 플랫폼은 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제 공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제 공개 WO 91/06678호; 국제 공개 WO 07/123744호; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호, 및 미국 특허출원공개 US 2008/0108082호에 기재되어 있으며, 이들 각각은 본원에 인용되어 포함된다.
순환 반응을 사용하는 다른 시퀀싱 절차, 예컨대 파이로시퀀싱(pyrosequencing)이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오티드가 신생 핵산 가닥에 혼입될 때, 무기 파이로포스페이트(PPi)의 방출을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; 문헌[Ronaghi, Genome Res. 11(1), 3-11 (2001)]; 문헌[Ronaghi et al. Science 281(5375), 363 (1998)]; 미국 특허 제6,210,891호; 미국 특허 제6,258,568호, 및 미국 특허 제6,274,320호, 이들의 각각은 본원에 인용되어 포함됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설퍼릴라제(sulfurylase)에 의해 아데노신 트리포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 수준은 루시퍼라제(luciferase)-생성 광자를 통해 검출될 수 있다. 따라서, 시퀀싱 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용되는 여기 방사선 공급원은 파이로시퀀싱 절차에는 필요하지 않다. 본 개시내용에 따라 제작된 앰플리콘에 대한 파이로시퀀싱의 적용에 적합할 수 있는 유용한 유체 시스템, 검출기, 및 절차는 예를 들어 국제 출원 WO 2012/058096호, 미국 특허출원공개 US 2005/0191698 A1호, 미국 특허 제7,595,883호, 및 미국 특허 제7,244,559호에 기재되어 있으며, 이들 각각은 본원에 포함된다.
일부 실시형태는 DNA 중합효소 활성의 실시간 모니터링을 수반하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오티드 혼입은 형광단-보유 중합효소와 γ-포스페이트-표지된 뉴클레오티드 사이의 형광 공명 에너지 전달(FRET) 상호작용을 통해 또는 제로모드 도파관(ZMW: zeromode waveguide)을 이용하여 검출될 수 있다. FRET-기반 시퀀싱을 위한 기술 및 시약은 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; 문헌[Lundquist et al. Opt. Lett. 33, 1026-1028 (2008)]; 문헌[Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 이들의 개시 내용은 본원에 인용되어 포함된다.
일부 SBS 실시형태는 뉴클레오티드의 연장 생성물 내로의 도입 시에 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 시퀀싱은 Ion Torrent(미국 코네티컷주 길포드 소재, Life Technologies의 자회사)로부터 상업적으로 입수 가능한 전기적 검출기 및 관련 기술, 또는 미국 특허출원공개 US 2009/0026082 A1호; 미국 특허출원공개 US 2009/0127589 A1; 미국 특허출원공개 US 2010/0137143 A1; 또는 미국 특허출원공개 US 2010/0282617 A1에 기재된 시퀀싱 방법 및 시스템을 사용할 수 있으며, 이들 각각은 본원에 인용되어 포함된다. 역학적 배제(kinetic exclusion)를 사용하여 표적 핵산을 증폭하기 위한 본원에 제시된 방법은 양성자를 검출하는 데 사용되는 기재에 용이하게 적용될 수 있다. 보다 구체적으로, 본원에 제시된 방법은 양성자를 검출하기 위해 사용되는 앰플리콘의 클론 집단을 제작하는 데 사용될 수 있다.
다른 유용한 시퀀싱 기술은 나노기공 시퀀싱이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer et al. Acc. Chem. Res. 35:817-825 (2002)]; 문헌[Li et al. Nat. Mater. 2:611-615 (2003)]을 참조하며, 이들의 개시내용은 본원에 인용되어 포함됨). 일부 나노기공 실시형태에서, 표적 핵산 또는 표적 핵산으로부터 제거된 개별 뉴클레오티드는 나노기공을 통과한다. 핵산 또는 뉴클레오티드가 나노기공을 통해 통과할 때, 각각의 뉴클레오티드 유형은 기공의 전기 전도도의 변동을 측정함으로써 식별될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001 (2007)]; 문헌[Healy, Nanomed. 2, 459-481 (2007)]; 문헌[Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)], 이들의 개시 내용은 본원에 인용되어 포함됨).
본 개시내용에 따른 검출에 적용될 수 있는 어레이-기반 발현 및 유전자형 분석을 위한 예시적 방법은 미국 특허 제7,582,420호; 미국 특허 제6,890,741호; 미국 특허 제6,913,884호, 또는 미국 특허 제6,355,431호, 또는 미국 특허출원공개 US 2005/0053980 A1호; 미국 특허출원공개 US 2009/0186349 A1호, 또는 미국 특허출원공개 US 2005/0181440 A1호에 기재되어 있으며, 이들 각각은 본원에 인용되어 포함된다.
본원에 제시된 방법의 한 가지 이점은 이들이 병렬로 복수의 표적 핵산의 신속하고, 효율적인 검출을 제공한다는 것이다. 따라서, 본 개시내용은 상기 예시된 것들과 같은 당업계에 알려진 기술을 사용하여 핵산을 제작 및 검출할 수 있는 통합 시스템을 제공한다. 따라서, 본 개시내용의 통합 시스템은 증폭 시약 및/또는 시퀀싱 시약을 하나 이상의 고정된 DNA 단편으로 전달할 수 있는 유체 구성요소를 포함할 수 있으며, 상기 시스템은 펌프, 밸브, 저장소, 유체 라인 등과 같은 구성요소를 포함한다. 플로우셀은 표적 핵산의 검출을 위한 통합 시스템 내에 구성되고/되거나 사용될 수 있다. 예시적 플로우셀은 예를 들어 미국 특허출원공개 US 2010/0111768 A1호 및 미국 특허출원공개 US 2012/0270305 A1에 기재되어 있으며, 이들 각각은 본원에 인용되어 포함된다. 플로우셀에 대해 예시된 바와 같이, 통합 시스템의 하나 이상의 유체 구성요소가 증폭 방법 및 검출 방법에 사용될 수 있다. 핵산 시퀀싱 실시형태를 일 예로서 들면, 통합 시스템의 하나 이상의 유체 구성요소가 본원에 제시된 증폭 방법을 위해 그리고 상기 예시된 것들과 같은 시퀀싱 방법에서 시퀀싱 시약의 전달을 위해 사용될 수 있다. 대안적으로, 통합 시스템은 증폭 방법을 수행하기 위해 그리고 검출 방법을 수행하기 위해 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성하고, 또한 핵산의 서열을 결정할 수 있는 통합 시퀀싱 시스템의 예는 제한 없이 MiSeqTM 플랫폼(미국 캘리포니아주 샌디에고 소재의 Illumina, Inc.) 및 미국 특허 출원 제2012/0270305호에 개시된 장치를 포함하며, 상기 특허는 본원에 인용되어 포함된다.
J. 표적 핵산을 시퀀싱할 때의 근접성 정보 보존
일부 실시형태에서, 근접성 정보는 표적화 올리고뉴클레오티드를 기반으로 보존된다.
일부 실시형태에서, 표적 핵산을 시퀀싱할 때, 근접성 정보를 보존하는 방법은 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체를 포함하는 방법을 이용하여 표적 핵산의 태그화 단편을 제작하는 단계; 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계; 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 단편들의 서열을 그룹화하는 단계; 및 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계를 포함한다.
근접성 정보는 또한 고유한 분자 식별자(UMI) 서열을 포함하는 어댑터 서열을 기반으로 보존될 수 있다. 일부 실시형태에서, 표적 핵산을 시퀀싱할 때, 근접성 정보를 보존하는 방법은 재조합효소로 코팅된 표적화 올리고뉴클레오티드를 포함하는 표적화된 트랜스포좀 복합체를 사용하여 표적 핵산의 태그화 단편을 제작하는 단계 - 여기서 하나 이상의 어댑터 서열은 단일 표적화 올리고뉴클레오티드 서열과 회합된 고유 분자 식별자(UMI)를 포함함 -; 5' 태그화 단편 또는 완전한 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계; 동일한 UMI의 서열을 포함하는 단편의 서열들을 그룹화하는 단계; 및 동일한 UMI의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계를 포함한다.
표적화된 트랜스포좀은 또한 고정된 폴리뉴클레오티드의 물리적 맵을 생성하는 방법에 사용될 수 있다. 본 방법은 연결된 서열을 함유할 가능성이 있는 클러스터(즉, 동일한 표적 폴리뉴클레오티드 분자로부터의 제1 및 제2 부분)를 식별하기 위해 유리하게 이용될 수 있다. 따라서, 고정된 폴리뉴클레오티드로부터 수득되는 임의의 2개의 클러스터의 상대적 근접성은 2개의 클러스터로부터 얻은 서열 정보의 정렬에 유용한 정보를 제공한다. 구체적으로, 고체 표면 상의 임의의 2개의 소정의 클러스터들 사이의 거리는 국제 공개 WO 2012/025250호에 보다 상세하게 기재된 바와 같이, 2개의 클러스터가 동일한 표적 폴리뉴클레오티드 분자로부터 유래될 확률과 양의 상관관계가 있으며, 상기 특허는 그 전체 내용이 본원에 인용되어 포함된다.
일 예로서, 일부 실시형태에서, 플로우셀의 표면 상에 신장된 긴 DNA 분자는 인시츄(in situ)로 태그먼트화되어 플로우셀의 표면 전반에 걸쳐 연결된 DNA 브릿지의 라인을 수득한다. 또한, 고정된 DNA의 물리적 맵. 따라서, 물리적 맵은 고정된 DNA가 증폭된 후의 클러스터의 물리적 관계와 상관관계가 있다. 구체적으로, 물리적 맵은 국제 공개 WO 2012/025250호의 포함된 자료에 기재된 바와 같이, 임의의 2개의 클러스터로부터 얻은 서열 데이터가 연결될 확률을 계산하는 데 사용된다.
일부 실시형태에서, 물리적 맵은 고체 표면 전반에 걸쳐 고정된 DNA 분자의 위치를 규명하기 위해 DNA를 이미지화함으로써 생성된다. 일부 실시형태에서, 고정된 DNA는 이미징제(imaging agent)를 고체 지지체에 첨가하고, 이미징제로부터의 신호를 검출함으로써 이미지화된다. 일부 실시형태에서, 이미징제는 검출 가능한 표지이다. 적합한 검출 가능한 표지는 양성자, 합텐, 방사성 핵종, 효소, 형광 표지, 화학발광 표지, 및/또는 발색제를 포함하지만, 이로 제한되지는 않는다. 예를 들어, 일부 실시형태에서, 이미징제는 삽입 염료(intercalating dye) 또는 비-삽입 DNA 결합제이다. 비제한적으로 미국 특허출원공개 US 2012/0282617호에 제시된 것들을 포함하는 당업계에 알려진 임의의 적합한 삽입 염료 또는 비-삽입 DNA 결합제가 사용될 수 있으며, 상기 특허는 그 전체 내용이 본원에 인용되어 포함된다.
일부 실시형태에서, 고정된 DNA 듀플렉스를 추가로 단편화하여 가닥 교환 및 클러스터 생성 전에 자유 말단을 유리시킨다. 브릿지 구조의 절단은 국제 공개 WO 2012/025250호의 포함된 자료에 의해 예시된 당업계에 알려진 임의의 적합한 방법론을 사용하여 수행될 수 있다. 예를 들어, 절단은 국제 공개 WO 2012/025250호에 기재된 우라실과 같은 변형된 뉴클레오티드의 혼입에 의해, 제한 엔도뉴클레아제 부위의 혼입에 의해, 또는 본원에 다른 곳에서 기재된 바와 같이 용액상 트랜스포좀 복합체를 브릿지된 DNA 구조에 적용함으로써 발생할 수 있다.
특정 실시형태에서, 복수의 핵산은 복수의 나노채널을 포함하는 플로우셀 상으로 흐르며, 나노채널은 그에 고정된 복수의 트랜스포좀 복합체를 갖는다. 본원에 사용된 용어 나노채널은 긴 선형 핵산 분자가 흐르는 좁은 채널을 지칭한다. 일부 실시형태에서, 표적 DNA의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 이하, 또는 1000개 이하의 개별적 긴 가닥이 각각의 나노채널 내로 흐른다. 일부 실시형태에서, 개별적 나노채널은 표적 DNA의 개별적 긴 가닥이 다수의 나노채널과 상호작용하는 것을 방지하는 물리적 장벽에 의해 분리된다. 일부 실시형태에서, 고체 지지체는 적어도 10, 50, 100, 200, 500, 1000, 3000, 5000, 10000, 30000, 50000, 80000, 또는 100000개의 나노채널을 포함한다. 일부 실시형태에서, 나노채널의 표면에 결합된 트랜스포좀은 DNA를 태그먼트화한다. 이어서, 예를 들어 이들 채널 중 하나의 길이를 따라 클러스터를 전개함으로써 근접성 맵핑이 수행될 수 있다. 일부 실시형태에서, 표적 DNA의 긴 가닥은 길이가 적어도 0.1kb, 1kb, 2kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb, 10kb, 15kb, 20kb, 25kb, 30kb, 35kb, 40kb, 45kb, 50kb, 55kb, 60kb, 65kb, 70kb, 75kb, 80kb, 85kb, 90kb, 95kb, 100kb, 150kb, 200kb, 250kb, 300kb, 350kb, 400kb, 450kb, 500kb, 550kb, 600kb, 650kb, 700kb, 750kb, 800kb, 850kb, 900kb, 950kb, 1000kb, 5000kb, 10000kb, 20000kb, 30000kb, 또는 50000kb일 수 있다. 일부 실시형태에서, 표적 DNA의 긴 가닥은 길이가 0.1kb, 1kb, 2kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb, 10kb, 15kb, 20kb, 25kb, 30kb, 35kb, 40kb, 45kb, 50kb, 55kb, 60kb, 65kb, 70kb, 75kb, 80kb, 85kb, 90kb, 95kb, 100kb, 150kb, 200kb, 250kb, 300kb, 350kb, 400kb, 450kb, 500kb, 550kb, 600kb, 650kb, 700kb, 750kb, 800kb, 850kb, 900kb, 950kb 이하, 또는 1000kb 이하이다. 일 예로서, 나노채널 내에 맵핑된, 고정된 태그먼트화 생성물을 갖는 1000개 이상의 나노채널을 갖는 플로우셀이 짧은 '배치된(positioned)' 판독물을 갖는 유기체의 게놈을 시퀀싱하는 데 사용될 수 있다. 일부 실시형태에서, 나노채널 내의 맵핑된, 고정된 태그먼트화 생성물은 일배체형을 분석하는 데 사용될 수 있다. 일부 실시형태에서, 나노채널 내의 맵핑된, 고정된 태그먼트화 생성물은 위상 조정(phasing) 문제를 분석하는 데 사용될 수 있다.
IV. 세포 유리 DNA를 포함하는 샘플과 함께 표적화된 트랜스포좀 복합체를 사용하는 방법
본원에 기재된 표적화된 트랜스포좀은 단순화된 라이브러리 제작 및 농축 프로토콜에서의 표적화된 전위에 사용될 수 있다. 일부 실시형태에서, 단순화된 프로토콜은 기존 프로토콜에 비해 더 적은 시간 또는 사용자 단계가 필요하다. 일부 실시형태에서, 하나 이상의 관심 핵산 서열은 히스톤과 회합된 DNA 내에 포함된다. 일부 실시형태에서, 히스톤과 회합된 DNA는 세포 유리 DNA이다.
일부 실시형태에서, 단순화된 라이브러리 제작 및 농축 프로토콜은 도 15에 나타낸 예시적 방법과 같이 세포 유리 DNA(cfDNA)와 함께 사용하기 위한 것이다. cfDNA에 대한 본 라이브러리 제작은 일반적으로 몇몇의 단계를 수반한다: 혈청으로부터의 cfDNA 추출(30분), 말단 복원(30분), A-꼬리화(30분), 비-랜덤 고유 분자 식별자(UMI)의 리게이션(30분), 어댑터의 리게이션(30분), 및 SPRI 정화 이후, PCR 증폭(약 30분). 표준 방법에서의 혈장으로부터의 cfDNA 추출은 프로테아제 단계(예를 들어, VeriSeq NIPT를 위한 프로토콜을 제공하는 Illumina 문서#1000000001856 v06(2020년 4월)에 기재된 프로테이나제 K)를 포함할 수 있다. 이들 단계를 기반으로 cfDNA 라이브러리를 제작하는 것은 시간 소모적이고, 자동화하기 어려운 비효율적인 공정이다.
혈장 중의 세포 유리 DNA(cfDNA)는 히스톤과 회합된 상태로 존재하는 것으로 알려진다(문헌[Marshman et al., Cell Death and Disease (2016) 7, e2518] 및 문헌[Rumore and Steinman J. Clin Inv. 86:69-74 (1990)] 참조). 혈장 샘플 중에서 직접 태그먼트화를 수행하는 데 있어서의 핵심 문제는 cfDNA로부터 히스톤을 제거하는 것이다. 히스톤을 제거하는 방법은 프로테아제 단계를 수반할 수 있으며, 이러한 프로테아제는 또한 태그먼트화에 관여하는 단백질을 분해시킬 수 있다. 예를 들어, VeriSeq 비침습적 산전 시험(NIPT) 방법(Illumina)에서의 혈장으로부터의 cfDNA 추출은 프로테아제 단계(VeriSeq NIPT 용액 패키지 삽입물, Illumina 문서 # 1000000001856 v06(2020년 4월)에 기재된 프로테이나제 K) 이후, 라이브러리 제작 전에 다수의 세척 단계를 포함한다. 히스톤을 제거할 필요 없이, 특정 관심 서열(예컨대, 게놈 내의 유전자)에 대한 트랜스포좀의 표적화는 cfDNA를 포함하는 샘플을 이용하는 작업 흐름을 유의하게 단순화할 수 있다.
아연 집게 DNA-결합 도메인은 아연 집게 뉴클레아제를 편집을 위해 게놈의 특정 영역으로 표적화할 수 있다(문헌[Costa et al., Genome Editing Using Engineered Nucleases and Their Use in Genomic Screening, PMID: 29165977, in Assay Guidance Manual (Markossian et al., editors) (2017)] 참조). 구체적으로, ZFN은 히스톤에 결합된 DNA를 효율적으로 절단하는 능력을 보유하는 반면, Cas9 뉴클레아제는 DNA가 히스톤에 결합되어 있을 때 강하게 억제된다(문헌[Yarringon et al., PNAS 115(38):9351-9358 (2018)] 참조).
일부 실시형태에서, 히스톤에 결합된 DNA는 뉴클레오솜 내에 포함될 수 있다. 본원에 사용된 "뉴클레오솜"은 8개의 히스톤 단백질 주위에 감긴 DNA의 세그먼트로 구성된 구조를 지칭한다. 일부 실시형태에서, 히스톤에 결합된 DNA는 세포 유리 DNA이다. 예시적 세포 유리 DNA는 임신한 여성(cfDNA는 태아로부터 유래될 수 있음) 또는 알고 있거나, 의심되는 암을 갖는 환자(cfDNA는 종양 세포로 유래될 수 있음)로부터의 혈액 샘플 중에 포함되는 cfDNA일 수 있다.
일부 실시형태에서, 표적화된 트랜스포좀은 아연 집게 DNA-결합 도메인에 의해 cfDNA 내의 하나 이상의 영역에 표적화된다. 일부 실시형태에서, 히스톤-결합된 DNA(예컨대, cfDNA)는 아연 집게 DNA-결합 도메인을 포함하는 표적화된 트랜스포좀을 사용하여 태그먼트화된다.
일부 실시형태에서, 본 방법은 단편화 후에 고체 지지체 상에 친화성 결합 파트너를 첨가하는 단계를 추가로 포함하며, 태그화 표적 단편은 고체 지지체에 결합된다. 일부 실시형태에서, 단편화는 고체 지지체 상에 친화성 요소를 첨가하기 전에 중단된다. 일부 실시형태에서, 단편화는 프로테이나제 K 및/또는 SDS를 포함하는 용액의 첨가에 의해 중단된다.
예를 들어, 아연 집게 DNA-결합 도메인을 포함하는 트랜스포좀 복합체는 도 15에 나타낸 바와 같이 cfDNA 내의 특정 관심 서열에 표적화될 수 있다. 일부 실시형태에서, 표적화된 트랜스포좀 내에 포함된 아연 집게 DNA-결합 도메인은 종양유전자 내부 또는 그 근처에 포함된 서열에 결합하여 암을 가진 환자로부터의 샘플 내의 cfDNA로부터의 표적화된 라이브러리를 생성함으로써 기능 획득 돌연변이가 cfDNA 내에 존재하는지 여부를 평가할 수 있다. 대안적으로, 표적화된 트랜스포좀 내에 포함된 아연 집게 DNA-결합 도메인은 종양 억제 유전자 내부 또는 그 근처에 포함된 서열에 결합하여 cfDNA로부터의 특정 라이브러리를 생성함으로써 기능 상실 돌연변이(즉, 활성 돌연변이)가 cfDNA 내에 존재하는지 여부를 평가할 수 있다. 이러한 방식으로, 이러한 표적화된 트랜스포존은 보다 공격적인 종양과 연관되거나, 더 좋지 않은 예후와 연관된 암 세포에서의 변화를 평가하기 위한 표적화된 라이브러리를 생성하는 데 사용될 수 있다.
유사하게, cfDNA로부터의 표적화된 라이브러리는 유전병과 연관된 특정 유전자 서열을 평가하는 데 사용될 수 있다. 이들 유전병은 유전자 서열에서의 알려진 변화에 의해 유발되는 알려진 유전성 질환, 예컨대 테이-삭스 질환, 낭포성 섬유증, 및 당업자에게 더 잘 알려진 다수의 질환일 수 있다. 일부 실시형태에서, 표적화된 트랜스포좀 내에 포함된 아연 집게 DNA-결합 도메인은 유전성 질환과 연관된 유전자 내부 또는 그 근처에 포함된 서열에 결합하여 표적화된 라이브러리를 생성할 수 있다. 일부 실시형태에서, 표적화된 라이브러리는 태아로부터의 cfDNA를 포함하는 모계 혈장을 사용하는 산전 시험에서 SNP 또는 다른 돌연변이에 대한 관심 유전자의 시퀀싱 영역을 위한 것일 수 있다.
V. 단일 세포 핵산의 분류 및 선택 방법
"오믹" 특성(들)을 기반으로 세포 분류가 가능하도록 핵산 선택 기술과 조합하여 sc-NGS(단일 세포 차세대 시퀀싱) 방법을 이용하는 방법이 본원에 기재된다. 본 방법은 sc-라이브러리 구성원을 농축 또는 고갈시키기 위해 고유한 세포 바코드를 표적화하는 단계를 포함할 수 있다. 2-시퀀싱 단계 작업 흐름을 포함하는 본 작업 흐름은 초기 시퀀싱 실행이 어떠한 세포가 소기의 세포의 선택 후에 제2 보다 포괄적인 시퀀싱 실행에서 추가의 '오믹' 데이터를 얻는지를 결정하는 데 사용되는 세포 데이터베이스를 생성하는 다루기 쉬운 방법론을 제공한다. 도 3은 이러한 분류 및 선택 방법의 개요를 제공하며, 초기 16s 시퀀싱이 관심 세포-바코드 ID를 결정하는 데 사용된 다음, 소기의 샘플의 농축 또는 원하지 않는 샘플의 고갈이 이어진다. 농축/고갈 후, 소기의 샘플은 포괄적인 시퀀싱을 겪을 수 있다.
일부 실시형태에서, 세포 선택은 그들의 부여된 UBC를 기반으로 sc-라이브러리로부터 관심이 적은 풍부한 세포와 같은 원하지 않는 샘플을 고갈시킴으로써 획득된다. 이러한 고갈 후의 2차 시퀀싱은 소기의 샘플, 즉, 라이브러리 내에 희귀할 수 있는 관심 세포로부터 생성된 DNA 라이브러리를 특성화할 수 있다. 일부 실시형태에서, 세포 선택은 sc-라이브러리로부터 그들의 부여된 UBC를 사용하여 소기의 샘플을 농축시킴으로써 획득된다. 소기의 이들 샘플은 샘플 내에 희귀하거나, 낮은 풍부도의 것일 수 있다.
VI. 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법
소기의 샘플 및 원하지 않는 샘플 둘 모두를 포함하는 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법이 본원에 기재된다. 일부 실시형태에서, 본 방법은 샘플의 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리를 초기 시퀀싱하여 이중 가닥화 핵산으로부터의 시퀀싱 데이터를 제작하는 단계를 포함한다. 일부 실시형태에서, 각각의 핵산 라이브러리는 라이브러리 내의 다른 샘플로부터의 핵산으로부터 단일 샘플로부터의 핵산을 구별하기 위한 고유한 샘플 바코드 및 단일 샘플로부터의 핵산을 포함한다.
본 방법은 소기의 게놈 특성(소기의 게놈 특성은 특정 유전자 돌연변이의 존재, 소정의 유전자의 메틸화 상태 등일 수 있음)을 갖는 세포와 연관된 바코드를 기반으로 소정의 집단 내의 단일 세포를 특성화하는 비용 효율적 수단일 수 있다. 이러한 소기의 게놈 특성은 초기 시퀀싱에 이어서 선택 단계 및 이후 관심 단일 세포에 대한 추가의 정보를 제공하기 위한 재시퀀싱으로부터 결정될 수 있다. 바코드를 혼입하는 대표적 방법은 도 5 및 도 6에 제시되어 있다.
일부 실시형태에서, 본 방법은 또한 시퀀싱 데이터를 분석하는 단계 및 소기의 샘플로부터 시퀀싱 데이터와 연관된 고유한 샘플 바코드를 식별하는 단계; 소기의 샘플로부터의 핵산 샘플을 농축하는 단계 및/또는 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계를 포함하는, 라이브러리에 대한 선택 단계를 수행하는 단계; 및 핵산 라이브러리를 재시퀀싱하는 단계를 포함한다.
일부 실시형태에서, 재시퀀싱은 직교 재시퀀싱이다. 본원에서 사용된 "직교 재시퀀싱"은 초기 시퀀싱과 비교하여 상이한 생리학적 특징을 분석하는 재시퀀싱을 지칭한다. 예를 들어, 초기 시퀀싱은 메틸화 상태를 평가할 수 있고, 재시퀀싱은 소기의 메틸화 패턴을 갖는 세포의 포괄적인 게놈의 광범위한 시퀀싱일 수 있다. 바꾸어 말하면, 초기 시퀀싱 및 재시퀀싱은 샘플의 혼합된 풀의 동일한 특징을 평가할 수 있지만, 초기 시퀀싱 및 재시퀀싱은 또한 소기의 샘플의 상이한 특성을 평가할 수도 있다.
본 방법의 한 가지 이점은 소기의 샘플에 대한 시퀀싱 데이터를 생성하는 데 보통 사용될 수 있는 특정 단계를 피할 수 있다는 것이다. 바꾸어 말하면, 본 방법은 다른 방법보다 더 빠르거나, 더 용이할 수 있거나, 결과를 편향시킬 수 있는 단계를 피할 수 있다. 일부 실시형태에서, 본 방법은 세포 분류-기반 농축 방법을 이용하지 않는다. 일부 실시형태에서, 본 방법은 FACS를 이용하지 않는다. 일부 실시형태에서, 본 방법은 세포 크기, 형태, 또는 표면 단백질 발현을 기반으로 하는 FACS를 이용하지 않는다. 일부 실시형태에서, 본 방법은 미세유체공학을 이용하지 않는다. 일부 실시형태에서, 본 방법은 전체 게놈 증폭을 이용하지 않는다. 본 방법에서 이들 단계를 피하는 것은 소기의 샘플에 대한 포괄적인 시퀀싱 데이터를 생성하는 데 필요한 시간 및 비용을 감소시킬 수 있다. 또한, 이들 단계를 피하는 것은 특정 방법으로부터 유래되는 편향을 피할 수 있다(예컨대, 세포를 FACS 방법론을 이용하여 분류하기 위해 표면 단백질 발현에 의존하는 것).
또한, 본 시퀀싱 및 분석 방법은 또한 FACS 기계 등의 필요 없이, 시퀀싱 시스템을 사용하여 수행될 수 있다.
일부 실시형태에서, 초기 시퀀싱 결과는 초기 시퀀싱이 사전의 분류 단계에 의해 편향되지 않고, 선택 단계를 가이드하는 데 사용될 수 있다. 본 방법에 의해, 당업자는 관심 특성에 대한 초기 시퀀싱에 의해 복수의 단일 세포 라이브러리를 분류하고, 이들 초기 서열 결과를 사용하여 어떠한 세포가 소기의 세포인지를 결정하고, 이어서 소기의 세포를 선택하고, 재시퀀싱할 수 있다.
본 방법의 다른 이점이 본원에 설명될 것이다.
A. 라이브러리의 제작
이들 방법의 초기 시퀀싱 단계는 샘플의 혼합된 풀로부터 복수의 핵산 샘플을 포함하는 라이브러리를 생성하는 임의의 수단일 수 있다. 일부 실시형태에서, 라이브러리는 단일 세포 라이브러리(sc-라이브러리)이다. 본원에 사용된 "단일 세포 라이브러리" 또는 "sc-라이브러리"는 세포의 혼합된 집단 내의 단일 세포로부터 생성된 라이브러리를 지칭한다. 그러나, 라이브러리는 또한 혼합된 집단 내의 단일 핵, 바이러스, 또는 고분자량(HMW) DNA로부터의 라이브러리일 수 있다. 따라서, 본 방법은 다양한 혼합된 집단과 함께 사용될 수 있고, sc-라이브러리와 함께 사용하기 위해 기재된 임의의 방법이 다른 유형의 라이브러리에 사용될 수 있다.
일부 실시형태에서, 본 방법은 라이브러리의 인덱싱 후 그러나 라이브러리의 포괄적 시퀀싱 전에 수행된다.
일부 실시형태에서, 핵산 라이브러리는 라이브러리 내의 다른 샘플로부터의 핵산으로부터 단일 샘플로부터의 핵산을 구별하기 위한 고유한 샘플 바코드를 포함하는 단일 샘플로부터의 핵산을 포함한다. 이러한 라이브러리를 생성하는 광범위하게 다양한 수단이 당업계에 잘 알려져 있다. 본 방법의 한 가지 이점은 다수의 상이한 방식을 통해 생성되는 라이브러리와 함께 사용될 수 있다는 것이다. 따라서, 당업자는 그들 자신의 선호도를 기반으로 샘플의 혼합된 풀로부터 복수의 핵산 샘플을 포함하는 라이브러리를 생성하는 특정 방법을 선택하고, 초기 시퀀싱을 수행할 수 있다. 이어서, 개시된 방법은 고유한 샘플 바코드를 기반으로 하는 선택에 이어서 재시퀀싱에 사용될 수 있다.
sc-시퀀싱의 대표적 방법은 국제 공개 WO 2016/130704호의 것들을 포함하며, 이는 본원에 인용되어 포함된다. 일부 실시형태에서, 본 방법은 고유한 샘플 바코드를 혼입하기 전에 핵산 샘플을 공간적으로 분리하는 단계를 포함한다.
이들 방법은 고유한 세포 바코드(UBC) 또는 고유한 샘플 바코드를 이용하는 임의의 sc-라이브러리 생성 및 시퀀싱 방법에 적용 가능하다. 예시적 sc-라이브러리 생성/시퀀싱 방법은 Biorad ddSEQ(예를 들어, Illumina Bio-Rad SureCell WTA 3' 라이브러리 제작 키트 사용), 다양한 10X Genomics 시스템(예컨대, 크롬 단일 세포 발현), Drop-Seq(문헌[Macosko et al., Cell 161(5):1202-1214 (2015)] 참조), InDrop™(1CellBio), TapestriTM 플랫폼(MissionBio), Split-Seq(문헌[Rosenburg et al., Science 360(6385):176-182 (2018)] 참조), 또는 Illlumina의 단일 세포 조합 인덱싱 시퀀싱(SCI-seq, 문헌[Cao et al., Science 357(6352): 661-667 (2017)] 참조)을 포함하며, 이들 모두는 라이브러리 생성 및 시퀀싱 방법의 개시내용에 인용되어 포함된다.
일부 실시형태에서, 본 방법은 샘플의 혼합된 풀로부터 복수의 핵산 샘플을 시퀀싱하기 전에 태그먼트화를 포함한다. 일부 실시형태에서, 라이브러리는 태그먼트화를 사용하여 생성된다. 일부 실시형태에서, 태그먼트화는 고유한 샘플 바코드를 각각의 핵산 샘플 내로 혼입한다.
일부 실시형태에서, 범용 프라이머는 핵산 라이브러리 내의 각각의 핵산 샘플 내로 혼입된다. 일부 실시형태에서, 범용 프라이머는 라이브러리 제작 동안 각각의 핵산 샘플 내로 혼입된다. 일부 실시형태에서, 범용 프라이머는 P5 및 P7 프라이머이다. 일부 실시형태에서, P5 및 P7 서열은 핵산 라이브러리 내의 각각의 핵산 샘플 내로 혼입된다.
일부 실시형태에서, i5 및 i7 서열은 핵산 라이브러리 내의 각각의 핵산 샘플 내로 혼입된다. 일부 실시형태에서, i5 및 i7 서열은 라이브러리 제작 동안 각각의 핵산 샘플 내로 혼입된다.
B. 초기 시퀀싱
일부 실시형태에서, 비표적화된 초기 시퀀싱은 복수의 단일 세포를 특성화하는 데 이로울 수 있고, 이후, 선택 및 재시퀀싱이 집단을 갖는 관심 단일 세포를 추가로 분석하기 위해 수행될 수 있다. 일부 실시형태에서, 초기 시퀀싱은 원하지 않는 샘플과 연관된 고유한 샘플 바코드를 식별한다. 일부 실시형태에서, 초기 시퀀싱은 소기의 샘플과 연관된 고유한 샘플 바코드를 식별한다.
일부 실시형태에서, 표적화된 초기 시퀀싱은 단일 세포의 집단 내의 관심 세포를 결정할 수 있고(즉, 소기의 샘플을 결정함), 이들 관심 세포로부터 생성된 라이브러리가 이어서 선택되고, 재시퀀싱되어 추가의 정보를 제공할 수 있다.
일부 실시형태에서, 초기 시퀀싱 단계는 표적화된 시퀀싱을 포함하고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함한다. 일부 실시형태에서, 초기 시퀀싱은 유전자-특이적 시퀀싱일 수 있다. 일부 실시형태에서, 초기 시퀀싱은 16s 시퀀싱일 수 있다.
일부 실시형태에서, 초기 시퀀싱 단계는 (도 7에 예시된 바와 같이) 하나 이상의 유전자-특이적 프라이머를 이용한 표적화된 시퀀싱을 포함한다. 일부 실시형태에서, 유전자-특이적 프라이머는 범용 프라이머 꼬리를 포함한다.
일부 실시형태에서, 초기 시퀀싱 단계는 전체 게놈 시퀀싱을 포함하지 않고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함한다. 바꾸어 말하면, 초기 시퀀싱은 덜 포괄적일 수 있으며, 재시퀀싱은 더 포괄적이다. 이러한 접근법은 원하지 않는 샘플의 재시퀀싱을 피함으로써 소기의 샘플에 대한 포괄적 데이터를 생성하는 데 필요한 시간/비용을 극적으로 감소시킬 수 있다.
일부 실시형태에서, 초기 시퀀싱 단계는 리보좀 시퀀싱을 포함하며, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함한다. 일부 실시형태에서, 리보좀 시퀀싱은 16s, 18s, 또는 내부 전사된 스페이서 시퀀싱을 포함한다. 일부 실시형태에서, 내부 전사된 스페이서 영역은 16s rRNA 유전자와 23s rRNA 유전자 사이에 위치한다. 일부 실시형태에서, 리보좀 시퀀싱은 상이한 종으로부터의 샘플을 포함하는 샘플의 혼합된 풀을 포함하는 샘플 내의 종을 결정하는 데 사용된다. 예를 들어, 리보좀 시퀀싱은 메타 유전체학 샘플 내의 박테리아 종을 결정하는 데 사용될 수 있다. 일부 실시형태에서, 재시퀀싱은 관심 종으로부터의 이들 소기의 샘플을 농축하거나, 관심 없는 종으로부터의 원하지 않는 샘플을 고갈시킨 후에 관심 종의 전체 게놈 시퀀싱을 포함한다.
일부 실시형태에서, 초기 시퀀싱은 세포 집단을 특성화하고, 이어서 재시퀀싱이 이어진다. 예를 들어, 초기 시퀀싱은 혈액 샘플 내의 소기의 세포 유형의 세포를 식별할 수 있고, 재시퀀싱은 특별히 이들 세포에 초점을 맞출 수 있다.
1. 표적화된 초기 시퀀싱
일부 실시형태에서, 초기 시퀀싱은 표적화된 시퀀싱이다. 본원에 사용된 표적화된 시퀀싱은 표적 핵산 영역의 시퀀싱을 지칭한다. 예를 들어, 표적화된 시퀀싱은 표적 게놈 내의 특정 유전자의 시퀀싱일 수 있다.
도 7은 표적화된 초기 시퀀싱이 수행될 수 있는 방법의 예를 보여준다. 복수의 세포 핵산 라이브러리를 포함하는 sc-라이브러리가 제작될 수 있으며, 각각의 라이브러리는 하나 이상의 UBC로 마킹된다. 각각의 세포 핵산 라이브러리 내의 단편은 일 말단에서 P5 서열을 포함하며, 다른 말단에서 P7 서열을 포함한다. sc-라이브러리로부터 증폭에 특이적인 표적 유전자를 생성하기 위해, P7-꼬리화, 유전자-특이적 프라이머가 P5 프라이머와 함께 사용될 수 있다. 이러한 방식으로, 관심 유전자를 포함하는 단편이 특이적으로 증폭되고, 이어서 증폭된 단편 내에 포함된 판독 1 및 판독 2 프라이머 서열을 기반으로 하는 초기 시퀀싱에 사용될 수 있다. 초기 시퀀싱 결과의 분석은 표적 유전자에 대한 관심 서열을 발현하였던 세포로부터의 세포 핵산 라이브러리와 연관된 UBC를 식별할 수 있다. 이어서, 선택이 수행된 다음, 소기의 샘플을 시퀀싱할 수 있다.
일부 실시형태에서, 표적화된 초기 시퀀싱은 관심 박테리아 분류군 또는 종과 연관된 16s rRNA 서열을 식별한다. 일부 실시형태에서, 표적화된 초기 시퀀싱은 돌연변이를 발현하는 KRAS G12 유전자를 포함하는 암 생검에서의 세포를 식별한다. 소기의 샘플의 초기 시퀀싱 및 식별 후, 소기의 샘플이 농축되거나, 원하지 않는 샘플이 고갈될 수 있다. 선택된 세포 핵산 라이브러리는 관심 단일 세포의 서열을 더 잘 이해하기 위해 보다 심층 시퀀싱 또는 전체 게놈 분석에 사용될 수 있다.
유사한 접근법이 임의의 관심 유전자와 함께 사용될 수 있다. 또한, 초기 시퀀싱은 표적 핵산의 차별적 영역에서의 mRNA 발현 수준 또는 메틸화 상태를 검정하여 상이한 바코드에 상응하는 세포 유형을 분류할 수 있다. 후성적 인자가 초기 시퀀싱에서 평가될 때, 재시퀀싱은 이어서 소기의 표현형의 세포의 포괄적 전체 게놈 시퀀싱을 제공할 수 있다.
2. 초기 시퀀싱으로부터 얻은 대표적 시퀀싱 정보
이들 방법에서, 초기 시퀀싱은 "오믹" 특성을 기반으로 하는 분류를 위한 서열 정보를 제공할 수 있다. 일부 실시형태에서, 초기 시퀀싱은 게놈 특성에 대한 정보, 예컨대 하나 이상의 유전자의 서열 또는 변이체를 제공한다. 일부 실시형태에서, 샘플로부터의 DNA는 시퀀싱되어 게놈 데이터를 생성한다. 일부 실시형태에서, 초기 시퀀싱은 상이한 유전자의 발현과 같은 전사체 특성에 대한 정보를 제공한다. 일부 실시형태에서, 샘플로부터의 RNA는 시퀀싱되어 전사체 데이터를 생성한다. 일부 실시형태에서, 초기 시퀀싱은 메틸화 마크 또는 패턴에 대한 데이터를 제공한다. 일부 실시형태에서, 샘플로부터의 DNA는 메틸화 분석에 사용된다. 일부 실시형태에서, 메틸화 분석은 바이설파이트 시퀀싱이다. 일부 실시형태에서, 단일 세포는 분류될 수 있고, 이어서 단일 세포로부터의 샘플은 바이설파이트 시퀀싱 및 메틸화 분석에 사용될 수 있다. 이러한 임의의 초기 시퀀싱 방법론의 경우, 시퀀싱은 전체 게놈 또는 표적화된 시퀀싱일 수 있다.
일부 실시형태에서, 초기 시퀀싱은 메타 유전체학 데이터를 생성하는 데 사용된다. 일부 실시형태에서, 초기 시퀀싱은 다수의 종으로부터의 샘플을 포함하는 샘플의 혼합된 풀 내의 종을 식별하는 데 사용된다. 일부 실시형태에서, 초기 시퀀싱은 다수의 종으로부터의 샘플을 포함하는 샘플의 혼합된 풀 내의 풍부한 종을 식별하는 데 사용된다. 이어서, 재시퀀싱은 소기의 종에 대한 추가의 시퀀싱 데이터를 생성할 수 있다. 일부 실시형태에서, 종은 박테리아 종이다. 일부 실시형태에서, 샘플의 혼합된 풀은 환자로부터 단리된 박테리아의 혼합된 풀을 포함한다.
초기 시퀀싱 데이터는 임의의 생물정보학 접근법으로 분석될 수 있다. 초기 시퀀싱 결과의 분석은 사용자가 본 방법을 사용하기를 원하는 방법에 따라 좌우될 것이다. 바꾸어 말하면, 사용자는 샘플을 소기의 샘플 및 원하지 않는 샘플로 특성화하기를 원하는 방법을 기반으로 초기 시퀀싱 결과를 분석하는 가장 적절한 방식을 선택할 것이다. 예를 들어, 사용자는 메틸화 상태가 선택을 위한 기준이기를 원하는 경우, 메틸화 상태의 분석을 사용할 것이다.
또한, 본 방법의 한 가지 분명한 이점은 초기 시퀀싱이 혼합된 집단의 편향되지 않는 분석일 수 있으며, 초기 시퀀싱을 통해 결정되는 소기의 샘플의 재시퀀싱이 이어질 수 있다는 것이다. 예를 들어, 사용자는 감염을 앓는 환자로부터 메타 유전체학 샘플을 가질 수 있지만, 사용자는 샘플 내에 포함된 박테리아 종에 대한 어떠한 정보도 갖지 않을 수 있다. 본 방법을 사용하여, 초기 16s 시퀀싱은 샘플 내의 박테리아 종을 식별할 수 있으며, 사용자는 알려진 병원체인 박테리아 종으로부터 샘플을 식별할 수 있다. 이러한 경우의 소기의 샘플은 이러한 잠재적으로 병원체 박테리아 종일 것인 반면, 원하지 않는 샘플은 비-병원성인 것으로 알려진 샘플 내의 풍부한 종일 수 있다. 이어서, 잠재적으로 병원성 박테리아가 항생제에 대한 내성과 관련된 유전자를 발현하는지 여부와 같은 소기의 샘플에 대한 더 많은 정보를 제공하기 위해 재시퀀싱이 수행될 수 있다. 이후, 이들 결과를 사용하여 대상체에 대한 최상의 항균 요법을 결정할 수 있다. 이러한 방법은 사용자가 감염이 희귀 박테리아에 의한 것인 경우, 결과를 편향시킬 수 있는 추정된 병원성 종에 대한 임의의 예측을 할 필요가 없기 때문에 특히 강력하다. 이러한 방법론은 또한 병원성 박테리아가 웰에서 배양되지 않는 것인 샘플을 평가하는 데 특히 유용할 수 있다. 이러한 경우, 본 방법은 잠재적으로 병원성 박테리아의 식별 및 임상적으로 관련 평가를 허용할 수 있는 반면, 동일한 환자 샘플을 평가하는 배양-기반 방법은 이러한 배양 가능하지 않는 병원성 박테리아의 존재를 놓칠 것이다.
3. 증폭 및 재시퀀싱
일부 실시형태에서, 본 방법은 초기 시퀀싱 후의 하나 이상의 증폭 단계를 포함한다. 일부 실시형태에서, 본 방법은 재시퀀싱 전의 증폭 단계를 포함한다.
일부 실시형태에서, 증폭은 선택을 위해 사용된다. 일부 실시형태에서, 소기의 샘플은 하기에 논의될 것인 바와 같이 고유한 샘플 바코드를 사용하여 소기의 샘플의 PCR 증폭을 통해 농축된다.
일부 실시형태에서, 증폭은 선택 후에 수행된다. 일부 실시형태에서, 증폭 단계 전에 소기의 샘플은 농축되거나, 원하지 않는 샘플은 고갈된다. 이러한 경우에, 증폭은 편향되지 않을 수 있으며, 선택 후의 라이브러리 내의 남은 모든 샘플은 증폭된다. 일부 실시형태에서, 증폭 단계는 범용 프라이머를 사용한다.
일부 실시형태에서, 증폭 및 재시퀀싱 단계는 한 차례 반복된다. 일부 실시형태에서, 증폭 및 재시퀀싱 단계는 한 차례 초과로 반복된다. 일부 실시형태에서, 증폭 및 재시퀀싱 단계는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 또는 그 초과의 차례로 또는 열거된 정수로부터 생성된 임의의 간격으로 반복된다.
일부 실시형태에서, 샘플은 고체 지지체 상에서 증폭된다.
C. 샘플
일부 실시형태에서, 본 방법은 핵산 샘플의 혼합된 풀로부터 생성된 다수의 개별 핵산 라이브러리를 포함하는 라이브러리를 초기 시퀀싱하는 단계를 포함한다.
1. 샘플의 혼합된 풀
샘플의 혼합된 풀은 임의의 비-균질한 샘플 그룹일 수 있다. 예를 들어, 샘플의 혼합된 풀은 상이한 개별 세포를 포함하는 혈액 샘플, 상이한 개별 세포를 포함하는 조직 샘플(즉, 종양 샘플), 또는 상이한 박테리아 종을 포함하는 환경 샘플 등일 수 있다.
일부 실시형태에서, 샘플의 혼합된 풀은 세포의 혼합된 풀, 핵의 혼합된 풀, 또는 고분자량 DNA(HMW DNA)의 혼합된 풀을 포함한다. 일부 실시형태에서, 샘플은 세포, 핵, 또는 HMW DNA이다. 일부 실시형태에서, HMW DNA는 바이러스 DNA이다. 고분자량 DNA는 20 kb 이상의 평균 단편 길이를 포함한다. 일부 실시형태에서, DNA는 25, 30, 35, 40, 45, 50 kb 이상의 평균 단편 길이를 포함한다.
일부 실시형태에서, 단일 샘플은 단일 세포이다. 일부 실시형태에서, 혼합된 풀로부터의 복수의 핵산 샘플은 세포의 혼합된 풀로부터의 복수의 핵산이다.
일부 실시형태에서, 샘플의 혼합된 풀은 환자로부터 수집된다. 일부 실시형태에서, 혼합된 풀은 혈액 또는 다른 조직 샘플 또는 종양으로부터 취한 생검 샘플로부터 유래된다.
일부 실시형태에서, 샘플의 혼합된 풀은 환경 샘플이다. 일부 실시형태에서, 혼합된 풀은 상이한 종의 박테리아 또는 다른 미생물의 혼합된 풀로부터 유래된다.
일부 실시형태에서, 샘플의 혼합된 풀은 소기의 샘플 및 비-소기의 샘플 둘 모두를 포함한다.
2. 소기의 샘플
본원에 사용된 "소기의 샘플"은 당업자가 평가하기를 원하는 샘플을 지칭한다. 이러한 정의에서, 사용자가 평가 중인 대상체에 유해한 악성 세포 등을 연구하기를 원할 수 있기 때문에, 소기의 샘플 자체를 원하는 것을 의미하는 것은 아니다.
예를 들어, 당업자는 오직 복수의 단일 세포 라이브러리 내의 특정 개별 세포 라이브러리에 관심이 있을 수 있다. 사용자는 암 약물 치료에 대한 내성을 부여하는 유전자 돌연변이를 발현하는 세포를 연구하는 것과 같은 특정 '오믹' 프로파일을 갖는 세포를 연구하기를 원할 수 있다. 본 방법을 사용하여, 당업자는 특정 약물 치료에 대한 내성의 잠재적 진전에 대해 환자를 모니터링할 수 있다.
다수의 경우, 소기의 샘플은 원하지 않는(즉, 비-소기의) 다른 샘플을 포함하는 샘플의 풀 내에 포함된다. 소기의 샘플은 특정 프로파일을 갖는 샘플일 수 있으며, 소기의 샘플은 원하지 않는 샘플을 포함하는 샘플의 풀 내에 존재한다. 예를 들어, 소기의 샘플은 샘플의 혼합된 풀로부터의 원하지 않는 샘플에 의해 발현되지 않는 특정 유전자 돌연변이를 발현할 수 있다. 대안적으로, 소기의 샘플은 풍부한 비-병원성 박테리아를 또한 포함하는 샘플 내에 포함된 병원성 박테리아일 수 있다.
본원에 기재된 방법에서, 시퀀싱에 의해 분석될 수 있는 임의의 특성이 소기의 샘플을 특성화하기 위해 사용될 수 있다. 따라서, 본 방법의 한 가지 이점은 광범위한 범위의 상이한 샘플과 함께 사용될 수 있다는 것이다.
일부 실시형태에서, 소기의 샘플은 세포 또는 핵이다. 일부 실시형태에서, 소기의 샘플은 세포이다. 일부 실시형태에서, 소기의 샘플은 세포로부터의 핵이다.
일부 실시형태에서, 소기의 샘플은 인간 세포 또는 인간 세포로부터의 핵이다. 일부 실시형태에서, 소기의 샘플은 암 세포 또는 암 세포로부터의 핵이다. 일부 실시형태에서, 소기의 세포 또는 핵은 소기의 특정 세포 유형이거나, 이로부터 유래된다. 일부 실시형태에서, 소기의 샘플은 풀 내의 다른 샘플에 대한 돌연변이를 갖는다. 일부 실시형태에서, 소기의 샘플은 암 세포 또는 면역 세포이거나, 이로부터 유래된다.
일부 실시형태에서, 소기의 샘플은 암 세포이거나, 이로부터 유래된다. 일부 실시형태에서, 소기의 샘플은 암 줄기 세포이거나, 이로부터 유래된다. 일부 실시형태에서, 소기의 샘플은 액체 또는 종양 생검 샘플 내의 암 세포이거나, 이로부터 유래된다. 일부 실시형태에서, 소기의 샘플은 약물 치료에 내성인 암 세포이거나, 이로부터 유래된다.
일부 실시형태에서, 소기의 샘플은 세포의 풀 내의 다른 암 세포에 대한 적어도 하나의 돌연변이를 갖는 암 세포이거나, 이로부터 유래된다. 일부 실시형태에서, 본 방법은 암 진화를 추적하기 위해 사용된다. 일부 실시형태에서, 암 진화는 소정의 화학요법 치료에 대한 내성의 발생일 수 있다. 일부 실시형태에서, 소기의 샘플은 체세포 드라이버 돌연변이를 갖는 세포이거나, 이로부터 유래된다.
일부 실시형태에서, 소기의 샘플은 메타 유전체학 샘플이다. 일부 실시형태에서, 소기의 샘플은 환경 샘플로부터의 미생물이다. 일부 실시형태에서, 소기의 샘플은 환경 샘플로부터 배양되지 않는 미생물이다. 일부 실시형태에서, 미생물은 박테리아, 진균, 고세균, 진균, 조류, 원생동물, 또는 바이러스를 포함한다. 일부 실시형태에서, 소기의 샘플은 병원체이다.
일부 실시형태에서, 소기의 샘플은 다른 샘플과 비교하여 이의 핵산에서 돌연변이를 갖는다. 일부 실시형태에서, 소기의 샘플은 단일 뉴클레오티드 변이(SNV)를 갖는다. 일부 실시형태에서, 소기의 샘플은 복제수 변이(CNV)를 갖는다.
일부 실시형태에서, 소기의 샘플은 소기의 메틸화 패턴을 갖는다. 일부 실시형태에서, 소기의 샘플은 소기의 발현 패턴을 갖는다. 일부 실시형태에서, 소기의 샘플은 소기의 후성적 패턴을 갖는다. 일부 실시형태에서, 소기의 샘플은 소기의 면역 유전자 재조합을 갖는다.
일부 실시형태에서, 샘플은 특정 종 유형을 갖는다. 일부 실시형태에서, 특정 종 유형은 인간 종이다. 일부 실시형태에서, 특정 종 유형은 특정 종의 박테리아이다.
상이한 유형의 샘플을 갖는 본 발명의 방법의 일부 대표적 용도가 하기 기재된다.
a) 희귀 샘플
일부 실시형태에서, 소기의 샘플은 출발 집단 내에서 희귀하다. 예를 들어, 소기의 샘플은 sc-라이브러리를 생성하는 데 사용되는 세포 집단 내에서 희귀하였던 단일 세포로부터의 것일 수 있다. 따라서, 희귀 세포로부터의 소기의 시퀀싱 데이터는 세포의 혼합된 풀 내의 개별 세포들로부터의 전체 라이브러리 풀로부터의 시퀀싱 데이터가 평가되는 경우, 원하지 않는 풍부한 세포로부터의 시퀀싱 데이터에 의해 압도될 수 있다.
본원에 사용된 소기의 샘플은 샘플의 혼합된 풀의 1%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 0.000001%, 0.0000001%, 0.00000001%, 또는 0.000000001% 이하로 존재하는 "희귀 샘플"이다. 일부 실시형태에서, 소기의 샘플은 소기의 세포이다. 일부 실시형태에서, 소기의 세포는 세포의 혼합된 풀의 1%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 0.000001%, 0.0000001%, 0.00000001%, 또는 0.000000001% 이하로 존재한다. 희귀 세포는 초기 시퀀싱에 의해 평가될 수 있는 임의의 특성, 예컨대 세포의 게놈 또는 후성적 구성을 기반으로 하는 특성을 특징으로 할 수 있다. 예를 들어, 희귀 세포는 이의 DNA가 샘플 내의 다른 세포의 DNA와 비교하여 돌연변이를 포함하는 것일 수 있다. 일부 실시형태에서, 희귀 세포는 이의 DNA의 메틸화 패턴이 샘플 내의 다른 세포와 비교하여 상이한 것일 수 있다. 본원에 기재된 방법에서, 시퀀싱 데이터로 분석될 수 있는 임의의 특성은 희귀 샘플을 특성화하기 위해 사용될 수 있다.
일부 실시형태에서, 본 방법에서의 초기 시퀀싱은 희귀 세포로부터 제작된 라이브러리를 식별하는 데 사용될 수 있다. 선택 단계는 소기의 샘플(즉, 희귀 관심 세포로부터의 라이브러리)을 농축하거나, 원하지 않는 샘플(즉, 원하지 않는 풍부한 세포로부터의 라이브러리)을 고갈시키기 위해 수행될 수 있다. 선택 후, 수득된 라이브러리는 소기의 희귀 세포의 특징을 평가하기 위해 보다 심층 시퀀싱에 의해 재시퀀싱될 수 있다.
3. 원하지 않는 샘플
본원에 사용된 "원하지 않는 샘플"은 당업자가 시퀀싱하기를 원하지 않는 샘플을 지칭한다. 원하지 않는 샘플은 이로운 셀일 수 있지만, 사용자에게 관심 분야가 아니다. 예를 들어, 사용자는 생검으로부터 간암 세포를 평가하기를 원할 수 있지만, 정상적인 비-암성 간 조직을 포함하는 세포는 평가하지 않기를 원할 수 있다. 당업자는 또한 오직 특정 유전적 돌연변이를 발현하는 세포로부터의 샘플을 시퀀싱하기를 원할 수 있으며, 샘플 내의 다른 세포로부터의 샘플을 시퀀싱하기는 원하지 않을 수 있다. 소기의 샘플을 농축하거나, 원하지 않는 샘플을 고갈시키기 위한 선택 없이, 원하지 않는 샘플의 시퀀싱은 시간, 자원, 및 시퀀싱 용량을 낭비할 수 있다.
D. 핵산
이들 방법은 핵산을 평가하는 데 사용될 수 있다. 일부 실시형태에서, 이들 핵산은 단일 세포로부터 유래된다. 일부 실시형태에서, 핵산은 DNA이다. 일부 실시형태에서, 핵산은 RNA이다. 일부 실시형태에서, 핵산은 리보좀 RNA(rRNA)이다. 일부 실시형태에서, 핵산은 16s rRNA이다. 일부 실시형태에서, 핵산은 18s rRNA이다.
일부 실시형태에서, 핵산은 리보좀 DNA(rDNA)이다.
일부 실시형태에서, 핵산은 내부 전사된 스페이서 핵산이다.
E. 고유한 샘플 바코드 및 고유한 세포 바코드
본원에 사용된 "고유한 샘플 바코드"는 샘플의 풀 내의 개별 샘플에 대해 고유한 바코드를 지칭한다. 일부 실시형태에서, 라이브러리를 초기 시퀀싱하는 단계는 샘플의 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리를 시퀀싱하는 단계를 포함한다. 이러한 샘플의 혼합된 풀은 상이한 개별 세포를 포함하는 혈액 샘플과 같은 임의의 비균질 샘플 그룹일 수 있다. 일부 실시형태에서, 고유한 샘플 바코드는 라이브러리 내의 다른 샘플로부터의 핵산으로부터 소기의 단일 샘플로부터의 핵산을 구별할 수 있다.
고유한 샘플 바코드는 단일 바코드 서열로 구성될 수 있다. 대안적으로, 고유한 샘플 바코드는 다수의 바코드 서열로 구성될 수 있다. 본원에 사용된 "바코드 서열"은 샘플을 구별하는 데 사용될 수 있는 서열을 지칭한다. 예를 들어, 고유한 샘플 바코드는 소정의 바코드 서열이 다수의 샘플과 연관될 수 있더라도, 고유한 샘플 바코드 내에 포함된 다수의 바코드를 기반으로 샘플의 혼합된 풀 내에 소정의 소기의 샘플에 고유할 수 있다. 이러한 경우, 고유한 샘플 바코드 내의 하나 이상의 바코드 서열이 다른 샘플과 공유되더라도, 고유한 샘플 바코드 내의 바코드 서열의 특정 조합은 고유할 수 있다.
일부 실시형태에서, 고유한 샘플 바코드는 고유한 세포 바코드이다. 본원에 사용된 "고유한 세포 바코드" 또는 "UBC"는 세포의 혼합된 풀 내의 단일 세포에 대해 고유한 바코드를 지칭한다. 시퀀싱 데이터를 분석할 때, UBC는 세포의 출발 혼합된 풀 내의 동일한 단일 세포 내에 원래 포함되었던 서열을 식별하는 데 사용될 수 있다.
일부 실시형태에서, 고유한 샘플 바코드는 핵의 유형, HMW DNA 등에 대해 고유하며, 본 발명은 단일 세포와 함께 사용하는 것으로 제한되지 않는다.
강력한 농축 방법이 가능하도록, 특정 고유한 샘플 바코드 설계가 바람직할 수 있다. 예를 들어, 혼성 포획 접근법을 사용하는 경우, 농축 특이성은 소기의 고유한 샘플 바코드에 고유하게 혼성화하는 프로브를 설계하는 능력에 따라 좌우될 것이다. 유사한 고려사항이 고유한 샘플 바코드-표적화 PCR 증폭에 대해서도 그러하다. 이를 위해, 세포 DNA 라이브러리에 부가된 연속적 핵산 서열로서 존재하는 고유한 샘플 바코드를 갖는 것이 바람직할 수 있다. 대안적으로, 고유한 샘플 바코드 내의 바코드 서열들 사이에 고정된 서열을 갖는 것이 바람직할 수 있으며, 이는 사용자가 고유한 샘플 바코드 내의 바코드 서열 조합에 결합할 프라이머를 알도록 한다.
고유한 샘플 바코드는 다른 알려진 바코드 또는 어댑터 서열과 조합하여 사용될 수 있다. 예를 들어, 라이브러리 단편은 고유한 샘플 바코드를 포함할 수 있으며, 또한 하나 이상의 상업적으로 입수 가능한 어댑터를 포함할 수 있다. 일부 실시형태에서, i5 및/또는 i7 어댑터 서열(Illumina)은 라이브러리 단편 내에 포함된다.
1. 바코드 유형
일부 실시형태에서, 바코드는 물리적으로 다룰 수 있는 바코드이다. "물리적으로 다룰 수 있는"이란, 바코드가 다른 제제에 결합할 수 있는 하나 이상의 핵산 서열을 포함하는 것을 의미한다. 일부 실시형태에서, 물리적으로 다룰 수 있는 바코드는 상보적 핵산 서열에 결합할 수 있다. 일부 실시형태에서, 물리적으로 다룰 수 있는 바코드는 프라이머 또는 포획 올리고뉴클레오티드에 의해 결합될 수 있다. 예를 들어, 물리적으로 다룰 수 있는 바코드는 시퀀싱 프라이머에 결합하여 라이브러리 단편의 시퀀싱이 가능하도록 할 수 있다. 다른 예에서, 물리적으로 다룰 수 있는 바코드는 포획 올리고뉴클레오티드에 결합하여 플로우셀 상에 라이브러리 단편이 고정되도록 할 수 있다.
일부 실시형태에서, 바코드는 고유한 샘플 바코드이다.
일부 실시형태에서, 고유한 샘플 바코드는 단일 연속적 바코드이다. 일부 실시형태에서, 고유한 샘플 바코드는 상이한 바코드 서열들 사이에 핵산 서열 없이, 하나 초과의 바코드 서열을 포함한다. 예를 들어, 다수의 바코드 서열(BC1 내지 BCX)은 상이한 단계에서 첨가될 수 있으며, 핵산 서열은 바코드 서열들 사이에 혼입되지 않는다. 도 5의 예시적 방법에 나타낸 바와 같이, BC1은 태그먼트화 동안 혼입될 수 있으며, BC2 내지 BCX는 리게이션 동안 혼입될 수 있다. 도 6의 예시적 방법에 나타낸 바와 같이, BC1은 태그먼트화 동안 혼입된 다음, 웰 특이적 BC의 하나 이상의 리게이션 라운드 이후 풀링(pooling)이 이어진다. 단일 연속적 바코드의 제작은 고유한 샘플 바코드에 결합할 수 있는 프라이머의 설계를 용이하게 할 수 있다.
일부 실시형태에서, 고유한 샘플 바코드는 다수의 불연속적 바코드이다. 일부 실시형태에서, 다수의 불연속적 바코드는 핵산 서열에 의해 분리된다. 일부 실시형태에서, 다수의 불연속적 바코드는 고정된 서열에 의해 분리된다. 예를 들어, 다수의 바코드 서열(BC1 내지 BCX)이 상이한 단계에서 첨가될 수 있으며, 핵산 서열이 바코드 서열들 사이에 혼입된다. 이러한 다수의 불연속적 바코드는 바코드 및 고정 서열이 알려져 있기 때문에, 고유한 샘플 바코드에 결합할 수 있는 프라이머의 설계를 용이하게 할 수 있다.
F. 엔도뉴클레아제
상이한 엔도뉴클레아제가 본 방법에서 사용될 수 있다. 본원에 사용된 용어 "엔도뉴클레아제"는 핵산을 절단할 수 있는 효소를 지칭하는 데 사용된다. 엔도뉴클레아제는 촉매적으로 활성 엔도뉴클레아제 또는 촉매적으로 비활성인 엔도뉴클레아제를 지칭할 수 있다. 엔도뉴클레아제와 회합된 가이드 RNA를 기반으로 특정 표적 서열에 표적화하는 능력과 같은 엔도뉴클레아제의 일부 특성은 촉매적으로 활성 엔도뉴클레아제 및 촉매적으로 비활성인 엔도뉴클레아제 둘 모두에 대해 공통적이다. 일부 실시형태에서, 엔도뉴클레아제는 하나 이상의 고유한 샘플 바코드에 결합하는 가이드 RNA와 회합된다. 특이성을 개선(즉, 표적화를 개선하고, 표적외 활성을 감소하기 위함)하는 데 사용될 수 있는 다수의 상이한 엔도뉴클레아제가 도 8에 제시되어 있다.
일부 실시형태에서, 엔도뉴클레아제는 촉매적으로 비활성인 엔도뉴클레아제이다. 본원에 사용된 "촉매적으로 비활성인 엔도뉴클레아제"는 핵산에 결합할 수 있지만, 핵산 절단을 매개하지는 않는 엔도뉴클레아제이다. 촉매적으로 비활성인 엔도뉴클레아제는 또한 비활성화 엔도뉴클레아제(예컨대, "dCas" 단백질)로 지칭될 수 있다. 예시적인 촉매적으로 비활성인 엔도뉴클레아제는 도 3(여기서, dCas9는 비오틴에 결합됨) 및 도 8(여기서, dCas9는 FokI를 갖는 융합 단백질 내에 포함됨)에 나타낸 바와 같은 dCas9이다. 보통, 엔도뉴클레아제는 핵산에 결합하고, 이어서 절단을 매개할 수 있다. 따라서, 촉매적으로 비활성인 엔도뉴클레아제는 절단 활성을 갖지 않으면서 핵산 결합 기능을 보유하는 것이다. 촉매적으로 비활성인 엔도뉴클레아제는 본 방법의 선택 단계에 사용될 수 있다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 원하지 않는 샘플을 고갈시키기 위해 사용된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 소기의 샘플을 농축하기 위해 사용된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 고체 지지체에 직접적으로 또는 간접적으로 결합된다. 일부 실시형태에서, 촉매적으로 활성 엔도뉴클레아제는 비오틴-스트렙타비딘 상호작용을 통해 고체 지지체에 결합된다.
또한, 당업자는 엔도뉴클레아제의 촉매 도메인을 인식할 수 있을 것이며, 야생형 엔도뉴클레아제로부터 촉매적으로 비활성인 엔도뉴클레아제를 생성하도록 돌연변이를 설계할 수 있을 것이다(문헌[Maeder et al., Nat Methods 10(10): 977-979 (2013)] 참조). 이러한 설계된 촉매적으로 비활성인 엔도뉴클레아제는 이의 절단 활성의 결여를 확인하기 위해 시험될 수 있다. 대표적인 촉매적으로 비활성인 Cas9 단백질은 미국 특허 제10457969호에 개시된 것들을 포함하며, 이는 그 전체 내용이 본원에 포함된다.
일부 실시형태에서, 엔도뉴클레아제는 촉매적으로 활성 엔도뉴클레아제이며, 이는 핵산을 절단할 수 있음을 의미한다. 일부 실시형태에서, 촉매적으로 활성 엔도뉴클레아제는 원하지 않는 샘플을 고갈시키기 위해 사용된다.
일부 실시형태에서, 엔도뉴클레아제는 가이드 RNA와 회합된다. 엔도뉴클레아제는 가이드 RNA에 의해 하나 이상의 관심 핵산 서열에 표적화될 수 있다. 일부 실시형태에서, 관심 핵산 서열은 하나 이상의 고유한 샘플 바코드이다.
일부 실시형태에서, 엔도뉴클레아제는 가이드 RNA를 설계하는 데 더 큰 유연성을 허용하는 최소 PAM 특이성을 갖는다(도 8에 나타낸 바와 같음).
일부 실시형태에서, 엔도뉴클레아제는 하나 이상의 고유한 샘플 바코드에 결합하는 가이드 RNA와 회합된다. 일부 실시형태에서, 가이드 RNA는 원하지 않는 샘플의 핵산과 회합된 고유한 샘플 바코드를 향한다. 일부 실시형태에서, 가이드 RNA는 소기의 샘플의 핵산과 회합된 고유한 샘플 바코드를 향한다.
일부 실시형태에서, 엔도뉴클레아제는 시아노박테리아 사이토네마 호프마니(ShCAST)로부터 유래된다. ShCAST는 Tn7-유사 트랜스포사제 하위유닛 및 유형 V-K CRISPR 이펙터(Cas12k)에 의해 매개되는 RNA-유도(sgRNA) DNA-전위를 위한 4-단백질 시스템이다(Strecker의 도 5에서 보여주는 실시형태를 포함하여 문헌[Strecker et al., Science. 365(6448): 48-53 (2019)]을 참조함). Tn7-유사 트랜스포존이 공동-선택된 뉴클레아제 결핍 CRISPR-Cas 시스템을 가져서 CRISPR-회합된 트랜스포사제를 생성하는 다른 시스템이 또한 기재되었다(문헌[Klompe et al., Nature 571:219-225 (2019)] 참조).
엔도뉴클레아제의 특이성을 증가시키기 위한 다수의 상이한 수단은 도 8에서 보여준다. 본원에 기재된 방법은 특이성을 개선할 수 있는 임의의 유형의 엔도뉴클레아제 및/또는 가이드 RNA를 사용할 수 있다. 일부 실시형태에서, 엔도뉴클레아제의 개선된 특이성은 하나 이상의 고유한 샘플 바코드에 대한 엔도뉴클레아제의 개선된 결합으로 인한 것이다. 이러한 개선된 결합은 다른 서열에 대한 결합(즉, 비-특이적 결합)과 비교하여 하나 이상의 고유한 관심 샘플 바코드에 대한 더 높은 백분율의 결합(즉, 특이적 결합)일 수 있다.
일부 실시형태에서, 촉매적으로 활성 엔도뉴클레아제는 핵산을 절단하기 위해 보다 큰 특이성을 갖는 엔도뉴클레아제이다. 일부 실시형태에서, 이러한 보다 큰 특이성은 단지 핵산 내의 표적 서열에 대한 결합에서의 보다 큰 특이성으로 인한 것이 아니다. 일부 실시형태에서, 보다 큰 특이성을 갖는 이들 촉매적으로 활성 엔도뉴클레아제는 원하지 않는 샘플을 절단하고, 샘플로부터 이들을 고갈시킬 수 있다.
일부 실시형태에서, 촉매적으로 활성 엔도뉴클레아제는 보다 높은 충실도의 돌연변이체이다. "보다 높은 충실도"의 엔도뉴클레아제는 야생형 엔도뉴클레아제와 비교하여 감소된 표적외 활성을 갖는 것을 지칭한다.
일부 실시형태에서, 촉매적으로 활성 엔도뉴클레아제는 FokI 뉴클레아제와 함께 융합 단백질 내에 포함된다. 일부 실시형태에서, 융합 단백질은 Cas9 및 FokI 뉴클레아제를 포함한다(문헌[Guilinger et al., Nat Biotechnol. 32(6): 577-582 (2014)] 참조). 이러한 융합 단백질은 근접하게 FokI 뉴클레아제에 융합된 촉매적으로 비활성인 Cas9를 포함하는 2개의 별개의 융합 단백질의 결합이 필요하도록 작동할 수 있으며(도 8에 나타낸 바와 같음), 이후, 이량체화 FokI 뉴클레아제는 표적 핵산을 절단할 수 있다. 일부 실시형태에서, 2개의 융합 단백질은 상이한 표적 서열에 결합한다. 일부 실시형태에서, 2개의 융합 단백질은 2개의 상이한 고유한 샘플 바코드에 결합한다.
G. 농축
다수의 상이한 농축 방법이 원하지 않는 샘플은 선택하지 않으면서 소기의 샘플을 선택하는 데 사용될 수 있다. 이러한 방식으로, 원하지 않는 샘플은 재시퀀싱되지 않고, 오직 소기의 샘플이 재시퀀싱된다.
일부 실시형태에서, 고갈은 소기의 샘플로부터 원하지 않는 샘플을 물리적으로 분리하는 것을 지칭한다. 일부 실시형태에서, 고갈은 소기의 샘플을 고체 지지체 상에 포획하는 단계 및 포획되지 않은 서열을 폐기하는 단계를 포함한다. 이러한 포획 단계는 원하지 않는 샘플의 포획을 피할 수 있고, 원하지 않는 샘플은 폐기될 것이다. 이러한 농축 단계 후, 오직 소기의 샘플이 라이브러리 내에 남을 것이다.
일부 실시형태에서, 농축 단계는 혼성 포획, 고유한 샘플 바코드-특이적 증폭, 또는 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획을 포함한다. 일부 실시형태에서, 고유한 샘플 바코드는 소기의 샘플의 농축을 유도하는 데 사용된다. 일부 실시형태에서, 고유한 샘플 바코드는 세포의 혼합된 풀로부터의 하나 이상의 단일 세포로부터 소기의 샘플의 농축을 유도하는 데 사용된다.
일부 실시형태에서, 다수의 농축 단계가 수행된다. 일부 실시형태에서, 다수의 단계는 동일한 유형의 농축을 포함한다. 예를 들어, 둘 이상의 혼성 포획 단계가 수행되며, 상이한 혼성 포획 올리고뉴클레오티드가 상이한 단계에서 사용될 수 있다.
일부 실시형태에서, 다수의 농축 단계는 상이한 유형의 농축을 포함한다. 예를 들어, 혼성 포획에 의한 농축이 수행된 다음, PCR 증폭이 이어질 수 있다.
일부 실시형태에서, 시퀀싱은 다수의 농축 단계들 사이에서 수행될 수 있다. 이러한 시퀀싱 결과는 소기의 샘플이 추가로 농축되어야 함을 나타낼 수 있다.
일부 실시형태에서, 선택은 농축 및 고갈 단계를 조합함으로써 수행된다. 바꾸어 말하면, 본원에 기재된 선택 단계의 임의의 조합이 사용자에 의해 조합될 수 있다.
1. 혼성 포획
일부 실시형태에서, 농축 단계는 혼성 포획을 포함한다. 일부 실시형태에서, 혼성 포획 단계는 혼성 포획 올리고뉴클레오티드를 고유한 샘플 바코드에 혼성화하는 단계를 포함한다. 이 단계는 고유한 샘플 바코드 세트에 결합하는 다수의 혼성 포획 올리고뉴클레오티드로 수행될 수 있으며, 고유한 샘플 바코드는 다수의 소기의 샘플의 고유한 샘플 바코드를 나타낸다. 예를 들어, 초기 시퀀싱 데이터는 세포의 혼합된 풀 내의 단일 세포 세트가 소정의 유전자 돌연변이를 발현하며, 이들 단일 세포와 연관된 고유한 샘플 바코드가 혼성 포획에 사용되어 이러한 특정 단일 세포로부터의 핵산 라이브러리를 농축할 수 있음을 나타낼 수 있다. 농축 후, 재시퀀싱이 수행되어 관심 단일 세포에 대한 추가의 시퀀싱 데이터를 생성할 수 있다. 이러한 방법은 원하지 않는 세포로부터의 샘플이 혼성 포획 단계 동안 농축되지 않을 것이기 때문에, 원하지 않는 세포에 대한 추가의 시퀀싱 데이터를 생성하는 것을 피할 수 있다.
일부 실시형태에서, 고유한 샘플 바코드는 혼성 포획 올리고뉴클레오티드의 알려진 패널과 혼성화하도록 선택된다. 대안적으로, 혼성 포획 올리고뉴클레오티드의 맞춤 패널은 핵산 라이브러리를 제작할 때 사용되는 고유한 샘플 바코드를 기반으로 생성될 수 있다.
일부 실시형태에서, 혼성 포획 올리고뉴클레오티드는 친화성 요소에 결합된다. 일부 실시형태에서, 친화성 요소는 특정 고유한 샘플 바코드에 결합되는 올리고뉴클레오티드의 포획이 가능하도록 사용되어 이들 고유한 샘플 바코드를 포함하는 라이브러리가 농축되도록 한다. 일부 실시형태에서, 친화성 요소는 비오틴이다. 다양한 친화성 요소, 예컨대 특정 포획 비드에 의해 결합될 수 있는 자성 마이크로입자가 당업자에게 알려질 것이다.
일부 실시형태에서, 혼성 포획 올리고뉴클레오티드는 고체 지지체에 직접적으로 또는 간접적으로 결합된다. 일부 실시형태에서, 혼성 포획 올리고뉴클레오티드는 비오틴-스트렙타비딘 상호작용을 통해 고체 지지체에 결합된다. 일부 실시형태에서, 고체 지지체는 비드이다.
2. 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획
혼성 포획과 유사한 방식으로, 특정 가이드 RNA와 회합된 촉매적으로 비활성인 엔도뉴클레아제가 농축을 위해 사용될 수 있다. 이들 촉매적으로 비활성인 엔도뉴클레아제는 가이드 RNA를 사용하여 특정 고유한 샘플 바코드에 표적화될 수 있다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획은 촉매적으로 비활성인 엔도뉴클레아제를 가이드 RNA를 통해 고유한 샘플 바코드에 결합시키는 것을 포함한다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 친화성 요소에 결합된다. 일부 실시형태에서, 친화성 요소는 특정 고유한 샘플 바코드에 결합되는 촉매적으로 비활성인 엔도뉴클레아제의 포획이 가능하도록 사용되어 이들 고유한 샘플 바코드를 포함하는 라이브러리가 농축되도록 한다. 일부 실시형태에서, 친화성 요소는 비오틴이다. 다양한 친화성 요소, 예컨대 특정 포획 비드에 의해 결합될 수 있는 자성 마이크로입자가 당업자에게 알려질 것이다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 고체 지지체에 직접적으로 또는 간접적으로 결합된다. 일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제는 비오틴-스트렙타비딘 상호작용을 통해 고체 지지체에 결합된다. 일부 실시형태에서, 고체 지지체는 비드이다.
3. PCR 증폭
일부 실시형태에서, 농축은 PCR 증폭을 통해 이루어진다. 일부 실시형태에서, 농축은 고유한 샘플 바코드-표적화 PCR 증폭에 의해 이루어진다. 일부 실시형태에서, 특정 고유한 샘플 바코드에 결합하는 프라이머는 초기 시퀀싱으로부터의 소기의 샘플과 연관되는 것으로 알려진 고유한 샘플 바코드를 기반으로 소기의 샘플의 증폭이 가능하도록 한다. 대조적으로, 원하지 않는 샘플과 연관된 다른 고유한 샘플 바코드에 결합하는 프라이머는 증폭 반응에 포함되지 않을 것이다. 이러한 방식으로, 소기의 샘플이 선택될 수 있다.
H. 고갈
다수의 상이한 고갈 방법이 소기의 샘플은 제거하지 않으면서 원하지 않는 샘플을 선택하는 데 사용될 수 있다. 이러한 방식으로, 원하지 않는 샘플을 재시퀀싱하지 않고, 오직 소기의 샘플이 재시퀀싱된다.
일부 실시형태에서, 고갈 단계는 혼성 포획, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획, 또는 CRISPR 분해를 포함한다.
일부 실시형태에서, 고유한 샘플 바코드는 원하지 않는 샘플의 고갈을 유도하는 데 사용된다. 일부 실시형태에서, 고유한 샘플 바코드는 세포의 혼합된 풀로부터의 하나 이상의 단일 세포로부터 원하지 않는 샘플의 고갈을 유도하는 데 사용된다.
일부 실시형태에서, 다수의 고갈 단계가 수행된다. 일부 실시형태에서, 다수의 단계는 동일한 유형의 고갈을 포함한다. 일부 실시형태에서, 다수의 농축 단계는 상이한 유형의 고갈을 포함한다. 예를 들어, 혼성 포획에 의한 고갈이 수행된 다음, CRISPR 분해가 이어질 수 있다. 일부 실시형태에서, 시퀀싱은 다수의 고갈 단계들 사이에서 수행될 수 있다. 예를 들어, 방법은 초기 표적화된 시퀀싱, 원하지 않는 샘플의 고갈, 다른 표적화된 시퀀싱, 추가의 원하지 않는 샘플의 고갈, 및 포괄적인 재시퀀싱을 포함할 수 있다.
1. 소기의 샘플로부터 원하지 않는 샘플을 물리적으로 분리하는 것에 의한 고갈
일부 실시형태에서, 고갈은 소기의 샘플로부터 원하지 않는 샘플을 물리적으로 분리하는 것을 지칭한다. 일부 실시형태에서, 고갈은 원하지 않는 샘플을 고체 지지체 상에 포획하는 단계 및 이들을 제거하는 단계를 포함한다. 이러한 고갈 단계 후, 오직 소기의 샘플이 라이브러리 내에 남을 것이다.
일부 실시형태에서, 혼성 포획에 의해 단리된 원하지 않는 샘플이 이후 추가의 재시퀀싱으로부터 제거되는 것(농축 실시형태에서 소기의 샘플에 대한 경우와 같이 재시퀀싱을 위해 유지되는 대신)을 제외하고, 혼성 포획이 소기의 샘플의 농축을 위해 기재된 바와 같이 수행될 수 있다.
일부 실시형태에서, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획에 의해 단리된 원하지 않는 샘플이 이후 추가의 재시퀀싱으로부터 제거되는 것(농축 실시형태에서 소기의 샘플에 대한 경우와 같이 재시퀀싱을 위해 유지되는 대신)을 제외하고, 촉매적으로 비활성인 엔도뉴클레아제 포획을 통한 포획이 소기의 샘플의 농축을 위해 기재된 바와 같이 수행될 수 있다.
2. 원하지 않는 샘플의 절단에 의한 고갈
일부 실시형태에서, 고갈은 원하지 않는 샘플이 적절하게 시퀀싱될 수 없도록 만드는 절단을 포함한다. 바꾸어 말하면, 고갈은 원하지 않는 샘플이 샘플의 절단을 기반으로 적절하게 시퀀싱되는 능력이 더 적거나, 없도록 만드는 것을 지칭한다. 일부 실시형태에서, 원하지 않는 샘플로부터의 핵산은 라이브러리 및 선택 내에 존재하되, 고갈은 이들 원하지 않는 샘플이 시퀀싱되는 능력이 감소된 것을 지칭한다.
예를 들어, 원하지 않는 샘플과 연관된 하나 이상의 고유한 샘플 바코드 내부 또는 근처의 서열의 절단은 시퀀싱에 필요한 핵산 서열을 원하지 않는 샘플의 나머지 부분으로부터 분리할 수 있다. 이러한 방식으로, 이러한 원하지 않는 샘플은 더 이상 고갈 후의 재시퀀싱에서 시퀀싱 결과를 생성할 수 없을 것이다. 일부 실시형태에서, 이러한 절단은 원하지 않는 샘플의 나머지 부분으로부터의 핵산 서열을 분리한다. 일부 실시형태에서, 분리된 핵산 서열은 어댑터 서열이다. 일부 실시형태에서, 이러한 어댑터 서열은 프라이머 서열 또는 핵산을 시퀀싱에 사용되는 플로우셀에 고정시키기 위한 서열일 수 있다. 예를 들어, 시퀀싱 프라이머 결합 부위를 원하지 않는 샘플의 나머지 부분으로부터 분리하는 것은 원하지 않는 샘플이 선택되는 시퀀싱 방법을 통해 시퀀싱될 수 없도록 만들 수 있다. 당업자는 시퀀싱에 사용되는 플랫폼 및 원래 생성되는 라이브러리의 조성물을 기반으로 고갈을 매개하도록 분리될 수 있는 이러한 서열을 식별할 수 있다.
일부 실시형태에서, 고갈 단계는 CRISPR 분해를 포함한다. 본원에 사용된 CRISPR(clustered regularly interspaced short palindromic repeat: 클러스터된 일정한 간격을 두고 주기적으로 분포하는 짧은 회문 구조 반복체)은 박테리아 및 고세균과 같은 원핵 유기체의 게놈에서 발견되는 DNA 서열의 패밀리를 지칭한다. 본원에 사용된 CRISPR 분해는 CRISPR 서열을 기반으로 하나 이상의 핵산의 임의의 분해를 지칭한다. 엔도뉴클레아제, 예컨대 Cas9는 CRISPR 서열을 이용하여 정의된 서열에서 핵산을 절단할 수 있다. 일부 실시형태에서, 엔도뉴클레아제는 촉매적으로 활성 엔도뉴클레아제이다.
일부 실시형태에서, CRISPR 분해는 원하지 않는 샘플의 핵산과 회합된 고유한 샘플 바코드를 향한다. 일부 실시형태에서, CRISPR 분해는 원하지 않는 샘플의 절단을 포함한다. 일부 실시형태에서, CRISPR 분해는 원하지 않는 샘플을 고갈시키기 위해 시퀀싱에 필요한 핵산 서열을 원하지 않는 샘플의 나머지 부분으로부터 분리한다.
a) ShCAST에 의한 원하지 않는 샘플의 절단 방법
일부 실시형태에서, 고갈 방법은 ShCAST에 의한 절단을 사용하여 수행된다. 일부 실시형태에서, 절단은 원하지 않는 샘플이 증폭 및/또는 시퀀싱될 수 없도록 한다.
일부 실시형태에서, ShCAST는 Cas12K를 포함하고; 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하고; 그리고/또는 gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나는 스트렙타비틴 코팅된 비드에 결합될 수 있다. 일부 실시형태에서, 비오틴화된 gRNA 및/또는 트랜스포사제는 원하지 않는 샘플이 스트렙타비딘 비드에 포획되도록 한다. 이러한 방식으로, 원하지 않는 샘플은 반응 혼합물로부터 제거될 수 있는 반면, 소기의 샘플은 유지될 수 있다.
일부 실시형태에서, ShCAST 내에 포함된 트랜스포사제의 결합을 제한하는 유체(반응 유체로도 알려짐)가 사용된다. 일부 실시형태에서, 트랜스포사제의 결합을 제한 또는 억제하는 것은 ShCAST 내에 포함된 트랜스포사제에 의해 매개되는 표적외 전위 반응을 감소시킨다. 표적외 절단이 감소될 때, 고갈 단계는 소기의 샘플에는 영향을 미치지 않으면서 오직 원하지 않는 샘플을 고갈시키는 데 더 선택적일 수 있다.
일부 실시형태에서, 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계는 복합체에 의한 절단을 제한하기 위한 조건을 갖는 유체 중에서 수행된다. 당업자는 트랜스포사제에 의해 매개되는 전위 반응에 의한 절단을 제한하는 다수의 수단을 인식할 것이며, 당업계에 알려진 임의의 수단이 이용될 수 있다. 예를 들어, 트랜스포사제 활성은 투여량-의존적이다(즉, 더 낮은 농도의 트랜스포사제는 전위 반응의 수를 제한함). 또한, 트랜스포사제는 마그네슘-의존적이다. 일부 실시형태에서, 복합체에 의한 절단을 제한하기 위한 조건은 15 mM 이하의 마그네슘 농도 및/또는 50 nM 이하의 Cas12K 및/또는 트랜스포사제의 농도를 갖는다.
일부 실시형태에서, ShCAST에 의한 핵산의 절단은 단계의 타이밍을 허용한다. 예를 들어, 사용자는 초기 반응 단계에서 ShCAST에 의한 핵산의 결합 및/또는 절단을 제한하여 더 큰 선택도(예를 들어, 원하지 않는 샘플은 절단하고, 원하지 않는 샘플은 절단하지 않음)를 허용하기를 원할 수 있다. 나중의 반응 단계에서, 사용자는 원하지 않는 샘플의 효율적 절단을 위해 복합체 내에 포함된 트랜스포사제에 의한 핵산의 절단을 촉진하기를 원할 수 있다. 바꾸어 말하면, 사용자는 상대적으로 선택적인 트랜스포사제의 결합을 원할 수 있는 한편, 상대적으로 높은 효율로 트랜스포사제에 의한 핵산의 절단이 발생하기를 원할 수 있다. 따라서, 복합체를 핵산에 혼성화하는 동안 초기 조건은 복합체 내에 포함된 트랜스포사제의 핵산에 대한 결합을 억제할 수 있고/있거나 복합체 내에 포함된 트랜스포사제에 의한 절단을 억제할 수 있다. 방법의 나중의 조건은 트랜스포사제에 의한 핵산의 절단을 촉진할 수 있다.
일부 실시형태에서, 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계는 (1) 복합체에 의한 핵산의 절단을 억제하는 조건 하에서 복합체를 이중 가닥화 핵산에 결합시키는 단계 및 (2) 결합 후, 복합체에 의한 핵산의 절단을 촉진하는 단계를 포함한다.
일부 실시형태에서, 결합은 (1) 표적 핵산에 대한 복합체의 결합을 억제하고, (2) 복합체에 의한 표적 핵산의 절단을 억제하는 조건 하에서 수행된다. 바꾸어 말하면, 초기 조건은 복합체의 결합 및 복합체에 의한 절단 둘 모두를 억제할 수 있다.
일부 실시형태에서, 트랜스포사제의 선택적 활성화의 상이한 수단이 사용될 수 있다. 일부 실시형태에서, 결합 동안, ShCAST 내에 포함된 트랜스포사제는 사용되는 반응 조건을 기반으로 비활성 또는 덜 활성이다. 일부 실시형태에서, 반응 조건은 핵산에 대한 ShCAST의 결합 후 변경되어, ShCAST의 보다 선택적 결합 후에 트랜스포사제에 의한 높은 절단 효율이 가능하도록 한다. 이러한 실시형태에서, 가역적으로 비활성화된 트랜스포사제가 사용될 수 있으며, 사용자는 트랜스포사제가 선택적 활성화 단계를 사용하는 것에 의해 활성인 시간을 제어할 수 있다. 이러한 트랜스포사제의 선택적 활성화 수단이 ShCAST에 대해 기재되는 한편, 이들 방법은 트랜스포사제를 혼입하는 다른 방법과 함께 사용될 수 있다.
일부 실시형태에서, 트랜스포사제는 결합 동안 가역적으로 비활성화되고, 절단을 촉진하는 단계는 트랜스포사제를 활성화시키는 단계를 포함한다.
일부 실시형태에서, 마그네슘 농도는 결합 동안 낮고(예를 들어, 15 mM 미만), 절단을 촉진하는 단계는 마그네슘 농도를 증가시키는 단계를 포함한다.
일부 실시형태에서, 트랜스포사제는 결합 동안 존재하지 않고, 절단을 촉진하는 단계는 트랜스포사제를 첨가하는 단계를 포함한다.
일부 실시형태에서, 트랜스포사제는 하나 이상의 트랜스포존의 결여로 인해 가역적으로 비활성화되고, 트랜스포사제를 활성화시키는 단계는 하나 이상의 트랜스포존을 제공하는 단계를 포함한다.
VII. 방법의 대표적 용도
본 방법은 다양한 시퀀싱 적용 분야에서 사용될 수 있다. 본원에 기재된 특정 용도는 본 발명을 제한하도록 의도되지 않으며, 당업자는 본 방법이 다양한 시퀀싱 적용의 결과를 개선하도록 사용될 수 있는 광범위한 범위의 방식을 계획할 수 있다.
A. 교정적 라이브러리 품질 관리
일부 실시형태에서, 본 방법은 샘플의 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리의 품질 관리(QC)에 사용될 수 있다. 일부 실시형태에서, 농축 또는 고갈 단계는 품질 관리에 사용된다. 일부 실시형태에서, 품질 관리 단계는 원하지 않는 샘플로부터의 신호를 감소시키는 점에서 교정적이다. 도 2는 현재의 단일 세포 방법이 본원에 기재된 품질 관리 단계 없이 메타 유전체학 샘플로부터의 희귀 세포로부터 정보를 손실할 수 있는 방식의 개요를 제공한다.
본원에 사용된 "품질 관리" 또는 "QC"는 라이브러리 내의 다양한 개체로부터 수득된 라이브러리의 성질을 기반으로 하며, 원래의 혼합된 샘플 집단과 관련된 인자를 기반으로 하지 않는 선택 단계를 지칭한다. 바꾸어 말하면, QC 방법이 반드시 라이브러리를 생성하는 데 사용되는 샘플의 원래의 혼합된 풀 내의 샘플들 사이의 생물학적 차이를 기반으로 단일 세포 라이브러리의 소기의 샘플 또는 원하지 않는 샘플을 식별하는 것은 아니되, 대신에 제작되는 라이브러리와 관련된 인자를 기반으로 소기의 샘플 또는 원하지 않는 샘플을 식별한다.
예를 들어, 단일 세포로부터 제작된, 소정의 라이브러리는 라이브러리 생성 공정에서의 랜덤 차이를 기반으로 하며, 세포의 원래의 혼합된 풀 내의 이 세포와 다른 세포 사이의 생물학적 차이를 기반으로 하지 않는 더 낮은 품질의 것일 수 있다. 원하지 않는 샘플은 불충분한 수의 단편들을 갖는 이들 단일 세포 라이브러리, 비-소기의 크기의 단편들을 갖는 것들 등을 포함할 수 있다. 시퀀싱 결과의 품질을 감소시킬 수 있는 임의의 인자는 특정 핵산 라이브러리가 원하지 않는 샘플로 분류되도록 할 수 있다. 바꾸어 말하면, 당업자는 본 방법을 사용하여 하위-표준 라이브러리 제작을 교정할 수 있고(여기서, 고유한 샘플 바코드와 연관된 일부 샘플은 노이즈이고, 산란됨), 원하지 않는 샘플은 라이브러리로부터 제거되고, 이어서 재시퀀싱이 수행된다. 이후, 이러한 재시퀀싱은 충분한 품질의 시퀀싱 데이터를 잠재적으로 제작할 수 있는 이들 라이브러리에 초점을 맞출 수 있다.
일부 실시형태에서, 초기 시퀀싱은 시퀀싱 결과의 품질을 기반으로 소기의 라이브러리와 원하지 않는 라이브러리를 식별한다.
일부 실시형태에서, 초기 시퀀싱 반응은 원하지 않는 샘플의 라이브러리가 더 낮은 품질의 것이기 때문에, 원하지 않는 샘플인 단일 세포의 라이브러리와 연관된 고유한 샘플 바코드를 식별한다. 일부 실시형태에서, 라이브러리의 원하지 않는 샘플은 초기 시퀀싱에 의해 식별되고, 이들 라이브러리는 재시퀀싱 전에 sc-라이브러리로부터 고갈된다. 일부 실시형태에서, 라이브러리의 소기의 샘플은 더 높은 품질의 라이브러리를 식별하는 초기 시퀀싱에 의해 식별되고, 이들 라이브러리는 재시퀀싱 전에 sc-라이브러리로부터 농축된다.
일부 실시형태에서, 품질 관리 단계는 재시퀀싱을 위해 사용되는 라이브러리의 품질을 증가시킨다. 이러한 방식으로, 재시퀀싱은 더 높은 품질의 라이브러리의 보다 심층 시퀀싱에 초점을 맞출 수 있다. 일부 실시형태에서, QC 단계는 더 낮은 품질의 라이브러리(즉, 원하지 않는 샘플)의 보다 심층 시퀀싱을 피함으로써, 시간 및 시약의 낭비를 피할 수 있다.
B. 종양학 용도
일부 실시형태에서, 본 방법은 질환을 평가 또는 모니터링하는 데 사용된다. 일부 실시형태에서, 질환은 암이다.
일부 실시형태에서, 암은 혈액 또는 고형 종양이다. 일부 실시형태에서, 암은 고형 종양 또는 혈액 샘플로부터의 생검을 기반으로 평가될 수 있다. 일부 실시형태에서, 본 방법은 이질성 종양을 평가하거나, 순환형 암 세포(CTC)를 평가하는 데 사용된다. CTC는 종양 예후의 추정 마커이고, 소정의 치료(예컨대, 화학요법 또는 면역요법)에 대한 대상체의 반응을 평가하는 역할을 할 수 있다.
일부 실시형태에서, 본 방법은 암 세포일 수 있거나, 아닐 수 있는 종양 미세환경에서의 세포를 평가하는 데 사용된다. 암 세포가 아닌 이들 세포는 그들 자체는 암성이 아니면서 암 세포에 근접할 수 있는 기질 세포, 혈관 세포, 또는 임의의 다른 유형의 세포일 수 있다. 종양 미세환경에서의 세포는 종양 성장 및 전이에 영향을 미치는 것으로 알려져 있다.
일부 실시형태에서, 초기 시퀀싱은 변이체 세포에 대한 표적화된 시퀀싱을 통해 sc-라이브러리 내의 라이브러리를 평가한다. 이들 변이체 세포는 이들의 핵산 내의 단일 뉴클레오티드 다형체, 삽입, 결실, 및/또는 복제수 변이를 갖는 것들일 수 있다. 이들 변이체 세포는 또한 메틸화에서의 변화와 같은 다른 인자 또는 인자들에서의 차이를 가질 수 있다. 일부 실시형태에서, 이들 변이체는 CTC이다. 초기 시퀀싱을 기반으로, 선택 단계는 변이체 세포에 대해 농축 또는 고갈시키도록 수행되어 관심 세포의 핵산 라이브러리를 포함하는 sc-라이브러리를 수득할 수 있다. 이어서, 이들 라이브러리는 변이체 세포의 보다 심층 게놈 특성화를 위해 재시퀀싱 단계에 사용될 수 있다.
일부 실시형태에서, 초기 시퀀싱은 체세포 드라이버 돌연변이 영역(들)의 표적화된 시퀀싱이다. 체세포 드라이버 돌연변이는 이를 발현하는 세포에 성장 이점을 부여하는 돌연변이이며, 이들 세포는 암의 진화 동안 양성으로 선택될 수 있다. 일부 실시형태에서, 초기 시퀀싱은 복수의 세포 핵산 라이브러리 내의 소정의 고유한 샘플 바코드에 의해 태그화된 개별 세포 핵산 라이브러리에 암성/분자 유형을 배정한다. 일부 실시형태에서, 보다 심층 재시퀀싱이 드라이버 돌연변이와 연관된 고유한 샘플 바코드에 의해 태그화된 라이브러리의 선택 후에 수행된다.
일부 실시형태에서, 체세포 드라이버 돌연변이는 KRAS G12에서의 돌연변이이다. 일부 실시형태에서, 초기 시퀀싱은 KRAS G12의 표적화된 시퀀싱이다. 일부 실시형태에서, KRAS G12 돌연변이를 갖는 개별 세포 핵산 라이브러리의 UBC 바코드를 결정하기 위해 분석이 수행된다(도 7에 나타낸 바와 같음). 일부 실시형태에서, 이들 관심 라이브러리에 대한 선택 후, 재시퀀싱은 KRAS G12를 갖는 세포의 프로파일을 더 잘 이해하기 위한 보다 심층 시퀀싱 또는 전체 게놈 시퀀싱이다. 유사한 프로토콜을 사용하여 임의의 다른 관심 돌연변이를 발현하는 세포로부터의 시퀀싱 데이터를 선택하고, 평가할 수 있었다.
일부 실시형태에서, 본 방법은 종양 진화를 추적하는 데 사용된다. 본원에 사용된 "종양 진화"는 경시적으로 암 세포 특징의 변화를 지칭하며, 종양 진화를 추적하는 것은 세포 진화 패턴을 특성화하는 것을 수반할 수 있다. 예를 들어, 종양은 이질성이며, 특정 형질이 경시적으로 선택됨에 따라, 경시적으로 이러한 종양 내의 이질성은 종양 특징에서의 변화를 초래한다. 종양 특징에서의 변화는 종양이 더 빠른 성장 또는 전이를 갖도록 하거나, 소정의 치료에 대한 내성을 갖도록 진화되도록 할 수 있다.
대상체의 종양이 소정의 화학요법에 대한 내성이 발달되는 경우, 예를 들어, 이러한 제제를 이용한 치료는 더 이상 종양 성장을 늦추거나, 중단하도록 작동될 수 있다. 본원에 기재된 방법은 소정의 치료에 대한 내성의 존재 또는 발달을 평가하기 위해 관심 세포를 심층 시퀀싱하기 위한 선택을 사용할 수 있다. 이러한 방식으로, 대상체의 치료 계획은 대상체에 효과적일 가능성이 있는 요법에 초점을 맞추며, 효과적일 가능성이 더 낮은 요법을 피하도록 최적화될 수 있다.
C. 메타 유전체학 용도
본 방법은 메타 유전체학에 사용될 수 있다. 본원에 사용된 "메타 유전체학"은 환경 샘플로부터 직접 회수한 유전 물질의 연구를 지칭한다. 일부 실시형태에서, 이러한 환경 샘플은 하나 초과의 미생물을 포함한다. 본원에 사용된 미생물은 박테리아, 바이러스, 진균, 또는 다른 작은 유기체를 포함할 수 있다. 예를 들어, 메타 유전체학 샘플은 미생물 군집(예컨대, 다양한 박테리아)을 포함할 수 있다.
일부 실시형태에서, 메타 유전체학 분석은 유기체의 배양을 피한다. 바꾸어 말하면, 메타 유전체학 샘플은 이들을 인공적으로 성장시키기 위해 먼저 이들을 배양하지 않고 평가될 수 있다. 배양을 피하는 것은 배양물에서 잘 성장하지 않는 유기체에 대한 도태압을 피할 수 있다. 또한, 배양을 피하는 것은 적절한 배양 조건과 같이 관심 미생물에 대해 거의 알려져 있지 않은 경우, 특히 중요할 수 있다. 달리 말하면, 다른 미생물이 더 잘 배양될 때, 관심 미생물은 배양 조건에 의해 도태될 수 있으며, 시퀀싱 전에 혼합된 집단으로부터 손실될 수 있다.
종래 방법을 이용하여, 희귀한, 배양 가능하지 않은 미생물의 드노보 조립 및 종 식별은 거의 불가능하다(문헌[Malmstrom and Eloe-Fadrosh mSystems 4:e00118-19 (2019)] 참조). 종래의 접근법은 세포 분할(즉, FACS, 미세유체공학)에 의해 단일 증폭된 게놈(SAG)을 분리한 다음, 세포 용해 및 전체 게놈 분석을 포함하였다(접근법 1). 다른 접근법은 메타 유전체-조립된 게놈(MAG) 분석, 커버리지에 의한 차별적 비닝(differential binning)을 사용한 짧은/긴-판독 샷건 시퀀싱, 및 테트라뉴클레오티드 빈도의 분석이었다(접근법 2). 대안적 접근법은 "미니-메타 유전체" 혼성 접근법(Quake lab, MetaSort)(접근법 3)이다.
그러나, 당업계에서의 이들 접근법은 낮은 다양성 샘플에서의 풍부한 종의 조립 및 종 식별에 가장 적합하다. 다양성이란, 샘플 내의 상이한 종의 수를 의미할 수 있다. 바꾸어 말하면, 종래의 메타 유전체학 방법은 높은 다양성 샘플에서의 비일반적 또는 희귀 종의 조립 및 종 식별에 제한된 용도를 갖는다.
예를 들어, 접근법 1은 풍부한 종은 고갈시키고, 희귀 종은 농축시키기 위해 오직 분류 가능한 표현형의 선험적 지식을 이용하여 다룰 수 있을 것이다. 또한, 접근법 1의 세포 분할은 농축 가능하거나, 분할 가능한 특성의 부재 하에 수행될 수 없다. 또한, 모든 종래 기술의 방법은 미생물 샘플을 완전히 특성화하기 위해 엄청난 시퀀싱 비용과 연관될 수 있다.
대조적으로, 본 방법은 초기 시퀀싱을 기반으로 소기의 샘플을 선택하는 데 사용될 수 있다. 이들 소기의 샘플은 메타 유전체학 샘플 내의 관심 미생물로부터의 세포 핵산 라이브러리일 수 있다. 선택 후, 농축 또는 고갈에 의해, 재시퀀싱이 이들 관심 미생물에 대한 보다 심층 시퀀싱 데이터를 제공하기 위해 수행될 수 있다.
일부 실시형태에서, 본 방법은 미생물 샘플 내의 각각의 유기체 DNA(RNA)를 고유하게 바코딩하여 초기 시퀀싱 및 분석 후에 소기의 세포 핵산 라이브러리의 농축 또는 원하지 않는 세포 핵산 라이브러리의 고갈을 위해 물리적으로 다룰 수 있도록 한다.
일부 실시형태에서, 초기 시퀀싱은 표적화된 시퀀싱에 초점을 맞춘다. 일부 실시형태에서, 초기 시퀀싱은 리보좀 RNA 또는 DNA(rRNA 또는 rDNA) 시퀀싱이다. 일부 실시형태에서, 초기 시퀀싱은 16S, 18S, 또는 내부 전사된 스페이서 시퀀싱이다. 일부 실시형태에서, 초기 시퀀싱은 복수의 세포 핵산 라이브러리 내의 소정의 바코드에 의해 태그화된 세포 RNA/DNA에 대한 분류군 수준의 식별을 부여한다. 일부 실시형태에서, 이러한 표적화된 시퀀싱은 원핵 16s rDNA 또는 rRNA 시퀀싱이다. 16s rRNA의 가변 영역의 시퀀싱은 다양한 미생물 집단에서의 속 또는 종과 같은 계통 발생학적 분류에 흔히 사용된다.
일부 실시형태에서, 초기 시퀀싱 반응이 수행된 다음, 16s rDNA 분석으로부터의 풍부한 종/분류군의 결정과 같은 분석이 이어진다(이러한 표적화된 시퀀싱의 일 예에 대해서는 도 7 참조). 예를 들어, 초기 시퀀싱은 모든 세포 핵산 라이브러리에 대한 16s rRNA 시퀀싱일 수 있으며, 선택 단계 후에 소기의 세포 핵산 라이브러리의 전체 게놈 시퀀싱이 이어질 수 있다. 이러한 방법은 관심 미생물로부터의 라이브러리에 대한 심층 시퀀싱에 초점을 맞춤으로써, 시간 및 돈을 절약할 수 있다.
일부 실시형태에서, 초기 시퀀싱은 근접성 보존 전위 시퀀싱을 사용하여 수행된다. 일부 실시형태에서, 근접성 보존 전위 시퀀싱은 샘플이 추출 후에 유의한 양의 온전한 단일 염색체 또는 고분자량의 게놈을 포함할 때에 사용된다.
일부 실시형태에서, 메타 유전체학은 환자로부터 취한 샘플을 평가하는 데 사용될 수 있다. 일부 실시형태에서, 샘플은 알려져 있지 않는 감염의 증상을 나타내는 환자로부터 취해질 수 있다. 일부 실시형태에서, 샘플은 미생물 샘플(예컨대, 대상체의 미생물군집을 평가하기 위한 대변 샘플)일 수 있다. 본원에 사용된 미생물군집 샘플은 인간 조직 또는 생체유체 상에 또는 그 내부에 잔여하는 미생물 무리의 집합체를 지칭한다.
D. 면역학 용도
일부 실시형태에서, 본 방법은 면역학적 분석에 사용된다. 일부 실시형태에서, 본 방법은 T-세포 클론형을 평가하는 데 사용된다. 소정의 개체의 T-세포 클론형의 조성은 T-세포 레퍼토리로 지칭될 수 있다. 일부 실시형태에서, 초기 시퀀싱은 TCR 레퍼토리를 특성화한다. 일부 실시형태에서, 선택 단계는 풍부한 T-세포 클론형을 고갈시킨다. 일부 실시형태에서, 재시퀀싱은 비일반적 T-세포 클론형의 보다 심층 시퀀싱에 사용된다.
실시예
실시예 1. Sci-RNA3 라이브러리 또는 다른 sc-라이브러리로부터의 농축
단일 세포 라이브러리(sc-라이브러리)를 생성하는 광범위하게 상이한 수단이 당업계에 알려져 있다. 본 방법은 라이브러리 단편 내에 포함된 특정 인덱스를 기반으로, sc-라이브러리를 생성하는 이러한 임의의 상이한 방법과 함께 사용될 수 있다.
예를 들어, 단일 세포 시퀀싱 라이브러리는 도 4에 나타낸 sci-RNA-seq3을 사용하여 생성될 수 있다(문헌[Cao et al., Nature 566(7745): 496-502 (2019)] 참조). 이러한 방법은 i5 및 i7 인덱스와 함께 RT 인덱스(BCRT) 및 리게이션 어댑터 인덱스(BCLIG)를 사용한다. i5 및 i7 인덱스는 상업적으로 입수 가능한 96개의 고유한 어댑터 세트(Illumina)이다.
RT 인덱스는 헤어핀 어댑터 인덱스(올리고 Tp)와 조합될 수 있다. 다수의 인덱스는 동일한 UMI, RT 인덱스, 리게이션 어댑터 인덱스, 및 태그먼트화 부위를 갖는 판독물을 기반으로 복제물을 제거하는 것과 같은 판독물의 역다중화가 가능하도록 한다. 도 4는 흑색 타원형으로서 사용되는 상이한 인덱스(즉, 바코드)를 보여준다: BCRT(10개의 뉴클레오티드), BCLIG(10개의 뉴클레오티드), i5(8개의 뉴클레오티드), 및 i7.
다수의 상이한 수단이 sci-RNA-seq3 방법(Sci-RNA3)에 의해 생성된 sc-라이브러리와 함께 농축을 위해 사용될 수 있다.
먼저, i7 선택을 피하는 프로브 포획 접근법이 사용될 수 있다. i5, BCLIG, 및 BCRT 인덱스 내에 포함된 뉴클레오티드를 기반으로, 총 28개의 염기가 포획 프로브를 개발하기 위한 특정 혼성화 염기를 나타내며, 총 67개의 뉴클레오티드가 혼성화를 위해 이용 가능하다(R1 프라이머의 33개의 뉴클레오티드 및 고정된 영역의 6개의 뉴클레오티드 포함). 이러한 계산에서, 포획 프로브는 UMI 서열에 대한 결합을 위한 범용 서열을 포함할 것이다.
두 번째로, 축소된 PCR 접근법이 사용될 수 있다. 이러한 접근법에서, 소기의 샘플의 농축을 위한 PCR은 선택된 i5, BCLIG, 및 BCRT 인덱스에 결합된 프라이머와 함께 i7 프라이머를 이용하여 수행된다. 이러한 접근법에서, 라이브러리는 라이브러리 단편 내의 BCRT 및 UMI 위치를 교체하도록 설계되어 BCRT를 사용한 축소된 PCR 접근법은 수득되는 PCR 생성물 내에 UMI 서열을 보유하도록 할 수 있다.
세 번째로, 조합된 접근법이 사용될 수 있다. 조합된 접근법에서, 프로브 포획 농축 단계에 이어서 i7-특이적 PCR 농축 단계가 수행된다.
이들 특정 접근법은 sci-RNA-seq3 라이브러리의 설계를 사용하지만, 다른 유형의 sc-라이브러리에서 사용되는 바코드/인덱스가 또한 농축 단계를 위해 이용될 수 있다. 이들 sc-라이브러리는 BioRad-ddSEQ, 10X Genomics, InDrop, Drop-Seq, 및 Split-Seq를 포함한다. 도 4에 나타낸 바와 같이, 라이브러리의 특정 바코드 구조(상이한 바코드 영역 내에 특정 수의 뉴클레오티드 포함)가 농축 프로토콜을 설계하는 데 사용될 수 있다. 당업자는 초기 시퀀싱에 사용되는 특정 sc-라이브러리를 기반으로 하는 농축에 가장 적절한 접근법을 설계하는 다양한 방법에 대한 정보를 사용할 수 있다.
실시예 2. 연속적 바코드를 포함하는 라이브러리 단편을 생성하기 위한 변형된 SCI-seq 접근법
변형된 SCI-seq 접근법은 도 5에 나타낸 바와 같이 연속적 바코드를 포함하는 단일 세포 RNA/DNA NGS 라이브러리를 생성하는 데 사용될 수 있다.
제1 단계에서, 태그먼트화가 BC1 바코드를 혼입하기 위한 BC1 서열을 포함하는 트랜스포존으로 로딩된 Tn5 트랜스포사제를 포함하는 트랜스포좀 복합체로 수행된다. 세포 또는 핵은 반응 웰 내로 분포된다. 출발 표적 핵산이 RNA인 경우, cDNA 합성이 수행되어 제1 가닥 및 제2 가닥을 생성한다. 태그먼트화는 웰 특이적 바코드(BC1 바코드)로 수행된다. DNA는 웰 전반에 걸쳐서 풀링된다. 갭 복원이 수행된 다음(3' 충전), 5' 인산화 및 3' A 꼬리 말단의 생성이 이어진다.
제2 단계에서, T/A 리게이션은 하나 이상의 바코드(BC2, …, BCx)로 수행된다. 이들 바코드는 비-랜덤일 수 있다. 이 단계의 경우, 핵 또는 세포가 반응 웰 내로 재분배된 다음, 웰 특이적 바코드(BC2 바코드)를 갖는 T-꼬리화 어댑터 리게이션이 이어진다. DNA를 웰 전반에 걸쳐 풀링한 다음, 5' 인산화 및 3' A-꼬리의 생성이 이어진다. 대안적으로, 라이브러리 단편들은 (모든 다른 바코딩 라운딩에 사용되는) 후속 C/G-리게이션을 위해 돌출된 C/G를 가질 수 있다. 이들 단계는 필요에 따라 다수의 바코딩 라운드에서 반복된다.
제3 단계에서, T/A 리게이션이 수행되어 BCn 바코드를 갖는 소기의 단편을 생성한다. 이 단계의 경우, 핵 또는 세포가 반응 웰 내로 재분배되고, T-꼬리화 Y-형상 어댑터가 웰 특이적 바코드로 리게이션된다. 이어서, DNA가 웰 전반에 걸쳐 풀링되고, PCR이 샘플 인덱스를 이용하여 수행되었다.
sc-라이브러리 생성 동안, 라이브러리는 완전히 구축될 필요는 없다. 스터비 비대칭 말단(stubby asymmetric end)은 혼성화의 특이성 및/또는 PCR 결과를 개선할 수 있다.
이어서, 수득된 라이브러리는 초기 시퀀싱에 사용된 다음, 라이브러리 단편 내에 존재하는 연속적 바코드를 기반으로 농축 또는 고갈이 이어진다. 프라이머는 전체 연속적 바코드에 걸쳐 설계될 수 있기 때문에, 연속적 바코드의 존재는 PCR의 후속 농축을 개선할 수 있다.
실시예 3. 메타 유전체학 샘플 내에 분포된 미생물 세포와 함께 사용하는 방법
본 방법은 유기체 게놈 조립과 같은 메타 유전체학에 사용될 수 있으며, 여기서, 유기체는 배양되지 않는다. 이들 유기체는 미생물 세포, 예컨대 환자로부터 취한 샘플 내의 것들일 수 있다.
이 방법의 경우, 세포는 웰 내로 분포되고, 태그먼트화는 BC1(단독)을 삽입한다. DNA를 풀링한 다음, 평활화(blunt) 및 A-꼬리를 생성하는 연장이 이어진다. 샘플은 DNA의 적절한 희석으로 분포된다.
다음으로, T/A 리게이션이 BC2를 포함하는 T-꼬리화 어댑터로 수행된다. DNA를 풀링하고, 평활화 및 A-꼬리를 생성하는 연장을 수행한다. 이들 단계는 소기의 수의 바코드(BCn)를 혼입하기 위해 반복된다.
마지막 리게이션의 경우, 갈라진 어댑터를 첨가한 다음, i5/i7 및 P5/P7 서열을 첨가하기 위해 PCR이 이어진다. P5 및 P7 서열은 Illumina 플랫폼을 사용하는 시퀀싱 방법에 유용하지만, 시퀀싱이 다른 플랫폼 상에 수행되는 경우, 다른 서열이 첨가될 수 있다.
초기 시퀀싱 반응을 수행된 다음, 분석이 이어진다. 분석은 전체 게놈 조립 또는 리보좀 DNA(rDNA) 분석으로부터의 풍부한 종/분류군의 결정을 포함할 수 있다. 예를 들어, 초기 시퀀싱은 16s rDNA(또는 rRNA) 시퀀싱일 수 있다. rDNA 또는 rRNA에 대한 초기 시퀀싱은 이 단계에 필요한 시간 및 자원을 감소시킬 수 있으며, 이들 데이터는 풍부한 종 또는 분류군을 식별하기에 충분할 수 있다.
대안적으로, 샘플 내의 대부분의 미생물이 추출 후에 온전한 단일 염색체 또는 고분자량의 게놈 DNA를 포함하는 경우, 근접성 보존 전위 시퀀싱(CPT-seq, Illumina)이 시퀀싱에 적절할 수 있다. CPT-seq 및 조합 인덱싱의 사용은 게놈-범위의 일배체형화(genome-wide haplotyping)가 가능하도록 한다(문헌[Amini et al., Nat Genet. 46(12): 1343-1349 (2014)] 참조). 이러한 접근법은 합성 연결된 긴-판독 라이브러리에 적용될 수 있다. 연결된-긴 판독 라이브러리는 (짧은-판독) 시퀀싱되고, 예시적 모체 '긴' 분자를 식별하는 DNA 바코드가 복합 라이브러리로부터의 농축 또는 고갈을 위해 표적화된 다음, 2차 시퀀싱이 이어진다. 예를 들어, 메타 유전체학 샘플과 작업 시, 원핵생물은 약 1개의 염색체를 가지며, 따라서 연결된 긴 판독 시퀀싱 방법, 예컨대 CPT-seq는 희귀 종의 특성화에 유용할 수 있고, 드노보 조립체를 분석할 수 있다.
초기 시퀀싱은 농축 또는 고갈을 위해 관심 종/분류군에 대한 데이터를 생성할 수 있다. 예를 들어, 특이적 프로브 또는 Cas9-가이드 RNA가 풍부한 종 분류군의 UBC에 대해 설계되어 보다 희귀한 관심 종/분류군에 대해 초점을 맞추기 위해 이들이 고갈되도록 할 수 있다. 풍부한 종의 고갈은 풍부한 종과 연관된 바코드를 기반으로 혼성 포획 또는 CRISPR 분해에 의해 수행될 수 있다.
선택 후, 잔여 라이브러리는 범용 프라이머(P5/P7)로 재증폭될 수 있다. 이어서, 재시퀀싱이 수행될 수 있다.
원하는 경우, 풍부한 종/분류군의 다수의 식별 라운드가 수행된 다음, 다른 고갈 라운드가 이어진다. 식별 및 고갈 공정은 풍부한 종/분류군의 충분한 고갈이 시퀀싱 데이터에서 관찰될 때까지 반복되어 메타 유전체학 특성화 기준이 충족되도록 할 수 있다.
원하는 경우, 초기 시퀀싱이 rDNA 또는 rRNA 분석에 초점을 맞추는 경우, 전체 게놈 시퀀싱이 재시퀀싱을 위해 수행될 수 있다. 이러한 경우, 초기 시퀀싱은 리보솜 신호에 초점을 맞출 수 있는 반면, 최종 재시퀀싱은 보다 희귀한 관심 종 또는 분류군에 대한 보다 포괄적인 데이터를 제공한다.
실시예 4. 물리적으로 다룰 수 있는 바코드 및 표적화된 시퀀싱을 이용한 NGS 라이브러리 구축
도 6에 나타낸 바와 같은 별도의 방출 단계를 갖는 전위 반응을 사용하는 물리적으로 다룰 수 있는 바코드를 생성하기 위한 방법이 또한 사용될 수 있다.
세포, 핵, 또는 HMW DNA는 반응 웰 내로 분포된다. 이어서, 세포 또는 핵은 선택적으로 용해되어 DNA를 제작을 위해 접근 가능하도록 만들 수 있다. 전위는 제1 바코드로 로딩된 트랜스포사제(BC1로 로딩된 Tn5)로 수행된다. 이 단계는 웰 특이적 제1 바코드를 갖는 태그를 혼입하지만, 트랜스포사제는 방출되지 않는다. 이어서, DNA가 웰 전반에 걸쳐 풀링될 수 있다. 고정된 2-단계 바코딩 반응식을 이용하여 높은 세포 처리량을 수용하기 위해, 본 방법은 반응 웰당 더 많은 바코드를 혼입할 수 있다.
이어서, DNA는 반응 웰 내로 재분포되고, 트랜스포사제가 방출된다. 갭-충전(3' 연장) 및 5' 인산화가 수행되고, 3' A 꼬리 말단이 첨가된다. 웰 특이적 제2 바코드(BC2)를 이용하여 T-꼬리화 Y-형상 어댑터 리게이션이 수행된다. DNA는 웰 전반에 걸쳐 풀링되고, PCR은 샘플 인덱스를 기반으로 수행된다. 스터비 비대칭 말단은 프라이머의 혼성화 특이성 및/또는 PCR 반응을 개선할 수 있기 때문에, 라이브러리는 이 단계에서 완전히 구축될 필요는 없다.
실시예 5. 재조합효소-매개된 표적화된 전위
서열-특이적 전위는 재조합효소-코팅된 표적화 올리고뉴클레오티드를 포함하는 트랜스포좀 복합체에 의해 매개될 수 있다. 도 9에 나타낸 바와 같이, 게놈 DNA를 포함하는 샘플은 재조합효소-코팅된 표적화 올리고뉴클레오티드를 포함하는 트랜스포좀 복합체와 조합된다.
재조합효소-코팅된 올리고뉴클레오티드는 상보적 서열이 표적 DNA(도 9의 게놈 DNA의 백색 섹션)에서 발견될 때까지, 이중 가닥화 DNA(dsDNA)를 따라 "스캔"할 수 있다. 이 시점에서, 재조합효소는 이러한 올리고뉴클레오티드를 (D-루프 형성을 통해) dsDNA 구조 내로 배치하기 위한 가닥 침입을 용이하도록 할 것이다. 이러한 공정은 트랜스포좀 복합체를 표적화된 서열에 근접하도록 할 것이며, 후속 전위는 트랜스포존 서열을 가닥 침입 부위에 가깝게 삽입할 것이다.
재조합효소-로딩된 트랜스포좀을 통한 표적화된 전위는 다음과 같이 수행할 수 있다. 먼저, 5 μl의 10X TEN 완충액(100 mM Tris pH 8, 10 mM EDTA, 250 mM NaCl)과 17.5 μl의 서열 번호 1의 올리고뉴클레오티드와 27.5 μl의 서열 번호 2의 올리고뉴클레오티드를 조합하여 제1 트랜스포좀 올리고뉴클레오티드 세트를 어닐링한다. 95℃에서 10분 동안 가열하고, 이어서 0.1℃/s 경사 속도로 10℃로 냉각시키는 공정에 의해 서열 번호 2의 올리고뉴클레오티드를 서열 번호 1의 올리고뉴클레오티드에 어닐링할 수 있다(3'에서 5' 방향으로).
유사하게, 서열 번호 3과 서열 번호 4의 올리고뉴클레오티드를 어닐링하여 제2 어닐링된 올리고뉴클레오티드 세트를 생성할 수 있다.
어닐링된 올리고뉴클레오티드를 다음 프로토콜을 사용하여 트랜스포사제 Tn5로 로딩할 수 있다. 14.28 μl의 35 μM 어닐링된 올리고뉴클레오티드와, 15.9 μl의 95.6 μM tsTn5 효소와, 220 μl의 50% 글리세롤 저장 완충액을 조합하고, 37℃에서 밤새 인큐베이션한다. 추가의 250 μl의 50% 글리세롤 저장 완충액을 첨가하고, 필요할 때까지, -20℃에서 저장할 수 있다.
다음으로, 재조합효소를 DNA에 첨가한 다음, 태그먼트화가 이어진다. 재조합효소는 가닥 침입을 통해 단일 가닥화 DNA 영역을 생성하여 올리고뉴클레오티드 쌍의 결합을 허용하도록 사용될 수 있다. 10 μl의 Tn5 로딩된 올리고뉴클레오티드 "1"(서열 번호 1 및 서열 번호 2의 어닐링된 쌍)과, 10 μl의 Tn5 로딩된 올리고뉴클레오티드 "2"(서열 번호 3 및 서열 번호 4의 어닐링된 쌍)와, 10 μl의 5X 완충액(250 mM Tris pH7.6, 50 mM MgCl2, 25 mM DTT, 2.5 mM ATP)과, 0.5 ㎍의 DNA와, 2 μl의 2 ㎍/μl RecA와, 17.5 μl의 H2O(총 부피 50 μl)를 조합하고, 부드럽게 혼합하고, 37℃에서 1시간 동안 인큐베이션할 수 있다.
이어서, 10 μl의 STOP 완충액(1% SDS)을 첨가하고, 1600 rpm에서 1분 동안 볼텍싱하고, 실온에서 5분 동안 인큐베이션하여 반응을 중단시킬 수 있다.
크기 선택은 2.5X SPRI 비드를 사용하여 수행할 수 있다. 150 μl의 SPRI 비드를 튜브에 첨가하고, 실온에서 5분 동안 인큐베이션한다. TWB 세척 완충액을 사용하여 세척을 두 차례 수행한 다음, TWB 세척 완충액을 제거한다.
다음으로, PCR 라이브러리 증폭을 수행한다. 20 μl의 EPM 혼합물(Illumina), 20 μl의 H2O, 및 10 μl의 P5-A14/P7-B15 프라이머 혼합물(H2O 중의 각각 2 μM 프라이머)을 세척된 비드에 첨가한다. 이어서, 반응을 다음과 같이 프로그래밍된 PCR 기계 상에 배치한다: 3분 동안 68℃; 3분 동안 98℃; 45초 동안 98℃, 30초 동안 62℃, 그리고 2분 동안 68℃의 8 사이클; 1분 동안 68℃; 및 마지막으로 4℃에서 유지함.
실시예 6. 단일 가닥화 핵산 및 표적화 올리고뉴클레오티드를 사용한 표적화된 전위
트랜스포사제는 이중 가닥화 DNA와 같이 이중 가닥화 DNA의 전위를 매개할 수 있다. 단일 가닥화 표적 핵산 내에 이중 가닥화 DNA 영역을 선별적으로 생성하기 위한 방법이 사용될 수 있다. 이러한 단일 가닥화 핵산은 이중 가닥화 핵산을 변성시킴으로써 생성될 수 있다.
도 10에 나타낸 바와 같이, 표적화 올리고뉴클레오티드는 예컨대 표적화 올리고뉴클레오티드가 관심 서열에 완전히 또는 일부 상보적일 때, 단일 가닥화 핵산 내의 관심 서열에 혼성화할 수 있다. 이러한 실시형태에서, 표적화 올리고뉴클레오티드는 재조합효소로 코팅되는 것이 필요하지 않으며, 표적화 올리고뉴클레오티드는 임의의 방식으로 트랜스포좀에 연결될 필요가 없다.
표적화 올리고뉴클레오티드에 의해 결합된 단일 가닥화 핵산 영역은 이제 이중 가닥화될 것이다. 트랜스포좀 복합체가 첨가될 때, 이어서 이는 이중 가닥화 영역에 결합되도록 진행되고, 이후 표적화된 단편이 생성될 수 있다. 바꾸어 말하면, 표적화 올리고뉴클레오티드의 혼성화 후, 표준 트랜스포좀이 이어서 사용될 수 있으며, 오직 표적 DNA가 혼성화를 통해 이중 가닥화되었던 곳에만 삽입되어야 한다. 이러한 방식으로, 표적화 올리고뉴클레오티드를 사용하여 표적 핵산으로부터의 특정 관심 영역을 포함하는 태그화 단편을 생성할 수 있다.
표적화 올리고뉴클레오티드를 사용하여 태그먼트화를 매개하는 대표적 방법이 제공된다. 서열 번호 5 및 서열 번호 6(100 μM 저장액)을 포함하는 2 μl의 올리고뉴클레오티드를 500 ng의 게놈 DNA(예컨대, PhiX)에 첨가한다. 반응을 1X TEN 완충액(10 mM Tris pH8, 1 mM EDTA, 25 mM NaCl) 중의 50 μl의 최종 부피로 희석한다. 반응을 95℃로 5분 동안 가열하여 DNA를 변성시키고, 이어서 0.1℃/s 경사 속도로 10℃로 냉각시킨다.
다음으로, DNA를 태그먼트화한다. 10 μl의 Nextera Tn5#1, 10 μl의 Nextera Tn5#2, 10 μl의 5X 태그먼트화 완충액, 및 상기 단계로부터의 20 μl의 어닐링된 올리고뉴클레오티드+DNA를 조합한다. 반응을 41℃에서 5분 동안 인큐베이션한 다음, 10℃에서 유지한다. 10 μl의 STOP 완충액(1% SDS)을 첨가하고, 1600 rpm에서 1분 동안 볼텍싱하고, 실온에서 5분 동안 인큐베이션하여 반응을 중단시킨다.
크기 선택은 2.5X SPRI 비드를 사용하여 수행한다. 150 μl의 SPRI 비드를 튜브에 첨가하고, 실온에서 5분 동안 인큐베이션한다. 반응을 TWB 세척 완충액을 사용하여 두 차례 세척한 다음, TWB 세척 완충액을 제거한다.
마지막으로, PCR을 사용하여 라이브러리를 증폭시킨다. 20 μl의 EPM 혼합물(Illumina), 20 μl의 H2O, 및 10 μl의 P5-A14/P7-B15 프라이머 혼합물(H2O 중의 각각 2 μM 프라이머)을 첨가한다. 반응을 다음과 같이 프로그래밍된 PCR 기계 상에 배치한다: 3분 동안 68℃; 3분 동안 98℃; 45초 동안 98℃, 30초 동안 62℃, 그리고 2분 동안 68℃의 8 사이클; 1분 동안 68℃; 및 4℃에서 유지함.
실시예 7. 아연 집게 DNA-결합 도메인을 사용한 세포 유리 DNA의 표적화된 전위
도 15에 개략적으로 나타낸 바와 같이, 서열-특이적 전위가 또한 cfDNA로 수행될 수 있다. cfDNA를 포함하는 혈장 샘플은 아연 집게 DNA-결합 도메인을 포함하는 표적화된 트랜스포좀 복합체와 혼합될 수 있다. 아연 집게 DNA-결합 도메인은 도 15에 나타낸 바와 같이 아연 집게 뉴클레아제(ZFN) 내에 포함될 수 있으며, 여기서, ZFN은 촉매적으로 비활성일 수 있다. 또한, 트랜스포좀 복합체(예컨대, 5' 말단에서 비오틴을 포함하는 제1 트랜스포존 또는 3' 말단에서 비오틴을 포함하는 제2 트랜스포존을 가짐)는 고체 지지체 상에 고정되도록 설계될 수 있다.
아연 집게 DNA-결합 도메인은 특정 관심 DNA 서열, 예컨대 사용자가 시퀀싱하기를 원하는 유전자 내부 또는 그에 근접한 것들에 결합할 수 있다. 이러한 결합은 cfDNA가 히스톤에 결합되는 동안(즉, 프로테아제를 이용한 cfDNA의 전처리 없이) 발생할 수 있다. 표적화된 트랜스포좀 복합체에 의해 매개된 태그먼트화 후, 표적화된 cfDNA 라이브러리는 스트렙타비딘 비드에 결합된다. 갭-충전 및 리게이션 후, cfDNA로부터 생성된 표적화된 라이브러리는 고체 지지체로부터 방출되거나, 고체 지지체 상에서 증폭 및/또는 시퀀싱될 수 있다.
cfDNA로부터 라이브러리를 생성하는 다른 수단에 대해 이 방법의 한 가지 이점은 태그먼트화 전에 히스톤을 제거하는 프로테아제 단계를 피하는 이 방법의 용이함이다. cfDNA로부터 히스톤을 제거하는 임의의 프로테아제 단계는, 프로테아제가 달리 트랜스포좀 복합체 내의 트랜스포사제를 방해하지 않을 것이기 때문에, 세척 또는 프로테아제를 제거하는 임의의 단계가 이어질 필요가 없을 것이다. 이러한 방식으로, 도 15에 개략적으로 나타낸 방법은 사용자에게 개선된 용이성 및 속도를 제공한다.
또한, 표적화된 트랜스포좀의 사용은 다른 유형의 농축 단계에 대한 필요성을 피할 수 있다. 표적화된 트랜스포좀 복합체 내의 아연 집게 DNA-결합 도메인은 관심 서열에 특이적으로 표적화될 수 있다. 예를 들어, 아연 집게 DNA-결합 도메인을 포함하는 표적화된 트랜스포좀은 유전성 질환과 연관된 것으로 알려진 유전자 서열을 포함하는 단편들의 라이브러리를 생성할 수 있다. 이러한 방식으로, 임신 환자의 혈장 중의 cfDNA를 사용하여 유전성 질환과 연관된 유전자의 서열을 포함하는 표적화된 라이브러리를 생성함으로써 해당 유전자에서의 태아 돌연변이의 잠재적 존재를 평가할 수 있다. 유사하게, 암을 갖는 환자의 혈장으로부터의 cfDNA를 사용하여 종양 억제 유전자 및 종양유전자의 서열을 포함하는 표적화된 라이브러리를 생성함으로써 좋지 않은 예후와 연관된 돌연변이가 존재하는지 여부를 결정할 수 있다.
실시예 8. ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제) 표적화된 라이브러리 제작 및 농축
라이브러리 제작 후에 별도의 농축 단계를 사용하는 특정 유전자의 표적화된 시퀀싱은 시간 소모적일 수 있다. 예를 들어, 이러한 별도의 농축 단계는 올리고뉴클레오티드 프로브를 라이브러리 DNA에 혼성화하는 단계 및 스트렙타비딘-코팅된 비드 상에 혼성화된 DNA를 단리하는 단계를 포함할 수 있다. 효율 및 필요한 시간에서의 유의한 개선에도 불구하고, 이러한 별도의 농축 프로토콜은 약 2시간이 소요될 수 있으며, 다수의 시약 및 단계는 이들 프로토콜을 자동화하기에 어렵게 만들 수 있다.
대조적으로, 본원에 개시된 방법은 제작 및 농축 둘 모두를 위한 단일 단계를 사용하여 특정 유전자의 표적화된 시퀀싱을 위한 라이브러리를 제작하고, 농축하는 데 사용될 수 있다. 예를 들어, 도 16a 및 도 16b는 ShCAST(사이토네마 호프마니 CRISPR 회합된 트랜스포사제) 표적화된 라이브러리 제작 및 농축을 위한 예시 조성물 및 공정 흐름에서의 작업 과정을 개략적으로 예시한다. ShCAST는 가이드 RNA(gRNA)를 사용하여 DNA를 대장균 게놈 내의 특정 부위 내로 삽입할 수 있는 Cas12k 및 Tn7-유사 트랜스포사제를 포함한다. 이들 gRNA는 잘 알려진 설계 알고리즘을 사용하여 표적 핵산 내의 하나 이상의 관심 서열에 대한 친화성에 의해 생성될 수 있다.
이들 방법은 특정 유전자의 표적화된 단편화 및 증폭을 위해 Tn5 트랜스포사제를 혼입하는 ShCAST의 변형된 버전(ShCAST-Tn5) 또는 ShCAST를 이용할 수 있다. 따라서, 라이브러리 제작과 농축 단계가 조합된다. 조합된 프로토콜은 표적 라이브러리 시퀀싱 작업 흐름의 효율을 단순화하고, 개선한다. 조합된 프로토콜은 또한 단계 수 및 사용자 터치포인트를 감소시키며, 따라서 자동화를 용이하게 할 수 있다.
일 예시적 방법에서, gRNA는 특정 유전자(관심 서열)를 표적화하도록 설계될 수 있으며, 표적 핵산 내의 gRNA에 대한 결합 부위들 사이의 간격은 삽입 크기를 제어하는 데 사용될 수 있다. 바꾸어 말하면, gRNA는 표적 핵 내의 서열에 결합하도록 설계될 수 있으며, 이는 소기의 크기의 삽입물(즉, 이중 가닥화 DNA 단편)을 생성하는 트랜스포좀 복합체의 표적화를 일으킨다. gRNA 및/또는 ShCAST/ShCAST-Tn5는 비오틴화될 수 있다. 도 16a에 예시된 바와 같은 방식으로, gRNA 및 어댑터(예를 들어, 증폭 및/또는 시퀀싱 방법에 유용한 서열을 포함하는 Illumina 어댑터)를 갖는 전이성 인자는 ShCAST의 트랜스포사제 내로 로딩되어 복합체(6000)를 수득할 수 있다. 도 16b의 공정 흐름(6010)에 예시된 바와 같은 방식으로, 수득된 ShCAST/ShCAST-Tn5 복합체는 태그먼트화를 억제하는 유체 조건 하에서(예를 들어, 낮은 마그네슘 또는 무-마그네슘) 게놈 DNA와 혼합될 수 있는 한편, 복합체가 표적 DNA 내의 각각의 서열에 결합되도록 한다. 이어서, 복합체는 비오틴화된 gRNA 및/또는 ShCAST/ShCAST-Tn5가 결합되는 스트렙타비딘 비드를 사용하여 단리될 수 있다. 임의의 결합되지 않은 DNA는 예를 들어 표적외 태그먼트화를 감소 또는 최소화기 위해 세척될 수 있다. 이후, 유체 조건이 변경(예를 들어, 마그네슘을 충분히 증가시킴)되어 태그먼트화를 촉진할 수 있다. 갭-충전 리게이션 단계에 이어서 열 해리가 사용되어 시퀀싱을 위한 제작에서 비드로부터 라이브러리를 방출할 수 있다.
도 16a 및 도 16b에 예시된 바와 같은 조성물 및 과정에서, 복합체의 트랜스포사제 부분은 DNA 내로 랜덤하게 삽입될 수 있음을 유의한다. 이러한 삽입은 태그먼트화를 억제하는 유체 조건(예를 들어, 낮은 마그네슘 또는 무-마그네슘) 하에서 ShCAST/ShCAST-Tn5 복합체와 게놈 DNA를 혼합함으로써 억제 또는 최소화될 수 있으며, 따라서 표적이 결합되도록 한다.
내부에 Cas12K 및 Tn7을 포함하는 ShCAST에 관한 추가의 상세 내용의 경우, 문헌[Strecker et al., "RNA-Guided DNA insertion with CRISPR-associated transposases," Science 365(6448): 48-53 (2019)]을 참조하며, 이의 전체 내용은 본원에 인용되어 포함된다.
등가물
전술한 서면 명세서는 당업자가 실시형태를 실시할 수 있도록 충분한 것으로 간주된다. 전술한 설명 및 실시예는 특정 실시형태를 상세히 설명하며, 본 발명자에 의해 고려된 최상의 형태를 설명한다. 그러나, 전술한 내용이 본문에 상세하게 나타나더라도, 실시형태는 다수의 방식으로 실시될 수 있으며, 첨부된 청구범위 및 이의 임의의 등가물에 따라 해석되어야 함을 인식할 것이다.
본원에 사용되는 용어 "약"은 명시적으로 나타내는지 여부와 상관 없이, 예를 들어 정수, 분수, 및 백분율을 포함하는 수치 값을 지칭한다. 용어 "약"은 일반적으로 당업자가 인용된 값과 동등한 것(예를 들어, 동일한 기능 또는 결과를 가짐)으로 간주할 수 있는 수치 값의 범위(예를 들어, 인용된 범위의 +/- 5 내지 10%)를 지칭한다. "적어도" 및 "약"과 같은 용어가 수치 값 또는 범위의 목록에 선행될 때, 해당 용어는 목록에 제공된 모든 값 또는 범위를 수식한다. 일부 경우, 용어 "약"은 가장 가까운 유효 숫자로 반올림된 수치 값을 포함할 수 있다.
SEQUENCE LISTING <110> Illumina, Inc. Illumina Cambridge Limited <120> SEQUENCE-SPECIFIC TARGETED TRANSPOSITION AND SELECTION AND SORTING OF NUCLEIC ACIDS <130> 01243-0020-00PCT <150> US 63/066,905 <151> 2020-08-18 <150> US 63/066,906 <151> 2020-08-18 <150> US 63/168,753 <151> 2020-03-31 <160> 8 <170> PatentIn version 3.5 <210> 1 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> 40-mer_A14_ME <400> 1 gccttttgta ataattaccg cagctcgcag gccaatttcg tcgtcggcag cgtcagatgt 60 gtataagaga cag 73 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> ME' (3' to 5') <400> 2 tctacacata ttctctgtc 19 <210> 3 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> 40-mer_B15_ME <400> 3 tcaactttac cattattctg ctggttagac tggtcgttcc ttcggttcta gtctcgtggg 60 ctcggagatg tgtataagag acag 84 <210> 4 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> ME' (5' to 3') <400> 4 ctgtctctta tacacatct 19 <210> 5 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Single-stranded 30-mer DNA primer targeting PhiX DNA <400> 5 gccttttgta ataattaccg cagctcgcag 30 <210> 6 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Single-stranded 30-mer DNA primer targeting PhiX DNA <400> 6 ggcagaaaga ggtaacgcag caccggaacg 30 <210> 7 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> P5 Primer <220> <221> misc_feature <222> (23)..(23) <223> n is u <400> 7 aatgatacgg cgaccaccga ganctacac 29 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> P7 Primer <400> 8 caagcagaag acggcatacg agat 24

Claims (31)

  1. 표적화된 트랜스포좀 복합체(targeted transposome complex)로서, 다음 a 내지 d를 포함하는, 표적화된 트랜스포좀 복합체:
    a. 트랜스포사제(transposase);
    b. 다음을 포함하는 제1 트랜스포존(transposon):
    i. 3' 트랜스포존 말단 서열,
    ii. 5' 어댑터 서열,
    c. 가이드 RNA와 회합된 촉매적으로 비활성인 엔도뉴클레아제(endonuclease) - 상기 가이드 RNA는 엔도뉴클레아제가 하나 이상의 관심 핵산 서열에 결합하도록 유도할 수 있음 -; 및
    d. 상기 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존.
  2. 제1항에 있어서, 촉매적으로 비활성인 엔도뉴클레아제는 시아노박테리아 사이토네마 호프마니(Scytonema hofmanni)(ShCAST)로부터 유래되며, 선택적으로,
    a. gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나는 스트렙타비딘-코팅된 비드에 결합될 수 있고;
    b. ShCAST는 Cas12K를 포함하고;
    c. 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하고; 그리고/또는
    d. 제1 트랜스포존은 P5 어댑터 및 P7 어댑터 중 적어도 하나를 포함하는, 표적화된 트랜스포좀 복합체.
  3. 다음 a 내지 d를 포함하는, 표적화된 트랜스포좀 복합체:
    a. 트랜스포사제,
    b. 다음을 포함하는 제1 트랜스포존:
    i. 3' 트랜스포존 말단 서열;
    ii. 5' 어댑터 서열;
    c. 아연 집게 DNA-결합 도메인 - 상기 아연 집게 DNA-결합 도메인은 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및
    d. 상기 트랜스포존 말단 서열의 상보체를 포함하는 제2 트랜스포존.
  4. 제3항에 있어서, 아연 집게 DNA-결합 도메인은 아연 집게 뉴클레아제 내에 포함되고, 선택적으로, 아연 집게 뉴클레아제는 촉매적으로 비활성인, 표적화된 트랜스포좀 복합체.
  5. 제3항 또는 제4항에 있어서, 하나 이상의 관심 핵산 서열은 히스톤과 회합된 DNA 내에 포함되고, 선택적으로, 히스톤과 회합된 DNA는 세포 유리 DNA인, 표적화된 트랜스포좀 복합체.
  6. 표적 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제1항 내지 제5항 중 어느 한 항의 트랜스포좀 복합체를 조합하는 단계; 및
    b. 상기 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  7. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제1항 내지 제5항 중 어느 한 항의 제1 트랜스포좀 복합체와, 다음 i 내지 iii을 포함하는 제2 트랜스포좀 복합체를 조합하는 단계:
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존 - 상기 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 및
    b. 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  8. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제1항 내지 제5항 중 어느 한 항의 제1 트랜스포좀 복합체와, 표적화된 트랜스포좀 복합체인 제1항 내지 제5항 중 어느 한 항의 제2 트랜스포좀 복합체를 조합하는 단계; 및
    b. 상기 핵산을 트랜스포사제에 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서, 이중 가닥화 핵산을 포함하는 샘플을 표적화된 하나 이상의 트랜스포좀 복합체와 조합하는 단계는,
    a. 샘플을 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제와 조합하는 단계 - 상기 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제는 제1 결합 파트너에 결합됨 -; 및
    b. 트랜스포사제와 제1 및 제2 트랜스포존을 첨가하는 단계 - 상기 트랜스포사제는 제2 결합 파트너에 결합됨 -;
    를 포함하며, 상기 트랜스포사제는 제1 및 제2 결합 파트너를 페어링(pairing)하는 것에 의해 아연 집게 DNA-결합 도메인 또는 촉매적으로 비활성인 엔도뉴클레아제에 결합할 수 있는, 방법.
  10. 표적화된 트랜스포좀 복합체로서,
    a. 트랜스포사제,
    b. 다음 i 내지 iii을 포함하는 제1 트랜스포존:
    i. 3' 트랜스포존 말단 서열;
    ii. 5' 어댑터 서열; 및
    iii. 재조합효소로 코팅된 표적화 올리고뉴클레오티드 - 상기 표적화 올리고뉴클레오티드는 하나 이상의 관심 핵산 서열에 결합할 수 있음 -; 및
    c. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존을 포함하며, 상기 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인, 표적화된 트랜스포좀 복합체.
  11. 제10항에 있어서, 표적화 올리고뉴클레오티드의 서열은 하나 이상의 관심 핵산 서열과 완전히 또는 일부 상보적이고/이거나 재조합효소는 UVSX, Rec233, 또는 RecA인, 트랜스포좀 복합체.
  12. 키트 또는 조성물로서, 표적화된 트랜스포좀 복합체인 제10항 또는 제11항의 제1 트랜스포좀 복합체, 및 다음 i 내지 iii을 포함하는 제2 트랜스포좀 복합체를 포함하며:
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존,
    상기 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적인, 키트 또는 조성물.
  13. 표적 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제10항 또는 제11항의 트랜스포좀 복합체를 조합하는 단계;
    b. 재조합효소에 의해 핵산의 가닥 침입(strand invasion)을 개시하는 단계; 및
    c. 상기 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  14. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제10항 또는 제11항의 제1 트랜스포좀 복합체와, 다음 i 내지 iii을 포함하는 제2 트랜스포좀 복합체를 조합하는 단계:
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존 - 상기 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -;
    b. 재조합효소에 의해 핵산의 가닥 침입을 개시하는 단계; 및
    c. 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  15. 태그화 핵산 단편들의 라이브러리를 생성하는 방법으로서,
    a. 이중 가닥화 핵산을 포함하는 샘플과, 표적화된 트랜스포좀 복합체인 제10항 또는 제11항의 제1 트랜스포좀 복합체와, 표적화된 트랜스포좀 복합체인 제10항 또는 제11항의 제2 트랜스포좀 복합체를 조합하는 단계;
    b. 재조합효소에 의해 핵산의 가닥 침입을 개시하는 단계; 및
    c. 상기 핵산을 트랜스포사제의 의해, 각각의 제1 트랜스포존의 3' 말단을 표적 단편의 5' 말단에 접합시켜서 제1 트랜스포좀 복합체로부터 생성된 복수의 제1 5' 태그화 표적 단편 및 제2 트랜스포좀 복합체로부터 생성된 복수의 제2 5' 태그화 표적 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  16. 제15항에 있어서, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드와, 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체 내에 포함된 표적화 올리고뉴클레오티드는 상이하며, 선택적으로, 표적화된 트랜스포좀 복합체인 제1 트랜스포좀 복합체 및 표적화된 트랜스포좀 복합체인 제2 트랜스포좀 복합체의 표적화 올리고뉴클레오티드는 이중 가닥화 핵산의 대향 가닥에 결합하는, 방법.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 가닥 침입을 개시하기 위해 사용되는 온도는 트랜스포사제에 의한 단편화를 위한 최적의 온도 미만이며, 선택적으로, 가닥 칩입을 개시하는 단계는 27℃ 내지 47℃에서 수행되고/되거나 단편화 단계는 45℃ 내지 65℃에서 수행되는, 방법.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 트랜스포사제에 대한 보조인자는 침입 개시 후 그리고 단편화 전에 트랜스포좀 복합체에 첨가되는, 방법.
  19. 표적 핵산을 시퀀싱할 때, 근접성 정보(contiguity information)를 보존하는 방법으로서,
    a. 제13항 내지 제18항 중 어느 한 항의 방법에 따라 표적 핵산의 태그화 단편을 제작하는 단계;
    b. 5' 태그화 단편 또는 완전 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계;
    c. 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 단편들의 서열을 그룹화하는 단계; 및
    d. 동일한 표적화 올리고뉴클레오티드의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계
    를 포함하는, 방법.
  20. 표적 핵산을 시퀀싱할 때, 근접성 정보를 보존하는 방법으로서,
    a. 제13항 내지 제19항 중 어느 한 항의 방법에 따라 표적 핵산의 태그화 단편을 제작하는 단계 - 여기서 하나 이상의 어댑터 서열은 단일 표적화 올리고뉴클레오티드 서열과 회합된 고유한 분자 식별자(UMI)를 포함함 -;
    b. 5' 태그화 단편 또는 완전 이중 가닥화 태그화 단편을 시퀀싱하여 단편의 서열을 제공하는 단계;
    c. 동일한 UMI의 서열을 포함하는 단편들의 서열을 그룹화하는 단계; 및
    d. 동일한 UMI의 서열을 포함하는 경우, 해당 서열 그룹이 표적 핵산 내에서 근접하였던 것으로 결정하는 단계
    를 포함하는, 방법.
  21. 핵산의 5' 태그화 단편의 표적화된 생성 방법으로서,
    a. 하나 이상의 표적화 올리고뉴클레오티드를 단일 가닥화 핵산을 포함하는 샘플에 혼성화하는 단계 - 상기 하나 이상의 표적화 올리고뉴클레오티드는 각각 핵산 내의 관심 서열에 결합할 수 있음 -;
    b. 다음 i 내지 iii을 포함하는 트랜스포좀 복합체를 적용하는 단계:
    i. 트랜스포사제;
    ii. 3' 트랜스포존 말단 서열 및 5' 어댑터 서열을 포함하는 제1 트랜스포존; 및
    iii. 5' 트랜스포존 말단 서열을 포함하는 제2 트랜스포존 - 상기 5' 트랜스포존 말단 서열은 3' 트랜스포존 말단 서열에 상보적임 -; 및
    c. 상기 핵산을 트랜스포사제에 의해, 제1 트랜스포존의 3' 말단을 단편의 5' 말단에 접합시켜서 복수의 5' 태그화 단편을 제작하는 것에 의해 복수의 단편으로 단편화하는 단계
    를 포함하는, 방법.
  22. 소기의 샘플과 원하지 않는 샘플 둘 모두를 포함하는 샘플의 혼합된 풀에서 소기의 샘플을 특성화하는 방법으로서,
    a. 이중 가닥화 핵산으로부터 시퀀싱 데이터를 제작하기 위해, 혼합된 풀로부터의 복수의 핵산 샘플을 포함하는 라이브러리를 초기 시퀀싱하는 단계 - 여기서 각각의 핵산 라이브러리는 단일 샘플로부터의 핵산 및 라이브러리 내의 다른 샘플로부터의 핵산으로부터 단일 샘플로부터의 핵산을 구별하기 위한 고유한 샘플 바코드를 포함함 -;
    b. 시퀀싱 데이터를 분석하고, 소기의 샘플로부터의 시퀀싱 데이터와 연관된 고유한 샘플 바코드를 식별하는 단계;
    c. 다음을 포함하는, 라이브러리에 대한 선택 단계를 수행하는 단계:
    i. 소기의 샘플로부터의 핵산 샘플을 농축하는 단계, 및/또는
    ii. 원하지 않는 샘플로부터의 핵산 샘플을 고갈시키는 단계; 및
    d. 핵산 라이브러리를 재시퀀싱하는 단계
    를 포함하는, 방법.
  23. 제22항에 있어서, 샘플의 혼합된 풀은 세포의 혼합된 풀, 핵의 혼합된 풀, 또는 고분자량 DNA의 혼합된 풀을 포함하고/하거나 고유한 샘플 바코드는 고유한 세포 바코드인, 방법.
  24. 제22항 또는 제23항에 있어서,
    a. 농축 단계가 혼성 포획, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획, 또는 고유한 샘플 바코드-특이적 증폭을 포함하거나;
    b. 고갈 단계가 혼성 포획, 촉매적으로 비활성인 엔도뉴클레아제를 통한 포획, CRISPR 분해, 또는 가이드 RNA(gRNA)에 결합된 ShCAST를 포함하는 복합체에 의한 절단을 포함하는, 방법.
  25. 제24항에 있어서, 고갈 단계는 gRNA에 결합된 ShCAST를 포함하는 복합체에 의한 절단을 포함하고, 선택적으로,
    a. ShCAST는 Cas12K를 포함하고;
    b. 트랜스포사제는 Tn5 또는 Tn7-유사 트랜스포사제를 포함하고;
    c. 원하지 않는 샘플로부터의 핵산 샘플은 이중 가닥화 DNA를 포함하고; 그리고/또는
    d. gRNA 및 트랜스포사제 중 적어도 하나는 비오틴화되며, 비오틴화된, gRNA 및 트랜스포사제 중 적어도 하나는 스트렙타비딘-코팅된 비드에 결합될 수 있는, 방법.
  26. 제22항 내지 제25항 중 어느 한 항에 있어서, 엔도뉴클레아제는 하나 이상의 고유한 샘플 바코드에 결합하는 가이드 RNA와 회합되고/되거나 가이드 RNA가 원하지 않는 샘플의 핵산과 연관된 고유한 샘플 바코드를 향하거나 가이드 RNA가 소기의 샘플의 핵산과 연관된 고유한 샘플 바코드를 향하는, 방법.
  27. 제22항 내지 제26항 중 어느 한 항에 있어서, 소기의 샘플은 샘플의 혼합된 풀의 1%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 0.000001%, 0.0000001%, 0.00000001%, 또는 0.000000001% 이하로 존재하는 희귀 샘플인, 방법.
  28. 제22항 내지 제27항 중 어느 한 항에 있어서, 고유한 샘플 바코드를 혼입하기 전에 핵산 샘플을 공간적으로 분리하는 단계 및/또는 샘플의 혼합된 풀로부터의 복수의 핵산 샘플을 시퀀싱하기 이전에 태그먼트화(tagmentation)를 포함하는, 방법.
  29. 제22항 내지 제28항 중 어느 한 항에 있어서, 고유한 샘플 바코드가 각각의 핵산 샘플 내로 혼입되고, 선택적으로, 고유한 샘플 바코드가 단일 연속적 바코드 또는 다수의 불연속적 바코드인, 방법.
  30. 제22항 내지 제29항 중 어느 한 항에 있어서, 상기 초기 시퀀싱 단계는,
    a. 전체 게놈 시퀀싱을 포함하지 않고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하고;
    b. 표적화된 시퀀싱을 포함하고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하고;
    c. 하나 이상의 유전자-특이적 프라이머를 이용하는 표적화된 시퀀싱을 포함하고, 선택적으로 유전자-특이적 프라이머는 범용 프라이머 꼬리를 포함하고; 그리고/또는
    d. 리보좀 시퀀싱을 포함하고, 재시퀀싱 단계는 전체 게놈 시퀀싱을 포함하는, 방법.
  31. 제22항 내지 제30항 중 어느 한 항에 있어서, 환경 샘플로부터의 미생물을 시퀀싱하는 데 사용되며, 선택적으로, 환경 샘플로부터의 미생물을 배양하는 단계를 포함하지 않는, 방법.
KR1020237005622A 2020-08-18 2021-08-17 핵산의 서열-특이적 표적화된 전위 및 선택과 분류 KR20230051508A (ko)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US202063066906P 2020-08-18 2020-08-18
US202063066905P 2020-08-18 2020-08-18
US63/066,906 2020-08-18
US63/066,905 2020-08-18
US202163162775P 2021-03-18 2021-03-18
US63/162,775 2021-03-18
US202163163381P 2021-03-19 2021-03-19
US63/163,381 2021-03-19
US202163168753P 2021-03-31 2021-03-31
US63/168,753 2021-03-31
US202163228344P 2021-08-02 2021-08-02
US63/228,344 2021-08-02
PCT/US2021/046292 WO2022040176A1 (en) 2020-08-18 2021-08-17 Sequence-specific targeted transposition and selection and sorting of nucleic acids

Publications (1)

Publication Number Publication Date
KR20230051508A true KR20230051508A (ko) 2023-04-18

Family

ID=77951793

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237005622A KR20230051508A (ko) 2020-08-18 2021-08-17 핵산의 서열-특이적 표적화된 전위 및 선택과 분류

Country Status (10)

Country Link
US (1) US20230279385A1 (ko)
EP (1) EP4200416A1 (ko)
JP (1) JP2023537850A (ko)
KR (1) KR20230051508A (ko)
CN (1) CN116323971A (ko)
AU (1) AU2021329302A1 (ko)
CA (1) CA3191159A1 (ko)
IL (1) IL299783A (ko)
MX (1) MX2023001676A (ko)
WO (1) WO2022040176A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113383083A (zh) * 2018-04-27 2021-09-10 埃克斯基因美国公司 用于制备多核苷酸的方法和组合物
EP4341390A1 (en) * 2021-05-14 2024-03-27 Becton, Dickinson and Company Methods for making libraries for nucleic acid sequencing

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
ATE144556T1 (de) 1988-06-24 1996-11-15 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
ATE138106T1 (de) 1988-07-20 1996-06-15 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
DE69118930T2 (de) 1990-01-26 1997-01-09 Abbott Lab Verbessertes Verfahren zur Amplifikation von Nuklein säurezielsequenz, einsetzbar für die Polymerase und Ligasekettenreaktion
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
DE69531542T2 (de) 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
WO1995025180A1 (en) 1994-03-16 1995-09-21 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP2319854B1 (en) 1997-01-08 2016-11-30 Sigma-Aldrich Co. LLC Bioconjugation Of Macromolecules
EP3034626A1 (en) 1997-04-01 2016-06-22 Illumina Cambridge Limited Method of nucleic acid sequencing
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US20050244870A1 (en) 1999-04-20 2005-11-03 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US6913884B2 (en) 2001-08-16 2005-07-05 Illumina, Inc. Compositions and methods for repetitive use of genomic DNA
ATE492652T1 (de) 2000-02-07 2011-01-15 Illumina Inc Nukleinsäuredetektionsverfahren mit universellem priming
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
AU2001282881B2 (en) 2000-07-07 2007-06-14 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
DE60332725D1 (de) 2002-05-30 2010-07-08 Scripps Research Inst Kupferkatalysierte ligierung von aziden und acetylenen
EP2607369B1 (en) 2002-08-23 2015-09-23 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
US7670810B2 (en) 2003-06-20 2010-03-02 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US7259258B2 (en) 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US8148515B1 (en) 2009-06-02 2012-04-03 Biotium, Inc. Detection using a dye and a dye modifier
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
WO2012058096A1 (en) 2010-10-27 2012-05-03 Illumina, Inc. Microdevices and biosensor cartridges for biological or chemical analysis and systems and methods for the same
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
CN103717749A (zh) * 2011-04-25 2014-04-09 伯乐生命医学产品有限公司 用于核酸分析的方法和组合物
EP2718465B1 (en) 2011-06-09 2022-04-13 Illumina, Inc. Method of making an analyte array
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
AU2015247779B2 (en) 2014-04-15 2021-06-24 Illumina, Inc. Modified transposases for improved insertion sequence bias and increased DNA input tolerance
CN107109401B (zh) * 2014-07-21 2021-02-19 亿明达股份有限公司 使用crispr-cas系统的多核苷酸富集
EP3256604B1 (en) * 2015-02-10 2020-03-25 Illumina, Inc. Methods and compositions for analyzing cellular components
KR102607830B1 (ko) 2017-02-21 2023-12-01 일루미나, 인코포레이티드 링커를 갖는 고정된 트랜스포좀을 사용한 태그먼트화
CN112166189A (zh) * 2018-05-24 2021-01-01 孟山都技术公司 植物基因组编辑
BR112021017655A2 (pt) * 2019-03-07 2021-11-16 Univ Columbia Método e sistema de integração de dna guiada por rna usando transposons tipo tn7
WO2020243085A1 (en) * 2019-05-24 2020-12-03 The Trustees Of Columbia University In The City Of New York Engineered cas-transposon system for programmable and site-directed dna transpositions

Also Published As

Publication number Publication date
JP2023537850A (ja) 2023-09-06
CN116323971A (zh) 2023-06-23
US20230279385A1 (en) 2023-09-07
AU2021329302A1 (en) 2023-02-16
IL299783A (en) 2023-03-01
EP4200416A1 (en) 2023-06-28
CA3191159A1 (en) 2022-02-24
MX2023001676A (es) 2023-03-17
WO2022040176A1 (en) 2022-02-24

Similar Documents

Publication Publication Date Title
AU2021282536B2 (en) Polynucleotide enrichment using CRISPR-Cas systems
AU2020205215B2 (en) Preserving genomic connectivity information in fragmented genomic DNA samples
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US20220090057A1 (en) Library preparation of tagged nucleic acid using tube add-on protocol
KR102628035B1 (ko) 메틸화 서열결정을 위한 단일 세포 전체 게놈 라이브러리
KR20220041875A (ko) 단일 세포 분석
US20230279385A1 (en) Sequence-Specific Targeted Transposition and Selection and Sorting of Nucleic Acids
RU2798952C2 (ru) Получение библиотеки нуклеиновых кислот с использованием электрофореза
KR20220031539A (ko) 전기영동을 이용한 핵산 라이브러리 제조