KR20230003255A - 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법 - Google Patents

단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법 Download PDF

Info

Publication number
KR20230003255A
KR20230003255A KR1020227042588A KR20227042588A KR20230003255A KR 20230003255 A KR20230003255 A KR 20230003255A KR 1020227042588 A KR1020227042588 A KR 1020227042588A KR 20227042588 A KR20227042588 A KR 20227042588A KR 20230003255 A KR20230003255 A KR 20230003255A
Authority
KR
South Korea
Prior art keywords
nuclei
sequence
index
nucleic acid
amplification
Prior art date
Application number
KR1020227042588A
Other languages
English (en)
Inventor
프랭크 제이. 스티머스
앤드류 씨. 애디
사라 에이. 비탁
Original Assignee
오레곤 헬스 앤드 사이언스 유니버시티
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오레곤 헬스 앤드 사이언스 유니버시티, 일루미나, 인코포레이티드 filed Critical 오레곤 헬스 앤드 사이언스 유니버시티
Publication of KR20230003255A publication Critical patent/KR20230003255A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 명세서에는 복수의 단일 세포로부터 핵산을 포함하는 서열결정 라이브러리의 제조 방법이 제공된다. 일 실시형태에서, 상기 서열결정 라이브러리는 상기 복수의 단일 세포로부터 전체 게놈 핵산을 포함한다. 일 실시형태에서, 방법은 상기 핵의 온전성을 유지시키면서 화학 처리에 의해서 뉴클레오솜-고갈된 핵을 생성시키는 단계를 포함한다. 또한 본 명세서에는 조성물, 예컨대, 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하는 조성물이 제공된다.

Description

단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법 {SINGLE CELL WHOLE GENOME LIBRARIES AND COMBINATORIAL INDEXING METHODS OF MAKING THEREOF}
관련 출원의 상호 참조
본 출원은 2016년 7월 22일자로 출원된 미국 가출원 제62/365,916호 및 2017년 1월 27일자로 출원된 미국 가출원 제62/451,305호의 이익을 주장하며, 이들 각각은 본 명세서에 참고로 포함된다.
서열 목록
본 출원은 27킬로바이트의 크기를 갖고, 2017년 7월 18일자로 생성된 "1592SeqListing_ST25.txt" 하의 파일명의 ASCII 텍스트 파일로서 미국 특허청에 EFS-Web을 통해서 전자적으로 제출된 서열 목록을 함유한다. 서열 목록에 함유된 정보는 참고로 본 명세서에 포함된다.
기술분야
본 개시내용의 실시형태는 핵산을 서열결정하는 것에 관한 것이다. 특히, 본 명세서에 제공된 방법 및 조성물의 실시형태는 인덱싱된(indexed) 단일-세포 서열결정 라이브러리를 생성시키고, 이로부터 서열 데이터를 입수하는 것이다.
단일 세포 서열결정은 포유동물 뇌에서 체세포 이수성(somatic aneuploidy)(McConnell, M. J. et al. Science (80.). 342, 632-637 (2013), Cai, X. et al. Cell Rep. 8, 1280-1289 (2014), Knouse, K. A. et al., Proc Natl Acad Sci U S A 111, 13409-13414 (2014), Rehen, S. K. et al. Proc. Natl. Acad. Sci. U. S. A. 98, 13361-6 (2001)) 및 종양내 이질성(Navin, N. et al. Nature 472, 90-94 (2011), Eirew, P. et al. Nature 518, 422-6 (2014), Gawad, C. et al. Proc. Natl. Acad. Sci. U. S. A. 111, 17947-52 (2014), Gao, R. et al. Nat. Genet. 1-15 (2016). doi:10.1038/ng.3641)을 비롯하여, 다양한 상황에서 세포들 간의 게놈 이질성의 폭을 밝혀냈다. 연구는 두 가지 접근법 중 하나를 선택했다: 단일 뉴클레오타이드 변이체 검출을 위한 높은 세포당 서열결정 깊이(Cai, X. et al. Cell Rep. 8, 1280-1289 (2014), Zong, C. et al. Science (80-. ). 338, 1622-1626 (2012)), 또는 카피 수 변이(CNV) 및 이수성을 식별하기 위한 로-패스(low-pass) 서열결정(McConnell, M. J. et al. Science (80.). 342, 632-637 (2013), Baslan, T. et al. Genome Res. 125, 714-724 (2015), Knouse, K. A. et al. Genome Res. gr.198937.115- (2016). doi:10.1101/gr.198937.115). 후자 접근법에서, 많은 수의 단일 세포 라이브러리를 제조하기 위한 효율적이고, 비용-효과적인 방법의 부족은 집단 스케일에서 CNV-보유 세포의 빈도를 정량하거나 또는 암과 관련하여 이질성의 강력한 분석을 제공하는 것을 어렵게 한다(Gawad, C. et al. Nat. Rev. Genet. 17, 175-88 (2016)).
최근, 인접성-보존 전위(contiguity-preserving transposition: CPT-seq)가 확립되었는데, 이것은 트랜스포사제(transposase)-기반 조합 인덱싱 전략을 사용하여 수 천 개의 연결된 서열 판독물의 개별적으로 바코딩된 라이브러리를 생산하는 방법이다(Adey, A. et al. Genome Biol. 11, R119 (2010), Amini, S. et al. Nat. Genet. 46, 1343-9 (2014), Adey, A. et al. Genome Res. 24, 2041-2049 (2014)). 본 발명자들은 CPT-seq를 게놈 할로타입 분해능의 문제(Amini, S. et al. Nat. Genet. 46, 1343-9 (2014)) 및 신규 게놈 어셈블리(Adey, A. et al. Genome Res. 24, 2041-2049 (2014))에 적용하였다. 이어서 이러한 개념을 염색질 접근성 검정(chromatin accessibility assay), ATAC-seq(Buenrostro, J. D. et al. Nat. Methods 10, 1213-8 (2013))에 적용하여, 수 천 개의 단일 세포 중의 활성 조절 요소의 프로파일을 생성시켰다(Cusanovich, D. a et al. Science 348, 910-4 (2015))(sciATAC-seq, 도 4A). 조합 인덱싱에서, 핵은 먼저 트랜스포사제를 통해서 96개의 인덱싱된 서열결정 어댑터(adaptor) 중 하나의 혼입에 의해서 바코딩된다. 이어서 96개의 반응이 조합되고, 이러한 무작위로 인덱싱된 핵 중 15 내지 25개가 형광 활성화된 핵 분류에 의해서 PCR 플레이트의 각각의 웰 내에 침착된다(FANS, 도 5). 따라서 동일한 트랜스포사제 바코드를 가질 임의의 2개의 핵의 확률은 낮다(6 내지 11%)(Cusanovich, D. a et al. Science 348, 910-4 (2015)). 이어서 각각의 PCR 웰이 인덱싱된 프라이머를 사용하여 고유하게 바코딩된다. 이 과정의 마지막에, 각각의 서열 판독물은 2개의 인덱스(index), 즉 트랜스포사제 플레이트로부터의 인덱스 1, 및 PCR 플레이트로부터의 인덱스 2(이것은 단일 세포 구별을 가능하게 함)를 함유한다. 원칙의 증거로서, 쿠사노비치(Cusanovich) 및 동료들은 15,000개 초과의 sciATAC-seq 프로파일을 생성시켰고, 이를 사용하여 이의 접근 가능한 염색질 랜드스케이프(landscape)에 의해서 두 세포 유형의 믹스를 분리하였다(Cusanovich, D. a et al. Science 348, 910-4 (2015)).
높은 세포 수치의 단일-세포 서열결정이 전사체, 염식질-접근성 및 돌연변이 차이를 통해서 복합체 조직 내에서 집단의 분리에서 이의 효능을 나타내었지만, 지금까지 단일세포의 전체 게놈을 포함하는 서열 정보를 얻는 것은 가능하지 않다.
본 명세서에는 복수의 단일 세포로부터 핵산을 포함하는 서열결정 라이브러리 제조하는 방법이 제공된다. 일 실시형태에서, 방법은 복수의 세포로부터 단리된 핵을 제공하는 단계; 단리된 핵을 화학 처리에 적용하여 단리된 핵의 온전성을 유지시키면서 뉴클레오솜-고갈된 핵을 생성시키는 단계; 뉴클레오솜-고갈된 핵의 하위세트를 제1 복수의 구획 내에 분포시키고, 각각의 하위세트를 트랜스포좀 복합체과 접촉시키는 단계로서, 각각의 구획 내의 트랜스포좀 복합체는 트랜스포사제 및 다른 구획 내의 제1 인덱스 서열과 상이한 제1 인덱스 서열을 포함하는, 상기 단계; 뉴클레오솜-고갈된 핵의 하위세트 내의 단편을 복수의 핵산 단편으로 단편화시키고, 제1 인덱스 서열을 핵산 단편의 적어도 하나의 가닥 내에 혼입시켜 인덱싱된 핵산 단편을 포함하는 인덱싱된 핵을 생성시키는 단계로서, 인덱싱된 핵산 단편은 트랜스포사제에 부착된 채로 유지되는, 상기 단계; 인덱싱된 핵을 조합하여 풀링된 인덱싱된 핵을 생성시키는 단계; 풀링된 인덱싱된 핵의 하위세트를 제2 복수의 구획 내에 분포시키는 단계; 각각의 구획 내의 인덱싱된 핵산 단편 내에 제2 인덱스 서열을 혼입시켜 이중-인덱스 단편을 생성시키는 단계로서, 각각의 구획 내의 제2 인덱스 서열은 다른 구획 내의 제2 인덱스 서열과 상이한, 상기 단계; 및 이중-인덱스 단편을 조합함으로써 복수의 단일 세포로부터 전체 게놈 핵산을 포함하는 서열결정 라이브러리를 생성시키는 단계를 포함한다.
일 실시형태에서, 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는 카오트로픽제(chaotropic agent), 예컨대, 리튬 3,5-다이아이오도살리실산으로의 처리를 포함한다. 일 실시형태에서, 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는, 세정제, 예컨대, 소듐 도데실 설페이트(SDS)로의 처리를 포함한다.
일 실시형태에서, 핵은 단리된 핵을 화학 처리, 예컨대, 폼알데하이드에 적용하기 전에 가교결합제로 처리된다. 가교결합제는 약 0.2% 내지 약 2%의 농도일 수 있고, 일 실시형태에서는 약 1.5%이다. 일 실시형태에서, 폼알데하이드에 의한 가교결합은 풀링된 인덱싱된 핵의 하위세트를 분포시킨 후에 그리고 각각의 구획 내의 인덱싱된 핵산 단편 내에 제2 인덱스 서열을 혼입시키기 전에 반전된다. 일 실시형태에서, 가교결합의 반전은 약 55℃ 내지 약 72℃에서의 인큐베이션을 포함한다. 일 실시형태에서, 트랜스포사제는 가교결합의 반전 이전에 인덱싱된 핵산 단편으로부터 해리된다. 일 실시형태에서, 트랜스포사제는 소듐 도데실 설페이트(SDS)를 사용하여 인덱싱된 핵산 단편으로부터 해리된다.
일 실시형태에서, 핵은 뉴클레오솜-고갈된 핵의 하위세트 내의 핵산을 복수의 핵산 단편으로 단편화시키고, 제1 인덱스 서열을 혼입시키기 전에 제한 효소로 처리된다. 일 실시형태에서, 핵은 제한 효소로의 처리 후에 리가제로 처리된다.
일 실시형태에서, 뉴클레오솜-고갈된 핵의 하위세트를 분포시키는 것, 풀링된 인덱싱된 핵의 하위세트를 분포시키는 것, 또는 이들의 조합은 형광-활성화된 핵 분류에 의해서 수행된다. 일 실시형태에서, 뉴클레오솜-고갈된 핵의 하위세트는 대략 동일한 수의 핵을 포함하고, 일 실시형태에서, 뉴클레오솜-고갈된 핵의 하위세트는 1 내지 약 2000개의 핵을 포함한다. 일 실시형태에서, 풀링된 인덱싱된 핵의 하위세트는 대략 동일한 수의 핵을 포함하고, 일 실시형태에서, 풀링된 인덱싱된 핵의 하위세트는 1 내지 약 25개의 핵을 포함한다. 일 실시형태에서, 풀링된 인덱싱된 핵의 하위세트는 뉴클레오솜-고갈된 핵의 하위세트보다 적어도 10배 더 적은 핵, 또는 뉴클레오솜-고갈된 핵의 하위세트보다 적어도 100배 더 적은 핵을 포함한다.
일 실시형태에서, 제1 복수의 구획, 제2 복수의 구획, 또는 이들의 조합은 다중-웰 플레이트, 예컨대, 96-웰 플레이트 또는 384-웰 플레이트이다.
일 실시형태에서, 뉴클레오솜-고갈된 핵의 하위세트가 구획 내에 분포된 후 트랜스포좀 복합체가 구획에 첨가된다. 일 실시형태에서, 트랜스포좀 복합체 각각은 트랜스포존을 포함하고, 트랜스포존 각각은 전달된 가닥을 포함한다. 일 실시형태에서, 전달된 가닥은 제1 인덱스 서열 및 제1 범용(universal) 서열을 포함한다.
일 실시형태에서, 제2 인덱스 서열을 인덱싱된 핵산 단편 내에 혼입하는 것은 각각의 구획 내의 인덱싱된 핵산 단편을, 각각 인덱스 서열을 포함하고, 각각 제1 범용 서열의 일부와 동일하거나 이에 상보성인 서열을 포함하는 제1 범용 프라이머 및 제2 범용 프라이머와 접촉시키고, 지수적 증폭 반응을 수행하는 것을 포함한다. 일 실시형태에서, 지수적 증폭 반응은 중합효소 연쇄 반응(PCR)일 수 있고, 일 실시형태에서, PCR은 15 내지 30회 사이클을 포함할 수 있다. 일 실시형태에서, 제1 범용 프라이머의 인덱스 서열은 제2 범용 프라이머의 인덱스 서열의 역 보체이고, 또 다른 실시형태에서, 제1 범용 프라이머의 인덱스 서열은 제2 범용 프라이머의 인덱스 서열의 역 보체와 상이하다. 일 실시형태에서, 제1 범용 프라이머는 이중-인덱스 단편의 3' 단부에서 범용 서열에 상보성인 제1 앵커(anchor) 서열 및 제1 포획(capture) 서열을 추가로 포함하고, 일 실시형태에서, 제1 포획 서열은 P5 프라이머 서열을 포함한다. 일 실시형태에서, 제2 범용 프라이머는 이중-인덱스 단편의 5' 단부에서 범용 서열에 상보성인 제2 앵커 서열 및 제2 포획 서열을 추가로 포함하고, 일 실시형태에서, 제2 포획 서열은 P7 프라이머 서열의 역 보체를 포함한다.
방법은 이중-인덱스 단편에 대해서 특이성을 갖는 복수의 포획 올리고뉴클레오타이드를 사용한 이중-인덱스 단편의 풍부화를 포함한다. 일 실시형태에서, 포획 올리고뉴클레오타이드는 고체 기질의 표면 상에 고정되고, 일 실시형태에서, 포획 올리고뉴클레오타이드는 범용 결합쌍의 제1 구성원을 포함하고, 결합쌍의 제2 구성원은 고체 기질의 표면 상에 고정된다.
방법은 또한 이중-인덱스 단편을 서열결정하여 복수의 단일 세포로부터 핵산의 뉴클레오타이드 서열을 결정하는 단계를 추가로 포함할 수 있다. 일 실시형태에서, 방법은 복수의 증폭 부위를 포함하는 표면을 제공하는 단계로서, 증폭 부위는 자유 3' 단부를 갖는 부착된 단일 가닥 포획 올리고뉴클레오타이드의 적어도 2개의 집단을 포함하는, 상기 단계, 및 증폭 부위를 포함하는 표면을, 각각 개별 이중-인덱스 단편으로부터의 앰플리콘의 클론성 집단을 포함하는 복수의 증폭 부위를 생성시키기에 적합한 조건 하에서 이중-인덱스 단편과 접촉시키는 단계를 포함할 수 있다. 일 실시형태에서, 이중-인덱스 단편의 수는 증폭 부위의 수를 초과하되, 이중-인덱스 단편은 증폭 부위에 대한 유체 접근부를 갖고, 그리고 증폭 부위 각각은 서열결정 라이브러리 내에 몇몇 이중-인덱스 단편을 위한 용량(capacity)을 갖는다. 일 실시형태에서, 접촉시키는 단계는 동시에 (i) 이중-인덱스 단편을 평균 수송 속도로 증폭 부위로 수송하는 단계, 및 (ii) 증폭 부위에 존재하는 상기 이중-인덱스 단편을 평균 증폭 속도로 증폭시키는 단계를 포함하되, 평균 증폭 속도는 평균 수송 속도를 초과한다.
또한 본 명세서에는 조성물이 제공된다. 일 실시형태에서, 조성물은 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하고, 여기서 단리된 핵은 인덱싱된 핵산 단편을 포함한다. 일 실시형태에서, 단리된 핵은 비자연적 가교결합부를 포함한다. 일 실시형태에서, 조성물은 오버행을 포함하는 절단된 제한 부위에서 종결된 인덱싱된 핵산 단편을 포함한다. 일 실시형태에서, 단리된 핵은 재배열된 게놈 DNA를 포함한다. 또 다른 실시형태에서, 조성물은 다중-웰 플레이트를 포함하고, 여기서 다중-웰 플레이트의 웰은 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하고, 여기서 단리된 핵은 인덱싱된 핵산 단편을 포함한다.
본 개시내용의 예시적인 실시형태의 하기 상세한 설명은 하기 도면과 함께 검토하는 경우 가장 잘 이해될 수 있다.
도 1은 본 개시내용에 따른 단일-세포 조합 인덱싱을 위한 일반적인 예시적인 방법의 일반적인 블록 다이어그램.
도 2는 인덱싱된 핵산 단편의 예시적인 실시형태의 개략도.
도 3은 이중-인덱스 단편의 예시적인 실시형태의 개략도.
도 4는 뉴클레오솜 고갈을 갖는 단일 세포 조합 인덱싱을 나타낸 도면. (도 4A) 단일 세포 조합 인덱싱 작업 흐름. (도 4B) 리튬 보조 뉴클레오솜 고갈(Lithium Assisted Nucleosome Depletion: LAND)을 사용한 뉴클레오솜 고갈 또는 가교결합 및 SDS 처리(xSDS) 이후에 표준 단리에 의해서 생성된 무손상 핵의 위상차 영상(phase contrast image). 스케일 막대: 100㎛. (도 4C) 뉴클레오솜 고갈은 염색질 접근성의 부위에 제한되지 않은 게놈 전체에 걸친 균일한 커버리지를 생성시킨다.
도 5는 형광 활성화된 핵 분류(FANS)를 나타낸 도면. 단일 핵의 FANS 분류로부터의 대표적인 플롯. 모든 플롯은 달리 언급되지 않는 한 제2(PCR) 플레이트의 분류로부터 유래된다. (도 5a) ATAC-seq 핵 (도 5b) LAND (도 5c) HeLa S3 및 3T3 (도 5d) xSDS (도 5e) PDAC Sort 1 트랜스포사제 플레이트 (도 5f) PDAC Sort 2 PCR 플레이트.
도 6은 혼합 모델을 사용한 SCI-seq 단일 세포 결정을 나타낸 도면. 나타낸 HeLa.LAND3, R 패키지 믹스툴의 노말믹스(normalmix)EM을 사용하여 각각의 분포를 식별하였다: 노이즈 인덱스 조합(좌측 피크) 및 단일 세포 라이브러리(우측 피크). 인덱스 조합을 단일 세포 라이브러리로서 간주하기 위한 판독 수치 역치는 단일 세포 분포의 평균보다 1 표준 편차(log10 공간에서) 작은 것 또는 노이즈 분포의 표준보다 2 큰 것(log10 공간에서, 따라서 100배 더 큼) 중에서 더 큰 것 및 최소 1,000이다. 나타낸 라이브러리의 경우, 단일 세포 성분의 평균보다 1 표준 편차 작은 것이 더 크고, 따라서 판독 수치 역치로서 사용된다.
도 7은 LAND 및 xSDS 뉴클레오솜 고갈 방법과 SCI-seq의 비교를 나타낸 도면. (도 7a) GM12878에 대한 6개의 LAND SCI-seq 제제 중 하나에 대한 복합성. 우측, 판독 수치의 분포를 나타낸 히스토그램. 점선은 단일-세포 판독 컷오프를 나타낸다. (도 7b) 3개의 PCR 플레이트 중 하나에 대한 xSDS 뉴클레오솜 고갈인 것을 제외하고는 도 7a에서와 같음. (도 7c) 좌측, GM12878 xSDS 제제에 대한 다운-샘플링된 판독물 상에서 제조되고, 커버리지의 완전 깊이를 예측하는데 사용되는 모델. 우측, LAND 제제 및 완전 xSDS 제제 중 하나에 대한 예상. 명암법은 다중 모델에 걸친 s.d.를 나타낸다. 지점은 서열결정의 실제 깊이를 나타낸다. (도 7d) LAND 또는 xSDS를 사용한 SCI-seq 및 쿠사이-랜덤 프라이밍(quasi-random priming: QRP) 및 축퇴 올리고뉴클레오타이드 PCR(DOP)에 대한 커버리지 균일성 스코어. (도 7e) 분산 필터(variance filter)을 시행하거나 시행하지 않은 모든 제제에 걸친 염색체-아암 수준에서 이수성을 나타낸 세포의 백분율의 요약. (도 7f) 50개 GM12878 세포의 핵형결정(karyotyping) 결과. (도 7g, 도 7h) LAND(도 7g) 또는 xSDS(도 7h)를 사용하여 생산된 단일 GM12878 세포의 윈도우화된 카피-수 콜(windowed copy-number call) 및 클러스터링의 요약. 각각의 패널에서 상단은 모든 세포에 대한 게인 또는 손실 빈도의 염색체-아암-스케일 요약을 나타내고; 하단은 적어도 하나의 CNV 콜을 함유하는 세포에 대한 클러스터링된 프로파일이다.
도 8은 모든 제제에 대한 SCI-seq 라이브러리 복잡성 및 인덱스 판독 수치 분포를 나타낸 도면. 각각의 제제에 대해서 2개의 플롯을 도시한다. 좌측: 각각의 지점은 고유 인덱스 조합(unique index combination)을 나타내고, x-축은 인덱스 조합에 배정된 고유 판독물의 분율이고, y-축은 인덱스 조합에 대한 log10 고유 판독 수치이다. 등고선은 지점 밀도를 나타낸다. 우측: 인덱스 조합 각각에 대한 log10 고유 판독 수치의 히스토그램. 본 발명자들은 대부분의 잠재적인 인덱스 조합이 단일 세포 라이브러리를 나타내지 않고, 따라서 매우 적은 고유 판독물을 함유하고(가장 좌측 분포), 단일 세포 라이브러리는 훨씬 더 많은 판독물 수치를 갖는다(우측 분포 또는 더 낮은 성능 라이브러리에서의 테일)고 예상한다. 플롯이 log10 스케일 상에 있기 때문에, 노이즈 분포는 실제로 총 판독 수치의 소수 만을 차지한다.
도 9는 인간 세포와 마우스 세포의 믹스에 대한 SCI-seq를 나타낸 도면. 모든 패널에 대해서 각각의 인덱스 성분에 대한 판독물의 수는 인간 참조 게놈, 또는 마우스 참조 게놈에 정렬된 수치를 기반으로 플롯팅된다. (도 9a,b) 인간(GM12878) 및 마우스(3T3)에 대한 LAND 뉴클레오솜 고갈, (도 9c,d) 인간(HeLa S3) 및 마우스(3T3)에 대한 LAND 뉴클레오솜 고갈, (도 9e) 인간(HeLa S3) 및 마우스(3T3)에 대한 xSDS 뉴클레오솜 고갈.
도 10은 더 깊은 서열결정 후 SCI-seq 라이브러리 복잡성 및 인덱스 판독 수치 분포를 나타낸 도면. 각각의 제제에 대해서 S2에서와 같이 2개의 플롯을 나타내고, 좌측 플롯은 각각의 인덱스 조합에 대한 고유 판독물의 분율 대 고유 판독 수치를 나타낸다. 우측 플롯은 각각의 인덱스 조합에 대한 판독 수치의 히스토그램을 나타낸다. 더 깊게 서열결정된 웰로부터의 세포를 그 웰이 속한 플레이트의 나머지와 함께 나타낸다. 더 낮은 복잡성을 갖는(더 좌측인) 세포의 집단은 더 깊게 서열결정된 집단이다.
도 11은 동일한 단일 세포에서 인접한 전위 사건의 서열결정으로부터 관찰된 9bp 판독 충첩을 나타낸 도면. (도 11a) 9bp 카핑이 전위 사건으로부터 발생한 방법의 다이어그램. (도 11b) 9bp에서 점선과 함께 모든 앰플리콘 중첩의 크기를 나타낸 대표적인 단일 세포.
도 12는 HMM 및 CBS에 대한 카피 수 호출 컴퓨터 흐름도. 호출 후, CBS 및 HMM에 대한 콜 세트는 징코(Ginkgo)와 교차하고, 모든 3개의 세트에 존재하는 콜 만이 최종 콜 세트로서 보유되었다.
도 13은 GM12878에 대한 단일 세포 서열결정의 표준 방법을 사용한 CNV 평가를 나타낸 도면. 상단: 염색체 아암 증폭 및 결실의 요약, 하단: 세포의 계층 클러스터링.
도 14는 모든 방법 전체의 윈도우 크기 및 판독 수치 컷오프에 의한 분산을 나타낸 도면. 세포당 윈도우 크기 및 판독 수치의 함수로서의 MAD 또는 MAPD 스코어의 변화를 나타낸 플롯.
도 15는 분산 스코어 컷오프 전체에 걸친 GM12878 이수성 비율을 나타낸 도면. 각각의 지점은 주어진 스코어 컷오프(x-축)에 포함된 세포의 수에 의해서 스케일된, 세포의 집단에 대한 이수성 비율(y-축)이다.
도 16은 쿠사이-랜덤 프라이밍(QRP)을 사용한 레서스 전두엽, 개체 1에 대한 CNV 프로파일을 나타낸 도면. (도 16a) 징코 콜, (도 16b) CBS 콜, (도 16c) HMM 콜, (도 16d) 3개 모두의 교차, 및 (도 16e) CBS 및 HMM 만의 교차.
도 17은 축퇴 올리고뉴클레오타이드 프라이밍된 PCR(DOP)을 사용한 레서스 전두엽, 개체 1에 대한 CNV 프로파일을 나타낸 도면. (도 17a) 징코 콜, (도 17b) CBS 콜, (도 17c) HMM 콜, (도 17d) 3개 모두의 교차, 및 (도 17e) CBS 및 HMM 만의 교차.
도 18은 LAND 뉴클레오솜 고갈과 함께 SCI-seq를 사용한 레서스 전두엽, 개체 1에 대한 CNV 프로파일을 나타낸 도면. (도 18a) 징코 콜, (도 18b) CBS 콜, (도 18c) HMM 콜, (도 18d) 3개 모두의 교차, 및 (도 18e) CBS 및 HMM 만의 교차.
도 19는 xSDS 뉴클레오솜 고갈과 함께 SCI-seq를 사용한 레서스 전두엽, 개체 1에 대한 CNV 프로파일을 나타낸 도면. (도 19a) 징코 콜, (도 19b) CBS 콜, (도 19c) HMM 콜, (도 19d) 3개 모두의 교차, 및 (도 19e) CBS 및 HMM 만의 교차.
도 20은 레서스 뇌에서 체세포 CNV를 나타낸 도면. (도 20a) SCI-seq 제제(HMM)에 대한 카피 수 변이, 및 하나의 대표적인 정배수성 세포를 나타낸 3개의 단일-세포 예. (도 20b) 필터링되거나 필터링되지 않은 방법 각각에 의해서 결정된 바와 같은 이수성의 빈도.
도 21은 레서스 전두엽 개체 1에 대한 커버리지 균일성의 비교를 나타낸 도면. 균일성 측정치는 GM12878 제제(도 7b)의 것과 매우 유사하다.
도 22는 분산 스코어 컷오프 전체에 걸친 레서스 이수성 비율을 나타낸 도면. 각각의 지점은 주어진 스코어 컷오프(x-축)에 포함된 세포의 수에 의해서 스케일된, 세포의 집단에 대한 이수성 비율(y-축)이다.
도 23은 xSDS 뉴클레오솜 고갈과 함께 SCI-seq를 사용한 레서스 전두엽, 개체 2에 대한 CNV 프로파일을 나타낸 도면. (도 23a) 징코 콜, (도 23b) CBS 콜, (도 23c) HMM 콜, (도 23d) 3개 모두의 교차, 및 (도 23e) CBS 및 HMM 만의 교차.
도 24는 III기 인간 췌장관 선암 (PDAC)의 SCI-seq 분석을 나타낸 도면. (도 24a) SCI-seq 라이브러리 복잡성. 우측 패널, 판독 수치의 분포를 나타낸 히스토그램. 점선은 단일 세포 판독 컷오프를 나타낸다. (도 24b) 중단점 콜(상단) 및 log2 서열 깊이 비의 중단점 윈도우 매트릭스. (도 24c) 중단점 매트릭스에 대한 주성분 분석 및 k-수단 클러스터링. (도 24d) 각각의 클러스터로부터의 응집된 세포에 대한 100kbp 분해능 CNV 호출. (도 24e) 모든 클러스터에 존재하는 클러스터 특이적 CNV 및 CEBPA 증폭(k4 나타냄).
도 25는 췌장관 선암에 대한 xSDS-기반 뉴클레오솜 고갈을 사용한 SCI-seq를 나타낸 도면. 분석에서 사용된 카피 수 호출의 3가지 방법에 대한 2.5Mbp 윈도우에 대한 카피 수 콜 요약: (도 25a) 징코, (도 25b) CBS, 및 (도 25c) HMM.
도 26은 xSDS SCI-seq를 사용한 일차 PDAC에 대한 단일 세포 CNV 콜을 나타낸 도면. 대표적인 단일 세포 신호 플롯.
도 27은 중단점 분석 흐름도의 개략도. 먼저, 개별 세포를 중단점에 대해서 분석한다. 역치를 초과하는 경우 모든 세포로부터의 중단점을 합치고, 국지적으로 판단한다. 국지적인 공유된 중단점들 사이에서 간격이 정의되고, 각각의 간격 내에서 평균 비율 스코어가 발견된다.
도 28은 카피 수 변이 호출을 위해서 히든 마르코프 모델(Hidden Markov Model) 방법을 사용하여 HeLavS3 상에서 LAND-기반 뉴클레오솜 고갈을 사용한 SCI-seq를 나타낸 도면. 윈도우화(2.5Mbp) 콜 및 세포의 계층 클러스터링의 요약. CBC 카피 수 호출은 하위-염색체 콜에 대해서 상당한 편향을 초래하였고, 징코는 다수의 세포에서 배수성을 적절하게 식별하는 데 실패하여 완전히 증폭된 바와 같이 지칭된 대다수의 세포를 초래하였다.
도 29는 히든 마르코프 모델 방법을 사용하여 단일 세포에서 HeLa S3 카피 수 변이 호출에 대해서 LAND-기반 뉴클레오솜 고갈을 사용한 SCI-seq를 나타낸 도면. 대표적인 단일 세포 신호 플롯. 1의 신호는 2.98의 평균 배수성에 상응한다.
도 30은 HeLa의 중단점 분석을 나타낸 도면. (도 30a) 2.5Mbp 윈도우를 사용한 HMM 분석으로부터 HeLa 세포주에서 식별된 중단점. (도 30b) GM12878에 대해서 정규화된 세포에 대한 HeLa 중단점 윈도우의 Log2 매트릭스.
도 31은 HeLa 중단점 윈도우에 대한 PCA를 나타낸 도면. HeLa는 세포주의 안정성을 기반으로 예상된 바와 같은 단일 집단을 생성시킨다. 적색 지점 및 청색 지점은 상이한 제제를 나타낸다.
도 32는 보관된(banked) II기 직장 암 샘플에 대한 xSDS-기반 뉴클레오솜 고갈을 사용한 SCI-seq를 나타낸 도면. 2.5Mbp 윈도우에 대한 교차된 카피 수 콜 요약.
도 33은 포워드 스캐터, 사이드 스캐터, 및 DAPI 강도 파라미터를 사용한 트랜스포사제로의 처리 후에 단일 핵을 단리하는 데 사용되는 게이팅 도식을 나타낸 도면.
도 34는 본 개시내용에 따른 단일-세포 조합 인덱싱을 위한 일반적인 예시적인 방법 및 게놈 및 염색체 입체 배좌의 일 실시형태의 일반적인 블록 다이어그램.
도 35는 다양한 폼알데하이드 농도 및 가교결합 반전의 시간을 사용한 방법으로부터 얻은 라이브러리 복잡성 및 고유 판독 수치를 나타낸 도면.
도 36은 HeLa 상에서 sci-GCC를 사용한 단일 세포 라이브러리의 예를 나타낸 도면. 키메라 결찰 정션 판독물로부터의 생산된 신호는 x-축 상의 제1 윈도우 및 y-축 상의 연결 윈도우를 갖는 10Mbp 윈도우에 걸친 게놈의 윈위 영역들 사이에 나타난다. 트랜스-염색체 3C 신호가 상승된 HeLa에 존재하는 공지된 전좌가 강조되어 있다.
개략도는 반드시 일정한 비율로 도시된 것은 아니다. 도면에서 사용된 유사한 번호는 유사한 성분, 단계 및 등을 지칭한다. 그러나, 주어진 도면에서 성분을 지칭하기 위한 번호의 사용은 동일한 번호로 표지된 또 다른 도면에서의 성분을 제한하도록 의도되지 않는다는 것이 이해될 것이다. 또한, 성분을 지칭하기 위한 상이한 번호의 사용은 상이한 번호의 성분이 다른 번호의 성분과 동일하거나 유사할 수 없다는 것을 나타내는 것으로 의도되지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "유기체", "대상체"는 상호 교환 가능하게 사용되고, 동물 및 식물을 지칭한다. 동물의 예는 포유동물, 예컨대, 인간이다.
본 명세서에서 사용되는 바와 같이, 용어 "세포 유형"은 모폴로지, 표현형, 발달 기원 또는 다른 공지되거나 인지 가능한 구별되는 세포 특징을 기반으로 세포를 식별하도록 의도된다. 다양한 상이한 세포 유형이 단일 유기체로부터(또는 유기체의 동일한 종으로부터) 수득될 수 있다. 예시적인 세포 유형은 방광, 췌장 상피, 췌장 알파, 췌장 베타, 췌장 내피, 골수 림프아구, 골수 B 림프아구, 골수 대식세포, 골수 적아구, 골수 수지상, 골수 지방세포, 골수 골세포, 골수 연골세포, 프로마이얼로블라스트(promyeloblast), 골수 거대핵모세포, 블래더(bladder), 뇌 B 림프구, 뇌 신경교, 뉴런, 뇌 성상교세포, 신경외배엽, 뇌 대식세포, 뇌 미세아교세포, 뇌 상피, 피질 뉴런, 뇌 섬유아세포, 유방 상피, 결장 상피, 결장 B 림프구, 유방 상피, 유방 근상피, 유방 섬유아세포, 결장 소장세포, 자궁경부 상피, 난소 상피, 난소 섬유아세포, 유선 상피, 혀 상피, 편도 수지상, 편도 B 림프구, 말초 혈액 림프아구, 말초 혈액 T 림프아구, 말초 혈액 피부 T 림프구, 말초 혈액 자연 킬러, 말초 혈액 B 림프아구, 말초 혈액 단핵구, 말초 혈액 골수아세포, 말초 혈액 단핵모세포, 말초 혈액 프로마이얼로블라스트, 말초 혈액 대식세포, 말초 혈액 호염구, 간 내피, 간 마스트(mast), 간 상피, 간 B 림프구, 비장 내피, 비장 상피, 비장 B 림프구, 간 간세포, 간 섬유아세포, 폐 상피, 기관지 상피, 폐 섬유아세포, 폐 B 림프구, 폐 슈반(Schwann), 폐 편평세포, 폐 대식세포, 폐 골아세포, 신경내분비, 폐 폐포, 위 상피, 및 위 섬유아세포를 포함하지만 이들로 제한되지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "조직"은 유기체에서 1종 이상의 특정 기능을 수행하도록 함께 작용하는 세포의 집합체 또는 응집물을 의미하도록 의도된다. 세포는 임의로 모폴로지적으로 유사할 수 있다. 예시적인 조직은 눈, 근육, 피부, 힘줄, 정맥, 동맥, 혈액, 심장, 비장, 림프절, 골, 골수, 폐, 기관지, 기관지, 소화관, 소장, 대장, 결장, 직장, 침샘, 혀, 담낭, 맹장, 간, 췌장, 뇌, 위, 피부, 신장, 요관, 방광, 요도, 생식선, 고환, 난소, 자궁, 나팔관, 흉선, 뇌하수체, 갑상선, 부신, 또는 부갑상선을 포함하지만 이들로 제한되지 않는다. 조직은 인간 또는 다른 유기체의 다양한 기관 중 임의의 것으로부터 유래될 수 있다. 조직은 건강한 조직 또는 건강하지 않은 조직일 수 있다. 건강하지 않은 조직은 폐, 유방, 직장결장, 전립선, 인두, 위, 고환, 피부, 신경계, 골, 난소, 간, 혈액 조직, 췌장, 자궁, 신장, 림프 조직 등에서의 악성종양을 포함하지만 이들로 제한되지 않는다. 악성은 다양한 조직학적 하위유형, 예를 들어, 암종, 선암, 육종, 섬유선암, 신경내분비성, 또는 미분화성일 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "뉴클레오솜"은 염색질의 기본 반복 단위를 지칭한다. 인간 게놈은 약 10㎜의 평균 직경을 갖는 세포의 핵 내에 컴팩팅된 수 미터의 DNA로 이루어진다. 진핵생물 핵에서, DNA는 염색질로서 공지된 핵단백질 복합체 내에 패키징된다. 뉴클레오솜(염색질의 기본 반복 단위)은 전형적으로 중심 히스톤 팔량체 주변에 대략 1.7배로 감겨 있는 약 146개의 DNA 염기쌍을 포함한다. 히스톤 팔량체는 히스톤 H2A, H2B, H3 및 H4 각각의 2개의 카피로 이루어진다. 뉴클레오솜은 스트링 상에서 비드의 방식으로 DNA를 따라서 규칙적으로 이격되어 있다.
본 명세서에서 사용되는 바와 같이, 용어 "구획"은 어떤 것을 다른 것으로부터 분리 또는 단리하는 면?? 또는 체적을 의미하도록 의도된다. 예시적인 구획은, 바이알, 관, 웰, 소적, 볼러스(boluse), 비드, 용기, 표면 특징부, 또는 물리적 힘, 예컨대, 유체 유동, 자성, 전기 전류 등에 의해서 분리된 면적 또는 체적을 포함하지만, 이들로 제한되지 않는다. 일 실시형태에서, 구획은 다중-웰 플레이트, 예컨대, 96- 또는 384-웰 플레이트의 웰이다.
본 명세서에서 사용되는 바와 같이, "트랜스포좀 복합체"는 통합 인식 부위를 포함하는 통합 효소 및 핵산을 지칭한다. "트랜스포좀 복합체"는 전위 반응을 촉매작용할 수 있는 트랜스포사제 인식 부위 및 트랜스포사제에 의해서 형성된 기능적 복합체이다(예를 들어, 군더슨(Gunderson) 등의 국제 특허 제WO 2016/130704호 참고). 통합 효소의 예는 인터그라제 또는 트랜스포사제를 포함하지만, 이들로 제한되지 않는다. 통합 인식 부위의 예는 트랜스포사제 인식 부위를 포함하지만, 이들로 제한되지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "핵산"은 관련 기술 분야에서 이의 용도와 일치하는 것으로 의도되고, 자연 발생 핵산 또는 이의 기능적 유사체를 포함한다. 특히 유용한 기능적 유사체는 핵산에 서열 특이적 방식으로 혼성화할 수 있거나 또는 특정 뉴클레오타이드 서열의 복제를 위한 주형으로서 사용될 수 있다. 자연 발생 핵산은 일반적으로 포스포다이에스터 결합을 갖는다. 유사체 구조는 관련 기술 분야에 공지된 다양한 것 중 임의의 것을 비롯한 교호 골격 링키지를 가질 수 있다. 자연 발생 핵산은 일반적으로 데옥시리보스 당(예를 들어, 데옥시리보핵산(DNA)에서 발견됨) 또는 리보스 당(예를 들어, 리보핵산(RNA)에서 발견됨)을 갖는다. 핵산은 관련 기술 분야에 공지된 이러한 당 모이어티의 다양한 유사체 중 임의의 것을 함유할 수 있다. 핵산은 네이티브 또는 비네이티브 염기를 포함할 수 있다. 이와 관련하여, 네이티브 데옥시리보핵산은 아데닌, 티민, 사이토신 또는 구아닌으로 이루어진 군으로부터 선택된 1종 이상의 염기를 가질 수 있고, 리보핵산은 아데닌, 우라실, 사이토신 또는 구아닌으로 이루어진 군으로부터 선택된 1종 이상의 염기를 가질 수 있다. 핵산에 포함될 수 있는 유용한 비네이티브 염기는 관련 기술 분야에 공지되어 있다. 비네이티브 염기의 예는 잠금(locked) 핵산(LNA) 및 브릿징된 핵산(BNA)을 포함한다. LNA 및 BNA 염기가 DNA 올리고뉴클레오타이드에 혼입되어, 올리고뉴클레오타이드 혼성화 강도 및 특이성을 증가시킬 수 있다. LNA 및 BNA 염기 및 이러한 염기의 용도는 관련 기술 분야의 통상의 기술자에게 공지되어 있고, 일상적이다.
본 명세서에서 사용되는 바와 같이, "뉴클레아제"는 핵산을 절단하는 임의의 효소를 지칭한다. 뉴클레아제는 가수분해효소라 불리는 효소의 부류에 속하고, 통상적으로 작용에서 특이적이고, 리보핵산(RNA)에 대해서 우선적으로 작용하는 리보뉴클레아제 및 데옥시리보핵산(DNA)에 대해서 우선적으로 작용하는 데옥시리보뉴클레아제가 있다.
본 명세서에서 사용되는 바와 같이, 핵산에 대한 언급에서 사용되는 경우 용어 "표적"은 본 명세서에 언급된 방법 또는 조성물과 관련하여 핵산에 대한 의미론적인 식별자로서 의도되고, 달리 명확하게 지시하는 것을 넘어서 핵산의 구조 또는 기능을 필수적으로 제한하지 않는다. 표적 핵산은 본질적으로 공지 또는 미지의 서열의 임의의 핵산일 수 있다. 그것은 예를 들어, 게놈 DNA 또는 cDNA의 단편일 수 있다. 서열결정은 표적 분자의 전체 또는 부분의 서열의 결정을 초래할 수 있다. 표적은 1차 핵산 샘플, 예컨대, 핵으로부터 유래될 수 있다. 표적은 또한 cDNA로의 역전사에 의해서 1차 RNA 샘플로부터 입수될 수 있다. 일 실시형태에서, 표적은 각각의 표적 단편의 단부에서 범용 서열의 배치에 의해서 증폭에 적합한 주형으로 가공될 수 있다.
본 명세서에서 사용되는 바와 같이, 뉴클레오타이드 서열을 기술하기 위해서 사용되는 경우 용어 "범용"은 분자가 서로 상이한 서열의 영역을 또한 갖는 2개 이상의 핵산 분자에 공통적인 서열의 영역을 지칭한다. 분자의 집합체의 상이한 구성원에 존재하는 범용 서열은 범용 포획 핵산, 예를 들어, 범용 서열의 일부에 상보성인 포획 올리고뉴클레오타이드, 예를 들어, 범용 포획 서열의 집단을 사용한 다수의 상이한 핵산의 포획을 허용할 수 있다. 범용 포획 서열의 비제한적인 예는 P5 및 P7 프라이머와 동일하거나 이에 상보성인 서열을 포함한다. 유사하게, 분자의 집합체의 상이한 구성원에 존재하는 범용 서열은 범용 서열의 일부에 상보성인 범용 프라이머, 예를 들어, 범용 앵커 서열의 집단을 사용한 다수의 상이한 핵산의 증폭 또는 복제(예를 들어, 서열결정)를 허용할 수 있다. 따라서 포획 올리고뉴클레오타이드 또는 범용 프라이머는 범용 서열에 특이적으로 혼성화할 수 있는 서열을 포함한다. 혼성화한 2개의 범용 서열은 범용 결합쌍이라 지칭된다. 예를 들어, 혼성화한 포획 올리고뉴클레오타이드 및 범용 포획 서열은 범용 결합쌍이다.
용어 "P5" 및 "P7"은 범용 포획 서열 또는 포획 올리고뉴클레오타이드를 지칭하는 경우 사용될 수 있다. 용어 "P5'"(P5 프라임) 및 "P7'"(P7 프라임)은 각각 P5 및 P7의 보체를 지칭한다. 임의의 적합한 범용 포획 서열 또는 포획 올리고뉴클레오타이드가 본 명세서에 제시된 방법에서 사용될 수 있고, P5 및 P7의 사용은 단지 예시적인 실시형태이다. 플로우셀 상에서의 포획 올리고뉴클레오타이드 예컨대, P5 및 P7 또는 이의 보체의 사용은 국제 특허 제WO 2007/010251호, 제WO 2006/064199호, 제WO 2005/065814호, 제WO 2015/106941호, 제WO 1998/044151호, 및 제WO 2000/018957호의 개시내용에 의해서 예시된 바와 같이 관련 기술 분야에 공지되어 있다. 예를 들어, 임의의 적합한 포워드 증폭 프라이머(고정되어 있든 용액 중에 존재하든)가 상보성 서열에 대한 혼성화 및 서열의 증폭을 위해서 본 명세서에 제시된 방법에서 유용할 수 있다. 유사하게, 임의의 적합한 리버스 증폭 프라이머(고정되어 있든 용액 중에 존재하든)가 상보성 서열에 대한 혼성화 및 서열의 증폭을 위해서 본 명세서에 제시된 방법에서 유용할 수 있다. 관련 기술 분야의 통상의 기술자는 본 명세서에 제시된 바와 같은 핵산의 포획 및/또는 증폭에 적합한 프라이머 서열의 설계 및 사용 방법을 이해할 것이다.
본 명세서에서 사용되는 바와 같이, 용어 "프라이머" 및 이의 파생어는 일반적으로 관심 표적 서열에 혼성화할 수 있는 임의의 핵산을 지칭한다. 전형적으로, 프라이머는 뉴클레오타이드가 상부에서 중합효소에 의해서 중합될 수 있는 기질로서 기능하지만; 일부 실시형태에서, 그러나, 프라이머는 합성된 핵산 가닥 내에 혼입되어, 또 다른 프라이머가 혼성화하여 합성된 핵산 분자에 상보성인 새로운 가닥의 합성을 프라이밍할 수 있는 부위를 제공할 수 있다. 프라이머는 뉴클레오타이드 또는 이의 유사체의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 프라이머는 단일-가닥 올리고뉴클레오타이드 또는 폴리뉴클레오타이드이다. 용어 "폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"는 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭하도록 본 명세서에서 상호 교환 가능하게 사용되고, 리보뉴클레오타이드, 데옥시리보뉴클레오타이드, 이의 유사체, 또는 이의 혼합물을 포함할 수 있다. 이 용어는 등가물로서, 뉴클레오타이드 유사체로부터 제조된 DNA 또는 RNA의 유사체를 포함하도록 이해되어야 하고, 단일 가닥(예컨대, 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오타이드에 적용 가능하도록 이해되어야 한다. 이 용어는 본 명세서에서 사용되는 바와 같이 또한 예를 들어, 역전사 효소의 작용에 의해서 RNA 주형으로부터 생산된 DNA에 상보성이거나 또는 이를 카피하는, cDNA를 포함한다. 이 용어는 분자의 1차 구보 만을 지칭한다. 따라서, 이 용어는 삼중-, 이중- 및 단일-가닥 데옥시리보핵산("DNA"), 뿐만 아니라 삼중-, 이중- 및 단일-가닥 리보핵산("RNA")을 포함한다.
본 명세서에서 사용되는 바와 같이, 용어 "어댑터(adapter)" 및 이의 파생어, 예를 들어, 범용 어댑터는 일반적으로 본 개시내용의 핵산 분자에 결찰될 수 있는 임의의 선형 올리고뉴클레오타이드를 지칭한다. 일부 실시형태에서, 어댑터는 샘플 중에 존재하는 임의의 표적 서열의 3' 단부 또는 5' 단부에 실질적으로 비상보성이다. 일부 실시형태에서, 적합한 어댑터 길이는 약 10 내지 100개 뉴클레오타이드, 약 12 내지 60개 뉴클레오타이드, 또는 약 15 내지 50개 뉴클레오타이드의 길이의 범위이다. 일반적으로, 어댑터는 뉴클레오타이드 및/또는 핵산의 임의의 조합물을 포함할 수 있다. 일부 양상에서, 어댑터는 하나 이상의 위치에서 1종 이상의 절단 가능한 기를 포함할 수 있다. 또 다른 양상에서, 어댑터는 프라이머, 예를 들어, 범용 프라이머의 적어도 일부에 실질적으로 동일하거나 또는 실질적으로 상보성인 서열을 포함할 수 있다. 일부 실시형태에서, 어댑터는 하류 오차 보정, 식별 또는 서열결정을 보조하도록 바코드(본 명세서에서 태그 또는 인덱스라고도 지칭됨)를 포함할 수 있다. 용어 "어댑터(adaptor)" 또는 "어댑터"는 상호 교환 가능하게 사용된다.
본 명세서에서 사용되는 바와 같이, 아이템의 집합체에 대한 언급에서 사용되는 경우 용어 "각각"은 그 집합체 내의 개별 아이템을 식별하도록 의도되지만, 달리 명백하게 언급되지 않는 한 그 집합 내의 모든 아이템을 반드시 지칭하는 것은 아니다.
본 명세서에서 사용되는 바와 같이, 용어 "수송"은 유체를 통한 분자의 이동을 지칭한다. 이 용어는 수동 수송, 예컨대, 이의 농도 구배(예를 들어, 수동 확산)를 통한 분자의 이동을 포함할 수 있다. 이 용어는 또한 능동 수송을 포함할 수 있고, 이에 의해서 분자는 이의 농도 구배를 따라서 또는 이의 농도 구배에 대해서 이동할 수 있다. 따라서, 수송은 에너지를 적용하여 목적하는 방향으로 또는 목적하는 위치, 예컨대, 증폭 부위로 1종 이상의 분자를 이동시키는 것을 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "증폭시키다", "증폭시키는" 또는 "증폭 반응" 및 이의 파생어는 일반적으로 핵산 분자의 적어도 일부가 적어도 하나의 추가적인 핵산 분자로 복제되거나 또는 카피되는 임의의 작용 또는 과정을 지칭한다. 추가적인 핵산 분자는 주형 핵산 분자의 적어도 일부 부분에 실질적으로 동일하거나 또는 실질적으로 상보성인 서열을 임의로 포함한다. 주형 핵산 분자는 단일-가닥 또는 이중-가닥일 수 있고, 추가적인 핵산 분자는 독립적으로 단일-가닥 또는 이중-가닥일 수 있다. 증폭은 핵산 분자의 선형 또는 지수적 복제를 임의로 포함한다. 일부 실시형태에서, 이러한 증폭은 등온 조건을 사용하여 수행될 수 있고; 다른 실시형태에서, 이러한 증폭은 열순환을 포함할 수 있다. 일부 실시형태에서, 증폭은 단일 증폭 반응으로 복수의 표적 서열을 동시에 증폭시키는 것을 포함하는 멀티플렉스 증폭이다. 일부 실시형태에서, "증폭"은 DNA 및 RNA 기반 핵산 단독의 적어도 일부 부분, 또는 조합으로의 증폭을 포함한다. 증폭 반응은 관련 기술 분야의 통상의 기술자에게 공지된 증폭 공정 중 임의의 것을 포함할 수 있다. 일부 실시형태에서, 증폭 반응은 중합효소 연쇄 반응(PCR)을 포함한다.
본 명세서에서 사용되는 바와 같이, "증폭 조건" 및 이의 파생어는 일반적으로 1종 이상의 핵산 서열을 증폭시키기에 적합한 조건을 지칭한다. 이러한 증폭은 선형이거나 또는 지수적일 수 있다. 일부 실시형태에서, 증폭 조건은 등온 조건을 포함할 수 있거나, 대안적으로 열순환 조건, 또는 등온 조건과 열순환 조건의 조합을 포함할 수 있다. 일부 실시형태에서, 1종 이상의 핵산 서열을 증폭시키기에 적합한 조건은 중합효소 연쇄 반응(PCR) 조건을 포함한다. 전형적으로, 증폭 조건은 핵산, 예컨대, 범용 서열에 의해서 플랭킹된 1종 이상의 표적 서열을 증폭시키거나, 1종 이상의 어댑터에 결찰된 증폭된 표적 서열을 증폭시키기에 충분한 반응 혼합물을 지칭한다. 일반적으로, 증폭 조건은 증폭 또는 핵산 합성을 위한 촉매, 예를 들어, 중합효소; 증폭될 핵산에 대해서 어느 정도의 상보성을 보유하는 프라이머; 및 뉴클레오타이드, 예컨대, 핵산에 혼성화된 후 프라이머의 연장을 촉진시키기 위한 데옥시리보뉴클레오타이드 트라이포스페이트(dNTP)를 포함한다. 증폭 조건은 핵산에 대한 프라이머의 혼성화 또는 어닐링, 프라이머의 연장 및 변성 단계(여기서 연장된 프라이머는 증폭 중인 핵산 서열로부터 분리됨)가 요구될 수 있다. 필수적이지는 않지만, 전형적으로, 증폭 조건은 열순환을 포함할 수 있고; 일부 실시형태에서, 증폭 조건은 어닐링, 연장 및 분리 단계가 반복되는 복수의 사이클을 포함한다. 전형적으로, 증폭 조건은 양이온, 예컨대, Mg2+ 또는 Mn2+를 포함하고, 이온 강도의 다양한 변형제를 또한 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, "재증폭" 및 이의 파생어는 일반적으로 증폭된 핵산 분자의 적어도 일부가 임의의 적합한 증폭 과정(일부 실시형태에서 "2차" 증폭으로 지칭됨)을 통해서 추가로 증폭되어, 재증폭된 핵산 분자를 생성시키는 임의의 과정을 지칭한다. 2차 증폭은 증폭된 핵산 분자가 생산된 본래 증폭 과정과 동일할 필요도 없고; 재증폭된 핵산 분자가 증폭된 핵산 분자에 완전히 동일하거나 완전히 상보성일 필요도 없으며; 필요한 것은 재증폭된 핵산 분자가 증폭된 핵산 분자 또는 이의 보체의 적어도 일부를 포함한다는 것이다. 예를 들어, 재증폭은 1차 증폭과 상이한 표적-특이적 프라이머를 포함하는 상이한 프라이머 및/또는 상이한 증폭 조건의 사용을 포함할 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "중합효소 연쇄 반응"("PCR")은 물리스(Mullis)의 미국 특허 제4,683,195호 및 제4,683,202호의 방법을 지칭하는데, 이것은 클로닝 또는 정제 없이 게놈 DNA의 혼합물 중에서 관심 폴리뉴클레오타이드의 분절의 농도를 증가시키는 방법을 기술한다. 관심 폴리뉴클레오타이드를 증폭시키는 이러한 과정은 2종의 올리고뉴클레오타이드 프라이머의 상당히 과량을 목적하는 관심 폴리뉴클레오타이드를 함유하는 DNA 혼합물에 도입하는 단계, 그 다음 DNA 중합효소의 존재 하에서의 일련의 열 사이클링 단계로 이루어진다. 2개의 프라이머는 관심 이중 가닥 폴리뉴클레오타이드의 이의 각각의 가닥에 상보성이다. 혼합물은 먼저 더 높은 온도에서 변성되고, 이어서 프라이머는 관심 분자의 폴리뉴클레오타이드 내에서 상보성 서열에 어닐링된다. 어닐링 후, 프라이머는 중합효소를 사용하여 연장되어 새로운 상보성 가닥의 쌍을 형성한다. 변성 단계, 프라이머 어닐링 단계 및 중합효소 연장 단계는 여러 번 반복되어(열순환이라 지칭됨) 고농도의 목적하는 관심 폴리뉴클레오타이드의 증폭 분절을 수득할 수 있다. 목적하는 관심 폴리뉴클레오타이드(앰플리콘)의 증폭된 분절의 길이는 서로에 대한 프라이머의 상대적인 위치에 의해서 결정되고, 따라서 이러한 길이는 제어 가능한 파라미터이다. 이러한 과정의 반복으로 인해서, 이 방법은 "중합효소 연쇄 반응"(이하 "PCR")이라 지칭된다. 관심 폴리뉴클레오타이드의 목적하는 증폭된 분절이 혼합물 중에서 우세한 핵산 서열(농도 면에서)이 되기 때문에, 이것은 "PCR 증폭된"이라고 불린다. 상기에 논의된 방법에 대한 변형에서, 표적 핵산 분자는 복수의 상이한 프라이머쌍, 일부 경우에, 관심 표적 핵산 분자당 1종 이상의 프라이머쌍이 을 사용하여 PCR 증폭되어, 멀티플렉스 PCR 반응을 형성할 수 있다.
본 명세서에 정의된 바와 같이 "멀티플렉스 증폭"은 적어도 1종의 표적-특이적 프라이머를 사용한 샘플 중의 2개 이상의 표적 서열의 선택적인 비무작위 증폭을 지칭한다. 일부 실시형태에서, 멀티플렉스 증폭은 단일 반응 용기 내에서 표적 서열의 일부 또는 전부가 증폭되도록 수행된다. 주어진 멀티플렉스 증폭의 "플렉시" 또는 "플렉스"는 일반적으로 단일 멀티플렉스 증폭 동안 증폭되는 상이한 표적-특이적 서열의 수를 지칭한다. 일부 실시형태에서, 플렉시는 약 12-플렉스, 24-플렉스, 48-플렉스, 96-플렉스, 192-플렉스, 384-플렉스, 768-플렉스, 1536-플렉스, 3072-플렉스, 6144-플렉스 또는 그 초과일 수 있다. 몇몇 상이한 방법(예를 들어, 젤 전기영동 그 이후의 농도측정, 생물분석기로의 정량 또는 정량 PCR, 표지된 프로브와의 혼성화; 바이오틴일화된 프라이머의 혼입 그 이후의 아비딘-효소 접합체 검출; 32P-표지된 데옥시뉴클레오타이드 트라이포스페이트의 증폭된 표적 서열 내로의 혼입)에 의해서 증폭된 표적 서열을 검출하는 것이 또한 가능하다.
본 명세서에서 사용되는 바와 같이, "증폭된 표적 서열" 및 이의 파생어는 일반적으로 표적-특이적 프라이머 및 본 명세서에 제공된 방법을 사용하여 표적 서열을 증폭시킴으로써 생산된 핵산 서열을 지칭한다. 증폭된 표적 서열은 표적 서열에 대해서 동일한 센스(즉, 양성 가닥) 또는 안티센스(즉, 음성 가닥) 중 어느 하나일 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "결찰시키는", "결찰" 및 이의 파생어는 일반적으로 2개 이상의 분자를 함께 공유 연결시키는 과정, 예를 들어, 2개 이상의 핵산 분자를 서로에 공유 연결시키는 과정을 지칭한다. 일부 실시형태에서, 결찰은 핵산의 인접한 뉴클레오타이드 간의 닉을 연결하는 것을 포함한다. 일부 실시형태에서, 결찰은 제1 핵산 분자의 단부와 제2 핵산 분자의 단부 사이에 공유 결합을 형성하는 것을 포함한다. 일부 실시형태에서, 결찰은 하나의 핵산의 5' 포스페이트기와 제2 핵산의 3' 하이드록실기 사이에 공유 결합을 형성하여, 결찰된 핵산 분자를 형성하는 것을 포함할 수 있다. 일반적으로 본 개시내용의 목적을 위해서, 증폭된 표적 서열은 어댑터에 결찰되어 어댑터-결찰된 증폭된 표적 서열을 생성시킬 수 있다.
본 명세서에서 사용되는 바와 같이, "리가제" 및 이의 파생어는 일반적으로 2개의 기질 분자의 결찰을 촉매작용할 수 있는 임의의 작용제를 지칭한다. 일부 실시형태에서, 리가제는 핵산의 인접한 뉴클레오타이드들 사이에서 닉의 연결을 촉매작용할 수 있는 효소를 포함한다. 일부 실시형태에서, 리가제는 하나의 핵산 분자의 5' 포스페이트와 또 다른 핵산 분자의 3' 하이드록실 사이의 공유 결합의 형성을 촉매작용하여, 결찰된 핵산 분자를 형성할 수 있는 효소를 포함한다. 적합한 리가제는 T4 DNA 리가제, T4 RNA 리가제, 및 이. 콜라이 DNA 리가제를 포함할 수 있지만, 이들로 제한되지 않는다.
본 명세서에서 사용되는 바와 같이, "결찰 조건" 및 이의 파생어는 일반적으로 2개의 분자를 서로에 결찰시키기에 적합한 조건을 지칭한다. 일부 실시형태에서, 결찰 조건은 핵산들 사이의 닉 또는 갭을 시일링하기에 적합하다. 본 명세서에서 사용되는 바와 같이, 용어 닉 또는 갭은 관련 기술 분야에서의 그 용어의 사용과 일치한다. 전형적으로, 닉 또는 갭은 효소, 예컨대, 리가제의 존재 하에서 적절한 온도 및 pH에서 결찰될 수 있다. 일부 실시형태에서, T4 DNA 리가제는 약 70 내지 72℃의 온도에서 핵산들 사이의 닉을 연결할 수 있다.
용어 "플로우셀"은 본 명세서에서 사용되는 바와 같이 1종 이상의 유체 시약이 유동될 수 있는 고체 표면을 포함하는 챔버를 지칭한다. 본 개시내용의 방법에서 쉽게 사용될 수 있는 플로우셀 및 검출 플랫폼의 예는 예를 들어, 문헌[Bentley et al., Nature 456:53-59 (2008)], 특허 제WO 04/018497호; 제US 7,057,026호; 제WO 91/06678호; 제WO 07/123744호; 제US 7,329,492호; 제US 7,211,414호; 제US 7,315,019호; 제US 7,405,281호 및 제US 2008/0108082호에 기술되어 있다.
본 명세서에서 사용되는 바와 같이, 핵산에 대한 언급에서 사용되는 경우 용어 "앰플리콘"은 핵산의 카핑 산물을 의미하고, 여기서 그 산물은 핵산의 뉴클레오타이드 서열의 적어도 일부에 동일하거나 상보성인 뉴클레오타이드 서열을 갖는다. 앰플리콘은 예를 들어, 중합효소 연장, 중합효소 연쇄 반응(PCR), 회전환 증폭(RCA), 결찰 연장, 또는 결찰 연쇄 반응을 비롯한, 주형으로서 핵산, 또는 이의 앰플리콘을 사용하는 임의의 다양한 증폭 방법에 의해서 생산될 수 있다. 앰플리콘은 특정 뉴클레오타이드 서열(예를 들어, PCR 산물)의 단일 카피 또는 뉴클레오타이드 서열(예를 들어, RCA의 콘카터머 산물(concatameric product))의 다수의 카피를 갖는 핵산 분자일 수 있다. 표적 핵산의 제1 앰플리콘은 전형적으로상보성 카피이다. 후석 앰플리콘은 제1 앰플리콘의 생성 이후에, 표적 핵산으로부터 또는 제1 앰플리콘으로부터 생성된 카피이다. 후속 앰플리콘은 표적 핵산에 실질적으로 상보성이거나 표적 핵산에 실질적으로 동일한 서열을 가질 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "증폭 부위"는 1종 이상의 앰플리콘이 생성될 수 있는 어레이 내의 또는 어레이 상의 부위를 지칭한다. 증폭 부위는 그 부위에서 생성되는 적어도 하나의 앰플리콘을 함유하거나, 보유하거나 또는 그에 부착되도록 추가로 구성될 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "어레이"는 상대적인 위치에 따라서 서로와 차별될 수 있는 부위의 집단을 지칭한다. 어레이의 상이한 부위에 존재하는 상이한 분자는 그 어레이 내의 부위의 위치에 따라서 서로와 차별될 수 있다. 어레이의 개별 부위는 1종 이상의 특정 유형의 분자를 포함할 수 있다. 예를 들어, 부위는 특정 서열을 갖는 단일 표적 핵산 분자를 포함할 수 있거나 부위는 동일한 서열(및/또는 이의 상보성 서열)을 갖는 몇몇 핵산 분자를 포함할 수 있다. 어레이의 부위는 동일한 기질 상에 위치된 상이한 특징부일 수 있다. 예시적인 특징부는 기질 내의 웰, 기질 내 또는 기질 상의 비드(또는 다른 입자), 기질로부터의 돌출부, 기질 상의 릿지(ridge) 또는 기질 내의 채널을 비제한적으로 포함한다. 어레이의 부위는 각각 상이한 분자를 보유하는 별개의 기질일 수 있다. 별개의 기질에 부착되는 상이한 분자는, 그 기질이 회합된 표면 상의 기질의 위치에 따라서 또는 액체 또는 젤 중의 기질의 위치에 따라서 식별될 수 있다. 별개의 기질이 표면 상에 위치된 예시적인 어레이는 비제한적으로 웰 내에 비드를 갖는 것을 포함한다.
본 명세서에서 사용되는 바와 같이, 용어 "용량"은 부위 및 핵산 물질에 대한 언급에서 사용되는 경우 그 부위를 점유할 수 있는 핵산 물질의 최대양을 의미한다. 예를 들어, 이 용어는 특정 조건에서 그 부위를 점유할 수 있는 핵산 분자의 총 수를 지칭할 수 있다. 예를 들어, 핵산 물질의 총 질량 또는 특정 조건에서 그 부위를 점유할 수 있는 특정 뉴클레오타이드 서열의 카피의 총수를 비롯한 다른 측정치가 마찬가지로 사용될 수 있다. 전형적으로, 표적 핵산에 대한 부위의 용량은 표적 핵산의 앰플리콘에 대한 부위의 용량과 실질적으로 동일하다.
본 명세서에서 사용되는 바와 같이, 용어 "포획제"는 표적 분자(예를 들어, 표적 핵산)에 부착, 보유 또는 결합할 수 있는 물질, 화학물질, 분자 또는 이의 모이어티를 지칭한다. 예시적인 포획제는 비제한적으로 표적 핵산의 적어도 일부에 상보성인 포획 핵산(본 명세서에서 포획 올리고뉴클레오타이드라고도 지칭됨), 표적 핵산(또는 이에 부착된 연결 모이어티)에 결합할 수 있는 수용체-리간드 결합쌍의 구성원(예를 들어, 아비딘, 스트렙타비딘, 바이오틴, 렉틴, 탄수화물, 핵산 결합 단백질, 에피토프, 항체 등), 또는 표적 핵산(또는 이에 부착된 연결 모이어티)과 공유 결합을 형성할 수 있는 화학 시약을 포함한다.
본 명세서에서 사용되는 바와 같이, 용어 "클론성 집단"은 특정 뉴클레오타이드 서열에 대해서 균일한 핵산의 집단을 지칭한다. 균일한 서열은 전형적으로 적어도 10개의 뉴클레오타이드 길이이지만, 예를 들어, 적어도 50, 100, 250, 500 또는 1000개의 뉴클레오타이드 길이를 비롯하여, 심지어는 더 길 수 있다. 클론성 집단은 단일 표적 핵산 또는 주형 핵산으로부터 유래될 수 있다. 전형적으로, 클론성 집단 중의 핵산의 전부가 동일한 뉴클레오타이드 서열을 가질 것이다. 적은 수의 돌연변이(예를 들어, 증폭 인공물)가 클론성에서 벗어나지 않으면서 클론성 집단에서 일어날 수 있다.
본 명세서에서 사용되는 바와 같이, 조성물, 물품, 핵산, 또는 핵과 관련하여 "제공하는"은 조성물, 물품, 핵산, 또는 핵을 제조하거나, 조성물, 물품, 핵산, 또는 핵을 달리 입수하는 것을 의미한다.
용어 "및/또는"은 열거된 요소 중 하나 또는 전부 또는 열거된 요소 중 임의의 둘 이상의 조합을 의미한다.
단어 "바람직한" 및 "바람직하게는"은 특정 상황 하에서 특정 이익을 제공할 수 있는 본 개시내용의 실시형태를 지칭한다. 그러나, 다른 실시형태가 동일하거나 다른 상황 하에서 또한 바람직할 수 있다. 추가로, 1종 이상의 바람직한 실시형태의 언급은 다른 실시형태가 유용하지 않다는 것을 의미하지 않고, 본 개시내용의 범주로부터 다른 실시형태를 제외시키도록 의도되지 않는다.
용어 "포함한다" 및 이의 변형은 이 용어가 설명 및 청구범위에 존재하는 경우 제한적인 의미를 갖지 않는다.
실시형태가 어느 실시형태나 용어 "포함하다", "포함한다", 또는 "포함하는" 등과 함께 본 명세서에 기술되어 있고, "이루어진" 및/또는 "본질적으로 이루어진"과 관련하여 기술된 다른 유사한 실시형태가 또한 제공된다.
달리 명시되지 않는 한, 단수 표현 및 "적어도 하나"는 상호 교환 가능하게 사용되고, 하나 또는 하나 초과를 의미한다.
또한 본 명세서에서, 종점에 의한 수치 범위의 언급은 그 범위 내의 하위 범위의 모든 수를 포함한다(예를 들어, 1 내지 5는 1, 1.5, 2, 2.75, 3, 3.80, 4, 5 등을 포함한다).
개별 단계를 포함하는 본 명세서에 개시된 임의의 방법의 경우, 단계는 임의의 실행 가능한 순서로 수행될 수 있다. 그리고, 적절한 경우, 2개 이상의 단계의 임의의 조합이 동시에 수행될 수 있다.
본 명세서 전체에서 "일 실시형태", "실시형태", "특정 실시형태", 또는 "일부 실시형태" 등에 대한 언급은 그 실시형태와 관련하여 기술된 특정 특징부, 구성, 조성물 또는 특징이 본 개시내용의 적어도 하나의 실시형태에 포함됨을 의미한다. 따라서, 본 명세서 전체에서 다양한 부분에서 이러한 구의 존재는 개시내용의 동일한 실시형태를 반드시 지칭하는 것은 아니다. 추가로, 특정 특징부, 구성, 조성물 또는 특징이 하나 이상의 실시형태에서 임의의 적합한 방식으로 조합될 수 있다.
본 명세서에 제공된 방법을 사용하여 복수의 단일 세포의 전체 게놈을 포함하는 서열결정 라이브러리를 생성시킬 수 있다. 일 실시형태에서, 방법을 사용하여 카피 수 변이(CNV, 예를 들어, 세포의 유전자형 내의 특정 서열, 예컨대, 유전자의 수)를 검출할 수 있다. 예를 들어, 방법을 사용하여 유기체로부터의 체세포의 샘플에서 CNV-보유 핵의 빈도를 정량하거나 또는 특정 병태, 예컨대, 암과 관련하여 이질성에 대한 정보를 제공할 수 있다.
본 명세서에 제공된 방법은 복수의 세포로부터 단리된 핵을 제공하는 단계를 포함한다(도 1, 블록 12; 도 34 블록 12). 세포는 임의의 유기체(들)로부터, 그리고 유기체(들)의 임의의 세포 유형 또는 임의의 조직으로부터 유래될 수 있다. 방법은 세포를 해리시키는 단계, 및/또는 핵을 단리하는 단계를 추가로 포함할 수 있다. 세포로부터 핵을 단리하는 방법은 관련 기술 분야의 통상의 기술자에게 공지되어 있고, 일상적이다. 핵의 수는 적어도 2개이다. 상한은 본 명세서에 기술된 바와 같은 방법의 다른 단계에서 사용되는 장비(예를 들어, 다중-웰 플레이트)의 실질적인 제한에 좌우된다. 예를 들어, 일 실시형태에서 핵의 수는 1,000,000,000개 이하, 100,000,000개 이하, 10,000,000개 이하, 1,000,000개 이하, 100,000개 이하, 10,000개 이하, 또는 1,000개 이하일 수 있다. 통상의 기술자는 각각의 핵 내의 핵산 분자가 유기체의 전체 유전 보체(또한 유기체의 전체 게놈이라 지칭됨)를 나타내고, 인트론 서열 및 엑손 서열 둘 모두뿐만 아니라 비-암호 조절 서열, 예컨대, 프로모터 및 인핸서 서열을 포함하는 게놈 DNA 분자라는 것을 인식할 것이다.
단리된 핵은 뉴클레오솜-무함유일 수 있거나, 또는 그것은 뉴클레오솜의 핵을 고갈시키는 조건에 적용되어, 뉴클레오솜-고갈된 핵을 생성시킬 수 있다(도 1, 블록 13; 도 34 블록 13). 뉴클레오솜-고갈된 핵은 세포의 전체 게놈의 DNA 서열을 결정하는 방법에서 유용하다.
일 실시형태에서, 뉴클레오솜-고갈을 위해서 사용되는 조건은 단리된 핵의 온전성을 유지시킨다. 전형적으로, 뉴클레오솜-고갈 방법은 단일 세포의 펠릿 또는 현탁액 상에서 사용되고, 따라서 그러한 실시형태에서 접착성 세포 배양물 또는 조직이 세포의 공급원으로서 사용되고, 공급원은 처리되어 단일 세포의 펠릿 또는 현탁액을 수득한다.
일 실시형태에서, 뉴클레오솜-고갈을 위한 조건은 핵산-단백질 상호작용을 방해할 수 있는 카오트로픽제로의 화학 처리를 포함한다. 유용한 카오트로픽제의 예는 3,5-리튬 다이아이오도살리실산을 포함하지만 이로 제한되지 않는다. 3,5-리튬 다이아이오도살리실산의 사용 조건은 그것을 세포의 펠릿에 첨가하고, 얼음 상에서 인큐베이션시키는 것을 포함한다.
또 다른 실시형태에서, 조건은 핵산-단백질 상호작용을 방해할 수 있는 세정제로의 화학 처리를 포함한다. 유용한 세정제의 예는 소듐 도데실 설페이트(SDS)를 포함하지만 이로 제한되지 않는다. SDS의 사용 조건은 그것을 세포의 펠릿에 첨가하고, 승온, 예컨대, 42℃에서 인큐베이션시키고, 이어서 비이온성 세정제, 예컨대, 트리톤(Triton)?? X-100을 첨가하고, 승온, 예컨대, 42℃에서 인큐베이션시키는 것을 포함한다.
일부 실시형태에서, 세정제, 예컨대, SDS가 사용되는 경우, 핵은 뉴클레오솜의 고갈 이전에 가교결합제에 노출된다. 일 실시형태에서, 핵은 세포 내부에서 가교결합제에 노출되고(도 34, 블록 11), 또 다른 실시형태에서, 단리된 핵은 가교결합제에 노출된다. 가교결합제의 유용한 예는 폼알데하이드를 포함하지만 이로 제한되지 않는다(Hoffman et al., 2015, J. Biol. Chem., 290:26404-26411). 세포의 폼알데하이드로의 처리는 폼알데하이드를 세포의 현탁액에 첨가하고, 실온에서 인큐베이션시키는 것을 포함할 수 있다. 일 실시형태에서, 폼알데하이드의 농도는 0.2% 내지 2%, 예컨대, 0.2% 초과 및 1.5% 이하일 수 있다. 폼알데하이드 처리 후에, 핵은 글리신 및 비이온성, 비변성 세정제, 비이온성, 비변성 세정제, 예컨대, 이게팔(Igepal)®에 노출될 수 있다. 핵을 단리하기 전에 세포가 가교결합되는 경우, 가교결합은 전형적으로 55℃ 내지 72℃, 예컨대, 68℃에서, 30분 내지 16시간, 예컨대, 1시간 동안의 인큐베이션에 의해서 반전된다(도 34, 블록 19). 그 후에 반전은 전형적으로 풀링된 인덱싱된 핵의 하위세트를 제2 복수의 구획에 분포시키는 단계(도 34, 블록 18) 후에 그리고 이중-인덱스 단편을 생성시키는 단계(도 34, 블록 20) 전에 일어난다. 하위세트를 분포시키는 단계 및 이중-인덱스 단편를 생성시키는 단계가 본 명세서 기술되어 있다.
일부 실시형태에서 가교결합제가 사용되는 경우, 방법은 또한 핵 내의 염색체 구조에 대한 정보, 예컨대, 염색질 폴딩 분석 및 게놈 재배열, 예컨대, 비제한적으로 전좌의 검출을 제공하는 조작을 포함할 수 있다. 이러한 분석 유형은 염색체 입체 배좌 포획(3C) 및 관련 방법(4C, 5C, 및 Hi-C)으로서 관련 기술 분야에 공지되어 있다. 이러한 조작은 전형적으로 핵 내의 게놈 DNA의 소화(도 34, 블록 14), 그 다음 근접하게 존재하는 게놈 단편의 단부의 결찰(도 34, 블록 15)을 포함한다. 이러한 단계는 키메라 단편을 생성하고, 여기서 키메라 단편은 서열 공간에서 또한 전형적으로 가까운 핵 내에서 인접하게 물리적으로 근접할 가능성이 있다(Nagano et al., 2013, Nature, 502:59-64). 전형적으로, 핵이 가교결합제에 노출된 후 그리고 핵산을 단편화하기 전에, 핵 중에 존재하는 게놈 DNA는 뉴클레아제, 예컨대, 제한 엔도뉴클레아제에 의해서 소화된다(도 34, 블록 14). 임의의 제한 엔도뉴클레아제가 사용될 수 있고, 일 실시형태에서, 제한 엔도뉴클레아제는 핵산을 절단하여 통상의 기술자에게 점착성 단부로서 또한 공지된 2개의 오버행을 생성한다. 게놈 DNA의 제한 엔도뉴클레아제로의 소화 후, 핵은 리가제에 노출되어 게놈 DNA의 단편을 연결한다(도 34, 블록 15).
단리된 핵에서 뉴클레오솜을 고갈시키는 과정(도 1, 블록 13; 도 34 블록 13) 동안, 단리된 핵의 온전성이 유지된다. 뉴클레오솜을 고갈시키기 위한 조건에 노출된 후에 핵이 무손상으로 유지되는지의 여부는, 일상적인 방법, 예컨대, 위상차 영상화에 의해서 핵의 상태를 가시화함으로써 결정될 수 있다. 일 실시형태에서, 적어도 100,000개의 핵이 뉴클레오솜-고갈 후에 무손상된다.
본 명세서에 제공된 방법은 뉴클레오솜-고갈된 핵의 하위세트를 제1 복수의 구획 내에 분포시키는 단계(도 1, 블록 14; 도 34, 블록 16)를 포함한다. 하위세트 중에, 따라서 각각의 구획 중에 존재하는 핵의 수는 적어도 1개일 수 있다. 일 실시형태에서, 하위세트 중에 존재하는 핵의 수는 1,000,000개 이하, 100,000개 이하, 10,000개 이하, 4,000개 이하, 3,000개 이하, 2,000개 이하 또는 1,000개 이하이다. 일 실시형태에서, 하위세트 중에 존재하는 핵의 수는 1 내지 1,000개, 1,000 내지 10,000개, 10,000 내지 100,000개, 또는 100,000 내지 1,000,000개일 수 있다. 일 실시형태에서, 각각의 하위세트 중에 존재하는 핵의 수는 대략 동일하다. 핵을 하위 하위 세트 내에 분포시키는 방법은 관련 기술 분야의 통상의 기술자에게 공지되어 있고, 일상적이다. 예는 형광-활성화된 핵 분류(FANS)를 포함하지만, 이들로 제한되지 않는다.
각각의 구획은 트랜스포좀 복합체를 포함한다. 트랜스포좀 복합체는 핵의 하위세트를 구획에 첨가하기 전에, 그 후에 또는 그와 동시에 각각의 구획에 첨가될 수 있다. 트랜스포좀 복합체, 즉, 트랜스포사제 인식 부위에 결합된 트랜스포사제는 때로는 "태그먼트화(tagmentation)"라 지칭되는 과정으로 트랜스포사제 인식 부위를 표적 핵산 내에 삽입할 수 있다. 일부 이러한 삽입 사례에서, 트랜스포사제 인식 부위의 하나의 가닥은 표적 핵산 내에 전달될 수 있다. 이러한 가닥은 "전달된 가닥"이라 지칭된다. 일 실시형태에서, 트랜스포좀 복합체는 2개의 소단위, 및 2개의 비-인접한 트랜스포존 서열을 갖는 이량체 트랜스포사제를 포함한다. 또 다른 실시형태에서, 트랜스포사제는 2개의 소단위, 및 인접한 트랜스포존 서열을 갖는 이량체 트랜스포사제를 포함한다.
일부 실시형태는 활동항진성 Tn5 트랜스포사제 및 Tn5-타입 트랜스포사제 인식 부위(Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998)), 또는 MuA 트랜스포사제 및 R1 및 R2 단부 서열을 포함하는 Mu 트랜스포사제 인식 부위(Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995)의 사용을 포함할 수 있다. Tn5 모자이크 단부(Mosaic End: ME) 서열이 또한 통상의 기술자에 의해서 최적화된 바와 같이 사용될 수 있다.
본 명세서에 제공된 조성물 및 방법의 특정 실시형태와 함께 사용될 수 있는 전위 시스템의 추가 예는 스타필로코쿠스 아우레우스(Staphylococcus aureus) Tn552(Colegio et al., J. Bacteriol., 183: 2384-8, 2001; Kirby C et al., Mol. Microbiol., 43: 173-86, 2002), Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994 및 국제 공개 제WO 95/23875호), 트랜스포존 Tn7(Craig, N L, Science. 271: 1512, 1996; Craig, N L, Review in: Curr Top Microbiol Immunol., 204:27-48, 1996), Tn/O 및 IS10(Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996), 마리너(Mariner) 트랜스포사제(Lampe D J, et al., EMBO J., 15: 5470-9, 1996), Tc1(Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996), P 요소(Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004), Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990), 박테리아 삽입 서열(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996), 레트로바이러스(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989), 및 효모의 레트로트랜스포존(Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989)을 포함한다. 추가 예는 IS5, Tn10, Tn903, IS911, 및 트랜스포사제 패밀리 효소의 조작된 버전을 포함한다(Zhang et al., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16; Wilson C. et al (2007) J. Microbiol. Methods 71:332-5).
본 명세서에 제공된 방법 및 조성물과 함께 사용될 수 있는 인터그라제의 다른 예는 레트로바이러스 인터그라제 및 이러한 레트로바이러스 인터그라제에 대한 인터그라제 인식 서열, 예컨대, HIV-1, HIV-2, SIV, PFV-1, RSV로부터의 인터그라제를 포함한다.
본 명세서에 기술된 방법 및 조성물에서 유용한 트랜스포존 서열은 미국 특허 출원 공개 제2012/0208705호, 미국 특허 출원 공개 제2012/0208724호 및 국제 특허 출원 공개 제WO 2012/061832호에 제공되어 있다. 일부 실시형태에서, 트랜스포존 서열은 제1 트랜스포사제 인식 부위, 제2 트랜스포사제 인식 부위, 및 두 트랜스포사제 인식 부위 사이에 존재하는 인덱스 서열을 포함한다.
본 명세서에서 유용한 일부 트랜스포좀 복합체는 2개의 트랜스포존 서열을 갖는 트랜스포사제를 포함한다. 일부 이러한 실시형태에서, 2개의 트랜스포존 서열은 서로에 연결되지 않고, 다시 말해서, 트랜스포존 서열은 서로와 비-인접하다. 이러한 트랜스포좀의 에는 관련 기술 분야에 공지되어 있다(예를 들어, 미국 특허 출원 공개 제2010/0120098호 참고).
일부 실시형태에서, 트랜스포좀 복합체는 2개의 트랜스포사제 소단위에 결합하여 "루핑된 복합체" 또는 "루핑된 트랜스포좀"을 형성하는 트랜스포존 서열 핵산을 포함한다. 일례에서, 트랜스포좀은 이량체 트랜스포사제 및 트랜스포존 서열을 포함한다. 루핑된 복합체는, 본래 표적 DNA의 정렬된 정보를 유지하고, 표적 DNA을 단편화하지 않으면서 트랜스포존이 표적 DNA 내에 삽입되는 되는 것을 보장할 수 있다. 인식될 바와 같이, 루핑된 구조는 표적 핵산의 물리적 연결성을 유지시키면서 목적하는 핵산 서열, 예컨대, 인덱스를, 표적 핵산 내에 삽입할 수 있다. 일부 실시형태에서, 루핑된 트랜스포좀 복합체의 트랜스포존 서열은 트랜스포존 서열이 단편화되어 2개의 트랜스포존 서열을 포함하는 트랜스포좀 복합체를 생성할 수 있도록 단편화 부위를 포함할 수 있다. 이러한 트랜스포좀 복합체는, 트랜스포존이 삽입되는 이웃하는 표적 DNA 단편이 검정의 후반 단계에서 확실하게 조립될 수 있는 암호 조합을 수용하는 것을 보장하는 데 유용하다.
트랜스포좀 복합체는 또한, 트랜스포사제 인덱스라고도 지칭되는 적어도 하나의 인덱스 서열을 포함한다. 인덱스 서열은 트랜스포존 서열의 부분으로서 존재한다. 일 실시형태에서, 인덱스 서열은 표적 핵산에 전달되는 트랜스포사제 인식 부위의 가닥인, 전달된 가닥 상에 존재할 수 있다. 태그 또는 바코드라고도 지칭되는 인덱스 서열은 특정 표적 핵산이 존재하였던 구획의 마커 특징으로서 사용된다. 트랜스포좀 복합체의 인덱스 서열은 각각의 구획에 대해서 상이하다. 따라서, 이러한 실시형태에서, 인덱스는 특정 구획 내에 존재하는 표적 핵산 각각에 부착된 핵산 서열 태그이고, 이의 존재는 핵의 집단이 이러한 방법 단계에서 존재하였던 구획을 나타내거나 이를 식별하기 위해서 사용된다.
인덱스 서열은 최대 20개 뉴클레오타이드 길이, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개일 수 있다. 4개의 뉴클레오타이드 태그가 동일한 어레이 상에서 256개의 샘플을 멀티플렉싱하는 가능성을 제공하고, 6개 염기 태그는 동일한 어레이 상에서 4096개의 샘플을 처리하는 것을 가능하게 한다.
일 실시형태에서, 전달된 가닥은 또한 범용 서열을 포함할 수 있다. 범용 서열이 본 명세서에 기술된다. 따라서, 일부 실시형태에서 전달된 가닥이 표적 핵산에 전달되는 경우, 표적 핵산은 트랜스포사제 인덱스, 범용 서열, 또는 이의 조합물을 포함한다.
방법은 또한 인덱싱된 핵을 생성시키는 단계(도 1, 블록 15; 도 34 블록 17)를 포함한다. 일 실시형태에서, 인덱싱된 핵을 생성시키는 단계는 뉴클레오솜-고갈된 핵의 하위세트 중에 존재하는 핵산(예를 들어, 각각의 구획 내의 핵산)을 복수의 핵산 단편으로 단편화시키는 단계를 포함한다. 핵산이 단편화된 후, 트랜스포사제는 핵산 단편에 부착된 채로 유지되어, 동일한 게놈 DNA 분자로부터 유래된 핵산 단편은 물리적으로 연결된 채로 유지된다(Adey et al., 2014, Genome Res., 24:2041-2049).
일 실시형태에서, 핵산을 단편화시키는 단계는 핵산 중에 존재하는 단편화 부위를 사용함으로써 달성된다. 전형적으로, 단편화 부위는 트랜스포좀 복합체를 사용함으로써 표적 핵산 내에 도입된다. 예를 들어, 루핑된 트랜스포좀 복합체는 단편화 부위를 포함할 수 있다. 단편화 부위를 사용하여 표적 핵산 내에 삽입된 인덱스 서열들 사이에서 물리적(정보적 아님) 회합을 절단할 수 있다. 절단은 생화학, 화학 또는 다른 수단에 의해서 이루어질 수 있다. 일부 실시형태에서, 단편화 부위는 다양한 수단에 의해서 단편화될 수 있는 뉴클레오타이드 또는 뉴클레오타이드 서열을 포함할 수 있다. 단편화 부위의 예는 제한 엔도뉴클레아제 부위, RNAse를 사용하여 절단 가능한 적어도 하나의 리보뉴클레오타이드, 특정 화학 작용제의 존재 하에서 절단 가능한 뉴클레오타이드 유사체, 퍼아이오데이트로의 처리에 의해서 절단 가능한 다이올 링키지, 화학 환원제를 사용하여 절단 가능한 다이설파이드기, 광화학 절단에 적용될 수 있는 절단 가능한 모이어티, 및 펩티다제 효소 또는 다른 적합한 수단에 의해서 절단 가능한 펩타이드를 포함하지만, 이들로 제한되지 않는다(예를 들어, 미국 특허 출원 공개 제2012/0208705호, 미국 특허 출원 공개 제2012/0208724호 및 국제 특허 제WO 2012/061832호 참고). 단편화의 결과는 인덱싱된 핵의 집단이고, 여기서 각각의 핵은 인덱싱된 핵산 단편을 함유한다. 인덱싱된 핵산 단편은 전형적으로 적어도 하나의 가닥 상에 특정 구획을 대표하는 인덱스 서열을 포함할 수 있고, 전형적으로는 포함한다. 인덱싱된 핵산 단편의 예를 도 2에 나타낸다. 인덱싱된 핵산 단편(20)의 단일 가닥은 트랜스포좀 복합체의 전달된 가닥으로부터 유래한 뉴클레오타이드(21) 및 (22)를 포함하고, 이것은 증폭 및/또는 서열결정을 위해서 사용될 수 있는 트랜스포사제 인덱스 및 범용 서열을 포함한다. 인덱싱된 핵산 단편은 또한 핵(23)의 게놈 DNA로부터 유래한 뉴클레오타이드를 포함한다.
다수의 구획으로부터의 인덱싱된 핵은 조합될 수 있다(도 1, 블록 16; 도 34 블록 18). 예를 들어, 2 내지 96개의 구획(96-웰 플레이트가 사용되는 경우)으로부터, 또는 2 내지 384개의 구획(384-웰 플레이트가 사용되는 경우)으로부터의 인덱싱된 핵이 조합된다. 이어서, 본 명세서에서 풀링된 인덱싱된 핵이라 지칭되는 조합된 인덱싱된 핵의 하위세트는 제2 복수의 구획 내에 분포된다. 하위세트 및 따라서 각각의 구획 중에 존재하는 핵의 수는 부분적으로 인덱스 충돌을 감소시키려는 목적을 기반으로 하고, 이것은 상기 방법의 이러한 단계에서 동일한 구획에 존재하게 되는 동일한 트랜스포사제 인덱스를 갖는 2개의 핵의 존재이다. 이러한 실시형태에서 하위세트에 존재하는 핵의 수는 2 내지 30개, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개일 수 있다. 일 실시형태에서, 하위세트에 존재하는 핵의 수는 20 내지 24개, 예컨대, 22개이다. 일 실시형태에서, 각각의 하위세트 중에 존재하는 핵의 수는 대략 동일하다. 일 실시형태에서, 각각의 하위세트에 존재하는 핵의 수는 뉴클레오솜-고갈된 핵의 하위세트의 핵보다 적어도 10배 더 적다(도 1, 블록 14; 도 34 블록 16). 일 실시형태에서, 각각의 하위세트에 존재하는 핵의 수는 뉴클레오솜-고갈된 핵의 하위세트의 핵보다 적어도 100배 더 적다(도 1, 블록 14; 도 34 블록 16). 핵을 하위 하위 세트 내에 분포시키는 방법은 관련 기술 분야의 통상의 기술자에게 공지되어 있고, 일상적이다. 예는 형광-활성화된 핵 분류(FANS)을 포함하지만, 이들로 제한되지 않는다.
핵을 하위세트 내로 분포시키는 단계 이후에 각각의 구획 내의 상기 인덱싱된 핵산 단편 내에 제2 인덱스 서열을 혼입시켜 이중-인덱스 단편을 생성시키는 단계로서, 각각의 구획 내의 제2 인덱스 서열은 다른 구획 내의 제2 인덱스 서열과 상이한, 이중-인덱스 단편을 생성시키는 단계가 이어진다. 이는 고정 및 서열결정 이전에 인덱싱된 핵산 단편의 추가 인덱싱을 초래한다(도 1, 블록 17; 도 34 블록 20). 이러한 실시형태에서 세포가 가교결합제에 의해서 가교결합되는 경우, 인덱싱된 핵산 단편에 부착된 트랜스포사제가 인덱싱된 핵산 단편으로부터 해리된다. 일 실시형태에서, 부착된 트랜스포사제는 가교결합이 반전(도 34, 블록 19)되기 전에 해리된다. 세정제를 사용하여 트랜스포사제를 해리시킬 수 있고, 일 실시형태에서 세정제는 소듐 도데실 설페이트(SDS)이다.
일 실시형태에서, 혼입은 전형적으로 지수적 증폭 반응, 예컨대, PCR에 의해서 수행된다. 인덱싱된 핵산 단편의 단편에 존재하는 범용 서열이 프라이머로서 작용하고, 증폭 반응에서 연장될 수 있는 범용 앵커 서열의 결합을 위해서 사용될 수 있다. 전형적으로, 2종의 상이한 범용 프라이머가 사용된다. 하나의 프라이머가 인덱싱된 핵산 단편의 하나의 가닥의 3' 단부에서 범용 서열과 혼성화하고, 제2 프라이머가 인덱싱된 핵산 단편의 다른 가닥의 3' 단부에서 범용 서열과 혼성화한다. 따라서, 각각의 프라이머의 앵커 서열은 상이할 수 있다. 적합한 프라이머는 각각 추가적인 범용 서열, 예컨대, 범용 포획 서열, 및 또 다른 인덱스 서열을 포함할 수 있다. 각각의 프라이머가 인덱스를 포함할 수 있기 때문에, 이 단계는 1개 또는 2개의 인덱스 서열, 예를 들어, 제2 및 임의적인 제3 인덱스의 첨가를 초래한다. 제2 및 임의적인 제3 인덱스를 갖는 인덱싱된 핵산 단편은 이중-인덱스 단편이라 지칭된다. 제2 및 제3 인덱스는 서로의 역 보체일 수 있거나, 또는 제2 및 제3 인덱스는 서로의 역 보체가 아닌 서열을 가질 수 있다. 이러한 제2 인덱스 서열 및 임의적인 제3 인덱스는 분포된 인덱싱된 핵이 배치된 각각의 구획에 대해서 고유하다(도 1, 블록 16; 도 34 블록 18).
일 실시형태에서, 제2 인덱스 서열의 혼입은 각각의 구획 내의 인덱싱된 핵산 단편을 제1 범용 프라이머 및 제2 범용 프라이머와 접촉시키는 단계를 포함한다. 제1 범용 프라이머는 제1 범용 서열의 일부와 동일한 서열을 포함하고, 제2 범용 프라이머는 제1 범용 서열의 일부에 상보성인 서열을 포함한다. 각각의 프라이머는 인덱스 서열을 포함한다. 일 실시형태에서, 제1 범용 프라이머의 인덱스 서열은 제2 범용 프라이머의 인덱스 서열의 역 보체이다. 또 다른 실시형태에서, 제1 범용 프라이머의 인덱스 서열은 제2 범용 프라이머의 인덱스 서열의 역 보체와 상이하다.
일 실시형태에서, 제1 범용 프라이머는 또한 이중-인덱스 단편의 3' 단부에서 범용 서열에 상보성인 제1 앵커 서열 및 제1 포획 서열을 포함한다. 일 실시형태에서, 제1 포획 서열은 P5 프라이머 서열을 포함한다. 일 실시형태에서, 제2 범용 프라이머는 또한 이중-인덱스 단편의 5' 단부에서 범용 서열에 상보성인 제2 앵커 서열 및 제2 포획 서열을 포함한다. 일 실시형태에서, 제2 포획 서열은 P7 프라이머 서열의 역 보체를 포함한다.
또 다른 실시형태에서, 혼입은 인덱싱된 핵산 단편을 단편의 양 단부에 추가적인 서열의 결찰을 초래하는 조건에 적용하는 단계를 포함한다. 일 실시형태에서, 블런트-엔디드(blunt-ended) 결찰이 사용될 수 있다. 또 다른 실시형태에서, 단편은 특정 유형의 DNA 중합효소의 특정 유형, 예컨대, Taq 중합효소 또는 클레노브 엑소 마이너스(Klenow exo minus)(이것은 단일 데옥시뉴클레오타이드, 예를 들어, 데옥시아데노신(A)를 인덱싱된 핵산 단편의 3' 단부에 부가하는 비-주형-의존성 말단 트랜스퍼라제 활성을 가짐)에 의해서 단일 오버행잉 뉴클레오타이드를 사용하여 제조된다. 이러한 효소를 사용하여 단편의 각각의 가닥의 블런트 단부화된 3' 말단에 단일 뉴클레오타이드 'A'를 부가할 수 있다. 따라서, 'A'는 Taq 또는 클레노브 엑소 마이너스 중합효소를 사용한 반응에 의해서 이중-가닥 표적 단편의 각각의 가닥의 3' 말단에 부가될 수 있는 반면, 단편의 각각의 단부에 부가될 추가적인 서열은 부가될 이중 가닥 핵산의 각각의 영역의 3' 말단 상에 존재하는 상용성 'T' 오버행을 포함할 수 있다. 이러한 단부 변형은 또한 핵산의 자가 결찰을 예방하여 이러한 실시형태에서 부가되는 서열에 의해서 플랭킹된 인덱싱된 핵산 단편의 형성으로의 편향이 존재한다.
본 명세서에 기술된 방법에 의한 핵산 분자의 단편화는 블런트 및 3'- 및 5'-오버행잉 단부의 불균질 믹스를 갖는 단편을 초래할 수 있다. 일부 실시형태에서, 따라서 관련 기술 분야 공지된 방법 및 키트(예컨대, 루시젠(Lucigen) DNA 종결자 단부 수선 키트(terminator End Repair Kit))를 사용하여 단편 단부를 수선하여 예를 들어, 클로닝 벡터의 블런트 부위 내로의 삽입에 최적화된 단부를 생성시키는 것이 바람직할 수 있다. 특정 실시형태에서, 핵산의 집단의 단편 단부는 블런팅 단부화된다. 더 특별하게는, 단편 단부는 블런트 단부화되고, 포스포릴화된다. 포스페이트 모이어티는 예를 들어, 폴리뉴클레오타이드 카이나제를 사용한 효소 처리를 통해서 도입될 수 있다.
일 실시형태에서, 인덱싱된 핵산 단편은 먼저 동일한 범용 어댑터(또한 '미스매칭된 어댑터라고 지칭됨,' 이의 일반적인 특징은 곰레이(Gormley) 등의 특허 제US 7,741,463호, 및 빅넬(Bignell) 등의 특허 제US 8,053,192호에 기술되어 있음)를 인덱싱된 핵산 단편의 5' 단부 및 3' 단부에 결찰시킴으로써 처리되어 이중-인덱스 단편을 형성한다. 일 실시형태에서, 범용 어댑터는 1개 또는 2개의 인덱스 서열 및 어레이 상에 이중-인덱스 단편을 고정시키기 위한 서열을 비롯하여, 서열결정에 필수적인 모든 서열을 포함한다. 서열결정될 핵산이 단일 세포로부터 유래하기 때문에, 이중-인덱스 단편의 추가 증폭은 서열결정을 위한 이중-인덱스 단편의 충분한 수를 달성하는 데 도움이 된다.
일 실시형태에서, 제2 인덱스 서열의 혼입은 범용 어댑터를 각각의 구획 내의 인덱싱된 핵산 단편에 결찰시키는 단계를 포함한다. 범용 어댑터는 2개의 핵산 가닥을 포함하며, 여기서 각각의 가닥은 제2 인덱스 서열을 포함한다. 일 실시형태에서, 범용 어댑터의 하나의 가닥의 제2 인덱스 서열은 범용 어댑터의 제2 가닥의 제2 인덱스 서열의 역 보체이다. 다른 실시형태에서, 범용 어댑터의 하나의 가닥의 제2 인덱스 서열은 범용 어댑터의 제2 가닥의 제2 인덱스 서열의 역 보체와 상이하다.
일 실시형태에서, 범용 어댑터는 또한 제1 포획 서열 및 제1 앵커 서열을 포함한다. 일 실시형태에서, 제1 포획 서열은 P5 프라이머 서열을 포함한다. 일 실시형태에서, 범용 어댑터는 또한 제2 포획 서열 및 제2 앵커 서열을 포함한다. 일 실시형태에서, 제2 포획 서열은 P7 프라이머 서열의 역 보체를 포함한다.
또 다른 실시형태에서, 인덱싱된 핵산 단편에 결찰된 범용 어댑터가 서열결정에 필요한 모든 서열을 포함하지 않는 경우, 지수적 증폭 단계, 예컨대, PCR을 사용하여 고정 및 서열결정 이전에 각각의 인덱싱된 핵산 단편에 존재하는 범용 어댑터를 추가로 변형시킬 수 있다. 예를 들어, 인덱싱된 핵산 단편에 존재하는 범용 서열에 상보성인 범용 앵커 서열을 사용하여 초기 프라이머 연장 반응이 수행되며, 여기서 각각의 개별 인덱싱된 핵산 단편의 두 가닥에 상보성인 연장 산물이 형성된다. 전혀적으로 PCR은 각각 추가적인 범용 서열, 예컨대, 범용 포획 서열, 및 또 다른 인덱스 서열을 부가한다. 각각의 프라이머가 인덱스를 포함할 수 있기 때문에, 이 단계는 1개 또는 2개의 인덱스 서열, 예를 들어, 제2 및 임의적인 제3 인덱스의 첨가 및 인덱싱된 핵산 단편의 어댑터 결찰에 의한 인덱싱을 초래한다(도 1, 블록 17; 도 34 블록 20).
범용 어댑터가 부가된 후, 서열결정에 필수적인 모든 서열을 포함하는 범용 어댑터를 결찰시키는 단일 단계 방법 또는 범용 어댑터를 결찰시키고 이어서 지수적으로 증폭시켜 범용 어댑터를 추가로 변형시키는 2-단계 방법 중 어느 하나에 의해서, 최종 이중-인덱스 단편은 범용 포획 서열, 제2 인덱스 서열, 및 임의적인 제3 인덱스 서열을 포함할 것이다. 제2 및 제3 인덱스는 서로의 역 보체일 수 있거나, 또는 제2 및 제3 인덱스는 서로의 역 보체가 아닌 서열을 가질 수 있다. 이러한 제2 및 임의적인 제3 인덱스 서열은 제1 인덱스가 태그먼트화에 의해서 부가된 후 분포된 인덱싱된 핵이 배치된 각각의 구획에 대해서 고유하다(도 1, 블록 17; 도 34 블록 20). 각각의 단부에 범용 어댑터를 첨가한 결과는 도 3에 도시된 이중-인덱스 단편(30)과 유사하거나 동일한 구조를 갖는 이중-인덱스 단편의 복수 또는 라이브러리이다. 이중-인덱스 단편(30)의 단일 가닥은 각각 3' 플로우셀 어댑터(예를 들어, P5) 및 5' 플로우셀 어댑터(예를 들어, P7')라고도 지칭되는 포획 서열(31 및 38) 및 인덱스(32 및 37), 예컨대, i5 및 i7을 포함한다. 이중-인덱스 단편(30)은 트랜스포좀 복합체(33)의 전달된 가닥으로부터 유래한 뉴클레오타이드(21) 및 (22)를 포함하고, 이것은 증폭 및/또는 서열결정을 위해서 사용될 수 있는 트랜스포사제 인덱스(34) 및 범용 서열(35)을 포함한다. 이중-인덱스 단편은 또한 핵(36)의 게놈 DNA로부터 유래한 뉴클레오타이드를 포함한다.
생성된 이중-인덱스 단편은 고정되고, 이어서 서열결정될 수 있는 핵산의 라이브러리를 집합적으로 제공한다. 본 명세서에서 서열결정 라이브러리라고도 지칭되는 용어 라이브러리는 이의 3' 및 5' 단부에서 공지된 범용 서열을 함유하는 단일 세포로부터의 핵산 단편의 집합체를 지칭한다. 라이브러리는 단리된 핵 중 하나 이상으로부터의 전체 게놈 핵산을 포함한다.
이중-인덱스 단편은 미리 결정된 크기 범위, 예컨대, 150 내지 400개의 뉴클레오타이드 길이, 예컨대, 150 내지 300개의 뉴클레오타이드를 위해서 선택된 조건에 적용될 수 있다. 생성된 이중-인덱스 단편은 풀링되고, 임의로 세정 과정에 적용되어 혼입되지 않은 범용 어댑터 또는 프라이머의 적어도 일부를 제거함으로써 DNA 분자에 대한 순도를 향상시킬 수 있다. 임의의 적합한 세정 과정, 예컨대, 전기영동, 크기 배제 크로마토그래피 등이 사용될 수 있다. 일부 실시형태에서, 고체 상 가역 고정화 상자성 비드를 사용하여 비부착된 범용 어댑터 또는 프라이머로부터 목적하는 DNA 분자를 분리하거나 크기를 기반으로 핵산을 선택할 수 있다. 고체 상 가역 고정화 상자성 비드는 베크만 콜터(Beckman Coulter)(아젠코트(Agencourt) AMPure XP), 써모피셔(Thermofisher)(매그젯(MagJet)), 오메가 바이오테크(매그-바인드(Mag-Bind)), 프로메가 비즈(Promega Beads)(프로메가(Promega)), 및 카파 바이오시스템즈(Kapa Biosystems)(카파 퓨어 비즈(Kapa Pure Beads))로부터 상업적으로 입수 가능하다.
복수의 이중-인덱싱된 단편이 서열결정을 위해서 제조될 수 있다. 이중-인덱싱된 단편이 풀링된 후, 이것은 전형적으로 서열결정 이전에 고정화 및/또는 증폭에 의해서 풍부해진다(도 1, 블록 18; 도 34 블록 21). 1종 이상의 공급원으로부터의 이중-인덱싱된 단편을 기질에 부착하는 방법은 관련 기술 분야에 공지되어 있다. 일 실시형태에서, 이중-인덱스 단편은 이중-인덱스 단편에 대해서 특이성을 갖는 복수의 포획 올리고뉴클레오타이드를 사용하여 풍부해지고, 포획 올리고뉴클레오타이드는 고체 기질의 표면 상에 고정될 수 있다. 예를 들어, 포획 올리고뉴클레오타이드는 범용 결합쌍의 제1 구성원을 포함할 수 있고, 여기서 결합쌍의 제2 구성원은 고체 기질의 표면 상에 고정되어 있다. 마찬가지로, 고정된 이중-인덱싱된 단편을 증폭시키는 방법은 브릿지 증폭 및 운동역학적 배제(운동역학적 배제)를 포함하지만, 이들로 제한되지 않는다. 서열결정 이전에 고정화 및 증폭시키는 방법은 예를 들어, 빅넬(Bignell) 등(US 8,053,192), 군더슨(Gunderson) 등(WO2016/130704), 쉔 등(Shen)(US 8,895,249), 및 피펜버그(Pipenburg) 등(US 9,309,502)에 기술되어 있다.
풀링된 샘플은 서열결정을 위해서 제제 중에서 고정될 수 있다. 서열결정은 단일 분자의 어레이로서 수행될 수 있거나, 또는 서열결정 이전에 증폭될 수 있다. 증폭은 1종 이상의 고정된 프라이머를 사용하여 수행될 수 있다. 고정된 프라이머(들)는 예를 들어, 편평한 표면 또는 비드의 풀 상의 론(lawn)일 수 있다. 비드의 풀은 에멀션의 각각의 "구획" 중에서 단일 비드를 갖는 에멀션 중에서 단리될 수 있다. "구획"당 단지 하나의 주형의 농도에서, 단일 주형 만이 각각의 비드 상에서 증폭된다.
용어 "고체 상 증폭"은 본 명세서에서 사용되는 바와 같이 고체 지지체 상에서 수행되거나 이것과 함께 수행되어 증폭된 산물의 전부 또는 일부가 이들이 형성될 때 고체 지지체 상에 고정되는 임의의 핵산 증폭 반응을 지칭한다. 특히, 이 용어는 고체 상 중합효소 연쇄 반응(고체 상 PCR) 및 고체 상 등온 증폭을 포함하는데, 이것은 포워드 및 리버스 증폭 프라이머 중 하나 또는 둘 모두가 고체 지지체 상에 고정된 것을 제외하고는 표준 용액 상 증폭과 유사한 반응이다. 고체 상 PCR은 시스템, 예컨대, 에멀션(여기서 하나의 프라이머가 비드에 앵커링되고, 나머지는 자유 용액 중에 존재함) 및 고체 상 젤 매트릭스 중의 집락 형성(여기서 하나의 프라이머가 표면에 앵커링되고, 나머지는 자유 용액 중에 존재함)을 포함한다.
일부 실시형태에서, 고체 지지체는 패턴화된 표면을 포함한다. "패턴화된 표면"은 고체 지지체의 노출된 층 내의 또는 그 상의 상이한 영역의 배열을 지칭한다. 예를 들어, 영역 중 하나 이상은 1종 이상의 증폭 프라이머가 존재하는 특징부일 수 있다. 그 특징부는 증폭 프라이머가 존재하지 않는 사이(interstitial) 영역에 의해서 분리될 수 있다. 일부 실시형태에서, 패턴은 행 및 열로 존재하는 특징부의 x-y 포맷일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 사이 영역의 반복되는 배열일 수 있다. 일부 실시형태에서, 패턴은 특징부 및/또는 사이 영역의 무작위 배열일 수 있다. 본 명세서에 언급된 방법 및 조성물에서 사용될 수 있는 예시적인 패턴화된 표면은 미국 특허 제8,778,848호, 제8,778,849호 및 제9,079,148호, 및 미국 특허 공개 제2014/0243224호에 기술되어 있다.
일부 실시형태에서, 고체 지지체는 표면 내의 웰 또는 함몰부의 어레이를 포함한다. 이것은 일반적으로 관련 기술 분야에서 공지된 바와 같이 다양한 기술, 예컨대, 비제한적으로 포토리소그래피, 스탬핑 기술, 성형 기술 및 마이크로에칭 기술을 사용하여 제조될 수 있다. 관련 기술 분야의 기술자에 의해서 인식될 바와 같이, 사용되는 기술은 어레이 기질의 조성 및 셩상에 좌우될 것이다.
패턴화된 표면의 특징부는 유리, 규소, 플라스틱 또는 패턴화된 공유결합된 젤, 예컨대, 폴리(N-(5-아지도아세트아마이딜펜틸)아크릴아마이드-코-아크릴아마이드)(PAZAM, 예를 들어, 미국 특허 공개 제2013/184796호, 특허 제WO 2016/066586호, 및 제WO 2015/002813호 참고)을 갖는 다른 적합한 고체 지지체 상의 웰의 어레이의 웰(예를 들어, 마이크로웰 또는 나노웰)일 수 있다. 이 과정은 다회의 사이클을 사용한 서열결정 실시 전체에서 안정적일 수 있는 서열결정을 위해서 사용되는 젤 패드를 생성한다. 웰에 대한 중합체의 공유결합이 다양한 용도 동안 구조화된 기질의 수명 전체에서 구조화된 특징부 내에서 젤을 유지시키는 데 도움이 된다. 그러나, 다수의 실시형태에서 젤은 웰에 공유 결합될 필요는 없다. 예를 들어, 일부 조건에서 구조화된 기질의 어느 부분에도 공유 부착되지 않은 식염수 무함유 아크릴아마이드(SFA, 예를 들어, 미국 특허 제8,563,477호 참고)가 젤 물질로서 사용될 수 있다.
특정 실시형태에서, 구조화된 기질은 고체 지지 물질을 웰(예를 들어, 마이크로웰 또는 나노웰)로 패턴화시키고, 패턴화된 지지체를 젤 물질(예를 들어, PAZAM, SFA 또는 이들의 화학적으로 변형된 변이체, 예컨대, SFA의 아지도 분해된(azidolyzed) 변이체(아지도-SFA))로 코팅하고, 예를 들어, 화학적 또는 기계적 폴리싱을 통해서, 젤 코팅된 지지체를 폴리싱하여 웰 내에 겔을 보유시키지만 웰들 사이의 구조화된 기질의 표면 상의 사이 영역로부터는 겔의 실질적인 전부를 제거하거나 불활성화시킴으로써 제조될 수 있다. 프라이머 핵산이 젤 물질에 부착될 수 있다. 이어서 이중-인덱스 단편의 용액이 폴리싱된 기질과 접촉되어 개별 이중-인덱스 단편이 젤 물질에 부착된 프라이머와의 상호작용을 통해서 개별 웰에 시딩될 것이지만; 표적 핵산은 젤 물질의 부재 또는 불활성으로 인해서 사이 영역을 점유하지 않을 것이다. 이중-인덱스 단편의 증폭은 웰로 한정될 것인데, 그 이유는 사이 영역 내의 젤의 부재 또는 불활성이 성장하는 핵산 집락의 외향 이동을 예방하기 때문이다. 이러한 과정은 통상적으로 제조 가능하고, 확대 가능하고, 종래의 마이크로- 또는 나노제작 방법을 이용할 수 있다.
본 개시내용은 단지 하나의 증폭 프라이머가 고정된(다른 프라이머는 통상적으로 자유 용액 중에 존재함) "고체 상" 증폭 방법을 포함하기 때문에, 일 실시형태에서 포워드 및 리버스 프라이머가 둘 모두가 고정되는 고체 지지체가 제공되는 것이 바람직하다. 실제로, 고체 지지체 상에 고정된 `복수`의 동일한 포워드 프라이머 및/또는 `복수`의 동일한 리버스 프라이머가 존재할 것인데, 그 이유는 증폭 과정이 증폭을 유지시키기 위해서 과량의 프라이머를 필요로 하기 때문이다. 본 명세서에서 포워드 및 리버스 프라이머에 대한 언급은 따라서 그 문맥이 달리 제시하지 않는 한 `복수`의 이러한 프라이머를 포함하는 것으로 해석되어야 한다.
통상의 기술자에게 인식될 바와 같이, 임의의 주어진 증폭 반응은 증폭될 주형에 대해서 특이적인 적어도 하나의 유형의 포워드 프라이머 및 적어도 하나의 유형의 리버스 프라이머가 필요하다. 그러나, 특정 실시형태에서 포워드 프라이머 및 리버스 프라이머는 동일한 서열의 주형-특이적 부분을 포함할 수 있고, 완전히 동일한 뉴클레오타이드 서열 및 구조(임의의 비-뉴클레오타이드 변형을 포함함)를 가질 수 있다. 다시 말해서, 단지 하나의 유형의 프라이머를 사용하여 고체 상 증폭을 수행하는 것이 가능하고, 이러한 단일-프라이머 방법은 본 개시내용의 범주 내에 포함된다. 다른 실시형태는 포워드 프라이머 및 리버스 프라이머를 사용할 수 있는데, 이것은 동일한 주형-특이적 서열을 함유하지만, 일부 다른 구조 특징부가 상이하다. 예를 들어, 하나의 유형의 프라이머는 다른 것에 존재하지 않는 비-뉴클레오타이드 변형을 함유할 수 있다.
본 개시내용의 모든 실시형태에서, 고체 상 증폭을 위한 프라이머는 바람직하게는 단일 지점 공유 부착에 의해서 프라이머의 5' 단부에서 또는 그 근처에서 고체 지지체에 고정되어, 이의 동족 주형에 어닐링시키기에 자유로운 프라이머의 주형-특이적 부분 및 프라이머 연장을 위해서 자유로운 3' 하이드록실기가 남는다. 관련 기술 분야에 공지된 임의의 적합한 공유 부착 수단이 이러한 목적을 위해서 사용될 수 있다. 선택된 부착 화학은 고체 지지체의 본성, 및 이것에 적용되는 임의의 유도체와 또는 작용화에 좌우될 것이다. 프라이머 자체가 비-뉴클레오타이드 화학 변형일 수 있는 모이어티를 포함하여 부착을 용이하게 할 수 있다. 특정 실시형태에서, 프라이머는 5' 단부에서 황-함유 친핵체, 예컨대, 포스포로티오에이트 또는 티오포스페이트를 포함할 수 있다. 고체-지지된 폴리아크릴아마이드 하이드로젤의 경우에, 이러한 친핵체는 하이드로젤에 존재하는 브로모아세트아마이드기에 결합할 것이다. 프라이머 및 주형을 고체 지지체에 접착시키는 더 특별한 수단은 국제 특허 제WO 05/065814호에 기술된 바와 같은, 중합된 아크릴아마이드 및 N-(5-브로모아세트아마이딜펜틸) 아크릴아마이드(BRAPA)로 구성된 하이드로젤에 대한 5' 포스포로티오에이트 부착을 통해서 이다.
본 개시내용의 특정 실시형태는 예를 들어, 생물분자, 예컨대, 폴리뉴클레오타이드에 대한 공유 부착이 가능한 반응성 기를 포함하는 중간체 물질의 층 또는 코팅을 적용함으로써 "작용되"된 불활성 기질 또는 매트릭스(예를 들어, 유리 슬라이드, 중합체 비드 등)를 포함하는 고체 지지체를 사용할 수 있다. 이러한 지지체의 예는 불활성 기질, 예컨대, 유리 상에 지지된 폴리아크릴아마이드 하이드로젤을 포함하지만, 이들로 제한되지 않는다. 이러한 실시형태에서, 생물분자(예를 들어, 폴리뉴클레오타이드)가 중간제 물질(예를 들어, 하이드로젤)에 직접 공유 부착될 수 있지만, 중간체 물질 자체는 기질 또는 매트릭스(예를 들어, 유리 기질)에 비-공유 부착될 수 있다. 용어 "고체 지지체에 대한 공유 부착"은 따라서 이러한 유형의 배열을 포함하는 것으로 이해되어야 한다.
풀링된 샘플은 비드 상에서 증폭될 수 있고, 여기서 각각의 비드는 포워드 증폭 프라이머 및 리버스 증폭 프라이머를 함유한다. 특정 실시형태에서, 이중-인덱스 단편의 라이브러리를 사용하여, 고체 상 증폭 및 보다 특별하게는 고체 상 등온 증폭에 의해서 미국 특허 공개 제2005/0100900호, 미국 특허 제7,115,400호, 특허 제WO 00/18957호 및 제WO 98/44151호에 기술된 것과 유사한, 핵산 집락의 클러스터링된 어레이를 제조한다. 용어 '클러스터' 및 '집락'은 복수의 동일한 고정된 핵산 가닥 및 복수의 동일한 고정된 상보성 핵산 가닥을 포함하는 고체 지지체 상의 별개의 부위를 지칭하도록 본 명세서에서 상호 교환 가능하게 사용된다. 용어 "클러스터링된 어레이"는 이러한 클러스터 또는 집락으로부터 형성된 어레이를 지칭한다. 이와 관련하여, 용어 "어레이"는 클러스터의 정렬된 배열을 필요로 하는 것으로서 이해되어서는 안 된다.
용어 "고체 상" 또는 "표면"은 프라이머가 평탄한 표면, 예를 들어, 유리, 실리카 또는 플라스틱 현미경 슬라이드에 부착된 평면 어레이 또는 유사한 플로우셀 장치 중 어느 하나; 하나 또는 2개의 프라이머가 비드에 부착되고, 비드가 증폭되는 비드; 또는 비드가 증폭된 후 표면 상의 비드의 어레이를 의미하도록 사용된다.
클러스터링된 어레이는 국제 특허 제WO 98/44151호에 기술된 바와 같은 열순환 공정, 또는 온도가 일정하게 유지되고, 연장 및 변성의 사이클이 시약의 변화를 사용하여 수행되는 공정 중 어느 하나를 사용하여 제조될 수 있다. 이러한 등온 증폭 방법은 특허 출원 제WO 02/46456호 및 미국 특허 공개 제2008/0009420호에 기술되어 있다. 등온 공정에서의 더 낮은 온도로 인해서, 이것이 일부 실시형태에서 특별하게 바람직하다.
본 명세서에 기술되거나 관련 기술 분야에 일반적으로 공지된 증폭 방법 중 임의의 것을 범용 또는 표적-특이적 프라이머와 함께 사용하여 고정된 DNA 단편을 증폭시킬 수 있다는 것이 인지될 것이다. 증폭에 적합한 방법은 미국 특허 제8,003,354호에 기술된 바와 같은, 중합효소 연쇄 반응(PCR), 가닥 치환 증폭(strand 치환 amplification: SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)을 포함하지만, 이들로 제한되지 않는다. 상기 증폭 방법을 사용하여 1종 이상의 관심 핵산을 증폭시킬 수 있다. 예를 들어, 멀티플렉스 PCR을 비롯한 PCR, SDA, TMA, NASBA 등을 사용하여 고정된 DNA 단편을 증폭시킬 수 있다. 일부 실시형태에서, 관심 폴리뉴클레오타이드에 특이적으로 안내된 프라이머는 증폭 반응에 포함된다.
폴리뉴클레오타이드의 증폭을 위한 다른 적합한 방법은 올리고뉴클레오타이드 연장 및 결찰, 회전환 증폭(RCA)(Lizardi et al., Nat. Genet. 19:225-232 (1998)) 및 올리고뉴클레오타이드 결찰 검정(OLA)(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호, 및 제 5,573,907호, 특허 제EP 0 320 308 B1호; 제EP 0 336 731 B1호; 제EP 0 439 182 B1호; 제WO 90/01069호; 제WO 89/12696호; 및 제WO 89/09835호 참고) 기술을 포함함할 수 있다. 이러한 증폭 방법은 고정된 DNA 단편을 증폭시키도록 설계될 수 있다. 예를 들어, 일부 실시형태에서, 증폭 방법은 결찰 프로브 증폭 또는 관심 핵산에 특이적으로 안내되는 프라이머를 함유하는 올리고뉴클레오타이드 결찰 검정(OLA) 반응을 포함할 수 있다. 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 안내되는 프라이머를 함유하는 프라이머를 함유하는 프라이머 연장-결찰 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 결찰 프라이머의 비제한적인 예로서, 증폭은 미국 특허 제7,582,420호 및 제7,611,869호에 예시된 바와 같은 골든게이트(GoldenGate) 검정(일루미나, 인크., 미국 캘리포니아주 샌디에고 소재)을 위해서 사용된 프라이머를 포함할 수 있다.
본 개시내용의 방법에서 사용될 수 있는 예시적인 등온 증폭 방법은 예를 들어, 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)]에 예시된 바와 같은 다중 치환 증폭(MDA), 또는 예를 들어, 미국 특허 제6,214,587호에 의해서 예시된 바와 같은 등온 가닥 치환 핵산 증폭을 포함하지만, 이들로 제한되지 않는다. 본 개시내용에서 사용될 수 있는 다른 비-PCR-기반 방법은 예를 들어, 예를 들어, 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호, 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기술된 가닥 치환 증폭(SDA) 또는 예를 들어, 문헌[Lage et al., Genome Res. 13:294-307 (2003)]에 기술된 과분지화 가닥 치환 증폭(hyper-branched strand displacement amplification)을 포함한다. 예를 들어, 게놈 DNA의 무작위 프라이머 증폭을 위해서 가닥-치환 Phi 29 중합효소 또는 Bst DNA 중합효소 큰 단편인, 5'->3' 엑소-와 함께 등온 증폭 방법이 사용될 수 있다. 이러한 중합효소의 사요은 이의 높은 진행도 및 가닥 치환 활성을 이용한다. 높은 진행도는 중합효소가 10 내지 20kb 길이인 단편을 생성시킬 수 있게 한다. 상기에 언급된 바와 같이, 낮은 진행도 및 가닥-치환 활성을 갖는 중합효소, 예컨대, 클레노브 중합효소를 사용하여 등온 조건 하에서 더 작은 단편이 생산될 수 있다. 증폭 반응, 조건 및 성분의 추가적인 설명은 미국 특허 제7,670,810호의 개시내용에 상세하게 언급되어 있다.
본 개시내용에서 유용한 또 다른 폴리뉴클레오타이드 증폭 방법은 예를 들어, 문헌[Grothues et al. Nucleic Acids Res. 21(5):1321-2 (1993)]에 기술된 바와 같은, 불변 5' 영역 그 다음 무작위 3' 영역을 갖는 2-도메인 프라이머의 집단을 사용하는 태깅된 PCR(Tagged PCR)이다. 제1 라운드의 증폭이 수행되어 무작위하게 합성된 3' 영역으로부터 개별 혼성화를 기반으로 하는 열 변성된 DNA 상에서 다수의 개시를 가능하게 한다. 3' 영역의 본성으로 인해서, 개시 부위는 게놈 전체에서 무작위적인 것으로 고려된다. 그 후, 비결합된 프라이머가 제거될 수 있고, 불변 5' 영역에 상보성인 프라이머를 사용하여 추가 복제가 일어날 수 있다.
일부 실시형태에서, 등온 증폭은 배제 증폭(ExAmp)이라고도 지칭된 운동역학적 배제 증폭(KEA)을 사용하여 수행될 수 있다. 본 개시내용의 핵산 라이브러리는 증폭 시약을 반응시켜 부위를 시딩한 개별 표적 핵산으로부터의 앰플리콘의 실질적인 클론성 집단을 각각 포함하는 복수의 증폭 부위를 생성시키는 단계를 포함하는 방법을 사용하여 제조될 수 있다. 일부 실시형태에서, 증폭 반응은 충분한 수의 앰플리콘이 생성되어 각각의 증폭 부위의 용량을 충전시킬 때까지 진행된다. 이러한 방식으로 이미 시딩된 부위를 용량까지 충족시키는 것은 표적 핵산이 그 부위에서 랜딩하고, 증폭하여 그 부위에서 앰플리콘의 클론성 집단을 생성시키는 것을 방지한다. 일부 실시형태에서, 제2 표적 핵산이 그 부위에 도착하기 전에 증폭 부위가 용량을 충전시키지 않더라도 명백한 클론성이 달성될 수 있다. 일부 조건 하에서, 제1 표적 핵산의 증폭은, 충분한 수의 카피가 그 부위로 수송되는 제2 표적 핵산으로부터의 카피의 생산을 효과적으로 초과하거나 압도하도록 제조되는 지점까지 진행될 수 있다. 예를 들어, 직경이 500nm보다 더 작은 원형 특징부 상에서 브릿지 증폭 공정을 사용하는 실시형태에서, 제1 표적 핵산에 대해서 14 사이클의 지수적 증폭 후에, 동일한 부위에서 제2 표적 핵산으로부터의 오염은 일루미나 서열결정 플랫폼 상에서의 합성에 의한 서열결정분석에 악영향을 미치기에 불충한 수의 오염된 앰플리콘을 생성할 것이다.
일부 실시형태에서, 어레이에서 증폭 부위는 완전히 클론성일 수 있지만 그럴 필요는 없다. 그 보다는, 일부 응용을 위해서, 개별 증폭 부위는 제1 이중-인덱싱된 단편으로부터의 앰플리콘이 우세하게 존재할 수 있고, 제2 표적 핵산으로부터의 낮은 수준의 오염된 앰플리콘을 또한 가질 수 있다. 어레이는, 오염 수준이 어레이의 후속 사용에 허용 가능하지 않은 영향을 갖지 않는 한 낮은 수준의 오염된 앰플리콘을 갖는 하나 이상의 증폭 부위를 가질 수 있다. 예를 들어, 어레이를 검출 응용에서 사용하려는 경우, 허용 가능한 수준의 오염은 검출 기술의 신호 대 노이즈 또는 분해능에 영향을 주지 않는 수준일 것이다. 따라서, 명백한 클론성은 일반적으로 본 명세서에 언급된 방법에 의해서 제조된 어레이의 특정 사용 또는 응용에 관련될 것이다. 특정 응용을 위해서 개별 증폭 부위에서 허용 가능할 수 있는 예시적인 수준은 최대 0.1%, 0.5%, 1%, 5%, 10% 또는 25%의 오염된 앰플리콘을 포함하지만, 이들로 제한되지 않는다. 어레이는 이러한 예시적인 수준의 오염된 앰플리콘을 갖는 하나 이상의 증폭 부위를 포함할 수 있다. 예를 들어, 어레이 내의 증폭 부위 중 최대 5%, 10%, 25%, 50%, 75%, 또는 심지어는 100%가 일부 오염된 앰플리콘을 가질 수 있다. 어레이 또는 부위의 다른 집합체에서, 부위 중 적어도 50%, 75%, 80%, 85%, 90%, 95% 또는 99% 또는 그 초과가 클론성이거나 또는 명백하게 클론성일 수 있다.
일부 실시형태에서, 또 다른 사례 또는 과정이 일어나는 것을 효과적으로 배제하기에 충분히 신속한 속도에서 과정이 일어나는 경우 운동역학적 배제가 일어날 수 있다. 예를 들어, 핵산 어레이의 제조를 고려하여, 어레이의 부위가 용액으로부터의 이중-인덱싱된 단편으로 무작위하게 시딩되고, 이중-인덱싱된 단편의 카피가 증폭 과정에서 생성되어 시딩된 부위 각각을 용량까지 충전시킨다. 본 개시내용의 운동역학적 배제 방법에 따라서, 시딩 및 증폭 과정은 증폭 속도가 시딩 속도를 초과하는 조건 하에서 동시에 진행될 수 있다. 이와 같이, 카피가 제1 표적 핵산에 의해서 시딩된 부위에서 제조되는 비교적 신속한 속도는 제2 핵산이 증폭을 위해서 부위를 시딩하는 것을 효과적으로 배제시킬 것이다. 운동역학적 배제 증폭 방법은 미국 출원 공개 제2013/0338042호의 개시내용에서 상세하게 기술된 바와 같이 수행될 수 있다.
운동역학적 배제는 증폭을 개시하기 위해서 비교적 느린 속도(예를 들어, 이중-인덱스 단편의 제1 카피를 제조하는 느린 속도) 대 이중-인덱싱된 단편의(또는 이중-인덱싱된 단편의 제1 카피의) 후속 카피를 제조하기 위해서 비교적 신속한 속도를 이용할 수 있다. 이전 단락의 예에서, 운동역학적 배제는 이중-인덱싱된 단편 시딩의 비교적 느린 속도(예를 들어, 비교적 느린 확산 또는 수송) 대 증폭이 일어나서 부위를 이중-인덱싱된 단편 시드의 카피로 충전시키는 비교적 신속한 속도로 인해서 일어난다. 또 다른 예시적인 실시형태에서, 운동역학적 배제는 부위를 시딩한 이중-인덱싱된 단편의 제1 카피의 형성의 지연(예를 들어, 지연된 또는 느린 활성화) 대 후속 카피가 제조되어 그 부위를 충전시키는 비교적 신속한 속도로 인해서 일어날 수 있다. 이러한 예에서, 개별 부위는 몇몇의 상이한 이중-인덱싱된 단편으로 시딩될 수 있다(예를 들어, 몇몇 이중-인덱싱된 단편이 증폭 이전에 각각의 부위에서 존재할 수 있다). 그러나, 임의의 주어진 이중-인덱싱된 단편을 위한 제1 카피 형성은 무작위로 활성화될 수 있어서 제1 카피 형성의 평균 속도는 후속 카피가 생성되는 속도에 비해서 비교적 느리다. 이러한 경우, 개별 부위가 몇몇 상이한 이중-인덱싱된 단편으로 시딩될 수 있지만, 운동역학적 배제는 이러한 이중-인덱싱된 단편 중 단지 하나가 증폭되게 할 것이다. 보다 구체적으로, 일단 제1 이중-인덱싱된 단편이 증폭을 위해서 활성화되면, 그 부위는 이의 카피로 용량까지 신속하게 충전되어 제2 이중-인덱싱된 단편의 카피가 그 부위에서 제조되는 것을 예방할 것이다.
일 실시형태에서, 이 방법을 수행하여 동시에 (i) 이중-인덱스 단편을 평균 수송 속도로 증폭 부위로 수송하고, (ii) 증폭 부위에 존재하는 상기 이중-인덱스 단편을 평균 증폭 속도로 증폭시키며, 여기서 평균 증폭 속도는 평균 수송 속도를 초과한다(미국 특허 제9,169,513). 따라서, 비교적 느린 수송 속도를 사용함으로써 이러한 실시형태에서 운동역학적 배제가 달성될 수 있다. 예를 들어, 충분히 낮은 농도의 이중-인덱스 단편을 선택하여 목적하는 평균 수송 속도를 달성할 수 있고, 더 낮은 농도가 더 느린 평균 수송 속도를 초래한다. 대안적으로 또는 추가로, 고점도 용액 및/또는 용액 중의 분자 운집 시약(crowding reagent)의 존재를 사용하여 수송 속도를 감소시킬 수 있다. 유용한 분자 운집 시약의 예는 폴리에틸렌 글리콜(PEG), 피콜, 덱스트란, 또는 폴리바이닐 알코올을 포함하지만, 이들로 제한되지 않는다. 예시적인 분자 운집 시약 및 제형은 본 명세서에 참고로 포함된 미국 특허 제7,399,590호에 언급되어 있다. 목적하는 수송 속도를 달성하도록 조정될 수 있는 또 다른 인자는 표적 핵산의 평균 크기이다.
증폭 시약은 앰플리콘 형성을 용이하게 하고, 일부 경우에 앰플리콘 형성의 속도를 증가시키는 추가 성분을 포함할 수 있다. 예는 재조합효소이다. 재조합효소는 반복된 침습/연장을 허용함으로써 앰플리콘 형성을 용이하게 할 수 있다. 보다 구체적으로, 재조합효소는 중합효소에 의한 이중-인덱스 단편의 침습 및 앰플리콘 형성을 위한 주형으로서 이중-인덱싱된 단편을 사용한 중합효소에 의한 프라이머의 연장을 용이하게 할 수 있다. 이러한 과정은, 앰플리콘이 침습/연장의 각각의 라운드로부터 생산되어, 후속 라운드에서 주형으로서 제공되는 연쇄 반응으로서 반복될 수 있다. 이러한 과정은 표준 PCR보다 더 신속하게 일어날 수 있는데, 그 이유는 (예를 들어, 가열 또는 화학적 변성을 통한) 변성 사이클이 필요하지 않기 때문이다. 이와 같이, 재조합효소-촉진된 증폭은 등온적으로 수행될 수 있다. 증폭을 용이하게 하기 위해서 재조합효소-촉진된 증폭 시약 중에 ATP, 또는 다른 뉴클레오타이드(또는 일부 경우에 이의 비-가수분해성 유사체)를 포함시키는 것이 일반적으로 바람직하다. 재조합효소와 단일 가닥 결합(SSB) 단백질의 혼합물이 특히 유용한데, 그 이유는 SSB는 증폭을 추가로 용이하게 할 수 있기 때문이다. 재조합효소-촉진된 증폭의 예시적인 제형은 트위스트디엑스(TwistDx)(영국 캠브릿지 소재)에 의해서 트위스트앰프(TwistAmp)로서 상업적으로 판매되는 것을 포함한다. 재조합효소-촉진된 증폭 시약의 유용한 성분 및 반응 조건은 미국 특허 제US 5,223,414호 및 제US 7,399,590호에 언급되어 있다.
앰플리콘 형성을 용이하게 하고, 일부 경우에 앰플리콘 형성 속도를 증가시키기 위해서 증폭 시약 중에 포함될 수 있는 성분의 또 다른 예는 헬리카제이다. 헬리카제는 앰플리콘 형성의 연쇄 반응을 가능하게 함으로써 앰플리콘 형성을 용이하게 할 수 있다. 이러한 과정은 표준 PCR보다 더 신속하게 일어날 수 있는데, 그 이유는 (예를 들어, 가열 또는 화학적 변성을 통한) 변성 사이클이 필요하지 않기 때문이다. 이와 같이, 헬리카제-촉진된 증폭은 등온적으로 수행될 수 있다. 헬리카제와 단일 가닥 결합(SSB) 단백질의 혼합물이 특히 유용한데, 그 이유는 SSB는 증폭을 추가로 용이하게 할 수 있기 때문이다. 헬리카제-촉진된 증폭의 예시적인 제형은 바이오헬릭스(Biohelix)(미국 매사추세츠주 벨버리 소재)로부터 아이소앰프(IsoAmp) 키트로서 상업적으로 판매되는 것을 포함한다. 추가로, 헬리카제 단백질을 포함하는 유용한 제형의 예는 미국 특허 제US 7,399,590호 및 제US 7,829,284호에 기술되어 있다.
앰플리콘 형성을 용이하게 하고, 일부 경우에 앰플리콘 형성 속도를 증가시키기 위해서 증폭 시약 중에 포함될 수 있는 성분의 추가의 또 다른 예는 원점 결합 단백질이다.
이중-인덱싱된 단편을 표면에 부착한 후에, 고정 및 증폭된 이중-인덱싱된 단편의 서열이 결정된다. 서열결정은 가닥 재합성을 비롯한 고정 및 증폭된 이중-인덱싱된 단편의 서열을 결정하기 위한 임의의 적합한 서열결정 기술 및 방법을 사용하여 수행될 수 있고, 관련 기술 분야에 공지되어 있고, 예를 들어, 빅넬 등(US 8,053,192), 군더슨 등(WO2016/130704), 쉔 등(US 8,895,249), 및 피펜버그 등(US 9,309,502)에 기술되어 있다.
본 명세서에 기술된 방법은 다양한 핵산 서열결정 기술과 함께 사용될 수 있다. 특히 적용 가능한 기술은 핵산이 어레이 내의 고정된 위치에서 부착되어 이의 상대적인 위치가 변화되지 않고, 그 어레이가 반복적으로 영상화되는 것이다. 예를 들어, 하나의 뉴클레오타이드 염기를 서로와 구별하는 데 사용되는 상이한 표지와 일치하는, 상이한 색상 채널에서 영상이 수득되는 실시형태가 특히 적용 가능하다. 일부 실시형태에서, 이중-인덱스 단편의 뉴클레오타이드 서열을 결정하기 위한 과정은 자동화 과정일 수 있다. 바람직한 실시형태는 합성에 의한 서열결정("SBS") 기술을 포함한다.
SBS 기술은 일반적으로 주형 가닥에 대해서 뉴클레오타이드를 반복적으로 첨가함으로써 초기 핵산 가닥을 효소적으로 연장시키는 것을 포함한다. 전통적인 SBS 방법에서, 단일 뉴클레오타이드 단량체가 각각의 전달에서 중합효소의 존재 하에서 표적 뉴클레오타이드에 제공될 수 있다. 그러나, 본 명세서에 기술된 방법에서, 하나 초과의 유형의 뉴클레오타이드 단량체가 전달에서 중합효소의 존재 하에서 표적 핵산에 제공될 수 있다.
일 실시형태에서, 뉴클레오타이드 단량체는 잠금 핵산(LNA) 또는 브릿징된 핵산(BNA)을 포함한다. 뉴클레오타이드 단량체에서 LNA 또는 BNA의 사용은 고정된 이중-인덱스 단편 상에 존재하는 서열결정 프라이머 서열과 뉴클레오타이드 단량체 간의 혼성화 강도를 증가시킨다.
SBS는 종결자 모이어티를 갖는 뉴클레오타이드 단량체 또는 임의의 종결자 모이어티가 결여된 것을 사용할 수 있다. 종결자가 결여된 뉴클레오타이드 단량체를 사용하는 방법은 본 명세서에 추가로 상세하게 언급된 바와 같은, 예를 들어, γ-포스페이트-표지된 뉴클레오타이드를 사용한 서열결정 및 파이로시퀀싱(pyrosequencing)을 포함한다. 종결자가 결여된 뉴클레오타이드 단량체를 사용하는 방법에서, 각각의 사이클에서 추가되는 뉴클레오타이드의 수는 일반적으로 가변적이고, 주형 서열 및 뉴클레오타이드 전달 모드에 좌우된다. 종결자 모이어티를 갖는 뉴클레오타이드 단량체를 사용하는 SBS 기술의 경우, 종결자는 다이데옥시뉴클레오타이드를 사용하는 전통적인 생어(Sanger) 서열결정에 대한 경우에서와 같이 사용되는 서열결정 조건 하에서 효과적으로 비가역적일 수 있거나, 종결자는 솔렉사(Solexa)(현재 일루미나, 인크.)에 의해서 개발된 서열결정 방법에 대한 경우에서와 같이 가역적일 수 있다.
SBS 기술은 표지 모이어티를 갖는 뉴클레오타이드 단량체 또는 표지 모이어티가 결여된 것을 사용할 수 있다. 따라서, 혼입 사례는 표지의 특징, 예컨대, 표지의 형광; 뉴클레오타이드 단량체의 특징, 예컨대, 분자량 또는 전하; 뉴클레오타이드의 혼입의 부산물, 예컨대, 피로포스페이트의 방출 등을 기반으로 검출될 수 있다. 2종 이상의 상이한 뉴클레오타이드가 서열결정 시약 중에 존재하는 실시형태에서, 상이한 뉴클레오타이드는 서로와 구별 가능할 수 있거나, 대안적으로 2종 이상의 상이한 표지는 사용될 검출 기술 하에서 구별 가능하지 않을 수 있다. 예를 들어, 서열결정 시약 중에 존재하는 상이한 뉴클레오타이드는 상이한 표지를 가질 수 있고, 이것은 솔렉사(현재 일루미나, 인크.)에 의해서 개발된 서열결정 방법에 의해서 예시된 바와 같은 적절한 광학 장치를 사용하여 구별될 수 있다.
바람직한 실시형태는 피로시퀀싱 기술을 포함한다. 피로시퀀싱은 특정 뉴클레오타이드가 초기 가닥 내에 혼입될 때 무기 피로포스페이트(PPi)의 방출을 검출한다(Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; 미국 특허 제6,210,891호; 제6,258,568호 및 제6,274,320호). 피로시퀀싱에서, 방출된 PPi는 ATP 설퍼라제에 의해서 아데노신 트라이포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 수준은 루시퍼라제-생산된 광자를 통해서 검출된다. 서열결정될 핵산은 어레이 내의 특징부에 부착될 수 있고, 그 어레이는 영상화되어 어레이의 특징부에서 뉴클레오타이드의 혼입으로 인해서 생성되는 화학발광을 캡처할 수 있다. 영상은 어레이를 특정 뉴클레오타이드 유형(예를 들어, A, T, C 또는 G)으로 처리한 후 얻어질 수 있다. 각각의 뉴클레오타이드 유형의 부가 후에 얻은 영상은 어레이 내의 특징부가 검출되는 것과 관련하여 상이할 것이다. 영상에서의 이러한 차이는 어레이 상의 특징부의 상이한 서열 내용물을 반영한다. 그러나, 각각의 특징부의 상대적인 위치는 영상에서 변화되지 않고 유지될 것이다. 영상은 본 명세서에 언급된 방법을 사용하여 저장, 처리 및 분석될 수 있다. 예를 들어, 각각의 상이한 뉴클레오타이드 유형으로 어레이를 처리한 후 얻어진 영상은 가역적 종결자-기반 서열결정 방법을 위해서 상이한 검출 채널로부터 얻은 영상에 대해서 본 명세서에 예시된 것과 동일한 방식으로 취급될 수 있다.
SBS의 또 다른 예시적인 유형에서, 순환 서열결정은 예를 들어, 국제 특허 제WO 04/018497호 및 미국 특허 제7,057,026호에 기술된 바와 같이 예를 들어, 절단 가능한 또는 광표백 가능한 염료 표지를 함유하는 가역적 종결자 뉴클레오타이드의 단계식 첨가에 의해서 달성된다. 이러한 접근법은 솔렉사(현재 일루미나 인크.)에 의해서 상업화되고 있고, 또한 국제 특허 제WO 91/06678호 및 제WO 07/123,744호에 기술되어 있다. 종결이 반전될 수 있고, 형광 표지가 절단될 수 있는 형광-표지된 종결자의 사용 가능성은 효율적인 순환식 가역 종결(cyclic reversible termination: CRT) 서열결정을 용이하게 한다. 중합효소는 또한 이러한 뉴클레오타이드로부터 효율적으로 혼입 및 연장하도록 공동 조작될 수 있다.
일부 가역적 종결자-기반 서열결정 실시형태에서, 표지는 SBS 반응 조건 하에서 연장을 실질적으로 저해하지 않는다. 그러나, 검출 표지는 예를 들어, 절단 또는 분해에 의해서 제거될 수 있다. 영상은 어레잉된 핵산 특징부 내의 표지의 혼입 이후에 캡처될 수 있다. 특정 실시형태에서, 각각의 사이클은 어레이에 4개의 상이한 뉴클레오타이드 유형을 동시에 전달하는 것을 포함하고, 각각의 뉴클레오타이드 유형은 스펙트럼이 구별되는 표지를 갖는다. 이어서 각각 4개의 상이한 표지 중 하나에 대해서 선택적인 검출 채널을 사용하여 4개의 영상이 얻어질 수 있다. 대안적으로, 상이한 뉴클레오타이드 유형은 순차적으로 첨가될 수 있고, 어레이의 영상은 각각의 첨가 단계 사이에서 얻어질 수 있다. 이러한 실시형태에서, 각각의 영상은 특정 유형의 뉴클레오타이드가 혼입된 핵산 특징부를 나타낼 것이다. 상이한 특징부는 각각의 특징부의 상이한 서열 내용물로 인해서 상이한 영상으로 존재하거나 존재하지 않을 것이다. 그러나, 특징부의 상대적인 배치는 영상에서 변화되지 않고 유지될 것이다. 이러한 가역적 종결자-SBS 방법으로부터 얻은 영상은 본 명세서에 언급된 바와 같이 저장, 처리 및 분석될 수 있다. 영상 캡처 단계 이후에, 표지는 제거될 수 있고, 가역적 종결자 모이어티는 뉴클레오타이드 첨가 및 검출의 후속 사이클을 위해서 제거될 수 있다. 이것이 특정 사이클에서 검출된 후에 그리고 후속 사이클 이전에 표지를 제거하는 것은 사이클 사이에서 배경 신호 및 크로스토크(crosstalk)를 감소시키는 이점을 제공할 수 있다. 유용한 표지 및 제거 방법의 예는 본 명세서에 언급되어 있다.
특정 실시형태에서 뉴클레오타이드 단량체의 일부 또는 전부가 가역적 종결자를 포함할 수 있다. 이러한 실시형태에서, 가역적 종결자/절단 가능한 형광단은 3' 에스터 링키지를 통해서 리보스 모이어티에 연결된 형광단을 포함할 수 있다(Metzker, Genome Res. 15:1767-1776 (2005)). 다른 접근법은 종결자 화학물질을 형광 표지의 절단부로부터 분리하였다(Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005)). 루파렐(Ruparel) 등은 작은 3' 알릴기를 사용하여 연장을 차단한 가역적 종결자의 개발을 기술하였지만, 이것은 팔라듐 촉매로의 짧은 처리에 의해서 쉽게 해제될 수 있다. 형광단은 장파장 UV광에 30초 노출에 의해서 쉽게 절단될 수 있는 광절단 가능한 링커를 통해서 염기에 부착되었다. 따라서, 다이설파이드 환원 또는 광절단 중 어느 하나가 절단 가능한 링커로서 사용될 수 있다. 가역적 종결에 대한 또 다른 접근법은 dNTP 상에 체적이 큰 염료를 배치한 후 일어나는 자연 종결의 사용이다. dNTP 상의 하전된 체적이 큰 염료의 존재는 입체 및/또는 정전기 장애를 통해서 효과적인 종결자로서 작용할 수 있다. 하나의 혼입 사례의 존재는 염료가 제거되지 않는 한 추가 혼입을 예방한다. 염료의 절단은 형광단을 제거하고, 종결을 효과적으로 반전시킨다. 변형된 뉴클레오타이드의 예는 또한 미국 특허 제7,427,673호, 및 제7,057,026호에 기술되어 있다.
본 명세서에 기술된 방법 및 시스템과 함께 사용될 수 있는 추가적인 예시적인 SBS 시스템 및 방법은 미국 특허 공개2007/0166705호, 제2006/0188901호, 제2006/0240439호, 제2006/0281109, 2012/0270305호, 및 제2013/0260372, 미국 특허 제7,057,026호, PCT 공개 제WO 05/065814호, 미국 특허 출원 공개 제2005/0100900호, 및 PCT 공개 제WO 06/064199호, 및 제WO 07/010,251호에 기술되어 있다.
일부 실시형태는 4개 미만의 상이한 표지를 사용하여 4개의 상이한 뉴클레오타이드의 검출을 사용할 수 있다. 예를 들어, SBS는 미국 특허 공개 제2013/0079232호에 포함된 문헌에 기술된 방법 및 시스템을 사용하여 수행될 수 있다. 첫 번째 예로서, 한 쌍의 뉴클레오타이드 유형이 동일한 파장에서 검출될 수 있지만, 그들은 다른 것과 비교하여 그 쌍 중 하나의 구성원에 대한 강도의 차이를 기반으로 또는 그 쌍의 다른 구성원에 대해서 검출된 신호와 비교하여 명백한 신호를 나타나게 하거나 사라지게 하는 그 쌍의 하나의 구성원의 변화(예를 들어, 화학적 변형, 광화학적 변형 또는 물리적 변형을 통해서)를 기반으로 구별될 수 있다. 두 번째 예로서, 4개의 상이한 뉴클레오타이드 유형 중 3개가 특정 조건 하에서 검출될 수 있는 반면, 제4 뉴클레오타이드 유형은 그러한 조건 하에서 검출 가능한 표지가 결여되어 있거나 또는 그러한 조건 하에서 최소한으로 검출된다(예를 들어, 배경 형광 등으로 인한 최소 검출). 핵산 내로의 첫 번째 3개의 뉴클레오타이드 유형의 혼입은 이의 각각의 신호의 존재를 기반으로 결정될 수 있고, 핵산 내로의 제4 뉴클레오타이드 유형의 혼입은 임의의 신호의 부재 또는 최소 검출을 기반으로 결정될 수 있다. 세 번째 예로서, 하나의 뉴클레오타이드 유형은 2개의 상이한 채널에서 검출되는 표지(들)를 포함할 수 있는 반면, 다른 뉴클레오타이드 유형은 채널 중 하나 이하에서 검출된다. 상기에 언급된 3개의 예시적인 구성은 상호 배타적인 것으로 간주되지 않고, 다양한 조합으로 사용될 수 있다. 모든 3개의 예를 조합한 예시적인 실시형태는 제1 채널에서 검출되는 제1 뉴클레오타이드 유형(예를 들어, 제1 여기 파장에 의해서 여기되는 경우 제1 채널에서 검출되는 표지를 갖는 dATP), 제2 채널에서 검출되는 제2 뉴클레오타이드 유형(예를 들어, 제2 여기 파장에 의해서 여기되는 경우 제2 채널에서 검출되는 표지를 갖는 dCTP), 제1 채널 및 제2 채널 둘 모두에서 검출되는 제3 뉴클레오타이드 유형(예를 들어, 제1 여기 파장 및/또는 제2 여기 파장에 의해서 여기되는 경우 두 채널 모두에서 검출되는 적어도 하나의 표지를 갖는 dTTP) 및 어느 하나의 채널에서도 검출되지 않거나 최소한으로 검출되는 표지가 결여된 제4 뉴클레오타이드 유형(예를 들어, 표지를 갖지 않는 dGTP)을 사용하는 형광-기반 SBS 방법이다.
추가로, 미국 특허 공개 제2013/0079232호에 포함된 문헌에 기술된 바와 같이, 서열결정 데이터는 단일 채널을 사용하여 입수될 수 있다. 이러한 소위 1-염료 서열결정 접근법에서, 제1 뉴클레오타이드 유형은 표지되지만, 표지는 제1 영상이 생성된 후에 제거되고, 제2 뉴클레오타이드 유형은 제1 영상이 생성된 후에만 표지된다. 제3 뉴클레오타이드 유형은 제1 영상 및 제2 영상 둘 모두에서 이의 표지를 보유하고, 제4 뉴클레오타이드 유형은 두 영상 모두에서 비표지된 채로 유지된다.
일부 실시형태는 결찰 기술에 의한 서열결정을 사용할 수 있다. 이러한 기술은 DNA 리가제를 사용하여 올리고뉴클레오타이드를 혼입시키고, 이러한 올리고뉴클레오타이드의 혼입을 식별한다. 올리고뉴클레오타이드는 전형적으로 올리고뉴클레오타이드가 혼성화하는 서열에서 특정 뉴클레오타이드의 식별과 상관관계가 있는 상이한 표지를 갖는다. 다른 SBS 방법에서와 같이, 영상은 핵산 특징부의 어레이를 표지된 서열결정 시약으로 처리한 후 얻어질 수 있다. 각각의 영상은 특정 유형의 표지가 혼입된 핵산 특징부를 나타낼 것이다. 상이한 특징부는 각각의 특징부의 상이한 서열 내용물로 인해서 상이한 영상으로 존재하거나 존재하지 않을 것이지만, 특징부의 상대적인 배치는 영상에서 변화되지 않고 유지될 것이다. 결찰-기반 서열결정 방법으로부터 얻은 영상은 본 명세서에 언급된 바와 같이 저장, 처리 및 분석될 수 있다. 본 명세서에 기술된 방법 및 시스템과 함께 사용될 수 있는 예시적인 SBS 시스템 및 방법은 미국 특허 제6,969,488호, 제6,172,218호, 및 제6,306,597호에 기술되어 있다.
일부 실시형태는 나노공극 서열결정을 사용할 수 있다(Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Acc. Chem. Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)). 이러한 실시형태에서, 이중-인덱스 단편이 나노공극을 통해서 통과한다. 나노공극은 합성 공극 또는 생물학적 막 단백질, 예컨대, α-용혈소일 수 있다. 이중-인덱스 단편이 나노공극을 통해서 통과하기 때문에, 각각의 염기-쌍은 공극의 전기 컨덕턴스에서의 변동을 측정함으로써 식별될 수 있다(미국 특허 제7,001,792호; Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008)). 나노공극 서열결정으로부터 얻은 데이터는 본 명세서에 언급된 바와 같이 저장, 처리 및 분석될 수 있다. 특히, 데이터는 본 명세서에 언급된 광학 영상 및 다른 영상의 예시적인 처리에 따라서 영상으로서 처리될 수 있다.
일부 실시형태는 DNA 중합효소 활성의 실시간 모니터링을 포함하는 방법을 사용할 수 있다. 뉴클레오타이드 혼입은 예를 들어, 미국 특허 제7,329,492호 및 제7,211,414호에 기술된 바와 같이 형광단-보유 중합효소와 γ-포스페이트-표지된 뉴클레오타이드 간의 형광 공명 에너지 전달(FRET) 상호작용을 통해서 검출될 수 있거나, 또는 뉴클레오타이드 혼입은 예를 들어, 미국 특허 제7,315,019호에 기술된 바와 같은 제로-모드 도파관으로 그리고 예를 들어, 미국 특허 제7,405,281호 및 미국 특허 공개 제2008/0108082호에 기술된 바와 같은 형광 뉴클레오타이드 유사체 및 조작된 중합효소를 사용하여 검출될 수 있다. 일루미네이션은 표면-테더링된 중합효소 주변의 젭토리터-스케일 체적에 제한될 수 있어서 형광성 표지된 뉴클레오타이드의 혼입은 낮은 배경으로 관찰될 수 있다(Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)). 이러한 방법으로부터 얻은 영상은 본 명세서에 언급된 바와 같이 저장, 처리 및 분석될 수 있다.
일부 SBS 실시형태는 연장 산물 내로의 뉴클레오타이드의 혼입 시에 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출을 기반으로 하는 서열결정은 이온 토렌트(Ion Torrent)(길포드(Guilford), 미국 코네티컷주 소재, 라이프 테크놀로지스(Life Technologies) 자회사)로부터 상업적으로 입수 가능한 전기 검출기 및 관련된 기술 또는 미국 특허 공개 제2009/0026082호; 제2009/0127589호; 제2010/0137143호; 및 제2010/0282617호에 기술된 서열결정 방법 및 시스템을 사용할 수 있다. 표적 핵산을 운동역학적 배제를 사용하여 증폭시키기 위한 본 명세서에 언급된 방법은 양성자를 검출하는 데 사용되는 기질에 쉽게 적용될 수 있다. 보다 구체적으로, 본 명세서에 언급된 방법을 사용하여 양성자를 검출하는 데 사용되는 앰플리콘의 클론성 집단을 생성시킬 수 있다.
상기 SBS 방법은 멀티플렉스 포맷으로 이롭게 수행되어 다수의 상이한 이중-인덱스 단편이 동시에 조작될 수 있다. 특정 실시형태에서, 상이한 이중-인덱스 단편은 일반적인 반응 용기 내에서 또는 특정 기질의 표면 상에서 처리될 수 있다. 이것은 멀티플렉스 방식으로 서열결정 시약의 편리한 전달, 미반응 시약의 제거 및 혼입 사례의 검출을 가능하게 한다. 표면-결합된 표적 핵산을 사용한 실시형태에서, 이중-인덱스 단편은 어레이 포맷으로 존재할 수 있다. 어레이 포맷에서, 이중-인덱스 단편은 전형적으로 공간적으로 구별 가능한 방식으로 표면에 결합될 수 있다. 이중-인덱스 단편은 직접 공유 부착, 비드 또는 다른 입자에 대한 부착 또는 표면에 부착된 중합효소 또는 다른 분자에 결합에 의해서 결합될 수 있다. 어레이는 각각의 부위(특징부라고도 지칭됨)에서 이중-인덱스 단편의 단일 카피를 포함할 수 있거나 또는 동일한 서열을 갖는 다수의 카피가 각각의 부위 또는 특징부에서 존재할 수 있다. 다수의 카피는 본 명세서에 추가로 상세하게 기술된 바와 같은 증폭 방법, 예컨대, 브릿지 증폭 또는 에멀션 PCR에 의해서 생산될 수 있다.
본 명세서에 언급된 방법은, 예를 들어, 적어도 약 10개의 특징부/㎠, 100개의 특징부/㎠, 500개의 특징부/㎠, 1,000개의 특징부/㎠, 5,000개의 특징부/㎠, 10,000개의 특징부/㎠, 50,000개의 특징부/㎠, 100,000개의 특징부/㎠, 1,000,000개의 특징부/㎠, 5,000,000개의 특징부/㎠, 또는 그 초과를 비롯한 다양한 밀도 중 임의의 것에서 특징부를 갖는 어레이를 사용할 수 있다.
본 명세서에 언급된 방법의 이점은, 이것이 동시에 복수의 ㎠의 신속하고 효율적인 검출을 제공한다는 것이다. 따라서, 본 개시내용은 관련 기술 분야에 공지된 기술, 예컨대, 본 명세서에 예시된 것을 사용하여 핵산을 제조 및 검출할 수 있는 통합된 시스템을 제공한다. 따라서, 본 개시내용의 통합된 시스템은 증폭 시약 및/또는 서열결정 시약을 하나 이상의 고정된 이중-인덱스 단편에 전달할 수 있는 유체 성분을 포함할 수 있고, 시스템은 성분, 예컨대, 펌프, 밸브, 저장소, 유체 라인 등을 포함한다. 플로우 셀은 표적 핵산의 검출을 위한 통합된 시스템으로 구성되고/되거나 사용될 수 있다. 예시적인 플로우 셀은 예를 들어, 미국 특허 공개 제2010/0111768호 및 미국 가특허 제13/273,666호에 기술되어 있다. 플로우 셀에 대해서 예시된 바와 같이, 통합된 시스템의 유체 성분 중 하나 이상이 증폭 방법 및 검출 방법을 위해서 사용될 수 있다. 예로서 핵산 서열결정 실시형태를 고려하는 경우, 통합된 시스템의 유체 성분 중 하나 이상이 본 명세서에 언급된 증폭 방법을 위해서 그리고 서열결정 방법, 예컨대 상기에 예시된 것에서 서열결정 시약의 전달을 위해서 사용될 수 있다. 대안적으로, 통합된 시스템은 증폭 방법을 수행하고, 검출 방법을 수행하기 위한 별개의 유체 시스템을 포함할 수 있다. 증폭된 핵산을 생성할 수 있고, 또한 핵산의 서열을 결정할 수 있는 통합된 서열결정 시스템의 예는 비제한적으로 MiSeqTM 플랫폼(일루미나, 인크., 미국 캘리포니아주 샌디에고 소재) 및 미국 가특허 제13/273,666호에 기술된 장치를 포함한다.
또한 본 명세서에는 조성물이 제공된다. 본 명세서에 기술된 방법의 실시 동안 다양한 조성물이 생성될 수 있다. 예를 들어, 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하는 조성물이 생성될 수 있고, 여기서 단리된 핵은 인덱싱된 핵산 단편을 포함한다. 또한 다중-웰 플레이트가 제공되며, 여기서 다중-웰 플레이트의 웰은 인덱싱된 핵산 단편을 갖는 단리된 핵을 포함한다. 일 실시형태에서, 단리된 핵은 비자연적 가교결합부, 예컨대, 가교결합제, 예를 들어, 폼알데하이드에 의해서 형성된 가교결합부의 유형을 포함할 수 있다. 일 실시형태에서, 인덱싱된 핵산 단편은 오버행을 갖는 절단된 제한 부위에서 종결된다. 일 실시형태에서, 단리된 핵은 재배열된 게놈 DNA를 포함한다.
실시형태
실시형태 1. 복수의 단일 세포로부터 핵산을 포함하는 서열결정 라이브러리를 제조하는 방법으로서,
a) 복수의 세포로부터 단리된 핵을 제공하는 단계;
(b) 상기 단리된 핵을 화학 처리에 적용하여 상기 단리된 핵의 온전성을 유지시키면서 뉴클레오솜-고갈된 핵을 생성시키는 단계;
(c) 상기 뉴클레오솜-고갈된 핵의 하위세트를 제1 복수의 구획 내로 분포시키고, 각각의 하위세트를 트랜스포좀 복합체와 접촉시키는 단계로서, 각각의 구획 내의 상기 트랜스포좀 복합체는 트랜스포사제 및 다른 구획 내의 제1 인덱스 서열과 상이한 제1 인덱스 서열을 포함하는, 상기 접촉시키는 단계;
(d) 상기 뉴클레오솜-고갈된 핵의 하위세트 내의 핵산을 복수의 핵산 단편으로 단편화시키고, 상기 제1 인덱스 서열을 상기 핵산 단편의 적어도 하나의 가닥 내에 혼입시켜 인덱싱된 핵산 단편을 포함하는 인덱싱된 핵을 생성시키는 단계로서, 상기 인덱싱된 핵산 단편은 상기 트랜스포사제에 부착된 채로 유지되는, 상기 인덱싱된 핵을 생성시키는 단계;
(e) 상기 인덱싱된 핵을 조합하여 풀링된 인덱싱된 핵을 생성시키는 단계;
(f) 상기 풀링된 인덱싱된 핵의 하위세트를 제2 복수의 구획 내에 분포시키는 단계;
(g) 각각의 구획 내의 상기 인덱싱된 핵산 단편 내에 제2 인덱스 서열을 혼입시켜 이중-인덱스 단편을 생성시키는 단계로서, 각각의 구획 내의 상기 제2 인덱스 서열은 다른 구획 내의 제2 인덱스 서열과 상이한, 상기 이중-인덱스 단편을 생성시키는 단계;
(h) 상기 이중-인덱스 단편을 조합함으로써 상기 복수의 단일 세포로부터 전체 게놈 핵산을 포함하는 서열결정 라이브러리를 생산하는 단계를 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 2. 실시형태 1에 있어서, 상기 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는 카오트로픽제로의 처리를 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 3. 실시형태 2 또는 3에 있어서, 상기 카오트로픽제는 리튬 3,5-다이아이오도살리실산을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 4. 실시형태 1 내지 3 중 어느 것에 있어서, 상기 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는 세정제로의 처리를 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 5. 실시형태 1 내지 4 중 어느 것에 있어서, 상기 세정제는 소듐 도데실 설페이트(SDS)를 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 6. 실시형태 1 내지 5 중 어느 것에 있어서, 상기 핵은 단계 (b) 이전에 가교결합제로 처리되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 7. 실시형태 1 내지 6 중 어느 것에 있어서, 상기 가교결합제는 폼알데하이드인, 서열결정 라이브러리를 제조하는 방법.
실시형태 8. 실시형태 1 내지 7 중 어느 것에 있어서, 상기 폼알데하이드의 농도는 약 0.2% 내지 약 2% 범위인, 서열결정 라이브러리를 제조하는 방법.
실시형태 9. 실시형태 1 내지 8 중 어느 것에 있어서, 상기 폼알데하이드의 농도는 약 1.5% 이하인, 서열결정 라이브러리를 제조하는 방법.
실시형태 10. 실시형태 1 내지 9 중 어느 것에 있어서, 폼알데하이드에 의한 가교결합은 단계 (f) 이후에 그리고 단계 (g) 이전에 반전되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 11. 실시형태 1 내지 10 중 어느 것에 있어서, 상기 가교결합의 상기 반전은 약 55℃ 내지 약 72℃에서 인큐베이션시키는 것을 포함하는, 열결정 라이브러리를 제조하는 방법.
실시형태 12. 실시형태 1 내지 11 중 어느 것에 있어서, 상기 트랜스포사제는 상기 가교결합의 상기 반전 이전에 상기 인덱싱된 핵산 단편으로부터 해리되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 13. 실시형태 1 내지 12 중 어느 것에 있어서, 상기 트랜스포사제는 소듐 도데실 설페이트(SDS)를 사용하여 상기 인덱싱된 핵산 단편으로부터 해리되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 14. 실시형태 1 내지 13 중 어느 것에 있어서, 상기 핵은 단계 (d) 이전에 제한 효소로 처리되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 15. 실시형태 1 내지 14 중 어느 것에 있어서, 상기 핵은 상기 제한 효소로의 처리 후에 리가제로 처리되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 16. 실시형태 1 내지 15 중 어느 것에 있어서, 단계 (c) 및 (f)에서의 상기 분포는 형광-활성화된 핵 분류에 의해서 수행되는, 서열결정 라이브러리를 제조하는 방법.
실시형태 17. 실시형태 1 내지 16 중 어느 것에 있어서, 상기 뉴클레오솜-고갈된 핵의 상기 하위세트는 대략 동일한 수의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 18. 실시형태 1 내지 17 중 어느 것에 있어서, 상기 뉴클레오솜-고갈된 핵의 상기 하위세트는 1 내지 약 2000개의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 19. 실시형태 1 내지 18 중 어느 것에 있어서, 상기 제1 복수의 구획은 다중-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
실시형태 20. 실시형태 1 내지 19 중 어느 것에 있어서, 상기 다중-웰 플레이트는 96-웰 플레이트 또는 384-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
실시형태 21. 실시형태 1 내지 20 중 어느 것에 있어서, 상기 풀링된 인덱싱된 핵의 상기 하위세트는 대략 동일한 수의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 22. 실시형태 1 내지 21 중 어느 것에 있어서, 상기 풀링된 인덱싱된 핵의 상기 하위세트는 1 내지 약 25개의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 23. 실시형태 1 내지 22 중 어느 것에 있어서, 상기 풀링된 인덱싱된 핵의 상기 하위세트는 상기 뉴클레오솜-고갈된 핵의 상기 하위세트보다 적어도 10배 더 적은 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 24. 실시형태 1 내지 23 중 어느 것에 있어서, 상기 풀링된 인덱싱된 핵의 상기 하위세트는 상기 뉴클레오솜-고갈된 핵의 상기 하위세트보다 적어도 100배 더 적은 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 25. 실시형태 1 내지 24 중 어느 것에 있어서, 상기 제2 복수의 구획은 다중-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
실시형태 26. 실시형태 1 내지 25 중 어느 것에 있어서, 상기 다중-웰 플레이트는 96-웰 플레이트 또는 384-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
실시형태 27. 실시형태 1 내지 26 중 어느 것에 있어서, 단계 (c)는 상기 뉴클레오솜-고갈된 핵의 하위세트가 분포된 후 상기 트랜스포좀 복합체를 상기 구획에 첨가하는 것을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 28. 실시형태 1 내지 27 중 어느 것에 있어서, 상기 트랜스포좀 복합체 각각은 트랜스포존을 포함하되, 상기 트랜스포존은 각각은 전달된 가닥을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 29. 실시형태 1 내지 28 중 어느 것에 있어서, 상기 전달된 가닥은 상기 제1 인덱스 서열 및 제1 범용 서열을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 30. 실시형태 1 내지 29 중 어느 것에 있어서, 단계 (g)에서 상기 제2 인덱스 서열의 상기 혼입은 각각의 구획 내의 상기 인덱싱된 핵산 단편을, 각각 인덱스 서열을 포함하고, 각각 제1 범용 서열의 일부와 동일하거나 이에 상보성인 서열을 포함하는 제1 범용 프라이머 및 제2 범용 프라이머와 접촉시키고, 지수적 증폭 반응을 수행하는 것을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 31. 실시형태 1 내지 30 중 어느 것에 있어서, 상기 제1 범용 프라이머의 상기 인덱스 서열은 상기 제2 범용 프라이머의 상기 인덱스 서열의 역 보체인, 서열결정 라이브러리를 제조하는 방법.
실시형태 32. 실시형태 1 내지 31 중 어느 것에 있어서, 상기 제1 범용 프라이머의 상기 인덱스 서열은 상기 제2 범용 프라이머의 상기 인덱스 서열의 역 보체와 상이한, 서열결정 라이브러리를 제조하는 방법.
실시형태 33. 실시형태 1 내지 32항 중 어느 것에 있어서, 상기 제1 범용 프라이머는 상기 이중-인덱스 단편의 3' 단부에서 범용 서열에 상보성인 제1 앵커 서열 및 제1 포획 서열을 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 34. 실시형태 1 내지 33 중 어느 것에 있어서, 상기 제1 포획 서열은 P5 프라이머 서열을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 35. 실시형태 1 내지 34 중 어느 것에 있어서, 상기 제2 범용 프라이머는 상기 이중-인덱스 단편의 5' 단부에서 범용 서열에 상보성인 제2 앵커 서열 및 제2 포획 서열을 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 36. 실시형태 1 내지 35 중 어느 것에 있어서, 상기 제2 포획 서열은 상기 P7 프라이머 서열의 상기 역 보체를 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 37. 실시형태 1 내지 36 중 어느 것에 있어서, 상기 지수적 증폭 반응은 중합효소 연쇄 반응(PCR)을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 38. 실시형태 1 내지 37 중 어느 것에 있어서, 상기 PCR은 15 내지 30회 사이클을 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 39. 실시형태 1 내지 38 중 어느 것에 있어서, 상기 이중-인덱스 단편에 대해서 특이성을 갖는 복수의 포획 올리고클레오타이드를 사용한 이중-인덱스 단편의 풍부화를 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 40. 실시형태 1 내지 39 중 어느 것에 있어서, 상기 포획 올리고클레오타이드는 고체 기질의 표면 상에 고정된, 서열결정 라이브러리를 제조하는 방법.
실시형태 41. 실시형태 1 내지 제40 중 어느 것에 있어서, 상기 포획 올리고클레오타이드는 범용 결합쌍의 제1 구성원을 포함하되, 상기 결합쌍의 제2 구성원은 고체 기질의 표면 상에 고정된, 서열결정 라이브러리를 제조하는 방법.
실시형태 42. 실시형태 1 내지 42 중 어느 것에 있어서, 상기 이중-인덱스 단편을 서열결정하여 복수의 단일 세포로부터 상기 핵산의 뉴클레오타이드 서열을 결정하는 단계를 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 43. 실시형태 1 내지 42 중 어느 것에 있어서, 하기 단계들을 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
복수의 증폭 부위를 포함하는 표면을 제공하는 단계로서, 상기 증폭 부위는 자유 3' 단부를 갖는 부착된 단일 가닥 포획 올리고클레오타이드의 적어도 2개의 집단을 포함하는, 상기 표면을 제공하는 단계, 및
상기 증폭 부위를 포함하는 표면을, 각각 개별 이중-인덱스 단편으로부터의 앰플리콘의 클론성 집단을 포함하는 복수의 증폭 부위를 생성시키기에 적합한 조건 하에서 상기 이중-인덱스 단편과 접촉시키는 단계.
실시형태 44. 실시형태 1 내지 43 중 어느 하나에 있어서, 상기 이중-인덱스 단편의 수는 증폭 부위의 수를 초과하되, 상기 이중-인덱스 단편은 상기 증폭 부위에 대한 유체 접근부를 갖고, 그리고 상기 증폭 부위 각각은 상기 서열결정 라이브러리 내에 몇몇 이중-인덱스 단편을 위한 용량을 갖는, 서열결정 라이브러리를 제조하는 방법.
실시형태 45. 실시형태 1 내지 44 중 어느 하나에 있어서, 상기 접촉시키는 단계는 동시에 (i) 상기 이중-인덱스 단편을 평균 수송 속도로 상기 증폭 부위로 수송하는 단계, 및 (ii) 상기 증폭 부위에 존재하는 상기 이중-인덱스 단편을 평균 증폭 속도로 증폭시키는 단계를 포함하되, 상기 평균 증폭 속도는 상기 평균 수송 속도를 초과하는, 서열결정 라이브러리를 제조하는 방법.
실시형태 46. 조성물로서, 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하되, 상기 단리된 핵은 인덱싱된 핵산 단편을 포함하는, 조성물.
실시형태 47. 실시형태 46에 있어서, 상기 단리된 핵은 비자연적 가교결합부를 포함하는, 조성물.
실시형태 48. 실시형태 46 또는 47 중 어느 것에 있어서, 상기 조성물은 오버행을 포함하는 절단된 제한 부위에서 종결된 인덱싱된 핵산 단편을 포함하는, 조성물.
실시형태 49. 실시형태 46 내지 48 중 어느 것에 있어서, 상기 단리된 핵은 재배열된 게놈 DNA를 포함하는, 조성물.
실시형태 50. 다중-웰 플레이트로서, 상기 다중-웰 플레이트의 웰은 실시형태 46 내지 49 중 어느 것의 조성물을 포함하는, 다중-웰 플레이트.
본 개시내용은 하기 실시예에 의해서 예시된다. 특정 실시예, 물질, 양 및 절차는 본 명세서에 언급된 바와 같은 본 개시내용의 범주 및 사상에 따라서 넓게 해석되어야 한다는 것이 이해되어야 한다.
실시예 1
조합 인덱싱을 사용한 수 천개의 단일-세포 게놈의 생성 및 서열결정
단일-세포 게놈 서열결정은 특히 종양 진화와 관련하여, 체세포 변이의 검출을 위해서 가치있는 것으로 증명되어 있다. 현재 기술은 높은 라이브러리 작제 비용으로 방해를 받는데, 이것은 평가될 수 있는 세포의 수를 제한하고, 따라서 조직 내에서 이질성을 측정하는 능력에 대해서 한계를 갖는다. 본 명세서에서, 단일 세포 조합 인덱싱된 서열결정(SCI-seq)은 체세포 카피 수 변이 검출을 위한 수 천 개의 로-패스 단일 세포 라이브러리를 동시에 생성시키는 방식으로서 제시된다. 16,698개의 단일 세포에 대한 라이브러리를 배양된 세포주, 영장류 전두엽 조직, 췌장 종양 내의 하위클론 변이의 상세한 평가를 비롯한 2종의 인간 선암의 조합물로부터 작제하였다. 본 실시예는 또한 비타크(Vitak) 등(2017, Nature Methods, 14, 302-308, doi:10.1038/nmeth.4154)으로서 입수 가능하다.
방법
샘플 제조 및 핵 단리.
접착성(HeLa S3, ATCC CCL-2.2; NIH/3T3, ATCC CRL-1658)이면 조직 배양 세포주를 트립신처리하고, 이어서 펠릿화하거나 또는 현탁액 중에서 성장(GM12878, Coriell; 오수 리서치 사이토지네틱스 래보러토리(OHSU Research Cytogenetics Laboratory)에서 핵형결정됨)되면 펠릿화하고, 그 다음 얼음 냉각된 PBS로 1회 세척하였다. 이어서 이것을 뉴클레오솜 고갈시키거나 고갈시키지 않고, 가교결합제를 통해서(xSDS 방법의 경우) 또는 핵 단리 완충액(NIB, 10mM 트리스HCl pH7.4, 10mM NaCl, 3mM MgCl2, 0.1% 이게팔®, 1x 프로테아제 저해제(로슈, Cat. 11873580001))를 사용하여 핵 제제로 직접 옮겼다. 조직 샘플(레서스Fcx1, 레서스Fcx2, PDAC, CRC)을 NIB 중에서 다운스(dounce) 균질화시키고, 이어서 35μM 세포 스트레이너(strainer)를 통해서 통과시킨 후 뉴클레오솜 고갈시켰다. 냉동된 레서스 전두엽 샘플, 레서스Fcx1(4살 암컷) 및 레서스Fcx2(9살 암컷)를 이의 노화 비인간 영장류 자원의 부분으로서 오레곤 내셔널 프리메이트 리서치 센터(Oregon National Primate Research Center)로부터 입수하였다.
표준 단일 세포 라이브러리 작제
단일 세포 라이브러리를 쿠사이-랜덤 프라이밍(QRP)을 사용하여 작제하고, 축퇴 올리고뉴클레오타이드 프라이밍된 PCR(DOP)을 뉴클레오솜이 고갈되지 않은 단리된 핵으로부터 제조하였고, 최대 1㎖의 NIB로 만들고, 5㎕의 5㎎/㎖ DAPI(써모 피셔, Cat. D1306)로 염색하고, 이어서 소니(Sony) SH800 상에서 단일 세포 모드로 FANS 분류하였다. 하나의 핵을 각각의 샘플 완충액을 함유하는 각각의 단일 웰에 침착시켰다. 피코플렉스 DNA-seq 키트(루비콘 제노믹스(Rubicon Genomics), Cat. R300381)를 사용하여 제조사의 프로토콜에 따라서 그리고 키트에 제공된 인덱싱된 PCR 프라이머를 사용하여 QRP 라이브러리를 제조하였다. Seq플렉스 DNA 증폭 키트(시그마, Cat. SEQXE-50RXN)를 사용하여 제조사의 프로토콜에 따라서, 그렇지만 10bp의 인덱스 서열을 함유하는 시판 PCR 인덱싱 프라이머를 사용하여 DOP 라이브러리를 제조하였다. 과-증폭을 방지하기 위해서, 증폭을 모니터링하고, 중간-지수적 증폭에 도달한 반응을 빼내기 위해서, 0.5㎕의 100X SYBR 그린(Green)(FMC 바이오프로덕츠(FMC 바이오프로덕츠), Cat. 50513)을 첨가하여 모든 QRP 및 DOP 라이브러리를 바이오라드 CFX 써모사이클러(바이오라드 CFX 써모사이클러) 상에서 증폭시켰다.
뉴클레오솜 고갈
리튬 보조 뉴클레오솜 고갈(LAND): 제조된 핵을 펠릿화하고, 200㎕의 12.5mM 리튬 3,5-다이아이오도살리실산(주요 텍스트에서 리튬 다이아이오도살리실레이트라 지칭됨, 시그마, Cat. D3635)이 보충된 NIB 중에 5분 동안 얼음 상에서 재현탁시키고, 그 다음 800㎕의 NIB를 첨가하고, 이어서 유동 분류에 직접 적용하였다.
가교결합 및 SDS 뉴클레오솜 고갈(xSDS): 세포를 10㎖의 배지(세포 배양) 중에서 또는 핵을 10㎖의 HEPES NIB(20mM HEPES, 10mM NaCl, 3mM MgCl2, 0.1% 이게팔, 1x 프로테아제 저해제(로슈, Cat. 11873580001))(조직 샘플)(1.5% 폼알데하이드 함유함) 중에서 실온에서 10분 동안 인큐베이션시킴으로써 가교결합을 달성하였다. 반응에 200mM 글리신(시그마, Cat. G8898-500G)을 넣고, 얼음 상에서 5분 동안 인큐베이션시킴으로써 가교결합 반응을 중화시켰다. 세포 배양 샘플을 가교결합시키고, 이어서 10㎖의 얼음 냉각된 1x PBS로 1회 세척하였고, 이것은 NIB 완충액 중에서 얼음 상에서 20분 동안 인큐베이션시킴으로써 단리되고, 다시 한번 펠릿화된 핵을 가졌다. 이어서 핵을 0.3% SDS(시그마, Cat. L3771)를 갖는 800uL의 1x NEBuffer 2.1(NEB, Cat. B7202S) 중에서 현탁시키고, 써모믹서(에펜도르프) 내에서 30분 동안 격렬하게 진탕하면서 42℃에서 인큐베이션시켰다. 이어서, 200㎕의 10% 트리톤-X100(시그마, Cat. 9002-93-1)을 첨가하고, 30분 동안 격렬하게 진탕하면서 42℃에서 인큐베이션시킴으로써 SDS를 켄칭시켰다.
태그먼트화 및 PCR을 통한 조합 인덱싱
핵을 5㎕의 5㎎/㎖ DAPI(써모 피셔, Cat. D1306)로 염색하고, 35㎛ 세포 스트레이너를 통해서 통과시켰다. 각각의 웰 내에서 NIB로 희석된 넥스테라(Nextera)® DNA 샘플 제제 키트(일루미나, Cat. FC-121-1031)로부터의 10㎕의 1x 넥스테라® 태그먼트 DNA(TD) 완충액을 사용하여 96 웰 플레이트를 제조하였다. 소니 SH800 유동 분류기를 사용하여 2,000개의 단일 핵을 신속 분류 모드로 96 웰 태그먼트화 플레이트의 각각의 웰 내에 분류하였다. 다음으로, 1㎕의 고유하게 인덱싱된 2.5μM 트랜스포사제-어댑터 복합체(트랜스포좀)를 각각의 웰에 첨가하였다. 이러한 복합체 및 연관된 서열은 아미니(Amini) 등(Amini, S. et al. Nat. Genet. 46, 1343-9, 2014)에 기술되어 있다. 반응을 55℃에서 15분 동안 인큐베이션시켰다. 실온까지 냉각시킨 후, 모든 웰을 풀링시키고, 상기에 기술된 바와 같이 DAPI로 염색하였다. 8.5㎕의 0.058% SDS, 8.9nM의 BSA 용액 및 2.5㎕의 2개의 고유하게 바코딩된 프라이머(10μM)를 함유하는 각각의 웰을 사용하여 두 번째 96 웰 플레이트, 또는 96 웰 플레이트의 세트를 제조하였다. 이어서, 96개의 반응의 풀로부터의 22개의 사후-태그먼트화 핵을 동일한 장비 상에서 그러나 단일 세포 분류 모드로 제2 플레이트의 각각의 웰 내에 유동 분류하고, 이어서 SDS 용액 중에서 55℃에서 5분 동안 인큐베이션시켜 핵 스캐폴드를 방해하고, 트랜스포사제 효소를 해리시켰다. 68℃에서 1시간 동안 인큐베이션시킴으로써 가교결합부를 반전시켰다(xSDS). 이어서 7.5㎕의 넥스테라® PCR 마스터 믹스(일루미나, Cat. FC-121-1031)뿐만 아니라 0.5㎕의 100X SYBR 그린(FMC 바이오프로덕츠, Cat. 50513) 및 4㎕의 물을 첨가함으로써 SDS를 희석시켰다. 이어서 먼저 반응을 72℃에서 5분 동안, 그 후 3분 동안 98℃에서 인큐베이션시키고, [98℃에서 20초, 63℃에서 15 및 72℃에서 25]의 15 내지 20회 사이클에 의해서 실시간 PCR을 바이오라드 CFX 써모싸이클러 상에서 수행하였다. 반응을 모니터링하고, 지수적 증폭이 대부분의 웰에서 관찰되면 중지시켰다. 이어서 5㎕의 각각의 웰을 풀링시키고, 퀴아퀵(Qiaquick) PCR 정제 칼럼(퀴아젠(Qiagen), Cat. 28104)을 사용하여 정제하고, 30㎕의 EB 중에 용리시켰다.
라이브러리 정량 및 서열결정
라이브러리를 고감도 생물분석기 키트(High Sensitivity Bioanalyzer kit)(애질런트(Agilent), Cat. 5067-4626) 상에서 200bp 내지 1kbp의 범위 사이로 정량되었다. 라이브러리를 아미니 등(Amini, S. et al. Nat. Genet. 46, 1343-9, 2014)에 기술된 시판 서열결정 프라이머를 사용하여, 시판 서열결정 화학 프로토콜(판독 1: 50회 영상화 사이클; 인덱스 판독 1: 8회 영상화 사이클, 27회 암 사이클, 10회 영상화 사이클; 인덱스 판독 2: 8회 연상화 사이클, 21회 암 사이클, 10회 영상화 사이클; 판독 2: 50회 영상화 사이클)을 사용하여 0.8pM로 적재된 일루미나 NextSeq® 500 상에서 서열결정하였다. QRP 및 DOP 라이브러리를 이중-인덱싱과 함께 고-용량 75회 사이클 키트를 사용하여 NextSeq® 500 상에서 표준 프라이머를 사용하여 서열결정하였다. QRP의 경우 판독물의 첫 번째 15bp는 "G" 염기가 매우 풍부한 추가적인 도전이 존재하는데, 이는 NextSeq® 2-색상 화학을 사용하여 비-형광성이고, 따라서 장비 상에서의 클러스터 식별은 실패한다. 따라서 라이브러리를 이러한 영역이 누락된 시판 서열결정 프로토콜(판독 1: 15회 암 사이클, 50회 영상화 사이클; 인덱스 판독 1: 10회 영상화 사이클; 인덱스 판독 2: 10회 영상화 사이클)을 사용하여 서열결정하였다.
서열 판독물 처리
SCI-seq 원 판독물을 처리하기 위한 소프트웨어는 sci-seq.sourceforge.net에서 World Wide Web에서 입수 가능하다. --인덱스 판독물에 대한 fastq 생성(--create-fastq-for-index-reads) 및 --불합격 판독물 가짐(--with-failed-reads) 선택을 갖는 bcl2fastq(일루미나 인크, 버전 2.15.0)를 사용하여 서열 실시를 진행시켜 fastq 파일을 생성시켰다. 인덱스 판독물을 연결시키고(총 36bp) 단부에 첨부된 고유 판독 수를 갖는 판독물 명칭으로서 사용하였다. 이어서 이러한 인덱스를 상응하는 인덱스 참고 세트에 매칭시켜 4개의 인덱스 성분(i7-트랜스포사제(8bp), i7-PCR (10bp), i5-트랜스포사제(8bp), 및 i5-PCR (10bp)) 각각에 대해서 2개의 해밍 거리를 허용하였고, 이어서 쿼드-인덱스 조합이 매칭된 판독물을 실제 인덱스(및 고유 판독 수를 보유함)로 재명명하고, 그 다음 이것을 세포 식별자로서 사용하였다. 이어서 판독물을 어댑터 트리밍시키고, 이어서 짝지우고, 짝지워지지 않은 판독물을 Bowtie2에 의해서 참조 게놈에 정렬하고, 합쳤다. 인간 제제를 GRCh37에 정렬시키고, 레서스 제제를 RheMac8에 정렬시키고, 인간/마우스 혼합 제제를 조합된 인간(GRCh37) 및 마우스(mm10) 참고군에 정렬시켰다. 정렬된 밤(bam) 파일을, Bowtie2에 의해서 기록된 바와 같은 10 미만의 정렬 스코어를 갖는 판독물을 따라서 바코드당 기준으로 동일한 정렬 좌표를 갖는 판독물을 제거하는 시판 스크립트를 사용하여 PCR 복제 제거에 적용하였다.
단일 세포 구별
각각의 PCR 플레이트에 대해서, 총 9,216개의 고유 인덱스 조합이 가능하고(12개 i7-트랜스포사제 인덱스 Х 8개 i5-트랜스포사제 인덱스 Х 12개 i7-PCR 인덱스 Х 8개 i5-PCR 인덱스), 이를 위해서 단지 소수가 실질적인 판독 수치를 가져야 하는데, 그 이유는 대다수의 인덱스 조합, 즉, 주어진 PCR 웰 내에 분류되지 않은 핵의 트랜스포사제 인덱스 조합이 존재하지 않아야 하기 때문이다. 이러한 "빈" 인덱스는 전형적으로 매우 적은 수의 판독물(실시의 1 내지 3%)을 함유하고, 대다수의 판독물은 실제 단일 세포 인덱스 조합에 속한다(실시의 97 내지 99%). 인덱스 조합에 대한 log10 고유 판독 수치의 생성된 히스토그램(도 6)은 2개의 정상 분포의 믹스를 생성한다: 노이즈 성분 및 단일 세포 성분. 이어서 R 패키지 "믹스툴"을 사용하여 혼합 모델(정상 믹스EM)을 핏팅하여 각각의 성분의 비율(λ), 평균(μ) 및 표준 편차를 식별하였다. 단일 세포 라이브러리로서 자격을 얻기 위한 판독 수치 역치는 log10 공간에서 단일 세포 성분의 평균보다 1 표준 편차 작은 것, 또는 노이즈 성분의 평균보다 100배 더 큰 것(log10 공간에서 +2) 중에서 더 큰 것인 것으로 이해되었고, 최소 1,000 고유 판독물이어야 했다.
인간-마우스 믹스 실험
두 접근법 중 하나를 취하여 인간(GM12878 또는 HeLa S3) 및 마우스 (3T3) 세포를 혼합하였다: i) 세포 단계에서 혼합하거나(HumMus.LAND1 및 HumMus.LAND2) 또는 ii) 핵 단계에서 혼합하였다(HumMus.LAND3, HumMus.LAND4, 및 HumMus.xSDS). 후자를 사용하여 이중항(doublet)을 초래할 수 있는 핵 가교결합 또는 함께 응집하는 것을 제어하였다. 라이브러리를 본 명세서에 기술된 바와 같이 작제하였는데, 예를 들어 2개의 구별되는 DAPI-양성 집단을 유동 분류 동안 관찰한 경우, 분율을 왜곡시키지 않도록 동일한 게이트에서 두 집단 모두를 포함하였다. 판독물을 대신에 GRCh37(hg19) 및 mm10으로 구성된 참조군에 정렬한 것을 제외하고는, 다른 실험에서와 같이 판독물을 처리하였다. 맵핑 품질 10 필터는 두 게놈 내의 보존된 영역에 정렬된 판독물을 효과적으로 제거하였고, 이어서 각각 식별된 단일 세포의 경우, 각각의 종에 대한 판독물을 집계하고, 이를 사용하여 충돌 빈도를 추정하였다. 초기 LAND 제제의 경우, 25개의 인덱싱된 핵을 PCR 웰당 분류하고, 28.1% 및 10.4%의 총 충돌 비율(즉, 인간-마우스 충돌 비율을 2배함)이 생성되었다. 제2의 2개의 LAND 제제의 경우, 본 발명자들은 PCR 웰당 22개의 핵을 분류하였고, 이것은 하나의 제제에 대해서 4.3%의 총 충돌 비율을 생성하였고, 나머지 것에서는 충돌이 검출 가능하지 않았다. 본 발명자들은 또한 본 발명자들의 xSDS 제제에 대해서 2개의 FANS 분류 조건을 시험하였는데, 하나는 관대하고, 더 넓은 범위의 DAPI 형광을 허용하였고, 나머지는 더 제한적이고, 동일한 PCR 플레이트의 개별 측면 상에서 두 제제 모두를 수행하였다. 관대한 게이팅의 경우, 본 발명자들은 23.6%의 총 충돌을 관찰하였는데, 이것은 8.1%에서의 보다 제한적인 게이팅에 대해서 실질적으로 감소하였다. 이러한 결과를 기반으로 본 발명자들은 더 제한적인 FANS를 사용하여 PCR 웰당 22개의 핵을 계속 분류하기로 결정하였다.
라이브러리 깊이 예상
라이브러리가 더 깊은 깊이까지 서열결정되면, 또는 서열결정된 경우, 라이브러리 풀의 성능을 추정하기 위해서, 무작위 판독물을 총 원 판독물의 1%마다 치환하지 않으면서 비정렬되고 낮은 품질의 판독물을 포함하는 모든 인덱스 조합 전체에서 각각의 SCI-seq 제제로부터 증분식으로 샘플링하였다. 각각의 지점에 대해서 본 발명자들은 각각의 단일 세포 인덱스로 배정된 고품질(MQ = 10)로 정렬된 총 수 판독물 및 고유, 비-PCR 복사체인 이러한 판독물의 분율, 뿐만 아니라 그 인덱스로 배정된 샘플링된 총 판독물의 상응하는 분율을 식별하였다. 이러한 지점을 사용하여 본 발명자들은 비선형 모델 및 하네스-울페(Hanes-Woolfe) 변형 모델 둘 모두를 핏팅하여 풀 내의 각각의 개별 단일 세포 라이브러리에 대한 추가적인 서열결정을 예측하고, 5%의 세포에 걸친 중간 고유 판독 백분율을 예상하였다. 그 모델의 정확도를 결정하기 위해서, 본 발명자들은 세포당 중간 고유 판독물 백분율이 90%(이것은 낮은 커버리지로 서열결정된 라이브러리에 대해서 달성된 것보다 다소 낮음)인 지점에 도달할 각각의 라이브러리의 다운샘플링된 원 판독물의 수를 결정하였다. 이제 본 발명자들은 30회 반복을 위한 판독물의 미리 결정된 수를 하위샘플링하고, 각각의 반복에서 각각의 세포에 대한 새로운 모델을 설정하고, 이어서 달성된 실제 서열결정 깊이까지 각각의 세포에 대해서 고유 판독 수치를 예측하였다. 이어서 모든 세포에 대해서 모든 반복 전체에서 실제 판독 수치의 표준 편차를 계산하였다.
게놈 윈도우화
게놈 윈도우를 시판 툴을 사용하여 라이브러리당 기반으로 결정하였다. 각각의 염색체에 대해서 전체 염색체의 크기를 표적 윈도우 크기로 나누어 염색체당 윈도우의 수를 생성하였다. 이어서 모든 단일 세포(모든 인간 샘플의 경우(여기서 절대 카피 수를 결정함)뿐만 아니라 각각의 풀링된 샘플의 경우(여기서 평균 카피 수에 대해서 증폭 또는 결실을 결정함) GM12878)의 풀에 대해서 요약된 염색체에 대한 총 판독 수치를 윈도우 수치로 나누어 윈도우당 평균 판독 수치를 결정하였다. 이어서 염색체가 사라졌고, 윈도우당 표적 판독 수치가 도달하면 집계된 풀로부터의 정렬된 판독물 및 윈도우 브레이크가 생성되었다. 그것이 그 염색체에 대한 윈도우 한계치에 따라서 75%를 초과하는 평균 판독물을 함유하면 염색체 경계에서의 윈도우 만이 포함되었다. 동적 윈도우를 사용함으로써, 본 발명자들은 편향, 예컨대, 고도로 반복되는 영역, 동원체 및 고정된 크기 빈22의 경우에서 판독물 낙오로 이어질 수 있는 다른 복잡한 영역을 설명하였다.
GC 편향 보정
판독물을 가변적인 크기의 빈에 넣고, 동적 윈도우의 GC 내용물 대신에 개별 판독물 GC 내용물을 기반으로 GC를 보정하였다. 본 발명자들은 단일 세포 분석에 필요한 큰 빈 크기가 더 작은 규모의 GC 내용물 변화를 평균화한다고 가정한다. 추가로, SCI-seq는 게놈의 큰 영역이 증폭되는 사전-증폭을 포함하지 않기 때문에, GC 편향은 PCR로부터만 유래하고 앰플리콘-특이적이다. 판독물에 대한 보정 중량을 계산하기 위해서, 본 발명자들은 주어진 GC를 갖는 모든 판독물의 분율과 동일한 GC 분율에서 평균 삽입 크기를 갖는 총 모의실험된 판독물의 분율을 비교하였다. 이어서 이러한 가중치를 판독 수치 대신에 사용하였고, 주어진 윈도우에서 모든 판독물 전체에서 합산하였다. DAC 블랙리스팅된 영역 내에 존재하는 모든 영역을 인간 샘플 분석을 위한 분석으로부터 제외시켰다(hhttp://genome.ucsc.edu/cgi-bin/hgFileUi?db=hg19&g=wgEncodeMapability)19. GC 보정 이후에, 모든 판독물을 게놈 전체에서 빈당 판독물의 평균수에 의해서 정규화하였다. 마지막으로, 각각의 윈도우에 대해서 본 발명자들은 각각의 세포의 정규화된 판독 수치를 취하고, 그것을 풀링된 샘플 기준치로 나누어 비율 스코어를 산출하였다.
데이터 변동의 측정
데이터 품질을 측정하기 위해서, 본 발명자들은 커버리지 분산의 2종의 상이한 측정치, 즉, 중간 절대 편차(MAD), 중간 절대 쌍 차이(median absolute pairwise difference: MAPD)를 계산하였다. 각각의 스코어에 대해서 본 발명자들은 세포 내의 평균 빈 수치에 의해서 정규화된 이웃하는 빈 간의 모든 쌍 차이의 절대값의 중간값을 계산하였다(log2-MAPD 스코어에 대한 정규화된 비율). 이들 스코어는 자주 발생하지 않는 카피 수 상태 변화로 인해서가 아니라, 기술적 노이즈로 인해서 정규화된 비닝된 판독치의 분산을 측정한다2,22.
카피 수 변이 호출
2개의 상이한 분류 전략, 즉, 히든 마르코프 모델 접근법(HMMcopy, 버전 3.3.0, Ha, G. et al., Genome Res. 22, 1995-2007, 2012) 및 순환식 2진 분류(Circular Binary Segmentation)(DNAcopy, 버전 1.44.0, Olshen et al. Biostatistics 5, 557-572, 2004)를 사용하는 2종의 입수 가능한 R 패키지를 사용하여 윈도우화된 GC 보정되고 벌크 샘플 정규화된 판독물 상에서 CNV 호출을 수행하였다. 입력 이전에 값을 Log2로 변환하였고(CBS의 경우 2*log2), 문헌[Knouse et al. 2016, Knouse et al., Genome Res. gr.198937.115, 2016, doi:10.1101/gr.198937.115]으로부터의 최적화된 파라미터를 기반으로 카피 수 콜을 생성하였다. 5Mb 이상의 크기를 갖는 카피 수 콜을 검출하기 위한 최적 감도 및 특이성을 위해서 본 발명자들은 HMM의 경우 0.995까지의 분절 연장(E)의 확률을 설정하였고, CBS의 경우 본 발명자들은 카피수 변화(α)가 0.0001인 것을 허용하도록 유의 수준을 선택하였다. 호출 손실 또는 수득에 대한 Log2 컷오프는 HMM의 경우 0.4 및 -0.35였고, CBS의 경우 1.32 및 0.6이었다. CNV 호출을 위한 추가적인 툴로서, 본 발명자들은 징코22를 사용하였는데, 이것은 데이터 정규화를 위해서 대안적인 방법을 사용한다. 본 발명자들은 각각의 세포에 대한 베드 파일(bed file) 및 벌크 다운 샘플링된 베드 파일을 업로드하였는데, 이것은 본 발명자들이 피카드 툴(Picard Tool)을 사용하여 생성하였다(본 발명자들은 0.1의 다운 샘플 확률을 사용하였음). 분석을 위해서 본 발명자들은 다운 샘플링된 벌크 베드 파일을 사용하여 단일 세포를 분절화하기로 선택하였고, 샘플에 대해서 배수성을 알고 있는 경우, 본 발명자들은 FACS 파일을 생성시켜 징코를 그 배수성에 정규화하였다. 3가지 방법에 대한 콜을 윈도우당 기반으로 교차시키거나 또는 필터링하여 염색체 아암의 80% 이상에 걸쳐있는 콜을 단지 포함시키고, 이어서 이수성 분석을 위해서 교차시켰다.
종양 중단점 분석
산발적인 이수성과 달리, 종양 구조 변이는 휠씬 더 복잡하고, 염색체 내에서 큰 부분의 중단점을 갖는다. 추가로, 종양의 임의의 주어진 하위콜론 내의 산발적인 이수성은 존재하는 하위집단의 정확한 프로파일보다 덜 적절하다. 따라서 본 발명자들은 HMM 및 CBS 분절화 비율 스코어 매트릭스를 사용하여 세포 전체에서 분절화된 영역의 경계를 계산함으로써 중단점을 식별하였다. 이어서, 본 발명자들은 게놈 전체에서 공유된 염색체 중단점의 생성된 분포를 사용하여 콜이 만들어진 특정 윈도우에서 가변성을 설명하기 위한 국지적인 최대값을 식별하고, 이어서 세포의 적어도 5%에 존재하는 값을 유지하였다. 이어서 본 발명자들은 각각의 중단점 내의 모든 윈도우를 합치고, 정배수성 집단의 평균 값에 대한 각각의 이수성 세포의 새로운 log2 비를 계산하였다. 이어서 본 발명자들은 실루엣 분석에 의해서 결정된 k 값을 사용한 k-평균 클러스터링 이전에 주성분 분석을 수행하였다. 추정 단일 세포의 약 10%를 차지할 수 있는 이중항 효과를 최소화하고, 또한 저성능 세포를 제외시키기 위해서, 본 발명자들은 각각의 중심에 근접한 것 만을 유지시켰다. 이어서 본 발명자들은 각각의 클러스터 내의 모든 세포에 대한 서열 판독물을 합치고, 이어서 HMM 전략 그 다음 절대 카피 수 상태 식별 및 병소 증폭의 식별 및 슬라이딩 윈도우 이상치 전략을 사용한 결실을 사용하여 더 높은 분해능 CNV 분석(표적 윈도우 크기 100kbp)을 수행하였다20. 종양내 클론 관계는, 관련 구조 변화가 세포에 더 큰 영향을 주는 것으로서 DNA를 파괴한다는 가정을 기반으로 하는 분절의 카피수의 이동과 달리 공유된 중단점에 의해서 가장 정확하게 포착된다. 따라서 본 발명자들은, 분절의 총 수로부터 적어도 90%(카피수 변화라고 지칭된 정확한 윈도우에서 노이즈를 설명하기 위해서)가 중첩된 고 분해능(100kbp) CNV 분석을 사용하여 식별된 중단점들 간의 분절의 비율을 평가함으로써 세포를 비교하였다.
결과
균일한 게놈 커버리지를 위한 뉴클레오솜 고갈
균일하게 분포된 서열 판독물을 생산하기 위해서 조합 인덱싱을 개작하는 데 있어서의 장매물은 핵 온전성을 손상시키지 않으면서 게놈 DNA에 결합된 뉴클레오솜을 제거하는 것이다. sciATAC-seq 방법을 네이티브 염색질 상에서 수행하는데, 이것은 DNA가 오픈 염색질(게놈의 1 내지 4%)의 영역 내에서만 라이브러리 분자로 전환하는 것을 허용한다18. 이러한 제한은 후성적 특징규명에 바람직하지만; 그러나, CNV 검출의 경우, 그것은 생물학적 편향을 초래하고, 판독 수치를 엄격하게 제한한다(세포당 약 3,000개)17. 따라서 본 발명자들은 SCI-seq 라이브러리 작제에 대해서 핵 온전성을 보유하면서 게놈 DNA로부터 뉴클레오솜을 제거하는 2가지 전략을 개발하였다. 첫 번째로, 리튬 보조 뉴클레오솜 고갈(LAND)은 카오트로픽제인 리튬 다이아이오도살리실레이트를 사용하여, 세포에서 DNA-단백질 상호작용을 방해하여, 히스톤으로부터 DNA를 방출시킨다. 두 번째로, SDS(xSDS)를 사용한 가교결합은 세정제 SDS를 사용하여 히스톤 단백질을 변성시키고, 그것이 DNA에 결합할 수 없게 한다. 그러나, SDS는 핵 온전성에 대해서 방해적 효과를 갖기 때문에, 무손상 핵을 유지시키기 위해서 변성 이전에 가교결합 단계가 필요하다.
이러한 전략의 생존력을 시험하기 위해서, 본 발명자들은 HeLa S3 세포주에 대한 벌크(30,000개 핵) 제제를 수행하였고, 이를 위해서 염색질 접근성 및 게놈 구조를 광범위하게 프로파일링하고19,20, 표준 대조군과 함께 LAND 또는 xSDS 처리를 수행하였다. 3개의 경우 모두에서, 핵은 무손상된 채로 유지되었는데 - 이것은 SCI-seq 흐름도에 대한 주요 요건이다(도 4B). 이어서 제조된 핵을 표준 ATAC-seq 라이브러리 작제에 적용하였다16. 미처리 핵으로부터 제조된 라이브러리는 표지된 HeLa S3 접근성 부위에 정렬된 서열 판독물이 10.8배 농축된 예상된 ATAC-seq 신호를 생성하였다. LAND 및 xSDS 제제 둘 모두는 각각 샷건(shotgun) 서열결정에 대해서 관찰된 1.4배에 가까운, 2.8 및 2.2배의 실질적으로 더 낮은 농축을 가졌다(도 4C, 표 1). 추가로, LAND 및 xSDS 제제 중에 존재하는 고유 서열 판독물의 예상된 수는 1억 7천만개인 표준 라이브러리에 대해서보다 훨씬 더 많은 각각 17억개 및 7억9천8백만개였는데, 이는 게놈의 더 높은 비율이 실행 가능한 서열결정 분자로 전환되었음을 시사한다.
Figure pat00001
뉴클레오솜 고갈을 사용한 SCI-seq
본 발명자들의 단일 세포 조합 인덱싱 작업 흐름을 사용한 뉴클레오솜 고갈의 성능을 평가하기 위해서, 본 발명자들은 먼저 깊게 프로파일링된, 정배수성 림프아구성 세포주 GM12878를 주목하였다14,15,19. 본 발명자들은 다양한 LAND 조건을 갖는 총 6개의 SCI-seq 라이브러리를 생성하였는데, 각각 PCR 인덱싱 단계에서 단일 96-웰 플레이트를 사용하였고, 3Х96-웰 PCR 플레이트를 갖는 단일 xSDS 라이브러리를 사용하였다. 기존의 방법에 대한 비교로서 제공하기 위해서, 본 발명자들은 쿠사이-랜덤 프라이밍을 사용하여 42개의 단일 세포 라이브러리(QRP, 40개 QC 통과)를 제조하였고, 축퇴 올리고뉴클레오타이드 프라이밍된 PCR을 사용하여 51개(DOP, 45개 QC 통과)를 제조하였다. 마지막으로, 본 발명자들은 50개의 세포의 핵형을 결정하여 이수성 측정의 비-서열결정 수단으로서 제공하였다(표 2).
[표 2a]
Figure pat00002
[표 2b]
Figure pat00003
각각의 SCI-seq 제제의 경우, 잠재적인 인덱스 조합의 수는 96(트랜스포사제 인덱싱) Х N(PCR 인덱싱, 플레이트당 96)이다; 그러나, 인덱스 조합 모두가 단일 세포 라이브러리를 나타내는 것은 아닌데, 그 이유는 각각의 PCR 웰이 단지 15 내지 25개의 트랜스포사제-인덱싱된 핵을 함유하기 때문이다. 비지 않은(non-empty) 인덱스 조합을 식별하기 위해서, 본 발명자들은 각각의 잠재적인 인덱스 조합에 대해서 고유(즉, 비-PCR 복제물), 고품질(MQ = 10)의 정렬된 판독물의 log10 변환된 히스토그램을 생성하였다. 이것은 50 내지 200개 판독물 사이에 중심이 있는 노이즈 성분인 저-판독물-수치 및 10,000 내지 100,000개 사이에 중심이 있는 단일 세포 성분인 고-판독물-수치로 구성된 이봉 분포를 생성하였다(도 7a,b, 도 8). 이어서 본 발명자들은 혼합 모델을 사용하여 이러한 고-판독물-수치 성분에 포함되는 인덱스를 식별하였는데(도 6), 이것은 뉴클레오솜 고갈을 위해서 LAND를 사용한 6개의 SCI-seq 제제 전체에서 4,643개의 단일 세포 라이브러리를 생성하였고, xSDS 제제의 경우 3,123개를 생성하였다.
대다수의 추정 단일 세포 라이브러리가 실제 단일 세포를 함유하는지를 확인하기 위해서, 본 발명자들은 PCR 웰당 22개 또는 25개의 핵과 함께 LAND(총 2,369개 세포)를 사용하여 인간과 마우스 세포의 믹스 상에서 4개의 SCI-seq 라이브러리 제제를 수행하였고, 하나의 제제는 2개의 FANS 조건 사이에서 분할된 xSDS를 사용한다(총 1,367개 세포; 도 9). 각각의 실험을 위해서 본 발명자들은 인간 또는 마우스 게놈에만 정렬된 90% 이상의 이의 판독물을 갖는 추정 단일 세포의 비율을 분석하였다. 남아있는 세포는 인간-마우스 충돌(즉, 이중항)을 나타내고, 총 충돌률의 대략 절반을 구성한다(나머지 절반은 인간-인간 또는 마우스-마우스임). 총 충돌률은 0 내지 23.6%에서 달라졌고, 이를 사용하여 sciATAC-seq17 및 고 처리량 단일 세포 RNA-seq 기술21에 대등한, 10% 미만의 표적 이중항 빈도에 대한 제한적 분류 조건을 사용하여 웰당 22개 세포를 결정하였다.
SCI-seq 제제에서 각각의 라이브러리에 대해서 생성된 고유 판독 수치는 라이브러리 복잡성 및 서열결정 깊이의 함수이다. 개발 도중 모든 제제를 깊게 서열결정하는데 드는 비용을 줄임으로써, 본 발명자들은 증가된 서열결정 깊이로 성취될 수 있는 예상 판독 수치 및 PCR 복제 백분율을 예상하기 위한 모델을 구현하였다(도 7c, 방법). 품질 평가의 수단으로서, 본 발명자들은, 세포 전체에서 판독물의 50%의 중간값이 PCR 복제인 깊이(M50)를 식별하였는데, 이는 추가적인 서열결정이 몇몇 다른 메트릭스와 함께 과도해지는 지점을 나타낸다(즉, 추가적인 판독물의 50% 초과가 어떠한 새로운 정보도 제공하지 않음)(표 3). 서열결정된 판독물의 하위세트로부터의 모델 예상은 모든 라이브러리 전체에서 0.02%의 중간값(최대 2.25%, 평균 0.41%) 내에서 고유 판독 수치를 정확하게 예측하였다. 추가 확인으로서, 몇몇 제제로부터의 PCR 웰의 하위세트의 추가적인 서열결정은 본 발명자들의 모델에 의해서 예측된 것의 0.13%의 중간값(최대 3.56%, 평균 0.72%) 내인 각각의 세포에 대한 고유 판독 수치를 생성하였다(도 10).
[표 3a]
Figure pat00004
[표 3b]
Figure pat00005
평균 절대 편차(MAD)22 및 평균 절대 쌍 편차(MAPD)2를 사용하여 커버리지 균일성을 평가하였는데, 이것은 LAND보다 xSDS를 사용하는 경우 실질적으로 더 양호한 균일성을 나타내었다(MAD: 평균 1.57-배 개선, p = <1x10-15; MAPD: 1.70-배 개선, p = <1x10-15, 웰치스 t-시험). xSDS를 사용한 편차는 다중 치환 증폭 방법과 유사하지만, QRP 및 DOP에 대한 것보다 여전히 더 크다(도 7d)22. LAND 제제는 더 높은 커버리지 편향을 가졌지만, 이들은 또한 xSDS(예를 들어, GM12878 제제의 경우 63,223의 M50)와 비교할 때 세포당 더 높은 고유 판독 수치를 산출하였다(예를 들어, 3개의 HeLa LAND 제제 중 하나의 경우 763,813의 M50). 모든 라이브러리에 대해서, 본 발명자들은 전위13,23의 기전으로 인해서 인접한 판독쌍의 특징적인 9개 염기쌍 중첩을 발견하였는데, 이는 본 발명자들이 트랜스포사제 삽입 사례의 어느 양쪽 상에서 분자를 서열결정할 수 있다는 것을 나타낸다(도 11).
SCI-seq를 사용한 카피 수 변이 호출
임의의 단일 세포 게놈 서열결정 연구를 위해서, 실제 이수성 세포를 제거하지 않으면서 실패한 라이브러리를 필터링하는 방법을 결정하는 것이 중요한 도전이다. 본 발명자들은 먼저 다른 방법과 직접 비교하기 위해서 본 발명자들의 SCI-seq 제제 상에서 CNV 호출을 진행시켰다. 모든 제제에 대해서, 본 발명자들은 최소 50,000개의 고유, 고품질 정렬된 판독물(모든 LAND 라이브러리 전체에서 868개, xSDS 라이브러리에 대해서 1,056개)을 갖는 세포를 사용하고, CNV 호출을 위해서 가변-크기의 게놈 윈도우(250만bp의 표적 중간값)를 사용하여 징코22, 순환식 2진 분류(CBS)24, 및 히든 마르코프 모델(HMM)25을 적용하였고(도 12), 모든 3개의 방법의 교차를 보수적으로 유지하였다. 본 발명자들의 서열결정-기반 콜을 핵형결정된 세포와 비교하기 위해서, 본 발명자들은 염색체-아암 수준 사례에 초점을 맞추었다(도 7e,f). 커버리지 균일성 차이와 일관되게, 본 발명자들의 LAND SCI-seq 제제는 높은 이수성 비율(61.9%)을 산출하였고, 이는 커버리지 균일성의 결여로 인한 위양성(false positive)의 풍부함을 시사하였다(도 7e,g). 그러나, SCI-seq를 사용한 xSDS 뉴클레오솜 고갈 전략은 핵형결정 결과(도 7e,h)에 훨씬 더 가까운, 22.6%의 이수성 빈도뿐만 아니라 DOP 및 QRP(각각 15.0% 및 13.5%)(도 13)를 초래하였다.
본 발명자들은 다음으로 다양한 분해능 및 판독 수치 역치에 걸친 MAD 및 MAPD 스코어를 기반으로 필터링 기준을 결정하였다(도 14). 이러한 분석은 본 발명자들의 SCI-seq 제제의 분해능의 더 큰 범위의 변동성을 보여주었고, 이는 표준 방법과 비교하는 경우 세포당 더 넓은 범위의 고유 판독물에 의해서 상당히 유도되었다. 모든 방법 전체에서 0.2의 MAD 분산 필터를 적용함으로써, xSDS, DOP 및 QRP에 대한 이수성 비율은 각각 12.2%, 9.7% 및 10.5%로 낮아졌는데, 이것 모두는 핵형결정에 의해서 결정된 비율보다 낮지만, 필터링 이전보다 서로에 더 가깝다(도 15).
레서스 뇌에서의 카피 수 변이
포유동물 뇌에서 이수성 및 큰 규모 CNV 빈도의 예측치는 5% 미만에서 33%까지 폭넓게 달라진다1-4. 이러한 불확실성은 정량적 측정치를 산출하기 위해서 충분한 수의 단일 세포를 프로파일링할 수 없다는 것으로부터 주로 기인된다. 레서스 마카크는 뇌에서 이수성의 풍부도를 정량하기 위한 이상적인 모델인데, 그 이유는 인간 샘플은 획득되기 어렵고, 평생 환경 노출에서의 높은 변동성에 의해서 혼동되기 때문이다. 추가로, 레서스 뇌는 계통 발생론적으로, 구조적으로 그리고 생리학적으로 설치류보다 인간에 더 유사하다26.
본 발명자들의 플랫폼의 다능성을 입증하기 위해서, 본 발명자들은 QRP를 사용한 38개 세포(35개 QC 통과), 및 DOP를 사용한 35개 세포(30개 QC 통과)와 함께, LAND 및 xSDS SCI-seq를 보관된 전두엽 조직(개체 1)에 적용하였다. 본 발명자들의 저용량 LAND 제제(16개 PCR 인덱스)는 141,449(248개 세포 = 50,000 고유 판독물)의 중간 고유 판독 수치를 갖는 340개의 단일 세포 라이브러리를 생성하였고, 본 발명자들의 xSDS 제제는 55,142(92개 세포 = 50,000 고유 판독물)의 중간 고유 판독 수치를 갖는 171개의 단일 세포 라이브러리를 생성하였다. 본 발명자들의 xSDS 제제에서 생산된 세포의 수는, 주로 추가적인 세포 탈응집 단계에 의해서 해결될 수 있는 분류 동안 핵 응집물로 인해서, 예상된 것보다 더 낮았다.
라이브러리 작제의 모든 방법 전체에서, 본 발명자들은 주로 레서스 참조 게놈(284,705개 콘티그(contig) < 1Mbp)의 더 낮은 품질로 인해서, 인간 분석에서보다 3개의 CNV 호출 접근법 사이에서 더 큰 차이를 관찰하였고(도 16 내지 19), 이는 "백금" 품질 참조 게놈에 대한 필요성을 강조한다27. 따라서, 본 발명자들은 하위-염색체 콜에 대한 HMM 결과에 초점을 맞췄고(도 20a) CBS 및 HMM 콜의 교차를 사용하여 이수성 분석을 수행하였다. 본 발명자들의 세포주 결과와 일치하게, LAND 제제는 훨씬 더 높은 이수성 비율(95.1%)을 산출하였고, 이는 커버리지 불균일성으로부터 기인하는 위양성을 시사한다(도 21 및 22). xSDS SCI-seq 미필터 이수성 비율(25.0%)은 DOP 제제(18.5%)에 근접하였고, QRP은 훨씬 더 낮은 비율을 산출하였다(3.1%; 도 20b). 0.2 이하의 MAD 스코어를 갖는 세포에 대해서 분산 필터를 도입한 후, 이수성 비율은 xSDS 제제의 경우 12.0%, DOP의 경우 8.7%로 떨어졌고, QRP 제제의 경우 3.1%에서 동일하게 정체되었다. 이러한 비율은, 각각 12.1% 및 10.3%의 필터링되지 않은 이수성 비율 및 필터링된 이수성 비율을 산출한 제2 개체로부터의 전두엽의 200㎣의 섹션 상에서 xSDS SCI-seq에 의해서 산출된 것과 유사하였다(381개 단일 세포, 중간 판독 수치 62,731, 213개 세포 = 50,000 고유 판독물)(도 23).
원발성 종양 샘플에 대한 SCI-seq는 클론성 집단을 나타낸다.
단일 세포 게놈 서열결정의 주요 응용 중 하나는 종양 이질성의 프로파일링, 및 암에서 클론성 진화를 이해하는 데 있는데, 그 이유는 그것이 치료 내성과 관련되기 때문이다5-8. 본 발명자들은 대략 250㎣로 측정된 새로 획득한 III기 췌장관 선암(PDAC) 샘플 상에서 단일 xSDS SCI-seq 제제를 수행하였고, 이것은 세포당 49,272의 중간 고유 판독 수치로 서열결정된 1,715개 단일 세포 라이브러리를 초래하였다(71,378의 M50; 라이브러리가 서열결정된 깊이에서 846개 세포 = 50,000 고유 판독물; 도 24a). 본 발명자들은 먼저 비교를 위한 정배수성 기준치로서 GM12878 라이브러리를 사용하여 CNV 호출을 수행하여 고-신뢰도 정배수성 세포의 세트(298, 35.2%)를 식별하였고, 이어서 이것을 개체 및 제제에 대해서 특이적인 새로운 기준치로서 사용하였다(도 23, 25, 26). 하위염색체 카피 수 변형(게놈 불안정성에 의해서 기인됨)이 전체 염색체 이수성(세포 분열 동안의 실수로 인함)보다 하위클론성 집단을 식별하는 데 더 많은 정보를 제공한다고 가정하여, 본 발명자들은 새로운 윈도우 경계로서 사용될 저 분해능에서 추정 카피 수 중단점을 식별하는 전략(방법, 도 27) 그 다음 주성분 분석(PCA) 및 k-평균 클러스터링을 통한 층화를 개발하였다. 본 발명자들은 먼저 이 방법을 본 발명자들의 HeLa 라이브러리(총 2,361개 단일 세포)에 적용하였는데, 이는 어떠한 뚜렷한 이질성도 나타내지 않았고, HeLa 세포주의 안정성을 추가로 뒷받침하였고20(도 28 내지 31), 이어서 본 발명자들의 일차 PDAC 샘플에 대해서, 그것은 실루엣 분석에 의해서 4의 최적 클러스터 수치를 나타내었다(도 24b,c).
이러한 클러스터 중 첫 번째 것(k3)은 초기 분석에서 고 신뢰도 정배수성으로 간주되지 않은 정배수성 세포의 집단이기 때문에, 제거되었다. 이들을 포함시키는 경우, 정배수성 집단은 PDAC에 대해서 예상된 범위 내인 46.0%의 최종 종양 세포 순도에 대해서 389로 증가한다28. 나머지 클러스터 k1(199 세포), k2(115 세포) 및 k4(91 세포)의 경우, 본 발명자들은 각각의 중심에 가까운 세포로부터의 모든 판독물을 합하고(방법), 초기 분석보다 25-배 더 높은 분해능인 100kbp 윈도우를 사용하여 CNV 호출을 수행하고, 이어서 절대 카피 수 상태를 결정하였다20(도 24d).
3개의 종양 클러스터 전체에서, 카피 수 분절의 상당한 부분이 공유되었는데(44.8%), 이는 그들이 공통 전구체 집단으로부터 발생했다는 것을 시사한다. 이것은, AML에서 빈번하게 돌연변이되고29, 췌장 종양에서 변경된 후성적 조절을 갖는 것으로 최근 밝혀진30 카피 수 7에서, 인핸서 결합 단백질을 암호화하는 CEBPA의 국소 증폭을 보유하는 고도로 재배열된 염색체 19를 포함한다(도 24e). 모든 쌍별 비교는, 클러스터 k2 및 k4가 65.9%의 카피 수 분절을 공유하는 가장 유사한 것이고, 그 다음 k1 및 k4가 58.3%, 그리고 k1 및 k2가 55.0%임을 나타내었다. 몇몇 클러스터-특이적 CNV는 잠재적인 기능적 관련성의 유전자를 함유한다(도 24e). 이들은 NF-κB 신호전달 경로에서 중요한 세린 카이나제를 암호화하는 클러스터 k1에서 IKBKB 의 카피 수 6에 대한 국소 증폭31; 유전자 DSC1,2,3DSG1,2,3,4 (이들 모두는 세포-세포 접착 및 세포 배치에 관여된 단백질을 암호화하고, 종종 암에서 잘못 조절됨)를 함유하는 클러스터 k1에서 카피 수 5에 대한 또 다른 국소 증폭32; 및 세포 증식 신호전달에 관여된 타이로신 카이나제 세포 표면 수용체를 암호화하고, 암에서 빈번하고 돌연변이되는 클러스터 k2에 대해서 특이적인 PDGRFB 를 함유하는 영역의 결실33을 포함한다.
마지막으로, 본 발명자들은 500㎣으로 측정된 동결된 II기 직장 선압에 xSDS SCI-seq를 적용하였다. 제조 동안 본 발명자들은 핵 부스러기 및 파열된 핵이 상당히 풍부한 것을 인지하였는데, 이는 146개의 단일 세포 라이브러리(중간 고유 판독 수치 71,378; 352,168의 M50; 111개 세포 = 50,000 고유 판독물)의 제제(16개 PCR 인덱스)의 수율 감소로 인한 것 같다. 본 발명자들은 PDAC 샘플과 동일한 CNV 호출 접근법을 수행하였지만; 고 빈도 중단점은 관찰되지 않았고, 하위클론성 집단이 식별될 수 없었다(도 32). 이것은 직장암에 대한 일반적인 치료법인 방사선 조사로 인한 핵 손상의 결과일 수 있는데, 이는 모든 단일 세포 방법에 의해서 공유되는 고품질 단일 세포 또는 핵 현탁액을 생산하는 도전을 강조한다12.
논의
본 발명자들은 조합 인덱싱 작업 흐름으로 뉴클레오솜 고갈을 사용하여 수 천개의 단일 세포 게놈 서열결정 라이브러리를 생산하는 방법인 SCI-seq를 개발하였다. SCI-seq를 사용하여, 본 발명자들은 단일 세포 게놈 연구의 주요 두 영역: 체세포 이수성 및 암을 대표하는 1차 조직 단리물을 비롯한, 무수히 많은 샘플로부터 16,698개의 단일 세포 라이브러리(이들 중 5,395개는 CNV 호출에 충분한 깊이로 서열결정됨)를 생산하였다. 처리량의 이점에 더하여, 이러한 플랫폼은 마이크로유체 장비 또는 소적 유화 기술이 필요하지 않다. 본 발명자들의 보다 균일한 뉴클레오솜 고갈 전략인 xSDS를 사용하여, 본 발명자들은 250kbp 정도의 분해능을 달성할 수 있었지만, 본 발명자들은 추가 최적화, 예컨대, 대안적인 가교결합제강 개선된 분해능에 충분한 깊이를 제공할 수 있다고 생각한다. 본 발명자들은 또한 증식, 이동에 영향을 줄 수 있거나 또는 가능하게는 다른 분자 하위유형을 유도할 수 있는 하위클론-특이적 CNV를 나타낸 췌장관 선암34에 이러한 전략을 적용함으로써 합쳐질 수 있는 클론성 집단을 식별하여 고 분해능 CNV 호출을 용이하게 하는 능력을 입증한다.
이 기술을 사용하여 SCI-seq 이전의 핵 스캐폴드 내에서의 동일계 사전 증폭 또는 시험관내 전사, 또는 ATAC-seq 변형인 THS-seq35에서와 같은, T4 시험관내 전사의 혼입을 포함시켜 생성된 커버리지를 증강시키고, 단일 뉴클레오타이드 변이체 검출을 용이하게 할 수 있다. 임의의 새로운 방법에서와 같이 최적화가 가능하지만, 본 발명자들은 SCI-seq에 의해서 제공된 처리량이 포유동물 체세포 게놈 안정성에 대한 깊은 정량을 위한 포문을 열고 뿐만 아니라 DNA 메틸화 및 염색질 구조물을 비롯한 단일 세포의 다른 특성을 평가하기 위한 플랫폼으로서 역할을 할 것이라고 여긴다.
수탁 코드
NCBI BioProject ID: PRJNA326698
HeLa dbGaP 수탁: phs000640
데이터 가용성
GM12878 및 레서스 서열 데이터는 무제한 접근을 위해서 BioProject ID: PRJNA326698 하에 NCBI Sequence Read Archive(SRA)를 통해서 접근 가능하다. HeLa 서열 데이터는 유전자형 및 표현형(dbGaP)의 데이터베이스를 통해서 수탁 번호 phs000640 하에 하위연구로서 접근 가능하다. 인간 종양 샘플은 dbGaP에 제출되고 있고, 연구 수탁 배정을 기다리고 있다. 이러한 프로젝트에 대해서 구체적으로 개발된 소프트웨어는 sci-seq.sourceforge.net에서 World Wide Web에서 입수 가능하다.
실시예 1에 인용된 참고 문헌
Figure pat00006
Figure pat00007
Figure pat00008
실시예 2
실시예 2에서 사용된 시약
Figure pat00009
포스페이트 완충액 식염수(PBS, 써모 피셔, Cat. 10010023)
Figure pat00010
0.25% 트립신(써모 피셔, Cat. 15050057)
Figure pat00011
트리스(피셔, Cat. T1503)
Figure pat00012
HCl(피셔, Cat. A144)
Figure pat00013
NaCl(피셔, Cat. M-11624)
Figure pat00014
MgCl2(시그마, Cat. M8226)
Figure pat00015
이게팔® CA-630(시그마, I8896)
Figure pat00016
프로테아제 저해제(로슈, Cat. 11873580001)
Figure pat00017
리튬 3,5-다이아이오도살리실산(시그마, Cat. D3635) - LAND 단독
Figure pat00018
폼알데하이드(시그마, Cat. F8775) - xSDS 단독
Figure pat00019
글리신(시그마, Cat. G8898) - xSDS 단독
Figure pat00020
HEPES(피셔, Cat. BP310) - xSDS 단독
Figure pat00021
NEBuffer 2.1 (NEB, Cat. B7202) - xSDS 단독
Figure pat00022
SDS(시그마, Cat. L3771) - xSDS 단독
Figure pat00023
트리톤TM -X100(시그마, Cat. 9002-93-1) - xSDS 단독
Figure pat00024
DAPI(써모 피셔, Cat. D1306)
Figure pat00025
넥스테라® 키트 (일루미나, Cat. FC-121-1031)로부터의 TD 완충액 및 NPM
Figure pat00026
96개의 인덱싱된 트랜스포좀(공개된 방법을 사용하여 조립되거나 또는 일루미나로부터 입수됨, 올리고 표 4에 나타냄)
Figure pat00027
인덱싱된 i5 및 i7 PCR 프라이머(표 5)
Figure pat00028
SYBR 그린 (FMC 바이오프로덕츠, Cat. 50513)
Figure pat00029
키아퀵® PCR 정제 키트(퀴아젠, Cat. 28104)
Figure pat00030
dsDNA 고감도 큐빗(High Sensitivity qubit)(써모 피셔, Cat. Q32851)
Figure pat00031
고감도 생물분석기 키트(애질런트, Cat. 5067-4626)
Figure pat00032
NextSeq 서열결정 키트(고 또는 중간 150-사이클)
Figure pat00033
서열결정 프라이머(표 6)
실시예에서 사용된 장비
Figure pat00034
다운스 균질화기
Figure pat00035
35μM 세포 스트레이너(BD 바이오사이언시스(BD Biosciences), Cat. 352235)
Figure pat00036
소니 SH800 세포 분류기(소니 바이오테크놀로지(Sony Biotechnology), Cat. SH800) 또는 DAPI-기반 단일 핵 분류가 가능한 다른 FACS 장비
Figure pat00037
CFX 커넥트 RT 쏘모 싸이클러(바이오-라드(Bio-Rad), Cat. 1855200) 또는 다른 실시간 써모싸이클러
Figure pat00038
큐빗® 2.0 플루오로메터(Flourometer)(써모 피셔, Cat. Q32866)
Figure pat00039
2100 생물분석기(애질런트, Cat. G2939A)
Figure pat00040
NextSeq® 500 (일루미나, Cat. SY-415-1001)
Figure pat00041
Figure pat00042
Figure pat00043
Figure pat00044
Figure pat00045
Figure pat00046
Figure pat00047
Figure pat00048
Figure pat00049
I. 리튬 3,5-다이아이오도살리실산(LAND) 또는 SDS(xSDS)을 사용한 핵의 제조
A. 핵 제제 및 뉴클레오솜 고갈의 LAND 방법
세포가 현탁 세포 배양물로 존재하면, 배양물을 약하게 분쇄하여 세포 덩어리를 파괴하고, 500xg에서 5분 동안 4℃에서 회전시킴으로써 세포를 펠릿화하고, 500㎕의 얼음 냉각된 PBS로 세척하였다.
세포가 접착성 세포 배양물로 존재하면, 배지를 흡인시키고, 세포를 37℃에서 10㎖의 PBS로 세척하고, 이어서 충분한 0.25% 트립신을 37℃에서 첨가하여 단층을 피복하였다. 37℃에서 5분 동안 또는 90%의 세포가 더 이상 표면에 접착하지 않을 때까지 인큐베이션시킨 후, 37℃ 배지를 1:1 비율로 첨가하여 트립신을 켄칭시켰다. 500xg에서 5분 동안 4℃에서 회전시킴으로써 세포를 펠릿화하고, 이어서 500㎕의 얼음 냉각된 PBS로 세척하였다.
조직을 사용하는 경우, 조직 샘플을 얼음 상에서 2㎖ 다운스 균질화기에 넣었다. 2㎖의 NIB 완충액(10mM 트리스HCl pH7.4, 10MM NaCl, 3mM MgCl2, 0.1% 이게팔®, 1x 프로테아제 저해제)을 샘플에 첨가하고, 얼음 상에서 5분 동안 인큐베이션시켰다. 샘플을 루즈 패슬(loose pestle)로 5회 다운싱하고, 그 다음 타이트 페슬(tight pestle)로 15 스트로크 다운싱하고, 이어서 35μM 세포 스트레이너를 통과시키고, 필요한 경우 추가적인 스트레이너를 사용하였다.
현탁 세포 배양물, 접착성 세포 배양물, 또는 조직 샘플 중 어느 하나로부터의 세포를 500xg에서 5분 동안 회전시켜 펠릿화하고, 이어서 NIB 완충액(2.5㎕ 1M LIS + 197.5㎕ NIB 완충액) 중의 12.5mM LIS 200㎕ 중에 재현탁시켰다. 얼음 상에서 5분 동안 인큐베이션시킨 후, 800㎕의 NIB 완충액 및 5㎕의 DAPI(5㎎/㎖)를 첨가하였다. 세포를 35μM 세포 스트레이너를 통해서 약하게 통과시켰다.
B. 핵 제제 및 뉴클레오솜 고갈의 xSDS 방법
세포가 현탁 세포 배양물로 존재하면, 배지를 약하게 분쇄하여 세포 덩어리를 파괴하였다. 배지 중의 세포 10㎖에 37% 폼알데하이드 406㎕를 첨가하고, 약하게 진탕하면서 실온에서 10분 동안 인큐베이션시켰다. 2.5M 글리신 800마이크로리터를 세포에 첨가하고, 얼음 상에서 5분 동안 인큐베이션시키고, 이어서 550xg에서 8분 동안 4℃에서 원심분리하였다. 10㎖의 얼음 냉각된 PBS로의 세척 후, 세포를 5㎖의 얼음 냉각된 NIB(10mM 트리스HCl pH7.4, 10mM NaCl, 3mM MgCl2, 0.1% 이게팔®, 1x 프로테아제 저해제) 중에 재현탁시키고, 약하게 혼합하면서 얼음 상에서 20분 동안 인큐베이션시켰다.
세포가 접착성 세포 배양물로 존재하면, 배지를 흡인시키고, 세포를 37℃에서 10㎖의 PBS로 세척하고, 이어서 충분한 0.25% 트립신을 37℃에서 첨가하여 단층을 피복하였다. 37℃에서 5분 동안 또는 90%의 세포가 더 이상 표면에 접착하지 않을 때까지 인큐베이션시킨 후, 37℃ 배지를 1:1 비율로 첨가하여 트립신을 켄칭시키고, 체적을 배지 10㎖로 만들었다. 세포를 배지 10㎖ 중에 재현탁시키고, 37% 폼알데하이드 406㎕를 첨가하고, 약하게 진탕하면서 실온에서 10분 동안 인큐베이션시켰다. 800마이크로리터의 2.5M 글리신을 세포에 첨가하고, 얼음 상에서 5분 동안 인큐베이션시켰다. 세포를 550xg에서 8분 동안 4℃에서 원심분리하고, 10㎖의 얼음 냉각된 PBS로 세척하였다. 세포를 5㎖의 얼음 냉각된 NIB 중에 재현탁시킨 후, 이것을 약하게 혼합하면서 얼음 상에서 20분 동안 인큐베이션시켰다.
조직을 사용하는 경우, 조직 샘플을 얼음 상에서 2㎖ 다운스 균질화기에 넣었다. 2㎖의 HEPES NIB(20mM HEPES, 10MM NaCl, 3mM MgCl2, 0.1% 이게팔, 1x 프로테아제 저해제) 완충액을 샘플에 첨가하고, 얼음 상에서 5분 동안 인큐베이션시켰다. 샘플을 루즈 패슬로 5회 다운싱하고, 그 다음 타이트 페슬로 15 스트로크 다운싱하고, 이어서 35μM 세포 스트레이너를 통과시키고, 필요한 경우 추가적인 스트레이너를 사용하였다. 체적을 HEPES-NIB로 최대 10㎖로 만들고, 406㎕의 37% 폼알데하이드를 10㎖ 체적에 첨가하였다. 800마이크로리터의 2.5M 글리신을 첨가하고, 얼음 상에서 5분 동안 인큐베이션시켰다.
현탁 세포 배양물 또는 접착성 세포 배양물 중 어느 하나로부터의 세포 또는 핵을 500xg에서 5분 동안 회전시켜 펠릿화하고, 900㎕의 1x NEBuffer 2.1로 세척하였다. 500 x g에서 5분 동안 회전시킨 후, 펠릿을 12㎕의 20% SDS를 갖는 800㎕ 1x NEBuffer 2.1 중에 재현탁시키고, 격렬하게 진탕하면서 42℃에서 30분 동안 인큐베이션시키고, 이어서 200㎕의 10% 트리톤TM X-100을 첨가하고, 격렬하게 진탕하면서 42℃에서 30분 동안 인큐베이션시켰다. 세포를 35μM 세포 스트레이너를 통해서 약하게 통과시키고, 5㎕ DAPI(5㎎/㎖)를 첨가하였다.
II. 핵 분류 및 태그먼트화
10㎕의 1x TD 완충액(1개의 플레이트에 대해서: 500㎕ NIB 완충액 + 500㎕ TD 완충액)을 사용하여 태그먼트화 플레이트를 제조하고, 2000개의 단일 핵을 태그먼트화 플레이트의 각각의 웰 내에 분류하였다. 이 단계에서, 웰당 핵의 수는, 웰당 핵의 수가 전체 플레이트에 대해서 일관된 한 약간 달라질 수 있다. 또한 상이한 샘플을 플레이트의 상이한 셀 내에서 멀티플렉싱하는 것이 가능한데, 그 이유는 트랜스포사제 인덱스가 보존될 것이기 때문이다. 세포를 도 33에 따라서 게이팅시켰다. 플레이트 회전시킨 후, 1㎕의 2.5nM의 고유 인덱싱된 트랜스포좀을 각각의 웰에 첨가하였다. 시일링 후, 플레이트를 약하게 진탕하면서 55℃에서 15분 동안 인큐베이션시켰다. 이어서 플레이트를 실온으로 복귀시키고, 이어서 얼음 상에 두었다. 모든 웰을 풀링시키고, 5㎕ DAPI(5㎎/㎖)를 첨가하고, 이어서 세포를 35μM 세포 스트레이너를 통해서 통과시켰다.
III. 제2 분류 및 PCR 인덱싱
각각의 웰에 대해서 0.25㎕의 20㎎/㎖ BSA, 0.5㎕의 1% SDS, 및 7.75㎕의 H2O를 사용하여 마스터 믹스를 제조하였다. 마스터 믹스(8.5㎕) 및 2.5㎕의 각각(i5 및 i7)의 10μM 프라이머를 96 웰 플레이트의 각각의 웰에 첨가하였다. 단일 핵(15 내지 22)을 가장 엄격한 분류 설정을 사용하여 각각의 웰 내에 분류하였다. 이어서, 플레이트를 회전시켰다. LAND 방법을 사용하여 제조된 이러한 핵을 5분 동안 55℃에서 인큐베이션시켜 트랜스포사제를 변성시켰다. xSDS 방법을 사용하여 제조된 이러한 핵을 45분 동안 68℃에서 인큐베이션시켜 트랜스포사제를 변성시키고, 가교결합부를 반전시켰다.
완충액을 제조하고(1개의 플레이트에 대해서: 750㎕ NPM, 400㎕ H2O, 및 50㎕ 100x SYBR 그린), 12㎕의 완충액을 스트립 튜브의 각각의 웰에 첨가하였다. 하기 PCR 사이클을 수행하였다: 5분 동안 72℃, 30초 동안 98℃, 이어서 (10초 동안 98℃, 30초 동안 63℃, 1분 동안 72℃ 그 다음 플레이트 판독 및 72℃에서 추가 10초)의 반복 사이클. SYBR 그린 형광에 결정되는 경우 대부분의 웰이 지수적 증폭을 나타낼 때까지 이 사이클을 반복하였다.
IV. 라이브러리 세정 및 정량
라이브러리를 PCR 플레이트의 각각의 웰 5uL를 사용하여 풀링시키고, 이어서 키아퀵® PCR 정제 칼럼을 사용하여 정제하고, 30㎕의 10mM 트리스-Cl, pH 8.5(EB) 중에서 용리시켰다. 2마이크로리터를 사용하여 제조사의 프로토콜에 따라서 dsDNA 고감도 큐빗® 2.0 플루오로메터를 사용하여 DNA의 농도를 정량하였다. 큐빗® 판독을 사용하여 라이브러리를 약 4ng/uL까지 희석하고, 제조사의 프로토콜에 따라서 1uL를 고감도 생물분석기 2100 상에서 수행하였다. 이어서 라이브러리를 200bp 내지 1kbp 범위에 대해서 정량하여, 일루미나 서열결정을 위해서 풀을 1nM로 희석시켰다.
V. 서열결정
NextSeq® 500을, 하기 변화를 제외하고는 1nM 샘플에 대해서 제조사의 설명서에 따라서 실시를 위해서 설정하였다. 라이브러리 풀을 0.8pM의 농도 및 1.5㎖의 총 체적으로 적재하고, 카트리지 위치 10 내에 침착시키고; 9㎕의 100μM 스톡 서열결정 프라이머 1을 카트리지 위치 7 내에서 총 1.5㎖의 HT1 완충액 중에 희석시킴으로써 시판 프라이머를 설정하고; 9㎕의 100 μM 스톡 서열결정 프라이머 2를 카트리지 위치 8 내에서 총 1.5㎖의 HT1 완충액 중에 희석시킴으로써 서열결정 프라이머를 설정하고; 18㎕의 각각의 시판 인덱스 서열결정 프라이머를 100 μM 스톡 농도에서 카트리지 위치 9에서 총 3㎖의 HT1 완충액 중에 희석시킴으로써 시판 인덱스 서열결정 프라이머를 설정하였다(표 7 참고). NextSeq® 500를 자립형 모드로 작동시키고; SCIseq 시판 화학 레시피(Amini et al., 2014, Nat. Genet. 46, 1343-1349)를 선택하고; 이중 인덱스를 선택하고; 판독 사이클의 적절한 수(50 추천) 및 각각의 인덱스에 대해서 18회 사이클을 도입하고; 모든 판독물 및 인덱스에 대한 시판 체크박스를 선택하였다.
Figure pat00050
실시예 3
단일-세포 조합 인덱싱 및 게놈 및 염색체 입체 배좌
단리된 핵의 제한 엔도뉴클레아제 소화 그 다음 결찰을 사용하여 핵 내의 염색체 구조에 대한 정보, 예컨대, 염색질 폴딩 분석 및 게놈 재배열의 검출을 획득할 수 있다. 이러한 분석 유형은 염색체 입체 배좌 포획(3C) 및 관련 방법(4C, 5C, 및 Hi-C)으로서 관련 기술 분야에 공지되어 있다.
실시예 1 및 2에 기술된 방법과 함께 사용될 수 있는 단일-세포 조합 인덱싱 및 게놈 및 염색체 입체 배좌(sci-GCC)의 방법이 도 34에 기술되어 있다. 구체적으로, 단일-세포 조합 인덱싱 및 게놈 및 염색체 입체 배좌의 방법은 도 34에 도시된 바와 같은 블록 12, 13, 14, 및 19를 포함한다. 단일 세포의 게놈 및 염색체 입체 배좌 분석의 다른 방법(Nagano et al., 2013, Nature, 502:59-64)과 달리, 본 명세서에 기술된 방법은 게놈 및 염색질 입체 배좌 서열 데이터 둘 모두를 입수하기 위해서 바이오틴 필-인(fill-in) 또는 바이오틴 풀-다운(pull-down)이 필요하지 않다.
가교결합 세포에 대한 상태를 평가하여 세포를 가교결합시키고, 핵 온전성을 유지하는 데 필요한 폼알데하이드의 최소 농도를 결정하였다. HeLa 세포를 0.2%, 0.35%, 1.5%에서 폼알데하이드에 노출시키거나, 또는 폼알데하이드에 노출시키지 않음으로써 세포를 가교결합시키고, 도 34에 기술된 방법의 단축 버전을 수행하고, 생성된 핵의 수를 결정하였다.
어떠한 무손상 핵도 폼알데하이드에 노출되지 않은 세포 및 0.2% 폼알데하이드에 노출된 세포로부터 단리되지 않았다. 0.35% 폼알데하이드에 노출된 세포는 정상 모폴로지를 갖는 3.8 x 105개의 핵을 산출하였고, 1.5% 폼알데하이드에 노출된 세포는 정상 모폴로지를 갖는 6.4 x 105개의 핵을 산출하였다.
가교결합을 반전시키기 위한 조건을 또한 평가하였다. HeLa 세포를 0.35%, 0.75%, 1.5%에서 폼알데하이드에 노출시키거나, 또는 폼알데하이드에 노출시키지 않음으로써 세포를 가교결합시키고, 도 34에 기술된 방법의 단축 버전을 수행하였다. 단리된 핵을 68℃에서 1 시간 또는 16시간 동안 인큐베이션시킴으로써 가교결합을 반전시켰다(도 35).
이 데이터는, 68℃에서 1시간 인큐베이션의 반전 조건과 함께 0.35% 폼알데하이드를 사용하는 것이 최상임을 나타낸다.
서열결정된 sci-GCC 라이브러리로부터 실시예 1 및 2 및 도 35에 기술된 방법에서와 같이 대등한 고유 판독 수치 게놈 폭이 수득될 수 있다. 게놈 서열 판독물에 더하여, 서열 판독물의 5% 내지 15%는 문헌[Nagano et al., (2013, Nature, 502:59-64)]에 기술된 바와 같이 염색질 입체 배좌 신호의 특징인 키메라 결찰 정션을 함유하였다. 평균적으로, 본 발명자들은 기존의 단일 세포 HiC 전략(예를 들어, 문헌[Nagano et al., 2013, Nature, 502:59-64] 참고)과 비교하는 경우 증가된 고유 키메라 결찰 정션 판독 수치를 얻었고, 평균 고유 키메라 결찰 정션 판독 수치는 가교결합 최적화 제제에서 세포당 40,000을 초과한다. HeLa에 대해서, 이러한 라이브러리는 HeLa 내의 공지된 전좌를 비롯하여, 염색질 구조를 명확하게 식별하기에 충분한 키메라 결찰 정션 판독물을 산출하였다(도 36).
본 명세서에 인용된 모든 특허, 특허 출원 및 간행물 및 전자적으로 입수 가능한 자료(예를 들어, 예를 들어, GenBank 및 RefSeq에서의 뉴클레오타이드 서열 제출물, 및 예를 들어, SwissProt, PIR, PRF, PDB에서의 아미노산 서열 제출물, GenBank 및 RefSeq에서의 주석이 달린 암호 영역으로부터의 번역물)의 완전한 개시내용은 이들의 전문이 참고로 포함된다. 간행물에 언급된 보완 자료(예컨대, 보완 표, 보완 도면, 보완 자료 및 방법, 및/또는 보완 실험 데이터)는 마찬가지로 이들의 전문이 참고로 포함된다. 본 출원의 개시내용과 본 명세서에 참고로 포함된 임의의 문서의 개시내용 간에 불일치가 존재하는 경우, 본 출원의 개시내용이 우선해야 한다. 상기 상세한 설명 및 실시예는 단지 이해의 명확성을 제공한다. 불필요한 제한은 이로부터 이해되지 않아야 한다. 본 발명은 도시되고 기술된 정확한 상세사항에 제한되지 않고, 관련 기술 분야의 통상의 기술자에게 자명한 변형이 청구범위에 의해서 정의된 본 발명에 포함될 것이다.
달리 지시되지 않는 한, 명세서 및 청구범위에서 사용된 성분의 양, 분자량 등을 표현하는 모든 수치는 모든 경우에 용어 "약"에 의해서 수식되는 것으로 이해되어야 한다. 따라서, 반대로 지시되지 않는 한, 명세서 및 청구범위에서 언급된 수치 파라미터는 본 발명에 의해서 수득하고자 하는 목적하는 특성에 따라서 달라질 수 있는 근사치이다. 적어도 그리고 청구범위의 범주에 동등한 교리를 제한하려는 시도가 아니지만, 각각의 수치 파라미터는 적어도 보고된 유효 자릿수에 비추어 그리고 통상적인 반올림 기법을 적용함으로써 해석되어야 한다.
본 발명의 넓은 범주를 설명하는 수치 범위 및 파라미터가 근사치임에도 불구하고, 구체적인 실시예에 언급된 수치는 가능한 한 정확하게 보고된다. 그러나 모든 수치 값은 본질적으로 각각의 시험 측정치에서 발견 된 표준 편차에서 필연적으로 발생하는 범위를 함유한다.
모든 제목은 편의를 위한 것이며, 달리 그렇게 명시되지 않는 한 제목을 따르는 문맥의 의미를 제한하기 위해서 사용되지 않아야 한다.
SEQUENCE LISTING <110> Illumina, Inc. Oregon Health & Science University <120> SINGLE CELL WHOLE GENOME LIBRARIES AND COMBINATORIAL INDEXING METHODS OF MAKING THEREOF <130> WO/2018/018008 <140> PCT/US2017/043381 <141> 2018-01-25 <150> US 62/451,305 <151> 2017-01-27 <150> US 62/365,916 <151> 2016-07-22 <160> 145 <170> PatentIn version 3.5 <210> 1 <211> 19 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 1 ctgtctctta tacacatct 19 <210> 2 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 2 tcgtcggcag cgtctccacg ctatagcctg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 3 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 3 tcgtcggcag cgtctccacg catagaggcg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 4 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 4 tcgtcggcag cgtctccacg ccctatcctg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 5 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 5 tcgtcggcag cgtctccacg cggctctgag cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 6 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 6 tcgtcggcag cgtctccacg caggcgaagg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 7 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 7 tcgtcggcag cgtctccacg ctaatcttag cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 8 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 8 tcgtcggcag cgtctccacg ccaggacgtg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 9 <211> 63 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 9 tcgtcggcag cgtctccacg cgtactgacg cgatcgagga cggcagatgt gtataagaga 60 cag 63 <210> 10 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 10 gtctcgtggg ctcggctgtc cctgtcccga gtaatcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 11 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 11 gtctcgtggg ctcggctgtc cctgtcctct ccggacaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 12 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 12 gtctcgtggg ctcggctgtc cctgtccaat gagcgcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 13 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 13 gtctcgtggg ctcggctgtc cctgtccgga atctccaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 14 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 14 gtctcgtggg ctcggctgtc cctgtccttc tgaatcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 15 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 15 gtctcgtggg ctcggctgtc cctgtccacg aattccaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 16 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 16 gtctcgtggg ctcggctgtc cctgtccagc ttcagcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 17 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 17 gtctcgtggg ctcggctgtc cctgtccgcg cattacaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 18 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 18 gtctcgtggg ctcggctgtc cctgtcccat agccgcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 19 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 19 gtctcgtggg ctcggctgtc cctgtccttc gcggacaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 20 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 20 gtctcgtggg ctcggctgtc cctgtccgcg cgagacaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 21 <211> 69 <212> DNA <213> Artificial <220> <223> tagmentation oligonucleotide <400> 21 gtctcgtggg ctcggctgtc cctgtcccta tcgctcaccg tctccgcctc agatgtgtat 60 aagagacag 69 <210> 22 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 22 caagcagaag acggcatacg agataatgcc gcttgtctcg tgggctcgg 49 <210> 23 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 23 caagcagaag acggcatacg agattataga cgcagtctcg tgggctcgg 49 <210> 24 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 24 caagcagaag acggcatacg agattcaatc gcatgtctcg tgggctcgg 49 <210> 25 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 25 caagcagaag acggcatacg agatttctta ataagtctcg tgggctcgg 49 <210> 26 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 26 caagcagaag acggcatacg agatgtccta gagggtctcg tgggctcgg 49 <210> 27 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 27 caagcagaag acggcatacg agatatattg atacgtctcg tgggctcgg 49 <210> 28 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 28 caagcagaag acggcatacg agatccgctg ccaggtctcg tgggctcgg 49 <210> 29 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 29 caagcagaag acggcatacg agatcctagt acgtgtctcg tgggctcgg 49 <210> 30 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 30 caagcagaag acggcatacg agatcaatta ccgtgtctcg tgggctcgg 49 <210> 31 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 31 caagcagaag acggcatacg agatggccgt agtcgtctcg tgggctcgg 49 <210> 32 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 32 caagcagaag acggcatacg agatcgatta cggcgtctcg tgggctcgg 49 <210> 33 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 33 caagcagaag acggcatacg agattaatga acgagtctcg tgggctcgg 49 <210> 34 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 34 caagcagaag acggcatacg agatccgttc cttagtctcg tgggctcgg 49 <210> 35 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 35 caagcagaag acggcatacg agatggtacc atatgtctcg tgggctcgg 49 <210> 36 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 36 caagcagaag acggcatacg agatccgatt cgcagtctcg tgggctcgg 49 <210> 37 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 37 caagcagaag acggcatacg agatatggct ctgcgtctcg tgggctcgg 49 <210> 38 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 38 caagcagaag acggcatacg agatgtataa tacggtctcg tgggctcgg 49 <210> 39 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 39 caagcagaag acggcatacg agatatcagc aagtgtctcg tgggctcgg 49 <210> 40 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 40 caagcagaag acggcatacg agatggcgaa ctcggtctcg tgggctcgg 49 <210> 41 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 41 caagcagaag acggcatacg agatttaatt gaatgtctcg tgggctcgg 49 <210> 42 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 42 caagcagaag acggcatacg agatttagga ccgggtctcg tgggctcgg 49 <210> 43 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 43 caagcagaag acggcatacg agataagtaa gagcgtctcg tgggctcgg 49 <210> 44 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 44 caagcagaag acggcatacg agatccttgg tccagtctcg tgggctcgg 49 <210> 45 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 45 caagcagaag acggcatacg agatcatcag aatggtctcg tgggctcgg 49 <210> 46 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 46 caagcagaag acggcatacg agatttatag cagagtctcg tgggctcgg 49 <210> 47 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 47 caagcagaag acggcatacg agatttactt ggaagtctcg tgggctcgg 49 <210> 48 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 48 caagcagaag acggcatacg agatgctcag ccgggtctcg tgggctcgg 49 <210> 49 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 49 caagcagaag acggcatacg agatacgtcc gcaggtctcg tgggctcgg 49 <210> 50 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 50 caagcagaag acggcatacg agatttgact gacggtctcg tgggctcgg 49 <210> 51 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 51 caagcagaag acggcatacg agatttgcga ggcagtctcg tgggctcgg 49 <210> 52 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 52 caagcagaag acggcatacg agatttccaa ccgcgtctcg tgggctcgg 49 <210> 53 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 53 caagcagaag acggcatacg agattaacct tcgggtctcg tgggctcgg 49 <210> 54 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 54 caagcagaag acggcatacg agattcaagc cgatgtctcg tgggctcgg 49 <210> 55 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 55 caagcagaag acggcatacg agatcttgca acctgtctcg tgggctcgg 49 <210> 56 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 56 caagcagaag acggcatacg agatccatcg cgaagtctcg tgggctcgg 49 <210> 57 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 57 caagcagaag acggcatacg agattagact tcttgtctcg tgggctcgg 49 <210> 58 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 58 caagcagaag acggcatacg agattgcgcg atgcgtctcg tgggctcgg 49 <210> 59 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 59 caagcagaag acggcatacg agatattgag attggtctcg tgggctcgg 49 <210> 60 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 60 caagcagaag acggcatacg agatttgata tattgtctcg tgggctcgg 49 <210> 61 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 61 caagcagaag acggcatacg agatcggtag gaatgtctcg tgggctcgg 49 <210> 62 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 62 caagcagaag acggcatacg agataccagc gcaggtctcg tgggctcgg 49 <210> 63 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 63 caagcagaag acggcatacg agatcgaatg agctgtctcg tgggctcgg 49 <210> 64 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 64 caagcagaag acggcatacg agatagttcg agtagtctcg tgggctcgg 49 <210> 65 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 65 caagcagaag acggcatacg agatttggac gctggtctcg tgggctcgg 49 <210> 66 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 66 caagcagaag acggcatacg agatatagac tagggtctcg tgggctcgg 49 <210> 67 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 67 caagcagaag acggcatacg agattatagt aagcgtctcg tgggctcgg 49 <210> 68 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 68 caagcagaag acggcatacg agatcggtcg ttaagtctcg tgggctcgg 49 <210> 69 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 69 caagcagaag acggcatacg agatatggcg gatcgtctcg tgggctcgg 49 <210> 70 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 70 caagcagaag acggcatacg agatctctga tcaggtctcg tgggctcgg 49 <210> 71 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 71 caagcagaag acggcatacg agatggccag tccggtctcg tgggctcgg 49 <210> 72 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 72 caagcagaag acggcatacg agatcggaag atatgtctcg tgggctcgg 49 <210> 73 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 73 caagcagaag acggcatacg agattggctg atgagtctcg tgggctcgg 49 <210> 74 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 74 caagcagaag acggcatacg agatgaaggt tgccgtctcg tgggctcgg 49 <210> 75 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 75 caagcagaag acggcatacg agatgttgaa ggatgtctcg tgggctcgg 49 <210> 76 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 76 caagcagaag acggcatacg agatccattc gtaagtctcg tgggctcgg 49 <210> 77 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 77 caagcagaag acggcatacg agattgcgcc agaagtctcg tgggctcgg 49 <210> 78 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 78 caagcagaag acggcatacg agatcgaata attcgtctcg tgggctcgg 49 <210> 79 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 79 caagcagaag acggcatacg agatgcgacg ccttgtctcg tgggctcgg 49 <210> 80 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 80 caagcagaag acggcatacg agatatcaac gattgtctcg tgggctcgg 49 <210> 81 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 81 caagcagaag acggcatacg agatgttctg aattgtctcg tgggctcgg 49 <210> 82 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 82 caagcagaag acggcatacg agatgctaac ctcagtctcg tgggctcgg 49 <210> 83 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 83 caagcagaag acggcatacg agatcaagca actggtctcg tgggctcgg 49 <210> 84 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 84 caagcagaag acggcatacg agatggagcg gccggtctcg tgggctcgg 49 <210> 85 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 85 caagcagaag acggcatacg agatcgcgta cgacgtctcg tgggctcgg 49 <210> 86 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 86 caagcagaag acggcatacg agatcgatgg cgccgtctcg tgggctcgg 49 <210> 87 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 87 caagcagaag acggcatacg agattggtat tcatgtctcg tgggctcgg 49 <210> 88 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 88 caagcagaag acggcatacg agatgataag gcaagtctcg tgggctcgg 49 <210> 89 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 89 caagcagaag acggcatacg agatgccggt cgaggtctcg tgggctcgg 49 <210> 90 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 90 caagcagaag acggcatacg agattgcgcc atctgtctcg tgggctcgg 49 <210> 91 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 91 caagcagaag acggcatacg agataagtct tccggtctcg tgggctcgg 49 <210> 92 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 92 caagcagaag acggcatacg agatagactc aagcgtctcg tgggctcgg 49 <210> 93 <211> 49 <212> DNA <213> Artificial <220> <223> PCR primer <400> 93 caagcagaag acggcatacg agatgcaggc gacggtctcg tgggctcgg 49 <210> 94 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 94 aatgatacgg cgaccaccga gatctacacg tccttaagat cgtcggcagc gtc 53 <210> 95 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 95 aatgatacgg cgaccaccga gatctacaca gtaacggtct cgtcggcagc gtc 53 <210> 96 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 96 aatgatacgg cgaccaccga gatctacacg ttcgtcagat cgtcggcagc gtc 53 <210> 97 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 97 aatgatacgg cgaccaccga gatctacacc gcctaatgct cgtcggcagc gtc 53 <210> 98 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 98 aatgatacgg cgaccaccga gatctacaca ccggaattat cgtcggcagc gtc 53 <210> 99 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 99 aatgatacgg cgaccaccga gatctacact aggccatagt cgtcggcagc gtc 53 <210> 100 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 100 aatgatacgg cgaccaccga gatctacact aactcttagt cgtcggcagc gtc 53 <210> 101 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 101 aatgatacgg cgaccaccga gatctacact atgagttaat cgtcggcagc gtc 53 <210> 102 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 102 aatgatacgg cgaccaccga gatctacact atcatgatct cgtcggcagc gtc 53 <210> 103 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 103 aatgatacgg cgaccaccga gatctacacg agcatatggt cgtcggcagc gtc 53 <210> 104 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 104 aatgatacgg cgaccaccga gatctacact aacgatccat cgtcggcagc gtc 53 <210> 105 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 105 aatgatacgg cgaccaccga gatctacacc ggcgtaactt cgtcggcagc gtc 53 <210> 106 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 106 aatgatacgg cgaccaccga gatctacacc gtcgcagcct cgtcggcagc gtc 53 <210> 107 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 107 aatgatacgg cgaccaccga gatctacacg tagctccatt cgtcggcagc gtc 53 <210> 108 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 108 aatgatacgg cgaccaccga gatctacact tgccttggct cgtcggcagc gtc 53 <210> 109 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 109 aatgatacgg cgaccaccga gatctacact gctaattctt cgtcggcagc gtc 53 <210> 110 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 110 aatgatacgg cgaccaccga gatctacacg tcctacttgt cgtcggcagc gtc 53 <210> 111 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 111 aatgatacgg cgaccaccga gatctacacg gtaggttagt cgtcggcagc gtc 53 <210> 112 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 112 aatgatacgg cgaccaccga gatctacacg agcatcattt cgtcggcagc gtc 53 <210> 113 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 113 aatgatacgg cgaccaccga gatctacacc cgctccggct cgtcggcagc gtc 53 <210> 114 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 114 aatgatacgg cgaccaccga gatctacact tcttccggtt cgtcggcagc gtc 53 <210> 115 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 115 aatgatacgg cgaccaccga gatctacaca ggagagaact cgtcggcagc gtc 53 <210> 116 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 116 aatgatacgg cgaccaccga gatctacact aactcaattt cgtcggcagc gtc 53 <210> 117 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 117 aatgatacgg cgaccaccga gatctacaca ctataggttt cgtcggcagc gtc 53 <210> 118 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 118 aatgatacgg cgaccaccga gatctacact aacgaattgt cgtcggcagc gtc 53 <210> 119 <211> 53 <212> DNA <213> PCR primer <400> 119 aatgatacgg cgaccaccga gatctacact gagaaccaat cgtcggcagc gtc 53 <210> 120 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 120 aatgatacgg cgaccaccga gatctacact tattctgagt cgtcggcagc gtc 53 <210> 121 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 121 aatgatacgg cgaccaccga gatctacact tattatggtt cgtcggcagc gtc 53 <210> 122 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 122 aatgatacgg cgaccaccga gatctacaca tatgagccat cgtcggcagc gtc 53 <210> 123 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 123 aatgatacgg cgaccaccga gatctacacc aaccagtact cgtcggcagc gtc 53 <210> 124 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 124 aatgatacgg cgaccaccga gatctacacc atccgactat cgtcggcagc gtc 53 <210> 125 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 125 aatgatacgg cgaccaccga gatctacaca tcatggctgt cgtcggcagc gtc 53 <210> 126 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 126 aatgatacgg cgaccaccga gatctacacc cgcaagttct cgtcggcagc gtc 53 <210> 127 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 127 aatgatacgg cgaccaccga gatctacacc ttctcattgt cgtcggcagc gtc 53 <210> 128 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 128 aatgatacgg cgaccaccga gatctacacc aggaggagat cgtcggcagc gtc 53 <210> 129 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 129 aatgatacgg cgaccaccga gatctacacg atatcggcgt cgtcggcagc gtc 53 <210> 130 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 130 aatgatacgg cgaccaccga gatctacacc cagtcctctt cgtcggcagc gtc 53 <210> 131 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 131 aatgatacgg cgaccaccga gatctacacc atagttcggt cgtcggcagc gtc 53 <210> 132 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 132 aatgatacgg cgaccaccga gatctacacc gtaatgcagt cgtcggcagc gtc 53 <210> 133 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 133 aatgatacgg cgaccaccga gatctacacc cgttcggatt cgtcggcagc gtc 53 <210> 134 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 134 aatgatacgg cgaccaccga gatctacacc cataagtcct cgtcggcagc gtc 53 <210> 135 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 135 aatgatacgg cgaccaccga gatctacacg gcaatgagat cgtcggcagc gtc 53 <210> 136 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 136 aatgatacgg cgaccaccga gatctacacc ggttatgcct cgtcggcagc gtc 53 <210> 137 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 137 aatgatacgg cgaccaccga gatctacact ggccggcctt cgtcggcagc gtc 53 <210> 138 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 138 aatgatacgg cgaccaccga gatctacaca gctgcaatat cgtcggcagc gtc 53 <210> 139 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 139 aatgatacgg cgaccaccga gatctacact ggccatgcat cgtcggcagc gtc 53 <210> 140 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 140 aatgatacgg cgaccaccga gatctacact gacgctccgt cgtcggcagc gtc 53 <210> 141 <211> 53 <212> DNA <213> Artificial <220> <223> PCR primer <400> 141 aatgatacgg cgaccaccga gatctacaca actgctgcct cgtcggcagc gtc 53 <210> 142 <211> 34 <212> DNA <213> Artificial <220> <223> sequencing primer <400> 142 gcgatcgagg acggcagatg tgtataagag acag 34 <210> 143 <211> 34 <212> DNA <213> Artificial <220> <223> sequencing primer <400> 143 caccgtctcc gcctcagatg tgtataagag acag 34 <210> 144 <211> 34 <212> DNA <213> Artificial <220> <223> sequencing primer <400> 144 ctgtctctta tacacatctg aggcggagac ggtg 34 <210> 145 <211> 34 <212> DNA <213> Artificial <220> <223> sequencing primer <400> 145 ctgtctctta tacacatctg ccgtcctcga tcgc 34

Claims (35)

  1. 복수의 단일 세포로부터 핵산을 포함하는 서열결정 라이브러리를 제조하는 방법으로서,
    (a) 복수의 세포로부터 단리된 핵을 제공하는 단계;
    (b) 상기 단리된 핵을 가역적 가교결합제로 처리하는 단계;
    (c) 상기 단리된 핵을 화학 처리에 적용하여 상기 단리된 핵의 온전성을 유지시키면서 뉴클레오솜-고갈된 핵을 생성시키는 단계;
    (d) 상기 단리된 핵 내 DNA를 소화(digest)시키는 단계;
    (e) 상기 단리된 핵을 리가아제로 처리하는 단계;
    (f) 상기 뉴클레오솜-고갈된 핵의 하위세트를 제1 복수의 구획 내로 분배시키고, 각각의 하위세트를 트랜스포좀(transposome) 복합체와 접촉시키는 단계로서, 각각의 구획 내의 상기 트랜스포좀 복합체는 트랜스포사제(transposase) 및 다른 구획 내의 제1 인덱스(index) 서열과 상이한 제1 인덱스 서열을 포함하는, 상기 접촉시키는 단계;
    (g) 상기 뉴클레오솜-고갈된 핵의 하위세트 내의 핵산을 복수의 핵산 단편으로 단편화시키고, 상기 제1 인덱스 서열을 상기 핵산 단편의 적어도 하나의 가닥 내에 혼입시켜 인덱싱된 핵산 단편을 포함하는 인덱싱된 핵을 생성시키는 단계로서, 상기 인덱싱된 핵산 단편은 상기 트랜스포사제에 부착된 채로 유지되는, 상기 인덱싱된 핵을 생성시키는 단계;
    (h) 상기 인덱싱된 핵을 조합하여 풀링된 인덱싱된 핵을 생성시키는 단계;
    (i) 상기 풀링된 인덱싱된 핵의 하위세트를 제2 복수의 구획 내에 분배시키는 단계;
    (j) 상기 가교결합을 반전시키는 단계;
    (k) 각각의 구획 내의 상기 인덱싱된 핵산 단편 내에 제2 인덱스 서열을 혼입시켜 이중-인덱스 단편을 생성시키는 단계로서, 각각의 구획 내의 상기 제2 인덱스 서열은 다른 구획 내의 제2 인덱스 서열과 상이한, 상기 이중-인덱스 단편을 생성시키는 단계;
    (l) 상기 이중-인덱스 단편을 조합함으로써 상기 복수의 단일 세포로부터 전체 게놈 핵산을 포함하는 서열결정 라이브러리를 생산하는 단계를 포함하는, 서열결정 라이브러리를 제조하는 방법.
  2. 제1항에 있어서, 상기 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는 카오트로픽제(chaotropic agent)로의 처리를 포함하는, 서열결정 라이브러리를 제조하는 방법.
  3. 제2항에 있어서, 상기 카오트로픽제는 리튬 3,5-다이아이오도살리실산을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  4. 제1항에 있어서, 상기 화학 처리는 핵산-단백질 상호작용을 방해할 수 있는 세정제로의 처리를 포함하는, 서열결정 라이브러리를 제조하는 방법.
  5. 제4항에 있어서, 상기 세정제는 소듐 도데실 설페이트(SDS)를 포함하는, 서열결정 라이브러리를 제조하는 방법.
  6. 제1항에 있어서, 상기 가역적 가교결합제는 폼알데하이드인, 서열결정 라이브러리를 제조하는 방법.
  7. 제6항에 있어서, 상기 폼알데하이드의 농도는 약 0.2% 내지 약 2% 범위인, 서열결정 라이브러리를 제조하는 방법.
  8. 제7항에 있어서, 상기 폼알데하이드의 농도는 약 1.5% 이하인, 서열결정 라이브러리를 제조하는 방법.
  9. 제6항에 있어서, 상기 가교결합의 상기 반전은 약 55℃ 내지 약 72℃에서 인큐베이션시키는 것을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  10. 제9항에 있어서, 상기 트랜스포사제는 상기 가교결합의 상기 반전 이전에 상기 인덱싱된 핵산 단편으로부터 해리되는, 서열결정 라이브러리를 제조하는 방법.
  11. 제10항에 있어서, 상기 트랜스포사제는 소듐 도데실 설페이트(SDS)를 사용하여 상기 인덱싱된 핵산 단편으로부터 해리되는, 서열결정 라이브러리를 제조하는 방법.
  12. 제1항에 있어서, 상기 소화는 제한 효소로 처리하는 것을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  13. 제1항에 있어서,
    i. 단계 (f) 및 (i)에서의 상기 분배는 형광-활성화된 핵 분류에 의해서 수행되거나,
    ii. 뉴클레오솜이 고갈된 핵의 하위 세트는 대략 동일한 수의 핵을 포함하거나,
    iii. 제1 복수의 구획은 다중-웰 플레이트이거나,
    iv. 풀링된 인덱싱된 핵의 하위 세트는 거의 동일한 수의 핵을 포함하거나,
    v. 풀링된 인덱싱된 핵의 하위 세트는 뉴클레오솜-고갈된 핵의 하위 세트보다 10배 이상 적은 수의 핵을 포함하거나,
    vi. 풀리된 인덱싱된 핵의 하위 세트는 뉴클레오솜-고갈된 핵의 하위 세트보다 100배 이상 적은 수의 핵을 포함하거나,
    vii. 제2 복수의 구획은 다중-웰 플레이트이거나,
    ⅷ. 단계 (f)는 뉴클레오솜-고갈된 핵의 하위 세트가 분배된 후 구획들에 트랜스포솜 복합체를 추가하는 것을 포함하거나, 또는
    ix. 각각의 트랜스포솜 복합체는 트랜스포존을 포함하고, 각각의 트랜스포존은 전달 가닥을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  14. 제1항에 있어서, 상기 뉴클레오솜-고갈된 핵의 하위 세트는 대략 동일한 수의 핵을 포함하고, 상기 뉴클레오솜-고갈된 핵의 하위 세트는 1 내지 약 2000개의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  15. 제1항에 있어서, 상기 제1 복수의 구획은 다중-웰 플레이트이고, 상기 다중-웰 플레이트는 96-웰 플레이트 또는 384-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
  16. 제1항에 있어서, 상기 풀링된 인덱싱된 핵의 하위 세트는 대략 동일한 수의 핵을 포함하고, 상기 풀링된 인덱싱된 핵의 하위 세트는 1 내지 약 25개의 핵을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  17. 제1항에 있어서, 상기 제2 복수의 구획은 다중-웰 플레이트이고,상기 다중-웰 플레이트는 96-웰 플레이트 또는 384-웰 플레이트인, 서열결정 라이브러리를 제조하는 방법.
  18. 제1항에 있어서, 각각의 트랜스포솜 복합체는 트랜스포존을 포함하고, 각각의 트랜스포존은 전달 가닥을 포함하며, 상기 전달 가닥은 상기 제1 인덱스 서열 및 제1 범용(universal) 서열을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  19. 제18항에 있어서, 단계 (k)에서 상기 제2 인덱스 서열의 상기 혼입은 각각의 구획 내의 상기 인덱싱된 핵산 단편을, 각각 인덱스 서열을 포함하고, 각각 제1 범용 서열의 일부와 동일하거나 이에 상보성인 서열을 포함하는 제1 범용 프라이머 및 제2 범용 프라이머와 접촉시키고, 지수적 증폭 반응을 수행하는 것을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  20. 제19항에 있어서,
    i. 상기 제1 범용 프라이머의 인덱스 서열은 상기 제2 범용 프라이머의 인덱스 서열의 역 상보체(reverse complement)이거나,
    ii. 상기 제1 범용 프라이머의 인덱스 서열은 상기 제2 범용 프라이머의 인덱스 서열의 역 상보체와 상이하거나,
    iii. 상기 제1 범용 프라이머는 상기 이중-인덱스 단편의 3' 말단에서 범용 서열에 상보성인 제1 앵커(anchor) 서열 및 제1 포획(capture) 서열을 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
  21. 제19항 또는 제20항에 있어서, 상기 제1 포획 서열은 P5 프라이머 서열을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  22. 제19항에 있어서, 상기 제2 범용 프라이머는 상기 이중-인덱스 단편의 5' 말단에서 범용 서열에 상보성인 제2 앵커 서열 및 제2 포획 서열을 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
  23. 제22항에 있어서, 상기 제2 포획 서열은 P7 프라이머 서열의 역 상보체를 포함하는, 서열결정 라이브러리를 제조하는 방법.
  24. 제19항에 있어서, 상기 지수적 증폭 반응은 중합효소 연쇄 반응(PCR)을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  25. 제24항에 있어서, 상기 PCR은 15 내지 30회 사이클을 포함하는, 서열결정 라이브러리를 제조하는 방법.
  26. 제1항에 있어서, 상기 이중-인덱스 단편에 대해서 특이성을 갖는 복수의 포획 올리고뉴클레오타이드를 사용한 이중-인덱스 단편의 풍부화를 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
  27. 제26항에 있어서, 상기 포획 올리고뉴클레오타이드는 고체 기질의 표면 상에 고정된, 서열결정 라이브러리를 제조하는 방법.
  28. 제26항 또는 제27항에 있어서, 상기 포획 올리고뉴클레오타이드는 범용 결합쌍의 제1 구성원을 포함하되, 상기 결합쌍의 제2 구성원은 고체 기질의 표면 상에 고정된, 서열결정 라이브러리를 제조하는 방법.
  29. 제1항에 있어서, 상기 이중-인덱스 단편을 서열결정하여 복수의 단일 세포로부터 상기 핵산의 뉴클레오타이드 서열을 결정하는 단계를 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
  30. 제29항에 있어서,
    복수의 증폭 부위를 포함하는 표면을 제공하는 단계로서, 상기 증폭 부위는 자유 3' 단부를 갖는 부착된 단일 가닥 포획 올리고클레오타이드의 적어도 2개의 집단을 포함하는, 상기 표면을 제공하는 단계, 및
    상기 증폭 부위를 포함하는 표면을, 각각 개별 이중-인덱스 단편으로부터의 앰플리콘의 클론성 집단을 포함하는 복수의 증폭 부위를 생성시키기에 적합한 조건 하에서 상기 이중-인덱스 단편과 접촉시키는 단계를 더 포함하는, 서열결정 라이브러리를 제조하는 방법.
  31. 제42항 또는 제43항에 있어서, 상기 이중-인덱스 단편의 수는 증폭 부위의 수를 초과하되, 상기 이중-인덱스 단편은 상기 증폭 부위에 대한 유체 접근부를 갖고, 그리고 상기 증폭 부위 각각은 상기 서열결정 라이브러리 내에 몇몇 이중-인덱스 단편을 위한 용량(capacity)을 갖는, 서열결정 라이브러리를 제조하는 방법.
  32. 제30항에 있어서, 상기 접촉시키는 단계는 동시에 (i) 상기 이중-인덱스 단편을 평균 수송 속도로 상기 증폭 부위로 수송하는 단계, 및 (ii) 상기 증폭 부위에 존재하는 상기 이중-인덱스 단편을 평균 증폭 속도로 증폭시키는 단계를 포함하되, 상기 평균 증폭 속도는 상기 평균 수송 속도를 초과하는, 서열결정 라이브러리를 제조하는 방법.
  33. 화학적으로 처리된 뉴클레오솜-고갈된 단리된 핵을 포함하는 조성물로서, 상기 단리된 핵은 오버행을 포함하는 절단된 제한 부위에서 종결되는 인덱싱된 핵산 단편을 포함하는 조성물.
  34. 제33항에 있어서, 상기 단리된 핵은 재배열된 게놈 DNA를 포함하는, 조성물.
  35. 다중-웰 플레이트로서, 상기 다중-웰 플레이트의 웰은 제33항 또는 제34항의 조성물을 포함하는, 다중-웰 플레이트.
KR1020227042588A 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법 KR20230003255A (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201662365916P 2016-07-22 2016-07-22
US62/365,916 2016-07-22
US201762451305P 2017-01-27 2017-01-27
US62/451,305 2017-01-27
PCT/US2017/043381 WO2018018008A1 (en) 2016-07-22 2017-07-21 Single cell whole genome libraries and combinatorial indexing methods of making thereof
KR1020187038171A KR102475710B1 (ko) 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020187038171A Division KR102475710B1 (ko) 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법

Publications (1)

Publication Number Publication Date
KR20230003255A true KR20230003255A (ko) 2023-01-05

Family

ID=60988232

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020227042588A KR20230003255A (ko) 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
KR1020187038171A KR102475710B1 (ko) 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020187038171A KR102475710B1 (ko) 2016-07-22 2017-07-21 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법

Country Status (12)

Country Link
US (2) US11535883B2 (ko)
EP (2) EP3488002B1 (ko)
JP (2) JP7155021B2 (ko)
KR (2) KR20230003255A (ko)
CN (2) CN110268059B (ko)
AU (2) AU2017299803B2 (ko)
CA (1) CA3026773C (ko)
DK (1) DK3488002T3 (ko)
ES (1) ES2873723T3 (ko)
IL (1) IL263920B2 (ko)
SG (1) SG11201811504PA (ko)
WO (1) WO2018018008A1 (ko)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP2697397B1 (en) 2011-04-15 2017-04-05 The Johns Hopkins University Safe sequencing system
ES2886507T3 (es) 2012-10-29 2021-12-20 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
ES2922624T3 (es) 2017-03-13 2022-09-19 Gigagen Inc Sistemas y métodos para el análisis combinatorio paralelo masivo de células individuales
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
KR102640255B1 (ko) * 2018-05-17 2024-02-27 일루미나, 인코포레이티드 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
KR102393414B1 (ko) * 2018-06-04 2022-05-02 일루미나, 인코포레이티드 고속 대량 단일 세포 전사체 라이브러리 그리고 이의 제조 및 사용 방법
EP3830262A1 (en) * 2018-08-03 2021-06-09 Becton Dickinson and Company Nuclei barcoding and capture in single cells
EP3841219A4 (en) * 2018-08-24 2022-05-04 Swift Biosciences, Inc. ASYMMETRICAL TARGETED AMPLIFICATION METHODS
US10704094B1 (en) 2018-11-14 2020-07-07 Element Biosciences, Inc. Multipart reagents having increased avidity for polymerase binding
US10876148B2 (en) * 2018-11-14 2020-12-29 Element Biosciences, Inc. De novo surface preparation and uses thereof
WO2020102766A2 (en) * 2018-11-15 2020-05-22 Element Biosciences, Inc. Methods for generating circular nucleic acid molecules
WO2020114918A1 (en) 2018-12-05 2020-06-11 Illumina Cambridge Limited Methods and compositions for cluster generation by bridge amplification
SG11202012807YA (en) 2018-12-18 2021-01-28 Illumina Cambridge Ltd Methods and compositions for paired end sequencing using a single surface primer
PT3899037T (pt) 2018-12-19 2023-12-22 Illumina Inc Métodos para melhorar a prioridade de clonalidade de agrupamento polinucleotídico
BR112021006234A2 (pt) 2019-03-01 2021-09-28 Illumina, Inc. Bibliotecas de células únicas e núcleos únicos de alto rendimento e métodos de preparo e uso
CN114174532A (zh) * 2019-04-05 2022-03-11 德克萨斯大学系统董事会 细胞条形码编码的方法和应用
JP2022530584A (ja) 2019-04-29 2022-06-30 イルミナ インコーポレイティッド 迅速なインキュベーション及び核酸富化による微生物試料の同定及び分析
US11535891B2 (en) 2019-05-03 2022-12-27 The Regents Of The University Of California Barcoded solid supports and methods of making and using same
WO2021011433A1 (en) * 2019-07-12 2021-01-21 New York Genome Center, Inc Methods and compositions for scalable pooled rna screens with single cell chromatin accessibility profiling
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN110952147B (zh) * 2019-12-18 2023-05-05 南方科技大学 单细胞基因组测序用的dna文库的构建方法
JP2023508792A (ja) * 2019-12-19 2023-03-06 イルミナ インコーポレイテッド ハイスループット単一細胞ライブラリー、並びに製造方法及び使用方法
WO2021168097A1 (en) * 2020-02-19 2021-08-26 Genapsys, Inc. Methods and systems for nucleic acid processing
CN115768884A (zh) * 2020-03-20 2023-03-07 使命生物公司 用于全基因组扩增的单细胞工作流程
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
CN111996598A (zh) * 2020-08-11 2020-11-27 杭州瀚因生命科技有限公司 一种单细胞染色质可及性的建库方法
CA3187250A1 (en) * 2020-08-14 2022-02-17 John Daniel WELLS In situ library preparation for sequencing
CN112280828A (zh) * 2020-10-22 2021-01-29 上海交通大学医学院 一种降低单细胞扩增偏倚性的离体组织细胞核分离方法
CN112309500A (zh) * 2020-10-30 2021-02-02 广州序科码生物技术有限责任公司 一种基于单细胞测序数据唯一片段序列捕获方法
WO2022109207A2 (en) 2020-11-19 2022-05-27 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Massively paralleled multi-patient assay for pathogenic infection diagnosis and host physiology surveillance using nucleic acid sequencing
CN114686564B (zh) * 2020-12-31 2023-10-24 深圳华大生命科学研究院 一种适用于微量样本的dna样本制备方法
CN114836838A (zh) * 2021-02-01 2022-08-02 南方医科大学 一种中通量单细胞拷贝数文库构建的方法及其应用
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
WO2022188054A1 (en) * 2021-03-10 2022-09-15 Nanjing University Methods and reagents for sample multiplexing for high throughput single-cell rna sequencing
US20220333178A1 (en) 2021-03-22 2022-10-20 Illumina Cambridge Limited Methods for improving nucleic acid cluster clonality
JP2024521287A (ja) * 2021-04-22 2024-05-31 深▲せん▼華大生命科学研究院 Rnaシークエンシングライブラリーの構築方法、シークエンシング方法及びキット
BR112023026984A2 (pt) * 2021-06-24 2024-03-12 Illumina Inc Métodos e composições para indexação combinatória de ácidos nucleicos baseados em microesferas
CN114277094B (zh) * 2021-12-24 2024-02-27 中国农业科学院生物技术研究所 提取植物细胞核的裂解液
CN114277093B (zh) * 2021-12-24 2024-02-27 中国农业科学院生物技术研究所 一种提取植物细胞核的方法
CA3223722A1 (en) 2022-04-07 2023-10-12 Illumina, Inc. Altered cytidine deaminases and methods of use
WO2024069581A1 (en) 2022-09-30 2024-04-04 Illumina Singapore Pte. Ltd. Helicase-cytidine deaminase complexes and methods of use
WO2024073047A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Cytidine deaminases and methods of use in mapping modified cytosine nucleotides
WO2024073043A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Methods of using cpg binding proteins in mapping modified cytosine nucleotides
WO2024118903A1 (en) 2022-11-30 2024-06-06 Illumina, Inc. Chemoenzymatic correction of false positive uracil transformations

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4882268A (en) 1985-12-24 1989-11-21 Massachusetts Institute Of Technology Method for determining tissue of origin and degree of malignancy of tumor cells
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
ATE144556T1 (de) 1988-06-24 1996-11-15 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
CA2035010C (en) 1990-01-26 1996-12-10 Keith C. Backman Method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
DE69531542T2 (de) 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
WO1995025180A1 (en) 1994-03-16 1995-09-21 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP2327797B1 (en) 1997-04-01 2015-11-25 Illumina Cambridge Limited Method of nucleic acid sequencing
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6245974B1 (en) * 1997-08-06 2001-06-12 North Carolina State University Matrix attachment regions
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
US8030000B2 (en) 2002-02-21 2011-10-04 Alere San Diego, Inc. Recombinase polymerase amplification
SI3587433T1 (sl) 2002-08-23 2020-08-31 Illumina Cambridge Limited Modificirani nukleotidi
DE60324810D1 (de) 2002-09-20 2009-01-02 New England Biolabs Inc HELICASE-ABHuNGIGE AMPLIFIKATION VON NUKLEINSUREN
US20050079516A1 (en) 2003-06-06 2005-04-14 The Board Of Trustees Of The University Of Illinois Chromosome stability assay
WO2005003304A2 (en) 2003-06-20 2005-01-13 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
WO2005065814A1 (en) 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
CN104673903B (zh) * 2005-06-20 2018-11-13 领先细胞医疗诊断有限公司 检测单个细胞中的核酸和鉴定异质大细胞群中罕见细胞的方法
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20080009420A1 (en) 2006-03-17 2008-01-10 Schroth Gary P Isothermal methods for creating clonal single molecule arrays
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2291533B2 (en) 2008-07-02 2020-09-30 Illumina Cambridge Limited Using populations of beads for the fabrication of arrays on surfaces
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
CA2821299C (en) 2010-11-05 2019-02-12 Frank J. Steemers Linking sequence reads using paired code tags
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US9617598B2 (en) * 2011-05-27 2017-04-11 President And Fellows Of Harvard College Methods of amplifying whole genome of a single cell
US9926552B2 (en) * 2011-06-06 2018-03-27 Cornell University Microfluidic device for extracting, isolating, and analyzing DNA from cells
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
CA3104322C (en) 2011-09-23 2023-06-13 Illumina, Inc. Methods and compositions for nucleic acid sequencing
CA2856163C (en) 2011-10-28 2019-05-07 Illumina, Inc. Microarray fabrication system and method
EP3366348B1 (en) 2012-01-16 2023-08-23 Greatbatch Ltd. Emi filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
CA3138752C (en) 2012-04-03 2024-02-06 Illumina, Inc. Integrated optoelectronic read head and fluidic cartridge useful for nucleic acid sequencing
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
CN104540964A (zh) * 2012-07-24 2015-04-22 赛昆塔公司 使用序列标签的单细胞分析
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
ES2887177T3 (es) 2013-03-13 2021-12-22 Illumina Inc Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
WO2014151554A1 (en) * 2013-03-15 2014-09-25 The Trustees Of The University Of Pennsylvania Phi29 method for library preparation
CA3156663A1 (en) * 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
AU2014268710B2 (en) * 2013-05-23 2018-10-18 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
TR201816438T4 (tr) 2013-07-01 2018-11-21 Illumina Inc Katalizörsüz yüzey işlevselleştirme ve polimer aşılama.
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
DK3161152T3 (en) 2014-06-30 2019-03-25 Illumina Inc Methods and compositions using one-sided transposition
BR112017007912A2 (pt) * 2014-10-17 2018-01-23 Illumina Cambridge Limited transposon de preservação de contiguidade
WO2016066586A1 (en) 2014-10-31 2016-05-06 Illumina Cambridge Limited Novel polymers and dna copolymer coatings
GB2532790B (en) * 2014-11-28 2017-10-04 Porvair Filtration Group Ltd Modified pipette tips for chromatin immunoprecipitation assay
KR20200020997A (ko) 2015-02-10 2020-02-26 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
WO2017156336A1 (en) * 2016-03-10 2017-09-14 The Board Of Trustees Of The Leland Stanford Junior University Transposase-mediated imaging of the accessible genome

Also Published As

Publication number Publication date
JP2019520828A (ja) 2019-07-25
JP2022169578A (ja) 2022-11-09
IL263920A (en) 2019-01-31
KR102475710B1 (ko) 2022-12-08
CA3026773A1 (en) 2018-01-25
CN117822128A (zh) 2024-04-05
DK3488002T3 (da) 2021-06-21
WO2018018008A1 (en) 2018-01-25
US20230323426A1 (en) 2023-10-12
JP7155021B2 (ja) 2022-10-18
CN110268059B (zh) 2024-01-12
EP3488002A1 (en) 2019-05-29
SG11201811504PA (en) 2019-01-30
EP3904514A1 (en) 2021-11-03
AU2017299803B2 (en) 2023-06-29
US20180023119A1 (en) 2018-01-25
IL263920B (en) 2022-10-01
AU2023222858A1 (en) 2023-09-28
CN110268059A (zh) 2019-09-20
US11535883B2 (en) 2022-12-27
KR20190034164A (ko) 2019-04-01
AU2017299803A1 (en) 2019-01-24
EP3488002B1 (en) 2021-03-31
CA3026773C (en) 2022-10-18
NZ749719A (en) 2021-06-25
ES2873723T3 (es) 2021-11-03
IL263920B2 (en) 2023-02-01

Similar Documents

Publication Publication Date Title
KR102475710B1 (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
US11299765B2 (en) Methods and compositions for preparing sequencing libraries
KR102628035B1 (ko) 메틸화 서열결정을 위한 단일 세포 전체 게놈 라이브러리
AU2018201836B2 (en) Preserving genomic connectivity information in fragmented genomic DNA samples
AU2021257967B2 (en) Methods and compositions for preparing sequencing libraries
NZ749719B2 (en) Single cell whole genome libraries and combinatorial indexing methods of making thereof

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal