KR20210098432A - 단일 검정을 이용한 다수의 분석물의 분석 - Google Patents

단일 검정을 이용한 다수의 분석물의 분석 Download PDF

Info

Publication number
KR20210098432A
KR20210098432A KR1020217009647A KR20217009647A KR20210098432A KR 20210098432 A KR20210098432 A KR 20210098432A KR 1020217009647 A KR1020217009647 A KR 1020217009647A KR 20217009647 A KR20217009647 A KR 20217009647A KR 20210098432 A KR20210098432 A KR 20210098432A
Authority
KR
South Korea
Prior art keywords
probe
tag
dna
barcode
nucleic acid
Prior art date
Application number
KR1020217009647A
Other languages
English (en)
Inventor
프랭크 제이. 스티머스
판 장
드미트리 케이. 포코로크
스티븐 노어버그
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20210098432A publication Critical patent/KR20210098432A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 명세서에 제공된 시스템, 방법, 및 조성물의 실시형태는 단일 검정을 사용하여 단일 샘플 내의 다수의 분석물을 동시에 분석하는 방법에 관한 것이다. 일부 실시형태는 단일 샘플 내의 DNA 및 RNA의 동시 분석, 예를 들어 DNA 라이브러리와 RNA 라이브러리의 동시 생성에 관한 것이다.

Description

단일 검정을 이용한 다수의 분석물의 분석
본 명세서에 제공된 시스템, 방법, 및 조성물은 단일 샘플 내의 다수의 분석물을 동시에 분석하기 위한 검정에 관한 것이다. 구체적으로, 본 명세서에 개시된 태양은 단일 검정에서 단일 샘나이트로부터 DNA 및 RNA를 분석하는 방법에 관한 것이다.
생물학적 샘플에 존재하는 특정 핵산 서열의 검출은, 예를 들어, 미생물의 식별 및 분류, 감염성 질환의 진단, 유전적 이상의 검출 및 특성화, 암과 관련된 유전적 변화의 식별, 질병에 대한 유전적 감수성의 연구, 및 다양한 유형의 치료에 대한 반응의 측정을 위한 방법으로 사용되어왔다. 생물학적 샘플에서 특정 핵산 서열을 검출하기 위한 일반적인 기술은 핵산 서열분석이다.
전장 게놈 서열분석, 유전자형 분석, 표적화된 재-서열분석, 유전자 발현, 단일 세포 유전체학, 후성 유전체학, 및, 조직 샘플의 단백질 발현 분석은 질병 생체표지자를 식별하고, 질병을 정확하게 진단 및 예후하며, 환자에 대한 적절한 치료를 선택하는 데 상당히 중요할 수 있다. 종종, 이를 위해서는 DNA, RNA, 또는 단백질과 같은 특정 관심 분석물을 개별적으로 분석하기 위한 다수의 검정이 필요하다. 이들 분석물을 별개로 그리고 개별적으로 분석하기 위해 다양한 검정이 확립되었다. 그러나, 다수의 분석물의 포괄적인 분석은 시간 소모적이고 지루하다.
본 발명은 단일 검정을 사용하여 샘플 내의 다수의 분석물을 동시에 분석하기 위한 시스템, 방법, 및 조성물에 관한 것이다.
본 명세서에 제공된 일부 실시형태는 핵산 라이브러리에 관한 것이다. 일부 실시형태에서, 라이브러리는 상보적 DNA(cDNA) 라이브러리 및 게놈 DNA(gDNA) 라이브러리를 포함한다. 일부 실시형태에서, cDNA 라이브러리는 mRNA 분자로부터 유래되며, 제1 바코드를 포함하는 제1 태그를 갖는 핵산을 포함한다. 일부 실시형태에서, gDNA 라이브러리는 게놈 DNA로부터 유래되고, 제2 바코드를 포함하는 제2 태그를 갖는 핵산을 포함한다. 일부 실시형태에서, 제1 바코드 및 제2 바코드는 동일하거나 상이하며, 제1 바코드 및 제2 바코드는 cDNA 라이브러리 및 gDNA 라이브러리의 공통 공급원을 식별한다. 일부 실시형태에서, cDNA 라이브러리 및 gDNA 라이브러리는 동일 환경에서 공동-구획화되고 제조된다. 일부 실시형태에서, DNA에 대한 태그 및 RNA에 대한 태그는 동일하다.
본 명세서에 제공된 일부 실시형태는 플로우셀 장치(flowcell device)에 관한 것이다. 일부 실시형태에서, 플로우셀 장치는 RNA를 포획하기 위한 제1 프로브 및 DNA를 포획하기 위한 제2 프로브를 포함하며, 제1 프로브는 제1 바코드 및 제1 기질 인식 서열을 포함하고 제2 프로브는 제2 바코드 및 제2 기질 인식 서열을 포함한다. 일부 실시형태에서, 제1 바코드 및 제2 바코드는 동일하거나 상이하며, 제1 바코드 및 제2 바코드는 RNA 및 DNA의 공통 공급원을 식별한다. 일부 실시형태에서, 제1 및 제2 프로브는 샘플로부터의 RNA 및 DNA를 단일 구획에서 동시에 분석하도록 구성된다. 제19항의 방법에서, 제1 및 제2 포획 프로브는 고체 지지체 상에 고정된다.
본 명세서에 제공된 일부 실시형태는 샘플로부터의 DNA 및 RNA를 단일 구획에서 동시에 분석하는 방법에 관한 것이다. 일부 실시형태에서, 본 방법은 DNA 및 RNA를 포함하는 샘플을 제공하는 단계 - RNA는 제1 태그를 포함함 -, DNA를 제2 태그로 차별적으로 태깅하는 단계, 샘플을 단일 구획에서 RNA를 포획하기 위한 제1 포획 프로브 및 태깅된 DNA를 포획하기 위한 제2 포획 프로브와 접촉시키는 단계, 제1 포획 프로브를 RNA에 그리고 제2 포획 프로브를 DNA에 혼성화하여, RNA 및 DNA를 포획하는 단계, 및 DNA 및 RNA를 분석하는 단계를 포함한다. 일부 실시형태에서, 제1 포획 프로브는 제1 바코드를 포함하고, 제2 포획 프로브는 제2 바코드를 포함하고, 제1 바코드 및 제2 바코드는 RNA 및 DNA의 공통 공급원을 식별한다.
본 명세서에 제공된 일부 실시형태는 gDNA 및 cDNA를 포함하는 핵산 라이브러리를 단일 구획에서 동시에 생성하는 방법에 관한 것이다. 일부 실시형태에서, 본 방법은 DNA 및 RNA를 포함하는 샘플을 제공하는 단계 - RNA는 제1 태그를 포함함 -, DNA를 제2 태그로 차별적으로 태깅하는 단계, 샘플을 단일 구획에서 RNA를 포획하기 위한 제1 포획 프로브 및 태깅된 DNA를 포획하기 위한 제2 포획 프로브와 접촉시키는 단계, RNA를 및 DNA를 각각 제1 프로브 및 제2 프로브에 혼성화하는 단계, 및 혼성화된 RNA 및 DNA로부터 cDNA 라이브러리 및 gDNA 라이브러리를 동시에 생성하는 단계를 포함한다. 일부 실시형태에서, 제1 프로브는 제1 바코드를 포함하고 제2 프로브는 제2 바코드를 포함하고, 제1 바코드 및 제2 바코드는 RNA 및 DNA의 공통 공급원을 식별한다.
본 명세서에 제공된 일부 실시형태는 샘플 내의 DNA 및 RNA를 단일 구획에서 동시에 분석하기 위한 키트에 관한 것이다. 일부 실시형태에서, 키트는 전위 시약(transposition reagent) 및 제1 태그에 상보적인 제1 프로브 및 제2 태그에 상보적인 제2 프로브를 포함하며, 제1 프로브 및 제2 프로브는 고체 지지체 상에 고정화되고, 제1 프로브는 제1 바코드를 포함하고 제2 프로브는 제2 바코드를 포함하며, 제1 바코드 및 제2 바코드는 DNA 및 RNA의 공통 공급원을 식별한다.
본 명세서에 제공된 일부 실시형태는 단일 세포 ATAC-seq 분석을 수행하는 방법에 관한 것이다. 일부 실시형태에서, 본 방법은 세포 또는 핵의 집단을 포함하는 샘플을 제공하는 단계, 표적 핵산에 대해 인접 보존 전위(contiguity preserving transposition)를 수행하는 단계, 세포 또는 핵의 집단을 개별 소적(droplet)으로 분할하는 단계 - 단일 세포 또는 핵이 단일 소적으로 분할됨 -, 표적 핵산을 인덱싱하는 단계, 및 인덱싱된 핵산을 분석하는 단계를 포함한다.
본 명세서에 제공된 일부 실시형태는 조합 인덱싱(CPT-seq)의 방법에 관한 것이다. 일부 실시형태에서, 본 방법은 세포 또는 핵의 집단을 포함하는 샘플을 제공하는 단계, 표적 핵산에 대해 개별적으로 인덱싱된 인접 보존 전위를 수행하는 단계, 세포 또는 핵의 집단을 개별 소적으로 분할하는 단계 - 다수의 세포 또는 핵이 단일 소적으로 분할되고, 단일 소적 내의 다수의 세포 또는 핵은 고유한 인덱스를 가짐 -, 표적 핵산을 인덱싱하는 단계, 및 인덱싱된 핵산을 분석하는 단계를 포함한다.
본 명세서에 요약된 임의의 실시형태에서, 분석물은 세포 집단, 단일 세포, 세포 핵 집단, 또는 세포 핵으로부터 수득된다. 본 명세서에 요약된 임의의 실시형태에서, 분석물은 분석물이 무엇인지에 따라 다양한 분석을 사용하여 분석된다. 예를 들어, 분석은 DNA 분석, RNA 분석, 단백질 분석, 태그멘테이션(tagmentation), 핵산 증폭, 핵산 서열분석, 핵산 라이브러리 제조, 트랜스포사제-접근가능 염색질 이용 서열분석 검정(assay for transposase accessible chromatic using sequencing, ATAC-seq), 인접-보존 전위(CPT-seq), 단일 세포 조합 인덱스 서열분석(single cell combinatorial indexed sequencing, SCI-seq), 또는 단일 세포 게놈 증폭, 또는 이들의 임의의 조합을 포함할 수 있다.
도 1a는 샘플 내의 다수의 관심 분석물을 분석하기 위한 전통적인 방법을 예시한 개략도이며, 여기서 각각의 관심 분석물은 2가지 상이한 관찰에서 개별적으로 분석된다. 도 1b는 동일한 구획에서 상이한 관심 분석물을 동시에 측정하는 공정의 실시형태의 개략도이다.
도 2는 DNA 및 RNA에 대한 결합을 위해 상이한 태그를 사용하는 동시-검정의 실시형태를 도시하는 개략도이다. 상이한 태그들은 RNA 또는 DNA를 갖는 단일 세포 또는 핵으로 도입되는 것으로 나타나 있다. 단일 세포 또는 핵은 소적 내에 캡슐화되거나 플레이트의 웰 상에서 분리된다. 바코드는 표면 상에 고정되거나 용액 중에 첨가되며, 태그를 통해 DNA 및 RNA를 포획한다.
도 3은 DNA 및 RNA에 대한 결합을 위해 동일한 태그를 사용하는 동시-검정의 실시형태를 도시하는 개략도이다. DNA가 먼저 폴리A 테일을 함유하도록 트랜스포좀에 의해 단편화된다. DNA 단편 및 mRNA 둘 모두는 표면 상에 또는 용액 중에 고정된 바코드를 갖는 폴리T 올리고뉴클레오타이드를 사용하여 인덱싱된다. DNA에 대해 수행되는 전위 반응은 내부 트랜스포존 특이적 서열에 의해 DNA가 RNA와 구별될 수 있게 한다.
도 4는 폴리A 트랜스포존을 전위에 의해 게놈 DNA 내로 도입하는 공정의 실시형태를 도시하는 개략도이다. 핵/세포는 폴리T 테일을 갖는 인덱싱된 올리고뉴클레오타이드로 캡슐화된다. 인덱싱된 올리고뉴클레오타이드는 전위된 gDNA 단편에 혼성화 및 라이게이션되고, 이어서 mRNA와 혼성화되어 제1 cDNA를 생성한다. 제2 cDNA 합성 후에, 이중 가닥 cDNA 및 gDNA를 다시 전위시켜 다른 쪽 말단에 PCR 어댑터를 추가한다. 이어서, 단편을 PCR에 의해 증폭시킨다.
도 5a 및 도 5b는 서열분석(ATAC-seq)을 사용한 트랜스포사제-접근가능 염색질 이용 서열분석 검정을 개략적으로 도시한다. 도 5a는 ATAC-seq의 일반적인 원리를 개략적으로 나타내고, 도 5b는 단일-세포 ATAC-seq를 수행하기 위한 단계들을 약술한다.
도 6a 및 도 6b는 벌크 동시-검정의 실시형태를 도시하는 개략도를 나타낸다. 도 6a에 나타나 있는 바와 같이, 세포 핵이 단리되고, DNA는 폴리A 테일로 태그멘테이션된다. 태그멘테이션된 DNA 및 mRNA는 프로브로 포획되고 추가 분석을 위해 정제된다. 도 6b는 도 6a의 공정에 사용되는 DNA 단편의 추가의 상세 사항을 나타낸다.
도 7a 및 도 7b는 비드 동시검정(bead coassay)의 실시형태를 도시하는 개략도를 나타낸다. 도 7a에 도시된 바와 같이, 세포 핵은 단리되고, DNA는 폴리A 테일로 태그멘테이션된다. 태그멘테이션된 DNA 및 mRNA는 비오틴 포획을 사용하여 포획된다. 도 7b는 도 7a의 공정에 사용되는 DNA 단편의 추가의 상세 사항을 나타낸다.
도 8은 도 6a 및 도 6b의 벌크 동시-검정의 서열분석 데이터를 도시한다. ATAC 라이브러리에 대한 단편은 도 8에서 강조된 시그니처(signature) ME 서열을 갖는다.
도 9의 패널 A 및 패널 b는 도 6a 및 도 6b의 벌크 동시-검정의 서열분석 데이터를 도시한다. 생성된 라이브러리를 서열분석하였다. ATAC 단편은 프로모터 영역 주위의 전형적인 풍부화를 나타내고(패널 A), 3' 카운팅에 대한 RNA 단편은 유전자 말단 주위의 리드 축적(reads accumulation)을 나타낸다(패널 B).
도 10은 SCI-seq와 같은 조합 인덱싱을 사용하여 수행된 동시-검정의 실시형태를 예시하는 개략도이다.
도 11은 조합 서열분석을 사용하여 동시-검정을 수행하는 방법의 실시형태를 예시하는 개략도이다.
도 12는, 바코드가 내부에 삽입된 비드 풀(bead pool)을 나타내고 예시적인 프라이머를 도시하는, 서열분석 작업 흐름의 예시적인 실시형태를 도시한다.
도 13은 세포 당 리드의 수를 도시하는 그래프를 나타내며, 이는 트랜스포사제가 증가하면 세포당 리드의 수가 증가함을 보여준다.
도 14는 세포 유형의 혼합물에 대해 ATAC-seq를 사용하여 단일 세포 감도를 나타내는 그래프를 나타낸다.
하기의 상세한 설명에서, 본 명세서의 일부를 형성하는 첨부된 도면을 참조한다. 도면에서, 문맥이 달리 나타내지 않는 한, 유사한 부호는 전형적으로 유사한 구성요소를 식별한다. 상세한 설명, 도면 및 청구범위에 기재된 예시적인 실시형태는 제한적인 것으로 의도되지 않는다. 본 명세서에 제시된 주제의 사상 또는 범위를 벗어남이 없이 다른 실시형태가 이용될 수 있으며 다른 변경이 이루어질 수 있다. 본 명세서에 일반적으로 기재되고 도면에 예시된 바와 같이, 본 발명의 태양은 매우 다양한 상이한 구성으로 배열, 치환, 조합, 분리 및 설계될 수 있으며, 이들 모두는 본 명세서에서 명백하게 고려된다는 것이 쉽게 이해될 것이다.
본 명세서에 제공된 시스템, 방법, 및 조성물의 실시형태는 단일 샘플 내의 다수의 분석물의 동시 분석에 관한 것이다. 일부 실시형태에서, 다수의 분석물은 DNA 및 RNA를 포함한다.
단일 샘플로부터의 다수의 분석물을 분석하는 전통적인 방법은, 예를 들어 도 1a에 나타나 있는 바와 같이, 각각의 관심 분석물을 단리하고 이어서 각각의 관심 분석물을 분석하기 위한 별개의 시약 및 단계의 사용을 수반하는 별개의 검정을 필요로 한다. 따라서, 분석물은 시간 및/또는 공간에 의해 개별적으로, 예를 들어 상이한 시간에 또는 상이한 구획에서 분석될 수 있다. 예를 들어, 단일 샘플로부터 DNA 및 RNA 둘 모두를 분석하는 것이 바람직할 수 있다. 전통적인 방법은 개별적으로 하나의 검정을 사용하여 DNA를 분석하고 다른 검정을 사용하여 RNA를 분석하므로, 시간, 비용 및 자원 소비를 증가시킨다. 게다가, 동일 샘플은 또한 단백질과 같은 추가의 관심 분석물을 포함할 수 있으며, 단백질의 분석은 또한 별도의 검정을 필요로 한다.
핵산 라이브러리는 유전자 생성물을 결정하기 위해 또는 전장 게놈 서열분석을 위해 유용하다. 예를 들어, 통합적 후성유전체학 분석의 신속하고 민감한 방법인 트랜스포사제-접근가능 염색질 이용 서열분석 검정(ATAC-seq)에 의한, 후성유전체학에서의 사용을 위한 것을 포함하여, 상이한 유형의 라이브러리, 예를 들어, 역전사된 RNA 또는 게놈 DNA (gDNA) 라이브러리로부터 생성된 상보적 DNA (cDNA) 라이브러리가 생성될 수 있다. 전통적으로, 이들 라이브러리는 개별적으로 그리고 독립적으로 생성된다. cDNA 라이브러리는, 예를 들어 신규한 유전자의 발견, 유전자 기능 연구, mRNA 발현 결정, 또는 대체 스플라이싱(alternate splicing) 결정을 포함하는, 다수의 응용에 유용할 수 있다. gDNA 라이브러리는, 예를 들어 유기체의 완전한 게놈 결정, 조절 서열의 기능 연구, 또는 유전자 돌연변이 연구를 포함하는, 다수의 개별 응용에 유용할 수 있다. 본 명세서에 기재된 방법, 조성물, 및 시스템은 cDNA 라이브러리 및 gDNA 라이브러리 둘 모두의 동시 생성을 가능하게 한다.
본 발명의 일 실시형태는 단일 검정을 사용하여 단일 샘플 내의 다수의 분석물을 분석하기 위한 시스템 및 방법이며, 여기서 각각의 관심 분석물은 예를 들어 도 1b에 도시된 바와 같이 단일 구획에서 동시에 분석된다. 도 1b는 샘플 내의 2개의 분석물을 도시하지만, 2개 초과의 관심 분석물이 존재할 수 있고, 각각의 관심 분석물이 동시에 분석될 수 있음이 이해되어야 한다. 본 명세서에 기재된 시스템, 방법, 및 조성물은 단일 샘플 내의 다수의 분석물의 동시 분석에 관한 것이다. 시스템, 방법, 및 조성물의 실시형태는 검정의 복잡성, 비용 및 시간을 감소시킴으로써 분석 효율을 개선한다.
본 명세서에 제공된 일부 실시형태는 핵산 라이브러리에 관한 것이다. 일부 실시형태에서, 핵산 라이브러리는, 기질에 결합하도록 구성된 제1 태그 및 바코드 서열을 갖는 핵산을 포함하며 mRNA 분자로부터 유래되는 cDNA 라이브러리, 및 기질에 결합하도록 구성되며 제1 태그와는 상이한 제2 태그를 갖는 핵산을 포함하며 게놈 DNA로부터 유래되는 gDNA 라이브러리를 포함한다. 일부 실시형태에서, 핵산 라이브러리는 세포 집단, 단일 세포, 세포 핵 집단, 또는 세포 핵으로부터 생성된다. 일부 실시형태에서, 제1 태그는 폴리A 태그이다. 일부 실시형태에서, 제2 태그는 트랜스포사제-특이적 요소를 포함한다.
일부 실시형태에서, 본 방법은 샘플 내의 각각의 관심 분석물을 태그로 태깅하여 각각의 관심 분석물을 인덱싱하는 단계를 포함한다. 일부 실시형태에서, 본 방법은 태그에 상보적인 프로브로 각각의 관심 분석물을 포획하는 단계를 추가로 포함한다. 일부 실시형태에서, 본 방법은 각각의 관심 분석물을 분석하는 단계를 추가로 포함한다.
일부 실시형태에서, 본 방법은 샘플 내의 DNA 및 RNA를 동시에 분석하는 단계를 포함한다. 일부 실시형태에서, 본 방법은 DNA 및 RNA를 포함하는 샘플을 제공하는 단계를 포함한다. 일부 실시형태에서, RNA는 제1 태그를 포함한다. 일부 실시형태에서, 본 방법은 제2 태그로 DNA를 차별적으로 태깅하는 단계를 포함한다. 일부 실시형태에서, 본 방법은 고체 지지체를 샘플과 접촉시키는 단계를 포함하며, 고체 지지체는 RNA를 포획하기 위한 제1 고정된 프로브 및 태깅된 DNA를 포획하기 위한 제2 고정된 프로브를 포함한다. 일부 실시형태에서, 본 방법은 고체 지지체 상에 DNA 및 RNA를 동시에 포획하는 단계를 포함한다. 일부 실시형태에서, 본 방법은 DNA 및 RNA를 분석하는 단계를 포함한다.
본 명세서에 사용되는 바와 같이, 샘플은 관심 분석물을 갖는 임의의 샘플을 포함한다. 샘플은, 예를 들어 전혈, 혈청, 간질액, 림프액, 뇌척수액, 객담, 소변, 대변, 젖, 땀, 눈물, 탯줄, 말초 혈액, 골수, 세포 또는 고형 조직을 포함하는 관심 분석물을 갖는 생물학적 샘플과 같은 생물학적 샘플일 수 있다. 일부 실시형태에서, 샘플은 세포 집단, 세포, 세포 핵 집단, 또는 세포 핵이다. 샘플은 대상체로부터 얻을 수 있으며, 대상체로부터의 하나 이상의 관심 분석물을 분석하는 것이 바람직하다. 본 명세서에 사용되는 바와 같이, "대상체"는 치료, 관찰, 또는 실험의 대상인 동물을 지칭한다. "동물"은 냉혈 및 온혈 척추동물 및 무척추 동물, 예를 들어 어류, 갑각류, 파충류 및 특히 포유류를 포함한다. "포유동물"은, 제한 없이, 마우스, 래트, 토끼, 기니피그, 개, 고양이, 양, 염소, 소, 말, 영장류, 예를 들어 원숭이, 침팬지, 및 유인원, 및 특히 인간을 포함한다.
본 명세서에 제공된 일부 실시형태는 샘플 내의 다수의 관심 분석물을 동시에 분석하는 방법에 관한 것이며, 여기서 관심 분석물은 핵산 또는 아미노산, 예를 들어 DNA, RNA, 단백질, 또는 임의의 다른 세포 생체분자, 또는 다른 관심 표적 분자 중 하나 이상이다.
샘플은 환경 공급원으로부터 얻어지는 유체 또는 시료일 수 있다. 예를 들어, 환경 공급원으로부터 얻어지는 유체 또는 시료는 식료품(food product), 식품(food produce), 가금류, 육류, 어류, 음료, 유제품, 물(폐수 포함), 연못, 강, 저수지, 수영장, 토양, 식품 가공 및/또는 포장 공장, 농경지, 수경배양(hydroculture)(수경재배식 식품 농장을 포함), 제약 제조 공장, 동물 군락 시설(animal colony facility), 또는 이들의 임의의 조합으로부터 얻어지거나 유래될 수 있다. 일부 실시형태에서, 샘플은 세포 배양물로부터 또는 미생물 콜로니로부터 수집되거나 유래된 유체 또는 시료이다.
본 명세서에 사용되는 바와 같이, "분석물", "표적 분석물", "관심 분석물"은 상호교환적으로 사용되며, 본 명세서에 개시된 방법 및 시스템에서 측정되는 분석물을 지칭한다. 일부 실시형태에서, 분석물은 생체분자일 수 있다. 생체분자의 비제한적인 예는 폴리뉴클레오타이드(예를 들어, DNA 또는 RNA), 단백질, 지질 및 탄수화물과 같은 거대분자를 포함한다. 특정 경우에, 분석물은 호르몬, 항체, 성장 인자, 사이토카인, 효소, 수용체(예를 들어, 신경 수용체, 호르몬 수용체, 영양소 수용체, 및 세포 표면 수용체) 또는 이들의 리간드, 암 표지자(예를 들어, PSA, TNF-알파), 심근 경색 표지자(예를 들어, 트로포닌, 크레아틴 키나제 등), 독소, 약물(예를 들어, 중독 약물), 대사제(예를 들어, 비타민을 포함함) 등일 수 있다. 단백질 분석물의 비제한적인 실시형태는 펩타이드, 폴리펩타이드, 단백질 단편, 단백질 복합체, 융합 단백질, 재조합 단백질, 인단백질, 당단백질, 지질단백질, 올리고뉴클레오타이드로 태깅된 단백질 등을 포함한다. 표적 분석물은 핵산일 수 있다.
표적 핵산은 샘플 내의 핵산의 평균 크기가 약 2 kb, 1 kb, 500 bp, 400 bp, 200 bp, 100 bp, 50 bp보다 작거나, 그보다 크거나, 그와 같거나, 또는 전술한 크기들 중 임의의 두 크기 사이의 범위인 샘플을 포함할 수 있다. 일부 실시형태에서, 샘플 내의 핵산의 평균 크기는 약 2000개 뉴클레오타이드, 1000개 뉴클레오타이드, 500개 뉴클레오타이드, 400개 뉴클레오타이드, 200개 뉴클레오타이드, 100개 뉴클레오타이드, 50개 뉴클레오타이드보다 작거나, 그보다 크거나, 그와 같거나, 또는 전술한 크기들 중 임의의 두 크기 사이의 범위이다.
본 명세서에 사용되는 바와 같이, "폴리뉴클레오타이드" 및 "핵산"은 상호교환적으로 사용될 수 있으며, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드 중 어느 하나인, 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭할 수 있다. 따라서, 이들 용어는 단일-, 이중-, 또는 다중-가닥 DNA 또는 RNA를 포함한다. 폴리뉴클레오타이드의 예는 유전자 또는 유전자 단편, 전장 게놈 DNA, 게놈 DNA, 후생유전체, 게놈 DNA 단편, 엑손, 인트론, 메신저 RNA(mRNA), 조절 RNA, 전달 RNA, 리보솜 RNA, 비암호화 RNA(ncRNA), 예컨대 PIWI-결합 RNA(piRNA), 작은 간섭 RNA(siRNA), 및 긴 비암호화 RNA(lncRNA), 작은 헤어핀(shRNA), 작은 핵 RNA(snRNA), 마이크로 RNA(miRNA), 소핵소체 RNA(snoRNA) 및 바이러스 RNA, 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 프라이머 또는 임의의 전술한 것의 증폭된 카피를 포함한다. 폴리뉴클레오타이드는 메틸화 뉴클레오타이드와 같은 변형된 뉴클레오타이드, 및 비-천연 염기를 갖는 뉴클레오타이드 및 아자-또는 데아자-퓨린과 같은 변형된 천연 염기를 갖는 뉴클레오타이드를 포함하는 뉴클레오타이드 유사체를 포함할 수 있다. 폴리뉴클레오타이드는 다음 4개의 뉴클레오타이드 염기의 특이적 서열로 구성될 수 있다: 아데닌(A); 시토신(C); 구아닌(G); 및 티민(T). 폴리뉴클레오타이드가 RNA인 경우에, 우라실(U)이 또한, 예를 들어 티민에 대한 천연 대체물로서 존재할 수 있다. 우라실은 DNA에 또한 사용될 수 있다. 용어 "핵산 서열"은 천연 및 비-천연 염기를 포함하는 폴리뉴클레오타이드 또는 임의의 핵산 분자의 알파벳 표현을 지칭할 수 있다.
핵산은 포스포다이에스테르 결합을 포함할 수 있으며, 예를 들어 포스포르아마이드, 포스포로티오에이트, 포스포로다이티오에이트, O-메틸포스포로아미다이트 및 펩타이드 핵산 골격 및 결합을 포함하는 다른 유형의 골격을 포함할 수 있다. 핵산은 데옥시리보뉴클레오타이드 및 리보뉴클레오타이드의 임의의 조합, 및 우라실, 아데닌, 티민, 시토신, 구아닌, 이노신, 잔타닌, 하이포잔타닌, 아이소시토신, 아이소구아닌, 및 염기 유사체, 예를 들어 나이트로피롤(3-나이트로피롤을 포함함) 및 나이트로인돌(5-나이트로인돌을 포함함)을 포함하는 염기의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 핵산은 적어도 하나의 무차별성(promiscuous) 염기를 포함할 수 있다. 무차별성 염기는 하나 초과의 상이한 유형의 염기와 염기쌍을 이룰 수 있으며, 예를 들어, 게놈 DNA 샘플과 같은 복합 핵산 샘플에서 랜덤 혼성화에 사용되는 올리고뉴클레오타이드 프라이머 또는 삽입체에 포함될 때 유용할 수 있다. 무차별성 염기의 예에는 아데닌, 티민 또는 시토신과 쌍을 이룰 수 있는 이노신이 포함된다. 다른 예에는 하이포잔틴, 5-나이트로인돌, 비환형 5-나이트로인돌, 4-나이트로피라졸, 4-나이트로이미다졸 및 3-나이트로피롤이 포함된다. 적어도 2, 3, 4개 이상의 유형의 염기와 염기쌍을 이룰 수 있는 무차별성 염기가 사용될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 동시는 작용이 동시에 또는 실질적으로 동시에 일어나는 것을 지칭한다. 따라서, 다수의 분석물의 동시 분석은 단일 검정에서 동시에 또는 실질적으로 동시에 다수의 분석물을 분석하는 것을 지칭한다. 유사하게, 서열분석 가능한 요소들의 동시 수집 또는 유도는 서열분석 가능한 요소들을 동시에 또는 실질적으로 동시에 수집 또는 유도하는 것을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 태그는 관심 분석물이 나중에 단리, 식별, 추적, 또는 분석될 수 있도록 하는 관심 분석물 또는 분석물들의 변형을 지칭한다. 따라서, 태그는 샘플 내의 관심 분석물을 식별할 수 있다. 태그는 예를 들어 폴리아데닐화(polyA) 태그를 포함할 수 있다. 일부 실시형태에서, 태그는 적어도 1개의 뉴클레오타이드, 적어도 2개의 뉴클레오타이드, 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 25개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 35개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 45개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 또는 50개의 뉴클레오타이드 이상, 또는 전술한 길이들 중 임의의 두 길이의 범위 내의 길이를 갖는 뉴클레오타이드 서열을 포함할 수 있다. 일부 실시형태에서, 태깅은 태그멘테이션에 의해 수행된다. 본 명세서에 사용되는 바와 같이, "태그멘테이션"은 표적 핵산 내에 트랜스포존을 삽입하여, 트랜스포존이 표적 핵산을 절단하고 절단된 표적 핵산의 말단에 어댑터 서열을 추가하도록 하는 것을 지칭할 수 있다. 태그멘테이션의 예시적인 방법이 미국 특허 제9,115,396호; 제9,080,211호; 제9,040,256호; 미국 특허 출원 공개 제2014/0194324호에 기재되어 있으며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다. 일부 실시형태에서, 태그는 각각의 관심 분석물에 대해 동일하거나 상이하다. 예를 들어, 각각의 관심 분석물은 동일한 태그로 태깅될 수 있거나, 상이한 태그로 태깅될 수 있다. 예를 들어, 차별적으로 태깅한다는 것은 DNA와 같은 하나의 관심 분석물을 RNA와 같은 다른 관심 분석물의 태깅과는 상이하거나 구별되는 방식으로 태깅하는 것을 지칭한다. 일부 실시형태에서, 태그는 각각의 분석물에 대해 상이하지만, 태그의 관계는 사전에 알려져 있다.
예를 들어 넥스테라(NEXTERA)™ XT 및 플렉스(FLEX) DNA 샘플 제조 키트(일루미나, 인크.(Illumina, Inc.))의 작업 흐름에 예시된 바와 같이, 트랜스포존 기반 기술이 DNA를 단편화하는 데 사용될 수 있으며, 여기서 게놈 DNA와 같은 표적 핵산은 표적을 동시에 단편화하고 태깅(태그멘테이션)하는 트랜스포좀 복합체로 처리되어 단편의 말단에서 고유한 어댑터 서열로 태깅된 단편화된 핵산 분자 집단을 생성한다.
전위 반응은 하나 이상의 트랜스포존이 무작위 부위 또는 거의 무작위 부위에서 표적 핵산 내로 삽입되는 반응이다. 전위 반응에서의 구성요소는 트랜스포사제(또는 본 명세서에 기재된 바와 같은 핵산을 단편화하고 태깅할 수 있는 다른 효소, 예컨대, 인테그라제) 및 트랜스포사제 (또는 본 명세서에 기재된 바와 같은 다른 효소)에 결합하는 이중-가닥 트랜스포존 말단 서열, 및 2개의 트랜스포존 말단 서열 중 하나에 부착된 어댑터 서열을 포함하는 트랜스포존 요소를 포함한다. 이중-가닥 트랜스포존 말단 서열의 한 가닥은 표적 핵산의 한 가닥으로 전달되고, 상보적 트랜스포존 말단 서열 가닥은 그렇지 않다(전달되지 않은 트랜스포존 서열). 어댑터 서열은 필요한 대로 또는 원하는 대로 하나 이상의 기능적 서열 또는 구성요소(예컨대, 프라이머 서열, 앵커 서열, 유니버설 서열, 스페이서 영역, 또는 인덱스 태그 서열)를 포함할 수 있다.
"트랜스포좀 복합체"는 적어도 하나의 트랜스포사제(또는 본 명세서에 기재된 바와 같은 다른 효소) 및 트랜스포존 인식 서열로 구성된다. 일부 그러한 시스템에서, 트랜스포사제는 트랜스포존 인식 서열에 결합하여, 전위 반응을 촉매할 수 있는 기능성 복합체를 형성한다. 일부 태양에서, 트랜스포존 인식 서열은 이중-가닥 트랜스포존 말단 서열이다. 트랜스포사제는 표적 핵산 내의 트랜스포사제 인식 부위에 결합하고, 트랜스포존 인식 서열을 표적 핵산 내로 삽입한다. 일부 그러한 삽입 이벤트에서, 트랜스포존 인식 서열(또는 말단 서열)의 한 가닥이 표적 핵산 내로 전달되어, 절단 이벤트를 초래한다. 본 발명의 트랜스포사제와 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 전위 절차 및 시스템이, 예를 들어, 국제 특허 공개 WO10/048605호, 미국 특허 출원 공개 제2012/0301925호, 미국 특허 출원 공개 제2012/13470087호, 또는 미국 특허 출원 공개 제2013/0143774호에 기재되어 있으며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다.
본 명세서에 제공된 특정 실시형태와 함께 사용될 수 있는 예시적인 트랜스포사제는 다음을 포함한다(또는 다음에 의해 인코딩된다): Tn5 트랜스포사제(문헌[Reznikoff et al., Biochem . Biophys . Res. Commun . 1999, 266, 729-734] 참조), 슬리핑 뷰티(Sleeping Beauty, SB) 트랜스포사제, 비브리오 하베야이(Vibrio harveyi)(애질런트(Agilent)에 의해 특성화되고 슈어셀렉트(SureSelect) QXT 제품에 사용되는 트랜스포사제), MuA 트랜스포사제 및 R1 및 R2 말단 서열을 포함하는 Mu 트랜스포사제 인식 부위(문헌[Mizuuchi, K., Cell, 35: 785, 1983]; 문헌[Savilahti, H, et al., EMBO J., 14:4893, 1995]), 황색 포도상구균(Staphylococcus aureus) Tn552(문헌[Colegio, O. et al., J. Bacteriol., 183:2384-8, 2001]; 문헌[Kirby, C. et al., Mol. Microbiol., 43:173-86, 2002]), Ty1(문헌[Devine & Boeke, Nucleic Acids Res., 22:3765-72, 1994] 및 국제 특허 공개 WO95/23875호), 트랜스포존 Tn7(문헌[Craig, N.L., Science, 271:1512, 1996]; 문헌[Craig, N.L., Curr. Top. Microbiol. Immunol., 204: 27-48, 1996]), Tn/O 및 IS10(문헌[Kleckner N. et al., Curr. Top. Microbiol. Immunol., 204:49-82, 1996]), 마리너 트랜스포사제(문헌[Lampe, D.J. et al., EMBO J., 15:5470-9, 1996]), Tc1(문헌[Plasterk, R.H., Curr. Top. Microbiol. Immunol., 204:125-43, 1996]), P 요소(문헌[Gloor, G.B., Methods Mol. Biol., 260:97-114, 2004)]), Tn3(문헌[Ichikawa & Ohtsubo, J. Biol. Chem., 265:18829-32, 1990]), 박테리아 삽입 서열(문헌[Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204:1-26, 1996]), 레트로바이러스(문헌[Brown et al., Proc. Natl. Acad. Sci. USA, 86:2525-9, 1989]), 및 효모의 레트로트랜스포존(문헌[Boeke & Corces, Ann. Rev. Microbiol. 43:403-34, 1989]). 더 많은 예는 IS5, Tn10, Tn903, IS911, 및 조작된 버전의 트랜스포사제 패밀리 효소를 포함하며(문헌[Zhang et al.,(2009) PLoS Genet. 5:e1000689. Epub Oct. 16]; 문헌[Wilson C. et al. (2007) J. Microbiol. Methods 71: 332-5]), 트랜스포사제와 관련하여 본 명세서에 인용된 참고문헌들 각각은 전체적으로 본 명세서에 참고로 포함된다. 본 명세서에 기재된 방법은 또한 단지 단일 트랜스포사제가 아니라 트랜스포사제의 조합을 포함할 수 있다.
일부 실시형태에서, 트랜스포사제는 Tn5, MuA, 또는 비브리오 하베야이 트랜스포사제, 또는 이의 활성 돌연변이체이다. 다른 실시형태에서, 트랜스포사제는 Tn5 트랜스포사제 또는 이의 활성 돌연변이체이다. 일부 실시형태에서, Tn5 트랜스포사제는 과활성 Tn5 트랜스포사제(예를 들어, 문헌[Reznikoff et al.], 국제 특허 공개 WO2001/009363호, 미국 특허 제5,925,545호, 제5,965,443호, 제7,083,980호, 및 제7,608,434호, 및 문헌[Goryshin and Reznikoff, J. Biol. Chem. 273:7367, 1998] 참조), 또는 그의 활성 돌연변이체이다. 일부 태양에서, Tn5 트랜스포사제는 본 명세서에 참고로 포함된 국제 특허 공개 WO2015/160895호에 기재된 Tn5 트랜스포사제이다. 일부 실시형태에서, Tn5 트랜스포사제는 융합 단백질이다. 일부 실시형태에서, Tn5 트랜스포사제 융합 단백질은 융합 신장 인자 Ts(Tsf) 태그를 포함한다. 일부 실시형태에서, Tn5 트랜스포사제는 야생형 서열에 대하여 아미노산 54, 56 및 372에서 돌연변이를 포함하는 과활성 Tn5 트랜스포사제이다. 일부 실시형태에서, 과활성 Tn5 트랜스포사제는 융합 단백질이며, 선택적으로 융합 단백질은 신장 인자 Ts(Tsf)이다. 일부 실시형태에서, 인식 부위는 Tn5-형 트랜스포사제 인식 부위이다(문헌[Goryshin and Reznikoff, J. Biol. Chem., 273:7367, 1998]). 일 실시형태에서, 과활성 Tn5 트랜스포사제와 복합체를 형성하는 트랜스포사제 인식 부위(예를 들어, EZ-Tn5TM 트랜스포사제, 미국 위스콘신주 매디슨 소재의 에피센터 바이오테크놀로지스(Epicentre Biotechnologies))가 사용된다. 일부 실시형태에서, Tn5 트랜스포사제는 야생형 Tn5 트랜스포사제이다.
본 명세서에 기재된 방법, 조성물, 또는 시스템의 임의의 실시형태에서, 트랜스포존은 트랜스포존 말단 서열을 포함한다. 일부 실시형태에서, 트랜스포존 말단 서열은 모자이크 말단(ME) 서열이다. 일부 실시형태에서, DNA는 태그멘테이션을 사용하여 태깅되고, 여기서 DNA는 태그로 태깅되고, 태그로 포함되는 것은 ME 서열과 같은 트랜스포존-특이적 서열이다. 따라서, DNA는 트랜스포존-특이적 서열에 기초하여 샘플 내 RNA와 구별된다.
본 명세서에 기재된 방법, 조성물, 또는 시스템의 임의의 실시형태에서, 트랜스포존은 어댑터 서열을 포함한다. 어댑터 서열은 프라이머 서열, 앵커 서열, 유니버설 서열, 스페이서 영역, 인덱스 서열, 포획 서열, 바코드 서열, 절단 서열, 서열분석-관련 서열 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상의 기능적 서열 또는 구성요소를 포함할 수 있다. 일부 실시형태에서, 어댑터 서열은 프라이머 서열을 포함한다. 다른 실시형태에서, 어댑터 서열은 프라이머 서열 및 인덱스 또는 바코드 서열을 포함한다. 프라이머 서열은 또한 유니버설 서열일 수 있다. 본 발명은 사용될 수 있는 어댑터 서열의 유형에 제한되지 않으며, 당업자는 라이브러리 제조 및 차세대 서열분석을 위해 사용될 수 있는 추가의 서열을 인식할 것이다. 유니버설 서열은 2개 이상의 핵산 단편에 공통인 뉴클레오타이드 서열의 영역이다. 선택적으로, 2개 이상의 핵산 단편은 또한 서열 차이 영역을 갖는다. 복수의 핵산 단편의 상이한 구성원에 존재할 수 있는 유니버설 서열은 유니버설 서열에 상보적인 단일 유니버설 프라이머를 사용하여 다수의 상이한 서열의 복제 또는 증폭을 가능하게 할 수 있다.
어댑터는 핵산, 예를 들어 단일-가닥 핵산을 포함한다. 어댑터는 약 5개의 뉴클레오타이드, 10개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드, 100개의 뉴클레오타이드보다 적거나, 많거나, 동일하거나, 또는 전술한 크기들 중 임의의 2개 사이의 범위의 길이를 갖는 짧은 핵산을 포함할 수 있다.
임의의 실시형태에서, A14-ME, ME, B15-ME, ME', A14, B15 및 ME를 포함하는 어댑터 서열 또는 트랜스포존 말단 서열이 하기에 제공된다:
A14-ME: 5′-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3′ (서열 번호 1)
B15-ME: 5′-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3′ (서열 번호 2)
ME': 5′-phos-CTGTCTCTTATACACATCT-3' (서열 번호 3)
A14: 5′-TCGTCGGCAGCGTC-3′ (서열 번호 4)
B15: 5′-GTCTCGTGGGCTCGG-3' (서열 번호 5)
ME: AGATGTGTATAAGAGACAG (서열 번호 6)
일부 실시형태에서, 프라이머 서열은 서열분석을 위한 라이브러리를 제조하기 위해 포함된다. 일부 실시형태에서, 프라이머 서열은 P5 프라이머 서열 또는 P7 프라이머 서열이다. P5 및 P7 프라이머는 다양한 일루미나 플랫폼에 대한 서열분석을 위해, 일루미나, 인크.에 의해 판매되는 상업적 플로우셀의 표면에 사용된다. 프라이머 서열은 전체적으로 본 명세서에 참고로 포함된 미국 특허 출원 공개 제2011/0059865 A1호에 기재되어 있다. 5' 말단에서 알킨으로 종결될 수 있는 P5 및 P7 프라이머의 예에는 다음이 포함된다:
P5: AATGATACGGCGACCACCGAGAUCTACAC (서열 번호 7)
P7: CAAGCAGAAGACGGCATACGAG*AT (서열 번호 8)
및 이들의 유도체 또는 유사체. 일부 예에서, P7 서열은 G* 위치에서 변형된 구아닌, 예를 들어 8-옥소-구아닌을 포함한다. 다른 예에서, *는 G*와 인접 3' A 사이의 결합이 포스포로티오에이트 결합임을 나타낸다. 일부 예에서, P5 및/또는 P7 프라이머는 비천연 링커를 포함한다. 선택적으로, P5 및 P7 프라이머 중 하나 또는 둘 모두는 폴리 T 테일을 포함할 수 있다. 폴리 T 테일은 대체적으로 상기에 나타낸 서열의 5' 말단에, 예를 들어, 5' 염기와 말단 알킨 단위 사이에 위치하지만, 일부 경우에 3' 말단에 위치할 수 있다. 폴리 T 서열은 임의의 수의 T 뉴클레오타이드, 예를 들어, 2 내지 20개를 포함할 수 있다. P5 및 P7 프라이머가 예로서 주어지지만, 본 명세서에 제시된 실시예에서 임의의 적합한 프라이머가 사용될 수 있음이 이해되어야 한다. P5 및 P7 프라이머 서열을 포함하는 프라이머 서열을 갖는 인덱스 서열은 서열분석을 위한 라이브러리를 활성화시키기 위해 P5 및 P7을 첨가하는 역할을 한다.
본 명세서에 사용되는 바와 같이, 용어 프로브는 표적 분석물에, 예를 들어 표적 분석물 상의 태그에 특이적으로 결합하기에 충분한 결합 특성을 갖는 포획 분자를 지칭한다. 예를 들어, 프로브는 표적 핵산에 특이적으로 혼성화하기에 충분한 상보성을 갖는 폴리뉴클레오타이드를 포함할 수 있다. 예를 들어, 프로브는 폴리A 태그에 특이적으로 결합하기 위한 폴리T 서열을 포함할 수 있다. 다른 예에서, 프로브는 항체 또는 단백질 태그를 포함한다. 포획 프로브는 표적 핵산을 혼합물 내의 다른 핵산 및/또는 구성요소로부터 단리하기 위한 친화성-결합 분자로서 기능할 수 있다. 표적 핵산은 또한 표적 서열 및 포획 프로브 둘 모두에 특이적으로 혼성화하기에 충분한 상보성을 갖는 링커, 어댑터 및 다른 가교 핵산과 같은 개재 분자를 통해 포획 프로브에 의해 특이적으로 결합될 수 있다.
일부 실시형태에서, 프로브는 바코드를 추가로 포함한다. 바코드는 표적을 소정 샘플로부터의 것으로서 식별한다. 예를 들어, 바코드는 하나 이상의 분석물을 공통 공급원로부터 것으로서 식별하는 데 사용된다. 하나의 분석물을 식별하는 바코드는 상이한 분석물을 식별하는 바코드와 동일하거나 상이할 수 있다. 바코드들 사이의 관계가 알려져 있는 한, 바코드들은 분석물을 공통 공급원로부터의 것으로서 식별하는 데 사용될 수 있다.
일부 실시형태에서, 바코드는 어레이 내의 폴리뉴클레오타이드를 식별하는 데 사용될 수 있는 핵산 서열을 포함할 수 있다. 바코드는 다른 바코드와 구별가능한 고유한 뉴클레오타이드 서열을 포함할 수 있다. 이는 또한 바코드의 서열에 의해 그리고 또한 폴리뉴클레오타이드 내 바코드의 위치에 의해, 예를 들어 프라이머 결합 부위의 5′에서의 그의 위치에 의해 폴리뉴클레오타이드 및 표적 핵산 내의 다른 뉴클레오타이드 서열과 구별될 수 있다. 예를 들어, 일부 실시형태에서, 바코드의 서열은 복수의 핵산에 1회 초과로 존재할 수 있으나; 프라이머 결합 부위의 5'에 위치하는 바코드가 검출될 수 있다. 바코드는 집단 내 복수의 바코드 내에서 및/또는 분석 또는 조사 중인 복수의 폴리뉴클레오타이드 및 표적 핵산 내에서 고유한 뉴클레오타이드 서열이 되기에 충분한 임의의 원하는 서열 길이를 가질 수 있다. 일부 실시형태에서, 바코드는 약 1 내지 30개 뉴클레오타이드 이상의 범위의 폴리뉴클레오타이드 내의 핵산 또는 영역이다. 예를 들어, 바코드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오타이드 이상의 길이를 가질 수 있다. 일부 실시형태에서, 바코드는 35, 40, 45 또는 50개 뉴클레오타이드 이상일 수 있다. 일부 실시형태에서, 각각의 바코드가 다른 바코드와 상이하도록 바코드는 폴리뉴클레오타이드를 어레이 내의 다른 폴리뉴클레오타이드와 구별할 수 있다. 일부 실시형태에서, 한 세트의 바코드가 다른 세트의 바코드와 상이하도록 바코드는 폴리뉴클레오타이드의 집단을 어레이 내의 다른 폴리뉴클레오타이드의 집단과 구별할 수 있다.
일부 실시형태에서, 바코드는 전위를 이용하여 직접 삽입된다. 그러한 실시형태에서, 고체 지지체에 대한 결합 이벤트는 필요하지 않다. 따라서, 본 명세서에 제공된 임의의 실시형태에서, 관심 분석물은 고체 지지체와 함께 또는 고체 지지체 없이 동시에 분석된다.
일부 실시형태에서, 프로브는 고체 지지체 상에 고정될 수 있다. 고체 지지체는, 예를 들어, 에칭된 표면, 웰, 덮인 웰, 어레이, 플로우셀 장치, 미세유체 채널, 비드, 자성 비드, 컬럼, 소적, 또는 마이크로입자를 포함할 수 있다. 그러한 실시형태에서, 관심 분석물은 고정된 프로브에 의해 고체 지지체에 결합되며, 여기서 관심 분석물은 고체 지지체 상에서 추가의 처리 또는 분석을 거친다. 일부 실시형태에서, 고정된 프로브 및 고체 지지체는 용액 중에서 사용된다. 예를 들어, 고정된 지지체는 비드일 수 있고, 비드에 부착된 프로브는 용액 중에서 DNA 및 RNA와 같은 관심 분석물의 포획을 위해 용액에 가용성이다. 그러한 실시형태에서, 태깅된 관심 분석물은 용액 내의 프로브에 결합하고, 태깅된 관심 분석물은 용액 중에서 바코딩된다. 바코딩된 관심 분석물은 용액 중에서 추가의 처리 또는 분석을 거칠 수 있거나, 또는 자성 비드의 사용에 의한 것을 비롯한 풀다운(pull down) 검정을 사용하여 풀다운될 수 있다.
본 명세서에 사용되는 바와 같이 용어 플로우셀은 하나 이상의 유체 시약이 유동할 수 있는 고체 표면을 포함하는 챔버를 지칭한다. 본 발명의 방법에서 용이하게 사용될 수 있는 플로우셀 및 관련 유체 시스템 및 검출 플랫폼의 예는, 예를 들어, 미세유체 장치, 미세구조체, 미세웰, 미세적정판 등을 포함하고, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제 특허 공개 WO04/018497호; 미국 특허 제7,057,026호; 국제 특허 공개 WO 91/06678호; 국제 특허 공개 WO 07/123744호; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호, 및 미국 특허 출원 공개 제2008/0108082호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
본 명세서에 사용되는 바와 같이, "어레이"는 상이한 미세특징부(microfeature)들이 상대적 위치에 따라 서로 구별될 수 있도록 표면과 연관되거나 부착된 폴리뉴클레오타이드를 포함하는 미세특징부와 같은 상이한 미세특징부들의 집단을 지칭할 수 있다. 어레이의 개별 특징부가 미세특징부의 단일 카피를 포함할 수 있거나, 미세특징부의 다수의 카피가 어레이의 개별 특징부에서 미세특징부들의 집단으로서 존재할 수 있다. 각각의 특징부에서의 미세특징부들의 집단은 전형적으로 단일 종의 미세특징부를 갖는 동종이다. 따라서, 단일 핵산 서열의 다수의 카피가 특징부에, 예를 들어 동일한 서열을 갖는 다수의 핵산 분자 상에 존재할 수 있다.
일부 실시형태에서, 미세특징부들의 이종 집단이 특징부에 존재할 수 있다. 일부 실시형태에서, 특징부는 단일 미세특징부 종만을 포함할 수 있다. 일부 실시형태에서, 특징부는 복수의 상이한 미세특징부 종, 예컨대 상이한 서열을 갖는 핵산의 혼합물을 포함할 수 있다. 어레이의 이웃하는 특징부들은 서로 이산될 수 있다. 특징부들은 서로 인접하거나 갭에 의해 분리될 수 있다. 특징부가 이격되는 실시형태에서, 이웃하는 부위들은, 예를 들어 100 μm, 50 μm, 10 μm, 5 μm, 1 μm, 0.5 μm, 100 nm, 50 nm, 10 nm, 5 nm, 1 nm, 0.5 nm 미만의 거리, 또는 전술한 거리들 중 임의의 2개의 범위 내의 임의의 거리만큼 분리될 수 있다. 어레이 상의 특징부들의 레이아웃은 또한 이웃하는 특징부들 사이의 중심간 거리(center-to-center distance)의 관점에서 이해될 수 있다. 본 발명에 유용한 어레이는 중심간 간격이 약 100 μm, 50 μm, 10 μm, 5 μm, 1 μm, 0.5 μm, 100 nm, 50 nm, 10 nm, 5 nm, 1 nm, 0.5 nm 미만, 또는 전술한 거리들 중 임의의 2개의 범위 내의 임의의 거리인 이웃하는 특징부들을 가질 수 있다. 일부 실시형태에서, 본 명세서에 기재된 거리 값은 어레이의 이웃하는 특징부들 사이의 평균 거리를 나타낼 수 있다. 따라서, 예를 들어 거리가 어레이의 모든 이웃하는 특징부들 사이의 임계 거리를 구성한다는 구체적인 언급에 의해 특별히 반대로 지시되지 않는 한 모든 이웃하는 특징부들이 명시된 범위에 속할 필요는 없다. 실시형태들은 특징부를 다양한 밀도로 갖는 어레이를 포함할 수 있다. 소정 실시형태에 대한 밀도의 예시적인 범위는 약 10,000,000개의 특징부/㎠ 내지 약 2,000,000,000개의 특징부/㎠; 약 100,000,000개의 특징부/㎠ 내지 약 1,000,000,000개의 특징부/㎠; 약 100,000개의 특징부/㎠ 내지 약 10,000,000개의 특징부/㎠; 약 1,000,000개의 특징부/㎠ 내지 약 5,000,000개의 특징부/㎠; 약 10,000개의 특징부/㎠ 내지 약 100,000개의 특징부/㎠; 약 20,000개의 특징부/㎠ 내지 약 50,000개의 특징부/㎠; 약 1,000개의 특징부/㎠ 내지 약 5,000개의 특징부/㎠, 또는 전술한 밀도들 중 임의의 2개의 범위 내의 임의의 밀도를 포함한다.
본 명세서에 사용되는 바와 같이, "표면"은 시약, 비드 또는 분석물과 접촉할 수 있는 기질 또는 지지 구조체의 일부를 지칭할 수 있다. 표면은 실질적으로 편평하거나 평면일 수 있다. 대안적으로, 표면은 둥글거나 윤곽이 잡힐 수 있다. 표면 상에 포함될 수 있는 예시적인 윤곽은 웰, 함몰부, 기둥(pillar), 리지(ridge), 채널 등이다. 기질 또는 지지 구조체로서 사용될 수 있는 예시적인 재료는 유리, 예컨대 개질 또는 기능화된 유리; 플라스틱, 예컨대 아크릴, 폴리스티렌 또는 스티렌과 다른 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄 또는 테플론(TEFLON); 다당류 또는 가교결합된 다당류, 예컨대 아가로스 또는 세파로스; 나일론; 나이트로셀룰로오스; 수지; 실리카, 또는 규소 및 개질된 규소를 포함하는 실리카-기반 재료; 탄소-섬유; 금속; 무기 유리; 광섬유 다발(bundle), 또는 다양한 다른 중합체를 포함한다. 단일 재료 또는 몇몇 상이한 재료들의 혼합물이 본 발명에 유용한 표면을 형성할 수 있다. 일부 실시형태에서, 표면은 웰을 포함한다.
본 명세서에 사용되는 바와 같이, "비드"는 강성 또는 반강성 재료로 제조된 작은 물체(small body)를 지칭할 수 있다. 물체는, 예를 들어, 구형, 타원형, 미소구체, 또는 규칙적인 치수를 갖든 불규칙적인 치수를 갖든 다른 인식된 입자 형상을 특징으로 하는 형상을 가질 수 있다. 비드에 유용한 예시적인 재료는 유리, 예컨대 개질 또는 기능화된 유리; 플라스틱, 예컨대 아크릴, 폴리스티렌 또는 스티렌과 다른 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄 또는 테플론; 다당류 또는 가교결합된 다당류, 예컨대 아가로스 또는 세파로스; 나일론; 나이트로셀룰로오스; 수지; 실리카, 또는 규소 및 개질된 규소를 포함하는 실리카-기반 재료; 탄소-섬유; 금속; 무기 유리; 광섬유 다발, 또는 다양한 다른 중합체를 포함한다. 예시적인 비드는 제어된 기공 유리 비드, 상자성 비드, 토리아 졸, 세파로스 비드, 나노결정 및 당업계에 공지된 다른 것들을 포함한다. 비드는 생물학적 또는 비-생물학적 재료로 제조될 수 있다. 자성 비드는 자석을 사용한 자성 비드 조작의 용이성으로 인해 특히 유용하다. 소정 실시형태에서 사용되는 비드는 0.1 μm 내지 100 μm의 직경, 폭 또는 길이를 가질 수 있다. 비드 크기는, 특징부를 분석하기에 충분한 신호를 유지하면서, 감소된 크기를 갖도록, 따라서 증가된 밀도를 갖도록 선택될 수 있다.
본 명세서에 사용되는 바와 같이, "혼성화", "혼성화하는" 또는 이의 문법적 등가물은 하나 이상의 폴리뉴클레오타이드가 반응하여 적어도 부분적으로는 뉴클레오타이드 잔기의 염기들 사이의 수소 결합을 통해 형성되는 복합체를 형성하는 반응을 지칭할 수 있다. 수소 결합은 왓슨-크릭 염기 짝짓기(Watson-Crick base pairing), 후그스타인(Hoogstein) 결합, 또는 임의의 다른 서열-특이적 방식으로 일어날 수 있다. 복합체는 듀플렉스(duplex) 구조를 형성하는 2개의 가닥, 다중-가닥 복합체를 형성하는 3개 이상의 가닥, 단일 자가-혼성화 가닥, 또는 이들의 임의의 조합을 가질 수 있다. 가닥들은 또한 수소 결합에 더하여 가교결합될 수 있거나 힘에 의해 달리 결합될 수 있다.
본 명세서에 사용되는 바와 같이, "연장하는", "연장" 또는 이들의 임의의 문법적 등가물은 폴리머라제와 같은 연장 효소에 의해 프라이머, 폴리뉴클레오타이드 또는 다른 핵산 분자에 dNTP를 추가하는 것을 지칭할 수 있다. 예를 들어, 본 명세서에 개시된 일부 실시형태에서, 생성된 연장된 프라이머는 핵산의 서열 정보를 포함한다. 일부 실시형태는 DNA 폴리머라제와 같은 폴리머라제, 또는 역전사효소를 사용하여 연장을 수행하는 것으로 논의되지만, 연장은 당업계에 잘 알려진 임의의 다른 방식으로 수행될 수 있다. 예를 들어, 연장은 관심 가닥에 혼성화된 올리고뉴클레오타이드와 같은 올리고뉴클레오타이드를 함께 연결함으로써 수행될 수 있다.
본 명세서에 사용되는 바와 같이, "라이게이션" 또는 "라이게이션하는" 또는 이들의 다른 문법적 등가물은 포스포다이에스테르 결합에 의해 2개의 뉴클레오타이드 가닥을 결합하는 것을 지칭할 수 있다. 라이게이션은 화학적 라이게이션을 포함할 수 있다. 그러한 반응은 리가제에 의해 촉매될 수 있다. 리가제는 ATP 또는 유사한 트라이포스페이트의 가수분해에 의해 이러한 반응을 촉매하는 효소 부류를 지칭한다.
본 명세서에 제공된 일부 실시형태는 단일 검정을 사용하여 샘플 내의 다수의 분석물을 동시에 분석하는 것에 관한 것이며, 여기서 다수의 분석물은 DNA 및 RNA를 포함한다. 일부 실시형태에서, 표적 DNA 및 표적 RNA는 태깅에 의해 변형된다. 따라서, 일부 실시형태에서, 본 방법은 샘플 내의 DNA를 제1 태그에 의해 변형시키는 단계 및 샘플 내의 RNA를 제2 태그에 의해 변형시키는 단계를 포함한다. 일부 실시형태에서, 본 방법은 변형된 DNA를 제1 태그에 상보적인 제1 프로브로 포획하는 단계 및 변형된 RNA를 제2 태그에 상보적인 제2 프로브로 포획하는 단계를 포함한다. 일부 실시형태에서, 본 방법은 포획된 DNA 및 RNA를 분석하는 단계를 포함한다. 본 명세서에 사용되는 바와 같이, 용어 "제1 태그" 및 "제2 태그"는 태깅 이벤트의 임의의 특정 타이밍 또는 서열을 지칭하지 않는다. 오히려, 이들 용어는, 제1 분석물이 예를 들어 제1 태그로 지칭되는 하나의 태그를 포함하고, 제2 분석물이 예를 들어 제2 태그로 지칭되는 다른 태그를 포함한다는 것을 설명하기 위해 사용될 뿐이다. 본 명세서에 기재된 임의의 실시형태에서, 제1 태그와 제2 태그는 동일하거나 상이할 수 있다. 바코드는 공통 공급원으로부터 나온 것으로서 분석물들을 식별하는 반면, 태그는 소정 유형으로서, 예를 들어 DNA 또는 RNA로서 분석물을 식별한다.
일부 실시형태에서, 본 방법은 DNA 및 RNA에 더하여, 추가의 관심 분석물을 동시에 분석하는, 예를 들어 단백질을 분석하는 단계를 추가로 포함한다. 그러한 실시형태에서, 단백질과 같은 추가의 관심 분석물은 추가 태그에 의해 변형된다.
일부 실시형태에서, 제1 태그 및 제2 태그(또는 관련 있는 경우 추가 태그)는 상이하다. 일부 실시형태에서, 제1 태그 및 제2 태그(또는 관련 있는 경우 추가 태그)는 동일하다. 일부 실시형태에서, 제1 태그 및 제2 태그는 기질 인식 서열을 추가로 포함한다. 기질 인식 서열은, 기질을 인식하고 그에 결합하여 태그를 고정하는 서열이다. 일부 실시형태에서, 제1 태그의 기질 인식 서열은 제2 태그의 기질 인식 서열과 동일하다.
일부 실시형태에서, DNA는 도 2에 도시된 바와 같이, 태그멘테이션 공정을 통해 태깅된다. 도 2의 실시형태에서, 단리된 단일 세포 또는 핵(15)을 갖는 웰 플레이트(10)가 도시된다. 핵(15)은 핵(15) 내에 DNA(20) 및 mRNA(25)를 포함한다. 단일 세포 또는 핵(15)은 분석을 위해 소적 내에 캡슐화되거나 개별 웰 내에 분리될 수 있다. DNA(20)는 태그1(TAG1)로 태깅되는 것으로 나타나 있으며, 이는 태그멘테이션 또는 다른 태깅 공정, 예컨대 역전사, 라이게이션, 또는 DNA를 태깅하기 위한 다른 수단을 통해 유도될 수 있다. 도 2의 실시형태에서, mRNA(25)는 태그2(TAG2)로 태깅된다. 도 2는 또한 비드 또는 다른 표면일 수 있는 고체 지지체(40) 상에 고정된 프로브(30, 35)를 도시한다. DNA(20)에 특이적인 프로브(30)는 DNA(20) 상의 태그1에 특이적으로 결합하는 포획 요소인 태그1 포획 요소를 포함한다. mRNA(25)에 특이적인 프로브(35)는 mRNA(25) 상의 태그2에 특이적으로 결합하는 포획 요소인 태그2 포획 요소를 포함한다. 각각의 프로브는 또한 바코드를 포함하여, 관심 분석물, 이 경우에 DNA 및 mRNA의 인덱싱을 가능하게 한다.
일부 실시형태에서, 폴리A 테일을 포함하는 mRNA는 태깅되지 않는다. 예를 들어, 도 3에 나타나 있는 실시형태에서, 웰 플레이트(200)는, 폴리A 테일(215)을 갖지만 달리 태깅되지 않은 mRNA(210)를 포함하는 핵(205)을 갖는다. 도 3의 실시형태에서, gDNA(220)는 폴리A 테일(215)로 태깅된다. gDNA(220)의 태깅 후에, gDNA(220) 및 mRNA(210) 둘 모두는 폴리A 테일(215)을 포함한다. gDNA(220)는, 예를 들어, 태그멘테이션을 사용하여 폴리A 테일(215)로 태깅될 수 있다. 도 3에 도시된 바와 같이, 폴리A 테일(215)을 갖는 gDNA(220) 및 폴리A 테일(215)을 또한 갖는 mRNA(210)는 폴리T 포획 요소(230)를 포함하는 동일한 프로브(225)로 포획될 수 있다. 프로브(225)는 고체 지지체(240) 상에 고정된다. 따라서, gDNA(220) 및 mRNA(210)는 동시에 처리되고 동일한 바코드(235)가 할당된다. gDNA(220)는 태그멘테이션 공정 동안 혼입된 트랜스포존-특이적 서열에 기초하여 mRNA(210)와 구별될 수 있다. 이러한 개념은 도 4를 참조하여 추가로 상세히 설명된다.
도 4는 단일 샘플에서 gDNA 및 mRNA 둘 모두를 동시에 분석하는 예시적인 방법을 도시한다. 이 실시형태에서, 폴리A 트랜스포존은 전위에 의해 게놈 DNA 내로 도입된다. 핵/세포는 폴리T 테일을 갖는 인덱싱된 프로브로 캡슐화된다. 인덱싱된 프로브는 전위된 gDNA 단편에 혼성화 및 라이게이션되고, 이어서 mRNA와 혼성화된다. 이는 제1 cDNA를 생성한다. 전위 후, gDNA는 태그멘테이션-특이적 서열인 ME 서열을 포함한다. 제2 cDNA 합성 후, 이중 가닥 cDNA 및 gDNA는 PCR 어댑터를 포함하도록 다시 전위된다. 이어서, 단편은 PCR 증폭을 위해 준비된다.
본 명세서에 사용되는 바와 같이, 용어 "시약"은 샘플과 반응하거나, 샘플과 상호작용하거나, 샘플을 희석하거나, 또는 샘플에 첨가하기에 유용한 제제 또는 둘 이상의 제제들의 혼합물을 기술하며, 용해, 핵산 분석, 핵산 증폭 반응, 단백질 분석, 태그멘테이션 반응, ATAC-seq, CPT-seq, 또는 SCI-seq 반응, 또는 다른 검정을 위한 제제를 포함하는, 본 명세서에 기재된 검정에 사용되는 제제를 포함할 수 있다. 따라서, 시약은 예를 들어 완충제, 화학물질, 효소, 폴리머라제, 50개 염기쌍 미만의 크기를 갖는 프라이머, 주형 핵산, 뉴클레오타이드, 라벨, 염료, 또는 뉴클레아제를 포함할 수 있다. 일부 실시형태에서, 시약은 라이소자임, 프로테이나제 K, 랜덤 헥사머, 폴리머라제(예를 들어, Φ29 DNA 폴리머라제, Taq 폴리머라제, Bsu 폴리머라제), 트랜스포사제(예를 들어, Tn5), 프라이머(예를 들어, P5 및 P7 어댑터 서열), 리가제, 촉매 작용 효소(catalyzing enzyme), 데옥시뉴클레오타이드 트라이포스페이트, 완충제, 또는 2가 양이온을 포함한다.
일부 실시형태에서, 샘플은 단일 세포를 포함하고, 단일 세포는 고정된다. 일부 실시형태에서, 세포는 고정제(fixative)로 고정될 수 있다. 본 명세서에 사용되는 바와 같이, 고정제는 일반적으로 세포를 고정시킬 수 있는 제제를 지칭한다. 예를 들어, 고정된 세포는 세포 내 단백질 복합체, 핵산 복합체, 또는 단백질-핵산 복합체를 안정화시킬 수 있다. 적합한 고정제 및 가교결합제는 알코올 또는 알데하이드계 고정제, 포름알데하이드, 글루타르알데하이드, 에탄올계 고정제, 메탄올계 고정제, 아세톤, 아세트산, 사산화오스뮴, 중크롬산칼륨, 크롬산, 과망간산칼륨, 머큐리얼(mercurial), 피크레이트, 포르말린, 파라포름알데하이드, 아민-반응성 NHS-에스테르 가교결합제, 예컨대 비스[설포석신이미딜]수베레이트(BS3), 3,3′-다이티오비스[설포석신이미딜프로피오네이트](DTSSP), 에틸렌 글리콜 비스[설포석신이미딜석시네이트](설포-EGS), 다이석신이미딜 글루타레이트(DSG), 다이티오비스[석신이미딜 프로피오네이트](DSP), 다이석신이미딜 수베레이트(DSS), 에틸렌 글리콜 비스[석신이미딜석시네이트](EGS), NHS-에스테르/다이아지린 가교결합제, 예컨대 NHS-다이아지린, NHS-LC-다이아지린, NHS-SS-다이아지린, 설포-NHS-다이아지린, 설포-NHS-LC-다이아지린, 및 설포-NHS-SS-다이아지린을 포함할 수 있다. 일부 실시형태에서, 세포를 고정하는 것은 세포의 내부 상태를 보존함으로써, 후속 분석 동안 또는 검정의 수행 동안 세포의 변형을 방지한다.
일부 실시형태에서, 샘플은 핵산 공급원, 예컨대 단일 세포, 단일 핵, 또는 세포 집단 또는 핵 집단을 포함하며, 단일 세포, 단일 핵, 세포 집단, 또는 핵 집단은 소적 내에 캡슐화된다. 일부 실시형태에서, 세포는 캡슐화 전에 고정된다. 본 명세서에 사용되는 바와 같이, 소적은 하이드로겔 비드를 포함할 수 있으며, 이는 단일 세포를 캡슐화하기 위한 비드이고, 하이드로겔 조성물로 구성될 수 있다. 일부 실시형태에서, 소적은 하이드로겔 재료의 균질한 소적이거나, 중합체 하이드로겔 쉘을 갖는 중공형 소적이다. 균질하든 중공형이든 간에, 소적은 단일 세포를 캡슐화할 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "하이드로겔"은 유기 중합체(천연 또는 합성)가 공유 결합, 이온 결합, 또는 수소 결합을 통해 가교결합되어, 물 분자를 포획하여 겔을 형성하는 3차원 개방 격자 구조를 생성할 때 형성되는 물질을 지칭한다. 일부 실시형태에서, 하이드로겔은 생체적합성 하이드로겔일 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "생체적합성 하이드로겔"은, 살아 있는 세포에 대해 독성이 없으며 포획된 세포로의 산소 및 영양소의 충분한 확산을 허용하여 생존력을 유지하게 하는 겔을 형성하는 중합체를 지칭한다. 일부 실시형태에서, 하이드로겔 재료는 알기네이트, 아크릴아마이드, 또는 폴리-에틸렌 글리콜(PEG), PEG-아크릴레이트, PEG-아민, PEG-카르복실레이트, PEG-다이티올, PEG-에폭사이드, PEG-아이소시아네이트, PEG-말레이미드, 폴리아크릴산(PAA), 폴리(메틸 메타크릴레이트)(PMMA), 폴리스티렌(PS), 폴리스티렌 설포네이트(PSS), 폴리비닐피롤리돈(PVPON), N,N'-비스(아크릴로일)시스타민, 폴리프로필렌 옥사이드(PPO), 폴리(하이드록시에틸 메타크릴레이트)(PHEMA), 폴리(N-아이소프로필아크릴아마이드)(PNIPAAm), 폴리(락트산)(PLA), 폴리(락트-코-글리콜산)(PLGA), 폴리카프로락톤(PCL), 폴리(비닐설폰산)(PVSA), 폴리(L-아스파르트산), 폴리(L-글루탐산), 폴리라이신, 한천, 아가로스, 헤파린, 알기네이트 설페이트, 덱스트란 설페이트, 하이알루로난, 펙틴, 카라기난, 젤라틴, 키토산, 셀룰로오스, 콜라겐, 비스아크릴아마이드, 다이아크릴레이트, 다이알릴아민, 트라이알릴아민, 다이비닐 설폰, 다이에틸렌글리콜 다이알릴 에테르, 에틸렌글리콜 다이아크릴레이트, 폴리메틸렌글리콜 다이아크릴레이트, 폴리에틸렌글리콜 다이아크릴레이트, 트라이메틸올프로판 트라이메타크릴레이트, 에톡실화 트라이메틸올 트라이아크릴레이트, 또는 에톡실화 펜타에리트리톨 테트라아크릴레이트, 또는 이들의 조합 또는 혼합물을 포함한다. 일부 실시형태에서, 하이드로겔은 알기네이트, 아크릴아마이드, 또는 PEG계 재료이다. 일부 실시형태에서, 하이드로겔은 아크릴레이트-다이티올, 에폭사이드-아민 반응 화학 특성을 갖는 PEG계 재료이다. 일부 실시형태에서, 하이드로겔은 PEG-말레이미드/다이티올 오일, PEG-에폭사이드/아민 오일, PEG-에폭사이드/PEG-아민, 또는 PEG-다이티올/PEG-아크릴레이트를 포함하는 중합체 쉘을 형성한다. 일부 실시형태에서, 하이드로겔 재료는 세포내 생체분자를 손상시킬 가능성이 있는 자유 라디칼의 생성을 피하도록 선택된다. 일부 실시형태에서, 하이드로겔 중합체는 60 내지 90%의 유체, 예를 들어 물, 및 10 내지 30%의 중합체를 포함한다. 소정 실시형태에서, 하이드로겔의 물 함량은 약 70 내지 80%이다. 본 명세서에 사용되는 바와 같이, 용어 "약" 또는 "대략"은, 수치 값을 수식할 때, 수치 값에서 발생할 수 있는 변동을 지칭한다. 예를 들어, 특정 기질 또는 구성요소의 제조상 차이로 인해 변동이 발생할 수 있다. 일 실시형태에서, 용어 "약"은 언급된 수치 값의 1%, 5%, 또는 최대 10% 이내를 의미한다.
하이드로겔은 친수성 생체중합체 또는 합성 중합체를 가교결합함으로써 제조될 수 있다. 따라서, 일부 실시형태에서, 하이드로겔은 가교결합제를 포함할 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "가교결합제"는 적절한 베이스 단량체와 반응할 때 3차원 네트워크를 형성할 수 있는 분자를 지칭한다. 하나 이상의 가교결합제를 포함할 수 있는 하이드로겔 중합체의 예에는 하이알루로난, 키토산, 한천, 헤파린, 설페이트, 셀룰로오스, 알기네이트(알기네이트 설페이트를 포함함), 콜라겐, 덱스트란(덱스트란 설페이트를 포함함), 펙틴, 카라기난, 폴리라이신, 젤라틴(젤라틴 타입 A를 포함함), 아가로스, (메트)아크릴레이트-올리고락타이드-PEO-올리고락타이드-(메트)아크릴레이트, PEO-PPO-PEO 공중합체(플루로닉스(Pluronics)), 폴리(포스파젠), 폴리(메타크릴레이트), 폴리(N-비닐피롤리돈), PL(G)A-PEO-PL(G)A 공중합체, 폴리(에틸렌 이민), 폴리에틸렌 글리콜(PEG)-티올, PEG-아크릴레이트, 아크릴아마이드, N,N'-비스(아크릴로일)시스타민, PEG, 폴리프로필렌 옥사이드(PPO), 폴리아크릴산, 폴리(하이드록시에틸 메타크릴레이트)(PHEMA), 폴리(메틸 메타크릴레이트)(PMMA), 폴리(N-아이소프로필아크릴아마이드)(PNIPAAm), 폴리(락트산)(PLA), 폴리(락트산-코-글리콜산)(PLGA), 폴리카프로락톤(PCL), 폴리(비닐설폰산)(PVSA), 폴리(L-아스파르트산), 폴리(L-글루탐산), 비스아크릴아마이드, 다이아크릴레이트, 다이알릴아민, 트라이알릴아민, 다이비닐 설폰, 다이에틸렌글리콜 다이알릴 에테르, 에틸렌글리콜 다이아크릴레이트, 폴리메틸렌글리콜 다이아크릴레이트, 폴리에틸렌글리콜 다이아크릴레이트, 트라이메틸올프로판 트라이메타크릴레이트, 에톡실화 트라이메틸올 트라이아크릴레이트, 또는 에톡실화 펜타에리트리톨 테트라아크릴레이트, 또는 이들의 조합이 포함되지만 이로 한정되지 않는다. 따라서, 예를 들어, 조합은 중합체 및 가교결합제, 예를 들어 폴리에틸렌 글리콜(PEG)-티올/PEG-아크릴레이트, 아크릴아마이드/N,N'-비스(아크릴로일)시스타민(BACy), 또는 PEG/폴리프로필렌 옥사이드(PPO)를 포함할 수 있다. 일부 실시형태에서, 중합체 쉘은 4-아암(four-arm) 폴리에틸렌 글리콜(PEG)을 포함한다. 일부 실시형태에서, 4-아암 폴리에틸렌 글리콜(PEG)은 PEG-아크릴레이트, PEG-아민, PEG-카르복실레이트, PEG-다이티올, PEG-에폭사이드, PEG-아이소시아네이트, 및 PEG-말레이미드로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 가교결합제는 순간(instantaneous) 가교결합제 또는 저속(slow) 가교결합제이다. 순간 가교결합제는 하이드로겔 중합체를 즉각적으로 가교결합하는 가교결합제이며, 본 명세서에서 클릭 화학(click chemistry)으로 지칭된다. 순간 가교결합제는 다이티올 오일 + PEG-말레이미드 또는 PEG 에폭사이드 + 아민 오일을 포함할 수 있다. 저속 가교결합제는 하이드로겔 중합체를 천천히 가교결합하는 가교결합제이며, PEG-에폭사이드 + PEG-아민 또는 PEG-다이티올 + PEG-아크릴레이트를 포함할 수 있다. 저속 가교결합제는 가교결합하는 데 수 시간 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12시간 초과가 걸릴 수 있다. 본 명세서에 제공된 일부 실시형태에서, 소적은 순간 가교결합제에 의해 제형화되므로, 저속 가교결합제와 비교하여 세포 상태가 더 우수하게 보존된다. 이론에 의해 구애됨이 없이, 세포는 더 긴 가교결합 시간 동안 세포내 신호전달 메커니즘에 의해 생리학적 변화를 겪을 수 있다.
일부 실시형태에서, 가교결합제는 하이드로겔 중합체 내에 다이설파이드 결합을 형성하여 하이드로겔 중합체를 연결한다. 일부 실시형태에서, 하이드로겔 중합체는 기공을 갖는 하이드로겔 매트릭스(예를 들어, 다공성 하이드로겔 매트릭스)를 형성한다. 이러한 기공은 소적 내에 단일 세포 또는 그로부터 추출된 핵산과 같은 충분히 큰 입자를 유지할 수 있지만, 시약과 같은 다른 재료가 기공을 통과함으로써 소적 내외로 통과하도록 허용한다. 일부 실시형태에서, 소적의 기공 크기는 중합체의 농도 대 가교결합제의 농도의 비를 변화시킴으로써 미세하게 조정된다. 일부 실시형태에서, 중합체 대 가교결합제의 비는 30:1, 25:1, 20:1, 19:1, 18:1, 17:1, 16:1, 15:1, 14:1, 13:1, 12:1, 11:1, 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:15, 1:20, 또는 1:30이거나, 또는 전술한 값들 중 임의의 2개의 비에 의해 정의되는 범위 내의 비이다. 일부 실시형태에서, 상이한 응용의 요건을 충족시키기 위해 추가 기능, 예컨대 DNA 프라이머 또는 하전된 화학 기가 중합체 매트릭스에 그래프팅될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "다공도"는 개방 공간, 예를 들어 기공 또는 다른 개구로 구성된 하이드로겔의 부피 분율(무차원)을 의미한다. 따라서, 다공도는 물질 내의 공극 공간의 척도이며, 0 내지 100%의 백분율(또는 0 내지 1)로서의, 총 부피에 대한 공극의 부피의 분율이다. 하이드로겔의 다공도는 0.5 내지 0.99, 약 0.75 내지 약 0.99, 또는 약 0.8 내지 약 0.95의 범위일 수 있다.
일부 실시형태에서, 소적은 단일 세포 또는 그로부터 추출된 핵산을 유지하는 동시에 시약의 충분한 확산을 허용하는 임의의 기공 크기를 가질 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "기공 크기"는 기공 단면의 직경 또는 유효 직경을 지칭한다. 용어 "기공 크기"는 또한 복수의 기공의 측정에 기초한 기공 단면의 평균 직경 또는 평균 유효 직경을 지칭할 수 있다. 원형이 아닌 단면의 유효 직경은 비원형 단면의 단면적과 동일한 단면적을 갖는 원형 단면의 직경과 동일하다. 일부 실시형태에서, 하이드로겔은 하이드로겔이 수화될 때 팽윤될 수 있다. 이어서, 하이드로겔 내의 물 함량에 따라 기공 크기가 변할 수 있다. 일부 실시형태에서, 하이드로겔의 기공은 하이드로겔 내에 캡슐화된 세포를 유지하지만 시약이 통과하도록 허용하기에 충분한 크기의 기공을 가질 수 있다. 일부 실시형태에서, 소적의 내부는 수성 환경이다. 일부 실시형태에서, 소적 내에 배치된 단일 세포는 소적의 중합체 쉘과의 상호작용이 없고/없거나 중합체 쉘과 접촉하지 않는다. 일부 실시형태에서, 중합체 쉘이 세포 주위에 형성되고, 수동적 흡착으로 인해 또는 표적화된 방식으로, 예컨대 항체 또는 다른 특이적 결합 분자에 부착됨으로써 중합체 쉘이 세포 표면으로 이동하기 때문에 세포는 중합체 쉘과 접촉한다.
일부 실시형태에서, 소적은 단일 세포를 캡슐화하기에 충분한 크기를 갖는다. 일부 실시형태에서, 소적은 약 20 μm 내지 약 200 μm, 예컨대 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 μm의 직경, 또는 전술한 값들 중 임의의 2개의 값에 의해 정의되는 범위 내의 직경을 갖는다. 소적의 크기는 환경적 요인으로 인해 변할 수 있다. 일부 실시형태에서, 소적은 연속 오일상으로부터 분리되어 수성상 중에 침지될 때 팽창된다. 일부 실시형태에서, 소적의 팽창은 캡슐화된 세포 내부의 유전 물질에 대한 검정을 수행하는 효율을 증가시킨다. 일부 실시형태에서, 소적의 팽창은 인덱싱된 삽입체가 PCR 동안 증폭될 더 큰 환경을 생성하며, 이는 그렇지 않으면 현재의 세포 기반 검정에서 제한될 수 있다.
일부 실시형태에서, 소적은 동적 수단, 예컨대 볼텍스 보조 에멀젼(vortex assisted emulsion), 미세유체 소적 생성, 또는 밸브 기반 미세유체학에 의해 제조된다. 일부 실시형태에서, 소적은 균일한 크기 분포로 제형화된다. 일부 실시형태에서, 소적의 크기는 마이크로유체 장치의 크기, 하나 이상의 채널의 크기, 또는 미세유체 채널을 통한 유량을 조정함으로써 미세하게 조정된다. 일부 실시형태에서, 생성된 소적은 20 내지 200 μm 범위의 직경, 예를 들어 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 μm의 직경을 갖거나, 또는 전술한 값들 중 임의의 2개의 값에 의해 정의되는 범위 내의 직경을 갖는다.
일부 실시형태에서, 하나 이상의 분석물을 분석하는 것은 분석물이 무엇인지에 따라 다양한 분석을 포함할 수 있다. 예를 들어, 분석은 DNA 분석, RNA 분석, 단백질 분석, 태그멘테이션, 핵산 증폭, 핵산 서열분석, 핵산 라이브러리 제조, 트랜스포사제-접근가능 염색질 이용 서열분석 검정(ATAC-seq), 인접-보존 전위(CPT-seq), 단일 세포 조합 인덱스 서열분석(SCI-seq), 또는 단일 세포 게놈 증폭, 또는 이들의 임의의 조합을 포함할 수 있다.
DNA 분석은 DNA를 증폭, 서열분석, 또는 달리 분석하는 데 사용되는 임의의 기술을 지칭한다. DNA 증폭은 PCR 기술 또는 파이로시퀀싱(pyrosequencing)을 사용하여 달성될 수 있다. DNA 분석은 또한 비-표적화된, 비-PCR 기반 DNA 서열분석(예를 들어, 메타게놈(metagenomics)) 기술을 포함할 수 있다. 비제한적인 예로서, DNA 분석은 16S rDNA(리보솜 DNA)의 초가변 영역을 서열화하는 단계 및 DNA를 통한 종 동정을 위한 서열분석을 사용하는 단계를 포함할 수 있다.
RNA 분석은 RNA를 증폭, 서열분석, 또는 달리 분석하는 데 사용되는 임의의 기술을 지칭한다. DNA를 분석하는데 사용되는 동일한 기술이 RNA를 증폭시키고 서열분석하는 데 사용될 수 있다. DNA보다 덜 안정한 RNA는 자극에 반응하는 DNA의 번역이다. 따라서, RNA 분석은 커뮤니티의 대사적으로 활성인 구성원들의 더 정확한 그림을 제공할 수 있고, 샘플 내의 유기체의 커뮤니티 기능에 대한 정보를 제공하는 데 사용될 수 있다. 또한, DNA 및 RNA 둘 모두의 동시 분석은 DNA 및 RNA 관련 조사 둘 모두의 효율적인 결정에 유익할 수 있다. 핵산 서열분석은 DNA 또는 RNA와 같은 핵산 분자의 서열에서 뉴클레오타이드의 순서를 결정하기 위한 서열분석의 사용을 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "서열분석"은 폴리뉴클레오타이드의 적어도 10개의 연속 뉴클레오타이드의 동일성(예를 들어, 적어도 20개, 적어도 50개, 적어도 100개 또는 적어도 200개 이상의 연속 뉴클레오타이드의 동일성)을 얻는 방법을 지칭한다.
용어 "차세대 서열분석" 또는 "고처리량 서열분석" 또는 "NGS"는 일반적으로, 대량 병렬 시그니처 서열분석, 고처리량 서열분석, 라이게이션에 의한 서열분석(예컨대, SOLiD 서열분석), 양성자 이온 반도체 서열분석, DNA 나노볼 서열분석, 단일 분자 서열분석, 및 나노기공 서열분석을 포함하지만 이에 한정되지 않는 고처리량 서열분석 기술을 지칭하고, 일루미나(Illumina), 라이프 테크놀로지스(Life Technologies), 또는 로슈(Roche) 등에 의해 현재 채용되는 병렬식의 합성에 의한 서열분석(parallelized sequencing-by-synthesis) 또는 라이게이션에 의한 서열분석(sequencing-by-ligation) 플랫폼을 지칭할 수 있다. 차세대 서열분석 방법은 또한 나노기공 서열분석 방법 또는 전자-검출 기반 방법, 예컨대 라이프 테크놀로지스에 의해 상품화된 이온 토렌트(Ion Torrent) 기술 또는 퍼시픽 바이오사이언시즈(Pacific Biosciences)에 의해 상품화된 단일 분자 형광 기반 방법을 포함할 수 있다.
단백질 분석은 단백질의 연구를 지칭하며, 프로테오믹(proteomic) 분석, 관심 단백질의 번역 후 변형(post-translational modification)의 결정, 단백질 발현 수준의 결정, 또는 다른 단백질 또는 핵산을 포함하는 다른 분자와의 단백질 상호작용의 결정을 포함할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "태그멘테이션"은 트랜스포존 말단 서열을 포함하는 어댑터와 복합체화된 트랜스포사제 효소를 포함하는 트랜스포좀 복합체에 의한 DNA의 변형을 지칭한다. 태그멘테이션은 DNA의 동시 단편화, 및 듀플렉스 단편의 두 가닥의 5' 말단에 대한 어댑터의 라이게이션을 초래한다. 트랜스포사제 효소를 제거하기 위한 정제 단계 후에, 추가 서열이, 예를 들어 PCR, 라이게이션, 또는 당업자에게 공지된 임의의 다른 적합한 방법에 의해, 조정된 단편의 말단에 첨가될 수 있다.
트랜스포사제-접근가능 염색질 이용 서열분석 검정(ATAC-seq)은 통합적 후성유전체학 분석의 신속하고 민감한 방법을 지칭한다. ATAC-seq는 개방 염색질 부위를 포획하고, 개방 염색질의 게놈 위치, DNA 결합 단백질, 개별 뉴클레오좀, 및 뉴클레오타이드 분해능을 갖는 조절 영역에서의 고차 압밀(compaction) 사이의 상호작용을 드러낸다. 뉴클레오좀을 엄격하게 회피하거나, 견딜 수 있거나, 그와 중첩하는 경향이 있는 DNA 결합 인자의 부류가 발견되었다. ATAC-seq를 사용하여, 휴면 인간 T 세포의 일련의 일일 후성유전체를 측정하고, 표준 채혈을 통해 프로 밴드(pro band)로부터 평가하였으며, 이는 건강 및 질병을 모니터링하기 위한 임상 시간스케일에서 개인 후성유전체를 판독하는 것의 실현가능성을 입증하였다. 더 구체적으로, ATAC-seq는 단일 세포로부터의 염색질을 삽입 효소 복합체로 처리하여 게놈 DNA의 태깅된 단편을 생성함으로써 수행될 수 있다. 이 단계에서, 염색질은 염색질의 개방 영역에서 게놈 DNA를 절단하고 단편의 양쪽 말단에 어댑터를 추가하는 Tn5 또는 MuA와 같은 삽입 효소를 사용하여 태그멘테이션된다(예를 들어, 동일한 반응에서 단편화 및 태깅된다). 도 5a에 약술된 바와 같이, ATAC-seq는 개방 염색질 상태에서만 전위를 허용하고, 일반적으로 문헌[Buenrostro et al. (Nature Methods, 2013, 10, 1213-1218)]에 기재되어 있으며, 이는 전체적으로 본 명세서에 참고로 포함된다.
본 명세서에 기재된 방법, 조성물, 또는 시스템의 임의의 실시형태에서, ATAC-seq는 단일 세포에 대해 또는 벌크(bulk)로 수행될 수 있다. 단일 세포 ATAC-seq는 단일 세포 후성유전학적 분석을 가능하게 하고, 예를 들어, 소적 또는 비드 내에 단일 세포 또는 단일 핵을 캡슐화함으로써 구획에서 수행될 수 있다. 본 명세서에 사용되는 바와 같이, 구획이라는 용어는 반응이 일어날 수 있는 한정된 공간의 물리적 또는 가상 지정을 지칭한다. 예를 들어, 구획은 비드, 소적, 웰, 또는 다른 물리적 파라미터일 수 있으며 이는 구성요소가 유지될 수 있는, 예를 들어 단일 세포가 실험 및 분석을 거칠 수 있는 영역을 한정한다. 용어 공동-구획화는 단일 구획 내에 있는 것을 지칭한다. 예를 들어, 2개의 분석물이 공동-구획된다고 할 때, 분석물들은 둘 모두 동일한 구획 내에 있다. 공동-구획화된 반응 생성물은 동일한 구획 내에 배치되거나 동일한 구획 내에서 제조된(예를 들어, 동일한 반응 조건 하에 단일 환경에서 제조된) 생성물을 지칭한다.
비드 또는 소적 내의 단일 세포 또는 단일 핵의 캡슐화는 비드 내에서 단일 세포 또는 핵을 분할함으로써 수행될 수 있다. 캡슐화 시에, 단일 세포는 도 5b에 약술된 바와 같이 ATAC-seq를 거친다. 단일 세포 ATAC-seq에서, 세포(또는 핵)는 개별적으로 구획화되고, 태그멘테이션되고, 분석될 수 있다. 이는 인접 보존 전위(CPT-seq)를 가능하게 하게 하는데, 그 이유는 단일 세포로부터의 모든 DNA 또는 라이브러리가 단일 소적에 캡슐화되는 것을 보장하기 때문이다. 보통, 전위는 어댑터를 삽입하고 트랜스포사제의 제거 후에 DNA를 단편화시킨다. 이에 의해, 단편화는 다양한 세포로부터의 리드(read)를 소적으로 스크램블하여, 단일 세포 분해능을 얻을 수 없도록 한다. 대조적으로, 본 명세서에 제공된 방법은 트랜스포사제가 모든 개별 DNA/라이브러리 단편을 함께 유지할 수 있게 하여, 단일 세포로부터의 모든 재료가 단일 소적 내로 이동될 수 있다. 이어서, 단일 소적 내의 세포로부터의 모든 단편을 (소적 내로 로딩된 비드로부터) 바코딩된 프라이머를 사용하여 PCR을 통해 인덱싱할 수 있다. CPT-seq는 일반적으로 문헌[Amini et al. (Nat Genet, 2014, 46, 1343-1349)]에 기재되어 있으며, 이는 전체적으로 본 명세서에 참고로 포함된다. 또한, 일부 실시형태에서, 단일 세포 ATAC-seq가 조합 인덱싱을 위해 사용될 수 있다. 조합 인덱싱 또는 분할(split) 및 풀(pool) 인덱싱이 단일 세포/단일 핵 분해능을 유지하면서 동일한 웰 또는 소적에서 다수의 세포를 로딩하는 데 사용될 수 있다. 일부 실시형태에서, 인덱스는 샘플 식별, 실험 조건, 또는 동일한 세포에 대해 사용될 수 있다. 조합 인덱싱은 소적 이용 및 세포 처리량을 증가시키기 위해 사용될 수 있고, 단일 세포 또는 핵과 함께 사용될 수 있다.
일부 경우에, 조건은 염색질에서 바람직한 수준의 삽입(예컨대, 개방 영역에서 평균 50 내지 200개의 염기쌍마다 일어나는 삽입)을 얻도록 조정될 수 있다. 본 방법에 사용되는 염색질은 임의의 적합한 방법에 의해 제조될 수 있다. 일부 실시형태에서, 핵은 단리되고 용해될 수 있고, 염색질은 예를 들어, 핵막(nuclear envelope)으로부터 추가로 정제될 수 있다. 다른 실시형태에서, 염색질은 단리된 핵을 반응 완충제와 접촉시킴으로써 단리될 수 있다. 이들 실시형태에서, 단리된 핵은, 삽입 효소 복합체가 염색질에 접근할 수 있게 하는, 반응 완충제(삽입 효소 복합체 및 다른 필요한 시약을 포함함)와의 접촉이 일어날 때 용해될 수 있다. 이들 실시형태에서, 본 방법은 세포 집단으로부터 핵을 단리하는 단계; 및 단리된 핵을 트랜스포사제 및 어댑터와 조합하는 단계를 포함할 수 있으며, 여기서 조합은 상기 염색질을 방출하기 위한 핵의 용해 및 게놈 DNA의 어댑터-태깅된 단편의 생성을 둘 다 초래한다. 염색질은 다른 방법(예를 들어, ChIP-SEQ 방법)에서와 같은 가교결합을 필요로 하지 않는다.
염색질이 단편화되고 태깅되어 게놈 DNA의 태깅된 단편을 생성한 후에, 어댑터 태깅된 단편의 적어도 일부를 서열분석하여 복수의 서열 리드를 생성한다. 단편은 임의의 적합한 방법을 사용하여 서열분석될 수 있다. 예를 들어, 단편은 일루미나의 가역적 종결자(reversible terminator) 방법, 로슈의 파이로시퀀싱 방법(454), 라이프 테크놀로지스의 라이게이션에 의한 서열분석(SOLiD 플랫폼) 또는 라이프 테크놀로지스의 이온 토렌트 플랫폼을 사용하여 서열분석될 수 있다. 그러한 방법의 예는 하기 참고문헌: 문헌[Margulies et al. (Nature 2005 437: 376-80)]; 문헌[Ronaghi et al. (Analytical Biochemistry 1996 242: 84-9)]; 문헌[Shendure et al. (Science 2005 309: 1728-32)]; 문헌[Imelfort et al. (Brief Bioinform. 2009 10:609-18)]; 문헌[Fox et al. (Methods Mol Biol. 2009;553:79-108)]; 문헌[Appleby et al. (Methods Mol Biol. 2009; 513:19-39)] 및 문헌[Morozova et al. (Genomics. 2008 92: 255-64])에 기재되어 있으며, 이들은 모든 출발 생성물, 라이브러리 제조 방법, 시약, 및 각각의 단계에 대한 최종 생성물을 비롯한, 본 방법 및 본 방법의 특정 단계의 일반적인 설명에 대해 본 명세서에 참고로 포함된다. 분명하게, 선택된 차세대 서열분석 플랫폼과 상용성이 있는 정방향 및 역방향 서열분석 프라이머 부위가 증폭 단계 동안 단편의 말단에 추가될 수 있다. 소정 실시형태에서, 단편은 단편에 첨가된 태그에 혼성화되는 PCR 프라이머를 사용하여 증폭될 수 있으며, 여기서 PCR에 사용되는 프라이머는 특정 서열분석 플랫폼과 상용성이 있는 5' 테일을 갖는다. ATAC-seq를 수행하는 방법은 본 명세서에 전체적으로 참고로 포함된 국제 특허 출원 PCT/US2014/038825호에 기술되어 있다.
본 명세서에 사용되는 바와 같이, 용어 "염색질"은 진핵 세포의 핵에서 발견되는 바와 같은 단백질 및 폴리뉴클레오타이드(예를 들어, DNA, RNA)를 포함하는 분자들의 복합체를 지칭한다. 염색질은 부분적으로는 뉴클레오좀을 형성하는 히스톤 단백질, 게놈 DNA, 및 게놈 DNA에 일반적으로 결합되는 다른 DNA 결합 단백질(예를 들어, 전사 인자)로 구성된다.
인접-보존 전위 서열분석(CPT-seq)은 트랜스포사제를 사용하여 표적 핵산에 인접한 주형 핵산 단편의 결합을 유지함으로써 인접 정보를 보존하면서 서열분석하는 방법을 지칭한다. 예를 들어, CPT는 핵산, 예컨대 DNA 또는 RNA에 대해 수행될 수 있다. CPT-핵산은 고유한 인덱스 또는 바코드를 갖는 상보적 올리고뉴클레오타이드의 혼성화에 의해 포획되고 고체 지지체 상에 고정될 수 있다. 일부 실시형태에서, 고체 지지체 상에 고정된 올리고뉴클레오타이드는 바코드에 더하여 프라이머-결합 부위, 고유한 분자 인덱스를 추가로 포함할 수 있다. 유리하게는, 단편화된 핵산의 물리적 근접성을 유지하기 위한 트랜스포좀의 이러한 사용은 동일한 원래 분자, 예컨대, 염색체로부터의 단편화된 핵산이 고체 지지체 상에 고정된 올리고뉴클레오타이드로부터의 동일한 고유한 바코드 및 인덱스 정보를 수용할 가능성을 증가시킨다. 이는 고유한 바코드를 갖는 인접하여 연결된 서열분석 라이브러리를 생성할 것이다. 인접하여 연결된 서열분석 라이브러리는 연속된 서열 정보를 도출하기 위해 서열분석될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "인접 정보"는 공유된 정보에 기초한 2개 이상의 DNA 단편 사이의 공간적 관계를 지칭한다. 정보의 공유 측면은 인접, 구획 및 거리 공간 관계와 관련될 수 있다. 이러한 관계에 관한 정보는 결국 DNA 단편으로부터 유래된 서열 리드의 계층적 조립 또는 맵핑을 용이하게 한다. 이러한 인접 정보는 그러한 조립 또는 맵핑의 효율 및 정확성을 개선하는데, 그 이유는 종래의 샷건 서열분석과 관련하여 사용되는 전통적인 조립 또는 맵핑 방법은 개별서열 리드가 도출되는 2개 이상의 DNA 단편 사이의 공간적 관계와 관련하여 개별 서열 리드의 상대적 게놈 기원 또는 좌표를 고려하지 않기 때문이다.
따라서, 본 명세서에 기재된 실시형태에 따르면, 인접 정보를 포획하는 방법은 인접 공간 관계를 결정하는 단거리 인접 방법, 구획 공간 관계를 결정하는 중거리 인접 방법, 또는 거리 공간 관계를 결정하는 원거리 인접 방법에 의해 수행될 수 있다. 이들 방법은 DNA 서열 조립 또는 맵핑의 정확도 및 품질을 용이하게 하고, 본 명세서에 기재된 것과 같은 임의의 서열분석 방법과 함께 사용될 수 있다.
인접 정보는 개별 서열 리드가 도출되는 2개 이상의 DNA 단편 사이의 공간적 관계와 관련하여 개별 서열 리드의 상대적 게놈 기원 또는 좌표를 포함한다. 일부 실시형태에서, 인접 정보는 중첩되지 않은 서열 리드로부터의 서열 정보를 포함한다.
일부 실시형태에서, 표적 핵산 서열의 인접 정보는 일배체형(haplotype) 정보를 나타낸다. 일부 실시형태에서, 표적 핵산 서열의 인접 정보는 게놈 변이체를 나타낸다.
단일 세포 조합 인덱스 서열분석(SCI-seq)은 체세포 카피수 변이 검출을 위한 수천 개의 저역(low-pass) 단일 세포 라이브러리를 동시에 생성하기 위한 서열분석 기술이다. 본 명세서에 제공된 일부 실시형태는, SCI-seq에 의한 것과 같은 조합 인덱싱 접근법을 사용하여 샘플 내의 다수의 분석물을 동시에 분석하는 방법, 조성물 및 시스템에 관한 것이다. 예를 들어, 도 10에 나타나 있는 바와 같이, DNA 및 RNA는 SCI-seq를 사용하여 동시에 인덱싱될 수 있다. DNA 및 RNA에 대한 특정 태그의 도입 후에, 세포/핵은 물리적으로 다수의 그룹으로 분리된다. 각각의 군에 대해, DNA는 제1 바코드(도 10의 바코드I)로 표지되고, RNA는 제2 바코드(도 10의 바코드J)로 표지된다. DNA 및 RNA의 표지화는 동시에 또는 순차적으로 일어날 수 있다. 이어서, 그룹들은 함께 풀링되고, 다수의 그룹들로 랜덤으로 분할되며, 이는 제3 바코드(도 10의 바코드K)로 추가로 표지될 수 있다. 풀 및 분할 공정은 인덱싱 용량을 증가시키기 위해 다수의 라운드 동안 반복될 수 있다. 인덱싱 충돌률(indexing collision rate)(상이한 세포들/핵들에 대해 동일한 바코드)은 라운드당 바코드 수 및 그룹당 세포/핵 수에 의해 제어될 수 있다. 바코드는 역전사 효소에 의해, 라이게이션에 의해, 태그멘테이션에 의해, 또는 바코드를 도입하기 위한 다른 수단에 의해 도입될 수 있다. 일부 실시형태에서, 본 명세서에 기재된 조합 서열분석 기술은 세포로부터 핵을 분리하거나 단리하는 것을 필요로 하지 않는다.
도 11은 라이게이션 및 연장에 의한 인덱싱을 사용한, SCI-seq에 의한 것과 같은 조합 서열분석의 세부 사항을 추가로 예시한다. 태그1을 갖는 트랜스포존이 전위에 의해 게놈 DNA 내로 삽입된다. 바코드I 및 태그2를 갖는 올리고뉴클레오타이드는 태그1 혼성화를 통해 gDNA에 라이게이션된다. 바코드J 및 태그2를 갖는 폴리T 올리고뉴클레오타이드에 의해 제1 cDNA 합성이 개시되고, 제2 cDNA 합성이 뒤따른다. 풀 및 분할 공정 후에, 바코드K를 갖는 올리고뉴클레오타이드는 태그2 영역 상의 gDNA 및 cDNA 둘 모두에 혼성화되고 갭 충전 라이게이션을 통해 라이게이션된다. 태그3(TAG3)은 분할 및 풀 후에 다음 라운드 인덱싱을 위한 앵커로서 기능할 수 있다. 조합 인덱싱 후에, 다른 말단상의 PCR/라이브러리 어댑터가 제2 전위에 의해 추가될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "단리된", "단리하기 위한", "단리", "정제된", "정제하기 위한", "정제", 및 본 명세서에 사용되는 바와 같은 이들의 문법적 등가물은, 달리 명시되지 않는 한, 샘플로부터의 또는 재료가 단리되는 공급원(예들 들어, 세포)으로부터의 적어도 하나의 오염물(예를 들어, 단백질 및/또는 핵산 서열)의 양의 감소를 지칭한다. 따라서, 정제는 "풍부화", 예를 들어, 샘플 내의 바람직한 단백질 및/또는 핵산 서열의 양의 증가를 초래한다.
핵산의 용해 및 단리 후에, 특히 단일 세포로부터 소량의 DNA를 증폭시키기 위해 널리 사용되는 기술인 다중 변위 증폭(multiple displacement amplification, MDA)과 같은 증폭이 수행될 수 있다. 일부 실시형태에서, 핵산은 핵산 라이브러리의 제조를 위해 증폭되거나, 서열분석되거나, 또는 사용된다. 본 명세서에 사용되는 바와 같이, 핵산 또는 핵산 반응과 관련하여 사용되는 용어 "증폭시킨다" 또는 "증폭된", "증폭시키는"은, 예를 들어, 본 발명의 일 실시형태에 의해, 표적 핵산과 같은 특정 핵산의 카피를 만드는 시험관내 방법을 지칭한다. 핵산을 증폭시키는 다수의 방법이 당업계에 공지되어 있으며, 증폭 반응은 폴리머라제 연쇄 반응, 리가제 연쇄 반응, 가닥 변위 증폭 반응, 롤링 서클 증폭(rolling circle amplification) 반응, 다중 어닐링 및 루핑 기반 증폭 사이클(multiple annealing and looping based amplification cycle, MALBAC), 전사-매개 증폭 방법, 예컨대 NASBA, 루프 매개 증폭 방법(예를 들어, 루프-형성 서열을 사용하는 "LAMP" 증폭)을 포함한다. 증폭되는 핵산은 변형된 DNA 및/또는 RNA를 비롯하여, DNA 또는 RNA, 또는 DNA와 RNA의 혼합물을 포함하거나, 이로 이루어지거나, 또는 이로부터 유래된 DNA일 수 있다. 출발 핵산이 DNA이든, RNA이든 또는 둘 모두이든, 핵산 분자 또는 분자들의 증폭으로부터 생성되는 생성물(예를 들어, "증폭 생성물")은 DNA 또는 RNA 중 어느 하나, 또는 DNA 및 RNA 뉴클레오사이드 또는 뉴클레오타이드 둘 모두의 혼합물일 수 있거나, 또는 변형된 DNA 또는 RNA 뉴클레오사이드 또는 뉴클레오타이드를 포함할 수 있다. "카피"는 표적 서열에 대한 완전한 서열 상보성 또는 동일성을 반드시 의미하는 것은 아니다. 예를 들어, 카피는 데옥시이노신 또는 데옥시우리딘과 같은 뉴클레오타이드 유사체, 의도적인 서열 변경(예컨대 표적 서열에 혼성화가능하지만 상보적이지 않은 서열을 포함하는 프라이머를 통해 도입된 서열 변경), 및/또는 증폭 동안 일어나는 서열 오류를 포함할 수 있다.
포획된 핵산은 당업계에 공지된 임의의 적합한 증폭 방법에 따라 증폭될 수 있다. 본 명세서에 기재되거나 당업계에 일반적으로 공지된 임의의 증폭 방법은 유니버설 또는 표적-특이적 프라이머와 함께 이용되어 핵산을 증폭시킬 수 있음이 이해될 것이다. 증폭에 적합한 방법은, 전체적으로 본 명세서에 참고로 포함된 미국 특허 제8,003,354호에 기재된 바와 같이, 폴리머라제 연쇄 반응(PCR), 가닥 변위 증폭(SDA), 전사 매개 증폭(TMA) 및 핵산 서열 기반 증폭(NASBA)을 포함하지만 이에 한정되지 않는다. 상기 증폭 방법은 하나 이상의 관심 핵산을 증폭시키기 위해 이용될 수 있다. 예를 들어, 멀티플렉스(multiplex) PCR, SDA, TMA, NASBA 등을 포함하는 PCR을 이용하여 핵산을 증폭시킬 수 있다. 일부 실시형태에서, 관심 핵산에 특이적으로 관련된 프라이머가 증폭 반응에 포함된다.
핵산의 증폭을 위한 다른 적합한 방법은 올리고뉴클레오타이드 연장 및 라이게이션, 롤링 서클 증폭(RCA)(본 명세서에 포함된 문헌[Lizardi et al., Nat. Genet. 19:225-232 (1998)]) 및 올리고뉴클레오타이드 라이게이션 검정(OLA) 기술(일반적으로 미국 특허 제7,582,420호, 제5,185,243호, 제5,679,524호 및 제5,573,907호; 유럽 특허 제0 320 308 B1호; 유럽 특허 제0 336 731 B1호; 유럽 특허 제0 439 182 B1호; 국제 특허 공개 WO 90/01069호; 국제 특허 공개 WO 89/12696호; 및 국제특허 공개 WO 89/09835호 참조, 이들 모두는 참고 포함됨)을 포함할 수 있다. 이들 증폭 방법은 핵산을 증폭시키도록 설계될 수 있음이 이해될 것이다. 예를 들어, 일부 실시형태에서, 증폭 방법은 관심 핵산에 특이적으로 관련된 프라이머를 포함하는 라이게이션 프로브 증폭 또는 올리고뉴클레오타이드 라이게이션 검정(oligonucleotide ligation assay, OLA) 반응을 포함할 수 있다. 일부 실시형태에서, 증폭 방법은, 관심 핵산에 특이적으로 관련되며 하이드로겔 기공을 통과할 수 있는 프라이머를 포함하는 프라이머 연장-라이게이션 반응을 포함할 수 있다. 관심 핵산을 증폭시키도록 특이적으로 설계될 수 있는 프라이머 연장 및 라이게이션 프라이머의 비제한적인 예로서, 각각 전체적으로 본 명세서에 참고로 포함된 미국 특허 제7,582,420호 및 제7,611,869호에 의해 예시되는 바와 같이, 증폭은 골든게이트(GoldenGate) 검정에 사용되는 프라이머(미국 캘리포니아주 샌디에고 소재의 일루미나, 인크.)를 포함할 수 있다.
일부 실시형태에서, 핵산은 미국 특허 제7,985,565호 및 제7,115,400호의 개시 내용에 의해 예시된 바와 같은 클러스터 증폭 방법을 사용하여 증폭되며, 상기 특허들 각각의 내용은 전체적으로 본 명세서에 참고로 포함된다. 미국 특허 제7,985,565호 및 제7,115,400호의 통합 자료는, 고정된 핵산 분자의 클러스터 또는 "콜로니"로 구성된 어레이를 형성하기 위하여 증폭 생성물이 고체 지지체 상에 고정되게 하는 핵산 증폭 방법을 기재한다. 그러한 어레이 상의 각각의 클러스터 또는 콜로니는 복수의 동일한 고정된 폴리뉴클레오타이드 가닥 및 복수의 동일한 고정된 상보적 폴리뉴클레오타이드 가닥으로부터 형성된다. 이렇게 형성된 어레이는 일반적으로 본 명세서에서 "클러스터형 어레이(clustered array)"로 지칭된다. 미국 특허 제7,985,565호 및 제7,115,400호에 기재된 것과 같은 고체상 증폭 반응의 생성물은 고정된 폴리뉴클레오타이드 가닥과 고정된 상보적 가닥의 쌍의 어닐링에 의해 형성된 소위 "브리지된(bridged)" 구조이며, 두 가닥은 모두 5' 말단에서, 바람직하게는 공유 부착을 통해 고체 지지체 상에 고정된다. 클러스터 증폭 방법론은 고정된 핵산 주형을 사용하여 고정된 앰플리콘을 생성하는 방법의 예이다. 다른 적합한 방법이 또한 본 명세서에 제공된 방법에 따라 생성되는 고정된 DNA 단편으로부터 고정된 앰플리콘을 생성하는데 사용될 수 있다. 예를 들어, 각각의 증폭 프라이머 쌍의 하나의 프라이머가 고정되든 또는 둘 모두의 프라이머가 고정되든 간에 하나 이상의 클러스터 또는 콜로니가 고체상 PCR을 통해 형성될 수 있다.
추가적인 증폭 방법은 등온 증폭(isothermal amplification)을 포함한다. 사용될 수 있는 예시적인 등온 증폭 방법은, 예를 들어 문헌[Dean et al., Proc. Natl. Acad. Sci. USA 99: 5261-66(2002)]에 의해 예시된 바와 같은 다중 변위 증폭(MDA) 또는 예를 들어, 미국 특허 제6,214,587호에 의해 예시된 등온 가닥 변위 핵산 증폭을 포함할 수 있지만 이에 한정되지 않으며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다. 본 발명에 사용될 수 있는 다른 비-PCR-기반 방법은, 예를 들어 문헌[Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995]; 미국 특허 제5,455,166호, 및 제5,130,238호, 및 문헌[Walker et al., Nucl. Acids Res. 20:1691-96 (1992)]에 기재된 가닥 변위 증폭(SDA) 또는 예를 들어 문헌[Lage et al., Genome Research 13:294-307 (2003)]에 기재된 과분지된(hyperbranched) 가닥 변위 증폭을 포함하며, 이들 각각은 전체적으로 본 명세서에 참고로 포함된다. 등온 증폭 방법은 게놈 DNA의 랜덤 프라이머 증폭을 위해 가닥-변위 파이(Phi) 29 폴리머라제 또는 Bst DNA 폴리머라제 큰 단편, 5'->3′ 엑소-와 함께 사용될 수 있다. 이들 폴리머라제의 사용은 그들의 높은 가공성 및 가닥 변위 활성을 활용한다. 높은 가공성으로 인해 폴리머라제는 길이가 10 내지 20 kb인 단편을 생성한다. 상기에 기술된 바와 같이, 클레노브(Klenow) 폴리머라제와 같이 낮은 가공성 및 가닥-변위 활성을 갖는 폴리머라제를 사용하여 등온 조건 하에서 더 작은 단편을 생성할 수 있다 증폭 반응, 조건 및 구성요소에 대한 추가 설명은 전체적으로 본 명세서에 참고로 포함된 미국 특허 제7,670,810호의 개시 내용에 상세히 기술되어 있다. 일부 실시형태에서, 랜덤 헥사머는 변성된 DNA에 어닐링된 후, 촉매 효소 파이 29의 존재 하에 일정한 온도에서 가닥 변위 합성된다. 이는 MDA 후 형광 강도(SYTOX로 염색된 DNA)의 증가에 의해 확인되는 바와 같이 DNA 증폭을 초래한다. 독립적으로, 넥스테라(등록상표) 태그멘테이션 및 PCR 후의 형광 강도의 상당한 증가에 의해 나타나는 바와 같은 용해 및 클린 업(clean up) 후 넥스테라(등록상표) 기반 태그멘테이션 및 PCR을 통한 후속 gDNA 증폭이 또한 수행될 수 있다.
본 발명에 유용한 다른 핵산 증폭 방법은, 예를 들어 전체적으로 본 명세서에 참고로 포함된 문헌[Grothues, et al. Nucleic Acids Res. 21(5):1321-2 (1993)]에 기재된 불변(constant) 5' 영역 다음에 랜덤 3' 영역을 갖는 2-도메인 프라이머의 집단을 사용하는 태깅된 PCR이다. 랜덤으로 합성된 3'영역으로부터의 개별 혼성화에 기초하여 열 변성 DNA에 대한 다수의 개시를 허용하도록 제1 증폭 라운드가 수행된다. 3′ 영역의 특성으로 인해, 개시 부위는 게놈 전체에 걸쳐 랜덤한 것으로 고려된다. 그 후에, 비결합 프라이머는 제거될 수 있고 불변 5' 영역에 상보적인 프라이머를 사용하여 추가의 복제가 일어날 수 있다.
일부 실시형태에서, 핵산은 완전히 또는 부분적으로 서열분석된다. 핵산은 임의의 적합한 서열분석 방법, 예를 들어 합성에 의한 서열분석, 라이게이션에 의한 서열분석, 혼성화에 의한 서열분석, 나노기공 서열분석 등을 포함하는 직접 서열분석에 따라 서열분석될 수 있다.
한 가지 서열분석 방법은 합성에 의한 서열분석(SBS)이다. SBS에서, 주형에서 뉴클레오타이드의 서열을 결정하기 위해 핵산 주형(예를 들어 표적 핵산 또는 이의 앰플리콘)을 따른 핵산 프라이머의 연장이 모니터링된다. 근본적인 화학적 공정은 (예컨대, 폴리머라제 효소에 의해 촉매되는 바와 같은) 중합일 수 있다. 특정 폴리머라제-기반 SBS 실시형태에서, 형광 표지된 뉴클레오타이드를 주형 의존 방식으로 프라이머에 첨가하여(그에 의해 프라이머를 연장시켜), 프라이머에 첨가된 뉴클레오타이드의 순서 및 유형의 검출을 사용하여 주형의 서열을 결정할 수 있다.
하나 이상의 증폭된 핵산은 사이클에서 시약의 반복된 전달을 수반하는 SBS 또는 다른 검출 기술을 거칠 수 있다. 예를 들어, 첫 번째 SBS 사이클을 개시하기 위해, 하나 이상의 표지된 뉴클레오타이드, DNA 폴리머라제 등이, 하나 이상의 증폭된 핵산 분자를 수용하는 소적 내로/소적을 통해 유동될 수 있다. 프라이머 연장으로 인해 표지된 뉴클레오타이드가 혼입되는 부위가 검출될 수 있다. 선택적으로, 뉴클레오타이드는, 일단 뉴클레오타이드가 프라이머에 첨가되었다면, 추가 프라이머 연장을 종결시키는 가역적 종결 속성을 추가로 포함할 수 있다. 예를 들어, 탈블로킹제(deblocking agent)가 전달되어 모이어티를 제거할 때까지 후속 연장이 발생할 수 없도록, 가역적 종결자 모이어티를 갖는 뉴클레오타이드 유사체가 프라이머에 첨가될 수 있다. 따라서, 가역적 종결을 사용하는 실시형태의 경우, 탈블로킹 시약은 (검출이 일어나기 전에 또는 후에) 플로우셀로 전달될 수 있다. 다양한 전달 단계들 사이에서 세척이 수행될 수 있다. 이어서, n개의 뉴클레오타이드에 의해 프라이머를 연장시키도록 사이클을 n회 반복하여, 길이 n의 서열을 검출할 수 있다. 본 발명의 방법에 의해 생성된 앰플리콘과 함께 사용하기 위해 용이하게 조정될 수 있는 예시적인 SBS 절차, 유체 시스템, 및 검출 플랫폼이, 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제 특허 공개 WO 04/018497호; 미국 특허 제7,057,026호; 국제 특허 공개 WO 91/06678호; 국제 특허 공개 WO 07/123744호; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호, 및 미국 특허 출원 공개 제2008/0108082호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
순환 반응을 사용하는 다른 서열분석 절차, 예를 들어, 파이로시퀀싱이 사용될 수 있다. 파이로시퀀싱은 특정 뉴클레오타이드가 초기(nascent) 핵산 가닥에 혼입될 때 무기 파이로포스페이트(PPi)의 방출을 검출한다(문헌[Ronaghi, et al., Analytical Biochemistry 242(1), 84-9 (1996)]; 문헌[Ronaghi, Genome Res. 11(1), 3-11(2001)]; 문헌[Ronaghi et al. Science 281(5375), 363 (1998)]; 미국 특허 제6,210,891호; 미국 특허 제6,258,568호 및 미국 특허 제6,274,320호, 이들 각각은 본 명세서에 참고로 포함됨). 파이로시퀀싱에서, 방출된 PPi는 ATP 설퍼릴라제에 의해 아데노신 트라이포스페이트(ATP)로 즉시 전환됨으로써 검출될 수 있고, 생성된 ATP의 수준은 루시페라제-생성된 광자를 통해 검출될 수 있다. 따라서, 서열분석 반응은 발광 검출 시스템을 통해 모니터링될 수 있다. 형광 기반 검출 시스템에 사용되는 여기 방사선 공급원은 파이로시퀀싱 절차에는 필요하지 않다. 본 발명에 따라 생성된 앰플리콘에 파이로시퀀싱을 적용하도록 조정될 수 있는 유용한 유체 시스템, 검출기 및 절차가, 예를 들어, 국제 특허 출원 PCT/US11/57111호, 미국 특허 출원 공개 제2005/0191698 A1호, 미국 특허 제7,595,883호, 및 미국 특허 제7,244,559호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
일부 실시형태는 DNA 폴리머라제 활성의 실시간 모니터링을 포함하는 방법을 이용할 수 있다. 예를 들어, 뉴클레오타이드 혼입은 형광단-함유 폴리머라제와 γ-포스페이트-표지된 뉴클레오타이드 사이의 형광 공명 에너지 전달(fluorescence resonance energy transfer, FRET) 상호작용을 통해, 또는 제로 모드 도파관(zero mode waveguide, ZMW)을 이용하여 검출될 수 있다. FRET-기반 서열분석을 위한 기술 및 시약은, 예를 들어 문헌[Levene et al. Science 299, 682-686 (2003)]; 문헌[Lundquist et al. Opt. Lett. 33, 1026-1028(2008)]; 문헌[Korlach et al. Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)]에 기재되어 있으며, 이들의 개시 내용은 본 명세서에 참고로 포함된다.
일부 SBS 실시형태는 연장 생성물 내로의 뉴클레오타이드의 혼입 시 방출되는 양성자의 검출을 포함한다. 예를 들어, 방출된 양성자의 검출에 기초한 서열분석은 상업적으로 이용가능한 전기 검출기 및 관련 기술을 사용할 수 있다. 그러한 서열분석 시스템의 예는 파이로시퀀싱(예를 들어, 로슈의 자회사인 454 라이프 사이언시즈(454 Life Sciences)로부터 구매가능한 플랫폼), γ-포스페이트-표지된 뉴클레오타이드를 사용한 서열분석(예를 들어, 퍼시픽 바이오사이언시즈(Pacific Biosciences)로부터 구매가능한 플랫폼) 및 양성자 검출을 사용한 서열분석(예를 들어, 라이프 테크놀로지스의 자회사인 이온 토렌트로부터 구매가능한 플랫폼) 또는 미국 특허 출원 공개 제2009/0026082 A1호; 미국 특허 출원 공개 제2009/0127589 A1호; 미국 특허 출원 공개 제2010/0137143 A1호; 또는 미국 특허 출원 공개 제2010/0282617 A1호에 기재된 서열분석 방법 및 시스템이며, 이들 각각은 본 명세서에 참고로 포함된다. 운동력학적 배제(kinetic exclusion)를 사용하여 표적 핵산을 증폭시키기 위한 본 명세서에 기술된 방법은 양성자를 검출하는 데 사용되는 기질에 용이하게 적용될 수 있다. 더 구체적으로, 본 명세서에 기술된 방법은 양성자를 검출하는 데 사용되는 앰플리콘의 클론성 집단을 생성하는 데 사용될 수 있다.
다른 서열분석 기술은 나노기공 서열분석이다(예를 들어, 문헌[Deamer et al. Trends Biotechnol. 18, 147-151 (2000)]; 문헌[Deamer et al. Acc. Chem. Res. 35:817-825(2002)]; 문헌[Li et al. Nat. Mater. 2:611-615 (2003)]을 참조하며, 이들의 개시 내용은 본 명세서에 참고로 포함된다). 일부 나노기공 실시형태에서, 표적 핵산 또는 표적 핵산으로부터 제거된 개별 뉴클레오타이드는 나노기공을 통과한다. 핵산 또는 뉴클레오타이드가 나노기공을 통과할 때, 각각의 뉴클레오타이드 유형은 기공의 전기 전도도의 변동을 측정함으로써 확인될 수 있다. (미국 특허 제7,001,792호; 문헌[Soni et al. Clin. Chem. 53, 1996-2001(2007)]; 문헌[Healy, Nanomed. 2, 459-481(2007)]; 문헌[Cockroft et al. J. Am. Chem. Soc. 130, 818-820 (2008)], 이들의 개시 내용은 본 명세서에 참고로 포함된다).
본 발명에 따른 검출에 적용될 수 있는 어레이-기반 발현 및 유전자형 분석을 위한 예시적인 방법은 미국 특허 제7,582,420호; 제6,890,741호; 제6,913,884호 또는 제6,355,431호 또는 미국 특허 출원 공개 제2005/0053980 A1호; 제2009/0186349 A1호 또는 제2005/0181440 A1호에 기재되어 있으며, 이들 각각은 본 명세서에 참고로 포함된다.
본 명세서에 기재된 바와 같은 핵산 단리, 증폭, 및 서열분석 방법에서, 다양한 시약이 핵산 단리 및 제조를 위해 사용된다. 그러한 시약은, 예를 들어, 라이소자임, 프로테이나제 K, 랜덤 헥사머, 폴리머라제(예를 들어, Φ29 DNA 폴리머라제, Taq 폴리머라제, Bsu 폴리머라제), 트랜스포사제(예를 들어, Tn5), 프라이머(예를 들어, P5 및 P7 어댑터 서열), 리가제, 촉매 작용 효소, 데옥시뉴클레오타이드 트라이포스페이트, 완충제, 또는 2가 양이온을 포함할 수 있다.
어댑터는 서열분석 프라이머 부위, 증폭 프라이머 부위, 및 인덱스를 포함할 수 있다. 본 명세서에 사용되는 바와 같이 "인덱스"는, 핵산을 태그하고/하거나 핵산의 공급원을 식별하도록 분자 식별자 및/또는 바코드로서 사용될 수 있는 뉴클레오타이드의 서열을 포함할 수 있다. 일부 실시형태에서, 인덱스가 단일 핵산, 또는 핵산의 하위집단을 식별하는 데 사용될 수 있다. 일부 실시형태에서, 단일 세포가, 예를 들어, 인접 보존 전위(CPTSeq) 접근법을 사용하는 조합 인덱싱에 사용될 수 있다.
인덱스는 핵산 분자의 공급원을 식별하는 데 유용할 수 있다. 일부 실시형태에서, 어댑터는 예를 들어 일측 또는 양측 단부에서 어댑터의 연장을 방지하는 블로킹 기의 첨가에 의해, 콘카테머(concatemer)의 형성을 방지하도록 변형될 수 있다. 3′ 블로킹 기의 예에는 3'-스페이서 C3, 다이데옥시뉴클레오타이드, 및 기질에 대한 부착이 포함된다. 5′ 블로킹 기의 예에는 탈인산화된 5′ 뉴클레오타이드, 및 기질에 대한 부착이 포함된다.
예시적인 방법은 후속 라이게이션 단계에서 콘카테머의 형성을 방지하기 위해 표적 핵산의 5' 말단을 탈인산화하는 단계; 탈인산화된 표적의 3' 말단에 리가제를 사용하여 제1 어댑터를 라이게이션하는 단계(제1 어댑터의 3' 말단은 블로킹됨); 라이게이션된 표적의 5' 말단을 재인산화하는 단계; 탈인산화된 표적의 5' 말단에 단일 가닥 리가제를 사용하여 제2 어댑터를 라이게이션하는 단계(제2 어댑터의 5′ 말단은 비인산화됨)를 포함한다.
다른 예는 단일 가닥 3' 오버행(overhang)을 갖는 이중 가닥 핵산을 형성하기 위한 5' 엑소뉴클레아제에 의한 핵산의 부분 절단(digestion)을 포함한다. 3' 오버행을 갖는 이중 가닥 핵산의 3' 말단에 3' 블로킹 기를 함유하는 어댑터가 라이게이션될 수 있다. 라이게이션된 어댑터를 갖는 3' 오버행을 갖는 이중 가닥 핵산은 탈혼성화되어 단일 가닥 핵산을 형성할 수 있다. 비-인산화된 5' 말단을 함유하는 어댑터는 단일-가닥 핵산의 5' 말단에 라이게이션될 수 있다.
핵산의 5'뉴클레오타이드와 같은 핵산을 탈인산화하는 방법은 핵산을 포스파타제와 접촉시키는 단계를 포함한다. 포스파타제의 예에는 송아지 장 포스파타제, 새우 알칼리 포스파타제, 남극 포스파타제, 및 APEX 알칼리 포스파타제(에피센트리(Epicentre))가 포함된다.
핵산을 라이게이션하는 방법은 핵산을 리가제와 접촉시키는 것을 포함한다. 리가제의 예에는 T4 RNA 리가제 1, T4 RNA 리가제 2, RtcB 리가제, 메타노박테리움(Methanobacterium) RNA 리가제, 및 TS2126 RNA 리가제(서클리가제(CIRCLIGASE))가 포함된다.
핵산의 5'뉴클레오타이드와 같은 핵산을 인산화하는 방법은 핵산을 키나제와 접촉시키는 단계를 포함한다. 키나제의 예에는 T4 폴리뉴클레오타이드 키나제가 포함된다.
본 명세서에 제공된 시스템 및 방법의 실시형태는, 전위 시약, 제1 태그에 상보적인 제1 프로브 및 제2 태그에 상보적인 제2 프로브를 포함하는 키트를 포함하며, 여기서 제1 프로브 및 제2 프로브는 고체 지지체 상에 고정된다. 일부 실시형태에서, 제1 프로브 및 제2 프로브는 바코드를 포함한다. 일부 실시형태에서, 제1 프로브 및 제2 프로브는 폴리T 프로브이다. 일부 실시형태에서, 고체 지지체는 에칭된 표면, 웰, 어레이, 플로우셀 장치, 미세유체 채널, 비드, 자성 비드, 컬럼, 소적, 또는 마이크로입자이다.
실시예
실시예 1-벌크 세포로부터의 동시적 DNA 및 RNA 라이브러리 제조
하기 실시예는 벌크 세포의 샘플에서 DNA 및 RNA를 동시에 분석하는 실시형태를 나타낸다.
도 6a에 나타나 있는 바와 같이, 세포를 얻고 용해하여 세포 핵을 단리하였다. 폴리A 트랜스포존을 갖는 트랜스포좀을 사용하여 전장 게놈 DNA (gDNA)를 태그멘테이션하였다. 트랜스포좀은 핵으로 진입하고, 개방 염색질(히스톤에 의해 결합되지 않은 gDNA)을 태그멘테이션한다.
태그멘테이션 후에, gDNA 및 RNA 둘 모두는 3' 폴리A 테일을 함유하였다. gDNA 및 RNA의 3' 폴리A 테일에 혼성화되는 폴리T 포획 프로브를 사용하여 gDNA 및 RNA 둘 모두를 포획하였다. 포획 프로브는 샘플 세포의 하류 증폭 및 분자 인덱싱을 위한, 또는 분자 디멀티플렉싱(demultiplexing)을 위한 제1 공통 서열(CS1)을 함유하였다. RNA를 DNA로 전환하기 위하여, 역전사효소에 의한 cDNA 합성을 위한 프라이머로서 포획 프로브를 사용하였다.
도 6b에 나타나 있는 바와 같이, 컬럼 정제(ZYMO)를 사용하여, gDNA 및 생성된 cDNA를 핵으로부터 정제하였다. 연장/라이게이션 반응에 의해 접근가능 염색질 이용 서열분석(ATAC) 라이브러리 제조를 완료하였고, cDNA의 제2 가닥 합성에 의해 RNA 라이브러리 제조를 완료하였다. 제2 공통 서열(CS2)과 분자 인덱스를 통합하기 위해 제2 라운드의 태그멘테이션을 사용하였다. 샘플 클린 업을 수행하여 Tn5를 제거하고, CS1 및 CS2에 상보적인 프라이머를 사용한 PCR에 의해 최종 서열분석 라이브러리를 생성하였다.
유사한 방법을 또한 사용하여 비드 상에서 DNA 및 RNA를 동시에 분석하였다. 도 7a 및 도 7b에 나타나 있는 바와 같이, 샘플 취급을 개선하고/하거나 전장 RNA 라이브러리를 가능하게 하기 위해 분석을 수행할 수 있다. 도 7a 및 도 7b의 개략도에 나타나 있는 바와 같이, 세포를 얻고 용해하여 핵을 단리하였다. 폴리A 트랜스포존과 공통 서열(CS2)을 함유하는 2개의 트랜스포좀으로 gDNA를 태그멘테이션하였다. 트랜스포좀은 핵으로 진입하고, 개방 염색질(히스톤에 의해 결합되지 않은 gDNA)을 태그멘테이션한다. 공통 서열(CS1)을 포함하는 폴리T 테일을 갖는 포획 프로브를 DNA 및 RNA 라이브러리 둘 모두의 폴리A 테일에 혼성화하였다. RNA 라이브러리 제조를 완료하기 위하여, 혼성화 프로브를 사용하여 cDNA 합성을 프라이밍하였다. 전장 RNA의 제조를 가능하게 하는 주형 스위칭 올리고뉴클레오타이드(TSO) 및 역전사효소의 주형 스위칭 활성을 사용하여 제2 공통 서열(CS2)을 RNA 라이브러리에 추가하였다. 샘플 취급을 개선하기 위하여, 비오티닐화된 포획 프로브를 사용하여 자성 스트렙타비딘 비드에 RNA 및 DNA 라이브러리를 결합시켰다. 비드 결합된 분자에서 세척, 완충제 교환, 및 취급이 용이하게 수행되었다.
도 8은 ATAC 및 RNA 라이브러리 제조의 결과를 도시한다. ATAC 라이브러리에 대한 단편은 도 8에 박스로 표시된 트랜스포존 특이적 서열인 시그니처 ME 서열을 갖는다. 도 9에 나타나 있는 바와 같이, ATAC 단편은 프로모터 영역 주위의 전형적인 풍부화를 나타내고(패널 A), 3' 카운팅에 대한 RNA 단편은 유전자 말단 주위의 리드 축적을 나타낸다(패널 B). 표 1 및 표 2는 동시 DNA 및 RNA 분석에 대한 ATAC-seq 및 RNA 메트릭스(metrics)의 결과를 요약한다.
[표 1]
Figure pct00001
[표 2]
Figure pct00002
실시예 2-단일 세포 ATAC-seq
하기 실시예는 구획에서 단일 세포 ATAC-seq를 수행하는 실시형태를 나타낸다.
도 5b에 약술된 바와 같이, 염색질 내로의 전위를 수행하였다. 전위 후, 단일 세포 또는 단일 핵을 구획 내로, 이 경우에 소적 내로, 분할하였다. 트랜스포사제는 모든 개별 DNA/라이브러리 단편을 함께 유지하여 단일 세포로부터의 모든 재료가 단일 소적 내에 캡슐화될 수 있도록 한다. 단일 소적 내의 세포로부터의 모든 단편을, 바코딩된 프라이머를 사용하여 PCR에 의해 인덱싱하였다.
단일 세포가 단일 소적들로 적절하게 분할되었음을 보장하기 위하여, 혼합된 인간 및 마우스 세포를 처리하였다. 샘플은 500,000개의 인간 세포 및 500,000개의 마우스 세포를 포함하였다. 각 검정은 34,000개의 핵을 포함하였으며, 이를 풀링하여 약 300,000개의 소적을 함유하는 소적 PCR의 하나의 칩을 생성하였다. 이 검정은 140,000개의 비드(채널당 3200개의 비드 11 μL)를 포함하였다. 4회 사이클의 소적 PCR을 수행한 후, 10회 사이클을 벌크로 수행하였다. 서열분석 작업 흐름의 일례가 도 12에 약술되어 있으며, 이는 바코드가 내부에 삽입된 서열을 제공한다. 도 13에 나타나 있는 바와 같이, Tn5 트랜스포사제를 증가시키면 전사 시작 부위(TSS)의 수율, 감도, 및 백분율이 증가하는 것으로 관찰되었다.
마우스 또는 인간으로부터의 것으로서 서열 리드를 식별하는 바코드를 판독하였고, 도 14에 약술된 바와 같이, 결과는 리드가 마우스 또는 인간에 정렬되었음을 나타내며, 이는 단일 세포가 단일 소적 내에 캡슐화되어 단일 세포의 분할을 가능하게 하고, 이는 단일 세포의 분석을 가능하게 함을 나타낸다. 예상되는 바와 같이, ATAC 리드 출력은 전사 시작 부위 주위에 분포되었다.
본 명세서에서 사용되는 바와 같이 용어 "포함하는"은 "비롯한", "함유하는" 또는 "~를 특징으로 하는"과 동의어이며, 포괄적이거나 개방형이며, 추가적인 언급되지 않은 요소 또는 방법 단계를 배제하지 않는다.
상기 설명은 본 발명의 몇몇 방법 및 재료를 개시한다. 본 발명은 제작 방법 및 장비의 변화뿐만 아니라 방법 및 재료의 변경에 민감하다. 그러한 변경은 본 명세서 또는 본 명세서에 개시된 본 발명의 실시를 고려하여 당업자에게 명백해질 것이다. 결과적으로, 본 발명은 본 명세서에 개시된 특정 실시형태로 제한되는 것이 아니라, 본 발명의 진정한 범위 및 사상 내에 있는 모든 변경 및 대안을 포함하는 것으로 의도된다.
공개 및 미공개 출원, 특허 및 문서 참고 문헌을 포함하지만 이에 한정되지 않는 본 명세서에 인용된 모든 참고 문헌은 전체적으로 본 명세서에 참고로 포함되며 본 명세서의 일부로 구성된다. 참고로 포함된 공보 및 특허 또는 특허출원이 본 명세서에 포함된 개시 내용과 모순되는 한, 본 명세서는 임의의 그러한 모순적 자료를 대체하고/하거나 그에 우선하도록 의도된다.
SEQUENCE LISTING <110> Illumina, Inc. <120> ANALYSIS OF MULTIPLE ANALYTES USING A SINGLE ASSAY <130> WO2020112604 <140> PCT/US2019/062945 <141> 2019-11-25 <150> US 62/773,862 <151> 2018-11-30 <160> 8 <170> PatentIn version 3.5 <210> 1 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 1 tcgtcggcag cgtcagatgt gtataagaga cag 33 <210> 2 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 2 gtctcgtggg ctcggagatg tgtataagag acag 34 <210> 3 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 3 ctgtctctta tacacatct 19 <210> 4 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 4 tcgtcggcag cgtc 14 <210> 5 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 5 gtctcgtggg ctcgg 15 <210> 6 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 6 agatgtgtat aagagacag 19 <210> 7 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 7 aatgatacgg cgaccaccga gauctacac 29 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 8 caagcagaag acggcatacg agat 24

Claims (62)

  1. 핵산 라이브러리로서,
    제1 바코드를 포함하는 제1 태그를 갖는 핵산을 포함하며 mRNA 분자로부터 유래되는 상보적 DNA(cDNA) 라이브러리; 및
    제2 바코드를 포함하는 제2 태그를 갖는 핵산을 포함하며 게놈 DNA로부터 유래되는 게놈 DNA(gDNA) 라이브러리
    를 포함하되,
    상기 제1 바코드 및 상기 제2 바코드는 동일하거나 상이하며 상기 제1 바코드 및 상기 제2 바코드는 상기 cDNA 라이브러리 및 상기 gDNA 라이브러리의 공통 공급원을 식별하고,
    상기 cDNA 라이브러리 및 상기 gDNA 라이브러리는 동일 환경에서 공동-구획화되고 제조되는, 핵산 라이브러리.
  2. 제1항에 있어서, 태그멘테이션(tagmentation) 시약을 추가로 포함하는, 핵산 라이브러리.
  3. 제2항에 있어서, 상기 태그멘테이션 시약은 상기 제1 태그를 mRNA에 부착하고 상기 제2 태그를 상기 gDNA에 부착하는, 핵산 라이브러리.
  4. 제1항에 있어서, 상기 제1 태그는 역전사에 의해 상기 mRNA에 부착되고, 상기 제2 태그는 태그멘테이션에 의해 상기 gDNA에 부착되는, 핵산 라이브러리.
  5. 제1항에 있어서, 상기 핵산 라이브러리는 고체 지지체에 부착되는, 핵산 라이브러리.
  6. 제5항에 있어서, 상기 고체 지지체는 기질, 에칭된 표면, 웰, 덮인 웰, 밀봉된 웰, 어레이, 플로우셀 장치(flowcell device), 미세유체 채널, 비드(bead), 자성 비드, 컬럼, 소적(droplet), 또는 미세입자인, 핵산 라이브러리.
  7. 제1항에 있어서, 상기 제1 태그 및 상기 제2 태그는 기질 인식 서열을 추가로 포함하는, 핵산 라이브러리.
  8. 제7항에 있어서, 상기 제1 태그의 기질 인식 서열은 상기 제2 태그의 기질 인식 서열과 동일한, 핵산 라이브러리.
  9. 제1항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 동일한, 핵산 라이브러리.
  10. 제1항에 있어서, 상기 제1 태그 및 상기 제2 태그는 동일한, 핵산 라이브러리.
  11. 제1항에 있어서, 상기 핵산 라이브러리는 세포 집단, 단일 세포, 세포 핵 집단, 또는 단일 세포 핵으로부터 생성되는, 핵산 라이브러리.
  12. 제1항에 있어서, 상기 제1 태그는 폴리A 태그인, 핵산 라이브러리.
  13. 제1항에 있어서, 상기 제2 태그는 트랜스포사제-특이적 요소를 포함하는, 핵산 라이브러리.
  14. 제1항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 태그멘테이션 반응을 통해 상기 핵산 라이브러리 내로 직접 혼입되는, 핵산 라이브러리.
  15. 플로우셀 장치로서,
    RNA를 포획하기 위한 제1 프로브로서, 제1 바코드 및 제1 기질 인식 서열을 포함하는, 상기 제1 프로브; 및
    DNA를 포획하기 위한 제2 프로브로서, 제2 바코드 및 제2 기질 인식 서열을 포함하는, 상기 제2 프로브
    를 포함하되;
    상기 제1 바코드 및 상기 제2 바코드는 동일하거나 상이하며, 상기 제1 바코드 및 상기 제2 바코드는 상기 RNA 및 DNA의 공통 공급원을 식별하고,
    상기 제1 프로브 및 상기 제2 프로브는 샘플로부터의 RNA 및 DNA를 단일 구획에서 동시에 분석하도록 구성되는, 플로우셀 장치.
  16. 제15항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 상기 플로우셀 장치 상에 고정되는, 플로우셀 장치.
  17. 제15항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 동일한, 플로우셀 장치.
  18. 제15항에 있어서, 상기 제1 기질 인식 서열은 상기 제2 기질 인식 서열과 동일한, 플로우셀 장치.
  19. 샘플로부터의 DNA 및 RNA를 단일 구획에서 동시에 분석하는 방법으로서,
    DNA 및 RNA를 포함하는 샘플을 제공하는 단계로서, 상기 RNA는 제1 태그를 포함하는, 상기 샘플을 제공하는 단계;
    DNA를 제2 태그로 차별적으로 태깅하는 단계;
    상기 샘플을 단일 구획에서 상기 RNA를 포획하기 위한 제1 포획 프로브 및 태깅된 DNA를 포획하기 위한 제2 포획 프로브와 접촉시키는 단계로서, 상기 제1 포획 프로브는 제1 바코드를 포함하고 상기 제2 포획 프로브는 제2 바코드를 포함하며, 상기 제1 바코드 및 상기 제2 바코드는 상기 RNA 및 DNA의 공통 공급원을 식별하는, 상기 접촉시키는 단계;
    상기 제1 포획 프로브를 상기 RNA에 그리고 상기 제2 포획 프로브를 상기 DNA에 혼성화하여, DNA 및 RNA를 동시에 포획하는 단계; 및
    DNA 및 RNA를 분석하는 단계
    를 포함하는, 방법.
  20. 제19항에 있어서, 상기 제1 포획 프로브 및 상기 제2 포획 프로브는 고체 지지체 상에 고정되는, 방법.
  21. 제19항에 있어서, 상기 제1 포획 프로브 및 상기 제2 포획 프로브는 기질 인식 서열을 추가로 포함하는, 방법.
  22. 제21항에 있어서, 상기 제1 포획 프로브의 기질 인식 서열은 상기 제2 포획 프로브의 기질 인식 서열과 동일한, 방법.
  23. 제19항에 있어서, 상기 샘플은 세포 집단, 단일 세포, 세포 핵 집단, 또는 세포 핵인, 방법.
  24. 제19항에 있어서, 상기 제1 프로브는 상기 제1 태그에 특이적으로 결합하는 포획 태그를 포함하고 상기 제2 프로브는 상기 제2 태그에 특이적으로 결합하는 포획 태그를 포함하는, 방법.
  25. 제19항에 있어서, 상기 제1 태그는 폴리A 태그이고 상기 제1 프로브는 폴리T 포획 서열을 포함하는, 방법.
  26. 제19항에 있어서, 상기 제2 태그는 상기 제1 태그와 동일하거나 상이한, 방법.
  27. 제19항에 있어서, 상기 제2 태그는 폴리A 태그이고 상기 제2 프로브는 폴리T 포획 서열을 포함하는, 방법.
  28. 제19항에 있어서, 상기 DNA를 차별적으로 태깅하는 단계는 태그멘테이션에 의해 수행되는, 방법.
  29. 제28항에 있어서, 태그멘테이션은 트랜스포존-특이적 서열을 도입하는, 방법.
  30. 제19항에 있어서, 상기 RNA 및 DNA는 라이게이션, 역전사(RT), 전위(transposition), 또는 다른 인덱싱 수단을 사용하여 각각 상기 제1 태그 및 제2 태그에 의해 변형되는, 방법.
  31. 제19항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 동일하거나 상이한, 방법.
  32. 제20항에 있어서, 상기 고체 지지체는 기질, 에칭된 표면, 웰, 덮인 웰, 밀봉된 웰, 어레이, 플로우셀 장치, 미세유체 채널, 비드, 자성 비드, 컬럼, 소적, 또는 미세입자인, 방법.
  33. 제19항에 있어서, 분석하는 단계는 DNA 분석, RNA 분석, 단백질 분석, 태그멘테이션, 핵산 증폭, 핵산 서열분석, 핵산 라이브러리 제조, 트랜스포사제-접근가능 염색질 이용 서열분석 검정(assay for transposase accessible chromatic using sequencing, ATAC-seq), 인접-보존 전위(contiguity-preserving transposition, CPT-seq), 단일 세포 조합 인덱스 서열분석(single cell combinatorial indexed sequencing, SCI-seq), 또는 단일 세포 게놈 증폭, 또는 이들의 임의의 조합을 포함하는, 방법.
  34. 제19항에 있어서, 분석하는 단계는 cDNA 라이브러리 및 gDNA 라이브러리를 동시에 생성하는 단계를 포함하는, 방법.
  35. 제19항에 있어서, 단백질을 상기 단일 구획에서 동시에 분석하는 단계를 추가로 포함하며, 상기 단백질은 제3 태그로 태깅되는, 방법.
  36. 제19항에 있어서, 상기 샘플은 세포를 포함하고, 상기 세포는 고정제(fixative)로 고정되는, 방법.
  37. 제36항에 있어서, 상기 고정제는 메탄올 또는 에탄올과 같은 알코올 또는 파라-포름알데하이드와 같은 알데하이드를 포함하는, 방법.
  38. gDNA 및 cDNA를 포함하는 핵산 라이브러리를 단일 구획에서 동시에 생성하는 방법으로서,
    DNA 및 RNA를 포함하는 샘플을 제공하는 단계로서, 상기 RNA는 제1 태그를 포함하는, 상기 샘플을 제공하는 단계;
    DNA를 제2 태그로 차별적으로 태깅하는 단계;
    상기 샘플을 단일 구획에서 상기 RNA를 포획하기 위한 제1 프로브 및 태깅된 DNA를 포획하기 위한 제2 프로브와 접촉시키는 단계로서, 상기 제1 프로브는 제1 바코드를 포함하고 상기 제2 프로브는 제2 바코드를 포함하며, 상기 제1 바코드 및 상기 제2 바코드는 상기 DNA 및 RNA의 공통 공급원을 식별하는, 상기 접촉시키는 단계;
    상기 RNA 및 상기 DNA를 각각 상기 제1 프로브 및 상기 제2 프로브에 혼성화하는 단계; 및
    혼성화된 RNA 및 DNA로부터 cDNA 라이브러리 및 gDNA 라이브러리를 동시에 생성하는 단계
    를 포함하는, 방법.
  39. 제38항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 고체 지지체 상에 고정되는, 방법.
  40. 제38항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 기질 인식 서열을 추가로 포함하는, 방법.
  41. 제40항에 있어서, 상기 제1 포획 프로브의 기질 인식 서열은 상기 제2 포획 프로브의 기질 인식 서열과 동일한, 방법.
  42. 제38항에 있어서, 상기 샘플은 세포 집단, 단일 세포, 세포 핵 집단, 또는 세포 핵인, 방법.
  43. 제38항에 있어서, 상기 제1 프로브는 상기 제1 태그에 특이적으로 결합하는 포획 태그를 포함하고 상기 제2 프로브는 상기 제2 태그에 특이적으로 결합하는 포획 태그를 포함하는, 방법.
  44. 제38항에 있어서, 상기 제1 태그는 폴리A 태그이고 상기 제1 프로브는 폴리T 포획 서열을 포함하는, 방법.
  45. 제38항에 있어서, 상기 제2 태그는 상기 제1 태그와 동일하거나 상이한, 방법.
  46. 제38항에 있어서, 상기 제2 태그는 폴리A 태그이고 상기 제2 프로브는 폴리T 포획 서열을 포함하는, 방법.
  47. 제38항에 있어서, 상기 DNA를 차별적으로 태깅하는 단계는 태그멘테이션에 의해 수행되는, 방법.
  48. 제47항에 있어서, 태그멘테이션은 트랜스포존-특이적 서열을 도입하는, 방법.
  49. 제38항에 있어서, 상기 RNA 및 DNA는 라이게이션, 역전사(RT), 전위, 또는 다른 인덱싱 수단을 사용하여 각각 제1 태그 및 제2 태그에 의해 변형되는, 방법.
  50. 제38항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 동일하거나 상이한, 방법.
  51. 제39항에 있어서, 상기 고체 지지체는 기질, 에칭된 표면, 웰, 덮인 웰, 밀봉된 웰, 어레이, 플로우셀 장치, 미세유체 채널, 비드, 자성 비드, 컬럼, 소적, 또는 미세입자인, 방법.
  52. 제38항에 있어서, 상기 샘플은 세포를 포함하고, 상기 세포는 고정제로 고정되는, 방법.
  53. 제52항에 있어서, 상기 고정제는 메탄올 또는 에탄올과 같은 알코올 또는 파라-포름알데하이드와 같은 알데하이드를 포함하는, 방법.
  54. 샘플 내의 DNA 및 RNA를 단일 구획에서 동시에 분석하기 위한 키트로서,
    전위 시약; 및
    제1 태그에 상보적인 제1 프로브 및 제2 태그에 상보적인 제2 프로브
    를 포함하되, 상기 제1 프로브는 제1 바코드를 포함하고 상기 제2 프로브는 제2 바코드를 포함하며, 상기 제1 바코드 및 상기 제2 바코드는 상기 DNA 및 상기 RNA의 공통 공급원을 식별하는, 키트.
  55. 제54항에 있어서, 상기 제1 바코드 및 상기 제2 바코드는 동일하거나 상이한, 키트.
  56. 제54항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 폴리T 포획 서열을 포함하는, 키트.
  57. 제54항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 기질 인식 서열을 포함하는, 키트.
  58. 제57항에 있어서, 상기 제1 프로브의 기질 인식 서열은 상기 제2 프로브의 기질 인식 서열과 동일한, 키트.
  59. 제54항에 있어서, 상기 제1 프로브 및 상기 제2 프로브는 고체 지지체 상에 고정되는, 키트.
  60. 제59항에 있어서, 상기 고체 지지체는 기질, 에칭된 표면, 웰, 덮인 웰, 밀봉된 웰, 어레이, 플로우셀 장치, 미세유체 채널, 비드, 자성 비드, 컬럼, 소적, 또는 미세입자인, 키트.
  61. 단일 세포를 분석하는 방법으로서,
    세포 또는 핵의 집단을 포함하는 샘플을 제공하는 단계;
    표적 핵산에 대해 인접 보존 전위를 수행하는 단계;
    상기 세포 또는 핵의 집단을 개별 소적으로 분할하는 단계로서, 단일 세포 또는 핵이 단일 소적으로 분할되는, 상기 분할하는 단계;
    상기 표적 핵산을 인덱싱하는 단계; 및
    인덱싱된 핵산을 분석하는 단계
    를 포함하는, 방법.
  62. 단일 세포를 분석하는 방법으로서,
    세포 또는 핵의 집단을 포함하는 샘플을 제공하는 단계;
    표적 핵산에 대해 개별적으로 인덱싱된 인접 보존 전위를 수행하는 단계;
    상기 세포 또는 핵의 집단을 개별 소적으로 분할하는 단계로서, 다수의 세포 또는 핵이 단일 소적으로 분할되고, 단일 소적 내의 상기 다수의 세포 또는 핵은 고유한 인덱스를 갖는, 상기 분할하는 단계;
    상기 표적 핵산을 인덱싱하는 단계; 및
    인덱싱된 핵산을 분석하는 단계
    를 포함하는, 방법.
KR1020217009647A 2018-11-30 2019-11-25 단일 검정을 이용한 다수의 분석물의 분석 KR20210098432A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862773862P 2018-11-30 2018-11-30
US62/773,862 2018-11-30
PCT/US2019/062945 WO2020112604A2 (en) 2018-11-30 2019-11-25 Analysis of multiple analytes using a single assay

Publications (1)

Publication Number Publication Date
KR20210098432A true KR20210098432A (ko) 2021-08-10

Family

ID=68988298

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217009647A KR20210098432A (ko) 2018-11-30 2019-11-25 단일 검정을 이용한 다수의 분석물의 분석

Country Status (15)

Country Link
US (1) US20220195504A1 (ko)
EP (2) EP3887540B1 (ko)
JP (1) JP2022513561A (ko)
KR (1) KR20210098432A (ko)
CN (1) CN112867801A (ko)
AU (1) AU2019390388A1 (ko)
BR (1) BR112021006183A2 (ko)
CA (1) CA3113091A1 (ko)
DK (1) DK3887540T3 (ko)
ES (1) ES2960890T3 (ko)
FI (1) FI3887540T3 (ko)
IL (1) IL281538A (ko)
MX (1) MX2021003771A (ko)
SG (1) SG11202102700TA (ko)
WO (1) WO2020112604A2 (ko)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3788166A4 (en) * 2018-05-01 2022-04-20 Takara Bio USA, Inc. METHODS FOR THE AMPLIFICATION OF NUCLEIC ACIDS AND COMPOSITIONS AND KITS FOR CARRYING OUT THESE
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
EP3894587A1 (en) 2018-12-10 2021-10-20 10X Genomics, Inc. Resolving spatial arrays by proximity-based deconvolution
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
WO2021091611A1 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
CN114885610A (zh) 2019-12-23 2022-08-09 10X基因组学有限公司 使用rna模板化连接进行空间分析的方法
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
WO2021216708A1 (en) 2020-04-22 2021-10-28 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
AU2022212231A1 (en) * 2021-01-29 2023-08-03 10X Genomics, Inc. Method for transposase mediated spatial tagging and analyzing genomic dna in a biological sample
CN116829731A (zh) * 2021-02-04 2023-09-29 Illumina公司 转座体结合珠粒上的长带索引连接的读段生成
AU2022238446A1 (en) 2021-03-18 2023-09-07 10X Genomics, Inc. Multiplex capture of gene and protein expression from a biological sample
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
GB202114206D0 (en) * 2021-10-04 2021-11-17 Genome Res Ltd Novel method
WO2023131939A1 (en) * 2022-01-05 2023-07-13 Yeda Research And Development Co. Ltd. Methods and kits for analyzing nucleosomes and plasma proteins
WO2024033174A1 (en) * 2022-08-12 2024-02-15 Miltenyi Biotec B.V. & Co. KG Barcoding of nucleic acids from single cells

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
JP2610643B2 (ja) * 1988-03-14 1997-05-14 紀夫 村田 グリセロール−3−リン酸アシルトランスフェラーゼをコードするdna鎖
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
JP2801051B2 (ja) 1988-06-24 1998-09-21 アムジエン・インコーポレーテツド 核酸塩基配列を検出するための方法及び試薬
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
JP2955759B2 (ja) 1988-07-20 1999-10-04 セゲブ・ダイアグノスティックス・インコーポレイテッド 核酸配列を増幅及び検出する方法
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
ES2089038T3 (es) 1990-01-26 1996-10-01 Abbott Lab Procedimiento mejorado para amplificar acidos nucleicos blanco aplicable para la reaccion en cadena de polimerasa y ligasa.
JP2777678B2 (ja) * 1990-06-11 1998-07-23 敏一 中村 組換ヒト肝実質細胞増殖因子及びその製造方法
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
ES2350626T3 (es) * 1993-08-30 2011-01-25 Baylor College Of Medicine Inhibidor de la síntesis de adn que es producido en células senescentes.
JP3175110B2 (ja) 1994-02-07 2001-06-11 オーキッド・バイオサイエンシーズ・インコーポレイテッド リガーゼ/ポリメラーゼ媒体された単一ヌクレオチド多型のジェネティックビットアナリシスおよび遺伝子解析におけるその使用
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
WO1995025180A1 (en) 1994-03-16 1995-09-21 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5702898A (en) * 1995-06-06 1997-12-30 The Trustees Of Columbia University In The City Of New York Procedure for normalization of cDNA libraries
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US5846721A (en) * 1996-09-19 1998-12-08 The Trustees Of Columbia University In The City Of New York Efficient and simpler method to construct normalized cDNA libraries with improved representations of full-length cDNAs
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP1591541B1 (en) 1997-04-01 2012-02-15 Illumina Cambridge Limited Method of nucleic acid sequencing
CA2406391C (en) * 1997-09-24 2005-08-02 Invitrogen Corporation Normalized nucleic acid libraries and methods of production thereof
US6399334B1 (en) * 1997-09-24 2002-06-04 Invitrogen Corporation Normalized nucleic acid libraries and methods of production thereof
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US20050244870A1 (en) 1999-04-20 2005-11-03 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
CN1367840A (zh) 1999-08-02 2002-09-04 威斯康星校友研究基金会 突变型Tn5转座酶及其使用方法
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
EP1990428B1 (en) 2000-02-07 2010-12-22 Illumina, Inc. Nucleic acid detection methods using universal priming
US6913884B2 (en) 2001-08-16 2005-07-05 Illumina, Inc. Compositions and methods for repetitive use of genomic DNA
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
WO2001075177A2 (en) * 2000-04-03 2001-10-11 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Tumor markers in ovarian cancer
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
CN1444651A (zh) * 2000-06-23 2003-09-24 泰世基因公司 在酵母中生产抗体文库以及抗体文库的应用
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
WO2002031149A2 (en) * 2000-10-12 2002-04-18 Marical, Inc. Polyvalent cation-sensing receptor proteins in aquatic species
JP2002153283A (ja) * 2000-11-24 2002-05-28 National Institute Of Agrobiological Sciences 植物の開花を誘導する遺伝子Hd3aおよびその利用
AU2002227156A1 (en) 2000-12-01 2002-06-11 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US20040161741A1 (en) * 2001-06-30 2004-08-19 Elazar Rabani Novel compositions and processes for analyte detection, quantification and amplification
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
JP2005519595A (ja) * 2002-03-01 2005-07-07 ダイアックス、コープ モジュラーリコンビナトリアルディスプレイライブラリー
DK3002289T3 (en) 2002-08-23 2018-04-23 Illumina Cambridge Ltd MODIFIED NUCLEOTIDES FOR POLYNUCLEOTIDE SEQUENCE
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
US7083980B2 (en) 2003-04-17 2006-08-01 Wisconsin Alumni Research Foundation Tn5 transposase mutants and the use thereof
US20050053980A1 (en) 2003-06-20 2005-03-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
US7608434B2 (en) 2004-08-04 2009-10-27 Wisconsin Alumni Research Foundation Mutated Tn5 transposase proteins and the use thereof
GB2423819B (en) 2004-09-17 2008-02-06 Pacific Biosciences California Apparatus and method for analysis of molecules
EP1845160A4 (en) * 2005-02-10 2009-07-01 Riken NUCLEOTIDE-amplification
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US8241573B2 (en) 2006-03-31 2012-08-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
EP2089517A4 (en) 2006-10-23 2010-10-20 Pacific Biosciences California POLYMERASEENZYME AND REAGENTS FOR ADVANCED NUCKIC ACID SEQUENCING
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2674751B1 (en) 2006-12-14 2017-02-01 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
JP5794572B2 (ja) 2008-10-24 2015-10-14 エピセンター テクノロジーズ コーポレイションEpicentre Technologies Corporation 核酸を修飾するためのトランスポゾン末端組成物及び方法
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
AU2011323107B2 (en) * 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
CN102559856B (zh) * 2010-12-22 2014-03-12 深圳华大基因科技服务有限公司 去除测序文库中的载体片段的方法
US20160194694A1 (en) * 2011-04-28 2016-07-07 Life Technologies Corporation Multiplex transcriptome analysis
US20150344938A1 (en) * 2011-04-28 2015-12-03 Life Technologies Corporation Multiplex transcriptome analysis
US9005935B2 (en) 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
WO2013085918A1 (en) 2011-12-05 2013-06-13 The Regents Of The University Of California Methods and compostions for generating polynucleic acid fragments
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
AU2014268710B2 (en) * 2013-05-23 2018-10-18 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
KR101648252B1 (ko) * 2014-01-28 2016-08-16 연세대학교 산학협력단 염기서열 확인 과정에서 분리된 핵산 단편들을 회수하는 방법
SG11201608585RA (en) 2014-04-15 2016-11-29 Illumina Inc Modified transposases for improved insertion sequence bias and increased dna input tolerance
US20170044525A1 (en) * 2014-04-29 2017-02-16 Illumina, Inc. Multiplexed single cell gene expression analysis using template switch and tagmentation
US10975371B2 (en) * 2014-04-29 2021-04-13 Illumina, Inc. Nucleic acid sequence analysis from single cells
CN112430641A (zh) * 2014-06-30 2021-03-02 亿明达股份有限公司 使用单侧转座的方法和组合物
CN107969137B (zh) * 2014-10-17 2021-10-26 伊卢米纳剑桥有限公司 接近性保留性转座
CN104328183A (zh) * 2014-10-30 2015-02-04 东南大学 基于高通量测序的基因组单倍型甲基化检测方法
CN104357563A (zh) * 2014-10-30 2015-02-18 东南大学 二次dna片段化的基因组单倍型高通量测序方法
KR20170135834A (ko) * 2015-02-10 2017-12-08 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
EP3259371B1 (en) * 2015-02-19 2020-09-02 Becton, Dickinson and Company High-throughput single-cell analysis combining proteomic and genomic information
CN106319639B (zh) * 2015-06-17 2018-09-04 深圳华大智造科技有限公司 构建测序文库的方法及设备
CA2991265A1 (en) * 2015-07-23 2017-01-26 Biocartis Nv Optimized clinical sample sequencing
EP4368715A2 (en) * 2015-08-28 2024-05-15 Illumina, Inc. Nucleic acid sequence analysis from single cells
EP3670671B1 (en) * 2015-09-18 2023-07-26 Vanadis Diagnostics Probe set for analyzing a dna sample and method for using the same
EP3519612B1 (en) * 2016-10-01 2022-04-06 Berkeley Lights, Inc. Dna barcode compositions and methods of in situ identification in a microfluidic device
KR102417999B1 (ko) * 2016-12-13 2022-07-06 삼성전자주식회사 차세대 핵산 서열 분석을 위한 라이브러리의 복잡성을 측정하는 방법
WO2018208804A1 (en) * 2017-05-09 2018-11-15 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples
WO2018218226A1 (en) * 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CN112004920A (zh) * 2018-02-05 2020-11-27 斯坦福大学托管董事会 用于单细胞和集合细胞的多重测量的系统和方法
CN112005115A (zh) * 2018-02-12 2020-11-27 10X基因组学有限公司 表征来自单个细胞或细胞群体的多种分析物的方法
CN108486100A (zh) * 2018-03-22 2018-09-04 苏州泰康吉安仪器科技有限公司 一种dna长度可控片段化方法及其在构建文库中的应用
EP3788166A4 (en) * 2018-05-01 2022-04-20 Takara Bio USA, Inc. METHODS FOR THE AMPLIFICATION OF NUCLEIC ACIDS AND COMPOSITIONS AND KITS FOR CARRYING OUT THESE
CA3097976A1 (en) * 2018-05-03 2019-11-07 Becton, Dickinson And Company High throughput multiomics sample analysis

Also Published As

Publication number Publication date
EP4293126A2 (en) 2023-12-20
BR112021006183A2 (pt) 2021-06-29
MX2021003771A (es) 2021-05-27
CA3113091A1 (en) 2020-06-04
EP3887540A2 (en) 2021-10-06
CN112867801A (zh) 2021-05-28
WO2020112604A2 (en) 2020-06-04
JP2022513561A (ja) 2022-02-09
FI3887540T3 (fi) 2023-09-14
SG11202102700TA (en) 2021-04-29
EP3887540B1 (en) 2023-08-23
EP4293126A3 (en) 2024-01-17
WO2020112604A3 (en) 2020-07-30
AU2019390388A1 (en) 2021-05-06
ES2960890T3 (es) 2024-03-07
DK3887540T3 (da) 2023-09-18
US20220195504A1 (en) 2022-06-23
IL281538A (en) 2021-05-31

Similar Documents

Publication Publication Date Title
EP3887540B1 (en) Analysis of multiple analytes using a single assay
US11649498B2 (en) Spatial indexing of genetic material and library preparation using hydrogel beads and flow cells
US20230323426A1 (en) Single cell whole genome libraries and combinatorial indexing methods of making thereof
JP6704955B2 (ja) 断片化したゲノムdna試料におけるゲノム連結性情報の保存
JP7234114B2 (ja) 細胞区画内の生体分子への直交アクセスおよび細胞区画内の生体分子のタグ付けのための分析システム
US11359226B2 (en) Contiguity particle formation and methods of use
WO2020180778A9 (en) High-throughput single-nuclei and single-cell libraries and methods of making and of using
US20220195507A1 (en) Methods and means for preparing a library for sequencing
RU2815513C2 (ru) Способы и средства получения библиотеки для секвенирования
KR20230137394A (ko) 트랜스포좀 결합된 비드 상의 긴 인덱싱된-연결된 판독 생성
WO2024031061A1 (en) Methods for improving strand invasion efficiency