KR20170023011A - 시료 분석용 방법들 및 조성물 - Google Patents

시료 분석용 방법들 및 조성물 Download PDF

Info

Publication number
KR20170023011A
KR20170023011A KR1020167036360A KR20167036360A KR20170023011A KR 20170023011 A KR20170023011 A KR 20170023011A KR 1020167036360 A KR1020167036360 A KR 1020167036360A KR 20167036360 A KR20167036360 A KR 20167036360A KR 20170023011 A KR20170023011 A KR 20170023011A
Authority
KR
South Korea
Prior art keywords
nucleic acid
less
sequence
sample
sequencing
Prior art date
Application number
KR1020167036360A
Other languages
English (en)
Inventor
미르나 자로스즈
크리스토퍼 힌드슨
마이클 쉬날-레빈
케빈 딘 네스
세르지 삭소노브
벤자민 제이. 힌드슨
존 스투엘프나겔
Original Assignee
10엑스 제노믹스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 10엑스 제노믹스, 인크. filed Critical 10엑스 제노믹스, 인크.
Publication of KR20170023011A publication Critical patent/KR20170023011A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Abstract

본 명세서는 투입 시료의 총량이 낮거나 또는 관심 표적이 전체 시료 안에 상대적으로 소수 또는 희귀 집단인 경우, 시료 공정 및 분석을 위한 방법들과 시스템들에 관계한다. 본 명세서는 특히 관심 표적 핵산이 전체 핵산에서 상대적으로 낮은 비율로 존재하는, 시료들이 포함된 핵산 시료를 분석하는 것에 관계한다.

Description

시료 분석용 방법들 및 조성물{METHODS AND COMPOSITIONS FOR SAMPLE ANALYSIS}
교차 참고자료
본 출원은 2014년 6월 26일자로 제출된 미국 가특허 출원 번호 62/017,580, 2014년 10월 14일자로 제출된 미국 가특허 출원 62/063,870에 대해 우선권을 주장하며, 이들 각 출원은 사실상 이들 전문이 여기에 참고자료로 편입된다.
배경
핵산 시퀀싱(sequencing)은 진단학, 예후학, 생명과학, 그리고 법의학적 생물학이 포함된 다양한 생의학적 맥락에 있어서 정보를 얻는데 광범위하게 이용된다. 시퀀싱(sequencing)는 Maxam-Gilbert 시퀀싱 및 쇄-종료 방법들이 포함된 기본 방법들, 또는 숏건(shotgun) 시퀀싱 및 브릿지 PCR이 포함된 드 노보(de novo) 시퀀싱 방법들, 또는 폴로니(polony) 시퀀싱, 454 피로시퀀싱, Illumina 시퀀싱, SOLiD 시퀀싱, Ion Torrent 반도체 시퀀싱, HeliScope 단일 분자 시퀀싱, SMRT® 시퀀싱이 포함된 차-세대 방법들, 및 기타 방법들이 관련될 수 있다. 대부분 시퀀싱 어플리케이션은 최소량의 시료 투입을 요구하고, 이는 보통 수백 나노그램 내지 수십 마이크로그램까지 다양하다. 상대적으로 많은 양의 출발 재료의 요구는 다수의 어플리케이션, 특히 최소량의 출발 재료가 이용가능한 어플리케이션에 심각한 장애를 야기할 수 있다. 이러한 어플리케이션의 예로는 출생전 비-침습성 진단 (NIPD), 이때 오직 소량의 DNA는 태아의 것이며, 그리고 암 진단, 이때 방대한 시료의 대부분은 정상적인 건강한 세포들이며, 종양 또는 암 세포들로부터 기인된 단지 소량의 세포로 구성된 것들을 포함한다. 시료들의 핵산 시퀀싱을 위한 방법들 및 조성물을 개발할 필요가 여전히 있으며, 이때 시료 핵산의 출발량은 상대적으로 적고, 또는 시료에서 관심대상의 핵산은 존재하는 전체 핵산에서 상대적으로 작은 비율로 구성된다. 본 명세서는 이러한 요구 및 다양한 기타 요구를 해결한다.
요약
본 명세서는 핵산을 분석하는 방법 및 시스템, 특히, 투입 핵산 양이 적은 방법 및 시스템을 제공한다. 한 측면에 있어서, 본 명세서는 핵산을 분석하는 방법을 제공하는데, 핵산 시료로부터 유도된 핵산 콜렉션(collection)을 제공하며, 이때 상기 핵산 콜렉션은 50 나노그램 (ng) 미만의 양으로 핵산 분자를 포함하며; 핵산 콜렉션의 증폭 생성물을 형성하기 위하여 파티션(partitions) 안에서 핵산 콜렉션을 증폭시키고; 핵산 콜렉션과 증폭 생성물을 푸울링(pooling)하여 푸울된(pooled) 혼합물을 만들고; 그리고 상기 푸울된 혼합물 안에 핵산의 최소한 일부분의 핵산 서열을 탐지하는 것을 포함한다.
일부 구체예들에 있어서, 핵산 콜렉션을 제공한 후, 그리고 증폭화(amplifying) 전, 상기 방법은 혼합물을 형성하기 위하여 비드에 방출가능하도록 연결되는 다수의 올리고뉴클레오티드를 핵산 콜렉션에 복합시키고, 상기 혼합물을 상기 파티션에 분배시키고(partitioning), 그리고 상기 파티션 안에서 비드로부터 상기 올리고뉴클레오티드를 방출시키는 것을 포함한다. 일부 구체예들에 있어서, 다수의 올리고뉴클레오티드 각각은 최소한 하나의 불변(constant) 영역과 가변(variable) 영역을 포함한다. 일부 구체예들에 있어서, 상기 불변 영역은 바코드(barcode) 서열을 포함한다. 일부 구체예들에 있어서, 상기 바코드 서열의 길이는 약 6개 뉴클레오티드 내지 약 20개의 뉴클레오티드이다. 일부 구체예들에 있어서, 상기 가변 영역은 프라이머(primer) 서열을 포함한다. 일부 구체예들에 있어서, 상기 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능한다. 일부 구체예들에 있어서, 상기 올리고뉴클레오티드는 하나 또는 그 이상의 자극 (가령, pH, 빛, 화학 종 및/또는 환원제 (가령, 디티오트레이톨 (DTT) 또는 트리스(2-카르복실에틸)포스핀 (TCEP))에 노출 시 비드로부터 방출된다.
일부 구체예들에 있어서, 탐지는 90% 이상의 정확도에서 완료된다. 일부 구체예들에 있어서, 탐지는 95% 이상의 정확도에서 완료된다. 일부 구체예들에 있어서, 탐지는 99% 이상의 정확도에서 완료된다. 일부 구체예들에 있어서, 탐지는 상기 핵산 콜렉션 안에 핵산의 최소한 90%를 탐지하는 것을 포함한다. 일부 구체예들에 있어서, 탐지는 상기 핵산 콜렉션 안에 작은 집단(minor population)의 서열 탐지를 포함하고, 이때 작은 집단은 상기 핵산 콜렉션의 50% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 상기 핵산 콜렉션의 25% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 상기 핵산 콜렉션의 10% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 상기 핵산 콜렉션의 5% 미만으로 구성된다.
일부 구체예들에 있어서, 그 양은 40 ng 미만이다. 일부 구체예들에 있어서, 그 양은 20 ng 미만이다. 일부 구체예들에 있어서, 그 양은 10 ng 미만이다. 일부 구체예들에 있어서, 그 양은 5 ng 미만이다. 일부 구체예들에 있어서, 그 양은 1 ng 미만이다. 일부 구체예들에 있어서, 그 양은 0.1 ng 미만이다.
일부 구체예들에 있어서, 상기 파티션은 작은 방울 (가령, 작은 유체 방울, 이를 테면 유중수적형(water-in-oil) 에멸젼 안에 작은 수성 방울), 미소캡슐, 웰(wells) 또는 튜브를 포함한다. 일부 구체예들에 있어서, 상기 파티션은 미세유동적(microfluidic) 장치에 의해 생성된다.
일부 구체예들에 있어서, 상기 핵산 콜렉션은 액체 이를 테면, 예를 들면, 혈액, 혈장, 혈청, 또는 소변이 포함된 액체로부터 유도된다. 일부 구체예들에 있어서, 상기 핵산 콜렉션의 최소한 하나의 부분집합은 하나 또는 그 이상의 순환 종양 세포들 (가령, 비-보존된 시료로부터 또는 포름알데히드 고정된 그리고 파라핀 매립된 시료로부터 획득된 이를 테면 하나 또는 그 이상의 순환 종양 세포들) 및/또는 종양으로부터 유도된다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 조직 생검(biopsy)으로부터 유도된다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 태아 핵산을 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션의 핵산의 5% 미만은 태아 핵산을 포함한다. 일부 구체예들에 있어서, 상기 핵산 시료는 세포 시료를 포함한다. 일부 구체예들에 있어서, 상기 세포 시료는 5% 미만의 순환 종양 세포들을 포함한다. 일부 구체예들에 있어서, 상기 세포 시료는 5% 미만의 종양 세포들을 포함한다.
일부 구체예들에 있어서, 상기 핵산 시료는 살아있는 시료, 비-보존된 시료, 보존된 시료, 방부처리된 시료 및/또는 고정된 시료로부터 유도된다. 일부 구체예들에 있어서, 상기 시료는 매립된 시료다. 일부 구체예들에 있어서, 상기 시료는 포름알데히드 고정된 그리고 파라핀 매립된 시료다.
또다른 측면에 있어서, 본 명세서는 핵산을 분석하는 방법을 제공하는데, 상기 핵산 콜렉션의 증폭 생성물을 형성하기 위하여 파티션 안에 핵산시료로부터 유도된 핵산 콜렉션을 증폭화하고; 푸울된 혼합물을 만들기 위하여 상기 핵산 콜렉션과 증폭 생성물을 푸울링하고; 그리고 상기 푸울된 혼합물에서 핵산 콜렉션내 작은 집단의 핵산 서열을 탐지하는 것을 포함하며, 이때 상기 작은 집단은 상기 핵산 콜렉션의 50% 미만으로 구성된다.
일부 구체예들에 있어서, 상기 방법은 상기 핵산 콜렉션의 증폭화 전, 혼합물을 형성하기 위하여 비드에 방출가능하도록 연결되는 다수의 올리고뉴클레오티드를 핵산 콜렉션에 복합시키고, 상기 혼합물을 상기 파티션에 분배시키고, 그리고 상기 파티션 안에 비드로부터 상기 올리고뉴클레오티드를 방출시키는 것을 포함한다. 일부 구체예들에 있어서, 다수의 올리고뉴클레오티드 각각은 최소한 하나의 불변 영역과 가변 영역을 포함한다. 일부 구체예들에 있어서, 상기 불변 영역은 바코드 서열을 포함한다. 일부 구체예들에 있어서, 상기 가변 영역은 프라이머 서열을 포함한다. 일부 구체예들에 있어서, 상기 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능한다. 일부 구체예들에 있어서, 상기 올리고뉴클레오티드는 하나 또는 그 이상의 자극 (가령, pH, 빛, 화학 종 및/또는 환원제)에 노출시 비드로부터 방출된다.
일부 구체예들에 있어서, 상기 작은 집단은 40% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 30% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 20% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 10% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 5% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 1% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 0.1% 미만으로 구성된다. 일부 구체예들에 있어서, 상기 작은 집단은 종양 핵산을 포함한다. 일부 구체예들에 있어서, 상기 작은 집단은 태아 핵산을 포함한다. 일부 구체예들에 있어서, 상기 작은 집단은 순환 종양 세포 핵산을 포함한다.
일부 구체예들에 있어서, 상기 파티션은 작은 방울, 미소캡슐, 웰 또는 튜브를 포함한다. 일부 구체예들에 있어서, 상기 파티션은 미세유동적 장치에 의해 생성된다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 액체 이를 테면, 예를 들면, 혈액, 혈장, 혈청, 또는 소변이 포함된 액체로부터 유도된다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 조직 생검으로부터 유도된다.
또다른 측면에 있어서, 본 명세서는 핵산을 분석하는 방법을 제공하며, 이 방법은 핵산 시료로부터 유도된 핵산 콜렉션을 제공하고, 이때 상기 핵산 콜렉션은 50 나노그램 (ng) 미만의 양의 핵산 분자들을 포함하고; 상기 핵산 콜렉션에 다수의 올리고뉴클레오티드를 복합시켜 혼합물을 형성하고, 이때 상기 올리고뉴클레오티드의 각각은 최소한 불변 영역과 가변 영역을 포함하며, 이의 불변 영역은 바코드 서열을 포함하고; 상기 혼합물을 다수의 파티션에 분배하고, 그리고 상기 파티션 안에 상기 핵산 콜렉션을 증폭시켜 상기 핵산 콜렉션의 증폭 생성물을 만들고; 상기 핵산 콜렉션과 증폭 생성물을 푸울링하여 푸울된 혼합물을 만들고; 그리고 최소한 90%의 민감도(sensitivity)로 푸울된 혼합물 안에 핵산의 최소한 일부분의 핵산 서열을 탐지하는 것을 포함한다.
일부 구체예들에 있어서, 상기 핵산 콜렉션은 40 ng 미만의 양의 핵산 분자를 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 20 ng 미만의 양의 핵산 분자를 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 10 ng 미만의 양의 핵산 분자를 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 5 ng 미만의 양의 핵산 분자를 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 1 ng 미만의 양의 핵산 분자를 포함한다. 일부 구체예들에 있어서, 상기 핵산 콜렉션은 0.1 ng 미만의 양의 핵산 분자를 포함한다.
일부 구체예들에 있어서, 상기 가변 영역은 프라이머 서열을 포함한다. 일부 구체예들에 있어서, 상기 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능한다. 일부 구체예들에 있어서, 탐지는 최소한 95%의 민감도에서 푸울된 혼합물 안에 핵산의 최소 일부분의 핵산 서열을 탐지하는 것을 포함한다. 일부 구체예들에 있어서, 탐지는 최소한 99%의 민감도에서 푸울된 혼합물 안에 핵산의 최소 일부분의 핵산 서열을 탐지하는 것을 포함한다.
또다른 측면에 있어서, 본 명세서는 핵산 서열을 분석하는 방법을 제공하는데, 이 방법은 핵산 시료로부터 생성된 핵산 분자들을 포함하는 파티션을 제공하고; 상기 파티션으로부터 핵산 분자들을 핵산 혼합물 안으로 푸울링하고; 상기 핵산 분자들의 핵산 서열을 포함하는 시퀀싱 판독(sequencing reads)을 만들기 위하여 상기 핵산 혼합물을 핵산 시퀀싱하고; 상기 시퀀싱 판독을 분석하고, 그리고 시퀀싱 판독에서 상기 핵산 혼합물 안에 오염(contaminant) 핵산 분자와 연합된 최소한 하나의 오염 판독을 식별해내기 위하여 프로그램화된 컴퓨터 프로세서를 이용하고; 상기 시퀀싱 판독으로부터 상기 오염 판독을 제거하고; 그리고 제거된 오염 판독을 가진 시퀀싱 판독으로부터 상기 핵산 시료의 서열을 만든는 것을 포함한다.
일부 구체예들에 있어서, 상기 핵산 혼합물 안에 상기 오염 핵산 분자의 양은 핵산 혼합물 안에 핵산 분자는 50% 미만, 20% 미만, 10% 미만, 5% 미만, 1% 미만, 0.1% 미만, 0.01% 미만, 0.001% 미만 또는 0.0001% 미만이다.
일부 구체예들에 있어서, 최소한 하나의 오염 판독은 오염 핵산 분자들과 연합된 다수의 오염 판독을 포함한다. 일부 구체예들에 있어서, 상기 서열은 최소한 90%, 최소한 95% 또는 최소한 99%의 정확도로 생성된다. 일부 구체예들에 있어서, 상기 파티션은 유중수적형 에멸젼 안에 작은 유체 방울, 이를 테면, 예를 들면, 작은 수성 방울을 포함한다.
일부 구체예들에 있어서, 상기 시퀀싱 판독중 주어진 하나에 중첩(들)이 모든 부분집합에 대하여 50% 미만, 모든 부분집합들에 대하여 25% 미만, 모든 부분집합들에 대하여 10% 미만, 모든 부분집합들에 대하여 5% 미만, 모든 부분집합들에 대하여 1% 미만 또는 모든 부분집합들에 대하여 0.1% 미만인 경우, 상기 시퀀싱 판독의 부분집합들중 서열 중첩(들)을 결정하고, 그리고 오염 판독을 확인함으로써 상기 오염 판독이 확인된다. 일부 구체예들에 있어서, 시퀀싱 판독의 부분집합들중 서열 중첩(들)을 결정하고, 그리고 상기 서열 판독중 주어진 하나의 서열이 모든 부분집합들에 대하여 중첩되지 않는 다면, 오염 판독을 확인함으로써, 오염 판독이 식별된다.
일부 구체예들에 있어서, 상기 시퀀싱 판독을 기준과 비교하고, 주어진 시퀀싱 판독이 기준과 50% 미만, 25% 미만, 10% 미만, 5% 미만, 1% 미만 또는 0.1% 미만으로 중첩된다면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인된다. 일부 구체예들에 있어서, 상기 시퀀싱 판독을 기준과 비교하고, 그리고 주어진 시퀀싱이 기준과 중첩되지 않는 다면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인된다.
일부 구체예들에 있어서, 상기 시퀀싱 판독을 서로 비교함으로써, 상기 시퀀싱 판독들중에서 서열 중첩(들)을 확인해내고, 그리고 이의 서열 중첩이 상기 시퀀싱 판독중 다른 시퀀싱 판독과 50% 미만, 25% 미만, 10% 미만, 5% 미만, 1% 미만 또는 0.1% 미만 인 경우 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인된다. 일부 구체예들에 있어서, 상기 시퀀싱 판독을 서로 비교함으로써, 상기 시퀀싱 판독들중에서 서열 중첩(들)을 확인해내고, 그리고 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과 중첩되지 않는 경우 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인된다.
일부 구체예들에 있어서, 상기 핵산 시료로부터 생성된 핵산 분자들이 포함된 파티션이 제공되는데, 이는 상기 파티션 안에 상기 핵산 분자들 각각에 대응하는 바코드화된 단편들 또는 이의 복사체들의 생성을 포함한다. 일부 구체예들에 있어서, 상기 시퀀싱 판독은 상기 바코드화된 단편들 또는 이의 복사체들의 핵산 서열이 포함된 바코드화된 단편 판독을 포함한다. 일부 구체예들에 있어서, 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 20% 미만, 15% 미만, 10% 미만, 5% 미만, 3% 미만 또는 0.1% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인된다.
일부 구체예들에 있어서, 상기 서열 판독을 이들의 서열 영역(들)로 매핑하고(mapping), 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독의 10개 미만, 5개 미만, 3개 미만 또는 1개 미만 또는 다른 판독이 없이 중첩되는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인된다.
본 명세서의 추가 측면들 및 장점들은 다음의 상세한 설명으로부터 당업자들에게 자명해질 것이며, 이때 단지 본 명세서의 설명적 구체예들을 나타내고, 그리고 설명된다. 인지하는 바와 같이, 본 명세서는 다른 상이한 구체예들일 수 있으며, 이의 몇 가지 세부적 사항은 본 명세서를 벗어나지 않고 다양한 명백한 측면에 있어서 변형될 수 있다. 따라서, 도면 및 설명은 그대로 설명을 위한 것으로 간주되며, 제한적인 것은 아니다.
참고자료의 편입
본 명세서에서 언급된 모든 공개물, 특허, 특허 출원들은 각 개별 공개, 특허 또는 특허 출원이 특이적으로 그리고 개별적으로 참고문헌에 통합된 것과 동일한 수준으로 이들의 전문이 참고자료에 통합된다.
도면의 간단한 설명
본 발명의 신규한 특징들은 첨부된 청구범위에서의 특이성으로 제시된다. 본 발명의 특징들 및 장점들은 예시적인 구체예들에서 제시된 상세한 설명을 참고하여 더 잘 이해될 수 있고, 이때 본 발명의 원리가 이용되며, 첨부 도면 (또한 명세서에서 "도면" 및 "도(FIG)")은 다음과 같다:
도 1은 예를 들면, 시퀀싱을 위하여 시료를 처리하는 흐름도표다.
도 2는 시료와 비드를 공동-분할하기 위한 예시적인 미세유동적 채널 구조를 도식적으로 설명한다.
도 3은 시료들의 증폭 및 바코드화를 위한 예시적인 공정을 도식적으로 설명한다.
도 4는 서열 데이터를 이들의 기원에 귀속시킴(attributing)에 있어서 서열의 바코드화 사용 예를 도식적으로 설명하는 것이다.
도 5는 컴퓨터 제어 시스템의 예를 도식적으로 설명하는 것이다.
상세한 설명
이 발명의 다양한 구체예들이 제시 및 설명되었지만, 이들 구체예는 오로지 예시를 위하여 제시된 것이라는 사실은 당업자에게 자명할 것이다. 본 발명을 벗아나지 않고, 다수의 변형, 변화 및 치환이 일어날 수 있다. 본 명세서에서 설명된 발명의 구체예에 다양한 대안이 이용될 수 있음을 인지해야 한다.
I. 전반적인 개요
본 명세서는 출발 재료의 양이 상대적으로 낮거나 또는 관심 표적이 총 출발 재료에서 단지 작은 비율로 구성된 경우, 시료 가공 및 분석에 유용한 방법들 및 시스템을 제공한다. 본 명세서에서 제공되는 방법들 및 시스템들은 핵산 시퀀싱 어플리케이션에 특히 유용한데, 이때 출발 핵산 (가령, DNA, mRNA, 등등) - 또는 출발 표적 핵산 -은 작은 양으로 존재하거나, 또는 이때 분석의 표적이 되는 핵산은 시료 안에 상대적으로 낮은 비율로 존재한다. 본 명세서에서 제공되는 방법들 및 시스템들은 출발 시료 재료를 별개의 분리된 유닛으로 분배하고; 별개의 유닛 안에 상기 재료에 확인가능한 바-코드를 붙여서 재료는 유닛별로(unit-by-unit) 식별될 수 있도록 하고; 상기 유닛으로부터 상기 재료를 푸울링하고; 상기 푸울된 재료를 시퀀싱하고; 그리고 관심 핵산을 탐지 또는 정량화하기 위하여 상기 시퀀싱 정보를 분석하는 것에 일반적으로 관련된다.
상기 설명된 방법들과 시스템들은 현재 핵산 시퀀싱 기술 및 이들과 연합된 시료 준비 방법들과 비교하여 상당한 장점들을 제공한다. 예를 들면, 상기 방법들과 시스템들은 핵산을 특징화시키는데 특히 유용하며, 이때 투입 핵산의 총량은 매우 낮다. 많은 핵산 분석 시스템들에 있어서, 시스템의 임계적 한계는 매우 작은 양의 핵산을 분석하지 못하는데 있다. 이로써 희귀한 사안들, 개별 세포들, 또는 획득하기 곤란한 또는 시료를 처리하기 곤란한 경우에 어려움이 발생된다. 예를 들면, 시퀀싱 시스템들 기술에서 현재 상태중 많은 것들은 Illumina 시퀀싱 시스템들의 경우 분석용으로 50-100 나노그램 (ng) 범위의 핵산 출발량을 필요로 하고, Pacific Biosciences SMRT 시퀀싱의 경우 500 ng의 출발 핵산을 필요로 하고, Ion Torrent 시퀀싱 시스템들의 경우 시종 최대 1 마이크로그램 (μg)을 필요로 한다.
투입 핵산의 양이 적은 핵산의 분석 및 특징화에 있어서 가치가 있는 것에 추가하여, 본 명세서에서 설명된 방법들과 시스템들은 분석될 시료 안에 전체 핵산에서 낮은 비율로 존재하는 핵산에 대한 시료를 분석할 경우, 시료 핵산의 양이 가령, 상기에서 설명된 바와 같이 절대적으로 낮은 수준이며, 그리고 상대적으로 낮은 비율로 존재하는 경우 상당한 잇점을 또한 제공한다. 한 예로써, 대부분의 시퀀싱 기술은 상기 시퀀싱 공정을 위한 충분한 재료를 얻기 위하여 시료 안에 표적 핵산의 광범위한 증폭을 필요로 한다. 이들 증폭 공정들은 특히 상기 시료가 작은 관심 집단을 보유한 비균질적 집단인 경우, 가령, 이때 관심대상의 표적 핵산은 전체 핵산에서 상대적으로 낮은 비율 (가령, 20% 미만)로 존재하는 경우, 정보 상실의 원인이 될 수 있다. 특히, 시료 안에서 핵산의 광범위한 증폭은 주(major) 집단을 선호적으로 증폭시키고, 그리고 시료에서 작은 집단의 신호를 압도시킬 수 있다. 시료 안의 핵산의 주 집단은 일부 경우에 증폭 공정 동안 작은 집단들보다 더 경쟁적일 수 있으며, 따라서 주 집단이 선호적으로 증폭될 수 있다. 주 핵산 집단과 부(minor) 핵산 집단을 갖는 시료의 예로써 주로 건강한 조직을 포함하고, 매우 소량의 병이든 조직, 이를 테면 종양 조직을 포함할 수 있는 조직 생검 시료가 있다. 따라서 이러한 시료로부터 추출된 단지 작은 비율의 핵산 (가령, DNA)은 병이 든 또는 비정상적인 집단 (가령, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만 등등)을 나타낼 수 있다. 전형적인 증폭 방법, 이를 테면 PCR은 건강한 조직에서부터 증폭의 손상(detriment) DNA, 그리고 심지어 종양 세포들의 DNA의 증폭 배제(exclusion) DNA를 신속하게 증폭시킬 수 있다. 이러한 증폭은 가령, 기하학적 증폭의 진행이 포함된 몇 가지 인자들에 의해 기인된 것이며, 이때 더 많은 양으로 시작된 시료는 소수 성분의 증폭을 신속하게 앞지른다. 이러한 증폭은 원천 이용(resource utilization)으로부터 또한 기인될 수 있는데, 이때 더 신속하게-성장하는 집단은 증폭을 위한 이용가능한 재원, 가령, 프라이머, 중합효소들 그리고 뉴클레오티드에게 소수 성분의 증폭 배제에 대하여 주요 성분을 증폭하도록 신속하게 지시한다. 더욱이, 이들 증폭 반응은 푸울된 상황에서 전형적으로 실행되기 때문에, 특이적 염색체, 폴리뉴클레오티드 또는 유기체에 있어서 증폭된 서열의 기원(origin)은 공정 동안 보존되지 못할 수도 있다.
특정 측면들에 있어서, 본 명세서에서 제공되는 방법들 및 시스템들은 개별적(individual) 또는 소수의 핵산들이 분리된 반응 용적, 가령, 작은 방울 또는 다른 파티션으로 할당되도록 분배하며, 여기에서 이들 핵산 성분들이 처음으로 증폭될 수 있다. 이 초기 증폭 동안 이들 분리된 반응 용적 안에 있는 성분들에 독특한 바코드가 연결된다. 상이한 성분들의 별도의 분배된 증폭, 뿐만 아니라 독특한 바코드 서열의 적용에 의해 후속적 증폭 공정들, 가령, PCR 또는 다른 증폭 공정들이 포함된 시퀀싱 과정을 통하여 각 시료 성분의 분담(contributions), 뿐만 아니라 이의 기원의 속성(attribution)이 보존된다. 시료들의 분배 및 바-코딩 방법들은 2014년 6월 26일자 제출된 U.S. 특허 출원 번호 14/316,383, 뿐만 아니라 2014년 2월 7일자로 제출된 U.S. 가특허 출원 번호 61/940,318, 및 2014년 5월 9일자로 제출된 61/991,018에서 상세하게 설명되며, 이들의 전체 공개문은 모든 용도로써 이들의 전문이 본 명세서에 참고자료에 편입된다.
본 명세서에서 공개된 방법들과 시스템들은 광범위한 환경(settings)에서 유용하다. 예를 들면, 상기 방법들과 시스템들은 임상적 진단학, 특히 실질 기관(solid organ) 암 및 혈액 암이 포함된 암을 진단, 또는 차등적으로 진단하기 위하여 또는 임산부에서 얻은 시료에서 태아 이수성(aneuploidy)을 탐지하는데 이용될 수 있다. 상기 방법들과 시스템들은 생물학적 연구, 특히 생의학적 연구에 또한 이용될 수 있다. 상기 방법들과 시스템들은 유기체 집단 (가령, 이를 테면 미생물군유전체(microbiome))의 특징화, 뿐만 아니라 법의학 및 환경 테스트에도 또한 이용될 수 있다.
II. 작업 흐름 개요
도 1은 시료 핵산을 바코드화하고, 그리고 후속적으로 시퀀싱시키기 위한 예시적인 방법을 설명하는데, 특히 이때 상기 시료는 상대적으로-적은 양이거나 또는 이때 표적 집단은 상기 시료 안에서 상대적으로 작은 집단이다 (가령, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만 등등). 우선, 핵산이 포함된 시료는 원천(source), 100으로부터 획득될 수 있고, 그리고 바코드화된 비드 세트, 110 또한 획득될 수 있다. 상기 비드는 하나 또는 그 이상의 바코드 서열, 뿐만 아니라 프라이머, 이를 테면 무작위 N-mer 또는 다른 프라이머가 포함된 올리고뉴클레오티드에 연계될 수 있다. 일부 경우들에 있어서, 상기 바코드 서열은 가령, 상기 바코드와 상기 비드 사이에 링키지의 절단을 통하여 바코드화된 비드로부터 방출되거나 또는 상기 바코드를 방출시키기 위하여 아래 비드의 분해를 통하여 바코드화된 비드로부터 방출되거나, 또는 이 둘 조합에 의해 바코드화된 비드로부터 방출된다. 예를 들면, 일부 경우들에 있어서, 상기 바코드화된 비드는 상기 바코드 서열을 방출시키기 위하여, 물질, 이를 테면 환원제에 의해 분해되거나 또는 용해될 수 있다. 이 실시예에 있어서, 적은 양의 상기 핵산이 포함된 시료, 105, 바코드화된 비드, 115, 그리고 일부 경우들에 있어서, 다른 시약들, 가령, 환원제, 120가 복합되며, 분해된다. 한 예로써, 이러한 분배는 상기 성분들을 작은 방울 생성 시스템, 이를 테면 미세유동적 장치, 125에 도입시키는 것을 포함할 수 있다. 미세유동적 장치 125의 도움에 의해, 유중수적형 에멸젼 130이 형성될 수 있고, 이때 상기 에멸젼은 시료 핵산, 105, 환원제, 120, 그리고 바코드화된 비드, 115를 포함하는 작은 수성 방울을 포함한다. 상기 환원제는 상기 바코드화된 비드를 용해시키거나 또는 분해할 수 있고, 이로 인하여 작은 방울, 135 안에 비드로부터 상기 바코드 및 무작위 N-mers를 가진 올리고뉴클레오티드가 방출될 수 있다. 그 다음 상기 무작위 N-mers는 상기 시료 핵산의 상이한 영역을 프라임시킬 수 있고(prime), 증폭 후 시료의 증폭된 복사체들이 생성되고, 이때 각각 복사체는 바코드 서열, 140로 테그(tag)된다. 일부 경우들에 있어서, 작은 방울 각각은 동일한 바코드 서열과 상이한 무작위 N-mer 서열을 포함하는 올리고뉴클레오티드의 세트를 함유한다. 후속적으로, 상기 에멸젼이 파괴되고, 145 그리고 추가 서열 (가령, 특히 시퀀싱 방법들을 도와주는 서열, 추가 바코드들, 등등)은 예를 들면, 증폭 방법들, 150 (가령, PCR)을 통하여 추가될 수 있다. 그 다음 시퀀싱이 실행될 수 있고, 155, 그리고 상기 시퀀싱 데이터, 160를 해석하기 위하여 알고리즘이 적용될 수 있다. 시퀀싱 알고리즘은 시퀀싱 판독을 배열하고 및/또는 특정 서열 판독이 속하는 시료를 확인하기 위하여 바코드들을 전반적으로 분석할 수 있다.
투입 양이 적은 핵산을 특징화시키는 방법들과 시스템들이 본 명세서에서 설명된다. 본 명세서에서 이용되고, 하기에서 설명된 바와 같이, 핵산의 적은 투입 양은 작업 흐름으로 도입되는 시료 핵산의 종합된(aggregate) 낮은 양을 일반적으로 지칭한다. 일부 구체예들에 있어서, 상기 용어는 장치, 이를 테면 미세유동적 장치로 도입되는 시료 핵산의 종합된 양을 지칭한다. 본 명세서에서 추가로 설명된 바와 같이, 핵산의 양은 질량(mass) 또는 게놈 등가체(equivalents)로 표현될 수 있는데, 가령, 작업흐름, 예를 들면 전체 게놈 시료들을 분석할 때, 작업흐름으로 도입되는 게놈 등가체의 수로 표현될 수 있다. 인지할 수 있는 바와 같이, 이는 분석될 유기체의 게놈 크기에 따라, 상기에서 설명된 질량-기반의 투입양의 수로부터 변화될 수 있다. 투입 시료 핵산은 상태와 상관없이(가령, 온전한(intact), 단편화된, 추출된, 추출되고 단편화된, 단편화되고, 크기 선택된, 등등), 도입되는 시료 핵산의 총량을 또한 포괄한다.
하나의 예시적인 측면에 있어서, 본 명세서에서 설명된 방법들과 시스템들은 별개의 파티션으로 개별적 또는 소량의 시료들(가령, 핵산)을 넣어두거나 또는 분배를 위하여 제공되며, 이때 각각 파티션은 이의 내용물을 다른 파티션 안에 있는 내용물로부터 분리되도록 유지시킨다. 본 명세서에서 이용된 바와 같이, 상기 파티션은 구멍(holes), 또는 이와 유사한 것들을 통하여 다양한 상이한 형태, 가령, 웰, 튜브, 마이크로 또는 나노웰을 포함할 수 있는 용기 또는 관(vessels)을 지칭한다. 그러나, 일부 측면들에 있어서, 상기 파티션은 유체 스트림(streams) 안에서 유동적이다. 이들 관은 내부 유체 중심 또는 코어를 에워하는 외측 방벽(barrier)을 가지는 가령, 미소캡슐 또는 마이크로-소포를 포함할 수 있고, 또는 매트릭스 안에 재료들을 혼입시키거나 및/또는 유지시킬 수 있는 다공성 매트릭스일 수 있다. 그러나, 일부 측면들에 있어서, 이들 파티션은 비-수성 연속성 상(phase), 가령, 오일 상 내에 작은 방울의 수성 유체를 포함할 수 있다. 다양한 상이한 관은 2013년 8월 13일자로 제출된 예를 들면, U.S. 특허 출원 번호 13/966,150에서 설명된다. 유사하게, 비-수성 또는 오일 연속성 상에서 안정적인 작은 방울을 만들기 위한 에멸젼 시스템들은 가령, U.S. 특허 공개 번호 2010/0105112에서 상세하게 설명되며, 이의 전체 내용은 본 명세서에 참고자료로 전체적으로 편입된다.
에멸젼 안에 작은 방울의 경우에 있어서, 분배의 시료 재료, 가령, 핵산을 별개의 파티션으로 분배하는 것은 분배 유체, 가령, 플로오르화된(fluorinated) 오일의 비-수성 스트림이 또한 흐를 수 있는 합류점(junction)으로 수성 시료가 포함된 스트림을 흘려보냄으로써 일반적으로 이루어질 수 있고, 흐르는 스트림 분배 유체 안에서 작은 수성 방울이 만들어지고, 이때 이러한 작은 방울은 상기 시료 재료들을 포함한다. 하기에서 설명된 바와 같이, 이러한 작은 방울은 또한 전형적으로 공동-분배된 바코드 올리고뉴클레오티드를 함유한다. 임의의 특정 파티션 안에 시료 재료의 상대적 양은 예를 들면, 상기 수성 스트림 안에 시료 농도, 수성 스트림의 흐름 속도 및/또는 비-수성 스트림, 그리고 이와 유사한 것들이 포함된 시스템의 다양한 상이한 매개변수들을 조절함으로써 조정될 수 있다. 본 명세서에서 설명된 파티션은 극도로 작은 용적을 가짐으로써 흔히 특징화된다. 예를 들면, 작은 방울 기반의 파티션 경우에 있어서, 작은 방울은 1000 pL 미만, 900 pL 미만, 800 pL 미만, 700 pL 미만, 600 pL 미만, 500 pL 미만, 400pL 미만, 300 pL 미만, 200 pL 미만, 100pL 미만, 50 pL 미만, 20 pL 미만, 10 pL 미만, 또는 심지어 1 pL 미만인 전체 용적을 가질 수 있다. 비드와 함께 공동-분배된 경우, 상기 파티션 안에 시료 유체 용적은 상기 설명된 용적의 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 또는 심지어 상기 설명된 용적의 10% 미만일 수 있다는 것을 인지할 것이다. 일부 경우들에 있어서, 낮은 반응 용적 파티션의 용도는 출발 시약들, 가령, 투입 핵산의 매우 작은 양으로 반응을 실행함에 있어서 특이 유익하다.
상기 시료들이 이들의 각 파티션 안으로 도입될 때, 본 명세서에서 설명된 방법들 및 시스템들에 따라, 파티션 안에 내용물은 일반적으로 독특한 식별자들(identifiers)과 함께 제공되어, 이들의 내용물의 특징화에 있어서 이들의 각 기원으로부터 유도된 것으로 볼 수 있다. 따라서, 상기 시료들은 독특한 식별장치들 (가령, 바코드 서열)과 함께 전형적으로 공동-분배된다. 일부 측면들에 있어서, 상기 독특한 식별장치들은 이들 시료들에 부찰될 수 있는 핵산 바코드 서열을 포함하는 올리고뉴클레오티드로 제공된다. 상기 올리고뉴클레오티드는 주어진 파티션에서 올리고뉴클레오티드 사이에 분배되고, 본 명세서에 함유된 핵산 바코드 서열은 동일하나, 그러나 상이한 파티션 사이에 올리고뉴클레오티드는 상이한 바코드 서열을 가질 수 있다. 일부 측면들에 있어서, 오직 하나의 핵산 바코드 서열이 주어진 파티션과 연합될 것이며, 비록 일부 경우들에 있어서, 2개 또는 그 이상의 상이한 바코드 서열이 존재할 수 있다.
상기 핵산 바코드 서열은 상기 올리고뉴클레오티드의 서열 안에 6개 내지 약 20개 또는 그 이상의 뉴클레오티드를 포함할 수 있다. 이들 뉴클레오티드는 완벽하게 연속적일 수 있고, 가령, 인접한 뉴클레오티드의 단일 스트레치(stretch)에 있을 수 있고, 또는 이들 뉴클레오티드는 하나 또는 그 이상의 뉴클레오티드에 의해 2개 또는 그 이상의 별개의 하위서열로 분리될 수 있다. 전형적으로, 별개의 하위서열의 길이는 전형적으로 약 4개 내지 약 16개의 뉴클레오티드일 수 있다.
상기 공동-분배된 올리고뉴클레오티드는 공동-분배된 세포들로부터 핵산의 공정화에 유용한 다른 기능적 서열을 또한 전형적으로 포함할 수 있다. 연합된 바코드 서열, 시퀀싱 프라이머, 혼성화 또는 프로빙 서열, 가령, 상기 서열의 존재 확인을 위한, 또는 바코드화된 핵산을 꺼집어내기(pulling down) 위한 서열, 또는 임의의 수의 다른 잠재적 기능 서열을 부착하게 되는 동안, 상기 파티션 안에 개별적 세포로부터 게놈 DNA를 증폭시키기 위하여 이들 서열은 표적화된 또는 무작위/범용 증폭 프라이머 서열을 포함한다. 다시, 시료 재료들과 함께 올리고뉴클레오티드 및 연합된 바코드들 그리고 다른 기능 서열의 공동-분배는 예를 들면, 본 명세서에서 참고자료에 편입된 2014년 2월 7일자 제출된 U.S. 특허 출원 번호 61/940,318, 2014년 5월 9일자로 제출된 61/991,018, 그리고 2014년 6월 26일자로 제출된 U.S. 특허 출원 번호 14/316,383에 설명된다.
간략하게 설명하자면, 한 가지 예시적인 공정에서 비드 각각은 상기 비드에 방출가능하도록 부착된 상기에서 설명된 올리고뉴클레오티드 다수를 포함하도록 제공되며, 이때 특정 비드에 부착된 모든 올리고뉴클레오티드는 동일한 핵산 바코드 서열을 포함할 수 있고, 그러나 이때 다수의 다양한 바코드 서열은 이용된 비드 집단에 걸쳐 나타낼 수 있다. 전형적으로, 비드 집단은 최소한 1000개의 상이한 바코드 서열, 최소한 10,000개의 상이한 바코드 서열, 최소한 100,000개의 상이한 바코드 서열, 또는 일부 경우들에 있어서, 최소한 1,000,000개의 상이한 바코드 서열을 포함할 수 있는 다양한 바코드 서열을 제공할 수 있다. 추가적으로, 각각 비드는 다수의 부착된 올리고뉴클레오티드 분자들과 함께 전형적으로 제공될 수 있다. 특히, 개별 비드 상에 바코드 서열이 함유된 올리고뉴클레오티드 분자들의 수는 최소한 약 10,000개의 올리고뉴클레오티드, 최소한 100,000개의 올리고뉴클레오티드 분자들, 최소한 1,000,000개의 올리고뉴클레오티드 분자들, 최소한 100,000,000개의 올리고뉴클레오티드 분자들일 수 있고, 그리고 일부 경우들에 있어서 최소한 10억 개의 올리고뉴클레오티드 분자들일 수 있다.
비드에 특정 자극을 적용할 때 상기 비드로부터 올리고뉴클레오티드가 방출될 수 있다. 일부 경우들에 있어서, 상기 자극은 광-자극, 가령, 상기 올리고뉴클레오티드를 방출시킬 수 있는 광-불안정한 링키지 절단을 통한, 광-자극일 수 있다. 일부 경우들에 있어서, 열 자극이 이용될 수 있고, 이때 상기 비드 환경의 온도 상승은 상기 비드로부터 링키지의 절단 또는 올리고뉴클레오티드의 다른 방출이 초래될 수 있다. 일부 경우들에 있어서, 상기 비드에 올리고뉴클레오티드의 링키지를 절단하는 화학 자극이 이용될 수 있거나, 또는 그렇지 않으면 비드로부터 상기 올리고뉴클레오티드의 방출이 초래될 수 있다
본 명세서에서 설명된 방법들 및 시스템들에 따라, 부착된 올리고뉴클레오티드가 포함된 비드는 개별 시료들과 함께 공동-분배될 수 있고, 단일 비드와 단일 시료는 개별 파티션 안에 함유된다. 단일 비드 파티션이 바람직한 일부 경우들에 있어서, 사용된 파티션들이 주로 하나씩(singly) 점유되도록(occupied), 평균적으로 상기 파티션이 파티션 당 한 개 미만의 비드가 함유되도록 유체의 상대적인 흐름 속도가 조절될 수 있다. 유사하게, 당업자는 더 많은 백분율의 파티션이 점유되도록, 가령, 단지 작은 백분율의 사용안된 파티션 만이 허용되도록, 흐름 속도를 조절할 수 있기를 원할 수 있다. 일부 측면들에 있어서, 개별적으로 점유된 파티션의 수가 사용안된 파티션이 특정 수준 미만, 그리고 다수의 사용된 파티션이 특정 수준 미만이 되도록 보장하기 위하여 흐름 및 채널 구조가 통제된다.
상기에서 명시된 바와 같이, 단일 비드 점유(occupancy)가 바람직한 상태일 수 있지만, 다중 점유된 파티션, 또는 사용안된 파티션이 종종 존재할 수 있다는 것을 인지할 것이다. 바코드 올리고뉴클레오티드가 포함된 시료들과 비드들을 공동 분배시키기 위한 미세유동적 채널 구조의 예가 도 2에서 도식적으로 설명된다. 나타낸 바와 같이, 채널 세그먼트 202, 204, 206, 208210가 채널 합류점 212에서 유체가 소통된다. 개별적 시료들 214을 포함하는 수성 스트림은 채널 세그먼트 202를 통하여 채널 합류점 212 방향으로 흐른다. 본 명세서의 도처에서 설명된 바와 같이, 이들 시료는 분배 공정 전, 수성 유체 안에서 현탁될 수 있다.
동시에, 비드 216를 휴대하고 있는 바코드가 포함된 수성 스트림은 채널 세그먼트 204를 통하여 채널 합류점 212 방향으로 흐른다. 비-수성 분배 유체는 측면 채널 206208 각각으로부터 채널 합류점 212로 도입되며, 복합된 스트림은 출구 채널 210로 흐른다. 채널 합류점 212 안에 채널 세그먼트 202204로부터 복합된 2개의 수성 스트림이 복합되고, 그리고 공동-분배된 시료들 214과 비드 216가 포함된 작은 방울 218로 분할된다. 이미 명시된 바와 같이, 채널 합류점 212에서 복합된 각 유체의 흐름 특징을 조절하고, 뿐만 아니라 채널 합류점의 기하학적 구조를 조절함으로써, 생성된 파티션 218 안에 비드, 시료들 또는 이 둘 모두의 원하는 점유 수준을 획득하기 위하여 복합 및 분배를 최적화시킬 수 있다.
인지할 수 있는 바와 같이, 예를 들면, 화학 자극, 핵산 연장, 전사, 및/또는 증폭 시약들 이를 테면 중합효소들, 역 전사효소, 뉴클레오시드 삼인산염 또는 NTP 유사체들, 프라이머 서열 그리고 추가 공인자들, 이를 테면 이러한 반응들에 이용된 이가 금속 이온들, 결찰 반응 시약들, 이를 테면 리게이즈 효소들 그리고 결찰 서열, 염료, 라벨, 또는 다른 테그용(tagging) 시약들이 포함된, 시료 및 비드와 함께 다수의 다른 시약들이 공동-분배될 수 있다.
일단 공동-분배되면, 비드에 배치된 올리고뉴클레오티드는 분배된 시료들에 바코드를 붙이고, 증폭시키는데 이용될 수 있다. 시료들을 증폭시키고, 바코드를 붙이는데 이들 바코드 올리고뉴클레오티드의 사용을 위한 특별하게 고상한 공정은 이미 참고자료에 편입된 2014년 2월 7일자 제출된 U.S. 특허 출원 번호 61/940,318, 2014년 5월 9일자로 제출된 61/991,018, 그리고 2014년 6월 26일자로 제출된 U.S. 특허 출원 번호 14/316,383에 설명된다. 간략하게 설명하자면, 한 측면에 있어서, 비드 상에 있는 시료와 함께 공동-분배된 올리고뉴클레오티드는 비드로부터 시료와 함께 파티션으로 방출되었다. 상기 올리고뉴클레오티드는 바코드 서열과 함께 이의 5' 말단에 전형적으로 프라이머 서열을 함유한다. 이 프라이머 서열은 상기 시료들의 다수의 상이한 영역을 무작위로 프라임시키기 위하여 의도된 무작위 올리고뉴클레오티드 서열일 수 있거나, 또는 이 프라이머 서열은 상기 시료의 특이적으로 표적화된 영역의 스트림을 프라임시키기 위하여 표적화된 특이적 프라이머 서열일 수 있다.
일단 방출되면, 올리고뉴클레오티드의 프라어미 부분은 시료의 상보적 영역에 어닐될 수 있다. 프라이머가 어닐된 주형 가닥에 대한 상보적 단편을 만들기 위하여, 시료 및 비드와 함께 또한 공동-분배되고, 그 다음 그 다음 상보적 단편과 함께 상기 시료를 주형으로 이용하여 프라이머 서열을 연장시키는 연장 반응 시약들, 가령, DNA 중합효소, 뉴클레오시드 삼인산염, 공-인자들 (가령, Mg2 + 또는 Mn2 + 등등)은 올리고뉴클레오티드 및 이의 연합된 바코드 서열을 포함한다. 상기 시료의 상이한 부분들에 다중 프라이머들을 어닐링시켜 연장시키면, 시료의 중첩되는 상보적인 단편들의 큰 푸울(pool)이 만들어질 것이며, 이때 각각은 이것이 생성된 파티션을 나타내는 이의 바코드 서열을 소유한다. 일부 경우들에 있어서, 이들 상보적인 단편들 자체가 바코드 서열이 다시 포함된 보체(complement)의 보체를 만들기 위하여 파티션 안에 존재하는 올리고뉴클레오티드에 의해 프라임된 주형으로 이용될 수 있다. 일부 경우들에 있어서, 이 복제 공정은 제1 보체가 복제될 때, 이의 말단 또는 말단 주변에 2개의 상보적 서열을 만들어져 헤어핀(hairpin) 구조 또는 부분적 헤어핀 구조가 형성됨으로써, 추가적으로 되풀이되는 복사체들의 생산을 위한 기반이 되는 분자의 능력이 감소되도록 복제 공정이 실행된다. 3에서는 이 공정의 한 가지 예를 도식적으로 설명하고 있다.
이 도면에서 보이는 바와 같이, 바코드 서열이 포함된 올리고뉴클레오티드는 에멸젼에서 가령, 작은 방울 302에 시료 핵산 304과 함께 공동-분배된다. 본 명세서의 도처에서 명시된 바와 같이, 상기 올리고뉴클레오티드 308는 상기 시료 핵산 304과 함께 공동-분배되는 비드 306 상에 제공될 수 있고, 이 올리고뉴클레오티드는 패널 A에 나타낸 바와 같이, 상기 비드 306로부터 방출될 수 있다. 상기 올리고뉴클레오티드 308는 하나 또는 그 이상의 기능 서열, 가령, 서열 310, 314316에 추가하여, 바코드 서열 312을 포함한다. 예를 들면, 올리고뉴클레오티드 308은 바코드 서열 312, 뿐만 아니라 주어진 시퀀싱 시스템을 위한 부착 또는 고정 서열로 기능을 할 수 있는 서열 310, 가령, Illumina Hiseq 또는 Miseq 시스템의 흐름 세포들에서 부착에 이용되는 P5 서열을 포함하는 것으로 보여진다. 나타낸 바와 같이, 상기 올리고뉴클레오티드는 프라이머 서열 316을 포함하는데, 이 서열은 상기 시료 핵산 304의 일부분의 복제를 프라이밍하기 위한 무작위 또는 표적화된 N-mer를 포함할 수 있다. 올리고뉴클레오티드 308에는 서열 314이 또한 포함되는데, 이는 시퀀싱 프라이밍 영역, 이를 테면 "판독1" 또는 R1 프라이밍 영역을 제공할 수 있는데, 즉, 시퀀싱 시스템들에서 합성 반응에 의해 중합효소 매개된, 주형 지시된(directed) 시퀀싱을 프라임하는데 이용된다. 일부 경우들에 있어서, 상기 바코드 서열 312, 고정 서열 310 및 R1 서열 314은 주어진 비드에 부착된 모든 올리고뉴클레오티드에게 공통적일 수 있다. 상기 프라이머 서열 316은 무작위 N-mer 프라이머들에 대하여 가변적일 수 있거나, 또는 특정 표적화된 용도를 위하여 주어진 비드 상에 있는 올로고뉴클레오티드에 대하여 공통적일 수 있다.
프라이머 서열 316의 존재에 근거하여, 상기 올리고뉴클레오티드는 패널 B에 나타낸 바와 같이, 핵산 시료를 프라임시킬 수 있고, 이로써 중합효소 효소들 그리고 상기 비드 306 및 시료 핵산 304와 함께 또한 공동 분배된 다른 연장 시약들을 이용하여 올리고뉴클레오티드 308308a의 연장이 허용된다. 패널 C에 나타낸 바와 같이, 무작위 N-mer 프라이머들의 경우, 상기 시료 핵산 304의 상이한 다중 영역들에 어닐될 올리고뉴클레오티드의 연장 후; 핵산의 다중 중첩 보체들 또는 단편들, 가령, 단편들 318320이 만들어진다. 시료 핵산의 일부분에 상보적인 서열 부분들, 가령, 서열 322324를 포함하지만, 본 명세서에서는 부착된 바코드 서열을 갖는 시료 핵산 304의 단편들이 포함된 이들 구조체들이 일반적으로 언급된다.
그 다음 상기 바코드화된 핵산 단편들은 가령, 서열 분석을 통하여 특징화될 수 있거나, 또는 패널 D에 나타낸 바와 같이, 공정에서 추가 증폭될 수 있다. 예를 들면, 추가 올리고뉴클레오티드, 가령, 비드 306로부터 또한 방출되는 올리고뉴클레오티드 308b는 단편들 318320을 프라임시킬 수 있다. 특히, 다시, 올리고뉴클레오티드 308b에서 무작위 N-mer 프라이머 316b(일부 경우들에 있어서 주어진 파티션에서 다른 무작위 N-mers, 가령, 프라이머 서열 316과는 상이할 수 있다)의 존재에 근거하여, 상기 올리고뉴클레오티드는 단편 318과 어닐되며, 그리고 연장되어 서열 328이 포함된 단편 318의 최소한 일부분에 대한 보체 326가 만들어지며, 이는 상기 시료 핵산 서열의 일부분의 사본(복사본)을 포함한다. 올리고뉴클레오티드 308b의 연장은 단편 318의 올리고뉴클레오티드 일부분 308을 통하여 복제될 때까지 지속된다. 본 명세서의 도처에서 명시된 바와 같이, 그리고 패널 D에서 설명된 바와 같이, 상기 올리고뉴클레오티드는 단편 318 안에 포함된 올리고뉴클레오티드 308의 서열 316314를 통하여 복제된 후, 중합효소에 의해 복제에서 신속한 중단을 처리하도록 설정될 수 있다. 본 명세서에서 설명된 바와 같이, 이는 예를 들면, 이용된 중합효소 효소에 의해 가공처리될 수 없는 상이한 뉴클레오티드 및/또는 뉴클레오티드 유사체들의 혼입을 포함하는 상이한 방법들에 의해 실현될 수 있다. 예를 들면, 이는 비-우라실 내성(tolerant) 중합효소가 이 영역의 복제를 중단시키는 것을 막기 위하여, 상기 서열 영역 312안에 우라실 함유된 뉴클레오티드의 함유를 포함할 수 있다. 그 결과, 한 단부에 상기 바코드 서열 312, 부착 서열 310, R1 프라이머 영역 314, 그리고 상기 무작위 N-mer 서열 316b이 포함된, 전장의 올리고뉴클레오티드 308b이 포함된 단편 326이 만들어진다. 상기 서열의 다른 단부에는 서열 314'에서 나타낸 것과 같이, 제1 올리고뉴클레오티드 308의 무작위 N-mer에 대한 보체 316', 뿐만 아니라 R1 서열의 전부 또는 일부분에 대한 보체가 포함될 수 있다. R1 서열 314 및 이의 보체 314'는 그 다음 함께 혼성화되어 부분적 헤어핀 구조 328를 형성한다. 인지할 수 있는 바와 같이, 상이한 올리고뉴클레오티드중에서 무작위 N-mers들은 상이하기 때문에, 이들 서열 및 이들의 보체들은 헤어핀 형성에 참여하지 않을 것으로 예측되는데, 가령, 무작위 N-mer 316에 대한 보체인 서열 316'은 무작위 N-mer 서열 316b에 상보적인 것으로 예측되지 않을 것이다. 이는 다른 적용 가령, 표적화된 프라이머들에 대한 경우는 아닐 것이며, 이때 N-mers는 주어진 파티션 안에 올리고뉴클레오티드중에 공통적일 것이다.
이들 부분적 헤어핀 구조가 형성됨으로써 추가 복제로 부터 상기 시료 서열의 제1 수준 복사본의 제거가 허용되며, 가령, 복사체들의 되풀이되는 복사를 막는다. 상기 부분적 헤어핀 구조는 상기 만들어진 단편들, 가령, 단편 326의 후속적인 공정에 유용한 구조를 또한 제공한다.
다중 상이한 파티션으로부터 모든 단편들은 본 명세서에서 설명된 바와 같이, 고처리량 서열화기에서 시퀸싱을 위하여 푸울될 수 있다. 각각 단편은 이의 기원 파티션으로 코드화되기 때문에, 이 단편의 서열은 상기 바코드의 존재에 근거하여 이의 기원에 귀속될 수 있다. 이는 도 4에서 도식적으로 설명된다. 한 실시예에서 나타낸 바와 같이, 제1 원천 400 (가령, 정상적인 세포들)에서 기인된 핵산 404, 그리고 상이한 원천 402 (가령, 종양 세포들)으로부터 유도된 핵산 406은 상기에서 설명된 바와 같이 이들의 고유한 바코드 올리고뉴클레오티드와 함께 각각 분배된다. 일부 경우들에 있어서 정상적인 세포들, 종양 세포들 또는 이들 모두는 살아있는 시료, 비-보존된 시료, 보존된 시료, 방부처리된 시료, 매립된 시료, 고정된 시료, 또는 이의 임의의 조합으로 구성된 집단에서 선택된 세포들 (가령 "시료"로부터)을 포함하는 조직 또는 유체로부터 획득된다. 일부 실시예들에 있어서, 조직 또는 세포는 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 일부 경우들에 있어서 상기 시료는 모두 매립되고, 고정된다. 일부 실시예들에 있어서 정상적인 세포들, 종양 세포들 또는 둘 모두는 포름알데히드 (가령 포르말린) 고정되고, 파라핀 매립된다 (FFPE).
그 다음 각각 파티션 안에, 각각 핵산 404406은 제1 단편(들)의 제2 단편들의 중첩 세트, 가령, 제2 단편 세트 408410를 따로 제공하도록 처리된다. 이 공정은 특정 제1 단편으로부터 유도된 제2 단편들 각각에 대하여 동일한 바코드 서열을 갖는 제2 단편들을 또한 제공한다. 나타낸 바와 같이, 제2 단편 세트 408에 대한 바코드 서열은 "1"로 표시되며, 단편 세트 410에 대한 바코드 서열은 "2"로 표시된다. 바코드들의 다양한 라이브러리는 많은 수의 상이한 단편 세트를 차등적으로 바코드화하는데 이용될 수 있다. 그러나, 상이한 제1 단편으로부터 모든 제2 단편 세트는 상이한 바코드 서열로 바코드화될 필요는 없다. 일부 경우들에 있어서, 다중 상이한 제1 단편들은 동일한 바코드 서열이 포함되도록 동시에 가공될 수 있다. 다양한 바코드 라이브러리들은 본 명세서의 도처에 상세하게 설명된다.
가령, 단편 세트 408410로부터 상기 바코드화된 단편들은 예를 들면, llumina 또는 Thermo Fisher, Inc.의 Ion Torrent 부서에서 이용가능한 합성 기술에 의한 서열을 이용하여 시퀀싱을 하기 위하여 푸울화될 수 있다. 서열 판독 412은 최소한 일부분은 포함된 바코드들에 근거하여, 그리고 일부 경우들에 있어서, 부분적으로 단편 자체의 서열에 근거하여, 합산된(aggregated) 판독 414416에 나타낸 바와 같이, 이들의 각 단편 세트에 귀속될 수 있다. 그 다음 각각 단편 세트에 대한 귀속된 서열 판독을 모아서 시료 단편 각각에 대하여 집합된 서열, 가령, 서열 418420을 제공하고, 그 다음 이들의 각 기원, 가령, 정상적인 세포들 400 및 종양 세포들 402로 추가 귀속될 수 있다. 게놈 어셈블리에 대한 방법들은 2014년 6월 26일자로 제출된 가령, U.S. 가특허 출원 번호 62/017,589에 설명되며, 이의 전문은 전체가 참고자료에 편입된다. 일부 경우들에 있어서 정상적인 세포들, 종양 세포들 또는 이들 모두는 살아있는 시료, 비-보존된 시료, 보존된 시료, 방부처리된 시료, 매립된 시료, 고정된 시료, 또는 이의 임의의 조합으로 구성된 집단에서 선택된 조직 또는 세포-시료 (가령 시료)로부터 획득된다. 일부 실시예들에 있어서, 조직 또는 세포는 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 일부 경우들에 있어서, 조직 또는 세포는 매립되고, 그리고 고정된다. 일부 실시예들에 있어서 정상적인 세포들, 종양 세포들 또는 이들 모두는 포름알데히드 (가령 포르말린) 고정되고, 그리고 파라핀 매립된 (FFPE) 조직이다.
매립(Embedding)이란 조직 또는 세포를 액체 매립 재료 (가령, 겔, 수지, 왁스, 또는 이의 임의의 조합)와 함께 틀에 넣고, 후속적으로 경화되는 공정이다. 냉각 공정 (가령, 최소한 하나의 파라핀 왁스는 매립 매체로 이용될 때)을 통하여 매립이 이루어질 수 있다. 가열 (가령 경화) 공정 (가령 최소한 하나의 에폭시 수지는 매립 매체로 이용될 때)을 통하여 매립이 이루어질 수 있다. 매립는 아크릴 수지를 이용하며, 이는 열, 자외선 빛, 또는 화학 촉매를 이용하여 중합화될 수 있다. 수성 매체에서 냉동된 조직을 이용하여 매립이 실행될 수 있다. 사전-냉동된 조직들은 액체 매립 재료 (가령, 물-기반의 글리콜, 크리오젤, 또는 수지)와 함께 틀 안에 넣고, 그 다음 냉동되어 굳어진 블록이 형성된다. 일부 경우들에 있어서, 상기 매립 공정은 수지(들)을 이용한다. 일부 경우들에 있어서, 상기 매립 공정은 왁스를 이용한다. 상기 왁스는 동물 왁스, 식물 왁스, 석유 왁스, 합성 왁스 또는 이의 임의의 조합일 수 있다. 상기 동물 왁스는 수지, 밀랍, 경랍 또는 라놀린일 수 있다. 상기 식물 왁스는 덧표피(epicuticular), 코티쿨라(coticular) 왁스, 또는 이의 임의의 조합일 수 있다. 상기 식물 왁스는 카르나우바(carnauba) 왁스, 칸델리아(candelilla) 왁스, 우리큐리(ouricury) 왁스, 콩 왁스, 또는 또는 이의 조합일 수 있다. 상기 왁스는 석유에서 유도된 왁스, 이를 테면 파라핀일 수 있다. 파라핀 왁스는 최소한 10, 15, 20, 25, 30, 35, 40, 45 또는 50개 그리고 많아야 15, 20, 25, 30, 35, 40, 45, 50 또는 55개의 탄소 원자의 탄소 쇄 길이를 가진 , 또는 전술한 n-알칸의 임의의 조합을 포함할 수 있다. 일부 실시예들에 있어서, 수지는 경질 락커 또는 에나멜-유사 마감으로 처리하는 액체의 임의의 성분이다. 수지는 천연 수지, 이를 테면 호박(amber), 카우리 코팔(kauri gum), 송진, 코펄(copal), 다마르(dammar), 유지(mastic), 산다락(sandarac), 유향(frankincense), 엘레미(elemi), 테레빈(turpentine), 코파이바(copaiba), 암모니아쿰(ammoniacum), 아위(asafoetida), 자황(gamboge), 몰약(myrrh), 또는 스카모이나(scammony)를 포함할 수 있다. 상기 수지는 목재 원천 (가령, 나무, 이를 테면, 예를 들면, 소나무)로부터 유도될 수 있다. 상기 수지는 합성 수지 이를 테면 매니큐어, 에폭시 수지, 열경화성 수지, 또는 이의 임의의 조합일 수 있다. 겔은 임의의 희석된 가교된 분자 배열일 수 있으며, 정상-상태(steady-state)에서도 흐름을 보이지 않는다. 겔은 히드로겔, 크세로겔(xerogels) 또는 히드로겔일 수 있다. 겔은 자연적으로 생산되거나, 합성 또는 이의 임의의 조합일 수 있다. 겔은 아가로즈, 메틸셀룰로오스, 히알루로난, 카라그레난, 젤라틴, 또는 이의 임의의 조합을 포함할 수 있다.
고정(Fixation)이란 생물학적 조직 또는 세포를 붕괴(decay)로부터 보존시키고, 이로 인하여 자가용해(autolysis) 또는 부패(putrefaction)를 방지시키는 공정이다. 일부 실시예들에 있어서, 고정된 조직 또는 고정된 세포는 붕괴로부터 보존된 것이다. 붕괴는 분해 (가령 썩음)가 관련될 수 있는데, 이는 유기 물질들을 더 단순한 형태로 부서지는 공정이다. 붕괴로부터 보존은 자가용해, 부패 또는 이둘 모두를 막는 것일 수 있다. 고정된 조직은 이의 세포들, 이의 조직 성분들 또는 이둘 모두를 보존하는 것일 수 있다. 조직 고정(fixation)은 고정되는 조직 또는 세포에서 단백질들 간에 공유 결합이 형성됨으로써 가교 고정제(crosslinking)에 의해 실행될 수 있다. 고정은 세포의 세포골격에 가용성 단백질을 고정시키는 것일 수 있다. 고정은 단단한 세포, 단단한 조직 또는 이둘 모두를 만들 수 있다. 고정은 화학물질, 이를 테면 포름알데히드 (가령 포르말린), 글루타알데히드, 에탄올, 메탄올, 아세트산, 오시뭄 테트라옥시드, 중크롬산 칼륨, 크롬산, 과망간산 칼륨, Zenker의 고정제, 피크르산염, Hepes-글루타민산 완충액-매개된 유기 용매 보호 효과 (HOPE), 또는 이의 임의의 조합의 사용을 통하여 이루어질 수 있다. 포름알데히드는 중량에 근거하여 수성 용액에서 약 37% 포름알데히드 기체 혼합물로 이용될 수 있다. 수성 포름알데히드 용액은 추가적으로 약 10-15%의 알코올 (가령 메탄올)을 포함하며, "포르말린"으로 불리는 용액이 형성될 수 있다. 고정제-보강 (10%) 용액은 물 안에 3.7% 용액의 포름알데히드 기체와 대등할 것이다. 포름알데히드는 최소한 5%, 8%, 10%, 12% 또는 15% 중성 완충된 포르말린 (NBF) 용액 (가령, 고정제 보강)으로 이용될 수 있다. 포름알데히드는 인산염 완충된 염수 (가령 포르말린)에서 3.7% 내지 4.0% 포름알데히드로 이용될 수 있다. 일부 경우들에 있어서, 최소한 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5, 10, 10.5, 11.0, 11.5, 12.0, 12.5, 13.0, 13.5, 14.0, 14.5, 또는 15.0 퍼센트 (%) 또는 그 이상의 포르말린 플러쉬(flush) 또는 담금(immersion)을 이용하여 고정이 실행된다. 일부 경우들에 있어서, 약 10% 포르말린 플러쉬를 이용하여 고정된다. 고정제 용적은 용적당 중량에 있어서 조직의 용적보다 10, 15, 20, 25 또는 30배 일 수 있다. 포름알데히드에 고정 후, 조직 또는 세포는 장기 보관을 위하여 알코올에 담겨질 수 있다. 일부 경우들에 있어서, 상기 알코올은 메탄올, 에탄올, 프로판올, 부탄올, 5개 또는 그 이상의 탄소 원자가 포함된 알코올, 또는 이의 임의의 조합이다. 상기 알코올은 선형 또는 분기형일 수 있다. 상기 알코올은 수성 용액 안에 최소한 50%, 60%, 70%, 80% 또는 90% 알코올일 수 있다. 일부 실시예들에 있어서, 상기 알코올은 수성 용액 안에 70% 에탄올이다.
방부처리(Embalming)는 조직 또는 세포를 자연적 분해로부터 보존시킨다. 방부처리된 시료는 살균된 시료, 내놓을만한 시료 또는 보존된 시료일 수 있다. 내놓을만한(presentable) 시료란 생체내에서 이의 예전 상태의 외양을 보존시켜주는 시험관 시료를 말한다. 일부 구체예들에 있어서, 방부처리된 조직 또는 방부처리된 세포는 방부처리 유체에 담금된 조직, 또는 방부처리 유체가 투여되었던 조직이다. 방부처리 유체는 최소한 일시적으로 분해를 지연시키고, 자연적 외관을 복원시킬 수 있다. 방부처리 유체는 보존제, 살균제, 소독제, 또는 이의 임의의 조합을 포함한다. 방부처리 유체는 포름알데히드, 글루타알데히드, 에탄올, 보습제, 또는 또는 이의 조합을 포함할 수 있다. 방부처리 유체 안에 포름알데히드 함량은 5 내지 35 퍼센트 (%) 범위가 될 수 있으며; 방부처리 유체 안에 알코올 함량은 9 내지 56 퍼센트 (%) 범위가 될 수 있다. 상기 알코올은 전술한 알코올 또는 이의 임의의 조합일 수 있다. 일부 실시예들에 있어서, 상기 알코올은 에탄올이다.
보존된 시료는 자연적 시료 (가령, 보존제 추가 없는)와 비교하였을 때 분해가 지연된 것이다. 분해는 미생물 성장, 바람직하지 않은 화학적 변화, 또는 이 둘 모두의 결과로써 발생될 수 있다. 보존된 조직 또는 세포는 질산염, 암모니아, 벤조산, 벤조산 나트륨, 히드로벤조에이트, 젖산, 프로피온산, 이산화황, 아황산염, 소르브산, 아스코르브산, 부틸화된 히드록시톨루엔, 부틸화된 히드록시아니솔, 갈산, 토코페롤(들), 이나트륨 EDTA, 구연산, 타르타르산, 레시틴, 페놀라제, 피마자유, 알코올, 홉, 로즈마리, 규조토, 또는 이의 임의의 조합과 접촉되는 조직 또는 세포일 수 있다.
일부 실시예들에 있어서, 상기 시료는 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 예를 들면, 상기 시료는 고정되고, 그리고 매립된다. 고정은 열거된 전술한 고정 재료 또는 방법들중 임의의 것을 이용함으로써 이루어질 수 있다. 열거된 전술한 매립 재료 또는 방법들중 임의의 것을 이용함으로써 매립이 이루어질 수 있다. 예를 들면, 상기 시료는 포름알데히드 고정되고, 그리고 파라핀 매립된다. 일부 경우들에 있어서, 파라핀 매립된 조직을 위한 고정제로 중성 완충된 포르말린 (NBF)이 이용된다. NBF는 완충된 용액내 4% 파라포름알데히드에 대등할 수 있다. 일부 경우들에 있어서, NBF는 보존제 (가령 알코올)를 더 포함한다. 상기 알코올은 전술한 알코올중 임의의 것일 수 있다. 고정은 최소한 12, 25, 36, 48, 또는 60 시간이 걸릴 수 있다. 고정은 기껏해야 25, 36, 48, 60 또는 72 시간이 걸릴 수 있다. 상기 조정은 실온에서 실행될 수 있다. 파라핀 매립은 조직 탈수를 포함할 수 있다. 상기 조직 탈수는 물을 대체시키기 위하여 일련의 등급화된 알코올 조(baths)를 통하여, 그리고 후속적으로 확스에 의해 침투되어 이루어질 수 있다. 침투된 조직은 그 다음 왁스에 매립될 수 있다. 상기 알코올은 에탄올일 수 있다. 상기 왁스는 전술한 임의의 왁스일 수 있다. 일부 경우들에 있어서, 상기 왁스는 파라핀 왁스디. 최소한 약 45, 50, 55, 60, 65, 70, 75 또는 80 도씨 (℃)의 융점을 가지는 상기 파라핀 왁스는 실온에서 고형화될 수 있다. 최대 약 45, 50, 55, 60, 65, 70, 75 또는 80 도씨 (℃)의 융점을 가지는 상기 파라핀 왁스는 실온에서 고형화될 수 있다. 일부 경우들에 있어서, 상기 파라핀 왁스는 최소한 56℃ 내지 최대 58℃의 융점을 가진다. 포르말린-고정된, 파라핀-매립된 (FFPE) 조직은 최소한 5, 10, 15, 50, 75, 100, 150, 200, 250, 500, 1000 년 또는 그 이상의 장시간 동안 보관될 수 있다. 장시간 동안 보관은 실온에서 될 수 있다. 포르말린-고정된, 파라핀-매립된 (FFPE) 조직들은 실온에서 무한대로 저장될 수 있다. 일부 경우들에 있어서, 핵산 (가령, DNA, RNA 또는 이 둘 모두)은 고정 후 FFPE 조직으로부터 회수될 수 있다.
III. 시료들
a. 시료들의 유형
본 명세서의 방법들과 시스템들은 미세유동적 장치로 도입되고, 별개의 격실로 분배될 수 있는 임의의 적절한 시료와 함께 이용될 수 있다. 예시적 시료들는 폴리뉴클레오티드, 핵산, 올리고뉴클레오티드, 순환 세포-없는 핵산, 순환 종양 핵산 (가령, 순환 종양 DNA), 순환 종양 세포 (CTC) 핵산, 핵산 단편들, 뉴클레오티드, DNA, RNA, 펩티드 폴리뉴클레오티드, 상보적인 DNA (cDNA), 이중 가닥으로된 DNA (dsDNA), 단일 가닥으로된 DNA (ssDNA), 플라스미드 DNA, 코스미드 DNA, 염색체 DNA, 게놈 DNA (gDNA), 바이러스 DNA, 박테리아 DNA, 미토콘드리아 DNA (mtDNA), 세포-없는 DNA, 세포 없는 태아 DNA (cffDNA), 리보좀 DNA (rDNA), 메신져 RNA (mRNA), 리보좀 RNA (rRNA), 전달 RNA (tRNA), nRNA, siRNA, snRNA, snoRNA, scaRNA, 마이크로RNA, 단일-가닥으로된 RNA (ssRNA), dsRNA, 바이러스 RNA, cRNA, 그리고 이와 유사한 것들을 포함할 수 있다. 일부 경우들에 있어서, 상기 시료들은 단백질 또는 폴리펩티드를 포함할 수 있다.
상기 시료는 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 상기 뉴클레오티드는 자연 발생적 또는 합성일 수 있다. 일부 경우들에 있어서, 상기 뉴클레오티드는 산화되거나 또는 메틸화될 수 있다. 상기 뉴클레오티드는 아데노신 일인산염 (AMP), 아데노신 이인산염 (ADP), 아데노신 삼인산염 (ATP), 구아노신 일인산염 (GMP), 구아노신 이인산염 (GDP), 구아노신 삼인산염 (GTP), 티미딘 일인산염 (TMP), 티미딘 이인산염 (TDP), 티미딘 삼인산염 (TTP), 우리딘 일인산염 (UMP), 우리딘 이인산염 (UDP), 우리딘 삼인산염 (UTP), 시티딘 일인산염 (CMP), 시티딘 이인산염 (CDP), 시티딘 삼인산염 (CTP), 5-메틸시티딘 일인산염, 5-메틸시티딘 이인산염, 5-메틸시티딘 삼인산염, 5-히드록시메틸시티딘 일인산염, 5-히드록시메틸시티딘 이인산염, 5-히드록시메틸시티딘 삼인산염, 고리형 아데노신 일인산염 (cAMP), 고리형 구아노신 일인산염 (cGMP), 데옥시아데노신 일인산염 (dAMP), 데옥시아데노신 이인산염 (dADP), 데옥시아데노신 삼인산염 (dATP), 데옥시구아노신 일인산염 (dGMP), 데옥시구아노신 이인산염 (dGDP), 데옥시구아노신 삼인산염 (dGTP), 데옥시티미딘 일인산염 (dTMP), 데옥시티미딘 이인산염 (dTDP), 데옥시티미딘 삼인산염 (dTTP), 데옥시우리딘 일인산염 (dUMP), 데옥시우리딘 이인산염 (dUDP), 데옥시우리딘 삼인산염 (dUTP), 데옥시시티딘 일인산염 (dCMP), 데옥시시티딘 이인산염 (dCDP) 및 데옥시시티딘 삼인산염 (dCTP), 5-메틸-2'-데옥시시티딘 일인산염, 5-메틸-2'-데옥시시티딘 이인산염, 5-메틸-2'-데옥시시티딘 삼인산염, 5-히드록시메틸-2'-데옥시시티딘 일인산염, 5-히드록시메틸-2'-데옥시시티딘 이인산염 및 5-히드록시메틸-2'-데옥시시티딘 삼인산염을 포함하나, 이에 국한되지 않는다.
상기 시료는 임의의 합성 핵산, 이를 테면 펩티드 핵산 (PNA), 유사 핵산, 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠김 핵산 (LNA) 또는 뉴클레오티드 측면 쇄와 함께 다른 합성 폴리머일 수 있다.
상기 시료는 상이한 정도의 순도를 가질 수 있다. 일부 경우들에 있어서, 상기 시료는 DNA 시료일 수 있고, 이때 시료의 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.5%, 또는 99.9% 이상이 DNA로 구성된다. 일부 경우들에 있어서, 상기 시료는 DNA 시료일 수 있고, 이때 시료의 0.1%, 0.2%, 0.3%, 0.5%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.5%, 또는 99.9% 미만이 DNA로 구성된다. 일부 경우들에 있어서, 상기 시료는 RNA 시료일 수 있고, 이때 상기 시료의 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.5%, 또는 99.9% 이상이 RNA로 구성된다. 일부 경우들에 있어서, 상기 시료는 RNA 시료일 수 있고, 이때 상기 시료의 0.1%, 0.2%, 0.3%, 0.5%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.5%, 또는 99.9% 미만은 RNA로 구성된다. 일부 경우들에 있어서 상기 시료는 100% DNA이며; 일부 경우들에 있어서 상기 시료는 100% RNA다.
상기 시료는 상이한 종의 혼합물을 포함할 수 있다. 일부 경우들에 있어서, 상기 시료는 DNA, RNA, 단백질, 그리고 지질, 또는 이의 임의의 조합, 또는 이의 임의의 상대적 비율의 혼합물을 포함한다. 예를 들면, 상기 시료는 1:1:50 비율로 DNA, RNA, 및 단백질을 포함할 수 있다. 또다른 실시예에서, 상기 시료는 상이한 유형의 DNA 혼합물 (가령, 합성 및 자연 발생적 DNA의 혼합물; 모체 및 태아 DNA의 혼합물; 등등)을 포함할 수 있다. 여전히 또다른 예에서, 시료는 상이한 유형의 RNA 혼합물 (가령, mRNA, tRNA 및/또는 rRNA이 혼합된 혼합물)을 포함할 수 있다. 시료들은 가령, 이미 참고자료에 편입된 2014년 6월 26일자로 제출된 U.S. 특허 출원 번호 62/017,558 에서 설명된 바와 같이, 상기 파티션 안에 배치된 세포안에 또한 존재할 수 있다.
b. 시료들의 원천
핵산이 포함된 임의의 물질은 시료의 원천일 수 있다. 상기 물질은 유체, 가령, 생물학적 유체일 수 있다. 유동성 물질은 혈액, 제대혈, 타액, 소변, 땀, 혈청, 정액, 질내 유체, 위 및 소화기 유체, 척수 유체, 태반 유체, 공동(cavity) 유체, 안구 유체, 혈청, 모유, 림프 유체, 또는 이의 조합을 포함하나, 이에 국한되지 않는다.
상기 물질은 고형 조직, 예를 들면, 생물학적 조직 또는 세포 또는 생검 콜렉션일 수 있다. 상기 물질은 정상적인 건강한 조직들을 포함할 수 있다. 상기 조직은 다양한 유형의 장기와 연합될 수 있다. 장기의 비-제한적인 예로는 뇌, 간, 폐, 신장, 전립선, 난소, 비장, 림프절 (편도 포함), 갑상선, 췌장, 심장, 골근육, 내장, 후두, 식도, 위, 또는 이의 조합을 포함할 수 있다.
상기 물질은 종양을 포함할 수 있다. 종양은 양성 (비-암) 또는 악성 (암)일 수 있다. 종양의 비-제한적인 예로는 다음을 포함할 수 있다: 섬유육종, 점액육종, 지방육종, 연골육종, 골 육종, 척삭종, 혈관육종, 내피육종, 림프관육종, 림프관내피육종, 활액막종, 중피종, Ewing 종양, 평활근육종, 횡문근육종, 위내장계 암종, 결장 암종, 췌장 암, 유방암, 비뇨생식계 암종, 난소 암, 전립선 암, 편평 세포 암종, 기저 세포 암종, 선암종, 한선 암종, 피지선 암종, 유두모양 암종, 유두모양 선암종, 낭샘암종, 수질 암종, 기관지유래암종, 신장 세포 암종, 간암, 담관 암종, 융모막암종, 고환종, 배아 암종, Wilms 종양, 경부 암, 내분비계 암종, 고환 종양, 폐 암종, 소 세포 폐 암종, 비-소 세포 폐 암종, 방광 암종, 상피 암종, 신경아교종, 별아교세포종, 속질모세포종, 속질모세포종, 뇌실막종, 송과체종, 혈관모세포종, 청각신경집종, 희소돌기아교세포종, 수막종, 흑색종, 신경모세포종, 망막모세포종, 또는 이의 조합. 상기 종양은 다양한 유형의 장기와 연합될 수 있다. 장기의 비-제한적인 예로는 뇌, 간, 폐, 신장, 전립선, 난소, 비장, 림프절 (편도 포함), 갑상선, 췌장, 심장, 골근육, 내장, 후두, 식도, 위, 또는 이의 조합을 포함할 수 있다.
상기 물질은 정상적인 건강한 조직들 또는 종양 조직들의 혼합물을 포함할 수 있다. 상기 조직은 다양한 유형의 장기와 연합될 수 있다. 장기의 비-제한적인 예로는 뇌, 간, 폐, 신장, 전립선, 난소, 비장, 림프절 (편도 포함), 갑상선, 췌장, 심장, 골근육, 내장, 후두, 식도, 위, 또는 이의 조합을 포함할 수 있다.
일부 경우들에 있어서, 상기 물질은 다음을 포함하나, 이에 국한되지 않는 다양한 세포들을 포함한다: 진핵 세포들, 원핵 세포들, 곰팡이 세포들, 심장 세포들, 폐 세포들, 신장 세포들, 간 세포들, 췌장 세포들, 재생 세포들, 줄기 세포들, 유도된 다능 줄기 세포들, 위내장 세포들, 혈액 세포들, 암 세포들, 박테리아 세포들, 인간 미생물군유전체 시료로 부터 단리된 박테리아 세포들, 등등 일부 경우들에 있어서, 상기 물질은 세포의 내용물, 이를 테면, 예를 들면, 단일 세포의 내용물 또는 다중 세포들의 내용물을 포함할 수 있다.
일부 경우들에 있어서, 상기 세포들은 정상적인 세포들, 종양 세포들 또는 이들 모두일 수 있고, 그리고 살아있는 시료, 비-보존된 시료, 보존된 시료, 방부처리된 시료, 매립된 시료, 고정된 시료, 또는 이의 임의의 조합으로 구성된 집단에서 선택된 조직 시료 또는 세포-시료 (가령 시료)로부터 획득된다. 일부 실시예들에 있어서, 상기 조직 시료 또는 세포 시료는 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 일부 경우들에 있어서, 상기 조직 시료 또는 세포 시료는 매립되고, 그리고 고정된다. 일부 실시예들에 있어서 조직 시료, 세포 시료 또는 이들 모두는 포름알데히드 (가령 포르말린) 고정되고, 파라핀 매립된다 (FFPE).
시료들은 다양한 개체들로부터 얻을 수 있다. 개체는 살아있는 개체 또는 죽은 개체일 수 있다. 일부 경우들에 있어서, 상기 개체는 포유류 개체, 이를 테면, 예를 들면, 인간 개체다. 개체의 예로는 인간, 포유류, 비-인간 포유류, 설치류, 양서류, 파충류, 개, 고양이, 소, 말, 염소, 양, 닭, 조류, 쥐, 토끼, 곤충, 민달팽이, 미생물, 박테리아, 기생충 또는 물고기를 포함하나, 이에 국한되지 않는다. 일부 경우들에 있어서, 상기 개체는 건강한, 이를 테면 건강한 남성, 여성, 어린이, 또는 유아다. 일부 경우들에 있어서, 상기 개체는 질환을 가진 또는 질환 또는 장애가 발생될 위험에 처한 환자일 수 있다. 일부 경우들에 있어서, 상기 개체는 임산부일 수 있다. 일부 경우에 있어서, 상기 개체는 정상적인 건강한 임산부일 수 있다. 일부 경우들에 있어서, 상기 개체는 특정 분만 결함을 가지고 있는 위험에 처한 임산부일 수 있다.
다양한 방식에 의해 개체로부터 시료를 얻을 수 있다. 예를 들면, 시료는 개체의 순환계에 접근하여(가령, 주사기 또는 다른 기구를 통하여 정맥내 또는 동맥안으로), 분비된 생물학적 시료 (가령, 타액, 가래, 소변, 대변 등등)을 수집하고, 생물학적 시료를 외과적(가령, 생검)으로 획득하고 (가령, 수술중 시료들, 수술후 시료들, 등등), 스왑 (가령, 볼 스왑, 구강인두 스왑), 또는 피펫팅, 또는 개체로부터 조직 유체 또는 다른 시료를 얻기 위한 임의의 다른 수잔을 통하여 개체로부터 시료를 얻을 수 있다.
IV. 투입 시료들의 양
a. 시료들의 전체 투입
본 명세서에서 제공되는 방법에서 이용될 수 있는 총 투입 시료 (가령, DNA, RNA, 등등)의 양은 가변적일 수 있다. 본 명세서에서 제공되는 방법들 및 시스템들은 투입 시료의 양이 낮을 때 특히 유용하지만; 다량의 투입 시료들의 경우에도 또한 이용될 수 있다. 일부 경우들에 있어서, 투입 시료들의 양은 약 1fg, 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1pg, 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1μg, 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 또는 20μg일 수 있다. 일부 경우들에 있어서, 투입 시료들의 양은 최소한 약 1fg, 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1pg, 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1μg, 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 20μg, 또는 그 이상일 수 있다. 일부 경우들에 있어서, 투입 시료들의 양은 약 20μg, 15μg, 10μg, 9μg, 8μg, 7μg, 6μg, 5μg, 4μg, 3μg, 2μg, 1μg, 900ng, 800ng, 700ng, 600ng, 500ng, 400ng, 300ng, 200ng, 100ng, 90ng, 80ng, 75ng, 70ng, 65ng, 60ng, 59ng, 58ng, 57ng, 56ng, 55ng, 54ng, 53ng, 52ng, 51ng, 50ng, 49ng, 48ng, 47ng, 46ng, 45ng, 44ng, 43ng, 42ng, 41ng, 40ng, 35ng, 30ng, 25ng, 20ng, 15ng, 10ng, 5ng, 2.5ng, 1ng, 900pg, 800pg, 700pg, 600pg, 500pg, 400pg, 300pg, 200pg, 100pg, 50pg, 25pg, 10pg, 5pg, 1pg, 900fg, 800fg, 700fg, 600fg, 500fg, 400fg, 300fg, 200fg, 100fg, 50fg, 25fg, 10fg, 5fg, 1fg이거나 또는 이보다 더 적을 수 있다. 일부 경우들에 있어서, 투입 시료의 양은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
일부 경우들에 있어서, 투입 시료로써 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 의 핵산 게놈 등가체가 이용될 수 있다. 일부 경우들에 있어서, 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 미만의 핵산 게놈 등가체가 이용될 수 있다. 일부 경우들에 있어서, 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 이상의 핵산의 게놈 등가체가 이용될 수 있다. 일부 경우들에 있어서, 이용되는 핵산의 게놈 등가체의 수는 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
일부 경우들에 있어서, 상기 투입 시료들은 근본적인 더 큰 유전적 성분 (가령, 게놈)의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입 시료들은 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 미만의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입 시료들은 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 이상의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입 시료들은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
b. 시료 안에 표적 성분들의 투입 양
일부 실시예들에 있어서, 투입 시료는 다양한 유형의 성분들 (가령, 핵산), 또는 상이한 원천으로부터 기인된 성분들을 포함할 수 있다. 특정 시료 안에 표적 성분들 또는 관심 대상의 성분들 (가령, 질환 또는 장애와 연합된 성분들)은 총 투입에서 특정 백분율로 구성될 수 있다. 예를 들면, 시료는 대부분 정상적인 조직 DNA (가령, 95% 또는 그 이상, 99% 또는 그 이상)와 매우 적은 (가령, 5% 또는 그 미만, 1% 또는 그 미만) 종양 또는 암 세포 DNA로 구성될 수 있으며, 이때 후자는 관심대상일 수 있다. 본 명세서에서 제공되는 방법들 및 시스템들은 표적 성분 (가령, 핵산)이 전체 시료에서 단지 소수 비율로 구성될 때 특히 유용하다. 예를 들면, 상기 방법들과 시스템들은 희귀한 핵산 집단 (가령, 세포-없는 핵산, 세포-없는 태아 핵산, 세포-없는 태아 핵산, 종양에서 기인된 세포-없는 핵산, 등등) 또는 희귀한 세포 집단에서 유도된 핵산을 탐지하는데 특히 유용하다. 일부 경우들에 있어서, 상기 표적 성분들은 총 투입에서 높은 백분율로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 성분들은 총 투입에서 낮은 백분율로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 성분들은 총 투입에서 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.9 %로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 성분들은 총 투입에서 최소한 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.9 %로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 성분들은 총 투입에서 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99.9 % 미만으로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 성분들은 본 명세서에서 설명된 임의의 두 값 사이에 속하는 백분율로 구성될 수 있다.
일부 구체예들에 있어서, 상기 시료는 체액, 특히 혈액 또는 소변으로부터 수득된 핵산을 포함할 수 있다. 상기 시료는 순환 세포-없는 핵산 및/또는 순환 종양 세포들과 연합된 핵산을 포함할 수 있다. 상기 세포들은 살아있는 조직, 비-보존된 조직, 보존된 조직, 방부처리된 조직, 매립된 조직, 고정된 조직, 또는 이의 임의의 조합으로 구성된 군에서 선택된 조직으로부터 획득될 수 있다. 일부 실시예들에 있어서, 상기 세포들은 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 일부 경우들에 있어서 상기 세포들은 모두 매립되고, 고정된다. 일부 실시예들에 있어서 상기 세포들은 포름알데히드 (가령 포르말린) 고정되고, 그리고 파라핀 매립된다 (FFPE).
일부 경우들에 있어서, 관심 대상의 표적 집단 (가령, 세포-없는 핵산, 태아 핵산, 순환 종양 세포들과 연합된 핵산, 등등)은 총 투입 시료의 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20% 미만을 포함할 수 있다. 일부 구체예들에 있어서, 상기 투입 시료는 세포 시료 (가령, 혈액 시료)이며, 이때 상기 시료 안에 세포의 총 수의 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 또는 20% 미만은 암 세포들 (가령, 순환 종양 세포들)로 구성된다. 세포 시료들을 분석하기 위한 방법들과 시스템들은 2014년 6월 26일자로 제출된 U.S. 가특허 출원 번호 62/017,558에서 설명되며, 이의 전문은 모든 목적을 위하여 전체가 참고자료에 편입된다.
투입 표적 성분들의 양은 변화될 수 있다. 일부 경우들에 있어서, 표적 성분들의 약 1fg, 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1pg, 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1μg, 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 또는 20μg 가 투입될 수 있다. 일부 경우들에 있어서, 표적 성분들의 최소한 약 1fg, 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1pg, 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1μg, 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 20μg 또는 그 이상이 투입될 수 있다. 일부 경우들에 있어서, 표적 성분들의 약 20μg, 15μg, 10μg, 9μg, 8μg, 7μg, 6μg, 5μg, 4μg, 3μg, 2μg, 1μg, 900ng, 800ng, 700ng, 600ng, 500ng, 400ng, 300ng, 200ng, 100ng, 90ng, 80ng, 75ng, 70ng, 65ng, 60ng, 59ng, 58ng, 57ng, 56ng, 55ng, 54ng, 53ng, 52ng, 51ng, 50ng, 49ng, 48ng, 47ng, 46ng, 45ng, 44ng, 43ng, 42ng, 41ng, 40ng, 35ng, 30ng, 25ng, 20ng, 15ng, 10ng, 5ng, 2.5ng, 1ng, 900pg, 800pg, 700pg, 600pg, 500pg, 400pg, 300pg, 200pg, 100pg, 50pg, 25pg, 10pg, 5pg, 1pg, 900fg, 800fg, 700fg, 600fg, 500fg, 400fg, 300fg, 200fg, 100fg, 50fg, 25fg, 10fg, 5fg, 1fg 또는 그 미만이 투입될 수 있다. 일부 경우들에 있어서, 투입된 표적 성분들의 양은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
일부 경우들에 있어서, 표적 성분들의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 성분들의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 미만의 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 성분들의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 이상의 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 성분들 안에 포함된 핵산의 게놈 등가체 수는 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
일부 경우들에 있어서, 상기 투입된 표적 성분들은 근본적인 더 큰 유전적 성분 (가령, 게놈)의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입된 표적 성분들은 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 미만의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입된 표적 성분들은 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 이상의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 투입된 표적 성분들은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
c. 시료 혼합물 안에 표적 시료 투입 양
일부 실시예들에 있어서, 투입된 시료들은 대상 또는 원천들을 변화시킴으로써 기인된 시료들의 혼합물일 수 있으며, 이때 표적 시료들은 총 투입의 특정 백분율로 구성될 수 있다. 예를 들면, 법의학적 분석을 위한 생물학적 시료들은 상이한 대상들 (가령, 희생자, 가해자, 증인, 범죄 실험 분석물, 등등)의 핵산을 포함하며, 상기 혼합물의 오직 일부분만이 상기 표적이다. 일부 경우들에 있어서, 상기 표적 시료는 총 투입에서 높은 백분율로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 총 투입에서 낮은 백분율로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 총 투입에서 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 99%, 또는 99.99%로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 총 투입에서 최소한 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 99%, 또는 99.99%로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 총 투입에서 약 0.000001%, 0.000005%, 0.0000075%, 0.00001%, 0.00005%, 0.000075%, 0.0001%, 0.0005%, 0.00075%, 0.001%, 0.005%, 0.0075%, 0.01%, 0.05%, 0.075%, 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 99% 또는 99.99% 또는 그 미만으로 구성될 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 본 명세서에서 설명된 임의의 두 값 사이에 속하는 백분율 범위로 구성될 수 있다.
포함된 표적 시료의 양은 변화될 수 있다. 일부 경우들에 있어서, 많은 양의 표적 시료가 포함될 수 있다. 일부 경우들에 있어서, 적은 양의 표적 시료가 포함될 수 있다. 일부 경우들에 있어서, 약 1 펨토그램 (fg), 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1 피코그램 (pg), 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1 마이크로그램 (μg), 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 또는 20μg의 표적 시료가 포함될 수 있다. 일부 경우들에 있어서, 최소한 약 1fg, 5fg, 10fg, 25fg, 50fg, 100fg, 200fg, 300fg, 400fg, 500fg, 600fg, 700fg, 800fg, 900fg, 1pg, 5pg, 10pg, 25pg, 50pg, 100pg, 200pg, 300pg, 400pg, 500pg, 600pg, 700pg, 800pg, 900pg, 1ng, 2.5ng, 5ng, 10ng, 15ng, 20ng, 25ng, 30ng, 35ng, 40ng, 41ng, 42ng, 43ng, 44ng, 45ng, 46ng, 47ng, 48ng, 49ng, 50ng, 51ng, 52ng, 53ng, 54ng, 55ng, 56ng, 57ng, 58ng, 59ng, 60ng, 65ng, 70ng, 75ng, 80ng, 90ng, 100ng, 200ng, 300ng, 400ng, 500ng, 600ng, 700ng, 800ng, 900ng, 1μg, 2μg, 3μg, 4μg, 5μg, 6μg, 7μg, 8μg, 9μg, 10μg, 15μg, 20μg 또는 그 이상의 표적 시료가 포함될 수 있다. 일부 경우들에 있어서, 약 20μg, 15μg, 10μg, 9μg, 8μg, 7μg, 6μg, 5μg, 4μg, 3μg, 2μg, 1μg, 900ng, 800ng, 700ng, 600ng, 500ng, 400ng, 300ng, 200ng, 100ng, 90ng, 80ng, 75ng, 70ng, 65ng, 60ng, 59ng, 58ng, 57ng, 56ng, 55ng, 54ng, 53ng, 52ng, 51ng, 50ng, 49ng, 48ng, 47ng, 46ng, 45ng, 44ng, 43ng, 42ng, 41ng, 40ng, 35ng, 30ng, 25ng, 20ng, 15ng, 10ng, 5ng, 2.5ng, 1ng, 900pg, 800pg, 700pg, 600pg, 500pg, 400pg, 300pg, 200pg, 100pg, 50pg, 25pg, 10pg, 5pg, 1pg, 900fg, 800fg, 700fg, 600fg, 500fg, 400fg, 300fg, 200fg, 100fg, 50fg, 25fg, 10fg, 5fg, 1fg 또는 그 미만의 표적 시료가 포함될 수 있다. 일부 경우들에 있어서, 표적 시료의 양은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
일부 경우들에 있어서, 표적 시료의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 시료의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 미만의 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 시료의 투입 양은 약 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 또는 50000 이상의 게놈 등가체일 수 있다. 일부 경우들에 있어서, 표적 시료의 투입 양은 본 명세서에서 설명된 임의의 두 값 사이에 있을 수 있다.
일부 경우들에 있어서, 상기 표적 시료는 근본적인 더 큰 유전적 성분 (가령, 게놈)의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X 미만의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 상기 표적 시료는 근본적인 더 큰 유전적 성분의 약 1X, 2X, 5X, 10X, 15X, 20X, 30X, 40X, 또는 50X의 적용 범위를 구성할 수 있다. 일부 경우들에 있어서, 포함된 표적 시료는 본 명세서에서 설명된 임의의 두 값 사이의 범위에서 근본적인 더 큰 유전적 성분을 포함할 수 있다.
d. 파티션에서 시료들
분석의 목적을 이루기 위하여 파티션으로 바람직한 수준의 시료 핵산을 제공하기 위하여 시료들의 분배가 실행될 수 있다. 예를 들면, 상기 시료에 임의의 복사본 핵산 일부분(가령, 표적 핵산)이 단일 파티션 안에 존재하는 가능성을 최소화시키도록 시료 핵산이 분배되는 것이 바람직할 수 있다. 이것은 분배되는 수성 스트림 안에 시료 핵산을 충분히 낮은 농도 또는 제한 희석으로 제공하고 임의의 단일 파티션 안에 오직 특정 양의 핵산이 분배되도록 함으로써 일반적으로 이루어질 수 있다. 전형적으로, 길이가 약 10 킬로베이스 (kb) 내지 약 100 kb, 또는 약 10 kb 내지 약 30 kb의 단편들이 포함된 시료 핵산 단편들이 제공되도록 시료 핵산이 처리될 수 있다. 이러한 경우들에 있어서, 파티션 안에 핵산은 약 100 내지 약 500개의 단편들이 포함되도록 보장하는 것이 일반적으로 바람직할 수 있다. 다른 적용에 있어서, 파티션 안에 단일 핵산 단편이 가장 낮은 양으로 낮추고, 단일 파티션 안에 세포의 전체 게놈, 또는 전체 내용물을 최대로 제공하는 것이 포함된 광범위하게 변화된 양으로 파티션 안에 핵산을 제공하는 것이 바람직할 수 있다.
본 명세서에서 설명된 시스템 및 방법들의 일부 측면들의 내용에서, 일부 경우들에 있어서, 상기 시료 핵산 안에 공동-분배된 비드의 양을 조절하는 것이 바람직할 수 있다. 일부 경우들에 있어서, 본 명세서에서 배치된 단일 비드 만을 가지는, 가령, "개별적으로 사용된" 파티션을 제공하는 것이 바람직할 수 있다. 상기에서 유추할 수 있는 바와 같이, 작은 방울 생성 합류점 안에 모여드는 다양한 유체의 하나 또는 그 이상의 흐름 속도를 조절하고, 합류점의 크기 및 구조를 조절하고, 그리고 작은 방울이 생성되는 시스템 또는 장치 안에 전체 채널의 기하학을 조절함으로써, 일반적으로 실현된다.
특정 실시예들에서, 파티션의 특정 백분율에는 단지 하나의 비드가 포함되도록 상기 비드가 분비될 수 있다. 일부 경우들에 있어서, 약 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 비드가 포함될 수 있다. 일부 경우들에 있어서, 최소한 약 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 비드가 포함될 수 있다. 일부 경우들에 있어서, 단지 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 비드가 포함될 수 있다. 일부 경우들에 있어서, 단지 하나의 비드가 포함된 백분율은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다.
특정 실시예들에서, 시료는 표적 핵산 (또는 표적 핵산 집단)이 포함된 핵산 시료이며, 그리고 파티션의 특정 백분율은 단지 하나의 표적 핵산, 단지 2개의 표적 핵산, 단지 3개의 표적 핵산, 단지 4개의 표적 핵산, 또는 단지 5개의 표적 핵산이 포함되도록 분배될 수 있다. 일부 경우들에 있어서, 약 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 표적 핵산을 포함할 수 있다. 일부 경우들에 있어서, 최소한 약 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 표적 핵산을 포함할 수 있다. 일부 경우들에 있어서, 단지 1%, 2.5%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 파티션은 단지 하나의 표적 핵산을 포함할 수 있다. 일부 경우들에 있어서, 단지 하나의 표적 핵산이 포함된 파티션의 백분율은 본 명세서에서 설명된 임의의 두 값 사이의 범위 안에 속할 수 있다. 일부 경우들에 있어서, 상기 파티션은 평균적으로 평균적으로 1개 미만 표적 핵산, 평균적으로 2개 미만 표적 핵산, 평균적으로 3개 미만 표적 핵산, 평균적으로 4개 미만 표적 핵산, 또는 평균적으로 5개 미만 표적 핵산을 포함한다.
추가적으로 또는 대안으로, 일부 경우들에 있어서, 비어있는 파티션, 가령 비드를 포함하지 않는 파티션이 과도한 숫자로 만들어지는 것을 피하는 것이 바람직할 수 있다. 본 명세서의 도처에서 설명된 바와 같이, 분배 구역을 향하는 유체의 흐름, 가령, 시료 유체, 유체가 포함된 비드, 및/또는 분배 유체는 생성된 파티션의 단지 90%, 단지 80%, 단지 70%, 단지 65%, 단지 60%, 단지 55%, 단지 50%, 단지 45%, 단지 40%, 단지 35%, 단지 30%, 단지 25%, 단지 20%, 단지 15%, 단지 10%, 단지 5%, 단지 2.5%, 또는 단지 1%만 사용 안되도록, 가령, 배치된 비드가 없도록 조절될 수 있다. 대부분의 경우들에 있어서, 상기-설명된 단일 점유률중 임의의 것을 여전히 제공하면서, 사용안된 파티션의 상기 명시된 범위가 획득될 수 있다. 예를 들면, 일부 경우들에 있어서, 본 명세서의 시스템들 및 방법들의 사용으로 사용안된 파티션이 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만이 되도록, 그리고 일부 경우들에 있어서, 5% 미만이 되도록 유지하면서, 25% 미만, 20% 미만, 15% 미만, 10% 미만의 다중 점유률을 보유하는 파티션, 일부 경우들에 있어서, 5% 미만의 다중 점유률을 보유하는 파티션이 되도록 한다.
특정 경우들에서 실질적으로 개별적으로 사용된 파티션을 제공하는 점에서 설명되고 있지만, 가령, 단일 파티션 안에 2개, 3개, 4개 또는 그 이상의 비드가 포함된, 다중 점유된 파티션이 제공되는 것이 바람직할 수 있다. 유사하게, 상기 파티션 안에 시료 양은 변화된 목적을 실현하기 위하여 또한 조정될 수 있다. 따라서, 상기에서 명시된 바와 같이, 상기 시료 및/또는 유체 및 분배 유체를 함유하는 비드의 흐름 특징은 이러한 다중 점유된 파티션이 제공되도록 조절될 수 있고, 이러한 파티션 안에 다양한 시료 농도 또는 양이 제공되도록 조절될 수 있다. 특히, 파티션의 50% 이상, 75% 이상, 그리고 일부 경우들에 있어서 80%, 90%, 95% 이상, 또는 그 이상의 점유률을 제공하기 위하여 흐름 매개변수가 조절될 수 있다.
본 명세서에서 설명된 바와 같은 파티션이 생성되도록 하기 위하여 벌크(bulk) 분배 방법들, 가령, 벌크 에멸젼 형성 시스템들, 대규모 작은 방울 형성 시스템들, 가령, Nanomi, Inc.에 의해 제공되는 시스템들, 또는 미세유동적 분배 시스템들이 포함된, 다수의 접근법이 이용될 수 있다. 일부 측면들에 있어서, 본 명세서에서 이용된 분배 시스템들은 2014년 4월 10일자 제출된 U.S. 가특허 출원 번호 61/977,804에서 설명되며, 이의 전문은 전체가 참고자료에 편입된다.
V. 장치로 시료 도입
본 명세서의 다양한 측면들중 임의의 것에 있어서, 개체로부터 획득된 시료는 장치 또는 시스템으로 도입될 수 있고, 이때 상기 시료는 다른 시약들 (가령, 기능 비드, 바코드화된 비드, 시료 증폭에 필요한 시약들, 환원제, 프라이머, 기능 서열, 등등)과 추가 복합되거나, 또는 혼합될 수 있다. 장치들 또는 시스템들은 통일된 몸통 구조 안에 통합된 미소규모 체널 망이 포함된 미세유동적 장치를 포함하거나, 또는 시료들의 가공에서 이용되는 유체를 제공하는 성분들의 응집을 포함할 수 있다. 본 명세서에서 설명된 바와 같이, 상기 용어 장치는 전술한 것들이 포함된, 본 명세서에서 설명된 유체 기능의 임의의 형상을 설명하는데 이용된다. 상기 장치는 시료 적재(loading) 채널을 포함하거나, 또는 포함하지 않을 수 있다. 일부 경우들에 있어서, 상기 장치는 다수의 시료 적재 채널들을 포함할 수 있다. 상기 장치는 시료 수용 관을 포함하거나 또는 포함하지 않을 수 있다. 일부 경우에 있어서, 상기 장치는 하나 또는 그 이상의 시료 수용 관을 포함할 수 있다. 시료 수용 관이 상기 장치에 영구적으로 연합될 수 있다. 시료 수용 관은 상기 장치에 부착될 수 있다. 시료 수용 관은 상기 장치와 분리가능할 수 있다. 시료 수용 관은 다양한 모양, 크기, 중량, 재료 및 형상일 수 있다. 예를 들면, 시료 수용 관은 규칙적인 모양 또는 불규칙적인 모양일 수 있고, 둥근 또는 타원 관모양일 수 있고, 직사각, 사각, 다이아몬드, 원형, 타원 또는 삼각 모양일 수 있다. 시료 수용 관은 임의의 유형의 재료, 이를 테면 유리, 플라스틱, 폴리머, 금속 등등으로 만들어질 수 있다. 시료 수용 관의 비-제한적인 유형의 예로는 튜브, 웰(well), 모세관 튜브, 카트릿지, 큐벳, 원심분리 튜브, 또는 피펫 팁이 포함될 수 있다. 일부 경우들에 있어서, 상기 장치는 동일한 시료 수용 관 다수를 포함할 수 있다. 일부 경우들에 있어서, 상기 장치는 크기, 모양, 중량, 재료 및 형상이 포함된 인자들중 최소한 하나가 상이한, 다수의 상이한 시료 수용 관을 포함할 수 있다. 일부 경우들에 있어서, 상기 장치는 하나 또는 그 이상의 다른 장치들 (가령, 열 순환기, 서열화기, 등등)과 소통될 수 있다. 일부 경우들에 있어서, 상기 장치는 또다른 장치의 일부일 수 있다.
일부 경우들에 있어서, 특정 도구를 이용하여 상기 장치로 시료를 직접적으로 도입시키거나 또는 적재시킬 수 있다. 도구의 비-제한적인 예로는 피펫, 자동-피펫, 전자 피펫, 디지털 판독 피펫, 디지털 조정 피펫, 양성 대체 피펫, 반복 피펫, 마이크로디스펜서 피펫, 상단 병이 있는(bottle top) 디스펜서, 수동 주사기, 자동-견본용 주사기, 분석용 전자 주사기, Hamilton 주사기, 또는 이의 조합이 포함된다. 일부 경우들에 있어서, 시료 적재 전, 시료가 용해되거나, 현탁되거나 물질과 혼합될 수 있다. 상기 물질은 액체 또는 기체일 수 있다. 상기 물질은 상기 장치의 하나 또는 그 이상의 시료 적재 채널들과 소통될 수 있다. 일부 경우들에 있어서, 시료는 제2 장치, 가령, 주사기 펌프 또는 시료 디스펜서에 의해 상기 장치로 도입될 수 있다.
시료는 제어된 방식으로 상기 장치에 적재될 수 있다. 일부 경우들에 있어서, 적재된 시료의 양은 조절될 수 있다. 일부 경우에 있어서, 적재된 시료의 용적은 조절될 수 있다. 일부 경우들에 있어서, 적재된 시료의 양은 시료-적재 속도의 조정을 통하여 조절될 수 있다. 일부 경우들에 있어서, 적재된 시료의 용적은 시료-적재 속도의 조정을 통하여 조절될 수 있다.
상기 장치로 하나 또는 그 이상의 유형의 시료들이 도입될 수 있다. 하나 이상의 유형의 시료들이 적재되는 경우에 있어서, 이들 시료는 연속적으로, 또는 동시에 적재될 수 있다. 일부 경우들에 있어서, 상이한 유형의 시료들은 동일한 채널을 통하여 적재될 수 있다. 일부 경우들에 있어서, 상이한 유형의 시료들은 다양한 채널을 통하여 적재될 수 있다. 일부 경우들에 있어서, 상이한 유형의 시료들은 동일한 시료 수용 관으로 적재될 수 있다. 일부 경우들에 있어서, 상이한 유형의 시료들은 이들의 상응하는 시료 수용 관으로 적재될 수 있다. 일부 측면들에 있어서, 단일 장치 또는 시스템은 잠재적 교차 오염 문제를 줄이거나 또는 없애면서 여러 상이한 시료를 처리하기 위하여 다중 평행 채널 또는 유체 망을 포함할 수 있다.
시료는 상기 장치에 적재되기 전, 가공되거나 또는 가공되지 않을 수 있다. 일부 경우들에 있어서, 시료는 임의의 추가 공정없이 상기 장치로 도입될 수 있다. 일부 경우들에 있어서, 시료는 장치로 도입되기 전, 하나 또는 그 이상의 가공 과정을 거칠 수 있다. 예를 들면, 핵산 혼합물이 시료로 이용되는 경우에 있어서, 상기 혼합물 안에 있는 하나 또는 그 이상의 성분들이 상기 장치로 도입되기 전, 단리되고, 추출되거나 또는 정제되도록 상기 혼합물이 가공될 수 있다. 예를 들면, 일부 경우들에 있어서, 진유전체(exomes)는 원래 핵산 시료로부터 정제될 수 있다. 또다른 실시예에서, 핵산의 더 긴 서열은 상기 시료 적재에 앞서 더 작은 서열 변이체로 단편화될 수 있고, 이 단편들은 가령, Blue Pippin 단편 선별 시스템을 이용하여 원하는 크기 또는 크기 범위의 단편들을 농축시키기 위하여 추가 공정을 거치거나 또는 거치지 않을 수 있다. 일부 경우들에 있어서, 적재되는 시료는 상기 장치로 적재되기 전 다른 시약들과 사전-혼합될 수 있다. 시약들의 비-제한적인 예로는 기능성 비드, 바코드들, 올리고뉴클레오티드, 변형된 뉴클레오티드, 고유 뉴클레오티드, DNA 중합효소, RNA 중합효소, 역 전사효소, 돌연변이체 교정 중합효소, dTTPs, dUTPs, dCTPs, dGTPs, dATPs, 프라이머, 시료 색인 서열, 시퀀싱 프라이머 결합 부위, 서열화기 프라이머 결합 부위, 환원제, 또는 이의 조합을 포함한다.
상기 시료를 수용할 수 있고, 그리고 추가 가공 단계를 위하여 특정 시약들과 복합될 수 있는 본 명세서에서 설명된 바와 같은 임의의 장치가 이용될 수 있다. 이러한 장치는 미세유동적 장치 (가령, 작은 방울 발생기)일 수 있다. 이러한 미세유동적 장치들의 예들은 2014년 4월 10일자 제출된 U.S. 가특허 출원 번호 61/977,804에서 설명되며, 모든 목적을 위하여 이의 전문은 전체가 참고자료에 편입된다.
VI. 테스트 실행
본 명세서에서 설명된 방법들과 시스템들은 투입 양이 적은 핵산 (가령, 50 나노그램 (ng) 미만, 49ng 미만, 48ng 미만, 47ng 미만, 46ng 미만, 45ng 미만, 44ng 미만, 43ng 미만, 42ng 미만, 41ng 미만, 40ng 미만, 35ng 미만, 30ng 미만, 25ng 미만, 20ng 미만, 15ng 미만, 10ng 미만, 5ng 미만, 2.5ng 미만, 1ng 미만, 0.5ng 미만, 0.1ng 미만, 0.05ng 미만, 0.01ng 미만, 0.005ng 미만, 0.001ng 미만, 등등)의 시료들을 탐지하고 분석하기 위한 높은 정확성을 제공할 수 있다. 이러한 정확성은 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 91%, 최소한 약 92%, 최소한 약 93%, 최소한 약 94%, 최소한 약 95%, 최소한 약 95.5%, 최소한 약 96%, 최소한 약 96.5%, 최소한 약 97%, 최소한 약 97.5%, 최소한 약 98%, 최소한 약 98.5%, 최소한 약 99%, 최소한 약 99.5%, 최소한 약 99.9%, 최소한 약 99.99%, 최소한 약 99.999%, 또는 최소한 약 99.9999%일 수 있다.
본 명세서에서 설명된 방법들과 시스템들은 투입 양이 적은 핵산 (가령, 50 ng 미만, 49ng 미만, 48ng 미만, 47ng 미만, 46ng 미만, 45ng 미만, 44ng 미만, 43ng 미만, 42ng 미만, 41ng 미만, 40ng 미만, 35ng 미만, 30ng 미만, 25ng 미만, 20ng 미만, 15ng 미만, 10ng 미만, 5ng 미만, 2.5ng 미만, 1ng 미만, 0.5ng 미만, 0.1ng 미만, 0.05ng 미만, 0.01ng 미만, 0.005ng 미만, 0.001ng 미만, 등등)의 시료들을 탐지하고 분석하기 위한 높은 민감도를 제공할 수 있다. 이러한 민감도는 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 91%, 최소한 약 92%, 최소한 약 93%, 최소한 약 94%, 최소한 약 95%, 최소한 약 95.5%, 최소한 약 96%, 최소한 약 96.5%, 최소한 약 97%, 최소한 약 97.5%, 최소한 약 98%, 최소한 약 98.5%, 최소한 약 99%, 최소한 약 99.5%, 최소한 약 99.9%, 최소한 약 99.99%, 최소한 약 99.999%, 또는 최소한 약 99.9999%일 수 있다.
본 명세서에서 설명된 방법들과 시스템들은 투입량이 적은 핵산 (가령, 50 나노그램 (ng) 미만, 49ng 미만, 48ng 미만, 47ng 미만, 46ng 미만, 45ng 미만, 44ng 미만, 43ng 미만, 42ng 미만, 41ng 미만, 40ng 미만, 35ng 미만, 30ng 미만, 25ng 미만, 20ng 미만, 15ng 미만, 10ng 미만, 5ng 미만, 2.5ng 미만, 1ng 미만, 0.5ng 미만, 0.1ng 미만, 0.05ng 미만, 0.01ng 미만, 0.005ng 미만, 0.001ng 미만, 등등)의 시료들을 탐지하고 분석함에 있어서 높은 특이성을 제공할 수 있다. 이러한 특이성은 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 91%, 최소한 약 92%, 최소한 약 93%, 최소한 약 94%, 최소한 약 95%, 최소한 약 95.5%, 최소한 약 96%, 최소한 약 96.5%, 최소한 약 97%, 최소한 약 97.5%, 최소한 약 98%, 최소한 약 98.5%, 최소한 약 99%, 최소한 약 99.5%, 최소한 약 99.9%, 최소한 약 99.99%, 최소한 약 99.999%, 또는 최소한 약 99.9999%일 수 있다.
VII. 적용
a. 암 및 다른 질환들의 진단
본 명세서에서 설명된 방법들과 시스템들은 암 또는 질환을 가진, 가진 것으로 의심되는, 또는 가질 위험에 처한 개체에서 암 또는 질환(가령, 치매) 진단에 유용할 수 있다. 특히, 이들 방법들, 조성물들 그리고 시스템들은 시퀀싱에 의해 암을 탐지하고, 암 세포들을 특징화하는데 유용한다.
본 명세서의 도처에서 설명된 바와 같이, 암 세포들은 고형 종양으로부터 획득되거나, 또는 순환 종양 세포들 (집합적으로 "암 시료")로부터 획득될 수 있다. 상기 고형 종양들은 살아있는 암 시료, 비-보존된 암 시료, 보존된 암 시료, 방부처리된 암 시료, 매립된 암 시료, 고정된 암 시료, 또는 이의 임의의 조합으로부터 수득될 수 있다. 상기 암 시료는 매립되고, 그리고 보존되거나, 방부처리되거나 또는 고정된다. 일부 경우들에 있어서 상기 암 시료는 모두 매립되고, 고정된다. 일부 실시예들에 있어서 상기 암 시료는 포름알데히드 고정되고, 파라핀 매립된다 (FFPE).
순환 종양 세포들 (CTCs)의 분석은 암 환자에서 실시간 "액체 생검'으로 간주되며, 이 생검은 CTCs의 특정 하위-집단의 특징화를 허용하고, 이로써 암 진단에서 상당한 확신을 가진다. 그러나, CTCs 탐지는 기술적으로 여전히 난제를 가지고 있는데, 그 이유는 매우 낮은 농도 (수백만개의 정상적인 세포들 배경에서 1개 CTC)에서 발생되기 때문에, 이의 식별 및 특징화는 극도의 감도 및 특이적 분석 방법들이 요구된다. (Pantel K. et al., Journal of Thoracic Disease, 2012, 4(5): 446-447), 이의 전문은 전체가 참고자료에 편입된다.
대부분의 핵산 시퀀싱 기술은 조직 또는 다른 시료들에서 획득된 세포 콜렉션으로부터 DNA 서열을 유도한다. 상기 세포들은 전형적으로 집단적으로 가공되어 세포들 집단의 평균이 되는 유전적 재료가 추출되고, 그 다음 주어진 시퀀싱 기술을 위하여 형상화된 시퀀싱 대기 DNA 라이브러리로 가공된다. 이 공정에 따른, 세포 특이적 표지의 부재, 시료 안 세포들의 부분집합 또는 모든 세포들에 의해 부여되는 유전적 재료의 속성은 이러한 앙상블(ensemble) 방식에서는 실제적으로 불가능하다.
특징들을 세포 집단의 특정 부분집합에 귀속시키지 못하는 능력에 추가하여, 이러한 앙상블 시료 준비 방법들은 시작부터 세포들의 시료에서 주요 구성분들을 주로 식별해내고, 특징화시키는 경향이 있고, 그리고 소수의 구성분들, 가령, 상기 시료 안에 한 개의 세포, 몇 개의 세포들, 또는 전체 세포에서 작은 백분율의 세포에 의해 기여되는 유전적 재료를 골라낼 수 있도록 기획된 것이 아니다.
대조적으로, 본 명세서에서 제공되는 방법들 및 시스템들은 개별적 또는 소수의 핵산, 가령, 순환 종양-연합된 DNA를 분리된 반응 용적 또는 파티션 (가령, 작은 방울)으로 분배 또는 할당할 수 있고, 이때 이들 핵산 또는 핵산 성분들은 비드에 방출가능하도록 부착된 올리고뉴클레오티드 안에 포함된 프라이머 서열 (가령, 무작위 N-mers)에 의해 우선 증폭될 수 있다. 더욱이, 이 초기 증폭 공정 동안 독특한 식별장치 (가령, 바코드 서열)는 이들 분리된 파티션 안에 있는 시료 핵산 또는 핵산 성분들에 연결될 수 있다.
본 명세서의 도처에서 설명된 바와 같이, 파티션의 생성 시, 시료 스트림, 비드 스트림 또는 이 둘 모두의 흐름 속도를 조절함으로써, 또는 채널 합류점의 기하학을 변경시킴으로써, 원하는 시료 (또는 표적 핵산)/비드 점유된 파티션이 만들어질 수 있다.
분리된, 독특한 식별장치의 적용과 함께, 상이한 시료 또는 성분들의 분배된 증폭에 의해 시퀀싱 공정을 통하여 각각 시료 성분, 뿐만 아니라 속성의 출연된 이들의 각 기원(가령, 정상적인 세포, 종양 세포, 순환 종양 세포, 등등)에 귀속이 허용된다. 일부 경우들에 있어서, 증폭 공정들의 추가 라운드가 실행될 수 있다.
b. 태아 이수성의 확인
이수성(Aneuploidy)이란 염색체 수가 특정 종의 수 특징적인 정확한 배수가 아닌 상태를 말한다. 잉여 또는 상실 염색체는 인간 출생 결함이 포함된 유전적 장애의 공통적인 원인이다. 예를 들면, Down 증후군 (DS) (본 명세서에서 또한 "3염색체성 21")은 염색체 21의 제3의 복사체의 전부 또는 일부의 존재로 인한 유전적 장애다. Edwards 증후군 (본 명세서에서 또한 "3염색체성 18")은 잉여 18번째 염색체의 전부 또는 일부의 존재로 인한 유전적 장애다. Patau 증후군, 또는 3염색체성 13은 염색체 비정상에 의한 증후군으로, 신체의 세포의 일부 또는 전부가 염색체 13으로부터 잉여 유전적 재료를 포함하고 있다. 염색체 이상을 진단하는 통상적인 방법들, 이를 테면 융모막 융모 샘플링 및 양막천자(amniocentesis)는 잠재적으로 태아와 엄마 모두에게 상당히 위험하다. 엄마의 혈청 표지 및 초음파를 이용한 태아 이수성을 비침습적으로 스크리닝하는 방법이 이용가능하지만, 신뢰성은 매우 제한적이다. (Fan et al. PNAS, 2008, 105(42): 16266-16271), 모든 목적을 위하여 이의 전문은 전체가 참고자료에 편입된다.
모체의 순환계에서 세포-없는 태아 핵산의 존재에 대한 최근 발견은 이수성을 위한 출생전 비침습적 유전적 테스트 개발로 이어졌다. 모체 혈류 안 세포-없는 태아 DNA (cffDNA), 자유로이 순환하는 태아 DNA는 태반을 구성하는 영양막으로부터 유래된다. 상기 태아 DNA는 단편화되고, 모체의 혈류로 태반의 미립자를 흘림(shedding)으로써 모체 혈류로 가게된다. 그러나, 세포-없는 태아 DNA의 분석을 통한 이수성의 측정은 모체 DNA의 높은 배경으로 인하여 여전히 힘들다. 태아 DNA는 모체의 세포-없는 혈장에서 전체 DNA의 10% 미만으로 대개 구성되는 것으로 추정된다.
본 명세서에서 설명된 방법들, 조성물들과 시스템들은 시퀀싱에 의해 태아 이수성을 진단하고, 그리고 모체의 혈액 또는 다른 체액에서 세포-없는 태아 DNA를 분석함으로써 태아 이수성을 탐지 및 진단하는데 유용하다. 복사체 수의 변이 및 반수체들의 단계화를 위한 방법들과 시스템들은 2014년 6월 26일자로 제출된 U.S. 가출원 62/017,808에서 설명되며, 이의 전문은 모든 목적을 위하여 전체가 참고자료에 편입된다.
예시적인 공정에서 상이한 기원 또는 원천 (가령, 세포-없는 모체 DNA, 세포-없는 태아 DNA, 등등)의 개별 또는 소수 핵산은 다수의 반응 용적, 또는 파티션 (가령, 작은 방울)으로 별도 분배될 수 있다. 한편, 방출가능하도록 부착된 올리고뉴클레오티드를 가진 다수의 비드는 동일한 분리된 파티션으로 분배되어, 각각 파티션에 비드와 시료 핵산 모두가 포함될 수 있다. 본 명세서의 도처에서 설명된 바와 같이, 시료 스트림, 비드 스트림 또는 이둘 모두의 흐름 속도를 변경시키거나, 또는 채널 합류점의 기하학을 변경시켜, 특정 수의 시료들 및/또는 올리고뉴클레오티드 부착된 비드를 포함하도록, 파티션의 점유률이 조정될 수 있다. 추가적으로, 파티션의 특정 백분율은 단지 하나의 표적 시료 핵산 (가령, 세포-없는 태아 DNA)만을 포함할 수 있도록 분배 공정 또한 조절될 수 있다. 예를 들면, 일부 경우들에 있어서, 본 명세서에서 제공된 시스템 및 방법들을 이용하면 하나 이상의 표적 핵산 (가령, 세포-없는 태아 DNA)이 포함된 점유에 의해 생성된 파티션이 90% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 또는 5% 미만으로 만들어질 수 있다. 일부 경우들에 있어서, 전체 점유된 파티션의 실질적인 백분율은 최소한 표적 시료 및 비드를 포함할 수 있도록 분배 공정이 조정될 수 있다. 예를 들면, 최소한 5%, 최소한 10%, 최소한 20%, 최소한 30%, 최소한 40%, 최소한 50%, 최소한 60%, 최소한 70%, 최소한 80%, 최소한 90%, 또는 최소한 99%의 상기 파티션이 그렇게 점유될 수 있다. 일부 경우들에 있어서, 파티션 안에 단일 표적 시료 및 단일 비드를 제공하는 것이 바람직할 수 있으며, 상기 파티션의 최소한 5%, 최소한 10%, 최소한 20%, 최소한 30%, 최소한 40%, 최소한 50%, 최소한 60%, 최소한 70%, 최소한 80%, 최소한 90%, 또는 최소한 99%는 그렇게 점유될 수 있다.
상기 파티션의 생성 후, 주어진 비드에 연합된 올리고뉴클레오티드는 이 파티션으로 방출되고, 그리고 주어진 파티연 안에 있는 하나 또는 그 이상의 표적 시료들에 부착될 수 있다. 올리고뉴클레오티드에 포함된 공통적인 바코드 서열 및 무작위 N-mers는 초기 증폭 공정 동안 각각 주어진 파티션 안에 있는 시료 서열의 기원을 확인하고, 시료 서열의 다중 단편들을 프라임시키는데 이용될 수 있다. 시료들의 처음으로 증폭된 단편들은 그 다음 푸울되고, 서열화될 수 있다 (가령, 본 명세서의 도처에서 설명된 것들이 포함된 임의의 적절한 시퀀싱 방법 이용). 상기 바코드들의 실체는 개별적 단편들의 서열 판독을 정렬시키고 뿐만 아니라 상이한 유전적 기원 (가령, 염색체)의 단편들을 구별해내는 역할을 할 수 있다. 각각 염색체에 매핑된 서열 수를 헤아림으로써, 태아 이수성에 기여하는 모체 혈장 안의 임의의 염색체의 과다 또는 과소 제공이 탐지된다.
c. 법의학적 적용
DNA 프로파일링 (DNA 테스트, DNA 유형결정, 또는 유전적 지문화(fingerprinting)로도 불림)이란 개체를 이들의 각 DNA 프로파일로 확인을 지원하기 위하여 법의학 과학자들이 이용하는 기술이다. DNA 프로파일은 개인의 DNA 구성이 반영된 암호화된 문자 세트로써, 이는 개인의 식별자로 또한 이용될 수 있다. DNA 프로파일링은 예를 들면, 부모 검사 및 범위 조사에 이용된다.
DNA 프로파일링은 매우 가변적인 소위 가변적 수 일렬 반복 (VNTRs), 특히 짧은 일렬 반복 (STRs)인 반복적 ("반복") 서열이다. VNTR 좌(loci)는 밀접하게 관련된 인간들 사이에서는 매우 유사하지만, 무관한 개인들은 동일한 VNTRs를 보유할 가능성은 상당히 낮을 정도의 가변성이 있다. 그러나, 전통적인 방법들은 일관된 그리고 신뢰적 결과를 제공하지 못하였는데, 그 이유는 인간 DNA 서열의 거의 99.9%는 모든 사람에서 동일하고, 가장 중요한 것은 상기 표적 DNA가 다량의 외부 물질 (가령, 환경적 오염, 희생자 대(vs.) 가해자 세포들 및/또는 핵산)에 의해 종종 오염되기 때문이다.
상기 방법들, 본 명세서에서 설명된 조성물들과 시스템들은 더 큰 핵산 시료들에서 소수로 나타나는 핵산의 특징화가 허용됨으로써, 법의학적 분석에서 특정 DNA 시료를 확인하는데 적용될 수 있다.
본 명세서의 도처에서 설명된 바와 같이, 유전적 재료 (가령, DNA)는 법의학적 증거의 혼합물 (가령, 혈흔 혼합물, 조직, 등등)로부터 추출될 수 있다. 추출된 DNA 시료들과 기능성 올리고뉴클레오티드를 휴대하는 다수의 비드는 제어된 공정을 통하여 각 파티션에 소수의 비드 또는 소량의 DNA 시료가 포함될 수 있도록 다중 반응 용적 또는 파티션으로 공동-분배된다. 상이한 유기체 (가령, 희생자 대(vs.) 가해자)로부터 게놈 재료의 중첩 서열 또는 세그먼트가 포함되지 않는 수준에서 상기 파티션 안에 시료 재료를 제공함으로써, 분리된 기여 시료 핵산의 가공처리 및 탐지를 확보할 수 있고, 뿐만 아니라 두 개의 상이한 기원 사이에 이러한 시료 핵산의 귀속을 확보할 수 있다.
비드에 부착된 올리고뉴클레오티드는 공통 서열 (가령 바코드 서열)과 프라임 서열 (현재 경우에 DNA의 특정 영역을 표적하는 표적 N-mers)을 포함할 수 있다. 상기 공통 바코드 서열을 이용하여 시료들을 확인하고, 각 주어진 파티션에서 시료 DNA의 특정 영역을 프라임시킨다. 상기 초기 증폭 공정은 증폭된 바코드화된 서열이 생성되도록 하기 위하여 각 파티션 내에서 일어날 수 있다. 그 다음 앰플리콘이 푸울되고, 하나 또는 그 이상의 추가 증폭 공정들을 거친 후, 최종 증폭된 산물의 시퀀싱이 이어진다. 본 명세서의 도처에서 설명된 바와 같이, 앰플리콘에 포함된 바코드 서열을 이용하여 이들 각 기원에 DNA 서열을 귀속시킬 수 있다. VNTR, 특히 증폭된 서열의 STR 좌를 분석함으로써, 표적 DNA가 속하는 개체가 식별될 수 있다.
d. 환경 테스트
상기에서 설명된 법의학적 테스트와 같이, 환경 시료들의 테스트는 흔히 상당히 비균질적인 시료들, 가령, 상이한 유기체, 생물학적 성분들, 및 다른 물질들이 다수 포함된 시료 안에서 생물학적 특이적 유기체 또는 성분들을 찾는 것과 관련된다. 이러한 경우들에 있어서, 본 명세서에서 설명된 방법들과 시스템들은 가령, 분석을 압도하는 주요 성분들 없이, 핵산 시퀀싱을 통하여 시료에 다양한 기여 성분들의 유익한 특징화를 제공한다. 이러한 분석은 특정 병원체, 지표(indicator) 유기체, 가령, 대장균형(coliforms), 및 이와 유사한 것들에 대한 시료의 조사를 포함할 수 있다.
e. 미생물군유전체 특징화
본 명세서에서 설명된 조성물들과 방법들은 다중 개별적 집단 성분들의 특징화, 가령, 미생물군유전체 분석에 유용할 수 있으며, 이때 다시말하면 미생물 요소들의 큰 그리고 다양한 집단들 가운데서 개별적 집단 구성요소들의 기여는 용이하게 식별되지 않을 수 있다. 특히, 전형적인 앙상블 기반 시퀀싱 접근 방법은 혼합된 시료 집단으로부터 평균적 또는 일치된 전체 유전적 정보를 제공하는 경향이 있을 수 있고, 집단 구성요소들 간에 유전적 구성에서 미묘한 변이를 볼 수 없을 것이다. 이러한 변이는 주어진 집단 또는 미생물군유전체의 상태를 특징화하는데 중요한 미생물군유전체의 상이한 균주, 변이체 또는 종을 규정할 수 있다.
예시적인 공정에서 세포 집단들, 가령, 미생물군유전체 시료로부터 추출된 유전적 재료 (가령, DNA, RNA, 등등)는 파티션에 출발 집단의 상이한 구성요소들로부터 중첩 핵산들이 포함되지 않도록, 분리된 파티션(가령, 작은 방울)으로 분배될 수 있다. 일부 경우들에 있어서, 이는 이러한 중첩 서열이 공동-분배될 확률이 매우 낮게 되는 농도에서 상기 집단으로부터 추출된 핵산이 제공됨으로써, 이루어질 수 있다. 일부 측면들에 있어서, 이는 핵산을 특징화시키기 위하여 본 명세서에서 설명된 바와 같이, 개별 세포들이 따로 분배되고 처리되도록 전체 세포를 분배함으로써, 이루어질 수 있다. 방출가능하도록 부착된 올리고뉴클레오티드를 가진 비드는 동일한 세트의 파티션으로 분배될 수 있다. 다시, 상기에서 설명된 바와 같이, 각 파티션은 특정 수의 비드 또는 표적 핵산에 의해 점유되도록 상기 분배 공정이 조절될 수 있다 (가령, 시료 스트림의 조절된 흐름 속도, 비드 스트림의 조절된 흐름 속도, 시료 및 비드 스트림 모두의 조절된 흐름 속도, 채널 합류점의 기하학의 정의된 구조, 등등).
각 파티션 안에서 시료는 공통 영역 (가령, 바코드 서열) 및 가변 영역 (가령, 표적 N-mers 또는 무작위 N-mers)이 포함된 방출된 올리고뉴클레오티드와 함께 초기 증폭될 수 있다. 이 초기 증폭 공정 후, 각 개별 파티션 안에 증폭된 서열은 다음 공정, 예를 들면, 시퀀싱 공정 동안 이들 각 파티션에 생성 서열을 귀속시킬 수 있는 독특한 식별기 (가령, 바코드 서열)로 테그될 수 있다. 시료 기원에 기반을 둔 파티션에 시료를 할당하는 경우, 시료가 후속적으로 노출되는 공정 단계들에서 특정 시료로부터 기인된 생성 서열을 더 잘 식별해낼 수 있다.
그 다음 앰플리콘(amplicons)이 푸울되고, 하나 또는 그 이상의 추가 증폭 공정들을 거질 수 있고, 최종 증폭된 산물의 시퀀싱이 이어진다. 부착된 독특한 바코드 서열에 근거하여, 각 생성 서열의 시료 기원이 식별될 수 있다.
VIII. 오염의 여과
핵산 시료가 비-시료 핵산에 의한 오염은 관련없는 시퀀싱 판독이 무작위로 생성되게 될 수 있으며, 이는 이러한 분석으로 오류를 도입시키는 것이 포함된 (가령, 서열 어셈블리), 시퀀싱 데이터 분석을 복잡하게 할 수 있다. 핵산 오염은 관심 핵산 시료로부터 유도되지 않은 핵산 (가령, "쓰레기(junk)" 핵산)으로 일반적으로 간주될 수 있다. 일부 경우들에 있어서, 이러한 오염은 상대적으로 낮은-수준으로 존재하지만, 여전히 서열 분석의 질과 정확성에 영향을 줄 수 있다.
본 명세서에서 설명된 방법들, 조성물들과 시스템들은 상대적으로 낮은-수준의 이러한 오염이 포함된, 핵산 오염으로부터 생성된 시퀀싱 판독 (가령, 핵산의 바코드화된 단편 또는 이의 복사체에 대하여 결정된 서열)을 식별하는데 유용할 수 있다. 일부 경우들에 있어서, 이러한 핵산 오염이 상기 시료 안의 상대적으로 낮은 수준, 이를 테면 전체 핵산의 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 1% 미만, 0.1% 미만, 0.01% 미만, 0.001% 미만, 0.0001% 미만 또는 0.00001% 미만으로 존재할 때, 본 명세서에서 설명된 방법들, 시스템들 그리고 조성물을 이용하여 하나 또는 그 이상의 오염 시퀀싱 판독의 식별 및 제거함으로써, 또는 확인가능한 시퀀싱 판독으로부터 확인불가능한 시퀀싱 판독을 제거함으로써, 오염 핵산으로부터 핵산(가령, DNA) 시퀀싱 판독을 걸러낼 수 있다.
한 측면에 있어서, 본 명세서는 핵산 서열을 분석하기 위한 방법을 제공한다. 상기 방법은 핵산 시료로부터 생성된 핵산 분자들이 포함된 파티션 (가령, 웰, 튜브, 마이크로 또는 나노웰, 구멍을 통하여, 작은 유체 방울 (가령, 유중수적형 에멸젼 안에 작은 수성 방울))을 제공하는 것을 포함한다. 상기 핵산 분자들은 상기 파티션으로부터 핵산 혼합물로 푸울될 수 있고, 그 다음 상기 핵산 분자들의 핵산 서열이 포함된 시퀀싱 판독을 만들기 위하여 핵산 시퀀싱을 거칠 수 있다. 프로그램화된 컴퓨터 프로세서 (가령, 이를 테면 본 명세서에서 설명된 예시적인 컴퓨터 제어 시스템의 프로그램화된 컴퓨터 프로세서)를 이용하여, 상기 시퀀싱 판독이 분석될 수 있고, 그리고 핵산 오염이 존재하는 경우, 최소한 하나의 오염 판독 (가령, 상기 핵산 혼합물에서 오염 핵산 분자와 연합된)이 확인될 수 있다. 일단 확인되면, 남아있는 시퀀싱 판독으로부터 생성된 핵산 시료의 서열을 가진 시퀀싱 판독으로부터 오염 판독이 제거될 수 있다. 일부 경우들에 있어서, 다수의 오염 판독(가령, 동일한 오염 핵산 분자와 연합된 또는 상이한 오염 핵산 분자들과 연합된)이 확인되고, 그리고 상기 핵산 시료에 대한 서열이 생성되기 전, 제거될 수 있다.
상기에서 논의된 바와 같이, 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자의 총량과 비교하였을 때 상대적으로 낮을 수 있다. 예를 들면, 핵산 혼합물 안에 오염 핵산 분자의 양은 핵산 혼합물 안에 핵산 분자의 총량의 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만, 0.005% 미만, 0.001% 미만, 0.0005% 미만, 0.0001% 미만, 0.00005% 미만, 0.00001% 미만, 0.000005% 미만, 0.000001% 미만, 0.0000005% 미만, 0.0000001% 미만, 또는 미만일 수 있다.
일부 구체예들에 있어서, 상기 시퀀싱 판독의 부분집합들중에서 서열 중첩(들)을 결정하고, 그리고 상기 시퀀싱 판독중 주어진 하나에 대한 중첩(들)이 모든 부분집합들에 대하여 임계값 미만인 경우, 오염 판독을 확인함으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 시퀀싱 판독의 부분집합들중에서 서열 중첩(들)을 측정하고, 그리고 상기 시퀀싱 판독의 주어진 하나에 대한 중첩(들)이 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만, 0.0005% 미만, 0.0001% 미만 또는 모든 부분집합들에 대하여 미만 인 경우, 오염 판독을 확인함으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 시퀀싱 판독의 부분집합들중 서열 중첩(들)을 결정하고, 그리고 상기 서열 판독중 주어진 하나가 모든 부분집합들에 대하여 중첩되지 않는다면, 오염 판독을 확인함으로써, 오염 판독이 식별된다.
일부 구체예들에 있어서, 상기 서열 판독을 기준과 비교하고, 그리고 기준과 주어진 시퀀싱 판독 중첩이 임계치 미만인 경우, 서열 판독들에서 주어진 서열 판독은 오염 판독으로 확인함으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 서열 판독을 기준과 비교하고, 그리고 기준과 주어진 시퀀싱 판독이 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만, 0.0005% 미만, 0.0001% 미만 또는 그 미만으로 중첩된다면, 상기 서열 판독들에서 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 서열 판독을 기준과 비교하고, 그리고 서열 단독에서 주어진 하나가 기준과 중첩되지 않는 경우, 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다.
일부 구체예들에 있어서, 상기 서열 판독을 서로 비교함으로써, 상기 시퀀싱 판독중에서 서열 중첩(들)을 확인하고, 그리고 상기 시퀀싱 판독중에서 하나의 서열이 다른 시퀀싱 판독과 임계치 미만으로 중첩된다면, 서열 판독에서 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 서열 판독을 서로 비교하여 상기 시퀀싱 판독중에서 서열 중첩(들)을 확인하고, 그리고 이의 서열이 시퀀싱 판독중 다른 시퀀싱 판독과 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만, 0.0005% 미만, 0.0001% 미만 또는 미만으로 중첩된다면, 상기 서열 판독에서 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 서열 판독을 서로 비교함으로써, 상기 시퀀싱 판독중 서열 중첩(들)을 확인하고, 그리고 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독의 서열과 중첩되지 않는 다면, 상기 서열 판독중 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다.
일부 구체예들에 있어서, 상기 서열 판독을 이들의 각 서열 영역(들)에 매핑하고, 그리고 이의 서열 영역(들)에 매핑되었을 때, 주어진 서열 판독이 이들의 서열 영역(들)에 매핑된 다른 서열 판독의 임계치 미만으로 중첩된다면, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다. 일부 구체예들에 있어서, 상기 서열 판독을 이들의 각 서열에 매핑하고, 그리고 이의 서열 영역(들)에 매핑되었을 때, 주어진 서열 판독이 상기 서열 판독중 이들의 서열 영역(들)에 매핑된 다른 서열 판독과 50개 미만, 상기 서열 판독중 다른 판독과 45개 미만, 상기 서열 판독중 다른 판독과 40개 미만, 상기 서열 판독중 다른 판독과 35개 미만, 상기 서열 판독중 다른 판독과30개 미만, 상기 서열 판독중 다른 판독과 25개 미만, 상기 서열 판독중 다른 판독과 20개 미만, 상기 서열 판독중 다른 판독과 19개 미만, 상기 서열 판독중 다른 판독과 18개 미만, 상기 서열 판독중 다른 판독과 17개 미만, 상기 서열 판독중 다른 판독과 16개 미만, 상기 서열 판독중 다른 판독과15개 미만, 상기 서열 판독중 다른 판독과 14개 미만, 상기 서열 판독중 다른 판독과 13개 미만, 상기 서열 판독중 다른 판독과 12개 미만, 상기 서열 판독중 다른 판독과 11 미만, 상기 서열 판독중 다른 판독과 10개 미만, 상기 서열 판독중 다른 판독과 9개 미만, 상기 서열 판독중 다른 판독과 8개 미만, 상기 서열 판독중 다른 판독과 7 미만, 상기 서열 판독중 다른 판독과 6개 미만, 상기 서열 판독중 다른 판독과 5개 미만, 상기 서열 판독중 다른 판독과 4개 미만, 상기 서열 판독중 다른 판독과 3개 미만, 상기 서열 판독중 다른 판독과 2개 미만, 상기 서열 판독중 다른 판독과 1개 미만, 또는 상기 서열 판독중 다른 판독과 하나도 중복되지 않는다면, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다.
본 명세서의 도처에서 설명된 바와 같이, 핵산 시료는 단편화되고, 이들 단편들은 이를 테면, 예를 들면 에멸젼 작은 방울로 분배된다 (가령, 도 4에 나타낸 바와 같이). 각 작은 방울에서 바코드화된 단편들 또는 분배된 단편들의 복사체들은 이를 테면, 예를 들면, 도 3에서 그리고 본 명세서의 도처에서 설명된 바와 같이 증폭 반응에서 생성될 수 있다. 상기 바코드화된 단편들 또는 이의 복사체들은 그 다음 서열화되어 바코드화된 단편 판독이 생성되고, 그 다음 이들은 더 큰 서열로 어셈블리될 수 있다. 오염 핵산 분자(들)이 상기 핵산 시료 및/또는 바코드화된 단편들이 생성된 파티션 안에 존재하는 경우, 상기 오염 핵산 분자(들)에 대응하는 바코드화된 단편들 또는 이의 복사체들이 또한 생성될 수 있다. 이러한 오염물 바코드화된 단편들 또는 이의 복사체들 또한 서열화되고, 따라서 관련없는 시퀀싱 판독이 서열 분석으로 도입된다. 이러한 관련없는 시퀀싱 판독은 상기 핵산 시료의 서열 분석을 간섭하거나 및/또는 서열 분석으로 오류를 도입시킬 수 있다. 본 명세서에서 제공된 방법들은 오염 핵산 분자로부터 유도된 바코드화된 단편들 또는 이의 복사체들로부터 생성된 바코드화된 판독을 제거하는데 유용할 수 있다. 따라서, 일부 구체예들에 있어서, 핵산 시료로부터 생성된 핵산 분자들이 포함된 파티션 제공은 이를 테면, 예를 들면 본 명세서에서 설명된 방법들에 의해 상기 핵산 분자들의 각각에 대응하는 바코드화된 단편들 또는 이의 복사체들을 생성하는 것을 포함할 수 있다. 더욱이, 생성된 시퀀싱 판독은 상기 바코드화된 단편들 또는 이의 복사체들의 핵산 서열이 포함된 바코드화된 단편 판독을 포함할 수 있다.
상기 핵산 시료가 게놈 핵산 시료인 경우에 있어서, 게놈의 공지의 이웃하는 일부분의 서열(가령, 공지의 공통 또는 우세 서열에 대한 매핑가능성)이 포함된 또다른 서열 판독에 대한 서열 판독의 중첩이 없는 것을 이용하여 상기 서열 판독이 오염 서열 판독인지를 식별해낼 수 있다. 일부 경우들에 있어서, 이를 테면 구조적 변이체 (가령, 복사체 수 변이, 삽입, 결손, 전위, 역전, 재배열, 반복 연장, 중복) 또는 다른 유전적 변이 (가령, 단일 뉴클레오티드 다형성)의 경우와 같이, 비록 시퀀싱 판독이 게놈의 공지된 이웃 부분에 연계되지 않을 수는 있지만, 여전히 연계된 서열 영역에 매핑은 가능하다 (가령, 상기 서열 영역 사이에 유의적인 바코드 중첩에 의해 증명됨). 구조적 변이들과 다른 유전적 변이를 결정하는 예시적인 방법들 및 시스템들은 가령, 2014년 6월 26일자로 제출된 U.S. 가특허 출원 번호 62/017,808 그리고 2014년 10월 29일자로 제출된 U.S. 가특허 출원 번호 62/072,214에서 제공되며, 이들 출원은 모든 목적을 위하여 이들 전문이 여기에 참고자료로 편입된다.
따라서, 주어진 서열 판독이 맵핑되는 서열 영역들 사이의 공통 바코드 서열에 대한 적절한 임계치 값은 주어진 서열 판독이 오염 판독임을 확인하도록 설명될 수 있고, 이때 오염 판독은 상기 게놈의 공지의 이웃 부분에 연계되지 않는다. 예를 들면, 주어진 바코드화된 단편 맵에 대한 서열 영역이 상기 서열 영역에 매핑가능한 전체 바코드화된 단편 판독의 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 19% 미만, 18% 미만, 17% 미만, 16% 미만, 15% 미만, 14% 미만, 13% 미만, 12% 미만, 11% 미만, 10% 미만, 9% 미만, 8% 미만, 7% 미만, 6% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 1% 미만, 0.5% 미만, 0.1% 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 0.001% 미만, 0.0005% 미만, 0.0001% 미만, 또는 심지어 미만인 상기 서열 영역 사이에 공통 바코드 서열을 가지는 바코드화된 단편들을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 식별될 수 있다.
서열 구조로부터 오염 판독을 제거하면, 핵산 시료의 서열을 생성함에 있어서 정확성이 개선될 수 있다. 예를 들면, 상기 오염 판독을 확인하고, 이를 상기 핵산 시료의 서열 생성으로부터 제거함으로써, 최소한 75%, 최소한 80%, 최소한 81%, 최소한 82%, 최소한 83%, 최소한 84%, 최소한 85%, 최소한 86%, 최소한 87%, 최소한 88%, 최소한 89%, 최소한 90%, 최소한 91%, 최소한 92%, 최소한 93%, 최소한 94%, 최소한 95%, 최소한 96%, 최소한 97%, 최소한 98%, 최소한 99%, 최소한 99.9%, 최소한 99.99%, 최소한 99.999%, 최소한 99.9999% 또는 더 높은 정확성을 가지고 서열이 생성될 수 있다.
IX. 컴퓨터 제어 시스템들
본 명세서는 본 명세서에서 제공된 방법들을 실행하도록 프로그램된 또는 설정된 컴퓨터 시스템들을 제공하는데, 이를 테면, 예를 들면, 핵산 시퀀싱 ( 낮은 투입/적은 양의 핵산의 핵산 시퀀싱) 방법, 획득된 시퀀싱 데이터의 분석 및 해석 방법 (가령, 본 명세서에서 설명된 응용을 포함하는, 이를 테면 진단 질환의 탐지, 태아 이수성의 확인, 법의학적 적용, 미생물군유전체 특징화, 환경 테스트), 및/또는 서열 어셈블리 전 또는 동안 오염 시퀀싱 판독의 확인 및 쳐과를 위한 방법들을 제공한다. 이러한 컴퓨터 시스템의 예는 도 5에서 제시된다. 도 5에 나타낸 바와 같이, 컴퓨터 시스템 501은 중앙 처리 장치 (CPU, 본원에서 또한 "프로세서" 및 "컴퓨터 프로세서") 505를 포함하고, 이것은 단일 코어 또는 멀티 코어 프로세서, 또는 병렬 처리를 위한 복수의 프로세서일 수 있다. 컴퓨터 시스템 501은 또한, 메모리 또는 메모리 위치 510 (가령, 무작위 접근 메모리, 판독 전용 메모리, 플래시 메모리), 전자 기억 장치 515 (가령, 하드 디스크), 하나 또는 그 이상의 다른 시스템과 통신하기 위한 통신 인터페이스 520 (가령, 네트워크 어댑터), 그리고 주변 장치 525, 예를 들면, 캐시, 다른 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터를 포함한다. 메모리 510, 기억 장치 515, 인터페이스 520 및 주변 장치 525는 통신 버스 (연속선), 예를 들면, 마더보드를 통해 CPU 505와 통신한다. 기억 장치 515는 데이터를 저장하기 위한 데이터 기억 장치 (또는 데이터 저장소)일 수 있다. 컴퓨터 시스템 501은 통신 인터페이스 520의 도움으로 컴퓨터 네트워크 ("네트워크") 530에 작동가능하게 연계될 수 있다. 네트워크 530은 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 네트워크 530은 일부 경우에, 전기통신 및/또는 데이터 네트워크이다. 네트워크 530은 하나 또는 그 이상의 컴퓨터 서버를 포함할 수 있는데, 이들은 분산 컴퓨팅, 예를 들면, 클라우드 컴퓨팅을 가능하게 할 수 있다. 네트워크 530은 일부 경우에, 컴퓨터 시스템 501의 도움으로, 개인간 네트워크를 실행할 수 있는데, 이것은 컴퓨터 시스템 501에 연계된 장치가 고객 또는 서버로서 행동할 수 있게 할 수 있다.
CPU 505는 일련의 기계-판독가능한 명령을 실행할 수 있는데, 이들은 프로그램 또는 소프트웨어에서 구현될 수 있다. 명령은 메모리 위치, 예를 들면, 메모리 510 내에 저장될 수 있다. CPU 505에 의해 수행된 작업의 실례는 페치, 명령어 해석, 명령어 실행, 그리고 라이트백을 포함할 수 있다. 기억 장치 515는 파일, 예를 들면, 드라이버, 라이브러리 및 저장된 프로그램을 저장할 수 있다. 기억 장치 515는 사용자 데이터, 예를 들면, 사용자 선호 및 사용자 프로그램을 저장할 수 있다. 컴퓨터 시스템 501은 일부 경우에, 컴퓨터 시스템 501의 외부에 있는, 예를 들면, 인트라넷 또는 인터넷을 통해 컴퓨터 시스템 501과 통신하는 원격 서버 상에 위치하는 하나 또는 그 이상의 추가 데이터 기억 장치를 포함할 수 있다. 컴퓨터 시스템 501은 네트워크 530을 통해 하나 또는 그 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들면, 컴퓨터 시스템 501은 사용자(가령, 작업자)의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 실례는 개인용 컴퓨터 (가령, 휴대용 PC), 슬레이트 또는 테블릿 PC (가령, Apple® iPad, Samsung® Galaxy Tab), 전화기, 스마트폰 (가령, Apple® iPhone, 안드로이드에서 이용가능한 장치, Blackberry®), 또는 개인 휴대용 단말기를 포함한다. 사용자는 네트워크 530을 통해 컴퓨터 시스템 501에 접근할 수 있다.
본원에서 설명된 바와 같은 방법은 컴퓨터 시스템 501의 전자 저장 위치 상에, 예를 들면, 예로서, 메모리 510 또는 전자 기억 장치 515 상에 저장된 기계 (가령, 컴퓨터 프로세서) 실행가능한 코드에 의하여 실행될 수 있다. 기계 실행가능한 또는 기계 판독가능한 코드는 소프트웨어의 형태에서 제공될 수 있다. 이용 동안, 코드는 프로세서 505에 의해 실행될 수 있다. 일부 경우들에 있어서, 코드는 기억 장치 515로부터 회수되고, 그리고 프로세서 505에 의한 용이한 접근을 위해 메모리 510 상에 저장될 수 있다. 일부 상황에서, 전자 기억 장치 515는 배제될 수 있고, 그리고 기계-실행가능 명령은 메모리 510 상에 보관된다. 코드는 이러한 코드를 실행하도록 개조된 프로세서를 갖는 기계용으로 미리 편집되고 설정될 수 있거나, 또는 실행 시간 동안 편집될 수 있다. 코드는 이러한 코드가 미리 편집된 또는 편집된 그대로 방식으로 실행할 수 있게 하도록 선별될 수 있는 프로그래밍 언어에서 공급될 수 있다.
본원에서 제공된 시스템 및 방법, 예를 들면, 컴퓨터 시스템 501의 측면들은 프로그래밍에서 구현될 수 있다.   이러한 기술의 다양한 측면은 전형적으로, 한 유형의 기계 판독가능 매체에서 운반되거나 또는 구현되는 기계 (또는 프로세서) 실행가능한 코드 및/또는 연관된 데이터의 형태에서 "생성물" 또는 "제조 물품"으로서 생각될 수 있다. 기계-실행가능 코드는 전자 기억 장치, 예를 들면, 메모리 (가령, 판독 전용 메모리, 무작위 접근 메모리, 플래시 메모리) 또는 하드 디스크 상에 저장될 수 있다. "저장" 유형 매체는 컴퓨터, 프로세서 또는 기타 유사한 것의 임의의 또는 모든 실재적인 메모리, 또는 이의 연관된 모듈, 예를 들면, 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 기타 등등을 포함할 수 있는데, 이들은 임의의 시점에서 소프트웨어 프로그래밍을 위한 비-일시적인 저장을 제공할 수 있다.   소프트웨어의 전부 또는 일부는 때때로, 인터넷 또는 다양한 다른 전기통신 네트워크를 통해 통신될 수 있다.   수 있다. 이런 통신은 예로서, 한 컴퓨터 또는 프로세서로부터 다른 것으로, 예를 들면, 관리 서버 또는 주컴퓨터로부터 응용 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다.  따라서, 소프트웨어 요소를 보유할 수 있는 다른 유형의 매체는 예로서, 국부 장치 사이에, 유선 및 광학적 지상통신선 네트워크를 통해, 그리고 다양한 에어-링크 위에서 물리적 인터페이스를 교차하여 이용된 광학파, 전기파 및 전자기파를 포함한다.  이런 파를 운반하는 물리적 요소, 예를 들면, 유선 또는 무선 링크, 광회선 또는 기타 유사한 것 역시 소프트웨어를 보유하는 매체로서 고려될 수 있다.  본 명세서에서 이용된 바와 같이, 비-일시적인, 실재적인 "저장" 매체에 한정되지 않으면, 용어, 예를 들면, 컴퓨터 또는 기계 "판독가능 매체"는 명령을 실행을 위한 프로세서에 제공하는데 참여하는 임의의 매체를 지칭한다.
따라서, 기계 판독가능 매체, 예를 들면, 컴퓨터-실행가능 코드는 실재적인 저장 매체, 반송파 매체 또는 물리적 전파 매체를 포함하지만 이들에 한정되지 않는 많은 형태를 취할 수 있다.   비휘발성 저장 매체는 예로서, 광학 디스크 또는 자기 디스크, 이를 테면, 임의의 컴퓨터(들) 또는 기타 유사한 것에서 임의의 저장 장치를 포함한다.  휘발성 저장 매체는 동적 메모리, 이를 테면, 이런 컴퓨터 플랫폼의 주기억장치를 포함한다.   실재적인 전송 매체는 동축 케이블; 구리선 및 컴퓨터 시스템 내에 버스를 포함하는 와이어를 비롯한 광섬유를 포함한다.   반송파 전송 매체는 전기 또는 전자기 신호, 또는 음향 또는 광파, 예를 들면, 고주파 (RF) 및 적외선 (IR) 데이터 통신 동안 산출된 것들의 형태를 취할 수 있다.  컴퓨터-판독가능 매체의 통상적인 형태는 이런 이유로, 예로서 다음을 포함한다: 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자성 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 종이 테이프, 구멍의 패턴을 갖는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 데이터 또는 명령을 수송하는 반송파, 이런 반송파를 수송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 임의의 다른 매체.   이들 형태의 컴퓨터 판독가능 매체 중에서 다수는 하나 또는 그 이상의 명령의 하나 또는 그 이상의 연속을 실행을 위한 프로세서로 운반하는데 관련될 수 있다.
컴퓨터 시스템 501은 예를 들면, 컴퓨터 시스템 501에 연결된 핵산 시퀀싱 장치의 결과 또는 판독을 제공하기 위하여 사용자 인터페이스(UI)를 포함할 수 있는 전자 디스플레이 535를 포함하거나 또는 이와 통신할 수 있다. 이러한 판독은 핵산 시퀀싱 판독, 이를 테면 주어진 핵산 시료의 핵산 염기 서열을 포함할 수 있다. UI는 이러한 판독의 용도 및 이러한 판독과 수반된 임의의 통계학적 데이터를 디스플레이하는데 또한 이용될 수 있다. UI의 실례는 제한 없이, 그래픽 사용자 인터페이스 (GUI) 및 웹-기초된 사용자 인터페이스를 포함한다. 전자 디스플레이 535는 컴퓨터 모티터, 또는 정기용량성 또는 저항성 터치스크린일 수 있다.
X. 실시예
실시예 1: 세포-없는 태아 DNA를 분석함으로써, 이수성의 분석
8% 미만 세포-없는 태아 DNA가 함유된 혈액 시료를 임산부에서 얻는다. 세포-없는 혈장 DNA는 혈액 시료로부터 추출되었다. 상기 추출된 세포-없는 DNA 시료들은 그 다음 방출가능하도록 기능 올리고뉴클레오티드에 부착된 비드는 다중 작은 방울로 공동-분배된다. 각각 작은 방울 안에 DNA 시료들은 방출된 올리고뉴클레오티드에 의해 증폭된다. 상기 앰플리콘은 그 다음 푸울되고, 추가 증폭 공정을 받은 후, 증폭된 산물의 분석 및 시퀀싱이 이어진다. 파티션 안에 DNA 시료들에 부착된 독특한 바코드는 생성된 서열을 이들의 각 유전적 기원 (가령, 염색체)에 귀속시킬 수 있다. 각각 염색체에 매핑된 서열 수를 헤아림으로써, 태아 이수성에 기여하는 모체 혈장 안의 임의의 염색체의 과다 또는 과소 제공이 탐지된다.
실시예 2: 순환 종양-연합된 DNA의 탐지에 의해 암 환자에서 전이 진행 모니터
전이성 전립선 암 환자로부터 1% 미만 순환 종양 세포들이 포함된 혈액 시료를 수집하고, 상기 혈액 시료로부터 혈장 DNA가 단리된다. 그 다음 상기 추출된 DNA 시료는 예정된 시료/파티션 비율로 다수의 반응 용적 또는 파티션로 분배되어, 각 파티션은 단지 하나의 개별적 표적 DNA가 포함된다. 그 다음 상기 분배된 DNA 시료는 다음을 포함하는 몇 가지 공정 단계를 거친다: (1) 시료-비드 혼합물을 만들기 위하여 파티션 안으로 방출가능하도록 연계된 올리고뉴클레오티드 테그를 가진 다수의 비드를 분배하고, (2) 바코드 서열 및 무작위 N-mer 서열이 포함된 기능 올리고뉴클레오티드 서열을 파티션 안으로 방출시키고, (3) 각 파티션 안에 무작위 N-mer를 가진 시료를 증폭시키고, 그리고 (4) 앰플리콘을 시퀀싱하고, 그리고 각 앰플리콘 안에 포함된 독특한 바코드 서열에 근거하여 상기 서열 판독을 분석한다. 그 다음 종양 환자의 혈액에서 순환 종양-연합된 DNA의 농도는 대조의 것과 비교한다. 발생된 순환 종양-연합된 DNA는 상기 암의 추가 진행을 나타낸다.
실시예 3: 리보좀 DNA 시퀀싱에 의해 환경적 박테리아 분리주(isolates)의 거대 콜렉션의 분석
박테리아 분리주의 콜렉션은 환경 원천으로부터 얻고, 테스트된다. 각 분리주로부터 DNA가 추출되고, 다중 반응 용적 또는 파티션으로 분배되어, 각 파티션은 특이적 박테리아 분리주로부터 기인된 DNA 시료가 포함된다. 독특한 바코드 서열 및 16s rDNA 프라이머가 포함된 기능성 올리고뉴클레오티드가 부착된 다수의 비드는 그 다음 파티션에 추가되어, 각 파티션 안에 DNA 시료들의 혼합물이 형성된다. 그 다음 각 파티션 안에 추출된 DNA 시료는 범용 16s rDNA 프라이머와 함께 증폭된다. 상기 증폭된 산물은 서열화되고, 데이터베이스에서 이용가능한 것들과 비교된다. 데이터베이스에서 원형(prototype) 균주 서열의 것과 ≥99%의 서열 유사성으로 종(species) 수준에 대한 규정이 정의되고, 그리고 데이터베이스에서 원형(prototype) 균주 서열의 것과 ≥97%의 서열 유사성으로 속(genus) 수준에 대한 규정이 정의된다. 상기 시퀀싱 정보를 이용하여, 박테리아 분리주의 콜렉션 안에 각 균주 백분율이 결정된다.
실시예 4: 세포 핵산을 분석
다중 세포 계통 (NA12878, NA12877, NA12882, NA20847)으로부터 Qiagen High Molecular Weight MagAttract DNA Kit를 이용하여 게놈 DNA가 추출된다.  게놈 DNA는 Qubit 시스템을 이용하여 정량화되고, 3가지 상이한 출발량의 DNA를 에멸젼의 작은 방울로 분배시키도록 낮은 농도로 적정되었다. 바코드화된 비드와 함께 2.4ng, 1.2ng 또는 0.6ng.  바코드화된 시퀀싱 라이브러리는 도 4에 나타낸 그리고 본 명세서의 도처에 설명된 것과 유사한 방식으로 작은 방울 에멸젼 안에 분비되고, 상기 에멸젼이 파괴되고, 작은 방울 내용물이 푸울되고, 상기 시퀀싱 라이브러리는 Agilent SureSelect Target Enrichment (Human V5)를 이용한 하이브리드 캡쳐에 의해 농축되었다.  라이브러리는 ~160X 온-타켓 시퀀싱 깊이로 서열화된다.  변이체-콜링(Variant-calling)은 Long Ranger 소프트웨어를 이용하여 실행된다.   간략하게 설명하자면, 시퀀싱 판독은 BWA MEM를 이용하여 배열되고, 위치에 의해 분류되고, PCR 복사본에 대하여 표지되고, 그리고 Freebayes 소프트웨어 패키지를 이용하여 SNPs, 작은 삽입 및 결손을 결정한다.  SNPs, 삽입 및 결손의 민감성 및 양성 예측치(PPV)에 대하여 이미 정립된 기본 값에 대하여 시료들이 특징화된다.  SNPs의 경우, 민감도 및 PPV는 모두 > 95%이며, 삽입 및 결손의 경우, PPV는 > 90%이며, 민감도는 >70%이다.
본 발명의 바람직한 구체예들이 제시 및 설명되며, 이들 구체예는 오로지 예시를 위하여 제시된 것이라는 사실은 당업자에게 자명할 것이다. 명세서 안에 제공된 특정 실시예에 의해 본 발명이 제한되는 것은 아니다. 본 발명은 전술한 명세서를 참고하여 설명되지만, 본 명세서의 설명 및 예시는 제한된 의미로 간주된다는 것을 의미하지 않는다. 본 발명을 벗어나지 않고, 다수의 변형, 변화 및 치환이 일어날 수 있다. 더욱이, 본 발명의 모든 측면은 다양한 조건 및 변수에 따라 본 명세서의 특정 설명, 형상 또는 상대적 비율에 제한되지 않는 것으로 이해될 수 있다. 본 명세서에서 설명된 발명의 구체예에 다양한 대안이 본 발명의 실시에서 이용될 수 있음을 인지해야 한다. 따라서 본 발명은 이러한 대안, 변형, 변이 또는 등가체를 또한 포괄할 수 있는 것으로 간주된다. 다음의 청구범위는 본 발명의 범위를 한정시키고, 이들 청구범위 내에 있는 방법 및 구성 그리고 이의 등가체가 포함된다.

Claims (120)

  1. 다음을 포함하는, 핵산을 분석하는 방법:
    (a) 핵산 시료로부터 유도된 핵산 콜렉션을 제공하고, 이때 상기 핵산 콜렉션은 50 나노그램 (ng) 미만의 양으로 핵산 분자들을 포함하며;
    (b) 혼합물을 형성하기 위하여 비드에 방출가능하도록 연결되는 다수의 올리고뉴클레오티드를 핵산 콜렉션에 복합시키고;
    (c) 다수의 파티션으로 상기 혼합물을 분배하고, 그리고 상기 파티션 안에 비드로부터 올리고뉴클레오티드를 방출시키고;
    (d) 파티션 안에 상기 핵산 콜렉션을 증폭시켜 상기 핵산 콜렉션의 증폭 생성물이 형성되며;
    (e) 상기 핵산 콜렉션과 증폭 생성물을 푸울링하여, 푸울된 혼합물을 만들고; 그리고
    (f) 상기 푸울된 혼합물 안에서 핵산의 최소 일부분의 핵산 서열이 탐지된다.
  2. 청구항 1에 있어서, 이때, (f)에서 90% 이상의 정확성에서 완료되는, 방법.
  3. 청구항 2에 있어서, 이때, (f)에서 95% 이상의 정확성에서 완료되는, 방법.
  4. 청구항 3에 있어서, 이때, (f)에서 99% 이상의 정확성에서 완료되는, 방법.
  5. 청구항 1에 있어서, 이때, (f)에서 탐지는 상기 핵산 콜렉션 안에 최소한 90%의 상기 핵산의 탐지를 포함하는, 방법.
  6. 청구항 1에 있어서, 이때, (f)에서 탐지는 상기 핵산 콜렉션 안에 작은 집단(minor population)의 서열 탐지를 포함하고, 이때 작은 집단은 상기 핵산 콜렉션의 50% 미만으로 구성되는, 방법.
  7. 청구항 6에 있어서, 이때 상기 작은 집단은 상기 핵산 콜렉션의 25% 미만으로 구성되는, 방법.
  8. 청구항 7에 있어서, 이때 상기 작은 집단은 상기 핵산 콜렉션의 10% 미만으로 구성되는, 방법.
  9. 청구항 8에 있어서, 이때 상기 작은 집단은 상기 핵산 콜렉션의 5% 미만으로 구성되는, 방법.
  10. 청구항 1에 있어서, 이때 그 양은 40 ng 미만인, 방법.
  11. 청구항 10에 있어서, 이때 그 양은 20 ng 미만인, 방법.
  12. 청구항 11에 있어서, 이때 그 양은 10 ng 미만인, 방법.
  13. 청구항 12에 있어서, 이때 그 양은 5 ng 미만인, 방법.
  14. 청구항 13에 있어서, 이때 그 양은 1 ng 미만인, 방법.
  15. 청구항 14에 있어서, 이때 그 양은 0.1 ng 미만인, 방법.
  16. 청구항 1에 있어서, 이때 다수의 올리고뉴클레오티드 각각은 최소한 하나의 불변 영역과 하나의 가변 영역을 포함하는, 방법.
  17. 청구항 16에 있어서, 이때 상기 불변 영역은 바코드 서열을 포함하는, 방법.
  18. 청구항 17에 있어서, 이때 상기 바코드 서열의 길이는 약 6개 뉴클레오티드 내지 약 20개의 뉴클레오티드인, 방법.
  19. 청구항 16에 있어서, 이때 상기 가변 영역은 프라이머 서열을 포함하는, 방법.
  20. 청구항 19에 있어서, 이때, (d)에서 다수의 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능을 하는, 방법.
  21. 청구항 1에 있어서, 이때 상기 올리고뉴클레오티드는 하나 또는 그 이상의 자극에 노출시 상기 비드로부터 방출되는, 방법.
  22. 청구항 21에 있어서, 이때 상기 자극은 온도, pH, 빛, 화학 종, 및/또는 환원제를 포함하는, 방법.
  23. 청구항 22에 있어서, 이때 상기 자극은 디티오트레이톨 (DTT) 또는 트리스(2-카르복실에틸)포스핀 (TCEP)이 포함된 환원제를 포함하는, 방법.
  24. 청구항 1에 있어서, 이때 상기 파티션은 작은 방울, 미소캡슐, 웰 또는 튜브를 포함하는, 방법.
  25. 청구항 1에 있어서, 이때 상기 파티션은 작은 유체 방울인, 방법.
  26. 청구항 25에 어서, 이때 상기 작은 유체 방울은 유중수적형 에멸젼 안에 작은 수성 방울인, 방법.
  27. 청구항 1에 있어서, 이때, (c)에서 상기 파티션은 미세유동적 장치에 의해 생성되는, 방법.
  28. 청구항 1에 있어서, 이때 상기 핵산 콜렉션은 액체로부터 유도된, 방법.
  29. 청구항 28있어서, 이때 상기 액체는 혈액, 혈장, 혈청, 또는 소변을 포함하는, 방법.
  30. 청구항 28있어서, 이때 상기 핵산 콜렉션의 최소한 부분집합은 하나 또는 그 이상의 순환 종양 세포들로부터 유도된, 방법.
  31. 청구항 28 또는 30에 있어서, 이때 상기 핵산의 부분 집합은 종양으로부터 유도된, 방법.
  32. 청구항 1에 있어서, 이때 상기 핵산 콜렉션은 조직 생검으로부터 유도된, 방법.
  33. 청구항 1에 있어서, 이때 상기 핵산 콜렉션은 태아 핵산을 포함하는, 방법.
  34. 청구항 33에 있어서, 이때 상기 핵산 콜렉션의 핵산의 5% 미만은 태아 핵산을 포함하는, 방법.
  35. 청구항 1에 있어서, 이때 상기 핵산 시료는 세포 시료를 포함하는, 방법.
  36. 청구항 35에 있어서, 이때 상기 세포 시료는 5% 미만의 순환 종양 세포들을 포함하는, 방법.
  37. 청구항 35에 있어서, 이때 상기 세포 시료는 5% 미만의 종양 세포들을 포함하는, 방법.
  38. 청구항 1에 있어서, 이때 상기 핵산 시료는 살아있는 시료, 비-보존된 시료, 보존된 시료, 방부처리된 시료 및 고정된 시료로 구성된 집단에서 선택된 시료로부터 유도된, 방법.
  39. 청구항 38에 있어서, 이때 상기 시료는 매립된 시료인, 방법.
  40. 청구항 39에 있어서, 이때 상기 시료는 포름알데히드 고정된 그리고 파라핀 매립된 시료인, 방법.
  41. 청구항 31에 있어서, 이때 상기 하나 또는 그 이상의 순환 종양 세포들은 비-보존된 시료로부터 수득되거나, 또는 포름알데히드 고정된 그리고 파라핀 매립된 시료로부터 수득되는, 방법.
  42. 다음을 포함하는, 핵산을 분석하는 방법:
    a) 혼합물을 형성하기 위하여 비드에 방출가능하도록 연결되는 다수의 올리고뉴클레오티드를 핵산 시료로부터 유도된 핵산 콜렉션에 복합시키고;
    b) 상기 혼합물을 다수의 파티션으로 분배시키고;
    c) 상기 비드로부터 올리고뉴클레오티드를 상기 파티션 안에 방출시키고;
    d) 파티션 안에 상기 핵산 콜렉션을 증폭시켜 상기 핵산 콜렉션의 증폭 생성물이 형성되며;
    e) 상기 핵산 콜렉션과 증폭 생성물을 푸울링하여, 푸울된 혼합물을 만들고; 그리고
    f) 푸울된 혼합물에서 상기 핵산 콜렉션 안에 작은 집단의 핵산 서열을 탐지하고, 이때 작은 집단은 상기 핵산 콜렉션의 50% 미만으로 구성된다.
  43. 청구항 42에 있어서, 이때 상기 작은 집단은 40% 미만으로 구성된, 방법.
  44. 청구항 42에 있어서, 이때 상기 작은 집단은 30% 미만으로 구성된, 방법.
  45. 청구항 42에 있어서, 이때 상기 작은 집단은 20% 미만으로 구성된, 방법.
  46. 청구항 42에 있어서, 이때 상기 작은 집단은 10% 미만으로 구성된, 방법.
  47. 청구항 42에 있어서, 이때 상기 작은 집단은 5% 미만으로 구성된, 방법.
  48. 청구항 42에 있어서, 이때 상기 작은 집단은 1% 미만으로 구성된, 방법.
  49. 청구항 42에 있어서, 이때 상기 작은 집단은 0.1% 미만으로 구성된, 방법.
  50. 청구항 42에 있어서, 이때 다수의 올리고뉴클레오티드 각각은 최소한 하나의 불변 영역과 하나의 가변 영역을 포함하는, 방법.
  51. 청구항 50에 있어서, 이때 상기 불변 영역은 바코드 서열을 포함하는, 방법.
  52. 청구항 50에 있어서, 이때 상기 가변 영역은 프라이머 서열을 포함하는, 방법.
  53. 청구항 52에 있어서, 이때, (d)에서 다수의 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능을 하는, 방법.
  54. 청구항 42에 있어서, 이때 상기 올리고뉴클레오티드는 하나 또는 그 이상의 자극에 노출시 상기 비드로부터 방출되는, 방법.
  55. 청구항 54에 있어서, 이때 상기 자극은 온도, pH, 빛, 화학 종, 및/또는 환원제를 포함하는, 방법.
  56. 청구항 42에 있어서, 이때 상기 파티션은 작은 방울, 미소캡슐, 웰 또는 튜브를 포함하는, 방법.
  57. 청구항 42에 있어서, 이때, (b)에서 상기 파티션은 미세유동적 장치에 의해 생성되는, 방법.
  58. 청구항 42에 있어서, 이때 상기 핵산 콜렉션은 액체로부터 유도된, 방법.
  59. 청구항 58에 있어서, 이때 상기 액체는 혈액, 혈장, 혈청, 또는 소변을 포함하는, 방법.
  60. 청구항 42에 있어서, 이때 상기 핵산 콜렉션은 조직 생검으로부터 유도된, 방법.
  61. 청구항 42에 있어서, 이때 상기 작은 집단은 종양 핵산을 포함하는, 방법.
  62. 청구항 42에 있어서, 이때 상기 작은 집단은 태아 핵산을 포함하는, 방법.
  63. 청구항 42에 있어서, 이때 상기 작은 집단은 순환 종양 세포 핵산을 포함하는, 방법.
  64. 다음을 포함하는, 핵산을 분석하는 방법:
    a) 핵산 시료로부터 유도된 핵산 콜렉션을 제공하고, 이때 상기 핵산 콜렉션은 50 나노그램 (ng) 미만의 양으로 핵산 분자들을 포함하며;
    b) 상기 핵산 콜렉션에 다수의 올리고뉴클레오티드를 복합시켜 혼합물을 만들고, 이때 다수의 올리고뉴클레오티드 각각은 최소한 하나의 불변 영역과 가변 영역을 포함하며, 이 불변 영역은 바코드 서열을 포함하고;
    c) 상기 혼합물을 다수의 파티션으로 분배하고, 상기 파티션 안에 핵산 콜렉션을 증폭시켜 상기 핵산 콜렉션의 증폭 생성물이 형성되며;
    d) 상기 핵산 콜렉션과 증폭 생성물을 푸울링하여, 푸울된 혼합물을 만들고; 그리고
    e) 최소한 90%의 민감도에서 푸울된 혼합물 안에 핵산의 최소 일부분의 핵산 서열을 탐지한다.
  65. 청구항 64에 있어서, 이때 상기 양은 40 ng 미만인, 방법.
  66. 청구항 65에 있어서, 이때 상기 양은 20 ng 미만인, 방법.
  67. 청구항 66에 있어서, 이때 상기 양은 10 ng 미만인, 방법.
  68. 청구항 67에 있어서, 이때 상기 양은 5 ng 미만인, 방법.
  69. 청구항 68에 있어서, 이때 상기 양은 1 ng 미만인, 방법.
  70. 청구항 69에 있어서, 이때 상기 양은 0.1 ng 미만인, 방법.
  71. 청구항 64에 있어서, 이때 상기 가변 영역은 프라이머 서열을 포함하는, 방법.
  72. 청구항 71에 있어서, 이때, (c)에서 다수의 올리고뉴클레오티드는 핵산 콜렉션의 증폭화에서 프라이머로 기능을 하는, 방법.
  73. 청구항 64에 있어서, 이때, (e)에서 탐지는 최소한 95%의 민감도에서 푸울된 혼합물 안에 핵산의 최소 일부분의 핵산 서열을 탐지하는 것을 포함하는, 방법.
  74. 청구항 64에 있어서, 이때, (e)에서 탐지는 최소한 99%의 민감도에서 푸울된 혼합물 안에 핵산의 최소 일부분의 핵산 서열을 탐지하는 것을 포함하는, 방법.
  75. 다음을 포함하는 핵산 서열을 분석하는 방법:
    a) 핵산 시료로부터 생성된 핵산 분자들이 포함된 파티션을 제공하고;
    b) 상기 파티션의 핵산 분자들을 핵산 혼합물로 푸울링시키고;
    c) 상기 핵산 혼합물을 핵산 시퀀싱시켜, 상기 핵산 분자들의 핵산 서열이 포함된 시퀀싱 판독이 생성되며;
    d) 프로그램화된 컴퓨터 프로세서를 이용하여 (i) 상기 시퀀싱 판독을 분석하고, 그리고 (ii) 상기 시퀀싱 판독에서 상기 핵산 혼합물 안에 오염 핵산 분자와 연합된 최소한 하나의 오염 판독을 식별해내고;
    e) 상기 오염 판독은 상기 시퀀싱 판독으로부터 제거되며; 그리고
    f) 상기 시퀀싱 판독으로부터 오염 판독이 제거된, 상기 핵산 시료의 서열이 생성된다.
  76. 청구항 75에 있어서, 이때 최소한 하나의 오염 판독은 오염 핵산 분자들과 연합된 다수의 오염 판독을 포함하는, 방법.
  77. 청구항 75에 있어서, 이때 상기 서열은 최소한 90%의 정확도로 생성되는, 방법.
  78. 청구항 77에 있어서, 이때 상기 서열은 최소한 95%의 정확도로 생성되는, 방법.
  79. 청구항 78에 있어서, 이때 상기 서열은 최소한 99%의 정확도로 생성되는, 방법.
  80. 청구항 75에 있어서, 이때 상기 파티션은 작은 유체 방울을 포함하는, 방법.
  81. 청구항 80에 있어서, 이때 상기 작은 유체 방울은 유중수적형 에멸젼 안에 작은 수성 방울을 포함하는, 방법.
  82. 청구항 75에 있어서, 이때 상기 오염 판독은 (1) 상기 시퀀싱 판독의 부분집합들중에서 서열 중첩(들)을 결정하고, 그리고 (2) 상기 시퀀싱 판독중 주어진 하나에 대한 중첩(들)이 모든 부분집합들에 대하여 50% 미만인 경우, 확인되는, 방법.
  83. 청구항 82에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 대하여 25% 미만인 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  84. 청구항 83에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 대하여 10% 미만인 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  85. 청구항 84에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 대하여 5% 미만인 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  86. 청구항 85에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 대하여 1% 미만인 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  87. 청구항 86에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 대하여 0.1% 미만인 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  88. 청구항 87에 있어서, 이때 (2) 상기 서열 판독중 주어진 하나에 대한 서열 중첩(들)이 모든 부분집합들에 중첩되지 않는 경우, 오염 판독이 확인되는 것을 더 포함하는, 방법.
  89. 청구항 75에 있어서, 이때 상기 오염 판독은 (1) 상기 시퀀싱 판독을 기준과 비교하고, 그리고 (2) 주어진 시퀀싱 판독이 기준과 50% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인됨으로써, 오염 판독이 식별되는, 방법.
  90. 청구항 89에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 25% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  91. 청구항 90에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 10% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  92. 청구항 91에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 5% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  93. 청구항 92에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 1% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  94. 청구항 93에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 0.1% 미만으로 중첩되면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  95. 청구항 94에 있어서, 이때 (2) 주어진 시퀀싱 판독이 기준과 중첩되지 않으면, 상기 시퀀싱 판독의 주어진 시퀀싱 판독은 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  96. 청구항 75에 있어서, 이때 상기 오염 판독은 (1) 상기 시퀀싱 판독을 서로 비교하여, 상기 시퀀싱 판독중에서 서열 중첩(들)을 확인하고, 그리고 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 50% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 식별되는, 방법.
  97. 청구항 96에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 25% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  98. 청구항 97에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 10% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  99. 청구항 98에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 5% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  100. 청구항 99에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 1% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  101. 청구항 100에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독과의 중첩이 0.1% 미만인 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  102. 청구항 101에 있어서, 이때 (2) 이의 서열이 상기 시퀀싱 판독중 다른 시퀀싱 판독의 서열과 중첩되지 않는 경우, 상기 시퀀싱 판독중 주어진 하나는 오염 판독으로 확인되는 것을 더 포함하는, 방법.
  103. 청구항 75에 있어서, 이때 a) 상기 시퀀싱 판독은 상기 바코드화된 단편들 또는 이의 복사체들의 핵산 서열이 포함된 바코드화된 단편 판독을 포함한다.
  104. 청구항 103에 있어서, 이때, c)에서 상기 시퀀싱 판독은 상기 바코드화된 단편들 또는 이의 복사체들의 핵산 서열이 포함된 바코드화된 단편 판독을 포함하는, 방법.
  105. 청구항 104에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 20% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  106. 청구항 105에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 15% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  107. 청구항 106에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 10% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  108. 청구항 107에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 5% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  109. 청구항 108에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 3% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  110. 청구항 109에 있어서, 이때 주어진 바코드화된 단편 판독이 그리는 서열 영역이 상기 서열 영역으로 매핑될 수 있는 전체 바코드화된 단편 판독의 0.1% 미만의 서열 영역간에 공통적인 바코드 서열을 가진 바코드화된 단편 판독을 매핑한다면, 상기 바코드화된 단편 판독의 주어진 하나는 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  111. 청구항 75에 있어서, 이때 상기 서열 판독을 이들의 서열 영역(들)으로 매핑하고, 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 서열 판독의 또다른 판독이 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독이 또다른 판독과 10개 미만이 중첩되는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  112. 청구항 111에 있어서, 이때 상기 서열 판독을 이들의 서열 영역(들)으로 매핑하고, 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 서열 판독의 또다른 판독이 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독이 또다른 판독과 5개 미만이 중첩되는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  113. 청구항 112에 있어서, 이때 상기 서열 판독을 이들의 서열 영역(들)으로 매핑하고, 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 서열 판독의 또다른 판독이 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독이 또다른 판독과 3개 미만이 중첩되는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  114. 청구항 113에 있어서, 이때 상기 서열 판독을 이들의 서열 영역(들)으로 매핑하고, 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 서열 판독의 또다른 판독이 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독이 또다른 판독과 1개 미만이 중첩되는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  115. 청구항 114에 있어서, 이때 상기 서열 판독을 이들의 서열 영역(들)으로 매핑하고, 그리고 이의 서열 영역(들)에 대해 매핑될 경우, 주어진 서열 판독은 서열 판독의 또다른 판독이 이들의 서열 영역(들)에 대해 매핑될 때, 상기 서열 판독이 또다른 판독과 중첩이 없는 경우, 상기 서열 판독의 주어진 서열 판독은 오염 판독으로 확인됨으로써, 오염 판독이 확인되는, 방법.
  116. 청구항 75에 있어서, 이때, b)에서 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자들의 1% 미만이 되는, 방법.
  117. 청구항 116에 있어서, 이때, b)에서 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자들의 0.1% 미만이 되는, 방법.
  118. 청구항 117에 있어서, 이때, b)에서 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자들의 0.01% 미만이 되는, 방법.
  119. 청구항 118에 있어서, 이때, b)에서 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자들의 0.001% 미만이 되는, 방법.
  120. 청구항 119에 있어서, 이때, b)에서 상기 핵산 혼합물 안에 오염 핵산 분자의 양은 상기 핵산 혼합물 안에 핵산 분자들의 0.0001% 미만이 되는, 방법.
KR1020167036360A 2014-06-26 2015-06-26 시료 분석용 방법들 및 조성물 KR20170023011A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462017580P 2014-06-26 2014-06-26
US62/017,580 2014-06-26
US201462063870P 2014-10-14 2014-10-14
US62/063,870 2014-10-14
PCT/US2015/038143 WO2015200871A1 (en) 2014-06-26 2015-06-26 Methods and compositions for sample analysis

Publications (1)

Publication Number Publication Date
KR20170023011A true KR20170023011A (ko) 2017-03-02

Family

ID=54929861

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167036360A KR20170023011A (ko) 2014-06-26 2015-06-26 시료 분석용 방법들 및 조성물

Country Status (10)

Country Link
US (2) US20150376605A1 (ko)
EP (1) EP3161161A4 (ko)
JP (1) JP2017523774A (ko)
KR (1) KR20170023011A (ko)
CN (1) CN106574298A (ko)
AU (1) AU2015279619A1 (ko)
CA (1) CA2953473A1 (ko)
IL (1) IL249618A0 (ko)
MX (1) MX2016016898A (ko)
WO (1) WO2015200871A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190017546A (ko) * 2017-08-11 2019-02-20 한국과학기술원 미세유체장치를 이용한 다중유전자 디지털 신호 분석장치 및 이의 분석방법
WO2019212138A1 (ko) * 2018-05-03 2019-11-07 주식회사 셀레믹스 차세대 염기서열 분석을 위한 시료 간 교차 오염 탐색용 내부 검정 물질

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX364957B (es) 2012-08-14 2019-05-15 10X Genomics Inc Composiciones y metodos para microcapsulas.
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US20150376609A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
CN114214314A (zh) 2014-06-24 2022-03-22 生物辐射实验室股份有限公司 数字式pcr条码化
JP2017526046A (ja) 2014-06-26 2017-09-07 10エックス ゲノミクス,インコーポレイテッド 核酸配列アセンブルのプロセス及びシステム
US20160122817A1 (en) 2014-10-29 2016-05-05 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
KR20170106979A (ko) 2015-01-13 2017-09-22 10엑스 제노믹스, 인크. 구조 변이 및 위상 조정 정보를 시각화하기 위한 시스템 및 방법
US10854315B2 (en) 2015-02-09 2020-12-01 10X Genomics, Inc. Systems and methods for determining structural variation and phasing using variant call data
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
EP3262188B1 (en) 2015-02-24 2021-05-05 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
SG11201804086VA (en) 2015-12-04 2018-06-28 10X Genomics Inc Methods and compositions for nucleic acid analysis
SG11201806757XA (en) 2016-02-11 2018-09-27 10X Genomics Inc Systems, methods, and media for de novo assembly of whole genome sequence data
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
WO2018200867A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
US10544413B2 (en) 2017-05-18 2020-01-28 10X Genomics, Inc. Methods and systems for sorting droplets and beads
CN117143960A (zh) 2017-05-18 2023-12-01 10X基因组学有限公司 用于分选液滴和珠的方法和系统
EP3625715A4 (en) 2017-05-19 2021-03-17 10X Genomics, Inc. DATA SET ANALYSIS SYSTEMS AND METHODS
CN116064732A (zh) 2017-05-26 2023-05-05 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
US10357771B2 (en) 2017-08-22 2019-07-23 10X Genomics, Inc. Method of producing emulsions
US10748643B2 (en) 2017-08-31 2020-08-18 10X Genomics, Inc. Systems and methods for determining the integrity of test strings with respect to a ground truth string
US10590244B2 (en) 2017-10-04 2020-03-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
WO2019083852A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. MICROFLUIDIC CHANNEL NETWORKS FOR PARTITIONING
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP3700672B1 (en) 2017-10-27 2022-12-28 10X Genomics, Inc. Methods for sample preparation and analysis
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
WO2019108851A1 (en) 2017-11-30 2019-06-06 10X Genomics, Inc. Systems and methods for nucleic acid preparation and analysis
SG11201907566TA (en) * 2017-12-08 2019-09-27 10X Genomics Inc Methods and compositions for labeling cells
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
CN111378557B (zh) 2018-12-26 2023-06-06 财团法人工业技术研究院 用于产生液珠的管状结构及液珠产生方法
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
EP3924505A1 (en) 2019-02-12 2021-12-22 10X Genomics, Inc. Methods for processing nucleic acid molecules
US11655499B1 (en) 2019-02-25 2023-05-23 10X Genomics, Inc. Detection of sequence elements in nucleic acid molecules
SG11202111242PA (en) 2019-03-11 2021-11-29 10X Genomics Inc Systems and methods for processing optically tagged beads
EP4073241A2 (en) 2019-12-11 2022-10-19 10X Genomics, Inc. Reverse transcriptase variants
US11851700B1 (en) 2020-05-13 2023-12-26 10X Genomics, Inc. Methods, kits, and compositions for processing extracellular molecules
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
WO2024006392A1 (en) * 2022-06-29 2024-01-04 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3591068A1 (en) * 2006-02-02 2020-01-08 The Board of Trustees of the Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
WO2008134153A1 (en) * 2007-04-23 2008-11-06 Advanced Liquid Logic, Inc. Bead-based multiplexed analytical methods and instrumentation
US20120252015A1 (en) * 2011-02-18 2012-10-04 Bio-Rad Laboratories Methods and compositions for detecting genetic material
US9625454B2 (en) * 2009-09-04 2017-04-18 The Research Foundation For The State University Of New York Rapid and continuous analyte processing in droplet microfluidic devices
US9187783B2 (en) * 2010-10-04 2015-11-17 Genapsys, Inc. Systems and methods for automated reusable parallel biological reactions
EP2675819B1 (en) * 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
EP2702175B1 (en) * 2011-04-25 2018-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
EP2737089B1 (en) * 2011-07-29 2017-09-06 Bio-rad Laboratories, Inc. Library characterization by digital assay
US9469874B2 (en) * 2011-10-18 2016-10-18 The Regents Of The University Of California Long-range barcode labeling-sequencing
EP2817418B1 (en) * 2012-02-24 2017-10-11 Raindance Technologies, Inc. Labeling and sample preparation for sequencing
MX364957B (es) * 2012-08-14 2019-05-15 10X Genomics Inc Composiciones y metodos para microcapsulas.
WO2014074611A1 (en) * 2012-11-07 2014-05-15 Good Start Genetics, Inc. Methods and systems for identifying contamination in samples
CA2894694C (en) * 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
KR102436171B1 (ko) * 2013-06-27 2022-08-24 10엑스 제노믹스, 인크. 샘플 처리를 위한 조성물 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190017546A (ko) * 2017-08-11 2019-02-20 한국과학기술원 미세유체장치를 이용한 다중유전자 디지털 신호 분석장치 및 이의 분석방법
WO2019212138A1 (ko) * 2018-05-03 2019-11-07 주식회사 셀레믹스 차세대 염기서열 분석을 위한 시료 간 교차 오염 탐색용 내부 검정 물질

Also Published As

Publication number Publication date
WO2015200871A1 (en) 2015-12-30
EP3161161A1 (en) 2017-05-03
US20150376605A1 (en) 2015-12-31
IL249618A0 (en) 2017-02-28
EP3161161A4 (en) 2018-02-28
CN106574298A (zh) 2017-04-19
CA2953473A1 (en) 2015-12-30
JP2017523774A (ja) 2017-08-24
MX2016016898A (es) 2017-04-25
US20200399631A1 (en) 2020-12-24
AU2015279619A1 (en) 2017-01-12

Similar Documents

Publication Publication Date Title
KR20170023011A (ko) 시료 분석용 방법들 및 조성물
US11414688B2 (en) Processes and systems for preparation of nucleic acid sequencing libraries and libraries prepared using same
KR102175718B1 (ko) 합성 핵산 스파이크-인
JP7182679B2 (ja) 核酸の解析のための方法及び組成物
KR102531677B1 (ko) 개별 세포 또는 세포 개체군으로부터 핵산을 분석하는 방법
Shapiro et al. Single-cell sequencing-based technologies will revolutionize whole-organism science
BR112021006183A2 (pt) análise de múltiplos analitos com o uso de um único ensaio
CN105189748B (zh) 测序免疫组库的方法
JP2017522866A (ja) 核酸配列の分析
US20210062272A1 (en) Systems and methods for using the spatial distribution of haplotypes to determine a biological condition
JP2021511794A (ja) 核酸増幅のための方法
JP2022505050A (ja) プーリングを介した多数の試料の効率的な遺伝子型決定のための方法および試薬
BR112021006234A2 (pt) Bibliotecas de células únicas e núcleos únicos de alto rendimento e métodos de preparo e uso
JP2022500764A (ja) マイクロサテライト不安定性を評価するための方法およびシステム
CN114008199A (zh) 高通量单细胞文库及其制备和使用方法
WO2021248034A2 (en) Methods of detecting mitochondrial diseases
US20240002914A1 (en) Probe-based analysis of nucleic acids and proteins
CN117015617A (zh) 基于探针的核酸和蛋白质分析
NZ760374A (en) High-throughput single-cell transcriptome libraries and methods of making and of using