KR20220011639A - Multipore Determination of the Distribution Fraction of a Polynucleotide Sequence in a Sample - Google Patents
Multipore Determination of the Distribution Fraction of a Polynucleotide Sequence in a Sample Download PDFInfo
- Publication number
- KR20220011639A KR20220011639A KR1020217038017A KR20217038017A KR20220011639A KR 20220011639 A KR20220011639 A KR 20220011639A KR 1020217038017 A KR1020217038017 A KR 1020217038017A KR 20217038017 A KR20217038017 A KR 20217038017A KR 20220011639 A KR20220011639 A KR 20220011639A
- Authority
- KR
- South Korea
- Prior art keywords
- target
- sample
- nanopore
- analyte
- nanopores
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/447—Systems using electrophoresis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/49—Systems involving the determination of the current at a single specific value, or small range of values, of applied voltage for producing selective measurement of one or more particular ionic species
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/60—Detection means characterised by use of a special device
- C12Q2565/631—Detection means characterised by use of a special device being a biochannel or pore
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Urology & Nephrology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Nanotechnology (AREA)
- Hematology (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
본원에는 하나 이상의 나노포어를 갖는 나노포어 센서를 이용하여, 예컨대, 샘플 내 표적 분석물 또는 참조 분석물의 양에 대한 전기 신호를 식별 및 상관에 관한 고유한 오차를 보정함으로써, 샘플 내 표적 분석물(예컨대, 특정 폴리뉴클레오타이드 서열)의 분포분율의 개선된 추정치를 결정하기 위한 방법 및 조성물이 개시된다.Disclosed herein is a nanopore sensor having one or more nanopores, for example, by correcting for errors inherent in identifying and correlating an electrical signal to the amount of a target analyte or reference analyte in a sample, thereby allowing a target analyte in a sample ( Methods and compositions for determining an improved estimate of the fraction of distribution (eg, a particular polynucleotide sequence) are disclosed.
Description
발명의 분야field of invention
정밀하고 정확한 정량을 위한 하나 이상의 고체 상태 나노포어 및 수학적 방법을 갖춘 시스템을 이용하여 샘플 내 특정 폴리뉴클레오타이드 서열의 분포분율을 결정하는 방법이 제공된다.A method is provided for determining the distribution fraction of a particular polynucleotide sequence in a sample using a system equipped with one or more solid state nanopores and a mathematical method for precise and accurate quantitation.
발명의 배경background of the invention
액체 샘플 내 존재하는 성분의 상대적 존재비를 결정함으로써 액체 샘플의 특성화는 많은 과학 분야 및 응용 분야에 유용한 정보를 제공할 수 있다. 예컨대, 순환 무세포 DNA에서 점 돌연변이의 상대적 존재비는 환자의 암 진행을 진단 또는 모니터링하는 데 이용될 수 있다. 다른 예로서, 예컨대 종자 무리에서 얻어진, 게놈 DNA 내의 비-GMO 참조 서열에 대한 유전자 변형 생물체(GMO)의 전이 유전자 서열의 분량을 결정하는 것은 규제 및 경제적 이유로 중요하다.Characterization of a liquid sample by determining the relative abundance of components present in the liquid sample can provide useful information for many scientific fields and applications. For example, the relative abundance of point mutations in circulating cell-free DNA can be used to diagnose or monitor cancer progression in a patient. As another example, determining the fraction of a transgene sequence of a genetically modified organism (GMO) relative to a non-GMO reference sequence in genomic DNA, such as obtained from a seed swarm, is important for regulatory and economic reasons.
샘플 내 표적 분석물의 분량의 고감도 검출을 위한 일부 방법이 존재하지만, 이들 방법은 일반적으로 비용이 많이 들고 시간이 많이 소요되거나, 다른 제한이 있다. 예를 들어, 정량적 실시간 PCR(qPCR) 분석법은 테스트 샘플 내 불변 참조 서열에 대한 표적 핵산 서열의 상대량을 결정하기 위한 표준 방법으로 남아 있다. 그러나, qPCR의 정량적 성능은, 샘플 당, 그리고 앰플리콘 당 증폭 효율의 가변성에 의해 제한된다. 증폭 효율에 영향을 미치는 요인은 샘플 기질 및 추출 시약 자체의 억제제 및 잔류 오염물질을 포함한다. 이러한 요인들은 샘플 및 준비에 따라 다르며, 한 서열 대 다른 서열의 증폭 효율에 영향을 미칠 수 있는 정도도 다르다. 표적 대 참조 앰플리콘의 증폭 효율의 약간의, 가변적 차이는 qPCR을 > 1.5 배의 정량적 차이를 해결하는 것으로 제한한다. 또한, 증폭 반응에는 특수 시약 세트를 필요하고 적절히 보관되어야만 하며, 시간이 많이 걸리고 반응 조건에 민감할 수 있다.Although some methods exist for highly sensitive detection of an amount of a target analyte in a sample, these methods are generally expensive, time consuming, or have other limitations. For example, quantitative real-time PCR (qPCR) assays remain the standard method for determining the relative amount of a target nucleic acid sequence to a constant reference sequence in a test sample. However, the quantitative performance of qPCR is limited by the variability of amplification efficiency per sample and per amplicon. Factors affecting amplification efficiency include inhibitors and residual contaminants of the sample substrate and extraction reagents themselves. These factors vary by sample and preparation, and to the extent that they can affect the efficiency of amplification of one sequence versus another. Slight, variable differences in the amplification efficiency of target versus reference amplicons limit qPCR to resolving >1.5-fold quantitative differences. In addition, amplification reactions require special reagent sets and must be properly stored, can be time consuming and sensitive to reaction conditions.
나노포어 장치의 이용은, 인가된 전압 하에서 나노포어를 통한 전위 시 개별 분자이 식별되는, 단일 분자 식별을 위한 민감한 도구로서 등장하였다. 나노포어 장치는 사용 용도에 따라 변형될 수 있고, 인간 건강, 농업, 또는 기타 모든 곳에서, 일상적인 사용 사례에 대해 충분히 저렴하고 효율적이다. 그러나, 나노포어의 데이터의 이용은 샘플 내 분석물의 정량적 추정치의 결정에 영향을 줄 수 있는 오차가 발생할 수 있으므로, 이러한 데이터의 사용은 신뢰하기 어렵다.The use of nanopore devices has emerged as a sensitive tool for single molecule identification, in which individual molecules are identified upon translocation through the nanopore under an applied voltage. Nanopore devices can be modified depending on the intended use, and are inexpensive and efficient enough for everyday use cases, whether in human health, agriculture, or anywhere else. However, the use of data from nanopores can introduce errors that can affect the determination of quantitative estimates of analytes in a sample, so the use of these data is unreliable.
따라서, 다목적이고, 저렴하며 사용하기 쉬운 샘플 내 참조 분석물과 비교하여 표적 분석물의 분포분율을 결정하는 개선된 방법이 필요하다.Accordingly, there is a need for an improved method for determining the fraction of a target analyte relative to a reference analyte in a sample that is versatile, inexpensive, and easy to use.
발명의 요약Summary of the invention
일부 구현예에 의하면, 나노포어 장치를 이용하여 혼합 미공지 샘플 내의 표적 분석물의 참 상대적 존재비의 향상된 추정치를 결정하는 방법으로서, 나노포어 장치 내의 나노포어를 가로질러 전압을 가하여 검출 가능한 전자 신호를 생성하고 참조 분석물에 대한 표적 분석물의 공지 상대적 존재비를 포함하는 대조군 샘플, 및 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 미공지 샘플 각각에 대하여: 별도로 상기 나노포어를 통해 상기 나노포어를 통해 하전된 분석물의 전위를 유도하는 단계로서, 상기 샘플 내 상기 표적 분석물의 상대적 존재비가 결정되는 단계; 각 샘플에 대하여 상기 나노포어를 통한 상기 표적 분석물 또는 상기 참조 분석물의 전위에 의해 생성되는 다수의 이벤트 신호를 생성하는 단계; 상기 다수의 이벤트 신호로부터 상기 표적 분석물과 관련된 제 1 이벤트 신호의 양 및 상기 참조 분석물과 관련된 제 2 이벤트 신호의 양을 식별하여 각 샘플에 대하여 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 결정하는 단계; 및 상기 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 이용하여 상기 혼합 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 조정하여 상기 검출된 상대적 존재비의 오차를 보정하고, 이를 통해 상기 혼합 미공지 샘플 내 상기 표적 분석물의 참 상대적 존재비에 대한 개선된 추정치를 결정하는 단계를 포함하는 방법이 제공된다. 일부 구현예에 있어서, 상기 샘플은 액체 샘플이다.According to some embodiments, there is provided a method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using a nanopore device, wherein a voltage is applied across the nanopore within the nanopore device to generate a detectable electronic signal and for each of a control sample comprising a known relative abundance of a target analyte to a reference analyte, and a mixed unknown sample comprising the target analyte and the reference analyte: separately via the nanopore via the nanopore inducing a potential of a charged analyte, wherein the relative abundance of the target analyte in the sample is determined; generating for each sample a plurality of event signals generated by translocation of the target analyte or the reference analyte through the nanopores; A detected relative abundance of first and second event signals for each sample by identifying an amount of a first event signal associated with the target analyte and an amount of a second event signal associated with the reference analyte from the plurality of event signals determining; and adjusting the detected relative abundances of the first and second event signals in the mixed unknown sample using the detected relative abundances of the first and second event signals in the control sample to obtain an error in the detected relative abundances. A method is provided comprising correcting for , thereby determining an improved estimate of the true relative abundance of the target analyte in the mixed unknown sample. In some embodiments, the sample is a liquid sample.
일부 구현예에서, 상기 대조군 샘플은 상기 표적 분석물을 포함하지만, 상기 참조 분석물은 포함하지 않는 표적 대조군 샘플이다. 일부 구현예에서, 상기 대조군 샘플은 상기 참조 분석물을 포함하지만, 상기 표적 분석물은 포함하지 않는 참조 대조군 샘플이다.In some embodiments, the control sample is a target control sample comprising the target analyte but not the reference analyte. In some embodiments, the control sample is a reference control sample comprising the reference analyte but not the target analyte.
일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비에 대한 개선된 추정치를 결정하는 방법은 나노포어 장치에 전압을 가하여 상기 표적 분석물을 포함하지만, 상기 참조 분석물은 포함하지 않는 표적 대조군 샘플에 대하여 나노포어 센서를 통하여 하전된 분석물의 전위를 유도하는 단계를 더 포함한다.In some embodiments, a method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device includes applying a voltage to the nanopore device to include the target analyte, but see supra The method further comprises inducing a potential of the charged analyte through the nanopore sensor with respect to a target control sample that does not contain the analyte.
일부 구현예에서, 상기 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비의 조정은 상기 표적 대조군 샘플 내 및 상기 참조 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 이용하여 상기 검출된 상대적 존재비의 상기 오차에 대해 보정하는 것을 포함한다. 일부 구현예에서, 상기 오차는 상기 표적 분석물의 위양성 또는 위음성 검출 오차를 포함한다.In some embodiments, the adjustment of the detected relative abundances of the first and second event signals in the unknown sample comprises the detected relative abundances of the first and second event signals in the target control sample and in the reference control sample. and correcting for the error of the detected relative abundance using In some embodiments, the error comprises a false positive or false negative detection error of the target analyte.
일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 결정하는 방법은 나노포어 장치에 전압을 가하여 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 대조군 샘플에 대하여 나노포어 센서를 통해 하전된 분석물의 전위를 유도하는 단계를 포함하고, 상기 표적 분석물 및 상기 참조 분석물의 상대적 존재비는 알려져 있다.In some embodiments, a method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device comprises applying a voltage to the nanopore device to include the target analyte and the reference analyte inducing a potential of a charged analyte through a nanopore sensor with respect to a mixed control sample, wherein the relative abundance of the target analyte and the reference analyte is known.
일부 구현예에서, 상기 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비의 조정은 상기 표적 대조군 샘플, 상기 참조 대조군 샘플, 및 상기 혼합 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 이용하여 상기 검출된 상대적 존재비의 오차를 보정하는 것을 포함한다.In some embodiments, the adjustment of the detected relative abundance of the first and second event signals in the unknown sample comprises the first and second event signals in the target control sample, the reference control sample, and the mixed control sample. and correcting an error of the detected relative abundance using the detected relative abundance of .
일부 구현예에서, 상기 오차는 위양성 표적 분석물 검출 오차, 위음성 표적 분석물 검출 오차, 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이, 또는 이들의 임의의 조합을 포함한다.In some embodiments, the error comprises a false positive target analyte detection error, a false negative target analyte detection error, a difference in capture rate constants of the target analyte and the reference analyte, or any combination thereof.
일부 구현예에서, 상기 대조군 샘플은 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 대조군 샘플이고, 상기 표적 분석물 및 상기 참조 분석물의 상대적 존재비는 알려져 있다. 일부 구현예에서, 상기 오차는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이를 포함한다.In some embodiments, the control sample is a mixed control sample comprising the target analyte and the reference analyte, and the relative abundance of the target analyte and the reference analyte is known. In some embodiments, the error comprises a difference in capture rate constants of the target analyte and the reference analyte.
일부 구현예에서, 상기 혼합 대조군 샘플은 상기 혼합 미공지 샘플에 비하여 1.2배 이하, 1.5배 이하, 2배 이하, 5배 이하, 또는 10배 이하만큼 차이가 나는 상기 참조 분석물에 대한 상기 표적 분석물의 상대적 존재비를 포함한다.In some embodiments, the mixed control sample is the target assay for the reference analyte that differs by no more than 1.2 fold, no more than 1.5 fold, no more than 2 fold, no more than 5 fold, or no more than 10 fold compared to the mixed unknown sample. Includes the relative abundance of water.
일부 구현예에서, 상기 참 상대적 존재비의 상기 추정치는 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 비율의 추정치이다. 일부 구현예에서, 상기 참 비율의 추정치(는 에 의해 결정되며, 여기서 상기 파라미터 ρ는 위양성 검출 오차, 위음성 검출 오차, 또는 둘 다를 보상할 수 있는 비율의 추정치이고, 상기 파라미터 α는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이를 보상하기 위하여 사용될 수 있다. 일부 구현예에서, 상기 파라미터 α는 참조 분석물 포획률을 표적 분석물 포획률로 나눈 비율의 추정치이다.In some embodiments, the estimate of the true relative abundance is an estimate of the true ratio of the target analyte to the reference analyte in the mixed unknown sample. In some embodiments, an estimate of the true ratio ( Is , wherein the parameter ρ is an estimate of a ratio capable of compensating for false-positive detection error, false-negative detection error, or both, and wherein the parameter α is to compensate for a difference in capture rate constants of the target analyte and the reference analyte can be used for In some embodiments, the parameter α is an estimate of the ratio of the reference analyte capture rate divided by the target analyte capture rate.
일부 구현예에서, 상기 참 상대적 존재비의 추정치는 상기 혼합 미공지 샘플 내 상기 참조 분석물 및 상기 표적 분석물의 집단에서 상기 표적 분석물의 참 분율의 추정치이다. 일부 구현예에서, 상기 참 분율의 추정치(는 에 의해 결정되며, 여기서 상기 파라미터 ρ는 위양성 검출 오차, 위음성 검출 오차, 또는 둘 다를 보상할 수 있는 비율에 대한 추정치이고, 상기 파라미터 α는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이를 보상하는 데 사용될 수 있다. 일부 구현예에서, 상기 파라미터 α는 상기 참조 분석물 포획률을 표적 분석물 포획률로 나눈 비율의 추정치이다.In some embodiments, the estimate of the true relative abundance is an estimate of the true fraction of the target analyte in the population of the reference analyte and the target analyte in the mixed unknown sample. In some embodiments, the estimate of the true fraction ( Is , wherein the parameter ρ is an estimate for a rate capable of compensating for false-positive detection error, false-negative detection error, or both, and wherein the parameter α compensates for a difference in capture rate constants of the target analyte and the reference analyte. can be used to In some embodiments, the parameter α is an estimate of the ratio of the reference analyte capture rate divided by the target analyte capture rate.
일부 구현예에서, 상기 파라미터 이고, 이다. 일부 구현예에서, 상기 파라미터 는 상기 대조군 샘플을 사용한 경우 상기 표적 대조군 샘플 내에서 관찰되는 상기 제 1 이벤트 신호의 분율이고, 표적 대조군 샘플을 사용하지 않은 경우 1이다. 일부 구현예에서, 상기 파라미터 는 상기 참조 대조군 샘플을 사용한 경우 상기 참조 대조군 샘플 내에서 관찰되는 상기 제 1 이벤트 신호의 분율이고, 참조 대조군 샘플을 사용하지 않은 경우 0이다. 일부 구현예에서, 상기 파라미터 는 상기 혼합 대조군 샘플 내에서 관찰되는 상기 제 1 이벤트 신호의 분율이고 여기서 상기 대조군 샘플을 사용한 경우 는 상기 혼합 대조 샘플 내 참조 분석물(Y)에 대한 표적 분석물(X)의 공지된 비율이거나, 혼합 대조군 샘플을 사용하지 않은 경우 이다. 일부 구현예에서, 상기 파라미터 는 상기 혼합 미공지 샘플 내에서 관찰되는 상기 제 1 이벤트 신호의 분율이다.In some embodiments, the parameter ego, to be. In some embodiments, the parameter is the fraction of the first event signal observed in the target control sample when the control sample was used, and when the target control sample was not used 1 is In some embodiments, the parameter is the fraction of the first event signal observed in the reference control sample when the reference control sample was used, and when the reference control sample was not used 0. In some embodiments, the parameter is the fraction of the first event signal observed in the mixed control sample where using the control sample is the known ratio of target analyte (X) to reference analyte (Y) in the mixed control sample, or when a mixed control sample is not used to be. In some embodiments, the parameter is the fraction of the first event signal observed in the mixed unknown sample.
일부 구현예에서, 상기 미공지 또는 대조군 샘플은 핵산 증폭에 의해 제조된다. 일부 구현예에서, 상기 미공지 또는 대조군 샘플은 핵산 증폭에 의해 제조되지 않는다. 일부 구현예에서, 상기 샘플은 실질적으로 참조 및 표적 분자들로 구성되도록 정제된다. 일부 구현예에서, 상기 샘플은 정제되지 않는다.In some embodiments, the unknown or control sample is prepared by nucleic acid amplification. In some embodiments, the unknown or control sample is not prepared by nucleic acid amplification. In some embodiments, the sample is purified to consist substantially of reference and target molecules. In some embodiments, the sample is not purified.
일부 구현예에서, 상기 혼합 미공지 샘플 내 상기 참조 분석물의 양 또는 농도는 알려져 있다. 일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 결정하는 방법은 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비의 상기 추정치 및 상기 혼합 미공지 샘플 내 상기 참조 분석물의 상기 알려진 양 또는 농도를 사용하여 상기 혼합 미공지 샘플 내 상기 표적 분석물의 절대적 양 또는 농도의 추정값을 결정하는 단계를 더 포함한다. 관련된 구현예에서, 상기 표적 분석물의 상기 절대적 양 또는 농도는 하나 이상의 나노포어 장치의 다수의 나노포어로부터 유래된 정보를 이용하여 결정될 수 있다.In some embodiments, the amount or concentration of the reference analyte in the mixed unknown sample is known. In some embodiments, the method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device comprises: the true relative of the target analyte to the reference analyte in the mixed unknown sample. determining an estimate of the absolute amount or concentration of the target analyte in the mixed unknown sample using the estimate of abundance and the known amount or concentration of the reference analyte in the mixed unknown sample. In a related embodiment, the absolute amount or concentration of the target analyte may be determined using information derived from a plurality of nanopores of one or more nanopore devices.
일부 구현예에서, 상기 표적 분석물과 관련된 제 1 이벤트 신호의 양 및 상기 참조 분석물과 관련된 제 2 이벤트 신호의 양은 정의된 한계에 따라 식별된다. 일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 결정하는 방법은 상기 한계를 최적화하여 Q-검정, 서포트 벡터 머신, 또는 기대 최대화 알고리즘을 이용하여 상기 참조 분석물 및/또는 상기 표적 분석물의 검출 정확도를 높이는 단계를 더 포함한다. 일부 구현예에 있어서, 상기 서포트 벡터 머신은 표적 분석물 및 참조 분석물의 공지된 양을 포함하는 대조군 샘플로부터 생성되는 전자 신호를 이용하여 훈련된다.In some embodiments, an amount of a first event signal associated with the target analyte and an amount of a second event signal associated with the reference analyte are identified according to a defined limit. In some embodiments, the method for determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device comprises optimizing the limit to perform a Q-test, a support vector machine, or an expectation maximization algorithm. The method further comprises increasing the detection accuracy of the reference analyte and/or the target analyte using the method. In some embodiments, the support vector machine is trained using electronic signals generated from a control sample comprising known amounts of a target analyte and a reference analyte.
일부 구현예에서, 상기 정의된 한계는: 이벤트 지속시간, 최대 δG, 중앙 δG, 평균 δG, 이벤트 신호의 표준편차, 50 Hz 미만인 이벤트의 노이즈 파워의 평균 또는 중앙값, 상기 이벤트 신호 내의 고유 패턴, 이벤트 면적, 또는 이들의 임의의 조합으로 구성되는 군으로부터 선택되는 하나 이상의 이벤트 신호의 특징의 함수이다.In some embodiments, the defined limits are: event duration, maximum δG, median δG, average δG, standard deviation of event signal, average or median of noise power of events less than 50 Hz, unique pattern within the event signal, event is a function of a characteristic of one or more event signals selected from the group consisting of area, or any combination thereof.
일부 구현예에서, 상기 검출된 상대적 존재비 내 상기 오차를 보정하기 위한 상기 혼합 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비의 조정은 Q-검정, 서포트 벡터 머신, 또는 기대 최대화 알고리즘을 이용하여 수행된다.In some embodiments, adjusting the detected relative abundance of the first and second event signals in the mixed unknown sample to correct for the error in the detected relative abundance is a Q-test, a support vector machine, or an expectation maximization This is done using an algorithm.
일부 구현예에서, 상기 표적 분석물 및 상기 참조 분석물은 각각 폴리뉴클레오타이드를 포함한다. 일부 구현예에서, 상기 표적 분석물 폴리뉴클레오타이드 및 상기 참조 분석물 폴리뉴클레오타이드는 상이한 길이를 갖는다. 일부 구현예에서, 상기 길이는 적어도 10개 뉴클레오타이드, 적어도 20개 뉴클레오타이드, 적어도 50개 뉴클레오타이드, 적어도 100개 뉴클레오타이드, 적어도 150개 뉴클레오타이드 또는 적어도 200개 뉴클레오타이드만큼 상이하다.In some embodiments, the target analyte and the reference analyte each comprise a polynucleotide. In some embodiments, the target analyte polynucleotide and the reference analyte polynucleotide have different lengths. In some embodiments, the lengths differ by at least 10 nucleotides, at least 20 nucleotides, at least 50 nucleotides, at least 100 nucleotides, at least 150 nucleotides, or at least 200 nucleotides.
일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 결정하는 방법은 상기 대조군 또는 미공지 샘플을 제 1 페이로드에 결합된 제 1 프로브와 접촉시키는 단계를 더 포함하며, 여기서 상기 제 1 프로브는 상기 제 1 분석물에 특이적으로 결합하도록 구성된다. 일부 구현예에서, 상기 나노포어 장치를 이용하여 혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 결정하는 방법은 상기 대조군 또는 미공지 샘플을 제 2 페이로드에 결합된 제 2 프로브와 접촉시키는 단계를 더 포함하며, 여기서 상기 제 2 프로브는 상기 제 2 분석물에 특이적으로 결합하도록 구성된다.In some embodiments, the method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device comprises: combining the control or unknown sample with a first probe bound to a first payload; contacting, wherein the first probe is configured to specifically bind to the first analyte. In some embodiments, the method of determining an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample using the nanopore device comprises: combining the control or unknown sample with a second probe coupled to a second payload; contacting, wherein the second probe is configured to specifically bind to the second analyte.
일부 구현예에서, 상기 표적 분석물은 유전자 변형 생물체와 관련된다. 일부 구현예에서, 상기 표적 분석물은 환자의 암의 존재 또는 부재와 관련된 마커를 포함한다.In some embodiments, the target analyte is associated with a genetically modified organism. In some embodiments, the target analyte comprises a marker associated with the presence or absence of cancer in the patient.
또한 본 명세서에서는 샘플 내 표적 분석물의 상대적 양을 결정하는 방법으로서, 참조 분석물을 포함하지만 표적 분석물은 포함하지 않는 제 1 대조군 샘플, 표적 분석물을 포함하지만 참조 분석물은 포함하지 않는 제 2 대조군 샘플, 상기 표적 분석물 및 상기 참조 분석물의 공지된 상대적 존재비를 포함하는 제 3 대조군 샘플, 및 상기 표적 분석물 및 상기 참조 분석물의 미공지 상대적 존재비를 포함하는 실험 샘플: 각각을 나노포어 시스템 내에서 실행하는 단계; 각 샘플에 대하여 참조 분석물과 관련된 제 1 이벤트 신호의 양 및 표적 분석물과 관련된 제 2 이벤트 신호의 양을 검출하는 단계; 및 상기 실험 샘플로부터의 상기 제 1 및 제 2 이벤트 신호의 양의 상대적 존재비를 상기 제 1 대조군 샘플, 상기 제 2 대조군 샘플, 및 상기 제 3 대조군 샘플 각각으로부터의 상기 제 1 및 제 2 이벤트 신호의 양의 상대적 존재비와 비교하여 상기 실험 샘플 내 상기 참조 분석물 및 상기 표적 분석물의 상기 참 상대적 존재비의 추정치를 결정하는 단계를 포함하는 방법이 제공된다.Also provided herein is a method for determining the relative amount of a target analyte in a sample, a first control sample including a reference analyte but not including a target analyte, and a second control sample including a target analyte but not including a reference analyte a control sample, a third control sample comprising a known relative abundance of the target analyte and the reference analyte, and an experimental sample comprising an unknown relative abundance of the target analyte and the reference analyte: each in a nanopore system running in; detecting for each sample an amount of a first event signal associated with a reference analyte and an amount of a second event signal associated with a target analyte; and the relative abundance of the amounts of the first and second event signals from the experimental sample of the first and second event signals from each of the first control sample, the second control sample, and the third control sample. A method is provided comprising determining an estimate of the true relative abundance of the reference analyte and the target analyte in the experimental sample as compared to the relative abundance of an amount.
일부 구현예에서, 상기 이벤트 신호는 상기 나노포어를 통한 상기 참조 분석물의 전위에 의해 유도된 전기 신호를 포함한다.In some embodiments, the event signal comprises an electrical signal induced by the potential of the reference analyte through the nanopore.
일부 구현예에서, 상기 표적 분석물 및 상기 참조 분석물은 각각 폴리뉴클레오타이드를 포함한다. 일부 구현예에서, 상기 표적 분석물 및 상기 참조 분석물은 길이에 의해 구별된다.In some embodiments, the target analyte and the reference analyte each comprise a polynucleotide. In some embodiments, the target analyte and the reference analyte are distinguished by a length.
일부 구현예에서, 상기 표적 분석물 및 상기 참조 분석물은 각각 상기 나노포어 장치 내 상기 참조 분석물 및 상기 표적 분석물 간의 구별을 용이하게 하는 페이로드를 포함하는 서열-특이적 프로브에 결합된다.In some embodiments, the target analyte and the reference analyte are each bound to a sequence-specific probe comprising a payload that facilitates discrimination between the reference analyte and the target analyte in the nanopore device.
일부 구현예에서, 상기 상대적 존재비는 상기 샘플 내 상기 표적 분석물 및 상기 참조 분석물의 총 집단과 비교한 상기 표적 분석물의 분량이다.In some embodiments, the relative abundance is the quantity of the target analyte compared to the total population of the target analyte and the reference analyte in the sample.
또한 본 명세서에서는 미공지 샘플 내 표적 분석물의 상대적 존재비를 결정하는 방법으로서 다수의 참조 분석물 및 다수의 표적 분석물을 포함하는 미공지 샘플을 제공하는 단계; 상기 미공지 샘플을 제 1 챔버 및 제 2 챔버 사이에 배치된 나노포어를 포함하는 나노포어 장치의 제 1 챔버로 로딩하는 단계; 상기 나노포어에 전압을 가하여 상기 참조 분석물 및 상기 표적 분석물이 상기 나노포어를 통하여 상기 제 1 챔버에서 상기 제 2 챔버로 통과하는 단계; 상기 나노포어를 통한 상기 참조 분석물의 전위와 관련된 제 1 전기 신호의 수를 검출하는 단계; 상기 나노포어를 통한 상기 표적 분석물의 전위와 관련된 제 2 전기 신호의 수를 검출하는 단계; 및 상기 전기 신호 상대적 존재비와 관련된 적어도 하나의 오차를 설명하는 참조값을 이용하여 상기 검출된 제 1 전기 신호의 수 및 상기 검출된 제 2 전기 신호의 수의 상대적 존재비를 상기 미공지 샘플 내 상기 표적 분석물의 참 상대적 존재비의 추정치로 변환하는 단계를 포함하는 방법이 제공된다.Also provided herein is a method for determining the relative abundance of a target analyte in an unknown sample, the method comprising: providing an unknown sample comprising a plurality of reference analytes and a plurality of target analytes; loading the unknown sample into a first chamber of a nanopore device comprising nanopores disposed between the first chamber and the second chamber; applying a voltage to the nanopores so that the reference analyte and the target analyte pass through the nanopores from the first chamber to the second chamber; detecting a number of first electrical signals related to the potential of the reference analyte through the nanopores; detecting a number of second electrical signals related to the potential of the target analyte through the nanopores; and analyzing the target in the unknown sample for the relative abundance of the number of detected first electrical signals and the number of detected second electrical signals using a reference value that accounts for at least one error associated with the relative abundance of electrical signals. A method is provided comprising converting to an estimate of the true relative abundance of water.
일부 구현예에서, 상기 참조값은 공지된 양의 표적 분석물 및 참조 분석물을 포함하는 혼합 대조군 샘플로부터 결정된 상기 제 1 전기 신호의 분포분율로부터 결정된다. 일부 구현예에서, 상기 참조값은 공지된 양의 표적 분석물 및 참조 분석물을 포함하는 혼합 대조군 샘플로부터 결정된 상기 제 1 전기 신호의 분포분율로부터 결정된다. 일부 구현예에서, 상기 참조값은 공지된 양의 표적 분석물 및 참조 분석물을 포함하는 혼합 대조군 샘플로부터 결정된 상기 제 1 전기 신호의 분포분율로부터 결정된다.In some embodiments, the reference value is determined from a fraction of the distribution of the first electrical signal determined from a mixed control sample comprising a known amount of a target analyte and a reference analyte. In some embodiments, the reference value is determined from a fraction of the distribution of the first electrical signal determined from a mixed control sample comprising a known amount of a target analyte and a reference analyte. In some embodiments, the reference value is determined from a fraction of the distribution of the first electrical signal determined from a mixed control sample comprising a known amount of a target analyte and a reference analyte.
일부 구현예에서, 상기 혼합 대조군 샘플, 상기 표적 대조군 샘플, 또는 상기 참조 대조군 샘플은 상기 미공지 샘플로부터의 상기 제 1 및 제 2 전기 신호의 상기 검출 동안 상기 나노포어 장치 내의 조건과 실질적으로 동일한 조건 하에 상기 나노포어 장치 내에서 실행된다.In some embodiments, the mixed control sample, the target control sample, or the reference control sample are under substantially the same conditions as the conditions in the nanopore device during the detection of the first and second electrical signals from the unknown sample. It is carried out in the nanopore device under
일부 구현예에서, 상기 나노포어 장치는 상기 장치의 내부 공간을 제 1 챔버 및 제 2 챔버로 분리하는 막을 포함하고, 상기 막은 상기 나노포어를 포함하며, 상기 제 1 챔버 및 상기 제 2 챔버는 상기 나노포어를 통해 유체 연통되고, 상기 장치는 각 챔버 내에 상기 나노포어에 전압을 가하기 위한 전극을 포함한다. 일부 구현예에서, 상기 전극은 상기 나노포어를 통한 전류를 탐지하도록 구성된다. 일부 구현예에서, 상기 전극은 전원과 연결된다.In some embodiments, the nanopore device comprises a membrane separating an internal space of the device into a first chamber and a second chamber, wherein the membrane comprises the nanopore, wherein the first chamber and the second chamber are In fluid communication through the nanopores, the device includes in each chamber an electrode for applying a voltage to the nanopores. In some embodiments, the electrode is configured to detect a current through the nanopore. In some embodiments, the electrode is connected to a power source.
일부 구현예에서, 본 명세서에서 제공되는 상기 방법들은 위양성 또는 위음성 검출 오차, 또는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이를 설명함으로써 혼합 미공지 샘플 내 표적 분석물의 분포분율의 추정치의 정확도를 개선한다. 일부 구현예에서, 일련의 대조군들이 분포분율의 추정치의 정확도를 개선하기 위해 실행되며, 이는 위양성 표적 분석물 검출 오차를 설명하기 위한 참조 분석물만의 대조군 샘플, 위음성 표적 분석물 검출 오차를 설명하기 위한 표적 분석물만의 대조군 샘플, 및 표적 분석물 및 참조 분석물 간의 포획률 상수 차이를 설명하기 위한 하나 이상의 혼합 대조군 샘플을 포함한다.In some embodiments, the methods provided herein provide false positive or false negative detection error, or the accuracy of an estimate of the fraction of distribution of a target analyte in a mixed unknown sample by accounting for a difference in capture rate constants of the target analyte and the reference analyte. to improve In some embodiments, a series of controls are run to improve the accuracy of the estimate of the fraction of distribution, a control sample of reference analyte only to account for false-positive target analyte detection errors, and to account for false-negative target analyte detection errors. a control sample of only the target analyte for , and one or more mixed control samples to account for differences in capture rate constants between the target analyte and the reference analyte.
일부 구현예에서, 상기 혼합 미공지 샘플 내 상기 표적 분석물 및 상기 참조 분석물 간의 포획률은 비교적 일정하여, 상기 혼합 대조군은 상대적 존재비의 추정치 개선에 사용되지 않아도 된다. 일부 구현예에서, 혼합 샘플 내 상기 표적 분석물 및 상기 참조 분석물 간의 상대적 포획률은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 이 차이를 보상하여 혼합 대조군 샘플의 실행 없이 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 표적 분석물 및 참조 분석물 종을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 혼합 대조군 샘플로부터의 데이터는 방법의 일부로 실제로 혼합 대조군 샘플을 실행하지 않고 분포분율의 추정치를 개선하는 데 사용된다.In some embodiments, the capture rate between the target analyte and the reference analyte in the mixed unknown sample is relatively constant, such that the mixed control need not be used to improve the estimate of relative abundance. In some embodiments, the relative capture rate between the target analyte and the reference analyte in a mixed sample is determined such that a correction term is applied to data from a mixed unknown sample to compensate for this difference to provide an estimate of the fraction of distribution without running a mixed control sample. known to be improved. In some embodiments, data from a mixed control sample run under substantially identical nanopore conditions using the same target analyte and reference analyte species as in the mixed unknown sample is actually running the mixed control sample as part of a method. It is used to improve the estimate of the fraction of distribution without
일부 구현예에서, 한계값은 상기 혼합 미공지 샘플로부터의 위양성 값이 무시할 수 있을 정도이고, 참조만의 대조군이 상대적 존재비의 추정치를 개선하는 데 사용할 필요가 없도록 결정된다. 일부 구현예에서, 혼합 샘플로부터의 위양성 값은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 위양성 오차를 보상하여 참조만의 대조군 샘플의 실행 없이 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 참조 분석물 종을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 참조 분석물만의 대조군 샘플로부터의 데이터는 방법의 일부로 실제로 참조만의 대조군을 실행하지 않고 분포분율의 추정치를 개선하는 데 사용된다.In some embodiments, a threshold is determined such that false positive values from the mixed unknown sample are negligible and that a reference-only control need not be used to improve the estimate of relative abundance. In some embodiments, false positive values from a mixed sample are known so that a correction term can be applied to data from a mixed unknown sample to compensate for false positive errors to improve the estimate of the fraction of distribution without running a reference-only control sample. In some embodiments, data from a reference analyte-only control sample run under substantially identical nanopore conditions using the same reference analyte species as in the mixed unknown sample is, as part of a method, actually reference-only control. It is used to improve the estimate of the fraction of distribution without running.
일부 구현예에서, 한계값은 상기 혼합 미공지 샘플로부터의 위음성 값이 무시할 수 있을 정도이고, 표적만의 대조군이 상대적 존재비의 추정치를 개선하는 데 사용할 필요가 없도록 결정된다. 일부 구현예에서, 혼합 샘플로부터의 위음성 값은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 위음성 오차를 보상하여 표적만의 대조군 샘플의 실행 없이 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 표적 분석물 종을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 표적 분석물만의 대조군 샘플로부터의 데이터는 방법의 일부로 실제로 표적만의 대조군을 실행하지 않고 분포분율의 추정치를 개선하는 데 사용된다.In some embodiments, a threshold is determined such that false negative values from the mixed unknown sample are negligible and that a target-only control need not be used to improve the estimate of relative abundance. In some embodiments, false negative values from a mixed sample are known so that a correction term can be applied to data from the mixed unknown sample to compensate for false negative errors to improve the estimate of the fraction of distribution without running a target-only control sample. In some embodiments, data from a target analyte-only control sample run under substantially identical nanopore conditions using the same target analyte species as in the mixed unknown sample is, as part of a method, actually target-only control. It is used to improve the estimate of the fraction of distribution without running.
일부 구현예에서, 본 명세서에서는 혼합 샘플 내 참조 분석물에 대한 표적 분석물의 상대적 존재비의 추정치를 결정하는 방법으로서, 나노포어 장치에 전압을 가하여 참조 분석물에 대한 표적 분석물의 공지된 상대적 존재비를 포함하는 혼합 대조군 샘플, 및 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 미공지 샘플: 각각에 대하여 개별로 나노포어 센서를 통해 하전된 분석물의 전위를 유도하는 단계로서, 상기 상기 참조 분석물에 대한 상기 표적 분석물의 상대적 존재비가 미공지된 단계; 각 샘플에 대하여 상기 참조 분석물과 관련된 제 1 이벤트 신호의 양 및 표적 분석물과 관련된 제 2 이벤트 신호의 양을 검출하는 단계; 및 상기 혼합 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비 및 상기 혼합 대조군 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비를 이용하여 상기 혼합 미공지 샘플로부터의 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 조정함으로써 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비의 추정치를 결정하는 단계를 포함하는 방법이 제공된다.In some embodiments, disclosed herein is a method of determining an estimate of the relative abundance of a target analyte to a reference analyte in a mixed sample, comprising applying a voltage to a nanopore device to include a known relative abundance of a target analyte to a reference analyte inducing a potential of a charged analyte through a nanopore sensor for each of a mixed control sample, and a mixed unknown sample comprising the target analyte and the reference analyte, wherein the reference analyte is an unknown relative abundance ratio of the target analyte to the target analyte; detecting for each sample an amount of a first event signal associated with the reference analyte and an amount of a second event signal associated with a target analyte; and the detected relative abundance of the first and second event signals in the mixed control sample and the true relative abundance of the target analyte to the reference analyte in the mixed control sample. A method is provided comprising determining an estimate of the true relative abundance of the target analyte to the reference analyte in the mixed unknown sample by adjusting the detected relative abundances of first and second event signals.
일부 구현예에서, 본 명세서에서는 혼합 샘플 내 참조 분석물에 대한 표적 분석물의 상대적 존재비의 추정치를 결정하는 방법으로서, 나노포어 장치에 전압을 가하여 표적 분석물을 포함하지만, 참조 분석물을 포함하지 않는 표적 대조군 샘플, 참조 분석물을 포함하지만, 표적 분석물을 포함하지 않는 참조 대조군 샘플, 및 상기 참조 분석물에 대한 상기 표적 분석물의 상대적 존재비가 알려지지 않은, 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 미공지 샘플: 각각에 대하여 각각에 대하여 개별로 나노포어 센서를 통한 전위를 유도하는 단계; 각 샘플에 대하여 상기 참조 분석물과 관련된 제 1 이벤트 신호의 양 및 표적 분석물과 관련된 제 2 이벤트 신호의 양을 검출하는 단계; 및 상기 표적 대조군 샘플 및 상기 참조 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 이용하여 상기 혼합 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 조정함으로써 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비의 추정치를 결정하는 단계를 포함하는 방법이 제공된다. 일부 구현예에서, 상기 표적 대조군 샘플은 상기 혼합 미공지 샘플로부터의 표적 분석물의 위음성 검출에 대한 보정항을 제공한다. 일부 구현예에서, 상기 참조 대조군 샘플은 상기 혼합 미공지 샘플 내 표적 분석물의 위양성 검출에 대한 보정항을 제공한다.In some embodiments, disclosed herein is a method of determining an estimate of the relative abundance of a target analyte to a reference analyte in a mixed sample, wherein a voltage is applied to a nanopore device to include the target analyte but not the reference analyte a target control sample, a reference control sample comprising a reference analyte but no target analyte, and the target analyte and the reference analyte, wherein the relative abundance of the target analyte to the reference analyte is unknown. A mixed unknown sample comprising: inducing an electric potential through the nanopore sensor individually for each; detecting for each sample an amount of a first event signal associated with the reference analyte and an amount of a second event signal associated with a target analyte; and adjusting the detected relative abundances of the first and second event signals in the mixed unknown sample using the detected relative abundances of the first and second event signals in the target control sample and the reference control sample. A method is provided comprising determining an estimate of the true relative abundance of said target analyte to said reference analyte in a mixed unknown sample. In some embodiments, the target control sample provides a correction for false-negative detection of a target analyte from the mixed unknown sample. In some embodiments, the reference control sample provides a correction for false-positive detection of a target analyte in the mixed unknown sample.
일부 구현예에서, 본 명세서에서는 혼합 샘플 내 참조 분석물에 대한 표적 분석물의 상대적 존재비의 추정치를 결정하는 방법으로서, 나노포어 장치에 전압을 가하여 참조 분석물에 대한 표적 분석물의 공지된 상대적 존재비를 포함하는 혼합 대조군 샘플, 표적 분석물을 포함하지만, 참조 분석물을 포함하지 않는 표적 대조군 샘플, 참조 분석물을 포함하지만, 표적 분석물을 포함하지 않는 참조 대조군 샘플, 및 상기 참조 분석물에 대한 상기 표적 분석물의 상대적 존재비가 알려지지 않은, 상기 표적 분석물 및 상기 참조 분석물을 포함하는 혼합 미공지 샘플: 각각에 대하여 각각에 대하여 개별로 나노포어 센서를 통한 전위를 유도하는 단계; 각 샘플에 대하여 상기 참조 분석물과 관련된 제 1 이벤트 신호의 양 및 표적 분석물과 관련된 제 2 이벤트 신호의 양을 검출하는 단계; 및 상기 표적 대조군 샘플 및 상기 참조 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비, 및 상기 혼합 대조군 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비 및 상기 혼합 대조군 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비를 이용하여 상기 혼합 미공지 샘플로부터의 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 조정함으로써 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비의 추정치를 결정하는 단계를 포함하는 방법이 제공된다.In some embodiments, disclosed herein is a method of determining an estimate of the relative abundance of a target analyte to a reference analyte in a mixed sample, comprising applying a voltage to a nanopore device to include a known relative abundance of a target analyte to a reference analyte a mixed control sample comprising a target analyte but no reference analyte, a reference control sample comprising a reference analyte but no target analyte, and the target for the reference analyte A mixed unknown sample comprising the target analyte and the reference analyte, wherein the relative abundance of the analyte is unknown: inducing a potential through the nanopore sensor individually for each; detecting for each sample an amount of a first event signal associated with the reference analyte and an amount of a second event signal associated with a target analyte; and the detected relative abundances of the first and second event signals in the target control sample and the reference control sample, and the detected relative abundances of the first and second event signals in the mixed control sample and in the mixed control sample. to the reference analyte in the mixed unknown sample by adjusting the detected relative abundances of the first and second event signals from the mixed unknown sample using the true relative abundance of the target analyte to the reference analyte. A method is provided comprising determining an estimate of the true relative abundance of the target analyte for
일부 구현예에서, 상기 혼합 샘플 내 참조 분석물에 대한 표적 분석물의 상대적 존재비의 추정치를 결정하는 방법은 나노포어 장치에 전압을 가하여 상기 표적 분석물을 포함하지만, 상기 참조 분석물은 포함하지 않는 표적 대조군 샘플에 대하여 나노포어 센서를 통해 하전된 분석물의 전위를 유도하는 단계를 더 포함한다.In some embodiments, the method of determining an estimate of the relative abundance of a target analyte to a reference analyte in the mixed sample comprises applying a voltage to a nanopore device to include the target analyte, but not the reference analyte. Inducing a potential of the charged analyte through the nanopore sensor relative to the control sample.
일부 구현예에서, 상기 혼합 샘플 내 참조 분석물에 대한 표적 분석물의 상대적 존재비의 추정치를 결정하는 방법은 나노포어 장치에 전압을 가하여 상기 참조 분석물을 포함하지만, 상기 표적 분석물은 포함하지 않는 참조 대조군 샘플에 대하여 나노포어 센서를 통해 하전된 분석물의 전위를 유도하는 단계를 더 포함한다. 일부 구현예에서, 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비의 상기 추정치를 결정하는 것은 상기 표적 대조군 샘플, 상기 참조 대조군 샘플, 및 상기 혼합 대조군 샘플 내 상기 혼합 대조군 샘플 내 상기 참조 분석물에 대한 상기 표적 분석물의 참 상대적 존재비를 이용하여 상기 혼합 미공지 샘플 내 상기 제 1 및 제 2 이벤트 신호의 검출된 상대적 존재비를 조정하는 것을 포함한다.In some embodiments, the method of determining an estimate of the relative abundance of a target analyte to a reference analyte in the mixed sample comprises applying a voltage to a nanopore device to include the reference analyte, but not the target analyte. Inducing a potential of the charged analyte through the nanopore sensor relative to the control sample. In some embodiments, determining said estimate of the true relative abundance of said target analyte to said reference analyte in said mixed unknown sample comprises said target control sample, said reference control sample, and said mixed control in said mixed control sample. and adjusting the detected relative abundance of the first and second event signals in the mixed unknown sample using the true relative abundance of the target analyte to the reference analyte in the sample.
일부 구현예에서, 상기 혼합 대조군 샘플은 상기 혼합 미공지 샘플에 비하여 1.2배 이하, 1.5배 이하, 2배 이하, 5배 이하, 또는 10배 이하만큼 차이가 나는 상기 참조 분석물에 대한 상기 표적 분석물의 상대적 존재비를 포함한다.In some embodiments, the mixed control sample is the target assay for the reference analyte that differs by no more than 1.2 fold, no more than 1.5 fold, no more than 2 fold, no more than 5 fold, or no more than 10 fold compared to the mixed unknown sample. Includes the relative abundance of water.
일부 구현예에서, 상기 상대적 존재비는 표적 분석물:참조 분석물의 비율을포함한다. 일부 구현예에서, 상기 혼합 미공지 샘플 내 상기 참조 분석물에 대한 표적 분석물의 참 비율의 추정치()는 에 의해 결정되며, 여기서 상기 파라미터 ρ는 위양성 검출 오차, 위음성 검출 오차, 또는 둘 다에 대한 보상을할 수 있는 비율에 대한 추정치이고, 상기 파라미터 α는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이에 대한 보상에 사용될 수 있다. 일부 구현예에서, 상기 파라미터 α는 참조 분석물 포획률을 표적 분석물 포획률로 나눈 비의 추정치이다.In some embodiments, the relative abundance comprises a ratio of target analyte:reference analyte. In some embodiments, an estimate of the true ratio of a target analyte to the reference analyte in the mixed unknown sample ( )Is , where the parameter ρ is an estimate of the rate that can compensate for false-positive detection error, false-negative detection error, or both, and the parameter α is the capture rate constant of the target analyte and the reference analyte. It can be used to compensate for differences. In some embodiments, the parameter α is an estimate of the ratio of the reference analyte capture rate divided by the target analyte capture rate.
일부 구현예에서, 상기 상대적 존재비는 상기 표적 분석물 및 상기 참조 분석물의 집단 내 상기 표적 분석물의 분량이다. 일부 구현예에서, 상기 혼합 미공지 샘플 내의 상기 참조 분석물 및 상기 표적 분석물의 집단 내 상기 표적 분석물의 참 분량의 추정치()는 에 의해 결정되며, 여기서 상기 파라미터 ρ는 위양성 검출 오차, 위음성 검출 오차, 또는 둘 다에 대한 보상을 할 수 있는 비율의 추정치이고, 상기 파라미터 α는 상기 표적 분석물 및 상기 참조 분석물의 포획률 상수 차이에 대한 보상에 사용될 수 있다. 일부 구현예에서, 상기 파라미터 α는 참조 분석물 포획률을 표적 분석물 포획률로 나눈 비의 추정치이다.In some embodiments, the relative abundance is the amount of the target analyte in the population of the target analyte and the reference analyte. In some embodiments, an estimate of the true amount of the target analyte in the population of the reference analyte and the target analyte in the mixed unknown sample ( )Is , wherein the parameter ρ is an estimate of a ratio capable of compensating for false-positive detection error, false-negative detection error, or both, and wherein the parameter α is the difference in capture rate constants of the target analyte and the reference analyte. can be used for compensation. In some embodiments, the parameter α is an estimate of the ratio of the reference analyte capture rate divided by the target analyte capture rate.
일부 구현예에서, 본 명세서에서는 공지된 상대적 존재비의 표적 분석물 및 참조 분석물을 포함하는 대조군 샘플; 및 상기 대조군 샘플 및 상기 참조 분석물과 상기 표적 분석물을 포함하는 미공지 샘플을 나노포어 장치 내에서 실행하여 상기 미공지 샘플 내 상기 참조 분석물 및 상기 표적 분석물의 상대적 존재비를 결정하는 데 사용하기 위한 설명서를 포함하는 키트가 제공된다.In some embodiments, disclosed herein is a control sample comprising known relative abundances of a target analyte and a reference analyte; and running the control sample and an unknown sample comprising the reference analyte and the target analyte in a nanopore device to determine the relative abundance of the reference analyte and the target analyte in the unknown sample. A kit is provided with instructions for
일부 구현예에서, 본 명세서에서 표적 분석물을 포함하는 제 1 대조군 샘플로서, 상기 제 1 대조군 샘플이 참조 분석물을 포함하지 않는 제 1 대조군 샘플; 상기 참조 분석물을 포함하는 제 2 대조군 샘플로서, 상기 제 2 대조군 샘플은 상기 표적 분석물을 포함하지 않는 제 2 대조군 샘플; 공지된 상대적 존재비의 상기 표적 분석물 및 상기 참조 분석물을 포함하는 제 3 대조군 샘플; 및 상기 제 1 대조군 샘플, 상기 제 2 대조군 샘플, 상기 제 3 대조군 샘플 및 상기 참조 분석물 및 상기 표적 분석물을 포함하는 미공지 샘플을 개별로 나노포어 장치 내에서 실행하여 상기 미공지 샘플 내 상기 참조 분석물 및 상기 표적 분석물의 상대적 존재비를 결정하는 데 사용하기 위한 설명서를 포함하는 키트가 제공된다.In some embodiments, a first control sample comprising a target analyte herein, wherein the first control sample does not comprise a reference analyte; a second control sample comprising the reference analyte, wherein the second control sample does not include the target analyte; a third control sample comprising known relative abundances of said target analyte and said reference analyte; and running the first control sample, the second control sample, the third control sample, and the unknown sample comprising the reference analyte and the target analyte separately in a nanopore device, so that the in the unknown sample is Kits are provided comprising a reference analyte and instructions for use in determining the relative abundance of the target analyte.
일부 구현예에서, 본 명세서에서는 샘플 내 표적 분석물의 참 분포분율의 추정치를 결정하는 컴퓨터-구현되는 방법으로서: 적어도 하나의 참조 분석물 대조군 또는 표적 분석물 대조군으로부터 나노포어 센서로부터의 데이터를 얻는 단계로서, 상기 데이터는 상기 나노포어를 통하여 전위하는 표적 분석물 또는 참조 분석물로부터의 다수의 이벤트 신호를 포함하는 단계; 이벤트 신호의 하나 이상의 특징을 식별하여 표적 분석물과 관련된 신호 및 참조 분석물과 관련된 신호를 구별하는 단계; 서포트 벡터 머신을 훈련시켜 상기 제 1 이벤트를 상기 제 2 이벤트로부터 구별하기 위한 최적화된 한계를 식별하고 샘플 내에서 상기 참조 분석물 및 상기 표적 분석물의 참 상대적 존재비의 추정치를 생성하는 단계로서, 상기 훈련은 참조 대조군 샘플, 표적 대조군 샘플, 및 혼합 대조군 샘플로 구성되는 군으로부터 선택되는 대조군의 이용을 포함하고 상기 훈련은 공지된 혼합 샘플을 사용하여 검증하는 것을 포함하는 단계; 및 상기 훈련된 서포트 벡터 머신을 이용하여 혼합 샘플로부터 나노포어 장치에 기록된 이벤트로부터 샘플 내 표적 분석물의 분포분율을 결정하는 단계를 포함하는 방법이 제공된다.In some embodiments, provided herein is a computer-implemented method of determining an estimate of the true fraction of a target analyte in a sample, comprising: obtaining data from a nanopore sensor from at least one reference analyte control or target analyte control; wherein the data comprises a plurality of event signals from a target analyte or a reference analyte translocating through the nanopore; identifying one or more characteristics of the event signal to differentiate a signal associated with a target analyte and a signal associated with a reference analyte; training a support vector machine to identify an optimized limit for differentiating the first event from the second event and generating an estimate of the true relative abundance of the reference analyte and the target analyte in a sample, wherein the training comprises the use of a control selected from the group consisting of a reference control sample, a target control sample, and a mixed control sample, wherein the training comprises validating using a known mixed sample; and determining a distribution fraction of a target analyte in the sample from events recorded in the nanopore device from the mixed sample using the trained support vector machine.
일부 구현예에서, 본 명세서에서는 샘플 내 표적 분석물의 참 분포분율의 추정치를 결정하는 컴퓨터-구현되는 방법으로서: 나노포어 장치로부터 데이터 세트를 얻는 단계로서, 상기 데이터는 적어도 하나의 대조군 샘플 및 적어도 하나의 미공지 샘플로부터의 이벤트 신호를 포함하는 단계; 일련의 특징을 식별하여 상기 표적 분석물과 관련된 제 1 이벤트 신호를 상기 참조 분석물과 관련된 제 2 이벤트 신호로부터 구별하기 위한 한계를 생성하는 데 사용하는 단계; 및 훈련된 서포트 벡터 머신을 이용하여 상기 미공지 샘플 내 분포분율의 참값을 추정하는 단계를 포함하는 방법이 제공된다.In some embodiments, disclosed herein is a computer-implemented method of determining an estimate of a true fraction of a target analyte in a sample, comprising: obtaining a data set from a nanopore device, the data comprising at least one control sample and at least one including an event signal from an unknown sample of identifying a set of features and using them to create a limit for differentiating a first event signal associated with the target analyte from a second event signal associated with the reference analyte; and estimating the true value of the fraction of distribution in the unknown sample using a trained support vector machine.
일부 구현예에서, 본 명세서에서는 샘플 내 표적 분석물의 분포분율의 추정치를 결정하는 컴퓨터-구현되는 방법으로서: 하나 이상의 나노포어 장치로부터 데이터 세트를 얻는 단계로서, 각 나노포어 장치는 하나 이상의 나노포어를 포함하는 단계; 상기 데이터 세트로부터 도출된, 일련의 입력을, 멀티포어 분석모델로 처리하는 단계로서, 상기 일련의 입력은 상기 나노포어 세트 각각으로부터의 호출들을 포함하는 단계; 및 상기 멀티포어 분석모델의 응답 출력에 근거하여, 상기 샘플 내 표적 분석물의 분포분율의 추정치 및 분포분율의 신뢰도를 생성하는 단계를 포함하는 방법이 제공된다.In some embodiments, disclosed herein is a computer-implemented method of determining an estimate of a fraction of a distribution of a target analyte in a sample, comprising: obtaining a data set from one or more nanopore devices, each nanopore device comprising one or more nanopores. including; processing a set of inputs, derived from the data set, into a multipore analytical model, the set of inputs comprising calls from each of the set of nanopores; and generating, based on the response output of the multipore analysis model, an estimate of the distribution fraction of the target analyte in the sample and the reliability of the distribution fraction.
도면의 간단한 설명
상술한 목적 및 다른 목적, 특징 및 장점은 동일한 참조 부호가 상이한 도면 전체에 걸쳐 동일한 부분을 나타내는 첨부 도면에 예시된 바와 같이, 본 발명의 특정 구현예에 관한 아래의 설명으로부터 명확해질 것이다. 도면은 반드시 축척에 맞춰진 것은 아니며, 대신에 본 발명의 다양한 구현예의 원리를 설명하는 데 중점을 둔다.
도 1A는 나노포어를 통해 통과하는 dsDNA에 의해 야기되는 단일-분자 이벤트의 전형적인 전자 신호를 나타내며, 이는 전위의 특징적인 지속시간 및 전위 동안의 전류 감소를 나타낸다.
도 1B는 22 nm 직경의 나노포어 내에 기록된 5.6 kb dsDNA에 대하여 최대 δG 대 지속시간의 모든-이벤트 산점도를 보여준다.
도 2A는 727 bp DNA가 1 M LiCl 내 100 mV에서 25 nm 직경의 고체-상태 나노포어를 통과할 때 나타나는 전형적인 이벤트를 보여준다. 배출 면적이 음영으로 표시되어 있다.
도 2B는 이벤트 깊이가 보존되는 동안, 증가된 dsDNA 길이에 따른 이벤트 지속시간의 증가를 보여준다.
도 2C는 나타난 각 길이에서 dsDNA에 대해 기록된 모든 이벤트 면적의 log10 의 분포의 플롯을 보여준다.
도 3A는 제 1 유형 분석물(사각형) 및 제 2 유형 분석물(원)로부터의 이벤트 사이에 생성되는 한계의 한 예를 도시한 것이다.
도 3B는 제 1 유형 분석물(사각형) 및 제 2 유형 분석물(원)로부터의 이벤트 사이의 선형 한계의 정확도를 증가시키기 위하여 더 높은 차원 공간으로의 입력 특징의 변환의 결과의 한 예를 도시한 것이다.
도 4A는 이번트 면적에 따른 참조 분석물 샘플, 표적 분석물 샘플, 및 혼합 샘플로부터의 모든 이벤트에 대한 확률 히스토그램을 보여준다.
도 4B는 참조 분석물만(Qref), 표적 분석물만(Qtarg), 및 표적 분석물 및 참조 분석물의 혼합 샘플(Qmix)로부터의 면적 한계 미만인 이벤트의 백분율의 그래프를 도시한 것이다.
도 4C는 분량 파라미터 가 q 값에서 그래픽으로 어떻게 나타나는지 보여준다. q = 5 pA*ms 한계(수직 점선)는 위양성 0.05(즉, Q ref = 0.05) 및 위음성 0.1(즉, Q targ = 0.9)에 해당한다.
도 5A는 표적 유전자의 상대적 존재비의 추정치(GMO(%) () 대 표적 유전자의 참 상대적 존재비(GMO(%))의 결정 결과를 보여준다. 비교를 위하여 영오차선(기울기 = 1)의 위 및 아래에 10% 오차 한계가 도시된다.
도 5B는 2 개의 분리된 대조군 및 6 개의 공지된 혼합물을 사용하여 샘플 내 유전자 변형 생물체의 참 상대적 존재비의 추정치의 결정의 결과를 보여준다. 예측된 표적 존재비 백분율 값은 참 표적 존재비 백분율에 대해 도시된다. 비교를 위하여 영오차선(기울기 = 1)의 위 및 아래에 10% 오차 한계가 도시된다.
도 6은 이벤트 면적에 따라 참조 분석물로부터 표적 분석물을 구별하기 위한 한계의 범위에 대한 표적 분석물 존재비의 추정치(GMO(%))의 결과를 보여준다.
도 7은 표적 및 참조 분석물로부터의 이벤트 신호를 구별하기 위한 최적 파라미터가 있는 훈련된 서포트 벡터 머신으로부터의 시험 데이터 세트에 대한 정확도를 예측을 보여준다.
도 8은 동일한 포어 상에서 분리된 대조군으로서 연속적으로 실행된 2 가지 분자 유형(프로브/페이로드에 결합된 94bp 표적 dsDNA 및 프로브/페이로드에 결합된 74bp 참조 dsDNA)에 대한 이벤트를 보여준다.
도 9A는 중첩된 100% 표적 분석물 대조군 샘플(닫힌 원) 및 100% 참조 분석물 대조군 샘플(열린 사각형)에 대하여 평균 δG 대 지속시간의 대표적인 이벤트 플롯을 나타낸다. 표적 분석물은 3-분지 PEG에 연결된 G12D-결합 프로브가 있는 89bp DNA(이하, G12D-3bPEG)이다. 참조 분석물은 8-암 PEG에 연결된 야생형(c.35G)-결합 프로브가 있는 89bp DNA(이하, WT-8armPEG)이다. 나노포어를 통과하는 표적 분석물로부터 이벤트 신호를 식별하기 위한 한계( msec, nS 및 nS)가 표적 태그 상자(점선)를 생성한다.
도 9B는 도 9A로부터, 플롯에 중첩된 표적 분석물과 참조 분석물을 포함하는 미공지 샘플 A(삼각형) 및 샘플 B(별)로부터의 데이터가 있는 플롯을 보여준다.
도 10은 중첩된 100% 표적 분석물 대조 샘플(닫힌 원)과 100% 참조 분석물 대조 샘플(열린 사각형)에 대하여 평균 δG 대 지속시간의 대표 이벤트 플롯을 보여준다. 참조 분석로부터 표적 분석물을 구별하기 위한 서포트 벡터 머신-식별된 결정 경계(즉, 한계)도 표시된다.
도 11은 최대 δG 대 지속시간의 모든 이벤트 산점도에 플롯팅된 50% 표적/50% 참조 혼합 샘플로부터의 이벤트를 보여준다. 표적 도메인 상자는 프로브-결합 돌연변이 표적과 관련된 이벤트를 포함한다.
도 12는 표적(돌연변이) 및 참조(야생형) 집단의 식별을 위해 도 11에 도시된 50% 표적 / 50% 참조 혼합 샘플로부터의 데이터에 3-가우스 혼합 모델을 사용하여 가우스 혼합에 대한 기대 최대화 알고리즘(EMGM)을 적용한 결과를 보여준다.
도 13은 위양성 분율을 결정하기 위하여 참조 분석물만의 대조군 샘플로부터의 데이터에 3-가우스 혼합 모델을 사용하여 EMGM을 적용한 결과를 보여준다.
도 14는 미공지 샘플 내 돌연변이(표적) 분자의 상대적 존재비를 확인하기 위하여 혼합 미공지 샘플로부터의 데이터에 3-가우스 혼합 모델을 사용하여 EMGM을 적용한 결과를 보여준다.
도 15A는 샘플 내 표적 분석물의 분포분율을 결정하기 위하여 다수의 포어로부터 컨센서스 호출을 이용하는 방법의 흐름도를 도시한다.
도 15B는 분포분율을 결정하기 위하여 4 개의 포어로부터 컨센서스 호출을 이용하는 구현예를 도시한다.
도 15C는 임의의 수의 나노포어로부터, 도 15B의 시스템의 구현예에 의해 구현되는 방법의 흐름도를 도시한다.
도 15D는 단일 나노포어 및 다수의 나노포어로부터 유래된 정보를 이용하여 표적 분자의 농도를 결정하기 위한 방법의 출력을 도시한다.
도 16A는 하나 이상의 구현예에 따라, 나노포어로부터의 데이터를 사전 필터링하기 위한 방법의 흐름도를 도시한다.
도 16B는 도 16A에 도시된 방법의 출력을 도시하며, 나노포어로부터의 이벤트 데이터는 전기 신호 대 체류시간의 진폭에 의해 플롯팅된다.
도 16C는 도 16A 및 16B에 도시된 방법의 출력을 도시하며, PCA 과정의 성분들(PC1 및 PC2)을 사용하여 각 샘플 집단에 대한 가우스 분포 계수 대 PC1를 생성한다.
도 16D는 도 16C에 도시된 PCA 과정의 출력을 이용하여 분리 점수를 생성하는 데 사용되는 데이터를 도시한다.
도 16E는 샘플의 보정 비율을 확인하기 위하여, 최대 전류 진폭을 초 단위의 체류시간의 로그 함수에 대해 플롯팅한 것을 도시한다. Brief description of the drawing
The foregoing and other objects, features and advantages will become apparent from the following description of specific embodiments of the present invention, as illustrated in the accompanying drawings in which like reference numerals indicate like parts throughout different drawings. The drawings are not necessarily to scale, emphasis instead being placed on illustrating the principles of various embodiments of the invention.
1A shows a typical electronic signal of a single-molecule event caused by a dsDNA passing through a nanopore, showing the characteristic duration of the translocation and the decrease in current during the translocation.
1B shows an all-event scatterplot of maximum δG versus duration for a 5.6 kb dsDNA recorded in 22 nm diameter nanopores.
2A shows typical events that occur when 727 bp DNA passes through a 25 nm diameter solid-state nanopore at 100 mV in 1 M LiCl. The discharge area is shaded.
Figure 2B shows an increase in event duration with increased dsDNA length, while event depth was preserved.
2C shows a plot of the distribution of log 10 of all event areas recorded for dsDNA at each length shown.
3A depicts an example of a boundary created between events from a first type analyte (square) and a second type analyte (circle).
3B shows an example of the result of transformation of an input feature into a higher dimensional space to increase the accuracy of the linear limit between events from a first type analyte (square) and a second type analyte (circle). did it
4A shows the probability histograms for all events from the reference analyte sample, the target analyte sample, and the mixed sample as a function of event area.
4B depicts a graph of the percentage of events below the area limit from reference analyte only (Q ref ), target analyte only (Q targ ), and a mixed sample of target analyte and reference analyte (Q mix ).
Figure 4C shows the aliquot parameters. shows how is represented graphically at the q value. The q = 5 pA*ms limit (vertical dashed line) corresponds to a false positive of 0.05 (ie, Q ref = 0.05) and a false negative of 0.1 (ie, Q targ = 0.9).
5A is an estimate of the relative abundance of target genes (GMO (%) ( ) versus the true relative abundance (GMO (%)) of the target gene. For comparison, the 10% margin of error is shown above and below the zero lane (slope = 1).
5B shows the results of determination of an estimate of the true relative abundance of genetically modified organisms in a sample using two separate controls and six known mixtures. Predicted target abundance percentage values are plotted versus true target abundance percentages. For comparison, the 10% margin of error is shown above and below the zero lane (slope = 1).
6 shows the results of estimates of target analyte abundance (GMO (%)) for a range of limits for differentiating target analytes from reference analytes according to event area.
7 shows prediction of accuracy on a test data set from a trained support vector machine with optimal parameters for discriminating event signals from target and reference analytes.
8 shows events for two molecular types (94 bp target dsDNA bound to probe/payload and 74 bp reference dsDNA bound to probe/payload) run serially as controls isolated on the same pore.
9A is Representative event plots of mean δG versus duration are shown for overlaid 100% target analyte control samples (closed circles) and 100% reference analyte control samples (open squares). The target analyte is 89 bp DNA (hereinafter G12D-3bPEG) with a G12D-binding probe linked to a 3-branched PEG. The reference analyte is 89 bp DNA (hereafter WT-8armPEG) with a wild-type (c.35G)-binding probe linked to an 8-arm PEG. Limitations for identifying event signals from target analytes that pass through the nanopores ( msec, nS and nS) creates a target tag box (dotted line).
FIG. 9B shows a plot from FIG. 9A with data from unknown sample A (triangles) and sample B (stars) comprising target and reference analytes superimposed on the plots.
FIG. 10 shows representative event plots of mean δG versus duration for overlapped 100% target analyte control samples (closed circles) and 100% reference analyte control samples (open squares). Support vector machine-identified decision boundaries (ie, limits) for differentiating target analytes from reference analyses are also indicated.
11 shows events from a 50% target/50% reference mixed sample plotted on a scatter plot of all events of maximum δG versus duration. The target domain box contains events related to the probe-binding mutation target.
Figure 12 is an expectation maximization algorithm for Gaussian mixing using a 3-Gaussian mixture model on data from the 50% target / 50% reference mixed sample shown in Figure 11 for identification of target (mutant) and reference (wild-type) populations. (EMGM) is applied.
13 shows the results of applying EMGM using a 3-Gaussian mixture model to data from a control sample of reference analyte only to determine the false positive fraction.
14 shows the results of applying EMGM to data from a mixed unknown sample using a 3-Gaussian mixture model to determine the relative abundance of mutant (target) molecules in the unknown sample.
15A depicts a flow diagram of a method of using a consensus call from multiple pores to determine the distribution fraction of a target analyte in a sample.
15B shows an implementation that uses a consensus call from four pores to determine the distribution fraction.
15C shows a flow diagram of a method implemented by an implementation of the system of FIG. 15B, from any number of nanopores.
15D depicts the output of a method for determining the concentration of a target molecule using information derived from single nanopores and multiple nanopores.
16A depicts a flow diagram of a method for pre-filtering data from nanopores, in accordance with one or more implementations.
Figure 16B shows the output of the method shown in Figure 16A, wherein event data from the nanopores is plotted by the amplitude of the electrical signal versus residence time.
16C shows the output of the method shown in FIGS. 16A and 16B , using the components of the PCA process (PC1 and PC2) to generate Gaussian distribution coefficients versus PC1 for each sample population.
FIG. 16D shows the data used to generate a separation score using the output of the PCA process shown in FIG. 16C.
Figure 16E shows the plot of the maximum current amplitude as a log function of the dwell time in seconds to confirm the calibration rate of the sample.
상세한 설명details
본 발명의 다양한 구현예의 세부사항은 하기 설명에서 설명된다. 본 발명의 다른 특징, 목적, 및 장점은 하기의 설명, 및 도면, 및 청구범위로부터 명백할 것이다.The details of various embodiments of the invention are set forth in the description that follows. Other features, objects, and advantages of the present invention will be apparent from the following description, and drawings, and from the claims.
정의Justice
본 출원 전반에 걸쳐, 본문은 본 영양소, 조성물, 및 방법의 다양한 구현예를 기술한다. 기술된 다양한 구현예는 다양한 예를 제공하기 위한 것이며 양자택일적인 설명으로 해석되지 않아야 한다. 반대로 본 명세서에 제공된 다양한 구현예의 설명은 중복되는 범위일 수 있다는 점에 유의해야 한다. 본 명세서에서 논의된 구현예들은 단지 예시적인 것이며 본 발명의 범위를 제한하고자 하는 것이 아니다.Throughout this application, the text describes various embodiments of the present nutrients, compositions, and methods. The various implementations described are for the purpose of providing various examples and should not be construed as alternative descriptions. Conversely, it should be noted that the descriptions of various embodiments provided herein may be in overlapping scope. The embodiments discussed herein are illustrative only and are not intended to limit the scope of the invention.
본 명세서 전반에 걸쳐, 다양한 문헌, 특허 및 공개된 특허 명세서가 식별 인용에 의해 참조된다. 이러한 문헌, 특허 및 공개된 특허 명세서의 개시는 본 발명이 속하는 기술 분야의 최신 기술을 보다 상세하게 설명하기 위하여 본 명세서에 참조로서 포함된다.Throughout this specification, various documents, patents, and published patent specifications are referenced by identification citation. The disclosures of these documents, patents, and published patent specifications are incorporated herein by reference in order to describe in more detail the state-of-the-art in the technical field to which the present invention pertains.
본 명세서 및 청구범위에서 사용된 바와 같이, 단수형 "하나(a),", "하나(an)" 및 "그(the)"는 문맥상 분명하게 달리 지시하지 않는 한 복수의 내용을 포함한다. 예를 들어, 용어 "전극(an electrode)"은, 이들의 혼합물을 포함하는 다수의 전극을 포함한다.As used herein and in the claims, the singular forms “a,” “an,” and “the” include the plural unless the context clearly dictates otherwise. For example, the term “an electrode” includes a plurality of electrodes, including mixtures thereof.
본 명세서에서 사용된, 용어 "포함하는"은 장치 및 방법이 언급된 구성요소 또는 단계를 포함하지만, 다른 것을 배제하지 않는다는 것을 의미하도록 의도된다. 장치 및 방법을 정의할 때 사용되는 "본질적으로 구성되는"은 조합에 본질적 중요성을 갖는 다른 구성요소 또는 단계를 배제하는 것을 의미한다. "구성되는"은 다른 구성요소 또는 단계를 배제하는 것을 의미한다. 이러한 전이 용어 각각에 의해 정의되는 구현예는 본 발명의 범위 내에 포함된다.As used herein, the term “comprising” is intended to mean that apparatus and methods include the recited components or steps, but do not exclude others. "Consisting essentially of," as used when defining apparatus and methods, means excluding other elements or steps of essential importance to the combination. "Consisting of" means excluding other elements or steps. Embodiments defined by each of these transition terms are included within the scope of the present invention.
예컨대 거리, 크기, 온도, 시간, 전압 및 농도와 같은, 범위를 포함하는, 모든 수치 지정은, 파라미터의 측정에서 일반적인 실험적 편차를 포함하도록 의도된근사값이며, 이러한 편차는 기술된 구현예의 범위 내에 포함되도록 의도된다. 항상 명시적으로 언급된 것은 아니더라도, 모든 수치적 지정이 용어 "약"이 선행되는 것으로 이해되어야 한다. 또한 비록 명시적으로 언급된 것은 아니지만, 본 명세서에 기재된 구성요소는 단지 예시적이며 이의 등가물이 당해 기술 분야에 공지되어 있음을 이해해야 한다.All numerical designations, including ranges, such as distance, size, temperature, time, voltage, and concentration, are approximations intended to include general experimental deviations in the measurement of parameters, such deviations being included within the scope of the described embodiments. it is intended to be It is to be understood that all numerical designations are preceded by the term “about,” although not always explicitly stated. It is also to be understood that, although not explicitly recited, the components described herein are exemplary only and equivalents thereof are known in the art.
본 명세서에서 사용된, 용어 "분석물"은 포어 내 분석물의 상대적 존재비의 결정을 용이하게 하기 위한 나노포어 센서를 사용하여 존재 여부를 검출할 수 있는 임의의 분자, 화합물, 복합체, 또는 기타 독립체를 지칭한다. 표적 또는 참조 분석물을 지칭할 때, 용어 표적 또는 참조 분자는 교환 가능하게 사용될 수 있다.As used herein, the term “analyte” refers to any molecule, compound, complex, or other entity capable of detecting its presence using a nanopore sensor to facilitate determination of the relative abundance of an analyte in a pore. refers to When referring to a target or reference analyte, the terms target or reference molecule may be used interchangeably.
본 명세서에서 사용된, 용어 "표적 분석물"은 샘플 내의 관심 있는 분자 또는 복합체를 지칭한다. 일부 구현예에서, 상기 표적 분석물은 관심 있는 핵산의 서열을 갖는 폴리뉴클레오타이드의 일부를 포함한다. 상기 표적 분석물은 본 명세서에 기재된 바와 같이, 나노포어 센서 내 표적 분석물의 검출을 용이하게 하기 위한 프로브에 의한 결합을 위해 특이적으로 표적화될 수 있다.As used herein, the term “target analyte” refers to a molecule or complex of interest in a sample. In some embodiments, the target analyte comprises a portion of a polynucleotide having a sequence of a nucleic acid of interest. The target analyte can be specifically targeted for binding by a probe to facilitate detection of the target analyte in the nanopore sensor, as described herein.
본 명세서에서 사용된, 용어 "참조 분석물"은 샘플 내의 관심 있는 분자 또는 복합체를 지칭하며, 그 존재비가 표적 분석물에 대한 정량화의 상대적 척도로 이용된다. 일부 구현예에서, 상기 참조 분석물은 관심 있는 핵산의 서열을 갖는 폴리뉴클레오타이드의 일부를 포함한다. 상기 참조 분석물은 본 명세서에 기재된 바와 같이, 나노포어 센서 내 표적 분석물의 검출을 용이하게 하기 위한 프로브에 의한 결합을 위해 특이적으로 표적화될 수 있다.As used herein, the term "reference analyte" refers to a molecule or complex of interest in a sample, whose abundance is used as a relative measure of quantification for a target analyte. In some embodiments, the reference analyte comprises a portion of a polynucleotide having a sequence of a nucleic acid of interest. The reference analyte can be specifically targeted for binding by a probe to facilitate detection of the target analyte in the nanopore sensor, as described herein.
본 명세서에서 사용된, 용어 "특이적 결합" 또는 "특이적으로 결합"은 표적 분석물 또는 참조 분석물에 대한 프로브의 표적화된 결합을 지칭한다.As used herein, the term “specific binding” or “specifically binding” refers to the targeted binding of a probe to a target analyte or reference analyte.
본 명세서에서 사용된, 용어 "프로브"는 표적 분석물 또는 그 단편에 특이적으로 결합하는 분자를 지칭한다. 일부 구현예에서, 상기 프로브는 프로브-페이로드 분자 또는 복합체에 결합된 표적 또는 참조 분석물을 포함하는 복합체의 전위 시 생성되는 전자 신호에 영향을 주도록 구성된 페이로드 분자를 포함한다. 일부 구현예에서, 상기 프로브는 페이로드 분자에 결합하도록 변형된 페이로드 분자 결합 모이어티를 포함한다.As used herein, the term “probe” refers to a molecule that specifically binds to a target analyte or fragment thereof. In some embodiments, the probe comprises a payload molecule configured to affect an electronic signal generated upon translocation of the probe-payload molecule or complex comprising a target or reference analyte bound to the complex. In some embodiments, the probe comprises a payload molecule binding moiety modified to bind to a payload molecule.
본 명세서에서 사용된, 용어 "페이로드 분자"는 차원의 관련된 범위 내에서 나노포어 내에 포획될 때 특유의 전기 신호의 생성을 용이하게 하는 물리적 차원을 갖는 분자를 지칭한다. 페이로드 분자는 표적 분석물 또는 참조 분석물에 결합되어 나노포어 장치 내 표적 분석물 또는 참조 분석물의 검출을 용이하게 할 수 있다. 일부 구현예에서, 상기 페이로드 분자는 구동 분자로 작용하도록 하전될 수 있다. 일부 구현예에서, 상기 페이로드 분자는 프로브 분자에 특이적으로 결합할 수 있는 프로브 결합 모이어티를 포함하며, 프로브는 표적 분석물 또는 참조 분석물에 특이적으로 결합한다.As used herein, the term “payload molecule” refers to a molecule having a physical dimension that facilitates the generation of a distinctive electrical signal when captured within a nanopore within a relevant range of dimensions. The payload molecule may be bound to a target analyte or reference analyte to facilitate detection of the target analyte or reference analyte in the nanopore device. In some embodiments, the payload molecule may be charged to act as a driving molecule. In some embodiments, the payload molecule comprises a probe binding moiety capable of specifically binding to a probe molecule, and the probe specifically binds to a target analyte or a reference analyte.
본 명세서에서 사용된 용어 "나노포어"(또는, 단순히 "포어")는 두 개의 부피를 분리하는 막 내의 단일 나노-규모 개구부를 지칭한다. 상기 포어는, 예컨대 지질 이중층 막 내에 삽입된 단백질 채널일 수 있거나, 또는 질화규소 또는 이산화규소 또는 그래핀 또는 이들의 또는 다른 물질들과의 조합으로 이루어진 층과 같은, 얇은 고체 상태의 기판을 통해 드릴링 또는 에칭 또는 전압-펄스 방법을 사용하여 조작될 수 있다. 기하학적으로, 상기 포어는 직경이 0.1 nm 이상 및 직경이 1 미크론 이하인 치수를 가지고 있고; 포어의 길이는, 두께가 나노미터 이하, 또는 두께가 최대 1 미크론 또는 그 이상의 두께가 될 수 있는 막의 두께에 의해 결정된다. 수백 나노미터보다 두꺼운 막의 경우, 나노포어를 "나노채널"로 지칭할 수 있다.As used herein, the term “nanopore” (or simply “pore”) refers to a single nano-scale opening in a membrane that separates two volumes. The pores may be, for example, protein channels embedded within a lipid bilayer membrane, or drilled through or through a thin solid-state substrate, such as a layer made of silicon nitride or silicon dioxide or graphene or a combination thereof or other materials. It can be manipulated using etching or voltage-pulsing methods. geometrically, the pores have dimensions that are greater than or equal to 0.1 nm in diameter and less than or equal to 1 micron in diameter; The length of the pores is determined by the thickness of the film, which can be up to a nanometer thick, or up to 1 micron thick or more thick. For membranes thicker than several hundred nanometers, the nanopores may be referred to as “nanochannels”.
본 명세서에서 사용된, 용어 "나노포어 기기" 또는 "나노포어 장치"는 단일 분자 이벤트를 감지하기 위한 회로와 하나 이상의 나노포어를 (병렬 또는 직렬로) 결합한 장치를 지칭한다. 나노포어로 감지를 용이하게 하는 데 사용되는 챔버 및 전극을 포함하는, 나노포어 장치 내의 각 나노포어는, 본 명세서에서 나노포어 센서로 지칭한다. 구체적으로, 나노포어 기기는 민감한 전압-클램프 증폭기를 이용하여 상기 포어(들)을 통해 이온 전류를 측정하는 동안 포어 또는 포어들에 특정한 전압을 가한다. 이중-가닥 DNA(dsDNA)와 같은 단일 하전된 분자가 포획되어 전기영동에 의해 포어를 통해 구동될 때, 측정된 전류가 변하여, 포획 이벤트(즉, 나노포어를 통한 분자의 전위, 또는 나노포어 내 분자의 포획)를 나타내고, 변화량 (전류 진폭) 및 이벤트의 지속시간은 상기 나노포어 내 포획된 분자를 특징짓는 데 사용된다. 실험 동안 많은 이벤트를 기록한 후, 이벤트의 분포를 분석하여 변화량(즉, 전류 신호)에 따른 상응하는 분자를 특징짓는다. 이러한 방식으로, 나노포어는 생분자의 감지를 위한 간단하고, 표지화가 없으며, 완전히 전기적인 단일-분자 방법을 제공한다.As used herein, the term “nanopore device” or “nanopore device” refers to a device that combines (in parallel or series) one or more nanopores with circuitry for sensing single molecule events. Each nanopore within a nanopore device, including a chamber and electrodes used to facilitate sensing with the nanopore, is referred to herein as a nanopore sensor. Specifically, the nanopore device applies a specific voltage to the pore or pores while measuring the ion current through the pore(s) using a sensitive voltage-clamp amplifier. When a single charged molecule, such as double-stranded DNA (dsDNA), is captured and driven through a pore by electrophoresis, the measured current changes, resulting in a capture event (i.e., the potential of the molecule through the nanopore, or within the nanopore). entrapment of molecules), the amount of change (current amplitude) and the duration of the event are used to characterize the entrapped molecules within the nanopore. After recording many events during the experiment, the distribution of events is analyzed to characterize the corresponding molecules according to the amount of change (ie the current signal). In this way, nanopores provide a simple, label-free, fully electrical single-molecule method for the detection of biomolecules.
본 명세서에서 사용된, 용어 "전기 신호"는 전자 회로의 구성에 따라 시간 경과에 따른 수집된 전류, 임피던스 / 저항, 또는 전압의 일련의 데이터를 포함한다. 일반적으로, 전류는 "전압 클램프" 구성에서 측정되고; 전압은 "전류 클램프" 구성에서 측정되며, 저항은 옴의 법칙 V = IR을 사용하여 상기 두 가지 중 하나에서 파생될 수 있다. 또한 임피던스는 나노포어 장치로부터 수집된 전류 또는 전압 데이터로부터 측정하여 생성될 수 있다. 본 명세서에서 언급된 전기 신호의 유형은 전류 신호 및 전류 임피던스 신호를 포함하지만, 그 밖의 다양한 전기 신호가 나노포어 내 입자를 검출하는 데 사용될 수 있다.As used herein, the term “electrical signal” includes a series of data of current, impedance/resistance, or voltage collected over time depending on the configuration of an electronic circuit. In general, current is measured in a “voltage clamp” configuration; Voltage is measured in a "current clamp" configuration, and resistance can be derived from either of the above using Ohm's Law V = IR. Impedance can also be generated by measuring from current or voltage data collected from the nanopore device. Although the types of electrical signals referred to herein include current signals and current impedance signals, a variety of other electrical signals may be used to detect particles within the nanopores.
본 명세서에서 사용된, 용어 "이벤트"는 검출 가능한 분자 또는 분자 복합체의 나노포어를 통한 전위 및 전기 신호를 통한 관련 측정, 예를 들어, 시간 경과에 따른 나노포어를 통한 전류에서의 변화를 지칭한다. 이는 전류, 기준 개방 채널로부터의 전류의 변화, 지속시간, 및/또는 나노포어 내의 분자 검출의 기타 특징으로 정의될 수 있다. 비슷한 특징을 갖는 다수 이벤트는 동일한 또는 유사한 특징(예컨대, 크기, 전하)이 있는 분자 또는 복합체 집단을 나타낸다.As used herein, the term “event” refers to a change in the potential through a nanopore of a detectable molecule or molecular complex and a related measurement through an electrical signal, e.g., a current through the nanopore over time. . This may be defined as current, change in current from a reference open channel, duration, and/or other characteristics of detection of molecules within the nanopore. Multiple events with similar characteristics represent a population of molecules or complexes with the same or similar characteristics (eg, size, charge).
본 명세서에서 사용된, 이벤트의 "면적"은 이벤트의 지속시간(즉, 전류가 개방 채널 전류 신호와 달라지는 지속시간)을 이벤트의 지속시간 동안 개방 채널로부터의 전류의 평균 변화량에 곱한 값(즉, pA*ms)의 절대값을 지칭한다.As used herein, "area" of an event is the duration of the event (i.e., the duration at which the current varies from the open channel current signal) multiplied by the average change in current from the open channel over the duration of the event (i.e., pA*ms).
본 명세서에서 사용된, 용어 "상대적 존재비"는 한 그룹 내의 관련된 항목들의 전체 수에 대한 한 항목의 양을 지칭한다. 예를 들어, 샘플 내의 표적 분석물과 관련하여, 상기 표적 분석물의 상대적 존재비는 참조 분석물 대비 샘플 내에 존재하는 표적 분석물의 양을 지칭한다. 이를 분포분율, 예를 들어 표적 분석물 및 참조 분석물의 총 집단과 비교한 샘플 내 표적 분석물의 백분율로 표시할 수 있다. 상기 상대적 존재비는 또한 예컨대, 표적 분석물:참조 분석물의 비율로도 나타낼 수 있다. 전자 신호와 관련하여서, 전자 신호 그룹의 상대적 존재비는 참조 분석물과 관련된 제 2 전자 신호의 양 대비 표적 분석물과 관련된 제 1 전자 신호의 양을 지칭할 수 있다. 샘플 내 표적 분석물의 참 상대적 존재비(즉, 이미 측정되었거나 공지된 상대적 존재비를 가지도록 제조됨) 및 본 명세서에서 제공된 방법에 따라 결정된 상대적 존재비를 구별하기 위하여, 참 상대적 존재비를 "참 상대적 존재비"로, 본 명세서에서 제공된 방법에 따라 결정된 상대적 존재비를 "참 상대적 분포의 추정치"로 지칭하기도 한다.As used herein, the term “relative abundance” refers to the amount of an item relative to the total number of related items in a group. For example, with respect to a target analyte in a sample, the relative abundance of the target analyte refers to the amount of the target analyte present in the sample relative to a reference analyte. This can be expressed as a fraction of distribution, eg, the percentage of target analyte in the sample compared to the total population of target analyte and reference analyte. The relative abundance can also be expressed as, for example, the ratio of target analyte:reference analyte. With respect to electronic signals, the relative abundance of a group of electronic signals may refer to an amount of a first electronic signal associated with a target analyte compared to an amount of a second electronic signal associated with a reference analyte. To distinguish between the true relative abundance of a target analyte in a sample (i.e., previously measured or prepared to have a known relative abundance) and a relative abundance determined according to the methods provided herein, the true relative abundance is referred to as "true relative abundance". , the relative abundance determined according to the methods provided herein is also referred to as an “estimate of the true relative distribution”.
본 명세서에서 사용된, 용어 "대조군 샘플"은 참조 분석물에 대한 표적 분석물의 공재된 상대적 존재비를 포함하는 샘플을 지칭한다. 참조 대조군 샘플, 표적 대조군 샘플, 및 혼합 대조군 샘플과 같은 대조군 샘플은, 본 명세서에서 미공지 샘플 내 분포분율의 추정치의 정확도를 높이기 위하여 사용된다. 일부 구현예에서, 대조군 샘플은 표적 분석물, 참조 분석물, 또는 둘 다를 포함한다.As used herein, the term “control sample” refers to a sample comprising a co-located relative abundance of a target analyte to a reference analyte. Control samples, such as reference control samples, target control samples, and mixed control samples, are used herein to increase the accuracy of estimates of the fraction of distribution in the unknown sample. In some embodiments, a control sample comprises a target analyte, a reference analyte, or both.
본 명세서에서 사용된, 용어 "미공지 샘플" 또는 "미공지 혼합 샘플" 또는 "혼합 미공지 샘플"은 미공지된 참조 분석물의 상대적 존재비를 포함하는 샘플을 지칭한다. 참조 분석물의 상대적 존재비는 본 명세서에서 제공된 방법에 의해 상대적 존재비를 결정해야 하는 경우, 그 추정치의 일부 값이 이미 알려져 있다고 해도, 모르는 것으로 간주된다. 일부 미공지 샘플의 경우, 샘플 내 참조 분석물의 양 또는 농도는 공지되어 있다.As used herein, the term “unknown sample” or “unknown mixed sample” or “mixed unknown sample” refers to a sample comprising the relative abundance of an unknown reference analyte. When the relative abundance of a reference analyte is to be determined by the methods provided herein, it is considered unknown, even if some value of that estimate is already known. For some unknown samples, the amount or concentration of the reference analyte in the sample is known.
본 명세서에서 사용된, 용어 "공지된 샘플"은 참조 분석물에 대한 표적 분석물의 공지된 상대적 존재비를 포함하는 샘플을 지칭하며, 이는 분포분율 추정 모델 또는 한계와 같은, 그 모델의 특징을 훈련, 검증하거나, 정확도를 추정치를 제공하는 데 사용된다.As used herein, the term "known sample" refers to a sample comprising a known relative abundance of a target analyte to a reference analyte, which is trained on features of that model, such as a fractional distribution estimation model or limits; Used to verify or provide an estimate of accuracy.
도입/개요Introduction/Overview
일부 구현예에서, 본 명세서에서 제공되는 본 발명은, 샘플 내에 존재하는 참조 분석물에 대한 표적 분석물의 참 상대적 존재비의 추정치(예컨대, 분량 또는 비율)을 결정하는 방법을 제공한다. 이 방법은 나노포어 단일 분자 계수 장치(즉, 나노포어 장치)를 이용하여 샘플 내에서 표적 분석물 및 참조 분석물을 검출하고 구별한다.In some embodiments, the invention provided herein provides methods for determining an estimate (eg, quantity or ratio) of the true relative abundance of a target analyte to a reference analyte present in a sample. This method utilizes a nanopore single molecule counting device (ie, a nanopore device) to detect and discriminate between target and reference analytes in a sample.
표적 분석물 및 참조 분석물과 관련된 원시 전자 이벤트 신호의 샘플 내 표적 분석물의 상대적 존재비의 추정치를 결정하는 데의 이용은 위양성 검출 오차, 위음성 검출 오차, 및 혼합 샘플 내 표적 분석물 및 참조 분석물 간의 포획률 상수 차이와 관련된 오차를 포함하는, 여러 이유 때문에 부정확할 수 있다. 본 명세서에서, 일부 구현예에 따르면, 샘플 내 참조 및 표적 분석물의 참 분포분율을 추정하는 정확도를 개선하는 방법을 제공한다. 일부 구현예에서, 이러한 방법은 혼합 샘플 내에서의 전자 신호 검출과 관련된 하나 이상의 오차에 대한 보정을 위해 특별히 고안된 대조군 샘플의 사용을 수반한다. 상기 혼합 샘플이 공지된 양 또는 농도의 참조 보석물을 포함할 때, 상대적 존재비의 개선된 추정치는 샘플 내 표적 분석물의 참 양 또는 농도의 개선된 추정치를 제공하는 데 사용될 수 있다.The use of raw electronic event signals associated with a target analyte and a reference analyte to determine an estimate of the relative abundance of a target analyte in a sample includes false positive detection error, false negative detection error, and between target analyte and reference analyte in a mixed sample. It can be inaccurate for a number of reasons, including errors related to differences in capture rate constants. Provided herein, in accordance with some embodiments, are methods for improving the accuracy of estimating the true distribution fraction of a reference and target analyte in a sample. In some embodiments, such methods involve the use of a control sample specifically designed for correction for one or more errors associated with detection of an electronic signal within the mixed sample. When the mixed sample includes a known amount or concentration of a reference gemstone, an improved estimate of the relative abundance can be used to provide an improved estimate of the true amount or concentration of the target analyte in the sample.
일부 구현예에서, 본 명세서에서 제공되는 방법은 위양성 또는 위음성 검출 오차, 또는 상기 표적 분석물 및 상기 참조 분석물 간의 포획률 상수 차이를 감안하여 혼합 미공지 샘플 내 표적 분석물의 분포분율의 추정치의 정확도를 개선한다. 일부 구현예에서, 위양성 표적 분석물 검출 오차를 감안하기 위한 참조 분석물만- 대조군 샘플, 위음성 표적 분석물 검출 오차를 감안하기 위한 표적 분석물만-대조군 샘플, 및 표적 분석물 및 참조 분석물 간의 포획률 상수 차이를 감안하기 위한 하나 이상의 혼합 대조군 샘플을 포함하는, 일련의 대조군 샘플이 분포분율의 추정치의 정확도를 개선하기 위하여 이용된다.In some embodiments, the methods provided herein allow for false positive or false negative detection errors, or differences in capture rate constants between the target analyte and the reference analyte, to account for the accuracy of an estimate of the distribution of a target analyte in a mixed unknown sample. to improve In some embodiments, reference analyte only-control sample to account for false-positive target analyte detection error, target analyte only-control sample to account for false-negative target analyte detection error, and between the target analyte and the reference analyte A series of control samples, including one or more mixed control samples to account for differences in capture rate constants, are used to improve the accuracy of estimates of the fraction of distribution.
일부 구현예에서, 혼합 미공지 샘플 내에서 표적 분석물 및 참조 분석물 간의 포획률은 비교적 일정하므로, 상대적 존재비의 추정치 개선을 위해 혼합 대조군을 사용하지 않아도 된다. 일부 구현예에서, 혼합 샘플 내 상기 표적 분석물 및 상기 참조 분석물 간의 상대적 포획률은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 이러한 차이를 보상함으로써 혼합 대조군 샘플을 실행하지 않고도 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 표적 분석물 및 참조 분석물 종을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 혼합 대조군 샘플로부터의 데이터는 실제로 혼합 대조군 샘플을 방법의 일부로 실행하지 않고도 분포분율의 추정치를 개선하는 데 사용될 수 있다.In some embodiments, the capture rate between the target analyte and the reference analyte in the mixed unknown sample is relatively constant, thus eliminating the need to use a mixed control to improve the estimate of relative abundance. In some embodiments, the relative capture rate between the target analyte and the reference analyte in a mixed sample is an estimate of the fraction of distribution without running a mixed control sample by applying a correction term to data from a mixed unknown sample to compensate for this difference. is known to improve In some embodiments, data from a mixed control sample run under substantially identical nanopore conditions using the same target analyte and reference analyte species as in the mixed unknown sample is actually running the mixed control sample as part of a method. It can be used to improve the estimate of the fraction of distribution without
일부 구현예에서, 한계값은 상기 혼합 미공지 샘플로부터의 위양성 값이 무시할 수 있을 정도이고, 참조 분석물만-대조군이 상대적 존재비의 추정치를 개선하는 데 사용할 필요가 없도록 결정된다. 일부 구현예에서, 혼합 샘플로부터의 위양성 값은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 위양성 오차에 대하여 보상하여 참조 분석물만-대조군 샘플을 실행하지 않고도 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 참조 분석물을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 참조 분석물만-대조군 샘플로부터의 데이터는 실제로 참조 분석물만-대조군 샘플을 방법의 일부로 실행하지 않고도 분포분율의 추정치를 개선하는 데 사용될 수 있다.In some embodiments, a threshold is determined such that false positive values from the mixed unknown sample are negligible and that a reference analyte-only-control does not need to be used to improve the estimate of relative abundance. In some embodiments, false positive values from a mixed sample are such that a correction term can be applied to data from a mixed unknown sample to compensate for false positive errors to improve the estimate of the fraction of distribution without running a reference analyte-only-control sample. is known In some embodiments, data from a reference analyte-only-control sample run under substantially the same nanopore conditions using the same reference analyte as in the mixed unknown sample actually determines the reference analyte-only-control sample. It can be used to improve the estimate of the fraction of a distribution without running as part of it.
일부 구현예에서, 한계값은 상기 혼합 미공지 샘플로부터의 위음성 값이 무시할 수 있을 정도이고, 참조 분석물만-대조군이 상대적 존재비의 추정치를 개선하는 데 사용할 필요가 없도록 결정된다. 일부 구현예에서, 혼합 샘플로부터의 위음성 값은 보정항이 혼합 미공지 샘플로부터의 데이터에 적용되어 위음성 오차에 대하여 보상하여 참조 분석물만-대조군 샘플을 실행하지 않고도 분포분율의 추정치를 개선할 수 있도록 알려져 있다. 일부 구현예에서, 상기 혼합 미공지 샘플 내에서와 동일한 참조 분석물을 이용하여 실질적으로 동일한 나노포어 조건 하에서 실행된 참조 분석물만-대조군 샘플로부터의 데이터는 실제로 참조 분석물만-대조군 샘플을 방법의 일부로 실행하지 않고도 분포분율의 추정치를 개선하는 데 사용될 수 있다.In some embodiments, a threshold is determined such that false negative values from the mixed unknown sample are negligible and that a reference analyte-only-control does not need to be used to improve the estimate of relative abundance. In some embodiments, false negative values from a mixed sample are such that a correction term can be applied to data from a mixed unknown sample to compensate for false negative errors to improve the estimate of the fraction of distribution without running a reference analyte-only-control sample. is known In some embodiments, data from a reference analyte-only-control sample run under substantially the same nanopore conditions using the same reference analyte as in the mixed unknown sample actually determines the reference analyte-only-control sample. It can be used to improve the estimate of the fraction of a distribution without running as part of it.
샘플 사용sample use
참조 핵산 분자에 비교하여, 핵산 단편 내 표적 서열의 분량을 결정하는 것은, 많은 응용을 갖는다.As compared to a reference nucleic acid molecule, determining the amount of a target sequence in a nucleic acid fragment has many applications.
한 가지 적용예에서, 본 명세서의 방법을 예컨대 여러 종자들의 수집으로부터 얻어진, 게놈 DNA 내 비=GMO 참조 서열에 대한 유전자 변형 생물체(GMO)의 전이 유전자의 분량을 결정하는 데 사용한다. 이러한 결정은 중요한 규제 및 경제적 이유가 있다. 원하는 형질을 갖는 종자의 구매자와 판매자는 공정한 가격 결정 및 거래를 위하여 원하는 형질을 포함하는 종자의 비율에 대한 정밀하고 정확한 지식이 필요하다.In one application, the methods herein are used to determine the amount of a transgene of a genetically modified organism (GMO) relative to a non=GMO reference sequence in genomic DNA, eg obtained from the collection of several seeds. This decision has important regulatory and economic reasons. Buyers and sellers of seeds with desired traits need precise and accurate knowledge about the proportion of seeds with desired traits for fair pricing and trading.
그러므로, 일부 구현예에서, 본 명세서에서 제공되는 방법은 1-100% GMO 함량 사이를 포함하는 것으로 추정되는 종자, 곡물, 분말, 및 사료로부터 % GMO 함량을 결정을 제공한다. 종자 개발자, 재배자, 및 감독 기관은 GMO 함량의 10% 차이 이내(1.1 배)를 해결할 수 있는 정밀한 측정 및 능력을 원한다. % GMO는 100 x (GMO 이벤트 복제수) / (분류군 특이적 게놈 참조 복제수)로 정의된다.Thus, in some embodiments, the methods provided herein provide for determining % GMO content from seeds, grains, powders, and feeds estimated to include between 1-100% GMO content. Seed developers, growers, and supervisory agencies want precise measurements and the ability to resolve within 10% differences (1.1 times) in GMO content. % GMO is defined as 100 x (GMO event copies) / (taxon-specific genomic reference copies).
다른 적용예로서, 본 명세서에서 기술된 방법을 혈액 또는 소변 샘플로부터 무세포 순환 DNA 내의 비돌연변이(야생형) 서열에 대한 점 돌연변이을 포함하는 폴리뉴클레오타이드 서열의 상대적 존재비를 모니터링하는 데 사용한다. 특정 게놈 유전자좌에서 점 돌연변이의 상대적 존재비는 암 유형 및 치료 결과와 관련이 있었다. 비돌연변이 서열에 대한 돌연변이 상대적 존재비의 결정은 진단, 치료, 및 질병 진행 모니터링에 사용될 수 있다. 종양 영상화 결과가 축소/성장하는 매스를 드러내는 데 몇 주가 걸릴 수 있지만, 본 명세서에서 제공되는 방법은 돌연변이 마커의 상대적 존재비를 신속하게 식별할 수 있으므로 쉽게 액세스할 수 있는 샘플 유형을 이용하여 효율적이고 빈번한 테스트 (예컨대, 매일)를 수행할 수 있다. 임상적으로, 이러한 기술은 질병 역학의 더 많은 시점을 제공함으로써 치료 반응을 보다 효율적으로 드러낼 수 있으며, 동시에 또한 재발을 조기에 감지할 수 있다.In another application, the methods described herein are used to monitor the relative abundance of polynucleotide sequences comprising point mutations to non-mutant (wild-type) sequences in cell-free circulating DNA from blood or urine samples. The relative abundance of point mutations at specific genomic loci was associated with cancer type and treatment outcome. Determination of the relative abundance of mutations to non-mutant sequences can be used for diagnosis, treatment, and monitoring of disease progression. Although tumor imaging results can take weeks to reveal shrinking/growing masses, the method provided herein can rapidly identify the relative abundance of mutant markers, thus enabling efficient and frequent use of easily accessible sample types. Testing (eg, daily) may be performed. Clinically, these techniques can more efficiently reveal treatment responses by providing more perspectives into disease epidemiology, while also enabling early detection of relapses.
일부 구현예에서, 본 명세서에서 제공되는 방법은 유전성 암 스크리닝 분석에서 복제수 변이 결정(CNV)을 제공한다. 복제수 변이(CNV) 시험은 유전성 암 소인에 대한 것이다. 목적은 참조와 < 1.5배 차이가 있는 유전자 조절 요소의 결실 또는 중복을 검출하는 것이다. 예를 들어, BRCA1 유전자의 복제수의 10% 차이(1.1 배)는 임상적 조치를 보증할 수 있다.In some embodiments, the methods provided herein provide for copy number variation determination (CNV) in a hereditary cancer screening assay. The copy number variation (CNV) test is for hereditary cancer predisposition. The objective is to detect deletions or duplications of gene regulatory elements that differ from the reference by <1.5 fold. For example, a 10% difference (1.1 fold) in the number of copies of the BRCA1 gene may warrant clinical action.
나노포어 검출Nanopore detection
나노포어는 고체-상태의 실리콘계 기판 상에서 형성되며, 완충된 전해질 용액 내에서 포어를 가로길러 전압을 인가함으로써 단일 분자 실험이 수행된다.Nanopores are formed on a solid-state silicon-based substrate, and single-molecule experiments are performed by applying a voltage across the pores in a buffered electrolyte solution.
도 1A는 나노포어를 통과하는 dsDNA에 의해 야기된 전형적인 단일-분자 이벤트를 보여준다. 이벤트는 지속시간의 폭 및 최대 컨덕턴스 깊이, 및 최대 δG로 정량화된다. 최대 δG은 전류 감쇠량 δI를 인가 전압 V로 나눈 값이다. 도 1B는 22 nm 직경의 나노포어로 5분 동안 기록된 5.6 kb dsDNA의 1072 개의 이벤트에 대하여 최대 δG 대 지속시간의 모든-이벤트 산점도를 보여준다(V = 100 mV, 1 nM DNA, 1M LiCl, 10 mM Tris, 1 mM EDTA, pH = 8.8).1A shows a typical single-molecule event caused by dsDNA passing through a nanopore. Events are quantified in terms of duration width and maximum conductance depth, and maximum δG. The maximum δG is a value obtained by dividing the current attenuation amount δI by the applied voltage V. 1B shows an all-event scatter plot of maximum δG versus duration for 1072 events of 5.6 kb dsDNA recorded for 5 min with 22 nm diameter nanopores (V = 100 mV, 1 nM DNA, 1M LiCl, 10 mM Tris, 1 mM EDTA, pH = 8.8).
최대 δG 및 지속시간 외에 정량화될 수 있는 이벤트 프로필의 특징은: 평균 δG, 중앙 δG, 이벤트 신호의 표준편차, 및 다른 고차적 특징들이다. 또다른 유용한 특징은 이벤트의 적분 면적의 절대값으로, 이것은 평균 δG에 지속시간을 곱하여 계산될 수 있다(Storm, A J, J H Chen, H W Zandbergen, and C Dekker. "Translocatoin of Double-Strand DNA Through a Silicon Oxide Nanopore." Physical Review E 71, no. 5 (May 2005): 051903, doi:10.1103/PhysRevE.71.051903). 상기 적분 면적, 또는 단순히 "면적"은, 전하 결핍이라고도 알려져 있다(Fologea, Daniel, Marc Gershow, Bradley Ledden, David S McNabb, Jene A Golovchenko, and Jiali Li. "Detecting Single Stranded DNA with a Solid State Nanopore." Nano Letters 5, no. 10 (October 2005): 1905-9. doi:10.1021/nl051199m).In addition to the maximum δG and duration, characteristics of the event profile that can be quantified are: mean δG, median δG, standard deviation of the event signal, and other higher-order characteristics. Another useful feature is the absolute value of the integral area of an event, which can be calculated by multiplying the mean δG by the duration (Storm, AJ, JH Chen, HW Zandbergen, and C Dekker. “Translocatoin of Double-Strand DNA Through a Silicon Oxide Nanopore." Physical Review E 71, no. 5 (May 2005): 051903, doi:10.1103/PhysRevE.71.051903). The integral area, or simply "area", is also known as charge depletion (Folgea, Daniel, Marc Gershow, Bradley Ledden, David S McNabb, Jene A Golovchenko, and Jiali Li. "Detecting Single Stranded DNA with a Solid State Nanopore. "
접힌 상태에서 상기 나노포어를 통과하기에 충분한 길이(> 700 bp)를 갖는 dsDNA의 경우, 상기 이벤트는 하나 이상의 진폭을 나타낼 수 있다. 도 1B는 완전히 접힌 이벤트는 더 큰 최대 δG 및 더 짧은 지속시간을 보이고, 접히지 않은 이벤트는 더 긴 지속시간 및 더 얕은 최대 δG를 보이는, 이의 예이다. 부분적으로 접힌 이벤트는, 더 깊은 수준에서 시작하여 더 얕은 수준에서 종료하고, 접히지 않은 이벤트와 완전히 접힌 이벤트 사이에서 전체 지속시간의 폭을 갖는, 이벤트 내에서 두 진폭 수준을 모두 보여준다. δG 및 지속시간 분포는 접힐 수 있는 dsDNA에 대한 모드들의 혼합을 보이는 반면, 이벤트 면적은, DNA가 나노포어를 통과할 때 접힐 수 있도록 충분한 길이를 갖는지의 여부와 무관하게, dsDNA에 대한 단일 모드 분포를 갖는다.For dsDNA of sufficient length (>700 bp) to pass through the nanopore in the folded state, the event may exhibit one or more amplitudes. 1B is an example of a fully folded event exhibiting a larger maximum δG and shorter duration, and an unfolded event exhibiting a longer duration and shallower maximum δG. A partially collapsed event shows both amplitude levels within an event, starting at a deeper level and ending at a shallower level, with the width of the overall duration between the unfolded and fully collapsed events. The δG and duration distributions show a mixture of modes for foldable dsDNA, whereas the event area is a single mode distribution for dsDNA, whether or not the DNA has sufficient length to fold as it passes through the nanopore. has
나노포어를 이용한 표적 분석물 및 참조 분석물의 구별은 신뢰성 있고 민감한 검출을 가능하게 하기 위해 나노포어를 통한 각각의 전위 시 충분히 다른 이벤트 신호의 검출을 기반으로 한다. 평균 이벤트 신호의 차이는 신호 지속시간, 전류의 변화, 신호 내의 특징, 또는 그 밖의 구별 가능한 특징 및 이들의 조합에 기반으로 할 수 있다. 사용되는 특징들은 본 명세서에서 기술된 분포분율 결정에 이용되는 참조 분석물 및 표적 분석물과 관련된 이벤트 신호를 식별하는 방법으로 작용하는 한계를 결정하기 위한 근거로 사용된다.The differentiation of target analytes and reference analytes using nanopores is based on the detection of sufficiently different event signals upon each translocation through the nanopores to enable reliable and sensitive detection. Differences in the average event signal may be based on signal duration, change in current, characteristics within the signal, or other distinguishable characteristics, and combinations thereof. The characteristics used are used as a basis for determining limits that serve as a method of identifying event signals associated with reference analytes and target analytes used in the fraction of distribution determination described herein.
일부 구현예에서, 상기 표적 및 참조 단편들은 다른 나노포어 이벤트 지속시간을 생성하기에 충분히 다른 길이의 dsDNA 분자들이다.In some embodiments, the target and reference fragments are dsDNA molecules of sufficiently different lengths to produce different nanopore event durations.
일부 구현예에서, 표적 분석물 및 참조 분석물은 둘 다 dsDNA이며, 별개의 이벤트 유형을 생성하는 특징은 표적 분석물 및 참조 분석물의 길이의 차이일 수 있다. 이러한 구현예에서, 표적 분석물과 참조 분석물의 길이 차이에 의해 생성되는, 표적 및 참조 이벤트 면적의 차이는, 표적 및 참조 이벤트 신호(즉, 이벤트 프로필)를 구별하는 데 사용될 수 있다.In some embodiments, the target analyte and reference analyte are both dsDNA, and the characteristic that generates distinct event types may be a difference in length of the target analyte and reference analyte. In such embodiments, differences in target and reference event areas, created by differences in lengths of target and reference analytes, can be used to differentiate target and reference event signals (ie, event profiles).
dsDNA에 대한 이벤트 면적 분포는 단일 모드를 갖는다. 이는 표적 및 참조 분석물이 충분히 다른 길이의 dsDNA일 때, 면적은 이벤트를 표적 요형 또는 참조 유형으로 분류하는 데 유용한 이벤트 특징이 된다. 충분히 다른 면적 분포를 생성하려면, 길이는 직경이 20 nm 초과인 나노포어에 대해 길이의 차이가 최소한 100 bp이어야 한다. 직경이 1-20 nm인 보다 작은, 예컨대 제어된 절연 파괴에 의해 형성된 나노포어의 경우(Yanagi, Itaru, Rena Akahori, Toshiyuki Hatano, and Ken-ichi Takeda. "Fabricating Nanopores with Diameters of Sub-1 Nm to 3 Nm Using Multilevel Pulse-Voltage Injection." Scientific Reports 4 (2014): 5000 doi:10.1038/srep05000), 표적 및 참조에 대한 dsDNA는 길이 차이가 최소 20 bp이어야 한다.The event area distribution for dsDNA has a single mode. This is when the target and reference analytes are dsDNA of sufficiently different lengths, the area becomes a useful event characteristic for classifying the event into a target phenotype or reference type. To generate sufficiently different area distributions, the length should be at least 100 bp difference in length for nanopores with a diameter greater than 20 nm. For smaller nanopores 1-20 nm in diameter, such as those formed by controlled breakdown (Yanagi, Itaru, Rena Akahori, Toshiyuki Hatano, and Ken-ichi Takeda. "Fabricating Nanopores with Diameters of Sub-1 Nm to 3 Nm Using Multilevel Pulse-Voltage Injection." Scientific Reports 4 (2014): 5000 doi:10.1038/srep05000), dsDNA for target and reference must have a length difference of at least 20 bp.
표적 및 참조 분자에 대해 dsDNA 길이가 얼마나 차이가 있을 수 있는지에 대한 명확한 상한은 없다.There is no clear upper limit on how different dsDNA lengths can be for target and reference molecules.
도 2A는 727 bp의 DNA가 1M LiCl 내 100 mV에서 직경 25 nm의 고체-상태 나노포어를 통과할 때의 전형적인 이벤트를 보여준다. 이벤트 면적은 음영 처리된 영역으로 표시된다. 도 2B는 dsDNA 길이에 따라 이벤트 면적이 어떻게 증가하는지를 보여준다. 주로, 이벤트 깊이가 유지되는 동안 이벤트 지속시간은 증가하고, 이벤트 면적(평균 깊이 × 지속시간)은 지속시간에 비례하므로 이러한 길이-의존적 증가를 포착한다. 도 2C는 동일한 나노포어 상에서 순차적으로 실행된, 표시된 각 DNA에 대하여 기록된 모든 이벤트들의 면적(pA*ms)의 밑이 10인 로그의 분포를 보여준다. 이벤트 면적의 밑이 10인 로그의 분포는 거의 정규(가우스)이다. DNA의 길이가 증가함에 따라, 분포의 평균이 증가한다. Figure 2A shows a typical event when 727 bp of DNA passes through a solid-state nanopore with a diameter of 25 nm at 100 mV in 1M LiCl. The event area is shown as a shaded area. Figure 2B shows how the event area increases with dsDNA length. Primarily, event duration increases while event depth is maintained, and event area (average depth × duration) is proportional to duration, thus capturing this length-dependent increase. 2C shows the distribution of the base 10 logarithm of the area (pA*ms) of all events recorded for each DNA indicated, run sequentially on the same nanopore. The distribution of the
길이가 최소 300 bp, 길이가 최대 100,000 bp인 두 개의 dsDNA인, dsDNA를 포함하는 표적-서열 및 dsDNA를 포함하는 참조-서열을 생성하였다. 일부 구현예에서, 표적 및 참조 dsDNA 분석물은 길이가 적어도 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp 100 bp, 150 bp, 200 bp 또는 300 bp 길이의 차이를 갖는다. 일반적으로, 표적 및 참조 dsDNA 분석물 간의 길이의 증가된 차이는, 크기로 구별할 때, 표적 및 참조 분석물과 관련된 이벤트 신호의 결정의 더 높은 민감도 및 특이성을 용이하게 하고, 샘플 내 상대적 존재비의 추정이 개선된다.Two dsDNAs of at least 300 bp in length and at most 100,000 bp in length, a target-sequence comprising dsDNA and a reference-sequence comprising dsDNA were generated. In some embodiments, the target and reference dsDNA analytes are at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90
일부 구현예에서, 게놈 DNA(gDNA)로부터 절단된 폴리뉴클레오타이드 단편의 특성을 지정하는 것은 분포분율 결정에 대한 워크플로우의 일부이다. 이러한 단편특징은 예컨대, 이의 서열, 길이, 및 2차 구조를 포함할 수 있다. 일부 구현예에서, 이러한 단편 특징은 나노포어 장치에 의한 특정 서열의 포획 및 검출을 향상시킨다.In some embodiments, characterizing polynucleotide fragments cleaved from genomic DNA (gDNA) is part of the workflow for fractional distribution determination. Such fragment characteristics may include, for example, its sequence, length, and secondary structure. In some embodiments, such fragment features enhance capture and detection of specific sequences by the nanopore device.
일부 구현예에서, 상기 표적 및 참조 단편은 표적/페이로드 분자 및 참조 페이로드 분자가 충분히 다른 나노포어 이벤트 신호를 생성하도록, 상이한 페이로드 분자에 결합된다. 일부 구현예에서, 상기 다른 이벤트 신호는 이벤트 지속시간, 이벤트 최대 깊이, 이벤트 평균 깊이 및/또는 다른 이벤트 특성들의 조합이다.In some embodiments, the target and reference fragments are bound to different payload molecules such that the target/payload molecule and the reference payload molecule generate sufficiently different nanopore event signals. In some implementations, the other event signal is a combination of event duration, event maximum depth, event average depth, and/or other event characteristics.
일부 구현예에서, 상기 표적 및 참조 분석물은, 각각의 분자 또는 복합 유형(표적-페이로드, 참조-페이로드)가 포어를 통과할 때, 고유한 나노포어 이벤트 신호가 생성되는 서열 특이적 페이로드에 의해 구별된다. 구별을 용이하게 하는 각 분자 유형에 결합하는 페이로드에 결합된 프로브를 이용하는 방법은 국제 특허출원 제 WO/2015/171169 호 "Target Detection with a Nanopore", 국제 특허출원 제 WO/2014/182634 호 "A Method of Biological Target Detection Using a Nanopore and a Fusion Protein Binding Agent", 국제 특허출원 제 WO/2016/049657 호 "Target Sequence Detection by Nanopore Sensing of Synthetic Probes" 국제 특허출원 제 WO/2016/126746 호 "Nanopore Detection of Target Polynucleotides from Sample Background" 및 국제 특허출원 제 WO/2017/173392 호 "Nanopore Discrimination of Target Polynucleotides from Sample Background by Fragmentation and Payload Binding"에 기재되어 있으며, 이들 각각은 그 전체 내용이 본 명세서에 참조로서 포함된다.In some embodiments, the target and reference analytes are sequence-specific, wherein a unique nanopore event signal is generated as each molecule or complex type (target-payload, reference-payload) passes through the pore. distinguished by the load. Methods using probes bound to payloads that bind to each molecular type to facilitate discrimination are described in International Patent Application No. WO/2015/171169 "Target Detection with a Nanopore", International Patent Application No. WO/2014/182634 " A Method of Biological Target Detection Using a Nanopore and a Fusion Protein Binding Agent", International Patent Application No. WO/2016/049657 "Target Sequence Detection by Nanopore Sensing of Synthetic Probes" International Patent Application No. WO/2016/126746 "Nanopore" Detection of Target Polynucleotides from Sample Background" and International Patent Application No. WO/2017/173392 "Nanopore Discrimination of Target Polynucleotides from Sample Background by Fragmentation and Payload Binding", each of which is incorporated herein by reference in its entirety included as
일부 구현예에서, 표적 및/또는 참조 분석물은 dsDNA이며, 고유 페이로드-결합 PNA가 나노포어로 검출되는 두 유형의 거대 분자를 생성하는 각 dsDNA 유형 (표적 및 참조)을 침범하한다. 일부 구현예에서, 표적 및/또는 참조 분석물은, DNA 또는 RNA를 포함하는, 단일-가닥 핵산(ssNA)이다. 페이로드-결합된 상보적 핵산(예컨대, LNA)은 ssNA 상의 한 영역에 혼성화하고 하나 이상의 플랭킹 프라이머는 ssNA 상의 다른 영역과 혼성화하여, 결합된 페이로드와 이중-가닥 분자를 생성하고, 상기 페이로드는 고유한 표적 및 참조 이벤트 프로필을 생성하기 위해 표적 및 참조에 대하여 고유하다.In some embodiments, the target and/or reference analyte is a dsDNA, which invades each dsDNA type (target and reference) resulting in two types of macromolecules that are detected as nanopores with native payload-binding PNAs. In some embodiments, the target and/or reference analyte is a single-stranded nucleic acid (ssNA), including DNA or RNA. A payload-bound complementary nucleic acid (eg, LNA) hybridizes to one region on the ssNA and one or more flanking primers to another region on the ssNA to generate a double-stranded molecule with the bound payload, wherein The load is unique to the target and reference to create a unique target and reference event profile.
분포분율 프레임워크Fractional Distribution Framework
일부 구현예에서, 분포분율 프레임워크는: 1) 표적 분석물 및 참조 분석물 유형 모두에 대하여, 샘플 물질을 나노포어 검출 포맷으로 전환하는 생화학적 방법을 고안 및 적용하는 단계; 2) 특정 나노포어 실험 프로토콜을 적용하는 단계; 및 3) 참조 분석물에 대하여 표적의 상대적 존재비에 대한 정량적 추정치를 생성하는 분석적 단계를 적용하는 단계를 포함한다. 이 섹션은 상기 프레임워크의 파트 1에 중점을 둔다.In some embodiments, the fractional distribution framework comprises: 1) designing and applying a biochemical method for converting a sample material into a nanopore detection format, for both target analyte and reference analyte types; 2) applying a specific nanopore experimental protocol; and 3) applying an analytical step that produces a quantitative estimate of the relative abundance of the target relative to the reference analyte. This section focuses on
나노포어 검출을 위한 샘플 준비Sample preparation for nanopore detection
표적 서열을 포함하는 분자("표적 분석물" 또는 "표적 분자"로 지칭) 및 참조 서열을 포함하는 분자("참조 분석물" 또는 "참조 분자"로 지칭)는 물리적으로 유사할 수 있다: 예를 들면 표적 및 참조 분자는 분자량, 또는 폴리뉴클레오타이드 길이가 비슷할 수 있으며, 단 하나의 뉴클레오타이드만 다를 수 있다. 생화학적 방법의 목표는 나노포어를 통한 전위 시 뚜렷한 "표적" 또는 "참조" 이벤트 프로필을 생성하기 위해 편향 없이 표적 및 참조 분자를 렌더링하는 것이다. 이러한 방식으로, 나노포어 상에서 측정된 표적:참조 혼합물은 샘플 내 표적:참조의 농도 비율을 나타낸다.A molecule comprising a target sequence (referred to as a "target analyte" or "target molecule") and a molecule comprising a reference sequence (referred to as a "reference analyte" or "reference molecule") may be physically similar: For example, the target and reference molecules may be similar in molecular weight, or polynucleotide length, and may differ by only one nucleotide. The goal of biochemical methods is to render target and reference molecules without bias to generate distinct “target” or “reference” event profiles upon translocation through nanopores. In this way, the target:reference mixture measured on the nanopore represents the concentration ratio of the target:reference in the sample.
일부 적용예에서 표적, 참조, 또는 두 분자 모두에 폴리뉴클레오타이드 서열을 추가하여 별개의 이벤트 프로필을 생성하는 것이 유리할 수 있다. 예를 들면, 혈액 또는 소변의 무세포 순환 DNA로부터 얻어진 DNA 단편의 대부분은 150-200bp의 균일하게 짧은 길이를 가진다. PCR, 라이게이션, 및 직접 올리고뉴클레오타이드 혼성화를 포함하는 통상적인 방법에 의해 폴리뉴클레오타이드 서열을 추가하는 것은 유연성을 허용하여 나노포어 이벤트의 구별을 최대화할 수 있다. 다른 경우에, 공유 결합된 고분자 페이로드를 운반하는 화학적으로 개질된 올리고뉴클레오타이드 프로브의 혼성화는 폴리뉴클레오타이드 길이엥 영향을 끼치지 않고 표적 또는 참조 분석물의 전하 및 분자량을 변경하는 데 사용될 수 있다. 모든 경우에, 목표는 표적 및 참조 분자 그룹 당 별개의 이벤트 프로필이다.In some applications it may be advantageous to create distinct event profiles by adding polynucleotide sequences to the target, reference, or both molecules. For example, most of the DNA fragments obtained from cell-free circulating DNA in blood or urine have a uniformly short length of 150-200 bp. Adding polynucleotide sequences by conventional methods including PCR, ligation, and direct oligonucleotide hybridization allows flexibility to maximize the differentiation of nanopore events. In other cases, hybridization of chemically modified oligonucleotide probes carrying covalently linked polymeric payloads can be used to alter the charge and molecular weight of a target or reference analyte without affecting polynucleotide length. In all cases, the target is a separate event profile per group of target and reference molecules.
GMO의 예(GMO 표적 서열을 포함하는 대두 종자의 분량)를 포함하는, 나노포어 감지 전에 필요한 PCR 없이 농축화 전략을 사용할 수 있는 충분한 출발 물질이 있는 적용 사례가 있다. 혈액 또는 소변 샘플이 유체의 mL 당 < 10 표적 서열을 포함할 수 있기 때문에, 액체 생검을 포함하는, 농축화의 일부로 PCR이 요구되는, 다른 사례가 있다. 제안되는 방법은 샘플 수집, 표적 및 참조의 정제 및 농축을 포함하는, 샘플 전처리 요구사항과 무관하다. 표적 및 참조가 배경(< 1 pM)에 비해 충분히 풍부하고(> 10 pM), 표적 및 참조 분석물이 존재하는, 다른 하나로부터 그리고 배경으로부터 구별될 수 있는 전기적 이벤트 신호를 생성한다면 나노포어 측정 및 후속 분포분율의 정량화가 구현될 수 있다.There are applications where there is sufficient starting material to use the enrichment strategy without the required PCR prior to nanopore detection, including examples of GMOs (amounts of soybean seeds containing GMO target sequences). There are other instances where PCR is required as part of the enrichment, including liquid biopsies, as blood or urine samples may contain < 10 target sequences per mL of fluid. The proposed method is independent of sample preparation requirements, including sample collection, purification and concentration of targets and references. Nanopore measurement and/or analysis if the target and reference are sufficiently enriched (>10 pM) relative to background (< 1 pM) and the target and reference analytes are present and produce electrical event signals that are distinguishable from the background and from the other. Subsequent quantification of the distribution fraction can be implemented.
일부 구현예에서, 표적 또는 참조 분석물은 20nt-100,000 nt 길이의 폴리뉴클레오타이드 서열(이중 및 단일 가닥의 DNA, RNA, 및 합성 폴리뉴클레오타이드를 포함)을 포함한다. 일부 구현예에서, 표적 서열을 포함하는 폴리뉴클레오타이드는 식물, 인간, 동물, 곤충, 박테리아 또는 바이러스를 포함하는 생명체 gDNA로부터 유래된다. 일부 구현예에서, 표적 폴리뉴클레오타이드 서열은, 플라스미드, BAC, 선형 서열-검증된 유전자 블록, 발현 카세트를 포함하는 공급원으로부터의 이중 또는 단일-가닥 RNA 또는 DNA를 포함하는 외인성, 비게놈 서열로부터 유래된다.In some embodiments, the target or reference analyte comprises a polynucleotide sequence (including double and single stranded DNA, RNA, and synthetic polynucleotides) between 20 nt and 100,000 nt in length. In some embodiments, a polynucleotide comprising a target sequence is derived from gDNA of a living organism, including a plant, human, animal, insect, bacterium, or virus. In some embodiments, the target polynucleotide sequence is derived from an exogenous, non-genomic sequence comprising double or single-stranded RNA or DNA from a source comprising a plasmid, a BAC, a linear sequence-verified gene block, an expression cassette. .
일부 구현예에서, 나노포어 장치에 의한 분포분율(예컨대, 복제수 변이) 검출에 특이적인 농축화를 제공한다. 일부 구현예에서, 나노포어에 의한 검출을 위한 샘플을 준비하기 위한 부위-지정 단편화 방법을 이용한다. 일부 구현예에서, 본 명세서에서 제공되는 검출 방법은 핵산 샘플의 폴리뉴클레오타이드 단편의 업스트림 단편화, 예컨대, gDNA의 길이 20-100,000 nt 또는 염기쌍 크기로의 단편화를 포함한다. 일부 구현예에서, 상기 핵산은 제한효소를 이용하거나, Cas9/sgRNA, TALENS, 징크 핑거 단백질/뉴클레아제 또는 그 밖의 당해 기술분야에 공지된 단편화 방법을 포함하는 부위-지정 뉴클레아제를 이용하여 서열-특이적으로 단편화된다.In some embodiments, specific enrichment is provided for detection of a fraction of a distribution (eg, copy number variation) by a nanopore device. In some embodiments, site-directed fragmentation methods are used to prepare samples for detection by nanopores. In some embodiments, the detection methods provided herein include upstream fragmentation of a polynucleotide fragment of a nucleic acid sample, eg, fragmentation of gDNA to a length of 20-100,000 nt or base pairs in size. In some embodiments, the nucleic acid is prepared using restriction enzymes or using site-directed nucleases including Cas9/sgRNA, TALENS, zinc finger protein/nuclease or other fragmentation methods known in the art. It is sequence-specifically fragmented.
일부 구현예에서, 표적 또는 참조 분석물 농축화는 표적 단편 크기를 유지, 배제, 및 용출하는 양성 및 음성 크기 선택을 이용하여 수행된다. 예를 들어, PEG 존재 하에 낮은 SPRI 비드:DNA의 비율(0.6)로 고분자량의 폴리뉴클레오타이드 종(예컨대, >8,000 bp DNA)를 유지 및 배제한 후, SPRI 비드:DNA(1.5:1)로 단편 크기(예컨대 2000-8000 bp)를 결합, 세척 및 용리한다. 일부 구현예에서, 나노포어 내 검출을 용이하게 하기 위하여 표적 또는 참조 핵산은 핵산 증폭을 겪을 수 있다.In some embodiments, target or reference analyte enrichment is performed using positive and negative size selection that maintains, excludes, and elutes the target fragment size. For example, after retention and exclusion of high molecular weight polynucleotide species (e.g., >8,000 bp DNA) with low SPRI bead:DNA ratio (0.6) in the presence of PEG, fragment size with SPRI bead:DNA (1.5:1) (eg 2000-8000 bp) bind, wash and elute. In some embodiments, a target or reference nucleic acid may be subjected to nucleic acid amplification to facilitate detection within the nanopore.
나노포어 검출Nanopore detection
분포분율 프레임워크는: 1) 표적 분석물 및 참조 유형 모두에 대하여, 샘플 물질을 나노포어 감지 포맷으로 전환하는 생화학적 방법을 고안 및 적용하는 단계; 2) 특정 나노포어 실험 프로토콜을 적용하는 단계; 및 3) 참조 분석물에 대한 표적의 분량(표적:참조)에 대한 정량적 추정치를 생성하는 수학적 방법을 적용하는 단계를 포함한다. 이 섹션은 실험 프로토콜, 파트 2에 중점을 둔다.The fraction of distribution framework comprises the steps of: 1) designing and applying biochemical methods to convert sample materials into nanopore sensing formats, for both target analytes and reference types; 2) applying a specific nanopore experimental protocol; and 3) applying a mathematical method to generate a quantitative estimate of the dose of the target (target:reference) relative to the reference analyte. This section focuses on the experimental protocol,
혼합 미공지 샘플 내 표적 분석물의 참 상대적 존재비의 개선된 추정치를 제공하기 위하여 나노포어 내에서 실생되는 샘플의 반복이 본 명세서에서 기술된다. 일부 구현예에서, 상기 표적 분석물 및 상기 참조 분석물은 나노포어 센서를 이용한 각 종 간의 신뢰성 있는 구별이 가능하도록 제조된다. 일부 구현예에서, 표적 서열을 포함하는 단편(즉, "표적 단편")의 특징 및 참조 서열을 포함하는 단편(즉, "참조 단편")의 특징은 두 단편이 하나 이상의 신호 특성에 의해 구별될 수 있는 나노포어 이벤트 신호를 생성하도록 선택된다.Repetition of a sample run within a nanopore is described herein to provide an improved estimate of the true relative abundance of a target analyte in a mixed unknown sample. In some embodiments, the target analyte and the reference analyte are prepared to enable reliable discrimination between species using a nanopore sensor. In some embodiments, characteristics of a fragment comprising a target sequence (i.e., a "target fragment") and a fragment comprising a reference sequence (i.e., a "reference fragment") are such that the two fragments are distinguished by one or more signal properties. nanopores are selected to generate an event signal that can be
일부 구현예에서, 하나 이상의 대조군 혼합물(즉, 대조군 샘플)이 미공지 혼합물 내 참조에 대한 표적의 분량의 추정치를 보정하는 데 사용된다. 일부 구현예에서, 상기 보정은 표적 및 참조 분자 유형 간의 나노포어 포획 효율의 차이를 보상한다.In some embodiments, one or more control mixtures (ie, control samples) are used to calibrate an estimate of the amount of target relative to a reference in the unknown mixture. In some embodiments, the calibration compensates for differences in nanopore capture efficiency between target and reference molecule types.
일부 구현예에서, 표적 및 참조 분석물의 미공지 혼합물이 나노포어 상에서 측정되고, 참조에 대한 표적의 분포분율이 수학적으로 정량화된다. 일부 구현예에서, 동일한 샘플로부터 유래되는, 표적 및 참조 분자 유형의 하나 이상의 미공지 혼합물이 동일한 나노포어 상에서 순차적으로 측정된다. 일부 구현예에서, 동일한 샘플로부터 유래되는, 표적 및 참조 분자 유형의 하나 이상의 미공지 혼합물은 상이한 나노포어 상에서 병렬적으로 측정된다.In some embodiments, an unknown mixture of a target and a reference analyte is measured on the nanopore, and the fraction distribution of the target relative to the reference is quantified mathematically. In some embodiments, one or more unknown mixtures of target and reference molecule types, derived from the same sample, are sequentially measured on the same nanopore. In some embodiments, one or more unknown mixtures of target and reference molecule types, derived from the same sample, are measured in parallel on different nanopores.
일부 구현예에서, 100% 표적 단독, 100% 참조 단독, 및 공지된 표적 및 참조 분자의 혼합물을 포함하는, 하나 이상의 대조군은 상기 미공지 혼합물 전 및/또는 후에, 나노포어 상에서 측정된다.In some embodiments, one or more controls, comprising 100% target alone, 100% reference alone, and a mixture of known target and reference molecules, are measured on the nanopores before and/or after said unknown mixture.
일부 구현예에서, 상기 실험 프로토콜은 나노포어 상에서 미공지 혼합물을 실행하기 전 또는 후, 또는 전과 후에, 나노포어 상에서 하나 이상의 대조군을 순차적으로 실행하는 것을 포함한다. 상기 대조군은 100% 표적 분석물, 또는 100% 참조 분석물로 구성될 수 있으며, 이들을 "분리된 대조군"으로 지칭한다. 또한 상기 대조군은 표적 및 참조 분석물의 임의의 공지된 혼합물일 수 있으며, "혼합 대조군" 또는 "대조군 혼합물"로 지칭한다. 상기 대조군 혼합물은 표적:참조 분석물의 비가 1:1이거나, 0.01:1 내지 100:1의 임의의 다른 표적:대조군 비율이거나, 표적:참조 분석물의 0.01:1보다 작은 임의의 비율(예컨대, 0.001:1) 또는 100:1보다 큰 임의의 비율(예컨대, 1000:1)일 수 있다. 하나 이상의 대조군은 1 회 초과로 실행될 수 있다. 대조군(분리된 및 혼합물) 및 미공지 혼합물은 동일한 나노포어 상에서 임의의 순서로 순차적으로 실행될 수 있다. 대조군과 미공지 샘플 사이에, 나노포어가 분자를 포획하는 유체 채널(즉, 챔버)은 플러시된다.In some embodiments, the experimental protocol comprises sequentially running one or more controls on the nanopores before or after, or before and after running the unknown mixture on the nanopores. The control may consist of 100% target analyte, or 100% reference analyte, referred to as “isolated controls”. The control may also be any known mixture of target and reference analytes, referred to as “mixed control” or “control mixture”. The control mixture is a target:reference analyte ratio of 1:1, any other target:control ratio from 0.01:1 to 100:1, or any ratio less than 0.01:1 of target:reference analyte (eg, 0.001: 1) or any ratio greater than 100:1 (eg 1000:1). One or more controls may be run more than once. Controls (isolated and mixtures) and unknown mixtures can be run sequentially in any order on the same nanopore. Between the control and unknown samples, the fluidic channels (ie chambers) in which the nanopores trap molecules are flushed.
일부 구현예에서, 대조군이 실행되지 않고, 미공지 혼합물만이 실행되며, 별도의 사전 실험에서 대조군을 실행하여 확립된 참조 표와 비교되며, 즉, 대조군은 사용 지점에서 실행되지 않는다.In some embodiments, no controls are run, only unknown mixtures are run and compared to reference tables established by running controls in a separate prior experiment, ie no controls are run at the point of use.
일부 구현예에서, 하나 이상의 유체적으로 분리된 채널 및 나노포어 센서는 미공지를 측정하는 하나 이상의 유체적으로 분리된 채널 및 나노포어 센서와 병렬적으로 대조군을 측정한다. 하나 이상의 나노포어는 각 유체 채널에 접근할 수 있다. 병렬화된 구현에서, 각 포어는 하나의 시약 세트 즉, 대조군(분리된 또는 혼합물) 또는 미공지 (하나 이상의 미공지의 세트에서)만을 보기 때문에, 플러싱이 불필요할 수 있다.In some embodiments, the one or more fluidly isolated channel and nanopore sensors measure a control in parallel with the one or more fluidly isolated channel and nanopore sensors that measure unknowns. One or more nanopores may access each fluidic channel. In a parallelized implementation, flushing may not be necessary as each pore sees only one set of reagents, either a control (isolated or mixture) or unknown (in one or more unknown sets).
일부 구현예에서, 대조군 혼합물 농도에서 표적 분석물에 대한 참조 분석물의 비율은 미공지 샘플 내 표적 분석물에 대한 참조 분석물의 예상 비율에 가깝지만, 이것은 미리 알려지지 않을 수 있다.In some embodiments, the ratio of reference analyte to target analyte in the control mixture concentration is close to the expected ratio of reference analyte to target analyte in an unknown sample, although this may not be known in advance.
각 새로운 미공지가 측정을 위해 추가되기 전에 이전의 미공지를 플러싱하여, 동일한 나노포어 상에서 임의의 수의 미공지 혼합물이 순차적으로 실행될 수 있다. 이를 위해서는 상기 미공지 혼합물이 동일한 표적 및 참조 분석물 유형으로 구성되어야 하지만, 이들의 비율은 다른 미공지들에서 동일하거나 다를 수 있다.Any number of unknown mixtures can be run sequentially on the same nanopore by flushing the old blanks before each new blank is added for measurement. This requires that the unknown mixture consist of the same target and reference analyte types, but their proportions may be the same or different in different unknowns.
각각의 기록 시간은 각 시약 유형에 대하여 최소 100 회의 이벤트를 검출할 수 있도록 충분히 길어야 하며, 기록되는 이벤트의 수가 많을수록 성능이 개선되고, 여기서 상기 개선은 500 회 이상의 이벤트가 기록될 때 현저하며, 1000 회 이상의 이벤트가 기록되면 매우 현저하다. 각 시약 세트에 대한 기록 시간은 동일하거나 다를 수 있다. 적응 방식은 분자의 표적 분자 수가 검출되면 동적으로 기록을 중단할 수 있다. 본 발명자들은 임의의 시약 세트(대조군 또는 미공지)에 적용 가능한 원하는 신뢰 수준(예컨대, 95%, 98%, 99%, 99.9% 등)을 얻기 위해 필요한 분자의 수를 결정하기 위한 방법을 확립하였다(SI Section 10.2, Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang, and William B Dunbar. "Nanopore-Based Target Sequence Detection" Edited by Meni Wanunu. PloS One 11, no. 5 (May 5, 2016): e0154426-21. doi:10.1371/journal.pone.0154426).Each recording time should be long enough to detect a minimum of 100 events for each reagent type, and the higher the number of recorded events, the better the performance, where the improvement is significant when more than 500 events are recorded; It is very noticeable when more than one event is recorded. The recording time for each reagent set can be the same or different. The adaptive approach can dynamically stop recording when a target molecule number of molecules is detected. We have established a method for determining the number of molecules required to obtain a desired level of confidence (e.g., 95%, 98%, 99%, 99.9%, etc.) applicable to any set of reagents (control or unknown). (SI Section 10.2, Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang, and William B Dunbar. “Nanopore-Based Target Sequence Detection” Edited by Meni Wanunu.
일부 구현예에서, 단일 나노포어를 사용한 실험 프로토콜은 1) 기록 시간 T 동안 100% 표적을 실행하고, 2) 나노포어 챔버를 플러싱하고, 3) 기록 시간 T 동안 100% 참조를 실행하고, 4) 나노포어 챔버를 플러싱하며, 5) 기록 시간 T 동안 50:50 표적:참조 혼합물을 실행하고, 6) 나노포어 챔버를 플러싱하며, 7) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다. 기록 시간 T는 15 초, 30 초, 45 초, 1 분, 5 분, 10 분, 또는 1-15 초 또는 10-60 분 사이의 임의의 기간일 수 있다.In some embodiments, experimental protocols using single nanopores are 1) running 100% target for recording time T, 2) flushing the nanopore chamber, 3) running 100% reference for recording time T, 4) flushing the nanopore chamber, 5) running a 50:50 target:reference mixture for recording time T, 6) flushing the nanopore chamber, and 7) running unknown mixture for recording time T. The recording time T may be 15 seconds, 30 seconds, 45 seconds, 1 minute, 5 minutes, 10 minutes, or any period between 1-15 seconds or 10-60 minutes.
또 다른 일반적인 실험 프로토콜은 (1)-(7)을 실행한 다음, 8) 나노포어 챔버를 플러싱하고, 9) 기록 시간 T 동안 100% 표적을 반복하고, 10) 나노포어 챔버를 플러싱하며, 11) 기록 시간 T 동안 100% 참조를 반복하고, 12) 나노포어 챔버를 플러싱하고, 13) 기록 시간 T 동안 50:50 표적:참조 혼합물을 반복하는 것이다.Another common experimental protocol is to run (1)-(7), then 8) flush the nanopore chamber, 9) repeat 100% target for recording time T, 10) flush the nanopore chamber, 11 )
또 다른 일반적인 실험 프로토콜은 (1)-(7)을 실행한 다음, 8) 나노포어 챔버를 플러싱하고, 9) 기록 시간 T 동안 50:50 표적:참조 혼합물을 반복하고, 10) 나노포어 챔버를 플러싱하고, 11) 기록 시간 T 동안 100% 참조를 반복하고, 12) 나노포어 챔버를 플러싱하고, 13) 기록 시간 T 동안 100% 표적을 반복하는 것이다.Another common experimental protocol is to run (1)-(7), then 8) flush the nanopore chamber, 9) repeat the 50:50 target:reference mixture for recording time T, and 10) flush the nanopore chamber. flush, 11)
또 다른 일반적인 실험 프로토콜은 1) 기록 시간 T 동안, 미공지 혼합물 내의 표적:참조 비율에 가까운 것으로 의심되는 표적:참조 대조군 혼합물 비율을 실행하고, 2) 나노포어 챔버를 플러싱하고, 3) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다.Another common experimental protocol is 1) running a suspected target:reference control mixture ratio close to the target:reference ratio in the unknown mixture, during recording time T, 2) flushing the nanopore chamber, 3) recording time T while running the unknown mixture.
또 다른 일반적인 실험 프로토콜은 1) 기록 시간 T 동안 1:1 표적:참조 대조군 혼합 비율을 실행하고, 2) 나노포어 챔버를 플러싱하고, 3) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다.Another common experimental protocol is to 1) run a 1:1 target:reference control mix ratio for recording time T, 2) flush the nanopore chamber, and 3) run unknown mixture for recording time T.
일부 구현예에서, 단일 나노포어를 이용하는 실험 프로토콜은 1) 기록 시간 T 동안 100% 표적을 실행하고, 2) 나노포어 챔버를 플러싱하고, 3) 기록 시간 T 동안 100% 참조를 실행하며, 4) 나노포어 챔버를 플러싱하고, 5) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다.In some embodiments, an experimental protocol using a single nanopore is 1) running 100% target for recording time T, 2) flushing the nanopore chamber, 3) running 100% reference for recording time T, 4) flush the nanopore chamber, and 5) run the unknown mixture for recording time T.
일부 구현예에서, 단일 나노포어를 이용하는 한 실험 프로토콜은 1) 기록 시간 T 동안 100% 표적을 실행하고, 3) 나노포어 챔버를 플러싱하고, 4) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다.In some embodiments, one experimental protocol using single nanopores is to 1) run 100% target for recording time T, 3) flush the nanopore chamber, and 4) run unknown mixture for recording time T.
일부 구현예에서, 단일 나노포어를 이용하는 한 실험 프로토콜은 1) 기록 시간 T 동안 100% 참조를 실행하고, 2) 나노포어 챔버를 플러싱하고, 3) 기록 시간 T 동안 미공지 혼합물을 실행하는 것이다.In some embodiments, one experimental protocol using single nanopores is to 1) run a 100% reference for a recording time T, 2) flush the nanopore chamber, and 3) run an unknown mixture for a recording time T.
일부 구현예에서, 단일 나노포어를 이용하는 한 실험 프로토콜은 기록 시간 T 동안 미공지 혼합물만을 실행하고, 100% 참조 대조군 샘플, 100% 표적 대조군 샘플, 공지된 표적:참조 대조군 혼합물, 또는 이들의 임의의 조합으로부터 유래된 오차 보정 정보를 포함하는 룩업 테이블로부터의 데이터 또는 이전의 데이터를 이용하며, 각각은 상기 미공지 혼합물에 대한 실험 프로토콜과 실질적으로 유사한 조건에서 실행되고, 기록 시간 T로부터 생성된 데이터에 적어도 하나의 보정항을 제공하여 미공지 혼합물 내 표적 분석물의 분포분율의 추정치를 개선한다.In some embodiments, one experimental protocol using single nanopores runs only unknown mixture for recording time T, 100% reference control sample, 100% target control sample, known target:reference control mixture, or any thereof Data from a lookup table containing error correction information derived from the combination or previous data is used, each run under conditions substantially similar to the experimental protocol for the unknown mixture, and data generated from recording time T At least one correction term is provided to improve the estimate of the fraction of distribution of the target analyte in the unknown mixture.
실험 프로토콜의 완료 시, 대조군으로부터 기록된 이벤트(실행된 경우) 및 미공지(들)로부터 기록된 이벤트는 수학적으로 분석되어 하나 이상의 미공지 내의 참조에 대한 표적의 분량을 예측한다.Upon completion of the experimental protocol, events recorded from controls (if executed) and events recorded from unknown(s) are mathematically analyzed to predict the amount of target relative to a reference within one or more unknowns.
분포분율 추정 및 한계 결정Estimating fractions of distribution and determining limits
분포분율 프레임워크는: 1) 표적 분석물 및 참조 유형 모두에 대하여, 샘플 물질을 나노포어 감지 포맷으로 전환하는 생화학적 방법을 고안 및 적용하는 단계; 2) 특정 나노포어 실험 프로토콜을 적용하는 단계; 및 3) 참조에 e한 표적 분석물 (표적:참조)의 분량에 대한 정량적 추정치를 생성하는 단계를 포함한다. 이 섹션은 상기 프레임워크의 파트 3에 중점을 둔다.The fraction of distribution framework comprises the steps of: 1) designing and applying biochemical methods to convert sample materials into nanopore sensing formats, for both target analytes and reference types; 2) applying a specific nanopore experimental protocol; and 3) generating a quantitative estimate for the amount of the target analyte (target:reference) referenced. This section focuses on
일부 경우에, 참조 서열 "r"에 대한 표적 서열 "t"의 추정된 농도 비율 R=[t]/[r]가 정량화된다. 전이 유전자 백분율, 또는 GMO%는, 상기 비율 R을 백분율로 환산한 것이다. 일부 경우에, 전체 (표적 및 참조 서열)에 대한 표적 서열의 추정된 분량 F=[t]/([t] + [r])이 정량화된다. 상기 비율 R과 분량 F 사이의 간단한 환산, 즉 F = R/(R + 1) 또는, 동등하게, R = F/(1 - F)이 존재한다.In some cases, the estimated concentration ratio R=[t]/[r] of the target sequence “t” to the reference sequence “r” is quantified. The transgene percentage or GMO% converts the ratio R into a percentage. In some cases, the estimated amount of the target sequence relative to the total (target and reference sequence) F=[t]/([t] + [r]) is quantified. There is a simple conversion between said ratio R and the quantity F: F = R/(R + 1) or, equivalently, R = F/(1 - F).
분포분율 방법은 참조에 대한 표적, 또는 전체(표적 및 참조의 합)에 대한 표적의 상대적인 양을 예측한다. 일부 구현예에서, 표적 또는 참조 분자의 절대 농도를 결정하기 위하여 보정 분자를 가할 수 있다. 일부 구현예에서, 일정한 농도에서 표적 분자 대 보정 분자의 상대적 포획률은 샘플 내 표적 분자의 농도와 관련이 있을 수 있으며, 다수의 나노포어로부터 유래되는 정보가 상기 표적 분자의 농도를 결정하는 데 이용될 수 있다.Fractional distribution methods predict the relative amount of a target to a reference, or a target to the whole (sum of target and reference). In some embodiments, a calibration molecule may be added to determine the absolute concentration of the target or reference molecule. In some embodiments, the relative capture rate of the target molecule to the calibration molecule at a constant concentration may be related to the concentration of the target molecule in the sample, wherein information derived from the plurality of nanopores is used to determine the concentration of the target molecule. can be
일부 구현예에서, 단일 나노포어 이벤트 특징이 분포분율을 계산하기 위하여 표적 및 참조 분석물 사이에서 비교된다. 일부 구현예에서, 하나 이상의 나노포어 이벤트 특징은 분포분율을 계산하기 위하여 표적 및 참조 분석물 유형 사이에서 비교된다.In some embodiments, single nanopore event characteristics are compared between a target and a reference analyte to calculate a fraction of distribution. In some embodiments, one or more nanopore event characteristics are compared between target and reference analyte types to calculate a fraction of distribution.
표적 분석물 및 참조 분석물과 관련된 이벤트 신호를 구별하고 분포분율을 결정하기 위해 나노포어로부터 이벤트 신호를 이용하여 오차에 대해 보정하는 한계 결정을 개선하는 본 명세서에서 기술된 세 가지 방법이 있다: 1) Q-검정법, 2) 서포트 벡터 머신(SVM), 3) 가우스 혼합에 대한 기대 최대화 알고리즘(EMGM) 방법.There are three methods described herein to improve limit determination, which uses event signals from nanopores to differentiate between target and reference analytes and to determine the fraction of distribution, to correct for error: 1 ) Q- test, 2) Support Vector Machine (SVM), 3) Expectation Maximization Algorithm (EMGM) method for Gaussian mixture.
다음 일반적 개념이 방법에 적용된다. 첫째, 참조 분석물 "r"에 대한 표적 분석물 "t"의 참 비율은 R=[t]/[r]로 표현된다. 전체(표적 및 참조) 분석물에 대한 표적 분석물의 참 분율은 F=[t]/([t]+[r])로 표현된다. 상기 비율 R과 분율 F 사이의 단순한 환산은 F = R/(R+1) 또는, 동등하게, R = F/(1 - F)이다. 미공지 혼합물의 참 비율은 Rmix이고 혼합물의 참 분율은 Fmix로 표시된다. 수학적 방법은 Fmix 및 Rmix의 추정치를 생성하며, 이는 및 로 표시된다. 표적 및 참조 분자 구성은 구별되는 나노포어 이벤트 신호를 제공하도록 고안 및 생성된다.The following general concepts apply to methods. First, the true ratio of target analyte "t" to reference analyte "r" is expressed as R=[t]/[r]. The true fraction of target analyte relative to total (target and reference) analytes is expressed as F=[t]/([t]+[r]). A simple conversion between said ratio R and fraction F is F = R/(R+1) or, equivalently, R = F/(1 - F). The true fraction of the unknown mixture is R mix and the true fraction of the mixture is denoted as F mix. The mathematical method produces estimates of F mix and R mix , which are and is displayed as Target and reference molecular constructs are designed and generated to provide distinct nanopore event signals.
Q 검정법Q test
수학적 방법은 먼저 기록된 모든 이벤트를 하나 또는 두 개의 카테고리, 즉, 표적 양성(동등하게, 참조 음성) 또는 표적 음성(동등하게, 참조 양성)으로 분류하기 위한 기준을 고안한다. 이벤트 기준은 하나 이상의 이벤트 특징을 이용한다. 일부 구현예에서, 단일 특징은 이벤트를 분류하는 기준을 생성하도록 사용된다. 기준이 주어지면, 각 이벤트는 표적 이벤트 또는 참조 이벤트로 태그된다. 이들은 "표적-태그" 또는 "참조-태그"라고 한다.The mathematical method first devises criteria for classifying all recorded events into one or two categories: target positive (equivalently, reference negative) or target negative (equivalently, reference positive). An event criterion utilizes one or more event characteristics. In some implementations, a single characteristic is used to create a criterion to classify an event. Given the criteria, each event is tagged as either a target event or a reference event. These are referred to as "target-tags" or "reference-tags".
표적-태그된 이벤트의 분율을 Q로 표현하며, 표적-태그된 이벤트의 수를 전체 이벤트의 수로 나눈 값과 같다. 참조-태그된 이벤트의 분율은 1-Q이다. 태그된 분율 Q는 상기 나노포어 농도 분율 F의 함수이며, Q(F)로 표기된다.The fraction of target-tagged events is expressed as Q , equal to the number of target-tagged events divided by the total number of events. The fraction of reference-tagged events is 1- Q . The tagged fraction Q is a function of the nanopore concentration fraction F , denoted Q (F).
혼합물 내 표적-태그된 이벤트의 분율 Q(Fmix)는 Q mix 로 표현되고; 100% 표적 대조군 내 표적-태그된 이벤트의 분율 Q(1)은 Q targ 로 표현되고; 100% 참조 대조군 내 표적-태그된 이벤트의 분율 Q(0)는 Q ref 로 표현되고; 표적:참조 대조군 혼합물 내 표적-태그된 이벤트의 분율은 Q X:Y 로 표현되고 여기서 X:Y는 대조군 혼합물 내 표적-대-참조의 혼합물의 비율이다. 분율 의 경우, Q(z) = Q X:Y 이다. 일부 구현예에서, z = 0.5인 1:1 비율 대조군 혼합물이 바람직하고 태그된 분율은 Q 1:1 또는 Q 50:50 으로 표기된다. The fraction Q (F mix ) of target-tagged events in the mixture is expressed as Q mix; The fraction Q (1) of target-tagged events in 100% target control is expressed as Q targ ; The fraction Q (0) of target-tagged events in the 100% reference control is expressed as Q ref ; The fraction of target-tagged events in the target:reference control mixture is expressed as Q X:Y where X:Y is the ratio of the target-to-reference mixture in the control mixture. fraction For , Q(z) = Q X:Y . In some embodiments, a 1:1 ratio control mixture with z =0.5 is preferred and the tagged fraction is denoted Q 1:1 or Q 50:50.
일반적으로, Q targ 는 1에 가깝고, 1-Q targ 는 위음성 분율을 나타낸다. 일반적으로, Q ref 는 0에 가깝고, Q ref 는 위양성 분율을 나타낸다. 대조군은 Q targ > Q X:Y > Q ref 를 만족한다. 혼합군은 Q targ > Q mix > Q reff 를 만족한다. In general, Q targ is close to 1, and 1- Q targ represents the false negative fraction. In general, Q ref is close to 0, and Q ref represents the false positive fraction. The control group satisfies Q targ > Q X:Y > Q ref . The mixed group satisfies Q targ > Q mix > Q reff .
일부 구현예에서, 대조군으로부터의 표적-태그된 분율(Q targ , Q ref , Q X:Y )는 개별적으로 실행되며, 룩업 테이블은 Q mix 를 측정하는 임의의 새로운 분석에 대한 값을 참조하는 데 사용된다. 일부 구현예에서, (Q targ , Q ref , Q X:Y )는 분석의 일부로서 사용 지점에 설정된다. 일부 구현예에서, (Q targ , Q ref )는 개별적으로 실행되고 룩업 테이블은 이의 값을 참조하는 데 사용되는 반면, (Q X:Y ) 값은 Q mix 를 측정하는 분석의 일부로서 사용 지점에 설정된다.In some embodiments, target-tagged fractions from controls ( Q targ , Q ref , Q X:Y ) are run individually, and lookup tables are used to reference values for any new assay that measures Q mix. used In some embodiments, ( Q targ , Q ref , Q X:Y ) is set at the point of use as part of the analysis. In some implementations, ( Q targ , Q ref ) is run separately and a lookup table is used to reference its values, whereas ( Q X:Y ) values are used as part of an analysis to measure Q mix at the point of use. is set
일부 구현예에서, 대조군으로부터의 표적-태그된 분율(Q targ , Q ref , Q X:Y )은 사용 지점에 1 회 이상 실행되고, 이의 값은 하기 식에서 후속 사용을 위해 평균화된다.In some embodiments, target-tagged fractions from controls ( Q targ , Q ref , Q X:Y ) are run one or more times at the point of use, the values of which are averaged for subsequent use in the equation below.
참 분량 Fmix의 추정치 에 대한 식은 다음과 같이 주어진다:Estimate of true quantity F mix The expression for is given as:
(식 1) (Equation 1)
여기서 , 및 이다.here , and to be.
참 비율 Rmix의 추정치 에 대한 식은 다음과 같이 주어진다:Estimate of true ratio R mix The expression for is given as:
(식 2) (Equation 2)
전이 유전자(GMO)의 분량을 예측하기 위한 예에서, GMO(%)는 (%)와 같다.In the example for predicting the amount of transgene (GMO), GMO (%) is Same as (%).
상기 파라미터 는 위양성 검출 오차, 위음성 검출 오차, 또는 둘 다에 대하여 보상할 수 있는 비율의 추정치이다. 일부 구현예에서, 의 값은 위양성 오차에 대하여 보상하는 데 사용될 수 있다. 위양성 오차에 대한 보상이 사용되지 않으면, 은 0으로 설정될 수 있다. 일부 구현예에서, 의 값은 위음성 오차에 대하여 보상하는 데 사용될 수 있다. 위음성 오차에 대한 보상이 사용되지 않으면, 은 0으로 설정될 수 있다.the above parameters is an estimate of the ratio that can be compensated for false-positive detection error, false-negative detection error, or both. In some embodiments, The value of can be used to compensate for false-positive errors. If compensation for false-positive errors is not used, may be set to 0. In some embodiments, The value of can be used to compensate for false negative errors. If compensation for false negative error is not used, may be set to 0.
상기 파라미터 는 비율 보상 승수이다. 분석적으로, 상기 파라미터 는 두 포획률 상수의 비율이다. 포획률 상수는 나노포어 이벤트 비율을 주어진 분자 유형에 대한 농도로 나눈 값이다. 구체적으로, 상기 파라미터 는 참조 분자 포획률 상수를 표적 분석물 포획률 상수로 나눈 값이다. 따라서, 상기 승수 는 표적 및 참조 분자 유형 간의 나노포어 포획 및 검출의 차이에 대하여 보상한다.the above parameters is the ratio reward multiplier. Analytical, the parameter is the ratio of the two capture rate constants. The capture rate constant is the rate of nanopore events divided by the concentration for a given molecular type. Specifically, the parameter is the reference molecule capture rate constant divided by the target analyte capture rate constant. Therefore, the multiplier compensates for differences in nanopore capture and detection between target and reference molecule types.
대조군 혼합물이 1:1 비율일 때, 이다.When the control mixture is in a 1:1 ratio, to be.
표적 분석물 및 참조 분석물의 포획률 상수 격차차이에 대한 보상이 사용되지 않을 때, 는 식 (1) 및 (2)에서 1로 설정되어, 및 각각에 대한 추정치를 제공한다.When compensation for the difference in capture rate constants of the target analyte and the reference analyte is not used, is set to 1 in equations (1) and (2), and An estimate is provided for each.
식 (1) 및 (2)를 적용하면 및 각각에 대한 추정치를 제공한다. 및 에 대한, 불확실성 추정치, 또는 오차 막대 역시 계산될 수 있다. 분리된 및 혼합 대조군에 대한 및 미공지 혼합물에 대한 각 Q는 그와 관련된 표준 오차, std(Q) 를 가지며, 여기서 N은 전체 이벤트의 수이다. 수치적으로, 각각의 Q 분포로부터의 무작위적 샘플이 여러 번 추출되어, 식 (1) 및 (2)를 적용하여 및 에 대한 값의 분포를 생성할 수 있다. 그런 다음 및 에 대한 분포를 이용하여 불확실성 한계를 계산할 수 있으며, 결과적으로 및 이 된다.Applying equations (1) and (2), we get and An estimate is provided for each. and Uncertainty estimates, or error bars, can also be computed for . Each Q for the isolated and mixed controls and for the unknown mixture is the standard error associated with it, std( Q) , where N is the total number of events. Numerically, a random sample from each Q distribution was taken multiple times, applying equations (1) and (2) to and You can create a distribution of values for . after that and The uncertainty limit can be calculated using the distribution for and becomes this
일부 구현예에서, 이벤트 특징 기준에 맞거나 벗어나는 이벤트의 비율 또는 분율은 미공지 혼합물 내 참조에 대한 표적의 분량을 추정하는 데 사용된다. 일부 구현예에서, 상기 기준은 한계이다.In some embodiments, the proportion or fraction of events meeting or deviating from the event characteristic criterion is used to estimate the amount of target relative to a reference in the unknown mixture. In some embodiments, the criterion is a limit.
본 발명자들의 이전 작업은 단일 태그 기준을 이용하여 Q와 그 오차 막대를 계산하는 방법을 기술한다(Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang, and William B Dunbar. "Nanopore-Based Target Sequence Detection." Edited by Meni Wanunu. PloS One 11, no. 5 (May 5, 2016): e0154426-21. doi:10.1371/journal.pone.0154426). 상기 작업에서 상세히 설명한 바와 같이, 기준을 적용하여, 각각의 이벤트 j는 그에 할당된 변수 Z j 를 가진다. 만일 이벤트 j가 테그되면, Z j = 1이고; 그렇지 않으면, Z j = 0이다. 각 시약 세트(대조군 및 미공지)에 대하여, 이며, 여기서 N은 전체 이벤트의 수이다. 동일한 기준이 모든 대조군, 분리된 것 및 혼합물, 및 모든 미공지에 적용되어, 위의 식들(식 (1)-(2))에 사용되는 모든 Q 값을 계산한다. Our previous work describes a method for calculating Q and its error bars using a single tag criterion (Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang, and William B Dunbar. "Nanopore-Based Target Sequence Detection." Edited by Meni Wanunu.
상기 기준은 하나 또는 하나 이상의 부등식을 포함하며, 하나 이상의 이벤트 특징의 선형 또는 비선형 함수일 수 있다. 각 부등식은 그와 관련된 한계 또는 한계의 범위를 갖는다. 따라서, 기준은 부등식 세트 및 그에 상응하는 한계 세트에 의해 완전히 특정된다.The criterion includes one or more inequalities and may be a linear or non-linear function of one or more event characteristics. Each inequality has an associated limit or range of limits. Thus, the criterion is fully specified by a set of inequalities and a corresponding set of limits.
일부 구현예에서, 상기 기준은 표적 및 참조 분자 유형의 클래스에 대해 설정되며, 해당 클래스에 대한 분자의 유형을 이용한 새로운 분석은 기설정된 기준을 이용할 수 있다.In some embodiments, the criteria are established for classes of target and reference molecule types, and new analyzes using the types of molecules for that class may use the predefined criteria.
일부 구현예에서, 상기 기준은 임의의 새로운 분석을 위해 수집된 대조군 데이터로부터 식별된다. 즉, 상기 기준은 운용시 분포분율 프로토콜의 일부로서 실행 시간에 설정된다.In some embodiments, the criteria are identified from control data collected for any new analysis. That is, the criteria are set at run time as part of the operational fractional distribution protocol.
일부 구현예에서, 상기 기준을 위한 부등식 세트는 비교 가능한 표적 및 참조 분자 유형을 이용한 이전의 실험 세트로부터 선험적으로 설정되는 반면, 하나 이상의 기준 부등식에 대한 한계 세트는 대조군 데이터를 이용한 실행 시간에 설정된다. In some embodiments, the set of inequalities for the criterion is established a priori from a previous set of experiments with comparable target and reference molecule types, while the limit set for one or more criterion inequalities is set at run time using control data. .
일부 구현예에서, 단일 이벤트 특징은 상기 기준을 설정하는 데 이용된다. In some embodiments, a single event characteristic is used to establish the criteria.
"q,"라고 표시된, 한계는 부등식에 기반하여 표적-태그되지-않은(즉, 참조-태그된) 이벤트로부터 표적-태그된 이벤트를 구분하는 스칼라 값이다. 한 기준 내에서 하나 이상의 부등식이 사용될 때, q는 부등식 세트 사용되는 한계값들의 벡터를 나타낼 수 있다.The limit, denoted " q, ", is a scalar value that distinguishes target-tagged events from non-target-tagged (ie, reference-tagged) events based on the inequality. When more than one inequality is used within a criterion, q may represent a vector of bound values used in the set of inequalities.
표적 및 참조에 대해 길이가 다른 두 dsDNA를 사용하는 예를 고려해보자. 일반적으로, 이벤트 면적을 이용한 단일 부등식은 실행 가능한 기준이다. 표적이 참조 dsDNA보다 길이가 긴 dsDNA인 경우, 면적이 한계를 초과하면 이벤트는 태그된다. 표적이 참조 dsDNA보다 길이가 짧은 dsDNA인 경우, 면적이 한계보다 작다면 이벤트는 태그된다.Consider the example of using two dsDNAs of different lengths for target and reference. In general, a single inequality using the event area is a viable criterion. If the target is a dsDNA that is longer than the reference dsDNA, the event is tagged if the area exceeds the limit. If the target is a dsDNA that is shorter in length than the reference dsDNA, an event is tagged if the area is less than the limit.
다양한 방법을 사용하여 q-한계값 또는 한계값들의 선택을 자동화할 수 있으며, 여기서 기준 내의 각 부등식에 대하여 하나의 q 값이 식별된다.Various methods can be used to automate the selection of a q- threshold value or threshold values, where one q value is identified for each inequality within the criterion.
일부 구현예에서, 상기 q-한계는 Q ref 에 대하여 원하는 위양성을 생성하는 값으로 발견된다. 예를 들어, 상기 q-한계는 5%의 위양성을 생성하기 위한 Q ref 의 95 번째 백분위로 설정될 수 있다. 이 경우, 참조 분자 이벤트들의 95%가 q보다 작은 면적을 갖는다. 또는, SFT q-한계는 Q targ ,에 대하여 원하는 위음성을 생성하는 값으로 발견되며, 즉, 상기 q-한계는 5%의 위음성을 생성하기 위한 Q targ 의 5 번째 백분위로 설정될 수 있다.In some embodiments, the q- limit is found to be a value that produces a desired false positive for Q ref . For example, the q- limit may be set to the 95th percentile of Q ref to produce 5% false positives. In this case, 95% of the reference molecular events have an area less than q. Alternatively, the SFT q- limit is found to be a value that produces a desired false negative for Q targ , ie, the q- limit may be set to the 5th percentile of Q targ to produce a false negative of 5%.
일부 구현예에서, 상기 SFT q-한계는 에 대한 해로서 발견된다. 상기 한계는 Q targ 와 Q ref 사이의 최대 거리에 해당하는 값일 수 있다.In some embodiments, the SFT q- limit is is found as a solution to The limit may be a value corresponding to the maximum distance between Q targ and Q ref.
일부 구현예에서, 상기 q-한계 범위는 Q ref 에 대하여 원하는 위양성 범위를 생성하는 값으로 계산된다. 예를 들어, 상기 q-한계 범위는 Q ref 의 95 번째 내지 99 번째 백분위 범위일 수 있다.In some embodiments, the q- limit range is calculated as a value that produces a desired false positive range for Q ref . For example, the q- limit range may be the 95th to 99th percentile range of Q ref .
q-한계 범위가 이용되는, 일부 구현예에서, 식 (1) 및 (2)는 및 값의 범위를 생성하고, 이들 범위의 평균이 계산되고 예측된 및 으로 보고된다. In some embodiments, where the q- limit range is used, equations (1) and (2) are and Generate a range of values, and the average of these ranges is calculated and predicted and is reported as
표적 DNA 및 참조 DNA에 결합된 두 개의 다른 페이로드를 사용하는 예를 고려해보자. 일반적으로, 이벤트 평균 전도도 및 이벤트 지속시간을 사용한 세 개의 부등식이 실행 가능한 기준이다. 구체적으로, 특정한 페이로드-표적 DNA 분자 구성에 대하여, 표적 이벤트는 평균 δG 대 지속시간의 2D 이벤트 플롯 상에서 고유한 부분 공간을 생성하고, 지속시간이 한계보다 크고, 평균 δG이 한 한계보다 위에 있거나 다른 한계보다 아래에 있을 때 이벤트가 태그된다. 이 경우, 태그 기준은 2 개의 이벤트 특징(평균 δG 및 지속시간)을 이용한, 세 개의 선형 부등식 및 세 개의 한계로 표시된다.Consider an example using two different payloads bound to a target DNA and a reference DNA. In general, three inequalities using event mean conductance and event duration are viable criteria. Specifically, for a particular payload-target DNA molecule construct, a target event creates a unique subspace on a 2D event plot of mean δG versus duration, with duration greater than the limit, and average δG above one limit, or An event is tagged when it is below another limit. In this case, the tag criterion is expressed as three linear inequalities and three limits, using two event features (mean δG and duration).
SVM 방법SVM method
일부 구현예에서, 기계 학습은 각 이벤트를 표적 분석물 이벤트 또는 참조 분석물 이벤트로 태그하기 위한 특징 세트 및 특징 기준을 식별하는 데 사용된다. 일부 구현예에서, 서포트 벡터 머신은 이벤트를 표적 또는 참조 분석물로 분류하는 데 사용된다.In some embodiments, machine learning is used to identify feature sets and feature criteria for tagging each event as either a target analyte event or a reference analyte event. In some embodiments, a support vector machine is used to classify an event as a target or reference analyte.
일부 구현예에서, 서포트 벡터 머신 워크플로우의 개발은 다음의 단계를 포함한다: 1) 나노포어 데이터를 로딩하는 단계, 2) 이벤트를 구별하기 위한 나노포어 이벤트 특징을 선택하는 단계, 3) 대조군을 이용한 모델 훈련 및 시험 단계, 4) 대조군을 이용하여 데이터를 보정하는 단계, 5) 미공지 표적:참조 혼합물을 예측하는 단계. 일부 구현예에서, 자동화된 분포분율 예측을 위하여 종래에 개발되고 감소된 서포트 벡터 머신 워크플로우이 구현된다.In some embodiments, development of a support vector machine workflow comprises the following steps: 1) loading nanopore data, 2) selecting nanopore event characteristics to distinguish events, 3) creating a control group training and testing the model used, 4) calibrating the data using controls, 5) predicting an unknown target:reference mixture. In some implementations, a conventionally developed and reduced support vector machine workflow for automated fractional distribution prediction is implemented.
일부 구현예에서, 기계 학습 도구는 이벤트 특징, 부등식의 형태(선형 및/또는 비선형) 및 부등식에 사용되는 한계값 q의 선택을 포함하는, 기준의 선택을 자동화하는 데 적용된다. 일부 구현예에서, 분류 문제를 해결하는 지도형 기계 학습 방법인, 서포트 벡터 머신(SVM)은 태그 기준을 생성하기 위해 구현된다. SVM에 관한 참고문헌은: Cortes, C. & Vapnik, V. Machine Learning (1995) 20: 273과 Boser, B. E., Guyon, I. M., and Vapnik, V. N. (1992). "A training algorithm for optimal margin classifiers," Proceedings of the fifth annual workshop on Computational learning theory을 포함하며, 이들 각각은 그 전체 내용이 참조로서 본 명세서에 포함된다. In some implementations, machine learning tools are applied to automate the selection of criteria, including the selection of event characteristics, the shape of the inequality (linear and/or non-linear), and the threshold q used for the inequality. In some implementations, a support vector machine (SVM), a supervised machine learning method for solving a classification problem, is implemented to generate tag criteria. References on SVM are: Cortes, C. & Vapnik, V. Machine Learning (1995) 20: 273 and Boser, BE, Guyon, IM, and Vapnik, VN (1992). "A training algorithm for optimal margin classifiers," including the Proceedings of the fifth annual workshop on Computational learning theory , each of which is incorporated herein by reference in its entirety .
본 발명의 분포분율 프레임워크에 SVM 방법을 적용하는 예는 다음과 같다:An example of applying the SVM method to the distributed fraction framework of the present invention is as follows:
선형 분리 가능한 데이터에 대하여, {x 1, ..., x n}를 데이터 세트라고 하고 yi ∈ {1, -1}를 x i의 클래스 라벨이라 하면, 결정 경계는 다음에 의해 모든 포인트들을 분류해야 한다:For linearly separable data, let { x 1 , ..., x n } be the data set and y i ∈ {1, -1} be the class label of x i , the decision boundary is You should classify:
모든 포인트들을 분류하는 마진을 최대화하기 위해, 분류 문제는 다음과 같은 최적화 문제가 된다:To maximize the margin of classifying all points, the classification problem becomes an optimization problem as follows:
Minimize (식 3)Minimize (Equation 3)
결정 경계에 가까운 데이터 포인트를 서포트 벡터라 한다.Data points close to the decision boundary are called support vectors.
실제 문제의 경우, 데이터는 일반적으로 일부 특이값 또는 노이즈로 인해 선형으로 분리 가능하지 않다. 분류를 최적화하기 위해, 일부 잘못 분류된 포인트를 허용하도록 마진을 조정하였다. 한편, 잘못된 분류된 사례는 높은 비용으로 처벌되었다. 이러한 마진은 소프트 마진이 된다. 소프트 마진 분류는 비용 함수에 "슬랙" 변수를 추가하여 사용될 수 있다(도 3A).For practical problems, the data are usually not linearly separable due to some singular value or noise. To optimize classification, margins were adjusted to allow for some misclassified points. On the other hand, misclassified cases were punished at a high cost. These margins become soft margins. Soft margin classification can be used by adding a “slack” variable to the cost function ( FIG. 3A ).
선형으로 분리 가능하지 않은 데이터를 처리하는 두 번째 방법은 커널 방법이다(Boser, B. E., et al., 앞에서 인용). 이는 입력 특징 공간을 더 높은 차원 공간으로 변환한다. 이렇게 하면, 데이터는 선형으로 분리할 수 있다(도 3B). 맵핑 함수를 로 표시하면, 그 다음 커널 함수 K는 다음과 같이 표현될 수 있다.A second method for dealing with data that is not linearly separable is the kernel method (Boser, BE, et al., cited earlier). This transforms the input feature space into a higher dimensional space. In this way, the data can be separated linearly ( FIG. 3B ). mapping function , the next kernel function K can be expressed as
(식 4) (Equation 4)
사용 가능한 커널 함수의 유형 세트가 있다. 가장 일반적인 유형은 다음과 같다:There is a set of types of kernel functions available. The most common types are:
선형 커널linear kernel
다항식 커널polynomial kernel
가우스(RBF) 커널Gaussian (RBF) kernel
일반적으로, 커널 트릭과 소프트 마진 모두는 분류 문제에 대한 더 나은 해를 생성하기 위해 사용된다.In general, both kernel tricks and soft margins are used to generate better solutions to classification problems.
SVM을 분포분율에 대한 나노포어 데이터에 적용하는 것은 다음의 단계를 갖는다: 1) 각 세트에 대하여 모든 이벤트를 포함하는, 대조군 및 미공지 데이터 세트를 로딩하는 단계; 2) 특징을 선택하는 단계; 3) 모델 훈련 및 시험 단계; 4) 데이터 보정 단계; 및 5) 및 를 예측하는 단계. 제공된 예에서, 상기 5 단계의 적용은 더 상세하게 설명된다. 식 (3) 및 (4), 커널 유형, 소프트 마진 상수, 및 커널 함수가 의존하는 임의의 파라미터를 포함하는 하이퍼-파라미터 그리드 검색은 상기 방법을 적용하는 일부로 해결된다. 공통 결정 경계 및 공통 보정 비율을 포함하는 SVM에서 생성된 분석 기반 일반화 모델은 대조군 데이터 세트의 필요 없이 미공지 혼합물에 적용될 수 있다.Applying SVM to nanopore data for fraction distribution has the following steps: 1) loading control and unknown data sets, containing all events for each set; 2) selecting a feature; 3) model training and testing phase; 4) data correction step; and 5) and step to predict. In the example provided, the application of the above five steps is described in more detail. A hyper-parameter grid search including equations (3) and (4), kernel type, soft margin constant, and any parameters that the kernel function depends on is solved as part of applying the above method. Analysis-based generalization models generated in SVM with common decision boundaries and common correction ratios can be applied to unknown mixtures without the need for a control data set.
공통 결정 경계 및 공통 보정 비율을 포함하는 SVM에서 생성된 분석 기반 일반화 모델은 대조군 데이터 세트의 필요 없이 미공지 혼합물에 적용될 수 있다. 결정 트리, 신경망, Native Bayer, 로지스틱 회귀, K-최근접 이웃 및 부스팅을 포함하는 그 밖의 데이터 마이닝 방법도 나노포어 데이터에 대해 적용 가능한 방법으로 청구된다.Analysis-based generalization models generated in SVM with common decision boundaries and common correction ratios can be applied to unknown mixtures without the need for a control data set. Other data mining methods including decision trees, neural networks, Native Bayer, logistic regression, K-nearest neighbors and boosting are also claimed as applicable methods for nanopore data.
EMGM 방법(가우스 혼합 모델에 대한 기대 최대화 알고리즘)EMGM Method (Expectation Maximization Algorithm for Gaussian Mixture Models)
일부 구현예에서, 클러스터링 방법은 표적 이벤트 및 참조 이벤트를 태그하기 위한 기준을 생성하는 데 적용된다. 각 이벤트는 표적 이벤트 또는 참조 이벤트로 태그된다. 일부 구현예에서, 분포분율은 표적 및 참조 이벤트의 합에 대한 표적 이벤트의 비율이다. 보상 정보를 제공하는 대조군을 실행하는 것은 분포분율의 추정치를 개선하는 조정을 가능하게 한다.In some embodiments, clustering methods are applied to generate criteria for tagging target events and reference events. Each event is tagged as either a target event or a reference event. In some embodiments, fraction distribution is the ratio of target events to the sum of target and reference events. Running a control that provides reward information allows adjustments to improve the estimate of the fraction of distribution.
일부 구현예에서, 상기 클러스터링 방법은 하나 이상의 이벤트 파라미터의 분포의 파라미터화된 모델에 적용되는 최대 우도 방법이다. 대조군 세트에 대하여 최대 우도 추정의 반복적 적용은, 표적 분석물 유형과 관련된 분포의 한 세트 및 참조 분석물 유형과 관련된 분포의 다른 세트와 함께 적합한 모델 파라미터를 생성한다. 이어서, 파라미터화된 모델의 미공지 혼합물에의 적용은 참조 분포(들)의 표적에 대한 이벤트의 할당을 생성하고, 표적 및 참조 분포에 할당된 이벤트의 총 수에 대한 표적 분포(들)에 할당된 이벤트의 비율은 분량 추정치를 생성하는 데 사용된다.In some embodiments, the clustering method is a maximum likelihood method applied to a parameterized model of the distribution of one or more event parameters. Iterative application of the maximum likelihood estimate to the control set, along with one set of distributions associated with the target analyte type and another set of distributions associated with the reference analyte type, produces suitable model parameters. Application of the parameterized model to the unknown mixture then produces an assignment of events to the target of the reference distribution(s), and assignment to the target distribution(s) to the target and the total number of events assigned to the reference distribution. The proportion of events that have occurred is used to generate a volume estimate.
로그 우도 함수는 상기 알고리즘의 반복에서 진행을 추적하기 위한 매트릭으로 사용되며, 이는 대조군 데이터에서 각 이벤트의 멤버십 할당을 반복적으로 업데이트하고 데이터에 대한 분포의 적합성을 개선한다. 일부 구현예에서, 데이터는 파라미터화된 가우스 분포들의 혼합을 이용하여 모델링된다. 가우스 혼합 모델을 포함하는, 수치 데이터를 특성화하는 유한 혼합 모델을 이용하는 방법은, 통계 및 응용수학 분야에 잘 특성화된다(Hand, David J., Heikki Mannila, and Padhraic Smyth. Principles of data mining. MIT press, 2001).The log-likelihood function is used as a metric to track progress in iterations of the algorithm, which iteratively updates the membership assignment of each event in the control data and improves the fit of the distribution to the data. In some implementations, the data is modeled using a mixture of parameterized Gaussian distributions. Methods using finite mixture models to characterize numerical data, including Gaussian mixture models, are well characterized in the fields of statistics and applied mathematics (Hand, David J., Heikki Mannila, and Padhraic Smyth. Principles of data mining. MIT press , 2001).
일부 구현예에서, 가우스 혼합(GM) 모델이 주어지면, 상기 방법은 성분 및 혼합 계수의 평균 및 공분산을 포함하는 파라미터들에 대하여 상기 우도 함수를 최대화한다. 상기 로그 우도에 대한 닫힌 해는 없기 때문에, 데이터를 할당하기 위한 모드 파리미터 및 가중치는 기대 최대화(EM) 기법을 이용하여 반복적으로 계산된다(C.M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006).In some embodiments, given a Gaussian mixture (GM) model, the method maximizes the likelihood function over parameters including mean and covariance of components and mixing coefficients. Since there is no closed solution to the log-likelihood, mode parameters and weights for assigning data are iteratively calculated using an expectation maximization (EM) technique (C.M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006).
분포분율을 추정치를 생성하기 위하여 GM 모델에 적용되는 EM 알고리즘을 나노포어 데이터에 적용하는 방법을 EMGM이라 한다. Q-검정법과 마찬가지로, EMGM 방법은 참조 이벤트로부터 표적 이벤트를 구별하는 데 사용될 수 있는 하나 이상의 나노포어 이벤트 신호에 대한 사전 지식을 이용한다.The method of applying the EM algorithm applied to the GM model to the nanopore data in order to generate an estimate of the distribution fraction is called EMGM. Like the Q-test, the EMGM method utilizes prior knowledge of one or more nanopore event signals that can be used to differentiate a target event from a reference event.
언급된 바와 같이, 표적 집단은 단일 분포, 또는 둘 이상의 분포로 나타낼 수 있다. 마찬가지로, 참조 집단은 단일 분포, 또는 둘 이상의 분포로 나타낼 수 있다. 표적 및 참조 분포(들)은 하나 이상의 분리된 대조군 및 하나 이상의 대조군 혼합물에 대하여 상기 알고리즘을 적용하여 설정된다.As noted, the target population may be represented by a single distribution, or by two or more distributions. Likewise, a reference population may be represented by a single distribution, or by two or more distributions. Target and reference distribution(s) are established by applying the above algorithm to one or more separate controls and one or more control mixtures.
이어서, 표적 분포(들)가 설정된 후, 미공지 혼합물 내 이벤트는 모델링된 표적 분포(들)와 관련되는 경우 표적 이벤트로 태그된다.Then, after the target distribution(s) have been established, events in the unknown mixture are tagged as target events if they relate to the modeled target distribution(s).
예를 들면, 총 세 개의 가우스 분포가 1:1 대조군 혼합물 내의 전체 데이터 세트에 적합할 수 있으며, 한 모드는 표적 유형과 관련되고 두 개의 모드는 참조와 관련된다.For example, a total of three Gaussian distributions may fit the entire data set in a 1:1 control mixture, with one mode related to target type and two modes to reference.
상기 알고리즘은 EMGM의 적용을 위해 단 하나의 대조군 혼합물만을 필요로 한다. 결과적으로, 결과 모델은 미공지 혼합물에에 적용될 수 있다. 일부 구현예에서, 추가 분리된 참조 대조군이 위양성의 효과를 상쇄하는 데 이용된다. 구체적으로, EMGM 모델의 100% 참조 대조군에의 적용은 위양성 분율을 설정했으며, 이는 EMGM 모델을 미공지 혼합물에 적용하여 생성된 예측 분율로부터 감산된다. 이러한 감산을 위양성 보상(또는 "FP" 보상)으로 지칭할 수 있다.The algorithm requires only one control mixture for application of EMGM. Consequently, the resulting model can be applied to unknown mixtures. In some embodiments, an additional isolated reference control is used to counteract the effect of false positives. Specifically, the application of the EMGM model to a 100% reference control set the false positive fraction, which was subtracted from the predicted fraction generated by applying the EMGM model to the unknown mixture. This subtraction may be referred to as false positive compensation (or “FP” compensation).
멀티포어 컨센서스 호출을 구현하는 구현예Implementation example implementing multipore consensus call
일부 적용예에서, 위와 아래에 설명된 시스템(들)의 구현예는 다수의 포어로부터의 표적 샘플 성분들의 분포분율 및/또는 농도의 추정치를 생성하여 보다 정확한 분포분율 및/또는 농도 추정치를 생성할 수 있다. 이와 같이, 개별 포어들(예컨대, 하나 이상의 나노포어 장치)로부터의 출력이 분포분율 및/또는 농도의 개선된 추정치를 생성하기 위해 조합되어 처리될 수 있다. 특히, 분포분율 및/또는 농도의 추정치는 추정치 생성에 기여하는 하나 이상의 나노포어로부터의 결과와 함께 공통 샘플(즉, 대조군으로부터, 미공지 혼합물로부터)의 상이한 분취량을 처리하는 단일 또는 다수의 마이크로유체 나노포어 장치(예컨대, 소모품)로부터 생성될 수 있다.In some applications, implementations of the system(s) described above and below may generate estimates of the fraction and/or concentration of target sample components from a plurality of pores to produce a more accurate estimate of the fraction and/or concentration. can As such, outputs from individual pores (eg, one or more nanopore devices) can be combined and processed to produce improved estimates of fraction distribution and/or concentration. In particular, estimates of fractions of distribution and/or concentrations can be derived from single or multiple micropores processing different aliquots of a common sample (i.e., from a control, from an unknown mixture) with results from one or more nanopores contributing to the generation of the estimate. Fluid nanopores can be generated from devices (eg, consumables).
따라서 하나 이상의 방법은, 이하에서 더 상세히 설명되는 바와 같이 다음 중 하나 이상을 포함할 수 있다: 하나 이상의 나노포어 장치 내에서 나노포어 세트에 전압을 가하여 검출 가능한 전자 신호를 생성하고 표적 분석물 및 참조 분석물의 유닛을 포함하는 샘플의 일부에 대하여 상기 나노포어 세트를 통해 하전된 분석물의 전위를 유도하는 단계; 상기 나노포어 세트를 통해 상기 표적 분석물 및 참조 분석물의 유닛의 전위로부터 이벤트 신호 세트를 생성하는 단계; 상기 이벤트 신호 세트로부터, 상기 나노포어 세트에 대응하고 상기 표적 분석물의 분포분율과 관련되는 파라미터 세트를 생성하는 단계; 상응하는 한계 조건에 따라 상기 파라미터 세트 각각을 평가하여 검증된 파라미터 세트를 생성하는 단계로서, 상기 상응하는 한계 조건 각각은 상기 파라미터 세트의 값에 걸쳐 결정된 가변성의 척도의 함수에 기반하고, 상기 검증된 파라미터 세트를 생성하는 단계는 상기 상응하는 한계 조건을 만족하는 파라미터 값을 유지하는 것을 포함하는 단계; 상기 (검증된) 파라미터 세트의 값을 파라미터 조합 연산으로 조합하는 단계; 및 상기 파라미터 조합 연산의 출력에 근거하여 표적 분석물의 분포분율의 추정치를 반환하는 단계.Accordingly, the one or more methods may include one or more of the following, as described in greater detail below: applying a voltage to a set of nanopores within the one or more nanopore devices to generate a detectable electronic signal and generating a detectable electronic signal and a target analyte and reference inducing a potential of a charged analyte through the set of nanopores with respect to a portion of the sample comprising units of the analyte; generating a set of event signals from the potential of units of the target analyte and a reference analyte through the set of nanopores; generating, from the set of event signals, a set of parameters corresponding to the set of nanopores and related to the distribution fraction of the target analyte; evaluating each of the parameter sets according to corresponding limit conditions to produce a validated parameter set, each of the corresponding limiting conditions being based on a function of a measure of variability determined over values of the parameter set, wherein generating the parameter set includes maintaining parameter values that satisfy the corresponding limit condition; combining the values of the (verified) parameter sets by a parameter combination operation; and returning an estimate of the distribution fraction of the target analyte based on the output of the parameter combination operation.
도 15A는 샘플 내 표적 분석물의 분포분율을 결정하기 위하여 임의의 수의 나노포어로부터 컨센서스 호출을 이용하는 방법의 흐름도를 도시한다. 도 15A에 도시된 바와 같이, 나노포어 장치와 관련된 계산 시스템(예컨대, 이하에서 설명된 나노포어 장치의 구현예와 같은)은 상기 나노포어 장치의 포어 세트에 상응하는 포어 파라미터 세트를 수신한다(1510). 상기 포어 파라미터 세트는 상기 포어 세트와 연결된 전극들로부터 출력되는 전기 신호(예컨대, 전류 측정)로부터 유도될 수 있으며, 상기 전기 신호는, 전술한 바와 같이, 상대적인 분포분율의 추정치를 결정하기 위하여 [t] 및 [r]를 결정하는 데 유용하지만; 그러나, 다른 구현예에서, 상기 포어 파라미터 세트는 다른 신호로부터 추가적으로 또는 대안적으로 유도될 수 있다.15A depicts a flow diagram of a method of using a consensus call from any number of nanopores to determine the distribution fraction of a target analyte in a sample. 15A , a computational system associated with a nanopore device (eg, such as an implementation of a nanopore device described below) receives a set of pore parameters corresponding to the set of pores of the nanopore device (1510). ). The pore parameter set may be derived from an electrical signal (eg, current measurement) output from electrodes connected to the pore set, and the electrical signal, as described above, is [t] to determine an estimate of the relative fraction of distribution. ] and [r] are useful for determining; However, in other embodiments, the pore parameter set may additionally or alternatively be derived from other signals.
상기 계산 시스템은 그런 다음 하나 이상의 한계 조건에 따라 포어 파라미터세트 각각을 평가한다(1520). 상기 한계 조건은 다수의 포어로부터 유도된 출력에 근거한 한계 조건을 포함할 수 있다. 예를 들어, 상기 둘 이상의 포어 세트에 걸친 가변성에 대한 통계적 측정은 분포분율의 추정치를 결정하기 위해 각 포어의 출력이 다른 포어의 출력과 함께 처리되어야 하는지를 평가하기 위한 한계 조건을 설계하는 데 이용될 수 있다. 가변성의 통계적 측정은: 다수의 포어에 걸친 파라미터 값의 범위(예컨대, 4분위수 범위), 다수의 포어에 걸친 파라미터 값의 분산, 다수의 포어에 걸친 파라미터 값의 표준편차, 및 기타 임의의 적절한 통계적 또는 비통계적 측정 중 하나 이상을 포함하거나 그로부터 유도될 수 있다. 다른 구현예에서, 상기 한계 조건은 각 포어가 다른 포어의 출력과 독립적으로 평가되는 방식으로 구성될 수 있다.The computational system then evaluates ( 1520 ) each set of pore parameters according to one or more limit conditions. The limit condition may include a limit condition based on outputs derived from a plurality of pores. For example, a statistical measure of variability across the two or more sets of pores could be used to design limiting conditions for evaluating whether the output of each pore should be processed along with the output of the other pore to determine an estimate of the fraction of distribution. can Statistical measures of variability include: range of parameter values across multiple pores (eg, quartile ranges), variance of parameter values across multiple pores, standard deviation of parameter values across multiple pores, and any other suitable statistical measure. or one or more of non-statistical measures. In other embodiments, the limit condition may be configured in such a way that each pore is evaluated independently of the output of the other pore.
도 15A에 도시된 바와 같이, 상기 계산 시스템은 그 후에, 상기 포어 파라미터 세트의 평가에 근거하여, 각 한계 조건을 만족하는 포어 파라미터의 서브세트를 파라미터 조합 연산으로 조합한다(1530). 상기 파라미터 조합 연산은 각 한계 조건을 만족하는 포어 파라미터의 세트로부터 결정된 평균 파라미터 값(예컨대, 평균값, 중앙값, 모드)을 출력할 수 있다. 일부 구현예에서, 상기 평균 파라미터 값은 가중 평균일 수 있고, 여기서 상기 가중 평균을 계산하는 데 사용되는 데 각 파라미터에 주어진 가중치는 단계 1520의 한계-기반 비교(예컨대, 상기 상응하는 한계 조건의 만족 정도)에 근거하여 결정될 수 있다. 한 구현예에서, 파라미터 값 및 이의 각 한계 조건 사이의 거리는 가중치를 결정하는 데 사용될 수 있다. 예를 들어, 한계 조건을 만족하는 정도가 더 낮은 파라미터 값은 가중치가 덜 부여될 수 있고, 한계 조건을 만족하는 정도가 더 높은 파라미터 값은 가중치가 더 부여될 수 있다.As shown in Fig. 15A, the calculation system then combines (1530) a subset of the Fore parameters that satisfy each limit condition into a parameter combining operation, based on the evaluation of the Fore parameter sets. The parameter combination operation may output an average parameter value (eg, an average value, a median value, a mode) determined from a set of pore parameters that satisfy each limit condition. In some embodiments, the average parameter value may be a weighted average, wherein the weight given to each parameter used to calculate the weighted average is determined by the limit-based comparison of step 1520 (eg, satisfaction of the corresponding limit condition). degree) can be determined. In one implementation, the distance between a parameter value and its respective limit condition can be used to determine the weight. For example, a parameter value with a lower degree of satisfying the limit condition may be given less weight, and a parameter value with a higher degree of satisfying the limit condition may be given more weight.
도 15A에 도시한 바와 같이, 상기 계산 시스템은 그 후에, 단계 1530의 파라미터 조합 연산의 출력에 근거하여 분포분율 추정치를 반환하며(1540), 여기서 상기 분포분율 추정치는 위에서 설명된 바와 같이, 표적 분석물 및 참조 분석물 전체 집단에 비교하여 샘플 내 표적 분석물의 백분율을 설명한다. 도 15A에 도시된 것과 유사한 방법은 또한 하기 도 15D와 관련된 예에서 보다 자세히 설명된 바와 같이, 표적 샘플 성분의 농도를 결정하는 데 사용될 수 있다.As shown in Figure 15A, the computational system then returns a fraction of distribution estimate based on the output of the parameter combination operation of step 1530 (1540), wherein the fraction of distribution estimate is subjected to target analysis, as described above. Describes the percentage of target analyte in the sample compared to the total population of water and reference analytes. Methods similar to those shown in FIG. 15A may also be used to determine the concentration of a target sample component, as described in more detail in the example associated with FIG. 15D below.
도 15B는 샘플 내 표적 분석물의 분포분율을 결정하기 위하여 나노포어 장치의 4 개의 포어로부터 컨센서스 호출을 이용하는 구현예를 도시하며, 여기서 도 15B는 도 15A에 나타낸 방법의 보다 구체적인 구현예이다. 도 15B에 도시된 바와 같이, 4 개의 포어로부터 유도된 출력(예컨대, 전기 신호 또는 기타 측정)은 파라미터 값 P1, P2, P3 및 P4를 생성하는 데 사용되며, 가장 작은 것에서 가장 큰 것 순서로, 계산 시스템에 의해, 배열된다. 상기 계산 시스템의 로직은 그 후 P3-P2로 4분위수 범위(IQR)를 정의하고, P1, P2, P3 및 P4 값 중 하나라도, 추가적인 분석을 위해 통과해야 하는지를 결정하기 위해 일련의 한계 조건을 구현한다.15B depicts an embodiment using a consensus call from four pores of a nanopore device to determine the fraction distribution of a target analyte in a sample, wherein FIG. 15B is a more specific embodiment of the method shown in FIG. 15A. As shown in Figure 15B, the outputs derived from the four pores (e.g., electrical signals or other measurements) are used to generate parameter values P1, P2, P3 and P4, in order from smallest to largest: By the calculation system, it is arranged. The logic of the calculation system then defines a quartile range (IQR) as P3-P2 and implements a set of limit conditions to determine whether any of the values P1, P2, P3, and P4 should pass for further analysis. do.
제 1 평가 단계(1501)에서, 상기 계산 시스템은 IQR을 파라미터 값 P2 및 P3의 평균으로 나눈 값을 제 1 한계와 비교하고, IQR/mean(P2, P3)이 제 1 한계보다 크면, 실험이 실패한 것으로 결정한다(따라서, P1, P2, P3 및 P4는 폐기되어야 한다). 그러나, IQR/mean(P2, P3)이 제 1 한계보다 작거나 같으면, P2 및 P3는 추가적인 분석을 위해 통과되고, 상기 계산 시스템은 P1과 P4를 각 한계 조건에 따라 평가한다.In the
제 2 평가 단계(1502)에서, 상기 계산 시스템은 P1을 P2, IQR, 및 X의 함수로 정의되는 제 2 한계와 비교하며, 여기서 X는 상수이다. 도 15B에 도시된 바와 같이, 상기 제 2 한계는 P2-X*IQR로 정의되며, 구체적인 한 예에서, 상기 X의 값은 1.5로 설정된다. P1이 제 2 한계보다 작으면 P1은 폐기되어야 하고; 그러나, P1이 제 2 한계보다 크거나 같으면, P1은 추가적인 분석을 위해 통과되어야 한다.In a
제 3 평가 단계(1503)에서, 상기 계산 시스템은 P4를 P3, IQR, 및 Y의 함수로 정의되는 제 3 한계와 비교하며, 여기서 Y는 상수이다. 도 15B에 도시된 바와 같이, 상기 제 3 한계는 P3+Y*IQR로 정의되며, 구체적인 한 예에서, 상기 Y의 값은 1.5로 설정된다. 그러나, 다른 구현예에서, X와 Y는 서로 동일할 필요는 없고, 상기 제 2 및 제 3 한계는 다른 적절한 방법으로 정의될 수 있다. P4가 제 3 한계보다 크면, P4는 폐기되어야 하고; 그러나, P4가 제 2 한계보다 작거나 같으면, P4는 추가적인 분석을 위해 통과되어야 한다.In a
도 15B에 도시된 바와 같이, 각각의 한계를 통과한 P1, P2, P3, 및 P4의 값은 (예컨대, 평균값을 결정하여, 가중 평균값을 결정하여) 조합된다(1504). 가중 평균이 결정되는 구현예에서, P1, P2, P3, 및 P4 각각에 상응하는 가중치 w1, w2, w3, 및 w4는 가중 평균을 생성하는 데 이용된다.As shown in FIG. 15B , the values of P1 , P2 , P3 , and P4 that pass their respective limits are combined 1504 (eg, by determining an average value, determining a weighted average value). In embodiments where a weighted average is determined, the weights w1, w2, w3, and w4 corresponding to each of P1, P2, P3, and P4 are used to generate the weighted average.
도 15C는 도 15B의 시스템의 구현예에 의해 구행되는 방법의 흐름도를 도시한다. 보다 상세하게, 도 15C는 다수의 나노포어로부터의 파라미터 값에 대한 호출을 입력으로 평가하고, 신뢰값이 있거나 없는 출력(예컨대, 평균 파라미터 값)을 반환하기 위한 로직의 구조를 보여준다. 상기 구조는 [P1, P2, ..., PN] 형태의 입력 어레이를 처리하여, (상태, 결과) 형태의 출력을 반환할 수 있으며, 여기서 상태는 신뢰도(예컨대, 상태 0은 무응답 출력을 나타내고, 상태 1은 신뢰값이 없는 반환 출력을 나타내며, 상태 2는 신뢰값이 있는 반환 출력을 나타냄)를 나타내고, 결과는 다수의 나노포어로부터 결정된 조합된 파라미터 값(예컨대, 평균 파라미터 값, 가중 평균 파라미터 값)이다. 상기 결과가 평균 파라미터인 구현예에서, 상기 평균은 산술 평균, 기하 평균, 가중 평균 및/또는 임의의 적절한 평균 또는 결합함수일 수 있다.15C shows a flow diagram of a method implemented by an implementation of the system of FIG. 15B. More specifically, FIG. 15C shows the structure of logic for evaluating a call to parameter values from multiple nanopores as input and returning an output (eg, average parameter value) with or without confidence values. The above structure may process an input array of the form [ P1, P2, ..., PN ], returning an output of the form (state, result ), where state is reliability (eg,
보다 상세하게, 길이가 0인 입력 어레이(1511)의 경우, 상기 로직은 반환 출력(0,0)을 제공한다. 길이가 1인 입력 어레이(1512)의 경우, 상기 로직은 반환 출력(1, x)를 제공하며, 여기서 x는 입력 어레이 내 파라미터의 값이다. 길이가 2인 입력 어레이(1513)의 경우, 상기 로직은 두 파라미터 값 간의 차이를 한계 조건과 비교하고, 한계 조건이 만족되는 경우, 반환 출력(2, mean(X))를 제공하며, 여기서 mean(X)는 입력 어레이 내 두파라미터의 평균값이다. 그러나, 한계 조건이 만족되지 않으면, 상기 로직은 반환 출력(1, mean(X))를 제공한다.More specifically, for a zero-
길이가 2보다 큰 입력 어레이의 경우, 상기 로직은 상기 어레이의 IQR을 결정하고, IQR을 기반으로 원하는 범위에 속하는 상기 어레이의 서브세트를 처리하며(1514), 여기서 도 15C의 상기 원하는 범위는 상기 어레이 내 25 번째 및 75 번째 4분위 파라미터 값을 기반으로 결정된다. 상기 서브세트의 길이가 원래 어레이의 길이의 절반보다 작은 경우, 상기 로직은 반환 출력(1, mean(X_good))을 제공하며, 여기서 X_good은 상기 원하는 범위에 속하는 어레이의 서브세트이다. 상기 서브세트의 길이가 원래 어레이의 길이의 절반보다 작은 경우, 상기 로직은 영역 (1516)에 진입하고, 여기서 상기 어레이의 서브세트의 최대값 및 최소값의 차이가 한계(TH)보다 크고, 상기 어레이의 IQR 값의 최대값 및 최소값의 차이가 TH보다 큰 경우, 상기 로직은 반환 출력(1, mean(X_in_IQR))을 제공하며, 여기서 X_in_IQR은 IQR 내에 속하는 입력 어레이의 값을 나타낸다. 상기 어레이의 서브세트의 최대값 및 최소값의 차이가 TH보다 크지만, 상기 어레이의 IQR 값의 최대값 및 최소값의 차이는 TH보다 크지 않은 경우, 상기 로직은 상기 어레이의 IQR 값의 길이가 1보다 큰지를 결정하고, 만일 그럴 경우, 반환 출력 (2, mean(X_in_IQR))을 제공한다. 그러나, 상기 어레이의 IQR 값의 길이가 1보다 크지 않으면, 상기 로직은 반환 출력 (1, mean(X_in_IQR))을 제공한다. For an input array of length greater than two, the logic determines the IQR of the array and processes a subset of the array that falls within a desired range based on the IQR (1514), where the desired range of Figure 15C is the It is determined based on the values of the 25th and 75th quartile parameters in the array. If the length of the subset is less than half the length of the original array, the logic provides a return output (1, mean(X_good)), where X_good is the subset of the array that falls within the desired range. If the length of the subset is less than half the length of the original array, the logic enters
마지막으로, 상기 어레이의 서브세트의 최대값 및 최소값의 차이가 한계(TH)보다 크지 않으면, 상기 로직은 상기 어레이의 섭스ㅔ트의 길이가 1보다 큰지를 결정하고, 만일 그럴 경우, 반환 출력 (2, mean(X_good))을 제공한다. 만일 상기 서브세트의 길이가 1보다 크지 않으면, 상기 로직은 반환 출력 (1, mean(X))을 제공한다.Finally, if the difference between the maximum and minimum values of the subset of the array is not greater than a limit TH, the logic determines whether the length of the subsent of the array is greater than one, and if so, returns the output ( 2, mean(X_good)). If the length of the subset is not greater than 1, the logic provides a return output (1, mean(X)).
한 예에서, 상기 로직은 입력 어레이 []에 대하여 (0, 0)의 (상태, 결과)를 출력하고, 여기서 입력 나노포어 데이터가 없으므로 반환 출력은 없다. 다른 예에서, 상기 로직은 입력 어레이 [0]에 대하여 (1, 0)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 0 및 상태 1(단 하나의 나노포어로부터의 결과가 있었음을 고려하면, 신뢰성 없음)을 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [0, 0]에 대하여 (2, 0)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 0, 상태 2(두 나노포어가 동일한 값 0을 반환하였음을 고려하면, 신뢰성 있음)를 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30]에 대하여 (1, 30)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 30, 상태가 1(단 하나의 나노포어로부터의 결과가 있었음을 고려하면, 신뢰성 없음)을 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30, 31]에 대하여 (2, 30.5)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 30.5, 상태 2(두 나노포어로부터의 데이터 값이 한계 조건에 대하여 가까움을 고려하면, 신뢰성 있음)을 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30, 100]에 대하여 (1, 65.0)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 65.0, 상태 1(두 나노포어로부터의 데이터 값이 한계 조건에 대하여 광범위하게 분리됨을 고려하면, 신뢰성 없음)을 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30, 31, 100]에 대하여 (2, 30.5)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 30.5, 상태 2(두 나노포어로부터의 데이터 값이 한계 조건에 대하여 가깝고, 세 번째 나노포어로부터의 데이터 값은 특이값으로 처리됨을 고려하면, 신뢰성 있음)를 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30, 31, 32, 33, 34, 35, 36]에 대하여 (2, 33.0)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 33.0, 상태 2(모든 나노포어로부터의 데이터 값이 한계 조건에 대하여 가까움을 고려하면, 신뢰성 있음)를 갖는다. 다른 예에서, 상기 로직은 입력 어레이 [30, 31, 32, 33, 34, 100, 98]에 대하여 (2, 32.0)의 (상태, 결과)를 출력하고, 여기서 상기 반환 출력은 결과 32.0, 상태 2(다수의 나노포어로부터의 데이터 값이 한계 조건에 대하여 가깝고, 두 나노포어로부터의 데이터 값은 특이값으로 처리됨을 고려하면, 신뢰성 있음)를 갖는다.In one example, the logic outputs (state, result) of (0, 0) for the input array [], where there is no return output since there is no input nanopore data. In another example, the logic outputs a (state, result) of (1, 0) for an input array [0], where the return output is
이와 같이, 설명된 방법의 구현예는 가변성의 다른 측정에 기반한 임의의 적절한 한계 조건을 이용하여, 임의의 적절한 수의 나노포어로부터 유래되는 정보에 적용될 수 있다.As such, embodiments of the described methods may be applied to information derived from any suitable number of nanopores, using any suitable limiting conditions based on other measures of variability.
또한, 전술한 바와 같이, 도 15A-15C와 관련하여 기술된 방법의 측면은 다수의 포어로부터 유래되는 정보를 이용하여 표적 분자의 농도를 결정하도록 적응될 수 있다. 도 15D는 다수의 나노포어로부터 유래되는 정보를 이용하여 표적 분자의 농도를 결정하기 위한 방법의 출력을 도시한다. 보다 상세하게, 도 15D에 도시된 출력과 관련하여, 상기 시스템의 한 구현예는 다수의 나노포어로부터 유래되는 정보를 이용하여, 일정한 농도에서 표적 샘플 성분(예컨대, 분자, 기타 분석물) 대 특정 보정 분자의 상대적 포획률을 결정하고, 다수의 나노포어로부터 유래되는 정보를 이용하여 상기 표적 샘플 성분의 농도를 결정하기 위하여 상기 상대적 포획률을 상기 표적 샘플 성분의 농도와 관련짓는다.Also, as noted above, aspects of the method described with respect to FIGS. 15A-15C can be adapted to determine the concentration of a target molecule using information derived from multiple pores. 15D depicts the output of a method for determining the concentration of a target molecule using information derived from multiple nanopores. More specifically, with regard to the output shown in FIG. 15D , one embodiment of the system utilizes information derived from multiple nanopores to compare target sample components (eg, molecules, other analytes) versus specific ones at a constant concentration. The relative capture rate is determined with the concentration of the target sample component to determine the relative capture rate of the calibration molecule, and information derived from the plurality of nanopores is used to determine the concentration of the target sample component.
도 15D에 도시된 출력과 관련한 특정 예에서, 농도가 0.5 nM인 217 bP 보정 분자에 대한 74 bP DNA(표적 분자)의 상대적 포획률은 다른 농도의 74 bP DNA(예컨대, 0.5nM 내지 15 nM의 농도)로 제조된 샘플들 내 74 bP DNA의 농도를 결정하는 데 사용되었다. 선형 곡선에 맞추기 위해 (0, 0)의 경계 조건인 1, 2, 또는 7 개의 대조군 데이터 포인트를 사용하여, 특정 사례는 이벤트의 수의 비율로부터의 표적 분자의 농도를 도출하였다. 도 15D에 도시된 출력은 1, 2 또는 7 개의 대조군 데이터 포인트를 이용하고, 단일 나노포어 대 다수의 나노포어로부터의 예측을 사용하여 표적 분자의 다른 농도의 추정치의 백분율 오차를 보여준다. 도 15D (상단)에 도시된 바와 같이, 74 bP DNA 표적 분자의 농도 및 217 bP 보정 분자를 사용한 포획 이벤트의 수의 비율 사이에 선형 상관관계가 존재한다. 도 15D (가운데 및 하단)에 도시된 바와 같이, 다수의 나노포어로부터의 데이터의 이용은 일반적으로 단일 나노포어로부터의 데이터를 이용한 표적 분자의 참 농도의 추정치와 비교하면, 0.5nM, 1nM, 3nM, 5nM, 7nM, 10nM, 및 15 nM의 농도에서 표적 분자의 참 농도의 추정치의 더 낮은 백분율 오차를 생성하며, 이는 특히 대조군 데이터 포인트의 수가 증가할수록 그렇다.In the specific example with respect to the output shown in FIG. 15D , the relative capture rates of 74 bP DNA (target molecule) to 217 bP calibration molecule at a concentration of 0.5 nM were compared to other concentrations of 74 bP DNA (e.g., 0.5 nM to 15 nM). concentration) was used to determine the concentration of 74 bP DNA in the samples prepared. Using 1, 2, or 7 control data points with boundary conditions of (0, 0) to fit a linear curve, a particular case derived the concentration of the target molecule from a ratio of the number of events. The output shown in FIG. 15D shows the percentage error of estimates of different concentrations of target molecules using 1, 2, or 7 control data points and using predictions from single versus multiple nanopores. As shown in Figure 15D (top), there is a linear correlation between the ratio of the concentration of the 74 bP DNA target molecule and the number of capture events with the 217 bP calibration molecule. As shown in Figure 15D (middle and bottom), the use of data from multiple nanopores is generally 0.5 nM, 1 nM, 3 nM compared to estimates of the true concentration of the target molecule using data from a single nanopore. , produce lower percentage errors of the estimate of the true concentration of the target molecule at concentrations of 5 nM, 7 nM, 10 nM, and 15 nM, especially as the number of control data points increases.
포어 상태 및 데이터 품질에 기초한 나노포어로부터의 데이터 사전 필터링Pre-filtering data from nanopores based on pore status and data quality
다수의 나노포어로부터의 데이터의 이용하여 추정치(예컨대, 분포분율의 추정치, 농도의 추정치)를 결정하는 것과 관련하여, 상기 시스템 및 그와 관련된 계산 로직의 일부 구현예는 나노포어 자체의 품질(예컨대, 저주파 또는 고주파 노이즈, 근제곱 평균 제곱 노이즈을 포함하는 개략적인 노이즈 통계, 포어 직경, 실험 중의 성장 속도, 등)에 의존하는 다른 이유로 인해 (예컨대, 멀티포어 컨센서스 호출을 이용한 계산을 수행하기 전에) 나노포어-유래된 정보의 사용을 생략하도록 구성될 수 있으며 이는 알고리즘적으로 자동화될 수 있다. 이와 같이, 방법(들)은 나노포어로부터의 데이터의 품질 평가에 기초하여 나노포어 세트의 나노포어로부터의 고려 데이를 생략하는 것을 포함할 수 있다.With respect to using data from multiple nanopores to determine an estimate (eg, an estimate of a fraction of a distribution, an estimate of a concentration), some implementations of the system and its associated computational logic depend on the quality of the nanopores themselves (eg, , low- or high-frequency noise, coarse noise statistics including root-mean-square noise, pore diameter, growth rate during experiments, etc. It may be configured to omit the use of pore-derived information and this may be algorithmically automated. As such, the method(s) may include omitting consideration data from the nanopores of the set of nanopores based on an assessment of the quality of the data from the nanopores.
특히, 상기 시스템은 저주파 노이즈 함량(예컨대, 평균/중앙 노이즈 파워가 0.1-10 Hz 범위 이상, < -50 dB/Hz인 경우는 허용 가능함)을 시간 영역 내에서 선택된 시간 동안(예컨대, 5 초마다) 평가하고, 한계 수준을 초과하는 저주파 노이즈 함량과 관련된 나노포어로부터 유래되는 데이터의 이용을 생략할 수 있다. 상기 시스템은 선택적으로 또는 대안적으로 고주파 노이즈 함량(예컨대, 평균/중앙 노이즈 파워가 0.5-30 kHz 범위 이상)을 시간 영역 내에서 선택된 시간 동안(예컨대, 5 초마다) 평가하고, 한계 수준을 초과하는 고주파 노이즈 함량과 관련된 나노포어로부터 유래되는 데이터의 이용을 생략할 수 있다. 상기 시스템은 선택적으로 또는 대안적으로 개략적인 노이즈 함량(예컨대, 시간 영역 신호의 RMS, 30 kHz에서 < 20 pA인 경우는 허용 가능함)을 시간 영역 내에서 선택된 시간 동안(예컨대, 5 초마다) 평가하고, 한계 수준을 초과하는 개략적 노이즈 함량과 관련된 나노포어로부터 유래되는 데이터의 이용을 생략할 수 있다.In particular, the system measures the low-frequency noise content (eg, acceptable if the average/median noise power is in the range 0.1-10 Hz or greater, <-50 dB/Hz) for a selected time period (eg, every 5 seconds) within the time domain. ), and the use of data derived from nanopores associated with low-frequency noise content exceeding the threshold level may be omitted. The system optionally or alternatively evaluates the high-frequency noise content (eg, with an average/median noise power in the range of 0.5-30 kHz or greater) for a selected period of time (eg, every 5 seconds) within a time domain and exceeds a threshold level. It is possible to omit the use of data derived from nanopores related to high-frequency noise content. The system optionally or alternatively evaluates a coarse noise content (e.g., RMS of a time domain signal, acceptable if < 20 pA at 30 kHz) over a selected time period (e.g., every 5 seconds) in the time domain and can omit the use of data derived from nanopores related to coarse noise content exceeding the threshold level.
상기 시스템은 또한 < 0.25 nm/min은 허용 가능한, 포어 직경(또는 다른 포어의 형태적 특징) 및/또는 포어 특징의 변화율을 시간 영역 내에서 선택된 시간 동안(예컨대, 5 초마다) 평가하고, 한계 범위를 벗어나는 형태적 특징과 관련되고/거나 한계 범위를 벗어나는 포어 특징의 변화율과 관련되는 나노포어로부터 유되하는 데이터의 이용을 생략할 수 있다. 특히, 시간에 따른 나노포어 직경을 결정하기 위한 방법은, 전류 I 및 전압 V인 G = I/V로 측정되는, 개방 채널 컨덕턴스의 모델의 구현을 포함한다. 구체적으로, G는 모든 이벤트 쌍 사이에서 평균 전류를 전압으로 나눈 값으로 계산된다. G에 대한 제 1 모델은 전체 저항(전체 저항은 전체 컨덕턴스의 역수임)에 대한 임의의 액세스 저항 기여를 무시하고, 다음과 같이 나노포어 직경 d와 막 두께 L에 의존한다: G1(d) = σ(πd2)/(4L), 여기서, σ는 벌크 전해질의 전도율이다. 상기 제 1 모델은 d/L < 3/4인 경우 컨덕턴스 대 나노포어 직경 데이터를 매칭한다. 제 2 모델은 액세스 저항의 효과를 통합하고 막 두께 L이 유효 두께 l = L/α, α ≥ 1로 대체되는 경우, 경험적으로 나노포어에서 막이 얇아지는 것을 수용하는 방법으로, 보고된 모든 d/L 값(즉, 1보다 크거나 작은 값)에 대하여 데이터를 매칭한다. 이 모델은: G2(d, l) = σ(πd2)/(4l)[1/(1 + (πd)/(4l)]이다.The system also evaluates the rate of change of pore diameter (or other pore morphological characteristics) and/or pore characteristics for a selected period of time (eg, every 5 seconds) within a time domain, where < 0.25 nm/min is acceptable; The use of data derived from nanopores related to out-of-range morphological features and/or rates of change of pore features out of bounds may be omitted. In particular, the method for determining the nanopore diameter over time involves the implementation of a model of open channel conductance, measured as G = I/V, which is a current I and a voltage V. Specifically, G is calculated as the average current divided by the voltage across all pairs of events. The first model for G ignores any access resistance contribution to the total resistance (total resistance is the reciprocal of the total conductance) and depends on the nanopore diameter d and the film thickness L as follows: G 1 (d) = σ(πd 2 )/(4L), where σ is the conductivity of the bulk electrolyte. The first model matches the conductance versus nanopore diameter data when d/L < 3/4. The second model incorporates the effect of access resistance and empirically accommodates film thinning in nanopores when the film thickness L is replaced by an effective thickness l = L/α, α ≥ 1, with all reported d/ Match data against L values (ie, values greater or less than 1). This model is: G 2 (d, l) = σ(πd 2 )/(4l)[1/(1 + (πd)/(4l)].
실험의 시간 경과에 따라 기록된 G의 주어진 범위에 대하여, 어떤 모델이 모델링된 값의 범위를 비교하기에 더 적합한지를 결정할 수 있다; 그러나, α에 대한 선택은, 경험적이지만, 추정된 d2 값에 상당한 영향을 미친다. 전형적으로 실험 과정에서 G = I/V의 값은 시간이 지남에 따라 천천히 증가한다. 관찰된 증가가 있으면, 두 가지 잠재적 원인이 있다. 첫째, 시간이 지남에 따라 나노포어가 확대되어, 전류량이 증가하게 된다; 이는 덜 "안정적인" 포어(즉, 이런저런 이유로 깨지기 쉽거나, 막이 매우 얇고/또는 막 물질을 에칭시킬 수 있는 고전압의 적용으로 인해 성장할 수 있는 막 내의 포어)의 경우에 더 높은 비율로 발생한다. 둘째, 상기 증가는 물의 증발 및 시약이 첨가된 나노포어 상의 "개방된" 챔버 내의 이온 농도의 상응하는 상대적 증가로 인한 것일 수 있다. 노출된 챔버 내의 완충액을 교체하고 컨덕턴스를 측정함으로써 이러한 원인들 중 어느 것이 작용하는 것인지 확인할 수 있다 - 상기 값이 원래의 값으로 회복되면, 포어의 크기 및 모양이 그대로 남아 있을 가능성이 높다; 상기 값이 더 높다면, 포어가 확대된 것일 수 있다. 요약하자면, 공지된 L 값을 이용하여, d/L < ¾인 경우, 상기 제 1 모델 G1(d)은 직경을 추정하는 데 사용될 수 있다. 그렇지 않은 경우, 상기 제 2 모델은 직경을 추정하는 데 사용될 수 있다.For a given range of G recorded over the time course of an experiment, we can determine which model is more suitable for comparing the range of modeled values; However, the choice for α has a significant impact on the estimated d 2 value, although empirically. Typically, in the course of an experiment, the value of G = I/V increases slowly over time. If there is an observed increase, there are two potential causes. First, the nanopores expand over time, resulting in an increase in the amount of current; This occurs at a higher rate in the case of less "stable" pores (ie, pores in a film that are fragile for one reason or another, or where the film is very thin and/or can grow due to application of high voltages that can etch the film material). Second, the increase may be due to evaporation of water and a corresponding relative increase in the concentration of ions in the “open” chamber on the nanopores to which the reagent has been added. By replacing the buffer in the exposed chamber and measuring the conductance, it is possible to determine which of these causes are at work - once the values return to their original values, the size and shape of the pores are likely to remain the same; If the value is higher, the pores may be enlarged. In summary, using known L values, if d/L < ¾, the first model G 1 (d) can be used to estimate the diameter. Otherwise, the second model can be used to estimate the diameter.
상기 시스템은 또한 샘플 품질 함량을 평가하여 나노포어로부터 유래되는 정보를 생략하고 (예컨대, 도 15A 및 15B에 나타낸 방법의 구현 전에) 불량한 샘플 품질 함량과 관련된 나노포어로부터 유래되는 정보의 이용을 생략할 수 있다. 상기 시스템은 단위 시간 당 포획률 또는 이벤트 비율을 통해 처리량(하한 한계, 예컨대, 분당 1 개의 이벤트 이상, 및 상한 한계, 예컨대, 분당 10,000 개의 이벤트 이상)으로 샘플 품질 함량을 평가할 수 있다.The system can also evaluate sample quality content to omit information derived from nanopores (e.g., prior to implementation of the method shown in Figures 15A and 15B) and to omit the use of information derived from nanopores related to poor sample quality content. can The system can evaluate sample quality content with throughput (lower limit, e.g., at least 1 event per minute, and upper limit, e.g., at least 10,000 events per minute) through capture rate or event rate per unit time.
상기 시스템은 잠재적으로 존재하는 하나 이상의 미공지 및 존재하는 하나 이상의 대조군을 포함하는, 존재하는 둘 이상의 종을 갖는 샘플에 대한 집단의 분리량으로 샘플 품질 함량을 평가할 수 있다. 한 예로서, 샘플은 하나의 대조군 또는 참조 성분, 및 최소 분량(예컨대, 2%) 이상으로 존재하는 하나의 미공지/표적 샘플 성분을 포함한다. 이러한 샘플을 처리할 때, 상기 시스템은 샘플 내의 집단을 구분하는 모델 추정(예컨대, SVM-기반 모델)로부터 분리도 값을 결정한다. 상기 모델(들)로부터 출력되는 분리도 값은 거리 값(예컨대, 이벤트의 한 집단의 중심의 참조 분리 경계/초평면까지의 최단 거리) 또는 기타 적절한 분리도를 포함할 수 있다.The system can evaluate sample quality content as an isolate of a population for a sample having two or more species present, including one or more unknowns potentially present and one or more controls present. As an example, the sample comprises one control or reference component and one unknown/target sample component present in at least a minimal amount (eg, 2%). When processing such a sample, the system determines a degree of separation value from a model estimate (eg, an SVM-based model) that distinguishes populations within the sample. The separation value output from the model(s) may include a distance value (eg, the shortest distance to a reference separation boundary/hyperplane of the center of a population of events) or other suitable separation.
샘플 품질 함량을 평가하는 한 예에서, S2 샘플(0%, 100%, 위에서 설명됨)의 50:50 혼합물은 도 16A에 도시한 바와 같이, 다음의 단계에 따라서 범용 모델로 평가되었다. 도 16A에 도시된 바와 같이, 상기 시스템에 의해 구현되는 범용 모델의 방법(1600)은 먼저 불량한 품질 데이터를 생성하는 나노포어로부터의 고려 정보(예컨대, 나노포어 크기 관련, 비정상적인 나노포어 형태 관련, 샘플 처리 분석과의 비정상적인 상호작용 관련, 샘플 및/또는 샘플 처리 물질의 검출된 오염 관련 등)를 필터링 또는 제거하기 위하여, 샘플 집단(예컨대, 50:50 혼합물의 집단)이 표적 영역 내에 있는지를 결정한다(1610). 도 16B는 단계 1620의 출력을 도시하며, 여기서 샘플을 처리하는 데 사용되는 서로 다른 시약들(즉, 0% S-아데노실메티오닌, 100% S-아데노실메티오닌)과 관련하여, 나노포어로부터의 이벤트 데이터는 전기 신호의 진폭 대 체류시간 대비로 플롯팅된다. 도 16B의 플롯을 생성할 때, 상기 시스템은 모든 집단으로부터 이벤트 데이터를 수집하고, 표적 영역을 정의하며, 외부의 이벤트는 노이즈로 분류된다. 상기 시스템은 그런 다음 상기 표적 영역에 의해 정의되는 참 이벤트 대 노이즈 이벤트의 수를 근거로 각 나노포어에 대한 노이즈 백분율의 측정을 결정하고, 특정 나노포어에 대한 노이즈 백분율이 한계보다 큰 경우, 상기 특정 포어로부터의 고려 데이터에서 제거하였다. 이와 같이, 상기 시스템은 나노포어 데이터 내에서 참 이벤트의 서브세트로부터 노이즈 이벤트의 서브세트를 분리하는 표적 영역 경계를 정의하였으며, 노이즈 이벤트의 서브세트 및 실제 이벤트의 서브세트에 근거하여 노이즈 백분율을 결정하였다. 그러나, 단계(1610)의 다른 구현예는 나노포어의 노이즈 백분율을 평가하는 것과 관련하여, 다른 방식으로 구현될 수 있다.In one example to evaluate sample quality content, a 50:50 mixture of S2 samples (0%, 100%, as described above) was evaluated with a universal model according to the following steps, as shown in Figure 16A. As shown in FIG. 16A , the
도 16A에 도시된 바와 같이, 상기 시스템은 이어서 불량한 품질 데이터를 생성하는 나노포어로부터의 고려 정보(예컨대, 샘플 처리 분석과 비정상적인 상호작용 관련, 샘플 및/또는 샘플 처리 물질의 검출된 오염 관련 등)를 필터링 또는 제거하는 또 다른 단계를 제공하기 위하여, 샘플 집단의 성분들의 분리를 평가한다(1620). 단계 1620을 구현할 때, 상기 시스템은: 체류시간(예컨대, 나노포어에 대한 샘플 성분의 체류시간), 나노포어로부터 출력된 전기 신호의 중앙 진폭, 나노포어로부터 출력된 전기 신호의 최대 진폭, 나노포어 면적, 및 기타 적절한 나노포어 관련 요인들 중 하나 이상에 대하여 주성분 분석(PCA) 연산을 수행할 수 있다. 특히, 상기 PCA 작업은 데이터를 제 1 좌표계에서 제 2 좌표계로 변환하는 변환(즉, 직교 선형 변환)을 구현하여, 데이터의 일부 투영에 의한 가장 큰 분산이 제 2 좌표계의 제 1 좌표 (즉, 첫 번째 성분)에 놓이도록 한다. 두 번째로 큰 분산은 두 번째 좌표에 놓이고, 세 번째로 큰 분산은 세 번째 좌표에 놓인다. 이렇게 하여, 상기 PCA 작업은 상기 데이터를 상기 데이터의 다른 분산 수준과 관련된 새로운 좌표들로 맵핑한다. 단일 파라미터 값(예컨대, 체류시간, 나노포어로부터 출력된 전기 신호의 중앙 진폭, 나노포어로부터 출력된 전기 신호의 최대 진폭, 나노포어 면적, 등)의 값 대신 PCA 성분을 이용할 때, 상기 시스템은 단일 파라미터의 값의 중복과 무관하게 데이터 분리를 효과적으로 평가할 수 있다.As shown in FIG. 16A , the system is then configured to account for information from the nanopores that generate poor quality data (eg, related to abnormal interactions with sample handling analysis, related to detected contamination of the sample and/or sample handling material, etc.) To provide another step for filtering or removing , the separation of components of the sample population is evaluated (1620). When implementing
이처럼, 상기 시스템은 PCA 작업의 첫 번째 성분을 이용하여 샘플 집단의 분리(예컨대, 각 샘플 집단을 표현하는 가우스 분포와 관련하여)를 점검한다. 샘플 집단의 분리를 점검할 때, 상기 시스템은: SS = (u1-u2)/(s1+s2)로 분리 점수를 정의할 수 있으며, 여기서 u1 및 u2는 각 가우스 분포의 평균(u2>u1)이고, s1 및 s2는 각 가우스 분포의 표준편차이다. 상기 분리 점수 SS는 그런 다음 분리의 정도가 적절한지를 결정하기 위해 한계에 대하여 평가된다. 도 16C은 (도 16B과 동일한 샘플 및 샘플 집단을 이용하여) 단계 1620의 출력을 도시하며, 여기서 상기 시스템은 PCA 작업의 성분들(PC1 및 PC2)을 사용하여 각 샘플 집단에 대하여 계수의 가우스 분포 대 PC1 대비를 생성한다. 도 16D에 도시된 바와 같이, 상기 시스템은 샘플 집단에 대하여 분리 점수 SS = (u1-u2)/(s1+s2)를 2.4로 결정하고, 한계 분리가 미리-정의된 한계보다 큰 경우, 상기 시스템은 상기 나노포어로부터 생성된 데이터를 평가하는 것을 계속한다. 그러나, 단계 1620의 다른 구현예는 샘플에 대한 집단 분리를 평가하는 것과 관련하여, 다른 방식으로 구현될 수 있다.As such, the system uses the first component of the PCA task to check the separation of the sample population (eg, with respect to the Gaussian distribution representing each sample population). When checking the separation of a sample population, the system can define the separation score as: SS = (u1-u2)/(s1+s2), where u1 and u2 are the mean of each Gaussian distribution (u2>u1) , and s1 and s2 are the standard deviations of each Gaussian distribution. The separation score SS is then evaluated against limits to determine if the degree of separation is appropriate. Figure 16C shows the output of step 1620 (using the same sample and sample population as Figure 16B), wherein the system uses the components of the PCA task (PC1 and PC2) to provide a Gaussian distribution of coefficients for each sample population. Creates a versus PC1 contrast. 16D , the system determines for the sample population a separation score SS = (u1-u2)/(s1+s2) of 2.4, and if the marginal separation is greater than a pre-defined limit, the system continues to evaluate the data generated from the nanopores. However, other embodiments of
도 16A에 도시된 바와 같이, 상기 시스템은 이어서 범용 모델을 (예컨대, 독립적으로 및/또는 협력적으로 작동할 수 있는, 기구축된 모델 및 클러스터링 방법을 포함하는 범용 모델) 구현하여 상기 샘플에 대한 보정 비율의 예측을 생성하기 위해 샘플 집단에 대한 보정 비율이 표적 범위 내에 있는지를 결정한다(1630). 도 16E에 도시된 바와 같이, 상기 시스템은 샘플의 50:50 보정 비율이 목표 범위 내에 있는지를 점검하기 위하여, 범용 모델을 이용하여 나노포어로부터의 전류의 최대 진폭의 출력을 초 단위의 체류 시간의 10을 밑으로 하는 로그에 대한 나노 암페어(max_amp (nA))로 생성한다. 도 16E에서, class_labels S2 0% 및 100%는 상이한 샘플 집단을 나타내고, 범용 모델은 %(S2_100%)를 68.91%로 출력하는데, 이는 50:50 보정 비율을 점검하는 데 이용된다. 그러나, 단계 1630의 다른 구현예는, 샘플 보정 비율의 점검과 관련하여, 다른 방식으로 구현될 수 있다. 나노포어 장치16A , the system then implements a general-purpose model (eg, a general-purpose model including an instrumented model and a clustering method, which can operate independently and/or cooperatively) for the sample. It is determined whether a correction rate for the sample population is within a target range to produce a prediction of the correction rate ( 1630 ). As shown in Fig. 16E, the system outputs the maximum amplitude of the current from the nanopores using a general-purpose model to check whether the 50:50 calibration ratio of the sample is within the target range of the dwell time in seconds. Generate in nanoamps (max_amp (nA)) for logarithms to
제공되는 바와 같이, 나노포어 장치는, 상기 장치의 내부 공간을 두 개의 부피로 분리하는 구조 내에 개구부를 형성하는 적어도 하나의 포어, 및 상기 포어를 통과하는 물체를 확인(예컨대, 물체를 나타내는 파라미터의 변화를 검출함으로써)하도록 구성된 적어도 하나의 센서를 포함한다. 본 명세서에서 기재된 방법에 사용되는 나노포어 장치들은 PCT 공개 제 WO/2013/012881 호에도 개시되며, 그 전체 내용이 참조로서 포함된다.As provided, a nanopore device includes at least one pore forming an opening in a structure that separates the interior space of the device into two volumes, and identifying an object passing through the pore (eg, a parameter representing the object). at least one sensor configured to (by detecting a change). Nanopore devices used in the methods described herein are also disclosed in PCT Publication No. WO/2013/012881, the entire contents of which are incorporated by reference.
나노포어 장치의 포어(들)는 나노 크기 또는 마이크로 크기이다. 한 측면에서, 각 포어는 작거나 큰 분자 또는 미생물이 통과할 수 있는 크기를 가진다. 한 측면에서, 각 포어는 직경이 적어도 약 1 nm이다. 대안적으로, 각 포어는 직경이 적어도 약 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 11 nm, 12 nm, 13 nm, 14 nm, 15 nm, 16 nm, 17 nm, 18 nm, 19 nm, 20 nm, 25 nm, 30 nm, 35 nm, 40 nm, 45 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 또는 100 nm이다.The pore(s) of the nanopore device are nano-sized or micro-sized. In one aspect, each pore is sized to allow passage of small or large molecules or microorganisms. In one aspect, each pore is at least about 1 nm in diameter. Alternatively, each pore has a diameter of at least about 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 11 nm, 12 nm, 13 nm, 14 nm, 15 nm, 16 nm, 17 nm, 18 nm, 19 nm, 20 nm, 25 nm, 30 nm, 35 nm, 40 nm, 45 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, or 100 nm is nm.
한 측면에서, 상기 포어는 직경이 약 100 nm 이하이다. 대안적으로, 상기 포어는 직경이 약 95 nm, 90 nm, 85 nm, 80 nm, 75 nm, 70 nm, 65 nm, 60 nm, 55 nm, 50 nm, 45 nm, 40 nm, 35 nm, 30 nm, 25 nm, 20 nm, 15 nm, 또는 10 nm 이하이다.In one aspect, the pores have a diameter of about 100 nm or less. Alternatively, the pores have a diameter of about 95 nm, 90 nm, 85 nm, 80 nm, 75 nm, 70 nm, 65 nm, 60 nm, 55 nm, 50 nm, 45 nm, 40 nm, 35 nm, 30 nm. nm, 25 nm, 20 nm, 15 nm, or 10 nm or less.
한 측면에서, 상기 포어의 직경은 약 1 nm 내지 약 100 nm 사이, 또는 약 2 nm 내지 약 80 nm, 또는 약 3 nm 내지 약 70 nm, 또는 약 4 nm 내지 약 60 nm, 또는 약 5 nm 내지 약 50 nm, 또는 약 10 nm 내지 약 40 nm, 또는 약 15 nm 내지 약 30 nm일 수 있다.In one aspect, the diameter of the pores is between about 1 nm and about 100 nm, or between about 2 nm and about 80 nm, or between about 3 nm and about 70 nm, or between about 4 nm and about 60 nm, or between about 5 nm and about 5 nm in diameter. from about 50 nm, or from about 10 nm to about 40 nm, or from about 15 nm to about 30 nm.
일부 측면에서, 상기 나노포어 장치는 상기 포어를 가로질러서 고분자 스캐폴드를 이동시키기 위한 수단 및/또는 상기 포어를 통과하는 물체를 식별하기 위한 수단을 더 포함한다. 보다 자세한 내용은 아래, 이중-포어 장치와 관련한 부분에서 제공된다.In some aspects, the nanopore device further comprises means for moving the polymer scaffold across the pore and/or means for identifying an object passing through the pore. More details are provided in the section related to the double-pore device below.
단일-포어 나노포어 장치와 비교하여, 이중-포어 장치는 포어를 가로지르는 고분자 스캐폴드의 이동 속도 및 방향을 잘 제어하도록 보다 쉽게 구성될 수 있다.Compared to single-pore nanopore devices, double-pore devices can be more easily configured to better control the speed and direction of movement of the polymer scaffold across the pores.
일 구현예에서, 상기 나노포어 장치는 다수의 챔버를 포함하며, 각 챔버는 적어도 하나의 포어를 통하여 인접 챔버와 연통된다. 이들 포어 중, 두 개의 포어, 즉 제 1 포어 및 제 2 포어는, 표적 폴리뉴클레오타이드의 적어도 일부에서 제 1 포어에서 빠져나와 제 2 포어 내로 이동할 수 있도록 위치한다. 또한, 상기 장치는 상기 이동 중에 상기 표적 폴리뉴클레오타이드를 식별할 수 있는 센서를 각 포어에서 포함한다. 한 측면에서, 상기 식별은 상기 표적 폴리뉴클레오타이드의 개별 성분을 식별하는 것을 포함한다. 다른 측면에서, 상기 식별은 상기 표적 폴리뉴클레오타이드에 결합된 페이로드 분자를 식별하는 것을 포함한다. 단일 센서가 사용될 때, 상기 단일 센서는 상기 포어를 가로질러 이온 전류를 측정하기 위하여 포어 양단에 배치된 두 개의 전극을 포함할 수 있다. 다른 구현예에서, 상기 단일 센서는 전극 이외의 구성을 포함한다.In one embodiment, the nanopore device comprises a plurality of chambers, each chamber communicating with an adjacent chamber through at least one pore. Two of these pores, a first pore and a second pore, are positioned such that at least a portion of the target polynucleotide can exit the first pore and move into the second pore. The device also includes a sensor in each pore capable of identifying the target polynucleotide during the movement. In one aspect, the identifying comprises identifying individual components of the target polynucleotide. In another aspect, the identifying comprises identifying a payload molecule bound to the target polynucleotide. When a single sensor is used, the single sensor may include two electrodes disposed across the pore to measure an ionic current across the pore. In another embodiment, the single sensor comprises a configuration other than an electrode.
한 측면에서, 상기 장치는 두 개의 포어를 통해 연결된 세 개의 챔버를 포함한다. 네 개 이상의 챔버를 가지는 장치는 세 개 챔버 장치의 측면에, 또는 세 챔버들 중 임의의 둘 사이에 하나 이상의 챔버를 포함하도록 고안해 낼 수 있다. 마찬가지로, 챔버를 연결시키기 위해 셋 이상의 포어가 장치 내에 포함될 수 있다.In one aspect, the device includes three chambers connected through two pores. Devices having four or more chambers can be devised to include one or more chambers on the side of a three chamber device, or between any two of the three chambers. Likewise, three or more pores may be included in the device to connect the chambers.
한 측면에서, 다수의 고분자 스캐폴드가 한 챔버에서 다음 챔버로 동시에 이동할 수 있도록, 두 개의 인접 챔버 사이에 둘 이상의 포어가 있을 수 있다. 이러한 다중-포어 디자인은 장치 내 표적 폴리뉴클레오타이드 분석 처리량을 향상시킬 수 있다. 다중화의 경우, 한 챔버는 표적 폴리뉴클레오타이드의 한 유형을 가질 수 있고, 다른 챔버는 다른 표적 폴리뉴클레오타이드 유형을 가질 수 있다.In one aspect, there may be two or more pores between two adjacent chambers, such that multiple polymer scaffolds can move simultaneously from one chamber to the next. This multi-pore design can improve the throughput of target polynucleotide analysis in the device. In the case of multiplexing, one chamber may have one type of target polynucleotide and the other chamber may have another type of target polynucleotide.
일부 측면에서, 상기 장치는 한 챔버에서 다른 챔버로 표적 폴리뉴클레오타이드를 이동시키기 위한 수단을 더 포함한다. 한 측면에서, 상기 이동은 표적 폴리뉴클레오타이드(예컨대, 표적 서열을 포함하는 증폭 산물 또는 앰플리콘)를 제 1 포어 및 제 2 포어 모두에 걸쳐 동시에 로딩하게 한다. 다른 측면에서, 상기 수단은 두 포어를 통해, 동일한 방향으로, 표적 폴리뉴클레오타이드의 이동을 추가로 가능하게 한다.In some aspects, the device further comprises means for moving the target polynucleotide from one chamber to another. In one aspect, the shift causes simultaneous loading of a target polynucleotide (eg, an amplification product or amplicon comprising a target sequence) across both the first pore and the second pore. In another aspect, the means further enable movement of the target polynucleotide through the two pores, in the same direction.
예를 들어, 3-챔버 이중-포어 장치 ("2-포어" 장치)에서, 각각의 챔버는 전원에의 연결을 위한 전극을 포함할 수 있어 챔버 사이의 각 포어를 가로질러 별개의 전압이 가해질 수 있다.For example, in a three-chamber double-pore device ("two-pore" device), each chamber may include an electrode for connection to a power source so that a separate voltage is applied across each pore between the chambers. can
본 발명의 한 구현예에 의하면, 상부 챔버, 중앙 챔버, 및 하부 챔버를 포함하는 장치로서, 상기 상부 챔버는 제 1 포어를 통해 상기 중앙 챔버와 연통되고, 상기 중앙 챔버는 제 2 포어를 통해 상기 하부 챔버와 연통되는 장치가 제공된다. 이러한 장치는 Dual-Pore Device라는 명칭의 미국 특허 공개 제 2013-0233709 호에 이미 개시된 임의의 크기 및 기타 특징을 가질 수 있으며, 이의 전체 내용이 본 명세서에 참조로서 포함된다.According to one embodiment of the present invention, there is provided an apparatus comprising an upper chamber, a central chamber, and a lower chamber, wherein the upper chamber communicates with the central chamber through a first pore, and wherein the central chamber communicates with the central chamber through a second pore. A device is provided in communication with the lower chamber. Such a device may have any size and other characteristics previously disclosed in US Patent Publication No. 2013-0233709 entitled Dual-Pore Device, the entire contents of which are incorporated herein by reference.
한 측면에서, 각 포어는 직경이 적어도 약 1 nm이다. 또한, 각 포어는 직경이 적어도 약 2 nm, 3 nm, 4 nm, 5nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 11 nm, 12 nm, 13 nm, 14 nm, 15 nm, 16 nm, 17 nm, 18 nm, 19 nm, 20 nm, 25 nm, 30 nm, 35 nm, 40 nm, 45 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 또는 100 nm이다.In one aspect, each pore is at least about 1 nm in diameter. Further, each pore has a diameter of at least about 2 nm, 3 nm, 4 nm, 5 nm, 6 nm, 7 nm, 8 nm, 9 nm, 10 nm, 11 nm, 12 nm, 13 nm, 14 nm, 15 nm, 16 nm, 17 nm, 18 nm, 19 nm, 20 nm, 25 nm, 30 nm, 35 nm, 40 nm, 45 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, or 100 nm.
한 측면에서, 각 포어는 직경이 약 100 nm 이하이다. 또한, 상기 포어는 직경이 약 95 nm, 90 nm, 85 nm, 80 nm, 75 nm, 70 nm, 65 nm, 60 nm, 55 nm, 50 nm, 45 nm, 40 nm, 35 nm, 30 nm, 25 nm, 20 nm, 15 nm, 또는 10 nm 이하이다.In one aspect, each pore is about 100 nm or less in diameter. In addition, the pores have a diameter of about 95 nm, 90 nm, 85 nm, 80 nm, 75 nm, 70 nm, 65 nm, 60 nm, 55 nm, 50 nm, 45 nm, 40 nm, 35 nm, 30 nm, 25 nm, 20 nm, 15 nm, or 10 nm or less.
한 측면에서, 상기 포어는 직경이 약 1 nm 내지 약 100 nm, 또는 약 2 nm 내지 약 80 nm, 또는 약 3 nm 내지 약 70 nm, 또는 약 4 nm 내지 약 60 nm, 또는 약 5 nm 내지 약 50 nm, 또는 약 10 nm 내지 약 40 nm, 또는 약 15 nm 내지 약 30 nm이다.In one aspect, the pores have a diameter of from about 1 nm to about 100 nm, or from about 2 nm to about 80 nm, or from about 3 nm to about 70 nm, or from about 4 nm to about 60 nm, or from about 5 nm to about 50 nm, or from about 10 nm to about 40 nm, or from about 15 nm to about 30 nm.
일부 측면에서, 상기 포어는 실질적으로 둥근 모양을 가진다. 본 명세서에서 사용된, "실질적으로 둥근"이란 적어도 약 80 또는 90%가 원통 형태인 모양을 지칭한다. 일부 구현예에서, 상기 포어는 모양이 사각형, 직사각형, 삼각형, 타원형, 또는 육각형이다.In some aspects, the pores have a substantially round shape. As used herein, “substantially round” refers to a shape that is at least about 80 or 90% cylindrical. In some embodiments, the pores are square, rectangular, triangular, oval, or hexagonal in shape.
한 측면에서, 상기 포어는 깊이가 약 1 nm 내지 약 10,000 nm, 또는, 약 2 nm 내지 약 9,000 nm, 또는 약 3 nm 내지 약 8,000 nm 등이다.In one aspect, the pores have a depth of from about 1 nm to about 10,000 nm, or from about 2 nm to about 9,000 nm, or from about 3 nm to about 8,000 nm, and the like.
일부 측면에서, 상기 나노포어는 막을 통해 연장된다. 예를 들어, 상기 포어는 지질 이중층 막 내에 삽입된 단백질 채널일 수 있거나, 이산화규소, 질화규소, 그래핀, 또는 이들의 또는 다른 물질들과의 조합으로 이루어진 층과 같은 고체-상태 기판을 통해 드릴링, 에칭 또는 포어를 형성하는 다른 방법에 의해 형성될 수 있다. 상기 나노포어는 스캐폴드:융합물:페이로드의 포어, 또는 효소 활성 후 이 분자의 산물을 통과시킬 수 있는 크기이다. 다른 구현예에서, 상기 포어의 일시적차단은 분자 유형의 구별을 위해 바람직할 수 있다.In some aspects, the nanopores extend through the membrane. For example, the pore may be a protein channel embedded in a lipid bilayer membrane, or drilling through a solid-state substrate such as a layer made of silicon dioxide, silicon nitride, graphene, or a combination thereof or other materials; It may be formed by etching or other methods of forming pores. The nanopore is sized to allow passage of the pore of the scaffold:fusion:payload, or the product of this molecule after enzymatic activity. In other embodiments, transient blocking of the pores may be desirable for differentiation of molecular types.
일부 측면에서, 상기 나노포어의 길이 또는 깊이는 두 개의 분리된 부피를 연결하는 채널을 형성할 수 있도록 충분한 크기를 갖는다. 이러한 일부 측면에서, 각 포어의 깊이는 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, 또는 900 nm 초과이다. 일부 측면에서,각 포어의 깊이는 2000 nm 또는 1000 nm 이하이다.In some aspects, the length or depth of the nanopore is of sufficient size to form a channel connecting two separate volumes. In some of these aspects, the depth of each pore is greater than 100 nm, 200 nm, 300 nm, 400 nm, 500 nm, 600 nm, 700 nm, 800 nm, or 900 nm. In some aspects, the depth of each pore is no more than 2000 nm or 1000 nm.
한 측면에서, 상기 포어들은 약 10 nm 내지 약 1000 nm인 거리로 이격되어 있다. 일부 측면에서, 상기 포어들 사이의 거리는 1000 nm, 2000 nm, 3000 nm, 4000 nm, 5000 nm, 6000 nm, 7000 nm, 8000 nm, 또는 9000 nm 초과이다. 일부 측면에서, 상기 포어들은 30000 nm, 20000 nm, 또는 10000 nm 이하로 이격된다. 한 측면에서, 상기 거리는 적어도 약 10 nm, 또는 적어도 약 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 150 nm, 200 nm, 250 nm, 또는 300 nm이다. 다른 측면에서, 상기 거리는 약 1000 nm, 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 250 nm, 200 nm, 150 nm, 또는 100 nm 이하이다.In one aspect, the pores are spaced apart by a distance of about 10 nm to about 1000 nm. In some aspects, the distance between the pores is greater than 1000 nm, 2000 nm, 3000 nm, 4000 nm, 5000 nm, 6000 nm, 7000 nm, 8000 nm, or 9000 nm. In some aspects, the pores are spaced apart by no more than 30000 nm, 20000 nm, or 10000 nm. In one aspect, the distance is at least about 10 nm, or at least about 20 nm, 30 nm, 40 nm, 50 nm, 60 nm, 70 nm, 80 nm, 90 nm, 100 nm, 150 nm, 200 nm, 250 nm, or 300 nm. In other aspects, the distance is less than or equal to about 1000 nm, 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 250 nm, 200 nm, 150 nm, or 100 nm.
또 다른 측면에서, 상기 포어들 사이의 거리는 약 20 nm 내지 약 800 nm, 약 30 nm 내지 약 700 nm, 약 40 nm 내지 약 500 nm, 또는 약 50 nm 내지 약 300 nm이다.In another aspect, the distance between the pores is from about 20 nm to about 800 nm, from about 30 nm to about 700 nm, from about 40 nm to about 500 nm, or from about 50 nm to about 300 nm.
두 포어는 챔버들 사이에 유체 연통이 가능하게 하고 위에서 그들 사이에 규정된 크기 및 거리를 갖는 한 임의의 위치에 배열될 수 있다. 한 측면에서, 상기 포어들은 그들 사이에 직접적인 차단이 없도록 배치된다. 또한, 한 측면에서, 상기 포어들은 실질적으로 동축이다.The two pores enable fluid communication between the chambers and may be arranged in any position as long as they have a defined size and distance between them above. In one aspect, the pores are arranged such that there is no direct blockage therebetween. Also, in one aspect, the pores are substantially coaxial.
한 측면에서, 상기 장치는 챔버 내에 하나 이상의 전원에 연결되는 전극을 갖는다. 일부 측면에서, 상기 전원은 전압-클램프 또는 패치-클램프를 포함하며, 이는 각 포어를 가로질러 전압을 공급하고 각 포어를 통해 전류를 독립적으로 측정할 수 있다. 이러한 측면에서, 상기 전원 및 상기 전극 구성은 상기 중앙 챔버를 두 전원에 대한 공통 접지로 설정할 수 잇다. 한 측면에서, 상기 전원 또는 전원들은 상기 상부 챔버(챔버 A) 및 상기 중앙 챔버(챔버 B) 사이에 제 1 전압 V1을, 상기 중앙 챔버와 상기 하부 챔버(챔버 C) 사이에 제 2 전압 V2를 인가하도록 구성된다.In one aspect, the device has electrodes in the chamber that are connected to one or more power sources. In some aspects, the power source comprises a voltage-clamp or patch-clamp, which can supply a voltage across each pore and independently measure the current through each pore. In this aspect, the power supply and the electrode configuration may establish the central chamber as a common ground for both power sources. In one aspect, the power source or power sources provide a first voltage V 1 between the upper chamber (chamber A) and the central chamber (chamber B) and a second voltage V between the central chamber and the lower chamber (chamber C). 2 is configured to apply.
일부 측면에서, 상기 제 1 전압 V1 및 상기 제 2 전압 V2는 독립적으로 조정 가능하다. 한 측면에서, 상기 중앙 챔버는 상기 두 전압에 대하여 접지점이 되도록 조정된다. 한 측면에서, 상기 중앙 챔버는 각 포어 및 상기 중앙 챔버 내의 전극 사이에 컨덕턴스를 제공하기 위한 매질을 포함한다. 한 측면에서, 상기 중앙 챔버는 각 포어 및 상기 중앙 챔버 내의 전극 사이에 저항을 제공하기 위한 매질을 포함한다. 이러한 저항을 나노포어 저항에 비해 충분히 작게 유지하는 것은 포어를 가로질러 두 전압 및 전류를 디커플링하는 데 유용하며, 이는 전압의 독립적인 조정에 도움이 된다.In some aspects, the first voltage V 1 and the second voltage V 2 are independently adjustable. In one aspect, the central chamber is adjusted to be a grounding point for the two voltages. In one aspect, the central chamber includes a medium for providing conductance between each pore and an electrode within the central chamber. In one aspect, the central chamber includes a medium for providing resistance between each pore and an electrode within the central chamber. Keeping these resistances small enough relative to the nanopore resistance is useful for decoupling both voltages and currents across the pore, which aids in independent regulation of the voltage.
전압의 조정은 챔버 내 하전 입자들의 이동을 제어하는 데 이용될 수 있다. 예를 들어, 두 전압이 같은 극성으로 설정된 경우, 적절하게 하전된 입자는 상부 챔버에서 중앙 챔버로 및 하부 챔버로, 또는 그 반대 방향으로 순차적으로 이동될 수 있다. 일부 측면에서, 두 전압이 반대 극성으로 설정된 경우, 하전 입자는 상부 또는 하부 챔버에서 중앙 챔버로 이동하여 거기에 머무르게 될 수 있다.Adjustment of the voltage can be used to control the movement of charged particles within the chamber. For example, when both voltages are set to the same polarity, properly charged particles can move sequentially from the upper chamber to the central chamber and to the lower chamber, or vice versa. In some aspects, when the two voltages are set to opposite polarities, charged particles can travel from the upper or lower chamber to the central chamber and stay there.
상기 장치 내 전압의 조정은, 하전된 고분자 스캐폴드처럼, 동시에 두 포어를 통과하기에 충분한 길이를 가지는 큰 분자의 이동을 제어하는 데 특히 유용할 수 있다. 이러한 측면에서, 하기에 설명된 바와 같이 상기 분자의 이동 방향 및 속도는 전압의 상대적 크기 및 극성에 의해 제어될 수 있다.Tuning the voltage in the device can be particularly useful for controlling the movement of large molecules, such as charged polymer scaffolds, that are of sufficient length to pass through two pores at the same time. In this respect, the direction and speed of movement of the molecule can be controlled by the relative magnitude and polarity of the voltage, as described below.
상기 장치는 액체 샘플, 특히, 생물학적 샘플, 및/또는 나노 가공에 적합한 물질을 보유하기에 적합한 물질을 포함할 수 있다. 한 측면에서, 그러한 물질은 규소, 질화규소, 이산화규소, 그래핀, 탄소 나노튜브, TiO2, HfO2, Al2O3, 또는 기타 금속층, 또는 이들 물질의 임의의 조합과 같은 유전 물질을 포함하지만, 이에 제한되지 않는다. 일부 측면에서, 예를 들어, 두께가 약 0.3 nm인 단층의 그래핀 막은 포어-보유 막으로 사용될 수 있다.The device may comprise a material suitable for holding a liquid sample, particularly a biological sample, and/or a material suitable for nanofabrication. In one aspect, such materials include dielectric materials, such as silicon, silicon nitride, silicon dioxide, graphene, carbon nanotubes, TiO 2 , HfO 2 , Al 2 O 3 , or other metal layers, or any combination of these materials, but , but not limited thereto. In some aspects, for example, a single-layer graphene film with a thickness of about 0.3 nm can be used as the pore-retaining film.
다양한 수단과 방법에 의해 마이크로유체이고 이중-포어 마이크로유체 칩 구현을 탑재한 장치가 만들어질 수 있다. 두 개의 평행한 막으로 구성되는 마이크로유체 칩의 경우, 두 막은 단일 빔으로 동시에 드릴링되어 두 개의 동심 포어를 형성할 수 있지만, 막의 각 측면에 다른 빔을 이용하는 것도 임의의 적절한 정렬 기술과 함께 가능하다. 일반적으로, 하우징은 챔버 A-C의 밀폐된 분리를 보장한다.Devices can be made by various means and methods that are microfluidic and are equipped with dual-pore microfluidic chip implementations. For microfluidic chips consisting of two parallel membranes, both membranes can be drilled simultaneously with a single beam to form two concentric pores, although using different beams on each side of the membrane is also possible with any suitable alignment technique. . In general, the housing ensures hermetic separation of chambers A-C.
한 측면에서, 상기 장치는 스페이서에 의해 연결되는 두 개의 평행한 막으로 구성되는 마이크로유체 칩("이중-포어 칩"으로 표시됨)을 포함한다. 각각의 막은 막의 중앙을 통해 단일 빔으로 뚫린 포어를 포함한다. 또한, 상기 장치는 바람직하게 상기 칩에 대한 Teflon® 하우징 또는 폴리카보네이트 하우징을 가진다. 상기 하우징은 챔버 A-C의 밀폐된 분리를 보장하고 전극에 대한 최소 액세스 저항을 제공하여 각 전압이 주로 각 포어를 가로질러 인가되도록 한다.In one aspect, the device comprises a microfluidic chip (denoted as a "double-pore chip") consisting of two parallel membranes connected by a spacer. Each membrane contains pores drilled with a single beam through the center of the membrane. In addition, the device preferably has a Teflon® housing or a polycarbonate housing for the chip. The housing ensures hermetic separation of chambers A-C and provides minimal access resistance to the electrodes so that each voltage is applied primarily across each pore.
보다 구체적으로, 상기 포어-함유 막은 두께 5-100 nm의 규소, 질화규소, 또는 이산화규소 창을 갖는 투과 전자 현미경(TEM) 그리드로 만들어질 수 있다. 스페이서는, SU-8, 포토레지스트, PECVD 산화물, ALD 산화물, ALD 알루미나와 같은, 절연체, 또는 Ag, Au, 또는 Pt와 같은, 증발된 금속 물질을 사용하고, 막 사이의 챔버 B의 다른 수성 부분 내 작은 부피를 차지하여, 막을 분리하는 데 사용될 수 있다. 홀더는 챔버 B의 가장 큰 부피 분율로 구성된 수조에 안착된다. 챔버 A 및 C는 막 밀봉으로 이어지는 직경이 더 큰 채널들로(액세스 저항을 낮추기 위해) 접근할 수 있다.More specifically, the pore-containing film may be made of a transmission electron microscope (TEM) grid with a silicon, silicon nitride, or silicon dioxide window of 5-100 nm in thickness. The spacer uses SU-8, photoresist, PECVD oxide, ALD oxide, an insulator, such as ALD alumina, or a vaporized metallic material, such as Ag, Au, or Pt, and the other aqueous portion of chamber B between the films. It occupies a small volume within it, so it can be used to separate membranes. The holder is seated in a water bath consisting of the largest volume fraction of chamber B. Chambers A and C are accessible with larger diameter channels (to lower access resistance) leading to the membrane seal.
집속된 전자 또는 이온 빔을 이용하여 막을 통해 뚫고, 이들을 자연스럽게 정렬할 수 있다. 포어는 각 층에 집속하는 올바른 빔을 조사하여 포어가 더 작은 크기로 조각(축소)되게 할 수 있다. 임의의 단일 나노포어 드릴링 방법은 또한 주어진 방법에 의해 가능한 드릴 깊이 및 막의 두께를 감안하여, 두 개의 막에 한 쌍의 포어를 뚫는 데 사용될 수 있다. 마이크로-포어를 미리 정해진 깊이로 미리 드릴링한 다음 막의 나머지 부분을 통한 나노포어는 막 두께를 더욱 미세화하는 것을 또한 가능하게 한다.A focused electron or ion beam can be used to break through the membrane and align them naturally. The pores can be sculpted (shrunk) into smaller sizes by irradiating the correct beam to focus on each layer. Any single nanopore drilling method can also be used to drill a pair of pores in two membranes, given the drill depth and membrane thickness possible by a given method. Pre-drilling the micro-pores to a predetermined depth and then nanopores through the remainder of the membrane also makes it possible to further refine the film thickness.
상기 장치의 포어에 존재하는 전압 덕분에, 하전된 분자는 상기 포어를 통하여 챔버 사이를 이동할 수 있다. 상기 이동 속도 및 방향은 전압의 크기 및 극성에 의해 제어될 수 있다. 또한, 두 전압 각각은 독립적으로 조정될 수 있으므로, 하전된 분자의 이동 방향 및 속도는 각 챔버 내에서 미세하게 제어될 수 있다.Thanks to the voltage present at the pores of the device, charged molecules can move through the pores between chambers. The moving speed and direction can be controlled by the magnitude and polarity of the voltage. In addition, since each of the two voltages can be adjusted independently, the movement direction and speed of the charged molecules can be finely controlled within each chamber.
하나의 예는 두 포어의 깊이에 두 포어 사이의 길이를 더한 값을 포함하는 결합된 거리보다 더 긴 길이를 갖는, 표적 폴리뉴클레오타이드를 고려한다. 예를 들어, 1000 bp dsDNA는 길이가 약 340 nm이고, 20 nm만큼 떨어진 두 개의 10 nm 깊이의 포어에 걸쳐 있는 40 nm보다 실질적으로 더 길 것이다. 첫 번째 단계에서, 상기 폴리뉴클레오타이드는 상부 챔버 또는 하부 챔버 내로 로딩된다. 이의 음전하 덕분에 약 7.4 pH의 생리학적 조건 하에서, 상기 폴리뉴클레오티드는 전압이 가해진 포어를 가로질러 이동될 수 있다. 그러므로, 두 번째 단계에서, 극성이 동일하고 크기가 같거나 비슷한, 두 전압을 상기 포어에 가하여 상기 폴리뉴클레오타이드를 두 포어를 가로질러 순차적으로 이동시킨다.One example contemplates a target polynucleotide having a length greater than the bound distance comprising the depth of the two pores plus the length between the two pores. For example, a 1000 bp dsDNA would be about 340 nm in length and substantially longer than 40 nm spanning two 10 nm
상기 폴리뉴클레오타이드가 제 2 포어에 도달할 때쯤, 두 전압 중 하나 또는 둘 다가 변경될 수 있다. 두 포어 사이의 거리는 상기 폴리뉴클레오타이드의 길이보다 짧도록 선택되었으므로, 상기 폴리뉴클레오타이드가 제 2 포어에 도달할 때, 이는 제 1 포어 내에도 있다. 따라서, 제 1 포어에서의 전압의 즉시 변경은, 상기 폴리뉴클레오타이드를 제 2 포어로부터 밀어내는 힘을 생성할 것이다.By the time the polynucleotide reaches the second pore, one or both of the voltages may be altered. The distance between the two pores was chosen to be shorter than the length of the polynucleotide, so that when the polynucleotide reaches the second pore, it is also within the first pore. Thus, an immediate change in voltage at the first pore will create a force that pushes the polynucleotide away from the second pore.
두 포어가 동일한 전압력 영향을 가지고 |V 1 | = |V 2 | + δV라고 가정하면, δV > 0 (또는 < 0)의 값은 |V 1 | (또는 V 2 ) 에서의 방향 이동에 대해 조정될 수 있다. 실제로, 각 포어에서 전압-유도된 힘이 V 1 = V 2 으로 동일하지 않지만, 보정 실험은 주어진 이중-포어 칩에 대하여 동일한 척력을 초래하는 적절한 바이어스 전압을 식별할 수 있으며; 그 바이어스 전압 주변의 변화는 방향 제어에 사용될 수 있다.Both pores have the same voltage force effect | V 1 | = | V 2 | Assuming + δV , a value of δV > 0 (or < 0) is | V 1 | (or V 2 ) can be adjusted for directional movement. In practice, although the voltage-induced force at each pore is not the same as V 1 = V 2 , calibration experiments can identify an appropriate bias voltage that results in the same repulsive force for a given dual-pore chip; A change around that bias voltage can be used for direction control.
이 때, 만일, 제 1 포어에서 전압-유도된 힘의 크기가 제 2 포어에서 전압-유도된 힘보다 작으면, 이어서 상기 폴리뉴클레오타이드는 두 포어를 통과하여 계속 제 2 포어 쪽을 향하지만, 더 느린 속도로 이동할 것이다. 이와 관련하여, 상기 폴리뉴클레오타이드의 이동 속도 및 방향이 두 전압의 극성 및 크기에 의해 조절될 수 있다는 것이 쉽게 이해된다. 아래에서 더 자세히 설명하겠지만, 이러한 정밀한 이동 제어는 광범위하게 적용된다. 표적 폴리뉴클레오타이드를 정량화하기 위해, 이중-포어 장치 구현의 유용서은 조절된 전달 및 감지 중에, 상기 표적 폴리뉴클레오타이드 또는 페이로드-결합된 표적 폴리뉴클레오타이드가 반복적으로 측정되어, 검출 결과에 확신을 더할 수 있다는 것이다.At this time, if the magnitude of the voltage-induced force at the first pore is smaller than the voltage-induced force at the second pore, then the polynucleotide passes through both pores and continues toward the second pore, but more will move at a slower pace. In this regard, it is readily understood that the movement speed and direction of the polynucleotide can be controlled by the polarity and magnitude of the two voltages. As will be discussed in more detail below, this precise movement control has broad application. To quantify a target polynucleotide, the usefulness of implementing a dual-pore device is that during controlled delivery and detection, the target polynucleotide or payload-bound target polynucleotide can be repeatedly measured, adding confidence to the detection result. will be.
따라서, 한 측면에서, 나노포어 장치를 통한 하전된 고분자 스캐폴드의 이동을 제어하는 방법이 제공된다. 상기 방법은 (a) 상기 구현예들 중 임의의 장치의 상부 챔버, 중앙 챔버 또는 하부 챔버 중 하나에 표적 폴리뉴클레오타이드(예컨대, 표적 폴리뉴클레오타이드 앰플리콘)를 포함하는 샘플을 로딩하는 단계로서, 상기 장치는 상기 상부 챔버 및 상기 중앙 챔버 사이에 제 1 전압을, 상기 중앙 챔버 및 상기 하부 챔버 사이에 제 2 전압을 제공하기 위한 하나 이상의 전원에 연결되는 단계; (b) 상기 표적 폴리뉴클레오타이드가 상기 두 챔버 사이에서 이동하여, 상기 고분자 스캐폴드가 제 1 및 제 2 포어 모두를 가로질러 위치하도록 초기 제 1 전압 및 초기 제 2 전압을 설정하는 단계; 및 (c) 상기 제 1 전압 및 제 2 전압을 조정하여 두 전압이 상기 하전된 표적 폴리뉴클레오타이드를 상기 중앙 챔버로부터 밀어내는 힘을 생성하도록 하는 단계로서(전압-경쟁 모드), 상기 두 전압은 크기가 서로 달라서, 제어된 조건 하에서, 상기 표적 폴리뉴클레오타이드 스캐폴드가 두 포어를 가로질러 다른 방향으로 제어된 방식으로 이동하는 단계를 포함한다.Accordingly, in one aspect, a method of controlling the migration of a charged polymer scaffold through a nanopore device is provided. The method comprises (a) loading a sample comprising a target polynucleotide (eg, a target polynucleotide amplicon) into one of an upper chamber, a central chamber, or a lower chamber of the device of any of the embodiments, the device comprising: coupled to one or more power sources for providing a first voltage between the upper chamber and the central chamber and a second voltage between the central chamber and the lower chamber; (b) setting an initial first voltage and an initial second voltage such that the target polynucleotide moves between the two chambers so that the polymer scaffold is positioned across both the first and second pores; and (c) adjusting the first voltage and the second voltage such that both voltages generate a force that repels the charged target polynucleotide from the central chamber (voltage-competition mode), wherein the two voltages have a magnitude are different, so that under controlled conditions, the target polynucleotide scaffold crosses the two pores and moves in different directions in a controlled manner.
한 측면에서, 상기 표적 폴리뉴클레오타이드를 포함하는 샘플은 상기 상부 챔버 내에 로딩되고 상기 초기 제 1 전압은 상기 표적 폴리뉴클레오타이드를 상기 상부 챔버로부터 상기 중앙 챔버 쪽으로 당기도록 설정되며 상기 초기 제 2 전압은 상기 표적 폴리뉴클레오타이드를 상기 중앙 챔버로부터 상기 하부 챔버 쪽으로 당기도록 설정된다. 마찬가지로, 상기 샘플은 초기에 상기 하부 챔버 내에 로딩될 수 있으며, 상기 표적 폴리뉴클레오타이드를 상기 중앙 및 상부 챔버로 당겨질 수 있다.In one aspect, the sample comprising the target polynucleotide is loaded into the upper chamber and the initial first voltage is set to pull the target polynucleotide from the upper chamber towards the central chamber and the initial second voltage is the target configured to pull polynucleotides from the central chamber towards the lower chamber. Likewise, the sample may initially be loaded into the lower chamber, and the target polynucleotide may be pulled into the central and upper chambers.
다른 측면에서, 상기 표적 폴리뉴클레오타이드를 포함하는 샘플은 상기 중앙 챔버 내에 로딩되고, 상기 초기 제 1 전압은 상기 하전된 고분자 스캐폴드를 상기 중앙 챔버로부터 상기 상부 챔버로 당기도록 설정되며; 상기 초기 제 2 전압은 상기 표적 폴리뉴클레오타이드를 상기 중앙 챔버로부터 상기 하부 챔버 쪽으로 당기도록 설정된다.In another aspect, the sample comprising the target polynucleotide is loaded into the central chamber, and the initial first voltage is set to pull the charged polymer scaffold from the central chamber to the upper chamber; The initial second voltage is set to pull the target polynucleotide from the central chamber toward the lower chamber.
한 측면에서, 단계 (c)에서 상기 제 1 전압 및 상기 제 2 전압에 대한 실시간 또는 온라인 조정은 전용 하드웨어 및 소프트웨어를 이용하여 능동 제어 또는 피드백 제어에 의해, 최대 수백 메가헤르츠의 클럭 속도로 수행된다. 상기 제 1 또는 제 2 또는 두 전압 모두의 자동 제어는 제 1 또는 제 2 또는 두 이온 전류 측정값의 피드백을 기반으로 한다.In one aspect, the real-time or online adjustment of the first voltage and the second voltage in step (c) is performed by active control or feedback control using dedicated hardware and software, at clock rates of up to several hundred megahertz. . The automatic control of the first or second or both voltages is based on feedback of the first or second or both ion current measurements.
센서sensor
위에서 논의된 바와 같이, 다양한 측면에서, 상기 나노포어 장치는 상기 표적 폴리뉴클레오타이드의 검출을 수행하기 위한 하나 이상의 센서를 더 포함한다.As discussed above, in various aspects, the nanopore device further comprises one or more sensors to effect detection of the target polynucleotide.
상기 장치에 사용되는 센서는 페이로드 분자에 결합되거나 결합되지 않은 표적 폴리뉴클레오타이드 앰플리콘을 식별하기에 적합한 임의의 센서일 수 있다. 예를 들어, 센서는 고분자와 관련된 전류, 전압, pH 값, 광학 특성, 또는 체류 시간을 측정하여 상기 표적 폴리뉴클레오타이드를 식별하도록 구성될 수 있다. 다른 측면에서, 상기 센서는 상기 표적 폴리뉴클레오타이드에 결합된 또는 부착된 표적 폴리뉴클레오타이드의 하나 이상의 개별 성분 또는 하나 이상의 성분을 식별하도록 구성될 수 있다. 상기 센서는 측정 가능한 파라미터의 변화를 검출하도록 구성된 임의의 성분으로 형성될 수 있으며 여기서 상기 변화는 상기 표적 폴리뉴클레오타이드, 상기 표적 폴리뉴클레오타이드의 성분, 또는 바람직하게, 상기 표적 폴리뉴클레오타이드에 결합되거나 부착된 성분을 나타낸다. 한 측면에서, 상기 센서는 분자 또는 다른 물질, 특히 표적 폴리뉴클레오타이드가, 포어를 통해 이동할 때 상기 포어를 가로지르는 이온 전류를 측정하기 위하여 포어의 두 측면에 배치된 한 쌍의 전극을 포함한다. 특정 측면에서, 상기 포어를 가로지르는 이온 전류는 상기 포어를 통과하는 표적 폴리뉴클레오타이드 부분이 페이로드 분자과 결합될 때 측정 가능하게 변화한다. 이러한 전류의 변화는, 예를 들어, 상기 존재하는 표적 폴리뉴클레오타이드의 존재, 부존재, 및/또는 크기에 상응하는 예측 가능하고, 측정 가능한 방식으로 변화할 수 있다.The sensor used in the device may be any sensor suitable for identifying a target polynucleotide amplicon bound to or not bound to a payload molecule. For example, the sensor can be configured to identify the target polynucleotide by measuring a current, voltage, pH value, optical property, or residence time associated with the polymer. In another aspect, the sensor may be configured to identify one or more individual components or one or more components of a target polynucleotide bound to or attached to the target polynucleotide. Said sensor may be formed of any component configured to detect a change in a measurable parameter, wherein said change is said target polynucleotide, a component of said target polynucleotide, or preferably a component bound to or attached to said target polynucleotide. indicates In one aspect, the sensor comprises a pair of electrodes disposed on two sides of the pore for measuring the ionic current across the pore as a molecule or other material, in particular a target polynucleotide, moves through the pore. In certain aspects, the ionic current across the pore changes measurably when a portion of the target polynucleotide passing through the pore binds to a payload molecule. This change in current may change in a predictable, measurable manner, corresponding, for example, to the presence, absence, and/or size of the target polynucleotide present.
바람직한 구현예에서, 상기 센서는 상기 나노포어를 가로질러 전압을 인가하고 전류를 측정하기 위해 사용되는 전극을 포함한다. 상기 나노포어를 통한 분자의 전위는 옴의 법칙, V = IZ에 따라 상기 나노포어를 통해 전류에 영향을 미치는 전기 임피던스(Z)를 제공하며, 여기서 V는 인가된 전압, I는 상기 나노포어를 통한 전류, 및 Z는 임피던스이다. 역으로, 컨덕턴스 G = 1/Z는 나노포어 이벤트를 신호하고 정량화기 위해 모니터링된다. 분자가 전기장 내에서(예컨대, 인가된 전압 하에서) 나노포어를 통해 전위될 때 결과는 전류 신호의 추가 분석 시 나노포어를 통과하는 분자와 상관될 수 있는 전류 신호이다.In a preferred embodiment, the sensor comprises an electrode used to apply a voltage across the nanopore and measure the current. The potential of a molecule through the nanopore provides an electrical impedance (Z) that affects the current through the nanopore according to Ohm's Law, V = IZ, where V is the applied voltage and I is the nanopore The current through, and Z is the impedance. Conversely, the conductance G = 1/Z is monitored to signal and quantify nanopore events. When a molecule is translocated through a nanopore in an electric field (eg, under an applied voltage) the result is a current signal that can be correlated with the molecule passing through the nanopore upon further analysis of the current signal.
전류 신호로부터 체류 시간 측정이 이용될 때, 성분의 크기는 감지 장치를 통과하는 데 걸리는 시간의 길이에 기초하는 특정 성분과 관련될 수 있다.When a dwell time measurement from a current signal is used, the magnitude of the component may be associated with a particular component based on the length of time it takes to pass through the sensing device.
한 구현예에 있어서, 센서는 고분자, 상기 고분자의 성분(또는 단위), 또는 상기 고분자에 결합되거나 부착된 성분의 광학 특성을 측정하는 나노포어 장치 내에 제공된다. 이러한 측정의 한 예는 적외선(또는 자외선) 분광에 의해 특정 단위에 고유한 흡광 밴드의 식별을 포함한다.In one embodiment, a sensor is provided in a nanopore device that measures optical properties of a polymer, a component (or unit) of the polymer, or a component bound to or attached to the polymer. One example of such a measurement involves the identification of an absorption band unique to a particular unit by infrared (or ultraviolet) spectroscopy.
일부 구현예에서, 상기 센서는 전기 센서이다. 일부 구현예에서, 상기 센서는 형광 신호를 검출한다. 포어의 출구에서의 방사선원은 상기 신호를 검출하는 데 이용될 수 있다.In some embodiments, the sensor is an electrical sensor. In some embodiments, the sensor detects a fluorescent signal. A radiation source at the exit of the pore may be used to detect the signal.
균등예 및 범위Equivalence and scope
통상의 기술자는 본 명세서에 설명된 발명에 따른 특정 구현예들의 여러 균등예들에 대한 많은 등가물을 인식하거나, 통상적인 실험만 사용하여 확인할 수 있을 것이다. 본 발명의 범위는 상기의 상세한 설명에 제한되도록 의도되는 것이 아니라, 첨부되는 청구범위에 기재된 바와 같다.Those skilled in the art will recognize, or be able to ascertain using no more than routine experimentation, many equivalents to various equivalents of the specific embodiments in accordance with the invention described herein. The scope of the present invention is not intended to be limited to the above detailed description, but is as set forth in the appended claims.
청구범위에서, "하나," "하나의," 및 "상기"와 같은 관사는 문맥에서 달리 명백하지 않는 한 하나 또는 둘 이상을 의미할 수 있다. 그룹의 하나 이상의 요소들 사이에 "또는"을 포함하는 청구범위 및 상세한 설명는 문맥에서 달리 명백하지 않는 한 하나, 둘 이상, 또는 해당 군의 모든 요소가 주어진 산물 또는 과정에 존재하거나, 포함되거나, 다른 방법으로 관련되는 경우에 충족되는 것으로 간주된다. 본 발명은 해당 군의 정확히 하나의 요소가 주어진 산물 또는 과정에 존재하거나, 포함되거나, 다른 방법으로 관련되는 구현예들을 포함한다. 본 발명은 해당 군의 둘 이상의, 또는 모든 요소가 주어진 산물 또는 과정에 존재하거나, 포함되거나, 다른 방법으로 관련되는 구현예들을 포함한다.In the claims, articles such as "a," "an," and "the" may mean one or more than one, unless the context clearly dictates otherwise. Claims and descriptions that include “or” between one or more elements of a group indicate that one, two or more, or all elements of that group are present, included, or otherwise in a given product or process, unless the context clearly dictates otherwise. It is considered to be satisfied if it is relevant in this way. The invention includes embodiments in which exactly one element of the group is present, included, or otherwise related to a given product or process. The invention includes embodiments in which two or more, or all, elements of a given group are present in, included in, or otherwise related to in a given product or process.
또한, 용어 "포함하는"은 개방된 것으로 의도되고 추가적인 요소 또는 단계의 포함을 허용하되 요구하지는 않는다는 점에 유의해야 한다. 본 명세서에서 용어 "포함하는"이 사용되는 경우, 용어 "구성되는"은 따라서 또한 포함되고 개시된다.It should also be noted that the term "comprising" is intended to be open-ended and does not permit, but does not require, the inclusion of additional elements or steps. Where the term “comprising” is used herein, the term “consisting of” is accordingly also included and disclosed.
범위가 제공되는 경우, 종점이 포함된다. 또한, 문맥 및 당해 기술분야의 통상적인 지식을 가지는 자의 이해에서 달리 명백하지 않는 한, 범위로 표현된 값들은 본 발명의 다른 구현예들에서 언급된 범위 내의 임의의 특정 값 또는 부분 범위, 문맥에서 달리 명시하지 않는 한, 범위의 하한의 단위의 1/10까지를 가정할 수 있다.Where ranges are provided, endpoints are included. Also, unless otherwise clear from the context and understanding of one of ordinary skill in the art, values expressed in ranges are not intended to be used in context with any particular value or subrange within the stated range in other embodiments of the invention. Unless otherwise specified, up to tenths of the unit of the lower limit of the range may be assumed.
인용된 모든 출처, 예컨대, 참고문헌, 공개문헌, 데이터베이스, 데이터베이스 항목 및 본 명세서에서 인용한 기술은, 인용에 명시적으로 언급되지 않더라도, 본 출원에 참조로서 포함된다. 인용된 출처의 내용과 본 출원이 상충되는 경우, 본 출원의 설명이 우선한다.All sources cited, such as references, publications, databases, database entries, and techniques cited herein, are incorporated herein by reference, even if not explicitly recited in the citation. In case of any conflict between the content of the cited sources and the present application, the description of the present application shall control.
섹션 및 표 제목은 제한하려는 의도가 아니다.Section and table headings are not intended to be limiting.
실시예Example
이하는 본 발명을 실시하기 위한 구체적인 구현예의 실시예들이다. 하기 실시예들은 단지 설명을 위해 제공되는 것으로서, 어떤 식으로든 본 발명의 범위를 제한하고자 하는 것이 아니다. 사용된 수치(예컨대, 양, 온도 등)에 관해서는 정확도를 보장하기 위해 노력을 기울였지만, 일부 실험 오차 및 편차는, 물론, 허용되어야 한다.The following are examples of specific embodiments for carrying out the present invention. The following examples are provided for illustrative purposes only and are not intended to limit the scope of the present invention in any way. Efforts have been made to ensure accuracy with respect to numbers used (eg, amounts, temperature, etc.), however, some experimental errors and deviations should, of course, be tolerated.
별도로 언급하지 않은 경우에, 본 발명을 실시함에 있어, 당업계의 기술 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학 분야의 통상적인 방법들이 사용될 것이다. 이러한 기술들은 문헌에 충분히 설명되어 있다. 예컨대, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B(1992)를 참고하기 바란다.Unless otherwise specified, in the practice of the present invention, methods conventional in the fields of protein chemistry, biochemistry, recombinant DNA technology and pharmacology within the skill of the art will be used. These techniques are fully described in the literature. For example, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B (1992).
실시예 1 - 표적 및 참조에 대해 길이가 다른 dsDNA 를 이용한 Q-검정 기반 FAExample 1 - Q-test based FA using dsDNA of different lengths for target and reference
본 실시예는 형질전환(GMO) 표적 서열이 788 bp 표적 dsDNA(즉, 표적 분석물) 내에 존재하고 참조 서열(렉틴 하우스키핑 유전자)이 466 bp 참조 dsDNA(즉, 참조 분석물) 내에 존재하는 경우 분포분율(FA) 프레임워크를 데이터에 적용하여 얻어지는 결과를 제시한다. 샘플 내 전이유전자 표적의 분량의 정량화는, 먼저 이벤트 면적에 기반한 단일 특성 기준으로 Q 검정법을 적용하고 식 (1) 및 (2)를 이용하며, 두 번째 SVM 방법을 적용하고 식 (3) 및 (4)를 이용함으로써 이루어진다.In this example, a transformation (GMO) target sequence is present in a 788 bp target dsDNA (ie, target analyte) and a reference sequence (lectin housekeeping gene) is present in a 466 bp reference dsDNA (ie, reference analyte) We present the results obtained by applying the fraction of distribution (FA) framework to the data. Quantification of the amount of transgene target in a sample is accomplished by first applying the Q test as a single attribute criterion based on event area and using equations (1) and (2), second applying the SVM method and applying equations (3) and ( 4) is done by using
상기 466 bp 참조 DNA 및 788 bp 표적 형질전환 DNA 단편들을 통상적인 전이유전자-포함 게놈 DNA 샘플의 혼합물로부터 서열 특이적 올리고뉴클레오타이드 프라이머를 사용하여 PCR에 의해 생성하였다. PCR 생성물을 표준 실리카 막 컬럼을 사용하여 정제 및 농축하였다. 생성된 다량의 개별 앰플리콘들로부터 상기 두 앰플리콘의 정밀한 분획 혼합물들을 제조하고, 상기 분획 혼합물 및 단일 앰플리콘의 분취량을 모든 분석에 대한 표준 참조 물질로 사용하였다.The 466 bp reference DNA and 788 bp target transforming DNA fragments were generated by PCR using sequence specific oligonucleotide primers from a mixture of conventional transgene-containing genomic DNA samples. The PCR product was purified and concentrated using a standard silica membrane column. Precise fraction mixtures of the two amplicons were prepared from the resulting large number of individual amplicons, and aliquots of the fraction mixture and single amplicons were used as standard reference materials for all analyses.
먼저, 466 bp 참조 DNA를 포함하는 참조 대조군 샘플을 나노포어 장치 내에서 측정하였다. 다음으로, 788 bp 형질전환 DNA를 포함하는 표적 대조군 샘플을 제조하고 나노포어 장치 내에서 측정하였다. 표적 분석물(788 bp)과 참조 분석물(466 bp)의 길이 차이는 이벤트 신호의 면적을 기반으로 식별할 수 있는 나노포어를 통한 전위 시 고유한 이벤트 신호를 생성한다.First, a reference control sample containing 466 bp reference DNA was measured in the nanopore device. Next, a target control sample containing 788 bp transforming DNA was prepared and measured in the nanopore device. The difference in length between the target analyte (788 bp) and the reference analyte (466 bp) creates a unique event signal upon translocation through the nanopore that can be discerned based on the area of the event signal.
도 4A는 466 bp 참조 DNA에 대한 하나 및 788 bp 표적 형질전환 DNA에 대한 하나인 2 개의 분리된 대조군 실행에 대한 모든 이벤트 면적 히스토그램을 보여준다. 또한, 3:10 표적:참조 대조군 혼합 샘플로부터 면적 히스토그램도 도시되어 있다. 도 4B는 대조군 혼합물(Q targ , Q ref )과 공지된 혼합물(Q mix ) 경향을 면적 기준 한계 q의 함수로 보여주며, 여기에서 Q mix = Q 3:10 이다. 도 4C는 분량 파라미터 가 q 값에서 그래픽으로 어떻게 나타나는지 보여준다. q = 5 pA*ms 한계(수직 점선)는 0.05의 위양성(즉, Q ref = 0.05) 및 0.1의 위음성(즉, Q targ = 0.9)에 해당한다.4A shows all event area histograms for two separate control runs, one for 466 bp reference DNA and one for 788 bp target transforming DNA. Also shown are area histograms from a 3:10 target:reference control mixed sample. 4B shows the trends of the control mixture ( Q targ , Q ref ) and the known mixture ( Q mix ) as a function of area-based limit q , where Q mix = Q 3:10 . Figure 4C shows the aliquot parameters. shows how is represented graphically at the q value. The q = 5 pA*ms limit (vertical dashed line) corresponds to a false positive of 0.05 (ie, Q ref = 0.05) and a false negative of 0.1 (ie, Q targ = 0.9).
대조 혼합물을 이용하여, 식 (2)를 적용하여 GMO 예측값(%) 을 생성하여, 공지 혼합물에 대한 분포 분율의 추정값 생성하기 위해 참조 전용 및 표적 전용 대조군을 이용하는 방법의 정확도 및 정밀도를 테스트한다. 먼저 공지 혼합물에 식 (2)를 적용하였다. Q X:Y 를 생성하는 데 대조군 혼합 샘플을 사용하지 않았기 때문에, 모델을 검증하지 위해 표적 분석물과 참조 분석물의 포획률 상수 차이에 대한 보상을 사용하지 않고(즉, α = 1로 설정) 추정치가 생성되었다. 도 5A는 예측된 GMO(%)() 대비 참 GMO(%)의 플롯을 보여주며, 비교를 위하여 영오차선(기울기 = 1)의 위, 아래에 10% 오차 한계를 도시하였다. 이러한 결과는 단일 나노포어에서 연속적으로, 100% 표적 및 100% 참조(분리된) 대조 샘군을 실행한 다음, 5개의 공지 혼합물을 실생하여 설정되었다. 표 1은 도 5A에 도시된 예측값과 오차 막대, 그리고 각 혼합물에 대하여 검출된 전체 이벤트의 수를 보고한다.Using the control mixture, GMO predicted value (%) by applying Equation (2) to test the accuracy and precision of the method using reference-only and target-only controls to generate estimates of the fraction of distribution for a known mixture. First, formula (2) was applied to a known mixture. Because no control mixed samples were used to generate Q X:Y , we did not use compensation for differences in capture rate constants of target and reference analytes to validate the model (i.e., set α = 1) and estimate the estimate has been created 5A shows the predicted GMO (%) ( ) versus true GMO (%), and 10% error limits are shown above and below the zero lane (slope = 1) for comparison. These results were established by running a population of 100% target and 100% reference (isolated) control samples sequentially on a single nanopore followed by running five known mixtures. Table 1 reports the predicted values and error bars shown in Figure 5A, and the total number of events detected for each mixture.
표 1. 도 5A의 데이터에 대한 GMO 예측 결과Table 1. GMO prediction results for the data in FIG. 5A
비슷한 프로토콜(2 개의 분리된 대조군 및 6 개의 공지 혼합물)에 따라 별도의 나노포어 실험 및 생성된 결과를 도 5B와 표 2에 제시하였다.Separate nanopore experiments and the resulting results according to a similar protocol (2 separate controls and 6 known mixtures) are presented in Figure 5B and Table 2.
표 2. 도 5B 데이터에 대한 GMO 예측 결과Table 2. GMO prediction results for Figure 5B data
도 5A 및 도 5B와 표 1 및 2의 결과는 단일 나노포어를 사용하여 5% 이내의 GMO% 예측 정확도가 두 DNA를 구분하는 것이 가능함을 시사한다. 이러한 결과는 표적 분석물과 참조 분석물의 포획률 상수 차이를 보상하지 않고(식 (2)에서 α = 1로 설정) 얻은 것이다. 포획률 상수 차이에 대한 보상은 결과를 더 개선시킬 것으로 예상된다.단일 값 대신, q-한계 범위를 이용한 예가 도 6에 도시되어 있다. 구체적으로, Q ref 의 75 내지 99 번째 백분위를 q-한계 범위로 선택하였다. 상기 q 범위에 대한 결과 를 도시하고, 평균값 을 공지된 15% GMO와 비교하였다. 이는 본 명세서에서 제공된 분석 프레임워크가 한계 범위에 걸쳐, 상기 한계가 최적화되지 않은 경우에도, 위양성 및 위음성 오차를 보상하여, 샘플 내 표적 분석물의 상대적 존재비의 개선된 추정값을 제공한다.The results in Figures 5A and 5B and Tables 1 and 2 suggest that it is possible to differentiate the two DNAs with a GMO% prediction accuracy within 5% using a single nanopore. These results were obtained without compensating for the difference in capture rate constants of the target analyte and the reference analyte (set α = 1 in Equation (2)). Compensation for differences in capture rate constants is expected to further improve the results. An example of using a q -limit range instead of a single value is shown in FIG. 6 . Specifically, the 75th to 99th percentile of Q ref was selected as the q- limit range. Results for the above q range is shown, and the average value was compared to known 15% GMO. This provides an improved estimate of the relative abundance of a target analyte in a sample, allowing the analytical framework provided herein to compensate for false-positive and false-negative errors over a range of limits, even when those limits are not optimized.
본 실시예에서 검증된 표적 서열의 존재비의 정량화를 위한 과정은 임의의 증폭, 정제, 농축 또는 완충액 교환 단계를 필요로 하지 않는다. 이러한 과정은 저렴한, 일회용 샘플 준비 카트리지와 호환되어, 소형(휴대용 또는 탁상용) 장치에서의 샘플-인 해답-아웃 과정을 허용한다.The procedure for quantification of the abundance of the target sequence validated in this example does not require any amplification, purification, concentration or buffer exchange steps. This process is compatible with inexpensive, disposable sample preparation cartridges, allowing sample-in, answer-out procedures in compact (portable or table-top) devices.
다른 일련의 실험에서, 다양한 GMO% 샘플을 미공지로 시험하였다. 각 나노포어에 대한 프로토콜은 다음과 같다: a) 100% 466 bp 참조를 5 분 동안, 그 다음 플러싱; b) 100% 788 bp 표적을 5 분 동안, 그 다음 플러싱; c) 1 내지 4 개의 미공지를 각각 5 분 동안 실행하고, 중간에 플러싱; d) 대조 혼합물을 실행한다. 면적 기준을 사용하였고 Q ref 의 75∼99 번째 백분위에 걸쳐 있는 q-한계 범위로 사용하였으며, 평균 을 예측된 GMO%로 보고하였다. 식 (2)에서, 대조군 혼합물을 사용하여 표적 분석물과 참조 분석물의 포획률 상수 차이를 보상하였다. 실험은 1:1, 0.75:1 또는 0.35:1의 표적:참조 대조군 혼합물을 사용하였다.In another series of experiments, various % GMO samples were tested as unknowns. The protocol for each nanopore is as follows: a) 100% 466 bp reference for 5 min followed by flushing; b) 100% 788 bp target for 5 min followed by flushing; c) 1 to 4 blanks each run for 5 minutes, flushing in the middle; d) Run the control mixture. The area criterion was used and the q- limit range spanning the 75th to 99th percentile of Q ref was used, and the mean was reported as the predicted GMO%. In equation (2), a control mixture was used to compensate for the difference in capture rate constants of the target analyte and the reference analyte. Experiments used 1:1, 0.75:1 or 0.35:1 target:reference control mixtures.
표 3은 0.35:1의 대조 혼합물 (35% GMO)을 보상용으로 사용한, 4 개의 "미공지" 혼합 샘플(S1-S4)에 대한 하나의 나노포어 분석의 예측 결과를 보고한다. 각 나노포어 분석에서 미공지들은 맹검 처리하였으므로, 백분율 오차는 표에 보고되지 않았다. 또한, 상기 표는 각각 5 분 동안 기록된 전체 이벤트의 수를 보고한다.Table 3 reports the predictive results of one nanopore analysis on four “unknown” mixed samples (S1-S4), using a 0.35:1 control mixture (35% GMO) as compensation. Since unknowns were blinded in each nanopore analysis, percentage errors were not reported in the table. In addition, the table above reports the total number of events recorded during each 5 minutes.
표 3. 맹검 샘플 S1-S4에 대한 GMO 예측 결과Table 3. GMO prediction results for blinded samples S1-S4
앞에서 언급한 프로토콜에 따라 총 12 회의 나노포어 실험을 수행하였고, 각 혼합 샘플을 항상 다른 나노포어 상에서, 다른 실험자에 의해 또는 다른 날에 2-5 회 시험하였다. 나노포어 크기 범위는 직경 25-35 nm이었다. 총 11 개의 혼합 샘플(S1-S11)을 분석하였다. 표 4는 예측된 GMO% 값을 가장 작은 것에서 큰 것 순으로, 결합된 추정치를 보고한다. 보고된 평균 GMO% 값은 단일-나노포어 예측의 결과를 평균하여 계산하였다. 각 평균 추정치의 불확실성은 개별 추정치 분포를 반복적으로 무작위 샘플링(몬테 카를로 방법)하여 계산하였다. 보고된 것은 수치적으로 생성된 95-번째 백분위 신뢰 구간이다. 각 샘플에 대한 시험 횟수와 각 샘플에 대한 참 GMO%를 또한 기록하였다.A total of 12 nanopore experiments were performed according to the aforementioned protocol, and each mixed sample was always tested 2-5 times on different nanopores, by different experimenters or on different days. The nanopore size range was 25-35 nm in diameter. A total of 11 mixed samples (S1-S11) were analyzed. Table 4 reports the combined estimates of the predicted % GMO values, from smallest to largest. The reported average GMO% values were calculated by averaging the results of single-nanopore predictions. The uncertainty of each mean estimate was calculated by repeated random sampling (Monte Carlo method) of the distribution of the individual estimates. Reported are the numerically generated 95th percentile confidence intervals. The number of tests for each sample and the % true GMO for each sample were also recorded.
표 4.샘플 S1-S11에 대한 결합된 GMO% 예측값 (평균 ± 2 시그마)Table 4. Combined GMO% predicted values for samples S1-S11 (mean ± 2 sigma)
표 4의 결과는 본 발명의 방법이 높은 정확도로 표적 분석물의 분포분율(예컨대, GMO%)을 예측할 수 있음을 보여준다. 10-90% 범위의 GMO% 내에서, 정확도는단일-나노포어 추정치를 결합하여 2% 이내이다. 포화 한계에 접근하여 에측 오차가 증가할 것으로 예상될 수 있는, 5-10% 및 100% GMO에서, 두 나노포어 추정치를 결합하면 < 5% 오차가 발생하였다. 일반적으로, 표적 분석물과 참조 분석물의 포획률 상수 차이에 대한 보상의 이용은 상기 포획률 상수 차이에 대한 보상을 하지 않은 경우에 비해 정확도를 개선한다(표 1-2). 전체 GMO% 예측 범위에 대하여, 더 많은 나노포어 추정치는 정확도 및 정밀도를 더 크게 개선시킨다. 공통 풀에서 각각 측정되는, 배열된 나노포어는, 또한 이 연구의 일부로 존재했던 사람, 일자, 및 시약 세트 간 변동을 제거하여, 불확실성을 또한 더 줄일 수 있다.The results in Table 4 show that the method of the present invention can predict the distribution fraction (eg, GMO%) of the target analyte with high accuracy. Within the GMO% range of 10-90%, the accuracy is within 2% of combined single-nanopore estimates. Combining the two nanopore estimates resulted in <5% error at 5-10% and 100% GMO, which could be expected to increase the prediction error by approaching the saturation limit. In general, the use of compensation for the difference in capture rate constants between the target analyte and the reference analyte improves accuracy compared to the case where no compensation for the difference in capture rate constants is used (Table 1-2). For the full GMO% prediction range, more nanopore estimates greatly improve accuracy and precision. Arranged nanopores, each measured in a common pool, can also further reduce uncertainty by eliminating variations between person, date, and reagent sets that were present as part of this study.
실시예 2 - 표적 및 참조에 대해 길이가 다른 dsDNA 를 이용한 SVM 기반 FAAExample 2 - SVM based FAA using dsDNA of different lengths for target and reference
실시예 1에서 기록되고 분석된 것과 동일한 나노포어 데이터를 종래에 존재한 SVM 방법(식 (3)∼(4))을 사용하여 여기서 재분석하였다.The same nanopore data as recorded and analyzed in Example 1 were reanalyzed here using the conventional SVM method (Equations (3) to (4)).
먼저 분리된 대조군 세트는 초기 선택 선택에 사용되었다. 초기 선택은, 특정 분류 방법에서 다중 공선성 문제를 야기할 수 있는, 상관관계가 높은 특징을 제거하는 것을 목적으로 한다. 7개의 식별된 특징은 다음과 같다: (i) log10(체류시간) 또는 "체류시간", 이벤트 지속시간의 밑이 10인 로그; (ii) maxAmp: δG 최대값; (iii) sdAmpSub: 상승 시간과 하강 시간을 제외한, 이벤트 신호의 표준편차; (iv) medAmp: δG 중앙값; (v) LFNmean: 50 Hz 이하인 이벤트의 노이즈 파워의 평균값; (vi) LFNmedian: 50 Hz 이하인 이벤트의 노이즈 파워의 중앙값; (vii) 면적: 실시예 1에서 사용된 동일한 이벤트 면적.A first isolated control set was used for the initial selection selection. The initial selection aims to remove highly correlated features that can cause multicollinearity problems in certain classification methods. The seven identified characteristics are: (i) log 10 (dwell time) or "dwell time", log
데이터 차원을 줄이기 위하여 추가적인 특징 추출을 수행하였다. 이 단계의 목적은 계산 시간과 분류 정확도의 균형을 맞추는 것이다. 두 가지 알고리즘이 구현되었다: 1) 단변량 특징 선택 방법. ANOVA F 값은 이벤트의 각 특징 및 표지 사이에서 계산되었다. 가장 높은 F 점수를 가지는 특징 부분을 선택하기 위하여 한계를 수동으로 설정하였다. 2) 재귀적 특징 제거(RFE). 추정기(예컨대, SVM)는 초기 특징 세트에 대하여 학습되고 각 특징의 중요도가 획득된다. 중요도가 가장 낮은 특징은 현재의 특징 세트에서 제외될 것이다. 원하는 수의 특징 세트에 도달할때까지 이러한 과정을 재귀적으로 반복한다.Additional feature extraction was performed to reduce the data dimension. The purpose of this step is to balance computation time with classification accuracy. Two algorithms were implemented: 1) a univariate feature selection method. ANOVA F values were calculated between each feature and marker of the event. Limits were set manually to select the feature part with the highest F-score. 2) Recursive feature removal (RFE). An estimator (eg, SVM) is trained on an initial set of features and the importance of each feature is obtained. The features with the lowest importance will be excluded from the current feature set. This process is repeated recursively until the desired number of feature sets is reached.
실시예 1의 데이터에 대하여, 단변량 특징 선택법을 사용하였다. 특징들의 백분율 한계를 60%으로 수동 설정하였다. 알고리즘에 의해 선택된 4 가지 최적 특징은: (i) 체류시간, (ii) sdAmpSub, (iii), medAmp, (iv) 면적이다.For the data of Example 1, a univariate feature selection method was used. The percentage limit of features was manually set to 60%. The four optimal features selected by the algorithm are: (i) residence time, (ii) sdAmpSub, (iii), medAmp, (iv) area.
방법의 다음 단계는 모델 훈련 및 시험이다. 분리된 대조군 내에서 수집된 모든 이벤트를 무작위로 훈련 데이터 세트 및 시험 데이터 세트 내로 7:3 분할을 사용하여 분류하였다. 분류를 수행하기 위한 최적 파라미터를 찾기 위하여 하이퍼-파라미터 검색 알고리즘을 이용하여 SVM을 상기 훈련 데이터 세트에 기반하여 훈련시켰다. 그리드 알고리즘에서 시험된 하이퍼-파라미터들은 다음과 같다: 커널 유형(선형, rbf), 정규화 파라미터(C) 및 커널 계수(gamma). ROC 곡선의 곡선 아래 면적(roc_auc)은 각 하이퍼-파라미터 조합의 성능을 평가하는 데 사용되었다. 가장 높은 roc_auc 점수를 가진 모델은 다운-스트림 데이터 처리에 사용되었다. 최상의 파라미터 조합에 대하여, 시험 데이터로부터의 각 클래스에 대한 평균 정밀도 및 리콜을 계산하였다. 이어서 최적 파라미터가 있는 모델을 훈련 데이터 세트로 훈련시키고 시험 데이터 세트에 대하여 시험하였다. 시험 데이터 세트에 대한 정확도 예측을 생성하고 도 7에 도시하였다. 전체 세트의 정확도는 97.5%를 상회하였다.The next step in the method is model training and testing. All events collected within separate controls were randomly classified using a 7:3 split into the training data set and the test data set. In order to find optimal parameters for performing classification, an SVM was trained based on the training data set using a hyper-parameter search algorithm. The hyper-parameters tested in the grid algorithm are: kernel type (linear, rbf), normalization parameter (C) and kernel coefficient (gamma). The area under the curve (roc_auc) of the ROC curve was used to evaluate the performance of each hyper-parameter combination. The model with the highest roc_auc score was used for downstream data processing. For the best parameter combination, the mean precision and recall for each class from the test data were calculated. The model with optimal parameters was then trained on the training data set and tested on the test data set. Accuracy predictions for the test data set were generated and shown in FIG. 7 . The accuracy of the whole set exceeded 97.5%.
방법의 다음 단계는 데이터 보정이었다. 보정 비율을 생성하는 대조군 혼합물 데이터에 3 단계의 모델을 대조군 혼합물 데이터에 적용하여 보정을 수행할 수 있다. 그런 다음 보정 비율을 미공지 혼합물에 대한 각 예측량에 곱한다. 이것은 식 (1) 및 (2)의 파라미터 α를 곱하는 것과 같다. SVM 방법에서는 상기 모델을 대조군 혼합물에 적용하여 파라미터 α의 값이 생성되는 데 반해, (1) 및 (2)은 대조군 데이터 세트 Q 값들로부터 α의 직접 계산을 포함한다.The next step in the method was data calibration. Calibration can be performed by applying the three-step model to the control mixture data to the control mixture data generating the correction ratio. The correction factor is then multiplied by each predicted quantity for the unknown mixture. This is equivalent to multiplying the parameter α in equations (1) and (2). In the SVM method, values of the parameter α are generated by applying the model to a control mixture, whereas (1) and (2) involve the direct calculation of α from the control data set Q values.
표 5는 Q-검정법과 SVM-기반 방법의 GMO% 예측 비교를 보여준다.Table 5 shows a comparison of the GMO% prediction of the Q-test and the SVM-based method.
표 5. 단일 나노포어 GMO% 예측의 비교, Q-검정 및 SVM Table 5. Comparison of Single Nanopore GMO% Prediction, Q-Test and SVM
샘플들은 다음과 같이 분류되었다: a) SVM 예측이 더 정확하다(1, 5, 6, 8, 9, 16, 19, 20, 21), b) Q-검정 예측이 더 정확하다(3, 4, 7, 10, 11, 12, 14, 15, 17), 및 c) 두 방법이 정확도에서 동등하다(2, 3, 18, 22). 이들 22 개의 샘플에 대하여, 두 방법의 전반적인 성능은 대체로 동등하였으며, 각각은 9/22의 경우 서로를 능가하였다.SVM 방법의 값은 Q-검정법에 대한 요구사항을 적용할 수 있는, 명확한 기준이 없을 수 있는, 데이터세트에 적용하도록 자동화할 수 있는 것이다. 반면, Q-검정법은 계산이 더 간단하고, Q-검정 형식에서 잘-특성화된 기준을 활용할 수 있는 분포분율 적용에 더 적합할 수 있다.The samples were classified as follows: a) the SVM prediction is more accurate (1, 5, 6, 8, 9, 16, 19, 20, 21), b) the Q-test prediction is more accurate (3, 4) , 7, 10, 11, 12, 14, 15, 17), and c) both methods are equivalent in accuracy (2, 3, 18, 22). For these 22 samples, the overall performance of the two methods was roughly equivalent, and each outperformed the other for 9/22. The values of the SVM method have no clear criteria against which the requirements for the Q-test can be applied. Something that can be automated to apply to datasets that may not exist. On the other hand, the Q-test is simpler to calculate and may be more suitable for application of fractions of a distribution where well-characterized criteria can be utilized in the Q-test format.
실시예 3 - 고유의 페이로드가 있는 짧은 DNA(74 bp 참조, 94 bp 표적 전이 유전자)를 이용한 Q-검정 기반 FAExample 3 - Q-test based FA using short DNA with native payload (74 bp reference, 94 bp target transgene)
GMO%의 예측 적용의 맥락에서, 본 실시예에서는 표적 및 참조 dsDNA에 대하여 두 개의 비교 가능한 길이가 사용될 수 있음을 보여주고, 여기서 나노포어 이벤트 신호의 구별은 두 개의 별개의 서열-특이적 페이로드를 사용하여 달성된다.In the context of the predictive application of % GMO, this example shows that two comparable lengths can be used for target and reference dsDNA, where the distinction of nanopore event signals is two distinct sequence-specific payloads. is achieved using
방법: 검증된 qPCR 프라이머 세트(European Union Reference Laboratory for GM Food and Feed에서 공개적으로 이용 가능함)를 사용하여 94bp 전이 유전자-특이적 및 74bp 분류군-특이적 단편을 종래 및 전이유전자-포함 게놈 DNA 샘플의 혼합물로부터 증폭하였다. 나노포어 검출에 앞서, 이들 앰플리콘을 PEG 폴리머 프로브에 공유결합된 서열-특이적 올리고뉴클레오타이드 프로브(국제 특허출원 제 WO/2016/187159 호, "Methods and Compositions for Target Detection in a Nanopore Using a Labelled Polymer Scaffold", 전체 내용이 본 명세서에 참조로서 포함됨)와 혼성화하였다(Data Storage patent #5520281-v2-29517, 5/16/2016에 설명된 방법). 구체적으로, 전이 유전자-표적화 프로브를 4-암 40 kDa PEG에 연결하였고, 및 참조-표적화 프로브를 8-암 40 kDa PEG에 연결하였다. Methods: 94 bp transgene-specific and 74 bp taxa-specific fragments were synthesized from conventional and transgene-containing genomic DNA samples using a validated qPCR primer set (publicly available from the European Union Reference Laboratory for GM Food and Feed). amplified from the mixture. Prior to nanopore detection, these amplicons were combined with a sequence-specific oligonucleotide probe covalently linked to a PEG polymer probe (International Patent Application No. WO/2016/187159, "Methods and Compositions for Target Detection in a Nanopore Using a Labeled Polymer"). Scaffold", which is incorporated herein by reference in its entirety) (method described in Data Storage patent #5520281-v2-29517, 5/16/2016). Specifically, the transgene-targeting probe was ligated to the 4-
전체 이벤트 산점도의 대표적인 예로서, 도 8은 동일한 포어 상에서 분리된 대조군으로서 연속적으로 실행된 두 분자 유형에 대한 이벤트 플롯을 보여준다. 먼저, 96 bp DNA/프로브-페이로드 복합체를 포함하는 샘플을 제조하고 나노포어 장치에서 측정하였다. 복합체는 표적 서열을 포함하고 프로브-페이로드에 결합하는 단편에 대한 모델이다. 프로브-페이로드는 4-암 PEG 구조의 PNA-PEG이었다. 다음으로, 분포분율의 계산이 달성될 수 있는 상기 나노포어를 통한 전위 시의 특유의 이벤트 신호를 생성하도록 참조 서열을 포함하는 단편을 디자인하였다. 참조 분자는 PNA-PEG가 결합된 74 bp DNA이고, 이 때 PEG는 8-암 구조를 가지고 있다. 표적/프로브-페이로드 분자는 참조/프로브-페이로드 분자로부터 구분되는 특유의 이벤트 부분 집단을 생성하며, 둘 다 존재하는 경우 배경 이벤트와 구별되는 것이 중요하다.As a representative example of an overall event scatterplot, FIG. 8 shows event plots for two molecular types run serially as separate controls on the same pore. First, a sample containing 96 bp DNA/probe-payload complex was prepared and measured in a nanopore device. The complex is a model for a fragment comprising the target sequence and binding to the probe-payload. The probe-payload was PNA-PEG with a 4-arm PEG structure. Next, a fragment comprising a reference sequence was designed to generate a unique event signal upon translocation through the nanopore, from which calculation of the fraction of distribution could be achieved. The reference molecule is a 74 bp DNA bound to PNA-PEG, wherein PEG has an 8-arm structure. Target/probe-payload molecules create distinct event subpopulations that are distinct from reference/probe-payload molecules, and it is important to distinguish them from background events when both are present.
각 나노포어에 대한 프로토콜은 다음과 같다: a) 5 분 동안 100% 74 bp/페이로드-2 참조물, 이후 플러싱; b) 5 분 동안 100% p4 bp/페이로드-1 표적물, 이후 플러싱; c) 각 5 분 동안 1-4 개의 미공지 실행, 실행 중간에 플러싱; d) 대조군 혼합물 실행. 면적 기준을 사용하였고 Q ref 의 75∼99 번째 백분위에 걸쳐 있는 q-한계 범위가 구현되었고, 평균 을 예측된 GMO%로 보고하였다. 식 (2)에서, 1:1 대조군 혼합물을 표적 분석물과 참조 분석물 사이의 포획률 상수 차이에 대한 보상으로 사용하였다.The protocol for each nanopore is as follows: a) 100% 74 bp/payload-2 reference for 5 min, followed by flushing; b) 100% p4 bp/payload-1 target for 5 min followed by flushing; c) 1-4 unknown runs for each 5 min, flushing between runs; d) Running the control mixture. An area criterion was used and a q- limit range spanning the 75th to 99th percentile of Q ref was implemented, and the mean was reported as the predicted GMO%. In equation (2), a 1:1 control mixture was used as compensation for the difference in capture rate constants between the target and reference analytes.
위에 언급한 프로토콜에 따라 나노포어 세트 실험을 수행하였고, 각 혼합된 샘플을, 항상 다른 나노포어 상에서, 다른 실험자에 의해 또는 다른 날에 2-4 회 시험하였다. 나노포어 크기의 범위는 직경 25-35 nm이었다. 총 6 개의 혼합물 샘플(Sp1-Sp6)을 분석하였다. 표 6은 예측된 GMO% 예측값을 가장 작은 것에서 큰 것 순으로, 결합된 추정치를 보고한다. 보고된 평균 GMO% 값은 단일-나노포어 예측을 평균하여 계산한다. 각 평균 추정치의 불확실성은 95 번째 백분위 신뢰 구간으로 계산 및 기록되었다. 각 샘플에 대한 시험 횟수 및 각 샘플에 대한 참 GMO%가 또한 기록된다.Nanopore set experiments were performed according to the protocol mentioned above, and each mixed sample was tested 2-4 times, always on different nanopores, by different experimenters or on different days. The nanopore size ranged from 25-35 nm in diameter. A total of six mixture samples (Sp1-Sp6) were analyzed. Table 6 reports the combined estimates of the predicted % GMO predicted values, from smallest to largest. The reported average % GMO values are calculated by averaging single-nanopore predictions. The uncertainty of each mean estimate was calculated and recorded as the 95th percentile confidence interval. The number of tests for each sample and the % true GMO for each sample are also recorded.
표 6. 표적/참조의 구별을 위하여 별개의 페이로드를 이용한 결합된 GMO% 예측Table 6. Prediction of % bound GMO using separate payloads for target/reference discrimination
두 페이로드에 대한 예측 성능은 dsDNA 길이 판별(실시예 1, 2)을 사용할 때만큼 좋지 않은 것으로 보인다. 어느 경우이든, 모든 경우에서 정확도는 6%를 상회하며, 병렬로 분자 풀을 측정하는 더 많은 나노포어를 이용를 가지고, 결과 추정치를 결합하여 더 개선될 수 있다.The predictive performance for both payloads does not appear to be as good as when using dsDNA length discrimination (Examples 1 and 2). In either case, the accuracy is greater than 6% in all cases, and can be further improved by combining the resulting estimates with the use of more nanopores measuring the molecular pool in parallel.
실시예 4 - 짧은 DNA(89 bp)와 2 개의 고유 페이로드를 이용하여 야생형과 비교한 KRAS G12D SNP에 대한 Q-검정 및 SVM 방법Example 4 - Q-test and SVM method for KRAS G12D SNP compared to wild type using short DNA (89 bp) and two unique payloads
고도로 단편화된, 무세포, 순환 DNA로부터 인간 KRAS 유전자의 짧은(58 bp, 70 bp, 또는 89 bp) 단편을 증폭하기 위한 프라이머를 디자인하였다. (cfDNA 프라이머 서열은 KRAS G12D SNP 서열(CosmicID 521)의 어느 한 쪽에 어닐링되도록 디자인되었다. 혈장으로부터 얻은 무세포 순환 DNA 분획으로부터 앰플리콘을 생성하고 야생형 및 돌연변이 KRAS 대립 유전자 둘 다를 표적화하는 올리고뉴클레오타이드 프로브와 혼성화하고 PEG 고분자 페이로드와 공유결합시켰다: KRAS wt 대립 유전자(c.35G)를 표적화하는 프로브는 40kDa 8-암 또는 80kDa 2-분지 PEG 고분자에 연결하였고, G12D(c.35G->A) 대립 유전자를 표적화하는 프로브는 40kDa 3-분지 PEG 고분자에 연결하였다.Primers were designed to amplify short (58 bp, 70 bp, or 89 bp) fragments of the human KRAS gene from highly fragmented, cell-free, circulating DNA. (cfDNA primer sequences were designed to anneal to either side of the KRAS G12D SNP sequence (CosmicID 521). Amplicons were generated from cell-free circulating DNA fractions obtained from plasma and oligonucleotide probes targeting both wild-type and mutant KRAS alleles were used. Hybridized and covalently linked to a PEG polymer payload: a probe targeting the KRAS wt allele (c.35G) was ligated to a 40 kDa 8-arm or 80 kDa two-branched PEG polymer and a G12D (c.35G->A) allele The gene targeting probe was linked to a 40 kDa 3-branched PEG polymer.
도 9A는 중첩된 100% 표적 분석물 대조군 샘플(파란색 닫힌 원) 및 100% 참조 분석물 대조군 샘플(검은색 열린 사각형)에 대한 평균 δG 대 지속시간 대비의 대표적인 이벤트 플롯을 보여준다. 표적 분석물은 3-분지 PEG에 연결된 G12D-결합 프로브(이하, G12D-3bPEG)가 있는 89bp DNA이다. 참조 분자는 8-암 PEG에 연결된 야생형(c.35G)-결합 프로브(이하, WT-8armPEG)가 있는 89bp DNA이다. 두 대조군을 35 nm 직경의 나노포어를 이용하여 215 mV에서 연속적으로 실행하였다(1.0 M LiCl, 10 mM tris 1 mM EDTA). 시각적으로, 플롯은 표적 이벤트를 태그하기 위한 세 부등식을 기반으로 한 기준을 제안한다: 9A shows representative event plots of mean δG versus duration versus overlapped 100% target analyte control samples (closed blue circles) and 100% reference analyte control samples (open squares in black). The target analyte is 89 bp DNA with a G12D-binding probe (hereinafter, G12D-3bPEG) linked to a 3-branched PEG. The reference molecule is an 89 bp DNA with a wild-type (c.35G)-binding probe (hereinafter WT-8armPEG) linked to an 8-arm PEG. Both controls were run continuously at 215 mV using 35 nm diameter nanopores (1.0 M LiCl, 10 mM tris 1 mM EDTA). Visually, the plot suggests criteria based on three inequalities for tagging target events:
한계값 msec, nS 및 nS는 또한 도 9A에 도시된 표적 태그 상자(점선)를 생성한다. 명시된 한계값과 함께 상기 세 부등식의 기준을 사용하여, 분리된 대조군은 과 를 생성한다. 표적-페이로드 및 참조-페이로드 분자의 등몰 농도는 가 되었고, 대조군 혼합물로 사용되었다. 두 개의 후속 미공지 샘플, A 및 B는, , 를 등록하였다. 두 샘플은 도 9B에 도시된 대로, 이벤트 플롯에서 두 개의 분리된 대조군에서 중첩되었다. 시각적으로, 샘플 A가 샘플 B보다 높은 G12D 함량을 보이지만, 둘 다 100% WT 대조군의 위양성 비율 0.6%에 비해 양성이다. 식 (1)을 적용하고 보상에 대해 대조군 혼합물을 이용한 경우, 야생형에 대한 G12D 돌연변이의 예측 분율은 샘플 A 및 샘플 B에 대해 각각 F A * = 11.1±0.9%와 F B * = 6.0±0.7%이다.limit value msec, nS and nS also generates the target tag box (dashed line) shown in Figure 9A. Using the criteria of the three inequalities above with the specified limits, the isolated controls were class to create The equimolar concentrations of the target-payload and reference-payload molecules are and was used as a control mixture. Two subsequent unknown samples, A and B, were , was registered. The two samples were superimposed in two separate controls in the event plot, as shown in Figure 9B. Visually, sample A shows a higher G12D content than sample B, but both are positive compared to the 0.6% false positive rate of the 100% WT control. Applying Equation (1) and using the control mixture for reward, the predicted fractions of G12D mutations for wild-type were F A * = 11.1 ± 0.9% and F B * = 6.0 ± 0.7% for sample A and sample B, respectively. to be.
표 7은 제 1 열 및 제 2 열의 샘플 A 및 B에 대한 결과를 보여준다. 테스트한 모든 환자 샘플에 대한 결과도 보여준다. 총 5 개의 서로 다른 환자 샘플을 분석하였다. 샘플 C 및 C2는 동일한 환자 샘플의 서브샘플들이고; 샘플 D, D2 및 E, E2도 그러하다. 동일한 환자 샘플로부터 얻어진 다른 서브샘플들은, 고려된 세 가지 경우 모두에서, 서로 2% 범위 이내였다. 이는 다른 실험자들이 다른 나노포어 상에서, 그리고 두 경우는 다른 날에 각 나노포어 실험을 실행하하고 있음에도 불구한 것이다. 이는 재현 가능한 과정 및 정량적 분포 분율 방법을 제안한다.Table 7 shows the results for samples A and B in
표 7. Q-검정법을 이용한 혈액 샘플 내 예측된 G12D 돌연변이 분율Table 7. Predicted fraction of G12D mutations in blood samples using Q-test
이러한 샘플들에 대한 참 G12D 양은 알려져 있지 않다. 암 치료(화학 요법) 개시 후 수 주가 지난 후 환자로부터 샘플을 수집했고, 이후 각 환자 DNA를 서열 분석하였고 G12D 돌연변이에 대해 양성인 것으로 나타났다. 대조군 환자로부터의 비양성 대조군 샘플도 분석하였고, G12D의 예측 분율은 2% 이하였으며, 이는 전체 과정 위양성 비율이 2%임을 시사한다. 워크플로우의 추가 최적화는 검출 한계를 더 줄일 수 있다.The true G12D amount for these samples is unknown. Samples were collected from patients several weeks after initiation of cancer treatment (chemotherapy), after which each patient's DNA was sequenced and found to be positive for the G12D mutation. Non-positive control samples from control patients were also analyzed and the predicted fraction of G12D was less than 2%, suggesting an overall course false positive rate of 2%. Further optimization of the workflow can further reduce the detection limit.
비교를 위해 SVM 방법을 적용하였다. 하나의 대표적인 실험(표 1의 나노포어 NP4)를 사용하여, SVM 방법의 적용하기 위해 설명된 단계를 이용하여 데이터를 처리하였다. 중첩된 100% 참조 대조군 및 100% 표적 대조군에 대한 중앙값 δG 대 log10(지속시간)의 이벤트 산점도가 도 10에 도시된다. SVM-식별된 결정 경계도 도시된다. 샘플 C2 내의 예측된 G12D 분율은 Q-검정 및 SVM 방법 모두에 대해 표 8에 보고된다. 두 방법은 서로 5% 이내이다.For comparison, the SVM method was applied. Using one representative experiment (Nanopore NP4 in Table 1), data were processed using the steps described for application of the SVM method. Event scatter plots of median δG versus log 10 (duration) for overlapped 100% reference control and 100% target control are shown in FIG. 10 . SVM-identified decision boundaries are also shown. The predicted G12D fraction in sample C2 is reported in Table 8 for both Q-test and SVM methods. Both methods are within 5% of each other.
표 8. 최적화된 한계(q)를 결정하기 위한 Q-검정 및 SVM 방법을 사용한 예측된 G12D 분율Table 8. Predicted G12D fraction using Q-test and SVM method to determine the optimized limit (q)
실시예 5: 짧은 DNA(89 bp)와 2 개의 고유 페이로드를 이용한 야생형과 비교한 KRAS G12D SNP의 FA에 대한 EMGMExample 5: EMGM for FA of KRAS G12D SNP compared to wild-type using short DNA (89 bp) and two unique payloads
대표적인 데이터 세트에 대한 가우스 혼합 모델에 대한 기대 최대화 알고리즘(EMGM)에 대한 적용이 설명된다. 표적 및 참조는 실시예 4에서 설명한 바와 같이, 페이로드-결합 dsDNA 단편 내의 돌연변이 KRASG12D SNP 및 야생형 서열이다. 대표적인 작업 절차로서, 1:1 대조군 혼합물만을 측정하고 100% 참조 대조군만을 측정한 다음, 미공지 혼합물을 측정하였다.The application of the expectation maximization algorithm (EMGM) to a Gaussian mixture model on a representative data set is described. Targets and references are the mutant KRASG12D SNP and wild-type sequence in the payload-binding dsDNA fragment, as described in Example 4. As a representative working procedure, only the 1:1 control mixture was measured, only the 100% reference control was measured, and then the unknown mixture was measured.
단계 1: 50% 표적 & 50% 참조 혼합 샘플의 체류시간의 로그값(log(체류시간))과 중앙 진폭(medAmp)을 EMGM 알고리즘에 대한 입력 데이터로 사용하였다(도 11). 본 분석에 대한 사전 지식을 이용하여, 표적, 돌연변이 KRASG12D SNP의 초기 식별 예상 영역을 플롯에서 직사각형 영역으로 표시하였다. 상기 사전 지식은 별도의 실험에서 유사한 조건(동일한 완충액)에서 100% 표적 대조군을 시험하여 확립하였다. 상기 상자는 태그를 위해 사용되지 않는다. 오히려, EMGM가 대조군 혼합물에 적용된 후, 상기 상자 내의 가우스 혼합물과 관련된 모든 이벤트를 표적 이벤트로 태그하였다.Step 1: The logarithm (log (retention time)) and median amplitude (medAmp) of the retention times of the 50% target & 50% reference mixed samples were used as input data to the EMGM algorithm ( FIG. 11 ). Using prior knowledge of this analysis, the initially identified predicted region of the target, mutant KRASG12D SNP, was marked as a rectangular region in the plot. This prior knowledge was established by testing a 100% target control under similar conditions (same buffer) in a separate experiment. The box is not used for tags. Rather, after EMGM was applied to the control mixture, all events related to the Gaussian mixture in the box were tagged as target events.
단계 2: 집단에 기초하여, 3 가우스 혼합 모델을 이용하여 모델을 훈련시켰다. 이 모델은 하나의 클러스터(다이아몬드) 내 돌연변이(표적) 영역을 예측하였다. 다른 두 개의 클러스터(별 및 사각형)는 야생형에 해당한다(도 12). 초기 표적 도메인 상자(도 11) 내의 일부 이벤트는 EMGM 알고리즘에 의한 참조 모드와 관련된 것을 관찰하였다. 이것은 상자 자체가 참조 대 표적으로 태그되는 이벤트의 집단을 정의하는 Q-검정법과 다르다.Step 2: Based on the population, the model was trained using a 3 Gaussian mixture model. This model predicted the mutation (target) region within one cluster (diamond). The other two clusters (star and square) correspond to wild-type (Fig. 12). We observed that some events within the initial target domain box (Fig. 11) were related to the reference mode by the EMGM algorithm. This differs from the Q-test, where the box itself defines a population of events that are tagged as reference representatives.
단계 3: 100% 야생형(참조) 샘플에 상기 모델을 적용하였다. 전체 이벤트의 수에 대한 돌연변이(표적) 영역 내 이벤트 수의 비율은 위양성 분율을 설정하며(도 13), 이는 분포분율의 추정치를 개선하는 데 사용될 수 있다.Step 3: Apply the above model to 100% wild-type (reference) samples. The ratio of the number of events in the mutation (target) region to the number of total events establishes the false positive fraction (Figure 13), which can be used to improve the estimate of the fraction of distribution.
단계 4: 상기 모델을 이용하여 미지의 혼합 샘플을 예측하였다. 전체 이벤트의 수에 대한 돌연변이 영역 내 이벤트 수의 비율을 미공지 혼합물 내 돌연변이 분자의 백분율의 예측 변수로 사용하였다(도 14).Step 4: Predict an unknown mixed sample using the model. The ratio of the number of events in the mutation region to the total number of events was used as a predictor of the percentage of mutant molecules in the unknown mixture (Fig. 14).
위양성 보상에 의한 성능 향상의 테스트로서, 단계 3의 위양성 분율을 보정으로서 단계 4에서 계산된 분율에서 감산하였다. 나노포어 세트 실험에서 다수의 혼합물에 EMGM을 적용한 결과가 표 9에 보고되었다. EMGM 결과가 취합될 때까지 혼합물을 맹검 처리한 다음, 그 결과를 참 G12D 분포분율 값과 비교하였다.As a test of performance improvement by false-positive compensation, the false-positive fraction in
표 9. 위양성(FP) 보상 유무에 따른 EMGM을 비교한 예측된 G12D 분율Table 9. Predicted G12D fraction compared to EMGM with and without false positive (FP) reward
NP-a의 경우, 위양성 보상을 사용하여 20%의 경우에만 성능이 향상되었다. NP-b의 경우, 모든 경우에 성능이 향상되었다. NP-c의 경우에는 위양성 보상을 하지 않았으나, 성능은, 특히 50% 및 20% 추정치의 경우에 이미 양호하였다.요약하면, 분포분율 추정을 위해 미공지 혼합물에 EMGM 모델을 적용하기 전에, EMGM 방법을 적용하기 위해서 대조군 혼합물만이 필요하다.For NP-a, performance improved only in 20% of cases using false-positive compensation. For NP-b, the performance was improved in all cases. In the case of NP-c, there was no false-positive compensation, but the performance was already good, especially for the 50% and 20% estimates. In summary, before applying the EMGM model to the unknown mixture for estimating the fraction of distribution, the EMGM method Only the control mixture is needed to apply
기타 구현예Other implementations
사용된 단어들은 한정이 아니라 설명의 단어들이며, 더 넓은 측면에서 본 발명의 진정한 범위 및 정신을 벗어나지 않으면서 첨부된 청구범위의 범위 내에서 변경이 이루어질 수 있음을 이해해야 한다.It is to be understood that the words used are words of description rather than limitation, and that changes may be made within the scope of the appended claims without departing from the true scope and spirit of the invention in its broader aspects.
본 발명은 일부 기술된 구현예와 관련하여 어느 정도 자세히 및 어느 정도 구체적으로 설명되었지만, 그러한 특정 또는 구현예 또는 임의의 특정 구현예로 제한되어야 하는 것은 아니고, 종래기술의 관점에서 그러한 청구범위의 가능한 가장 넓은 해석을 제공하고, 따라서 본 발명의 의도된 범위를 효과적으로 포괄하기 위해, 첨부된 청구범위에 대한 참조로 해석되어야 한다.While this invention has been described in some detail and to some extent specific in connection with some described embodiments, it is not intended to be limited to that particular or embodiment or any particular embodiment, and in view of the prior art, the possible scope of such claims. In order to provide the broadest interpretation, and thus to effectively encompass the intended scope of the invention, it should be construed with reference to the appended claims.
본 명세서에서 언급된 모든 공개문헌, 특허 출원, 특허 및 기타 참조문헌은 그 전체 내용이 본 명세서에 참조로서 포함된다. 상충하는 경우, 정의를 포함한 본 명세서가, 우선한다. 또한, 섹션 제목, 물질, 방법, 및 실시예는 예시의 목적이며 제한하려는 의도가 아니다.All publications, patent applications, patents, and other references mentioned herein are incorporated herein by reference in their entirety. In case of conflict, the present specification, including definitions, will control. Also, section headings, materials, methods, and examples are for the purpose of illustration and are not intended to be limiting.
Claims (20)
하나 이상의 나노포어 장치 내에서 나노포어 세트에 전압을 가하여 검출 가능한 전자 신호(electronic signature)를 생성하고 표적 분석물 및 참조 분석물의 유닛을 포함하는 샘플의 일부에 대하여 상기 나노포어 세트를 통해 하전된 분석물의 전위를 유도하는 단계;
상기 나노포어 세트를 통해 상기 표적 분석물 및 참조 분석물의 유닛의 전위로부터 이벤트 신호(event signature) 세트를 생성하는 단계;
상기 이벤트 신호 세트로부터 상기 나노포어 세트에 대응하고 상기 표적 분석물의 분포분율과 관련되는 파라미터 세트를 생성하는 단계;
상응하는 한계 조건에 따라 상기 파라미터 세트 각각을 평가하여 검증된 파라미터 세트를 생성하는 단계로서, 상기 상응하는 한계 조건 각각은 상기 파라미터세트의 값에 걸쳐 결정된 가변성의 측정값의 함수에 기반하고, 상기 검증된 파라미터 세트를 생성하는 단계는 상기 상응하는 한계 조건을 만족하는 파라미터 값을 유지하는 것을 포함하는 단계;
상기 검증된 파라미터 세트의 값을 파라미터 조합 연산으로 조합하는 단계; 및
상기 파라미터 조합 연산의 출력에 근거하여 상기 표적 분석물의 분포분율의 추정치를 반환하는 단계
를 포함하는 방법.
A method of determining an estimate of the fraction of distribution of a target analyte using one or more nanopore devices, the method comprising:
Applying a voltage to a set of nanopores within one or more nanopore devices to generate a detectable electronic signature and to analyze a portion of a sample comprising units of a target analyte and a reference analyte charged through the set of nanopores. inducing a potential of water;
generating a set of event signatures from the translocation of units of the target analyte and a reference analyte through the set of nanopores;
generating, from the set of event signals, a set of parameters corresponding to the set of nanopores and related to the distribution fraction of the target analyte;
evaluating each of the parameter sets according to corresponding limit conditions to produce a validated parameter set, each of the corresponding limiting conditions being based on a function of a measure of variability determined over values of the parameter set, the validation generating the specified parameter set includes maintaining parameter values that satisfy the corresponding limit condition;
combining the values of the verified parameter sets by a parameter combination operation; and
returning an estimate of the distribution fraction of the target analyte based on an output of the parameter combination operation;
How to include.
The method of claim 1 , wherein the event signal in the set of event signals comprises a current induced and measured by the potential of one of a target analyte and a reference analyte through the nanopores in the set of nanopores.
The method of claim 1 , wherein the measure of variability is at least one of a quartile range, standard deviation, and variance determined over the values of the set of parameters, and wherein a function of the measure of variability includes a constant in the measure of variability. How to include multiplication.
2. The method of claim 1, wherein the corresponding limit condition against which at least one of the parameter sets is evaluated comprises a difference between a maximum value and a minimum value of a parameter in the parameter set.
2. The method of claim 1, wherein combining the values of the verified parameter sets with a parameter combination operation comprises determining a weighted average of values of the verified parameter sets, wherein the weights for the values of the verified parameter sets are: a method determined based on the satisfaction level of the corresponding limit condition for each of the set of verified parameters.
The method of claim 1 , wherein generating the parameter set comprises excluding from consideration data from nanopores in the set of nanopores based on an assessment of the quality of data from the nanopores.
7. The method of claim 6, wherein the quality assessment comprises a first assessment characterizing a morphological feature of each nanopore, a second assessment characterizing a rate of change of a morphological feature of each nanopore, and a signal noise associated with each nanopore. A method comprising at least one of a third evaluation that characterizes.
7. The method of claim 6, wherein the quality assessment comprises a first operation of filtering nanopore data based on noise observed with respect to each nanopore, and a second operation of filtering nanopore data based on separation of a sample population in the sample. A method comprising: an operation; and a third operation of determining a calibration ratio of a population of samples in the sample.
9. The method of claim 8, wherein the first task defines a target area boundary that separates a subset of noise events from a subset of real events within the nanopore data, and, for each set of nanopores, the A method for determining a noise ratio based on a subset and a subset of the actual events.
9. The method of claim 8, wherein the second task implements a principal component analysis (PCA) task on at least one of a dwell time and an amplitude of an electrical signal output, and wherein the first component of the PCA task is used to determine between a sample population of the samples. A method for determining a measure of separation.
The method of claim 1 , wherein the target analyte is associated with a genetically modified organism.
샘플로부터 물질을 전위시키기 위한 나노포어 세트를 포함하는 하나 이상의 나노포어 장치;
상기 나노포어 세트와 연결된 전극 세트를 포함하는 전기 시스템; 및
다음 사항에 대한 설명서를 저장하는 비일시적 컴퓨터 판독 가능 메모리를 포함하는 계산 시스템을 포함하는 시스템:
상기 나노포어 세트에 전압을 가하여 검출 가능한 전자 신호(electronic signature)를 생성하고 상기 표적 분석물 및 상기 참조 분석물의 유닛을 포함하는 상기 샘플의 일부에 대하여 상기 나노포어 세트를 통해 하전된 분석물의 전위를 유도하는 단계;
상기 나노포어 세트를 통해 상기 표적 분석물 및 참조 분석물의 유닛의 전위로부터 이벤트 신호(event signature) 세트를 생성하는 단계;
상기 이벤트 신호 세트로부터 상기 나노포어 세트에 대응하고 상기 표적 분석물의 분포분율과 관련되는 파라미터 세트를 생성하는 단계;
상응하는 한계 조건에 따라 상기 파라미터 세트 각각을 평가하여 검증된 파라미터 세트를 생성하는 단계로서, 상기 상응하는 한계 조건 각각은 상기 파라미터 세트의 값에 걸쳐 결정된 가변성의 측정값의 함수에 기반하고, 상기 검증된 파라미터 세트를 생성하는 단계는 상기 상응하는 한계 조건을 만족하는 파라미터 값을 유지하는 것을 포함하는 단계;
상기 검증된 파라미터 세트의 값을 파라미터 조합 연산으로 조합하는 단계; 및
상기 파라미터 조합 연산의 출력에 근거하여 상기 표적 분석물의 분포분율의 추정치를 반환하는 단계.
A system for determining an estimate of the fraction of distribution of a target analyte, comprising:
one or more nanopore devices comprising a set of nanopores for displacing material from the sample;
an electrical system comprising a set of electrodes connected to the set of nanopores; and
A system comprising a computing system comprising a non-transitory computer readable memory storing instructions for:
A voltage is applied to the set of nanopores to generate a detectable electronic signature and the potential of a charged analyte through the set of nanopores relative to a portion of the sample comprising units of the target analyte and the reference analyte. inducing;
generating a set of event signatures from the translocation of units of the target analyte and a reference analyte through the set of nanopores;
generating, from the set of event signals, a set of parameters corresponding to the set of nanopores and related to the distribution fraction of the target analyte;
evaluating each of the parameter sets according to corresponding limit conditions to produce a validated parameter set, each of the corresponding limiting conditions being based on a function of a measure of variability determined over values of the parameter set, the validation generating the specified parameter set includes maintaining parameter values that satisfy the corresponding limit condition;
combining the values of the verified parameter sets by a parameter combination operation; and
returning an estimate of the distribution fraction of the target analyte based on an output of the parameter combination operation.
13. The method of claim 12, wherein the measure of variability is at least one of a quartile range, a standard deviation, and a variance determined over values of the set of parameters, and wherein a function of the measure of variability gives a constant to the measure of variability. A system involving multiplication.
13. The system of claim 12, wherein the calculation system comprises a memory storing instructions for determining a difference between a maximum and a minimum value of a parameter in the parameter set, wherein the corresponding limit condition to which at least one of the parameter sets is evaluated is A system that is the difference between the maximum and minimum values of a parameter in the parameter set.
13. The method of claim 12, wherein the calculation system comprises a memory for storing instructions for determining a weighted average of values of the set of verified parameters, wherein the weights for the values of the set of verified parameters are determined for each of the sets of verified parameters. a system determined based on the satisfaction level of the corresponding limit condition for .
13. The system of claim 12, wherein said target analyte is associated with a genetically modified organism.
13. The system of claim 12, wherein the computational system includes a memory for storing instructions for discarding parameter values based on a quality assessment from each nanopore from which the parameter originated.
18. The method of claim 17, wherein the quality assessment characterizes a first assessment characterizing a morphological characteristic of each nanopore, a second assessment characterizing a rate of change of a morphological characteristic of each nanopore, and a signal noise associated with each nanopore. A system comprising at least one of a third rating to build.
18. The method of claim 17, wherein the quality assessment defines a target area boundary that separates a subset of noise events from a subset of real events within the nanopore data, and, for each set of nanopores, a subset of the noise events. and determining a noise ratio based on a set and a subset of the actual events.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2019/028518 WO2020219011A1 (en) | 2019-04-22 | 2019-04-22 | Multipore determination of fractional abundance of polynucleotide sequences in a sample |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220011639A true KR20220011639A (en) | 2022-01-28 |
Family
ID=72940971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217038017A KR20220011639A (en) | 2019-04-22 | 2019-04-22 | Multipore Determination of the Distribution Fraction of a Polynucleotide Sequence in a Sample |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3959331A1 (en) |
JP (1) | JP2022530016A (en) |
KR (1) | KR20220011639A (en) |
CN (1) | CN113966403A (en) |
WO (1) | WO2020219011A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114942402B (en) * | 2022-07-20 | 2022-11-29 | 武汉格蓝若智能技术有限公司 | Abnormal electric energy meter positioning method and system |
WO2024138465A1 (en) * | 2022-12-28 | 2024-07-04 | 深圳华大生命科学研究院 | Biological sample quantification method, apparatus, device, and medium |
CN116127288B (en) * | 2023-04-14 | 2023-09-15 | 南京邮电大学 | Nanopore sensing signal noise removing method and device based on independent component analysis |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5646987B2 (en) * | 2007-04-04 | 2014-12-24 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Compositions, devices, systems, and methods for using nanopores |
AU2010326349B2 (en) * | 2009-12-01 | 2015-10-29 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
KR20190127983A (en) * | 2015-02-02 | 2019-11-13 | 투 포어 가이즈, 인코포레이티드 | Nanopore detection of target polynucleotides from sample background |
US10102338B2 (en) * | 2015-09-24 | 2018-10-16 | Genia Technologies, Inc. | Adaptive compression and modification of nanopore measurement data |
EP3440456B1 (en) * | 2016-10-24 | 2020-12-23 | Ontera Inc. | Fractional abundance of polynucleotide sequences in a sample |
-
2019
- 2019-04-22 KR KR1020217038017A patent/KR20220011639A/en unknown
- 2019-04-22 WO PCT/US2019/028518 patent/WO2020219011A1/en unknown
- 2019-04-22 CN CN201980097297.9A patent/CN113966403A/en active Pending
- 2019-04-22 EP EP19925663.7A patent/EP3959331A1/en not_active Withdrawn
- 2019-04-22 JP JP2021562858A patent/JP2022530016A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN113966403A (en) | 2022-01-21 |
EP3959331A1 (en) | 2022-03-02 |
WO2020219011A1 (en) | 2020-10-29 |
JP2022530016A (en) | 2022-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102137178B1 (en) | Distribution fraction of the polynucleotide sequence in the sample | |
Forstater et al. | MOSAIC: a modular single-molecule analysis interface for decoding multistate nanopore data | |
Charron et al. | Precise DNA concentration measurements with nanopores by controlled counting | |
US11486873B2 (en) | Multipore determination of fractional abundance of polynucleotide sequences in a sample | |
KR20220011639A (en) | Multipore Determination of the Distribution Fraction of a Polynucleotide Sequence in a Sample | |
JP2017532049A (en) | Polymer analysis | |
CN109923613B (en) | Method for detecting target analyte in sample using signal variation data set | |
JP2018525703A5 (en) | ||
CN111868832A (en) | Method for identifying copy number abnormality | |
EP3411819A1 (en) | Method for reducing noise level of data set for a target analyte | |
JP2019507863A (en) | Detection of analytes in blinking and fluorescence reactions | |
EP3266880A1 (en) | Method for real-time quantification of nucleic acid | |
WO2022061307A1 (en) | Methods for accurate and reproducible detection and quantification of target polynucleotides using a nanopore device | |
Karau | DNA labels for improved detection and capture with solid-state nanopores | |
JP2006163720A (en) | Method and apparatus for displaying gene information | |
US20210180120A1 (en) | Devices and method for detecting an amplification event | |
Angevine | Nanopore thermodynamics via infrared laser heating | |
US9817943B2 (en) | Cumulative differential chemical assay identification |