JP2022534920A - Sequencing by appearance - Google Patents

Sequencing by appearance Download PDF

Info

Publication number
JP2022534920A
JP2022534920A JP2021570322A JP2021570322A JP2022534920A JP 2022534920 A JP2022534920 A JP 2022534920A JP 2021570322 A JP2021570322 A JP 2021570322A JP 2021570322 A JP2021570322 A JP 2021570322A JP 2022534920 A JP2022534920 A JP 2022534920A
Authority
JP
Japan
Prior art keywords
oligonucleotide probe
nucleic acid
probe species
species
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021570322A
Other languages
Japanese (ja)
Other versions
JPWO2020243187A5 (en
Inventor
ミール,カリム
Original Assignee
エックスゲノムズ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/425,929 external-priority patent/US11427867B2/en
Application filed by エックスゲノムズ コーポレーション filed Critical エックスゲノムズ コーポレーション
Publication of JP2022534920A publication Critical patent/JP2022534920A/en
Publication of JPWO2020243187A5 publication Critical patent/JPWO2020243187A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/113Nucleic acid detection characterized by the use of physical, structural and functional properties the label being electroactive, e.g. redox labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本発明は、ポリマーを配列決定する方法であり、1つ以上のポリマーの配列が、ポリマーへの分子プローブのレパートリーの結合相互作用の出現特性により決定される。The present invention is a method of sequencing a polymer, wherein the sequence of one or more polymers is determined by the emergence properties of binding interactions of a repertoire of molecular probes to the polymer.

Description

関連出願の相互参照
本出願は、2018年11月29日に出願された「Sequencing by Emergence」と題する米国特許出願第16/205,155号の一部継続であり、2017年11月29日に出願された「Sequencing by Emergence」と題する米国特許出願第62/591,850号の優先権を主張し、参照により本明細書に援用される。
CROSS-REFERENCE TO RELATED APPLICATIONS This application is a continuation-in-part of U.S. patent application Ser. No. 62/591,850, filed and entitled "Sequencing by Emergence," is hereby incorporated by reference.

本開示は、概して、1つ以上のポリヌクレオチドへのプローブの一過的な結合を介して核酸を配列決定するためのシステムおよび方法に関する。 The present disclosure relates generally to systems and methods for sequencing nucleic acids through transient binding of probes to one or more polynucleotides.

DNA配列決定は、最初に、ゲル電気泳動ベースの方法で実現した:ジデオキシ鎖終結法(例えば、Sanger et al.,Proc.Natl.Acad.Sci.74:5463-5467,1977)、および化学分解法(例えば、Maxam et al.,Proc.Natl.Acad.Sci.74:560-564,1977)。これらのヌクレオチドの配列決定方法は、時間と費用の両方がかかっていた。それにもかかわらず、前者は10年以上および数億ドルを要したにもかかわらず、初めてヒトゲノムの配列決定につながった。 DNA sequencing was first achieved with gel electrophoresis-based methods: the dideoxy chain termination method (eg, Sanger et al., Proc. Natl. Acad. Sci. 74:5463-5467, 1977), and chemical digestion. methods (eg, Maxam et al., Proc. Natl. Acad. Sci. 74:560-564, 1977). These nucleotide sequencing methods were both time consuming and expensive. Nevertheless, the former led to the sequencing of the human genome for the first time, albeit over ten years and hundreds of millions of dollars.

個別化医療の夢がますます実現に近づくにつれて、個々のヒトゲノムを配列決定するための安価で大規模な方法の必要性が高まっている(Mir,Sequencing Genomes:From Individuals to Populations,Briefings in Functional Genomics and Proteomics,8:367-378,2009)。ゲル電気泳動を回避するいくつかの配列決定方法(その後、より低コストである)が、「次世代配列決定」として開発された。(Illumina Inc.によって実施されているように)可逆的ターミネーターを使用した、そのような1つの配列決定方法が主流である。サンガー配列決定の最も進化した形態で使用される検出方法および現在主流のイルミナ技術は、蛍光を伴う。単一ヌクレオチド挿入を検出する他の可能な手段としては、プロトン放出を使用した検出(例えば、電界効果トランジスタ、ナノポアを通るイオン電流、および電子顕微鏡を介した検出)が挙げられる。Illuminaの化学は、蛍光標識が付いた可逆的ターミネーター(Canard et al.,Metzker Nucleic Acids Research 22:4259-4267,1994)を使用した、ヌクレオチドの周期的付加を伴う(Bentley et al.,Nature 456:53-59,2008)。Illumina配列決定は、単一ゲノム分子をクローン増幅することから始まり、標的ゲノムをライブラリに変換し、次いでクラスターとしてクローン増幅するために、実質的な事前の試料処理が必要である。 As the dream of personalized medicine moves ever closer to becoming a reality, there is a growing need for inexpensive, large-scale methods to sequence individual human genomes (Mir, Sequencing Genomes: From Individuals to Populations, Briefings in Functional Genomics). and Proteomics, 8:367-378, 2009). Some sequencing methods that bypass gel electrophoresis (and are subsequently less costly) were developed as 'next generation sequencing'. One such sequencing method predominates, using reversible terminators (as practiced by Illumina Inc.). The detection methods used in the most advanced forms of Sanger sequencing and the current predominant Illumina technology involve fluorescence. Other possible means of detecting single nucleotide insertions include detection using proton emission (eg, field effect transistors, ionic currents through nanopores, and detection via electron microscopy). Illumina's chemistry involves the cyclic addition of nucleotides (Bentley et al., Nature 456 : 53-59, 2008). Illumina sequencing begins with clonally amplifying single genome molecules and requires substantial prior sample processing to convert the target genome into a library and then clonally amplify as clusters.

しかしながら、配列決定前の増幅の必要性を回避するいくつかの方法が、その後市場に出回っている。どちらの新たな方法も、DNAの単一分子上で、合成による蛍光配列決定(SbS)を行う。第1の方法、HelicosBio(現在のSeqLL)からの方法は、可逆的終結を伴う段階的SbSを行う(Harris et al.,Science,320:106-9,2008)。第2の方法、Pacific BiosciencesからのSMRT配列決定は、ヌクレオチドを組み込んだ反応の天然の脱離基である末端リン酸上の標識を使用し、試薬の交換を必要とせずに連続的に配列決定を行うことを可能にする(例えば、Levene et al.,Science 299:682-686,2003およびEid et al.,Science,323:133-8,2009)。Pacific Bioscience配列決定にやや類似したアプローチは、Genia(現在はRocheの一部)によって開発されている方法であり、光学的方法ではなく、ナノポアを介してSbSを検出することによる。 However, several methods have since hit the market that circumvent the need for amplification prior to sequencing. Both new methods perform fluorescent sequencing-by-synthesis (SbS) on a single molecule of DNA. The first method, from HelicosBio (now SeqLL), performs stepwise SbS with reversible termination (Harris et al., Science, 320:106-9, 2008). The second method, SMRT sequencing from Pacific Biosciences, uses a label on the terminal phosphate, the natural leaving group of reactions incorporating nucleotides, to continuously sequence without the need for reagent exchange. (eg Levene et al., Science 299:682-686, 2003 and Eid et al., Science, 323:133-8, 2009). A somewhat analogous approach to Pacific Bioscience sequencing is the method being developed by Genia (now part of Roche), by detecting SbS through nanopores rather than optical methods.

最も一般的に使用されている配列決定方法は、リード長(read length)が制限されており、これにより、配列決定のコストと得られたリード(read)のアセンブリの困難性の両方が増加する。サンガー配列決定によって得られたリード長は、1000塩基範囲内である(例えば、Kchouk et al.,Biol.Med.9:395,2017)。Roche454配列決定およびIon Torrentはともに、数百塩基範囲のリード長を有する。当初、約25塩基のリードで始まったIllumina配列決定は、現在、典型的には、150~300塩基対リードである。しかし、新鮮な試薬が、リード長の各塩基に対して供給される必要があるため、25ではなく250塩基を配列決定するには、10倍の時間および10倍の高価な試薬が必要である。市販のシステムで可能な最長のリード長は、Oxford Nanopores Technology(ONT)およびPacific Bioscience(PacBio)のナノポア鎖配列決定によって得られている(例えば、Kchouk et al.,Biol.Med.9:395,2017)。後者は、通常、平均約10,000塩基長のリードを有するが、前者は、ごく稀に、数百キロ塩基長のリードを得ることができる(例えば、Laver et al.,Biomol.Det.Quant.3:1-8,2015)。 Most commonly used sequencing methods are limited in read length, which increases both the cost of sequencing and the difficulty of assembling the resulting reads. . Read lengths obtained by Sanger sequencing are in the 1000 base range (eg Kchouk et al., Biol. Med. 9:395, 2017). Both Roche 454 sequencing and Ion Torrent have read lengths in the hundreds of bases range. Illumina sequencing, which originally started with reads of about 25 bases, now typically has 150-300 base pair reads. However, because fresh reagents must be supplied for each base in the read length, sequencing 250 bases instead of 25 requires 10 times the time and 10 times the expensive reagents. . The longest read lengths possible with commercial systems have been obtained by nanopore chain sequencing at Oxford Nanopores Technology (ONT) and Pacific Bioscience (PacBio) (e.g., Kchouk et al., Biol. Med. 9:395, 2017). The latter usually have reads on average about 10,000 bases long, while the former can very rarely obtain reads several hundred kilobases long (see, for example, Laver et al., Biomol. Det. Quant .3:1-8, 2015).

ONTおよびPacBioの配列決定の他に、配列決定技術自体ではないが、試料調製のアプローチである、いくつかのアプローチが存在し、Illuminaショートリード配列決定技術を補完して、より長いリードを構築するための足掛かりを提供する。これらのうちの1つは、10×Genomicsによって開発された液滴ベースの技術であり、液滴内の100~200kbの断片(例えば、抽出後の平均の断片長の範囲)を単離し、それらをより短い長さの断片のライブラリに処理し、その各々が、それらが由来する100~200kbに特異的な配列識別タグを含み、複数の液滴からのゲノムの配列決定時に、約50~200Kbのバケットに逆畳み込みを行う(deconvolve)ことができる(Goodwin et al.,Nat.Rev.Genetics 17:333-351,2016)。別のアプローチが、Bionano Genomicsによって開発されており、ニッキングエンドヌクレアーゼへの曝露を介してDNAを伸長し、ニックを誘導する。この方法は、ニッキングのポイントを蛍光検出して、分子のマップまたはスカフォールドを提供する。この方法は現在、ゲノムをアセンブリするのに十分に高い密度を有するようには開発されていないが、それにもかかわらず、ゲノムの直接可視化を提供し、大きな構造多型を検出し、長距離ハプロタイプを決定することができる。 In addition to ONT and PacBio sequencing, there are several approaches that are not sequencing technologies per se, but sample preparation approaches that complement the Illumina short-read sequencing technology to build longer reads. provide a stepping stone for One of these is a droplet-based technique developed by 10x Genomics, which isolates 100-200 kb fragments (e.g., average fragment length range after extraction) within droplets and were processed into a library of shorter length fragments, each containing a sequence identification tag specific to the 100-200 kb from which they were derived, approximately 50-200 Kb when sequencing the genome from multiple droplets. (Goodwin et al., Nat. Rev. Genetics 17:333-351, 2016). Another approach, developed by Bionano Genomics, elongates the DNA and induces nicking through exposure to nicking endonucleases. This method provides a molecular map or scaffold by fluorescence detection of the nicking points. Although this method has not currently been developed to have a high enough density to assemble genomes, it nonetheless provides direct visualization of genomes, detects large structural variants and long-range haplotypes. can be determined.

異なる配列決定方法が開発され、配列決定のコストが概して減少する傾向にあるにもかかわらず、ヒトゲノムのサイズは、患者に対して高い配列決定コストを引き続きもたらしている。個々のヒトゲノムは、46本の染色体に組織化され、そのうち最も短いものは約50メガ塩基であり、最も長いものは250メガ塩基である。NGS配列決定方法は、依然として、性能に影響を及ぼす多くの問題を有し、分析に必要な時間を実質的に増加させ得る参照ゲノムへの依存性が含まれる(例えば、Kulkarni et al.,Comput Struct Biotechnol J.15:471-477,2017で議論されている)。 Despite the development of different sequencing methods and the general trend towards decreasing sequencing costs, the size of the human genome continues to result in high sequencing costs for patients. The individual human genome is organized into 46 chromosomes, the shortest of which is approximately 50 megabases and the longest of which is 250 megabases. NGS sequencing methods still have a number of issues that affect performance, including reliance on reference genomes that can substantially increase the time required for analysis (e.g., Kulkarni et al., Comput Struct Biotechnol J. 15:471-477, 2017).

上記の背景を考慮すると、当該技術分野で必要とされているものは、試薬および時間の使用において効率的であり、かつ正確度を損なうことなく長いハプロタイプ解像リード(haplotype-resolved reads)を提供する、スタンドアロンの配列決定技術を提供するためのデバイス、システムおよび方法である。 Given the above background, what is needed in the art is to be efficient in the use of reagents and time, and to provide long haplotype-resolved reads without compromising accuracy. Devices, systems and methods for providing stand-alone sequencing technology for

この背景セクションで開示される情報は、一般的な背景の理解を高めるためにすぎず、この情報が、当業者に既知の従来技術を形成することの承認またはいかなる形態の示唆として解釈されるべきではない。 The information disclosed in this background section is merely to enhance the understanding of the general background and should not be construed as an acknowledgment or any form of suggestion that this information constitutes prior art known to those skilled in the art. is not.

本開示は、改善された核酸配列決定技術を提供するためのデバイス、システム、および方法に対する当該技術分野の必要性に対処する。広範な一態様では、本開示は、分子プローブを、1つ以上の単位の二本鎖標的分子に結合させることによって、少なくとも1つの単位の多単位標的分子を識別する方法を含む。本開示は、1つ以上の種類の分子プローブと二本鎖標的分子との単一分子相互作用の検出に基づく。一部の実施形態では、プローブは、少なくとも1単位の標的分子にと一過的に結合する。一部の実施形態では、プローブは、少なくとも1単位の標的分子へと反復的に結合する。一部の実施形態では、分子実体は、高分子、表面またはマトリックス上で、ナノメトリック正確度まで位置決定される。 The present disclosure addresses the need in the art for devices, systems and methods to provide improved nucleic acid sequencing technology. In one broad aspect, the present disclosure includes a method of identifying at least one unit of a multiunit target molecule by binding a molecular probe to one or more units of a double-stranded target molecule. The present disclosure is based on the detection of single-molecule interactions between one or more types of molecular probes and double-stranded target molecules. In some embodiments, the probe transiently binds at least one unit of the target molecule. In some embodiments, the probe repeatedly binds to at least one unit of the target molecule. In some embodiments, molecular entities are positioned to nanometric accuracy on macromolecules, surfaces or matrices.

一態様では、核酸を配列決定する方法が提供される。本方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露すること、によって進行する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、1つの定義されたヌクレオチドおよび1つ以上の縮重位置(degenerate position)を含む。各定義されたヌクレオチドは、A、C、G、Tの塩基のセットから選択される。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体(universal base analogs)の混合物のいずれかを含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例(instance)を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって進行する。試験基板上のそれぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって継続する。 In one aspect, a method of sequencing a nucleic acid is provided. The method includes (a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid. The method proceeds by (b) exposing the fixed elongated/extended nucleic acid to each oligonucleotide probe species of the set of oligonucleotide probe species. Each oligonucleotide probe species in the set of oligonucleotide probe species is a library of probe species of a given length, containing one defined nucleotide and one or more degenerate positions. Each defined nucleotide is selected from the set of A, C, G, T bases. Each degenerate position contains either an A, C, G, T base or a mixture of universal base analogs. Exposure (b) is the transient and reversible binding of individual probes of each oligonucleotide probe species to one or more portions of the immobilized nucleic acid that are complementary to the respective oligonucleotide probe species. , thereby giving rise to each instance of optical activity. The method proceeds by (c) using an imaging device to measure the location on the test substrate of each respective instance of optical activity that occurs during or after exposure (b). The method repeats exposing (b) and measuring (c) for each oligonucleotide probe species in (d) the set of oligonucleotide probe species, thereby generating a plurality of sets of locations on the test substrate. Proceed by acquiring. Each set of locations on the test substrate corresponds to an oligonucleotide probe species in the set of oligonucleotide probe species. The method continues by (e) sequencing at least a portion of the nucleic acid from the plurality of sets of locations on the test substrate by compiling locations on the test substrate represented by the plurality of sets of locations. .

本開示の別の態様では、核酸を配列決定する方法が提供される。この追加の方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することによって継続する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含む。各定義されたヌクレオチド位置は、A、C、G、Tの塩基を含む。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体(universal base analogs)の混合物のいずれかを含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例(instance)を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって終了する。 In another aspect of the disclosure, a method of sequencing nucleic acid is provided. This additional method includes (a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid. The method continues by (b) exposing the fixed extended/extended nucleic acid to each oligonucleotide probe species of the set of oligonucleotide probe species. Each oligonucleotide probe species in the set of oligonucleotide probe species is a library of probe species of a given length, containing two or more defined nucleotide positions and one or more degenerate positions. Each defined nucleotide position includes A, C, G, T bases. Each degenerate position contains either an A, C, G, T base or a mixture of universal base analogs. Exposure (b) is the transient and reversible binding of individual probes of each oligonucleotide probe species to one or more portions of the immobilized nucleic acid that are complementary to the respective oligonucleotide probe species. , thereby giving rise to each instance of optical activity. The method proceeds by (c) using an imaging device to measure the location on the test substrate of each respective instance of optical activity that occurs during or after exposure (b). The method repeats exposing (b) and measuring (c) for each oligonucleotide probe species in (d) the set of oligonucleotide probe species, thereby generating a plurality of sets of locations on the test substrate. Continue by getting. Each respective set of locations on the test substrate corresponds to an oligonucleotide probe species in the set of oligonucleotide probe species. The method concludes by (e) sequencing at least a portion of the nucleic acid from the set of locations on the test substrate by compiling locations on the test substrate represented by the set of locations. .

本開示の別の態様では、核酸を配列決定する方法が提供される。この追加の方法は、(a)核酸を試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することを含む。本方法は、(b)固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することによって進行する。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の長さのプローブ種のライブラリであり、2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含む。各定義されたヌクレオチド位置は、A、C、G、Tの塩基のセットのうちの1つを含む。各縮重位置は、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含む。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の1つ以上の部分に安定して結合することを可能にする条件下で行われ、それによって、照射時に、固定された核酸の1つ以上の部分に対応する基板上の1つ以上の場所で、光学活性のそれぞれの事例を生じさせる。本方法は、(c)撮像デバイスを使用して光学活性の事例の段階的な損失が測定/記録されるように、光学活性の事例を退色させることによって進行する。本方法は、(d)固定され伸長/伸展された核酸を、結合したオリゴヌクレオチドプローブが解離することを可能にする条件に曝露し、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(d)単一分子位置決定アルゴリズムを使用して、光学活性の各事例のナノメトリックな/微調整された場所を計算し、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって進行する。 In another aspect of the disclosure, a method of sequencing nucleic acid is provided. This additional method includes (a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid. The method proceeds by (b) exposing the fixed extended/extended nucleic acid to each oligonucleotide probe species of the set of oligonucleotide probe species. Each oligonucleotide probe species in the set of oligonucleotide probe species is a library of probe species of a given length, containing two or more defined nucleotide positions and one or more degenerate positions. Each defined nucleotide position contains one of the set of A, C, G, T bases. Each degenerate position contains a mixture of A, C, G, T bases or any of the universal base analogues. Exposure (b) allows the individual probes of each oligonucleotide probe species to stably bind to one or more portions of the immobilized nucleic acid that are complementary to the respective oligonucleotide probe species. conditions whereby, upon irradiation, each instance of optical activity is produced at one or more locations on the substrate corresponding to one or more portions of the immobilized nucleic acid. The method proceeds by (c) bleaching the optically active instances such that the gradual loss of the optically active instances is measured/recorded using an imaging device. The method includes (d) exposing the fixed and elongated/extended nucleic acid to conditions that allow the bound oligonucleotide probes to dissociate, and for each oligonucleotide probe species in the set of oligonucleotide probe species: continue by repeating exposing (b) and measuring (c), thereby acquiring a plurality of sets of positions on the test substrate. Each respective set of locations on the test substrate corresponds to an oligonucleotide probe species in the set of oligonucleotide probe species. The method uses (d) a single-molecule localization algorithm to calculate the nanometric/fine-tuned location of each instance of optical activity; By compiling the locations on the substrate, one proceeds by sequencing at least a portion of the nucleic acid from the set of multiple locations on the test substrate.

本開示の別の態様は、核酸を配列決定する方法を提供する。本方法は、(a)核酸を、試験基板上に固定/固定化し、それによって、固定/固定化核酸を形成すること、を含む。本方法は、(b)固定/固定化核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することにより進行する。曝露(b)は、それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定/固定化核酸の1つ以上の部分に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる。本方法は、(c)撮像デバイスを使用して、曝露(b)中またはその後に生じる光学活性の各それぞれの事例の試験基板上の場所を測定することによって進行する。本方法は、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することによって継続する。試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する。本方法は、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから核酸の少なくとも一部分の配列を決定することによって終了する。 Another aspect of the disclosure provides a method of sequencing a nucleic acid. The method includes (a) immobilizing/immobilizing a nucleic acid on a test substrate, thereby forming an immobilized/immobilized nucleic acid. The method proceeds by (b) exposing the immobilized/immobilized nucleic acid to each oligonucleotide probe species of the set of oligonucleotide probe species. Exposure (b) is under conditions that allow individual probes of each oligonucleotide probe species to bind to one or more portions of the immobilized/immobilized nucleic acid that are complementary to the respective oligonucleotide probe species. , thereby giving rise to each instance of optical activity. The method proceeds by (c) using an imaging device to measure the location on the test substrate of each respective instance of optical activity that occurs during or after exposure (b). The method repeats exposing (b) and measuring (c) for each oligonucleotide probe species in (d) the set of oligonucleotide probe species, thereby generating a plurality of sets of locations on the test substrate. Continue by getting. Each respective set of locations on the test substrate corresponds to an oligonucleotide probe species in the set of oligonucleotide probe species. The method concludes by (e) sequencing at least a portion of the nucleic acid from the set of locations on the test substrate by compiling locations on the test substrate represented by the set of locations. .

他の実施形態は、本明細書に記載の方法に関連するシステム、携帯型消費者向けデバイス、およびコンピュータ可読媒体を対象とする。 Other embodiments are directed to systems, portable consumer devices, and computer-readable media related to the methods described herein.

本明細書に開示されるように、適用可能な場合、本明細書に開示される任意の実施形態を任意の態様に適用することができる。 As disclosed herein, any embodiment disclosed herein may be applied to any aspect, where applicable.

本開示の追加の態様および利点は、以下の詳細な説明から当業者に容易に明らかになるであろう。ここでは、本開示の例示的な実施形態のみが示され、説明される。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、本開示からすべて逸脱することなく、様々な明白な態様で修正することができる。したがって、図面および説明は、本質的に例示的なものとしてみなされ、限定的なものとしてみなされるべきではない。 Additional aspects and advantages of the present disclosure will become readily apparent to those skilled in the art from the following detailed description. Only exemplary embodiments of the present disclosure are shown and described herein. As will be realized, the disclosure is capable of other and different embodiments, and its several details are capable of modifications in various obvious aspects, all without departing from the disclosure. Accordingly, the drawings and description are to be regarded as illustrative in nature and not as restrictive.

例示的なシステムトポロジーをまとめて示す。結合事象に関与する複数のプローブを有するポリマーと、結合事象の位置決定および配列識別に関する情報を収集および記憶し、次いで、本開示の様々な実施形態に従ってポリマー配列を決定するための分析をさらに行うためのコンピュータ記憶媒体と、を含む。Figure 3 summarizes an exemplary system topology; Polymers with multiple probes involved in binding events and information regarding localization and sequence identification of binding events are collected and stored and then further analyzed to determine polymer sequence according to various embodiments of the present disclosure. and a computer storage medium for. 本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための方法のプロセスおよび特徴のフローチャートをまとめて提供する。[0013] Figure 1 provides collectively a flow chart of processes and features of a method for determining the sequence and/or structural characteristics of a target polymer, according to various embodiments of the present disclosure. 本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための追加の方法のプロセスおよび特徴のフローチャートを提供する。[0014] Figures 10A and 10B provide flowcharts of processes and features of additional methods for determining the sequence and/or structural characteristics of target polymers, according to various embodiments of the present disclosure; 本開示の様々な実施形態に従って、標的ポリマーの配列および/または構造的特徴を決定するための追加の方法のプロセスおよび特徴のフローチャートを提供する。[0014] Figures 10A and 10B provide flowcharts of processes and features of additional methods for determining the sequence and/or structural characteristics of target polymers, according to various embodiments of the present disclosure; 本開示の様々な実施形態に従う、ポリヌクレオチドへのプローブの一過的な結合の例をまとめて示す。Examples of transient binding of probes to polynucleotides are summarized according to various embodiments of the present disclosure. 本開示の様々な実施形態に従って、標的ポリヌクレオチドに結合する異なるk塩基長(k-mer)のプローブの例をまとめて示す。FIG. 10A-B summarizes examples of probes of different k-base lengths (k-mers) that bind to target polynucleotides, according to various embodiments of the present disclosure. 本開示の様々な実施形態に従って、オリゴヌクレオチドセットの連続サイクルを伴う参照オリゴを使用する例をまとめて示す。FIG. 11 summarizes examples of using reference oligos with successive cycles of oligonucleotide sets, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、異なるプローブセットを単一の参照分子に適用する例をまとめて示す。FIG. 10 summarizes examples of applying different probe sets to a single reference molecule, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、複数の種類のプローブを使用する場合における一過的な結合の例をまとめて示す。10A-10B summarize examples of transient binding when using multiple types of probes, in accordance with various embodiments of the present disclosure. 本開示の様々な実施形態に従って、いくつかの収集された一過的な結合事象が、達成され得るプローブの局在化の程度と相関する例をまとめて示す。An example of how several collected transient binding events correlate with the degree of probe localization that can be achieved is shown collectively, according to various embodiments of the present disclosure. 本開示の様々な実施形態に従う、タイリングプローブの例をまとめて示す。FIG. 10 summarizes examples of tiling probes according to various embodiments of the present disclosure; FIG. 本開示の様々な実施形態に従う、直接標識されたプローブの一過的な結合の例をまとめて示す。Examples of transient binding of directly labeled probes are summarized according to various embodiments of the present disclosure. 本開示の様々な実施形態に従う、挿入色素(intercalating dye)の存在下での一過的なプローブの結合の例をまとめて示す。FIG. 11 summarizes examples of transient probe binding in the presence of an intercalating dye, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従う、異なるプローブ標識技術の例をまとめて示す。Figures 10A-10B summarize examples of different probe labeling techniques, according to various embodiments of the present disclosure; 本開示の様々な実施形態に従う、変性され梳かれた二本鎖DNA上のプローブの一過的な結合の例を示す。FIG. 12 shows an example of transient binding of probes on denatured and combed double-stranded DNA, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従う、細胞溶解および核酸固定化および伸長の例をまとめて示す。FIG. 11 summarizes examples of cell lysis and nucleic acid fixation and extension according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、単一細胞を捕捉し、任意選択的に、細胞由来の核酸の抽出、伸長、および配列決定を提供する例示的なマイクロ流体アーキテクチャを示す。FIG. 4 illustrates an exemplary microfluidic architecture that captures single cells and optionally provides extraction, extension, and sequencing of nucleic acids from the cells, in accordance with various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、個々の細胞に異なるIDタグを提供する例示的なマイクロ流体アーキテクチャを示す。FIG. 4 illustrates an exemplary microfluidic architecture that provides individual cells with different ID tags, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、個々の細胞からポリヌクレオチドを配列決定する例を示す。FIG. 2 shows an example of sequencing polynucleotides from individual cells, according to various embodiments of the present disclosure. FIG. 本開示の様々な実施形態に従って、一過的なプローブの結合の撮像を行うための例示的なデバイスレイアウトをまとめて示す。FIG. 11 collectively illustrates an exemplary device layout for imaging transient probe binding, in accordance with various embodiments of the present disclosure; FIG. 本開示の様々な実施形態に従って、エアギャップによって分離された試薬を含む例示的なキャピラリーチューブを示す。FIG. 4 illustrates an exemplary capillary tube containing reagents separated by air gaps, in accordance with various embodiments of the present disclosure; FIG. 本開示の様々な実施形態に従う、蛍光の例をまとめて示す。4A-4B collectively illustrate fluorescence examples according to various embodiments of the present disclosure. 本開示の様々な実施形態に従う、蛍光の例をまとめて示す。4A-4B collectively illustrate fluorescence examples according to various embodiments of the present disclosure. 本開示の様々な実施形態に従う、合成変性二本鎖DNA上の一過的な結合を示す。2 shows transient binding on synthetic denatured double-stranded DNA, according to various embodiments of the present disclosure. 「フットプリント」配列決定の2つのサイクルを示す。この5塩基長の場合、5サイクルが使用される。ここで、各サイクルは、オリゴヌクレオチドの「フットプリント」または長さに沿って定義される異なる単一のヌクレオチド位置を有し、残りのヌクレオチドは縮重しており、各位置が4つすべてのヌクレオチドまたは各縮重位置が普遍的ヌクレオチド類似体(例えば、ニトロインドール、ニトロピロール、またはイノシンなど)のいずれかのライブラリを含む。定義された各塩基は、同じ混合物中に添加された場合、互いに区別され得る4つの異なる標識のうちの1つに連結された異なる色で表される。この図では、位置1は、第1のサイクルで定義され、位置2は、第2のサイクルで定義される。これらのサイクルを経ると、標的(オリゴのフットプリント下)の位置1、2、3、4、5の同一性が、連続したサイクルで得られる。一部の実施形態では、標的の照合された塩基の同一性は、オリゴの対応する定義された塩基に相補的である。一部のかかる実施形態では、位置決定は、オリゴが結合するフットプリントの場所を特定するのに十分である必要があり、フットプリント内の位置は、色またはサイクル数などのコードによって定義される。Two cycles of 'footprint' sequencing are shown. For this 5 base length, 5 cycles are used. Here, each cycle has a different single nucleotide position defined along the "footprint" or length of the oligonucleotide, the remaining nucleotides being degenerate and each position representing all four Includes libraries of either nucleotides or universal nucleotide analogues at each degenerate position (eg, nitroindole, nitropyrrole, or inosine, etc.). Each defined base is represented by a different color linked to one of four different labels that can be distinguished from each other when added in the same mixture. In this figure, position 1 is defined in the first cycle and position 2 is defined in the second cycle. After going through these cycles, the identities of positions 1, 2, 3, 4, 5 of the target (under the oligo footprint) are obtained in successive cycles. In some embodiments, the matched base identities of the target are complementary to the corresponding defined bases of the oligo. In some such embodiments, the localization must be sufficient to identify the location of the footprint to which the oligo binds, the position within the footprint being defined by a code such as color or cycle number. . 1つのヌクレオチドのみが定義され、4つの異なる定義されたヌクレオチドすべてが異なる色で示される場合を概略的に示す。一部の実施形態における異なる色は、異なるフルオロフォアまたは異なる付加サイクルを示す。色が異なる場合、配列決定プロセス全体を、試薬交換を必要とせずに、単一の均一反応またはワンポット反応で実行することができる。このアプローチでは、DNAの鎖は、表面上で伸長/伸展され、短いオリゴが、溶液中に添加され、それらの相補場所に結合する。It schematically shows the case where only one nucleotide is defined and all four different defined nucleotides are shown in different colors. Different colors in some embodiments indicate different fluorophores or different addition cycles. If the colors are different, the entire sequencing process can be performed in a single homogenous or one-pot reaction without the need for reagent exchange. In this approach, strands of DNA are stretched/stretched on the surface and short oligos are added in solution and bind to their complementary sites. 各側に4つの縮重位置、5’cy3 NNgGcNN(オリゴ名称:3004-3mer)に隣接する3つの定義された塩基とのオリゴの結合を示す。伸展されたDNAは、0.5MのNaоHによって20分間変性されたラムダファージである。結合緩衝液は、4×SSCおよび0.1%のTween20であり、結合は、4℃で行われ、撮像は、室温で行われた。Four degenerate positions on each side, oligo binding with three defined bases flanking 5'cy3 NNgGcNN (oligo name: 3004-3mer) are shown. Stretched DNA is lambda phage denatured with 0.5M NaOH for 20 minutes. Binding buffer was 4×SSC and 0.1% Tween 20, binding was performed at 4° C. and imaging was performed at room temperature.

ここで、実施形態を詳細に参照する。その例は、添付の図面に例示されている。以下の詳細な説明では、本開示の完全な理解を提供するために、多くの特定の詳細が示されている。しかしながら、本開示がこれらの特定の詳細なしで実施されることは、当業者には明らかであろう。他の例では、実施形態の態様を不必要に曖昧にしないように、周知の方法、手順、構成要素、回路、およびネットワークは、詳細に説明されていない。 Reference will now be made in detail to the embodiments. Examples are illustrated in the accompanying drawings. In the following detailed description, numerous specific details are set forth in order to provide a thorough understanding of the present disclosure. However, it will be clear to those skilled in the art that the present disclosure may be practiced without these specific details. In other instances, well-known methods, procedures, components, circuits, and networks have not been described in detail so as not to unnecessarily obscure aspects of the embodiments.

定義
本開示で使用される専門用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図するものではない。説明および添付の特許請求の範囲で使用される場合、単数形の「a」、「an」、および「the」は、文脈により明らかにそうではないことが示されていない限り、複数形も同様に含むことが意図される。本明細書で使用される「および/または」という用語は、関連する列挙された項目の1つ以上の任意のおよびすべての可能な組み合わせを指し、それを包含することも理解されたい。さらに、「含む(includes)」および/または「含む(comprising)」という用語は、本明細書で使用される場合、記載された特徴、整数、ステップ、操作、要素、および/または構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しないことを理解されたい。
Definitions The terminology used in this disclosure is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. As used in the description and the appended claims, the singular forms "a,""an," and "the" refer to the plural forms as well, unless the context clearly indicates otherwise. intended to be included in It should also be understood that the term "and/or" as used herein refers to and includes any and all possible combinations of one or more of the associated listed items. Furthermore, the terms "includes" and/or "comprising", as used herein, do not exclude the presence of a recited feature, integer, step, operation, element, and/or component. , does not preclude the presence or addition of one or more other features, integers, steps, operations, elements, constituents, and/or groups thereof.

本明細書で使用される場合、用語「~の場合(if)」は、文脈に応じて、「~のとき(when)」または「~の際(upon)」または「決定に応じて(in response to determining)」または「検出に応じて(in response to detecting)」を意味すると解釈される。同様に、「それが決定される場合」または「[記載された状態または事象]が検出される場合」という語句は、文脈に応じて、「決定の際」または「決定に応じて」または「[記載された状態または事象]の検出の際」または「[記載された状態または事象]の検出に応じて」を意味すると解釈される。 As used herein, the term “if,” depending on the context, is “when,” or “upon,” or “in is taken to mean "response to determining" or "in response to detecting". Similarly, the phrases "when it is determined" or "when [the stated condition or event] is detected" are interchangeable, depending on the context, "on determining" or "upon determination" or " It is taken to mean "upon detection of [state or event]" or "in response to detection of [state or event]".

「または」という用語は、排他的な「または」ではなく、包含的な「または」を意味することが意図される。すなわち、別段の指定がない限り、または文脈から明らかでない限り、「XはAまたはBを採用する」という語句は、自然な包含的置換のうちのいずれかを意味することが意図される。すなわち、「Xは、AまたはBを用いる」という語句は、以下の例のうちのいずれかによって満たされる:XはAを用いる、XはBを用いる、または、XはAとBの両方を用いる。さらに、本出願および添付の特許請求の範囲で使用される冠詞「a」および「an」は、別途指定されない限り、または単数形を対象とすることが文脈から明らかでない限り、概して、「1つ以上」を意味すると解釈されるべきである。 The term "or" is intended to mean an inclusive "or" rather than an exclusive "or." That is, unless specified otherwise, or clear from context, the phrase "X employs A or B" is intended to mean any of the natural inclusive permutations. That is, the phrase "X uses A or B" is satisfied by any of the following examples: X uses A, X uses B, or X uses both A and B. use. Further, as used in this application and the appended claims, the articles "a" and "an" generally refer to "one" unless specified otherwise or clear from context that they are directed to the singular. shall be construed to mean "greater than or equal to".

また、様々な要素を説明するために、本明細書では、第1、第2などの用語を使用するが、これらの要素は、これらの用語によって限定されるべきではないことも理解されたい。これらの用語は、ある要素と別の要素を区別するためにのみ使用される。例えば、第1のフィルタは、本開示の範囲から逸脱することなく、第2のフィルタと呼ぶことができ、同様に、第2のフィルタは、第1のフィルタと呼ぶことができる。第1のフィルタと第2のフィルタは両方ともフィルタであるが、同じフィルタではない。 It should also be understood that although the terms first, second, etc. are used herein to describe various elements, these elements should not be limited by these terms. These terms are only used to distinguish one element from another. For example, a first filter could be termed a second filter, and, similarly, a second filter could be termed a first filter, without departing from the scope of this disclosure. Both the first filter and the second filter are filters, but not the same filter.

本明細書で使用される場合、「約」または「およそ」という用語は、当業者によって決定される特定の値に対する許容誤差の範囲内であることを意味し得、それは、部分的には、その値がどのように測定または決定されるか(例えば、測定システムの限界)に依存し得る。例えば、「約」は、当該技術分野における慣例に従って、標準偏差が1以内のまたは1超を意味し得る。「約」は、所与の値の±20%、±10%、±5%、または±1%の範囲を意味し得る。「約」または「およそ」という用語は、値が、1桁以内、5倍以内、または2倍以内であることを意味し得る。本出願および特許請求の範囲において特定の値が記載されている場合、別段の記載がない限り、特定の値について許容誤差の範囲内であることを意味する「約」という用語が想定されるべきである。「約」という用語は、当業者によって一般に理解される意味を有し得る。「約」という用語は、±10%を指し得る。「約」という用語は、±5%を指し得る。 As used herein, the terms "about" or "approximately" can mean within an acceptable margin of error for a particular value as determined by one skilled in the art, which is in part It may depend on how the value is measured or determined (eg, limitations of the measurement system). For example, "about" can mean within 1 or greater than 1 standard deviation, per the practice in the art. "About" can mean a range of ±20%, ±10%, ±5%, or ±1% of a given value. The terms "about" or "approximately" can mean within one order of magnitude, within five times, or within two times the value. Where specific values are recited in this application and claims, the term “about” should be assumed to mean within a tolerance for the specified value unless otherwise stated. is. The term "about" may have a meaning commonly understood by those of ordinary skill in the art. The term "about" can refer to ±10%. The term "about" can refer to ±5%.

本明細書で使用される場合、用語「核酸」、「核酸分子」、および「ポリヌクレオチド」は、互換的に使用される。用語は、デオキシリボ核酸(DNA、例えば、相補的DNA(cDNA)、ゲノムDNA(gDNA)など)、リボ核酸(RNA、例えば、メッセンジャーRNA(mRNA)、低分子干渉RNA(siRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA、胎児もしくは胎盤によって高度に発現されるRNAなど)、ならびに/またはDNAもしくはRNA類似体(例えば、合成塩基類似体および/もしくは天然に存在する(エピジェネティック修飾された)塩基類似体、糖類似体、および/または非天然の骨格などを含む)、RNA/DNAハイブリッドおよびペプチド核酸(PNA)など、任意の組成物形態の核酸を指してもよく、これらはすべて、一本鎖形態または二本鎖形態であり得る。特に限定されない限り、核酸は、天然ヌクレオチドの既知の類似体を含むことができ、そのいくつかは、天然に存在するヌクレオチドと同様の様式で機能することができる。核酸は、本明細書に記載されるプロセス(例えば、直鎖、環状、スーパーコイル、一本鎖、二本鎖など)を行うために有用な任意の形態であり得る。場合によっては、核酸は、特定の実施形態では、プラスミド、ファージ、自律複製配列(ARS)、セントロメア、人工染色体、染色体、あるいは他の核酸(インビトロで、または宿主細胞、細胞、細胞核、もしくは細胞の細胞質で、複製し得るか、または複製され得る)であるか、またはそれ由来である。一部の実施形態では、核酸は、単一の染色体またはその断片(例えば、二倍体生物から得られた試料の1つの染色体からの核酸試料)に由来し得る。核酸分子は、完全長の天然ポリヌクレオチド(例えば、長鎖非コード(lnc)RNA、mRNA、染色体、ミトコンドリアDNA、またはポリヌクレオチド断片)を含むことができる。ポリヌクレオチド断片は、少なくとも200塩基長であり得るか、もしくは少なくとも数千ヌクレオチド長であり得るか、または、ゲノムDNAの場合、ポリヌクレオチド断片は、数百キロ塩基長~数メガ塩基長であり得る。 As used herein, the terms "nucleic acid," "nucleic acid molecule," and "polynucleotide" are used interchangeably. The term includes deoxyribonucleic acid (DNA, e.g., complementary DNA (cDNA), genomic DNA (gDNA), etc.), ribonucleic acid (RNA, e.g., messenger RNA (mRNA), small interfering RNA (siRNA), ribosomal RNA (rRNA ), transfer RNA (tRNA), microRNA, RNA highly expressed by the fetus or placenta, etc.), and/or DNA or RNA analogs (e.g. synthetic base analogs and/or naturally occurring (epigenetic modifications may refer to nucleic acids in any composition form, including base analogs, sugar analogs, and/or non-natural backbones, etc.), RNA/DNA hybrids and peptide nucleic acids (PNAs), which are All can be in single- or double-stranded form. Unless specifically limited, nucleic acids can contain known analogues of natural nucleotides, some of which can function in a manner similar to naturally occurring nucleotides. Nucleic acids can be in any form useful for carrying out the processes described herein (eg, linear, circular, supercoiled, single stranded, double stranded, etc.). Optionally, the nucleic acid is, in certain embodiments, a plasmid, phage, autonomously replicating sequence (ARS), centromere, artificial chromosome, chromosome, or other nucleic acid (in vitro or in a host cell, cell, cell nucleus, or cellular cytoplasmic, replicable, or replicable) or derived therefrom. In some embodiments, a nucleic acid can be derived from a single chromosome or fragment thereof (eg, a nucleic acid sample from one chromosome of a sample obtained from a diploid organism). Nucleic acid molecules can include full-length naturally occurring polynucleotides (eg, long non-coding (lnc) RNA, mRNA, chromosomal, mitochondrial DNA, or polynucleotide fragments). Polynucleotide fragments can be at least 200 bases long, or at least thousands of nucleotides long, or in the case of genomic DNA, polynucleotide fragments can be hundreds of kilobases to several megabases long. .

特定の実施形態では、核酸は、ヌクレオソーム、ヌクレオソームの断片もしくは部分、またはヌクレオソーム様構造を含む。核酸は、タンパク質(例えば、ヒストン、DNA結合タンパク質など)を含むことがある。本明細書に記載されるプロセスによって分析される核酸は、時には、実質的に単離され、タンパク質または他の分子と実質的に会合していない。核酸には、一本鎖(「センス」または「アンチセンス」、「プラス」鎖または「マイナス」鎖、「フォワード」リーディングフレームまたは「リバース」リーディングフレーム)および二本鎖ポリヌクレオチドから合成、複製、または増幅されたRNAもしくはDNAの誘導体、バリアント、および類似体も含まれる。デオキシリボヌクレオチドには、デオキシアデノシン、デオキシシチジン、デオキシグアノシンおよびデオキシチミジンが含まれる。RNAの場合、塩基シトシンは、ウラシルで置き換えられ、糖の2’位はヒドロキシル部分を含む。一部の実施形態では、核酸は、対象から得られた核酸を鋳型として使用して調製される。 In certain embodiments, the nucleic acid comprises a nucleosome, a fragment or portion of a nucleosome, or a nucleosome-like structure. Nucleic acids may include proteins (eg, histones, DNA binding proteins, etc.). Nucleic acids analyzed by the processes described herein are sometimes substantially isolated and substantially unassociated with proteins or other molecules. Nucleic acids include synthetic, replicated, and double-stranded (“sense” or “antisense,” “plus” or “minus” strands, “forward” or “reverse” reading frames) and double-stranded polynucleotides. Also included are derivatives, variants, and analogues of amplified RNA or DNA. Deoxyribonucleotides include deoxyadenosine, deoxycytidine, deoxyguanosine and deoxythymidine. For RNA, the base cytosine is replaced with uracil and the 2' position of the sugar contains a hydroxyl moiety. In some embodiments, a nucleic acid is prepared using a nucleic acid obtained from a subject as a template.

本明細書で使用される場合、「末端位置(ending position)」または「末端位置(end position)」(または単に「末端(end)」)という用語は、最も外側の塩基、例えば、セルフリーDNA分子(例えば、プラスミドDNA分子)の端の塩基の、ゲノム座標、またはゲノム同一性、またはヌクレオチド同一性を指し得る。末端位置は、DNA分子のいずれかの末端に対応し得る。このようにして、一方が、DNA分子の開始および終末を指す場合、両方が末端位置に対応し得る。一部の実施形態では、1つの末端位置は、セルフリーDNA分子の一端上の最も外側の塩基のゲノム座標またはヌクレオチド同一性であり、これは、分析方法、例えば、超並列配列決定もしくは次世代配列決定、単一分子配列決定、二本鎖もしくは一本鎖DNA配列決定ライブラリ調製プロトコル、ポリメラーゼ連鎖反応(PCR)、またはマイクロアレイによって検出もしくは決定される。一部の実施形態では、そのようなインビトロ技術は、セルフリーDNA分子の真のインビボ物理的末端を変化させることができる。したがって、各検出可能な末端は、生物学的に真の末端を表し得るか、または末端は、元の末端から1つ以上のヌクレオチドを削減するか、または1つ以上のヌクレオチドを分子の伸長する(例えば、クレノウ断片による非平滑末端の二本鎖DNA分子のオーバーハングの5’平滑化および3’充填であり得る)。末端位置のゲノム同一性またはゲノム座標は、ヒト参照ゲノム(例えば、hg19)に対する配列リードの整列(alignment)の結果に由来し得る。これは、ヒトゲノムの元の座標を表すインデックスまたはコードのカタログから導出することができる。本発明は、これらに限定されないが、標的特異的プローブ、ミニ配列決定、DNA増幅によって読み取られる、セルフリーDNA分子上の位置またはヌクレオチド同一性を指し得る。「ゲノム位置」という用語は、ポリヌクレオチド(例えば、遺伝子、プラスミド、核酸断片、ウイルスDNA断片)のヌクレオチド位置を指し得る。「ゲノム位置」という用語は、ゲノム(例えば、配偶子もしくは微生物または多細胞生物の各細胞の染色体のハプロイドセット)のヌクレオチド位置に限定されない。 As used herein, the term "ending position" or "end position" (or simply "end") refers to the outermost base, e.g., cell-free DNA It can refer to genomic coordinates, or genomic identity, or nucleotide identity, of the bases at the ends of a molecule (eg, a plasmid DNA molecule). A terminal position can correspond to either end of a DNA molecule. Thus, where one refers to the beginning and end of a DNA molecule, both can correspond to terminal positions. In some embodiments, one terminal position is the genomic coordinates or nucleotide identity of the outermost base on one end of the cell-free DNA molecule, which is analyzed by analytical methods such as massively parallel sequencing or next generation. Detected or determined by sequencing, single molecule sequencing, double- or single-stranded DNA sequencing library preparation protocols, polymerase chain reaction (PCR), or microarray. In some embodiments, such in vitro techniques can alter the true in vivo physical ends of cell-free DNA molecules. Thus, each detectable terminus may represent a biologically true terminus, or the terminus may be reduced by one or more nucleotides from the original terminus or extended by one or more nucleotides of the molecule. (For example, it can be 5'blunting and 3'filling of non-blunt-ended double-stranded DNA molecule overhangs with Klenow fragment). Genomic identities or genomic coordinates of terminal positions can be derived from the results of alignment of sequence reads to a human reference genome (eg, hg19). This can be derived from a catalog of indices or codes representing the original coordinates of the human genome. The present invention can refer to locations or nucleotide identities on cell-free DNA molecules read by, but not limited to, target-specific probes, mini-sequencing, DNA amplification. The term "genomic location" can refer to the nucleotide location of a polynucleotide (eg, gene, plasmid, nucleic acid fragment, viral DNA fragment). The term "genomic location" is not limited to the nucleotide location of a genome (eg, a gamete or a haploid set of chromosomes of each cell of a microorganism or multicellular organism).

本明細書で使用される場合、用語「変異」、「一塩基バリアント」、「一塩基多型」、「バリアント」、「エピジェネティック修飾」、および「構造再編成」は、1つ以上の細胞の遺伝物質における1つ以上の異なる種類の1つ以上の検出可能な変化を指す。特定の例では、1つ以上の変異を、がん細胞(例えば、ドライバー変異およびパッセンジャー変異)に見出し、識別することができる。変異は、親細胞から娘細胞に伝達され得る。当業者は、親細胞における遺伝子変異(例えば、ドライバー変異)が、娘細胞における追加の異なる変異(例えば、パッセンジャー変異)を誘導し得ることを理解するであろう。変異またはバリアントは、概して、核酸において生じる。特定の例では、変異は、1つ以上のデオキシリボ核酸またはその断片における検出可能な変化であり得る。変異は、概して、核酸内の新しい位置に付加、欠失、置換、反転、または転位されるヌクレオチドを指す。変異は、自然に発生する変異または実験的に誘発される変異であり得る。特定の組織の配列における変異は、「組織特異的アレル(allele)」の例である。例えば、腫瘍は、正常細胞では生じない遺伝子座におけるアレルをもたらす変異を有し得る。「組織特異的アレル」の別の例は、胎児組織に生じるが、母体組織には生じない胎児特異的アレルである。「アレル」という用語は、場合によっては、変異と互換的に使用され得る。 As used herein, the terms "mutation," "single nucleotide variant," "single nucleotide polymorphism," "variant," "epigenetic modification," and "structural rearrangement" refer to refers to one or more detectable alterations of one or more different types in the genetic material of In certain instances, one or more mutations can be found and identified in cancer cells (eg, driver mutations and passenger mutations). Mutations can be transmitted from parent cells to daughter cells. Those skilled in the art will appreciate that genetic mutations (eg, driver mutations) in parental cells can induce additional, different mutations (eg, passenger mutations) in daughter cells. Mutations or variants generally occur in nucleic acids. In certain instances, a mutation can be a detectable change in one or more deoxyribonucleic acids or fragments thereof. Mutations generally refer to nucleotides that are added, deleted, substituted, inverted, or transposed to new positions within a nucleic acid. Mutations can be naturally occurring mutations or experimentally induced mutations. Variations in sequences in specific tissues are examples of "tissue-specific alleles." For example, a tumor may have mutations that result in an allele at a genetic locus that does not occur in normal cells. Another example of a "tissue-specific allele" is a fetal-specific allele that occurs in fetal tissue but not maternal tissue. The term "allele" can sometimes be used interchangeably with mutation.

「一過的な結合(transient binding)」という用語は、結合試薬またはプローブが、ポリヌクレオチド上の結合部位に可逆的に結合し、通常、プローブがその結合部位に結合したままではないことを意味する。これは、分析の過程における結合部位の場所に関する有用な情報を提供する。典型的には、1つの試薬またはプローブが、固定化ポリマーに結合し、次いで、しばらく滞留した後、ポリマーから脱離する。次いで、同じまたは別の試薬またはプローブは、別の部位でポリマーに結合し得る。一部の実施形態では、ポリマーに沿った複数の結合部位は、複数の試薬またはプローブによって同時に結合され得る。場合によっては、異なるプローブは、重複する結合部位に結合する。ポリマーに可逆的に結合する試薬またはプローブのこのプロセスは、分析の過程で何度も繰り返され得る。かかる結合事象の場所、頻度、滞留時間、光子放出は、最終的に、ポリマーの化学構造のマップをもたらす。実際、これらの結合事象の一過的な性質により、かかる結合事象の数の増加を検出することができる。例えば、プローブが長期間にわたって結合したままである場合、各プローブは他のプローブの結合を阻害する。 The term "transient binding" means that a binding reagent or probe reversibly binds to a binding site on a polynucleotide and the probe does not normally remain bound to its binding site. do. This provides useful information regarding the location of binding sites during the course of analysis. Typically, one reagent or probe binds to the immobilized polymer and then stays for some time before detaching from the polymer. The same or another reagent or probe can then be attached to the polymer at another site. In some embodiments, multiple binding sites along a polymer can be simultaneously bound by multiple reagents or probes. In some cases, different probes bind to overlapping binding sites. This process of reversibly binding reagents or probes to polymers can be repeated many times during the course of an analysis. The location, frequency, residence time and photon emission of such binding events ultimately provide a map of the polymer's chemical structure. Indeed, due to the transient nature of these binding events, an increase in the number of such binding events can be detected. For example, each probe inhibits the binding of the other probe if the probes remain bound for an extended period of time.

「反復結合(repetitive binding)」という用語は、ポリマーの同じ結合部位が、分析の過程で同じ結合試薬もしくはプローブ、または同じ種類の結合試薬もしくはプローブによって複数回結合されることを意味する。典型的には、ポリマーのマップが開発されるまで、1つの試薬がある部位に結合し、次いで解離し、別の試薬が結合し、次いで解離するなどである。反復結合は、プローブから得られる情報の感度および正確度を高める。より多くの光子が蓄積されると、複数の独立した結合事象は、実際のシグナルが検出される確率を増加させる。一度だけ検出されたときに、シグナルが低すぎて、バックグラウンドノイズを超えて呼び出すことができない場合、感度が増加する。このような場合、シグナルが、持続的に見られるときに呼び出し可能になる(例えば、同じシグナルが複数回見られる場合、シグナルが実際に増加しているという信頼度が増加する)。情報の複数の読み取りにより、ある読み取りが別の読み取りで確認されるため、結合部位の呼び出しの正確度が高まる。 The term "repetitive binding" means that the same binding site on a polymer is bound multiple times by the same binding reagent or probe, or the same type of binding reagent or probe, during the course of an analysis. Typically, one reagent binds to a site, then releases, another reagent binds, then releases, etc., until a map of the polymer is developed. Repeated binding increases the sensitivity and accuracy of the information obtained from the probe. As more photons accumulate, multiple independent binding events increase the probability that a real signal will be detected. Sensitivity is increased if the signal is too low to be called over background noise when detected only once. In such cases, the signal becomes callable when seen persistently (eg, if the same signal is seen multiple times, the confidence that the signal is actually increasing increases). Multiple reads of information increase the accuracy of binding site calling because one read is confirmed by another.

本明細書で使用される場合、「プローブ」という用語は、オリゴヌクレオチドを含むことができ、結合された蛍光標識であり得る1つ以上の任意選択的な標識を有する。一部の実施形態では、プローブは、任意選択的に、蛍光色素または蛍光または光散乱粒子で標識されたペプチドまたはポリペプチドである。これらのプローブは、核酸またはタンパク質、炭水化物、脂肪酸または他の生体分子もしくは非生体ポリマーへの結合部位の局在を決定するために使用することができる。 As used herein, the term "probe" can comprise an oligonucleotide and has one or more optional labels, which can be fluorescent labels attached. In some embodiments, probes are peptides or polypeptides that are optionally labeled with fluorochromes or fluorescent or light scattering particles. These probes can be used to localize binding sites to nucleic acids or proteins, carbohydrates, fatty acids or other biomolecules or non-biopolymers.

本明細書で使用される場合、「オリゴヌクレオチドプローブ種(oligonucleotide probe species)」という用語は、プローブとして使用される1つ以上の異なるオリゴヌクレオチドを含むことができる。オリゴヌクレオチドの配列の一部分は、オリゴヌクレオチドプローブ種のすべてのメンバーに共通であり、他の部分、特に、共通配列に隣接する塩基は、縮重的または普遍的であり、したがって、オリゴヌクレオチドプローブ種の複数のメンバーがもたらされ得る。場合によっては、「オリゴヌクレオチドプローブ種」という用語は、個々のオリゴヌクレオチドプローブなどの単一種のメンバーを示し得る。他の場合、この用語は、複数種のすべてのメンバーを示し得る。オリゴヌクレオチドプローブ種は、標識が提供される場合、すべて共通の標識を有する。本明細書で使用される場合、「オリゴヌクレオチド種のセット」という用語は、異なる共通配列を有する複数のオリゴヌクレオチド種を意味する。 As used herein, the term "oligonucleotide probe species" can include one or more different oligonucleotides used as probes. A portion of the sequence of the oligonucleotide is common to all members of the oligonucleotide probe species and other portions, particularly the bases flanking the common sequence, are degenerate or universal, thus making the oligonucleotide probe species can be provided. In some cases, the term "oligonucleotide probe species" can refer to members of a single species, such as individual oligonucleotide probes. In other cases, the term may refer to all members of multiple species. Oligonucleotide probe species all have a common label, if a label is provided. As used herein, the term "oligonucleotide species set" means a plurality of oligonucleotide species having different consensus sequences.

本明細書で使用される場合、「オリゴヌクレオチド種の完全なセット」という用語は、配列決定方法で使用されるすべてのオリゴヌクレオチド種を意味する。オリゴヌクレオチドの完全なセットの異なるメンバーは、同じ長さのk塩基長を有するか、または異なる長さのk塩基長を有する。オリゴヌクレオチドプローブ種の完全なセットは、単一の長さのk塩基長のすべてのk塩基長配列を含み得るか、またはそのサブセットを含み得る。 As used herein, the term "complete set of oligonucleotide species" means all oligonucleotide species used in the sequencing method. Different members of the complete set of oligonucleotides have the same length of k bases or have different lengths of k bases. A complete set of oligonucleotide probe species can include all k base long sequences of a single length of k base lengths, or can include a subset thereof.

本明細書で使用される場合、「配列プローブのタイリングセット(tiling set)」または「タイリングセット」という用語は、オリゴヌクレオチドプローブ種のセットを意味し、セットの2つを除くすべてのオリゴヌクレオチドプローブ種が、セットの2つの他のオリゴヌクレオチドプローブ種にも共通の1つを除くすべてのオリゴヌクレオチドプローブ種共通の塩基を有し、対応する異なる塩基が、オリゴヌクレオチドプローブ種共通の配列の各末端にある。タイリングセットの2つのメンバーは、1つを除くすべてのオリゴヌクレオチドプローブ種共通の塩基で、また1つの他のオリゴヌクレオチドプローブ種とも共通の塩基を有するオリゴヌクレオチドプローブ種を有し、異なる塩基は、それぞれの3’末端および5’末端にあり、すべて重複するオリゴのセットを完成させる。 As used herein, the terms "tiling set of sequence probes" or "tiling set" refer to a set of oligonucleotide probe species in which all but two of the oligo The nucleotide probe species has bases in common with all but one of the oligonucleotide probe species that are also common to two other oligonucleotide probe species in the set, and the corresponding different bases are in the sequences common to the oligonucleotide probe species. at each end. Two members of the tiling set have oligonucleotide probe species that have bases in common with all but one oligonucleotide probe species and with one other oligonucleotide probe species, and the different bases are , at their respective 3′ and 5′ ends, completing a set of all overlapping oligos.

本明細書で使用される場合、用語「オリゴヌクレオチド」および「オリゴ」は、短い核酸配列を意味する。一部の実施形態では、オリゴは、定義されたサイズのものであり、例えば、各オリゴは、長さがkヌクレオチド塩基である(本明細書において「k塩基長(k-mer)」とも称される)。典型的なオリゴのサイズは、3塩基長、4塩基長、5塩基長、6塩基長などである。オリゴは、本明細書では、N塩基長とも称され得る。 As used herein, the terms "oligonucleotide" and "oligo" refer to short nucleic acid sequences. In some embodiments, the oligos are of a defined size, eg, each oligo is k nucleotide bases in length (also referred to herein as a "k-mer"). is done). Typical oligo sizes are 3 bases long, 4 bases long, 5 bases long, 6 bases long, and the like. An oligo may also be referred to herein as being N bases long.

本明細書で使用される場合、「標識(label)」という用語は、単一の検出可能な実体(例えば、波長放出実体)または複数の検出可能な実体を包含する。一部の実施形態では、標識は、核酸に一過的に結合するか、またはプローブに共有結合もしくは非共有結合のいずれかで結合される。蛍光発光中に異なる種類の標識が点滅し、光子放出が変動し、または光スイッチがオンもしくはオフし得る。異なる標識は、異なる撮像方法に使用される。特に、一部の標識は、異なる種類の蛍光顕微鏡に固有に適している。一部の実施形態では、蛍光標識は、異なる波長で蛍光を発し、また異なる寿命を有する。一部の実施形態では、バックグラウンド蛍光が、撮像場に存在する。一部のかかる実施形態では、そのようなバックグラウンドは、散乱またはバックグラウンド蛍光による蛍光の時間枠を拒絶することによって分析から除去される。標識がプローブの一端(例えば、オリゴプローブの3’末端)にある場合、位置決定の正確度は、プローブのその末端(例えば、プローブ配列の3’末端および標的配列の5’末端)に対応する。標識の明らかな一過性、変動性、または点滅、または暗化の挙動は、付着したプローブがその結合部位に結合し、解離しているかどうかを区別することができる。 As used herein, the term "label" includes a single detectable entity (eg, wavelength emitting entity) or multiple detectable entities. In some embodiments, the label is either transiently attached to the nucleic acid or attached to the probe either covalently or non-covalently. Different types of labels may flash during fluorescence emission, photon emission may fluctuate, or light switches may be turned on or off. Different labels are used for different imaging methods. In particular, some labels are uniquely suited for different types of fluorescence microscopy. In some embodiments, the fluorescent labels fluoresce at different wavelengths and have different lifetimes. In some embodiments, background fluorescence is present in the imaging field. In some such embodiments, such background is removed from analysis by rejecting the time window of fluorescence due to scatter or background fluorescence. If the label is at one end of the probe (e.g., the 3' end of the oligo probe), the localization accuracy corresponds to that end of the probe (e.g., the 3' end of the probe sequence and the 5' end of the target sequence). . Apparent transient, fluctuating or blinking or darkening behavior of the label can distinguish whether the attached probe is bound and dissociated from its binding site.

本明細書で使用される場合、「フラップ(flap)」という用語は、第2の実体の結合のための受容体として機能する実体を指す。2つの実体は、分子結合対を含み得る。かかる結合対は、核酸結合対を含み得る。一部の実施形態では、フラップは、標識されたオリゴヌクレオチドに結合する一連のオリゴヌクレオチドまたはポリヌクレオチド配列を含む。フラップとオリゴヌクレオチドとの間のかかる結合は、標的に結合するプローブの一部の一過的な結合を撮像するプロセスの過程で実質的に安定でなければならない。 As used herein, the term "flap" refers to an entity that functions as a receptor for binding of a second entity. Two entities may comprise a molecular binding pair. Such binding pairs may include nucleic acid binding pairs. In some embodiments, the flap comprises a series of oligonucleotide or polynucleotide sequences that bind to labeled oligonucleotides. Such a bond between the flap and the oligonucleotide should be substantially stable during the process of imaging the transient binding of the portion of the probe that binds to the target.

用語「伸長された(elongated)」、「拡張された(extended)」、「伸展された(stretched)」、「線状化された(linearized)」、および「直線化された(straightened)」は、互換的に使用され得る。特に、用語「伸長ポリヌクレオチド」(または「拡張されたポリヌクレオチド」など)は、何らかの方法で表面またはマトリックスに付着させた後、線状に伸展された核酸分子を示す。一般に、これらの用語は、ポリヌクレオチドに沿った結合部位が、それらの間のいくつかのヌクレオチドと多少相関する物理的距離によって分離されていることを意味する(例えば、ポリヌクレオチドは直線状である)。物理的距離がいくつかの塩基と一致する程度の幾分の不確かさは、許容され得る。 The terms "elongated", "extended", "stretched", "linearized" and "straightened" are , can be used interchangeably. In particular, the term "extended polynucleotide" (or "extended polynucleotide" etc.) refers to a nucleic acid molecule that is linearly extended after being attached to a surface or matrix in some way. In general, these terms mean that binding sites along a polynucleotide are separated by a physical distance that more or less correlates with the number of nucleotides between them (e.g., polynucleotides are linear ). Some uncertainty to the extent that physical distances are consistent with some bases can be tolerated.

本明細書で使用される「撮像」という用語は、二次元アレイおよび二次元走査検出器の両方を含む。ほとんどの場合、本明細書で使用される撮像技術は、必然的に、蛍光励起源(例えば、適切な波長のレーザ)および蛍光検出器を含む。 The term "imaging" as used herein includes both two-dimensional arrays and two-dimensional scanning detectors. In most cases, the imaging techniques used herein necessarily include a fluorescence excitation source (eg, a laser of appropriate wavelength) and a fluorescence detector.

本明細書で使用される場合、「配列ビット(sequence bit)」という用語は、配列の1つまたはいくつかの塩基(例えば、1~9塩基長)を示す。特に、一部の実施形態では、配列は、一過的な結合に使用されるオリゴ(またはペプチド)の長さに対応する。したがって、かかる実施形態では、配列は、標的ポリヌクレオチドの領域を指す。 As used herein, the term "sequence bit" refers to one or several bases (eg, 1-9 bases long) of a sequence. In particular, in some embodiments the sequence corresponds to the length of the oligo (or peptide) used for transient conjugation. Thus, in such embodiments, sequence refers to a region of a target polynucleotide.

本明細書で使用される場合、「ハプロタイプ」という用語は、典型的には、ともに遺伝する一連のバリエーションを指す。これは、バリエーションのセットが、ポリヌクレオチドまたは染色体上に近接して存在するために生じる。場合によっては、ハプロタイプは、1つ以上の一塩基多型(SNP)を含む。場合によっては、ハプロタイプは、1つ以上のアレルを含む。 As used herein, the term "haplotype" refers to a set of variations that are typically inherited together. This occurs because sets of variations exist in close proximity on a polynucleotide or chromosome. In some cases, a haplotype includes one or more single nucleotide polymorphisms (SNPs). In some cases, a haplotype includes one or more alleles.

本明細書で使用される場合、「メチル結合タンパク質」という用語は、約70個のヌクレオチド残基を含むメチルCpG結合ドメインを含むタンパク質を指す。かかるドメインは、DNAの非メチル化領域に対する親和性が低く、したがって、メチル化された核酸の場所を識別するために使用することができる。いくつかの一般的なメチル結合タンパク質としては、MeCP2、MBD1、およびMBD2が挙げられる。しかし、メチルCpG結合ドメインを含む様々な異なるタンパク質がある(例えば、Roloff et al.,BMC Genomics 4:1,2003に記載されているもの)。同様に、他の種類の抗体を使用して、メチルアデニンなどの他の種類のエピジェネティック修飾に結合する。 As used herein, the term "methyl binding protein" refers to a protein containing a methyl CpG binding domain comprising approximately 70 nucleotide residues. Such domains have a low affinity for unmethylated regions of DNA and can therefore be used to identify the location of methylated nucleic acids. Some common methyl-binding proteins include MeCP2, MBD1, and MBD2. However, there are a variety of different proteins that contain methyl-CpG binding domains (eg, those described in Roloff et al., BMC Genomics 4:1, 2003). Similarly, other types of antibodies are used to bind other types of epigenetic modifications such as methyladenine.

本明細書で使用される場合、「ナノボディ」という用語は、重鎖のみの抗体断片を含むタンパク質のセットを指す。これらは、非常に安定したタンパク質であり、様々なヒト抗体に類似する配列相同性を有するように設計することができ、したがって、体内の細胞型もしくは領域、または天然に存在する特定の種類のエピジェネティック修飾核酸塩基への特異的標的化を可能にする。ナノボディ生物学の概説は、Bannas et al.,Frontiers in Immu.8:1603,2017に見出すことができる。 As used herein, the term "nanobody" refers to a set of proteins comprising heavy chain-only antibody fragments. They are highly stable proteins and can be engineered to have similar sequence homology to various human antibodies, and thus can be used in cell types or regions within the body, or in specific types of naturally occurring epitopes. Allows specific targeting to genetically modified nucleobases. A review of nanobody biology is provided by Bannas et al. , Frontiers in Immu. 8:1603, 2017.

本明細書で使用される場合、「アフィマー(affimer)」という用語は、非抗体結合タンパク質を指す。これらは、高度にカスタマイズ可能なタンパク質であり、2つのペプチドループと、一部の実施形態では、所望のタンパク質標的に対する親和性および特異性を提供するようにランダム化されたN末端配列と、を有する。したがって、一部の実施形態では、アフィマーを使用して、タンパク質の目的の配列または構造領域を識別する。一部のかかる実施形態では、アフィマーは、多くの異なる種類のタンパク質発現、局在、および相互作用を識別するために使用される(例えば、Tiede et al.,ELife 6:e24903,2017に記載されている)。 As used herein, the term "affimer" refers to a non-antibody binding protein. These are highly customizable proteins, comprising two peptide loops and, in some embodiments, an N-terminal sequence randomized to provide affinity and specificity for the desired protein target. have. Thus, in some embodiments, affimers are used to identify sequences or structural regions of interest in proteins. In some such embodiments, affimers are used to distinguish between many different types of protein expression, localization, and interactions (eg, as described in Tiede et al., ELife 6:e24903, 2017). ing).

本明細書で使用される場合、「アプタマー」という用語は、汎用性が高く、カスタマイズ可能な結合分子の別のカテゴリーを指す。アプタマーは、ヌクレオチド領域および/またはペプチド領域を含む。考えられるアプタマー配列のランダムなセットを生成し、次いで、目的の特定の標的分子に結合する所望の配列を選択するのが典型的である。アプタマーは、それらの安定性および柔軟性を超えた追加の特徴を有し、他のカテゴリーの結合タンパク質よりも望ましいものになっている。(例えば、Song et al.,Sensors 12:612-631,2012およびDunn et al.,Nat.Rev.Chem.1:0076,2017に記載されている)。 As used herein, the term "aptamer" refers to another category of versatile and customizable binding molecules. Aptamers comprise nucleotide and/or peptide regions. It is typical to generate a random set of possible aptamer sequences and then select the desired sequence that binds to the particular target molecule of interest. Aptamers have additional characteristics beyond their stability and flexibility that make them desirable over other categories of binding proteins. (See, eg, Song et al., Sensors 12:612-631, 2012 and Dunn et al., Nat. Rev. Chem. 1:0076, 2017).

説明のために例示的な用途を参照して、いくつかの態様を以下に記載する。本明細書に記載の特徴の完全な理解を提供するために、多数の特定の詳細、関係、および方法が示されていることを理解されたい。しかしながら、本明細書に記載の特徴は、1つ以上の特定の詳細を用いることなく、または他の方法を用いて実施され得ることは、関連技術分野の当業者には理解されよう。本明細書で説明される特徴は、例示される行為または事象の順序によって限定されず、いくつかの行為は、他の行為または事象とは異なる順序で、かつ/またはそれと同時に生じ得る。さらに、例示される行為または事象のすべてが、本明細書に記載される特徴に従って方法を実行するために必要であるとは限らない。 Several aspects are described below with reference to exemplary applications for illustration. It should be understood that numerous specific details, relationships and methods have been set forth in order to provide a thorough understanding of the features described herein. It will be understood, however, by one skilled in the relevant art that the features described herein can be practiced without one or more of the specific details or with other methods. Features described herein are not limited by the illustrated order of acts or events, and some acts may occur in different orders and/or concurrently with other acts or events. Moreover, not all illustrated acts or events may be required to implement a methodology in accordance with the features described herein.

例示的なシステムの実施形態。
一態様では、標的核酸を配列決定する方法が、本明細書に開示される。本方法は、(a)標的核酸を、試験基板上に二本鎖線状化伸展形態で固定し、それによって、固定伸展二本鎖核酸を形成することを含み得る。本方法は、(b)固定伸展二本鎖核酸を、試験基板上で一本鎖形態に変性させ、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得ることをさらに含み得、固定された第2の鎖のそれぞれの塩基は、固定された第1の鎖の対応する相補塩基に隣接または近接していてもよい。本方法は、(c)固定された第1の鎖および固定された第2の鎖を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することをさらに含み得、オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、所定の配列および長さである。曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の各部分と結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ得る。それによって、光学活性のそれぞれの事例を生じ得る。本方法は、(d)1つ以上の二次元撮像デバイスを使用して、試験基板上の場所を測定すること、および、任意選択的に、曝露(c)中に生じる光学活性の各それぞれの事例の持続時間を測定すること、により継続し得る。次いで、本方法は、(e)オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種のそれぞれのプールに対して、曝露(c)および測定(d)を反復することによって進行し、それによって、試験基板上の複数の位置のセットを得ることができる。試験基板上のそれぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットの1つ以上のオリゴヌクレオチドプローブ種に対応し得る。それに関連する複数の標識の使用の結果として、連続的および/または同時に、複数の異なるオリゴヌクレオチドプローブ種が測定される場合、曝露(c)の単一のステップから、試験基板上の複数の位置のセットが得られる。本方法は、(f)異なるまたは異なるセットのオリゴヌクレオチドプローブ種に対応する複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから標的核酸の少なくとも一部分の配列を決定することをさらに含み得る。
An exemplary system embodiment.
In one aspect, disclosed herein is a method of sequencing a target nucleic acid. The method may comprise (a) immobilizing the target nucleic acid in a double-stranded linearized extended form on a test substrate, thereby forming an immobilized extended double-stranded nucleic acid. The method includes (b) denaturing the fixed, extended double-stranded nucleic acid to a single-stranded form on a test substrate, thereby obtaining a fixed first strand and a fixed second strand of the target nucleic acid. Each base of the immobilized second strand may be adjacent or close to the corresponding complementary base of the immobilized first strand. The method may further comprise (c) exposing the immobilized first strand and the immobilized second strand to a respective pool of oligonucleotide probe species of each of the set of oligonucleotide probe species; Each oligonucleotide probe species in the set of oligonucleotide probe species is of a given sequence and length. Exposure (c) is performed by the individual probes of the respective pools of each oligonucleotide probe species each of the immobilized first strand or the immobilized second strand complementary to the respective oligonucleotide probe species. It can be performed under conditions that allow the moieties to bind and form their respective duplexes. Each instance of optical activity can thereby be produced. The method comprises (d) measuring a location on the test substrate using one or more two-dimensional imaging devices, and optionally each respective optical activity occurring during exposure (c). It can be continued by measuring the duration of the case. The method then proceeds by (e) repeating exposing (c) and measuring (d) for each pool of oligonucleotide probe species of the set of oligonucleotide probe species, whereby the test substrate A set of multiple positions on can be obtained. Each set of locations on the test substrate may correspond to one or more oligonucleotide probe species of the set of oligonucleotide probe species. If multiple different oligonucleotide probe species are measured sequentially and/or simultaneously as a result of the use of multiple labels associated therewith, multiple locations on the test substrate from a single step of exposure (c). is obtained. The method comprises (f) compiling a target from a plurality of sets of locations on a test substrate by compiling locations on the test substrate represented by a plurality of sets of locations corresponding to different or different sets of oligonucleotide probe species. It can further comprise sequencing at least a portion of the nucleic acid.

一部の実施形態では、曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブ種が、個々のオリゴヌクレオチドプローブに相補的である固定された第1の鎖または固定された第2の鎖の各部分と一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性の事例を生じさせる。一部の実施形態では、曝露(c)は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブ種が、個々のプローブに相補的である固定された第1の鎖または固定された第2の鎖の各部分と反復して一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を反復して生じさせる。一部のかかる実施形態では、各オリゴヌクレオチドプローブは、オリゴヌクレオチド種のプールにおいて、オリゴヌクレオチドプローブ種のセットにおいて、標識(例えば、色素、蛍光ナノ粒子、または光散乱粒子)に結合される。 In some embodiments, exposing (c) is the immobilized first strand or carried out under conditions that allow each portion of the immobilized second strand to transiently and reversibly bind to form the respective duplexes, thereby giving rise to instances of optical activity . In some embodiments, exposing (c) is the immobilized first strand or immobilized Each instance of optical activity is performed under conditions that allow it to repeatedly transiently and reversibly bind to each portion of the second strand to form the respective duplexes, thereby rendering each instance of optical activity is repeatedly generated. In some such embodiments, each oligonucleotide probe is attached to a label (eg, dye, fluorescent nanoparticle, or light scattering particle) in a set of oligonucleotide probe species in a pool of oligonucleotide species.

一部の実施形態では、ある方法では、曝露は、挿入色素の形態の第1の標識の存在下で行われる。一部の実施形態では、各オリゴヌクレオチドプローブは、オリゴヌクレオチド種のプールにおいて、第2の標識に結合しているオリゴヌクレオチドプローブ種のセットにおいて、第1の標識および第2の標識は、第1の標識および第2の標識が互いに近接している場合、第1の標識蛍光および第2の標識蛍光のうちの1つを増加させる重複するドナー発光スペクトルおよびアクセプター励起スペクトルを有し、光学活性のそれぞれの事例は、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入される挿入色素(intercalating dye)の、オリゴヌクレオチドプローブに結合している第2の標識への近接に由来する。他の実施形態では、第1の標識および第2の標識の両方が、オリゴヌクレオチドプローブに結合している。 In some embodiments, in a method, exposure is in the presence of a first label in the form of an intercalating dye. In some embodiments, each oligonucleotide probe is bound to a second label in a pool of oligonucleotide species.In a set of oligonucleotide probe species, the first label and the second label are bound to the first label. and the second label are in close proximity to each other, have overlapping donor emission and acceptor excitation spectra that increase one of the first label fluorescence and the second label fluorescence, and are optically active In each case, an intercalating dye intercalating in each duplex between the oligonucleotide probe and the immobilized first strand or immobilized second strand binds to the oligonucleotide probe. derived from the proximity to the second marker that is In other embodiments, both the first label and the second label are attached to the oligonucleotide probe.

一部の実施形態では、曝露は、挿入色素の形態の第1の標識の存在下にあり、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識に結合しており、第1の標識は、第1の標識および第2の標識が互いに近接している場合、第2の標識の蛍光を増加し得、光学活性のそれぞれの事例は、挿入色素の近接から、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に第2の標識を挿入する。 In some embodiments, the exposure is in the presence of a first label in the form of an intercalating dye, each oligonucleotide probe species of the set of oligonucleotide probe species bound to a second label, One label can increase the fluorescence of the second label when the first and second labels are in close proximity to each other, and each instance of optical activity is associated with the proximity of the intercalating dye to the oligonucleotide probe. and the immobilized first strand or the immobilized second strand, inserting a second label in each duplex.

一部の実施形態では、曝露は、挿入色素の形態の第1の標識の存在下にあり、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識に結合しており、第2の標識は、第1の標識および第2の標識が互いに近接している場合、第1の標識の蛍光を増加させ、光学活性のそれぞれの事例は、挿入色素の近接から、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に第2の標識を挿入する。 In some embodiments, the exposure is in the presence of a first label in the form of an intercalating dye, each oligonucleotide probe species of the set of oligonucleotide probe species bound to a second label, Two labels increase the fluorescence of the first label when the first label and the second label are in close proximity to each other, and each instance of optical activity is due to the proximity of the intercalating dye to the oligonucleotide probe and A second label is inserted in each duplex between the immobilized first strand or the immobilized second strand.

一部の実施形態では、曝露は、挿入色素の存在下にあり、光学活性のそれぞれの事例は、オリゴヌクレオチドプローブと固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入されている挿入色素の蛍光に由来する。かかる実施形態では、光学活性のそれぞれの事例は、それぞれの二重鎖に挿入される前の挿入色素の蛍光よりも大きい。 In some embodiments, the exposure is in the presence of an intercalating dye, and each instance of optical activity is between the oligonucleotide probe and the immobilized first strand or the immobilized second strand, respectively. derived from the fluorescence of the intercalating dye intercalating into the double strand of the In such embodiments, each instance of optical activity is greater than the fluorescence of the intercalating dye prior to intercalation into its respective duplex.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの2つ以上のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、固定された第1の鎖および固定された第2の鎖に曝露されるオリゴヌクレオチドプローブ種のセットの各異なるオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、異なる標識と関連付けられる。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種の第1のプール、第1の標識と関連付けられた第1のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第2のオリゴヌクレオチドプローブ種の第2のプール、第2の標識と関連付けられた第2のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、第1の標識および第2の標識は異なる。代替的に、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種の第1のプール、第1の標識と関連付けられた第1のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第2のオリゴヌクレオチドプローブ種の第2のプール、第2の標識と関連付けられた第2のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、オリゴヌクレオチドプローブ種のセットの第3のオリゴヌクレオチドプローブ種の第3のプール、第3の標識と関連付けられた第3のオリゴヌクレオチドプローブ種は、単一の事例の曝露(c)中に、固定された第1の鎖および固定された第2の鎖に曝露され、第1の標識、第2の標識、および第3の標識は、各々異なる。 In some embodiments, the two or more oligonucleotide probe species of the set of oligonucleotide probe species are immobilized first strand and immobilized second strand during a single instance of exposure (c). each different oligonucleotide probe species of the set of oligonucleotide probe species exposed to the strands and exposed to the immobilized first strand and the immobilized second strand during a single instance of exposure (c) , associated with different labels. In some such embodiments, the first pool of first oligonucleotide probe species of the set of oligonucleotide probe species, the first oligonucleotide probe species associated with the first label are during exposure (c), exposed to the immobilized first strand and the immobilized second strand, a second pool of second oligonucleotide probe species of the set of oligonucleotide probe species, a second label; is exposed to the immobilized first strand and the immobilized second strand during a single instance of exposure (c), the first label and the second oligonucleotide probe species associated with 2 labels are different. Alternatively, the first pool of the first oligonucleotide probe species of the set of oligonucleotide probe species, the first oligonucleotide probe species associated with the first label, are subjected to a single instance of exposure (c) in a second pool of oligonucleotide probe species of the set of oligonucleotide probe species exposed to the immobilized first strand and the immobilized second strand, associated with a second label A second oligonucleotide probe species is exposed to the immobilized first strand and the immobilized second strand during a single instance of exposure (c), and the third oligonucleotide probe species of the set A third pool of oligonucleotide probe species, a third oligonucleotide probe species associated with a third label, was immobilized first strand and immobilized during a single instance of exposure (c) The first label, the second label, and the third label exposed to the second strand are each different.

他の実施形態では、励起、放出、蛍光寿命などによって区別される任意の数の異なる標識を、オリゴヌクレオチドプローブ種の関連するプールとともに使用する。 In other embodiments, any number of different labels distinguished by excitation, emission, fluorescence lifetime, etc. are used with associated pools of oligonucleotide probe species.

一部の実施形態では、オリゴヌクレオチドプローブ種のプールは、単一のオリゴヌクレオチドプローブ種を含む。他の実施形態では、オリゴヌクレオチドプローブ種のプールは、複数のオリゴヌクレオチドプローブ種を含む。さらなる実施形態では、複数のオリゴヌクレオチドプローブ種のプールは、複数のオリゴヌクレオチドプローブ種のプールの各単一のオリゴヌクレオチドプローブ種と関連付けられた(結合している)区別用の標識を有する。さらなる実施形態では、複数の異なるオリゴヌクレオチドプローブ種のセットの一部またはすべては、複数のオリゴヌクレオチドプローブ種のプールの他のオリゴヌクレオチドプローブ種とは直接区別可能ではない同じ種類の標識を有する。またさらなる実施形態では、複数のオリゴヌクレオチドプローブ種のプールの1つ以上のオリゴヌクレオチドプローブ種は、標識されていない。 In some embodiments, the pool of oligonucleotide probe species comprises a single oligonucleotide probe species. In other embodiments, the pool of oligonucleotide probe species comprises a plurality of oligonucleotide probe species. In a further embodiment, the pool of oligonucleotide probe species has a distinguishing label associated with (bound to) each single oligonucleotide probe species of the pool of oligonucleotide probe species. In further embodiments, some or all of the set of different oligonucleotide probe species have the same type of label that is not directly distinguishable from other oligonucleotide probe species of the pool of oligonucleotide probe species. In yet further embodiments, one or more oligonucleotide probe species of the pool of plurality of oligonucleotide probe species are unlabeled.

一部の実施形態では、(e)オリゴヌクレオチドプローブ種のセットの各単一のオリゴヌクレオチドプローブ種に対して、曝露(c)および測定(d)を繰り返す。 In some embodiments, (e) exposing (c) and measuring (d) are repeated for each single oligonucleotide probe species of the set of oligonucleotide probe species.

一部の実施形態では、曝露(c)および測定(d)および反復は、順次行われる。他の実施形態では、曝露(c)および測定(d)は同時に行われ、曝露(c)プロセス中に単一のフレームが得られたらすぐに、測定(d)が開始される。さらなる実施形態では、複数の曝露(c)プロセスが、例えば、測定(d)プロセスを行う前に、異なるプールのオリゴヌクレオチドプローブを用いて、行われる。 In some embodiments, exposing (c) and measuring (d) and repeating are performed sequentially. In other embodiments, exposure (c) and measurement (d) are performed simultaneously, and measurement (d) begins as soon as a single frame is obtained during the exposure (c) process. In a further embodiment, multiple exposing (c) processes are performed, eg, with different pools of oligonucleotide probes, before performing the measuring (d) process.

一部の実施形態では、曝露(c)は、単一種を含むか、またはオリゴヌクレオチドプローブのセットの複数のオリゴヌクレオチドプローブ種を含むオリゴヌクレオチドプローブ種の第1のプールに対して、第1の温度で行われ、反復(e)、曝露(c)、および測定(d)は、オリゴヌクレオチドプローブ種の第1のプールに対して、曝露(c)および測定(d)を第2の温度で行うことを含む。 In some embodiments, exposing (c) is to a first pool of oligonucleotide probe species comprising a single species or comprising a plurality of oligonucleotide probe species of a set of oligonucleotide probes. repeating (e), exposing (c), and measuring (d) to a first pool of oligonucleotide probe species, exposing (c) and measuring (d) at a second temperature; Including doing.

一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種の第1のプールに対して、第1の温度で行われ、反復(e)、曝露(c)、および測定(d)の事例は、オリゴヌクレオチドプローブ種の第1のプールに対して、曝露(c)および測定(d)を複数の異なる各温度で行うことを含み、第1の温度および複数の異なる各温度での測定(d)によって記録された光学活性の測定場所および持続時間を使用して、オリゴヌクレオチドプローブ種の第1のプールについての融解曲線を構築することをさらに含む。他の実施形態では、異なる温度の代わりに、異なる塩濃度が使用される。追加の実施形態では、ホルムアミドなどの変性試薬またはpHの変化を使用して、結合親和性を変化させる。さらなる実施形態では、異なる塩濃度、異なる温度、異なるpHレベル、または異なるレベルの変性試薬の任意の組み合わせを、1つ以上のオリゴヌクレオチドプローブ種に対して利用して、融解曲線当量を実現する。 In some embodiments, exposing (c) is to a first pool of oligonucleotide probe species of the set of oligonucleotide probe species at a first temperature, repeating (e), exposing (c) , and measuring (d) include exposing (c) and measuring (d) to a first pool of oligonucleotide probe species at each of a plurality of different temperatures, wherein the first temperature and a plurality of constructing a melting curve for the first pool of oligonucleotide probe species using the optical activity measurement locations and durations recorded by measurements (d) at each different temperature of . In other embodiments, different salt concentrations are used instead of different temperatures. In additional embodiments, denaturing reagents such as formamide or changes in pH are used to alter binding affinity. In further embodiments, any combination of different salt concentrations, different temperatures, different pH levels, or different levels of denaturing reagents are utilized for one or more oligonucleotide probe species to achieve melting curve equivalents.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットは、複数の異なる種類のオリゴヌクレオチドプローブ種のプールを含む複数のサブセットを含み、オリゴヌクレオチドプローブ種の複数のサブセットの複数の異なる種類のオリゴヌクレオチドプローブ種を含むプールの各それぞれのサブセットに対して、反復(e)、曝露(c)、および測定(d)が行われる。一部のかかる実施形態では、各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の2つ以上の異なるオリゴヌクレオチドプローブ種を含む複数の異なる種類のオリゴヌクレオチドプローブ種のプールを含む。代替的に、複数の異なるオリゴヌクレオチドプローブ種のプールを含む各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の4つ以上の異なるオリゴヌクレオチドプローブ種を含む。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットは、オリゴヌクレオチドプローブ種のプールを含む4つのサブセットからなる。一部の実施形態では、本方法は、オリゴヌクレオチドプローブ種のセットを、各オリゴヌクレオチドプローブ種の計算されたまたは実験的に導出された融解温度に基づいて、オリゴヌクレオチドプローブ種のプールを含む複数のサブセットに分割することをさらに含み、同様の融解温度を有するオリゴヌクレオチドプローブ種は、分割によってオリゴヌクレオチドプローブの同じサブセットに配置され、曝露(c)の事例の温度または持続時間は、オリゴヌクレオチドプローブ種のプールを含む対応するサブセットのオリゴヌクレオチドプローブ種の平均融解温度によって決定される。またさらに、一部の実施形態では、本方法は、オリゴヌクレオチドプローブのセットを、各オリゴヌクレオチドプローブ種の配列に基づいて、オリゴヌクレオチドプローブ種のプールを含む複数のサブセットに分割することをさらに含み、配列が重複するオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種のプールを含む異なるサブセットに配置される。 In some embodiments, the set of oligonucleotide probe species comprises a plurality of subsets comprising a pool of a plurality of different types of oligonucleotide probe species, wherein the plurality of different types of oligonucleotides of the plurality of subsets of oligonucleotide probe species Iterations (e), exposures (c), and measurements (d) are performed for each respective subset of the pool containing the probe species. In some such embodiments, each respective subset comprises a pool of multiple different types of oligonucleotide probe species, including two or more different oligonucleotide probe species from the set of oligonucleotide probe species. Alternatively, each respective subset comprising a pool of multiple different oligonucleotide probe species comprises four or more different oligonucleotide probe species from the set of oligonucleotide probe species. In some such embodiments, the set of oligonucleotide probe species consists of four subsets comprising the pool of oligonucleotide probe species. In some embodiments, the method generates a set of oligonucleotide probe species based on a calculated or experimentally derived melting temperature of each oligonucleotide probe species, comprising a pool of oligonucleotide probe species. wherein the oligonucleotide probe species with similar melting temperatures are placed in the same subset of oligonucleotide probes by the splitting, and the temperature or duration in the case of exposure (c) is the oligonucleotide probe Determined by the average melting temperature of the oligonucleotide probe species of the corresponding subset comprising the pool of species. Still further, in some embodiments, the method further comprises dividing the set of oligonucleotide probes into a plurality of subsets comprising pools of oligonucleotide probe species based on the sequence of each oligonucleotide probe species. , oligonucleotide probe species that overlap in sequence are arranged into different subsets comprising pools of oligonucleotide probe species.

一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって得られたデータのフレーム内の光学活性のそれぞれの事例の中心または光学活性のそれぞれの事例の一部分を識別および適合させるための適合関数を用いて、光学活性のそれぞれの事例を識別および適合させることを含み、光学活性のそれぞれの事例の中心は、試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部のかかる実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。 In some embodiments, measuring locations on the test substrate identifies the center of each instance of optical activity or a portion of each instance of optical activity within a frame of data obtained by the two-dimensional imaging device. and a fit function for fitting, wherein the center of each instance of optical activity is the location of each instance of optical activity on the test substrate. is considered. In some such embodiments, the fitness function is a Gaussian function, a first moment function, a gradient-based approach, or a Fourier transform.

一部の実施形態では、光学活性のそれぞれの事例は、二次元撮像デバイスによって測定される複数のフレームにわたって持続し、光学活性のそれぞれの事例を含む複数のフレーム中の単一のフレームは、光学活性のそれぞれの事例の一部分であり、試験基板上の場所を測定することは、複数のフレームにわたる光学活性のそれぞれの事例の中心を識別するために、複数のフレームにわたる適合関数を用いて光学活性のそれぞれの事例を識別および適合させることを含み、光学活性のそれぞれの事例の中心は、複数のフレームにわたる試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部のかかる実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。 In some embodiments, each instance of optical activity persists over multiple frames measured by the two-dimensional imaging device, and a single frame out of the multiple frames comprising each instance of optical activity is an optical Measuring the location on the test substrate that is a fraction of each instance of activity is measured using a fit function over multiple frames to identify the center of each instance of optical activity over multiple frames. , the center of each instance of optical activity is taken to be the position of each instance of optical activity on the test substrate over multiple frames. In some such embodiments, the fitness function is a Gaussian function, a first moment function, a gradient-based approach, or a Fourier transform.

一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって測定されるデータのフレームを、訓練された畳み込みニューラルネットワークに入力することを含み、データのフレームは、光学活性の複数の事例の中の光学活性のそれぞれの事例を含み、複数の光学活性の事例の中の光学活性の各事例は、固定された第1の鎖または固定された第2の鎖の一部分に結合するオリゴヌクレオチド種の個々のオリゴヌクレオチドプローブに対応し、入力に応答して、訓練された畳み込みニューラルネットワークは、光学活性の複数の事例の中の光学活性の1つ以上の事例の各々の試験基板上の位置を識別する。一部の実施形態では、光学活性の複数の事例は、データの1つ以上のフレーム内の異なる位置に存在し、光学活性の複数の異なる位置は、その各々が、曝露ステップにおける光学活性の複数の事例を有し、1つ以上の標的ポリヌクレオチドの第1の鎖および/または第2の鎖上の異なる結合部位に対応する。さらなる実施形態では、同じ位置を有する光学活性のそれぞれの事例は、異なるフレームのセットにわたって生じ、異なる位置を有するそれぞれの光学活性の他の事例と、異なるフレームのセットにわたって、別々におよび/または同時に処理される。 In some embodiments, measuring the location on the test substrate includes inputting frames of data measured by a two-dimensional imaging device into a trained convolutional neural network, the frames of data each instance of optical activity in the plurality of instances of optical activity, wherein each instance of optical activity in the plurality of instances of optical activity is a portion of the immobilized first strand or the immobilized second strand In response to inputs corresponding to individual oligonucleotide probes of the oligonucleotide species that bind to Identify locations on the test board. In some embodiments, the multiple instances of optical activity are present at different locations within one or more frames of data, and the multiple different locations of optical activity each represent a plurality of instances of optical activity in the exposing step. and correspond to different binding sites on the first and/or second strand of one or more target polynucleotides. In further embodiments, each instance of optical activity having the same position occurs over a different set of frames, and each other instance of optical activity having a different position occurs over different sets of frames, separately and/or simultaneously. It is processed.

一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも20nm、少なくとも2nm、少なくとも60nm、または少なくとも6nmの位置決定精度で解像する。 In some embodiments, the measurement resolves the center of each instance of optical activity to a location on the test substrate with a location accuracy of at least 20 nm, at least 2 nm, at least 60 nm, or at least 6 nm.

一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に解像し、位置は、サブ回折限界の正確度および/または精度で決定される。 In some embodiments, the measurement resolves the center of each instance of optical activity to a location on the test substrate, where the location is determined with sub-diffraction limit accuracy and/or precision.

一部の実施形態では、(d)試験基板上の場所およびそれぞれの光学活性の持続時間を測定することは、場所における5,000超の光子、場所における50,000超の光子、または場所における200,000超の光子を測定する。一部の実施形態では、測定(d)に使用される光子の数は、単一のフレームから得られるか、または光学活性の単一の事例を含むとみなされるフレームの組み合わせから得られる。 In some embodiments, (d) measuring the locations on the test substrate and the duration of the respective optical activity is greater than 5,000 photons at the locations, greater than 50,000 photons at the locations, or Over 200,000 photons are measured. In some embodiments, the number of photons used for measurement (d) is obtained from a single frame or from a combination of frames deemed to contain a single instance of optical activity.

一部の実施形態では、光学活性のそれぞれの事例は、試験基板について観察される背景光学活性に比べて、所定の数の標準偏差(例えば、3、4、5、6、7、8、9、または10標準偏差を超える)よりも大きい。 In some embodiments, each instance of optical activity has a predetermined number of standard deviations (e.g., 3, 4, 5, 6, 7, 8, 9 standard deviations) compared to the background optical activity observed for the test substrate. , or more than 10 standard deviations).

一部の実施形態では、複数のオリゴヌクレオチドプローブ種のセットまたはサブセットの各それぞれのオリゴヌクレオチドプローブ種は、固有のN塩基長配列を含み、ここで、Nは、セット{1、2、3、4、5、6、7、8、および9}の中の整数であり、長さNのすべての固有のN塩基長配列は、複数のオリゴヌクレオチドプローブ種を含むセットまたはサブセットによって表される。一部のかかる実施形態では、固有のN塩基長配列は、1つ以上の縮重ヌクレオチド、および1つ以上の普遍的な塩基(例えば、2’-デオキシイノシン、CPG500、5-ニトロインドール)によって占有される1つ以上のヌクレオチド位置を含む。一部のかかる実施形態では、固有のN塩基長配列は、5’で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接し、3’で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、70%超の割合の標的核酸の配列を決定する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、90%超の割合の標的核酸の配列を決定する。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定(f)は、99%超の割合の標的核酸の配列を決定する。一部の実施形態では、決定(f)は、99%超の割合の標的核酸の配列を決定する。 In some embodiments, each respective oligonucleotide probe species of a set or subset of a plurality of oligonucleotide probe species comprises a unique N base long sequence, where N is the set {1, 2, 3, 4, 5, 6, 7, 8, and 9} and all unique N-base long sequences of length N are represented by a set or subset containing a plurality of oligonucleotide probe species. In some such embodiments, the unique N-base long sequence is bounded by one or more degenerate nucleotides and one or more universal bases (eg, 2'-deoxyinosine, CPG500, 5-nitroindole). Contains one or more nucleotide positions that are occupied. In some such embodiments, the unique N-base long sequence is 5′ flanked by a single degenerate nucleotide position or universal nucleotide position and 3′ by a single degenerate nucleotide position or universal flanking nucleotide positions. In some embodiments, the target nucleic acid is at least 140 bases long and determining (f) sequences greater than 70% of the target nucleic acid. In some embodiments, the target nucleic acid is at least 140 bases long and determining (f) sequences greater than 90% of the target nucleic acid. In some embodiments, the target nucleic acid is at least 140 bases long and determining (f) sequences greater than 99% of the target nucleic acid. In some embodiments, determining (f) sequences greater than 99% of the target nucleic acids.

一部の実施形態では、標的核酸は、少なくとも10,000塩基長であるか、または少なくとも1,000,000塩基長である。 In some embodiments, the target nucleic acid is at least 10,000 bases long, or at least 1,000,000 bases long.

一部の実施形態では、試験基板は、曝露(c)および測定(d)を反復する前に洗浄され、それによって、試験基板をオリゴヌクレオチドプローブ種のセットにおける1つ以上のオリゴヌクレオチドプローブ種に曝露する前に、1つ以上のオリゴヌクレオチドプローブ種を試験基板から除去する。 In some embodiments, the test substrate is washed prior to repeating exposing (c) and measuring (d), thereby exposing the test substrate to one or more oligonucleotide probe species in the set of oligonucleotide probe species. One or more oligonucleotide probe species are removed from the test substrate prior to exposure.

一部の実施形態では、固定(a)は、分子コーミング(molecular combing)(後退メニスカス)、フロー伸展(flow stretching)、ナノ束縛(nanoconfinement)、または電気伸展(electro-stretching)によって、核酸を、試験基板に適用することを含む。 In some embodiments, immobilization (a) comprises the nucleic acid by molecular combing (receding meniscus), flow stretching, nanoconfinement, or electro-stretching; Including applying to the test substrate.

一部の実施形態では、光学活性の各それぞれの事例は、所定の閾値を満たす観測メトリックを有する。一部のかかる実施形態では、観測メトリックは、持続時間、シグナル・ノイズ比、光子計数、または強度を含む。一部の実施形態では、所定の閾値は、(i)固有のN塩基長配列の各塩基または各非縮重塩基および/もしくは非普遍的塩基が、標的核酸の固定された第1の鎖または固定された第2の鎖の相補塩基に結合する、第1の結合形態と、(ii)固有のN塩基長配列の塩基または各非縮重塩基および/もしくは非普遍的塩基と、それぞれのオリゴヌクレオチドプローブが光学活性のそれぞれの事例を形成するように結合している標的核酸の固定された第1の鎖または固定された第2の鎖の配列との間に、少なくとも1つの不一致が存在する、第2の結合形態と、を区別する。 In some embodiments, each respective instance of optical activity has an observed metric that meets a predetermined threshold. In some such embodiments, the observation metric includes duration, signal-to-noise ratio, photon count, or intensity. In some embodiments, the predetermined threshold is that (i) each base of a unique N-base long sequence or each non-degenerate base and/or non-universal base is a fixed first strand of the target nucleic acid or a first binding form that binds to complementary bases of the immobilized second strand; and (ii) a unique N-base long sequence of bases or each non-degenerate and/or non-universal base; There is at least one mismatch between the sequence of the immobilized first strand or the immobilized second strand of the target nucleic acid to which the nucleotide probe is bound to form each instance of optical activity , from the second binding form.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種は、固有の対応する所定の閾値を有する。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来し、訓練セットは、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種について、それぞれのオリゴヌクレオチドプローブ種の固有のN塩基長配列の各塩基または各非縮重塩基および/もしくは非普遍的塩基が参照配列の相補塩基に結合するように参照配列に結合した際の、それぞれのオリゴヌクレオチドプローブについての観察メトリックの尺度を含む。一部のかかる実施形態では、参照配列は、参照基板上に固定される。代替的に、参照配列は、標的核酸とともに含まれ、標的核酸から分離されるか、またはそれにライゲーションされ、試験基板上に固定される。一部の実施形態では、参照配列は、PhiX174、M13、ラムダファージ、T7ファージ、大腸菌(Escherichia coli)、酵母(Saccharomyces cerevisiae)、分裂酵母(Saccharomyces pombe)、または任意の他の天然に存在するゲノムもしくはトランスクリプトームのゲノムのすべてまたは一部分を含む。一部の実施形態では、参照配列は、既知の配列の合成構築物である。一部の実施形態では、参照配列は、ウサギグロビンRNAのすべてまたは一部分を含む。 In some embodiments, each respective oligonucleotide probe species of the set of oligonucleotide probe species has a unique corresponding predetermined threshold value. In some such embodiments, the predetermined threshold for each respective oligonucleotide probe species of the set of oligonucleotide probe species is derived from the training data set. In some embodiments, the predetermined threshold value for each respective oligonucleotide probe species of the set of oligonucleotide probe species is derived from a training data set, the training set comprising each respective oligonucleotide of the set of oligonucleotide probe species. For the nucleotide probe species, each base of the unique N-base long sequence of each oligonucleotide probe species or each non-degenerate and/or non-universal base was bound to the reference sequence such that it bound to the complementary base of the reference sequence. Includes a measure of the observed metric for each oligonucleotide probe at the time. In some such embodiments, the reference sequences are immobilized on a reference substrate. Alternatively, the reference sequence is included with the target nucleic acid, separated from or ligated to it and immobilized on the test substrate. In some embodiments, the reference sequence is PhiX174, M13, phage lambda, phage T7, Escherichia coli, Saccharomyces cerevisiae, Saccharomyces pombe, or any other naturally occurring genome. or includes all or part of the genome of the transcriptome. In some embodiments, the reference sequence is a synthetic construct of known sequence. In some embodiments, the reference sequence comprises all or part of rabbit globin RNA.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、固定された第1の鎖の相補部分に結合することによって、光学活性の第1の事例を生じ、固定された第2の鎖の相補部分に結合することによって、光学活性の第2の事例を生じる。 In some embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species produces a first instance of optical activity by binding to the complementary portion of the immobilized first strand and is immobilized. A second instance of optical activity is produced by binding to the complementary portion of the second strand.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、固定された第1の鎖の2つ以上の相補部分に結合することによって、試験基板上の異なる位置での光学活性の2つ以上の事例を生じさせ、および/または固定された第2の鎖の2つ以上の相補部分に結合することによって、試験基板上の異なる位置での光学活性の2つ以上の第2の事例を生じさせる。 In some embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species is positioned at different locations on the test substrate by binding to two or more complementary portions of the immobilized first strand. Two or more instances of optical activity at different locations on the test substrate by producing two or more instances of optical activity and/or binding to two or more complementary portions of the immobilized second strand. Give rise to the second case.

一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露(c)中、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、同じ位置で2回以上結合し、それによって、2つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。 In some embodiments, each oligonucleotide probe species is exposed to a portion of the immobilized first strand or the immobilized second strand that is complementary to the respective oligonucleotide probe species during exposure (c). , bind at the same position more than once, thereby giving rise to more than one instance of optical activity, each instance of optical activity representing a binding event of multiple binding events.

一部の実施形態では、それぞれのオリゴヌクレオチドプローブは、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、複数の位置で結合し、各位置で複数回結合し、曝露(c)中、光学活性の各位置で、光学活性の複数の事例を潜在的に生成し、光学活性の各事例は、複数の結合事象の結合事象を表す。 In some embodiments, each oligonucleotide probe is attached at multiple positions to a portion of the immobilized first strand or immobilized second strand that is complementary to the respective oligonucleotide probe species. , binds multiple times at each position, potentially generating multiple instances of optical activity at each location of optical activity during exposure (c), each instance of optical activity resulting in binding events of multiple binding events. show.

一部の実施形態では、曝露(c)は、5分間以上、5分間以下、2分間以下、または1分間以下で生じる。 In some embodiments, exposure (c) occurs for 5 minutes or more, 5 minutes or less, 2 minutes or less, or 1 minute or less.

一部の実施形態では、曝露(c)は、二次元撮像デバイスの1つ以上のフレーム、二次元撮像デバイスの2つ以上のフレーム、二次元撮像デバイスの500個以上のフレーム、または二次元撮像デバイスの5,000個以上のフレームにわたって生じる。 In some embodiments, the exposure (c) is one or more frames of a two-dimensional imaging device, two or more frames of a two-dimensional imaging device, 500 or more frames of a two-dimensional imaging device, or Occurs over 5,000 frames of the device.

一部の実施形態では、複数の二次元撮像デバイスが、同時および/または順次のいずれかで利用され、複数の二次元撮像デバイスの各々は、特定の種類の標識を検出するように最適化され、それによって、複数の異なるオリゴヌクレオチドプローブ種と関連付けられた複数の標識のデータの同時収集を可能にする。 In some embodiments, multiple two-dimensional imaging devices are utilized, either simultaneously and/or sequentially, each of the multiple two-dimensional imaging devices optimized to detect a particular type of label. , thereby allowing simultaneous collection of data for multiple labels associated with multiple different oligonucleotide probe species.

一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の期間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、第2の期間曝露(c)を行うことを含み、第1の期間は、第2の期間とは異なる。 In some embodiments, exposing (c) is to a first oligonucleotide probe species of a set of oligonucleotide probe species for a first period of time, repeating (e), exposing (c), and measuring (d) includes exposing (c) to the second oligonucleotide probe species for a second period of time, the first period of time being different than the second period of time.

一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第1の数のフレーム間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第2の数のフレーム間曝露(c)を行うことを含み、第1の数のフレームは、第2の数のフレームとは異なる。 In some embodiments, exposing (c) is to the first oligonucleotide probe species of the set of oligonucleotide probe species for a first number of frames of the two-dimensional imaging device, repeating (e) , exposing (c), and measuring (d) comprises performing a second number of frame-to-frame exposures (c) of the two-dimensional imaging device to the second oligonucleotide probe species, wherein the first number is different from the second number of frames.

一部の実施形態では、曝露(c)は、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第1の数のフレーム間行われ、反復(e)、曝露(c)、および測定(d)は、第2のオリゴヌクレオチドプローブ種に対して、二次元撮像デバイスの第2の数のフレーム間曝露(c)を行うことを含み、第1の数のフレームの各フレームの曝露時間は、第2の数のフレームの各フレームの曝露時間とは異なる。 In some embodiments, exposing (c) is to the first oligonucleotide probe species of the set of oligonucleotide probe species for a first number of frames of the two-dimensional imaging device, repeating (e) , exposing (c), and measuring (d) comprises performing a second number of frame-to-frame exposures (c) of the two-dimensional imaging device to the second oligonucleotide probe species, wherein the first number The exposure time of each frame of the frames is different than the exposure time of each frame of the second number of frames.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さである。 In some embodiments, each oligonucleotide probe species of a set of oligonucleotide probe species is the same length.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さMであり、Mは、2以上の正の整数であり(例えば、Mは、2、3、4、5、6、7、8、9、10、または10以上)、(f)試験基板上の複数の位置のセットからの標的核酸の少なくとも一部分の配列を決定することは、複数の位置のセットによって表される異なるオリゴヌクレオチドプローブ種の重複配列をさらに使用する。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種のセットの別のオリゴヌクレオチドプローブと、M-1個の配列相同性を共有する。一部のかかる実施形態では、試験基板上の複数の位置のセットからの標的核酸の少なくとも一部分の配列を決定することは、固定された第1の鎖に対応する第1のタイリング経路および固定された第2の鎖に対応する第2のタイリング経路を決定することを含む。一部のかかる実施形態では、第1のタイリング経路における切れ目(break)は、第2のタイリング経路の対応する部分を使用して解決され、第2のタイリング経路は、第1のタイリング経路に相補的である。他の実施形態では、第1のタイリング経路または第2のタイリング経路における切れ目は、参照配列を使用して解決される。他の実施形態では、第1のタイリング経路または第2のタイリング経路の切れ目は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して解決される。一部のかかる実施形態では、標的核酸配列の配列割当の信頼度は、第1のタイリング経路および第2のタイリング経路の対応する部分を使用して増加する。他の実施形態では、標的核酸配列の配列割当の信頼度は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して増加する。 In some embodiments, each oligonucleotide probe species of a set of oligonucleotide probe species has the same length M, where M is a positive integer greater than or equal to 2 (eg, M is 2, 3, 4 , 5, 6, 7, 8, 9, 10, or 10 or more), (f) sequencing at least a portion of the target nucleic acid from the set of multiple locations on the test substrate comprises Overlapping sequences of different oligonucleotide probe species represented by are also used. In some such embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species shares M−1 sequence homology with another oligonucleotide probe of the set of oligonucleotide probe species. In some such embodiments, sequencing at least a portion of the target nucleic acid from the set of multiple locations on the test substrate comprises a first tiling pathway corresponding to the immobilized first strand and immobilized determining a second tiling path corresponding to the generated second strand. In some such embodiments, a break in the first tiling path is resolved using a corresponding portion of the second tiling path, the second tiling path Complementary to the ring pathway. In other embodiments, discontinuities in the first tiling path or the second tiling path are resolved using a reference array. In other embodiments, the break in the first or second tiling pathway is the corresponding portion of the third or fourth tiling pathway from another instance of the target nucleic acid. is resolved using In some such embodiments, the confidence of the sequence assignment of the target nucleic acid sequence is increased using corresponding portions of the first tiling pathway and the second tiling pathway. In other embodiments, the confidence of the sequence assignment of the target nucleic acid sequence is increased using the corresponding portion of the third tiling pathway or fourth tiling pathway obtained from another instance of the target nucleic acid. .

一部の実施形態では、曝露(c)の事例の時間の長さは、曝露(c)の事例で使用されたオリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種の推定融解温度によって決定される。 In some embodiments, the length of time for instance exposure (c) is determined by the estimated melting temperature of each oligonucleotide probe species in the set of oligonucleotide probe species used in instance exposure (c). be.

一部の実施形態では、本方法は、(f)固定された二本鎖または固定された第1の鎖および固定された第2の鎖を、抗体、アフィマー、ナノボディ、アプタマー、またはメチル結合タンパク質に曝露することをさらに含み、それによって、標的核酸への修飾を決定するか、または試験基板上の複数の位置のセットからの標的核酸の一部分の配列と相関させる。一部の実施形態では、本方法は、標的核酸の一部分を含み得る様々なエピジェネティック修飾の決定を可能にし得る。 In some embodiments, the method comprises (f) combining the immobilized duplex or the immobilized first strand and the immobilized second strand with an antibody, affimer, nanobody, aptamer, or methyl binding protein to thereby determine modifications to the target nucleic acid or correlate with the sequence of portions of the target nucleic acid from a set of multiple locations on the test substrate. In some embodiments, the method may allow determination of various epigenetic modifications that may comprise a portion of the target nucleic acid.

一部の実施形態では、試験基板は、二次元表面を含み得る。一部のかかる実施形態では、二次元表面は、ゲルまたはマトリックスでコーティングされている。 In some embodiments, the test substrate can include a two-dimensional surface. In some such embodiments, the two-dimensional surface is coated with a gel or matrix.

一部の実施形態では、試験基板は、フローセル、セル、三次元マトリックス、またはゲルを含み得る。 In some embodiments, test substrates can include flow cells, cells, three-dimensional matrices, or gels.

一部の実施形態では、試験基板は、固定(a)の前に、配列特異的オリゴヌクレオチドプローブ種と結合され、固定(a)は、試験基板に結合した配列特異的オリゴヌクレオチドプローブ種を使用して、試験基板上で標的核酸を捕捉することを含み得る。 In some embodiments, the test substrate is bound with the sequence-specific oligonucleotide probe species prior to immobilization (a), wherein immobilization (a) uses the sequence-specific oligonucleotide probe species bound to the test substrate. and capturing the target nucleic acid on the test substrate.

一部の実施形態では、配列特異的オリゴヌクレオチドプローブ種は、試験基板の表面に結合し、天然オリゴヌクレオチド塩基よりも高い融解温度を有し、標的核酸の変性を可能にし得る、PNA塩基および/またはLNA塩基などの塩基を含んでいてもよい。一部の実施形態では、複数の異なる配列特異的オリゴヌクレオチドプローブ種は、相補的であり、それによって、標的核酸の第1の鎖および第2の鎖の結合が可能になり、これにより、各単一の標的核酸から、標的核酸の塩基をより高い割合で決定することが可能になり得る。 In some embodiments, the sequence-specific oligonucleotide probe species are bound to the surface of the test substrate, have higher melting temperatures than natural oligonucleotide bases, and can allow denaturation of target nucleic acids, PNA bases and/or PNA bases. Alternatively, it may contain bases such as LNA bases. In some embodiments, the plurality of different sequence-specific oligonucleotide probe species are complementary, thereby allowing binding of the first and second strands of the target nucleic acid, thereby allowing each From a single target nucleic acid, it may be possible to determine a higher percentage of the bases of the target nucleic acid.

一部の実施形態では、核酸は、追加の複数の細胞成分を含む溶液中に存在し、固定(a)または変性(b)は、標的核酸が試験基板に固定された後、および曝露(c)の前に、試験基板を洗浄することをさらに含んでもよく、それによって、標的核酸から遊離した追加の複数の細胞成分を精製する。 In some embodiments, the nucleic acid is in a solution comprising additional cellular components, fixation (a) or denaturation (b) is performed after the target nucleic acid has been fixed to the test substrate, and exposure (c ), it may further comprise washing the test substrate, thereby purifying additional plurality of cellular components released from the target nucleic acid.

一部の実施形態では、試験基板は、曝露(c)の前に、ポリエチレングリコール、ウシ血清アルブミン-ビオチン-ストレプトアビジン、カゼイン、ウシ血清アルブミン(BSA)、1つ以上の異なるtRNA、1つ以上の異なるデオキシリボヌクレオチド、1つ以上の異なるリボヌクレオチド、サケ精子DNA、プルロニックF-127、Tween-20、水素シルセスキオキサン(HSQ)、またはそれらの任意の組み合わせで不動態化(passivated)される。 In some embodiments, the test substrate prior to exposure (c) comprises polyethylene glycol, bovine serum albumin-biotin-streptavidin, casein, bovine serum albumin (BSA), one or more different tRNAs, one or more different deoxyribonucleotides, one or more different ribonucleotides, salmon sperm DNA, Pluronic F-127, Tween-20, hydrogen silsesquioxane (HSQ), or any combination thereof .

一部の実施形態では、試験基板は、固定(a)の前に、7-オクテニルトリクロロシランまたはメタクリルオキシプロピルトリメトキシシランを含むビニルシランコーティングでコーティングされる。 In some embodiments, the test substrate is coated with a vinylsilane coating comprising 7-octenyltrichlorosilane or methacryloxypropyltrimethoxysilane prior to fixation (a).

本開示の別の態様は、核酸を配列決定する方法を提供し、(a)標的核酸を、試験基板上で線状化され伸展された形態で固定し、それによって、固定伸展標的核酸を形成することと、(b)固定伸展標的核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することであって、オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の配列および長さであり、曝露(b)を、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定標的核酸の各部分に一時的かつ可逆的に可能にする条件下で行い、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、(c)二次元撮像デバイスを使用して、試験基板上の場所を測定することと、および、任意選択的に、曝露(b)中に生じる光学活性の各それぞれの事例の持続時間を測定することと、(d)オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、曝露(b)および測定(c)を反復し、それによって、試験基板上の複数の位置のセットを取得することであって、試験基板上の各それぞれの位置のセットが、オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応し得る、取得することと、(e)複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから、標的核酸の少なくとも一部分の配列を決定することであって、位置のセットが、試験基板上の異なる位置および/または同じ位置における光学活性の場所を含み得る、決定することと、を含む。一部のかかる実施形態では、標的核酸は、二本鎖核酸であり、本方法は、試験基板上で、標的固定二本鎖核酸を一本鎖形態に変性させ、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得ることをさらに含み得、固定された第2の鎖は、固定された第1の鎖に相補的である。一部の実施形態では、標的核酸は、一本鎖RNAである。 Another aspect of the present disclosure provides a method of sequencing a nucleic acid, comprising: (a) immobilizing a target nucleic acid in a linearized and stretched form on a test substrate, thereby forming a immobilized stretched target nucleic acid; and (b) exposing the fixed extension target nucleic acid to a respective pool of each oligonucleotide probe species of the set of oligonucleotide probe species, wherein each oligonucleotide probe species in the set of oligonucleotide probe species is of a given sequence and length, and exposes (b) the immobilized target nucleic acids in which the individual oligonucleotide probes of the respective pools of the respective oligonucleotide probe species are complementary to the respective oligonucleotide probe species. exposing under conditions that allow each portion to be transiently and reversibly thereby giving rise to each instance of optical activity; and (c) using a two-dimensional imaging device, on a test substrate and optionally measuring the duration of each respective instance of optical activity occurring during the exposure (b); and (d) each repeating exposing (b) and measuring (c) for the oligonucleotide probe species, thereby obtaining a set of multiple locations on the test substrate, wherein each respective location on the test substrate on a test substrate by obtaining, where the set may correspond to oligonucleotide probe species in the set of oligonucleotide probe species; Determining the sequence of at least a portion of the target nucleic acid from a set of multiple locations of the set of locations may include locations of optical activity at different locations and/or at the same location on the test substrate. including. In some such embodiments, the target nucleic acid is a double-stranded nucleic acid and the method denatures the target-immobilized double-stranded nucleic acid to a single-stranded form on the test substrate, thereby immobilizing the target nucleic acid. Obtaining an immobilized first strand and an immobilized second strand, wherein the immobilized second strand is complementary to the immobilized first strand. In some embodiments, the target nucleic acid is single-stranded RNA.

本開示の別の態様は、核酸を分析する方法を提供し、(a)二本鎖形態の標的核酸を、試験基板上で固定し、それによって、固定二本鎖核酸を形成することと、(b)標的固定二本鎖核酸を、試験基板上で一本鎖形態に変性させることであって、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得、固定された第2の鎖が、固定された第1の鎖に相補的である、変性させることと、(c)固定された第1の鎖および固定された第2の鎖を、1つ以上のオリゴヌクレオチドプローブ種に曝露し、1つ以上のオリゴヌクレオチドプローブ種が、固定された第1の鎖または固定された第2の鎖に結合するかどうかを決定することと、を含み得る。 Another aspect of the disclosure provides a method of analyzing nucleic acids, comprising: (a) immobilizing a target nucleic acid in double-stranded form on a test substrate, thereby forming an immobilized double-stranded nucleic acid; (b) denaturing the target-immobilized double-stranded nucleic acid to a single-stranded form on a test substrate, thereby obtaining an immobilized first strand and an immobilized second strand of the target nucleic acid; denaturing, wherein the immobilized second strand is complementary to the immobilized first strand; and (c) combining the immobilized first strand and the immobilized second strand into one exposing to more than one oligonucleotide probe species and determining whether the one or more oligonucleotide probe species bind to the immobilized first strand or the immobilized second strand.

ここで、例示的なシステムの詳細を、図1Aと併せて説明する。図1Aは、一部の実施態様によるシステム100を示すブロック図である。一部の実施態様では、デバイス100は、1つ以上の処理ユニット(CPU)102(プロセッサまたは処理コアとも称される)、1つ以上のネットワークインターフェース104、ユーザーインターフェース106、非永続的メモリ111、永続的メモリ112、およびこれらの構成要素を相互接続するための1つ以上の通信バス114を含み得る。1つ以上の通信バス114は、任意選択的に、システム構成要素間の通信を相互接続および制御する回路(チップセットと呼ばれることもある)を含む。非永続的メモリ111は、典型的には、DRAM、SRAM、DDR RAMなどの高速ランダムアクセスメモリを含むが、永続的メモリ112は、典型的には、CD-ROM、デジタル多用途ディスク(DVD)または他の光学記憶デバイス、磁気カセット、磁気テープ、磁気ディスク記憶デバイスまたは他の磁気記憶デバイス、磁気ディスク記憶デバイス、光学ディスク記憶デバイス、ROM、EEPROM、フラッシュメモリデバイス、または他の不揮発性固体記憶デバイスを含む。永続的メモリ112は、任意選択的に、CPU102から遠隔的に位置する1つ以上の記憶デバイスを含む。永続的メモリ112は、非一時的コンピュータ可読記憶媒体を含む。一部の実施態様では、非永続的メモリ111、または代替的に、非一時的コンピュータ可読記憶媒体は、時に、永続的メモリ112と併せて、以下のプログラム、モジュール、およびデータ構造、またはそのサブセットを記憶し得る:
●様々な基本システムサービスを扱い、ハードウェア依存タスクを行うためのプロシージャを含み得る、任意選択的なオペレーティングシステム116、
●システム100を他のデバイスと接続するための任意選択的なネットワーク通信モジュール(または命令)118、または通信ネットワーク、
●標的分子130に関する情報を収集するための光学活性検出モジュール120と、
●標的分子130についての光学活性の位置のセットと直接的に相関し得る、複数の結合部位における各それぞれの結合部位140に関する情報、
●(i)持続時間144、および(ii)放出された光子数146を含み得る、各結合部位140の複数の結合事象における各それぞれの結合事象142に関する情報、
●標的分子130の配列を決定するための配列決定モジュール150、
●(i)ベースコール152、および(ii)確率154を含み得る、各標的分子130の複数の結合部位における各それぞれの結合部位140に関する情報、
●各標的分子130の参照ゲノム160に関する任意選択的な情報、および
●各標的分子130の相補鎖170に関する任意選択的な情報。
Details of an exemplary system will now be described in conjunction with FIG. 1A. FIG. 1A is a block diagram illustrating system 100 according to some implementations. In some implementations, device 100 includes one or more processing units (CPUs) 102 (also referred to as processors or processing cores), one or more network interfaces 104, user interfaces 106, non-persistent memory 111, It may include persistent memory 112 and one or more communication buses 114 for interconnecting these components. One or more communication buses 114 optionally include circuitry (sometimes called a chipset) that interconnects and controls communications between system components. Non-persistent memory 111 typically includes high-speed random access memory such as DRAM, SRAM, DDR RAM, while persistent memory 112 typically includes CD-ROMs, Digital Versatile Disks (DVDs), or other optical storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device, magnetic disk storage device, optical disk storage device, ROM, EEPROM, flash memory device, or other non-volatile solid state storage device including. Persistent memory 112 optionally includes one or more storage devices located remotely from CPU 102 . Persistent memory 112 includes non-transitory computer-readable storage media. In some implementations, non-persistent memory 111, or alternatively, non-transitory computer-readable storage media, sometimes in conjunction with persistent memory 112, includes the following programs, modules, and data structures, or a subset thereof: can be stored:
- an optional operating system 116, which handles various basic system services and may contain procedures for performing hardware dependent tasks;
an optional network communication module (or instructions) 118 or communication network for connecting the system 100 with other devices;
- an optically active detection module 120 for gathering information about the target molecule 130;
- information about each respective binding site 140 in the plurality of binding sites that can be directly correlated with the set of optically active positions for the target molecule 130;
- information about each respective binding event 142 in the plurality of binding events for each binding site 140, which may include (i) duration 144, and (ii) number of photons emitted 146;
- a sequencing module 150 for determining the sequence of the target molecule 130;
- information about each respective binding site 140 in the plurality of binding sites of each target molecule 130, which may include (i) base calls 152, and (ii) probabilities 154;
• optional information about the reference genome 160 of each target molecule 130 and • optional information about the complementary strand 170 of each target molecule 130 .

様々な実施態様では、上記識別された要素のうちの1つ以上は、前述の記憶デバイスのうちの1つ以上に記憶され、上記の機能を実行するための命令のセットに対応する。本明細書では、上記で識別されたモジュール、データ、またはプログラム(例えば、命令のセット)は、別個のソフトウェアプログラム、プロシージャ、データセット、またはモジュールとして実装される必要はなく、したがって、これらのモジュールおよびデータの様々なサブセットは、様々な実施態様において組み合わされるか、またはそうでなければ再編成される。一部の実施態様では、非永続的メモリ111は、任意選択的に、上で識別されたモジュールおよびデータ構造のサブセットを記憶する。さらに、一部の実施形態では、非永続的メモリ111または永続的メモリ112は、上に記載されていない追加のモジュールおよびデータ構造を記憶する。一部の実施形態では、上で識別された要素のうちの1つ以上は、視覚化システム100の要素以外のコンピュータシステムに記憶され、視覚化システム100によってアドレス指定可能であり、視覚化システム100は、必要に応じて、そのようなデータのすべてまたは一部分を取得し得る。 In various implementations, one or more of the identified elements are stored in one or more of the aforementioned storage devices and correspond to sets of instructions for performing the functions described above. As used herein, the modules, data, or programs (eg, sets of instructions) identified above need not be implemented as separate software programs, procedures, data sets, or modules; and various subsets of the data are combined or otherwise rearranged in various implementations. In some implementations, non-persistent memory 111 optionally stores a subset of the modules and data structures identified above. Additionally, in some embodiments, non-persistent memory 111 or persistent memory 112 stores additional modules and data structures not described above. In some embodiments, one or more of the elements identified above are stored in a computer system other than an element of visualization system 100 and are addressable by visualization system 100, and visualization system 100 may obtain all or part of such data, as appropriate.

ネットワーク通信モジュール118の例としては、これらに限定されないが、ワールドワイドウェブ(WWW)、イントラネット、ローカルエリアネットワーク(LAN)、コントローラエリアネットワーク(CAN)、カメラリンクおよび/または携帯電話ネットワーク、無線ローカルエリアネットワーク(WLAN)および/または無線ネットワーク(メトロポリタンエリアネットワーク(MAN)、ならびに無線通信による他のデバイスなど)が挙げられる。有線または無線通信は、任意選択的に、複数の通信規格、通信プロトコルおよび/または通信技術のいずれかを使用、これらに限定されないが、モバイル通信のためのグローバルシステム(GSM)、拡張データGSM環境(EDGE)、高速ダウンリンクパケット接続(HSDPA)、高速アップリンクパケット接続(HSUPA)、Evolution、Data-Only(EV-DO)、HSPA、HSPA+、デュアルセルHSPA(DC-HSPDA)、ロングタームエボリューション(LTE)、近距離無線通信(NFC)、広帯域符号分割多元接続(W-CDMA)、符号分割多元接続(CDMA)、時間分割多元接続(TDMA)、ブルートゥース、ワイヤレスフィデリティ(Wi-Fi)(例えば、IEEE802.11a、IEEE802.11ac、IEEE802.11ax、IEEE802.11b、IEEE802.11gおよび/またはIEEE802.11n)、ボイスオーバーインターネットプロトコル(VoIP)、Wi-MAX、電子メール用のプロトコル(例えば、インターネットアクセスプロトコル(IMAP)および/またはポストプロトコル(POP))、インスタントメッセージ(例えば、拡張可能なメッセージングおよびプレゼンスプロトコル(XMPP)、インスタントメッセージングおよびプレゼンス利用拡張向けセッション開始プロトコル(SIMPLE)、インスタントメッセージングおよびプレゼンスサービス(IMPS))、および/またはショートメッセージサービス(SMS)、あるいは本開示の出願日現在でまだ開発されていない通信プロトコルを含む任意の他の好適な通信プロトコルが含まれる。 Examples of network communication module 118 include, but are not limited to, World Wide Web (WWW), Intranet, Local Area Network (LAN), Controller Area Network (CAN), Camera Link and/or Cellular Network, Wireless Local Area networks (WLANs) and/or wireless networks (such as metropolitan area networks (MANs) and other devices with wireless communication). Wired or wireless communication optionally uses any of multiple communication standards, communication protocols and/or communication technologies, including, but not limited to, Global System for Mobile Communications (GSM), Extended Data GSM Environment. (EDGE), High Speed Downlink Packet Access (HSDPA), High Speed Uplink Packet Access (HSUPA), Evolution, Data-Only (EV-DO), HSPA, HSPA+, Dual Cell HSPA (DC-HSPDA), Long Term Evolution ( LTE), Near Field Communication (NFC), Wideband Code Division Multiple Access (W-CDMA), Code Division Multiple Access (CDMA), Time Division Multiple Access (TDMA), Bluetooth, Wireless Fidelity (Wi-Fi) (e.g. IEEE802.11a, IEEE802.11ac, IEEE802.11ax, IEEE802.11b, IEEE802.11g and/or IEEE802.11n), Voice over Internet Protocol (VoIP), Wi-MAX, protocols for email (e.g. Internet Access Protocol (IMAP) and/or Post Protocol (POP)), instant messaging (e.g. Extensible Messaging and Presence Protocol (XMPP), Session Initiation Protocol for Enhanced Instant Messaging and Presence Usage (SIMPLE), Instant Messaging and Presence Service (IMPS) )), and/or Short Message Service (SMS), or any other suitable communication protocol, including a communication protocol not yet developed as of the filing date of this disclosure.

図1Aは、「システム100」を示すが、図は、本明細書に記載の実施態様の構造的概略図というよりも、コンピュータシステムに存在する様々な特徴の機能的な説明として意図されている。実際には、当業者によって認識されるように、別々に示されたアイテムを組み合わせることができ、いくつかのアイテムを分離することができる。さらに、図1Aは、非永続的メモリ111内の特定のデータおよびモジュールを示すが、これらのデータおよびモジュールの一部またはすべては、永続的メモリ112内にある。さらに、一部の実施形態では、メモリ111および/または112は、上に記載されていない追加のモジュールおよびデータ構造を記憶する。他の実施形態では、1つ以上の異なるハードウェアモジュール(図示せず)は、1つ以上の二次元撮像デバイス、レーザおよび格子またはフィルタホイールおよび関連するコントローラを含む光学システム、ならびに様々なポンプ、バルブ、ヒーターおよび他の機械システムを含む流体システムなどの、システム100の一部として含まれている。 Although FIG. 1A shows a "system 100," the figure is intended as a functional illustration of the various features present in a computer system rather than as a structural schematic of the implementations described herein. . In practice, items shown separately could be combined and some items could be separated, as recognized by those skilled in the art. Further, although FIG. 1A shows certain data and modules within non-persistent memory 111 , some or all of these data and modules reside within persistent memory 112 . Additionally, in some embodiments, memory 111 and/or 112 store additional modules and data structures not described above. In other embodiments, one or more different hardware modules (not shown) comprise one or more two-dimensional imaging devices, optical systems including lasers and gratings or filter wheels and associated controllers, and various pumps, Included as part of system 100, such as fluid systems including valves, heaters and other mechanical systems.

本開示によるシステムは、図1Aを参照して開示されているが、本開示による方法は、図2A、図2B、図3、および図4を参照して、ここで詳細に説明される。 A system according to the present disclosure has been disclosed with reference to FIG. 1A, while a method according to the present disclosure will now be described in detail with reference to FIGS. 2A, 2B, 3, and 4. FIG.

ブロック202。標的核酸である分子の化学構造を決定する方法が提供される。本開示の目標は、標的核酸の単一ヌクレオチド分解能の配列決定を可能にすることである。一部の実施形態では、オリゴヌクレオチドプローブ種または他の分子を含む1つ以上のプローブと、標的核酸または他の分子との間の相互作用を特徴付ける方法が提供される。本方法は、1つ以上のプローブ種を、標的核酸または他の分子に一過的に結合させる条件下で、オリゴヌクレオチドプローブ種または別の分子を含み得る1つ以上のプローブを、標的核酸または他の分子に添加することを含む。本方法は、検出器で(1つ以上の二次元撮像デバイスを含んでもよい)、標的核酸または他の分子上の個々の結合事象を連続的に監視することによって進行してもよく、ある期間にわたって、または一連のフレームにわたって、結合事象を記録することを含んでもよい。次いで、結合事象からのデータを分析して、相互作用の1つ以上の特徴が決定され得る。 block 202; A method is provided for determining the chemical structure of a molecule that is a target nucleic acid. A goal of the present disclosure is to enable single-nucleotide resolution sequencing of target nucleic acids. In some embodiments, methods are provided for characterizing interactions between one or more probes, including oligonucleotide probe species or other molecules, and target nucleic acids or other molecules. The method involves binding one or more probes, which may include an oligonucleotide probe species or another molecule, to a target nucleic acid or other molecule under conditions that allow the one or more probe species to transiently bind to the target nucleic acid or other molecule. Including adding to other molecules. The method may proceed by continuously monitoring individual binding events on the target nucleic acid or other molecule with a detector (which may include one or more two-dimensional imaging devices), over a period of time or over a series of frames. Data from binding events can then be analyzed to determine one or more characteristics of the interaction.

一部の実施形態では、同一性(標的核酸であるポリマーの配列)を決定する方法が提供される。一部の実施形態では、細胞または組織の同一性を決定する方法が提供される。一部の実施形態では、生物の同一性を決定する方法が提供される。一部の実施形態では、個体の同一性を決定する方法が提供される。一部の実施形態では、本方法は、単一細胞の核酸および/またはタンパク質の配列決定に適用される。 In some embodiments, methods of determining identity (sequence of a polymer that is a target nucleic acid) are provided. In some embodiments, methods of determining cell or tissue identity are provided. In some embodiments, methods of determining the identity of an organism are provided. In some embodiments, methods of determining the identity of an individual are provided. In some embodiments, the method is applied to single-cell nucleic acid and/or protein sequencing.

標的ポリヌクレオチド。
一部の実施形態では、分子は、標的核酸であり、天然の標的ポリヌクレオチドであるか、または天然ポリヌクレオチドのコピーである。様々な実施形態では、本方法は、単一細胞、単一のオルガネラ、単一の染色体、単一のウイルス、エキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、単一の標的ポリヌクレオチド分子を抽出することをさらに含み得、これらは試料として、本明細書にも記載され得る。さらなる実施形態では、本方法は、単一細胞、単一のオルガネラ、単一の染色体、単一のウイルス、エキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、1つ以上の標的ポリヌクレオチド分子を抽出することを含み得、これらは試料として、本明細書にも記載され得る。またさらなる実施形態では、本方法は、複数の細胞、複数のオルガネラ、複数の染色体、複数のウイルス、複数のエキソソーム、または体液から、インタクトな標的ポリヌクレオチドとして、1つ以上の標的ポリヌクレオチド分子を抽出することを含み得、これらは試料として、本明細書にも記載され得る。一部の実施形態では、単一の標的ポリヌクレオチドは、単一のRNA、単一のssDNA、または単一のdsDNAを含み得る。
target polynucleotide.
In some embodiments, the molecule is a target nucleic acid, a naturally occurring target polynucleotide, or a copy of a naturally occurring polynucleotide. In various embodiments, the methods synthesize a single target polynucleotide molecule as an intact target polynucleotide from a single cell, single organelle, single chromosome, single virus, exosome, or bodily fluid. It can further comprise extracting, which can also be described herein as a sample. In further embodiments, the method extracts one or more target polynucleotide molecules as intact target polynucleotides from a single cell, single organelle, single chromosome, single virus, exosome, or bodily fluid. Extracting, which may also be described herein as a sample. In still further embodiments, the method extracts one or more target polynucleotide molecules as intact target polynucleotides from multiple cells, multiple organelles, multiple chromosomes, multiple viruses, multiple exosomes, or bodily fluids. Extracting, which may also be described herein as a sample. In some embodiments, a single target polynucleotide may comprise a single RNA, single ssDNA, or single dsDNA.

一部の実施形態では、標的核酸は、短鎖ポリヌクレオチド(例えば、1キロ塩基未満または300塩基未満)である。一部の実施形態では、短鎖ポリヌクレオチドは、尿および血液などの体液中のセルフリーDNAに見られるように、100~200塩基長、150~250塩基長、200~350塩基長、または100~500塩基長である。 In some embodiments, the target nucleic acid is a short polynucleotide (eg, less than 1 kilobase or less than 300 bases). In some embodiments, the short polynucleotide is 100-200 bases long, 150-250 bases long, 200-350 bases long, or 100 bases long, as found in cell-free DNA in body fluids such as urine and blood. ~500 bases long.

一部の実施形態では、標的核酸は、少なくとも10,000塩基長である。一部の実施形態では、標的核酸は、少なくとも1,000,000塩基長である。 In some embodiments, the target nucleic acid is at least 10,000 bases long. In some embodiments, the target nucleic acid is at least 1,000,000 bases long.

様々な実施形態では、単一の標的核酸は、染色体である。様々な実施形態では、単一標的ポリヌクレオチドは、約10、10、10、10、10、10、10、もしくは10塩基長、または10~10塩基長の任意の長さである。 In various embodiments, the single target nucleic acid is a chromosome. In various embodiments, the single target polynucleotide is about 10 2 , 10 3 , 10 4 , 10 5 , 10 6 , 10 7 , 10 8 , or 10 9 bases long, or 10 2 -10 9 bases long. Any length.

一部の実施形態では、本方法は、標的タンパク質、標的ポリペプチド、または標的ペプチドのアミノ酸配列の分析を可能にする。一部の実施形態では、標的タンパク質、標的ポリペプチド、または標的ペプチドのアミノ酸配列を分析および決定する方法が提供される。一部の実施形態では、ペプチド修飾、ならびに標的ポリヌクレオチドのアミノ酸配列を分析するための方法が提供される。一部の実施形態では、標的分子実体は、少なくとも5単位を含むポリマーである。かかる実施形態では、結合プローブは、オリゴヌクレオチド、抗体、アフィマー、ナノボディ、アプタマー、結合タンパク質、または低分子などを含む分子プローブである。 In some embodiments, the method allows analysis of the amino acid sequence of a target protein, target polypeptide, or target peptide. In some embodiments, methods are provided for analyzing and determining the amino acid sequence of a target protein, target polypeptide, or target peptide. In some embodiments, methods are provided for analyzing peptide modifications as well as the amino acid sequence of target polynucleotides. In some embodiments, the target molecular entity is a polymer containing at least 5 units. In such embodiments, the binding probes are molecular probes, including oligonucleotides, antibodies, affimers, nanobodies, aptamers, binding proteins, or small molecules.

一部の実施形態では、標準的な20アミノ酸、22タンパク質原性アミノ酸、アロタンパク質中に見出される非タンパク質原性アミノ酸もしくは翻訳後修飾の結果として見出される非タンパク質原性アミノ酸、天然に存在するD-アミノ酸、または天然に存在するL-アミノ酸の各々もしくは1つ以上は、N-レコグニン、ナノボディ、抗体、アプタマーなどを含む対応する特異的プローブによって結合される。各プローブの結合は、標的タンパク質、標的ポリペプチド鎖、または標的ペプチド内の対応する各アミノ酸に特異的である。一部の実施形態では、標的タンパク質、標的ポリペプチド鎖、または標的ペプチドにおけるサブユニットの順序が決定される。一部の実施形態では、結合は、サロゲートの結合部位への結合である。一部の実施形態では、サロゲートは、特定のアミノ酸またはペプチド配列に結合したタグであり、一過的な結合は、サロゲートタグへの結合である。 In some embodiments, the standard 20 amino acids, 22 proteinogenic amino acids, non-proteinogenic amino acids found in alloproteins or non-proteinogenic amino acids found as a result of post-translational modifications, naturally occurring D - each or one or more of the amino acids, or naturally occurring L-amino acids, are bound by corresponding specific probes, including N-recognines, nanobodies, antibodies, aptamers, and the like. Binding of each probe is specific for each corresponding amino acid within a target protein, target polypeptide chain, or target peptide. In some embodiments, the order of subunits in a target protein, target polypeptide chain, or target peptide is determined. In some embodiments, binding is binding to the binding site of the surrogate. In some embodiments, the surrogate is a tag attached to a specific amino acid or peptide sequence and the transient binding is binding to the surrogate tag.

一部の実施形態では、分子は、不均一分子である。一部の実施形態では、不均一分子は、超分子構造の一部分を含み得る。一部の実施形態では、本方法は、不均一なポリマーの化学構造の単位を識別し、順序付けること、または超分子構造の化学構造の単位を識別し、順序付けることを可能にし、このような単位は、核酸およびアミノ酸などの異なる種類のポリマーサブユニットを含み得る。かかる実施形態は、1つ以上のポリマーを伸長させ、複数のプローブに結合させて、伸長ポリマーに沿った複数の部位での化学構造を識別することを含み得る。ヘテロポリマーを伸長することで、サブ回折レベル(例えば、ナノメトリック)のプローブ結合部位の位置決定を可能にし得る。 In some embodiments, the molecule is a heterogeneous molecule. In some embodiments, a heterogeneous molecule can comprise a portion of a supramolecular structure. In some embodiments, the method allows identifying and ordering units of chemical structure of a heterogeneous polymer or identifying and ordering units of chemical structure of a supramolecular structure, such as A unit can comprise different types of polymeric subunits, such as nucleic acids and amino acids. Such embodiments may involve extending one or more polymers and attaching multiple probes to identify chemical structures at multiple sites along the extended polymer. Stretching the heteropolymer may allow for sub-diffraction level (eg, nanometric) positioning of probe binding sites.

一部の実施形態では、ポリマーのサブユニットを認識するオリゴヌクレオチドプローブ種の結合によって、ポリマーを配列決定するための方法が提供される。典型的には、1つのオリゴヌクレオチドプローブ種の結合は、ポリマーを配列決定するのに十分ではない。例えば、図1Bに、実施形態が示されており、プローブ種の完全なセット182との一過的な相互作用の測定に基づいて、ポリマー130が配列決定される(例えば、変性標的核酸と、オリゴヌクレオチドプローブ種の完全なセットとの相互作用、あるいは変性標的、タンパク質、標的ポリペプチド、もしくは標的ペプチドと、ナノボディもしくはアフィマー、抗体、または他のアミノ酸特異的結合剤プローブ種のセットとの相互作用であり、異なるプローブ種が、光学活性の観察を可能にするように標識される)。 In some embodiments, attachment of oligonucleotide probe species that recognize subunits of the polymer provides a method for sequencing the polymer. Typically, binding of one oligonucleotide probe species is not sufficient to sequence the polymer. For example, FIG. 1B shows an embodiment in which a polymer 130 is sequenced based on measuring transient interactions with a complete set of probe species 182 (e.g., denatured target nucleic acids, Interaction with a complete set of oligonucleotide probe species, or interaction of a denatured target, protein, target polypeptide, or target peptide with a nanobody or affimer, antibody, or other amino acid-specific binder probe species set. and different probe species are labeled to allow observation of optical activity).

標的ポリマーの抽出および/または調製。
一部の実施形態では、対象となる細胞を対象とならない他の細胞から分離すること、または核酸抽出を行う前に、単一の種類のいくつかの細胞のライブラリを作製することが望ましい。1つのそのような例では、循環腫瘍細胞または循環胎児細胞が、血液から単離される(例えば、親和性捕捉用に細胞表面マーカーを使用することによって)。一部の実施形態では、ヒト細胞から微生物細胞を分離することが望ましく、目的は、微生物細胞から標的核酸を検出し、分析することである。一部の実施形態では、オプソニンは、広範囲の微生物を親和性捕捉し、哺乳類細胞からそれらを分離するために使用される。他の実施形態では、分別溶解が行われる。比較的穏和な条件下で、哺乳動物細胞を最初に溶解する。微生物細胞は、典型的には、哺乳動物細胞よりも硬く(溶解しにくい)、そのため、微生物細胞は、哺乳動物細胞の溶解を通してインタクトなままであり得る。溶解した哺乳類細胞断片は、洗い流される。次いで、より過酷な条件を使用して、微生物細胞を溶解する。次いで、標的微生物ポリヌクレオチドを選択的に配列決定する。
Extraction and/or preparation of target polymer.
In some embodiments, it is desirable to separate cells of interest from other cells that are not of interest, or to generate a library of several cells of a single type prior to nucleic acid extraction. In one such example, circulating tumor cells or fetal cells are isolated from blood (eg, by using cell surface markers for affinity capture). In some embodiments, it is desirable to separate microbial cells from human cells and the goal is to detect and analyze target nucleic acids from microbial cells. In some embodiments, opsonins are used to affinity capture a wide range of microorganisms and separate them from mammalian cells. In other embodiments, fractional lysis is performed. Mammalian cells are first lysed under relatively mild conditions. Microbial cells are typically more rigid (less lysable) than mammalian cells, so they can remain intact throughout mammalian cell lysis. Lysed mammalian cell fragments are washed away. Harsh conditions are then used to lyse the microbial cells. The target microbial polynucleotides are then selectively sequenced.

一部の実施形態では、標的核酸は、配列決定の前に、細胞から抽出される。代替的な実施形態では、配列決定(例えば、染色体DNAの配列決定)は、細胞内で行われ、染色体DNAは、間期に畳み込み経路をたどる。オリゴヌクレオチドプローブ種のインサイツでの安定した結合は、Beliveau et al.,Nature Communications 6:7147(2015)によって実証されている。オリゴヌクレオチドプローブ種のかかるインサイツ結合および三次元空間におけるオリゴヌクレオチドプローブ種のナノメトリックな局在は、細胞内の染色体分子(標的核酸)の配列および構造的配置の決定を可能にし得る。 In some embodiments, target nucleic acids are extracted from cells prior to sequencing. In an alternative embodiment, sequencing (eg, sequencing of chromosomal DNA) is performed intracellularly and the chromosomal DNA follows a folding pathway during interphase. In situ stable binding of oligonucleotide probe species is described by Beliveau et al. , Nature Communications 6:7147 (2015). Such in situ binding of oligonucleotide probe species and nanometric localization of oligonucleotide probe species in three-dimensional space can allow determination of the sequence and structural arrangement of chromosomal molecules (target nucleic acids) within cells.

標的ポリヌクレオチドは、天然の折り畳まれた状態で存在することが多い。例えば、ゲノムDNAは、染色体において高度に凝縮されているが、RNAは、二次構造を形成し得る。一部の実施形態では、長い鎖長のポリヌクレオチドは、生体試料から抽出する間に(例えば、天然ポリヌクレオチドの実質的に天然長を保存することによって)得られる。一部の実施形態では、ポリヌクレオチドは、その長さに沿った場所がほとんどまたはまったく曖昧さなしにトレースされるように線状化される。理想的には、標的ポリヌクレオチドは、線状化される前または線状化された後のいずれかに、直線化、伸展、または伸長される。 Target polynucleotides often exist in their native folded state. For example, genomic DNA is highly condensed in chromosomes, whereas RNA can form secondary structures. In some embodiments, long length polynucleotides are obtained during extraction from a biological sample (eg, by preserving substantially the native length of the native polynucleotide). In some embodiments, the polynucleotide is linearized such that locations along its length are traced with little or no ambiguity. Ideally, the target polynucleotide is linearized, stretched or elongated either before or after being linearized.

一部の実施形態では、本方法は、天然長またはそのかなりの割合が(例えば、DNA全染色体または約1メガ塩基以上の断片について)保存される、非常に長いポリマー長を配列決定するのに特に適している。しかし、一般的な分子生物学的方法は、DNAの意図しない断片化をもたらし得る。例えば、ピペッティングおよびボルテックスは、剪断力を引き起こし、DNA分子を破壊する可能性がある。ヌクレアーゼ汚染は、核酸を、分解または断片化し得る。一部の実施形態では、天然長の断片またはかなり高分子量の(HMW)断片は、固定化、伸長および配列決定を開始する前に保存される。 In some embodiments, the methods are useful for sequencing very long polymer lengths, in which the natural length or a significant proportion thereof is conserved (e.g., for entire DNA chromosomes or fragments of about 1 megabase or greater). particularly suitable. However, common molecular biology methods can result in unintended fragmentation of DNA. For example, pipetting and vortexing can cause shear forces and destroy DNA molecules. Nuclease contamination can degrade or fragment nucleic acids. In some embodiments, native-length fragments or fairly high molecular weight (HMW) fragments are stored prior to initiating fixation, extension and sequencing.

一部の実施形態では、ポリヌクレオチドは、配列決定に進む前に、意図的に、比較的均一な長さ(例えば、約1Mbの長さ)に断片化される。一部の実施形態では、ポリヌクレオチドは、固定または伸長の後またはその間に、比較的均一な長鎖に断片化される。一部の実施形態では、断片化は、酵素的に実現される。一部の実施形態では、断片化は、物理的に実現される。一部の実施形態では、物理的断片化は、超音波処理を介して実現される。一部の実施形態では、物理的断片化は、イオン衝撃または放射線を介して実現される。一部の実施形態では、物理的断片化は、電磁放射線を介して効果化される。一部の実施形態では、物理的断片化は、UV照明を介して実現される。一部の実施形態では、UV照明の線量を制御して、所与の鎖長に断片化される。一部の実施形態では、物理的断片化は、UV照明と色素による染色(例えば、YOYO-1)の組み合わせを介して実現される。一部の実施形態では、断片化プロセスは、物理的作用または試薬の添加によって停止される。一部の実施形態では、断片化プロセスの停止に影響を及ぼし得る試薬は、β-メルカプトエタノール(BME)などの還元剤である。 In some embodiments, polynucleotides are intentionally fragmented into relatively uniform lengths (eg, about 1 Mb in length) prior to proceeding to sequencing. In some embodiments, the polynucleotide is fragmented into relatively uniform long strands after or during fixation or extension. In some embodiments, fragmentation is accomplished enzymatically. In some embodiments, fragmentation is physically implemented. In some embodiments, physical fragmentation is accomplished via sonication. In some embodiments, physical fragmentation is accomplished via ion bombardment or radiation. In some embodiments, physical fragmentation is effected via electromagnetic radiation. In some embodiments, physical fragmentation is accomplished via UV illumination. In some embodiments, the dose of UV illumination is controlled to fragment to a given chain length. In some embodiments, physical fragmentation is achieved through a combination of UV illumination and dye staining (eg, YOYO-1). In some embodiments, the fragmentation process is stopped by physical action or addition of reagents. In some embodiments, the reagent that can affect cessation of the fragmentation process is a reducing agent such as β-mercaptoethanol (BME).

放射線量による断片化および配列決定
一部の実施形態では、二次元撮像デバイスの視野が、完全なメガ塩基長のDNAを二次元撮像デバイスの1つの次元で見ることを可能にし得る場合、1Mbの長さのゲノムDNAを生成することが効率的である。他の実施形態では、より大きいまたはより小さい断片が、二次元撮像デバイスの1つの次元内に適合する断片によって可視化され得る。さらなる実施形態では、二次元撮像デバイスによって単一の画像として撮像され得るよりも大きい長さの標的核酸が使用され、標的核酸の異なる部分の画像は、異なる時間に撮像され、1つの撮像(c)ステップでは、標的核酸の1つ以上の領域について1つ以上のフレームで撮像されるか、またはより完全な配列決定のプロセスが、二次元撮像デバイスの視野を標的核酸の異なる部分に移動する前に行われ、これは、オリゴヌクレオチドプローブ種の完全なセットまたはその任意のサブセットの利用を含み得る。また、染色体長の断片のサイズを減少させることは、鎖のもつれを最小化し得、伸展され十分に分離された形態の最大長のDNAを可能にし得ることに留意されたい。
Fragmentation and Sequencing by Radiation Dose In some embodiments, if the field of view of a two-dimensional imaging device can allow a complete megabase length of DNA to be viewed in one dimension of the two-dimensional imaging device, 1 Mb of It is efficient to generate lengths of genomic DNA. In other embodiments, larger or smaller fragments can be visualized with fragments that fit within one dimension of the two-dimensional imaging device. In a further embodiment, a target nucleic acid of greater length than can be imaged as a single image by a two-dimensional imaging device is used, and images of different portions of the target nucleic acid are imaged at different times to form one image (c ) step, one or more regions of the target nucleic acid are imaged in one or more frames, or more completely before the sequencing process moves the field of view of the two-dimensional imaging device to different portions of the target nucleic acid. , which may involve utilizing the complete set of oligonucleotide probe species or any subset thereof. Also note that reducing the size of the chromosomal-length fragments may minimize strand entanglement and allow for maximum length DNA in an extended and well-segregated form.

染色体の長いサブ断片を配列決定するための方法は、以下のステップ:
i)染色体の二本鎖DNAを、色素で染色することであって、当該色素が、二本鎖DNAの塩基対間に挿入される(intercalating)、染色することと、
ii)色素染色された染色体DNAを、所定の線量の電磁放射線に曝露して、所望のサイズ範囲内の染色体DNAのサブ断片を生成することと、
iii)色素染色された染色体のサブ断片DNAを、表面に伸長および固定することと、
iv)染色された染色体断片を変性させて、塩基対を破壊し、それによって、任意の挿入色素を遊離することと、
v)得られた脱染色された伸長固定一本鎖染色体断片を、所望の長さおよび配列のオリゴヌクレオチドプローブ種の1つ以上のセットに曝露することと、
vi)オリゴヌクレオチドプローブ種の1つ以上のセットの各オリゴヌクレオチドプローブ種の脱染色された伸長一本鎖染色体断片に沿った結合の場所を決定することと、
vii)オリゴヌクレオチドプローブ種の1つ以上のセットのオリゴヌクレオチドプローブ種の結合の場所をコンパイルして、染色体サブ断片の完全な配列決定を得ることと、を含む。
A method for sequencing long sub-segments of chromosomes comprises the following steps:
i) staining the double-stranded DNA of the chromosome with a dye, the dye intercalating between the base pairs of the double-stranded DNA;
ii) exposing the dye-stained chromosomal DNA to a predetermined dose of electromagnetic radiation to generate sub-fragments of chromosomal DNA within a desired size range;
iii) extending and fixing the dye-stained chromosomal sub-fragment DNA to the surface;
iv) denaturing the stained chromosomal fragment to disrupt base pairs and thereby release any intercalating dye;
v) exposing the resulting destained, elongated, fixed single-stranded chromosomal fragment to one or more sets of oligonucleotide probe species of desired length and sequence;
vi) determining the location of binding of each oligonucleotide probe species of one or more sets of oligonucleotide probe species along the destained extended single-stranded chromosomal segment;
vii) compiling the binding sites of the oligonucleotide probe species of one or more sets of oligonucleotide probe species to obtain a complete sequencing of the chromosomal sub-fragments.

一部の実施形態では、上に記載されるように、染色は、染色体が細胞内にあるときに生じ得る。一部の実施形態では、上に記載されるように、標識されたオリゴヌクレオチドは、染色により多くの挿入色素を添加した結果として標識され、その後、二重鎖が形成される際、二重鎖に挿入される。一部の実施形態では、上に記載されるように、任意選択的に、変性に加えて、染色を退色可能な線量の電磁放射線が適用される。上記の一部の実施形態では、当該所定の線量は、化学的曝露による曝露の強度および持続時間ならびに断片化の停止を操作することによって達成され、当該化学曝露は、β‐メルカプトエタノールなどの還元剤である。上記の一部の実施形態では、線量は、ポアソン分布が約1Mb長の断片を生成するように既定される。 In some embodiments, staining may occur when the chromosome is intracellular, as described above. In some embodiments, as described above, the labeled oligonucleotide is labeled as a result of adding more intercalating dye to the stain, and then when the duplex is formed, the duplex is inserted into In some embodiments, optionally, in addition to denaturing, a dose of electromagnetic radiation capable of bleaching the stain is applied, as described above. In some embodiments of the above, the predetermined dose is achieved by manipulating the intensity and duration of exposure and cessation of fragmentation by chemical exposure, wherein the chemical exposure is a reducing agent such as β-mercaptoethanol. is an agent. In some embodiments above, the dose is defined such that the Poisson distribution produces fragments about 1 Mb long.

固定および固定化の方法。
ブロック204。標的核酸を、試験基板上の二本鎖線状化伸展形態で固定し、それによって、固定伸展二本鎖核酸を形成する。任意選択的に、分子は、表面またはマトリックスに固定化される。一部の実施形態では、断片化ポリマーまたは天然ポリマーが固定される。一部の実施形態では、固定された二本鎖線状化核酸は、直線状であってもよく、曲線状または蛇行状の経路に沿っていてもよい。
Methods of fixation and immobilization.
block 204; A target nucleic acid is immobilized in a double-stranded linearized extended form on a test substrate, thereby forming an immobilized extended double-stranded nucleic acid. Optionally, the molecule is immobilized on a surface or matrix. In some embodiments, fragmented or natural polymers are immobilized. In some embodiments, the immobilized double-stranded linearized nucleic acid may be linear or along a curved or tortuous path.

一部の実施形態では、固定は、分子コーミング(後退メニスカス)、フロー伸展、ナノ束縛、または電気伸展によって、標的核酸を、試験基板に適用することを含み得る。一部の実施形態では、標的核酸の基板への適用または固定は、UV架橋ステップをさらに含み得、標的核酸は、基板に共有結合される。一部の実施形態では、標的核酸の基板へのUV架橋は、実現されなくてもよく、標的核酸は、他の手段(例えば、疎水性相互作用、水素結合など)を介して基板に結合される。 In some embodiments, immobilization can include applying the target nucleic acid to the test substrate by molecular combing (retracted meniscus), flow extension, nano-tethering, or electro-extension. In some embodiments, applying or immobilizing the target nucleic acid to the substrate may further comprise a UV cross-linking step, wherein the target nucleic acid is covalently bound to the substrate. In some embodiments, UV cross-linking of the target nucleic acid to the substrate may not be achieved and the target nucleic acid is bound to the substrate via other means (e.g., hydrophobic interactions, hydrogen bonding, etc.). be.

ほんの一端での標的核酸の固定化(例えば、固定)は、ポリヌクレオチドが非協調的な方法で伸展および収縮することを可能にし得る。したがって、任意の伸長方法が使用される場合、標的核酸の長さに沿った伸長の割合は、標的核酸の任意の特定の位置に応じて変化し得る。一部の実施形態では、標的核酸に沿った複数の場所の相対位置を固定し、変動を受けないようにすることが必要である。かかる実施形態では、伸長標的核酸は、その長さに沿った複数の接触点によって、表面に固定化または固定される(例えば、Michalet et al,Science 277:1518-1523,1997の分子コーミング技術で行われる。また、表面での伸展に使用され得るMolecular Combing of DNA:Methods and Applications,Journal of Self-Assembly and Molecular Electronics(SAME)1:125-148を参照されたい(例えば、ACS Nano.2015 Jan 27;9(1):809-16)、ならびにBensimonらのUS6344319およびDedeckerらのUS2013/0130255に記載されている)。 Immobilization (eg, fixation) of a target nucleic acid at only one end can allow the polynucleotide to extend and contract in a non-coordinated manner. Therefore, when any extension method is used, the rate of extension along the length of the target nucleic acid can vary for any particular position of the target nucleic acid. In some embodiments, it is necessary to fix the relative position of multiple locations along the target nucleic acid and not subject to variation. In such embodiments, the extended target nucleic acid is immobilized or anchored to the surface by multiple contact points along its length (e.g., by the molecular combing technique of Michaelet et al, Science 277:1518-1523, 1997). See also Molecular Combining of DNA that can be used for surface extension: Methods and Applications, Journal of Self-Assembly and Molecular Electronics (SAME) 1:125-148 (e.g., ACS Nano. 2015 Jan. 27;9(1):809-16), and in Bensimon et al., US6344319 and Dedecker et al., US2013/0130255).

一部の実施形態では、標的核酸のアレイ(array)は、表面に固定化され、一部の実施形態では、アレイの標的核酸は、回折限界撮像によって個別に解像されるのに十分に離れている。一部の実施形態では、標的核酸は、所与の表面積内に最大限に充填され、標的核酸が重複しないように、規則正しい様式で表面に固定される。一部の実施形態では、これは、パターン化された表面(例えば、標的核酸の末端が結合し得るような場所における疎水性パッチまたはストリップの規則正しい配置)を作製することによって実現される。一部の実施形態では、アレイの標的核酸は、回折限界撮像によって個別に解像されるのに十分に離れていなくてもよく、超解像法によって個別に解像される。 In some embodiments, an array of target nucleic acids is immobilized on a surface, and in some embodiments, the target nucleic acids of the array are sufficiently separated to be individually resolved by diffraction-limited imaging. ing. In some embodiments, the target nucleic acids are fixed to the surface in an ordered manner so that they are maximally packed within a given surface area and that the target nucleic acids do not overlap. In some embodiments, this is achieved by creating a patterned surface (eg, an ordered arrangement of hydrophobic patches or strips in locations such that the ends of the target nucleic acid can bind). In some embodiments, the target nucleic acids of the array may not be far enough apart to be individually resolved by diffraction-limited imaging, but are individually resolved by super-resolution methods.

一部の実施形態では、標的核酸は、DNAカーテンを利用して組織化される(Greene et al.,Methods Enzymol.472:293-315,2010)。これは、特に長い標的核酸に有用である。かかる実施形態では、一過的な結合は、一端に付着したDNA鎖がフローまたは電気泳動力によって伸長される間、または鎖の両端が捕捉された後、記録される。一部の実施形態では、複数の標的核酸を形成し得る同じ標的核酸配列の多くのコピーが、DNAカーテン法で利用され、配列が、1つの標的核酸からではなく、複数の標的核酸から、集合としての結合パターンからアセンブリされる。一部の実施形態では、標的核酸の両端は、パッド(例えば、試験基板の他のセクションよりも標的核酸に強力に結合し得る、試験基板の領域)に結合し得、各末端は、異なるパッドに結合し得る。一部の実施形態では、単一の線状標的核酸が結合し得る2つのパッドは、単一の線状標的核酸の伸展された構成を所定の位置に保持することができ、等間隔、非重複または非相互作用の単一線状標的核酸の規則正しいアレイが形成されるようにすることができる。一部の実施形態では、1つの標的核酸のみが、個々のパッドを占有し得る。一部の実施形態では、パッドがポアソン過程を使用して投入される場合、一部のパッドは標的核酸がなく、一部は標的核酸がなく、一部は1つ以上の標的核酸なしにより占有される。 In some embodiments, target nucleic acids are organized using DNA curtains (Greene et al., Methods Enzymol. 472:293-315, 2010). This is particularly useful for long target nucleic acids. In such embodiments, transient binding is recorded while a DNA strand attached at one end is stretched by flow or electrophoretic forces, or after both ends of the strand are captured. In some embodiments, many copies of the same target nucleic acid sequence, which can form multiple target nucleic acids, are utilized in the DNA curtain method to assemble sequences from multiple target nucleic acids rather than from one target nucleic acid. is assembled from the binding patterns as In some embodiments, both ends of the target nucleic acid may be attached to pads (e.g., regions of the test substrate that may bind the target nucleic acid more strongly than other sections of the test substrate), each end being attached to a different pad. can be bound to In some embodiments, two pads to which a single linear target nucleic acid can bind can hold the stretched configuration of the single linear target nucleic acid in place and are evenly spaced, non-uniform. Ordered arrays of overlapping or non-interacting single linear target nucleic acids can be formed. In some embodiments, only one target nucleic acid can occupy each pad. In some embodiments, when the pads are populated using a Poisson process, some pads are free of target nucleic acids, some are free of target nucleic acids, and some are occupied by one or more free target nucleic acids. be done.

一部の実施形態では、標的核酸である標的分子は、規則正しい超分子スカフォールド(例えば、DNA折り紙構造)上に捕捉される。一部の実施形態では、最初に遊離溶液中でスカフォールド構造を使用してもよく、溶液相動態を利用して、標的核酸である標的分子を捕捉する。占有されると、スカフォールドは、沈降するか、または表面で自己組織化し、表面に結合され得る。規則正しいアレイは、視野ごとにより高い密度の分子(高密度アレイ)を可能にする分子の効率的なサブ回折充填を可能にし得る。単一分子位置決定法は、高密度アレイ内の標的核酸である標的分子が、(例えば、点と点の距離が40nm以下に)超解像されるようにすることができる。 In some embodiments, target molecules that are target nucleic acids are captured on an ordered supramolecular scaffold (eg, a DNA origami structure). In some embodiments, the scaffold structure may be used initially in free solution, utilizing solution phase kinetics to capture the target molecule, which is the target nucleic acid. Once occupied, the scaffold can settle or self-assemble on the surface and bind to the surface. Ordered arrays can allow efficient sub-diffractive packing of molecules allowing for higher densities of molecules per field (dense arrays). Single-molecule localization methods can allow target molecules, which are target nucleic acids in high-density arrays, to be super-resolved (eg, point-to-point distances of 40 nm or less).

一部の実施形態では、ヘアピンを、(任意選択的に、標的核酸の末端を研磨した後に)二重鎖標的核酸の末端にライゲーションする。一部の実施形態では、ヘアピンは、標的核酸を表面に固定化し得るビオチンを含み得る。代替的な実施形態では、ヘアピンは、二重鎖標的核酸の2つの鎖を共有結合する役割を果たし得る。一部のかかる実施形態では、標的核酸の他端は、例として、オリオd(T)によって、または特定の配列によって、表面捕捉のためにテール付加(tailed)される。変性後、標的核酸の両方の鎖は、オリゴヌクレオチドまたは他のプローブ種との相互作用に利用可能である。 In some embodiments, hairpins are ligated to the ends of a double-stranded target nucleic acid (optionally after polishing the ends of the target nucleic acid). In some embodiments, the hairpin can contain biotin, which can immobilize the target nucleic acid on the surface. In alternative embodiments, hairpins may serve to covalently link two strands of a double-stranded target nucleic acid. In some such embodiments, the other end of the target nucleic acid is tailed for surface capture, eg, by an olio d(T) or by a specific sequence. After denaturation, both strands of the target nucleic acid are available for interaction with oligonucleotides or other probe species.

一部の実施形態では、規則正しいアレイは、(例えば、Woo and Rothemund,Nature Communications,5:4889に記載されている)大きなDNA格子を形成するように一緒に連結する個々のスカフォールドの形態をとることができる。一部のかかる実施形態では、個々の小さなスカフォールドは、塩基対合によって、互いにロックオンし得る。一部の実施形態では、小さなスカフォールドは、ともに結合することができ、したがって、本明細書に記載される配列決定ステップのための高度に規則正しいナノ構造アレイを提示する。一部の実施形態では、捕捉部位は、規則正しい二次元格子において10nmのピッチで配置される。このような格子は、1平方センチメートル当たり1兆個程度の分子を捕捉することができる。 In some embodiments, ordered arrays take the form of individual scaffolds that link together to form a large DNA lattice (e.g., as described in Woo and Rothemund, Nature Communications, 5:4889). can be done. In some such embodiments, individual small scaffolds may lock onto each other through base pairing. In some embodiments, small scaffolds can be bound together, thus presenting highly ordered nanostructure arrays for the sequencing steps described herein. In some embodiments, the capture sites are arranged with a pitch of 10 nm in a regular two-dimensional lattice. Such grids can trap as many as 1 trillion molecules per square centimeter.

一部の実施形態では、格子内の捕捉部位は、規則正しい二次元格子に、5nmのピッチ、10nmのピッチ、15nmのピッチ、30nmのピッチ、または50nmのピッチで配置される。一部の実施形態では、格子内の捕捉部位は、規則正しい二次元格子に、5nmのピッチ~50nmのピッチで配置される。 In some embodiments, the trapping sites within the lattice are arranged in a regular two-dimensional lattice with a pitch of 5 nm, a pitch of 10 nm, a pitch of 15 nm, a pitch of 30 nm, or a pitch of 50 nm. In some embodiments, the trapping sites within the lattice are arranged in a regular two-dimensional lattice with a pitch of 5 nm to 50 nm.

一部の実施形態では、標的核酸または他の標的分子の規則正しいアレイは、ナノフルイディクスを使用して作製される。1つのかかる実施例では、ナノトレンチ(nanotrench)またはナノグルーブ(nanogroove)のアレイ(例えば、100nm幅および150nm深)が表面に形成され、長い標的核酸を規則正しく並べるように機能する。かかる実施形態では、ナノトレンチまたはナノグルーブに1つの標的核酸が存在すると、別の標的核酸の侵入が排除され得る。別の実施形態では、ナノピット(nanopit)アレイが使用され、長い標的核酸のセグメントがピット内にあり、ピット内で結合され、介在している長いセグメントの標的核酸がピット間に広がる。 In some embodiments, ordered arrays of target nucleic acids or other target molecules are produced using nanofluidics. In one such embodiment, an array of nanotrench or nanogroove (eg, 100 nm wide and 150 nm deep) is formed on the surface and serves to order long target nucleic acids. In such embodiments, the presence of one target nucleic acid in the nanotrenches or nanogrooves can preclude entry of another target nucleic acid. In another embodiment, nanopit arrays are used, with segments of long target nucleic acids within the pits and bound within the pits, with intervening long segments of the target nucleic acid extending between the pits.

一部の実施形態では、高密度の標的核酸は、依然として超解像撮像および正確な配列決定を可能にし得る。例えば、一部の実施形態では、標的核酸のサブセットのみが対象である(例えば、標的化配列決定)。かかる実施形態では、標的化配列決定が行われるとき、複合体試料(例えば、全ゲノムまたはトランスクリプトーム、複数のゲノム)由来の標的核酸のサブセットおよび/または標的核酸の領域のみを分析する必要があり得、標的核酸は、通常よりも高い密度で試験基板またはマトリックスに固定される。かかる実施形態では、回折限界空間またはSMLM解像度空間内にいくつかのポリヌクレオチドが存在する場合であっても、シグナルが検出された場合、それが、標的遺伝子座のうちの1つのみに由来する可能性が高く、また、この遺伝子座が同じオリゴヌクレオチドプローブ種に同時に結合しているような別の遺伝子座の回折限界距離またはSMLM解像度空間内にはない可能性が高い。標的化配列決定を受ける各標的核酸間の必要な距離は、標的となるポリヌクレオチドの割合に相関する。例えば、5%未満のポリヌクレオチドが標的となる場合、ポリヌクレオチドの密度は、すべての標的核酸配列が望まれる場合の20倍を超える。一部の実施形態では、標的化配列決定の場合、撮像時間は、全ゲノムが分析される場合よりも短い(例えば、上の例では、標的化配列決定の撮像は、全ゲノム配列決定よりも10倍速くなり得る)。 In some embodiments, high densities of target nucleic acids may still allow for super-resolution imaging and accurate sequencing. For example, in some embodiments, only a subset of target nucleic acids are of interest (eg, targeted sequencing). In such embodiments, when targeted sequencing is performed, only a subset of target nucleic acids and/or regions of target nucleic acids from a complex sample (e.g., whole genome or transcriptome, multiple genomes) need to be analyzed. Possible, the target nucleic acid is immobilized on the test substrate or matrix at a higher than normal density. In such embodiments, even if there are several polynucleotides in diffraction-limited space or SMLM resolution space, if a signal is detected, it is from only one of the target loci. It is highly probable and unlikely that this locus is within the diffraction limited distance or SMLM resolution space of another locus that simultaneously binds to the same oligonucleotide probe species. The required distance between each target nucleic acid undergoing targeted sequencing correlates with the proportion of polynucleotides targeted. For example, if less than 5% of the polynucleotides are targeted, the density of polynucleotides is 20 times greater than if all target nucleic acid sequences were desired. In some embodiments, for targeted sequencing, the imaging time is shorter than when the whole genome is analyzed (e.g., in the example above, targeted sequencing imaging is faster than whole genome sequencing). 10 times faster).

一部の実施形態では、試験基板は、固定ステップの前に、配列特異的オリゴヌクレオチドプローブ種と結合され、固定ステップは、試験基板に結合した配列特異的オリゴヌクレオチドプローブ種を使用して、試験基板上で標的核酸を捕捉または固定することを含み得る。一部の実施形態では、標的核酸は、5’末端に固定または結合されている。一部の実施形態では、標的核酸は、3’末端に固定または結合されている。別の実施形態では、試験基板上に2つの別個のプローブが存在する場合、1つのプローブは、標的核酸の第1の末端に固定または結合され得、第2のプローブは、標的核酸の第2の末端に固定または結合され得る。2つのプローブを使用する場合、標的核酸の長さに関する事前情報を有することも望ましい場合がある。一部の実施形態では、標的核酸は、試験基板に固定または結合される前に、所定のエンドヌクレアーゼで切断される。追加の実施形態では、標的核酸は、一端または両端で最初に固定または結合された後、標的核酸の長さに沿った追加の点で固定または結合される。 In some embodiments, the test substrate is bound with the sequence-specific oligonucleotide probe species prior to the immobilizing step, wherein the immobilizing step uses the sequence-specific oligonucleotide probe species bound to the test substrate to Capturing or immobilizing the target nucleic acid on a substrate may be included. In some embodiments, the target nucleic acid is fixed or bound at the 5' end. In some embodiments, the target nucleic acid is fixed or bound at the 3' end. In another embodiment, when there are two separate probes on the test substrate, one probe may be anchored or attached to the first end of the target nucleic acid and the second probe may be attached to the second end of the target nucleic acid. can be fixed or attached to the end of the When using two probes, it may also be desirable to have prior information about the length of the target nucleic acid. In some embodiments, the target nucleic acid is cleaved with a defined endonuclease prior to being immobilized or bound to the test substrate. In additional embodiments, the target nucleic acid is initially fixed or bound at one or both ends and then fixed or bound at additional points along the length of the target nucleic acid.

様々な実施形態では、固定の前に、標的核酸が抽出され、またはゲルもしくはマトリックス中に包埋される(例えば、Shag et al.,Nature Protocols 7:467-478,2012に記載されている)。1つのかかる非限定的な例では、標的核酸は、液体からゲルへ転移を起こす媒体を含むフローチャネルに沈着される。標的核酸は、最初に伸長され、液相中に分布し、次いで、相を固相/ゲル相に変えることによって(例えば、架橋を引き起こすもしくは加速し得る加熱によって、または、ポリアクリルアミドの場合、補助因子を添加することによって、もしくは時間とともに)固定される。一部の実施形態では、標的核酸は、固相/ゲル相において伸長される。 In various embodiments, the target nucleic acid is extracted or embedded in a gel or matrix prior to fixation (described, for example, in Shag et al., Nature Protocols 7:467-478, 2012). . In one such non-limiting example, target nucleic acids are deposited in a flow channel containing a medium that undergoes a liquid-to-gel transition. The target nucleic acid is first elongated and distributed in a liquid phase, and then assisted by changing the phase to a solid/gel phase (e.g., by heating, which can cause or accelerate cross-linking, or in the case of polyacrylamide). fixed by adding factors or over time). In some embodiments, the target nucleic acid is elongated in solid/gel phase.

一部の代替的な実施形態では、1つ以上のオリゴヌクレオチドプローブ種は、試験基板もしくはマトリックス上で固定化されるか、または試験基板もしくはマトリックス中で固定化される。かかる実施形態では、1つ以上の標的核酸は、溶液中に懸濁され、1つ以上の固定されたオリゴヌクレオチドプローブ種に一時的に結合し得る。一部の実施形態では、1つ以上のオリゴヌクレオチドプローブ種の空間的にアドレス指定可能なアレイを使用して、標的核酸を捕捉する。一部の実施形態では、セルフリーDNAもしくはマイクロRNAなどの短い標的核酸(例えば、300ヌクレオチド未満)、またはmRNAなどの比較的短い標的核酸(例えば、10,000ヌクレオチド未満)は、1つ以上のオリゴヌクレオチドプローブ種を含み得るか、またはビオチンアビジンなどの他の結合機構を含み得る適切な捕捉分子を使用して標的核酸の修飾末端もしくは非修飾末端を捕捉することによって、表面にランダムに固定化される。一部の実施形態では、短いまたは比較的短い標的核酸は、試験基板との複数の相互作用を有し、配列決定は、試験基板に平行な方向で実行される。したがって、スプライシングアイソフォームの組織的または構造的なDNA修飾が解決される。例えば、一部のアイソフォームでは、反復またはシャッフルされたエキソンの場所が、描写もしくは決定され得るか、または、がん性細胞では顕著な構造再編成が生じ得、かかる構造再編成およびDNAの遺伝子もしくは重要な非コード領域との関係が、描写もしくは決定される。 In some alternative embodiments, one or more oligonucleotide probe species are immobilized on or in a test substrate or matrix. In such embodiments, one or more target nucleic acids may be suspended in solution and transiently bound to one or more immobilized oligonucleotide probe species. In some embodiments, a spatially addressable array of one or more oligonucleotide probe species is used to capture target nucleic acids. In some embodiments, short target nucleic acids (e.g., less than 300 nucleotides) such as cell-free DNA or microRNAs, or relatively short target nucleic acids such as mRNAs (e.g., less than 10,000 nucleotides) are combined with one or more Random immobilization to a surface by capturing the modified or unmodified ends of the target nucleic acid using a suitable capture molecule which may contain an oligonucleotide probe species or may contain other binding mechanisms such as biotinavidin be done. In some embodiments, short or relatively short target nucleic acids have multiple interactions with a test substrate and sequencing is performed in an orientation parallel to the test substrate. Thus, systematic or structural DNA modifications of splicing isoforms are resolved. For example, in some isoforms, the location of repeated or shuffled exons can be delineated or determined, or marked structural rearrangements can occur in cancerous cells, such structural rearrangements and genetic Alternatively, the relationship to non-coding regions of interest is delineated or determined.

一部の実施形態では、固定化されたプローブは、標的核酸にアニーリングし得る共通の配列を含み得る。かかる実施形態は、標的核酸が、一方または両方の末端で生じ得る共通配列を有する場合に特に有用である。一部の実施形態では、標的核酸は、一本鎖であり、ポリAテール(tail)などの共通の配列を有する。かかる一例では、例えば、平滑ライゲーションまたはスプリントオリゴを利用したライゲーションを使用して天然のmRNAの5’末端にポリアデニル化テールが付加された、ポリアデニル化テールを有する天然のmRNAが、試験基板または他の表面もしくはマトリックス上のオリゴヌクレオチドポリd(T)プローブのアレイまたはローン(lawn)上で捕捉される。一部の実施形態では、特に、短いDNAが分析される場合、例えば、特異的な短いオリゴをライゲーションすることによって、または捕捉分子(試験基板または他の表面もしくはマトリックス上の特異的な相補オリゴヌクレオチドプローブ種である)との相互作用にビオチンを結合させることによって、標的核酸の末端を適合させる。 In some embodiments, the immobilized probes can contain common sequences that can anneal to the target nucleic acid. Such embodiments are particularly useful when the target nucleic acids have consensus sequences that can occur at one or both termini. In some embodiments, the target nucleic acids are single stranded and have a common sequence such as a poly A tail. In one such example, a native mRNA with a polyadenylated tail is attached to a test substrate or other Captured on an array or lawn of oligonucleotide poly d(T) probes on a surface or matrix. In some embodiments, particularly when short DNA is analyzed, e.g., by ligating specific short oligos or capturing molecules (specific complementary oligonucleotides on a test substrate or other surface or matrix). The ends of the target nucleic acid are adapted by binding biotin for interaction with the probe species.

一部の実施形態では、標的核酸は、制限酵素によって生成される粘着末端を有する二本鎖DNAを含み得る。一部の非限定的な例では、稀な部位(例えば、Pmme1またはNOT1)の制限酵素を使用して、標的核酸の長い断片を生成し、各断片は、共通の末端配列を有する粘着性末端を含む。一部の実施形態では、適合は、ターミナルトランスフェラーゼを使用して行われる。他の実施形態では、ライゲーションまたはタグ付けは、Illumina配列決定のユーザーによって利用されるものと同様の様式でアダプターを導入するために使用される。これにより、ユーザーは、十分に確立されたIlluminaプロトコルを使用して試料を調製し、次いで、本明細書に記載の方法によって捕捉し、配列決定することができる。かかる実施形態では、標的核酸は、任意の増幅の前に(誤差およびバイアスが導入され、天然標的核酸の一部を含み得る任意のエピジェネティック情報が除去される)、配列決定のために捕捉または固定される。 In some embodiments, the target nucleic acid may comprise double-stranded DNA with sticky ends generated by restriction enzymes. In some non-limiting examples, rare site (e.g., Pmmel or NOTl) restriction enzymes are used to generate long fragments of the target nucleic acid, each fragment having a common terminal sequence with sticky ends. including. In some embodiments, the adaptation is performed using terminal transferase. In other embodiments, ligation or tagging is used to introduce adapters in a manner similar to that utilized by Illumina sequencing users. This allows users to prepare samples using well-established Illumina protocols, then capture and sequence by the methods described herein. In such embodiments, the target nucleic acid is captured or captured for sequencing prior to any amplification (which introduces errors and biases and removes any epigenetic information that may be part of the native target nucleic acid). Fixed.

伸長方法
ほとんどの実施形態では、伸長が起きるように、ポリヌクレオチドまたは他の標的分子(例えば、標的核酸、標的タンパク質、標的ポリペプチド、または標的ペプチド)を、試験基板、表面、またはマトリックスに、付着、結合、または固定する必要があり得る。一部の実施形態では、標的核酸の伸長は、その結晶学的距離(例えば、dsDNAでは、ある塩基から次の塩基へのインサイツでの分離が既知で0.34nm)と等しく、それよりも長く、またはそれよりも短くする。一部の実施形態では、標的核酸は、インサイツの結晶学的距離よりも長く伸展される。
Extension Methods In most embodiments, polynucleotides or other target molecules (eg, target nucleic acids, target proteins, target polypeptides, or target peptides) are attached to a test substrate, surface, or matrix such that extension occurs. , bound or fixed. In some embodiments, the stretch of the target nucleic acid is equal to and longer than its crystallographic distance (e.g., for dsDNA, the in situ separation from one base to the next is 0.34 nm). , or shorter. In some embodiments, the target nucleic acid is stretched beyond the in situ crystallographic distance.

一部の実施形態では、標的核酸は、分子コーミングを介して伸展される(例えば、Michalet et al.,Science 277:1518-1523,1997およびDeen et al.,ACS Nano 9:809-816,2015に記載されている)。これにより、数百万~数十億の標的核酸を、並行して、伸展させ、一方向に整列させることが可能になり得る。一部の実施形態では、分子コーミングは、所望の標的核酸を含む溶液を試験基板上で洗浄し、次いで、溶液のメニスカスを縮退することによって行われる。メニスカスを縮退する前に、標的核酸は、試験基板と、共有結合または他の相互作用を形成し得る。溶液が後退するにつれて、標的核酸は、メニスカスと同じ方向に(例えば、表面保持を介して)引っ張られる。しかし、標的核酸と試験基板との間の結合または固定の相互作用の強度が表面保持力を克服するのに十分である場合、標的核酸は、縮退するメニスカスの方向に均一な様式で伸展する。一部の実施形態では、分子コーミングは、Kaykov et al.,Sci Reports.6:19636(2016)に記載のように行われる(その全体が参照により本明細書に援用される)。他の実施形態では、分子コーミングは、Petit et al.Nano Letters 3:1141-1146(2003)に記載されている方法またはその修正版を使用して、(例えば、マイクロ流体デバイスの)チャネルで行われる。 In some embodiments, the target nucleic acid is extended via molecular combing (eg, Michaelet et al., Science 277:1518-1523, 1997 and Deen et al., ACS Nano 9:809-816, 2015 It is described in). This can allow millions to billions of target nucleic acids to be extended and unidirectionally aligned in parallel. In some embodiments, molecular combing is performed by washing a solution containing the desired target nucleic acid onto the test substrate and then retracting the meniscus of the solution. Prior to retracting the meniscus, the target nucleic acid may form covalent bonds or other interactions with the test substrate. As the solution recedes, the target nucleic acid is pulled in the same direction as the meniscus (eg, via surface retention). However, if the strength of the binding or anchoring interaction between the target nucleic acid and the test substrate is sufficient to overcome the surface retention forces, the target nucleic acid will extend in a uniform fashion towards the degenerating meniscus. In some embodiments, molecular combing is as described in Kaykov et al. , Sci Reports. 6:19636 (2016), which is incorporated herein by reference in its entirety. In other embodiments, molecular combing is performed as described in Petit et al. Nano Letters 3:1141-1146 (2003), or modifications thereof, in channels (eg, in microfluidic devices).

気液界面の形状は、分子コーミングによって伸展される伸長標的核酸の配向を決定し得る。一部の実施形態では、標的核酸は、気液界面に対して垂直に伸長される。一部の実施形態では、標的核酸は、その1つの末端の修飾なしに、試験基板もしくは他の表面に付着、結合、または固定されるか、あるいはそのいずれかの末端への修飾なしに、結合または固定される。一部の実施形態では、二本鎖標的核酸の末端が、疎水性相互作用によって捕捉される場合、後退メニスカスにより伸展されると、二本鎖標的核酸の部分が変性し、試験基板または表面とのさらなる疎水性相互作用が形成され得る。 The shape of the air-liquid interface can determine the orientation of extended target nucleic acids that are extended by molecular combing. In some embodiments, the target nucleic acid is elongated perpendicular to the air-liquid interface. In some embodiments, the target nucleic acid is attached, bound, or immobilized to a test substrate or other surface without modification of one end thereof, or bound without modification to either end thereof. or fixed. In some embodiments, when the ends of a double-stranded target nucleic acid are captured by hydrophobic interactions, when extended by a receding meniscus, portions of the double-stranded target nucleic acid denature and interact with the test substrate or surface. of additional hydrophobic interactions can be formed.

一部の実施形態では、標的核酸は、分子スレッディング(molecular threading)を介して伸展される(例えば、Payne et al.,PLoS ONE 8(7):e69058,2013に記載されている)。一部の実施形態では、分子スレッディングは、標的核酸が、(例えば、化学変性剤、温度または酵素、塩濃度またはpHによって)一本鎖に変性された後に行われる。一部の実施形態では、標的核酸は、一端で繋がれ、次いで、流体の流れを利用して伸展される(例えば、Greene et al.,Methods in Enzymology,327:293-315に示されている)。 In some embodiments, the target nucleic acid is extended via molecular threading (eg, described in Payne et al., PLoS ONE 8(7):e69058, 2013). In some embodiments, molecular threading is performed after the target nucleic acid is denatured (eg, by chemical denaturants, temperature or enzymes, salt concentration or pH) into single strands. In some embodiments, the target nucleic acid is tethered at one end and then extended using fluid flow (see, for example, Greene et al., Methods in Enzymology, 327:293-315 ).

様々な実施形態では、標的核酸は、マイクロ流体チャネル内に存在する。一部の実施形態では、標的核酸が、マイクロ流体チャネル内に流し込まれるか、または1つ以上の染色体、エキソソーム、核、もしくは細胞からフローチャネルに抽出される。一部の実施形態では、標的核酸をマイクロ流体フローセルもしくはナノ流体フローセルを介してナノチャネルに挿入するのではなく、ナノチャネルまたはマイクロチャネルである1つ以上のチャネルを、チャネルの壁および/または底が形成され得る表面が電気的にバイアスされるような方法で構築することによって、標的核酸を、オープントップチャネルに挿入する(例えば、Asanov et al.,Anal Chem.1998 Mar.15;70(6):1156-6を参照されたい)。一部の実施形態では、正のバイアスが、チャネルの壁および/または底が形成され得る表面に適用され、負に帯電した標的核酸がナノチャネルに引き寄せられる。同時に、チャネル間の領域は、電気的にバイアスされていない可能性があり、そのため、標的核酸が、チャネル間の領域に沈着する可能性が低くなる。 In various embodiments, the target nucleic acid is present within a microfluidic channel. In some embodiments, target nucleic acids are flowed into microfluidic channels or extracted from one or more chromosomes, exosomes, nuclei, or cells into flow channels. In some embodiments, rather than inserting a target nucleic acid into a nanochannel through a microfluidic or nanofluidic flow cell, one or more channels that are nanochannels or microchannels are formed with walls and/or bottoms of the channels. The target nucleic acid is inserted into the open-top channel by constructing it in such a way that the surface on which the can be formed is electrically biased (see, e.g., Asanov et al., Anal Chem. 1998 Mar. 15; 70 (6 ): 1156-6). In some embodiments, a positive bias is applied to the surface on which the walls and/or bottom of the channel can be formed, attracting negatively charged target nucleic acids to the nanochannel. At the same time, the regions between the channels may be electrically unbiased, thus making it less likely that the target nucleic acid will deposit in the regions between the channels.

一部の実施形態では、伸長は、流体力学的抗力によって実現される。一部の実施形態では、標的核酸は、ナノスリット(nanoslit)内のクロスフロー(crossflow)を介して伸展される(Marie et al.,Proc Natl Acad Sci USA 110:4893-8,2013)。一部の実施形態では、標的核酸の伸長は、フローチャネルにおけるナノ束縛によって実現される。フロー伸展・ナノ束縛は、一般に、マイクロ流体デバイスまたはナノ流体デバイス内で行われるフロー勾配を介して、標的核酸を線状のコンフォメーションに伸展することを伴い得る。この伸展方法を利用し得るマイクロ流体デバイスまたはナノ流体デバイスのナノ束縛部分は、マイクロ流体デバイスまたはナノ流体デバイスの狭い領域を指し得る。狭い領域またはチャネルの使用は、分子個体主義(molecular individualism)の問題(例えば、伸長中に個々の核酸または他のポリマーが複数のコンフォメーションを採り得る傾向)を克服するのに役立ち得る。フロー伸展法の1つの問題は、流れが、標的核酸に沿って常に等しく適用されるとは限らないことである。これは、伸長の長さの、広い範囲である、範囲を示す標的核酸をもたらす。一部の実施形態では、フロー伸展法は、伸長流および/または流体力学的抗力を伴ってもよい。一部の実施形態では、標的核酸が、マイクロチャネルまたはナノチャネル内に引き寄せられる場合、1つ以上の標的核酸は、マイクロチャネルまたはナノチャネル内でナノ束縛され、それによって、伸長される。一部の実施形態では、ナノ束縛後、標的核酸は、バイアス表面に、または試験基板もしくは他の表面の上部のコーティングもしくはマトリックスに沈着、結合、または固定される。 In some embodiments, elongation is achieved by hydrodynamic drag. In some embodiments, the target nucleic acid is extended through crossflow within a nanoslit (Marie et al., Proc Natl Acad Sci USA 110:4893-8, 2013). In some embodiments, elongation of the target nucleic acid is achieved by nano-tethering in the flow channel. Flow unfolding and nanoconstraint generally can involve unfolding a target nucleic acid into a linear conformation via a flow gradient performed within a microfluidic or nanofluidic device. A nano-constrained portion of a microfluidic or nanofluidic device that can utilize this method of extension can refer to a narrow region of a microfluidic or nanofluidic device. The use of narrow regions or channels can help overcome problems of molecular individualism, such as the tendency of individual nucleic acids or other polymers to adopt multiple conformations during extension. One problem with the flow extension method is that the flow is not always applied equally along the target nucleic acid. This results in target nucleic acids exhibiting a range of extension lengths. In some embodiments, flow extension may involve elongational flow and/or hydrodynamic drag. In some embodiments, one or more target nucleic acids are nanobound and thereby elongated within the microchannel or nanochannel when the target nucleic acids are drawn into the microchannel or nanochannel. In some embodiments, after nanobinding, the target nucleic acid is deposited, bound, or immobilized on the bias surface or in a coating or matrix on top of the test substrate or other surface.

一部の実施形態では、正のバイアスまたは負のバイアスを表面に適用する複数の方法のいずれかが利用される。一部の実施形態では、試験基板または他の表面は、耐汚染性(non-fouling)の特徴を有する材料で作製されるか、またはコーティングされ、試験基板または他の表面は、脂質(例えば、脂質二重層)、ウシ血清アルブミン(BSA)、カゼイン、様々なPEG誘導体などで不動態化される。不動態化は、チャネルの任意の1つの部分におけるポリヌクレオチドの集積、結合、または固定を防止する役割を果たし得、したがって、伸長および/またはより均一な伸長を可能にし得る。一部の実施形態では、試験基板または他の表面はまた、酸化インジウムスズ(ITO)または広スペクトル透明導電性酸化物、導電性ポリマー、グラフェン、非常に薄い金属フィルムなどの他の透明導電性表面を含んでもよい。 In some embodiments, any of several methods of applying a positive or negative bias to the surface are utilized. In some embodiments, the test substrate or other surface is made of or coated with a material that has non-fouling characteristics, and the test substrate or other surface is coated with a lipid (e.g., lipid bilayer), bovine serum albumin (BSA), casein, various PEG derivatives, etc. Passivation may serve to prevent accumulation, binding, or immobilization of polynucleotides in any one portion of the channel, thus allowing elongation and/or more uniform elongation. In some embodiments, the test substrate or other surface is also indium tin oxide (ITO) or other transparent conductive surfaces such as broad spectrum transparent conductive oxides, conductive polymers, graphene, very thin metal films. may include

一部の実施形態では、マイクロ流体チャネルまたはナノ流体チャネルを含む試験基板または他の表面に脂質二重層(LBL)を作製する場合、1%のリサミン(商標)ローダミンB 1,2-ジヘキサデカノイル-sn-グリセロ-3-ホスホエタノールアミンを含む両性イオンPOPC(1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン)脂質を、表面にコーティングする。トリエチルアンモニウム塩(ローダミン-DHPE)脂質の添加は、蛍光顕微鏡でのLBL形成の観察を可能にし得る。本開示の一部の実施形態で使用される脂質二重層不動態化の方法は、Persson et al.,Nano Lett.12:2260-2265,2012に記載されている。 In some embodiments, when creating lipid bilayers (LBLs) on test substrates or other surfaces containing microfluidic or nanofluidic channels, 1% Lissamine™ Rhodamine B 1,2-dihexadecadeca A zwitterionic POPC (1-palmitoyl-2-oleoyl-sn-glycero-3-phosphocholine) lipid containing noyl-sn-glycero-3-phosphoethanolamine is coated on the surface. Addition of triethylammonium salt (rhodamine-DHPE) lipids can allow observation of LBL formation under a fluorescence microscope. Methods of lipid bilayer passivation used in some embodiments of the present disclosure are described in Persson et al. , Nano Lett. 12:2260-2265, 2012.

一部の実施形態では、1つ以上の標的核酸の伸長は、電気泳動または誘電泳動を介して行われる。一部の実施形態では、標的核酸は、一方の末端で繋がれ、次いで、電場によって伸展される(例えば、Giese et al.,Nature Biotechnology 26:317-325,2008に記載されている)。核酸の電気伸展は、核酸が非常に負に帯電した分子であるという事実に基づいている。例えば、Randall et al.2006,Lab Chip.6,516-522に記載されている電気伸展の方法は、核酸が、電場によって、マイクロチャネルまたはナノチャネルを通して(標的核酸分子の配向を誘導するために)引き込まれることを伴う。一部の実施形態では、電気伸展は、ゲルまたは絡み合ったポリマー内またはそれなしで行われる。ゲルまたは絡み合ったポリマーを使用する1つの利点は、標的核酸が利用可能な三次元空間を制限することであり、それによって、分子個体主義を克服するのに役立つ。ナノ束縛などの圧力駆動型伸展方法に対する電気伸展の一般的な利点は、核酸分子を破壊するのに十分な剪断力の欠如である。 In some embodiments, extension of one or more target nucleic acids is via electrophoresis or dielectrophoresis. In some embodiments, the target nucleic acid is tethered at one end and then stretched by an electric field (eg, as described in Giese et al., Nature Biotechnology 26:317-325, 2008). Electrostretching of nucleic acids is based on the fact that nucleic acids are highly negatively charged molecules. For example, Randall et al. 2006, Lab Chip. 6, 516-522, involves drawing nucleic acids through microchannels or nanochannels (to induce orientation of target nucleic acid molecules) by an electric field. In some embodiments, electrostretching is performed within or without a gel or entangled polymer. One advantage of using gels or entangled polymers is that they limit the three-dimensional space available to target nucleic acids, thereby helping to overcome molecular individualism. A general advantage of electrostretching over pressure-driven stretching methods such as nanotethering is the lack of shear forces sufficient to disrupt nucleic acid molecules.

一部の実施形態では、複数のポリヌクレオチドが試験基板または他の表面に存在する場合、標的核酸は、同じ向きで整列していないこともあれば、まっすぐではないこともある(例えば、標的核酸は、試験基板または他の表面に付着、結合、もしくは固定してもよく、または曲線状の経路でゲルまたは絡み合ったポリマーを通して通り抜けてもよい)。かかる実施形態では、複数の標的核酸のうちの2つ以上が重複する可能性が高くなり、各標的核酸の長さに沿ったプローブの局在に関して潜在的な混乱につながる。一部の実施形態では、同じ配列決定情報が、直線状の十分に整列した標的核酸から得られるように、曲線状の標的核酸からも得られるが、曲線状の標的核酸からの配列決定情報を処理する画像処理タスクは、直線状の十分に整列した標的核酸から得られるものよりも、多くの計算力または時間を必要とし得る。 In some embodiments, when multiple polynucleotides are present on a test substrate or other surface, the target nucleic acids may not be aligned in the same orientation or straight (e.g., target nucleic acids may be attached, bound, or fixed to a test substrate or other surface, or may pass through a gel or entangled polymer in a curvilinear path). In such embodiments, it becomes more likely that two or more of the multiple target nucleic acids will overlap, leading to potential confusion regarding the localization of the probes along the length of each target nucleic acid. In some embodiments, the same sequencing information is obtained from a curved target nucleic acid as is obtained from a linear, well-aligned target nucleic acid, but the sequencing information from a curved target nucleic acid is Processing image processing tasks can require more computational power or time than can be obtained from a linear, well-ordered target nucleic acid.

実施形態では、1つ以上の標的核酸が、試験基板の表面である平面に平行な方向に伸長され、ある長さの標的核酸が、CMOSまたはCCDカメラなどのアレイ検出器である二次元撮像デバイス内の一連の隣接する画素にわたって撮像される。一部の実施形態では、1つ以上の標的核酸が、試験基板または他の表面に垂直な方向で伸長される。一部の実施形態では、標的核酸は、光シート顕微鏡、スピニングディスク共焦点顕微鏡、三次元超解像顕微鏡、三次元単一分子局在化、またはレーザ走査ディスク共焦点顕微鏡もしくはそのバリアントを介して撮像される。一部の実施形態では、標的核酸は、試験基板または他の表面に対して斜めの角度で伸長される。一部の実施形態では、標的核酸は、二次元撮像デバイスまたは検出器を介して撮像され、得られた画像またはフレームは、単一分子局在化アルゴリズムソフトウェアを介して処理される(例えば、Fiji/ ImageJ plug-in ThunderSTORM、Ovesny et al.,BioInform.30:2389-2390,2014に記載されている)。 In an embodiment, one or more target nucleic acids are elongated in a direction parallel to the plane that is the surface of the test substrate, and a length of target nucleic acid is an array detector, such as a CMOS or CCD camera, a two-dimensional imaging device. is imaged over a series of adjacent pixels in . In some embodiments, one or more target nucleic acids are elongated in a direction perpendicular to the test substrate or other surface. In some embodiments, the target nucleic acid is detected via light sheet microscopy, spinning disk confocal microscopy, three-dimensional super-resolution microscopy, three-dimensional single molecule localization, or laser scanning disk confocal microscopy or variants thereof. imaged. In some embodiments, the target nucleic acid is elongated at an oblique angle to the test substrate or other surface. In some embodiments, the target nucleic acid is imaged via a two-dimensional imaging device or detector and the resulting images or frames are processed via single molecule localization algorithm software (e.g., Fiji / ImageJ plug-in ThunderSTORM, Ovesny et al., BioInform.30:2389-2390, 2014).

固定および伸長の前の、単一細胞由来のDNAの抽出および単離。
一部の実施形態では、個々の細胞の標的核酸が遊離される間、個々の細胞を一箇所で保持するために、単一細胞用のトラップが、マイクロ流体構造内に設計される(例えば、WO2012/056192またはWO2012/055415のデバイス設計を使用して)。一部の実施形態では、ナノチャネル中の標的核酸を抽出および伸展する代わりに、カバーガラスまたは箔を使用して、マイクロ/ナノ流体構造を密封し、これをさらに、ポリビニルシランでコーティングして、分子コーミングを可能にする(例えば、Petit et al.,Nano Letters 3:1141-1146.2003に記載されているように、流体の動きによって)。流体チップ内の穏やかな条件により、抽出された標的核酸が長い鎖長を有するように保存され得る。
Extraction and isolation of DNA from single cells prior to fixation and extension.
In some embodiments, single-cell traps are designed within the microfluidic structure to hold individual cells in place while their target nucleic acids are released (e.g., using the device designs of WO2012/056192 or WO2012/055415). In some embodiments, instead of extracting and spreading the target nucleic acid in the nanochannel, a coverslip or foil is used to seal the micro/nanofluidic structure, which is further coated with polyvinylsilane to Enables molecular combing (eg, by fluid motion as described in Petit et al., Nano Letters 3:1141-1146.2003). Mild conditions within the fluidic chip can preserve the extracted target nucleic acids to have long chain lengths.

単一細胞または核からバイオポリマーを抽出するために、いくつかの異なるアプローチが利用可能である(例えば、いくつかの好適な方法が、Kim et al.,Integr Biol 1(10),574-86,2009に概説されている)。一部の非限定的な例では、細胞を高濃度のKCLで処理して、細胞膜を破裂させるか、または除去する。細胞は、低張液を添加することによって溶解される。一部の実施形態では、各細胞は、個別に単離され、各細胞のDNAは、個別に抽出され、次いで、単一細胞に関連する標的核酸の各セットは、マイクロ流体容器またはデバイス内で個別に配列決定される。一部の実施形態では、標的核酸抽出は、1つ以上の細胞を洗剤および/またはプロテアーゼで処理することによって行われ得る。一部の実施形態では、キレート剤(例えば、EDTAまたはEDDS)は、ヌクレアーゼによって必要とされる二価カチオンを捕捉するために溶解液中に提供される(したがって、ヌクレアーゼ活性を低下させる)。 Several different approaches are available for extracting biopolymers from single cells or nuclei (for example, some suitable methods are described in Kim et al., Integr Biol 1(10), 574-86 , 2009). In some non-limiting examples, cells are treated with high concentrations of KCL to rupture or remove cell membranes. Cells are lysed by adding hypotonic solution. In some embodiments, each cell is individually isolated, each cell's DNA is individually extracted, and then each set of target nucleic acids associated with a single cell is placed in a microfluidic container or device. Individually sequenced. In some embodiments, target nucleic acid extraction may be performed by treating one or more cells with detergents and/or proteases. In some embodiments, a chelating agent (eg, EDTA or EDDS) is provided in the lysate to trap divalent cations required by nucleases (thus reducing nuclease activity).

一部の実施形態では、単一細胞の核および余分な核成分は、以下の方法によって別々に抽出される。1つ以上の細胞が、マイクロ流体デバイスの供給チャネルに提供される。次いで、1つ以上の細胞が捕捉され得、各細胞は1つの捕捉構造によって捕捉される。第1の溶解緩衝液は、1つ以上の捕捉細胞を有するマイクロ流体デバイスの捕捉構造内に流動され、第1の溶解緩衝液は、細胞膜を溶解し得るが、細胞核の完全性を維持し得る。第1の溶解緩衝液が流動すると、マイクロ流体デバイスの捕捉構造内で捕捉された1つ以上の細胞の核外成分がマイクロ流体デバイス内のフローセル内に遊離され、そこで放出されたRNAおよび細胞質が固定化される。次いで、第2の溶解緩衝液を、1つ以上の捕捉細胞またはその残部を有するマイクロ流体デバイスの捕捉構造に供給することによって、1つ以上の核をさらに溶解してもよい。第2の溶解緩衝液の添加は、1つ以上の核および/またはミトコンドリアの成分(例えば、ゲノムDNAまたはミトコンドリアDNA)の、DNAがその後に固定化されるマイクロ流体デバイス中のフローセルへの放出を引き起こし得る。1つ以上の細胞の核外および細胞内構成要素は、同じフローセルの異なる場所で、または同じマイクロ流体デバイス内の異なるフローセル内で、または異なるマイクロ流体デバイス内で固定化される。 In some embodiments, single cell nuclei and extra nuclear components are separately extracted by the following method. One or more cells are provided to the feed channel of the microfluidic device. One or more cells can then be trapped, each cell being trapped by one trapping structure. A first lysis buffer is flowed into the capture structures of a microfluidic device having one or more captured cells, the first lysis buffer can lyse cell membranes but maintain the integrity of cell nuclei. . Upon flow of the first lysis buffer, one or more extranuclear components of the cells captured within the capture structures of the microfluidic device are liberated within the flow cell within the microfluidic device, where the released RNA and cytoplasm are immobilized. One or more nuclei may then be further lysed by providing a second lysis buffer to the capture structures of the microfluidic device having the one or more captured cells or remnants thereof. Addition of the second lysis buffer causes the release of one or more nuclear and/or mitochondrial components (e.g., genomic DNA or mitochondrial DNA) to the flow cell in the microfluidic device where the DNA is subsequently immobilized. can cause. One or more extranuclear and intracellular components of a cell are immobilized at different locations of the same flow cell, or within different flow cells within the same microfluidic device, or within different microfluidic devices.

図16Aおよび図16Bの概略図は、複数の単一細胞を捕捉および単離し得るマイクロ流体アーキテクチャを示す。細胞1602は、フローセル2004内の細胞トラップ1606によって捕捉される。一部の実施形態では、細胞が捕捉された後、溶解試薬が、図示された細胞トラップ1606に流入し、通過する。次いで、溶解後、核酸1608は、捕捉トラップ1606に近接して分布してもよく、一方、他の細胞1602から抽出された核酸1608から隔離されたままであってもよい。一部の実施形態では、図16Bに図示されるように、電気泳動性の誘導は、核酸を操作するために行われる(例えば、電荷1610を使用することによって)。溶解により、細胞1602および核1604から核酸1608が放出され得る。核酸1608は、細胞1602が捕捉されたときに、核酸1608があった位置(例えば、細胞トラップ1606に対して)に留まっていてもよい。トラップは、単一細胞の寸法(例えば、2~10μm)である。一部の実施形態では、微小液滴を含む試料をもたらすチャネルおよびマイクロ流体デバイスのフローセルはともに、2μm、10μmよりも広く、かつ高く、または10μm超である。一部の実施形態では、分岐チャネルとトラップとの間の距離は、1~1000ミクロンである。 The schematic diagrams of Figures 16A and 16B show a microfluidic architecture that can capture and isolate multiple single cells. Cell 1602 is captured by cell trap 1606 within flow cell 2004 . In some embodiments, after cells are trapped, the lysis reagent flows into and through the illustrated cell trap 1606 . After lysis, nucleic acids 1608 may then be distributed in close proximity to capture traps 1606 while remaining segregated from nucleic acids 1608 extracted from other cells 1602 . In some embodiments, electrophoretic induction is performed to manipulate nucleic acids (eg, by using charge 1610), as illustrated in FIG. 16B. Lysis can release nucleic acids 1608 from cells 1602 and nuclei 1604 . Nucleic acid 1608 may remain where it was (eg, relative to cell trap 1606) when cell 1602 was trapped. Traps are of single cell size (eg, 2-10 μm). In some embodiments, the channel that provides the sample containing microdroplets and the flow cell of the microfluidic device are both wider and taller than 2 μm, 10 μm, or greater than 10 μm. In some embodiments, the distance between the branch channel and the trap is 1-1000 microns.

表面での高分子量DNAの抽出および伸長。
様々な実施形態では、HMWポリヌクレオチドを伸展するための様々な方法が使用される(例えば、ACS Nano.9(1):809-16,2015)。1つのそのような例では、表面での伸長は、フローセルで行われる(例えば、Petit and Carbeck in Nano.Lett.3:1141-1146,2003に記載されているアプローチを使用することによって)。流体またはマイクロ流体アプローチに加えて、一部の実施形態では、ポリヌクレオチドは、Giess et al.,Nature Biotechnology 26,317 -325(2008)に開示されているような電場を使用して、伸展される。ポリヌクレオチドが表面に付着されていない場合、ポリヌクレオチドを伸長させるためのいくつかのアプローチが利用可能である(例えば、Frietag et al.,Biomicrofluidics,9(4):044114(2015)、Marie et al.,Proc Natl Acad Sci USA 110:4893-8,2013)。
Extraction and extension of high molecular weight DNA on surfaces.
In various embodiments, various methods for extending HMW polynucleotides are used (eg, ACS Nano. 9(1):809-16, 2015). In one such example, surface extension is performed in a flow cell (eg, by using the approach described in Petit and Carbeck in Nano. Lett. 3:1141-1146, 2003). In addition to fluidic or microfluidic approaches, in some embodiments, polynucleotides are prepared according to Giess et al. , Nature Biotechnology 26, 317-325 (2008). Several approaches are available for extending polynucleotides when they are not attached to a surface (e.g., Frietag et al., Biomicrofluidics, 9(4):044114 (2015), Marie et al. ., Proc Natl Acad Sci USA 110:4893-8, 2013).

一部の実施形態では、ゲルプラグ中でDNA使用する代替として、試験基板を含み得るマイクロ流体デバイスにロードするのに好適な染色体は、Cram et al.,Methods Cell Sci.,2002,24,27-35に記載されているポリアミン法によって調製され、試験基板を含み得るマイクロ流体デバイスに直接ピペッティングで送られる。一部のかかる実施形態では、染色体中のDNAに結合されたタンパク質は、プロテアーゼを使用して消化され、実質的に裸のDNAを遊離し、次いで、上に記載のように固定され、伸長され得る。 In some embodiments, as an alternative to using DNA in gel plugs, chromosomes suitable for loading into microfluidic devices that may contain test substrates are described in Cram et al. , Methods Cell Sci. , 2002, 24, 27-35 and pipetted directly into a microfluidic device that may contain a test substrate. In some such embodiments, proteins bound to DNA in chromosomes are digested using a protease to release substantially naked DNA, which is then fixed and elongated as described above. obtain.

リードの場所保存のための試料の処理。
非常に長い領域またはポリマーが配列決定される実施形態では、標的核酸の任意の分解は、全体的な配列決定の正確度を著しく低下させる可能性を有する。伸長ポリマー全体の保存を促進する方法を以下に提示する。
Sample processing for lead location preservation.
In embodiments in which very long regions or polymers are sequenced, any degradation of the target nucleic acid has the potential to significantly reduce overall sequencing accuracy. A method for promoting preservation of the entire extended polymer is presented below.

標的核酸は、抽出、保存、または調製中に損傷する可能性を有する。ニック、ギャップ、塩基の酸化、シトシンのデラミネーション、および付加物は、天然の二本鎖ゲノムDNA分子内に形成され得る。これは、特に、試料のポリヌクレオチドがFFPE材料由来である場合に当てはまる。したがって、一部の実施形態では、DNA修復溶液は、DNAが固定化される前または後に導入される。一部の実施形態では、DNA修復は、ゲルプラグへのDNA抽出後に行われる。一部の実施形態では、修復溶液は、DNAエンドヌクレアーゼ、キナーゼ、および他のDNA修飾酵素を含んでいてもよい。一部の実施形態では、修復溶液は、ポリメラーゼおよびリガーゼを含み得る。一部の実施形態では、修復溶液は、New England BiolabsのプレPCRキットである。一部の実施形態では、かかる方法は、主に、Karimi-Busheri et al.,Nucleic Acids Res.Oct 1;26(19):4395-400,1998、およびKunkel et al.,Proc.Natl Acad Sci.USA,78,6734-6738,1981に記載されているように行われる。他の実施形態では、標的核酸損傷を検出することが望ましい。例えば、1つ以上のDNA付加物の数および場所を決定することが望ましい。かかる実施形態では、追加の標識付加物特異的結合部分は、配列決定方法の一部として利用される。 Target nucleic acids have the potential to be damaged during extraction, storage, or preparation. Nicks, gaps, oxidation of bases, delamination of cytosines, and adducts can form within naturally occurring double-stranded genomic DNA molecules. This is especially true when the sample polynucleotides are derived from FFPE material. Therefore, in some embodiments, a DNA repair solution is introduced before or after the DNA is immobilized. In some embodiments, DNA repair is performed after DNA extraction into gel plugs. In some embodiments, repair solutions may include DNA endonucleases, kinases, and other DNA modifying enzymes. In some embodiments, a repair solution may include a polymerase and a ligase. In some embodiments, the repair solution is New England Biolabs' pre-PCR kit. In some embodiments, such methods are based primarily on Karimi-Busheri et al. , Nucleic Acids Res. Oct 1;26(19):4395-400, 1998, and Kunkel et al. , Proc. Natl Acad Sci. USA, 78, 6734-6738, 1981. In other embodiments, it is desirable to detect target nucleic acid damage. For example, it may be desirable to determine the number and location of one or more DNA adducts. In such embodiments, additional labeled adduct-specific binding moieties are utilized as part of the sequencing method.

一部の実施形態では、標的核酸が伸長された後、ゲル重層を適用する。一部のかかる実施形態では、試験基板または他の表面での伸長および変性後、二本鎖標的核酸または変性標的核酸は、ゲル層で覆われる。代替的に、標的核酸は、既にゲル環境にある間、(例えば、上に記載のように)伸長される。一部の実施形態では、標的核酸の伸長後、ゲル中に投入される。例えば、一部の実施形態では、標的核酸が一端で表面に付着し、試薬の流れまたは電気泳動場によって伸展されるとき、周辺領域の媒体がゲル中に投入される。一部の実施形態では、ゲルへの投入は、試薬の流れの中に、アクリルアミド、過硫酸アンモニウム、およびTEMEDを含むことによって起こり得る。かかる化合物は、重合するとポリアクリルアミドとなる。代替的な実施形態では、熱に応答するゲルが適用される。一部の実施形態では、標的核酸の末端は、アクリルアミドと重合し得るアクリダイトで修飾される。一部のかかる実施形態では、天然ポリヌクレオチドの骨格の負電荷を考慮すると、電場の印加により、正極に向かってポリヌクレオチドが伸長する。 In some embodiments, gel overlay is applied after the target nucleic acid is elongated. In some such embodiments, after extension and denaturation on a test substrate or other surface, the double-stranded or denatured target nucleic acid is covered with a gel layer. Alternatively, the target nucleic acid is elongated (eg, as described above) while already in the gel environment. In some embodiments, the target nucleic acid is put into a gel after elongation. For example, in some embodiments, the target nucleic acid is attached at one end to a surface and the media of the surrounding area is cast into the gel as it is stretched by a flow of reagents or an electrophoresis field. In some embodiments, loading into the gel can occur by including acrylamide, ammonium persulfate, and TEMED in the reagent stream. Such compounds polymerize to polyacrylamides. In an alternative embodiment, a thermally responsive gel is applied. In some embodiments, the ends of the target nucleic acid are modified with an acrylidite that can polymerize with acrylamide. In some such embodiments, application of an electric field causes the polynucleotide to elongate toward the positive electrode, given the negative charge of the backbone of naturally occurring polynucleotides.

一部の実施形態では、標的核酸は、標的核酸の完全性を維持するために、ゲルプラグまたはゲル層中の細胞から抽出され、次いで、AC電場が印加されて、ゲル内の標的核酸が誘電泳動的に伸展または伸長される。誘電泳動的な伸展は、カバーガラスの上部のゲル層、または試験基板もしくは他の表面に会合したゲル中で行われ、その後、本明細書に記載される方法のいずれかを利用し、伸展された標的核酸に適用して、オリゴヌクレオチドプローブ種の一過的な結合を検出することができる。 In some embodiments, the target nucleic acid is extracted from cells in a gel plug or gel layer to maintain the integrity of the target nucleic acid and then an AC electric field is applied to dielectrophoretically dielectrophoretically target the nucleic acid within the gel. stretched or elongated. Dielectrophoretic spreading is performed in a gel layer on top of a coverslip, or gel associated with a test substrate or other surface, and then spread using any of the methods described herein. can be applied to different target nucleic acids to detect transient binding of the oligonucleotide probe species.

一部の実施形態では、試料または標的核酸は、その環境のマトリックスに架橋される。一例では、これは、細胞環境である。例えば、本明細書に記載される核酸配列決定方法が細胞においてインサイツで行われる場合、標的核酸は、ヘテロ二官能性架橋剤を使用して、細胞マトリックスに架橋される。これは、FISSEQなどの技術を使用して、セル内で直接配列決定する方法の一部として行われる(Lee et al.,Science 343:1360-1363,2014)。 In some embodiments, the sample or target nucleic acid is crosslinked to the matrix of its environment. In one example, this is the cellular environment. For example, when the nucleic acid sequencing methods described herein are performed in situ in a cell, the target nucleic acid is crosslinked to the cell matrix using a heterobifunctional crosslinker. This is done as part of a method of direct in-cell sequencing using techniques such as FISSEQ (Lee et al., Science 343:1360-1363, 2014).

標的生体分子に対する損傷の多くは、標的生体分子を細胞および組織から抽出するプロセスにおいて、ならびに(標的生体分子が分析される前の)標的生体分子のその後の取り扱いにおいて生じる。標的核酸の場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。一部の実施形態では、機械的ストレスは、例えば、ChemBioChem,11:340-343(2010)に開示されている方法で、最小化される。加えて、カルシウムもしくは亜鉛、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の非触媒性二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対非触媒性二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。 Much of the damage to target biomolecules occurs in the process of extracting the target biomolecules from cells and tissues and in their subsequent handling (before the target biomolecules are analyzed). In the case of target nucleic acids, aspects of their handling that result in loss of their integrity can include pipetting, vortexing, freeze-thawing, and excessive heating. In some embodiments, mechanical stress is minimized, for example, by methods disclosed in ChemBioChem, 11:340-343 (2010). In addition, high concentrations of noncatalytic divalent cations such as calcium or zinc, EDTA, EGTA, or gallic acid (and analogues and derivatives thereof) can inhibit degradation by nucleases. In some embodiments, a 2:1 mass ratio of sample to non-catalytic divalent cations is sufficient to inhibit nucleases, even in samples such as stool where extreme levels of nucleases are present.

標的核酸の完全性を維持するために(例えば、DNA損傷またはより小さな断片への破壊を誘発しないように)、一部の実施形態では、DNAまたはRNAなどの生体高分子を、染色体、ミトコンドリア、細胞、核、エキソソームなどのその天然の保護された環境に保持することが望ましい。標的核酸が既にその保護された環境の外にある一部の実施形態では、それをゲルまたは微小液滴などの保護された環境に内包することが望ましい。一部の実施形態では、標的核酸は、その保護環境から、配列決定される場所(例えば、配列決定データが取得され得る流体系またはフローセルの一部)に物理的に近接して、遊離される。したがって、一部の実施形態では、生体高分子(例えば、核酸、タンパク質)は、保護された実体で提供され、当該保護された実体は、その天然状態(例えば、天然長)に近い生体高分子を維持し、生体高分子を含む保護された実体を、生体高分子が配列決定され得る場所に近接してもたらし、次いで、生体高分子を、配列決定される領域に、または配列決定される領域に近い領域に放出する。一部の実施形態では、フローセルは、試料の標的ゲノムDNAを効果的に封入し得るアガロースゲルを含み得、当該アガロースゲルは、長さが200Kbを超えるゲノムDNAの実質的な部分を維持し、標的ゲノムDNAを含むアガロースゲルを、標的ゲノムDNAが配列決定される環境(例えば、試験基板、表面、ゲル、マトリックス)の近くに配置し、標的ゲノムDNAを、アガロースゲルから配列決定環境に(または標的ゲノムDNAのさらなる輸送および取り扱いが最小化されるように、配列決定環境の近くに)放出し、1つ以上の配列決定方法を実施する。配列決定環境への放出は、電場の印加、またはアガラーゼによるアガロースゲルの消化によるものである。 To maintain the integrity of the target nucleic acid (e.g., so as not to induce DNA damage or breakage into smaller fragments), in some embodiments, biopolymers such as DNA or RNA are added to chromosomes, mitochondria, It is desirable to keep it in its natural protected environment, such as cells, nuclei, exosomes. In some embodiments where the target nucleic acid is already outside its protected environment, it is desirable to encase it in a protected environment such as a gel or microdroplet. In some embodiments, the target nucleic acid is released from its protective environment in physical proximity to where it is to be sequenced (e.g., part of a fluidic system or flow cell from which sequencing data can be obtained). . Thus, in some embodiments, a biopolymer (e.g., nucleic acid, protein) is provided with a protected entity that approximates its native state (e.g., native length). and bring the protected entity containing the biopolymer into close proximity to the location where the biopolymer may be sequenced, and then place the biopolymer into the region to be sequenced or to the region to be sequenced. emits to a region close to In some embodiments, the flow cell may comprise an agarose gel capable of effectively encapsulating target genomic DNA of a sample, the agarose gel retaining a substantial portion of genomic DNA greater than 200 Kb in length, An agarose gel containing target genomic DNA is placed near the environment in which the target genomic DNA is to be sequenced (e.g., test substrate, surface, gel, matrix), and the target genomic DNA is transferred from the agarose gel to the sequencing environment (or Close to the sequencing environment) and one or more sequencing methods are performed, such that further transport and handling of the target genomic DNA is minimized. Release to the sequencing environment is by application of an electric field or digestion of the agarose gel by agarase.

高分子の変性。
ブロック206。一部の実施形態では、固定された伸展二本鎖標的核酸を、その後、試験基板上で一本鎖形態に変性し、それによって、標的核酸の固定された第1の鎖および固定された第2の鎖を得る。固定された第2の鎖のそれぞれの塩基は、固定された第1の鎖の対応する相補塩基に隣接していてもよい。一部の実施形態では、変性は、最初に、二本鎖標的核酸を伸長または伸展させ、次いで、変性溶液を添加して、2本鎖を分離することによって行われる。
Polymer denaturation.
block 206; In some embodiments, the fixed, extended double-stranded target nucleic acid is then denatured to a single-stranded form on a test substrate, thereby separating the fixed first strand and the fixed second strand of the target nucleic acid. You get 2 strands. Each base of the immobilized second strand may be adjacent to the corresponding complementary base of the immobilized first strand. In some embodiments, denaturation is performed by first elongating or stretching a double-stranded target nucleic acid and then adding a denaturing solution to separate the duplexes.

一部の実施形態では、変性は、1つ以上の試薬(例えば、0.5MのNaOH、DMSO、ホルムアミド、尿素など)を含む化学変性である。一部の実施形態では、変性は、(例えば、試料を85℃以上に加熱することによる)熱変性である。一部の実施形態では、変性は、ヘリカーゼ、またはヘリカーゼ活性を有する他の酵素の使用を介したものなどの、酵素変性を介したものである。一部の実施形態では、標的核酸は、表面との相互作用を介して、または臨界長を超えた伸展などの物理的プロセスによって、変性される。一部の実施形態では、変性は完全または部分的である。 In some embodiments, denaturation is chemical denaturation involving one or more reagents (eg, 0.5 M NaOH, DMSO, formamide, urea, etc.). In some embodiments, denaturation is thermal denaturation (eg, by heating the sample to 85° C. or higher). In some embodiments, denaturation is through enzymatic denaturation, such as through the use of helicase, or other enzymes with helicase activity. In some embodiments, the target nucleic acid is denatured through interaction with a surface or by physical processes such as stretching beyond a critical length. In some embodiments, denaturation is complete or partial.

一部の実施形態では、オリゴヌクレオチドプローブ種の、標的核酸の反復単位上の修飾(例えば、ポリヌクレオチドのエピジェネティック修飾ヌクレオチド、またはポリペプチドのリン酸化)への結合は、任意選択的な変性ステップの前または後に行われる。 In some embodiments, binding of the oligonucleotide probe species to modifications on repeat units of a target nucleic acid (e.g., epigenetically modified nucleotides of polynucleotides, or phosphorylation of polypeptides) is followed by an optional denaturation step. before or after

一部の実施形態では、二本鎖標的核酸の任意選択的な変性は、まったく行われない場合がある。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、標的核酸の二重鎖構造への結合またはアニーリングに利用される。例えば、一部の実施形態では、オリゴヌクレオチドプローブ種は、二重鎖形態標的核酸の過剰なゆらぎ(breathing)を誘導することによって、修飾亜鉛フィンガータンパク質の使用により二重鎖形態標的核酸の配列を認識することによって、または標的核酸の二重鎖形態を変性させてガイドRNAの結合を可能にするCas9もしくは類似のタンパク質を使用することによって、二重鎖形態標的核酸の個々の鎖に(例えば、PNAプローブを使用して)ストランド侵入(strand invasion)を介して結合し得る。一部の実施形態では、ガイドRNAは、照合プローブ(interrogation probe)配列および標識を含んでもよく、したがって、本明細書に記載されるオリゴヌクレオチドプローブ種として機能し、オリゴヌクレオチドプローブ種の1つ以上のセットの各配列を含むgRNAが提供される。 In some embodiments, optional denaturation of double-stranded target nucleic acids may not occur at all. In some such embodiments, oligonucleotide probe species are utilized for binding or annealing to duplex structures of target nucleic acids. For example, in some embodiments, an oligonucleotide probe species is used to detect the sequence of a double-stranded form of the target nucleic acid through the use of modified zinc finger proteins by inducing excessive breathing of the double-stranded form of the target nucleic acid. individual strands of a double-stranded form of a target nucleic acid (e.g., It may bind via strand invasion (using a PNA probe). In some embodiments, the guide RNA may comprise an interrogation probe sequence and a label, thus functioning as an oligonucleotide probe species described herein, and one or more of the oligonucleotide probe species A gRNA comprising each sequence of the set of is provided.

一部の実施形態では、二本鎖標的核酸は、ニック(例えば、天然のニック、またはDNase1処理によって生成するもの)を含んでもよい。かかる実施形態では、反応の条件下で、一方の鎖が、二重鎖の他方の鎖から一過的に解れるもしくは剥がれる(例えば、一過的に変性する)か、または自然な塩基対のゆらぎが生じる。これは、オリゴヌクレオチドプローブ種が、天然鎖の再ハイブリダイゼーションによって置換される前に、一過的に結合することを可能にし得る。 In some embodiments, a double-stranded target nucleic acid may include nicks (eg, natural nicks or those generated by DNase 1 treatment). In such embodiments, under the conditions of the reaction, one strand will transiently unravel or detach from the other strand of the duplex (e.g., transiently denature) or will undergo natural base pairing. Fluctuation occurs. This may allow the oligonucleotide probe species to transiently bind before being displaced by rehybridization of the native strand.

一部の実施形態では、単一の二本鎖標的核酸が変性され、その結果、二重鎖の各鎖が利用可能になり、オリゴヌクレオチドプローブ種が結合する。一部の実施形態では、単一の標的核酸は、変性プロセスによって、または配列決定方法の別のステップによって、損傷され、(例えば、好適なDNAポリメラーゼおよび/またはリガーゼの添加によって)修復される。 In some embodiments, a single double-stranded target nucleic acid is denatured so that each strand of the duplex is available for binding of an oligonucleotide probe species. In some embodiments, a single target nucleic acid is damaged and repaired (eg, by addition of a suitable DNA polymerase and/or ligase) by a denaturation process or by another step of the sequencing method.

一部の実施形態では、(試験基板または他の表面への固定または結合の準備において)二本鎖標的ゲノムDNAの固定化および線状化は、分子コーミング、表面への二本鎖標的ゲノムDNAのUV架橋、任意選択的な湿潤、化学変性剤(例えば、アルカリ性溶液、DMSOなど)への曝露による二本鎖標的ゲノムDNAの変性、洗浄後の酸性溶液への任意選択的な曝露、および事前調整緩衝液への任意選択的な曝露を含み得る。 In some embodiments, immobilization and linearization of double-stranded target genomic DNA (in preparation for immobilization or binding to a test substrate or other surface) involves molecular combing, double-stranded target genomic DNA to a surface. UV cross-linking, optional wetting, denaturation of double-stranded target genomic DNA by exposure to chemical denaturants (e.g., alkaline solutions, DMSO, etc.), optional exposure to acidic solutions after washing, and prior Optional exposure to conditioning buffer may be included.

プローブのアニーリング。
ブロック208。任意選択的な変性ステップの後、本方法は、固定された第1の鎖および固定された第2の鎖を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露することによって継続し得、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、所定の配列および長さである。曝露は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のオリゴヌクレオチドプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の各部分と結合し、それぞれの二重鎖を形成することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる。
Annealing the probe.
block 208; After an optional denaturation step, the method exposes the immobilized first strand and the immobilized second strand to respective pools of oligonucleotide probe species for each of the set of oligonucleotide probe species. Each oligonucleotide probe species of the set of oligonucleotide probe species is of a given sequence and length. The exposure is such that the individual oligonucleotide probes of each pool of each oligonucleotide probe species are complementary to their respective oligonucleotide probe species, each portion of the immobilized first strand or immobilized second strand. and under conditions that allow them to form their respective duplexes, thereby giving rise to their respective instances of optical activity.

図5A、図5Bおよび図5Cは、異なるプローブ種の1つのポリマー502への一過的な結合の例を示す。各プローブ(例えば、504、506、および508)は、特定の照合配列(interrogation sequence)(例えば、オリゴヌクレオチドまたはペプチド配列)を含み得る。プローブ種504を、ポリマー502に適用した後、プローブ種504は、1回以上の洗浄ステップにより、ポリマー502から洗い流される。その後、同様の洗浄ステップが、プローブ種506および508を除去するために使用される。 5A, 5B and 5C show examples of transient binding of different probe species to one polymer 502. FIG. Each probe (eg, 504, 506, and 508) can include a specific interrogation sequence (eg, oligonucleotide or peptide sequence). After applying the probe species 504 to the polymer 502, the probe species 504 are washed from the polymer 502 by one or more washing steps. Similar washing steps are then used to remove probe species 506 and 508 .

プローブの設計および標的。
一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のプールを含む溶液を、溶液中の標的核酸に提供する。オリゴヌクレオチドプローブ種を含むプールが、試験基板、他の表面、またはマトリックス上の標的核酸と接触した場合、オリゴヌクレオチドプローブは、拡散および分子衝突により、標的核酸と接触することができる。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のプールを含む溶液は、オリゴヌクレオチドプローブを、1つ以上の標的核酸と接触させるように撹拌される。一部の実施形態では、溶液を含むオリゴヌクレオチドプローブ種を交換して、新鮮なオリゴヌクレオチドプローブを、試験基板、他の表面、またはマトリックス上の1つ以上の標的ヌクレオチドにもたらす。一部の実施形態では、電場を使用して、オリゴヌクレオチドプローブを試験基板、または他の表面、例えば、正に付勢した表面またはAC電界に引き寄せることができる。
Probe design and targeting.
In some embodiments, a solution comprising one or more pools of oligonucleotide probe species is provided to target nucleic acids in solution. When a pool containing oligonucleotide probe species contacts target nucleic acids on a test substrate, other surface, or matrix, the oligonucleotide probes can contact the target nucleic acids by diffusion and molecular collisions. In some embodiments, a solution containing one or more pools of oligonucleotide probe species is agitated so as to contact the oligonucleotide probes with one or more target nucleic acids. In some embodiments, the oligonucleotide probe species containing solution is exchanged to provide fresh oligonucleotide probes to one or more target nucleotides on a test substrate, other surface, or matrix. In some embodiments, an electric field can be used to attract oligonucleotide probes to a test substrate, or other surface, such as a positively energized surface or an AC electric field.

一部の実施形態では、標的核酸は、特定のポリヌクレオチド配列を含み得、オリゴヌクレオチドプローブ種の特異的結合部分は、例えば、3塩基長、4塩基長、5塩基長、または6塩基長のオリゴヌクレオチド配列照合部分(interrogation portion)、任意選択的に、1つ以上の縮重位置または普遍的位置、および、任意選択的に、ヌクレオチドスペーサー(例えば、1つ以上のTヌクレオチド)または脱塩基部分もしくは非ヌクレオチド部分を含む。図6Aおよび図6Bに示されるように、同様の結合が、使用されるオリゴヌクレオチドプローブ種(例えば、604および610)の長さに関わらず、標的核酸602に沿って生じる。異なるk塩基長のオリゴヌクレオチドに固有の主な違いは、k塩基長が、それぞれのオリゴヌクレオチドプローブ種によって結合される結合部位の長さを設定することである(例えば、3塩基長のプローブ604は、606などの3ヌクレオチド長の部位に主にかつより安定して結合し、5塩基長のプローブ610は、610などの5ヌクレオチド長の部位に主にかつより安定して結合する)。 In some embodiments, the target nucleic acid can comprise a specific polynucleotide sequence, wherein the specific binding portion of the oligonucleotide probe species is, for example, 3, 4, 5, or 6 bases long. an oligonucleotide interrogation portion, optionally one or more degenerate or universal positions, and optionally a nucleotide spacer (e.g., one or more T nucleotides) or abasic portion or contain non-nucleotide moieties. As shown in FIGS. 6A and 6B, similar binding occurs along target nucleic acid 602 regardless of the length of the oligonucleotide probe species (eg, 604 and 610) used. The main difference inherent in different k base length oligonucleotides is that the k base length sets the length of the binding site bound by the respective oligonucleotide probe species (e.g., 3 base length probe 604 binds predominantly and more stably to 3-nucleotide-long sites such as 606, and 5-base-long probes 610 bind predominantly and more stably to 5-nucleotide-long sites such as 610).

図6Aでは、例示された3塩基長のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブとして使用するには異常に短い。通常、そのような短い配列は、非常に低い温度および長いインキュベーション時間が使用されない限り、安定して結合することができないため、オリゴヌクレオチドプローブとして使用されない。しかし、そのような短いオリゴヌクレオチドプローブ種は、本明細書に記載される検出方法に必要とされるような標的核酸への一過的な結合を形成しない。さらに、オリゴヌクレオチドプローブ種の配列が短いほど、オリゴヌクレオチドプローブ種のセットに存在するオリゴヌクレオチドプローブ種がより少ない。例えば、3塩基長のオリゴヌクレオチドプローブ種の完全なセットには、64個のみのオリゴヌクレオチド配列が必要であり、一方、4塩基長のオリゴヌクレオチドプローブ種の完全なセットには、256個のオリゴヌクレオチド配列が必要である。さらに、融解温度を上げるために、一部の実施形態では、非常に短いオリゴヌクレオチドプローブ種のプールが修飾され、一部の実施形態では、本明細書に記載される縮重ヌクレオチド(例えば、N)または普遍的ヌクレオチドが含まれる場合がある。例えば、7塩基長のオリゴヌクレオチドの安定性に対して、4つのNヌクレオチドは、3塩基長のオリゴヌクレオチドの安定性を増加させるであろう。 In FIG. 6A, the 3-base long oligonucleotide probe species exemplified is unusually short for use as an oligonucleotide probe. Usually such short sequences are not used as oligonucleotide probes because they cannot bind stably unless very low temperatures and long incubation times are used. However, such short oligonucleotide probe species do not form transient binding to target nucleic acids as required for the detection methods described herein. Furthermore, the shorter the sequences of the oligonucleotide probe species, the fewer oligonucleotide probe species present in the set of oligonucleotide probe species. For example, a complete set of 3 base long oligonucleotide probe species requires only 64 oligonucleotide sequences, while a complete set of 4 base long oligonucleotide probe species requires 256 oligos. A nucleotide sequence is required. Furthermore, to increase the melting temperature, in some embodiments the pool of very short oligonucleotide probe species is modified, in some embodiments degenerate nucleotides (e.g., N ) or universal nucleotides. For example, 4 N nucleotides will increase the stability of a 3 base long oligonucleotide, relative to the stability of a 7 base long oligonucleotide.

図6Bの概略図では、5塩基長のオリゴヌクレオチドプローブの、その完全一致位置(612-3)、1塩基不一致位置(612-2)、および2塩基不一致位置(612-1)への結合が示されている。 In the schematic diagram of FIG. 6B, binding of a 5-base long oligonucleotide probe to its perfect match position (612-3), 1-base mismatch position (612-2), and 2-base mismatch position (612-1) is It is shown.

任意の1つのオリゴヌクレオチドプローブの結合は、標的核酸の配列決定を可能にするのに十分ではない場合がある。一部の実施形態では、標的核酸の配列を再構築するために、オリゴヌクレオチドプローブの完全なセットが必要である。オリゴヌクレオチドプローブ種の結合部位の場所、重複する結合部位へのオリゴヌクレオチドプローブ種の時間的に離れた結合、オリゴヌクレオチドプローブ種と標的核酸との間の不一致の部分的結合、結合の頻度、および結合の持続時間に関する情報は、すべて、配列または標的核酸の推定に寄与し得る。伸長または伸展された標的核酸の場合、標的核酸の長さに沿ったオリゴヌクレオチドプローブ種の結合の場所は、高い信頼度を有する配列の構築に寄与し得る。二本鎖標的核酸の場合、二重鎖形態の標的核酸の両方(例えば、両方の相補鎖)を同時に配列決定することから、より高い信頼性の配列が現れ得る。 Binding of any one oligonucleotide probe may not be sufficient to allow sequencing of the target nucleic acid. In some embodiments, a complete set of oligonucleotide probes is required to reconstruct the sequence of the target nucleic acid. location of binding sites for oligonucleotide probe species, temporally separated binding of oligonucleotide probe species to overlapping binding sites, mismatched partial binding between oligonucleotide probe species and target nucleic acid, frequency of binding, and Any information regarding the duration of binding can contribute to the inference of the sequence or target nucleic acid. In the case of elongated or stretched target nucleic acids, the location of binding of the oligonucleotide probe species along the length of the target nucleic acid can contribute to the construction of sequences with high confidence. In the case of a double-stranded target nucleic acid, a higher confidence sequence can emerge from simultaneously sequencing both (eg, both complementary strands) of the double-stranded form of the target nucleic acid.

一部の実施形態では、共通の参照オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の1つ以上のセットにおけるオリゴヌクレオチドプローブ種の1つ以上のプールの各々とともに添加される。例えば、図7A、図7B、および図7Cでは、共通の参照オリゴヌクレオチドプローブ種704は、オリゴヌクレオチドプローブ種のセット(例えば、706、712、および716)に含まれる任意の追加のプローブに関わらず、標的核酸702の同じ結合部位708に結合する。共通の参照オリゴヌクレオチドプローブ種704の存在は、他のオリゴヌクレオチドプローブ種706、712、および716の、それらのそれぞれの結合部位(例えば、710、714、718、720、および722)への結合を阻害しない。 In some embodiments, a common reference oligonucleotide probe species is added with each of one or more pools of oligonucleotide probe species in one or more sets of oligonucleotide probe species. For example, in Figures 7A, 7B, and 7C, the common reference oligonucleotide probe species 704 is independent of any additional probes included in the set of oligonucleotide probe species (eg, 706, 712, and 716) , bind to the same binding site 708 on the target nucleic acid 702 . The presence of a common reference oligonucleotide probe species 704 inhibits binding of other oligonucleotide probe species 706, 712, and 716 to their respective binding sites (e.g., 710, 714, 718, 720, and 722). do not interfere.

図7Cに示されるように、結合部位718、720、および722は、個々のオリゴヌクレオチドプローブ(716-1、716-2、および716-3)が、それらの部位が重複している場合であっても、可能性のあるすべての部位にどのように結合するのかを示す。図7A、図7B、および図7Cでは、プローブ配列は、3塩基長で示されている。しかしながら、同様の方法は、4塩基長、5塩基長、6塩基長などのプローブでも、同様に十分に行うことができる。 As shown in FIG. 7C, binding sites 718, 720, and 722 are where the individual oligonucleotide probes (716-1, 716-2, and 716-3) overlap. show how it binds to all possible sites. In Figures 7A, 7B, and 7C, the probe sequences are shown to be 3 bases long. However, similar methods work equally well with probes that are 4 bases, 5 bases, 6 bases, etc. in length.

一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットは、所与の長さのすべてのオリゴを含み得る。例えば、1024個の個々の5塩基長の完全なセットは、本開示の一実施形態に従って、オリゴヌクレオチドプローブ種の1つ以上のセットにコードされ、かつ含まれる。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットは、複数の長さのすべてのオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブのセットは、一連のオリゴヌクレオチドプローブ種のタイリングである。一部の実施形態では、オリゴヌクレオチドプローブ種のセットは、オリゴヌクレオチドプローブ種のパネルである。合成生物学における特定の用途(例えば、DNAデータの記憶)の場合、配列決定は、配列の特定のブロックの順序を見つけることを含み得、ブロックは、所望のデータをコードするように設計される。 In some embodiments, one or more sets of oligonucleotide probe species may include all oligos of a given length. For example, a complete set of 1024 individual 5 bases long is encoded and included in one or more sets of oligonucleotide probe species according to one embodiment of the present disclosure. In some embodiments, one or more sets of oligonucleotide probe species may include all oligonucleotide probe species of multiple lengths. In some embodiments, the set of oligonucleotide probes is a tiling of a series of oligonucleotide probe species. In some embodiments, the set of oligonucleotide probe species is a panel of oligonucleotide probe species. For certain applications in synthetic biology, such as DNA data storage, sequencing may involve finding the order of specific blocks of sequences, where the blocks are designed to encode desired data. .

図8A、図8B、および図8Cに示されるように、一部の実施形態では、オリゴヌクレオチドプローブ種の複数セット(例えば、804、806、および808)が、任意の標的核酸802に適用される。各オリゴヌクレオチドプローブ種は、その相補結合部位に優先的に結合する。一部の実施形態では、各曝露(c)間に緩衝液で洗浄することは、以前のセットのオリゴヌクレオチドプローブ種の除去を助ける。 As shown in FIGS. 8A, 8B, and 8C, in some embodiments, multiple sets of oligonucleotide probe species (eg, 804, 806, and 808) are applied to any target nucleic acid 802. . Each oligonucleotide probe species preferentially binds to its complementary binding site. In some embodiments, washing with buffer between each exposure (c) helps remove the previous set of oligonucleotide probe species.

一部の実施形態では、核酸配列決定用プローブは、オリゴヌクレオチドであり、エピ修飾用プローブは、修飾結合タンパク質もしくはペプチド(例えば、MBD1などのメチル結合タンパク質)または抗修飾抗体(例えば、抗メチルC抗体)である。一部の実施形態では、オリゴヌクレオチドプローブ種は、ゲノム内の特定の部位(例えば、既知の変異を有する部位)を標的とし得る。図9A、図9B、および図9Cに示されるように、一部の実施形態では、オリゴヌクレオチド(例えば、804、806、および808)および代替プローブ(例えば、902)の両方は、標的核酸802に同時に適用される(および複数回の曝露ステップを通して)。目的の標的部位を決定する方法は、Liu et al.,BMC Genomics 9:509(2008)に提供されている(参照により本明細書に援用される)。 In some embodiments, the nucleic acid sequencing probe is an oligonucleotide and the epimodification probe is a modified binding protein or peptide (e.g., a methyl binding protein such as MBD1) or an anti-modified antibody (e.g., anti-methyl C antibody). In some embodiments, the oligonucleotide probe species can target specific sites within the genome (eg, sites with known mutations). As shown in FIGS. 9A, 9B, and 9C, in some embodiments both oligonucleotides (eg, 804, 806, and 808) and surrogate probes (eg, 902) are attached to target nucleic acid 802. applied simultaneously (and through multiple exposure steps). Methods for determining target sites of interest are described by Liu et al. , BMC Genomics 9:509 (2008), incorporated herein by reference.

一部の実施形態では、プローブの1つ以上のセットのオリゴヌクレオチドプローブ種であり、プローブ種の1つ以上のセットのオリゴヌクレオチドプローブ種またはサブセットであり、オリゴヌクレオチドプローブ種の1つ以上のセットである、プローブ種の各々が、次々に適用される(例えば、最初に、オリゴヌクレオチドプローブ種またはオリゴヌクレオチドプローブ種のサブセットもしくは1つ以上のセットである1つのプローブ種の結合が検出され、次いで、次のオリゴヌクレオチドプローブ種が添加される前に除去され、検出され、除去され、次いで、次の…など)。一部の実施形態では、プローブの1つ以上のセットのプローブのすべてまたはサブセットは、単一のプールに同時に追加され、各結合プローブは、結合プローブの同一性のために完全にまたは部分的にコードする標識に連結され、結合プローブの各々のコードは、検出および分析のプロセスによってデコード(decode)される。 In some embodiments, an oligonucleotide probe species of one or more sets of probes, an oligonucleotide probe species or a subset of one or more sets of probe species, one or more sets of oligonucleotide probe species , each of the probe species is applied in turn (e.g., first binding of one probe species, which is an oligonucleotide probe species or a subset or one or more sets of oligonucleotide probe species, is detected, then , removed before the next oligonucleotide probe species is added, detected, removed, then the next... etc.). In some embodiments, all or a subset of the probes of one or more sets of probes are added simultaneously to a single pool, and each bound probe is fully or partially Linked to an encoding label, the code of each bound probe is decoded by the process of detection and analysis.

図11Aおよび図11Bによって示されるように、一部の実施形態では、複数のプローブの結合部位に関する情報を得るために、プローブのタイリングシリーズまたはタイリングセットが使用されてもよい。図11Aでは、第1のタイリングセット1104は、標的核酸1102に適用される。第1のタイリングセット1104中のタイリングプローブのサブセットの各タイリングプローブは、1つの共通の塩基1108を含み、それによって、標的核酸1102のその1つの共通の塩基1108の5倍のカバレッジの深度をもたらす。カバレッジの深度は、タイリングシリーズのプローブのk塩基長に比例する(例えば、3塩基長のオリゴのセットは、標的核酸中のすべての塩基の約3倍のカバレッジをもたらす)。 As illustrated by FIGS. 11A and 11B, in some embodiments, a tiling series or set of probes may be used to obtain information about the binding sites of multiple probes. In FIG. 11A, a first tiling set 1104 is applied to target nucleic acid 1102 . Each tiling probe of the subset of tiling probes in first tiling set 1104 includes one common base 1108, thereby providing five times the coverage of that one common base 1108 of target nucleic acid 1102. Bring depth. The depth of coverage is proportional to the k-base length of the tiling series of probes (eg, a set of 3-base long oligos provides about 3-fold coverage of all bases in the target nucleic acid).

一部の実施形態では、オリゴヌクレオチドプローブ種のセットが標的塩基に沿ってタイリングする場合、タイリング経路に切れ目がある場合に問題が生じる可能性がある。例えば、5塩基長のオリゴヌクレオチドプローブ種のセットでは、5塩基を超える標的分子の1つ以上の配列に結合することができるオリゴヌクレオチドプローブ種は存在しない。この場合、一部の実施形態では、1つ以上のアプローチが利用される。第一に、標的核酸が二本鎖核酸を含む場合、1つ以上の塩基の割当は、二重鎖の相補鎖から得られた配列に委ねられるか、またはそれに依存し得る。第二に、標的核酸の複数コピーが利用可能である場合、1つ以上の塩基の割当は、標的核酸の他のコピー上の同じ配列の他のコピーに依存し得る。第三に、一部の実施形態では、参照配列が利用可能である場合、1つ以上の塩基の割当は、参照配列に委ねられてもよく、またはそれに依存してもよく、1つ以上の塩基が、注釈付けられて、それらが参照配列から人為的に移植されていることを示す。 In some embodiments, when a set of oligonucleotide probe species tiles along a target base, problems can arise if there are discontinuities in the tiling pathway. For example, in a set of oligonucleotide probe species that are 5 bases long, none of the oligonucleotide probe species can bind to one or more sequences of the target molecule greater than 5 bases. In this case, in some embodiments, one or more approaches are utilized. First, if the target nucleic acid comprises a double-stranded nucleic acid, the assignment of one or more bases may be left to or dependent on the sequence obtained from the complementary strand of the duplex. Second, if multiple copies of the target nucleic acid are available, the assignment of one or more bases may depend on other copies of the same sequence on other copies of the target nucleic acid. Third, in some embodiments, when a reference sequence is available, the assignment of one or more bases may be left to or dependent on the reference sequence, and one or more Bases are annotated to indicate that they have been artificially grafted from the reference sequence.

一部の実施形態では、特定のオリゴヌクレオチドプローブ種は、様々な理由のために、オリゴヌクレオチドプローブ種の1つ以上のセットから省略される。例えば、いくつかのオリゴヌクレオチドプローブ配列は、自己相補性または回文配列などのそれら自体との、オリゴヌクレオチドプローブ種の完全なセットの他のプローブとの、または標的核酸との問題のある相互作用(例えば、既知の確率的で無差別な結合)を示す。一部の実施形態では、最小数の有益なオリゴヌクレオチドプローブ種は、標的核酸の種類ごとに決定される。k塩基長のオリゴヌクレオチドプローブ種の完全なセットの中では、オリゴヌクレオチドの半分は、オリゴヌクレオチドの他の半分に完全に相補的である。一部の実施形態では、これらの相補対(および実質的な相補性に起因する問題がある他の対)が同時にポリヌクレオチドに添加されなくてもよく、むしろオリゴヌクレオチドプローブ種の異なるサブセットまたはプールに割り当てられてもよいことは確かである。一部の実施形態では、センスおよびアンチセンスの両方の一本鎖DNA(単一の二本鎖標的核酸由来)が存在し、配列決定は、各相補オリゴヌクレオチドプローブ種対の1つのメンバーのみで行われる。センス鎖およびアンチセンス鎖の両方から得られた配列決定情報を組み合わせて、全体的な配列を生成する。 In some embodiments, a particular oligonucleotide probe species is omitted from one or more sets of oligonucleotide probe species for various reasons. For example, some oligonucleotide probe sequences exhibit problematic interactions with themselves, such as self-complementarity or palindrome sequences, with other probes of the complete set of oligonucleotide probe species, or with target nucleic acids. (eg known probabilistic promiscuous combination). In some embodiments, the minimum number of beneficial oligonucleotide probe species is determined for each type of target nucleic acid. Within a complete set of k base long oligonucleotide probe species, one half of the oligonucleotide is perfectly complementary to the other half of the oligonucleotide. In some embodiments, these complementary pairs (and other pairs with problems due to substantial complementarity) may not be added to the polynucleotide at the same time, but rather different subsets or pools of oligonucleotide probe species. may certainly be assigned to . In some embodiments, both sense and antisense single-stranded DNA (from a single double-stranded target nucleic acid) are present and sequencing is performed with only one member of each complementary oligonucleotide probe species pair. done. The sequencing information obtained from both the sense and antisense strands are combined to generate the overall sequence.

一部の実施形態では、オリゴヌクレオチドプローブ種は、カスタムマイクロアレイ合成を使用して作製されるライブラリを含み得る。一部の実施形態では、マイクロアレイライブラリは、ゲノムの特定の標的部分に系統的に結合するオリゴヌクレオチドを含み得る。一部の実施形態では、マイクロアレイライブラリは、標的ゲノムにわたって一定距離離れた場所に系統的に結合するオリゴヌクレオチドプローブ種を含み得る。例えば、100万個のオリゴヌクレオチドプローブ種を含むライブラリは、約3000塩基ごとに結合するように設計されたオリゴヌクレオチドプローブ種を含むことができる。同様に、1000万個のオリゴヌクレオチドプローブ種を含むライブラリは、約300塩基ごとに結合するように設計され得、3000万個のオリゴヌクレオチドプローブ種を含むライブラリは、約100塩基ごとに結合するように設計され得る。一部の実施形態では、オリゴヌクレオチドプローブ種の配列は、参照ゲノム配列に基づいて計算的に設計される。 In some embodiments, oligonucleotide probe species can include libraries created using custom microarray synthesis. In some embodiments, a microarray library can contain oligonucleotides that systematically bind to specific target portions of the genome. In some embodiments, a microarray library may contain oligonucleotide probe species that are systematically bound at spaced apart locations across a target genome. For example, a library containing one million oligonucleotide probe species can contain oligonucleotide probe species designed to bind approximately every 3000 bases. Similarly, a library containing 10 million oligonucleotide probe species can be designed to bind approximately every 300 bases, and a library containing 30 million oligonucleotide probe species can be designed to bind approximately every 100 bases. can be designed to In some embodiments, the sequences of the oligonucleotide probe species are computationally designed based on a reference genome sequence.

一部の実施形態では、標的とされるゲノムの領域は、特定の遺伝子座である。他の実施形態では、標的とされるゲノムの領域は、遺伝子座のパネル(例えば、がんに関連する遺伝子もしくは他の高度に保存された領域)、またはゲノムワイド関連解析(genome-wide association study)によって識別された染色体区間内の遺伝子もしくは他の高度に保存された領域である。一部の実施形態では、標的遺伝子座はまた、ゲノムの暗黒物質、典型的には反復性であるゲノムのクロマチン領域、および反復領域の近傍にある複合遺伝子座を含んでもよい。そのような領域としては、テロメア、セントロメア、末端動原体染色体の短腕、ならびにゲノムの他の低複雑度領域が挙げられる。従来の配列決定方法は、ゲノムの反復部分に対処することはできない(2019年現在、まだ完全なヒトゲノムが存在しない)が、ナノメトリック精度が高い場合、本明細書に記載の方法は、これらの領域に網羅的に対処する。 In some embodiments, the region of the genome targeted is a specific locus. In other embodiments, the region of the genome targeted is a panel of loci (e.g., cancer-associated genes or other highly conserved regions), or genome-wide association studies. ) are genes or other highly conserved regions within the chromosomal interval identified by In some embodiments, the target loci may also include the dark matter of the genome, the chromatin regions of the genome that are typically repetitive, and complex loci flanking the repetitive regions. Such regions include telomeres, centromeres, short arms of acrocentric chromosomes, as well as other low-complexity regions of the genome. Conventional sequencing methods cannot address repetitive parts of the genome (there is still no complete human genome as of 2019), but with high nanometric accuracy, the methods described herein can Address the area exhaustively.

一部の実施形態では、複数のオリゴヌクレオチドプローブ種の各それぞれのオリゴヌクレオチドプローブ種は、固有のN塩基長配列を含み、ここで、Nは、セット{1、2、3、4、5、6、7、8、および9}の中の整数であり、長さNのすべての固有のN塩基長配列は、複数のオリゴヌクレオチドプローブ種によって表される。 In some embodiments, each respective oligonucleotide probe species of the plurality of oligonucleotide probe species comprises a unique N base long sequence, where N is the set {1, 2, 3, 4, 5, 6, 7, 8, and 9}, and all unique N-base long sequences of length N are represented by multiple oligonucleotide probe species.

オリゴヌクレオチドプローブ種を作製するために使用されるオリゴ長が長いほど、オリゴヌクレオチドプローブ種に影響を及ぼす回文配列または折り返し配列に対して、効率的なプローブとして機能する可能性が高くなる。一部の実施形態では、結合効率は、1つ以上の縮重塩基または普遍的塩基を除去することにより、そのようなオリゴの長さを短縮することによって、実質的に改善される。このため、オリゴヌクレオチドプローブ種のためのより短い照合配列(例えば、4塩基長)を使用することが有利である。しかしながら、オリゴヌクレオチドプローブの配列が短いほど、より不安定な結合(例えば、より低い結合温度)を示す。一部の実施形態では、オリゴヌクレオチドプローブ種の結合安定性は、特異的安定化塩基修飾またはオリゴコンジュゲート(例えば、スチルベンキャップ)を使用することによって増強される。一部の実施形態では、完全に修飾された3塩基長または4塩基長(例えば、ロックド核酸(LNA)および/またはペプチド核酸(PNA))が使用される。 The longer the oligo length used to make the oligonucleotide probe species, the more likely it is to function as an efficient probe for palindromic or folded sequences affecting the oligonucleotide probe species. In some embodiments, coupling efficiency is substantially improved by shortening the length of such oligos by removing one or more degenerate or universal bases. For this reason, it is advantageous to use shorter reference sequences (eg, 4 bases long) for oligonucleotide probe species. However, shorter oligonucleotide probe sequences exhibit more labile binding (eg, lower binding temperatures). In some embodiments, the binding stability of oligonucleotide probe species is enhanced through the use of specific stabilizing base modifications or oligoconjugates (eg, stilbene caps). In some embodiments, fully modified 3- or 4-base lengths (eg, locked nucleic acids (LNA) and/or peptide nucleic acids (PNA)) are used.

一部の実施形態では、固有のN塩基長配列は、1つ以上の縮重ヌクレオチドによって占有される1つ以上のヌクレオチド位置を含んでもよい。一部の実施形態では、縮重位置は、オリゴヌクレオチドプローブを含むオリゴヌクレオチドプローブ種のすべての4つのヌクレオチドおよびメンバーを含み、縮重塩基場所に、4つのヌクレオチドの各々が提供される。一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のヌクレオチド位置は、普遍的塩基によって占有される。一部の実施形態では、普遍的塩基は、2’-デオキシイノシンまたは本明細書に記載される他の普遍的塩基である。一部の実施形態では、固有のN塩基長配列は、5’末端で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接し、3’末端で、単一の縮重ヌクレオチド位置または普遍的ヌクレオチド位置に隣接する。一部の実施形態では、5’の単一普遍的ヌクレオチドおよび/または3’の単一普遍的ヌクレオチドは、各々、2’-デオキシイノシンまたは本明細書に記載される他の普遍的塩基であり得る。 In some embodiments, a unique N-base long sequence may include one or more nucleotide positions occupied by one or more degenerate nucleotides. In some embodiments, degenerate positions include all four nucleotides and members of an oligonucleotide probe species comprising an oligonucleotide probe, wherein degenerate base locations are provided with each of the four nucleotides. In some embodiments, one or more nucleotide positions of the oligonucleotide probe species are occupied by universal bases. In some embodiments, the universal base is 2'-deoxyinosine or other universal bases described herein. In some embodiments, the unique N-base long sequence is flanked at the 5′ end by a single degenerate nucleotide position or universal nucleotide position and at the 3′ end by a single degenerate nucleotide position or universal nucleotide position. adjacent to the target nucleotide position. In some embodiments, the 5' single universal nucleotide and/or the 3' single universal nucleotide is 2'-deoxyinosine or other universal bases described herein, respectively. obtain.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、同じ長さMである。一部の実施形態では、Mは、2以上の正の整数である。(f)試験基板上の光学活性の複数の位置のセットから、標的核酸の少なくとも一部分の配列を決定することは、光学活性の複数の位置のセットによって表されるオリゴヌクレオチドプローブ種の重複した配列をさらに使用してもよく、これは、単一のオリゴヌクレオチドプローブ種の異なる場所、および光学活性の同じ場所での異なる回数、持続時間、光子強度、またはそれらの合計の組み合わせを含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブのセットの別のオリゴヌクレオチドプローブと、M-1個の配列相同性を共有する。他の実施形態では、オリゴヌクレオチドプローブのセットのサブセットは、セットの他のオリゴヌクレオチド種と、M-1個の配列相同性を共有し得るか、またはオリゴヌクレオチドプローブのセットのいずれも、M-1個の配列相同性を共有しない場合がある。 In some embodiments, each oligonucleotide probe species of a set of oligonucleotide probe species is the same length M. In some embodiments, M is a positive integer of 2 or greater. (f) determining the sequence of at least a portion of the target nucleic acid from the set of optically active multiple locations on the test substrate, comprising overlapping sequences of the oligonucleotide probe species represented by the set of optically active multiple locations; may also be used, which may include different locations of a single oligonucleotide probe species and different times at the same location of optical activity, duration, photon intensity, or a combination of sums thereof. In some embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species shares M−1 sequence homology with another oligonucleotide probe of the set of oligonucleotide probes. In other embodiments, a subset of the set of oligonucleotide probes may share M−1 sequence homology with other oligonucleotide species of the set, or none of the set of oligonucleotide probes may share M− They may not share a single sequence homology.

プローブ標識。
一部の実施形態では、オリゴヌクレオチドプローブのセットの各オリゴヌクレオチドプローブ種は、標識に結合される。図14A~図14Eは、オリゴヌクレオチドプローブまたは他のプローブタイプを標識する異なる方法を示す。一部の実施形態では、標識は、色素、蛍光ナノ粒子、または光散乱粒子である。一部の実施形態では、プローブ1402は、標識1406に直接結合されている。一部の実施形態では、プローブ1402は、オリゴヌクレオチドプローブ1408-Aの配列に相補的である配列1408-Bを含み得るフラップ配列1410を介して間接的に標識されている。
probe label.
In some embodiments, each oligonucleotide probe species of a set of oligonucleotide probes is attached to a label. Figures 14A-14E show different methods of labeling oligonucleotide probes or other probe types. In some embodiments, the label is a dye, fluorescent nanoparticle, or light scattering particle. In some embodiments, probe 1402 is directly attached to label 1406 . In some embodiments, probe 1402 is indirectly labeled via flap sequence 1410, which can include sequence 1408-B that is complementary to the sequence of oligonucleotide probe 1408-A.

好ましい特徴を有する多くの種類の有機色素が、標識用に利用可能であり、いくつかは、高い光安定性および/または高い量子効率、および/または最小限の暗状態および/もしくは高い溶解度、および/または低い非特異的結合を有する。Atto542は、いくつかの好ましい品質を有する好ましい色素である。Cy3Bは、非常に明るい色素であり、Cy3もまた有効である。いくつかの色素は、赤色色素Atto655およびAtto647Nなどの、タンパク質、細胞、または細胞材料からの自家蛍光が広がる波長の回避を可能にする。多くの種類のナノ粒子が、標識のために利用可能である。本開示は、蛍光標識されたラテックス粒子以外に、金粒子または銀粒子、半導体ナノ結晶(量子ドット)、およびナノダイヤモンドをナノ粒子標識として使用する。ナノダイヤモンドは、一部の実施形態では、標識として特に好ましい。ナノダイヤモンドは、高い量子効率(QE)を有する光を放射し、高い光安定性、高い化学安定性、長い蛍光寿命(例えば、20ns程度、これは、光散乱および/または自家蛍光からの観察されるバックグラウンドを低減するために使用することができる)を有し、2つ以上の蛍光発光を有し、異なる発光帯域幅を有し、かつ小さい(例えば、直径40nm前後)。DNAナノ構造およびナノボールは、複数の有機色素を、それらの構造(分岐構造を含み得る)に組み込むか、または挿入色素などの標識を利用するかのいずれかによって、非常に明るい標識であり得る。 Many types of organic dyes with favorable characteristics are available for labeling, some exhibiting high photostability and/or high quantum efficiency, and/or minimal dark state and/or high solubility, and / or have low non-specific binding. Atto 542 is a preferred dye with several favorable qualities. Cy3B is a very bright dye and Cy3 is also effective. Some dyes allow avoidance of wavelengths at which autofluorescence from proteins, cells, or cellular material prevails, such as the red dyes Atto655 and Atto647N. Many types of nanoparticles are available for labeling. The present disclosure uses gold or silver particles, semiconductor nanocrystals (quantum dots), and nanodiamonds as nanoparticle labels, in addition to fluorescently labeled latex particles. Nanodiamonds are particularly preferred as labels in some embodiments. Nanodiamonds emit light with high quantum efficiency (QE), high photostability, high chemical stability, long fluorescence lifetime (e.g., on the order of 20 ns, which is observed from light scattering and/or autofluorescence). have two or more fluorescent emissions, have different emission bandwidths, and are small (eg, around 40 nm in diameter). DNA nanostructures and nanoballs can be very brightly labeled, either by incorporating multiple organic dyes into their structure (which can include branched structures) or by utilizing labels such as intercalating dyes.

一部の実施形態では、各間接標識は、オリゴヌクレオチドプローブ種の配列照合部分にコードされている塩基の同一性を特定し得る。一部の実施形態では、標識は、核酸挿入色素の1つ以上の分子を含んでもよい。一部の実施形態では、標識は、1つ以上の種類の色素分子、蛍光ナノ粒子、または光散乱粒子を含み得る。一部の実施形態では、より長い撮像時間を可能にするために、速やかに光退色しない標識が選択される。 In some embodiments, each indirect label may specify the identity of a base encoded in the sequence-referencing portion of the oligonucleotide probe species. In some embodiments, the label may comprise one or more molecules of a nucleic acid intercalating dye. In some embodiments, labels may include one or more types of dye molecules, fluorescent nanoparticles, or light scattering particles. In some embodiments, labels are selected that do not photobleach rapidly to allow for longer imaging times.

図12A、図12B、および図12Cは、付けられた蛍光標識1202を有するオリゴヌクレオチドプローブ1204の、標的核酸1206への一過的なオン・オフ結合を示す。標識1202は、オリゴヌクレオチドプローブ1204が標的核酸1206上の結合部位に結合するかどうかに関わらず、蛍光を発する。同様に、図13A、図13B、および図13Cは、非標識オリゴヌクレオチドプローブ1306の一過的なオン・オフ結合を示す。結合事象は、溶液1302から一過的に形成される二重鎖1304への色素1304(例えば、YOYO-1)の挿入(intercalation)によって検出される。挿入色素は、溶液中で浮遊する遊離状態と比較して、二本鎖核酸に結合したときに、蛍光の顕著な増加を示す。 12A, 12B, and 12C show transient on-off binding of an oligonucleotide probe 1204 having a fluorescent label 1202 attached to a target nucleic acid 1206. FIG. Label 1202 fluoresces regardless of whether oligonucleotide probe 1204 binds to a binding site on target nucleic acid 1206 . Similarly, FIGS. 13A, 13B, and 13C show transient on-off binding of unlabeled oligonucleotide probe 1306. FIG. A binding event is detected by the intercalation of a dye 1304 (eg, YOYO-1) into a duplex 1304 transiently formed from solution 1302 . The intercalating dye exhibits a significant increase in fluorescence when bound to double-stranded nucleic acids compared to the free state floating in solution.

一部の実施形態では、標的核酸に結合し得るオリゴヌクレオチドプローブ種は、直接標識されなくてもよい。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、フラップを含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種の構築(例えば、それらをコード化すること)は、特定の配列単位を結合することを含み、単位は、標識を、それに結合された相補(特定の単位に)コードオリゴヌクレオチド配列と、オリゴヌクレオチドプローブ種の1つ以上のセットの各k塩基長の一端に(例えば、フラップ配列)、結合するのに十分な長さを有する。フラップのコード配列の各ユニットは、別個の蛍光標識プローブに対するドッキング部位または結合部位として機能し得る。5塩基のプローブ配列をコードするために、プローブ上のフラップは、5つの異なる単位または結合場所を含み得、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の単位または結合位置は、オリゴヌクレオチドプローブ種配列(標的核酸に結合し得る部分)に隣接し、第2の単位または結合位置は、第1の単位または結合位置に隣接するなどである。配列決定においてプローブ・フラップを使用するのに先立って、プローブ・フラップの各種は、蛍光標識されたオリゴのセットに結合され、単位の数またはフラップ配列上の結合位置の数が所望の数の蛍光標識タイプよりも多い場合、非標識であるオリゴを含んでもよい。異なる標識と関連付けられたオリゴは、異なる単位または結合位置に相補的なそれぞれの配列を有し、オリゴヌクレオチドプローブ種配列のための固有の識別タグを生成する。一部の実施形態では、これは、フラップ上の各それぞれの単位または結合位置に相補的である4つの別個に標識されたオリゴ配列(例えば、合計で16個もの異なる標識の組み合わせ)を使用することによって行われ得る。 In some embodiments, an oligonucleotide probe species capable of binding a target nucleic acid may not be directly labeled. In some such embodiments, an oligonucleotide probe species may include a flap. In some embodiments, constructing an oligonucleotide probe species (e.g., encoding them) comprises linking specific sequence units, the units having a label and a complementary (specific units) and of a length sufficient to bind to one end of each k-base length (eg, flap sequence) of a set of one or more oligonucleotide probe species. Each unit of the flap coding sequence can serve as a docking or binding site for a separate fluorescently labeled probe. To encode a probe sequence of 5 bases, a flap on the probe can contain 5 different units or binding sites, for example each site is a different DNA base sequence linked in tandem to the next site. For example, a first unit or binding position on the flap flanks the oligonucleotide probe species sequence (a portion capable of binding to a target nucleic acid) and a second unit or binding position flanks the first unit or binding position. and so on. Prior to using the probe flaps in sequencing, each species of probe flap is conjugated to a set of fluorescently labeled oligos such that the number of units or number of binding sites on the flap sequence is the desired number of fluorescent More than labeled types may include oligos that are unlabeled. Oligos associated with different labels have their respective sequences complementary to different units or binding sites, creating unique identification tags for the oligonucleotide probe species sequences. In some embodiments, this uses four separately labeled oligo sequences that are complementary to each respective unit or binding position on the flap (e.g., as many as 16 different label combinations in total). can be done by

一部の実施形態では、A、C、T、およびGが定義されているプローブは、標識が、オリゴヌクレオチドプローブ種の特定の位置で定義されたヌクレオチドを1つだけ報告するような様式で、コード化される(および他の位置は縮重的または普遍的である)。これには、1種類のヌクレオチド当たり1色、つまり、コード化に4色しか必要としない場合がある。 In some embodiments, probes with A, C, T, and G defined are in such a manner that the label reports only one defined nucleotide at a particular position of the oligonucleotide probe species. encoded (and other positions are degenerate or universal). This may require only 1 color per nucleotide, ie 4 colors for coding.

一部の実施形態では、1つのフルオロフォア色のみが、曝露プロセス全体を通して使用される。かかる実施形態では、各曝露プロセスは、4つのサブプロセスに分割され、その各々で、セットの次のオリゴヌクレオチドプローブ種が添加される前に、特定の位置(例えば、位置1)に異なる塩基を有する4つのオリゴヌクレオチドプローブ種のセットの1つのオリゴヌクレオチドプローブ種が個別に添加される。各サイクルでは、オリゴヌクレオチドプローブ種は、同じ標識を有してもよい。5塩基長のオリゴヌクレオチドプローブ種配列長の本実施態様では、オリゴヌクレオチドの1つ以上のセットの完全なセットは、単一の塩基位置での照合に対応するオリゴヌクレオチドプローブ種の5つのセットを含み得、各セットは、5塩基長のオリゴヌクレオチドプローブ種のセットの単一の位置での異なる単一の塩基に対応する4つのオリゴヌクレオチドプローブ種を含み得、曝露サブプロセスの総数は20である(各セットが4つのオリゴヌクレオチドプローブ種を有する、5塩基長のオリゴヌクレオチドプローブセットの完全なセットの各塩基位置に対応する5つのセット)。 In some embodiments, only one fluorophore color is used throughout the exposure process. In such embodiments, each exposure process is divided into four sub-processes, each of which places a different base at a particular position (e.g., position 1) before the next oligonucleotide probe species in the set is added. One oligonucleotide probe species of a set of four oligonucleotide probe species with is added separately. At each cycle, the oligonucleotide probe species may have the same label. In this embodiment of an oligonucleotide probe species sequence length of 5 bases in length, the complete set of one or more sets of oligonucleotides represents five sets of oligonucleotide probe species corresponding to matches at single base positions. each set may comprise 4 oligonucleotide probe species corresponding to different single bases at a single position of the set of 5 base long oligonucleotide probe species, the total number of exposure subprocesses being 20 (5 sets corresponding to each base position of a complete set of oligonucleotide probe sets of 5 base lengths, each set having 4 oligonucleotide probe species).

一部の実施形態では、オリゴヌクレオチドプローブ種配列の第1の塩基は、フラップ配列の第1の単位によってコードされ、第2の塩基は、第2の単位によってコードされる。フラップの単位の順序は、オリゴヌクレオチドプローブ種の塩基配列の順序に対応し得る。次いで、別個の蛍光標識を、(相補的な塩基対合を介して)フラップに含まれるそれぞれの対応する単位に結合またはドッキングしてもよい。第1の単位に関連付けられ、したがって第1のオリゴヌクレオチドプローブ種の配列位置に関連付けられた第1の標識は、一実施例では、500nm~530nmの波長で発光し得、第2の単位に関連付けられ、したがって第2のオリゴヌクレオチドプローブ種の配列位置に関連付けられた第2の標識は、550nm~580nmの波長で発光し得、第3の標識は、600nm~630nmで、第4の標識は、650nm~680nmで、第5の標識は、700nm~730nmで発光し得る。次いで、各場所における塩基の同一性は、例えば、標識の蛍光寿命によってコードされ得る。1つのそのような例では、Aに対応する標識は、Cに対応する標識よりも長い寿命を有し、Gに対応する標識よりも長い寿命を有し、Tに対応する標識よりも長い寿命を有する。上記の例では、位置1の塩基Aは、最も長い寿命を有する500nm~530nmで発光してもよく、位置3の塩基Gは、第3の最も長い寿命を有する600nm~630nmで発光してもよい。 In some embodiments, the first base of the oligonucleotide probe seed sequence is encoded by the first unit of the flap sequence and the second base is encoded by the second unit. The order of the flap units may correspond to the order of the base sequences of the oligonucleotide probe species. A separate fluorescent label may then be attached or docked (via complementary base pairing) to each corresponding unit contained in the flap. A first label associated with the first unit, and thus associated with the sequence position of the first oligonucleotide probe species, may in one example emit at a wavelength between 500 nm and 530 nm and is associated with the second unit. A second label, thus associated with the sequence position of the second oligonucleotide probe species, may emit at a wavelength of 550 nm to 580 nm, a third label at 600 nm to 630 nm, a fourth label at At 650 nm-680 nm, the fifth label may emit at 700 nm-730 nm. The identity of the base at each location can then be encoded, for example, by the fluorescence lifetime of the label. In one such example, the label corresponding to A has a longer lifetime than the label corresponding to C, has a longer lifetime than the label corresponding to G, and has a longer lifetime than the label corresponding to T. have In the example above, base A at position 1 may emit at 500 nm-530 nm, which has the longest lifetime, and base G at position 3 may emit at 600 nm-630 nm, which has the third longest lifetime. good.

一部の実施形態では、図14Eに図示されるように、オリゴヌクレオチドプローブ種1402は、配列1408-Bに対応する配列1408-Aを含み得る。配列1408-Bは、フラップ領域1410に付着、結合、または連結される。図14Eの全体構築物をもたし得る可能な配列の一例として、1410における4つの単位位置の各々は、それぞれ、配列AAAA(例えば、1412に相補的な領域)、CCCC(例えば、1414に相補的な領域)、GGGG(例えば、1416に相補的な領域)、およびTTTT(例えば、1418に相補的な領域)によって定義される。したがって、全体的なフラップ配列は、(配列番号1)5’-AAAACCCCGGGGTTTT-3’である。次いで、各単位位置は、特定の発光波長範囲を利用してコードされ、その位置にあり得る4つの異なる塩基は、4つの異なる蛍光寿命の標識されたオリゴによってコードされ、寿命/輝度比は、オリゴヌクレオチドプローブ種1402配列自体に対応する特定の塩基位置および塩基コードに対応し得る。 In some embodiments, as illustrated in FIG. 14E, oligonucleotide probe species 1402 can include sequence 1408-A corresponding to sequence 1408-B. Array 1408-B is attached, bound, or linked to flap region 1410. FIG. As an example of a possible sequence that could give rise to the overall construct of FIG. 14E, each of the four unit positions at 1410 would have the sequences AAAA (e.g., a region complementary to 1412), CCCC (e.g., a region complementary to 1414), respectively. region), GGGG (eg, the region complementary to 1416), and TTTT (eg, the region complementary to 1418). Therefore, the overall flap sequence is (SEQ ID NO: 1) 5'-AAACCCCGGGGTTTT-3'. Each unit position is then encoded using a specific emission wavelength range, and the four different possible bases at that position are encoded by labeled oligos of four different fluorescence lifetimes, the lifetime/brightness ratio being: It can correspond to a particular base position and base code corresponding to the oligonucleotide probe species 1402 sequence itself.

好適なコードの例は、以下の通りである:
●位置1-A 塩基コード-TTTT-発光ピーク510、寿命/輝度#1
●位置1-C 塩基コード-TTTT-発光ピーク510、寿命/輝度#2
●位置1-G 塩基コード-TTTT-発光ピーク510、寿命/輝度#3
●位置1-T 塩基コード-TTTT-発光ピーク510、寿命/輝度#4
●位置2-A 塩基コード-GGGG-発光ピーク560、寿命/輝度#1
●位置2-C 塩基コード-GGGG-発光ピーク560、寿命/輝度#2
●位置2-G 塩基コード-GGGG-発光ピーク560、寿命/輝度#3
●位置2-T 塩基コード-GGGG-発光ピーク560、寿命/輝度#4
●位置3-A 塩基コード-CCCC-発光ピーク610、寿命/輝度#1
●位置3-C 塩基コード-CCCC-発光ピーク610、寿命/輝度#2
●位置3-G 塩基コード-CCCC-発光ピーク610、寿命/輝度#3
●位置3-T 塩基コード-CCCC-発光ピーク610、寿命/輝度#4
●位置4-A 塩基コード-AAAA-発光ピーク660、寿命/輝度#1
●位置4-C 塩基コード-GGGG-発光ピーク660、寿命/輝度#2
●位置4-G 塩基コード-GGGG-発光ピーク660、寿命/輝度#3
●位置4-T 塩基コード-GGGG-発光ピーク660、寿命/輝度#4
An example of suitable code is as follows:
●Position 1-A base code-TTTT-luminescence peak 510, lifetime/brightness #1
●Position 1-C base code-TTTT-luminescence peak 510, lifetime/brightness #2
●Position 1-G base code-TTTT-luminescence peak 510, lifetime/brightness #3
●Position 1-T base code-TTTT-luminescence peak 510, lifetime/brightness #4
●Position 2-A base code-GGGG-emission peak 560, lifetime/brightness #1
●Position 2-C base code-GGGG-emission peak 560, lifetime/brightness #2
●Position 2-G base code-GGGG-emission peak 560, lifetime/brightness #3
●Position 2-T base code-GGGG-emission peak 560, lifetime/brightness #4
●Position 3-A base code-CCCC-emission peak 610, lifetime/brightness #1
●Position 3-C base code-CCCC-emission peak 610, lifetime/brightness #2
●Position 3-G base code-CCCC-emission peak 610, lifetime/brightness #3
●Position 3-T base code-CCCC-luminescence peak 610, lifetime/brightness #4
●Position 4-A base code-AAAA-emission peak 660, lifetime/brightness #1
●Position 4-C base code-GGGG-emission peak 660, lifetime/brightness #2
●Position 4-G base code-GGGG-emission peak 660, lifetime/brightness #3
●Position 4-T base code-GGGG-luminescence peak 660, lifetime/brightness #4

他の実施形態では、異なる単位位置は、蛍光寿命によってコード化され、塩基は、蛍光発光波長によってコード化される。一部の実施形態では、他の測定可能な物理的属性は、代替的に、コード用に使用され得、またはその測定値が波長および寿命の測定値と互換性がある場合に使用され得る。例えば、発光の偏光または輝度はまた、フラップに含めるために利用可能ないくつかのコードのサイズを増加させるために、測定され得る。 In other embodiments, different unit positions are encoded by fluorescence lifetimes and bases are encoded by fluorescence emission wavelengths. In some embodiments, other measurable physical attributes may alternatively be used for the code, or where the measurements are compatible with wavelength and lifetime measurements. For example, the polarization or intensity of emitted light can also be measured to increase the size of the number of codes available for inclusion in the flap.

一部の実施形態では、トーホールド(toe-hold)プローブ(例えば、Levesque et al.,Nature Methods 10:865-867,2013)が使用される。これらのプローブは、部分的に二本鎖であり、不一致標的に結合したときに競合的に不安定化される(例えば、Chen et al.,Nature Chemistry 5,782-789,2013に詳述されている)。一部の実施形態では、トーホールドプローブは、単独で使用される。一部の実施形態では、正しいハイブリダイゼーションを確実にするために、トーホールドプローブが使用される。一部の実施形態では、トーホールドプローブは、標的核酸に結合した他のプローブの解離反応速度を促進するために使用される。 In some embodiments, toe-hold probes (eg, Levesque et al., Nature Methods 10:865-867, 2013) are used. These probes are partially double-stranded and are competitively destabilized when bound to mismatched targets (detailed, for example, in Chen et al., Nature Chemistry 5, 782-789, 2013). ing). In some embodiments, the toehold probe is used alone. In some embodiments, toehold probes are used to ensure correct hybridization. In some embodiments, toehold probes are used to enhance the dissociation kinetics of other probes bound to target nucleic acids.

一部の実施形態では、共通の励起線によって励起される標識は、量子ドットである。一部のかかる実施形態では、この例によれば、Qdot525、Qdot565、Qdot605、およびQdot655は、それぞれ4つのヌクレオチドに対応するように選択される。代替的に、4つの異なるレーザ線を使用して、4つの異なる有機フルオロフォアを励起し、得られた発光を、イメージスプリッターによって分割して検出される。一部の他の実施形態では、発光波長は、2つ以上の有機色素に共通であるが、蛍光寿命が異なる。当業者は、過度の労力および実験なしに、いくつかの異なるコード化および検出のスキームを想定することができるであろう。 In some embodiments, the labels excited by the common excitation line are quantum dots. In some such embodiments, according to this example, Qdot525, Qdot565, Qdot605, and Qdot655 are selected to each correspond to four nucleotides. Alternatively, four different laser lines are used to excite four different organic fluorophores and the resulting emission is split and detected by an image splitter. In some other embodiments, the emission wavelength is common to two or more organic dyes, but the fluorescence lifetimes are different. Those skilled in the art could envision several different encoding and detection schemes without undue effort and experimentation.

一部の実施形態では、オリゴヌクレオチドプローブ種の1つ以上のセットの異なるオリゴヌクレオチドプローブ種は、個別に添加されなくてもよいが、コード化され、一緒にプールされる。最も単純な一度に1つの色および1つのオリゴからのステップアップは、一度に2つの色(または2つの寿命、標識間の他の検出可能な差の2つ)および2つのオリゴヌクレオチドプローブ種である。5つのオリゴヌクレオチドプローブ種の各々について、5つの区別可能な単一の色素でコード化された標識、1つの色素でコード化された標識の直接検出を使用して、一度に最大約5つのオリゴヌクレオチドプローブ種をプールすることを期待するのは合理的である。 In some embodiments, different oligonucleotide probe species of one or more sets of oligonucleotide probe species may not be added individually, but are encoded and pooled together. The simplest step-up from one color and one oligo at a time is two colors (or two lifetimes, two of the other detectable differences between labels) and two oligonucleotide probe species at a time. be. For each of the five oligonucleotide probe species, up to about five oligos at a time using five distinct single dye-encoded labels, direct detection of one dye-encoded label It is reasonable to expect to pool the nucleotide probe species.

他の実施形態では、より高いレベルの複雑性が必要とされるか、または望まれ、フレーバーまたはコードを増やしてもよい。例えば、3塩基長のオリゴヌクレオチドプローブ種の完全なセットの各塩基を個別にコードするには、64個の異なるコードが必要となる。また、例として、5塩基長のオリゴヌクレオチドプローブ種の完全なセットの各塩基を個別にコードするには、1024の異なるコードが必要となる。このような多数のコードは、複数の異なる検出可能な標識の特徴から構成される、1つのオリゴ当たり1つのコードを有することによって達成される。一部の実施形態では、より小さいセットのコードを使用して、オリゴヌクレオチドプローブ種のより小さいセットまたは完全なセットのサブセットをコード化する(例えば、場合によっては、64個のコードを使用して、5塩基長の1024個のオリゴヌクレオチドプローブ種の配列の完全なセットの16サブセットをコード化する)。 In other embodiments, a higher level of complexity is required or desired and may add flavor or code. For example, to individually code each base of a complete set of three base long oligonucleotide probe species would require 64 different codes. Also, by way of example, 1024 different codes would be required to individually code each base of a complete set of five base long oligonucleotide probe species. Such multiple codes are achieved by having one code per oligo composed of multiple different detectable label features. In some embodiments, a smaller set of codes is used to encode a smaller set of oligonucleotide probe species or a subset of the complete set (e.g., optionally using 64 codes , encoding 16 subsets of the complete set of sequences of 1024 oligonucleotide probe species of 5 bases length).

一部の実施形態では、いくつかの方法で、大きなセットのオリゴコードが得られる。例えば、一部の実施形態では、コード特異的な色素でロードされたビーズ、またはDNAナノ構造ベースのコードは、最適な間隔の異なる蛍光波長の発光色素を含んでもよい(例えば、Lin et al.,Nature Chemistry 4:832-839,2012)。一部の実施形態では、図14Cおよび図14Dに図示されるように、ビーズ1412は、複数の蛍光標識1414を含み得る。図14Cでは、ビーズ1412上にコーティングされた標識1414が描写されている。図14Dでは、ビーズ1412に封入された標識1414が描写されている。一部の実施形態では、各標識1414は、異なる種類の蛍光分子である。一部の実施形態では、すべての標識1414は、同じ種類の蛍光分子(例えば、Cy3)である。さらなる実施形態では、異なるおよび/または同じ蛍光分子を含む異なる標識のうちの1つ以上が、ビーズにコーティングされるか、結合されるか、または封入される。 In some embodiments, large sets of oligocodes are obtained in several ways. For example, in some embodiments, beads loaded with code-specific dyes, or DNA nanostructure-based codes, may contain luminescent dyes with different optimally spaced fluorescence wavelengths (see, eg, Lin et al. , Nature Chemistry 4:832-839, 2012). In some embodiments, a bead 1412 can include multiple fluorescent labels 1414, as illustrated in FIGS. 14C and 14D. FIG. 14C depicts labels 1414 coated onto beads 1412 . FIG. 14D depicts label 1414 encapsulated in bead 1412 . In some embodiments, each label 1414 is a different type of fluorescent molecule. In some embodiments, all labels 1414 are the same type of fluorescent molecule (eg, Cy3). In further embodiments, one or more of the different labels, including different and/or the same fluorescent molecule, are coated, attached or encapsulated to the beads.

一部の実施形態では、コードスキームが使用され、オリゴヌクレオチドプローブ種の塩基の位置およびその同一性を説明するために、モジュラーコードが使用される。一部の実施形態では、これは、オリゴヌクレオチドプローブ種を識別し得る標識の組み合わせを含み得るオリゴヌクレオチドプローブ種にコードアームを付加することによって実施される。例えば、すべての可能な5塩基長のオリゴヌクレオチドプローブのライブラリをコード化することが望まれる場合、アームは、5つの部位、単位、または結合位置を有し、各部位、単位、または結合位置は、5塩基長のオリゴヌクレオチドプローブ種の5つの核酸塩基の各々に対応し、5つの部位の各々は、5つの区別可能な標識に結合され、部位、単位、または結合位置に関連付けられた5つの区別可能な標識の各々は、異なる塩基の決定に関連する15個の他の標識からさらに区別可能である。1つのそのような例では、各部位、単位、または結合位置に対応する特定のピーク発光波長を有するフルオロフォアを含む標識(例えば、第1の部位、単位、または結合位置には500nm、第2の部位、単位、または結合位置には550nm、第3の部位、単位、または結合位置には600nm、第4の部位、単位、または結合位置4には650nm、第5の部位、単位、または結合位置には700nm)、および同じ発光波長を有するが異なる蛍光寿命を有する4つのフルオロフォを含む標識は、各位置で4つの塩基の各々をコードすることができる。 In some embodiments, a coding scheme is used and a modular code is used to describe the base positions of the oligonucleotide probe species and their identities. In some embodiments, this is accomplished by adding coding arms to the oligonucleotide probe species, which may contain a combination of labels capable of distinguishing the oligonucleotide probe species. For example, if it is desired to encode a library of all possible 5-base long oligonucleotide probes, the arm has five sites, units, or attachment positions, each site, unit, or attachment position being , corresponding to each of the five nucleobases of a five-base-long oligonucleotide probe species, each of the five sites being attached to five distinguishable labels and associated with sites, units, or binding sites. Each distinguishable label is further distinguishable from 15 other labels associated with different base determinations. In one such example, a label comprising a fluorophore having a specific peak emission wavelength corresponding to each site, unit, or attachment site (e.g., 500 nm for the first site, unit, or attachment site, 500 nm for the second 550 nm for the site, unit, or binding position of 600 nm for the third site, unit, or binding position, 650 nm for the fourth site, unit, or binding position 4, and the fifth site, unit, or bond 700 nm at the position), and four fluorophores with the same emission wavelength but different fluorescence lifetimes can encode each of the four bases at each position.

一部の実施形態では、オリゴヌクレオチドプローブ種または他の結合試薬上の、それに結合された、もしくはそれに連結された異なる標識は、発光の波長によってコードされるか、または部分的にコード化される。一部の実施形態では、異なる標識は、蛍光寿命によってコード化されるか、または部分的にコード化される。一部の実施形態では、異なる標識は、蛍光偏光によってコード化されるか、または部分的にコード化される。一部の実施形態では、異なる標識は、波長、蛍光寿命、蛍光偏光寿命、または任意の他の光学的に観察可能な機構の任意の組み合わせによってコードされるか、または部分的にコードされる。 In some embodiments, different labels on, attached to, or linked to oligonucleotide probe species or other binding reagents are encoded or partially encoded by the wavelength of emission. . In some embodiments, the different labels are encoded or partially encoded by fluorescence lifetime. In some embodiments, the different labels are encoded or partially encoded by fluorescence polarization. In some embodiments, the different labels are encoded or partially encoded by any combination of wavelength, fluorescence lifetime, fluorescence polarization lifetime, or any other optically observable mechanism.

一部の実施形態では、異なる標識は、関連付けられたオリゴヌクレオチドプローブ種である関連付けられたプローブ種の反復オンオフハイブリダイゼーション動態によってコード化されるか、または部分的にコード化される。異なる会合-解離定数を有する異なるオリゴヌクレオチドプローブ種である異なる結合プローブが使用される。一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブは、蛍光強度によってコードされるか、または部分的にコードされる。一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブは、異なる数の、任意選択的に、結合、付着、または連結された非自己消光フルオロフォアを有することによって、コードされた蛍光強度である。個々のフルオロフォアは、典型的には、消光を防止または低減するために十分に離れている必要がある。一部の実施形態では、これは、任意に剛性リンカーまたはDNAナノ構造を使用して、標識を互いに好適な距離で所定の位置に保持することによって達成される。 In some embodiments, the different labels are encoded or partially encoded by repeated on-off hybridization kinetics of associated probe species that are associated oligonucleotide probe species. Different binding probes are used, which are different oligonucleotide probe species with different association-dissociation constants. In some embodiments, probes that are oligonucleotide probe species are encoded or partially encoded by fluorescence intensity. In some embodiments, probes that are oligonucleotide probe species are fluorescent intensities encoded by having different numbers of non-self-quenching fluorophores, optionally bound, attached, or ligated. . Individual fluorophores typically need to be far enough apart to prevent or reduce quenching. In some embodiments, this is achieved by holding the labels in place at a suitable distance from each other, optionally using rigid linkers or DNA nanostructures.

一部の実施形態では、蛍光強度によるコーデ化は、類似の発光スペクトルを有するが、量子収率または他の測定可能な光学特性が異なる色素バリアントを使用することによって実現される。例えば、励起/発光558/572を有するCy3B(例えば、0.67の量子収率)は、Cy3(励起/発光550/570を有し、0.15の量子収率)よりも実質的に明るいが、同様の吸収/発光スペクトルを有する。一部のかかる実施形態では、532nmレーザは、両方の色素を励起するために使用される。他の好適な色素には、(励起/発光591/604nmを有する)Cy3.5が含まれ得、これは、上方シフトした励起および発光スペクトルを有するが、それにもかかわらず、532nmのレーザによって励起されるであろう。しかし、その波長での励起は、Cy3.5には最適ではなく、Cy3に最適化されたバンドパスフィルタでは、Cy3.5の発光がより明るく見えるであろう。Atto532は、励起/発光532/553を有し、0.9の量子収率を有し、532nmレーザがAtto532をその最大励起で励起させ得るため、明るいと予想される。 In some embodiments, encoding by fluorescence intensity is achieved by using dye variants that have similar emission spectra but differ in quantum yield or other measurable optical properties. For example, Cy3B with excitation/emission 558/572 (e.g. quantum yield of 0.67) is substantially brighter than Cy3 (with excitation/emission 550/570 and quantum yield of 0.15). have similar absorption/emission spectra. In some such embodiments, a 532 nm laser is used to excite both dyes. Other suitable dyes may include Cy3.5 (with excitation/emission 591/604 nm), which has up-shifted excitation and emission spectra but is nevertheless excited by a 532 nm laser. will be done. However, excitation at that wavelength is not optimal for Cy3.5, and with a bandpass filter optimized for Cy3, the emission of Cy3.5 would appear brighter. Atto532 has excitation/emission 532/553, a quantum yield of 0.9, and is expected to be bright because a 532 nm laser can excite Atto532 at its maximum excitation.

他の実施形態では、単一の励起波長を使用して、色素の放射寿命を測定し、複数のコードを実現する。かかる実施形態による一例では、Alexa Fluor546、Cy3B、Alexa Fluor555、およびAlexa Fluor555を含むセットが使用される。場合によっては、他の色素セットが、より有用である。一部の実施形態では、コードのセットは、FRETペアを使用することによって、かつ/または放射光の偏光を測定することによっても拡張される。コード標識の数を増やすための別の方法は、複数の色でコードすることである。 In other embodiments, a single excitation wavelength is used to measure the radiative lifetime of dyes to achieve multiple codes. In one example according to such an embodiment, a set comprising Alexa Fluor546, Cy3B, Alexa Fluor555, and Alexa Fluor555 is used. In some cases other dye sets are more useful. In some embodiments, the code set is also extended by using FRET pairs and/or by measuring the polarization of the emitted light. Another way to increase the number of code indicators is to code with multiple colors.

図15は、標的核酸へのオリゴヌクレオチドプローブ種の一過的な結合からの蛍光の例を示す。時系列から選択されたフレーム(例えば、フレーム番号1、20、40、60、80、100)は、オン・オフ結合を示す特定の部位におけるシグナルの存在(例えば、暗色のスポット)および不在(例えば、白色の領域)を示している。それぞれのフレームは、標的核酸に沿った複数の結合したオリゴヌクレオチドプローブ種から生じた蛍光を示す。集約された画像は、すべての以前のフレームの蛍光の集約または合計を示し、オリゴヌクレオチドプローブ種が結合し、かつ100フレーム中に検出されたすべての部位を示している。 FIG. 15 shows examples of fluorescence from transient binding of oligonucleotide probe species to target nucleic acids. Selected frames from the time series (e.g. frame numbers 1, 20, 40, 60, 80, 100) show the presence (e.g. dark spots) and absence (e.g. , white areas). Each frame shows fluorescence generated from multiple bound oligonucleotide probe species along the target nucleic acid. The merged image shows the aggregation or sum of the fluorescence of all previous frames, showing all sites where the oligonucleotide probe species bound and were detected during the 100 frames.

プローブの標的ポリヌクレオチドへの一過的な結合。
オリゴヌクレオチドプローブ種であるプローブの結合は、動的プロセスであり、結合したプローブは、常に、非結合になる幾分の確率を有する(例えば、温度、塩濃度、プローブ間の競合、およびいくつかの他の要因を含む様々な要因によって決定される)。したがって、常に、あるプローブが別のプローブに置き換わる機会がある。例えば、一実施形態では、相補的であるオリゴヌクレオチドプローブ種を含むオリゴヌクレオチドプローブ種のプールが使用され、試験基板または他の表面上の伸展標的核酸へのアニーリングと、溶液中の相補オリゴヌクレオチドプローブ種へのアニーリングとの間の連続的な競合を引き起こし得る。別の実施形態では、プローブは、3つの部分を有し、第1の部分は、標的核酸に対して完全に相補的であり、第2の部分は、標的核酸に対して部分的に相補的であり、標的核酸に曝露された共通のプールの1つ以上の他のオリゴヌクレオチドプローブ種に部分的に相補的であり、第3の部分は、標的核酸に曝露された共通のプールの1つ以上の他のオリゴヌクレオチドプローブ種に完全に相補的である。一部の実施形態では、標的核酸の塩基位置などの化学構造の単位の正確な空間場所に関する情報を収集することは、高分子の構造および/または配列を決定するのに役立ち得る。一部の実施形態では、オリゴヌクレオチドプローブ種結合部位の場所は、(例えば、単一分子局在化アルゴリズムを使用することによって)ナノメトリック精度またはサブナノメトリック精度で決定される。一部の実施形態では、複数の観察されたオリゴヌクレオチドプローブ種の結合部位は、回折限界光学撮像法によって解像可能であり、結合事象が時間的に離れているため解像される。標的核酸の配列は、各場所に結合し得るオリゴヌクレオチドプローブ種の同一性に基づいて決定される。
Transient binding of probes to target polynucleotides.
The binding of probes, which are oligonucleotide probe species, is a dynamic process, and bound probes always have some probability of becoming unbound (e.g., temperature, salt concentration, competition between probes, and some (determined by a variety of factors, including other factors in Therefore, there is always an opportunity for one probe to replace another. For example, in one embodiment, a pool of oligonucleotide probe species is used, including oligonucleotide probe species that are complementary, to anneal to a stretched target nucleic acid on a test substrate or other surface, and the complementary oligonucleotide probes in solution. It can cause a continuous competition between annealing to seeds. In another embodiment, the probe has three portions, a first portion fully complementary to the target nucleic acid and a second portion partially complementary to the target nucleic acid. is partially complementary to one or more other oligonucleotide probe species of the common pool exposed to the target nucleic acid, and the third portion is one of the common pool exposed to the target nucleic acid It is fully complementary to the other oligonucleotide probe species above. In some embodiments, gathering information about the precise spatial location of units of chemical structure, such as base positions, of a target nucleic acid can help determine the structure and/or sequence of macromolecules. In some embodiments, the locations of oligonucleotide probe species binding sites are determined with nanometric or sub-nanometric precision (eg, by using single-molecule localization algorithms). In some embodiments, multiple observed binding sites of oligonucleotide probe species are resolvable by diffraction-limited optical imaging and are resolved because the binding events are separated in time. The sequence of the target nucleic acid is determined based on the identity of the oligonucleotide probe species that can bind at each location.

一部の実施形態では、曝露プロセスは、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、固定された第1の鎖もしくは固定された第2の鎖または個々のオリゴヌクレオチドプローブ種に相補的である標的核酸の各部分と、一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件を使用して行われ、それによって、光学活性の事例を生じさせる。一部の実施形態では、滞留時間(dwell time)(例えば、特定のオリゴヌクレオチドプローブ種による結合の持続時間(duration)および/または存続時間(persistence)は、結合事象が、完全一致(perfect match)、不一致(mismatch)、または擬似(spurious)結合であるかどうかを決定するために使用される。 In some embodiments, the exposure process is performed by subjecting individual probes of each pool of each oligonucleotide probe species to immobilized first strands or immobilized second strands or individual oligonucleotide probe species. It is performed using conditions that allow each portion of the target nucleic acid that is complementary to transiently and reversibly bind to form the respective duplexes, thereby providing a case of optical activity. give rise to In some embodiments, the dwell time (e.g., duration and/or persistence of binding by a particular oligonucleotide probe species) is such that a binding event is a perfect match. , mismatch, or spurious binding.

一部の実施形態では、曝露プロセスは、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、個々のオリゴヌクレオチドプローブ種に相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の各部分と、反復して一過的かつ可逆的に結合し、それぞれの二重鎖を形成することを可能にする条件を使用して行われ、それによって、光学活性のそれぞれの事例を反復して生じさせる。 In some embodiments, the exposing process comprises immobilizing or anchoring the individual probes of each pool of each oligonucleotide probe species to the immobilized first strand of target nucleic acid that is complementary to the individual oligonucleotide probe species. using conditions that allow it to repeatedly transiently and reversibly bind each portion of the second strand to form the respective duplexes, thereby providing an optically active Iteratively generate each instance of .

一部の実施形態では、配列決定プロセスまたは方法は、伸長標的核酸を、順次提供されるオリゴヌクレオチドプローブ種の1つ以上の完全なセットの各々からの一過的な相互作用に供することを含み得る(1つのオリゴヌクレオチドプローブ種を有する溶液が除去され、次のオリゴヌクレオチドプローブ種を有する溶液が添加される)。一部の実施形態では、各オリゴヌクレオチドプローブ種の結合は、オリゴヌクレオチドプローブ種が一過的に結合することを可能にする条件を使用して行われる。したがって、例えば、1つのオリゴヌクレオチドプローブ種に対して25℃、次のオリゴヌクレオチドプローブ種に対して30℃で、結合が行われる。一部の実施形態では、オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の共通のプールにあるセットで利用される。例えば、類似の温度、類似の塩濃度、またはハイブリダイゼーション結合に影響を及ぼし得る他の要因などの類似の条件を使用して一過的に結合し得るすべてのオリゴヌクレオチドプローブ種は、セットに集められ、任意選択的に、オリゴヌクレオチドプローブ種の共通のプールで一緒に使用され得る。一部のかかる実施形態では、セットの各オリゴヌクレオチドプローブ種は、差次的に標識されるか、または差次的にコードされる。 In some embodiments, the sequencing process or method comprises subjecting the extended target nucleic acid to transient interactions from each of one or more complete sets of sequentially provided oligonucleotide probe species. (solution with one oligonucleotide probe species is removed and solution with the next oligonucleotide probe species is added). In some embodiments, binding of each oligonucleotide probe species is performed using conditions that allow the oligonucleotide probe species to transiently bind. Thus, for example, binding is performed at 25° C. for one oligonucleotide probe species and 30° C. for the next. In some embodiments, oligonucleotide probe species are utilized in sets that are in a common pool of oligonucleotide probe species. All oligonucleotide probe species that can be transiently bound using similar conditions, such as, for example, similar temperatures, similar salt concentrations, or other factors that can affect hybridization binding, are assembled into a set. can optionally be used together in a common pool of oligonucleotide probe species. In some such embodiments, each oligonucleotide probe species of the set is differentially labeled or differentially encoded.

一部の実施形態では、オリゴヌクレオチドプローブ種の一過的な結合は、少量の二価カチオンを含むが、一価カチオンを含まない緩衝液中で行われる。一部の実施形態では、緩衝液は、5mMのTris-HCl、10mMの塩化マグネシウム、mmのEDTA、0.05%のTween-20、およびpH8を含み得る。一部の実施形態では、緩衝液は、1nM未満、5nM未満、10nM未満、または15nM未満の塩化マグネシウム、塩化カルシウム、塩化マンガン、または他の適切な二価カチオンを含んでもよい。他の実施形態では、溶液中の負に帯電した核酸塩基の濃度のわずかに半分以上の濃度の二価カチオンが提供され、この溶液は、オリゴヌクレオチドプローブ種および標的核酸を含み得る。 In some embodiments, transient binding of oligonucleotide probe species is performed in buffers containing small amounts of divalent cations but no monovalent cations. In some embodiments, the buffer may contain 5 mM Tris-HCl, 10 mM magnesium chloride, mm EDTA, 0.05% Tween-20, and pH 8. In some embodiments, the buffer may contain less than 1 nM, less than 5 nM, less than 10 nM, or less than 15 nM magnesium chloride, calcium chloride, manganese chloride, or other suitable divalent cation. In other embodiments, divalent cations are provided at a concentration slightly greater than half the concentration of negatively charged nucleobases in solution, which solution may include oligonucleotide probe species and target nucleic acids.

一部の実施形態では、一過的な結合を促進する複数の条件が使用される。一部の実施形態では、ある条件が、1つのオリゴヌクレオチドプローブ種に対して、そのTmに応じて使用され、別の条件が、別のオリゴヌクレオチドプローブ種に対して、そのTmに応じて使用されるなど、オリゴヌクレオチドプローブ種の完全なセットに対して使用される(例えば、5塩基長の可能な1024個の完全なセットからの各5塩基長のオリゴヌクレオチドプローブ種)。一部の実施形態では、512個の非相補的5塩基長のみが提供される(例えば、標的核酸が二重鎖形態であり、したがって、両方の相補鎖が試料中に存在するため)。一部の実施形態では、各オリゴヌクレオチドプローブ種の付加は、同じ配列順序で同じ5つの特異的塩基および2つの縮重塩基または普遍的塩基を含むオリゴヌクレオチドプローブ(したがって、16個の七量体)の混合物を含んでもよく、したがって、標的核酸配列を照合するために使用される異なる試薬セットのシステムスループットおよび数に関して、単一の五量体オリゴヌクレオチドプローブとして機能し得る同じ標識を用いてすべて標識される。縮重塩基または普遍的塩基は、オリゴヌクレオチドプローブ種のセットの複雑度を増加させることなく、安定性が付加され得る。 In some embodiments, multiple conditions are used that promote transient binding. In some embodiments, one condition is used for one oligonucleotide probe species depending on its Tm and another condition is used for another oligonucleotide probe species depending on its Tm. (eg, each 5 base long oligonucleotide probe species from 1024 possible complete sets of 5 base lengths). In some embodiments, only 512 non-complementary 5-base lengths are provided (eg, because the target nucleic acid is in double-stranded form and thus both complementary strands are present in the sample). In some embodiments, addition of each oligonucleotide probe species results in an oligonucleotide probe containing the same 5 specific bases and 2 degenerate or universal bases in the same sequence order (thus 16 heptamers). ), thus all with the same label that can function as a single pentameric oligonucleotide probe in terms of system throughput and number of different reagent sets used to interrogate target nucleic acid sequences. be labeled. Degenerate bases or universal bases can add stability without increasing the complexity of the set of oligonucleotide probe species.

一部の実施形態では、同じまたは類似のTmを共有し得る複数のオリゴヌクレオチドプローブ種に対して、同じ条件が提供される。一部のかかる実施形態では、オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、異なるコード標識を含んでもよい(これは異なる部分を証明し得、そのため、各標識種が一意的に識別される)。このような場合、温度は、オリゴヌクレオチドプローブ種の交換のプールであるいくつかのオリゴヌクレオチドプローブ種を通して保持され、その後、同じまたは類似のTmを共有し得る次のオリゴヌクレオチドプローブ種のセットに対して変更される。 In some embodiments, the same conditions are provided for multiple oligonucleotide probe species that may share the same or similar Tm. In some such embodiments, each oligonucleotide probe species of a set of oligonucleotide probe species may comprise a different code label (which may account for different moieties so that each label species is uniquely identified). ). In such cases, the temperature is held through several oligonucleotide probe species, which are pools of exchange of oligonucleotide probe species, and then for the next set of oligonucleotide probe species that may share the same or similar Tm. changed by

一部の実施形態では、曝露プロセスの一部であるオリゴヌクレオチドプローブ種の結合期間中に、温度を変えることで、2つ以上の温度で、オリゴヌクレオチドプローブ種の結合挙動が測定される。一部の実施形態では、オリゴヌクレオチドプローブ種の標的核酸への結合挙動または結合パターンが、選択範囲を通して段階的に設定された温度(例えば、10℃~65℃または1℃~35℃)と相関している、融解曲線の類似体が行われる。他の実施形態では、温度の変化と同様の様式で、塩の変化、ホルムアミドなどの変性剤の添加、およびオリゴヌクレオチドプローブ結合に影響を及ぼすことが知られている他のパラメータの変更などの、標的核酸へのオリゴヌクレオチドプローブ結合に影響を及ぼし得る他のパラメータに変更が加えられる。他の実施形態では、単一の温度が利用され、結合動態の観察が、オリゴヌクレオチドプローブ結合のTmと相関し得る別の測定可能なパラメータとして使用される。 In some embodiments, the binding behavior of the oligonucleotide probe species is measured at two or more temperatures by varying the temperature during binding of the oligonucleotide probe species that is part of the exposure process. In some embodiments, the binding behavior or pattern of the oligonucleotide probe species to the target nucleic acid correlates with stepped temperatures (e.g., 10°C to 65°C or 1°C to 35°C) through a selection range. , an analogue of the melting curve is performed. In other embodiments, changes in salt, addition of denaturants such as formamide, and changes in other parameters known to affect oligonucleotide probe binding are performed in a manner similar to changes in temperature. Alterations are made to other parameters that may affect oligonucleotide probe binding to target nucleic acids. In other embodiments, a single temperature is utilized and observation of binding kinetics is used as another measurable parameter that can be correlated with the Tm of oligonucleotide probe binding.

一部の実施形態では、オリゴヌクレオチドプローブ種のTmは、例えば、最近傍パラメータによって計算される。他の実施形態では、オリゴヌクレオチドプローブ種のTmは、経験的に導出される。例えば、最適な融解温度範囲は、融解曲線(例えば、ある温度範囲にわたる吸収による融解の程度の測定)を行うことによって導出される。一部の実施形態では、セットオリゴヌクレオチドプローブ種の組成物は、経験的試験によって検証される理論的に一致するTmに従って設計される。一部の実施形態では、曝露プロセスの一部としてのオリゴヌクレオチドプローブ種の結合は、実質的にTm未満(例えば、計算されたTm未満で最大33℃)の温度で行われる。一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各個々のオリゴヌクレオチドプローブ種に対して経験的に定義された最適温度は、配列決定方法における曝露プロセスの一部として、各個々のオリゴヌクレオチドプローブ種の結合に使用される。 In some embodiments, the Tm of an oligonucleotide probe species is calculated, eg, by the nearest neighbor parameter. In other embodiments, the Tm of the oligonucleotide probe species is empirically derived. For example, the optimal melting temperature range is derived by performing a melting curve (eg, measuring the degree of melting by absorption over a range of temperatures). In some embodiments, the composition of the set oligonucleotide probe species is designed according to a theoretically matched Tm verified by empirical testing. In some embodiments, binding of the oligonucleotide probe species as part of the exposure process occurs at a temperature substantially below the Tm (eg, up to 33° C. below the calculated Tm). In some embodiments, an empirically defined optimal temperature for each individual oligonucleotide probe species of a set of oligonucleotide probe species is determined as part of the exposure process in a sequencing method for each individual oligonucleotide. Used for binding probe species.

一部の実施形態では、異なるTmを有するオリゴヌクレオチドプローブ種の温度を変更することの代替としてまたはそれに加えて、プローブおよび/または塩の濃度を変化させ、かつ/またはpHを変化させる。一部の実施形態では、他の表面の試験基板上の電気バイアスは、オリゴヌクレオチドプローブ種と1つ以上の標的核酸との間の一過的な結合を積極的に促進するために、正と負の間で繰り返し切り替えられる。 In some embodiments, as an alternative or in addition to changing the temperature of oligonucleotide probe species with different Tms, probe and/or salt concentrations are changed and/or pH is changed. In some embodiments, the electrical bias on the other surface test substrate is positive and positive to actively promote transient binding between the oligonucleotide probe species and one or more target nucleic acids. repeatedly toggled between negative.

一部の実施形態では、使用されるオリゴヌクレオチドプローブ種の濃度は、オリゴヌクレオチドプローブ種の配列のGCに対するATの含有量に従って調節される。一部の実施形態では、より高い濃度のオリゴヌクレオチドプローブ種が、より高いGC含量を有するオリゴに対して提供される。一部の実施形態では、塩基組成の影響を補償し得る緩衝液(例えば、CTAB、ベタイン、またはテトラメチル塩化アンモニウム(TMACl)などのカオトロピック試薬を含む緩衝液)は、2.5M~4Mの濃度で使用され、したがって、同じセットの条件を使用して測定されるように、異なるAT対GC配列の含有量および異なるTmを有する異なるオリゴヌクレオチドプローブ種に対して、効果的なTmを均等化することができる。 In some embodiments, the concentration of the oligonucleotide probe species used is adjusted according to the AT to GC content of the sequence of the oligonucleotide probe species. In some embodiments, higher concentrations of oligonucleotide probe species are provided for oligos with higher GC content. In some embodiments, buffers that can compensate for effects of base composition (e.g., buffers containing chaotropic reagents such as CTAB, betaine, or tetramethylammonium chloride (TMACl)) are used at concentrations between 2.5M and 4M. and thus equalize the effective Tm for different oligonucleotide probe species with different AT versus GC sequence content and different Tms, as measured using the same set of conditions be able to.

一部の実施形態では、オリゴヌクレオチドプローブ種は、確率的影響または配列決定チャンバーの設計の様相(例えば、ナノチャネルの角にまたは壁に対してプローブが捕捉され得るフローセル中の渦)のために、試料全体に不均一に分布する(例えば、試験基板、フローチャンバー、スライド、標的核酸の長さ、および/または標的核酸の規則正しいアレイ)。プローブ溶液の効率的な混合または撹拌を確実に行うことによって、プローブの局所的な枯渇に対処する。場合によっては、これは、乱流を生成し得る粒子を溶液中に含ませることによって、および/または乱流を生成するフローセル(例えば、1つ以上の表面上のヘリンボーンパターン)を構築することによって、音響波を使用して実現される。加えて、フローセル内の層流のため、典型的には、混合がほとんどなく、表面に近い溶液は、バルク溶液とほとんど混合されない。これにより、表面近くにある試薬/結合プローブを除去し、表面に新鮮な試薬/プローブをもたらす上で問題が発生する可能性がある。これを軽減するために、上に記載のような乱流生成アプローチを実施することができ、かつ/または表面での大規模な流体の流れ/交換を行うことができる。一部の実施形態では、標的核酸が配列される前または後に、非蛍光のビーズまたはボールを、(標的核酸が結合される表面である)表面に付着させ、表面のランドスケープを粗い質感にする。これは、渦および流れを生成して、表面近くの流体を、より効果的に混合および/または交換し得る。他の実施形態では、電場は、結合したオリゴヌクレオチドプローブ種を濃縮および/または除去するために利用され、電場が、1つ以上の標的核酸が結合した表面とバルク溶液との間に印加される。 In some embodiments, the oligonucleotide probe species are isolated due to stochastic effects or aspects of the sequencing chamber design (e.g., vortices in the flow cell where probes can be trapped in the corners or against the walls of nanochannels). , unevenly distributed throughout the sample (eg, test substrate, flow chamber, slide, length of target nucleic acid, and/or ordered array of target nucleic acid). Local depletion of the probe is addressed by ensuring efficient mixing or agitation of the probe solution. In some cases, this is done by including particles in the solution that can generate turbulence and/or by constructing flow cells that generate turbulence (e.g., herringbone patterns on one or more surfaces). , which is realized using acoustic waves. In addition, due to the laminar flow in the flow cell, there is typically very little mixing, with little solution near the surface mixing with the bulk solution. This can create problems in removing reagents/bound probes near the surface and bringing fresh reagents/probes to the surface. To mitigate this, turbulence generation approaches such as those described above can be implemented and/or large scale fluid flow/exchange at the surface can be performed. In some embodiments, before or after the target nucleic acid is arrayed, non-fluorescent beads or balls are attached to the surface (which is the surface to which the target nucleic acid is bound) to give the surface landscape a rough texture. This can create vortices and flows to more effectively mix and/or exchange fluids near the surface. In other embodiments, an electric field is utilized to concentrate and/or remove bound oligonucleotide probe species, wherein the electric field is applied between the surface to which one or more target nucleic acids are bound and the bulk solution. .

一部の実施形態では、オリゴヌクレオチド種の完全なセットまたはサブセットが、一緒に添加される。一部のかかる実施形態では、塩基組成の影響を均等化する緩衝液(例えば、米国特許出願第2004/0058349号に記載されているTMAClまたはチオシアン酸グアニジン)が使用される。一部の実施形態では、同じまたは類似のTmを有するプローブ種が、一緒に添加される。一部の実施形態では、一緒に添加されるオリゴヌクレオチドプローブ種は、差次的に標識されていなくてもよい。一部の実施形態では、一緒に添加されるオリゴヌクレオチドプローブ種は、差次的に標識される。一部の実施形態では、差次的な標識は、異なる輝度、寿命、最大励起、最大発光、または他の観察可能な光学的特性、例えば、ならびに/またはそのような物理的特性の組み合わせを有する発光を伴う標識である。 In some embodiments, the complete set or subset of oligonucleotide species are added together. In some such embodiments, buffers that equalize the effects of base composition (eg, TMACl or guanidine thiocyanate as described in US Patent Application No. 2004/0058349) are used. In some embodiments, probe species with the same or similar Tm are added together. In some embodiments, the co-added oligonucleotide probe species may not be differentially labeled. In some embodiments, the oligonucleotide probe species added together are differentially labeled. In some embodiments, differential labels have different brightness, lifetimes, excitation maxima, emission maxima, or other observable optical properties, such as and/or combinations of such physical properties. It is a label with luminescence.

一部の実施形態では、2つ以上のオリゴヌクレオチドプローブ種が、一緒に使用され、それらの結合場所は、異なるオリゴヌクレオチド種から生じるシグナル間を区別する必要なく、決定される(例えば、オリゴが同じ発光波長で標識されている)。二重鎖標的核酸の両方の鎖が利用可能な場合、両方の鎖から結合部位のデータを得ることで、アセンブリアルゴリズムの一部として、2つ以上のオリゴヌクレオチド間の区別が可能になり得る。一部の実施形態では、1つ以上の参照オリゴヌクレオチドプローブ種が、アセンブリアルゴリズムのセットまたはサブセットの各オリゴヌクレオチドプローブ種とともに添加され、次いで、そのような参照プローブの光学活性の場所および得られた結合場所を使用して、標的核酸の配列アセンブリの足場形成または繋留を行うことができる。他の実施形態では、2つ以上のオリゴヌクレオチドプローブ種が一緒に使用され、それらの結合場所は、異なるオリゴヌクレオチド種から生じるシグナルを区別する必要なしに(例えば、オリゴが同じ発光波長で標識されている)、オリゴヌクレオチドプローブ種の複数のセットを作製することによって決定される。オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の2つ以上のサブセットに表され、オリゴヌクレオチドプローブ種の識別は、異なるサブセットの組み合わせを使用して実現され、光学活性の共通の場所、したがって、オリゴヌクレオチドプローブ種の結合場所が決定される。 In some embodiments, two or more oligonucleotide probe species are used together and their binding sites determined without the need to distinguish between signals arising from different oligonucleotide species (e.g., oligos are labeled with the same emission wavelength). When both strands of a double-stranded target nucleic acid are available, obtaining binding site data from both strands can allow discrimination between two or more oligonucleotides as part of an assembly algorithm. In some embodiments, one or more reference oligonucleotide probe species are added with each oligonucleotide probe species of a set or subset of assembly algorithms, and then the location of the optical activity of such reference probes and the resulting The binding sites can be used to scaffold or tether the sequence assembly of the target nucleic acid. In other embodiments, two or more oligonucleotide probe species are used together and their binding sites are determined without the need to distinguish signals originating from different oligonucleotide species (e.g., oligos labeled with the same emission wavelength). ), determined by generating multiple sets of oligonucleotide probe species. Each oligonucleotide probe species of the complete set of oligonucleotide probe species is represented in two or more subsets of oligonucleotide probe species, and identification of the oligonucleotide probe species is achieved using combinations of the different subsets, optical The common location of activity and thus the binding location of the oligonucleotide probe species is determined.

代替的な一実施形態では、オリゴヌクレオチドプローブ種は、好ましい結合条件を使用して、安定して結合することができるが、結合条件を好ましくない結合条件に変えて、結合を制御し、一過的な結合を強いるために利用することができる。非限定的な実施形態では、条件の変更は、オリゴヌクレオチドプローブ種の結合を解離させ得る熱、pH、電場、または試薬交換である。次いで、条件を良好な結合条件に戻し、オリゴヌクレオチドプローブ種が再び結合することを可能にする。一部の実施形態では、第1の好ましい結合条件の時間間隔が、すべての標的核酸部位を飽和させない場合、オリゴヌクレオチドローブ種の第2の好ましい結合条件の時間間隔において、第1の好ましい結合条件の時間間隔で使用されるのと同じオリゴヌクレオチドプローブ種のセットであるオリゴヌクレオチドプローブ種が、第1の好ましい結合条件の時間間隔とは異なる標的核酸部位のセットに結合し得る。一部の実施形態では、これらのサイクルは、制御可能な速度で複数回行われる。 In an alternative embodiment, the oligonucleotide probe species can be stably bound using favorable binding conditions, but the binding conditions are changed to unfavorable binding conditions to control and transiently bind the binding. can be used to force a binding. In non-limiting embodiments, the modification of conditions is heat, pH, electric field, or reagent exchange that can dissociate binding of the oligonucleotide probe species. Conditions are then returned to good binding conditions to allow the oligonucleotide probe species to bind again. In some embodiments, if the time interval of the first preferred binding condition does not saturate all target nucleic acid sites, then in the time interval of the second preferred binding condition of the oligonucleotide lobe species, the first preferred binding condition can bind to a different set of target nucleic acid sites than the time interval of the first preferred binding condition. In some embodiments, these cycles are performed multiple times at a controllable rate.

一部の実施形態では、一過的な結合は、1ミリ秒以下、50ミリ秒以下、500ミリ秒以下、1マイクロ秒以下、10マイクロ秒以下、50マイクロ秒以下、500マイクロ秒以下、1秒以下、2秒以下、5秒以下、または10秒以下持続する。 In some embodiments, the transient binding is 1 millisecond or less, 50 milliseconds or less, 500 milliseconds or less, 1 microsecond or less, 10 microseconds or less, 50 microseconds or less, 500 microseconds or less, 1 Lasts no more than seconds, no more than 2 seconds, no more than 5 seconds, or no more than 10 seconds.

一部の実施形態では、一過的な結合の方法を使用し、新鮮なオリゴヌクレオチドプローブ種の連続供給を確実にする場合、フルオロフォアの光退色が、重大な問題を引き起こさない可能性があり、照明を制限するために洗練された視野絞りまたはパウエルレンズが必要でない可能性がある。したがって、フルオロフォアの選択(または退色防止、レドックス系の提供)が重要ではない場合があり、一部のかかる実施形態では、比較的単純な光学系、例えば、fストップが構築され、これにより、二次元撮像デバイスの視野にはない標的核酸の照明を防止し得る。 In some embodiments, photobleaching of the fluorophore may not pose a significant problem when using transient binding methods and ensuring a continuous supply of fresh oligonucleotide probe species. , a sophisticated field stop or Powell lens may not be necessary to limit the illumination. Therefore, the choice of fluorophore (or anti-fading, provision of a redox system) may not be critical, and in some such embodiments relatively simple optics are constructed, e.g. Illumination of target nucleic acids that are not in the field of view of the two-dimensional imaging device can be prevented.

一部の実施形態では、一過的な結合の別の利点は、ポリヌクレオチドに沿ったすべての結合部位で複数の測定を行うことができるため、光学活性事例または検出の正確度に対する信頼性が増すことである。例えば、場合によっては、分子プロセスの典型的な確率的な性質により、オリゴヌクレオチドプローブ種が、誤った場所に結合する可能性がある。一過的に結合したプローブの、正確な結合よりもはるかに短くなる可能性が高いそのような外れ値を用いて、孤立した結合事象を廃棄することができ、複数の検出された相互作用によって裏付けられたそれらの結合事象のみが、標的核酸の配列決定の目的のための有効な検出事象として受け入れられる。 In some embodiments, another advantage of transient binding is that multiple measurements can be made at all binding sites along the polynucleotide, increasing confidence in the accuracy of optical activity events or detection. to increase. For example, in some cases, the typical stochastic nature of molecular processes can cause oligonucleotide probe species to bind in the wrong place. With such outliers, which are likely to be much shorter than the exact binding of transiently bound probes, isolated binding events can be discarded, allowing multiple detected interactions to Only those binding events that are validated are accepted as valid detection events for purposes of sequencing the target nucleic acid.

一過的な結合の検出および結合部位の位置決定。
一過的な結合は、サブ回折レベルの位置決定を可能にする不可欠な構成要素である。一過的に結合するオリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブが、標的核酸に結合するか、または溶液中に存在するいずれかの可能性が、いつでも存在する。したがって、標的核酸結合部位のすべてが、いつでもオリゴヌクレオチドプローブによって結合されるわけではない。これにより、光の回折限界よりも近い部位(例えば、標的核酸上で10nmしか離れていない2つの部位)での結合事象の検出が可能になり得る。例えば、配列AAGCTTが60塩基後に繰り返される場合、反復配列は、約20nm離れていることになる(標的核酸が、約0.34nmのワトソン-クリック塩基長に伸長され直線化されている場合)。20ナノメートルは、通常、光学撮像によって区別することはできないであろう。しかし、プローブが、撮像中に、異なる時間に2つの部位に結合した場合、それらは個々に検出される。これにより、結合事象の超解像撮像が可能となる。ナノメトリック精度は、ホモポリマーリピートである配列リピート、または2塩基リピート、3塩基リピート、または3塩基超のリピートを解像し、それらの数を決定するために特に重要である。
Detection of transient binding and localization of binding sites.
Transient coupling is an essential component that enables sub-diffraction level localization. There is always the possibility that each oligonucleotide probe of a set of transiently binding oligonucleotide probe species either binds to a target nucleic acid or is present in solution. Therefore, not all target nucleic acid binding sites are bound by an oligonucleotide probe at any one time. This can allow detection of binding events at sites closer than the diffraction limit of light (eg, two sites only 10 nm apart on the target nucleic acid). For example, if the sequence AAGCTT is repeated after 60 bases, the repeats will be about 20 nm apart (if the target nucleic acid has been extended and linearized to a Watson-Crick base length of about 0.34 nm). Twenty nanometers would normally be indistinguishable by optical imaging. However, if a probe binds to two sites at different times during imaging, they will be detected individually. This allows for super-resolution imaging of binding events. Nanometric precision is particularly important for resolving and determining the number of sequence repeats that are homopolymeric repeats or repeats of 2, 3, or more than 3 bases.

一部の実施形態では、光学活性の複数の事例と関連付けられ、標的核酸の場所と相関する複数の結合事象は、単一のオリゴヌクレオチドプローブ種の配列からではなく、オリゴヌクレオチドプローブ種の完全なセットからのデータを分析し、部分的に重複する配列から生じ得る結合事象または光学活性の事例を考慮することによって決定され得る。一例として、同じ場所に(実際には、サブナノメトリック的に近い)、プローブATTAAGおよびTTAAGCが結合している。それらは、6塩基長であり、共通の5塩基配列を共有し、それぞれが他方を検証するとともに、共通の5塩基配列のいずれかの側で配列が1塩基伸びている。場合によっては、5塩基配列の各側の1塩基は、不一致であり(末端における不一致は、典型的には、内部にある不一致よりも許容されると予想される)、両方の結合事象に存在するのは、5塩基配列のみであることが検証される。 In some embodiments, the multiple binding events associated with multiple instances of optical activity and correlated with target nucleic acid locations are not from the sequence of a single oligonucleotide probe species, but from the complete oligonucleotide probe species. It can be determined by analyzing the data from the set and considering cases of binding events or optical activity that can arise from partially overlapping sequences. As an example, probes ATTAAG and TTAAGC are bound at the same location (sub-nanometrically close, in fact). They are 6 bases long, share a common 5 base sequence, each verify the other, and extend the sequence by 1 base on either side of the common 5 base sequence. In some cases, one base on each side of the five-base sequence is mismatched (mismatches at the ends are typically expected to be more tolerated than internal ones) and are present in both binding events. It is verified that only 5 base sequences do.

一部の代替的な実施形態では、一過的な単一分子の結合は、非光学的な方法によって検出される。一部の実施形態では、非光学的な方法は、電気的な方法である。一部の実施形態では、一過的な単一分子の結合は、直接的な励起方法が存在しない場合、非蛍光的な方法によって検出され、むしろ生物発光または化学発光の機構が使用される。 In some alternative embodiments, transient single-molecule binding is detected by non-optical methods. In some embodiments, the non-optical method is an electrical method. In some embodiments, transient single-molecule binding is detected by non-fluorescent methods in the absence of direct excitation methods, rather bioluminescence or chemiluminescence mechanisms are used.

一部の実施形態では、標的核酸中の各塩基は、配列が重複し得る複数のオリゴヌクレオチドプローブ種によって照合される。各塩基のこの繰り返しサンプリングは、標的核酸における希少な一塩基バリアントまたは変異の検出を可能にする。 In some embodiments, each base in the target nucleic acid is matched by multiple oligonucleotide probe species that may overlap in sequence. This repeated sampling of each base allows detection of rare single nucleotide variants or mutations in the target nucleic acid.

一部の実施形態では、分析下の各オリゴヌクレオチドプローブ種が標的核酸と有した光学活性または結合相互作用(閾値結合持続時間よりも長い持続時間を有する)のすべての事例が、かかる分析で利用される。一部の実施形態では、配列決定は、完全一致からの配列を繋ぎ合わせる、または再構築することを含み得るだけでなく、第1のソフトウェア配列決定プロセスで、各オリゴヌクレオチドプローブ種と関連する光学活性または結合事象の有効な事例を最初に分析することによって、配列を得ることができる。一部の実施形態では、一過的な結合は、検出手段として記録されるが、オリゴヌクレオチドプローブ種の結合の位置決定を改善するために使用されなくてもよい。 In some embodiments, all instances of optical activity or binding interactions (having a duration greater than the threshold binding duration) that each oligonucleotide probe species under analysis had with the target nucleic acid are utilized in such analysis. be done. In some embodiments, sequencing may involve not only splicing or reconstructing sequences from perfect matches, but in a first software sequencing process, the optical sequence associated with each oligonucleotide probe species. Sequences can be obtained by first analyzing valid instances of activity or binding events. In some embodiments, transient binding is recorded as a means of detection, but may not be used to improve localization of binding of oligonucleotide probe species.

光学活性を検出し、結合部位の局在を決定するための撮像技術。
ブロック214。一部の実施形態では、試験基板上の場所、および、任意選択的に、二次元撮像デバイスを使用した曝露プロセス中に生じる光学活性の各それぞれの事例の持続時間が測定される。
Imaging techniques for detecting optical activity and localizing binding sites.
block 214; In some embodiments, the location on the test substrate and, optionally, the duration of each respective instance of optical activity occurring during the exposure process using a two-dimensional imaging device are measured.

一部の実施形態では、試験基板上の場所を測定することは、二次元撮像デバイスによって測定されるデータのフレームを訓練された畳み込みニューラルネットワークに入力することを含み得る。データのフレームは、異なる場所および同じ場所における光学活性の複数の事例のうち、異なる場所における光学活性のそれぞれの事例を含み得る。光学活性の複数の事例の光学活性の各事例は、標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に結合する個々のヌクレオチドプローブ種に対応し得る。入力に応答して、訓練された畳み込みニューラルネットワークは、光学活性の複数の事例の光学活性の1つ以上の事例の各々の試験基板上の位置を識別し得る。 In some embodiments, measuring locations on the test substrate may include inputting frames of data measured by a two-dimensional imaging device into a trained convolutional neural network. A frame of data may include each instance of optical activity at a different location from multiple instances of optical activity at different locations and the same location. Each instance of optical activity of the plurality of instances of optical activity may correspond to an individual nucleotide probe species that binds to a portion of the immobilized first strand or immobilized second strand of the target nucleic acid. In response to the input, the trained convolutional neural network can identify the location on the test substrate of each of one or more instances of optical activity of the plurality of instances of optical activity.

一部の実施形態では、検出器は、二次元検出器であり、結合事象は、ナノメトリック正確度で(例えば、単一分子局在化アルゴリズムを使用することによって)位置決定される。一部の実施形態では、相互作用の特徴は、標的核酸とのオリゴヌクレオチドプローブ種の結合親和性に対応し得る光学活性または結合事象の各事例の持続時間を含み得る。一部の実施形態では、特徴は、特定の標的核酸(例えば、特定の遺伝子配列に対応するポリヌクレオチド)のアレイ内の場所に対応し得る、試験基板の場所、表面、またはマトリックスである。 In some embodiments, the detector is a two-dimensional detector and binding events are localized with nanometric accuracy (eg, by using single-molecule localization algorithms). In some embodiments, interaction characteristics can include optical activity or the duration of each instance of binding event, which can correspond to the binding affinity of the oligonucleotide probe species with the target nucleic acid. In some embodiments, a feature is a location, surface, or matrix of a test substrate that can correspond to the location within an array of a particular target nucleic acid (eg, a polynucleotide corresponding to a particular gene sequence).

一部の実施形態では、光学活性の各それぞれの事例は、所定の閾値を満たし得る観測メトリックを有する。一部の実施形態では、観測メトリックは、持続時間、シグナル・ノイズ比、光子計数、もしくは強度、またはそれらの組み合わせを含む。一部の実施形態では、光学活性のそれぞれの事例が1つのフレームに対して観察される場合、所定の閾値が満たされる。一部の実施形態では、光学活性のそれぞれの事例の強度が比較的低く、光学活性のそれぞれの事例が10分の1のフレームに対して観察される場合、所定の閾値が満たされる。 In some embodiments, each respective instance of optical activity has an observed metric that can meet a predetermined threshold. In some embodiments, the observation metric includes duration, signal-to-noise ratio, photon count, or intensity, or a combination thereof. In some embodiments, a predetermined threshold is met if each instance of optical activity is observed for one frame. In some embodiments, the predetermined threshold is met if the intensity of each instance of optical activity is relatively low and each instance of optical activity is observed for one tenth of the frames.

一部の実施形態では、所定の閾値は、(i)オリゴヌクレオチドプローブ種の固有のN塩基長配列の各残基が、標的核酸の固定された第1の鎖または固定された第2の鎖の相補塩基に結合する、第1の結合形態と、(ii)オリゴヌクレオチドプローブ種の固有のN塩基長配列と、それぞれのオリゴヌクレオチドプローブ種が光学活性または結合事象のそれぞれの事例を形成するように結合している標的核酸の固定された第1の鎖または固定された第2の鎖の配列との間に少なくとも1つの不一致が存在する、第2の結合形態と、の間で区別され得る。 In some embodiments, the predetermined threshold is such that (i) each residue of a unique N-base long sequence of the oligonucleotide probe species is a fixed first strand or a fixed second strand of the target nucleic acid; and (ii) a unique N-base long sequence of oligonucleotide probe species such that each oligonucleotide probe species forms a respective instance of optical activity or binding event. and a second binding form in which there is at least one mismatch between the sequence of the immobilized first strand or the immobilized second strand of the target nucleic acid bound to the .

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種は、固有の対応する所定の閾値を有する。 In some embodiments, each respective oligonucleotide probe species of the set of oligonucleotide probe species has a unique corresponding predetermined threshold value.

一部の実施形態では、所定の閾値は、標的核酸に沿った特定の場所における、オリゴヌクレオチドプローブ種と標的核酸との間の1つ以上、2つ以上、3つ以上、4つ以上、5つ以上、または6つ以上の結合事象を観察することに基づいて、決定される。 In some embodiments, the predetermined threshold is 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, between the oligonucleotide probe species and the target nucleic acid at a particular location along the target nucleic acid. A determination is made based on observing one or more, or six or more binding events.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する(例えば、ラムダファージ、または任意の既知の合成標的核酸の配列決定に一過的な結合方法を適用することによって得られた情報に由来するデータセット)。一部の実施形態では、異なる閾値は、DNA塩基と比較してエピジェネティック修飾塩基またはRNA塩基(例えば、ウリジン)などの異なる塩基バリアントに対して決定され、そのような異なる閾値は、予想される試料の標的核酸の種類または潜在的に修飾された塩基領域(例えば、CpGアイランド)のうちの1つに対応して、使用される。 In some embodiments, the predetermined threshold value for each respective oligonucleotide probe species of the set of oligonucleotide probe species is derived from a training data set (e.g., lambda phage, or any known synthetic target nucleic acid sequence data set derived from information obtained by applying the temporal combination method to the decision). In some embodiments, different thresholds are determined for different base variants, such as epigenetically modified bases or RNA bases (e.g., uridine) compared to DNA bases, and such different thresholds are expected Corresponding to one of the target nucleic acid types or potentially modified base regions (eg, CpG islands) of the sample is used.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットの各それぞれのオリゴヌクレオチドプローブ種についての所定の閾値は、訓練データセットに由来する。訓練セットは、オリゴヌクレオチドプローブ種のセットにおける各それぞれのオリゴヌクレオチドプローブ種について、参照核酸配列に結合した際の各それぞれのオリゴヌクレオチドプローブ種についての観察メトリックの尺度を含み、そのため、それぞれのオリゴヌクレオチドプローブ種の固有のN塩基長配列の各残基が、参照核酸配列の相補塩基に結合する。 In some embodiments, the predetermined threshold for each respective oligonucleotide probe species of the set of oligonucleotide probe species is derived from the training data set. The training set includes, for each respective oligonucleotide probe species in the set of oligonucleotide probe species, a measure of the observed metric for each respective oligonucleotide probe species when bound to the reference nucleic acid sequence, so that each oligonucleotide Each residue of a unique N-base long sequence of the probe species binds to a complementary base of the reference nucleic acid sequence.

一部の実施形態では、参照核酸は、参照基板上に固定される。一部の実施形態では、参照核酸は、試験基板とともに含まれ、試験基板上に固定される。一部の実施形態では、参照核酸配列は、PhiX174、M13、ラムダファージ、T7ファージ、大腸菌(Escherichia coli)、酵母(Saccharomyces cerevisiae)、分裂酵母(Saccharomyces pombe)のゲノムのすべてまたは一部分を含み得る。一部の実施形態では、参照核酸配列は、既知の配列の合成構築物である。一部の実施形態では、参照核酸配列は、ウサギグロビンRNAのすべてまたは一部分を含み得る(例えば、標的核酸がRNAを含む場合、または標的核酸の1つの鎖のみが配列決定される場合に利用される)。 In some embodiments, the reference nucleic acid is immobilized on a reference substrate. In some embodiments, the reference nucleic acid is included with and immobilized on the test substrate. In some embodiments, the reference nucleic acid sequence may comprise all or part of the genome of PhiX174, M13, phage lambda, phage T7, Escherichia coli, Saccharomyces cerevisiae, Saccharomyces pombe. In some embodiments, the reference nucleic acid sequence is a synthetic construct of known sequence. In some embodiments, the reference nucleic acid sequence can comprise all or part of a rabbit globin RNA (e.g., utilized when the target nucleic acid comprises RNA or when only one strand of the target nucleic acid is to be sequenced). ).

一部の実施形態では、曝露プロセスは、挿入色素の形態の第1の標識を利用し得る。オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種は、第2の標識に結合される。第1の標識および第2の標識は、重複するドナー発光スペクトルおよびアクセプター励起スペクトルを有し、第1の標識および第2の標識が互いに近接している場合、第1の標識および第2の標識のうちの1つに蛍光レベルを増加させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、第2の標識に挿入する。一部の実施形態では、曝露プロセスおよび関連する蛍光は、フェルスター共鳴エネルギー移動(FRET)法を含み得る。かかる実施形態では、挿入色素は、FRETドナーを含み得、第2の標識は、FRETアクセプターを含み得る。 In some embodiments, the exposure process may utilize a first label in the form of an intercalating dye. Each oligonucleotide probe species in the set of oligonucleotide probe species is attached to a second label. The first label and the second label have overlapping donor emission spectra and acceptor excitation spectra, and the first label and the second label if the first label and the second label are in close proximity to each other. can increase the fluorescence level. Each instance of optical activity can result from the proximity of the intercalating dye and the respective duplex between the oligonucleotide probe species and the immobilized first strand or immobilized second strand of the target nucleic acid. is inserted into the second label. In some embodiments, the exposure process and associated fluorescence may involve Förster Resonance Energy Transfer (FRET) methods. In such embodiments, the intercalating dye may comprise a FRET donor and the second label may comprise a FRET acceptor.

一部の実施形態では、光学活性の事例は、オリゴヌクレオチドプローブ種または標的核酸配列に結合、連結、または会合した標識への挿入色素間のFRETを利用して検出される。一部の実施形態では、標的核酸が固定化された後、すべての標的核酸の末端は、例えば、ターミナルトランスフェラーゼによって、FRETパートナーとして機能し得る蛍光標識されたヌクレオチドを添加することによって標識される。一部のかかる実施形態では、オリゴヌクレオチドプローブ種は、その末端の1つにおいて、Cy3BまたはAtto542標識で標識される。 In some embodiments, instances of optical activity are detected utilizing FRET between intercalating dyes to labels bound, ligated or associated with oligonucleotide probe species or target nucleic acid sequences. In some embodiments, after the target nucleic acids are immobilized, all target nucleic acid ends are labeled, e.g., by terminal transferase, by adding fluorescently labeled nucleotides that can function as FRET partners. In some such embodiments, the oligonucleotide probe species is labeled at one of its termini with a Cy3B or Atto542 label.

一部の実施形態では、FRETは、光活性化によって置換される。かかる実施形態では、ドナー(例えば、標的核酸上の標識)は、光活性化剤を含み得、アクセプター(例えば、オリゴヌクレオチドプローブ種上の標識)は、不活性化または暗化された状態のフルオロフォアを含み得る(例えば、Cy5標識は、20mMのTris(pH7.5)、2mMのEDTA、および50mMのNaCl中で、1mg/mLのNaBH4を用いたケージ化によって暗化され得る)。かかる実施形態では、オリゴヌクレオチドプローブ種に結合され、かつ活性化剤に近接している場合にオンに切り替わり、その活性化剤が標的核酸に結合される、暗化されたフルオロフォアの蛍光。 In some embodiments, FRET is replaced by photoactivation. In such embodiments, the donor (e.g., label on the target nucleic acid) may comprise a photoactivator and the acceptor (e.g., label on the oligonucleotide probe species) is fluorophore in an inactivated or darkened state. Fore can be included (eg, Cy5 label can be darkened by caging with 1 mg/mL NaBH4 in 20 mM Tris (pH 7.5), 2 mM EDTA, and 50 mM NaCl). In such embodiments, the fluorescence of a dimmed fluorophore that is bound to an oligonucleotide probe species and switched on when in proximity to an activator, which is bound to a target nucleic acid.

一部の実施形態では、曝露プロセスは、挿入色素(例えば、光活性剤)の形態の第1の標識を利用してもよい。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識(例えば、暗化されたフルオロフォア)に結合される。第1の標識は、第1の標識および第2の標識が互いに近接している場合、第2の標識を蛍光させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、オリゴヌクレオチドプローブ種に結合される第2の標識に挿入する。 In some embodiments, the exposure process may utilize a first label in the form of an intercalating dye (eg, photoactive agent). Each oligonucleotide probe species of the set of oligonucleotide probe species is attached to a second label (eg, a darkened fluorophore). A first label may cause a second label to fluoresce when the first label and the second label are in close proximity to each other. Each instance of optical activity can result from the proximity of the intercalating dye and the respective duplex between the oligonucleotide probe species and the immobilized first strand or immobilized second strand of the target nucleic acid. is inserted into the second label attached to the oligonucleotide probe species.

一部の実施形態では、曝露プロセスは、挿入色素(例えば、暗化されたフルオロフォア)の形態の第1の標識を利用してもよい。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、第2の標識(例えば、光活性化剤)に結合される。第2の標識は、第1の標識および第2の標識が互いに近接しているときに、第1の標識を蛍光させ得る。光学活性のそれぞれの事例は、挿入色素の近接性から生じ得、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖を、オリゴヌクレオチドプローブ種に結合される第2の標識に挿入する。 In some embodiments, the exposure process may utilize a first label in the form of an intercalating dye (eg, a darkened fluorophore). Each oligonucleotide probe species of the set of oligonucleotide probe species is attached to a second label (eg, a photoactivator). The second label may cause the first label to fluoresce when the first label and the second label are in close proximity to each other. Each instance of optical activity can result from the proximity of the intercalating dye and the respective duplex between the oligonucleotide probe species and the immobilized first strand or immobilized second strand of the target nucleic acid. is inserted into the second label attached to the oligonucleotide probe species.

一部の実施形態では、曝露プロセスは、挿入色素を利用し得る。光学活性のそれぞれの事例は、オリゴヌクレオチドプローブ種と、標的核酸の固定された第1の鎖または固定された第2の鎖との間のそれぞれの二重鎖に挿入される挿入色素の蛍光から生じ得、光学活性のそれぞれの事例は、それぞれの二重鎖に挿入される前の挿入色素の蛍光よりも大きい。標的核酸とオリゴヌクレオチドプローブ種との間の二重鎖に挿入される1つ以上の挿入色素の蛍光の増加(100倍以上)は、単一分子局在化アルゴリズムのための点光源(point source)様シグナルを提供し得、結合部位の場所の正確な決定を可能にし得る。挿入色素は、二重鎖に挿入されてもよく、強力に検出され、正確に位置決定される各オリゴヌクレオチドプローブ種結合部位の結合事象に関連する、相当数の二重鎖に起因する光学活性の事例を生成してもよい。 In some embodiments, the exposure process may utilize an intercalating dye. Each instance of optical activity is derived from the fluorescence of an intercalating dye that intercalates into each duplex between the oligonucleotide probe species and either the immobilized first strand or the immobilized second strand of the target nucleic acid. Each instance of optical activity that can occur is greater than the fluorescence of the intercalating dye prior to intercalation into the respective duplex. An increase in fluorescence (over 100-fold) of one or more intercalating dyes intercalating into the duplex between the target nucleic acid and the oligonucleotide probe species is a point source for single-molecule localization algorithms. )-like signal, allowing precise determination of the location of the binding site. Intercalating dyes may be intercalated into the duplex and are strongly detected and exhibit a substantial number of duplex-induced optical activities associated with each binding event of each oligonucleotide probe species binding site that are precisely located. may generate instances of

一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、標的核酸の固定された第1の鎖の相補部分に結合することによって、光学活性の第1の事例を生じ、標的核酸の固定された第2の鎖の相補部分に結合することによって、光学活性の第2の事例を生じる。一部の実施形態では、標的核酸の固定された第1鎖の一部分は、その相補オリゴヌクレオチドプローブ種の結合による光学活性の事例を生じ得、標的核酸の固定された第1鎖の一部分に相補的な標的核酸の固定された第2鎖の一部分は、その相補オリゴヌクレオチドプローブ種の結合による光学活性の別の事例を生じ得る。 In some embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species produces the first instance of optical activity by binding to the complementary portion of the immobilized first strand of the target nucleic acid. , produces the second instance of optical activity by binding to the complementary portion of the immobilized second strand of the target nucleic acid. In some embodiments, the immobilized first strand portion of the target nucleic acid can undergo an instance of optical activity upon binding of its complementary oligonucleotide probe species, complementary to the immobilized first strand portion of the target nucleic acid. A portion of the immobilized second strand of the target nucleic acid can give rise to another instance of optical activity due to binding of its complementary oligonucleotide probe species.

一部の実施形態では、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種は、標的核酸の固定された第1の鎖の2つ以上の相補領域に結合することによって、光学活性の2つ以上の第1の事例を生じ得、標的核酸の固定された第2の鎖の2つ以上の相補領域に結合することによって、光学活性の2つ以上の第2の事例を生じ得る。 In some embodiments, each oligonucleotide probe species of the set of oligonucleotide probe species is optically active by binding to two or more complementary regions of the immobilized first strand of the target nucleic acid. The first instance above can occur, and by binding to two or more complementary regions of the immobilized second strand of the target nucleic acid, two or more second instances of optical activity can occur.

一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブ種に相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に、3回以上結合し得、それによって、3つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。 In some embodiments, each oligonucleotide probe species is a portion of the immobilized first strand or the immobilized second strand of the target nucleic acid that is complementary to the respective oligonucleotide probe species during the exposure process. can bind three or more times, thereby resulting in three or more instances of optical activity, each instance of optical activity representing a binding event of multiple binding events.

一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブに相補的である標的核酸の固定された第1の鎖または固定された第2の鎖の一部分に、5回以上結合し得、それによって、5つ以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。 In some embodiments, each oligonucleotide probe species is attached to a portion of the immobilized first strand or immobilized second strand of the target nucleic acid that is complementary to the respective oligonucleotide probe during the exposure process. , can bind five or more times, thereby giving rise to five or more instances of optical activity, each instance of optical activity representing a binding event of multiple binding events.

一部の実施形態では、それぞれのオリゴヌクレオチドプローブ種は、曝露プロセス中、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された第1の鎖または固定された第2の鎖の一部分に、10回以上結合し得、それによって、10個以上の光学活性の事例をもたらし、光学活性の各事例は、複数の結合事象の結合事象を表す。 In some embodiments, each oligonucleotide probe species is attached to a portion of the immobilized first strand or immobilized second strand complementary to the respective oligonucleotide probe species during the exposure process. It can bind more than once, thereby resulting in 10 or more instances of optical activity, each instance of optical activity representing a binding event of multiple binding events.

一部の実施形態では、曝露プロセスは、5分以下、4分以下、3分以下、2分以下、または1分以下であってもよい。 In some embodiments, the exposure process may be 5 minutes or less, 4 minutes or less, 3 minutes or less, 2 minutes or less, or 1 minute or less.

一部の実施形態では、曝露プロセスは、二次元撮像デバイスの1つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの2つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの500つ以上のフレームで生じ得る。一部の実施形態では、曝露プロセスは、二次元撮像デバイスの5,000つ以上のフレームで生じ得る。一部の実施形態では、光学活性がまばらである場合(例えば、空間的にプローブ結合が少ない事例がある)、一過的な結合の1つのフレームは、オリゴヌクレオチドプローブ種の結合部位に関連するシグナルを位置決定するのに十分である。 In some embodiments, the exposure process can occur in one or more frames of the two-dimensional imaging device. In some embodiments, the exposure process can occur in two or more frames of the two-dimensional imaging device. In some embodiments, the exposure process may occur over 500 frames or more of the two-dimensional imaging device. In some embodiments, the exposure process can occur over 5,000 frames or more of the two-dimensional imaging device. In some embodiments, when optical activity is sparse (e.g., there are instances of spatially low probe binding), one frame of transient binding is associated with the binding site of the oligonucleotide probe species. sufficient to localize the signal.

一部の実施形態では、曝露プロセス中の光学活性の平均的な事例の予想される時間の長さは、曝露プロセスで使用されるオリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種の推定融解温度によって決定される。 In some embodiments, the expected length of time for the average instance of optical activity during the exposure process is the estimated melting point of each oligonucleotide probe species of the set of oligonucleotide probe species used in the exposure process. Determined by temperature.

一部の実施形態では、光学活性は、標識からの蛍光発光の検出を含み得る。それぞれの標識は、励起され、対応する発光波長は、フィルタホイールの異なるフィルタを使用して、別々に検出される。一部の実施形態では、標識発光寿命は、蛍光寿命撮像(FLIM)システムを使用して測定される。代替的に、発光波長は、分割され、単一のセンサーの異なる象限に、または4つの別々のセンサーに投影される。一部の実施形態では、プリズムを使用して、CCDの画素にわたって発光スペクトルを分割する方法が、Lundquit et al.,Opt Lett.,33:1026-8,2008に記載のように使用(sued)される。一部の実施形態では、スペクトログラフも使用され得る。代替的に、一部の実施形態では、発光波長を輝度レベルと組み合わせて、予想されるオリゴヌクレオチドプローブ種の結合時間がフレーム曝露時間よりも有意に短い場合、結合部位におけるプローブの滞留時間に関する情報を提供し得る。 In some embodiments, optical activity can include detection of fluorescence emission from a label. Each label is excited and the corresponding emission wavelengths are detected separately using different filters in the filter wheel. In some embodiments, the label emission lifetime is measured using a fluorescence lifetime imaging (FLIM) system. Alternatively, the emitted wavelengths are split and projected onto different quadrants of a single sensor or onto four separate sensors. In some embodiments, a method of using a prism to split the emission spectrum across the pixels of a CCD is described in Lundquit et al. , Opt Lett. , 33:1026-8, 2008. Spectrographs may also be used in some embodiments. Alternatively, in some embodiments, the emission wavelength is combined with the brightness level to provide information about the residence time of the probe at the binding site if the expected binding time of the oligonucleotide probe species is significantly shorter than the frame exposure time. can provide

走査型プローブ顕微鏡法(高速原子間力顕微鏡法を含む)および電子顕微鏡法などのいくつかの検出方法は、ポリヌクレオチド分子が検出面で伸長されている場合、ナノメトリック距離を解像することができる。しかし、これらの方法は、フルオロフォアの光学活性に関する情報を提供しない。超解像精度で蛍光分子を検出するための複数の光学撮像技術がある。これらには、誘導放出抑制(STED)、確率的光学再構築顕微鏡(STORM)、超解像光学ゆらぎ撮像(SOFI)、単一分子局在顕微鏡(SMLM)、および全反射照明蛍光顕微鏡(TIRF)が含まれる。一部の実施形態では、ナノスケールトポグラフィーイメージングのための点集積(PAINT)に最も類似したSMLMアプローチが使用される。これらのシステムは通常、フルオロフォアを励起するための1つ以上のレーザ、焦点検出/保持機構、1つ以上のCCDまたはCMOSカメラ、適切な対物レンズ、リレーレンズ、およびミラーを必要とする。一部の実施形態では、オリゴヌクレオチドプローブ種のオン結合(binding-on)およびオフ結合(binding-off)を記録するためのいくつかの画像フレーム(例えば、動画または映像ビデオ)について、曝露ステップが生じ得る。 Some detection methods, such as scanning probe microscopy (including high-speed atomic force microscopy) and electron microscopy, are capable of resolving nanometric distances when polynucleotide molecules are elongated in the detection plane. can. However, these methods do not provide information on the optical activity of fluorophores. There are multiple optical imaging techniques for detecting fluorescent molecules with super-resolution accuracy. These include stimulated emission depletion (STED), stochastic optical reconstruction microscopy (STORM), super-resolution optical fluctuation imaging (SOFI), single molecule localization microscopy (SMLM), and total internal reflection fluorescence microscopy (TIRF). is included. In some embodiments, an SMLM approach that is most similar to Point Integration for Nanoscale Topography Imaging (PAINT) is used. These systems typically require one or more lasers to excite the fluorophores, a focus detection/holding mechanism, one or more CCD or CMOS cameras, appropriate objective lenses, relay lenses, and mirrors. In some embodiments, the exposing step is performed for a number of image frames (e.g., movie or motion video) to record the binding-on and binding-off of the oligonucleotide probe species. can occur.

SMLM法は、高い光子計数に依存する。高い光子計数は、生成されたガウスパターンのフルオロフォア発光の重心が決定される精度を向上させるが、高い光子計数の必要性は、長い画像の取得および明るく光安定性のフルオロフォアへの依存にも関連している。高濃度のプローブ溶液は、クエンチされたプローブ、分子ビーコンを使用するか、または相補オリゴヌクレオチドプローブ種と会合した2つ以上の標識(例えば、標的核酸を形成する二重鎖の両側に1つ)を有することによって、支障となるバックグラウンドを引き起こすことなく利用される。かかる実施形態では、標識は、色素間の相互作用を介して溶液中でクエンチされる。しかしながら、それらが標的に結合すると、標識が分離し、蛍光が明るくなり(例えば、単一の色素の2倍の輝度で)、より検出されやすくなる。 The SMLM method relies on high photon counts. High photon counts improve the accuracy with which the centroid of the fluorophore emission of the generated Gaussian pattern is determined, but the need for high photon counts is compromised by long image acquisitions and reliance on bright, photostable fluorophores. is also related. A high concentration probe solution uses quenched probes, molecular beacons, or two or more labels associated with complementary oligonucleotide probe species (e.g., one on each side of the duplex forming the target nucleic acid). is utilized without causing a disturbing background. In such embodiments, the label is quenched in solution via dye-dye interactions. However, when they bind to the target, the labels separate and fluoresce brightly (eg, twice as bright as a single dye), making them more detectable.

一部の実施形態では、オリゴヌクレオチドプローブ種であるプローブ種のオン速度(on-rate)は、例えば、プローブ濃度を上げること、温度を上げること、または分子クラウディング(molecular crowding)を増すことによって(例えば、溶液中にPEG400、PEG800などを含むことによって)、変化する(例えば、増加する)。他の実施形態では、オリゴヌクレオチドプローブ種であるプローブ種のオフ速度(off-rate)は、例えば、オリゴヌクレオチドプローブ種であるプローブ種の熱安定性を低下させることによって、化学成分を操作すること、不安定化付属体を添加することに、またはオリゴヌクレオチドプローブ種の場合、具体的には、それらの長さを減らすこと、天然塩基の代わりにエピジェネティック修飾塩基もしくは合成修飾塩基を使用すること、オリゴヌクレオチドプローブ種の骨格を修飾することによって(例えば、核酸塩基間もしくは糖間の間隔を変えることによって、例えば、電荷を付加することによって)、変化する。一部の実施形態では、オフ速度は、温度を上げること、塩濃度を減らすこと(例えば、厳密に増加させること)、またはpHを変化させることによって、増加する。 In some embodiments, the on-rate of a probe species that is an oligonucleotide probe species is increased by, for example, increasing probe concentration, increasing temperature, or increasing molecular crowding. change (eg, increase) (eg, by including PEG400, PEG800, etc. in the solution). In other embodiments, the off-rate of a probe species that is an oligonucleotide probe species is controlled by manipulating chemical moieties, for example, by decreasing the thermal stability of the probe species that is an oligonucleotide probe species. , adding destabilizing appendages, or in the case of oligonucleotide probe species, in particular reducing their length, using epigenetically or synthetically modified bases instead of natural bases. , is altered by modifying the backbone of the oligonucleotide probe species (eg, by altering the spacing between nucleobases or sugars, eg, by adding charges). In some embodiments, the off-rate is increased by increasing temperature, decreasing (eg, increasing severely) salt concentration, or changing pH.

一部の実施形態では、使用されるオリゴヌクレオチドプローブ種の濃度は、オリゴヌクレオチドプローブ種の標識であるプローブ標識を、本質的に、それらが結合するまで非蛍光にすることによって、バックグラウンドレベルを有意に上昇させることなく、増加される。これを行う1つの方法は、結合が、光活性化事象を誘発することである。別の例は、結合が生じるまで標識をクエンチすることである(例えば、分子ビーコン)。別の例は、シグナルを、エネルギー移動事象(例えば、FRET、CRET、BRET)の結果として検出することである。一部の実施形態では、標的核酸であるバイオポリマーが、ドナーに結合し、試験基板である表面にあり、オリゴヌクレオチドプローブ種であるプローブが、アクセプターに結合する(またはその逆)。別の実施形態では、挿入色素は、溶液中に提供され、標識されたプローブが結合すると、挿入色素と標識されたプローブとの間にFRET相互作用が存在する。挿入色素の例は、YOYO-1であり、プローブ上の標識の例は、ATTO655である。別の実施形態では、挿入は、FRET機構なしで使用される色素であり、試験基板または他の表面上の一本鎖標的核酸およびオリゴヌクレオチドプローブ種の両方が非標識であり、シグナルは、挿入色素が挿入され得る相補二本鎖を、結合が生成する場合にのみ、検出され得る。挿入色素は、二重鎖核酸に挿入されておらず、代わりに溶液中に遊離している場合、その同一性に応じて、輝度が100分の1または1000分の1以下である。一部の実施形態では、TIRFまたは薄層斜光照明(HILO)(例えば、Mertz et al.,J.of Biomedical Optics,15(1):016027,2010)顕微鏡を使用して、溶液中の挿入色素から任意のバックグラウンドシグナルを排除する。 In some embodiments, the concentration of oligonucleotide probe species used reduces background levels by rendering the probe label, the label of the oligonucleotide probe species, essentially non-fluorescent until they bind. Increased without significant elevation. One way to do this is for binding to trigger a photoactivation event. Another example is to quench the label until binding occurs (eg molecular beacons). Another example is detecting a signal as a result of an energy transfer event (eg, FRET, CRET, BRET). In some embodiments, a target nucleic acid, a biopolymer, is attached to a donor, a test substrate, a surface, and an oligonucleotide probe species, a probe, is attached to an acceptor (or vice versa). In another embodiment, the intercalating dye is provided in solution and upon binding of the labeled probe there is a FRET interaction between the intercalating dye and the labeled probe. An example of an intercalating dye is YOYO-1 and an example of a label on the probe is ATTO655. In another embodiment, the intercalating is a dye used without a FRET mechanism, both the single-stranded target nucleic acid and the oligonucleotide probe species on the test substrate or other surface are unlabeled, and the signal is intercalating Complementary duplexes into which the dye can intercalate can only be detected when binding occurs. The intercalating dye is 100-fold or 1000-fold less bright, depending on its identity, when it is not intercalated into a double-stranded nucleic acid and is instead free in solution. In some embodiments, TIRF or oblique thin-layer illumination (HILO) (e.g., Mertz et al., J. of Biomedical Optics, 15(1):016027, 2010) microscopy is used to intercalate dyes in solution. Eliminate any background signal from

一部の実施形態では、試験基板または他の表面上のシグナルの検出を不明瞭にさせ得る高いバックグラウンド蛍光の低減(不明瞭化は、高濃度の標識プローブから生じ得る)。一部の実施形態では、これは、試験基板または他の表面上に形成される二重鎖を標識するためのDNA染色剤または挿入色素を利用することによって対処される。色素は、標的核酸が一本鎖である場合も、一本鎖プローブにも挿入されない可能性があるが、オリゴヌクレオチドプローブ種と標的核酸との間に二重鎖が形成された場合、挿入色素が挿入される。一部の実施形態では、オリゴヌクレオチドプローブ種は非標識であり、検出されるシグナルは、挿入色素のみから生じ得る。一部の実施形態では、オリゴヌクレオチドプローブ種は、挿入色素またはDNA染色剤に対するFRETパートナーとして機能し得る標識で標識される。一部の実施形態では、挿入色素はドナーであり、異なる波長のアクセプターと結合され得、したがって、オリゴヌクレオチドプローブ種を複数のフルオロフォアでコードすることが可能になる。 In some embodiments, reduction of high background fluorescence that can obscure the detection of signal on test substrates or other surfaces (obscuring can result from high concentrations of labeled probes). In some embodiments, this is addressed by utilizing DNA stains or intercalating dyes to label duplexes formed on test substrates or other surfaces. The dye may not intercalate into a single-stranded probe or if the target nucleic acid is single-stranded, but if a duplex is formed between the oligonucleotide probe species and the target nucleic acid, the intercalating dye is inserted. In some embodiments, the oligonucleotide probe species are unlabeled and the detected signal can come from the intercalating dye alone. In some embodiments, the oligonucleotide probe species are labeled with a label that can serve as a FRET partner for intercalating dyes or DNA stains. In some embodiments, the intercalating dye is a donor and can be conjugated with acceptors of different wavelengths, thus allowing the oligonucleotide probe species to be encoded with multiple fluorophores.

一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種に相補的な各標的核酸部位に関連する光学活性または結合事象の複数の事例を検出し得る。一部の実施形態では、複数の事象は、単一のオリゴヌクレオチドプローブ分子のオンおよびオフ結合からのもの、オリゴヌクレオチドプローブ種の亜種のオンおよびオフ結合からのもの、またはオリゴヌクレオチドプローブ種のオンおよびオフ結合からのもの、ならびに前述の結合事象の任意の組み合わせ(単一、亜種、または種のオリゴヌクレオチドプローブ)からのものであり、複数回生じ得る。一部の実施形態では、オン結合またはオフ結合の速度は、条件の変化によって影響を受けない場合がある。例えば、オン結合およびオフ結合の両方が、同じ条件下(例えば、塩濃度、温度など)で生じ、プローブ・標的相互作用が弱いことに起因する。 In some embodiments, the exposure process can detect multiple instances of optical activity or binding events associated with each target nucleic acid site complementary to the oligonucleotide probe species. In some embodiments, the multiple events are from on and off binding of a single oligonucleotide probe molecule, from on and off binding of subspecies of an oligonucleotide probe species, or from on and off binding of a subspecies of an oligonucleotide probe species. from on and off binding, as well as from any combination of the aforementioned binding events (single, subspecies, or species oligonucleotide probes), and can occur multiple times. In some embodiments, on- or off-binding kinetics may not be affected by changes in conditions. For example, both on- and off-binding occur under the same conditions (eg, salt concentration, temperature, etc.) and result from weak probe-target interactions.

一部の実施形態では、配列決定は、(より短い、同じ長さの、またはオリゴヌクレオチドプローブ種の長さの桁内の)単一の標的核酸上の複数の場所での光学活性またはオン・オフ結合事象の複数の事例を撮像することによって行われる。かかる実施形態では、より長い標的核酸が断片化されるか、または断片のパネルが予め選択され、試験基板または他の表面上に配列されており、そのため、各標的核酸分子は、個別に解像可能である。これらの場合、光学活性の事例の頻度もしくは持続時間、またはオリゴヌクレオチドプローブ種の特定の場所への結合を使用して、オリゴヌクレオチドプローブ種が標的核酸配列に完全に相補的であるかどうかを決定する。オリゴヌクレオチドプローブ種の結合の頻度または持続時間により、オリゴヌクレオチドプローブ種が標的核酸配列のすべてまたは一部に相補的であるかどうか(残りの塩基は不一致またはオーバーハングである)決定され得る。 In some embodiments, sequencing comprises optically active or on-site at multiple locations on a single target nucleic acid (shorter, of the same length, or within an order of magnitude of the length of the oligonucleotide probe species). This is done by imaging multiple instances of off-coupling events. In such embodiments, longer target nucleic acids are fragmented, or panels of fragments are preselected and arrayed on a test substrate or other surface, so that each target nucleic acid molecule can be resolved individually. It is possible. In these cases, the frequency or duration of instances of optical activity, or binding of the oligonucleotide probe species to a particular location, is used to determine whether the oligonucleotide probe species is perfectly complementary to the target nucleic acid sequence. do. The frequency or duration of binding of the oligonucleotide probe species can determine whether the oligonucleotide probe species is complementary to all or part of the target nucleic acid sequence (the remaining bases being mismatched or overhanging).

一部の実施形態では、標的核酸間の横並び(side-by-side)の重複の発生が、一部の実施形態では、DNA染色剤からの蛍光の増加によって検出される。一部の実施形態では、染色剤が使用されなくてもよく、重複は、名目上単一であるが実際には重複した対の標的核酸の領域内の見かけの結合部位の頻度の増加によって検出される。例えば、回折限界分子が光学的に重複しているように見えるが、実際には物理的に重複していない可能性があるいくつかの事例では、本開示の他箇所に記載されているように、単一分子局在化を使用して超解像される。端部間(end-on-end)の重複が生じる場合、一部の実施形態では、標的核酸のマーキング末端の標識を使用して、並んだ標的核酸を真の連続した長さの単一の標的核酸から区別する。一部の実施形態では、そのような光学キメラは、ゲノムまたは標的配列の多くのコピーが予想され、見かけのキメラの出現が1回だけ見出される場合、アーティファクトとして却下される。一部の実施形態では、標的核酸の末端(回折限界)が光学的に重複して見えるが、物理的に重複していない場合、それらは、本開示の方法によって解像される。一部の実施形態では、場所決定は、非常に正確であり、そのため、非常に近い標識から発せられるシグナルが解像される。 In some embodiments, the occurrence of side-by-side overlap between target nucleic acids is detected, in some embodiments, by an increase in fluorescence from the DNA stain. In some embodiments, no staining agent may be used, and overlap is detected by an increase in the frequency of apparent binding sites within regions of nominally single but actually overlapping pairs of target nucleic acids. be done. For example, in some cases where diffraction-limited molecules appear to overlap optically but may not actually overlap physically, as described elsewhere in this disclosure, , super-resolved using single-molecule localization. Where end-on-end overlap occurs, in some embodiments labels at the marked ends of the target nucleic acids are used to divide the aligned target nucleic acids into a true contiguous length of single Distinguish from target nucleic acid. In some embodiments, such optical chimeras are dismissed as artifacts when many copies of the genome or target sequence are expected and only one appearance of the apparent chimera is found. In some embodiments, if the ends of the target nucleic acid (diffraction limited) appear optically overlapping, but not physically overlapping, they are resolved by the methods of the present disclosure. In some embodiments, localization is so precise that signals emitted from very close labels are resolved.

一部の実施形態では、配列決定は、オリゴヌクレオチドプローブ種よりも長い単一の標的核酸上の複数の場所での光学活性またはオン・オフ結合事象の複数の事例を撮像することによって行われる。一部の実施形態では、単一の標的核酸にわたる光学活性またはプローブ結合事象の事例の場所が決定される。一部の実施形態では、単一の標的核酸にわたる光学活性または結合事象のオリゴヌクレオチドプローブ種の事例の場所は、標的核酸を伸長することによって決定され、そのため、標的核酸の長さに沿った光学活性または結合事象の事例の異なる場所が検出され、解像される。 In some embodiments, sequencing is performed by imaging multiple instances of optical activity or on-off binding events at multiple locations on a single target nucleic acid that is longer than the oligonucleotide probe species. In some embodiments, the locations of instances of optical activity or probe binding events across a single target nucleic acid are determined. In some embodiments, the location of an oligonucleotide probe species instance of optical activity or binding event across a single target nucleic acid is determined by elongating the target nucleic acid, so that optical activity along the length of the target nucleic acid is determined. Different locations of instances of activity or binding events are detected and resolved.

一部の実施形態では、非結合オリゴヌクレオチドプローブ種の光学活性を、標的核酸に結合したオリゴヌクレオチドプローブ種から区別することは、結合していないオリゴヌクレオチドプローブ種からのシグナルの拒絶(rejection)または除去(removal)を必要とし得る。一部のかかる実施形態では、これは、例えば、照明のためにエバネッセント場または波導を利用することによって、またはFRETペア標識を利用することによって、または光活性化を利用して、特定の場所でオリゴヌクレオチドプローブ種を検出することによって、実現される(例えば、Hylkje et al.,Biophys J.2015;108(4):949-956に記載されている)。 In some embodiments, distinguishing the optical activity of the unbound oligonucleotide probe species from the oligonucleotide probe species bound to the target nucleic acid is the rejection of signal from the unbound oligonucleotide probe species or May require removal. In some such embodiments, this can be achieved at specific locations, for example, by utilizing evanescent fields or wave guidance for illumination, or by utilizing FRET pair labeling, or by utilizing photoactivation. This is accomplished by detecting oligonucleotide probe species (described, for example, in Hylkje et al., Biophys J. 2015;108(4):949-956).

一部の実施形態では、図13A~13Cに示されるように、オリゴヌクレオチドプローブ種は、標識されていなくてもよいが、標的との相互作用が、結合が生じるかまたは生じた場合(例えば、図13A~図13Cに示されるように)、二重鎖に挿入されて蛍光を発する(挿入された色素1304のように)、結合していない挿入色素1302などのDNA染色剤を使用して検出される。一部の実施形態では、1つ以上の挿入色素は、標的核酸とオリゴヌクレオチドプローブ種との間の単一の二重鎖に、任意の時点で挿入され得る。一部の実施形態では、挿入された挿入色素によって発光される蛍光は、溶液中で浮遊する遊離状態の非結合挿入色素からの蛍光よりも桁違いに大きい。例えば、挿入されたYOYO-1色素からのシグナルは、溶液中の遊離したYOYO-1色素からのシグナルよりも約100倍大きい。一部の実施形態では、軽く染色された(または部分的に光退色された)二本鎖ポリヌクレオチドが撮像される場合、観察されるポリヌクレオチドに沿った個々のシグナルは、単一の挿入色素分子に対応し得る。二重鎖におけるYOYO-1色素の交換を促進し、明るいシグナルを得るために、一部の実施形態では、結合緩衝液中に、メチルビオローゲンおよびアスコルビン酸を含むレドックス酸化系(ROX)が提供される。 In some embodiments, as shown in Figures 13A-13C, the oligonucleotide probe species may be unlabeled, but interaction with the target occurs when binding occurs or occurs (e.g., Detected using a DNA stain such as unbound intercalating dye 1302 that intercalates into the duplex and fluoresces (like intercalating dye 1304), as shown in FIGS. 13A-13C). be done. In some embodiments, one or more intercalating dyes can intercalate into a single duplex between the target nucleic acid and the oligonucleotide probe species at any time. In some embodiments, the fluorescence emitted by the intercalated intercalating dye is orders of magnitude greater than the fluorescence from free, unbound intercalating dye floating in solution. For example, the signal from intercalated YOYO-1 dye is approximately 100-fold greater than the signal from free YOYO-1 dye in solution. In some embodiments, when a lightly stained (or partially photobleached) double-stranded polynucleotide is imaged, the individual signal along the observed polynucleotide is a single intercalating dye. It can correspond to a molecule. To facilitate exchange of the YOYO-1 dye in the duplex and obtain a bright signal, in some embodiments a redox oxidation system (ROX) comprising methylviologen and ascorbic acid is provided in the binding buffer. be.

一部の実施形態では、単一の色素分子で標識された個々のヌクレオチドの組み込みを検出することによる単一標的核酸上での配列決定(例えば、HelicosおよびPacBioの配列決定によって実現されるような)は、色素が検出されない場合、エラーが導入され得る。場合によっては、これは、ヌクレオチドがもはや色素に結合されていないか、単一ヌクレオチド結合事象が検出するには短すぎるか、色素が光退色されているか、色素の点滅により検出された累積シグナルが弱いか、色素の発光が弱すぎるか、または色素が長い暗い光物理状態に入るためである。一部の実施形態では、これは、いくつかの代替的な方法で克服される。第一に、好ましい光物理的特性を有する強力な個々の色素(例えば、Cy3B)でヌクレオチドを標識することである。別の例は、光退色および暗い光物理的状態(例えば、β-メルカプトエタノール、Trolox、ビタミンCおよびその誘導体、レドックス系)を低減する緩衝液条件および添加剤を提供することである。別の例は、光への曝露を最小化することである(例えば、より短い曝露を必要とするより高感度の検出器を有すること、またはストロボ照明を提供すること)。第二に、単一の色素の代わりに、量子ドット(例えば、Qdot655)、フルオロスフィア、ナノダイヤモンド、プラズモン共鳴粒子、光散乱粒子などのナノ粒子で、ヌクレオチドを標識することである。別の例は、単一の色素ではなく、ヌクレオチド当たり多くの色素を有することである(例えば、図14Cおよび図14Dに示されているように)。この場合、複数の色素1414は、それらの自己消光を最小化するように(例えば、それらを十分に離してDNA折り紙などの剛性ナノ構造1412を使用して)、または剛性リンカーを介した線形間隔で組織化される。 In some embodiments, sequencing on a single target nucleic acid by detecting incorporation of individual nucleotides labeled with a single dye molecule (e.g., as realized by Helicos and PacBio sequencing). ) can introduce error if the dye is not detected. In some cases, this is because the nucleotide is no longer bound to the dye, single nucleotide binding events are too short to detect, the dye is photobleached, or the cumulative signal detected by blinking of the dye is Either it is weak, the emission of the dye is too weak, or the dye enters a long dark photophysical state. In some embodiments, this is overcome in some alternative way. The first is to label the nucleotides with strong individual dyes (eg Cy3B) with favorable photophysical properties. Another example is to provide buffer conditions and additives that reduce photobleaching and dark photophysics (eg, β-mercaptoethanol, Trolox, vitamin C and its derivatives, redox systems). Another example is minimizing exposure to light (eg, having a more sensitive detector that requires shorter exposures, or providing stroboscopic illumination). Second, labeling nucleotides with nanoparticles such as quantum dots (eg, Qdot655), fluorospheres, nanodiamonds, plasmon resonance particles, light scattering particles, etc., instead of single dyes. Another example is to have many dyes per nucleotide rather than a single dye (eg, as shown in Figures 14C and 14D). In this case, multiple dyes 1414 are spaced to minimize their self-quenching (e.g., by spacing them well apart using rigid nanostructures 1412 such as DNA origami) or linearly spaced via rigid linkers. organized in

一部の実施形態では、検出誤差率は、溶液中の尿素、アスコルビン酸またはその塩、イソアスコルビン酸またはその塩、β-メルカプトエタノール(BME)、DTT、レドックス系、またはTroloxから選択される1つ以上の化合物の存在下で、さらに低減される(および、シグナル寿命が延びる)。 In some embodiments, the detection error rate is selected from urea in solution, ascorbic acid or salts thereof, isoascorbic acid or salts thereof, β-mercaptoethanol (BME), DTT, redox systems, or Trolox. Further reduction (and increased signal lifetime) in the presence of one or more compounds.

一部の実施形態では、標的核酸単独へのプローブの一過的な結合は、色素光物理学による誤差を低減するのに十分である。曝露プロセス中に得られた情報は、異なる標識オリゴヌクレオチドプローブ種の多くのオン/オフ相互作用の集約である。したがって、標識を欠いているか、単一の結合事象を適切に検出するには短すぎるか、標識が光退色されているか、または暗状態にある場合でも、標的核酸に結合する他のオリゴヌクレオチドプローブ種上の標識は、すべて標識を欠いているわけではないか、検出するには短すぎる結合事象を有するか、光退色されているか、または標識が暗状態にあり、したがって、一部の実施形態では、それらの結合部位の場所に関する情報を提供することになる。 In some embodiments, transient binding of the probe to the target nucleic acid alone is sufficient to reduce errors due to dye photophysics. The information obtained during the exposure process is an aggregation of many on/off interactions of different labeled oligonucleotide probe species. Thus, other oligonucleotide probes that bind to the target nucleic acid even if they lack label, are too short to adequately detect a single binding event, have photobleached label, or are in the dark The labels on the species are not all devoid of label, have binding events that are too short to detect, are photobleached, or are in a dark state, thus in some embodiments will provide information on the location of their binding sites.

一部の実施形態では、各一過的な結合事象における標識からの光学活性シグナルの事例は、二次元撮像デバイスの2つ以上の画素をカバーする光路(典型的には、拡大率を提供する)を通して投影される。光学活性シグナルの事例に対する点広がり関数(PSF)が決定され、PSFの重心が光学活性シグナルの事例の正確な場所として使用される。一部の実施形態では、位置決定は、サブ回折(例えば、超解像)およびサブナノメートル正確度でさえ決定される。位置決定の正確度は、収集された光子数に反比例する。したがって、蛍光標識によって1秒当たりに放出される光子が多いほど、またはより長く光子が収集されるほど、正確度が高くなる。 In some embodiments, the instance of optically active signal from the label at each transient binding event provides a light path (typically a magnification factor) covering two or more pixels of a two-dimensional imaging device. ). The point spread function (PSF) for the optically active signal case is determined and the centroid of the PSF is used as the precise location of the optically active signal case. In some embodiments, position determination is determined with sub-diffraction (eg, super-resolution) and even sub-nanometer accuracy. Position determination accuracy is inversely proportional to the number of photons collected. Therefore, the more photons emitted per second by the fluorescent label or the longer the photons are collected, the higher the accuracy.

一実施例では、図10Aおよび図10Bに示されるように、各オリゴヌクレオチドプローブ種の結合部位における光学活性または結合事象の事例の数と、収集された光子数との両方が、達成される局在化の程度と相関する。標的核酸1002の場合、結合部位について記録された最小数の結合事象1004-1および最小数の光子1008-1は、それぞれ、最も低い精度の位置決定1006-1および1010-1と相関する。結合部位について、いくつかの結合事象の数1004-2、1004-3、またはいくつかの記録された光子の数1008-2、1008-3のいずれかが増加するにつれて、位置決定の程度、それぞれ1006-2、1006-3および1010-2、1010-3が増加する。図10Aでは、標的核酸1002を有する標識されたオリゴヌクレオチドプローブ種の光学活性または結合事象(例えば、1004-1、1004-2、1004-4)の異なる数の検出された確率的事例は、プローブ(1006-1、1006-2、1006-3)の異なる程度の位置決定をもたらし、より多くの数の結合事象(例えば、1004-2)は、より高い程度の位置決定(例えば、1006-2)と相関し、より少ない数の結合事象(例えば、1004-1)は、より低い程度の位置決定(例えば、1006-1)と相関する。図10Bでは、同様に、検出される異なる数の光子(例えば、1008-1、1008-2、および1008-3)は、異なる程度の位置決定をもたらす(それぞれ、1010-1、1010-2、および1010-3)。 In one example, as shown in FIGS. 10A and 10B, both the number of instances of optical activity or binding events at the binding site of each oligonucleotide probe species and the number of photons collected are achieved. Correlates with the degree of encroachment. For target nucleic acid 1002, the lowest number of binding events 1004-1 and the lowest number of photons 1008-1 recorded for the binding site correlate with the least accurate localizations 1006-1 and 1010-1, respectively. For binding sites, the degree of localization as either the number of some binding events 1004-2, 1004-3 or the number of recorded photons 1008-2, 1008-3 increases, respectively. 1006-2, 1006-3 and 1010-2, 1010-3 increase. In FIG. 10A, different numbers of detected stochastic instances of optical activity or binding events (e.g., 1004-1, 1004-2, 1004-4) of labeled oligonucleotide probe species with target nucleic acid 1002 are detected by probe (1006-1, 1006-2, 1006-3) result in different degrees of localization, with a greater number of binding events (eg, 1004-2) resulting in a higher degree of localization (eg, 1006-2 ), and a smaller number of binding events (eg, 1004-1) correlate with a lower degree of localization (eg, 1006-1). In FIG. 10B, similarly, different numbers of photons detected (eg, 1008-1, 1008-2, and 1008-3) result in different degrees of localization (1010-1, 1010-2, and 1010-3).

代替的な実施形態では、各一過的な結合事象における標識からのシグナルは、光学倍率経路を介して投影されない場合がある。代わりに、基板(典型的には、標的核酸分子が存在し得る光学的に透明な表面)は、二次元検出器アレイに直接結合される。検出器アレイの画素が小さい場合(例えば、1平方ミクロン以下)、検出器の表面上のシグナルの1対1の投影は、結合シグナルが少なくとも1ミクロン正確度で局在することを可能にし得る。標的核酸が十分に伸展されている(例えば、2キロ塩基の標的核酸が1ミクロンの長さに伸展されている)場合、一部の実施形態では、2キロ塩基間隔のシグナルが解像される。例えば、シグナルが4096塩基ごとまたは2ミクロンごとに生じると予想される、6塩基長プローブの場合、前述の分解能は、個々の結合部位を明確に位置決定するのに十分である。シグナルは、2つの画素と中間場所との間に部分的に発生し得る(例えば、シグナルが2つの画素間にある場合、解像度は、1平方ミクロンの画素について500nmまたはそれよりも良好であり得る)。一部の実施形態では、超解像法は、二次元撮像デバイスと比較して、適切な場所に標的核酸を有するシステムのために利用される。そのような場所は、二次元撮像デバイスに使用されるセンサーの種類に応じて変化し得る。例えば、裏面入射型CCDは、前面照射型CCDよりもセンサーの検出面からさらに遠い実際のセンサー領域を有し、両方とも、各画素に不随するナノレンズを利用し得るCCDまたはCMOS撮像デバイスとは著しく異なる。一部の実施形態では、基板は、より高い解像度を提供するために、二次元アレイ検出器に関してXおよび/またはYの寸法で物理的に変換(translated)される(例えば、100nmの増分で)。かかる実施形態では、デバイスまたはシステムは、レンズまたはレンズ間の空間を必要としないため、より小さい(またはより薄い)。一部の実施形態では、基板の変換はまた、分子記憶読み出しを既存のコンピュータおよびデータベースとより互換性のある電子読み出しに直接変換することを提供する。一部の実施形態では、時間分解蛍光が利用され、蛍光寿命を捕捉するために利用されるか、または単に励起バックグラウンドを排除するために使用される。 In alternative embodiments, the signal from the label at each transient binding event may not be projected through the optical magnification path. Alternatively, a substrate (typically an optically transparent surface on which target nucleic acid molecules may reside) is directly attached to a two-dimensional detector array. If the pixels of the detector array are small (eg, one square micron or less), a one-to-one projection of the signal on the surface of the detector may allow the bound signal to be localized with at least one micron accuracy. If the target nucleic acid is sufficiently stretched (e.g., a 2 kilobase target nucleic acid is stretched to a length of 1 micron), in some embodiments signals at 2 kilobase intervals are resolved. . For example, for a 6-base long probe, where signal is expected to occur every 4096 bases or every 2 microns, the resolution described above is sufficient to unambiguously localize individual binding sites. A signal may occur partially between two pixels and an intermediate location (e.g., if the signal is between two pixels, the resolution may be 500 nm or better for a 1 square micron pixel). ). In some embodiments, super-resolution methods are utilized for systems that have target nucleic acids in place relative to two-dimensional imaging devices. Such locations may vary depending on the type of sensor used in the two-dimensional imaging device. For example, back-thinned CCDs have an actual sensor area farther from the sensing plane of the sensor than front-illuminated CCDs, both of which can utilize nanolenses associated with each pixel. different. In some embodiments, the substrate is physically translated in the X and/or Y dimensions with respect to the two-dimensional array detector (eg, in 100 nm increments) to provide higher resolution. . In such embodiments, the device or system is smaller (or thinner) because it does not require lenses or spaces between lenses. In some embodiments, conversion of the substrate also provides direct conversion of molecular storage readouts into electronic readouts that are more compatible with existing computers and databases. In some embodiments, time-resolved fluorescence is utilized to capture fluorescence lifetimes or simply to eliminate excitation background.

一部の実施形態では、光学活性または結合事象の高速の一過的な事例を捕捉するために、捕捉フレームレートが増加し、データ転送速度が標準顕微鏡技術よりも増加する。一部の実施形態では、曝露プロセスの速度は、高フレームレートをプローブの濃度の増加と結合することによって増加する。しかしながら、最大フレームレートは、各フレームに関連する取得シグナルと比較して、電子ノイズを低減するのに適切である。200ミリ秒露光の電子ノイズは、単一の100ミリ秒露光と同じであるが、単一の200ミリ秒露光と2つの100ミリ秒露光を比較すると、2の平方根と同じくらい高くなる。 In some embodiments, capture frame rates are increased and data transfer rates are increased over standard microscopy techniques to capture fast transient instances of optical activity or binding events. In some embodiments, the speed of the exposure process is increased by combining high frame rates with increased concentrations of probe. However, the maximum frame rate is adequate to reduce electronic noise compared to the acquired signal associated with each frame. The electronic noise of a 200 ms exposure is the same as a single 100 ms exposure, but is as high as the square root of 2 when comparing a single 200 ms exposure to two 100 ms exposures.

より高速のCMOSカメラが利用可能になり、より高速の撮像が可能になってきている。例えば、Andor Zyla Plusは、USB3.0接続のみで、512x1024画素平方で、最大398フレーム/秒を可能にし、限られた関心領域(ROI)(画素数が少ない)またはCameraLink接続を使用する場合、さらに高速である。 Higher speed CMOS cameras are becoming available, enabling higher speed imaging. For example, the Andor Zyla Plus allows up to 398 frames per second at 512x1024 pixels square with only a USB 3.0 connection, and when using a limited region of interest (ROI) (low pixel count) or CameraLink connection: It's even faster.

一部の実施形態では、高速撮像を実現し得るシステムは、ガルボミラーまたはデジタルマイクロミラーを使用して、時間的に増分された画像を異なるセンサーに送信し得る。動画のフレームの正しい順序は、異なるセンサーからのフレームを取得時間に応じてインターリーブすることによって再構築される。 In some embodiments, systems that can achieve high speed imaging may use galvo mirrors or digital micromirrors to transmit temporally incremented images to different sensors. The correct order of the frames of the video is reconstructed by interleaving frames from different sensors according to acquisition time.

一部の実施形態では、一過的な結合プロセスは、塩濃度などの様々な生化学パラメータを調整することによって高速化することができる。高フレームレートのカメラがいくつか存在し、それを、結合の速度を一致させるために使用することができ、多くの場合、視野を制限して、画素のサブセットからより高速な読み出しを得ている。一部の実施形態では、ガルバノメーターミラーは、単一のセンサーの異なる領域に連続したシグナルを時間的に分配するために、またはセンサーを分離するために利用される。後者は、センサーの全視野の利用を可能にするが、分配されたシグナルがコンパイルされると、全体的な時間分解能が向上する。 In some embodiments, the transient binding process can be sped up by adjusting various biochemical parameters such as salt concentration. There are some high frame rate cameras that can be used to match the speed of binding, often with a limited field of view to get faster readout from a subset of pixels. . In some embodiments, galvanometer mirrors are utilized to temporally distribute sequential signals to different regions of a single sensor or to separate sensors. The latter allows utilization of the full field of view of the sensor, but improves overall temporal resolution when the distributed signals are compiled.

複数の結合事象のデータセットの構築。
ブロック218。一部の実施形態では、曝露および測定プロセスは、オリゴヌクレオチドプローブ種のセットの個々のオリゴヌクレオチドプローブ種について反復され、それによって、試験基板上の光学活性または結合事象の複数の位置のセット、オリゴヌクレオチドプローブ種のセットの単一のオリゴヌクレオチドプローブ種に対応する試験基板上の光学活性または結合事象の各それぞれの位置のセットを得る。
Building a dataset of multiple binding events.
block 218; In some embodiments, the exposure and measurement process is repeated for each oligonucleotide probe species of the set of oligonucleotide probe species, thereby providing a set of multiple locations of optical activity or binding events on the test substrate, the oligo A set of positions for each respective optical activity or binding event on the test substrate corresponding to a single oligonucleotide probe species of the set of nucleotide probe species is obtained.

一部の実施形態では、オリゴヌクレオチドプローブのセットは、オリゴヌクレオチドプローブの複数のサブセットを含み得、オリゴヌクレオチドプローブの複数のサブセットの種のオリゴヌクレオチドプローブの種の各それぞれのサブセットについて、反復して曝露および測定プロセスが行われる。 In some embodiments, the set of oligonucleotide probes may comprise a plurality of subsets of oligonucleotide probes, wherein for each respective subset of the species of oligonucleotide probes of the species of the plurality of subsets of oligonucleotide probes, repeat An exposure and measurement process takes place.

一部の実施形態では、オリゴヌクレオチドプローブ種の各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセットからの2つ以上の異なるオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブ種の各それぞれのサブセットは、オリゴヌクレオチドプローブ種のセット由来の4つ以上の異なるオリゴヌクレオチドプローブ種を含み得る。一部の実施形態では、オリゴヌクレオチドプローブのセットは、オリゴヌクレオチドプローブ種の4つのサブセットを含み得る。 In some embodiments, each respective subset of oligonucleotide probe species may comprise two or more different oligonucleotide probe species from the set of oligonucleotide probe species. In some embodiments, each respective subset of oligonucleotide probe species may comprise four or more different oligonucleotide probe species from the set of oligonucleotide probe species. In some embodiments, a set of oligonucleotide probes may comprise four subsets of oligonucleotide probe species.

一部の実施形態では、本方法は、各オリゴヌクレオチドプローブ種の計算されたまたは実験的に導出された融解温度に基づいて、オリゴヌクレオチドプローブ種のセットを、オリゴヌクレオチドプローブ種の複数のサブセットに分割することをさらに含み得る。同様の融解温度を有するオリゴヌクレオチドプローブ種を、分割によってオリゴヌクレオチドプローブの同じサブセットに配置する。さらに、曝露プロセスの温度または持続時間は、オリゴヌクレオチドプローブ種の対応するサブセットのオリゴヌクレオチドプローブ種の平均融解温度によって決定される。 In some embodiments, the method divides the set of oligonucleotide probe species into a plurality of subsets of oligonucleotide probe species based on the calculated or experimentally derived melting temperature of each oligonucleotide probe species. It can further include dividing. Oligonucleotide probe species with similar melting temperatures are placed into the same subset of oligonucleotide probes by partitioning. Additionally, the temperature or duration of the exposure process is determined by the average melting temperature of the oligonucleotide probe species of the corresponding subset of oligonucleotide probe species.

一部の実施形態では、本方法は、各オリゴヌクレオチドプローブ種の配列に基づいて、オリゴヌクレオチドプローブのセットを、オリゴヌクレオチドプローブの複数のサブセットに分割することをさらに含み得、配列が重複しているオリゴヌクレオチドプローブ種は、異なるサブセットに配置される。 In some embodiments, the method may further comprise dividing the set of oligonucleotide probes into a plurality of subsets of oligonucleotide probes based on the sequence of each oligonucleotide probe species, wherein the sequences overlap. The oligonucleotide probe species present are arranged in different subsets.

一部の実施形態では、曝露および測定プロセスを反復することは、オリゴヌクレオチドプローブ種のセットの各単一のオリゴヌクレオチドプローブ種に対して行われる。 In some embodiments, repeating the exposure and measurement process is performed for each single oligonucleotide probe species of the set of oligonucleotide probe species.

一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の温度で行われ、曝露および測定プロセスを反復することは、第1のオリゴヌクレオチドプローブ種の曝露および測定プロセスを、第2の温度で行うことを含み得る。 In some embodiments, the exposing process is performed at a first temperature for a first oligonucleotide probe species of the set of oligonucleotide probe species, and repeating the exposing and measuring process comprises The exposing and measuring process of the oligonucleotide probe species can include performing at a second temperature.

一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の温度で行われ得る。曝露および測定プロセスを反復する事例は、第1のオリゴヌクレオチドプローブ種に対する曝露および測定プロセスを、複数の異なる温度の各々で行うことを含み得る。本方法は、複数の異なる温度の第1の温度および各温度についての曝露および測定プロセスによって決定された光学活性の事例の測定された場所、および任意選択的に、持続時間を使用して、第1のオリゴヌクレオチドプローブ種の融解曲線を構築することをさらに含み得る。 In some embodiments, the exposure process can occur at a first temperature for a first oligonucleotide probe species of a set of oligonucleotide probe species. An instance of repeating the exposure and measurement process may include performing the exposure and measurement process for the first oligonucleotide probe species at each of a plurality of different temperatures. The method uses a first temperature of a plurality of different temperatures and the measured locations, and optionally durations, of the instances of optical activity determined by the exposure and measurement process for each temperature to generate a second It can further comprise constructing a melting curve of one oligonucleotide probe species.

一部の実施形態では、試験基板は、曝露および測定プロセスを反復する前に洗浄され、それによって、試験基板を異なる1つ以上のオリゴヌクレオチドプローブ種に曝露する前に、試験基板から1つ以上のそれぞれのオリゴヌクレオチドプローブ種を除去する。任意選択的に、第1のオリゴヌクレオチドプローブ種を1つ以上の洗浄液で置換し、次いで、異なる1つ以上のオリゴヌクレオチドプローブ種を添加する。 In some embodiments, the test substrate is washed prior to repeating the exposure and measurement process, thereby removing one or more ions from the test substrate prior to exposing the test substrate to one or more different oligonucleotide probe species. , each oligonucleotide probe species is removed. Optionally, one or more wash solutions are substituted for the first oligonucleotide probe species and then one or more different oligonucleotide probe species are added.

一部の実施形態では、試験基板上の結合事象の場所を測定することは、二次元撮像デバイスによって取得されたデータのフレーム内の光学活性のそれぞれの事例の中心を識別および適合するための適合関数を用いて、光学活性のそれぞれの事例を識別および適合することを含み得る。光学活性のそれぞれの事例の中心は、試験基板上の光学活性または結合事象のそれぞれの事例の場所であるとみなされる。 In some embodiments, measuring the location of the binding event on the test substrate is adapted to identify and fit the center of each instance of optical activity within a frame of data acquired by the two-dimensional imaging device. It may involve using a function to identify and fit each instance of optical activity. The center of each instance of optical activity is considered to be the location of each instance of optical activity or binding event on the test substrate.

一部の実施形態では、適合関数は、ガウス関数、一次モーメント関数、勾配ベースのアプローチ、またはフーリエ変換である。ガウス適合は、顕微鏡システムのPSFの近似であるだけでなく、一部の実施形態では、スプライン(例えば、三次スプライン)またはフーリエ変換アプローチの追加は、PSFの中心を決定する正確度を向上させ得る(例えば、Babcock et al.,Sci Rep.7:552,2017およびZhang et al.,46:1819-1829,2007に記載されている)。 In some embodiments, the fitness function is a Gaussian function, first moment function, gradient-based approach, or Fourier transform. A Gaussian fit is not only an approximation of the PSF of a microscope system, but in some embodiments the addition of a spline (e.g., cubic spline) or Fourier transform approach may improve the accuracy of determining the center of the PSF. (See, eg, Babcock et al., Sci Rep. 7:552, 2017 and Zhang et al., 46:1819-1829, 2007).

一部の実施形態では、測定プロセスの完了後、オリゴヌクレオチドプローブ種の単一の名目上の結合場所についての光学活性の位置のセットは、決定された位置および識別されたオリゴヌクレオチドプローブ種を有し(例えば、検出された発光波長により)、プロセスは、セットからのどのオリゴヌクレオチドプローブ種が、標的核酸への重複した名目上の結合場所を有するかを決定することができる(例えば、どれが、例えば、異なる数の検出される光子により、異なるオリゴヌクレオチドプローブ種について異なる決定された許容範囲内の同じナノメトリック場所に結合するか)。一例では、ナノメトリック場所は、中心が1nm(+/-0.5nm)の精度で定義され、したがって、それぞれのPSF重心の重複についてのそれぞれの精度または許容度が一緒にビニングされるであろう。各単一の定義されたオリゴヌクレオチドプローブ種は、適切な精度または許容度(ナノメートルまたはサブメートル)で、ナノメートル(またはサブナノメートル)の重心への正確な局在を可能にするために、複数回結合し得る(例えば、放出および収集される光子数に応じて)。 In some embodiments, after completion of the measurement process, the set of optically active positions for a single nominal binding site of the oligonucleotide probe species has the determined position and the identified oligonucleotide probe species. (e.g., by the detected emission wavelength), the process can determine which oligonucleotide probe species from the set have overlapping nominal binding sites on the target nucleic acid (e.g., which , e.g., different numbers of detected photons bind to the same nanometric location within different determined tolerances for different oligonucleotide probe species). In one example, the nanometric locations are defined with an accuracy of 1 nm (+/- 0.5 nm) on the center, so the respective accuracy or tolerance for overlap of the respective PSF centroids will be binned together. . Each single defined oligonucleotide probe species is Can couple multiple times (eg, depending on the number of photons emitted and collected).

一部の実施形態では、ナノメトリックまたはサブナノメトリックの位置決定は、例えば、5’-AGTCG-3’のオリゴヌクレオチドプローブ種配列の、第1の塩基がAであり、第2の塩基がGであり、第3の塩基がTであり、第4の塩基がCであり、第5の塩基Gであると決定してもよい。このようなパターンは、5’-CGACT-3’の標的配列を示唆する。したがって、すべての単一塩基が定義された1024個の5塩基長のオリゴヌクレオチドプローブ種は、上に記載されるプローブコーディングシステムを使用して、5サイクルを使用して、適用または試験され、各サイクルは、プロセスを曝露、決定、および反復することを含み得、オリゴヌクレオチドプローブ種プールの添加ステップおよび洗浄ステップの両方をさらに含み得る。一部の実施形態では、オリゴヌクレオチド[プローブ種のプール中の各特異的オリゴヌクレオチドプローブ種の濃度は、単独で使用する場合よりも低い。一部の実施形態では、データの取得は、異なるオリゴヌクレオチドプローブ種間の競合の潜在的な結果として、結合事象の閾値数に達するために、曝露プロセス中に、より長い時間またはより多くのフレームが取得される。一部の実施形態では、縮重塩基または普遍的塩基を利用し得るより高い濃度のオリゴヌクレオチドプローブ種を、縮重塩基または普遍的塩基を有しない同じk塩基長の種の長さのオリゴヌクレオチドプローブ種として使用される。一部の実施形態では、コードスキームは、オリゴヌクレオチドプローブ種の直接標識化によって、例えば、オリゴヌクレオチドプローブ種の3’または5’位置で標識を合成またはコンジュゲートすることによって実現される。しかしながら、一部の代替的な実施形態では、これは、間接的な標識によって(例えば、本明細書に記載されるように、フラップ配列を各標識オリゴに付着させることによって)行われる。 In some embodiments, the nanometric or sub-nanometric positioning is an oligonucleotide probe seed sequence of, for example, 5′-AGTCG-3′, where the first base is A and the second base is G. , the third base is T, the fourth base is C, and the fifth base is G. Such a pattern suggests a target sequence for 5'-CGACT-3'. Thus, 1024 5 base long oligonucleotide probe species with all single bases defined were applied or tested using 5 cycles using the probe coding system described above, each A cycle may comprise exposing, determining, and repeating the process, and may further comprise both addition and washing steps of the oligonucleotide probe species pool. In some embodiments, the concentration of each specific oligonucleotide probe species in the oligonucleotide [probe species pool is lower than when used alone. In some embodiments, data acquisition takes longer or more frames during the exposure process to reach a threshold number of binding events, potentially as a result of competition between different oligonucleotide probe species. is obtained. In some embodiments, higher concentrations of oligonucleotide probe species that can utilize degenerate bases or universal bases are added to oligonucleotides of the same k-base length species without degenerate or universal bases. Used as probe species. In some embodiments, the coding scheme is achieved by direct labeling of the oligonucleotide probe species, e.g., by synthesizing or conjugating a label at the 3' or 5' position of the oligonucleotide probe species. However, in some alternative embodiments, this is done by indirect labeling (eg, by attaching a flap sequence to each labeled oligo, as described herein).

一部の実施形態では、各オリゴヌクレオチドプローブ種の場所は、その場所についての複数の結合事象のPSFを決定することによって正確に定義され、次いで、オフセット結合事象からの部分的な配列重複(および、利用可能な場合、二重鎖形態の標的核酸の相補鎖からデータ)によって裏付けられ得る。本明細書に記載される一部の実施形態は、1または数ナノメートルへのプローブ結合の単一分子局在化に高度に依存している。 In some embodiments, the location of each oligonucleotide probe species is precisely defined by determining the PSF of multiple binding events for that location, followed by partial sequence overlap (and , data from the complementary strand of the target nucleic acid in duplex form, if available). Some embodiments described herein highly rely on single-molecule localization of probe binding to one or a few nanometers.

一部の実施形態では、光学活性のそれぞれの事例は、二次元撮像デバイスによって測定されるように、複数のフレームにわたって持続し得る。試験基板上の場所を測定することは、複数のフレームにわたる光学活性のそれぞれの事例の中心を識別するために、複数のフレームにわたって適合関数を用いて、光学活性のそれぞれの事例を識別および適合することを含む。光学活性のそれぞれの事例の中心は、複数のフレームにわたって試験基板上の光学活性のそれぞれの事例の位置であるとみなされる。一部の実施形態では、適合関数は、複数のフレームの各フレーム上の中心を個別に決定し得る。他の実施形態では、適合関数は、複数のフレームにわたってまとめて光学活性の事例の中心を決定し得る。 In some embodiments, each instance of optical activity may persist over multiple frames, as measured by a two-dimensional imaging device. Measuring locations on the test substrate identifies and fits each instance of optical activity using a fitting function over multiple frames to identify the center of each instance of optical activity over multiple frames. Including. The center of each instance of optical activity is taken to be the location of each instance of optical activity on the test substrate over multiple frames. In some embodiments, the fit function may independently determine the center on each frame of the plurality of frames. In other embodiments, the fit function may be determined jointly over multiple frames to determine the center of the optically active case.

一部の実施形態では、適合は、直接隣接する(例えば、半画素以内の)局在が次のフレームに存在する場合、それらがどれだけ明るいかによって重み付けされ、それらを一緒に平均化し得る追跡ステップを利用することができ、それは、これが光学活性または結合事象の単一の事例であると仮定し得る。しかしながら、光学活性の事例が複数のフレームによって分離される場合(例えば、結合事象間の、少なくとも5フレームのギャップ、少なくとも10フレームのギャップ、少なくとも25フレームのギャップ、少なくとも50フレームのギャップ、または少なくとも100フレームのギャップ)、適合機能は、それらが異なる結合事象であると仮定し得る。光学活性または結合事象の異なる事例を追跡することは、配列割当における信頼性を向上させるのに役立ち得る。 In some embodiments, the fit may be weighted by how bright the immediately neighboring (e.g., within half-pixel) localizations are if they are present in the next frame, and average them together. A step can be utilized that can assume that this is a single instance of optical activity or binding event. However, if instances of optical activity are separated by more than one frame (e.g., at least a 5-frame gap, at least a 10-frame gap, at least a 25-frame gap, at least a 50-frame gap, or at least 100 frame gaps between binding events). frame gaps), the fitting function may assume that they are different binding events. Tracking different instances of optical activity or binding events can help improve confidence in sequence assignment.

一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも20nmの位置決定精度で解像し得る。一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に、少なくとも2nm、少なくとも60nm、少なくとも6nmの位置精度で解像し得る。一部の実施形態では、測定は、光学活性のそれぞれの事例の中心を、試験基板上の位置に、2nm~100nmの位置決定精度で解像し得る。一部の実施形態では、測定プロセスは、光学活性のそれぞれの事例の中心を、試験基板上の位置に解像し得、位置は、サブ回折限界の位置であり、サブ回折限界であり得る精度を有する。一部の実施形態では、解像度は、精度よりも限定的である。 In some embodiments, the measurement process can resolve the center of each instance of optical activity to a location on the test substrate with a localization accuracy of at least 20 nm. In some embodiments, the measurement process can resolve the center of each instance of optical activity to a location on the test substrate with a location accuracy of at least 2 nm, at least 60 nm, at least 6 nm. In some embodiments, the measurement can resolve the center of each instance of optical activity to a location on the test substrate with a positioning accuracy of 2 nm to 100 nm. In some embodiments, the measurement process may resolve the center of each instance of optical activity to a location on the test substrate, where the location is a sub-diffraction limit location, and may be sub-diffraction limit accuracy. have In some embodiments, resolution is more limiting than accuracy.

一部の実施形態では、測定プロセスは、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を決定し得、測定プロセスは、光学活性の1つ以上の事例が、場所において5000超個の光子を含んでいることを決定し得る。一部の実施形態では、測定プロセスは、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を決定し得、測定プロセスは、光学活性の1つ以上の事例が、場所において50,000超個の光子、または場所において200,000超個の光子を含んでいることを決定し得る。 In some embodiments, the measurement process may determine the location on the test substrate and, optionally, the duration of each instance of optical activity, wherein the measurement process determines the location of one or more instances of optical activity. may be determined to contain more than 5000 photons at locations. In some embodiments, the measurement process may determine the location on the test substrate and, optionally, the duration of each instance of optical activity, wherein the measurement process determines the location of one or more instances of optical activity. contains more than 50,000 photons at a location, or more than 200,000 photons at a location.

各色素は、光子を生成し得る最大速度(例えば、1KHz~1MHz)を有する。例えば、いくつかの色素は、1秒間に200,000個の光子しか測定できない。色素の典型的な寿命は、10ナノ秒であり、したがって、1秒当たり100,000,000個の光子を放出し、これを収集効率と組み合わせた場合、検出器の量子効率の濾過損失により、検出される1秒当たりの光子が桁違いに少なくなる可能性がある。したがって、一部の実施形態では、試験基板上の場所、および、任意選択的に、光学活性のそれぞれの事例の持続時間を測定することは、関連付けられた場所で、1,000,000個超の光子を測定し得る。 Each dye has a maximum rate (eg, 1 KHz to 1 MHz) at which it can generate photons. For example, some dyes can only measure 200,000 photons per second. The typical lifetime of the dye is 10 nanoseconds, thus emitting 100,000,000 photons per second, and when this is combined with the collection efficiency, the filtering loss in the quantum efficiency of the detector results in Orders of magnitude fewer photons per second can be detected. Thus, in some embodiments, measuring the locations on the test substrate and, optionally, the duration of each instance of optical activity is associated with greater than 1,000,000 photons can be measured.

場合によっては、特定の外れ値配列は、非ワトソン-クリック様式で結合し得るか、または短いモチーフは、異常に高いオン速度または低いオフ速度をもたらし得る。例えば、RNAとDNA間の一部のプリン-ポリプリリミジン相互作用は、非常に強力である(例えば、AGGなどのRNAモチーフ)。これらは、より低いオフ速度を有するだけでなく、核形成配列がより安定なため、より高いオン速度を有する。場合によっては、特定の既知の規則に必ずしも適合しない外れ値から結合が生じる。一部の実施形態では、アルゴリズムは、そのような外れ値を識別するために、またはそのような外れ値の期待値を考慮に入れるために使用される。 In some cases, certain outlier sequences may bind in a non-Watson-Crick fashion, or short motifs may result in abnormally high on-rates or low off-rates. For example, some purine-polypyrimidine interactions between RNA and DNA are very strong (eg, RNA motifs such as AGG). They not only have lower off-rates, but also higher on-rates because the nucleation sequences are more stable. In some cases, binding arises from outliers that do not necessarily conform to certain known rules. In some embodiments, algorithms are used to identify such outliers or to take into account the expected value of such outliers.

一部の実施形態では、光学活性のそれぞれの事例は、試験基板について観察されるバックグラウンドに比べて、所定の数の標準偏差(例えば、3、4、5、6、7、8、9、または10標準偏差を超える)よりも大きい。 In some embodiments, each instance of optical activity has a predetermined number of standard deviations (e.g., 3, 4, 5, 6, 7, 8, 9, or more than 10 standard deviations).

一部の実施形態では、曝露プロセスは、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の期間行われる。一部のかかる実施形態では、曝露および測定プロセスを反復することは、第2の期間、第2のオリゴヌクレオチドプローブ種の曝露プロセスを行うことを含み得る。第1の期間は、第2の期間を超える。 In some embodiments, the exposure process is performed for a first time period on a first oligonucleotide probe species of the set of oligonucleotide probe species. In some such embodiments, repeating the exposure and measurement process can include conducting the exposure process of the second oligonucleotide probe species for a second period of time. The first period of time exceeds the second period of time.

一部の実施形態では、曝露プロセスは、二次元撮像デバイスを使用して、オリゴヌクレオチドプローブ種のセットの第1のオリゴヌクレオチドプローブ種に対して、第1の数のフレームについて行われる。一部のかかる実施形態では、曝露および測定プロセスを反復することは、二次元撮像デバイスを使用して、第2のオリゴヌクレオチドプローブ種に対して、第2の数のフレームについて曝露プロセスを行うことを含み得る。第1のフレーム数は、第2のフレーム数を超える。 In some embodiments, the exposure process is performed for a first number of frames for a first oligonucleotide probe species of a set of oligonucleotide probe species using a two-dimensional imaging device. In some such embodiments, repeating the exposure and measurement process includes performing the exposure process for a second number of frames on the second oligonucleotide probe species using the two-dimensional imaging device. can include The first number of frames exceeds the second number of frames.

一部の実施形態では、1つ以上のタイリングセットの相補オリゴヌクレオチドプローブ種を、変性された二重鎖標的核酸の各鎖に結合させるために使用する。図11Bに示されるように、試験基板上の複数の位置のセットを使用して、標的核酸の少なくとも一部分の配列を決定することが可能であり、これは、標的核酸1110の固定された第1の鎖に対応する第1のタイリング経路1114、および標的核酸1112の固定された第2の鎖に対応する第2のタイリング経路1116を決定することを含み得る。 In some embodiments, one or more tiling sets of complementary oligonucleotide probe species are used to bind to each strand of a denatured double-stranded target nucleic acid. At least a portion of the target nucleic acid can be sequenced using a set of multiple locations on the test substrate, as shown in FIG. and a second tiling path 1116 corresponding to the immobilized second strand of the target nucleic acid 1112 .

一部の実施形態では、第1のタイリング経路における切れ目は、第2のタイリング経路の対応する部分を使用して解決され、タイリング経路における切れ目は、所望の信頼度で塩基配列を決定することができないことであり、切れ目を解決することは、所望の信頼度で塩基配列を決定することである。一部の実施形態では、第1のタイリング経路または第2のタイリング経路における切れ目は、参照配列を使用して解決される。一部の実施形態では、第1のタイリング経路または第2のタイリング経路の切断は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して解決される。 In some embodiments, discontinuities in the first tiling path are resolved using corresponding portions of the second tiling path, and discontinuities in the tiling path determine the base sequence with a desired degree of confidence. What cannot be done, and resolving the discontinuity, is to determine the base sequence with the desired degree of confidence. In some embodiments, discontinuities in the first tiling path or the second tiling path are resolved using a reference array. In some embodiments, cleavage of the first or second tiling pathway corresponds to a third or fourth tiling pathway obtained from another instance of the target nucleic acid. Resolved using parts.

一部の実施形態では、各結合部位についての標的核酸配列の配列割当の信頼度は、第1のタイリング経路および第2のタイリング経路の対応する部分を使用して増加する。一部の実施形態では、標的核酸配列の配列割当の信頼度は、標的核酸の別の事例から得られた第3のタイリング経路または第4のタイリング経路の対応する部分を使用して増加する。 In some embodiments, the confidence of the sequence assignment of the target nucleic acid sequence for each binding site is increased using corresponding portions of the first tiling pathway and the second tiling pathway. In some embodiments, the confidence of the sequence assignment of the target nucleic acid sequence is increased using the corresponding portion of the third tiling pathway or fourth tiling pathway obtained from another instance of the target nucleic acid. do.

配列の整列またはアセンブリ。
ブロック222。一部の実施形態では、標的核酸の少なくとも一部分の配列は、複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットを使用して決定される。
Sequence alignment or assembly.
block 222; In some embodiments, the sequence of at least a portion of the target nucleic acid is determined using a set of multiple locations on the test substrate by compiling the locations on the test substrate represented by the set of multiple locations. be done.

一部の実施形態では、連続した配列は、デノボアセンブリを介して得られる。他の実施形態では、アセンブリを容易にするために、参照配列が使用される。完全なゲノム配列決定が、ゲノムの同じ領域(理想的には、同じ染色体に由来する分子)にわたる複数の標的核酸分子からの情報の合成を必要とする場合、アルゴリズムは、複数の標的核酸分子から得られた情報を処理する必要があり得る。一部の実施形態では、複数の標的核酸分子間の共通の配列に基づいて標的核酸配列を整列させ得るアルゴリズムが利用され、領域がカバーされる共整列された分子からの帰属によって、各標的核酸分子内の任意のギャップを埋めてもよい(例えば、1つの標的核酸分子におけるギャップは、別の共整列された標的核酸分子について決定される配列リードによってカバーされる)。 In some embodiments, contiguous sequences are obtained via de novo assembly. In other embodiments, reference sequences are used to facilitate assembly. If complete genome sequencing requires the synthesis of information from multiple target nucleic acid molecules spanning the same region of the genome (ideally, molecules originating from the same chromosome), the algorithm It may be necessary to process the information obtained. In some embodiments, an algorithm is utilized that can align target nucleic acid sequences based on common sequences between multiple target nucleic acid molecules, and assignments from the co-aligned molecules that cover regions of each target nucleic acid Any gaps in the molecule may be filled (eg, gaps in one target nucleic acid molecule are covered by sequence reads determined for another co-aligned target nucleic acid molecule).

一部の実施形態では、sショットガンアセンブリ法(例えば、Schuler et al.,Science 274:540-546,1996に記載されている)を、本明細書に記載されるように得られた配列割当を使用して、アセンブリを行うように適合させる。サンガー配列決定またはイルミナショットガン配列決定に対する現在の方法の利点は、多数のリードが、それらが完全長、インタクトな標的核酸分子、またはその非常に大きな断片から配列決定されるときに、事前にアセンブリされることである(例えば、互いに対するリードまたはコンティグの場所、およびリードまたはコンティグ間のギャップの長さが既知であり得る)。様々な実施形態では、参照ゲノムは、長距離ゲノム構造のアセンブリ、もしくは短距離ポリヌクレオチド配列のアセンブリ、またはその両方のアセンブリを容易にするために使用される。一部の実施形態では、リードは、部分的にデノボアセンブリされ、次いで参照に整列され、次いで、参照支援アセンブリが、デノボアセンブリされる。一部の実施形態では、様々な参照アセンブリを使用して、ゲノムアセンブリのためのいくつかのガイダンスを提供する。他の実施形態では、実際の分子から得られた情報(特に、2つ以上の分子によって裏付けられている場合)は、参照配列からの任意の情報よりも重み付けされる。 In some embodiments, the shotgun assembly method (described, for example, in Schuler et al., Science 274:540-546, 1996) is applied to sequence assignments obtained as described herein. is adapted to do the assembly. An advantage of current methods over Sanger sequencing or Illumina shotgun sequencing is that large numbers of reads are pre-assembled when they are sequenced from full-length, intact target nucleic acid molecules, or very large fragments thereof. (eg, the location of reads or contigs relative to each other and the length of gaps between reads or contigs may be known). In various embodiments, reference genomes are used to facilitate assembly of long-range genomic structures, or assembly of short-range polynucleotide sequences, or both. In some embodiments, the reads are partially de novo assembled, then aligned to a reference, and then a reference support assembly is de novo assembled. In some embodiments, various reference assemblies are used to provide some guidance for genome assembly. In other embodiments, information obtained from the actual molecule (particularly if supported by more than one molecule) is weighted over any information from the reference sequence.

一部の実施形態では、配列ビットが得られる標的核酸は、標的核酸間の配列重複のセグメントに基づいて整列され、より長いシリココンティグ、および、最終的には、染色体全体の配列が生成される。 In some embodiments, the target nucleic acids from which sequence bits are obtained are aligned based on segments of sequence overlap between the target nucleic acids to generate longer silicocontigs and, ultimately, sequences of entire chromosomes. .

一部の実施形態では、標的核酸の同一性は、その長さに沿って結合するオリゴヌクレオチドプローブ種のパターンによって決定される。一部の実施形態では、同一性は、RNA種またはRNAアイソフォームの同一性である。一部の実施形態では、同一性は、標的核酸が対応し得る参照配列の場所である。 In some embodiments, the identity of a target nucleic acid is determined by the pattern of oligonucleotide probe species bound along its length. In some embodiments, the identity is that of RNA species or RNA isoforms. In some embodiments, the identity is the location of the reference sequence to which the target nucleic acid can correspond.

一部の実施形態では、位置決定の正確度または精度は、配列ビットを一緒に繋ぎ合わせる(stitch)のに十分ではない場合がある。一部の実施形態では、プローブのサブセットは、特定の局所内で結合することが見出されるが、厳密には、位置決定データから、配列順序を、所望の信頼度で決定することは困難である。一部の実施形態では、分解能は、回折限界である。一部の実施形態では、局所または回折限界スポット内の短距離配列は、局所またはスポット内に位置するオリゴヌクレオチドプローブ種の配列重複によってアセンブリされる。したがって、例えば、オリゴヌクレオチドプローブ種のサブセットの個々の配列がどのように重複するかに関する情報を使用することによって、短距離配列がアセンブリされ得る。一部の実施形態では、このようにして構築された短距離配列は、次いで、標的核酸上のそれらの順序に基づいて、長距離配列へと一緒に繋ぎ合わされ得る。したがって、長距離配列は、隣接または重複スポットから得られた短距離配列を結合することによって得ることができる。 In some embodiments, the accuracy or precision of positioning may not be sufficient to stitch aligned bits together. In some embodiments, a subset of probes are found to bind within specific localities, but strictly speaking, it is difficult to determine sequence order from localization data with the desired degree of confidence. . In some embodiments, the resolution is diffraction limited. In some embodiments, short-range sequences within a local or diffraction-limited spot are assembled by sequence overlap of oligonucleotide probe species located within the local or spot. Thus, for example, by using information about how individual sequences of a subset of oligonucleotide probe species overlap, short-range sequences can be assembled. In some embodiments, short-range sequences constructed in this manner can then be spliced together into long-range sequences based on their order on the target nucleic acid. Long-range sequences can thus be obtained by combining short-range sequences obtained from adjacent or overlapping spots.

一部の実施形態では、(例えば、天然に二本鎖である標的核酸の場合)相補鎖について得られた参照配列および配列情報を使用して、配列割当を容易にする。 In some embodiments, reference sequences and sequence information obtained for complementary strands (eg, for target nucleic acids that are naturally double-stranded) are used to facilitate sequence assignment.

一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、70%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、90%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、標的核酸は、少なくとも140塩基長であり、決定プロセスは、99%を超える標的核酸配列の配列のカバレッジを決定し得る。一部の実施形態では、決定プロセスは、99%を超える標的核酸配列の配列のカバレッジを決定し得る。 In some embodiments, the target nucleic acid is at least 140 bases long and the determination process can determine sequence coverage of the target nucleic acid sequence of greater than 70%. In some embodiments, the target nucleic acid is at least 140 bases long and the determination process can determine sequence coverage of the target nucleic acid sequence of greater than 90%. In some embodiments, the target nucleic acid is at least 140 bases long and the determination process can determine sequence coverage of the target nucleic acid sequence of greater than 99%. In some embodiments, the determination process may determine sequence coverage of the target nucleic acid sequence of greater than 99%.

非特異的または不一致の結合事象。
概して、配列決定は、標的核酸が結合したヌクレオチドに相補的であるヌクレオチドを含むと仮定する。しかし、必ずしもそうではないことがある。この仮定が成立しない場合の一例として、結合不一致エラーが挙げられる。それにもかかわらず、不一致は、既知のルールまたは挙動に従って生じる場合、標的核酸の配列を決定するのに有用である。短いオリゴヌクレオチドプローブ種(例えば、5塩基長)の使用は、1つの塩基が5塩基長の20%であるため、単一の不一致の影響が安定性に対して大きな影響を有することを意味する。したがって、適切な条件を使用して、短いオリゴヌクレオチドプローブ種によって、絶妙な特異性が得られる。それでも、不一致が生じる可能性があり、分子相互作用の確率的性質のため、それらの結合の持続時間の一部は、5塩基すべてが特異的である結合から区別可能ではない場合がある。一部の実施形態では、塩基(または配列)呼び出し(calling)を行うために、アルゴリズムが使用され、アセンブリは、不一致の発生を考慮に入れることが多い。多くの種類の不一致は予測可能であり、特定のルールに従っている。いくつかのこれらのルールは、理論的考察によって導出され、他のルールは、実験的に導出されている(例えば、Maskos and Southern,Nucleic Acids Res 21(20):4663-4669,2013、Williams et al.,Nucleic Acids Res 22:1365-1367,1994に記載されている)。
Non-specific or inconsistent binding events.
Generally, sequencing assumes that the target nucleic acid contains nucleotides that are complementary to the bound nucleotides. However, this may not always be the case. An example of when this assumption does not hold is a join mismatch error. Nonetheless, discrepancies are useful in determining the sequence of a target nucleic acid if they occur according to known rules or behavior. The use of short oligonucleotide probe species (e.g., 5 bases long) means that the effect of a single mismatch has a large impact on stability, as one base is 20% of a 5 base length. . Thus, using appropriate conditions, short oligonucleotide probe species provide exquisite specificity. Nevertheless, discrepancies can occur, and due to the stochastic nature of molecular interactions, some of those binding durations may not be distinguishable from binding where all five bases are specific. In some embodiments, algorithms are used to make base (or sequence) calling, and assembly often takes into account the occurrence of mismatches. Many kinds of discrepancies are predictable and follow certain rules. Some of these rules are derived by theoretical considerations, others are experimentally derived (eg Maskos and Southern, Nucleic Acids Res 21(20):4663-4669, 2013, Williams et al. al., Nucleic Acids Res 22:1365-1367, 1994).

一部の実施形態では、表面への非特異的結合の影響は、非特異的部位へのプローブ結合のかかる非存続性によって緩和され、ある撮像剤が非特異的結合部位(例えば、相補標的配列上ではない)を占有すると、それは退色され得るが、場合によっては、その位置に留まり、その場所へのさらなる結合を遮断する(例えば、グアニン四重鎖形成による相互作用)。典型的には、標的ポリヌクレオチドへの撮像剤結合の解像を妨げる非特異的結合部位の大部分は、撮像の初期段階のうちに占有および退色され、撮像剤のポリヌクレオチド部位へのオン/オフ結合が、その後、容易に観察されるようになる。したがって、一実施形態では、高いレーザ出力を使用して、最初に非特異的結合部位を占有するプローブを退色させ、任意選択的に、この段階のうちは画像を撮影せず、次いで、任意選択的に、レーザ出力を低減させ、撮像を開始して、ポリヌクレオチドへのオン・オフ結合を捕捉する。最初の非特異的結合後のさらなる非特異的結合は、頻度が低く(退色されたプローブが、しばしば非特異的結合部位に固着したままであるため)、一部の実施形態では、例えば、ドッキング部位への特異的結合とみなされる閾値を適用することによって、計算的にフィルタリング除去され、同じ場所への結合は、持続的でなければならない(例えば、同じ部位で、少なくとも5回または少なくとも10回発生するはずである)。典型的には、ドッキング部位への特異的な結合事象が、約20回検出される。 In some embodiments, the effects of non-specific binding to the surface are mitigated by such non-persistence of probe binding to non-specific sites, such that an imaging agent has non-specific binding sites (e.g., complementary target sequences). ), it can be bleached, but in some cases remains in that position, blocking further binding to that site (eg, interactions via guanine quadruplex formation). Typically, the majority of non-specific binding sites that prevent resolution of imaging agent binding to target polynucleotides are occupied and bleached during the early stages of imaging, resulting in on/off of imaging agent to polynucleotide sites. Off-coupling is then readily observed. Thus, in one embodiment, high laser power is used to first bleach probes occupying non-specific binding sites, optionally no images are taken during this step, and then optionally Briefly, the laser power is reduced and imaging is initiated to capture on and off binding to polynucleotides. Further non-specific binding after the initial non-specific binding is infrequent (because bleached probes often remain anchored to non-specific binding sites) and in some embodiments, e.g. Specific binding to the site is computationally filtered out by applying a threshold for what is considered specific binding to the site, and binding to the same site must be persistent (e.g., at the same site at least 5 times or at least 10 times should occur). Typically, about 20 specific binding events to the docking site are detected.

他の実施形態では、非特異的である結合は、フルオロフォアのシグナルが、表面に伸展される標的分子の直鎖の位置と相関しなければならず、他のシグナルは、アルゴリズム的に除去される。一部の実施形態では、線状二重鎖形態の標的核酸鎖を直接染色するか、または持続的な結合部位を通して線を補間するかのいずれかによって、標的核酸鎖の位置を決定することが可能である。一部の実施形態では、一般に、線に沿って脱落しないシグナルは、それらが持続的であるかどうかにかかわらず、破棄される。同様に、一部の実施形態では、超分子格子が使用される場合、格子の既知の構造と相関しない結合事象は破棄される。 In other embodiments, binding that is non-specific requires that the signal of the fluorophore be correlated with the linear position of the target molecule stretched to the surface, and other signals are algorithmically removed. be. In some embodiments, the position of the target nucleic acid strand can be determined by either directly staining the target nucleic acid strand in linear duplex form or by interpolating a line through persistent binding sites. It is possible. In some embodiments, signals that do not drop out along the line are generally discarded, regardless of whether they are persistent. Similarly, in some embodiments, when a supramolecular lattice is used, binding events that do not correlate with the known structure of the lattice are discarded.

一部の実施形態では、複数の結合事象は、特異性を増加させ得る。例えば、単一の「呼び出し(call)」から検出される部分または配列の同一性を確立するのではなく、複数の呼び出しからコンセンサスが得られる。また、標的部分または標的核酸への複数の結合事象は、(閾値持続時間の)結合が、同じ場所で複数回起こる可能性が低い非特異的結合事象から、実際の場所への結合を区別することを可能にし得る。また、経時的に複数の結合事象を測定することにより、表面への非特異的結合事象の蓄積が弱められ、その後、非特異的結合が再び検出される可能性がほとんどなくなるということが観察される。これは、非特異的結合からのシグナルが弱められるものの、非特異的結合部位が占有または妨害されたままであり得るためである可能性が高い。 In some embodiments, multiple binding events can increase specificity. For example, rather than establishing the identity of a portion or sequence detected from a single "call", consensus can be obtained from multiple calls. Also, multiple binding events to the target moiety or target nucleic acid distinguish binding to the actual location from non-specific binding events where binding (of threshold duration) is unlikely to occur multiple times at the same location. can make it possible. It has also been observed that by measuring multiple binding events over time, the accumulation of non-specific binding events on the surface is attenuated such that subsequent non-specific binding is less likely to be detected again. be. This is likely because the non-specific binding sites may remain occupied or blocked, although the signal from non-specific binding is attenuated.

一部の実施形態では、配列決定は、標的核酸上の不一致および非特異的結合によって複雑になる。非特異的結合または外れ値事象の影響を回避するために、一部の実施形態では、本方法は、それらの場所および存続時間に基づいて、シグナルを重み付けしてもよい。場所による重み付けは、プローブが、例えば、格子構造内の場所を含む、伸展された標的核酸または超分子の格子(例えば、DNA折り紙グリッド)上に共局在するかどうかによって予測される。結合の存続性による重み付けは、結合の持続時間および結合の頻度に関係し、異なる名目上の結合事象または結合場所に関連する重み付けを使用して、完全一致、部分一致または非特異的結合の可能性を決定し得る。オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種について確立される重み付けを使用して、シグナルの正確性を決定する。 In some embodiments, sequencing is complicated by mismatches and non-specific binding on the target nucleic acid. To avoid the effects of non-specific binding or outlier events, in some embodiments the method may weight signals based on their location and duration. Weighting by location is predicted by whether probes co-localize on a stretched target nucleic acid or a supramolecular lattice (eg, a DNA origami grid), including, for example, locations within a lattice structure. Weighting by binding persistence relates to the duration of binding and frequency of binding, using weights associated with different nominal binding events or binding sites to determine the possibility of exact, partial or non-specific binding. can determine gender. The weighting established for each oligonucleotide probe species in the complete set of oligonucleotide probe species is used to determine signal fidelity.

一部の実施形態では、優先順位は、シグナル持続時間が所定の閾値を超えるかどうか、シグナル反復または周波数が所定の閾値を超えるかどうか、シグナルが標的分子の場所と相関するかどうか、および/または収集される光子数が所定の閾値を超えるかどうか、を判定することによって、シグナル検証およびベースコール(base calling)を容易にするために使用される。一部の実施形態では、これらの判定のうちのいずれかに対する答えが真である場合、シグナルは、実在として(例えば、不一致または非特異的結合の事象ではないとして)受け入れられる。他の実施形態では、これらの判定のうちの1つを超えると、シグナルが真として受け入れられるために真である必要があり得る。 In some embodiments, the priority is whether the signal duration exceeds a predetermined threshold, whether the signal repetition or frequency exceeds a predetermined threshold, whether the signal correlates with the location of the target molecule, and/or Or used to facilitate signal verification and base calling by determining whether the number of photons collected exceeds a predetermined threshold. In some embodiments, if the answer to any of these determinations is true, the signal is accepted as real (eg, not a mismatch or non-specific binding event). In other embodiments, exceeding one of these determinations may require the signal to be true in order to be accepted as true.

一部の実施形態では、不一致は、それらの経時的結合パターンによって区別されるため、配列情報の二次層とみなされる。かかる実施形態では、結合シグナルが、その経時的結合特性により不一致であると判定される場合、関連付けられた配列ビットは、推定的な不一致塩基を除去するためにバイオインフォマティクス的にトリミングされ、残りの配列ビットが、配列決定に利用される。不一致は、ハイブリダイズするオリゴヌクレオチドプローブ種の末端で生じる可能性が最も高いため、一部の実施形態では、不一致を決定するための経時的結合特性を使用して、1つ以上の塩基を、オリゴヌクレオチドプローブ種の配列の末端からトリミングすることができる。どの塩基を適切にトリミングするかについての決定は、一部の実施形態では、同じ標的核酸領域にわたってタイリングする他のオリゴからの情報によって通知される。 In some embodiments, mismatches are considered a second layer of sequence information, as they are distinguished by their binding patterns over time. In such embodiments, if a binding signal is determined to be mismatched by its binding properties over time, the associated sequence bits are bioinformatically trimmed to remove putative mismatched bases, and the remaining Alignment bits are used for sequencing. Because mismatches are most likely to occur at the ends of the hybridizing oligonucleotide probe species, in some embodiments, temporal binding properties are used to determine mismatches by replacing one or more bases with It can be trimmed from the end of the sequence of the oligonucleotide probe species. Decisions about which bases to trim appropriately are, in some embodiments, informed by information from other oligos that tile over the same target nucleic acid region.

一部の実施形態では、可逆的に見えるシグナルは、(例えば、表面への蛍光汚染物質の付着に起因する)非特異的シグナルに対応する確率または尤度を有するため、負に重み付けられる。 In some embodiments, signals that appear to be reversible are negatively weighted because they have a probability or likelihood corresponding to non-specific signals (eg, due to attachment of fluorescent contaminants to the surface).

ブロック302~304。一部の実施形態では、標的核酸を配列決定する方法は、標的核酸が試験基板上で線状化伸展形態で結合され、それによって、固定伸展核酸を形成する固定プロセスを含み得る。標的核酸を、上記の方法のいずれか1つに従って試験基板に付着させる。 Blocks 302-304. In some embodiments, a method of sequencing a target nucleic acid can include a fixation process in which the target nucleic acid is bound in a linearized extended form on a test substrate, thereby forming a fixed extended nucleic acid. A target nucleic acid is attached to a test substrate according to any one of the methods described above.

表面での単一細胞の単離、ならびにDNAおよびRNAの両方の抽出。
一部の実施形態では、RNAおよびDNAのいずれかまたは両方を、単一細胞から単離し、配列決定することができる。一部の実施形態では、DNAを配列決定することが目的である場合、配列決定を開始する前に、RNaseを試料と反応させる。一部の実施形態では、RNAを配列決定することが目的である場合、配列決定を開始する前に、DNaseを試料と反応させる。一部の実施形態では、細胞質の核酸および核の核酸の両方が分析され、それらは、差次的に、または順次抽出される。一部の実施形態では、まず、細胞膜(核膜ではない)を破壊して、細胞質の核酸を遊離し、回収する。次に、関連する核膜を破壊して、核の核酸を遊離する。一部の実施形態では、タンパク質およびポリペプチドは、細胞質画分の一部として回収される。一部の実施形態では、RNAは、細胞質画分の一部として回収される。一部の実施形態では、DNAは、核画分の一部として回収される。一部の実施形態では、細胞質画分および核画分は、一緒に抽出される。一部の実施形態では、抽出後、mRNAおよびゲノムDNAは、差次的に捕捉される。例えば、mRNAは、表面に付着したオリゴdTプローブによって捕捉される。これは、フローセルの第1の部分で生じ得、DNAは、DNAの末端が捕捉され得る疎水性ビニルシランコーティングを有するフローセルの第2の部分で捕捉される(例えば、おそらく疎水性相互作用により)。
Isolation of single cells on the surface and extraction of both DNA and RNA.
In some embodiments, either or both RNA and DNA can be isolated and sequenced from a single cell. In some embodiments, if the goal is to sequence DNA, RNase is allowed to react with the sample prior to initiating sequencing. In some embodiments, if the goal is to sequence RNA, DNase is allowed to react with the sample prior to initiating sequencing. In some embodiments, both cytoplasmic and nuclear nucleic acids are analyzed and they are differentially or sequentially extracted. In some embodiments, the cell membrane (not the nuclear membrane) is first disrupted to release and recover cytoplasmic nucleic acids. The associated nuclear membrane is then disrupted to liberate the nuclear nucleic acids. In some embodiments, proteins and polypeptides are recovered as part of the cytoplasmic fraction. In some embodiments, RNA is recovered as part of the cytoplasmic fraction. In some embodiments, DNA is recovered as part of the nuclear fraction. In some embodiments, the cytoplasmic and nuclear fractions are extracted together. In some embodiments, after extraction, mRNA and genomic DNA are differentially captured. For example, mRNA is captured by oligo-dT probes attached to the surface. This can occur in a first portion of the flow cell and the DNA is trapped in a second portion of the flow cell that has a hydrophobic vinylsilane coating where the ends of the DNA can be trapped (eg, presumably through hydrophobic interactions).

一部の実施形態では、ポリ(L)リジン(PLL)(例えば、Microsurfaces Inc.から入手可能であるか、または独自にコーティングするか)などの正電荷を有する表面が利用され、細胞膜に結合し得ることが知られている。一部の実施形態では、細胞が表面と接触する(collide)可能性が増加するように、高さが低い、かつ/または幅が広いフローチャネル(例えば、30ミクロン未満)が使用される。一部の実施形態では、乱流を導入するために、フローセルの天井にヘリンボーンパターンまたは蛇行パターンを使用するとによって、接触回数が増加する。一部の実施形態では、細胞の付着は、細胞が低密度で表面に分散されることが望ましいため、かかる実施形態では効率的である必要がない場合がある(例えば、各個々の細胞から抽出されたRNAおよびDNAが空間的に分離したままであり得るように、細胞間に十分なスペースがあることを確実にするため)。一部の実施形態では、細胞膜および核膜の両方が破壊されるように(例えば、細胞内容物が培体中に放出され、単離された細胞の近傍の表面で捕捉されるように)、プロテイナーゼ処理を使用して、細胞が溶解される。固定化されると、一部の実施形態では、DNAおよびRNAが伸展される。一部の実施形態では、伸展緩衝液が、カバーガラス表面にわたって一方向に流れる(例えば、流体の流れの方向に、DNAおよびRNAポリヌクレオチドを伸展させ、整列させる)。一部の実施形態では、条件(例えば、温度、伸展緩衝液の組成物、および流れの物理的な力など)を調節することで、RNAの二次/三次構造がほとんどの変性するため、RNAが、抗体への結合または配列決定に利用可能となり得る。一旦、RNAが変性形態で伸展されると、変性緩衝液から結合緩衝液に切り替えることが可能である。 In some embodiments, a positively charged surface such as poly(L)lysine (PLL) (e.g., available from Microsurfaces Inc. or proprietary coated) is utilized to bind to cell membranes. known to obtain. In some embodiments, low height and/or wide flow channels (eg, less than 30 microns) are used to increase the likelihood that cells will collide with the surface. In some embodiments, the number of contacts is increased by using a herringbone or serpentine pattern on the ceiling of the flow cell to introduce turbulence. In some embodiments, cell attachment may not need to be efficient in such embodiments, as it is desirable for cells to be dispersed over the surface at low density (e.g., extract from each individual cell to ensure that there is enough space between cells so that the treated RNA and DNA can remain spatially separated). In some embodiments, both the cell membrane and the nuclear membrane are disrupted (e.g., so that the cell contents are released into the medium and trapped on the surface adjacent to the isolated cells) Cells are lysed using proteinase treatment. When immobilized, in some embodiments DNA and RNA are stretched. In some embodiments, the spreading buffer is unidirectionally flowed across the coverslip surface (eg, spreading and aligning DNA and RNA polynucleotides in the direction of fluid flow). In some embodiments, adjusting the conditions (e.g., temperature, extension buffer composition, and physical force of the flow, etc.) denatures most of the secondary/tertiary structure of the RNA, thus reducing the RNA can be made available for binding to antibodies or for sequencing. Once the RNA is extended in denatured form, it is possible to switch from the denaturation buffer to the binding buffer.

代替的に、RNAは、まず、細胞膜を破壊し、一方向に流れを誘導することによって、抽出され、固定化される。次に、プロテイナーゼを使用することによって、核膜を破壊し、逆方向に流れを誘導する。一部の実施形態では、DNAは、例えば、レアカッティング制限酵素(例えば、NOT1、PMME1)を使用することによって、遊離の前または後に断片化される。この断片化は、DNAの解離を助けることができ、個々の鎖を単離およびコーミングを可能にすることができる。各細胞から抽出されたRNAおよびDNAが混ざり合わず、固定化された細胞が十分に離れているように、システムが構成される。一部の実施形態では、これは、細胞の破裂または破壊の前、後、または際に、液体をゲルに転移させることによって補助される。 Alternatively, RNA is first extracted and immobilized by disrupting the cell membrane and inducing flow in one direction. Proteinases are then used to disrupt the nuclear envelope and induce flow in the opposite direction. In some embodiments, DNA is fragmented before or after release, eg, by using rare-cutting restriction enzymes (eg, NOT1, PMME1). This fragmentation can help dissociate the DNA, allowing individual strands to be isolated and combed. The system is configured so that the RNA and DNA extracted from each cell are not mixed and the fixed cells are well separated. In some embodiments, this is aided by transferring liquid to the gel before, after, or during cell rupture or disruption.

一部の実施形態では、標的核酸は、二本鎖核酸である。かかる実施形態では、本方法は、試験基板上で固定二本鎖標的核酸を一本鎖形態に変性させることをさらに含み得る。一部の実施形態では、核酸は、配列決定を進めるために一本鎖形態であるか、または部分的に変性した形態であるか、または鎖侵入(strand invasion)もしくは三重鎖形成オリゴヌクレオチドプローブ種を利用する場合に二本鎖である必要がある。固定二本鎖核酸が変性されると、核酸の固定された第1鎖および固定された第2鎖の両方が直接アクセス可能になる。固定された第2の鎖は、天然の二重鎖標的ヌクレオチドの固定された第1の鎖に相補的である。 In some embodiments, the target nucleic acid is a double-stranded nucleic acid. In such embodiments, the method may further comprise denaturing the immobilized double-stranded target nucleic acid to a single-stranded form on the test substrate. In some embodiments, the nucleic acid is in single-stranded form or partially denatured form to proceed with sequencing, or is subjected to strand invasion or triplex forming oligonucleotide probe species. must be double-stranded when using Once the immobilized double-stranded nucleic acid is denatured, both the immobilized first strand and the immobilized second strand of nucleic acid become directly accessible. The immobilized second strand is complementary to the immobilized first strand of natural double-stranded target nucleotides.

一部の実施形態では、標的核酸は、一本鎖である(例えば、mRNA、lncRNA、マイクロRNA)。一部の実施形態では、標的核酸が一本鎖RNAであり、配列決定方法が進行する前に、変性を必要としない。 In some embodiments, the target nucleic acid is single-stranded (eg, mRNA, lncRNA, microRNA). In some embodiments, the target nucleic acid is single-stranded RNA and does not require denaturation before sequencing methods proceed.

一部の実施形態では、試料は、近接した天然の相補鎖を有さない一本鎖DNAポリヌクレオチドを含み得る。一部の実施形態では、標的核酸に沿ったオリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の結合場所がコンパイルされ、配列は、それらの場所に従ってすべての配列ビットを集約し、それらを一緒に繋ぎ合わせることによってアセンブリされる。 In some embodiments, a sample may contain single-stranded DNA polynucleotides that do not have contiguous natural complements. In some embodiments, the binding locations of each oligonucleotide probe species of a complete set of oligonucleotide probe species along the target nucleic acid are compiled, and the sequence aggregates all sequence bits according to those locations and converts them to Assembled by piecing together.

RNAの伸展
一部の実施形態では、荷電表面上の核酸の伸展は、溶液のカチオン濃度によって影響を受ける。低塩濃度では、RNAは一本鎖であり、その骨格に沿って負に荷電し、その長さに沿ってランダムに表面に結合し得る。
Spreading of RNA In some embodiments, spreading of nucleic acids on a charged surface is affected by the cation concentration of the solution. At low salt concentrations, RNA is single-stranded, negatively charged along its backbone, and can bind to surfaces randomly along its length.

RNAを線状形態に変性および伸展するために、複数の可能な方法がある。一部の実施形態では、tRNAは、最初に、(例えば、高い塩濃度を使用することによって)球状形態になるように奨励される。一部のかかる実施形態では、各RNA分子(例えば、特に、ポリAテール)の末端は、相互作用によりアクセスしやすくなる。一部の実施形態では、RNAが球状形態で結合したら、異なる緩衝液(例えば、変性緩衝液)をフローセルに流す。 There are multiple possible methods for denaturing and extending RNA into a linear form. In some embodiments, the tRNA is initially encouraged to assume a globular morphology (eg, by using high salt concentrations). In some such embodiments, the ends of each RNA molecule (eg, especially the polyA tail) are made accessible for interaction. In some embodiments, once the RNA is bound in spherical form, a different buffer (eg, denaturing buffer) is run through the flow cell.

代替的な実施形態では、表面をオリゴd(T)で予めコーティングして、mRNAのポリAテールを捕捉する(例えば、Ozsolak et al.,Cell 143:1018-1029,2010に記載されている)。ポリAテールは、典型的には、二次構造を比較的含まないはずの領域である(例えば、それらがホモポリマーであるため)。ポリAテールは、高等真核生物では比較的長いため(250~3000ヌクレオチド)、一部の実施形態では、長いオリゴd(T)捕捉プローブを設計して、RNAにおける分子内塩基対形成のかなりの部分を融解させるのに十分な比較的高い厳密性(例えば、高い温度および/または塩条件)で、ハイブリダイゼーションを行うようにする。結合後、一部の実施形態では、残りのRNA構造を球状状態から線状状態へ転移させることは、捕捉プローブを剥離するのに十分ではないが、潜在的に、流体の流れまたは電気泳動力と組み合わせて、RNAの分子内塩基対形成を妨害し得る変性条件を使用することによって実現される。 In an alternative embodiment, the surface is pre-coated with oligo d(T) to capture the polyA tail of mRNA (as described, for example, in Ozsolak et al., Cell 143:1018-1029, 2010). . The polyA tail is typically a region that should be relatively free of secondary structure (eg, because they are homopolymers). Because the poly-A tail is relatively long in higher eukaryotes (250-3000 nucleotides), in some embodiments, long oligo-d(T) capture probes are designed to significantly reduce intramolecular base-pairing in RNA. Hybridization should be performed at relatively high stringency (eg, high temperature and/or salt conditions) sufficient to melt portions of . After binding, in some embodiments, transitioning the remaining RNA structures from a globular state to a linear state is not sufficient to detach the capture probe, but potentially due to fluid flow or electrophoretic forces. is achieved by using denaturing conditions that can interfere with intramolecular base-pairing of RNA.

ブロック310。一部の実施形態では、固定伸展標的核酸は、オリゴヌクレオチドプローブのセットのそれぞれのオリゴヌクレオチドプローブ種のそれぞれのプールに曝露される。オリゴヌクレオチドプローブ種のセットの各オリゴヌクレオチドプローブ種は、所定の配列および長さであり、曝露は、それぞれのオリゴヌクレオチドプローブ種のそれぞれのプールの個々のプローブが、それぞれのオリゴヌクレオチドプローブ種に相補的である固定された核酸の各部分に一時的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせ得る。 block 310; In some embodiments, the fixed, extended target nucleic acid is exposed to a respective pool of each oligonucleotide probe species of the set of oligonucleotide probes. Each oligonucleotide probe species of the set of oligonucleotide probe species is of a given sequence and length, and the exposure is such that the individual probes of each pool of each oligonucleotide probe species are complementary to each oligonucleotide probe species. Each instance of optical activity is performed under conditions that allow transient and reversible binding to each portion of the immobilized nucleic acid that is the target, thereby giving rise to each instance of optical activity.

ブロック312。一部の実施形態では、測定プロセスにおいて、試験基板上の場所、および、任意選択的に、二次元撮像デバイスを利用し得る曝露プロセス中に生じる光学活性の各それぞれの事例の持続時間が決定される。 block 312; In some embodiments, the measurement process determines the location on the test substrate and, optionally, the duration of each respective instance of optical activity occurring during the exposure process that may utilize a two-dimensional imaging device. be.

ブロック314。一部の実施形態では、曝露および測定プロセスは、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種について反復され、それによって、試験基板上で複数の位置のセットを得、試験基板上の各それぞれの位置のセットは、オリゴヌクレオチドプローブ種のセットのオリゴヌクレオチドプローブ種に対応する。 block 314; In some embodiments, the exposure and measurement process is repeated for each oligonucleotide probe species of the set of oligonucleotide probe species, thereby obtaining a plurality of sets of locations on the test substrate, each Each set of positions corresponds to an oligonucleotide probe species of the set of oligonucleotide probe species.

ブロック316。一部の実施形態では、標的核酸の少なくとも一部分の配列は、複数の位置のセットによって表される試験基板上の位置をコンパイルすることによって、試験基板上の複数の位置のセットから決定される。 block 316; In some embodiments, the sequence of at least a portion of the target nucleic acid is determined from the set of multiple locations on the test substrate by compiling the locations on the test substrate represented by the set of multiple locations.

RNA配列決定
RNAの長さは、典型的には、ゲノムDNAよりも短いが、現在の技術を使用してRNAを一端から他端へ配列決定することは困難である。それにもかかわらず、選択的スプライシングおよび遺伝子アイソフォームのために、mRNAの完全な配列編成を決定することが非常に重要である。一部の実施形態では、mRNAは、そのポリAテールが固定化オリゴd(T)に結合することによって捕捉され、その二次構造は、表面に伸長されるように、伸展力(例えば、400pN超)および変性条件(例えば、ホルムアミドおよび/または7Mもしくは8Mの尿素を含む)を適用することによって除去される。次いで、これにより、結合するオリゴヌクレオチドプローブ種(例えば、エキソン特異的)が、一過的に結合することが可能になる。RNAの長さが短いため、本明細書に記載される単一分子局在化法を用いて、エキソンを解像、区別、および位置決定することが有益である。一部の実施形態では、mRNAに散在するわずかな結合事象は、特定のmRNAアイソフォームに関するmRNA内のエキソンの順序および同一性を決定するのに十分である。
RNA Sequencing Although RNA is typically shorter in length than genomic DNA, it is difficult to sequence RNA from one end to the other using current technology. Nevertheless, due to alternative splicing and gene isoforms, it is very important to determine the complete sequence organization of mRNA. In some embodiments, the mRNA is captured by binding its polyA tail to immobilized oligo d(T) and its secondary structure is extended to the surface by an extensional force (e.g., 400 pN super) and denaturing conditions (eg, containing formamide and/or 7M or 8M urea). This in turn allows the binding oligonucleotide probe species (eg, exon-specific) to transiently bind. Due to the short length of RNA, it is beneficial to resolve, distinguish, and locate exons using the single-molecule localization methods described herein. In some embodiments, the few binding events interspersed with the mRNA are sufficient to determine the order and identity of exons within the mRNA for a particular mRNA isoform.

二本鎖コンセンサス
試料分子から配列情報を得るための方法は、以下の通りである:
i)第1の発光最大波長の標識を有する第1のオリゴヌクレオチドプローブ種を提供すること、第2のオリゴヌクレオチドプローブ種の配列が第1のオリゴヌクレオチドプローブ種の配列に相補的である、第2の発光最大波長の標識を有する第2のオリゴヌクレオチドプローブ種を提供すること、
ii)基板上の天然の二本鎖標的核酸分子を伸長、固定、および変性すること、
iii)光学活性の事例を含む撮像データを生成しながら、第1および第2のオリゴの両方を、iiの変性核酸に曝露すること、
iv)第1および第2のオリゴヌクレオチドプローブ種の結合場所を決定すること、
v)結合場所が共局在する場合、その位置が正しいとみなすこと、
vi)伸長標的核酸に沿った複数の場所が結合していること。
Double Strand Consensus Methods for obtaining sequence information from sample molecules are as follows:
i) providing a first oligonucleotide probe species having a label with a first emission maximum wavelength, wherein the sequence of the second oligonucleotide probe species is complementary to the sequence of the first oligonucleotide probe species; providing a second oligonucleotide probe species having labels with two emission maxima;
ii) extending, fixing and denaturing the native double-stranded target nucleic acid molecule on the substrate;
iii) exposing both the first and second oligos to the denatured nucleic acid of ii while generating imaging data containing instances of optical activity;
iv) determining the binding sites of the first and second oligonucleotide probe species;
v) if the binding sites co-localize, then the position is considered correct;
vi) binding at multiple locations along the extended target nucleic acid;

一部の実施形態では、オリゴヌクレオチドプローブ種は、一過性および可逆的に結合し得る。一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、所与の長さの第1および第2のオリゴヌクレオチドプローブ種の完全なセットの一部であり、オリゴヌクレオチドプローブ種の完全なセットの各第1および第2のオリゴ対に対して、ステップii~iiiを反復し、核酸全体を配列決定する。 In some embodiments, oligonucleotide probe species can bind transiently and reversibly. In some embodiments, the first and second oligonucleotide probe species are part of a complete set of first and second oligonucleotide probe species of a given length, and Steps ii-iii are repeated for each first and second oligo pair of the complete set to sequence the entire nucleic acid.

一部の実施形態では、2つの発光最大波長が、光学的にそれらがあるべき場所に共局在することを確実にするために、いくつかの修正を行う必要があり得る。これは、光学的にまたはソフトウェアプロセスを利用して、色収差を補正することを含み得る。一部のかかる実施形態では、2つの相補オリゴヌクレオチドプローブ種が同時に曝露されるが、それらが互いにアニーリングして、したがって標的核酸への同時結合を妨げることを防止するために、修飾オリゴヌクレオチド化学が使用される。非自己対合類似体の場合、標的核酸上で、修飾Gは、相補オリゴヌクレオチドの修飾Cと対合し得ないが、非修飾Cと対合し得、修飾Aは、相補オリゴヌクレオチドプローブ種の修飾Tと対合し得ないが、非修飾Tと対合し得る。したがって、かかる実施形態では、第1および第2のオリゴヌクレオチドプローブ種が修飾されており、そのため、第1のオリゴヌクレオチドプローブ種が、第2のオリゴヌクレオチドプローブ種と塩基対を形成することができず、したがって、標的核酸へアクセスが妨害されないようし、視野にわたって変化し得る色収差のスペクトル較正を可能にする。一部の実施形態では、色収差を較正および除去するために使用される同じプロセスを利用して、スペクトルおよび空間PSF変動が同様に較正および補償され得る。 In some embodiments, it may be necessary to make some modifications to ensure that the two emission maxima are optically co-localized where they should be. This may include correcting for chromatic aberration either optically or using a software process. In some such embodiments, two complementary oligonucleotide probe species are exposed simultaneously, but modified oligonucleotide chemistries are used to prevent them from annealing to each other and thus preventing simultaneous binding to the target nucleic acid. used. In the case of non-self-pairing analogues, on the target nucleic acid, modification G cannot pair with modification C of the complementary oligonucleotide, but can pair with unmodified C, modification A being the complementary oligonucleotide probe species. modified T, but can match unmodified T. Thus, in such embodiments, the first and second oligonucleotide probe species are modified such that the first oligonucleotide probe species is capable of base pairing with the second oligonucleotide probe species. , thus ensuring unhindered access to the target nucleic acid and allowing spectral calibration of chromatic aberrations that may vary across the field of view. In some embodiments, spectral and spatial PSF variations can be similarly calibrated and compensated for using the same process used to calibrate and remove chromatic aberration.

一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、一緒に添加されるのではなく、次々に添加される。 In some embodiments, the first and second oligonucleotide probe species are added one after the other rather than together.

かかる実施形態では、オリゴヌクレオチドプローブ種が次々に添加される場合、洗浄ステップは、その間に実施される。この場合、相補オリゴヌクレオチドプローブ種は、同じ発光最大波長で標識され、色収差を補正する必要はない。また、2つのオリゴが互いに結合する可能性もない。 In such embodiments, when oligonucleotide probe species are added one after the other, washing steps are performed in between. In this case, the complementary oligonucleotide probe species are labeled with the same emission maximum wavelength and need not be corrected for chromatic aberration. Also, there is no possibility that two oligos will bind to each other.

一部の実施形態では、標的核酸は、オリゴヌクレオチドプローブ種のセット全体が曝露されるまで、さらなる第1および第2のオリゴヌクレオチドプローブ種に曝露される。 In some embodiments, the target nucleic acid is exposed to additional first and second oligonucleotide probe species until the entire set of oligonucleotide probe species has been exposed.

一部の実施形態では、第1のオリゴヌクレオチドプローブ種の後、第2のオリゴヌクレオチドプローブ種が、オリゴヌクレオチドプローブ種の完全なセットの相補的なオリゴヌクレオチドプローブ種の他の対が添加される前に、次のオリゴヌクレオチドプローブ種として添加される。一部の実施形態では、第2のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の完全なセットの他のオリゴヌクレオチドプローブ種が添加される前に、次のオリゴヌクレオチドプローブ種として添加されない。 In some embodiments, after the first oligonucleotide probe species, a second oligonucleotide probe species is added followed by another pair of oligonucleotide probe species complementary to the complete set of oligonucleotide probe species. before it is added as the next oligonucleotide probe species. In some embodiments, a second oligonucleotide probe species is not added as the next oligonucleotide probe species before other oligonucleotide probe species of the complete set of oligonucleotide probe species are added.

かかる実施形態の一例は、以下のような試料標的核酸分子から配列情報を得るための方法を含む:
i)基板上の二本鎖標的核酸分子を、伸長、固定、および変性すること、
ii)第1の標識オリゴを、i)の変性標的核酸に曝露し、オリゴヌクレオチドプローブ種の結合のその場所を、検出および記録すること、
iii)第1の標識オリゴヌクレオチドプローブ種を、洗浄によって除去すること、
iv)第2の標識オリゴヌクレオチドプローブ種を、i)の変性標的核酸に曝露し、オリゴヌクレオチドプローブ種の結合のその場所を、検出および記録すること、
v)任意選択的に、ii)とiv)の記録間のドリフトの補正すること、
vi)ii~ivで得られた結合の記録された位置が共局在する場合、このようにして得られた場所の配列に関する配列情報が、正しいとみなされること。
One example of such an embodiment includes methods for obtaining sequence information from sample target nucleic acid molecules such as:
i) extending, fixing and denaturing the double-stranded target nucleic acid molecule on the substrate;
ii) exposing the first labeled oligo to the denatured target nucleic acid of i) and detecting and recording the location of binding of the oligonucleotide probe species;
iii) removing the first labeled oligonucleotide probe species by washing;
iv) exposing a second labeled oligonucleotide probe species to the denatured target nucleic acid of i) and detecting and recording the location of binding of the oligonucleotide probe species;
v) optionally correcting for drift between the recordings of ii) and iv);
vi) If the recorded positions of binding obtained in ii-iv are co-localized, the sequence information for the sequence of the positions thus obtained is considered correct.

一部の実施形態では、第1および第2のオリゴヌクレオチドプローブ種は、オリゴヌクレオチドプローブ種の完全なセットの一部であり、標的核酸全体を配列決定するために、オリゴヌクレオチドプローブ種の完全なセットの第1および第2のオリゴヌクレオチドプローブ種対に対して、ステップii~iiiを反復する。 In some embodiments, the first and second oligonucleotide probe species are part of a complete set of oligonucleotide probe species, and the complete set of oligonucleotide probe species is used to sequence the entire target nucleic acid. Repeat steps ii-iii for the first and second oligonucleotide probe species pairs of the set.

共局在は、同じ配列遺伝子座を見ていることを示し得る。さらに、センス鎖を標的とするオリゴヌクレオチドプローブ種は、4つの差次的に標識されたオリゴを使用して、中心塩基を識別することを目指すことができ、アンチセンス鎖を標的とするオリゴヌクレオチドプローブ種は、センス鎖のオリゴヌクレオチドプローブ種に対する相補配列を有する4つの差次的に標識されたオリゴヌクレオチドプローブ種を使用して、中心塩基を識別することを目指すことができる。中央位置についての検証されたベースコールを得るために、センス鎖のデータは、アンチセンス鎖のデータを裏付ける必要がある。したがって、中央A塩基を有するオリゴヌクレオチドプローブ種が、センス鎖に結合する場合、中央T塩基を有する相補オリゴヌクレオチドプローブ種が、アンチセンス鎖に結合する必要がある。 Co-localization may indicate looking at the same sequence locus. In addition, an oligonucleotide probe species targeting the sense strand can be aimed at identifying the central base using four differentially labeled oligos and oligonucleotides targeting the antisense strand The probe species can be aimed at identifying the central base using four differentially labeled oligonucleotide probe species with complementary sequences to the oligonucleotide probe species on the sense strand. To obtain a validated base call for the central position, the sense strand data must corroborate the antisense strand data. Thus, if an oligonucleotide probe species with a central A base binds to the sense strand, a complementary oligonucleotide probe species with a central T base must bind to the antisense strand.

一部の実施形態では、センスおよびアンチセンス鎖のかかる裏付けまたはコンセンサスを得ることは、G:TまたはG:Uのゆらぎ塩基対形成から生じる曖昧さを克服するのに役立ち得る。これがセンス鎖上で生じる場合、C:Aは塩基対を形成する可能性が低いため、アンチセンス鎖上でシグナルが得られる可能性は低い。 In some embodiments, obtaining such confirmation or consensus of the sense and antisense strands can help overcome ambiguities arising from G:T or G:U wobble base pairing. If this occurs on the sense strand, it is unlikely that a signal will be obtained on the antisense strand because C:A is less likely to base pair.

一部の実施形態では、修飾G塩基またはT/Uは、ゆらぎ塩基対の形成を防止するために、オリゴヌクレオチドプローブ種において使用することができる。一部の他の実施形態では、アセンブリアルゴリズムは、特に、相補標的核酸鎖上にC:G塩基対による確証が存在せず、かつ、場所がA:T塩基対を形成する相補標的核酸鎖に結合するオリゴヌクレオチドプローブ種と相関する場合、ゆらぎ塩基対の形成の可能性を考慮してもよい。一部の実施形態では、3つではなく2つだけ水素結合を形成する能力を有する7-デアザグアニシンを、G修飾として使用して、それが形成され得る塩基対合の安定性を低下させ、グアニン四重鎖およびその非常に強力なの形成(したがって、無差別な結合を形成する)を低下させる。 In some embodiments, modified G bases or T/U can be used in oligonucleotide probe species to prevent wobble base pair formation. In some other embodiments, the assembly algorithm is specifically directed to complementary target nucleic acid strands where there is no C:G base pair confirmation on the complementary target nucleic acid strand and where locations form A:T base pairs. The possibility of wobble base pair formation may be considered when correlated with the oligonucleotide probe species that bind. In some embodiments, 7-deazaguanisine, which has the ability to form only two hydrogen bonds instead of three, is used as a G-modification to reduce the stability of the base pairing it can form, and guanine It reduces the formation of quadruplexes and their very strong (thus forming promiscuous bonds).

同時二重鎖コンセンサスアセンブリ
一部の実施形態では、二重らせん標的核酸の両方の鎖が存在し、標的鎖間に近接している間、上に記載されるオリゴヌクレオチドプローブ種に曝露される。一部の実施形態では、検出される一過的な光シグナルから、オリゴヌクレオチドプローブ種のそれぞれのセットの各オリゴヌクレオチドプローブ種の2つの相補鎖のうちのどちらが結合したかを区別することができない場合がある。例えば、標的核酸に沿ったオリゴヌクレオチドプローブ種のそれぞれのセットのオリゴヌクレオチドプローブ種の各々について、各標的核酸鎖に沿った結合場所がコンパイルされる場合、異なる配列の2つのプローブが、あたかも同じ場所に結合しているように見える場合がある。これらのオリゴヌクレオチドプローブ種は、相補配列を有するべきであり、次いで、標的核酸の配列を正確にコンパイルするための前提条件である、結合した2つのオリゴヌクレオチドプローブ種の各々のどの鎖かを決定することが難しくなる。
Simultaneous Duplex Consensus Assembly In some embodiments, both strands of the duplex target nucleic acid are present and exposed to the oligonucleotide probe species described above while in proximity between the target strands. In some embodiments, it is not possible to distinguish from the detected transient light signal which of the two complementary strands of each oligonucleotide probe species of each set of oligonucleotide probe species has bound. Sometimes. For example, if the binding sites along each target nucleic acid strand are compiled for each of the oligonucleotide probe species of each set of oligonucleotide probe species along the target nucleic acid, then two probes of different sequence will appear at the same site. may appear to be bound to These oligonucleotide probe species should have complementary sequences, then determine which strand of each of the two oligonucleotide probe species bound, which is a prerequisite for accurately compiling the sequence of the target nucleic acid. becomes difficult to do.

一部の実施形態では、単一のオリゴヌクレオチドプローブ種の結合事象が、第1の標的核酸鎖または第2の標的核酸鎖に結合しているかどうかの決定は、得られた光学活性のデータの完全なセットを考慮しなければならない。例えば、オリゴヌクレオチドプローブ種の2つのタイリングシリーズが、問題の場所をカバーする場合、シグナルを生成するオリゴヌクレオチドプローブ種の配列のどのシリーズが重複するか基づいて、2つのタイリングシリーズのどちらにシグナルが帰属するかが割り当てられる。次いで、一部の実施形態では、配列は、最初に、結合および配列重複の場所を使用して、各タイリングシリーズを構築することによって、アセンブリすることができる。次いで、2つのタイリングシリーズは、逆相補体として整列され、2つの鎖の配列データがこれらの場所の各々で完全な逆相補体である場合にのみ、各場所での塩基割当が受け入れられる(例えば、したがって、二重鎖コンセンサス配列を提供する)。 In some embodiments, determining whether a single oligonucleotide probe species binding event binds to the first target nucleic acid strand or the second target nucleic acid strand is a function of the obtained optical activity data. A complete set must be considered. For example, if two tiling series of oligonucleotide probe species cover the location of interest, which of the two tiling series is selected based on which series of sequences of the oligonucleotide probe species that produce the signal overlap. A signal is assigned whether it is attributed. In some embodiments, sequences can then be assembled by first building each tiling series using the locations of joins and sequence overlaps. The two tiling series are then aligned as reverse complements, and base assignments at each location are accepted only if the sequence data for the two strands are perfect reverse complements at each of these locations ( For example, thus providing a duplex consensus sequence).

一部の実施形態では、配列決定の不一致は、2つの可能性のうちの1つが、独立した不一致結合事象などの追加の層の情報によって裏付けられる必要がある、曖昧なベースコールであるとフラグ付けされる。一部の実施形態では、二重鎖コンセンサスが得られたら、ゲノムの同じ領域をカバーする他の標的核酸からのデータを比較することによって、従来の(多分子)コンセンサスが決定される(例えば、複数の細胞からの結合部位の情報が利用可能である場合)。かかるアプローチの1つの問題は、ハプロタイプ配列を含む異なる標的核酸の可能性である。 In some embodiments, sequencing discrepancies are flagged as ambiguous base calls in which one of the two possibilities must be corroborated by an additional layer of information such as an independent mismatch binding event. attached. In some embodiments, once a duplex consensus is obtained, the conventional (multimolecular) consensus is determined by comparing data from other target nucleic acids covering the same region of the genome (e.g. (if binding site information from multiple cells is available). One problem with such an approach is the possibility of different target nucleic acids containing haplotype sequences.

代替的に、一部の実施形態では、個々の鎖コンセンサスを得た後、個々の鎖コンセンサスの二重鎖コンセンサスを得る。かかる実施形態では、二重鎖標的核酸の各鎖の配列が、同時に得られる。これは、一部の実施形態では、追加の試料調製ステップを必要とせずに実現され、分子バーコードを用いた二重鎖標的核酸の鎖のかかる差次的なタグ付けは、現在のNGS法とは異なる(例えば、Salk et al.,Proc.Natl.Acad.Sci.109(36),2012に記載されている)。 Alternatively, in some embodiments, an individual strand consensus is obtained followed by a duplex consensus of the individual strand consensus. In such embodiments, the sequence of each strand of a double-stranded target nucleic acid is obtained simultaneously. This is accomplished, in some embodiments, without the need for additional sample preparation steps, and such differential tagging of strands of double-stranded target nucleic acids with molecular barcodes is a feature of current NGS methods. (described, for example, in Salk et al., Proc. Natl. Acad. Sci. 109(36), 2012).

センス鎖およびアンチセンス鎖の両方の同時配列取得は、ナノポア配列決定に利用される2Dまたは1Dコンセンサス配列決定と比較して有利である。これらの代替方法は、第2の鎖の配列を得る前に、二重鎖の一方の鎖の配列を得る必要がある。一部の実施形態では、二重鎖コンセンサス配列決定は、10の範囲における正確度、例えば、(他のNGSアプローチの10~10の生の正確度と比較して)100万塩基中に1つの誤差を提供し得る。これにより、本方法は、がん状態を示す希少バリアント(例えば、セルフリーDNAに存在するバリアントなど)または腫瘍細胞集団に低頻度で存在するバリアントを解決する必要性と非常に適合する。 Simultaneous sequence acquisition of both sense and antisense strands is advantageous compared to 2D or 1D two -consensus sequencing utilized for nanopore sequencing. These alternative methods require obtaining the sequence of one strand of the duplex before obtaining the sequence of the second strand. In some embodiments, duplex consensus sequencing has an accuracy in the range of 10 6 , e.g. can provide one error in This makes the method highly compatible with the need to resolve rare variants that are indicative of cancer conditions, such as those present in cell-free DNA, or variants that are present at low frequencies in tumor cell populations.

単細胞解像配列決定
様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含み得る。一部の実施形態では、単一細胞は、他の細胞との結合を含まない。一部の実施形態では、単一細胞は、クラスター中または組織中で、他の細胞に付着している。一部の実施形態では、そのような細胞は、個々の非付着細胞に脱凝集される。
Single Cell Resolution Sequencing In various embodiments, the method may further comprise sequencing the genome of the single cell. In some embodiments, a single cell does not contain association with other cells. In some embodiments, single cells are attached to other cells in clusters or tissues. In some embodiments, such cells are disaggregated into individual non-adherent cells.

一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造(例えば、フローセルまたはマイクロウェル)の入口に、流体的に移される(例えば、ピペットを使用することによって)。一部の実施形態では、脱凝集は、細胞をピペッティングすることによって、プロテアーゼ、超音波処理、または物理的撹拌を適用することによって行われる。一部の実施形態では、細胞は、脱凝集された後、それらが伸長される構造に、流体的に移される。 In some embodiments, the cells are disaggregated and then fluidically transferred (e.g., by using a pipette) to the inlet of a structure (e.g., a flow cell or microwell) where the polynucleotides are elongated. . In some embodiments, disaggregation is performed by pipetting the cells, applying proteases, sonication, or physical agitation. In some embodiments, cells are fluidically transferred to a structure in which they are elongated after being disaggregated.

一部の実施形態では、単一細胞が単離され、標的核酸が単一細胞から遊離され、その結果、同じ細胞に由来するすべての標的核酸が互いに近接したまま配置され、かつ他の細胞の内容物が配置される場所とは異なる場所に配置される。一部の実施形態では、Di Carlo et al.,Lab Chip 6:1445-1449,2006に記載されているように、トラップ構造が使用される。 In some embodiments, a single cell is isolated and the target nucleic acid is released from the single cell such that all target nucleic acids from the same cell remain in close proximity to each other and are isolated from other cells. Placed in a different location than where the contents are placed. In some embodiments, Di Carlo et al. , Lab Chip 6:1445-1449, 2006, trap structures are used.

一部の実施形態では、複数の単一細胞を捕捉および単離するマイクロ流体アーキテクチャ(例えば、図16Aおよび図16Bに示されるようにトラップが離れている場合)、または複数の非単離細胞を捕捉するアーキテクチャ(例えば、トラップが連続している場合)のいずれかを使用することが可能である。一部の実施形態では、トラップは、単一細胞(例えば、2μM~10μM)の寸法である。一部の実施形態では、フローセルは、長さが数百ミクロン~数ミリメートルであり、深さが約30ミクロンである。 In some embodiments, a microfluidic architecture that captures and isolates multiple single cells (e.g., when the traps are spaced apart as shown in FIGS. 16A and 16B), or multiple non-isolated cells. It is possible to use any of the catching architectures (eg if the traps are continuous). In some embodiments, the trap is the size of a single cell (eg, 2-10 μM). In some embodiments, the flow cell is hundreds of microns to several millimeters long and about 30 microns deep.

一部の実施形態では、例えば、図17に示されるように、単一細胞が、送達チャネル1702に流し込まれ、トラップされ1704、ポリヌクレオチドを遊離し、次いで、伸長される。一部の実施形態では、細胞1602が、溶解され1706、次いで細胞核は、第2の溶解ステップ1708を通して溶解され、したがって、細胞外ポリヌクレオチドおよび細胞内ポリヌクレオチド1608が順次遊離される。任意選択的に、核外ポリヌクレオチドおよび核内ポリヌクレオチドの両方が、単一の溶解ステップを使用して遊離される。遊離後、ポリヌクレオチド1608は、フローセル2004の長さに沿って固定化され、伸長される。一部の実施形態では、トラップは、単一細胞の寸法(例えば、2μM~10μM幅)である。一実施形態では、トラップの寸法は、底部で4.3μM幅、中深部で6μm幅、および上部で8μm幅、深さが33μmであり、デバイスは、射出成形を使用して環状オレフィン(COC)から作製される。 In some embodiments, for example, as shown in FIG. 17, single cells are flowed into delivery channel 1702, trapped 1704, releasing polynucleotides, and then elongated. In some embodiments, the cells 1602 are lysed 1706 and then the cell nuclei are lysed through a second lysis step 1708, thus liberating extracellular and intracellular polynucleotides 1608 sequentially. Optionally, both the extranuclear and intranuclear polynucleotides are released using a single lysis step. After release, polynucleotide 1608 is immobilized and elongated along the length of flow cell 2004 . In some embodiments, traps are single cell dimensions (eg, 2 μM to 10 μM wide). In one embodiment, the trap dimensions are 4.3 μM wide at the bottom, 6 μm wide at mid-depth, and 8 μm wide, 33 μm deep at the top, and the device is made of cyclic olefin (COC) using injection molding. made from

一部の実施形態では、単一細胞は、個々のチャネルに溶解され、各個々の細胞を、トランスポザーゼ媒介の組み込みを介して固有のタグ配列と反応させ、その後、ポリヌクレオチドが組み合わされ、同じ混合物中で配列決定される。一部の実施形態では、トランスポザーゼ複合体は、細胞にトランスフェクトされるか、または細胞を含む液滴に融合される液滴中にある。 In some embodiments, single cells are lysed into individual channels, each individual cell is reacted with a unique tag sequence via transposase-mediated integration, and the polynucleotides are then combined into the same mixture. sequenced in In some embodiments, the transposase complex is in a droplet that is transfected into a cell or fused to a droplet containing the cell.

一部の実施形態では、凝集体は、細胞の小さなクラスターであり、一部の実施形態では、クラスター全体が、同じ配列決定タグでタグ付けされる。一部の実施形態では、細胞は凝集しておらず、循環腫瘍細胞(CTC)または循環胎児細胞などの遊離した浮遊細胞である。 In some embodiments, aggregates are small clusters of cells, and in some embodiments the entire cluster is tagged with the same sequencing tag. In some embodiments, the cells are not aggregated and are free floating cells such as circulating tumor cells (CTCs) or circulating fetal cells.

単一細胞配列決定において、細胞溶解後の自発的なシトシン脱アミノ化によって引き起こされるシトシンからチミンへの一塩基バリアントの問題が存在する。これは、配列決定の前に、試料をウラシルN-グリコシラーゼ(UNG)で前処理することによって克服される(例えば、Chen et al.,Mol Diagn Ther.18(5):587-593,2014に記載されている)。 In single cell sequencing, there is a problem of cytosine to thymine single nucleotide variants caused by spontaneous cytosine deamination after cell lysis. This is overcome by pretreating samples with uracil N-glycosylase (UNG) prior to sequencing (see, eg, Chen et al., Mol Diagn Ther. 18(5):587-593, 2014). Have been described).

ハプロタイプの識別。
様々な実施形態では、上に記載の方法は、ハプロタイプを配列決定するために使用される。ハプロタイプの配列決定は、本明細書に記載の方法を使用して、二倍体ゲノムのハプロタイプにわたる第1の標的核酸を配列決定することを含む。二倍体ゲノムの第2のハプロタイプ領域にわたる第2の標的核酸も配列決定されなければならない。第1および第2の標的核酸は、相同染色体の異なるコピーから得られるであろう。第1および第2の標的ポリヌクレオチドの配列を比較し、それによって、第1および第2の標的核酸上のハプロタイプを決定する。
Haplotype identification.
In various embodiments, the methods described above are used to sequence haplotypes. Haplotype sequencing comprises sequencing the first target nucleic acid across the haplotypes of the diploid genome using the methods described herein. A second target nucleic acid spanning a second haplotype region of the diploid genome must also be sequenced. The first and second target nucleic acids will be obtained from different copies of homologous chromosomes. The sequences of the first and second target polynucleotides are compared, thereby determining haplotypes on the first and second target nucleic acids.

したがって、実施形態から得られる単一分子のリードおよびアセンブリは、ハプロタイプ特異的であると分類される。アセンブリが断続的な場合だけ、ハプロタイプ特異的な情報が、必ずしも長い範囲にわたって容易に得られるとは限らない。かかる実施形態では、それにもかかわらず、リードの場所が提供される。このような状況でも、ゲノムの同じセグメントをカバーする複数のポリヌクレオチドを分析すると、ハプロタイプが計算的に決定される。 Thus, the single molecule reads and assemblies resulting from the embodiments are classified as haplotype-specific. Haplotype-specific information is not always readily available over long ranges only when assembly is intermittent. In such embodiments, lead locations are nevertheless provided. Even in this situation, analysis of multiple polynucleotides covering the same segment of the genome will computationally determine the haplotype.

一部の実施形態では、相同分子は、ハプロタイプまたは親染色体の特異性に従って分離される。実際に物理的または視覚的に、本開示の方法によって得られた情報の視覚的性質は、特定のハプロタイプを示すことができる。一部の実施形態では、ハプロタイプの解像度は、改善された遺伝子または祖先の研究を行うことを可能にする。他の実施形態では、ハプロタイプの分解能は、より良好な組織型決定を行うことを可能にする。一部の実施形態では、ハプロタイプの分解能または特定のハプロタイプの検出は、診断を行うことを可能にする。 In some embodiments, homologous molecules are segregated according to haplotype or parental chromosome specificity. Physically or visually in nature, the visual nature of the information obtained by the methods of the present disclosure can indicate a particular haplotype. In some embodiments, haplotype resolution allows improved genetic or ancestry studies to be performed. In other embodiments, haplotype resolution allows for better tissue typing. In some embodiments, haplotype resolution or detection of specific haplotypes allows diagnosis to be made.

複数の細胞由来のポリヌクレオチドの同時配列決定
様々な実施形態では、上に記載の方法は、各ポリヌクレオチドがその起源の細胞の情報を保持する複数の細胞(または核)由来のポリヌクレオチドを配列決定するために使用される。
Simultaneous Sequencing of Polynucleotides from Multiple Cells In various embodiments, the methods described above sequence polynucleotides from multiple cells (or nuclei), each polynucleotide carrying information about its cell of origin. used to determine

特定の実施形態では、トランスポゾン媒介性の配列挿入は、細胞内で媒介され、各挿入は、起源の細胞の標識としての固有のID配列タグを含む。他の実施形態では、トランスポゾン媒介性の挿入は、単一細胞が単離された容器(例えば、アガロースビーズ、油-水滴などを含む容器)内で生じる。固有のタグは、タグを有するすべてのポリヌクレオチドが同じ細胞に由来しなければならないことを示す。次いで、すべてのDNAおよび/またはRNAが抽出され、混合され、伸長される。次いで、本明細書に記載の実施形態による配列決定(または任意の他の配列決定方法)が標的核酸上で行われる場合、ID配列タグのリードは、標的核酸がどの細胞に由来するかを示す。一部の実施形態では、細胞識別タグは短い。10,000個の細胞について(例えば、腫瘍微量剖検から)、約65,000個の固有配列は、8ヌクレオチド長の識別子配列によって提供され、約100万個の固有配列は、10ヌクレオチド長の識別子配列によって提供される。 In certain embodiments, transposon-mediated sequence insertions are mediated intracellularly and each insertion contains a unique ID sequence tag as a marker of the cell of origin. In other embodiments, transposon-mediated insertion occurs within a vessel in which single cells are isolated (eg, a vessel containing agarose beads, oil-water droplets, etc.). A unique tag indicates that all polynucleotides bearing the tag must come from the same cell. All DNA and/or RNA is then extracted, mixed and elongated. When sequencing (or any other sequencing method) according to the embodiments described herein is then performed on the target nucleic acid, the ID sequence tag read indicates from which cell the target nucleic acid is derived. . In some embodiments, cell identification tags are short. For 10,000 cells (e.g., from a tumor micropsy), about 65,000 unique sequences are provided by 8-nucleotide-long identifier sequences, and about 1 million unique sequences are provided by 10-nucleotide-long identifier sequences. Provided by an array.

一部の実施形態では、個々の細胞は、同一性(ID)タグを用いてタグ付けされる。図19に示されるように、一部の実施形態では、同一性タグは、タグ付けによってポリヌクレオチドに組み込まれ、試薬が、単一細胞に直接提供されるか、または細胞と融合もしくは包接する微小液滴1802中に提供される。各細胞は、異なるIDタグ(例えば、100万個超の可能なタグなどの大きなセットから)を受け取る。微小液滴および細胞1804が融合した後、IDタグは、個々の細胞内のポリヌクレオチドに組み込まれる。個々の細胞の内容物は、フローセル2004内で混合される。次いで、(例えば、本明細書に開示される方法によって)配列決定は、特定の標的核酸が、どの細胞に由来するかを明らかにする。代替的な実施形態では、微小液滴は、細胞を包み込み、タグ付け試薬を細胞に送達する(例えば、細胞内に拡散するか、または細胞内容物を微小液滴内に破裂させることによって)。 In some embodiments, individual cells are tagged with an identity (ID) tag. As shown in FIG. 19, in some embodiments, identity tags are incorporated into polynucleotides by tagging, and reagents are provided directly to single cells, or microencapsulated cells that are fused or encapsulated with cells. provided in droplet 1802 . Each cell receives a different ID tag (eg, from a large set of over one million possible tags). After the microdroplet and cell 1804 fuse, the ID tags are incorporated into polynucleotides within individual cells. The contents of individual cells are mixed within flow cell 2004 . Sequencing (eg, by the methods disclosed herein) then reveals from which cell a particular target nucleic acid is derived. In alternative embodiments, the microdroplet envelops the cell and delivers the tagging reagent to the cell (eg, by diffusing into the cell or bursting the cell contents into the microdroplet).

この同じインデックス化の原理は、その目的が、試料を混合し、それらを一緒に配列決定することだけではなく、各個々の試料に関する配列情報を回収することである場合、細胞以外の(例えば、異なる個体由来の)試料に適用される。 This same indexing principle applies to non-cellular (e.g., It applies to samples (from different individuals).

さらに、複数の細胞が配列決定される場合、細胞集団におけるハプロタイプの多様性および頻度を決定することが可能である。一部の実施形態では、分子が十分に長い場合、細胞集団に存在する異なる染色体、長い染色体セグメント、またはハプロタイプが決定されるため、単一細胞の内容物を一緒に保持する必要性がなく、集団におけるゲノムの不均一性が分析される。これは、どの2つのハプロタイプが一緒に細胞内に存在するかを示すものではないが、ゲノム構造タイプ(またはハプロタイプ)の多様性およびそれらの頻度、ならびにどの異常な構造バリアントが存在するかについて報告する。 Furthermore, when multiple cells are sequenced, it is possible to determine the diversity and frequency of haplotypes in a cell population. In some embodiments, if the molecule is long enough, the different chromosomes, long chromosome segments, or haplotypes present in the cell population are determined without the need to hold the contents of a single cell together. Genomic heterogeneity in the population is analyzed. It does not indicate which two haplotypes exist together in a cell, but reports on the diversity of genomic structural types (or haplotypes) and their frequencies, as well as which aberrant structural variants are present. do.

一部の実施形態では、標的核酸がRNAであり、cDNAコピーが配列決定される場合、タグの添加は、タグ配列を含むプライマーを用いたcDNA合成を含む。RNAが直接配列決定される場合、T4 RNAリガーゼを使用して、タグをRNAの3’末端にライゲーションすることによって、タグを添加する。タグを生成する代替方法は、4つのA、C、G、およびT塩基のうちの2つ以上のヌクレオチドを用いて、ターミナルトランスフェラーゼでRNAまたはDNAを伸長することであり、各個々のポリヌクレオチドは、その上に、ヌクレオチドの固有配列が確率的にテール付けされる。 In some embodiments, when the target nucleic acid is RNA and the cDNA copy is to be sequenced, adding the tag comprises cDNA synthesis using a primer containing the tag sequence. If the RNA is to be sequenced directly, the tag is added by ligating it to the 3' end of the RNA using T4 RNA ligase. An alternative method of generating tags is to extend RNA or DNA with terminal transferase with two or more nucleotides of the four A, C, G, and T bases, each individual polynucleotide , onto which a unique sequence of nucleotides is probabilistically tailed.

一部の実施形態では、タグ配列の量を短く保つように維持することで、より多くの配列リードが、ポリヌクレオチド配列の配列決定自体に寄与するようにするために、タグ配列が、いくつかの部位にわたって分配される。ここで、複数の短い識別子配列が、例えば、3つ、各細胞または容器に導入される。次に、ポリヌクレオチドに沿って分布するタグのビットから、ポリヌクレオチドの起点を決定する。したがって、この場合、1つの場所から読み出されるタグのビットは、起源の細胞を決定するのに十分ではないが、複数のタグビットの決定を行うには十分である。 In some embodiments, the amount of tag sequence is kept short so that more sequence reads contribute to the sequencing of the polynucleotide sequence itself, so that the tag sequence is distributed over the site of Here, a plurality of short identifier sequences are introduced into each cell or vessel, eg three. The origin of the polynucleotide is then determined from the bits of the tag distributed along the polynucleotide. Thus, in this case, the tag bit read from one location is not sufficient to determine the cell of origin, but is sufficient to make multiple tag bit determinations.

構造バリアントの検出
一部の実施形態では、検出された配列と参照ゲノムとの間の差異は、置換、インデル、および構造多型を含む。特に、参照配列が本開示の方法によってアセンブリされていない場合、典型的には、反復は圧縮され、アセンブリが反復を解凍する。
Detection of Structural Variants In some embodiments, differences between the detected sequence and the reference genome comprise substitutions, indels, and structural polymorphisms. In particular, if the reference sequence has not been assembled by the methods of the present disclosure, typically the repeats are compressed and assembly decompresses the repeats.

一部の実施形態では、ポリヌクレオチドに沿った一連の配列リードの方向は、逆位事象が生じたかどうかを報告する。参照と比較して他のリードと反対方向にある1つ以上のリードは、反転を示す。 In some embodiments, the orientation of a series of sequence reads along the polynucleotide reports whether an inversion event has occurred. One or more leads in the opposite direction to the other leads relative to the reference indicates a reversal.

一部の実施形態では、その近傍の他のリードの文脈では予想されない1つ以上のリードの存在は、参照と比較して、再編成または転座を示す。参照におけるリードの場所は、ゲノムのどの部分が別の部分にシフトしたかを示す。場合によっては、その新しい場所におけるリードは、転座ではなく重複である。 In some embodiments, the presence of one or more reads not expected in the context of other reads in their vicinity is indicative of a rearrangement or translocation compared to the reference. The location of the read in the reference indicates which part of the genome has shifted to another part. In some cases, the read at its new location is a duplication rather than a translocation.

一部の実施形態では、反復領域またはコピー数バリエーションを検出することも可能である。パラロガスなバリエーションを有するリードまたは関連するリードの反復的な発生は、ゲノムの複数の場所で発生する複数のリードまたは非常に類似したリードとして観察される。これらの複数の場所は、場合によっては、(例えば、サテライトDNAでのように)一緒に密接に充填されているか、または、他の場合、(例えば、偽遺伝子でのように)ゲノムにわたって分散している。本開示の方法は、短いタンデムリピート(STR)、可変数タンデムリピート(VNTR)、トリヌクレオチドリピートなどに適用される。特異的リードの不在または反復は、それぞれ欠失または増幅が生じたことを示す。一部の実施形態では、本明細書に記載の方法は、ポリヌクレオチドに複数のおよび/または複雑な再編成が存在する場合、特に適用される。本明細書に記載の方法は、単一のポリヌクレオチドを分析することに基づいているため、一部の実施形態では、上に記載の構造バリアントは、少数の細胞(例えば、集団由来のわずか1%の細胞)で稀に生じるものまで解像される。 In some embodiments, it is also possible to detect repeat regions or copy number variations. Repeated occurrences of reads with paralogous variations or related reads are observed as multiple reads occurring at multiple locations in the genome or reads that are very similar. These multiple locations are in some cases closely packed together (as in satellite DNA) or in other cases dispersed throughout the genome (as in pseudogenes). ing. The disclosed methods apply to short tandem repeats (STR), variable number tandem repeats (VNTR), trinucleotide repeats, and the like. Absence or repetition of a specific read indicates that deletion or amplification, respectively, has occurred. In some embodiments, the methods described herein are particularly applicable when multiple and/or complex rearrangements are present in the polynucleotide. Since the methods described herein are based on analyzing single polynucleotides, in some embodiments the structural variants described above are isolated from a small number of cells (e.g., as few as 1 from a population). % cells) are resolved.

同様に、一部の実施形態では、セグメント重複、すなわちデュプリコンは、ゲノム内で正しく位置決定される。セグメント重複は、典型的には、ほぼ同一の配列のDNA配列の長い領域(例えば、1キロ塩基長を超える)である。これらのセグメント重複は、体細胞変異を含む、個々のゲノムにおける多くの構造多型を引き起こす。セグメント重複は、ゲノムの遠位部分に存在し得る。現在の次世代配列決定では、リードがどのセグメント重複から生じるかを決定することは困難である(したがって、アセンブリを複雑にする)。本開示の一部の実施形態では、配列リードは、長い分子(例えば、0.1~10メガ塩基長の範囲)にわたって得られ、通常、リードを使用して、ゲノムのどのセグメントがデュプリコンに対応するゲノムの特定のセグメントに隣接しているかを決定することによって、デュプリコンのゲノムコンテキストを決定することが可能である。 Similarly, in some embodiments, segmental duplications, ie duplicons, are correctly positioned within the genome. Segmental overlaps are typically long regions of DNA sequences (eg, greater than 1 kilobase long) of nearly identical sequence. These segmental duplications give rise to many structural polymorphisms in individual genomes, including somatic mutations. Segmental duplications can occur in distal portions of the genome. With current next-generation sequencing, it is difficult to determine which segment duplication a read originates from (thus complicating assembly). In some embodiments of the present disclosure, sequence reads are obtained over long molecules (eg, in the range of 0.1-10 megabases in length), and typically the reads are used to identify which segments of the genome become duplicons. It is possible to determine the genomic context of a duplicon by determining its flanking particular segments of the corresponding genome.

構造バリアントのブレークポイントは、本開示の一部の実施形態では、正確に位置決定される。一部の実施形態では、ゲノムの2つの部分が融合していることを検出することが可能であり、ブレークポイントが生じた正確な個々のリードが決定される。本明細書に記載されるように収集された配列リードは、2つの融合した領域のキメラを含み、ブレークポイントの一方の側のすべての配列は、融合したセグメントの一方に対応し、他方の側は、融合したセグメントの他方である。これにより、ブレークポイント周辺の構造が複雑な場合であっても、ブレークポイントを決定する信頼度が高くなる。一部の実施形態では、正確な染色体ブレークポイント情報は、疾患機序の理解、特定の転座の発生の検出、または疾患の診断において使用される。 Structural variant breakpoints are precisely located in some embodiments of the present disclosure. In some embodiments, it is possible to detect the fusion of two parts of the genome and determine the exact individual read where the breakpoint occurred. Sequence reads collected as described herein contain chimeras of two fused regions, with all sequences on one side of the breakpoint corresponding to one of the fused segments and is the other of the fused segments. This increases the reliability of determining breakpoints even when the structure around the breakpoint is complex. In some embodiments, precise chromosomal breakpoint information is used in understanding disease mechanisms, detecting the occurrence of specific translocations, or diagnosing disease.

エピゲノム修飾の位置決定
一部の実施形態では、本方法は、固定二本鎖標的核酸または固定された第1の鎖および天然二重鎖標的核酸の固定された第2の鎖を、抗体、アフィマー、ナノボディ、アプタマー、またはメチル結合タンパク質に曝露して、それによって、核酸への修飾を決定するか、または試験基板上の複数の位置のセットからの核酸の部分の配列と相関させることをさらに含む。一部の抗体は、二本鎖または一本鎖に結合する。メチル結合タンパク質は、クロマチンの場合と同様に、二本鎖ポリヌクレオチドに結合することが予想される。
Localization of Epigenome Modifications In some embodiments, the method comprises immobilizing an immobilized double-stranded target nucleic acid or an immobilized first strand and an immobilized second strand of a native double-stranded target nucleic acid with an antibody, an affimer , a nanobody, an aptamer, or a methyl-binding protein, thereby determining modifications to the nucleic acid or correlating with the sequence of portions of the nucleic acid from a set of multiple locations on the test substrate. . Some antibodies bind double chains or single chains. Methyl-binding proteins are expected to bind double-stranded polynucleotides, as they do to chromatin.

一部の実施形態では、天然ポリヌクレオチドは、配列決定のために呈示される前にプロセシングを必要としない。これにより、本方法は、DNAの化学修飾が所定の位置に留まるため、エピゲノム情報を、配列情報と統合することができる。一部の実施形態では、ポリヌクレオチドは、方向的に十分に整列しており、したがって、撮像、画像処理、ベースコールおよびアセンブリが比較的容易であり、配列の誤差率が低く、カバレッジが高い。本開示を実施するために、いくつかの実施形態が記載されているが、各実施形態は、試料調製の負担が完全にまたはほぼ完全に排除されるように行われる。 In some embodiments, native polynucleotides do not require processing prior to presentation for sequencing. This allows the method to integrate epigenomic information with sequence information because chemical modifications of DNA remain in place. In some embodiments, the polynucleotides are well-aligned directionally, thus providing relatively easy imaging, image processing, base calling and assembly, low sequence error rates, and high coverage. Several embodiments are described for carrying out the present disclosure, each embodiment being performed in such a way that the burden of sample preparation is completely or almost completely eliminated.

これらの方法は、増幅なしでゲノムDNAに対して実施されるため、一部の実施形態では、増幅バイアスおよびエラーに悩まされず、エピゲノムマークが保存され、(例えば、配列の取得とは直交的に)検出される。場合によっては、核酸がメチル化されているかどうかを、配列特異的な様式で決定することが有用である。例えば、胎児DNAを母体DNAから区別する1つの方法は、前者が目的の遺伝子座でメチル化されることである。これは、非侵襲的産前検査(NIPT)に有用である。 Because these methods are performed on genomic DNA without amplification, in some embodiments they do not suffer from amplification bias and errors, epigenomic marks are preserved, and (e.g., orthogonal to sequence acquisition ) is detected. In some cases it is useful to determine in a sequence specific manner whether a nucleic acid is methylated. For example, one way to distinguish fetal DNA from maternal DNA is that the former is methylated at the locus of interest. This is useful for non-invasive prenatal testing (NIPT).

哺乳動物においていくつかのシトシンバリアント、C5-メチルシトシン(5-mC)、C5-ヒドロキシメチルシトシン(5-hmC)、C5-ホルミルシトシン、およびC5-カルボキシルシトシンを生じる、炭素-5(C5)のアルキル化などの複数の種類のメチル化が可能である。また、真核生物および原核生物は、アデニンをN6-メチルアデニン(6-mA)にメチル化する。原核生物では、N4-メチルシトシンも頻繁に見られる。 of carbon-5 (C5), which produces several cytosine variants in mammals, C5-methylcytosine (5-mC), C5-hydroxymethylcytosine (5-hmC), C5-formylcytosine, and C5-carboxylcytosine Multiple types of methylation are possible, including alkylation. Eukaryotes and prokaryotes also methylate adenine to N6-methyladenine (6-mA). N4-methylcytosine is also frequently found in prokaryotes.

抗体は、利用可能であるか、またはこれらの修飾のそれぞれに対して産生され、ならびに目的に応じて、任意の他のものが構築される。修飾を標的とするアフィマー、ナノボディ、またはアプタマーは、フットプリントがより小さい可能性があるため、特に関連している。本発明における抗体への任意の言及は、アフィマー、ナノボディ、アプタマー、および任意の類似の試薬を含むと解釈されるべきである。加えて、他の天然に存在するDNA結合タンパク質、例えば、メチルタンパク質(MBD1、MBD2など)が、一部の実施形態で使用される。 Antibodies are available or produced against each of these modifications, as well as any others, depending on the purpose. Affimers, nanobodies or aptamers that target modifications are of particular relevance due to their potentially smaller footprint. Any reference to antibodies in the present invention should be construed to include affimers, nanobodies, aptamers and any similar reagents. In addition, other naturally occurring DNA binding proteins such as methyl proteins (MBD1, MBD2, etc.) are used in some embodiments.

一部の実施形態では、メチル化分析は、配列決定とは直交的に実施される。一部の実施形態では、これは、配列決定の前に行われる。一例として、抗メチルC抗体またはメチル結合タンパク質(MeCP2、MBD1、MBD2、およびMBD4を含むメチル結合ドメイン(MBD)タンパク質ファミリー)、または(MBD1に基づく)ペプチドは、一部の実施形態では、ポリヌクレオチドに結合し、標識を介してそれらの場所が検出された後、(例えば、高塩緩衝液、カオトロフィック試薬、SDS、プロテアーゼ、尿素、および/またはヘパリンを添加することによって)それらが除去される。一部の実施形態では、オン・オフ結合を促進するか、または一過的に結合するように操作されている試薬を使用することで、試薬が一過的に結合し得る。ヒドロキシメチル化またはDNA損傷部位などの他のポリヌクレオチド修飾の場合も、同様のアプローチが使用され、そのための抗体は、入手可能であるか、または産生される。修飾の場所が検出され、修飾結合試薬が除去された後、配列決定が開始される。一部の実施形態では、抗メチル抗体および抗ヒドロキシメチル抗体などが、標的ポリヌクレオチドが一本鎖になるように変性された後に、添加される。この方法は、非常に感度が高く、長いポリヌクレオチド上の単一の修飾を検出することができる。 In some embodiments, methylation analysis is performed orthogonally to sequencing. In some embodiments, this is done prior to sequencing. As an example, an anti-methyl C antibody or a methyl binding protein (the methyl binding domain (MBD) protein family, including MeCP2, MBD1, MBD2, and MBD4), or a peptide (based on MBD1), in some embodiments, is a polynucleotide after their location has been detected via labeling, they are removed (e.g., by adding high salt buffers, chaotrophic reagents, SDS, proteases, urea, and/or heparin). be. In some embodiments, reagents can be transiently bound by facilitating on-off binding or by using reagents that have been engineered to transiently bind. A similar approach is used for other polynucleotide modifications, such as hydroxymethylation or sites of DNA damage, for which antibodies are available or produced. After the sites of modification are detected and the modified binding reagents are removed, sequencing is initiated. In some embodiments, anti-methyl antibodies, anti-hydroxymethyl antibodies, and the like are added after the target polynucleotide is denatured to be single stranded. This method is very sensitive and can detect single modifications on long polynucleotides.

図19は、単一細胞からのDNAおよびRNAの抽出および伸展、ならびにDNAおよびRNAの差次的標識(例えば、それぞれmCおよびm6Aに対する抗体を用いた)を示す。細胞1602は、表面に固定化され、次いで、溶解される(1902)。溶解によって核1604から遊離される核酸1608は、固定化され、伸長される1904。次いで、核酸は、付加されたDNAタグ1910および1912を有する抗体に曝露され、抗体によって結合される。一部の実施形態では、タグは、DNA PAINTベースの単一分子局在化のための蛍光色素またはオリゴヌクレオチドドッキング配列である。一部の実施形態では、タグおよびDNA PAINTを使用する代わりに、抗体または他の結合タンパク質が、単一の蛍光標識または複数の蛍光標識のいずれかで直接蛍光標識される。抗体がコード化される場合、標識化の一例が、図14A、図14Cおよび図14Dに示される。一部の実施形態では、DNAおよびRNAの両方のエピ修飾分析が、本明細書に記載の配列決定方法を使用したそれらの配列と共役される。 FIG. 19 shows extraction and spreading of DNA and RNA from single cells and differential labeling of DNA and RNA (eg, with antibodies against mC and m6A, respectively). Cells 1602 are immobilized on a surface and then lysed (1902). Nucleic acids 1608 released from nuclei 1604 by lysis are immobilized and elongated 1904 . The nucleic acids are then exposed to and bound by antibodies that have DNA tags 1910 and 1912 attached. In some embodiments, the tag is a fluorescent dye or an oligonucleotide docking sequence for DNA PAINT-based single-molecule localization. In some embodiments, instead of using tags and DNA PAINT, antibodies or other binding proteins are directly fluorescently labeled with either a single fluorescent label or multiple fluorescent labels. When antibodies are encoded, an example of labeling is shown in Figures 14A, 14C and 14D. In some embodiments, epimodification analysis of both DNA and RNA is coupled with their sequences using the sequencing methods described herein.

一部の実施形態では、結合タンパク質によるメチル化の検出に加えて、結合部位におけるメチル化の存在は、修飾が標的核酸部位に存在しないときと比較した、修飾が存在するときの差次的なオリゴヌクレオチドの結合挙動によって、検出される。 In some embodiments, in addition to detecting methylation by the binding protein, the presence of methylation at the binding site is differential when the modification is present compared to when the modification is absent at the target nucleic acid site. It is detected by the binding behavior of the oligonucleotide.

一部の実施形態では、バイサルファイト処理は、メチル化を検出するのに使用される。ここで、オリゴヌクレオチドプローブ種の完全なセットを通して実行した後、バイサルファイト処理を使用して、非メチル化シトシンをウラシルに変換し、次いで、オリゴヌクレオチドプローブの完全なセットを再び適用する。バイサルファイト処理前のヌクレオチド位置が、Cと読まれ、バイサルファイト処理後にUと読まれた場合、非メチル化とみなすことができる。 In some embodiments, bisulfite treatment is used to detect methylation. Here, after running through the complete set of oligonucleotide probe species, a bisulfite treatment is used to convert unmethylated cytosines to uracil, then the complete set of oligonucleotide probes is reapplied. If a nucleotide position reads C before bisulfite treatment and U after bisulfite treatment, it can be considered unmethylated.

メチル化などのDNA修飾用の参照エピゲノムは存在しない。有用であるためには、未知のポリヌクレオチドのメチル化マップを、配列ベースのマップに連結する必要がある。したがって、一部の実施形態では、エピマップにコンテキストを提供するために、エピマッピング法を、オリゴ結合によって得られた配列ビットと相関させる。一部の実施形態では、配列リードに加えて、他の種類のメチル化情報も共役される。これには、非限定的な例として、ニッキングエンドヌクレアーゼベースのマップ、オリゴヌクレオチドプローブ種結合ベースのマップ、および変性および変性-再生マップが含まれる。一部の実施形態では、1つ以上のオリゴヌクレオチドプローブ種の一過的な結合を使用して、ポリヌクレオチドをマッピングする。ゲノムへの機能的染色体またはクロマチンが、一部の実施形態では、DNA損傷部位およびタンパク質結合またはリガンド結合などのゲノムにマッピングする他の特徴に適用される。 There is no reference epigenome for DNA modifications such as methylation. To be useful, a methylation map of an unknown polynucleotide must be linked to a sequence-based map. Therefore, in some embodiments, the epimapping method is correlated with sequence bits obtained by oligoconjugation to provide context to the epimap. In some embodiments, other types of methylation information are also conjugated in addition to sequence reads. This includes, as non-limiting examples, nicking endonuclease-based maps, oligonucleotide probe species binding-based maps, and denaturation and denaturation-renaturation maps. In some embodiments, transient binding of one or more oligonucleotide probe species is used to map polynucleotides. Functional chromosome or chromatin to genome, in some embodiments, applies to sites of DNA damage and other features that map to the genome such as protein or ligand binding.

本開示では、塩基配列決定またはエピゲノム配列決定のいずれかが最初に行われる。一部の実施形態では、両方同時に行われる。例えば、特定のエピ修飾に対する抗体は、一部の実施形態では、オリゴから差次的にコードされる。かかる実施形態では、両方の種類のプローブの一過的な結合を促進する条件(例えば、低塩濃度)が使用される。 In this disclosure, either sequencing or epigenome sequencing is performed first. In some embodiments, both are done at the same time. For example, antibodies to particular epimodifications are in some embodiments differentially encoded from oligos. In such embodiments, conditions (eg, low salt concentration) are used that promote transient binding of both types of probes.

一部の実施形態では、ポリヌクレオチドが染色体またはクロマチンを含む場合、抗体を染色体またはクロマチン上で使用して、DNA上の修飾、およびヒストン上の修飾(例えば、ヒストンアセチル化およびメチル化)も検出する。これらの修飾の場所は、染色体またはクロマチン上の場所に対する抗体の一過的な結合によって決定される。一部の実施形態では、抗体は、オリゴタグで標識され、一過的に結合しないが、むしろそれらの結合部位に永久的または半永久的に固定される。かかる実施形態では、抗体は、オリゴタグを含み、これらの抗体結合部位の場所は、抗体タグ上のオリゴに対する相補オリゴの一過的な結合を使用することによって検出される。 In some embodiments, where the polynucleotide comprises a chromosome or chromatin, antibodies are used on the chromosome or chromatin to detect modifications on DNA, and also modifications on histones (e.g., histone acetylation and methylation). do. The location of these modifications is determined by transient binding of antibodies to locations on the chromosome or chromatin. In some embodiments, antibodies are labeled with oligotags that do not bind transiently, but rather are permanently or semi-permanently anchored to their binding sites. In such embodiments, the antibody comprises an oligotag and the location of these antibody binding sites is detected using transient binding of complementary oligos to the oligos on the antibody tag.

セルフリー核酸の単離および分析
診断に最もアクセス可能なDNAまたはRNAのいくつかは、体液または便の細胞外に見つかる。そのような核酸は、体内の細胞によってしばしば脱落したものである。血液中を循環するセルフリーDNAは、21番染色体トリソミーおよび他の染色体およびゲノム障害の出生前検査に使用される。それは、特定の病理状態のマーカーである腫瘍由来のDNAおよび他のDNAまたはRNAを検出する手段でもある。しかしながら、分子は、典型的には、小さなセグメント(例えば、血液中の約200塩基対の長さの範囲、および尿中のさらに短い範囲)に存在する。ゲノム領域のコピー数は、ゲノムの他の部分と比較して、参照の特定の領域に整列するリードの数と比較することによって、決定される。
Isolation and Analysis of Cell-Free Nucleic Acids Some of the most diagnostically accessible DNA or RNA is found extracellularly in bodily fluids or stool. Such nucleic acids are often shed by cells in the body. Cell-free DNA circulating in the blood is used for prenatal testing for trisomy 21 and other chromosomal and genomic disorders. It is also a means of detecting tumor-derived DNA and other DNA or RNA that are markers of certain pathological states. However, molecules are typically present in small segments, such as about 200 base pair long ranges in blood and even shorter ranges in urine. The copy number of a genomic region is determined by comparing the number of reads that align to a particular region of the reference relative to other parts of the genome.

一部の実施形態では、本開示の方法は、2つのアプローチによるセルフリーDNA配列の列挙または分析に適用される。1つ目は、変性の前または後に短い核酸を固定化することを伴う。一過性結合試薬は、核酸の同一性、そのコピー数、変異または特定のSNPアレルが存在するかどうか、ならびに検出された配列がメチル化されているか、または他の修飾(バイオマーカー)を有するかどうかを決定するために、核酸を照合するために使用される。 In some embodiments, the methods of the present disclosure are applied to enumerate or analyze cell-free DNA sequences by two approaches. The first involves immobilizing short nucleic acids before or after denaturation. Transient binding reagents determine the identity of the nucleic acid, its copy number, whether mutations or specific SNP alleles are present, and whether the detected sequence is methylated or has other modifications (biomarkers) Used to match nucleic acids to determine whether

2つ目のアプローチは、(例えば、セルフリー核酸が生体試料から単離された後に)小さい核酸断片を連結することを伴う。連結は、組み合わせた核酸を伸展させることを可能にする。連結は、DNAの末端を研磨し、平滑末端ライゲーションを行うことによって、行われる。代替的に、血液またはセルフリーDNAは、2つのアリコートに分割され、一方のアリコートは、ポリAでテール付加され(ターミナルトランスフェラーゼを使用して)、他方のアリコートは、ポリTによってテール付加される。 A second approach involves ligating small nucleic acid fragments (eg, after the cell-free nucleic acid has been isolated from a biological sample). Ligation allows extension of the combined nucleic acids. Ligation is performed by polishing the ends of the DNA and performing blunt-end ligation. Alternatively, blood or cell-free DNA is split into two aliquots, one aliquot tailed with poly-A (using terminal transferase) and the other aliquot tailed with poly-T. .

次いで、得られたコンカテマーを配列決定に供する。得られた「スーパー」配列リードを、次いで、参照と比較して、個々のリードを抽出する。個々のリードデータは、計算的に抽出され、次いで、他の短いリードデータと同じ様式で処理される。 The resulting concatemers are then subjected to sequencing. The resulting "super" sequence reads are then compared to references to extract individual reads. Individual lead data is computationally extracted and then processed in the same manner as other short lead data.

一部の実施形態では、生体試料は、便(核酸を分解する多数のエキソヌクレアーゼを含む媒体)を含む。かかる実施形態では、高濃度の二価カチオン(エキソヌクレアーゼが機能するために必要とする)のキレート剤(例えばEDTA)を用いて、DNAを十分にインタクトで維持し、配列決定を可能にする。一部の実施形態では、セルフリー核酸は、エキソソーム中のカプセル化を介して細胞から脱落する。エキソソームは、超遠心分離によって、またはスピンカラム(Qiagen)を使用することによって単離され、それに含まれるDNAまたはRNAが回収され、配列決定される。 In some embodiments, the biological sample comprises stool, a medium containing numerous exonucleases that degrade nucleic acids. In such embodiments, high concentrations of divalent cations (required by exonucleases to function) chelators (eg, EDTA) are used to keep the DNA sufficiently intact to permit sequencing. In some embodiments, cell-free nucleic acids are shed from cells via encapsulation in exosomes. Exosomes are isolated by ultracentrifugation or by using spin columns (Qiagen) and the DNA or RNA they contain is recovered and sequenced.

一部の実施形態では、メチル化情報は、上に記載の方法に従って、セルフリー核酸から得られる。 In some embodiments, methylation information is obtained from cell-free nucleic acids according to the methods described above.

配列決定技術の組み合わせ
一部の実施形態では、本明細書に記載の方法は、他の配列決定技術と組み合わされる。一部の実施形態では、一過的な結合による配列決定の後、第2の方法による配列決定が、同じ分子上で開始される。例えば、より長いより安定なオリゴヌクレオチドが結合して、合成による配列決定が開始される。一部の実施形態では、本方法は、完全なゲノム配列決定であることにとどまらず、Illumina由来のものなどの短いリード配列決定のための足掛かりを提供するために使用される。この場合、ゲノムのより均一なカバレッジを得るために、PCR増幅ステップを除外することによって、Illuminaライブラリの調製を行うことが有利である。これらの実施形態のいくつかの1つの利点は、必要とされる配列決定のカバレッジ倍率が、例えば、約40倍から20倍に半減することである。一部の実施形態では、これは、本明細書に記載の方法が提供する方法および場所情報によって行われる配列決定の追加によるものである。一部の実施形態では、任意選択的に、光学的に標識されるより長くより安定したオリゴは、ゲノム(例えば、BRCA1遺伝子座)の目的の特定の領域を、配列決定プロセスの一部または全体を通して短い配列決定オリゴとともに前にまたは同時にマークするために(差次的に標識される)、標的に結合することができる。
Combining Sequencing Technologies In some embodiments, the methods described herein are combined with other sequencing technologies. In some embodiments, after sequencing by transient binding, sequencing by a second method is initiated on the same molecule. For example, longer and more stable oligonucleotides are bound to initiate sequencing-by-synthesis. In some embodiments, the method is used to go beyond full genome sequencing to provide a stepping stone for short read sequencing, such as that from Illumina. In this case, it is advantageous to perform Illumina library preparation by omitting the PCR amplification step in order to obtain more uniform coverage of the genome. One advantage of some of these embodiments is that the required sequencing coverage factor is halved, eg, from about 40-fold to 20-fold. In some embodiments, this is due to the addition of sequencing performed by the method and location information provided by the methods described herein. In some embodiments, the longer, more stable oligos, which are optionally optically labeled, target specific regions of interest in the genome (e.g., the BRCA1 locus) during part or all of the sequencing process. It can bind to the target (differentially labeled) to mark before or at the same time with short sequencing oligos through the .

機械学習の方法
一部の実施形態では、人工知能または機械学習を使用して、既知の配列のポリマー(例えば、ポリヌクレオチド)に対して試験する場合、および/またはポリヌクレオチドの配列を別の方法からのデータと交差検証する場合、オリゴヌクレオチドプローブ種の完全なセットのメンバーの挙動を学習させる。一部の実施形態では、学習アルゴリズムは、1つ以上の条件または文脈における、オリゴヌクレオチドプローブ種の結合部位を含む1つ以上のポリヌクレオチド標的に対する特定のオリゴヌクレオチドプローブ種の完全な挙動を考慮に入れる。同じまたは異なる試料でより多くの配列決定が行われるにつれて、機械学習から得られる知識はより強力になる。機械学習から学んだことは、様々な他のアッセイに適用され、特に、一過的な結合ベースの出現配列決定に加えて、オリゴとオリゴ/ポリヌクレオチドとの相互作用(例えば、ハイブリダイゼーションによる配列決定)を伴うアッセイにおいて、適用される。
Machine Learning Methods In some embodiments, artificial intelligence or machine learning is used when testing against a polymer (e.g., polynucleotide) of known sequence and/or determining the sequence of the polynucleotide by another method. The behavior of members of a complete set of oligonucleotide probe species is learned when cross-validated with data from . In some embodiments, the learning algorithm takes into account the complete behavior of a particular oligonucleotide probe species against one or more polynucleotide targets comprising binding sites for the oligonucleotide probe species under one or more conditions or contexts. put in. The knowledge gained from machine learning becomes more powerful as more sequencing is performed on the same or different samples. Learnings from machine learning have been applied to a variety of other assays, particularly transient binding-based emergence sequencing, as well as interactions between oligos and oligo/polynucleotides (e.g., sequencing by hybridization). determination).

一部の実施形態では、人工知能または機械学習は、既知の配列の1つ以上のポリヌクレオチドへの短いオリゴ(例えば、3塩基長、4塩基長、5塩基長、または6塩基長)の完全なセットの結合について実験的に得られた結合パターンのデータを提供することによって、訓練される。各オリゴの訓練データは、結合場所、結合の持続時間、および所与の期間にわたる結合事象の数を含む。この訓練の後、機械学習アルゴリズムが、決定される配列のポリヌクレオチドに適用され、その学習に基づいて、ポリヌクレオチドの配列をアセンブリすることができる。一部の実施形態では、機械学習アルゴリズムに、参照配列も提供される。 In some embodiments, artificial intelligence or machine learning is used to complete short oligos (e.g., 3 bases, 4 bases, 5 bases, or 6 bases in length) to one or more polynucleotides of known sequence. It is trained by providing experimentally obtained binding pattern data for a set of bindings. The training data for each oligo includes binding locations, duration of binding, and number of binding events over a given time period. After this training, machine learning algorithms can be applied to the polynucleotides of the determined sequences and, based on their learning, assemble sequences of the polynucleotides. In some embodiments, a reference sequence is also provided to the machine learning algorithm.

一部の実施形態では、配列アセンブリアルゴリズムは、機械学習要素および非機械学習要素の両方を含む。 In some embodiments, the sequence assembly algorithm includes both machine learning and non-machine learning elements.

一部の実施形態では、実験的に得られた結合パターンから学習するコンピュータアルゴリズムの代わりに、結合パターンは、シミュレーションを介して得られる。例えば、一部の実施形態では、オリゴヌクレオチドプローブ種の完全なセットのオリゴヌクレオチドプローブ種の既知配列のポリヌクレオチドへの一過的な結合のシミュレーションが行われる。シミュレーションは、実験データまたは公開データから得られた各オリゴヌクレオチドプローブ種の配列の挙動のモデルに基づく。例えば、結合安定性の予測は、近傍法に従って利用可能である(例えば、SantaLucia et al.,Biochemistry 35,3555-3562(1996)およびBreslauer et al.,Proc.Natl.Acad.Sci.83:3746-3750,1986に記載されている)。一部の実施形態では、不一致挙動は既知であり(例えば、AへのG不一致結合は、TからAよりも強いまたはより強い相互作用であり得る)、または実験的に導出される。さらに、一部の実施形態では、オリゴのいくつかの短いサブ配列(例えば、GGAまたはACC)の異常に高い結合強度が知られている。一部の実施形態では、機械学習アルゴリズムは、シミュレーションデータ上で訓練され、次いで、それが短いオリゴの完全なセットによって照合される場合、未知の配列の配列を決定するために使用される。 In some embodiments, instead of computer algorithms learning from experimentally derived binding patterns, binding patterns are obtained via simulation. For example, in some embodiments, transient binding of a complete set of oligonucleotide probe species to a polynucleotide of known sequence is simulated. Simulations are based on models of the sequence behavior of each oligonucleotide probe species derived from experimental or published data. For example, prediction of binding stability is available according to the neighborhood method (see, eg, SantaLucia et al., Biochemistry 35, 3555-3562 (1996) and Breslauer et al., Proc. Natl. Acad. Sci. 83:3746). -3750, 1986). In some embodiments, the mismatch behavior is known (eg, G mismatch binding to A can be a stronger or stronger interaction than T to A) or is experimentally derived. Additionally, in some embodiments, unusually high binding strengths of some short subsequences of oligos (eg, GGA or ACC) are known. In some embodiments, a machine learning algorithm is trained on simulated data and then used to determine the sequence of an unknown sequence when it is matched by a complete set of short oligos.

一部の実施形態では、オリゴヌクレオチドプローブ種またはパネルの完全なセットのオリゴのデータ(場所、結合持続時間、シグナル強度など)は、1つ、または数十、または数百、または数千の既知の配列で訓練された機械学習アルゴリズムにプラグインされる。次いで、機械学習アルゴリズムを適用して、問題の配列から、データセットを生成し、機械学習アルゴリズムは、問題の未知の配列の配列を生成する。比較的小さいゲノム、またはあまり複雑でないゲノム(例えば、細菌、バクテリオファージなど)の生物の配列決定のためのアルゴリズムの訓練は、その種類の生物に対して行われるべきである。より大きいゲノムまたはより複雑なゲノム(特に、反復DNA領域を有するゲノム)を有する生物の場合(例えば、S.pombeまたはヒト)、訓練は、その種類の生物に対して行われるべきである。全染色体長までのメガ塩基断片の長距離アセンブリの場合、一部の実施形態では、訓練は、類似の生物に対して行われ、そのため、ゲノムの特定の様相が訓練中に表現される。例えば、ヒトゲノムは二倍体であり、セグメント重複を有する大きな配列領域を示す。目的の他のゲノム、特に、多くの農業上重要な植物種は、非常に複雑なゲノムを有する。例えば、コムギおよび他の穀物は、高度な倍数体ゲノムを有する。 In some embodiments, the data (location, binding duration, signal intensity, etc.) for a complete set of oligos of oligonucleotide probe species or panels is one, or tens, or hundreds, or thousands of known is plugged into a machine learning algorithm trained on an array of A machine learning algorithm is then applied to generate a data set from the problem array, and the machine learning algorithm generates an array of the unknown problem sequences. Algorithm training for the sequencing of organisms with relatively small or less complex genomes (eg, bacteria, bacteriophages, etc.) should be done for that type of organism. For organisms with larger or more complex genomes (especially genomes with repetitive DNA regions) (eg S. pombe or humans), training should be done for that type of organism. For long-range assembly of megabase fragments up to full chromosome length, in some embodiments training is performed on similar organisms so that specific aspects of the genome are represented during training. For example, the human genome is diploid and exhibits large sequence regions with segmental overlaps. Other genomes of interest, especially many agriculturally important plant species, have very complex genomes. For example, wheat and other cereals have highly polyploid genomes.

一部の実施形態では、機械学習ベースの配列アセンブリのアプローチは、(a)1つ以上の訓練データセットから収集されたオリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の結合挙動に関する情報を提供することと、(b)オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種の、配列が決定される標的核酸への物理的な結合を提供することと、(c)各オリゴヌクレオチドプローブ種についての結合場所、および/または結合持続時間、および/または各場所で生じる結合の回数(例えば、結合反復の存続時間)に関する情報を提供することと、を含む。 In some embodiments, the machine learning-based sequence assembly approach comprises (a) information about the binding behavior of each oligonucleotide probe species of a complete set of oligonucleotide probe species collected from one or more training datasets; (b) providing physical attachment of each oligonucleotide probe species of the complete set of oligonucleotide probe species to the target nucleic acid to be sequenced; (c) each oligonucleotide providing information regarding the binding sites for the probe species, and/or the duration of binding and/or the number of times binding occurs at each site (eg, duration of binding repeats).

一部の実施形態では、特定の実験の配列は、最初に、非機械学習アルゴリズムによって処理される。次いで、第1のアルゴリズムの出力配列を使用して、機械学習アルゴリズムを訓練し、訓練が、同じ分子の実際の実験的に導出された配列上で行われるようにする。一部の実施形態では、配列アセンブリアルゴリズムは、ベイズアプローチを含む。一部の実施形態では、本開示の方法に由来するデータは、WO2010/075570に記載されている種類のアルゴリズムに提供され、任意選択的に、他の種類のゲノムデータまたは配列決定データと組み合わされる。 In some embodiments, a particular experimental sequence is first processed by a non-machine learning algorithm. The output sequences of the first algorithm are then used to train a machine learning algorithm such that the training is performed on the actual experimentally derived sequences of the same molecule. In some embodiments, the sequence assembly algorithm comprises a Bayesian approach. In some embodiments, data derived from the methods of the present disclosure are provided to algorithms of the type described in WO2010/075570, optionally combined with other types of genomic or sequencing data. .

一部の実施形態では、配列は、いくつかの方法でデータから抽出される。配列アセンブリ方法のスペクトルの一端では、モノマーまたは一連のモノマーの局在化は、モノマーまたは一連のモノマーを注文するだけで配列が得られるように正確である(ナノメトリックまたはサブナノメトリック)。スペクトルの他端では、データは、配列に関する様々な仮説を排除するために使用される。例えば、1つの仮説は、配列が既知の個々のゲノム配列に対応するということである。アルゴリズムは、データが個々のゲノムから乖離する場所を決定する。別の場合、仮説は、配列が「正常」体細胞の既知のゲノム配列に対応するということである。アルゴリズムは、推定される腫瘍細胞からのデータが、「正常な」体細胞の配列から乖離する場所を決定する。 In some embodiments, sequences are extracted from the data in several ways. At one end of the spectrum of array assembly methods, the localization of a monomer or series of monomers is so precise (nanometric or sub-nanometric) that the sequence is obtained by simply ordering the monomer or series of monomers. At the other end of the spectrum, the data are used to rule out various hypotheses about sequence. For example, one hypothesis is that the sequences correspond to known individual genomic sequences. Algorithms determine where the data deviate from individual genomes. Another hypothesis is that the sequence corresponds to the known genomic sequence of a "normal" somatic cell. The algorithm determines where data from putative tumor cells deviate from the sequence of "normal" somatic cells.

本開示の一実施形態では、1つ以上の既知の標的核酸(例えば、オリゴヌクレオチドプローブ種の完全なセットの各オリゴヌクレオチドプローブ種に対する相補体を含むスーパー配列を含むラムダファージDNAまたは合成構築物)を含む訓練セットを、オリゴヌクレオチドプローブ種の完全なセットからの各オリゴヌクレオチドプローブ種の試験された反復結合のために使用する。機械学習アルゴリズムを使用して、一部の実施形態では、オリゴヌクレオチドプローブ種の結合特性および不一致特性を決定する。したがって、直感に反して、不一致結合は、さらなるデータを提供する方法としてみなされ、配列をアセンブリする、かつ/または配列に対する信頼度を付加するために使用される。 In one embodiment of the present disclosure, one or more known target nucleic acids (e.g., lambda phage DNA or synthetic constructs comprising a supersequence comprising the complement for each oligonucleotide probe species of a complete set of oligonucleotide probe species) are A training set containing is used for tested iterative binding of each oligonucleotide probe species from the complete set of oligonucleotide probe species. Machine learning algorithms are used, in some embodiments, to determine binding and mismatch properties of oligonucleotide probe species. Thus, counterintuitively, discordant binding is viewed as a method of providing additional data and is used to assemble sequences and/or add confidence to sequences.

配列決定計装とデバイス
配列決定方法は、共通の計装要件を有する。基本的に、機器は撮像および試薬の交換が可能でなければならない。撮像要件には、1つ以上のグループ:対物レンズ、リレーレンズ、ビームスプリッター、ミラー、フィルタ、カメラまたはポイント検出器が含まれる。カメラまたは撮像デバイスは、CCD、アレイCMOS、またはアバランシェフォトダイオードアレイ検出器を含む。ポイント検出器には、光電子増倍管(PMT)またはアバランシェフォトダイオード(APD)が含まれる。場合によっては、高速カメラが使用される。その他のオプションの様相は、本方法の形式に応じて調整される。例えば、照明源(例えば、ランプ、LED、またはレーザ)、照明の基板への結合(例えば、プリズム、導波路、フォトニックナノ構造、格子、ゾル-ゲル、レンズ、可動ステージ、または可動対物レンズ)、撮像デバイスと関連して試料を移動させるための機構、試料混合/撹拌、温度制御、および電気制御は、本明細書に開示される異なる実施形態に対して各々独立して調整される。
Sequencing Instrumentation and Devices Sequencing methods have common instrumentation requirements. Basically, the instrument must be capable of imaging and exchange of reagents. Imaging requirements include one or more groups: objective lenses, relay lenses, beam splitters, mirrors, filters, cameras or point detectors. Cameras or imaging devices include CCD, array CMOS, or avalanche photodiode array detectors. Point detectors include photomultiplier tubes (PMTs) or avalanche photodiodes (APDs). In some cases, high speed cameras are used. Other optional aspects are tailored to the type of method. For example, illumination sources (eg, lamps, LEDs, or lasers), coupling illumination to substrates (eg, prisms, waveguides, photonic nanostructures, gratings, sol-gels, lenses, movable stages, or movable objectives). , the mechanism for moving the sample in relation to the imaging device, sample mixing/stirring, temperature control, and electrical control are each independently adjusted for the different embodiments disclosed herein.

単一分子の実装の場合、照明は、例えば、プリズムベースの全内部反射、対物レンズベースの全内部反射、プラズモニック導波路、格子ベースの導波路、ヒドロゲルベースの導波路、または好適な角度でレーザ光を基板のエッジにもたらすことによって生成されるエバネッセント導波路を利用することができる。一部の実施形態では、導波路は、コア層および第1のクラッド層を含む。照明は、代替的に、HILO照明またはライトシートを含む。いくつかの単一分子機器では、パルス照明と時間ゲート検出の同期を使用することによって、光散乱の影響を軽減する。ここでは、光散乱がゲートアウトされる。一部の実施形態では、暗視野照明が使用される。蛍光寿命測定のために設定されている器具もある。 For single-molecule implementations, the illumination is e.g. prism-based total internal reflection, objective lens-based total internal reflection, plasmonic waveguides, grating-based waveguides, hydrogel-based waveguides, or at suitable angles Evanescent waveguides created by bringing laser light to the edge of the substrate can be used. In some embodiments, a waveguide includes a core layer and a first cladding layer. The lighting alternatively includes HILO lighting or light sheets. Some single-molecule instruments mitigate the effects of light scattering by using synchronization of pulsed illumination and time-gated detection. Here light scattering is gated out. In some embodiments, darkfield illumination is used. Some instruments are set up for fluorescence lifetime measurements.

一部の実施形態では、機器はまた、細胞、核、オルガネラ、染色体などからポリヌクレオチドを抽出するための手段を含む。 In some embodiments, the instrument also includes means for extracting polynucleotides from cells, nuclei, organelles, chromosomes, and the like.

ほとんどの実施形態に好適な機器は、IlluminaのゲノムアナライザーIIxである。本デバイスは、プリズムベースのTIR、20×乾燥対物レンズ、ライトスクランブラ、532nmおよび660nmのレーザ、赤外線レーザベースの自動焦点システム、発光フィルタホイール、Photometrix CoolSnap CCDカメラ、温度制御、および試薬交換用のシリンジポンプベースのシステムで構成されている。一部の実施形態では、この機器を代替カメラの組み合わせを用いて改良することで、より良好な単一分子配列決定が可能になる。例えば、センサーは、低い電子ノイズ、2e未満を有する。また、センサーは、多数の画素を有する。一部の実施形態では、シリンジ-ポンプベースの試薬交換システムは、圧力駆動フローベースのシステムに置き換えられる。システムは、互換性のあるIlluminaフローセル、または一部の実施形態では、機器の実際の配管もしくは改良された配管に合うように適合されたカスタムのフローセルとともに使用される。 A suitable instrument for most embodiments is Illumina's Genome Analyzer IIx. The device includes a prism-based TIR, 20× dry objective, light scrambler, 532 nm and 660 nm lasers, infrared laser-based autofocus system, emission filter wheel, Photometrix CoolSnap CCD camera, temperature control, and a It consists of a syringe pump-based system. In some embodiments, the instrument can be enhanced with a combination of alternative cameras to allow better single molecule sequencing. For example, the sensor has low electronic noise, less than 2e. Also, the sensor has a large number of pixels. In some embodiments, the syringe-pump based reagent exchange system is replaced with a pressure driven flow based system. The system is used with a compatible Illumina flow cell or, in some embodiments, a custom flow cell adapted to match the actual or modified plumbing of the instrument.

代替的に、レーザベッド(レーザは、標識の選択に依存する)またはゲノム分析デバイスからのレーザシステムおよびライトスクランブラ、EM CCDカメラ(例えば、Hamamatsu ImageEM)またはScientific CMOS(例えば、Hamamatsu Orca FLASH)と結合された電動Nikon Ti-E顕微鏡、および任意選択的に、温度制御が使用される。一部の実施形態では、科学用センサーではなく消費者用センサーが使用される。これは、配列決定のコストを劇的に低減する可能性を有する。これは、圧力駆動またはシリンジポンプのシステム、および特別に設計されたフローセルと結合されている。一部の実施形態では、フローセルは、ガラスまたはプラスチックで製作され、それぞれ利点および欠点を有する。一部の実施形態では、フローセルは、環状オレフィンコポリマー(COC)、例えば、TOPAS、他のプラスチック、もしくはPDMSを使用して、またはシリコンもしくはガラス中で、微細加工法を使用して製作される。一部の実施形態では、熱可塑性プラスチックの射出成形は、工業規模の製造に低コスト化の道筋を提供する。一部の光学構成では、熱可塑性プラスチックは、最小限の固有蛍光を有する良好な光学特性を有する必要がある。芳香族または共役系を含むポリマーは、顕著な固有蛍光を有することが予想されるため、理想的には除外されるべきである。Zeonor1060R、Topas5013、およびPMMA-VSUVT(例えば、米国特許第8,057,852号に記載されている)は、緑色および赤色の波長範囲(例えば、Cy3およびCy5に対して)で妥当な光学特性を有することが報告されており、Zeonar1060Rは、最も好ましい特性を有する。一部の実施形態では、熱可塑性プラスチックをマイクロ流体デバイスの広い領域にわたって結合させることが可能である(例えば、Sun et al.,Microfluidics and Nanofluidics,19(4),913-922,2015に報告されている)。一部の実施形態では、バイオポリマーが付着されるガラスカバーガラスは、熱可塑性プラスチックの流体アーキテクチャに結合される。 Alternatively, a laser bed (laser depends on label choice) or laser system and light scrambler from a genomic analysis device, EM CCD camera (e.g. Hamamatsu ImageEM) or Scientific CMOS (e.g. Hamamatsu Orca FLASH) and A coupled motorized Nikon Ti-E microscope and, optionally, temperature control are used. In some embodiments, consumer sensors are used rather than scientific sensors. This has the potential to dramatically reduce the cost of sequencing. This is coupled with a system of pressure driven or syringe pumps and a specially designed flow cell. In some embodiments, the flow cell is made of glass or plastic, each having advantages and disadvantages. In some embodiments, the flow cell is fabricated using cyclic olefin copolymers (COC), such as TOPAS, other plastics, or PDMS, or in silicon or glass using microfabrication methods. In some embodiments, injection molding of thermoplastics provides a low cost route to industrial scale manufacturing. For some optical configurations, the thermoplastic should have good optical properties with minimal intrinsic fluorescence. Polymers containing aromatic or conjugated systems are expected to have significant intrinsic fluorescence and should ideally be excluded. Zeonor 1060R, Topas 5013, and PMMA-VSUVT (described, for example, in US Pat. No. 8,057,852) have reasonable optical properties in the green and red wavelength ranges (eg, for Cy3 and Cy5). and Zeonar 1060R has the most favorable properties. In some embodiments, thermoplastics can be bonded over large areas of microfluidic devices (eg, as reported in Sun et al., Microfluidics and Nanofluidics, 19(4), 913-922, 2015). ing). In some embodiments, the glass coverslip to which the biopolymer is attached is bonded to a thermoplastic fluidic architecture.

代替的に、手動操作のフローセルは、顕微鏡の上部で使用される。これは、一部の実施形態では、両面粘着シートを使用してフローセルを作製し、適切な寸法のチャネルが得られるようにレーザ切断し、カバースリップとスライドガラスとの間に挟むことによって、構築される。ある試薬交換サイクルから別の試薬交換サイクルまで、フローセルは、フレーム間の位置合わせまで、機器/顕微鏡上に留めてもよい。一部の実施形態では、リニアエンコーダを備えた電動ステージを使用して、広い領域を撮像する際のステージの移動を確実にする。同じ場所が、正しく再訪される。正しい位置合わせを維持するために、基準マーカーが使用される。一部の実施形態では、フローセルまたは表面のエッチングなどの基準マーキングでは、光学的に検出される固定化ビーズがフローセル内に提供される。ポリヌクレオチド骨格が(例えば、YOYO-1によって)染色されている場合、これらの固定された既知の位置を使用して、画像を、あるフレームから次のフレームへ整列させる。 Alternatively, a manually operated flow cell is used on top of the microscope. This is constructed, in some embodiments, by creating a flow cell using double-sided adhesive sheets, laser-cutting channels of appropriate dimensions, and sandwiching them between a coverslip and a glass slide. be done. From one reagent change cycle to another, the flow cell may remain on the instrument/microscope until frame-to-frame alignment. In some embodiments, a motorized stage with a linear encoder is used to ensure movement of the stage when imaging large areas. The same location is revisited correctly. Fiducial markers are used to maintain correct alignment. In some embodiments, fiducial marking, such as etching of the flow cell or surface, provides immobilized beads within the flow cell that are optically detected. If the polynucleotide backbone is stained (eg, by YOYO-1), these fixed, known positions are used to align the images from one frame to the next.

一実施形態では、本明細書に記載の方法を実施するために、レーザまたはLED照明を使用する照明機構(例えば、米国特許第7,175,811号およびRamachandran et al.,Scientific Reports 3:2133,2013に記載されているものなど)を、任意選択的な加熱機構および試薬交換システムと結合される。一部の実施形態では、スマートフォンベースの撮像設定(ACS Nano7:9147)が、任意選択的な温度制御モジュールおよび試薬交換システムと結合される。かかる実施形態では、主に電話のカメラが使用されるが、iPhoneまたは他のスマートフォンデバイスの照明および振動機能などの他の態様も使用することができる。 In one embodiment, an illumination arrangement using laser or LED illumination (e.g., U.S. Pat. No. 7,175,811 and Ramachandran et al., Scientific Reports 3:2133) is used to perform the methods described herein. , 2013) with an optional heating mechanism and reagent exchange system. In some embodiments, a smartphone-based imaging setup (ACS Nano7:9147) is combined with an optional temperature control module and reagent exchange system. Such embodiments primarily use the phone's camera, but other aspects such as the lighting and vibration capabilities of an iPhone or other smart phone device can also be used.

図20Aおよび図20Bは、フローセル2004および統合された光学レイアウトを使用して、本明細書に記載されるように、一過的なプローブ結合の撮像を行うための可能なデバイスを例示している。試薬は、エアギャップ2022によって分離された試薬/緩衝液2008のパケットとして送達される。図20Aは、プリズム2016(例えば、TIRF設定)を通して透過されるカップリングレーザ光2014を介してエバネッセント波2010が生成される例示的なレイアウトを示している。一部の実施形態では、反応の温度は、統合された温度制御2012によって制御される(例えば、一例では、透明基板2024は、電気的に結合され、したがって、基板2024の全体の温度を変化させる酸化インジウムスズを含む)。試薬は、試薬/緩衝液2008の連続的な流れとして送達される。格子、波導路2020、またはフォトニック構造を使用して、レーザ光2014を結合して、エバネッセント場2010を生成する。一部の実施形態では、温度制御は、空間を覆うブロック2026に由来する。 20A and 20B illustrate a possible device for imaging transient probe binding as described herein using flow cell 2004 and an integrated optical layout. . Reagents are delivered in packets of reagent/buffer 2008 separated by air gaps 2022 . FIG. 20A shows an exemplary layout in which an evanescent wave 2010 is generated via coupled laser light 2014 transmitted through a prism 2016 (eg, TIRF setting). In some embodiments, the temperature of the reaction is controlled by integrated temperature control 2012 (e.g., in one example, transparent substrate 2024 is electrically coupled, thus changing the overall temperature of substrate 2024). including indium tin oxide). Reagents are delivered as a continuous stream of reagent/buffer 2008 . A grating, waveguide 2020 , or photonic structure is used to couple the laser light 2014 to produce the evanescent field 2010 . In some embodiments, temperature control comes from block 2026 covering the space.

図20Aに記載されるレイアウトの態様は、図20Bに記載されるレイアウトの態様と互換可能である。例えば、代替的に、対物スタイルTIRF、ライトガイドTIRF、コンデンサTIRFを使用することができる。継続的またはエアギャップ試薬送達は、一部の実施形態では、シリンジポンプまたは圧力駆動の流れによって制御される。エアギャップ方法は、すべての試薬2008(例えば、図21に図示されるように)が、キャピラリー/チューブ2102またはチャネルに予め充填され、シリンジポンプまたは圧力制御システムからのプッシュまたはプルによって送達されることを可能にする。エアギャップ法は、すべての試薬が、キャピラリー/チューブまたはチャネルに予め充填され、シリンジポンプまたは圧力制御システムからのプッシュまたはプルによって送達されることを可能にする。エアギャップ2022は、空気もしくは気体(窒素など)、または水溶液と混ざらない液体を含む。エアギャップ2022は、試薬送達だけでなく、分子コーミングを行うためにも使用することができる。流体デバイス(例えば、流体容器、カートリッジ、またはチップ)は、ポリヌクレオチド固定化および任意選択的に伸長が行われるフローセル領域、試薬保存、入口、出口、およびポリヌクレオチド抽出、ならびにエバネッセント場を成形するための任意の構造を含む。一部の実施形態では、デバイスは、ガラス、プラスチック、またはガラスとプラスチックのハイブリッドで作製される。一部の実施形態では、熱伝導性要素および電気伝導性要素(例えば、金属)が、ガラスおよび/またはプラスチック構成要素に組み込まれる。一部の実施形態では、流体容器は、ウェルである。一部の実施形態では、流体容器は、フローセルである。一部の実施形態では、表面は、1つ以上の化学層、生化学層(例えば、BSA-ビオチン、ストレプトアビジン)、脂質層、ヒドロゲル、またはゲル層でコーティングされる。次いで、ビニルシランでコーティングされた22×22mmのカバーガラス(BioTechniques 45:649-658,2008、またはGenomic Visionから入手可能)、またはクロロベンゼン溶液中の1.5%Zeonexでスピンコーティングされたカバーガラスを使用する。基板は、2%の3-アミノプロピルトリエトキシシラン(APTES)またはポリリジンでコーティングすることもでき、伸展は、pH7.5~8のHEPES緩衝液中での静電相互作用を介して生じる。代替的に、ビス-アクリルアミドおよびTEMEDを含む1~8%のポリアクリルアミド溶液中でスピンコーティングまたはディップコーティングされたシラン化カバーガラス。これに加えて、ビニルシランでコーティングされたカバーガラスを使用して、コーブガラスを、アセトン(v/v)中の10%の3-メタクリルオキシプロピルトリメトキシシラン(Bind Silane、Pharmacia Biotech)で1時間コーティングすることができる。ポリアクリルアミドコーティングは、以下に記載されているように得ることもできる(Liu Q et al.Biomacromolecules,2012,13(4),pp 1086-1092)。使用することができるいくつかのヒドロゲルコーティングは、Mateescu et al.Membranes 2012,2,40-69に記載および参照されている。 The layout aspect described in FIG. 20A is compatible with the layout aspect described in FIG. 20B. For example, objective-style TIRF, light guide TIRF, condenser TIRF may alternatively be used. Continuous or air-gap reagent delivery is controlled by syringe pumps or pressure-driven flow in some embodiments. The air-gap method is that all reagents 2008 (eg, as illustrated in FIG. 21) are prefilled into capillaries/tubes 2102 or channels and delivered by push or pull from a syringe pump or pressure control system. enable The air-gap method allows all reagents to be prefilled into capillaries/tubes or channels and delivered by push or pull from a syringe pump or pressure control system. Air gap 2022 contains air or a gas (such as nitrogen) or a liquid that is immiscible with aqueous solutions. The air gap 2022 can be used not only for reagent delivery, but also for molecular combing. A fluidic device (e.g., fluidic container, cartridge, or chip) includes a flow cell region where polynucleotide immobilization and optionally elongation occurs, reagent storage, inlets, outlets, and polynucleotide extraction, and for shaping the evanescent field. including any structure of In some embodiments, the device is made of glass, plastic, or a hybrid of glass and plastic. In some embodiments, thermally and electrically conductive elements (eg, metal) are incorporated into glass and/or plastic components. In some embodiments, the fluid reservoir is a well. In some embodiments, the fluid reservoir is a flow cell. In some embodiments, the surface is coated with one or more chemical, biochemical (eg, BSA-biotin, streptavidin), lipid, hydrogel, or gel layers. 22 x 22 mm coverslips coated with vinylsilane (BioTechniques 45:649-658, 2008, or available from Genomic Vision) or spin-coated coverslips with 1.5% Zeonex in chlorobenzene solution were then used. do. Substrates can also be coated with 2% 3-aminopropyltriethoxysilane (APTES) or polylysine and spreading occurs via electrostatic interactions in HEPES buffer at pH 7.5-8. Alternatively, silanized coverslips spin- or dip-coated in 1-8% polyacrylamide solutions containing bis-acrylamide and TEMED. In addition to this, using vinylsilane-coated coverslips, the Cove glass was treated with 10% 3-methacryloxypropyltrimethoxysilane (Bind Silane, Pharmacia Biotech) in acetone (v/v) for 1 hour. can be coated. Polyacrylamide coatings can also be obtained as described below (Liu Q et al. Biomacromolecules, 2012, 13(4), pp 1086-1092). Some hydrogel coatings that can be used are described by Mateescu et al. Described and referenced in Membranes 2012, 2, 40-69.

また、標的核酸は、交流電流(AC)(誘電泳動)電場を印加することによって、アガロースゲル中で伸長され得る。DNA分子は、ゲル中に電気泳動されてもよく、またはDNAは、融かしたアガロースと混合されてもよく、次いで、アガロースとともに設定されてもよい。次に、約10Hzの周波数のAC電場を印加し、200~400V/cmの電場強度を使用する。伸展は、0.5~3%の範囲のアガロースゲル濃度で行うことができる。場合によっては、表面を、フローチャネルまたはウェル中で、BSA-ビオチンでコーティングした後、ストレプトアビジンまたはニュートラアビジンを添加する。このコーティングされたカバーグラスを使用して、最初にpH7.5の緩衝液中でDNAを結合させ、次いで、pH8.5の緩衝液中でDNAを伸展することによって、二本鎖ゲノムDNAを伸展することができる。場合によっては、ストレプトアビジンでコーティングされたカバーグラスを使用して、核酸鎖を捕捉および固定化するが、伸展は行わない。したがって、核酸は、一端で結合し、一方、他端が溶液中でぶら下がっている。 A target nucleic acid can also be elongated in an agarose gel by applying an alternating current (AC) (dielectrophoresis) electric field. DNA molecules may be electrophoresed into a gel, or the DNA may be mixed with melted agarose and then set with the agarose. An AC electric field with a frequency of about 10 Hz is then applied and a field strength of 200-400 V/cm is used. Stretching can be performed at agarose gel concentrations ranging from 0.5-3%. Optionally, surfaces are coated with BSA-biotin in flow channels or wells prior to addition of streptavidin or neutravidin. The coated coverslips were used to extend the double-stranded genomic DNA by first binding the DNA in a pH 7.5 buffer and then extending the DNA in a pH 8.5 buffer. can do. In some cases, streptavidin-coated coverslips are used to capture and immobilize, but not extend, nucleic acid strands. Nucleic acids are thus bound at one end while the other end is left hanging in solution.

GAIIxなどの光学配列決定システムの様々な顕微鏡様構成要素を使用する代わりに、一部の実施形態では、配列決定のために、より統合された一体化デバイスが構築される。かかる実施形態では、ポリヌクレオチドは、センサーアレイ上に、またはセンサーアレイに隣接する基板上に直接結合され、任意選択的に、伸長される。センサーアレイ上での直接検出は、アレイへのDNAハイブリダイゼーションに関して実証されている(例えば、Lamture et al.,Nucleic Acid Research 22:2121-2125,1994に記載されている)。一部の実施形態では、レイリー散乱が蛍光色素からの発光と比較して短命であることから、センサーを時間ゲートして、バックグラウンド蛍光を低減する。 Instead of using various microscope-like components of an optical sequencing system such as GAIIx, in some embodiments a more integrated integrated device is constructed for sequencing. In such embodiments, the polynucleotides are attached directly onto the sensor array, or onto a substrate adjacent to the sensor array, and optionally elongated. Direct detection on sensor arrays has been demonstrated for DNA hybridization to the array (described, for example, in Lamture et al., Nucleic Acid Research 22:2121-2125, 1994). In some embodiments, the sensor is time-gated to reduce background fluorescence because Rayleigh scattering is short-lived compared to the emission from the fluorochrome.

一実施形態では、センサーはCMOS検出器である。一部の実施形態では、複数の発光最大波長が検出される(例えば、米国特許出願第2009/0194799号に記載されている)。一部の実施形態では、検出器は、Foveon検出器である(例えば、米国特許第6,727,521号に記載されている)。一部の実施形態では、センサーアレイは、三重接合ダイオードのアレイである(例えば、米国特許第9,105,537号に記載されている)。 In one embodiment, the sensor is a CMOS detector. In some embodiments, multiple emission maxima are detected (eg, as described in US Patent Application No. 2009/0194799). In some embodiments, the detector is a Foveon detector (eg, described in US Pat. No. 6,727,521). In some embodiments, the sensor array is an array of triple junction diodes (eg, described in US Pat. No. 9,105,537).

一部の実施形態では、試薬/緩衝液は、単回投与(例えば、ブリスターパックを介して)でフローセルに送達される。パック内の各ブリスターは、オリゴヌクレオチドのオリゴヌクレオチドプローブ種のセットとは異なるオリゴヌクレオチドプローブ種を含む。オリゴヌクレオチドプローブ種間のいかなる混合または混入なしで、第1のブリスターを穿刺し、標的核酸をその内容物に曝露する。一部の実施形態では、洗浄ステップは、連続して、次のブリスターに移動する前に適用される。これは、オリゴヌクレオチドプローブ種の異なるセットを物理的に分離し、したがって、バックグラウンドノイズ(前のセットからのオリゴヌクレオチドプローブ種が撮像視野に残る場合)を低減する役割を果たす。 In some embodiments, reagents/buffers are delivered to the flow cell in a single dose (eg, via a blister pack). Each blister within the pack contains an oligonucleotide probe species distinct from the oligonucleotide probe species set of oligonucleotides. The first blister is punctured to expose the target nucleic acid to its contents without any mixing or contamination between oligonucleotide probe species. In some embodiments, the washing step is applied sequentially before moving to the next blister. This serves to physically separate the different sets of oligonucleotide probe species and thus reduce background noise (if oligonucleotide probe species from the previous set remain in the imaging field).

一部の実施形態では、配列決定は、細胞が配置され、および/またはポリヌクレオチドが抽出された同じデバイスまたは一体化構造において行われる。一部の実施形態では、本方法を実施するために必要なすべての試薬が、分析が開始される前に流体デバイスに予め充填される。一部の実施形態では、試薬(例えば、プローブ)は、デバイス内で乾燥状態で存在し、反応が進行する前に湿潤され、溶解される。 In some embodiments, sequencing is performed in the same device or integrated structure in which the cells were placed and/or the polynucleotides were extracted. In some embodiments, all reagents required to perform the method are pre-filled into the fluidic device before the analysis begins. In some embodiments, reagents (eg, probes) are present in the device in a dry state and are wetted and dissolved before the reaction proceeds.

追加の実施形態
広範な一態様では、本発明は、補助的な事象のレパートリーを分析することによって不随的な情報を取得する方法である。
Additional Embodiments In one broad aspect, the invention is a method of obtaining ancillary information by analyzing a repertoire of ancillary events.

1つの広範な態様では、本発明の範囲は、分子プローブを1つ以上の分子の単位に結合させることによって、多単位分子の少なくとも1単位を識別する方法を含む。本発明は、1つ以上の種類の分子プローブと分子との単一分子相互作用の検出に基づいている。一部の実施形態では、プローブは、少なくとも1単位の分子に一過的に結合する。一部の実施形態では、プローブは、少なくとも1単位の分子に反復的に結合する。一部の実施形態では、分子実体は、表面またはマトリックス上で、ナノメトリック正確度(典型的には、250nm未満、好ましくは50nm未満、より好ましくは2nm未満)まで位置決定される。 In one broad aspect, the scope of the invention includes methods of identifying at least one unit of a multiunit molecule by attaching a molecular probe to one or more units of the molecule. The present invention is based on the detection of single molecule interactions between one or more types of molecular probes and molecules. In some embodiments, the probe transiently binds at least one unit of the molecule. In some embodiments, the probe is repeatedly bound to at least one unit of the molecule. In some embodiments, molecular entities are positioned on a surface or matrix to nanometric accuracy (typically less than 250 nm, preferably less than 50 nm, more preferably less than 2 nm).

一部の実施形態では、本発明は、1つ以上のプローブと分子との間の相互作用を特徴付ける方法を含み、以下を含む:
1つ以上のプローブ種を、プローブが分子に一過的に結合することができる条件下で、分子に添加することと、
検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
ステップbからのデータを分析して、相互作用の1つ以上の特徴を決定することと、
任意選択的に、ステップaの前に、分子が表面またはマトリックス上に固定化されることと、を含む。一部の実施形態では、cの検出器は、2Dまたは検出器であり、結合事象は、表面またはマトリックス上で、例えば、単一分子局在化アルゴリズムを使用して、ナノメートル正確度で位置決定される。一部の実施形態では、特徴は、プローブと分子との親和性に対応する各事象の持続時間である。一部の実施形態では、特徴は、表面またはマトリックス上の場所である。
In some embodiments, the invention includes methods of characterizing interactions between one or more probes and molecules, including:
adding one or more probe species to the molecule under conditions that allow the probe to transiently bind to the molecule;
continuously monitoring and recording individual binding events on the molecule with a detector over a period of time;
analyzing the data from step b to determine one or more characteristics of the interaction;
optionally, prior to step a, the molecule is immobilized on a surface or matrix. In some embodiments, the detector in c is a 2D or detector and binding events are located on a surface or matrix with nanometer accuracy, for example using single molecule localization algorithms. It is determined. In some embodiments, the feature is the duration of each event corresponding to the affinity between the probe and the molecule. In some embodiments, the feature is a location on a surface or matrix.

一部の実施形態では、本発明は、不均一な高分子の化学構造の単位を識別または特徴付ける方法を含み、複数のプローブを結合させて、高分子の複数の部位における化学構造を識別することを含み、
a)1つ以上のプローブ種を、プローブが高分子に結合することができる条件下で、高分子に添加することと、
b)検出器で、高分子上の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、高分子の複数の部位における化学構造を識別することと、を含む。
In some embodiments, the invention includes methods of identifying or characterizing units of chemical structure of heterogeneous macromolecules, wherein multiple probes are attached to identify chemical structures at multiple sites of the macromolecule. including
a) adding one or more probe species to the macromolecule under conditions that allow the probe to bind to the macromolecule;
b) continuously monitoring and recording binding events on the macromolecule with a detector over a period of time;
c) analyzing the data from step b to identify chemical structures at multiple sites of the macromolecule.

任意選択的に、高分子は、ステップaの前に、表面またはマトリックス上に固定化される。一部の実施形態では、高分子は、超分子構造を含む。一部の実施形態では、1つ以上のプローブの各々は、高分子に一過的に結合する。一部の実施形態では、複数のプローブの各々は、ポリマーに反復的に結合する。 Optionally, the macromolecule is immobilized on a surface or matrix prior to step a. In some embodiments, the macromolecule comprises a supramolecular structure. In some embodiments, each of the one or more probes transiently binds to a macromolecule. In some embodiments, each of the plurality of probes is repeatedly attached to the polymer.

一部の実施形態では、分子実体は、少なくとも5単位を含むポリマーである。一部の実施形態では、結合プローブは、オリゴヌクレオチド、抗体、結合タンパク質、低分子などを含む分子プローブである。典型的には、ポリマーは、ポリヌクレオチドまたはポリペプチドを含む。 In some embodiments, the molecular entity is a polymer containing at least 5 units. In some embodiments, binding probes are molecular probes, including oligonucleotides, antibodies, binding proteins, small molecules, and the like. Typically, polymers comprise polynucleotides or polypeptides.

一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または特徴付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、複数のプローブを結合させることを含み、
a)1つ以上のプローブ種を、プローブがポリマーに結合することができる条件下で、ポリマーに添加することと、
b)検出器で、ポリマー上の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、ポリマーに沿った複数の部位における化学構造を識別することと、を含む。
In some embodiments, the invention includes a method of identifying or characterizing units of chemical structure of a heterogeneous polymer, wherein multiple probes are attached to identify chemical structures at multiple sites along the polymer. including
a) adding one or more probe species to the polymer under conditions that allow the probe to bind to the polymer;
b) continuously monitoring and recording binding events on the polymer with a detector over a period of time;
c) analyzing the data from step b to identify chemical structures at multiple sites along the polymer.

一部の実施形態では、ポリマーは、ステップaの前に、表面またはマトリックス上に固定化される。一部の実施形態では、ポリマーは、ステップaの前に変性される。一部の実施形態では、1つ以上のプローブの各々は、ポリマーに一過的に結合する。一部の実施形態では、複数のプローブの各々は、ポリマーに反復的に結合する。一部の実施形態では、化学構造の単位を識別するプローブ結合の場所は、ナノメトリック(必要に応じて、サブナノメトリックでも)正確度/精度で(例えば、単一分子局在化アルゴリズムを使用して)決定され、それによって、「配列」は、各場所に結合するプローブの同一性に基づいて決定される。 In some embodiments, the polymer is immobilized on a surface or matrix prior to step a. In some embodiments, the polymer is modified prior to step a. In some embodiments, each of the one or more probes is transiently attached to the polymer. In some embodiments, each of the plurality of probes is repeatedly attached to the polymer. In some embodiments, the location of probe binding that identifies units of chemical structure is determined with nanometric (and optionally sub-nanometric) accuracy/precision (e.g., using single-molecule localization algorithms). ), whereby the "sequence" is determined based on the identity of the probes that bind to each location.

一部の実施形態では、位置決定の正確度および精度が高く(サブナノメートルまたは数ナノメートル)、各配列ビットの場所および順序が、明確に決定される。しかしながら、配列リードは、非連続的に、断続的な様式で出現する。ほとんどの配列決定方法が、配列を最初から最後まで連続的に読み取る場合、本発明では、配列情報の獲得は、確率的に分散される。すべての配列データが収集された場合、配列は、それらの空間場所に従って得られた配列情報のビットを順序付けることによってまとめられ、各配列ビットは、例えば、5塩基長について得られた情報の前および次の局在化配列ビットと重複する必要があり、各配列ビットは、配列において、一端で、前の配列ビットの4塩基と、および他端で、次の配列ビットの4塩基と重複する必要がある。これが正確に保持されてされない場合(例えば、4つではなく3つのみの重複)、配列ビットは、不一致に起因して得られた可能性が高いか、または位置がわずかにずれている可能性がある。本発明の新規の態様は、この内部チェック機構が、配列ビットの正しい順序を解決でき、したがって、高い信頼度で配列を解決できるはずである、ということである。 In some embodiments, the positioning accuracy and precision is high (sub-nanometer or few nanometers) and the location and order of each array bit is unambiguously determined. However, sequence reads appear in a discontinuous, intermittent manner. Where most sequencing methods read sequences sequentially from beginning to end, in the present invention the acquisition of sequence information is stochastically distributed. When all sequence data have been collected, the sequence is assembled by ordering the bits of sequence information obtained according to their spatial location, with each sequence bit preceded by the information obtained for, for example, 5 bases in length. and must overlap with the next localized alignment bit, each alignment bit overlapping on one end with 4 bases of the previous alignment bit and on the other end with 4 bases of the next alignment bit There is a need. If this is not preserved exactly (e.g. only 3 overlaps instead of 4) then the alignment bits are likely obtained due to mismatches or may be slightly misaligned. There is A novel aspect of the present invention is that this internal checking mechanism should be able to resolve the correct ordering of alignment bits, and thus resolve alignment with a high degree of confidence.

一部の実施形態では、プローブ添加の各サイクルの持続時間は、特定の数の結合事象が、各相補結合部位について収集され得るように構成される。結合事象の数は、平均で5、10、20などである。一部の実施形態では、プローブ添加の各サイクルの持続時間は、特定の数の光子が、各相補結合部位について収集され得るように構成される。各結合について収集される光子の数が多いほど、達成され得る位置決定の程度(正確度)および精度が良好になる。一部の実施形態では、異なるプローブまたはプローブセットの持続時間が異なる。したがって、いくつかのプローブは、高精度で位置決定することができ、他のプローブは、より低い精度で位置決定することができる。一部の実施形態では、高度に局所化された位置を使用して、配列アセンブリを繋留する(anchor)ことができ、局所化が不十分な位置は、配列の重複によって計算的にアセンブリされる。一部の実施形態では、局所化された位置(あまり十分に局所化されていないものを含む)は、ド・ブラウングラフを使用するものなどのアセンブリアルゴリズムで使用することができる。 In some embodiments, the duration of each cycle of probe addition is configured such that a certain number of binding events can be collected for each complementary binding site. The number of binding events is on average 5, 10, 20, etc. In some embodiments, the duration of each cycle of probe addition is configured such that a certain number of photons can be collected for each complementary binding site. The higher the number of photons collected for each bond, the better the degree (accuracy) and precision of localization that can be achieved. In some embodiments, different probes or probe sets have different durations. Thus, some probes can be positioned with high accuracy and other probes can be positioned with lower accuracy. In some embodiments, highly localized positions can be used to anchor sequence assembly, and poorly localized positions are computationally assembled by overlapping sequences. . In some embodiments, the localized positions (including those that are not well localized) can be used in assembly algorithms such as those using de Brownian graphs.

一部の実施形態では、プローブは標識される。標識という用語は、単一の検出可能な実体(例えば、波長発光実体)または複数の検出可能な実体を包含する。一部の実施形態では、複数の検出可能な実体は、コードを含み得、それによってプローブ種を識別することができる。一部の実施形態では、プローブは、フルオロフォアまたは粒子で標識される。蛍光標識は、異なる波長で蛍光を放出ることができ、また異なる寿命を有する。一部の実施形態では、バックグラウンド蛍光は、散乱に起因する蛍光の早期の時間枠を拒絶することによって除去される。標識がプローブの一端(例えば、オリゴプローブの3’末端)にある場合、1nmの正確度は、プローブ配列の3’末端および標的配列の5’に対応する。 In some embodiments, probes are labeled. The term label encompasses a single detectable entity (eg, wavelength emitting entity) or multiple detectable entities. In some embodiments, the multiple detectable entities may comprise codes, thereby distinguishing between probe species. In some embodiments, probes are labeled with fluorophores or particles. Fluorescent labels can emit fluorescence at different wavelengths and have different lifetimes. In some embodiments, background fluorescence is removed by rejecting early timeframes of fluorescence due to scatter. If the label is at one end of the probe (eg, the 3' end of an oligo probe), 1 nm accuracy corresponds to the 3' end of the probe sequence and the 5' end of the target sequence.

一部の実施形態では、ポリマーの配列決定は、プローブのレパートリーとのその一過的な相互作用(例えば、ポリヌクレオチドとオリゴヌクレオチドのレパートリーとの相互作用)を測定することに基づく。一部の実施形態では、レパートリーは、所与の長さまたは所与の長さのセットのすべてのオリゴヌクレオチドを含む。 In some embodiments, sequencing of a polymer is based on measuring its transient interaction with a repertoire of probes (eg, interaction with a repertoire of polynucleotides and oligonucleotides). In some embodiments, the repertoire includes all oligonucleotides of a given length or set of given lengths.

一部の実施形態では、本発明は、単一標的ポリヌクレオチド上でヌクレオチド塩基および/または修飾を配列決定する方法を含み、
a)ポリヌクレオチドを、表面またはマトリックス上に固定化し、任意選択的に、ポリヌクレオチドを伸展することと、
b)任意選択的に、ポリヌクレオチドを、ポリヌクレオチドの少なくとも一部分がプローブとの結合に利用可能になる程度まで、変性させることと、
c)1つ以上のプローブ種を、プローブがポリヌクレオチドに一過的に結合することができる条件下で、添加することと、
d)検出器で、ポリヌクレオチド上の結合事象を継続的に監視し、一定期間、記録することと、
e)bのプローブを除去することと、
f)プローブの完全なレパートリーの結合が監視されるまで、毎回異なる1つ以上のプローブ種を用いて、ステップb~dを反復することと、
g)ステップcの各反復からのデータをコンパイルして、修飾および/または塩基の配列を再構築することと、を含む。
In some embodiments, the invention comprises a method of sequencing nucleotide bases and/or modifications on a single target polynucleotide,
a) immobilizing the polynucleotide on a surface or matrix and optionally extending the polynucleotide;
b) optionally, denaturing the polynucleotide to the extent that at least a portion of the polynucleotide is available for binding to the probe;
c) adding one or more probe species under conditions that allow the probe to transiently bind to the polynucleotide;
d) continuously monitoring and recording binding events on the polynucleotide with a detector over a period of time;
e) removing the probe of b;
f) repeating steps b-d, each time with a different one or more probe species, until binding of the complete repertoire of probes has been monitored;
g) compiling data from each iteration of step c to reconstruct the sequence of modifications and/or bases.

一部の実施形態では、ポリマーの配列決定は、プローブ種のレパートリーの一過的な結合相互作用の出現特性の結果である。1つのプローブの結合は、ポリマーを配列決定するのに十分ではなく、オリゴマーの完全なレパートリーが必要である(例えば、ポリヌクレオチドの場合、オリゴヌクレオチドのレパートリー)。オリゴの結合の場所、重複部位への時間的に離れた結合、不一致の部分的な結合、結合の頻度、結合の持続時間に関する情報は、すべて、堅牢な配列の構築に寄与する。伸長または伸展されたポリヌクレオチドの場合、ポリヌクレオチドの長さに沿ったプローブ結合の場所は、堅牢な配列の構築に寄与する。また、二本鎖DNAの場合、配列は、二重鎖の両方の鎖を同時に配列決定することから出現する。 In some embodiments, polymer sequencing is the result of emergent properties of transient binding interactions of a repertoire of probe species. The binding of one probe is not sufficient to sequence a polymer and a complete repertoire of oligomers is required (eg, in the case of polynucleotides, a repertoire of oligonucleotides). Information about the location of oligo binding, temporally distant binding to overlapping sites, mismatched partial binding, frequency of binding, and duration of binding all contribute to the construction of robust sequences. In the case of elongated or stretched polynucleotides, the location of probe binding along the length of the polynucleotide contributes to the construction of robust sequences. Also, in the case of double-stranded DNA, the sequence emerges from sequencing both strands of the duplex simultaneously.

上記の一部の実施形態では、ポリマー(ポリヌクレオチド中のヌクレオチド)の反復単位上の修飾へのプローブの結合は、任意選択的なbの変性ステップの前に行われる。一部の実施形態では、任意選択的なbの変性ステップは行われず、プローブが二重鎖構造に対処する。場合によっては、プローブは、鎖侵入を介して(例えば、PNAプローブを使用して)、二重鎖の過剰なゆらぎの誘発を介して、修飾亜鉛フィンガータンパク質を介して二重鎖の配列を認識することによって、または二重鎖を融解する(例えば、ガイドRNA配列の結合を可能にすることにより)Cas9もしくは類似のタンパク質を使用することによって(ガイドRNAは、照合プローブ配列を含み得、レパートリーの各配列を含むgRNAが提供される)、二重鎖の個々の鎖に結合する。 In some embodiments of the above, the attachment of probes to modifications on repeating units of the polymer (nucleotides in the polynucleotide) is performed prior to the optional denaturation step of b. In some embodiments, the optional b denaturation step is not performed and the probe addresses double-stranded structure. In some cases, the probe recognizes the sequence of the duplex through strand invasion (e.g., using PNA probes), through induction of excessive duplex fluctuation, or through a modified zinc finger protein. or by using Cas9 or a similar protein that melts the duplex (e.g., by allowing guide RNA sequences to bind) (the guide RNA may contain a reference probe sequence, and the repertoire of A gRNA containing each sequence is provided), which binds to the individual strands of the duplex.

上記の注意点は、一部の実施形態では、特定のプローブは、例えば、それ自体との問題のある相互作用(例えば、自己相補性、それ自体の他のコピーとの結合を可能にする回文配列)、レパートリーの他のプローブとの相互作用、またはポリヌクレオチドとの相互作用(例えば、既知の確率的で無差別な結合)に起因して、レパートリーから省略され得るが、本発明の配列決定を実施するのに十分なプローブが残ることである。実際、最小数の有益なプローブは、分析下の配列の種類ごとに決定することができる。別の注意点は、完全なレパートリーの半分が、レパートリーの他のオリゴに完全に相補的であるという事実に関する。一部の実施形態では、これらの相補対(および、実質的な相補性のために問題のある他の対)が、ポリヌクレオチドに同時に添加されないように保証される。一部の実施形態では、二本鎖DNAのセンス鎖およびアンチセンス鎖の両方が存在する場合、配列決定は、相補対の1つだけのメンバーを用いて行われ、センス鎖およびアンチセンス鎖の両方から得られた配列情報が組み合わされて、配列を生成する。 The above caveat is that in some embodiments, a particular probe may, e.g. sequences), interactions with other probes of the repertoire, or interactions with polynucleotides (e.g., known stochastic and promiscuous binding), which may be omitted from the repertoire, but the sequences of the present invention Enough probes remain to make a decision. In fact, the minimum number of useful probes can be determined for each type of sequence under analysis. Another caveat concerns the fact that half of the complete repertoire is fully complementary to other oligos in the repertoire. In some embodiments, these complementary pairs (and other pairs in question due to substantial complementarity) are guaranteed not to be added to the polynucleotide at the same time. In some embodiments, when both sense and antisense strands of double-stranded DNA are present, sequencing is performed with only one member of a complementary pair, and The sequence information obtained from both is combined to generate the sequence.

一部の実施形態では、(天然に二本鎖である標的の)相補鎖について得られた参照配列および配列情報を使用して、特定の場所における配列の割当を容易にすることができる。 In some embodiments, the reference sequence and sequence information obtained for the complementary strand (of the naturally double-stranded target) can be used to facilitate assignment of sequences at particular locations.

本発明の一部の実施形態では、配列決定は、以下のステップ(5塩基の配列決定について示している):
a)表面上の二重鎖DNAを、伸展/伸長させること、
b)二重鎖DNAを変性させて、残っている一対の相補鎖を、表面上で、インサイツで残すことと、
c)短いオリゴ(例えば、3、4、5、6塩基長)の完全なレパートリーを、DNA鎖の対に結合させ、各オリゴの結合場所を、鎖の対の糸尺(linear length)に沿って記録することと、
d)結合の場所およびオリゴ間の配列重複を使用して、2つの鎖の各々に対する相補体を表すオリゴの2つのタイリング経路を構築することと、
e)2つの鎖の逆相補配列を比較し、「二重鎖コンセンサス」由来の塩基割当を行うことと(両方の鎖によって割当が裏付けられ、裏付けが見つからない場合にベースコールの曖昧さが示される)、を含む。
In some embodiments of the invention, sequencing comprises the following steps (shown for 5 base sequencing):
a) spreading/elongating the double stranded DNA on the surface,
b) denaturing the double stranded DNA leaving the remaining pair of complementary strands in situ on the surface;
c) A complete repertoire of short oligos (e.g., 3, 4, 5, 6 bases long) is attached to a pair of DNA strands and the attachment site of each oligo is aligned along the linear length of the pair of strands. and
d) constructing two tiling paths of oligos representing the complement to each of the two strands using the attachment sites and sequence overlap between the oligos;
e) Comparing the reverse complement sequences of the two strands and making base assignments from a "duplex consensus" (both strands confirm assignments, indicating base call ambiguity if no confirmation is found). ), including

問題は、タイリング経路に切れ目がある場合、例えば、5塩基の配列決定の場合、5塩基長を超える一続きの配列にオリゴ結合が存在しない場合に生じ得る。この場合、1つ以上のアプローチを取ることができる:塩基割当は、利用可能な場合、二重鎖の相補鎖から得られた配列に従うこと、利用可能な場合、配列の同じセグメントの他のコピーに依存すること、または参照配列に従うこと(この場合、塩基は、参照から人為的に移植されることを示すように注釈付けされ得る)。 Problems can arise when there are discontinuities in the tiling pathway, eg, in the case of 5 base sequencing, when there are no oligo bonds in stretches greater than 5 bases in length. In this case, one or more approaches can be taken: the base assignments follow the sequence obtained from the complementary strand of the duplex, if available; or follow a reference sequence (in which case the bases may be annotated to indicate that they are artificially transplanted from the reference).

一部の実施形態では、人工知能または機械学習を使用して、既知の配列のポリマー(例えば、ポリヌクレオチド)に対して試験する場合、および/またはポリヌクレオチドの配列を別の方法からのデータと交差検証する場合、レパートリーのメンバーの挙動を学習させる。学習アルゴリズムは、1つ以上の条件または文脈における、プローブの結合部位を含む1つ以上のポリヌクレオチド標的に対する特定のプローブの完全な挙動を考慮に入れる。同じまたは異なる試料でより多くの配列決定が行われるにつれて、機械学習から得られる知識はより強力になる。機械学習から学んだことは、様々な他のアッセイに適用され、特に、一過的な結合ベースの出現配列決定および本発明の他の実施形態に加えて、オリゴとオリゴ/ポリヌクレオチドとの相互作用(例えば、ハイブリダイゼーションによる配列決定)を伴うアッセイにおいて、適用され得る。 In some embodiments, artificial intelligence or machine learning is used when testing against polymers (e.g., polynucleotides) of known sequence and/or comparing the sequences of polynucleotides with data from another method. When cross-validating, the behavior of the members of the repertoire is learned. A learning algorithm takes into account the complete behavior of a particular probe against one or more polynucleotide targets, including the binding site of the probe, under one or more conditions or contexts. The knowledge gained from machine learning becomes more powerful as more sequencing is performed on the same or different samples. Learnings from machine learning can be applied to a variety of other assays, particularly transient binding-based emergence sequencing and interaction between oligos and oligo/polynucleotides, in addition to other embodiments of the invention. It can be applied in assays involving action, such as sequencing by hybridization.

一部の実施形態では、人工知能または機械学習は、既知の配列の1つ以上のポリヌクレオチドへの短いオリゴ(例えば、3塩基長、4塩基長、5塩基長、または6塩基長)の完全なレパートリーの結合について実験的に得られた結合パターンのデータを提供することによって訓練される。各オリゴの訓練データは、結合場所、結合の持続時間、および所与の期間にわたる結合事象の数を含む。この訓練の後、機械学習アルゴリズムが、決定される配列のポリヌクレオチドに適用され、その学習に基づいて、ポリヌクレオチドの配列をアセンブリすることができる。機械学習アルゴリズムに、参照配列を提供することもできる。 In some embodiments, artificial intelligence or machine learning is used to complete short oligos (e.g., 3 bases, 4 bases, 5 bases, or 6 bases in length) to one or more polynucleotides of known sequence. It is trained by providing experimentally obtained binding pattern data for the binding of a diverse repertoire. The training data for each oligo includes binding locations, duration of binding, and number of binding events over a given time period. After this training, machine learning algorithms can be applied to the polynucleotides of the determined sequences and, based on their learning, assemble sequences of the polynucleotides. A reference sequence can also be provided to a machine learning algorithm.

一部の実施形態では、配列アセンブリアルゴリズムは、機械学習要素および非機械学習要素の両方を含む。 In some embodiments, the sequence assembly algorithm includes both machine learning and non-machine learning elements.

一部の実施形態では、配列アセンブリアルゴリズムは、ベイズアプローチを含む。一部の実施形態では、本発明の方法に由来するデータは、(WO2010075570)に記載されている種類のアルゴリズムに提供することができ、任意選択的に、他の種類のゲノムデータまたは配列決定データと組み合わせることができる。 In some embodiments, the sequence assembly algorithm comprises a Bayesian approach. In some embodiments, data derived from the methods of the invention can be provided to algorithms of the type described in (WO2010075570), optionally other types of genomic or sequencing data. can be combined with

一部の実施形態では、実験的に得られた結合パターンから学習するコンピュータアルゴリズムの代わりに、結合パターンは、シミュレーションを介して得られる。例えば、レパートリーのオリゴの、既知の配列のポリヌクレオチドへの一過的な結合のシミュレーションを行うことができ、シミュレーションは、実験データまたは公開データから得られた各オリゴの挙動のモデルに基づいて行うことができる。例えば、結合安定性の予測は、最近傍法[SantaLucia et al.Biochemistry 35,3555-3562(1996)、Breslauer et al.Proc.Natl.Acad.Sci.USA,83:3746-3750(1986)]に従って利用可能であり、不一致挙動は、既知であるか、または実験的に導出され得るが、オリゴの一部の短いサブ配列(例えば、GGAからACCへ)の異常に高い結合強度が知られている。機械学習アルゴリズムは、シミュレーションデータ上で訓練され、次いで、それが短いオリゴの完全なレパートリーによって照合される場合、未知の配列の配列を決定するために使用され得る。 In some embodiments, instead of computer algorithms learning from experimentally derived binding patterns, binding patterns are obtained via simulation. For example, transient binding of oligos in the repertoire to polynucleotides of known sequence can be simulated, the simulation being based on models of the behavior of each oligo derived from experimental or published data. be able to. For example, prediction of binding stability can be performed using the nearest neighbor method [SantaLucia et al. Biochemistry 35, 3555-3562 (1996), Breslauer et al. Proc. Natl. Acad. Sci. USA, 83:3746-3750 (1986)], and although the mismatch behavior is known or can be derived experimentally, short subsequences of some of the oligos (e.g. GGA to ACC ) are known to have unusually high bond strengths. A machine learning algorithm can be trained on simulated data and then used to determine the sequence of an unknown sequence when it is matched against the complete repertoire of short oligos.

一部の実施形態では、レパートリーまたはパネルのオリゴのデータ(場所、結合持続時間、シグナル強度など)は、1つ以上、好ましくは(数十、数百、または数千)の既知の配列で訓練された機械学習アルゴリズムにプラグインされる。 In some embodiments, the data (location, binding duration, signal intensity, etc.) for a repertoire or panel of oligos are trained on one or more, preferably (tens, hundreds, or thousands) of known sequences. It is plugged into the machine learning algorithms that have been developed.

次いで、機械学習アルゴリズムを適用して、問題の配列から、データセットを生成し、機械学習アルゴリズムは、問題の未知の配列の配列を生成する。下等生物、例えば、細菌、バクテリオファージなどの配列決定のためのアルゴリズムの訓練は、その種類の生物に対して行われる必要がある。S.pombeなどの酵母から始まり、反復DNAを有するヒトまたはコムギに至る高等生物の場合、高等生物に対して訓練される必要がある。全染色体長までのメガ塩基断片の長距離アセンブリの場合、訓練は、類似の生物に対して行われる必要があり得、そのため、ゲノムの特定の様相が訓練中に表現される。例えば、ヒトゲノムは二倍体であり、多くのセグメント重複を有する。コムギは、倍数体である。 A machine learning algorithm is then applied to generate a data set from the problem array, and the machine learning algorithm generates an array of the unknown problem sequences. Algorithms for sequencing lower organisms such as bacteria, bacteriophages, etc. need to be trained for that type of organism. S. For higher organisms, starting from yeast such as pombe to humans or wheat with repetitive DNA, they need to be trained to higher organisms. For long-range assembly of megabase fragments up to full chromosome length, training may need to be performed on similar organisms so that specific aspects of the genome are represented during training. For example, the human genome is diploid and has many segmental duplications. Wheat is polyploid.

一部の実施形態では、機械学習に基づく配列再構築のアプローチは、
a)1つ以上の訓練データセットから収集されたレパートリーの各オリゴの結合挙動に関する情報、およびかかる情報を使用することができるアセンブリアルゴリズムを提供することと、
b)レパートリーの各オリゴを、配列が決定されるポリヌクレオチドに物理的に結合させ、各オリゴについて、結合場所、および/または結合持続時間、および/または各場所で結合が生じる回数(結合反復の存続時間)に関する情報を提供することと、
c)訓練データセットを使用するアセンブリアルゴリズムを使用して、ポリヌクレオチドの配列を再構築することと、を含む。
In some embodiments, the machine learning-based sequence reconstruction approach comprises:
a) providing information about the binding behavior of each oligo of the repertoire collected from one or more training datasets, and an assembly algorithm capable of using such information;
b) Each oligo of the repertoire is physically attached to the polynucleotide to be sequenced, and for each oligo the location of attachment and/or the duration of attachment and/or the number of times attachment occurs at each location (number of iterations of attachment). providing information about the lifetime);
c) reconstructing the sequence of the polynucleotide using an assembly algorithm using the training data set.

ヒトゲノムの場合、良好な基本ルールのゲノムは、NA12878であろう。NA12878は、様々な配列決定、ハプロタイピングおよび構造マッピングの方法によって広範に特徴付けられており、そのアセンブリは、任意のヒトゲノムの中で最も信頼度が高い。それにもかかわらず、これまでのところ、複雑なゲノムの真の表現を与え得る完璧な技術がないため、そのようなゲノムに利用可能な真値(ground truth)のデータセットは完璧ではない可能性があり、機械学習アルゴリズムは、代替的な「真値」または「平均」または「コンセンサス」を考慮に入れる必要があり得る。真値は、Illumina配列決定と組み合わせて、異なる技術(例えば、10×Genomics、Bionanogenomics、PacBio、ONT)を使用したアセンブリから事前に構築される。 For the human genome, a good ground rule genome would be NA12878. NA12878 has been extensively characterized by various sequencing, haplotyping and structural mapping methods, and its assembly is the most reliable of any human genome. Nonetheless, the ground truth datasets available for such genomes may not be perfect, as so far there is no perfect technology that can give a true representation of complex genomes. , and machine learning algorithms may need to take into account alternative 'true values' or 'means' or 'consensus'. True values are pre-constructed from assemblies using different technologies (eg, 10×Genomics, Bionanogenomics, PacBio, ONT) in combination with Illumina sequencing.

一部の実施形態では、特定の実験の配列は、最初に、非機械学習アルゴリズムによって処理される。次いで、第1のアルゴリズムの出力配列を使用して、機械学習アルゴリズムを訓練し、訓練が、同じ分子の実際の実験的に導出された配列上で行われるようにする。機械学習アルゴリズムの利点は、他のアルゴリズムよりも速く実装することができることである。 In some embodiments, a particular experimental sequence is first processed by a non-machine learning algorithm. The output sequences of the first algorithm are then used to train a machine learning algorithm such that the training is performed on the actual experimentally derived sequences of the same molecule. An advantage of machine learning algorithms is that they can be implemented faster than other algorithms.

一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または順序付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、複数のプローブを結合させることを含む。複数の当該部位は、回折限界光学撮像によって解像可能であるよりも近いが、それらの検出が時間的に離れているため解像される。化学構造を識別するプローブの結合は、必要に応じて、ナノメトリック/サブナノメトリック位置決定の正確度/精度で決定され、それによって、化学構造の空間順序である「配列」が決定される。 In some embodiments, the invention includes a method of identifying or ordering units of chemical structure of a heterogeneous polymer, wherein multiple probes are attached to identify chemical structures at multiple sites along the polymer. Including. Multiple sites of interest are closer than can be resolved by diffraction-limited optical imaging, but are resolved because their detection is separated in time. The binding of chemical structure identifying probes is optionally determined with nanometric/sub-nanometric localization accuracy/precision, thereby determining the spatial order of the chemical structure, the "sequence."

さらなる実施形態では、特徴付けられるか、または配列決定される複数のポリマーは、回折限界光学撮像によって解像可能であるものよりも近いが、それらの長さに沿ったプローブ結合の場所がナノメトリック的に局在しているため、解像される。 In further embodiments, the plurality of polymers characterized or sequenced are closer than is resolvable by diffraction-limited optical imaging, but the location of probe binding along their length is nanometric. are resolved because they are locally localized.

一部の実施形態では、本発明は、不均一ポリマーの化学構造の単位を識別または順序付ける方法を含み、ポリマーに沿った複数の部位における化学構造を識別するために、ポリマーを伸長させること、および複数のプローブを結合させることを含む。当該複数の部位は、回折限界光学的撮像によって解像可能であるものよりも近いが、ポリマーが伸長され、かつ/またはそれらの標識が時間的に離れているため、解像される。各化学構造を識別するプローブの結合の場所は、ナノメトリック正確度で決定され、それによって、化学構造の空間順序である「配列」が決定される。 In some embodiments, the invention includes a method of identifying or ordering units of chemical structure of a heterogeneous polymer, stretching the polymer to identify chemical structures at multiple sites along the polymer; and binding a plurality of probes. The multiple sites are closer than can be resolved by diffraction-limited optical imaging, but are resolved because the polymers are stretched and/or their labels are separated in time. The location of binding of the probes that identify each chemical structure is determined with nanometric precision, thereby determining the spatial order of the chemical structure, the "sequence."

一部の実施形態では、本発明は、標的ポリヌクレオチド上の塩基配列を分析する方法を含む。一部の実施形態では、本発明は、ヌクレオチド修飾またはDNA損傷、ならびに標的ポリヌクレオチド上の塩基配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリヌクレオチド上の配列の編成を分析する方法を含む。 In some embodiments, the invention includes methods of analyzing base sequences on target polynucleotides. In some embodiments, the invention includes methods for analyzing nucleotide modifications or DNA damage as well as base sequences on target polynucleotides. In some embodiments, the invention includes methods of analyzing the organization of sequences on a target polynucleotide.

「一過的な結合」という用語は、結合試薬またはプローブが、通常、分析の過程でその結合部位に結合したままではなく、典型的には、1つの試薬の結合がオンおよびオフし、次いで、同じまたは別の試薬の結合がオンおよびオフするなど、を意味する。反復結合とは、同じ結合部位が、分析の過程で、同じ結合試薬もしくはプローブ、または同じ種類の結合試薬もしくはプローブによって複数回結合され、典型的には、1つの試薬の結合がオンおよびオフし、次いで、別の試薬の結合がオンおよびオフするなど、を意味する。一部の実施形態では、結合相互作用は、一定期間にわたって継続的に観察される。 The term "transient binding" means that the binding reagent or probe does not normally remain bound to its binding site during the course of the analysis, typically binding one reagent on and off and then , binding of the same or different reagents on and off, etc. Repeated binding means that the same binding site is bound multiple times by the same binding reagent or probe, or the same type of binding reagent or probe, during the course of an assay, typically with one reagent binding on and off. , then the binding of another reagent is turned on and off, and so on. In some embodiments, binding interactions are observed continuously over a period of time.

一部の実施形態では、反復結合は、得られた情報の感度および正確度を増加させる。シグナルは、一度検出された場合、バックグラウンドを超えて呼び出されるには低すぎる可能性があり、持続的に見られる場合に呼び出されるため、感度が上がると、シグナルが本物であるという信頼度が増す。複数の読み取りの情報により、ある読み取りが、別の読み取りで確認されるため、正確度が上昇する(同様に、両方の鎖の読み取りにより、一方の読み取りが、別の読み取りで確認され得る)。 In some embodiments, repeated binding increases the sensitivity and accuracy of the information obtained. Because the signal, once detected, may be too low to be called out above background, and is called out when seen persistently, increased sensitivity increases confidence that the signal is genuine. Increase. The information of multiple reads increases the accuracy because one read is confirmed by another read (similarly, reading on both strands allows one read to be confirmed by another read).

一部の実施形態では、本方法の機構は、プローブ分子の標的分子への結合を含む。かかる結合事象は、短命または一過性であり、ならびに多くのかかる結合事象は、同じ場所および/または部分的に重複する場所で反復的に生じる。かかる結合事象の場所、頻度、滞留時間、および光子放出は、記録され、計算的に処理される。 In some embodiments, the mechanism of the method involves binding of the probe molecule to the target molecule. Such binding events are short-lived or transient, and many such binding events occur repeatedly at the same and/or partially overlapping locations. The location, frequency, dwell time and photon emission of such binding events are recorded and processed computationally.

一部の実施形態では、一過的な結合は、少量の二価カチオンを含むが、一価カチオンを含まない緩衝液中で行われる(例えば、5mMのTris-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8)。 In some embodiments, transient binding is performed in buffers containing small amounts of divalent cations but no monovalent cations (eg, 5 mM Tris-HCl, 10 mM MgCl2, 1 mM EDTA, 0.05% Tween-20, pH 8).

したがって、ポリヌクレオチドの配列決定は、以下のステップ:
a)ポリヌクレオチドを固定化することと、
b)1nM未満、5nM未満、10nM、または15nMの塩化マグネシウムを含む反応緩衝液中で、オリゴのレパートリーまたはサブレパートリーを、ポリヌクレオチドに結合させることと、
c)一過的な結合を検出することと、
d)必要に応じて、b~cを反復することと、を含む。
Polynucleotide sequencing therefore involves the following steps:
a) immobilizing the polynucleotide;
b) binding the repertoire or sub-repertoire of oligos to the polynucleotide in a reaction buffer containing less than 1 nM, less than 5 nM, 10 nM, or 15 nM magnesium chloride;
c) detecting transient binding;
d) optionally repeating b through c.

ポリヌクレオチド配列のアセンブリ
一部の実施形態では、分子が固定化される個体基板は、ガラス、ケイ素、二酸化ケイ素、窒化ケイ素、金属(例えば、金)、ポリジメトキシシラン(PDMS)、ポリマー(例えば、環状オレフィン、Zeonex、ポリメチルメタクリレート、ポリスチレン)を含む。一部の実施形態では、固体表面は、例えば、ポリビニルシランでコーティングされる。一部の実施形態では、ポリマーは、分子コーミングによって、ポリビニルコーティング表面に伸展され、次いで、紫外線または高温に曝露することによって表面に架橋される。
Assembly of Polynucleotide Sequences In some embodiments, the solid substrate to which molecules are immobilized is glass, silicon, silicon dioxide, silicon nitride, metals (e.g., gold), polydimethoxysilane (PDMS), polymers (e.g., cyclic olefins, Zeonex, polymethyl methacrylate, polystyrene). In some embodiments, the solid surface is coated with, for example, polyvinylsilane. In some embodiments, the polymer is extended onto the polyvinyl coating surface by molecular combing and then crosslinked to the surface by exposure to ultraviolet light or elevated temperature.

一部の実施形態では、本発明は、表面またはマトリックスと複数の相互作用を形成する伸長ポリマーへの、レパートリーの各メンバーの結合場所を決定することを含む。一部の実施形態では、結合場所は、反復的で一過的なオン・オフのプローブ結合事象を検出することによって決定される。その結合部位は、重複してもよいが、それらの結合が時間的に離れる傾向があるため、互いの結合をそれほど干渉しない。プローブがより長い期間結合している場合、一方の結合が、別の結合を遮断する。 In some embodiments, the invention involves determining the binding location of each member of the repertoire to an elongated polymer that forms multiple interactions with the surface or matrix. In some embodiments, the binding sites are determined by detecting repetitive, transient on-off probe binding events. The binding sites may overlap but do not significantly interfere with each other's binding, as their binding tends to be separated in time. If the probe binds for a longer period of time, binding of one blocks binding of the other.

一部の実施形態では、レパートリーは、(例えば、所与の長さのすべてのオリゴの)完全なレパートリーである。一部の実施形態では、それは一連のオリゴプローブのタイリングシリーズである。一部の実施形態では、それはオリゴプローブのパネルである。合成生物学における特定の用途(例えばDNAデータの記憶)の場合、配列決定は、配列の特定のブロックの順序を見つけることを含み得、データをコード化するように設計される。 In some embodiments, the repertoire is the complete repertoire (eg, of all oligos of a given length). In some embodiments it is a tiling series of oligoprobes. In some embodiments it is a panel of oligoprobes. For certain applications in synthetic biology, such as DNA data storage, sequencing may involve finding the order of particular blocks of sequences, designed to encode data.

一部の実施形態では、本方法の機構は、プローブ分子の標的分子への結合を含み、かかる結合は、標識により検出可能であり、当該標識は、その放出または光スイッチングのオフおよび/またはオンにおいて一過的に結合、点滅、または変動し、多くのかかる結合事象は、同じ場所および/または1つ以上の部分的に重複する場所で、反復的に生じ得る。かかる結合事象の場所および持続時間が、記録され、処理される。一部の実施形態では、標識の見かけの一過性、変動性、または点滅挙動は、標識がプローブに結合されており、プローブが標的に結合し、標的から解離しているためである。 In some embodiments, the mechanism of the method involves binding of the probe molecule to the target molecule, such binding being detectable by a label, the label turning off and/or on its emission or photoswitching. , and many such binding events may occur repeatedly at the same location and/or at one or more partially overlapping locations. The location and duration of such binding events are recorded and processed. In some embodiments, the apparent transient, variable, or blinking behavior of the label is due to the label being attached to the probe and the probe binding and dissociating from the target.

一部の実施形態では、標的に結合するプローブは、直接標識されていない。一部のかかる実施形態では、プローブは、第2の実体の結合のための受容体として機能する実体である「フラップ」を含む。2つの実体は、分子結合対を含み得る。かかる結合対は、核酸結合対を含み得る。一部の実施形態では、フラップは、標識オリゴヌクレオチド(オリゴ)に結合する一連のオリゴまたはポリヌクレオチド配列を含み、かかる結合は、標的に結合するプローブの部分の一過的な結合を撮像するプロセスの過程中、実質的に安定である。一部の実施形態では、標的は、ポリヌクレオチド配列を含み、プローブの結合部分は、例えば、3塩基長、または4塩基長、または5塩基長、または6塩基長の配列照合部分、任意選択的に、1つ以上の縮重位置もしくは普遍的位置、ならびに任意選択的にヌクレオチドスペーサー(例えば、1つ以上のTヌクレオチド)、または脱塩基部分もしくは非ヌクレオチド部分、およびフラップ部分を含む。かかるフラップ部分は、配列が非修飾であり、撮像の過程中、安定性を保持するために、例えば20塩基長以上であり、配列は安定であるように設計され、かつ好ましくは標的ポリヌクレオチドに頻繁に見つからないものである。 In some embodiments, the target-binding probe is not directly labeled. In some such embodiments, the probe comprises a "flap", an entity that functions as a receptor for binding of a second entity. Two entities may comprise a molecular binding pair. Such binding pairs may include nucleic acid binding pairs. In some embodiments, the flap comprises a series of oligo or polynucleotide sequences that bind to labeled oligonucleotides (oligos), such binding being the process of imaging transient binding of the portion of the probe that binds to the target. is substantially stable during the process of In some embodiments, the target comprises a polynucleotide sequence and the binding portion of the probe is e.g. contains one or more degenerate or universal positions, and optionally a nucleotide spacer (eg, one or more T nucleotides), or an abasic or non-nucleotide portion, and a flap portion. Such flap portions are unmodified in sequence, are designed to be, for example, 20 bases long or longer, are stable in sequence, and are preferably linked to the target polynucleotide in order to retain stability during the imaging process. It is not found often.

一部の実施形態では、プローブのレパートリーが、標的に適用される。一部の実施形態では、レパートリーのプローブの各々、またはレパートリーのプローブのサブセットが、次々に適用される。すなわち、1つまたはサブセットの結合が、最初に検出され、次いで、除去され、その後、次が添加され、検出され、および除去され、次いで、その次に続く。次いで、データを処理して、各特異性のプローブの各プローブ結合事象のナノメトリックまたはサブナノメトリック位置を与える。一部の実施形態では、各プローブ特異性の結合順序および/または場所を使用して、配列をまとめる。 In some embodiments, a repertoire of probes is applied to the target. In some embodiments, each of the probes of the repertoire, or a subset of the probes of the repertoire, are applied one after the other. That is, one or a subset of bindings is first detected and then removed, followed by the next added, detected and removed, and then the next. The data are then processed to give the nanometric or sub-nanometric position of each probe binding event for each specific probe. In some embodiments, the sequence is assembled using the binding order and/or location of each probe specificity.

一部の実施形態では、レパートリーの結合プローブのすべてまたはサブセットが同時に添加され、各結合プローブが、その同一性を完全にまたは部分的にコードする標識に繋がれ、結合プローブの各々のコードが、検出によってデコードされる。 In some embodiments, all or a subset of the conjugated probes of the repertoire are added simultaneously, each conjugated probe is tethered to a label that fully or partially encodes its identity, and the code of each conjugated probe is Decoded by detection.

一部の実施形態では、プローブ上のフラップは、モジュール式であり、異なるオリゴに対する結合部位を含んでもよく、かかるオリゴは、異なる標識を有し、オリゴのプローブ部分の同一性をコードするために使用される。 In some embodiments, the flaps on the probe are modular and may contain binding sites for different oligos, such oligos having different labels to encode the identity of the probe portion of the oligo. used.

一部の実施形態では、核酸標的は、表面またはマトリックスに付着される。一部のかかる実施形態では、標的の一端が、表面またはマトリックスに付着しているが、標的の残部は、相互作用していない。一部の実施形態では、標的は、規則正しい超分子スカフォールド(例えば、DNA折り紙構造)上に捕捉される。一部の実施形態では、スカフォールド構造は、標的分子を捕捉するために、溶液相動態を利用するために、溶液中に遊離状態で開始する。占有されると、スカフォールドは表面に定着または自己組織化し、ロックダウンされて大きなDNA格子を形成し、個々の小さなスカフォールドは互いにロックインする。次いで、それらは、本発明の配列決定ステップのための高度に規則正しいナノ構造アレイを呈する。 In some embodiments, nucleic acid targets are attached to a surface or matrix. In some such embodiments, one end of the target is attached to the surface or matrix, while the remainder of the target is non-interacting. In some embodiments, targets are captured on an ordered supramolecular scaffold (eg, a DNA origami structure). In some embodiments, the scaffold structure starts free in solution to take advantage of solution phase kinetics to capture target molecules. Once occupied, the scaffolds anchor or self-assemble to the surface, locking down to form large DNA lattices, with individual smaller scaffolds locking into each other. They then present highly ordered nanostructure arrays for the sequencing step of the invention.

一部の実施形態では、非特異的結合または外れ値事象の影響を回避するために、本方法は、それらの場所および存続時間に基づいて、シグナルに優先順位を付ける。例えば、格子構造内の場所を含む伸展ポリマーまたは超分子格子(例えば、DNA折り紙グリッド)上に、プローブが、共局在するかどうかに基づいて、場所により優先順位を付ける。結合の存続性による優先順位は、結合の持続時間および結合の頻度に関するものであり、優先順位リストを使用して、完全一致、部分一致、または非特異的結合の可能性を決定する。この優先順位は、パネルまたはレパートリーの各結合プローブに対して確立され、シグナルの正確さを決定するために使用される。優先度は、シグナル検証およびベースコールを容易にするために、本発明のアルゴリズムによって使用される。一部の実施形態では、このアルゴリズムは、
1.シグナル持続時間>閾値であるか。「はい(yes)」の場合、実在(real)として受け入れる。
2.シグナル反復/頻度>閾値であるか。「はい」の場合、実在として受け入れる。
3.シグナルがパターン(グリッドまたはライン)と相関するか。「はい(yes)」の場合、実在(real)として受け入れる。
In some embodiments, the method prioritizes signals based on their location and duration to avoid the effects of non-specific binding or outlier events. For example, probes are prioritized by location based on whether they co-localize on an extended polymer or supramolecular lattice (eg, DNA origami grid) that includes locations within the lattice structure. Prioritization by binding persistence relates to the duration of binding and frequency of binding, and a priority list is used to determine the likelihood of exact, partial, or non-specific binding. This priority is established for each bound probe in a panel or repertoire and used to determine the fidelity of the signal. Priorities are used by the algorithm of the present invention to facilitate signal verification and base calling. In some embodiments, the algorithm is
1. Is signal duration>threshold? If yes, accept as real.
2. Is signal repetition/frequency>threshold? If yes, accept as real.
3. Whether the signal correlates with a pattern (grid or line). If yes, accept as real.

それ以外の場合、このシグナルのデータを破棄する。1および2の代替として、アルゴリズムは、収集された光子数>閾値であるかどうかを尋ねることができる。 Otherwise, discard the data for this signal. As an alternative to 1 and 2, the algorithm can ask if the number of photons collected>threshold.

また、可逆的でないように見えるシグナルは、非特異的シグナル(例えば、表面への蛍光汚染物質の付着)に該当する場合があるため、アセンブリアルゴリズムで廃棄または重み付けされ得る。 Also, signals that do not appear to be reversible may correspond to non-specific signals (eg, attachment of fluorescent contaminants to surfaces) and thus may be discarded or weighted in the assembly algorithm.

一部の実施形態では、本発明は、単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を配列決定する方法を含み:
ポリヌクレオチドを、表面に固定化し、線状化することと、
1つ以上の標識プローブ種を、プローブが一過的に結合し、かつ標的部位へのプローブ結合を非標的部位へのプローブ結合から区別することができる条件下で、添加することと、
各場所における結合事象の閾値数(所要の局在化の精度に応じて)が蓄積されるまで、ポリヌクレオチドを2D検出器で連続的に撮像し、プローブ結合の画素座標を記録することと、
bのプローブを除去することと、
毎回、異なる1つ以上のプローブ種を用いて、ステップb~dを反復することと、
プローブが持続的に結合する結合部位の各々のナノメトリック座標(例えば、結合部位への4つ以上の結合事象)を提供するための単一分子局在化アルゴリズムを使用して、ステップcの各反復からのデータをコンパイルし、ナノメトリック的な局在化部位を、プローブ種の同一性(例えば、特異的オリゴヌクレオチド配列または特異的抗体)と相関させることと、
結合種の順序(配列)を決定して、サブナノメトリックまたはナノメトリック場所の各々に関連する配列同一性(および修飾状態)を決定して、ポリヌクレオチドの長さにわたってヌクレオチド修飾および/または塩基配列をコンパイルし、ポリヌクレオチドの長さにわたって任意のギャップを検出することと、を含む。
In some embodiments, the invention includes methods of sequencing nucleotide modifications and/or bases on a single target polynucleotide:
Immobilizing and linearizing a polynucleotide to a surface;
adding one or more labeled probe species under conditions that allow the probe to transiently bind and probe binding to target sites to be distinguished from probe binding to non-target sites;
continuously imaging the polynucleotide with a 2D detector and recording the pixel coordinates of probe binding until a threshold number of binding events at each location has been accumulated (depending on the precision of localization desired);
removing the probe of b;
repeating steps b through d, each time using a different one or more probe species;
Each of step c. compiling data from replicates and correlating nanometric localization sites with probe species identities (e.g., specific oligonucleotide sequences or specific antibodies);
Determining the order (sequence) of the binding species, determining the sequence identity (and modification state) associated with each sub-nanometric or nanometric location, and determining nucleotide modifications and/or base sequences over the length of the polynucleotide. compiling and detecting any gaps across the length of the polynucleotide.

一部の実施形態では、ステップgの前に、追加のステップを実施し、そのステップでは、結合事象が完全一致、不一致、または擬似結合であるかどうかを判定する際に、特定のプローブ種の、その各々の結合場所に対する持続時間および/または存続時間、ならびに、標的が変性二本鎖である場合、どのプローブが隣接場所および相補鎖に結合したかが考慮される。 In some embodiments, prior to step g, an additional step is performed, in which, in determining whether the binding event is a perfect match, mismatch, or pseudo-binding, , the duration and/or lifetime for its respective binding site, and, if the target is a denatured duplex, which probes have bound to adjacent sites and complementary strands.

一部の実施形態では、ステップhを追加して、ある種類の結合標的(例えば、抗原)と別の種類の結合標的(例えば、配列)との相関を決定することができる。 In some embodiments, step h can be added to determine the correlation between one type of binding target (eg, antigen) and another type of binding target (eg, sequence).

一部の実施形態では、ステップbのプローブは、試薬交換によって除去される。任意選択的に、まず、プローブを1つ以上の洗浄液で置換し、次いで、次のプローブのセットを添加する。 In some embodiments, the probe of step b is removed by reagent exchange. Optionally, the probes are first replaced with one or more wash solutions and then the next set of probes is added.

一部の実施形態では、ステップcにおいて、結合事象の閾値数が蓄積されている可能性が高くなるのに十分に長い期間、(オン・オフ結合事象の)撮像が実行される。 In some embodiments, in step c, imaging (of on-off binding events) is performed for a period long enough to likely accumulate a threshold number of binding events.

一部の実施形態では、本方法は、各場所における結合事象の閾値数が蓄積されている可能性が高くなるまで、ポリヌクレオチドを2D検出器上で連続的に撮像し、プローブ結合の画素座標を記録することを含む。 In some embodiments, the method continuously images the polynucleotide on a 2D detector until it is likely that a threshold number of binding events at each location has accumulated, and probe binding pixel coordinates including recording

一部の実施形態では、撮像持続時間の期間は、必要とされる位置決定の正確度(例えば、ナノメトリックまたはサブナノメトリック正確度)に依存する。撮像は、サブ10nMまたはサブナノメトリック位置決定を得るために長時間実行する必要があり得る。一部の実施形態では、撮像持続時間は、どの短いストレッチの配列(配列ビット)が、どのプローブに結合しているかに関して必要とされる信頼度の程度に依存する。長時間実行すると、正しい一致における信頼度が高まり、擬似結合または不一致結合が計算的にフィルタリング除去されるようになる。 In some embodiments, the duration of the imaging duration depends on the required positioning accuracy (eg, nanometric or sub-nanometric accuracy). Imaging may need to be performed for a long time to obtain sub-10 nM or sub-nanometric localization. In some embodiments, the imaging duration depends on the degree of confidence required as to which short stretch of sequence (array bit) is bound to which probe. Longer runs increase confidence in correct matches and computationally filter out pseudo-joins or non-matching joins.

一部の実施形態では、本発明の標的ポリヌクレオチドが固定化される。一部の実施形態では、固定化は、構造支持体(例えば、平面、細胞マトリックス)上にある。一部の実施形態では、標的ポリヌクレオチドは、ウェルまたはフローセルなどの流体容器内に配置される。 In some embodiments, target polynucleotides of the invention are immobilized. In some embodiments, immobilization is on a structural support (eg, flat surface, cell matrix). In some embodiments, target polynucleotides are placed in fluidic containers such as wells or flow cells.

一部の実施形態では、二本鎖ゲノムDNAの固定化および線状化、ならびに表面上の一過的な結合の調製は、以下を含む:
a)分子コーミング、
b)UV架橋、
c)任意選択的な湿潤、
d)化学変性物質、アルカリ性溶液、DMSOなどへの曝露を含む変性、
e)任意選択的な洗浄後の酸性溶液への曝露、
f)任意選択的な事前調整緩衝液。
In some embodiments, immobilization and linearization of double-stranded genomic DNA and preparation of transient binding on surfaces include:
a) molecular combing,
b) UV crosslinking,
c) optional wetting;
d) denaturation, including exposure to chemical denaturants, alkaline solutions, DMSO, etc.;
e) exposure to an acidic solution after optional washing;
f) optional preconditioning buffer.

一部の実施形態では、ポリマーは、短いポリヌクレオチド、1Kbp未満または300bp未満である。一部の実施形態では、短いポリヌクレオチドは、尿および血液などの体液中のセルフリーDNAに見られるように、100~200塩基範囲にある。一部の実施形態では、ポリヌクレオチドは、好ましくは、2つの末端のうちの1つによって、表面に結合または捕捉される。一部の実施形態では、ポリヌクレオチドは、ナノ構造格子で順番に捕捉される。格子は、DNA折り紙で形成され得るような超分子構造からなる。捕捉部位は、規則正しい2D格子内の10nmのピッチで配置され得る。このような格子は、完全な占有率で、1cm2当たり1兆分子を捕捉することができる。 In some embodiments, the polymer is a short polynucleotide, less than 1 Kbp or less than 300 bp. In some embodiments, short polynucleotides are in the 100-200 base range, as found in cell-free DNA in body fluids such as urine and blood. In some embodiments, polynucleotides are bound or captured to a surface, preferably by one of the two termini. In some embodiments, polynucleotides are sequentially captured in a nanostructured lattice. The lattice consists of supramolecular structures such as can be formed with DNA origami. The trapping sites can be arranged with a pitch of 10 nm in a regular 2D grid. Such a lattice can trap 1 trillion molecules per cm2 at full occupancy.

一部の実施形態では、ポリマーは、直鎖状である。一部の実施形態では、線状化は、表面の波状または蛇行経路に沿ってポリマーを提供する。他の実施形態では、ポリマーは、伸長され、直線状である。一部の実施形態では、直線状のポリマーは、単一の方向で整列される。一部の実施形態では、ポリマーは、伸長しておらず、2Dまたは3D空間を通る捻じれた経路を形成し得る。後者は、細胞内のバイオポリマーに本方法を適用する場合である。 In some embodiments, the polymer is linear. In some embodiments, linearization provides the polymer along a wavy or tortuous path on the surface. In other embodiments, the polymer is elongated and linear. In some embodiments, linear polymers are aligned in a single direction. In some embodiments, the polymer is unstretched and may form a tortuous path through 2D or 3D space. The latter is the case when applying the method to intracellular biopolymers.

一部の実施形態では、ポリヌクレオチドは、表面またはマトリックス上にランダムに整列される。一部の実施形態では、ポリヌクレオチドは、規則正しい様式で整列される。一部の実施形態では、ポリヌクレオチドはDNAカーテン[Greeneおよび共同研究者、US2008/0274905A1]のように呈示される。かかる実施形態では、一過的な結合は、一端に付着したDNA鎖がフローまたは電気泳動力によって伸長される間、または鎖の両端が捕捉された後、記録される。一部の実施形態では、一端または両端での捕捉は、カーテンがそこから延びる表面上または界面での空間的にアドレス指定可能なオリゴへの結合またはライゲーションに起因する。一部の実施形態では、DNAカーテンで使用される脂質表面コーティングは、表面結合およびバックグラウンドを最小化する。一部の実施形態では、多くのコピーの同じ配列が、DNAカーテンの複数のポリヌクレオチドを形成するし、配列は、1つのポリヌクレオチドからではなく、複数のポリヌクレオチドからの集約的な結合パターンからアセンブリされる。 In some embodiments, the polynucleotides are randomly arranged on the surface or matrix. In some embodiments, the polynucleotides are arranged in an ordered manner. In some embodiments, the polynucleotide is displayed as a DNA curtain [Greene and coworkers, US2008/0274905A1]. In such embodiments, transient binding is recorded while a DNA strand attached at one end is stretched by flow or electrophoretic forces, or after both ends of the strand are captured. In some embodiments, capture at one or both ends results from binding or ligation to spatially addressable oligos on the surface or interface from which the curtain extends. In some embodiments, the lipid surface coating used in the DNA curtain minimizes surface binding and background. In some embodiments, many copies of the same sequence form multiple polynucleotides of the DNA curtain, and the sequence is not from one polynucleotide, but from an aggregate binding pattern from multiple polynucleotides. Assembled.

DNAカーテン(Greeneおよび共同研究者)に関して実証されているように、長いポリヌクレオチドの場合、規則正しい方法は、各長いポリヌクレオチドの1つの末端を、パッドの規則正しいアレイ内のパッドに個別に付着させることによって行うことができ、異なるポリヌクレオチドの末端が、各パッドを占有する。一部の実施形態では、ポリヌクレオチドの両端はパッドに結合し、各末端は異なるパッドに結合する。単一の線状ポリヌクレオチドが結合する2つのパッドは、ポリヌクレオチドの伸展された構成を所定の位置に保持し、等間隔に配置された、重複していない、または相互作用しないポリヌクレオチドの規則正しいアレイを形成することを可能にする役割を果たすことができる。一部の実施形態では、1つのポリヌクレオチドのみが個々のパッドを占有することができる。一部の実施形態では、ポアソン過程によって、パッドが占有されている。いくつかのパッドは、ポリヌクレオチドによって占有されておらず、いくつかは1つ、いくつかは1つを超えて占有されている。 For long polynucleotides, as demonstrated for DNA curtains (Greene and co-workers), the ordered method is to individually attach one end of each long polynucleotide to a pad in an ordered array of pads. with different polynucleotide ends occupying each pad. In some embodiments, both ends of the polynucleotide are attached to pads and each end is attached to a different pad. Two pads to which a single linear polynucleotide binds hold the stretched configuration of the polynucleotide in place, and an ordered array of equally spaced, non-overlapping or non-interacting polynucleotides. It can play a role in making it possible to form an array. In some embodiments, only one polynucleotide can occupy each pad. In some embodiments, the Poisson process occupies the pad. Some pads are not occupied by polynucleotides, some are occupied by one, some by more than one.

本発明の一部の実施形態では、かなりの数が同じ細胞型である(かつ実質的に同じ配列を含むと予想される)複数の細胞から抽出されたDNAの配列決定の場合、配列は、1つのポリヌクレオチドからではなく、複数のポリヌクレオチドからの集約的な結合パターンからアセンブリされる。 In some embodiments of the invention, for sequencing DNA extracted from a plurality of cells, a substantial number of which are of the same cell type (and expected to contain substantially the same sequences), the sequences are: Assembled from aggregate binding patterns from multiple polynucleotides rather than from a single polynucleotide.

一部の実施形態では、ポリヌクレオチドは、それらの天然の環境(例えば、細胞、組織、生体液)から取り出され、表面に固定化される。一部の実施形態では、ポリヌクレオチドは、それらの細胞または組織の環境に留まる。一部の実施形態では、細胞または組織は、固定される。一部の実施形態では、ポリヌクレオチドは、細胞内で架橋される。 In some embodiments, polynucleotides are removed from their natural environment (eg, cells, tissues, biological fluids) and immobilized on a surface. In some embodiments, the polynucleotides remain in their cellular or tissue environment. In some embodiments, cells or tissues are fixed. In some embodiments, the polynucleotides are cross-linked intracellularly.

一部の実施形態では、ポリヌクレオチドは、一本鎖(例えば、mRNA、lncRNA、マイクロRNA)である。一部の実施形態では、ポリヌクレオチドは、二本鎖である。一部の実施形態では、ポリヌクレオチドは、変性される。一部の実施形態では、変性は、0.5Mまたは1MのNaOH、DMSO(例えば、60%)、ホルムアミド(10~90%)、尿素(7~8M)などからの1つ以上の試薬を含む化学変性である。一部の実施形態では、変性は、85℃以上の熱変性である。一部の実施形態では、変性は、ヘリカーゼまたはヘリカーゼ活性を有する他の酵素の使用を介するものなどの、酵素変性を介する変性である。一部の実施形態では、ポリヌクレオチドは、表面との相互作用を通して、または臨界長を超えた伸展などの物理的プロセスによって、変性される。一部の実施形態では、変性は完全または部分的である。 In some embodiments, the polynucleotide is single-stranded (eg, mRNA, lncRNA, microRNA). In some embodiments, the polynucleotide is double-stranded. In some embodiments, the polynucleotide is denatured. In some embodiments, denaturation includes one or more reagents from 0.5 M or 1 M NaOH, DMSO (eg, 60%), formamide (10-90%), urea (7-8 M), and the like. Chemical denaturation. In some embodiments, denaturation is heat denaturation at 85° C. or higher. In some embodiments, the denaturation is through enzymatic denaturation, such as through the use of helicase or other enzymes with helicase activity. In some embodiments, polynucleotides are denatured through interaction with surfaces or by physical processes such as stretching beyond a critical length. In some embodiments, denaturation is complete or partial.

一部の実施形態では、ポリヌクレオチドのアレイは、表面に固定化され、一部の実施形態では、アレイのポリヌクレオチドは、個別に解像されるのに十分に離れている。一部の実施形態では、アレイのポリヌクレオチドは、個別に解像されるには十分に離れていない。一部の実施形態では、アレイのポリヌクレオチドは、超解像法によって個別に解像される。一部の実施形態では、ポリヌクレオチドは、表面に対して平行に伸長される。一部の実施形態では、ポリヌクレオチドは、表面に対して斜めの角度で伸長される。一部の実施形態では、2D検出器を介した検出は、単一分子局在化アルゴリズムソフトウェアを介して処理される(例えば、Fiji/ImageJのプラグインであるThunderstorm、またはhttps://github.com/jungmannlab/picassoでダウンロード可能なPicasso)。一部の実施形態では、ポリヌクレオチドは、表面に対して垂直に伸長される。標識の座標の検出は、スピニングディスク共焦点顕微鏡、光シート顕微鏡、3D超解像顕微鏡、もしくは3D単一分子局在化顕微鏡、または他の3D撮像アプローチを介して行われる。 In some embodiments, an array of polynucleotides is immobilized on a surface, and in some embodiments, the polynucleotides of the array are sufficiently separated to be individually resolved. In some embodiments, the polynucleotides of the array are not far enough apart to be individually resolved. In some embodiments, the polynucleotides of the array are individually resolved by super-resolution. In some embodiments, the polynucleotide is elongated parallel to the surface. In some embodiments, the polynucleotide is elongated at an oblique angle to the surface. In some embodiments, detection via a 2D detector is processed via single-molecule localization algorithm software (eg, Thunderstorm, a plugin for Fiji/ImageJ, or https://github. Picasso available for download at com/jungmannlab/picasso). In some embodiments, the polynucleotide is elongated perpendicular to the surface. Detection of the coordinates of the labels is done via spinning disk confocal microscopy, light sheet microscopy, 3D super-resolution microscopy, or 3D single molecule localization microscopy, or other 3D imaging approaches.

本発明の方法では、(特定の種の多数のコピーからの)プローブは、特定の様式(例えば、ワトソン-クリック塩基対合、抗体-抗原結合)でポリヌクレオチドの標的部位に一過的に結合し、デカルト座標および一過的な結合の持続時間が記録される。一部の実施形態では、同種のプローブは、標的部位に一過的に繰り返し結合する。一部の実施形態では、あるプローブ種が除去され、別のプローブ種が添加される。一部の実施形態では、これは、プローブのレパートリー(例えば、完全なレパートリー)、タイリングシリーズ、またはパネルが試験されるまで繰り返される。一部の実施形態では、各プローブ種の結合の場所が記録される。一部の実施形態では、記録は、必要とされる精度に応じて、または用途の目的に従って使用可能である精度に応じて、数十ナノメートル以内、数ナノメートル以内、さらには数サブナノメートル(オングストローム)以内への結合のナノメトリック位置決定精度(すなわち、x-y、および、一部の実施形態では、z座標)を与えるように処理される。一部の実施形態では、1つのオリゴプローブ種またはオリゴプローブ配列のレパートリーもしくはパネルが提供され、核酸修飾または損傷の部位に結合することができる結合剤(例えば、タンパク質)の1つまたはレパートリーも提供され得る。 In the methods of the invention, probes (from multiple copies of a particular species) transiently bind to polynucleotide target sites in a specific manner (eg, Watson-Crick base pairing, antibody-antigen binding). and the Cartesian coordinates and the duration of the transient binding are recorded. In some embodiments, homogeneous probes transiently and repeatedly bind to target sites. In some embodiments, one probe species is removed and another probe species is added. In some embodiments, this is repeated until a repertoire of probes (eg, a complete repertoire), tiling series, or panel has been tested. In some embodiments, the location of binding for each probe species is recorded. In some embodiments, the recording is within a few tens of nanometers, within a few nanometers, or even sub-nanometers ( Angstroms) are processed to give nanometric localization accuracy (ie, xy and, in some embodiments, z coordinates) of the bond. In some embodiments, one oligoprobe species or repertoire or panel of oligoprobe sequences is provided, and one or a repertoire of binding agents (e.g., proteins) capable of binding to sites of nucleic acid modification or damage is also provided. can be

一部の実施形態では、プローブ上の標識の1つ以上の物理的特性も記録される。異なるプローブ種は、異なる物理的特性を含む標識で標識されており、かかる物理的特性は、輝度(吸収、量子収率)、波長、寿命、偏光を含む。一部の実施形態では、物理的特性は、単一分子または単一粒子レベルで測定され得る任意の他の物理的特性である。一部の実施形態では、複数の標識実体は、標識を含む。 In some embodiments, one or more physical properties of the label on the probe are also recorded. Different probe species are labeled with labels that contain different physical properties, including brightness (absorption, quantum yield), wavelength, lifetime, and polarization. In some embodiments, the physical property is any other physical property that can be measured at the single molecule or single particle level. In some embodiments, the plurality of labeling entities comprises labels.

一部の実施形態では、一過的な的結合は、数秒(a few second)または数秒(several seconds)間である。一部の実施形態では、一過的な結合は、10マイクロ秒~数十秒にわたり得る。一部の実施形態では、一過的な結合は、持続時間が1ミリ秒~1秒である。一部の実施形態では、一過的な結合は、10マイクロ秒~1ミリ秒である。 In some embodiments, transient binding is for a few seconds or several seconds. In some embodiments, transient binding can range from 10 microseconds to tens of seconds. In some embodiments, the transient binding is 1 millisecond to 1 second in duration. In some embodiments, the transient binding is 10 microseconds to 1 millisecond.

本発明は、方法が絶妙な感受性の可能性を有し、不均一な分子集団における多様性を解消することができるように、単一(個々の)分子(例えば、ポリマー)上で実施される。また、試料分子の処理は、その付随する損失(例えば、ライゲーションが非常に非効率であるため、ライゲーションによって適合されていない分子が効果的に失われる)およびアーティファクトの導入(例えば、PCR中の複製エラー)を伴い、本発明が試料分子の処理を必要としないという事実によっても、感度は肯定的に影響を受ける。 The present invention is performed on single (individual) molecules (e.g., polymers) such that the method has the potential for exquisite sensitivity and can resolve diversity in heterogeneous molecular populations. . Also, the processing of sample molecules suffers from its concomitant loss (e.g., ligation is so inefficient that unmatched molecules are effectively lost by ligation) and the introduction of artifacts (e.g., replication during PCR). Sensitivity is also positively affected by the fact that the present invention does not require processing of sample molecules (with errors).

複数の結合事象は、感度を増加させ、より多くの光子が蓄積され、複数の独立した結合事象は、実際のシグナルが検出される確率を増加させる。複数の結合事象はまた、単一の「呼び出し(call)」で検出される部分または配列の同一性を確立するのではなく、複数の呼び出しからコンセンサスを得ることができるため、特異性を増加させる。また、標的部分または配列への複数の結合事象は、実際の場所への結合を、(閾値持続時間の)結合が同じ場所で複数回起こる可能性が低い非特異的結合事象と区別することを可能にする。また、経時的に複数の結合事象を測定することにより、表面への非特異的結合事象の蓄積が弱まり、その後、再び非特異的結合が検出されることはほとんどなくなることが観察される。これは、非特異的結合からのシグナルを退色させるものの、非特異的結合部位が占有またはブロックされたままであるためである可能性が高い。したがって、動画の初期フレームを切り落とすことができることから、非特異的結合を最小化するために表面を不動態化する多大な努力は必要ではない。 Multiple binding events increase sensitivity, more photons are accumulated, and multiple independent binding events increase the probability that the actual signal is detected. Multiple binding events also increase specificity, as consensus can be drawn from multiple calls rather than establishing the identity of a portion or sequence detected in a single "call". . Also, multiple binding events to a target moiety or sequence may be useful to distinguish binding to a real location from non-specific binding events where binding (of threshold duration) is unlikely to occur multiple times at the same location. to enable. Also, by measuring multiple binding events over time, it is observed that the accumulation of non-specific binding events on the surface diminishes, after which non-specific binding is rarely detected again. This is likely because the non-specific binding sites remain occupied or blocked, although the signal from non-specific binding is bleached. Therefore, since the early frames of the movie can be clipped, no great effort is required to passivate the surface to minimize non-specific binding.

一部の実施形態では、各一過的な結合事象における標識からのシグナルは、2D検出器の1つを超える画素をカバーする光路(典型的には、倍率を提供する)を通して投影される。シグナルの点広がり関数(PSF)をプロットし、PSFの重心を、シグナルの正確な場所とする。この位置決定は、サブナノメートルの精度で行うことができる。位置決定の正確度は収集された光子の数に反比例するため、1秒当たりに放出される光子が多いほど、または長時間光子が収集されるほど、正確度が高くなる。高正確度および高精度を達成するために、2D検出器に対する試料のドリフトを最小化するか、またはドリフト補正のための有効な手段を実施する必要がある。一部の実施形態では、ドリフト補正アプローチは、正しいドリフトを参照するために使用することができる表面上の基準マーカーを含む。精度が数ナノメートルまたはサブナノメートルまで上げる必要がある場合、複数の特定の結合場所を有するDNA折り紙は、非常に効果的な基準マーカーである。 In some embodiments, the signal from the label at each transient binding event is projected through an optical path (typically providing magnification) that covers more than one pixel of the 2D detector. Plot the point spread function (PSF) of the signal and take the centroid of the PSF as the exact location of the signal. This position determination can be performed with sub-nanometer accuracy. Since the accuracy of localization is inversely proportional to the number of photons collected, the more photons emitted per second or the longer photons are collected, the higher the accuracy. To achieve high accuracy and precision, it is necessary to minimize sample drift relative to the 2D detector or implement effective means for drift correction. In some embodiments, the drift correction approach includes fiducial markers on the surface that can be used to reference correct drift. DNA origami with multiple specific binding sites is a very effective fiducial marker when accuracy needs to be increased to a few nanometers or sub-nanometers.

本発明の代替的な実施形態では、各一過的な結合事象における標識からのシグナルは、光学倍率経路を通して投影されず、むしろ基板、典型的には、標的分子が存在する光学的に透明な表面が、2D検出器アレイに直接結合される。次いで、検出器アレイの画素が小さい場合(例えば、1ミクロン以下の場合)、表面上のシグナルを1:1で投影すると、結合シグナルを少なくとも1ミクロンの正確度で位置決定することが可能になる。伸展されたDNAの場合、例えば、2kbpの長さは1ミクロンに相当し、2キロ塩基離れたシグナルを解像することができる。6塩基長のプローブで、4096塩基ごと、すなわち2ミクロンごとにシグナルが生じると予想される場合、この解像度は十分である。また、2つの画素間に部分的に収まるシグナルは、中間場所を提供し、そのため、1ミクロンの画素の解像度は500nmである。もちろん、実際の天然ポリヌクレオチド配列では、シグナルは、すべての4096塩基よりも近く、それよりも遠い場所で生じると予想される。しかしながら、DNAストレージなどのいくつかの新奇な用途では、ポリヌクレオチド構築物は、例えば、2Kbごとにシグナルが収まるように設計することができる。このアプローチの利点は、デバイスがより単純で、より安定であることである。また、基板は、2Dアレイ検出器に対して、例えば、100nm単位で平行移動して、より高い解像度を与えることができる。この実施形態の1つの利点は、レンズを必要としないため、デバイスをより小さく(またはより薄く)することができ、レンズ間に空間を作ることができることである。また、分子記憶読み出しの、既存のコンピュータおよびデータベースとより互換性のある電子読み出しへの、直接変換も提供することができる。 In an alternative embodiment of the invention, the signal from the label at each transient binding event is not projected through the optical magnification path, but rather the substrate, typically an optically transparent substrate on which the target molecule resides. A surface is directly bonded to the 2D detector array. Then, if the detector array pixels are small (e.g., 1 micron or less), a 1:1 projection of the signal on the surface will allow the binding signal to be located with an accuracy of at least 1 micron. . For stretched DNA, for example, a length of 2 kbp corresponds to 1 micron and signals 2 kilobases apart can be resolved. This resolution is sufficient if a 6 base long probe is expected to produce a signal every 4096 bases, ie every 2 microns. Also, a signal that fits partially between two pixels provides an intermediate location, so the resolution of a 1 micron pixel is 500 nm. Of course, in an actual natural polynucleotide sequence, the signal would be expected to occur closer to and farther than every 4096 bases. However, in some novel applications such as DNA storage, polynucleotide constructs can be designed to accommodate signals, for example, every 2 Kb. The advantage of this approach is that the device is simpler and more stable. Also, the substrate can be translated relative to the 2D array detector by, for example, 100 nm to give higher resolution. One advantage of this embodiment is that no lenses are required, so the device can be smaller (or thinner) and spaces can be created between the lenses. Direct conversion of molecular storage readouts to electronic readouts that are more compatible with existing computers and databases can also be provided.

一部の実施形態では、一過的な結合を促進する複数の条件が使用される。一部の実施形態では、ある条件が、そのTmに応じたあるプローブ種に対して使用され、別の条件が、そのTmに応じた別のプローブ種に対して使用されるなど、プローブ種の全レパートリーに対して使用され、例えば、5塩基長の可能な1024個のレパートリーからの各5塩基長種に対して使用される。一部の実施形態では、両方の標的ポリヌクレオチド鎖が試料中に存在するため、512個の非相補5塩基長のみが提供される。一部の実施形態では、各プローブ付加は、5つの特異的塩基および2つの縮重塩基を含むプローブ(したがって、16個の七量体)の混合物を含み、配列を照合する能力に関して単一の五量体として機能する同一の標識を用いてすべて標識されており、縮重塩基は、プローブセットの複雑度を増加させることなく、安定性を付加する。 In some embodiments, multiple conditions are used that promote transient binding. In some embodiments, one condition is used for one probe species according to its Tm, another condition is used for another probe species according to its Tm, etc. It is used for the entire repertoire, eg for each 5 base long species from a possible 1024 repertoire of 5 base lengths. In some embodiments, only 512 non-complementary 5-base lengths are provided because both target polynucleotide strands are present in the sample. In some embodiments, each probe addition comprises a mixture of probes containing 5 specific bases and 2 degenerate bases (thus 16 heptamers), resulting in a single probe for the ability to match sequences. All labeled with the same label that functions as a pentamer, degenerate bases add stability without increasing the complexity of the probe set.

一部の実施形態では、同一または類似のTmを共有する複数のプローブに対して、同一の条件が提供される。レパートリーの各プローブは、異なるコード化標識(または、それが識別される標識)を含み得る。このような場合、いくつかのプローブ交換を通して温度を保持した後、同じまたは同様のTmを共有する次の一連のプローブに対して温度を上げる。 In some embodiments, identical conditions are provided for multiple probes sharing the same or similar Tm. Each probe in the repertoire may contain a different coded label (or the label by which it is identified). In such cases, after holding the temperature through several probe exchanges, the temperature is increased for the next series of probes sharing the same or similar Tm.

一部の実施形態では、Tmは、例えば、最近傍パラメータによって計算される。他の実施形態では、Tmは、経験的に導出される。例えば、最適なTMまたはTM範囲は、融解曲線を作成する(例えば、ある温度範囲にわたる吸収による融解の程度を測定する)ことによって導出される。一部の実施形態では、プローブセットの組成物は、経験的な試験によって検証されるそれらの理論的に一致するTmに従って設計される。一部の実施形態では、結合は、Tmより実質的に低い温度、例えば、Tmより33度低い温度で行われる。一部の実施形態では、完全一致から不一致を区別するための最適な温度は、様々な場所で、完全一致および不一致を含む短い合成標的を使用して、経験的に融解曲線を作成することによって判定される。一部の実施形態では、経験的に判定された各オリゴの最適温度は、配列決定における各オリゴの結合に使用される。 In some embodiments, Tm is calculated by, for example, nearest neighbor parameters. In other embodiments, Tm is empirically derived. For example, the optimal TM or TM range is derived by constructing a melting curve (eg, measuring the degree of melting due to absorption over a range of temperatures). In some embodiments, probe set compositions are designed according to their theoretically matched Tm's verified by empirical testing. In some embodiments, the binding is performed at a temperature substantially below Tm, eg, 33 degrees below Tm. In some embodiments, the optimal temperature for distinguishing mismatches from perfect matches is determined empirically by generating melting curves using short synthetic targets containing perfect matches and mismatches at various locations. be judged. In some embodiments, the empirically determined optimum temperature for each oligo is used for binding each oligo in sequencing.

一部の実施形態では、使用されるオリゴの濃度は、オリゴ配列のAT対GC含量に従って調節される。より高い濃度のオリゴが、より高いGC含量を有するオリゴに対して提供される。一部の実施形態では、塩基組成物の影響を均等化する、CTAB、ベタイン、または2.5~4M濃度のテトラメチル塩化アンモニウム(TMACl)などのカオトロピック試薬を含む緩衝液が使用される。 In some embodiments, the concentration of oligos used is adjusted according to the AT to GC content of the oligo sequences. Higher concentrations of oligos are provided for oligos with higher GC content. In some embodiments, buffers containing chaotropic reagents such as CTAB, betaine, or tetramethylammonium chloride (TMACl) at concentrations of 2.5-4 M are used that equalize the effects of base composition.

使用されるオリゴ長が長いほど、オリゴに影響を及ぼす回文配列または折り返し配列に対して、効率的なプローブとして機能する可能性が高い。効率は、1つ以上の縮重塩基を除去することにより、そのようなオリゴの長さを短縮することによって、実質的に改善することができる。この場合、オリゴの結合安定性は、特異的安定化塩基修飾またはオリゴコンジュゲートを使用することによって増強することができる。このような理由で、より短い照合配列(例えば、4塩基長)の使用は、利点を有する。一部の実施形態では、完全に修飾された3塩基長または4塩基長(例えばLNA)を使用することができる。 The longer the oligo length used, the more likely it is to act as an efficient probe for palindromic or folded sequences affecting the oligo. Efficiency can be substantially improved by shortening the length of such oligos by removing one or more degenerate bases. In this case, the binding stability of the oligos can be enhanced by using specific stabilizing base modifications or oligo-conjugates. For this reason, the use of shorter reference sequences (eg, 4 bases long) has advantages. In some embodiments, fully modified 3-base or 4-base lengths (eg, LNA) can be used.

一部の実施形態では、全レパートリーが一緒に追加される。一部のかかる実施形態では、塩基組成物の影響を均等化する緩衝液(例えば、TMAClまたはグアニジニウムチオシアネート)が使用される。一部の実施形態では、同じまたは類似のTmを有するプローブ種が、一緒に添加される。一部の実施形態では、一緒に添加されるプローブ種は、差次的に標識される。一部の実施形態では、一緒に添加されるプローブ種は、差次的に標識されない。一部の実施形態では、差次的な標識は、例えば、異なる輝度、寿命、または波長、およびそのような物理的特性の組み合わせを有する発光を伴う標識である。 In some embodiments, the entire repertoire is added together. In some such embodiments, buffers that equalize the effects of base composition (eg, TMACl or guanidinium thiocyanate) are used. In some embodiments, probe species with the same or similar Tms are added together. In some embodiments, probe species that are added together are differentially labeled. In some embodiments, the co-added probe species are not differentially labeled. In some embodiments, differential labels are labels with emissions having, for example, different luminosities, lifetimes, or wavelengths, and combinations of such physical properties.

一部の実施形態では、差次的な標識は、コード化され、例えば、それらは、DNA折り紙またはDNAナノ構造ベースのコードである。一部の実施形態では、コードアームは、プローブを識別する標識の組み合わせを含むプローブに添加される。例えば、すべての可能な5塩基長のオリゴヌクレオチドプローブのライブラリをコードする場合、アームは、5つの部位を有し、各部位が、5塩基長の5つの核酸塩基の各々に対応し、5つの部位の各々が、5つの区別可能な種に結合され得る。例えば、特定のピーク発光波長を有するフルオロフォアは、位置の各々(例えば、位置1が500nm、位置2が550、位置3が600nm、位置4が650nm、および位置5が700nm)に対応し得、同じ波長であるが、異なる蛍光寿命を有する4つのフルオロフォアは、各位置の4つの塩基の各々をコードし得る。 In some embodiments, the differential labels are encoded, eg, they are DNA origami or DNA nanostructure-based codes. In some embodiments, coding arms are added to probes that contain a combination of labels that identify the probe. For example, to encode a library of all possible 5 base long oligonucleotide probes, the arm has 5 sites, each site corresponding to each of the 5 nucleobases of 5 base lengths, and the 5 Each of the moieties can bind to five distinct species. For example, a fluorophore with a particular peak emission wavelength can correspond to each of the positions (e.g., 500 nm for position 1, 550 nm for position 2, 600 nm for position 3, 650 nm for position 4, and 700 nm for position 5), Four fluorophores of the same wavelength but with different fluorescence lifetimes can encode each of the four bases at each position.

一部の実施形態では、プローブは、標識が、オリゴヌクレオチドの特定の位置で1つだけのヌクレオチドを報告する様式で、コードされる。レパートリーのサブセット(サブレパートリー)を、同時に添加することができる。各サイクルで、オリゴの塩基位置のうちの1つが定義され、他の位置が縮重している、4色コードスキームを使用することができる。 In some embodiments, probes are encoded in a manner in which the label reports only one nucleotide at a particular position of the oligonucleotide. Subsets of the repertoire (sub-repertoires) can be added simultaneously. A four-color coding scheme can be used in which at each cycle one of the base positions of the oligo is defined and the others are degenerate.

A、C、T、およびGが定義されるすべてのオリゴは、各々、その定義された塩基に特異的な特定のフルオロフォアで標識される。第1の塩基が定義され、残りが縮重しているオリゴのサブレパートリーが結合、検出、および除去された後、類似の組成であるが、第2の位置が標識によってコード化されている(他の位置は縮重している)プローブのサブレパートリーが添加され、次いで、各々、第3、第4、および第5と、次々に行われる。 All oligos where A, C, T, and G are defined are each labeled with a specific fluorophore specific for that defined base. After binding, detecting and removing a sub-repertoire of oligos in which the first base is defined and the rest are degenerate, of similar composition but encoded by a label in the second position ( A sub-repertoire of probes is added, followed by the third, fourth, and fifth respectively.

第1のサイクル、セット1:4色は、位置1の4つの塩基を表す。 The first cycle, set 1: 4 colors represent the 4 bases at position 1.

第2のサイクル、セット2:4色は、位置2の4つの塩基を表す。 The second cycle, set 2: 4 colors represents the 4 bases at position 2.

第3のサイクル、セット3:4色は、位置3の4つの塩基を表す。 The third cycle, set 3: 4 colors represents the 4 bases at position 3.

第4のサイクル、セット4:4色は、位置4の4つの塩基を表す。 The fourth cycle, set 4: 4 colors represents the 4 bases at position 4.

第5のサイクル、セット5:4色は、位置5の4つの塩基を表す。 The 5th cycle, set 5: 4 colors represents the 4 bases at position 5.

全レパートリーは、5サイクルで消耗され得る。 The entire repertoire can be exhausted in 5 cycles.

一部の実施形態では、4未満、例えば、1色のみが、プロセス全体を通して使用される。この場合、各サイクルは、4つのサブサイクルに分割され、その各々で、位置(例えば、位置1)の4つの塩基のうちの1つが、次の塩基が添加される前に個別に添加され、毎回、プローブは、同じ標識を有する。本実施態様では、全レパートリーは、20サイクルで消耗され得る。 In some embodiments, less than 4, eg, only 1 color is used throughout the process. In this case, each cycle is divided into four subcycles, in each of which one of the four bases at a position (e.g. position 1) is added separately before the next base is added, Each time the probe has the same label. In this embodiment, the entire repertoire can be exhausted in 20 cycles.

データ処理後、単一分子局在化は、セット1~5からのプローブのうち、ポリヌクレオチド上に同じフットプリントを有する(すなわち、同じナノメトリック場所に結合する)ものを(検出された色により)識別することができる。例えば、ナノメトリック場所は、1nmの中心(+/-0.5nm)の精度で定義される。そのため、PSFの重心が同じ1nm内にあるすべてのプローブは、一緒にビニングされる。各単一塩基で定義されたオリゴ種は、ナノメートル(またはサブナノメートル)の重心までの正確な位置決定を可能にするために、(発光および収集される光子の数に応じて)複数回結合することができる。したがって、ナノサブナノメトリックまたはサブナノメトリックの位置決定は、例えば、5’AGTCG3’のオリゴ配列の場合、第1の塩基がA、第2の塩基がG、第3の塩基がT、第4の塩基がC、および第5の塩基がTであると判定してもよく、これは、5’CGACT3’の標的配列を示唆するであろう。したがって、すべての単一塩基が定義された1024個のオリゴプローブは、わずか5サイクルで(オリゴの添加および洗浄を含む)通過または試験され得、これは、5塩基長の全配列空間をカバーする。一部の実施形態では、セットの各オリゴの濃度は、それが単独で使用されるときよりも低い濃度で使用され、この場合、データの取得は、結合事象の閾値数に到達するためにより長い時間行われ、また、特定のオリゴよりも、より高い濃度の縮重オリゴを使用することができる。このコードスキームは、プローブを直接標識することによって、例えば、オリゴの3’または5’で標識を合成またはコンジュゲートすることによって、行うことができる。しかしながら、それはまた、間接的な標識化によっても行うことができる。例えば、プローブ配列を、標識されたオリゴが結合している「フラップ」配列(結合相互作用には意図されていない配列)に結合することで、プローブの配列照合部分でコードされている塩基の同一性を特定することができる。このスキームでは、4つの塩基のみを区別する必要があるため、4つの異なる種類の標識のみが必要である。1塩基のみがコード化されている場合、オリゴライブラリの合成は、各々1つの定義された塩基および他の4つの縮重した塩基を含む、20個の異なるオリゴのみを合成する必要があるため、安価である。合成中の反応性について濃度を調整することができるように、縮重位置の自動合成中は、手動での混合を使用することが好ましい。 After data processing, single-molecule localization was performed for probes from sets 1-5 that have the same footprint on the polynucleotide (i.e., bind to the same nanometric location) (by detected color ) can be identified. For example, nanometric locations are defined with an accuracy of 1 nm centers (+/-0.5 nm). Therefore, all probes whose PSF centroids are within the same 1 nm are binned together. Each single-base-defined oligo-species is bound multiple times (depending on the number of photons emitted and collected) to enable precise localization down to nanometric (or sub-nanometric) centroids. can do. Thus, nano-sub-nanometric or sub-nanometric positioning is, for example, for an oligo sequence of 5′AGTCG3′, the first base is A, the second base is G, the third base is T, the fourth base is is a C, and the fifth base is a T, which would suggest a target sequence of 5'CGACT3'. Thus, 1024 oligo probes with every single base defined can be run through or tested in as little as 5 cycles (including oligo addition and washing), which covers the entire sequence space of 5 bases long. . In some embodiments, the concentration of each oligo in the set is used at a lower concentration than when it is used alone, in which case data acquisition takes longer to reach the threshold number of binding events. It is also possible to use higher concentrations of degenerate oligos than specific oligos. This coding scheme can be done by directly labeling the probe, for example by synthesizing or conjugating a label at the 3' or 5' of the oligo. However, it can also be done by indirect labeling. For example, by binding the probe sequence to the "flap" sequence (sequence not intended for binding interaction) to which the labeled oligo is bound, the identity of the bases encoded in the sequencing portion of the probe Gender can be specified. In this scheme, only four different types of labels are needed, since only four bases need to be distinguished. Since if only 1 base is encoded, the synthesis of the oligo library only needs to synthesize 20 different oligos, each containing 1 defined base and 4 other degenerate bases, Inexpensive. It is preferred to use manual mixing during automated synthesis of degenerate positions so that concentrations can be adjusted for reactivity during synthesis.

各オリゴの場所は、その場所ついての複数の事象のPSFを決定することによって正確に定義され、次いで、オフセット事象からの部分的な配列重複によって裏付けられる。この実施形態は、ナノメートルまたはサブナノメートル精度へのプローブ結合の単一分子局在化に高度に依存している。 Each oligo location is precisely defined by determining the PSF of multiple events for that location and then supported by partial sequence overlap from offset events. This embodiment is highly dependent on single-molecule localization of probe binding to nanometric or sub-nanometric precision.

一部の実施形態では、すべての4つの塩基からの寄与が均等化される。これは、G-C対の安定性を抑制するか、またはATの安定性を増加させる試薬を使用することによって行うことができる。このような試薬としては、ベタイン、TMA、および様々な他の試薬が挙げられる。代替的に、ヌクレオチド類似体、修飾、およびN位置を使用して、プローブのTmを均等化することができる。したがって、Gと等しいTmを得るには、安定性が増加したT類似体が使用される。 In some embodiments, contributions from all four bases are equalized. This can be done by using reagents that either suppress the stability of the GC pair or increase the stability of AT. Such reagents include betaine, TMA, and various other reagents. Alternatively, nucleotide analogues, modifications, and N-positions can be used to equalize the Tm of the probe. Therefore, to obtain a Tm equal to G, a T analogue with increased stability is used.

一部の実施形態では、4つの部分的に縮重したオリゴプールの濃度は、各々、そのTmに従って単一コード化塩基の安定性の差異を補償するように調整される。これはTmによる濃度の調整が縮重位置に適用されないため、部分的な補償でしかありえない。 In some embodiments, the concentrations of the four partially degenerate oligo pools are each adjusted to compensate for differences in stability of single encoded bases according to their Tm. This can only be a partial compensation, since the adjustment of density by Tm does not apply to degenerate positions.

一部の実施形態では、レパートリーのプローブのプローブは、コード化される。一部の実施形態では、例えば、1024個の5塩基長のセット全体が、コード化される。一部の実施形態では、コード化は、配列の照合に使用される5塩基長の一端に、特定の配列単位(例えば、フラップ配列)を結合することを含む。コード配列の各単位は、フラップ上にハイブリダイズされた蛍光標識オリゴを有する、別個の蛍光標識プローブのドッキング部位として機能する。5塩基のプローブ配列をコードするために、プローブ上のフラップは5つの異なる結合場所を含み、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の位置は、プローブ配列(ポリヌクレオチド標的に結合する部分)に隣接し、第2の位置は、第1の位置に隣接する、などである。配列決定でプローブ・フラップを使用するのに先立って、各種のプローブ・フラップを、蛍光標識されたオリゴのセットに結合して、プローブ配列のための固有のIDタグを生成する。これは、フラップ上の各位置に相補的である4つの異なる標識オリゴ配列を使用することによって行うことができ、合計で16個の異なる標識が必要である。 In some embodiments, the probes of the probes of the repertoire are encoded. In some embodiments, for example, the entire set of 1024 5 bases is encoded. In some embodiments, encoding comprises attaching a particular sequence unit (eg, a flap sequence) to one end of the 5-base length used for sequence matching. Each unit of coding sequence serves as a docking site for a separate fluorescently labeled probe, with fluorescently labeled oligos hybridized on the flap. To encode a 5 base probe sequence, the flap on the probe contains 5 different binding sites, eg, each site is a different DNA base sequence tandemly linked to the next site. For example, the first position on the flap is adjacent to the probe sequence (the portion that binds to the polynucleotide target), the second position is adjacent to the first position, and so on. Prior to using the probe flaps in sequencing, each probe flap is attached to a set of fluorescently labeled oligos to generate a unique ID tag for the probe sequence. This can be done by using 4 different label oligo sequences complementary to each position on the flap, requiring a total of 16 different labels.

一部の実施形態では、配列の第1の塩基は、フラップの第1の単位によってコード化され、第2の塩基は、第2の単位によってコードされるなど、塩基配列の順序に対応する単位の順序でコード化される。次いで、別個の蛍光標識を、各単位にドッキングする(相補塩基対合を通して)。例えば、第1の位置は、波長500~530nmで、第2の位置は、波長550~580nmで、第3の位置は、600~630nmで、第4の位置は、650~680nmで、第5の位置は、700~730nmで発光してもよい。次いで、各場所における塩基の同一性は、例えば、標識の蛍光寿命によってコード化され得る。例えば、Aに対応する標識は、Cよりも長い寿命を有し、Cは、Gよりも長い寿命を有し、Gは、Tよりも長い寿命を有する。 In some embodiments, units corresponding to the order of the base sequence, such as the first base of the sequence is encoded by the first unit of the flap and the second base is encoded by the second unit. are coded in the order A separate fluorescent label is then docked (through complementary base pairing) to each unit. For example, the first position is for wavelengths 500-530 nm, the second position is for wavelengths 550-580 nm, the third position is 600-630 nm, the fourth position is 650-680 nm, the fifth position is for wavelengths 550-580 nm. The position may emit at 700-730 nm. The identity of the base at each location can then be encoded, for example, by the fluorescence lifetime of the label. For example, the label corresponding to A has a longer lifetime than C, which has a longer lifetime than G, and G has a longer lifetime than T.

位置1のAは、500~530nmで発光し、最も長い寿命を有し、位置3のGは、600-630nmで発光し、3番目に長い寿命を有する、などである。 A at position 1 emits at 500-530 nm and has the longest lifetime, G at position 3 emits at 600-630 nm and has the third longest lifetime, and so on.

一部のかかる実施形態では、ポリヌクレオチドを配列決定する方法は、
a)オリゴのコード化セットを提供することであって、かかるコード化が、モジュール式の多単位配列を含み、各単位について異なる標識プローブが予め結合されている、提供することと、
b)レパートリーを、ポリヌクレオチドに一過的かつ反復的に結合させ、各種類の異なるシグナルを位置決定することと、
c)記録された結合場所を使用して、ポリヌクレオチドの配列を再構築し、各プローブの同一性をデコードすることと、を含む。
In some such embodiments, the method of sequencing a polynucleotide comprises
a) providing a coded set of oligos, said coding comprising modular multi-unit sequences, with pre-bound different labeled probes for each unit;
b) transiently and repeatedly binding the repertoire to polynucleotides to localize each type of different signal;
c) using the recorded binding sites to reconstruct the sequence of the polynucleotide and decoding the identity of each probe.

一部の実施形態では、4つの異なるオリゴヌクレオチドのサブレパートリーのみが使用され、例えば、5塩基長の中央の塩基のみが定義され、残りが縮重している。オリゴヌクレオチドの中央位置での不一致は、最も不安定すると予想され、中央の塩基が結合し、不一致を形成しないための絶対的な必要性が存在するように、条件がセットアップされ得る。一時的な結合は、多かれ少なかれすべての部位がオリゴヌクレオチド結合によってカバーされることを確実にし、その後、位置決定が、高レベル(例えば、サブナノメートル)まで行われる場合、ポリヌクレオチドの配列は、中央にコードされたオリゴによって提供される塩基ごとの情報を一緒に繋ぎ合わせるだけでアセンブリすることができる。中央の塩基のA、C、G、Tの各々は、4つの異なる区別可能なフルオロフォア、例えば、Atto488、Cy3B、Atto655、Alexa700によってコードされ得る。 In some embodiments, only four different oligonucleotide sub-repertoires are used, eg, only the central bases of 5 bases in length are defined and the rest are degenerate. A mismatch at the central position of the oligonucleotide is expected to be the most labile, and conditions can be set up such that there is an absolute need for the central base to bind and not form a mismatch. Temporary binding ensures that more or less all sites are covered by oligonucleotide binding, after which when positioning is performed to high levels (e.g., sub-nanometer), sequences of polynucleotides are centered. can be assembled by simply splicing together the base-by-base information provided by the oligos encoded in the . Each of the central bases A, C, G, T can be encoded by four different distinguishable fluorophores, eg, Atto488, Cy3B, Atto655, Alexa700.

実際には、既知の配列のポリヌクレオチドの配列決定における各々のプールの濃度、反応条件、および温度を繰り返し調整することによって、最適な濃度(ならびに反応条件および温度)を決定することが好ましく、様々な代表的なポリヌクレオチドについて最も正確な配列が得られる濃度/条件が最適であるとみなすことができる。 In practice, it is preferable to determine the optimal concentration (and reaction conditions and temperature) by iteratively adjusting the concentration, reaction conditions, and temperature of each pool in sequencing polynucleotides of known sequence, and varying Concentrations/conditions that give the most accurate sequence for any representative polynucleotide can be considered optimal.

一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法であり、
a)ポリヌクレオチドを固定化することと、
b)オリゴの1つの位置(塩基A、C、G、T)が指定され(X)、かつ標識によってコード化され、残りが縮重した塩基(N)である、オリゴヌクレオチドのライブラリ/レパートリーを添加することと、
c)各標識オリゴのポリヌクレオチドへの反復した結合を撮像し、特定の塩基の結合場所および同一性をナノメトリック的に位置決定することと、
d)第2の位置について標識されたオリゴヌクレオチドのライブラリ/レパートリーを添加し、特定の塩基の結合場所および同一性をナノメトリック的に位置決定し、第3、第4、および第5の位置などについても同様に行うことと、
e)どの塩基標識が、オリゴヌクレオチドレパートリーの各位置の場所に持続的に一過的に結合するかに従って、各場所で配列をアセンブリすることと、
f)結合場所および隣接場所間の配列の重複を考慮に入れることによって、ポリヌクレオチドの配列をアセンブリすることと、を含む。
In some embodiments, the invention is a method for sequencing a polynucleotide comprising:
a) immobilizing the polynucleotide;
b) a library/repertoire of oligonucleotides where one position (bases A, C, G, T) of the oligos is designated (X) and encoded by a label, the rest being degenerate bases (N) adding;
c) imaging the repeated binding of each labeled oligo to the polynucleotide and nanometrically localizing the binding sites and identities of specific bases;
d) adding a library/repertoire of labeled oligonucleotides for the second position, nanometrically localizing the binding sites and identities of specific bases, the third, fourth and fifth positions, etc. Do the same for
e) assembling the sequence at each location according to which base label is persistently and transiently bound at each location of the oligonucleotide repertoire;
f) assembling the sequence of the polynucleotides by taking into account sequence overlap between the binding sites and adjacent sites.

本発明のこの実施形態は、2.5nm未満、または1nm未満、または0.34nm以下であるナノメトリック位置決定の精度から恩恵を受け、プローブオリゴヌクレオチドの特定の塩基の場所を、同じ近傍の別のプローブオリゴヌクレオチド結合の特定の塩基の場所から区別することができるようになる。 This embodiment of the invention benefits from a nanometric localization accuracy of less than 2.5 nm, or less than 1 nm, or less than 0.34 nm, allowing the location of a particular base in a probe oligonucleotide to be compared to another base in the same neighborhood. of the probe-oligonucleotide binding from the specific base location.

一部の実施形態では、レパートリーのプローブのいくつかがコード化される。一部の実施形態では、例えば、1024個の5塩基長のセット全体が、コード化される。一部の実施形態では、コード化は、配列の照合に使用される5塩基長の一端に、特定の配列単位(例えば、フラップ配列)を結合することを含む。コード化配列の各単位は、フラップ上にハイブリダイズした蛍光標識オリゴを有する、別個の蛍光標識プローブ種のドッキング部位として機能する。5塩基のプローブ配列をコードするために、プローブ上のフラップは5つの異なる結合場所を含み、例えば、各場所は、次の場所にタンデムに連結された異なるDNA塩基配列である。例えば、フラップ上の第1の位置は、プローブ配列(ポリヌクレオチド標的に結合する部分)に隣接し、第2の位置は、第1の位置に隣接する、などである。配列決定でプローブ・フラップを使用するのに先立って、各種のプローブ・フラップを、蛍光標識されたオリゴのセットに結合して、プローブ配列のための固有のIDタグを生成する。これは、フラップ上の各位置に相補的である4つの異なる標識オリゴ配列を使用することによって行うことができ、合計で16個の異なる標識が必要である。 In some embodiments, some of the probes of the repertoire are encoded. In some embodiments, for example, the entire set of 1024 5 bases is encoded. In some embodiments, encoding comprises attaching a particular sequence unit (eg, a flap sequence) to one end of the 5-base length used for sequence matching. Each unit of coding sequence serves as a docking site for a separate fluorescently labeled probe species with fluorescently labeled oligos hybridized on the flap. To encode a 5 base probe sequence, the flap on the probe contains 5 different binding sites, eg, each site is a different DNA base sequence tandemly linked to the next site. For example, the first position on the flap is adjacent to the probe sequence (the portion that binds to the polynucleotide target), the second position is adjacent to the first position, and so on. Prior to using the probe flaps in sequencing, each probe flap is attached to a set of fluorescently labeled oligos to generate a unique ID tag for the probe sequence. This can be done by using 4 different label oligo sequences complementary to each position on the flap, requiring a total of 16 different labels.

一部の実施形態では、配列の第1の塩基は、フラップの第1の単位によってコード化され、第2の塩基は、第2の単位によってコードされるなど、塩基配列の順序に対応する単位の順序でコード化される。次いで、別個の蛍光標識を、各単位にドッキングする(相補塩基対合を通して)。例えば、第1の位置は、波長500~530nmで、第2の位置は、波長550~580nmで、第3の位置は、600~630nmで、第4の位置は、650~680nmで、第5の位置は、700~730nmで発光してもよい。次いで、各場所の塩基の同一性は、例えば、標識の蛍光寿命によってコード化され得る。例えば、Aに対応する標識は、Cよりも長い寿命を有し、Cは、Gよりも長い寿命を有し、Gは、Tよりも長い寿命を有する。 In some embodiments, units corresponding to the order of the base sequence, such as the first base of the sequence is encoded by the first unit of the flap and the second base is encoded by the second unit. are coded in the order A separate fluorescent label is then docked (through complementary base pairing) to each unit. For example, the first position is at wavelengths 500-530 nm, the second position is at wavelengths 550-580 nm, the third position is at 600-630 nm, the fourth position is at 650-680 nm, the fifth position is at wavelengths 550-580 nm. The position may emit at 700-730 nm. The identity of the base at each location can then be encoded, for example, by the fluorescence lifetime of the label. For example, the label corresponding to A has a longer lifetime than C, which has a longer lifetime than G, and G has a longer lifetime than T.

位置1のAは、500~530nmで発光し、最も長い寿命を有し、位置3のGは、600-630nmで発光し、3番目に長い寿命を有する、などである。 A at position 1 emits at 500-530 nm and has the longest lifetime, G at position 3 emits at 600-630 nm and has the third longest lifetime, and so on.

一部のかかる実施形態では、ポリヌクレオチドを配列決定する方法は、
a)オリゴのコード化セットを提供することであって、かかるコード化が、モジュール式の多単位配列を含み、各単位について異なる標識プローブが予め結合されている、提供することと、
b)レパートリーを、ポリヌクレオチドに一過的かつ反復的に結合させ、各種類の異なるシグナルを位置決定することと、
c)記録された結合場所を使用して、ポリヌクレオチドの配列を再構築し、各プローブの同一性をデコードすることと、を含む。
In some such embodiments, the method of sequencing a polynucleotide comprises
a) providing a coded set of oligos, said coding comprising modular multi-unit sequences, with pre-bound different labeled probes for each unit;
b) transiently and repeatedly binding the repertoire to polynucleotides to localize each type of different signal;
c) using the recorded binding sites to reconstruct the sequence of the polynucleotide and decoding the identity of each probe.

このアプローチの利点は、すべての個々のオリゴが個別に合成される必要はなく、単に合成サイクル中にヌクレオチドの混合物を添加することによって作製されることである。 The advantage of this approach is that every individual oligo does not have to be synthesized individually, but simply made by adding a mixture of nucleotides during the synthesis cycle.

オリゴの特定のヌクレオチドが提供することができる識別の程度は、オリゴのその位置に依存する。不一致は、5塩基長の中央で最悪に許容され、中央から離れるほど、より良好に許容されることが予想される。したがって、単一の結合事象からのデータから正しい配列同一性を割り当てることは、時として困難であり得るが、部位および隣接部位(重複、オフセット)に対する複数の事象により、配列が裏付けられ得る。 The degree of discrimination that a particular nucleotide in an oligo can provide depends on its position in the oligo. Mismatches are expected to be worst tolerated in the middle of the 5-base length, and better tolerated away from the middle. Therefore, assigning the correct sequence identity from data from a single binding event can sometimes be difficult, but multiple events for the site and flanking sites (overlaps, offsets) can support the sequence.

場合によっては、結合の持続時間は、正確ではなくても、再現性がなくてもよく、または期待されるものに対応していなくてもよい。しかしながら、一部の実施形態では、配列は、その場所に結合する完全なレパートリーからのすべてのプローブの結合持続時間を調べることによって、その場所への最長の平均結合持続時間を有するプローブを選択することで、割り当てることができる。非ワトソン-クリック塩基対を形成するプローブの不一致結合または結合の異常に高い結合の知識がある場合を除いて、データセットに適用され、一部の実施形態では、最長結合持続時間を有するオリゴが、ポリヌクレオチドにおける配列に対応するものとみなされる。 In some cases, the duration of binding may not be exact, reproducible, or correspond to what is expected. However, in some embodiments, the sequence selects the probe with the longest average binding duration to that location by examining the binding duration of all probes from the complete repertoire that bind to that location. can be assigned by doing so. Applied to the data set, except in the case of knowledge of mismatched binding or unusually high binding of non-Watson-Crick base-pairing probes, in some embodiments the oligo with the longest binding duration is , are considered to correspond to sequences in the polynucleotide.

一部の実施形態では、オリゴがそれらの融解温度に従ってセットに分割されるため、5サイクルを超えて実施される。約20個のセットは、5塩基長のTmレパートリーを表すのに十分である(異常値を除く)。一部の実施形態では、AまたはT=2およびGまたはC=4のTm寄与を使用して、Tmを計算する。他の場合、(例えば、Breslauerによる)最近傍パラメータを使用して、Tmを計算する。他の場合、各オリゴのTmは、経験的に判定される。各所与の温度で、相補体の一方が表面に結合され、他方が標識されて溶液中にある場合、融解曲線の取得を介して経験的に判定されるか、またはオリゴ相補体の結合を分析することによって判定される。 In some embodiments, more than 5 cycles are performed as the oligos are divided into sets according to their melting temperature. Approximately 20 sets are sufficient to represent a 5 base long Tm repertoire (excluding outliers). In some embodiments, Tm contributions of A or T=2 and G or C=4 are used to calculate Tm. In other cases, the nearest neighbor parameters (eg by Breslauer) are used to calculate Tm. In other cases, the Tm of each oligo is determined empirically. At each given temperature, when one of the complements is bound to the surface and the other is labeled and in solution is determined empirically via obtaining a melting curve or analyzing the binding of the oligo-complements. determined by

一部の実施形態では、同じ温度がすべてのオリゴ結合に使用され、Tmは、オリゴの濃度を調節することによって調節される。より高い濃度は、安定性の低いオリゴに使用され、より低い濃度は、より安定したオリゴに使用される。各オリゴの濃度は、経験的または理論的に判定される。一部の実施形態では、単一の温度が使用されるが、オリゴヌクレオチドの長さまたは化学組成が変化する。 In some embodiments, the same temperature is used for all oligo attachments and the Tm is adjusted by adjusting the concentration of oligos. Higher concentrations are used for less stable oligos and lower concentrations for more stable oligos. The concentration of each oligo is determined empirically or theoretically. In some embodiments, a single temperature is used, but the length or chemical composition of the oligonucleotide is varied.

一部の実施形態では、最初に、短いオリゴプローブが、一致と不一致間を効率的に識別するための条件が見出される。短いプローブは、非常に速い動態を有するため、多数の一過的な結合事象を短時間(例えば、1秒、数秒、または1分もしくは2分未満)で蓄積することができる。律速段階は、試薬交換および温度調整であり得る。結合は、乾燥させることなく撮像され、それによって、各プローブの最適な平衡反応条件を使用することができる。 In some embodiments, conditions are first found for short oligo probes to efficiently discriminate between matches and mismatches. Short probes have very fast kinetics and can accumulate many transient binding events in a short period of time (eg, less than a second, seconds, or a minute or two). Rate limiting steps can be reagent exchange and temperature adjustment. Binding is imaged without drying, thereby allowing the use of optimal equilibrium reaction conditions for each probe.

一般に、配列決定は、標的ポリヌクレオチドが、結合したヌクレオチドに相補的であるヌクレオチドを含むことを仮定しており、結合不一致誤差は、この仮定が当てはまらない場合の一例である。それにもかかわらず、不一致は、既知のルールまたは挙動に従って生じる場合、標的の配列を決定するのに有用であり得る。短いオリゴヌクレオチド(例えば、5塩基長)の使用は、1つの塩基が5塩基長の20%であるため、単一の不一致の影響が安定性に対して大きな影響を有することを意味する。したがって、適切な条件では、短いオリゴプローブによって絶妙な特異性を得ることができる。それでも、不一致が生じる可能性があり、分子相互作用の確率的性質のため、それらの結合の持続時間は、一部の場合において、5塩基すべてが特異的である結合から区別可能ではない場合がある。しかしながら、塩基(または配列)呼び出しおよびアセンブリを行うために使用されるアルゴリズムは、不一致の発生を考慮に入れることができる。多くの種類の不一致は予測可能であり、特定のルールに従っている。これらのルールのいくつかは、理論的考慮によって導出することができ、他のルールは、実験的に導出される(例えば、Maskos and Southern Nucleic Acids Res,Williams et al Nucleic Acids Res 22:13651367(1994))。 In general, sequencing assumes that the target polynucleotide contains nucleotides that are complementary to the nucleotides bound, and binding mismatch errors are an example of when this assumption does not hold. Nonetheless, discrepancies can be useful in determining the sequence of a target if they occur according to known rules or behavior. The use of short oligonucleotides (eg, 5 bases long) means that the effect of a single mismatch has a large impact on stability, since one base is 20% of a 5 base length. Thus, under appropriate conditions, exquisite specificity can be obtained with short oligoprobes. Nevertheless, discrepancies can occur, and due to the stochastic nature of molecular interactions, the duration of their binding may in some cases be indistinguishable from binding in which all five bases are specific. be. However, the algorithms used to perform base (or sequence) calling and assembly can take into account the occurrence of discrepancies. Many kinds of discrepancies are predictable and follow certain rules. Some of these rules can be derived by theoretical considerations, others are experimentally derived (see, for example, Maskos and Southern Nucleic Acids Res, Williams et al Nucleic Acids Res 22:13651367 (1994 )).

本発明の一実施形態では、1つ以上の既知の標的ポリヌクレオチド(例えば、ラムダファージDNAまたはレパートリーの各オリゴに対する相補体を含むスーパー配列を含む合成構築物)を含む訓練セットを、レパートリーからの各オリゴヌクレオチドの反復結合を試験するために使用する。機械学習アルゴリズムを使用して、オリゴプローブの結合特性および不一致特性を決定することができる。したがって、直感に反して、不一致結合は、さらなるデータを提供する方法としてみなすことができ、配列をアセンブリする、かつ/または配列に対する信頼度を付加するために使用することができる。 In one embodiment of the invention, a training set comprising one or more known target polynucleotides (e.g., lambda phage DNA or a synthetic construct comprising a supersequence comprising the complement to each oligo of the repertoire) is generated from each oligo from the repertoire. Used to test repeat binding of oligonucleotides. Machine learning algorithms can be used to determine binding and mismatch properties of oligo probes. Thus, counter-intuitively, discordant binding can be viewed as a method of providing additional data and can be used to assemble sequences and/or add confidence to sequences.

特定の外れ値配列は、非ワトソン-クリック様式で結合し得るか、または短いモチーフは、異常に高いオン速度または低いオフ速度をもたらし得る。例えば、RNAとDNAとの間のプリン-ポリプリリミジン相互作用は、非常に強力であり得る(例えば、aggなどのRNAモチーフ)。これらは、より低いオフ速度を有するだけでなく、より安定した核形成配列を提供することによって、より高いオン速度も有する。場合によっては特定の既知の規則に必ずしも適合しない外れ値から結合が生じる。アルゴリズムは、そのような外れ値を識別するために、またはそのような外れ値の期待値を考慮に入れるために設計され得る。 Certain outlier sequences may bind in a non-Watson-Crick fashion, or short motifs may result in abnormally high on-rates or low off-rates. For example, purine-polypyrimidine interactions between RNA and DNA can be very strong (eg RNA motifs such as agg). They not only have lower off-rates, but also higher on-rates by providing a more stable nucleation sequence. Sometimes binding arises from outliers that do not necessarily conform to certain known rules. Algorithms can be designed to identify such outliers or to take into account the expected value of such outliers.

二本鎖DNA(例えば、天然ヒトゲノムDNA)が固定化されている場合、1024個のセットからの1つのオリゴ(アンチセンス)は、一方の鎖(センス)に結合し、他のオリゴ(センス)は、他方の鎖(アンチセンス)に結合する。変性後であっても、特定のオリゴが結合している鎖、センスもしくはアンチセンスをすぐに区別することはできない場合がある。 When double-stranded DNA (e.g., native human genomic DNA) is immobilized, one oligo (antisense) from the set of 1024 binds to one strand (sense) and the other oligo (sense). binds to the other strand (antisense). Even after denaturation, it may not be possible to readily distinguish which strand a particular oligo is attached to, sense or antisense.

どの変性鎖にプローブの1つが結合するかを、すぐに区別可能ではない場合がある。しかし、完全な配列決定データセットにより、オリゴ結合の重複配列が、一方または他方にナノメトリック的に位置することが分かるため、これを明らかにすることができる(図7を参照)。 It may not be immediately distinguishable to which denatured strand one of the probes binds. However, the full sequencing data set allows this to be revealed, as overlapping sequences of oligo-bonds are found to be nanometrically located on one side or the other (see Figure 7).

同じ場所に位置したままの2本の鎖の驚くべき利点は、相補標的部位に基づいて塩基配列の割当が独立して照合されるため、非常に高い正確度が可能になることである。1つの特異的オリゴの1つの鎖への結合の真実性は、表面での数または数ナノメートル(a few or several nanometers)以内の同じ場所に位置する他の鎖に対するその相補体の結合によって確立することができる。 A surprising advantage of the two strands remaining co-located is that the independent matching of base sequence assignments based on complementary target sites allows for very high accuracy. The authenticity of the binding of one specific oligo to one strand is established by the binding of its complement to the co-located other strand within a few or several nanometers of the surface. can do.

一部の実施形態では、6個の定義された塩基を有するオリゴヌクレオチドプローブが使用され、完全なレパートリーは、4096個の配列を含む。一部の実施形態では、5個の定義された塩基を有するオリゴヌクレオチドプローブが使用され、完全なレパートリーは、1024個の配列を含む。一部の実施形態では、5個または6個の塩基が定義され、追加の普遍的塩基または縮重位置がオリゴヌクレオチド長に含まれる。 In some embodiments, oligonucleotide probes with 6 defined bases are used and the complete repertoire contains 4096 sequences. In some embodiments, oligonucleotide probes with 5 defined bases are used and the complete repertoire contains 1024 sequences. In some embodiments, 5 or 6 bases are defined and additional universal bases or degenerate positions are included in the length of the oligonucleotide.

非特異的結合は、典型的には、特定のプローブよりも短い時間結合し、したがって、データ処理中に計算的に区別することができる。例えば、ある条件下では、10ミリ秒より短い結合事象が、非特異的とみなされる。 Non-specific binding typically binds for a shorter period of time than specific probes and thus can be computationally distinguished during data processing. For example, under certain conditions binding events shorter than 10 ms are considered non-specific.

プローブのオン速度は、プローブの濃度を増加させること、温度を上昇させること、分子クラウディングを増加させること(PEG400、PEG800などを含む)によって、操作する(増加させる)ことができる。化学成分を操作することによってプローブの熱安定性を低下させること、不安定化付属体を添加すること、または、オリゴヌクレオチドの場合、それらの長さを短縮することによって、オフ速度を増加させることができる。オフ速度はまた、温度を上昇させること、塩濃度を減少させること(厳密さを増加すること)、pHをスケールの極値に近づけることによって加速させることができる。 The probe on-rate can be manipulated (increased) by increasing probe concentration, increasing temperature, increasing molecular crowding (including PEG400, PEG800, etc.). Decreasing the thermal stability of the probes by manipulating the chemical moieties, adding destabilizing appendages or, in the case of oligonucleotides, increasing the off-rates by shortening their length can be done. The off-rate can also be accelerated by increasing temperature, decreasing salt concentration (increasing severity), and moving pH closer to the extremes of the scale.

プローブの濃度を増加させることによってオン速度を増加させると、溶液中のプローブによるバックグラウンド蛍光が顕著になり得るため、問題となる場合がある。表面での単一分子検出は、表面に結合するシグナルが、バックグラウンドを超えて検出されるように、バックグラウンドシグナルを低くすることに依存する。 Increasing the on-rate by increasing the concentration of the probe can be problematic as background fluorescence from the probe in solution can become significant. Single-molecule detection at a surface relies on lowering the background signal such that the signal bound to the surface is detected above background.

一部の実施形態では、使用されるプローブの濃度は、プローブが結合するまで本質的に非蛍光にすることによって、増加させることができる。これを行う1つの方法は、結合が、光活性化事象を誘発することである。別の例は、プローブが、蛍光発生性であることである。別の例は、結合が生じるまで標識をクエンチすることである(例えば、分子ビーコン)。別の例は、シグナルを、エネルギー移動事象(例えば、FRET、CRET、BRET)の結果として検出することである。一実施形態では、表面のバイオポリマーがドナーを担い、プローブがアクセプターを担うか、またはその逆もまた同様である。別の実施形態では、挿入色素は、溶液中に提供され、標識プローブが結合する際、挿入色素とプローブとの間にFRET相互作用が存在する。挿入色素は、ドナーおよびプローブ上の標識がアクセプターであってもよく、またはその逆であってもよい。例えば、挿入色素は、ストックからの1000~10,000倍希釈のYOYO-1または100~10,000倍希釈のEvagreenであってもよく、プローブ上の標識は、ATTO655であってもよい。別の実施形態では、挿入色素は、FRET機構を用いずに使用され、表面上の一本鎖標的配列とプローブ配列との両方が非標識であり、シグナルは、結合により、挿入色素が挿入される二本鎖が生成されるときにのみ検出される。挿入色素は、DNAに挿入されておらず、かつ溶液中に遊離している場合、その同一性に応じて、輝度が100分の1または1000分の1以下であり得る。これを、TIRFまたはHILO顕微鏡と組み合わせると、溶液中の挿入色素からのいかなるバックグラウンドシグナルも除去される。 In some embodiments, the concentration of probe used can be increased by rendering the probe essentially non-fluorescent until it binds. One way to do this is for binding to trigger a photoactivation event. Another example is that the probe is fluorogenic. Another example is to quench the label until binding occurs (eg molecular beacons). Another example is detecting a signal as a result of an energy transfer event (eg, FRET, CRET, BRET). In one embodiment, the surface biopolymer carries the donor and the probe carries the acceptor, or vice versa. In another embodiment, the intercalating dye is provided in solution and there is a FRET interaction between the intercalating dye and the probe when the labeled probe binds. The intercalating dye may be the acceptor with the label on the donor and the probe, or vice versa. For example, the intercalating dye can be 1000-10,000-fold dilution of YOYO-1 or 100-10,000-fold dilution of Evagreen from stock, and the label on the probe can be ATTO655. In another embodiment, the intercalating dye is used without the FRET mechanism, both the single-stranded target and probe sequences on the surface are unlabeled, and the signal is that the intercalating dye is intercalated upon binding. detected only when a double-strand is produced. Intercalating dyes, when not intercalated into DNA and free in solution, can be 100-fold or 1000-fold less bright, depending on their identity. Combining this with TIRF or HILO microscopy eliminates any background signal from intercalating dyes in solution.

一部の実施形態では、本発明は、単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を配列決定する方法を含み、
i)ポリヌクレオチドを、表面またはマトリックス上に固定化することと、
ii)1つ以上のプローブ種を、プローブがポリヌクレオチドに一過的に結合して、ポリヌクレオチドから検出される1つ以上の蛍光(または他の検出可能な)シグナルの変化をもたらすことができる条件下で、添加することと、
iii)検出器で、ポリヌクレオチドからの1つ以上のシグナルを継続的に監視し、一定期間、結合事象を記録することと、
iv)bのプローブを除去することと、
v)毎回、異なる1つ以上のプローブ種を用いて、ステップii~ivを反復することと、
vi)ステップiiiの各反復からのデータをコンパイルして、修飾および/または塩基の配列を再構築することと、を含む。
In some embodiments, the invention comprises a method of sequencing nucleotide modifications and/or bases on a single target polynucleotide,
i) immobilizing the polynucleotide on a surface or matrix;
ii) one or more probe species can be transiently bound by the probe to the polynucleotide, resulting in a change in one or more fluorescent (or other detectable) signals detected from the polynucleotide; under the conditions of adding
iii) continuously monitoring one or more signals from the polynucleotide with a detector and recording binding events over a period of time;
iv) removing the probe of b;
v) repeating steps ii-iv using one or more different probe species each time;
vi) compiling the data from each iteration of step iii to reconstruct the sequence of modifications and/or bases.

特定の実施形態では、本発明の方法は、ポリヌクレオチドのアレイ上で操作することができる。一部の実施形態では、標的ポリヌクレオチドのアレイは、複数のポリヌクレオチドを単一視野で見ることができるように、固定化される。 In certain embodiments, the methods of the invention can operate on arrays of polynucleotides. In some embodiments, the array of target polynucleotides is immobilized so that multiple polynucleotides can be viewed in a single field of view.

一部の実施形態では、標的ポリヌクレオチドは、その長さに沿って化学的特徴(塩基配列、損傷、修飾)を見ることができるように、伸長または伸展されている。一部の実施形態では、単一の非常に長い標的ポリヌクレオチドは、その長さの実質的な全体を単一視野で見ることができるように、固定化されている(Frietag et al)。 In some embodiments, the target polynucleotide is elongated or stretched so that chemical features (sequences, lesions, modifications) can be seen along its length. In some embodiments, a single very long target polynucleotide is immobilized so that substantially all of its length can be viewed in a single field of view (Frietag et al).

一部の実施形態では、流体容器は、ウェルである。一部の実施形態では、流体容器は、フローセルである。一部の実施形態では、表面は、1つ以上の化学層、生化学層(例えば、BSA-ビオチン、ストレプトアビジン)、脂質層、ヒドロゲル、またはゲル層でコーティングされる。 In some embodiments, the fluid reservoir is a well. In some embodiments, the fluid reservoir is a flow cell. In some embodiments, the surface is coated with one or more chemical, biochemical (eg, BSA-biotin, streptavidin), lipid, hydrogel, or gel layers.

一部の実施形態では、天然ポリヌクレオチドは、配列決定のために呈示される前にプロセシングを必要としない。これにより、本方法は、DNAの化学修飾が所定の位置に留まるため、エピゲノム情報を、配列情報と統合することができる。好ましくは、ポリヌクレオチドは、方向的に十分に整列しており、したがって、撮像、画像処理、ベースコールおよびアセンブリが比較的容易であり、配列の誤差率が低く、カバレッジが高い。本発明を実施するために、いくつかの手段が記載されているが、各手段は、試料調製の負担が完全にまたはほぼ完全に排除されるように行われる。 In some embodiments, native polynucleotides do not require processing prior to presentation for sequencing. This allows the method to integrate epigenomic information with sequence information because chemical modifications of DNA remain in place. Preferably, the polynucleotides are well-aligned directionally so that imaging, image processing, base calling and assembly are relatively easy, sequence error rates are low, and coverage is high. Several means have been described for carrying out the invention, each of which is done in such a way that the burden of sample preparation is completely or almost completely eliminated.

本発明は、ゲノムDNAの塩基の数よりも桁違いに少ない試薬添加サイクルを行うことによって、ゲノムDNAの100万個以上の実質的に連続した塩基を配列決定することを可能にするため、直感に反し、驚くべきことである。本発明の方法は、単一の標的ポリヌクレオチド分子が、それらへのプローブの一過的な結合を検出することによって配列決定することができるという発見に部分的に基づいている。したがって、様々な態様および実施形態では、本発明は、長い鎖長のポリヌクレオチドを得ることと、ポリヌクレオチドの長さに沿った場所がトレースされるように、ポリヌクレオチドを線状の状態で配置することと、を含む。 The present invention is intuitive because it allows one million or more substantially contiguous bases of genomic DNA to be sequenced by performing reagent addition cycles orders of magnitude fewer than the number of bases in the genomic DNA. On the contrary, it is surprising. The methods of the invention are based, in part, on the discovery that single target polynucleotide molecules can be sequenced by detecting transient binding of probes to them. Thus, in various aspects and embodiments, the present invention provides for obtaining long strand lengths of polynucleotides and arranging the polynucleotides in a linear fashion so that locations along the length of the polynucleotide can be traced. including doing and

一部の実施形態では、ポリヌクレオチドの全長またはほぼ全長は、無視できる数のギャップを有する連続したリードを含む。これは、ゲノムの反復領域を通してでさえ、長距離のゲノム構造を提供し、また、個々のハプロタイプを解像することを可能にする。この方法は、1つまたはわずかな細胞から、高度に完全な配列を提供することができる。 In some embodiments, the full length or nearly full length of the polynucleotide comprises contiguous reads with a negligible number of gaps. This provides long-range genomic structure, even through repetitive regions of the genome, and also allows individual haplotypes to be resolved. This method can provide highly complete sequences from one or a few cells.

一部の実施形態では、連続配列は、アルゴリズムを使用して、デノボアセンブリを介して得られる。場合によっては、重複する配列ビットの高い割合の場所が実験的に得られるため、アルゴリズムのタスクは比較的単純である。しかし、信頼度を高めるのに困難が存在する場合、参照配列を使用して、アセンブリを容易にすることもできる。複数のポリヌクレオチドからの情報を処理するアルゴリズムのいくつかは、非常に長い距離をカバーする個々のハプロタイプを解像するために使用されている。 In some embodiments, contiguous sequences are obtained through de novo assembly using an algorithm. In some cases, locations with a high percentage of overlapping alignment bits are obtained experimentally, so the task of the algorithm is relatively simple. However, reference sequences can also be used to facilitate assembly if difficulties exist in increasing confidence. Some of the algorithms that process information from multiple polynucleotides have been used to resolve individual haplotypes covering very large distances.

いくつかの方法で、配列をデータから抽出することができる。配列再構築方法のスペクトルの一端では、モノマーまたは一連のモノマーの局在化は、モノマーまたは一連のモノマーを注文するだけで配列が得られるように正確である(ナノメトリックまたはサブナノメトリック)。スペクトルの他端では、データは、配列に関する様々な仮説を排除するために使用される。例えば、1つの仮説は、配列が既知の個々のゲノム配列に対応するということである。アルゴリズムは、データが個々のゲノムから乖離する場所を決定する。別の場合、仮説は、配列が「正常」体細胞の既知のゲノム配列に対応するということである。アルゴリズムは、推定される腫瘍細胞からのデータが、「正常な」体細胞の配列から乖離する場所を決定する。これらのアプローチのスペクトルにわたるバリエーションを実装することができる。 Sequences can be extracted from the data in several ways. At one end of the spectrum of sequence reconstruction methods, the localization of a monomer or series of monomers is so precise (nanometric or sub-nanometric) that one only needs to order a monomer or series of monomers to obtain the sequence. At the other end of the spectrum, the data are used to rule out various hypotheses about sequence. For example, one hypothesis is that the sequences correspond to known individual genomic sequences. Algorithms determine where the data deviate from individual genomes. Another hypothesis is that the sequence corresponds to the known genomic sequence of a "normal" somatic cell. The algorithm determines where data from putative tumor cells deviate from the sequence of "normal" somatic cells. Variations across the spectrum of these approaches can be implemented.

したがって、一部の実施形態では、未知の配列のアセンブリは、
a)参照ゲノムを提供することと、
b)参照ゲノムのオリゴのレパートリーへの理論的結合パターンを、インシリコで決定することと、
c)実際のデータを、理論的参照とインシリコで比較することと、
d)実際のデータと理論的参照との間の差異を、インシリコで決定することと、
e)dで見出された差異に従って、参照の配列を変更/再構築して、これまで未知の配列のアセンブリを生成することと、を含む。
Thus, in some embodiments, the assembly of unknown sequences is
a) providing a reference genome;
b) determining in silico the theoretical binding pattern to the repertoire of oligos of the reference genome;
c) comparing actual data in silico with theoretical references;
d) determining in silico the difference between the actual data and the theoretical reference;
e) altering/reconstructing the reference sequence according to the differences found in d to generate an assembly of hitherto unknown sequences.

一部の実施形態では、差異は、置換、インデル、および構造多型を含む。特に、参照配列が本発明の方法によってアセンブリされていない場合、反復は圧縮され、再構築が解凍する。 In some embodiments, differences include substitutions, indels, and structural polymorphisms. In particular, if the reference sequence has not been assembled by the method of the invention, repeats are compressed and reconstruction uncompresses.

一部の実施形態では、ゲノムDNAが複数の細胞から得られ、データは、複数の分子間で統合され得る。複数の分子の各々は、複数の分子のうちの少なくとも別の分子と部分的に重複し、それらは、共通のプローブ結合パターンを一致させることによって整列される。部分的に重複する分子の各々は、他の分子と一連の配列を共有する。整列が計算的に行われると、各分子に固有の配列がギャップを埋めるために使用され、完全にまたは実質的に連続したアセンブリされた配列が得られる。 In some embodiments, genomic DNA is obtained from multiple cells and the data can be integrated between multiple molecules. Each of the plurality of molecules partially overlaps with at least another of the plurality of molecules, which are aligned by matching common probe binding patterns. Each partially overlapping molecule shares a set of sequences with the other molecule. Once the alignment is computationally performed, sequences unique to each molecule are used to fill gaps, resulting in a fully or substantially contiguous assembled sequence.

本方法は、複数の個々の(非クローンの)ポリヌクレオチドに対して並行して実施することができ、複数のポリヌクレオチドは、それらの長さの全体(またはかなりの部分)にわたって個別に解像可能であり、個々のポリヌクレオチド間の重複が最小限であるか、またはまったく生じないような様式で配置される。横並びの重複が発生する場合、これは、DNA染色剤からの蛍光の増加によって、または、染色剤が使用されない場合、結合事象の頻度の増加によって検出することができ、分子が、光学的に重複しているように見えるが、物理的に重複していない場合(回折限界)、それらは、本発明によって提供される単一分子局在化によって提供される超解像によって解像することができる。端部間重複が生じる場合、一部の実施形態では、ポリヌクレオチドの末端をマーキングする標識を使用して、並置されたポリヌクレオチドを真の連続した長さから区別することができる。そのような光学的キメラは、ゲノムの多くのコピーが予想され、見かけのキメラの出現が1回だけ見出される場合、アーティファクトとして却下することもできる。ここでも、分子の末端(回折限界さ)が光学的に重複しているように見えるが、物理的に重複していない場合、それらは本発明の方法によって解像することができる。一部の実施形態では、場所決定は、非常に正確であり、そのため、非常に近い標識から発せられるシグナルが解像され得る。 The method can be performed in parallel on multiple individual (non-clonal) polynucleotides, which are individually resolved over the entire (or substantial portion) of their length. possible and arranged in such a way that there is minimal or no overlap between individual polynucleotides. If side-by-side duplication occurs, this can be detected by an increase in fluorescence from the DNA stain, or if no stain is used, by an increase in the frequency of binding events, and the molecules are optically overlapped. appear to overlap but are physically non-overlapping (diffraction limit), they can be resolved by the super-resolution provided by the single-molecule localization provided by the present invention. . Where end-to-end overlap occurs, in some embodiments labels marking the ends of polynucleotides can be used to distinguish juxtaposed polynucleotides from true contiguous lengths. Such optical chimeras can also be dismissed as artefacts if many copies of the genome are expected and only one appearance of the apparent chimera is found. Again, if the ends of the molecules (diffraction-limited) appear to overlap optically, but not physically, they can be resolved by the method of the invention. In some embodiments, localization is so precise that signals emitted from very close labels can be resolved.

高濃度のプローブ溶液は、クエンチされたプローブ分子ビーコンを使用するか、または同じ種類の2つ以上の標識(例えば、オリゴの両側に1つの標識)を有することによって、支障となるバックグラウンドを引き起こすことなく達成することができる。溶液中では、それらは色素間相互作用を介してクエンチされる。しかし、標的に結合すると分離され、単一の色素の2倍の輝度で明るく蛍光を発することができるため、検出が容易になる。このような色素間相互作用は、Cy3について既知である。 High concentrations of probe solutions cause disturbing background by using quenched probe molecular beacons or having two or more labels of the same type (e.g., one label on each side of the oligo) can be achieved without In solution they are quenched via dye-dye interactions. However, once bound to the target, they are separated and can fluoresce twice as brightly as a single dye, facilitating detection. Such dye-dye interactions are known for Cy3.

一態様では、本発明は、プローブのレパートリーの一過的な結合によってポリマーを配列決定するためのデバイスを含み、かかるデバイスは、光源、流体導管、光学部品、検出器、電子回路、任意選択的に、コンピュータプロセッサおよびコンピュータメモリを含む。DNAは、流体容器に配置され、結合プローブと流体接触しており、光源は、結合プローブと関連付けられた標識を検出器によって検出される光を放出する。一部の実施形態では、検出器は、2D検出器である。一部の実施形態では、ポリヌクレオチドは、流体導管の1つの部分に保持され、結合プローブは別の部分にある。任意選択的に、流体導管の1つの部分は、バルブを介して他の部分から分離される。一部の実施形態では、オリゴまたはオリゴのセットは、液滴またはパケットとして送達される。一部の実施形態では、液滴は、配列決定が行われるフローセルに、予め充填される。 In one aspect, the invention includes a device for sequencing a polymer by transient binding of a repertoire of probes, such device comprising a light source, fluidic conduits, optics, detectors, electronic circuitry, and optionally includes a computer processor and computer memory. The DNA is placed in a fluid container and in fluid contact with the binding probe, and the light source emits light where the label associated with the binding probe is detected by the detector. In some embodiments the detector is a 2D detector. In some embodiments, the polynucleotide is retained in one portion of the fluid conduit and the binding probe is in another portion. Optionally, one portion of the fluid conduit is separated from the other portion via a valve. In some embodiments, an oligo or set of oligos is delivered as droplets or packets. In some embodiments, the droplets are pre-filled into the flow cell where sequencing takes place.

一部の実施形態では、配列決定されるポリヌクレオチドのサブセットは、最初に、ポリヌクレオチドの第1のセットから選択される。一部のかかる実施形態では、捕捉オリゴヌクレオチドを溶液中で使用して、ポリヌクレオチドのサブセットにハイブリダイズさせ、それらを溶液から除く。例えば、AgilentのSureSelectまたは同様のアプローチを使用することができる。一部の実施形態では、選択は、CRISPR型のアプローチを伴い、核酸結合は、タンパク質結合によって促進される。同様に、配列決定されるタンパク質またはポリペプチドは、捕捉抗体、ナノボディ、アフィボディ、アプタマーなどによって、溶液から選択され得る。同様に、配列決定される抗体、アフィボディ、またはナノボディは、捕捉抗原によって、溶液から選択され得る。単離されたバイオポリマーは、表面に配列され、本発明の配列決定方法に供される。 In some embodiments, the subset of polynucleotides to be sequenced is first selected from the first set of polynucleotides. In some such embodiments, capture oligonucleotides are used in solution to hybridize to a subset of polynucleotides and remove them from solution. For example, Agilent's SureSelect or similar approach can be used. In some embodiments, selection involves a CRISPR-type approach and nucleic acid binding is facilitated by protein binding. Similarly, proteins or polypeptides to be sequenced can be selected from solution by capture antibodies, nanobodies, affibodies, aptamers, and the like. Similarly, antibodies, affibodies, or nanobodies to be sequenced can be selected from solution by the capture antigen. Isolated biopolymers are arrayed on the surface and subjected to the sequencing methods of the invention.

一部の実施形態では、結合プローブは、タンパク質(例えば、cas9)およびガイドRNAを含むCRISPR系を含む。一部の実施形態では、配列決定の目的は、標的およびオフ標的効果を検出するためのガイドRNAの結合場所を決定することである。 In some embodiments, the binding probe comprises a CRISPR system comprising a protein (eg, cas9) and guide RNA. In some embodiments, the purpose of sequencing is to determine the binding sites of guide RNAs for detecting target and off-target effects.

一部の実施形態では、標的ポリヌクレオチドは、体液中に存在するもの、例えば、血液中の循環DNAまたはRNAである。かかるポリヌクレオチドは、長さが短く、血液中で約200塩基であり、尿中ではより短い。これらのポリヌクレオチドを表面に固定化し、本発明の配列決定方法に供することができる。そのようなポリヌクレオチドのいくつかは、一本鎖末端を有し、それによって、固定化される。例えば、それらは、ビニルシラン表面(Genomic Vision、France)に固定化することができる。一部の実施形態では、循環DNAまたはRNAは、環状化され、円はローリングサークル反応に使用される。一部の実施形態では、環状化は、CircLigaseなどの酵素によって行われる。一部の実施形態では、ローリングサークル増幅反応の生成物であるタンデムコピーの長い鎖長は、表面上またはマトリックス中で伸展され、次いで、本発明の配列決定方法に供される。このようなアプローチにより、循環ポリヌクレオチドのコンセンサス配列を得ることができる。一部の実施形態では、検出される循環DNAが希少であり、例えば、がんの早期検出の場合、タンデムコピーの配列決定によって得られるコンセンサスは、配列決定方法のエラー率を上回る正確度レベルを得ることを可能にする。例えば、本方法の生の正確度が99.9%である場合、コンセンサスリードは、99.999%の正確度を可能にし、非常に稀なバリアントを検出することを可能にし得る。この文脈におけるローリングサークル増幅の利点は、各アンプリコンが、環状化ポリヌクレオチドから直接コピーされるため、第1または早期の複製ラウンドからの誤差を永続化しないことである(PCRとなる)。 In some embodiments, the target polynucleotide is present in body fluids, eg, circulating DNA or RNA in blood. Such polynucleotides are short in length, approximately 200 bases in blood and shorter in urine. These polynucleotides can be surface immobilized and subjected to the sequencing methods of the invention. Some such polynucleotides have single-stranded ends and are thereby immobilized. For example, they can be immobilized on a vinylsilane surface (Genomic Vision, France). In some embodiments, the circulating DNA or RNA is circularized and circles are used in a rolling circle reaction. In some embodiments, circularization is performed by an enzyme such as CircLigase. In some embodiments, long strand lengths of tandem copies that are products of rolling circle amplification reactions are extended on a surface or in a matrix and then subjected to the sequencing methods of the invention. Such an approach can yield consensus sequences for circulating polynucleotides. In some embodiments, the detected circulating DNA is rare, e.g., for early detection of cancer, the consensus obtained by sequencing tandem copies provides a level of accuracy that exceeds the error rate of sequencing methods. allow you to get For example, if the raw accuracy of the method is 99.9%, consensus reads may allow for 99.999% accuracy, allowing detection of very rare variants. An advantage of rolling circle amplification in this context is that each amplicon is copied directly from the circularized polynucleotide and thus does not perpetuate errors from the first or earlier replication rounds (resulting in PCR).

一部の実施形態では、本方法は、伸展された分子に沿って、インサイツで適用される。一部の実施形態では、本方法は、クロマチンに、インサイツで適用される。一部の実施形態では、本方法は、分裂期/中期染色体に、インサイツで適用され得る。一部の実施形態では、本方法は、間期染色体に、インサイツで適用され得る。一部の実施形態では、本方法は、細胞内の染色体DNAに、インサイツで適用され得る。一部の実施形態では、本方法は、タンデムコピーに沿って、インサイツで適用され得る。 In some embodiments, the method is applied in situ along the stretched molecule. In some embodiments, the method is applied to chromatin in situ. In some embodiments, the method can be applied in situ to mitotic/metaphase chromosomes. In some embodiments, the method can be applied in situ to interphase chromosomes. In some embodiments, the method can be applied in situ to chromosomal DNA within cells. In some embodiments, the method can be applied in situ along with tandem copies.

一部の実施形態では、DNAを配列決定することが目的である場合、配列決定を開始する前に、RNAseが試料に適用される。一部の実施形態では、RNAを配列決定することが目的である場合、配列決定を開始する前に、DNAseが試料に適用される。一部の実施形態では、細胞質の核酸および核の核酸の両方が分析され、それらは、差次的に、または順次抽出される。まず、細胞膜(核膜ではない)を破壊して、細胞質の核酸を遊離し、回収する。次いで、核膜を破壊して、核酸を遊離する。一部の実施形態では、タンパク質およびポリペプチドは、細胞質画分の一部として回収される。一部の実施形態では、RNAは、細胞質画分の一部として回収される。一部の実施形態では、DNAは、核画分の一部として回収される。一部の実施形態では、細胞質画分および核画分は、一緒に抽出される。一部の実施形態では、抽出後、mRNAおよびゲノムDNAは、差次的に捕捉される。例えば、mRNAは、表面に付着したオリゴdTプローブによって捕捉される。これはフローセルの第1の部分で生じ得、DNAは、DNAの末端が捕捉され得る疎水性ビニルシランコーティングを有するフローセルの第2の部分で捕捉される(おそらく疎水性相互作用により)。 In some embodiments, if the goal is to sequence DNA, RNAse is applied to the sample prior to initiating sequencing. In some embodiments, if the goal is to sequence RNA, DNAse is applied to the sample prior to initiating sequencing. In some embodiments, both cytoplasmic and nuclear nucleic acids are analyzed and they are differentially or sequentially extracted. First, the cell membrane (not the nuclear membrane) is disrupted to release and recover cytoplasmic nucleic acids. The nuclear membrane is then disrupted to liberate the nucleic acids. In some embodiments, proteins and polypeptides are recovered as part of the cytoplasmic fraction. In some embodiments, RNA is recovered as part of the cytoplasmic fraction. In some embodiments, DNA is recovered as part of the nuclear fraction. In some embodiments, the cytoplasmic and nuclear fractions are extracted together. In some embodiments, after extraction, mRNA and genomic DNA are differentially captured. For example, mRNA is captured by oligo-dT probes attached to the surface. This can occur in the first part of the flow cell and the DNA is trapped in the second part of the flow cell which has a hydrophobic vinylsilane coating where the ends of the DNA can be trapped (presumably by hydrophobic interactions).

ここまでに説明された一過的な結合の機構は、プローブ結合が不安定であるため、受動的である。以下に、一過的な結合が活性機構である本発明の代替的な実施形態を説明する。ここでは、プローブ結合が安定であり、物理的または分子的手段によって除去されなければならない。 The transient binding mechanism described so far is passive because the probe binding is labile. The following describes alternative embodiments of the invention in which transient binding is the activation mechanism. Here the probe binding must be stable and removed by physical or molecular means.

したがって、活性な一過的な結合ループは、
1)オリゴまたはオリゴセットを、標的に安定して結合させることと、
2)オリゴまたはオリゴセットを、標的から能動的に除去することと、
3)1および2を反復することと、を含む。
Therefore, the active transient binding loop is
1) stably binding an oligo or oligo set to a target;
2) actively removing the oligo or oligoset from the target;
3) repeating 1 and 2;

一部の実施形態では、ループは、少なくとも2回行われる。一部の実施形態では、オン・オフ結合は、継続的に監視される。一部の実施形態では、オン結合のみが監視される。ステップ1における標的にオリゴを結合させることは、多くの同じ配列のオリゴを結合させることを含む。一部の実施形態では、複数のオリゴ配列は、ステップ1で標的に結合して、標的上の異なる部位に結合する。 In some embodiments, the loop is performed at least twice. In some embodiments, on-off coupling is continuously monitored. In some embodiments, only on-coupling is monitored. Attaching oligos to targets in step 1 involves attaching many oligos of the same sequence. In some embodiments, multiple oligo sequences are attached to the target in step 1 and bind to different sites on the target.

一部の実施形態では、配列決定方法は、
1)オリゴ1またはオリゴ1セットを添加し、
2)撮像しながら、オリゴを、標的部位のサブセットに安定して結合させ、
3)オリゴを、標的から能動的に除去し、
4)十分な場所から、十分な数の画像が収集されるまで、2および3を反復し。
5)オリゴを洗い流し、
6)オリゴ2またはオリゴセット2を添加し、
7)ステップ2~5を反復し、
8)オリゴ3またはオリゴセット3を添加し、
9)ステップ2~5を反復し、
10)レパートリーが消耗するまで、上記のプロセスを継続する、ことを含む。
In some embodiments, the sequencing method comprises
1) add oligo 1 or oligo 1 set,
2) oligos are stably bound to a subset of target sites while being imaged;
3) actively removing the oligo from the target;
4) Repeat 2 and 3 until enough images are collected from enough locations.
5) wash off the oligos,
6) add oligo 2 or oligo set 2,
7) repeat steps 2-5;
8) add oligo 3 or oligo set 3;
9) repeat steps 2-5;
10) Continuing the above process until the repertoire is exhausted.

一部の実施形態では、ステップ2および3は、各オリゴまたはオリゴセットに対して複数回行われる。これは、いくつかの理由で行われる。結合は確率過程であるため、結合が適切な時間にわたって行われる場合、反応は平衡前または初期段階で停止され、結合部位のごく一部が占有される。したがって、使用されるオリゴまたはオリゴセットの結合部位が、全体的にともに近すぎて、個別に解像することができない場合、サブセットは、統計的にさらに離され、オリゴの濃度および反応の時間が適切に設定されている場合、それらを個別に検出することが可能になる。適切な時間および濃度は、経験的に判定することができる。これにより、異なる位置のサブセットを、結合させ、各反復で照合することができる。結合を複数回行う別の理由は、すべてまたはほぼすべてのほとんどの部位を、照合することを可能にし、実質的にすべてまたはほとんどの部位を、各々複数回照合することを可能にするためであり、したがって、感度および正確性が向上する。 In some embodiments, steps 2 and 3 are performed multiple times for each oligo or set of oligos. This is done for several reasons. Since binding is a stochastic process, if binding is allowed to occur for an appropriate period of time, the reaction will be terminated before equilibrium or in the early stages, and a small fraction of the binding sites will be occupied. Thus, if the binding sites of the oligos or sets of oligos used are too close together overall to be resolved individually, the subsets will be statistically further apart, and the concentration of oligos and the time of reaction will vary. If properly configured, it will be possible to detect them individually. Appropriate times and concentrations can be determined empirically. This allows subsets of different positions to be combined and matched at each iteration. Another reason for performing multiple ligations is to allow most sites to be matched, and substantially all or most sites to be matched multiple times each. , thus improving sensitivity and accuracy.

一部の実施形態では、活性結合および除去は、温度変化によってもたらされる。一部の実施形態では、活性結合および除去は、試薬変化によってもたらされる。一部の実施形態では、活性結合および除去は、電気的変化によってもたらされる。 In some embodiments, active binding and removal is effected by temperature change. In some embodiments, active binding and removal is effected by reagent change. In some embodiments, active binding and removal are effected by electrical changes.

本発明の一部の実施形態では、プローブ結合期間の経過中に、温度を変化させることができ、1つを超える温度で、プローブの結合挙動を決定できるようにする。一部の実施形態では、融解曲線の類似物が行われ、標的ポリマーへの結合挙動または結合パターンは、選択された範囲(例えば、10度~65度)にわたる温度の勾配と相関する。 In some embodiments of the invention, the temperature can be varied over the course of the probe binding period, allowing the binding behavior of the probe to be determined at more than one temperature. In some embodiments, melting curve analogues are performed and the binding behavior or pattern to the target polymer correlates with the gradient of temperature over a selected range (eg, 10 degrees to 65 degrees).

一部の実施形態では、代替として、または異なるTmを有するオリゴヌクレオチドプローブの温度を変更することに加えて、それらの濃度、および/または塩条件、および/またはpHを変化させることができる。一部の実施形態では、表面上の電気バイアスは、一過的な結合を能動的に促進するために、正と負の間で反復的に切り替えられる。 In some embodiments, alternatively, or in addition to changing the temperature of oligonucleotide probes with different Tms, their concentration, and/or salt conditions, and/or pH can be changed. In some embodiments, the electrical bias on the surface is repeatedly switched between positive and negative to actively promote transient binding.

一部の代替的な実施形態では、一過的な単一分子の結合は、非光学的方法によって検出される。一部の実施形態では、非光学的な方法は、電気的な方法である。一部の実施形態では、一過的な単一分子の結合は、直接的な励起方法が存在しない場合、非蛍光的な方法によって検出され、むしろ生物発光または化学発光の機構が使用される。 In some alternative embodiments, transient single-molecule binding is detected by non-optical methods. In some embodiments, the non-optical method is an electrical method. In some embodiments, transient single-molecule binding is detected by non-fluorescent methods in the absence of direct excitation methods, rather bioluminescence or chemiluminescence mechanisms are used.

一部の実施形態では、本発明は、標的ポリヌクレオチドを配列決定するための方法を含み、
1)標的ポリヌクレオチドを、その長さに沿って、表面/マトリックスとの1つ以上の相互作用(例えば、複数の相互作用)によって、固定化することと、
2)標的中に一致が見出された場合、一過的な結合が、非特異的結合を上回る区別可能な持続時間または存続時間で生じ得るような条件下で(オリゴ濃度、塩濃度、温度)、固定化標的ポリヌクレオチドを、所与の配列および長さのオリゴヌクレオチドまたは化学組成物で満たす(flood)ことと、
3)一過的な結合事象を検出し、それらの2D座標を記録することと、
4)オリゴヌクレオチドを除去することと、
5)次のオリゴヌクレオチドのセットを添加し、所与の長さの配列の全レパートリーが試験されるまで、3および4を反復し、除去することと、
6)アルゴリズムを使用して、一過的な結合するオリゴヌクレオチドの場所に基づいて、固定化標的ポリヌクレオチドの配列をコンパイルすることと、を含む。
In some embodiments, the invention includes a method for sequencing a target polynucleotide comprising:
1) immobilizing the target polynucleotide along its length by one or more interactions (e.g., multiple interactions) with the surface/matrix;
2) under conditions (oligo concentration, salt concentration, temperature ), flooding the immobilized target polynucleotide with an oligonucleotide or chemical composition of given sequence and length;
3) detecting transient binding events and recording their 2D coordinates;
4) removing the oligonucleotide;
5) adding and removing the next set of oligonucleotides, repeating 3 and 4 until the entire repertoire of sequences of a given length has been tested;
6) using an algorithm to compile a sequence of the immobilized target polynucleotide based on the location of the transient binding oligonucleotides.

本発明の方法は、天然長またはそのかなりの割合が(例えば、DNA全染色体または約1Mbp画分について)保存される、非常に長いポリマー長の配列に特に好適である。しかしながら、一般的な分子生物学的方法は、DNAの断片化をもたらす。ピペッティング、ボルテキシングは、DNA分子を破壊する可能性のある剪断力を引き起こす。ヌクレアーゼ汚染は、核酸を分解させる可能性がある。本発明の一部の実施形態では、天然長の天然長または天然長のかなり高分子量の(HMW)断片は、固定化、伸展、および配列決定を開始する前に保存される。 The methods of the present invention are particularly suitable for sequences of very long polymer length, where the natural length or a significant fraction thereof is conserved (eg, for the entire DNA chromosome or about a 1 Mbp fraction). However, common molecular biology methods result in DNA fragmentation. Pipetting, vortexing cause shear forces that can destroy DNA molecules. Nuclease contamination can degrade nucleic acids. In some embodiments of the invention, native-length or native-length high molecular weight (HMW) fragments are preserved prior to initiating immobilization, extension, and sequencing.

したがって、一部の実施形態では、本発明は、標的ポリヌクレオチドを配列決定するための方法を含み、
1)細胞を、マイクロ流体容器またはデバイスに配置することと、
2)ポリヌクレオチドを、細胞からマイクロ流体環境に抽出することと、
3)標的ポリヌクレオチドを、その長さに沿って、表面/マトリックスとの1つ以上(例えば、複数の相互作用)によって、固定化し、伸長することと、
4)標的中に一致が見出された場合、一過的な結合が、非特異的結合を上回る区別可能な持続時間または存続時間で生じ得るような条件下で(オリゴ濃度、塩濃度、温度)、固定化標的ポリヌクレオチドを、所与の配列および長さのオリゴまたは化学組成物で満たすことと、
5)一過的な結合事象を検出し、それらの2D座標を記録することと、
6)オリゴを除去することと、
7)所与の長さの配列の全レパートリーが試験されるまで、毎回、異なるオリゴを用いて4~6回反復することと、
8)単一分子局在化アルゴリズムを使用して、各結合部位をナノメトリックで位置決定することと、
9)アルゴリズムを使用して、一過的な結合するオリゴヌクレオチドの場所に基づいて、固定化標的ポリヌクレオチドの配列をコンパイルすることと、を含む。
Thus, in some embodiments, the invention includes a method for sequencing a target polynucleotide comprising
1) placing the cells in a microfluidic container or device;
2) extracting the polynucleotides from the cells into a microfluidic environment;
3) immobilizing and extending the target polynucleotide along its length by one or more (e.g., multiple interactions) with the surface/matrix;
4) under conditions (oligo concentration, salt concentration, temperature ), filling the immobilized target polynucleotide with oligos or chemical compositions of given sequence and length;
5) detecting transient binding events and recording their 2D coordinates;
6) removing oligos;
7) repeating 4-6 times, each time with a different oligo, until the entire repertoire of sequences of a given length has been tested;
8) nanometrically localizing each binding site using a single-molecule localization algorithm;
9) using an algorithm to compile a sequence of the immobilized target polynucleotide based on the location of the transient binding oligonucleotides.

一部の実施形態では、単一の直線化された、線状ポリマーは、一度に分析または検討される。この場合、2D座標を記録する必要はなく、1D座標だけ必要である。 In some embodiments, a single linearized, linear polymer is analyzed or studied at a time. In this case there is no need to record the 2D coordinates, only the 1D coordinates.

一部の実施形態では、ポリヌクレオチドは、ステップ1の後、その間、またその前に、比較的均一な長い鎖長(例えば、約1Mb)に断片化される。一部の実施形態では、ポリヌクレオチドは、ステップ2の後またはその間に、比較的均一な長い鎖長に断片化される。一部の実施形態では、断片化は、酵素的に行われる。一部の実施形態では、断片化は、物理的に行われる。一部の実施形態では、物理的断片化は、超音波処理を介する。一部の実施形態では、物理的断片化は、イオン爆撃または放射線を介する。一部の実施形態では、物理的断片化は、電磁放射線を介する。一部の実施形態では、物理的断片化は、UV照明を介する。一部の実施形態では、UV照明の線量は、所与の長さまで断片化をもたらすように制御される。一部の実施形態では、物理的断片化は、UV照明および色素(例えば、YOYO-1)による染色の組み合わせを介する。一部の実施形態では、断片化プロセスは、物理作用または試薬の添加によって停止される。一部の実施形態では、断片化プロセスの停止に影響を及ぼす試薬は、β-メルカプトエタノール(BME)などの還元剤である。 In some embodiments, the polynucleotide is fragmented into relatively uniform long chain lengths (eg, about 1 Mb) after, during, or before step 1. In some embodiments, the polynucleotide is fragmented into relatively uniform long chain lengths after or during step two. In some embodiments, fragmentation is performed enzymatically. In some embodiments, fragmentation is done physically. In some embodiments, physical fragmentation is through sonication. In some embodiments, physical fragmentation is through ion bombardment or radiation. In some embodiments, physical fragmentation is through electromagnetic radiation. In some embodiments, physical fragmentation is through UV illumination. In some embodiments, the dose of UV illumination is controlled to cause fragmentation to a given length. In some embodiments, physical fragmentation is through a combination of UV illumination and staining with a dye (eg, YOYO-1). In some embodiments, the fragmentation process is stopped by physical action or addition of reagents. In some embodiments, the reagent that affects terminating the fragmentation process is a reducing agent such as β-mercaptoethanol (BME).

一部の実施形態では、本発明は、
1)細胞を、マイクロ流体容器またはデバイスに配置することと、
2)細胞を、挿入色素で染色することと、
3)挿入色素媒介性断片化をもたらすための所定の線量のUV光を提供することと、
4)任意選択的に、断片化を中止することと、
5)ポリヌクレオチドを、細胞からマイクロ流体環境に抽出することと、
6)ポリヌクレオチドを、固定化し、伸長させることと、
7)固定化され伸長されたポリヌクレオチド上で、インサイツで配列決定することと、を含む。
In some embodiments, the invention provides
1) placing the cells in a microfluidic container or device;
2) staining the cells with an intercalating dye;
3) providing a dose of UV light to effect intercalating dye-mediated fragmentation;
4) optionally discontinuing fragmentation;
5) extracting the polynucleotides from the cells into a microfluidic environment;
6) immobilizing and extending the polynucleotide;
7) sequencing in situ on the immobilized and elongated polynucleotides.

これらのステップは、単離された単一細胞に作用するステップを含めて、本発明の様々な実施形態に追加することができる。 These steps can be added to various embodiments of the invention, including steps acting on isolated single cells.

一部の実施形態では、各細胞は、マイクロ流体容器またはデバイス内で個別に単離され、そのDNAは、個別に抽出され、個別に配列決定される。一部の実施形態では、抽出は、洗剤および/またはプロテアーゼで処理することによって行われる。一部の実施形態では、キレート剤(例えば、EDTA)は、ヌクレアーゼによって必要とされる二価カチオンを除去するために溶液中に提供される。一部の実施形態では、特定の試料源を用い、二価カチオンの濃度は、分子生物学において通常使用されるよりも高い。 In some embodiments, each cell is individually isolated within a microfluidic container or device and its DNA is individually extracted and individually sequenced. In some embodiments, extraction is performed by treatment with detergents and/or proteases. In some embodiments, a chelating agent (eg, EDTA) is provided in solution to remove divalent cations required by nucleases. In some embodiments, with a particular sample source, the concentration of divalent cations is higher than commonly used in molecular biology.

一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも速い。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも低コストである。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも長いリードを提供する。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも高い正確度を提供する。一部の好ましい実施形態では、本発明は、普及している配列決定技術よりも高い感度を提供する。最も好ましい実施形態では、本発明は、前述の利点のすべてを提供する。さらに、一部の好ましい実施形態では、フローセル、計装、およびコンピュータパワーのコストがコストに加算されるのにもかかわらず、ほんの数ドル以下の少量の生化学試薬を使用して、全ゲノムを約1時間以内に配列決定することができる。例えば、20塩基の標識部位を有する5塩基長は、約1ドルで購入することができ、完全なレパートリーは、1000ドルになる。標識部位に安定して結合することができる蛍光標識されたオリゴは、約50ドルである。マイクロモル濃度のスケールで合成されたそのようなオリゴの約100万分の1が使用され、1回の実行当たりのコストは1ドル未満となる。 In some preferred embodiments, the present invention is faster than popular sequencing techniques. In some preferred embodiments, the present invention is less costly than popular sequencing technologies. In some preferred embodiments, the present invention provides longer reads than prevailing sequencing technologies. In some preferred embodiments, the present invention provides greater accuracy than current sequencing techniques. In some preferred embodiments, the present invention provides greater sensitivity than prevailing sequencing technologies. In its most preferred embodiments, the present invention provides all of the aforementioned advantages. Moreover, in some preferred embodiments, whole genomes can be obtained using small quantities of biochemical reagents for only a few dollars or less, even though the cost of flow cells, instrumentation, and computer power add to the cost. It can be sequenced within about an hour. For example, a 5-base length with a 20-base labeling site can be purchased for about $1, making a complete repertoire $1000. Fluorescently labeled oligos that can be stably attached to the labeling site cost about $50. Approximately one millionth of such oligos synthesized on the micromolar scale are used, costing less than $1 per run.

本発明の方法は、酵素を必要とせず、プローブ(オリゴ)の希釈溶液のみを消費するという点で注目に値する。したがって、本方法は低コストである。配列決定化学は、単純なプローブおよび緩衝液のみを消費し、その結果、コストは、主に、機器およびプラスチックウェアである。 The method of the present invention is notable in that it does not require enzymes and only consumes dilute solutions of probes (oligos). Therefore, the method is low cost. Sequencing chemistry consumes only simple probes and buffers, so the cost is primarily equipment and plasticware.

本発明の驚くべき特徴は、単一分子の伸長された標的が、数百回の試薬交換および洗浄サイクルにわたって安定したままであることである。 A surprising feature of the present invention is that the single molecule extended target remains stable over hundreds of reagent exchange and washing cycles.

単一分子局在化によって可能になる本発明の注目すべき側面は、10nmピッチの規則正しいアレイは、完全に占有された場合、1cm当たり1兆個の標的分子を与えることである。 A notable aspect of the present invention enabled by single-molecule localization is that a 10 nm-pitch ordered array, if fully occupied, provides 1 trillion target molecules per cm 2 .

本発明の別の注目すべき側面は、標的における単一の塩基置換により、(例えば)10個の5塩基長プローブが、参照配列に対して変化することである。それまで結合しなかった5つのプローブがいま結合し、それまで結合していた5つのプローブがもう結合しない。この変化は、他の鎖でも見られるであろう。 Another notable aspect of the invention is that a single base substitution in the target alters (for example) 10 5 base long probes relative to the reference sequence. Five previously unbound probes now bind, and five previously bound probes no longer bind. This change will also be seen in other strands.

その好ましい実施形態では、本発明は、以下の要素のうちの2つ以上を含むことによって、従来技術と区別される:ポリヌクレオチドが固定化される前の事前ライブラリ調製がないこと;一部の実施形態におけるポリヌクレオチドの一方向での整列;一過的な結合;反復結合;ポリヌクレオチドの連続した配列が配列情報のビットを一緒に繋ぎ合わせることによって構築されること。 In its preferred embodiments, the present invention distinguishes from the prior art by including two or more of the following elements: no prior library preparation before polynucleotides are immobilized; unidirectional alignment of polynucleotides in embodiments; transient linkage; repetitive linkage; constructing a contiguous sequence of polynucleotides by piecing together bits of sequence information.

本発明の一部の実施形態では、本方法を実施するために必要なすべての試薬が、分析が開始される前に流体デバイスに予め充填される。一部の実施形態では、試薬(例えば、プローブ)は、デバイス内で乾燥状態で存在し、反応が進行する前に湿潤され、溶解される。 In some embodiments of the invention, all reagents required to perform the method are pre-filled into the fluidic device before the analysis is started. In some embodiments, reagents (eg, probes) are present in the device in a dry state and are wetted and dissolved before the reaction proceeds.

一部の実施形態では、本方法は、試薬交換を伴わない撮像の過程中で、単一のポリマーへの複数の結合事象を含む標的バイオポリマーを配列決定する手段を含む。一部の実施形態では、単一のバイオポリマー上の複数の場所の各々への複数の結合事象が、1回または複数回生じる。 In some embodiments, the method includes means for sequencing a target biopolymer that includes multiple binding events to a single polymer during the course of imaging without reagent exchange. In some embodiments, multiple binding events to each of multiple locations on a single biopolymer occur one or more times.

一部の実施形態では、配列決定方法は、配列プローブが単一のポリヌクレオチドに一過的に結合することを含み、当該プローブは、単一のポリヌクレオチド上の複数の重複部位の各々に実質的に相補的である。一部の実施形態では、重複部位の各々は、本方法の場所正確度および精度によって解像される。 In some embodiments, the sequencing method comprises transiently binding a sequence probe to a single polynucleotide, wherein the probe substantially overlaps each of a plurality of overlapping sites on the single polynucleotide. complementary to each other. In some embodiments, each of the overlapping sites is resolved by the local accuracy and precision of the method.

一部の実施形態では、配列決定方法は、配列プローブが単一のポリヌクレオチドに一過的に結合することを含み、レパートリーの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的であり、2つ以上のプローブの重複部位への結合は、時間的に離れている。 In some embodiments, the sequencing method comprises transiently binding sequence probes to a single polynucleotide, wherein the plurality of probes of the repertoire each binds sequence bits on the single polynucleotide. Substantially complementary, the binding of two or more probes to overlapping sites are separated in time.

一部の実施形態では、配列決定方法は、配列プローブのタイリングセットが単一のポリヌクレオチドに一過的に結合することを含み、セットの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的であり、2つ以上のプローブの重複部位/ビットへの結合は、時間的に離れる。 In some embodiments, the sequencing method comprises transiently binding a tiling set of sequence probes to a single polynucleotide, wherein the plurality of probes of the set are each on a single polynucleotide. and the binding of two or more probes to overlapping sites/bits are separated in time.

一部の実施形態では、配列決定方法は、配列プローブのパネルが単一のポリヌクレオチドに結合することを含み、パネルの複数のプローブは、各々、単一のポリヌクレオチド上の配列ビットに実質的に相補的である。一部のかかる実施形態では、配列ビットは、同じまたは異なるプローブによって複数回照合される。 In some embodiments, the sequencing method comprises binding a panel of sequence probes to a single polynucleotide, wherein the plurality of probes of the panel each substantially binds sequence bits on the single polynucleotide. Complementary to In some such embodiments, sequence bits are matched multiple times with the same or different probes.

一部の実施形態では、本発明は、標的タンパク質上のアミノ酸配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリペプチド上のアミノ酸配列を分析するための方法を含む。一部の実施形態では、本発明は、標的ポリヌクレオチド上のアミノ酸配列と同様に、ペプチド修飾を分析する方法を含む。 In some embodiments, the invention includes methods for analyzing amino acid sequences on target proteins. In some embodiments, the invention includes methods for analyzing amino acid sequences on target polypeptides. In some embodiments, the invention includes methods of analyzing peptide modifications as well as amino acid sequences on target polynucleotides.

一部の実施形態では、本発明の方法は、ポリペプチドの配列決定に適用される。20個のアミノ酸の各々は、N-レコグニン、ナノボディ、抗体、アプタマーなどを含む対応する特異的プローブによって結合される。各プローブの結合は、ポリペプチド鎖内の各対応するアミノ酸に特異的である。 In some embodiments, the methods of the invention are applied to the sequencing of polypeptides. Each of the 20 amino acids is bound by a corresponding specific probe including N-recognins, nanobodies, antibodies, aptamers and the like. Binding of each probe is specific for each corresponding amino acid within the polypeptide chain.

一部の実施形態では、ポリペプチドにおけるサブユニットの順序が決定される。一部の実施形態では、結合は、結合部位の代替物に結合する。一部の実施形態では、代替物は、特定のアミノ酸またはペプチド配列で結合されたタグである。一過的な結合は、代替タグに結合する。 In some embodiments, the order of subunits in the polypeptide is determined. In some embodiments, the binding binds to a binding site surrogate. In some embodiments, alternatives are tags attached at specific amino acid or peptide sequences. Transient binding binds to the surrogate tag.

一部の実施形態では、本発明は、ポリマーの同一性を決定することを含む。一部の実施形態では、本発明は、細胞または組織の同一性を決定することを含む。一部の実施形態では、本発明は、生物の同一性を決定することを含む。一部の実施形態では、本発明は、個体の同一性を決定することを含む。一部の実施形態では、本発明の方法は、単一細胞配列決定に適用される。 In some embodiments, the invention includes determining the identity of the polymer. In some embodiments, the invention involves determining the identity of cells or tissues. In some embodiments, the invention includes determining the identity of an organism. In some embodiments, the invention involves determining the identity of an individual. In some embodiments, the methods of the invention are applied to single cell sequencing.

一部の実施形態では、配列決定は、細胞内でインサイツで行われる。細胞の内容物は、マトリックスと称され得、一過的な結合が開始する前に、固定され、変性される。一部の実施形態では、細胞は、単層を形成してもよく、または他の実施形態では、それらは、組織またはオルガノイドなどの3Dアーキテクチャの一部である。多光子顕微鏡法および光シート顕微鏡法などの、3D構造の事象を検出することができる撮像方法を使用することができる。マトリックスまたはゲル中の分子を固定し、その中で照合することにより、希少なものを含むすべての分子を捕捉することができる。一部の実施形態では、細胞(例えば、循環腫瘍細胞CTC)は、表面に分散され、配列決定される。一部の実施形態では、細胞は、各細胞が他の細胞から十分に離れて分離されるように、表面に分散される。次いで、細胞を溶解することができ、それらの分子インベントリを表面上で捕捉し、本発明の配列決定方法に供することができる。 In some embodiments, sequencing is performed in situ within a cell. The cell contents, which may be referred to as the matrix, are fixed and denatured before transient binding begins. In some embodiments the cells may form a monolayer, or in other embodiments they are part of a 3D architecture such as a tissue or organoid. Imaging methods capable of detecting 3D structural events can be used, such as multiphoton microscopy and light sheet microscopy. By immobilizing and matching molecules in a matrix or gel, all molecules, including rare ones, can be captured. In some embodiments, cells (eg, circulating tumor cell CTCs) are dispersed on a surface and sequenced. In some embodiments, the cells are dispersed over the surface such that each cell is sufficiently separated from the other cells. Cells can then be lysed and their molecular inventory captured on the surface and subjected to the sequencing methods of the invention.

一部のかかる実施形態では、本方法は、
I)細胞内のポリヌクレオチドの場所を固定することと、
II)所与の特異性のオリゴを添加し、単一分子局在化を使用して、すべての結合事象の場所を決定することと、
III)異なる特異性のオリゴを添加し、単一分子局在化を使用して、すべての結合事象の場所を決定することと、
IV)ステップII~IIIを反復することと、
V)オリゴヌクレオチドの結合の場所をコンパイルすることによって、細胞内のポリヌクレオチドの線状経路または領域場所の配列を再構築することと、を含む。
In some such embodiments, the method comprises:
I) fixing the location of the polynucleotide within the cell;
II) adding oligos of given specificity and using single molecule localization to determine the location of all binding events;
III) adding oligos of different specificities and using single molecule localization to determine the location of all binding events;
IV) repeating steps II-III;
V) reconstructing the sequences of linear pathways or regions of polynucleotide locations within the cell by compiling the sites of binding of the oligonucleotides.

上記の一部の実施形態では、機構(FRET、蛍光標識、クエンチ標識など)を使用して、個々の点源の検出を困難にするバックグラウンド蛍光/光散乱を最小化する。上記の一部の実施形態では、RNAseを使用して、本発明が残りのDNAに適用される前に、RNAが除去される。上記の一部の実施形態では、二重鎖DNAは、オリゴの添加前にインサイツで変性される。 In some of the above embodiments, mechanisms (FRET, fluorescent labels, quench labels, etc.) are used to minimize background fluorescence/light scattering that makes detection of individual point sources difficult. In some embodiments above, RNAse is used to remove RNA before the invention is applied to the remaining DNA. In some embodiments of the above, the double-stranded DNA is denatured in situ prior to addition of oligos.

一部の実施形態では、修飾の場所はまた、5メチルC(5MC)などの修飾の場所を決定するために単一分子局在化を使用することによって決定される。 In some embodiments, the location of modifications is also determined by using single molecule localization to determine the location of modifications such as 5 methyl C (5MC).

本発明の一部の実施形態は、デジタル分子計数における問題を解決するように設計される。分子を計数する上での1つの問題は、高精度で再現性のあるデータを得ることである。分子相互作用の確率的性質に起因して、エンドポイントデジタル計数アッセイは、エンドポイント測定が行われた時点では存在しない特定の事象を見逃し得るか、またはそれは擬似事象(例えば、非特異的結合または部分一致)を計数し得る。このため、計数される分子が、複数回(または反復的に)結合する一過的な結合プローブによって検出されるデジタル計数アッセイがより好適である。複数の結合事象は、何か本物が検出されているという自信を与え、何が検出されているのか、またはいくつかの特徴の何が検出されているのか(例えば、部分一致)を決定することができる。 Some embodiments of the present invention are designed to solve problems in digital molecular counting. One problem in counting molecules is obtaining highly accurate and reproducible data. Due to the stochastic nature of molecular interactions, endpoint digital counting assays can miss specific events that are not present at the time endpoint measurements are taken, or they can be spurious events (e.g., non-specific binding or partial matches) can be counted. For this reason, digital counting assays are more suitable, in which the molecules to be counted are detected by transient binding probes that bind multiple (or repetitively). Multiple binding events provide confidence that something authentic is being detected and determine what is being detected or what of some feature is being detected (e.g. partial match). can be done.

したがって、一部の実施形態では、本発明は、試料中の分子の種類(例えば、特定の配列を含むDNA断片)の数を計数する(またはコピー数を決定する)方法を含み、
a)プローブが分子に一過的に結合することができる条件下で、1つ以上のプローブ種を添加することと、
b)検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、非認証相互作用をフィルタリング除去し、認証相互作用の数を決定し、それによって、分子のコピー数を決定することと、
d)任意選択的に、分子はステップaの前に、表面またはマトリックス上に固定化することと、を含む。
Thus, in some embodiments, the invention includes a method of counting the number (or determining the copy number) of a molecular class (e.g., a DNA fragment comprising a particular sequence) in a sample,
a) adding one or more probe species under conditions that allow the probe to transiently bind to the molecule;
b) continuously monitoring and recording individual binding events on the molecule with a detector over a period of time;
c) analyzing the data from step b to filter out non-authenticating interactions and determine the number of authenticating interactions, thereby determining the copy number of the molecule;
d) optionally, the molecule is immobilized on a surface or matrix prior to step a.

一部の実施形態では、ある種類の分子の列挙は、一過的な結合相互作用の出現特性の結果である。1つのプローブ結合事象または結合のエンドポイント決定は、分子の種類の数の真値を決定するのに十分ではなく、真正な決定は、もみ殻から小麦を分ける(真正な事象を非真正な事象から分ける)複数の結合事象(出現特性)の分析から生じる。 In some embodiments, enumeration of certain types of molecules is a result of the emergence properties of transient binding interactions. A single probe binding event or endpoint determination of binding is not sufficient to determine the true value of the number of molecular species, and a true determination separates wheat from the husk (a true event becomes a non-genuine event resulting from the analysis of multiple binding events (occurrence characteristics).

一部の実施形態では、本発明は、1つ以上のプローブと分子との間の相互作用を計数する方法であって、
a)プローブが分子に一過的に結合することができる条件下で、所与の特異性の1つ以上のプローブを添加することと、
b)検出器で、分子上の個々の結合事象を継続的に監視し、一定期間、記録することと、
c)ステップbからのデータを分析して、一定の期間中に生じた相互作用の数を決定することと、
d)任意選択的に、異なる特異性の1つ以上のプローブを添加し、ステップb~cを反復することと、
e)任意選択的に、ステップaの前に、分子が表面またはマトリックス上に固定化されることと、を含む。一部のかかる実施形態では、ステップcで、相互作用が、各相互作用の持続時間によって分類され、各分類に該当する事象の数が記録される。本実施形態は、例えば、配列と異なるプローブとの間の一致度が測定されている場合、有用であり得る。この実施形態は、真正な事象を非真正な事象と区別するために前の実施形態に適合され得る。
In some embodiments, the invention provides a method of counting interactions between one or more probes and a molecule comprising:
a) adding one or more probes of a given specificity under conditions that allow the probes to transiently bind to the molecule;
b) continuously monitoring and recording individual binding events on the molecule with a detector over a period of time;
c) analyzing the data from step b to determine the number of interactions that occurred over a period of time;
d) optionally adding one or more probes of different specificities and repeating steps b-c;
e) optionally, prior to step a, the molecule is immobilized on a surface or matrix. In some such embodiments, in step c, the interactions are classified by the duration of each interaction and the number of events falling into each classification is recorded. This embodiment can be useful, for example, when the degree of identity between a sequence and different probes is being measured. This embodiment can be adapted to the previous embodiment to distinguish genuine events from non-genuine events.

真正な事象を構成するもの、および非真正な事象を構成するものを決定するために、いくつかの基準を確立することができる。例えば、結合持続時間のカットオフは、真正な事象を非真正な事象から分離するための1つの基準である。 Several criteria can be established to determine what constitutes a genuine event and what constitutes a non-genuine event. For example, an association duration cutoff is one criterion for separating authentic events from non-authentic events.

測定する必要がある高密度の分子を含む混雑した視野に対処する、PAINTなどの特定の単一分子局在化方法では、位置決定の正確度は以下に依存する:(1)収集された光子の数(位置決定の程度は光子の数に反比例するため、サブナノメートルまたは低ナノメートルレベルへの位置決定を得るために多数の光子が必要である)、(2)低デューティサイクル(すなわち、各結合事象が持続する時間が短い)、これは、統計的には結合事象が確率的であるために、ほんの一部、したがって任意の所与の時間に、個別に解像可能なシグナルのみが遊離されることを意味する。 For certain single-molecule localization methods, such as PAINT, which deal with crowded fields containing dense molecules that need to be measured, the accuracy of localization depends on: (1) the photons collected; (the degree of localization is inversely proportional to the number of photons, so a large number of photons are needed to obtain localization to the subnanometer or low nanometer level), (2) a low duty cycle (i.e., each binding events are short-lived), this is due to the fact that binding events are statistically stochastic, so that at any given time only a small fraction, and thus at any given time, only individually resolvable signals are liberated. means to be

一部の代替的な実施形態では、分子の視野が混雑していない、もしくは高密度ではないか、または伸長または伸展されたポリマーに沿った部位がまばらである場合、低デューティサイクルは必要とされない。シグナルまたは検出可能な光子放出は、長寿命であり得、検出される持続時間は、単一分子局在化アルゴリズムを使用して位置決定を行うことができる範囲を決定する。より多くの光子を収集するために、長い露光時間を使用することができる。かかる実施形態では、プローブの光退色を最小化するために、パルス照明またはストロボ照明を使用することが有用である。また、色素からのシグナルは、しばしば、より低い波長の光による励起によって回収することができる。したがって、検出は、
1)波長1の照明、
2)シグナルの検出、
3)波長2の照明、および
4)位置決定に必要とされる十分な光子が収集されるまで、1~3を反復すること、を含む。
In some alternative embodiments, a low duty cycle is not required if the field of view of the molecules is not crowded or dense or the sites along the elongated or stretched polymer are sparse. . The signal or detectable photon emission can be long-lived, and the duration of detection determines the extent to which localization can be made using single-molecule localization algorithms. Long exposure times can be used to collect more photons. In such embodiments, it is useful to use pulsed or strobed illumination to minimize photobleaching of the probe. Signals from dyes can also often be recovered by excitation with lower wavelength light. Therefore, the detection is
1) illumination of wavelength 1;
2) detection of the signal;
3) illumination of wavelength 2; and 4) repeating 1-3 until enough photons required for position determination are collected.

これを配列決定に適用して、例えば、ポリヌクレオチドの長さに沿った5塩基長プローブの場所を決定する場合、配列ビットを数ナノメートルまで位置決定することができ、プローブのレパートリーの各々の場所を使用して、結合事象のレパートリーの場所の出現特性である、ポリヌクレオチドの配列をまとめることができる。一過的な結合を必要としないこの実施形態は、シグナルが、ナノメートルまたはサブナノメートル寸法まで局在化されるため、依然として新規である。 When this is applied to sequencing to determine, for example, the location of a 5-base long probe along the length of a polynucleotide, sequence bits can be located down to a few nanometers, and each of the repertoire of probes Locations can be used to summarize sequences of polynucleotides that are characteristic of occurrences of locations in a repertoire of binding events. This embodiment, which does not require transient binding, remains novel as the signal is localized down to nanometer or sub-nanometer dimensions.

一部の実施形態では、ポリヌクレオチドは、液体からゲルへの転移を起こし得る媒体を含むフローチャネル内に配置し、ポリヌクレオチドが十分に分散され個別に単離された後、ポリヌクレオチドをそれらの場所に固定するゾル-ゲル転移を誘導できるようにする。次いで、本発明のプローブをゲル相に捕捉されたポリヌクレオチドに適用することができる。ポリヌクレオチドが3Dに分散されるため(一方向に整列しているにもかかわらず)、光シート顕微鏡法などの撮像法を使用して2Dスライスを撮像することができる。 In some embodiments, the polynucleotides are placed in a flow channel containing a medium capable of undergoing a liquid-to-gel transition, and after the polynucleotides are sufficiently dispersed and individually isolated, the polynucleotides are transferred to their Make it possible to induce a sol-gel transition that locks in place. The probes of the invention can then be applied to the polynucleotides captured in the gel phase. Because the polynucleotides are distributed in 3D (albeit unidirectionally aligned), imaging methods such as light sheet microscopy can be used to image 2D slices.

一部の実施形態では、溶液は、液相および固相(またはゲル相)の2つの相を有する。ポリヌクレオチドは、最初に伸長され、液相中に分布し、次いで、相を固相/ゲル相に変えることによって(例えば、加熱によって、またはポリアクリルアミドの場合は補助因子を添加することによって、もしくは時間とともに)固定される。場合によっては、ポリヌクレオチドは、固相/ゲル相において伸長され得る。次に、本発明の配列決定化学を、固相において三次元で単離した静的ポリヌクレオチドに適用する。次いで、配列決定反応の検出は、共焦点顕微鏡、多光子顕微鏡、光シート顕微鏡、スピニングディスク共焦点顕微鏡などによって行われる。この実施形態は、試料中の実質的にすべての分子が配列決定される必要がある場合、特に関連性がある(表面に捕捉され得る分子だけではない)。ポリヌクレオチドは、ポリ(N-イソプロイルアクリルアミド)を含む媒体中で処理され、加熱は、3D空間でポリヌクレオチドを固定するが、ヒドロゲルを介して試薬の交換を可能にするヒドロゲルを生成する相転移につながる(Eriksen et al Biomicrofluidics 5:31101-311014,2011)。 In some embodiments, the solution has two phases, a liquid phase and a solid phase (or gel phase). Polynucleotides are first elongated and distributed in a liquid phase, and then by changing the phase to a solid/gel phase (e.g., by heating or by adding a cofactor in the case of polyacrylamide, or fixed over time). In some cases, the polynucleotide can be elongated in the solid/gel phase. The sequencing chemistry of the invention is then applied to static polynucleotides isolated in three dimensions on solid phase. Detection of the sequencing reaction is then performed by confocal microscopy, multiphoton microscopy, light sheet microscopy, spinning disk confocal microscopy, and the like. This embodiment is particularly relevant when substantially all molecules in the sample need to be sequenced (not just those that can be captured on the surface). Polynucleotides are treated in a medium containing poly(N-isopropylacrylamide) and heating produces a hydrogel that immobilizes the polynucleotide in 3D space but allows the exchange of reagents through the hydrogel during a phase transition. (Eriksen et al Biomicrofluidics 5:31101-311014, 2011).

一部の実施形態では、ポリマーは、一端で捕捉され、次いで、ポリマーが配置される液体媒体の流れによるポリマー上の力に起因して、直線化または伸展される。液相/ゾル相がゲル相に転移することで、分子は静的になる。 In some embodiments, the polymer is trapped at one end and then straightened or stretched due to forces on the polymer due to the flow of the liquid medium in which the polymer is placed. The transition from the liquid/sol phase to the gel phase renders the molecule static.

いくつかの方法では、ポリマーがゲル中に配置されるか、またはゲル中に配置されることになる場合、ポリマーの長さに沿った特徴(例えば、配列ブットまたはアミノ酸)の相対的に固定されたまたは静的な位置により、ポリマーの長さに沿った標識の場所を単一分子局在化方法によって決定することができるようになる。 In some methods, the relative fixation of features (e.g., sequence blocks or amino acids) along the length of the polymer when the polymer is placed or will be placed in the gel. Alternatively, static positioning allows the location of the label along the length of the polymer to be determined by single-molecule localization methods.

したがって、これらの実施形態は、
I)ポリヌクレオチドを、ゲルまたはマトリックス中で一方向に整列することと、
II)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、ゲルまたはマトリックスを通して、所与の特異性の蛍光オリゴを流すことと、
III)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、ゲルまたはマトリックスを通して、異なる特異性の蛍光オリゴを流すことと、
IV)ステップIIIを反復することと、
V)各特異性のオリゴの結合場所に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む。
Accordingly, these embodiments are
I) unidirectionally aligning the polynucleotides in a gel or matrix;
II) flowing fluorescent oligos of given specificity through a gel or matrix so that the oligos can undergo transient interactions with the polynucleotide;
III) flowing fluorescent oligos of different specificities through a gel or matrix so that the oligos can undergo transient interactions with polynucleotides;
IV) repeating step III;
V) using the information about the binding location of each specific oligo to determine the sequence of the target polynucleotide.

一部の実施形態では、配列情報は、制限酵素、ニッキングエンドヌクレアーゼ、およびメチルトランスフェラーゼなどの配列特異的核酸結合タンパク質の一過的な結合によって取得される。そのようなタンパク質の大量のレパートリーが市販されており、配列空間の多くをカバーしている。回文配列を認識する多数の配列酵素が利用可能である。前述の3つのタンパク質の1つの特徴は、それらが、二本鎖DNAの配列を認識することである。これらのプローブは、完全なレパートリーからのいくつかのオリゴヌクレオチド、例えば、(通常の反応条件下で、それらを比較的非効率的なプローブにさせる自己相互作用またはヘアピン相互作用を起こすいくつかのオリゴヌクレオチド)を置き換えるために使用され得る。 In some embodiments, sequence information is obtained by transient binding of sequence-specific nucleic acid binding proteins such as restriction enzymes, nicking endonucleases, and methyltransferases. A large repertoire of such proteins is commercially available, covering much of the sequence space. A number of sequence enzymes are available that recognize palindrome sequences. One characteristic of the three proteins mentioned above is that they recognize sequences of double-stranded DNA. These probes consist of several oligonucleotides from the complete repertoire, e.g., several oligos that under normal reaction conditions undergo self-interactions or hairpin interactions, making them relatively inefficient probes. nucleotides).

抗体または結合タンパク質の一過的な結合は、塩濃度などの反応条件の操作によってもたらされ得る。一部の実施形態では、一過的な結合をもたらすために、塩濃度が、100mM超に上げられる。一部の実施形態では、塩濃度が、200mM超に上げられる。一部の実施形態では、塩濃度が、300mM超に上げられる。一部の実施形態では、一過的な結合は、緩衝液を低塩から高塩に交換することによって能動的に行われる。一部の実施形態では、配列または修飾(例えば、メチル化)特異的結合タンパク質は、安定した結合または一過的な結合を可能にし、それらの場所は、それらにコンジュゲートされた標識の単一分子局在化によって、またはタンパク質への直接的なもしくはタグを介した結合よって、決定される。 Transient binding of antibody or binding protein can be effected by manipulation of reaction conditions such as salt concentration. In some embodiments, the salt concentration is increased above 100 mM to provide transient binding. In some embodiments, the salt concentration is raised above 200 mM. In some embodiments, the salt concentration is raised above 300 mM. In some embodiments, transient binding is performed actively by buffer exchange from low salt to high salt. In some embodiments, the sequence- or modified (e.g., methylated) specific binding proteins allow stable or transient binding, and their location is associated with a single Determined by molecular localization or by direct or tag-mediated conjugation to the protein.

一部の実施形態では、逆の反応を行い、プローブを固定化し、溶液中の分子(分析される標的)との一過的な相互作用が決定される。 In some embodiments, the reverse reaction is performed, probes are immobilized, and transient interactions with molecules in solution (targets to be analyzed) are determined.

本発明の一部の実施形態では、分子は、表面またはマトリックス上に固定化されておらず、溶液中で自由に拡散している。検出は、蛍光相関分光法(FCS)によって実行される。一部のかかる実施形態では、分子(例えば、より大きく、かつ)は、プローブよりもゆっくりと溶液中を移動する。したがって、各共焦点スポットにおいて、分子が共焦点スポットから拡散する前に、プローブと分子との多くの推定結合事象を記録することができ、これらの結合事象は相互相関となる。結合相互相関は、共焦点スポットにおけるプローブの滞在時間によって、非結合相互相関から区別することができる。一部の実施形態では、オリゴのコード化されたレパートリーが提供され、結合オリゴの同一性(これは、統計的に一度に1つずつ生じる)は、蛍光結合シグナルをデコードすることによって決定される。 In some embodiments of the invention, molecules are not immobilized on a surface or matrix and are freely diffusing in solution. Detection is performed by fluorescence correlation spectroscopy (FCS). In some such embodiments, molecules (eg, larger and) move through solution more slowly than probes. Therefore, in each confocal spot, many putative binding events between probe and molecule can be recorded before the molecule diffuses out of the confocal spot, and these binding events are cross-correlated. Bound cross-correlation can be distinguished from unbound cross-correlation by the dwell time of the probe in the confocal spot. In some embodiments, an encoded repertoire of oligos is provided and the identity of bound oligos (which statistically occurs one at a time) is determined by decoding the fluorescent binding signal. .

一部のかかる実施形態では、本方法は、
I)ポリヌクレオチドを、溶液中に添加することと、
II)単一のポリヌクレオチドを単離する共焦点領域(confocal volume)に照射することと、
III)オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、所与の特異性の蛍光オリゴを流すか、またはアンケージすることと、
IV)オリゴがポリヌクレオチドと一過的な相互作用を行い、それらの結合特性が決定され得るように、異なる特異性の蛍光オリゴを流すか、またはアンケージすることと、
V)ステップIVを反復することと、
VI)各特異性のオリゴについて検出された結合事象の持続時間および存続時間に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む。
In some such embodiments, the method comprises:
I) adding the polynucleotide into the solution;
II) illuminating a confocal volume that isolates a single polynucleotide;
III) flowing or uncaging fluorescent oligos of given specificity so that the oligos can undergo transient interactions with the polynucleotide;
IV) flowing or uncaging fluorescent oligos of different specificities so that the oligos undergo transient interactions with polynucleotides and their binding properties can be determined;
V) repeating step IV;
VI) using information about the duration and duration of binding events detected for each specific oligo to determine the sequence of the target polynucleotide.

一部の実施形態では、結合特性は、所定の閾値を超える結合持続時間が生じるかどうかを含む。 In some embodiments, the binding characteristic includes whether a binding duration exceeding a predetermined threshold occurs.

一部の実施形態では、ポリヌクレオチドは溶液中に留まり、そのバルクは、それが比較的同じ場所または共焦点領域内に留まることを可能にし、レパートリーのオリゴは、その体積を1つずつ(またはセットごとに設定される)通過するか、または、好ましくは、コード化されたレパートリーとしてすべて同時に添加される。一部の実施形態では、ポリヌクレオチドのバルクを、物理的トラップ(例えば、レーザトラッピング、静電トラッピング)によって、固定場所にトラップされるようにする。一部の実施形態では、複数のポリヌクレオチドは、複数の光トラップによって個別に捕捉され得る。 In some embodiments, the polynucleotide remains in solution, its bulk allows it to remain relatively in the same place or within a confocal region, and the oligos of the repertoire divide its volume one by one (or set by set) or, preferably, added all at once as a coded repertoire. In some embodiments, the bulk of the polynucleotide is made trapped to a fixed location by physical trapping (eg, laser trapping, electrostatic trapping). In some embodiments, multiple polynucleotides can be individually captured by multiple optical traps.

一部の実施形態では、ポリヌクレオチドは、容器内(例えば、非混和性脂質小胞内)に拘束される。容器は、プローブの交換を可能にし得るが、ポリヌクレオチドを散逸させない。 In some embodiments, the polynucleotide is confined within a container (eg, within an immiscible lipid vesicle). The container may allow exchange of probes but does not dissipate the polynucleotides.

一部の実施形態では、共焦点領域は、多光子領域(multi-photon volume)である。 In some embodiments, the confocal volume is a multi-photon volume.

一部の実施形態では、溶液中のポリマーは、定常ではなく、ポリマーは、レパートリーの異なるプローブを有する十分に離れたフローストリーム(例えば、層流ストリーム)の方向に対して垂直の方向に移動する。移動は、電気泳動(すなわち、正のバイアス電極に向かって)であり、ポリヌクレオチドの移動方向によって軌道が著しく影響されないフローストリーム中で、オリゴよりも高分子量のポリヌクレオチドに作用する。 In some embodiments, the polymer in solution is not stationary and the polymer moves in a direction perpendicular to the direction of a well-separated flow stream (e.g., a laminar stream) that has a different repertoire of probes. . Migration is electrophoretic (ie, toward a positively biased electrode) and acts on polynucleotides of higher molecular weight than oligos in a flow stream whose trajectory is not significantly affected by the direction of polynucleotide migration.

一部の実施形態では、ポリヌクレオチドは、一端のみで固定化されているが、表面に平行なフローストリーム(または、例えば、光学的に捕捉されたビーズに固定化されたときの2D検出面)中で伸展され、一端以外のその長さに沿った場所からの、長寿命の表面との相互作用をしない。一部の実施形態では、一端で固定化されたポリヌクレオチドは、一本鎖である。次いで、レパートリーのオリゴを流体量で交換する。一部の実施形態では、オリゴの流れの方向は、ポリヌクレオチドの伸長方向と同じである。一部の実施形態では、個々のオリゴ分子の検出可能な繰り返しの一過的な結合は、オリゴの大部分が流れの方向に沿って移動しているときであっても、伸長ポリマーの相補的な場所に生じる。 In some embodiments, polynucleotides are immobilized at only one end, but in a flow stream parallel to the surface (or, for example, a 2D detection surface when immobilized to optically captured beads). It extends inside and does not interact with the long-lived surface from anywhere along its length other than at one end. In some embodiments, the polynucleotide immobilized at one end is single stranded. The oligos in the repertoire are then exchanged in fluid amounts. In some embodiments, the direction of oligo flow is the same as the direction of polynucleotide elongation. In some embodiments, the detectable repeated transient binding of individual oligomolecules leads to the complementary binding of the elongated polymer even when the majority of the oligos are moving along the direction of flow. occurs in a particular place.

一部の実施形態では、ポリヌクレオチドは、その固定化地点から、流れの方向に対して垂直に伸展される。これは、流れの方向に対して垂直に電場を提供することによって実現することができる。流れは、1ミリバールから最大1バールの圧力を印加することによって、圧力駆動の流れによってもたらされ、電場は、1センチメートル当たり1~100ボルトであり得、固定化されたポリヌクレオチドの末端を負にし、フローセルの別の表面を正にして、そちらにポリヌクレオチドが引き寄せられる。 In some embodiments, the polynucleotide is extended perpendicular to the direction of flow from its point of immobilization. This can be achieved by providing an electric field perpendicular to the direction of flow. Flow is effected by pressure-driven flow by applying a pressure of 1 millibar up to 1 bar, the electric field can be 1-100 volts per centimeter, and the ends of the immobilized polynucleotides are shunted. One surface of the flow cell is made negative and the other surface of the flow cell is made positive to which the polynucleotides are attracted.

一部のかかる実施形態では、本方法は、
I.ポリヌクレオチドを、一方の末端で表面に付着させ、物理的機構によって、一方向に伸長させることと、
II.オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、所与の特異性の蛍光オリゴを流すことと、
III.オリゴがポリヌクレオチドと一過的な相互作用を行うことができるように、異なる特異性の蛍光オリゴを流すことと、
IV.ステップIIIを反復することと、
V.各特異性のオリゴについて検出された結合事象の持続時間および存続時間に関する情報を使用して、標的ポリヌクレオチドの配列を決定することと、を含む
In some such embodiments, the method comprises:
I. attaching a polynucleotide at one end to a surface and extending it in one direction by a physical mechanism;
II. flowing fluorescent oligos of given specificity so that the oligos can undergo transient interactions with the polynucleotide;
III. flowing fluorescent oligos of different specificities so that the oligos can undergo transient interactions with the polynucleotide;
IV. repeating step III;
V. using information about the duration and duration of binding events detected for each specific oligo to determine the sequence of the target polynucleotide.

一部の実施形態では、物理的機構は、ポリヌクレオチドの一端に付着されたかさばる実体(例えば、ビーズ)に対する作用による、フロー伸展、電気泳動伸展、または伸展である。次いで、かさばる実体は、レーザトラッピング、静電トラッピング(帯電している場合)、磁気トラッピング(常磁性の場合)に供され得る。 In some embodiments, the physical mechanism is flow extension, electrophoretic extension, or extension by action on a bulky entity (eg, a bead) attached to one end of the polynucleotide. The bulky entity can then be subjected to laser trapping, electrostatic trapping (if charged), magnetic trapping (if paramagnetic).

上記の方法のポリヌクレオチドがゲノムDNAである場合、本方法は、染色体をアセンブリするために重複してアセンブリされたポリヌクレオチド配列をさらに含むことができる。 When the polynucleotides of the above methods are genomic DNA, the methods can further include redundantly assembled polynucleotide sequences to assemble the chromosome.

一部の実施形態では、本発明は、分析用の生体高分子を送達するための方法に関し、
1.生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2.生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3.生体高分子を、保護実体から分析ゾーンに放出することと、
4.本発明に記載の方法に従って、生体高分子を分析することと、を含む。
In some embodiments, the present invention relates to a method for delivering biopolymers for analysis, comprising:
1. providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
2. placing a protective entity comprising a biopolymer proximate to the analysis zone;
3. releasing the biopolymer from the protective entity into the analysis zone;
4. and analyzing the biopolymer according to the method of the invention.

一部の実施形態では、プローブは、定義された1つのヌクレオチド(例えば、NNNXNNN(式中、Xは、定義されたまたはコードヌクレオチドである))に従って標識される。一部の実施形態では、NNNXNNNオリゴのレパートリーは、位置X位は、A、C、G、またはTを含み、位置Nは、A、C、G、およびTのうちの1つである。オリゴの中央塩基は、その同一性、A、C、G、またはTに従って差次的に標識される。一部の実施形態では、NNNXNNNオリゴの4つのライブラリ(例えば、各ライブラリは、オリゴヌクレオチドのセット:NNNANNN、NNNTNNN、NNNGNNN、およびNNCNNNを含む)は、それぞれ差次的に標識され、配列決定プロセス中に試薬交換を必要としない均一な反応で使用される。 In some embodiments, probes are labeled according to a single defined nucleotide (eg, NNNXNNN, where X is a defined or coding nucleotide). In some embodiments, the repertoire of NNNXNNN oligos position X comprises A, C, G, or T and position N is one of A, C, G, and T. The central base of the oligo is differentially labeled according to its identity, A, C, G, or T. In some embodiments, four libraries of NNNXNNN oligos (e.g., each library comprising a set of oligonucleotides: NNNANNN, NNNTNNN, NNNGNNN, and NNCNNN) are each differentially labeled and used in homogeneous reactions that do not require reagent exchange.

相補的核酸配列(例えば、オリゴプローブ)を使用して、核酸配列を検出することは非常に容易である。オリゴヌクレオチドによって結合される配列(例えば、5塩基)は、本明細書において配列ビットと称される。いくつかのアッセイ、例えば、Fodorの遺伝子チップアッセイ(例えば、Chee et al Science 274:610-4.1996に記載されている)において、プローブは固定化され、標的は標識され、溶液中で提供される。多くの他のアッセイにおいて、標的は固定化され、プローブは標識され、溶液中で提供される(例えば、サザンブロットを介して、Southern EM,Journal of Molecular Biology,98:503-517(1975)に記載されている)。かかるアッセイでは、プローブは、ワトソン-クリック相互作用によって標的核酸配列にハイブリダイズし、過剰の標識プローブを洗い流し、残りの結合プローブを検出する。ハイブリダイゼーションは、洗浄に耐え、検出中に所定の位置に留まるのに十分に安定した正しい結合を必要とする。固定化ポリヌクレオチドを配列決定するための方法は、オリゴヌクレオチドのレパートリーのハイブリダイゼーションによってのみ提案されており(例えば、Drmanac et al Science,260,1649-1652,1993に記載されている)、この「ハイブリダイゼーションによる配列決定」(SbH)アプローチは、小さなゲノムの再配列決定について実証されている(例えば、Pihlak et al Nature,Biotechnlogy 26:676-684 2008に記載されている)。Mir(WO2002/074988,2001)は、表面に伸展されたポリヌクレオチドのSbHをさらに提供する。前述のプロービングおよび配列決定方法のすべては、エンドポイントアッセイであり、プローブが相補ポリヌクレオチド標的との長寿命相互作用を形成することを必要とする。任意の核酸相互作用はオフ速度を有するが、核酸アッセイの場合、オフ速度は、アッセイに顕著な影響を及ぼさない程度に遅い。プローブが安定して結合している場合、一連の次のプローブをハイブリダイズする前に、厳密な剥離プロトコル(高温を含む)を伴う特定のステップを行って、プローブを除去する必要がある。厳しい条件は、DNAを損傷するか、または標的DNAを表面から除去する可能性があり、本発明者の経験から、かなりの量のプローブが、有効に、永久に固着したままである。 It is very easy to detect nucleic acid sequences using complementary nucleic acid sequences (eg oligoprobes). A sequence (eg, 5 bases) bound by an oligonucleotide is referred to herein as a sequence bit. In some assays, such as Fodor's gene chip assay (described, for example, in Chee et al Science 274:610-4.1996), probes are immobilized and targets are labeled and provided in solution. be. In many other assays, targets are immobilized and probes are labeled and provided in solution (e.g., via Southern blotting, see Southern EM, Journal of Molecular Biology, 98:503-517 (1975)). Have been described). In such assays, probes hybridize to target nucleic acid sequences by Watson-Crick interactions, excess labeled probe is washed away, and residual bound probe is detected. Hybridization requires correct binding that is stable enough to survive washing and remain in place during detection. Methods for sequencing immobilized polynucleotides have only been proposed by hybridization of repertoires of oligonucleotides (described, for example, in Drmanac et al Science, 260, 1649-1652, 1993), and this " A "sequencing by hybridization" (SbH) approach has been demonstrated for resequencing of small genomes (described, for example, in Pihlak et al Nature, Biotechnology 26:676-684 2008). Mir (WO2002/074988, 2001) further provides SbH of surface-extended polynucleotides. All of the probing and sequencing methods described above are endpoint assays and require probes to form long-lived interactions with complementary polynucleotide targets. Any nucleic acid interaction has an off-rate, but for nucleic acid assays, the off-rate is slow enough not to significantly affect the assay. If the probe is stably bound, certain steps involving a rigorous detachment protocol (including high temperature) must be performed to remove the probe before hybridizing the next probe in the series. Harsh conditions can damage the DNA or remove the target DNA from the surface, and in our experience, a significant amount of the probe effectively remains permanently anchored.

本発明は、新規の反直観的な配列決定アプローチであり、プローブと標的配列との短命なワトソン-クリック相互作用を伴う。プローブの化学構造(例えば、配列、3D構造)は、使用される条件下で長寿命の安定した相互作用を形成しないように設計される。むしろ、プローブ分子の大部分が標的に結合し、次いで、検出プロセス中に解離するように設計される。これは、プローブの大部分が検出中に結合したままであると予想されるハイブリダイゼーションとは異なる。 The present invention is a novel counter-intuitive sequencing approach that involves short-lived Watson-Crick interactions between probes and target sequences. The chemical structure (eg, sequence, 3D structure) of the probe is designed so that it does not form long-lived stable interactions under the conditions used. Rather, the majority of probe molecules are designed to bind to the target and then dissociate during the detection process. This is in contrast to hybridization where most of the probe is expected to remain bound during detection.

本発明のステップは、配列決定におけるハイブリダイゼーションベースの試みが、安定した長寿命の結合を伴う場合、本アプローチは、特に、短寿命の不安定な結合を必要とするという事実を含む。照合塩基が5個という短いオリゴヌクレオチドの不安定で一過的な反復した結合のための条件が見出され、オリゴヌクレオチドは、全レパートリー(1024個のオリゴ)を容易に生成し、かつ実行するのに十分に短い。 A step of the present invention involves the fact that when hybridization-based approaches in sequencing involve stable long-lived bonds, the present approach particularly requires short-lived labile bonds. Conditions were found for labile, transient and repetitive binding of oligonucleotides as short as 5 reference bases, which readily generated and performed the entire repertoire (1024 oligos). short enough for

本発明は、SbHといくつかの類似点を有するが、それは、SbHの固有の問題に悩まされない:1つのプローブが結合したら、例えば、5塩基長のそのフットプリントは、5塩基の配列をカバーし、結合から5塩基のフットプリントと部分的に重複する他のプローブを阻害または妨害する。一度に1つのプローブのみを使用する場合であっても、プローブのサブ配列がタンデムに繰り返されている場合、第1の結合オリゴは、隣接位置から情報が得られないようにする。しかしながら、本発明は一過的な結合を伴うため、第1のプローブが外れ、第2のプローブによる結合のたに配列がアクセス可能になり、第2のプローブが外れ、第3の結合が可能になる、などである。本アプローチの別の利点は、各配列ビットの真偽が、反復結合によって検証されることである。しかし、SbHの場合、一旦何かが結合すると、固着してしまい、それが特異的結合または非特異的結合の結果であるのかを決定することが困難になる。加えて、不一致の安定した結合は、SbHに問題を引き起こすが、本発明の場合、不一致は、結合の持続時間、長い持続時間の結合の頻度などによって完全一致と区別することができる。場合によっては、不一致(例えば、4塩基)は、ワトソン-クリック塩基対を形成し得、5番目の塩基は、塩基対を形成しない。他の場合では、例えば、4は、ワトソン-クリック塩基対を形成し得、5番目は、非ワトソン-クリック塩基対を形成し得る。場合によっては(例えば、非ワトソン-クリック結合が形成される場合)、いくつかのワトソン-クリック塩基対および1つ以上の非ワトソン-クリック塩基対を有する非完全一致は、実際には、完全一致よりもより安定な相互作用を形成する場合があり、結合の平均持続時間がより長いこともある。すべてのそのような可能性に関する経験的なデータを収集することで、本発明の配列決定技術の性能が改善されるであろう。機械学習を使用して、フルセットの挙動を予測するために、そのような挙動を実験のサブセットから学習することができる。 Although the present invention has some similarities with SbH, it does not suffer from the inherent problems of SbH: once one probe binds, its footprint, e.g., 5 bases long, covers a sequence of 5 bases. and inhibits or interferes with other probes that partially overlap the footprint of 5 bases from binding. Even if only one probe is used at a time, the first binding oligo prevents information from adjacent positions if the probe subsequences are repeated in tandem. However, since the present invention involves transient binding, the first probe is dislodged, making the sequence accessible for binding by a second probe, and the second probe is dislodged, allowing a third binding. and so on. Another advantage of this approach is that the truth of each array bit is verified by iterative joins. However, in the case of SbH, once something binds, it sticks, making it difficult to determine whether it is the result of specific or non-specific binding. In addition, stable binding of mismatches poses problems for SbH, but in the present case, mismatches can be distinguished from perfect matches by the duration of binding, the frequency of long-duration binding, etc. In some cases, a mismatch (eg, 4 bases) can form a Watson-Crick base pair, and the fifth base does not base pair. In other cases, for example, 4 may form a Watson-Crick base pair and the 5 may form a non-Watson-Crick base pair. In some cases (e.g., when non-Watson-Crick bonds are formed), a non-perfect match with several Watson-Crick base pairs and one or more non-Watson-Crick base pairs is actually a perfect match. may form interactions that are more stable than each other, and the average duration of binding may be longer. Collecting empirical data on all such possibilities will improve the performance of the sequencing techniques of the invention. Using machine learning, such behavior can be learned from a subset of experiments in order to predict the behavior of the full set.

本発明の短いオリゴヌクレオチドの使用は、標的配列の探索が、典型的には、3、4、5、または6個の一致の発見を伴うという利点を有しており、これは、非常に迅速に起こり得、標的配列の出現がかなり頻繁である。一部の実施形態では、実質的にすべての一致部位および不一致部位は、検出の過程で一過的に結合されるが、一部の実施形態では、一部の部位のみが結合される。 The use of short oligonucleotides of the invention has the advantage that searching for a target sequence typically involves finding 3, 4, 5, or 6 matches, which is very rapid. and the occurrence of the target sequence is fairly frequent. In some embodiments, substantially all of the matched and mismatched sites are transiently bound during the course of detection, while in some embodiments only some of the sites are bound.

本発明のポリヌクレオチド配列決定は、オリゴのレパートリーの結合特性の出現特性である。概して、SbHおよびハイブリダイゼーションアッセイは、合成オリゴヌクレオチドのその標的天然ポリヌクレオチドへのワトソン-クリックルールによる完全一致の結合から情報を取得し、不一致を含む結合の除去に努める。本発明の一部の実施形態は、各オリゴヌクレオチドが分析下のポリヌクレオチドと有した結合相互作用のレパートリー(閾値結合持続時間を超える)を調べる。一部の実施形態では、配列決定は、完全一致からの配列の繋ぎ合わせまたは再構築を含むだけでなく、各オリゴの結合傾向を分析することによって配列を得る。本方法は、各オリゴ種の結合傾向:オン・オフ結合の速度および持続時間(プローブが部位と結合を形成する塩基対の種類および数の関数である)を測定するために、一意に設定される。要約すると、オリゴと、オリゴが完全な塩基対合または完全一致を形成する部位との反復的な結合相互作用は、プローブのいくつかの塩基が標的と対合しない不一致を形成する場所とは異なる傾向があり、ほとんどの場合、不一致部位への結合は、完全一致部位よりも短命な傾向がある。経験的データを使用して、特定の外れ値(ワトソン-クリック不一致結合がワトソン-クリック一致結合よりも長命である)に対する期待値を修正する。本発明のアルゴリズムは、これを考慮に入れることができる。 Polynucleotide sequencing of the present invention is an emerging property of binding properties of a repertoire of oligos. Generally, SbH and hybridization assays derive information from perfect match binding of a synthetic oligonucleotide to its target natural polynucleotide by the Watson-Crick rule and seek to eliminate binding containing mismatches. Some embodiments of the invention examine the repertoire of binding interactions (over a threshold binding duration) that each oligonucleotide has with the polynucleotide under analysis. In some embodiments, sequencing involves splicing or reconstructing sequences from perfect matches as well as obtaining sequences by analyzing the binding propensity of each oligo. The method was uniquely set up to measure the binding propensity of each oligo species: rate and duration of on-off binding, which is a function of the type and number of base pairs with which the probe forms a bond with the site. be. In summary, repetitive binding interactions between oligos and sites where the oligos form perfect base pairs or perfect matches are distinct from where some bases of the probe form mismatches that do not match the target. In most cases, binding to mismatch sites tends to be shorter-lived than to perfect match sites. Empirical data are used to modify expectations for certain outliers (Watson-Crick discordant bonds outlast Watson-Crick concordant bonds). The algorithm of the invention can take this into account.

本発明の一部の実施形態では、検出ステップは、プローブのオン結合およびオフ結合が記録されるいくつかの画像フレーム(例えば、動画またはビデオ)を取ることを伴う。 In some embodiments of the invention, the detection step involves taking a number of image frames (eg, movie or video) in which the on- and off-bindings of the probe are recorded.

一部の実施形態では、検出ステップは、各相補的部位への複数のオン結合事象およびオフ結合事象を検出することを伴う。複数の事象は、同じプローブ分子のオン結合またはオフ結合によるものか、または同じ特異性を有する別の分子(すなわち、同じ配列または分子構造に特異的である)に置換されたものであり、これは、複数回生じ得る。オン結合またはオフ結合は、条件の変化によって影響されず、オン結合およびオフ結合の両方は、同じ条件(塩濃度、温度など)下で生じ、プローブ標的相互作用が弱いため、結合が一過性であることに起因する。 In some embodiments, the detecting step involves detecting multiple on- and off-binding events to each complementary site. Multiple events are due to on- or off-binding of the same probe molecule, or displaced by another molecule with the same specificity (i.e., specific for the same sequence or molecular structure). can occur multiple times. On- or off-binding is unaffected by changes in conditions, both on- and off-binding occur under the same conditions (salt concentration, temperature, etc.) and binding is transient due to weak probe-target interactions due to being

本発明の一部の実施形態では、配列決定は、プローブ長のより短い、同じ長さの、または1桁以内の単一の標的ポリヌクレオチド上の複数の場所での複数のオン・オフ結合事象を撮像することによって行われる。かかる実施形態では、より長い標的ポリヌクレオチドが断片化されているか、または断片のパネルが事前に選択され、表面に配列されており、そのため、各ポリヌクレオチド分子が個別に解像可能である。これらの場合、プローブが特定の場所に結合する頻度または持続時間を使用して、プローブが標的配列に対応するかどうかを判定する。プローブ結合の頻度または持続時間は、プローブが標的配列のすべてまたは一部(残りの塩基が不一致である)に対応するかどうかを決定することもできる。 In some embodiments of the invention, sequencing includes multiple on-off binding events at multiple locations on a single target polynucleotide of shorter, the same length, or within an order of magnitude of probe length. is performed by imaging the In such embodiments, longer target polynucleotides are fragmented or panels of fragments are pre-selected and arrayed on a surface so that each polynucleotide molecule is individually resolvable. In these cases, the frequency or duration of probe binding to a particular location is used to determine whether the probe corresponds to the target sequence. The frequency or duration of probe binding can also determine whether the probe corresponds to all or part of the target sequence (with the remaining bases mismatched).

本発明の一部の実施形態では、配列決定は、プローブよりも長い単一の標的ポリヌクレオチド上の複数の場所での複数のオン・オフ結合事象を撮像することによって行われる。一部の実施形態では、単一のポリヌクレオチド上のプローブ結合事象の場所が決定される。一部の実施形態では、単一のポリヌクレオチド上のプローブ結合事象の場所は、標的ポリヌクレオチドを伸長することによって決定され、その長さに沿った異なる場所が検出され、解像され得る。一部の実施形態では、伸長は、表面上で生じる。一部の実施形態では、伸長は、ナノチャネル中で生じる。一部の実施形態では、伸長は、標的の一方または両方の末端が張力下にある場合、流体力学的抗力によって生じる。一部の実施形態では、伸長は、電気泳動力を介して生じ、例えば、標的ポリヌクレオチドの一端が繋がれている、繋留されている、または捕捉されている場合、他端は、溶液またはゲル中で自由にぶら下がっている。 In some embodiments of the invention, sequencing is performed by imaging multiple on-off binding events at multiple locations on a single target polynucleotide that is longer than the probe. In some embodiments, the location of probe binding events on a single polynucleotide is determined. In some embodiments, the location of probe binding events on a single polynucleotide can be determined by extending the target polynucleotide and different locations along its length can be detected and resolved. In some embodiments, elongation occurs on a surface. In some embodiments, elongation occurs in a nanochannel. In some embodiments, elongation occurs by hydrodynamic drag when one or both ends of the target are under tension. In some embodiments, elongation occurs via electrophoretic forces, e.g., when one end of the target polynucleotide is tethered, tethered, or captured, the other end is hanging freely inside.

一部の実施形態では、標識されたプローブのオン・オフ結合は、結合されていないプローブからのシグナルの拒絶または除去を必要とする。これは、例えば、照明のためにエバネッセント場または波導を使用することによって、または共鳴エネルギー移動(RET、例えば、蛍光またはフォースターRET)を利用することによって、または光活性化を利用することによって、行うことができる(例えば、Biophys J.2015 Feb 17;108(4):949-956に記載されている)。 In some embodiments, on-off binding of labeled probes requires rejection or removal of signal from unbound probes. This can be done, for example, by using evanescent fields or waves for illumination, or by taking advantage of resonance energy transfer (RET, e.g., fluorescence or Forster RET), or by taking advantage of photoactivation. (eg, described in Biophys J. 2015 Feb 17;108(4):949-956).

一部の実施形態では、プローブは標識されないが、標的との相互作用は、結合が生じるか、または生じたときに二重鎖に挿入される挿入色素などのDNA染色によって検出される。1つ以上の挿入色素は、二重鎖に挿入され得る。挿入された場合、挿入色素が発する蛍光は、溶液中に遊離している挿入色素による蛍光よりも桁違いに大きくなり得る。例えば、挿入されているYOYO-1色素からのシグナルは、溶液中の遊離したYOYO-1色素からのシグナルよりも約100倍大きい。 In some embodiments, the probe is unlabeled, but interaction with the target is detected by a DNA stain such as an intercalating dye that intercalates into the duplex when binding occurs or occurs. One or more intercalating dyes can intercalate into the duplex. When intercalated, the fluorescence emitted by the intercalating dye can be orders of magnitude greater than the fluorescence from the intercalating dye free in solution. For example, the signal from intercalated YOYO-1 dye is approximately 100-fold greater than the signal from free YOYO-1 dye in solution.

本発明のこの態様は、軽く染色された(またはある程度の光退色の後)二本鎖ポリヌクレオチドが撮像される場合、単一の挿入色素分子に対応する可能性が高い、ポリヌクレオチドに沿った個々のシグナルが観察され得るという、観察の実施によって最初に動機づけられたものである。二重鎖中のYOYO-1色素の交換を容易にし、明るいシグナルを得るために、結合緩衝液中に、sおよびアスコルビン酸を含む酸化還元系(ROX)が提供され得る。 This aspect of the invention provides that when a lightly stained (or after some degree of photobleaching) double-stranded polynucleotide is imaged, the It was initially motivated by the observational practice that individual signals can be observed. A redox system (ROX) comprising s and ascorbic acid can be provided in the binding buffer to facilitate exchange of the YOYO-1 dye in the duplex and to obtain a bright signal.

一部の実施形態では、配列決定は、伸長ポリヌクレオチドを、次々に提供されるプローブの完全な配列レパートリーの各々からの一過的な相互作用に供することを含む(1つのプローブ配列を有する溶液が除去され、次のプローブ有する溶液が添加される)。一部の実施形態では、各プローブの結合は、プローブが一過的に結合することを可能にする条件下で行われる。したがって、例えば、1つのプローブに対して25℃、次のプローブに対して30℃で、結合が行われる。また、プローブは、セットで結合することができ、例えば、ほぼ同じ方法で、一過的に結合するすべてのプローブは、セットに集められ、一緒に使用され得る。一部のかかる実施形態では、セットの各プローブ配列は、差次的に標識されるか、または差次的にコード化される。 In some embodiments, sequencing comprises subjecting extended polynucleotides to transient interactions from each of a complete sequence repertoire of probes provided in turn (a solution with one probe sequence is removed and the solution with the next probe is added). In some embodiments, binding of each probe is performed under conditions that allow the probe to bind transiently. Thus, for example, binding is performed at 25° C. for one probe and 30° C. for the next. Also, probes can be bound in sets, eg, all probes that are transiently bound in much the same way can be assembled into sets and used together. In some such embodiments, each probe sequence of the set is differentially labeled or differentially encoded.

一部の実施形態では、または場合によっては、標的の場所への複数の結合事象は、単一のプローブ配列からではなく、レパートリーからのデータを分析し、部分的に重複する配列から生じる事象を考慮することによって決定される。例えば、同じ場所に(実際には、サブナノメトリック的に近い)、プローブATTAAGおよびTTAAGCが結合している。それらは、6塩基長であり、共通の5塩基配列を共有し、それぞれが他方を検証するとともに、5塩基のいずれかの側で配列が1塩基伸びている。場合によっては、5塩基配列の各側の1塩基は、不一致であり(末端における不一致は、典型的には、内部にある不一致よりも許容されると予想される)、両方の結合事象に存在するのは、5塩基配列のみであることが検証される。 In some embodiments, or in some cases, multiple binding events to a target locus are analyzed by analyzing data from a repertoire rather than from a single probe sequence to identify events arising from partially overlapping sequences. determined by consideration. For example, probes ATTAAG and TTAAGC are bound at the same location (sub-nanometrically close, in fact). They are 6 bases long and share a common 5 base sequence, each verifying the other and extending the sequence by 1 base on either side of the 5 bases. In some cases, one base on each side of the five-base sequence is mismatched (mismatches at the ends are typically expected to be more tolerated than internal ones) and are present in both binding events. It is verified that only 5 base sequences do.

一部の実施形態では、シグナルは、挿入色素から、プローブまたは標的配列上の標識へのFRETによって検出される。一部のかかる実施形態では、プローブは、その末端のうちの一方で、Cy3B標識で標識される。一部の実施形態では、標的が固定化された後、すべての標的分子の末端が標識され、例えば、ターミナルトランスフェラーゼによって、FRETパートナーとして作用する蛍光標識ヌクレオチドが組み込まれる。 In some embodiments, the signal is detected by FRET from the intercalating dye to the label on the probe or target sequence. In some such embodiments, the probe is labeled with a Cy3B label on one of its termini. In some embodiments, after target immobilization, all target molecules are end-labeled and incorporated, eg, by terminal transferase, with fluorescently labeled nucleotides that act as FRET partners.

一部の実施形態では、完全な配列レパートリーは使用されず、むしろ、目的の配列の特定のセグメントをカバーする溶液プローブのタイリングアレイが使用される。一部の実施形態では、完全な配列レパートリーは使用されず、むしろ、プローブのパネルが使用され、そのため、複数の場所が、配列特異的に一過的に結合するプローブによって照合される。 In some embodiments, the complete sequence repertoire is not used, but rather a tiling array of solution probes covering specific segments of the sequences of interest. In some embodiments, the complete sequence repertoire is not used, but rather a panel of probes, so that multiple locations are interrogated by probes that transiently bind sequence-specifically.

一部の実施形態では、本発明を実施するために、標的ポリヌクレオチドは一本鎖(例えば、mRNA)であるか、または一本鎖にする必要がある。一部の実施形態では、標的ポリヌクレオチドは二本鎖であり、一過的な結合は、プローブの一過的な鎖侵入に起因する。一部の実施形態では、二本鎖標的は、ニック(例えば、天然またはDNase1処置によって生成される)を含有し、かつ反応条件下で、一方の鎖が、他方から一過的に解れるか、もしくは剥離するか、または天然塩基対のゆらぎが生じ、プローブが天然鎖によって置換される前に一過的に結合することを可能にする。 In some embodiments, the target polynucleotide must be single-stranded (eg, mRNA) or rendered single-stranded in order to practice the present invention. In some embodiments, the target polynucleotide is double-stranded and transient binding results from transient strand invasion of the probe. In some embodiments, the double-stranded target contains nicks (e.g., naturally occurring or generated by DNase1 treatment), and under reaction conditions, one strand transiently unwinds from the other. or exfoliate, or cause a natural base-pair wobble, allowing the probe to transiently bind before being displaced by the natural strand.

一部の実施形態では、配列は、プローブの各々について収集された一過性データを分析することによって構築される。一部の実施形態では、このようなデータは、2D表面上の結合事象の座標を含み、典型的には、伸長ポリヌクレオチドの経路と相関する。 In some embodiments, sequences are constructed by analyzing transient data collected for each of the probes. In some embodiments, such data include coordinates of binding events on a 2D surface, typically correlated with the pathways of extended polynucleotides.

プローブ結合の場所は、各プローブの結合の順序を提供し、これは、連続した配列にコンパイルされ得る。 The location of probe binding provides the order of binding for each probe, which can be compiled into a contiguous sequence.

本明細書および特許請求の範囲において、標的ポリヌクレオチドという用語は、単鎖のみが存在する場合と、2つの二重らせん鎖が存在する場合との両方を指す。二本鎖または一本鎖ポリヌクレオチドが単独で意図される場合、それは、本文中に示される。RNAが言及される場合、それは一本鎖であると仮定される。 As used herein and in the claims, the term target polynucleotide refers both to the presence of only a single strand and to the presence of two double helices. Where double-stranded or single-stranded polynucleotide alone is intended, it is indicated in the text. When RNA is referred to it is assumed to be single-stranded.

本明細書および特許請求の範囲において、結合または場所が基板上に記録されている場合、かなりの割合の結合が基板上の核酸上で生じていると仮定することができる。 In the present specification and claims, when binding or location is recorded on a substrate, it can be assumed that a significant proportion of binding occurs on nucleic acids on the substrate.

ポリヌクレオチドの抽出
様々な実施形態では、本方法は、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または生体材料もしくは流体由来の単一標的ポリヌクレオチド分子を、実質的にインタクトな標的ポリヌクレオチドとして抽出することをさらに含む。様々な実施形態では、標的ポリヌクレオチド分子は、伸長/伸展されている。様々な実施形態では、標的ポリヌクレオチド分子は、表面に固定化される。様々な実施形態では、標的ポリヌクレオチド分子は、ゲル中に配置される(例えば、Shag et al Nature Prototcols 7:467-478(2012)と比較されたい)。様々な実施形態では、標的ポリヌクレオチド分子は、マイクロ流体チャネルおよび/またはナノ流体チャネルに配置される。様々な実施形態では、標的ポリヌクレオチド分子は、インタクトである。
Polynucleotide Extraction In various embodiments, the methods extract a single target polynucleotide molecule from a cell, organelle, chromosome, virus, exosome, or biological material or fluid as a substantially intact target polynucleotide. further including In various embodiments, the target polynucleotide molecule is elongated/stretched. In various embodiments, the target polynucleotide molecule is immobilized on a surface. In various embodiments, the target polynucleotide molecules are placed in a gel (compare, eg, Shag et al Nature Protocols 7:467-478 (2012)). In various embodiments, target polynucleotide molecules are disposed in microfluidic and/or nanofluidic channels. In various embodiments, the target polynucleotide molecule is intact.

様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含む。様々な実施形態では、本方法は、ポリヌクレオチドを、単一細胞からフローチャネルに遊離することをさらに含む。様々な実施形態では、フローチャネルの壁は、ポリヌクレオチドの集積を防止する不動態化を含む。様々な実施形態では、不動態化は、脂質、ポリエチレングリコール(PEG)、カゼインおよび/またはウシ血清アルブミン(BSA)のコーティングを含む。 In various embodiments, the method further comprises sequencing the genome of the single cell. In various embodiments, the method further comprises releasing polynucleotides from the single cell into the flow channel. In various embodiments, the walls of the flow channel comprise passivation to prevent accumulation of polynucleotides. In various embodiments, passivation includes coatings of lipids, polyethylene glycol (PEG), casein and/or bovine serum albumin (BSA).

一部の実施形態では、抽出が行われる前に、目的の細胞を、目的ではない他の細胞から分離することが必要である。いくつかの方法が利用可能であり、例えば、循環腫瘍細胞または循環胎児細胞は、それらの表面市場を親和性捕捉に使用することによって、血液から単離される。一部の実施形態では、微生物細胞をヒト細胞から分離することが必要であり、その目的は、微生物細胞由来のポリヌクレオチドを、検出および分析することである。オプソニンは、広範囲の微生物を捕捉し、それらを哺乳動物細胞から分離するために使用することができ、そうして、微生物のポリヌクレオチドが選択的に配列決定され得る。また、差次的溶解を行うことができる。ここで、まず、哺乳動物細胞を溶解するための条件が使用される。微生物細胞(特にマイコバクテリウム)は、哺乳動物細胞を溶解するために使用される条件に対して抵抗性であるため、したがって、インタクトのまま残り、哺乳動物細胞の内容物を洗い流すことによって単離することができる。次いで、より過酷な条件を使用して、微生物細胞からポリヌクレオチドを抽出し、それらを選択的に配列決定する。 In some embodiments, it is necessary to separate the cells of interest from other cells that are not of interest before extraction is performed. Several methods are available, for example, circulating tumor cells or circulating fetal cells are isolated from blood by using their surface market for affinity capture. In some embodiments, it is necessary to separate microbial cells from human cells for the purpose of detecting and analyzing polynucleotides derived from microbial cells. Opsonins can be used to capture a wide range of microorganisms and separate them from mammalian cells so that the microbial polynucleotides can be selectively sequenced. Also, differential lysis can be performed. Here, first, conditions for lysing mammalian cells are used. Microbial cells (particularly mycobacteria) are resistant to the conditions used to lyse mammalian cells and thus remain intact and isolated by washing away the contents of mammalian cells. can do. The polynucleotides are then extracted from the microbial cells using harsher conditions and they are selectively sequenced.

配列決定
概して、本発明の方法は、
a)標的核酸を提供することと、
b)一過的な結合反応を行って、標的上の第1のセットの配列ビットの場所を得ることと、
c)一過的な結合反応を行って、標的上の第2のセットの配列ビットの場所を得ることと、
d)一過的な結合反応を行って、標的上の第3のセットの配列ビットの場所を得ることと、を含む。
Sequencing In general, the method of the invention comprises
a) providing a target nucleic acid;
b) performing a transient binding reaction to obtain a first set of sequence bit locations on the target;
c) performing a transient binding reaction to obtain a second set of sequence bit locations on the target;
d) performing a transient binding reaction to obtain a third set of sequence bit locations on the target.

一部の実施形態では、複数のオリゴが、決定可能な距離によって、まとめられるか、または分離される。 In some embodiments, multiple oligos are grouped or separated by a determinable distance.

一部の実施形態では、配列ビットが得られる標的は、標的間の配列重複のセグメントに基づいて整列され、より長い「インシリコ」コンティグ、および最終的に染色体全体の配列が生成される。 In some embodiments, the targets from which the sequence bits are derived are aligned based on segments of sequence overlap between the targets to generate longer "in silico" contigs and ultimately sequences for the entire chromosome.

本発明の一部の実施形態では、標的ポリヌクレオチドを、ゲルと接触させる。一部の実施形態では、ゲルとの接触は、標的ポリヌクレオチドを伸長した後に生じる。一部の実施形態では、ゲルとの接触は、標的ポリヌクレオチドを伸長させる前に生じる。 In some embodiments of the invention, target polynucleotides are contacted with a gel. In some embodiments, contact with the gel occurs after elongation of the target polynucleotide. In some embodiments, contacting with the gel occurs prior to elongating the target polynucleotide.

一部の実施形態では、一般的に見られる配列が、標的ポリヌクレオチドに使用される。これは、ゲノムで非常に頻繁に生じるいくつかの配列のうちの1つ以上であり得る。この場合、ゲノムの全配列ではなく、ゲノムのフィンガープリントを容易に得ることができる。 In some embodiments, commonly found sequences are used for target polynucleotides. This can be one or more of several sequences that occur very frequently in the genome. In this case, fingerprints of the genome can be readily obtained, rather than the full sequence of the genome.

一部の実施形態では、本発明は、緊密にパックされたポリヌクレオチド、ならびにポリヌクレオチドに沿った配列ビットを超解像することによって得ることができる配列情報の密度を増加させる。 In some embodiments, the present invention increases the density of sequence information that can be obtained by super-resolving tightly packed polynucleotides as well as sequence bits along the polynucleotide.

一実施形態では、本方法は、
1)DNAの修飾または処理を行わずに、長い鎖長のゲノムDNAを抽出することと、
2)ゲノムDNA分子を、表面に伸展または伸長することと、
3)表面に伸展されたDNAの上を溶液が流れ得るように、フローセルを提供することと(フローセル内で伸展が行われたか、または表面上でフローセルが構築されたかのいずれか)、
4)DNAを変性することと、
5)一過的に結合するプローブを添加することと、
6)例えば、レーザ全内部反射(TIR)照明、焦点検出/保持機構、CCDカメラ、適切な対物レンズ、リレーレンズ、およびミラーを使用して、各場所でどのプローブが結合するのかを検出することと、
7)フローセルが装着されるステージを、ゲノム分子または異なる場所(その第1の位置におけるCCDの視野の外側)に提供される分子の部分が配列決定され得るように、CCDカメラに対して移動させることと、
8)必要に応じて、5~7を反復すること、
9)データを処理することであって、
a)画像を処理すること、
b)配列コール(sequence call)を行うこと、
c)配列コールを、空間場所に結び付けること、
d)どの配列コールの場所がラインに適合するかを判定すること、
e)得られた情報を使用して、配列決定リードをアセンブリして、超連続(super-contiguous)リードを提供すること、
f)アセンブリされたリードを使用して、ゲノムをアセンブリすること、および
g)好ましくはコンピュータまたはスマートフォンタイプのデバイス上のグラフィカルインターフェースを介して、配列リードおよび/またはアセンブリされたゲノムを、ユーザーに提供することを含む、データを処理することと、を含む。
In one embodiment, the method comprises:
1) extracting long strands of genomic DNA without modification or treatment of the DNA;
2) spreading or elongating a genomic DNA molecule onto a surface;
3) providing a flow cell so that the solution can flow over the DNA stretched on the surface (either the stretching was done in the flow cell or the flow cell was constructed on the surface);
4) denaturing the DNA;
5) adding a transiently binding probe;
6) Detecting which probes are bound at each location using, for example, laser total internal reflection (TIR) illumination, focus detection/holding mechanisms, CCD cameras, appropriate objective lenses, relay lenses and mirrors. When,
7) The stage on which the flow cell is mounted is moved relative to the CCD camera so that genomic molecules or portions of molecules provided at different locations (outside the field of view of the CCD in its first position) can be sequenced. and
8) repeating 5-7 as necessary;
9) processing the data,
a) processing the image;
b) making a sequence call;
c) binding array calls to spatial locations;
d) determining which array call locations fit the line;
e) using the information obtained to assemble sequencing reads to provide super-contiguous reads;
f) assembling the genome using the assembled reads; and g) providing the sequence reads and/or the assembled genome to the user, preferably via a graphical interface on a computer or smart phone type device. and processing the data, including

複数の細胞からゲノムDNAを抽出することができる場合、分子の多くのコピーが表面に呈示され、同じホモログからの結果が収集され、コンセンサスリードが得られ、ハプロタイプまたは親染色体特異性に従って相同分子が分離される。 When genomic DNA can be extracted from multiple cells, many copies of the molecule are surface displayed, results from the same homolog are collected, consensus reads are obtained, and homologous molecules are identified according to haplotype or parental chromosomal specificity. separated.

一部の実施形態では、一過的な結合は、検出手段として記録されるが、位置決定を改善するためには使用されない。場合によっては、分子はまばらに配列され、位置決定を増やす必要はない。しかしながら、光退色に対する堅牢性および非特異的バックグラウンドをフィルタリング除去する能力(永久的に固着したシグナルを処理することができる)により、このアプローチは説得力を持つようになる。 In some embodiments, transient binding is recorded as a means of detection, but not used to improve position determination. In some cases, the molecules are sparsely aligned and do not require increased localization. However, the robustness to photobleaching and the ability to filter out non-specific background (permanently stuck signals can be processed) make this approach compelling.

一部の実施形態では、プローブは標的に結合したままであるが、一過的な結合標識がオンおよびオフ結合するテールまたはフラップを有する。一部の実施形態では、テールは、非ワトソン-クリック塩基対合する核酸類似体からなる。 In some embodiments, the probe remains bound to the target but has a tail or flap to which the transient binding label binds on and off. In some embodiments, the tail consists of non-Watson-Crick base-pairing nucleic acid analogues.

単一塩基照合
一部の実施形態では、プローブは、定義された1つだけのヌクレオチドに従って標識される。
Single Base Interrogation In some embodiments, probes are labeled according to only one defined nucleotide.

一部の実施形態では、オリゴヌクレオチドは種に分割され、異なるヌクレオチド、ACGTが定義され、各異なるヌクレオチドに対応する各オリゴは、差次的に標識され、任意選択的に、配列決定反応に添加される。 In some embodiments, the oligonucleotides are divided into species, different nucleotides, ACGTs, are defined, and each oligo corresponding to each different nucleotide is differentially labeled and optionally added to the sequencing reaction. be done.

一部の実施形態では、オリゴは、差次的に標識されないが、各塩基の種類は、洗浄が以前のヌクレオチドを除去した後に、別々に添加される。 In some embodiments, the oligos are not differentially labeled, but each base type is added separately after washing removes the previous nucleotide.

一部の実施形態では、比較的短い時間スケール(例えば、1分以上)にわたる結合事象を検出するために、オリゴライブラリのより高い複雑性に対処するために、対応して、1塩基または数塩基のみが定義される、より高い濃度のオリゴが必要である。5塩基が定義されている10nMのオリゴが十分である場合、256倍高い濃度の、1塩基のみが定義されているオリゴが必要である。これは、2.56uMのオリゴヌクレオチドに相当し(一部の実施形態では、不一致などにより、低い濃度で十分である)、表面からの照明の指数関数的に減衰するエバネッセント場が使用される場合でも、表面上のポリヌクレオチド標的上の結合事象を検出することを困難にするレベルのバックグラウンド蛍光をもたらすであろう。バックグラウンド蛍光は、実質的に光散乱に起因するため、一部の実施形態では、それは時間ゲートで除去され得る。一部の実施形態では、溶液中の高濃度のオリゴは、蛍光性ではないが、蛍光生成性であり、クエンチされるか、または直接励起されないが、表面または標的ポリヌクレオチド自体に付着した実体から共鳴エネルギー移動に供される場合にのみ光を放出する機構が用いられる。一部の実施形態では、形成された二重鎖に挿入される色素が励起され、それが結合すると、オリゴ上の蛍光標識にエネルギーを移す。一部の実施形態では、定義されたオリゴライブラリの各々が一度に1つずつ添加され、オリゴには標識が結合しておらず、溶液からの核酸染色剤または挿入色素のみを使用して、結合事象が標識される。 In some embodiments, in order to detect binding events over relatively short time scales (e.g., 1 minute or longer), one or a few bases are correspondingly used to accommodate the higher complexity of the oligo library. A higher concentration of oligos is required, defined only by If 10 nM oligos with 5 bases defined are sufficient, a 256-fold higher concentration of oligos with only 1 base defined is needed. This corresponds to 2.56 uM of oligonucleotide (in some embodiments, due to mismatch etc., lower concentrations are sufficient), when an exponentially decaying evanescent field of illumination from the surface is used. However, it will result in levels of background fluorescence that make it difficult to detect binding events on polynucleotide targets on the surface. Since background fluorescence is substantially due to light scattering, in some embodiments it can be time gated out. In some embodiments, high concentrations of oligos in solution are not fluorescent, but are fluorogenic and are quenched or not excited directly, but from entities attached to the surface or the target polynucleotide itself. A mechanism is used that emits light only when subjected to resonance energy transfer. In some embodiments, a dye that intercalates into the formed duplex is excited and upon binding transfers energy to a fluorescent label on the oligo. In some embodiments, each of the defined oligo libraries is added one at a time, no labels are attached to the oligos, and only nucleic acid stains or intercalating dyes from solution are used for binding. Events are labeled.

一部の実施形態では、オリゴヌクレオチドにおいて、1塩基のみが定義され、残りの位置が縮重している場合、4つの可能な定義された塩基であるA、C、G、またはTに対して、4回以下の試薬交換サイクルのみが必要である。一部の実施形態では、塩基の各々は、別個の標識によってコードされ、4つすべての標識を同時に検出する手段がある場合、試薬交換は必要でない。このような均一またはワンポット配列決定反応が実施される場合、機器は非常に単純で、本質的に顕微鏡であり、試薬交換を必要としない。例えば、適切な緩衝液中のオリゴ混合物(オリゴヌクレオチドプローブ種の混合物)を、標的ポリヌクレオチドが位置するカバーガラスの上に、ほんの一滴加え、次いで、結合事象を十分長い時間観察して、1つ以上の結合事象で配列全体をカバーする。この均一反応は、数時間実行され、蒸発に対して密封される。十分に多い量が使用される場合、溶液の大部分からの拡散による試薬交換を促進することによって、表面近くで生じ得る試薬の枯渇を克服することができる(例えば、これは、乱流またはカオス混合によって増強することができる)。代替的に、目的が異なるオリゴミックスを添加することではなく、単に枯渇した試薬を交換することである場合、試薬交換を行う。 In some embodiments, for the four possible defined bases A, C, G, or T, where only one base is defined and the remaining positions are degenerate in the oligonucleotide , only 4 or fewer reagent change cycles are required. In some embodiments, each of the bases is encoded by a separate label, and reagent exchange is not required if there is means to detect all four labels simultaneously. When such homogenous or one-pot sequencing reactions are performed, the instrumentation is very simple, essentially microscopic, and does not require reagent exchange. For example, just one drop of an oligo mixture (a mixture of oligonucleotide probe species) in a suitable buffer is added onto a coverslip on which the target polynucleotide is located, and then the binding event is observed for a long enough time to allow one The above binding events cover the entire sequence. This homogeneous reaction is run for several hours and sealed against evaporation. If large enough volumes are used, reagent depletion that can occur near the surface can be overcome by facilitating reagent exchange by diffusion from the bulk of the solution (e.g., this may result in turbulent or chaotic flow). can be enhanced by mixing). Alternatively, if the goal is simply to replace depleted reagents rather than adding a different oligomix, a reagent replacement is performed.

一部のかかる実施形態では、標的ポリヌクレオチドを、伸長または伸展させて、結合事象の場所、したがって、ポリヌクレオチドの長さに沿ったヌクレオチドの場所を決定できるようにする。一部のかかる実施形態では、ポリヌクレオチドは、一本鎖であり、そのため、オリゴが結合する鎖に関して曖昧さがない。これは、この一塩基照合(single-nucleotide interrogation)アプローチが、変性二重らせんポリヌクレオチドのどちらの鎖で個々の結合事象が生じるのかを逆折り畳みするために、タイリング経路を構築する無駄(luxury)がないため、有用である。一塩基照合アプローチを一本鎖に適用することができるいくつかの例がある。まず、ほとんどの場合、RNAは天然では一本鎖である。他の場合、二本鎖核酸を一本鎖にすることができ、さらなる場合、二重らせんの片方の鎖を複製して、一本鎖を作ることができ、例えば、核酸を環状化し、ローリングサークル増幅を介して反復的に複製することができる。 In some such embodiments, the target polynucleotide is elongated or stretched so that the location of the binding event, and thus the location of the nucleotides along the length of the polynucleotide, can be determined. In some such embodiments, the polynucleotide is single-stranded, so there is no ambiguity as to which strand the oligo binds. This is because this single-nucleotide interrogation approach avoids the luxury of constructing tiling pathways to reverse fold on which strand of the denatured double-helical polynucleotide each binding event occurs. ), so it is useful. There are several examples where the single base matching approach can be applied to single strands. First, for the most part, RNA is naturally single-stranded. In other cases, a double stranded nucleic acid can be made single stranded, and in further cases one strand of a duplex can be replicated to make a single strand, e.g., the nucleic acid can be circularized, rolled It can replicate iteratively via circle amplification.

一部のかかる実施形態では、ドリフトを回避する強い必要性があり、各結合事象は単一塩基の情報のみを提供するため、配列の重複ビットによって形成されるタイリング経路は、配列中のヌクレオチドの配置を容易にする完全なデータセットから抽出することができない。必要な精度を得るために、振動や熱ドリフトの点で極めて安定したシステムを使用している。そのような安定したシステムの1つは、オリンパスのIX81倒立レーザTIRF顕微鏡で使用することができるIX2 Nosepieceステージである。一部の実施形態では、追加または代替として、ドリフト補正機構が使用され、ドリフト補正のための非常に効果的な手段は、DNA折り紙などの基準マーカーを使用し、データを反復的にドリフト補正して正確で高精度な超解像画像を生成するために、複数ラウンドの処理を行うことである。DNA折り紙は、当業者によって、構造内の非常に規則正しく正確に設けられた位置に、蛍光標識用の複数の結合部位を有するように設計されている。例えば、Daiら(Nature Nanotechnology 2016,11:798-807、参照により本明細書に援用される)に記載されている種類のDNA折り紙を使用することができ、例えば、12または16ポイントグリッドを含む。折り紙は、DNA PAINT機構によって標識され、一本鎖ドッキング部位がグリッドの上面から突出し、蛍光標識された撮像剤によって一過的に結合されている。結合部位は、4つの異なる標識で標識された撮像剤に対して、グリッド上に提供され、標識は、4つの一塩基定義オリゴライブラリを特異的に標識するために使用される。一部の実施形態では、折り紙グリッドに結合する撮像剤は、配列決定反応のワトソン-クリック結合系よりも直交的な結合系を有するように設計される。そのような直交系は、例えば、Firebird Biomolecular Sciences LLC(www.firebirdbio.com)から入手可能な人工的に拡張された遺伝情報システム(AEGIS)ホスホロアミダイト試薬を使用した拡張アルファベット核酸塩基対システムである。本システムは、本発明の配列決定システムで使用されるワトソン・クリックA:TおよびG:C塩基対に直交的な、Z:PおよびS:B塩基対を提供する。 In some such embodiments, there is a strong need to avoid drift, and since each binding event only provides information for a single base, the tiling path formed by the overlapping bits of the sequence is the nucleotide cannot be extracted from the complete dataset to facilitate placement. In order to obtain the required accuracy, we use a system that is extremely stable in terms of vibration and thermal drift. One such stable system is the IX2 Nosepiece stage that can be used with Olympus' IX81 inverted laser TIRF microscope. In some embodiments, a drift correction mechanism is additionally or alternatively used, and a very effective means for drift correction uses fiducial markers such as DNA origami to iteratively drift correct the data. It is to perform multiple rounds of processing to generate accurate and highly accurate super-resolution images. DNA origami has been designed by those skilled in the art to have multiple binding sites for fluorescent labels at very regular and precisely placed positions within the structure. For example, DNA origami of the type described in Dai et al. (Nature Nanotechnology 2016, 11:798-807, incorporated herein by reference) can be used, including, for example, a 12 or 16 point grid. . The origami is labeled with a DNA PAINT mechanism, with single-stranded docking sites protruding from the top surface of the grid and transiently bound by a fluorescently labeled imaging agent. Binding sites are provided on the grid for imaging agents labeled with four different labels, and the labels are used to specifically label four single base defined oligo libraries. In some embodiments, the imaging agent that binds to the origami grid is designed to have a binding system that is more orthogonal than the Watson-Crick binding system of sequencing reactions. Such an orthogonal system is, for example, the Extended Alphabet Nucleobase Pairing System using Artificially Augmented Genetic Information System (AEGIS) phosphoramidite reagents available from Firebird Biomolecular Sciences LLC (www.firebirdbio.com). be. The system provides Z:P and S:B base pairs that are orthogonal to the Watson-Crick A:T and G:C base pairs used in the sequencing system of the invention.

一部の実施形態では、オリゴ(例えば、3塩基長が定義されているオリゴ)を、低温または高塩で結合させることができ、これにより、多数の部位(そのいくつかは解像可能ではない)が結合できるようになる。一部の実施形態では、結合の場所を特定するために、蛍光標識を退色させ、各々の正確な場所が単一分子局在化によって決定され得るようにする。例えば、Neely et al Nucleic Acids Res.2014 Apr;42(7):e50および米国特許出願第13/701,628号(2012年12月3日出願、参照により本明細書に援用される)を参照されたい。この非一過的な結合アプローチでは、1つのオリゴの結合が、重複するオリゴの結合を妨げ得る可能性がある。これに対処するため、複数のサイクルが使用される。第1のセットの結合したオリゴは、温度および/または化学的変性によって融解され、次いで、結合が再び開始され、第1のサイクルでブロックされた場所が第2のサイクルで結合することができるなどの可能性を可能にする。これは、任意選択的に、より多くのサイクルで繰り返され、より多くの以前にブロックされた部位が結合することを可能にする。同様に、一部の実施形態では、結合は、確率的光学再構築顕微鏡(STORM、例えば、(参照により本明細書に援用される)米国特許第7,776,613号および米国特許第10,073,035号に記載されている)によって検出され、フルオロフォアシグナルのうちのいくつかのみを任意の時点でオンにする。一部の実施形態では、これは、配列を最大限にカバーするために複数回繰り返される。 In some embodiments, oligos (e.g., oligos of defined 3-base length) can be attached at low temperature or high salt, resulting in a large number of sites, some of which are not resolvable. ) can be combined. In some embodiments, to identify the location of binding, the fluorescent label is bleached so that the precise location of each can be determined by single molecule localization. For example, Neely et al Nucleic Acids Res. 2014 Apr;42(7):e50 and US Patent Application No. 13/701,628 (filed December 3, 2012, incorporated herein by reference). In this non-transient binding approach, it is possible that binding of one oligo can interfere with binding of overlapping oligos. Multiple cycles are used to address this. The bound oligos of the first set are melted by temperature and/or chemical denaturation, then binding is initiated again, allowing locations blocked in the first cycle to bind in the second cycle, etc. enable the possibility of This is optionally repeated for more cycles to allow more previously blocked sites to bind. Similarly, in some embodiments, coupling is performed using stochastic optical reconstruction microscopy (STORM), e.g., US Pat. 073,035), turning on only some of the fluorophore signals at any given time. In some embodiments, this is repeated multiple times to maximize coverage of the sequence.

結合速度は、オリゴ濃度を増加させること、結合温度を増加させること、ならびに/または塩および体積排除剤(volume excluding agent)の同一性および濃度を変化させることによって増加させることができる。一部の実施形態では、体積排除剤は、ヒドロキシプロピルメチルセルロース(HPMC)、ヒドロキシエチルメチルセルロース(HEMC)、ヒドロキシブチルメチルセルロース、ヒドロキシプロピルセルロース、メチルセルロース、およびヒドロキシルメチルセルロースからなる群から選択され、PEG-800は、約0.002重量%~約15重量%の範囲の濃度である。加えて、100~600mM濃度のMgCl2などの二価カチオンは、結合速度に加速効果を有する。 The rate of conjugation can be increased by increasing the oligo concentration, increasing the conjugation temperature, and/or varying the identity and concentration of salt and volume excluding agent. In some embodiments, the volume excluding agent is selected from the group consisting of hydroxypropylmethylcellulose (HPMC), hydroxyethylmethylcellulose (HEMC), hydroxybutylmethylcellulose, hydroxypropylcellulose, methylcellulose, and hydroxylmethylcellulose, and PEG-800 is , at concentrations ranging from about 0.002% to about 15% by weight. In addition, divalent cations such as MgCl2 at concentrations of 100-600 mM have an accelerating effect on binding kinetics.

一部の実施形態では、結合の速度を増加させる追加の手段は、流れの存在下で測定値を得ることによるものである。したがって、最大50ulのフローセル体積では、1分間当たり1μlの流速は結合速度を増加させることができる。一部の実施形態では、流れは、乱流である。一部の実施形態では、乱流は、表面から出ているロッドまたは隆起の存在、フローセルの上面のヘリンボーンパターン、または流れを乱流にする溶液中のビーズまたは微細構造の存在によって誘発される。結合速度を増加させることに加えて、フロープロセスを最適化することもまた、試薬交換の有効性を増加させ、以前のサイクルからの残留オリゴが最小限にとどまることを確実にする。一部の実施形態では、1つのオリゴ種から次のオリゴ種への交換プロセス中、きれいな緩衝液を用いた1回以上の洗浄が必要であり、洗浄中に、オリゴプローブが表面から拡散し、平衡濃度に到達するのに時間が必要である。一部の実施形態では、時間は1分であり、他の実施形態では、時間は10分である。一部の実施形態では、10~100容量の緩衝液を、フローセルに通して、残留オリゴの除去を確実にする。一部の実施形態では、TIRF範囲外でのプローブの移動が、例えば、ver帯電したオリゴを正のバイアス電極に移動させる電場を印加することによって促進されるため、時間が低減される。様々なプロセス:時間、乱流、交換される緩衝液の量、および電場のうちの1つ以上を組み合わせることができる。一部の実施形態では、ある程度の残留オリゴは許容される。それは、前のオリゴの同一性が既知であり、アセンブリアルゴリズムが、それらの微量な存在を考慮することができるためである。 In some embodiments, an additional means of increasing the rate of binding is by taking measurements in the presence of flow. Therefore, with a flow cell volume of up to 50 ul, a flow rate of 1 μl per minute can increase the binding rate. In some embodiments, the flow is turbulent. In some embodiments, turbulence is induced by the presence of rods or ridges protruding from the surface, a herringbone pattern on the top surface of the flow cell, or the presence of beads or microstructures in the solution that make the flow turbulent. In addition to increasing the binding rate, optimizing the flow process also increases the efficiency of reagent exchange and ensures that residual oligos from previous cycles are minimized. In some embodiments, one or more washes with clean buffer are required during the exchange process from one oligospecies to the next, during which oligoprobes diffuse from the surface, Time is required to reach equilibrium concentrations. In some embodiments the time is 1 minute and in other embodiments the time is 10 minutes. In some embodiments, 10-100 volumes of buffer are passed through the flow cell to ensure removal of residual oligos. In some embodiments, movement of the probe outside the TIRF range is facilitated, for example, by applying an electric field that causes ver-charged oligos to move to the positively biased electrode, thus reducing the time. One or more of the various processes: time, turbulence, amount of buffer exchanged, and electric field can be combined. In some embodiments, some residual oligos are acceptable. This is because the identities of the previous oligos are known and the assembly algorithm can take their minor presence into account.

一部の実施形態では、縮重位置は使用されず、オリゴヌクレオチドの所望の安定性は、条件(例えば、低温、高塩)を適切に操作することによって得られるか、もしくはそれ自体が十分に安定している(例えば、ガンマPNAなど)オリゴ化学を使用することによって得られるか、またはスペルミンもしくはスチルベンなどのコンジュゲートを末端に付加して、短いオリゴヌクレオチドの安定性を増加させる。 In some embodiments, degenerate positions are not used and the desired stability of the oligonucleotide is obtained by properly manipulating conditions (e.g., low temperature, high salt), or is itself sufficient Stable (eg, gamma PNA, etc.) may be obtained by using oligo chemistry, or conjugates such as spermine or stilbenes may be added to the ends to increase the stability of short oligonucleotides.

一部の実施形態では、ハイブリダイゼーションは、定義されていない位置にあるすべての可能な配列を含むオリゴヌクレオチドのライブラリを使用するよりも、縮重でニトロインドールまたはデオキシイノシンなどの普遍的塩基を使用することによって改善され得る。これらの普遍的塩基は、様々なベンダーから購入されるオリゴの配列に沿った位置で指定することができる。一部の実施形態では、いくつかの位置は、ヌクレオチドのライブラリによって占有され、他の位置は、普遍的塩基によって占有される。普遍的塩基は、混合物の複雑度を低減するために、より低い濃度のオリゴプローブを用いることができる。 In some embodiments, hybridization is degenerate and uses universal bases such as nitroindole or deoxyinosine rather than using a library of oligonucleotides containing all possible sequences at undefined positions. can be improved by These universal bases can be specified at positions along the sequence of oligos purchased from various vendors. In some embodiments, some positions are occupied by a library of nucleotides and other positions are occupied by universal bases. Universal bases can use lower concentrations of oligoprobes to reduce the complexity of the mixture.

使用されるオリゴの複雑度をコードする1つの塩基が高いため、使用されるオリゴライブラリの濃度を増やす必要があり、そのため、10nMの濃度の代わりに、1uM以上の濃度を使用する必要があり、これが大きなバックグラウンドを生み出すため、一部の実施形態では、挿入色素などからのFRET機構が使用され、挿入標識スキーム(FRETなし)またはオリゴは、ハイブリダイゼーションが起こると蛍光を発する蛍光発生性標識で標識される。 Due to the high one base encoding complexity of the oligos used, the concentration of the oligo library used had to be increased, so instead of the concentration of 10 nM, concentrations of 1 uM and above had to be used; As this creates a large background, in some embodiments a FRET mechanism such as from an intercalating dye is used and an intercalating labeling scheme (no FRET) or oligos are fluorogenic labels that fluoresce upon hybridization. be labeled.

一部の実施形態では、2つの定義された塩基で、64個のすべての可能なオリゴが同時に添加され、差次的に標識される。一部の実施形態では、16個の差次的な標識が利用可能であり、そのため、64個のライブラリは、4つの16個のライブラリに分割される。したがって、4サイクルだけで配列決定が終了する。他の実施形態では、4個の標識を使用して、4個のオリゴを一緒に添加することを可能にし、16サイクル行うことが必要になる。これらの3塩基長のハイブリダイゼーションは、4×SSC、または2.4MのTMAClまたは3.5MのTMACl、LiTCA、GUCNを含む緩衝液中で行うことができる。これらは、不一致をより良好に識別し、かつ/または塩基組成物の影響を均等化する役割を果たし得る。 In some embodiments, all 64 possible oligos are added simultaneously and differentially labeled at two defined bases. In some embodiments, 16 differential labels are available, so the 64 libraries are divided into four 16 libraries. Therefore, sequencing is completed in only 4 cycles. In other embodiments, 4 labels are used, allowing 4 oligos to be added together, requiring 16 cycles to be performed. These 3-base-long hybridizations can be performed in a buffer containing 4×SSC, or 2.4 M TMACl or 3.5 M TMACl, LiTCA, GUCN. These may serve to better discriminate discrepancies and/or equalize the effects of base composition.

時間解像度の向上。
一部の実施形態では、一過的な結合プロセスは、塩濃度などの様々な生化学パラメータを調整することによって高速化することができる。高フレームレートのカメラがいくつか存在し、それを、結合の速度を一致させるために使用することができ、多くの場合、視野を制限して、画素のサブセットからより高速な読み出しを得ている。1つの代替的なアプローチは、ガルボノメータミラーを使用して、単一のセンサーの異なる領域に連続したシグナルを時間的に分散させるか、またはセンサーを分離することであり、後者は、センサーの完全な視野を利用することができるが、分散されたシグナルがコンパイルされる場合、全体的な時間解像度が増加する。回折限界スポット内の複数のシグナルの画像処理事例中に拒否することができるため、プロセスをより高速で実行することができ、プローブの高い結合速度に対処することができる。
Improved temporal resolution.
In some embodiments, the transient binding process can be sped up by adjusting various biochemical parameters such as salt concentration. There are some high frame rate cameras that can be used to match the speed of binding, often with a limited field of view to get faster readout from a subset of pixels. . One alternative approach is to use galvonometer mirrors to temporally disperse sequential signals to different regions of a single sensor or to separate the sensors, the latter being the The full field of view can be utilized, but the overall temporal resolution increases when scattered signals are compiled. The ability to reject multiple signals within a diffraction-limited spot during imaging cases allows the process to run faster and accommodate high binding rates of probes.

DNA光損傷の回避
一部の実施形態では、タンパク質を介してオリゴヌクレオチドに結合した蛍光部分を有し、配列決定される核酸に対する光損傷の影響を低減することが好都合である。一部の実施形態では、タンパク質部分の影響は、蛍光標識の様々な悪影響から、オリゴおよび標的配列に対して保護を提供することである。酸化的損傷などのこれらの悪影響のいくつかは、還元剤またはレドックス系などの反応溶液中に添加剤を含めることによって克服することができる。しかしながら、電子伝達またはトンネル効果などの他の有害な機構は、添加剤によって防止されない場合がある。一部の実施形態では、還元剤またはレドックス系は、オリゴに物理的に連結されている。一部の実施形態では、タンパク質は、ストレプトアビジンである。ストレプトアビジンの蛍光標識バージョンは、例えば、FRETによる波長シフトをもたらす別の色素にコンジュゲートされたストレプトアビジン-フィコエリトリンを含むストレプトアビジン-フィコエリトリンが入手可能である。次いで、ストレプトアビジンはまた、周知のビオチン-ストレプトアビジン相互作用によって1つ以上のビオチン化オリゴヌクレオチドに結合する。様々な密接に関連するタンパク質、アビジン、ニュートラアビジンも使用することができる。ストレプトアビジンは、結合している複数の色素を有する。他の好適なタンパク質としては、ユビキチンおよびSNAP-タグタンパク質が挙げられる。タンパク質以外の分子も、それらが経験的に損傷を防ぐように蛍光色素の周囲に遮蔽を提供し得ることが見出されているならば、使用することができる。
Avoidance of DNA Photodamage In some embodiments, it is advantageous to have fluorescent moieties attached to oligonucleotides via protein to reduce the effects of photodamage on nucleic acids to be sequenced. In some embodiments, the effect of the protein moiety is to provide protection to the oligo and target sequences from various adverse effects of fluorescent labeling. Some of these adverse effects, such as oxidative damage, can be overcome by including additives in the reaction solution, such as reducing agents or redox systems. However, other detrimental mechanisms such as electron transport or tunneling effects may not be prevented by the additive. In some embodiments, the reducing agent or redox system is physically linked to the oligo. In some embodiments, the protein is streptavidin. Fluorescently labeled versions of streptavidin are available, eg, streptavidin-phycoerythrin, which includes streptavidin-phycoerythrin conjugated to another dye that produces a wavelength shift by FRET. Streptavidin then also binds to one or more biotinylated oligonucleotides through the well-known biotin-streptavidin interaction. Various closely related proteins, avidin, neutravidin can also be used. Streptavidin has multiple dyes attached. Other suitable proteins include ubiquitin and SNAP-tag proteins. Molecules other than proteins can also be used if they are empirically found to be able to provide a shield around the fluorochrome to prevent damage.

したがって、一部の実施形態では、配列決定試薬は、タンパク質上の第1の位置に結合した一過的に結合するヌクレオチド/オリゴヌクレオチドと、タンパク質上の第2の位置に結合した少なくとも1つの蛍光色素部分を含む色素成分とを含む。 Thus, in some embodiments, the sequencing reagents comprise a transiently binding nucleotide/oligonucleotide attached to a first position on the protein and at least one fluorescent nucleotide/oligonucleotide attached to a second position on the protein. and a dye component comprising a dye moiety.

単一細胞解像配列決定
様々な実施形態では、本方法は、単一細胞のゲノムを配列決定することをさらに含む。一部の実施形態では、単一細胞は、他の細胞との結合を含まない。一部の実施形態では、単一細胞は、クラスター中または組織中で、他の細胞に付着している。一部の実施形態では、そのような細胞は、個々の非付着細胞に脱凝集される。
Single Cell Resolution Sequencing In various embodiments, the method further comprises sequencing the genome of the single cell. In some embodiments, a single cell does not contain association with other cells. In some embodiments, single cells are attached to other cells in clusters or tissues. In some embodiments, such cells are disaggregated into individual non-adherent cells.

一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法を含み、本方法は、以下のステップ:
i)1つ以上の細胞をフローセルに導入することと、
ii)細胞を処理して、ポリヌクレオチドを遊離することと、
iii)遊離されたポリヌクレオチドを、フローセル内で伸長することと、
iv)伸長されたポリヌクレオチドを、鋳型/配列決定標的として用いて、配列決定反応を行うことと、を含む。
In some embodiments, the invention includes a method for sequencing a polynucleotide, the method comprising the steps of:
i) introducing one or more cells into the flow cell;
ii) treating the cell to release the polynucleotide;
iii) extending the released polynucleotides in a flow cell;
iv) performing a sequencing reaction using the extended polynucleotide as a template/sequencing target.

一部の実施形態では、本発明は、ポリヌクレオチドを配列決定するための方法を含み、本方法は、以下のステップ:
i)1つ以上の細胞を、マイクロコンテナ(micro-container)に導入することと、
ii)細胞を処理して、ポリヌクレオチドを遊離することと、
iii)容器の内容物を、フローセル内に遊離することと、
iv)ポリヌクレオチドを伸長させることと、
v)当該伸長されたポリヌクレオチドを、鋳型として使用して、配列決定反応を行うことと、を含む。
In some embodiments, the invention includes a method for sequencing a polynucleotide, the method comprising the steps of:
i) introducing one or more cells into a micro-container;
ii) treating the cells to release the polynucleotides;
iii) releasing the contents of the container into the flow cell;
iv) extending the polynucleotide;
v) performing a sequencing reaction using the elongated polynucleotide as a template.

一部の実施形態では、ポリヌクレオチドを配列決定するための方法が提供され、本方法は、以下のステップ:
i)細胞を、フローセルに曝露することであって、フローセルが、入口および出口を含む、曝露することと、
ii)当該細胞から、ポリヌクレオチドを抽出することと、
iii)当該ポリヌクレオチドの少なくとも一部分が、個別に解像可能であるように、当該ポリヌクレオチドを、当該フローセルの表面に付着させることと、
iv)オリゴを、当該ポリヌクレオチドに曝露することと、
v)当該ポリヌクレオチド上のオリゴの結合場所を、識別することと、を含む。
In some embodiments, a method is provided for sequencing a polynucleotide, the method comprising the steps of:
i) exposing the cells to a flow cell, the flow cell comprising an inlet and an outlet;
ii) extracting polynucleotides from the cells;
iii) attaching the polynucleotides to the surface of the flow cell such that at least a portion of the polynucleotides are individually resolvable;
iv) exposing an oligo to said polynucleotide;
v) identifying the binding site of the oligo on the polynucleotide.

一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造(例えば、フローセルまたはマイクロウェル)の入口に、流体的に移される(例えば、ピペットを使用することによって)。脱凝集は、細胞をピペッティングすることによって、プロテアーゼ、超音波処理、または物理的撹拌を適用することによって行うことができる。一部の実施形態では、細胞は、脱凝集された後、ポリヌクレオチドが伸長される構造に、流体的に移される。 In some embodiments, the cells are disaggregated and then fluidically transferred (e.g., by using a pipette) to the inlet of a structure (e.g., a flow cell or microwell) where the polynucleotides are elongated. . Disaggregation can be done by pipetting the cells, applying proteases, sonication, or physical agitation. In some embodiments, the cells are disaggregated and then fluidically transferred to a structure where the polynucleotides are elongated.

一部の実施形態では、単一細胞が単離され、ポリヌクレオチドが単一細胞から遊離され、その結果、同じ細胞に由来するすべてのポリヌクレオチドが互いに近接したまま配置され、かつ他の細胞の内容物が配置される場所とは異なる場所に配置される。一部の実施形態では、Lab Chip,2006,6,1445-1449に記載されている捕捉構造が使用される。 In some embodiments, single cells are isolated and polynucleotides are released from the single cells such that all polynucleotides from the same cell remain in close proximity to each other and are isolated from other cells. Placed in a different location than where the contents are placed. In some embodiments, the trapping structures described in Lab Chip, 2006, 6, 1445-1449 are used.

一部の実施形態では、単一細胞が捕捉され、内容物が遊離され、次いで伸長される。一部の実施形態では、単一細胞は、個々のチャネルに破裂され、各個々の細胞を、トランスポザーゼ媒介の組み込みを介して固有のタグ配列と反応させ、その後、ポリヌクレオチドが組み合わされ、同じ混合物中で配列決定される。トランスポザーゼ複合体は、細胞にトランスフェクトされるか、または細胞を含む液滴に融合される液滴中にある。 In some embodiments, single cells are captured, the contents released, and then elongated. In some embodiments, single cells are ruptured into individual channels, each individual cell is reacted with a unique tag sequence via transposase-mediated integration, and the polynucleotides are then combined into the same mixture. sequenced in The transposase complex is in droplets that are transfected into cells or fused to droplets containing cells.

一部の実施形態では、凝集体は、細胞の小さなクラスターであり、一部の実施形態では、クラスター全体が、同じ配列決定タグでタグ付けされる。一部の実施形態では、細胞は凝集しておらず、循環腫瘍細胞(CTC)または循環胎児細胞などの遊離した浮遊細胞である。 In some embodiments, aggregates are small clusters of cells, and in some embodiments the entire cluster is tagged with the same sequencing tag. In some embodiments, the cells are not aggregated and are free floating cells such as circulating tumor cells (CTCs) or circulating fetal cells.

単一細胞配列決定において、細胞溶解後の自発的なシトシン脱アミノ化によって引き起こされるシトシンからチミンへの一塩基バリアントの問題が存在する。これは、配列決定の前に、試料をウラシルN-グリコシラーゼ(UNG)で前処理することによって克服される。(例えば、Mol Diagn Ther.2014 Oct;18(5):587-593に記載されている) In single cell sequencing, there is a problem of cytosine to thymine single nucleotide variants caused by spontaneous cytosine deamination after cell lysis. This is overcome by pretreating the samples with uracil N-glycosylase (UNG) prior to sequencing. (for example, as described in Mol Diagn Ther. 2014 Oct;18(5):587-593)

ポリヌクレオチドの細胞特異的インデックス付け
様々な実施形態では、本方法は、複数の細胞(または核)由来のポリヌクレオチドを配列決定することにさらに適用され、各ポリヌクレオチドは、その起源の細胞の情報を保持する。
Cell-Specific Indexing of Polynucleotides In various embodiments, the method is further applied to sequencing polynucleotides from a plurality of cells (or nuclei), each polynucleotide containing information about its cell of origin. hold.

特定の実施形態では、トランスポゾン媒介性の挿入は、細胞内で生じ、各挿入は、起源の細胞の標識としての固有のID配列タグを含む。他の実施形態では、トランスポゾン媒介性の挿入は、単一細胞が単離された容器(例えば、アガロースビーズ、油-水滴などを含む容器)内で生じる。固有のタグは、タグを有するすべてのポリヌクレオチドが同じ細胞に由来しなければならないことを示す。次いで、すべてのゲノムDNAおよび/またはRNAが抽出され、混合され、伸長され得る。次いで、SbS(または任意の他の配列決定方法)がPBSまたはプロモーターに由来する場合、それが得る第1の配列は、細胞識別配列由来であり、続いてポリヌクレオチドの配列である。細胞識別タグを、短く保つことが好ましい。10,000個の細胞について(例えば、腫瘍微量剖検から)、約65,000個の固有配列は、8ヌクレオチド長の識別子配列によって提供され得、約100万個の固有配列は、10ヌクレオチド長の識別子配列によって提供され得る。 In certain embodiments, transposon-mediated insertion occurs intracellularly and each insertion contains a unique ID sequence tag as a marker of the cell of origin. In other embodiments, transposon-mediated insertion occurs within a vessel in which single cells are isolated (eg, a vessel containing agarose beads, oil-water droplets, etc.). A unique tag indicates that all polynucleotides bearing the tag must come from the same cell. All genomic DNA and/or RNA can then be extracted, mixed and extended. Then, if the SbS (or any other sequencing method) is from PBS or a promoter, the first sequence it gets is from the cell identification sequence, followed by the sequence of the polynucleotide. It is preferred to keep cell identification tags short. For 10,000 cells (e.g., from a tumor micropsy), about 65,000 unique sequences can be provided by 8 nucleotide long identifier sequences, and about 1 million unique sequences can be provided by 10 nucleotide long identifier sequences. It can be provided by an identifier sequence.

この同じインデックス化の原理は、その目的が、試料を混合し、それらを一緒に配列決定することだけではなく、各個々の試料に関する配列情報を回収することである場合、細胞以外の(例えば、異なる個体由来の)試料に適用され得る。 This same indexing principle applies to non-cellular (e.g., samples (from different individuals).

したがって、一部の実施形態では、本方法は、
1)細胞の内容物を単離することと、
2)トランスポゾン媒介性の挿入を行い、細胞の固有配列タグを、細胞のポリヌクレオチドに挿入することと、
3)細胞のポリヌクレオチドを、固定することと、
4)タグの配列およびポリヌクレオチドの配列の読み取りを包含する、本発明の配列決定方法を実施することと、を含む。
Thus, in some embodiments, the method comprises:
1) isolating the contents of the cells;
2) performing transposon-mediated insertion to insert the cell's unique sequence tag into the cell's polynucleotide;
3) immobilizing the polynucleotides in the cells;
4) performing the sequencing method of the invention, including reading the sequence of the tag and the sequence of the polynucleotide.

一部の実施形態では、ポリヌクレオチドはRNAであり、cDNAコピーが配列決定される。かかる実施形態では、タグの付加は、タグ配列を含むプライマーを用いたcDNA合成を含み得る。 In some embodiments, the polynucleotide is RNA and the cDNA copy is sequenced. In such embodiments, tagging may involve cDNA synthesis using a primer containing the tag sequence.

一部の実施形態では、配列の量を短く保つように維持することで、より多くの配列リードが、ポリヌクレオチド配列の配列決定自体に寄与し得るようにするために、タグ配列が、いくつかの部位にわたって分配される。ここで、複数の短い識別子配列が、例えば、3つ、各細胞または容器に導入される。次に、ポリヌクレオチドに沿って分布するタグのビットから、ポリヌクレオチドの起点を決定する。したがって、この場合、1つの場所から読み出されるタグのビットは、起源の細胞を決定するのに十分ではない可能性があるが、複数のタグビットの決定を行うには十分である。 In some embodiments, several tag sequences are used to keep the amount of sequence short so that more sequence reads can contribute to the sequencing of the polynucleotide sequence itself. distributed over the site of Here, a plurality of short identifier sequences are introduced into each cell or vessel, eg three. The origin of the polynucleotide is then determined from the bits of the tag distributed along the polynucleotide. Thus, in this case, the tag bit read from one location may not be sufficient to determine the cell of origin, but is sufficient to make multiple tag bit determinations.

複数の方法による配列決定
一部の実施形態では、一過的な結合による配列決定の後、第2の方法による配列決定が、同じ分子上で開始され得る。例えば、より長いより安定なオリゴヌクレオチドが結合して、合成による配列決定を開始することができる。
Sequencing by Multiple Methods In some embodiments, after sequencing by transient binding, sequencing by a second method can be initiated on the same molecule. For example, longer, more stable oligonucleotides can bind to initiate sequencing-by-synthesis.

標的ポリヌクレオチド
ポリヌクレオチドという用語は、DNA、RNA、およびそれらのバリアントまたは模倣体を指し、核酸と同義的に使用され得る。単一標的ポリヌクレオチドは、1つの核酸鎖である。核酸鎖は、二本鎖であるか、または一本鎖である。ポリマーは、長鎖非コード(lnc)RNA、mRNA、染色体、ミトコンドリアDNAなどの完全長の天然ポリヌクレオチドを含み得るか、またはそれは、少なくとも200塩基長のポリヌクレオチド断片であるが、好ましくは、少なくとも数千ヌクレオチド長であり、ゲノムDNAの場合、より好ましくは、数百キロ塩基長~数メガ塩基長である。
Target Polynucleotide The term polynucleotide refers to DNA, RNA, and variants or mimetics thereof, and may be used interchangeably with nucleic acid. A single target polynucleotide is one nucleic acid strand. A nucleic acid strand may be double-stranded or single-stranded. A polymer can comprise a full-length naturally occurring polynucleotide such as long non-coding (lnc) RNA, mRNA, chromosomal, mitochondrial DNA, or it is a polynucleotide fragment of at least 200 bases in length, but preferably at least It is several thousand nucleotides long, and in the case of genomic DNA, it is more preferably several hundred kilobases to several megabases long.

様々な態様および実施形態では、本発明は、例えば、生物学的環境からの抽出中にポリヌクレオチドの実質的に天然の長さを保存することによって、長い鎖長のポリヌクレオチドを得ることと、ポリヌクレオチドの長さに沿った場所をほとんどまたはまったく曖昧さなく追跡することができるように、ポリヌクレオチドを線状の状態で配置し、理想的には、ポリヌクレオチドが直線化、伸展、または伸長されることと、線状の状態で標的ポリヌクレオチドを配置する前または配置した後に、を含む。 In various aspects and embodiments, the present invention provides for obtaining long chain length polynucleotides, e.g., by preserving substantially the natural length of the polynucleotide during extraction from a biological environment; Polynucleotides are arranged in a linear fashion so that their location along the length of the polynucleotide can be traced with little or no ambiguity, and ideally they are linearized, stretched or elongated. before or after placing the target polynucleotide in a linear state.

様々な実施形態では、単一標的ポリヌクレオチドは、染色体である。様々な実施形態では、単一標的ポリヌクレオチドは、約102、103、104、105、106、107、108、または109塩基長である。コムギの染色体3bは、9億9500万塩基長であり、一方、ヒトで最大の1番染色体は、2億4900万塩基である。様々な実施形態では、単一標的ポリヌクレオチドは、一本鎖である。様々な実施形態では、単一標的ポリヌクレオチドは、二本鎖である。 In various embodiments, the single target polynucleotide is a chromosome. In various embodiments, a single target polynucleotide is about 102, 103, 104, 105, 106, 107, 108, or 109 bases long. Wheat chromosome 3b is 995 million bases long, while the largest human chromosome 1 is 249 million bases. In various embodiments, a single target polynucleotide is single stranded. In various embodiments, a single target polynucleotide is double-stranded.

単一標的ヌクレオチドは、好ましくは、天然ポリヌクレオチドである。単一標的ヌクレオチドは、ゲノムDNAなどの二本鎖であり得る。単一標的ポリヌクレオチドは、mRNAなどの一本鎖であり得る。単一の二本鎖標的ポリヌクレオチドは、二重鎖の各鎖がオリゴによる結合に利用可能であるように、変性され得る。単一ポリヌクレオチドは、損傷され、修復される。様々な実施形態では、単一標的ポリヌクレオチドは、染色体のDNAの全長である。染色体のDNAの全長は、抽出することなく細胞内に留まることができる。配列決定は、染色体DNAが間期に畳み込み経路をたどる細胞内で行うことができる。インサイツでのオリゴの安定した結合が実証されている:B.Beliveau,A et al Nature Communications 6 7147(2015)。そのようなインサイツでの結合オリゴおよび3D空間におけるそれらのナノメトリック位置決定は、細胞内の染色体分子の配列および領域配置を決定することを可能にすることができる。本発明は、オリゴの結合が安定しておらず、一過性であり、染色体領域の超微細解像度を可能にするという点で異なる。同様に、RNA(例えば、マイクロRNA、mRNA、lncRNA)の場所および量は、それらの結合オリゴへの結合パターンによって決定することができる。 A single target nucleotide is preferably a naturally occurring polynucleotide. A single target nucleotide can be double-stranded, such as genomic DNA. A single target polynucleotide can be single-stranded, such as mRNA. A single double-stranded target polynucleotide can be denatured such that each strand of the duplex is available for binding by an oligo. A single polynucleotide is damaged and repaired. In various embodiments, a single target polynucleotide is the entire length of chromosomal DNA. Full-length chromosomal DNA can remain in cells without extraction. Sequencing can be performed in cells where chromosomal DNA undergoes a folding pathway during interphase. Stable binding of oligos in situ has been demonstrated:B. Beliveau, A et al Nature Communications 6 7147 (2015). Such in situ binding oligos and their nanometric positioning in 3D space can allow one to determine the sequence and regional arrangement of chromosomal molecules within a cell. The present invention differs in that the binding of oligos is not stable and transient, allowing ultra-fine resolution of chromosomal regions. Similarly, the location and quantity of RNAs (eg, microRNAs, mRNAs, lncRNAs) can be determined by their binding patterns to binding oligos.

感度の限界への到達
分子が細胞から遊離されると、実質的にすべての分子が配列決定に利用可能になる。まず、関連する場合、分子が付着するのを防ぐために、領域を不動態化する。次に、実質的にすべての分子は、2つの方法のうちの1つで捕捉される。初めて、分子はチャネル内を流れ続け、チャネルの長さにわたって確率的に捕捉され、これは実質的にすべての分子が最終的に捕捉されるのに十分な長さである。このため、チャネルは、蛇行したチャネルであり得、小さなスペースに、非常に長い長さを詰め込むことができる。第二に、1つ以上の細胞から遊離されるすべての分子を、3D空間で個別に解像可能なように、十分に流動および分離させる。次いで、溶液をゼリー化する。すなわち、固体-ゲル転移であり、そのため、分子は3D空間に固定化されるようになる。次いで、分子を本発明の配列決定方法に供することができ、3D空間は、光シート顕微鏡法または回転ディスク顕微鏡法および3D単一分子局在化などの3D切片化法によって調べることができる。
Reaching the Limits of Sensitivity Once a molecule is released from the cell, virtually all of it becomes available for sequencing. First, where relevant, the regions are passivated to prevent the molecules from sticking. Substantially all molecules are then captured in one of two ways. For the first time, molecules continue to flow in the channel and are stochastically trapped over the length of the channel, long enough that virtually all molecules are eventually trapped. Thus, the channel can be a serpentine channel, allowing very long lengths to be packed into a small space. Second, it allows all molecules released from one or more cells to flow and separate sufficiently to be individually resolvable in 3D space. The solution is then jellified. ie, a solid-gel transition, whereby molecules become immobilized in 3D space. Molecules can then be subjected to the sequencing methods of the invention and the 3D space can be interrogated by 3D sectioning methods such as light sheet or spinning disk microscopy and 3D single molecule localization.

表面でのポリヌクレオチドの捕捉
一部の実施形態では、標的ポリヌクレオチドは、その末端との疎水性相互作用を介して、表面に付着される。一部の実施形態では、ポリヌクレオチドと表面との接触は、末端が解れ、疎水性の一本鎖が曝露されるようにする厳密な条件下で行われる。
Capturing Polynucleotides on Surfaces In some embodiments, target polynucleotides are attached to surfaces via hydrophobic interactions with their termini. In some embodiments, the contacting of the polynucleotide with the surface is performed under stringent conditions such that the ends are cleaved and hydrophobic single strands are exposed.

一部の実施形態では、フローセルを使用して、後退メニスカスを介して伸展を生成するか、またはフロー伸展を行うよりもむしろ、カバーガラスを、ポリヌクレオチドを有するトラフに浸漬し、溶液からカバーガラスを引き抜く際に、ポリヌクレオチドがコーミングされる。 In some embodiments, rather than using a flow cell to create an extension or flow extension through a receding meniscus, the coverslip is immersed in a trough with polynucleotides and the coverslip is removed from the solution. Polynucleotides are combed when pulling out.

一部の実施形態では、電場を使用して、負に帯電したポリヌクレオチド(より大きな割合の試料が、サンプリングされ得るように)を、場合によっては、オリゴプローブを、表面に引き寄せることができる。 In some embodiments, an electric field can be used to attract negatively charged polynucleotides (so that a greater proportion of the sample can be sampled), and in some cases oligoprobes, to the surface.

表面でのポリヌクレオチドの固定
一端を固定化し、流動させることで、揺動、伸展および収縮などが可能になる。ポリマーの長さに沿った伸展の程度の変動(収縮および拡張)により、x-y座標は、あるサイクルと次のサイクルとの間の標的の特定の位置を保証することができない。
Immobilization of Polynucleotides on Surfaces Immobilizing one end and allowing it to flow allows rocking, extension and contraction, and the like. Due to variations in the degree of stretching (contraction and expansion) along the length of the polymer, the xy coordinates cannot guarantee a specific position of the target from one cycle to the next.

一部の実施形態では、再現性のある、高い精度および正確な位置決定を得るために、ポリマーに沿った複数の場所の相対位置が変動を受けないことが望ましい。このような場合、伸長された分子は、その長さに沿った複数の接触点によって、表面に固定化または固定される必要がある。 In some embodiments, it is desirable that the relative positions of multiple locations along the polymer are not subject to variation in order to obtain reproducible, high precision and accurate position determination. In such cases, the elongated molecule must be immobilized or anchored to the surface by multiple contact points along its length.

したがって、一部の実施形態では、ポリマーは、複数の相互作用によって表面に接触する(分子コーミング技術で行われる(Michalet et al,Science 1999))。次いで、使用条件下で、相対場所が固定されることが知られている。このような事例を見たことはないが、一部が表面から外れて、再び付着するような外れ値があることを考慮する。 Thus, in some embodiments, the polymer contacts the surface through multiple interactions (performed by molecular combing techniques (Michalet et al, Science 1999)). Then, under conditions of use, the relative location is known to be fixed. I haven't seen a case like this, but consider outliers where some detach from the surface and reattach.

したがって、一部の実施形態では、長いポリマーが分析され、長いポリマーは、表面またはマトリックスと複数の相互作用を形成する。 Thus, in some embodiments, long polymers are analyzed and the long polymers form multiple interactions with the surface or matrix.

一部の態様では、本発明は、単一分子上の各塩基を複数回照合することを含む、希少バリアントの検出方法を含む。各一過的な結合事象は、1つ以上の塩基を照合し、各塩基は、複数の結合事象によって照合される。さらに、一部の実施形態では、各塩基は、配列が重複する複数のオリゴヌクレオチドによって(例えば、タイリングシリーズとして)、照合される。 In some aspects, the invention includes methods of detecting rare variants that involve multiple matching of each base on a single molecule. Each transient binding event matches one or more bases, and each base is matched by multiple binding events. Further, in some embodiments, each base is matched by multiple oligonucleotides that overlap in sequence (eg, as a tiling series).

ポリヌクレオチド伸長
様々な実施形態では、本方法は、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または体液由来の単一標的ポリヌクレオチド分子を、インタクトな標的ポリヌクレオチドとして抽出することをさらに含む。標的ポリヌクレオチドは、しばしば天然の折り畳まれた状態を占める。例えば、ゲノムDNAは、染色体において高度に凝縮されているが、RNAは、二次構造を形成する。本発明の様々な実施形態では、ポリヌクレオチドを展開するためのステップが取られる。様々な実施形態では、標的ポリヌクレオチド分子は、その骨格を追跡することができるように、線状の状態で提供される。様々な実施形態では、標的ポリヌクレオチド分子は、伸長されている。かかる伸長により、結晶学的距離(ある塩基から次の塩基への0.34nmの分離)と等しく、それよりも長く、またはそれよりも短くなり得る。一部の実施形態では、ポリヌクレオチドは、結晶学的距離を超えて伸展される。
Polynucleotide Extension In various embodiments, the method further comprises extracting a single target polynucleotide molecule from a cell, organelle, chromosome, virus, exosome, or bodily fluid as an intact target polynucleotide. Target polynucleotides often occupy their native folded state. For example, genomic DNA is highly concentrated in chromosomes, whereas RNA forms secondary structures. In various embodiments of the invention, steps are taken to expand the polynucleotide. In various embodiments, the target polynucleotide molecule is provided in a linear state so that its backbone can be traced. In various embodiments, the target polynucleotide molecule is elongated. Such extensions can be equal to, longer than, or shorter than the crystallographic distance (0.34 nm separation from one base to the next). In some embodiments, the polynucleotide is extended beyond the crystallographic distance.

様々な実施形態では、標的ポリヌクレオチドは、ゲルまたはマトリックス中に配置される。様々な実施形態では、標的ポリヌクレオチドは、ゲルまたはマトリックス中に抽出される。様々な実施形態では、標的ポリヌクレオチドは、マイクロ流体フローセルまたはチャネル内で抽出される。 In various embodiments, the target polynucleotide is placed in a gel or matrix. In various embodiments, target polynucleotides are extracted into a gel or matrix. In various embodiments, target polynucleotides are extracted in microfluidic flow cells or channels.

様々な実施形態では、標的ポリヌクレオチド分子は、表面に固定化される。ポリヌクレオチドは、平面に対して平行に、または表面に対して垂直に配置され得る。それらが平面に対して平行である場合、それらの長さは、CMOSまたはCCDカメラなどの2Dアレイ検出器内の隣接する一連の画素にわたって撮像することができる。それらが表面に対して垂直である場合、それらの長さは、光シート顕微鏡または走査ディスク共焦点顕微鏡またはそのバリアントを介して撮像することができる。 In various embodiments, the target polynucleotide molecule is immobilized on a surface. Polynucleotides can be oriented parallel to a plane or perpendicular to a surface. If they are parallel to the plane, their length can be imaged over a series of adjacent pixels in a 2D array detector such as a CMOS or CCD camera. If they are perpendicular to the surface, their length can be imaged via light sheet microscopy or scanning disk confocal microscopy or variants thereof.

一部の実施形態では、ポリヌクレオチドは、分子コーミングを介して伸展される(例えば、Michalet et al,Science 277:1518(1997)およびDeen et al,ACS Nano 9:809-816(2015)に記載されている)。これは、数百万および数十億の分子を並列に伸展および一方向に整列させることを可能にし得る。一部の実施形態では、分子コーミングは、表面上の流体/液体の前面を移動させることによって行われる。一部の実施形態では、分子コーミングは、Petit et al.Nano Letters 3:1141-1146(2003)に記載されている方法または方法の修正バージョンを使用して、チャネル中で行われる。 In some embodiments, the polynucleotide is extended via molecular combing (see, eg, Michaelet et al, Science 277:1518 (1997) and Deen et al, ACS Nano 9:809-816 (2015)). is being used). This can allow parallel stretching and unidirectional alignment of millions and billions of molecules. In some embodiments, molecular combing is performed by moving a fluid/liquid front on the surface. In some embodiments, molecular combing is as described in Petit et al. Nano Letters 3:1141-1146 (2003), or a modified version of the method, in the channel.

気液界面の形状は、伸長ポリヌクレオチドの配向を決定する。一部の実施形態では、ポリヌクレオチドは、気液界面に対して垂直に伸長される。一部の実施形態では、標的ポリヌクレオチドは、その末端の一方または両方の修飾なしで、表面に付着される。一部の実施形態では、末端が疎水性相互作用によって捕捉され、後退メニスカスによる伸展は、二重鎖の部分を変性させ、表面とのさらなる疎水性相互作用をもたらす。 The shape of the air-liquid interface determines the orientation of the elongated polynucleotide. In some embodiments, the polynucleotide is elongated perpendicular to the air-liquid interface. In some embodiments, the target polynucleotide is attached to the surface without modification of one or both of its termini. In some embodiments, the terminus is trapped by hydrophobic interactions, and extension by a receding meniscus denatures portions of the duplex, resulting in additional hydrophobic interactions with the surface.

一部の実施形態では、ポリヌクレオチドは、分子スレッディングを介して伸展される(例えば、Payne et al,PLoS ONE 8(7):e69058(2013)に記載されている)。一部の実施形態では、分子スレッディングは、標的が(例えば、化学変性剤、温度、または酵素によって)一本鎖化された後に行われる。一部の実施形態では、ポリヌクレオチドは、一端で繋がれ、次いで、流体の流れの中で伸展される(例えば、Greene et al,Methods in Enzymology,327:293-315に記載されている)。一部の実施形態では、ポリヌクレオチドは、一端で繋がれ、次いで電場によって伸展される(例えば、Giese et al Nature Biotechnology 26:317-325(2008)に記載されている)。 In some embodiments, the polynucleotide is extended via molecular threading (eg, described in Payne et al, PLoS ONE 8(7):e69058 (2013)). In some embodiments, molecular threading is performed after the target is single-stranded (eg, by chemical denaturants, temperature, or enzymes). In some embodiments, the polynucleotide is tethered at one end and then extended in fluid flow (eg, as described in Greene et al, Methods in Enzymology, 327:293-315). In some embodiments, the polynucleotide is tethered at one end and then stretched by an electric field (eg, as described in Giese et al Nature Biotechnology 26:317-325 (2008)).

様々な実施形態では、標的ポリヌクレオチド分子は、ゲル中に配置される。様々な実施形態では、標的ポリヌクレオチド分子は、マイクロ流体チャネルに配置される。様々な実施形態では、標的ポリヌクレオチドは、一端で表面に付着し、流れの内で伸長される。 In various embodiments, the target polynucleotide molecules are placed in a gel. In various embodiments, target polynucleotide molecules are disposed in microfluidic channels. In various embodiments, the target polynucleotide is attached to the surface at one end and elongated in flow.

一部の実施形態では、伸展は、電気泳動によるものである。一部の実施形態では、伸展は、ナノ束縛によるものである。一部の実施形態では、伸展は、流体力学的抗力によるものである。一部の実施形態では、ポリヌクレオチドは、クロスフローナノスリット内で伸展される(例えば、Marie et al.Proc Natl Acad Sci U S A.110:4893-8(2013)によって記載される)。 In some embodiments, spreading is by electrophoresis. In some embodiments, unfolding is through nano-binding. In some embodiments, extension is due to hydrodynamic drag. In some embodiments, the polynucleotide is stretched within a cross-flow nanoslit (eg, described by Marie et al. Proc Natl Acad Sci USA. 110:4893-8 (2013)).

一部の実施形態では、マイクロ流体またはナノ流体フローセルを介してポリヌクレオチドをナノチャネルに挿入するのではなく、チャネルの壁が形成される表面を電気的に印加するような方法でチャネルを構築することによって、ポリヌクレオチドをオープントップチャネルに挿入する(例えば、Asanov A N,Wilson W W,Oldham P B.Anal Chem.1998 Mar.15;70(6):1156-6を参照されたい)。負に帯電したポリヌクレオチドがナノチャネル内に引き寄せられるように、正のバイアスが表面に印加される。チャネル壁の稜はバイアスを含まないため、ポリヌクレオチドがそこに沈着する可能性が低く、耐汚染性の特徴を有し、かつ脂質、BSA、カエシン、PEGなどで不動態化されている材料を用いて作製またはコーティングすることができる。一部の実施形態では、ナノチャネルに引き寄せられるポリヌクレオチドは、チャネル内でナノ束縛され、それによって、伸長される。一部の実施形態では、ナノ束縛後、ポリヌクレオチドは、バイアス表面上、または表面上のコーティングもしくはマトリックス上に沈着する。表面は、酸化インジウムスズ(ITO)を含み得る。 In some embodiments, rather than inserting a polynucleotide into a nanochannel through a microfluidic or nanofluidic flow cell, the channel is constructed in such a way as to electrically apply the surface on which the channel walls are formed. Polynucleotides are inserted into the open top channel by (see, eg, Asanov A N, Wilson W W, Oldham P B. Anal Chem. 1998 Mar. 15;70(6):1156-6). A positive bias is applied to the surface such that negatively charged polynucleotides are attracted into the nanochannel. Since the ridges of the channel walls do not contain biases, polynucleotides are less likely to deposit there, and materials that have contamination-resistant characteristics and are passivated with lipids, BSA, caesin, PEG, etc. can be made or coated with In some embodiments, polynucleotides that are attracted to a nanochannel are nanobound and thereby elongated within the channel. In some embodiments, after nanobinding, the polynucleotides are deposited onto the bias surface or onto a coating or matrix on the surface. The surface may comprise indium tin oxide (ITO).

一部の実施形態では、ポリヌクレオチドは、すべてが同じ方向にうまく整列されるわけではないか、またはそれらは直線状ではなく、むしろ2Dまたは3D空間にわたって曲線状の経路をとり、直線状にうまく整列された分子と同じ種類の情報を得ることができるが、画像処理タスクはより困難であり、異なる方向をとる分子の場合、それらが重複する可能性が高くなり、エラーにつながる。しかしながら、これは、配列決定が、細胞内で、インサイツで、ポリヌクレオチド上で行われる場合、必要悪である。 In some embodiments, the polynucleotides are not all well aligned in the same direction, or they are not linear, but rather take curvilinear paths through 2D or 3D space and are well linearly aligned. The same kind of information can be obtained with aligned molecules, but the image processing task is more difficult and for molecules that take different orientations, they are more likely to overlap, leading to errors. However, this is a necessary evil when sequencing is performed intracellularly, in situ, on polynucleotides.

様々な実施形態では、本方法は、ポリヌクレオチドを、単一もしくは複数の染色体、エキソソーム、核、または細胞から、フローチャネルに遊離することをさらに含む。 In various embodiments, the method further comprises releasing polynucleotides from single or multiple chromosomes, exosomes, nuclei, or cells into the flow channel.

様々な実施形態では、フローチャネルの壁は、ポリヌクレオチドの集積を防止する不動態化を含む。様々な実施形態では、不動態化は、カゼイン、PEG、脂質、またはウシ血清アルブミン(BSA)のコーティングを含む。 In various embodiments, the walls of the flow channel comprise passivation to prevent accumulation of polynucleotides. In various embodiments, passivation comprises a coating of casein, PEG, lipids, or bovine serum albumin (BSA).

伸長された、拡張された、伸展された、線状化された、直線化された、という用語は、互換的に使用することができ、一般に、複数の結合部位が、それらが離れているヌクレオチドの数と多かれ少なかれ相関する物理的距離によって分離されていることを意味する。物理的距離がいくつかの塩基と一致する程度の幾分の不確かさは、許容され得る。伸長または伸展が、ポリヌクレオチドの全長に沿って均一でない場合、物理的距離は、ポリヌクレオチドの全長にわたる同じ比を有する塩基の数と相関しない。これは、無視できる程度に起こり得、アルゴリズムによって効果的に無視または処理され得る。これがかなりの程度発生した場合、他の措置が必要である。例えば、ポリヌクレオチドのいくつかのセグメントでは、伸展は、結晶学的距離の90%であり、他の領域では、約50%発散し得る。それを処理する1つの方法は、アセンブリアルゴリズムを介して、連続した配列をまとめる行うことである。ある極端な例では、アルゴリズムは距離データを必要とせず、リードの順序のみを必要とする。これを処理する別の方法は、JOJO-1またはYOYO-1などの挿入色素を使用して、ポリヌクレオチドの長さを染色することであり、次いで、ポリヌクレオチドが特定のセグメントであまり伸展されていない場合、より伸展されているセグメントと比較して、より多くの色素シグナルがポリヌクレオチドのセグメント上で見られるであろう。統合された色素シグナルは、原点間の距離を計算するための方程式の一部として使用することができる。 The terms elongated, extended, stretched, linearized and linearized can be used interchangeably and generally multiple binding sites are separated by nucleotides separated by a physical distance that more or less correlates with the number of Some uncertainty to the extent that physical distances are consistent with some bases can be tolerated. Physical distance does not correlate with the number of bases having the same ratio over the length of the polynucleotide if the extension or extension is not uniform along the length of the polynucleotide. This can occur to a negligible degree and can be effectively ignored or handled by the algorithm. If this occurs to any significant extent, other measures are necessary. For example, in some segments of the polynucleotide the stretch can be 90% of the crystallographic distance, while in other regions it diverges by about 50%. One way to handle it is to put the contiguous sequences together via an assembly algorithm. At one extreme, the algorithm does not need the distance data, only the order of the reads. Another way of dealing with this is to use an intercalating dye such as JOJO-1 or YOYO-1 to stain the length of the polynucleotide, and then the polynucleotide is too stretched in a particular segment. If not, more dye signal will be seen on the segment of the polynucleotide compared to the more extended segment. The integrated dye signal can be used as part of the equation to calculate the distance between origins.

様々な実施形態では、標的ポリヌクレオチド分子は、インタクトである。標的が天然ゲノムDNAである場合、オリゴヌクレオチドが結合する前に、それを一本鎖にすることができる。これは、最初に、添加されたポリヌクレオチドを伸長または伸展し、次いで、変性溶液(例えば、0.5Mまたは1MのNaOH)を添加して、2つの鎖を分離することによって、行うことができる。オリゴは、より高度に安定した二重鎖を形成することができるように、修飾され得る。オリゴは、遊離3’末端を有し、そこから伸長が生じて、安定性を増大させ得る。一部の実施形態では、オリゴは、ゲノムの特異的超頻繁標的部位を標的化し得る(例えば、Liu et al BMC Genomics 9:509 2008に記載されている)。 In various embodiments, the target polynucleotide molecule is intact. If the target is native genomic DNA, it can be rendered single-stranded prior to oligonucleotide binding. This can be done by first elongating or extending the added polynucleotide and then adding a denaturing solution (eg, 0.5 M or 1 M NaOH) to separate the two strands. . Oligos can be modified so that they can form more stable duplexes. Oligos have free 3' ends from which extensions can occur to increase stability. In some embodiments, oligos may target specific hyper-frequent target sites in the genome (eg, as described in Liu et al BMC Genomics 9:509 2008).

オリゴは、ライブラリを含み得、カスタムマイクロアレイ合成を使用して作製される。マイクロアレイ作製ライブラリは、ゲノムの特定の部位(例えば、がんパネルなどの特定の疾患のすべてのエキソンまたはパネル)を標的とするオリゴを含むことができる。マイクロアレイ作製ライブラリは、ポリヌクレオチドにわたって一定の距離間隔で場所に系統的に結合するオリゴを含むことができる。例えば、100万個のオリゴを含むライブラリは、3000塩基ごとに結合する。1000万個のオリゴを含むライブラリは、300塩基ごとに結合するように設計することができ、3000万個のオリゴを含むライブラリは、100塩基ごとに結合するように設計することができる。オリゴの配列は、参照ゲノム配列に基づいて、計算的に設計することができる。例えば、オリゴが1000塩基ごとに結合するように設計されているが、1回または数ラウンドのヌクレオチド組み込み後、距離が発散することが明らかになる場合、参照と比較して構造多型が生じていることを示す。オリゴのセットは、まず、それらを使用して、参照自体からのポリヌクレオチドの配列決定を起源とすることによって検証することができ、適切な場所への結合に失敗したオリゴは、将来のライブラリから省略することができる。 Oligos can include libraries and are created using custom microarray synthesis. A microarray-generated library can contain oligos targeted to specific sites of the genome (eg, all exons or panels of a specific disease, such as a cancer panel). A microarray-generated library can contain oligos that are systematically linked to locations at regular distance intervals across the polynucleotide. For example, a library containing 1 million oligos will bind every 3000 bases. A library containing 10 million oligos can be designed to bind every 300 bases and a library containing 30 million oligos can be designed to bind every 100 bases. The sequences of oligos can be computationally designed based on the reference genome sequence. For example, if an oligo is designed to bind every 1000 bases, but after one or several rounds of nucleotide incorporation, the distance becomes apparent to diverge, then a structural polymorphism occurs compared to the reference. indicate that A set of oligos can be validated by first using them to originate polynucleotide sequencing from the reference itself, and oligos that fail to bind in place will be excluded from future libraries. can be omitted.

ポリヌクレオチドに沿った緊密に間隔を置いたシグナルの検出
走査型プローブ顕微鏡法(高速AFMを含む)および電子顕微鏡法などのいくつかの検出方法は、ポリヌクレオチド分子が検出面で伸長されたときに、ナノメトリック距離を解像することができる。さらに、STED、確率的光学再構築顕微鏡法(STORM)、超解像光学ゆらぎ撮像法(SOFI)、単一分子局在顕微鏡法(SMLM)などの超解像光学法は、そのような距離を解像することが可能である。これらの方法を包含するが、本発明は、特に、ナノスケールトポグラフィーのための点集積(PAINT)に最も類似したSMLMアプローチを利用する。
Detection of Tightly Spaced Signals Along Polynucleotides Several detection methods, such as scanning probe microscopy (including high-speed AFM) and electron microscopy, detect when a polynucleotide molecule is elongated across the detection surface. , can resolve nanometric distances. Moreover, super-resolution optical methods such as STED, stochastic optical reconstruction microscopy (STORM), super-resolution optical fluctuation imaging (SOFI) and single-molecule localization microscopy (SMLM) can measure such distances. can be resolved. Although encompassing these methods, the present invention specifically utilizes the SMLM approach, which is most similar to point integration for nanoscale topography (PAINT).

本発明は、単に単一の結合位置を短いDNA標的に位置決定することに留まらない。本発明の新規の態様は、ポリヌクレオチドの長さに沿って単一のオリゴ種の複数の結合位置を位置決定することである。本発明の別の新規の態様は、ポリヌクレオチド上の複数のオリゴヌクレオチド種の結合を位置決定することである。本発明の別の新規の態様は、単一のオリゴヌクレオチド種または複数のオリゴヌクレオチド種の結合位置間の距離を決定することである。本発明の別の新規の態様は、ポリヌクレオチドに沿った複数の結合位置のナノメトリック場所を決定することである。本発明の別の新規の態様は、ポリヌクレオチドのアレイに存在する特定のポリヌクレオチドに、プローブ結合事象を割り当てることである。本発明の別の新規の態様は、ポリヌクレオチドに沿った、複数の種類の化学実体(例えば、配列結合プローブ、エピゲノムマーク結合プローブ)の複数の結合位置のナノメトリック場所を決定することである。本発明の別の新規の態様は、ポリヌクレオチドへのエピゲノム結合プローブをナノメトリック的に位置決定することを含む。本発明の別の態様は、単一のポリヌクレオチド上の配列の反復的な照合による配列の検出において、正確度を高めることである。本発明の別の新規の態様は、オリゴヌクレオチドの完全なレパートリーの場所を決定することによって、ポリヌクレオチドの配列を決定することである。本発明の別の新規の態様は、オリゴヌクレオチドのタイリングアレイの場所を決定することによって、ポリヌクレオチドの標的セグメントの配列を決定することである。 The present invention goes beyond simply localizing a single binding site to a short DNA target. A novel aspect of the present invention is the positioning of multiple binding sites of a single oligospecies along the length of a polynucleotide. Another novel aspect of the invention is to locate the binding of multiple oligonucleotide species on a polynucleotide. Another novel aspect of the present invention is to determine the distance between binding positions of a single oligonucleotide species or multiple oligonucleotide species. Another novel aspect of the invention is determining the nanometric location of multiple binding sites along a polynucleotide. Another novel aspect of the present invention is the assignment of probe binding events to specific polynucleotides present in an array of polynucleotides. Another novel aspect of the invention is the determination of the nanometric location of multiple binding sites of multiple types of chemical entities (e.g., sequence binding probes, epigenomic mark binding probes) along a polynucleotide. Another novel aspect of the present invention involves nanometric positioning of epigenomic binding probes to polynucleotides. Another aspect of the invention is to increase accuracy in detecting sequences by repetitive matching of sequences on a single polynucleotide. Another novel aspect of the present invention is the determination of the sequence of polynucleotides by locating a complete repertoire of oligonucleotides. Another novel aspect of the present invention is to determine the sequence of a target segment of a polynucleotide by determining the location of a tiling array of oligonucleotides.

規則正しいアレイ
ポリヌクレオチドは、分子が所与の表面積内に最大限に充填され、それらが重複しないように、規則正しい様式で、表面上に提供され得る。これは、パターン化された表面、例えば、ポリヌクレオチド(例えば、1Mbp長)の末端が結合する場所で、次のパッチがポリヌクレオチドの末端をちょうど超える場所に、疎水性パッチの規則正しい配置を作製することによって行うことができる。代替的に、オリゴヌクレオチドの空間的にアドレス指定可能なアレイを使用して、ポリヌクレオチドを捕捉することができる。ポリヌクレオチドは、一本鎖であり、ポリAテールなどの共通の配列を有する(例えば、mRNA)。ポリヌクレオチドは、二本鎖であり、制限酵素によって生成される粘着末端を有する。例えば、レアカッティング制限酵素(例えば、Pmme1またはNOT1)を使用して、各々が共通の末端配列を含む長い断片を生成することができる。
Ordered Array Polynucleotides can be provided on a surface in a regular fashion such that the molecules are maximally packed within a given surface area and that they do not overlap. This creates an ordered arrangement of hydrophobic patches on a patterned surface, e.g., where the end of a polynucleotide (e.g., 1 Mbp long) binds, where the next patch is just beyond the end of the polynucleotide. It can be done by Alternatively, a spatially addressable array of oligonucleotides can be used to capture polynucleotides. Polynucleotides are single-stranded and have common sequences such as poly-A tails (eg, mRNA). Polynucleotides are double-stranded and have cohesive ends generated by restriction enzymes. For example, rare-cutting restriction enzymes (eg, Pmmel or NOTl) can be used to generate long fragments each containing common terminal sequences.

規則正しいアレイは、ナノ流体工学を使用して作製され得る。ある場合、表面が加工された(textured)ナノトレンチまたはナノグルーブ(例えば、幅100nm、深さ150nm)のアレイは、長いポリヌクレオチドを規則正しく並べるのに役立ち、あるポリヌクレオチドが別のポリヌクレオチドの侵入を排除する。別の場合、ナノピットアレイは、長いポリヌクレオチドのセグメントがピット中にあり、長いセグメントがピット間にある。規則正しいアレイも作製することができる。 Ordered arrays can be made using nanofluidics. In some cases, arrays of textured nanotrenches or nanogrooves (e.g., 100 nm wide, 150 nm deep) serve to order long polynucleotides, allowing one polynucleotide to penetrate another. Eliminate. In another case, the nanopit array has long polynucleotide segments in the pits and long segments between the pits. Regular arrays can also be made.

一過的なプローブの結合およびアセンブリによる配列決定
本発明の一部の実施形態では、配列決定リード自体は得られない。一過的なプローブの結合による配列決定の場合、リードは、ポリヌクレオチド上の特定の場所にハイブリダイズしたオリゴの相補体である。第1のレベルでは、アセンブリは、オリゴの結合によって収集された配列情報から行われる。従って、本発明の一部の実施形態は、
(i)ポリヌクレオチドを伸長することと、
(ii)ポリヌクレオチドを変性することと(例えば、標的がRNAである場合、二次構造を除去すること、または、標的がゲノムDNAなどの二本鎖DNAである場合、二重らせんを分離すること)、
(iii)不安定な相互作用で標的に結合する短いオリゴプローブを添加することと、
(iv)各短いオリゴプローブの結合場所を決定することと、を含む。
Sequencing by Transient Probe Binding and Assembly In some embodiments of the invention, the sequencing reads themselves are not obtained. In the case of sequencing by transient probe binding, a read is the complement of an oligo hybridized to a specific location on the polynucleotide. At the first level, assembly is done from the sequence information gathered by the ligation of oligos. Accordingly, some embodiments of the invention include:
(i) extending the polynucleotide;
(ii) denaturing the polynucleotide (e.g. removing secondary structure if the target is RNA or separating the duplex if the target is double stranded DNA such as genomic DNA) thing),
(iii) adding a short oligoprobe that binds to the target with labile interactions;
(iv) determining the binding location of each short oligo probe.

一部の実施形態では、各オリゴ配列を、一度に1つずつ添加する。一部の実施形態では、オリゴは、その同一性がデコードされ得るタグ(例えば、直交的なオリゴのセットが結合され得るか、またはその同一性を決定する配列タグ)を有する。一部の実施形態では、一度に1つを超えるオリゴが添加される。一部の実施形態では、デコード可能な限り多くのオリゴが添加される。例えば、16個の異なるコードが利用可能である場合、コードのうちの1つを各々有する16個のオリゴ配列が同時に添加される。一部の実施形態では、実質的により多くのオリゴが添加され、DNA折り紙などの光学バーコードを使用することによって区別する(例えば、Nat Chem.10:832-9,2012に記載されている)。一部の実施形態では、オリゴの完全なセット、例えば、5塩基長または6塩基長ごと(任意選択的に、縮重位置または普遍的位置で補充される)が使用される。 In some embodiments, each oligo sequence is added one at a time. In some embodiments, an oligo has a tag whose identity can be decoded (eg, a sequence tag to which a set of orthogonal oligos can be bound or to determine its identity). In some embodiments, more than one oligo is added at a time. In some embodiments, as many oligos as decodable are added. For example, if 16 different codes are available, 16 oligo sequences each having one of the codes are added simultaneously. In some embodiments, substantially more oligos are added and differentiated by using optical barcodes such as DNA origami (described, for example, in Nat Chem. 10:832-9, 2012). . In some embodiments, a complete set of oligos is used, eg every 5 or 6 bases in length (optionally supplemented with degenerate or universal positions).

第2のレベルでは、第1のレベルでアセンブリされたポリヌクレオチドの重複によって、染色体全体のアセンブリが行われる。十分な長さの重複が存在する場合、ハプロタイプフェーズドアセンブリを行うことができる。 At the second level, the assembly of the entire chromosome is performed by duplication of the polynucleotides assembled at the first level. If sufficient long overlaps exist, haplotype phased assembly can be performed.

競合を介してもたらされる一過的なプローブの結合
オリゴプローブの結合は、動的プロセスであり、結合されるプローブは(温度および塩濃度を含む様々な要因によって決定される速度で)常にゆらいでいること(breathing)が理解されなければならず、したがって、ある鎖が別の鎖に置換される機会がある。例えば、一実施形態では、プローブの相補体が使用され、表面上の伸展された標的DNAおよび溶液中の相補体へのアニーリング間の連続的な競合が生み出される。別の実施形態では、プローブは、3つの部分を有する。第1の部分は、標的に相補的であり、第2の部分は、標的に部分的に相補的であり、かつ溶液中のオリゴに部分的に相補的であり、第3の部分は、溶液中のオリゴに相補的である。
Transient Probe Binding Driven Through Competition Oligoprobe binding is a dynamic process in which the bound probe is constantly fluctuating (at a rate determined by various factors including temperature and salt concentration). Breathing must be understood and therefore there is an opportunity for one strand to be substituted for another. For example, in one embodiment, the complement of the probe is used to create a continuous competition between the stretched target DNA on the surface and the annealing to the complement in solution. In another embodiment, the probe has three parts. The first portion is complementary to the target, the second portion is partially complementary to the target and partially complementary to the oligo in solution, and the third portion is complementary to the solution. is complementary to the oligo in the

一部の実施形態では、(例えば、Nature Methods 10:865(2013)に記載される)不一致標的に結合したときに競合的に不安定化される部分的二本鎖を含む、トーホールドプローブ(Toehold probe)を使用する(例えば、Nature Chemistry 5,782-789(2013)に記載される)。 In some embodiments, toehold probes (e.g., as described in Nature Methods 10:865 (2013)) comprising partial duplexes that are competitively destabilized when bound to mismatched targets ( Toehold probe) is used (described, for example, in Nature Chemistry 5, 782-789 (2013)).

この方法は、一過的なプローブの結合による配列決定の正確度を確保することができる。本方法は、
(i)ポリヌクレオチドを伸長することと、
(ii)ポリヌクレオチドが一本鎖ではない場合、実質的に一本鎖にすることと(例えば、変性により)、
(iii)トーホールドプローブセットのレパートリーを、標的ポリヌクレオチドに適用することと、
(iv)レパートリーの各トーホールドプローブセットのトーホールドプローブセットからの1つのオリゴの結合の場所を決定することと、
(v)レパートリーのすべてのトーホールドプローブの位置決定データに基づいて、配列を再構築することと、を含む。
This method can ensure the accuracy of sequencing by transient probe binding. The method is
(i) extending the polynucleotide;
(ii) if the polynucleotide is not single stranded, rendering it substantially single stranded (e.g., by denaturation);
(iii) applying the repertoire of toehold probe sets to a target polynucleotide;
(iv) determining the binding location of one oligo from each toehold probe set of the repertoire;
(v) reconstructing the sequence based on the localization data of all toehold probes in the repertoire.

一部の実施形態では、トーホールドプローブは、正しいハイブリダイゼーションを確実にするために使用される。一部の実施形態では、トーホールドプローブは、オフ反応を促進するために使用される。 In some embodiments, toehold probes are used to ensure correct hybridization. In some embodiments, toehold probes are used to facilitate off-reactions.

短距離配列のアセンブリおよび長距離配列を作成するための結合
一部の実施形態では、位置決定の正確度または精度は、配列ビットを一緒に繋ぎ合わせるのに十分ではない。プローブのサブセットは、特定の局所で結合することが見出されるが、厳密には、位置決定データから、それらの順序を、信頼性をもって決定することは困難である。ある場合、解像度は、回折限界である。一部の実施形態では、局所または回折限界スポット内の短距離配列は、局所またはスポット内に位置するプローブの配列重複によってアセンブリすることができる。したがって、例えば、オリゴのサブセットの個々の配列がどのように重複するかに関する情報を使用することによって、短距離配列がアセンブリされる。このようにして構築された短距離配列は、次いで、ポリヌクレオチド上のそれらの順序に基づいて、長距離配列へと一緒に繋ぎ合わされ得る。したがって、隣接または重複したスポットから得られた短距離配列を結合することによって、長距離配列が得られる。
Assembly of Short-Range Arrays and Joining to Create Long-Range Arrays In some embodiments, the localization accuracy or precision is not sufficient to stitch together alignment bits. A subset of probes are found to bind at specific localities, but precisely their order is difficult to reliably determine from localization data. In some cases, the resolution is diffraction limited. In some embodiments, short-range arrays within a local or diffraction-limited spot can be assembled by sequence overlap of probes located within the local or spot. Thus, for example, short-range sequences are assembled by using information about how the individual sequences of a subset of oligos overlap. Short-range sequences constructed in this manner can then be spliced together into long-range sequences based on their order on the polynucleotide. Thus, long-range sequences are obtained by combining short-range sequences obtained from adjacent or overlapping spots.

ホモポリマーおよび短いタンデムリピート
ホモポリマーの問題があり、長さがオリゴの長さよりも大きい場合、例えば、10塩基のホモポリマーの塩基数を列挙することは困難である。また、短いタンデムリピートは、列挙するのが難しい場合がある。これは、いくつかの方法、例えば、次のいずれかで対処することができる:
Homopolymers and short tandem repeats There is the problem of homopolymers, where it is difficult to enumerate the number of bases in a homopolymer, eg, 10 bases, when the length is greater than the length of the oligo. Also, short tandem repeats can be difficult to enumerate. This can be dealt with in several ways, e.g. one of the following:

1.反復が延びる正確な範囲を決定できるように、位置決定の正確度を高めること。 1. To increase the accuracy of position determination so that the exact extent to which iterations extend can be determined.

2.領域への結合の動態が、(任意の反復配列の)複数のタンデムコピーが存在する場合、または部分的なコピーが存在する場合でも異なること。コピー数は、結合速度の増加によって推定することができ、オフ速度は、ある部位に結合したオリゴが、3D空間を通過することなく別の隣接部位に移動し得るため、影響を受ける。 2. The kinetics of binding to the region differ when multiple tandem copies (of any repeat sequence) are present, or even when partial copies are present. Copy number can be estimated by the increase in binding rate and off-rate is affected as an oligo bound at one site can migrate to another adjacent site without passing through 3D space.

3.また、二重鎖の2つの鎖間の塩基の数は一致しなければならないこと。一致しない場合、不正確性が示唆される。 3. Also, the number of bases between the two strands of the duplex must match. A mismatch indicates inaccuracy.

4.ホモポリマーならびに5塩基長のレパートリーの場合、より長いホモポリマーオリゴ(例えば、6つのA、7つのA、8つのAなど)を、適切なTmで添加することができること。 4. For homopolymers as well as 5-base long repertoires, longer homopolymer oligos (eg, 6 A's, 7 A's, 8 A's, etc.) can be added at the appropriate Tm.

5.参照ゲノムを考慮に入れること。 5. Take into account the reference genome.

6.ホモポリマーまたは繰り返しが、一定の長さである可能性を提供すること。 6. To provide the possibility that homopolymers or repeats are of constant length.

ポリヌクレオチドの識別
ポリヌクレオチドの同一性は、その長さに沿ったプローブ結合のパターンによって決定することができる。同一性は、RNA種、RNAアイソフォームの同一性であり得る。これはまた、ポリヌクレオチドが対応する参照の場所であってもよい。
Polynucleotide Identification The identity of a polynucleotide can be determined by the pattern of probe binding along its length. Identity can be of RNA species, of RNA isoforms. It may also be the reference location to which the polynucleotide corresponds.

エピゲノム修飾の位置決定
メチル化分析を、配列決定とは直交的に行うことができる。一部の実施形態では、これは、配列決定の前に行われる。抗メチルC抗体またはメチル結合タンパク質(MeCP2、MBD1、MBD2、およびMBD4を含むメチル結合ドメイン(MBD)タンパク質ファミリー)、または(MBD1に基づく)ペプチドは、ポリヌクレオチドに結合することができ、標識を介してそれらの場所が検出された後、(例えば、高塩緩衝液、カオトロフィック試薬、SDS、プロテアーゼ、尿素、および/またはヘパリンを添加することによって)それらが除去される。好ましくは、オン・オフ結合を促進するか、または一過的に結合するように操作されている試薬を使用することで、試薬が一過的に結合する。
Localization of Epigenome Modifications Methylation analysis can be performed orthogonally to sequencing. In some embodiments, this is done prior to sequencing. Anti-methyl-C antibodies or methyl-binding proteins (the methyl-binding domain (MBD) protein family, including MeCP2, MBD1, MBD2, and MBD4), or peptides (based on MBD1), can bind to polynucleotides and via labels After their locations have been detected by , they are removed (eg, by adding high salt buffers, chaotrophic reagents, SDS, proteases, urea, and/or heparin). Preferably, reagents are transiently bound by facilitating on-off binding or by using reagents that have been engineered to transiently bind.

ヒドロキシメチル化またはDNA損傷部位などの他のポリヌクレオチド修飾の場合も、同様のアプローチがとられ、そのための抗体は、入手可能であるか、または産生され得る。修飾の場所が検出され、修飾結合試薬が除去された後、配列決定が開始され得る。一部の実施形態では、抗メチル抗体および抗ヒドロキシメチル抗体などが、標的ポリヌクレオチドが一本鎖になるように変性された後に、添加される。この方法は、非常に感度が高く、長いポリヌクレオチド上の単一の修飾を検出することができる。 A similar approach is taken for other polynucleotide modifications, such as hydroxymethylation or sites of DNA damage, for which antibodies are available or can be produced. After the sites of modification are detected and the modified binding reagents are removed, sequencing can begin. In some embodiments, anti-methyl antibodies, anti-hydroxymethyl antibodies, and the like are added after the target polynucleotide is denatured to be single stranded. This method is very sensitive and can detect single modifications on long polynucleotides.

メチル化などのDNA修飾用の参照エピゲノムは存在しない。有用であるためには、未知のポリヌクレオチドのメチル化マップを、核酸配列または配列ベースのマップに連結する必要がある。したがって、本発明のエピマッピング方法は、エピゲノムマップへのコンテキストを提供するために、オリゴ結合によって得られた配列ビットと相関させることができる。配列リードに加えて、配列情報を得る他の手段を、エピゲノムマップと共役することができる。これには、ニッキングエンドヌクレアーゼベースのマップ、オリゴ結合ベースのマップ、および変性および変性-再性マップが含まれる。一部の実施形態では、1つ以上のオリゴの一過的な結合を使用して、ポリヌクレオチドをマッピングすることができる。ゲノムに対する機能的修飾に加えて、同じアプローチを、DNA損傷およびタンパク質(例えば、転写因子)の部位またはリガンド結合などのゲノムにマッピングする他の特徴に適用することができる。 There is no reference epigenome for DNA modifications such as methylation. To be useful, a methylation map of an unknown polynucleotide must be linked to a nucleic acid sequence or sequence-based map. Thus, the epimapping method of the invention can be correlated with the sequence bits obtained by oligoconjugation to provide context to the epigenome map. In addition to sequence reads, other means of obtaining sequence information can be coupled with epigenome maps. This includes nicking endonuclease-based maps, oligo-ligation-based maps, and denaturation and denaturation-renaturation maps. In some embodiments, transient binding of one or more oligos can be used to map polynucleotides. In addition to functional modifications to the genome, the same approach can be applied to other features that map to the genome, such as DNA damage and protein (eg, transcription factor) sites or ligand binding.

本発明では、塩基配列決定またはエピゲノム配列決定のいずれかを最初に行うことができる。一部の実施形態では、両方とも同時に行うことができる。例えば、特異的エピ修飾に対する抗体は、オリゴから差次的にコードすることができ、低塩などの条件を使用することにより、両方の種類のプローブの結合が一過的になる。 In the present invention either sequencing or epigenome sequencing can be performed first. In some embodiments, both can be done simultaneously. For example, antibodies to specific epimodifications can be differentially encoded from oligos, and using conditions such as low salt results in transient binding of both types of probes.

一部の実施形態では、抗体を染色体またはクロマチン上で使用して、DNA上の修飾だけでなく、ヒストンアセチル化およびメチル化などのヒストン上の修飾も検出することができる。これらの修飾の場所は、抗体の染色体またはクロマチン上の場所への一過的な結合によって決定することができる。一部の実施形態では、抗体は、オリゴタグで標識され、一過的に結合しないが、それらの結合部位に永久的または半永久的に固定され得る。この場合、場所は、抗体にタグ付けするオリゴへの相補オリゴの一過的な結合を使用することによって、検出することができる。 In some embodiments, antibodies can be used on chromosomes or chromatin to detect not only modifications on DNA, but also modifications on histones such as histone acetylation and methylation. The location of these modifications can be determined by transient binding of the antibody to a chromosomal or chromatin location. In some embodiments, antibodies are labeled with oligotags that do not bind transiently, but can be permanently or semi-permanently anchored to their binding sites. In this case, the location can be detected by using transient binding of complementary oligos to the antibody-tagging oligos.

リードの場所保存のための試料の処理
一部の実施形態では、ポリヌクレオチドが伸長された後、ゲルオーバーレイが適用される。表面上での伸長および変性の後、ポリヌクレオチド(二本鎖または変性)をゲル層でカバーすることができる。代替的に、ポリヌクレオチドは、既にゲル環境にある中で、伸長される。一部の実施形態では、ポリヌクレオチドが伸長された後、ゲル中に投入される。例えば、ポリヌクレオチドが一端で表面に付着し、流れの中で、または電気泳動電流によって伸展されるとき、周囲の媒体がゲル中にキャストされ得る。これは、アクリルアミド、過硫酸アンモニウム、およびTEMEDを流れに含めることによって行うことができ、設定されると、ポリアクリルアミドになる。代替的に、熱に反応するゲルを適用することができる。一部の実施形態では、ポリヌクレオチドの末端は、アクリルアミドと重合するアクリダイトで修飾することができる。次いで、天然ポリヌクレオチドの骨格が負であることを考慮して、正極に向かってポリヌクレオチドを伸長する電場を印加することができる。
Processing Samples for Read Placement In some embodiments, a gel overlay is applied after the polynucleotides are extended. After extension and denaturation on the surface, the polynucleotides (double-stranded or denatured) can be covered with a gel layer. Alternatively, the polynucleotides are elongated while already in the gel environment. In some embodiments, the polynucleotides are elongated and then loaded into a gel. For example, when a polynucleotide is attached at one end to a surface and stretched in a stream or by an electrophoretic current, the surrounding medium can be cast into a gel. This can be done by including acrylamide, ammonium persulfate, and TEMED in the stream, which, when set, becomes polyacrylamide. Alternatively, a heat sensitive gel can be applied. In some embodiments, the ends of the polynucleotide can be modified with an acrylidite that polymerizes with acrylamide. An electric field can then be applied that elongates the polynucleotide towards the positive electrode, given that the backbone of native polynucleotides is negative.

一部の実施形態では、試料は、その環境のマトリックスに架橋され、これは細胞環境である。例えば、配列決定が細胞においてインサイツで行われる場合、ポリヌクレオチドは、ヘテロ二官能性架橋剤を使用して、細胞マトリックスに架橋される。これは、FISSEQなどの技術を使用して、配列決定が細胞内に直接適用されるときに行われた(例えば、Lee et al.Science 343:1360-3(2014)に記載されている)。 In some embodiments, the sample is crosslinked to the matrix of its environment, which is the cellular environment. For example, when sequencing is performed in situ in cells, polynucleotides are cross-linked to the cell matrix using heterobifunctional cross-linkers. This has been done when sequencing is directly applied intracellularly using techniques such as FISSEQ (described, for example, in Lee et al. Science 343:1360-3 (2014)).

一部の実施形態では、標的化配列決定を可能にするために、プローブのパネルを使用する。標的化配列決定が行われる場合、複合試料からのポリヌクレオチドのサブセット(例えば、全ゲノムまたはトランスクリプトーム)のみが分析される必要があるため、ポリヌクレオチドは、通常よりも高い密度で表面またはマトリックス上に配置され得る。したがって、回折限界空間内に伸長されたポリヌクレオチドがいくつか存在する場合でも、シグナルが検出されると、それが標的遺伝子座の1つのみからのものである可能性が高い。次いで、標的化配列決定に必要な撮像が、標的となる試料の分画と同時に行われることを可能にする。例えば、エキソンを含むゲノムの5%未満が標的化される場合、ポリヌクレオチドの密度は20倍大きくなり得、したがって、全ゲノムが分析される場合よりも撮像時間が10倍短くなり得る。 In some embodiments, panels of probes are used to enable targeted sequencing. When targeted sequencing is performed, only a subset of polynucleotides (e.g., the whole genome or transcriptome) from a complex sample needs to be analyzed, so that polynucleotides are spread over the surface or matrix at a higher than usual density. can be placed on. Therefore, even if there are some polynucleotides stretched into the diffraction limited space, if a signal is detected it is likely to be from only one of the target loci. It then allows the imaging necessary for targeted sequencing to occur simultaneously with the targeted sample fractionation. For example, if less than 5% of the exon-containing genome is targeted, the density of polynucleotides can be 20-fold greater, and thus imaging time can be 10-fold shorter than if the whole genome is analyzed.

一部の実施形態では、標的とされるゲノムの部分は、特定の遺伝子座である。他の実施形態では、標的とされるゲノムの部分は、遺伝子座のパネル、例えば、がんに関連する遺伝子、またはゲノムワイド関連解析によって識別された染色体間隔内の遺伝子である。標的遺伝子座はまた、ゲノムの暗黒物質、典型的には、反復的であるゲノムのヘテロクロマチン領域、ならびに反復領域の近傍にある複合遺伝子座であってもよい。そのような領域としては、テロメア、セントロメア、および末端動原体染色体の短腕、ならびにゲノムの他の低複雑度領域が挙げられる。従来の配列決定方法は、ゲノムの反復部分に対処することができないが、ナノメトリック精度が高い場合、本発明の方法は、これらの領域に網羅的に対処することができる。 In some embodiments, the portion of the genome targeted is a specific locus. In other embodiments, the portion of the genome targeted is a panel of loci, eg, genes associated with cancer, or genes within chromosomal intervals identified by genome-wide association studies. Target loci may also be the dark matter of the genome, typically heterochromatin regions of the genome that are repetitive, as well as complex loci near repetitive regions. Such regions include the telomeres, centromeres, and short arms of acrocentric chromosomes, as well as other low-complexity regions of the genome. Conventional sequencing methods cannot address repetitive parts of the genome, but with high nanometric precision, the method of the present invention can address these regions exhaustively.

本発明の利点は、高価で、時間がかかる個々の長い読み取りを実際に行うことなく、代わりに短いオリゴの結合によって得られる連続した配列情報または重複した配列情報を一緒に繋ぎ合わせることによって、長いリードを得ることができることである。複数の短い3、4、5、または6塩基ビットの配列情報が、単一のポリヌクレオチド分子の長さに沿って同時に得られ、したがって、それらはすべて連結され、ポリヌクレオチドがオン・オフ結合するオリゴで飽和した場合、それらのナノメトリック位置、解像度、および順序は、分子全体の配列を明らかにする。ポリヌクレオチドの配列決定は、分子のある場所から別の場所へのSbS反応によって得られる単一の長いリード(例えば、PacBio配列決定)ではなく、配列情報の複数のビットが同時に得られるため、現在の方法よりも時間がかからない。 An advantage of the present invention is that by splicing together contiguous or overlapping sequence information obtained by conjugation of short oligos instead of actually performing each long read, which is expensive and time consuming, a long read can be obtained. Being able to get leads. Multiple short 3-, 4-, 5-, or 6-base bits of sequence information are obtained simultaneously along the length of a single polynucleotide molecule, so that they are all ligated, binding the polynucleotide on and off When saturated with oligos, their nanometric position, resolution, and order reveal the sequence of the entire molecule. Sequencing of polynucleotides is currently used because multiple bits of sequence information are obtained simultaneously, rather than a single long read (e.g., PacBio sequencing) obtained by SbS reactions from one place to another on the molecule. takes less time than the method of

本発明の別の主要な利点は、すべての種類の構造的変動(マイクロアレイベースの技術、現在の主流のアプローチにとっては困難なバランスの取れたコピー数バリエーションおよび逆位を含む)を、大小を問わず、マイクロアレイ、細胞遺伝学、または他の現在の配列決定方法ではアプローチできない分解能およびスケールで、検出することが可能になることである。 Another major advantage of the present invention is that all kinds of structural variation (including microarray-based techniques, balanced copy number variations and inversions that are difficult for current mainstream approaches), both large and small. without being able to detect at resolutions and scales not approachable by microarrays, cytogenetics, or other current sequencing methods.

さらに、本方法は、ゲノムの反復領域にわたる配列決定を可能にする。従来の配列決定のために、ゲノムのそのような部分にわたるリードの問題は、まず、そのような領域が参照ゲノムに十分に表現されておらず、Illumina、Ion Torrent、Helicos/SeqLL、およびComplete Genomicsなどの技術は、典型的には、デノボアセンブリによってではなく、参照に整列させることによって、大きなゲノムに対処する。第二に、リードが反復領域の全体に及んでいない場合、その領域にわたってより短いリードを介して領域をアセンブリすることは困難である。これは、ある分子上の反復領域と別の分子上の反復領域との間の可能な複数の整列のうちのどれが正しいのか、決定することが困難であり得るからである。誤った整列は、アセンブリ内の反復領域の短縮または延長につながる可能性がある。本発明の配列決定方法では、セットを同時にまたは次々に、のいずれかで行われる複数のリードによる単一分子の完全またはほぼ完全なカバレッジがある場合、(ポリヌクレオチド自体が反復領域の全体にわたる場合)反復領域の全体にわたるアセンブリを構築することができる。本発明の方法は、反復領域にまたがる十分長いポリヌクレオチドに適用され得る。1~10Mbのポリヌクレオチドは、ゲノムのほとんどの反復領域をまたぐのに十分である。本発明の方法は、Freitagらに示されているように、および(例えば、Rasmussen,et al Lab on a Chip,11:1431-3(2011)に記載されている)で試みられているように、真核生物ゲノム由来のポリヌクレオチドの完全長の染色体に適用され得、そのため、ゲノムの可能な反復長のすべてまたは大部分をまたぐことが可能である。 Furthermore, the method allows sequencing across repetitive regions of the genome. For conventional sequencing, the problem of reads across such parts of the genome is that such regions are not well represented in the reference genome, and Illumina, Ion Torrent, Helicos/SeqLL, and Complete Genomics Techniques such as typically address large genomes by aligning to a reference rather than by de novo assembly. Second, if the reads do not span the entire repetitive region, it is difficult to assemble the region via shorter reads across the region. This is because it can be difficult to determine which of multiple possible alignments between the repeat region on one molecule and the repeat region on another molecule is correct. Misalignment can lead to shortening or lengthening of repeat regions within the assembly. In the sequencing methods of the invention, if there is complete or near-complete coverage of a single molecule by multiple reads performed either simultaneously or one after the other (if the polynucleotide itself spans the repeat region ) can build assemblies spanning the repeat regions. The methods of the invention can be applied to sufficiently long polynucleotides that span the repeat region. A 1-10 Mb polynucleotide is sufficient to span most repetitive regions of the genome. The method of the present invention is shown in Freitag et al. and attempted (for example, in Rasmussen, et al Lab on a Chip, 11:1431-3 (2011)). , can be applied to full-length chromosomes of polynucleotides from eukaryotic genomes, and thus can span all or most of the genome's possible repeat lengths.

ポリヌクレオチドのインサイツ領域情報の保存
一部の実施形態では、本発明の配列決定方法は、細胞内で、インサイツで適用される。RNAおよびゲノムDNAの場合、変性された後、配列決定が開始され得る。mRNAの場合、配列決定は、二次構造を変性した後、任意に開始され得る。一部の実施形態では、配列決定は、例えば、ミクロトームによって得られる細胞のスライス上で行われる。
Preservation of Polynucleotide In Situ Region Information In some embodiments, the sequencing methods of the invention are applied in situ, within a cell. For RNA and genomic DNA, sequencing can be initiated after denaturation. In the case of mRNA, sequencing can optionally be initiated after denaturing secondary structures. In some embodiments, sequencing is performed on slices of cells obtained, for example, by microtome.

本発明の配列決定方法を細胞内で実施することで、ゲノムDNAの配列決定ができるだけでなく、細胞内のゲノムDNAの場所を確立することができる。さらに、組織に適用すると、分析される組織の細胞における体細胞バリアントの分布、ならびに染色体構成の差異を可能にする。これは非常に重要である。なぜなら、ゲノムの異なる部分が、細胞内で相互作用しているからである。例えば、エンハンサーは、ループを介して遺伝子領域に接触し、インサイツのゲノム解析により、そのような相互作用の検出が可能になる。また、細胞内のゲノムまたは個々の染色体の構成を可視化または決定することができる。加えて、プロセスは、培養皿で増殖した細胞集団(例えば、線維芽細胞またはニューロン)に対して、または組織切片に対して行うことができる。実質的に三次元である細胞または組織の場合、配列決定は、細胞または組織のスライスに対して行うことができる。一部の実施形態では、細胞内のクロマチンDNAは、変性を受け(例えば、0.5MのNaOHを使用する)、次いで本発明の一過的な結合相互作用が行われる。RNAは、RNAseを添加することによって除去することができる。一部の実施形態では、一過的な結合相互作用は、非標識プローブ結合によって形成される二重鎖への挿入色素の結合から検出される。一部の実施形態では、プローブが標識され、結合は、二重鎖に挿入される色素とプローブ上の標識との間のFRETを介して検出される。 By performing the sequencing method of the invention in a cell, not only is it possible to sequence the genomic DNA, but it is also possible to establish the location of the genomic DNA within the cell. Furthermore, when applied to tissues, it allows the distribution of somatic variants in the cells of the tissue analyzed, as well as differences in chromosomal composition. This is very important. This is because different parts of the genome interact within the cell. For example, enhancers contact gene regions through loops, allowing in situ genomic analysis to detect such interactions. Also, the organization of the genome or individual chromosomes within the cell can be visualized or determined. Additionally, the process can be performed on cell populations (eg, fibroblasts or neurons) grown in culture dishes or on tissue sections. For cells or tissues that are substantially three-dimensional, sequencing can be performed on slices of the cells or tissues. In some embodiments, chromatin DNA within the cell undergoes denaturation (eg, using 0.5 M NaOH) followed by transient binding interactions of the invention. RNA can be removed by adding RNAse. In some embodiments, transient binding interactions are detected from binding of intercalating dyes to duplexes formed by unlabeled probe binding. In some embodiments, the probe is labeled and binding is detected via FRET between the dye intercalating into the duplex and the label on the probe.

結合プローブの同一性および空間位置
本発明の一態様は、複数の配列断片の各々に一過的に結合したプローブの同一性および空間位置を保存することである。ポリヌクレオチドに沿ったプローブの結合位置は、検出器の場所感受性アスペクトによって決定される。CCDなどの2D検出器を使用する場合、画像が投影される画素のx-y座標によって、場所が決定される。いくつかの計算フィルタを使用して、真の検出事象から、標識の擬似結合を除去する。標識は、ポリヌクレオチドが続く経路を示すために、いくつかの起点を通る線と相関していなければならない。経路が直線である場合、フィルタを通過する位置は直線上にある。
Identity and Spatial Location of Bound Probes One aspect of the present invention is to preserve the identity and spatial location of probes transiently attached to each of a plurality of sequence fragments. The location of probe attachment along the polynucleotide is determined by the location-sensitive aspect of the detector. When using a 2D detector such as a CCD, the location is determined by the xy coordinates of the pixels onto which the image is projected. Several computational filters are used to remove spurious binding of labels from true detection events. The label must correlate with a line through some origin to indicate the path followed by the polynucleotide. If the path is straight, the position through the filter is on a straight line.

バイオポリマーに結合するプローブの同一性は、2つの方法のうちの1つで決定することができる。ある反応体積で、複数のプローブが差次的に標識され、かつ一緒に使用される場合、オリゴの同一性は、(ポリヌクレオチドに沿った特定の場所で検出される)コード標識を検出することによって決定される。これは、標識ごとに1つずつ4つの異なるレーザを照射するか、標識ごとに1つずつ4つの異なる発光フィルタを使用するか、または異なるレーザと発光フィルタの組み合わせを使用することで行うことができる。この場合、画像を1つの波長で撮影し、ポリヌクレオチドにマッピングし、次いで、次へと同様に行う。4つの標識を連続的に検出する代わりに、4つの標識を同時に検出することもできる。これは、プリズムを使用して、2D検出器上の異なる場所に、発光を分割することによって行うことができる。また、これは、発光波長を4つのチャネルに分割するために、ダイクロイックミラーおよび発光フィルタを、4つの標識ごとに1つずつ使用することによっても行うことができる。最後に、発光波長は任意の数のチャネル間で分割することができ、各チャネルで各シグナルの強度が検出されて、標識固有なシグネチャを与える。一部の実施形態では、最初に、各フルオロフォアのチャネルにわたるシグネチャが取得され、次いで、シグネチャを使用して、標識、したがって、記録されたデータからの配列を識別する。 The identity of probes bound to biopolymers can be determined in one of two ways. When multiple probes are differentially labeled and used together in a reaction volume, the identity of the oligos can be used to detect code labels (detected at specific locations along the polynucleotide). determined by This can be done by irradiating four different lasers, one for each label, using four different emission filters, one for each label, or using different combinations of lasers and emission filters. can. In this case, an image is taken at one wavelength, mapped to the polynucleotide, and so on. Instead of detecting four labels sequentially, four labels can be detected simultaneously. This can be done by using a prism to split the emission onto different locations on the 2D detector. This can also be done by using dichroic mirrors and emission filters, one for each of the four labels, to split the emission wavelengths into four channels. Finally, the emission wavelength can be split between any number of channels and the intensity of each signal detected in each channel to give a label-specific signature. In some embodiments, first a signature across the channel for each fluorophore is obtained and then the signature is used to identify the label and thus the sequence from the recorded data.

タグの配列決定
一部の実施形態では、DNAのセグメントは、インサイツでタグ付けされ(すなわち、ゲノムDNAの長さに沿って、または細胞内で)、タグの場所および同一性は、本発明の一過的な結合方法を使用して決定される。タグは、配列タグであり得、一過的に結合するオリゴの小さなプールのみがそれらの同一性を決定するために使用され得るように、設計することができる。一部の実施形態では、タグの場所および同一性が決定されると、ポリヌクレオチドは、細胞から抽出されるか、または表面から遊離され得、一方、配列タグは、ポリヌクレオチド断片に結合したままである。ポリヌクレオチド+配列タグは、任意選択的に、任意の配列決定方法(例えば、高スループットIllumina配列決定)を使用して、増幅され、配列決定され得る。配列決定の出力から、タグの配列を使用して、配列の特定のセグメントを、ゲノム内の特定の場所に、位置決定することができる。
Sequencing of tags In some embodiments, segments of DNA are tagged in situ (i.e., along the length of genomic DNA or within a cell), and the location and identity of tags are determined according to the present invention. Determined using transient binding methods. The tags can be sequence tags and can be designed so that only a small pool of transiently binding oligos can be used to determine their identity. In some embodiments, once the location and identity of the tags are determined, the polynucleotides can be extracted from the cell or released from the surface while the sequence tags remain attached to the polynucleotide fragments. is. Polynucleotides+sequence tags can optionally be amplified and sequenced using any sequencing method (eg, high-throughput Illumina sequencing). From the sequencing output, the sequence of the tags can be used to localize specific segments of the sequence to specific locations within the genome.

色素光物理学
単一の蛍光色素の検出は、各特定の色素タイプの特質に影響されやすい。特定の色素は、暗状態、速い光退色、および低い量子収率などの光物理学的特徴を有し、それらは、候補色素から排除される。また、色素の化学的特徴、それらの構造、およびそれらが電荷を有するかどうかは、それらがどの程度うまく組み込まれ得るか、およびそれらがどの程度非特異的に結合するかにも影響する。色素の選択は、不良な光物理学的および化学的問題の回避、ならびに、それらが選択された装置のセットアップにおいて、どの程度励起および検出され得るか、およびそれらが他の3つの色素からどの程度識別され得るか、に依存する。本発明の一部の実施形態では、FRET効率またはクエンチ効率などの他の特徴もまた重要である。幸いにも、いくつかの色素メーカーがあり、選択される色素のリストが多数ある。うまく機能することができる4つの色素は、Atto488、Cy3b、Atto655、およびCy7またはAlexa594である。本発明で使用され得る別の4つの良好な単一分子色素が、Sobhyら[Rev.Sci.Instrum.82,113702(2011)に示されており、405nm、488nm、532nm、および640nmレーザを使用して、それぞれAtto425、Atto488、Cy3、およびAtto647Nを励起することができる。標識の各々は、異なる塩基の同一性を示す。特定の色素は、捕捉された光物理状態からそれらを放出するために、ピーク励起波長とは異なる波長の光のパルスを必要とする。光物理を最小化するいくつかのレドックス系が知られている。Trolox、β-メルカプタノール;グルコース、グルコースオキシダーゼおよびカタラーゼ;プロトカテク酸およびプロトカテク酸-3,4-ジオキシゲナーゼ;メチルビオローゲンおよびアスコルビン酸。(Ha and Tinnefeld,Annu Rev Phys Chem.2012;63:595-617を参照されたい)。連続照明の代替として、一部の実施形態では、試料は、パルス照明またはストロボスコープ照明に供され、これは、光退色を低減する。
Dye Photophysics Detection of single fluorescent dyes is sensitive to the peculiarities of each particular dye type. Certain dyes have photophysical characteristics such as dark state, fast photobleaching, and low quantum yield, which exclude them from candidate dyes. The chemical characteristics of the dyes, their structure, and whether they carry a charge also affect how well they can be incorporated and how nonspecifically they bind. The choice of dyes is based on the avoidance of poor photophysical and chemical problems, and how well they can be excited and detected in the instrument set-up of choice, and how well they differ from the other three dyes. can be identified, depends on. Other features such as FRET efficiency or quench efficiency are also important in some embodiments of the invention. Fortunately, there are several dye manufacturers and a large list of dyes to choose from. Four dyes that can work well are Atto488, Cy3b, Atto655, and Cy7 or Alexa594. Another four good single-molecule dyes that can be used in the present invention are described by Sobhy et al. [Rev. Sci. Instrum. 82, 113702 (2011), 405 nm, 488 nm, 532 nm, and 640 nm lasers can be used to excite Atto425, Atto488, Cy3, and Atto647N, respectively. Each label indicates the identity of a different base. Certain dyes require a pulse of light of a wavelength different from the peak excitation wavelength to release them from the trapped photophysical state. Several redox systems are known that minimize photophysics. Trolox, beta-mercaptanol; glucose, glucose oxidase and catalase; protocatechuate and protocatechuate-3,4-dioxygenase; methylviologen and ascorbic acid. (See Ha and Tinnefeld, Annu Rev Phys Chem. 2012; 63:595-617). As an alternative to continuous illumination, in some embodiments the sample is subjected to pulsed or stroboscopic illumination, which reduces photobleaching.

撮像
ポリヌクレオチドの画像は、2D検出器(例えば、電荷結合素子(CCD)カメラ)のアレイ上に投影され、それらから、デジタル化され、メモリに記憶される。次いで、メモリに記憶された画像は、画像分析アルゴリズムに供される。これらのアルゴリズムは、シグナルをバックグラウンドから区別し、シグナル特性の変化を監視し、他のシグナル処理機能を行うことができる。メモリおよびシグナル処理は、オフラインでコンピュータ上で、またはマイクロプロセッサもしくはフィールドプログラマブルゲートアレイ(FPGA)によって制御される専用デジタルシグナル処理(DSP)回路で行われる。
Imaging An image of the polynucleotide is projected onto an array of 2D detectors (eg, charge-coupled device (CCD) cameras), from which it is digitized and stored in memory. The images stored in memory are then subjected to image analysis algorithms. These algorithms can distinguish signal from background, monitor changes in signal properties, and perform other signal processing functions. Memory and signal processing are performed off-line on the computer or in dedicated digital signal processing (DSP) circuits controlled by a microprocessor or field programmable gate array (FPGA).

画像処理
蛍光標識が伸長ポリヌクレオチドに一過的に結合している場合、2Dアレイ検出器で画像を撮影することによって検出することができる。次のタスクは、撮影した画像から、配列決定データを抽出することである。伸展された分子を、2Dアレイ検出器(例えば、CCDまたはCMOSセンサー)の画素の列または行のいずれかに沿って、2Dアレイ検出器の一軸に沿って整列させるように取り組む。
Imaging When a fluorescent label is transiently bound to an elongated polynucleotide, it can be detected by taking an image with a 2D array detector. The next task is to extract the sequencing data from the captured images. One seeks to align the stretched molecules along one axis of the 2D array detector, along either the columns or rows of pixels of the 2D array detector (eg, CCD or CMOS sensor).

時間遅延積分(TDI)撮像またはラインスキャナーが使用され、連続画像ストリップが得られる場合(例えば、Hesse et al.Anal Chem.2004 Oct 1;76(19):5960-4に記載されている)、本発明の一実施形態は、画像の移動(またはステージの移動)の方向をポリヌクレオチドの伸長の線形方向と一致させることを含む。これは、非常に長いポリヌクレオチド(数100ミクロン、数mm、または数10mmの長さ)の連続した画像を得ることができ、かつ画像インターフェースでの誤差にもつながり得る画像の繋ぎ合わせに余分な計算リソースを費やす必要がないようにするためである。 When time-delayed integration (TDI) imaging or line scanners are used and continuous image strips are obtained (for example, as described in Hesse et al. Anal Chem. 2004 Oct 1;76(19):5960-4), One embodiment of the invention involves matching the direction of image movement (or stage movement) with the linear direction of polynucleotide elongation. This makes it possible to obtain continuous images of very long polynucleotides (hundreds of microns, millimeters, or tens of millimeters long) and requires extra effort in image stitching, which can also lead to errors in the image interface. This is to avoid having to expend computational resources.

一部の実施形態では、本発明のシステムは、ポリマーの迅速かつ正確な長距離画像を取得するための方法を含み、
i)ポリマーを一方向に伸展することと、
ii)時間遅延積分(TDI)を搭載した2D検出器を使用することと、
iii)試料を、検出器に対して、DNA伸展の方向に移動することと、
iv)長いポリマー分子が単一の長い画像スワス(swath)/ストリップ(strip)から(別々のフレームを繋ぎ合わせる必要なく)分析される、移動方向のラインを読み取ることと、を含む、方法。
In some embodiments, the systems of the present invention include methods for obtaining rapid and accurate long-range images of polymers,
i) stretching the polymer in one direction;
ii) using a 2D detector with time delay integration (TDI);
iii) moving the sample in the direction of the DNA extension relative to the detector;
iv) reading lines in the direction of travel, where long polymer molecules are analyzed from a single long image swath/strip (without the need to stitch separate frames).

一部のかかる実施形態では、移動速度は、読み出し速度のほんの一部である。これにより、表面上の次の位置がセンサーによって撮像される前に、複数のシグナル事象が、センサー要素によって、各位置から捕捉されるようになる。したがって、複数の結合事象を検出することができる。特定の数の連続した画素は、位置が、隣接する場所から事象を捕捉するのに十分にシフトする前に、場所の周りの経時事象(temporal event)を捕捉する。 In some such embodiments, the travel speed is a fraction of the readout speed. This causes multiple signal events to be captured by the sensor element from each location before the next location on the surface is imaged by the sensor. Therefore, multiple binding events can be detected. A certain number of consecutive pixels capture a temporal event around a location before the location shifts enough to capture the event from an adjacent location.

他の場合、非常に長い(ultra-long)ポリヌクレオチドは、蛇行ナノチャネル内の束縛により、蛇行パターンに折り畳まれ(Frietag et alを参照されたい)、次いで、単一のCCDまたはCMOSのフレーム内で撮像される。 In other cases, ultra-long polynucleotides are folded into a serpentine pattern due to constraining within serpentine nanochannels (see Frietag et al.) and then placed within the frame of a single CCD or CMOS. is imaged with

伸長方向が2Dアレイ検出器の軸に対応しない場合、第1の画像処理ステップは、画像内の軸に沿ってラインが整列するように画像を変換するために行われる。本発明の一部の実施形態では、ポリヌクレオチドが単一方向にまっすぐ整列され、ポリヌクレオチドの場所は、直線軸に沿って活性化される画素を調べることによって追跡することができる。すべての画素が活性化される必要はなく、表面へのバックグラウンド/非特異的結合を超えるポリヌクレオチドを追跡できる数だけで十分である。軸に沿っていないシグナルは無視される。一部の実施形態では、ポリヌクレオチドの骨格が標識される。例えば、Sybr Goldなどの蛍光色素の結合を使用して、ポリヌクレオチドを追跡することができる。従来のDNA染色剤の代わりに、共役カチオン性ポリマーを使用することができる。 If the stretch direction does not correspond to the axis of the 2D array detector, a first image processing step is performed to transform the image so that the lines are aligned along the axis in the image. In some embodiments of the invention, the polynucleotides are linearly aligned in a single direction, and the location of the polynucleotides can be tracked by examining pixels that are activated along the linear axis. Not all pixels need to be activated, just the number that allows tracking of polynucleotides beyond background/non-specific binding to the surface is sufficient. Signals not along the axis are ignored. In some embodiments, the backbone of the polynucleotide is labeled. For example, conjugation of fluorescent dyes such as Sybr Gold can be used to track polynucleotides. Conjugated cationic polymers can be used in place of conventional DNA stains.

蛍光寿命およびバックグラウンド散乱拒絶
異なる結合プローブ(一過的に結合するものを含む)は、異なる蛍光寿命を有する発光実体(例えば、色素)でコードすることができる。分子の蛍光寿命は、分子が、蛍光光子の放出によって基底状態に戻るまでの、励起状態で過ごす平均時間である。
Fluorescence Lifetime and Background Scatter Rejection Different bound probes (including transiently bound ones) can be encoded with luminescent entities (eg, dyes) with different fluorescence lifetimes. The fluorescence lifetime of a molecule is the average time a molecule spends in an excited state before returning to the ground state by emission of a fluorescence photon.

次いで、パルスレーザ励起を使用して、色素を励起することができ、時間相関単一光子検出器(または高分解能の時間相関検出が可能な他の検出器)を使用して、各色素の蛍光寿命プロファイルを検出する。検出器は、am強化CCD(IMCCD)である。また、光子の到達時間をビニングできるポイント検出器のアレイも可能である。また、光散乱による早期(ピコ秒範囲)の蛍光がゲートアウトされるように、発光の検出時間をゲートアウトすることができ、そうして、バックグラウンドを上回る、色素によって放出される蛍光が検出される。 Pulsed laser excitation can then be used to excite the dyes, and a time-correlated single-photon detector (or other detector capable of high-resolution time-correlated detection) can be used to detect the fluorescence of each dye. Discover lifespan profiles. The detector is an am-enhanced CCD (IMCCD). Also possible is an array of point detectors that can bin the arrival times of photons. Also, the detection time of luminescence can be gated out such that early (picosecond range) fluorescence due to light scattering is gated out, and fluorescence emitted by the dye above background is detected. be done.

本発明の方法は、エバネッセント場の有無にかかわらず、かつ比較的高い濃度のオリゴを用いて行うことができるが、散乱によるバックグラウンド蛍光は、蛍光の早期の時間枠を拒絶することによって除去される。そのため、パルス励起および時間ゲート検出または時間相関検出を使用すれば、一石二鳥である:1つは、異なる蛍光寿命によって区別される標識を用いて、配列決定の照合試薬(ヌクレオチド、オリゴ)をコードすることができ、もう1つは、散乱によるバックグラウンド蛍光を拒絶することができる。 Although the method of the present invention can be performed with or without an evanescent field and with relatively high concentrations of oligos, background fluorescence due to scattering is eliminated by rejecting early timeframes of fluorescence. be. Therefore, using pulsed excitation and time-gated or time-correlated detection kills two birds with one stone: one encodes sequencing reference reagents (nucleotides, oligos) with labels distinguished by different fluorescence lifetimes. and another can reject background fluorescence due to scattering.

溶液中の色素(散乱ではない)に起因するバックグラウンド蛍光は依然として残るが、これは、励起にエバネッセント波、ゼロモード導波路および/またはRET機構を使用することによって低減することができる。または、試薬をクエンチすることができる(例えば、分子ビーコンなど)。 Background fluorescence due to dyes in solution (not scattering) still remains, but this can be reduced by using evanescent waves, zero-mode waveguides and/or RET mechanisms for excitation. Alternatively, reagents can be quenched (eg, molecular beacons, etc.).

例示的なセットアップは、広視野蛍光寿命撮像顕微鏡(FLIM)システムを含み、405nmのパルスレーザダイオードを使用して試料を照射し、ICCDカメラでシフトした蛍光シグナルを収集する。最短ゲート時間が200psの4 Picos強化CCDカメラ(Stanford computer optics)を使用することができる。顕微鏡内でビームスプリッターを使用して、レーザパルスを蛍光シグナルから分離する。このビームスプリッターは、405nmの励起波長を反射し、より長い波長にシフトした試料の蛍光シグナルを透過する。広視野FLIMの設定には、パルスレーザダイオードと強化CCDカメラのトリガー同期がさらに必要である。時間分解測定の励起源は、パルスまたは変調されており、蛍光発光および動態の測定を可能にする。時間領域蛍光測定方法は、蛍光減衰曲線の真の表現を生成するため、一般により容易に理解される。典型的には、時間領域システムは、高速応答検出器と結合された励起を提供するパルス光源からなる。時間ゲートの数を増やし、多指数減衰適合を考慮するための適合アルゴリズムを開発することによって、寿命の結果を改善することができる。時間相関検出は、単一分子の位置決定と組み合わせることができる。 An exemplary setup includes a wide-field fluorescence lifetime imaging microscope (FLIM) system, using a 405 nm pulsed laser diode to illuminate the sample and collect the shifted fluorescence signal with an ICCD camera. A 4 Picos enhanced CCD camera (Stanford computer optics) with a minimum gate time of 200 ps can be used. A beam splitter is used within the microscope to separate the laser pulse from the fluorescent signal. This beamsplitter reflects the 405 nm excitation wavelength and transmits the fluorescence signal of the sample shifted to longer wavelengths. The wide-field FLIM setup additionally requires trigger synchronization of the pulsed laser diode and the enhanced CCD camera. The excitation source for time-resolved measurements is pulsed or modulated, allowing fluorescence emission and kinetic measurements. Time-domain fluorometry methods are generally more easily understood because they produce a true representation of the fluorescence decay curve. Typically, time domain systems consist of a pulsed light source providing excitation coupled with a fast response detector. Lifetime results can be improved by increasing the number of time gates and developing a fitting algorithm to account for multi-exponential decay fitting. Time-correlated detection can be combined with single-molecule localization.

流体工学
本発明は、流体デバイス(フローセルまたはウェル)で実施することができる。試薬を送達および交換する手段は、様々な形態をとることができる。シリンジポンプまたは圧力駆動システム、音響駆動システムを使用して、試薬を、それが貯蔵されている場所から、配列決定が行われる場所、次いで、廃棄物として除去される場所へ、移動させることができる。複数のプローブを送達する必要がある場合(例えば、1024個のオリゴの各々)、多数のオリゴを貯蔵し、本発明の方法を実行するために使用することができる配列決定システムにそれらを送達するための1つの手段は、Pihalk et al.Anal.Chem.2005,77,64-71に記載されている。使用することができる別のアプローチは、Linder et al Anal.Chem.2005,77,64-71に記載されている。多数の異なるプローブまたはプローブセットを送達する1つの簡単な方法は、各々がエアギャップによって分離されるキャピラリーにそれらを装填することである。洗浄液も散在させることができる。次いで、各プローブおよび洗浄液が、本発明に必要な撮像を行うのに十分な時間、表面に接触するように、ループを適切な速度で(例えば、シリンジポンプから引くことによって)実行する。
Fluidics The present invention can be implemented in fluidic devices (flow cells or wells). The means of delivering and exchanging reagents can take a variety of forms. Syringe pumps or pressure-driven systems, acoustic-driven systems can be used to move reagents from where they are stored to where sequencing is performed and then removed as waste. . If multiple probes need to be delivered (e.g. each of 1024 oligos), store a large number of oligos and deliver them to a sequencing system that can be used to carry out the methods of the invention. One means for is described by Pihalk et al. Anal. Chem. 2005, 77, 64-71. Another approach that can be used is Linder et al Anal. Chem. 2005, 77, 64-71. One simple way to deliver a large number of different probes or probe sets is to load them into capillaries, each separated by an air gap. A washing liquid can also be interspersed. The loop is then run at an appropriate speed (eg, by pulling from a syringe pump) so that each probe and wash contact the surface for a time sufficient to perform the imaging required by the present invention.

配列品質:配列決定エラーおよびカバー率バイアスの最小化
すべての配列決定技術は、あるレベルのエラーを受け、異なる配列決定プラットフォームは、異なる種類のエラーを受けやすい。Schirmer ら(Nucl.Acids Res.2015;nar.gku1341)l,Illumina MiSeqによると、生のエラー率は、2%である。これには、ライブラリの準備、クラスター増幅、プレフェージング(初期の組み込みでのエラー)、およびフェージング(後期の組み込みでのエラー)によって導入されるエラーが含まれる。これは、コンセンサスを構築するためにリードをトリミングおよび重複させることによって削減することができる。
Sequence Quality: Minimizing Sequencing Errors and Coverage Bias All sequencing techniques are subject to some level of error, and different sequencing platforms are susceptible to different types of error. According to Schirmer et al. (Nucl. Acids Res. 2015; nar. gku1341) l, Illumina MiSeq, the raw error rate is 2%. This includes errors introduced by library preparation, cluster amplification, prephasing (errors in early integration), and phasing (errors in late integration). This can be reduced by trimming and duplicating reads to build consensus.

本発明の実施形態では、PCRは行われないため、PCRに起因して導入されるカバレッジバイアスはなく、PCR中のポリメラーゼの組み込みミスに起因するエラーはない。Illumina、ABI SOLID、Ion Torrent、Intelligent BiosystemsおよびComplete Genomicsの配列決定において、増幅エラーは、ライブラリ調製中およびクローン増幅中(例えば、DNAナノボール、ポロニーまたはクラスター生成)に導入され得る。 Since PCR is not performed in embodiments of the present invention, there is no coverage bias introduced due to PCR and no errors due to polymerase misincorporation during PCR. In Illumina, ABI SOLID, Ion Torrent, Intelligent Biosystems and Complete Genomics sequencing, amplification errors can be introduced during library preparation and clone amplification (eg, DNA nanoball, polony or cluster generation).

次世代配列決定におけるエラーを克服するための通常の手段は、ゲノムの複数の別個の(非アンプリコン)コピーからゲノムの同じセグメントのリードを得るために、未増幅ゲノムの複数のコピーに対して配列決定を行うことである。次いで、配列は、多数の分子のコンセンサスから割り当てられる。2つの配列が優勢である場合、それはヘテロ接合性を示し得る。これは、配列決定が単一細胞で行われる場合には、該当しない。また、複数のコピーが得られる組織または細胞が均一でない場合にも問題となる。例えば、腫瘍内では、複数のクローン集団が混在し、体細胞変異が存在し得る。ゲノムは、免疫細胞でも変化しており、直接的な単一細胞配列決定が必要である。本発明の方法は、単一のポリヌクレオチドに基づいて、そのような場合に適用される。 A common means of overcoming errors in next-generation sequencing is to generate reads for the same segment of the genome from multiple distinct (non-amplicon) copies of the genome, for multiple copies of the unamplified genome. Sequencing. Sequences are then assigned from the consensus of a large number of molecules. If two sequences predominate, it may indicate heterozygosity. This is not the case when sequencing is performed in single cells. It is also a problem when the tissue or cells from which multiple copies are obtained are not homogenous. For example, within tumors, multiple clonal populations may coexist and somatic mutations may be present. Genomes are also changing in immune cells, requiring direct single-cell sequencing. The method of the present invention applies in such cases on the basis of single polynucleotides.

いくつかの用途では、細胞の集団で生じた体細胞変異を検出することが重要である。この場合、エラーを真の稀な変異から区別することが困難である可能性があるため、多くの分子からコンセンサスリードを取得することによって、エラーが除去され得ることに頼らない方がよい。これに関する別の問題は、異なるコピーが、パラロガスであることであり、ゲノムのセグメントの異なる重複(セグメント重複)からのものであるが、小さな差異を含み得ることである。 For some applications, it is important to detect somatic mutations that occur in populations of cells. In this case, it may be difficult to distinguish errors from true rare mutations, so it is better not to rely on errors being able to be eliminated by obtaining consensus reads from many molecules. Another problem with this is that the different copies are paralogous and can be from different duplications of segments of the genome (segmental duplications) but contain small differences.

本発明の方法に従って配列決定を行っている場合、複数のプローブ結合事象によって配列呼び出しを強化することによって、生のエラーを低減することができる。 When sequencing according to the methods of the invention, raw errors can be reduced by reinforcing sequence calls with multiple probe binding events.

HelicosおよびPacBio配列決定において行われているように、単一の色素分子で標識されたヌクレオチドの組み込みを検出することを介して単一分子上で配列決定する場合、色素が検出されないことに起因して誤差が生じ得る。これは、色素が光退色しているため、色素の点滅により検出される累積シグナルが弱いため、色素の発光が弱すぎるため、または色素が長い光物理学的な暗状態に入るためである。これは、本発明においていくつかの方法で克服することができる。第一に、好ましい光物理的特性を有する強力な個々の色素(例えば、Cy3B)で色素を標識することである。別の例は、光退色および暗い光物理的状態(例えば、β-メルカプトエタノール、Trolox、ビタミンCおよびその誘導体、レドックス系)を低減する緩衝液条件および添加剤を提供することである。別の例は、光への曝露を最小化することである(例えば、より短い曝露を必要とするより高感度の検出器を有すること、またはストロボ照明を提供すること)。第二に、単一の色素の代わりに、量子ドット(例えば、Qdot655)、フルオロスフィア、プラズモン共鳴粒子、光散乱粒子などのナノ粒子で標識することである。別の例は、単一の色素ではなく、ヌクレオチド当たり多くの色素を有することである。この場合、複数の色素は、それらの自己消光を最小化するように(例えば、それらを十分に離してDNA折り紙などの剛性ナノ構造を使用して)、または剛性リンカーを介した線形間隔で組織化される。Genovoxxは、多くのフルオロフォアを含むヌクレオチドを組み込むことができ、Mir(WO2005/040425)は、ナノ粒子が結合しているヌクレオチドを組み込むことができている。 This is due to the fact that no dye is detected when sequencing on a single molecule via detecting incorporation of nucleotides labeled with a single dye molecule, as is done in Helicos and PacBio sequencing. errors can occur. This is because the dye is photobleached, the cumulative signal detected by blinking of the dye is weak, the dye emits too little light, or the dye enters a long photophysical dark state. This can be overcome in several ways in the present invention. The first is to label the dyes with strong individual dyes (eg Cy3B) with favorable photophysical properties. Another example is to provide buffer conditions and additives that reduce photobleaching and dark photophysics (eg, β-mercaptoethanol, Trolox, vitamin C and its derivatives, redox systems). Another example is minimizing exposure to light (eg, having a more sensitive detector that requires shorter exposures, or providing stroboscopic illumination). Second, labeling with nanoparticles such as quantum dots (eg, Qdot655), fluorospheres, plasmon resonance particles, light scattering particles, etc., instead of single dyes. Another example is to have many dyes per nucleotide rather than a single dye. In this case, multiple dyes are organized to minimize their self-quenching (e.g., by spacing them well apart and using rigid nanostructures such as DNA origami) or at linear spacing via rigid linkers. become. Genovox can incorporate nucleotides containing many fluorophores and Mir (WO2005/040425) has been able to incorporate nucleotides with attached nanoparticles.

しかしながら、本発明に最も関連する色素光物理によるエラーを低減するための最も重要な手段は、本発明に記載される一過的な結合を利用することである。ここで、撮像ステップ中の読み出しは、異なる標識担持プローブの多くのオン/オフ相互作用の集約として得られるため、一方の標識が光退色しているか、または暗状態にある場合でも、分子に付着する他の結合プローブ上の標識は、光退色していないか、または暗状態にない可能性がある。 However, the most important means for reducing dye photophysical errors that are most relevant to the present invention is through the use of transient binding as described in the present invention. Here, the readout during the imaging step is obtained as an aggregation of many on/off interactions of the different label-bearing probes, so that even if one label is photobleached or in the dark state, Labels on other bound probes that do not may not be photobleached or in a dark state.

検出誤差率は、溶液中の尿素、アスコルビン酸またはその塩、イソアスコルビン酸またはその塩、β-メルカプトエタノール(BME)、DTT、レドックス系、またはTroloxから選択される1つ以上の化合物の存在下で、さらに低減される(および、シグナル寿命が延びる)。 Detection error rate in the presence of one or more compounds selected from urea, ascorbic acid or its salts, isoascorbic acid or its salts, β-mercaptoethanol (BME), DTT, redox systems, or Trolox in solution is further reduced (and signal lifetime is extended).

アレイ捕捉によるリードの集約
別の実施形態では、表面上またはマトリックス中に配置される特定のポリヌクレオチドまたはポリヌクレオチドの特定のセグメントを標的とする捕捉試薬を使用して、標的ポリヌクレオチドを捕捉する。一部の実施形態では、捕捉プローブは、試料中のすべてのポリヌクレオチド上に存在する特定の一般的な配列を標的にするように設計される。例えば、オリゴ(dT)捕捉試薬は、すべてのRNAを標的とする。一部の実施形態では、共通のオリゴ配列を、標的ポリヌクレオチドに移植し、それらを捕捉することができる。異なる捕捉試薬を使用して、異なるポリヌクレオチドを捕捉することができ、異なる捕捉試薬を、マイクロアレイなどの空間的にアドレス指定可能な規則正しいアレイに配置することができる。ポリヌクレオチドが捕捉されると、それらは、流体の流れまたは電気泳動流によって伸長され得る。
Aggregation of Reads by Array Capture In another embodiment, target polynucleotides are captured using capture reagents that target specific polynucleotides or specific segments of polynucleotides located on a surface or in a matrix. In some embodiments, capture probes are designed to target a particular common sequence present on all polynucleotides in a sample. For example, oligo(dT) capture reagents target all RNA. In some embodiments, common oligosequences can be grafted onto target polynucleotides to capture them. Different capture reagents can be used to capture different polynucleotides, and the different capture reagents can be arranged in a spatially addressable ordered array, such as a microarray. Once the polynucleotides are captured, they can be elongated by fluid flow or electrophoretic flow.

配列決定のためのセンス・アンチセンス一本鎖の作製
一部の実施形態では、ヘアピンは、二本鎖標的の末端にライゲーションされ、他の末端の一方は鎖の一方のみを介して表面に固定化される。次いで、ポリヌクレオチドが変性され、付着点から伸長/伸展される。次いで、ポリヌクレオチドが、伸長した状態で固定される。
Generating Sense-Antisense Single-Strands for Sequencing In some embodiments, hairpins are ligated to the ends of a double-stranded target, one of the other ends being anchored to the surface via only one of the strands. become. The polynucleotide is then denatured and extended/extended from the point of attachment. The polynucleotide is then fixed in the extended state.

これは、標的が一本鎖であることを確実にする方法を提供する。さらに、端部間のセンス鎖およびアンチセンス鎖から得られたリードは、相補的なリードを提供し、これは、得られた配列決定の真偽の内部検証である。また、このようなセンス・アンチセンス鎖は、第2の鎖を合成するために自然にヘアピンを作るAMV逆転写酵素を使用して、RNA上でcDNA合成を行うことによって作製することもできる。一部の実施形態では、逆転写のためのプライマーは、表面への付着を可能にする部分で修飾される。 This provides a way to ensure that the target is single stranded. Furthermore, the reads obtained from the sense and antisense strands between the ends provide complementary reads, which are an internal verification of the authenticity of the resulting sequencing. Such sense-antisense strands can also be generated by performing cDNA synthesis on RNA using AMV reverse transcriptase, which naturally creates hairpins to synthesize the second strand. In some embodiments, primers for reverse transcription are modified with moieties that allow attachment to surfaces.

一本鎖アセンブリ
本発明の一部の実施形態では、試料は、近接して天然相補鎖を有しない一本鎖ポリヌクレオチドを含む。ここで、ポリヌクレオチドに沿ったレパートリーの各々のオリゴの結合場所がコンパイルされると、配列は、それらの場所に従って、すべての配列ビットを集約し、それらを一緒に繋ぎ合わせることによって再構築することができる。実際、完全なレパートリーは、配列ビットのタイリングシリーズを提供するであろう。現実世界では、パターンは、ポリヌクレオチド上の不一致結合および非特異的結合によって複雑になり得る。しかし、不一致は、それらの経時的結合パターンによって区別することができ、したがって、配列情報の二次層とみなすことができる。この場合、その経時的結合特性により、結合シグナルが不一致であると判断された場合、配列ビットをバイオインフォマティクス的にトリミングして、推定される不一致塩基を除去し、残りの配列ビットを配列再構築に加えることができる。不一致は、ハイブリダイズするオリゴの末端で生じる可能性が最も高いため、経時的結合特性に応じて、末端から1つ以上の塩基をトリミングすることができる。どの塩基がトリミングされるのかに関しては、同じ配列空間上でタイリングしている他のオリゴからの情報によって知ることができる。
Single-Strand Assembly In some embodiments of the invention, the sample comprises single-stranded polynucleotides that have no contiguous natural complement. Now, once the binding locations of each oligo of the repertoire along the polynucleotide have been compiled, the sequence is reconstructed according to their location by aggregating all the sequence bits and splicing them together. can be done. In fact, the complete repertoire would provide a tiling series of array bits. In the real world, patterns can be complicated by mismatched and non-specific binding on the polynucleotide. However, the discrepancies can be distinguished by their binding patterns over time and can thus be viewed as a second layer of sequence information. In this case, if its binding properties over time determined that the binding signal was mismatched, the sequence bits were bioinformatically trimmed to remove the putative mismatched bases and the remaining sequence bits were subjected to sequence reconstruction. can be added to Since mismatches are most likely to occur at the ends of hybridizing oligos, one or more bases can be trimmed from the ends, depending on binding properties over time. Information from other oligos tiling on the same sequence space can be used to know which bases are trimmed.

同時二重鎖コンセンサスアセンブリ
本発明の一部の実施形態では、二重らせんの両方の鎖が近接して存在し、検出される一過的なシグナルから、どの鎖にオリゴが結合したのか区別することはできない。しかしながら、ポリヌクレオチドに沿ったレパートリーの各々のオリゴの結合場所がコンパイルされる場合、2つのオリゴ配列が同じ場所に結合するように見える可能性がある。これらのオリゴは、配列において相補的である必要がある。単一の結合事象が、一方または他方の鎖に対するものなのかを判断するために、全体的にデータが考慮される。オリゴの2つのタイリングシリーズは、問題の位置をカバーし、各タイルは、一方向または他方向のポリヌクレオチドの長さに沿った位置の漸増的なシフトである。シグナルを生成するオリゴ配列がどのシリーズと重複するかに基づいて、シグナルが属する2つのタイリングシリーズのうちのどちらかが割り当てられる。これは、図28に例示されている。次いで、一部の実施形態では、最初に、結合および配列重複の場所を使用して、2つのタイリングシリーズの各々を構築することによって、配列が再構築される。次いで、2つのタイリングシリーズは、逆相補体として整列され、2つの鎖がこれらの場所の各々で完全な逆相補体である場合にのみ、各場所での塩基割当が受け入れられる(これは、二重鎖コンセンサス配列を提供する)。任意の不一致は、2つの可能性のうちの1つが、独立した不一致結合事象などの追加の層の情報によって裏付けられる必要がある、曖昧なベースコールであるとフラグ付けされる。一部の実施形態では、二重鎖コンセンサスが得られたら、(複数の細胞由来のDNAが利用可能であるとき)個々のハプロタイプが混合しないように注意して、ゲノムの同じ領域をカバーする他のポリヌクレオチドからのデータを比較することによって、従来の(多分子)コンセンサスを判定する。代替的に、一部の実施形態では、個々の鎖コンセンサスを得た後、個々の鎖コンセンサスの二重鎖コンセンサスを得る。本発明のかかる実施形態では、二重鎖の各々の鎖の配列は、次世代配列決定(NGS)で現在利用可能であるように、二重鎖の2つの鎖を分子バーコードで差次的にタグ付けするような追加の試料調製ステップなしで、同時に得られる(J.Salk,et al.“Detection of ultra-rare mutations by next-generation sequencing”.Proc.Natl.Acad.Sci.,vol.109 no.36.2012)。また、この同時の両方の鎖(センスおよびアンチセンス)配列の取得は、第2の鎖の配列が得られる前に、二重鎖の一方の鎖について配列を得る必要があるナノポアに対して利用可能である2Dまたは1D2コンセンサス配列決定と比較して有利である。二重鎖コンセンサス配列決定は、106の範囲の正確度、すなわち、100万塩基中に1つのエラー(他のNGSアプローチの102~103の生の正確度と比較して)を提供することができ、本発明の場合、二重鎖コンセンサスは、追加の試料調製ステップがない配列取得の本質的な部分である。これにより、本方法は、早期がん発見のために循環DNAを検出しようとしている場合、または腫瘍細胞集団の低頻度サブクローン由来のDNAを検出しようとしている場合に生じる希少バリアントを解決する必要性と非常に適合する。
Simultaneous Duplex Consensus Assembly In some embodiments of the invention, both strands of the duplex are present in close proximity to distinguish which strand the oligo is attached to from the transient signal detected. It is not possible. However, when the binding sites of each oligo in the repertoire along the polynucleotide are compiled, it is possible that two oligo sequences appear to bind at the same site. These oligos must be complementary in sequence. The data are considered globally to determine whether a single binding event is to one strand or the other. Two tiling series of oligos cover the position in question, each tile being an incremental shift of position along the length of the polynucleotide in one direction or the other. Based on which series the signal-generating oligo sequence overlaps, one of the two tiling series to which the signal belongs is assigned. This is illustrated in FIG. Then, in some embodiments, the sequence is reconstructed by first constructing each of the two tiling series using the locations of joins and sequence overlaps. The two tiling series are then aligned as reverse complements, and base assignments at each location are accepted only if the two strands are perfect reverse complements at each of these locations (this is providing the duplex consensus sequence). Any discrepancy is flagged as an ambiguous base call in which one of the two possibilities must be corroborated by an additional layer of information such as an independent discrepancy binding event. In some embodiments, once a duplex consensus is obtained (when DNA from multiple cells is available), individual haplotypes covering the same region of the genome are selected, taking care not to mix individual haplotypes. A conventional (multimolecular) consensus is determined by comparing data from multiple polynucleotides. Alternatively, in some embodiments, an individual strand consensus is obtained followed by a duplex consensus of the individual strand consensus. In such embodiments of the invention, the sequence of each strand of the duplex is differentiated by molecular barcodes of the two strands of the duplex, as currently available in Next Generation Sequencing (NGS). (J. Salk, et al. “Detection of ultra-rare mutations by next-generation sequencing”. Proc. Natl. Acad. Sci., vol. 109 no.36, 2012). This simultaneous acquisition of both strands (sense and antisense) sequence is also utilized for nanopores where sequence must be obtained for one strand of a duplex before sequence for the second strand is obtained. It is advantageous compared to possible 2D or 1D2 consensus sequencing. Double-strand consensus sequencing can provide accuracies in the range of 106, or 1 error in a million bases (compared to raw accuracies of 102-103 for other NGS approaches). For the present invention, duplex consensus is an essential part of sequence acquisition without additional sample preparation steps. This method addresses the need to address rare variants that arise when trying to detect circulating DNA for early cancer detection, or when trying to detect DNA from low-frequency subclones of tumor cell populations. very compatible with

複数のポリヌクレオチドからのリードの組み込み
好ましくは、連続した配列は、デノボアセンブリを介して得られる。しかしながら、参照配列は、アセンブリを容易にするために使用することもできる。これにより、デノボアセンブリを構築することが可能になるが、非常に長い距離の個々のハプロタイプを解決するのはより困難であり、ハプロタイプに関する情報を提供する分子に沿って十分な場所に遭遇する必要がある。完全なゲノム配列決定が、ゲノムの同じセグメント(理想的には、同じ染色体に由来する分子)にわたる複数の分子からの情報の合成を必要とする場合、アルゴリズムは、複数の分子から得られた情報を処理する必要がある。1つのアルゴリズムは、複数の分子間で共通している配列に基づいて分子を整列させ、領域がカバーされているともに整列した分子からの帰属によって、各分子内のギャップを埋めるタイプのアルゴリズムである。したがって、ある分子のギャップは、別の(ともに整列した分子)分子内のリードによってカバーされる。さらに、Eugene Myersによって開発されたようなショットガンアセンブリ法は、多数のリードが予めアセンブリされているという追加の利点を用いて(例えば、互いに対するリードの場所、リード間のギャップの長さが既知である)、アセンブリを実行するように適合され得る。Mishraら(Bioinformatics,Oxford Journals,(2011)27(2):153-160)によって記載されているSUTTAなどの他のアルゴリズム的なアプローチも、データのアセンブリのために適合され得る。様々な実施形態では、参照ゲノムは、長距離ゲノム構造もしくは短距離ポリヌクレオチド配列のいずれか、またはその両方のアセンブリを容易にするために使用され得る。リードは、部分的にデノボアセンブリされ、次いで、参照に整列され、次いで、参照支援アセンブリが、デノボアセンブリされ得る。(例えば、異なる民族からの)様々な参照アセンブリを使用して、ゲノムアセンブリ用のいくつかのガイダンスを提供することができる。しかしながら、実際の分子から得られる情報(特に、2つ以上の分子によって裏付けられている場合)は、参照からの任意の情報よりも重み付けされる。従来技術では、複数の個別に検査された単一のポリヌクレオチド分子から得られた局所的配列を整列させることによって、連続した配列を再構築することができることは示されていない。
Incorporating Reads from Multiple Polynucleotides Preferably, contiguous sequences are obtained via de novo assembly. However, reference sequences can also be used to facilitate assembly. This makes it possible to build de novo assemblies, but it is more difficult to resolve individual haplotypes over very long distances, requiring encountering enough locations along the molecule to provide information about the haplotype. There is Where complete genome sequencing requires the synthesis of information from multiple molecules spanning the same segment of the genome (ideally, molecules originating from the same chromosome), the algorithm will combine the information obtained from multiple molecules. need to be processed. One algorithm is a type of algorithm that aligns molecules based on sequences that are common among multiple molecules and fills gaps within each molecule with assignments from co-aligned molecules that have regions covered. . Thus, gaps in one molecule are covered by reads in another (co-aligned molecule) molecule. In addition, shotgun assembly methods, such as those developed by Eugene Myers, use the additional advantage of having a large number of pre-assembled reads (e.g., location of reads relative to each other, length of gaps between reads known). ), which can be adapted to perform the assembly. Other algorithmic approaches such as SUTTA described by Mishra et al. (Bioinformatics, Oxford Journals, (2011) 27(2):153-160) can also be adapted for data assembly. In various embodiments, a reference genome can be used to facilitate assembly of either long-range genomic structures or short-range polynucleotide sequences, or both. Reads can be partially de novo assembled, then aligned to a reference, and then de novo assembled with reference assisted assembly. Various reference assemblies (eg, from different ethnicities) can be used to provide some guidance for genome assembly. However, information obtained from actual molecules (especially when supported by more than one molecule) is weighted over any information from references. The prior art has not shown that contiguous sequences can be reconstructed by aligning local sequences obtained from multiple individually examined single polynucleotide molecules.

参照なしの配列決定
様々な実施形態では、配列は、標的ポリヌクレオチド分子の別のコピーまたは標的ポリヌクレオチド分子の参照配列を使用せずに決定される。この場合、大部分のリード(例えば、90%)が合体され、合体していないそれらのリードのリード間のギャップが分かる。ポリヌクレオチドの糸尺(linear length)が追跡可能であること、およびリード間の画素数を計数し、各画素にわたるDNAの長さの知識を使用することによって、ギャップの距離を決定することができることから、ギャップ距離が分かるであろう。
Reference-Free Sequencing In various embodiments, the sequence is determined without the use of another copy of the target polynucleotide molecule or a reference sequence of the target polynucleotide molecule. In this case, most of the reads (eg, 90%) are coalesced and the gaps between the reads for those that are not coalesced are known. that the linear length of the polynucleotide is traceable and that the gap distance can be determined by counting the number of pixels between reads and using knowledge of the length of the DNA across each pixel will give the gap distance.

ハプロタイプ解像配列決定
ゲノム配列は、ハプロタイプ情報(単一の親染色体に由来する単一のDNA分子に沿ったアレルの関連)を長距離にわたって得ることができれば、はるかに大きな有用性を有するであろう。
Haplotype-Resolving Sequencing Genomic sequencing would have far greater utility if haplotype information (allelic association along a single DNA molecule derived from a single parental chromosome) could be obtained over long distances. deaf.

様々な態様および実施形態では、本方法は、ハプロタイプを配列決定するために使用することができる。ハプロタイプの配列決定には、本発明による方法を使用して、二倍体ゲノムのハプロタイプにわたる第1の標的ポリヌクレオチドを配列決定するステップと、本発明による方法を使用して、二倍体ゲノムのハプロタイプ分岐にわたる第2の標的ポリヌクレオチドを配列決定するステップであって、第1および第2の標的ポリヌクレオチドが相同染色体の異なるコピーに由来する、配列決定するステップと、第1および第2の標的ポリヌクレオチドの配列を比較し、それによって、第1および第2の標的ポリヌクレオチド上のハプロタイプを決定するステップと、が含まれ得る。 In various aspects and embodiments, the methods can be used to sequence haplotypes. Haplotype sequencing includes sequencing a first target polynucleotide across haplotypes of the diploid genome using a method according to the invention, and sequencing a second target polynucleotide across the haplotype divergence, wherein the first and second target polynucleotides are from different copies of homologous chromosomes; comparing the sequences of the polynucleotides thereby determining haplotypes on the first and second target polynucleotides.

細胞集団におけるハプロタイプの多様性および頻度の決定
細胞の集団におけるゲノムの不均一性を調べることを目的とする多くの既存の方法では、技術的に要求が厳しい単一細胞解析が使用される。しかしながら、本発明の注目に値する特徴は、分子が十分に長い場合、細胞集団に存在する異なる染色体、長い染色体セグメント、またはハプロタイプが決定され得るため、単一細胞の内容物を一緒に保持する必要性がなく、集団におけるゲノムの不均一性が分析され得ることである。これは、どの2つのハプロタイプが一緒に細胞内に存在するかを示すものではないが、ゲノム構造タイプ(またはハプロタイプ)の多様性およびそれらの頻度、ならびにどの異常な構造バリアントが存在するかについて報告する。本実施形態は、以下のステップ:
1.ゲノムDNAを、2つ以上の細胞から抽出することと、
2.DNAを伸長させ、本発明の配列決定方法を実施することと、
3.データを分析して、どのDNA鎖がホモログであるかを決定することと、
4.ホモログ間の異なるハプロタイプを決定することと、
5.異なるハプロタイプの頻度を決定することと、を含む。
Determination of Haplotype Diversity and Frequency in Cell Populations Many existing methods aimed at examining genomic heterogeneity in populations of cells employ technically demanding single-cell analysis. However, a notable feature of the present invention is that if the molecule is long enough, different chromosomes, long chromosomal segments, or haplotypes present in a cell population can be determined, thus requiring the contents of a single cell to be held together. Without gender, genomic heterogeneity in populations can be analyzed. It does not indicate which two haplotypes exist together in a cell, but reports on the diversity of genomic structural types (or haplotypes) and their frequencies, as well as which aberrant structural variants are present. do. This embodiment includes the following steps:
1. extracting genomic DNA from two or more cells;
2. elongating the DNA and performing the sequencing method of the invention;
3. analyzing the data to determine which DNA strands are homologs;
4. determining different haplotypes between homologs;
5. and determining frequencies of different haplotypes.

他の配列決定技術との相乗効果
一部の実施形態では、本発明の方法は、完全なゲノム配列決定であることにとどまらず、Illumina由来のものなどの短いリード配列決定のための足掛かりを提供するために使用される。この場合、ゲノムのより均一なカバレッジを得るために、PCR増幅ステップを除外することによって、Illuminaライブラリの調製を行うことが有利である。これらの実施形態のいくつかの1つの利点は、必要とされる配列決定のカバレッジ倍率が、例えば、約40倍から20倍に半減され得ることである。一部の実施形態では、これは、本発明の方法によって行われる配列決定および方法が提供する場所情報の追加によるものである。
Synergy with Other Sequencing Technologies In some embodiments, the methods of the present invention go beyond full genome sequencing and provide a stepping stone for short read sequencing, such as those from Illumina. used to In this case, it is advantageous to perform Illumina library preparation by omitting the PCR amplification step in order to obtain more uniform coverage of the genome. One advantage of some of these embodiments is that the required sequencing coverage factor can be halved, eg, from about 40-fold to 20-fold. In some embodiments, this is due to the sequencing performed by the method of the invention and the addition of location information provided by the method.

配列決定パネル
一部の実施形態では、特定の遺伝子または遺伝子座に対応するゲノムのサブセットを配列決定することが望ましい。この場合、ゲノムDNAは一本鎖にされ、配列特異的オリゴが、目的の領域にわたって一過的にアニーリングする。このように配列決定を標的化する1つの利点は、ゲノムの全体が表面に伸展されても、標的化領域のみがライトアップされることである。そのため、光検出可能な標的領域に直接赴くによって撮像時間が短縮され得る。さらに、分子のわずかな部分のみが検出される必要があるため、ゲノムを、通常よりもはるかに高い密度で表面に整列させることができる。一例として、ヒトゲノムのBRCA1領域は、BRCA1配列に相補的な複数のオリゴヌクレオチドをアニーリングすることによって、配列決定することができる。ゲノムの他の部分は検出されないままである。
Sequencing Panels In some embodiments, it is desirable to sequence a subset of the genome corresponding to a particular gene or locus. In this case, genomic DNA is made single-stranded and sequence-specific oligos are transiently annealed over the region of interest. One advantage of targeting sequencing in this way is that even if the entire genome is stretched to the surface, only the targeted region is lit up. Imaging time can thus be reduced by going directly to the photodetectable target area. Furthermore, genomes can be arrayed on surfaces at much higher densities than usual, since only a small fraction of the molecules need to be detected. As an example, the BRCA1 region of the human genome can be sequenced by annealing multiple oligonucleotides complementary to the BRCA1 sequence. Other parts of the genome remain undetected.

セルフリー核酸
診断に最もアクセス可能なDNAまたはRNAのいくつかは、体液または便の細胞外に見つかる。血液中を循環するDNAは、21番染色体トリソミーおよび他の染色体およびゲノム障害の出生前検査に使用される。それは、特定の病理状態のマーカーである腫瘍由来のDNAおよび他のDNAまたはRNAを検出する手段でもある。しかしながら、これらの分子は、典型的には、血液中で約200bpの長さの範囲にあり、尿中ではより短い。ゲノム領域のコピー数は、ゲノムの他の部分と比較して、参照に整列するリードの数と比較することによって、決定される。
Cell-Free Nucleic Acids Some of the most diagnostically accessible DNA or RNA is found extracellularly in bodily fluids or stool. DNA circulating in the blood is used for prenatal testing for trisomy 21 and other chromosomal and genomic disorders. It is also a means of detecting tumor-derived DNA and other DNA or RNA that are markers of certain pathological states. However, these molecules typically range in length from about 200 bp in blood and are shorter in urine. The copy number of a genomic region is determined by comparing the number of reads that align to the reference compared to other parts of the genome.

場合によっては、核酸がメチル化されているかどうかを、配列特異的な様式で決定することが有用である。例えば、胎児DNAを母体DNAから区別する1つの方法は、前者が目的の遺伝子座でメチル化されることであり、これは、非侵襲的産前検査(NIPT)に有用であり得る。 In some cases it is useful to determine in a sequence specific manner whether a nucleic acid is methylated. For example, one way to distinguish fetal from maternal DNA is that the former is methylated at the locus of interest, which can be useful for non-invasive prenatal testing (NIPT).

本発明は、2つのアプローチによるセルフリー核酸配列の列挙または分析に適用することができる。1つ目は、変性の前または後に短い核酸を固定化することを伴う。一過性結合試薬は、核酸の同一性、そのコピー数、変異または特定のSNPアレルが存在するかどうか、ならびに検出された配列がメチル化されているか、または他の修飾(バイオマーカー)を有するかどうかを決定するために、核酸を照合するために使用され得る。 The present invention can be applied to enumeration or analysis of cell-free nucleic acid sequences by two approaches. The first involves immobilizing short nucleic acids before or after denaturation. Transient binding reagents determine the identity of the nucleic acid, its copy number, whether mutations or specific SNP alleles are present, and whether the detected sequence is methylated or has other modifications (biomarkers) can be used to interrogate nucleic acids to determine whether

これには、
1)体液(例えば、血液)から、セルフリー核酸を単離することと、
2)単離されたセルフリー核酸を、基板に固定化することと、
3)固定化されたセルフリー核酸へのプローブの結合によって、配列決定を行うことと、が含まれる。
This includes
1) isolating cell-free nucleic acids from a body fluid (e.g., blood);
2) immobilizing the isolated cell-free nucleic acid on a substrate;
3) performing sequencing by binding of the probe to the immobilized cell-free nucleic acid.

2つ目は、まず小さな断片を連結することで、コンカテマーを伸展できるようにすることである。これには、
4)血液から、セルフリーDNAを単離することと、
5)DNAを連結することと、
6)連結されたDNA上のプローブの結合によって、配列決定を行うことと、が含まれる。
The second is to ligate small pieces first so that the concatemer can be extended. This includes
4) isolating cell-free DNA from the blood;
5) ligating the DNA;
6) performing sequencing by binding probes on the ligated DNA.

一部の実施形態では、連結は、DNAの末端を研磨し、平滑末端ライゲーションを行うことによって、行われる。代替的に、血液またはセルフリーDNAは、2つのアリコートに分割され得、一方のアリコートは、ポリAでテール付加され(ターミナルトランスフェラーゼを使用して)、他方のアリコートは、ポリTによってテール付加される。 In some embodiments, ligation is performed by polishing the ends of the DNA and performing blunt-end ligation. Alternatively, the blood or cell-free DNA can be split into two aliquots, one aliquot tailed with poly-A (using terminal transferase) and the other aliquot tailed with poly-T. be.

次いで、得られたコンカテマーを配列決定に供する。得られた「スーパー」配列リードを、次いで、参照と比較して、個々のリードを抽出する。個々のリードデータは、計算的に抽出され、次いで、他の短いリードデータと同じ様式で処理される。 The resulting concatemers are then subjected to sequencing. The resulting "super" sequence reads are then compared to references to extract individual reads. Individual lead data is computationally extracted and then processed in the same manner as other short lead data.

核酸は、核酸を分解することができる多数のエキソヌクレアーゼを含む媒体である便中にも見出され、エキソヌクレアーゼが機能するために必要な大量の二価カチオンのキレート剤(例えば、EDTA)を用いて、DNAを十分にインタクトで保持し、本発明の方法に従って配列決定することができる。DNAが細胞から脱落する別の方法は、エキソソーム内のカプセル化を介する。エキソソームは、超遠心分離によって、またはスピンカラム(Qiagen)を使用することによって単離され得、それに含まれるDNAまたはRNAが回収され、本発明の方法に従って配列決定することができる。 Nucleic acids are also found in the stool, a medium containing numerous exonucleases capable of degrading nucleic acids and containing large amounts of divalent cation chelators (e.g., EDTA) required for the exonucleases to function. can be used to keep the DNA sufficiently intact to be sequenced according to the methods of the invention. Another method by which DNA is shed from cells is through encapsulation within exosomes. Exosomes can be isolated by ultracentrifugation or by using spin columns (Qiagen) and the DNA or RNA contained therein can be recovered and sequenced according to the methods of the invention.

一部の実施形態では、1つ、ただし通常は少なくとも2つ、好ましくはいくつかのオリゴヌクレオチドの核酸への結合は、その同一性、または核酸のゲノムのどの部分に由来もしくは起源しているのかを決定するのに十分である。したがって、完全なレパートリーが試験される前に、不完全な配列決定により、必要な情報が提供され得る。一部の実施形態では、異なる染色体またはゲノム領域の比率は、それらのゲノム起源に従って識別される核酸分子の数を計数することによって、決定される。一部の実施形態では、これにより、試料の胎児画分に関する情報を決定することが可能になる。一部の実施形態では、核酸分子の同一性または起源の決定とともに、1つ以上のオリゴの結合を分析することによって、一塩基バリアントまたはインデルの出現が決定される。 In some embodiments, the binding of one, but usually at least two, preferably several oligonucleotides to the nucleic acid is derived or originated from its identity or from which part of the genome of the nucleic acid. is sufficient to determine Thus, incomplete sequencing may provide the necessary information before the full repertoire is tested. In some embodiments, the proportion of different chromosomal or genomic regions is determined by counting the number of nucleic acid molecules that are distinguished according to their genomic origin. In some embodiments, this allows information about the fetal fraction of the sample to be determined. In some embodiments, the occurrence of single nucleotide variants or indels is determined by analyzing binding of one or more oligos along with determining the identity or origin of the nucleic acid molecule.

オリゴヌクレオチドが結合する時間が長いほど、核酸分子の同一性または起源を決定するのに必要なオリゴヌクレオチドは少なくなる。この点で、特定の遺伝子または遺伝子座は、オリゴヌクレオチドプローブ配列のパネルの提供によって検出することができ、かかるプローブは、10ヌクレオチドを超えるオリゴ長であるか、または長さが10nt未満の複数の特定の短いオリゴヌクエルチドである。したがって、がん関連プローブのパネルを、血液から抽出された核酸分子に適用して、がん関連遺伝子を識別し、次いで、さらなるオリゴヌクレオチドの結合を使用して、一塩基バリアントまたはインデルを識別することができる。このための本発明に記載されるアプローチの利点には、バリアントを呼び出す際の信頼度を高めるための、複数の結合事象、および一部の実施形態では、両方の鎖のプロービングが含まれる。 The longer the oligonucleotide binds, the less oligonucleotide is required to determine the identity or origin of the nucleic acid molecule. In this regard, specific genes or loci can be detected by providing a panel of oligonucleotide probe sequences, such probes being oligos greater than 10 nucleotides in length, or multiple oligos less than 10 nt in length. Certain short oligonucleotides. Thus, a panel of cancer-associated probes is applied to nucleic acid molecules extracted from blood to identify cancer-associated genes, and then binding of additional oligonucleotides is used to identify single nucleotide variants or indels. be able to. Advantages of the approach described in the present invention for this include multiple binding events and, in some embodiments, probing of both strands to increase confidence in calling variants.

RNA配列決定
RNAの長さは、典型的には、ゲノムDNAよりも短いが、現在の技術を使用してRNAを一端から他端へ配列決定することは困難である。それにもかかわらず、選択的スプライシングのため、mRNAの完全な配列組成を得、決定することが非常に重要である。本発明の一部の実施形態では、mRNAは、そのポリAテールを固定化されたオリゴd(T)に結合させることによって捕捉することができ、その二次構造は、伸展力および変性条件によって除去され、そのため、表面に伸長され得る。次いで、結合試薬(エキソン特異的である)が、一過的に結合することが可能になる。RNAの長さが短いため、本発明に記載の単一分子局在化方法を用いて、エキソンを解像および区別することが有益である。一部の実施形態では、RNAに散在するわずかな結合事象は、特定のmRNAアイソフォームに関するmRNA内のエキソンの順序および同一性を決定するのに十分である。
RNA Sequencing Although RNA is typically shorter in length than genomic DNA, it is difficult to sequence RNA from one end to the other using current technology. Nevertheless, due to alternative splicing, it is very important to obtain and determine the complete sequence composition of mRNA. In some embodiments of the present invention, mRNA can be captured by binding its polyA tail to immobilized oligo d(T), and its secondary structure is determined by stretching forces and denaturing conditions. removed so that it can be extended to the surface. A binding reagent (which is exon specific) is then allowed to bind transiently. Due to the short length of RNA, it is beneficial to resolve and distinguish exons using the single-molecule localization methods described in this invention. In some embodiments, the few binding events interspersed in the RNA are sufficient to determine the order and identity of exons within the mRNA for a particular mRNA isoform.

分析前に生体高分子の完全性を保存すること
生物学において、天然の状態の生体分子を観察することは、しばしば難しい。たいてい、天然の状態の生体分子の情報を取り出すプロセスは、天然の状態の一部の態様の破壊をもたらす。
Preserving the Integrity of Biomacromolecules Prior to Analysis In biology, it is often difficult to observe biomolecules in their native state. Most often, the process of retrieving information on biomolecules in their native state results in the disruption of some aspect of their native state.

ゲノムの場合、天然の染色体状態のゲノムの情報内容を分析することが課題である。ヒト染色体におけるDNAは、5,000万塩基長~2億5,000万塩基長の範囲であり得るが、今日のショットガン配列決定技術は、数百塩基長しか読み取ることができない。これは、DNA配列の場所およびコピー数が表現型に重要な意味を有することがますます認識されるようになっているにもかかわらず、である。 In the case of genomes, the challenge is to analyze the information content of the genome in its native chromosomal state. DNA in human chromosomes can range from 50 million to 250 million bases long, but today's shotgun sequencing technology can read only a few hundred bases long. This is despite the increasing recognition that the location and copy number of DNA sequences have important implications for phenotype.

損傷の多くは、細胞および組織から生体分子を抽出するプロセス、ならびに(生体分子が分析される前の)生体分子のその後の取り扱いにおいて生じる。DNAの場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。機械的ストレスは、最小化することができる(例えば、ChemBioChem,11:340-343(2010)に記載されている。加えて、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。 Much of the damage occurs in the process of extracting biomolecules from cells and tissues and in their subsequent handling (before they are analyzed). In the case of DNA, aspects of its handling that result in loss of its integrity can include pipetting, vortexing, freeze-thawing, and excessive heating. Mechanical stress can be minimized (for example, as described in ChemBioChem, 11:340-343 (2010). In addition, EDTA, EGTA, or gallic acid (and its analogs and derivatives) can be High concentrations of divalent cations can inhibit degradation by nucleases, hi some embodiments, a 2:1 mass ratio of sample to divalent cations is useful in samples such as stool where extreme levels of nucleases are present. is also sufficient to inhibit the nuclease.

本発明の代替的な態様が対処しようとする問題は、分析の前に、生体高分子の天然の完全性をどのように保存するか、特に、その天然の長さ、またはその天然の長さにやや近い長さのゲノムDNAをどのように保存するかである。これは、本発明の方法を使用した配列決定、または他の方法を使用した配列決定の両方に関連する。それは、特に、ナノポア配列決定に特に関連している。 The problem that alternative embodiments of the present invention seek to address is how to preserve the natural integrity of a biopolymer, in particular its natural length, or its natural length, prior to analysis. How to preserve genomic DNA with a length somewhat close to . This concerns both sequencing using the method of the invention or sequencing using other methods. It is particularly relevant for nanopore sequencing.

一部の実施形態では、本発明は、分析用の生体高分子を送達するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から分析ゾーンに遊離することと、を含む。
In some embodiments, the present invention relates to a method for delivering biopolymers for analysis, comprising:
1) providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
2) placing a protective entity comprising a biomacromolecule in proximity to the analysis zone;
3) liberating the biopolymer from the protective entity into the analysis zone.

一部の実施形態では、本発明は、分析用の生体高分子を調製するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から遊離することと、
4)生体高分子を、分析ゾーンに通すことと、を含む。
In some embodiments, the present invention relates to methods for preparing biopolymers for analysis, comprising:
1) providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
2) placing a protective entity comprising a biomacromolecule in proximity to the analysis zone;
3) liberating the biopolymer from the protective entity;
4) passing the biopolymer through an analysis zone;

一部の実施形態では、本発明は、分析用の生体高分子を調製するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から分析ゾーンに遊離することと、を含む。
In some embodiments, the present invention relates to methods for preparing biopolymers for analysis, comprising:
1) providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
2) placing a protective entity comprising a biomacromolecule in proximity to the analysis zone;
3) liberating the biopolymer from the protective entity into the analysis zone.

さらなる実施形態では、本発明は、生体高分子を分析するための方法に関し、
1)生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
2)生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
3)生体高分子を、保護実体から遊離することと、
4)生体高分子を、分析ゾーンに通すことと、
5)分析ゾーンにおいて、生体高分子の少なくとも1つの特徴を検出することと、を含む。
In a further embodiment, the invention relates to a method for analyzing biomacromolecules,
1) providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
2) placing a protective entity comprising a biomacromolecule in proximity to the analysis zone;
3) liberating the biopolymer from the protective entity;
4) passing the biopolymer through the analysis zone;
5) detecting at least one characteristic of the biopolymer in the analysis zone.

一部の実施形態では、本発明は、分析用のゲノムDNAを送達するための方法に関し、
1)ゲノムDNAを含む保護実体を提供することであって、当該保護実体が、その天然長に近いゲノムDNAを保存する、提供することと、
2)ゲノムDNAを含む保護実体を、分析ゾーンに近接して配置することと、
3)ゲノムDNAを、保護実体から遊離することと、
4)ゲノムDNAを、分析ゾーンに通すことと、を含む。
In some embodiments, the invention relates to a method for delivering genomic DNA for analysis, comprising:
1) providing a protected entity comprising genomic DNA, said protected entity preserving the genomic DNA near its natural length;
2) placing protective entities containing genomic DNA in close proximity to the analysis zone;
3) liberating the genomic DNA from the protective entity;
4) passing the genomic DNA through an analysis zone;

さらなる実施形態では、本発明は、
1)ゲノムDNAを含むアガロースゲルを提供することであって、当該アガロースゲルが、200Kb長を超えるゲノムDNAのかなりの部分を保存する、提供することと、
2)ゲノムDNAを含む当該アガロースを、DNAが分析される表面に近接して配置することと、
3)ゲノムDNAを、アガロースから表面に遊離することと、
4)DNAを一方向に伸長することと、を含む。
In a further embodiment, the invention provides
1) providing an agarose gel containing genomic DNA, said agarose gel preserving a substantial portion of genomic DNA greater than 200 Kb in length;
2) placing the agarose containing genomic DNA in close proximity to the surface on which the DNA is to be analyzed;
3) liberating the genomic DNA from the agarose to the surface;
4) stretching the DNA in one direction.

一部の実施形態では、本発明は、希少な標的分子が検出される、分析用の生体高分子を調製するための方法に関し、
1)機械的ストレスを最小化し、かつ/または高濃度の二価カチオン/没食子酸を含む環境を含む容器内で、かつ高分子の集積を最小化するために(例えば、脂質層を介して)不動態化された容器の領域内で、生体高分子を抽出することと、
2)抽出された生体高分子を、容器内の表面に固定することと、
3)本発明の方法に従って、抽出および固定化された生体高分子を分析/配列決定することと、を含む。
In some embodiments, the present invention relates to methods for preparing biopolymers for analysis in which rare target molecules are detected,
1) to minimize mechanical stress and/or in vessels containing environments with high concentrations of divalent cations/gallic acid and to minimize accumulation of macromolecules (e.g. via lipid layers); extracting the biopolymer within the region of the passivated container;
2) fixing the extracted biopolymer to a surface within the container;
3) analyzing/sequencing the extracted and immobilized biopolymers according to the methods of the invention.

一部の実施形態では、ゲノムDNAの長さは、50Kb、100Kb、200Kb、400Kb、800Kb超である。一部の実施形態では、DNAの特定の部分は、約1Mbを超える長さである。一部の実施形態では、一部の分子のDNAは、5Mbを超える長さである。一部の実施形態では、DNAの標的分子は、染色体の実質的な長さに近い。一部の実施形態では、テロメアからテロメアまでの染色体の全長が保存され、分析される。 In some embodiments, the length of genomic DNA is greater than 50Kb, 100Kb, 200Kb, 400Kb, 800Kb. In some embodiments, the specified portion of DNA is greater than about 1 Mb in length. In some embodiments, the DNA of some molecules is greater than 5 Mb in length. In some embodiments, the DNA target molecule approximates the substantial length of a chromosome. In some embodiments, the entire length of the chromosome from telomere to telomere is stored and analyzed.

一部の実施形態では、アガロースゲルは、アガロースビーズの形態である。一部の実施形態では、DNAは、液滴に封入される。一部の実施形態では、DNAは、実質的にクロマチンとして残る。一部の実施形態では、DNAは、染色体として残る。一部の実施形態では、染色体は、細胞周期の中期段階の染色体である。一部の実施形態では、染色体は、細胞周期の後期段階の染色体である。 In some embodiments, the agarose gel is in the form of agarose beads. In some embodiments, DNA is encapsulated in droplets. In some embodiments, the DNA remains substantially as chromatin. In some embodiments, the DNA remains chromosomal. In some embodiments, the chromosome is a cell cycle metaphase chromosome. In some embodiments, the chromosome is a late cell cycle chromosome.

一部の実施形態では、試料は、実質的に単一細胞の全DNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全RNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全タンパク質/ポリペプチド/ペプチド内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全DNAおよびRNA内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全DNA、RNA、タンパク質内容物を含む。 In some embodiments, the sample comprises substantially the total DNA content of a single cell. In some embodiments, the sample comprises substantially the total RNA content of a single cell. In some embodiments, the sample comprises substantially the entire protein/polypeptide/peptide content of a single cell. In some embodiments, the sample comprises substantially the total DNA and RNA content of a single cell. In some embodiments, the sample comprises substantially the total DNA, RNA, protein content of a single cell.

一部の実施形態では、試料は、実質的に単一細胞の全細胞質内容物を含む。一部の実施形態では、試料は、実質的に単一細胞の全核内容物を含む。一部の実施形態では、試料は、RNAの全細胞質内容物およびDNAの全核内容物を含む。一部の実施形態では、試料は、実質的にタンパク質の全膜内容物を含む。 In some embodiments, the sample comprises substantially the entire cytoplasmic contents of a single cell. In some embodiments, the sample comprises substantially the entire nuclear contents of a single cell. In some embodiments, the sample comprises total cytoplasmic content of RNA and total nuclear content of DNA. In some embodiments, the sample comprises substantially the entire membrane content of proteins.

一部の態様では、本方法は、以下を含む。 In some aspects, the method includes the following.

1.生体高分子を分析ゾーンに送達するための方法:
a.生体高分子を含む保護実体を提供することであって、当該保護実体が、その天然状態に近い生体高分子を保存する、提供することと、
b.生体高分子を含む保護実体を、分析ゾーンに近接して配置することと、
c.生体高分子を、保護実体から遊離することと、
d.生体高分子を、分析ゾーンに通すことと、
e.分析ゾーンにおいて、生体高分子の少なくとも1つの特徴を検出することと、を含む、方法。
1. Methods for delivering biopolymers to the analysis zone:
a. providing a protected entity comprising a biopolymer, the protected entity preserving the biopolymer near its native state;
b. placing a protective entity comprising a biopolymer proximate to the analysis zone;
c. liberating the biopolymer from the protective entity;
d. passing the biopolymer through an analysis zone;
e. detecting at least one characteristic of the biopolymer in the analysis zone.

2.保護実体が、分析ゾーンと並置される、1に記載の方法。 2. 2. The method of 1, wherein the protective entity is juxtaposed with the analysis zone.

3.保護実体が、生体高分子の天然環境を含む、1に記載の方法。 3. 2. The method of 1, wherein the protective entity comprises the natural environment of the biopolymer.

4.保護実体が、染色体、染色分体、またはクロマチンを含む、3に記載の方法。 4. 4. The method of 3, wherein the protective entity comprises a chromosome, chromatid, or chromatin.

5.保護実体が、細胞、核、オルガネラ、小胞、エキソソーム、カプシドを含む、3に記載の方法。 5. 4. The method of 3, wherein the protective entity comprises cells, nuclei, organelles, vesicles, exosomes, capsids.

6.保護実体が、コンパクトな構造における生体高分子の凝縮、折り畳み、または他のレンダリングを含む、1に記載の方法。 6. 2. The method according to 1, wherein the protective entity comprises condensation, folding or other rendering of biomacromolecules in a compact structure.

7.保護実体が、液滴、ビーズ、またはゲルである、1に記載の方法。 7. 2. The method of 1, wherein the protective entity is a droplet, bead, or gel.

8.保護実体が、ゲルビーズ、ゲルプラグ、ゲルスラブ、ゲルキャピラリー、または他のゲル形成物である、5に記載の方法。 8. 6. The method of 5, wherein the protective entity is a gel bead, gel plug, gel slab, gel capillary, or other gel former.

9.ゲルが、アガロースである、8に記載の方法。 9. 9. The method according to 8, wherein the gel is agarose.

10.生体高分子が、態様1のステップ1の前に、保護実体内に封入されるかまたは包まれる、先行態様1~9に記載の方法。 10. 10. The method of preceding aspects 1-9, wherein the biopolymer is encapsulated or encased in a protective entity prior to step 1 of aspect 1.

11.生体高分子が、電場の印加を介して保護実体から遊離される、8に記載の方法。 11. 9. A method according to 8, wherein the biopolymer is released from the protective entity via application of an electric field.

11a.生体高分子が、マイクロ流体構造中に遊離される方法。 11a. A method in which a biopolymer is released into a microfluidic structure.

11b.マイクロ流体構造が、不動態化される、11aに記載の方法。 11b. The method of 11a, wherein the microfluidic structure is passivated.

11c.不動態化が、脂質コーティングを介する、11bに記載の方法。 11c. The method of 11b, wherein passivation is via a lipid coating.

12.分析ゾーンが、ナノポア、ナノギャップ、または他のナノスケール検出ステーション/リーディングヘッドである、1に記載の方法。 12. 2. The method of 1, wherein the analysis zone is a nanopore, nanogap, or other nanoscale detection station/reading head.

12b.個々のポリヌクレオチドが分析ゾーンの近くに遊離された後、個々のポリヌクレオチドに対して、ナノポア配列決定が行われる、12に記載の方法。 12b. 13. The method according to 12, wherein nanopore sequencing is performed on individual polynucleotides after they have been released near the analysis zone.

13.分析ゾーンが、表面である、1に記載の方法。 13. 2. The method of 1, wherein the analysis zone is a surface.

14.表面が、生体高分子上の1つ以上の部位に結合することができる薬剤を含む、12に記載の方法。 14. 13. The method according to 12, wherein the surface comprises an agent capable of binding to one or more sites on the biopolymer.

15.分析ゾーンが、ナノチャネル、ナノグルーブ、ナノピット、またはナノスリットである、1に記載の方法。 15. 2. The method of 1, wherein the analysis zone is a nanochannel, nanogroove, nanopit, or nanoslit.

16.生体高分子が、流体中に存在し、かつ分析ゾーンと接触している構造中に遊離される、1に記載の方法。 16. 2. The method of claim 1, wherein the biopolymer is present in the fluid and released into a structure in contact with the analysis zone.

17.生体高分子が、分析ゾーンに到達する前に、マイクロ流体チャネルを通過する、15に記載の方法。 17. 16. The method according to 15, wherein the biopolymer passes through a microfluidic channel before reaching the analysis zone.

18.生体高分子が、電気泳動または電気浸透によって遊離される、1に記載の方法。 18. 2. The method of 1, wherein the biopolymer is released by electrophoresis or electroosmosis.

19.分析ゾーンへの通過速度が、分子ラチェット、分子モーター、流体力学的抗力、電場、光ピンセット、磁気ピンセットによって制御される、1に記載の方法。 19. 2. The method of claim 1, wherein the speed of passage into the analysis zone is controlled by molecular ratchets, molecular motors, hydrodynamic drag, electric fields, optical tweezers, magnetic tweezers.

20.生体高分子が、保護実体を破壊する薬剤によって遊離される、1に記載の方法。 20. 2. A method according to 1, wherein the biopolymer is liberated by an agent that destroys the protective entity.

21.破壊剤が、酵素、洗剤、酸性溶液、またはアルカリ性溶液である、20に記載の方法。 21. 21. The method according to 20, wherein the disrupting agent is an enzyme, detergent, acid solution, or alkaline solution.

22.酵素が、プロテアーゼである、21に記載の方法。 22. 22. The method according to 21, wherein the enzyme is a protease.

23.破壊剤が、超音波処理、帯電スイッチ、温度変化、ヒートショック、コールドショック、解凍などを含む、20に記載の方法。 23. 21. The method according to 20, wherein the destructive agent includes sonication, charge switch, temperature change, heat shock, cold shock, thawing, and the like.

24.保護が、剪断力からの保護である、1に記載の方法。 24. 2. The method according to 1, wherein the protection is protection from shear forces.

25.保護が、ヌクレアーゼ、プロテアーゼからの保護である、1に記載の方法。 25. 2. The method according to 1, wherein the protection is protection from nucleases, proteases.

26.ステップeが、生体高分子上の2つ以上の場所における2つ以上の特徴を検出することを含む、請求項1に記載の方法。 26. 2. The method of claim 1, wherein step e comprises detecting two or more features at two or more locations on the biopolymer.

27.生体高分子が、ポリマーである、1に記載の方法。 27. 2. The method according to 1, wherein the biopolymer is a polymer.

28.天然状態に近い保存が、ポリマーを、実質的に長い鎖長で保存することを含む、請求項27に記載の方法。 28. 28. The method of claim 27, wherein near-native preservation comprises preserving the polymer with substantially longer chain lengths.

29.ポリマーが、DNAポリマーであり、鎖長が、40Kb、100Kb、200Kb、500Kb、1Mb、5Mb、50Mb、250Mbにわたって保存されている、28に記載の方法。 29. 29. The method of 28, wherein the polymer is a DNA polymer and chain length is conserved over 40 Kb, 100 Kb, 200 Kb, 500 Kb, 1 Mb, 5 Mb, 50 Mb, 250 Mb.

30.生体高分子が、生体高分子の移動方向に対して垂直な流れ(クロスフロー)の試薬によって遊離される、1に記載の方法。 30. 2. The method of claim 1, wherein the biopolymer is liberated by a flow of reagent perpendicular to the direction of movement of the biopolymer (cross-flow).

31.クロスフローが、RNAse、プロテアーゼ、アルカリ、洗剤を含む、30に記載の方法。 31. 31. The method according to 30, wherein cross-flow comprises RNAse, protease, alkali, detergent.

32.生体高分子が、その放出後、およびその分析ゾーンに入る前に、一連のピラーまたはポストを横断する、1に記載の方法。 32. A method according to 1, wherein the biopolymer traverses a series of pillars or posts after its release and before entering its analysis zone.

33.保護実体が、パラフィンを含む、1に記載の方法。 33. 2. The method of 1, wherein the protective entity comprises paraffin.

34.保護実体が、ホルマリン固定・パラフィン包埋された生体高分子を含む、33に記載の方法。 34. 34. The method according to 33, wherein the protective entity comprises a formalin-fixed, paraffin-embedded biopolymer.

35.生体高分子が、その完全性を保持し、損傷を修復する溶液に曝露される、1に記載の方法。 35. 2. The method of 1, wherein the biopolymer is exposed to a solution that preserves its integrity and repairs damage.

36.生体高分子が、DNAであり、溶液が、修復酵素(例えば、NEBによるPCR修復ミックス)を含む、35に記載の方法。 36. 36. The method of 35, wherein the biopolymer is DNA and the solution contains repair enzymes (eg, PCR repair mix with NEB).

35.生体高分子の遊離が、生体高分子を、その天然の被包(encasing)から抽出するプロセス(例えば、細胞からのDNAの抽出)である、態様1~36に記載の方法。 35. 37. A method according to aspects 1-36, wherein liberating the biopolymer is a process of extracting the biopolymer from its natural encasing (eg, extraction of DNA from cells).

36.生体高分子が保護実体から遊離された後、マイクロピペッティング、ボルテックスおよび/または遠心分離を使用せずに、ステップが実施される、1に記載の方法。 36. 2. A method according to 1, wherein the steps are performed without the use of micropipetting, vortexing and/or centrifugation after the biopolymer has been released from the protective entity.

代替的な実施形態
代替的な一実施形態では、プローブは安定して結合するが、その一過性は、環境をオフモードに切り替える外部トリガーによって制御される。かかるトリガーは、プローブの結合を解離させる、熱、pH、電場、または試薬交換である。次いで、環境がオンモードに切り替わり、プローブが再び結合できるようになる。一部の実施形態では、第1のラウンドの結合で、結合によりすべての部位が飽和されない場合、第2のラウンドは、第1の部位以外の他の部位を占有することができる。これらのサイクルは、制御可能なレートで複数回実行され得る。
ALTERNATIVE EMBODIMENT In an alternative embodiment, the probe binds stably, but its transience is controlled by an external trigger that switches the environment to off mode. Such triggers are heat, pH, electric field, or reagent exchange to dissociate probe binding. The environment then switches to on mode, allowing the probe to bind again. In some embodiments, if the first round of binding does not saturate all sites, the second round can occupy other sites than the first. These cycles can be executed multiple times at a controllable rate.

代替的な超解像および単一分子局在化方法
代替的な実施形態では、プローブは比較的安定して結合されるが、回折限界よりも近い光シグナルを解像するためのいくつかのアプローチが存在する。まず、量子ドットまたは色素などの発光標識の光学特性が既知である場合、実体の点広がり関数を使用して、ポリヌクレオチドに沿って間隔の狭い2つのシグナルを解像することが可能である。これは、間隔の狭い2つのシグナルが異なる波長で放出される場合に容易に行われる。第二に、確率的プロセスである光退色を可能にすることによって、シグナルを解決することが可能である(J Biomed Opt.2012 Dec;17(12):126008)。第三に、説明され、市販されているいくつかのハードウェアアプローチがあり、走査光学顕微鏡、4Pi、STED、およびSIMを含む。STEDの場合、特定の互換性のあるフルオロフォアセットを使用する必要がある。時間的に離れている間隔の狭いシグナルに基づいて、いくつかの分子アプローチも説明されており、これには、STORM(サブ回折限界確率的光学再構築顕微鏡(STORM) M.J.Rust,M.Bates,X.Zhuang Nature Methods 3:793-795(2006))が含まれ、この場合、互換性のあるフルオロフォアの特定のセットを使用しなければならない。
Alternative Super-Resolution and Single Molecule Localization Methods In alternative embodiments, probes are bound relatively stably, but several approaches for resolving optical signals closer than the diffraction limit exists. First, if the optical properties of a luminescent label, such as a quantum dot or dye, are known, it is possible to resolve two closely spaced signals along the polynucleotide using the point spread function of the entity. This is easily done if the two closely spaced signals are emitted at different wavelengths. Second, it is possible to resolve the signal by allowing photobleaching, which is a stochastic process (J Biomed Opt. 2012 Dec;17(12):126008). Third, there are several hardware approaches described and commercially available, including scanning optical microscopes, 4Pi, STED, and SIM. For STED, a specific compatible fluorophore set must be used. Based on closely spaced signals separated in time, several molecular approaches have also been described, including STORM (sub-diffraction limited stochastic optical reconstruction microscopy (STORM) MJ Rust, M. Bates, X. Zhuang Nature Methods 3:793-795 (2006)), in which a specific set of compatible fluorophores must be used.

単一分子局在化方法であるDNA PAINT(Jungmann et al Nano Lett.2010,10:4756)もまた、本発明の様々な実施形態では使用され得る。DNA PAINTの場合、各結合プローブは、オリゴタグで標識され、それに対して、相補オリゴ抗タグが一過的に結合する。結合プローブの各々は、異なる配列相補体の結合パートナー対と会合する。区別するために、結合プローブの各々と会合するアンチタグは、他のアンチタグと区別可能である。それらを区別可能にする要素は、異なる波長の発光標識(例えば、Atto488、Cy3B、Alexa594、およびAtto655/647N)、異なる寿命を有する標識であり得るか、または異なるアンチタグは、異なるオン/オフ結合動態を有するように設計され得る。 DNA PAINT (Jungmann et al Nano Lett. 2010, 10:4756), a single molecule localization method, may also be used in various embodiments of the invention. For DNA PAINT, each bound probe is labeled with an oligotag to which a complementary oligo anti-tag transiently binds. Each binding probe associates with a binding partner pair of different sequence complement. To distinguish, the antitag associated with each of the bound probes is distinguishable from other antitags. The elements that make them distinguishable can be luminescent labels of different wavelengths (e.g., Atto488, Cy3B, Alexa594, and Atto655/647N), labels with different lifetimes, or different antitags have different on/off binding kinetics. can be designed to have

DNA PAINTを使用して、シグナルの局在の座標を正確に割り当てることができる。局在は、シグナルを放出するフルオロフォアが、組み込まれた部位に近いままである場合、決定がより容易である。したがって、波長発光部分(例えば、フルオロフォア)を塩基に結合するリンカーまたはブリッジの長さおよび柔軟性の程度が限定されなければならず、例えば、一部の実施形態では、短鎖の剛性リンカーが使用される。 DNA PAINT can be used to precisely assign the coordinates of signal localization. Localization is easier to determine if the signal-emitting fluorophore remains close to the site of incorporation. Therefore, the length and degree of flexibility of the linker or bridge that connects the wavelength-emitting moiety (e.g., fluorophore) to the base must be limited; used.

超解像画像を得るための別の代替手段は、拡張による(例えば、Chen,Tillberg,and Boyden Science 30 January 2015:Vol.347 no.6221 pp.543-548に記載されている)。ここでは、伸長されたポリヌクレオチドが、ゲル中に提供され、次いで、拡張され、したがって、生体材料が伸展される。ポリヌクレオチドと関連付けられた特異的標識は、膨潤可能なポリマーネットワークに共有結合的に繋留される。腫脹の際、ポリヌクレオチドが破壊されていても(または、もはや連続したポリリン酸骨格を有していなくても)、断片の順序が保持され、本発明が依然として実施され得る。 Another alternative for obtaining super-resolution images is by extension (eg described in Chen, Tillberg, and Boyden Science 30 January 2015: Vol. 347 no. 6221 pp. 543-548). Here, elongated polynucleotides are provided in a gel and then expanded, thus stretching the biomaterial. Specific labels associated with polynucleotides are covalently tethered to the swellable polymer network. Upon swelling, even if the polynucleotide is disrupted (or no longer has a continuous polyphosphate backbone), the order of the fragments is preserved and the invention can still be practiced.

このような超解像アプローチは、一過的な結合を必要としない。したがって、各サイクルのプローブ結合は、レパートリーの異なるオリゴまたはオリゴセットを有する異なるトラフに表面(例えば、カバーガラス)を浸漬することによって行うことができる。 Such super-resolution approaches do not require transient coupling. Thus, each cycle of probe binding can be performed by dipping a surface (eg, coverslip) into a different trough with a different repertoire of oligos or sets of oligos.

一過的な結合の利点
一過的な結合アプローチ法は、結合するフルオロフォアの光退色が常に新鮮なフルオロフォアに置き換えられるため、問題にならないという利点を有する。したがって、フルオロフォアの選択、アンチフェード、レドックス系の提供はそれほど重要ではなく、例えば、カメラの視野にはない分子の照明を防止するためのfストップなしで、より単純な光学系を構築することができる。なぜなら、照明は、一過的にエバネッセント波に入る標識のみを退色し、これらの退色された標識は、バルク溶液からの分子によって連続的に置き換えられるからである。
Advantages of Transient Conjugation The transient conjugation approach has the advantage that photobleaching of the conjugated fluorophore is not a problem as it is always replaced by fresh fluorophore. Therefore, fluorophore selection, anti-fade, provision of redox systems are less important, e.g. constructing simpler optics without f-stops to prevent illumination of molecules not in the field of view of the camera. can be done. Because the illumination transiently bleaches only the labels that enter the evanescent wave, these bleached labels are continuously replaced by molecules from the bulk solution.

オン・オフ結合の利点は、単一の色素分子で標識されたプローブの暗状態または光退色の問題を回避することである。特定のプローブ分子が退色しているか、または暗状態にある場合、そのプローブの結合事象は検出されない。それにもかかわらず、標的位置は、その場所への次の結合事象によって検出される可能性が高い。 The advantage of on-off coupling is that it avoids the problem of dark state or photobleaching of probes labeled with single dye molecules. If a particular probe molecule is bleached or in a dark state, no binding event for that probe will be detected. Nevertheless, the target location is likely to be detected by subsequent binding events to that location.

一部の実施形態では、オン・オフ結合の利点は、検出における信頼度を増加させるために複数の測定を行うことができるようにすることである。例えば、場合によっては、分子プロセスの典型的な確率的性質のために、プローブは、不適切な場所に結合し得るが、そのような外れ値は破棄することができ、複数の検出された相互作用によって裏付けられ得るそれらの結合事象のみが、配列決定の目的のための有効な検出事象として受け入れられる。 In some embodiments, an advantage of on-off coupling is that it allows multiple measurements to be made to increase confidence in detection. For example, in some cases, due to the typical stochastic nature of molecular processes, probes may bind in inappropriate locations, but such outliers can be discarded and multiple detected mutual Only those binding events that can be supported by action are accepted as valid detection events for sequencing purposes.

本発明の一部の実施形態では、一過的な結合アプローチの利点は、伸長ポリヌクレオチドに沿って配列がどのように決定されるのかについて非常に重要である。この利点は、一過的な結合が、結合されるべきすべてのプローブ場所が同時に結合されるわけではないことを意味するという事実である。これにより、光の回折限界よりも近い部位での結合事象を、検出することができるようになる。例えば、配列AAGCTTが60塩基後に繰り返される場合、およそ20nmの距離(標的が、ワトソン-クリック距離=0.34nmに伸長および直線化され、線状化されている場合)は、通常、光学撮像によって区別されない。しかしながら、撮像中の異なる時間に、プローブが2つの部位への結合する場合、それらは個別に検出することができる。これにより、ナノスケールトポグラフィーのための点集積(PAINT)として知られる方法によって、結合事象の超解像撮像を行うことができる。シグナルのナノメトリックまたはサブナノメトリック位置決定を可能にするアルゴリズム(例えば、ThunderSTORM)を使用することができる。これにより、プローブの正確な場所、したがって、結合の正確な順序を決定することができる。ナノメトリック精度は、反復を解像し、それらの数を決定するために、特に重要である。 In some embodiments of the invention, the advantage of the transient binding approach is critical to how sequences are determined along the extended polynucleotide. The advantage of this is the fact that transient binding means that not all probe locations to be bound are bound at the same time. This allows binding events at sites closer than the diffraction limit of light to be detected. For example, if the sequence AAGCTT is repeated after 60 bases, a distance of approximately 20 nm (when the target is elongated and linearized to a Watson-Crick distance = 0.34 nm and linearized) is typically detected by optical imaging. indistinguishable. However, if the probe binds to two sites at different times during imaging, they can be detected separately. This allows super-resolution imaging of binding events by a method known as point integration for nanoscale topography (PAINT). Algorithms that allow nanometric or sub-nanometric localization of signals (eg, ThunderSTORM) can be used. This allows the exact location of the probes and hence the exact order of attachment to be determined. Nanometric precision is particularly important for resolving repeats and determining their number.

10x Inc.によって開発された液滴ベースの分配およびバーコード化アプローチに対するこのアプローチの利点は、ゲノム構造およびハプロタイプ情報が、推論によって、または計算再構築によってではなく、分子の直接可視化によって得ることができることである。本方法の固有の利点は、効率的に実施した場合、単一細胞由来のゲノムを配列決定し、その中のハプロタイプを解像できることである。本方法が効率的でない場合でも、分子の分配およびバーコード化を必要とするアプローチによって必要とされるものよりも、ゲノムのデノボ再構築に必要なゲノムのコピーがはるかに少ない。また、全体的な試薬使用量が少ないだけでなく、必要とされる処理ステップがより少ない。さらに、この方法は、増幅なしでゲノムDNAに対して機能し得るため、増幅バイアスに悩まされず、エラーおよびエピゲノムマークが保存され、配列の取得とは直交的に検出することができる。炭素-5(C5)のアルキル化は、哺乳動物において、いくつかのシトシンバリアント:C5-メチルシトシン(5-mC)、C5-ヒドロキシメチルシトシン(5-hmC)、C5-ホルミルシトシン、およびC5-カルボキシルシトシン、を生じる。また、真核生物および原核生物は、アデニンをN6-メチルアデニン(6-mA)にメチル化する。原核生物では、N4-メチルシトシンも頻繁に見られる。これらの修飾の各々に対する抗体は、入手可能であるか、または産生され得る。修飾を標的とするアフィマー、ナノボディ、またはアプタマーは、フットプリントがより小さい可能性があるため、特に関連している。加えて、他の天然に存在するDNA結合タンパク質、例えば、メチルタンパク質(MBD1、MBD2など)が、使用され得る。 10x Inc. An advantage of this approach over the droplet-based partitioning and barcoded approach developed by , is that genomic structural and haplotype information can be obtained by direct visualization of the molecule rather than by inference or by computational reconstruction. . A unique advantage of this method is that, when performed efficiently, the genome from a single cell can be sequenced and the haplotypes therein resolved. Even if the method is not efficient, much fewer copies of the genome are required for de novo reconstruction of the genome than is required by approaches that require molecular partitioning and barcoding. Also, not only is the overall reagent usage lower, but fewer processing steps are required. Furthermore, since the method can work on genomic DNA without amplification, it does not suffer from amplification bias, errors and epigenomic marks are preserved, and can be detected orthogonally to sequence acquisition. Alkylation of carbon-5 (C5) occurs in mammals by several cytosine variants: C5-methylcytosine (5-mC), C5-hydroxymethylcytosine (5-hmC), C5-formylcytosine, and C5- carboxyl cytosine. Eukaryotes and prokaryotes also methylate adenine to N6-methyladenine (6-mA). N4-methylcytosine is also frequently found in prokaryotes. Antibodies to each of these modifications are available or can be produced. Affimers, nanobodies or aptamers that target modifications are of particular relevance due to their potentially smaller footprint. In addition, other naturally occurring DNA binding proteins such as methyl proteins (MBD1, MBD2, etc.) can be used.

したがって、様々な態様および実施形態では、本発明は、エピゲノム情報を含む単一の伸長標的ポリヌクレオチド分子を配列決定する方法を提供する。 Thus, in various aspects and embodiments, the invention provides methods of sequencing a single extended target polynucleotide molecule containing epigenomic information.

様々な態様および実施形態では、本方法は、ハプロタイプが解像される段階的配列決定に使用され得、前段落の方法を使用して二倍体ゲノムのハプロタイプ分岐にわたる第1の標的ポリヌクレオチドを配列決定するステップと、前段落の方法を使用して二倍体ゲノムのハプロタイプ分岐にわたる第2の標的ポリヌクレオチドを配列決定するステップと、を含み得、第1および第2の標的ポリヌクレオチドは異なる相同染色体に由来し、それによって、第1および第2の標的ポリヌクレオチド上のハプロタイプ(連結されたアレル)を決定する。 In various aspects and embodiments, the method can be used for stepwise sequencing in which haplotypes are resolved and the method of the preceding paragraph is used to determine the first target polynucleotide across the haplotype branches of the diploid genome. and sequencing a second target polynucleotide spanning the haplotype branch of the diploid genome using the method of the preceding paragraph, wherein the first and second target polynucleotides are different Haplotypes (linked alleles) on the first and second target polynucleotides are determined from the homologous chromosomes.

本発明の利点は、高価で、時間がかかる個々の長い読み取りを実際に行うことなく、代わりに短いオリゴの結合によって得られる連続した配列情報または重複した配列情報を一緒に繋ぎ合わせることによって、長いリードを得ることができることである。複数の短い3、4、5、または6塩基ビットの配列情報が、単一のポリヌクレオチド分子の長さに沿って同時に得られ、したがって、それらはすべて連結され、ポリヌクレオチドがオン・オフ結合するオリゴで飽和した場合、それらのナノメトリック位置、解像度、および順序は、分子全体の配列を明らかにする。ポリヌクレオチドの配列決定は、分子のある場所から別の場所へのSbS反応によって得られる単一の長いリード(例えば、PacBio配列決定)ではなく、配列情報の複数のビットが同時に得られるため、現在の方法よりも時間がかからない。 An advantage of the present invention is that by splicing together contiguous or overlapping sequence information obtained by conjugation of short oligos instead of actually performing each long read, which is expensive and time consuming, a long read can be obtained. Being able to get leads. Multiple short 3-, 4-, 5-, or 6-base bits of sequence information are obtained simultaneously along the length of a single polynucleotide molecule, so that they are all ligated, binding the polynucleotide on and off When saturated with oligos, their nanometric position, resolution, and order reveal the sequence of the entire molecule. Sequencing of polynucleotides is currently used because multiple bits of sequence information are obtained simultaneously, rather than a single long read (e.g., PacBio sequencing) obtained by SbS reactions from one place to another on the molecule. takes less time than the method of

本発明の別の主要な利点は、すべての種類の構造的変動(マイクロアレイベースの技術、現在の主流のアプローチにとっては困難なバランスの取れたコピー数バリエーションおよび逆位を含む)を、大小を問わず、マイクロアレイ、細胞遺伝学、または他の現在の配列決定方法ではアプローチできない分解能およびスケールで、検出することが可能になることである。 Another major advantage of the present invention is that all kinds of structural variation (including microarray-based techniques, balanced copy number variations and inversions that are difficult for current mainstream approaches), both large and small. without being able to detect at resolutions and scales not approachable by microarrays, cytogenetics, or other current sequencing methods.

さらに、本方法は、ゲノムの反復領域にわたる配列決定を可能にする。従来の配列決定のために、ゲノムのそのような部分にわたるリードの問題は、まず、そのような領域が参照ゲノムに十分に表現されておらず、Illumina、Ion Torrent、Helicos/SeqLL、およびComplete Genomicsなどの技術は、典型的には、デノボアセンブリによってではなく、参照に整列させることによって、大きなゲノムに対処する。第二に、リードが反復領域の全体に及んでいない場合、その領域にわたってより短いリードを介して領域をアセンブリすることは困難である。これは、ある分子上の反復領域と別の分子上の反復領域との間の可能な複数の整列のうちのどれが正しいのか、決定することが困難であり得るからである。誤った整列は、アセンブリ内の反復領域の短縮または延長につながる可能性がある。本発明の配列決定方法では、セットを同時にまたは次々に、のいずれかで行われる複数のリードによる単一分子の完全またはほぼ完全なカバレッジがある場合、(ポリヌクレオチド自体が反復領域の全体にわたる場合)反復領域の全体にわたるアセンブリを構築することができる。本発明の方法は、反復領域にまたがる十分長いポリヌクレオチドに適用され得る。1~10Mbのポリヌクレオチドは、ゲノムのほとんどの反復領域をまたぐのに十分である。 Furthermore, the method allows sequencing across repetitive regions of the genome. For conventional sequencing, the problem of reads across such parts of the genome is that such regions are not well represented in the reference genome, and Illumina, Ion Torrent, Helicos/SeqLL, and Complete Genomics Techniques such as typically address large genomes by aligning to a reference rather than by de novo assembly. Second, if the reads do not span the entire repetitive region, it is difficult to assemble the region via shorter reads across the region. This is because it can be difficult to determine which of multiple possible alignments between the repeat region on one molecule and the repeat region on another molecule is correct. Misalignment can lead to shortening or lengthening of repeat regions within the assembly. In the sequencing methods of the invention, if there is complete or near-complete coverage of a single molecule by multiple reads performed either simultaneously or one after the other (if the polynucleotide itself spans the repeat region ) can build assemblies spanning the repeat regions. The methods of the invention can be applied to sufficiently long polynucleotides that span the repeat region. A 1-10 Mb polynucleotide is sufficient to span most repetitive regions of the genome.

様々な配列決定メトリックへの影響
速度への影響-このアプローチは単純で、試料処理ステップまたはサイクルタイムが長くならない。酵素的なステップはなく、ハイブリダイゼーションのみであり、高速化するための複数の手段がある。
Impact on Various Sequencing Metrics Impact on Speed—This approach is simple and does not increase sample processing steps or cycle times. There are no enzymatic steps, just hybridization, and there are multiple means to speed things up.

コストへの影響-このアプローチは、極めて低コストであり、必要な試薬は、極めて少量のオリゴ、例えば、0.5~3nMのオリゴプローブである。 Cost impact—This approach is very low cost and the reagents required are very small amounts of oligos, eg 0.5-3 nM of oligo probe.

リード長への影響-リード長は、潜在的に、任意の長さのDNAの分子(染色体全体を含む)と同じ長さである。 Effect on read length—Read length is potentially as long as a molecule of DNA of any length, including an entire chromosome.

正確度への影響-提案された技術は、最高正確度の配列決定技術となる可能性がある。わずかな異常値を除いて、短いオリゴは、わずか1塩基の不一致が安定性の大幅な低下につながるため、非常に特異的である。適切な結合条件を考慮すると、完全一致は、ほとんどの場合、1つ以上の塩基の不一致から区別することができ、この能力は、各配列部位の反復的な照合によって増強することができる。さらに、本方法は、配列の決定において不一致情報を利用することができる。さらに、二重鎖の両方の鎖からの同時配列取得は、正確度を向上させる。この技術の正確度レベルは、稀な変異を検出するために十分なものとなる。 Impact on Accuracy—The proposed technique has the potential to be the most accurate sequencing technique. Except for a few outliers, the short oligos are highly specific as even a single base mismatch leads to a large loss of stability. Given proper binding conditions, a perfect match can in most cases be distinguished from a mismatch of one or more bases, and this ability can be enhanced by iterative matching of each sequence site. Additionally, the method can utilize discrepancy information in determining sequences. Furthermore, simultaneous sequence acquisition from both strands of a duplex improves accuracy. The accuracy level of this technique will be sufficient for detecting rare mutations.

感度への影響-本方法は、単一分子技術であるため、非常に感度が高い可能性がある。ライゲーションなどの非効率的な調製ステップがないため、分子は失われない。抽出は、配列決定の部位に近接して統合され得るため、分子が容器に付着することによって失われず、マイクロ流体デバイス自体の内壁は、分子の集積を防止するために不動態化され得る。また、細胞から遊離される実質的にすべての分子は、フローチャネル内でアクセスすることができる。さらに、本方法は、わずか1つの分子から完全に連続したリードが得られる可能性がある。これは、単一細胞からの配列決定に関連しており、本方法は、前例のないカバレッジおよび低いアレルドロップアウトを可能にする。 Effect on sensitivity—This method is potentially very sensitive as it is a single molecule technique. No molecules are lost because there are no inefficient preparation steps such as ligation. Extraction can be integrated close to the site of sequencing so molecules are not lost by sticking to the container, and the inner walls of the microfluidic device itself can be passivated to prevent accumulation of molecules. Also, virtually all molecules released from the cell are accessible within the flow channel. Moreover, the method has the potential to yield a complete contiguous read from as little as one molecule. This is relevant for sequencing from a single cell and the method allows unprecedented coverage and low allele dropout.

配列決定の用途および使用
一部の実施形態では、本発明は、単一の伸長ポリヌクレオチドから直接得られる配列情報の使用を含み、長いポリヌクレオチド内で得られる配列リードのコンテキスト(約100Kb~染色体全体)が保存される。コンテキスト情報は、短いリードが特定のポリヌクレオチドに由来するという情報のみを含み得る。コンテキストはまた、ポリヌクレオチド内の配列決定リードの正確なまたはおよその場所を知ることにも及び得る。
Sequencing Applications and Uses In some embodiments, the present invention involves the use of sequence information obtained directly from a single extended polynucleotide, in the context of sequence reads obtained within longer polynucleotides (approximately 100 Kb to chromosomal). whole) is saved. Contextual information may only include information that a short read is derived from a particular polynucleotide. Context can also extend to knowing the exact or approximate location of a sequencing read within a polynucleotide.

さらに、ポリヌクレオチドが、同じ染色体(または、他の種類の完全なポリヌクレオチド、例えば、RNA転写産物)に由来する類似のまたは異なる長さの複数のポリヌクレオチドの一部である場合、個々のポリヌクレオチドの長さ(サブ染色体長である場合)よりもさらに長距離の情報を得ることができる。一部の実施形態では、複数のポリヌクレオチドの各々からの配列リードは、複数のポリヌクレオチドを含む他のポリヌクレオチドからのリードとは独立して得られる。この場合、複数のポリヌクレオチドから得られた配列決定データを使用して、そのポリヌクレオチドを最初に発出した天然ポリヌクレオチド配列に、ポリヌクレオチドを再構築またはアセンブリする。これは、多くの所与の細胞型から抽出されたゲノムDNA上で配列決定が行われ、多くの同じ染色体ホモログからのDNAが存在することが予想される場合であり得る。例えば、100万個の細胞からの細胞抽出(例えば、CEPHパネルからのリンパ芽球様細胞株、例えば、NA12878)において、母体に由来する100万個の染色体相同体および父親に由来する100万個の染色体ホモログが、抽出されたDNAにおいて予想される。 Furthermore, when a polynucleotide is part of multiple polynucleotides of similar or different lengths that are derived from the same chromosome (or other type of complete polynucleotide, e.g., RNA transcripts), individual polynucleotides Longer distance information can be obtained than the nucleotide length (if sub-chromosomal length). In some embodiments, the sequence reads from each of the plurality of polynucleotides are obtained independently of the reads from other polynucleotides comprising the plurality of polynucleotides. In this case, sequencing data obtained from multiple polynucleotides are used to reconstruct or assemble the polynucleotides into the native polynucleotide sequence from which they were originally issued. This may be the case when sequencing is performed on genomic DNA extracted from many given cell types and it is expected that DNA from many of the same chromosomal homologues will be present. For example, in a cell extract from 1 million cells (e.g., a lymphoblastoid cell line from the CEPH panel, e.g., NA12878), 1 million maternally derived chromosomal homologues and 1 million paternally derived is expected in the extracted DNA.

他の実施形態では、短いリードのコンテキストは、単離された長い(約50~200Kb)単一のポリヌクレオチドを配列決定することによって保存される。一部の実施形態では、短いリードのコンテキストは、伸長ポリヌクレオチドに沿って配列決定することによって保存される。一部の実施形態では、同じセグメントをカバーする(ハプロタイプ分解能を有するか否かにかかわらず)単一のポリヌクレオチドの多くのコピーを標的として使用して、標的ごとに複数の配列リードを取得し、配列リードを使用して、単一のポリヌクレオチドのうちの1つによって表され得るものよりも長距離配列のポリヌクレオチドセグメントを再構築する。したがって、ゲノムまたは大部分のゲノムのデノボアセンブリを再構築することができる。ハプロタイプ解像のデノボアセンブリを作成するために、十分な部分のポリヌクレオチドが配列決定リードでカバーされている場合、重複したセグメントを、1つの相同染色体または別の相同染色体からのセグメントに属するものとして区別することが可能である(例えば、その中で見出されるSNPまたは構造バリアントに基づいて)。本発明の方法を使用して、現在の配列決定技術によって得ることが困難なゲノムに見出され得る以下の特徴を決定または解決することができる。 In other embodiments, the context of short reads is preserved by sequencing long (approximately 50-200 Kb) single isolated polynucleotides. In some embodiments, the context of short reads is preserved by sequencing along the extended polynucleotide. In some embodiments, multiple copies of a single polynucleotide (with or without haplotype resolution) covering the same segment are used as targets to obtain multiple sequence reads per target. , using sequence reads to reconstruct polynucleotide segments of longer sequences than can be represented by one of the single polynucleotides. Thus, de novo assemblies of genomes or large genomes can be reconstructed. Duplicate segments are identified as belonging to one homologous chromosome or segments from another homologous chromosome if a sufficient portion of the polynucleotide is covered by the sequencing reads to create a haplotype-resolved de novo assembly. A distinction can be made (eg, based on SNPs or structural variants found therein). The methods of the invention can be used to determine or resolve the following features that can be found in genomes that are difficult to obtain by current sequencing techniques.

逆位
ポリヌクレオチドに沿った一連の配列リードの方向は、反転事象が生じたかどうかを報告する。参照と比較して他のリードと反対方向にある1つ以上のリードは、反転を示す。
Inversion The orientation of a series of sequence reads along the polynucleotide reports whether an inversion event occurred. One or more leads in the opposite direction to the other leads relative to the reference indicates a reversal.

転座
その近傍の他のリードのコンテキストでは予想されない1つ以上のリードの存在は、参照と比較して、再編成または転座を示す。参照におけるリードの場所は、ゲノムのどの部分が別の部分にシフトしたかを示す。場合によっては、その新しい場所におけるリードは、転座ではなく重複である。
Translocations The presence of one or more reads that are not expected in the context of other reads in their vicinity indicates rearrangements or translocations compared to the reference. The location of the read in the reference indicates which part of the genome has shifted to another part. In some cases, the read at its new location is a duplication rather than a translocation.

コピー数バリエーション
特異的リードの非存在または反復は、それぞれ、欠失または増幅が生じたことを示す。本発明の方法は、ポリヌクレオチドに複数のおよび/または複雑な再編成が存在する場合、特に適用することができる。本発明の方法は、単一のポリヌクレオチドを分析することに基づいているため、上に記載の構造バリアントは、少数の細胞、例えば、集団由来のわずか1%の細胞における稀な出現まで解像することができる。
Copy Number Variation Absence or repetition of a specific read indicates that a deletion or amplification has occurred, respectively. The methods of the invention are particularly applicable when multiple and/or complex rearrangements are present in the polynucleotide. Since the methods of the invention are based on analyzing single polynucleotides, the structural variants described above are resolved to rare occurrences in a small number of cells, e.g., as few as 1% of cells from a population. can do.

デュプリコン
セグメント複製またはデュプリコンは、ゲノム中で持続的であり、体細胞変異を含む個々のゲノムの多くの構造バリエーションを播種する。セグメント重複は、ゲノムの遠位部分に存在し得る。現在の次世代配列決定では、リードがどのセグメント重複から生じるかを決定することは困難である。本発明の一部の実施形態では、リードは、長い分子(例えば、0.1~10メガ塩基長の範囲)にわたって得られるため、通常、単にリードを使用して、ゲノムのどのセグメントがデュプリコンに対応するゲノムの特定のセグメントに隣接しているかを決定することによって、デュプリコンのゲノムコンテキストを決定することが可能である。
Duplicons Segment duplications, or duplicons, are persistent in the genome and seed many structural variations of individual genomes, including somatic mutations. Segmental duplications can occur in distal portions of the genome. With current next-generation sequencing, it is difficult to determine which segment duplication a read originates from. In some embodiments of the invention, reads are obtained over long molecules (eg, in the range of 0.1 to 10 megabases in length), so typically reads are simply used to determine which segment of the genome is a duplicon. It is possible to determine the genomic context of a duplicon by determining which is flanked by a particular segment of the genome corresponding to .

反復領域
パラロガス変異を有するリードまたは関連するリードの反復的な発生は、ゲノムの複数の場所で生じる複数のまたは非常に類似したリードとして、本発明の方法(データ分析の後)によって観察され得る。これらの複数の場所は、サテライトDNAでのように、一緒に密接に充填されているか、または偽遺伝子のように、ゲノムにわたって分散している。本発明の方法は、短いタンデムリピート(STR)、可変数タンデムリピート(VNTR)、トリヌクレオチドリピートなどに適用することができる。
Repeat Regions The recurrent occurrence of reads with paralogous mutations or related reads can be observed by the methods of the invention (after data analysis) as multiple or very similar reads occurring at multiple locations in the genome. These multiple locations are either tightly packed together, as in satellite DNA, or dispersed throughout the genome, as in pseudogenes. The method of the invention can be applied to short tandem repeats (STR), variable number tandem repeats (VNTR), trinucleotide repeats, and the like.

ブレークポイントの検索
構造バリアントのブレークポイントは、本発明の方法によって特定することができる。本発明は、ゲノムのどの2つの部分が融合したのかを、全体的なレベルで示すだけでなく、ブレークポイントが生じた正確な個々のリードを見ることができる。リードは、2つの融合した領域のキメラを含むだけでなく、ブレークポイントの一方の側のすべての配列は、融合したセグメントの一方に対応し、他方の側は、融合したセグメントの他方である。これにより、ブレークポイントを決定する信頼度が高くなる。ブレークポイント周辺の構造が複雑である場合でも、本発明の方法は構造を解決することができる。一部の実施形態では、正確な染色体ブレークポイント情報は、疾患機序の理解に使用され、特定の転座の発生の検出に使用され、疾患の診断に使用される。
Finding Breakpoints Breakpoints in structural variants can be identified by the method of the present invention. The present invention not only shows at a global level which two parts of the genome have fused, but also allows us to see the exact individual reads where breakpoints occurred. The read not only contains a chimera of the two fused regions, but all sequences on one side of the breakpoint correspond to one of the fused segments and the other side is the other of the fused segments. This increases the confidence in determining breakpoints. Even if the structure around the breakpoint is complex, the method of the present invention can resolve the structure. In some embodiments, precise chromosomal breakpoint information is used to understand disease mechanisms, to detect the occurrence of specific translocations, and to diagnose disease.

ハプロタイプ
一部の実施形態では、ハプロタイプの解像度は、改善された遺伝子研究を行うことを可能にする。他の実施形態では、ハプロタイプの分解能は、より良好な組織型決定を行うことを可能にする。一部の実施形態では、ハプロタイプの分解能または特定のハプロタイプの検出は、診断を行うことを可能にする。
Haplotypes In some embodiments, haplotype resolution allows improved genetic studies to be performed. In other embodiments, haplotype resolution allows for better tissue typing. In some embodiments, haplotype resolution or detection of specific haplotypes allows diagnosis to be made.

他の推論的または分配およびタグ付けハプロタイピング/フェージングアプローチと比較して、本発明は、可能性の高いハプロタイプのコンピュータ再構築に基づかない。本発明によって得られた情報の視覚的性質は、実際に物理的または視覚的に特定のハプロタイプを示す。 In contrast to other speculative or distribution and tagging haplotyping/phasing approaches, the present invention is not based on computational reconstruction of probable haplotypes. The visual nature of the information obtained by the present invention actually physically or visually indicates a particular haplotype.

したがって、本発明の実施形態から得られるリードおよびアセンブリは、ハプロタイプ特異的であると分類され得る。ハプロタイプ固有の情報が必ずしも長距離にわたって容易に取得されるわけではない唯一のケースは、アセンブリが断続的である場合であり、それにもかかわらず、リードの場所が提供される。ここでも、複数のポリヌクレオチドがゲノムの同じセグメントをカバーする場合、ハプロタイプを計算的に決定することができる。 Thus, reads and assemblies resulting from embodiments of the present invention can be classified as haplotype-specific. The only case where haplotype-specific information is not always easily obtained over long distances is when the assembly is intermittent and still provides the location of the leads. Again, if multiple polynucleotides cover the same segment of the genome, the haplotype can be computationally determined.

生物の識別
本発明の一実施形態は、本発明によって提供される配列、エピ情報および構造情報に基づいて、メタゲノム試料などの混合試料中に存在する異なる個々の生物を識別することである。本発明の配列決定方法は、ゲノムのわずか1つのコピーからゲノムのかなりの部分を配列決定することができるため、生物の多様なメタゲノム混合物を配列決定することができる。さらに、1塩基または数塩基の情報から得られた単一分子のマップだけで、微生物を識別するのに十分である。
Identification of Organisms One embodiment of the present invention is the identification of different individual organisms present in a mixed sample, such as a metagenomic sample, based on the sequence, epi-information and structural information provided by the present invention. The sequencing methods of the present invention are capable of sequencing a substantial portion of the genome from as little as one copy of the genome, thus enabling the sequencing of diverse metagenomic mixtures of organisms. Moreover, a single molecule map derived from one or a few bases of information is sufficient to distinguish microorganisms.

細胞株の識別と検証
一部の実施形態では、ゲノムDNAは、培養中の細胞から抽出され、伸展され、メチル化および/または配列情報は、本発明の方法を使用して伸展された分子から抽出される。この情報を使用して、細胞株の同一性を検証し、その分子表現型を決定し、継代の過程を通して、または実験が行われる際に(例えば、増殖成長条件の撹乱)、そのエピゲノムの変化を監視することができる。
Identification and Validation of Cell Lines In some embodiments, genomic DNA is extracted from cells in culture and expanded, and methylation and/or sequence information is obtained from the expanded molecules using the methods of the invention. extracted. This information is used to verify the identity of the cell line, determine its molecular phenotype, and modify its epigenome throughout the course of passage or as experiments are performed (e.g., perturbation of growth conditions). Changes can be monitored.

疾患検出
一部の実施形態では、本発明は、がんの早期検出、がんの診断、がんの分類、がん内の細胞の不均一性の分析、がんの病期分類、がんの発達のモニタリング、薬物治療を適用するかどうかの判断、使用する薬物または薬物の組み合わせ、治療の効果のモニタリング、再発のモニタリング、転帰の予後予測のために本発明の方法を使用することを含む。これらの場合の各々において、特定の「バイオマーカー」またはバイオマーカーのセットのいずれかが探索され、特定の配列、エピバリアントもしくは構造バリアント、または特定の閾値レベルを上回る一般的な構造バリエーションの発生が検出される。この態様は、
1.スクリーニングされている(例えば、がんの早期徴候についてスクリーニングされている)ヒト患者または個体から試料生体材料を得ることと、
2.本発明の方法に従って、配列決定および/またはエピ分析を行うことと、
3.参照と比較するか、または個体/患者由来の他の体組織と比較して、データの配列、エピバリエーションおよび/または構造バリエーションを探索することと、
4.バリエーションの量および/または種類を評価し、任意選択的に、スコアを提供することと、
5.4に基づいて、臨床判断を行うことと、を含む。
Disease Detection In some embodiments, the present invention is used for early detection of cancer, cancer diagnosis, cancer classification, analysis of cellular heterogeneity within cancer, cancer staging, cancer determining whether to apply drug therapy, drugs or drug combinations used, monitoring efficacy of treatment, monitoring recurrence, prognosticating outcome . In each of these cases, either a particular "biomarker" or set of biomarkers is sought, and the occurrence of a particular sequence, epivariant or structural variant, or general structural variation above a certain threshold level. detected. This aspect is
1. Obtaining a sample biomaterial from a human patient or individual being screened (e.g., screened for early signs of cancer);
2. performing sequencing and/or epi-analysis according to the method of the invention;
3. Exploring sequence, epivariation and/or structural variations in the data compared to a reference or compared to other body tissues from individuals/patients;
4. assessing the amount and/or type of variation and optionally providing a score;
5. making clinical decisions based on 4.

同じ5つのステップをがん以外の疾患症例に適用することができ、家畜、イヌ、およびネコなどのヒト以外の動物にも適用することができる。配列データは、RNAおよびDNAデータを含み得る。一部の実施形態では、臨床判断を行うためには、配列のみの情報、構造のみの情報、またはメチル化もしくは他の修飾のみの情報を使用する。 The same five steps can be applied to non-cancer disease cases and can be applied to non-human animals such as livestock, dogs, and cats. Sequence data can include RNA and DNA data. In some embodiments, sequence-only information, structure-only information, or methylation or other modification-only information is used to make clinical decisions.

一部の実施形態では、5つのステップは、着床前スクリーニング診断またはスクリーニングにおいてどの受精卵を選択するかを決定することを含み得る。一部の実施形態では、FFPE切片が得られ、DNAが抽出および固定化され、結合剤の一過的な結合が行われる。 In some embodiments, the five steps may include determining which zygote to select for pre-implantation screening diagnosis or screening. In some embodiments, FFPE sections are obtained, DNA is extracted and fixed, and transient binding of binding agents is performed.

遺伝子型と表現型の相関
一部の実施形態では、本発明の方法は、以下によって、遺伝子型と表現型の相関を行うために使用される:
1.集団、コホート、または家族の個体から、試料生体材料(例えば、RNAまたはDNA)を得ること、
2.本発明の方法に従って、配列決定および/またはエピ分析を行うこと、
3.任意選択的に、民族、表現型の層別化、および表現型の誤分類を考慮しながら、データ内の配列、エピマーク、および/または構造バリアントを探索し、特定の疾患、表現型、または形質について、症例と対照との間でそれらを比較すること、および
4.どの配列、エピモチーフおよび/もしくは構造的モチーフ、またはマーカーバリアントが、表現型と相関するかを決定すること。
Genotype-Phenotype Correlations In some embodiments, the methods of the invention are used to perform genotype-phenotype correlations by:
1. obtaining a sample biomaterial (e.g., RNA or DNA) from a population, cohort, or family of individuals;
2. performing sequencing and/or epi-analysis according to the methods of the invention;
3. Optionally, search for sequence, epimark, and/or structural variants within the data, taking into account ethnicity, phenotypic stratification, and phenotypic misclassification to identify specific diseases, phenotypes, or traits. 3. comparing them between cases and controls; Determining which sequences, epimotifs and/or structural motifs, or marker variants correlate with a phenotype.

さらに、表現型相関配列、エピバリアントおよび/または構造バリアントは、表現型の候補バイオマーカーとして選択することができる。任意選択的に、候補バイオマーカーを微調整または検証するために、さらなる研究が行われる。 In addition, phenotype-correlated sequences, epivariants and/or structural variants can be selected as candidate biomarkers of phenotype. Optionally, further studies are performed to fine tune or validate the candidate biomarkers.

実験方法の詳細な説明
本発明の様々な態様、実施形態、および特徴を、以下にさらに詳細に提示および説明する。しかしながら、上記および以下の説明は、例示および説明にすぎず、特許請求されるように本発明を限定するものではない。
Detailed Description of Experimental Methods Various aspects, embodiments, and features of the present invention are presented and described in further detail below. However, the foregoing and following descriptions are exemplary and explanatory only, and are not restrictive of the invention as claimed.

一部の実施形態では、本発明の方法は、プロセスの主要な機能要素間の様々な洗浄ステップを含み、様々な点での洗浄ステップの必要性は、当業者によって認識されるであろう。一般に、洗浄緩衝液は、リン酸緩衝生理食塩水、2×SSC、TEN、HEPESを含むことができ、少量のTween20、TritonX、Sarkosyl、および/またはSDSなどが補充される。典型的には、機能ステップ間に、2~3回の洗浄を挿入することができる。例えば、場合によっては、あるオリゴが別のオリゴと交換される際に、洗浄ステップが行われる。 In some embodiments, the methods of the present invention include various washing steps between major functional elements of the process, and the need for washing steps at various points will be recognized by those skilled in the art. Generally, wash buffers can include phosphate buffered saline, 2×SSC, TEN, HEPES, supplemented with small amounts of Tween 20, TritonX, Sarkosyl, and/or SDS, and the like. Typically, 2-3 washes can be inserted between functional steps. For example, in some cases a wash step is performed when one oligo is replaced with another.

ほとんどの場合、特定のオリゴ長について記載されているものは、他のオリゴ長についても同様であり得ることを理解されたい。また、識別する、分析する、測定するなどの用語が使用される場合、それらは精神的な行為ではなく、むしろ計装上で実行される行為であり、かかる計装は、検出器およびコンピュータアルゴリズムと組み合わせて使用される自動化された流体工学を含むことを理解されたい。 It should be understood that in most cases what is described for a particular oligo length may be similar for other oligo lengths. Also, when terms such as identifying, analyzing, and measuring are used, they are not mental acts, but rather acts performed on instrumentation, which may be performed by detectors and computer algorithms. It should be understood to include automated fluidics used in conjunction with .

表面上のメガ塩基範囲のゲノムDNAの抽出および伸長
高分子量(HMW)または長い鎖長のDNAを抽出および伸長するための多くの方法が存在する。例えば、Allemand et al Biophysical Journal 73:2064-2070 1997、Michalet et al Science 277:1518-1523(1999)を参照されたい)。一部の実施形態では、Kaykov et al(Scientific Reports 6:19636 2016)から適合された方法を使用して、メガ塩基範囲の平均長を有するDNAを抽出および伸長することができる。かかる実施形態では、ゲノムDNAは、プロテイナーゼKを1時間使用して(例えば、BioradまたはGenomic Visionのプロトコルを使用するか、またはKaykovらによって記載されているように)、アガロースブロック中の細胞(1ブロック当たり1×104~105)から抽出され、洗浄ステップは、100mMのNaClを含み、アガロースブロックは、混合することなく、βアガラーゼ(NEB,USA)を42℃で長期間(例えば、16時間)使用して、トラフ中で融解および消化され、次いで、室温に戻される。DNAは、pH6の50mMのMES、100mMのNaClを含む緩衝液中でコーミングされる。(例えば、Kaykovらによって記載されているように)トラフから、基板(例えば、カバースリップ)を引き出すことができるデバイスを使用して、最小限の振動で滑らかで低摩擦のz運動を生成する。900?m/秒のコーミング速度を使用して、DNA分子を最小限の破断で均一に伸展する。約50%の分子が1Mbより長く、平均の長さが2Mbで、5%が4Mbを超える。
Extraction and Extension of Genomic DNA in the Megabase Range on Surfaces There are many methods for extracting and extending high molecular weight (HMW) or long chain length DNA. See, eg, Allemand et al Biophysical Journal 73:2064-2070 1997, Michaelet et al Science 277:1518-1523 (1999)). In some embodiments, methods adapted from Kaykov et al (Scientific Reports 6:19636 2016) can be used to extract and extend DNA with average lengths in the megabase range. In such embodiments, genomic DNA is isolated from cells (1 1 x 104-105 per block), wash steps included 100 mM NaCl, and agarose blocks were incubated with β-agarase (NEB, USA) for extended periods (e.g., 16 h) at 42°C without mixing. Used, thawed and digested in a trough and then brought back to room temperature. DNA is combed in a buffer containing 50 mM MES, 100 mM NaCl, pH 6. A device that can pull a substrate (eg, a coverslip) out of a trough (eg, as described by Kaykov et al.) is used to generate smooth, low-friction z motion with minimal vibration. 900? A combing speed of m/sec is used to uniformly stretch the DNA molecules with minimal breakage. About 50% of the molecules are longer than 1 Mb, with an average length of 2 Mb and 5% over 4 Mb.

表面に伸展するためのいくつかの他の方法を使用することができる(例えば、ACS Nano.2015 Jan 27;9(1):809-16に記載されている)。代替的に、表面上の伸長は、PetitおよびCarbeck(Nano.Lett.3:1141-1146(2003))によって記載されているアプローチを使用することを含めて、フローセル内で行うことができ、これは、20~100uMのチャネルでコーミングする場合、4~5μm/秒の流体の後退速度で、平坦な気液界面がもたらされ、十分に整列した一方向性のポリヌクレオチドが提供されることを示す。流体アプローチに加えて、ポリヌクレオチドは、電場を使用することによって伸展することができる(例えば、Giess et al.Nature Biotechnology 26,317-325(2008)に記載されている)。ポリヌクレオチドが表面に付着されていない場合、ポリヌクレオチドを伸長させるためのいくつかのアプローチが利用可能である(例えば、Frietag et al Biomicrofluidics.9(4):044114(2015)およびMarie et al.Proc Natl Acad Sci U S A.110:4893-8(2013)に記載されている)。 Several other methods for spreading to surfaces can be used (eg, described in ACS Nano. 2015 Jan 27;9(1):809-16). Alternatively, the extension on the surface can be done in a flow cell, including using the approach described by Petit and Carbeck (Nano. Lett. 3:1141-1146 (2003)). found that when combing in 20-100 uM channels, a fluid retraction rate of 4-5 μm/sec resulted in a flat air-liquid interface and provided well-aligned unidirectional polynucleotides. show. In addition to fluidic approaches, polynucleotides can be stretched by using an electric field (described, for example, in Giess et al. Nature Biotechnology 26, 317-325 (2008)). Several approaches are available for extending polynucleotides when they are not attached to a surface (e.g., Frietag et al Biomicrofluidics. 9(4):044114 (2015) and Marie et al. Proc. Natl Acad Sci U S A. 110:4893-8 (2013)).

ゲルプラグでDNAを使用する代わりに、チップ上へのローディングに好適な染色体を、Cram et al.(L.S.Cram,C.S.Bell and J.J.Fawcett,Methods Cell Sci.,2002,24,27-35)に記載されているように、ポリアミン法によって調製し、直接デバイスにピペッティングすることもできる。染色体のDNAに結合するタンパク質を、プロテアーゼを使用して消化して、実質的に裸のDNAを遊離することができる。 As an alternative to using DNA in gel plugs, chromosomes suitable for loading onto the chip were prepared as described by Cram et al. (L.S. Cram, C.S. Bell and J.J. Fawcett, Methods Cell Sci., 2002, 24, 27-35). Petting is also possible. Proteins that bind to chromosomal DNA can be digested using proteases to liberate substantially naked DNA.

分析前に生体高分子の完全性を保存すること
損傷の多くは、細胞および組織から生体分子を抽出するプロセス、ならびに(生体分子が分析される前の)生体分子のその後の取り扱いにおいて生じる。DNAの場合、その完全性の損失をもたらすその取り扱いの様相には、ピペッティング、ボルテックス、凍結融解、および過度の加熱が含まれ得る。機械的ストレスを最小化することができる(ChemBioChem,11:340-343(2010)。加えて、EDTA、EGTA、または没食子酸(およびその類似体および誘導体)などの高濃度の二価カチオンは、ヌクレアーゼによる分解を阻害し得る。一部の実施形態では、試料対二価カチオンの質量比を2:1にすると、極端なレベルのヌクレアーゼが存在する便などの試料においても、ヌクレアーゼを阻害するのに十分である。
Preserving the Integrity of Biomacromolecules Prior to Analysis Much of the damage occurs in the process of extracting biomolecules from cells and tissues and in their subsequent handling (before they are analyzed). In the case of DNA, aspects of its handling that result in loss of its integrity can include pipetting, vortexing, freeze-thawing, and excessive heating. Mechanical stress can be minimized (ChemBioChem, 11:340-343 (2010). In addition, high concentrations of divalent cations such as EDTA, EGTA, or gallic acid (and analogues and derivatives thereof) In some embodiments, a 2:1 mass ratio of sample to divalent cations inhibits nucleases, even in samples such as stool where extreme levels of nucleases are present. is sufficient for

単一細胞からの核酸の抽出および単離
単一の細胞または核からバイオポリマーを抽出するために利用可能ないくつかの異なるアプローチがあり、本発明の目的のためのバイオポリマーを抽出するために使用され得る。いくつかの好適な方法は、Kim et al.Integr Biol 2009 vol.1(10)pp.574-86に概説されている。細胞をKCLで処理して、細胞膜を除去することができる。細胞は、低張液を添加することによって破裂することができる。様々な異なる化学的および物理的溶解方法は、当該技術分野で知られているように、およびマイクロフルイディクスにおいてこれまで試験されているように実施することができる。
Extraction and Isolation of Nucleic Acids from Single Cells There are several different approaches available for extracting biopolymers from single cells or nuclei, and to extract biopolymers for the purposes of the present invention. can be used. Some suitable methods are described by Kim et al. Integr Biol 2009 vol. 1 (10) pp. 574-86. Cells can be treated with KCL to remove cell membranes. Cells can be ruptured by adding hypotonic solution. A variety of different chemical and physical lysis methods can be performed as known in the art and as previously tested in microfluidics.

単一細胞用のトラップは、核酸内容物が遊離される間に、細胞を保持するマイクロ流体構造で設計することができる。これは、WO/2012/056192、WO/2012/055415***のデバイス設計を使用することを含むが、本発明では、DNAを抽出し、ナノチャネル内で伸展する代わりに、マイクロ/ナノ流体構造を密封するために使用されるカバーガラスまたは箔を、Petit et al.Nano Letters 3:1141-1146(2003)に記載されているように、流体の移動によって分子コーミングを可能にするために、ポリビニルシラン(または同様に処置される)でコーティングする。流体チップ内の条件が穏やかであると、抽出されたDNAが、長い鎖長で保持され得る。 Traps for single cells can be designed with microfluidic structures that retain cells while their nucleic acid content is released. This includes using the device designs of WO/2012/056192, WO/2012/055415***, but in the present invention, instead of extracting DNA and spreading it in nanochannels, micro/nanofluidic The coverslips or foils used to seal the structures are as described by Petit et al. Coat with polyvinylsilane (or similarly treated) to allow molecular combing by fluid movement, as described in Nano Letters 3:1141-1146 (2003). The milder conditions within the fluidic chip allow the extracted DNA to be retained in long strand lengths.

一部の実施形態では、本発明の方法は、Strijp et al.Sci Rep.7:11030(2017)に記載の方法の適合を含む。伸展する前、単一細胞の核成分および核外成分は、マイクロ流体デバイスの供給チャネルに少なくとも1つの細胞を提供すること、少なくとも1つの捕捉構造内に少なくとも1つの細胞を捕捉すること、第1の溶解緩衝液を細胞に供給することによって、細胞の核の完全性に影響を及ぼすことなく、少なくとも1つの捕捉構造内に捕捉された細胞を溶解すること、放出されたRNAが固定化されるフローセルに細胞の核外成分を遊離すること、第2の溶解緩衝液を核に供給することによって、細胞の核を溶解すること、細胞の核成分(例えば、ゲノムDNA)を、それが固定化されるフローセルに遊離すること、によって、別々に抽出される。細胞外成分および細胞内成分は、同じフローセルの異なる場所またはデバイス内の異なるフローセルに固定化される。 In some embodiments, the methods of the invention are those described in Strijp et al. Sci Rep. 7:11030 (2017). Prior to spreading, the nuclear and extranuclear components of a single cell provide at least one cell to a feed channel of a microfluidic device; capture at least one cell within at least one capture structure; lysing the cells trapped within the at least one trapping structure without affecting the nuclear integrity of the cells by supplying the cells with a lysis buffer of releasing extranuclear components of the cells into the flow cell; lysing the nuclei of the cells by supplying a second lysis buffer to the nuclei; are separately extracted by releasing into a flow cell where the Extracellular and intracellular components are immobilized at different locations on the same flow cell or on different flow cells within the device.

捕捉用アダプター
非末端修飾ポリヌクレオチドを捕捉/固定化することに加えて、一部の実施形態では、(特に、短いDNAが分析される場合のもの)DNAの末端は、表面/マトリックス上の捕捉分子との相互作用に適合される。これには、ターミナルトランスフェラーゼを使用したテール付加(例えば、ポリAによるテール付加)および表面またはマトリックス上でのオリゴd(T)捕捉プローブへの結合が含まれる。オリゴd(T)捕捉プローブは、20~50nt長である。また、ライゲーションまたはタグ付けを使用して、Illumina配列決定用のアダプターを、ポリヌクレオチド上に導入し、表面またはマトリックス上の相補配列で捕捉することも含む。これにより、ユーザーは、十分に確立されたIlluminaプロトコルを使用して試料を調製することができ、次いで、本発明の方法によって捕捉し、配列決定される。好ましくは、ポリヌクレオチドは、増幅の前に捕捉され、これは、エラーおよびバイアスを導入する傾向を有する。
Capture Adapters In addition to capturing/immobilizing non-terminally modified polynucleotides, in some embodiments (particularly where short DNAs are analyzed) the ends of the DNA are captured on a surface/matrix. adapted to interact with molecules. This includes tailing using terminal transferase (eg, tailing with polyA) and binding to oligo d(T) capture probes on surfaces or matrices. Oligo d(T) capture probes are 20-50 nt long. It also includes using ligation or tagging to introduce adapters for Illumina sequencing onto polynucleotides to capture with complementary sequences on a surface or matrix. This allows users to prepare samples using well-established Illumina protocols, which are then captured and sequenced by the methods of the invention. Preferably, polynucleotides are captured prior to amplification, which tends to introduce errors and biases.

一部の実施形態では、セルフリーDNAもしくはマイクロRNAなどの短い(約300nt未満)ポリヌクレオチド、またはmRNAなどの比較的短い(10,000nt未満)ポリヌクレオチドは、適切な捕捉分子を使用して修飾または非修飾末端を捕捉することによって、表面上でランダムに固定化される。ポリAテールを有する天然mRNAは、表面上のオリゴd(T)プローブのローン(lawn)上で捕捉され得る。次いで、配列決定は、表面から「垂直に」行われる。一部の実施形態では、短いまたは比較的短いポリヌクレオチドが、表面と複数の相互作用を行い、配列決定が「水平に」実行される。これにより、スプライシングアイソフォームの編成を解像することが可能になり、例えば、いくつかのアイソフォームでは、反復またはシャッフルされるエキソンの場所を描写することができる。 In some embodiments, short (less than about 300 nt) polynucleotides such as cell-free DNA or microRNA, or relatively short (less than 10,000 nt) polynucleotides such as mRNA are modified using a suitable capture molecule. or randomly immobilized on the surface by capturing unmodified ends. Native mRNAs with poly-A tails can be captured on lawns of oligo d(T) probes on the surface. Sequencing is then performed "perpendicularly" from the surface. In some embodiments, short or relatively short polynucleotides make multiple interactions with the surface and sequencing is performed "horizontally." This allows the organization of splicing isoforms to be resolved, for example delineating the location of exons that are repeated or shuffled in some isoforms.

一部の実施形態では、ポリヌクレオチドは、捕捉プローブの規則正しいアレイ上で捕捉される。規則正しいアレイは、空間的にアドレス指定可能なアレイである。規則正しいアレイは、DNA折り紙(Rothemund,Science)アプローチを使用して形成され得るような分子ナノ構造アレイの形態をとり得る。規則正しいアレイは、DNAの自己組織化によって形成され得るような2D分子格子の形態をとり得る(Woo and Rothemund,Nature Communications,5:4889)。規則正しいアレイは、視野ごとにより高密度の分子(高密度配列)を可能にする、分子の効率的なサブ回折充填を可能にし、本発明の単一分子局在化方法は、高密度アレイ内の分子(例えば、40nmの点間距離)を解像することを可能にする。 In some embodiments, polynucleotides are captured on an ordered array of capture probes. A regular array is a spatially addressable array. Ordered arrays can take the form of molecular nanostructure arrays, such as can be formed using the DNA origami (Rothemund, Science) approach. Ordered arrays can take the form of 2D molecular lattices such as can be formed by DNA self-assembly (Woo and Rothemund, Nature Communications, 5:4889). Ordered arrays allow efficient sub-diffraction filling of molecules, which allows for a higher density of molecules per field of view (dense arrays), and the single-molecule localization method of the present invention allows for It allows to resolve molecules (eg 40 nm point-to-point distance).

ポリヌクレオチド修復
ポリヌクレオチドは、抽出、貯蔵、または調製中に損傷を受ける可能性がある。ニックおよび付加物は、天然の二本鎖ゲノムDNA分子内に形成され得る。これは、特に、試料のポリヌクレオチドがFFPE材料由来である場合に当てはまる。DNA修復溶液は、DNAが固定化される前または後に導入される。これは、ゲルプラグにおけるDNA抽出後に行うことができる。かかる修復溶液は、DNAエンドヌクレアーゼ、キナーゼ、および他のDNA修飾酵素を含んでいてもよい。かかる修復溶液は、ポリメラーゼおよびリガーゼを含み得る。かかる修復溶液は、New England BiolabsのプレPCRキットである。以下の参考文献は、それらの全体が本明細書に援用される。Karimi-Busheri et al.Nucleic Acids Res.1998 Oct 1;26(19):4395-400およびKunkel et al.(1981)Proc.Natl Acad Sci.USA,78,6734-6738。
Polynucleotide Repair Polynucleotides can become damaged during extraction, storage, or preparation. Nicks and adducts can be formed within naturally occurring double-stranded genomic DNA molecules. This is especially true when the sample polynucleotides are derived from FFPE material. A DNA repair solution is introduced before or after the DNA is immobilized. This can be done after DNA extraction in gel plugs. Such repair solutions may include DNA endonucleases, kinases, and other DNA modifying enzymes. Such repair solutions may include polymerases and ligases. Such a repair solution is New England Biolabs' pre-PCR kit. The following references are incorporated herein in their entirety. Karimi-Busheri et al. Nucleic Acids Res. 1998 Oct 1;26(19):4395-400 and Kunkel et al. (1981) Proc. Natl Acad Sci. USA, 78, 6734-6738.

ポリヌクレオチドの染色
任意選択的に、一部の実施形態では、ポリヌクレオチドDNA染色の骨格を追跡するために、他のポリヌクレオチド結合試薬を使用することができる。挿入色素、主溝結合剤、標識された非特異的DNA結合タンパク質、カチオン性共役ポリマーは、DNAに結合することができる。挿入色素は、様々な核酸塩基対色素比で使用することができる。約1:5~10の色素対塩基対比での複数の挿入色素ドナーを使用すると、成長するDNA鎖に沿ったヌクレオチド付加のためのドナーとして機能するのに十分な、色素分子(例えば、Sybr Green1、Sytox Green、YOYO-1)によるDNAの標識につながる。いくつかのDNA結合試薬は、ポリヌクレオチドを実質的にカバーすることができる。これらのDNA染色剤は、均一にまたはリアルタイム配列決定においてFRETパートナーとして機能することもできる。YOYO-1などの挿入色素を添加すると、DNAを暗く保ち、BMEなどの試薬を添加して、DNAのニッキングを防止することが有用である。一部の実施形態では、ポリヌクレオチドは、事前に染色されていないが、染色剤は、変性DNAへの結合プロセス中に添加される。ポリヌクレオチド-オリゴ二重鎖が形成されると、色素が挿入され得、その時点で、プローブ上の標識なしに、蛍光が検出される。一部の実施形態では、プローブ上にFRETパートナーである標識が存在し、標識と挿入色素との間のFRET相互作用が存在する。
Staining Polynucleotides Optionally, in some embodiments, other polynucleotide binding reagents can be used to follow the backbone of the polynucleotide DNA stain. Intercalating dyes, major groove binders, labeled non-specific DNA binding proteins, cationic conjugated polymers can bind to DNA. Intercalating dyes can be used at various nucleobase-to-dye ratios. Using multiple intercalating dye donors at a dye-to-base-pair ratio of about 1:5-10, there are enough dye molecules (eg, Sybr Green1 , Sytox Green, YOYO-1). Some DNA binding reagents can substantially cover a polynucleotide. These DNA stains can also function as FRET partners either homogeneously or in real-time sequencing. Adding an intercalating dye such as YOYO-1 keeps the DNA dark and adding a reagent such as BME is useful to prevent nicking of the DNA. In some embodiments, the polynucleotide is not pre-stained, but a stain is added during the binding process to the denatured DNA. Once the polynucleotide-oligo duplex is formed, the dye can be intercalated, at which point fluorescence is detected without label on the probe. In some embodiments, there is a label that is a FRET partner on the probe and there is a FRET interaction between the label and the intercalating dye.

一部の実施形態では、結合プローブは、結合プローブ間の二重鎖が形成された場合、挿入色素などのFRETドナーを介して励起され得る。数ナノメートルの解像度を得ることが可能である(例えば、Chemphyschem.2014 Aug 25;15(12):2431-5に記載されている)。 In some embodiments, bound probes can be excited via a FRET donor, such as an intercalating dye, when a duplex between the bound probes is formed. Resolutions of a few nanometers can be obtained (eg, as described in Chemphyschem. 2014 Aug 25;15(12):2431-5).

単一分子局在化を使用した伸長DNAに沿った配列決定
一過的な結合の概念は、それらが反応条件下で一過的に結合することができる限り、様々な種類の結合プローブに拡張することができる。結合プローブは、標識の異なるフレーバー(例えば、異なる波長の発光)を有するフルオロフォアで標識することができる。
Sequencing along stretched DNA using single-molecule localization The concept of transient binding extends to different types of binding probes as long as they can be transiently bound under the reaction conditions can do. Binding probes can be labeled with fluorophores having different flavors of label (eg, emission at different wavelengths).

一部の実施形態では、蛍光修飾DNAオリゴは、Biosynthesisから購入される。ストレプトアビジンは、Invitrogenから購入される(カタログ番号:S-888)。ウシ血清アルブミン(BSA)およびBSA-ビオチンは、Sigma Aldrichから購入される(カタログ番号:A8549)。スライドガラスおよびカバースリップは、VWRから購入される。試料の調製および撮像に、3つの緩衝液が使用される:緩衝液A(10mMのTris-HCl、100mMのNaCl、0.05%のTween-20、pH7.5)、緩衝液B(5mMのTris-HCl、10mMのMgCl2、1mMのEDTA、0.05%のTween-20、pH8)、および緩衝液C(1×リン酸緩衝生理食塩水、500mMのNaCl、pH8)。 In some embodiments, fluorescently modified DNA oligos are purchased from Biosynthesis. Streptavidin is purchased from Invitrogen (catalog number: S-888). Bovine serum albumin (BSA) and BSA-biotin are purchased from Sigma Aldrich (catalog number: A8549). Slides and coverslips are purchased from VWR. Three buffers are used for sample preparation and imaging: Buffer A (10 mM Tris-HCl, 100 mM NaCl, 0.05% Tween-20, pH 7.5), Buffer B (5 mM Tris-HCl, 10 mM MgCl2, 1 mM EDTA, 0.05% Tween-20, pH 8), and buffer C (1× phosphate buffered saline, 500 mM NaCl, pH 8).

一部の実施形態では、蛍光撮像は、完全フォーカスシステムを備えた倒立Nikon Eclipse Ti顕微鏡(Nikon Instruments)上で実施され、油浸対物レンズ(CFI Apo TIRF 100×、NA1.49、Oil)を用い、Nikon TIRF照明器を使用した、対物レンズ型TIRF構成を適用する。2D撮像の場合、107nmの画素サイズに対応する?150倍の最終倍率を得るために、追加の1.5の倍率が使用される。励起には、488nm(200mW、Coherent Sapphire)、561nm(200mW、Coherent Sapphire)、647nm(300mW、MBP Communications)の3つのレーザが使用される。レーザビームは、クリーンアップフィルタ(ZT488/10、ZET561/10、およびZET640/20、Chroma Technology)を通過し、マルチバンドビームスプリッター(ZT488rdc/ZT561rdc/ZT640rdc、Chroma Technology)を使用して、顕微鏡対物レンズに結合する。蛍光は、発光フィルタ(ET525/50m、ET600/50m、およびET700/75m、Chroma Technology)でスペクトル的にフィルタリングし、EMCCDカメラ(iXon X3 DU-897、Andor Technologies)で撮像する。 In some embodiments, fluorescence imaging was performed on an inverted Nikon Eclipse Ti microscope (Nikon Instruments) equipped with a full focus system, using an oil immersion objective (CFI Apo TIRF 100×, NA 1.49, Oil). , apply an objective-type TIRF configuration using a Nikon TIRF illuminator. For 2D imaging, does it support a pixel size of 107 nm? An additional 1.5 magnification is used to obtain a final magnification of 150X. Three lasers are used for excitation: 488 nm (200 mW, Coherent Sapphire), 561 nm (200 mW, Coherent Sapphire), 647 nm (300 mW, MBP Communications). The laser beam was passed through a clean-up filter (ZT488/10, ZET561/10, and ZET640/20, Chroma Technology), and using a multi-band beam splitter (ZT488rdc/ZT561rdc/ZT640rdc, Chroma Technology) to the microscope objective. bind to Fluorescence is spectrally filtered with emission filters (ET525/50m, ET600/50m, and ET700/75m, Chroma Technology) and imaged with an EMCCD camera (iXon X3 DU-897, Andor Technologies).

一部の実施形態では、試料調製のために、カバースリップ(No.1.5、18×18mm2、?0.17mm厚)およびスライドガラス(3×1インチ2、1mm厚)を、2枚の両面テープで一緒に挟んで、約20μLの内部体積を有するフローチャンバーを形成する。まず、20μLのビオチン標識ウシアルブミン(1mg/ml、緩衝液A中に溶解)をチャンバーに入れ、2分間インキュベートする。次いで、40μLの緩衝液Aを使用してチャンバーを洗浄する。次いで、20μLのストレプトアビジン(0.5mg/mL、緩衝液A中に溶解)をチャンバーに通し、2分間結合させる。40μLの緩衝液Aで洗浄した後、続いて、40μLの緩衝液Bで洗浄する。最後に、20μLの緩衝液B中のビオチン標識DNAオリゴ鋳型およびプライマー(約300pMのモノマー濃度)およびDNA折り紙ドリフトマーカー(約100pM)をチャンバーに入れ、5分間インキュベートする。 In some embodiments, for sample preparation, coverslips (No. 1.5, 18 x 18 mm2, ~0.17 mm thick) and glass slides (3 x 1 in2, 1 mm thick) were prepared in duplicate. Sandwich together with double-sided tape to form a flow chamber with an internal volume of approximately 20 μL. First, 20 μL of biotin-labeled bovine albumin (1 mg/ml, dissolved in buffer A) is placed in the chamber and incubated for 2 minutes. The chamber is then washed using 40 μL of Buffer A. 20 μL of streptavidin (0.5 mg/mL, dissolved in buffer A) is then passed through the chamber and allowed to bind for 2 minutes. A wash with 40 μL of buffer A is followed by a wash with 40 μL of buffer B. Finally, biotin-labeled DNA oligo templates and primers (approximately 300 pM monomer concentration) and DNA origami drift markers (approximately 100 pM) in 20 μL of buffer B are placed in the chamber and incubated for 5 minutes.

理想的には、温度およびオリゴ配列を選択して、組み込みに好適な塩濃度を実施できるようにする。CCD読み出しの帯域幅は、16bitで1MHz、プリアンプゲインで5.1MHzに設定されている。撮像は、561nmで294W/cm2の励起強度を有するTIR照明を使用して行われる。 Ideally, the temperature and oligo sequence are chosen to allow a suitable salt concentration for incorporation. The CCD readout bandwidth is set to 1 MHz for 16 bits and 5.1 MHz for preamplifier gain. Imaging is performed using TIR illumination with an excitation intensity of 294 W/cm2 at 561 nm.

より高速な撮像を可能にする高速なCMOSカメラが利用可能になりつつある。例えば、Andor Zyla Plusは、USB3.0接続だけで、512x1024にわたって最大398fpsを可能にし、関心領域(ROI)にわたって高速になり、またはCameraLink接続も可能である。したがって、より短いドッキング/撮像鎖で、またはより高い温度で、またはより低い塩濃度で動作することにより、短時間で必要な分解能のために十分な情報を収集することが可能である。このため、高いレーザ出力(例えば、500mW)が好ましく、高いカメラ量子収率(例えば、約80%)が好ましく、高い色素輝度が好ましい。これにより、必要な取得時間を、数秒に短縮することができる。しかし、これは回折限界法の10倍を超える分解能ゲインを与え得る。 Faster CMOS cameras are becoming available that allow faster imaging. For example, the Andor Zyla Plus allows up to 398 fps over 512x1024 with just a USB 3.0 connection, faster over a region of interest (ROI), or even a CameraLink connection. Therefore, by operating with shorter docking/imaging chains, or at higher temperatures, or at lower salt concentrations, it is possible to collect sufficient information for the required resolution in a short period of time. For this reason, high laser power (eg, 500 mW) is preferred, high camera quantum yield (eg, about 80%) is preferred, and high dye brightness is preferred. This can reduce the required acquisition time to a few seconds. However, it can give a resolution gain of more than 10 times that of the diffraction limited method.

本発明の一実施形態では、CCDまたはCMOSカメラとの時間遅延積分を使用して、新規の撮像方法が実装され、試料ステージがカメラの読み出しと同期して移動し、時間分解能が多くの画素にわたって広がるようにする。これにより、表面上のある場所から別の場所への移動の遅延がないため、画像取得が加速する。結果は撮像ストリップであり、列の最初の1000画素は、1つの場所の撮像の10秒を表し、次の1000画素は、次の場所の10秒の撮像を表す。また、Appl Opt.54:8632-6(2015)に記載されている方法も、適合させることができる。 In one embodiment of the present invention, a novel imaging method is implemented using time-delayed integration with a CCD or CMOS camera, where the sample stage moves synchronously with the camera readout, and the time resolution is over many pixels. let it spread out. This accelerates image acquisition as there is no delay in moving from one location on the surface to another. The result is an imaging strip where the first 1000 pixels in a row represent 10 seconds of imaging at one location and the next 1000 pixels represent 10 seconds of imaging at the next location. Also, Appl Opt. 54:8632-6 (2015) can also be adapted.

光散乱ナノ粒子(例えば、金ナノ粒子)または半導体ナノ結晶が使用される場合、これらの粒子のより明るく、ほぼ非網羅的な光学応答のために、速度の実質的にさらなるステップアップがある。繰り返しになるが、このようなナノ粒子標識を使用する場合、最大速度を向上させるために、カメラのフレームレートおよび撮像剤のオン/オフ速度を調整する必要がある。 When light-scattering nanoparticles (eg, gold nanoparticles) or semiconductor nanocrystals are used, there is a substantial further step-up in speed due to the brighter, nearly non-exhaustive optical response of these particles. Again, when using such nanoparticle labels, the frame rate of the camera and the on/off speed of the imaging agent need to be adjusted to improve the maximum speed.

一過的な結合アプローチの例として、光退色または暗状態の影響がほとんどなく、洗練されたフィールドストップまたはパウエルレンズが照明を制限する必要がないことが挙げられる。加えて、表面への非特異的結合の影響は、非特異的部位へのプローブ結合のかかる非存続性によって緩和され、撮像剤が非特異的結合部位(すなわち、標的ドッキング上ではない)を占有すると、その位置に留まり、その場所へのさらなる結合を遮断する。典型的には、標的ポリヌクレオチドへの撮像剤結合の解像を妨げる非特異的結合部位の大部分は、撮像の初期段階のうちに占有および退色され、撮像剤のポリヌクレオチド部位へのオン/オフ結合が、その後、容易に観察されるようになる。したがって、一実施形態では、高いレーザ出力を使用して、最初にオン特異的結合部位を占有するプローブを退色させ、任意選択的に、この段階のうちは画像を撮影せず、次いで、任意選択的に、レーザ出力を低減させ、撮像を開始して、ポリヌクレオチドへのオン・オフ結合を捕捉する。最初の非特異的結合後のさらなる非特異的結合は、頻度が低く(退色されたプローブが、非特異的結合部位に固着したままであり得るため)、例えば、ドッキング部位への特異的結合とみなされる閾値を適用することによって、計算的にフィルタリング除去され得、同じ場所への結合は、持続的でなければならない(例えば、同じ部位で、少なくとも5回または少なくとも10回発生するはずである)。典型的には、ドッキング部位への特異的な結合事象が、約20回検出される。 Examples of transient coupling approaches include little effect of photobleaching or dark conditions and no need for sophisticated field stops or Powell lenses to limit illumination. In addition, the effects of non-specific binding to the surface are mitigated by such non-persistence of probe binding to non-specific sites, allowing imaging agents to occupy non-specific binding sites (i.e. not on target docking). It then stays in place and blocks further binding to that location. Typically, the majority of non-specific binding sites that prevent resolution of imaging agent binding to target polynucleotides are occupied and bleached during the early stages of imaging, resulting in on/off of imaging agent to polynucleotide sites. Off-coupling is then readily observed. Thus, in one embodiment, high laser power is used to first bleach probes occupying on-specific binding sites, optionally no images are taken during this step, and then optionally Briefly, the laser power is reduced and imaging is initiated to capture on and off binding to polynucleotides. Further non-specific binding after the initial non-specific binding is infrequent (because the bleached probe can remain anchored to the non-specific binding site), e.g. Can be computationally filtered out by applying a threshold to be considered and binding to the same location must be persistent (e.g., should occur at the same site at least 5 times or at least 10 times) . Typically, about 20 specific binding events to the docking site are detected.

本発明者らの目的のために、非特異的である結合をフィルタリング除去するための別の手段は、シグナルが表面に伸展された線状の鎖と相関しなければならないことであり、これは、線状の鎖を染色することによって、または他の持続的な結合部位を介してラインを追跡することによって、行うことができる。持続的であるかどうかにかかわらず、線に沿って落ちないシグナルは廃棄することができる。同様に、超分子格子が使用される場合、格子の構造と相関しない結合事象は破棄され得る。 For our purposes, another means to filter out binding that is non-specific is that the signal must be correlated with linear chains stretched out on the surface, which is , by staining linear strands, or by tracing lines through other persistent binding sites. Signals that do not fall along the line, persistent or not, can be discarded. Similarly, if a supramolecular lattice is used, binding events uncorrelated with the structure of the lattice can be discarded.

表面での単一細胞の単離、ならびにDNAおよびRNAの両方の抽出
ポリ(L)リジン(PLL)(例えば、Microsurfaces Inc.から入手可能であるか、または独自にコーティングするか)などの正電荷を有する表面は、細胞膜に結合し得ることが知られている。細胞が表面と接触する可能性が高くなるように、低い高さのフローチャネルの高さ(30ミクロン未満)が使用される。これは、フローセルの天井に、乱流を導入するヘリンボーンパターンを使用することによって強化することができる。細胞の付着は、細胞が低密度で表面に播種される必要があるため(各々の個々の細胞から抽出されるRNAおよびDNAが空間的に分離したままであるように、細胞間に十分なスペースがあることを確実にするため)、効率的である必要はない。細胞膜および核膜の両方が破壊されるように、細胞内容物が培体中に噴出され、単離された細胞の近傍の表面で捕捉されるように、プロテイナーゼ処理を使用して、細胞を破裂させる。ゲノムDNAの場合、確立された細胞遺伝学的技術であるFiber FISHのから、このアプローチが優先される。固定化されたら、DNAおよびRNAが伸展される。伸展緩衝液は、カバーガラス表面にわたって一方向に流れ、DNAおよびRNAポリヌクレオチドを、流れの方向に伸展させ、整列させる。温度、伸展緩衝液の組成、および流れの物理的な力により、RNAの二次/三次構造の大部分を除去することができ、RNAが抗体への結合に利用可能となる。RNAが伸展されると、変性形態で、変性緩衝液から結合緩衝液に切り替えることが可能である。
Isolation of single cells and extraction of both DNA and RNA on surfaces Positive charges such as poly(L) lysine (PLL) (eg available from Microsurfaces Inc. or proprietary coating) is known to be capable of binding to cell membranes. A low flow channel height (less than 30 microns) is used so that cells are more likely to contact the surface. This can be enhanced by using a herringbone pattern in the ceiling of the flow cell that introduces turbulence. Cell attachment requires that the cells be seeded to the surface at a low density (enough space between cells so that the RNA and DNA extracted from each individual cell remain spatially separated). (to ensure that there is a Cells are ruptured using proteinase treatment such that both the cell and nuclear membranes are disrupted so that the cell contents are ejected into the medium and trapped on the surface adjacent to the isolated cells. Let For genomic DNA, this approach is preferred because of the established cytogenetic technique of Fiber FISH. Once immobilized, DNA and RNA are stretched. The stretching buffer flows unidirectionally across the coverslip surface, stretching and aligning the DNA and RNA polynucleotides in the direction of flow. Temperature, extension buffer composition, and the physical forces of flow can remove most of the secondary/tertiary structure of the RNA, making it available for antibody binding. Once the RNA is stretched, it can switch from the denaturation buffer to the binding buffer in its denatured form.

代替的に、RNAは、まず、細胞膜を破壊し、一方向に流れを誘導することによって、抽出され、固定化される。次に、プロテイナーゼを使用することによって、核膜を破壊し、逆方向に流れを誘導する。一部の実施形態では、DNAは、例えば、レアカッティング制限酵素(例えば、NOT1、PMME1)を使用することによって、遊離の前または後に断片化される。この断片化は、DNAの解離を助け、個々の鎖を単離およびコーミングすることが可能になる。固定化された細胞は、各細胞から抽出されたRNAおよびDNAが混ざり合わず、十分に離れているように、システムのセットアップを確実にする。これは、細胞の破裂の前、後、または際に、液体をゲルへ転移させることによって補助され得る。 Alternatively, RNA is first extracted and immobilized by disrupting the cell membrane and inducing flow in one direction. Proteinases are then used to disrupt the nuclear envelope and induce flow in the opposite direction. In some embodiments, DNA is fragmented before or after release, eg, by using rare-cutting restriction enzymes (eg, NOT1, PMME1). This fragmentation aids in the dissociation of DNA, allowing individual strands to be isolated and combed. Immobilized cells ensure that the system is set up so that the RNA and DNA extracted from each cell are not intermingled and are well separated. This can be aided by transferring liquid to the gel before, after, or during cell rupture.

RNAの伸展
荷電表面上の核酸の伸展は、溶液のカチオン濃度によって影響を受ける。低塩濃度では、RNAは一本鎖であり、その骨格に沿って負に帯電し、その長さに沿ってランダムに表面に結合する可能性が高い。
Spreading of RNA The spreading of nucleic acids on charged surfaces is affected by the concentration of cations in solution. At low salt concentrations, RNA is single-stranded, negatively charged along its backbone, and likely bound to surfaces randomly along its length.

これに対する1つのアプローチは、最初に、高塩を使用することによって、その球状形態を促進することであり、そのような場合、末端、特にポリAテールは、相互作用によりアクセスしやすい。球状形態で結合したら、変性緩衝液として機能する異なる緩衝液をフローセルに適用することができる。代替的に、我々は、mRNAのポリAテールを捕捉するために、PLLをオリゴd(T)で予めコーティングする選択肢を有する。複数のグループが、mRNAのポリアデニル化3’へのオリゴ(dT)結合を使用して、mRNAの表面への結合を実証している(例えば、Ozsolak F,et al.)[4]。ポリAテールのホモポリマーの性質は、さもなければ捕捉を妨げ得る二次構造を比較的含まない領域であるべきことを意味する。ポリAテールは、高等真核生物では比較的長いため(250~3000nt)、長いオリゴd(T)捕捉プローブを設計して、RNAの分子内塩基対形成のかなりの部分を融解させるのに十分な比較的高い厳密性(温度、塩条件)で、ハイブリダイゼーションを行うことができる。オリゴd(T)を、結合の安定性を増加させる修飾で試験し、架橋修飾で試験して、結合後にRNAを捕捉プローブに固定することができる。結合後、残りのRNA構造を球状状態から線状状態へ転移させることは、捕捉を無効にするのに十分ではないが、RNAの分子内塩基対形成を破壊し得る変性条件を使用することによって、および流体の流れまたは電気泳動力によって、行うことができる。 One approach to this is to first promote its globular morphology by using high salt, in which case the termini, especially the polyA tail, are more accessible for interactions. Once bound in spherical form, a different buffer can be applied to the flow cell to act as a denaturing buffer. Alternatively, we have the option of precoating the PLL with oligo d(T) to capture the polyA tail of the mRNA. Several groups have demonstrated binding of mRNA to the surface using oligo(dT) binding to the polyadenylation 3' of mRNA (eg Ozsolak F, et al.) [4]. The homopolymeric nature of the polyA tail means that the region should be relatively free of secondary structure that could otherwise interfere with entrapment. Because the polyA tail is relatively long (250-3000 nt) in higher eukaryotes, long oligo d(T) capture probes were designed to be sufficient to melt a significant fraction of the intramolecular base pairing of RNA. Hybridization can be performed with relatively high stringency (temperature, salt conditions). Oligo d(T) can be tested with modifications that increase the stability of binding and tested with bridging modifications to immobilize RNA to capture probes after binding. By using denaturing conditions that can disrupt the intramolecular base-pairing of RNA, although it is not sufficient to abolish capture to transform the remaining RNA structures from a globular state to a linear state after binding. , and by fluid flow or electrophoretic forces.

配列決定計装とデバイス
本発明の配列決定方法は、共通の計装要件を有する。基本的に、機器は撮像および試薬の交換が可能でなければならない。撮像要件には、1つ以上のグループ:対物レンズ、リレーレンズ、ビームスプリッター、ミラー、フィルタ、カメラまたはポイント検出器が含まれる。カメラには、CCDまたはアレイCMOS検出器が含まれる。ポイント検出器には、光電子増倍管(PMT)またはアバランシェフォトダイオード(APD)が含まれる。いくつかのCESA高速カメラが使用される。その他の任意選択的な態様は、本方法の形式に応じて、照明源(例えば、ランプ、LED、またはレーザ)、および照明を基板に結合するための手段、例えば、プリズム、格子、ゾル-ゲル、レンズ、移動ステージまたは可動対物レンズ、撮像デバイスに対する試料の移動、試料の混合/撹拌、温度制御、および電気。
Sequencing Instrumentation and Devices The sequencing methods of the invention have common instrumentation requirements. Basically, the instrument must be capable of imaging and exchange of reagents. Imaging requirements include one or more groups: objective lenses, relay lenses, beam splitters, mirrors, filters, cameras or point detectors. The camera contains a CCD or array CMOS detector. Point detectors include photomultiplier tubes (PMTs) or avalanche photodiodes (APDs). Several CESA high speed cameras are used. Other optional aspects, depending on the format of the method, include illumination sources (eg, lamps, LEDs, or lasers), and means for coupling the illumination to the substrate, such as prisms, gratings, sol-gel , lens, motion stage or movable objective lens, sample movement relative to the imaging device, sample mixing/stirring, temperature control, and electricity.

本発明の単一分子の実施態様では、照明は、好ましくは、エバネッセント波の生成を介し、例えば、プリズムベースの全内部反射、対物レンズベースの全内部反射、格子ベースの導波路、ヒドロゲルベースの導波路、または好適な角度でレーザ光を基板のエッジにもたらすことによって生成されるエバネッセント導波路を介し、導波路は、コア層および第1のクラッド層を含み得る。照明は、代替的に、薄層斜光(HILO)照明またはライトシートを含み得る。いくつかの単一分子機器では、パルス照明と時間ゲート検出の同期を使用することによって、光散乱の影響を軽減する。ここでは、光散乱がゲートアウトされる。一部の実施形態では、暗視野照明が使用される。蛍光寿命測定のために設定されている器具もある。 In single-molecule embodiments of the present invention, illumination is preferably via the generation of evanescent waves, e.g., prism-based total internal reflection, objective-based total internal reflection, grating-based waveguides, hydrogel-based Through a waveguide, or an evanescent waveguide created by bringing laser light to the edge of the substrate at a suitable angle, the waveguide may include a core layer and a first cladding layer. Illumination may alternatively include thin layer oblique light (HILO) illumination or a light sheet. Some single-molecule instruments mitigate the effects of light scattering by using synchronization of pulsed illumination and time-gated detection. Here light scattering is gated out. In some embodiments, darkfield illumination is used. Some instruments are set up for fluorescence lifetime measurements.

一部の実施形態では、機器はまた、細胞、核、オルガネラ、染色体などからポリヌクレオチドを抽出するための手段を含む。 In some embodiments, the instrument also includes means for extracting polynucleotides from cells, nuclei, organelles, chromosomes, and the like.

本発明のほとんどの実施形態に好適な機器は、IlluminaからのゲノムアナライザーIIxであり、この機器は、プリズムベースのTIR、20×乾燥対物レンズ、ライトスクランブラ、532nmおよび660nmのレーザ、赤外線ベースの自動焦点システム、発光フィルタホイール、Photometrix CoolSnap CCDカメラ、温度制御、および試薬交換用のシリンジポンプベースのシステムで構成されている。この機器を代替カメラの組み合わせを用いて改良することで、より良好な単一分子配列決定が可能になる。例えば、センサーは、好ましくは、低い電子ノイズ、2e未満を有する。また、センサーは、多数の画素を有する。シリンジ-ポンプベースの試薬交換システムは、圧力駆動フローベースのシステムに置き換えることもできる。システムは、互換性のあるIlluminaフローセル、または機器の実際の配管もしくは改良された配管に合うように適合されたカスタムのフローセルとともに使用ことができる。 A suitable instrument for most embodiments of the invention is the Genome Analyzer IIx from Illumina, which includes a prism-based TIR, 20× dry objective, light scrambler, 532 nm and 660 nm lasers, infrared-based It consists of an autofocus system, an emission filter wheel, a Photometrix CoolSnap CCD camera, temperature control, and a syringe pump-based system for reagent exchange. Refinement of this instrument with a combination of alternative cameras will allow better single-molecule sequencing. For example, the sensor preferably has low electronic noise, less than 2e. Also, the sensor has a large number of pixels. Syringe-pump based reagent exchange systems can also be replaced with pressure driven flow based systems. The system can be used with compatible Illumina flow cells or custom flow cells adapted to match the actual or modified plumbing of the instrument.

代替的に、レーザベッド(レーザは、標識の選択に依存する)またはゲノム分析デバイスからのレーザシステムおよびライトスクランブラ、EM CCDカメラ(例えば、Hamamatsu ImageEM)またはScientific CMOS(例えば、Hamamatsu Orca FLASH)と結合された電動Nikon Ti-E顕微鏡、および任意選択的に、温度制御を使用することができる。一部の実施形態では、科学用センサーではなく消費者用センサーが使用される。これは、配列決定のコストを劇的に低減する可能性を有する。これは、圧力駆動またはシリンジポンプのシステム、および特別に設計されたフローセルと結合されている。フローセルは、ガラスまたはプラスチックで製作され、それぞれ利点および欠点を有する。環状オレフィンコポリマー(COC)、例えば、TOPAS、他のプラスチック、もしくはPDMS、またはシリコンもしくはガラス中で、微細加工法を使用して。熱可塑性プラスチックの射出成形は、工業規模の製造に低コスト化の道筋を提供する。一部の光学構成では、熱可塑性プラスチックは、最小限の固有蛍光を有する良好な光学特性を有する必要がある。芳香族または共役系を除く、含むポリマーは、顕著な固有蛍光を有することが予想されるため、理想的には除外されるべきである。Zeonor1060R、Topas5013、PMMA-VSUVT(US8057852B2)は、緑色および赤色の波長範囲(例えば、Cy3およびCy5に対して)で妥当な光学特性を有することが報告されており、Zeonar1060Rが最も好ましい。このような表面のいくつかにプローブを共有結合させるための方法が利用可能である。熱可塑性プラスチックを結合するための方法が報告されている(例えば、Microfluidics and Nanofluidics,19(4),913-922)。一部の実施形態では、バイオポリマーが付着されるガラスカバーガラスは、熱可塑性プラスチックの流体アーキテクチャに結合される。ガラスは、優れた光学特性ならびにいくつかの他の利点を有するが、現在利用可能な選択肢があるものの、低コストで複雑なマイクロ流体デバイスを製造することは困難であった(Scientific Reports 5:13276(2015))。 Alternatively, a laser bed (laser depends on label choice) or laser system and light scrambler from a genomic analysis device, EM CCD camera (e.g. Hamamatsu ImageEM) or Scientific CMOS (e.g. Hamamatsu Orca FLASH) and A coupled motorized Nikon Ti-E microscope and optionally temperature control can be used. In some embodiments, consumer sensors are used rather than scientific sensors. This has the potential to dramatically reduce the cost of sequencing. This is coupled with a system of pressure driven or syringe pumps and a specially designed flow cell. Flow cells are made of glass or plastic, each having advantages and disadvantages. In cyclic olefin copolymers (COC), such as TOPAS, other plastics, or PDMS, or silicon or glass, using microfabrication methods. Injection molding of thermoplastics offers a low cost route to industrial scale manufacturing. For some optical configurations, the thermoplastic should have good optical properties with minimal intrinsic fluorescence. Polymers containing, but not aromatic or conjugated systems are expected to have significant intrinsic fluorescence and should ideally be excluded. Zeonor 1060R, Topas 5013, PMMA-VSUVT (US8057852B2) are reported to have reasonable optical properties in the green and red wavelength range (eg for Cy3 and Cy5), with Zeonar 1060R being the most preferred. Methods are available for covalently attaching probes to some of these surfaces. Methods for bonding thermoplastics have been reported (eg Microfluidics and Nanofluidics, 19(4), 913-922). In some embodiments, the glass coverslip to which the biopolymer is attached is bonded to a thermoplastic fluidic architecture. Although glasses have excellent optical properties as well as several other advantages, it has been difficult to fabricate low-cost and complex microfluidic devices, despite currently available options (Scientific Reports 5:13276 (2015)).

代替的に、手動操作のフローセルは、顕微鏡の上部で使用することができる。これは、両面粘着シートを使用してフローセルを作製し、適切な寸法のチャネルが得られるようにレーザ切断し、カバースリップとスライドガラスとの間に挟むことによって、簡単に構築することができる。 Alternatively, a manually operated flow cell can be used on top of the microscope. This can be easily constructed by creating a flow cell using double-sided adhesive sheets, laser cutting to obtain channels of appropriate dimensions, and sandwiching between a coverslip and a glass slide.

ある試薬交換サイクルから別の試薬交換サイクルまで、フローセルは、フレーム間の位置合わせまで、機器/顕微鏡上に留めてもよい。リニアエンコーダを備えた電動ステージを使用して、広い領域を撮像する際のステージの移動を確実にし、同じ場所が正しく再訪され、正しい位置合わせを確実にするために、基準マーカーが使用され得る。代替的に、フローセルは、各撮像ラウンドの後に機器/顕微鏡から除去され、組み込み反応は、例えば、次のラウンドの撮像のために顕微鏡に戻される前に、フラットブロックを有するサーマルサイクラーで他の場所で行われる(撮像という用語は、2Dアレイまたは2D走査検出器を含むように使用される)。この場合、フローセルまたは表面のエッチングなどの基準マーキング、光学的に検出され得るフローセル内の固定化されたビーズを有することが重要である。ポリヌクレオチド骨格が染色される場合(例えば、YOYO-1によって)、それらの固定位置の分布場所を使用して、画像をあるフレームから次のフレームに整列させることができる。 From one reagent change cycle to another, the flow cell may remain on the instrument/microscope until frame-to-frame alignment. A motorized stage with a linear encoder can be used to ensure stage movement when imaging large areas, and fiducial markers can be used to ensure correct revisiting of the same locations and correct alignment. Alternatively, the flow cell is removed from the instrument/microscope after each imaging round, and the integrated reaction is e.g. elsewhere in a thermal cycler with flat blocks before being returned to the microscope for the next round of imaging. (the term imaging is used to include 2D arrays or 2D scanning detectors). In this case, it is important to have fiducial markings, such as etching of the flow cell or surface, immobilized beads within the flow cell that can be optically detected. If the polynucleotide backbone is stained (eg, by YOYO-1), the distribution of those fixed positions can be used to align images from one frame to the next.

一実施形態では、本発明の方法を実施するために、レーザまたはLED照明を使用するUS7175811またはRamachandran et al(Scientific Reports 3:2133)に記載されている照明機構を、温度制御機構および試薬交換システムと結合することができる。一部の実施形態では、スマートフォンベースの撮像設定(ACS Nano7:9147)が、任意選択的な温度制御モジュールおよび試薬交換システムと結合され得る。主に、電話のカメラが使用されるが、iPhoneまたは他のスマートフォンデバイスの照明および振動機能などの他の態様も使用することができる。 In one embodiment, the illumination mechanism described in US7175811 or Ramachandran et al (Scientific Reports 3:2133) using laser or LED illumination is combined with a temperature control mechanism and a reagent exchange system to practice the methods of the invention. can be combined with In some embodiments, a smartphone-based imaging setup (ACS Nano7:9147) can be coupled with an optional temperature control module and reagent exchange system. Primarily, the phone's camera is used, but other aspects such as the lighting and vibration capabilities of an iPhone or other smart phone device can also be used.

GAIIxなどの光学配列決定システムの様々な顕微鏡様構成要素を使用する代わりに、配列決定のために、より統合された一体化デバイスが構築され得る。ここで、ポリヌクレオチドは、センサーアレイ上に、またはセンサーアレイに隣接する基板上に直接結合され、任意選択的に、伸長される。センサーアレイ上での直接検出は、アレイへのDNAハイブリダイゼーションに関して、実証されている(Lamture et al Nucleic Acid Research 22:2121-2125(1994))。レイリー散乱が蛍光色素からの発光と比較して短命であることから、センサーを時間ゲートして、バックグラウンド蛍光を低減することができる。 Instead of using various microscope-like components of an optical sequencing system such as GAIIx, a more integrated integrated device can be built for sequencing. Here, the polynucleotides are attached directly onto the sensor array, or onto a substrate adjacent to the sensor array, and optionally elongated. Direct detection on sensor arrays has been demonstrated for DNA hybridization to the array (Lamture et al Nucleic Acid Research 22:2121-2125 (1994)). Because Rayleigh scattering is short-lived compared to emission from fluorochromes, the sensor can be time-gated to reduce background fluorescence.

一実施形態では、センサーはCMOS検出器である。一部の実施形態では、複数の色が検出される(US2009/0194799)。一部の実施形態では、検出器は、Foveon検出器である(例えば、US6727521)。センサーアレイは、三重接合ダイオードのアレイ(US9105537)であり得る。一部の実施形態では、オリゴまたは他の結合試薬上の異なる標識は、発光の波長によってコードされる。一部の実施形態では、異なる標識は、蛍光寿命によってコードされる。一部の実施形態では、異なる標識は、蛍光偏光によってコードされる。一部の実施形態では、異なる標識は、波長、蛍光寿命の組み合わせによってコードされる。 In one embodiment, the sensor is a CMOS detector. In some embodiments, multiple colors are detected (US2009/0194799). In some embodiments, the detector is a Foveon detector (eg US6727521). The sensor array can be an array of triple junction diodes (US9105537). In some embodiments, different labels on oligos or other binding reagents are encoded by wavelengths of emission. In some embodiments, different labels are encoded by fluorescence lifetimes. In some embodiments, the different labels are encoded by fluorescence polarization. In some embodiments, different labels are encoded by a combination of wavelength, fluorescence lifetime.

単一の波長を光源として使用し、フィルタを使用する必要がないことは、セットアップの単純さのため、およびフィルタを使用する場合に必然的に一部の光の損失があるための両方で有利である。一部の実施形態では、異なる標識は、反復的なオン・オフのハイブリダイゼーション動態によってコードされ、異なる会合定数-解離定数を有する異なる結合プローブが使用される。一部の実施形態では、プローブは蛍光強度によってコード化される。プローブは、異なる数の結合された非自己消光性フルオロフォアを有することによってコードされた蛍光強度であり得る。個々のフルオロフォアは、通常、クエンチさせないように十分に分離されている必要があり、それらを好適な距離で所定の位置に保持する剛性リンカーまたはDNAナノ構造が、これを達成するための良好な方法である。蛍光強度によるコード化のための1つの代替的な実施形態は、類似の発光スペクトルを有するが、それらの量子収率または他の測定可能な光学特性が異なる色素バリアントを使用することであり、例えば、Cy3B(558/572)は、Cy3(550/570)(量子収率0.15)よりもかなり明るいが(量子収率0.67)、類似の吸収/発光スペクトルを有する。532nmレーザを使用して、両方の色素を励起することができる。使用され得る他の色素としては、Cy3.5(591/604)が挙げられるが、これは、シフトアップした励起スペクトルおよび発光スペクトルを有する一方、それでも532nmレーザによって励起されるが、Cy3からの発光を選択するように設計されたバンドパスフィルタでは、Cy3.5が準最適な波長によって励起されているため、両方が同様の量子収率を有するにもかかわらず、明るく見えない。Atto532(532/553)は、0.9の量子収率を有し、532nmレーザがそのスイートスポットに当たるため、明るいと予想される。これらの期待にもかかわらず、使用される色素は、それらの性能を適切に測定するために経験的に試験されなければならない。前述のセットからの色素を区別することができない場合、他の色素を試験することができる。単一の励起波長を使用して複数のコードを得るための別のアプローチは、色素の発光寿命を測定することである。このために、Alexa Fluor546、Cy3B、Alexa Fluor555、およびAlexa Fluor555を含むセット、ならびに多くの他の組み合わせを使用することができる。一部の実施形態では、コードのレパートリーは、FRETペアを使用することによって、および放射光の偏光を測定することによっても拡張され得る。したがって、波長、寿命、偏光、FRETペアの所望の組み合わせで、区別可能な標識の多くのレパートリーが作成され得る。標識の数を増やすための別の手段は、複数の色でコードすることである。 Using a single wavelength as the light source and not having to use filters is advantageous both because of the simplicity of the setup and because of the inevitable loss of some light when using filters is. In some embodiments, different labels are encoded by repetitive on-off hybridization kinetics, and different binding probes with different association-dissociation constants are used. In some embodiments, probes are encoded by fluorescence intensity. Probes can be fluorescence intensities encoded by having different numbers of non-self-quenching fluorophores attached. Individual fluorophores usually need to be sufficiently separated to avoid quenching, and rigid linkers or DNA nanostructures that hold them in place at suitable distances are good ways to accomplish this. The method. One alternative embodiment for encoding by fluorescence intensity is to use dye variants that have similar emission spectra but differ in their quantum yields or other measurable optical properties, e.g. , Cy3B(558/572) are significantly brighter (quantum yield 0.67) than Cy3(550/570) (quantum yield 0.15), but have similar absorption/emission spectra. A 532 nm laser can be used to excite both dyes. Other dyes that can be used include Cy3.5 (591/604), which has upshifted excitation and emission spectra, while still being excited by a 532 nm laser, but emitting from Cy3. In a bandpass filter designed to select , Cy3.5 does not appear bright because it is excited by the suboptimal wavelength, even though both have similar quantum yields. Atto532 (532/553) has a quantum yield of 0.9 and is expected to be bright because the 532 nm laser hits its sweet spot. Despite these expectations, the dyes used must be empirically tested to adequately measure their performance. If dyes from the above set cannot be distinguished, other dyes can be tested. Another approach to obtaining multiple codes using a single excitation wavelength is to measure the emission lifetime of dyes. For this purpose, sets including Alexa Fluor 546, Cy3B, Alexa Fluor 555, and Alexa Fluor 555, as well as many other combinations can be used. In some embodiments, the code repertoire can also be expanded by using FRET pairs and by measuring the polarization of the emitted light. Thus, a large repertoire of distinguishable labels can be created at any desired combination of wavelength, lifetime, polarization, and FRET pair. Another means of increasing the number of signs is to code with multiple colors.

現在の光学配列決定方法は、画像処理ステップを必要とし、画像から配列シグナルが抽出される。これには、通常、画像の各フレームから関連するシグナルを抽出することが含まれる。一実施形態では、代替は、すべての画素から、すべてのサイクルを通して垂直的にシグナルを捕捉し、アルゴリズムを使用して配列を計算することである。このアプローチの1つの利点は、シグナルのトラジェクトリーが、サイクルを通して垂直的に見られる場合、非特異的シグナルまたはバックグラウンドシグナルをフィルタリングすることが容易であり、それらは通常、サイクルを通して同じ場所で生じないが、実際の組み込みは同じ場所で生じる。また、特定の伸長された分子に属するシグナルは、一連の画素を通して直線によって追跡され得るため、決定することも容易である。 Current optical sequencing methods require an image processing step to extract the sequence signal from the image. This usually involves extracting the relevant signal from each frame of the image. In one embodiment, an alternative is to capture the signal vertically through every cycle from every pixel and calculate the array using an algorithm. One advantage of this approach is that when the signal trajectory is viewed vertically throughout the cycle, it is easier to filter out non-specific or background signals, which usually occur at the same location throughout the cycle. No, but the actual integration happens at the same place. The signal belonging to a particular elongated molecule is also easy to determine, as it can be traced by a straight line through a series of pixels.

脂質不動態化
ナノ流体チャネルの表面で脂質二重層(LBL)を生成する場合、本発明者らは、蛍光顕微鏡でのLBL形成の観察を可能にするために添加される1%のリサミン(商標)ローダミンB 1,2-ジヘキサデカノイル-sn-グリセロ-3-ホスホエタノールアミン、トリエチルアンモニウム塩(ローダミン-DHPE)脂質を含む、両性イオンPOPC(1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン)脂質を使用した。各コーティング手順の前に、直径が約70nmの脂質小胞を押し出しによって作製した(ESIを参照)。押し出した小胞溶液を、流体系のマイクロチャネルの1つを通してフラッシュした。続いて、脂質小胞が表面に沈降し、破裂し、LBLのパッチを形成し、数分以内に連続的なLBLへと繋がり、マイクロチャネル全体をコーティングする。その後、脂質小胞の流れがコーティングされたマイクロチャネル内で維持されている間、LBLがナノチャネル内に自発的に拡散し、小胞の安定した供給を確保する。コーティングプロセスの間、ナノチャネルを通して対向流(約80μm/秒)が、コーティングされたマイクロチャネルに課され、ナノチャネル内のいかなる破片または小胞を回避する。少し速い代替の方法も試験され、ナノチャネルを通して、LBLでコーティングされたマイクロチャネルから、脂質小胞をフラッシュすることを伴い、ナノチャネル内の脂質小胞の沈降および破裂がもたらされた。しかしながら、この方法では、小胞および他の残渣が堆積し、ナノチャネルが潜在的に遮断されるのを防止するように注意を払う必要がある。
Lipid Passivation When generating lipid bilayers (LBLs) on the surface of nanofluidic channels, we used 1% Lissamine™, which is added to allow observation of LBL formation in a fluorescence microscope. ) Rhodamine B 1,2-dihexadecanoyl-sn-glycero-3-phosphoethanolamine, triethylammonium salt (rhodamine-DHPE) zwitterionic POPC (1-palmitoyl-2-oleoyl-sn-glyceroyl) containing lipids -3-phosphocholine) lipids were used. Prior to each coating procedure, lipid vesicles with a diameter of approximately 70 nm were made by extrusion (see ESI). The extruded vesicle solution was flushed through one of the microchannels of the fluidics system. Subsequently, lipid vesicles settle to the surface, burst, form patches of LBLs, and within minutes connect into continuous LBLs, coating the entire microchannel. The LBL then diffuses spontaneously into the nanochannel, ensuring a steady supply of vesicles, while the flow of lipid vesicles is maintained within the coated microchannel. During the coating process, a countercurrent flow (approximately 80 μm/sec) is imposed on the coated microchannels through the nanochannels to avoid any debris or vesicles within the nanochannels. A slightly faster alternative method was also tested, which involved flushing lipid vesicles from an LBL-coated microchannel through the nanochannel, resulting in sedimentation and rupture of the lipid vesicles within the nanochannel. However, with this method, care must be taken to prevent vesicles and other debris from accumulating and potentially blocking the nanochannels.

エピマーキング試薬および標識方法
ポリヌクレオチド上のゲノム修飾またはエピジェネティック修飾(Epi-Marks)は、本発明の方法を使用して検出され得る。本明細書における焦点は、ヒトにおいて5-メチルシトシンの形態で、通常、CpGモチーフの文脈で生じるゲノムDNA上のメチル基への結合である。しかしながら、同じ原理を、ヒドロキシルメチルCのような他の修飾、ならびに様々な種類のDNA損傷に適用することができる。RNA上の修飾は、同様に標識することができる。1つ以上の種類の異なる数の修飾(オリゴヌクレオチド合成には、様々な修飾が利用可能である)を含むtrRNAaなどの合成DNAおよびRNAならびにRNAモデルは、商業ベンダー(例えば、IDT、Trilink)から得ることができる。DNAの場合、ゲノムメチルCに対する抗体(Diagenodeなどから入手可能)、メチル結合タンパク質1(MBD1)、およびMBD1のペプチド断片(いずれもAbcamから)の親和性結合を、試験し、最適化することができる。RNAの場合、メチルアデノシン(m6A)(Abcamから入手可能)およびm7G-cap(対照として)(SySy.comから入手可能)に対する抗体などの抗体を、試験し、最適化することができる。これらの修飾を含むDNAまたはRNAへの結合の効率は、2つのメトリックを用いて測定することができる。まず、親和性試薬の、オリゴヌクレオチド配列の修飾および非修飾バージョンへの結合、ならびにDNAおよびRNAのバージョンの両方に対する結合は、例えば、濾紙上でのスポッティングおよび結合を使用して試験することができる。標的修飾を含むか、非標的修飾を含むか、または修飾を含まない、いずれかの合成オリゴヌクレオチドに対する各抗体の結合の効率および特異性を確立することができる。抗メチル抗体については、ゲノムDNAをインサイツで変性させることが好ましい。
Epi-Marking Reagents and Labeling Methods Genomic or epigenetic modifications (Epi-Marks) on polynucleotides can be detected using the methods of the invention. The focus here is on binding in the form of 5-methylcytosine in humans to methyl groups on genomic DNA that normally occur in the context of CpG motifs. However, the same principle can be applied to other modifications such as hydroxylmethyl C, as well as various types of DNA damage. Modifications on RNA can be similarly labeled. Synthetic DNA and RNA such as trRNA and RNA models containing one or more types and different numbers of modifications (various modifications are available for oligonucleotide synthesis) are available from commercial vendors (e.g. IDT, Trilink). Obtainable. For DNA, the affinity binding of antibodies to genomic methyl C (available from Diagenode, etc.), methyl-binding protein 1 (MBD1), and peptide fragments of MBD1 (all from Abcam) can be tested and optimized. can. For RNA, antibodies such as antibodies to methyladenosine (m6A) (available from Abcam) and m7G-cap (as a control) (available from SySy.com) can be tested and optimized. The efficiency of binding to DNA or RNA containing these modifications can be measured using two metrics. First, binding of affinity reagents to modified and unmodified versions of the oligonucleotide sequence, and to both DNA and RNA versions, can be tested using, for example, spotting and binding on filter paper. . The efficiency and specificity of binding of each antibody to synthetic oligonucleotides, either containing targeted, non-targeted, or no modifications, can be established. For anti-methyl antibodies, it is preferred to denature the genomic DNA in situ.

局所的な枯渇と層流の軽減効果
プローブ溶液の効率的な混合または撹拌を確実に行うことによって、プローブの局所的な枯渇に対処することができる。これは、乱流を生成する粒子を溶液中に含ませることによって、および/または乱流を生成するフローセル(例えば、1つ以上の表面上のヘリンボーンパターン)を構築することによって、音響波を使用して行うことができる。加えて、フローセル内の層流のため、典型的には、混合がほとんどなく、表面に近い溶液は、バルク溶液とほとんど混合されない可能性がある。これにより、表面近くにある試薬/結合プローブを除去し、表面に新鮮な試薬/プローブをもたらす上で問題が発生する。これに対処するために、上記の乱気流生成アプローチを実施することができ、かつ/または表面での大規模な流体の流れ/交換を行うことができる。1つのアプローチは、標的分子を整列させた後、表面に非蛍光ビーズまたはスフィアを付着させ、表面のランドスケープを粗い質感にして、表面近くの流体をより効果的に混合および/または交換するのに必要な渦および流れを生成する。
Local Depletion and Mitigation Effects of Laminar Flow Local depletion of the probe can be addressed by ensuring efficient mixing or agitation of the probe solution. It uses acoustic waves by including turbulence-generating particles in the solution and/or by constructing a turbulence-generating flow cell (e.g., a herringbone pattern on one or more surfaces). can be done by In addition, due to laminar flow within the flow cell, there is typically little mixing, and the solution near the surface may be poorly mixed with the bulk solution. This creates problems in removing reagents/bound probes near the surface and bringing fresh reagents/probes to the surface. To combat this, the turbulence generation approach described above can be implemented and/or large scale fluid flow/exchange at the surface can be performed. One approach is to attach non-fluorescent beads or spheres to the surface after aligning the target molecules, giving the surface landscape a rough texture for more effective mixing and/or exchange of fluids near the surface. Generate the required vortices and flows.

高速撮像
単一分子局在顕微鏡法(SMLM)は、高い光子計数に依存する。高い光子計数は、ガウスパターンのフルオロフォア生成の重心を決定することができる精度を向上させるが、高い光子計数の必要性は、長い画像の取得および明るく光安定なフルオロフォアへの依存性にも関連している。プロセスの速度は、高フレーム検出をプローブの濃度の増加と結合することによって増加し得る。しかしながら、高濃度の標識プローブは、高いバックグラウンド蛍光を引き起こす可能性があり、これは表面上のシグナルの検出を曖昧にする可能性がある。これは、表面に形成される二重鎖を標識するためのDNA染色剤または挿入色素を使用することによって対処することができる。色素は、標的が一本鎖の場合は挿入されず、一本鎖プローブにも挿入されないが、それらの間に二重鎖が形成された場合に挿入される。一部の実施形態では、プローブは、標識されておらず、検出されるシグナルは、挿入色素のみに起因する。一部の実施形態では、プローブは、挿入色素またはDNA染色剤に対するFRETパートナーとして機能する標識で標識される。挿入色素は、ドナーであり得、異なる波長のアクセプターと結合され得、したがって、プローブを複数のフルオロフォアでコードすることが可能になる。
High speed imaging Single molecule localization microscopy (SMLM) relies on high photon counts. High photon counts improve the accuracy with which the centroid of fluorophore generation of Gaussian patterns can be determined, but the need for high photon counts is also compromised by long image acquisitions and reliance on bright, photostable fluorophores. Related. The speed of the process can be increased by combining high-frame detection with increasing concentrations of probe. However, high concentrations of labeled probe can cause high background fluorescence, which can obscure the detection of signal on the surface. This can be addressed by using DNA stains or intercalating dyes to label the duplexes formed on the surface. The dye does not intercalate when the target is single-stranded, nor does it intercalate with the single-stranded probe, but it does intercalate when a duplex is formed between them. In some embodiments, the probe is unlabeled and the detected signal is due solely to the intercalating dye. In some embodiments, probes are labeled with intercalating dyes or labels that function as FRET partners to DNA stains. The intercalating dye can be a donor and can be conjugated with acceptors of different wavelengths, thus allowing the probe to be encoded with multiple fluorophores.

さらなる実施例
ポリヌクレオチド上のエピマークの場所の検出
Further Examples Detection of Epimark Locations on Polynucleotides

任意選択的に、オリゴ結合プロセスの前(または、時にはその後またはその間)に、エピゲノム結合試薬の一過的な結合が行われる。どの結合試薬が使用されるかに応じて、結合は、変性の前または後に行われる。一部の実施形態では、抗メチルC抗体結合は、変性DNA上で行われるが、メチル結合タンパク質の場合、任意の変性ステップの前に、二本鎖DNA上で結合が行われる。 Optionally, transient binding of epigenome binding reagents occurs prior to (or sometimes after or during) the oligo binding process. Conjugation is performed before or after denaturation, depending on which binding reagent is used. In some embodiments, anti-methyl C antibody binding is performed on denatured DNA, whereas for methyl binding proteins, binding is performed on double-stranded DNA prior to any denaturation step.

ステップ1-メチル結合試薬の一過的な結合。 Step 1—Transient attachment of methyl binding reagent.

変性後、フローセルをPBS洗浄でフラッシュし、Cy3B標識抗メチル抗体3D3クローン(Diagenode)を一過性タンパク質結合試薬中に添加し、結合を撮像する。 After denaturation, the flow cell is flushed with a PBS wash, Cy3B labeled anti-methyl antibody 3D3 clone (Diagenode) is added in the transient protein binding reagent and binding is imaged.

代替的に、変性の前に、フローセルをリン酸緩衝生理食塩水でフラッシュし、Cy3B標識MBD1を添加し、一過性タンパク質結合試薬中で撮像する。一過的なオリゴ結合についての撮像は、上に記載のように行われる。 Alternatively, prior to denaturation, the flow cell is flushed with phosphate-buffered saline, Cy3B-labeled MBD1 is added, and imaged in a transient protein binding reagent. Imaging for transient oligo binding is performed as described above.

一過性結合緩衝液は、pH2.8での溶出緩衝液である。典型的な溶出緩衝液は、50mMのHEPES(pH7.9)、0.1MのNaCl、1.5mMのMgCl2、0.05%のTritonX-10を含む。一過的な相互作用はまた、0.2%のSDSおよび0.1%のTween-20で、室温で7分行うことができる。さらに、DNAとの一過的なタンパク質相互作用は、0.1MのグリシンHCl、pH2.5~3で行うことができる。この緩衝液は、タンパク質構造に永久的に影響を与えることなく、ほとんどのタンパク質または抗体の結合相互作用を効果的に解離する。しかしながら、いくつかの抗体およびタンパク質は、低いpHによって損傷されるため、溶出されたタンパク質画分を、1/10容量のアルカリ性緩衝液(1MのTris.HCl、pH8.5またはPBS緩衝液など)を添加することによって、直ちに中和することが最良である。 The transient binding buffer is the elution buffer at pH 2.8. A typical elution buffer contains 50 mM HEPES (pH 7.9), 0.1 M NaCl, 1.5 mM MgCl2, 0.05% Triton X-10. A transient interaction can also be performed with 0.2% SDS and 0.1% Tween-20 for 7 minutes at room temperature. Additionally, transient protein interactions with DNA can be performed in 0.1 M glycine HCl, pH 2.5-3. This buffer effectively dissociates most protein or antibody binding interactions without permanently affecting protein structure. However, some antibodies and proteins are damaged by low pH, so the eluted protein fraction was washed with 1/10 volume of alkaline buffer (such as 1 M Tris.HCl, pH 8.5 or PBS buffer). It is best to neutralize immediately by adding

一部の実施形態では、結合用にPBSが使用され、一過的な結合ではなく、安定した結合が検出され、場所が記録される。 In some embodiments, PBS is used for binding and stable binding rather than transient binding is detected and location recorded.

ステップ2-メチル結合試薬の除去 Step 2—Removal of Methyl Binding Reagent

典型的には、エピ分析は配列決定の前に行われ、したがって、任意選択的に、メチル結合試薬は、配列決定を開始する前に、ポリヌクレオチドの前にフラッシュ除去される。これは、複数のサイクルのPBS/PBSTおよび/または高塩もしくは溶出緩衝液およびSDSを流すことによって、次いで、除去が生じたことを撮像で確認することによって、行うことができる。無視できる量を超える結合試薬が残存していることが明らかな場合、カオトロピック塩、GuCLなどのより厳密な処理剤を流して、残った試薬を除去することができる。 Typically, epi-analysis is performed prior to sequencing, so optionally, methyl binding reagents are flashed off prior to polynucleotides prior to initiating sequencing. This can be done by running multiple cycles of PBS/PBST and/or high salt or elution buffer and SDS followed by imaging to confirm that removal has occurred. If it is evident that more than a negligible amount of binding reagent remains, a more stringent treatment such as chaotropic salts, GuCL can be run through to remove the remaining reagent.

ステップ3-データ相関
配列決定およびエピゲノミクスデータが得られた後、配列決定の結合場所の場所間で相関を行い、エピ結合場所を相関させて、メチル化またはオミック情報の配列文脈を提供する。
Step 3—Data Correlation After sequencing and epigenomics data are obtained, correlations are performed between sequencing binding sites to correlate epibinding sites to provide sequence context for methylation or omic information.

RNAの調製
ポリRNAを、表面に付着したオリゴdT(0.1~1uM)にハイブリダイズさせる。オリゴdTは、1つ以上のソラレン残基を含み、これにより、RNAをオリゴdTに架橋させる。次いで、RNAが所定の位置に固定されると、RNAは、流体の流れ、後退メニスカス、または変性溶液中で電気泳動的に伸展され、ny二次構造を開放するのに役立つ。RNAが伸展または伸長されると、本発明のオリゴ結合アプローチが適用される。
Preparation of RNA Poly RNA is hybridized to surface-attached oligo dT (0.1-1 uM). Oligo-dT contains one or more psoralen residues, which cross-link RNA to oligo-dT. Once the RNA is anchored in place, it is then electrophoretically stretched in fluid flow, a receding meniscus, or a denaturing solution to help release the ny secondary structure. Once the RNA is stretched or elongated, the oligo-ligation approach of the present invention is applied.

ローリングサークル増幅を使用した長ssDNAの調製
二本鎖DNA標的を環状化し、次いでローリングサークル増幅を行い、二重鎖の一方のタンデム一本鎖コピーを生成する。dsDNAは、T4 DNAポリメラーゼ1(Roche)およびdNTP(Promega)を使用することによって研磨される。T4ポリヌクレオチドキナーゼは、5’ヒドロキシル基をリン酸化する。次いで、ステムループ(8~200塩基のdT:dAステム、ループはGGTTTTTCGCCCTTTCACGTTGGAを含む)を、T4 DNAリガーゼを使用して、研磨されたDNAの両方の末端にライゲーションする。プライミングは、ニックから、またはステムループ内で結合するプライマーから起こり得る。
Preparation of Long ssDNA Using Rolling Circle Amplification A double-stranded DNA target is circularized and then subjected to rolling circle amplification to generate tandem single-stranded copies of one side of the duplex. dsDNA is polished by using T4 DNA polymerase 1 (Roche) and dNTPs (Promega). T4 polynucleotide kinase phosphorylates the 5' hydroxyl group. The stem-loop (8-200 base dT:dA stem, loop contains GGTTTTTCGCCCTTTCACGTTGGA) is then ligated to both ends of the polished DNA using T4 DNA ligase. Priming can occur from a nick or from a primer that binds within the stem-loop.

ローリングサークル増幅は、プライマーを使用して環状一本鎖標的上で行うこともでき、例えば、1μLの1nMのM13mp18鋳型(NEB)を以下のプロトコルで増幅することができる。プロトコルは、両端に結合したステムループを用いて、二本鎖DNAに適用することもできる。この場合、10μLの10×反応緩衝液(10×phi29 DNAポリメラーゼ緩衝液(B7020、Enzymatics、500mMのTris-HCl、100mMの(NH4)2SO4、40mMのDTT、100mMのMgCl2、pH7.5)、2.5μLの100nMのプライマー(TCCAACGTCAAAGGGCGAAAAACC、IDT)、および1.6μLのdNTPミックス(Enzymatics N2050L)を、水で48μLの体積にする。混合物を95℃で1分間、次いで、60℃で1分間インキュベートし、次いで、4℃にする。混合物を氷上に置き、2μLのphi29 DNAポリメラーゼ(10U/μL、Enzymatics P7020-LC-L)を添加する。混合物全体を、次いで、30℃で4時間インキュベートし、次いで、4℃にし、450μLの1×PBS(pH7.4)で希釈した。次いで、回収した溶液を、PBS中で100倍希釈する。配列決定の前に、保存溶液を、相補的配列(GGTTTTTCGCCCTTTGACGTTGGA,IDT)を含む表面にローリングサークルアンプリコンを添加し、アンプリコンが、その長さに沿った複数の相互作用を介して固定化されるようにする。 Rolling circle amplification can also be performed on circular single-stranded targets using primers, eg, 1 μL of 1 nM M13mp18 template (NEB) can be amplified with the following protocol. The protocol can also be applied to double-stranded DNA with stem-loops attached at both ends. In this case, 10 μL of 10× reaction buffer (10× phi29 DNA polymerase buffer (B7020, Enzymatics, 500 mM Tris-HCl, 100 mM (NH4)2SO4, 40 mM DTT, 100 mM MgCl2, pH 7.5), 2 .5 μL of 100 nM primer (TCCAACGTCAAAGGGCGAAAAACC, IDT), and 1.6 μL of dNTP mix (Enzymatics N2050L) are brought to a volume of 48 μL with water.The mixture is incubated at 95° C. for 1 minute and then at 60° C. for 1 minute. and then brought to 4° C. Place the mixture on ice and add 2 μL of phi29 DNA polymerase (10 U/μL, Enzymatics P7020-LC-L) The whole mixture is then incubated at 30° C. for 4 hours and then , brought to 4° C. and diluted with 450 μL of 1×PBS (pH 7.4).The recovered solution is then diluted 100-fold in PBS.Before sequencing, the stock solution was added to the complementary sequence (GGTTTTTCGCCCTTTGACGTTGGA, A rolling circle amplicon is added to a surface containing IDT) such that the amplicon becomes immobilized via multiple interactions along its length.

代替的に、一本鎖オーバーハングを有する二本鎖DNAは、MES緩衝液 pH5.5で、オーバーハングの曝露された塩基と表面との間の疎水性相互作用を介してビニルシラン表面に付着する。次いで、緩衝液を変性緩衝液(0.5M~1MのNaOH)と交換し、固定化されていない鎖をフラッシュ除去され得るように数回の洗浄を行う。次いで、カバーガラスを再びMESに曝露し、DNAを後退メニスカスによって伸長させる。同様に、DNAの末端は修飾され得、例えば、ターミナルトランスフェラーゼ(NEB)によって、ホモポリマーテールを付加することができ、DNAは、次いで、相補ホモポリマーオリゴヌクレオチド上で捕捉することができる。次いで、二本鎖DNAの非捕捉鎖は、熱変性および/もしくは化学変性を使用して、または鎖を分離するヘリカーゼ(例えば、Hel308)などのモータータンパク質を使用することによって融解され得る。このため、ホンポリマーのテールは数十~数百ヌクレオチドであり得、捕捉プローブは同様に長くてもよい。代替的に、他方の鎖が変性している間、テール付加された鎖を所定の位置に保持するための架橋試薬が提供される。テール付加されたDNAはまた、二重らせんの2つの鎖を連結するために、ステムループで他端にライゲーションすることができ、その結果、DNAが捕捉されると、DNAの両方の鎖が配列決定され得る。この場合、一過性結合緩衝液は、LNA残基を含む一過的に結合するオリゴとの相互作用と比較して、二重鎖の塩基対を弱めるように(その再形成を防止し、したがって、オリゴの結合を妨げるように)構成される。 Alternatively, double-stranded DNA with single-stranded overhangs attaches to vinylsilane surfaces in MES buffer pH 5.5 via hydrophobic interactions between the exposed bases of the overhangs and the surface. . The buffer is then exchanged with a denaturing buffer (0.5 M to 1 M NaOH) and several washes are performed so that non-immobilized strands can be flashed off. The coverslip is then exposed to MES again and the DNA is elongated by the receding meniscus. Similarly, the ends of the DNA can be modified to add homopolymeric tails, eg, by terminal transferase (NEB), and the DNA can then be captured on complementary homopolymeric oligonucleotides. The uncaptured strand of double-stranded DNA can then be melted using heat and/or chemical denaturation or by using a motor protein such as a helicase (eg, Hel308) to separate the strands. Thus, the tail of the phone polymer can be tens to hundreds of nucleotides and the capture probe can be similarly long. Alternatively, a cross-linking reagent is provided to hold the tailed strand in place while the other strand is denatured. Tailed DNA can also be ligated at the other end with a stem-loop to join the two strands of the duplex, so that when the DNA is captured, both strands of the DNA are aligned. can be determined. In this case, the transient binding buffer is designed to weaken the base pairing of the duplex (preventing its reformation, Therefore, it is configured to prevent binding of oligos).

NNNXNNNオリゴヌクレオチド種の核酸への結合
NNNXNNN(式中、Nは縮重位置であり、Xは指定された位置である)を使用した配列決定の場合、4つのオリゴヌクレオチドライブラリ5’NNNANNN3’、5’NNNCNNN3’、5’NNNGNNN3’,および5’NNNANNN3’の各々を、それぞれ、Atto488、Atto542、Alexa594、およびAtto655で差次的に標識し、各々100nM~1uMの濃度で、2.4~3.5MのTMAClまたは4×SSCおよび0.01~0.1%のTween20を含む15ulの液滴に組み合わせ、核酸分子が伸長または伸展された表面に適用する。カバーガラスは、エポキシ、カウガム、またはネイルワニスを使用してスライドガラスに密封される。カバーガラスは、Olympus 1X81倒立顕微鏡の顕微鏡IX2ノーズピース上に配置され、4つの組み合わせられたレーザ線(Agilent)、488nm、532nm、590、および640nmを使用して、クワッドバンドTIRFフィルタキューブ(Chroma)および1.45NA Olympus TIRF対物レンズを介して試料を同時に照射する。任意選択的に、光ファイバスクランブラ(点源)を使用して、ビームを均一化する。レーザ出力は、40~150mWの各波長で調整され、同等のシグナルの輝度が得られる。TIRF角度も調整され、照明チャネルの各々について最適なコントラスト画像が得られる。放射は、95B Scientific CMOSカメラ(Photometrics)に投影される前に、クワッドビュー(Quad-view)デバイス(Photometrics)の4つの象限に分割される。代替的に、4つの色素の4つの発光波長は、一連のダイクロイックミラーおよび反射ミラーを使用して複数のカメラに分割される。カメラの設定は、レーザ出力とともに調整されて、各色素についてほぼ等価のシグナル強度が得られるが、収集された結合情報はデジタルであるため、4つの色素からのシグナルの輝度は正確に等価である必要はない。各シグナルの特定は、クワッドビュー象限または複数のカメラの異なる発光チャネルにおける各色素の発光プロファイルを考慮に入れることによって、ソフトウェアによって決定される。次いで、以前に決定された発光プロファイルを使用して、色素の同一性を決定することができる。
Binding of NNNXNNN Oligonucleotide Species to Nucleic Acids For sequencing using NNNXNNN, where N is a degenerate position and X is a designated position, four oligonucleotide libraries 5′NNNANN3′, 5 Each of 'NNNCNNN3', 5'NNNGNNN3', and 5'NNNANNN3' was differentially labeled with Atto488, Atto542, Alexa594, and Atto655, respectively, and 2.4-3. A 15 ul drop containing 5 M TMACl or 4×SSC and 0.01-0.1% Tween 20 is combined and applied to the surface on which the nucleic acid molecules are stretched or stretched. Coverslips are sealed to glass slides using epoxy, cow gum, or nail varnish. Coverslips were placed on the microscope IX2 nosepiece of an Olympus 1X81 inverted microscope and a quad-band TIRF filter cube (Chroma) using four combined laser lines (Agilent), 488 nm, 532 nm, 590, and 640 nm. and illuminate the sample simultaneously through a 1.45 NA Olympus TIRF objective. Optionally, a fiber optic scrambler (point source) is used to homogenize the beam. The laser power is adjusted at each wavelength from 40 to 150 mW to obtain comparable signal brightness. The TIRF angle is also adjusted to obtain optimal contrast images for each of the illumination channels. The radiation is divided into four quadrants on a Quad-view device (Photometrics) before being projected onto a 95B Scientific CMOS camera (Photometrics). Alternatively, the four emission wavelengths of the four dyes are split to multiple cameras using a series of dichroic and reflective mirrors. The camera settings are adjusted along with the laser power to give approximately equivalent signal intensities for each dye, but because the binding information collected is digital, the intensity of the signals from the four dyes are exactly equivalent. No need. The identity of each signal is determined by the software by taking into account the emission profile of each dye in different emission channels of quad view quadrants or multiple cameras. The previously determined emission profile can then be used to determine the identity of the dye.

任意選択的に、1nMのYOYO-1または類似の挿入色素も反応混合物に添加され、最大1uMの高濃度のオリゴが使用され、カメラの高フレームレートと組み合わされる。ここでは、単一の488nmレーザのみを使用して、FRET機構を介して、4つの色素を励起させる。 Optionally, 1 nM YOYO-1 or similar intercalating dye is also added to the reaction mixture, and high concentrations of oligos up to 1 uM are used, combined with the high frame rate of the camera. Here, only a single 488 nm laser is used to excite the four dyes via a FRET mechanism.

任意選択的に、基準マーカーとして、1uMのDNA折り紙グリッドとともにDNA PAINT撮像剤もまた、15ul混合物の一部として添加される。 Optionally, a DNA PAINT imaging agent is also added as part of the 15ul mixture along with a 1uM DNA origami grid as a fiducial marker.

撮像データは、超解像画像処理パッケージ、例えば、ImageJ/FijiまたはPicassoへのプラグインであるThunderstorm(J.Schnitzbauer*, M.T.Strauss*,T.Schlichthaerle,F.Schueder,R.Jungmann Super-Resolution Microscopy with DNA-PAINT.Nature Protocols(2017).12:1198-1228 DOI:https://doi.org/10.1038/nprot.2017.024)を使用して処理される。 The imaging data were processed using a super-resolution image processing package such as ImageJ/Fiji or Thunderstorm (J. Schnitzbauer*, M.T. Strauss*, T. Schlichthaerle, F. Scheder, R. Jungmann Super) which is a plug-in to Picasso. -Resolution Microscopy with DNA-PAINT.Nature Protocols (2017).12:1198-1228 DOI: https://doi.org/10.1038/nprot.2017.024).

次いで、超解像画像を処理して、核酸鎖に沿った結合位置の座標を見つけ、異なる定義されたヌクレオチドに対応する異なる色からのデータをコンパイルして、核酸鎖の各々の配列を再構築する。画像処理および配列アセンブリに関するより完全な情報については、PCTおよびその後継(offspring)に記載されている。 The super-resolution image is then processed to find the coordinates of the binding positions along the nucleic acid strand and the data from different colors corresponding to different defined nucleotides are compiled to reconstruct the sequence of each of the nucleic acid strands. do. More complete information on image processing and sequence assembly is provided in the PCT and its offspring.

ドリフト
最高の位置決定精度(例えば、数ナノメートルまたはサブナノメートル)を得るには、振動およびドリフト(例えば、熱変動によって引き起こされる)を制御することが重要である。ドリフトを防止するために、自動ステージを使用すべきではない。ステージが停止しているときでも、動きが残る場合が多く、数画素または数十画素のドリフトにつながるためである。基準マーカーは、ドリフトを補正するために使用することができる。蛍光標識されたラテックス粒子とともに、金粒子または銀粒子、半導体ナノ結晶、ナノダイヤモンドは、特に好ましいナノ粒子標識である。これらは、高い量子効率(QE)で光を放出し、高い光安定性、長い蛍光寿命(17ns)を有し(光散乱/自家蛍光(1~2ns)の時間ゲートに使用することができる)、小さい(例えば、40nm)場合がある。
Drift To obtain the highest positioning accuracy (eg, nanometer or sub-nanometer), it is important to control vibration and drift (eg, caused by thermal fluctuations). To prevent drift, motorized stages should not be used. This is because motion often remains even when the stage is stopped, leading to a drift of several pixels or tens of pixels. Fiducial markers can be used to correct for drift. Gold or silver particles, semiconductor nanocrystals, nanodiamonds, along with fluorescently labeled latex particles are particularly preferred nanoparticle labels. They emit light with high quantum efficiency (QE), have high photostability, long fluorescence lifetime (17 ns) (can be used for time gating of light scattering/autofluorescence (1-2 ns)). , may be small (eg, 40 nm).

ドリフトは計算的に補正することもできる。ドリフト補正は、各動画の時間を通して各マーカーの位置を追跡し、検出されたすべてのマーカーの軌道を平均化して、画像の全体的に正しいドリフトを測定することを含む。また、Fiji/ThunderSTORM、ならびにMatLabには、妥当な効果があり、基準マーカーを必要とせず、むしろ自己相関によってドリフトを補正する固有のドリフト補正アルゴリズムがある。Nikon Ti顕微鏡には、Perfect Focusを有し、Olympusには、Zドリフト補償モジュール(IX3-ZDC2)がある。また、ドリフトを回避するためのローテク(low tech)方法は、試料ステージを対物レンズ(例えば、Olympus nosepieceステージ)に強固に取り付けることである。また、熱環境が十分に制御されている場合、ドリフトは、数分後に無視できるようになり、かつ/または安定化され得る。 Drift can also be corrected computationally. Drift correction involves tracking the position of each marker through the time of each movie and averaging the trajectories of all detected markers to measure the global correct drift of the image. Fiji/ThunderSTORM as well as MatLab also have inherent drift correction algorithms that are reasonably effective and do not require fiducial markers, but rather correct drift by autocorrelation. The Nikon Ti microscope has a Perfect Focus and the Olympus has a Z-drift compensation module (IX3-ZDC2). Also, a low tech way to avoid drift is to rigidly attach the sample stage to the objective lens (eg, the Olympus nosepiece stage). Also, if the thermal environment is well controlled, the drift may become negligible and/or stabilize after a few minutes.

DNA折り紙、100nm金ナノ粒子、(Sigma Aldrich、緩衝液C中に10nM、撮像前に添加する)、100nMのTetrasppeckビーズ(Thermofisher)またはナノダイヤモンドを、ドリフトおよび整列のマーカーとして使用することができる。Photometrics Prime 95Bなどの既製カメラは、粒子追跡機能を備え、基準マーカーを焦点に合わせるために使用することができる。 DNA origami, 100 nm gold nanoparticles, (Sigma Aldrich, 10 nM in buffer C, added before imaging), 100 nM Tetrasppeck beads (Thermofisher) or nanodiamonds can be used as drift and alignment markers. An off-the-shelf camera, such as the Photometrics Prime 95B, with particle tracking capabilities, can be used to bring the fiducial markers into focus.

別の場合、焦点位置のドリフトは、カスタムビルドの焦点安定化によって排除され得る。近赤外線レーザ(LP785-SF20、Thorlabs)は、カバースライドおよび試料のガラス-水界面から完全に内部反射された。ビーム位置は、CMOSカメラ(UI-3240CP-NIR-GL,Imaging Development Systems,Obersulm,Germany)で監視される。LabVIEW 2015(National Instruments)に実装されたフィードバック制御は、レーザスポットの画像と参照画像の相互相関を最大化した。200msごとに軸方向の試料位置を調整する(P737.2SL and E-709.SRG,Physikalische Instrumente)。試料と対物レンズを、23℃に安定させる(H101-CRYO-BL安定化ユニット、H101-MINI試料チャンバーおよびOKO-MOC対物レンズ安定化を有する、Okolab、Ottaviano,Italy)。 Alternatively, focus position drift can be eliminated by custom-built focus stabilization. A near-infrared laser (LP785-SF20, Thorlabs) was completely internally reflected from the cover slide and the glass-water interface of the sample. The beam position is monitored with a CMOS camera (UI-3240CP-NIR-GL, Imaging Development Systems, Obersulm, Germany). Feedback control implemented in LabVIEW 2015 (National Instruments) maximized the cross-correlation between the image of the laser spot and the reference image. Adjust the axial sample position every 200 ms (P737.2SL and E-709.SRG, Physikalische Instrumente). Samples and objectives are stabilized at 23° C. (Okolab, Ottaviano, Italy, with H101-CRYO-BL stabilization unit, H101-MINI sample chamber and OKO-MOC objective stabilization).

退色、三重状態、および光損傷を最小化するためのシステム
オリゴヌクエルチドを標識するために使用される色素に応じて、以下の試薬が有効である:
(a)ピラノースオキシダーゼ、カタラーゼ、グルコース、(b)プロトカテク酸-ジオキシゲナーゼ、3,4-プロトカテク酸、(c)カタラーゼ、グルコースオキシダーゼ、スクロースまたはグルコース(高安定性の商用バージョンのFluMaXx(Hypermol)が利用可能)。
(d)メチレンブルーおよびジチオトロール(DTT)、(e)βメルカプトエタノール、TCEP、またはジチオトロール(DTT)を含む還元剤、(f)Trolox、1,3,5,7シクロオクタテトラエン、および/または4-ニトロベンジルアルコールを含む三重状態消光剤/蛍光促進剤。
Systems for Minimizing Bleaching, Triple State, and Photodamage Depending on the dye used to label the oligonucleotides, the following reagents are effective:
(a) pyranose oxidase, catalase, glucose, (b) protocatechuate-dioxygenase, 3,4-protocatechuate, (c) catalase, glucose oxidase, sucrose or glucose (a highly stable commercial version of FluMaXx (Hypermol) is Available).
(d) methylene blue and dithiotrol (DTT), (e) reducing agents including β-mercaptoethanol, TCEP, or dithiotrol (DTT), (f) Trolox, 1,3,5,7 cyclooctatetraene, and/or or triple-state quenchers/enhancers including 4-nitrobenzyl alcohol.

酸素スカベンジャーとして、ピラノースオキシダーゼ、カタラーゼ、グルコース(PO+C)は特に有効であり、以下のように調製される: As oxygen scavengers, pyranose oxidase, catalase, glucose (PO+C) are particularly effective and are prepared as follows:

PO+Cを、PO+C酸素スカベンジャーシステム(1×PO、1×C、0.8%のグルコース)で測定する前に、1×Troloxを添加して1時間インキュベートする。ストック溶液:100×PO溶液は、26mgのPO(P4234-250UN、Sigma-Aldrich Chemie GmbH、Taufkirchen,Germany)、684μLの酵素緩衝液からなり、100×C溶液は、1mlの酵素緩衝液中の2mgのカタラーゼからなる。両方を遠心分離で濾過し(Ultrafree MC-GV、Merck KGaA、Darmstadt,Germany;0.22μm)、液体窒素中で急速冷凍し、?80℃で保存した。100×Trolox溶液は、100mgのTrolox(Sigma-Aldrich 238813-1G)、430μLのメタノール、および3.2mLのH2O中の345μLのNaOH(1M)からなり、?20℃で保存した。 1× Trolox is added and incubated for 1 hour before PO+C is measured with a PO+C oxygen scavenger system (1×PO, 1×C, 0.8% glucose). Stock solution: 100×PO solution consists of 26 mg PO (P4234-250UN, Sigma-Aldrich Chemie GmbH, Taufkirchen, Germany), 684 μL enzyme buffer, 100×C solution consists of 2 mg in 1 ml enzyme buffer of catalase. Both were filtered by centrifugation (Ultrafree MC-GV, Merck KGaA, Darmstadt, Germany; 0.22 μm), flash frozen in liquid nitrogen and ? Stored at 80°C. The 100× Trolox solution consisted of 100 mg Trolox (Sigma-Aldrich 238813-1G), 430 μL methanol, and 345 μL NaOH (1M) in 3.2 mL H2O, ? Stored at 20°C.

蛍光標識は、標的DNAに光損傷を誘発し得る。これを最小化するために、上記の添加剤のうちの1つ以上を添加することに加えて、蛍光標識を標的DNAから分離することが有用である。これは、2つの方法の一方または両方で行われる。第1は、単純に、オリゴヌクレオチド種と蛍光標識との間にスペーサーを付加することである。18塩基長スペーサーをオリゴヌクレオチドプローブに付加することができ、標識がCy3Bである場合に有効である。第2の方法は、標識とオリゴヌクレオチドとの間にタンパク質シールドを添加することであり、その結果、オリゴヌクレオチドが標的ポリヌクレオチド/核酸に結合した場合、タンパク質は、基板上の核酸に対する酸化プロセスの影響を軽減するシールドとして機能する。多数のタンパク質をシールドとして使用することができ、1つの例は、ビオチン化オリゴヌクレオチド種に連結され得、かつ1つ以上の蛍光色素で標識され得るストレプトアビジンである。 Fluorescent labels can induce photodamage in target DNA. To minimize this, it is useful to separate the fluorescent label from the target DNA in addition to adding one or more of the above additives. This is done in one or both of two ways. The first is simply to add a spacer between the oligonucleotide species and the fluorescent label. An 18 base long spacer can be added to the oligonucleotide probe and is effective when the label is Cy3B. A second method is to add a protein shield between the label and the oligonucleotide, so that when the oligonucleotide binds to the target polynucleotide/nucleic acid, the protein is protected from oxidation processes to the nucleic acid on the substrate. Acts as a shield to reduce impact. Many proteins can be used as shields, one example is streptavidin, which can be linked to biotinylated oligonucleotide species and labeled with one or more fluorescent dyes.

大型エリアセンサー
長い分子のための大きな視野を得るために、多数の画素を有するカメラは、低倍率の対物レンズと連結されている。1200万の3.5ミクロン画素と低い電子ノイズを含むSony IMX253センサーを含むカメラを使用することができる。このセンサーは、高速データ転送のための10GigEインターフェースに接続されている(Emergent Vision Technologies(Canada)によるHR1200では、毎秒80フレームが可能である)。このカメラは、20×0.75NAのニコン対物レンズに連結されており、センサーの一軸に約2メガ塩基長の伸展されたDNAを撮像することができる。
Large Area Sensor To obtain a large field of view for long molecules, a camera with many pixels is coupled with a low magnification objective lens. A camera containing a Sony IMX253 sensor with 12 million 3.5 micron pixels and low electronic noise can be used. The sensor is connected to a 10 GigE interface for high speed data transfer (HR1200 by Emergent Vision Technologies (Canada) allows 80 frames per second). This camera is coupled to a 20×0.75 NA Nikon objective and can image stretched DNA approximately 2 megabases long in one axis of the sensor.

温度制御および試薬交換
温度制御および試薬交換は、CherryTemp(France)高速切り替えおよび正確な温度制御システム、ならびに固定され伸長/伸展された核酸および複数の試薬の入口および圧力駆動フローシステム(Elvesys、France)に接続された1つ以上の出口を含むカバーガラス上に結合された灌流チャンバーを含むシステムを使用して実施される。複数の試薬を送達するため、Elvesys圧力発生器パイプをスプリッター内に入れ、送達する試薬のチューブ内に圧力を加え、試薬をバルブ内に押し込み、次いで、バルブを切り替えて、キャピラリーチューブを介してフローセルに特定の試薬を送達する。流量センサーは、0~80ul/分の流速を測定し、必要な流速(例えば、10ul/分)の適切なレベルに圧力発生器を調節するためのフィードバックを提供するために、フローラインに統合される。
Temperature Control and Reagent Exchange Temperature control and reagent exchange are provided by the CherryTemp (France) fast switching and accurate temperature control system as well as fixed and stretched/extended nucleic acid and multiple reagent inlet and pressure driven flow systems (Elvesys, France). It is performed using a system that includes a perfusion chamber coupled onto a coverslip that includes one or more outlets connected to. To deliver multiple reagents, an Elvesys pressure generator pipe is placed into the splitter, applying pressure within the tubing of the reagents to be delivered, pushing the reagents into the valve, then switching the valve to the flow cell through the capillary tubing. deliver specific reagents to A flow sensor is integrated into the flowline to measure flow rates from 0-80 ul/min and provide feedback to adjust the pressure generator to the appropriate level for the required flow rate (eg, 10 ul/min). be.

本発明は、本明細書の教示および本明細書に列挙される参考文献に照らして、最も完全に理解される。本明細書内の実施形態は、本発明の実施形態の例示を提供し、本発明の範囲を限定すると解釈されるべきではない。当業者は、多くの他の実施形態が本発明によって包含されることを容易に認識する。当業者は、通常の実験のみを使用して、本明細書に記載の本発明の特定の実施形態と多くの均等物を認識するか、または確認することができるであろう。そのような均等物は、特許請求の範囲(下記)に包含されることが意図されている。 The invention is most thoroughly understood in light of the teachings herein and the references cited therein. The embodiments within the specification provide an illustration of embodiments of the invention and should not be construed as limiting the scope of the invention. The skilled artisan readily recognizes that many other embodiments are encompassed by the invention. Those skilled in the art will recognize, or be able to ascertain using no more than routine experimentation, many equivalents to the specific embodiments of the invention described herein. Such equivalents are intended to be covered by the claims (below).

追加の実施形態
1.単一ポリマー分子中のサブユニットの配列を識別するための方法であって、
i.ポリマーを固定化することと、
ii.ポリマーを、当該ポリマーのサブユニットを認識する分子プローブと接触させることと、
iii.分子プローブの結合部位を、位置決定することと、
iv.分子プローブの結合場所を決定することによって、サブユニットの場所を決定することと、を含む、方法。
Additional Embodiments 1 . A method for identifying sequences of subunits in a single polymer molecule comprising:
i. immobilizing the polymer;
ii. contacting the polymer with a molecular probe that recognizes a subunit of the polymer;
iii. locating the binding site of the molecular probe;
iv. determining the location of the subunit by determining the binding location of the molecular probe.

2.ステップ(ii)および(iii)を複数回反復することを含む、1に記載の方法。 2. 2. The method of 1, comprising repeating steps (ii) and (iii) multiple times.

3.同じ特異性のプローブを、複数回結合させることを含む、2に記載の方法。 3. 3. The method of 2, comprising binding probes of the same specificity multiple times.

4.(ii)の各反復において、異なる特異性の結合プローブを含む、2に記載の方法。 4. 3. The method of 2, wherein each iteration of (ii) comprises a bound probe of different specificity.

5.分子プローブを接触させることが、ポリマーとのプローブの複数の一過的な結合事象を含む、1に記載の方法。 5. 2. The method of Claim 1, wherein contacting the molecular probe comprises multiple transient binding events of the probe with the polymer.

6.単一標的ポリヌクレオチド上のヌクレオチド修飾および/または塩基を、配列決定するための方法であって、
i.ポリヌクレオチドを、表面またはマトリックス上に固定化することと、
ii.プローブがそれらの結合部位に一過的に結合する条件下で、1つ以上のプローブ種を添加することであって、かかる一過性は、複数のプローブが結合部位の各々に次々と結合することを可能にし、標的部位への結合が、非標的部位への結合から区別され得る(例えば、結合の持続時間の差によって)、添加することと、
iii.閾値数の結合事象が蓄積されているように、2D検出器上のポリヌクレオチドを、連続的に撮像し(または、複数のフレームを撮影し)、結合の画素座標を記録することと、
iv.iiのプローブを除去することと、
v.毎回、異なる1つ以上のプローブ種を用いて、ステップii~ivを反復することと、
vi.ステップiiiの各反復からのデータを、単一分子局在化アルゴリズムを使用してコンパイルして、プローブが持続的に結合する結合部位の各々のナノメトリックまたはサブナノメトリックな場所(例えば、結合部位への10以上の結合事象)を提供し、ナノメトリックな局在部位をプローブ種(例えば、特異的オリゴヌクレオチド配列または特異的抗体)の同一性と相関させることと、
vii.viを使用して、ナノメトリック場所の各々における結合種の順序(配列)を決定して、ポリヌクレオチドのヌクレオチド修飾および/または塩基配列をコンパイルすることと、を含む、方法。
6. A method for sequencing nucleotide modifications and/or bases on a single target polynucleotide, comprising:
i. immobilizing the polynucleotide on a surface or matrix;
ii. The addition of one or more probe species under conditions in which the probes bind transiently to their binding sites, such transient binding of multiple probes to each binding site in turn. allowing binding to target sites to be distinguished from binding to non-target sites (e.g., by differences in duration of binding), adding
iii. Continuously imaging (or taking multiple frames) the polynucleotide on the 2D detector such that a threshold number of binding events has accumulated and recording the pixel coordinates of the binding;
iv. removing the probe of ii;
v. repeating steps ii-iv using a different one or more probe species each time;
vi. The data from each iteration of step iii are compiled using a single-molecule localization algorithm to determine the nanometric or sub-nanometric location of each of the binding sites to which the probe persistently binds (e.g., 10 or more binding events of the
vii. determining the order (sequence) of binding species at each of the nanometric locations using vi to compile the nucleotide modification and/or base sequence of the polynucleotide.

7.伸長ならびに固定化することと、を含む、1および6に記載の方法。 7. 7. The method of 1 and 6, comprising extending and immobilizing.

8.各特異性のプローブの同一性が、既知であるか、または決定され得る、1に記載の方法。 8. 2. The method of 1, wherein the identity of the probes of each specificity is known or can be determined.

9.結合プローブが、オリゴヌクレオチドである、1および6に記載の方法。 9. 7. The method of 1 and 6, wherein the binding probe is an oligonucleotide.

10.結合プローブが、抗体、アフィボディ、アフィマー、ナノボディ、アプタマー、または核酸結合タンパク質である、1および6に記載の方法。 10. 7. The method of 1 and 6, wherein the binding probe is an antibody, affibody, affimer, nanobody, aptamer, or nucleic acid binding protein.

11.プローブ種が、区別され得る、6に記載の方法。 11. 7. The method of 6, wherein probe species can be distinguished.

12.結合が、空間的に解像可能なシグナルを介して検出される、1および6に記載の方法。 12. The method of 1 and 6, wherein binding is detected via a spatially resolvable signal.

13.空間的に解像可能なシグナルが、プローブ上の1つ以上の標識に起因する、12に記載の方法。 13. 13. The method according to 12, wherein the spatially resolvable signal results from one or more labels on the probe.

14.プローブの同一性が、コード化される、13に記載の方法。 14. 14. The method of 13, wherein the identity of the probe is encoded.

15.結合プローブが、認識配列の完全なレパートリー(例えば、64個の3塩基長、245個の4塩基長、1024個の5塩基長、または4096個の6塩基長)を含み、任意選択的に、追加の縮重塩基または普遍的塩基を含む、9に記載の方法。 15. the binding probe comprises a complete repertoire of recognition sequences (e.g., 64 3 bases long, 245 4 bases long, 1024 5 bases long, or 4096 6 bases long), optionally 10. The method of 9, including additional degenerate bases or universal bases.

16.単一標的ポリヌクレオチドが、染色体またはその一部分に由来する、6に記載の方法。 16. 7. The method of 6, wherein the single target polynucleotide is derived from a chromosome or portion thereof.

17.単一標的ポリヌクレオチドが、約10、10、10、10、10、10、10、10塩基長である、6に記載の方法。 17. 7. The method of 6, wherein the single target polynucleotide is about 10< 2 >, 10< 3 >, 10<4> , 10< 5 >, 10< 6 >, 10< 7 >, 10< 8 >, 10< 9 > bases in length.

18.単一標的ポリヌクレオチド分子を、ポリヌクレオチドの撹乱を最小化し、細胞、オルガネラ、染色体、ウイルス、エキソソーム、または体液/物質から、抽出することをさらに含む、6に記載の方法。 18. 7. The method of 6, further comprising extracting the single target polynucleotide molecule from cells, organelles, chromosomes, viruses, exosomes, or bodily fluids/substances with minimal disruption of the polynucleotide.

19.標的ポリマー/ポリヌクレオチド分子が、表面に固定化される、1および6に記載の方法。 19. 7. The method of 1 and 6, wherein the target polymer/polynucleotide molecule is immobilized on a surface.

20.標的ポリマー/ポリヌクレオチド分子が、ゲルまたはマトリックス中に配置される、1および6に記載の方法。 20. 7. The method of 1 and 6, wherein the target polymer/polynucleotide molecule is placed in a gel or matrix.

21.標的ポリマー/ポリヌクレオチド分子が、マイクロ流体チャネルまたはナノ流体チャネルに配置される、1および6に記載の方法。 21. 7. The method of 1 and 6, wherein the target polymer/polynucleotide molecule is placed in a microfluidic or nanofluidic channel.

22.標的ポリマー/ポリヌクレオチド分子が、実質的にインタクトである、1および6に記載の方法。 22. 7. The method of 1 and 6, wherein the target polymer/polynucleotide molecule is substantially intact.

23.配列が、標的ポリヌクレオチド分子の別のコピーまたは標的ポリヌクレオチド分子の参照配列を使用せずに決定される、6に記載の方法。 23. 7. The method of 6, wherein the sequence is determined without using another copy of the target polynucleotide molecule or a reference sequence of the target polynucleotide molecule.

24.二倍体または倍数体ゲノムのハプロタイプ解像配列決定(haplotype resolved sequencing)の方法であって、
i.2倍体/倍数体ゲノムの第1のハプロタイプを表す第1の標的ポリヌクレオチドを、1または6の方法を使用して配列決定することと、
ii.二倍体/倍数体ゲノムの第2のハプロタイプを表す第2の標的ポリヌクレオチドを、1または6の方法を使用して配列決定することと、
iii.倍数体ゲノムについて、請求項1または6に記載の方法を使用して、倍数体ゲノムのさらなるハプロタイプを表すさらなる標的ポリヌクレオチドを配列決定し、それによって、ゲノムの第1、第2、およびさらなるハプロタイプを決定することであって、第1および第2の標的ポリヌクレオチド、ならびにさらなる標的ポリヌクレオチドが、異なる相同染色体(染色体ホモログ)由来する、配列決定することと、を含む、方法。
24. A method for haplotype resolved sequencing of a diploid or polyploid genome comprising:
i. sequencing the first target polynucleotide representing the first haplotype of the diploid/polyploid genome using the method of 1 or 6;
ii. sequencing a second target polynucleotide representing a second haplotype of the diploid/polyploid genome using the method of 1 or 6;
iii. For polyploid genomes, the method of claim 1 or 6 is used to sequence further target polynucleotides representing further haplotypes of the polyploid genome, thereby sequencing the first, second and further haplotypes of the genome. and sequencing that the first and second target polynucleotides, as well as the additional target polynucleotides, are from different homologous chromosomes (chromosomal homologues).

25.長く連続した(long-contiguous)配列決定リードを取得する方法であって、
i.プローブ結合事象に基づいて、第1の短いリード(read)を得ることと、
ii.プローブ結合事象に基づいて、第1のリードに隣接する第2の短いリードを得ることと、
iii.プローブ結合事象に基づいて、第1または第2の短いリードに隣接するさらなる短いリードを得ることと、
iv.少なくとも2つの短いリードを一緒に繋ぎ合わせて、連続した長いリードを得ることと、を含む、方法。
25. A method of obtaining long-contiguous sequencing reads, comprising:
i. obtaining a first short read based on a probe binding event;
ii. obtaining a second short read adjacent to the first read based on the probe binding event;
iii. obtaining additional short reads that flank the first or second short reads based on probe binding events;
iv. splicing together at least two short reads to obtain a continuous long read.

26.ハプロタイプ解像配列決定のリードの一部が、各ホモログの別個のポリヌクレオチドから(例えば、複数の細胞から)得られる、25に記載の方法。 26. 26. The method of 25, wherein some of the haplotype-resolved sequencing reads are obtained from separate polynucleotides of each homologue (eg, from multiple cells).

27.1つ以上の参照配列を使用して場所を推測することによって、ナノメトリック位置決定または順序が容易になる、6に記載の方法。 27. The method of 6, wherein inferring location using one or more reference sequences facilitates nanometric localization or ordering.

28.標的ポリヌクレオチドが、ゲルまたはマトリックスと接触している、先行請求項に記載の方法。 28. The method of any preceding claim, wherein the target polynucleotide is in contact with a gel or matrix.

29.塩基配列決定が、塩基配列とは直交的なエピマーク(epi-mark)の標識によって、エピマークの分析(例えば、メチル化)と組み合わされる、1および10に記載の方法。 29. The method according to 1 and 10, wherein sequencing is combined with epi-mark analysis (eg methylation) by labeling of epi-marks orthogonal to the base sequence.

30.ポリマーの化学構造を決定する方法であって、ポリマーを伸長することと、伸長したポリマーに沿った複数の部位に、複数の時間的に解像可能な標識を結合することであって、複数の部位が、回折限界光学撮像によって解像可能ではない、結合することと、ナノメトリックまたはサブナノメトリックの正確度で、それらの場所を決定することと、を含む、方法。 30. A method of determining the chemical structure of a polymer comprising stretching the polymer and attaching multiple temporally resolvable labels at multiple sites along the stretched polymer, comprising: A method comprising: binding sites that are not resolvable by diffraction-limited optical imaging; and determining their location with nanometric or sub-nanometric accuracy.

31.一過的な結合が、能動的な解離(active unbinding)を含む、6に記載の方法。 31. 7. The method of 6, wherein transient binding comprises active unbinding.

32.結合が、安定した結合を含む、31に記載の方法。 32. 32. The method according to 31, wherein the binding comprises a stable binding.

33.能動的な解離が、プローブの熱、pHの変化、塩濃度の変化、化学的分解または生化学的分解を含む手段によって、結合を破壊することを含む、32に記載の方法。 33. 33. The method according to 32, wherein active dissociation comprises breaking the bond by means including heat, pH change, salt concentration change, chemical degradation or biochemical degradation of the probe.

34.結合および能動的解離が、均一反応における温度サイクルを使用して行われる、31に記載の方法。 34. 32. The method according to 31, wherein binding and active dissociation are performed using temperature cycling in a homogeneous reaction.

35.結合プローブが、(明細書に従って定義されている)別個の配列ビットに結合する、先行請求項に記載の方法。 35. A method according to any preceding claim, wherein the binding probes are bound to discrete sequence bits (defined according to the specification).

36.結合プローブが、ナノメトリック正確度および精度で局在化される、先行請求項に記載の方法。 36. The method of any preceding claim, wherein the bound probes are localized with nanometric accuracy and precision.

37.結合部位が、サブナノメトリック正確度および精度で位置決定される、先行請求項に記載の方法。 37. The method of any preceding claim, wherein the binding site is located with sub-nanometric accuracy and precision.

38.2つ以上の結合プローブが結合する2つ以上の配列ビットが、互いに対して超解像される、先行請求項に記載の方法。 38. A method according to any preceding claim, wherein two or more arrayed bits bound by two or more binding probes are super-resolved with respect to each other.

39.プローブが、直接標識される、1~38に記載の方法。 39. The method according to 1-38, wherein the probe is directly labeled.

40.プローブが、間接的に標識される、1~38に記載の方法。 40. The method according to 1-38, wherein the probe is indirectly labeled.

41.間接的に標識されたプローブが、標的結合ドメインおよび少なくとも1つの標識ドメインを含む、40に記載の方法。 41. 41. The method of 40, wherein the indirectly labeled probe comprises a target binding domain and at least one labeling domain.

42.当該標的結合ドメインが、少なくとも3個のヌクレオチドを含み、標的核酸に一過的に結合することができる、41に記載の方法。 42. 42. The method of 41, wherein said target binding domain comprises at least 3 nucleotides and is capable of transiently binding to a target nucleic acid.

43.当該標識ドメインが、標識される相補核酸分子に安定して結合することができる核酸配列を含む、41に記載の方法。 43. 42. The method according to 41, wherein said labeling domain comprises a nucleic acid sequence capable of stably binding a complementary nucleic acid molecule to be labeled.

44.プローブが、標的結合ドメインおよび複数の標識ドメインを含む、41に記載の方法。 44. 42. The method of 41, wherein the probe comprises a target binding domain and multiple labeling domains.

45.当該複数の標識ドメインが、各々、標識される相補核酸分子に安定して結合することができる核酸配列を含む、44に記載の方法。 45. 45. The method according to 44, wherein said plurality of labeling domains each comprises a nucleic acid sequence capable of stably binding a complementary nucleic acid molecule to be labeled.

46.各結合ドメインが、異なる配列を含む、44に記載の方法。 46. 45. The method according to 44, wherein each binding domain comprises a different sequence.

47.異なる各結合ドメインが、少なくとも3個のヌクレオチドのうちの1つに対応する、44に記載の方法。 47. 45. The method according to 44, wherein each different binding domain corresponds to one of the at least three nucleotides.

48.少なくとも3つのヌクレオチドのうちの1つの同一性が、異なる標識によって決定される、47に記載の方法。 48. 48. The method according to 47, wherein the identity of one of the at least three nucleotides is determined by different labels.

49.少なくとも12個の異なる標識、または11個の異なる標識および1つのブランクが使用される、48に記載の方法。 49. 49. The method according to 48, wherein at least 12 different labels are used, or 11 different labels and 1 blank.

50.標的結合ドメインが、少なくとも3個のヌクレオチドおよび1つ以上の縮重ヌクレオチド位置を含む、41および44に記載の方法。 50. 45. The method of 41 and 44, wherein the target binding domain comprises at least 3 nucleotides and one or more degenerate nucleotide positions.

51.標識が、放射光、発光、または散乱光の、波長、寿命、輝度、偏光などにより異なっている、48に記載の方法。 51. 49. The method according to 48, wherein the labels differ by wavelength, lifetime, brightness, polarization, etc. of emitted, emitted, or scattered light.

52.ポリヌクレオチドが、末端にテール付加され、テールに相補的な配列を介して捕捉される、先行実施形態に記載の方法。 52. The method of the preceding embodiment, wherein the polynucleotide is tailed at the end and captured via a sequence complementary to the tail.

53.テールに相補的な配列が、規則正しいアレイに組織化されている、52に記載の方法。 53. 53. The method according to 52, wherein the tail-complementary sequences are organized in an ordered array.

54.規則正しいアレイが、テールに相補的な空間的に規則正しいアレイを含む超分子グリッド(例えば、DNA折り紙)を含む、52に記載の方法。 54. 53. The method according to 52, wherein the ordered array comprises a supramolecular grid (eg DNA origami) comprising a spatially ordered array complementary to the tails.

55.ターミナルトランスフェラーゼを使用して、ポリヌクレオチドがテール付加されている、52に記載の方法。 55. 53. The method of 52, wherein the polynucleotide is tailed using terminal transferase.

56.標的ポリヌクレオチドが、短鎖核酸、セルフリー核酸、または循環核酸である、52に記載の方法。 56. 53. The method of 52, wherein the target polynucleotide is a short nucleic acid, a cell-free nucleic acid, or a circulating nucleic acid.

57.標的ポリヌクレオチドが、mRNAであり、かつ既に一方の末端に天然にテール付加されている、52に記載の方法。 57. 53. The method of 52, wherein the target polynucleotide is mRNA and is already naturally tailed at one end.

58.標的ポリヌクレオチドが、まだ一方の末端に天然にテール付加されていないRNAである、52に記載の方法。 58. 53. The method according to 52, wherein the target polynucleotide is RNA not already naturally tailed at one end.

59.ポリマー/ポリヌクレオチドが、プローブ結合の前に変性される、先行実施形態に記載の方法。 59. The method of any preceding embodiment, wherein the polymer/polynucleotide is denatured prior to probe binding.

60.単一のポリマー/ポリヌクレオチドが、伸展または伸長される、先行実施形態に記載の方法。 60. A method according to previous embodiments, wherein a single polymer/polynucleotide is stretched or elongated.

61.単一のポリマー/ポリヌクレオチドが、表面に固定化される、先行実施形態に記載の方法。 61. The method of the preceding embodiment, wherein a single polymer/polynucleotide is immobilized on the surface.

62.単一のポリマー/ポリヌクレオチドが、ゲルまたはマトリックス中に固定化される、先行実施形態に記載の方法。 62. The method of the preceding embodiment, wherein a single polymer/polynucleotide is immobilized in a gel or matrix.

63.不均一ポリマーの化学構造を識別および順序付ける方法であって、ポリマーを伸長させ、複数のプローブを結合させて、伸長されたポリマーに沿った複数の部位における化学構造を識別することを含み、複数の当該部位が、回折限界光学撮像によって解像され得るよりも近いが、それらの標識が時間的に離れることから解像可能であり、化学構造を識別するプローブの結合場所が、ナノメトリック(サブ回折)精度で決定され、それによって、不均一なポリマーの化学構造の空間的な順序が決定される、方法。 63. A method of identifying and ordering the chemical structures of a heterogeneous polymer comprising extending the polymer and attaching a plurality of probes to identify chemical structures at multiple sites along the extended polymer, comprising: are closer than can be resolved by diffraction-limited optical imaging, but are resolvable from the temporal separation of their labels, and the binding locations of probes that identify chemical structures are nanometric (sub- diffraction) precision, whereby the spatial order of the chemical structures of heterogeneous polymers is determined.

64.ポリマーの配列が、ポリマーへの分子プローブのレパートリーの結合相互作用の出現特性を介して決定される、ポリマーを配列決定する方法。 64. A method of sequencing a polymer in which the sequence of the polymer is determined through the emergence properties of binding interactions of a repertoire of molecular probes to the polymer.

実施例1:配列決定のための試料の調製。
ステップ1:長い鎖長のゲノムDNAの抽出。
NA12878またはNA18507細胞(Coriell Biorepository)を培養物中で増殖させ、収穫する。細胞を、60℃に加熱した低融点アガロースと混合する。混合物を(例えば、Bio-Radから購入した)ゲルモールドに注ぎ、ゲルプラグにセットさせ、約4×10個の細胞をもたらす(この数は、ポリヌクレオチドの所望の密度に応じて、より多いかまたはより少ない)。ゲルプラグ内の細胞は、プラグを、プロテイナーゼKを含む溶液に浸すことによって溶解される。ゲルプラグは、TE緩衝液中で穏やかに洗浄される(例えば、15mLのファルコンチューブ中で、洗浄緩衝液で満たされるが、混合を助けるために小さな気泡を残し、チューブローテーター上に配置する)。プラグを、約1.6mL体積のトラフに配置され、DNAは、アガラーゼ酵素を使用してDNAを消化することによって抽出される。0.5MのMES pH5.5溶液を消化したDNAに適用する。FiberPrepキット(Genomic Vision、France)および付随のプロトコルを使用して、このステップを実行し、平均長が300KbのDNA分子が得られる。代替的に、これらの細胞株から抽出されたゲノムDNA自体がCorrielから入手可能であり、ワイドボアピペットを使用して、0.5MのMES pH5.5溶液に直接ピペッティングし(1.2mL中約10uL)、1μM未満の平均間隔を与える。
Example 1: Sample preparation for sequencing.
Step 1: Extraction of long-length genomic DNA.
NA12878 or NA18507 cells (Coriell Biorepository) are grown in culture and harvested. Cells are mixed with low melting point agarose heated to 60°C. Pour the mixture into a gel mold (eg, purchased from Bio-Rad) and allow to set in the gel plug, resulting in approximately 4×10 7 cells (this number may be higher depending on the desired density of polynucleotides). or less). Cells within the gel plug are lysed by soaking the plug in a solution containing proteinase K. Gel plugs are gently washed in TE buffer (eg, in a 15 mL Falcon tube, filled with wash buffer, leaving small air bubbles to aid mixing, and placed on a tube rotator). The plug is placed in a trough of approximately 1.6 mL volume and the DNA is extracted by digesting the DNA using the agarase enzyme. Apply 0.5 M MES pH 5.5 solution to the digested DNA. This step is carried out using the FiberPrep kit (Genomic Vision, France) and accompanying protocol, resulting in DNA molecules with an average length of 300 Kb. Alternatively, the genomic DNA itself extracted from these cell lines is available from Corriel and pipetted directly into 0.5 M MES pH 5.5 solution using a wide-bore pipette (in 1.2 mL 10 uL), giving an average spacing of less than 1 μM.

ステップ2:表面での分子の伸展。
ステップ1の最後の部分は、0.5MのMESpH5.5溶液中でトラフ内に抽出されたポリヌクレオチドを提供する。ビニルシラン(例えば、Genomic VisionからのCombiSlips)でコーティングされた基板カバーガラスをトラフに浸し、(必要な標的核酸の密度に応じて)1~10分間インキュベートする。次いで、カバーガラスは、カバーガラスを把持するためにクリップが取り付けられたシリンジポンプなどの機械的プラーを使用して、ゆっくりと引き抜かれる(代替的に、Genomic VisionからのFiberCombシステムが使用される)。カバーガラス上のDNAを、架橋剤(Stratagene、USA)を使用して10,000マイクロジュールのエネルギーを使用して表面に架橋する。このプロセスが慎重に実施されると、表面に伸長された平均長が200~300Kbの高分子量(HMW)ポリヌクレオチドがもたらされ、ポリヌクレオチドの集団の中には、1Mbを超える長さの分子、または10Mb程度の長さの分子でさえ存在する。より細心の注意と最適化により、平均長は、メガベース範囲にシフトする(上記のメガベース範囲のコーミングのセクションを参照)。
Step 2: Stretching of molecules on the surface.
The last part of step 1 provides the extracted polynucleotides in a trough in a 0.5 M MES pH 5.5 solution. Substrate coverslips coated with vinylsilane (eg, CombiSlips from Genomic Vision) are immersed in the trough and incubated for 1-10 minutes (depending on the density of target nucleic acid required). The coverslip is then slowly withdrawn using a mechanical puller such as a syringe pump fitted with a clip to grip the coverslip (alternatively, the FiberComb system from Genomic Vision is used). . The DNA on the coverslip is crosslinked to the surface using a crosslinker (Stratagene, USA) with an energy of 10,000 microjoules. Careful execution of this process results in surface extended high molecular weight (HMW) polynucleotides with an average length of 200-300 Kb, with some populations of polynucleotides containing molecules greater than 1 Mb in length. , or even molecules as long as 10 Mb. With more care and optimization, the average length shifts into the megabase range (see the megabase range combing section above).

代替として、上述のように、予め抽出されたDNA(例えば、ヒト男性ゲノムDNA、Novagen cat.No.70572-3またはPromegaからの)が使用され、これは、かなりの割合が50Kbを超えるゲノム分子を含む。ここで、約0.2~0.5ng/μLの濃度で、約5分間の浸漬は、回折限界撮像を使用して高い割合の分子が個別に解像される分子密度を提供するのに十分である。 Alternatively, as described above, pre-extracted DNA (eg, human male genomic DNA, from Novagen cat. No. 70572-3 or Promega) is used, which contains a significant proportion of genomic molecules greater than 50 Kb. including. Here, at a concentration of about 0.2-0.5 ng/μL, a soak of about 5 minutes is sufficient to provide a molecular density in which a high proportion of the molecules are individually resolved using diffraction-limited imaging. is.

ステップ3:フローセルの作製。
既にスライドガラスに取り付けられている両面粘着性の3Mシートから作られたフローセルのガスケットに、カバースリップを押し付ける。ガスケット(両面粘着シート上の保護層の両側)は、レーザカッターを使用して作製され、1つ以上のフローチャネルを生成する。フローチャネルの長さは、カバーガラスの長さよりも長く、そのため、カバーガラスがフローチャネルの中央に配置されると、カバーガラスによって覆われていないチャネルの両端の各々の部分が、フローチャネルに流体を出し入れするための入口および出口として、それぞれ使用される。流体は、ビニルシラン表面に付着している伸長されたポリヌクレオチドの上を通過する。一端で安全綿棒(Johnsons、USA)を使用して吸引を生じさせ、他端で流体をピペット注入すると、流体は、チャネルを通って流れる。チャネルは、リン酸緩衝生理食塩水-Tweenおよびリン酸緩衝生理食塩水(PBS洗浄)で予め湿潤される。
Step 3: Fabrication of flow cell.
Press the cover slip onto the gasket of the flow cell made from double-sided adhesive 3M sheet already attached to the glass slide. Gaskets (both sides of the protective layer on the double-sided adhesive sheet) are made using a laser cutter to create one or more flow channels. The length of the flow channel is greater than the length of the cover slip, so that when the cover slip is centered in the flow channel, each portion of the channel's opposite ends not covered by the cover slip will allow fluid flow into the flow channel. are used as inlets and outlets, respectively, for loading and unloading. The fluid is passed over the elongated polynucleotide attached to the vinylsilane surface. A safety swab (Johnsons, USA) is used at one end to create aspiration and the other end to pipette the fluid and the fluid flows through the channel. Channels are pre-wetted with phosphate-buffered saline-Tween and phosphate-buffered saline (PBS wash).

ステップ4:二本鎖DNAの変性。
次の標的核酸が添加される前に、前の標的核酸を効率的に洗い流す必要がある。これは、緩衝液と最大4回交換することによって、任意選択的に、DMSOまたはアルカリ性溶液などの変性剤を使用して持続的な結合を除去することによって、行うことができる。二本鎖標的核酸は、フローセルを通してアルカリ(0.5MのNaOH)をフラッシュし、室温で約20~60分間インキュベートすることによって変性される。この後、PBS/PBST洗浄が続く。代替的に、1MのHCLで1時間インキュベーションし、続いてPBS/PBST洗浄を行う。
Step 4: Denaturation of double-stranded DNA.
Before the next target nucleic acid is added, the previous target nucleic acid must be effectively washed away. This can be done by exchanging the buffer up to 4 times, optionally by using a denaturant such as DMSO or an alkaline solution to remove persistent binding. Double-stranded target nucleic acids are denatured by flushing alkali (0.5 M NaOH) through the flow cell and incubating at room temperature for about 20-60 minutes. This is followed by a PBS/PBST wash. Alternatively, incubate with 1M HCL for 1 hour, followed by a PBS/PBST wash.

ステップ5:不動態化(Passivation)
任意選択的に、BlockAid(Invitrogen、USA)などのブロッキング緩衝液を流し込み、約5~15分間インキュベートする。これに続いて、PBS/PBST洗浄を行う。
Step 5: Passivation
Optionally, pour in a blocking buffer such as BlockAid (Invitrogen, USA) and incubate for about 5-15 minutes. This is followed by a PBS/PBST wash.

実施例2:変性ポリヌクレオチドへのオリゴヌクレオチドの一過的な結合による配列決定
ステップ1:一過的な結合条件下でのオリゴヌクレオチドプローブ種の添加
フローセルを、PBSTおよび任意選択的に、緩衝液A(10mMのトリス-HCl、100mMのNaCl、0.05%のTween-20、pH7.5)で予め調整する。約1~10nMの各オリゴヌクレオチドプローブ種を、緩衝液B(5mMのトリス-HCl、10mMのMgCl、1mMのEDTA、0.05%のTween-20、pH8)または緩衝液B+5mMのトリス-HCl、10mMのMgCl、1mMのEDTA、0.05%のTween-20、pH8、1mMのPCA、1mMのPCD、1mMのTrolox)中の、伸長され変性された標的核酸に適用する。オリゴヌクレオチドプローブ種の長さは、典型的には、5~7ヌクレオチドの範囲であり、反応温度は、オリゴヌクレオチドプローブ種のTmに依存する。使用された1つのプローブタイプは、一般式5’-Cy3-NXXXXXN-3’(Xは指定された塩基、Nは縮重位置)のプローブタイプであり、LNAヌクレオチドは、位置1、2、4、6、および7にあり、DNAヌクレオチドは、位置3および5にある。プローブは、Sigma Proligoから購入し、これは、以前にPihlakらによって使用されたものである。結合の温度は、各オリゴヌクレオチドプローブ種配列のTmと関連付けられた。
Example 2: Sequencing by Transient Binding of Oligonucleotides to Denatured Polynucleotides Step 1: Addition of Oligonucleotide Probe Species Under Transient Binding Conditions Precondition with A (10 mM Tris-HCl, 100 mM NaCl, 0.05% Tween-20, pH 7.5). About 1-10 nM of each oligonucleotide probe species was added to buffer B (5 mM Tris-HCl, 10 mM MgCl 2 , 1 mM EDTA, 0.05% Tween-20, pH 8) or buffer B + 5 mM Tris-HCl. , 10 mM MgCl 2 , 1 mM EDTA, 0.05% Tween-20, pH 8, 1 mM PCA, 1 mM PCD, 1 mM Trolox). The length of the oligonucleotide probe species typically ranges from 5-7 nucleotides and the reaction temperature depends on the Tm of the oligonucleotide probe species. One probe type that was used was of the general formula 5′-Cy3-NXXXXXN-3′ (where X is the specified base and N is the degenerate position), where the LNA nucleotides are at positions 1, 2, 4 , 6, and 7, with DNA nucleotides at positions 3 and 5. Probes were purchased from Sigma Proligo and were previously used by Pihlak et al. The temperature of binding was related to the Tm of each oligonucleotide probe species sequence.

A+およびB+溶液で洗浄した後、オリゴヌクレオチドプローブ種の一過的な結合は、LNA DNAキメラオリゴヌクレオチドプローブ種3004 NTgGcGN(ここで、大文字はLNAであり、小文字はDNAヌクレオチドである)の場合、B+溶液中で、0.5~100nMのオリゴ(典型的には、3nm~10nm)を用いて、室温で行う。異なる温度条件および/または塩条件(ならびに濃度条件)を、異なるオリゴヌクレオチドプローブ種の配列に対して、それらのTmおよび結合挙動に従って使用する。検出用にFRET機構が使用される場合、最大1uMのはるかに高い濃度のオリゴが使用され得る。一部の実施形態では、FRETは、一過的に形成された二重鎖に挿入される挿入色素分子(YOYO-1、Sytox Green、Sytox Orange、Sybr Goldなど(Life Technologies)から、使用される挿入色素に応じて1000分の1~10,000分の1の希釈形態)と、オリゴ上の標識との間のFRETである。一部の実施形態では、挿入色素は、FRETなしで標識として直接使用される。この場合、オリゴヌクレオチドプローブ種は標識されない。安価であることに加えて、非標識オリゴヌクレオチドプローブ種は、二重鎖形成時の挿入された色素からのバックグラウンドが、挿入されていない色素よりも100~1000明るい(例えば、どの挿入剤が使用されるかに応じて)ため、標識されたオリゴヌクレオチドプローブ種よりも高い濃度で使用することができる。 After washing with A+ and B+ solutions, the transient binding of the oligonucleotide probe species is as follows: Performed at room temperature with 0.5-100 nM oligos (typically 3-10 nm) in B+ solution. Different temperature and/or salt conditions (as well as concentration conditions) are used for different oligonucleotide probe species sequences according to their Tm and binding behavior. Much higher concentrations of oligos up to 1 uM can be used if a FRET mechanism is used for detection. In some embodiments, FRET is used from intercalating dye molecules (YOYO-1, Sytox Green, Sytox Orange, Sybr Gold, etc. (Life Technologies) that intercalate into transiently formed duplexes). 1000-fold to 10,000-fold dilution depending on the intercalating dye) and the label on the oligo. In some embodiments, intercalating dyes are used directly as labels without FRET. In this case the oligonucleotide probe species is unlabeled. In addition to being inexpensive, the unlabeled oligonucleotide probe species has a background from the intercalating dye upon duplex formation that is 100-1000 brighter than the non-intercalating dye (e.g., which intercalating agent used), so higher concentrations than labeled oligonucleotide probe species can be used.

ステップ2:撮像-複数のフレームの撮影。
フローチャネルは、Perfect Focus、TIRFアタッチメント、およびTIRF対物レーザ、およびHamamatsu 512×512裏面入射型EMCCDカメラを備えた倒立顕微鏡(例えば、Nikon Ti-E)上に配置される。プローブは、緩衝液B+に添加され、任意選択的に、撮像剤が補充される。
Step 2: Capture—Capture multiple frames.
The flow channel is placed on an inverted microscope (eg, Nikon Ti-E) equipped with a Perfect Focus, TIRF attachment and TIRF objective laser, and a Hamamatsu 512×512 back-thinned EMCCD camera. Probes are added to buffer B+, optionally supplemented with an imaging agent.

表面に配置されたポリヌクレオチドに結合するプローブは、TIRFアタッチメントを有するNikon Ti-E上の1.49 NA 100x Nikon油浸対物レンズを通じて、光ファイバスクランブラ(Point Source)を介して、約61.5°のTIRF角度で調整された75~400mWのレーザ光(例えば、532nmの緑色光)の全内部反射によって生成されたエバネッセント波によって照明される。画像は、1.5倍のさらなる倍率で同じレンズを通して収集され、ダイクロイックミラーおよびエミッションフィルタを介してHamamatsu ImageEMカメラに投影される。50~200ミリ秒の5000~30,000フレームは、Perfect Focusを使用して100~140のEMゲインで撮影される。一部の実施形態では、高いレーザ出力(例えば、400mW)を最初の数秒で使用して、初期の非特異的結合を退色させ、これにより、表面からのほとんど一面のシグナルを、より低い密度に低減し、個々の結合事象が解像される。その後、レーザ出力を、任意選択的に、低減する。 Probes that bind to the surface-disposed polynucleotides are passed through a 1.49 NA 100x Nikon oil immersion objective on a Nikon Ti-E with TIRF attachment, via a fiber optic scrambler (Point Source) at approximately 61.5 nm. Illuminated by an evanescent wave generated by total internal reflection of 75-400 mW laser light (eg, 532 nm green light) tuned at a TIRF angle of 5°. Images are collected through the same lens at an additional magnification of 1.5x and projected onto a Hamamatsu ImageEM camera through a dichroic mirror and emission filter. 5000-30,000 frames of 50-200 ms are taken with EM gain of 100-140 using Perfect Focus. In some embodiments, high laser power (e.g., 400 mW) is used in the first few seconds to bleach initial non-specific binding, thereby reducing the almost blanket signal from the surface to a lower density. reduced and individual binding events are resolved. The laser power is then optionally reduced.

図22A~図22Eは、標的核酸に一過的に結合するオリゴヌクレオチドプローブ種の照明の例を示す。これらの図において、標的核酸は、ヒトDNAである。濃い斑点は、プローブ蛍光の領域を示し、より濃い斑点は、オリゴヌクレオチドプローブ種によってより頻繁に結合されたより多くの領域を示す(例えば、より多くの光子が収集された)。図22A~図22Eは、1つの標的核酸の配列決定中に捕捉された時系列(例えば、ビデオ)からの画像である。標的核酸の領域の例として、ポイント2202、2204、2206、2208が、時系列を通して示されており、時間の経過とともに(例えば、オリゴヌクレオチドプローブ種の異なるセットが標的核酸に曝露されたときに)、より大きい強度またはより小さい強度で結合された。 Figures 22A-22E show examples of illumination of oligonucleotide probe species that transiently bind to target nucleic acids. In these figures, the target nucleic acid is human DNA. Darker spots indicate areas of probe fluorescence, darker spots indicate more areas bound more frequently by the oligonucleotide probe species (eg, more photons collected). Figures 22A-22E are images from a time series (eg, video) captured during sequencing of one target nucleic acid. As examples of regions of a target nucleic acid, points 2202, 2204, 2206, 2208 are shown through time, over time (e.g., when different sets of oligonucleotide probe species are exposed to the target nucleic acid). , joined with greater or lesser strength.

撮像緩衝液が添加された。一部の実施形態では、撮像緩衝液は、β-メルカプトエタノール、酵素レドックス系、および/またはアスコルビン酸および没食子酸を含む緩衝液によって補充または置換される。フルオロフォアは、ラインに沿って検出され、オリゴヌクレオチドプローブ種の結合が生じたことを示す。任意選択的に、フローセルが2つ以上のチャネルで作製される場合、チャネルのうちの1つは、ポリヌクレオチドの密度およびポリヌクレオチド伸長の質をチェックするために(例えば、Intensilightまたは488nmレーザ照明を使用して)YOYO-1挿入色素で染色される。 Imaging buffer was added. In some embodiments, the imaging buffer is supplemented or replaced with a buffer containing β-mercaptoethanol, an enzymatic redox system, and/or ascorbic acid and gallic acid. A fluorophore is detected along the line to indicate that binding of the oligonucleotide probe species has occurred. Optionally, if the flow cell is made with two or more channels, one of the channels is illuminated (e.g., with Intensilight or 488 nm laser illumination) to check the density of polynucleotides and the quality of polynucleotide elongation. using) stained with YOYO-1 intercalating dye.

ステップ3:撮像-他の場所への移動(任意選択的なステップ)。
ニコンTi-eのスライドホルダーに(フローセルの一部としてスライドガラスにアタッチメントを介して)取り付けられたカバーガラスは、対物レンズ(したがって、CCD)に対して移動され、別々の場所が撮像される。撮像は、異なる場所で提供された標的核酸または標的核酸の部分に結合するオリゴヌクレオチドプローブ種が(その第1の位置でのCCDの視野の外で)撮像されるように、複数の他の場所で行われる。各場所からの画像データは、コンピュータメモリに格納される。
Step 3: Imaging-Transfer to another location (optional step).
A cover glass mounted in a Nikon Ti-e slide holder (via attachment to the glass slide as part of the flow cell) is moved relative to the objective lens (and thus the CCD) and separate locations are imaged. Imaging may be performed at multiple other locations such that oligonucleotide probe species that bind to target nucleic acids or portions of target nucleic acids provided at different locations are imaged (outside the field of view of the CCD at its first location). is done in Image data from each location is stored in computer memory.

ステップ4:次のオリゴのセットの添加。
次のオリゴヌクレオチドプローブ種のセットを添加し、標的核酸の全体が配列決定されるまで、ステップ1~3を反復する。
Step 4: Addition of next set of oligos.
The next set of oligonucleotide probe species is added and steps 1-3 are repeated until the entire target nucleic acid has been sequenced.

ステップ5:結合の場所と同一性の決定。
光学活性の各事例の場所が決定され、結合した標識オリゴヌクレオチドプローブ種由来の蛍光が投影される画素の場所が記録される。結合したオリゴヌクレオチドプローブ種の同一性は、(例えば、光学フィルタによる波長選択を使用して)どの標識オリゴヌクレオチドプローブ種が結合されているのかを決定することによって決定され、フルオロフォアは、複数のフィルタにわたって検出され、この場合、フィルタセットにわたる各フルオロフォアの発光シグネチャは、フルオロフォアの同一性(したがって、オリゴヌクレオチドプローブ種の同一性)を決定するために使用される。任意選択的に、フローセルが2つ以上のチャネルで作製される場合、チャネルのうちの1つは、標的核酸の密度および標的核酸伸長の質をチェックするために(例えば、Intensilightまたは488nmレーザ照明を使用することによって)、YOYO-1挿入色素で染色される。オリゴヌクレオチドプローブ種を標識するために使用される蛍光波長ごとに1つずつ、1つ以上の画像または動画を撮影する。
Step 5: Determining the Site of Bonding and Identity.
The location of each instance of optical activity is determined and the location of the pixel where the fluorescence from the bound labeled oligonucleotide probe species is projected is recorded. The identity of the bound oligonucleotide probe species is determined by determining which labeled oligonucleotide probe species is bound (e.g., using wavelength selection by optical filters), where the fluorophore has multiple The emission signature of each fluorophore detected across the filter, where it is across the filter set, is used to determine the identity of the fluorophore (and thus the identity of the oligonucleotide probe species). Optionally, if the flow cell is made with two or more channels, one of the channels is illuminated (e.g., with Intensilight or 488 nm laser illumination) to check the density of the target nucleic acid and the quality of the target nucleic acid elongation. by using), stained with YOYO-1 intercalating dye. One or more images or movies are taken, one for each fluorescence wavelength used to label the oligonucleotide probe species.

ステップ6:データ処理。
二重鎖標的核酸の両方の鎖が表面に付着したままである場合、オリゴヌクレオチドプローブ種の結合は、二本鎖標的核酸の両方の鎖上のそれらの相補的な場所に同時に生じる。次いで、全データセットを分析して、標的核酸上の特定の位置に密接な局在化シグナルを与えるオリゴヌクレオチドプローブ種のセットを見つけ、それらの場所は、ポリヌクレオチドの選択されたポイントに対応するオリゴヌクレオチドプローブ種の配列を重複させることによって確認され、これは、次いで、各ポイントでのオリゴヌクレオチドプローブ種の2つの重複したタイリングシリーズを明らかにする。局所における次のシグナルがどのタイリングシリーズに当てはまるのかは、それがどの鎖に結合しているのかを示す。
Step 6: Data processing.
When both strands of a double-stranded target nucleic acid remain attached to the surface, binding of the oligonucleotide probe species occurs simultaneously at their complementary locations on both strands of the double-stranded target nucleic acid. The entire data set is then analyzed to find a set of oligonucleotide probe species that give close localization signals to specific locations on the target nucleic acid, those locations corresponding to selected points in the polynucleotide. Confirmed by overlapping the sequences of the oligonucleotide probe species, this then reveals two overlapping tiling series of the oligonucleotide probe species at each point. Which tiling series the next signal in the region applies to indicates which strand it is attached to.

標的核酸鎖は表面に固定されたままであるため、各オリゴヌクレオチドプローブ種について記録された結合場所は、アルゴリズムを実行するソフトウェアスクリプトを使用して重ねることができる。これにより、オリゴヌクレオチドプローブ種結合場所が、変性二重鎖標的核酸の各鎖に対する別々の経路である(しかし、それは相補的である必要がある)、2つのオリゴヌクレオチドプローブ種配列のタイリング経路のフレームワーク内にあることを示すシグナルがもたらされる。各タイリング経路は、完了している場合、鎖の全長にわたる。次に、各鎖のタイリングされた配列を比較して、二本鎖(2Dとしても知られる)コンセンサス配列を提供する。1つのタイリングパスにギャップがある場合、相補的なタイリングパスの配列が取られる。一部の実施形態では、配列は、塩基割当を助け、ギャップを埋めるために、同じ配列の複数のコピーと比較されるか、または参照と比較される。 As the target nucleic acid strand remains immobilized on the surface, the binding sites recorded for each oligonucleotide probe species can be overlaid using a software script that runs the algorithm. This allows the tiling pathways of the two oligonucleotide probe species sequences where the oligonucleotide probe species binding site is a separate pathway for each strand of the denatured duplex target nucleic acid (but it must be complementary). A signal is provided to indicate that it is within the framework of Each tiling path, if complete, spans the entire length of the chain. The tiled sequences of each strand are then compared to provide a double-stranded (also known as 2D) consensus sequence. If there is a gap in one tiling path, the alignment of the complementary tiling path is taken. In some embodiments, a sequence is compared to multiple copies of the same sequence or compared to a reference to aid in base assignment and fill in gaps.

実施例3:ポリヌクレオチド上のエピマークの場所の検出。
任意選択的に、オリゴ結合プロセスの前(または時に、その後またはその間)に、エピゲノム結合試薬の一過的な結合が行われる。どの結合試薬が使用されるかに応じて、結合は、変性の前または後に行われる。一部の実施形態では、抗メチルC抗体の場合、結合は、変性標的核酸上で行われるが、メチル結合タンパク質の場合、任意の変性ステップの前に、二本鎖標的核酸上で結合が行われる。
Example 3: Detection of epimark locations on polynucleotides.
Optionally, transient binding of epigenome binding reagents is performed prior to (or sometimes after or during) the oligo binding process. Conjugation is performed before or after denaturation, depending on which binding reagent is used. In some embodiments, for anti-methyl-C antibodies, binding occurs on the denatured target nucleic acid, whereas for methyl-binding proteins, binding occurs on the double-stranded target nucleic acid prior to any denaturation step. will be

ステップ1-メチル結合試薬の一過的な結合。
変性後、フローセルをPBS洗浄でフラッシュし、Cy3Bで標識された抗メチル抗体3D3クローン(Diagenode)をPBS中に添加する。
Step 1—Transient attachment of methyl binding reagent.
After denaturation, the flow cell is flushed with a PBS wash and a Cy3B-labeled anti-methyl antibody 3D3 clone (Diagenode) is added in PBS.

代替的に、変性の前に、フローセルをPBSでフラッシュし、Cy3Bで標識されたMBD1を添加する。 Alternatively, prior to denaturation, the flow cell is flushed with PBS and Cy3B-labeled MBD1 is added.

撮像は、一過的なオリゴヌクレオチドプローブ種の結合について、上に記載のように行われる。 Imaging is performed as described above for transient oligonucleotide probe species binding.

ステップ2:メチル結合試薬の除去。
典型的には、エピ分析は、配列決定の前に行われる。したがって、任意選択的に、標的核酸の配列決定を開始する前に、メチル結合試薬をフラッシュアウトする。これは、複数サイクルのPBS/PBSTおよび/または高塩緩衝液およびSDSを流し、次いで、除去が生じたことを撮像で確認することによって行われる。無視できる量を超える結合試薬が残存していることが明らかな場合、カオトロピック塩、GuCLなどのより厳密な処理剤を流して、残った試薬を除去する。
Step 2: Removal of methyl binding reagent.
Typically epi-analysis is performed prior to sequencing. Therefore, optionally, methyl binding reagents are flushed out prior to initiating sequencing of the target nucleic acid. This is done by running multiple cycles of PBS/PBST and/or high salt buffer and SDS followed by imaging to confirm that elimination has occurred. If it is evident that more than a negligible amount of binding reagent remains, a harsher treatment such as chaotropic salt, GuCL is run through to remove the remaining reagent.

ステップ3:データ相関。
配列決定エピゲノミクスデータが得られた後、配列決定プローブ種の結合場所の場所間で相関を行い、エピ結合場所を相関させて、メチル化の配列文脈を提供する。
Step 3: Data Correlation.
After the sequencing epigenomics data are obtained, correlations are made between the binding sites of the sequencing probe species to correlate the epibinding sites to provide sequence context for the methylation.

実施例4:ラムダファージDNA中の一過的な結合から収集された蛍光。
図23A、図23B、および図23Cは、一過的な結合事象の例を示す。これらは、オリゴIDの一過的な結合を、まとめて示す。Lin2621、Cy3標識5’NAgCgGN3’(室温で、緩衝液B+中、1.5nMの濃度)。標的核酸は、MES pH5.5緩衝液+0.1MのNaCl中で、ビニルシラン表面(Genomic Vision)上に手動でコーミングされたラムダファージゲノムである。点源光ファイバスクランブラを介した400mWの532nmのレーザ。蛍光は、532nmの励起バンド、TIRF対物レンズ100倍1.49NA、および追加の1.5倍の倍率を含む、TIRFアタッチメントおよびマルチクロイックで収集された。防振は実装しなかった。画像を、100EM Gain設定で、Hamamatsu ImageEM 512×512上に、Perfect Focusを用いて捕捉した。10000フレームを100msにわたって収集した。オリゴヌクレオチドプローブセットのCy3の濃度は、約250nM~300nMであった。図23Aは、ThunderSTORMにおける相互相関ドリフト補正の前に収集された蛍光を示す。図23Bは、スケールバーとの相互相関ドリフト補正後に収集された蛍光を示す。図23Cは、図23Bの拡大された領域における蛍光を示す。図23Cは、Lin2621の複数の場所への持続的な結合によって追跡された長いポリヌクレオチド鎖を示す。画像から、標的核酸鎖が、Cy3発光の回折限界よりも近い距離で、撮像面上で固定化され、伸長されたことが明らかである。
Example 4: Fluorescence collected from transient binding in lambda phage DNA.
Figures 23A, 23B, and 23C show examples of transient binding events. These collectively show the transient binding of oligo IDs. Lin2621, Cy3-labeled 5'NAgCgGN3' (1.5 nM concentration in buffer B+ at room temperature). Target nucleic acids are lambda phage genomes manually combed onto a vinylsilane surface (Genomic Vision) in MES pH 5.5 buffer + 0.1 M NaCl. 400 mW 532 nm laser through a point source fiber optic scrambler. Fluorescence was collected with a TIRF attachment and multichroic, including a 532 nm excitation band, a 100x 1.49 NA TIRF objective, and an additional 1.5x magnification. No anti-vibration was implemented. Images were captured with Perfect Focus on a Hamamatsu ImageEM 512×512 with a 100 EM Gain setting. 10000 frames were collected over 100 ms. The concentration of Cy3 in the oligonucleotide probe set was approximately 250-300 nM. FIG. 23A shows fluorescence collected before cross-correlation drift correction in ThunderSTORM. FIG. 23B shows fluorescence collected after cross-correlation drift correction with scale bar. FIG. 23C shows the fluorescence in the magnified area of FIG. 23B. FIG. 23C shows a long polynucleotide chain traced by persistent binding of Lin2621 to multiple sites. It is clear from the images that the target nucleic acid strand was immobilized and extended on the imaging plane at a distance closer than the diffraction limit of Cy3 emission.

実施例5:合成DNA中の一過的な結合から収集された蛍光
図24は、3つの異なるポリヌクレオチド鎖から収集された蛍光データの一例を示す。合成3キロ塩基変性二本鎖DNA上の、複数のプロービングおよび洗浄ステップが示されている。ビニルシラン表面上で、合成DNAをMES(pH5.5)でコーミングし、変性させた。一連の結合および洗浄ステップを行い、ビデオ記録し、ThunderSTORMを使用してImageJで処理した。周囲温度で、緩衝液B+中の10nMのオリゴで行った以下の実験シリーズについて、3つの例示的な鎖(1、2、3)を超解像画像から切り取った。オリゴヌクレオチドプローブ種3004の結合、洗浄、オリゴ2879の結合、洗浄、オリゴ3006の結合、洗浄、およびオリゴヌクレオチドプローブ種3004の結合(再度)。これは、結合マップが一過的な結合に由来し得ること、結合パターンが洗浄によって消去され得ること、次いで、異なる結合パターンが、合成DNAの同じ第1および第2の鎖上の異なるオリゴヌクレオチドプローブ種で得られることを示す。シリーズの最後にオリゴヌクレオチドプローブ種3004に戻ること、およびシリーズの最初として使用された場合のパターンと類似していることは、なんら最適化を試みることなく、プロセスが堅牢であることを指し示す。
Example 5: Fluorescence Collected from Transient Binding in Synthetic DNA Figure 24 shows an example of fluorescence data collected from three different polynucleotide strands. Multiple probing and washing steps on synthetic 3 kilobase denatured double-stranded DNA are shown. Synthetic DNA was combed and denatured with MES (pH 5.5) on the vinylsilane surface. A series of binding and washing steps were performed, video recorded and processed in ImageJ using ThunderSTORM. For the following series of experiments performed with 10 nM oligos in buffer B+ at ambient temperature, three exemplary strands (1, 2, 3) were cropped from super-resolution images. Bind oligonucleotide probe species 3004, wash, bind oligo 2879, wash, bind oligo 3006, wash, and bind oligonucleotide probe species 3004 (again). This suggests that binding maps can result from transient binding, that binding patterns can be erased by washing, and that different binding patterns can then result in different oligonucleotides on the same first and second strand of synthetic DNA. It shows that it is obtained with the probe species. The return to oligonucleotide probe species 3004 at the end of the series, and the similarity of the pattern when used as the beginning of the series, indicates that the process is robust without any optimization attempts.

実験的に決定された結合場所は、予想される位置に対応し、二重鎖1および3は、4つの可能な完全一致結合部位のうちの3つを示し、二重鎖2は、4つのすべての結合場所および1つの顕著な不一致場所を示す。オリゴヌクレオチドプローブ種3004による第2のプロービングは、おそらく不一致が少ないため、よりきれいなシグナルを示すように見えることが観察される。これは、レーザ光への長時間曝露による加熱のため、温度がわずかに上昇する可能性と一致する。 The experimentally determined binding sites correspond to the expected positions, with duplexes 1 and 3 showing 3 of the 4 possible perfect match binding sites and duplex 2 showing 4 All binding sites and one significant discrepancy site are indicated. It is observed that the second probing with oligonucleotide probe species 3004 appears to give a cleaner signal, presumably due to fewer mismatches. This is consistent with the possibility of a slight increase in temperature due to heating from prolonged exposure to laser light.

この実験に使用されたオリゴ配列は、以下の通りである(大文字の塩基は、ロックド核酸(LNA)である):
オリゴヌクレオチドプローブ種3004:5’cy3 NTgGcGN
オリゴヌクレオチドプローブ種2879:5’cy3 NGgCgAN
オリゴヌクレオチドプローブ種3006:5’cy3 NTgGgCN:
The oligo sequences used for this experiment are as follows (bases in capital letters are locked nucleic acids (LNA)):
Oligonucleotide probe species 3004: 5'cy3 NTgGcGN
Oligonucleotide probe species 2879: 5'cy3 NGgCgAN
Oligonucleotide probe species 3006: 5'cy3 NTgGgCN:

3kbp合成鋳型の配列の配列表(文書の下部)は、以下の通りである:
(配列番号2)AAAAAAAAACCGGCCCAGCTTTCTTCATTAGGTTATACATCTACCGCTCGCCAGGGCGGCGACCTCGCGGGTTTTCGCTATTTATGAAAATTTTCCGGTTTAAGGCGTTTCCGTTCTTCTTCGTCATAACTTAATGTTTTTATTTAAAATACCCTCTGAAAAGATAGGATAGCACACGTGCTGAAAGCGAGGCTTTTTGGCCTCTGTCGTTTCCTTTCTCTGTTTTTGTCCGTGGAATGAACAATGGAAGTCAACAAAAAGCAGCTGGCTGACATTTTCGGTGCGAGTATCCGTACCATTCAGAACTGGCAGGAACAGGGAATGCCCGTTCTGCGAGGCGGTGGCAAGGGTAATGAGGTGCTTTATGACTCTGCCGCCGTCATAAAATGGTATGCCGAAAGGGATGCTGAAATTGAGAACGAAAAGCTGCGCCGGGAGGTTGAAGAACTGCGGTTCTTATACATCTAATAGTGATTATCTACATACATTATGAATCTACATTTTAGGTAAAGATTAATTGAGTACCAGGTTTCAGATTTGCTTCAATAAATTCTGACTGTAGCTGCTGAAACGTTGCGGTTGAACTATATTTCCTTATAACTTTTACGAAAGAGTTTCTTTGAGTAATCACTTCACTCAAGTGCTTCCCTGCCTCCAAACGATACCTGTTAGCAATATTTAATAGCTTGAAATGATGAAGAGCTCTGTGTTTGTCTTCCTGCCTCCAGTTCGCCGGGCATTCAACATAAAAACTGATAGCACCCGGAGTTCCGGAAACGAAATTTGCATATACCCATTGCTCACGAAAAAAAATGTCCTTGTCGATATAGGGATGAATCGCTTGGTGTACCTCATCTACTGCGAAAACTTGACCTTTCTCTCCCATATTGCAGTCGCGGCACGATGGAACTAAATTAATAGGCATCACCGAAAATTCAGGATAATGTGCAATAGGAAGAAAATGATCTATATTTTTTGTCTGTCCTATATCACCACAAAACCTGAAACTGGCGCGTGAGATGGGGCGACCGTCATCGTAATATGTTCTAGCGGGTTTGTTTTTATCTCGGAGATTATTTTCATAAAGCTTTTCTAATTTAACCTTTGTCAGGTTACCAACTACTAAGGTTGTAGGCTCAAGAGGGTGTGTCCTGTCGTAGGTAAATAACTGACCTGTCGAGCTTAATATTCTATATTGTTGTTCTTTCTGCAAAAAAGTGGGGAAGTGAGTAATGAAATTATTTCTAACATTTATCTGCATCATACCTTCCGAGCATTTATTAAGCATTTCGCTATAAGTTCTCGCTGGAAGAGGTAGTTTTTTCATTGTACTTTACCTTCATCTCTGTTCATTATCATCGCTTTTAAAACGGTTCGACCTTCTAATCCTATCTGACCATTATAATTTTTTAGAATGCGGCGTTTTCCGGAACTGGAAAACCGACATGTTGATTTCCTGAAACGGGATATCATCAAAGCCATGAACAAAGCAGCCGCGCTGGATGAACTGATACCGGGGTTGCTGAGTGAATATATCGAACAGTCAGGTTAACAGGCTGCGGCATTTTGTCCGCGCCGGGCTTCGCTCACTGTTCAGGCCGGAGCCACAGACCGCCGTTGAATGGGCGGATGCTAATTACTATCTCCCGAAAGAATCCGCATACCAGGAAGGGCGCTGGGAAACACTGCCCTTTCAGCGGGCCATCATGAATGCGATGGGCAGCGACTACATCCGTGAGGTGAATGTGGTGAAGTCTGCCCGTGTCGGTTATTCCAAAATGCTGCTGGGTGTTTATGCCTACTTTATAGAGCATAAGCAGCGCAACACCCTTATCTGGTTGCCGACGGATGGTGATGCCGAGAACTTTATGAAAACCCACGTTGAGCCGACTATTCGTGATATTCCGTCGCTGCTGTTAATTGAGTTTATAGTGATTTTATGAATCTATTTTGATGATATTATCTACATACGACTGGCGTGCCATGCTTGCCGGGATGTCAAATTTAATAAGGTGATAGTAAATAAAACAATTGCATGTCCAGAGCTCATTCGAAGCAGATATTTCTGGATATTGTCATAAAACAATTTAGTGAATTTATCATCGTCCACTTGAATCTGTGGTTCATTACGTCTTAACTCTTCATATTTAGAAATGAGGCTGATGAGTTCCATATTTGAAAAGTTTTCATCACTACTTAGTTTTTTGATAGCTTCAAGCCAGAGTTGTCTTTTTCTATCTACTCTCATACAACCAATAAATGCTGAAATGAATTCTAAGCGGAGATCGCCTAGTGATTTTAAACTATTGCTGGCAGCATTCTTGAGTCCAATATAAAAGTATTGTGTACCTTTTGCTGGGTCAGGTTGTTCTTTAGGAGGAGTAAAAGGATCAAATGCACTAAACGAAACTGAAACAAGCGATCGAAAATATCCCTTTGGGATTCTTGACTCGATAAGTCTATTATTTTCAGAGAAAAAATATTCATTGTTTTCTGGGTTGGTGATTGCACCAATCATTCCATTCAAAATTGTTGTTTTACCACACCCATTCCGCCCGATAAAAGCATGAATGTTCGTGCTGGGCATAGAATTAACCGTCACCTCAAAAGGTATAGTTAAATCACTGAATCCGGGAGCACTTTTTCTATTAAATGAAAAGTGGAAATCTGACAATTCTGGCAAACCATTTAACACACGTGCGAACTGTCCATGAATTTCTGAAAGAGTTACCCCTCTAAGTAATGAGGTGTTAAGGACGCTTTCATTTTCAATGTCGGCTAATCGATTTGGCCATACTACTAAATCCTGAATAGCTTTAAGAAGGTTATGTTTAAAACCATCGCTTAATTTGCTGAGATTAACATAGTAGTCAATGCTTTCACCTAAGGAAAAAAACATTTCAGGGAGTTGACTGAATTTTTTATCTATTAATGAATAAGTGCTTGACCTATTTCTTCATTACGCCATTATACATCTAGCCCACCGCTGCCAAAAAAAAA
A sequence listing (at the bottom of the document) of the sequence of the 3 kbp synthetic template follows:
(配列番号2)AAAAAAAAACCGGCCCAGCTTTCTTCATTAGGTTATACATCTACCGCTCGCCAGGGCGGCGACCTCGCGGGTTTTCGCTATTTATGAAAATTTTCCGGTTTAAGGCGTTTCCGTTCTTCTTCGTCATAACTTAATGTTTTTATTTAAAATACCCTCTGAAAAGATAGGATAGCACACGTGCTGAAAGCGAGGCTTTTTGGCCTCTGTCGTTTCCTTTCTCTGTTTTTGTCCGTGGAATGAACAATGGAAGTCAACAAAAAGCAGCTGGCTGACATTTTCGGTGCGAGTATCCGTACCATTCAGAACTGGCAGGAACAGGGAATGCCCGTTCTGCGAGGCGGTGGCAAGGGTAATGAGGTGCTTTATGACTCTGCCGCCGTCATAAAATGGTATGCCGAAAGGGATGCTGAAATTGAGAACGAAAAGCTGCGCCGGGAGGTTGAAGAACTGCGGTTCTTATACATCTAATAGTGATTATCTACATACATTATGAATCTACATTTTAGGTAAAGATTAATTGAGTACCAGGTTTCAGATTTGCTTCAATAAATTCTGACTGTAGCTGCTGAAACGTTGCGGTTGAACTATATTTCCTTATAACTTTTACGAAAGAGTTTCTTTGAGTAATCACTTCACTCAAGTGCTTCCCTGCCTCCAAACGATACCTGTTAGCAATATTTAATAGCTTGAAATGATGAAGAGCTCTGTGTTTGTCTTCCTGCCTCCAGTTCGCCGGGCATTCAACATAAAAACTGATAGCACCCGGAGTTCCGGAAACGAAATTTGCATATACCCATTGCTCACGAAAAAAAATGTCCTTGTCGATATAGGGATGAATCGCTTGGTGTACCTCATCTACTGCGAAAACTTGACCTTTCTCTCCCATATTGCAGTCGCGGCACGATGGAACTAAATTAATAGGCATCACCGAAAATTCAGGATAATGTGCAATAGGAAGAAAATGATCTATATTTTTTGTCTGTCCTATATCAC CACAAAACCTGAAACTGGCGCGTGAGATGGGGCGACCGTCATCGTAATATGTTCTAGCGGGTTTGTTTTTATCTCGGAGATTATTTTCATAAAGCTTTTCTAATTTAACCTTTGTCAGGTTACCAACTACTAAGGTTGTAGGCTCAAGAGGGTGTGTCCTGTCGTAGGTAAATAACTGACCTGTCGAGCTTAATATTCTATATTGTTGTTCTTTCTGCAAAAAAGTGGGGAAGTGAGTAATGAAATTATTTCTAACATTTATCTGCATCATACCTTCCGAGCATTTATTAAGCATTTCGCTATAAGTTCTCGCTGGAAGAGGTAGTTTTTTCATTGTACTTTACCTTCATCTCTGTTCATTATCATCGCTTTTAAAACGGTTCGACCTTCTAATCCTATCTGACCATTATAATTTTTTAGAATGCGGCGTTTTCCGGAACTGGAAAACCGACATGTTGATTTCCTGAAACGGGATATCATCAAAGCCATGAACAAAGCAGCCGCGCTGGATGAACTGATACCGGGGTTGCTGAGTGAATATATCGAACAGTCAGGTTAACAGGCTGCGGCATTTTGTCCGCGCCGGGCTTCGCTCACTGTTCAGGCCGGAGCCACAGACCGCCGTTGAATGGGCGGATGCTAATTACTATCTCCCGAAAGAATCCGCATACCAGGAAGGGCGCTGGGAAACACTGCCCTTTCAGCGGGCCATCATGAATGCGATGGGCAGCGACTACATCCGTGAGGTGAATGTGGTGAAGTCTGCCCGTGTCGGTTATTCCAAAATGCTGCTGGGTGTTTATGCCTACTTTATAGAGCATAAGCAGCGCAACACCCTTATCTGGTTGCCGACGGATGGTGATGCCGAGAACTTTATGAAAACCCACGTTGAGCCGACTATTCGTGATATTCCGTCGCTGCTGTTAATTGAGTTTATAGTGATTTTATGAATCTATTTTGATGATATTATCTACATACGACTGGCGTGCCATGCTTGCCG GGATGTCAAATTTAATAAGGTGATAGTAAATAAAACAATTGCATGTCCAGAGCTCATTCGAAGCAGATATTTCTGGATATTGTCATAAAACAATTTAGTGAATTTATCATCGTCCACTTGAATCTGTGGTTCATTACGTCTTAACTCTTCATATTTAGAAATGAGGCTGATGAGTTCCATATTTGAAAAGTTTTCATCACTACTTAGTTTTTTGATAGCTTCAAGCCAGAGTTGTCTTTTTCTATCTACTCTCATACAACCAATAAATGCTGAAATGAATTCTAAGCGGAGATCGCCTAGTGATTTTAAACTATTGCTGGCAGCATTCTTGAGTCCAATATAAAAGTATTGTGTACCTTTTGCTGGGTCAGGTTGTTCTTTAGGAGGAGTAAAAGGATCAAATGCACTAAACGAAACTGAAACAAGCGATCGAAAATATCCCTTTGGGATTCTTGACTCGATAAGTCTATTATTTTCAGAGAAAAAATATTCATTGTTTTCTGGGTTGGTGATTGCACCAATCATTCCATTCAAAATTGTTGTTTTACCACACCCATTCCGCCCGATAAAAGCATGAATGTTCGTGCTGGGCATAGAATTAACCGTCACCTCAAAAGGTATAGTTAAATCACTGAATCCGGGAGCACTTTTTCTATTAAATGAAAAGTGGAAATCTGACAATTCTGGCAAACCATTTAACACACGTGCGAACTGTCCATGAATTTCTGAAAGAGTTACCCCTCTAAGTAATGAGGTGTTAAGGACGCTTTCATTTTCAATGTCGGCTAATCGATTTGGCCATACTACTAAATCCTGAATAGCTTTAAGAAGGTTATGTTTAAAACCATCGCTTAATTTGCTGAGATTAACATAGTAGTCAATGCTTTCACCTAAGGAAAAAAACATTTCAGGGAGTTGACTGAATTTTTTATCTATTAATGAATAAGTGCTTGACCTATTTCTTCATTACGCCATTATACATCTAGCCCACCGCTGCCAA AAAAAAA

実施例6:単一細胞の統合的単離、核酸の抽出および配列決定。
ステップ1:マイクロ流体アーキテクチャの設計と製作
マイクロチャネルは、典型的な直径15umのヒトがん細胞株由来の細胞を収容するように設計されているため、マイクロ流体ネットワークは、最小限の深さおよび幅33umを有する。デバイスは、細胞用の入口、および単一のチャネルに合流し単一細胞トラップに供給するための緩衝液用の入口を備える(図17に示す)。細胞の入口と緩衝液の入口との間の交差点で、細胞を、1つ以上のトラップが配置されている供給チャネルの側壁に沿って整列させる。各トラップは、ヒトがん細胞株から細胞を捕捉するように、寸法決定された単純なくびれである。細胞捕捉用のくびれは、断面が台形である:底部は幅4.3um、中深度は6um、上部は幅8umで、深さは33umである。各細胞トラップは、供給チャネルを分岐点に接続し、分岐の一方は、廃棄チャネルであり(図17には示されていない)、もう一方は、(核酸の伸長および配列決定のための)フロー伸展セクションを含むチャネルであり、細胞ごとに1つある。フロー伸展セクションは、幅20um(または最大2mm)、長さ450um、深さ100nm(または最大2um)のチャネルからなる。一部の実施形態では、フロー伸展チャネルは、始まりがより狭く、記載の寸法まで広がる。
Example 6: Integrated isolation of single cells, nucleic acid extraction and sequencing.
Step 1: Design and Fabrication of the Microfluidic Architecture The microchannels are designed to accommodate cells from a human cancer cell line with a typical diameter of 15um, so that the microfluidic network has minimal depth and It has a width of 33um. The device includes an inlet for cells and an inlet for buffer to merge into a single channel and feed the single cell trap (shown in Figure 17). At the intersection between the cell inlet and the buffer inlet, the cells are aligned along the side walls of the feed channel where one or more traps are located. Each trap is a simple constriction sized to trap cells from a human cancer cell line. The cell trapping constriction is trapezoidal in cross-section: 4.3 um wide at the bottom, 6 um mid-depth, 8 um wide at the top, and 33 um deep. Each cell trap connects a supply channel to a branch point, one of the branches is a waste channel (not shown in FIG. 17) and the other is a flow channel (for nucleic acid extension and sequencing). Channels containing extension sections, one per cell. The flow extension section consists of a channel that is 20um wide (or up to 2mm), 450um long and 100nm deep (or up to 2um). In some embodiments, the flow extension channels are narrower at the beginning and widen to the stated dimensions.

ステップ2:デバイスの製作
本デバイスは、TOPAS5013(TOPAS)の射出成形を使用して、ニッケルシムを複製することによって製作される。簡潔には、シリコンマスターは、UVリソグラフィーおよび反応性イオンエッチングによって生成される。100nmのNiVシード層を堆積させ、ニッケルを330umの最終厚さに電気メッキする。Siマスターは、KOH中で化学的にエッチングされている。溶融温度250℃、金型温度120℃、最大保持圧力1,500barを2秒間、20cm3/s~45cm3/sの異なる射出率で射出成形を行う。最後に、カバーガラス(1.5)をデバイスに接着するか、または150umのTOPAS箔を使用するかのいずれかで、0.51MPaの最大圧力下、UV処理および熱処理を組み合わせてデバイスを密封する。箔の表面粗さは、デバイスを密封する前に、シリコンウェハーから電気的にメッキされた2つの平坦なニッケルメッキ間で、140℃および5.1MPaで20分間箔をプレスすることによって低減される。これにより、デバイスの蓋が確実に光学的に平坦であり、高NA光学顕微鏡法を可能にする。本デバイスは、油浸TIRF対物レンズ(100×/NA1.49)およびEMCCDカメラ(Hamamatsu ImageEM 512)を備えた倒立蛍光顕微鏡(ニコンTi-E)に搭載されている。液体は、0~10mbarの範囲の圧力で、圧力コントローラー(MFCS、Fluigent)を使用して、デバイスを介して駆動される。デバイスは、エタノールでプライミングされ、次に脱気され、FACS Flow Sheath Fluid(BD Biosciences)は、フロー伸展デバイスを接続するマイクロチャネルを除くすべてのマイクロチャネルにロードされる。選択的ローディングは、溶液が導入された供給チャネルの入口で正の圧力を維持しながら、フロー伸展チャネルの出口に正の圧力をかけながら、廃棄チャネルの出口に負の圧力をかけるか、または吸引することによって実現される。単一分子撮像および電気泳動に好適な緩衝液(0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のβ-メルカプトエタノール、BME)は、フロー伸展デバイスのチャネルに充填される。この緩衝液は、フロー伸展セクションにおけるDNAの固着を防止し、フロー伸展セクションの高さが低い場合、抽出されたDNAの導入に対抗し得る電気浸透流を抑制する。
Step 2: Device Fabrication The device is fabricated by replicating nickel shims using injection molding of TOPAS5013 (TOPAS). Briefly, a silicon master is produced by UV lithography and reactive ion etching. A 100 nm NiV seed layer is deposited and nickel is electroplated to a final thickness of 330 um. The Si master is chemically etched in KOH. Injection molding is carried out at a melt temperature of 250° C., a mold temperature of 120° C., a maximum holding pressure of 1,500 bar for 2 seconds, and different injection rates from 20 cm 3 /s to 45 cm 3 /s. Finally, either a cover glass (1.5) is glued to the device or a 150 um TOPAS foil is used to seal the device using a combination of UV and heat treatment under a maximum pressure of 0.51 MPa. . The surface roughness of the foil is reduced by pressing the foil for 20 minutes at 140°C and 5.1 MPa between two flat nickel platings electroplated from a silicon wafer before sealing the device. . This ensures that the lid of the device is optically flat, enabling high NA optical microscopy. The device is mounted on an inverted fluorescence microscope (Nikon Ti-E) equipped with an oil immersion TIRF objective (100x/NA 1.49) and an EMCCD camera (Hamamatsu ImageEM 512). Liquids are driven through the device using pressure controllers (MFCS, Fluigent) at pressures ranging from 0 to 10 mbar. The device is primed with ethanol, then degassed and FACS Flow Sheath Fluid (BD Biosciences) is loaded into all microchannels except the microchannel connecting the flow extension device. Selective loading maintains a positive pressure at the inlet of the supply channel where the solution was introduced, while applying a positive pressure at the outlet of the flow extension channel while applying a negative pressure at the outlet of the waste channel, or aspiration. It is realized by A buffer suitable for single-molecule imaging and electrophoresis (0.5×TBE + 0.5% (v/v) Triton-X100 + 1% (v/v) β-mercaptoethanol, BME) was used in the flow extension device. filled into the channel. This buffer prevents DNA from sticking in the flow extension section and suppresses the electroosmotic flow that can oppose the introduction of the extracted DNA if the height of the flow extension section is low.

ステップ3:細胞調製
LS174T結腸直腸がん細胞を、10%のウシ胎仔血清(FBS;Autogen-Bioclear UK Ltd.)および1%のペニシリン/ストレプトマイシン(Lonza)を含むダルベッコの改変イーグル培地(DMEM;Gibco)で培養した後、10%のDMSOを含むFBS中で、1ミリリットル当たり1.7 106細胞の濃度で凍結する。解凍後、細胞懸濁液を、FACSFlow緩衝液と1:1で混合し、28.8×g(A-4-44、Eppendorf)で5分間遠心分離し、FACSFlow緩衝液中に再懸濁する。最後に、細胞を1uMのCalcein AM(Invitrogen)で染色し、1ミリリットル当たり0.35 10細胞で、チップにロードする。約5~10,000個の細胞がロードされ、各トラップに捕捉された最初の細胞が分析される。
Step 3: Cell preparation LS174T colorectal cancer cells were grown in Dulbecco's Modified Eagle's Medium (DMEM; Gibco) containing 10% fetal bovine serum (FBS; Autogen-Bioclear UK Ltd.) and 1% penicillin/streptomycin (Lonza). ) and then frozen at a concentration of 1.7 10 6 cells per milliliter in FBS containing 10% DMSO. After thawing, the cell suspension is mixed 1:1 with FACSFlow buffer, centrifuged at 28.8×g (A-4-44, Eppendorf) for 5 minutes, and resuspended in FACSFlow buffer. . Finally, cells are stained with 1 uM Calcein AM (Invitrogen) and loaded onto the chip at 0.35 10 6 cells per milliliter. Approximately 5-10,000 cells are loaded and the first cells captured in each trap are analyzed.

ステップ4:操作
細胞および緩衝液を同時に導入し、トラップが位置するマイクロチャネルの側壁に沿って、細胞を整列させる。単一細胞は、最大30nL/分のトラップを通る緩衝液の流れのために、トラップ内に捕捉され、保持される。0.5×TBE+0.5%(v/v)のTriton-X100+0.1uMのYOYO-1(Invitrogen)で構成される溶解緩衝液を、入口の1つにロードし、トラップを通して10nL/分で10分間注入する。次いで、すべてのウェルで、溶液を、YOYO-1を含まない緩衝液に交換し、染色を止める。次に、細胞核を、1nW/(um)の線量の青色励起光に最大300秒間曝露し、DNAの部分的な光ニッキングを引き起こさせる(www.pnas.org/cgi/doi/10.1073/pnas.1804194115のSI付録を参照されたい)。次に、緩衝液を、BMEを含む溶液(0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のBME)に変え、蛍光ランプの強度を、依然として蛍光撮像が可能な最小強度に下げる。次に、温度を60℃に上げ、タンパク質分解溶液(>200μg mL-1のプロテイナーゼK(Qiagen)、0.5×TBE+0.5%(v/v)のTriton-X100+1%(v/v)のBME+200g/mL)を導入し、溶解物をトラップに送る。DNAは、隣接するフロー伸展セクションに移動する。油浸対物レンズを、単一分子撮像のために、所定の位置に移動する(100×、NA1.49、追加の1.5×の倍率により、120nm画素の画像サイズが得られる)。DNA断片は、フロー伸展セクションにわたる5~10Vの電圧の印加による電気泳動を使用して、マイクロチャネルからフロー伸展デバイスに導入される。DNA断片の両端が、反対側のマイクロチャネルにある場合、電圧がオフになる。100~150%で伸展された分子の450um部分は、単一細胞から抽出されたゲノムDNAの1メガ塩基超長に対応する。一部の実施形態では、タンパク質分解後、DNA内容物は、0.5×TBEを捕捉緩衝液に置き換えることによって、デバイスを通して押し出され、かかる実施形態では、フロー伸展セクションの寸法は、任意選択的に、より大きく、それのため、数千のメガ塩基の断片が(疎水性相互作用または静電相互作用によって)同時に捕捉され、チャネル内で伸展され得る。これは、pH8の緩衝液(例えば、HEPES)を使用することによって行われ、ここで、結合されるカバーガラスは、APTESまたはポリリジンなどで正に荷電しているか、またはビニルシランカバーガラスが結合され、pH5.5~5.7の0.5MのMES緩衝液を使用して、DNAに流入させ、次いで、MES緩衝液を空気で追従することによってコーミングする。または箔がZeonexを含む場合、分子コーミングは、pH5.7の0.6MのMES緩衝液で行うことができる。
Step 4: Operation Cells and buffer are introduced simultaneously to align the cells along the sidewalls of the microchannel where the traps are located. Single cells are captured and retained within the trap due to buffer flow through the trap of up to 30 nL/min. A lysis buffer consisting of 0.5×TBE + 0.5% (v/v) Triton-X100 + 0.1 uM YOYO-1 (Invitrogen) was loaded into one of the inlets and pumped through the trap at 10 nL/min. Infuse for minutes. The solution is then replaced with buffer without YOYO-1 in all wells to stop staining. Cell nuclei are then exposed to a dose of 1 nW/(um) 2 of blue excitation light for up to 300 seconds, causing partial photonicking of DNA (www.pnas.org/cgi/doi/10.1073/ See SI Annex of pnas.1804194115). The buffer was then changed to a solution containing BME (0.5 x TBE + 0.5% (v/v) Triton-X100 + 1% (v/v) BME), and the intensity of the fluorescent lamp was still adjusted for fluorescence imaging. to the lowest intensity possible. The temperature was then raised to 60° C. and proteolysis solution (>200 μg mL −1 Proteinase K (Qiagen), 0.5×TBE + 0.5% (v/v) Triton-X100 + 1% (v/v) BME+200 g/mL) is introduced and the lysate is sent to the trap. DNA migrates to adjacent flow extension sections. The oil immersion objective is moved into position for single molecule imaging (100×, NA 1.49, additional 1.5× magnification yields an image size of 120 nm pixels). DNA fragments are introduced from the microchannel into the flow extension device using electrophoresis with the application of a voltage of 5-10 V across the flow extension section. When both ends of the DNA fragment are in opposite microchannels, the voltage is turned off. A 450 um portion of the molecule stretched at 100-150% corresponds to over 1 megabase of genomic DNA extracted from a single cell. In some embodiments, after proteolysis, the DNA content is pushed through the device by replacing 0.5×TBE with the capture buffer, and in such embodiments the dimensions of the flow extension section are optionally However, it is larger, so that thousands of megabase fragments can be simultaneously captured (by hydrophobic or electrostatic interactions) and extended within the channel. This is done by using a pH 8 buffer (e.g. HEPES), where the coverslips to be bonded are positively charged such as with APTES or polylysine, or vinylsilane coverslips are bonded, 0.5 M MES buffer at pH 5.5-5.7 is used to wash in the DNA and then combed by following the MES buffer with air. Or if the foil contains Zeonex, molecular combing can be done with 0.6 M MES buffer at pH 5.7.

二本鎖標的核酸が固定化されると、変性溶液である0.5MのNaOHおよび/または6%のDMSOが流し込まれる。すると、単一細胞試料は、本発明の配列決定方法のための準備でき、オリゴヌクレオチドプローブ種の完全なセットが流され、オリゴヌクレオチドプローブ種の結合が撮像される。 Once the double-stranded target nucleic acid is immobilized, a denaturing solution of 0.5 M NaOH and/or 6% DMSO is flushed through. A single cell sample is then ready for the sequencing method of the invention, the complete set of oligonucleotide probe species is flowed, and the binding of the oligonucleotide probe species is imaged.

一部の実施形態では、細胞溶解は、2ステップであり、そのため、RNAは、フロー伸展セクション内を汚染させず、蛍光を引き起こさない。ここで、第1の溶解緩衝液(例えば、DNA挿入YOYO-1色素が添加された、0.5%(v/v)のTritonX-100を含む0.5×TBE)を適用する。この緩衝液は、細胞膜を溶解し、10~20μlのヌクレアーゼ不含H2Oで満たされたトラップ出口に細胞質内容物を遊離し、トラップ内にDNAを含む核が残る(例えば、van Strijp et al.Sci Rep.7:11030(2017)に記載されている)。各細胞の細胞質内容物は溶解後に除去され、廃液出口に流されるか、またはデバイスは、DNAのフロー伸展セクションとは別のRNAのフロー伸展セクションを有するように設計される。一部の実施形態では、RNAは、ポリA RNAを捕捉するオリゴdTでコーティングされた別個のフロー伸展セクションに送られる。一部の実施形態では、RNAのフロー伸展セクションは、ナノウェルまたはナノピットを含み(Marie et al,Nanoscale DOI:10.1039/c7nr06016e)2017)、RNAが捕捉され、酵素試薬を使用して(例えば、ターミナルトランスフェラーゼによるポリA付加を使用して)、捕捉配列を付加するために使用される。核溶解は、第2の緩衝液(0.5%(v/v)のTritonX-100およびプロテイナーゼKを含む0.5×TBE)を用いて行い、DNAは、DNAのフロー伸展セクションに流される。 In some embodiments, cell lysis is in two steps, so RNA does not contaminate the flow extension section and cause fluorescence. Here, a first lysis buffer (eg, 0.5×TBE with 0.5% (v/v) Triton X-100 with added DNA intercalating YOYO-1 dye) is applied. This buffer lyses the cell membrane and releases the cytoplasmic contents into the trap outlet filled with 10-20 μl of nuclease-free HO, leaving the nuclei containing DNA within the trap (see, eg, van Strijp et al. Sci. Rep. 7:11030 (2017)). The cytoplasmic contents of each cell are either removed after lysis and flushed to a waste outlet, or the device is designed to have a flow-extending section for RNA separate from that for DNA. In some embodiments, RNA is directed to a separate flow extension section coated with oligo-dT that captures poly-A RNA. In some embodiments, the flow extension section of RNA comprises nanowells or nanopits (Marie et al, Nanoscale DOI: 10.1039/c7nr06016e) 2017), in which RNA is captured and treated using enzymatic reagents (e.g. (using poly-A addition by terminal transferase) to add capture sequences. Nuclear lysis is performed using a second buffer (0.5×TBE with 0.5% (v/v) Triton X-100 and proteinase K) and the DNA is flowed through the DNA flow extension section. .

核酸の損失を最小化するために、トラップおよびフロー伸展セクションからの距離は短く、デバイス壁は十分に不動態化される(脂質を用いたコーティングによる不動態化を含む)(例えば、Persson et al,Nanoletters 12:2260-5(2012)に記載されている)。 The distance from the trap and flow extension section is short and the device walls are well passivated (including passivation by coating with lipids) to minimize nucleic acid loss (e.g., Persson et al. , Nanoletters 12:2260-5 (2012)).

引用文献および代替実施形態
本明細書で引用されるすべての参考文献は、各々の個々の刊行物または特許もしくは特許出願が、あらゆる目的のために、その全体が参照により援用さることが具体的かつ個別に示されている場合と同じ程度に、あらゆる目的のために、それらの全体が参照により本明細書に援用される。
REFERENCES AND ALTERNATIVE EMBODIMENTS All references cited in this specification are specifically and implied that each individual publication or patent or patent application is incorporated by reference in its entirety for all purposes. To the same extent as if individually indicated, they are hereby incorporated by reference in their entireties for all purposes.

すべての見出しおよび副見出しは、便宜上本明細書でのみ使用され、本発明を決して限定するものとして解釈されるべきではない。 All headings and subheadings are used herein for convenience only and should not be construed as limiting the invention in any way.

本明細書に提供される任意のおよびすべての実施例、または例示的な言語(例えば、「例えば」)の使用は、単に本発明をより良く明らかにすることを意図しており、別段の請求がない限り、範囲を限定するものではない。本明細書におけるいかなる言語も、任意の請求されていない要素を本発明の実施に不可欠であると示すものとして解釈されるべきではない。 The use of any and all examples, or exemplary language (e.g., "for example"), provided herein is merely intended to better clarify the invention, and may not be construed as otherwise claimed. is not intended to limit the scope unless No language in the specification should be construed as indicating any non-claimed element as essential to the practice of the invention.

また、様々な要素を説明するために、本明細書では、第1、第2などの用語を使用するが、これらの要素は、これらの用語によって限定されるべきではないことも理解されたい。これらの用語は、ある要素と別の要素を区別するためにのみ使用される。例えば、第1の対象は、本開示の範囲から逸脱することなく、第2の対象と呼ぶことができ、同様に、第2の対象は、第1の対象と呼ぶことができる。最初の対象と2番目の対象は両方とも同じ対象であるが、同じ対象ではない。 It should also be understood that although the terms first, second, etc. are used herein to describe various elements, these elements should not be limited by these terms. These terms are only used to distinguish one element from another. For example, a first subject could be termed a second subject, and, similarly, a second subject could be termed a first subject, without departing from the scope of this disclosure. Both the first object and the second object are the same object, but they are not the same object.

本開示で使用される専門用語は、特定の実施形態を説明することのみを目的とし、本発明を限定することを意図するものではない。説明および添付の特許請求の範囲で使用される場合、単数形の「a」、「an」、および「the」は、文脈により明らかにそうではないことが示されていない限り、複数形も同様に含むことが意図される。本明細書で使用される「および/または」という用語は、関連する列挙された項目の1つ以上の任意のおよびすべての可能な組み合わせを指し、それを包含することも理解されたい。さらに、「含む(comprises)」および/または「含む(comprising)」という用語は、本明細書で使用される場合、記載された特徴、整数、ステップ、操作、要素、および/または構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しないことを理解されたい。 The terminology used in this disclosure is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. As used in the description and the appended claims, the singular forms "a," "an," and "the" refer to the plural forms as well, unless the context clearly indicates otherwise. intended to be included in It should also be understood that the term "and/or" as used herein refers to and includes any and all possible combinations of one or more of the associated listed items. Furthermore, the terms “comprises” and/or “comprising”, as used herein, do not include the presence of a recited feature, integer, step, operation, element, and/or component. , does not preclude the presence or addition of one or more other features, integers, steps, operations, elements, constituents, and/or groups thereof.

本明細書で使用される場合、用語「~の場合(if)」は、文脈に応じて、「~のとき(when)」または「~の際(upon)」または「決定に応じて(in response to determining)」または「検出に応じて(in response to detecting)」を意味すると解釈される。同様に、「それが決定される場合」または「[記載された状態または事象]が検出される場合」という語句は、文脈に応じて、「決定の際」または「決定に応じて」または「(記載された状態または事象)の検出の際」または「(記載された状態または事象)の検出に応じて」を意味すると解釈される。 As used herein, the term “if,” depending on the context, is “when,” or “upon,” or “in is taken to mean "response to determining" or "in response to detecting". Similarly, the phrases "when it is determined" or "when [the stated condition or event] is detected" are, depending on the context, "upon determination" or "upon determination" or " It is taken to mean "upon detection of (the stated condition or event)" or "in response to detection of (the stated condition or event)".

本明細書における特許文献の引用および援用は、ただ便宜上行われるものであり、かかる特許文献の妥当性、特許性、および/または執行可能性に関するいかなる見解も反映されない。 The citation and incorporation of patent documents herein is done for convenience only and does not reflect any view as to the validity, patentability and/or enforceability of such patent documents.

本発明は、非一時的コンピュータ可読記憶媒体に埋め込まれたコンピュータプログラム機構を含むコンピュータプログラム製品として実装され得る。例えば、コンピュータプログラム製品は、図1Aの任意の組み合わせで示されるプログラムモジュールを含み得る。これらのプログラムモジュールは、CD-ROM、DVD、磁気ディスクストレージ製品、USBキー、またはその他の非一時的コンピュータ可読データもしくはプログラムストレージ製品に記憶することができる。 The present invention may be implemented as a computer program product comprising a computer program mechanism embedded in a non-transitory computer-readable storage medium. For example, a computer program product could include the program modules shown in any combination in FIG. 1A. These program modules may be stored on CD-ROMs, DVDs, magnetic disk storage products, USB keys, or other non-transitory computer readable data or program storage products.

本明細書内の実施形態は、本発明の実施形態の例示を提供し、本発明の範囲を限定すると解釈されるべきではない。当業者は、多くの他の態様および実施形態が、本発明の方法によって包含されることを認識するであろう。本発明の実施形態および以下に提供される技術的詳細は、当業者によって変化させることができ、過度の実験または再発明なしに試験および体系的に最適化することができる。 The embodiments within the specification provide an illustration of embodiments of the invention and should not be construed as limiting the scope of the invention. The skilled artisan will recognize that many other aspects and embodiments are encompassed by the method of the invention. The embodiments of the present invention and the technical details provided below can be varied, tested and systematically optimized without undue experimentation or reinvention by those skilled in the art.

本発明は、本明細書の教示および本明細書に列挙される参考文献に照らして、最も完全に理解される。当業者には明白であるように、その趣旨および範囲から逸脱することなく、多くの修正および変形を行うことができる。本明細書に記載される特定の実施形態は、例としてのみ提供される。本実施形態は、原理およびその実用的な用途を最もよく説明するために選択および記載され、それによって、当業者は、本発明および企図された特定の使用に好適な様々な修正を有する様々な実施形態を最もよく利用することができる。本発明は、添付の特許請求の範囲の条件、およびかかる特許請求の範囲が権利を有する均等物の全範囲によってのみ限定されるべきである。 The invention is most thoroughly understood in light of the teachings herein and the references cited therein. Many modifications and variations can be made without departing from its spirit and scope, as will be apparent to those skilled in the art. Certain embodiments described herein are provided as examples only. The embodiments were chosen and described in order to best explain the principles and practical application thereof, thereby enabling those skilled in the art to make various modifications suitable for the invention and the particular uses contemplated. Embodiments can be best utilized. The invention is to be limited only by the terms of the appended claims, along with the full scope of equivalents to which such claims are entitled.

Claims (37)

核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基からの1つの定義されたヌクレオチド、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
A method of sequencing a nucleic acid, comprising:
(a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid;
(b) exposing the fixed extended/extended nucleic acid to each oligonucleotide probe species in the set of oligonucleotide probe species, each oligonucleotide probe species in the set of oligonucleotide probe species comprising: A library of probe species of defined length, comprising one defined nucleotide from the bases A, C, G, T, and one or more degenerate positions, each degenerate position corresponding to A, C , G, T bases or any mixture of universal base analogues, and said exposing (b) is such that the individual probes of said respective oligonucleotide probe species are complementary to said respective oligonucleotide probe species. exposing, performed under conditions that permit transient and reversible binding to one or more portions of said immobilized nucleic acid, thereby giving rise to each instance of optical activity When,
(c) using an imaging device to measure the location on said test substrate of each respective instance of optical activity occurring during or after said exposure (b);
(d) repeating said exposing (b) and measuring (c) for each oligonucleotide probe species in said set of oligonucleotide probe species, thereby obtaining a set of multiple locations on said test substrate; obtaining each respective set of locations on the test substrate corresponding to an oligonucleotide probe species in the set of oligonucleotide probe species;
(e) determining the sequence of at least a portion of the nucleic acid from the set of locations on the test substrate by compiling the locations on the test substrate represented by the set of locations; and, including, methods.
前記光学活性が、前記オリゴヌクレオチド種上の標識に起因し、前記標識が、ナノ粒子、蛍光分子構造を含む、請求項1に記載の方法。 2. The method of claim 1, wherein said optical activity results from a label on said oligonucleotide species, said label comprising nanoparticles, fluorescent molecular structures. 各オリゴヌクレオチド種が、他の標識から区別されることを可能にする異なる標識で標識される、請求項2に記載の方法。 3. The method of claim 2, wherein each oligonucleotide species is labeled with a different label that allows it to be distinguished from other labels. 前記光学活性が、1つ以上の挿入色素分子を含む二重鎖認識部分による結合相互作用の前記標識に起因する、請求項1に記載の方法。 2. The method of claim 1, wherein said optical activity results from said labeling of binding interactions by a duplex recognition moiety comprising one or more intercalating dye molecules. 前記光学活性が、バルク溶液ではなく、前記固定され伸長/伸展された核酸の近傍でのみ検出される、請求項1に記載の方法。 2. The method of claim 1, wherein said optical activity is detected only in the vicinity of said fixed, elongated/stretched nucleic acid and not in the bulk solution. 前記光学活性が、FRETを介して検出されるか、または、前記標識が、それが前記固定され伸長/伸展された核酸の近傍になるまでクエンチされるか、もしくは蛍光発生性である、請求項5に記載の方法。 10. The optical activity is detected via FRET, or the label is quenched or fluorogenic until it is in the vicinity of the fixed elongated/stretched nucleic acid. 5. The method described in 5. 前記オリゴが、二重標識され、前記二重標識が、各末端にCy3部分を含み、これが、バルク溶液中では色素間(dye-dye)相互作用によって実質的にクエンチされるが、結合時には蛍光する、請求項5に記載の方法。 The oligos are double-labeled, the double-labels containing Cy3 moieties at each end, which are substantially quenched by dye-dye interactions in bulk solution, but which fluoresce upon binding. 6. The method of claim 5, wherein 前記固定され伸長/伸展された核酸が、一本鎖である、請求項1に記載の方法。 2. The method of claim 1, wherein said fixed and elongated/stretched nucleic acid is single stranded. ドリフトが、基板ステージを対物レンズにロックすることによって、最小化される、請求項1に記載の方法。 2. The method of claim 1, wherein drift is minimized by locking the substrate stage to the objective lens. 前記ドリフトが、補正される、請求項1に記載の方法。 2. The method of claim 1, wherein said drift is corrected. 基準ドリフト補正マーカーが、前記固定され伸長/伸展された核酸の近傍で、前記基板上に提供される、請求項1に記載の方法。 2. The method of claim 1, wherein a reference drift correction marker is provided on the substrate in the vicinity of the fixed elongated/stretched nucleic acid. 前記基準ドリフト補正マーカーが、空間的にアドレス指定可能な蛍光シグナルを含む折り紙(Origami)グリッドを含む、請求項10に記載の方法。 11. The method of claim 10, wherein the fiducial drift-corrected marker comprises an Origami grid containing spatially addressable fluorescent signals. 前記空間的にアドレス指定可能な蛍光シグナルが、一過性であり、PAINTまたはDNA PAINT法による撮像剤の結合に起因する、請求項11に記載の方法。 12. The method of claim 11, wherein said spatially addressable fluorescent signal is transient and results from binding of an imaging agent by PAINT or DNA PAINT methods. 前記オリゴプローブ種のセットが、前記固定され伸長/伸展された核酸に同時に曝露され、それらが他の標識から区別されることを可能にする、それらの別個の標識が、各々検出される、請求項3に記載の方法。 wherein said set of oligo probe species are simultaneously exposed to said fixed, elongated/stretched nucleic acid and their distinct labels are each detected, allowing them to be distinguished from other labels. Item 3. The method according to item 3. 配列5’NNNXNNN3’のライブラリを各々含む、4つのプローブ種が使用され、式中、Nが、縮重位置であり、Xが、前記差次的に標識された4つのヌクレオチドの各々である、請求項1に記載の方法。 Four probe species are used, each comprising a library of sequences 5'NNNXNNN3', where N is a degenerate position and X is each of the four differentially labeled nucleotides. The method of claim 1. 核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基を各々含む2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に一過的かつ可逆的に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
A method of sequencing a nucleic acid, comprising:
(a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid;
(b) exposing the fixed extended/extended nucleic acid to each oligonucleotide probe species in the set of oligonucleotide probe species, each oligonucleotide probe species in the set of oligonucleotide probe species comprising: A library of probe species of defined length, comprising two or more defined nucleotide positions each comprising an A, C, G, T base, and one or more degenerate positions, each degenerate position comprising , A, C, G, T bases or any mixture of universal base analogues, wherein said exposure (b) is such that the individual probes of said respective oligonucleotide probe species are is performed under conditions that allow it to transiently and reversibly bind to one or more portions of said immobilized nucleic acid that are complementary to, thereby giving rise to each instance of optical activity, exposing and
(c) using an imaging device to measure the location on said test substrate of each respective instance of optical activity occurring during or after said exposure (b);
(d) repeating said exposing (b) and measuring (c) for each oligonucleotide probe species in said set of oligonucleotide probe species, thereby obtaining a set of multiple locations on said test substrate; obtaining each respective set of locations on the test substrate corresponding to an oligonucleotide probe species in the set of oligonucleotide probe species;
(e) determining the sequence of at least a portion of the nucleic acid from the set of locations on the test substrate by compiling the locations on the test substrate represented by the set of locations; and, including, methods.
核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に線状化され伸長/伸展された形態で固定し、それによって、固定され伸長/伸展された核酸を形成することと、
(b)前記固定され伸長/伸展された核酸を、オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、前記オリゴヌクレオチドプローブ種のセットにおける各オリゴヌクレオチドプローブ種が、所定の長さのプローブ種のライブラリであり、A、C、G、Tの塩基を各々含む2つ以上の定義されたヌクレオチド位置、および1つ以上の縮重位置を含み、各縮重位置が、A、C、G、Tの塩基または普遍的塩基類似体のいずれかの混合物を含み、前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定された核酸の1つ以上の部分に安定して結合することを可能にする条件下で行われ、それによって、照射時に、前記固定された核酸の1つ以上の部分に対応する前記基板上の1つ以上の場所で、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)光学活性の事例の段階的な損失が撮像デバイスを使用して測定/記録されるように、前記光学活性の事例を退色させることと、
(d)前記固定され伸長/伸展された核酸を、結合したオリゴヌクレオチドプローブが解離することを可能にする条件に曝露し、前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)光学活性の各事例のナノメトリック/微調整された場所を計算するために、単一分子局在化アルゴリズムを使用することと、
(f)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
A method of sequencing a nucleic acid, comprising:
(a) immobilizing the nucleic acid in a linearized, elongated/extended form on a test substrate, thereby forming an immobilized elongated/extended nucleic acid;
(b) exposing the fixed extended/extended nucleic acid to each oligonucleotide probe species in the set of oligonucleotide probe species, wherein each oligonucleotide probe species in the set of oligonucleotide probe species is A library of probe species of defined length, comprising two or more defined nucleotide positions each comprising an A, C, G, T base, and one or more degenerate positions, each degenerate position comprising , A, C, G, T bases or any mixture of universal base analogues, and wherein said exposure (b) is such that an individual probe of said respective oligonucleotide probe species comprises said respective oligonucleotide probe under conditions that allow stable binding to one or more portions of said immobilized nucleic acid that are complementary to the species, thereby, upon irradiation, one or more exposing, causing each instance of optical activity at one or more locations on the substrate corresponding to a portion;
(c) bleaching the instances of optical activity such that the gradual loss of instances of optical activity is measured/recorded using an imaging device;
(d) exposing said fixed and elongated/extended nucleic acid to conditions that allow bound oligonucleotide probes to dissociate, and for each oligonucleotide probe species in said set of oligonucleotide probe species, repeating said exposing (b) and measuring (c), thereby obtaining a plurality of sets of locations on said test substrate, each respective set of locations on said test substrate corresponding to said oligo obtaining corresponding oligonucleotide probe species in the set of nucleotide probe species;
(e) using a single-molecule localization algorithm to calculate the nanometric/fine-tuned location of each instance of optical activity;
(f) determining the sequence of at least a portion of the nucleic acid from the set of locations on the test substrate by compiling the locations on the test substrate represented by the set of locations; and, including, methods.
前記オリゴヌクレオチド種が、
5’NNnNnNN3’を含み、式中、Nまたはnは、指定された位置または縮重位置であり、N=LNA部分であり、n=デオキシリボース部分である、請求項16に記載の方法。
said oligonucleotide species comprising:
17. The method of claim 16, comprising 5'NNnNnNN3', wherein N or n are designated or degenerate positions, N = LNA moiety and n = deoxyribose moiety.
前記オリゴヌクレオチド種が、5’cy3 NTgGcGN3’、5’cy3B NTgGcGN3’、5’Atto542 NTgGcGN3’を含む、請求項16に記載の方法。 17. The method of claim 16, wherein said oligonucleotide species comprises 5'cy3 NTgGcGN3', 5'cy3B NTgGcGN3', 5'Atto542 NTgGcGN3'. 前記核酸が二本鎖である場合、前記二本鎖が変性され、両方の鎖が前記基板上に位置し、個々のプローブが結合する前記鎖が、前記基板に結合する前記オリゴヌクレオチドプローブ種の配列の重複から、各鎖についてタイリング経路を構築することによって、逆畳み込みが行われる、請求項16に記載の方法。 When the nucleic acid is double-stranded, the duplex is denatured, both strands are located on the substrate, and the strand to which individual probes are attached is of the oligonucleotide probe species attached to the substrate. 17. The method of claim 16, wherein deconvolution is performed by constructing tiling pathways for each strand from sequence overlaps. 核酸を配列決定する方法であって、
(a)前記核酸を、試験基板上に固定/固定化し、それによって、固定/固定化核酸を形成することと、
(b)前記固定/固定化核酸を、オリゴヌクレオチドプローブ種のセットのそれぞれのオリゴヌクレオチドプローブ種に曝露することであって、
前記曝露(b)が、前記それぞれのオリゴヌクレオチドプローブ種の個々のプローブが、前記それぞれのオリゴヌクレオチドプローブ種に相補的である前記固定/固定化核酸の1つ以上の部分に結合することを可能にする条件下で行われ、それによって、光学活性のそれぞれの事例を生じさせる、曝露することと、
(c)撮像デバイスを使用して、前記曝露(b)中またはその後に生じる光学活性の各それぞれの事例の前記試験基板上の場所を測定することと、
(d)前記オリゴヌクレオチドプローブ種のセットにおけるそれぞれのオリゴヌクレオチドプローブ種に対して、前記曝露(b)および測定(c)を反復し、それによって、前記試験基板上の複数の位置のセットを取得することであって、前記試験基板上の各それぞれの位置のセットが、前記オリゴヌクレオチドプローブ種のセットにおけるオリゴヌクレオチドプローブ種に対応する、取得することと、
(e)前記複数の位置のセットによって表される前記試験基板上の前記位置をコンパイルすることによって、前記試験基板上の前記複数の位置のセットから、前記核酸の少なくとも一部分の配列を決定することと、を含む、方法。
A method of sequencing a nucleic acid, comprising:
(a) immobilizing/immobilizing said nucleic acid on a test substrate, thereby forming an immobilized/immobilized nucleic acid;
(b) exposing said immobilized/immobilized nucleic acid to each oligonucleotide probe species of a set of oligonucleotide probe species;
said exposing (b) enables individual probes of said respective oligonucleotide probe species to bind to one or more portions of said immobilized/immobilized nucleic acid that are complementary to said respective oligonucleotide probe species; exposing, performed under conditions that cause the respective instances of optical activity to occur; and
(c) using an imaging device to measure the location on said test substrate of each respective instance of optical activity occurring during or after said exposure (b);
(d) repeating said exposing (b) and measuring (c) for each oligonucleotide probe species in said set of oligonucleotide probe species, thereby obtaining a set of multiple locations on said test substrate; obtaining each respective set of locations on the test substrate corresponding to an oligonucleotide probe species in the set of oligonucleotide probe species;
(e) determining the sequence of at least a portion of the nucleic acid from the set of locations on the test substrate by compiling the locations on the test substrate represented by the set of locations; and, including, methods.
各プローブ種の複数のオン・オフ結合事象を使用して、前記試験基板上の位置のセットを取得する、請求項20に記載の方法。 21. The method of claim 20, wherein multiple on-off coupling events of each probe species are used to obtain a set of locations on the test substrate. かなりの数(例えば、70%超)の事象が、サブ回折精度で位置決定された単一分子である、請求項21または22に記載の方法。 23. The method of claim 21 or 22, wherein a significant number (eg, >70%) of the events are single molecules located with sub-diffraction accuracy. 前記オリゴヌクレオチドが、構造:
プローブ配列-スペーサー-シールド-標識であって、プローブ配列が、縮重塩基位置および/または特異的塩基位置を含む核酸配列を含み、前記スペーサーが、化学リンカー(例えば、ヘキサエチレングリコールのいくつかの結合)または核酸配列(例えば、18塩基長の配列)のいずれかを含み、前記リンカーが、二官能性であり、かつ前記プローブ配列を前記シールドまたは標識に連結することができ、前記シールドが、タンパク質(例えば、ストレプトアビジン)を含み、前記標識が、蛍光標識またはタグ(蛍光標識もしくは分子撮像剤のドッキング部位として機能する)を含む、プローブ配列-スペーサー-シールド-標識を含む、請求項21に記載の方法。
The oligonucleotide has the structure:
A probe sequence-spacer-shield-label, wherein the probe sequence comprises a nucleic acid sequence containing degenerate base positions and/or specific base positions, and wherein said spacer comprises a chemical linker (e.g., some of hexaethylene glycol). binding) or a nucleic acid sequence (e.g., an 18 base long sequence), the linker being bifunctional and capable of linking the probe sequence to the shield or label, the shield comprising: Claim 21, wherein the label comprises a probe sequence-spacer-shield-label comprising a protein (e.g. streptavidin) and comprising a fluorescent label or tag (functioning as a docking site for a fluorescent label or molecular imaging agent). described method.
前記スペーサーおよび/またはシールドが存在しない、請求項21に記載の方法。 22. The method of claim 21, wherein said spacer and/or shield are absent. 酸素除去/蛍光促進分子システムが、撮像中に提供され、前記システムが、(a)ピラノースオキシダーゼ、カタラーゼ、グルコース、(b)プロトカテク酸-ジオキシゲナーゼ、3,4-プロトカテク酸、(c)カタラーゼ、グルコースオキシダーゼ、スクロースまたはグルコース、(d)メチレンブルーおよびジチオトロール(DTT)、(e)βメルカプトエタノール、TCEP、またはジチオトロール(DTT)を含む還元剤、(f)Trolox、1,3,5,7-シクロオクタテトラエン、および/または4-ニトロベンジルアルコールを含む三重項状態消光剤/蛍光促進剤、のうちの1つ以上を含む、請求項21に記載の方法。 An oxygen scavenging/fluorescence enhancing molecular system is provided during imaging, said system comprising (a) pyranose oxidase, catalase, glucose, (b) protocatechuate-dioxygenase, 3,4-protocatechuate, (c) catalase, reducing agents including glucose oxidase, sucrose or glucose, (d) methylene blue and dithiotrol (DTT), (e) beta-mercaptoethanol, TCEP, or dithiotrol (DTT), (f) Trolox, 1,3,5,7 - Cyclooctatetraene, and/or a triplet state quencher/fluorescence enhancer comprising 4-nitrobenzyl alcohol. 前記オリゴが、高濃度(100nM超)の蛍光標識されたオリゴヌクレオチドを含み、かかる高濃度によるバックグラウンドが、FRET、クエンチング、蛍光発生、光活性化、蛍光ケージを含む機構を使用することによって回避される、請求項21に記載の方法。 By using mechanisms in which said oligos contain fluorescently labeled oligonucleotides at high concentrations (greater than 100 nM) and background from such high concentrations includes FRET, quenching, fluorogenesis, photoactivation, and fluorescence cages. 22. The method of claim 21, which is avoided. 前記核酸が、セルフリー核酸である、請求項20に記載の方法。 21. The method of claim 20, wherein said nucleic acid is a cell-free nucleic acid. 固定化が、非修飾核酸の末端を、疎水性表面に付着させることを含み、前記セルフリー塩基を、前記核酸の前記末端の1つで、MES ph5.5~6の存在下、ビニルシランまたはZeonexの表面に結合させる、請求項27に記載の方法。 Immobilization comprises attaching the ends of an unmodified nucleic acid to a hydrophobic surface, and adding said cell-free base to one of said ends of said nucleic acid in the presence of MES ph 5.5-6, vinylsilane or Zeonex. 28. The method of claim 27, wherein the surface of the 固定化が、セルフリー核酸の末端を、ターミナルトランスフェラーゼを使用して、ヌクレオチドを用いてテール付加し、前記テールを、表面に固定化された相補核酸にハイブリダイズさせることを含む、請求項27に記載の方法。 28. The method of claim 27, wherein immobilizing comprises tailing the ends of the cell-free nucleic acid with nucleotides using a terminal transferase to hybridize the tails to complementary nucleic acids immobilized on the surface. described method. 固定化が、前記セルフリー核酸を環状化し、ローリングサークル増幅によって増幅し、一本鎖アンプリコンを固定化することを含む、請求項27に記載の方法。 28. The method of claim 27, wherein immobilizing comprises circularizing the cell-free nucleic acid, amplifying by rolling circle amplification, and immobilizing single stranded amplicons. 前記アンプリコンが、前記基板上で伸長または伸展されている、請求項21~31のいずれか一項に記載の方法。 A method according to any one of claims 21 to 31, wherein said amplicons are stretched or spread on said substrate. 前記アンプリコンが、ボール状構造に凝縮され、前記基板上に固定化/固定される、請求項30に記載の方法。 31. The method of claim 30, wherein said amplicons are condensed into ball-like structures and immobilized/fixed on said substrate. 前記セルフリー核酸のゲノム起源が、1つ以上のオリゴヌクレオチド種の前記結合によって決定/識別される、請求項27に記載の方法。 28. The method of claim 27, wherein the genomic origin of said cell-free nucleic acid is determined/identified by said binding of one or more oligonucleotide species. 異なる染色体またはゲノム領域の比率が、それらのゲノム起源に従って識別される核酸分子の数を計数することによって決定される、請求項33に記載の方法。 34. The method of claim 33, wherein the proportion of different chromosomal or genomic regions is determined by counting the number of nucleic acid molecules that are distinguished according to their genomic origin. 試料の胎児画分が決定される、請求項34に記載の方法。 35. The method of claim 34, wherein the fetal fraction of the sample is determined. 一塩基バリアントまたはインデルが、1つ以上のオリゴの、核酸分子(それらのゲノム起源に従って識別される)への結合を分析することによって決定される、請求項33に記載の方法。
34. The method of claim 33, wherein single nucleotide variants or indels are determined by analyzing binding of one or more oligos to nucleic acid molecules (identified according to their genomic origin).
JP2021570322A 2019-05-29 2020-05-27 Sequencing by appearance Pending JP2022534920A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/425,929 US11427867B2 (en) 2017-11-29 2019-05-29 Sequencing by emergence
US16/425,929 2019-05-29
PCT/US2020/034726 WO2020243187A1 (en) 2019-05-29 2020-05-27 Sequencing by emergence

Publications (2)

Publication Number Publication Date
JP2022534920A true JP2022534920A (en) 2022-08-04
JPWO2020243187A5 JPWO2020243187A5 (en) 2023-06-06

Family

ID=73553066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021570322A Pending JP2022534920A (en) 2019-05-29 2020-05-27 Sequencing by appearance

Country Status (7)

Country Link
EP (1) EP3976828A4 (en)
JP (1) JP2022534920A (en)
KR (1) KR20220034054A (en)
CN (1) CN114207149A (en)
AU (1) AU2020282704A1 (en)
CA (1) CA3140900A1 (en)
WO (1) WO2020243187A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022232709A2 (en) * 2021-04-06 2022-11-03 Xgenomes Corp. Systems, methods, and compositions for detecting epigenetic modifications of nucleic acids
EP4216220A1 (en) * 2022-01-25 2023-07-26 Leica Microsystems CMS GmbH Data storage device and method for storing data
WO2023250364A1 (en) * 2022-06-21 2023-12-28 Nautilus Subsidiary, Inc. Method for detecting analytes at sites of optically non-resolvable distances
CN116596933B (en) * 2023-07-18 2023-09-29 深圳赛陆医疗科技有限公司 Base cluster detection method and device, gene sequencer and storage medium

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2755149B1 (en) * 1996-10-30 1999-01-15 Pasteur Institut METHOD FOR DIAGNOSING GENETIC DISEASES BY MOLECULAR COMBING AND DIAGNOSTIC KIT
US7071324B2 (en) * 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
WO2003008623A2 (en) * 2001-07-15 2003-01-30 Keck Graduate Institute Methylation analysis using nicking agents
US7276338B2 (en) * 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
CN108603227A (en) * 2015-11-18 2018-09-28 卡利姆·U·米尔 Super-resolution is sequenced
WO2019108853A1 (en) * 2017-11-29 2019-06-06 Xgenomes Corp. Sequencing of nucleic acids by emergence

Also Published As

Publication number Publication date
EP3976828A4 (en) 2023-06-28
EP3976828A1 (en) 2022-04-06
WO2020243187A1 (en) 2020-12-03
KR20220034054A (en) 2022-03-17
CA3140900A1 (en) 2020-12-03
AU2020282704A1 (en) 2022-01-27
CN114207149A (en) 2022-03-18

Similar Documents

Publication Publication Date Title
US20240117413A1 (en) Sequencing by emergence
US11427867B2 (en) Sequencing by emergence
KR102187291B1 (en) Chemical composition and how to use it
JP7457457B2 (en) Method for detecting target nucleic acids in samples
JP2022534920A (en) Sequencing by appearance
US11827930B2 (en) Methods of sequencing with linked fragments
JP2020513741A (en) Connected ligation
US20220359040A1 (en) Systems and methods for determining sequence
US10851411B2 (en) Molecular identification with subnanometer localization accuracy
US20200082913A1 (en) Systems and methods for determining sequence
US20210198731A1 (en) Linked target capture and ligation
US20220073980A1 (en) Sequencing by coalescence
US11905556B2 (en) Linked target capture

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230529