JP6726316B2 - ナノポア配列決定からのac信号の定期分析 - Google Patents

ナノポア配列決定からのac信号の定期分析 Download PDF

Info

Publication number
JP6726316B2
JP6726316B2 JP2018567285A JP2018567285A JP6726316B2 JP 6726316 B2 JP6726316 B2 JP 6726316B2 JP 2018567285 A JP2018567285 A JP 2018567285A JP 2018567285 A JP2018567285 A JP 2018567285A JP 6726316 B2 JP6726316 B2 JP 6726316B2
Authority
JP
Japan
Prior art keywords
data
voltage
nanopore
voltage data
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018567285A
Other languages
English (en)
Other versions
JP2019527819A (ja
Inventor
バジャージ,カピル・エム・エス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2019527819A publication Critical patent/JP2019527819A/ja
Application granted granted Critical
Publication of JP6726316B2 publication Critical patent/JP6726316B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • G01N27/3278Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction involving nanosized elements, e.g. nanogaps or nanoparticles

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Nanotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本開示は、ナノポア配列決定からのAC信号の定期分析(period−to−period analysis)に関する。
内径が1ナノメートル程度のポアサイズを有するナノポア膜装置は、迅速なヌクレオチド配列決定において見込みを示してきた。電圧信号が導電性流体に浸漬されたナノポアを横断して印加されるとき、電界は、イオンを、ナノポアを通り導電性流体内を移動させ得る。ナノポアを通る導電性流体内でのイオンの移動は、わずかなイオン電流をもたらし得る。印加電圧は、分子をさらに移動させ、ナノポア内へ、ナノポアを通り、又はナノポアの外に、配列させ得る。イオン電流(又は対応する電圧)のレベルは、ナノポア及びナノポア内に移動された個々の分子の、サイズ及び化学的構造に依存する。
ナノポアを通り移動するDNA分子(又は配列決定されることになる他の核酸分子)の代替として、分子(例えば、DNA鎖に加えられたヌクレオチド)は、個々のサイズ及び/又は構造の個々のタグを含み得る。ナノポアを含む回路内のイオン電流又は電圧(例えば、積分コンデンサでの)は、分子に対応するナノポアの抵抗の測定方法として測定され得て、それによりナノポア内の個々の分子、及び核酸の特定の位置の特定のヌクレオチドの検出が可能になる。
ナノポアベースの配列決定チップは、DNA配列決定に用いられ得る。ナノポアベースの配列決定チップは、アレイとして構成される多数のセンサセルを組み込み得る。例えば、100万個のセルのアレイは、1000行×1000列のセルを含み得る。
測定される電圧は、製造のばらつきにより、チップ毎に、かつ同一チップ内のセル毎に変化し得る。そのため、セル内の特定の核酸又は他の重合体の中の本当のヌクレオチドであり得る、又はそれに対応し得る、本当の分子を測定することは困難であり得る。
したがって、改善された技術が、配列決定のために所望される。
実施形態は、ナノポアに印加されるAC波形を用いる、ナノポア配列決定の一次分析用の、信号処理及び塩基分類(base−calling)のためのシステム、方法、機器、及び器具を提供し得る。識別手法が使用され得る。
いくつかの実施形態では、識別方式は、1期間又はn期間に基づき得る。複数の識別方式を、位置決め事象に適時施すことも可能であり、この場合、ある事象は、ナノポア内に移動するヌクレオチドに取り付けられたタグを用いて検出され得るので、核酸に加えられようとしている、あるヌクレオチドに対応し得る。充填必要時間(TTT)、滞留時間などの異なる測定値が、取得され得る。
他の実施形態は、本明細書で説明される方法に関連付けられるシステム、可搬型消費者デバイス、及びコンピュータ可読媒体向けである。
本発明の実施形態の性質及び利点のより良好な理解は、以下の詳細な説明及び添付図面を参照することで得られ得る。
ナノポアセルのアレイを備えるナノポアセンサチップの一実施形態の上面図である。 ポリヌクレオチド又はポリペプチドを特徴づけるために使用され得る、ナノポアセンサチップ内のナノポアセルの一実施形態である。 ナノポアベースの、合成による配列決定(ナノ−SBS)技術を用いてヌクレオチド配列決定を実行するナノポアセルの一実施形態である。 ナノポアセル内の電気回路の一実施形態である。 本開示のある態様による、ACサイクルの明期間及び暗期間中のナノポアセルから取得されたデータポイントの例である。 本開示のある態様による、電圧データの周期性を示すサンプルデータである。 本開示のある態様による、電圧データが1つの充填事象を有するときの、差分データを決定するための電圧データの変位である。 本開示のある態様による、電圧データが3つの充填事象を有するときの、差分データを決定するための電圧データの変位である。 本開示のある態様による、電圧データの時間変位の例を示す概略図である。 本開示のある態様による、差分データから計算され得るパラメータの例である。 本開示のある態様による、ナノポア配列決定からのAC信号の定期分析の一例の方法を示すフローチャートである。 図12Aは、本開示のある態様による、処理された差分データと、事象を示す未処理のADCデータとの比較を示すサンプルデータである。図12Bは、本開示のある態様による、処理された差分データと、事象を示す未処理のADCデータとの比較を示すサンプルデータである。 本開示のある態様による、提案される方法で処理された信号と、充填事象を示す未処理のADC信号との比較を示すサンプルデータである。 本開示のある態様による、提案される方法で処理された信号と、充填事象を示す未処理のADC信号との比較を示すサンプルデータである。 図14Aは、本開示のある態様による、提案される方法で処理された信号と、充填事象を示す未処理のADC信号との比較を示すサンプルデータである。図14Bは、本開示のある態様による、提案される方法で処理された信号と、充填事象を示す未処理のADC信号との比較を示すサンプルデータである。 本開示のある態様によるシステム及び方法と共に使用可能な一例のコンピュータシステムのブロック図である。
用語
別途定義されない限り、本明細書で用いられる技術的及び科学的な用語は、当業者によって一般に理解される意味と同様の意味を有する。本明細書で説明される方法、装置、及び材料と同様の又は同等のものが、開示された技術の実施で使用され得る。以下の用語は、頻繁に使用される一定の用語の理解を支援するために提供され、本開示の範囲を限定することを意味しない。本明細書で用いられる略語は、化学的及び生物学の分野でのその従来の意味を有する。
「核酸」は、デオキシリボヌクレオチド又はリボヌクレオチド、及び一本又は二本鎖の何れかの形態の、その重合体を指し得る。この用語は、合成の、自然発生的、非自然発生的であり、参照核酸と同様の結合特性を有し、参照ヌクレオチドと同様の挙動で代謝する、周知のヌクレオチドの類似物又は修飾された主鎖の残基又は連鎖を含む核酸を包含し得る。そのような類似物の例は、それだけには限らないが、ホスホロチオエート、ホスホルアミダイト、メチルホスホン酸塩、キラルメチルホスホン酸塩、2−O−メチルリボヌクレオチド、ペプチド核酸(PNAs)を含み得る。別途規定されていない限り、個々の核酸配列は、明示的に示された配列だけでなく、従来の方法で修飾されたその変形形態(例えば、縮重コドン置換)及び相補的配列を、暗黙的に包含する。具体的には、縮重コドン置換は、1つ又は複数の選択された(又は全ての)コドンの第3の位置が、混合塩基及び/又はデオキシイノシン残基で置換される、配列を発生させることによって達成され得る(Batzerら、Nucleic Acid Res.19:5081 (1991)、Ohtsukaら、J.Biol.Chem.260:2605−2608(1985)、Rossoliniら、Mol.Cell.Probes 8:91−98(1994))。用語、核酸は、遺伝子、cDNA、mRNA、オリゴヌクレオチド、及びポリヌクレオチドと交換可能に用いられ得る。
用語「鋳型」は、DNA合成のためのDNAヌクレオチドの相補的鎖へ複製される一本鎖核酸分子を示し得る。場合によっては、鋳型は、mRNAの合成中に複製されるDNAの配列を示し得る。
用語「プライマ」は、DNA合成の開始点を提供する短い核酸配列を示し得る。DNAポリメラーゼなどのDNA合成を触媒する酵素は、新らたなヌクレオチドをDNA複製用プライマに加え得る。「ポリメラーゼ」は、鋳型を用いたポリヌクレオチドの合成を行う酵素を示す。この用語は、完全な長さのポリペプチドとポリメラーゼ活性を有する範囲とを両方とも包含する。DNAポリメラーゼは、当業者によく知られており、それだけに限定されないが、パイロコッカス・フリオサス、サーモコッカス・リトラリス、及びサーモトガ・マリティマ(Thermotoga maritime)から分離もしくは派生したDNAポリメラーゼ、又はその変形版を含む。それらは、DNA依存性ポリメラーゼと、逆転写酵素などのRNA依存性ポリメラーゼとを両方とも含む。DNA依存性DNAポリメラーゼは、ほとんどがファミリーA、B、及びCに分類されるものの、少なくとも5つのファミリーが知られている。多様なファミリー間での、配列の類似性はわずか又は皆無である。最多のファミリーAポリメラーゼは、ポリメラーゼ、3’→5’エキソヌクレアーゼ活性及び5’→3’エキソヌクレアーゼ活性を含む、複数の酵素機能を含み得る、単鎖のタンパク質である。ファミリーBポリメラーゼは通常、ポリメラーゼ及び3’→5’エキソヌクレアーゼ活性を有する単一の触媒領域、並びに副次的要素を有する。ファミリーCポリメラーゼは通常、ポリメラーゼ及び3’→5’エキソヌクレアーゼ活性を有するマルチサブユニットのタンパク質である。大腸菌では、DNAポリメラーゼI(ファミリーA)、II(ファミリーB)、及びIII(ファミリーC)の、3つのタイプのDNAポリメラーゼが見つかっている。真核細胞では、3つの異なるファミリーBのポリメラーゼである、DNAポリメラーゼα、δ、及びεが、核の複製に関与し、ファミリーAポリメラーゼであるポリメラーゼγが、ミトコンドリアDNA複製に使用される。他のタイプのDNAポリメラーゼは、ファージポリメラーゼを含む。同様に、RNAポリメラーゼは通常、ファージ及びウイルスポリメラーゼだけでなく、真核性RNAポリメラーゼI、II、及びIII、並びにバクテリアRNAポリメラーゼを含む。RNAポリメラーゼは、DNA依存性及びRNA依存性であり得る。
「ナノポア」は、膜内に、形成又は配置された、細孔、流路又は通路を示す。膜は、脂質二重層などの有機膜、又は高分子材料から形成される膜などの合成膜であり得る。ナノポアは、例えば相補型金属酸化膜半導体(CMOS)又は電界効果トランジスタ(FET)回路などの、検知回路に結合された検知回路又は電極に、隣接又は近接して配置され得る。いくつかの実施例では、ナノポアは、0.1ナノメートル(nm)〜約1000nmの水準の特徴的な幅又は直径を有する。一部のナノポアは、タンパク質である。
「ヌクレオチド」は、自然に発生するリボヌクレオチド又はデオキシリボヌクレオチド単量体を指すことに加えて、状況が明確にそうでないことを示さない限り、ヌクレオチドが使用されている個々の状況(例えば、相補的塩基へのハイブリッド形成法)に関して、機能的に同等である誘導体及び類似物を含む、関連するその構造的変形形態を指すと理解され得る。
「タグ」は、原子又は分子、あるいは原子又は分子の集合であり得る、検出可能な部分を指す。タグは、光学的、電気化学的、磁気的、静電的(例えば、誘導性、容量性)識別特性(signature)を提供し得て、その識別特性がナノポアの支援により検出され得る。通常、ヌクレオチドにタグが取り付けられているとき、それは、「タグ付けされたヌクレオチド」と呼ばれる。タグは、リン酸塩部分を介してヌクレオチドに取り付けられ得る。
本明細書で用いられるとき、用語「明期間」は、通常、タグ付けされたヌクレオチドのタグが、AC信号を通して印加される電界によってナノポア内に押し込まれる期間を指す。用語「暗期間」は、通常、タグ付けされたヌクレオチドのタグが、AC信号を通して印加される電界によってナノポア外に押し出される期間を指す。ACサイクルは、明期間及び暗期間を含み得る。異なる実施形態では、ナノポアセルを明期間(又は暗期間)内に入れるためにナノポアセルに印加される電圧信号の極性は、異なり得る。
一次分析のある一定の方法は、AC信号がナノポアに印加されるナノポア配列決定によって発生する、ACデータ(交流電圧の印加からの結果)の信号処理、及び処理済みデータの塩基分類を行うための多数のパラメータを使用する。多数のパラメータを使用することは、遅く、雑音があり、特に新しいシステムに初めて適用されるとき、多数のパラメータを有することで堅牢性に欠けることがある。そのようなフィルタリングは、その独特の人為構造(使用されるフィルタ及びそのパラメータによる)を導入し得て、雑音を増幅し、誤差を塩基分類及び配列に伝播させ得る。一次分析の性能(速度、感度、精度など)は、重要である。
いくつかの実施形態では、ACデータの1サイクルに対応する電圧測定値間の差分が算出され、差分データが、ナノポア内のタグの充填事象を識別するために分析されるが、ここでタグは、個々のヌクレオチドに対応する。いくつかの利点は、簡潔、高速、堅牢(多数の又は何れの外部パラメータも必要としない)であること、何れのフィルタリングも必要とせず、FPGA及びGPU内で容易に実行でき、ほとんどの雑音(ADC雑音以外の)を首尾よく除去できることを含み得る。加えて、連続する塩基分類は、雑音に影響されにくくするように、統合されたデータ上で実行され得る。実施形態は、隣接する又はそうでなければ近傍のサイクル(本明細書で局所近傍とも示される)からの対応する点の差分を用い得て、実施形態は、例えばゲインのドリフトのベースライン移動の補正など、未処理のデータでの局所的な系統的変動に順応し得る。
I.ナノポアベースの配列決定チップ
図1は、ナノポアセル150のアレイ140を備えるナノポアセンサチップ100の一実施形態の上面図である。各ナノポアセル150は、ナノポアセンサチップ100のシリコン基板上に集積化された制御回路を備える。いくつかの実施形態では、側壁136は、アレイ140に含まれ、ナノポアセル150のグループを分離し得て、その結果、各グループは、特徴づけのための異なるサンプルを受け取り得る。各ナノポアセルは、核酸を配列決定するために用いられ得る。いくつかの実施形態では、ナノポアセンサチップ100は、カバープレート130を備え得る。いくつかの実施形態では、ナノポアセンサチップ100は、コンピュータプロセッサなどの他の回路とインタフェースする複数のピン110も備え得る。
いくつかの実施形態では、ナノポアセンサチップ100は、例えばマルチチップモジュール(MCM)又はシステムインパッケージ(SiP)などのように同一のパッケージ内に複数チップを含み得る。チップは、例えば、メモリ、プロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、データコンバータ、高速I/Oインタフェースなどを含み得る。
いくつかの実施形態では、ナノポアセンサチップ100は、例えば、脂質懸濁液又は他の膜構造化懸濁液、分析物溶液、及び/又は他の液体、懸濁液、又は固体を送達するためのピペット、ロボットアーム、コンピュータプロセッサ、並びに/あるいはメモリなどの分析物送達メカニズムを含む、本明細書で開示されるプロセスの多様な実施形態を実行する(例えば、自動的に実行する)ための多様な構成要素を含み得るナノチップワークステーション120に結合され(例えば、ドッキングされ)得る。複数のポリヌクレオチドが、ナノポアセル150のアレイ140上で検出され得る。いくつかの実施形態では、各々のナノポアセル150は、個別にアドレス可能であり得る。
II.ナノポア配列決定セル
ナノポアセンサチップ100内のナノポアセル150は、多数の異なる方法で実施され得る。例えば、いくつかの実施形態では、異なるサイズ及び/又は化学的構造のタグが、配列決定されるために、核酸分子内の異なるヌクレオチドに取り付けられ得る。いくつかの実施形態では、配列決定されることになる核酸分子の鋳型への相補鎖が、別の仕方で重合体がタグ付けされたヌクレオチドを鋳型とハイブリッド形成することによって、合成され得る。いくつかの実施態様では、核酸分子及び取り付けられたタグは、両方ともナノポアを通り移動し、ナノポアを通過するイオン電流が、ヌクレオチドに取り付けられたタグの個々のサイズ及び/又は構造によって、ナノポア内に存在するヌクレオチドを示し得る。いくつかの実施態様では、タグだけが、ナノポア内へ移動し得る。ナノポア内で異なるタグを検出するために、多数の異なる方法も存在し得る。
A.ナノポア配列決定セル構造
図2は、ポリヌクレオチド又はポリペプチドを特徴づけるために使用され得る、図1のナノポアセンサチップ100内のナノポアセル150のような、ナノポアセンサチップ内の一例のナノポアセル200の一実施形態を示す。ナノポアセル200は、誘電体層201及び204から形成された凹部205と、凹部205を覆って形成された脂質二重層214と、脂質二重層214上の、脂質二重層214によって凹部205から分離された試料室215とを、含み得る。凹部205は、ある体積の電解質206を収容し得て、試料室215は、例えば、可溶性タンパク質ナノポア膜貫通分子複合体(PNTMC)などのナノポア、及び対象の分析物(例えば、配列決定されることになる核酸分子)を収容するバルク電解質208を保持し得る。
ナノポアセル200は、凹部205の底部に作用電極202と、試料室215内に配置された対電極210とを含み得る。信号源228は、電圧信号を作用電極202と対電極210との間に印加し得る。単一のナノポア(例えば、PNTMC)が、電圧信号による電気穿孔法プロセスによって脂質二重層214内へと挿入され、それにより脂質二重層214内のナノポア216を形成し得る。アレイ内の個々の膜(例えば、脂質二重層214又は他の膜構造)は、化学的にも電気的にも互いに接続されていないこともある。それゆえ、アレイ内の各ナノポアセルは、独立した配列決定機械であり、対象の分析物に対して作用し、そうでなければ不透過性の脂質二重層を介してイオン電流を調節するナノポアに関連付けられる、単一のポリマー分子に固有のデータを生成する。
図2に示すように、ナノポアセル200は、シリコン基板などの基板230上に形成され得る。誘電体層201は、基板230上に形成され得る。誘電体層201を形成するために用いられる誘電体材料は、例えば、ガラス、酸化物、窒化物、その他を含み得る。電気的刺激を制御し、ナノポアセル200から検出されるデータを処理する電気回路222は、基板230上及び/又は誘電体層201内部に形成され得る。例えば、複数のパタニングされた金属層(例えば、金属1〜金属6)が、誘電体層201内に形成され、複数の能動デバイス(例えば、トランジスタ)が、基板230上に製造され得る。いくつかの実施形態では、信号源228は、電気回路222の一部に含まれる。電気回路222は、例えば、増幅器、積算器、アナログデジタル変換器、ノイズフィルタ、フィードバック制御ロジック、及び/又は多様な他の構成要素を含み得る。電気回路222は、メモリ226に結合されたプロセッサ224にさらに結合され得て、ここでプロセッサ224は、アレイ内に配列されている重合体分子の配列を決定するために、配列決定データを分析することができる。
作用電極202は、誘電体層201上に形成され、凹部205の底部の少なくとも一部を形成し得る。いくつかの実施形態では、作用電極202は、金属電極である。非ファラデー性伝導のために、作用電極202は、腐食及び酸化に耐性を示す、例えば、白金、金、チタン窒化物、及びグラファイトなどの金属又は他の材料で形成され得る。例えば、作用電極202は、電気めっきを用いた白金電極であってもよい。別の実施例では、作用電極202は、チタン窒化物(TiN)作用電極であってもよい。作用電極202は、多孔質であってもよく、それによりその表面積及び結果として生じる作用電極202に付随するキャパシタンスを増大させ得る。ナノポアセルの作用電極は、別のナノポアセルの作用電極から独立していることもあることから、作用電極は、本開示内でセル電極と呼ばれ得る。
誘電体層204は、誘電体層201上に形成され得る。誘電体層204は、凹部205を囲む壁を形成する。誘電体層204を形成するために用いられる誘電体材料は、例えば、ガラス、酸化物、シリコン一窒化物(SiN)、ポリイミド、又は他の適切な疎水性の絶縁材料を含み得る。誘電体層204の上面は、シラン処理され得る。シラン処理は、誘電体層204の上面の上に疎水性層220を形成し得る。いくつかの実施形態では、撥水性層220は、約1.5ナノメートル(nm)の厚さを有する。
誘電体層204の壁によって形成される凹部205は、作用電極202の上の電解質206の体積を含む。電解質206の体積は、緩衝性を有し、以下の、塩化リチウム(LiCl)、塩化ナトリウム(NaCl)、塩化カリウム(KCl)、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム(CaCl)、塩化ストロンチウム(SrCl)、塩化マンガン(MnCl)、及び塩化マグネシウム(MgCl)、のうちの1つ又は複数を含み得る。いくつかの実施形態では、電解質206の体積は、約3マイクロメートル(μm)の厚さを有する。
図2にも示すように、膜は、誘電体層204の上面に形成され、凹部205全体に及ぶ。いくつかの実施形態では、膜は、疎水性層220の上面に形成された脂質単一層218を含み得る。膜が凹部205の開口に達したとき、脂質単一層218は、凹部205の開口全体に及ぶ脂質二重層214に遷移し得る。脂質二重層は、例えば、ジフィタノイル−ホスファチジルコリン(DPhPC)、1,2−ジフィタノイル−sn−グリセロ−3−ホスホコリン、1,2−ジ−O−フィタニル−sn−グリセロ−3−ホスホコリン(DoPhPC)、パルミトイル−オレオイル−ホスファチジルコリン(POPC)、ジオレオイル−ホスファチジル−メチルエステル(DOPME)、ジパルミトイルホスファチジルコリン(DPPC)、ホスファチジルコリン、ホスファチジルエタノールアミン、ホスファチジルセリン、ホスファチジン酸、ホスファチジルイノシトール、ホスファチジルグリセロール、スフィンゴミエリン、1,2−ジ−O−フィタニル−sn−グリセロール、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−350]、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−550]、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−750]、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−1000]、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−2000]、1,2−ジオレオイル−sn−グリセロ−3−ホスホエタノールアミン−N−ラクトシル、GM1ガングリオシド、リゾホスファチジルコリン(LPC)又はその任意の組合せから選択されるリン脂質を含み、又はそれらから構成され得る。
示したように脂質二重層214には、例えば、単一のPNTMCによって形成された単一のナノポア216が埋め込まれる。上述のように、ナノポア216は、単一のPNTMCを脂質二重層214内に電気穿孔法によって挿入することによって、形成され得る。ナノポア216は、対象の分析物及び/又は小さなイオン(例えば、Na、K、Ca2+、Cl)の少なくとも一部分を脂質二重層214の両側間を通過させるのに十分に大きくてもよい。
試料室215は、脂質二重層214を覆っており、特徴づける対象の分析物の溶液を保持し得る。溶液は、バルク電解質208を含み、最適なイオン濃度への緩衝性を有し、ナノポア216を開口状態に維持するために最適なpHに維持された水性溶液であり得る。ナノポア216は、脂質二重層214を横切り、バルク電解質208から作用電極202へのイオン流のための唯一の経路を提供する。ナノポア(例えば、PNTMC)及び対象の分析物に加えて、バルク電解質208は、塩化リチウム(LiCl)、塩化ナトリウム(NaCl)、塩化カリウム(KCl)、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム(CaCl)、塩化ストロンチウム(SrCl)、塩化マンガン(MnCl)、及び塩化マグネシウム(MgCl)、のうちの1つ又は複数をさらに含み得る。
対電極(CE)210は、電気化学的電位センサであり得る。いくつかの実施形態では、対電極210は、複数ナノポアセル間で共有され、それゆえ、共通電極とも称され得る。いくつかの場合では、共通の電位及び共通電極は、全てのナノポアセルに対して、又は少なくとも個々のグループ内の全てのナノポアセルに対して共通であり得る。共通電極は、共通の電位を、ナノポア216と接触するバルク電解質208に印加するように構成可能である。対電極210及び作用電極202は、脂質二重層214を横断する電気的刺激(例えば、電圧バイアス)を供給するための信号源228に結合され、脂質二重層214の電気的特性(例えば、抵抗、電気容量、及びイオン電流)を検知のために用いられ得る。いくつかの実施形態では、ナノポアセル200は、参照電極212も含み得る。
いくつかの実施形態では、多様なチェックが、較正の一部としてナノポアセルの作成中に実施され得る。ナノポアセルが作成されたあと、さらなる較正ステップが、例えば、所望されるように(例えば、セル中に1ナノポア)実行しているナノポアセルを識別するために、実行されてもよい。そのような較正チェックは、物理的チェック、電圧較正、開放流路較正、及び単一のナノポアを有するセルの識別を含み得る。
B.ナノポア配列決定セルの信号検出
ナノポアセンサチップ100内のナノポアセル150などのナノポアセンサチップ内のナノポアセルは、合成による単分子ナノポアベースの配列決定(ナノ−SBS)技術を用いる並行配列決定を可能にし得る。
図3は、ナノ−SBS技術を用いてヌクレオチド配列決定を実行するナノポアセル300の一実施形態を示す。ナノ−SBS技術では、配列決定されることになる鋳型332(例えば、ヌクレオチド酸分子又は別の対象の分析物)及びプライマは、ナノポアセル300の試料室内のバルク電解質308内に導入され得る。例として、鋳型332は、円形状又は直線状であり得る。核酸プライマは、4つの別の仕方で重合体がタグ付けされたヌクレオチド338が付加され得る、鋳型332の一部にハイブリッド形成され得る。
いくつかの実施形態では、酵素(例えば、DNAポリメラーゼなどのポリメラーゼ334)が、鋳型332への相補鎖を合成するのに用いるナノポア316に関連付けられ得る。例えば、ポリメラーゼ334は、ナノポア316に共有結合していてもよい。ポリメラーゼ334は、ヌクレオチド338のプライマ上への、一本鎖核酸分子を鋳型として用いる取り込みを触媒する。ヌクレオチド338は、4つの異なるタイプA、T、G又はCのうちの1つであるヌクレオチドを伴うタグ種(「タグ」)を含み得る。タグ付けされたヌクレオチドが、ポリメラーゼ334と正しく複合体を形成するとき、タグは、電気的な力、例えば、脂質二重層314及び/又はナノポア316を横断して印加される電圧により生成される電界の存在下で生成される力によってナノポア内に引き込まれ(装填され)得る。タグの尾部は、ナノポア316の筒内に位置決めされ得る。ナノポア316の筒内に保たれるタグは、タグの別個の化学的な構造及び/又はサイズにより、固有のイオン遮断信号340を生成し、それにより、タグが取り付けられた付加された塩基を、電子的に同定する。
本明細書で用いられるとき、「装填された」又は「充填された」タグは、認識可能な長さの時間、例えば、0.1ミリ秒(ms)から10000msの間、ナノポア内に位置決めされる、及び/又は、ナノポア内又は近くに留まるタグでもよい。いくつかの場合では、タグは、ヌクレオチドから放出される前に、ナノポア内に装填される。いくつかの例では、装填されたタグが、ヌクレオチド組み込み事象の際に放出されたあとにナノポアを通過する(及び/又はナノポアにより検出される)確率が適度に高く、例えば90%から99%である。
いくつかの実施形態では、ポリメラーゼ334がナノポア316に接続される前に、ナノポア316のコンダクタンスは、例えば約300ピコジーメンス(300pS)のように高いことがあり得る。タグがナノポア内に装填されるとき、固有のコンダクタンス信号(例えば、信号340)は、タグの別個の化学構造及び/又はサイズにより生成される。例えば、ナノポアのコンダクタンスは、約60pS、80pS、100pS又は120pSであり、それぞれは、タグ付けされたヌクレオチドの4つのタイプのうちの1つに対応する。ポリメラーゼは、次に異性化及びリン酸基転移反応を経て、ヌクレオチドを成長している核酸分子内に組み込み、タグ分子を放出する。
いくつかの場合では、タグ付けされたヌクレオチドのいくつかは、核酸分子(鋳型)の目下の位置(相補的塩基)と一致し得ない。核酸分子と塩基対合されていないタグ付けされたヌクレオチドも、ナノポアを通過し得る。これらの対合されていないヌクレオチドは、典型的には、正しく対合されたヌクレオチドがポリメラーゼと結合したままである時間スケールより短い時間スケール内で、ポリメラーゼによって拒絶される。対合されていないヌクレオチドに結合されたタグは、ナノポアを迅速に通過し、短期間(例えば、10ms未満)の間検出され得て、一方、対合したヌクレオチドに結合されたタグは、ナノポア内に装填され、長期間(例えば、少なくとも10ms)の間検出され得る。それゆえ、対合されていないヌクレオチドは、ヌクレオチドがナノポア内で検出される時間に少なくとも部分的に基づいて、下流のプロセッサによって識別され得る。
装填された(充填された)タグを含むナノポアのコンダクタンス(又は等価的に抵抗)が、ナノポアを通過する電流を介して測定され得て、タグ種の識別、それによる目下の位置にあるヌクレオチドを提供する。いくつかの実施形態では、直流(DC)信号が、ナノポアセルに印加され得る(例えば、タグがナノポアを通って移動する方向が反転しないように)。しかし、直流を用いた長期間のナノポアセンサの運転は、電極の組成を変化させ得て、ナノポア全体のイオン濃度を不平衡にさせ、ナノポアセルの寿命に影響し得る他の望ましくない効果を有し得る。交流(AC)波形を印加することは、電界移動を低減し、これらの望ましくない効果を回避し、下記のある一定の利点を有し得る。タグ付けされたヌクレオチドを利用する本明細書で説明される核酸配列決定方法は、印加されるAC電圧に完全に共存可能であり、それゆえAC波形が、これらの利点を達成するために用いられ得る。
AC検出サイクルの間に電極を再充電する能力は、犠牲電極、電流通過反応で分子特性を変化させる電極(例えば、銀を含む電極)、又は電流通過反応で分子特性を変化させる電極が使用されるとき、有益であり得る。電極は、直流信号が使用されるとき、検出サイクル中に消耗し得る。再充電は、電極が小さいとき(例えば、平方ミリメートル当たり少なくとも500の電極を有する電極アレイに供給するために十分に小さいとき)問題になり得る、電極が完全に枯渇するなどの消耗限界に到達することを防止し得る。電極寿命は、場合によっては、電極幅と共に進み、少なくとも部分的に、それに依存する。
ナノポアを通過するイオン電流を測定する好適な状態は、当技術分野で知られており、例が本明細書で提供される。測定は、膜及び細孔を横断して印加される電圧により実行され得る。いくつかの実施形態では、電圧は、−400mV〜+400mVの範囲にあり得る。用いられる電圧は、−400mV、−300mV、−200mV、−150mV、−100mV、−50mV、−20mV、及び0mVから選択される下限と、+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV、及び+400mVから別々に選択される上限とを有する範囲にあることが好ましい。用いられる電圧は、100mV〜240mVの範囲にあることがさらに好ましく、160mV〜240mVの範囲にあることが最も好ましい。増大された印加電位を用いたナノポアによって異なるヌクレオチド間の識別能力を増大させることが可能である。AC波形及びタグ付けされたヌクレオチドを用いた核酸の配列決定は、その全体が引用することにより本明細書に組み込まれる、2013年11月6日に提出された「Nucleic Acid Sequencing Using Tags(タグを用いた核酸配列決定)」という名称の米国特許公開第US2014/0134616で説明されている。米国2014/0134616で説明されたタグ付けされたヌクレオチドに加えて、配列決定は、例えば、5つの一般的な核酸塩基、アデニン、シトシン、グアニン、ウラシル、及びチミンの(S)−グリセロール・ヌクレオシド・三リン酸塩(gNTPs)などの糖又は非環式の部分を欠く、ヌクレオチド類似物を用いて実行され得る(Horhotaら、Organic Letters、8:5345−5347[2006])。
C.ナノポア配列決定セルの電気回路
図4は、ナノポアセル200などのナノポアセル内の電気回路400(図2の電気回路222の一部分を含み得る)の一実施形態を示す。上述のように、いくつかの実施形態では、電気回路400は、ナノポアセンサチップ内の複数のナノポアセル又は全てのナノポアセル間で共有され得、それゆえ、共通電極とも称され得る対電極210を含む。共通電極は、交流電圧源420(VLIQ)に接続することによって、共通の電位を、ナノポアセル内の脂質二重層(例えば、脂質二重層214)と接触するバルク電解質(例えば、バルク電解質208)に印加するように構成されることが可能である。いくつかの実施形態では、AC非ファラデー性モードが、電圧VLIQをAC信号(例えば、方形波)で変調するために利用され、それをナノポアセル内で脂質二重層に接触するバルク電解質に印加し得る。いくつかの実施形態では、VLIQは、±200〜250mVの大きさ及び例えば25〜400Hzの周波数を有する方形波である。対電極210と脂質二重層(例えば、脂質二重層214)との間のバルク電解質は、例えば100μF以上などの大きなコンデンサ(図示せず)によってモデル化され得る。
図4は、作用電極(例えば、作用電極202)及び脂質二重層(例えば、脂質二重層214)の電気特性を表す電気モデル422も示す。電気モデル422は、脂質二重層に関連付けられたキャパシタンスをモデル化するコンデンサ426(CBilayer)と、ナノポア内の個々のタグの存在に基づいて変化し得る、ナノポアに関連付けられた可変抵抗をモデル化する抵抗器428(RPORE)とを含む。電気モデル422は、2重層キャパシタンス(CDouble Layer)を有し、作用電極202及び凹部205の電気特性を表すコンデンサ424も含む。作用電極202は、他のナノポアセル内の作用電極から独立した別個の電位を印加するように構成され得る。
パスデバイス406は、脂質二重層及び作用電極を電気回路400から接続又は切断するために使用され得るスイッチである。パスデバイス406は、電圧刺激がナノポアセル内の脂質二重層を横断して印加されることを有効化又は無効化するために、制御ライン407によって制御され得る。脂質が、脂質二重層を形成するために堆積される前では、2つの電極間のインピーダンスは、セルの凹部が封止されていないため、非常に低く、それゆえパスデバイス406は、短絡状態を回避するために開路に維持され得る。パスデバイス406は、脂質溶媒がナノポアセルに堆積されてナノポアセルの凹部を封止したあと、閉じられ得る。
電気回路400は、オンチップ積分コンデンサ408(ncap)をさらに含み得る。積分コンデンサ408は、リセット信号403を使用しスイッチ401を閉じ、その結果、積分コンデンサ408が電圧源VPRE405に接続されることによって、事前充電され得る。いくつかの実施形態では、電圧源VPRE405は、例えば、900mVの大きさの固定の参照電圧を提供する。スイッチ401が閉じられているとき、積分コンデンサ408は、電圧源VPRE405の参照電圧レベルまで事前充電され得る。
積分コンデンサ408が事前充電されたあと、リセット信号403が使用されスイッチ401が開路され、その結果、積分コンデンサ408は、電圧源VPRE405から切断される。この時点では、電圧源VLIQのレベルにより、対電極210の電位は、作用電極202(及び積分コンデンサ408)の電位より高いレベルにあるか、その反対でもあり得る。例えば、電圧源VLIQからの方形波の正位相の間(例えば、AC電圧源信号サイクルの明又は暗期間)、対電極210の電位は、作用電極202の電位より高いレベルにある。電圧源VLIQからの方形波の負位相の間(例えば、AC電圧源信号サイクルの暗又は明期間)、対電極210の電位は、作用電極202の電位より低いレベルにある。したがって、いくつかの実施形態では、積分コンデンサ408は、対電極210と作用電極202との間の電位差により、明期間の間に電圧源VPRE405の事前充電された電圧レベルからさらに高いレベルまで充電され、暗期間中により低いレベルに放電され得る。他の実施形態では、充電及び放電は、それぞれ暗期間及び明期間に発生し得る。
積分コンデンサ408は、1kHz、5kHz、10kHz、100kHz、又はそれを超え得る、アナログデジタル変換器(ADC)410のサンプリング速度による固定された期間に、充電又は放電され得る。例えば、1kHzのサンプリング速度で、積分コンデンサ408は、約1msの期間中、充電/放電し、次に、電圧レベルがサンプリングされ、積分期間の終わりにADC410によって変換され得る。個々の電圧レベルは、ナノポア内の個々のタグ種に対応し、それゆえ、鋳型上の目下の位置でのヌクレオチドに対応し得る。
ADC410によるサンプリングされたあと、積分コンデンサ408は、リセット信号403を使用しスイッチ401を閉じ、その結果、積分コンデンサ408が電圧源VPRE405に再接続されることによって、再び事前充電され得る。積分コンデンサ408を事前充電するステップと、積分コンデンサ408が充電又は放電する一定の期間待機するステップと、積分コンデンサの電圧レベルをADC410によってサンプリング及び変換するステップとが、配列決定プロセスの間中サイクルで繰り返され得る。
デジタルプロセッサ430は、例えば、正規化、データバッファリング、データフィルタリング、データ圧縮、データ削減、イベント抽出、又はナノポアセルアレイからのADC出力データを多様なデータフレームへのアセンブリングなどのために、ADC出力データを処理し得る。いくつかの実施形態では、デジタルプロセッサ430は、塩基判定などのさらに下流の処理を実行し得る。デジタルプロセッサ430は、ハードウェア(例えば、GPU、FPGA、ASICなどの内部の)又はハードウェアとソフトウェアとの組合せとして実装され得る。
したがって、ナノポアを横断して印加される電圧信号は、ナノポアの個々の状態を検出するために用いられ得る。ナノポアの可能な状態の1つは、タグが取り付けられたポリホスフェートがナノポアの筒に存在しない場合、開放チャネル状態であり、本明細書ではナノポアの未充填状態とも呼ぶ。ナノポアの別の4つの可能な状態は、タグが取り付けられたポリホスフェートヌクレオチドの4つの異なるタイプ(A、T、G又はC)のうちの1つがナノポアの筒内に保持されるときの状態に各々対応する。ナノポアのさらに別の可能な状態は、脂質二重層が断裂するときである。
積分コンデンサ408での電圧レベルが、固定された期間後に測定されるとき、ナノポアの異なる状態は、異なる電圧レベルの測定値をもたらし得る。これは、積分コンデンサ408(すなわち、時間に対する積分コンデンサ408の電圧のグラフの傾きの程度)での電圧減衰率(放電による減少又は充電による増大)が、ナノポアの抵抗(例えば、抵抗器RPORE428の抵抗)に依存するからである。より詳しくは、異なる状態のナノポアに関連付けられた抵抗が、分子(タグ)の別個の化学構造に起因して異なるので、異なる対応する電圧減衰率は、観察され得るようになり、ナノポアの異なる状態を識別するために用いられ得る。電圧減衰曲線は、RC時定数τ=RCを有する指数関数曲線であり得て、ここで、Rは、ナノポアに関連付けられた抵抗(すなわち、RPORE428)であり、Cは、Rに並列の膜に関連付けられたキャパシタンス(すなわち、コンデンサ426(CBilayer))である。ナノポアセルの時定数は、例えば、約200〜500msであり得る。減衰曲線は、二重層の詳細な実施により、指数関数曲線に正確に一致し得ないが、減衰曲線は、指数関数曲線に類似し、単調であり得て、それゆえ、タグの検出を可能にする。
いくつかの実施形態では、開放チャネル状態にあるナノポアに関連付けられた抵抗は、100Mohm〜20Gohmまでの範囲内にあり得る。いくつかの実施形態では、タグが、ナノポアの筒内部に存在する状態にあるナノポアに関連付けられた抵抗は、200MOhm〜40GOhmまでの範囲内にあり得る。他の実施形態では、積分コンデンサ408は、ADC410へ導く電圧が、電気モデル422内の電圧減衰によりやはり変化することになるため、省略され得る。
積分コンデンサ408での電圧の減衰率は、異なる方法で決定され得る。上で説明したように、電圧減衰率は、一定の時間間隔の間の電圧減衰を測定することによって決定され得る。例えば、積分コンデンサ408での電圧は、最初に時間t1でADC410により測定され、次に、電圧は、時間t2でADC410により再び測定される。時間曲線に対する積分コンデンサ408での電圧の傾きがより急であるとき、電圧差はより大きく、電圧曲線の傾きがより緩やかなとき、電圧差はより小さい。このように、電圧差は、積分コンデンサ408での電圧の減衰率を、ゆえに、ナノポアセルの状態を決定するための測定基準として用いられ得る。
他の実施形態では、電圧減衰率は、選択された電圧減衰量のために必要な持続時間を測定することによって決定され得る。例えば、電圧が第1の電圧レベルV1から第2の電圧レベルV2に降下又は増大するのに必要な時間が測定され得る。時間に対する電圧曲線の傾きがより急であるとき、必要な時間はより少なく、時間に対する電圧曲線の傾きがより緩やかなとき、必要な時間はより大きい。このように、必要な測定時間は、積分コンデンサncap408での電圧の減衰率を、ゆえに、ナノポアセルの状態を決定するための測定基準として用いられ得る。当業者には、例えば、電流測定技術を含む、ナノポアの抵抗を測定するために必要とされ得る多様な回路を理解されよう。
いくつかの実施形態では、電気回路400は、オンチップに、パスデバイス(例えば、パスデバイス406)及び追加のコンデンサ(例えば、積分コンデンサ408(ncap))を含まないことがあり、それによりナノポアベースの配列決定チップのサイズの削減を支援する。膜(脂質二重層)の薄い性質のため、膜に関連付けられたキャパシタンス(例えば、コンデンサ426(CDilayer))のみで、追加のオンチップのキャパシタンスを必要とすることなく必要なRC時定数を生み出すのに十分とすることができる。それゆえ、コンデンサ426は、積分コンデンサとして使用され得て、電圧信号VPREによって事前充電され、続いて、電圧信号VLIQによって放電又は充電され得る。そうでなければ電気回路内にオンチップで作製される追加のコンデンサ及びパスデバイスをなくすことにより、ナノポア配列決定チップ内の単一のナノポアセルのフットプリントを著しく減少させることができ、それにより、(例えば、ナノポア配列決定チップ内の数百万ものセルを有する)ますます多くのセルを含むためにナノポア配列決定チップを拡大することが容易になる。
D.ナノポアセル内でのデータサンプリング
核酸の配列決定を実行するために、積分コンデンサ(例えば、積分コンデンサ408(ncap))又はコンデンサ426(CBilayer)の電圧レベルは、タグ付けされたヌクレオチドが核酸に加えられている間に、ADC(例えば、ADC410)によってサンプリングされ変換され得る。ヌクレオチドのタグは、例えば、VLIQがVPREより低いような印加電圧のとき、対電極及び作用電極を介して印加される、ナノポアを横断する電界によって、ナノポアの筒内へと押し入れられ得る。
1.充填
充填事象は、タグ付けされたヌクレオチドが、鋳型(例えば、核酸断片)に取り付けられ、タグがナノポアの筒の内外に進むときにあたる。これは、充填事象の間に複数回発生し得る。タグが、ナノポアの筒内にあるとき、ナノポアの抵抗は、より高く、より低い電流がナノポアを通り流れ得る。
配列決定の間、タグは、いくつかのACサイクル状態でナノポア内に存在しないことがあり(開放チャネル状態と呼ぶ)、この場合電流は、ナノポアのより低い抵抗のために、最も高い。タグがナノポアの筒内へと取り付けられるとき、ナノポアは、明モードである。タグがナノポアの筒外へと押し出されるとき、ナノポアは、暗モードである。
2.明及び暗期間
ACサイクルの間、積分コンデンサでの電圧は、ADCによって複数回サンプリングされ得る。例えば、ある実施形態では、AC電圧信号が、システム全体に、例えば、約100Hzで印加され、ADCの取得速度は、セルあたり約2000Hzであり得る。このように、ACサイクル(AC波形のサイクル)毎に取得される約20のデータポイント(電圧測定値)が存在し得る。AC波形の1サイクルに対応するデータポイントは、1セットと呼ばれ得る。ACサイクル毎のデータポイントの1セット内には、例えば、明モード(期間)に対応し得る、VLIQがVPREより低いときキャプチャされるサブセットが存在し得て、このときタグは、ナノポアの筒内へと押し込まれる。別のサブセットは、暗モード(期間)に対応し得て、このときタグは、例えば、VLIQがVPREより高いとき、印加される電界によってナノポアの筒外へと押し出される。
3.測定電圧
データポイント毎に、スイッチ401が開路のとき、積分コンデンサ(例えば、積分コンデンサ408(ncap)又はコンデンサ426(CBilayer))における電圧は、例えば、VLIQがVPREより高いとき、VPREからVLIQに増大し、VLIQがVPREより低いとき、VPREからVLIQに減少するように、VLIQによる充電/放電の結果として減衰する挙動で変化していく。最終的な電圧値は、VLIQから作用電極の電荷だけずれる。積分コンデンサでの電圧レベルの変化率は、ナノポアを含み、結果としてナノポア内の分子(例えば、タグ付けされたヌクレオチドのタグ)を含み得る、二重層の抵抗の値によって支配され得る。電圧レベルは、スイッチ401が開路したあとの所定時間に測定され得る。
スイッチ401は、データ収集速度で動作し得る。スイッチ401は、通常、ADCによる測定の直後の2回のデータ取得間の比較的短時間、閉路され得る。スイッチは、複数データポイントがVLIQの各ACサイクルの各サブ期間(明又は暗)中に収集されることを可能にする。スイッチ401が開路のままのとき、積分コンデンサでの電圧レベル及び、それゆえ、ADCの出力値は、完全に減衰し、そこに留まり得る。代わりに、スイッチ401が閉路のとき、積分コンデンサは、再び事前充電され(VPREに)、別の測定の準備がなされる。したがって、スイッチ401は、複数データポイントが各ACサイクルの各サブ期間(明又は暗)に収集されることを可能にする。そのような複数の測定は、固定されたADC(例えば、平均化され得る、より多数の測定による8ビットから14ビット)を用いたより高い分解能を可能にさせ得る。複数の測定は、ナノポア内に充填される分子に関する動態情報をさらに提供し得る。時間の情報により、どれだけの長さで充填が発生するかの決定を可能にさせ得る。これは、核酸鎖に加えられる複数のヌクレオチドが配列決定されつつあるか否かを判定することを支援することにも用いられ得る。
図5は、ACサイクルの明期間及び暗期間中のナノポアセルから取得されたデータポイントの例を示す。図5では、データポイントでの変化は、図解目的用に強調されている。作用電極又は積分コンデンサに印加される電圧(VPRE)は、例えば、900mVなどの一定のレベルにある。ナノポアセルの対電極に印加される電圧信号510(VLIQ)は、方形波として示されるAC信号であり、このときデューティサイクルは、50%以下、例えば約40%のような任意の好適な値であり得る。
明期間520の間、対電極に印加される電圧信号510(VLIQ)は、作用電極に印加される電圧VPREより低く、その結果、タグは、作用電極及び対電極に印加される、異なる電圧レベルに起因する電界によって、ナノポアの筒内に押し込まれ得る(例えば、タグ上の電荷及び/又はイオンの流れにより)。スイッチ401が開路のとき、ADCの前のノードでの(例えば、積分コンデンサでの)電圧は、減少していく。電圧データポイントが取得されたあと(例えば、指定された期間の後)、スイッチ401は、閉路され得て、測定ノードでの電圧は、VPREへと再び戻るように増大していく。プロセスは、複数の電圧データポイントを測定するために繰り返され得る。このようにして、複数のデータポイントは、明期間の間に取得され得る。
図5に示すように、VLIQ信号の符号の変化の後の明期間内の第1のデータポイント522(第1のポイントデルタ(FPD)とも呼ばれる)は、後続のデータポイント524よりも低いことがあり得る。これは、ナノポア内にタグが存在しないからであり(開流路)、それゆえ、それは低抵抗及び高放電率を有するためであり得る。いくつかの例では、第1のデータポイント522は、図5に示すようなVLIQレベルを超え得る。これは、信号をオンチップコンデンサに結合する二重層のキャパシタンスに起因し得る。データポイント524は、充填事象が発生した、すなわち、タグがナノポアの筒内に押し込まれたあと取得され得て、この場合ナノポアの抵抗、及びそれゆえの積分コンデンサの放電速度は、ナノポアの筒内に押し込まれるタグの個々のタイプに依存する。データポイント524は、以下で説明するように、CDouble Layer424で生成される電荷により、測定毎にわずかに減少し得る。
暗期間530の間、対電極に印加される電圧信号510(VLIQ)は、作用電極に印加される電圧VPREより高く、その結果、何れのタグも、ナノポアの筒外に押し出され得る。スイッチ401が開路のとき、測定ノードでの電圧は、電圧信号510(VLIQ)の電圧レベルがVPREより高いので、増大する。電圧データポイントが取得されたあと(例えば、指定された期間の後)、スイッチ401は、閉路され得て、測定ノードでの電圧は、VPREへと再び戻るように減少していく。プロセスは、複数の電圧データポイントを測定するために繰り返され得る。このように、複数のデータポイントは、第1のポイントデルタ532及び後続のデータポイント534を含む暗期間の間に取得され得る。上述のように、暗期間の間に、何れのヌクレオチドタグもナノポアの外に押し出され、それゆえ、任意のヌクレオチドタグに関する最小限度の情報が取得され、さらに正規化に用いられる。
図5は、明期間540の間、対電極に印加される電圧信号510(VLIQ)は、作用電極に印加される電圧VPREより低いにもかかわらず、充填事象が発生しない(開経路)ことも示す。したがって、ナノポアの抵抗は低く、積分コンデンサの放電速度は高い。結果的に、第1のデータポイント542及び後続のデータポイント544を含む、取得されたデータポイントは、低電圧レベルを示す。
明又は暗期間の間に測定される電圧は、ナノポアの一定の抵抗(例えば、1つのタグがナノポア内にある間に所与のACサイクルの明モードの間に形成される)の測定毎にほぼ同一であると期待され得るが、このことは、電荷が2重層コンデンサ424(CDouble Layer)で生成する場合であり得ない。この電荷生成は、ナノポアセルの時定数をより長くさせる結果をもたらし得る。結果的に、電圧レベルは移動し、それにより測定値がサイクル内のデータポイント毎に減少するという結果をもたらし得る。このように、サイクル内で、データポイントは、図5に示すように、ある程度データポイントから別のデータポイントへ変化し得る。
4.塩基決定
ナノポアセンサチップの有効なナノポアセル毎に、生成モードが、核酸を配列決定するために実行され得る。配列決定中に取得されるADC出力データは、より高い精度を提供するために、正規化され得る。正規化は、サイクル形状及びベースラインシフトなどの偏位効果を引き起こし得る。正規化の後、実施形態は、充填された経路の電圧のクラスタを決定し得て、ここで各クラスタは、異なるタグ種、及びそれゆえの異なるヌクレオチドに対応する。クラスタは、所与のヌクレオチドに対応する所与の電圧の確率を算出するために使用され得る。別の例として、クラスタは、異なるヌクレオチド(塩基)間での差別化のための分離電圧を決定するために用いられ得る。
配列決定処理に関するさらなる詳細は、例えば、「Nanopore−Based Sequencing With Varying Voltage Stimulus(電圧刺激を変化させるナノポアベースの配列決定)」という名称の米国特許公開第2016/0178577、「Nanopore−Based Sequencing With Varying Voltage Stimulus(電圧刺激を変化させるナノポアベースの配列決定)」という名称の米国特許公開第2016/0178554、「Non−Destructive Bilayer Monitoring Using Measurement Of Bilayer Response To Electrical Stimulus(電気的刺激に応答した二重層の測定を用いた非破壊二重層モニタリング)」という名称の米国特許出願第15/085,700、及び「Electrical Enhancement Of Bilayer Formation(二重層形成の電気的促進)」という名称の米国特許出願第15/085,713の中で見つけることができ、開示のその全体があらゆる目的のために参照により本明細書に組み込まれる。
5.電圧値の周期性
図6は、いくつかの実施形態により実行された試験配列決定用のサンプルの明及び暗期間のデータを示す。明期間のデータは、図の上部分601に示され、暗期間のデータは、図の下部分603に示される。電圧データの周期性は、図4への参照で上述したように、交流(AC)電圧源、例えば、AC電圧源420によって供給される交流信号に起因する。図6で示した各データポイントは、例えば、図4のncapで、パスデバイス406の開路に対して一定の期間後に、ナノポアセル回路のノードでの電圧のADC測定によって取得される。測定毎に、ncapでの電圧は、VPREで開始し(VPREは、破線612として示される)、次に減衰し、ACサイクル内の期間(明又は暗)により+又は−のVLIQへと近づく。一定の時間遅延後に、ADCは、電圧値を測定する。図6は、これらの測定された電圧値、すなわち各々のデータポイントの集合が、VPREからVLIQへのRC減衰曲線の単一のポイントサンプルであることを示す。図6で示した実施例のデータ収集速度は、約1,976Hzである。各期間内で、ポイントからポイントの電圧の不均一性は、部分的にセル内で生成される電荷によってもたらされ、積分コンデンサ(例えば、使用される回路によりコンデンサ408又はコンデンサ426)の充電/放電の基礎をなす電圧減衰曲線内の全体のシフトへ導く。
図6は、明モードの開経路状態からのデータ、例えば、第7のACサイクルの明期間の開始直後に出現する充填事象610に先行する明モードデータ620を示す。他のACサイクル内の後続の開経路値及び充填事象は、時間が進行するときにも示される。いくつかの実施形態では、本明細書で示すように、明期間に測定されたADC値は、充填された状態及び開経路状態の両方で、サイクルからサイクルへ実際に相当の再現性を有する。このことは、明期間のデータ内のシステムのオフセット及び雑音が、暗チャネルのデータを使用することなく、隣接する(又は後続の隣接しないものでも)明期間のデータを用いて補償され得ることの可能性をもたらす。以下の章で、電圧データの周期性の使用方法を形成する1つ又は複数の実施形態を詳述する。
III.定期分析
実施形態は、上の図6に示したように、データでの周期性の利点を利用する。実施形態は、仮定又はパラメータをほとんど用いることがないので、より堅牢性を有する。この方法で、実施形態は、新らたなナノポア、脂質二重層などを有する新たなシステムと共に用いられ得て、この場合新たなセルの最小限度の特徴づけがなされた。したがって、実施形態は、使用される配列決定セルの予備知識をそれ程有することなく、広く適用可能であり得る。
A.差分信号の決定
差分信号を決定するために、1サイクルのデータが、別のサイクルのデータから減じられ得る。いくつかの実施形態では、対応するデータポイントは、近傍のサイクル(例えば、最近傍の、第2の近傍のなど)に基づく。
図7は、各サイクルが各明及び暗期間を有しB及びDのラベルによって示される、複数のサイクル1〜4のデータポイントのセットを示す。いくつかによる差分データの決定は、以下のように続く。未処理のADCデータ(図示せず)が、各々がメモリに格納され得る、2つの変位されたデータセットを作成するために用いられる。信号710は、2分の1の期間により、左に(本明細書ではleft_adcと呼ぶ)変位された未処理のデータであり、データ720は、2分の1の期間右に(本明細書ではright_adcと呼ぶ)変位された未処理のデータである。この実施形態が、正味の1期間変位の一例を示す一方で、他の変位は、本開示の範囲から逸脱することなく、2つの期間変位、3つの期間変位などが可能である。さらに、未処理のデータは、半期間での2回の変位とは対照的に、1回の完全な期間で変位される、変位済みのデータと共に使用され得る。処理済みの差分データ730(本明細書ではp2p_diffと呼ぶ)が、次に、2つの変位されたadc信号を減算することによって作成され得て、この事例では、
p2p_diff=left_adc−right_adc
となる。
いくつかの実施形態では、処理済みの差分データ730の第1のサイクル(p2p_diff)は、未処理のサイクル1から未処理のサイクル2を減算することによって取得される。処理済みの差分データ730の第2のサイクル(p2p_diff)は、未処理のサイクル2から未処理のサイクル3を減算することによって取得される。処理済みの差分データ730の第3のサイクル(p2p_diff)は、未処理のサイクル4などから未処理のサイクル3を減算することによって取得される。処理済みの差分データ730では、未処理のデータからの単一の充填事象770は、複製され、まず正のピーク(事象ピーク750)として登場し、続いて負のピーク(事象ピーク760)として再び登場する。
当業者には、事象ピーク750及び760は、一般に反対の符号であり、それゆえ、正負の修飾語句は、単に一例として本明細書で用いられることが理解されよう。この単一の充填事象に関する正負のピークは、2つの変位されたデータセット(この例での1つの完全な期間)の間の正味の時間変位に等しい合計によって時間内で分離される。しかし、正味の時間変位は、複数のサイクルに続く充填事象には、より長くなり得る。
図7は、処理済みの差分データ730を算出するポイント毎の定期的差分方法を示し、例えば、変位は、単一の又は複数の期間による何れの方向(右から左又は左から右)にもあり得て、任意の差分方式が、本開示の範囲から逸脱することなく用いられ得る。図7は、単一の期間による左から右の変位(正味の)による最近傍の差分を示す。しかし、差分は、基礎をなす信号についてのより粗い尺度の情報を提供され得る、複数の期間による変位によって得られ得る。
第1のサイクル及び/又は最終のサイクルの差分は、1つの変位サイクルの第1のサイクルのデータ又は最終のサイクルのデータが存在しないことがあるため、決定されなくてもよい。したがって、これらの領域は、本明細書では、「無効領域」と呼ぶ。第1の無効領域740の例が、図7に示されている。
図8は、図7で説明した同一の変位方法を使用して、しかし今回は、わずかに異なる性質の未処理データを有する、差分技術の一実施形態を示す。本明細書で示すように、いくつかの実施形態では、充填事象は、2つ以上のACサイクルで継続し得る。例えば、図8のデータでは、充填事象は、各々がサイクル2、3、及び4中にそれぞれ発生する、充填事象810、820、及び830によって示される3サイクルで継続する。しかし、これらの充填事象毎の未処理データでの繰返し性のため、第1の充填事象810及び最終の充填事象830のみが、処理済みの差分データに正のピーク840及び負のピーク850としてそれぞれ表れ得る。当業者には、ピーク840及び850は、一般に反対の符号であり、それゆえ、正負の修飾語句は、単に一例として本明細書で用いられることが理解されよう。さらに、正のピークと負のピークとの間の時間分離が、もはや単に未処理データに適用される正味の時間変位(再び、この例では、1期間)ではなく、正味の時間変位及び第1の充填事象810と最終の充填事象830との間の持続時間の和となる。
図9は、いくつかの実施形態による、差分データを決定するための、未処理データポイントを変位させる方法を説明する概略図を示す。第1の行は、各々の正のチャネルに数字記号を付した、初期のデータセットを示す。負のチャネルは、本事例では使用しないので、対角線のハッチングを用いてグレイアウトした。第2の行は、1サイクル右へ変位したデータを示す。第3の行は、1サイクル左へ変位したデータを示す。第4の行は、一例の差分信号であり、ここで差分は、初期のデータから右へ変位した信号を減算したものであり、したがって、前のサイクルが、後のサイクルから減算される。
第5の行は、初期のデータから左へ変位した信号を減算した差分データを示す。この例では、後のサイクルが、前のサイクルから減算される。したがって、充填事象は、正のパルスを伴い開始され得る。
最終の行は、右へ変位したデータと左へ変位したデータとの間の差分を示す。いくつかの実施形態では、最近傍の差分(例えば、1−2)及び第2の近傍の差分(例えば、1−3)は、差分が充填事象を有する1つによるのか、充填事象を有する2つによるのかを判定するために用いられ得る。いくつかの実施形態では、これが、2つのチップが同一の結果を提供することの確認を支援し得る。
B.差分データ
図10は、いくつかの実施形態による充填事象の差異データの一例を示す。詳細には、図10は、例えば、配列決定装置の動作中、デジタルプロセッサ430によって生成された、時間と共に測定された差異データ1010を示す。したがって、実施形態は、基礎をなす未処理のAC信号(例えば、図6で示した信号)を示さない。それにもかかわらず、塩基分類を決定するために必要な情報は、差分データ1010自体から抽出され得る。
すでに上述したように、正のパルス1020は、時刻tで開始する充填事象を表す。いくつかの実施形態では、充填事象は、明モードが時刻tで開始するわずか後に発生し得る。例えば、上述のように、図5を参照すると、tは、VLIQが、VPREより小さい状態からVPREより大きい状態に転換する瞬間(又はセルの構成によりその逆方向)を、それゆえポアを横断する電界の方向が転換する正確な時刻を、示す。時間差(t−t)は、有益な情報を提供し、いくつかの実施形態では、充填時間(TTT)、すなわち、暗モードが後に続く、タグがナノポア内に挿入されるのにかかる時間、と解釈され得る。TTTは、例えば、ナノポア分子を作成するシステム設計を支援し得る。例えば、TTTは、例えば、改善された(より速い)TTTを有する新たなポアを作成するために、新たな用途のポアを選択するとき及び/又はポアを変異させるとき、有用な設計パラメータである。
いくつかの実施形態では、充填パルス(本明細書では「電圧レベル」又は「レベル」とも呼ぶ)の振幅LEVENTは、開経路(未充填経路)及び4つの塩基(A、G、C、及びT)に対して発生する4つの異なる(かつ区別可能である)振幅を有する、充填事象に関与する個々のタグに対応する。パルスの幅dtintra−cycleは、充填事象が発生する持続時間、いわゆる「滞在時間」(持続時間は単一の明サイクル以内と推測する)に対応する。しかし、第1のサイクルで充填されたあと、タグは、通常、その後多数のサイクル(例えば、100)も充填し、それゆえ、滞在時間は多数のサイクルにわたり拡張し得る。したがって、滞在時間は、サイクル内滞在時間がdtintra−cycleであるとなるように、より適切に解釈され得る。図10に示すように、サイクル内滞在時間は、dtintra−cycleであり、所与の充填事象の差分データ内の第1のピーク幅によって測定され得る。
サイクル間滞在時間は、dtinter−cycleとして示され、開始の正のパルスと終了の負のパルスとの時間差としての差分データ、例えば、第1のパルスの第1のエッジ(最も早い時刻)と最終のパルスの最終のエッジ(最も遅い時刻)との間の時間差、から測定され得る。他のエッジは、本開示の範囲から逸脱することなく、エンドポイントとして用いられ得る。
上述の図8は、複数サイクルの充填事象を説明し、そこで、タグは、3つの連続したサイクルで充填した。図8で説明したように、複数サイクルの充填事象では、中央のサイクルでの電圧ポイント間の差分は、通常0であり得る。しかし、減算は完全ではないこともあり、例えば、充填事象毎のTTTは、若干異なり、LEVENT近傍のレベルを有する、正負パルス間の少数のポイントをもたらす。この現象の一例が、以下の図12のサンプル差分データポイント1201に示される。そのような不均一性は、これらの充填事象間の不均一性が、ただ1つの又は2つのADCサイクル内に現れるので、持続時間に基づいて新たな充填事象と区別され得る。この方法で、おりおりのはずれポイントは、第1の大きな正のパルスによって信号が出された、同一の充填事象の一部であると推定され得る。
データ内で見られる任意のピークのピーク値、例えば、雑音ピーク1030は、ピークが雑音か有効な充填事象かを判定するために、より大きい充填事象パルスのピーク値と比較され得る。すでに上述したように、信号に対しての遅い移動変化、例えば、あるサイクルから別のサイクルへのゲインドリフトは、恐らくあるサイクルから別のサイクルへ首尾一貫しており(基本的にDCオフセットとして現れる)、差分プロセス中に除去及び/又は最小化され得る。したがって、本明細書で説明する定期的な差分方法は、通常、長い時間スケールで発生する変化及び/又はサイクルからサイクルへ繰返し性を有するデータ内の不均一性に対しては感度が低い、充填事象検出器を提供し得る。加えて、差分データのベースラインは、ベースラインが、下記のように、差分データ自体の統計的分析から識別され得るので、精度良く0である必要はなく、又は予め知られている必要もない。
いくつかの実施形態では、充填事象の発生速度は、サンプリング速度、例えば2kHzに比べて遅い(毎秒1又は2回)。したがって、ゼロ値は、差分信号の最も共通の値(モード)又は平均値として決定され得る。雑音は、例えば、充填事象なしで(開経路データ)、データの分散に基づいて測定され得る(例えば、1.8ADCレベル)。差分信号に寄与するセルがより多いほど、より小さい雑音、例えば1.0ADCレベルになり得る。測定された雑音レベルに基づいて、充填事象を識別する閾値(図10で示した±Tnoise)は、選択され得て、例えば、閾値は、雑音の標準偏差に基づいて選択され得て、例えば、鼻の外側の標準偏差の6倍よりも大きいデータのみが、充填事象として登録され得る。さらに、幅dtintra−cycleは、少なくともある一定の数の、例えば3、4、5、又は6ポイントであることが必要とされ得る。したがって、充填電圧は、疑似の電圧測定により雑音を低減させることができる、少なくともある一定の回数のサイクルを、見出すことが必要とされ得る。
C.差分データの算出
図11は、ある実施形態による、配列決定セルを使用する一例の方法を示すフローチャートである。より具体的には、図11は、いくつかの実施形態による、ナノポア配列決定からのAC信号の定期分析の方法を示す。
ステップ1110では、交流信号(本明細書では「AC信号」とも呼ぶ)が、配列決定セルのナノポアを横断して印加される。そのようなAC信号は、AC信号発生器によって供給される方形波であり得て、同様のAC電圧源420(本明細書ではAC「信号発生器」とも呼ぶ)が、図4への参照で上述された。いくつかの実施形態では、AC信号は、第1の部分(本明細書では「明モード」又は「明期間」とも呼ぶ)と第2の部分(本明細書では「暗モード」又は「暗期間」とも呼ぶ)とを含む交流信号の各サイクルを有する、複数のサイクルの長さであり得る。第2の部分の電圧レベルは、第1の部分の電圧レベルに対して参照電圧の反対側である(VLIQは、図5で示した本実施形態では、VPREの上下何れかにある)。上述のように、図1〜2を参照すると、いくつかの実施形態では、ナノポアは、ヌクレオチドに接続されたタグを受容するように構成され、それにより充填事象を形成する。
ステップ1120では、図4を参照し上述したように、例えばADC410によって電圧データの第1のセット(本明細書では「未変位電圧データ」又は「未処理の電圧データ」とも呼ぶ)が取得される。いくつかの実施形態では、電圧データの第1のセットは、交流信号の複数のサイクルの第1の部分(例えば、明期間)の間に取得される。電圧データの第1のセットの例は、図5の明期間520で示されるデータポイントを含み、図7〜8で示したような「B」期間内で特徴づけられる全てのポイントも含む。図7〜8で示したように、電圧データの第1のセットは、AC信号の複数のサイクルにわたって取得される電圧データポイントを含み得る。上述のように、電圧データは、異なる時刻で、ナノポアの抵抗の値に対応し(すなわち、依存し)、ここでナノポアの抵抗は、タグがナノポア内部に受容されるとき、変化する。
ステップ1130では、電圧データの時間変位されたセットが、取得された未処理の電圧データから、例えば、図4で上述したデジタルプロセッサ430によって、決定される。変位データの例は、上述したように、図7〜9で示した。いくつかの実施形態では、電圧データの未処理のセット及び電圧データの変位セットのデータポイントの各サイクルは、指定された数のデータポイントを含み、未処理の未変位のデータは、明期間内に15のデータポイントを含み得て、変位データは、明期間内に対応する15のデータポイントを含み得る。例えば上の図7〜9を参照して上述したように、変位データは、未変位データに対して時間変位されているので、変位データのデータポイントと未変位データのデータポイントとは、AC信号の異なるサイクルから来ている。例えば、少し図9に移ると、Org−LShiftとラベルが付された例で示したように、未変位データポイントは、未変位データのサイクル1から始まり得て、変位データデポイントは、未変位サイクル2から始まり得る。
ステップ1140では、例えば、図4で上で示したデジタルプロセッサ430によって、電圧データの未変位セットのデータポイントと、電圧データの変位セットの対応するデータポイントとの間の差分を算出することによって、差分データが算出される。いくつかの実施例では、対応するデータポイントは、それぞれのサイクルで同一の位置を有するが、異なるサイクルに存在し得る。例えば、未変位データのサイクル1から始まる未変位データポイント及び未変位データのサイクル2から始まる変位データポイントについて、差分データは、第1の差分データポイントが、サイクル1からの第1のポイントをサイクル2の第1のポイントから減算することによって算出され得る、第2の差分データポイントが、サイクル1からの第2のポイントをサイクル2の第2のポイントから減算することによって算出され得る、などの方法で算出され得る。本開示の利益を有する当業者には、差分を実行する多数の異なる方法が存在し、上述した単一のポイント方式は、多数の中の単なる一例として意味されることを理解されよう。例えば、各サイクルからの複数のデータポイントは、減算の前に平均化又はフィルタリングされ得て、又は差分は、最近傍の減算に基づいて、次の近傍の減算基づいて、又は本開示の範囲を逸脱することない類似の減算に基づいて算出され得る。
ステップ1150では、充填事象は、差分データ内の1つ又は複数のデータポイントに基づいて検出される(すなわちタグは、ナノポア内に受容された)。例えば、充填事象は、図10を参照し上述したように、差分データ内のパルスの存在によって、識別され得る。いくつかの実施形態では、充填事象は、差分データのモードとして開経路レベルを識別することによって、決定される。充填事象は、差分データの開始パルスが閾値を超えたかを判定することと、差分データ内の最終のパルスが、開始パルスに追随し、開始パルスの符号と反対の符号であることを判定することと、開始パルス及び終了パルス間の時間差を判定することとによって、識別され得る。いくつかの実施形態では、閾値は、図10を参照し上述したように、差分データのモードから決定され得る。
いくつかの実施形態では、所与のセルのために、未変位データ(すなわち未処理データ)は、効果的に複製され得て、複製はメモリに格納される。近傍のサイクルの対応する電圧ポイント間の差分が次に、格納された未変位データ、及び未変位データの格納された複製又は未変位データの時間変位複製を用いて算出される。同等に、未変位データの単一の複製は、目下のサイクルのペアのポイントと共に使用され得て、2つの間から得た差分と共にプロセッサによって読み出される。
データプロセッサのキャッシュ内には、格納される位置が存在し得て、所与のサイクルがある位置に格納され、2サイクル毎に使用され得る。ある算出のために、サイクルデータポイントが、差分を決定するための初期サイクルに対応し得る。次の算出のために、サイクルデータポイントが、差分を決定するための最終サイクルに対応し得る。この方法で、動作回数は、完全なアレイの2つの複製を有すること、及び差分算出の度にサイクルデータポイントの2セットを読み出すことに対して削減され得る。
例えば、データポイントの第1のセットは、第1のメモリ位置に格納され得て、データポイントの第2のセットは、第2のメモリ位置に格納され得る。第1のメモリ位置でのデータポイントのセットから第2のメモリ位置でのデータポイントのセットを減算した差分が、取られ得る。次に、次の算出のために、データポイントの第1のセットは、メモリからを除去され得て、データポイントの第3のセットは、第1のメモリ位置に格納され得る。次の差分は、第2のメモリ位置でのデータポイントのセットから第1のメモリ位置でのデータポイントの第3のセットを減算した差分などが、取られることになる。
上で差分の方法が、デジタル信号処理技術という文脈で、説明される一方で、本開示は、それに限定されない。例えば、アナログ技術が、デジタル技術の代わりに、又はそれと組み合わせて、本開示の範囲から逸脱することなく使用され得る。例えば、時間変位及び差分の算出は、1つ又は複数のアナログ回路素子、例えば、移相器、オペアンプ、アナログフィルタなどによって、実行され得る。
D.データ圧縮及び特性
塩基分類に必要とされる物理的情報が、パルスの特性の少数のセットから抽出され得るので、このセットの特性をメモリに少数のパラメータとして格納させて、パルスのいくつかの特性の算出により、データの圧縮が可能になり得る。チップは、例えば、数十万のセル又は、数百万のセルまでも大規模で、2kHzのサンプリング速度であり得る。
したがって、全ての電圧ポイントが格納される事例では、テラバイトのデータが、発生され得て、関連する記憶装置のコストは、高額であり得る。いくつかの実施形態では、差分データに基づく充填事象パラメータのコンピュータ処理を介したデータ圧縮は、充填事象毎に格納されることになる、少数のパラメータのみを用い得て、したがって大いに記憶装置の要件及びコストを削減する。
充填事象で格納されるパラメータの例は、1つ又は複数のレベルLEVENTと、充填時間TTTと、多様な時間差、例えば、開始パルス及び終了パルスの間に時間差とを含み得る。図10を参照し上述したように、サイクル内滞在時間及びサイクル間滞在時間は、算出され、圧縮されたデータとして格納され得る。
いくつかの実施形態では、本明細書で開示された方法によって処理された差分データは、少数の他の有益な特徴を含む。第1に、全ての未充填(すなわち開経路)データは、低い振幅を有し、差分データの開経路の値を0付近(又はあるオフセットの付近)に集めさせる。一方で、充填事象は、その振幅が背景雑音レベルより上に立ちあがる急激なステップ(本明細書ではパルス及び/又はピークとも呼ぶ)、例えば、図7で示した事象ピーク750として現れる。これは、データ圧縮の可能性に導く。いくつかの実施形態では、図10〜11を参照して上でさらに詳細に説明したように、データを圧縮するために、ピークを特徴づけるために必要な最小限のデータだけが格納され得て、全ての他のデータは、棄却される。第2に、データ内の長期の系統的なドリフト(ゲインドリフト及び/又はオフセットシフトなどの)が、比較的近接した時間内に、2サイクルの間に同様の振幅を伴い発生し、本明細書でなされたように、異なるサイクルからデータ減算することで、これらのタイプの系統的な効果を除去することによって、データを補正する。さらに一般には、処理されたデータは、1)AC期間と比較して長い時間スケールで発生する、及び/又は2)サイクルからサイクルへ繰り返すように発生する、データ内の任意の系統的な変位に対して比較的影響を受けにくいことがあり得る。
本明細書で開示される方法の別の利益は、改善された処理速度に関する。提案された方法は、ADC値(1バイトデータ)での差分に基づくので、データが適切にメモリ整列されている場合、それは高速である。さらに、それは、セル毎に容易にベクトル化され得て、複数のセルのために並列化され得る。単一のプロセッサでubfファイル上の分析を実行するとして、100MB/sのオーダーの処理能力が期待される。原理的に、(例えば、リングバッファ内で)処理に直接アクセス可能なデータを有することによって、ubfファイルをスキップすることができる。したがって、方法及びシステムのいくつかの実施形態は、例えば、FPGAを用いたリアルタイム処理に用いられ得る。本明細書で開示される方法の利用は、処理用のhdf5のような中間フォーマットの使用をさらに不要にし得る。さらに、方法は、本来順応的であり、局所的近傍に基づくので、広範なバックグラウンド処理は、必要としないことがある。
IV.結果
図12〜14は、いくつかの実施形態による、未処理の配列決定データ及び処理済みの差分データを示す。
図12Aは、未処理のADC試験データの比較的短い時間スケール(Is全体の持続時間)のグラフを示し、十分な分解能を伴う個々のACサイクルを示し、各ACサイクル内の個々の明及び暗期間を示す。いくつかの明期間は、充填事象、例えば、充填事象1203を示す。充填事象の各々は、同一のタグが、各事象でナノポア内に充填されつつあることを示す、約110のほぼ同一のADCレベルを有する。これが発生するいくつかの理由が存在し、例えば、タグに関連付けられた塩基を触媒することにいくつかのサイクルを要し得る、又は複数のタグ付けされた同一のタイプの塩基は、核酸内で配列決定されていることを繰り返し得る。
図12Bは、いくつかの実施形態による、図12Aで示した未処理の(未変位の)ADCデータから算出された差分データ(p2p_diff)を示す。図6〜9で参照し上述したように、差分データでは、各充填事象は、反対の符号を有する事象パルスのペアによって表される。さらに、例えば、TTTが、サイクルからサイクルへわずかに変化するとき、図10を参照し上で説明したように、複数サイクルの充填事象のために、差分処理は、完全でないことがある。この場合、正負パルス間の少量のサンプル差分データポイント1201は、充填振幅に匹敵するレベルを有する。しかし、これらのはずれデータポイントは、関係する時間スケールに基づいて、すなわちそれらは、有効な充填事象よりもかなり速いので、充填事象から識別され得る。
図13A及び図13Bは、いくつかの実施形態による、定期的差分方法の結果を示す。図13A及び図13Bは、約150秒の持続時間にわたる、未処理のADCデータ及び処理済みの差分データを示し、それゆえ、図12A及び図12Bと比較して、さらに多数の充填事象が、見出され得る。そのうえ、図13Aで示した未処理のADCデータは、明モード及び暗モードデータの両方において、時間変位ゲインドリフトを明白に示す。このドリフトは、誤差を含みやすい未処理データへとつながる。しかし図13Bで示したように、ドリフトは、サイクルからサイクルで(個々のサイクルは、ここで見出すには速すぎる)比較的安定しているので、ドリフトは、差分データ内で効果的に除去される。そのうえ、閾値より低い図13Bでの差分データは、雑音であると見なされ、除去される。図13Bは、それゆえ、このデータが充填事象を検出するために必要でないことを実証し、全体のデータ記憶装置要件を低減するために除去され得る。
図14A及び図14Bは、図13A〜13Bで示したデータと同様のデータであるサンプルデータの別のセットを示す。図14Aで示した未処理のADCデータ内では、ベースラインシフトとして知られている現象が観察される。いくつかの実施形態では、この現象は、充填事象が発生する度に平衡から急激に抜けることになる、セルの電荷バランスに起因し得る。結果的に、充填事象の間、明モード及び暗モードの両方のデータ傾向は上向きであり、次に、セル内の容量性素子上の電荷は、平衡状態に到達するように再配分されるので、時間と共に傾向は下向きに戻り始める。図14Bは、本明細書で開示される差分方法が、このオフセットシフトを効果的に補正することができることを示す。図13A〜13Bにおけるように、一定の閾値より低い差分データは、全体のデータ記憶装置要件を低減するために除去される。
いくつかの実施形態では、差分データは、充填事象を識別するデータの予備的な分析を実行するために用いられ得る。その後の処理は、個々の塩基分類及び次に位置合せとしての事象の分類を包含し得る。したがって、実施形態は、1つ又は複数の配列決定セルから信号を取得し、事象を検出し、塩基分類を形成するために事象を分類し、塩基を配列決定し、参照ゲノムに配列し得る。
システムのいくつかの試験的なパラメータは、塩類の量、塩類のタイプ、ポアでの電圧値、ナノポアのタイプ、明及び暗モードのデューティサイクル、並びにAC信号の周波数及びデータ収集速度であり得る。実施形態は、これらの異なる試験パラメータに断定的でないようにあり得る。他の利益は、動作速度、簡潔なハードウェア(例えば、FPGA、対照的なGPU、基本的なCPU)内にプログラムする能力、及びデータ低減(より少ないメモリ)である。
V.コンピュータシステム
本明細書で説明したコンピュータシステムの任意のものは、任意の適切な数のサブシステムを利用し得る。そのようなサブシステムの例は、図15のコンピュータシステム10内で示した。いくつかの実施形態では、コンピュータシステムは、単一のコンピュータ装置を含み、ここでサブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態では、コンピュータシステムは、各々がサブシステムであり、内部に構成要素を有する、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップ及びラップトップコンピュータ、タブレット、携帯電話、並びに他の携帯機器を含み得る。
図15で示したサブシステムは、システムバス1575を介して相互接続されている。プリンタ1574、キーボード1578、記憶デバイス1579、ディスプレイアダプタ1582に結合されているモニタ1576、及びその他などの付加的なサブシステムを示す。I/O制御装置1571に結合された外付け及び入出力(I/O)デバイスは、入出力(I/O)ポート1577(例えば、USB、Fire Wire(登録商標))などの当技術分野で知られている任意の数の手段によって、コンピュータシステムに接続され得る。例えば、I/Oポート1577又は外部インタフェース81(例えば、イーサネット(登録商標)、Wi−Fi、など)は、コンピュータシステム1510をインターネットなどの広域ネットワーク、マウス入力装置、又はスキャナに接続するために用いられ得る。システムバス1575を介した相互接続により、サブシステム間での情報交換を可能にするだけでなく、セントラルプロセッサ1573が、各サブシステムと通信すること、システムメモリ1572又は記憶デバイス1579(例えば、ハードドライブ又は光ディスクなどの固定ディスク)からの複数の命令実行を制御することを可能にする。システムメモリ1572及び/又は記憶デバイス1579は、コンピュータ可読媒体を含み得る。別のサブシステムは、カメラ、マイクロフォン、加速度計、その他などのデータ収集デバイス1585である。本明細書で説明したデータの任意のものは、ある構成要素から別の構成要素へ出力され得て、ユーザに出力され得る。
コンピュータシステムは、例えば、外部インタフェース1581によって又は内部インタフェースによって共に接続される、複数の同一の構成要素又はサブシステムを含み得る。いくつかの実施形態では、コンピュータシステム、サブシステム、又は装置は、ネットワークを通して通信し得る。そのような事例では、あるコンピュータは、クライアント、別のコンピュータは、サーバと考えることができ、ここで各々は、同一のコンピュータシステムの一部であり得る。クライアント及びサーバは、各々複数のシステム、サブシステム、又は構成要素を含み得る。
実施形態の態様は、ハードウェア(例えば、特定用途向け集積回路又はフィールドプログラマブルゲートアレイ)を用いて、及び/又はモジュラー又は統合された様式の一般にプログラム可能なプロセッサを伴う、コンピュータソフトウェアを用いて、制御ロジックの形態で実施され得る。本明細書で使用されるとき、プロセッサは、同一の集積チップ上のシングルコアプロセッサ、マルチコアプロセッサ、又は単一の回路基板上のマルチプロセシングユニット、あるいはネットワーク接続されたプロセッサを含む。本開示及び本明細書で提供された教示に基づいて、ハードウェア並びにハードウェア及びソフトウェアの組合せを用いて、本発明の実施形態を実施するための他の方法及び/又は方法が、当業者には、知られ、かつ理解されよう。
本出願で説明されるソフトウェアの構成要素又は機能の任意のものは、例えばJava(登録商標)、C、C++、C#、Objective−C、Swiftなどの任意の好適なコンピュータ言語、又は例えば、従来の又はオブジェクト指向の技術を用いたPerlもしくはPythonなどのスクリプト言語を用いてプロセッサによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、一連の命令又は指令として、保存及び/又は伝送用の、コンピュータ可読媒体上に格納され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、ハードドライブ、フロッピーディスクなどの磁気媒体、コンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)などの光学的媒体、又はフラッシュメモリ、などを含み得る。コンピュータ可読媒体は、そのような記憶又は伝送デバイスの任意の組合せであり得る。
そのようなプログラムは、さらにエンコードされ、インターネットを含む、多様なプロトコルに従う有線、光学、及び/又は無線ネットワークを介した伝送に適応された、搬送波信号を用いて伝送され得る。そのように、コンピュータ可読媒体は、そのようなプログラムを用いてエンコードされたデータ信号を使用して作成され得る。プログラムコードを用いてエンコードされたコンピュータ可読媒体は、互換性のあるデバイスを用いて包装され得て、又は別個に他のデバイスから供給され得る(例えば、インターネットでのダウンロード)。任意のそのようなコンピュータ可読媒体は、個々のコンピュータ製品(例えば、ハードドライブ、CD、又は完全なコンピュータシステム)上に又は内部に備えられ得て、また、システム又はネットワーク内部の異なるコンピュータ製品上に又は内部に存在し得る。コンピュータシステムは、本明細書で説明した成果の任意のものをユーザに提供するための、モニタ、プリンタ、又は他の好適なディスプレイを含み得る。
本明細書で説明した方法の任意のものは、ステップを実行するように構成され得る1つ又は複数のプロセッサを含むコンピュータシステムを用いて、全体的に又は部分的に実行され得る。したがって、各ステップ又はステップの各グループを実行する異なる構成要素を潜在的に有する、本明細書で説明した方法の任意のもののステップを、実行するように構成されたコンピュータシステムに、実施形態は、向けられ得る。番号を付されたステップが提示されたが、本明細書の方法のステップは、同時に又は異なる順序で実行され得る。さらに、これらのステップの部分は、他の方法からの他のステップの部分と共に用いられ得る。また、ステップの全て又は部分は、任意選択的であり得る。さらに、任意の方法の任意のステップは、モジュール、ユニット、回路、又はこれらのステップを実行するための他の手段を用いて、実行され得る。
個々の実施形態の個別の詳細が、本発明の実施形態の技術概念及び範囲から逸脱することのなく、任意の好適な方法で組み合わされ得る。しかし、本発明の他の実施形態は、各々の個別の態様に関する特定の実施形態に、又はこれらの個別の態様の特定の組合せに、向けられ得る。
本発明の例示の実施形態の上述の説明は、図解及び説明の目的で提示されてきた。網羅的であること、又は本発明を、説明されたそのものの形式に限定することを意図するものではなく、多数の変形例及び変形形態が、上述の教示に照らして、可能である。
列挙の「a」、「an」、又は「the」は、具体的にそうでないことに示さない限り、「1つ又は複数」を意味することを意図する。「or」のを使用法は、具体的にそうでないことに示さない限り、「排他的論理和」でなく、「包含的論理和」を意味することを意図する。「第1の」構成要素への言及は、第2の構成要素がもたらされることを必ずしも必要としない。さらに「第1の」又は「第2の」構成要素への言及は、明確に規定されない限り、言及された構成要素を特定の位置に限定しない。
本明細書で言及された全ての特許、特許出願書類、出版物、及び明細書は、その全体があらゆる目的のために参照により本明細書に組み込まれる。何れも従来技術に入れることは認められない。

Claims (18)

  1. ナノポアを含む配列決定セルであって、前記ナノポアは、ヌクレオチドに接続されているタグを受容するように構成され、それにより充填事象を作成する、配列決定セルと、
    交流信号を前記配列決定セルの前記ナノポアを横断して印加する信号発生器であって、前記交流信号の各サイクルが、第1の部分及び第2の部分を備え、前記第2の部分の電圧レベルが、前記第1の部分の電圧レベルに対して、参照電圧の反対側にある、信号発生器と、
    前記交流信号の複数のサイクルの前記第1の部分の間に電圧データの第1のセットを取得するアナログデジタル変換器であって、電圧データの前記第1のセットの各データポイントが、異なる時刻で前記ナノポアの抵抗の値に対応し、前記ナノポアの前記抵抗は、前記タグが前記ナノポア内部に受容されるとき、変化する、アナログデジタル変換器と、
    デジタルプロセッサであって、
    電圧データの前記第1のセットから電圧データの変位されたセットを決定し、電圧データの前記第1のセット及び電圧データの前記変位されたセットのデータポイントの各サイクルが、指定された数のデータポイントを含み、
    電圧データの前記第1のセットのデータポイントと、対応する、電圧データの前記変位されたセットのデータポイントとの間の差分を算出することによって、差分データを算出し、
    前記差分データ内の1つ又は複数のデータポイントに基づいて、前記充填事象を識別する
    ように構成された、デジタルプロセッサと
    を備える、システム又は器具。
  2. 電圧を、前記ナノポアを横断して選択的に印加するスイッチであって、前記交流信号の前記第1の部分の間に複数回、開路及び閉路するように構成された、スイッチをさらに備える、請求項1に記載のシステム又は器具。
  3. 電圧データの前記変位されたセットが、電圧データの前記第1のセットを表す、格納されたデータから選択されるデータポイントを含む、請求項1に記載のシステム又は器具。
  4. 電圧データの前記変位されたセットが、電圧データの前記第1のセットの時間変位された複製から選択されるデータポイントを含み、前記差分データを算出するステップが、電圧データの前記第1のセットと、電圧データの前記第1のセットの前記時間変位された複製との対応するデータポイント間の差分を算出するステップをさらに備える、請求項3に記載のシステム又は器具。
  5. 前記デジタルプロセッサが、
    電圧データの前記第1のセットの第1サブセットを選択するステップと、
    電圧データの前記第1のセットの第2サブセットを選択するステップであって、電圧データの前記第1のセットの前記第2サブセットのサイクルが、電圧データの前記第1のセットの前記第1サブセットのサイクルと異なるサイクルである、ステップと
    によって電圧データの前記変位されたセットを決定するようにさらに構成される、請求項1に記載のシステム又は器具。
  6. 電圧データの前記第1のセットの前記第1サブセットから選択されるデータポイントと、電圧データの前記第1のセットの前記第2サブセットから選択されるデータポイントとが、前記対応するデータポイントである、請求項5に記載のシステム又は器具。
  7. 前記デジタルプロセッサが、
    電圧データの前記第1のセットの複製を生成するステップと、
    電圧データの前記第1のセットの前記複製に時間変位を適用することによって、電圧データの前記変位されたセットを生成するステップと、
    電圧データの前記第1のセット及び電圧データの前記変位されたセットの両方をメモリ内に格納するステップと
    によって、電圧データの前記変位されたセットを決定するようにさらに構成される、請求項1に記載のシステム又は器具。
  8. 前記デジタルプロセッサが、
    前記差分データのモードを識別し、
    閾値を超える前記差分データの開始パルスを決定し、前記閾値は前記モードから決定され、
    前記開始パルスに追随し、反対の符号を有する、前記差分データ内の最終パルスを決定し、
    前記開始パルスと、前記最終パルスとの間の時間差を決定し、
    前記開始パルス及び/又は最終パルスの前記時間差及び振幅をメモリ内に格納する
    ようにさらに構成された、請求項1に記載のシステム又は器具。
  9. 複数の配列決定セルを含む配列決定チップであって、前記デジタルプロセッサが、差分データの複数のセットを分析するようにさらに構成され、差分データの前記複数のセットのうちの各々が、前記複数の配列決定セルのうちのそれぞれ1つからくる、配列決定チップをさらに備える、請求項1に記載のシステム又は器具。
  10. 前記デジタルプロセッサが、前記差分データ内のパルスのレベルに基づいて、塩基分類を決定するためのカットオフ値を決定するために、差分データの前記複数のセットの値を集めるようにさらに構成された、請求項9に記載のシステム又は器具。
  11. 配列決定セルを用いる方法であって、
    前記配列決定セルのナノポアを横断して交流信号を印加するステップであって、前記ナノポアが、ヌクレオチドに接続されたタグを受容するように構成され、それにより充填事象を作成し、前記交流信号の各サイクルが、第1の部分と第2の部分とを備え、前記第2の部分の電圧レベルは、前記第1の部分の電圧レベルに対して、参照電圧の反対側にある、ステップと、
    前記交流信号の複数のサイクルの前記第1の部分の間に電圧データの第1のセットを取得するステップであって、電圧データの前記第1のセットの各データポイントが、異なる時刻で前記ナノポアの抵抗の値に対応し、前記ナノポアの前記抵抗は、前記タグが前記ナノポア内部に受容されるとき、変化する、ステップと、
    電圧データの前記第1のセットから電圧データの変位されたセットを決定するステップであって、電圧データの前記第1のセット及び電圧データの前記変位されたセットのデータポイントの各サイクルが、指定された数のデータポイントを含む、ステップと、
    電圧データの前記第1のセットのデータポイントと、対応する、電圧データの前記変位されたセットのデータポイントとの間の差分を算出することによって、差分データを算出するステップと、
    前記差分データ内の1つ又は複数のデータポイントに基づいて、前記充填事象を識別するステップと
    を含む、方法。
  12. 前記対応するデータポイントが、異なるサイクル内に同一の位置を有する、請求項11に記載の方法。
  13. 電圧データの前記変位されたセットの対応するデータポイントが、電圧データの前記第1のセットからデータポイントを選択することによって決定され、電圧データの前記変位されたセットの前記データポイントは、データポイント数が指定されたサイクルとは異なるサイクルから選択される、請求項11に記載の方法。
  14. 電圧データの前記変位されたセットが、電圧データの前記第1のセットの時間変位された複製から選択されるデータポイントを含み、前記差分データを算出するステップが、電圧データの前記第1のセットと、電圧データの前記第1のセットの前記時間変位された複製との対応するデータポイント間の差分を算出するステップを備える、請求項11に記載の方法。
  15. 電圧データの前記変位されたセットを決定するステップが、
    電圧データの前記第1のセットの第1サブセットを選択するステップと、
    電圧データの前記第1のセットの第2サブセットを選択するステップと
    をさらに含み、電圧データの前記第1のセットの前記第2サブセットのサイクルが、電圧データの前記第1のセットの前記第1サブセットのサイクルと異なるサイクルである、請求項11に記載の方法。
  16. 電圧データの前記変位されたセットを決定するステップが、
    電圧データの前記第1のセットの複製を生成するステップと、
    電圧データの前記第1のセットの前記複製に時間変位を適用することによって、電圧データの前記変位されたセットを生成するステップと、
    電圧データの前記第1のセット及び電圧データの前記変位されたセットの両方をメモリ内に格納するステップと
    をさらに含む、請求項11に記載の方法。
  17. 前記差分データのモードを識別するステップと、
    閾値を超える前記差分データの開始パルスを決定するステップであって、前記閾値は、前記モードから決定される、ステップと
    をさらに含む、請求項11に記載の方法。
  18. 差分データの複数のセットを分析するステップであって、差分データの前記複数のセットのうちの各々が、配列決定チップの複数の配列決定セルのうちのそれぞれ1つからくる、ステップと、
    前記差分データ内のパルスのレベルに基づいて、塩基分類を決定するためのカットオフ値を決定するために、差分データの前記複数のセットの複数の値を集めるステップと
    をさらに含む、請求項11に記載の方法。
JP2018567285A 2016-06-23 2017-06-22 ナノポア配列決定からのac信号の定期分析 Active JP6726316B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662354106P 2016-06-23 2016-06-23
US62/354,106 2016-06-23
PCT/EP2017/065423 WO2017220732A1 (en) 2016-06-23 2017-06-22 Period-to-period analysis of ac signals from nanopore sequencing

Publications (2)

Publication Number Publication Date
JP2019527819A JP2019527819A (ja) 2019-10-03
JP6726316B2 true JP6726316B2 (ja) 2020-07-22

Family

ID=59295165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018567285A Active JP6726316B2 (ja) 2016-06-23 2017-06-22 ナノポア配列決定からのac信号の定期分析

Country Status (5)

Country Link
US (2) US11124827B2 (ja)
EP (1) EP3475695B1 (ja)
JP (1) JP6726316B2 (ja)
CN (1) CN109313177B (ja)
WO (1) WO2017220732A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6814875B2 (ja) 2016-08-08 2021-01-20 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 確率的配列決定プロセスのための塩基呼出
CN109963949A (zh) * 2016-09-15 2019-07-02 豪夫迈·罗氏有限公司 使用具有杂合模式刺激的电压模式的基于纳米孔的测序
JP6770197B2 (ja) * 2016-12-15 2020-10-14 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 適応ナノ細孔信号圧縮
JP2021513962A (ja) 2018-02-15 2021-06-03 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 分析物の検出および分析のためのナノポアタンパク質コンジュゲート
CN112292462B (zh) * 2018-06-27 2024-06-14 豪夫迈·罗氏有限公司 生化传感器阵列中的多路复用模拟部件
EP3894056A2 (en) * 2018-12-11 2021-10-20 F. Hoffmann-La Roche AG Systems and methods for self-limiting protein pore insertion in a membrane
CN111662971A (zh) * 2020-06-04 2020-09-15 成都万众壹芯生物科技有限公司 一种基因测序芯片的校正方法、装置
JP7498913B2 (ja) 2020-07-16 2024-06-13 地方独立行政法人神奈川県立産業技術総合研究所 ドリフト補正装置、ドリフト補正方法およびプログラム
CN113030548A (zh) * 2021-03-09 2021-06-25 南京邮电大学 基于局域阈值的纳米孔检测电流信号特征信息提取方法及装置

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58223927A (ja) 1982-06-22 1983-12-26 Nec Corp デ−タ圧縮処理装置
US5853979A (en) 1995-06-30 1998-12-29 Visible Genetics Inc. Method and system for DNA sequence determination and mutation detection with reference to a standard
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
EP1285252A1 (en) * 2000-04-24 2003-02-26 Eagle Research & Development, LLC An ultra-fast nucleic acid sequencing device and a method for making and using the same
US6413792B1 (en) 2000-04-24 2002-07-02 Eagle Research Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
WO2002045323A2 (en) 2000-12-01 2002-06-06 Sri International Data relationship model
EP1727065A4 (en) 2004-01-30 2010-05-05 Nat Inst Of Advanced Ind Scien SEQUENCER OF EVENTS
EP1910556A4 (en) 2004-07-20 2010-01-20 Conexio 4 Pty Ltd METHOD AND APPARATUS FOR NUCLEIC ACID SEQUENCE ANALYSIS
US8200648B2 (en) 2006-08-07 2012-06-12 Yeda Research & Development Co. Ltd. At The Weizmann Institute Of Science Data similarity and importance using local and global evidence scores
US7731826B2 (en) 2006-08-17 2010-06-08 Electronic Bio Sciences, Llc Controlled translocation of a polymer in an electrolytic sensing system
CN101680873B (zh) 2007-04-04 2015-11-25 加利福尼亚大学董事会 使用纳米孔的组合物、设备、系统和方法
US8703422B2 (en) 2007-06-06 2014-04-22 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
EP2155855B1 (en) 2007-06-06 2016-10-12 Pacific Biosciences of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US8126235B2 (en) 2008-04-04 2012-02-28 Massachusetts Institute Of Technology Methods and apparatus for automated base-calling on multiple DNA strands
US20100122907A1 (en) 2008-05-06 2010-05-20 Government of the United States of America, Single molecule mass or size spectrometry in solution using a solitary nanopore
US9218451B2 (en) 2008-08-26 2015-12-22 23Andme, Inc. Processing data from genotyping chips
WO2010024894A1 (en) 2008-08-26 2010-03-04 23Andme, Inc. Processing data from genotyping chips
US8370079B2 (en) 2008-11-20 2013-02-05 Pacific Biosciences Of California, Inc. Algorithms for sequence determination
US8986928B2 (en) 2009-04-10 2015-03-24 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
JP5858931B2 (ja) 2010-02-08 2016-02-10 ジニア・テクノロジーズ・インコーポレーテッドGenia Technologies Incorporated ナノ細孔内の分子を操作するためのシステムおよび方法
EP3933402A1 (en) 2010-02-23 2022-01-05 University of Washington Method of making unsupported artificial mycolic acid membranes
US9165109B2 (en) 2010-02-24 2015-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
WO2011108540A1 (ja) 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置
EP2593568B1 (en) 2010-07-14 2017-04-19 The Curators Of The University Of Missouri Nanopore-facilitated single molecule detection of nucleic acids
WO2012033524A2 (en) 2010-09-07 2012-03-15 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
US20130060482A1 (en) 2010-12-30 2013-03-07 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
US10241075B2 (en) 2010-12-30 2019-03-26 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
US20130090860A1 (en) 2010-12-30 2013-04-11 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
JP6457811B2 (ja) 2011-09-23 2019-01-23 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
CN102621214B (zh) 2012-03-13 2014-10-29 美国哈佛大学 一种基于固态纳米孔对核酸分子进行减速及单分子捕获的方法
ES2906186T3 (es) 2012-04-09 2022-04-13 Univ Columbia Método para la preparación de nanoporo y usos del mismo
US20130274148A1 (en) 2012-04-11 2013-10-17 Illumina, Inc. Portable genetic detection and analysis system and method
EP2864502B1 (en) 2012-06-20 2019-10-23 The Trustees of Columbia University in the City of New York Nucleic acid sequencing by nanopore detection of tag molecules
CN102899243B (zh) 2012-09-21 2014-08-20 清华大学 基于石墨烯纳米孔-微腔-固态纳米孔结构的dna测序装置及方法
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
JP6120437B2 (ja) 2013-03-08 2017-04-26 国立大学法人大阪大学 物質の識別方法
WO2014165286A1 (en) 2013-03-12 2014-10-09 Iowa State University Research Foundation, Inc. Systems and methods for recognizing, classifying, recalling and analyzing information utilizing ssm sequence models
US9551697B2 (en) * 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
CN105980578B (zh) 2013-12-16 2020-02-14 深圳华大智造科技有限公司 用于使用机器学习进行dna测序的碱基判定器
CN106255767A (zh) 2014-03-21 2016-12-21 牛津楠路珀尔科技有限公司 由多维测量分析聚合物
GB201408652D0 (en) 2014-05-15 2014-07-02 Oxford Nanopore Tech Ltd Model adjustment during analysis of a polymer from nanopore measurements
SG11201609692SA (en) 2014-06-03 2016-12-29 Illumina Inc Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
KR102472061B1 (ko) 2014-08-08 2022-11-29 퀀텀-에스아이 인코포레이티드 분자들을 프로빙, 검출 및 분석하기 위한 광학계 및 검정 칩
WO2016064703A1 (en) 2014-10-21 2016-04-28 Life Technologies Corporation Methods, systems, and computer-readable media for blind deconvolution dephasing of nucleic acid sequencing data
US9557294B2 (en) 2014-12-19 2017-01-31 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US9863904B2 (en) 2014-12-19 2018-01-09 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US10935512B2 (en) 2015-09-24 2021-03-02 Roche Sequencing Solutions, Inc. Encoding state change of nanopore to reduce data size

Also Published As

Publication number Publication date
JP2019527819A (ja) 2019-10-03
US20170370902A1 (en) 2017-12-28
EP3475695B1 (en) 2020-07-01
CN109313177B (zh) 2020-09-22
US11124827B2 (en) 2021-09-21
EP3475695A1 (en) 2019-05-01
US20210395815A1 (en) 2021-12-23
WO2017220732A1 (en) 2017-12-28
CN109313177A (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
JP6726316B2 (ja) ナノポア配列決定からのac信号の定期分析
US11892444B2 (en) Formation and calibration of nanopore sequencing cells
CN109952382B (zh) 随机测序方法的碱基识别
CN109791138B (zh) 纳米孔电压方法
JP7366073B2 (ja) バイオケミカルセンサアレイの多重化アナログ構成要素
CN111512155B (zh) 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声
JP2020520446A (ja) フェーズドナノポアアレイ
US20230279488A1 (en) Normalization and baseline shift removal by rotation in added data dimensions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200626

R150 Certificate of patent or registration of utility model

Ref document number: 6726316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250