JP2021504701A

JP2021504701A - ナノポア−ｓｂｓ信号のための規格化およびベースラインシフト除去

Info

Publication number: JP2021504701A
Application number: JP2020528440A
Authority: JP
Inventors: フオ，ショウチン
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG
Priority date: 2017-11-27
Filing date: 2018-11-20
Publication date: 2021-02-15
Anticipated expiration: 2038-11-20
Also published as: US20230279488A1; EP3717905A1; CN111615629A; JP7042910B2; US20200283844A1; CN111615629B; WO2019104076A1; US11639524B2

Abstract

配列決定セル（３００）を用いる方法が、核酸（３３２）を配列決定しながら、電圧（３２８）を配列決定セル間に印加するステップと、タグ分子（３３８）が配列決定セルのナノポア（３１６）内で装填されつつ複数の信号値（Ｐ（ｔｉ））を配列決定セルから取得するステップと、複数の取得された信号値（Ｐ（ｔｉ））のそれぞれの値と相関関係にある複数の相関信号値（Ｘ（ｔｉ））を取得し、それにより複数の２次元のデータポイント（１２０１、１２０３、１２０５、１２０７、１２０９、１３０３、１３０５、１３０７、１３０９、１３１１）を形成するステップとを含む。２次元のデータポイントは、複数の取得された信号値に対する１次元と、相関信号値に対する２次元とを含む。方法は、２次元変換を、２次元のデータポイントに適用することによって、複数の変換された信号値を計算するステップを、さらに含む。【選択図】図３

Description

関連出願の相互参照
[0001]本出願は、内容の全てが本明細書での参照により組み込まれる、２０１７年１１月２７日に提出された米国仮特許出願第６２／５９１，０９９の利益を主張するものである。

[0002]内径が１ナノメートル程度のポアサイズを有するナノポア膜装置は、迅速なヌクレオチド配列決定において見込みを示してきた。電位が導電性流体に浸漬されたナノポア全体に印加されたとき、ナノポア全体のイオンの伝導に起因するわずかなイオン電流が存在し得る。電流の量は、ポアサイズ、およびどの分子がナノポア内にあるかに影響される。分子は、特定のヌクレオチドに取り付けられた特定のタグであり得て、それにより核酸の特定の位置にあるヌクレオチドの検出が可能になる。ナノポアを含む回路内の電圧は、分子の抵抗を測定する方法として測定され得て（例えば、積分コンデンサにおいて）、それによりナノポア内の分子の検出が可能になる。

[0003]ナノポアベースの配列決定チップは、ＤＮＡ配列決定に用いられ得る。ナノポアベースの配列決定チップは、アレイとして構成される多数のセンサセルを組み込み得る。例えば、１００万個のセルのアレイは、１０００行×１０００列のセルを含み得る。

[0004]測定される電圧は、製造のばらつきにより、チップ毎に、かつ同一チップ内のセル毎に変化し得る。そのため、セル内の特定の核酸または他の重合体の中の本当のヌクレオチドであり得る、またはそれに対応し得る、本当の分子を測定することは困難であり得る。加えて、他の時間に依存する測定電圧の非理想性が、不正確の原因となり得る。また、これらの回路は、例えば、脂質二重層、ナノポアなどの生化学的な回路素子を利用するので、電気的特性の変動性が、従来の半導体回路より、はるかに高くなり得る。

[0005]したがって、配列決定処理の精度および安定性を向上させる、信号の規格化技術が所望される。

[0006]各種実施形態が、マルチセルのナノポアベースの配列決定チップのセルからの出力信号処理に関する、技術およびシステムを提供している。改善されたマルチセルのナノポアベースの配列決定チップが、本明細書で開示される各種実施形態を利用することによって、構築され得る。例えば、実施形態は、例えばゼロ点電圧の変動／ドリフト、ゲインドリフト、およびベースラインシフトに起因する、配列決定信号の非理想性を補償できる、配列決定信号処理を実行するシステムおよび方法を含み得る。

[0007]一実施形態によれば、配列決定信号の非理想性は、ベースラインシフトによって誘起される配列決定信号の誤差などの効果をより効果的に補償する、改善された信号処理技術を用いることによって、補償され得る。技術は、各明モード信号値を対応する相関信号値と関連付けることによって、１次元の明モード信号値から、２次元の信号値、すなわち、２次元のデータポイントを発生させることを含み得る。２次元のデータポイントは次に、明モードのデータの分散を低減し得る、１つまたは複数の２次元変換を決定するために使用され得る。技術は、新たに取得された明モード信号値の分散を低減するために、２次元変換を、新たに取得された明モード信号値に適用することも含み得る。

[0008]別の実施形態によれば、配列決定信号の非理想性は、暗モード信号を明モード信号から減ずるベースラインとして利用する、改善された信号処理のシステムおよび方法によって、補償され得る。暗モード信号は、配列決定セルに印加されたとき、タグが印加された電界によってナノポアの筒の外に押し出される、ＡＣ信号の「暗モード」期間中に取得される。例えば、セルのゼロ点電圧の変動を補償するために、ゼロ点が補償された信号値は、暗モード信号を、明モードの開経路信号値と明モードの装填された信号値との両方から減算することによって、計算され得る。ゼロ点が補償された信号値は、他の中間処理段階、例えば移動ヒストグラムを利用する段階、および／または後述する２次元処理方法への入力として使用されてもよい。技術は、セルのゼロ点電圧の不均一性および／またはドリフトなどの現象によって誘起される、配列決定信号の誤差を、たとえゼロ点電圧自体の値が未知であっても、補正し得る。

[0009]別の実施形態によれば、規格化因子の改善された推定値が、改善された信号処理技術を用いて決定され得る。技術は、任意の時点での（例えば、ポア内にタグがない）開放チャネルのポア状態を、その時点での一連の測定履歴に基づいて決定するために、移動ヒストグラムを使用し得る。履歴データによるヒストグラムへの寄与は、履歴データをその経時度合に応じて重み付け／割引することによって、制御され得る。ポア内のタグを用いて測定される信号を規格化する際に使用する規格化因子は、移動ヒストグラムの最大のピークに関連付けられた、配列決定信号値であると決定されてもよい。

[0010]上述の技術は、ナノポアベースの配列決定セルの配列決定信号を改善するために、単独で、または任意の組合せもしくは順序で用いられ得る。１つまたは複数の上述の技術は、マルチセルのナノポアベースの配列決定チップの配列決定信号を改善するために、セル単位基準で適用され得る。

[0011]他の実施形態は、本明細書で説明される方法に関連付けられたシステムおよびコンピュータ読み取り可能な媒体に向けられる。

[0012]本発明の実施形態の性質および利点のより良好な理解が、以下の詳細な説明および添付図面を参照することで、獲得され得る。

[0013]ナノポアセルのアレイを含むナノポアセンサチップの一実施形態の平面図である。 [0014]ポリヌクレオチドまたはポリペプチドを特徴づけるために使用され得る、ナノポアセンサチップ内のナノポアセルの一実施形態である。 [0015]ナノポアベースの、合成による配列決定（ナノ−ＳＢＳ）技術を用いてヌクレオチド配列決定を実行するナノポアセルの一実施形態である。 [0016]ナノポアセル内の電気回路の一実施形態である。 [0017]ＡＣサイクルの明期間および暗期間中のナノポアセルから取得されたデータポイントの例である。 [0018]図６Ａは、いくつかの実施形態による、理想化されたＡＤＣ信号のための規格化の技術概念である。図６Ｂは、いくつかの実施形態による、理想化されたＡＤＣ信号のための規格化の技術概念である。 [0019]ある実施形態により、ゲインドリフトに悪影響を受けた理想化された信号である。 [0020]ある実施形態により、ベースラインシフトを示す理想化された信号である。 [0021]約５秒の推移にわたりナノポアセルから測定された、未処理の配列決定信号のサンプルデータの一例である。 [0022]ある実施形態により、非ゼロおよび変化するＶ_０の効果を除去するために、配列決定信号を処理する方法１０００を示すフローチャートである。 [0023]ある実施形態により、開チャネル値を用いて測定された明モード信号を規格化する、ポイント単位の開チャネル規格化ルーチンのみを用いて規格化されたデータの一例である。 [0024]図１２Ａは、ある実施形態による、暗−明面内の回転によるオフセットシフト補正を示す。図１２Ｂは、ある実施形態による、暗−明面内の回転によるオフセットシフト補正を示す。図１２Ｃは、ある実施形態による、暗−明面内の回転によるオフセットシフト補正を示す。 [0025]図１３Ａは、ある実施形態による、積分された履歴値および明値によって定義された２Ｄ面内の変換による、オフセットシフト補正方法を示すプロットである。図１３Ｂは、ある実施形態による、積分履歴値および明値によって定義された２Ｄ面内の変換による、オフセットシフト補正方法を示すプロットである。 [0026]ある実施形態により、配列決定セルを用いる方法１４００を示すフローチャートである。 [0027]ある実施形態による、配列決定セルを用いる方法を示すフローチャートである。 [0028]図１６Ａは、ある実施形態により、ポイント単位の規格化のみによって処理されたサンプルデータと、積分履歴−明モード面内での２次元変換、およびその後にポイント単位の規格化によって、処理されたサンプルデータとの、比較である。図１６Ｂは、ある実施形態により、ポイント単位の規格化のみによって処理されたサンプルデータと、積分履歴−明モード面内での２次元変換、およびその後にポイント単位の規格化によって、処理されたサンプルデータとの、比較である。 [0029]図１６Ｂで示したものに類似した処理された配列決定信号データから計算され得る、一例の移動ヒストグラム１７０１である。 [0030]ある実施形態による、配列決定セルを用いる方法を示すフローチャートである。 [0031]いくつかの実施形態による、規格化およびオフセット補正の一例のシステムである。 [0032]本開示のある態様による、コンピュータシステムである。

用語
[0033]別途定義されない限り、本明細書で用いられる技術的および科学的な用語は、当業者によって一般に理解される意味と同様の意味を有する。本明細書で説明される方法、装置、および材料と同様のまたは同等のものが、開示された技術の実施で使用され得る。以下の用語は、頻繁に使用される一定の用語の理解を支援するために提供され、本開示の範囲を限定することを意味しない。本明細書で用いられる略語は、化学的および生物学の分野でのその従来の意味を有する。

[0034]「核酸」は、デオキシリボヌクレオチドまたはリボヌクレオチド、および一本または二本鎖のいずれかの形態の、その重合体を指し得る。この用語は、合成の、自然発生的、非自然発生的であり、参照核酸と同様の結合特性を有し、参照ヌクレオチドと同様の挙動で代謝する、周知のヌクレオチドの類似物または修飾された主鎖の残基または連鎖を含む核酸を包含し得る。そのような類似物の例は、それだけには限らないが、ホスホロチオエート、ホスホルアミダイト、メチルホスホン酸塩、キラルメチルホスホン酸塩、２−Ｏ−メチルリボヌクレオチド、ペプチド核酸（ＰＮＡ）を含み得る。別途規定されていない限り、個々の核酸配列は、明示的に示された配列だけでなく、従来の方法で修飾されたその変形形態（例えば、縮重コドン置換）および相補的配列を、暗黙的に包含する。具体的には、縮重コドン置換は、１つまたは複数の選択された（または全ての）コドンの第３の位置が、混合塩基および／またはデオキシイノシン残基で置換される、配列を発生させることによって達成され得る（Ｂａｔｚｅｒら、ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ．１９：５０８１（１９９１）、Ｏｈｔｓｕｋａら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２６０：２６０５−２６０８（１９８５）、Ｒｏｓｓｏｌｉｎｉら、Ｍｏｌ．Ｃｅｌｌ．Ｐｒｏｂｅｓ８：９１−９８（１９９４））。用語、核酸は、遺伝子、ｃＤＮＡ、ｍＲＮＡ、オリゴヌクレオチド、およびポリヌクレオチドと交換可能に用いられ得る。

[0035]用語「鋳型」は、ＤＮＡ合成のためのＤＮＡヌクレオチドの相補的鎖へ複製される一本鎖核酸分子を示し得る。場合によっては、鋳型は、ｍＲＮＡの合成中に複製されるＤＮＡの配列を示し得る。

[0036]用語「プライマ」は、ＤＮＡ合成の開始点を提供する短い核酸配列を示し得る。ＤＮＡポリメラーゼなどのＤＮＡ合成を触媒する酵素は、新らたなヌクレオチドをＤＮＡ複製用プライマに加え得る。

[0037]「ポリメラーゼ」は、鋳型を用いたポリヌクレオチドの合成を行う酵素を示し得る。この用語は、完全な長さのポリペプチドとポリメラーゼ活性を有する範囲とを両方とも包含する。ＤＮＡポリメラーゼは、当業者によく知られており、それだけに限定されないが、パイロコッカス・フリオサス、サーモコッカス・リトラリス、およびサーモトガ・マリティマから分離もしくは派生したＤＮＡポリメラーゼ、またはその変形版を含む。それらは、ＤＮＡ依存性ポリメラーゼと、逆転写酵素などのＲＮＡ依存性ポリメラーゼとを両方とも含む。ＤＮＡ依存性ＤＮＡポリメラーゼは、ほとんどがファミリーＡ、Ｂ、およびＣに分類されるものの、少なくとも５つのファミリーが知られている。多様なファミリー間での、配列の類似性はわずかまたは皆無である。最多のファミリーＡポリメラーゼは、ポリメラーゼ、３’→５’エキソヌクレアーゼ活性および５’→３’エキソヌクレアーゼ活性を含む、複数の酵素機能を含み得る、単鎖のタンパク質である。ファミリーＢポリメラーゼは通常、ポリメラーゼおよび３’→５’エキソヌクレアーゼ活性を有する単一の触媒領域、ならびに副次的要素を有する。ファミリーＣポリメラーゼは通常、ポリメラーゼおよび３’→５’エキソヌクレアーゼ活性を有するマルチサブユニットのタンパク質である。大腸菌では、ＤＮＡポリメラーゼＩ（ファミリーＡ）、ＩＩ（ファミリーＢ）、およびＩＩＩ（ファミリーＣ）の、３つのタイプのＤＮＡポリメラーゼが見つかっている。真核細胞では、３つの異なるファミリーＢのポリメラーゼである、ＤＮＡポリメラーゼα、δ、およびεが、核の複製に関与し、ファミリーＡポリメラーゼであるポリメラーゼγが、ミトコンドリアＤＮＡ複製に使用される。他のタイプのＤＮＡポリメラーゼは、ファージポリメラーゼを含む。同様に、ＲＮＡポリメラーゼは通常、ファージおよびウイルスポリメラーゼだけでなく、真核性ＲＮＡポリメラーゼＩ、ＩＩ、およびＩＩＩ、ならびにバクテリアＲＮＡポリメラーゼを含む。ＲＮＡポリメラーゼは、ＤＮＡ依存性およびＲＮＡ依存性であり得る。

[0038]「ナノポア」は、膜内に、形成または配置された、細孔、流路または通路を示す。膜は、脂質二重層などの有機膜、または高分子材料から形成される膜などの合成膜であり得る。ナノポアは、例えば相補型金属酸化膜半導体（ＣＭＯＳ）または電界効果トランジスタ（ＦＥＴ）回路などの、検知回路に結合された検知回路または電極に、隣接または近接して配置され得る。いくつかの実施例では、ナノポアは、０．１ナノメートル（ｎｍ）〜約１０００ｎｍの水準の特徴的な幅または直径を有する。いくつかの実施態様では、ナノポアは、タンパク質であり得る。

[0039]用語「ヌクレオチド」は、自然に発生するリボヌクレオチドまたはデオキシリボヌクレオチド単量体を指すことに加えて、状況が明確にそうでないことを示さない限り、ヌクレオチドが使用されている個々の状況（例えば、相補的塩基へのハイブリッド形成法）に関して、機能的に同等である誘導体および類似物を含む、関連するその構造的変形形態を指すと理解され得る。

[0040]用語「タグ」は、原子または分子、あるいは原子または分子の集合であり得る、検出可能な部分を指し得る。タグは、光学的、電気化学的、磁気的、静電的（例えば、誘導性、容量性）識別特性を提供し得て、その識別特性がナノポアの支援により検出され得る。通常、ヌクレオチドにタグが取り付けられているとき、それは、「タグ付けされたヌクレオチド」と呼ばれる。タグは、リン酸塩部分を介してヌクレオチドに取り付けられ得る。

[0041]用語「明期間」は、通常、タグ付けされたヌクレオチドのタグが、ＡＣ信号を通して印加される電界によってナノポア内に押し込まれる期間を指す。用語「暗期間」は、通常、タグ付けされたヌクレオチドのタグが、ＡＣ信号を通して印加される電界によってナノポア外に押し出される期間を指す。ＡＣサイクルは、明期間および暗期間を含み得る。異なる実施形態では、ナノポアセルを明期間（または暗期間）内に入れるためにナノポアセルに印加される電圧信号の極性は、異なり得る。明期間および暗期間は、参照電圧に対する交流信号の異なる部分に対応し得る。

[0042]用語「信号値」は、配列決定セルからの配列決定信号出力値を指し得る。ある一定の実施形態によれば、配列決定信号は、１つまたは複数の配列決定セルの回路内のある点から測定されたおよび／または出力である、電気的信号であり得て、例えば、信号値は、電圧または電流であり得る（またはそれを表し得る）。信号値は、電圧および／または電流の直接測定の結果を表し得て、かつ／あるいは間接測定値を表し得て、例えば、信号値は、電圧または電流が指定された値に到達するのにかかる測定された持続時間であり得る。信号値は、ナノポアの抵抗率と相関を示しナノポア（充填されたかつ／または未充填の）の抵抗率および／またはコンダクタンスが導出され得る、任意の測定可能な量を表し得る。別の実施例として、信号値は、例えば、揺動されているヌクレオチドに取り付けられた蛍光体からポリメラーゼを有する核酸への、光の強度に対応し得る。

[0043]用語「ヒストグラム」は、指定された数の間隔（値域）毎に信号値の数のカウントを記憶するデータ構造を参照し得る。各値域は、信号値の離散的な値（例えば、ＡＤＣの分解能によって決定されるような）に、または可能な間隔内の信号値の範囲に対応し得る。

[0044]ある実施形態によれば、本明細書で開示される方法およびシステムは、ナノポアの配列決定信号、例えば、ナノポアセルに接続されたＡＤＣによって測定されるような電圧信号の処理における改善に関する。より具体的には、本明細書で開示される方法およびシステムは、ナノポア配列決定信号における、ゲインドリフトおよびベースラインシフトの両方を補正する。

[0045]ナノポア配列決定信号におけるベースラインシフト現象は、測定処理中に生じる充放電サイクル中における、システム内のある本質的に容量性である構成要素（例えば、セルの作用電極）上で増加する、電荷不均衡に関し得る。信号のゲインドリフトは、膜のキャパシタンスの比較的遅い（数百または数千秒）変化によって発生し得て、ここで膜（例えば、二重層）はポアを含む。そのような膜キャパシタンスは、例えば、二重層での物理的変化に応答して、決定論的進行で変化し得る。

[0046]信号のベースラインドリフトは、２次元変換によって、例えば、２次元空間でセルのデータを回転させるまたは平坦にすることによって、（セル単位基準で）除去され得て、ここで２次元空間の１つの軸は、測定された明チャネル電圧であると定義され、もう一方の軸は、セル内の電荷不均衡の代理として機能する導出値であると定義される。いくつかの実施形態では、代理は、明チャネル電圧または暗チャネル電圧のいずれかの、時間加重された積分履歴であり得る。積分履歴を計算するために、履歴電圧値は、より古いデータの合計への寄与を、履歴値が古くなるのに従って格下げしながら、総合して合計され（すなわち積分され）得る。時間的格下げの時定数は、セル単位基準で単独で測定され得る、セルのステップ応答時間に関係している。

[0047]ゲインドリフトの補償は、セルの明チャネル信号のポイント単位の規格化によって、（セル単位基準で）実現され得る。例えば、信号を規格化するために、各々の測定された未処理の電圧は、ピークＯＣ電圧の推定値によって除算され得る。ピークＯＣ電圧の推定値は、本明細書において「移動ヒストグラム法」と呼ばれるものを利用して、見つけられ得る。ピークＯＣ電圧は、データの、時間加重された移動ヒストグラム内の、最大ピークの最大値として確認され得る。規格化されることになるポイント単位で、ヒストグラムは、例えば、履歴データの各々の新しいヒストグラムへの寄与を、経時度合により指数関数的に格下げしながら更新処理を用いて、新しい電圧が取得される度に決定され得る。移動ヒストグラム法での指数関数的格下げの時定数はさらに、セルのゲインが変化するときの速度に関係し得る。

[0048]セルのゼロ点電圧Ｖ_０でのドリフトまたは変動の補償は、Ｖ_０の測定および追跡を明示的に必要としない、改善された処理技術によって実現され得る。例えば、暗モード信号を、開経路信号および装填された信号の両方から減算される、ベースライン信号として用いることによって、配列決定信号上のＶ_０ドリフトの効果は、補償され得る。さらに、Ｖ_０の分散に起因する、未処理の配列決定信号値の分散は、追加の測定を実施する必要なしに、大きく低減され、またはそれどころか除去され、配列決定作業中またはその前に、セル毎にＶ_０を明示的に追跡する。

Ｉ．ナノポア配列決定セル
[0049]ナノポアセンサチップ１００内のナノポアセル１５０は、多数の異なる方法で実施され得る。例えば、いくつかの実施形態では、異なるサイズおよび／または化学的構造のタグが、配列決定されるために、核酸分子内の異なるヌクレオチドに取り付けられ得る。いくつかの実施形態では、配列決定されることになる核酸分子の鋳型への相補鎖が、別の仕方で重合体がタグ付けされたヌクレオチドを鋳型とハイブリッド形成することによって、合成され得る。いくつかの実施態様では、核酸分子および取り付けられたタグは、両方ともナノポアを通り移動し、ナノポアを通過するイオン電流が、ヌクレオチドに取り付けられたタグの個々のサイズおよび／または構造によって、ナノポア内に存在するヌクレオチドを示し得る。いくつかの実施態様では、タグだけが、ナノポア内へ移動し得る。ナノポア内で異なるタグを検出するために、多数の異なる方法も存在し得る。

Ａ．ナノポア配列決定セル構造
[0050]図２は、ポリヌクレオチドまたはポリペプチドを特徴づけるために使用され得る、図１のナノポアセンサチップ１００内のナノポアセル１５０のような、ナノポアセンサチップ内のナノポアセル２００の一実施形態を示す。ナノポアセル２００は、誘電体層２０１および２０４から形成されたウェル２０５と、ウェル２０５を覆って形成された脂質二重層２１４と、脂質二重層２１４上の、脂質二重層２１４によってウェル２０５から分離された試料室２１５とを、含み得る。ウェル２０５は、ある体積の電解質２０６を収容し得て、試料室２１５は、例えば、可溶性タンパク質ナノポア膜貫通分子複合体（ＰＮＴＭＣ）などのナノポア、および対象の分析物（例えば、配列決定されることになる核酸分子）を収容するバルク電解質２０８を保持し得る。

[0051]ナノポアセル２００は、ウェル２０５の底部に作用電極２０２と、試料室２１５内に配置された対電極２１０とを含み得る。信号源２２８は、電圧信号を作用電極２０２と対電極２１０との間に印加し得る。単一のナノポア（例えば、ＰＮＴＭＣ）が、電圧信号による電気穿孔法プロセスによって脂質二重層２１４内へと挿入され、それにより脂質二重層２１４内のナノポア２１６を形成し得る。アレイ内の個々の膜（例えば、脂質二重層２１４または他の膜構造）は、化学的にも電気的にも互いに接続されていないこともある。それゆえ、アレイ内の各ナノポアセルは、独立した配列決定機械であり、対象の分析物に対して作用し、そうでなければ不透過性の脂質二重層を介してイオン電流を調節するナノポアに関連付けられる、単一のポリマー分子に固有のデータを生成する。

[0052]図２に示すように、ナノポアセル２００は、シリコン基板などの基板２３０上に形成され得る。誘電体層２０１は、基板２３０上に形成され得る。誘電体層２０１を形成するために用いられる誘電体材料は、例えば、ガラス、酸化物、窒化物、その他を含み得る。電気的刺激を制御し、ナノポアセル２００から検出される信号を処理する電気回路２２２は、基板２３０上および／または誘電体層２０１内部に形成され得る。例えば、複数のパタニングされた金属層（例えば、金属１〜金属６）が、誘電体層２０１内に形成され、複数の能動デバイス（例えば、トランジスタ）が、基板２３０上に製造され得る。いくつかの実施形態では、信号源２２８は、電気回路２２２の一部に含まれる。電気回路２２２は、例えば、増幅器、積算器、アナログデジタル変換器、ノイズフィルタ、フィードバック制御ロジック、および／または多様な他の構成要素を含み得る。電気回路２２２は、メモリ２２６に結合されたプロセッサ２２４にさらに結合され得て、ここでプロセッサ２２４は、アレイ内に配列されている重合体分子の配列を決定するために、配列決定データを分析することができる。

[0053]作用電極２０２は、誘電体層２０１上に形成され、ウェル２０５の底部の少なくとも一部を形成し得る。いくつかの実施形態では、作用電極２０２は、金属電極である。非ファラデー性伝導のために、作用電極２０２は、腐食および酸化に耐性を示す、例えば、白金、金、チタン窒化物、およびグラファイトなどの金属または他の材料で形成され得る。例えば、作用電極２０２は、電気めっきを用いた白金電極であってもよい。別の実施例では、作用電極２０２は、チタン窒化物（ＴｉＮ）作用電極であってもよい。作用電極２０２は、多孔質であってもよく、それによりその表面積および結果として生じる作用電極２０２に付随するキャパシタンスを増大させ得る。ナノポアセルの作用電極は、別のナノポアセルの作用電極から独立していることもあることから、作用電極は、本開示内でセル電極と呼ばれ得る。

[0054]誘電体層２０４は、誘電体層２０１上に形成され得る。誘電体層２０４は、ウェル２０５を囲む壁を形成する。誘電体層２０４を形成するために用いられる誘電体材料は、例えば、ガラス、酸化物、シリコン一窒化物（ＳｉＮ）、ポリイミド、または他の適切な疎水性の絶縁材料を含み得る。誘電体層２０４の上面は、シラン処理され得る。シラン処理は、誘電体層２０４の上面の上に疎水性層２２０を形成し得る。いくつかの実施形態では、撥水性層２２０は、約１．５ナノメートル（ｎｍ）の厚さを有する。

[0055]誘電体層２０４の壁によって形成されるウェル２０５は、作用電極２０２の上の電解質２０６の体積を含む。電解質２０６の体積は、緩衝性を有し、以下の、塩化リチウム（ＬｉＣｌ）、塩化ナトリウム（ＮａＣｌ）、塩化カリウム（ＫＣｌ）、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム（ＣａＣｌ_２）、塩化ストロンチウム（ＳｒＣｌ_２）、塩化マンガン（ＭｎＣｌ_２）、および塩化マグネシウム（ＭｇＣｌ_２）、のうちの１つまたは複数を含み得る。いくつかの実施形態では、電解質２０６の体積は、約３マイクロメートル（μｍ）の厚さを有する。

[0056]図２にも示すように、膜は、誘電体層２０４の上面に形成され、ウェル２０５全体に及ぶ。いくつかの実施形態では、膜は、疎水性層２２０の上面に形成された脂質単一層２１８を含み得る。膜がウェル２０５の開口に達したとき、脂質単一層２１８は、ウェル２０５の開口全体に及ぶ脂質二重層２１４に遷移し得る。脂質二重層は、例えば、ジフィタノイル−ホスファチジルコリン（ＤＰｈＰＣ）、１，２−ジフィタノイル−ｓｎ−グリセロ−３−ホスホコリン、１，２−ジ−Ｏ−フィタニル−ｓｎ−グリセロ−３−ホスホコリン（ＤｏＰｈＰＣ）、パルミトイル−オレオイル−ホスファチジルコリン（ＰＯＰＣ）、ジオレオイル−ホスファチジル−メチルエステル（ＤＯＰＭＥ）、ジパルミトイルホスファチジルコリン（ＤＰＰＣ）、ホスファチジルコリン、ホスファチジルエタノールアミン、ホスファチジルセリン、ホスファチジン酸、ホスファチジルイノシトール、ホスファチジルグリセロール、スフィンゴミエリン、１，２−ジ−Ｏ−フィタニル−ｓｎ−グリセロール、１，２−ジパルミトイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−［メトキシ（ポリエチレングリコール）−３５０］、１，２−ジパルミトイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−［メトキシ（ポリエチレングリコール）−５５０］、１，２−ジパルミトイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−［メトキシ（ポリエチレングリコール）−７５０］、１，２−ジパルミトイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−［メトキシ（ポリエチレングリコール）−１０００］、１，２−ジパルミトイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−［メトキシ（ポリエチレングリコール）−２０００］、１，２−ジオレオイル−ｓｎ−グリセロ−３−ホスホエタノールアミン−Ｎ−ラクトシル、ＧＭ１ガングリオシド、リゾホスファチジルコリン（ＬＰＣ）またはその任意の組合せから選択されるリン脂質を含み、またはそれらから構成され得る。

[0057]示したように脂質二重層２１４には、例えば、単一のＰＮＴＭＣによって形成された単一のナノポア２１６が埋め込まれる。上述のように、ナノポア２１６は、単一のＰＮＴＭＣを脂質二重層２１４内に電気穿孔法によって挿入することによって、形成され得る。ナノポア２１６は、対象の分析物および／または小さなイオン（例えば、Ｎａ^＋、Ｋ^＋、Ｃａ^２＋、Ｃｌ⁻）の少なくとも一部分を脂質二重層２１４の両側間を通過させるのに十分に大きくてもよい。

[0058]試料室２１５は、脂質二重層２１４を覆っており、特徴づける対象の分析物の溶液を保持し得る。溶液は、バルク電解質２０８を含み、最適なイオン濃度への緩衝性を有し、ナノポア２１６を開口状態に維持するために最適なｐＨに維持された水性溶液であり得る。ナノポア２１６は、脂質二重層２１４を横切り、バルク電解質２０８から作用電極２０２へのイオン流のための唯一の経路を提供する。ナノポア（例えば、ＰＮＴＭＣ）および対象の分析物に加えて、バルク電解質２０８は、塩化リチウム（ＬｉＣｌ）、塩化ナトリウム（ＮａＣｌ）、塩化カリウム（ＫＣｌ）、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム（ＣａＣｌ_２）、塩化ストロンチウム（ＳｒＣｌ_２）、塩化マンガン（ＭｎＣｌ_２）、および塩化マグネシウム（ＭｇＣｌ_２）、のうちの１つまたは複数をさらに含み得る。

[0059]対電極２１０は、電気化学的電位センサであり得る。いくつかの実施形態では、対電極２１０は、複数ナノポアセル間で共有され、それゆえ、共通電極とも称され得る。いくつかの場合では、共通の電位および共通電極は、全てのナノポアセルに対して、または少なくとも個々のグループ内の全てのナノポアセルに対して共通であり得る。共通電極は、共通の電位を、ナノポア２１６と接触するバルク電解質２０８に印加するように構成可能である。対電極２１０および作用電極２０２は、脂質二重層２１４間に電気的刺激（例えば、電圧バイアス）を供給するための信号源２２８に結合され、脂質二重層２１４の電気的特性（例えば、抵抗、電気容量、およびイオン電流）を検知のために用いられ得る。いくつかの実施形態では、ナノポアセル２００は、参照電極２１２も含み得る。

[0060]いくつかの実施形態では、多様なチェックが、較正の一部としてナノポアセルの作成中に実施され得る。ナノポアセルが作成された後、さらなる較正ステップが、例えば、所望されるように（例えば、セル中に１ナノポア）実行しているナノポアセルを識別するために、実行されてもよい。そのような較正チェックは、物理的チェック、電圧較正、開放流路較正、および単一のナノポアを有するセルの識別を含み得る。

Ｂ．ナノポア配列決定セルの信号検出
[0061]ナノポアセンサチップ１００内のナノポアセル１５０などのナノポアセンサチップ内のナノポアセルは、合成による単分子ナノポアベースの配列決定（ナノ−ＳＢＳ）技術を用いる並行配列決定を可能にし得る。

[0062]図３は、ナノ−ＳＢＳ技術を用いてヌクレオチド配列決定を実行するナノポアセル３００の一実施形態を示す。ナノ−ＳＢＳ技術では、配列決定されることになる鋳型３３２（例えば、ヌクレオチド酸分子または別の対象の分析物）およびプライマは、ナノポアセル３００の試料室内のバルク電解質３０８内に導入され得る。例として、鋳型３３２は、円形状または直線状であり得る。核酸プライマは、４つの別の仕方で重合体がタグ付けされたヌクレオチド３３８が付加され得る、鋳型３３２の一部にハイブリッド形成され得る。

[0063]いくつかの実施形態では、酵素（例えば、ＤＮＡポリメラーゼなどのポリメラーゼ３３４）が、鋳型３３２への相補鎖を合成するのに用いるナノポア３１６に関連付けられ得る。例えば、ポリメラーゼ３３４は、ナノポア３１６に共有結合していてもよい。ポリメラーゼ３３４は、ヌクレオチド３３８のプライマ上への、一本鎖核酸分子を鋳型として用いる取り込みを触媒する。ヌクレオチド３３８は、４つの異なるタイプＡ、Ｔ、ＧまたはＣのうちの１つであるヌクレオチドを伴うタグ種（「タグ」）を含み得る。

[0064]タグ付けされたヌクレオチドが、ポリメラーゼ３３４と正しく結合されるとき、タグは、電気的な力、例えば、脂質二重層３１４および／またはナノポア３１６間に印加される電圧により生成される電界の存在下で生成される力によってナノポア内に引き込まれ（装填され）得る。電圧は、作用電極および対電極３１０に接続された電源３２８を用いて印加され得る。タグの尾部は、ナノポア３１６の筒内に位置決めされ得る。ナノポア３１６の筒内に保たれるタグは、タグの別個の化学的な構造および／またはサイズにより、固有のイオン遮断信号３４０を生成し、それにより、タグが取り付けられた付加された塩基を、電子的に同定する。

[0065]本明細書で用いられるとき、「装填された」または「充填された」タグは、認識可能な長さの時間、例えば、０．１ミリ秒（ｍｓ）から１０，０００ミリ秒の間、ナノポア内に位置決めされる、および／または、ナノポア内または近くに留まるタグでもよい。いくつかの場合では、タグは、ヌクレオチドから放出される前に、ナノポア内に装填される。いくつかの例では、装填されたタグが、ヌクレオチド組み込み事象の際に放出された後にナノポアを通過する（および／またはナノポアにより検出される）確率が適度に高く、例えば９０％から９９％である。

[0066]いくつかの実施形態では、ポリメラーゼ３３４がナノポア３１６に接続される前に、ナノポア３１６のコンダクタンスは、例えば約３００ピコジーメンス（３００ｐＳ）のように高いことがあり得る。タグがナノポア内に装填されるとき、固有のコンダクタンス信号（例えば、信号３４０）は、タグの別個の化学構造および／またはサイズにより生成される。例えば、ナノポアのコンダクタンスは、約６０ｐＳ、８０ｐＳ、１００ｐＳまたは１２０ｐＳであり、それぞれは、タグ付けされたヌクレオチドの４つのタイプのうちの１つに対応する。ポリメラーゼは、次に異性化およびリン酸基転移反応を経て、ヌクレオチドを成長している核酸分子内に組み込み、タグ分子を放出する。

[0067]いくつかの場合では、タグ付けされたヌクレオチドのいくつかは、核酸分子（鋳型）の目下の位置（相補的塩基）と一致し得ない。核酸分子と塩基対合されていないタグ付けされたヌクレオチドも、ナノポアを通過し得る。これらの対合されていないヌクレオチドは、典型的には、正しく対合されたヌクレオチドがポリメラーゼと結合したままである時間スケールより短い時間スケール内で、ポリメラーゼによって拒絶される。対合されていないヌクレオチドに結合されたタグは、ナノポアを迅速に通過し、短期間（例えば、１０ｍｓ未満）の間検出され得て、一方、対合したヌクレオチドに結合されたタグは、ナノポア内に装填され、長期間（例えば、少なくとも１０ｍｓ）の間検出され得る。それゆえ、対合されていないヌクレオチドは、ヌクレオチドがナノポア内で検出される時間に少なくとも部分的に基づいて、下流のプロセッサによって識別され得る。

[0068]装填された（充填された）タグを含むナノポアのコンダクタンス（または等価的に抵抗）が、ナノポアを通過する電流を介して測定され得て、タグ種の識別、それによる目下の位置にあるヌクレオチドを提供する。いくつかの実施形態では、直流（ＤＣ）信号が、ナノポアセルに印加され得る（例えば、タグがナノポアを通って移動する方向が反転しないように）。しかし、直流を用いた長期間のナノポアセンサの運転は、電極の組成を変化させ得て、ナノポア全体のイオン濃度を不平衡にさせ、ナノポアセルの寿命に影響し得る他の望ましくない効果を有し得る。交流（ＡＣ）波形を印加することは、電界移動を低減し、これらの望ましくない効果を回避し、下記のある一定の利点を有し得る。タグ付けされたヌクレオチドを利用する本明細書で説明される核酸配列決定方法は、印加されるＡＣ電圧に完全に共存可能であり、それゆえＡＣ波形が、これらの利点を達成するために用いられ得る。

[0069]ＡＣ検出サイクル中に電極を再充電する能力は、犠牲電極、または導電反応で分子特性を変化させる電極（例えば、銀を含む電極）を用いる場合、有益であり得る。電極は、直流信号が使用されるとき、検出サイクル中に消耗し得る。再充電は、電極が小さいとき（例えば、平方ミリメートル当たり少なくとも５００の電極を有する電極アレイに供給するために十分に小さいとき）問題になり得る、電極が完全に枯渇するなどの消耗限界に到達することを防止し得る。電極寿命は、場合によっては、電極の幅と共に進み、少なくとも部分的に、それに依存する。

[0070]ナノポアを通過するイオン電流を測定する好適な状態は、当技術分野で知られており、例が本明細書で提供される。測定は、膜および細孔間に印加される電圧により実行され得る。いくつかの実施形態では、電圧は、−４００ｍＶ〜＋４００ｍＶの範囲にあり得る。用いられる電圧は、−４００ｍＶ、−３００ｍＶ、−２００ｍＶ、−１５０ｍＶ、−１００ｍＶ、−５０ｍＶ、−２０ｍＶ、および０ｍＶから選択される下限と、＋１０ｍＶ、＋２０ｍＶ、＋５０ｍＶ、＋１００ｍＶ、＋１５０ｍＶ、＋２００ｍＶ、＋３００ｍＶ、および＋４００ｍＶから別々に選択される上限とを有する範囲にあることが好ましい。用いられる電圧は、１００ｍＶ〜２４０ｍＶの範囲にあることがさらに好ましく、１６０ｍＶ〜２４０ｍＶの範囲にあることが最も好ましい。増大された印加電位を用いたナノポアによって異なるヌクレオチド間の識別能力を増大させることが可能である。ＡＣ波形およびタグ付けされたヌクレオチドを用いた核酸の配列決定は、その全体が引用することにより本明細書に組み込まれる、２０１３年１１月６日に提出された「ＮｕｃｌｅｉｃＡｃｉｄＳｅｑｕｅｎｃｉｎｇＵｓｉｎｇＴａｇｓ（タグを用いた核酸配列決定）」という名称の米国特許公開第ＵＳ２０１４／０１３４６１６で説明されている。米国２０１４／０１３４６１６で説明されたタグ付けされたヌクレオチドに加えて、配列決定は、例えば、５つの一般的な核酸塩基、アデニン、シトシン、グアニン、ウラシル、およびチミンの（Ｓ）−グリセロール・ヌクレオシド・三リン酸塩（ｇＮＴＰ）などの糖または非環式の部分を欠く、ヌクレオチド類似物を用いて実行され得る（Ｈｏｒｈｏｔａら、ＯｒｇａｎｉｃＬｅｔｔｅｒｓ、８：５３４５−５３４７［２００６］）。

Ｃ．ナノポア配列決定セルの電気回路
[0071]図４は、ナノポアセル２００などのナノポアセル内の電気回路４００（図２の電気回路２２２の一部分を含み得る）の一実施形態を示す。上述のように、いくつかの実施形態では、電気回路４００は、ナノポアセンサチップ内の複数のナノポアセルまたは全てのナノポアセル間で共有され得、それゆえ、共通電極とも称され得る対電極４１０を含む。共通電極は、電圧源Ｖ_ＬＩＱ４２０に接続することによって、共通の電位を、ナノポアセル内の脂質二重層（例えば、脂質二重層２１４）と接触するバルク電解質（例えば、バルク電解質２０８）に印加するように構成されることが可能である。いくつかの実施形態では、ＡＣ非ファラデー性モードが、電圧Ｖ_ＬＩＱをＡＣ信号（例えば、方形波）で変調するために利用され、それをナノポアセル内で脂質二重層に接触するバルク電解質に印加し得る。いくつかの実施形態では、Ｖ_ＬＩＱは、±２００〜２５０ｍＶの大きさおよび例えば２５〜４００Ｈｚの周波数を有する方形波である。対電極４１０と脂質二重層（例えば、脂質二重層２１４）との間のバルク電解質は、例えば、１００μＦ以上などの大きなコンデンサ（図示せず）によって、モデル化され得る。

[0072]図４は、作用電極４０２（例えば、作用電極２０２）および脂質二重層（例えば、脂質二重層２１４）の電気特性を表す電気モデル４２２も示す。電気モデル４２２は、脂質二重層に関連付けられたキャパシタンスをモデル化するコンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}）と、ナノポア内の個々のタグの存在に基づいて変化し得る、ナノポアに関連付けられた可変抵抗をモデル化する抵抗器４２８（Ｒ_ＰＯＲＥ）とを含む。電気モデル４２２は、２重層キャパシタンス（Ｃ_{ＤｏｕｂｌｅＬａｙｅｒ}）を有し、作用電極４０２およびウェル２０５の電気特性を表すコンデンサ４２４も含む。作用電極４０２は、他のナノポアセル内の作用電極から独立した別個の電位を印加するように構成され得る。

[0073]パスデバイス４０６は、脂質二重層および作用電極を電気回路４００から接続または切断するために使用され得るスイッチである。パスデバイス４０６は、電圧刺激がナノポアセル内の脂質二重層間に印加されることを有効化または無効化するために、制御ライン４０７によって制御され得る。脂質が、脂質二重層を形成するために堆積される前では、２つの電極間のインピーダンスは、セルのウェルが封止されていないため、非常に低く、それゆえパスデバイス４０６は、短絡状態を回避するために開路に維持され得る。パスデバイス４０６は、脂質溶媒がナノポアセルに堆積されてナノポアセルのウェルを封止した後、閉じられ得る。

[0074]回路４００は、オンチップ積分コンデンサ４０８（ｎ_ｃａｐ）をさらに含み得る。積分コンデンサ４０８は、リセット信号４０３を使用しスイッチ４０１を閉じ、その結果、積分コンデンサ４０８が電圧源Ｖ_ＰＲＥ４０５に接続されることによって、事前充電され得る。いくつかの実施形態では、電圧源Ｖ_ＰＲＥ４０５は、例えば、９００ｍＶの大きさの固定の参照電圧を提供する。スイッチ４０１が閉じられているとき、積分コンデンサ４０８は、電圧源Ｖ_ＰＲＥ４０５の参照電圧レベルまで事前充電され得る。

[0075]積分コンデンサ４０８が事前充電された後、リセット信号４０３が使用されスイッチ４０１が開路され、その結果、積分コンデンサ４０８は、電圧源Ｖ_ＰＲＥ４０５から切断される。この時点では、電圧源Ｖ_ＬＩＱのレベルにより、対電極４１０の電位は、作用電極４０２（および積分コンデンサ４０８）の電位より高いレベルにあるか、その反対でもあり得る。例えば、電圧源Ｖ_ＬＩＱからの方形波の正位相の間（例えば、ＡＣ電圧源信号サイクルの明または暗期間）、対電極４１０の電位は、作用電極４０２の電位より高いレベルにある。電圧源Ｖ_ＬＩＱからの方形波の負位相の間（例えば、ＡＣ電圧源信号サイクルの暗または明期間）、対電極４１０の電位は、作用電極４０２の電位より低いレベルにある。したがって、いくつかの実施形態では、積分コンデンサ４０８は、対電極４１０と作用電極４０２との間の電位差により、明期間の間に電圧源Ｖ_ＰＲＥ４０５の事前充電された電圧レベルからさらに高いレベルまで充電され、暗期間中により低いレベルに放電され得る。他の実施形態では、充電および放電は、それぞれ暗期間および明期間に発生し得る。

[0076]積分コンデンサ４０８は、１ｋＨｚ、５ｋＨｚ、１０ｋＨｚ、１００ｋＨｚ、またはそれを超え得る、アナログデジタル変換器（ＡＤＣ）４３５のサンプリング速度による固定された期間に、充電または放電され得る。例えば、１ｋＨｚのサンプリング速度で、積分コンデンサ４０８は、約１ｍｓの期間中、充電／放電し、次に、電圧レベルがサンプリングされ、積分期間の終わりにＡＤＣ４３５によって変換され得る。個々の電圧レベルは、ナノポア内の個々のタグ種に対応し、それゆえ、鋳型上の目下の位置でのヌクレオチドに対応し得る。

[0077]ＡＤＣ４３５によるサンプリングされた後、積分コンデンサ４０８は、リセット信号４０３を使用しスイッチ４０１を閉じ、その結果、積分コンデンサ４０８が電圧源Ｖ_ＰＲＥ４０５に再接続されることによって、再び事前充電され得る。積分コンデンサ４０８を事前充電するステップと、積分コンデンサ４０８が充電または放電する一定の期間待機するステップと、積分コンデンサの電圧レベルをＡＤＣ４３５によってサンプリングおよび変換するステップとが、配列決定プロセスの間中サイクルで繰り返され得る。

[0078]デジタルプロセッサ４３０は、例えば、正規化、データバッファリング、データフィルタリング、データ圧縮、データ削減、イベント抽出、またはナノポアセルアレイからのＡＤＣ出力データを多様なデータフレームへのアセンブリングなどのために、ＡＤＣ出力データを処理し得る。いくつかの実施形態では、デジタルプロセッサ４３０は、塩基判定などのさらに下流の処理を実行し得る。デジタルプロセッサ４３０は、ハードウェア（例えば、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣなどの内部の）またはハードウェアとソフトウェアとの組合せとして実装され得る。

[0079]したがって、ナノポア間に印加される電圧信号は、ナノポアの個々の状態を検出するために用いられ得る。ナノポアの可能な状態の１つは、タグが取り付けられたポリホスフェートがナノポアの筒に存在しない場合、開放チャネル状態であり、本明細書ではナノポアの未充填状態とも呼ぶ。ナノポアの別の４つの可能な状態は、タグが取り付けられたポリホスフェートヌクレオチドの４つの異なるタイプ（Ａ、Ｔ、ＧまたはＣ）のうちの１つがナノポアの筒内に保持されるときの状態に各々対応する。ナノポアのさらに別の可能な状態は、脂質二重層が断裂するときである。

[0080]積分コンデンサ４０８での電圧レベルが、固定された期間後に測定されるとき、ナノポアの異なる状態は、異なる電圧レベルの測定値をもたらし得る。これは、積分コンデンサ４０８（すなわち、時間に対する積分コンデンサ４０８の電圧のグラフの傾きの程度）での電圧減衰率（放電による減少または充電による増大）が、ナノポアの抵抗（例えば、抵抗器Ｒ_ＰＯＲＥ４２８の抵抗）に依存するからである。より詳しくは、異なる状態のナノポアに関連付けられた抵抗が、分子（タグ）の別個の化学構造に起因して異なるので、異なる対応する電圧減衰率は、観察され得るようになり、ナノポアの異なる状態を識別するために用いられ得る。電圧減衰曲線は、ＲＣ時定数τ＝ＲＣを有する指数関数曲線であり得て、ここで、Ｒは、ナノポアに関連付けられた抵抗（すなわち、Ｒ_ＰＯＲＥ４２８）であり、Ｃは、Ｒに並列の膜に関連付けられたキャパシタンス（すなわち、コンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}））である。ナノポアセルの時定数は、例えば、約２００〜５００ｍｓであり得る。減衰曲線は、二重層の詳細な実施により、指数関数曲線に正確に一致し得ないが、減衰曲線は、指数関数曲線に類似し、単調であり得て、それゆえ、タグの検出を可能にする。

[0081]いくつかの実施形態では、開放チャネル状態にあるナノポアに関連付けられた抵抗は、１００ＭΩ〜２０ＧΩまでの範囲内にあり得る。いくつかの実施形態では、タグが、ナノポアの筒内部に存在する状態にあるナノポアに関連付けられた抵抗は、２００ＭΩ〜４０ＧΩまでの範囲内にあり得る。他の実施形態では、積分コンデンサ４０８は、ＡＤＣ４３５へ導く電圧が、電気モデル４２２内の電圧減衰によりやはり変化することになるため、省略され得る。

[0082]積分コンデンサ４０８での電圧の減衰率は、異なる方法で決定され得る。上で説明したように、電圧減衰率は、一定の時間間隔の間の電圧減衰を測定することによって決定され得る。例えば、積分コンデンサ４０８での電圧は、最初に時間ｔ１でＡＤＣ４３５により測定され、次に、電圧は、時間ｔ２でＡＤＣ４３５により再び測定される。時間曲線に対する積分コンデンサ４０８での電圧の傾きがより急であるとき、電圧差はより大きく、電圧曲線の傾きがより緩やかなとき、電圧差はより小さい。このように、電圧差は、積分コンデンサ４０８での電圧の減衰率を、ゆえに、ナノポアセルの状態を決定するための測定基準として用いられ得る。

[0083]他の実施形態では、電圧減衰率は、選択された電圧減衰量のために必要な持続時間を測定することによって決定され得る。例えば、電圧が第１の電圧レベルＶ１から第２の電圧レベルＶ２に降下または増大するのに必要な時間が測定され得る。時間に対する電圧曲線の傾きがより急であるとき、必要な時間はより少なく、時間に対する電圧曲線の傾きがより緩やかなとき、必要な時間はより大きい。このように、必要な測定時間は、積分コンデンサｎ_ｃａｐ４０８での電圧の減衰率を、ゆえに、ナノポアセルの状態を決定するための測定基準として用いられ得る。当業者には、例えば、電流測定技術を含む、ナノポアの抵抗を測定するために必要とされ得る多様な回路を理解されよう。

[0084]いくつかの実施形態では、電気回路４００は、オンチップに、パスデバイス（例えば、パスデバイス４０６）および追加のコンデンサ（例えば、積分コンデンサ４０８（ｎ_ｃａｐ））を含まないことがあり、それによりナノポアベースの配列決定チップのサイズの削減を支援する。膜（脂質二重層）の薄い性質のため、膜に関連付けられたキャパシタンス（例えば、コンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}））のみで、追加のオンチップのキャパシタンスを必要とすることなく必要なＲＣ時定数を生み出すのに十分とすることができる。それゆえ、コンデンサ４２６は、積分コンデンサとして使用され得て、電圧信号Ｖ_ＰＲＥによって事前充電され、続いて、電圧信号Ｖ_ＬＩＱによって放電または充電され得る。そうでなければ電気回路内にオンチップで作製される追加のコンデンサおよびパスデバイスをなくすことにより、ナノポア配列決定チップ内の単一のナノポアセルのフットプリントを著しく減少させることができ、それにより、（例えば、ナノポア配列決定チップ内の数百万ものセルを有する）ますます多くのセルを含むためにナノポア配列決定チップを拡大することが容易になる。

Ｄ．ナノポアセル内でのデータサンプリング
[0085]核酸の配列決定を実行するために、積分コンデンサ（例えば、積分コンデンサ４０８（ｎ_ｃａｐ））またはコンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}）の電圧レベルは、タグ付けされたヌクレオチドが核酸に加えられている間に、ＡＤＣ（例えば、ＡＤＣ４３５）によってサンプリングされ変換され得る。ヌクレオチドのタグは、例えば、Ｖ_ＬＩＱがＶ_ＰＲＥより低いような印加電圧のとき、対電極および作用電極を介して印加される、ナノポア間の電界によって、ナノポアの筒内へと押し入れられ得る。

１．充填
[0086]充填事象は、タグ付けされたヌクレオチドが、鋳型（例えば、核酸断片）に取り付けられ、タグがナノポアの筒の内外に進むときにあたる。これは、充填事象の間に複数回発生し得る。タグが、ナノポアの筒内にあるとき、ナノポアの抵抗は、より高く、より低い電流がナノポアを通り流れ得る。

[0087]配列決定の間、タグは、いくつかのＡＣサイクル状態でナノポア内に存在しないことがあり（開放チャネル状態と呼ぶ）、この場合電流は、ナノポアのより低い抵抗のために、最も高い。タグがナノポアの筒内へと取り付けられるとき、ナノポアは、明モードである。タグがナノポアの筒外へと押し出されるとき、ナノポアは、暗モードである。

２．明および暗期間
[0088]ＡＣサイクルの間、積分コンデンサでの電圧は、ＡＤＣによって複数回サンプリングされ得る。例えば、ある実施形態では、ＡＣ電圧信号が、システム全体に、例えば、約１００Ｈｚで印加され、ＡＤＣの取得速度は、セルあたり約２０００Ｈｚであり得る。このように、ＡＣサイクル（ＡＣ波形のサイクル）毎に取得される約２０のデータポイント（電圧測定値）が存在し得る。ＡＣ波形の１サイクルに対応するデータポイントは、１セットと呼ばれ得る。ＡＣサイクル毎のデータポイントの１セット内には、例えば、明モード（期間）に対応し得る、Ｖ_ＬＩＱがＶ_ＰＲＥより低いときキャプチャされるサブセットが存在し得て、このときタグは、ナノポアの筒内へと押し込まれる。別のサブセットは、暗モード（期間）に対応し得て、このときタグは、例えば、Ｖ_ＬＩＱがＶ_ＰＲＥより高いとき、印加される電界によってナノポアの筒外へと押し出される。

３．測定電圧
[0089]データポイント毎に、スイッチ４０１が開路のとき、積分コンデンサ（例えば、積分コンデンサ４０８（ｎ_ｃａｐ）またはコンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}））における電圧は、例えば、Ｖ_ＬＩＱがＶ_ＰＲＥより高いとき、Ｖ_ＰＲＥからＶ_ＬＩＱに増大し、Ｖ_ＬＩＱがＶ_ＰＲＥより低いとき、Ｖ_ＰＲＥからＶ_ＬＩＱに減少するように、Ｖ_ＬＩＱによる充電／放電の結果として減衰する挙動で変化していく。最終的な電圧値は、Ｖ_ＬＩＱから作用電極の電荷だけずれる。積分コンデンサでの電圧レベルの変化率は、ナノポアを含み、結果としてナノポア内の分子（例えば、タグ付けされたヌクレオチドのタグ）を含み得る、二重層の抵抗の値によって支配され得る。電圧レベルは、スイッチ４０１が開路した後の所定時間に測定され得る。

[0090]スイッチ４０１は、データ収集速度で動作し得る。スイッチ４０１は、通常、ＡＤＣによる測定の直後の２回のデータ取得間の比較的短時間、閉路され得る。スイッチは、複数データポイントがＶ_ＬＩＱの各ＡＣサイクルの各サブ期間（明または暗）中に収集されることを可能にする。スイッチ４０１が開路のままのとき、積分コンデンサでの電圧レベルおよび、それゆえ、ＡＤＣの出力値は、完全に減衰し、そこに留まり得る。代わりに、スイッチ４０１が閉路のとき、積分コンデンサは、再び事前充電され（Ｖ_ＰＲＥに）、別の測定の準備がなされる。したがって、スイッチ４０１は、複数データポイントが各ＡＣサイクルの各サブ期間（明または暗）に収集されることを可能にする。そのような複数の測定は、固定されたＡＤＣ（例えば、平均化され得る、より多数の測定による８ビットから１４ビット）を用いたより高い分解能を可能にさせ得る。複数の測定は、ナノポア内に充填される分子に関する動態情報をさらに提供し得る。時間の情報により、どれだけの長さで充填が発生するかの決定を可能にさせ得る。これは、核酸鎖に加えられる複数のヌクレオチドが配列決定されつつあるか否かを判定することを支援することにも用いられ得る。

[0091]図５は、ＡＣサイクルの明期間および暗期間中のナノポアセルから取得されたデータポイントの例を示す。図５では、データポイントでの変化は、図解目的用に強調されている。作用電極または積分コンデンサに印加される電圧（Ｖ_ＰＲＥ）は、例えば、９００ｍＶなどの一定のレベルにある。ナノポアセルの対電極に印加される電圧信号５１０（Ｖ_ＬＩＱ）は、方形波として示されるＡＣ信号であり、このときデューティサイクルは、５０％以下、例えば約４０％のような任意の好適な値であり得る。

[0092]明期間５２０の間、対電極に印加される電圧信号５１０（Ｖ_ＬＩＱ）は、作用電極に印加される電圧Ｖ_ＰＲＥより低く、その結果、タグは、作用電極および対電極に印加される、異なる電圧レベルに起因する電界によって、ナノポアの筒内に押し込まれ得る（例えば、タグ上の電荷および／またはイオンの流れにより）。スイッチ４０１が開路のとき、ＡＤＣの前のノードでの（例えば、積分コンデンサでの）電圧は、減少していく。電圧データポイントが取得された後（例えば、指定された期間の後）、スイッチ４０１は、閉路され得て、測定ノードでの電圧は、Ｖ_ＰＲＥへと再び戻るように増大していく。プロセスは、複数の電圧データポイントを測定するために繰り返され得る。このようにして、複数のデータポイントは、明期間の間に取得され得る。

[0093]図５に示すように、Ｖ_ＬＩＱ信号の符号の変化の後の明期間内の第１のデータポイント５２２（第１のポイントデルタ（ＦＰＤ）とも呼ばれる）は、後続のデータポイント５２４よりも低いことがあり得る。これは、ナノポア内にタグが存在しないからであり（開流路）、それゆえ、それは低抵抗および高放電率を有するためであり得る。いくつかの例では、第１のデータポイント５２２は、図５に示すようなＶ_ＬＩＱレベルを超え得る。これは、信号をオンチップコンデンサに結合する二重層のキャパシタンスに起因し得る。データポイント５２４は、充填事象が発生した、すなわち、タグがナノポアの筒内に押し込まれた後に取得され得て、この場合ナノポアの抵抗、およびそれゆえの積分コンデンサの放電速度は、ナノポアの筒内に押し込まれるタグの個々のタイプに依存する。データポイント５２４は、以下で説明するように、Ｃ_{ＤｏｕｂｌｅＬａｙｅｒ}４２４で生成される電荷により、測定毎にわずかに減少し得る。

[0094]暗期間５３０の間、対電極に印加される電圧信号５１０（Ｖ_ＬＩＱ）は、作用電極に印加される電圧Ｖ_ＰＲＥより高く、その結果、いずれのタグも、ナノポアの筒外に押し出され得る。スイッチ４０１が開路のとき、測定ノードでの電圧は、電圧信号５１０（Ｖ_ＬＩＱ）の電圧レベルがＶ_ＰＲＥより高いので、増大する。電圧データポイントが取得された後（例えば、指定された期間の後）、スイッチ４０１は、閉路され得て、測定ノードでの電圧は、Ｖ_ＰＲＥへと再び戻るように減少していく。プロセスは、複数の電圧データポイントを測定するために繰り返され得る。このように、複数のデータポイントは、第１のポイントデルタ５３２および後続のデータポイント５３４を含む暗期間の間に取得され得る。上述のように、暗期間の間に、いずれのヌクレオチドタグもナノポアの外に押し出され、それゆえ、任意のヌクレオチドタグに関する最小限度の情報が取得され、さらに正規化に用いられる。

[0095]図５は、明期間５４０の間、対電極に印加される電圧信号５１０（Ｖ_ＬＩＱ）は、作用電極に印加される電圧Ｖ_ＰＲＥより低いにもかかわらず、充填事象が発生しない（開経路）ことも示す。したがって、ナノポアの抵抗は低く、積分コンデンサの放電速度は高い。結果的に、第１のデータポイント５４２および後続のデータポイント５４４を含む、取得されたデータポイントは、低電圧レベルを示す。

[0096]明または暗期間の間に測定される電圧は、ナノポアの一定の抵抗（例えば、１つのタグがナノポア内にある間に所与のＡＣサイクルの明モードの間に形成される）の測定毎にほぼ同一であると期待され得るが、このことは、電荷が２重層コンデンサ４２４（Ｃ_{ＤｏｕｂｌｅＬａｙｅｒ}）で生成する場合であり得ない。この電荷生成は、ナノポアセルの時定数をより長くさせる結果をもたらし得る。結果的に、電圧レベルは移動し、それにより測定値がサイクル内のデータポイント毎に減少するという結果をもたらし得る。このように、サイクル内で、データポイントは、図５に示すように、ある程度データポイントから別のデータポイントへ変化し得る。

[0097]測定に関するさらなる詳細は、例えば、「Ｎａｎｏｐｏｒｅ−ＢａｓｅｄＳｅｑｕｅｎｃｉｎｇＷｉｔｈＶａｒｙｉｎｇＶｏｌｔａｇｅＳｔｉｍｕｌｕｓ（電圧刺激を変化させるナノポアベースの配列決定）」という名称の米国特許公開第２０１６／０１７８５７７、「Ｎａｎｏｐｏｒｅ−ＢａｓｅｄＳｅｑｕｅｎｃｉｎｇＷｉｔｈＶａｒｙｉｎｇＶｏｌｔａｇｅＳｔｉｍｕｌｕｓ（電圧刺激を変化させるナノポアベースの配列決定）」という名称の米国特許公開第２０１６／０１７８５５４、「Ｎｏｎ−ＤｅｓｔｒｕｃｔｉｖｅＢｉｌａｙｅｒＭｏｎｉｔｏｒｉｎｇＵｓｉｎｇＭｅａｓｕｒｅｍｅｎｔＯｆＢｉｌａｙｅｒＲｅｓｐｏｎｓｅＴｏＥｌｅｃｔｒｉｃａｌＳｔｉｍｕｌｕｓ（電気的刺激に応答した二重層の測定を用いた非破壊二重層モニタリング）」という名称の米国特許出願第１５／０８５，７００、および「ＥｌｅｃｔｒｉｃａｌＥｎｈａｎｃｅｍｅｎｔＯｆＢｉｌａｙｅｒＦｏｒｍａｔｉｏｎ（二重層形成の電気的促進）」という名称の米国特許出願第１５／０８５，７１３の中で見つけることができ、開示のその全体があらゆる目的のために参照により本明細書に組み込まれる。

４．正規化および塩基分類
[0098]ナノポアセンサチップの有効なナノポアセル毎に、生成モードが、核酸を配列決定するために実行され得る。配列決定中に取得されるＡＤＣ出力データは、より高い精度を提供するために、正規化され得る。正規化は、サイクル形状、ゲインドリフト、電荷注入オフセット、およびベースラインシフトなどの偏位効果を引き起こし得る。いくつかの実施態様では、充填事象に対応する明期間サイクルの信号値は、単一の信号値がサイクル毎に取得される（例えば、平均）ように、平坦化され得る、またはサイクル内減衰（一種のサイクル形状効果）を低減するために測定された信号に対して調整がなされ得る。ゲインドリフトは、通常完全な信号を基準の大きさとし、数百から数千秒までのオーダーで変化する。例として、ゲインドリフトは、溶液の変化（ポア抵抗）または二重層キャパシタンスの変化がトリガとなり得る。ベースラインシフトは、約１００ｍｓの時間尺度で発生し、作用電極の電圧オフセットに関係する。ベースラインシフトは、配列決定セル内の電荷バランスを明期間から暗期間へ維持する必要の結果として、充填からの有効調整比の変化によって駆動され得る。

[0099]正規化の後、実施形態は、充填された経路の電圧のクラスタを決定し得て、ここで各クラスタは、異なるタグ種、およびそれゆえの異なるヌクレオチドに対応する。クラスタは、所与のヌクレオチドに対応する所与の電圧の確率を算出するために使用され得る。別の例として、クラスタは、異なるヌクレオチド（塩基）間での差別化のための分離電圧を決定するために用いられ得る。

[0100]単一の測定に基づく核酸の塩基決定の例示の方法が以下に提供される。実施例は、説明のために電圧測定を使用し得るが、例示の技術は、電流測定などの他の信号測定に同様に適用する。

ＩＩ．誤差源
[0101]チップの有用なセルが識別された後、生成モードが、例えば、１つの核酸を配列決定するセル毎に、核酸を配列決定するために、実行され得る。配列決定中に測定される信号値は、より高い精度を提供するために、規格化され得る。例えば、ＡＣ駆動電圧の明期間（本明細書で「明モード電圧」または代替として「明期間電圧」と呼ぶ）中に取得される電圧レベルデータが規格化され得る。例えば、明モード電圧は、ナノポアが、本明細書で「開チャネル電圧」または「明モード開チャネル電圧」と呼ぶ、充填されていない状態にあるとき、測定された明モードデータポイントの各々をセルの明モード電圧で除算することによって、規格化され得る。明モード電圧レベルデータを規格化することによって、未処理のＡＤＣ測定値のダイナミックレンジは、規格化された範囲に変倍され、通常、０と１の間の範囲を提供するが、明モード開チャネル電圧に用いられる特定値により、１より大きい値も可能である。

[0102]規格化は、システムが変化を、例えば、配列決定セルの電気特性の変化を、補償することを可能にし得る。例えば、回路４００のキャパシタンスは、時間と共に変化し得る。例えば、コンデンサ４２６（Ｃ_{Ｂｉｌａｙｅｒ}）のキャパシタンスは、例えば、ウェルの縁部における二重層の面積または厚さの物理的変化のために、変化し得て、ここでのそのような変化は、ゲインドリフトと呼ばれる。別の例として、充電は、明期間と暗期間との間の電荷移動の差異の結果として、セル内で増大し得て、これがベースラインシフト（およびときには高速ベースラインシフト）と呼ばれる。低速ベースラインシフトは、測定回路の変動性および二重層膜の電気特性の変化に起因し得る。これらの例は、より詳細に後述する。

[0103]そのような変化は、正確な同一状態が測定された値に影響を及ぼし得て、それにより不安定性をもたらす。しかしながら、規格化が、そのような変化を補償し得て、時間に対して安定した規格化値（例えば、電圧または電流）を提供し、それにより核酸の配列決定の決定において、より高い精度を可能にする。

Ａ．理想化された規格化
[0104]図６Ａ〜６Ｂは、いくつかの実施形態による、理想化されたＡＤＣ信号のための規格化の技術概念を示す。図６Ａは、例えば、上述したような、配列決定作業中にＡＤＣによって測定され得る、理想化された明モードデータ６０１および理想化された暗モードデータ６０３を示す。図６Ａ〜６Ｂの理想化されたＡＤＣデータも、図５への参照で上述したデータより、さらに長い時間尺度で示されている。そのため、個々のＡＣサイクルは、図５では見ることができない。それにもかかわらず、明モードデータ６０１および暗モードデータ６０３は、ＡＣ駆動電圧Ｖ_ｌｉｑの異なる半サイクル中に取得されることを理解されたい。さらに、図６Ａで示したデータは、ノイズ、ゲインドリフト、および／またはベースラインシフトが存在しないという意味で、理想化されており、すなわち、開チャネル電圧（明モードおよび暗モードの両方とも）は、個々のＡＣサイクルにわたり一定であり、時間に対して一定である。

[0105]加えて、明モードデータ６０１は、２つの異なるタグ付けされたヌクレオチドの２つの別個の仮想の充填事象に対応する、充填事象６０５および６０７を示す。充填事象６０５および６０７で測定された電圧は、別の装填されたタグ付けされたヌクレオチドにより、異なる。図に示すように、充填事象は、いくつかのＡＣサイクルにわたって発生し、充填事象中に明モード開経路信号が測定されない、十分に高速な時間尺度で発生する。いくつかの実施形態では、１つまたは複数の充填事象６０５および６０７は、ＡＤＣ値の増大を、減少とは対照的に、もたらし得る。そのような値は、上述の開チャネルとして見なされ得る。

[0106]図６Ａでは、明モードの開チャネルＡＤＣ値は、充填事象６０５および６０７のＡＤＣ値を規格化するために用いられ得る、Ｐ_０により表されている。この理想化された例でのこの規格化因子Ｐ_０は、ｔ＝０での計測値において一定であり、この例ではＡＤＣ値が１５０である。この事例での規格化を実行するために、明モードデータの全てが、同一の定数Ｐ_０＝１５０で除算され得る。説明を容易にするために、除算による規格化の例が、本開示を通して使用されるが、当業者には、逆数による乗算が数学的に同等であり、そのため、本開示の範囲から逸脱することなくさらに使用され得ることが理解されよう。

[0107]図６Ｂは、図６Ａの理想化された明モードデータ６０１を規格化することでもたらされた、規格化された明モードデータ６１０を示す。規格化された明モードデータでは、開チャネルレベルおよびタグレベルは、未処理のＡＤＣ値ではなく、むしろ０から１の範囲で伸びている。明モード開チャネル電圧が、この事例では一定なので、規格化因子Ｐ_０は、配列決定実行の全持続時間にわたり、全信号を規格化するために使用され得る。しかしながら、実際の信号は、多くの非理想性に悪影響を受け、この簡潔な、単一の値の規格化を不正確にする。実際の配列決定システムでの誤差の２つの主要な原因は、ベースラインシフトおよびゲインドリフトである。

Ｂ．ゲインドリフト
[0108]各配列決定セルは、脂質二重層キャパシタンスによって決まる電圧利得を有する。ゲインは、２つの電極（例えば、対電極２１０および作用電極２０２）間で達成される電圧差に対応する。例えば、コンデンサの方程式Ｃ＝ｑ／Ｖが与えられたとすると、同量の充電が存在する場合、キャパシタンスが増大すると共に、電圧は減少し得る。したがって、脂質二重層キャパシタンスが、時間と共に変化する場合、電圧利得は時間と共に変化する。電圧利得が、時間と共に変化する場合、明モードおよび暗モード（開チャネルおよび装填されたものの両方）は、時間と共に変化し得る。任意の実際のシステムで、二重層キャパシタンスは、例えば、二重層が変形するにつれて、時間と共に変化し得る。そのような変化は、通常、数百または数千秒の時間尺度で発生し、通常の充填事象よりも低速であるが、より高い正確な測定が所望される場合、やはり考慮されるべきである。

[0109]図７は、ゲインドリフトに悪影響を受けた理想化された信号を示す（充填事象および非現実的なゲインドリフトの両方に非現実的な時間尺度を用いて、両方の現象が同一のグラフ上に明確に示されることを可能にした）。図６Ａ〜６Ｂのように、図７は、配列決定作業中にＡＤＣによって測定され得るような、理想化された明モードデータ７０１および理想化された暗モードデータ７０３を示す。ゲインドリフトは、明および暗モード間で反対に相関される（例えば、明モードが増大するとき、暗モードが減少する、および逆もまた同様）ドリフトを有する、明および暗モードの開チャネル電圧での全体のドリフトとして示されている。時間に対して同一のタグの、測定されるＡＤＣレベルに関して、ゲインドリフトが有する効果を明瞭にするために、各充填事象が同種のタグを含みながら、目下の開チャネル電圧から同一の電圧降下をもたらす、４つの充填事象をさらに示す。しかしながら、各事象中に同一のタグが装填されたという事実にもかかわらず、このタグのＡＤＣ値は、時間と共にドリフトする。このように、このセルに関しておそらく、同一のタグが、１２０から１５０の範囲内のどこにでも検出され得る事例である。結果として、規格化されていないレベルは、誤差が発生しやすいであろう。

[0110]ゲインドリフトを補正するために、図６Ａ〜６Ｂを参照して上述したものに類似した規格化手順が、実行され得る。しかしながら、図６Ａ〜６Ｂの事例と異なり、明モードでの開チャネル電圧は、時間に対して一定でないため、上述した単一の値の規格化（すなわち全てをＰ_０で除算する）は、時間に対して全ての信号を規格化できない。一定の規格化の代わりに、より複雑な可変規格化が、適用され得て、例えば、規格化は、未処理の明モードで測定されたＡＤＣ値の各々を、そのポイントの開チャネル値の推定値を用いて、除算することによって達成され得る。未充填領域毎に、開チャネル電圧の推定値は、多くの方法、例えば、局所的な平均値をとることによって、またはより詳細に後述するような、積分されたヒストグラム技術などの、より洗練された信号処理技術を用いることによって、作成され得る。したがって、局所的推定値は、明モードの開チャネル値のために、取得され得て、そのデータポイントに局所的な推定電圧を用いてデータポイントを規格化する。

[0111]他方では、信号の装填された領域は、課題を提供し得る。いくつかの充填事象には、例えば、充填事象７０５および７０７で見られるように、充填速度が十分低速である場合、利用可能な開放チャネルデータが存在し得る。充填速度が比較的低速である場合、開チャネル値は、タグが装填される前に、測定され得る。そのような開チャネル値は、サイクル毎に測定され得る。この挙動は、充填事象７０５および７０７で示した櫛状の線で示される。これらの事例では、限定された開チャネルデータは、充填事象中に真の開チャネル値を推定するために使用され得る。この限定された開チャネルデータ（すなわち充填発生しない場合に対して限定される）は、開チャネル値の局所的推定値（例えば、ゲインドリフトを考慮するように、時間内に局所的な）を取得するために使用され得る。

[0112]しかしながら、それは、充填が、例えば、充填事象７０９および７１１で示したような、開チャネルデータが明モードで取得されないほど十分高速である事例であり得る。充填速度が十分に高速である場合、タグは、速やかに装填され、開チャネル値は、測定されない。この開チャネル電圧の欠落は、開チャネルの局所的推定値を決定しようとする場合、問題となり得る。所与の時間間隔の開チャネル値が存在しない場合、その時間間隔には局所的推定値は決定され得ない。これらの事例では、さらに詳細に後述するように、暗モードデータを用いて、明モードでの開チャネルデータの局所的推定値を決定することができる。

Ｃ．ベースラインシフト
[0113]ベースラインシフトは、測定処理中に生じる充放電サイクルにおける、セルの一定の構成要素（例えば、Ｃ_{ＤｏｕｂｌｅＬａｙｅｒ}）上で増加する、電荷不均衡に関する現象である。例えば、測定処理中、過剰な電荷は、図４のＣ_{ＤｏｕｂｌｅＬａｙｅｒ}により表される、セルの作用電極上で増加し得る。一例では、電荷不均衡は、ナノポアおよびタグの両方とも非線形のＩ−Ｖ特性を有するという事実に起因する。この非線形性の結果として、充放電サイクルは、容量性の構成要素に、同一の量の電荷を付加または除去し得ない。例えば、正負のイオンは、１つの電極からもう一方の電極に、ポアを通って、時間に対して同一の速度で移動し得ず、例えば、ウェル内に正電荷の増加をもたらす。なお、デューティサイクルは、正負のイオンの伝達速度の通常の差異に対処するために、６０％暗モードおよび４０％明モードであり得るが、速度が変化するとき、デューティサイクルは変化する必要があり得て、このことは、実施が困難であり得ることに留意されたい。

[0114]この蓄積される電荷不均衡の結果として、セルでの電圧測定値は、（例えば、正電荷がウェルに増加するとき）増大し得る。電荷不均衡の結果として、このベースライン電圧のシフトは、それが、当初設定された対向する電圧に平衡するのに十分な高い電圧を発生するまで増大し得る。そのポイントで、電荷は再び均衡し得る。ベースラインシフトは、暗モードおよび明モードの両方の開チャネル状態において、ならびに４つの装填された状態の各々において、開チャネルの各々および４つの装填された状態で、潜在的に異なるシフトの大きさおよび時定数と共に、発生し得る。結果的に、ベースラインシフトは、ポアにおけるタグの確率的な結合事象を反映させる、全体的に不規則な様式で変化し得る。

[0115]図８は、ベースラインシフトを示す理想化された信号を示す。図６Ａ〜６Ｂおよび図７と同様に、図８は、理想化された明モードデータ８０１および理想化された暗モードデータ８０３を示す。この種類のベースラインシフトは、通常、タグのポア内での滞在時間のオーダーである時間尺度で、通常ゲインシフトための時間尺度よりずっと高速である時間尺度で、発生する。したがって、ゲインシフトは、図８では示されない。

[0116]充填事象８１０の前に、セルは、平衡に、すなわち、均等な電荷の、例えばＣ_{ＤｏｕｂｌｅＬａｙｅｒ}への、移動の確保に必要とするベースライン電圧に、明および暗モード中に到達してしまう。しかしながら、充填事象８１０が開始すると、システムは、平衡から外される。より具体的には、セルが暗モードにあるときのポアの実効抵抗が同じ値に留まる一方で、明モードでのポアの実効抵抗は、増大してしまう。明モードで増大させられた抵抗は、充填事象が発生する前と比較して、このモードの間に、移動するための充電量がより小さくなる。したがって、電荷不均衡が形成し始め、それが、タグレベルおよび暗モード開チャネルレベルの両方で、それぞれ、上向きシフト８０５および８０７につながる。

[0117]ゲインシフト現象と同様に、ベースラインシフトを補償するために、可変のポイント単位の規格化が、適用され得て、例えば、規格化は、未処理の明モードで測定されたＡＤＣ値の各々を、そのポイントの開チャネル値の推定値を用いて、除算することによって達成され得る。しかしながら、そのような補正方法は、開チャネルおよび装填されたチャネル信号間の動的な差異のために、装填された信号を的確に規格化し損ない得る。例えば、時間ｔでの開経路信号をＰ_ＯＣ（ｔ）とし、時間ｔでの可変の装填されたタグレベルをＰ_ｉ（ｔ）、ここでｉ＝Ａ、Ｃ、Ｇ、またはＴとすると、システムのダイナミックスは、以下の２つの方程式でモデル化され得る。
ここで、Ｐ^０ _ＯＣおよびＰ^０ _ｉは、ｔ＝０での開チャネルおよびｉ番目の装填されたチャネルの値、ｂは、ｔ＝０での開チャネルベースラインシフト、ｂ_ｉは、ｔ＝０でのｉ番目の装填されたチャネルのベースラインシフト、そしてＴは、ベースラインシフトに関連付けられた時間尺度である。明モードデータの、対応する明モード開経路信号による、ポイント単位の除算に依拠する規格化方法は、方程式（１）および（２）を方程式（１）で除算することによって、効果的にモデル化し得て、それが、それぞれ規格化された開チャネルおよびタグレベルの、方程式（３）および（４）をもたらす。

[0118]方程式（３）〜（４）で分かるように、ＯＣレベルは、全ての時間で完全に規格化される（定義によれば）。さらに、ｂ_ｉ＝ｂの場合ならば、時間依存が省かれ、方程式（４）は、
に変わる。しかしながら、一般的には、ｂ_ｉ≠ｂであり、方程式（４）は、全ての時間で一定に留まらず、タグレベルをもたらし続ける。したがって、開経路信号値によるポイント単位の除算に、主に依拠する、タグレベルの任意の規格化は、規格化後であっても、やはり時間依存性である規格化されたタグ値をもたらし得る。タグレベルの時間的変動は、十分に大きい場合、下流側の配列決定誤差の原因となり得て、そのため（開チャネル値によるポイント単位の規格化に加えて）信号処理技術を利用することが、ベースラインシフトのデータを的確に補正するために有益である。

Ｄ．ゼロ点電圧での変動
[0119]電子的な理由で、各セルは、異なるゼロ点電圧を有し得る。用語、ゼロ点電圧は、０Ｖがセルに入力として印加されたとき、セルによって出力される電圧を示し、本明細書ではＶ_０と呼ぶ。Ｖ_０の変動は、製造上の不完全性、またはチップ内の異なるセルのアナログ回路間の不均一性に起因し得る。さらに、電気化学的な理由で、偏りがセル内に形成され得る。さらに、電極の表面の化学的性質が、電極を電池としてはたらかせ、そのため、各セルは、セル毎にＶ_０に寄与し得るわずかに異なった電位を有し得る。セルでゼロでないＶ_０を有する正味の効果は、測定されたＡＤＣ信号が、Ｖ_０の値により、不自然に押し上げられまたは押し下げられることである。したがって、Ｖ_０が時間と共に変動する場合、配列決定誤差が生じ得る。

Ｅ．ゲインドリフトおよびベースラインシフトを示すサンプルデータ
[0120]図９は、約５秒の推移にわたりナノポアセルから測定された、未処理の配列決定信号のサンプルデータの一例を示す。信号は、複数の充填事象を含む明モードデータ９１０および暗モードデータ９２０を含む。充填事象に応答して、明および暗モードの両方が、挿入図に示すような、比較的短期間のベースラインシフトに悪影響を受け得る。例えば、数秒オーダーでの、より長い時間スケールでは、信号は、ゲインドリフトをやはり示し、それが図９で、明および暗チャネル信号間の分離において、わずかな、時間に対して漸進的な変化として現れている。図９で分かるように、明および暗チャネルでのオフセットシフトは、相関関係にあり、すなわちオフセットシフトは、明および暗モード信号で、同一の方向に移動することになり、例えば、両方のモードは、上向きにシフトする、または両方は、下向きにシフトする。対照的に、ゲインドリフトは、明および暗チャネル間で反相関関係にあり、すなわちゲインドリフトは、明および暗モード信号で、反対方向に移動することになり、例えば、明モードの場合、上にドリフトし、暗モードの場合、下にドリフトする。

ＩＩＩ．信号補正
[0121]ナノポア配列決定セルから取得された未処理の配列決定信号は、例えば、ゲインドリフト、ベースラインシフト、ゼロ点電圧での変動、および上述したような他の較正の課題を含む、いくつかの非理想性に悪影響を受ける。１つまたは複数の信号処理技術が、未処理の配列決定信号を改善するために用いられ得て、その結果、配列決定誤差が最小化される。

[0122]以下のセクションは、信号の精度および安定性を改善するために、未処理の配列決定信号を処理する方法を説明する。セクションＩＩＩ（Ａ）は、ゼロ点電圧の効果を、任意のセルのＶ_０を明示的に知ることなしに、補正するおよび／または除去する方法を説明する。セクションＩＩＩ（Ｂ）は、開チャネルおよび装填されたチャネル信号のダイナミックスが異なる場合でも、ベースラインシフトの効果を最小化し得る方法を説明する。セクションＩＩＩ（Ｃ）は、進行するヒストグラム技術を用いて追跡される開経路信号値を用いてゲインドリフトを補正するように、改善されたポイント単位の規格化を実行するために使用され得る方法を説明する。これらの方法は、ナノポア配列決定セルでの改善された信号処理方法を提供するために、単独で、または任意の組合せで使用され得る。

Ａ．Ｖ_０なしでの規格化
[0123]実施形態は、その開示が、あらゆる目的のためにその全体において参照により本明細書に組み込まれている、「ＦｏｒｍａｔｉｏｎａｎｄＣａｌｉｂｒａｔｉｏｎｏｆＮａｎｏｐｏｒｅＳｅｑｕｅｎｃｉｎｇｃｅｌｌｓ」という名称の米国特許出願第１５／６３２，１９０で説明されているように、Ｖ_０（Ｖ_{ＭＺＥＲＯ}とも呼ぶ）を補償するために、較正処理を実行し得る。例えば、Ｖ_０は、各々の配列決定処理の前に実行する、診断ルーチンの一部として、配列決定チップのセル毎に直接測定され得る。Ｖ_０は、定期的に測定され更新され、メモリに記憶され、次に、上述した２Ｄ変換処理および規格化手順の前に、測定された明モードおよび暗モード値から減算され得る。しかしながら、Ｖ_０値が、実際のＶ_０測定値と、それが測定された配列決定信号から減算される時間との間の期間を通じて、記憶された値からドリフトする場合、不正確さがやはり生じ得る。ある実施形態によれば、システムは、Ｖ_０を追跡し除去する必要をなくし、それにより時間依存性のＶ_０に起因する誤差の軽減を支援する、改善された処理方法を、利用し得る。

[0124]方法の一実施形態を説明するために、明および暗モード電圧値を、Ｖ_０を明確に考慮する関数形式で、表現することが、有用であり、
Ｖ_＋＝ｍ（Ｖ_ｐｏｓ−Ｖ_０）（６）
Ｖ₋＝ｍ（Ｖ_ｎｅｇ−Ｖ_０）（７）
ここでＶ_＋は、ＡＤＣによって測定された明モード電圧、Ｖ₋は、ＡＤＣによって測定された暗モード電圧、ｍは、システムのゲイン、Ｖ_ｐｏｓおよびＶ_ｎｅｇは、それぞれ明モードおよび暗モード中にセルのナノポア間の電圧である。通常、Ｖ_ｐｏｓは、ナノポアの状態により５つの異なる値をとり得て、開チャネル状態にはＶ^ＯＣ _ｐｏｓ、ならびにｉ＝Ａ、Ｃ、Ｇ、およびＴに対応する装填された状態のうちの１つ毎にＶ^Ｔｉ _ｐｏｓをとり得る。

[0125]セクションＩＩ（Ａ）で上記のように、規格化手順は、測定された明モード信号値を対応する開チャネル明モード信号値で除算することを含み得る。方程式（６）によって導入された明モードデータ用の関数形式を用いて、装填された状態毎の規格化値ｆ_ｉが、ゼロ点電圧Ｖ_０を明示的に考慮する形式で記述され得る。
ここで
は、ｉ＝Ａ、Ｃ、Ｇ、またはＴの測定された明モード装填された値、
は、測定された明モード開チャネル値である。

[0126]方程式（８）は、Ｖ_０が時間と共に変化する場合、たとえ未処理の装填された電圧Ｖ^Ｔｉ _ｐｏｓおよび未処理の開チャネル電圧Ｖ^ＯＣ _ｐｏｓが、各々時間に対して一定でも、規格化されたタグレベルの特定の数値も変化することになる。そのような規格化されたタグレベルでのドリフトは、下流の配列決定誤差の原因となり得る。すでに簡潔に上述したように、この誤差源を補正するために、ゼロ点電圧Ｖ_０の値は、頻繁に測定され、規格化がなされる前に、測定された開チャネルおよび装填されたチャネル値から減算され得る。しかしながら、この解決法は、貴重な配列決定時間をＶ_０測定に充てる必要があるので、問題であり、そのため一時的な盲点すなわちデッドタイムを、配列決定処理内に導入する。ある実施形態によれば、Ｖ_０の予備知識を必要とせず、そのためＶ_０の測定または追跡を必要としない、修正された規格化処理が、利用され得る。

[0127]例えば、代替の規格化は、ゼロ点電圧Ｖ_０が、方程式（６）および（７）で、単にオフセットとして現れることを認識することによって、Ｖ_０に依存しないことが識別され得る。したがって、オフセットは、方程式（７）によって表現された暗モードデータを、方程式（６）によって表現された明モードデータから減算することによって、除去され得る。この減算を、明モード開チャネルデータＶ^ＯＣ _＋と、明モード装填されたデータＶ^Ｔｉ _＋との両方に実行することによって、以下の規格化の代替形式がもたらされる。
この規格化値の代替形式は、任意のＶ_０に関する明示的な依存性を除去し、そのため、Ｖ_０は、規格化を実行するために、知られる必要がない。さらに、方程式（９）内の多様な用語は各々、通常の配列決定の工程中に測定され、そのため、追加の測定は、規格化の実行のために、必要とされない。加えて、所望される場合、最初の規格化値ｆ_ｉは、再定義された規格化値、以下の関係に基づくｆ_ｉ’から、計算され得る。
ｆ_ｉ＝ｆ_ｉ’（１−ｆ₋）＋ｆ₋ （１０）
ここでｉ＝Ａ、Ｃ、Ｇ、またはＴ、および

[0128]暗モード電圧を方程式（９）の分子および分母から除算することによって、Ｖ_０ドリフトの効果は、補償され得る。いくつかの実施形態では、Ｖ_０の分散に起因する、未処理の信号値の任意の分散は、追加の測定を実施する必要なしに、大きく低減され、またはそれどころか除去され、配列決定中に、Ｖ_０を明示的に追跡する。本明細書で用いられるように、方程式（９）の分子および分母は、それぞれ開チャネルおよび装填されたチャネルの、ゼロ点が補償された信号値として見なされる。

[0129]方程式（９）により表される再定義された規格化のゆえに、セクションＩＩＩ（Ｂ）への参照で後述する、２Ｄ変換手順も有益であり得ることに留意されたい。より具体的には、図１２Ａ〜１２Ｃで示した積分履歴を用いた回転補正の事例では、処理は、積分履歴の計算のための入力信号（ｘ軸）として、ゼロ点補償された明モードデータを、用いることによって、修正され得る。同様に、ｙ軸データのために、ゼロ点補償された明モードデータが、使用され得る。補償されたデータを用いることによって、明モードデータの変化するＶ_０に起因する任意の分散は、除去または最小化され得る。

[0130]図１０は、ある実施形態により、非ゼロおよび変化するＶ_０の効果を除去するために、配列決定信号を処理する方法１０００を説明するフローチャートを示す。いくつかの実施形態では、方法１０００は、図２のプロセッサ２２４、デジタルプロセッサ４３０、および／または配列決定セルの回路に接続された任意の制御論理によって、実行され得る。

[0131]ステップ１０１０では、複数の配列決定信号値Ｐ（ｔ_ｉ）が、配列決定セルから取得される。配列決定信号値は、ＡＤＣによって測定された電圧であり、デジタルプロセッサ、例えば図４に示すような、ＡＤＣ４１０およびデジタルプロセッサ４３０に送信され得る。デジタルプロセッサは、他の構成要素を含む、例えば、図２０を参照し、より詳細に後述するように、コンピュータシステムの一部であり得る。電圧は、１つまたは複数の明期間であって、その明期間自体が１つまたは複数の別のＡＣサイクルにわたる、明期間にわたって測定された電圧に対応し得て、すなわち、全ての測定データは、単一のＡＣサイクル内の同一の明期間からであることが必要とされない。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。いくつかの事例では、取得される電圧は、時間に対するセルのゼロ点電圧の不均一性により、ポイントからポイントで（同一のナノポアの状態であっても）変化し得る。印加電圧は、交流信号、例えば、参照電圧に対して、第１の部分（例えば、本明細書で「明モード」とも呼ぶ明期間）および第２の部分（例えば、本明細書で「暗モード」とも呼ぶ暗期間）を有するＡＣ信号であり得る。ある実施形態によれば、参照電圧は、積分コンデンサ、例えば、図４に示すようなｎｃａｐに印加される参照電圧（図４のＶＰＲＥ４０５）であり得る。

[0132]ステップ１０２０では、１つまたは複数の信号値の第１のセットが決定され、例えば、交流信号の明期間中に測定された１つまたは複数の電圧が、デジタルプロセッサ４３０によって選択される。電圧の第１のセットは、多様な明期間に対応し得る。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。さらに、１つまたは複数の信号値の第１のセットは、方程式（６）〜（９）を参照し上述したように、多様な明モードの装填されたチャネル信号値Ｖ^Ｔｉ _＋に対応し得る。

[0133]ステップ１０３０では、１つまたは複数の信号値の第２のセットが決定され、例えば、交流信号の明期間中に測定された１つまたは複数の電圧が、デジタルプロセッサ４３０によって選択される。電圧の第１のセットは、多様な明期間に対応し得る。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。さらに、１つまたは複数の信号値の第２のセットは、方程式（６）〜（９）を参照し上述したように、多様な明モード開経路信号値Ｖ^ＯＣ _＋に対応し得る。

[0134]ステップ１０４０では、交流信号の第２の部分中に測定された１つまたは複数の信号値の第３のセットが決定され、例えば、交流信号の暗期間中に測定された１つまたは複数の電圧が、デジタルプロセッサ４３０によって選択され得る。１つまたは複数の電圧の第３のセットは、多様な暗期間にまたがって測定され得て、方程式（６）〜（９）を参照し上述したように、暗モード電圧信号値Ｖ₋に対応することになる。

[0135]ステップ１０５０では、１つまたは複数の信号値の第３のセットの対応する値は、１つまたは複数の信号値の第１のセットから減算され、それにより１つまたは複数のゼロ点が補償された信号値の第１のセットを生成する。例えば、方程式（９）の分子で示した減算は、デジタルプロセッサ４３０によって実行され得る。上記のように、方程式（９）への参照において、もたらされた補償された明モードの装填された信号値のセットは、減算処理が変動するゼロ点電圧の効果を、大いに低減するという事実により、低減された分散を有することになる。

[0136]ステップ１０６０では、１つまたは複数の信号値の第３のセットの対応する値は、１つまたは複数の信号値の第２のセットから減算され、それにより１つまたは複数のゼロ点が補償された信号値の第２のセットを生成する。例えば、方程式（９）の分母で示した減算は、デジタルプロセッサ４３０によって実行され得る。上記のように、方程式（９）への参照において、もたらされた補償された明モードの装填された信号値のセットは、減算処理が変動するゼロ点電圧の効果を、大いに低減するという事実により、低減された分散を有することになる。

[0137]明および暗モードのゼロ点が補償された信号値が決定された後、それらは次に、他の任意の下流の信号処理方法において使用され得る。例えば、開チャネル明モードのゼロ点が補償された信号値は、一連の明モードの装填された信号値を規格化するために、規格化因子として使用され得る。いくつかの実施形態では、明および／または暗モードの補償された信号値は、セクションＩＩＩ（Ｂ）で後述するように、オフセットシフトの効果を除去するために、２次元変換を用いて、さらに処理され得る。他の実施形態では、明モードの補償された信号値は、ヒストグラムを形成するために使用され得て、このヒストグラムは、セクションＩＩＩ（Ｃ）で後述するように、規格化因子に用いられることになる明モード開チャネル値の、改善された推定値を取得するために、使用され得る。同様に、上記の方法によって決定されるような、ゼロ点が補償された信号値は、図１９への参照でさらに詳細に後述するように、ゼロ点補正モジュール１９０３によって決定され、出力され得る。

Ｂ．２次元変換によるベースラインシフト除去
[0138]方程式（１）〜（５）を参照し上述したように、ポイント単位の規格化技術は、開経路信号および装填された信号のダイナミックスが同一の場合、ゲインドリフトおよびオフセットシフトの両方を、効果的に補正し得る。しかしながら、開チャネルおよび装填されたチャネル信号のダイナミックスは、同一であるとは限らない。装填された信号のゲインドリフトおよびベースラインシフトの両方を、より良好に補正するために、測定された２次元の配列決定信号を、２次元変換の方法によって、例えば、より詳細に後述するように、回転させるまたは平坦にすることによって、処理する方法が、利用され得る。

[0139]測定された明モードデータは、信号値Ｐ（ｔ_ｉ）の１次元のアレイによって表され得て、ここで例えば、アレイ内の各ポイントは、時間ｔ_ｉで取得された明モード信号値である。そのような１次元データの一例が、図９で示してあり、それは約３．５秒の期間にわたって取得された明モードデータを示す。理想的には、１次元アレイＰ（ｔ_ｉ）の値は、ナノポアの状態にのみに依存し得て、そのため時間に対して安定であり得る。実際の任意の信号では、所与のポア状態に対応する所与の信号値は、時間で変化し得て、そのため、異なるナノポアの状態（開チャネル、および４つの装填された状態）に対応する信号値の母集団は、各々がある平均値を有する、有限幅の分布によって、最も正確に記述される。つまり、いくつかの期間にわたって取得された信号値のヒストグラムは、有限幅の５つのピークを有することになり、ここで各ヒストグラムのピークの幅は、異なるナノポア状態に対応する、信号値の分散に依存する。図１１のヒストグラム１１０３および１１０５は、そのような例を示す。より具体的には、ヒストグラム１１０５は、開チャネルピーク１１０５ａ、ならびに装填されたチャネルピーク１１０５ｂ、１１０５ｃ、および１１０５ｄを示す。

[0140]所与のポア状態（例えば、「Ａ」タグの装填された状態に対応するポア状態）の装填されたチャネル値に大きな分散を有することは、そのことがその装填されたタグの識別を複雑にするので、理想的でない（ここで再び、理想的には、単一の装填された状態は、時間に対して単一の安定した信号値を有する）。１つまたは複数の装填された状態の信号値の分散が、十分に大きい場合、２つの異なる装填された状態の信号値分布は、重なり合い、配列決定信号内でのそれらの識別を、困難で誤差が発生しやすくする。

[0141]ある実施形態によれば、１次元データＰ（ｔ_ｉ）の分散は、１次元データＰ（ｔ_ｉ）の分散が、データ収集期間中にドリフトまたは変化する、ある他の制御されない変数の不均一性に起因し得ることを、認識することによって、補償され、最小化され得る。例えば、特定のＰ（ｔ_ｉ）値は、本明細書でＱ（ｔ_ｉ）と呼ぶ、やはりある時間ｔ_ｉでのセル内の電荷不均衡の量に、依存し得る。Ｐ（ｔ_ｉ）の分散を補償する一方法は、時間ｔ_ｉ毎に、電荷不均衡Ｑ（ｔ_ｉ）をやはり測定し、次にこの２次元のデータを、Ｐ（ｔ_ｉ）の分散を除去するために、ある種類の２次元変換を用いて処理する。より一般には、Ｐ（ｔ_ｉ）の各測定値は、本明細書で相関信号値と呼ぶ、別の量Ｘ（ｔ_ｉ）の測定値と対合され、２次元の信号データポイントＳ_２Ｄ＝［Ｘ（ｔ_ｉ），Ｐ（ｔ_ｉ）］を生成し得る。以下の説明が２次元の信号データの一例に着目する一方で、数学的表現は、本開示の範囲から逸脱することなく、２つより多くの次元に拡張され得る。

[0142]この新しい２次元のデータセットＳ_２Ｄは、Ｐ（ｔ_ｉ）の分散の大きさを最小化する、１つまたは複数の２次元変換Ｒ_２Ｄを見出すために、使用され得る。一般に、２次元変換Ｒ_２Ｄは、以下のような２×２の行列として表現され得る。
Ｓ_２Ｄは、列ベクトルとして表現され得て、したがって、変換された信号値Ｓ’_２Ｄは、下のように記述される。
Ｓ’_２Ｄ＝Ｒ_２ＤＳ_２Ｄ（１２）
Ｘ’（ｔ_ｉ）＝αＸ（ｔ_ｉ）＋βＰ（ｔ_ｉ）（１４）
Ｐ’（ｔ_ｉ）＝γＸ（ｔ_ｉ）＋δＰ（ｔ_ｉ）（１５）

[0143]ある実施形態によれば、相関信号値Ｘ（ｔ_ｉ）は、明モード信号値Ｐ（ｔ_ｉ）の分散に寄与する現象を、直接測定するまたはその代替となる、任意のものであるように、選択され得る。例えば、上述したように、オフセットシフトは、各々の測定された明モードポイントがわずかに異なるオフセットシフトを有し得るので、測定されたＰ（ｔ_ｉ）値の分散源であり得る。さらに、オフセットシフトは、セルの１つまたは複数の容量性の構成要素における電荷不均衡によって発生し得る。したがって、この例での分散を除去するために、相関信号値Ｘ（ｔ_ｉ）は、電荷不均衡の測定値自体または電荷不均衡の代替であるように、選択されるべきであり、すなわちＸ（ｔ_ｉ）は、電荷不均衡に対して線形に変化するべきである。以下の２つの例では、相関信号値Ｘ（ｔ_ｉ）は、１）対応する暗モード信号値、または２）本明細書で明モード信号値の積分履歴と呼ぶもの、のいずれかであるように選択される。相関信号値のこれらの例の両方が、電荷不均衡の代替であり、例えば、電荷不均衡と線形に相関し得て、そのため明モード信号データのオフセットドリフトを補正するために、使用され得る。本開示の利益を有する当業者には理解されるように、相関信号値には、他の多くの選択が可能である。

[0144]いくつかの実施形態では、それらが変換された後に、１つまたは複数のデータのクラスタのアスペクト比を保存しない、２Ｄ変換を利用することは、有益であり得る。例えば、そのような２Ｄ変換は、変換行列によって与えられる。
そのような変換は、それが、やはり本明細書で「変換パラメータ」と呼ぶ、単一の変換パラメータρ_ｉのみを含む、という事実により、データを決定することおよび適用することの両方への、計算の負担が少ないので、有益であり得る。いくつかの実施形態では、方程式（１６）で示した変換は、より詳細に後述するように、できる限り異なるρ_ｉを異なるクラスタに適用させながら、２Ｄ面内の信号値の異なるクラスタに単独で適用され得る。例えば、明モード開チャネルデータのクラスタ（例えば、図１２Ａのクラスタ１２０１）にのみ適用されることになる、変換パラメータは、ρ_ＯＣと呼び、明モードの装填されたチャネルデータのクラスタ（例えば、クラスタ１２０３、１２０５、１２０７、および１２０９）のグループにのみ適用されることになる、変換パラメータは、ρ_Ｔｈと呼ぶ。各々の事例で、低減された変換は、信号データの２つの次元間の線形混合をもたらす。例えば、明モード開チャネルデータＰ_ＯＣ（ｔ_ｉ）を変換する事例には、変換された開チャネルデータＰ’_ＯＣ（ｔ_ｉ）が、以下の方程式によって与えられる。
Ｐ’_ＯＣ（ｔ_ｉ）＝Ｐ_ＯＣ（ｔ_ｉ）＋Ｐ_ＯＣＸ（ｔ_ｉ）（１７）
したがって、変換された信号値は、それに付加された相関信号値からのある寄与を有する、未処理の開経路信号値である。相関信号値からの寄与は、変換パラメータρ_ＯＣの大きさによって決定される。

[0145]いくつかの実施形態によれば、変換パラメータρ_ＯＣは、変換された開チャネルデータＰ’_ＯＣ（ｔ_ｉ）の最も平坦なクラスタをもたらす、例えば、変換されたクラスタを通してフィッティングされたラインの傾きがゼロである、変換パラメータであるように決定される。

[0146]装填された信号値は、さらに同様に変換され得る。例えば、以下の変換が、適用され得る。
Ｐ’_Ｔｈ（ｔ_ｉ）＝Ｐ_Ｔｈ（ｔ_ｉ）＋ρ_ＴｈＸ（ｔ_ｉ）（１８）
変換パラメータρ_Ｔｈは、より詳細を後述するような、データのヒストグラム内の目下の装填されたピーク間の最大限の識別性を提供するように、選択され得る。

[0147]本明細書で開示される例示的な実施例では、２Ｄ変換の特定の形式は、測定データのヒストグラム内の異なるピーク間の識別性を最大化する、２Ｄ変換を見出すことによって、決定され得る。ヒストグラムは、一定の値域内に含まれる、信号値の数をカウントすることによって測定された、信号値の時系列データから、計算され得て、ここで値域は、（電圧またはＡＤＣカウントのいずれかとして測定される）信号値のダイナミックレンジに及ぶ。図１１は、未処理データを用いて計算され、その結果、不十分なピーク間の識別性を有する、ヒストグラム１１０３を示し、例えば、ピーク１１０５ｄは、理想的には２つの個別のピークであるべきときに、１つの不鮮明にされたピークとして見られる。対照的に、図１６Ｂは、２Ｄ変換を用いて予め変換された、データを用いて計算され、ヒストグラム１１０３のピークより識別可能なピークを有する、ヒストグラム１６０５を示す。

[0148]いくつかの実施形態では、最適な２Ｄ変換は、ヒストグラムの特性を最適化することによって、計算され、後続の配列決定の工程に用いられるために、メモリに記憶され得て、かつ／または定期的に更新され得る。例えば、最適な２Ｄ変換は、ヒストグラム化されたデータ内のピーク（またはピークの部分セット）間の最小値を、最小化する２Ｄ変換に決定され得る。別の例では、最適な２Ｄ変換は、ヒストグラムのピーク（またはピークの部分セット）間の距離を、最大化する２Ｄ変換に決定され得る。いくつかの実施形態では、ヒストグラムは、混合モデル、例えばガウスのまたはラプラスの混合モデル、を用いてモデル化され得て、モデルの多様なパラメータ、例えばピーク位置、最小値などが、最良の２Ｄ変換を決定する最適化関数のパラメータとして、使用され得る。

[0149]いくつかの実施形態では、最適な２Ｄ変換は、２Ｄ面内の最も平坦な、クラスタのセットまたはクラスタの部分セットを、もたらす変換であり得る。そのような変換は、２Ｄデータのクラスタが、水平のラインを用いて分割されるとき（すなわちｘ次元で一定であるしきい値を用いて）、クラスタ混合を最小化する、２Ｄ変換を決定することによって、見出され得る。

[0150]簡潔性のために、本明細書で論じる例示の実施例は、信号取得時間が、明モード信号値および相関信号値の両方で、同一であることとする。しかしながら、このことは、他の実施形態において正である必要はなく、明モードおよび相関信号値は、ある時間に測定された明モード値と、他のある時間に作成された相関信号値との間に、いくらかの関連がもたらされ得る限り、異なる時間に取得され得る。

１．暗−明面内での２Ｄ変換
[0151]ある実施形態によれば、暗モード信号データは、測定された明モード信号値Ｐ（ｔ_ｉ）毎に、対応する値を有する、相関信号値Ｘ（ｔ_ｉ）であるように選択される。この例では、暗モード信号はまた、未処理の配列決定信号のベースラインシフトを誘起する、電荷不均衡の代替として、使用される。したがって、暗モード信号値は、２次元の配列決定信号Ｓ_２Ｄを生成するために、測定され、各々の明チャネル信号値と対合され得て、それは次に、明モード信号Ｐ（ｔ_ｉ）の分散を最小化する、２次元変換Ｒ_２Ｄを見出すために、使用され得る。

[0152]図９に短時間だけ戻ると、挿入図から、明および暗チャネルデータの両方が、ベースラインシフト現象に悪影響を受けることが、見ることができる。さらに、明モードデータ９１０および暗モードデータ９２０のベースラインシフトが、相関関係にあることが、見ることができる。ある実施形態によれば、明モードデータのオフセットシフトを補正する、改善された方法は、この相関を強化し得る。例えば、２次元の配列決定信号Ｓ_２Ｄ＝［Ｘ（ｔ_ｉ），Ｐ（ｔ_ｉ）］が、取得され得て、この事例では、相関信号値Ｘ（ｔ_ｉ）は、取得された暗モード信号値に対応する。この２次元の配列決定信号は次に、２次元の配列決定信号に適用されたとき、明モード信号データＰ（ｔ_ｉ）の分散を低減する、２次元変換Ｒ_２Ｄを識別するために、使用され得る。簡潔性のために、この変換は、本明細書では、暗−明面内の「回転」と呼ぶこととするが、一般に、任意の２次元変換（回転のみでない）が、本開示の範囲から逸脱することなく、利用され得る。さらに、本開示の利益を有する当業者には理解されるように、データクラスタの回転、または座標系の回転は、等価であり、そのため、どちらの方法も、本開示の範囲から逸脱することなく、利用され得る。

[0153]図１２Ａ〜１２Ｃは、ある実施形態による、暗−明面内の回転によるオフセットシフト補正を示す。図１２Ａは、方法の開始点を説明するために、暗−明面内の、２次元の配列決定信号Ｓ_２Ｄ＝［Ｘ（ｔ_ｉ）Ｐ（ｔ_ｉ）］のプロットの一例を示す。より具体的には、任意のポイントのｘ座標は、時間ｔ_ｉに測定された、暗モード値Ｘ（ｔ_ｉ）によって与えられ、ｙ座標は、対応する明モード値Ｐ（ｔ_ｉ）である。ある実施形態によれば、Ｓ_２Ｄを構成する、明および暗ポイントのそれぞれの測定時間は、同一である、または同時である必要はなく、むしろ、本開示の範囲から逸脱することなく、異なる時間であり得る。いくつかの実施形態では、明モード信号値は、時間に基づいて、暗モード信号値と対合され、例えば、明モード期間で最初に取得された明モードポイントは、次の暗モード期間で最初に取得された暗モードポイントと対合され、または、例えば、明モード信号値は、明モード信号値が取得された、明期間の直前もしくは直後である、暗モード値と対合され、その結果、明および暗モード信号値間の持続時間は、可能な限り短くなる。他の例では、平均暗モード値が、１つまたは複数の明モード値と対合される。本開示の利益を有する当業者には理解され得るように、相関信号値には、他の多くの組合せが可能である。

[0154]図１２Ａで分かるように、暗−明面内でのデータのプロットは、多様なデータポイントＳ_２Ｄが、開チャネル測定値と、それぞれＣ、Ａ、Ｔ、およびＧの塩基に対応する、４つの異なるタグの装填された値とを表す、自然のクラスタ１２０１、１２０３、１２０５、１２０７、および１２０９を形成することを示している。これらのクラスタは、通常、その長軸が左へ上向きである、すなわち暗モード軸に対して水平でない、形状で、細長い。したがって、前処理されたデータは、Ｐ（ｔ_ｉ）のデータの分散の大きさ（すなわち、垂直方向の大きさ）を最小化するために、最適化されない。事実上、データクラスタの自然の形状は、Ｐ（ｔ_ｉ）の分散の大きさを最小化するように、各々の個別のクラスタを回転および／または平坦化し得る、２次元変換Ｒ_２Ｄが存在する、という事実を示唆する。

[0155]暗−明面内でデータが変換される前に、データは、信号のダイナミックレンジを、１つまたは複数の方向で、圧縮または拡張するために、増減することによって前処理され得る。例えば、図１２Ｂは、これらの値を１／５乗することによって、増減されたｙ軸値、すなわち
を有する、最初の信号を示す。この例では、データの最初のｙ方向範囲は、（およそ）０．５から２．５にわたり、増減変換後、ｙ方向範囲は、（およそ）０．７から１．４の範囲に圧縮されている。本開示の利益を有する当業者には理解されるように、この増減を行うステップは、任意選択であり、また、任意の増減関数（ｘまたはｙ次元のどちらかでの）の形式が、本開示の範囲から逸脱することなく、適用され得る。

[0156]図１２Ｃは、Ｒ_２Ｄが２次元のデータに適用された後に、もたらされたデータを示す。この例では、２Ｄ変換Ｒ_２Ｄは、各未処理データポイントのｘ座標を変化させずに、ｙ座標を新しい位置にマッピングしている。
別法として、２Ｄ変換は、行列の乗算によって表現され得る。
ここで、この事例では、図１２Ａ〜１２Ｃを参照してすでに上述したように、ｘ成分は、暗モード値によって与えられ、ｙ成分は、明モード値によって与えられる。

[0157]上述した例では、同一の変換Ｒ_２Ｄが、全てのデータポイントに、それがどのクラスタに属するかに関わらず、適用される。ある実施形態によれば、別個の変換が、各データポイントに、データポイントが属するクラスタに基づいて、適用され得る。例えば、開チャネルデータクラスタは、１つの変換を用いて、平坦化／回転され得て、装填されたＣクラスタは、別の変換によって平坦化／回転され得る。いくつかの実施形態では、開チャネルクラスタは、１つの変換を用いて、変換され得て、一方、装填された値を表す４つのクラスタは、異なる変換を用いて、変換され得る。同様に、暗モードデータを用いる適用には、暗モードデータクラスタが、明モード開チャネルおよび装填された値に用いられる変換とは異なる、第３の変換を用いて、変換され得る。一般に、２Ｄ変換Ｒ_２Ｄへの高精度なエントリは、例えば、変換されるデータへの線形フィッティングが傾きをもたないように、変換を最適化することによって、または、例えば、装填されたレベル間の離隔距離を最大化する変換を見出すことによって、数値的に決定され得る。

２．積分履歴−明モード面における２Ｄ変換
[0158]上述したような、暗モード信号値を用いるよりも、ある実施形態によれば、明モードデータの移動平均の形式、本明細書で明モードデータの「積分履歴」と呼ぶものが、相関信号値Ｘ（ｔ_ｉ）に選択される。この例では、積分履歴信号はまた、未処理の配列決定信号のベースラインシフトを誘起する、電荷不均衡の代替として、使用される。したがって、積分履歴信号値は、２次元の配列決定信号Ｓ_２Ｄを生成するために、測定され、各々の明チャネル信号値と対合され得て、それは次に、明モード信号Ｐ（ｔ_ｉ）の分散を最小化する、２次元変換Ｒ_２Ｄを見出すために、使用され得る。

[0159]積分履歴は、単一の積分履歴値を計算するために、ある時間ウィンドウにわたる履歴の、明モードデータを合計する（すなわち、積分する）ことによって、計算され得る。いくつかの実施態様では、積分履歴は、測定された明モードデータポイントＰ（ｔ_ｉ）が、新たに取得される毎に、移動基準で計算され得る。このことは、対応する更新された積分履歴値Ｈ（ｔ_ｉ）を、前の積分履歴Ｈ（ｔ_ｉ−１）の値を用いて計算する、漸化式（下の方程式（２２）で示すような）を用いて達成され得る。より古いデータポイントはまた、下の方程式（２２）でなされるように、時間と共に割り引かれ得て、例えば、履歴データが、データが増大する場合、経時度合と共に減少する、重み付け因子によりこのデータを増減することによって、値の経時度合と共に、効果的に指数関数的に割り引かれ得る。

[0160]他の実施態様では、積分に使用されることになる、各々の取得されたデータポイントの経時度合は、別々に記憶され、次に、積分が計算される前に、データポイント固有の重み付け因子を適用するために、使用され得る。例えば、指数関数的重み付け因子
は、各々の取得されたデータポイントに適用され得て、積分は次に、個別に重み付けされたポイントの全てを合計することによって、実行される。この例では、ｄｔは、取得期間（秒で測定された）、ｎは、データポイントの経時度合（データポイントが取得されてから経過した、取得期間の数）、Ｔは、履歴データの積分への寄与を、どれだけ早く格下げすることが所望されるかに基づいて、選択され得る、指数的減衰パラメータである。

[0161]漸化式によって計算された、積分履歴の例に戻ると、上述した時間重み付けされた積分履歴処理は、ソフトウェア、ハードウェア、またはそれらの任意の組合せによって、実装され得て、以下の漸化式の計算をもたらす。
Ｈ（ｔ_ｉ）＝（１−α）Ｈ（ｔ_ｉ−１）＋αＰ（ｔ_ｉ）（２２）
ここで、０＜α＜１であるαは、各積分履歴を計算するとき、目下のデータポイントに対して、履歴データをどれだけ重み付けするかをパラメータで表記する定数である。パラメータαは、減衰率と呼び、下で与えられる。
ここで、ｄｔは、取得時間のステップであり、Ｔは、セル内の作用電極のステップ応答に関連付けられる、測定された時定数であり、ａは、アルゴリズムが、履歴データを「忘却する」ために要する、時間を増大または減少させるために設定され得る、「メモリ速度」パラメータであり、すなわちそれは、どれだけ速やかに履歴データを格下げするかを、設定し得る。方程式（２２）は、Ｈ（ｔ_ｉ）の公称値が入力の公称値に等しいという、有益な特性を有する。例えば、長い開チャネル期間、すなわち、充填事象を伴わない長期間中、積分履歴は、開チャネルレベルに等しい。

[0162]２Ｄデータポイントを形成するために、時間ｔ_ｉで測定された明モードデータポイントは、対応する積分履歴値Ｈ（ｔ_ｉ）に関連付けられ、これらの２つのポイントは、図１２Ａ〜１２Ｃを参照し上述した処理と同様に、２次元データとして処理されるために、２次元の配列決定信号Ｓ_２Ｄ＝［Ｈ（ｔ_ｉ），Ｐ（ｔ_ｉ）］を形成し得る。例えば、変換されたデータは、以下の方程式を用いて、計算され得る。
ここで、指標ｋは、変換されている異なるクラスタ、例えば、開チャネルまたは装填されたチャネルクラスタにわたって通される。例えば、変換パラメータρ_ＯＣ＝０．０１を有する、ある変換は、開チャネルデータクラスタを平坦化するために、適用され得て、変換パラメータρ_Ｔｈ＝０．０２を有する、別の変換は、装填されたデータクラスタを平坦化するために、適用され得る。

[0163]例えば、装填された値の事例には、変換された信号値が、以下の方程式によって計算され得る。
変換された装填された信号値Ｐ’_Ｔｈ（ｔ_ｉ）は次に、以下の方程式により、規格化され得る。
ここで、Ｐ’_Ｔｈ（ｔ_ｉ）のＰ’_ＯＣ（ｔ_ｉ）による除算に加えて、数学的処理が、規格化されるレベルＮ_ＴＨ（ｔ_ｉ）を０から１の範囲内に維持するために、かつさらに、ρ_Ｔｈの全ての値に対して装填されたタグ断片を一定にするために、付加されている。したがって、ρ_Ｔｈが小さい場合、方程式（２６）は、上の方程式（５）で定義した通常の規格化、すなわち
に、縮小する。

[0164]いくつかの実施形態では、暗モードデータはまた、このデータを平坦化し、ベースラインシフトの効果を除去するために、２つの次元変換を通して変換され得る。例えば、未処理の暗モードデータＤ（ｔ_ｉ）は、以下の方程式により、変換され得る。
ここで、Ｄ（ｔ_ｉ）は、暗モード信号値、ρ_Ｎは、暗モードデータクラスタを平坦化／回転させるために決定される、変換パラメータであり、Ｈ（ｔ_ｉ）は、やはり明モード信号の積分履歴である。いくつかの実施形態では、変換された暗モードデータＤ’（ｔ_ｉ）は、セクションＩＩＩ（Ａ）への参照で上述したように、任意選択のゼロ点補正に使用され得る。その事例では、負のチャネルから正のチャネルへのノイズ伝播を最小化するために、平坦化された負のチャネルデータは、それが使用される前に、指数関数的フィルタを通して、フィルタリングされ得る。いくつかの実施形態では、暗モードレベルは、セクションＩＩＩ（Ｃ）への参照で後述するように、明モード開チャネル値と同様に、進行するヒストグラムを用いて、追跡され得る。

[0165]図１３Ａ〜１３Ｂは、ある実施形態による、積分された履歴値および明値によって定義された２Ｄ面内の変換による、オフセットシフト補正方法を示すプロットを示す。この２次元空間にプロットされた、適切な明モード信号、例えば、ＯＣ、Ａ、Ｃ、Ｇ、およびＴは、それぞれデータポイント１３０３、１３０５、１３０７、１３０９、および１３１１の５つの別個のクラスタとして、明確に際立たせている。図１２Ａ〜１２Ｃへの参照で上述したクラスタと同様に、それらは、横軸（積分履歴の軸）に対して傾斜している。

[0166]ある実施形態によれば、図１３Ａ〜１３Ｂで示した２Ｄデータの処理は、図１２Ａ〜１２Ｃへの参照で上述したものに類似した仕方で実行され、詳細は、簡潔のためここでは繰り返さないこととする。図１２Ｃと同様に、図１３Ｂは、未処理のデータと比較して改善された、多様なレベル間に離隔距離を有する、「回転された」または「平坦化された」データを示す。

３．２Ｄ変換方法の例示的なフローチャート
[0167]図１４は、ある実施形態により、配列決定セルを用いる方法１４００を示すフローチャートである。より具体的には、図１４は、配列決定信号データを補正するために使用され得る、２次元変換を決定する方法を説明する。いくつかの実施形態では、方法１４００は、図２のプロセッサ２２４、デジタルプロセッサ４３０、および／または配列決定セルの回路に接続された任意の制御論理回路によって、実行され得る。

[0168]ステップ１４０１では、電圧が、核酸を含む配列決定セル間に印加され得る。印加電圧は、交流信号、例えば、参照電圧に対して、第１の部分（例えば、本明細書で「明モード」とも呼ぶ明期間）および第２の部分（例えば、本明細書で「暗モード」とも呼ぶ暗期間）を有するＡＣ信号であり得る。ある実施形態によれば、参照電圧は、積分コンデンサ、例えば、図４に示すようなｎ_ｃａｐに印加される参照電圧（例えば、図４のＶ_ＰＲＥ４０５）であり得る。

[0169]ステップ１４０３では、複数の配列決定信号値Ｐ（ｔ_ｉ）が、配列決定セルから取得される。いくつかの実施形態によれば、配列決定信号値は、ＡＤＣによって測定された電圧であり、デジタルプロセッサ、例えば図４に示すような、ＡＤＣ４１０およびデジタルプロセッサ４３０に送信され得る。デジタルプロセッサは、他の構成要素を含む、例えば、図２０を参照し、より詳細に後述するように、コンピュータシステムの一部であり得る。電圧は、１つまたは複数の明期間であって、その明期間自体が１つまたは複数の別のＡＣサイクルにわたる、明期間にわたって測定された電圧に対応し得て、すなわち、全ての測定データは、単一のＡＣサイクル内の同一の明期間からであることが必要とされない。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。いくつかの事例では、取得される電圧は、セルのオフセットシフトの不均一性により、ポイントからポイントで（同一のナノポアの状態であっても）変化し得る。したがって、母集団として見なされる、取得された電圧のセットは、少なくとも部分的に、オフセットシフトの不均一性による、いくらかの不均一性（分散として定量化される）を有することになる。

[0170]ステップ１４０４では、対応する相関信号値Ｘ（ｔ_ｉ）のセットが、例えば、デジタルプロセッサによって、決定される。セクションＩＩＩ（Ｂ）（１）〜（２）で上述したように、相関信号値は、いくつかの異なる方法によって、例えば、対応する暗モード値をとることによって、または対応する積分履歴値（積分された履歴）を計算することによって、決定され得る。いずれの事例でも、最初の１次元の測定された信号値Ｐ（ｔ_ｉ）のデータは、２次元のデータポイントＳ_２Ｄ＝［Ｘ（ｔ_ｉ），Ｐ（ｔ_ｉ）］へと拡張され、ここで、時間ｔ_ｉで測定された各信号値Ｐ（ｔ_ｉ）は、対応する相関信号値Ｘ（ｔ_ｉ）と対合される。

[0171]ステップ１４０５では、複数の測定された信号値の不均一性を低減する２次元変換が、デジタルプロセッサによって決定される。いくつかの実施形態では、２次元変換は、それが２次元のデータポイントのセットに適用されるとき、それがセルの電圧オフセットシフトの分散を補償するように、決定される。より具体的には、値［Ｘ（ｔ_ｉ），Ｐ（ｔ_ｉ）］によって定義される、２次元空間内に表現され得る、２次元データには、変換は、Ｐ（ｔ_ｉ）の大きさ、すなわち、最初に測定された明モード信号値Ｐ（ｔ_ｉ）によって定義される大きさの分散を最小化するために（すなわちデータを平坦化するために）選択される。いくつかの実施形態では、２次元変換は、上述の方程式（１１）および／または（１６）の形式をとり得る。

[0172]図１２〜１３を参照し上述したように、データＳ_２Ｄは、自然にデータクラスタ、例えば、ナノポアの開チャネル状態およびナノポアの４つの装填された状態に対応する、５つのデータクラスタを形成し得る。いくつかの実施形態では、全てのクラスタを同じ方法で変換する、例えば、全てのクラスタをある角度φで回転させる、単一の２次元変換が選択される。そのような事例では、変換は、１つのクラスタだけの分散を最小化するために、２つ以上のクラスタの分散を同時に最小化するために、またはセクションＩＩＩ（Ｂ）で上述したように、クラスタ間の離隔距離を最大化するために、選択され得る。他の実施形態では、２つ以上の変換が、利用され得て、例えば、５つのデータクラスタを別々に変換し、各クラスタの分散を個別に最小化する、５つの異なる変換が見出され得る。

[0173]ステップ１４０７では、２次元変換は、メモリ内に、例えば、配列決定信号データを、それが取得されたときに、変換するようにプログラミングされている、デジタルプロセッサおよび／またはコンピュータシステムによって、アクセス可能なメモリ内に、記憶されている。

[0174]２次元変換が、決定され、メモリ内に記憶された後、それは、配列決定信号データを処理し、信号値のベースラインシフトの効果を低減または最小化するために、使用され得る。例えば、各々の新しい処理されたデータポイントは、データポイントが属するクラスタにより、方程式（２４）、（２５）、または（２６）を用いて、測定された信号データから計算され得る。

[0175]図１５は、新しいデータポイントが取得されたとき、２次元変換を、ポイント単位基準で、配列決定信号データに適用することによって、ベースラインシフト除去を提供し得る、取得および変換のループを、説明している。いくつかの実施形態では、方法１５００は、図２のプロセッサ２２４、デジタルプロセッサ４３０、および／または配列決定セルの回路に接続された任意の制御論理回路によって、実行され得る。

[0176]ステップ１５０１では、電圧が、図１４のステップ１４０１への参照で上述したものと同様の仕方で、配列決定セル間に印加される。

[0177]ステップ１５０３では、配列決定セルからの１つまたは複数の信号値が、交流信号の先頭の部分の間に、取得される。このステップは、やはり、図１４のステップ１４０３への参照で上述したものと同様である。

[0178]ステップ１５０５では、１つまたは複数の相関信号値が、図１４のステップ１４０５への参照で上述したものと同様の仕方で、取得される。

[0179]ステップ１５０７では、１つまたは複数の変換された信号値が、２次元変換を２次元のデータポイントに適用することによって、計算される。例えば、セクションＩＩＩで上述したように、２次元変換Ｒ_２Ｄは、２次元のデータポイントＳ_２Ｄ＝［Ｘ（ｔ_ｉ），Ｐ（ｔ_ｉ）］に適用され得る。ある実施形態によれば、Ｒ_２Ｄは、２×２の行列として表現され得て、変換を適用することは、行列の乗算Ｒ_２ＤＳ_２Ｄを実行することを含み得る。Ｒ_２Ｄの成分は、例えば、図１４への参照で上述した方法により、予め決定され、メモリによってアクセス可能であり得る。

[0180]ある実施形態によれば、同一の変換Ｒ_２Ｄが、全ての２次元のデータポイントに適用され得る、または異なる変換が、データポイントの異なる階級もしくはクラスタに適用され得る。例えば、データポイントが、おそらく開チャネルデータポイントである（すなわち開チャネルデータポイントのクラスタに属する）と決定された場合、開チャネル特定の変換が、そのデータポイントに適用され得る。同様に、データポイントが、おそらく装填されたデータポイントである（すなわち装填されたタグデータポイントの１つまたは４つのクラスタに属する）と決定された場合、次に、装填された状態特定の変換が、適用され得る。さらに、タグ特定の変換を、データポイントが、特定のタグの装填された状態に関連付けられる、決定に基づいて適用することもできる。ある実施形態によれば、処理されることになるデータポイントの特定の範疇が、データポイントの明モード値の未処理の値に基づいて、すなわち未処理のＰ（ｔ_ｉ）の値によって、推定され得る。例えば、１つまたは複数のしきい値が、予め定められ得て、データポイントの範疇は、値Ｐ（ｔ_ｉ）が、しきい値の上、下、または以内にあるかに基づいて、推定され得る。例えば、あるしきい値の上にあるＰ（ｔ_ｉ）値は、開チャネル値であると決定され得て、したがって、開チャネル特定の変換が、これらの値に適用され得る。いくつかの実施形態では、各々の新しい処理されたデータポイントは、データポイントが属するクラスタにより、方程式（２４）、（２５）、または（２６）を用いることによって、測定された信号データポイントから計算され得る。

[0181]ステップ１５０９では、取得および変換のループを継続するか、すなわち別のデータポイントを取得し、処理するか否かの、決定がなされる。この検討は、例えば、メモリおよび／または帯域の制限、あるいは例えば、システムがループ中に一定の数のデータポイントを取得し処理するように予めプログラミングされているか否か、を含む、多くの因子を考慮し得る。ここで示された例は、各データポイントが、ポイント単位基準で、２次元変換によって処理される事例を、説明するのに対し、変換は、本開示の範囲を逸脱することなく、データポイント群を取得した後に、適用され得る。

[0182]例えば、図１４〜１５への参照で、上述した方法は、電圧を表す信号値の取得および変換に関するものの、他の種類の信号が、可能であり、したがって、他の種類の信号値は、本開示の範囲を逸脱することなく、処理され得る。例えば、セルの回路は、信号値が、電圧、電流、または配列決定セルの回路内の任意のポイントでの電圧および／または電流を導出するために使用され得る、他の任意の量（例えば、時間）の測定値を表すように、構成され得る。

４．ポイント単位規格化と２Ｄ変換との比較
[0183]未処理の明モードデータ、例えば、図９で示した未処理の配列決定信号９１０は、各々の測定された明モードデータポイントを、対応する測定された（または推定された）明モード開チャネル値で除算する、ポイント単位の開チャネル規格化ルーチンを用いて、処理され得る。例えば、そのような規格化方法は、米国特許出願第１５／６３２，１９０で説明されているように、使用され得る。

[0184]図１１は、開チャネル値（利用可能な場合は測定された値、測定された値が利用可能でない場合は推定された値）を用いて測定された明モード信号を規格化する、ポイント単位の開チャネル規格化ルーチンのみを用いて規格化されたデータの一例である。開チャネル値１１０１は、非常に良好に規格化され、データは、全体的に平坦であり、１の値の周りに塊になっている。しかしながら、規格化された信号においても、装填された値（タグレベル）は、ヒストグラム１１０３および１１０５の装填された値のピーク間の低コントラストによって理解できるように、十分に識別されない。

[0185]理想的には、ヒストグラムは、各々がおよそゼロカウントである最小値によって分離される、ＯＣ、Ａ、Ｃ、Ｇ、およびＴの装填されたレベルの、５つの急峻に描かれるピークを有するべきである。むしろ、その代わりにヒストグラムは、簡単に区別可能な４つのピーク、例えば、ピーク１１０５ａ、１１０５ｂ、１１０５ｃ、および１１０５ｄのみを示している。さらに、装填されたタグレベルの２つは、最後のピーク１１０５ｄ内で一緒に不鮮明にされているように見える。そのようなタグレベル間の不十分な分離は、どの時間にどの塩基が配列決定されているかを、識別することを課せられている任意の処理に、深刻な困難をもたらし得る。

[0186]装填された信号レベル間に、改善された区別を提供するために、１つまたは複数の実施形態は、任意のポイント単位の規格化ルーチンを適用する前に、セクションＩＩＩ（Ｂ）（１）〜ＩＩＩ（Ｂ）（３）を参照して上述した、２Ｄ変換のうちの１つを用いて、配列決定信号を予備処理し得る。

[0187]図１６Ａおよび１６Ｂは、ポイント単位の規格化のみによって処理されたサンプルデータ（利便性のために、図１６Ａとして再現された図１１）と、積分履歴−明モード枠内での２次元変換、およびその後のポイント単位の規格化（下の枠）によって、処理されたサンプルデータとの、比較を示す。ヒストグラム１６０３および１６０５、ならびにそれぞれの挿入図によって示されるように、積分履歴を用いた２Ｄ変換によって予備処理がなされた信号（ヒストグラム１６０５で示した）は、異なる信号レベルの全てに、予備処理なしのポイント単位の規格化（ヒストグラム１６０３で示した）に対して、優れたコントラストを有する。ヒストグラム１６０３と比較して、ヒストグラム１６０５は、開チャネル１６０５ａ、および４つの装填されたチャネル１６０５ｂ、１６０５ｃ、１６０５ｄ、１６０５ｅに、より区別可能なピークを有する。したがって、２次元変換を利用する処理技術は、ポイント単位の規格化技術のみを使用することと比較して、より正確な配列決定を提供し得る。

Ｃ．移動ヒストグラムと共に開チャネル追跡を用いた規格化
[0188]明モード開チャネル電圧は、上のセクションＩＩＩ（Ａ）で簡単に説明され、米国特許出願第１５／６３２，１９０でより詳細に説明されているように、未処理の配列決定信号を規格化するために、追跡され、使用され得る。規格化に使用する、明モード開チャネル値を決定するための、１つの方法は、規格化されることになるデータポイントに時間的に最も近い、明モード開チャネルデータポイントを選択することである。いくつかの状況では、しかしながら、好適な明モード開チャネル値が、データ内に存在しない可能性がある。例えば、充填のダイナミックスに関する理由には、明モード取得期間を通して、開チャネルデータポイントは、存在するとしても、極めて少ない可能性がある。他の方法は、推定された明モード開チャネル値を計算するために、対応する暗モード値を使用し得るが、確実なシステムアーキテクチャに関しては、暗モードデータは、この計算に利用できない。例えば、あるアーキテクチャでは、チップの一定の領域のＡＤＣの全てが、一定の期間中に明モードデータのみを、取得することに占有され得る。ある実施形態によれば、他の方法が失敗する、または理想的でない結果をもたらす状況では、定期的に繰り返すヒストグラム方法が、明モード開チャネル値の推定値を追跡するために、利用され得る。

[0189]図１７は、図１６Ｂで示したものに類似した処理された配列決定信号データから計算され得る、一例の移動ヒストグラム１７０１を示す。ある実施形態によれば、ヒストグラム１７０１は、取得された明モードデータの母集団として計算され得る。例えば、取得実行（図１４で示したものなど）のウィンドウ（例えば、４秒以内）中に取得されたデータは、ヒストグラム１７０１のようなヒストグラムデータ構造へと組織化され得る。ヒストグラムを計算するために、値域幅は、ＡＤＣのダイナミックレンジに及ぶように選択され得て、例えば、ヒストグラムは、ＡＤＣ値の０から２５５に対応する、単位幅の２５６の値域を有し得る。新しいデータポイントが取得されるとき、取得されるＡＤＣ値にマッピングする、適切な値域のカウントが、時間と共に更新されるヒストグラムを維持するために、更新され得る。ヒストグラム１７０１のようなヒストグラムが計算された後、開チャネル電圧は、ヒストグラム内で最大の母数を有する値域、例えば、ピーク１７０３を特定することによって、識別され得る。

１．単一ポイント移動ヒストグラム
[0190]単一ポイント「移動」ヒストグラムを実現するために、システムは、１つまたは複数の新たに取得されたデータポイントを、１つまたは複数の規則により、履歴データに組み合わせることによって、時間と共にヒストグラムを更新するように構成され得る。例えば、ヒストグラムは、各ポイントの値域の全カウントへの寄与を、データポイントの経時度合に基づいて、指数関数的に格下げすることによって、より古いデータが、どの所与の値域にも、より少なく寄与する、定期的に繰り返す基準で、計算され得る。例えば、ヒストグラムのｉ番目の値域を表す値域Ｂ（ｉ）（例えば、ＡＤＣ値では１２７にあたる１２８番目の値域）を考え、この値域のカウントが１とし、すなわち、それが、１つ前に測定されたデータポイントを含むとする。さらに、この、前に測定されたデータポイントは、ＡＤＣの最新の取得期間中に取得されたとする。今度は、新たに取得されたデータポイントも、１２７のＡＤＣ値を含むとすると、そのためやはり、前のデータポイントと同一の値域に加算されなければならない。２つのデータポイントを、指数関数的に減少する格下げ規則に従って組み合わせるために、目下のデータポイントは、１カウントとしてカウントされ、前のデータポイントは、いくらかの１の断片として、カウントされ、ここで、断片は、格下げ係数を計算することによって決定され、次に履歴データのカウントを、格下げ係数に基づいて重み付ける。

[0191]いくつかの実施形態では、
などの指数関数的格下げ係数が、使用され得て、ここで、ｄｔは、取得期間（秒で測定された）、ｎは、データポイントの経時度合（データポイントが取得されてから経過した、取得期間の数）、Ｔは、履歴データの寄与を、どれだけ早く格下げするかに基づいて、選択され得る、指数的減衰パラメータである。この例では、簡単にするために、Ｔ＝ｄｔとする。履歴データポイントは、最新の取得サイクル中に取得されたので、ｎ＝１、したがってＡ＝ｅ^−１≒０．３７となる。したがって、新しい値域値は、１．３７（格下げが用いられない場合の２ではなく）であり得る。上述した単純な格下げ例は、関連付けられたタイムスタンプを伴う、任意の数のデータポイントを有する、任意の数の値域およびデータのセットに拡張され得る。ある実施形態によれば、移動ヒストグラム法での指数関数的格下げの時定数Ｔはさらに、ゲイン変化の時間尺度に関係する。

２．繰返し移動ヒストグラム
[0192]いくつかの実施形態では、移動ヒストグラム法は、以下の方法の通りに、ヒストグラムの値域の母数の値Ｂ_ｔ（ｉ）を更新することによって、実行される。まず、ヒストグラムは、ある所定の初期化期間ｔ_ｉｎｉｔにわたりデータを取得することによって、初期化される。次に、新しいデータポイントが取得されたとき、本明細書でアクティブヒストグラム値域ｋと呼ぶ、新しいデータポイントが属するヒストグラム値域は、どれかをまず決定する。次に、アクティブ値域の母集団Ｂが、以下の漸化式により、更新されることになる。
Ｂ_ｔ（ｋ）＝β＊Ｂ_ｔ−１（ｋ）＋（１−β）Ｎ_ｅ（２８）
非アクティブ値域、ｉ≠ｋであるｉを有する値域の母集団は、以下の漸化式により、格下げされることになる。
Ｂ_ｔ（ｉ≠ｋ）＝β＊Ｂ_ｔ−ｎ１（ｉ≠ｋ）（２９）
ここで、０＜β＜１であるβは、より古いヒストグラムデータの更新された母集団への寄与を、漸進的に格下げするためにはたらく、格下げ係数である。パラメータＮ_ｅは、本明細書でヒストグラム値域の有効数と呼び、ヒストグラム全体の母数を、配列決定実行の推移にわたり、おおよそ一定に維持するために選択される。より具体的には、方程式（２８）においてＮ_ｅによる増減なしでは、ヒストグラムの全体の母数は、ｉ≠ｋである値域の母数が方程式（２９）によって格下げされることになるので、時間と共に減少する可能性がある。したがって、Ｎ_ｅの値は、方程式（２９）の適用の結果、非アクティブ値域から除去され、おおよそ同等の母数を、アクティブ値域に加算することによって、この減少を相殺するために選択される。いくつかの実施形態では、値域Ｎ_ｅの有効数は、ゼロでない、例えばヒストグラムの全体の値域数の半数であり得る母数を有する、ヒストグラム内の値域数に、設定される。

[0193]指標ｎは、非アクティブのヒストグラム値域の更新レートを、データ収集から切り離すために、方程式（２９）に導入される。例えば、いくつかの実施形態では、ｎ＝１では、アクティブなヒストグラム値域および残りの値域の両方が、取得サイクル毎に更新される。同様に、ｎ＝２では、非アクティブ値域は、２サイクル毎にのみ更新される。非アクティブ値域を、ｎ回の取得サイクル毎にのみ更新することは、移動ヒストグラム法の全体の処理時間を、減少させ得る。

[0194]明モード開チャネル値を特定し追跡するための、上述した定期的に繰り返すヒストグラム方法のうちの１つを利用することは、これらの方法が、いずれの暗チャネルデータを必要とせず、そのため使用可能な暗チャネルデータを含まない、一定のシステムの高スループットモードで使用され得るので、他の方法よりロバストであり得る。さらに、方法は、移動ヒストグラムの形態で、履歴情報を保持するので、たとえ、例えば充填事象の高い速度により、最小限の開チャネルデータが利用可能または開チャネルデータが利用可能でなくても、方法は、開チャネルレベルを追跡するために、使用され得る。最後に、開チャネルデータを追跡し推定するための、定期的に繰り返すヒストグラム方法は、それが、開チャネル値がおそらく存在する範囲を定義するために、ハードコード化されたしきい値に依存しないので、カルマンフィルタ使用などの、他の方法に関する改善であり得る。むしろ、開チャネルは、ヒストグラム自体のデータに基づいて、例えば、ピーク探索ルーチンを使用して、探索され得る。開チャネル値が多くの場合、ヒストグラム内の最大のピーク、例えば最大振幅ピークとなり得るので、このことが、可能である。

[0195]いくつかの実施形態では、最大の母数を有するヒストグラム値域（例えば、ヒストグラム内の最大ピーク）は、開チャネル値として見なされ得る。実施形態はさらに、長い充填事象（滞在事象とも呼ぶ）中に装填されたレベルを追跡することを避けるために、最大ピークが許容された窓内にある場合のみ、最大ピークを受領する、窓関数法を利用し得る。いくつかの実施形態では、窓の幅は、ヒストグラム内の開チャネルピークのある断片、例えば、半値全幅（ＦＷＨＭ）の２．３倍に、動的に更新され得る。

[0196]新しい開チャネル値が窓外にある事例では、２次ピーク（例えば、２番目に大きい）が、古い開チャネルピークと、新しい最大ピークとの間で探索される。２次ピークが見出され、ピーク高さ要件を満たし、２次ピークが窓内にあるとき、新しいＯＣ値として受領される。２次ピークができる限り、開チャネルピークとして機能することを可能にすることによって、恒久的な開チャネルレベル飛び越しが、受容され得る。この２次ピーク探索はさらに、長い滞在事象中であっても、滞在中にやはり発生する、開チャネル事象がいくらか存在する限り、適正な開チャネル値が追跡されることを保証し得る。そのような２次ピーク追跡は、ＡＯＣ（開チャネルを超える）レベルを、開チャネル未満と同様に、調べる場合、開チャネルの故障率への対処に、改善を提供し得る。

[0197]いくつかの実施形態では、移動ヒストグラムへの入力データは、処理され、例えば、上述したように、２次元変換によって平坦化される。例えば、開チャネル値Ｐ_ＯＣ（ｔ_ｉ）は、積分履歴値Ｈ（ｔ_ｉ）と対合され得て、以下の方程式により、処理され得る。

[0198]開チャネル値が決定された後、その値は、タグレベルの値が時間的に一定であることを保証するために、他の信号値を規格化するために、使用され得る。例えば、移動ヒストグラム法によって、各装填された信号値を、開チャネル値の推定値で除算する規格化が、適用され得る。

３．移動ヒストグラム規格化法の例示的なフローチャート
[0199]図１８は、ある実施形態による、配列決定セルを用いる方法を示すフローチャートを示す。より具体的には、図１８は、セクションＩＩＩ（Ｃ）（１）〜（２）で上述したような、移動ヒストグラムを用いる配列決定信号値の、規格化の方法を説明する。いくつかの実施形態では、方法１８００は、図２のプロセッサ２２４、デジタルプロセッサ４３０、および／または配列決定セルの回路に接続された任意の制御論理回路によって、実行され得る。

[0200]ステップ１８１０では、複数の配列決定信号値Ｐ（ｔ_ｉ）が、配列決定セルから取得される。配列決定信号値は、ＡＤＣによって測定された電圧であり、デジタルプロセッサ、例えば図４に示すような、ＡＤＣ４１０およびデジタルプロセッサ４３０に送信され得る。デジタルプロセッサは、他の構成要素を含む、例えば、図２０を参照し、より詳細に後述するように、コンピュータシステムの一部であり得る。電圧は、１つまたは複数の明期間であって、その明期間自体が１つまたは複数の別のＡＣサイクルにわたる、明期間にわたって測定された電圧に対応し得て、すなわち、全ての測定データは、単一のＡＣサイクル内の同一の明期間からであることが必要とされない。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。いくつかの事例では、取得される電圧は、時間に対するセルのゼロ点電圧の不均一性により、ポイントからポイントで（同一のナノポアの状態であっても）変化し得る。印加電圧は、交流信号、例えば、参照電圧に対して、第１の部分（例えば、本明細書で「明モード」とも呼ぶ明期間）および第２の部分（例えば、本明細書で「暗モード」とも呼ぶ暗期間）を有するＡＣ信号であり得る。ある実施形態によれば、参照電圧は、積分コンデンサ、例えば、図４に示すようなｎｃａｐに印加される参照電圧（例えば、図４のＶＰＲＥ４０５）であり得る。

[0201]ステップ１８２０では、信号値の第１のセットが決定され、例えば、交流信号の明期間中に測定された１つまたは複数の電圧が、デジタルプロセッサ４３０によって選択される。電圧の第１のセットは、多様な明期間に対応し得る。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。さらに、１つまたは複数の信号値の第１のセットは、多様な明モードの装填されたチャネル信号値に対応し得る。

[0202]ステップ１８３０では、ヒストグラムが、例えば、セクションＩＩＩ（Ｃ）（１）〜（２）で上述したような、信号値の第１のセットから作成される。例えば、測定された信号のヒストグラム（または分布）は、測定された信号値を値域化すること、および、特定のＡＤＣカウントを有する特定の信号値が特定の値域内に低下する回数をカウントすることによって、計算され得る。

[0203]ステップ１８４０では、規格化因子が、ヒストグラム内のピークを識別することによって、決定される。ある実施形態によれば、ピーク値も、ピーク幅も、ステップ１８１０で測定された配列決定信号データを取得する以前に、知られている必要はない。例えば、ピーク検出ルーチンは、ピークの境界および特性を、例えばヒストグラム内の最大ピークを識別するために、検出し得る。他の実施形態では、２番目に大きいピークの信号値が、例えば上のセクションで説明したような、受容可能な（またはおそらく受容可能な）開経路信号値（開チャネル範囲）に対応する、信号値の所定の範囲内にあるとき、２番目に大きいピークは、選択され得る。いくつかの実施形態では、信号範囲の最端部にある、またはその近傍の値域は、縁部効果を避けるために、初期のピーク検出ルーチン中に、無視され得る。ピークを識別するための信号範囲は、他の配列決定の工程、セル、チップ、などからの実験データを通して、確立され得る。

[0204]ステップ１８５０では、信号値の第２のセットが、決定される。やはり、上と同様に、信号値の第２のセットは、多様な明期間に対応し得る。そのような測定は、本明細書で説明されるように発生し得て、所与のセルの核酸の異なる部分の配列決定の多様な回数で発生し得る。さらに、１つまたは複数の信号値の第２のセットは、多様な明モードの装填されたチャネル信号値に対応し得る。

[0205]ステップ１８６０では、信号値の第２のセット内の少なくとも１つの値が、少なくとも１つの規格化された信号値を取得するために、規格化因子を用いて、例えば、信号値の第２のセット内の少なくとも１つの値を、規格化因子で除算することによって、規格化される。複数の規格化された信号値が、取得され得る。

ＩＶ．規格化およびオフセット補正のシステムおよびデータフロー
[0206]図１９は、いくつかの実施形態による、規格化およびオフセット補正の一例のシステムを示す。より具体的には、図１９は、上述のデータ処理技術の各々を組み合わせて利用するシステムの、データフローおよび論理図の一例を示し、すなわち図１９のシステムは、ゼロ点補正、２次元変換によるベースラインシフト除去、および移動ヒストグラムを用いた規格化を、利用する。図１９で表したモジュールは、ナノポア配列決定システム内に、例えば、ナノポア配列決定システムの、１つまたは複数のコンピュータシステムおよびデジタルプロセッサの内部に、ハードウェアのみで、ソフトウェアのみで、またはハードウェアとソフトウェアとの組合せで、組み込まれ得て、例えば、論理は、１つまたは複数の、図１のナノチップワークステーション、図２のプロセッサ２２４およびメモリ２２６、および図４のデジタルプロセッサ４３０の内部に実装され得る。さらに、図１９で示したモジュールの各々は、各モジュールが、１つまたは複数のコンピュータのメモリに記憶されたデータにアクセスすることも、１つまたは複数のコンピュータのメモリにデータを保存することも両方できるように、１つまたは複数のコンピュータのメモリ（図示せず）に、動作可能に接続され得る。さらに、モジュールの各々のモジュールまたは集合は、コンピュータシステム、例えば図２０で示したコンピュータシステムの、１つまたは複数のプロセッサによって、実行され得る、コンピュータ読み取り可能な命令またはプログラムコードの形態をとり得る。

Ａ．ゼロ点電圧Ｖ_０の補正
[0207]１つまたは複数の未処理の配列決定信号値（本明細書で「データポイント」とも呼ぶ）は、入力１９０１で、ＡＤＣから受け取られる。例えば、図５への参照で上述したような、印加されるＡＣ信号の明モードおよび／または暗モード中に測定される、１つまたは複数の電圧が、受け取られ得る。図１９で示した本実施形態では、取得された配列決定信号値は最初に、ゼロ点補正モジュール１９０３で、処理される。いくつかの実施形態では、ゼロ点補正モジュール１９０３は、特定のＶ_０値を知る必要のない、ゼロ点補正方式を利用し得て、例えば、図１０へ参照し、セクションＩＩＩ（Ｃ）で上述したような、変化するゼロ点電圧Ｖ_０の任意の効果を除去するために、対応する暗モード信号値を、明モード信号値から減算し得る。別法として、ゼロ点補正モジュール１９０３は、メモリに記憶しておいた、Ｖ_０として予め測定された値を減算し得る。

[0208]ゼロ点補正されたデータは次に、２つの分離した処理フロー、装填された値の処理フロー１９０２および規格化因子計算フロー１９０４に、渡される。ある実施形態によれば、装填された値の処理フロー１９０２は、オフセットシフトのこれらの値を補正するために、２次元変換を装填された値に適用することによって、装填された値を処理する。ある実施形態によれば、規格化因子計算フロー１９０４は、移動ヒストグラム法を用いて、規格化因子（ゲインドリフトの装填された値を補正するために使用されることになる）を計算する。

Ｂ．装填された信号の２次元変換
[0209]まず装填された値の処理フロー１９０２を注目すると、データはまず、次元付加モジュール１９０５で、処理される。次元付加モジュール１９０５は二番目に、取得された明モード信号値毎に、相関関係にあるデータポイントを計算し得る。例えば、次元付加モジュール１９０５は、図１３Ａ〜１３Ｃへの参照で上述したように、各明チャネル値を、対応する暗チャネル値と対合させ得る。いくつかの実施形態では、次元付加モジュール１９０５は、明チャネル値の積分履歴を実行し、次に、各々の測定された明チャネル値を、例えばセクションＩＩＩ（Ｂ）（２）で上述したような、方程式（２２）で具体化した漸化式を実行することによって、相関関係にある積分履歴値と、対合させ得る。

[0210]各明チャネルデータポイントが、次元付加モジュール１９０５によって、２次元のデータポイントに変換された後、明チャネル値およびそれらの関連付けられた相関関係にある値は、装填された値のオフセットドリフトを補正するために、２次元変換を適用する、２次元変換モジュール１９０９へ送られる。ある実施形態によれば、２次元変換モジュール１９０９は、セクションＩＩＩ（Ｂ）（１）〜（３）で上述したように、回転または平坦化変換などの、２次元変換を、２次元のデータポイントの各々に適用する、行列乗数の形態をとり得る。例えば、図１４Ａ〜１４Ｂに示すように、２次元変換は、２次元空間内に２次元のデータポイントが広がる、回転／平坦化された、装填されたチャネルデータのクラスタをもたらし得る。すなわち、変換されたクラスタは、未処理のデータと比較して、ｘ軸に関して、より水平である。さらにつまり、２次元変換の動作は、ｙ次元に沿って見たときの、５つのクラスタ間の重なりを低減する、ということである。この変換されたデータは次に、各値が、ある実施形態により、規格化因子計算フロー１９０４で計算された開チャネル値へ、増減される（すなわち除算される）規格化モジュール１９１５によって、規格化される。

Ｃ．移動ヒストグラムを用いた規格化因子の決定
[0211]規格化因子計算フロー１９０４に注目すると、明チャネル値およびそれらの関連付けられた相関関係にある値は、開チャネル値のオフセットドリフトを補正するために、２次元変換を適用する、２次元変換モジュール１９０７へ送られる。ある実施形態によれば、２次元変換モジュール１９０７は、行列の乗算の形態の変換を、２次元のデータポイントの各々に適用し得る。２次元変換モジュール１９０７によって適用される変換は、装填されたチャネルデータの分散が、装填された値の処理フロー１９０２への参照で上述した２次元変換によって低減されたように、１つの次元で低減されつつある開チャネルデータの分散をもたらし得る。変換された開経路信号値は次に、データの更新された移動ヒストグラム（すなわち母集団分布）が、新しいデータおよびメモリに記憶された履歴データに基づいて計算される、移動ヒストグラムモジュール１９１１へ送られる。

[0212]ある実施形態によれば、更新された移動ヒストグラムは、セクションＩＩＩ（Ｃ）を参照して上述したような多くの方法で、履歴データから計算され得る。例えば、履歴データの移動ヒストグラムへの寄与は、経時度合に基づいて、格下げされ得る。新たに取得されたデータが、更新された移動ヒストグラムを形成するために、履歴データと組み合わされた後、ピーク検出モジュール１９１３は、ヒストグラム中で最大のピーク（すなわち配列信号データ中で最も数が多い値）を検索するために、ピーク探索ルーチンを実行し、次に、対応する信号値を、規格化因子として用いられることになる、開経路信号値の最良の推定値として、選択する。この方法によって決定された規格化因子は、直近での測定値が、いずれの開チャネル値も含まない場合においても、開チャネル電圧値の改善された推定値をもたらす。

[0213]再び、装填された値の処理フロー１９０２を注目すると、２Ｄ変換モジュール１９０９によって変換された、装填されたデータ出力は、規格化因子を用いて規格化され、出力接続点１９１７で出力される、例えば、方程式（５）または方程式（２６）を用いて規格化された、装填された信号をもたらす。装填された値が、より水平である（すなわち、明チャネル値の不均一性が、装填された値の各クラスタ内でより小さい）だけでなく、データも、ダイナミックレンジがほぼ０と１との間となるように、増減される。その結果、本明細書で説明した処理システムは、ゲインドリフトおよびオフセットシフトの両方の効果が、最小化されたので、互いにより容易に区別される装填された値（すなわちタグ値）と、時間に対してより安定的である値をもたらす。

Ｖ．コンピュータシステム
[0214]本明細書で説明したコンピュータシステムの任意のものは、任意の適切な数のサブシステムを利用し得る。そのようなサブシステムの例は、図２０のコンピュータシステム２０１０内で示した。いくつかの実施形態では、コンピュータシステムは、単一のコンピュータ装置を含み、ここでサブシステムは、コンピュータ装置の構成要素であり得る。他の実施形態では、コンピュータシステムは、各々がサブシステムであり、内部に構成要素を有する、複数のコンピュータ装置を含み得る。コンピュータシステムは、デスクトップおよびラップトップコンピュータ、タブレット、携帯電話、ならびに他の携帯機器を含み得る。

[0215]図２０で示したサブシステムは、システムバス２０７５を介して相互接続されている。プリンタ２０７４、キーボード２０７８、記憶デバイス２０７９、ディスプレイアダプタ２０８２に結合されているモニタ２０７６、およびその他などの付加的なサブシステムを示す。Ｉ／Ｏ制御装置２０７１に結合された外付けおよび入出力（Ｉ／Ｏ）デバイスは、入出力（Ｉ／Ｏ）ポート２０７７（例えば、ＵＳＢ、ＦｉｒｅＷｉｒｅ（登録商標））などの当技術分野で知られている任意の数の手段によって、コンピュータシステムに接続され得る。例えば、Ｉ／Ｏポート２０７７または外部インタフェース２０８１（例えば、イーサネット、Ｗｉ−Ｆｉ、など）は、コンピュータシステム２０１０をインターネットなどの広域ネットワーク、マウス入力装置、またはスキャナに接続するために用いられ得る。システムバス２０７５を介した相互接続により、サブシステム間での情報交換を可能にするだけでなく、セントラルプロセッサ２０７３が、各サブシステムと通信すること、システムメモリ２０７２または記憶デバイス２０７９（例えば、ハードドライブまたは光ディスクなどの固定ディスク）からの複数の命令実行を制御することを可能にする。システムメモリ２０７２および／または記憶デバイス２０７９は、コンピュータ可読媒体を含み得る。別のサブシステムは、カメラ、マイクロフォン、加速度計、その他などのデータ収集デバイス８５である。本明細書で説明したデータの任意のものは、ある構成要素から別の構成要素へ出力され得て、ユーザに出力され得る。

[0216]コンピュータシステムは、例えば、外部インタフェース２０８１によって、または内部インタフェースによって、共に接続される、複数の同一の構成要素またはサブシステムを含み得る。いくつかの実施形態では、コンピュータシステム、サブシステム、または装置は、ネットワークを通して通信し得る。そのような事例では、あるコンピュータは、クライアント、別のコンピュータは、サーバと考えることができ、ここで各々は、同一のコンピュータシステムの一部であり得る。クライアントおよびサーバは、各々複数のシステム、サブシステム、または構成要素を含み得る。

[0217]実施形態の態様は、ハードウェア（例えば、特定用途向け集積回路またはフィールドプログラマブルゲートアレイ）を用いて、および／またはモジュラーまたは統合された様式の一般にプログラム可能なプロセッサを伴う、コンピュータソフトウェアを用いて、制御ロジックの形態で実施され得る。本明細書で使用されるとき、プロセッサは、同一の集積チップ上のシングルコアプロセッサ、マルチコアプロセッサ、または単一の回路基板上のマルチプロセシングユニット、あるいはネットワーク接続されたプロセッサを含む。本開示および本明細書で提供された教示に基づいて、ハードウェアならびにハードウェアおよびソフトウェアの組合せを用いて、本発明の実施形態を実施するための他の方法および／または方法が、当業者には、知られ、かつ理解されよう。

[0218]本出願で説明されるソフトウェアの構成要素または機能の任意のものは、例えばＪａｖａ、Ｃ、Ｃ＋＋、Ｃ＃、Ｏｂｊｅｃｔｉｖｅ−Ｃ、Ｓｗｉｆｔなどの任意の好適なコンピュータ言語、または例えば、従来のまたはオブジェクト指向の技術を用いたＰｅｒｌもしくはＰｙｔｈｏｎなどのスクリプト言語を用いてプロセッサによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、一連の命令または指令として、保存および／または伝送用の、コンピュータ可読媒体上に格納され得る。好適な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、ハードドライブ、フロッピーディスクなどの磁気媒体、コンパクトディスク（ＣＤ）もしくはＤＶＤ（デジタル多用途ディスク）などの光学的媒体、またはフラッシュメモリ、などを含み得る。コンピュータ可読媒体は、そのような記憶または伝送デバイスの任意の組合せであり得る。

[0219]そのようなプログラムは、さらにエンコードされ、インターネットを含む、多様なプロトコルに従う有線、光学、および／または無線ネットワークを介した伝送に適応された、搬送波信号を用いて伝送され得る。そのように、コンピュータ可読媒体は、そのようなプログラムを用いてエンコードされたデータ信号を使用して作成され得る。プログラムコードを用いてエンコードされたコンピュータ可読媒体は、互換性のあるデバイスを用いて包装され得て、または別個に他のデバイスから供給され得る（例えば、インターネットでのダウンロード）。任意のそのようなコンピュータ可読媒体は、個々のコンピュータ製品（例えば、ハードドライブ、ＣＤ、または完全なコンピュータシステム）上にまたは内部に備えられ得て、また、システムまたはネットワーク内部の異なるコンピュータ製品上にまたは内部に存在し得る。コンピュータシステムは、本明細書で説明した成果の任意のものをユーザに提供するための、モニタ、プリンタ、または他の好適なディスプレイを含み得る。

[0220]本明細書で説明した方法の任意のものは、ステップを実行するように構成され得る１つまたは複数のプロセッサを含むコンピュータシステムを用いて、全体的にまたは部分的に実行され得る。したがって、各ステップまたはステップの各グループを実行する異なる構成要素を潜在的に有する、本明細書で説明した方法の任意のもののステップを、実行するように構成されたコンピュータシステムに、実施形態は、向けられ得る。番号を付されたステップが提示されたが、本明細書の方法のステップは、同時に、または異なる順序で実行され得る。さらに、これらのステップの部分は、他の方法からの他のステップの部分と共に用いられ得る。また、ステップの全てまたは部分は、任意選択的であり得る。さらに、任意の方法の任意のステップは、モジュール、ユニット、回路、またはこれらのステップを実行するための他の手段を用いて、実行され得る。

[0221]個々の実施形態の個別の詳細が、本発明の実施形態の技術概念および範囲から逸脱することのなく、任意の好適な方法で組み合わされ得る。しかし、本発明の他の実施形態は、各々の個別の態様に関する特定の実施形態に、またはこれらの個別の態様の特定の組合せに、向けられ得る。

[0222]本発明の例示の実施形態の上述の説明は、図解および説明の目的で提示されてきた。網羅的であること、または本発明を、説明されたそのものの形式に限定することを意図するものではなく、多数の変形例および変形形態が、上述の教示に照らして、可能である。

[0223]列挙の「ａ」、「ａｎ」、または「ｔｈｅ」は、具体的にそうでないことに示さない限り、「１つまたは複数」を意味することを意図する。「ｏｒ」のを使用法は、具体的にそうでないことに示さない限り、「排他的論理和」でなく、「包含的論理和」を意味することを意図する。「第１の」構成要素への言及は、第２の構成要素がもたらされることを必ずしも必要としない。さらに「第１の」または「第２の」構成要素への言及は、明確に規定されない限り、言及された構成要素を特定の位置に限定しない。

[0224]本明細書で言及された全ての特許、特許出願、公報、および明細書は、その全体があらゆる目的のために参照により本明細書に組み込まれる。いずれも従来技術に入れることは認められない。

Claims

配列決定セルを用いる方法であって、
前記配列決定セル間に電圧を印加するステップであって、ここで、前記配列決定セルが核酸を含み、前記印加された電圧が、参照電圧に対して第１の部分および第２の部分を有する交流信号を含むものである、前記ステップ；
前記交流信号の前記第１の部分の間に、前記配列決定セルから複数の信号値を取得するステップであって、ここで、前記交流信号の前記第１の部分の間にタグ分子が前記配列決定セルのナノポア内に装填され、前記タグ分子は特定のヌクレオチドに対応し、前記信号値が時間と共に変化する、前記ステップ；
前記取得された複数の信号値のそれぞれの値と相関関係にある複数の相関信号値を取得し、それにより複数の２次元のデータポイントを形成するステップであって、ここで、前記複数の２次元のデータポイントが、前記取得された複数の信号値に等しい第１の次元内の値、および前記複数の相関信号値に等しい第２の次元内の値を含む、前記ステップ；ならびに、
２次元変換を前記複数の２次元のデータポイントに適用することによって、複数の変換された信号値を計算するステップであって、ここで、前記２次元変換が前記取得された信号値の不均一性を補償する、前記ステップ；
を含む、前記方法。
前記複数の相関信号値が、複数の取得された電圧の複数の積分された履歴を計算することによって決定される、請求項１に記載の方法。
前記複数の相関信号値が、前記交流信号の前記第２の部分の間に取得された、複数の取得された信号値であり、ここで、前記交流信号の前記第２の部分の間に、タグ分子が、前記配列決定セルの前記ナノポア内に装填されない、請求項１に記載の方法。
前記２次元変換が、行列の乗算である、請求項１に記載の方法。
規格化因子を、前記複数の変換された信号値のヒストグラムに基づいて計算するステップ；
前記複数の変換された信号値を、複数の規格化された信号値を取得するために、前記規格化因子を用いて規格化するステップ；および、
前記ナノポアの１つまたは複数の状態を、前記複数の規格化された信号値に基づいて識別するステップ；
を含む、請求項１に記載の方法。
前記規格化因子が、前記複数の変換された信号値の前記ヒストグラム内の最大の振幅ピークを有する取得された信号値となるように決定される、請求項５に記載の方法。
前記複数の変換された信号値の少なくとも１つの変換された信号値を、前記少なくとも１つの変換された信号値を前記規格化因子で除算することによって、規格化するステップをさらに含む、請求項６に記載の方法。
前記２次元変換を、前記複数の信号値の前記不均一性を低減する変換となるように決定するステップであって、ここで、前記２次元変換が前記複数の２次元のデータポイントに適用され、かつ、前記２次元変換が前記セルの前記電圧のオフセットシフトを補償するものである、前記ステップをさらに含む、請求項１に記載の方法。
配列決定セルを用いる方法であって、
配列決定セル間に印加された電圧を有する前記配列決定セルの複数の測定された信号値を取得するステップであって、ここで、前記セルが核酸を含み、前記印加された電圧が、参照電圧に対して第１の部分および第２の部分を有する交流信号を含むものである、前記ステップ；
前記交流信号の前記第１の部分の間に測定される、信号値の第１のセットを決定するステップ；
前記信号値の第１のセットからヒストグラムを作成するステップ；
規格化因子を、前記ヒストグラム内のピークを識別することによって決定するステップであって、前記ピークが、前記配列決定セルの開経路信号値に対応する、前記ステップ；
前記交流信号の前記第１の部分の間に測定される、信号値の第２のセットを決定するステップ；ならびに、
前記信号値の第２のセット内の少なくとも１つの値を、少なくとも１つの規格化された信号値を取得するために、前記規格化因子を用いて規格化するステップ；
を含む、前記方法。
前記ヒストグラム内の前記ピークを識別するステップが、最大振幅ピークを前記配列決定セルの前記開経路信号値に対応するピークとなるように選択するステップを含む、請求項９に記載の方法。
前記ヒストグラム内の前記ピークを識別するステップが、２番目に大きい振幅ピークを前記配列決定セルの前記開経路信号値に対応する前記ピークとなるように選択するステップを含み、そのとき前記２番目に大きい振幅ピークの信号値は、開チャネル範囲を定義する信号値の範囲の中にあり、前記最大振幅ピークの信号値は前記信号値の範囲の外にある、請求項９に記載の方法。
前記信号値の第１のセットからヒストグラムを作成するステップが、前記信号値の第１のセットのポイント毎に、各ポイントの寄与を各ポイントの経時度合に基づいて割り引くステップを含む、請求項９に記載の方法。
前記ヒストグラムを作成するステップの前に、
前記交流信号の前記第１の部分の間に測定される、前記信号値の第１のセットと相関関係にある相関信号値の第１のセットを取得し、それにより２次元のデータポイントのセットを形成するステップ；
前記２次元のデータポイントのセットに基づいて、変換された信号値のセットを決定するステップであって、前記変換された信号値が、２次元変換を前記２次元のデータポイントのセットに適用することによって計算される、前記ステップ；および、
前記変換された信号値のセットを、前記ヒストグラムを作成するために使用するステップ；
を含む、請求項９に記載の方法。
配列決定セルを用いる方法であって、
配列決定セル間に印加された電圧を有する前記配列決定セルの複数の測定された信号値を取得するステップであって、ここで、前記セルが核酸を含み、前記印加された電圧が、参照電圧に対して第１の部分および第２の部分を有する交流信号を含む、前記ステップ；
前記交流信号の前記第１の部分の間に測定された、１つまたは複数の信号値の第１のセットを決定するステップであって、そのときにタグ分子が、前記配列決定セルのナノポア内に装填され、ここで、前記タグ分子は特定のヌクレオチドに対応するものである、前記ステップ；
前記交流信号の前記第１の部分の間に測定された、１つまたは複数の信号値の第２のセットを決定するステップであって、そのときに前記タグ分子が、前記配列決定セルの前記ナノポア内に装填されない、前記ステップ；
前記交流信号の前記第２の部分の間に測定された、１つまたは複数の信号値の第３のセットを決定するステップであって、そのときに前記タグ分子が、前記配列決定セルの前記ナノポア内に装填されない、前記ステップ；
前記１つまたは複数の信号値の第１のセットから、前記１つまたは複数の信号値の第３のセットの対応する値を減算し、それにより１つまたは複数のゼロ点が補償された信号値の第１のセットを生成するステップ；ならびに、
前記１つまたは複数の信号値の第２のセットから、前記１つまたは複数の信号値の第３のセットの対応する値を減算し、１つまたは複数のゼロ点が補償された信号値の第２のセットを生成するステップ；
を含む、前記方法。
前記１つまたは複数のゼロ点が補償された信号値の第１および第２のセットに対応する、対応する相関信号値を決定し、それにより複数の２次元のデータポイントを形成するステップ；ならびに、
前記１つまたは複数のゼロ点が補償された信号値の第１のセットの不均一性を低減するために、２次元変換を適用するステップ；
をさらに含む、請求項１４に記載の方法。
前記１つまたは複数のゼロ点が補償された信号値の第１および第２のセットからヒストグラムを作成するステップ；
規格化因子を、前記ヒストグラム内のピークを識別することによって決定するステップであって、前記ピークが、前記配列決定セルの開経路信号値に対応する、前記ステップ；ならびに、
前記１つまたは複数のゼロ点が補償された信号値の第１のセットを、前記規格化因子により除算することによって、規格化するステップ；
をさらに含む、請求項１４に記載の方法。
前記１つまたは複数のゼロ点が補償された信号値の第２のセットの少なくとも１つの信号値が、前記１つまたは複数のゼロ点が補償された信号値の第１のセットの少なくとも１つの信号値を規格化するための、規格化因子となるように決定される、請求項１４に記載の方法。
請求項１から１７のいずれかに記載の方法の操作を実行するために、コンピュータシステムを制御するための複数の命令を記憶するコンピュータ可読媒体を備える、コンピュータ製品。
請求項１８に記載のコンピュータ製品；および、
前記コンピュータ可読媒体に記憶する命令を実行するための１つまたは複数のプロセッサ；
を備える、システム。
請求項１から１７のいずれかに記載の方法を実行するための手段を有する、システム。
請求項１から１７のいずれかに記載の方法を実行するように構成された１つまたは複数のプロセッサを備える、システム。
請求項１から１７のいずれかに記載の方法のステップをそれぞれ実行するモジュールを備える、システム。
複数の配列決定セルを備える配列決定チップであって、第１の配列決定セルが、ナノポアを含み、前記ナノポアは、ヌクレオチドに接続されたタグを受容するように構成され、それにより充填事象を形成する、配列決定チップ；
交流信号を、前記第１の配列決定セルの前記ナノポア間に印加する信号源であって、前記交流信号の各サイクルが、第１の部分および第２の部分を含み、前記第２の部分の電圧レベルが、前記第１の部分の電圧レベルに対して参照電圧の反対側にある、前記信号源；
前記交流信号の複数のサイクルの前記第１の部分の間に信号値データの第１のセットを取得するアナログデジタル変換器であって、前記信号値データの第１のセットの各データポイントが、異なる時間で前記ナノポアの抵抗の値に対応し、前記ナノポアの前記抵抗は、前記タグが前記ナノポア内部に受容されるとき変化する、前記アナログデジタル変換器；ならびに、
請求項１から１７のいずれかに記載の方法の操作を実行するように構成された、１つまたは複数のプロセッサ；
を備える、システム。