JP2014531901A

JP2014531901A - ポリマー単位を含むポリマーの解析

Info

Publication number: JP2014531901A
Application number: JP2014531315A
Authority: JP
Inventors: ウィリアムレイド，スチュアート; ハーパー，ギャヴィン; ギャヴィンブラウン，クライヴ; アンソニークラーク，ジェームス; ジョンヘロン，アンドリュー
Original assignee: オックスフォードナノポールテクノロジーズリミテッド
Priority date: 2011-09-23
Filing date: 2012-09-21
Publication date: 2014-12-04
Anticipated expiration: 2032-09-21
Also published as: EP3269825B1; CA2849624C; EP3269825A1; CN104066850B; EP3663412A1; JP2019066484A; JP7512218B2; US11921103B2; CA3113287C; US20190310242A1; WO2013041878A1; EP3663412B1; JP6457811B2; JP6833792B2; US20170219557A1; EP2758545B1; CN104066850A; JP2021072834A; CA2849624A1; US20160162634A1

Abstract

ポリマー、例えば、ＤＮＡのポリマー単位の配列（３）が、前記ポリマーに関係する測定の少なくとも１つのシリーズ、例えば、ナノポア中を通る移行の関数としてのイオン電流から推定され（１）、それぞれの測定の値が、ｋポリマー単位のグループであるｋマーに依拠している（４）。可能なｋマーのセットについて、起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、およびそのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付けを含む、確率的モデル、特に隠れマルコフモデル（ＨＭＭ）が提供される。モデルを参照する解析技法、例えば、ビタビ復号を使用して、測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定する。追加の実施形態では、ポリマー単位の分解を改善するために、移行中に異なる電圧がナノポアを横断して印加される。

Description

本発明は、一般的には、ポリマー単位を含むポリマーを解析する、例えば、限定されるものではないが、ポリヌクレオチドをポリマーに関係する測定を行うことにより解析する分野に関する。本発明の第一の態様は、具体的にはポリマー中のポリマー単位の配列を推定することに関する。本発明の第二および第三の態様は、ポリマーの解析のためにポリマーの移行中にナノポア中を流れるイオン電流の測定に関する。

ポリマーを解析しおよび／またはポリマー単位の配列を決定するためのポリマーの測定を提供する多くの種類の測定システムが存在する。

例えば、限定されるものではないが、１つの種類の測定システムは、ポリマーを移行させる際に通るナノポアを利用する。前記システムのある特性は、ナノポア中のポリマー単位に依拠しており、その特性の測定が行われる。例えば、測定システムは、絶縁膜にナノポアを置き分析物分子の存在下でナノポアを通る電圧駆動イオン輸送を測定することにより作製しうる。ナノポアの性質に応じて分析物の正体を、その特徴的なイオン電流サイン、特に、電流ブロックの持続時間および程度ならびに電流レベルの分散を通じて明らかにしうる。ナノポアを使用するそのような種類の測定システムは、特に、ＤＮＡまたはＲＮＡなどのポリヌクレオチドの配列を決定する分野ではかなり有望であり、つい最近の開発の主題であった。

幅広い適用にわたり迅速で安価な核酸（例えば、ＤＮＡまたはＲＮＡ）配列決定技術に対する必要性が現在存在する。既存の技術は、主に増幅技法を利用して大量の核酸を産生し、シグナル検出には高品質の専門の蛍光化学物質を必要とするために、時間がかかり高価である。ナノポア検知には、必要なヌクレオチドおよび試薬の量を減少させることにより迅速で安価な核酸配列決定を提供できる潜在性がある。

本発明は、それぞれの測定の値が、ｋが正整数であるｋ個のポリマー単位（すなわち、ｋマー）のグループに依拠している状況に関する。

さらに、それぞれの測定の値が、ｋが複数の整数であるｋマーに依拠していることは、大多数の現在公知の生物学的ナノポアを含む多くの種類の測定システムに典型的である。これは、１つよりも多いポリマー単位が、観察されるシグナルに寄与しており、概念的には、測定されているポリマー単位よりも大きな「鈍いリーダーヘッド」を有する測定システムと見なしてもよいからである。そのような状況では、分解される異なるｋマーの数がｋの冪乗まで増加する。例えば、ｎ個の可能なポリマー単位が存在する場合では、分解される異なるｋマーの数はｎ^ｋである。異なるｋマーについての測定間は明確に分離していることが望ましいが、これらの測定の一部が重複していることはよく起こる。特に大きな数のポリマー単位がｋマー中にある、すなわち、大きな値のｋでは、異なるｋマーにより生み出される測定を分解するのは困難になり、ポリマーについての情報、例えば、ポリマー単位の根底にある配列の推定値を導き出すのに障害となる。

したがって、開発研究の多くは、測定の分解を改善する測定システムの設計に向けられてきた。根底にある物理的または生物学的系の固有の変動からばらついて生じることがある測定の変動および／または測定されている特性が小規模である結果避けられない測定ノイズによって、これは実際の測定システムでは困難である。

多くの研究が、単一のポリマー単位に依拠している分解可能な測定を提供する測定システムの設計を目指してきた。しかし、これは実際には困難であった。

他の研究は、ｋが複数の整数であるｋマーに依拠している測定を受け入れたが、異なるｋマーからの測定が互いに分解可能である測定システムの設計を目指してきた。しかし、現実の限界はこれが極めて困難であることを再び意味している。いくつかの異なるｋマーが発するシグナルの分布は重複することが多いことがある。

原理的には、それぞれが同じポリマー単位に部分的に頼ってポリマー単位のレベルで分解される単一の値を得る、ｋが複数の整数であるｋ個の測定からの情報を組み合わせることは可能であるだろう。しかし、これは実際には困難である。第一に、これは、ｋ個の測定のセットを変換する適切な変換を同定する可能性にかかっている。しかし、多くの測定システムでは、根底にある物理的または生物学的系における相互作用の複雑さのために、そのような変換は存在しないまたは同定するのが非現実的であるのいずれかである。第二に、所与の測定システムについてそのような変換が原理的に存在するとしても、測定の変動のために変換を同定するのは困難であるおよび／または変換はそれでも互いに分解することができない値を与える可能性がある。第三に、そのような技法では、例えば、測定を行うことができない測定システムによって、またはそれに続くデータ処理のエラーによって、実際の測定システムで時折ありうるように、見逃された測定、すなわち、所与のｋマーに依拠している測定がポリマー単位の配列のなかで失われる場合を考慮に入れることは困難であるまたは不可能である。

本発明の第一の態様は、ｋマーに依拠しているような測定からポリマー中のポリマー単位の配列を推定する正確度を改善する技法を提供することに関する。

本発明の第一の態様によれば、ポリマーに関係する測定の少なくとも１つのシリーズからポリマー中のポリマー単位の配列を推定する方法であって、それぞれの測定の値が、ｋが正整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについて所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照する解析技法を使用して測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む方法が提供される。

さらに本発明の第一の態様によれば、類似する方法を実行する解析装置が提供される。

したがって、本発明の第一の態様は、測定を生み出す測定システムのモデルを使用する。測定のいかなるシリーズを考慮しても、モデルはその測定を生み出したｋマーの異なる配列の可能性を表す。本発明の第一の態様は、それぞれの測定の値が、ｋが複数の整数であるｋマーに依拠している状況に特に適している。

前記モデルは可能なｋマーを考慮する。例えば、それぞれのポリマー単位が４個のポリマー単位（またはさらに一般的にはｎ個のポリマー単位）のうちの１つでありうるポリマーでは、どれか特定のｋマーが物理的に存在しないのでなければ、４^ｋ個の可能なｋマー（またはさらに一般的にはｎ^ｋ個の可能なｋマー）が存在する。存在しうるすべてのｋマーでは、放出重み付けは所与の測定値を観測する可能性を考慮に入れる。それぞれのｋマーに関する放出重み付けは、そのｋマーについての所与の測定値を観測する可能性を表す。

遷移重み付けは、起点ｋマーから目的地ｋマーまでの遷移の可能性を表し、したがって、測定が依拠しているｋマーの、異なるｋマー間を遷移する可能性を考慮に入れる。したがって、遷移重み付けは、多少なりとも可能性がある遷移を考慮しうる。例として、ｋが複数の整数である場合、所与の起点ｋマーでは、これは、起点ｋマーとは異なる配列を有し最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位ではない目的地ｋマーまでの遷移である好ましくない遷移よりも、最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位である配列を有する目的地ｋマーまでの遷移である好ましい遷移のより大きな可能性を表しうる。例えば、ポリマー単位が天然に存在するＤＮＡ塩基である３マーでは、状態ＣＧＴは、ＧＴＣ、ＧＴＧ、ＧＴＴおよびＧＴＡへの好ましい遷移を有する。限定のない例として、モデルは、遷移重み付けおよび放出重み付けが確率である隠れマルコフモデルであってもよい。

これにより、測定のシリーズは、モデルを参照する解析技法を使用して解析することが可能になる。ポリマー中のポリマー単位の少なくとも１つの推定された配列が、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて推定される。例えば、限定されるものではないが、解析技法は確率的技法であってよい。

特に、個々のｋマーからの測定は互いに分解可能である必要はなく、同じポリマー単位に依拠しているｋ個の測定のグループからその変換に関しての値までの変換が存在する必要はない、すなわち、観測される状態のセットはもっと少数のパラメータの関数である必要はない（がこれは排除されない）。代わりに、モデルの使用は、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度を検討する際に複数の測定を考慮に入れることにより正確な推定を提供する。概念的には、遷移重み付けは、一部はそのポリマー単位に、および実際、配列中のより大きな距離からの測定にも依拠している少なくともｋ個の測定を、所与のポリマー単位を推定する際に、モデルが考慮に入れることを可能にすると見なしてもよい。モデルは、所与のポリマー単位を推定する際に多数の測定を効果的に考慮に入れて、より正確でありうる結果を出すことができる。

同様に、そのようなモデルを使用すれば、解析技法は所与のｋマーからの失われた測定を考慮に入れるおよび／または所与のｋマーにより生じる測定の外れ値を考慮に入れることが可能になる。これは、遷移重み付けおよび／または放出重み付けにおいて説明しうる。例えば、遷移重み付けは好ましくない遷移の少なくとも一部の非ゼロの可能性を表しうるおよび／または放出重み付けはあらゆる可能な測定を観測する非ゼロの可能性を表しうる。

本発明の第二および第三の態様は、ポリマーがナノポア中を通って移行している間にナノポア中を流れるイオン電流の測定を使用してポリマーの解析を支援する技法の提供に関する。

本発明の第二の態様によれば、ポリマー単位を含むポリマーを解析する方法であって、
ナノポアを横断して電圧が印加されている間にナノポア中を通るポリマーの移行中に、ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定を行い、前記測定が個々のｋマーに関して、ナノポアを横断して印加される前記電圧の異なるレベルで行われる別々の測定を含むステップ、および
前記電圧の前記異なるレベルでの測定を解析してポリマーの少なくとも一部の正体を決定するステップ
を含む方法が提供される。

前記方法は、ｋが正整数であるポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定を行うことを伴う。特に、測定は、個々のｋマーに関して、ナノポアを横断して印加された前記電圧の異なるレベルで行われる別々の測定を含む。本発明者らは、ナノポアを横断して印加された前記電圧の異なるレベルでのそのような測定は単に重複しているというよりもむしろ追加の情報を提供すると認識し実証してきた。例えば、異なる電圧での測定は、異なる状態の分解を可能にする。例えば、所与の電圧で分解することができないいくつかのｋマーは別の電圧では分解することができる。

本発明の第三の態様は、ナノポアを横断する電圧の異なるレベルの印加下で行われる測定を行う方法であって、場合により本発明の第二の態様で用いてもよい方法を提供する。特に、本発明の第三の態様によれば、ポリマー単位を含むポリマーの測定を行う方法であって、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記電圧の異なるレベルを周期的に印加するステップ、および
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定であり、前記測定が個々のｋマーに依拠している状態よりも短い繰返し周期を有する前記周期での前記電圧の前記異なるレベルでの前記個々のｋマーに関する別々の測定を含む測定を行うステップ
を含む方法が提供される。

したがって、本発明の第三の態様は、本発明の第二の態様と同じ利点であって、特に測定が単に重複しているというよりもむしろ追加の情報を提供するという利点を与える。異なる電圧での測定は、それに続く測定の解析において異なる状態の分解を可能にする。例えば、所与の電圧で分解することができないいくつかの状態は別の電圧では分解することができる。

これは、異なる電圧での測定がナノポア中を通るポリマーの１回の移行中に得られる技術革新に基づいている。これは、繰返し周期が測定される状態の持続時間よりも短くなるように選択される周期で前記電圧のレベルを変化させることにより達成される。

しかし、本発明の第二の態様内でこの方法を使用することは不可欠ではない。代案として、電圧の異なる大きさでのイオン電流測定は、同方向への移行でもよいし、または反対方向への移行を含んでいてもよいナノポア中を通るポリマーの異なる移行中に行うことができる。

したがって、本発明の第二の態様および第三の態様の方法は、ポリマーについての情報を導き出す測定のその後の解析を改善する追加の情報を提供することができる。導き出しうる情報の種類のいくつかの例は以下の通りである。

解析は、状態間の遷移の時機を導き出すことでありうる。このケースでは、異なる電位でのそれぞれの状態の測定により提供される追加の情報は、正確度を改善する。例えば、２つの状態間の遷移を１つの電圧では分解することができないケースでは、遷移は別の電圧でのイオン電流測定のレベルの変化により同定しうる。これが、１つの電圧だけでは明らかな作動にならないと考えられる遷移を同定すること、または遷移が実際には起こらなかったことをより高い信頼度で決定することを潜在的に可能にする。この同定は、測定のそれに続く解析において使用しうる。

一般に、異なる電圧レベルで測定を実行することは、１つの電圧レベルで得られるよりも多くの情報を提供する。例えば、ナノポア中を通るイオン流の測定において、測定から得られる情報には、特定の状態についての電流レベルおよびシグナル分散（ノイズ）が含まれる。例えば、ナノポア中を通るＤＮＡの移行では、ヌクレオチド塩基Ｇを含むｋマーはシグナル分散が増大した状態を生じる傾向がある。例えば、類似の電流レベルを有するそれぞれの状態によって、またはそれぞれの状態のうちの１つもしくは両方が高いシグナル分散を有する場合には、状態の遷移が起こったかどうかを確定するのは困難であることもある。特定の状態についての電流レベルおよびシグナル分散は異なる電圧レベルでは異なることがあり、したがって、異なる電圧レベルでの測定は、高分散状態の決定を可能にするまたは状態を決定する信頼度のレベルを増加しうる。その結果、別の電圧レベルと比べて１つの電圧レベルでの状態間の遷移を決定する方が容易でありうる。

解析は、ポリマーの正体を推定するまたはポリマー中のポリマー単位の配列を推定することでありうる。このケースでは、異なる電位でのそれぞれの状態の測定により与えられる追加の情報は推定の正確度を改善する。

ポリマー単位の配列を推定するケースでは、解析は本発明の第一の態様に従った方法を使用しうる。したがって、本発明の第一の態様の特長は、本発明の第二の態様および／または第三の態様の特長と、いかなる組合せでも組み合わせることができる。

さらに、本発明の第二および第三の態様によれば、類似の方法を実行する解析装置が提供される。

さらに十分な理解を可能にするため、本発明の実施形態は添付図面を参照して非限定的例としてここで説明されることになる。

は、ナノポアを含む測定システムの概略図である。は、測定システムにより経時的に測定された事象のシグナルのプロットである。は、ナノポアを含む測定システムにおける２つの異なるポリヌクレオチドの測定の度数分布のグラフである。は、実験的に導き出される電流測定のセットに適用される一次線形モデルから予測される値に対する６４の３マー係数のプロットである。は、実験的に導き出される電流測定値のセットに適用される一次線形モデルから予測される値に対する１０２４の５マー係数のプロットである。は、ポリマーの測定を含む入力シグナルを解析する方法のフローチャートである。は、図６の状態検出ステップのフローチャートである。は、図６の解析ステップのフローチャートである。は、状態検出ステップに供される入力シグナルのプロットである。は、測定の得られたシリーズのプロットである。は、遷移マトリックスの図形表示である。は、シミュレーションされた例におけるｋマー状態に関する予測される測定のグラフである。は、図１２において図示される予測される測定からシミュレーションされた入力シグナルを示している。は、図１３の入力シグナルから導き出される測定のシリーズを示している。は、遷移重み付けの遷移マトリックスを示している。は、遷移重み付けの遷移マトリックスを示している。は、ガウスである可能な分布を有する放出重み付けのグラフである。は、三角である可能な分布を有する放出重み付けのグラフである。は、四角である可能な分布を有する放出重み付けのグラフである。は、図１２に示される１セットのシミュレーションされた測定と予測される測定間の電流スペースアライメントのグラフである。は、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。は、シミュレーションされた測定の追加のセットと図１２に示される予測される測定間の電流スペースアライメントのグラフである。は、図１５の遷移マトリックスを用いた、実際のｋマーと図２２のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。は、図１６の遷移マトリックスを用いた、実際のｋマーと図２２のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。は、分布が図１２の予測される測定を中心とする小非ゼロバックグランドのある四角分布を有する放出重み付けのグラフである。は、図１５の遷移マトリックスおよび図２５の放出重み付けを用いた、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。は、分布が図１２の予測される測定を中心とするゼロバックグランドのある四角分布を有する放出重み付けのグラフである。は、図１５の遷移マトリックスおよび図２７の放出重み付けを用いた、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。は、ストレプトアビジンを使用するＭＳ−（Ｂ２）８ナノポア中に保持されるＤＮＡ鎖から得られる電流測定の散布図である。は、実例トレーニングプロセスについての遷移マトリックスである。は、図３０の遷移マトリックスの拡大部分である。は、静的トレーニングプロセスから導き出される６４のｋマーのモデルについての放出重み付けのグラフである。は、図３２のモデルのおよそ４００の状態のモデルへの変換についての放出重み付けのグラフである。は、トレーニングプロセスのフローチャートである。は、図３４のトレーニングプロセスにより決定される放出重み付けのグラフである。は、モデルから予測される測定を用いていくつかの実験にわたって集められた電流測定のグラフである。は、実際のｋマーと推定されたｋマー間のｋマースペースアライメントのグラフである。は、実際の配列と整列された推定されたｋマーの推定された配列を示している。は、ポリマーのセンス領域およびアンチセンス領域の別々の推定された配列を、２つのそれぞれの次元で配置されたセンス領域およびアンチセンス領域からの測定を処理することにより導かれる推定された配列と一緒に示している。は、最初の例における３つの異なる電圧でのナノポア中のＤＮＡ鎖のセットについてのイオン電流測定のヒストグラムのセットである。は、第二の例におけるナノポア中の一本鎖についての共通の時間期間にわたり付加された電位および得られたイオン電流の対になったグラフである。は、第二の例において電圧レベル＋６０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。は、第二の例において電圧レベル＋１００ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。は、第二の例において電圧レベル＋１４０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。は、第二の例において電圧レベル＋１８０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。は、第二の例において印加された電圧に対するそれぞれのＤＮＡ鎖の測定された電流のプロットである。は、印加された電圧に対する第二の例におけるＤＮＡ鎖ごとの電流測定の標準偏差のプロットである。は、イオン電流測定を行う方法のフローチャートである。は、第三の例における共通の時間期間にわたって付加された電位および得られたイオン電流の対になったグラフである。は、第三の例における共通の時間期間にわたって付加された電位および得られたイオン電流の対になったグラフである。は、イオン電流測定を行う別の方法のフローチャートである。Ａ及びＢは、ナノポアを横断して印加された形状電圧ステップおよび得られた電流の同じ時間尺度上のプロットである。本発明のすべての態様は、以下の通りの広範なポリマーに適用しうる。

ポリマーは、ポリヌクレオチド（または核酸）、タンパク質などのポリペプチド、多糖類、または他の任意のポリマーであってよい。ポリマーは天然でも合成でもよい。

ポリヌクレオチドまたは核酸のケースでは、ポリマー単位はヌクレオチドであってよい。核酸は典型的にはデオキシリボ核酸（ＤＮＡ）、リボ核酸（ＲＮＡ）、ｃＤＮＡまたはペプチド核酸（ＰＮＡ）、グリセロール核酸（ＧＮＡ）、トレオース核酸（ＴＮＡ）、ロックド核酸（ＬＮＡ）もしくはヌクレオチド側鎖のある他の合成ポリマーなどの当技術分野で公知の合成核酸である。核酸は一本鎖でも二本鎖でもまたは一本鎖領域と二本鎖領域の両方を含んでいてもよい。典型的には、ｃＤＮＡ、ＲＮＡ、ＧＮＡ、ＴＮＡまたはＬＮＡは一本鎖である。本発明の方法を使用して、いかなるヌクレオチドでも同定しうる。ヌクレオチドは天然に存在するもので人工的なものでもよい。ヌクレオチドは典型的には、核酸塩基、糖および少なくとも１つのリン酸基を含有する。核酸塩基は典型的には複素環式である。適切な核酸塩基には、プリンおよびピリミジンが、さらに具体的にはアデニン、グアニン、チミン、ウラシルおよびシトシンが含まれる。糖は典型的には五炭糖である。適切な糖には、リボースおよびデオキシリボースが含まれるがこれらに限定されない。ヌクレオチドは典型的にはリボヌクレオチドまたはデオキシリボヌクレオチドである。ヌクレオチドは典型的には、一リン酸塩、二リン酸塩または三リン酸塩を含有する。

ヌクレオチドは損傷した塩基でも後成的塩基でも可能である。ヌクレオチドは標識されてまたは修飾されて、はっきりしたシグナルを有するマーカーとして働くことができる。この技法を使用して、ポリヌクレオチド内の塩基の非存在、例えば、塩基脱落単位またはスペーサーを同定することが可能である。前記方法はどんな種類のポリマーにも適用することができるであろう。

修飾されたまたは損傷したＤＮＡの測定（または類似のシステム）を検討する際に特に有用なのが、補完的データが考慮される方法である。提供される追加の情報は、さらに多数の根底にある状態の区別を可能にする。

ポリペプチドのケースでは、ポリマー単位は天然に存在するまたは合成のアミノ酸であってよい。

多糖類のケースでは、ポリマー単位は単糖であってよい。

本発明は、下でさらに考察されるように、広範囲の測定システムにより行われる測定に適用しうる。

本発明のすべての態様に従って、測定システムはナノポアを含むナノポアシステムでありうる。このケースでは、測定はナノポア中を通るポリマーの移行中に行いうる。ナノポア中を通るポリマーの移行は、観測されうる、全体では「事象」と呼びうる測定される特性における特徴的シグナルを生じる。

ナノポアは、典型的にはナノメーターオーダーのサイズを有し、その中を通ってポリマーを通過させるポアである。ポリマー単位がポア中を通って移行することに依拠している特性は測定しうる。前記特性は、ポリマーとポア間の相互作用に関連していることがある。ポリマーの相互作用はポアの狭窄領域で起こりうる。測定システムは前記特性を測定し、ポリマーのポリマー単位に依拠している測定を生み出す。

ナノポアは生物学的ポアでも固体状態ポアでもよい。

ナノポアが生物学的ポアである場合、以下の特性を有していることがある。

生物学的ポアは膜貫通タンパク質ポアでありうる。本発明に従って使用するための膜貫通タンパク質ポアは、βバレルポアまたはαヘリックス束状ポアに由来することが可能である。βバレルポアは、β鎖から形成されるバレルまたはチャネルを含む。適切なβバレルポアには、α溶血素、炭疽毒素およびロイコシジンなどのβ毒素、ならびにマイコバクテリウム・スメグマチス（Mycobacterium smegmatis）ポリン（Ｍｓｐ）、例えば、ＭｓｐＡ、外膜ポリンＦ（ＯｍｐＦ）、外膜ポリンＧ（ＯｍｐＧ）、外膜ホスホリパーゼＡおよびナイセリア（Neisseria）自己輸送体リポタンパク質（ＮａｌＰ）などの細菌の外膜タンパク質／ポリン、が含まれるがこれらに限定されない。αヘリックス束状ポアは、αヘリックスから形成されるバレルまたはチャネルを含む。適切なαヘリックス束状ポアには、内膜タンパク質ならびにＷＺＡおよびＣｌｙＡ毒素などのα外膜タンパク質が含まれるがこれらに限定されない。膜貫通ポアは、Ｍｓｐにまたはα溶血素（α−ＨＬ）に由来しうる。

膜貫通タンパク質ポアは典型的にはＭｓｐに、好ましくはＭｓｐＡに由来する。そのようなポアは、オリゴマーであり、典型的にはＭｓｐ由来の７、８、９または１０モノマーを含む。ポアは、同一のモノマーを含むＭｓｐ由来のホモオリゴマーポアであってもよい。代わりに、ポアは、その他のモノマーとは異なる少なくとも１つのモノマーを含むＭｓｐ由来のヘテロオリゴマーポアであってもよい。ポアは、Ｍｓｐ由来の２つ以上の共有結合モノマーを含む１つまたは複数の構築物を含んでいてもよい。適切なポアは、米国特許仮出願第６１／４４１，７１８号（２０１１年２月１１日提出）に開示されている。好ましくは、ポアはＭｓｐＡまたはそのホモログもしくはパラログ由来である。

生物学的ポアは天然に存在するポアでもよいし、変異ポアでもよい。典型的なポアは、ＷＯ−２０１０／１０９１９７、Stoddart D et al.、Proc Natl Acad Sci、12; 106(19):7702-7、Stoddart D et al.、Angew Chem Int Ed Engl. 2010; 49(3):556-9、Stoddart D et al.、Nano Lett. 2010 Sep 8; 10(9):3633-7、Butler TZ et al.、Proc Natl Acad Sci 2008; 105(52):20647-52および米国特許仮出願第６１／４４１７１８号に記載されている。

生物学的ポアはＭＳ−（Ｂ１）８でありうる。Ｂ１をコードするヌクレオチド配列およびＢ１のアミノ酸配列は下に示されている（配列番号１および配列番号２）。
配列番号１：ＭＳ−（Ｂ１）８＝ＭＳ−（Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＡＴＧＧＧＴＣＴＧＧＡＴＡＡＴＧＡＡＣＴＧＡＧＣＣＴＧＧＴＧＧＡＣＧＧＴＣＡＡＧＡＴＣＧＴＡＣＣＣＴＧＡＣＧＧＴＧＣＡＡＣＡＡＴＧＧＧＡＴＡＣＣＴＴＴＣＴＧＡＡＴＧＧＣＧＴＴＴＴＴＣＣＧＣＴＧＧＡＴＣＧＴＡＡＴＣＧＣＣＴＧＡＣＣＣＧＴＧＡＡＴＧＧＴＴＴＣＡＴＴＣＣＧＧＴＣＧＣＧＣＡＡＡＡＴＡＴＡＴＣＧＴＣＧＣＡＧＧＣＣＣＧＧＧＴＧＣＴＧＡＣＧＡＡＴＴＣＧＡＡＧＧＣＡＣＧＣＴＧＧＡＡＣＴＧＧＧＴＴＡＴＣＡＧＡＴＴＧＧＣＴＴＴＣＣＧＴＧＧＴＣＡＣＴＧＧＧＣＧＴＴＧＧＴＡＴＣＡＡＣＴＴＣＴＣＧＴＡＣＡＣＣＡＣＧＣＣＧＡＡＴＡＴＴＣＴＧＡＴＣＡＡＣＡＡＴＧＧＴＡＡＣＡＴＴＡＣＣＧＣＡＣＣＧＣＣＧＴＴＴＧＧＣＣＴＧＡＡＣＡＧＣＧＴＧＡＴＴＡＣＧＣＣＧＡＡＣＣＴＧＴＴＴＣＣＧＧＧＴＧＴＴＡＧＣＡＴＣＴＣＴＧＣＣＣＧＴＣＴＧＧＧＣＡＡＴＧＧＴＣＣＧＧＧＣＡＴＴＣＡＡＧＡＡＧＴＧＧＣＡＡＣＣＴＴＴＡＧＴＧＴＧＣＧＣＧＴＴＴＣＣＧＧＣＧＣＴＡＡＡＧＧＣＧＧＴＧＴＣＧＣＧＧＴＧＴＣＴＡＡＣＧＣＣＣＡＣＧＧＴＡＣＣＧＴＴＡＣＧＧＧＣＧＣＧＧＣＣＧＧＣＧＧＴＧＴＣＣＴＧＣＴＧＣＧＴＣＣＧＴＴＣＧＣＧＣＧＣＣＴＧＡＴＴＧＣＣＴＣＴＡＣＣＧＧＣＧＡＣＡＧＣＧＴＴＡＣＧＡＣＣＴＡＴＧＧＣＧＡＡＣＣＧＴＧＧＡＡＴＡＴＧＡＡＣＴＡＡ
配列番号２：ＭＳ−（Ｂ１）８＝ＭＳ−（Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＧＬＤＮＥＬＳＬＶＤＧＱＤＲＴＬＴＶＱＱＷＤＴＦＬＮＧＶＦＰＬＤＲＮＲＬＴＲＥＷＦＨＳＧＲＡＫＹＩＶＡＧＰＧＡＤＥＦＥＧＴＬＥＬＧＹＱＩＧＦＰＷＳＬＧＶＧＩＮＦＳＹＴＴＰＮＩＬＩＮＮＧＮＩＴＡＰＰＦＧＬＮＳＶＩＴＰＮＬＦＰＧＶＳＩＳＡＲＬＧＮＧＰＧＩＱＥＶＡＴＦＳＶＲＶＳＧＡＫＧＧＶＡＶＳＮＡＨＧＴＶＴＧＡＡＧＧＶＬＬＲＰＦＡＲＬＩＡＳＴＧＤＳＶＴＴＹＧＥＰＷＮＭＮ

生物学的ポアはより好ましくはＭＳ−（Ｂ２）８である。Ｂ２のアミノ酸配列は、変異Ｌ８８Ｎを除いてはＢ１のアミノ酸配列と同じである。Ｂ２をコードするヌクレオチド配列およびＢ２のアミノ酸配列は下に示されている（配列番号３および配列番号４）。
配列番号３：ＭＳ−（Ｂ２）８＝ＭＳ−（Ｌ８８Ｎ／Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＡＴＧＧＧＴＣＴＧＧＡＴＡＡＴＧＡＡＣＴＧＡＧＣＣＴＧＧＴＧＧＡＣＧＧＴＣＡＡＧＡＴＣＧＴＡＣＣＣＴＧＡＣＧＧＴＧＣＡＡＣＡＡＴＧＧＧＡＴＡＣＣＴＴＴＣＴＧＡＡＴＧＧＣＧＴＴＴＴＴＣＣＧＣＴＧＧＡＴＣＧＴＡＡＴＣＧＣＣＴＧＡＣＣＣＧＴＧＡＡＴＧＧＴＴＴＣＡＴＴＣＣＧＧＴＣＧＣＧＣＡＡＡＡＴＡＴＡＴＣＧＴＣＧＣＡＧＧＣＣＣＧＧＧＴＧＣＴＧＡＣＧＡＡＴＴＣＧＡＡＧＧＣＡＣＧＣＴＧＧＡＡＣＴＧＧＧＴＴＡＴＣＡＧＡＴＴＧＧＣＴＴＴＣＣＧＴＧＧＴＣＡＣＴＧＧＧＣＧＴＴＧＧＴＡＴＣＡＡＣＴＴＣＴＣＧＴＡＣＡＣＣＡＣＧＣＣＧＡＡＴＡＴＴＡＡＣＡＴＣＡＡＣＡＡＴＧＧＴＡＡＣＡＴＴＡＣＣＧＣＡＣＣＧＣＣＧＴＴＴＧＧＣＣＴＧＡＡＣＡＧＣＧＴＧＡＴＴＡＣＧＣＣＧＡＡＣＣＴＧＴＴＴＣＣＧＧＧＴＧＴＴＡＧＣＡＴＣＴＣＴＧＣＣＣＧＴＣＴＧＧＧＣＡＡＴＧＧＴＣＣＧＧＧＣＡＴＴＣＡＡＧＡＡＧＴＧＧＣＡＡＣＣＴＴＴＡＧＴＧＴＧＣＧＣＧＴＴＴＣＣＧＧＣＧＣＴＡＡＡＧＧＣＧＧＴＧＴＣＧＣＧＧＴＧＴＣＴＡＡＣＧＣＣＣＡＣＧＧＴＡＣＣＧＴＴＡＣＧＧＧＣＧＣＧＧＣＣＧＧＣＧＧＴＧＴＣＣＴＧＣＴＧＣＧＴＣＣＧＴＴＣＧＣＧＣＧＣＣＴＧＡＴＴＧＣＣＴＣＴＡＣＣＧＧＣＧＡＣＡＧＣＧＴＴＡＣＧＡＣＣＴＡＴＧＧＣＧＡＡＣＣＧＴＧＧＡＡＴＡＴＧＡＡＣＴＡＡ
配列番号４：ＭＳ−（Ｂ２）８＝ＭＳ−（Ｌ８８Ｎ／Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＧＬＤＮＥＬＳＬＶＤＧＱＤＲＴＬＴＶＱＱＷＤＴＦＬＮＧＶＦＰＬＤＲＮＲＬＴＲＥＷＦＨＳＧＲＡＫＹＩＶＡＧＰＧＡＤＥＦＥＧＴＬＥＬＧＹＱＩＧＦＰＷＳＬＧＶＧＩＮＦＳＹＴＴＰＮＩＮＩＮＮＧＮＩＴＡＰＰＦＧＬＮＳＶＩＴＰＮＬＦＰＧＶＳＩＳＡＲＬＧＮＧＰＧＩＱＥＶＡＴＦＳＶＲＶＳＧＡＫＧＧＶＡＶＳＮＡＨＧＴＶＴＧＡＡＧＧＶＬＬＲＰＦＡＲＬＩＡＳＴＧＤＳＶＴＴＹＧＥＰＷＮＭＮ

生物学的ポアは、生体膜、例えば、脂質二重層などの両親媒性層に挿入しうる。両親媒性層は、親水性も親油性も有するリン脂質などの両親媒性分子から形成される層である。両親媒性層は単層でも二重層でもよい。両親媒性層は、（Gonzalez-Perez et al.、Langmuir、2009、25、10447-10450）により開示されているなどのコブロックポリマーであってもよい。代わりに、生物学的ポアは固体状態層に挿入されてもよい。

代わりに、ナノポアは、固体状態層内で形成される開口部を含む固体状態ポアであってもよい。

固体状態層は生体起源ではない。言い換えると、固体状態層は生物もしくは細胞などの生物学的環境に由来してもそこから単離されてもおらず、または生物学的に利用可能な構造体の合成的に製造されたものでもない。固体状態層は、マイクロエレクトロニクス材料、Ｓｉ３Ｎ４、Ａ１２０３およびＳｉＯなどの絶縁材料、ポリアミドなどの有機および無機ポリマー、Ｔｅｆｌｏｎ（登録商標）などのプラスチックまたは二成分付加硬化型シリコーンゴムなどのエラストマーならびにガラスを含むがこれらに限定されない有機材料からでも無機材料からでも形成することが可能である。固体状態層はグラフェンから形成しうる。適切なグラフェン層は、ＷＯ２００９／０３５６４７およびＷＯ−２０１１／０４６７０６に開示されている。

固体状態ポアは典型的には固体状態層中の開口部である。開口部は化学的にまたは他の方法で改変して、ナノポアとしてのその特性を増強してもよい。固体状態ポアは、トンネル電極（Ivanov AP et al.、Nano Lett. 2011 Jan 12;11(1):279-85）または電界効果トランジスター（ＦＥＴ）デバイス（国際出願ＷＯ２００５／１２４８８８）などのポリマーの別のまたは追加の測定を提供する追加の成分と組み合わせて使用してもよい。固体状態ポアは、例えば、ＷＯ００／７９２５７に記載されている工程を含む公知の工程により形成してもよい。

測定システムの一種では、ナノポア中を流れるイオン電流の測定を使用しうる。これらのおよび他の電気的測定は、Stoddart D et al.、Proc Natl Acad Sci、12; 106(19):7702-7、Lieberman KR et al、J Am Chem Soc. 2010; 132(50):17961-72および国際出願ＷＯ−２０００／２８３１２に記載されている標準単一チャネル記録装置を使用して行いうる。代わりに、電気的測定は、例えば、国際出願ＷＯ−２００９／０７７７３４および国際出願ＷＯ−２０１１／０６７５５９に記載されているマルチチャネルシステムを使用して行いうる。

ポリマーがナノポア中を通って移行する時に測定を行うことを可能にするために、移行速度はポリマー結合部分により制御することができる。典型的には、前記部分は、印加電界に合わせてまたは逆らってナノポア中を通ってポリマーを移動させることができる。前記部分は、例えば、前記部分が酵素のケースでは酵素活性を使用して分子モーターになる、または分子ブレーキとなることができる。ポリマーがポリヌクレオチドである場合、ポリヌクレオチド結合酵素の使用を含む移行速度を制御するためのいくつかの方法が提唱されている。ポリヌクレオチドの移行速度を制御するのに適した酵素には、ポリメラーゼ、ヘリカーゼ、エキソヌクレアーゼ、一本鎖および二本鎖結合タンパク質、ならびにジャイレースなどのトポイソメラーゼが含まれるがこれらに限定されない。他のポリマー型では、そのポリマー型と相互作用する部分を使用することができる。ポリマー相互作用部分は、国際出願番号ＰＣＴ／ＧＢ１０／０００１３３またはＵＳ６１／４４１７１８（Lieberman KR et al、J Am Chem Soc. 2010;132(50):17961-72）に開示されているおよび電位開口型スキーム（Luan B et al.、Phys Rev Lett. 2010; 104(23):238103）についてのいかなる部分でもよい。

ポリマー結合部分は、ポリマー運動を制御するいくつかの方法で使用することが可能である。前記部分は、印加電界に合わせてまたは逆らってナノポア中を通ってポリマーを移動させることができる。前記部分は、例えば、前記部分が酵素のケースでは酵素活性を使用して分子モーターとして、または分子ブレーキとして使用することができる。ポリマーの移行は、ポア中を通るポリマーの動きを制御する分子歯止めにより制御しうる。分子歯止めはポリマー結合タンパク質であってよい。ポリヌクレオチドでは、ポリヌクレオチド結合タンパク質は好ましくはポリヌクレオチドハンドリング酵素である。ポリヌクレオチドハンドリング酵素は、ポリヌクレオチドと相互作用をし、ポリヌクレオチドの少なくとも１つの特性を改変することができるポリペプチドである。前記酵素は、ポリヌクレオチドを切断して個々のヌクレオチドまたはジヌクレオチドもしくはトリヌクレオチドなどのヌクレオチドの比較的短い鎖を形成することによりポリヌクレオチドを改変することがある。前記酵素は、ポリヌクレオチドを特定の位置に方向付けるまたは移動させることによりポリヌクレオチドを改変することがある。ポリヌクレオチドハンドリング酵素は、標的ポリヌクレオチドと結合しポア中を通るその動きを制御することができさえすれば酵素活性を示す必要はない。例えば、前記酵素はその酵素活性を取り除くように改変されてもよいし、酵素として作用するのを妨げる条件下で使用してもよい。そのような条件は下でさらに詳細に考察される。

ポリヌクレオチドハンドリング酵素は、核酸分解酵素に由来していてもよい。酵素の構築物中で使用されるポリヌクレオチドハンドリング酵素は、より好ましくは、酵素分類（ＥＣ）群、３．１．１１、３．１．１３、３．１．１４、３．１．１５、３．１．１６、３．１．２１、３．１．２２、３．１．２５、３．１．２６、３．１．２７、３．１．３０および３．１．３１のうちのいずれかのメンバー由来である。酵素は、国際出願番号ＰＣＴ／ＧＢ１０／０００１３３（ＷＯ２０１０／０８６６０３として公開された）に開示されている酵素のうちのいずれであってもよい。

好ましい酵素は、ポリメラーゼ、エキソヌクレアーゼ、ヘリカーゼおよびジャイレースなどのトポイソメラーゼである。適切な酵素には、大腸菌（E.coli）由来のエキソヌクレアーゼＩ（配列番号８）、大腸菌（E.coli）由来のエキソヌクレアーゼＩＩＩ酵素（配列番号１０）、サーマス・サーモフィルス（T. thermophilus）由来のＲｅｃＪ（配列番号１２）およびバクテリオファージラムダエキソヌクレアーゼ（配列番号１４）ならびにそのバリアントが含まれるがこれらに限定されない。配列番号１４に示される配列またはそのバリアントを含む３つのサブユニットは相互作用してトリマーエキソヌクレアーゼを形成する。前記酵素は好ましくはＰｈｉ２９ＤＮＡポリメラーゼ由来である。Ｐｈｉ２９ポリメラーゼ由来の酵素は、配列番号６に示される配列またはそのバリアントを含む。

配列番号６、８、１０、１２または１４のバリアントは、配列番号６、８、１０、１２または１４のアミノ酸配列とは異なるアミノ酸配列を有しポリヌクレオチド結合力は保持している酵素である。前記バリアントは、ポリヌクレオチドの結合を促進しならびに／または高塩濃度および／もしくは室温でその活性を促進する改変を含みうる。

配列番号６、８、１０、１２または１４のアミノ酸配列の全長にわたり、バリアントは好ましくは、アミノ酸同一性に基づいてその配列に少なくとも５０％相同であることになる。さらに好ましくは、前記バリアントポリペプチドは、アミノ酸同一性に基づいて、配列番号６、８、１０、１２または１４のアミノ酸配列にその全配列にわたり少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９０％およびさらに好ましくは少なくとも９５％、９７％または９９％相同であってよい。２００以上の、例えば、２３０、２５０、２７０または２８０以上の連続するアミノ酸のストレッチにわたって少なくとも８０％、例えば、少なくとも８５％、９０％または９５％アミノ酸同一性（「ハード相同性」）が存在していてもよい。相同性は上に記載される通りに決定される。バリアントは、配列番号２を参照して上で考察されるいかなる点においても野生型配列とは異なりうる。酵素は上で考察されたポアに共有結合していてもよい。

一本鎖ＤＮＡ塩基配列決定のための２つの戦略は、シスからトランスへとトランスからシスへの両方、付加電位に合わせてまたは逆らってのどちらかでナノポア中を通るＤＮＡの移行である。鎖塩基配列決定のための最も有利な機構は、付加電位下でのナノポア中を通る一本鎖ＤＮＡの制御された移行である。二本鎖ＤＮＡ上で前進的にまたは進行的に作用するエキソヌクレアーゼは、付加電位下で残りの一本鎖を中に送り込むためにポアのシス側上で、または逆電位下ではトランス側で使用することができる。同様に、二本鎖ＤＮＡをほどくヘリカーゼも類似する様式で使用することが可能である。付加電位に逆らった鎖移行を必要とする塩基配列決定適用の可能性もあるが、ＤＮＡは先ず逆電位下でまたは電位なしで酵素により「捕捉」されなければならない。次に結合に続いて電位が切り替えられると、前記鎖はポア中をシスからトランスへ通過し、電流の流れにより伸ばされた立体構造に保持されることになる。一本鎖ＤＮＡエキソヌクレアーゼまたは一本鎖ＤＮＡ依存性ポリメラーゼは分子モーターとして働いて、付加電位に逆らってトランスからシスに、制御された段階的な様式でポア中で移行したばかりの一本鎖を引き戻すことができる。代わりに、一本鎖ＤＮＡ依存性ポリメラーゼは、ポア中を通るポリヌクレオチドの動きを遅くする分子ブレーキとして働くことができる。仮出願ＵＳ６１／４４１７１８またはＵＳ仮出願第６１／４０２９０３号に記載されているいかなる部分、技法または酵素を使用してもポリマーの動きを制御することができるであろう。

しかし、別の種類の測定システムおよび測定も可能である。

別の種類の測定システムのいくつかの非限定的例は以下の通りである。

測定システムは、走査型プローブ顕微鏡であってよい。走査型プローブ顕微鏡は、原子間力顕微鏡（ＡＦＭ）、走査型トンネル顕微鏡（ＳＴＭ）または別の形態の走査型顕微鏡である。

読取り装置がＡＦＭであるケースでは、ＡＦＭチップの解像度は、個々のポリマー単位の寸法ほど微細ではないことがある。したがって、測定は複数のポリマー単位の関数になりうる。ＡＦＭチップは、チップが機能化されていない場合とは別の様式でポリマー単位と相互作用するように機能化させうる。ＡＦＭは、接触モード、非接触モード、タッピングモードまたは他のどんなモードでも作動させうる。

読取り装置がＳＴＭであるケースでは、測定の解像度は個々のポリマー単位の寸法ほど微細ではないことがあり、そのため測定は複数のポリマー単位の関数になる。ＳＴＭは、従来法でまたは分光学的測定（ＳＴＳ）をするようにまたは他のどんなモードでも作動させうる。

別の種類の測定のいくつかの例には、電気的測定および光学的測定が限定なく含まれる。蛍光の測定を伴う適切な光学的方法は、J. Am. Chem. Soc. 2009、131 1652-1653により開示されている。可能な電気的測定には、電流測定、インピーダンス測定、トンネリング測定（例えば、Ivanov AP et al.、Nano Lett. 2011 Jan 12;11(1):279-85に開示されている）およびＦＥＴ測定（例えば、国際出願ＷＯ２００５／１２４８８８に開示されている）が含まれる。光学的測定は電気的測定と組み合わせうる（Soni GV et al.、Rev Sci Instrum. 2010 Jan;81(1):014301）。測定は、ナノポア中を通るイオン電流の流れの測定などの膜貫通電流測定でもよい。イオン電流は典型的には、直流イオン電流でよいが、原理的には代案は交流電流の流れ（すなわち、交流電圧の印加下で流れる交流電流の大きさ）を使用することである。

本明細書では、用語「ｋマー」とは、ｋマーが単一ポリマー単位であるｋが１であるケースを含む、ｋが正整数であるｋ個のポリマー単位のグループのことである。いくつかの文脈では、一般にはｋが１であるケースを除外してｋマーのサブセットである、ｋが複数の整数であるｋマーに言及する。

理想的には測定は単一のポリマー単位に依拠すると考えられるが、多くの典型的な測定システムに関しては、測定は、ｋが複数の整数であるポリマーのｋマーに依拠する。すなわち、それぞれの測定は、ｋが複数の整数であるｋマー中のそれぞれのポリマー単位の配列に依拠する。典型的には、測定はポリマーと測定システム間の相互作用に関連する特性である。

本発明のいくつかの実施形態では、小グループのポリマー単位、例えば、ダブレットまたはトリプレットのポリマー単位（すなわち、ｋ＝２またはｋ＝３）に依拠している測定を使用するのが好ましい。他の実施形態では、さらに大きなグループのポリマー単位に依拠している測定を、すなわち、「広い」解像度で使用するのが好ましい。そのような広い解像度は、ホモポリマー領域を調べるのに特に有用になることがある。

特に測定が、ｋが複数の整数であるｋマーに依拠している場合、できる限り多くの可能なｋマーについて分解可能である（すなわち、分離される）ことが望ましい。典型的には、これは異なるｋマーにより生み出される測定が測定範囲にわたり十分に広がっているおよび／または狭い分布を有するならば、達成することが可能である。これは、異なる測定システムにより様々な程度に達成しうる。しかし、異なるｋマーにより生み出される測定が分解可能であることが不可欠ではないことは本発明の特別な利点である。

図１は、両親媒性層などの生体膜２に挿入された生物学的ポア１であるナノポアを含む測定システム８の例を模式的に示している。ポリマー単位のシリーズ４を含むポリマー３は、矢印で示されるように生物学的ポア１中を通って移行される。ポリマー３は、ポリマー単位４がヌクレオチドであるポリヌクレオチドでありうる。ポリマー３は、生物学的ポア１内部のｋマーに依拠して変化する膜貫通電流などの電気特性を引き起こす生物学的ポア１の活性部分５と相互作用する。この例では、活性部分５は３つのポリマー単位４のｋマーと相互作用しているものとして示されているが、これは限定的なものではない。

生体膜２のそれぞれの側に配置された電極６は、制御回路７１および測定回路７２を含めて、電気回路７と接続されている。

制御回路７１は、生物学的ポア１を横断する印加のために電極６に電圧を供給するように配置されている。

測定回路７２は、電気特性を測定するように配置されている。したがって、測定は生物学的ポア１内部のｋマーに依拠している。

測定システムにより出力される典型的タイプのシグナルであり、本発明に従って解析されることになる入力シグナルであるシグナルは「ノイズステップ波」であるが、このシグナルタイプに限定されない。この形態を有する入力シグナルの例は、ナノポアを含む測定システムを使用して得られるイオン電流測定のケースについて図２に示されている。

このタイプの入力シグナルは、連続するグループの複数の測定が同じｋマーに依拠している測定の入力シリーズを含む。それぞれのグループ内の複数の測定は、下で考察されるある分散を受ける一定値であり、したがって、測定システムの状態に対応してシグナルに「レベル」を形成する。シグナルは、大きなセットであることもあるレベルのセット間を移動する。計測手段のサンプリング速度およびシグナル上のノイズを考慮すると、レベル間の遷移は瞬間的だと見なすことが可能であり、したがって、シグナルは理想化されたステップトレースにより概算することが可能である。

それぞれの状態に対応した測定は事象の時間尺度にわたり一定であるが、大半の測定システムでは短い時間尺度にわたり分散を受けることになる。分散は、例えば、電気回路およびシグナル処理から、特に電気生理学という特定のケースでは増幅器から生じる測定ノイズに起因することがある。そのような測定ノイズは、測定されている特性が小規模であるため避けられない。分散は、測定システムの根底にある物理的または生物学的系における固有の変動または拡散からも生じることがある。大半の測定システムは、そのような固有の変動を大小の程度の差はあっても経験することになる。所与の測定システムでは、両方の変動源が一因となることがあるまたはこれらのノイズ源のうちの１つが優勢であることもある。

さらに、典型的にはグループにおける測定数に先験的知識はなく、この数は予測不能に変化する。

分散および測定数についての知識の欠如というこれら２つの要因のため、例えば、グループが短いおよび／または２つの連続するグループの測定のレベルが互いに近い場合、グループのいくつかを区別するのが困難になることがある。

シグナルは、測定システムにおいて起きている物理的または生物学的過程の結果として、このような形態をとる。したがって、測定のそれぞれのグループは「状態」と呼びうる。

例えば、ナノポアを含むいくつかの測定システムでは、ナノポア中を通るポリマーの移行からなる事象は、一方向だけに動く様式で起こりうる。一方向だけの動きのそれぞれのステップ中、ナノポアを横断する所与の電圧でのナノポア中を流れるイオン電流は一定であり、上で考察された分散を受ける。したがって、測定のそれぞれのグループは、一方向だけの動きのステップに関連している。それぞれのステップは、ポリマーがナノポアに対してそれぞれの位置にある状態に対応する。状態の期間中の正確な位置にはある程度の変動がありうるが、状態間にはポリマーの大規模な動きがある。測定システムの性質に応じて、状態はナノポア中での結合事象の結果として起こりうる。

個々の状態の持続時間は、ポアを横断して印加される電位、ポリマーの歯止めをするのに使用される酵素の種類、ポリマーが酵素によりポア中を通って押されているのかまたは引っ張られているのか、ｐＨ、塩濃度および存在するヌクレオシド三リン酸の種類などのいくつかの要因に依拠していることがある。状態の持続時間は、測定システムに応じて０．５ｍｓから３秒まで変化することがあり、所与のナノポアシステムでは、状態間である程度の無作為な変動がある。持続時間の予測される分布は、所与の測定システムについて実験的に決定しうる。

前記方法は、測定の複数の入力シリーズであって、それぞれがそれぞれのシリーズにおける複数の測定の連続するグループが同じｋマーに依拠している上記の形態をとる入力シリーズを使用することがある。そのような複数のシリーズは登録されることがあるので、例えば、それぞれシリーズの測定が同時間に行われる場合、それぞれのシリーズからのどの測定が対応し同じｋマーに依拠しているのかが先験的に分かる。例えば、測定が、異なる測定システムにより同調して測定された異なる特性である場合、こうなる可能性がある。代わりに、そのような複数のシリーズは登録されないことがあるので、それぞれのシリーズからのどの測定が対応し同じｋマーに依拠しているのかは先験的には分からない。例えば、測定のシリーズが異なる時間に行われる場合、こうなる可能性がある。

ナノポアを横断する異なるレベルの電圧の印加下で測定が行われる、下で考察される第三の態様に従った方法は、それぞれのレベルの電圧に関する測定のシリーズを提供する。このケースでは、測定の繰返し周期は、問題の測定システムについての状態の繰返し周期を考慮して選択される。理想的には、繰返し周期はすべての状態の持続時間より短く、これは、測定システムについての最小の予想される繰返し周期よりも短い繰返し周期を選択することにより達成される。しかし、いくつかの状態のみの持続時間よりも短い、例えば、状態の持続時間の平均で６０％、７０％、８０％、９０％、９５％、または９９％よりも短い繰返し周期中に行われる測定から有用な情報を得ることができる。典型的には、繰返し周期は最長で３秒、さらに典型的には最長で２秒または最長で１秒であってよい。典型的には、繰返し周期は少なくとも０．５ｍｓ、さらに典型的には少なくとも１ｍｓまたは少なくとも２ｍｓであってよい。

１つよりも多い、例えば、２から１０までの数の電圧周期を状態の持続時間に適用してもよい。

それぞれのｋマーに関して複数の測定を１つの電圧レベルで（または、複数の電圧レベルのそれぞれで複数の測定を）行ってもよい。１つの可能なアプローチでは、異なるレベルの電圧をそれぞれ、例えば、電圧波形がステップ波である時に、一期間連続して印加してもよく、前記複数の期間のそれぞれの期間中に、その期間に印加される電圧のうちの１つで１グループの複数の測定が行われる。

複数の測定は、それ自体それに続く解析において使用しうる。代わりに、その（またはそれぞれの）電圧レベルでの１つまたは複数のサマリー測定を、複数の測定のそれぞれのグループから導き出しうる。前記１つまたは複数のサマリー測定は、所与のｋマーに関して所与の電圧レベルでの複数の測定から、いかなる様式でも、例えば、平均もしくは中央値として、または統計的変動の尺度、例えば標準偏差として導き出しうる。次に、前記１つまたは複数のサマリー測定は、それに続く解析において使用しうる。

電圧周期はいくつかの異なる波形から選択しうる。波形は、非対称的、対照的、規則的または不規則的でもよい。

周期の一例では、異なるレベルの電圧をそれぞれ、それらの異なるレベル間の遷移と共に、一期間、すなわち、周期、例えば方形波またはステップ波の部分的期間連続して印加してもよい。電圧レベル間の遷移は、急なこともあれば、一期間にわたり傾斜していることもある。

周期の別の例では、電圧レベルは連続して変化し、例えば、異なるレベル間、例えば、三角波またはのこぎり波で傾斜していてもよい。このケースでは、異なるレベルでの測定は、所望の電圧レベルに対応する周期内で時々測定を行うことにより行ってもよい。

情報は、電圧平坦域での測定からまたは勾配の測定から導き出しうる。さらに情報は、異なる電圧レベルで行われる測定に加えて、例えば、１つの電圧レベルと別の電圧レベル間の過渡電流の形状の測定により導き出しうる。

段階的電圧スキームでは、電圧レベル間の遷移は、どんな容量過渡電流をも最小にするように形作ることができる。ナノポアシステムを単純なＲＣ回路と見なせば、電流の流れ、Ｉ、は式Ｉ＝Ｖ／Ｒ＋ＣｄＶ／ｄｔにより与えられ、Ｖは付加電位、Ｒは抵抗（典型的にはポアの）、ｔは時間およびＣは容量（典型的には二重層の）である。このモデル系では２つの電圧レベル間の遷移は、時定数、τ＝ＲＣの指数関数（Ｖ＝Ｖ２−（Ｖ２−Ｖ１）^＊ｅｘｐ（−ｔ／τ））に従うと考えられる。

図５２ａおよび５２ｂは、電圧レベル間の遷移の時定数τが、遷移速度が最適化されている、非常に速いおよび非常に遅くなるように選択されるケースを図示している。電圧遷移が非常に速い場合、測定される電流シグナルにスパイク（オーバーシュート）が見られ、非常に遅いと測定されるシグナルは急には平らにならない（アンダーシュート）。遷移速度が最適化されているケースでは、測定される電流が理想的な急な遷移から歪んでいる時間は最小化される。遷移の時定数τは、測定システムの電気的特性の測定から、または異なる遷移の試験から決定しうる。

２つ以上のうちのいかなる数のレベルの電圧でも測定は行いうる。電圧のレベルは、それぞれのレベルの電圧での測定が、前記測定が依拠しているｋマーの正体についての情報を提供するように選択される。したがって、レベルの選択は測定システムの性質に依拠している。ナノポアを横断して印加される電位差の程度は、両親媒性層の安定性、使用される酵素の種類および所望の移行速度などの要因に依拠することになる。典型的には、電圧のレベルのそれぞれは同じ極性になるが、一般には電圧のレベルのうちの１つまたは複数はそれ以外のレベルとは反対の極性であることも可能であろう。一般に、大半のナノポアシステムでは、それぞれのレベルの電圧は典型的には対地１０ｍＶから２Ｖであってもよい。したがって、電圧レベル間の電圧差は典型的には少なくとも１０ｍＶ、さらに好ましくは少なくとも２０ｍＶであってよい。電圧レベル間の電圧差は典型的には最大で１．５Ｖ、さらに典型的には最大で４００ｍＶであってよい。電圧差が大きくなると電圧レベル間の電流差はさらに大きくなり、したがってそれぞれの状態間に潜在的にさらに大きな区別を生じる傾向がある。しかし、高電圧レベルは例えば、システムにより多くのノイズを生じるまたは酵素による移行の混乱を招くことがある。逆に、電圧差が小さくなると電流差は小さくなる傾向がある。最適電位差は、実験条件または酵素歯止めの種類に応じて選択しうる。

１つの電圧レベルで測定されるｋマーは、必ずしも異なる電圧レベルで測定されるのと同じｋマーではないことがある。ｋの値は、異なる電位で測定されるｋマー間で異なることがある。しかし、これが本当であるならば、異なる電圧レベルで測定されるそれぞれのｋマーに共通であるポリマー単位が存在する可能性が高い。理論に縛られることなく、測定されているｋマーのいかなる差も、ナノポアを横断して印加されるより高い電位差でのナノポア内のポリマーの立体構造の変化がリーダーヘッドにより測定されているポリマー単位の数の変化をもたらすことに起因している可能性があると考えられる。この立体構造の変化の程度は、１つの値と別の値間の電位の差に依拠している可能性がある。

測定の一部としてまたは登録情報を提供する追加の供給源からのいずれかで他の情報が入手可能になることがある。この他の情報により状態を同定できることがある。

代わりに、シグナルが恣意的な形態をとることがある。これらのケースでは、ｋマーに対応する測定は放出と遷移のセットの点からも記載されることがある。例えば、特定のｋマーに依拠している測定は、これらの方法による記載を受け入れることができる形で起こる測定のシリーズを含むことがある。

所与の測定システムがｋマーおよびｋマーのサイズに依拠している測定を提供する程度は実験的に調べることができる。例えば、公知のポリマーが合成され、測定システムに対して予め定められた位置に保持されて、得られた測定から、前記測定が測定システムと相互作用をするｋマーの正体にどのように依拠しているのかを調べることができる。

１つの可能なアプローチは、同一配列を有するポリマーのセットを、そのセットのポリマーごとに変化する予め定められた位置のｋマーを除いて使用することである。前記ｋマーのサイズおよび正体を変化させて、測定に対するその効果を調べることができる。

別の可能なアプローチは、予め定められた位置で調査中のｋマーの外側のポリマー単位がそのセットのポリマーごとに変化するポリマーのセットを使用することである。そのようなアプローチの例として、図３は、ナノポアを含む測定システムにおける２つのポリヌクレオチドの電流測定の頻度分布である。前記ポリヌクレオチドのうちの１つ（ｐｏｌｙＴと呼ばれる）では、ナノポアの領域におけるすべての塩基がＴ（ｐｏｌｙＴと呼ばれる）であり、ポリヌクレオチドのもう一方（Ｎ１１−ＴＡＴＧＡＴ−Ｎ８と呼ばれる）では、特定の決められた６マー（配列ＴＡＴＧＡＴを有する）から左側に１１塩基および右側に８塩基を変化させる。図３の例は電流測定の点で前記２つの鎖の見事な分離を示している。Ｎ１１−ＴＡＴＧＡＴ−Ｎ８鎖により見られる値の範囲も、ｐｏｌｙＴにより見られる値の範囲よりもごくわずかに広い。このようにしておよび他の配列を有するポリマーも測定して、問題の特定の測定システムでは、測定が６マーに良好な近似で依拠していることを確かめることが可能である。

このアプローチまたは類似のアプローチは、位置および最小ｋマー記述を決定することを可能にするどんな測定システムについても一般化することが可能である。

異なる条件下でまたは異なる検出方法によって複数の測定を適用する確率論的枠組み、特に技法により、ポリマーのより低いｋ記述を使用することが可能になることがある。例えば、下で考察されるセンスＤＮＡおよびアンチセンスＤＮＡ測定のケースでは、それぞれのｋマー測定のより正確な記述が６マーになると考えられる場合、３マー記述で根底にあるポリマーｋマーを決定するのに十分でありうる。同様に、複数の電位での測定のケースでは、それぞれのｋマー測定のより正確な記述がｋマーまたはｋが比較的高い値を有するｋマーになると考えられる場合、ｋが比較的低い値を有するｋマー記述で根底にあるポリマーｋマーを決定するのに十分でありうる。

類似の方法を使用して、一般的測定システムにおける十分近似するｋマーの位置および幅を同定してもよい。図３の例では、これは、（例えば、Ｎの数を前と後ろで変化させることにより）ポアに対して６マーの位置を変えて、最もよく近似するｋマーの位置を検出し、６から決められた塩基の数を増加するおよび減少することにより達成される。ｋの値は、十分に狭い値の拡散の影響を最小限受けることがある。ｋマーの位置は、ピーク幅を最小限にするように選択することができる。

典型的な測定システムでは、異なるｋマーに依拠している測定はすべてが独自に分解可能であるわけではないことは通常事実である。例えば、図３が関係する測定システムでは、決められた６マーを有するＤＮＡ鎖により生み出される測定の範囲は２ｐＡの桁であり、このシステムの近似の測定範囲は３０ｐＡから７０ｐＡであることが観測される。６マーでは、４０９６通りの可能なｋマーが存在する。これらのそれぞれが２ｐＡの類似する変動を有することを考慮すると、４０ｐＡ測定範囲においてはこれらのシグナルは独自に分解可能ではないことは明らかである。いくつかのｋマーの測定が分解可能である場合でさえ、多くの他のｋマーの測定が分解可能ではないことが典型的に観測される。

多くの実際の測定システムでは、それぞれが同じポリマー単位に一部依拠しているｋ個の測定を変換して、ポリマー単位のレベルで分解される単一の値を得る関数を同定することは可能ではなく、またはさらに一般的にはｋマー測定がｋマーの数よりも小さなパラメータのセットにより記述可能ではない。

例として、ナノポアを含む特定の測定システムでは、ポリヌクレオチドの実験的に導かれたイオン電流測定は簡単な一次線形モデルにより正確に記述可能ではないことがここで実証されるであろう。これは、下でより詳細に説明される２つのトレーニングセットについて明らかにされる。この実証のために使用される簡単な一次線形モデルは、
電流＝Ｓｕｍ［ｆｎ（Ｂｎ）］＋Ｅ
であり、ｆｎは測定システムにおけるそれぞれの位置ｎで生じる塩基Ｂｎごとの係数であり、Ｅは実験変動性に起因するランダム誤差を表す。データは最小二乗法によりこのモデルにフィットさせるが、当技術分野で公知の多くの方法のいずれか１つを代わりに使用することもできる。図４および５は、電流測定に対してフィットする最良モデルのプロットである。データがこのモデルで十分に記述されるのであれば、点は典型的な実験誤差（例えば、２ｐＡ）内で対角線にきちんと従うはずである。これは、データがどちらのセットの係数でもこの線形モデルでは十分に記述されないことを示すケースではない。

ノイズが多いステップ波である入力シグナルを解析する方法であって、本発明の第一の態様を具体化する特定の方法がここで説明されることになる。以下の方法は、測定が、ｋが２以上のｋマーに依拠しているケースに関係するが、同じ方法はｋが１であるｋマーに依拠している測定に単純化された形態で適用しうる。

前記方法は図６に図示されており、図６に模式的に図示されている解析ユニット１０において実施しうる。解析ユニット１０は測定回路７２からの測定を含む入力シグナルを受けて解析する。したがって、解析ユニット１０と測定システム８は接続され、合わせてポリマーを解析するための装置を構成する。解析ユニット１０は、制御回路７に制御シグナルも提供して測定システム８において生物学的ポア１を横断して印加される電圧を選択し、印加された電圧に従って測定回路７２からの測定を解析することができる。

解析ユニット１０と測定システム８を含む装置は、ＷＯ−２００８／１０２２１０、ＷＯ−２００９／０７７３４、ＷＯ−２０１０／１２２２９３および／またはＷＯ−２０１１／０６７５５９のいずれかに開示されている通りに配置しうる。

解析ユニット１０は、コンピュータ装置において実行されるコンピュータプログラムにより実施してもよいし、または専用のハードウェアデバイスまたはその任意の組合せにより実施してもよい。どちらのケースでも、前記方法により使用されるデータは解析ユニット１０のメモリに記憶される。コンピュータ装置は、使用される場合、いかなる種類のコンピュータシステムでもよいが、典型的には従来の構造である。コンピュータプログラムは、いかなる適切なプログラム言語で書かれていてもよい。コンピュータプログラムは、コンピュータ可読記憶媒体上に記憶されることができ、前記媒体は、どんな種類でも、例えば、計算システムのドライブに差し込み可能であり、情報を磁気的に、光学的にまたは光磁気的に記憶しうる記憶媒体、ハードドライブなどのコンピュータシステムの固定記憶媒体、またはコンピュータメモリでもよい。

前記方法は、どのグループでも測定の数についての先験的な知識なしで同じｋマーに依拠している複数の測定の連続するグループを含む、上記の種類の測定のシリーズを（または、さらに下で説明されるように、より一般的にはどんな数のシリーズでも）を含む入力シグナル１１で実施される。そのような入力シグナル１１の例は、以前記載された図２に示されている。

状態検出ステップＳ１では、入力シグナル１１は処理されて、連続するグループの測定を同定し、それぞれの同定されたグループに関して予め定められた数（１または複数である）の測定からなる測定のシリーズ１２を導き出す。解析ステップＳ２は、このようにして導き出された測定のシリーズ１２で実施される。状態検出ステップＳ１の目的は、それぞれのｋマー状態に関連する予め定められた数の測定まで入力シグナルを減らして、解析ステップＳ２を簡略化することである。例えば、図２に示されるように、ノイズの多いステップ波シグナルは、それぞれの状態に関連する単一の測定が平均電流でありうる状態まで減らしうる。この状態はレベルと呼ばれることもある。

状態検出ステップＳ１は、以下の通りに入力シグナル１１の導関数において短期増加を探す図７に示されている方法を使用して実施しうる。

ステップＳ１−１では、入力シグナル１１は微分されてその導関数を導き出す。

ステップＳ１−２では、ステップＳ１−１からの導関数は、（微分が増幅させる傾向がある）高周波ノイズを抑制するための低域フィルタリングにかけられる。

ステップＳ１−３では、ステップＳ１−２からフィルターにかけられた導関数は閾値処理され、測定のグループ間の遷移点を検出し、それによりデータのグループを同定する。

ステップＳ１−４では、予め定められた数の測定は、ステップＳ１−３において同定されたそれぞれのグループにおける入力シグナル１１から導き出される。最も簡単なアプローチでは、単一の測定は、それぞれの同定されたグループにおける測定値の、例えば平均、中央値または他の位置の尺度として導き出される。ステップＳ１−４からの測定出力は測定のシリーズ１２を形成する。他のアプローチでは、それぞれのグループに関する複数の測定が導き出される。

この技法の一般的簡略化は、データの２つの隣接する窓の平均を比較するスライディングウィンドウ解析を使用することである。次に、閾値は直接的に平均差に置くこともできるし、または前記２つの窓におけるデータ点の分散に基づいて設定することができる（例えば、ステューデントｔ統計量を計算することにより）。これらの方法の特定の利点は、これらの方法がデータに多くの仮定を負わせることなく適用することができることである。

測定されたレベルに関連している他の情報は、解析において後で使用するために記憶させることができる。そのような情報は、シグナルの分散、非対称情報、観察の信頼度、グループの長さのいずれでも制限なく含んでいてもよい。

例として、図９は、移動するウィンドウｔ検定により減らされた実験的に決定された入力シグナル１１を図示している。特に、図９は入力シグナル１１を細線で示している。状態検出に続くレベルは暗線としてかぶせて示されている。図１０は、遷移間の平均値からのそれぞれの状態のレベルを計算して、全トレースについて導き出された測定のシリーズ１２を示している。

しかし、下でさらに詳細に説明されるように、状態検出ステップＳ１は任意選択であり、さらに下で説明される代案では、省いてもよい。このケースでは、図６中の点線により模式的に示されるように、解析ステップＳ２は、測定のシリーズ１２の代わりに、入力シグナル１１自体で実施される。

解析ステップＳ２はここで説明される。

解析ステップＳ２は、解析ユニット１０に記憶されたモデル１３を参照する解析技法を使用する。解析ステップＳ２は、測定のシリーズ１２がポリマー単位の配列により生み出されるというモデル１３により予測される尤度に基づいてポリマー中のポリマー単位の推定された配列１６を推定する。最も単純なケースでは、推定された配列１６は、ポリマー単位ごとに単一の推定された正体を提供する表示であることがある。さらに一般的には、推定された配列１６は、ある最適性基準に従ってポリマー単位の配列の任意の表示であることがある。例えば、推定された配列１６は、例えば、ポリマーの一部またはすべてにおける１つまたは複数のポリマー単位の複数の推定された正体を含めて、複数の配列を含むことがある。

モデル１３の数学的基礎はここで検討される。解析ステップＳ２は、さらに下で説明されるクオリティスコア１７も提供する。

電流をサンプリングする確率変数の配列｛Ｘ_１、Ｘ_２、．．．，Ｘ_ｎ｝間の関係は、変数
Ｘ_１−Ｘ_２−Ｘ_３−．．．₋Ｘ_ｎ
間の条件付き独立関係を表す単純なグラフィックモデルＡにより表される。

それぞれの電流測定は読み取られているｋマーに依拠しているので、確率変数の根底にあるセット｛Ｓ_１、Ｓ_２、．．．、Ｓ_ｎ｝がｋマーの根底にある配列を表しており、対応するグラフィックモデルＢでは、

である。

適用の電流領域に適用されるこれらのモデルはマルコフ性を利用する。モデルＡでは、ｆ（Ｘ_ｉ）を確率変数Ｘｉの確率密度関数を表すようにとれば、マルコフ性は
ｆ（Ｘ_ｍ｜Ｘ_ｍ−１）＝ｆ（Ｘ_ｍ｜Ｘ_１、Ｘ_２、．．．、Ｘ_ｍ−１）
として表すことができる。

モデルＢでは、マルコフ性は
Ｐ（Ｓ_ｍ｜Ｓ_ｍ−１）＝Ｐ（Ｓ_ｍ｜Ｓ_１、Ｓ_２、．．．、Ｓ_ｍ−１）
として表すことができる。

問題が正確にどのようにコード化されているかに応じて、解決のための自然の方法は、ベイジアンネットワーク、マルコフ確率場、隠れマルコフモデルを含むことがあり、これらのモデルの異形、例えば、そのようなモデルの条件付きまたは最大エントロピーフォーミュレーションも含む。これらのわずかに異なる枠組み内の解決法は多くの場合類似している。一般的に、モデル１３は起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け１４、およびそれぞれのｋマーに関してそのｋマーについて測定の所与の値を観測する可能性を表す放出重み付け１５を含んでいる。モデル１３が隠れマルコフモデルであるケースではここで説明される。

隠れマルコフモデル（ＨＭＭ）は、グラフィックモデルＢにおいてここで与えられる設定の自然表示である。ＨＭＭでは、個々の確率変数Ｓ_ｍとＳ_ｍ＋１の間の関係は、このケースではそれぞれの確率変数が取ることのできる可能な状態間、すなわち、起点ｋマーから目的地ｋマーまでの遷移の確率を表す確率である遷移重み付け１４の遷移マトリックスの点から定義されている。例えば、従来から、遷移マトリックスの（ｉ，ｊ）番目エントリーは、Ｓ_ｍ＝Ｓ_ｍ，ｉだと仮定するとＳ_ｍ＋１＝Ｓ_{ｍ＋１，ｊ}である確率、すなわち、Ｓ_ｍがそのｉ番目の可能な値を帯びると仮定するとＳ_ｍ＋１のｊ番目の可能な値への遷移の確率を表す遷移重み付け１４である。

図１１は、Ｓ_ｍからＳ_ｍ＋１までの遷移マトリックスの図形表示である。ここでは、Ｓ_ｍおよびＳ_ｍ＋１は、説明のために４つの値を示しているだけであるが、実際には異なるｋマーが存在するのと同じ数の状態が存在すると考えられる。それぞれのエッジは遷移を表し、遷移確率を表す遷移マトリックスからのエントリーで標識してもよい。図１１では、Ｓ_ｍ層からＳ_ｍ＋１層においてそれぞれの交点を接続する４つのエッジの遷移確率は古典的には合計で１になると考えられるが、非確率的重み付けを使用してもよい。

一般に、遷移重み付け１４は、非バイナリー変数（非バイナリー値）の値を含むことが望ましい。これにより、モデル１３はｋマー間の遷移の実際の確率を表すことが可能になる。

モデル１３がｋマーを表すことを考慮すると、所与のｋマーは、起点ｋマーから、最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位である配列を有する目的地ｋマーまでの遷移であるｋ個の好ましい遷移を有する。例えば、４種のヌクレオチドＧ、Ｔ、ＡおよびＣからなるポリヌクレオチドのケースでは、起点３マーＴＡＣは３マーＡＣＡ、ＡＣＣ、ＡＣＴおよびＡＣＧへの好ましい遷移を有する。最初の近似まで、概念的には、４つの好ましい遷移の遷移確率は（０．２５）に等しく、それ以外の好ましくない遷移の遷移確率はゼロであり、好ましくない遷移は、起点ｋマーから、起点ｋマーとは異なる配列を有し、最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位ではない目的地ｋマーまでの遷移であると考えてもよい。しかし、この近似は理解のためには有用であるが、遷移の実際の可能性は一般に、所与の測定システムではこの近似から変わることがある。これは、非バイナリー変数（非バイナリー値）の値をとる遷移重み付け１４により反映されることがある。表されることがあるそのような変動のいくつかの例は以下の通りである。

一例は、好ましい遷移の遷移確率は等しくなくてもよいことである。これによりモデル１３は、ポリマーの配列間に相互関係性があるポリマーを表すことが可能になる。

一例は、好ましくない遷移の少なくとも一部の遷移確率はゼロでなくてもよいことである。これにより、モデル１３は見逃された測定、すなわち、実際のポリマー中のｋマーのうちの１つ（または複数）に依拠している測定はないことを考慮することが可能になる。そのような見逃された測定は、測定システムの問題によって起こり、測定は物理的には行われない、または、例えば、所与のグループが短すぎるもしくは２つのグループが十分分離したレベルではないという理由で、測定値のグループのうちの１つを同定することができない状態検出ステップＳ１などのその後のデータ解析の問題によって起こることもある。

遷移重み付け１４が任意の値を持つことを可能にする一般性にもかかわらず、典型的には、遷移重み付け１４が、起点ｋマーから、最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位である配列を有する目的地ｋマーまでの好ましい遷移の非ゼロの可能性を表し、好ましくない遷移のさらに低い可能性を表すことが事実となるであろう。典型的には、遷移重み付け１４は、前記好ましくない遷移の少なくとも一部の非ゼロの可能性も表すが、その可能性はゼロに近いことがあり、または完全に除外される遷移の一部ではゼロであることもある。

配列中の単一の見逃されたｋマーを可能にするため、遷移重み付け１４は、起点ｋマーから、最初の（ｋ−２）個のポリマー単位が起点ｋマーの最後の（ｋ−２）個のポリマー単位である配列を有する目的地ｋマーまでの好ましくない遷移の非ゼロの可能性を表すことがある。例えば、４種のヌクレオチドからなるポリヌクレオチドのケースで、起点３マーＴＡＣでは、これらはＣから開始するすべての可能な３マーへの遷移である。これらの単一の見逃されたｋマーに対応する遷移を「スキップ（skips）」と定義することができる。

それぞれのｋマーに関して単一測定を含む測定のシリーズ１２を解析するケースでは、次に遷移重み付け１４は、測定１２ごとに遷移の高い可能性を表すことになる。測定の性質に応じて、起点ｋマーから起点ｋマーと同じである目的地ｋマーまでの遷移の可能性はゼロもしくはゼロに近いこともあれば、好ましくない遷移の可能性に類似することもある。

同様に、それぞれのｋマーに関して予め定められた数の測定を含む測定のシリーズ１２を解析するケースでは、次に遷移重み付け１４は、同じｋマーに関する測定１２間の遷移の低いまたはゼロの可能性を表すことがある。遷移重み付け１４を変化させて起点ｋマーと目的地ｋマーが同じｋマーになるようにすることは可能である。これは、例えば、誤検出された状態遷移を可能にする。これら繰り返される同じｋマーに対応する遷移を「ステイ（stays）」と定義することができる。ｋマー中のポリマー単位すべてが同一である、すなわちホモポリマーであるケースでは、好ましい遷移はステイ遷移になると考えられることに我々は注目している。これらのケースでは、ポリマーは１位置移動しているがｋマーは同じままである。

同様に、それぞれのｋマーに関して典型的に複数の測定がある測定のシリーズ１２を解析するケースであるが未知の量であるケース（「スティッキング（sticking）」と呼ばれることがある）では、遷移重み付け１４は、起点ｋマーと目的地ｋマーが同じｋマーになる比較的高い確率を表すことがあり、物理系に応じて、遷移重み付け１４は、いくつかのケースでは、上記の好ましい遷移が、起点ｋマーから最初の（ｋ−１）個のポリマー単位が起点ｋマーの最後の（ｋ−１）個のポリマー単位と同じである目的地ｋマーまでの遷移である確率よりも大きくなることがある。

さらに、状態検出ステップＳ１を使用せずに、入力シグナル１１を解析するケースでは、次にこれは、単に、起点ｋマーと目的地ｋマーが同じｋマーになる比較的高い確率を表すように遷移重み付け１４を適合させることにより達成しうる。これにより、根本的に、同じ解析ステップＳ２を実施することが可能になり、モデル１３の適合は状態検出を暗黙の裡に考慮に入れている。

それぞれのｋマーと関連して、そのｋマーについての測定の所与の値を観測する確率を表す放出重み付け１５が存在する。したがって、図１１における交点Ｓ_ｍ，ｉにより表されるｋマー状態では、放出重み付け１５は、電流測定がサンプリングされる分布を記述する確率密度関数ｇ（Ｘ_ｍ｜Ｓ_ｍ，ｉ）として表されうる。放出重み付け１５が、非バイナリー変数の値を含むことが望ましい。これにより、モデル１３は、一般には簡単なバイナリー形をもたないことがある異なる電流測定の確率を表すことが可能になる。

状態検出ステップＳ１が、それぞれの同定されたグループに関して複数の測定からなる測定のシリーズ１２を導き出すケースでは（例えば、平均および変動）、放出重み付け１５は、そのｋマーについてのそれぞれの種類の測定の所与の値を観測する確率を表す。同様に、登録されているので、それぞれのシリーズ由来のどの測定が対応しており同じｋマーに依拠しているのかが先験的に分かっている測定の複数のシリーズ１２で前記方法が実施されるさらに一般的なケースでは、放出重み付け１５はそのｋマーについてのそれぞれのシリーズの測定の所与の値を観測する確率を再び表す。これらのケースでは、モデル１３は、それぞれのｋマー状態についての複数の測定の分布を記述する複数の次元における確率密度関数として放出重み付け１５を使用して適用することができる。一般に、所与のｋマーについての放出重み付け１５は、測定の確率を反映するいかなる形態でも取りうる。異なるｋマーは、単一モデル１３内での同じ放出分布形態またはパラメータ付け（parameterisation）で放出重み付け１５を有する必要はない。

多くの測定システムでは、ｋマーの測定は、測定される物理的または生物学的特性の拡散によりおよび／または測定誤差によりのいずれかで分散することがある特定の予測される値を有する。これは、適切な分布、例えば、単峰形（unimodal）である分布を有する放出重み付け１５を使用することによりモデル１３にモデル化することができる。

しかし、いくつかの測定システムでは、所与のｋマーについての放出重み付け１５は、多峰形（multimodal）である、例えば、測定システムにおける２つの異なる種類の結合からおよび／またはｋマーが測定システム内で複数の立体構造をとることから物理的に生じることがある。

有利なことに、放出重み付け１５は、可能なすべての測定を観測する非ゼロの可能性を表すことがある。これにより、モデル１３は、外れ値である、所与のｋマーが生み出す思いがけない測定を考慮に入れることが可能になる。例えば、放出重み付け１５確率密度関数を、非ゼロ確率を有する外れ値を可能にする広いサポート上で選択しうる。例えば、単峰形分布のケースでは、ｋマーごとの放出重み付けは、すべての実数に対して非ゼロの重み付けを有するガウス分布またはラプラス分布を有することがある。

放出重み付け１５が恣意的に定義される分布であることを可能にして、外れ値測定の手際の良い取扱いおよび多価放出を有する単一状態のケースを取り扱うことが可能になることは有利でありうる。

放出重み付け１５を経験的に、例えば、下に説明されるトレーニング段階中に決定するのが望ましいことがある。

放出重み付け１５の分布は、測定空間を横断する任意の適切な数のビン（bin）を用いて表すことができる。例えば、下記のケースでは、分布は、データ範囲全体で５００個のビンにより定義される。外れ値測定は、すべてのビンにおいて非ゼロ確率（外れたビンでは低いが）を、データが定義されたビンのうちの１つに収まらない場合は類似の確率を有することにより取り扱うことが可能である。十分な数のビンを定義すれば望ましい分布を近似することができる。

したがって、前記好ましくない遷移のうちの少なくとも一部の非ゼロ可能性を表す遷移重み付け１４の使用および／またはあらゆる可能な測定を観測する非ゼロ可能性を表す放出重み付け１５の使用から特定の利点を導き出しうる。特定の利点は、所与のｋマーについての広い範囲の測定を観測する相対的な可能性に対応する放出重み付けの使用からも導き出しうる。

これらの利点を強調するために、配列を導き出すための簡単な非確率的方法は比較例と見なされる。この比較例では、観測される値の所与の範囲外の測定を生み出すｋマーは無効とされ、見逃された測定（スキップ）に対応する遷移は、例えば、エッジおよび交点を削除することにより図１１における遷移の数を減らして、無効とされる。比較例では、次に、Ｓ_ｉごとに正確に１つの交点を含み、ポリマー単位の根底にある配列に対応するｋマー状態の独自の接続された配列が探索される。しかし、この比較例は恣意的な閾値に頼って無効とされた交点とエッジを同定するので、適切なエッジがグラフ内の存在しないため読み飛ばされた測定のケースではどんな経路も見つけることができない。同様に、外れた測定のケースでは、比較例は、図１１において削除された対応する交点を生じることになり、再びグラフ中を通る適切な経路を確認するのは不可能になる。

これとは対照的に、モデル１３および解析ステップＳ２における確率的または重み付けの方法などの解析技法の使用の特定の利点は、このブレイクダウンのケースを回避することができる点である。別の利点は、複数の可能な経路が存在するケースでは、最も可能性の高い経路、または可能性のある経路のセットを決定することができる点である。

この方法の別の特定の利点は、ホモポリマー、すなわち同一ポリマー単位の配列の検出に関係する。モデルをベースとする解析により、シグナルに寄与するポリマー単位の数に類似する長さまでホモポリマー領域の取扱いが可能になる。例えば、６マー測定は６ポリマー単位長までホモポリマー領域を同定することができるであろう。

解析ステップＳ２の１つの可能な形態は図８に示されており、以下の通りに作動する。

ステップＳ２−１では、ｋマーの推定された配列１８は、測定のシリーズ１２がｋマーの配列により生み出されるというモデル１３により予測される尤度に基づいてモデル１３を参照して推定される。

ステップＳ２−２では、ポリマー単位の推定された配列１６は、ステップＳ２−１において推定されたｋマーの推定された配列１８から推定される。

ステップＳ２−１でもＳ２−２でも、さらに下で考察されるように、それぞれｋマーの推定された配列１８とポリマー単位の推定された配列１６の質を表すクオリティスコアも提供される。

解析ステップＳ２において適用される解析技法は、モデル１３に適している種々の形態をとり、測定のシリーズ１２がポリマー単位の配列により生み出されるというモデル１３により予測される尤度に基づいてポリマー中のポリマー単位の推定された配列１６を提供しうる。例えば、モデルがＨＭＭであるケースでは、解析技法は、ステップＳ２−１において、いかなる公知のアルゴリズムでも、例えば、フォワードバックワードアルゴリズムまたはビタビ（Viterbi）アルゴリズムを使用してもよい。そのようなアルゴリズムは、一般に、状態の配列を通じたあらゆる可能な経路の尤度を力任せに虱潰しに計算するのを回避し、代わりに、尤度に基づいて簡略化された方法を使用して状態配列を同定する。

一代案では、ステップＳ２−１は、測定のシリーズが個々のｋマーにより生み出されるというモデルにより予測される尤度に基づいて、配列の個々のｋマーまたは配列中のｋマーごとの複数のｋマー推定値を推定することによりｋマーの配列１８を同定しうる。例として、解析技法がステップＳ２−１においてフォワードバックワードアルゴリズムを使用する場合、解析技法は、測定のシリーズが個々のｋマーにより生み出されるというモデルにより予測される尤度に基づいて、ｋマーの配列１８を推定する。フォワードバックワードアルゴリズムは当技術分野では周知である。フォワード部分では、所与のｋマーで終わる全配列の全体の尤度は遷移および放出重み付けを使用して最初から最後の測定まで再帰的に前向きに計算される。バックワード部分は、類似する形態でしかし最後の測定からずっと最初まで働く。これらのフォワードおよびバックワード確率は組み合わされ、データの全体の尤度と併せてそれぞれの測定が所与のｋマー由来である確率を計算する。

フォワード−バックワード確率から、配列１８におけるそれぞれのｋマーの推定値が導き出される。これは、それぞれ個々のｋマーと関連する尤度に基づいている。１つの簡単なアプローチは、フォワード−バックワード確率がそれぞれの測定でのｋマーの相対的尤度を示しているので、それぞれの測定で最も可能性の高いｋマーを取ることである。

ステップＳ２−１では、測定のシリーズ１２が個々のｋマーを含む配列により生み出されるというモデル１３により予測される尤度を表すクオリティスコアも配列１８中の個々のｋマーに関して導き出される。これはステップＳ２−１において実施される解析から得られ、追加の有用な情報を提供する。

もう１つの代案では、ステップＳ２−１は、測定のシリーズがｋマーの全体配列により生み出されるというモデルにより予測される尤度に基づいて、全体配列または複数の全体配列を推定することによりｋマーの配列１８を同定しうる。別の例として、解析技法がステップＳ２−１においてビタビアルゴリズムを使用する場合、解析技法は、測定のシリーズがｋマーの全体配列により生み出されるというモデルにより予測される尤度に基づいてｋマーの配列１８を推定する。ビタビアルゴリズムは当技術分野では周知である。

ステップＳ２−１では、測定のシリーズ１２がｋマーの全体配列により生み出されるというモデル１３により予測される尤度を表すクオリティスコアも配列１８中の個々のｋマーに関して導き出される。これはステップＳ２−１において実施される解析から得られ、追加の有用な情報を提供する。

別の代案として、ステップＳ２−１は、測定のシリーズがｋマーの全体配列により生み出されるというモデルにより予測される尤度に基づいてｋマーの全体配列を同定する第１段階および第１段階の結果から前記配列の個々のｋマーまたは前記配列中のｋマーごとの複数のｋマー推定値を推定することによりｋマーの配列１８を同定する第２段階を含む、２つの段階に分けてもよい。例として、この代案は、力任せの虱潰し計算を使用しうる。

ステップＳ２−２では、ポリマー単位の推定された配列１６は、任意の適切な技法を使用してステップＳ２−１において推定されたｋマーの推定された配列１８から推定される。１つの単刀直入なアプローチは、ｋマーをポリマー単位と１対１の関係に関連付け、関連するｋマーから単一のポリマー単位を取り出すだけである。さらに複雑なアプローチは、それぞれの所与のポリマー単位を含有する配列１８中の推定されたｋマーのグループからの情報の組合せを使用してそれぞれのポリマー単位を推定する。例えば、ポリマー単位はその推定されたｋマーのうち最も確実なものから取り出してもよい。それぞれのポリマー単位は、ステップＳ２−１における推定されたｋマー配列に関して導き出されたクオリティスコア１７を利用して推定することができる。

ステップＳ２−２では、測定のシリーズ１２がポリマー単位を含む配列により生み出されるというモデル１３により予測される尤度を表すクオリティスコアも配列１６中のそれぞれのポリマー単位に関して導き出される。これは、例えば、それぞれのｋマーおよび関連するポリマー単位の相対的確率に基づいて、ステップＳ２−２において実施される解析から得られ、追加の有用な情報を提供する。

解析ステップＳ２における上記技法は限定的ではない。確率的または他の解析技法を使用するモデルを利用する多くの方法が存在する。ｋマーの全体配列、個々のｋマーまたは根底にあるポリマー単位を推定するプロセスは、特定の適用に適合させることが可能である。いかなる「硬い」ｋマー配列、ｋマーまたはポリマー単位コールも作る必要はない。あらゆるｋマー配列、または可能性の高いｋマー配列のサブセットを考慮することができる。ｋマー配列と関連するｋマーもしくはｋマーのセットまたは特定のｋマー配列とは関係がないと見なされるｋマーもしくはｋマーのセット、例えば、すべてのｋマー配列にわたる加重和を考慮することができる。ｋマーと関連するポリマー単位もしくはポリマー単位のセットまたは特定のｋマーとは関係がないと見なされるポリマー単位もしくはポリマー単位のセット、例えば、すべてのｋマーにわたる加重和、ｋマー配列もしくはｋマー配列のセットに依拠しているｋマーまたはｋマー配列もしくはｋマー配列のセットとは無関係なｋマーを考慮することができる。

例として、３マーポリヌクレオチド系を考慮しうる。可能性の高い塩基推定値のセットを導き出すいくつかの方法がある。第１の代案は、最も可能性の高い経路を考慮し（ビタビアルゴリズム）、その経路と関連する３マー状態のセットを導き出し、ｋマー由来の１つの塩基、例えば、中央の塩基を塩基コールとして使用することである。第２の代案は、すべての経路を考慮してそれぞれの地点で最も可能性の高いｋマーを導き出すことである（フォワード−バックワードアルゴリズム）。次に、最も可能性の高いｋマー由来の１つの塩基（例えば、中央の塩基）を塩基推定値とすることもできるだろう。ｋマーから塩基推定値を導き出す別の方法は、塩基のうちの１つ（例えば、中央の塩基）の寄与を考慮し最も可能性の高い塩基を推定値として取りすべてのｋマーにわたり合計することになると考えられる。ｋマーから塩基推定値を導き出す別の方法は、すべてのｋマーにおけるすべての位置からの寄与を合計してそれぞれの位置で最も可能性の高い推定値を決定することになると考えられる。

同様に、解析ステップＳ２は、ｋマーの複数の配列１８および／またはポリマー単位の複数の配列１６を推定しうる。このケースでは、ｋマーの複数の配列１８のそれぞれおよび／またはポリマー単位の複数の配列１６のそれぞれに関してクオリティスコアを導き出しうる。このようにして、解析ステップＳ２は、可能性がさらに低い配列に関する情報で、にもかかわらず一部の適用において有用であることもある情報を提供する。

上記説明は、遷移重み付け１４および放出重み付け１５が確率であり、解析ステップＳ２がモデル１３を参照する確率的技法を使用するＨＭＭであるモデル１３に関して与えられている。しかし、遷移重み付け１４および／または放出重み付け１５が確率ではなくある他の方法で遷移または測定の可能性を表す枠組みをモデル１３が使用することは代案としては可能である。このケースでは、解析ステップＳ２は、測定のシリーズがポリマー単位の配列により生み出されるというモデル１３により予測される尤度に基づいている確率的技法以外の解析技法を使用しうる。解析ステップＳ２により使用される解析技法は、尤度関数を明確に使用しうるが、一般にはこれは不可欠ではない。したがって、本発明の文脈では、用語「尤度」は、計算または正式な尤度関数の使用を必要とせずに、測定のシリーズがポリマー単位の配列により生み出される可能性を考慮に入れるという一般的意味で使用される。

例えば、遷移重み付け１４および／または放出重み付け１５は、遷移または放出の可能性を表すが、確率ではなく、したがって、例えば、合計が１になるように制約されてはいないコスト（または距離）により表しうる。このケースでは、解析ステップＳ２は解析を、例えば、オペレーションズリサーチにおいて広く見られるように、最小コスト経路または最小経路問題として取り扱う解析技法を使用しうる。ダイクストラアルゴリズムなどの標準法（または他のさらに効率的なアルゴリズム）を解決のために使用することができる。

モデル１３が、鈍いリーダーヘッドシステムからのデータをモデル化し解析するのに使用されるＨＭＭである特定の例がここで考察されることになる。ここでは、入力データ１１は先ず既に記載された状態検出ステップＳ１により処理される。簡単にするために、しかし制限なく、この特定の例は、４種の可能な塩基を有し、そのため６４の可能なｋマーが存在するポリヌクレオチドについての３マーモデルに関係している。根底にあるモデル１３および状態を参照して要点を説明することができるシミュレーションされたケースが提示される。

このシミュレーションされたケースでは、３マー電流レベルが無作為に選択されるので、６４のｋマー状態の放出重み付け１５を最も簡単に記述するのにも６４の係数が必要である。測定からｋマーの根底にある配列を決定するのは、記載された通りにモデルベースの解析により達成される。

図１２は、ｋマーごとに、測定の最も可能性の高い値を示している。したがって、これらの値は、それぞれのｋマーの放出重み付け１５の分布の中心値でもある。図１２では、ｋマー状態インデックスは、Ｇ、Ｔ、Ａ、Ｃの順に順次続き、すなわち、状態０＝「ＧＧＧ」、状態１＝「ＧＧＴ」、．．．状態６２＝「ＣＣＡ」、状態６３＝「ＣＣＣ」である。ｋマー状態インデックスは解析中に使用され、最終ステップとして「塩基スペース（base space）」に再び変換される。

所与の配列からの測定は、既に記載されている係数を使用してシミュレーションされる。例えば、配列ＡＣＴＧＴＣＡＧは３マー、ＡＣＴ、ＣＴＧ、ＴＧＴ、ＧＴＣ、ＴＣＡ、ＣＡＧで構成されている。これらは状態インデックス４５、５２、１７、７、３０、５６に対応し、このインデックスは６８．５、４６．５、９４．９、５１．３、１９．５、５２．１の予測される測定を与える。シミュレーションされた測定は、入力シグナル１２として図１３に、状態検出ステップＳ１により生み出される測定のシリーズ１２として図１４に図示されている。

実際には、行われたどんな測定も、その測定に付随するエラーがある。シミュレーションのケースでは、予測された測定値にノイズを加えることによりこれは考慮される。

測定を見落とすまたは偽陽性の測定を挿入する可能性もある。これらは、ここで説明されることになる遷移マトリックスにおいて説明することができる。

シミュレーションのケースについての遷移重み付け１４の遷移マトリックスは、ここで考慮されることになる。

測定のシリーズ１２および放出重み付け１５のセットを考慮して、解析ステップＳ２は根底にある配列の推定値を決定する。概念的には、これは、観測された配列が比較される対象のすべての可能な遷移をモデル化する解析ステップＳ２と見なしてもよい（が、実際、解析ステップＳ２はこれを必要としないもっと効率的なアルゴリズムを使用することもある）。例えば、考慮中の３マーのケースでは、６４の状態のそれぞれが他の４つの状態への好ましい遷移を有する。

図１５は、好ましい遷移に対する遷移重み付け１４がそれぞれ０．２５であり、好ましくない遷移に対する遷移重み付け１４がそれぞれゼロであるシミュレーションされたモデルについての遷移重み付け１４の遷移マトリックスを図示している。例えば、起点状態０（ＧＧＧ）は、等しい確率で状態、０（ＧＧＧ）、１（ＧＧＴ）、２（ＧＧＡ）または３（ＧＧＣ）に遷移することが可能であると見ることができる。

図１６は、見逃された測定を表す、すなわち、遷移が読み飛ばされている好ましくない遷移に対する非ゼロの遷移重み付け１４を可能にすることにより、図１５のシミュレーションされたモデルから修正されたシミュレーションされたモデルについての遷移重み付け１４の遷移マトリックスのより複雑なケースを図示している。一般論として、遷移マトリックスは、根底にある測定システムをモデル化するのに必要であるように、恣意的に複雑になることがある。

測定のシリーズ１２で作動するケースでは、我々が状態検出Ｓ１を実施した場合、所与の起点ｋマーから離れる遷移確率は典型的に高く、要するに１に近づく。図１５の第１の例では、遷移マトリックスは、好ましい「遷移」のうちの１つが同じｋマーへの遷移である４つのホモポリマーのケースを除けば、遷移を必要とする。任意の状態からの４つの好ましい遷移のそれぞれの確率は０．２５である。このマトリックスは、他の適切な緩和が行われなければ、「実世界」のデータを取り扱うこと、例えば、放出重み付け１５における外れ値取扱い、ができる可能性はない。

しかし、非ゼロの遷移は、それを扱う必要があるまたは起こる可能性があるいかなるケースにも可能にすることができる。図１６の第２の例では、好ましい遷移の確率は０．２５未満であり、残りはステイおよびスキップ確率からなる。恣意的なレベルの複雑さまで、複数のスキップも類似する形態で許される。

遷移確率は、ｋマー間の遷移を測定することができる平易さを考慮に入れるように調整することが可能である。例えば、互いに非常に近い２つの連続するｋマーからのシグナルのケースでは、状態検出ステップＳ１がこの遷移を見逃すことは可能である。このケースでは、これら２つのｋマー間の遷移マトリックスエレメントは、第２のｋマーを読み飛ばす方向へ重み付けをしてもよい。

マトリックスは、所与の試料中の任意の配列バイアスを考慮に入れるように調整しうる。

上記の例では、放出および遷移重み付けは一定の値で固定されているが、これは不可欠ではない。代案として、放出重み付けおよび／または遷移重み付けは、おそらくプロセスについての追加の情報に導かれて、解析される測定値シリーズの異なる部分について変化させてもよい。例として、「ステイ」としての解釈を有する遷移重み付けのマトリックスのエレメントを、特定の事象（）がポリマーの実際の遷移を反映する信頼度に応じて調整することができるだろう。さらなる例として、放出重み付けを、測定デバイスのバックグランドノイズにおける系統的ドリフトまたは印加された電圧に加えられる変化を反映するように調整することができるだろう。重み付けに対する調整の範囲はこれらの例に限定されない。

上記の例では、それぞれのｋマーが単回表示されているが、これは不可欠ではない。代案として、モデルはｋマーの一部またはすべての複数回別個に表示されてもよく、したがって、所与のｋマーに関して、遷移および／または放出重み付けのセットが複数あってもよい。ここでの遷移重み付けは別個の起点ｋマーと別個の目的地ｋマー間であってよく、したがって、それぞれの起点−目的地対は、それぞれのｋマーの別個の表示の数に応じて、複数の重み付けがあってもよい。これら別個の表示の多くの可能な解釈の１つは、ｋマーが、直接観測することが可能ではないシステムのある挙動、例えば、ナノポア中を通る移行中にポリマーが取る可能性がある異なる立体構造または移行挙動の異なる動態を示すラベルをタグ付けされていることである。

状態検出ステップＳ１を実施せずに生の入力シグナル１１で作動するモデル１３では、複数の測定のグループが、グループにおける測定の数についての先験的な知識なしで同じｋマーに依拠している測定の入力シリーズに前記方法は直接適用される。このケースでは、非常に類似する技法であるが、所与の起点ｋマー状態から離れる遷移確率の合計がここでは１よりはるかに少ないという点で著しく調整した技法を、モデル１３に適用することができる。例えば、平均してシステムが同じｋマーで１００の測定を費やすとすれば、遷移マトリックスにおける対角線上の確率（遷移を表さないまたは起点ｋマーと目的地ｋマーが同じｋマーである遷移を表す）は０．９９になり、０．０１のスプリットがすべてのその他の好ましい遷移と好ましくない遷移の間にあることになる。好ましい遷移のセットは、状態検出ケースについての遷移に類似していることがある。

放出重み付け１５を考慮して、図１７から１９は、それぞれ、ガウス、三角および四角分布であるシミュレーションされた係数についての放出分布を示すが、どんな恣意的な分布（非パラメータ分布を含む）もこの様式で定義することができる。

ノイズに対するこれらの方法の堅牢さを実証するため、ノイズ摂動がシミュレーションされた測定に加算される。この例では、標準偏差５ｐＡのガウス分布からサンプリングされたランダムノイズが図１２に示される予測されるｋマー測定に加算される。

図２０は、図１２に示される予測される測定と比べたシミュレーションされた測定（測定のシリーズ１２）を示しており、見ることができる加算されたノイズが厳密であることを図示している。

遷移重み付けの適切な遷移マトリックス、例えば、図１６に示されるマトリックスおよび放出重み付け１５についての適切な分布、このケースでは、ガウス分布を用いて、モデル１３が適用される。フォワード−バックワードアルゴリズムが解析技法として使用されて、測定のシリーズにおけるそれぞれの点で最も可能性の高いｋマーを推定する。推定されたｋマーコールは、図２１に示されているように、既知のｋマー配列に対して比較される。この厳密なケースでも、大多数の状態が正しく推定されていることが分かる。

配列中のｋマーに関連する失われた測定に対する堅牢さはここで説明される。このケースでは、ノイズを予測されるｋマー測定に加算することに加えて（この例では、１ｐＡ標準偏差を有するノイズの厳密ではないケースを使用する）、このケースでは、０．１の削除の確率で、ｋマー測定がデータからも無作為に削除される測定のシリーズ１２がシミュレーションされる。図２２は、図１２に示されている予測された測定と比べたシミュレーションされた測定（測定のシリーズ１２）を示している。図２２では、円で囲まれた失われたｋマー状態を見ることができる。

再び、遷移重み付けの適切な遷移マトリックス、このケースでは図１５および１６に示される両方のマトリックスおよび放出重み付け１５についての適切な分布、このケースでは、ガウス分布を用いて、予測されたｋマー測定のモデル１３が適用される。フォワード−バックワードアルゴリズムが解析技法として使用されて、測定のシリーズ１２におけるそれぞれの点で最も可能性の高いｋマーを推定する。

推定されたｋマーコールは、図１５および１６の遷移マトリックスについてそれぞれ図２３および２４に示されているように、既知のｋマー配列に対して比較される。ここでは、図２３と比べた場合、図２４では、モデル遷移におけるスキップを可能にすることにより正確にコールされたｋマーの数に改善がみられる。失われたｋマー測定値が高信頼度の推定値に取り囲まれているケースでは、失われたｋマーは周囲のｋマーから推定することが可能である。これとは対照的に、スキップが許されないケースでは、失われたデータは、解析がｋマーのシリーズの中を通る経路を見つけるためにゼロには達しない分布を有する放出重み付け１５により収容される。放出分布における非ゼロのバックグランドは次のセクションでさらに考察される。

配列中の所与のｋマーと関連がある外れた測定に対する堅牢さはここで説明される。遷移重み付け１４が読み飛ばされた状態（すなわち、図１５の遷移マトリックスを用いて）を許さない失われた測定に関する以前の説明では、解析がｋマーの配列中を通る経路（非常に可能性が低い経路にもかかわらず）を見つけることができるようにゼロに達しない分布を有する放出重み付け１５を使用する必要があった。すべての測定値について非ゼロの値を有する放出重み付け１５の利点は、四角放出分布の単純なケースにおいて例証される。この例は、標準偏差５ｐＡを有するノイズが加算される図２０に示される測定のシミュレーションされたシリーズ１２を使用する。

再び、図１５に示されるように、好ましくない遷移が許されない遷移重み付け１４の遷移マトリックスを用いて、および放出重み付け１５についての２つの異なる分布を用いて、予測されたｋマー測定のモデル１３がこのケースでは適用される。フォワードバックワードアルゴリズムが解析技法として使用されて、測定のシリーズ１２におけるそれぞれの点で最も可能性の高いｋマーを推定する。

第１のケースでは、放出重み付け１５は、図２５に示される小非ゼロバックグランド（このケースでは１×１０^−１０）の四角分布を有し、これについては図２６において、推定されたｋマーコールは既知のｋマー配列に対して比較される。

第２のケースでは、放出重み付け１５は図２７に示されるゼロバックグランドの四角分布を有し、これについては図２８において、推定されたｋマーコールが既知のｋマー配列に対して比較される。

放出重み付け１５の分布においてゼロバックグランドの第２のケースでは、それらの分布の幅が狭すぎる放出分布ではｋマー配列を通る経路は存在しない。この例では、図２７において示されるように、解析が測定の中を通る経路を見つけることができるように幅＋／−１４ｐＡの放出分布を使用してきた。このケースでは、それぞれが大きな数の正確な状態を有する少数の経路が存在するよりは、多くの不正確にコールされた状態を含有する多数の経路が存在する。この例についてのｋマーコールのセットは図２８に示されている。

図２５に示されるように、バックグランドにおいて小非ゼロ放出が許される第１のケースでは、はるかに狭い分布を許容することが可能であり、図２８よりも良好な結果を与える図２７に示されるように、さらに大きな数のｋマー状態を正確に推定することが可能になる。

さらに、この例は、図２７および２８に示される四角分布の使用よりも良好な結果を提供する図２０および２１に示される例について使用されるガウス放出と四角分布ケースを比較することにより確率的方法の利点を示している。

モデル１３のトレーニング、すなわち、所与の測定システムについての放出重み付け１５の誘導がここで考察されることになる。

上記シミュレーションとは対照的に、実際の測定システムでは、それぞれのｋマーからの個々の測定は前もって分かってはいないが、トレーニングセットから導き出すことができる。一般論として、これは既知のポリマーから測定を行い、それ自体がＨＭＭにとって従来法であるトレーニング技法を使用することを含む。

これらのトレーニング法では、特定種類の配列、すなわち、所与のｋについてすべてのｋマーを含有する最小長配列であるド・ブラン（deBruijn）配列を利用しうる。ド・ブラン配列を使用するのは必要とされる実験数を最小限に抑えるための効率的方法である。

ポリヌクレオチドを測定するのに使用されるナノポアを含む測定システムについて２つのトレーニング法が記載されている。第１の方法は、ビオチン／ストレプトアビジン系によってナノポア内の特定の位置に保持された「静的」ＤＮＡ鎖からの測定を使用する。第２の方法は、ナノポア中を通って移行されるＤＮＡ鎖からの測定を使用し、ｋマー推定のために記載された枠組みに類似する確率的枠組みを利用することにより係数を推定するまたは「訓練する」。

第１の静的トレーニング法は以下の通りに実施される。

これらの実験は、Stoddart D et al.、Proc Natl Acad Sci, 12;106(19):7702-7に記載されている方法に類似するやり方でビオチン分子を使用してＤＮＡ鎖をストレプトアビジン「アンカー」に結合させた。このシステムでは、ｋの値は３である。ＤＮＡ鎖は、４００ｍＭＫＣｌ中でＭＳ−（Ｂ２）８を使用するｋ＝３ド・ブラン配列（配列番号３）を表す。前記鎖は、付加電位下でナノポア中に捕捉され、その電流が記録される。下の表１に収載されているように、実験は配列を１ヌクレオチドずつ前進させている一連のＤＮＡ鎖を用いて繰り返すことが可能である。このようにして、下の表に収載されているように、移動している鎖から予測される電流レベルに対応する１８０ｍＶなどの特定の付加電位での電流レベルの測定が得られた。
配列番号３（ｋ３ド・ブラン）：
ＡＴＡＡＧＡＡＣＡＴＴＡＴＧＡＴＣＡＧＴＡＧＧＡＧＣＡＣＴＡＣＧＡＣＣＴＴＴＧＴＴＣＴＧＧＴＧＣＴＣＧＴＣＣＧＧＧＣＧＣＣＣＡＡＡＴ

それぞれ個々の鎖からのデータは順次プロットされて図２９に示される電流状態の地図（散布図）を生み出し、それぞれの点はＳＤ０１（左）からＳＤ６４（右）までのＤＮＡ鎖を表す。データは、ポリＴ鎖からのふれとしてプロットされている。

これらの測定を使用して、図２９に示される測定を中心とするそれぞれのｋマーの分布として放出重み付け１５を導き出すことができる。ガウス分布は、図２９に示される測定から得られる標準偏差を用いて使用しうる。遷移重み付け１４は手動で選択しうる。

第２の動的トレーニング技法は以下の通りに実施される。

静的鎖トレーニングは多くの利点を提供するが、骨が折れることがあり、一部では測定システムは完全な塩基配列決定システムを正確に反映しないこともある。解析ステップＳ２において使用する枠組みに類似する枠組み（および、したがって、類似するアルゴリズム）を利用することにより、モデル１３を別法で訓練することが可能である。このそのような１つの実行はここで説明されるが、多くのバリエーションを適用することができる。説明されるプロセスは反復性のプロセスなので、始めるのに用いるパラメータの合理的推定値（ベイズ理論用語で、プライアー（prior））があるのは有用である。３マー静的係数は、より高度なｋマーモデルを訓練するための合理的開始点を提供する。

トレーニングが適用されるので、状態コーリングモデルよりもかなり柔軟性が少ないモデルが使用される。トレーニング鎖（複数可）の配列は既知であるので、大きな制約を適用することができる。すべてのｋマー間の認められた遷移をモデル化するよりも、我々のトレーニング配列により認められた遷移のみがモデル化される。トレーニングをさらに制約するため、トレーニング鎖中のそれぞれの位置は独立してモデル化され、直後の状態への遷移のみが好ましい。したがって、これを「強制的経路（forced path）」モデルと呼ぶことができるであろう。

例えば、およそ４００単位のポリマーであれば、そのポリマー中の位置ごとの別々の状態インデックスを定義することができる。次に、図３０および３１に示されるように、ポリマー内での遷移を許す遷移マトリックスが構築され、図３０が４０８のｋマー状態についての遷移マトリックスを示し、図３１が最初の１０の遷移重み付けの大写しを示している。

上記のモデル１３における遷移重み付け１４のｋマー推定遷移マトリックスの場合と同じように、これが現実世界のシステムであるという事実を考慮するように柔軟性を加えることが可能である。この例では、遷移がないこと（または、起点状態インデックスと目的地状態インデックスが同じ状態である遷移）が認められ、状態を読み飛ばす好ましくない遷移について非ゼロの確率を使用することにより見落とされた測定が収容される。確率的（または、重み付けされた）枠組みの利点は、測定システムの既知の人為産物を遷移重み付けおよび／または放出重み付けにおいて具体的に取り扱うことができる点である。

放出重み付けのトレーニングがここで説明される。放出重み付けの分布は、上記解析ステップＳ２のために使用された分布と類似していてもよい。しかし、この例では、ポリマー中のそれぞれの位置が別々に扱われるために、放出分布は位置ごとに定義される。図３２は、上記の静的トレーニングプロセスから導かれる６４ｋマーモデルの例を示している。図３３は、およそ４００の状態の配列に移し返られた図３２の６４ｋマーモデルの例を示している。既に記載されたように、外れ値データは、あらゆる可能な測定値について非ゼロの確率を有する放出重み付けの分布内に収容することができる。

トレーニングプロセスは図３４に示されており、ここで説明される。トレーニングプロセスは反復性であり、先ず、上記のモデル２０の最初の推定値をモデル２１の推定値として使用する。トレーニングプロセスは測定２２も使用する。

モデル２１の推定値および測定２２を考慮すれば、ステップＳ３において、広い範囲の既知のアルゴリズムのうちのいずれか１つを適用することにより、測定２２がモデルにどのようにして適合するのかが計算される。ＨＭＭのケースでは、１つの適切なアルゴリズムはフォワード−バックワードアルゴリズムである。

次に、ステップＳ４では、ステップＳ３において計算されたモデルに適合するデータを使用して、どんな根底にある状態放出分布がその適合下にあるかを推定し、ｋマー状態中心を再推定し、それによってモデル２１の推定値を更新する。

ステップＳ５では、トレーニングプロセスが収束したかどうか、すなわち、ステップＳ４からのモデル２１の更新された推定値が以前の繰り返しから著しく変化していないかどうかが決定される。収束していなければ、前記プロセスはモデル２１の更新された推定値を使用して繰り返される。

そのような繰り返しは、ステップＳ５において収束が決定されるまで行われる。この時点で、モデル２１の更新された推定値は測定２２の記述に収束しており、出力モデル２３として出力される。

これはトレーニングプロセスのための機械学習アルゴリズムの１つの可能な実行であるが、当技術分野で公知の他の機械学習方法を使用することもできるであろう。

図６の解析方法が図９の実験的に決定された入力シグナル１１に適用される例がここで説明されることになる。上記のように、状態検出ステップＳ１により導き出される測定のシリーズ１２は図１０に示されている。

ポリマーはポリヌクレオチドであり、測定を記述するのに使用されるｋマーモデルは３マーである。

モデル１３は、図１６に示され上に記載されている遷移重み付け１４を含む。

前記モデルは、上記の図３４のトレーニングプロセスを使用して決定された放出重み付け１５を含む。図３５は、小非ゼロバックグランドを有するガウス分布である結果として得られた放出重み付け１５を示している。

図３６は、モデル１３から予測される測定値を用いて、いくつかの実験にわたり集計された状態データのセクションからの電流測定のオーバーレイを示している。

図３７は、既知の配列（参照）と解析ステップＳ２により推定されたｋマー状態の推定された配列（コール）の状態スペースアライメントを示している。正確に推定されたｋマー状態は大きな点として示されている。見ることができるように、ｋマー状態の良好な推定が与えられている。

図３８は、解析ステップＳ２により推定され、実際の配列と整列させて示されるヌクレオチドの推定された配列１６を示している。正確なｋマー状態推定値は「＃」として図示されている（ｋマー状態を直接塩基と関連付けてきたので、これを示すことができる）。正確な塩基推定値であるが不正確なｋマー状態推定値は「＊」として図示されている。

上記説明は、前記方法が単一入力シグナル１１および測定の単一シリーズ１２に基づいているケースに関係している。

代わりに、本発明の第一の態様は、それぞれが同じポリマーに関係している測定の複数のシリーズを使用してもよい。この文脈では、「同じ」ポリマーとは、同じ正体または組成を有するポリマーであり、物理的に同じポリマーまたは同じ正体を有する物理的に異なるポリマーである。測定の複数のシリーズは同じポリマーで行ってもよいし、関連する配列を有する異なるポリマーで行ってもよい。

測定の複数のシリーズはそれぞれが同じ技法で行ってもよいし、異なる技法で行ってもよい。測定の複数のシリーズは同じ測定システムで行ってもよいし、異なる測定システムで行ってもよい。

測定の複数のシリーズは、同じポリマーの同じ領域で同時に行われる異なる種類、例えば、同時に行われる膜貫通電流測定とＦＥＴ測定であっても、または同時に行われる光学的測定と電気的測定であってもよい（Heron AJ et al.、J Am Chem Soc. 2009;131(5):1652-3）。所与のポリマーまたはその領域を１回よりも多くポア中を通って移行させることにより複数の測定を次々に行うことも可能である。これらの測定は同じ測定でもまたは異なる測定でもよく、同じ条件下でもまたは異なる条件下でも行うことができる。

測定の複数のシリーズは関係のあるポリマーの領域で行いうる。このケースでは、測定のシリーズは、関係のある配列を有する別々のポリマーの測定でもよくまたは関係のある配列を有する同じポリマーの異なる領域の測定でもよい。後者の例として、関係が配列が相補的であるという場合に、ポリヌクレオチドについて提唱された技法が使用されることもある。このケースでは、センス鎖とアンチセンス鎖が、ポリヌクレオチド結合タンパク質を使用してまたはポリヌクレオチド試料調製を介して順次読み取られうる。特許仮出願第６１／５１１４３６号またはＷＯ−２０１０／０８６６２２に提示されているいかなる方法でも使用してセンス鎖とアンチセンス鎖を読み取らせてもよい。

この例として、図６に図示されている方法は、状態検出ステップＳ１において処理されうる複数の入力シグナル１１に適用して、測定の複数のシリーズ１２を提供しもよい。このケースでは、上に詳細に記載されているように、それぞれの入力シグナル１１および測定のシリーズ１２は、同じポリマーの同じ領域の測定であることにより、または同じポリマーもしくは異なるポリマーの異なっているが関係のある領域（例えば、ＤＮＡ鎖および相補的ＤＮＡ鎖）の測定であることによりのいずれかで前記ポリマーと関係している。

このケースでは、解析方法は基本的に同じであるが、測定のそれぞれのシリーズ１２からの測定は、複数のそれぞれの次元で配置されているステップＳ２における解析技法により扱われる。

これは、解析ステップＳ２においてそれぞれの入力シグナル１１と測定のシリーズ１２を別々に処理するよりはかなり有利である。解析のこの初期段階で測定のシリーズ１２からの情報を組み合わせることにより、根底にあるポリマー単位のより正確な推定を行うことが可能である。解析プロセス初期の情報を組み合わせると、解析プロセスの終了時に測定のシリーズ１２と組合せを独立に処理するよりも正確な出力が可能になる。これは、根底にあるポリマー関係による以外に、測定のシリーズ１２が関係があるといういかなる要件もなしで達成されうる。確率的技法または他の解析技法でも、解析が、測定の関係のあるシリーズ１２の位置合わせまたはアライメントを推定することが可能になる。測定のどんなシリーズでも他の任意の測定のシリーズに位置合わせをすることは先験的に分かっていることもあれば分かっていないこともあることに注目するのは重要である。位置合わせがないケースでは、シリーズ内のそれぞれの測定は別のシリーズからの測定と先験的に対になっていない。

数学的に言えば、２つのそれぞれの次元に配置されている測定のシリーズ１２を扱う解析ステップＳ２の拡張は単刀直入である。放出重み付け１５は複数の次元で起こり、測定のシリーズ１２ごとに１つの次元である。方法が、登録されている測定の複数のシリーズ１２で実施され、したがってそれぞれのシリーズからのどの測定が対応しており同じｋマーに依拠しているのかが先験的に分かっているケースでは、モデル１３を、放出重み付け１５をｋマー状態ごとの複数の測定の分布を記述している確率密度関数として複数の次元で使用して適用しうる。

これとは対照的に、方法が登録されていない複数のシリーズで実施され、したがってそれぞれのシリーズからのどの測定値が対応しており同じｋマーに依拠しているのかが先験的に分かっていないケースでは、前記方法は、以下の通りに、測定の複数のシリーズを、複数のそれぞれの次元で配置された全体として扱う。

放出分布のそれぞれの次元は、スキップ状態で増大され、多次元重みはその発生の可能性を表す。個々のシリーズでスキップが起こる場合、放出分布は対応する次元での測定値よりはむしろ「スキップ」シグナル状態を放出するように取られる。これら「スキップ」状態は観測可能ではなく、これらの状態の未知の数および位置が位置合わせ問題を引き起こす。解析ステップＳ２は、測定の複数のシリーズ１２がｋマーおよびポリマー単位の異なる配列から導き出される尤度およびこれらの測定間の異なる位置合わせではそれぞれの位置合わせが放出分布において潜在している可能性に基づいて実施される。

登録されたケースでも非登録のケースでも、測定の複数のシリーズ１２が同じ特性（例えば、同じポリマーの繰返し測定について）の等しい測定である場合、それぞれのシリーズ１２に関する放出重み付け１５は同じであってよい。測定の複数のシリーズ１２が異なる特性（例えば、同じポリマーの異なる測定について、またはポリマーの異なっているが関係のある領域の測定について）の測定である場合、それぞれのシリーズ１２に関する放出重み付け１５は異なっていてもよい。

上記のグラフィックモデルＢを考慮すると、概念的にはモデルは、Ｘ_ｉがここでは単一の値というよりむしろ値のベクトルを表すこと以外は同じである。ＨＭＭのケースでは、１次元確率密度関数ｇ（）からの状態放出値というよりはむしろ、値は複数次元密度関数から放出され、例えば、センス鎖およびアンチセンス鎖の測定のケースでは、Ｘ_ｉは電流ペア（Ｘ_ｉｓ，Ｘ_ｉａ）を放出し、Ｘ_ｉｓはセンス鎖からの電流読取りでありＸ_ｉａは相補的ｋマーに対するアンチセンス鎖からの読みである。この放出された電流ペアは、観測されないスキップ状態ならびに実際の電流測定を含有していてもよい。基本的な１次元ケースと同じように、外れ値および失われたデータまたは読み飛ばされた状態をモデル化することができる。

有利なことに、ポリマーのうちの１つでのスキップは関係するポリマーからの情報を使用して埋めることができる。例えば、センス−アンチセンスデータに関しては、２次元密度ｇ（）がスキップを非ゼロ確率で１次元に放出し、その間電流をもう一方の次元からサンプリングすることを可能にすることにより、スキップをアンチセンスではなくセンスにおいて（またはその逆）放出してもよく、したがって、Ｘ_１は形式（Ｘ_１ｓ，Ｘ_１ａ）、（Ｘ_１ｓ，−）または（−，Ｘ_１ａ）（−は観測されないスキップを表す）の電流ペアを放出しうる。さらに、両方のポリマーにおけるスキップもモデル化し、１Ｄケースにおけるのと同じように補正することができる。ここで、測定の１つのシリーズにおける「ステイ」も、その他のものについてのスキップ状態を放出することによりモデル化することができる。

前記１次元ＨＭＭからの利点はすべてこの複数次元ＨＭＭに移動する。同様に、２つの別々の１次元ＨＭＭを実行し次にアライメント技法を通じて底空間で整列させることよりも利点がある。

単なる例として、複数の次元で配置された測定にビタビアルゴリズムを適用することが考察される。ビタビアルゴリズムは当技術分野では周知である。１次元ＨＭＭでは、最も可能性の高い経路がそれぞれの可能なｋマーＫで終わる尤度Ｌ_ｉ（ｋ）は、最初の状態から最後の状態へ状態配列の中を前方に移動するそれぞれの状態ｉ（ｉ＝１．．．ｎ）ごとに計算される。測定の複数のシリーズ間の位置合わせの欠如によって、そのような経路はすべて考慮しなければならない。値Ｌ_ｉ（Ｋ）はすぐ前を先行する状態からの値Ｌ_ｉ−１（．）のみを遷移および放出確率と共に使用し、再帰を形成して計算することができる。ｍ次元ＨＭＭでは、類似するスキームを使用しうる。スキップが組み込まれるためには、ｍ個のインデックスがあり、したがって、Ｌ_{ｉ１，ｉ２，．．．ｉｍ}（Ｋ）は、次元１における状態ｉ１、次元２における状態ｉ２などを記述する最大尤度である。それは可能なあらゆる量Ｌ_{ｊ１，ｊ２，．．．ｊｍ}（Ｋ）を調べることにより再帰的に計算することができ、スキップが次元１で放出されるならばｊ１＝ｉ１または状態が次元１において放出されるならば（ｉ１−１）であり、ｊ２、ｊ３、等についても同様である。

この解析法は、それぞれの入力シグナル１１および測定のシリーズ１２が同じポリマーの同じ領域の測定である場合に適用しうる。例えば、ポリマーまたはポリマーの領域が再読取りされるシステムでは、これらの読みは組み合わせることができ、位置合わせまたはアライメントを推定して根底にあるｋマー状態をさらに正確に決定することができる。前記方法は、異なる条件下でまたは組み合わされる異なる方法により行われる測定も可能にする。

上で考察されたように、例えば、測定の複数シリーズが複数の電気的測定または電気的および光学的測定を含む場合、複数の測定も同時に行いうる。これらの読みは組み合わされるおよび／または位置合わせもしくはアラインメントが推定されて根底にあるポリマー配列をより正確に推定することができる。

代わりに、測定の複数のシリーズ１２は集合されて、１次元測定として解析ステップＳ２により使用される測定のサマリーシリーズを提供する。ｍ個の異なる種類の複数の測定シリーズが存在する場合、同じ種類のすべてのシリーズに集合が適用され、ｍ次元ＨＭＭがサマリー状態シリーズに用いることができる。代わりに、複数のシリーズが存在する場合、それぞれのシリーズまたはそれぞれのサマリー測定シリーズに１次元ＨＭＭを実行してよく、これらの解析からの出力に基づいてコンセンサスコールが行われる。

この解析法は、入力シグナル１１および測定の２つのシリーズを含む測定のシリーズ１２にも適用することができ、測定の第１のシリーズはポリマーの第１の領域の測定であり、測定の第２のシリーズは前記第１の領域に関係しているポリマーの第２の領域、例えば、同じポリマーまたは異なるポリマーの相補的領域の測定である。

この技法は、ＤＮＡ配列の相補的対、すなわち、「センス」鎖およびその相補的「アンチセンス」鎖への特定の適用を有する。

２つの別々の１次元ＨＭＭおよび次にアライメント技法を通じた底空間で整列させることにまさる２次元アプローチの利点はここで説明されることになる。

極度に単純化した説明として、センス鎖上でのＨＭＭからＰｒ（ＡＡＡＣＡＡＡ）＝０．６、Ｐｒ（ＡＡＡＧＡＡＡ）＝０．３９、Ｐｒ（ＡＡＡＡＡＡＡ）＝０．０１およびアンチセンス鎖上でのＨＭＭからＰｒ（ＴＴＴＴＴＴＴ）＝０．６、Ｐｒ（ＴＴＴＣＴＴＴ）＝０．３９、Ｐｒ（ＴＴＴＧＴＴＴ）＝０．０１が想定されている。センスおよびアンチセンスについて最も可能性の高い配列が取られ、センス−アンチセンスペアとして整列されるように企てられた場合、配列の中間の塩基でクラッシュ（clash）が得られる。２次元ＨＭＭは、配列の飛び抜けて最も可能性の高い一貫したペアは（ＡＡＡＧＡＡＡ、ＴＴＴＣＴＴＴ）であることを見つけ、配列ペア（ＡＡＡＣＡＡＡ、ＴＴＴＧＴＴＴ）および（ＡＡＡＡＡＡＡ、ＴＴＴＴＴＴＴ）には低い確率を割り当てると考えられる。

この極度に単純化した説明では、２番目に可能性が高い配列はそれぞれの１次元ＨＭＭにより問題を解決すると見なされるが、さらに長い配列についてのすべての必要なポリマー単位推定を一通り調べるのはすぐに非現実的になる。さらに、ポリマー単位を推定するためのいくつかの方法（例えば、ビタビ）は最も確実な経路を放出するだけで、ポリマー単位を推定した後の可能性のより低い配列の組合せは不可能になる。

ビタビアルゴリズムを使用するセンス−アンチセンスケースの特定の詳細な例は、改良を実証するためにここで説明される。

センス−アンチセンスのケースでは、上記のｍ次元ケースは、ｍ＝２について使用され、Ｌ_ｉｊ（Ｋ）は、状態がセンスのみにより、アンチセンスのみにより、または両方により放出されるのかに応じて、値Ｌ_{ｉ−１，ｊ}（．）、Ｌ_{ｉ．ｊ−１}（．）およびＬ_ｉ，ｊ（．）を使用して計算される。

図３９は、最も可能性の高いセンスおよびアンチセンス配列の独立したコールが３マーモデルおよびＨＭＭを使用して行われる例を図示している。ジョイントセンス−アンチセンスコールは上記の２次元ビタビアルゴリズムを使用して行われる。ジョイントコールは正確で例外は非常に少なく、特にセンスコールとアンチセンスコールの両方で不正確にコールされている塩基を正確にコールしている。正確な３マー状態推定値は「＃」で示され、正確な塩基は「＊」で示されている。この図解では、独立したセンス読取りとアンチセンス読取りの最良の領域を組み合わせても、センス−アンチセンス結果の正確なコールの数を占めていないことが見て取れる。解析プロセス初期のデータの組合せは、確率的アプローチと組み合わせると、「部分の総和超（more than the sum of the parts）」の結果をもたらす。

この多次元例は、加算された情報が１つの鎖は別の鎖に相補的であることであるセンス−アンチセンスＤＮＡのケースのためであるが、ポリマーの領域間の他の関係は多次元アプローチにおいてコード化しうる。コード化できるであろう別の種類の情報の例は、ポリマー中の構造情報である。この情報は、機能的構造体を形成することがわかっているＲＮＡに存在しうる。この情報は、ポリペプチド（タンパク質）にも存在しうる。タンパク質のケースでは、構造情報は、疎水性領域または親水性領域に関係していてもよい。前記情報は、アルファへリックス、ベータシートまたは他の二次構造に関してでもよい。前記情報は、結合部位、触媒部位および他のモチーフなどの既知の機能的モチーフに関してでもよい。

本発明の第二の態様および第三の態様に従ってポリマーの測定を行う方法がここで考察されることになる。下でさらに詳細に考察されるように、これは場合によっては、本発明の第一の態様に従った上記の方法と組み合わせてもよい。

この方法では、測定はナノポア中を流れるイオン電流の測定である。この方法では、ポリマーは、ナノポアを横断して電圧が印加されている間にナノポアの中を移行する。測定はナノポア中のｋマーの正体に依拠している。測定はナノポアを横断する異なるレベルの電圧の印加下で行われる。そのような測定により、単なる重複性ではなく追加の情報が与えられることは本発明者らにより認識されていた。この利点のいくつかの特定の実証がここで説明されることになる。

最初の例は、付加電位下で測定システム中に静止して保持されたＤＮＡの鎖であるポリマーのイオン電流測定の分解を図示している。この例では、電流が最初の通常の電圧レベルでは互いに類似しているＤＮＡ配列は、第２の電圧レベルで記録することにより分解された。

ＤＮＡ鎖は、Proc Natl Acad Sci U S A. 2009 May 12;106(19):7702-7に既に報告されている方法に類似するストレプトアビジンアンカーを使用してナノポア中に保持された。ＤＮＡの個々の鎖が当技術分野で公知の方法を使用してＤＰｈＰＣ二重層に包埋された単一ＭＳ−（Ｂ１）_８ナノポア中で測定される場合、ラン（run）が収集された。電圧はナノポアを横切って印加され、電流はナノポアのどちら側でも塩溶液中のイオンの動きから生み出された。

ラン条件は、４００ｍＭＫＣｌ、１０ｍＭＨｅｐｅｓ、ｐＨ８．０、＋１８０ｍＶであった。対照配列（ＴＳ０１）はストレプトアビジンと一緒に２対１比でインキュベートされ、チャンバーに添加されて最終濃度２００ｎＭＤＮＡを得た。分析物配列はストレプトアビジンと一緒に２対１比でチャンバーに添加され、最終分析物ＤＮＡ濃度４００ｎＭを得た。両方のケースで、ビオチン化ＤＮＡとストレプトアビジンは、チャンバーへの添加に先立って５分間インキュベートされた。シングルチャネルレコーディングは、＋１８０ｍＶ（２秒）から−１８０ｍＶ（０．２秒）まで付加電位を変化させる自動化手順を使用して実施された。正の付加電位を使用して捕捉してＤＮＡレベルを読取り、負電位を使用してナノポアからストレプトアビジン−ＤＮＡ複合体を排出した。

ＤＮＡ結合事象（状態）ごとの平均電流は以下の通りに調べられた。

ＴＳ０１対照と分析物配列からの集団が記録された。分析物配列電流レベルは、以下の関係
Ｉ_{ＤＮＡＡｊｕｓｔｅｄ}＝Ｉ_{ＤＮＡＲｅｃｏｒｄｅｄ}−Ｉ_ＴＳ０１＋３２．２ｐＡ
を使用することにより調整された。このプロセスは、広範囲の様々なＤＮＡ配列について繰り返された。例として、表２は、＋１８０ｍＶの電圧で測定された場合、調整された電流レベルが類似する大きさ（５４．５±０．５ｐＡ）を示した選択された配列を提示している。

それに続く実験では、ＤＮＡの同じ鎖はすべて、脂質膜に包埋された単一ＭＳ−（Ｂ１）_８ナノポアを含有するチャンバー中に置かれた。条件は、上記条件の４００ｍＭＫＣｌ、１０ｍＭＨｅｐｅｓ、ｐＨ８．０、＋１８０ｍＶに類似していた。分析物配列はすべてストレプトアビジンと一緒に２対１比でチャンバーに添加され、最終濃度は分析物ＤＮＡごとに２００ｎＭＤＮＡであった。ＴＳ０１はこの実験では添加されなかった。ビオチン化ＤＮＡとストレプトアビジンは、チャンバーへの添加に先立って５分間インキュベートされた。

ＤＮＡ識別に対する付加電位の効果を調べるため、この実験では電圧を変化させた。シングルチャネルレコーディングは、付加電位を＋Ｘ（２秒）から−Ｘ（０．２秒）まで変化させる自動化手順を使用して実施され、Ｘは１４０ｍＶ、１８０ｍＶおよび２２０ｍＶである。シングルチャネルデータは、Ｘの値ごとにおよそ３０分間記録された。

ＤＮＡ結合事象（状態）ごとの平均電流レベルが記録され、それぞれ＋１４０ｍＶ、＋１８０ｍＶおよび＋２２０ｍＶの正電位に関して図４０に示されているヒストグラムのセットにプロットされている。これらの結果を考慮すると、＋１８０ｍＶでのデータは予想通りに振る舞っており、表１．１の１１の鎖すべてが非常に類似する電流レベルを生じていることは明白である。＋２２０ｍＶでは、電流レベルヒストグラムが広がるまたは散らばっており、レベルが分離していることが示唆される。＋１４０ｍＶでも、広がるまたは散らばっており、同様に電流レベルは明らかに多数のはっきり異なる集団に分解している。これらの結果から、＋１８０ｍＶではできなかった多くのＤＮＡ鎖を＋１４０ｍＶでは互いに区別することができることが示唆される。実験の容易さのために、これはナノポア中で静止している鎖を用いて実施された例であるが、ＤＮＡ鎖が異なればナノポア中の関連のある位置で提供されるｋマーも異なり、イオン電流に影響を与えるので、ＤＮＡ鎖の異なるｋマーにより生み出されるイオン電流間の類似の分離はポア中を動的に移行すると予測される。

第２の例は、付加電位下で測定システム中で静止して保持されるＤＮＡの鎖であるポリマーのイオン電流測定の分離を図示している。この例では、異なる電圧レベルでのイオン電流の測定は異なるｋマーを分解することが示されている。

第２の例では、所与の鎖の電流レベルに対する付加電位の効果を決定するために、ＤＮＡ配列はすべての可能なトリプレットを含有するように選択された（ド・ブラン、ＧＴＡＣ、ｋ３、配列番号５）。
配列番号５（ｋ３ド・ブラン）
ＡＴＡＡＧＡＡＣＡＴＴＡＴＧＡＴＣＡＧＴＡＧＧＡＧＣＡＣＴＡＣＧＡＣＣＴＴＴＧＴＴＣＴＧＧＴＧＣＴＣＧＴＣＣＧＧＧＣＧＣＣＣＡＡＡＴ

鎖の動きから生じるどんな可能な複雑化もなく電流レベルの効果を評価するために、一連の異なるＤＮＡ鎖が設計された。これらの鎖はそれぞれが、３’末端にビオチン−ＴＥＧリンカー、ｋ３ド・ブラン配列の一部（３５ヌクレオチド長）、およびＤＮＡをナノポア内に通すのを支援する低二次構造を有するセクション（１０ヌクレオチド長）を含有していた。ｋ３ド・ブランを含有するセクションの配列は、配列が鎖あたり１ヌクレオチド移動されるように変化させた。リーダーセクションは、ド・ブランセクションにハイブリダイズしないように選択された。これらのコードおよび対応する配列は表３に収載されている。

表３に示される鎖の電流レベルは、第１の例に記載されるアプローチに類似するアプローチを使用して得られた。ＴＳ０１鎖は内部対照としてチャンバーに添加され、電流レベルはこの対照に対して較正された。この実験で使用される方法と第１の例で使用された方法の間には２つの主な違いが存在していた。第１の違いはナノポアがＭＳ−（Ｂ１−Ｌ８８Ｎ）_８ミュータントに変えられていることであった。第２の違いは、適用された電圧スキームであった。これは、電流が４つの異なる付加電位で順次記録されるように選択された。ナノポアがＤＮＡを捕捉する速度は付加電位に依拠しているので、最も大きな電位が最初に記録された。選択された電圧スキームは、＋１８０ｍＶ（２．２秒）、＋１４０ｍＶ（０．４秒）、＋１００ｍＶ（０．４秒）、＋６０ｍＶ（０．４秒）、−１８０ｍＶ（０．８秒）であった。

図４１は、下のトレースでは印加電圧の例を、上のトレースでは同じ時間スケールにわたるＳＤ０１鎖について得られ測定されたイオン電流を示している。図４１のこの例に見られるように、結合事象は＋１８０ｍＶの初期間中に起こり、イオン電流の降下を生じる。それに続く期間で電位が下がるに従って、観測されるイオン電流は減少する。最終期間は、逆になった電圧はＤＮＡ鎖を排出する。

ＤＮＡ鎖ＳＤ０１〜ＳＤ５４のすべてについて類似するパターンが観測され、それぞれの電圧での測定されたイオン電流レベルは表３に収載されている。

このデータのグラフィック表示を提供するため、図４２から４５は、それぞれ４つのレベルの電圧で、順次水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。見て取れるように、散布図の形状は電位が変わるに従って変化する。それは、異なる電圧での測定が、例えば、別の電圧では分解することができない２つの状態を分解する１つの電圧での測定により追加の情報を提供することになることを暗示している。

同じデータの別の表示を与えるため、図４６は印加電圧に対するそれぞれの鎖の測定された電流のグラフである。前記データは、それぞれの電圧での鎖ごとの点からなり、鎖ごとの点はグラフでは線で繋がれて鎖ごとの傾向を示している。図４６におけるこの表示は変動の２つの主要な特長を図示している。

第１の特長は、電圧が増大するに従って全体では異なる鎖についての測定された電流の広がりが増大することである。この全体の傾向は一般的に興味深い。これは、電圧の最適の選択に影響を与えると考えられるが、状態間の分離におよび個々の状態の測定の標準偏差にも依拠している状態間の分解の変化を示している可能性がある。しかし、全体の傾向は複数の電圧を使用する有益性を実証するものではない。

第２の特長は、個々の鎖についての測定された電流が印加電圧への異なる依存度での挙動を示していることである。したがって、全体の傾向が電圧の増大に従って分岐することであるが、すべての鎖ごとの電流測定は同じ傾向を示してはいない。鎖についての測定は相互に分岐していないが、代わりに個々の鎖に変動がある。それどころか、一部の鎖は電圧と共に一般的線形変化を示しているが、他の鎖は非線形または振動性の変化を示し、いくつかのケースでは変曲点がある。全体的な分岐傾向に対して、一部の鎖に関する線は収束している。この観測の理由は重大ではないが、これは、異なる電圧の印加下での測定システムの物理的および／または生物学的変化により、おそらくナノポア中のＤＮＡの立体構造変化により引き起こされると推測される。

この第２の特長は、１つよりも多い電圧での測定が単に重複しているというよりはむしろ追加の情報を提供することである。異なる電圧でのイオン電流測定により異なる状態の分解が可能になる。例えば、１つの電圧では分解できないいくつかの状態を別の電圧では分解することができる。

第２の例でのいくつかの追加の観測により、状態の標準偏差（または分散）に対する電圧を変えることの効果が調べられる。これらの状態の分散は、電流の分散がＤＮＡ鎖の制御された動き（例えば、酵素制御されたＤＮＡ移行）に類似する時間尺度であるときには問題を引き起こすことがある。このレジメでは、電流レベルの変化がそれぞれの状態内の分散またはＤＮＡのネット運動（net movement）のためあるかどうかを決めるのは困難になる。この理由で、第２の例で収集されたデータは、移行を制御する酵素を使用するのではなく、ストレプトアビジンによりナノポア上に保持された鎖を使用して収集された。したがって、電流変化が鎖の動きから生じたのかまたはその電流状態の固有の特性から生じたのかどうかを描写するように電流レベルの分散を変化させることができるシステムがあるのが望ましい。

状態分散に対する付加電位の効果を評価するため、第２の例の結果は解析されて、表３のＤＮＡ配列ごとに平均標準偏差を導き出した。図４７は、印加電圧に対するそれぞれの鎖の標準偏差のグラフである。データは、それぞれの電圧での鎖ごとの点からなり、鎖ごとの点はグラフでは線で繋がれて鎖ごとの傾向を示している。電流レベルの分散は付加電位と共に確かに変化することは、図４７から明らかである。大多数の鎖では、分散は付加電位の増大と共に増加するが＋１８０ｍＶから＋２２０ｍＶまで急上昇する。この変化は上記の電圧に合わせた電流の変動に類似する原因を有すると推測される。

１つよりも多い電圧でイオン電流測定を行う方法であって、本発明の第二の態様および第三の態様を具体化する方法は、図４８に図示されている。この方法では、付加電位はＤＮＡがナノポア中を通って動いている間変調される。

ステップＳ６では、ポリマーはナノポアを横断する電圧の印加下でナノポア内を通って移行される。

ステップＳ７では、移行中、電圧のレベルは周期的に変化される。周期は２つ以上の電圧レベルを含みうる。電圧レベルは規則的にまたは不規則に繰り返してもよい。この期間を含めて、周期は個々の観測される状態、すなわち、測定される電流が異なるｋマーに依拠するようにポリマーが異なる位置である状態よりも短くなるように選択される。したがって、それぞれの状態中、電圧のレベルが同じである時、例えば、繰り返される周期で、ナノポア中を流れるイオン電流は同じであることが観察される。言い換えると、イオン電流は印加電圧と共に循環する。

ステップＳ８では、異なる電圧レベルの適用下でのナノポア中を流れるイオン電流はそれぞれの状態ごとに測定される。

第３の例は、この方法の例が以下の通りに実施された。分析物ＤＮＡ鎖は、上記第２の例におけるストレプトアビジン系で特徴付けられていた配列を含有するように選択された。分析物ＤＮＡ鎖は、ナノポア中に通させる５’オーバーハングでの低二次構造配列も含有していた。相補鎖は分析物鎖にハイブリダイズされた。前記相補鎖は、コレステロール−ＴＥＧリンカーを含有する短いオリゴがハイブリダイズされる短い５’オーバーハングも含有していた。コレステロールの組込みにより、ＤＮＡは二重層に繋ぎ止められ、必要なＤＮＡの濃度が大幅に減少する。表４は、この例で使用される分析物ＤＮＡ鎖の配列を収載している。

実験設定は上記に類似しており、溶液は、４００ｍＭＫＣｌ、１０ｍＭＨｅｐｅｓ、ｐＨ８．０、１ｍＭＥＤＴＡ、１ｍＭＤＴＴを含有していた。バッファーはチャンバー内で予備混合溶液の一部として使用された。表４．１において使用されるＤＮＡは１対１対１比でハイブリダイズされ、予備混合溶液に添加され、ＰｈｉＤＮＡＰも添加され、予備混合溶液は室温で５分間混合させておいた。単一のＭＳ−（Ｂ１−Ｌ８８Ｎ）_８チャネルが得られ、予備混合物を添加して、０．５ｎＭの最終溶液ＤＮＡ濃度および１００ｎＭの最終溶液Ｐｈｉ２９ＤＮＡＰ濃度が得られた。

印加電圧は、それぞれ１０ｍｓの長さの＋１８０ｍＶと＋１４０ｍＶの交互パルスを含む周期で適用された。

図４９は、結果の図解部分を示しており、特に、下トレースでは印加電圧、および上トレースでは得られ測定されたイオン電流を示している。事象はＰｈｉ２９ＤＮＡＰ−ＤＮＡ複合体から見られた。図４９では、付加電位の両方で、状態、例えば、標識された状態１から３を観測することができた。それぞれの状態中、連続する周期においてそれぞれの電圧レベルで流れるイオン電流は同じである。それぞれの状態で、＋１４０ｍＶおよび＋１８０ｍＶの付加電位での電流レベルは、鎖が一貫した位置にあり、ポア中の単一分子上２つの電圧で読みを与える間順次得られ、これは状態の期間よりも短い周期期間により達成される。容量性遷移は付加電位が変えられる直後に観察することができる。これは、脂質二重層上に蓄えられた電荷が変化する時に起きる。この容量性遷移の持続時間は脂質膜のサイズに依拠し、さらに小さな膜サイズに進むことにより減らすことができる。この実験では、脂質膜は、直径５０μｍの開口部にわたって浮遊させた。

ＤＮＡは付加電位下Ｐｈｉ２９ＤＮＡＰの中を通って引っ張られるので、鎖が１つの位置から別の位置に動くときに起こる状態間の遷移を観察することも可能である。前記遷移により付加電位ごとに観察される電流が変化する。

図４９の例は、状態２と隣接する状態１および３における測定されるイオン電流間の違いは＋１４０ｍＶの印加電圧よりも＋１８０ｍＶの印加電圧でのほうがはるかに大きいという点で、複数の電圧を使用する利点も図示している。これにより、＋１４０ｍＶの印加電圧よりも＋１８０ｍＶの印加電圧で状態１と３から状態２を分解するほうが容易になる。逆に、＋１８０ｍＶの印加電圧よりも＋１４０ｍＶの印加電圧で他の状態を分解するほうが容易である。

図５０は、図４９と同じ種類のプロットにおいて、第３の例で記載された条件に類似する条件下で、しかし、ＭＳ−（Ｂ１−Ｌ８８Ｎ）_８の代わりにＭＳ−（Ｂ１）_８ポアを使用して得られた結果の別の図解部分を図示している。図５０は図４９に類似する全体的な形を有し、今回は、状態１から状態４と名付けられた４つの状態を含む。このケースでは、＋１４０ｍＶの印加電圧での状態２と隣接する状態３の測定されたイオン電流間にはほとんど違いはないが、＋１４０ｍＶの印加電圧では大きな違いが存在する。このケースでは、＋１４０ｍＶでは状態２を状態３から分解するのは困難であるまたは不可能でさえあるが、これは＋１８０ｍＶでは可能になる。再び、＋１８０ｍＶの印加電圧よりも＋１４０ｍＶの印加電圧で他の状態を分解するほうが容易である。

上で実証され考察された複数レベルの印加電圧を使用して得られた追加の情報は、ポリマーについての情報を導き出すために測定されたイオン電流が解析される時には利点を提供する。

測定を解析する１つの方法は、本発明の第一の態様に従って方法、例えば、第一の態様を（図６およびそれに続く図を参照して）具体化する上記の方法を適用することである。したがって、本明細書に記載される方法の様々な特長はいかなる組合せでも組み合わせうる。このケースでは、複数の電圧を使用することにより得られる追加の情報は推定の正確度を改善する。

本発明の第一の態様に従った解析法は、ポリマーの少なくとも一部の配列を、したがって、正体を決定する。しかし、第二の態様および第三の態様に従った方法も、ポリマーの少なくとも一部の正体を決定する測定を解析する他の方法において利点を提供し、その利点のいくつかの非限定的例は以下の通りである。

測定を解析して、本発明の第一の態様に従った技法以外の技法を使用してポリマーの少なくとも一部のポリマー単位の配列を推定しうる。

測定を解析して、ポリマー単位の配列の完全な推定を提供せずにポリマーの少なくとも一部の正体を推定しうる。これらの種類の解析では、複数の電圧を使用することにより得られる追加の情報は推定の正確度を改善する。

代わりに、測定を解析して、状態間の遷移のタイミングを導き出しうる。これらのタイミングはそれ自体が価値があり、またはさらなる解析において使用して、例えば、ポリマー単位の正体を決定しうる。この種類の解析では、追加の情報は遷移を検出する能力を改善する。一部の遷移は１つの電位で観測するほうが容易であり、他の遷移はもう一方の電位で観測するほうが容易である。例として、図５０の図解的結果では、状態２から状態３への遷移は＋１４０ｍＶで観測するのは困難であるが、＋１８０ｍＶでは容易に観測される。これとは対照的に、状態３から状態４への遷移は＋１８０ｍＶでは弱いが、＋１４０ｍＶでは容易に観測される。したがって、１つよりも多い電位で記録するのには状態検出に対する利点が明らかに存在する。

いくつかの解析方法では、異なるレベルでの測定は両方とも、例えば、ポリマーの少なくとも一部の正体の決定に両方とも同じように寄与する別々の測定として直接使用される。他の解析方法では、異なるレベルでの測定、例えば、正体を決定するのに使用される１つのレベルで行われる測定およびその結果を確認するのに使用される異なるレベルで行われる測定は異なるやり方で使用しうる。代わりに、１つのレベルでのノイズは、１つの電圧での特定の測定を使用することを決定するため、別のレベルでのノイズと比較されることがある。代わりに、解析方法は、それぞれのｋマーについての異なるレベルでの測定間の選択とそれに続くポリマーの少なくとも一部の正体を決定するための選択された測定の使用を含んでいてもよい。

異なるレベルでの２つの測定の使用により得られる追加の情報の程度はｋマー間で変わることがある。そのケースでは、異なる数のレベルでの測定は異なるｋマーについて使用され、例えば、いくつかのｋマーについて、減少した数のレベル、おそらく、１つだけのレベルでの測定を使用し、一方、他のｋマーについてさらに多くのレベルでの測定を使用することがある。この方法は、高分散状態にまたは類似の電流レベルを有するそれぞれの状態に特に有用でありうる。

異なるレベルでの測定が使用される場合、異なる重み付けが異なる測定に付けられることがある。

それでもなお、解析方法が様々な形で測定を使用しうるという事実にもかかわらず、いくつかのｋマーに関する異なるレベルでの測定はある方法で使用される。

本発明に従った２つの非限定的例がここで説明される。これらの例は両方とも、それぞれの電位での状態あたり典型的には少なくとも１つの測定があるケースに適用される。

最初の例では、複数のレベルでの測定が使用されて、状態遷移を決定する。これは、状態遷移がある電位では観測可能であるが別の電位では可能ではないことがあるという事実を利用する。測定は、状態からの遷移の可能性が高い、状態検出ステップＳ１を含む上記の解析方法を受けることができる。図５０では、例えば、状態についてのそれぞれの電位での全データの平均をとることにより、トレースはそれぞれ１４０および１８０ｍＶでの２つの測定に減らしてもよい。次に、これらの測定は２セットの放出分布から同時発生（すなわち、密に結合した次元）として扱われ、１Ｄケースに類似するセットの遷移で解析されてもよい。これは、我々が単一の電位で状態を１回よりも多く測定するケース、例えば、平均と分散に実行が類似している点に注目されたい。実際、我々は、例えば、それぞれの電位での平均と分散を考慮することによりこのアプローチを４つの密に結合された次元まで広げることがある。

第２の例では、状態間の遷移は、ステップＳ１が省かれる上記ケースに似て、別々のステップとしてというよりむしろ解析段階中に推定される。この例では、単純にするため、我々は、電位周期のそれぞれのステップでの測定のシリーズを単回測定まで減らしたケース、例えば、平均を考慮することになる。再び、図５０を参照して、状態１は１４０から１８０ｍＶに交互に代わる２８の測定からなる。したがって、測定ごとの放出確率は適切な放出（１４０ｍＶまたは１８０ｍＶ）およびこのデータに適している遷移に関して計算される。例えば、この状態からのおよそ０．０５の全遷移確率が適切でありうる。このアプローチは、それぞれの周期からのサマリー測定またはそれぞれの周期からの複数のサマリー測定よりはむしろそれぞれの測定を考慮するように一般化されてもよい。

本発明の第二の態様に従って異なる電圧で測定を行う方法では、ポリマーがナノポア中を通って移行される間付加電位が循環される本発明の第三の態様に従った方法を適用するのが有利であるが、代わりに他の方法を使用しうる。

非限定的例として、本発明の第二の態様に従って１つよりも多い電圧でイオン電流測定を行う１つの別の方法は、図５１に示されており以下の通りに実施される。

ステップＳ９では、ポリマーはナノポア中を通って移行され、ステップＳ１０では、移行中単一レベルの電圧がナノポアを横断して印加されそのレベルの電圧の印加下でナノポア中を流れるイオン電流が観測されるそれぞれの状態ごとに測定される。次に、前記方法は同じポリマーを移行させるステップＳ９およびステップＳ１０を繰り返すが、異なるレベルの電圧を印加する。ステップＳ９およびＳ１０は、いかなる数の回数でも繰り返して、いかなる数の電圧レベルでイオン電流測定を得てもよい。

望ましいのは、毎回同じポリヌクレオチドを読み取るために、ナノポアを離れるポリマーの能力は制限される。ポリヌクレオチドのケースでは、これは、鎖が離れていかないように電位を制御することにより、または鎖の移行を阻害する、ストレプトアビジンなどの化学的または生化学的ブロック剤を使用することにより実行しうる。

Claims

ポリマーに関係する少なくとも１つのシリーズの測定からポリマー中のポリマー単位の配列を推定する方法であって、それぞれの測定値が、ｋが正整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照する解析技法を使用して測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む方法。
遷移重み付けおよび放出重み付けのうちの少なくとも１つが非２値変数の値を含む、請求項１に記載の方法。
遷移重み付けと放出重み付けの両方が非２値変数の値を含む、請求項２に記載の方法。
放出重み付けがあらゆる可能な測定を観測する非ゼロの可能性を表す、請求項１から３のいずれか一項に記載の方法。
それぞれのｋマーに関する放出重み付けが測定値にわたり単峰性または多峰性分布を有する、請求項１から４のいずれか一項に記載の方法。
それぞれのｋマーに関する放出重み付けが測定値にわたりガウス分布、ラプラス分布、四角分布または三角分布を有する、請求項５に記載の方法。
ｋが複数の整数である、請求項１から６のいずれか一項に記載の方法。
遷移重み付けが、起点ｋマーから、最初の（ｋ−１）個のポリマー単位が前記起点ｋマーの最後の（ｋ−１）個のポリマー単位である配列を有する目的地ｋマーまでの遷移である好ましい遷移の非ゼロ可能性を表し、起点ｋマーから前記起点ｋマーとは異なる配列を有し、最初の（ｋ−１）個のポリマー単位が前記起点ｋマーの最後の（ｋ−１）個のポリマー単位ではない目的地ｋマーまでの遷移である好ましくない遷移のより低い可能性を表す、請求項７に記載の方法。
遷移重み付けが前記好ましくない遷移のうちの少なくとも一部の非ゼロ可能性を表す、請求項８に記載の方法。
遷移重み付けが、起点ｋマーから、最初の（ｋ−２）個のポリマー単位が前記起点ｋマーの最後の（ｋ−２）個のポリマー単位である配列を有する目的地ｋマーまでの好ましくない遷移の非ゼロ可能性を表す、請求項９に記載の方法。
解析技法が確率的技法である、請求項１から１０のいずれか一項に記載の方法。
遷移重み付けが確率であり、および／または放出重み付けが確率である、請求項１から１１のいずれか一項に記載の方法。
モデルが隠れマルコフモデルである、請求項１から１２のいずれか一項に記載の方法。
解析のステップが、測定のシリーズがポリマー単位の推定された配列により生み出されるというモデルにより予測される尤度を表す推定された配列またはそれぞれの推定された配列に関してクオリティスコアを導き出すことをさらに含む、請求項１から１３のいずれか一項に記載の方法。
解析のステップが、ポリマー単位の推定された配列に対応する個々のｋマーに関するクオリティスコアであって、測定のシリーズが個々のｋマーを含む配列により生み出されるというモデルにより予測される尤度を表すクオリティスコアを導き出すことをさらに含む、請求項１から１４のいずれか一項に記載の方法。
解析のステップが、ポリマー単位の推定された配列に対応するｋマーの配列に関するクオリティスコアであって、測定のシリーズがｋマーの所与の配列により生み出されるというモデルにより予測される尤度を表すクオリティスコアを導き出すことをさらに含む、請求項１から１５のいずれか一項に記載の方法。
解析のステップがポリマー中のポリマー単位の複数の推定された配列を導き出す、請求項１から１６のいずれか一項に記載の方法。
ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップが、
測定のシリーズが個々のｋマーにより生み出されるというモデルにより予測される尤度に基づいてｋマーの配列を推定するステップ、および
ｋマーの推定された配列からポリマー単位の配列を推定するステップ
を含む、請求項１から１７のいずれか一項に記載の方法。
ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップが、
測定のシリーズがｋマーの全体の配列により生み出されるというモデルにより予測される尤度に基づいてｋマーの少なくとも１つの配列を推定するステップ、および
ｋマーの推定された配列からポリマー単位の配列を推定するステップ
を含む、請求項１から１８のいずれか一項に記載の方法。
測定の少なくとも１つのシリーズにおいて、予め定められた数の測定がそれぞれのｋマーに依拠しており、予め定められた数が１以上である、請求項１から１９のいずれか一項に記載の方法。
グループにおける測定の数についての先験的知識なしで、複数の測定のグループが同じｋマーに依拠している測定の入力シリーズを含む少なくとも１つの入力シグナルを受けるステップ、および
解析のステップ前に、少なくとも１つの入力シグナルを処理して、連続するグループの測定を同定し、それぞれの同定されたグループに関して前記予め定められた数の測定を導き出し、解析のステップがこのようにして導き出された測定のシリーズまたはそれぞれの測定のシリーズで実施されるステップ
を含む、請求項２０に記載の方法。
少なくとも１つのシリーズの測定において、複数の測定のグループが、前記グループにおける測定の数について先験的知識なしで同じｋマーに依拠している、請求項１から１９のいずれか一項に記載の方法。
ポリマーの前記測定を行うことをさらに含む、請求項１から２２のいずれか一項に記載の方法。
ポリマーの前記測定がナノポア中を通るポリマーの移行中に行われる、請求項２３に記載の方法。
ポリマーの移行が、複数の測定のグループが同じｋマーに依拠するように実施される、請求項２４に記載の方法。
ナノポア中を通るポリマーの移行は一方向のみに動く様式で実施される、請求項２４または２５に記載の方法。
ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである、請求項２４から２６のいずれか一項に記載の方法。
測定のシリーズが、ナノポア中を通るポリマーの移行中に行われる測定である、請求項２４から２７のいずれか一項に記載の方法。
ナノポアが生物学的ポアである、請求項２４から２８のいずれか一項に記載の方法。
測定が、電流測定、インピーダンス測定、トンネリング測定、ＦＥＴ測定および光学的測定のうちの１つまたは複数を含む、請求項２４から２９のいずれか一項に記載の方法。
方法が、それぞれが前記ポリマーに関係している測定の複数のシリーズで実施され、それぞれの測定の値がｋマーに依拠しており、
解析技法が、複数のそれぞれの次元で配置されている測定の複数のシリーズを扱う、請求項２４から３０のいずれか一項に記載の方法。
測定のそれぞれのシリーズが同じポリマーの同じ領域の測定である、請求項３１に記載の方法。
測定の複数のシリーズが測定の２つのシリーズを含み、測定の最初のシリーズがポリマーの第１の領域の測定であり、測定の第２のシリーズが前記第１の領域に関係しているポリマーの第２の領域の測定である、請求項３１に記載の方法。
前記第１の領域と第２の領域が同じポリマーの関係する領域である、請求項３３に記載の方法。
前記関係する領域が相補的である、請求項３３または３４に記載の方法。
モデルがメモリに記憶される、請求項１から３５のいずれか一項に記載の方法。
モデルを提供し測定を解析するステップが、ハードウェア装置においてまたはコンピュータ装置において実行される、請求項１から３６のいずれか一項に記載の方法。
請求項１から３７のいずれか一項に記載の方法を実施するように構成されたデバイス。
ポリマー中のポリマー単位の配列を前記ポリマーに関係のある測定の少なくとも１つのシリーズから推定するための解析デバイスであって、それぞれの測定の値が、ｋが複数の整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、方法が
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーの所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付けを含むモデルを記憶するメモリ、ならびに
前記モデルを参照する解析技法を使用して、測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するように構成された解析ユニット
を含む、解析デバイス。
ポリマーの前記測定を行うように構成された測定デバイス、および
請求項３８または３９に記載の解析デバイス
を備える塩基配列決定装置。
ポリマー単位を含むポリマーを解析する方法であって、
ナノポアを横断して電圧が印加されている間にナノポア中を通るポリマーの移行中に、ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定を行い、前記測定が個々のｋマーに関して、ナノポアを横断して印加される前記電圧の異なるレベルで行われる別々の測定を含むステップ、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するステップ
を含む方法。
測定を行う前記ステップが、
異なる移行において電圧がナノポアを横断して異なるレベルで印加されている間に、ナノポア中を通る前記ポリマーの複数の移行を実施するステップ、
前記異なる移行中に、ナノポアを横断する前記電圧の前記異なるレベルでの前記ｋマーの測定を行うステップ
を含む、請求項４１に記載の方法。
前記複数の移行がナノポア中を通る第１の方向への移行およびナノポア中を通る前記第１の方向とは反対の方向への移行を含む、請求項４２に記載の方法。
測定を行う前記ステップが、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記測定が前記個々のｋマーに依拠している状態の持続期間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するステップ、および前記周期において前記電圧の前記異なるレベルでの前記個々のｋマーに関して前記別々の測定を行うステップ
を含む、請求項４１に記載の方法。
ポリマー単位を含むポリマーの測定を行う方法であって、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記電圧の異なるレベルを周期的に印加するステップ、および
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定であり、前記測定が個々のｋマーに依拠している状態よりも短い繰返し周期を有する前記周期で前記電圧の前記異なるレベルでの前記個々のｋマーに関する別々の測定を含む測定を行うステップ
を含む方法。
繰返し周期が最長で３秒である、請求項４４または４５に記載の方法。
繰返し周期が少なくとも０．５ｍｓである、請求項４４から４６のいずれか一項に記載の方法。
前記電圧の異なるレベルがそれぞれ、前記周期の部分的期間連続して印加される、請求項４４から４７のいずれか一項に記載の方法。
前記周期における前記電圧の前記異なるレベル間の遷移が、電圧変化により引き起こされる測定の容量性遷移を減少するように形作られる、請求項４８に記載の方法。
測定を解析してポリマーの正体を決定することをさらに含む、請求項４５または請求項５に付随する場合は請求項４６から４９のいずれか一項に記載の方法。
測定を解析してポリマーの正体を推定するステップが、測定を解析してポリマー中のポリマー単位の配列を推定することを含む、請求項４１から４４または５０のいずれか一項に記載の方法。
測定を解析してポリマー中のポリマー単位の配列を推定するステップが、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照し、ナノポアを横断する電圧の異なるレベルの印加下で行われる測定を扱う解析技法を使用して測定を複数の次元での測定として解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む、請求項５１に記載の方法。
測定を解析してポリマーの正体を決定するステップが、前記異なる電圧レベルで行われる別々の測定を比較して、前記測定が前記個々のｋマーに依拠している状態間の遷移を決定することをさらに含む、請求項４１から４４、５１または５２のいずれか一項に記載の方法。
電圧の前記異なるレベル間の違いが１０ｍＶから１．５Ｖの範囲である、請求項１から５３のいずれか一項に記載の方法。
前記異なるレベルが２つの異なるレベルからなる、請求項１から５４のいずれか一項に記載の方法。
電圧の異なるレベルが同じ極性である、請求項１から５５のいずれか一項に記載の方法。
前記測定がナノポア中を通るイオン電流の流れの測定である、請求項１から５６のいずれか一項に記載の方法。
ナノポア中を通るイオン電流の流れの前記測定が、ナノポア中を通るＤＣイオン電流の流れの測定である、請求項５７に記載の方法。
前記電圧の前記異なるレベルのそれぞれ１つでグループの複数の測定を行うステップ、および
前記異なるレベルのそれぞれ１つでの複数の測定のそれぞれのグループから１つまたは複数のサマリー測定を導き出して、個々のｋマーに関して前記別々の測定を構成するステップ
を含む、請求項１から５８のいずれか一項に記載の方法。
前記電圧の異なるレベルがそれぞれ一定期間連続して印加され、
それぞれ各自の期間中、それぞれの期間中に印加される前記電圧の前記異なるレベルのうちの１つでグループのうちの１つの複数の測定を行う、
請求項５９に記載の方法。
ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである、請求項１から６０のいずれか一項に記載の方法。
ナノポアが生物学的ポアである、請求項１から６１のいずれか一項に記載の方法。
ナノポア中を通るポリマーの前記移行が、連続するｋマーがナノポアで登録される一方向のみに動く様式で実施される、請求項１から６２のいずれか一項に記載の方法。
ポリマーの移行が分子歯止めにより制御される、請求項１から６３のいずれか一項に記載の方法。
分子歯止めが酵素である、請求項６４に記載の方法。
ポリマー単位を含むポリマーを解析するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポア中を通るポリマーの移行中にナノポアを横断して電圧を印加するように配置された制御回路、および
ｋが正整数であるポリマーのｋ個のポリマー単位であるｋマーの正体に依拠している測定をナノポア中で行うように配置された測定回路であって、
前記制御回路がナノポアを横断して電圧の異なるレベルを印加するように配置され、前記測定回路がナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、測定回路、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するように配置されている解析ユニット
を備える装置。
制御回路が、ナノポア中を通る前記ポリマーの異なる移行中にナノポアを横断して電圧の異なるレベルを印加するように配置されており、測定回路が前記電圧の異なるレベルでの前記異なる移行中に、個々のｋマーに関して別々の測定を行うように配置されている、請求項６６に記載の装置。
制御回路が、ナノポア中を通るポリマーの前記移行中に、前記測定が前記個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するように配置されており、測定回路が前記周期において前記電圧の前記異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、請求項６６に記載の装置。
ポリマー単位を含むポリマーを測定するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポア中を通るポリマーの移行中に、前記測定が前記個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で前記電圧の異なるレベルを印加するように配置されている制御回路、および
ナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている測定回路
を備える装置。
前記電圧の前記異なるレベルで測定を解析して、ポリマーの少なくとも一部の正体を決定するように配置されている解析ユニットをさらに備える、請求項６９に記載の装置。