JP2022530016A

JP2022530016A - サンプル中のポリヌクレオチド配列の部分存在量の多孔決定

Info

Publication number: JP2022530016A
Application number: JP2021562858A
Authority: JP
Inventors: イエンアンチャオ; ウィリアムマッケナ; ウィリアムビー．ダンバー
Original assignee: オンテラインコーポレイテッド
Priority date: 2019-04-22
Filing date: 2019-04-22
Publication date: 2022-06-27
Also published as: WO2020219011A1; EP3959331A1; CN113966403A; KR20220011639A

Abstract

1つまたは複数のナノ孔を有するナノ孔センサを用いて、例えば、特定する際に存在する誤差を補正し、電気信号をサンプル中の標的分析物または参照分析物の量に相関づけることによって、サンプルにおける標的分析物（例えば、特定のポリヌクレオチド配列）の部分存在量の改善された推定値を決定するための方法および組成物を、本明細書に開示する。TIFF2022530016000059.tif70144

Description

発明の分野
1つまたは複数の固体状態のナノ孔を有するシステムを用いてサンプルから特定のポリヌクレオチド配列の部分存在量を決定する方法および正確かつ精密な定量のための数学的方法。

発明の背景
サンプル中に存在する成分の相対存在量を決定することによる液体サンプルの特徴づけは、多くの科学分野および用途で価値のある情報を提供し得る。例えば、循環する無細胞DNA内の点変異の相対存在量は、患者における癌の診断または癌の進行のモニタリングのために使用され得る。別の例として、例えば種子から得られる、遺伝子組み換え生物（GMO）のトランスジェニック配列の、ゲノムDNA内の非GMO参照配列に対する部分量の決定は、規制および経済的理由から重要である。

サンプルにおける標的分析物の部分量を高感度で検出する方法はいくつか存在するが、これらの方法は通常、高価でありかつ長時間を要するか、または他の制約を有する。例えば、定量リアルタイムPCR（qPCR）アッセイは今でも、試験サンプル内の不変参照配列に対する標的核酸配列の相対量を決定するために使用される標準的方法である。しかし、qPCRの定量性能は、サンプルごとおよびアンプリコンごとの増幅効率のばらつきによって制限される。増幅効率に影響する因子は、サンプル基板由来の阻害物質およびキャリーオーバー混入物質ならびに抽出試薬自身を含む。これらの因子は、サンプルおよび調製物ごとに相違するだけでなく、それらがある配列の増幅効率に別の配列との比較でどの程度影響するかの点でも相違する。参照アンプリコンに対する標的アンプリコンの増幅効率の小さな、ばらつきのある違いは、qPCRを、分解可能な量の差＞1.5倍に制限する。さらに、増幅反応は、特別な試薬一式を必要とし、適切に保管されなければならず、長時間を要し、反応条件に敏感であり得る。

ナノ孔デバイスの使用は、印加された電圧の下でナノ孔を通過する移動の際に個々の分子を同定する単分子同定のための高感度ツールとして登場した。ナノ孔デバイスは、使用場所に柔軟性があり、かつヒトの健康、農業またはそれ以外に関して日常的に使用するのに十分安価および効率的である。しかし、ナノ孔からのデータの使用は、サンプル中の分析物の推定量の決定に影響し得る誤差を生じる可能性があり、そのためこのデータの信頼性のある使用は実現されていない。

したがって、汎用的であり、安価で、かつ使用が容易な、サンプルにおける参照分析物に対する標的分析物の部分存在量を決定するための改善された方法が、必要とされている。

いくつかの態様にしたがい、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法が、本明細書で提供され、本方法は、ナノ孔デバイスにおいてナノ孔をまたぐ電圧を印加し、参照分析物に対する標的分析物の相対存在量が既知の対照サンプルと、サンプルにおける標的分析物の相対存在量を決定すべき、標的分析物および参照分析物を含む混合未知サンプルとの各々について別々に、検出可能な電気的シグネチャーを生成し、ナノ孔を通じた荷電分析物の移動を誘導する工程；各サンプルにおけるナノ孔を通じた標的分析物または参照分析物の移動によって生成される複数のイベントシグネチャーを生成する工程；複数のイベントシグネチャーから標的分析物に関連する複数の第1のイベントシグネチャーおよび参照分析物に関連する複数の第2のイベントシグネチャーを特定し、各サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を決定する工程；ならびに対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を用いて混合未知サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を調整して、検出される相対存在量における誤差を補正し、それによって混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する工程を含む。いくつかの態様において、サンプルは液体サンプルである。

いくつかの態様において、対照サンプルは、標的分析物を含むが参照分析物を含まない標的対照サンプルである。いくつかの態様において、対照サンプルは、参照分析物を含むが標的分析物を含まない参照対照サンプルである。

いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法はさらに、標的分析物を含むが参照分析物を含まない標的対照サンプルに対するナノ孔センサを通じた荷電分析物の移動を誘導するようナノ孔デバイスに電圧を印加する工程を含む。

いくつかの態様において、未知のサンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量の調整は、標的対照サンプルにおけるおよび参照対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を使用して前記検出される相対存在量における誤差を補正する工程を含む。いくつかの態様において、誤差は、標的分析物の偽陽性または偽陰性検出誤差を含む。

いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法はさらに、標的分析物および参照分析物を含み、標的分析物および参照分析物の相対存在量が既知である混合対照サンプルに対するナノ孔センサを通じた荷電分析物の移動を誘導するようナノ孔デバイスに電圧を印加する工程を含む。

いくつかの態様において、未知サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量の調整は、標的対照サンプル、参照対照サンプルおよび混合対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を使用して前記検出される相対存在量における誤差を補正する工程を含む。

いくつかの態様において、誤差は、偽陽性標的分析物検出誤差、偽陰性標的分析物検出誤差、標的分析物と参照分析物の間の捕捉率定数差、またはそれらの任意の組み合わせを含む。

いくつかの態様において、対照サンプルは、標的分析物および参照分析物を含み、標的分析物および参照分析物の相対存在量が既知である、混合対照サンプルである。いくつかの態様において、誤差は、標的分析物と参照分析物の間の捕捉率定数差を含む。

いくつかの態様において、混合対照サンプルは、混合未知サンプルに対して1.2倍、1.5倍、2倍、5倍または10倍より大きく相違しない、参照分析物に対する標的分析物の相対存在量を含む。

いくつかの態様において、真の相対存在量の推定値は、混合未知サンプルにおける参照分析物に対する標的分析物の真の比の推定値である。いくつかの態様において、真の比の推定値

は、

によって決定され、式中、パラメータρは偽陽性検出誤差、偽陰性検出誤差またはその両方を補償することができる比の推定値であり、パラメータαは、標的分析物と参照分析物の間の捕捉率定数差を補償するために使用することができる。いくつかの態様において、パラメータαは、参照分析物捕捉率を標的分析物捕捉率で割った比の推定値である。

いくつかの態様において、真の相対存在量の推定値は、混合未知サンプルにおける参照分析物および標的分析物の集団における標的分析物の真の部分量の推定値である。いくつかの態様において、真の部分量の推定値

は、

によって決定され、式中、パラメータρは偽陽性検出誤差、偽陰性検出誤差またはその両方を補償することができる比の推定値であり、パラメータαは、標的分析物と参照分析物の間の捕捉率定数の相違を補償するために使用することができる。いくつかの態様において、パラメータαは、参照分析物捕捉率を標的分析物捕捉率で割った比の推定値である。

いくつかの態様において、パラメータ

である。いくつかの態様において、パラメータQ_targは、標的対照サンプルが使用される場合、該対照サンプルにおいて観察される第1のイベントシグネチャーの部分量であり、標的対照サンプルが使用されない場合、Q_targ = 1である。いくつかの態様において、パラメータQ_refは、参照対照サンプルが使用される場合、該参照対照サンプルにおいて観察される第1のイベントシグネチャーの部分量であり、参照対照サンプルが使用されない場合、Q_ref = 0である。いくつかの態様において、パラメータQ_X:Yは、混合対照サンプルにおいて観察される第1のイベントシグネチャーの部分量であり、ここで、

は、混合対照サンプルが使用される場合、該対照サンプルにおける参照分析物（Y）に対する標的分析物（X）の既知の比であり、混合対照サンプルが使用されない場合、α= 1である。いくつかの態様において、パラメータQ_mixは、混合未知サンプルにおいて観察される第1のイベントシグネチャーの部分量である。

いくつかの態様において、未知または対照サンプルは、核酸増幅によって調製される。いくつかの態様において、未知または対照サンプルは、核酸増幅によって調製されない。いくつかの態様において、サンプルは、実質的に参照および標的分子からなるよう精製される。いくつかの態様において、サンプルは精製されない。

いくつかの態様において、混合未知サンプルにおける参照分析物の量または濃度は、既知である。いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法は、混合未知サンプルにおける参照分析物に対する標的分析物の真の相対存在量の推定値ならびに混合未知サンプルにおける参照分析物の既知の量または濃度を用いて混合未知サンプルにおける標的分析物の絶対量または濃度の推定値を決定する工程を含む。関連する態様において、標的分析物の絶対量または濃度は、1つまたは複数のナノ孔デバイスの複数のナノ孔から得られる情報を用いて決定され得る。

いくつかの態様において、標的分析物に関連する複数の第1イベントシグネチャーおよび参照分析物に関連する複数の第2イベントシグネチャーは、定義されたしきい値にしたがい特定される。いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法はさらに、Q検定、サポートベクターマシンまたは期待値最大化アルゴリズムを用いて参照分析物および／または標的分析物の検出の正確度を向上させるようしきい値を最適化する工程を含む。いくつかの態様において、サポートベクターマシンは、既知量の標的分析物および参照分析物を含む対照サンプルからの電気的シグネチャーを用いて訓練される。

いくつかの態様において、定義されたしきい値は、イベント持続時間、最大δG、δG中央値、平均δG、イベントシグネチャーの標準偏差、50 Hzより下のイベントの雑音電力の平均もしくは中央値、イベントシグネチャーの固有のパターン、イベントの面積またはそれらの任意の組み合わせ、からなる群より選択されるイベントシグネチャーの1つまたは複数の特徴の関数である。

いくつかの態様において、混合未知サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量の調整による検出される相対存在量における誤差の補正は、Q検定、サポートベクターマシンまたは期待値最大化アルゴリズムを用いて行われる。

いくつかの態様において、標的分析物および参照分析物は各々、ポリヌクレオチドを含む。いくつかの態様において、標的分析物のポリヌクレオチドおよび参照分析物のポリヌクレオチドは、異なる長さである。いくつかの態様において、それらの長さは、少なくとも10ヌクレオチド、少なくとも20ヌクレオチド、少なくとも50ヌクレオチド、少なくとも100ヌクレオチド、少なくとも150ヌクレオチドまたは少なくとも200ヌクレオチド異なる。

いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法はさらに、対照または未知サンプルを、第1のペイロードに結合された第1のプローブと接触させる工程を含み、ここで第1のプローブは、第1の分析物に特異的に結合するよう構成される。いくつかの態様において、ナノ孔デバイスを用いて混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を決定する方法はさらに、対照または未知サンプルを、第2のペイロードに結合された第2のプローブと接触させる工程を含み、ここで第2のプローブは、第2の分析物に特異的に結合するよう構成される。

いくつかの態様において、標的分析物は、遺伝子組み換え生物と相関する。いくつかの態様において、標的分析物は、患者における癌の存在または非存在に関連するマーカーを含む。

サンプルにおける標的分析物の相対量を決定する方法であって、参照分析物を含み標的分析物を含まない第1の対照サンプル、標的分析物を含み参照分析物を含まない第2の対照サンプル、既知の相対存在量の標的分析物および参照分析物を含む第3の対照サンプル、ならびに未知の相対存在量の標的分析物および参照分析物を含む実験サンプル、の各々をナノ孔システムにおいて別々に試験する工程、各サンプルにおいて参照分析物に関連する複数の第1のイベントシグネチャーおよび標的分析物に関連する複数の第2のイベントシグネチャーを検出する工程、ならびに実験サンプル由来の複数の第1および第2のイベントシグネチャーの相対存在量を、第1の対照サンプル、第2の対照サンプルおよび第3の対照サンプルの各々由来の複数の第1および第2のイベントシグネチャーの相対存在量と比較し、実験サンプルにおける参照分析物および標的分析物の真の相対存在量の推定値を決定する工程を含む方法も、本明細書で提供される。

いくつかの態様において、イベントシグネチャーは、ナノ孔を通じた参照分析物の移動により誘導される電気信号を含む。

いくつかの態様において、標的分析物および参照分析物は各々、ポリヌクレオチドを含む。いくつかの態様において、参照分析物および標的分析物は、長さにより区別される。

いくつかの態様において、参照分析物および標的分析物は各々、ナノ孔デバイスにおける参照分析物と標的分析物の間の区別を容易にするペイロードを含む配列特異的なプローブに結合される。

いくつかの態様において、相対存在量は、サンプルにおける標的分析物および参照分析物の総集団に対する標的分析物の部分量である。

未知サンプルにおける標的分析物の相対存在量を決定する方法であって、複数の参照分析物および複数の標的分析物を含む未知サンプルを提供する工程、第1のチャンバおよび第2のチャンバの間に配置されたナノ孔を含むナノ孔デバイスの第1のチャンバに未知サンプルを投入する工程、ナノ孔をまたぐ電圧を印加し、参照分析物および標的分析物を、ナノ孔を通じて第1のチャンバから第2のチャンバに移動させる工程、ナノ孔を通じた参照分析物の移動に各々が関連する複数の第1の電気信号を検出する工程、ナノ孔を通じた標的分析物の移動に各々が関連する複数の第2の電気信号を検出する工程、ならびに電気信号の相対存在量に関連する少なくとも1つの誤差を考慮した参照値を用いて、検出された第1の電気信号の数および検出された第2の電気信号の数の相対存在量を、未知サンプルにおける標的分析物の真の相対存在量の推定値に変換する工程を含む方法も、本明細書で提供される。

いくつかの態様において、参照値は、既知量の標的分析物および参照分析物を含む混合対照サンプルから決定される第1の電気信号の部分存在量から決定される。いくつかの態様において、参照値は、既知量の標的分析物および参照分析物を含む混合対照サンプルから決定される第1の電気信号の部分存在量から決定される。いくつかの態様において、参照値は、既知量の標的分析物および参照分析物を含む混合対照サンプルから決定される第1の電気信号の部分存在量から決定される。

いくつかの態様において、混合対照サンプル、標的対照サンプルまたは参照対照サンプルは、未知サンプルから第1および第2の電気信号を検出する際のナノ孔デバイスにおける条件と実質的に同一の条件下のナノ孔デバイスにおいて試験される。

いくつかの態様において、ナノ孔デバイスは、該デバイスの内部空間を第1のチャンバおよび第2のチャンバに分ける膜を含み、ここで膜はナノ孔を含み、第1のチャンバおよび第2のチャンバはナノ孔を通じて流体連通しており、該デバイスは、ナノ孔をまたぐ電圧を印加するための電極を各チャンバに含む。いくつかの態様において、電極は、ナノ孔を通る電流をモニタリングするよう構成される。いくつかの態様において、電極は、電源に接続される。

いくつかの態様において、本明細書で提供される方法は、偽陽性もしくは偽陰性検出誤差または標的分析物と参照分析物の間の捕捉率定数差を考慮することによって、混合未知サンプルにおける標的分析物の部分存在量の推定値の正確度を改善する。いくつかの態様において、部分存在量の推定値の正確度を改善するために、偽陽性標的分析物検出誤差を考慮するための参照のみ対照、偽陰性標的分析物検出誤差を考慮するための標的のみ対照および標的分析物と参照分析物の間の捕捉率定数差を考慮するための1つまたは複数の混合対照サンプルを含む一連の対照群が試験される。

いくつかの態様において、混合未知サンプルにおける標的分析物と参照分析物の間の捕捉率は比較的一定であり、相対存在量の推定値を改善するために混合対照を使用する必要はない。いくつかの態様において、混合サンプルにおける標的分析物と参照分析物の間の相対捕捉率は既知であり、混合対照サンプルを試験することなく部分存在量の推定値を改善するようこの差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ標的分析物種および参照分析物種を用いて実質的に同一のナノ孔条件下で試験された混合対照サンプル由来のデータが、この方法の一部として混合対照サンプルを実際に試験せずに部分存在量の推定値を改善するために使用される。

いくつかの態様において、しきい値は、混合未知サンプル由来の偽陽性値が無視できる程度となり、相対存在量の推定値を改善するために参照のみ対照を使用する必要がないように決定される。いくつかの態様において、混合サンプル由来の偽陽性値は既知であり、参照のみ対照サンプルを試験することなく部分存在量の推定値を改善するよう偽陽性誤差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ参照分析物種を用いて実質的に同一のナノ孔条件下で試験された参照のみ対照サンプル由来のデータが、この方法の一部として参照のみ対照を実際に試験せずに部分存在量の推定値を改善するために使用される。

いくつかの態様において、しきい値は、混合未知サンプル由来の偽陰性値が無視できる程度となり、相対存在量の推定値を改善するために標的のみ対照を使用する必要がないように決定される。いくつかの態様において、混合サンプル由来の偽陰性値は既知であり、標的のみ対照サンプルを試験することなく部分存在量の推定値を改善するよう偽陰性誤差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ標的分析物種を用いて実質的に同一のナノ孔条件下で試験された標的のみ対照サンプル由来のデータが、この方法の一部として標的のみ対照を実際に試験せずに部分存在量の推定値を改善するために使用される。

いくつかの態様において、混合サンプルにおける参照分析物に対する標的分析物の相対存在量の推定値を決定する方法であって、ナノ孔デバイスに電圧を印加し、参照分析物に対する標的分析物の相対存在量が既知の混合対照サンプル、ならびに標的分析物および参照分析物を含み参照分析物に対する標的分析物の相対存在量が未知である混合未知サンプルの各々について個別にナノセンサを通じた荷電分析物の移動を誘導する工程、各サンプルについて参照分析物に関連する複数の第1のイベントシグネチャーおよび標的分析物に関連する複数の第2のイベントシグネチャーを検出する工程、ならびに混合対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量および混合対照サンプルにおける参照分析物に対する標的分析物の真の相対存在量を用いて混合未知サンプル由来の第1および第2のイベントシグネチャーの検出される相対存在量を調整することによって、混合未知サンプルにおける参照分析物に対する標的分析物の真の相対存在量の推定値を決定する工程を含む方法が、本明細書で提供される。

いくつかの態様において、混合サンプルにおける参照分析物に対する標的分析物の相対存在量の推定値を決定する方法であって、ナノ孔デバイスに電圧を印加し、標的分析物を含むが参照分析物を含まない標的対照サンプル、参照分析物を含むが標的分析物を含まない参照対照サンプル、ならびに標的分析物および参照分析物を含み、参照分析物に対する標的分析物の相対存在量が未知である混合未知サンプルの各々について個別にナノセンサを通じた荷電分析物の移動を誘導する工程、各サンプルについて参照分析物に関連する複数の第1のイベントシグネチャーおよび標的分析物に関連する複数の第2のイベントシグネチャーを検出する工程、ならびに標的対照サンプルおよび参照対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を用いて混合未知サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を調整することによって、混合未知サンプルにおける参照分析物に対する標的分析物の真の相対存在量の推定値を決定する工程を含む方法が、本明細書で提供される。いくつかの態様において、標的対照サンプルは、混合未知サンプル由来の標的分析物の偽陰性検出についての補正項を提供する。いくつかの態様において、参照対照サンプルは、混合未知サンプルにおける
標的分析物の偽陽性検出についての補正項を提供する。

いくつかの態様において、混合サンプルにおける参照分析物に対する標的分析物の相対存在量の推定値を決定する方法であって、ナノ孔デバイスに電圧を印加し、参照分析物に対する標的分析物の相対存在量が既知の混合対照サンプル、標的分析物を含むが参照分析物を含まない標的対照サンプル、参照分析物を含むが標的分析物を含まない参照対照サンプル、ならびに標的分析物および参照分析物を含み、参照分析物に対する標的分析物の相対存在量が未知である混合未知サンプルの各々について個別にナノセンサを通じた荷電分析物の移動を誘導する工程、各サンプルについて参照分析物に関連する複数の第1のイベントシグネチャーおよび標的分析物に関連する複数の第2のイベントシグネチャーを検出する工程、ならびに標的対照サンプルおよび参照対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量ならびに混合対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量および混合対照サンプルにおける参照分析物に対する標的分析物の真の相対存在量を用いて混合未知サンプル由来の第1および第2のイベントシグネチャーの検出される相対存在量を調整することによって、混合未知サンプルにおける参照分析物に対する標的分析物の真の相対存在量の推定値を決定する工程を含む方法が、本明細書で提供される。

いくつかの態様において、混合サンプルにおける参照分析物に対する標的分析物の相対存在量の推定値を決定する方法はさらに、標的分析物を含むが参照分析物を含まない標的対照サンプルについてナノセンサを通じた荷電分析物の移動を誘導するようナノ孔デバイスに電圧を印加する工程を含む。

いくつかの態様において、混合サンプルにおける参照分析物に対する標的分析物の相対存在量の推定値を決定する方法はさらに、参照分析物を含むが標的分析物を含まない参照対照サンプルについてナノセンサを通じた荷電分析物の移動を誘導するようナノ孔デバイスに電圧を印加する工程を含む。いくつかの態様において、混合未知サンプルにおける参照分析物に対する標的分析物の真の相対存在量の推定値を決定する工程は、標的対照サンプル、参照対照サンプルおよび混合対照サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量ならびに混合対照サンプルにおける参照分析物に対する標的分析物の真の相対存在量を用いて、混合未知サンプルにおける第1および第2のイベントシグネチャーの検出される相対存在量を調整する工程を含む。

いくつかの態様において、相対存在量は、標的分析物：参照分析物の比を含む。いくつかの態様において、いくつかの態様において、混合未知サンプルにおける参照分析物に対する標的分析物の真の比の推定値

は、

いくつかの態様において、相対存在量は、標的分析物および参照分析物の集団における標的分析物の部分量を含む。いくつかの態様において、混合未知サンプルにおける参照分析物および標的分析物の集団における標的分析物の真の部分量の推定値

は、

いくつかの態様において、既知の相対存在量で標的分析物および参照分析物を含む対照サンプル、ならびに未知サンプルにおける参照分析物および標的分析物の相対存在量を決定するために対照サンプルならびに参照分析物および標的分析物を含む未知サンプルをナノ孔デバイスにおいて試験するために使用される説明書を含むキットが、本明細書で提供される。

いくつかの態様において、標的分析物を含み参照分析物を含まない第1の対照サンプル、参照分析物を含み標的分析物を含まない第2の対照サンプル、既知の相対存在量で標的分析物および参照分析物を含む第3の対照サンプル、ならびに未知サンプルにおける参照分析物および標的分析物の相対存在量を決定するために第1の対照サンプル、第2の対照サンプル、第3の対照サンプルおよび参照分析物および標的分析物を含む未知サンプルをナノ孔デバイスにおいて個別に試験するために使用される説明書を含むキットが、本明細書で提供される。

いくつかの態様において、サンプルにおける標的分析物の真の部分存在量の推定値を決定するコンピュータにより実施される方法であって、参照分析物対照または標的分析物対照の少なくとも1つ由来のデータをナノ孔センサから取得する工程であって、該データは、ナノ孔を通じて移動する標的分析物または参照分析物由来の複数のイベントシグネチャーを含む、工程、イベントシグネチャーの1つまたは複数の特徴を、標的分析物に相関するものと参照分析物に相関するものに区別する工程、第1のイベントを第2のイベントから区別する最適なしきい値を特定し、サンプルにおける参照分析物および標的分析物の真の相対存在量の推定値を生成するようサポートベクターマシンを訓練する工程であって、訓練は、参照対照サンプル、標的対照サンプルおよび混合対照サンプルからなる群より選択される対照の使用を含み、かつ訓練は、既知混合サンプルを用いた検証を含む、工程、ならびにサポートベクターマシンを使用して、ナノ孔デバイスにおいて記録された混合サンプル由来のイベントからサンプルにおける標的分析物の部分存在量を決定する工程を含む方法が、本明細書で提供される。

いくつかの態様において、サンプルにおける標的分析物の真の部分存在量の推定値を決定するコンピュータにより実施される方法であって、ナノ孔デバイスからデータセットを取得する工程であって、該データは、少なくとも1つの対照サンプルおよび少なくとも1つの未知サンプル由来のイベントシグネチャーを含む、工程、標的分析物に相関する第1のイベントシグネチャーと参照分析物に相関する第2のイベントシグネチャーを区別するしきい値を生成するために使用する特徴セットを特定する工程、ならびに訓練されたサポートベクターマシンを用いて未知サンプルにおける部分存在量の真の値を推定する工程を含む方法が、本明細書で提供される。

いくつかの態様において、サンプル中の標的分析物の部分存在量の推定値を決定するコンピュータにより実施される方法が、本明細書に提供され、本方法は、1つまたは複数のナノ孔デバイスからデータセットを取得する工程であって、各ナノ孔デバイスが1つまたは複数のナノ孔を含む工程；多孔分析モデルを用いて該データセットから得られる入力セットを処理する工程であって、入力セットがナノ孔セットの各々からのコール（call）を含む、工程；ならびに多孔分析モデルの返し出力に基づき、サンプル中の標的分析物の部分存在量の推定値および部分存在量の信頼値を生成する工程を含む。

上記およびその他の目的、特徴および利点は、以下の本発明の個々の態様の説明から明らかとなり、これらは、異なる図を通して類似の参照記号で同じ要素が表されている添付図面に図示されている。図面は必ずしも原寸通りというわけではなく、本発明の様々な態様の原理を説明するための強調表示がなされている。

（図１）図1Aは、dsDNAがナノ孔を通過することによってもたらされる単一分子イベントの典型的な電気的シグネチャーである、特徴的な移動の持続時間および移動中の電流の減少、を示す。図1Bは、22 nm径ナノ孔において記録された5.6 kb dsDNAについての持続時間に対する最大δGの全イベント散布図を示す。
（図２Ａ）図2Aは、727 bp DNAが、1M LiCl中、100 mVの下で、25 nm径固体ナノ孔を通過する際の典型的なイベントを示す。ベント面積が影付き表示されている。
（図２Ｂ）図2Bは、dsDNA長の増加にともない、イベント深度が維持されつつイベント持続時間が増加することを示す。
（図２Ｃ）図2Cは、示される各長さのdsDNAについて記録されたすべてのイベントの面積のlog₁₀の分布のプロットである。
（図３Ａ）図3Aは、1型分析物（四角）由来のイベントと2型分析物（丸）由来のイベントの間に設定されたしきい値の例を示す。
（図３Ｂ）図3Bは、1型分析物（四角）由来のイベントと2型分析物（丸）由来のイベントの間の直線状しきい値の正確度を向上させる入力特徴量からより高次元空間への変換の結果の例を示す。
（図４Ａ）図4Aは、イベント面積にしたがう参照分析物サンプル、標的分析物サンプルおよび混合サンプル由来の全イベントの確率ヒストグラムを示す。
（図４Ｂ）図4Bは、参照分析物のみ（Qref）、標的分析物のみ（Qtarg）ならびに標的分析物および参照分析物の混合サンプル（Qmix）からの面積しきい値を下回るイベントの割合のグラフを示す。
（図４Ｃ）図4Cは、部分量パラメータρ（q）が、あるq値で視覚的にどのように見えるかを示す。q = 5pA^*msのしきい値（垂直の破線）は、0.05の偽陽性（すなわち、Q_ref = 0.05）および0.1の偽陰性（すなわち、Q_targ = 0.9）に相当する。
（図５）図5Aは、標的遺伝子の真の相対存在量（GMO(%)）に対する標的遺伝子の相対存在量の推定値（GMO(%)

の決定の結果を示す。比較のために、ゼロ誤差線（勾配 = 1）の上下10％の誤差マージンが示されている。図5Bは、2つの単独対照および6つの既知混合物を用いたサンプルにおける遺伝子操作生物の真の相対存在量の推定値の決定の結果を示す。予測される標的存在量の百分率の値が、真の標的存在量の百分率に対してプロットされている。比較のために、ゼロ誤差線（勾配 = 1）の上下10％の誤差マージンが示されている。
（図６）図6は、イベントの面積にしたがい標的分析物を参照分析物から区別するための一定範囲のしきい値における標的分析物存在量（GMO(%)）の推定の結果を示す。
（図７）図7は、標的分析物由来のイベントシグネチャーと参照分析物由来のイベントシグネチャーを区別するための最適なパラメータを用いた訓練されたサポートベクターマシンからの試験データセットにおける正確度の予測を示す。
（図８）図8は、単独対照として同じ孔で連続して試験された2つの分子タイプ（プローブ／ペイロードに結合された94 bp標的dsDNAおよびプローブ／ペイロードに結合された74 bp参照dsDNA）についてのイベントプロットを示す。
（図９Ａ）図9Aは、重ね合わされた100％標的分析物対照サンプル（塗りつぶした丸）および100％参照分析物対照サンプル（白抜きの四角）についての平均δG 対持続時間の代表的なイベントプロットを示す。標的分析物は、3分枝PEGに連結されたG12D結合プローブ（G12D-3bPEGと呼ばれる）を有する89bp DNAである。参照分析物は、8アームPEGに連結された野生型（c.35G）結合プローブ（WT-8armPEGと呼ばれる）を有する89bp DNAである。ナノ孔を通過する標的分析物（q₁ = 1 msec、q₂ = 0.4 nSおよびq₃ = 0.65 nS）からのイベントシグネチャーを特定するためのしきい値は、標的タグ付けボックス（破線）を形成する。
（図９Ｂ）図9Bは、図9Aからのプロットを示し、標的分析物および参照分析物を含む未知サンプルA（三角）およびサンプルB（星）からのデータが、同プロットで重ね合わされている。
（図１０）図10は、重ね合わされた100％標的分析物対照サンプル（塗りつぶした丸）および100％参照分析物対照サンプル（白抜きの四角）についての平均δG 対持続時間の代表的なイベントプロットを示す。サポートベクターマシンにより特定された、標的分析物を参照分析物から区別するための決定境界（すなわち、しきい値）もプロットされている。
（図１１）図11は、最大δG 対持続時間の全イベント散布図にプロットされた50％標的／50％参照混合物サンプルからのイベントを示す。標的ドメインボックスは、プローブに結合された変異体標的に関連するイベントを囲んでいる。
（図１２）図12は、標的（変異体）および参照（野生型）集団の特定のための、図11に示される50％標的／50％参照混合物サンプルからのデータへの3ガウス混合モデルを用いたガウス混合期待値最大化アルゴリズム（EMGM）の適用の結果を示す。
（図１３）図13は、偽陽性率を示すための、参照のみ対照サンプルからのデータへの3ガウス混合モデルを用いたEMGMの適用の結果を示す。
（図１４）図14は、未知サンプルにおける変異体（標的）分子の相対存在量を特定するための、混合未知サンプルからのデータへの3ガウス混合モデルを用いたEMGMの適用の結果を示す。
（図１５）図15Aは、サンプル中の標的分析物の部分存在量を決定するために複数の孔からのコンセンサスコールを用いる方法のフローチャートを示す。図15Bは、部分存在量を決定するために4つ孔からのコンセンサスコールを用いる態様を示す。図15Cは、任意数のナノ孔からの、図15Bのシステムの態様により実施される方法のフローチャートを示す。図15Dは、単一のナノ孔からおよび複数のナノ孔から得られる情報を用いて標的分子の濃度を決定する方法の出力を示す。
（図１６）図16Aは、1つまたは複数の態様にしたがう、ナノ孔からのデータを事前フィルタリングする方法のフローチャートを示す。図16Bは、ナノ孔からのイベントデータが電気信号の振幅対ドエルタイムによりプロットされる、図16Aに示される方法の出力を示す。図16Cは、システムがPCAオペレーションの成分（PC1およびPC2）を使用して、各サンプル集団についてカウント数対PC1のガウス分布を生成する、図16Aおよび16Bに示される方法の出力を示す。図16Dは、図16Cに示されるPCAオペレーションの出力を用いて分離スコアを生成するために使用されるデータを示す。図16Eは、サンプルの較正比をチェックするための、秒単位のドエルタイムの対数関数に対する最大電流振幅のプロットを示す。

詳細な説明
本発明の様々な態様の詳細が、以下の説明の中で示されている。本発明のその他の特徴、目的および利点は、当該説明および図面からならびに特許請求の範囲から明らかとなるであろう。

定義
本願を通じて、同書は本発明の栄養物（nutrients）、組成物および方法の様々な態様を参照している。記載される様々な態様は、様々な例示的な実施例を提供することを意図したものであり、二者択一されるべきものの説明として解釈されてはならない。そうではなく、本明細書で提供される様々な態様の説明は、範囲が重複し得ることに留意されるべきである。本明細書で議論される態様は、例示にすぎず、本発明の範囲を限定することを意図したものではない。

また、本開示を通して、様々な刊行物、特許および公開された特許明細書が、識別情報の引用により参照されている。これらの刊行物、特許および公開された特許明細書の開示は、本発明の属する技術分野の状況をより十分に説明するために参照により本開示に組み入れられる。

本明細書および特許請求の範囲で使用される場合、単数形「1つの（a）」、「1つの（an）」および「その（the）」は、文脈がそれ以外のことを明確に示していない限り、複数の参照を包含する。例えば、「電極（electrode）」という用語は、それらが混合されたものを含む、複数の電極を包含する。

本明細書で使用される場合、「～を含む（comprising）」という用語は、そのデバイスおよび方法が言及されている要素または工程を含むが、それ以外のものも排除しないことを意味することが意図されている。「～から本質的になる（consisting essentially of）」は、デバイスおよび方法を定義するために使用される場合、その組み合わせに対して何らかの本質的意義を有する他の要素または工程を排除することを意味する。「～からなる（consisting of）」は、他の要素または工程を排除することを意味する。これらの転換語の各々によって定義される態様は、本発明の範囲に包含される。

範囲を含む、すべての数値表示、例えば距離、大きさ、温度、時間、電圧および濃度は、近似値であり、パラメータの測定の際に通常見られる実験的ばらつきを包含することが意図されており、そのばらつきも、記載される態様の範囲に含まれることが意図されている。明示的に言及されているとは限らないが、すべての数値標示の前に「約」という用語が付されることが理解されるべきである。これも明示的に言及されているとは限らないが、本明細書に記載される要素は例示にすぎず、それらの等価物が当技術分野で公知となっていることも理解されるべきである。

本明細書で使用される場合、「分析物」という用語は、任意の分子、化合物、複合体またはその存在をナノ孔センサを用いて検出し、孔内の分析物の相対存在量の決定を促進することができるその他の実体を表す。標的または参照分析物を参照する場合、標的または参照分子という用語が、言い換え可能に使用され得る。

本明細書で使用される場合、「標的分析物」という用語は、サンプル中の関心対象の分子または複合体を表す。いくつかの態様において、標的分析物は、関心対象の核酸配列を有するポリヌクレオチドの一部分を含む。標的分析物は、本明細書に記載されるように、ナノ孔センサにおける標的分析物の検出を促進するためのプローブによる検出のために特異的に標的化され得る。

本明細書で使用される場合、「参照分析物」という用語は、その存在量が標的分析物の定量の相対的基準として使用されるサンプル中の関心対象の分子または複合体を表す。いくつかの態様において、参照分析物は、関心対象の核酸配列を有するポリヌクレオチドの一部分を含む。参照分析物は、本明細書に記載されるように、ナノ孔センサにおける標的分析物の検出を促進するためのプローブによる検出のために特異的に標的化され得る。

本明細書で使用される場合、「特異的結合」または「特異的に結合する」という用語は、標的分析物または参照分析物へのプローブの標的化された結合を表す。

本明細書で使用される場合、「プローブ」という用語は、標的分析物またはそのフラグメントに特異的に結合する分子を表す。いくつかの態様において、プローブは、プローブ・ペイロード分子または複合体に結合した標的または参照分析物を含む複合体の移動の際に発生する電気的シグネチャーに影響を及ぼすよう構成されたペイロード分子を含む。いくつかの態様において、プローブは、ペイロード分子に結合するよう適合されたペイロード分子結合部位を含む。

本明細書で使用される場合、「ペイロード分子」という用語は、相関する寸法範囲のナノ孔に捕捉されたときに固有の電気信号の発生を促進する物理的寸法を有する分子を表す。ペイロード分子は、ナノ孔デバイスにおける標的分析物または参照分析物の検出を促進するよう標的分析物または参照分析物に結合され得る。いくつかの態様において、ペイロード分子はまた、ドライバー分子として作用するよう荷電され得る。いくつかの態様において、ペイロード分子は、標的分析物または参照分析物に特異的に結合するプローブ分子に特異的に結合することができるプローブ結合部分を含む。

「ナノ孔」（または単に「孔」）という用語は、本明細書で使用される場合、2つのボリュームを隔てる膜上にある単一のナノスケールの開口部を表す。例えば、孔は、脂質二重膜に挿入されたタンパク質チャネルであり得、またはドリル抜きもしくはエッチングによりまたは薄い固体基板、例えば窒化ケイ素もしくは二酸化ケイ素もしくはグラフェンまたはこれらもしくはその他の材料の組み合わせの層を通じて電圧パルス法を用いて作製され得る。幾何学的に、孔は、直径0.1 nm以上直径1ミクロン以下の寸法を有し、孔の長さは、ナノメートル以下の厚みまたは最大1ミクロンもしくはそれ以上の厚みであり得る膜厚によって支配される。数百ナノメートルより厚い膜において、ナノ孔は、「ナノチャネル」と称され得る。

本明細書で使用される場合、「ナノ孔機器」または「ナノ孔デバイス」という用語は、（並列または直列の）1つまたは複数のナノ孔を、単分子イベントを検知するための回路と組み合わせたデバイスを表す。ナノ孔デバイス内の各ナノ孔は、そのナノ孔による検知を促進するために使用されるそのチャンバおよび電極を含めて、本明細書でナノ孔センサと称される。詳細に、ナノ孔機器は、指定の電圧を孔または複数の孔をまたいで印加し、その孔を通るイオン電流を測定する高感度電圧固定増幅器を使用する。単一の荷電分子、二本鎖DNA（dsDNA）が電気泳動により孔を通じて捕捉および駆動されたとき、捕捉イベント（すなわち、ナノ孔を通じた分子の移動またはナノ孔における分子の捕捉）を示す測定される電流の変化および（電流振幅における）変化量ならびにイベントの持続時間は、ナノ孔において捕捉された分子を特徴づけるために使用される。実験中に多数のイベントを記録した後、そのイベントの分布が、その変化量（すなわち、電流シグネチャー）にしたがい対応する分子を特徴づけるために分析される。このようにして、ナノ孔は、生体分子の検知のための、簡単で、標識を必要としない、純粋に電気的な単分子法を提供する。

本明細書で使用される場合、「電気信号」という用語は、電気回路の構成に依存して電流、インピーダンス／抵抗、または電圧から経時的に収集される一連のデータを包含する。従来的に、電流は、「電圧固定」構成で測定され、電圧は、「電流固定」構成で測定され、抵抗の測定は、オームの法則V=IRを用いていずれかの構成で行われ得る。インピーダンスもまた、ナノ孔デバイスから収集された電流または電圧データから測定され得る。本明細書で参照される電気信号のタイプは、電流シグネチャーおよび電流インピーダンスシグネチャーを含むが、その他の様々な電気信号もナノ孔において粒子を検出するために使用され得る。

本明細書で使用される場合、「イベント」という用語は、ナノ孔を通る検出可能な分子または分子複合体の移動および電気信号、例えばナノ孔を通じた電流の経時的変化を通じたそれに関連する測定を表す。それは、その電流、基準開放チャネルからの電流の変化、持続時間および／またはナノ孔における分子の検出の他の特徴によって定義され得る。類似の特徴を有する複数のイベントは、同一であるまたは類似の特徴（例えば、容積、電荷）を有する分子または複合体の集団を示す。

本明細書で使用される場合、イベントの「面積」は、イベントの持続時間（すなわち、その電流が開放チャネルの電流信号から外れる時間）に、そのイベントの持続時間内の開放チャネルからの電流の変化の平均値を乗算したものの絶対値（すなわち、pA^*ms）を表す。

本明細書で使用される場合、「相対存在量」という用語は、グループ内の関連要素の総数に対するある要素の量を表す。例えば、サンプル中の標的分析物に関していえば、標的分析物の相対存在量は、参照分析物に対するサンプル中に存在する標的分析物の量を表す。これは、部分存在量、例えば、標的分析物および参照分析物の集団全体に対するサンプル中の標的分析物の百分率として表され得る。相対存在量はまた、例えば、標的分析物：参照分析物の比として表され得る。電気的シグネチャーに関して、一群の電気的シグネチャーの相対存在量は、参照分析物に相関する第2の電気的シグネチャーの量に対する標的分析物に相関する第1の電気的シグネチャーの量を表し得る。サンプル中の標的分析物の実際の相対存在量（すなわち、以前に測定されたまたは既知の相対存在量を有するよう調製されたもの）と本明細書で提供される方法にしたがい決定される相対存在量を区別するために、本発明者らは多くの例で、実際の相対存在量を「真の相対存在量」と表し、本明細書で提供される方法により決定される相対存在量を「真の相対存在量の推定値」と表する。

本明細書で使用される場合、「対照サンプル」という用語は、参照分析物に対する標的分析物の相対存在量が既知であるサンプルを表す。対照サンプル、例えば参照対照分析物、標的対照分析物および混合対照サンプルは、本発明において、未知サンプルにおける部分存在量の推定値の正確度を改善させるために使用される。いくつかの態様において、対照サンプルは、標的分析物、参照分析物またはその両方を含む。

本明細書で使用される場合、「未知サンプル」または「未知混合サンプル」または「混合未知サンプル」という用語は、参照分析物の相対存在量が未知であるサンプルを表す。参照分析物の相対存在量は、それが本明細書で提供される方法によって決定される必要がある場合、または推定値の一部の値がすでに既知である場合でさえも、未知であるとみなされる。いくつかの未知サンプルでは、サンプル中の参照分析物の量または濃度が未知である。

本明細書で使用される場合、「既知サンプル」という用語は、参照分析物に対する標的分析物の相対存在量が既知であるサンプルを表し、部分存在量推定モデルまたはそのモデルの特徴、例えばしきい値を訓練、検証または推定正確度を提供するために訓練するために使用される。

導入／概要
本明細書で提供される発明は、いくつかの態様において、サンプル中に存在する参照分析物に対する標的分析物の真の相対存在量（例えば、部分量または比）の推定値を決定する方法である。この方法は、サンプル中の標的分析物および参照分析物を検出しそれらを区別するためにナノ孔単分子カウンター（すなわち、ナノ孔デバイス）を利用する。

サンプルにおける標的分析物の相対存在量についての推定量を決定する上での標的分析物および参照分析物に相関する未加工の電気的イベントシグネチャーの利用は、偽陽性検出誤差、偽陰性検出誤差および混合サンプルにおける標的分析物と参照分析物の間の捕捉率定数差に関連する誤差を含むいくつかの理由から不正確となり得る。本明細書で、本発明者らは、いくつかの態様にしたがい、サンプルにおける参照および標的分析物の真の部分存在量を推定する正確度を改善する方法を提供する。いくつかの態様において、これらの方法は、混合サンプルにおける電気信号の検出に付随する1つまたは複数の誤差を補正するよう特別に設計された対照サンプルを使用する。混合サンプルが既知量または濃度の参照分析物を含む場合、相対存在量の改善された推定値を使用してサンプルにおける標的分析物の真の量または濃度の改善された推定値を提供することができる。

いくつかの態様において、本明細書で提供される方法は、偽陽性もしくは偽陰性検出誤差または標的分析物と参照分析物の間の捕捉率定数差を考慮することによって、混合未知サンプルにおける標的分析物の部分存在量の推定値の正確度を改善する。いくつかの態様において、部分存在量の推定の正確度を改善するために、偽陽性標的分析物検出誤差を考慮するための参照のみ対照、偽陰性標的分析物検出誤差を考慮するための標的のみ対照ならびに標的分析物と参照分析物の間の捕捉率定数差を考慮するための1つまたは複数の混合対照サンプルを含む、複数の対照が試験される。

いくつかの態様において、混合未知サンプルにおける標的分析物と参照分析物の間の捕捉率は比較的一定であり、相対存在量の推定値を改善するために混合対照を使用する必要はない。いくつかの態様において、混合サンプルにおける標的分析物と参照分析物の間の相対捕捉率は既知であり、混合対照サンプルを試験することなく部分存在量の推定値を改善するようこの差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ標的分析物および参照分析物種を用いて実質的に同一のナノ孔条件下で試験された混合対照サンプル由来のデータが、この方法の一部として混合対照サンプルを実際に試験することなく部分存在量の推定値を改善するために使用される。

いくつかの態様において、混合未知サンプル由来の偽陽性値が無視できる程度となり、相対存在量の推定値を改善するために参照のみ対照を使用する必要がないよう、しきい値が決定される。いくつかの態様において、混合サンプル由来の偽陽性値は既知であり、したがって参照のみ対照サンプルを試験することなく部分存在量の推定値を改善するよう偽陽性誤差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ参照分析物種を用いて実質的に同一のナノ孔条件下で試験された参照のみ対照サンプル由来のデータが、この方法の一部として参照のみ対照サンプルを実際に試験することなく部分存在量の推定値を改善するために使用される。

いくつかの態様において、混合未知サンプル由来の偽陰性値が無視できる程度となり、相対存在量の推定値を改善するために標的のみ対照を使用する必要がないよう、しきい値が決定される。いくつかの態様において、混合サンプル由来の偽陰性値は既知であり、したがって標的のみ対照サンプルを試験することなく部分存在量の推定値を改善するよう偽陰性誤差を補償するために混合未知サンプル由来のデータに補正項を適用することができる。いくつかの態様において、混合未知サンプルにおけるのと同じ標的分析物種を用いて実質的に同一のナノ孔条件下で試験された標的のみ対照サンプル由来のデータが、この方法の一部として標的のみ対照を実際に試験することなく部分存在量の推定値を改善するために使用される。

サンプルの使用
参照核酸分子に対する、核酸フラグメント内の標的配列の部分量の決定は、多くの用途を有する。

1つの例示的な使用例において、本発明者らは、ここでこの方法を使用し、例えば種子収集物から得られるゲノムDNA内での遺伝子操作生物（GMO）のトランスジェニック配列の、非GMO参照配列に対する部分量を決定する。この決定は、規制的および経済的理由から重要である。所望の特性を有する種子の売買人は、値付けおよび取引を公平にするために、所望の特性を含む種子画分の正確かつ精密な知識を必要とする。

したがって、いくつかの態様において、本明細書で提供される方法は、1～100％のGMO含量を含むと推測される総種子、穀物、小麦粉および飼料からの％GMO含量の決定を提供する。種子の開発者、栽培者および規定当局は、GMO含量の10％の差（1.1倍）を見分ける正確な手段および能力を求めている。％GMOは、100 x (GMOイベントコピー数）／（タキソン特異的ゲノム参照コピー数)と定義される。

別の例示的な使用例として、本発明者らは、本明細書に記載される方法を使用して、血液または尿サンプル由来の無細胞循環DNA内の非変異（野生型）配列に対する点変異を含むポリヌクレオチド配列の相対存在量をモニタリングする。特定のゲノム座における点変異の相対存在量は、癌のタイプおよび処置の結果と相関する。非変異配列に対する変異体の相対存在量の決定は、診断、治療および疾患進行モニタリングの手引きをするために使用され得る。腫瘍画像化の結果から縮小／成長する細胞塊を明らかにするためには数週間を要し得るが、本明細書に記載される方法は、容易にアクセス可能なサンプルタイプを使用することにより、効率的かつ高頻度の試験（例えば、毎日）を可能にする変異体マーカーの相対存在量の迅速な同定を実現する。重要なことは、そのような技術は、疾患ダイナミクスにおけるより多くの時点を提供することにより治療反応をより効率的に明らかにし、同時に再発の早期検出も可能にし得ることである。

いくつかの態様において、本明細書で提供される方法は、遺伝性癌スクリーニングアッセイにおいてコピー数多型決定（CNV）を提供する。遺伝性癌の素因に関するコピー数多型（CNV）試験。目標は、参照からの＜1.5倍の差で遺伝子調節要素の欠失または重複を検出することである。例えば、BRCA1遺伝子のコピー数における10％の差（1.1倍）は、臨床行動を支持し得る。

ナノ孔検出
ナノ孔を、固体ケイ素ベースの基板において形成し、緩衝化電解質溶液中で孔をまたぐ電圧を印加することによって単分子実験を実施する。

図1Aは、dsDNAがナノ孔を通過することにより引き起こされる典型的な単分子イベントを示している。イベントは、持続時間幅および最大コンダクタンス深度、最大δGによって定量化される。最大δGは、電流減衰δIを印加された電圧Vで割ったものである。図1Bは、22 nm径ナノ孔を用いて5分間で記録された5.6 kb dsDNAの1072個のイベントについての最大δG 対持続時間の全イベント散布図を示している（V = 100 mV、1 nM DNA、1 M LiCl、10 mM Tris、1 mM EDTA、pH = 8.8）。

最大δGおよび持続時間に加えて、定量化することができるイベントプロフィールの他の特徴は、平均δG、δG中央値、イベント信号の標準偏差、および他のより高次の特徴である。別の有用な特徴は、平均δGに持続時間をかけたものとして算出され得る、イベントの積分面積の絶対値である（Storm, A J, J H Chen, H W Zandbergen, and C Dekker. "Translocation of Double-Strand DNA Through a Silicon Oxide Nanopore." Physical Review E 71, no.5 (May 2005): 051903, doi: 10.1103/PhysRevE.71.051903）。積分面積または単に「面積」はまた、電荷損失として公知である（Fologea, Daniel, Marc Gershow, Bradley Ledden, David S McNabb, Jene A Golovchenko, and Jiali Li, "Detecting Single Stranded DNA with a Solid State Nanopore." Nano Letters 5, no. 10 (October 2005): 1905-9. doi: 10.1021/nl051199m）。

折りたたまれた状態でナノ孔を通過するのに十分長い（> 700 bpの）dsDNAの場合、イベントは、1つより多くの振幅を示し得る。図1Bは、この一例であり、完全に折りたたまれたイベントが、より大きな最大δG値およびより短い持続時間を示し、折りたたまれていないイベントが、より長い持続時間およびより浅い最大δG値を示している。部分的に折りたたまれたイベントは、そのイベント内で、より深いレベルから始まり、より浅いレベルで終わる、両方の振幅レベルを示し、折りたたまれていないイベントと完全に折りたたまれたイベントのそれの間の総持続時間幅を有する。δGおよび持続時間の分布は、折りたたまれることができるdsDNAにおいて複合様式を示すが、イベント面積は、そのDNAがナノ孔を通過する際に折りたたまれるのに十分長いかどうかによらず、dsDNAについて単一様式の分布を示す。

ナノ孔を用いた標的分析物と参照分析物の間の区別は、高信頼性かつ高感度の検出を可能にするナノ孔を通じた各々の移動の際の有意に異なるイベントシグネチャーの検出に基づく。この平均イベントシグネチャーの差は、シグネチャー持続時間、電流の変化、シグネチャー内の特徴、またはその他の識別可能な特徴およびそれらの組み合わせに基づき得る。使用される特徴は、本明細書に記載される部分存在量決定のために使用される参照分析物および標的分析物に相関するイベントシグネチャーの特定方法として機能するしきい値の決定の基礎となる。

いくつかの態様において、標的および参照フラグメントは、異なるナノ孔イベント持続時間を生じる十分に異なる長さのdsDNA分子である。

いくつかの態様において、標的および参照分析物は両方ともdsDNAであり、異なるイベントタイプを生成する特徴は、標的および参照分析物の長さの差であり得る。そのような態様において、標的および参照分析物の長さの差により生じる標的および参照イベント面積の差が、標的および参照イベントシグネチャー（すなわち、イベントプロフィール）を区別するために使用される。

dsDNAのイベント面積分布は、単一様式である。これは、標的および参照分析物が、十分に異なる長さを有するdsDNAである場合、面積を、イベントを標的タイプまたは参照タイプに分類するための有用なイベント特徴にする。十分に異なる面積分布を生成するため、長さは、直径が20 nmより長いナノ孔については少なくとも100 bp相違するようにすべきである。例えば制御された絶縁破壊によって形成される（Yanagi, Itaru, Rena Akahori, Toshiyuki Hatano, and Ken-ichi Takeda, "Fabricating Nanopores with Diameters of Sub-1 Nm to 3 Nm Using Multilevel Pulse-Voltage Injection." Scientific Reports 4 (2014): 5000 doi: 10.1038/srep05000）、直径が1～20 nmのより小さなナノ孔については、標的および参照のdsDNAは、長さが少なくとも20bp相違するようにすべきである。

標的と参照分子でdsDNA長さをどの程度相違させることができるかについては見かけの上限はない。

図2Aは、1 M LiCl中、100 mVの下で727 bp DNAが25 nm径の固体ナノ孔を通過する際の典型的なイベントを示している。イベント面積は、影付き領域として示されている。図2Bは、dsDNAの長さに伴いイベント面積がどの程度増加するかを示している。主に、イベント深度を維持しつつイベント持続時間が増加しており、イベント面積（平均深度に持続時間を乗算したもの）は、持続時間に比例するため、この長さ依存的な増加を捕捉する。図2Cは、同じナノ孔で連続して試験された、示される各DNA長について記録された全イベントの面積（pA^*ms）の10を底とする対数の分布を示す。イベント面積の10を底とする対数の分布は、おおよそ正規（ガウス）である。DNAの長さが増加すると、この分布の平均も増加する。

2つのdsDNAの長さが少なくとも300 bp長、最大100,000 bp長である、標的配列を含むdsDNAおよび参照配列を含むdsDNAを作製する。いくつかの態様において、標的および参照dsDNA分析物は、少なくとも10 bp、20 bp、30 bp、40 bp、50 bp、60 bp、70 bp、80 bp、90 bp、100 bp、150 bp、200 bpまたは300 bpの長さの相違を有する。通常、サイズにより区別する場合、標的および参照dsDNA分析物の間の長さの差が大きくなると、標的および参照分析物に相関するイベントシグネチャーの決定の感度および特異性が高くなり、サンプルにおける相対存在量の推定が改善される。

いくつかの態様において、ゲノムDNA（gDNA）から切り出されたポリヌクレオチドフラグメントの特性を特定することは、部分存在量決定のワークフローの一部である。これらのフラグメントの特性は、例えば、それらの配列、長さ、および二次構造を含み得る。いくつかの態様において、フラグメントの特性は、ナノ孔デバイスによる特定配列の捕捉および検出を向上させる。

いくつかの態様において、標的および参照フラグメントは、標的／ペイロードおよび参照ペイロード分子が十分に異なるナノ孔イベントシグネチャーを生じるよう、異なるペイロード分子に結合される。いくつかの態様において、異なるイベントシグネチャーは、イベント持続時間、イベント最大深度、イベント平均深度および／またはその他のイベント特性の組み合わせである。

いくつかの態様において、標的および参照分析物は、配列特異的なペイロードによって区別され、各分子または複合体タイプ（標的・ペイロード、参照・ペイロード）が孔を通過する際、固有のナノ孔イベントシグネチャーが生成される。区別を容易にするよう各分子タイプに結合するペイロードに結合されるプローブを使用する方法は、国際公開番号WO/2015/171169、「Target Detection with a Nanopore」、国際公開番号WO/2014/182634、「A Method of Biological Target Detection Using a Nanopore and a Fusion Protein Binding Agent」、国際公開番号WO/2016/049657、「Target Sequence Detection by Nanopore Sensing of Synthetic Probes」、国際公開番号WO/2016/126746、「Nanopore Detection of Target Polynucleotides from Sample Background」、および国際公開番号WO/2017/173392、「Nanopore Discrimination of Target Polynucleotides from Sample Background by Fragmentation and Payload Binding」に記載されており、これらの各々の全体を参照により本明細書に組み入れる。

いくつかの態様において、標的および／または参照分析物は、dsDNAであり、ナノ孔で検出される2つの高分子タイプを生成するよう、各dsDNAタイプ（標的および参照）に固有のペイロードが結合されたPNAが組み込まれる。いくつかの態様において、標的および／または参照分析物は、DNAまたはRNAを含む一本鎖核酸（ssNA）である。ペイロードが結合された相補性核酸（例えば、LNA）がssNAの一領域にハイブリダイズし、1つまたは複数の隣接プライマーが、ssNAの他の領域にハイブリダイズして、ペイロードが結合された二本鎖分子を形成し、ペイロードは標的および参照に固有のものであり、固有の標的および参照イベントプロフィールを生成する。

部分存在量フレームワーク
いくつかの態様において、部分存在量フレームワークは、1）標的分析物および参照の両方のタイプについて、サンプル物質をナノ孔検知形式に変換する生化学的方法を設計および適用すること、2）個別のナノ孔実験プロトコルを適用すること、ならびに3）分析方法を適用し、参照分析物に対する標的の相対存在量についての推定量を得ること、を含む。この節では、このフレームワークの第1部に着目する。

ナノ孔検出のためのサンプル調製
標的配列を含む分子（「標的分析物」または「標的分子」と称される）および参照配列を含む分子（「参照分析物」または「参照分子」と称される）は、物理的に類似したものであり得、例えば、標的および参照分子は、類似の分子量またはポリヌクレオチド長を有するものであり得、単一ヌクレオチドでのみ相違するものであり得る。この生化学的方法の目標は、標的および参照分子が、ナノ孔を通じて移動する際にバイアスなしに別個の「標的」または「参照」イベントプロフィールを生成するようにすることである。このようにして、ナノ孔で測定された標的：参照混合物は、サンプルにおける標的：参照濃度比を示す。

いくつかの使用例において、別個のイベントプロフィールを生成するよう標的、参照または両分子にポリヌクレオチド配列を付加することが有益であり得る。例えば、血液または尿の無細胞循環DNA画分から得られる大部分のDNAフラグメントは、長さが一様に短く150～200 bpである。PCR、ライゲーションおよび直接オリゴヌクレオチドハイブリダイゼーションを含む一般的方法によるポリヌクレオチド配列の付加は、ナノ孔イベントの区別を最大化する柔軟性を与える。他の例において、共有結合されたポリマーペイロードを含む化学修飾されたオリゴヌクレオチドプローブのハイブリダイゼーションは、ポリヌクレオチド長に影響を及ぼすことなく標的または参照分析物の電荷および分子量を変化させるために使用される。すべての例において、目標は、標的および参照分子群ごとの別個のイベントプロフィールである。

ナノ孔検知前にPCRを必要としない濃縮計画を使用することができる十分な出発物質があるGMOの実施例（GMO標的配列を含むダイズ種子の部分量）を含む使用例がある。血液または尿サンプルが液体1 mLあたり<10個の標的配列しか含まないことがあるため、濃縮の一部としてPCRが必要となる液体生検を含む他の例もある。提案される方法は、サンプル収集、精製ならびに標的および参照の濃縮を含むサンプル調製要件に関して不可知論的である。ナノ孔による測定およびその後の部分存在量の定量は、標的および参照がバックグラウンド（<1 pM）と比較して十分に濃縮されている（>10 pM）場合、ならびに標的および参照分析物が、存在する場合、相互からおよびバックグラウンドから区別可能である電気的イベントシグネチャーを生成する場合、実施可能である。

いくつかの態様において、標的または参照分析物は、20 nt～100,000 ntの長さのポリヌクレオチド配列（二本鎖および一本鎖DNA、RNAおよび合成ポリヌクレオチドを含む）を含む。いくつかの態様において、標的配列を含むポリヌクレオチドは、植物、ヒト、動物、昆虫、細菌またはウイルスからを含む、生物のgDNAから得られる。いくつかの態様において、標的ポリヌクレオチド配列は、プラスミド、BAC、直鎖配列確認済み遺伝子ブロック、発現カセットを含む供給源由来の二本鎖または一本鎖RNAまたはDNAを含む外因性、非ゲノム性配列から得られる。

いくつかの態様において、本発明者らは、ナノ孔デバイスによる部分存在量（例えば、コピー数多型）検出に特化した濃縮を提供する。いくつかの態様において、本発明者らは、ナノ孔による検出のためにサンプルを調製するために部位特異的断片化法を使用する。いくつかの態様において、本明細書で提供される検出方法は、長さを20～100,000 ntまたは塩基対にする核酸サンプル、例えばgDNAのポリヌクレオチド断片化の上流断片化を含む。いくつかの態様において、核酸は、制限酵素を用いてまたはCas9/sgRNA、TALENS、ジンクフィンガータンパク質／ヌクレアーゼを含む部位特異的ヌクレアーゼもしくは当技術分野で公知の別の断片化法を使用することによって配列特異的に断片化される。

いくつかの態様において、標的または参照分析物の濃縮は、標的フラグメントサイズを保持、廃棄および溶出する正または負のサイズ選択を用いて実施される。例えば、高分子量ポリヌクレオチド種（例えば、>8,000 bp DNA）を保持および廃棄するためのPEGの存在下での低いSPRIビーズ：DNAの比（0.6）、その後のフラグメントサイズ（例えば、2000～8000 bp）を結合、洗い流しおよび溶出するためのSPRIビーズ：DNA（1.5：1）。いくつかの態様において、標的または参照核酸は、ナノ孔における検出を容易にするよう、核酸増幅に供され得る。

ナノ孔検出
部分存在量フレームワークは、1）標的分析物および参照の両方のタイプについて、サンプル物質をナノ孔検知形式に変換する生化学的方法を設計および適用すること、2）個別のナノ孔実験プロトコルを適用すること、ならびに3）数学的方法を適用し、参照分析物に対する標的（標的：参照）の相対存在量についての推定量を得ること、を含む。この節では、第2部の実験プロトコルに着目する。

混合未知サンプルにおける標的分析物の真の相対存在量の改善された推定値を提供するよう繰り返しサンプルをナノ孔において試験することが、本明細書に記載されている。いくつかの態様において、標的分析物および参照分析物は、ナノ孔センサを用いた各種間の信頼性のある区別を実現するよう調製される。いくつかの態様において、標的配列を含むフラグメント（すなわち、「標的フラグメント」）の特徴および参照配列を含むフラグメント（すなわち、「参照フラグメント」）の特徴は、これら2つのフラグメントが、1つまたは複数の信号特性によって差別化され得るナノ孔イベントシグネチャーを生成するよう選択される。

いくつかの態様において、1つまたは複数の対照混合物（すなわち、対照サンプル）が、未知混合物における参照に対する標的の部分量の推定値を較正するために使用される。いくつかの態様において、較正は、標的および参照分子タイプの間のナノ孔捕捉効率の差を補償する。

いくつかの態様において、標的および参照分析物の未知混合物がナノ孔において測定され、参照に対する標的の部分存在量が数学的に定量される。いくつかの態様において、同じサンプルから得られる、標的と参照分子タイプとの2つ以上の未知混合物が、同じナノ孔において連続して測定される。いくつかの態様において、同じサンプルから得られる、標的と参照分子タイプとの2つ以上の未知混合物が、異なるナノ孔において並行して測定される。

いくつかの態様において、100％標的単独、100％参照単独ならびに標的および参照分子の既知混合物を含む1つまたは複数の対照が、未知混合物の前および／または後に、ナノ孔において測定される。

いくつかの態様において、実験プロトコルは、ナノ孔において未知混合物を試験する前もしくは後、または前および後に、ナノ孔において1つまたは複数の対照を連続して試験することを含む。対照は、100％標的分析物、または100％参照分析物から構成され得、これらは、「単独対照」と称される。対照はまた、「混合対照」または「対照混合物」と称される、標的および参照分析物の任意の既知混合物であり得る。対照混合物は、1：1比の標的：参照分析物、または0.01：1～100：1の任意の他の比の標的：参照分析物、または0.01：1未満の任意の比（例えば、0.001：1）もしくは100：1超の任意の比（例えば、1000：1）の標的：参照分析物であり得る。1つまたは複数の対照が、2回以上試験され得る。対照（単独および混合物）ならびに未知混合物は、同じナノ孔において任意の順で連続して試験され得る。対照および未知サンプルの間で、ナノ孔が分子を捕捉する流体チャネル（すなわち、チャンバ）が洗い流される。

いくつかの態様において、対照は試験されず、未知混合物のみが試験され、そして実験前に別途対照を試験することによって作製された参照テーブルと比較される、すなわち、対照は使用時点で試験されない。

いくつかの態様において、1つまたは複数の流れ的に隔離されたチャネルおよびナノ孔センサが対照を測定し、並行して1つまたは複数の流れ的に隔離されたチャネルおよびナノ孔センサが未知物を測定する。2つ以上のナノ孔が、各流体チャネルに対するアクセス性を有し得る。並行実施の場合、各孔で1つの試薬セットのみ、すなわち、対照（単独もしくは混合物）または未知物（1つまたは複数の未知物のセットから）が使用されるため、洗い流しは必要でないことがある。

いくつかの態様において、対照混合物濃縮物における標的分析物に対する参照分析物の比は、未知サンプルにおける標的分析物に対する参照分析物の予想される比の付近であるが、これは事前にわからない場合もある。

任意の数の未知混合物が、同じナノ孔において連続して試験され得、各々の新しい未知物が測定のために添加される前に、その前の未知物が洗い流され得る。これは、未知混合物が同じ標的および参照分析物タイプから構成されることを必要とするが、それらの比は異なる未知物間で同じであっても異なっていてもよい。

各々の記録期間は、各試薬タイプにつき少なくとも100のイベントを検出するのに十分長くすべきであり、性能はより多くのイベントが記録されるほど改善され、その改善は、500を超えるイベントが記録される場合に有意であり、1000を超えるイベントが記録される場合に非常に有意である。各試薬セットに対する記録期間は、同じであっても異なっていてもよい。適応スキームは、目標数の分子が検出されたときに動的に記録を停止し得る。本発明者らは以前に、本ワークフローにおいて任意の試薬セット（対照または未知）に適用することができる所望のレベルの信頼性（例えば、95％、98％、99％、99.9％等）を達成するために必要とされる分子の数を決定する方法を確立した（SI Section 10.2, Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang, and William B Dunbar. "Nanopore-Based Target Sequence Detection." Edited by Meni Wanunu. PloS One 11, no. 5 (May 5, 2016): e0154426-21. doi: 10.1371/journal.pone.0154426）。

いくつかの態様において、単一のナノ孔を用いる実験プトロコルは、1）記録期間Tの間、100％標的を試験し、2）ナノ孔チャンバを洗い流し、3）記録期間Tの間、100％参照を試験し、4）ナノ孔チャンバを洗い流し、5）記録期間Tの間、50：50標的：参照混合物を試験し、6）ナノ孔チャンバを洗い流し、7）記録期間Tの間、未知混合物を試験するというものである。記録期間Tは、15秒間、30秒間、45秒間、1分間、5分間、10分間または1～15秒間もしくは10～60分間の任意の期間であり得る。

別の共通実験プトロコルは、（1）～（7）を行った後に、8）ナノ孔チャンバを洗い流し、9）記録期間Tの間、100％標的を再試験し、10）ナノチャンバを洗い流し、11）記録期間Tの間、100％参照を再試験し、12）ナノチャンバを洗い流し、13）記録期間Tの間、50：50標的：参照混合物を再試験するというものである。

別の共通実験プトロコルは、（1）～（7）を行った後に、8）ナノ孔チャンバを洗い流し、9）記録期間Tの間、50：50標的：参照混合物を再試験し、10）ナノ孔チャンバを洗い流し、11）記録期間Tの間、100％参照を再試験し、12）ナノチャンバを洗い流し、13）記録期間Tの間、100％標的を再試験するというものである。

さらに別の共通実験プトロコルは、1）記録期間Tの間、未知混合物における標的：参照比におおよそ近いと考えられる標的：参照対照混合物比を試験し、2）ナノ孔チャンバを洗い流し、3）記録期間Tの間、未知混合物を試験するというものである。

さらに別の共通実験プロトコルは、1）記録期間Tの間、1：1標的：参照対照混合物比を試験し、2）ナノ孔チャンバを洗い流し、3）記録期間Tの間、未知混合物を試験するというものである。

いくつかの態様において、単一のナノ孔を用いる実験プロトコルは、1）記録期間Tの間、100％標的を試験し、2）ナノ孔チャンバを洗い流し、3）記録期間Tの間、100％参照を試験し、4）ナノ孔チャンバを洗い流し、5）記録期間Tの間、未知混合物を試験するというものである。

いくつかの態様において、単一のナノ孔を用いる実験プロトコルは、1）記録期間Tの間、100％標的を試験し、3）ナノ孔チャンバを洗い流し、4）記録期間Tの間、未知混合物を試験するというものである。

いくつかの態様において、単一のナノ孔を用いる実験プロトコルは、1）記録期間Tの間、100％参照を試験し、2）ナノ孔チャンバを洗い流し、3）記録期間Tの間、未知混合物を試験するというものである。

いくつかの態様において、単一のナノ孔を用いる実験プロトコルは、記録期間Tの間、未知混合物のみを試験し、そして未知混合物における標的分析物の部分存在量の推定を改善するよう記録期間Tから生成されたデータに対して少なくとも1つの補正項を提供するために、各々が未知混合物に対する実験プロトコルと実質的に類似の条件下で試験された、100％参照対照サンプル、100％標的対照サンプル、既知の標的：参照対照混合物、またはそれらの任意の組み合わせから得られた誤差補正情報を含むルックアップテーブルからのデータまたは過去データを使用するというものである。

実験プロトコルの完了後、対照（試験された場合）から記録されたイベントおよび未知物から記録されたイベントが数学的に分析され、1つまたは複数の未知物における参照に対する標的の部分量が予測される。

部分存在量の推定およびしきい値の決定
部分存在量フレームワークは、1）標的分析物および参照の両方のタイプについて、サンプル物質をナノ孔検知形式に変換する生化学的方法を設計および適用すること、2）個別のナノ孔実験プロトコルを適用すること、ならびに3）数学的方法を適用し、参照分析物に対する標的（標的：参照）の相対存在量についての推定量を得ること、を含む。この節では、このフレームワークの第3部に着目する。

いくつかの例において、参照配列「r」に対する標的配列「t」の推定濃度比R = [t]/[r]が定量される。導入遺伝子の比率またはGMO％は、百分率に変換された比Rである。いくつかの例において、全体（標的および参照配列）に対する標的配列の推定部分量F = [t]/([t]+[r])が定量される。比Rと部分Fの間で単純な変換、すなわちF = R/(R + 1)または同じ様にR = F/(1-F)、がなされる。

部分存在量法は、参照に対する標的または全体（標的および参照の和）に対する標的の相対量を予測する。いくつかの態様において、標的または参照のいずれかの分子の絶対濃度を決定するために、較正用分子が添加され得る。いくつかの態様において、一定濃度の較正分子に対する標的分子の相対捕捉率が、サンプル中の標的分子の濃度に相関づけられ得、複数のナノ孔から得られる情報が、標的分子の濃度を決定するために使用され得る。

いくつかの態様において、部分存在量を計算するために、単一ナノ孔イベントの特徴が、標的および参照分析物タイプの間で比較される。いくつかの態様において、部分存在量を計算するために、2つ以上のナノ孔イベントの特徴が、標的および参照分析物タイプの間で比較される。

本発明者らは、標的分析物および参照分析物に相関するイベントシグネチャーを区別するためのしきい値の決定を改善するためならびに部分存在量を決定するためのナノ孔からのイベントシグネチャーの使用に起因する誤差を補正するための方法を、本明細書に3つ記載する：1）Q検定法、2）サポートベクターマシン（SVM）および3）ガウス混合期待値最大化アルゴリズム（EMGM）法。

以下の一般概念をこれらの方法に適用する。最初に、参照分析物「r」に対する標的分析物「t」の真の比はR = [t]/[r]で表される。全（標的および参照）分析物に対する標的分析物の真の部分量は、F = [t]/([t]+[r])で表される。比Rと部分Fの間の単純な変換は、F = R/(R + 1)または同じ様にR = F/(1-F)、である。未知混合物の真の比は、R_mixで表され、混合物の真の部分量は、F_mixで表される。F_mixおよびR_mixの推定値は数学的方法によりから得、これらは

で表される。標的および参照分子構築物は、別個のナノ孔イベントシグネチャーを生じるよう、設計および作製される。

Q検定法
この数学的方法は、最初に、すべての記録されたイベントを1つまたは2つのカテゴリー、すなわち、標的陽性（参照陰性と同等）または標的陰性（参照陽性と同等）に分割するための基準を設計する。このイベント基準は、1つまたは複数のイベント特徴を使用する。いくつかの態様において、単一の特徴が、イベントを分割するための基準を作成するために使用される。この基準の下で、それぞれのイベントに、標的イベントまたは参照イベントのいずれかのタグが付与される。これらは、「標的タグ付き」または「参照タグ付き」と称される。

標的タグ付きイベントの部分量は、Qで表され、これは標的タグ付きイベントの数を総イベント数で割ったものに等しい。参照タグ付きイベントの部分量は、1-Qである。タグ付き部分量Qは、Q(F)と記述される、ナノ孔上での濃度部分量Fの関数である。

混合物Q(F_mix)における標的タグ付きイベントの部分量は、Q_mixで表され、100％標的対照Q(1)における標的タグ付きイベントの部分量は、Q_targで表され、100％参照対照Q(0)における標的タグ付きイベントの部分は、Q_refで表され、標的：参照対照混合物における標的タグ付きイベントの部分は、Q_X:Yで表され、ここでX:Yは、対照混合物における標的対参照の混合物の比である。部分量z = X/(X + Y)の場合、本発明者らはQ(z) = Q_X:Yとする。いくつかの態様において、z = 0.5の1：1比の対照混合物が好ましく、そのタグ付きの部分量は、Q_1:1またはQ_50:50と記述される。

典型的に、Q_targは1に近く、1-Q_targは偽陰性の部分量を表す。典型的に、Q_refは0に近く、Q_refは偽陽性の部分量を表す。対照は、Q_targ≧Q_X:Y≧Q_refを満たす。混合物は、Q_targ≧Q_mix≧Q_refを満たす。

いくつかの態様において、対照由来の標的タグ付きの部分量（Q_targ、Q_ref、Q_X:Y）は別途試験され、Q_mixを測定する任意の新しいアッセイにおける値を参照するためにルックアップテーブルが使用される。いくつかの態様において、（Q_targ、Q_ref、Q_X:Y）は、アッセイの一部として使用時点で確立される。いくつかの態様において、（Q_targ、Q_ref）は別途実施され、それらの値を参照するためにルックアップテーブルが使用され、（Q_X:Y）値はQ_mixを測定するアッセイの一部として使用時点で確立される。

いくつかの態様において、対照由来の標的タグ付きの部分量（Q_targ、Q_ref、Q_X:Y）は、使用時点で複数回試験され、以下の次式におけるその後の使用のためにそれらの値が平均化される。

真の部分量F_mixの推定値

についての式は、

によって与えられ、式中

である。

真の比R_mixの推定値

についての式は、

によって与えられる。

導入遺伝子（GMO）の部分量を予測する例において、GMO（％）は、

に等しい。

パラメータρは、偽陽性検出誤差、偽陰性検出誤差またはその両方を補償することができる比の推定値である。いくつかの態様において、Q_refの値は、偽陽性誤差を補償するために使用することができる。偽陽性誤差に対する補償が使用されない場合、Q_refは、0に設定することができる。いくつかの態様において、Q_targの値は、偽陰性誤差を補償するために使用することができる。偽陰性誤差に対する補償が使用されない場合、Q_targは、0に設定することができる。

パラメータαは、比の補償乗数である。分析的に、パラメータαは、2つの捕捉率定数の比である。捕捉率定数は、特定の分子タイプについてナノ孔イベント率を濃度で割ったものである。詳細に、パラメータαは、参照分子捕捉率定数を標的分析物捕捉率定数で割ったものである。したがって、この乗数αは、標的と参照の分子タイプ間のナノ孔捕捉および検出の差を補償する。

対照混合物が1：1比のとき、

である。

標的分析物と参照分析物の間の捕捉率定数差に対する補償が使用されない場合、それぞれ

の推定値を提供するよう、等式（1）および（2）においてαが1に設定される。

等式（1）および（2）の適用は、それぞれ、

の推定値を提供する。

についての不確かさ推定またはエラーバーもまた、算出することができる。単独および混合対照についてならびに未知混合物についての各Qは、それに付随する標準誤差

を有し、式中Nは総イベント数である。等式（1）および（2）を適用することによって

の値の分布を生成するために、数的に、各Q分布からの無作為サンプルが複数回抽出され得る。次いで、

の分布は、不確かさ境界を算出し、

を導くために使用され得る。

いくつかの態様において、イベント特徴基準に一致するまたはイベント特徴基準を超過するイベントの比および部分量は、未知混合物における参照に対する標的の部分量を推定するために使用される。いくつかの態様において、基準はしきい値である。

本発明者らの以前の報告は、Qおよびそのエラーバーを算出するために単一のタグ付け基準をどのように利用するかを説明している（Morin, Trevor J, Tyler Shropshire, Xu Liu, Kyle Briggs, Cindy Huynh, Vincent Tabard-Cossa, Hongyun Wang and Willian B Dunbar. "Nanopore-Based Target Sequence Detection." Edited by Meni Wanunu. PloS One 11, no. 5 (May 5, 2016): e0154426-21. doi: 10.1371/journal.pone.0154426）。この報告で詳述されているように、この基準を適用することにより、各イベントjは、それに割り当てられた変数Z_jを有する。イベントjがタグ付けされる場合、Z_j = 1であり、それ以外の場合は、Z_j = 0である。各試薬セット（対照および未知物）において、Q = (Σ_jZ_j)/Nであり、式中Nは総イベント数である。上記式（等式（1）～（2））で利用されるすべてのQ値を算出するために、同じ基準が、すべての対照、単独および混合物ならびにすべての未知物に適用される。

この基準は、1つまたは2つ以上の不等式を含み、それらは1つまたは複数のイベント特徴の線形または非線形関数であり得る。各不等式は、それに関連するしきい値またはしきい値範囲を有する。したがって、基準は、不等式のセットおよび対応するしきい値のセットによって十分に特定される。

いくつかの態様において、基準は、標的および参照分子タイプのクラスごとに確立され、そのクラスの分子タイプを用いる新しいアッセイは、すでに確立されている基準を利用する。

いくつかの態様において、基準は、任意の新しいアッセイで収集される対照データから見出される。すなわち、基準は、部分存在量プロトコルの一部として実施時に確立される。

いくつかの態様において、基準についての不等式のセットは、同等の標的および参照分子タイプを用いた過去の実験セットから事前に確立され、1つまたは複数の基準不等式のためのしきい値のセットは、対照データを用いて実施時に確立される。

いくつかの態様において、単一のイベント特徴が、基準の確立に利用される。

「q」で示されるしきい値は、不等式に基づき標的タグ付きイベントを非標的タグ付き（すなわち、参照タグ付き）イベントから分離するスカラー値である。2つ以上の不等式が基準に使用される場合、qは、不等式のセットで使用されるしきい値のベクトルを表し得る。

標的および参照として2つの異なる長さのdsDNAを用いる例を考察する。一般に、イベント面積を用いる単一の不等式が、実行可能な基準である。標的が参照dsDNAよりも長いdsDNAであるとき、イベントは、その面積がしきい値を超える場合にタグ付けされる。標的が参照dsDNAよりも短いdsDNAであるとき、イベントは、その面積がしきい値未満である場合にタグ付けされる。

1つのq値がその基準の各不等式を用いて特定される、qしきい値または値群の選択を自動化するために、異なる方法が利用され得る。

いくつかの態様において、qしきい値は、Q_refについて所望の偽陽性を生じる値として見出される。例えば、qしきい値は、5％の偽陽性を生じるようQ_refの95パーセンタイルに設定され得る。その例において、参照分子イベントの95％は、q未満の面積を有する。あるいは、SFT qしきい値が、Q_targについて所望の偽陰性を生じる値として見出される、すなわち、qしきい値は、5％の偽陰性を生じるようQ_targの5パーセンタイルに設定され得る。

いくつかの態様において、SFT qしきい値は、

に対する解として見出される。しきい値は、Q_targとQ_refの間の最大距離に対応する値であろう。

いくつかの態様において、qしきい値範囲が、Q_refについての所望の偽陽性範囲を示す値として算出される。例えば、qしきい値範囲は、Q_refの95パーセンタイル～99パーセンタイルに及び得る。

いくつかの態様において、qしきい値範囲が利用される場合、等式（1）および（2）は、

値の範囲を生成し、これらの範囲の平均が算出され、予測される

値として報告される。

標的DNAおよび参照DNAに結合された2つの異なるペイロードを用いる例を考察する。通常、イベント平均コンダクタンスおよびイベント持続時間を用いる3つの不等式が、実行可能な基準である。詳細に、個々のペイロード・標的DNA分子構築物について、標的イベントは、平均δG 対持続時間の2Dイベントプロット上に固有のサブ空間を生成し、イベントは、持続時間がしきい値よりも長い場合および平均δGが1つのしきい値を上回りかつ別のしきい値を下回る場合にタグ付けされる。この例において、タグ付け基準は、2つのイベント特徴（平均δG、持続時間）を用いて3つの線形不等式および3つのしきい値によって表される。

SVM法
いくつかの態様において、各イベントを標的分析物イベントまたは参照分析物イベントとタグ付けするための特徴セットおよび特徴基準を特定するために、機械学習が使用される。いくつかの態様において、イベントを標的または参照分析物に分類するために、サポートベクターマシンが使用される。

いくつかの態様において、サポートベクターマシンワークフローの構築は、以下の工程を含む：1）ナノ孔データの入力、2）イベントを区別するナノ孔イベント特徴の選択、3）対照を用いたモデル訓練および試験、4）対照を用いたデータ較正、5）未知標的：参照混合物の予測。いくつかの態様において、すでに構築され単純化されたサポートベクターマシンワークフローが、自動部分存在量予測のために実施される。

いくつかの態様において、機械学習ツールは、イベント特徴、不等式の形式（線形および／または非線形）ならびに不等式で使用されるしきい値qの選択を含む、基準の選択を自動化するよう適用される。いくつかの態様において、分類問題を解決する教師付き機械学習法であるサポートベクターマシン（SVM）が、タグ付け基準を生成するために実施される。SVMに関する参考文献は、Cortes, C. & Vapnik, V. Machine Learning (1995) 20: 273、およびBoser, B.E., Guyon, I.M., and Vapnik, V.N. (1992). "A training algorithm for optimal margin classifiers," Proceedings of the fifth annual workshop on Computational learning theoryを含み、これらの各々の全体が参照により組み入れられる。

本発明者らの部分存在量フレームワークへのSVM法の適用の例が以下に提供される。

線形的に分離可能なデータについて、｛x₁,...,x_n｝をデータセットとし、

をx_iのクラスラベルにすると、決定境界は、

によってすべての点を分類するはずである。

すべての点を分類するマージンを最大化するため、分類問題は、以下の最適化問題となる：

となるように

を最小化する。

決定境界に近いデータ点は、サポートベクターと呼ばれる。

現実世界の問題について、データは通常、いくつかの異常値またはノイズが原因で線形的に分離可能でない。分類を最適化するために、数個の誤分類される点を許容するようマージンを調整した。同時に、誤分類される例に、高コストの罰則を与えた。このマージンは、ソフトマージンになる。ソフトマージン分類は、「スラック」変数をコスト関数に加えることによって使用され得る（図3A）。

となるように

を最小化する。

線形的に分離可能でないデータを扱う第2の方法は、カーネル法である（Boser, B.E., et al., 上記引用の通り）。それは、入力特徴空間をより高次空間に変形させる。そうすることによって、データは線形的に分離可能となり得る（図3B）。マッピング関数をφ(x)とすると、カーネル関数Kは、

と記述され得る。

複数のカーネル関数タイプが利用可能である。最も一般的なタイプをここに列挙する。
線形カーネル

多項式カーネル

ガウス（RBF）カーネル

通常、カーネルトリックおよびソフトマージンの両方が、分類問題に対するより良い解をもたらすよう一緒に使用される。

部分存在量に関するナノ孔データへのSVMの適用は、以下の工程を含む：1）各セットの全イベントを含む、対照および未知データセットの入力；2）特徴選択；3）モデル訓練および試験；4）データ較正；ならびに5）

の予測。提供される実施例では、これらの5工程の適用がより詳細に実証されている。等式（3）および（4）、カーネルタイプ、ソフトマージン定数およびカーネル関数が依存し得る任意のパラメータを含むハイパーパラメータグリッド検索が、この方法を適用する一部として解かれる。共通決定境界および共通較正比を含むSVMから生成されるアッセイベースの一般化モデルは、対照データセットを必要とすることなく、未知混合物に適用され得る。

共通決定境界および共通較正比を含むSVMから生成されるアッセイベースの一般化モデルは、対照データセットを必要とすることなく、未知混合物に適用され得る。決定木、ニューラルネットワーク、単純ベイズ（Native Bayer）、ロジスティック回帰、K近傍およびブースティングを含む他のデータマイニング法も、ナノ孔データに適用可能な方法として言及する。

EMGM法（ガウス混合期待値最大化アルゴリズム）
いくつかの態様において、標的イベントおよび参照イベントをタグ付けするための基準を策定するためにクラスタリング法が適用される。各イベントは、標的イベントまたは参照イベントとタグ付けされる。いくつかの態様において、部分存在量は、標的および参照イベントの和に対する標的イベントの比率である。補償情報を提供する対照を使用することで、部分存在量の推定を改善する調整が可能となる。

いくつかの態様において、クラスタリング法は、1つまたは複数のイベントパラメータの分布のパラメータ化モデルに適用される最尤法である。対照セットに最尤推定を繰り返し適用することにより、1つの分布セットが標的分析物タイプに関連し、他の分布セットが参照分析物タイプに関連するフィッティングされたモデルパラメータが得られる。その後の、未知混合物に対するパラメータ化モデルの適用により、イベントが標的または参照分布のいずれかに割り当てられ、標的および参照分布に割り当てられたイベントの総数に対する標的分布に割り当てられたイベントの比が、部分存在量の推定値を得るために使用される。

対数尤度関数は、アルゴリズムの繰り返しの中で進展を追跡するためのメトリックとして使用され、対照データにおける各イベントのメンバーシップ割り当てを再帰的に更新し、データに対する分布のフィッティングを改善する。いくつかの態様において、データは、パラメータ化されたガウス分布の混合を用いてモデル化される。数値データを特徴づけるためにガウス混合モデルを含む有限混合モデルを使用する方法は、統計学および応用数学において十分に特徴づけられている（Hand, David J., Heikki Mannila, and Padhraic Smyth. Principles of data mining. MIT press, 2001）。

いくつかの態様において、ガウス混合（GM）モデルの下、この方法は、成分の平均および共分散ならびに混合係数を含むパラメータに関する尤度関数を最大化する。対数尤度に閉形式解は存在しないので、データをモードに割り当てるためのモードパラメータおよびウェイトは、期待値最大化（EM）技術を用いて繰り返し算出される（C.M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006）。

部分存在量の推定値を生成する目的でGMモデルに適用されるEMアルゴリズムをナノ孔データに適用する方法は、EMGMと呼ばれる。Q検定法と同様、EMGM法は、標的イベントを参照イベントから区別するために使用することができる1つまたは複数のナノ孔イベントシグネチャーについての以前の知識を使用する。

記載されているように、標的集団は、単一の分布または2つ以上の分布によって表され得る。同様に、参照集団も、単一の分布または2つ以上の分布によって表され得る。標的および参照分布は、このアルゴリズムを1つまたは複数の単独対照および1つまたは複数の対照混合物に適用することによって確立される。

次に、標的分布が確立された後、未知混合物におけるイベントは、それがモデル化された標的分布に関連する場合に標的イベントとタグ付けされる。

例として、1つのモードが標的タイプに関連し、2つのモードが参照タイプに関連する合計3つのガウス分布が、1：1対照混合物における全データセットをフィッティングすることができた。

このアルゴリズムは、EMGMの適用のために対照混合物を1つしか必要としない。次に、得られたモデルが、未知混合物に適用され得る。いくつかの態様において、追加の単独参照対照が、偽陽性の影響を相殺するために使用される。詳細に、100％参照対照へのEMGMモデルの適用は、偽陽性部分量を生成し、これは、EMGMモデルを未知混合物に適用することによって生成される予想される部分量から差し引かれる。この減算は、偽陽性補償（または「FP」補償）と称され得る。

多孔コンセンサスコールを実施する態様
いくつかの応用において、上記および下記システムの態様は、より正確な部分存在量および／または濃度の推定値を生成するために、複数の孔から標的サンプル成分の部分存在量および／または濃度の推定値を生成することができる。したがって、（例えば、1つまたは複数のナノ孔デバイスの）個々の孔からの出力は、部分存在量および／または濃度の改善された推定値を生成するよう、組み合わせて処理され得る。特に、部分存在量および／または濃度の推定値は、共通の（すなわち、対照由来、未知混合物由来の）サンプルの異なるアリコートを処理する単一のまたは複数のマイクロ流体ナノ孔デバイス（例えば、消耗品）から生成され得、1つまたは複数のナノ孔からの結果が推定値の生成に寄与する。

したがって、以下により詳細に記載されるよう、1つまたは複数の方法は、1つまたは複数のナノ孔デバイスにおいてナノ孔セットをまたぐ電圧を印加して、標的分析物および参照分析物の単位を含むサンプルの一部において検出可能な電気的シグネチャーを生成し、ナノ孔セットを通じた荷電分析物の移動を誘導する工程；ナノ孔セットを通じた標的分析物および参照分析物の単位の移動からイベントシグネチャーセットを生成する工程：イベントシグネチャーセットから、ナノ孔セットに対応し、標的分析物の部分存在量に関連するパラメータセットを生成する工程；対応するしきい条件にしたがいパラメータセットの各々を評価し、検証されたパラメータセットを生成する工程であって、対応するしきい条件の各々が、パラメータセットの値の間で決定される変動性の尺度の関数に基づき、検証されたパラメータセットを生成することは、対応するしきい条件を満たすパラメータ値を保持することを含む、工程；パラメータ組み合わせオペレーションにより（検証された）パラメータセットの値を組み合わせる工程；ならびにパラメータ組み合わせオペレーションの出力に基づき、標的分析物の部分存在量の推定値を返す工程、の1つまたは複数を含み得る。

図15Aは、サンプル中の標的分析物の部分存在量を決定するために任意数のナノ孔からのコンセンサスコールを用いる方法のフローチャートを示す。図15Aに示されるように、ナノ孔デバイス（例えば、以下に記載されるナノ孔デバイスの態様）に関連付けられたコンピューティングシステムは、1510で、ナノ孔デバイスの孔セットに対応する孔パラメータセットを受け取る。孔パラメータセットは、孔のセットと連通した電極からの電気信号（例えば、電流測定値）の出力から導き出され得、ここで上記のように、相対および部分存在量の推定値を決定するために[t]および[r]を決定する上で電気信号が有用であるが、代替の態様において、孔パラメータセットは、追加でまたは代替として、他の信号から導き出され得る。

コンピューティングシステムは、次に、1520で、1つまたは複数のしきい条件にしたがい孔パラメータセットの各々を評価する。しきい条件は、複数の孔からの出力に基づくしきい条件を含み得る。例えば、部分存在量の推定値を決定するために各孔の出力が他の孔の出力と組み合わせて処理されるべきかどうかを評価するためのしきい条件を設計するために、孔セットの2つまたはそれ以上の間の変動性の統計的尺度が使用され得る。変動性の統計的尺度は、複数孔間のパラメータ値の範囲（例えば、四分位範囲）、複数孔間のパラメータの分散、複数孔間のパラメータ値の標準偏差、および任意の他の適切な統計的または非統計的尺度の1つまたは複数を含むかまたはそれから導き出され得る。他の態様において、しきい条件は、各孔が他の孔の出力に非依存的に評価される様式で構成され得る。

図15Aに示されるように、コンピューティングシステムは、次に、孔パラメータセットの評価に基づき、1530で、パラメータ組み合わせオペレーションにより、それらの各々のしきい条件を満たす孔パラメータのサブセットを組み合わせる。パラメータ組み合わせオペレーションは、それらの各々のしきい条件を満たす孔パラメータのサブセットから決定される平均（average）パラメータ値（例えば、平均（mean）、中央値、モード）を出力し得る。いくつかの態様において、平均パラメータ値は、重み付けされた平均であり得、重み付けされた平均を算出するために使用される各パラメータに付与される重みは、工程1520のしきい値ベースの比較（例えば、対応するしきい条件の充足レベル）に基づき決定され得る。1つの態様において、パラメータ値とそれらの各々のしきい条件の間の距離が、重みを決定するために使用され得る。例えば、しきい条件を低い程度満たすパラメータ値には小さい重みが付与され得、しきい条件を高い程度満たすパラメータ値にはより大きな重みが付与され得る。

図15Aに示されるように、コンピューティングシステムは、次に、1540で、工程1530のパラメータ組み合わせオペレーションの出力に基づき部分存在量の推定値を返し、部分存在量の推定値は、上記のように、標的分析物および参照分析物の集団全体と比較したサンプル中の標的分析物の比率を表す。以下の図15Dに関連する実施例においてより詳細に記載されるように、図15Aに示されるのと同様の方法も、標的サンプル成分の濃度を決定するために使用され得る。

図15Bは、サンプル中の標的分析物の部分存在量を決定するためにナノ孔デバイスの4つ孔からのコンセンサスコールを用いる態様を示し、図15Bは、図15Aに示される方法のより具体的な態様である。図15Bに示されるように、4つのナノ孔からの出力（例えば、電気信号または他の測定値）は、パラメータ値P1、P2、P3およびP4を生成するために使用され、コンピューティングシステムのロジックにより、最小から最大の順に配列される。コンピューティングシステムのロジックは、次に、P3-P2として四分位範囲（IQR）を定義し、値P1、P2、P3およびP4のうちの、存在する場合、いずれをさらなる分析のために通過させるべきかを決定するために一連のしきい条件を適用する。

第1の評価1501において、コンピューティングシステムは、パラメータ値P2およびP3の平均で割ったIQRを第1のしきい値と比較し、IQR/平均(P2,P3)が第1のしきい値より大きい場合、その実験が失敗であった（したがって、P1、P2、P3およびP4を破棄すべきである）と決定する。しかし、IQR/平均(P2,P3)が第1のしきい値より小さいまたはそれに等しい場合、P2およびP3をさらなる分析のために通過させ、コンピューティングシステムは、それらの各々のしきい条件にしたがいP1およびP4を評価する。

第2の評価1502において、コンピューティングシステムは、P2、IQRおよびXの関数と定義される第2のしきい値とP1を比較し、ここでXは定数である。図15Bに示されるように、第2のしきい値は、P2-X*IQRと定義され、具体的な態様において、Xの値は1.5に設定される。P1が第2のしきい値よりも小さい場合、P1は破棄すべきであるが、P1が第2のしきい値よりも大きいまたはそれに等しい場合、P1はさらなる分析のために通過させるべきである。

第3の評価1503において、コンピューティングシステムは、P3、IQRおよびYの関数と定義される第3のしきい値とP4を比較し、ここでYは定数である。図15Bに示されるように、第3のしきい値は、P3+Y*IQRと定義され、具体的な態様において、Yの値は1.5に設定される。しかし、他の態様において、XおよびYは互いと同一である必要はなく、第2および第3のしきい値は、別の適切な様式で定義され得る。P4が第3のしきい値よりも大きい場合、P4は破棄すべきであるが、P4が第2のしきい値よりも小さいまたはそれに等しい場合、P4はさらなる分析のために通過させるべきである。

図15Bに示されるように、それらの各々のしきい値を通過するP1、P2、P3およびP4の値は、1504で（例えば、平均値を決定することにより、重み付けされた平均を決定することにより）組み合わされる。重み付けされた平均が決定される態様において、それぞれP1、P2、P3およびP4に対応する重み値w1、w2、w3およびw4が、重み付けされた平均を生成するために使用される。

図15Cは、図15Bのシステムの態様により実施される方法のフローチャートを示す。より詳細に、図15Cは、複数のナノ孔からのパラメータ値についてのコールを入力として評価し、信頼値を付けてまたは付けずに出力（例えば、平均パラメータ値）を返すロジックの構成を表す。この構成は、[P1, P2, ..., PN]形式の入力配列を処理し、（状況,結果）形式の出力を返すことができ、ここで状況は、信頼性の尺度を示し（例えば、状況0は、返し出力なしを示し、状況1は、信頼性なしの返し出力を示し、状況2は、信頼性ありの返し出力を示し）、結果は、複数のナノ孔から決定される組み合わされたパラメータ値（例えば、平均パラメータ値、重み付けされた平均パラメータ値）である。結果が平均パラメータである態様において、平均は、算術平均、幾何平均、重み付けされた平均および／または任意の他の適当な平均もしくは組み合わせ関数であり得る。

より詳細に、長さゼロの入力配列1511に対して、ロジックは、返し出力（0,0）を提供する。長さ1の入力配列1512に対して、ロジックは、返し出力（1,x）を提供し、ここでxはその入力配列のパラメータの値である。長さ2の入力配列1513に対して、ロジックは、2つのパラメータ値の間の差をしきい条件と比較し、しきい条件が満たされる場合、返し出力（2,平均(X))を提供し、ここで平均(X)はその入力配列の2つのパラメータの平均値である。しかし、しきい条件が満たされない場合、ロジックは、返し出力（1,平均(X))を提供する。

2より大きな長さを有する入力配列の場合、ロジックは、その配列のIQRを決定し、1514で、そのIQRに基づく所望の範囲内に含まれる配列のサブセットを処理し、ここで図15Cにおける所望の範囲はその配列の25および75四分位パラメータ値に基づき決定される。サブセットの長さが元の配列の長さの半分未満となる場合、ロジックは、返し出力（1,平均(X_good)）を提供し、ここでX_goodは所望の範囲内に含まれる配列のサブセットである。サブセットの長さが元の配列の長さの半分未満となる場合、ロジックは、レジーム1516に入り、そこで、その配列のサブセットの最大値と最小値の間の差がしきい値（TH）より大きい場合、およびその配列のIQR値の最大値と最小値の間の差がTHより大きい場合、ロジックは、返し出力（1,平均(X_in_IQR)）を提供し、ここでX_in_IQRはそのIQRの範囲内に含まれる入力配列の値を表す。その配列のサブセットの最大値と最小値の間の差がTHより大きいが、その配列のIQR値の最大値と最小値の間の差がTHより大きくない場合、ロジックは、その配列のIQR値の値の長さが1より大きいかどうかを決定し、そうであるとき、返し出力（2,平均(X_in_IQR)）を提供する。しかし、その配列のIQR値の値の長さが1より大きくないとき、ロジックは、返し出力（1,平均(X_in_IQR)）を提供する。

最後に、その配列のサブセットの最大値と最小値の間の差がしきい値（TH）より大きくない場合、ロジックは、サブセットの長さが1より大きいかどうかを決定し、そうであるとき、返し出力（2,平均(X_good)）を提供する。サブセットの長さが1より大きくないとき、ロジックは、返し出力（1,平均(X)）を提供する。

1つの例において、ロジックは、[ ]の入力配列に対して、(0,0)の（状況,結果）を出力し、この場合、ナノ孔データがないため返し出力がない。別の例において、ロジックは、[0]の入力配列に対して（1,0）の（状況,結果）を出力し、この場合、返し出力は結果0および状況1を有する（1つのみのナノ孔からのデータしか存在しないため、信頼性なし）。別の例において、ロジックは、[0,0]の入力配列に対して、(2,0)の（状況,結果）を出力し、この場合、返し出力は結果0および状況2を有する（2つのナノ孔が同一値0を返したことから、信頼性あり）。別の例において、ロジックは、[30]の入力配列に対して、(1,30)の（状況,結果）を出力し、この場合、返し出力は結果30および状況1を有する（1つのみのナノ孔からのデータしか存在しないため、信頼性なし）。別の例において、ロジックは、[30,31]の入力配列に対して、(2,30.5)の（状況,結果）を出力し、この場合、返し出力は結果30.5および状況2を有する（2つのナノ孔からのデータ値がしきい条件に対して近いことから、信頼性あり）。別の例において、ロジックは、[30,100]の入力配列に対して、(1,65.0)の（状況,結果）を出力し、この場合、返し出力は結果65.0および状況1を有する（2つのナノ孔からのデータ値がしきい条件に対して大きくかけ離れているため、信頼性なし）。別の例において、ロジックは、[30,31,100]の入力配列に対して、(2,30.5)の（状況,結果）を出力し、この場合、返し出力は結果30.5および状況2を有する（2つのナノ孔からのデータ値がしきい条件に対して近く、かつ第3のナノ孔からのデータ値が外れ値として扱われることから、信頼性あり）。別の例において、ロジックは、[30,31,32,33,34,35,36]の入力配列に対して、(2,33.0)の（状況,結果）を出力し、この場合、返し出力は結果33.0および状況2を有する（すべてのナノ孔からのデータ値がしきい条件に対して近いことから、信頼性あり）。別の例において、ロジックは、[30,31,32,33,34,100,98]の入力配列に対して、(2,32.0)の（状況,結果）を出力し、この場合、返し出力は結果32.0および状況2を有する（多数のナノ孔からのデータ値がしきい条件に対して近く、かつ2つのナノ孔からのデータ値が外れ値として扱われることから、信頼性あり）。

このようにして、記載される方法の態様は、変動性の他の尺度に基づく任意の適当なしきい条件を用いて、任意の適当な数のナノ孔から得られる情報に適用することができる。

さらに、上記のように、図15A～15Cに関連して記載される方法の局面は、複数の孔から得られる情報を用いて標的分子の濃度を決定するよう適合させることができる。図15Dは、複数のナノ孔から得られる情報を用いて標的分子の濃度を決定する方法の出力を示す。より詳細に、図15Dに示される出力に関連して、該システムの態様は、複数のナノ孔から得られる情報を用いて、高濃度の特定の較正分子に対する標的サンプル成分（例えば、分子、他の分析物）の相対捕捉率を決定し、そして複数のナノ孔から得られる情報を用いて標的サンプル成分の濃度を決定するためにその相対捕捉率を標的サンプル成分の濃度と相関づける。

その出力が図15Dに示されている特定の態様において、0.5 nMの濃度を有する217 bP較正分子に対する74 bP DNA（標的分子）の相対捕捉率を使用して、異なる濃度の74 bP DNA（例えば、0.5 nM～15 nMの濃度）を含むよう調製されたサンプル中の74 bP DNAの濃度を決定した。1、2または7つのコントロールデータ点を、(0,0)境界条件と共に用いて、リニアカーブにフィッティングすることにより、特定の例は、イベント数の比から標的分子の濃度を導き出した。図15Dに示される出力は、1、2または7つのコントロールデータ点を用いた、および単一のナノ孔対複数のナノ孔からの予測を用いた、異なる濃度の標的分子の推定における誤差率を示す。図15D（上）に示されるように、74 bP DNA標的分子の濃度と217 bP較正分子を用いた捕捉イベント数の比の間に線形的相関が存在する。図15D（中央および下）に示されるように、複数のナノ孔からのデータの使用は、全体として、0.5 nM、1 nM、3 nM、5 nM、7 nM、10 nMおよび15 nMの濃度の標的分子の実濃度の推定において、単一のナノ孔からのデータを用いた標的分子の実濃度の推定と比較して、特にコントロールデータ点の数が増えるほど、より低い誤差率を示した。

孔の状態およびデータの品質に基づくナノ孔からのデータの事前フィルタリング
推定値（例えば、部分存在量の推定値、濃度の推定値）を決定するための複数のナノ孔からのデータの使用に関して、該システムおよび関連するコンピューティングロジックのいくつかの態様はまた、ナノ孔自体の品質（例えば、低または高周波数ノイズ、二乗平均平方根ノイズ、孔の直径、実験中の成長率等を含む要約ノイズ統計）に依存する他の理由から、（例えば、多孔コンセンサスコールを用いた演算を行う前に）ナノ孔由来の情報の使用を除外するよう構成され得、これはアルゴリズム的に自動化され得る。したがって、該方法は、ナノ孔からのデータの品質の査定に基づきナノ孔セットのナノ孔からのデータを考慮から除外する工程を含み得る。

特に、該システムは、その時間ドメイン内の選択された期間（例えば、5秒ごと）の低周波数ノイズコンテンツ（例えば、0.1～10 Hz範囲のノイズパワーの平均／中央値、<-50 dB/Hzを許容）を評価することができ、しきいレベルを超える低周波数ノイズコンテンツを伴うナノ孔からの情報の使用を除外することができる。該システムは、さらにまたはあるいは、その時間ドメイン内の選択された期間（例えば、5秒ごと）の高周波数ノイズコンテンツ（例えば、0.5～30 kHz範囲のノイズパワーの平均／中央値）を評価することができ、しきいレベルを超える高周波数ノイズコンテンツを伴うナノ孔からの情報の使用を除外することができる。該システムは、さらにまたはあるいは、その時間ドメイン内の選択された期間（例えば、5秒ごと）の要約ノイズコンテンツ（例えば、時間ドメイン信号のRMS、30 kHzで<20 pAを許容）を評価することができ、しきいレベルを超える要約ノイズコンテンツを伴うナノ孔からの情報の使用を除外することができる。

該システムはまた、孔の直径（もしくは他の孔の形態的特徴）および／または、<0.25 nm/分を許容する、その時間ドメイン内の選択された期間（例えば、5秒ごと）における孔の特徴の変化率を評価することができ、しきい範囲外の形態的特徴を有するおよび／またはしきい範囲外の孔の特徴の変化率を有するナノ孔からの情報の使用を除外することができる。特に、ナノ孔の直径を経時的に決定する方法は、電流をI、電圧をVとして、G＝I/Vで測定される、オープンチャネルコンダクタンスのモデルの実施を含み得る。詳細に、Gは、各イベント対間で、平均電流を電圧で割ったものとして算出される。Gについての第1のモデルは、総抵抗に対するあらゆるアクセス抵抗の寄与を無視し（総抵抗は総コンダクタンスの逆数である）、G₁(d) = σ(πd²)/(4L)のようにナノ孔の直径dおよび膜厚Lに依存し、ここでσはバルク電解質の導電率である。この第1のモデルは、d/L < 3/4のときの、コンダクタンス対ナノ孔直径データに対応する。第2のモデルは、アクセス抵抗の影響を取り込み、すべての報告される（すなわち、1より小さいおよび1より大きい）d/L値のデータに対応し、ただし、膜圧Lは、ナノ孔における膜の薄膜化に対応するよう、ヒューリスティックに、有効厚l = L/α、α≧1で置き換えられる。このモデルは、G₂(d,l) = σ(πd²)/(4l)[1/(1 + (πd)/(4l)]である。

実験の過程で記録されたGの与えられた範囲について、当業者は、その範囲をモデル化された値と比較することによって、どのモデルがより適切かを決定することができるが、αの選択は、ヒューリスティックであるものの、推定されるd₂値に対して有意な効果を有する。実験過程の間のG＝I/Vの値は、典型的に、時間とともにゆるやかに増加する。増加が観察される場合、2つの可能性のある要因がある。第1に、ナノ孔は時間と共に拡大し得、増加した量の電流が流れることを可能にし、これは、「安定性」が低い孔（すなわち、ある理由もしくは他の理由で壊れやすい、または膜が非常に薄いためおよび／もしくは膜物質を剥離させ得るより高い電圧の印加により成長し得る膜内の孔）においてより高確率で起こる。第2に、増加は、試薬を添加するナノ孔上の「オープン」チャンバーにおける水の蒸発およびそれに応じたイオン濃度の相対的増加に起因し得る。当業者は、むき出しのチャンバーにおいて緩衝液を交換し、そのコンダクタンスを再測定することにより、これらの要因のいずれが作用しているかを試験することができ、その値が元の値に戻る場合、孔のサイズおよび形状は、インタクトな状態のままである可能性が高く、値がより高くなる場合、孔は拡大している可能性が高い。まとめると、既知のLを用いて、d/L < 3/4の場合、第1のモデルG₁(d)が、直径を推定するために使用され得る。それ以外の場合、第2のモデルが、直径を推定するために使用され得る。

該システムはまた、サンプル品質コンテンツを評価し、（例えば、図15Aおよび15Bに示される方法の実施前に）低いサンプル品質コンテンツを有するナノ孔からの情報を除外することができ、かつそのような情報の使用を除外することができる。該システムは、単位時間あたりの捕捉率または（より低いしきい値、例えば、毎分1イベントを超える、およびより高いしきい値、例えば、毎分10,000イベントを超える）イベント率を通じたスループットでサンプル品質コンテンツを評価することができる。

該システムは、存在する可能性のある1つまたは複数の未知物質および存在する1つまたは複数の対照を含む2つ以上の種が存在するサンプルにおける集団の分離の量の点で、サンプル品質コンテンツを評価することができる。1つの例において、サンプルは、1つの対照または参照成分、および最小部分量（例えば、2％）を超えて存在する1つの未知／標的サンプル成分を含む。そのようなサンプルの処理において、該システムは、モデル推定（例えば、SVMベースのモデル）から、サンプル内の集団を分割する分離メトリックの値を決定する。該モデルからの分離メトリックの出力の値は、距離値（例えば、あるイベント集団の重心から参照分離境界／超平面までの最短距離）または任意の他の適切な分離メトリックを含み得る。

サンプル品質コンテンツを評価する1つの例において、S2サンプルの50:50混合物（上記の0％、100％）を、図16Aに示される以下の工程にしたがいユニバーサルモデルを用いて評価した。図16Aに示されるように、該システムにより実施されるユニバーサルモデルの方法1600は、最初に、1610で、（例えば、ナノ孔のサイズの点で、異常なナノ孔の形態の点で、サンプル処理アッセイとの異常な相互作用の点で、検出されたサンプルおよび／またはサンプル処理物質の汚染に関連して等）低品質のデータを生成するナノ孔からの情報を考慮からフィルタリングまたは除去するために、サンプル集団（例えば、50:50混合物の集団）が標的領域内にあるかどうかを決定する。図16Bは、工程1620の出力を示しており、ここではナノ孔からのイベントデータが、サンプルを処理するために使用される異なる試薬（すなわち、0％ S-アデノシルメチオニン、100％ S-アデノシルメチオニン）に関連付けて、電気信号の振幅対ドエルタイムによりプロットされている。図16Bのプロットの作成において、該システムはすべての集団からイベントデータを収集して、標的領域を定義し、その外側のイベントをノイズと分類する。該システムは、ついで、実イベント数対標的領域により定義されるノイズイベント数に基づき、各ナノ孔におけるノイズ率の測定値を決定し、特定のナノ孔におけるノイズ率がしきい値を超える場合、その特定のナノ孔からのデータを考慮から除外した。そのようにして、該システムは、ナノ孔データにおいて実イベントのサブセットからノイズイベントのサブセットを分離する標的領域境界を定義し、ノイズイベントのサブセットおよび実イベントのサブセットに基づきノイズ率を決定した。しかし、ナノ孔のノイズ率の評価に関して、工程1610の他の態様が別の様式で実施され得る。

図16Aに示されるように、該システムはついで、（例えば、サンプル処理アッセイとの異常な相互作用の点で、検出されたサンプルおよび／またはサンプル処理物質の汚染に関連して等）低品質のデータを生成するナノ孔からの情報を考慮からフィルタリングまたは除去する別の工程を提供するために、1620で、サンプルの集団の成分の分離を評価する。工程1620の実施において、該システムは、ドエルタイム（例えば、ナノ孔に対するサンプル成分のドエルタイム）、ナノ孔からの電気信号の出力の振幅の中央値、ナノ孔からの電気信号の出力の最大振幅、ナノ孔の面積、および任意の他の適当なナノ孔に関連する要因、の1つまたは複数に対して主成分分析(PCA）オペレーションを実施することができる。特に、PCAオペレーションは、一部のデータの突出による最大の分散が第2の座標系の第1の座標（すなわち、第1の成分）上に収まるように、第1の座標系から第2の座標系にデータを変換する変換（すなわち、直交線形変換）を実施する。2番目に大きい分散は第2の座標上に収まり、3番目に大きな分散は第3の座標上に収まる。このようにして、PCAオペレーションは、データ内の異なるレベルの分散に関連する新しい座標にデータをマップする。単一パラメータの値（例えば、ドエルタイム、ナノ孔からの電気信号の出力の振幅の中央値、ナノ孔からの電気信号の出力の最大振幅値、ナノ孔の面積等）ではなくPCA成分を使用することにより、該システムは、1つ1つのパラメータの値の重複に関係なく、データ内での分離を効率的に評価することができる。

このようにして、該システムは、PCAオペレーションの第1の成分を使用して（例えば、各サンプル集団を表すガウス分布との関係で）サンプル集団の分離をチェックする。サンプル集団の分離のチェックにおいて、該システムは、分離スコアをSS = (u1-u2)/(s1+s2)と定義することができ、ここでu1およびu2はそれぞれのガウス分布の平均（u2>u1）であり、s1およびs2はそれぞれのガウス分布の標準偏差である。分離スコアSSは、ついで、分離レベルが適切であるかどうかを決定するために、しきい値に対して評価される。図16Cは、（図16Bと同じサンプルおよびサンプル集団を用いた）工程1620の出力を示しており、ここで該システムはPCAオペレーションの成分（PC1およびPC2）を使用して各サンプル集団におけるカウント数対PC1のガウス分布を生成する。図16Dに示されるように、該システムは、このサンプル集団について、分離スコアSS = (u1-u2)/(s1+s2)を2.4と決定し、しきい分離が事前に定義されたしきい値を超える場合、該システムはナノ孔から生成されるデータの評価を継続する。しかし、サンプルの集団分離の評価に関して、工程1620の他の態様が別の様式で実施され得る。

図16Aに示されるように、該システムは、ついで、1630で、サンプルについての較正比の予測を生成するために、ユニバーサルモデル（例えば、独自におよび／または共同で機能し得る、事前に構築されたモデルおよびクラスタリング法を含むユニバーサルモデル）を実施することにより、サンプル集団の較正比が標的範囲内に収まるかどうかを決定する。図16Eに示されるように、該システムは、サンプルの50:50較正比が標的範囲内に収まるかどうかをチェックするため、ユニバーサルモデルを使用して、秒単位のドエルタイムの10を底とする対数に対するナノアンペア単位のナノ孔からの電流の最大振幅（最大amp (nA)）の出力を生成する。図16Eにおいて、クラスラベルS2 0％および100％は、異なるサンプル集団を表し、ユニバーサルモデルは、％(S2_100％)を68.91％と出力し、これが50:50較正比をチェックするために使用される。しかし、サンプル較正比のチェックに関連し、工程1630の他の態様が別の様式で実施され得る。

ナノ孔デバイス
提供されるナノ孔デバイスは、該デバイスの内部空間を2つのボリュームに分離する構造上に開口部を形成する少なくとも1つの孔、および該孔を通過する物体を（例えば、物体を示すパラメータの変化を検出することによって）特定するよう構成された少なくとも1つのセンサを含む。本明細書に記載される方法で使用されるナノ孔デバイスは、その全体が参照により組み入れられるPCT公報WO/2013/012881にも開示されている。

ナノ孔デバイスの孔は、ナノスケールまたはマイクロスケールである。1つの局面において、各孔は、小さなまたは大きな分子または微生物を通過させるサイズを有する。1つの局面において、各孔は、直径が少なくとも約1 nmである。あるいは、各孔は、直径が少なくとも約2 nm、3 nm、4 nm、5 nm、6 nm、7 nm、8 nm、9 nm、10 nm、11 nm、12 nm、13 nm、14 nm、15 nm、16 nm、17 nm、18 nm、19 nm、20 nm、25 nm、30 nm、35 nm、40 nm、45 nm、50 nm、60 nm、70 nm、80 nm、90 nmまたは100 nmである。

1つの局面において、孔は、直径が約100 nm以下である。あるいは、孔は、直径が約95 nm、90 nm、85 nm、80 nm、75 nm、70 nm、65 nm、60 nm、55 nm、50 nm、45 nm、40 nm、35 nm、30 nm、25 nm、20 nm、15 nmまたは10 nm以下である。

1つの局面において、孔は、約1 nm～約100 nmの間、あるいは約2 nm～約80 nm、または約3 nm～約70 nm、または約4 nm～約60 nm、または約5 nm～約50 nm、または約10 nm～約40 nm、または約15 nm～約30 nmの直径を有する。

いくつかの態様において、ナノ孔デバイスはさらに、孔をまたいでポリマースキャホールドを移動させる手段および／または孔を通過する物体を特定する手段を含む。さらなる詳細は、以下で提供され、2孔デバイスとの関係で記載されている。

単孔ナノ孔デバイスと比較して、2孔デバイスは、孔をまたぐポリマースキャホールドの移動の速度および方向の高い制御を提供するようより容易に構成することができる。

1つの態様において、ナノ孔デバイスは複数のチャンバを含み、各々のチャンバは少なくとも1つの孔を通じて隣接するチャンバと連通している。これらの孔の中で、2つの孔、すなわち第1の孔および第2の孔は、標的ポリヌクレオチドの少なくとも一部を、第1の孔から出て第2の孔へ移動できるよう配置される。さらに、デバイスは、各孔に、その移動中に標的ポリヌクレオチドを特定することができるセンサを含む。1つの局面において、この特定は、標的ポリヌクレオチドの個々の成分の特定を必要とする。別の局面において、この特定は、標的ポリヌクレオチドに結合されたペイロード分子の特定を必要とする。単一のセンサが使用される場合、この単一のセンサは、孔を通過するイオン電流を測定するよう孔の両端に配置された2つの電極を含み得る。別の態様において、単一のセンサは、電極以外の要素を含む。

1つの局面において、デバイスは、2つの孔を通じて接続された3つのチャンバを含む。3つを超えるチャンバを有するデバイスは、3チャンバデバイスのいずれかの側面または3つのチャンバのうちの任意の2つの間に1つまたは複数の追加チャンバを含むよう容易に設計することができる。同様に、チャンバを接続するために2つを超える孔をデバイスに含めることができる。

1つの局面において、複数のポリマースキャホールドを1つのチャンバから次のチャンバに同時に移動させることができるよう、2つの隣接するチャンバ間に2つまたはそれ以上の孔を存在させることができる。そのような多孔設計は、該デバイスにおける標的ポリヌクレオチド分析のスループットを向上させ得る。多重化される場合、1つのチャンバは、1つのタイプの標的ポリヌクレオチドを有し得、別のチャンバは、別の標的ポリヌクレオチドタイプを有し得る。

いくつかの局面において、デバイスはさらに、標的ポリヌクレオチドを1つのチャンバから別のチャンバに移動させる手段を含む。1つの局面において、この移動により、標的ポリヌクレオチド（例えば、標的配列を含む増幅産物またはアンプリコン）は、第1の孔および第2の孔の両方に同時に投入される。別の局面において、この手段はさらに、両方の孔を通じた標的ポリヌクレオチドの同一方向への移動を可能にする。

例えば、3チャンバ2孔デバイス（「2孔」デバイス）において、各チャンバは、チャンバ間の各孔をまたいで別個の電圧を印加できるよう電源に接続するための電極を含み得る。

本開示の1つの態様にしたがい、上部チャンバ、中間チャンバおよび下部チャンバを含み、上部チャンバが第1の孔を通じて中間チャンバと連通しており、中間チャンバが第2の孔を通じて下部チャンバと連通している、デバイスが提供される。そのようなデバイスは、任意の寸法またはその全体が参照により本明細書に組み入れられる、Dual-Pore Deviceを表題とする米国公開番号2013-0233709において以前に開示された他の特徴を有し得る。

1つの局面において、各孔は、直径が少なくとも約1 nmである。あるいは、各孔は、直径が少なくとも約2 nm、3 nm、4 nm、5 nm、6 nm、7 nm、8 nm、9 nm、10 nm、11 nm、12 nm、13 nm、14 nm、15 nm、16 nm、17 nm、18 nm、19 nm、20 nm、25 nm、30 nm、35 nm、40 nm、45 nm、50 nm、60 nm、70 nm、80 nm、90 nmまたは100 nmである。

1つの局面において、各孔は、直径が約100 nm以下である。あるいは、孔は、直径が約95 nm、90 nm、85 nm、80 nm、75 nm、70 nm、65 nm、60 nm、55 nm、50 nm、45 nm、40 nm、35 nm、30 nm、25 nm、20 nm、15 nmまたは10 nm以下である。

いくつかの局面において、孔は、実質的に円形の形状を有する。「実質的に円形」は、本明細書で使用される場合、円筒の形状の少なくとも約80または90％である形状を表す。いくつかの態様において、孔は、正方形、長方形、三角形、楕円形または六角形の形状である。

1つの局面において、孔は、約1 nm～約10,000 nmの間、あるいは約2 nm～約9,000 nmの間、または約3 nm～約8,000 nmの間等の深さを有する。

いくつかの局面において、ナノ孔は、膜全体に及ぶ。例えば、孔は、脂質二重膜に挿入されたタンパク質チャネルであり得、または固体基板、例えば二酸化ケイ素、窒化ケイ素、グラフェンまたはこれらもしくはその他の材料の組み合わせから形成される層を通じたドリル抜き、エッチングまたはそれ以外の方法により孔を形成することにより作製され得る。ナノ孔は、スキャホールド：融合：ペイロードまたは酵素活性によるこの分子の生産物が孔を通過できるようにするサイズである。他の態様において、分子タイプの区別のために孔の一時的遮断が望まれ得る。

いくつかの局面において、ナノ孔の長さまたは深さは、そうでなければ隔離されている2つのボリュームを接続するチャネルを形成するよう十分長い。いくつかのそのような局面において、各孔の深さは、100 nm、200 nm、300 nm、400 nm、500 nm、600 nm、700 nm、800 nmまたは900 nmを超える。いくつかの局面において、各孔の深さは、2000 nmまたは1000 nm以下である。

1つの局面において、孔は、約10 nm～約1000 nmの間の距離をあけて配置される。いくつかの局面において、孔間の距離は、1000 nm、2000 nm、3000 nm、4000 nm、5000 nm、6000 nm、7000 nm、8000 nmまたは9000 nmを超える。いくつかの局面において、孔は、30000 nm、20000 nmまたは10000 nm以下の間隔をあけて配置される。1つの局面において、距離は、少なくとも約10 nm、あるいは少なくとも約20 nm、30 nm、40 nm、50 nm、60 nm、70 nm、80 nm、90 nm、100 nm、150 nm、200 nm、250 nmまたは300 nmである。別の局面において、距離は、約1000 nm、900 nm、800 nm、700 nm、600 nm、500 nm、400 nm、300 nm、250 nm、200 nm、150 nmまたは100 nm以下である。

さらに別の局面において、孔間の距離は、約20 nm～約800 nmの間、約30 nm～約700 nmの間、約40 nm～約500 nmの間または約50 nm～約300 nmの間である。

2つの孔は、それらがチャンバ間の流体連通を実現する限り、任意の位置に配置され、所定のサイズおよび孔間距離を有し得る。1つの局面において、孔は、それらの間に直接的な遮蔽物が存在しないよう配置される。さらに、1つの局面において、孔は、実質的に同軸である。

1つの局面において、デバイスは、1つまたは複数の電源に接続された電極をチャンバ内に有する。いくつかの局面において、電源は、各孔をまたいで電圧を供給し、各孔を通る電流を独立して測定することができる、電圧固定またはパッチクランプを含む。これに関して、電源および電極の構成は、中間チャンバを、両電源の共通の接地点に設定し得る。1つの局面において、電源または電源群は、上部チャンバ（チャンバA）と中間チャンバ（チャンバB）の間に第1の電圧V₁を、中間チャンバと下部チャンバ（チャンバC）の間に第2の電圧V₂を印加するよう構成される。

いくつかの局面において、第1の電圧V₁および第2の電圧V₂は、独立して調整可能である。1つの局面において、中間チャンバは、2つの電圧に対する接地点となるよう調整される。1つの局面において、中間チャンバは、中間チャンバ内の各孔と各電極の間に伝導性を提供する媒体を含む。1つの局面において、中間チャンバは、中間チャンバ内の各孔と各電極の間に抵抗を提供する媒体を含む。そのような抵抗をナノ孔の抵抗よりも十分小さく維持することは、孔をまたぐ2つの電圧および電流を切り離すために有用であり、それは電圧の独立した調整の助けとなる。

電圧の調整は、チャンバ内での荷電粒子の移動を制御するために使用され得る。例えば、両電圧が同一の極性で設定される場合、適当に荷電した粒子は、上部チャンバから中間チャンバへ、そして下部チャンバへ、またはその逆に連続して移動し得る。いくつかの局面において、2つの電圧が反対の極性で設定される場合、荷電粒子は、上部または下部のいずれかのチャンバから中間チャンバに移動し、そこで維持され得る。

該デバイスにおける電圧の調整は、大きな分子、例えば、両方の孔を同時に通過するのに十分長い、荷電したポリマースキャホールドの移動を制御するために特に有用であり得る。そのような局面において、分子の移動の方向および速度は、以下に記載されるように、電圧の相対的な大きさおよび極性によって制御することができる。

デバイスは、液体サンプル、特に生物学的サンプルを保持するのに適した材料および／またはナノファブリケーションに適した材料を含み得る。1つの局面において、そのような材料は、誘電材料、例えば、非限定的に、ケイ素、窒化ケイ素、二酸化ケイ素、グラフェン、カーボンナノチューブ、TiO₂、HfO₂、Al₂O₃もしくは他の金属層、またはこれらの材料の任意の組み合わせを含む。いくつかの局面において、例えば、約0.3 nm厚の単一シート状のグラフェン膜が、孔保持用膜として使用され得る。

マイクロ流体型であるデバイスおよび2孔マイクロ流体チップを実装するデバイスは、様々な手段および方法によって製造され得る。2つの平行な膜から構成されるマイクロ流体チップの場合、両方の膜は、2つの同心の孔を形成するよう単一のビームによって同時にドリル抜きされ得るが、任意の適切な位置合わせ技術と共に膜の各々の側で異なるビームを用いることも可能である。一般に、ハウジングは、チャンバA～Cの密封された隔離を実現する。

1つの局面において、デバイスは、スペーサーによって接続された2つの平行な膜から構成される（「デュアルポア（Dual-pore）チップ」と呼ばれる）マイクロ流体チップを含む。各々の膜は、単一のビームによって膜の中心を通るようドリル抜きされた孔を含む。さらに、デバイスは、好ましくは、チップ用のテフロン（登録商標）ハウジングまたはポリカーボネートハウジングを有する。ハウジングは、チャンバA～Cの密封された隔離を実現し、各電圧が主に各孔をまたいで印加されることを確実にするよう電極に対して最小限のアクセス抵抗を提供する。

より詳細に、孔保持用膜は、5～100 nm厚のケイ素、窒化ケイ素または二酸化ケイ素ウィンドウを有する透過型電子顕微鏡（TEM)グリッドにより作製される。スペーサーは、膜を隔離するために使用され得、絶縁体、例えばSU-8、光レジスト、PECVDオキシド、ALDオキシド、ALDアルミナまたは蒸着金属材料、例えばAg、AuもしくはPtを使用し、膜間のチャンバBのそうでなければ水性の部分の中の小ボリュームを占有する。チャンバBの最大ボリューム部分をなすホルダーが水槽内に設置される。チャンバAおよびCは、膜封鎖を可能にする（低いアクセス抵抗の）大きな直径のチャネルによってアクセス可能である。

膜を通る穴をドリル抜きするために集束電子またはイオンビームが使用され得、それによってそれらは必然的に整列させられる。孔はまた、各層に集束する正確なビームを適用することによって、より小さなサイズになるよう造形（縮小）され得る。その方法および膜の厚みで可能なドリル抜きの深さを考慮しつつ、2つの膜において一対の孔をドリル抜きするために、単一ナノ孔ドリル抜き法も使用され得る。膜の厚みをさらに改善するために、まず所定の深さまでマイクロ孔をドリル抜きし、その後に膜の残りの部分を通じてナノ孔をドリル抜きすることもまた可能である。

デバイスの孔に電圧がかかることにより、荷電した分子は、孔を通ってチャンバ間を移動することができる。移動の速度および方向は、電圧の大きさおよび極性によって制御することができる。さらに、2つの電圧の各々が独立して調整可能であることにより、荷電分子の移動の方向および速度を各チャンバで細かく制御することができる。

1つの例は、両方の孔の深さおよび2つの孔の間の距離を含む合算距離よりも長い長さを有する標的ポリヌクレオチドに関する。例えば、1000バイトのdsDNAは、長さが約340 nmであり、20 nm隔離された2つの10 nm深度の孔による40 nmよりも実質的に長い。最初の工程において、このポリヌクレオチドは、上部または下部のいずれかのチャンバに投入される。約7.4のpHの生理学的条件下でのその負の電荷により、このポリヌクレオチドは、電圧を印加された孔を通過して移動することができる。したがって、第2の工程において、このポリヌクレオチドが両方の孔を通じて連続して移動するよう、同一の極性および同一または同等の大きさの2つの電圧が孔に印加される。

ほぼポリヌクレオチドが第2の孔に達した時点で、電圧の一方または両方が変更され得る。2つの孔の間の距離はポリヌクレオチドの長さよりも短くなるよう選択されるので、ポリヌクレオチドが第2の孔に達したとき、それはまた第1の孔の中に存在する。第1の孔における電圧の極性の迅速な変更は、したがって、そのポリヌクレオチドを第2の孔から引き抜く力を発生させる。

2つの孔が同一の電圧・力の影響を有し、|V₁|=|V₂|+δVである場合、|V₁|（またはV₂）方向への調整可能な移動のために値δV>0（または<0）が調整され得る。実際には、各孔で電圧により誘導される力はV₁=V₂と同一ではないが、較正実験により、所定の2孔チップにおいて等しい引き抜き力をもたらす適切なバイアス電圧を決定することができ、そのバイアス電圧付近の値が方向制御のために使用され得る。

この時点で、第1の孔において電圧により誘導される力の大きさが第2の孔において電圧により誘導される力よりも小さい場合、ポリヌクレオチドは、より低速になるが、第2の孔に向かって両方の孔を通過し続ける。これに関して、ポリヌクレオチドの移動の速度および方向は、両方の電圧の極性および大きさによって制御することができることが直ちに理解される。以下でさらに説明されるように、そのような移動の細かい制御は、幅広い用途を有する。標的ポリヌクレオチドを定量する場合、2孔デバイス実装の有用性は、制御された送達および検知の間、標的ポリヌクレオチドまたはペイロードに結合された標的ポリヌクレオチドを繰り返し測定し、検出結果の信頼性を高めることができることである。

したがって、1つの局面において、ナノ孔デバイスを通じた荷電ポリマースキャホールドの移動を制御する方法が、提供される。この方法は、（a）上記態様のいずれかのデバイスの上部チャンバ、中間チャンバまたは下部チャンバの1つに標的ポリヌクレオチド（例えば、標的ポリヌクレオチドアンプリコン）を含むサンプルを投入する工程であって、デバイスが、上部チャンバと中間チャンバの間に第1の電圧を、および中間チャンバと下部チャンバの間に第2の電圧を提供するために1つまたは複数の電源に接続される、工程、（b）標的ポリヌクレオチドをチャンバ間で移動させ、それによってポリマースキャホールドが第1および第2の孔の両方をまたぐ位置に行くよう、初期第1電圧および初期第2電圧を設定する工程、ならびに（c）荷電標的ポリヌクレオチドを中間チャンバから引き抜く力を両電圧が発生させるよう第1電圧および第2電圧を調整する工程（電圧競合モード）であって、これら2つの電圧は、標的ポリヌクレオチドスキャホールドがいずれかの方向にかつ制御された様式で両方の孔を通って移動するよう、制御された条件下で大きさが異なる、工程を含む。

1つの局面において、標的ポリヌクレオチドを含むサンプルは、上部チャンバに投入され、初期第1電圧は、標的ポリヌクレオチドを上部チャンバから中間チャンバに引き入れるよう設定され、初期第2電圧は、標的ポリヌクレオチドを中間チャンバから下部チャンバに引き入れるよう設定される。同様に、サンプルを最初に下部チャンバに投入することができ、標的ポリヌクレオチドを中間および上部チャンバに引き入れることができる。

別の局面において、標的ポリヌクレオチドを含むサンプルは、中間チャンバに投入され、初期第1電圧は、荷電ポリマースキャホールドを中間チャンバから上部チャンバに引き入れるよう設定され、初期第2電圧は、標的ポリヌクレオチドを中間チャンバから下部チャンバに引き入れるよう設定される。

1つの局面において、工程（c）における第1電圧および第2電圧に対するリアルタイムまたはオンライン調整は、最大数百メガヘルツのクロック速度の専用ハードウェアおよびソフトウェアを用いる能動制御またはフィードバック制御により行われる。第1または第2または両方の電圧の自動制御は、第1または第2または両方のイオン電流測定のフィードバックに基づく。

センサ
上で議論されたように、様々な局面において、ナノ孔デバイスはさらに、標的ポリヌクレオチドの検出を行う1つまたは複数のセンサを含む。

このデバイスで使用されるセンサは、ペイロード分子に結合したまたは結合していない標的ポリヌクレオチドアンプリコンを特定するのに適した任意のセンサであり得る。例えば、センサは、そのポリマーに関連する電流、電圧、pH値、光学的特徴または残留時間を測定することによって標的ポリヌクレオチドを特定するよう構成され得る。他の局面において、センサは、標的ポリヌクレオチドの1つもしくは複数の個々の成分または標的ポリヌクレオチドに結合もしくは付加した1つもしくは複数の成分を特定するよう構成され得る。センサは、標的ポリヌクレオチド、標的ポリヌクレオチドの成分または好ましくは標的ポリヌクレオチドに結合もしくは付加した成分を示す測定可能なパラメータの変化を検出するよう構成された任意の要素から形成され得る。1つの局面において、センサは、分子または他の実体、特に標的ポリヌクレオチドが孔を通って移動した際に孔を通るイオン電流を測定する孔の両側に配置された一対の電極を含む。特定の局面において、孔を通るイオン電流は、孔を通過する標的ポリヌクレオチドセグメントがペイロード分子に結合されている場合に測定可能に変化する。そのような電流の変化は、予測可能、測定可能な様式で変化し得、例えば、存在する標的ポリヌクレオチド分子の存在、非存在および／またはサイズに対応する。

好ましい態様において、センサは、電圧を印加し、ナノ孔を通る電流を測定するために使用される電極を含む。ナノ孔を通る分子の移動は、オームの法則V = IZにしたがいナノ孔を通る電流に影響する電気的インピーダンス（Z)を提供し、式中Vは印加された電圧であり、Iはナノ孔を通る電流であり、Zはインピーダンスである。逆に、コンダクタンスG = I/Zは、ナノ孔イベントを感知および定量するためにモニタリングされる。分子が電場内（例えば、印加された電圧下）のナノ孔を通って移動することによる結果は、電流シグネチャーであり、これは電流信号のさらなる分析の際にナノ孔を通過する分子に相関付けられ得る。

電流シグネチャーからの抵抗時間測定が使用される場合、成分のサイズは、検知デバイスを通過するのに要する時間の長さに基づき特定の成分に相関付けられ得る。

1つの態様において、センサは、ポリマーの光学的特徴、ポリマーの成分（もしくは単位）、またはポリマーに結合もしくは付加した成分を測定するナノ孔デバイスに提供される。そのような測定の1つの例は、赤外線（または紫外線）分光分析による特定単位に固有の吸収バンドの特定を含む。

いくつかの態様において、センサは、電気センサである。いくつかの態様において、センサは、蛍光シグネチャーを検出する。そのシグネチャーを検出するために、孔の出口において照射源が使用され得る。

等価物および範囲
当業者は、本明細書に記載される発明にしたがう具体的態様の多くの等価物を認識し、または慣用的実験のみを用いて確認することができる。本発明の範囲は、上記の詳細な説明に限定されることは意図されておらず、そうではなく、本発明の範囲は、添付の特許請求の範囲に示されるものである。

特許請求の範囲において、「1つの（a）」、「1つの（an）」および「その（the）」等の冠詞は、そうでないことが示されていない限りまたはそれ以外のことが文脈から明らかでない限り、1つまたは2つ以上を意味し得る。あるグループの1つまたは複数のメンバーの間に「または、もしくは」を含む請求項または説明は、そうでないことが示されていない限りまたはそれ以外のことが文脈から明らかでない限り、そのグループのメンバーの1つ、2つ以上もしくはすべてが特定の物もしくはプロセスに存在すること、特定の物もしくはプロセスで用いられること、または特定の物もしくはプロセスとそれ以外の関係を有することを満たすものとみなされる。本発明は、そのグループのただ1つのメンバーが特定の物もしくはプロセスに存在する、特定の物もしくはプロセスで用いられるまたは特定の物もしくはプロセスとそれ以外の関係を有する態様を含む。本発明は、そのグループのメンバーの2つ以上またはすべてが特定の物もしくはプロセスに存在する、特定の物もしくはプロセスで用いられるまたは特定の物もしくはプロセスとそれ以外の関係を有する態様を含む。

「含む（comprising）」という用語は、開放的かつ許容的であるが、追加の要素または工程の加入を必要としないことが意図されている。「含む（comprising）」という用語が本明細書で使用される場合、「からなる（consisting of）」という用語もまた包含され、開示される。

範囲が示される場合、終点も包含される。さらに、そうでないことが示されない限りまたはそれ以外のことが文脈から明らかであり当業者に理解されない限り、範囲で表される値は、本発明の異なる態様において、文脈がそれ以外のことを明確に示していない限り、その範囲の下限の値の10分の1まで、示されている範囲内の任意の個々の値または部分範囲も想定され得ることが理解されるべきである。

すべての引用元、例えば、参考文献、刊行物、データベース、データベースのエントリーおよび本明細書で引用されている技術は、その引用の中で明示的に言及されていない場合であっても、参照により本願に組み入れられる。引用元の内容と本願のそれが相反する場合、本願の内容が優先される。

節および表の見出しは、限定を意図したものではない。

以下は、本発明を実施する具体的態様の実施例である。これらの実施例は、例示を目的として提供されるにすぎず、いかなる様式においても本発明の範囲を限定することは意図されていない。使用されている数値（例えば、量、温度等）に関しては正確性を確保するよう努めているが、当然のことながら、一定の実験誤差および偏差が許容されるべきである。

本発明の実施には、それ以外のことが示されていない限り、当技術分野のタンパク質化学、生化学、組み換えDNA技術および薬理学の従来的方法が使用される。そのような技術は、文献で十分に説明されている。例えば、T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvanina: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B (1992)を参照のこと。

実施例1 - 標的および参照について異なる長さのdsDNAを用いたQ検定ベースのFA
この実施例は、トランスジェニック（GMO）標的配列が788 bp標的dsDNA（すなわち、標的分析物）内に存在し、参照配列（レクチンハウスキーピング遺伝子）が466 bp参照dsDNA（すなわち、参照分析物）内に存在するデータに対する部分存在量（FA）フレームワークの適用の結果を示す。サンプル中の導入遺伝子標的の部分量の定量は、以下のように、最初にイベント面積に基づく単一の特徴基準を用いたQ検定法を適用しかつ等式（1）および（2）を用い、次にSVM法を適用しかつ等式（3）及び（4）を用いることによって達成されている。

466 bp参照DNAおよび788 bp標的トランスジェニックDNAフラグメントは、配列特異的なオリゴヌクレオチドプライマーを用いて通常のおよび導入遺伝子を含有するゲノムDNAサンプルの混合物からPCRによって生成した。標準的なシリカ膜カラムを用いてPCR産物を精製および濃縮した。大ボリュームの個別に生成したアンプリコンから部分量が正確な2つのアンプリコンの混合物を調製し、この部分量混合物および単一のアンプリコンのアリコートを、すべてのアッセイにおいて標準参照物質として使用した。

最初に、466 bp参照DNAを含む参照対照サンプルを、ナノ孔デバイスで測定した。次に、788 bpトランスジェニックDNAを含む標的対照サンプルを調製し、ナノ孔デバイスで測定した。標的分析物（788 bp）と参照分析物（466 bp）の間の長さの差は、ナノ孔を通る移動の際に固有のイベントシグネチャーを発生させ、これらはイベントシグネチャーの面積に基づき区別することができる。

図4Aは、1つは466 bp参照DNA、1つは788 bp標的トランスジェニックDNAの、2つの単独対照の試験についての全イベントの面積ヒストグラムを示す。3：10標的：参照対照混合物の面積ヒストグラムも示されている。図4Bは、対照混合物（Q_targ、Q_ref）および既知混合物（Q_mix）の傾向を面積基準しきい値qの関数として示しており、ここでは、Q_mix = Q_3:10である。図4Cは、部分量パラメータρ（q）が、あるq値でどのようにグラフ表示されるのかを示す。q = 5 pA^*msのしきい値（垂直の破線）は、0.05の偽陽性（すなわち、Q_ref = 0.05）および0.1の偽陰性（すなわち、Q_targ = 0.9）に対応する。

参照のみおよび標的のみ対照を用いて既知混合物の部分存在量の推定値を得る方法の正確度および精度を試験するために、予測されるGMO（％）として

を導く等式（2）の適用を、ここでは対照混合物を用いて行う。等式（2）を、最初に既知混合物に適用した。Q_X:Yを得るために対照混合物サンプルを使用しなかったので、このモデルを検証するために標的分析物と参照分析物の間の捕捉率定数差についての補償を用いずに（すなわち、α = 1に設定して）推定値を得た。図5Aは、予測されるGMO（％）

対真のGMO（％）のプロットおよび比較のためのゼロ誤差線の上下10％誤差マージン（勾配 = 1）を示す。これらの結果は、単一のナノ孔において連続して、100％標的および100％参照（単独）対照を試験し、その後に5つの既知混合物を試験することによって得た。表1は、図5Aにおいてプロットされた予測値およびエラーバー、ならびに各混合物で検出された総イベント数を報告している。

（表１）図5AのデータについてのGMO予測結果

同様のプロトコルにしたがう別のナノ孔実験（2つの単独対照および6つの既知混合物）から、図5Bおよび表2に示す結果が得られた。

（表２）図5BのデータについてのGMO予測結果

図5Aおよび図5Bならびに表1および2の結果は、単一のナノ孔を用いて2つのDNA長を区別する上で、5％以内のGMO％予測正確度が実現可能であることを示唆している。これらの結果は、標的分析物と参照分析物の間の捕捉率定数差の補償を使用せずに（等式（2）においてα= 1に設定して）達成された。捕捉率定数差の補償は、結果をさらに改善すると考えられる。

単一の値に変えてqしきい値範囲を使用する場合の実施例が、図6に示されている。詳細に、qしきい値範囲を、Q_refの75～99パーセンタイルを網羅するよう選択した。得られる

の傾向をq範囲にわたってプロットし、その平均値である平均

を既知の15％GMOと比較した。これは、本明細書に提供される分析フレームワークが、しきい値が最適化されていない場合でさえも、一定範囲のしきい値上で偽陽性および偽陰性誤差を補償し、サンプルにおける標的分析物の相対存在量の改善された推定値を提供することができることを示している。

この実施例で実証された、集団内の標的配列の存在量を定量するためのワークフローは、いかなる増幅、精製、濃縮または緩衝液交換工程も必要としなかった。このワークフローは、安価で使い捨て可能なサンプル調製カートリッジと相性が良く、小型化された（携帯またはデスクトップ）ユニットでサンプルイン・アンサーアウト（sample-in answer-out）ワークフローを実現可能である。

別の実験セットにおいて、未知物としてGMO％が異なるサンプルを試験した。各ナノ孔において使用したプロトコルは、a）100％ 466 bp参照を5分間、その後に洗い流し、b）100％ 788 bp標的を5分間、その後に洗い流し、c）1～4つの未知物を各々5分間試験、その間に洗い流し、d）対照混合物を試験、であった。面積基準を使用し、Q_refの75～99パーセンタイルを網羅するqしきい値範囲を導入し、平均

を予測されるGMO％として報告した。等式（2）において、標的分析物と参照分析物の間の捕捉率定数差を補償するために、対照混合物を使用した。実験は、1：1、0.75：1または0.35：1の標的：参照対照混合物を使用した。

表3は、補償のために0.35：1（35％GMO）の対照混合物を用いた4つの「未知」混合サンプル（S1～S4）についての1つのナノ孔アッセイからの予測結果を報告している。未知物は各ナノ孔アッセイで盲検としたため、パーセント誤差は表に報告されていない。この表はまた、各5分間の期間に記録された総イベント数を報告している。

（表３）盲検サンプルS1～S4についてのGMO予測結果

合計12のナノ孔実験を、上記のプロトコルにしたがい実施し、各混合サンプルを、必ず異なるナノ孔で、かつ異なる実験者または異なる日に、2～5回試験した。ナノ孔のサイズ範囲は、直径25～35 nmであった。合計11の混合サンプル（S1～S11）をアッセイした。表4は、最小～最大の予測GMO％値の順に、合算された推定値を報告している。報告されている平均GMO％値は、単一ナノ孔予測を平均することによって算出されている。各平均推定値の不確実性は、個々の推定値の反復的無作為サンプリングの分布から算出されている（モンテカルロ法）。数的に生成された95パーセンタイル信頼区間が報告されている。各サンプルを試験した回数および各サンプルにおける真のGMO％も報告されている。

（表４）サンプルS1～S11についての合算されたGMO％予想（平均±2シグマ）

表4の結果は、本発明者らの方法が標的分析物の部分存在量（例えば、GMO％）を高い正確度で予測することができることを示している。10～90％GMOの範囲で、正確度は、単一ナノ孔推定値を合算することによって2％以内である。5～10％の間および、飽和限界に達することにより予測誤差が増加することが予期され得る100％GMOで、2つのナノ孔推定値を合算すると、＜5％誤差となる。概ね、標的分析物と参照分析物の間の捕捉率定数差の補償の使用は、捕捉率定数差の補償なしの場合と比較して正確度を向上させる（表1～2）。GMO％予測範囲全体で、ナノ孔推定値が多いほど、正確度および精度がより大きく改善される。各々共通のプールから測定するアレイ配置のナノ孔もまた、この研究の一部として存在する個人ごとおよび日ごとならびに試薬セットごとのばらつきを取り除くことによって不確かさをさらに減少させ得る。

実施例2 - 標的および参照で異なる長さのdsDNAを用いたSVMベースのFA
ここでは、実施例1で記録および分析したのと同じナノ孔データを、以前に示したSVM法（等式（3）～（4））を用いて再分析した。

最初に、初期特徴選択のために単独対照セットを使用した。初期選択は、特定の分類法で多重共線性の問題を引き起こし得る高度に相関する特徴を除去することを目的とする。7つの特定された特徴は、以下であった：（i）イベント持続時間の10を底とする対数であるlog₁₀(ドエル)、または単に「ドエル」、（ii）最大δGである、maxAmp、（iii）立ち上がりおよび立ち下り時間を除くイベント信号の標準偏差である、sdAmpSub、（iv）δG中央値である、medAmp、（v）50 Hzを下回るイベントの雑音電力の平均である、LFNmean、（vi）50 Hzを下回るイベントの雑音電力の中央値である、LFNmedian、（vii）実施例1で使用したのと同じイベント面積である、面積。

データの次元を減らすために、さらなる特徴抽出を行った。この工程の目的は、演算時間と分類正確度のバランスをとることである。2つのアルゴリズムを採用した：1）単変量特徴選択法。イベントの各特徴とラベルの間でANOVA F値を算出した。最も高いFスコアを有する特徴の一部を選択するよう手作業でしきい値を設定した。2）再帰的特徴削減（RFE）。推定器（例えば、SVM）を初期特徴セットで訓練し、各特徴の重要度を得た。最低重要度の特徴は、現特徴セットから除外される。この手順を、所望の数の特徴セットに達するまで再帰的に繰り返す。

実施例1データでは、単変量特徴選択法を使用した。特徴の比率のしきい値を、手作業で60％に設定した。アルゴリズムによって選択された4つの最適な特徴は以下であった：（i）ドエル、（ii）sdAmpSub、（iii）medAmp、（iv）面積。

この方法の次の工程は、モデル訓練および試験である。単独対照における全イベントを、7：3分割を用いて無作為に訓練データセットおよび試験データセットに分けた。SVMを、分類を実施する上で最適なパラメータを見出すためにハイパーパラメータ検索アルゴリズムを用いて訓練データセットに基づき訓練した。グリッドアルゴリズムにおいて試験したハイパーパラメータは、カーネルタイプ（線形、rbf）、正規化パラメータ（C）およびカーネル係数（ガンマ）であった。ROC曲線の曲線下面積（roc_auc)を用いて、各ハイパーパラメータの組み合わせの性能を評価した。最高のroc_aucスコアを有するモデルを、下流データ処理で使用した。最良のパラメータの組み合わせについて、その平均正確度および試験データからの各クラスの再現率を計算した。次いで、最適なパラメータを有するモデルを、訓練データセットによって訓練し、試験データセットで試験した。試験データセットにおいて正確度の予測を得、これが図7に示されている。セット全体での正確度は、97.5％超を維持した。

この方法の次の工程は、データ較正であった。較正は、工程3のモデルを対照混合物データに適用し、補正比を生成することによって達成することができる。その後、補正比に、未知混合物の各予測量を乗算する。これは、等式（1）および（2）においてパラメータαを乗算することに等しい。パラメータαの値は、SVM法においてこのモデルを対照混合物に適用することによって生成し、（1）および（2）は、対照データセットQ値からαを直接計算する。

表5は、Q検定法とSVMベースの方法の間のGMO％予測の比較を示す。

（表５）単一ナノ孔GMO％予測の比較、Q検定対 SVM

サンプルは以下のように分かれた：a）SVM予測の方が正確であった（1、5、6、8、9、16、19、20、21）、b）Q検定予測の方が正確であった（3、4、7、10、11、12、14、15、17）、およびc）これらの方法は正確度に関して同等であった（2、3、18、22）。これらの22個のサンプルについて、2つの方法の全体的な性能はほぼ同等であり、各々が9／22の例で他方よりも優れていた。

SVM法の価値は、Q検定法では必要条件となる適用可能な明確な基準を事前に有さない場合があるデータセットへの適用を自動化することができることである。他方、Q検定法は、計算的に単純であり、Q検定形式で十分特徴づけられた基準を利用することができる部分存在量の適用において好ましいと考えられる。

実施例3 - 固有のペイロードを有する短鎖DNA（74 bp参照、94 bp標的導入遺伝子）を用いたQ検定ベースのFA
GMO％予測への適用に関して、この実施例は、2つの異なる配列特異的ペイロードを使用することによってナノ孔イベントシグネチャーの区別を達成することにより、標的および参照dsDNAについて2つの同等の長さを使用することができることを示す。

方法：検証されたqPCRプライマーセット（European Union Reference Laboratory for GM Food and Feedから公衆利用可能）を用いて、本発明者らは、通常のおよび導入遺伝子を含有するゲノムDNAサンプルの混合物から94 bpの導入遺伝子特異的および74 bpのタキソン特異的フラグメントの両方を増幅した。ナノ孔検出の前に、これらのアンプリコンを、PEGポリマープローブに共有結合された配列特異的オリゴヌクレオチドプローブとハイブリダイズ（Data Storage特許番号5520281-v2-29517、5/16/2016に記載される方法）させた（その全体が参照により本明細書に組み入れられる、国際公開番号WO/2016/187159、「Methods and Compositions for Target Detection in a Nanopore Using a Labelled Polymer Scaffold」を参照のこと）。詳細に、導入遺伝子標的化プローブを4アーム40kDa PEGに連結し、参照標的化プローブを8アーム40kDa PEGに連結した。

全イベント散布図の代表的実施例として、図8は、同一の孔で連続的に単独対照として試験した2つの分子タイプのイベントプロットを示す。最初に、96 bp DNA/プローブ・ペイロード複合体を含むサンプルを調製し、ナノ孔デバイスにおいて測定した。この複合体は、標的配列を含み、プローブ・ペイロードに結合されたフラグメントのモデルである。このプローブ・ペイロードは、4アームPEG構造を有するPNA-PEGであった。次に、部分存在量の計算を行うことができる固有のイベントシグネチャーをナノ孔を通る移動の際に生成するよう参照配列を含むフラグメントを設計した。参照分子は、PNA-PEGが結合した74 bp DNAであり、PEGは、8アーム構造を有する。鍵は、参照／プローブ・ペイロード分子が、標的／プローブ・ペイロード分子と相違する固有のイベントサブ集団を生成し、かつ両方が、存在する場合、任意のバックグラウンドイベントと相違することである。

各ナノ孔において使用したプロトコルは、a）100％ 74 bp/ペイロード-2参照を5分間、その後に洗い流し、b）100％ p4 bp/ペイロード-1標的を5分間、その後に洗い流し、ｃ）1～4つの未知物を各々5分間試験、その間に洗い流し、ｄ）対照混合物を試験、であった。面積基準を使用し、Q_refの75～99パーセンタイルを網羅するqしきい値範囲を導入し、平均

を予測されるGMO％として報告した。等式（2）において、標的分析物と参照分析物の間の捕捉率定数差を補償するために、1：1対照混合物を使用した。

一連のナノ孔実験を、上記のプロトコルにしたがい実施し、各混合サンプルを、必ず異なるナノ孔で、かつ異なる実験者または異なる日に、2～4回試験した。ナノ孔のサイズ範囲は、直径25～35 nmであった。合計6つの混合サンプル（Sp1～Sp6）をアッセイした。表6は、最小～最大の予測GMO％値の順に、合算された推定値を報告している。報告されている平均GMO％値は、単一のナノ孔の予測を平均することによって算出されている。各平均推定値の不確実性を算出し、95パーセンタイルの信頼区間として報告されている。各サンプルを試験した回数および各サンプルにおける真のGMO％も報告されている。

（表６）標的／参照を区別するために異なるペイロードを用いた合算されたGMO％予想値

2つのペイロードを用いた予測性能は、dsDNA長による区別を用いた場合（実施例1、2）ほど良好でないようである。いずれの例においても、正確度は、すべての例で6％より良好であり、より多くのナノ孔で分子のプールを並行して測定し、得られた推定値を合算することによってさらに改善することができる。

実施例4 - 短鎖DNA（89 bp）および2つの固有のペイロードを用いた野生型に対するKRAS G12D SNPのFAのためのQ検定およびSVM法
本発明者らは、高度に断片化された、無細胞の循環DNAからヒトKRAS遺伝子の短い（58 bp、70 bpまたは89 bp）フラグメントを増幅するプライマーを設計した（参照、KRAS G12D SNP配列（CosmicID 521）のいずれかの側にアニールするようDNAプライマー配列を設計した）。血液血漿から得られた無細胞循環DNA画分からアンプリコンを生成し、野生型および変異KRAS対立遺伝子の両方を標的とし、PEGポリマーペイロードに共有結合されたオリゴヌクレオチドプローブを用いたハイブリダイゼーションに供した：KRAS wt対立遺伝子（c.35G）を標的化するプローブは40 kDa 8アームまたは80 kDa 2分枝PEGポリマーに連結し、G12D（c.35G->A）対立遺伝子を標的化するプローブは、40 kDa 3分枝PEGポリマーに連結した。

図9Aは、重ね合わされた100％標的分析物対照サンプル（青色塗りつぶしの丸）および100％参照分子対照サンプル（黒色の中抜きの四角）についての平均δG 対持続時間の代表的なイベントプロットを示す。標的分析物は、3分枝PEGに連結されたG12D結合プローブ（G12D-3bPEGと称される）を伴う89 bp DNAであった。参照分子は、8アームPEGに連結された野生型（c.35G）結合プローブ（WT-8アームPEGと称される）を伴う89 bp DNAであった。215 mV（1.0M LiCl 10 mM tris 1 mM EDTA）の下で35 nm径ナノ孔を用いて2つの対照を連続して試験した。視覚的に、このプロットは、標的イベントをタグ付けするための3つの不等式：

に基づく基準を示唆している。

しきい値q₁ = 1 msec、q₂ = 0.4 nSおよびq₃ = 0.65 nSは、図9Aにおいても示される標的タグ付けボックス（破線）を形成する。示されているしきい値と共に3つの不等式の基準を用いると、単独対照は、Q_ref = 0.006およびQ_targ = 0.795を示す。対照混合物として使用される、等モル濃度の標的・ペイロードおよび参照・ペイロード分子は、Q_1:1 = 0.274を示す。2つのその後の未知サンプルであるAおよびBは、Q_A = 0.066およびQ_B = 0.041となった。2つのサンプルは、図9Bに示されるイベントプロットにおいて2つの単独対照と重ね合わされている。視覚的に、サンプルAは、サンプルBよりも高いG12D含量を示すが、両方とも、100％WT対照の0.6％偽陽性率と比較して陽性である。等式（1）を適用し、補償のために対照混合物を使用した後の、野生型に対するG12D変異体の予測される部分量は、サンプルAおよびBについて、それぞれ、

である。

表7は、第1および2列目にサンプルAおよびBについての結果を示している。また、試験したすべての患者サンプルについての結果も示されている。合計5つの異なる患者サンプルをアッセイした。サンプルCおよびC2は、同じ患者サンプル由来のサブサンプルであり、サンプルD、D2およびE、E2も同様である。同じ患者サンプルから取得された異なるサブサンプルは、検討された3つすべての例で、相互に2％以内であった。これは、異なる人間が、異なるナノ孔においてかつ2つの例では異なる日に各ナノ孔実験を行ったにもかかわらずである。このことは、再現可能なワークフローおよび部分存在量の定量法を示唆している。

（表７）Q検定法を用いて血液サンプルにおいて予測されたG12D変異体部分量

これらのサンプルにおいて、G12Dの真の量は不明である。癌処置（化学療法）の実施から数週間後の患者からサンプルを回収し、その後に各患者のDNAを配列決定し、G12D変異について陽性であることを確認した。対照患者由来の非陽性対照サンプルもアッセイし、G12Dの予測される部分量は、2％またはそれ未満であり、これにより、ワークフロー全体の偽陽性が2％であることが示唆された。このワークフローのさらなる最適化は、検出限度をさらに低下させることができる。

比較のためにSVM法を適用した。1つの代表的な実験（表1におけるナノ孔NP4）を用いて、データを、SVM法の適用に関して記載されている工程を用いて処理した。重ね合わされた100％参照対照および100％標的対照についてのδG中央値対 log₁₀(持続時間)のイベント散布図が、図10に示されている。SVMにより特定された検出境界もプロットされている。Q検定およびSVM法の両方について、サンプルC2で予測されたG12D部分量が表8に報告されている。これらの2つの方法は、相互に5％以内である。

（表８）最適化されたしきい値（q）を決定するためにQ検定およびSVMを用いて予測されたG12D部分量

実施例5：短鎖DNA（89 bp）および2つの固有のペイロードを用いた野生型に対するKRAS G12D SNPのFAのためのEMGM
代表的なデータセットへの、ガウス混合期待値最大化アルゴリズム（EMGM）の適用を説明する。標的および参照は、実施例4に記載されるように、ペイロード結合dsDNAフラグメント内の変異KRASG12D SNPおよび野生型配列である。代表的なワークフローにおいて、1つのみの1：1対照混合物を測定し、かつ1つのみの100％参照対照を測定し、その後に未知混合物を測定した。

工程1：50％標的＆50％参照混合サンプルのドエルタイムの対数（log(ドエル)）および振幅中央値（medAmp）を、EMGMアルゴリズムへの入力データとして使用した（図11）。このアッセイに関する以前に確立された知識を用いて、標的である変異KRASG12D SNPの最初に特定される予測される領域を、プロットにおいて長方形の領域として標識した。以前の知識は、別個の実験において同等の条件（同じ緩衝液）下で100％標的対照を試験することによって確立された。このボックスは、タグ付けには使用されない。そうではなく、EMGMを対照混合物に適用した後、ボックス内のガウス混合に関連する任意のイベントが、標的イベントとしてタグ付けされる。

工程2：この集団に基づき、3ガウス混合モデルを使用してこのモデルを訓練した。このモデルは、1つのクラスター（ダイヤモンド）内で変異体（標的）領域を予測した。他の2つのクラスター（星および四角）は、野生型に対応する（図12）。本発明者らは、初期標的ドメインボックス（図11）内のいくつかのイベントがEMGMアルゴリズムにより参照モードと関連することを確認した。これは、ボックス自体が参照に対して標的としてタグ付けされるイベントの集団を定義するQ検定法と異なるものである。

工程3：このモデルを100％野生型（参照）サンプルに適用した。総イベント数に対する変異体（標的）領域のイベント数の比は、偽陽性部分量を表し（図13）、これを用いて部分存在量の推定値を改善することができる。

工程4：このモデルを使用して未知混合物を予測した。総イベント数に対する変異体領域のイベント数の比を、未知混合物における変異体分子の比率の予測子として使用した（図14）。

偽陽性補償による性能向上の試験として、工程3からの偽陽性部分量を、補正として工程4において算出された部分量から減算した。1つのセットのナノ孔実験の中の複数の混合物にEMGMを適用した結果が表9に報告されている。EMGM結果が得られるまで混合物を盲検にし、次いでその結果を真のG12D部分存在量値と比較した。

（表９）偽陽性（FP）補償なしおよびありのEMGMを比較する予測されたG12D部分量

NP-aの例において、性能は、偽陽性補償を使用することによって20％の例でのみ向上した。NP-bでは、性能はすべての例で向上した。NP-cについては偽陽性補償を試験しなかったが、性能はすでに、特に50％および20％推定値で良好であった。

まとめると、部分存在量の推定のためにEMGMモデルを未知混合物に適用する前に、対照混合物にEMGM法を適用することが必要となるのみである。

他の態様
使用されている用語は、限定ではなく説明のための用語であること、および広義の局面での本発明の真の範囲および精神から逸脱することなく添付の特許請求の範囲内で変更がなされ得ることが理解されるべきである。

本発明は、様々な記載されている態様に関して一定の長さおよび一定の具体性をもって記載されているが、任意のそのような詳細もしくは態様または任意の特定の態様に限定されることは意図されておらず、添付の特許請求の範囲を参照しつつ、そのような特許請求の範囲の先行技術に対する最も広義の可能な解釈を提供するよう、したがって、本発明の意図されている範囲を効果的に包含するよう理解されるべきである。

本明細書で言及されているすべての刊行物、特許出願、特許および他の参考文献は、それらの全体が参照により組み入れられる。相反する場合、定義を含めて、本明細書が優先される。加えて、節の表題、材料、方法および実施例は一例にすぎず、限定を意図したものではない。

Claims

1つまたは複数のナノ孔デバイスを用いて標的分析物の部分存在量の推定値を決定する方法であって、
1つまたは複数のナノ孔デバイスにおいてナノ孔セットをまたぐ電圧を印加して、標的分析物および参照分析物の単位を含むサンプルの一部について、検出可能な電気的シグネチャーを生成し、ナノ孔セットを通じた荷電分析物の移動を誘導する工程、
ナノ孔セットを通じた標的分析物および参照分析物の単位の移動からイベントシグネチャーセットを生成する工程、
イベントシグネチャーセットから、ナノ孔セットに対応しかつ標的分析物の部分存在量に関連するパラメータセットを生成する工程、
対応するしきい条件にしたがいパラメータセットの各々を評価し、検証されたパラメータセットを生成する工程であって、対応するしきい条件の各々が、パラメータセットの値の間で決定される変動性の尺度の関数に基づき、検証されたパラメータセットを生成することは、対応するしきい条件を満たすパラメータ値を保持することを含む、工程、
パラメータ組み合わせオペレーションにより検証されたパラメータセットの値を組み合わせる工程、ならびに
パラメータ組み合わせオペレーションの出力に基づき、標的分析物の部分存在量の推定値を返す工程
を含む、方法。

イベントシグネチャーセットのイベントシグネチャーが、ナノ孔セットのナノ孔を通じた標的分析物質および参照分析物質の1つの移動により誘導される測定された電流を含む、請求項1記載の方法。

変動性の尺度が、パラメータセットの値の間で決定される四分位範囲、標準偏差、および分散の少なくとも1つであり、変動性の尺度の関数が、変動性の尺度に定数を乗じたものを含む、請求項1記載の方法。

パラメータセットの少なくとも1つを評価するための対応するしきい条件が、パラメータセット内のパラメータの最大値と最小値の間の差を含む、請求項1記載の方法。

パラメータ組み合わせオペレーションにより検証されたパラメータセットの値を組み合わせる工程が、検証されたパラメータセットの値の重み付けされた平均を決定することを含み、検証されたパラメータセットの値に対する重みが、検証されたパラメータセットの各々に対する対応するしきい条件の充足レベルに基づき決定される、請求項1記載の方法。

パラメータセットを生成する工程が、ナノ孔からのデータの品質の査定に基づき、ナノ孔セットのナノ孔からのデータを考慮から除外することを含む、請求項1記載の方法。

品質の査定が、各ナノ孔の形態的特徴を特徴づける第１の査定、各ナノ孔の形態的特徴の変化率を特徴づける第2の査定、および各ナノ孔に関連する信号ノイズを特徴づける第3の査定の少なくとも1つを含む、請求項6記載の方法。

品質の査定が、各ナノ孔に関連して観察されるノイズに基づきナノ孔データをフィルタリングする第1のオペレーション、サンプル内のサンプル集団の分離に基づきナノ孔データをフィルタリングする第2のオペレーション、およびサンプル内のサンプル集団の較正比を決定する第3のオペレーションを含む、請求項6記載の方法。

第1のオペレーションが、ナノ孔データにおいてノイズイベントのサブセットと実イベントのサブセットを分離する標的領域境界を定義し、ノイズイベントのサブセットおよび実イベントのサブセットに基づき、ナノ孔セットの各々についてノイズ率を決定する、請求項8記載の方法。

第2のオペレーションが、電気信号の出力のドエルタイムおよび振幅の少なくとも1つに対して主成分分析（PCA）オペレーションを実施し、PCAオペレーションの第1の成分を使用してサンプルのサンプル集団間の分離の尺度を決定する、請求項8記載の方法。

標的分析物が、遺伝子操作された生物に関連する、請求項1記載の方法。

標的分析物の部分存在量の推定値を決定するためのシステムであって、
サンプル由来の物質を移動させるためのナノ孔セットを含む1つまたは複数のナノ孔デバイス；
ナノ孔セットと連通した電極セットを含む電気システム；ならびに
ナノ孔セットをまたぐ電圧を印加して、標的分析物および参照分析物の単位を含むサンプルの一部について、検出可能な電気的シグネチャーを生成し、ナノ孔セットを通じた荷電分析物の移動を誘導する指令、
ナノ孔セットを通じた標的分析物および参照分析物の単位の移動からイベントシグネチャーセットを生成する指令、
イベントシグネチャーセットから、ナノ孔セットに対応しかつ標的分析物の部分存在量に関連するパラメータセットを生成する指令、
対応するしきい条件にしたがいパラメータセットの各々を評価し、検証されたパラメータセットを生成する指令であって、対応するしきい条件の各々が、パラメータセットの値の間で決定される変動性の尺度の関数に基づき、検証されたパラメータセットを生成することが、対応するしきい条件を満たすパラメータ値を保持することを含む、指令、
パラメータ組み合わせオペレーションにより検証されたパラメータセットの値を組み合わせる指令、および
パラメータ組み合わせオペレーションの出力に基づき、標的分析物の部分存在量の推定値を返す指令
を記憶する非一時的コンピュータ読み取り可能メモリを含むコンピューティングシステム
を含む、システム。

変動性の尺度が、パラメータセットの値の間で決定される四分位範囲、標準偏差、および分散の少なくとも1つであり、変動性の尺度の関数が、変動性の尺度に定数を乗じたものを含む、請求項12記載のシステム。

コンピューティングシステムが、パラメータセットのパラメータの最大値と最小値の間の差を決定する指令を記憶するメモリを含み、パラメータセットの少なくとも1つを評価するための対応するしきい条件が、パラメータセット内のパラメータの最大値と最小値の間の差である、請求項12記載のシステム。

コンピューティングシステムが、検証されたパラメータセットの値の重み付けされた平均を決定する指令を記憶するメモリを含み、検証されたパラメータセットの値に対する重みが、検証されたパラメータセットの各々に対する対応するしきい条件の充足レベルに基づき決定される、請求項12記載のシステム。

標的分析物が、遺伝子操作された生物に関連する、請求項12記載のシステム。

コンピューティングシステムが、パラメータを得た各ナノ孔の品質の査定に基づきパラメータ値を破棄するための指令を記憶するメモリを含む、請求項12記載のシステム。

品質の査定が、各ナノ孔の形態的特徴を特徴づける第１の査定、各ナノ孔の形態的特徴の変化率を特徴づける第2の査定、および各ナノ孔に関連する信号ノイズを特徴づける第3の査定の少なくとも1つを含む、請求項17記載のシステム。

品質の査定が、ナノ孔データにおいてノイズイベントのサブセットと実イベントのサブセットを分離する標的領域境界を定義し、ノイズイベントのサブセットおよび実イベントのサブセットに基づき、ナノ孔セットの各々についてノイズ率を決定する、請求項17記載の方法。

品質の査定が、電気信号の出力のドエルタイムおよび振幅の少なくとも1つに対して主成分分析（PCA）オペレーションを実施し、PCAオペレーションの第1の成分を使用してサンプルのサンプル集団間の分離の尺度を決定する、請求項17記載の方法。