詳細な説明
本発明は、多数の方式で、例えば、プロセス;装置;系;合成物;コンピュータ読取り可能記憶媒体において具現化されたコンピュータプログラムプロダクト;および/またはプロセッサに連結されたメモリに記憶されかつ/もしくはそれによって提供されるインストラクションを実行するよう構成されたプロセッサのようなプロセッサとして実装され得る。本明細書において、これらの実装または本発明がとることができるその他の形態は、技術として言及される。概して、開示するプロセスの工程の順序は、本発明の範囲内で改変されてもよい。他に特記されない限り、タスクを達成するために構成されているとして記載されるプロセッサまたはメモリのような構成要素は、所定の時間にタスクを達成するよう時間的に構成された一般的な構成要素として実装されてもよく、またはタスクを達成するよう製造された特定の構成要素として実装されてもよい。本明細書において使用されるように、「プロセッサ」という用語は、コンピュータプログラムインストラクションのようなデータを処理するよう構成された1つまたは複数のデバイス、回路、および/またはプロセシングコアをさす。
本発明の一つまたは複数の態様の詳細な説明は、本発明の原理を図示する添付の図面と共に以下に提供される。本発明はそのような態様に関して説明されるが、本発明はいかなる態様にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定され、本発明には、多数の代替物、修飾、および等価物が包含される。多数の具体的な詳細が、本発明の完全な理解を提供するため、以下の説明において示される。これらの詳細は、例のために提供され、本発明は、これらの具体的な詳細のうちのいくつかまたは全てを含まずに特許請求の範囲に従って実施されてもよい。明確のため、本発明が不必要に不明瞭にならないよう、本発明に関係する技術分野において公知である技術的材料は、詳細には記載されていない。
内径1ナノメートル程度の孔径を有するナノポア膜デバイスは、迅速なヌクレオチド配列決定において見込みを示した。伝導液に浸されたナノポアに電位が印加される時、ナノポアを介したイオンの電導に起因する小さいイオン電流を観察することができる。電流のサイズは、孔径に影響を受ける。
ナノポアシーケンシングチップは、DNA配列決定のために使用され得る。ナノポアシーケンシングチップには、アレイとして構成された多数のセンサセルが組み込まれている。例えば、100万個のセルのアレイは、1000行×1000列のセルを含み得る。
図1は、ナノポアシーケンシングチップにおけるセル100の態様を図示する。脂質二重層102が、セルの表面に形成されている。可溶性タンパク質ナノポア膜貫通分子複合体(PNTMC)および関心対象の分析物を含有しているバルク電解質114が、セルの表面に直接置かれる。1個のPNTMC 104が電気穿孔によって脂質二重層102へ挿入される。アレイ中の個々の脂質二重層は、化学的にも電気的にも相互に接続されていない。従って、アレイ中の各セルは、PNTMCと会合した1個のポリマー分子に独特のデータを生じる、独立した配列決定機である。PNTMC 104は、分析物に対して作動し、そうでなければ不透過性である二重層を通るイオン電流をモジュレートする。
引き続き図1を参照すると、アナログ測定回路網112が、電解質の薄膜108によって覆われた金属電極110に接続されている。電解質の薄膜108は、イオン不透過性の脂質二重層102によって、バルク電解質114から隔離されている。PNTMC 104は、脂質二重層102を横切っており、バルク液体から金属電極110へイオン電流が流れるための唯一のパスを提供する。金属電極110は、作用電極(WE)とも呼ばれる。セルは、電気化学ポテンシャルセンサである対/基準電極(CE/RE)116も含む。
いくつかの態様において、ナノポアアレイは、1分子ナノポアシーケンシングバイシンセシス(Nano-SBS)技術を使用した平行配列決定を可能にする。図2は、Nano-SBS技術によるヌクレオチド配列決定を達成するセル200の態様を図示する。Nano-SBS技術においては、配列決定すべき鋳型202およびプライマーがセル200に導入される。この鋳型プライマー複合体に、4種の異なるタグが付けられたヌクレオチド208が、バルク水相に添加される。正確にタグ付けられたヌクレオチドがポリメラーゼ204と複合体を形成すると、タグのテールがナノポア206のバレルに位置付けられる。ポリメラーゼが正確なヌクレオチドの取り込みを触媒した後、ナノポア206のバレルに保持されたタグ付着ポリリン酸が、独特のイオン電流遮断信号210を生成し、それによって、タグの異なる化学構造のため、電子的に、付加された塩基が同定される。
図3は、予めロードされるタグによるヌクレオチド配列決定を達成しようとしているセルの態様を図示する。ナノポア301が膜302に形成されている。酵素303(例えば、DNAポリメラーゼのようなポリメラーゼ)が、ナノポアと会合している。いくつかのケースにおいて、ポリメラーゼ303は、ナノポア301に共有結合で付着している。ポリメラーゼ303は、配列決定すべき一本鎖核酸分子304と会合している。いくつかの態様において、一本鎖または二本鎖の核酸分子304は環状である。いくつかのケースにおいて、核酸分子304は直鎖状である。いくつかの態様において、核酸プライマー305は、核酸分子304の一部分にハイブリダイズする。ポリメラーゼ303は、一本鎖核酸分子304を鋳型として使用して、プライマー305へのヌクレオチド306の取り込みを触媒する。ヌクレオチド306はタグ種(「タグ」)307を含む。
図4は、予めロードされるタグによる核酸配列決定のためのプロセス400の態様を図示する。ステージAは図3に記載された構成要素を図示する。ステージCは、ナノポアへロードされたタグを示す。「ロードされた」タグとは、認識可能な量の時間、例えば、0.1ミリ秒(ms)〜1000msの間、ナノポアまたはその近くに位置付けられかつ/または残留するものであり得る。いくつかのケースにおいて、予めロードされるタグは、ヌクレオチドから放出される前にナノポアにロードされる。いくつかの事例において、タグは、ヌクレオチド取り込みイベントによって放出された後にナノポアを通過する(かつ/またはナノポアによって検出される)タグの可能性が、適度に高い場合、例えば、90%〜99%である場合、予めロードされる。
ステージAにおいて、タグ付きヌクレオチド(4種の異なる型のうちの1種:A、T、G、またはC)は、ポリメラーゼと会合していない。ステージBにおいて、タグ付きヌクレオチドが、ポリメラーゼと会合する。ステージCにおいて、ポリメラーゼはナノポアとドッキングする。タグは、膜および/またはナノポアを介して印加された電圧によって生成された電場の存在下で生成された力のような電気的な力によってドッキング中にナノポアへ引き込まれる。
会合したタグ付きヌクレオチドのうちのいくつかは、一本鎖核酸分子と塩基対合する(例えば、AはTと、GはCと)。しかしながら、会合したタグ付きヌクレオチドのうちのいくつかは、一本鎖の核酸分子と塩基対合しない。これらの非対合ヌクレオチドは、典型的には、正確に対合したヌクレオチドがポリメラーゼと会合し続ける時間尺度より短い時間尺度でポリメラーゼによって拒絶される。非対合ヌクレオチドは一過性にしかポリメラーゼと会合しないため、図4に示されるプロセス400は、典型的には、ステージDを越えて進行しない。例えば、非対合ヌクレオチドは、ステージBにおいて、またはプロセスがステージCに入った直後に、ポリメラーゼによって拒絶される。
ポリメラーゼがナノポアとドッキングする前に、ナノポアを通る電流は、約30ピコアンペア(pA)である。ステージCにおいて、ナノポアを通って流れる電流は、約6pA、8pA、10pA、または12pAであり、各アンペア数は、4種のタグ付きヌクレオチドの型のうちの1種に対応する。ポリメラーゼは、成長中の核酸分子へヌクレオチドを取り込み、タグ分子を放出するため、異性化およびトランスリン酸化の反応を起こす。ステージDにおいて、放出されたタグがナノポアを通過する。タグがナノポアによって検出される。具体的には、タグがナノポアに保持されると、タグの異なる化学構造によって独特のイオン電流遮断信号(例えば、図2中の信号210を参照すること)が生成され、それによって、付加された塩基が電子的に同定される。サイクル(即ち、ステージA〜EまたはステージA〜F)の繰り返しは、核酸分子の配列決定を可能にする。
いくつかのケースにおいて、図4のステージFにおいて見られるように、成長中の核酸分子へ取り込まれないタグ付きヌクレオチドもナノポアを通過するであろう。いくつかの事例において、未取り込みのヌクレオチドがナノポアによって検出され得るが、方法は、ヌクレオチドがナノポアにおいて検出される時間に少なくとも一部分基づき、取り込まれたヌクレオチドと未取り込みのヌクレオチドとを区別するための手段を提供する。未取り込みヌクレオチドに結合しているタグは、ナノポアを迅速に通過し、短期間(例えば、10ms未満)検出されるが、取り込まれたヌクレオチドに結合しているタグは、ナノポアへロードされ、長期間(例えば、少なくとも10ms)検出される。
図5は、ナノポアシーケンシングチップのセルにおいて測定されるイオン電流遮断信号500の態様を図示する。例えば、各セルが図2に示されるようなNano-SBS技術によるヌクレオチド配列決定を達成する態様において、異なるタグ付着ポリリン酸がナノポア206のバレルに保持されるため、イオン電流遮断信号500が測定される信号である。
図5に示されるように、Y軸は測定されたイオン電流遮断信号であり、X軸は時間である。ポリメラーゼがナノポアにドッキングしていない時、ナノポアはオープンチャンネル状態であると呼ばれる。ナノポアにオープンチャンネルが存在する時、ナノポアを通過する電流は約30pAである。ポリメラーゼがナノポアにドッキングする時、ナノポアを通って流れる電流は、約6pA、8pA、10pA、または12pAであり、各アンペア数は、4種のタグ付きヌクレオチドの型のうちの1種:A、T、G、またはCに対応する。4つの電流レベル(約6pA、約8pA、約10pA、および約12pA)は、部位によって変動する場合があり、経時的に振幅のドリフトを有する場合があり、変動する量の関連ノイズを有する場合があるが、4つの電流レベルは、相互に離れており、相互に区別可能である。従って、経時的な振幅のドリフト、および測定された電流に関連したノイズを相殺するために調整が行われた後、4つの異なる電流レベルは、4種のタグ付きヌクレオチドの異なる型を同定するためのサイン電流レベルとして使用され得る。例えば、図5に示されるように、信号のサイン電流レベルとの一致によってイオン電流遮断信号500から検出され得るイベントには、タグ付きヌクレオチドA、C、G、C、T、およびGの検出が含まれる。A、C、G、C、T、またはGの検出を以後ベースコーリングと呼び、タグ付きヌクレオチドの検出(例えば、Aの検出)のイベントを以後ベースコールイベントと呼ぶ。
いくつかの態様において、イオン電流は、各セルにおいてアナログ測定回路112(図1を参照すること)によって読み取られ、デジタル情報に変換され、チップから転送され、コンピュータによってチップの外部でベースコーリングが実施され得る。いくつかの態様において、フィールドプログラマブルゲートアレイ(FPGA)または特定用途向け集積回路(ASIC)が、転送されたデータを受容し、データを処理し、チップから、ベースコーリング技術が実施され得るコンピュータへデータを送る。しかしながら、ナノポアシーケンシングチップがより多くのセルを含むよう拡張されると、ナノポアシーケンシングチップとの間の総合転送データ速度は、到達不可能な速度にまで増加し得る。例えば、1個のセルが8ビット/試料で毎秒10,000のサンプルを生成する場合、1000万個のセルを有するナノポアシーケンシングチップは、毎秒約100ギガバイトのデータを生成するであろう。そして、ナノポアシーケンシングチップが約30分間運転された場合、データの総量は約200テラバイトまで累積するであろう。
多数の方式によって、ナノポアシーケンシングチップの総合転送データ速度を低下させることができる。いくつかの態様において、より詳細に以下に記載されるように、ナノポアシーケンシングチップ上のデータのうちのいくつかを圧縮するため、デジタル圧縮技術を使用することができ、次いで、圧縮されたデータをより低い転送速度でチップから転送することができる。
いくつかの態様において、データ縮小は、時間領域においてデータの群をフィルタリングすることによって達成される。静的較正および動的較正が、チップ上でのデータの圧縮およびフィルタリングの遂行を支援する。多数のメモリ効果およびメモリレス効果、具体的には、以下に限定されるわけではないが、アレイおよびセルのレベルでのシリコンプロセスの変動、電極の変動、試料間の脂質および生化学の特性および変動、温度および電圧の変動効果、配列に関するシステムメモリ効果、最適読み出しウィンドウ、ならびに完全な配列決定サイクルを通したエージング効果が、較正を使用して解決される。
較正は、完全な試料配列決定サイクルの間中、電気的レベルの動的な確立および同定ならびにアライメント/追跡を可能にするため、フィルタリング/圧縮スキームは完全に効果的で正確なままである。それは、最適な読み取りパラメータおよび時間の決定、ならびにフィルタリング/圧縮されたデータを見ることのみによる、そうでなければ理解し得ない試料中の不規則性の同定も可能にする。
較正戦略には、静的技術および動的技術、セルに基づく無作為抽出およびアレイに基づく無作為抽出、データ収集と平行した側波帯信号の使用、RAWデータ収集、ならびにオープンチャンネルレベルに基づく外挿が含まれる。
いくつかの態様において、データのうちのいくつかを、ナノポアシーケンシングチップにおいて(例えば、ベースコーリング技術を使用して)処理することができる。次いで、処理されたデータを、チップから、例えば、さらなる処理のためのコンピュータへ転送することができる。あるいは、処理されたデータは、イベントを検出し、検出されたイベントに応答して起こる制御信号を生成するため、ナノポアシーケンシングチップによって使用されてもよい。生成された制御信号は、インプット制御信号として、個々のセルまたはセルの群へフィードバックされ得る。検出および決定のうちのいくつかがチップ上でなされるため、より少ないデータが、さらなる処理のためにチップから転送される必要があり、より少ない制御データがチップに転送され得、制御データを生成するための応答時間も低下し得る。
図6は、ナノポアシーケンシングチップ上のナノポアセンサの測定値をエクスポートするためのプロセス600の態様のフローチャートを図示する。602において、ナノポアシーケンシングチップのセルにおけるナノポアセンサに関連した電気的特性が測定される。ナノポアセンサに関連した電気的特性は、任意の測定可能な電気的パラメータまたは複数の任意の測定可能な電気的パラメータであり得る。いくつかの態様において、測定されるナノポアセンサに関連した電気的特性には、電流が含まれる。例えば、再び図2を参照すると、ポリメラーゼが正確なヌクレオチドの取り込みを触媒した後、ナノポア206のバレルに保持されたタグ付着ポリリン酸が、独特のイオン電流遮断信号210を生成し、それを測定することができる。いくつかの態様において、ナノポアセンサまたはナノポアセンサもしくはセルの一部分に関連した電圧、キャパシタンス、または抵抗を含む、ナノポアセンサに関連した他の型の電気的特性が測定されてもよい。
604において、ナノポアセンサに関連した電気的特性が処理される。いくつかの態様において、ナノポアセンサの電気的特性の処理は、測定値に関連したノイズを低下させることを含む。例えば、測定値の平均をとることによってノイズを低下させることができる。フィルタリング技術によってもノイズを低下させることができる。いくつかの態様において、処理は、電気的特性の異なるレベルが、タグ付きヌクレオチドの異なる型の同定のためのサインレベルとして使用され得るよう、経時的な電気的特性の振幅のドリフトのモニタリングおよび相殺を含む。いくつかの態様において、電気的特性の測定値を、ドリフト効果を相殺するために調整することができる。いくつかの態様において、タグ付きヌクレオチドの異なる型を同定するためのサインレベルを、測定されている電気的特性のドリフトを相殺するため、動的に調整することができる。タグ付きヌクレオチドの特定の型を同定するためのサインレベルには、上限閾値および下限閾値の対が含まれ得る。例えば、電気的特性が上限閾値レベルと下限閾値レベルとの間にある場合、それは、特定のサインレベルおよびその対応するベースコールイベント(例えば、A、C、G、またはTの検出)にマッピングされ得る。
いくつかの態様において、ドリフト効果の補正はナノポアシーケンシングチップ上で達成され得る。いくつかの態様において、ドリフト効果の補正は、ナノポアシーケンシングチップの外部で達成され得る。例えば、外部コンピュータが、イオン電流測定値を受容し、モニタリングし、経時的なドリフト効果の補正の量を決定してもよい。外部コンピュータは、ドリフト効果を動的に補正するための制御信号をナノポアシーケンシングチップに送信することができる。
いくつかの態様において、ドリフト効果の補正は、セルレベルで達成され得る。各セルは、上記のようなドリフト効果をモニタリングし相殺するためのロジック構成要素を含む。いくつかの態様において、ドリフト効果の補正は、ナノポアシーケンシングチップの異なる区域内で独立に達成され得る。これは、ドリフトの量がチップの異なる区域内で変動し得るためである。各区域は、その区域内のセルのドリフト効果を集合的にモニタリングし相殺するためのロジック構成要素を含んでいてよい。
606において、電気的特性と1つまたは複数の以前の電気的特性とについてのサマリが決定される。608において、電気的特性と1つまたは複数の以前の電気的特性とについてのサマリが、ナノポアシーケンシングチップからエクスポートされる。エクスポートされたサマリは、さらなる処理のためにコンピュータによって使用され得る。より詳細に以下に記載されるように、サマリは、電気的特性の測定値から、ベースコールイベントの検出を可能にする情報を抽出し、ベースコーリングのために有用でない情報を除外する。サマリは、電気的特性の圧縮であり、電気的特性の測定値よりコンパクトである。その結果、サマリのエクスポートは、測定値のエクスポートとは対照的に、ナノポアシーケンシングチップの総合転送データ速度を低下させる。いくつかの態様において、電気的特性のサマリは、処理された電気的特性のサブセットである。
図7は、ナノポアシーケンシングチップのセルにおけるイオン電流遮断信号の測定値の例示的なセットを図示する。Y軸は測定されたイオン電流遮断信号であり、X軸は時間である。測定データについてのサマリを決定する異なる方式は、図7に示される測定値のセットを例示的な例として使用して、以下で議論する。
図8は、ナノポアシーケンシングチップのセルにおけるイオン電流遮断信号の測定値のうちのいくつかについてのサマリを決定するためのプロセス800の態様のフローチャートを図示する。いくつかの態様において、プロセス800は図6の工程606において達成されるプロセスである。
802において、電気的特性と1つまたは複数の以前の電気的特性の少なくとも一部分とが、ナノポアセンサにおけるベースコールイベントに対応することが決定される。例えば、図7に示されるように、測定値704は、10pAのサインレベルにマッピングされ得るため、G型のタグ付きヌクレオチドの検出というベースコールイベントに対応すると決定され得る。同様に、測定値706および708は、再びG型のタグ付きヌクレオチドの検出という2個の付加的なベースコールイベントに対応すると決定され得る。
複数の測定値が1個のベースコールイベントに対応することを決定するため、多数の基準を使用することができる。例えば、ヌクレオチド配列決定がNano-SBS技術によって達成される場合、2個のベースコールイベントは、有意に高いサイン電流レベル(約30pA)を有するオープンチャンネル状態によって、相互に分離されることが公知である。従って、閾値レベル702を上回る測定値はオープンチャンネル状態に対応すると決定され得る。これらの測定値は、ベースコーリングのために有用な付加的な情報を提供し得ないが、測定値のセグメントを分離するために使用され得る。例えば、測定値710と測定値712との間にある測定値、即ち、測定値704は、1個のベースコールイベントに対応すると決定され得、測定値712と測定値714との間にある測定値、即ち、測定値706は、もう1個のベースコールイベントに対応すると決定され得る。
引き続き図8を参照すると、804において、電気的特性と1つまたは複数の以前の電気的特性の少なくとも一部分とを表すサマリが決定される。いくつかの態様において、サマリは振幅パラメータおよび時間パラメータを含む。例えば、振幅パラメータは電気的特性の平均振幅であり得、時間パラメータは測定値の持続時間であり得る。例えば、図7を参照すると、測定値704を表す第1のパラメータは10pAであり、第2のパラメータは57msである。同様に、測定値706および測定値708を表すパラメータは、それぞれ(10pA、48ms)および(10pA、8ms)である。圧縮前の最初の測定値は、各々1バイトの79の測定値を含む。圧縮後、測定値を表すサマリは、6バイトのデータに縮小される。従って、圧縮比は10:1を超える。
いくつかの態様において、サマリはランレングス符号化によって決定される。例えば、ある種の閾値にマッピングされる連続する測定値を、単一の振幅値および連続する測定値の個数によって表すことができる。
いくつかの態様において、サマリは、ある種のレベルの測定値の持続時間を符号化することによって決定される。例えば、ある種の閾値にマッピングされる連続する測定値を、単一の振幅値および連続する測定値の持続時間によって表すことができる。
いくつかの態様において、サマリは、ベースコールイベントの始めを符号化することによって決定される。例えば、オープンチャンネル状態の後の最初の測定値(測定値716を参照すること)を、ベースコールイベントを表すために使用することができる。
いくつかの態様において、ベースコーリングはプロセス600の工程606において達成される。サマリはベースコールイベントを含む。例えば、図7に示された測定値についてのサマリは(G、G、G)である。
上述の態様は、理解の明確のためにある程度詳細に説明したが、本発明は提供した詳細に限定されない。本発明を実装するための多くの代替的な方式が存在する。開示された態様は、例示的であって限定的なものではない。