JP2020504816A - 適応ナノ細孔信号圧縮 - Google Patents

適応ナノ細孔信号圧縮 Download PDF

Info

Publication number
JP2020504816A
JP2020504816A JP2019531973A JP2019531973A JP2020504816A JP 2020504816 A JP2020504816 A JP 2020504816A JP 2019531973 A JP2019531973 A JP 2019531973A JP 2019531973 A JP2019531973 A JP 2019531973A JP 2020504816 A JP2020504816 A JP 2020504816A
Authority
JP
Japan
Prior art keywords
data
frames
cell
cells
digest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019531973A
Other languages
English (en)
Other versions
JP6770197B2 (ja
Inventor
フェルナンデス−ゴメス,サンティアゴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2020504816A publication Critical patent/JP2020504816A/ja
Application granted granted Critical
Publication of JP6770197B2 publication Critical patent/JP6770197B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method

Abstract

本明細書に記載された技法は、DNA分子の並列配列決定のためのシステムおよび方法に関する。前処理装置は、100,000個以上のセルを含むセンサチップから未処理のデータフレームを受け取ることができ、それぞれの未処理データフレームは、この100,000個以上のセルの形成中またはこの100,000個以上のセルを使用したDNA分子の配列決定中の所与の時刻における、この100,000個以上のセルからの検出信号を含むことができる。前処理装置は次いで、セルの状態を決定するための関連情報を未処理データフレームから抽出し、抽出された情報を含む1つまたは複数のダイジェストフレームを生成し、ダイジェストフレームを、塩基決定などの処理のために処理装置に送る。処理装置に送られるダイジェストフレームの数は、いくつかの未処理データフレームよりも少なく、ダイジェストフレームは前処理されたデータを含むため、処理装置に転送されるデータの量および処理装置によるデータ処理の量を減らすことができる。

Description

[0001]内径1ナノメートル程度の細孔サイズを有するナノ細孔膜デバイス(nanopore membrane device)は、高速ヌクレオチド配列決定において有望である。伝導性流体に浸漬されたナノ細孔を横切って電圧電位を印加すると、ナノ細孔を横切るイオンの伝導によるものと考えられる小さなイオン電流が存在することがある。この電流のサイズは、細孔サイズおよびナノ細孔の中にどの分子があるのかに敏感である。この分子を、特定のヌクレオチドに取り付けられた特定のタグとすることができ、それによって核酸の特定の位置にあるヌクレオチドの検出を可能にすることができる。分子の抵抗を測定する手段として、ナノ細孔を含む回路内の電圧を(例えば積分コンデンサにおいて)測定することができ、それによってナノ細孔の中にどの分子があるのかを検出することを可能にすることができる。
[0002]ナノ細孔ベースの配列決定センサチップを、DNAの配列決定に使用することができる。ナノ細孔ベースの配列決定センサチップは、配列を並列に決定するためにアレイとして構成された多数のセンサセルを含むことができる。例えば、ナノ細孔ベースの配列決定センサチップは、100,000個以上のDNA分子の配列を並列に決定するために2次元アレイとして配置された、100、000個以上(例えば百万個以上)のセルを含むことがある。したがって、複数の期間のうちのそれぞれの期間中に、センサチップによって、100,000個以上のセルからの測定信号を含む大量のデータが生成されることがある。
[0003]本開示は一般に、ナノ細孔ベースのDNA配列決定に関し、より詳細には、多数の並列配列決定センサセルを含むナノ細孔ベースの配列決定センサチップによって生成されたデータの圧縮に関する。配列決定センサセルによって生成された全てのデータを処理に送る代わりに、前処理回路を使用して、配列決定センサセルによって生成されたデータから関連情報を抽出し、抽出された情報だけをさらなる処理のために転送して、転送されるデータの量を減らす。
[0004]いくつかの実施形態では、前処理回路を使用して、センサチップによって生成されたデータから、配列決定センサセルの形成中に配列決定センサセルを検査および較正するための関連情報、ならびにDNA分子中の塩基を決定するための関連情報を抽出する。この抽出された情報だけが、抽出された情報に基づいて配列決定センサセルを検査および較正すること、および/またはDNA分子中の塩基を決定することができる処理装置に送られる。この前処理回路は、セル形成、較正および配列決定の異なる段階中に、センサチップによって生成されたデータから異なる情報を抽出するように構成することができる。いくつかの実施形態では、配列決定システム内の他の構成要素からのリクエストに基づいて、前処理回路が、センサチップによって異なる時刻に生成されたデータから異なる情報を適応的に抽出する。
[0005]いくつかの実施形態では、少なくとも100,000個のDNA分子の配列を並列に決定するように構成された配列決定システムを操作する方法が開示される。この方法は、複数のセルを含むセンサチップからデータフレームのセットを、前処理回路によって受け取るステップを含むことができ、それぞれのデータフレームは、複数のセルからの検出信号を含むことができ、異なる1つの時刻に対応することができる。この方法はさらに、データフレームのセットから情報を抽出して、複数のセルの状態を決定する際に使用するダイジェストされた情報(digested information)(以後、ダイジェスト情報)を取得するステップを含むことができる。この方法はさらに、データフレームのセットから抽出されたダイジェスト情報を含むダイジェストされたフレーム(以後、ダイジェストフレーム)のグループを生成するステップと、ダイジェストフレームのグループを、複数のセルの状態を決定する際に使用する処理装置に送るステップとを含むことができる。
[0006]いくつかの実施形態では、複数のセルを含むセンサチップからの出力データを処理するための装置が開示される。この装置は、前処理回路と、前処理回路に結合されたメモリとを含むことができる。この前処理回路は、センサチップからデータフレームのセットを受け取るようにすることができる。それぞれのデータフレームは、複数のセルからの検出信号を含むことができ、異なる1つの時刻に対応することができる。この装置は、データフレームのセットのうちの少なくともいくつかのデータフレームをメモリに記憶することができる。この装置は、データフレームのセットの中の複数のセルの検出信号から情報を抽出して、複数のセルの状態を決定するためのダイジェスト情報を取得すること、データフレームのセットから抽出されたダイジェスト情報を含むダイジェストフレームのグループを生成すること、およびダイジェストフレームのグループを、複数のセルの状態を決定する際に使用する処理装置に送ることができる。
[0007]したがって、本発明は、少なくとも100,000個のDNA分子の配列を並列に決定するように構成された配列決定システムを操作する方法を提供する。この方法は、前処理回路において、複数のセルを含むセンサチップからデータフレームの第1のセットを受け取るステップであり、複数のセルのうちのそれぞれのセルが、そのセルの状態を決定するための検出信号を経時的に生成するように構成されており、それぞれのデータフレームが、複数のセルからの検出信号を含み、異なる1つの時刻に対応する、ステップと、データフレームの第1のセットの中の複数のセルの検出信号から情報を抽出して、複数のセルの状態を決定する際に使用する第1のダイジェスト情報を取得するステップと、データフレームの第1のセットから抽出された第1のダイジェスト情報を含む1つまたは複数のダイジェストフレームの第1のグループを生成するステップであり、1つまたは複数のダイジェストフレームの第1のグループにおけるダイジェストフレームの数が、データフレームの第1のセットにおけるデータフレームの数よりも少ない、ステップと、1つまたは複数のダイジェストフレームの第1のグループを、複数のセルの状態を決定する際に使用する処理装置に送るステップとを含む。1つまたは複数のダイジェストフレームの第1のグループは、データフレームの第1のセットからの1つまたは複数のデータフレームを含むことができる。セルの状態は、セルの開放状態もしくは短絡状態、セル内の2分子層(bilayer)の存在もしくは不在、セル内のナノ細孔の存在もしくは不在、セルに関連づけられた塩基、またはこれらの任意の組合せから選択される。データフレームの第1のセットは、複数のセルの形成中に生成された、センサチップからのデータフレームを含むことができる。データフレームの第1のセットはあるいは、複数のセルの較正中に生成された、センサチップからのデータフレームを含むことができる。データフレームの第1のセットは、配列決定サイクルにおいて生成された、センサチップからのデータフレームを含むこともできる。データフレームの第1のセットはあるいは、多数の配列決定サイクルにおいて生成された、センサチップからのデータフレームを含むこともできる。この方法はさらに、1つまたは複数のダイジェストフレームの第1のグループの特性を識別するフレームマップを生成するステップを含むことができる。フレームマップは、1つまたは多数の配列決定サイクルのために生成されたダイジェストフレームを識別することができる。この方法はさらに、センサチップからのデータフレームの第2のセットを使用して1つまたは複数のダイジェストフレームの第2のグループを生成するよう求めるリクエストを受け取るステップと、そのリクエストに基づいて、データフレームの第2セットの中の複数のセルの検出信号から情報を抽出して、複数のセルの状態を決定する際に使用する第2のダイジェスト情報を取得するステップと、データフレームの第2のセットから抽出された第2のダイジェスト情報を含む1つまたは複数のダイジェストフレームの第2のグループを生成するステップと、1つまたは複数のダイジェストフレームの第2のグループを処理装置に送るステップとを含むことができる。1つまたは複数のダイジェストフレームの第2のグループの中のダイジェストフレームの数は、1つまたは複数のダイジェストフレームの第1のグループの中のダイジェストフレームの数よりも多くてもよく、または少なくてもよい。リクエストは、1つまたは複数の所望のダイジェストフレームを識別することができる。
[0008]本発明はさらに、センサチップからの出力データを処理するための装置を提供する。この装置は、前処理回路と、前処理回路に結合されたメモリとを備え、前処理回路が、センサチップからデータフレームの第1のセットを受け取るように構成されており、センサチップは複数のセルを含み、複数のセルのうちのそれぞれのセルは、そのセルの状態を決定するための検出信号を経時的に生成するように構成されており、それぞれのデータフレームは、複数のセルからの検出信号を含み、異なる1つの時刻に対応し、前処理回路がさらに、データフレームの第1のセットのうちの少なくともいくつかのデータフレームをメモリに記憶するように構成されており、前処理回路がさらに、データフレームの第1のセットの中の複数のセルの検出信号から情報を抽出して、複数のセルの状態を決定するための第1のダイジェスト情報を取得するように構成されており、前処理回路はさらに、データフレームの第1のセットから抽出された第1のダイジェスト情報を含む1つまたは複数のダイジェストフレームの第1のグループを生成するように構成されており、1つまたは複数のダイジェストフレームの第1のグループにおけるダイジェストフレームの数は、データフレームの第1のセットにおけるデータフレームの数よりも少なく、前処理回路はさらに、1つまたは複数のダイジェストフレームの第1のグループを、複数のセルの状態を決定する際に使用する処理装置に送るように構成されている。前処理回路は、フィールドプログラマブルゲートアレイ(FPGA)、システムオンチップ(SoC)、特定用途向け集積回路(ASIC)、プログラマブルアレイロジック(PAL)、またはコンプレックスプログラマブルロジックデバイス(CPLD)を含むことができ、前処理回路はさらに、1つまたは複数のダイジェストフレームの第1のグループの特性を識別するフレームマップを生成するように構成することができる。セルの状態は、セルの開放状態もしくは短絡状態、セル内の2分子層の存在もしくは不在、セル内のナノ細孔の存在もしくは不在、セルに関連づけられた塩基、またはこれらの任意の組合せから選択することができる。データフレームの第1のセットは、複数のセルの形成中または1つもしくは複数の配列決定サイクル中に生成された、センサチップからのデータフレームを含むことができる。検出信号は、1つまたは複数のAC信号サイクル内のデータ点を含むことができ、それぞれのAC信号サイクルは明期(bright period)および暗期(dark period)を含み、検出信号は、1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの明期内の1つまたは複数のデータ点と、1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの暗期内の1つまたは複数のデータ点とを含み、1つまたは複数のダイジェストフレームのうちのそれぞれのダイジェストフレームは、複数のセルのうちのそれぞれのセルについて、AC信号サイクルの明期内の最初のデータ点とそのAC信号サイクルの暗期内の第1のデータ点との差、AC信号サイクルの明期内の最後のデータ点とそのAC信号サイクルの暗期内の最後のデータ点との差、明期内の最後のデータ点と次の暗期内の最初のデータ点との差、暗期内の最後のデータ点と次の明期内の最初のデータ点との差、またはAC信号サイクルの暗期内の2つのデータ点間の差を含むことができる。
[0009]ナノ細孔ベースの配列決定チップ内のセルの一実施形態を示す図である。 [0010]ナノ細孔ベースの配列決定チップ内のセルの一実施形態を示す図である。 [0011]Nano−SBS技法を使用したヌクレオチド配列決定を実行しているセルの一実施形態を示す図である。 [0012]事前装填された(pre−loaded)タグを用いたヌクレオチド配列決定を実行しようとしているセルの一実施形態を示す図である。 [0013]事前装填されたタグを用いた核酸配列決定のためのプロセスの一実施形態を示す図である。 [0014]ナノ細孔ベースの配列決定チップのセル内の回路の一実施形態を示す図である。この回路は、既に形成された脂質2分子層を破壊することなく、セル内に脂質2分子層が形成されたかどうかを検出するように構成することができる。 [0015]ナノ細孔ベースの配列決定チップのセル内のある、図6Aに示された回路と同じ回路を示す図である。図6Aと比べると、作用電極と対電極との間の脂質膜/2分子層を示す代わりに、作用電極および脂質膜/2分子層の電気的特性を表す電気的モデルが示されている。 [0016]ACサイクルの明期および暗期中にナノ細孔セルから捕捉された例示的なデータ点を示す図である。 [0017]ある種の実施形態に基づく、ナノ細孔配列決定セルを形成および較正する例示的な方法を示す流れ図である。 [0018]ある種の実施形態に基づく、配列決定チップのナノ細孔配列決定セルを較正する例示的な方法を示す流れ図である。 [0019]ある種の実施形態に基づく、配列決定チップのセル内のナノ細孔の数を評価する例示的な方法を示す流れ図である。 [0020]図11Aは、ある種の実施形態に基づく、セルの1つの状態に対する見本の開チャネル電圧データを示す図である。図11Bは、ある種の実施形態に基づく、セルの別の状態に対する見本の開チャネル電圧データを示す図である。図11Cは、ある種の実施形態に基づく、セルの別の状態に対する見本の開チャネル電圧データを示す図である。 [0021]ある種の実施形態に基づく、見本のヒストグラムデータを示す図である。 [0022]ある種の実施形態に基づく、例示的なナノ細孔ベースの配列決定チップによって捕捉されたデータを処理するための例示的なシステムのブロック図である。 [0023]ある種の実施形態に基づく、例示的なナノ細孔ベースの配列決定チップによって捕捉された未処理のデータフレームの例を示す図である。 [0024]ある種の実施形態に基づく、例示的なナノ細孔ベースの配列決定チップによって捕捉された未処理のデータフレームを前処理することによって生成された例示的なダイジェストデータフレームを示す図である。 [0025]ある種の実施形態に基づく、例示的なフレームマップを示す図である。 [0026]ある種の実施形態に基づく、複数(例えば100,000個以上)のDNA分子の配列を並列に決定するように構成された配列決定システムを操作する例示的な方法を示す流れ図である。 [0027]ある種の実施形態に基づく、適応データ処理の例示的な方法を示す流れ図である。 [0028]ある種の実施形態に基づくシステムおよび方法とともに使用可能な例示的なコンピュータシステムのブロック図である。
定義
[0029]「核酸」は、デオキシリボヌクレオチドまたはリボヌクレオチド、および一本鎖または二本鎖の形態のデオキシリボヌクレオチドまたはリボヌクレオチドのポリマーを指すことがある。この用語は、合成、天然および非天然であり、基準核酸と同様の結合特性を有し、基準ヌクレオチドと同様に代謝される、知られているヌクレオチド類似体または修飾された骨格鎖残基(modified backbone residue)もしくは連鎖(linkage)を含む、核酸を包含することがある。このような類似体の例には、限定はされないが、ホスホロチオアート、ホスホラミダイト、メチルホスホナート、キラル−メチルホスホナート、2−O−メチルリボヌクレオチド、ペプチド−核酸(PNA)が含まれる。
[0030]特段の記載がない限り、特定の核酸配列は暗に、明示的に示された配列だけでなく、その核酸配列の保存的に修飾された異形(conservatively modified variant)(例えば縮退コドン置換(degenerate codon substitution))および相補配列も包含する。具体的には、縮退コドン置換は、1つまたは複数の選択された(または全ての)コドンの第3位が混合基および/またはデオキシイノシン残基で置換された配列を生成することによって達成することができる(Batzer他、Nucleic Acid Res.19:5081(1991);Ohtsuka他、J.Biol.Cham.260:2605〜2608(1985);Rossolini他、Mol.Cell.Probes 8:91〜98(1994))。核酸という用語は、遺伝子、cDNA、mRNA、オリゴヌクレオチドおよびポリヌクレオチドと相互に交換可能に使用される。
[0031]用語「ヌクレオチド」は、そうでないことが文脈から明らかである場合を除き、天然のリボヌクレオチドまたはデオキシリボヌクレオチド単量体を指すことに加えて、誘導体および類似体を含む、それらに関係した構造的異形であって、ヌクレオチドが使用されている特定の文脈(例えば相補塩基とのハイブリダイゼーション)に関して機能的に等価である構造的異形をも指すと理解することができる。
[0032]「ナノ細孔」は、膜に形成された、または他の手法で膜に提供された細孔(pore)、チャネル(channel)または通路(passage)を指す。膜は、脂質2分子層などの有機膜、またはポリマー材料で形成された膜などの合成膜とすることができる。ナノ細孔は、例えば相補型金属酸化物半導体(CMOS)または電界効果トランジスタ(FET)回路などの感知回路または感知回路に結合された電極に隣接または近接して配することができる。いくつかの例では、ナノ細孔が、0.1ナノメートル(nm)から約1000nm程度の特性幅または特性直径を有する。一部のナノ細孔はタンパク質である。
[0033]用語「明期」は一般に、AC信号によって加えられた電場によってタグ付きヌクレオチドのタグがナノ細孔の中へ押し込まれているときの期間を指す。用語「暗期」は一般に、AC信号によって加えられた電場によってタグ付きヌクレオチドのタグがナノ細孔から押し出されているときの期間を指す。ACサイクルは、明期および暗期を含むことができる。異なる実施形態においては、ナノ細孔セルを明期(または暗期)にするためにナノ細孔セルに印加される電圧信号の極性が異なることがある。明期と暗期は、基準電圧に関する交番信号の異なる部分に対応しうる。
[0034]用語「信号値」は、配列決定セルから出力された配列決定信号の値を指すことがある。ある種の実施形態によれば、配列決定信号は、1つまたは複数の配列決定セルの回路内の点から測定および/または出力された電気信号であり、信号値は例えば、電圧もしくは電流である(または電圧もしくは電流を表す)。信号値は、電圧および/もしくは電流の直接測定の結果を表すことがあり、かつ/または間接測定を表すことがある。例えば、信号値は、電圧または電流が指定された値に達するのにかかる所要時間の測定値であることがある。信号値は、ナノ細孔の抵抗率と相関する測定可能な任意の量を表すことがあり、この測定可能な量から、(挿通された(threaded)および/または挿通されていない)ナノ細孔の抵抗率および/またはコンダクタンスを導き出すことができる。別の例として、信号値は、光強度、例えば、ポリメラーゼによって触媒されて核酸を形成しているヌクレオチドに取り付けられた蛍光体からの光強度に対応することがある。
[0035]用語「フレーム」または「データフレーム」は、センサチップ上のそれぞれの動作セルの少なくとも1つのデータ点を含むデータの集合を指す。フレームは、センサチップのそれぞれの動作セルからの所与の時刻の未処理データを含む未処理フレームであることがある。フレームはさらに、1つまたは複数の未処理フレームからの処理済みデータを含むダイジェストフレームであることがある。用語「フレームマップ」または「記録フレームマップ」は、処理のために処理装置に送られるフレームの流れを記述するために使用されるフレームの配列を指す。特段の記載がない限り、「フレームマップ」は周期的に繰り返される。例えば、「RMDRM」記録フレームマップは、サイクルの明期からの最初および2番目の未処理フレーム(RおよびR)、続いて明期の中間(M)フレーム、減衰(D)フレーム、そのサイクルの暗期からの最初の未処理フレーム(R)、および暗期の中間(M)フレームからなる配列を示すことがある。フレームマップは、1つの配列決定サイクルまたは多数の配列決定サイクルのために生成されたダイジェストフレームを識別することができる。
[0036]用語「ラストポイントデルタ(last point delta:LPD)」は、サイクルの明期の最後のサンプルとそのサイクルの暗期の最後のサンプルとの差を指すものとすることができる。用語「ファーストポイントデルタ(first point delta:FPD)」は、サイクルの明期の最初のサンプルとそのサイクルの暗期の最初のサンプルとの差を指すものとすることができる。用語「ステップポイントデルタ(step point delta:SPD)pos/negまたはneg/pos」は、明期の最後のサンプルと次の暗期の最初のサンプルとの差(pos/neg)、または暗期の最後のサンプルと次の明期の最初のサンプルとの差(neg/pos)を指すものとすることができる。用語「ダークディケイデルタ(dark decay delta:DDD)」は、サイクルの暗期の2つのサンプル間の差を指すものとすることができる。用語「ウィグルポイントデルタ(wiggle point delta:WPD)」は、ウィグル波形(wiggle waveform)が印加されたときの明期の最後のサンプルと次の暗期の最初のサンプルとの差を指すものとすることができる。用語「Xポイントデルタ(X point delta:XPD)」は、任意のサンプル間の差を指すものとすることができる(通常はLPDを除く)。用語「レールド(railed)」は、ADC出力の最小値または最大値を指すものとすることができる。例えば、8ビットADCに関しては、レールド値が0または255である。
[0037]本明細書で使用されるとき、波形は信号に対応することがあり、その信号に関連したレベル(振幅)、タイミングおよびデータを含むことがある。波形は、周期的または非周期的であることがある。波形は、アナログ信号またはディジタル信号を表すことがある。
詳細な説明
[0038]本明細書に開示された技法は、ナノ細孔ベースのDNA配列決定に関し、より詳細には、多数の並列配列決定センサセルを含むナノ細孔ベースの配列決定センサチップによって生成されたデータの圧縮に関する。
[0039]いくつかの実施形態では、前処理回路を使用して、センサチップによって生成されたデータから、配列決定センサセルの形成中に配列決定センサセルを検査および較正するための関連情報、ならびにDNA分子中の塩基を決定するための関連情報を抽出する。この抽出された情報だけが、抽出された情報に基づいて配列決定センサセルを検査および較正すること、またはDNA分子中の塩基を決定することができる処理装置に送られる。この前処理回路は、セル形成、較正および配列決定の異なる段階中に、センサチップによって生成されたデータから異なる情報を抽出するように構成することができる。
[0040]いくつかの実施形態では、配列決定システム内の他の構成要素からのリクエストに基づいて、前処理回路が、センサチップによって異なる時刻に生成されたデータから異なる情報を適応的に抽出する。
I.ナノ細孔システム
[0041]ナノ細孔センサチップ内のナノ細孔セルは、多くの異なる手法で実施することができる。例えば、いくつかの実施形態では、配列決定する対象の核酸分子中の異なるヌクレオチドに、異なるサイズおよび/または異なる化学構造のタグが取り付けられる。いくつかの実施形態では、配列決定する対象の核酸分子の鋳型に対して相補的な相補鎖が、異なるポリマータグが取り付けられたヌクレオチドをその鋳型とハイブリダイズさせることによって合成される。いくつかの実施態様では、核酸分子と取り付けられたタグの両方がナノ細孔の中を移動し、ナノ細孔を通り抜けるイオン電流が、ヌクレオチドに取り付けられたタグの具体的なサイズおよび/または構造により、ナノ細孔の中にあるヌクレオチドを示す。いくつかの実施態様では、タグだけをナノ細孔の中に移動させる。さらに、ナノ細孔内の異なるタグを検出する多くの異なる手法が存在することがある。
A.ナノ細孔配列決定セル
[0042]図1は、ある種の実施形態に基づく、ナノ細孔ベースの配列決定チップ内のナノ細孔セル100の一実施形態を示す簡略化された構造である。ナノ細孔セル100は、酸化物106などの誘電体材料によって形成されたウェルを含むことができる。ウェルを覆うため、ウェルの表面に膜102を形成することができる。いくつかの実施形態では、膜102が脂質2分子層である。セルの表面には、バルク電解液(bulk electrolyte)114が配置されており、バルク電解液114は例えば、可溶性タンパク質ナノ細孔膜貫通分子複合体(soluble protein nanopore transmembrane molecular complex:PNTMC)と、関心の分析物とを含むことができる。エレクトロポレーション(electroporation)によって膜102に単一のPNTMC104を挿入することができる。アレイ内の個々の膜は、化学的にもまたは電気的にも互いに接続されていない。したがって、アレイ内のそれぞれのセルは、PNTMCに結合された単一のポリマー分子に固有のデータを生成する、独立した配列決定マシンである。PNTMC104は、分析物に対して動作し、通常は不透過性である2分子層を通り抜けるイオン電流を変調する。
[0043]電解液の薄膜108によって覆われた金属作用電極110にアナログ測定回路112が接続されている。電解液の薄膜108は、イオン不透過性の膜102によってバルク電解液114から分離されている。PNTMC104は膜102を横切り、バルク液体から作用電極110にイオン電流が流れるための唯一の経路を提供する。セルはさらに、電気化学ポテンシャルセンサである対電極(CE)116を含む。セルはさらに参照電極117を含む。
[0044]図2は、ポリヌクレオチドまたはポリペプチドの特性を評価する目的に使用することができる、ある種の実施形態に基づく、ナノ細孔センサチップ内の例示的なナノ細孔セル200の一実施形態を示す。ナノ細孔セル200は、誘電体層201および204から形成されたウェル205と、ウェル205の上に形成された脂質2分子層214などの膜と、脂質2分子層214上にあって脂質2分子層214によってウェル205から分離された試料チャンバ215とを含むことができる。ウェル205は、電解液のボリューム(volume)206を含むことができ、試料チャンバ215は、ナノ細孔と関心の分析物(例えば配列決定する対象の核酸分子)とを含むバルク電解液208を保持することができる。ナノ細孔は例えば、可溶性タンパク質ナノ細孔膜貫通分子複合体(PNTMC)である。
[0045]ナノ細孔セル200は、ウェル205の底の作用電極202と、試料チャンバ215内に配された対電極210とを含むことができる。作用電極202と対電極210の間に、信号源228が電圧信号を印加することができる。この電圧信号によって引き起こされるエレクトロポレーションプロセスによって、脂質2分子層214に単一のナノ細孔(例えばPNTMC)を挿入し、それによって脂質2分子層214内にナノ細孔216を形成することができる。アレイ内の個々の膜(例えば脂質2分子層214または他の膜構造体)は、化学的にもまたは電気的にも互いに接続されていなくてもよい。したがって、アレイ内のそれぞれのナノ細孔セルを、ナノ細孔に結合された単一のポリマー分子に固有のデータを生成する、独立した配列決定マシンとすることができる。ナノ細孔は、関心の分析物に対して動作し、通常は不透過性である脂質2分子層を通り抜けるイオン電流を変調する。
[0046]図2に示されているように、ナノ細孔セル200は、シリコン基板などの基板230上に形成することができる。基板230上に誘電体層201を形成することができる。誘電体層201を形成するために使用される誘電体材料は、例えばガラス、酸化物、窒化物などを含むことができる。基板230上および/または誘電体層201内に、電気刺激を制御するため、およびナノ細孔セル200から検出された信号を処理するための電気回路222を形成することができる。例えば、誘電体層201内に、パターンが形成された複数の金属層(例えば金属1から金属6)を形成することができ、基板230上に複数の能動デバイス(例えばトランジスタ)を製作することができる。いくつかの実施形態では、信号源228が、電気回路222の部分として含まれている。電気回路222は例えば、増幅器、積分器、アナログ−ディジタル変換器、ノイズフィルタ、フィードバック制御論理および/または他のさまざまな構成要素を含むことができる。電気回路222をさらに、メモリ226に結合された処理装置224に結合することができ、処理装置224は、配列決定データを分析して、アレイ内で配列決定が実行されたポリマー分子の配列を決定することができる。
[0047]誘電体層201上に作用電極202を形成することができ、作用電極202は、ウェル205の底の少なくとも一部を構成することができる。いくつかの実施形態では、作用電極202が金属電極である。非ファラデー性伝導(non−faradaic conduction)のために、作用電極202は、例えば白金、金、窒化チタンおよび黒鉛など、腐食および酸化に対して抵抗性の金属または他の材料でできていてもよい。例えば、作用電極202は、電気めっきされた白金を含む白金電極とすることができる。別の例では、作用電極202が窒化チタン(TiN)作用電極である。作用電極202は多孔質とすることができ、それによって作用電極202の表面積を増大させることができ、その結果として作用電極202に関連した静電容量を増大させることができる。ナノ細孔セルの作用電極は、別のナノ細孔セルの作用電極から独立していることがあるため、本開示では作用電極をセル電極と呼ぶことがある。
[0048]誘電体層201の上方に誘電体層204を形成することができる。誘電体層204は、ウェル205を取り囲む壁を形成する。誘電体層204を形成するために使用される誘電体材料は例えば、ガラス、酸化物、一窒化ケイ素(SiN)、ポリイミドまたは他の適当な疎水性絶縁材料を含む。誘電体層204の上面はシラン化されていてもよい。このシラン化は、誘電体層204の上面の上方に疎水層220を形成することができる。いくつかの実施形態では、疎水層220が約1.5ナノメートル(nm)の厚さを有する。
[0049]誘電体層204によって形成されたウェル205は、作用電極202の上方に電解液のボリューム206を含む。電解液のボリューム206は緩衝されていてもよく、以下のうちの1つまたは複数を含むことができる:塩化リチウム(LiCl)、塩化ナトリウム(NaCl)、塩化カリウム(KCl)、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム(CaCl)、塩化ストロンチウム(SrCl)、塩化マンガン(MnCl)、および塩化マグネシウム(MgCl)。いくつかの実施形態では、電解液のボリューム206が約3ミクロン(μm)の厚さを有する。
[0050]やはり図2に示されているように、誘電体層204の上に膜を形成することができ、膜は、ウェル205をまたぐことができる。いくつかの実施形態では、この膜が、疎水層220の上に形成された脂質単分子層218を含む。この膜がウェル205の開口に到達したときに、脂質単分子層218は、ウェル205の開口をまたぐ脂質2分子層214に移行することができる。この脂質2分子層は、リン脂質を含むことができ、またはリン脂質からなることができる。リン脂質は例えば、ジフィタノイル−ホスファチジルコリン(DPhPC)、1,2−ジフィタノイル−sn−グリセロ−3−ホスホコリン、1,2−ジ−O−フィタニル−sn−グリセロ−3−ホスホコリン(DoPhPC)、パルミトイル−オレオイル−ホスファチジルコリン(POPC)、ジオレイル−ホスファチジル−メチルエステル(DOPME)、ジパルミトイルホスファチジルコリン(DPPC)、ホスファチジルコリン、ホスファチジルエタノールアミン、ホスファチジルセリン、ホスファチジン酸、ホスファチジルイノシトール、ホスファチジルグリセロール、スフィンゴミエリン、1,2−ジ−O−フィタニル−sn−グルセロール、1,2−ジパルミトイル−sn−グリセロ−3−ホスホエタノールアミン−N−[メトキシ(ポリエチレングリコール)−350]、1,2−ジオレオイル−sn−グリセロ−3−ホスホエタノールアミン−N−ラクトシル、GMlガングリオシド、リゾホスファチジルコリン(LPC)、またはこれらの任意の組合せから選択される。
[0051]示されているように、脂質2分子層214には、単一のナノ細孔216、例えば単一のPNTMCによって形成された単一のナノ細孔216が埋め込まれている。上述のとおり、ナノ細孔216は、エレクトロポレーションによって脂質2分子層214に単一のPNTMCを挿入することによって形成することができる。ナノ細孔216は、脂質2分子層214の2つの面間で、関心の分析物の少なくとも一部分および/または小イオン(例えばNa、K、Ca2+、Cl)を通すのに十分な大きさを有することができる。
[0052]脂質2分子層214の上には試料チャンバ215があり、試料チャンバ215は、特性評価の対象の関心の分析物の溶液を保持することができる。この溶液は、バルク電解液208を含む水溶液であって、ナノ細孔216を開いたままにするために最適なイオン濃度に緩衝され、最適なpHに維持された水溶液とすることができる。ナノ細孔216は、脂質2分子層214を横切っており、バルク電解液208から作用電極202にイオンが流れるための唯一の経路を提供する。ナノ細孔(例えばPNTMC)および関心の分析物に加えて、バルク電解液208はさらに、以下のうちの1つまたは複数を含むことができる:塩化リチウム(LiCl)、塩化ナトリウム(NaCl)、塩化カリウム(KCl)、グルタミン酸リチウム、グルタミン酸ナトリウム、グルタミン酸カリウム、酢酸リチウム、酢酸ナトリウム、酢酸カリウム、塩化カルシウム(CaCl)、塩化ストロンチウム(SrCl)、塩化マンガン(MnCl)、および塩化マグネシウム(MgCl)。
[0053]対電極(CE)210は、電気化学ポテンシャルセンサとすることができる。いくつかの実施形態では、対電極210が複数のナノ細孔セル間で共用され、したがって共通電極と呼ばれる。いくつかのケースでは、この共通電位および共通電極が、全てのナノ細孔セルに対して、または少なくとも特定のグループ内の全てのナノ細孔セルに対して共通である。ナノ細孔216と接触したバルク電解液208に共通の電位を印加するように、この共通電極を構成することができる。対電極210および作用電極202を信号源228に結合して、脂質2分子層214を横切る電気的刺激(例えば電圧バイアス)を提供することができ、対電極210および作用電極202を使用して、脂質2分子層214の電気的特性(例えば抵抗、静電容量およびイオン電流)を感知することができる。いくつかの実施形態では、ナノ細孔セル200がさらに参照電極212を含むことができる。
[0054]いくつかの実施形態では、検証または品質管理の部分として、ナノ細孔セルの製作中にさまざまな検査が実施される。例えば所望のとおりの機能を有する(例えばそれぞれのセルに1つのナノ細孔がある)ナノ細孔セルを識別するため、ナノ細孔セルが製作された後に、さらなる検証ステップを実行することができる。このような検証検査は、物理的検査、電圧較正、開チャネル較正、および単一のナノ細孔を有するセルの識別を含むことができる。
B.合成によるナノ細孔ベースの配列決定
[0055]ナノ細孔センサチップ内のナノ細孔セルは、単一分子ナノ細孔ベースの配列決定を使用した、合成(Nano−SBS)技法による並列配列決定を可能にすることができる。
[0056]図3は、Nano−SBS技法を使用したヌクレオチド配列決定を実行しているナノ細孔セル300の一実施形態を示す。Nano−SBS技法では、ナノ細孔セル300の試料チャンバ内のバルク電解液308に、配列決定する対象の鋳型332(例えば核酸分子または別の関心の分析物)およびプライマーを導入することができる。例として、鋳型332は円形または線状とすることができる。鋳型332の一部分に核酸プライマーをハイブリダイズさせることができ、これに、異なるポリマータグが取り付けられた4つのヌクレオチド338を付加することができる。
[0057]いくつかの実施形態では、鋳型332に相補鎖を合成する際に使用するため、ナノ細孔316に、酵素(例えばDNAポリメラーゼなどのポリメラーゼ334)が結合される。例えば、共有結合によってナノ細孔316にポリメラーゼ334を取り付けることができる。ポリメラーゼ334は、一本鎖核酸分子を鋳型として使用したプライマー上へのヌクレオチド338の組込みを触媒することができる。ヌクレオチド338は、タグ種(「タグ」)を含むことができ、ヌクレオチドは、4つの異なるタイプA、T、GまたはCのうちの1つである。タグ付きヌクレオチドがポリメラーゼ334と正確に複合体を形成すると、脂質2分子層314および/またはナノ細孔316を横切って印加された電圧によって生成された電場の存在下で生成された力などの電気的な力によって、ナノ細孔にタグが引き込まれる(装填される(loaded))ことがある。ナノ細孔316の筒(barrel)の中にタグの尾部(tail)が置かれることがある。ナノ細孔316の筒の中に保持されたタグは、タグの明確に異なる化学構造および/またはサイズに起因する固有のイオン遮断信号340を生成することができ、それによって、タグが付着した付加された塩基を電子的に識別することができる。
[0058]本明細書で使用されるとき、「装填された」または「挿通された」タグは、評価可能な時間の間、例えば0.1ミリ秒(ms)から10000msの間、ナノ細孔の中に置かれたタグ、および/またはナノ細孔の中もしくはナノ細孔の付近に留まっているタグとすることができる。いくつかのケースでは、ヌクレオチドから解放される前にナノ細孔の中にタグが装填される。いくつかの場合には、装填されたタグが、ヌクレオチド組込み事象後に解放された後にナノ細孔を通過する(および/またはナノ細孔によって検出される)確率が都合よく高く、例えば90%から99%である。
[0059]いくつかの実施形態では、ナノ細孔316にポリメラーゼ334が接続される前のナノ細孔316のコンダクタンスが高く、例えば約300ピコシーメンス(300pS)などである。ナノ細孔の中にタグが装填されると、タグの明確に異なる化学構造および/またはサイズに起因する固有のコンダクタンス信号(例えば信号340)が生成される。ナノ細孔のコンダクタンスは例えば、約60pS、80pS、100pSまたは120pSとなりうる。これらの値はそれぞれ、タグ付きヌクレオチドの4つのタイプのうちの1つのタイプに対応する。ポリメラーゼは次いで、異性化およびトランスリン酸化反応を受けて、成長中の核酸分子にヌクレオチドを組み込み、タグ分子を解放することがある。
[0060]いくつかのケースでは、タグ付きヌクレオチドの一部が、(相補塩基を)核酸分子(鋳型)の現在の位置と整合させない。核酸分子と塩基対を形成していないタグ付きヌクレオチドもナノ細孔を通過することがある。対を形成していないこれらのヌクレオチドは、正しく対を形成したヌクレオチドがポリメラーゼに結合されたままでいる時間尺度よりも短い時間尺度のうちに、ポリメラーゼによって拒絶されうる。対を形成していないヌクレオチドに結合されたタグは、ナノ細孔を迅速に通過し、短時間のうちに(例えば10ms未満で)検出されることがあり、一方、対を形成したヌクレオチドに結合されたタグは、長時間(例えば少なくとも10ms)、ナノ細孔の中に装填され、検出されうる。したがって、対を形成していないヌクレオチドは、ナノ細孔内でヌクレオチドが検出される時間の長さに少なくとも部分的に基づいて、下流の処理装置によって識別することができる。
[0061]装填された(挿通された)タグを含むナノ細孔のコンダクタンス(またはこれと等価の抵抗)を、ナノ細孔を通過する電流を介して測定することができ、それによって現在の位置でのタグ種、したがってヌクレオチドの識別を提供することができる。いくつかの実施形態では、(例えばナノ細孔を通ってタグが移動する方向が逆にならないように)ナノ細孔セルに直流(DC)信号が印加される。しかしながら、直流を使用してナノ細孔センサを長時間操作すると、電極の組成が変化し、ナノ細孔の両側のイオン濃度が不均衡になり、ナノ細孔セルの寿命に影響を及ぼしうる他の望ましくない効果が生じうる。交流電流(AC)波形の印加は、エレクトロマイグレーションを低減して、これらの望ましくない効果を回避し、後述するある種の利点を提供することができる。タグ付きヌクレオチドを利用する本明細書に記載された核酸配列決定法は、印加AC電圧と完全に両立し、したがって、AC波形を使用してこれらの利点を達成することができる。
[0062]犠牲電極、通電反応(current−carrying reaction)において分子の性質を変化させる電極(例えば銀を含む電極)、または通電反応において分子の性質を変化させる電極が使用されるときには、AC検出サイクル中に電極を再充電することができると、有利となりうる。直流信号が使用されるときには検出サイクル中に電極が減損することがある。再充電は、電極が完全に減損するなど、電極が減損限界に達することを防ぐことができる。減損限界に達することは、電極が小さいとき(例えば1平方ミリメートルあたり少なくとも500個の電極を有する電極アレイを提供するのに十分な程度に電極が小さいとき)に問題となりうる。いくつかのケースでは、電極寿命が電極の幅に比例し、電極の幅に少なくとも部分的に依存する。
[0063]当技術分野では、ナノ細孔を通過するイオン電流を測定するのに適した条件が知られており、本明細書ではそれらの例を示す。この測定は、膜および細孔を横切って電圧を印加することによって実行することができる。いくつかの実施形態では、使用される電圧が−400mVから+400mVの範囲にある。使用される電圧は、−400mV、−300mV、−200mV、−150mV、−100mV、−50mV、−20mVおよび0mVから選択された下限と、下限とは独立に+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mVおよび+400mVから選択された上限とを有する範囲にあることが好ましい。使用される電圧が100mVから240mVの範囲にあるとより好ましいことがあり、160mVから240mVの範囲にあるとよりいっそう好ましいことがある。増大させた印加電位を使用することによって、ナノ細孔による異なるヌクレオチド間の識別を増強することが可能である。AC波形およびタグ付きヌクレオチドを使用した核酸の配列決定は、2013年11月6日に出願された「Nucleic Acid Sequencing Using Tags(タグを使用した核酸配列決定)」という名称の米国特許出願公開第2014/0134616号に記載されている。この文献は、その全体が参照によって本明細書に組み込まれている。米国特許出願公開第2014/0134616号に記載されたタグ付きヌクレオチドの他に、配列決定は、糖または非環式部分を欠くヌクレオチド類似体、例えばアデニン、シトシン、グアニン、ウラシルおよびチミンの5つの一般的な核酸塩基の(S)−グルセロールヌクレオシドトリホスファート(gNTP)を使用することによっても実行することができる(Horhota他、Organic Letters、8:5345〜5347[2006])。
[0064]それに加えてまたはその代わりに、いくつかの実施態様では、電流値などの他の信号値が測定され、その信号値が、ナノ細孔に挿通されたヌクレオチドを識別する目的に使用される。
[0065]図4は、事前装填されたタグを用いたヌクレオチド配列決定を実行しようとしているセルの一実施形態を示す。膜402の中にナノ細孔401が形成されている。酵素(例えばDNAポリメラーゼなどのポリメラーゼ403)がナノ細孔に結合されている。いくつかのケースでは、共有結合によってナノ細孔401にポリメラーゼ403が取り付けられている。ポリメラーゼ403は、配列決定する対象の核酸分子404に結合されている。いくつかの実施形態では核酸分子404が円形である。いくつかのケースでは核酸分子404が線状である。いくつかの実施形態では、核酸プライマー405を、核酸分子404の一部分とハイブリダイズさせる。ポリメラーゼ403は、一本鎖核酸分子404を鋳型として使用したプライマー405上へのヌクレオチド406の組込みを触媒する。ヌクレオチド406はタグ種(「タグ」)407を含む。
[0066]図5は、事前装填されたタグを用いた核酸配列決定のためのプロセス500の一実施形態を示す。ステージAは、図4で説明した構成要素を示す。ステージCは、ナノ細孔の中に装填されたタグを示す。「装填された」タグは、評価可能な時間の間、例えば0.1ミリ秒(ms)から10000msの間、ナノ細孔の中に置かれたタグ、および/またはナノ細孔の中もしくはナノ細孔の付近に留まっているタグとすることができる。いくつかのケースでは、ヌクレオチドから解放される前にナノ細孔の中に事前装填されたタグが装填される。いくつかの場合には、タグが、ヌクレオチド組込み事象後に解放された後にナノ細孔を通過する(および/またはナノ細孔よって検出される)確率が都合よく高く、例えば90%から99%である場合に、タグは、事前装填されている。
[0067]ステージAでは、タグ付きヌクレオチド(4つの異なるタイプ、すなわちA、T、GまたはCのうちの1つ)がポリメラーゼに結合されていない。ステージBでは、タグ付きヌクレオチドがポリメラーゼに結合されている。ステージCでは、ポリメラーゼがナノ細孔にドッキングされている。ドッキング中に、タグは、膜および/またはナノ細孔を横切って印加された電圧によって生成された電場の存在下で生成された力などの電気的な力によって、ナノ細孔に引き込まれる。
[0068]結合されたタグ付きヌクレオチドの一部は核酸分子と塩基対を形成していない。対を形成していないこれらのヌクレオチドは通常、正しく対を形成したヌクレオチドがポリメラーゼに結合されたままでいる時間尺度よりも短い時間尺度のうちに、ポリメラーゼによって拒絶される。対を形成していないヌクレオチドは、ポリメラーゼに一時的に結合されているだけであるため、図5に示されたプロセス500は通常、ステージDよりも先に進まない。例えば、対を形成していないヌクレオチドは、ステージBにおいてポリメラーゼによって拒絶されるか、またはプロセスがステージCに進んですぐにポリメラーゼによって拒絶される。
[0069]さまざまな実施形態において、ナノ細孔にポリメラーゼがドッキングされる前のナノ細孔のコンダクタンスは−300ピコシーメンス(300pS)でありうる。他の例として、ステージCでは、ナノ細孔のコンダクタンスが、約60pS、80pS、100pSまたは120pSとなりうる。これらの値はそれぞれ、タグ付きヌクレオチドの4つのタイプのうちの1つのタイプに対応する。ポリメラーゼは、異性化およびトランスリン酸化反応を受けて、成長中の核酸分子にヌクレオチドを組み込み、タグ分子を解放する。具体的には、ナノ細孔の中にタグが保持されているときには、タグの明確に異なる化学構造に起因する固有のコンダクタンス信号(例えば図3の信号310を参照されたい)が生成され、それによって付加された塩基が電子的に識別される。このサイクル(すなわちステージAからEまたはステージAからF)を繰り返すことによって、核酸分子の配列決定が可能になる。ステージDで、解放されたタグがナノ細孔を通過する。
[0070]いくつかのケースでは、図5のステージFに示されているように、成長中の核酸分子に組み込まれていないタグ付きヌクレオチドもナノ細孔を通過する。いくつかの場合には、組み込まれていないヌクレオチドがナノ細孔によって検出されうるが、この方法は、ナノ細孔内でヌクレオチドが検出される時間の長さに少なくとも部分的に基づいて、組み込まれたヌクレオチドと組み込まれていないヌクレオチドとを区別する手段を提供する。対を形成していないヌクレオチドに結合されたタグは、ナノ細孔を迅速に通過し、短時間のうちに(例えば10ms未満で)検出されるが、一方、組み込まれたヌクレオチドに結合されたタグは、長時間(例えば少なくとも10ms)、ナノ細孔の中に装填され、検出される。
[0071]ナノ細孔ベースの配列決定に関するさらなる詳細は例えば、「Nanopore−Based Sequencing With Varying Voltage Stimulus(変動する電圧刺激を用いたナノ細孔ベースの配列決定)」という名称の米国特許出願第14/577,511号、「Nanopore−Based Sequencing With Varying Voltage Stimulus(変動する電圧刺激を用いたナノ細孔ベースの配列決定)」という名称の米国特許出願第14/971,667号、「Non−Destructive Bilayer Monitoring Using Measurement Of Bilayer Response To Electrical Stimulus(電気的刺激に対する2分子層応答の測定を使用した非破壊2分子層監視)」という名称の米国特許出願第15/085,700号、および「Electrical Enhancement Of Bilayer Formation(2分子層形成の電気的強化)」という名称の米国特許出願第15/085,713号に出ている。
II.測定回路
[0072]図6Aは、脂質膜または脂質2分子層612を示し、脂質膜または脂質2分子層612は、セル作用電極614と対電極616との間に、脂質膜/2分子層612を横切って電圧が印加されるような態様で位置する。脂質2分子層は、脂質分子の2つの層でできた薄い膜である。脂質膜は、脂質分子数個分(3つ以上)の厚さを有する膜である。脂質膜/2分子層612はさらにバルク液体/電解液618と接触している。図1の作用電極、脂質2分子層および対電極と比べると、作用電極614、脂質膜/2分子層612および対電極616は上下が逆に描かれていることに留意されたい。いくつかの実施形態では、複数のセル間で対電極が共用されており、したがって対電極は共通電極とも呼ばれる。この共通電極を電圧源Vliq620に接続することにより、この共通電極を、測定セル内の脂質膜/2分子層と接触したバルク液体に共通の電位を印加するように構成することができる。この共通電位および共通電極は、全ての測定セルに対して共通である。それぞれの測定セル内にはセル作用電極があり、作用セル作用電極614は、共通電極とは対照的に、他の測定セル内のセル作用電極から独立して明確に異なる電位を印加するように構成可能である。
[0073]図6Bは、ナノ細孔ベースの配列決定チップのセル内にある、図6Aに示された回路600と同じ回路600を示す。図6Aと比べると、作用電極と対電極との間の脂質膜/2分子層を示す代わりに、作用電極および脂質膜/2分子層の電気的特性を表す電気的モデルが示されている。
[0074]図6Bは、ナノ細孔セル200などのナノ細孔セル内の電気的モデルを表す電気回路600(この回路は、図2の電気回路222の部分を含むことがある)を示す。上述のとおり、いくつかの実施形態では、電気回路600が、対電極640(例えば対電極210)を含み、この対電極は、複数のナノ細孔セル間でまたはナノ細孔センサチップ内の全てのナノ細孔セル間で共用されることがあり、したがって共通電極とも呼ばれることがある。電圧源Vliq620に接続することにより、この共通電極を、ナノ細孔セル内の脂質2分子層(例えば脂質2分子層214)と接触したバルク電解液(例えばバルク電解液208)に共通の電位を印加するように構成することができる。いくつかの実施形態では、AC信号(例えば方形波)によって電圧Vliqを変調し、その電圧を、ナノ細孔セル内の脂質2分子層と接触したバルク電解液に印加するために、AC非ファラデーモードが利用される。いくつかの実施形態では、Vliqが、±200〜250mVの大きさおよび例えば25から600Hzの間の周波数を有する方形波である。100μF以上などの大きなコンデンサ(図示せず)によって、対電極640と脂質2分子層の間のバルク電解液をモデル化することができる。
[0075]図6Bはさらに、作用電極602(例えば作用電極202)および脂質2分子層(例えば脂質2分子層214)の電気的特性を表す電気的モデル622を示す。電気的モデル622は、脂質2分子層に関連した静電容量をモデル化するコンデンサCbilayer626と、ナノ細孔に関連した可変抵抗をモデル化する抵抗器Rpore628とを含み、この可変抵抗は、ナノ細孔の中の特定のタグの存在に基づいて変化しうる。電気的モデル622はさらに、コンデンサCdbl624を含み、コンデンサCdbl624は、セルの作用電極602およびウェル(例えばウェル205)の電気的特性を表す2層静電容量cdblを有する。作用電極602は、他のナノ細孔セル内の作用電極から独立して明確に異なる電位を印加するように構成することができる。
[0076]パスデバイス(pass device)606を、脂質2分子層および作用電極を接続したり、または電気回路600から分離したりする目的に使用することができるスイッチとすることができる。メモリビットによってパスデバイス606を制御して、ナノ細孔セル内の脂質2分子層を横切って電圧刺激が印加されることを可能にし、または不能にすることができる。ナノ細孔セルのウェルが密閉されていないため、脂質を堆積させて脂質2分子層を形成する前の2つの電極間のインピーダンスは非常に低く、したがって、短絡条件を回避するためにパスデバイス606を開いたままに維持することができる。ナノ細孔セルに脂質溶媒を堆積させた後にパスデバイス606を閉じて、ナノ細孔セルのウェルを密閉することができる。
[0077]電気回路600はさらに、オンチップ積分コンデンサCint608(ncap)を含むことができる。リセット信号603を使用してスイッチ601を閉じて、積分コンデンサCint608が電圧源Vpre605に接続されるようにすることにより、積分コンデンサCint608を事前充電することができる。いくつかの実施形態では、電圧源Vpre605が、例えば900mVの大きさを有する正の定電圧を供給する。スイッチ601が閉じられると、積分コンデンサCint608を、電圧源Vpre605の正電圧レベルに事前充電することができる。
[0078]積分コンデンサCint608が事前充電された後、リセット信号603を使用してスイッチ601を開いて、積分コンデンサCint608が電圧源Vpre605から分離されるようにすることができる。この時点で、対電極640の電位は、電圧源Vliqのレベルに応じて、作用電極602(および積分コンデンサCint608)の電位よりも高いレベルにあること、または低いレベルにあることがある。例えば、電圧源Vliqからの方形波の位相が正(例えばAC電圧源信号サイクルの明期または暗期)である間、対電極640の電位は、作用電極602の電位よりも高いレベルにある。電圧源Vliqからの方形波の位相が負(例えばAC電圧源信号サイクルの暗期または明期)である間、対電極640の電位は、作用電極602の電位よりも低いレベルにある。したがって、いくつかの実施形態では、積分コンデンサCint608がさらに、明期の間は、電圧源Vpre605の事前充電された電圧レベルからより高いレベルに充電され、暗期の間は、対電極640と作用電極602の間の電位差によってより低いレベルに放電される。他の実施形態では、この充電および放電をそれぞれ暗期および明期に実行させることができる。
[0079]アナログ−ディジタル変換器(ADC)610のサンプリングレートに応じた固定された時間の間、積分コンデンサCint608を充電または放電することができる。このサンプリングレートは、1kHz超、5kHz超、10kHz超、100kHz超またはそれ以上とすることができる。例えば、1kHzのサンプリングレートでは、約1msの間、積分コンデンサCint608を充電/放電することができ、次いで、積分期間の終わりに、ADC610によって電圧レベルをサンプリングおよび変換することができる。ナノ細孔内の特定のタグ種には特定の電圧レベルが対応し、したがって、特定の電圧レベルは、鋳型上の現在の位置におけるヌクレオチドに対応するであろう。
[0080]ADC610によってサンプリングされた後、リセット信号603を使用してスイッチ601を閉じて、積分コンデンサCint608が再び電圧源Vpre605に接続されるようにすることにより、積分コンデンサCint608を再び事前充電することができる。積分コンデンサCint608を事前充電するステップ、積分コンデンサCint608が充電または放電するのを固定された時間の間待機するステップ、ならびにADC610によって積分コンデンサの電圧レベルをサンプリングおよび変換するステップを、配列決定プロセスの全体を通じて循環的に繰り返すことができる。
[0081]ディジタル処理装置630は、例えば正規化、データバッファリング、データフィルタリング、データ圧縮、データ削減、事象抽出のため、またはナノ細孔セルのアレイからのADC出力データを集めてさまざまなデータフレームにするために、ADC出力データを処理することができる。いくつかの実施形態では、ディジタル処理装置630が、塩基決定などのさらなる下流処理を実行することができる。ディジタル処理装置630は、ハードウェア(例えばGPU、FPGA、ASICなど)として、またはハードウェアとソフトウェアの組合せとして実装することができる。
[0082]したがって、ナノ細孔を横切って印加された電圧信号を使用して、ナノ細孔の特定の状態を検出することができる。ナノ細孔の可能な状態の1つが開チャネル状態であり、開チャネル状態は、タグが取り付けられたポリホスファートがナノ細孔の筒の中にないときである。ナノ細孔の別の4つの可能な状態はそれぞれ、タグが取り付けられたポリホスファートヌクレオチドの4つの異なるタイプ(A、T、GまたはC)のうちの1つのタイプがナノ細孔の筒の中に保持された状態に対応する。ナノ細孔の別の可能な状態は、脂質2分子層が破れた状態である。
[0083]固定された時間の後に積分コンデンサCint608上の電圧レベルを測定すると、ナノ細孔の状態が異なる結果として、異なる電圧レベルが測定されることがある。これは、積分コンデンサCint608上の電圧減衰(放電による低下または充電による増大)率(すなわち時間プロットに対する積分コンデンサCint608上の電圧の勾配の大きさ)が、ナノ細孔抵抗(例えば抵抗器Rpore628の抵抗)に依存するためである。より具体的には、分子(タグ)の化学構造が明確に異なることにより、異なる状態にあるナノ細孔に関連した抵抗は異なるため、対応する異なる電圧減衰率が観察されることがあり、この異なる電圧減衰率を使用して、ナノ細孔の異なる状態を識別することができる。電圧減衰曲線は、RC時定数τ=RCの指数曲線であることがある。ここで、Rは、ナノ細孔(すなわちRpore628)に関連した抵抗であり、Cは、膜(すなわちコンデンサCbilayer626)に関連したRと並列の静電容量である。ナノ細孔セルの時定数は例えば200〜500msである。減衰曲線は、2分子層の詳細な実施態様により指数曲線に正確には当てはまらないことがあるが、減衰曲線は指数曲線と似ており、単調曲線であり、したがってタグの検出を可能にする。
[0084]いくつかの実施形態では、開チャネル状態にあるナノ細孔に関連した抵抗が100Mオームから20Gオームの範囲にある。いくつかの実施形態では、ナノ細孔の筒の内側にタグがある状態のナノ細孔に関連した抵抗が200Mオームから40Gオームの範囲にある。他の実施形態では、積分コンデンサCint608が省かれている。これは、電気的モデル622内の電圧減衰のため、そのようにしてもADC610に達する電圧が変動するためである。
[0085]積分コンデンサCint608上の電圧の減衰率は、異なる手法で決定することができる上で説明したとおり、電圧減衰率は、固定された時間間隔の間の電圧減衰を測定することによって決定することができる。例えば、最初に、時刻t1に、積分コンデンサCint608上の電圧をADC610によって測定し、次いで、時刻t2に、この電圧をADC610によって再び測定する。積分コンデンサCint608上の電圧の時間に対する曲線の勾配が大きいときには電圧差が大きく、電圧曲線の勾配が小さいときには電圧差が小さい。したがって、この電圧差を、積分コンデンサCint608上の電圧の減衰率を決定するための測定基準、したがってナノ細孔セルの状態を決定するための測定基準として使用することができる。
[0086]他の実施形態では、選択された量の電圧減衰に必要な所要時間を測定することによって、電圧減衰率を決定することができる。例えば、第1の電圧レベルV1から第2の電圧レベルV2まで電圧が降下または増大するのに必要な時間を測定することができる。時間に対する電圧の曲線の勾配が大きいときにはこの必要な時間が短く、時間に対する電圧の曲線の勾配が小さいときには必要な時間が長い。したがって、測定された必要な時間を、積分コンデンサCint608上の電圧Vncapの減衰率を決定するための測定基準、したがってナノ細孔セルの状態を決定するための測定基準として使用することができる。例えば電流測定技法を含め、当業者は、ナノ細孔の抵抗を測定する目的に使用することができるさまざまな回路を理解するであろう。
[0087]いくつかの実施形態では、電気回路600が、オンチップで製作されたパスデバイス(例えばパスデバイス606)および追加のコンデンサ(例えば積分コンデンサCint608)を含まず、それによってナノ細孔ベースの配列決定チップのサイズの低減が容易になる。膜(脂質2分子層)の薄い性質のため、追加のオンチップ静電容量を必要とすることなく必要なRC時定数を生み出す目的には、膜に関連した静電容量(例えばコンデンサCbilayer626)だけで十分でありうる。したがって、コンデンサCbilayer626を積分コンデンサとして使用することができ、電圧信号VpreによってコンデンサCbilayer626を事前充電することができ、続いて電圧信号Vliqによって放電または充電することができる。他の場合には電気回路内にオンチップで製造される追加のコンデンサおよびパスデバイスを排除することによって、ナノ細孔配列決定チップ内の単一のナノ細孔セルの占有面積をかなり低減させることができ、それによって、ますます多くのセルを含める(例えばナノ細孔配列決定チップに数百万個のセルを含める)ためのナノ細孔配列決定チップのスケーリングを容易にすることができる。
[0088]図7は、ACサイクルの明期および暗期中にナノ細孔セルから捕捉された例示的なデータ点を示す。図7では、図解の目的上、データ点の変化が誇張されている。作用電極または積分コンデンサに印加される電圧(VPRE)は、例えば900mVなど一定のレベルにある。ナノ細孔セルの対電極に印加される電圧信号510(VLIQ)は、方形波として示されるAC信号であり、デューティサイクルは、50%以下、例えば約40%など、適当な任意の値とすることができる。
[0089]明期720の間は、電圧源Vliq620によって対電極に印加される電圧信号が、作用電極に印加される電圧VPREよりも低く、その結果、作用電極と対電極に印加される電圧レベルが異なることによって(例えばタグ上の電荷および/またはイオンの流れにより)生じる電場により、ナノ細孔の筒の中にタグが押し込まれることがある。スイッチ601が開いているとき、ADCの前のノードの電圧(例えば積分コンデンサにおける電圧)は低下する。電圧データ点が捕捉された後(例えば指定された期間の後)、スイッチ601を閉じることができ、そうすると、測定ノードにおける電圧は再びVPREまで増大するであろう。このプロセスを繰り返して、多数の電圧データ点を測定することができる。このようにすると、明期の間に多数のデータ点を捕捉することができる。
[0090]図7に示されているように、VLIQ信号の符号が変化した後の明期における第1のデータ点722は、後続のデータ点724よりも低いことがある。これは、ナノ細孔の中にタグがなく(開チャネルであり)、したがってナノ細孔が低い抵抗および高い放電率を有するためであることがある。いくつかの場合には、図7に示されているように、第1のデータ点722がVLIQレベルを超える。このことは、この信号をオンチップコンデンサに結合する2分子層の静電容量によって引き起こされることがある。データ点724は、挿通事象が起こった後に、すなわちナノ細孔の筒の中にタグが押し込まれた後に捕捉されたものである可能性がある。ここで、ナノ細孔の抵抗、したがって積分コンデンサの放電率は、ナノ細孔の筒の中に押し込まれたタグの具体的なタイプに依存する。後述するように、Cdbl624に蓄積された電荷のため、データ点724は、測定のたびにわずかに低下することがある。
[0091]暗期730の間は、対電極に印加される電圧信号710(VLIQ)が、作用電極に印加される電圧(VPRE)よりも高く、その結果、タグはいずれもナノ細孔の筒から押し出されるであろう。電圧信号710(VLIQ)の電圧レベルの方がVPREよりも高いため、スイッチ601が開いているとき、測定ノードにおける電圧は増大する。電圧データ点が捕捉された後(例えば指定された期間の後)、スイッチ601を閉じることができ、そうすると、測定ノードにおける電圧は再びVPREまで低下するであろう。このプロセスを繰り返して、多数の電圧データ点を測定することができる。このようにして、暗期の間に、ファーストポイントデルタ732および後続のデータ点734を含む多数のデータ点を捕捉することができる。上述のとおり、暗期の間、ヌクレオチドタグはいずれもナノ細孔から押し出され、したがって、どのヌクレオチドタグについても、正規化で使用するものを除けば最小限の情報しか得られない。
[0092]図7はさらに、明期740の間は、対電極に印加される電圧信号710(VLIQ)が、作用電極に印加される電圧(VPRE)よりも低いが、挿通事象は起こらない(開チャネルである)ことを示している。したがって、ナノ細孔の抵抗は低く、積分コンデンサの放電率は高い。その結果として、第1のデータ点742および後続のデータ点744を含む捕捉されたデータ点は、低い電圧レベルを示す。
[0093]明期または暗期中に測定される電圧は、(例えば所与のACサイクルの明モード(bright mode)中にナノ細孔の中に1つのタグがある間に実施された)ナノ細孔の抵抗が一定であるときのそれぞれの測定でほぼ同じであることが予想されるであろうが、2重層コンデンサCdbi624において電荷が蓄積するときには、そうはならないことがある。この電荷蓄積によって、ナノ細孔セルの時定数はより長くなりうる。その結果として、電圧レベルが移動することがあり、それによって、1つのサイクルのそれぞれのデータ点に関して測定値が低下することがある。したがって、1つのサイクル内では、図7に示されているように、データ点が、1つのデータ点と別のデータ点とでいくぶん変化することがある。
III.セルの形成および較正
[0094]図8は、ある種の実施形態に基づく、ナノ細孔配列決定セルを形成および較正する例示的な方法を示す流れ図である。較正の一部として、配列決定セルの製作中にさまざまな検査を実施することができる。例えば所望のとおりの機能を有する(例えばそのセルに1つのナノ細孔がある)配列決定セルを識別するため、セルが製作された後に、さらなる較正ステップを実行することができる。これらの較正ステップが完了した後、正規化および配列決定を実行することができる。
[0095]ステップ810で、セルの回路の物理的検査を実行する。緩衝溶液または脂質溶液が加えられる前に、いくつかの「乾式検査」を実行することができ、緩衝溶液または脂質溶液が加えられた後に、いくつかの「湿式検査」を実行することができる。例えば、配列決定チップのそれぞれのセルを、開路(すなわち開放状態)または短絡(すなわち短絡状態)に関して検査することができる。ある種の実施形態に基づく物理的検査のさらなる説明については、このセクションの後続のサブセクションAを参照すれば出ている。
[0096]ステップ820で、それぞれのセルの上に脂質層を形成する。ある種の実施形態によれば、この形成プロセスの間、脂質層の厚さが監視され、脂質層の最終的な状態が脂質2分子層のそれであることを保証するために、さまざまなフィードバックプロセスが機能する。例えば、セルに脂質溶液を適用する第1の反復の後に、脂質層が厚すぎ、2分子層ではないと判定された場合には、薄化手順を開始することができる。ある種の実施形態に基づく脂質2分子層に関連した物理的検査のさらなる説明については、このセクションの後続のサブセクションAを参照すれば出ている。
[0097]ステップ830で、配列決定チップのそれぞれのセルに対してゼロ点電圧較正を実行する。それぞれのセルの電子的特性は異なるため、それぞれのセルは、セルにゼロボルトが印加されたときに異なるDCオフセットを有しうる。本明細書ではこのDCオフセットを「ゼロ点」電圧と呼び、あるいはVMzeroと称する。例えば、チップ内の異なるセルのアナログ回路間には、製造不完全部または製造変動が存在しうる。したがって、1つのセルのADCは、別のセルのADCとは異なる電圧バイアスを有することができる。実施形態は、このような変動を考慮するために較正を実行することができる。ある種の実施形態に基づくゼロ点電圧較正のさらなる説明については、このセクションの後続のサブセクションBを参照すれば出ている。
[0098]ステップ840で、それぞれのセルにナノ細孔を追加し、セルの特性を評価して、1つのセルにいくつのナノ細孔が追加されたのかを判定する。このステップにおいて、セルに追加されたナノ細孔の数が多すぎたり(2つ以上)または少なすぎたり(ゼロ)した場合には、ナノ細孔を追加したりまたはセルからナノ細孔を除去したりするために、フィードバックプロセスを開始することができる。ある種の実施形態によれば、2つ以上または1つ未満のナノ細孔を有することが判明したセルは非活性化し、それらのセルは、配列決定プロセスの間、使用しない。ある種の実施形態に基づくナノ細孔特性評価のさらなる説明は、このセクションの後続のサブセクションCおよびEを参照すれば出ている。
[0099]ステップ850で、配列決定操作を実行し、それにより、例えば図3〜7を参照して上で説明したようにしてセルからの出力信号を生成する。例えば、ナノ細孔の筒の中にタグの尾部を置き、それによってタグの明確に異なる化学構造および/またはサイズに起因する固有の出力信号を生成する。ある種の実施形態によれば、ナノ細孔を通過する電流を介して出力信号を測定し、それによって、核酸の現在の位置におけるタグ種、したがってヌクレオチドの識別を提供する。いくつかの実施形態では、積分コンデンサ、例えば図6A〜7を参照して上で説明した積分コンデンサを使用して、電流または電圧を測定することができる。ある種の実施形態に基づく配列決定操作のさらなる説明については、後続のセクションIVを参照すれば出ている。
[0100]ステップ860で、出力信号(例えば電圧および/または電流信号)を正規化する。この正規化プロセスの一部は、明モード開チャネル電圧を(そのセルのアナログ回路モデルを使用することによって)測定および/または推測すること、ならびにその明モード開チャネル電圧を、出力信号に対する正規化係数として使用することを含むことができる。ある種の実施形態に基づく正規化プロセスのさらなる説明については、後続のサブセクションDを参照すれば出ている。ある種の実施形態によれば、この正規化方法が、図6を参照して上で説明したディジタル処理装置によって実行される。
[0101]ステップ870で、1つまたは複数の処理装置が、正規化された出力信号を使用して塩基を決定することができる。後のセクションIVで説明するが、実施形態は、挿通チャネルに対する電圧のクラスタ(cluster)を決定し、それらのクラスタを使用して、正規化された出力信号を使用して異なる塩基を区別するためのカットオフ電圧を決定することができる。
[0102]ある種の実施形態によれば、較正検査および正規化検査の順序が、図8の流れ図に示された順序とは異なる。例えば、ある種の実施形態によれば、例えば初期の製造加工ステップが完了した後に(例えば脂質2分子層の形成前、脂質2分子層の形成後、ナノ細孔の形成前、ナノ細孔の形成後などに)、較正/正規化ステップが、1回実行される。ある種の実施形態によれば、チップの寿命の全体にわたって、較正が、(例えば予定された間隔でおよび/またはあらゆる配列決定操作の前に)何度も実行される。ある種の実施形態によれば、較正および正規化が、「オンライン」で、すなわち、それぞれの未処理データ点が取得されるたびに、または一群の未処理データ点が取得されるたびに実行される。
[0103]ここでは配列決定、較正および正規化が別個のステップとして示されているが、これらのステップは、配列決定操作の一部として一緒に実行することができる。すなわち、本開示の範囲から逸脱することなく、配列決定中に取得されたそれぞれの点または点のグループを較正/正規化ステップにかけることができる。例えば、配列決定の開始前および/または開始後に、配列決定チップの較正を較正することができる。この較正は、決定的な誤りが存在しないことを保証するために実行することができる。このような決定的な誤りは、1つまたは複数のセルで配列決定が実行されることを妨げることがありうる。較正を使用してさらに、最終的に核酸の配列を決定するために使用することができる補正または正規化された電圧値を取得するために、値(例えば電圧または電流)を測定する際または測定値を分析する際に使用される較正値を取得する(例えばゼロ点電圧を決定する)ことができる。
A.物理的検査
[0104]乾式検査は、配列決定チップ内に緩衝液(例えば電解質溶液)が流される前、およびウェルの上に膜(例えば脂質2分子層)が形成される前に実行することができる。乾式検査では、配列決定チップの(例えばそれぞれの配列決定セルの)電気構成要素を検査して、それらの構成要素が適正に機能していること、例えば(例えば特定の範囲内の)予想される値を有する信号がそれぞれのウェルから受け取られることを確認する。この時点ではウェル内または試料チャンバ内に電解質溶液がないため、電極間(例えば電極202と210の間)には接続がないはずである。したがって、「開」状態が予想されるであろう。接続(すなわち短絡状態)が存在する場合には、測定される電圧が予想される範囲の外にあることになり(例えば電圧測定値が基準電圧と同じであり)、それによってセルに何か誤りがあることが示される。いくつかの実施形態では、乾式検査が、ウィグルポイントデルタ(WPD)またはステップポイントデルタ(SPD)を使用して実行される。上で定義したとおり、ステップポイントデルタ(SPD)は、明期の最後のデータ点と次の暗期の最初のデータ点との差(すなわちSPDpos/neg)、または暗期の最後のデータ点と次の明期の最初のデータ点との差(SPDneg/pos)とすることができる。ウィグルポイントデルタ(WPD)は、ウィグル波形が印加されたときの明期の最後のデータ点と次の暗期の最初のデータ点との差とすることができる。したがって、しきい値よりも大きなWPDまたはSPDは、セルが短絡状態にあることを示していることがある。その場合、2つの電極間に電解質溶液がない場合でも、それらの2つの電極が電気的に接続されており、したがって、セルの一部の電気構成要素に欠陥(例えば短絡)がある可能性がある。いくつかの実施形態では、乾式検査に、ファーストポイントデルタ(FPD)またはラストポイントデルタ(LPD)などの他のパラメータが使用される。
[0105]湿式検査では、チップの表面に緩衝液が流される。この検査は、緩衝液を介して電極間に接続(例えば短絡)があることを確認することができる。開放状態(すなわち電極間に接続がない状態)は、対応するセルがなんらかの欠陥を有する可能性があることを示していることがある。いくつかの実施形態では、乾式検査の場合と同様に、湿式検査が、ウィグルポイントデルタ(WPD)またはステップポイントデルタ(SPD)を使用して実行される。例えば、しきい値よりも小さなWPDまたはSPDは、セルが開放状態にあることを示していることがある。その場合、2つの電極間に電解質溶液が加えられている場合でも、それらの2つの電極が電気的に分離されており、したがって、セルの一部の電気構成要素に欠陥(例えば開路)がある可能性がある。いくつかの実施形態では、乾式検査に、ファーストポイントデルタ(FPD)またはラストポイントデルタ(LPD)などの他のパラメータが使用される。
[0106]脂質(カバー)層検査では、チップの上に溶液を流すことができる。この溶液は、その中に脂質が溶け込んだ有機溶媒とすることができる。このプロセスの終わりには、それぞれのウェルが、溶媒および脂質の栓を有しているはずである。この脂質層は、溶液中のイオンの流れを遮断するような非常に厚いものであると考えられるため、この時点では電極間に電気的接続は存在しない(または最小限にしか存在しない)はずである。
[0107]セルが当初、比較的に厚い脂質層を有することがあり、この厚い脂質層を薄くして脂質2分子層を形成する。薄化手順では、厚すぎる脂質層を有するセルを決定するためにADC値をセルごとに測定することができ、2分子層を薄くすることができる。米国特許出願第15/085,713号は、脂質層を薄くするための電気的な脂質薄化刺激を記載している。
[0108]薄化後、ウェルを覆う膜の働きをする、分子2つ分の厚さを有する脂質2分子層が存在しうる。実際には、任意の透水性膜を使用することができる。脂質2分子層の縁には、溶媒の固定リングである環(annulus)がある。この環は、2分子層に対する脂質のリザーバの働きをすることができる。
[0109]脂質層の厚さは、ファーストポイントデルタ(FPD)を使用して測定することができる。FPDは、サイクルの明期の最初の測定電圧レベルとそのサイクルの暗期の最初の測定電圧レベルとの差に対応する。FPDは例えば、図7に示された最初の高い点間の差である。ファーストポイントデルタは2分子層の静電容量に比例し、2分子層の厚さは静電容量に比例する。脂質層が厚い(例えば数ミクロンである)とき、静電容量は小さい。この厚さが約4nmまで縮減するまでに、静電容量は、例えば100フェムトファラド程度の測定可能なものになる。2分子層は、使用される分子に基づく決定論的な厚さを有し、2分子層の分子がどのように配列されているのか、およびどのくらいの溶媒が残っているのかに基づいて厚さに多少の違いが生じる。ある種の実施形態によれば、脂質2分子層の厚さは4.2から4.3nmである。2分子層(または他の膜)の静電容量は横方向の面積に比例し、横方向の面積は、どのくらいの環が存在するのかに依存する。したがって、FPDは、2分子層が存在するかどうか、および縁のどのくらい近くに2分子層が形成されているのかを提供することができる。いくつかの実施形態では、脂質(カバー)層検査を実行するために、WPDなどの他のパラメータが、測定されたデータ点から決定される。
[0110]いくつかの実施形態では、システム内のフィードバック機構を使用して、脂質層をさらに薄くすることができる。脂質層を薄くするために、横方向の圧力を加える(例えば脂質層の頂面を横切って緩衝液を高速で流す)ことができる。別の例として、AC信号をオンにして、脂質層を効果的に往復振動させることができるACバイアスを、2分子層のエネルギー的に安定した状態が達成されるまで印加することができる。このような手順は、脂質2分子層の形成プロセスにおける極小部を取り除くことができる。
[0111]このフィードバックは、FPDを経時的に測定し、フィードバックを調整することにより機能することができる。十分に小さい(例えばしきい値よりも小さい)FPDを有するセルは、その特定のセルを薄くするために実行される処置を有しうる。このようなプロセスを、少なくとも指定された百分率(例えば70%)のセルが使用可能な2分子層を有するまで続けることができる。いくつかの実施形態では、フィードバックを提供するために、WPDが、測定されたデータ点から決定される。
B.電圧較正
[0112]異なる電圧に対してシステムを較正するため、それぞれのセルのゼロ点電圧(本明細書ではVMzeroとも称する)を決定することができる。電子工学的な理由から、それぞれのセルは異なるDCオフセットを有することがある。例えば、チップ内の異なるセルのアナログ回路間には、製造不完全部または製造変動が存在しうる。さらに、電気化学的理由から、システム内にバイアスが構築されることがある。このような製造可変性のため、1つの電極は、別の電極とはわずかに異なることがある。このことはセル間にオフセットを導入しうる。加えて、電極の表面化学によって電極が電池として機能することがあり、したがって、それぞれのセルがわずかに異なる電位を有することがある。このことは、それぞれのセルのVMzeroに寄与しうる。ある種の実施形態によれば、正味の効果が、VMzeroの値によって、測定されるADC信号が押し上げられたりまたは押し下げられたりすることである。実施形態は、セル間のこのような変動を考慮するために較正を実行することができる。
[0113]図9は、ある種の実施形態に基づく、配列決定チップのナノ細孔配列決定セルの較正の例示的な方法900を示す流れ図である。方法900は、さまざまな時点において、例えば膜が形成される前、膜が形成された後(ただし細孔が挿入される前)、および/またはセルに細孔が挿入された後に実行することができる。この較正は、較正プロセスにおいて多数回、実行することができ、VMzeroに対して異なる値が取得され、所与のステージに対して使用される。
[0114]ステップ910で、配列決定チップのそれぞれのセルのゼロ点電圧(本明細書ではVMzeroとも称する)を取得する。いくつかの実施形態では、セルにゼロ電圧を印加して(例えば電流の経路をなくして)、VMZeroをADCによって測定する。このようなゼロ印加電圧の状態は、さまざまな手法で、例えば作用電極および/もしくは対電極の接続を解除することによって、または両方の電極を同じ電圧に置くことによって達成することができる。このようにすると、それぞれのADCが異なる浮動電圧を受け取ることができる。さらに、アナログ値からディジタル値への変換はADCによって異なりうる。ある種の実施形態によれば、セルごとに1つずつ測定された一組のVMzeroをメモリに記憶することができる。記憶されたそれらの値を使用して、それぞれのセルを較正する(すなわちそれぞれのセルからオフセットを除去する)ことができ、それによって、明期電圧および/または暗期電圧の両方の電圧のADC測定値がセル間で比較可能であることを保証することができる。上述のとおり、それぞれのセルのゼロ点電圧は、ADC、例えば図6に示されたADC610によって測定することができる。
[0115]配列決定チップは、数千または数百万のセルを含むことがあり、したがって数千または数百万のゼロ点電圧を測定することも起こりうる。ある種の実施形態によれば、ゼロ点電圧は、それぞれのセルの脂質2分子層にナノ細孔が挿入される前に測定し、メモリに記憶する。いくつかの実施形態では、メモリが、配列決定チップ上に一体化されており、または、図13を参照して後に説明するように、例えば任意の形態のコンピュータメモリなど、配列決定チップに動作可能に接続された外部メモリ記憶装置である。その代わりにまたはそれに加えて、それぞれのセルの脂質2分子層にナノ細孔が挿入された後にゼロ点電圧を測定することもできる。他の例として、ゼロ点電圧を、特性評価ステップもしくは較正ステップの一部としてそれぞれのセルについて1回測定することもでき、またはチップの寿命の全体にわたって多数回測定することもできる。例えば、VMzeroは、2重層コンデンサの静電容量が変化するにつれて経時的に変化することがあり、したがって、システムが適正に較正されていることを保証するために、配列決定実行の前および/または後にVMzeroを測定することができる。
[0116]ステップ920で、脂質2分子層にナノ細孔が挿入された後に、配列決定操作を実行し、複数の測定電圧を(例えば配列決定チップのADCによって)取得することができる。配列決定は、チップのそれぞれのセルを横切る交番信号の印加中に実行することができる。電圧データをこのように取得するプロセスについては、図3〜5を参照して上で説明した。
[0117]ステップ930で、取得した電圧値を、記憶されたVMzero値を使用して補正する。例えば、ある種の実施形態によれば、セルの測定値とそのセルのVMzero値との差を、例えば図4のディジタル処理装置430によって計算することができる。より詳細には、それぞれのセルについて、そのセルのVMzeroを測定された電圧値から減じることによって、補正または較正された一組の電圧値を取得することができる。
[0118]したがって、それぞれのセルについて、ゼロ点電圧値を(例えばVMzeroとして)決定し、それを使用して、ADCのダイナミックレンジを最適化することができる。例えば、ADCは、指定されたデータ範囲、例えば8ビットの符号なし範囲(0から255)を提供することができる。これらのディジタル値間の差は、ADCの製造によって制御されるが、(例えばADC基準電圧によって制御される)特定のアナログ範囲を、配列決定セルのアナログ電圧の予想される範囲に対応するように変化させて、セル固有のVMzeroを考慮することができる。使用される電圧は相対的な電圧であるため、ADCのゼロ値がゼロボルトに一致している必要はない。
[0119]一実施形態では、ADC電圧範囲の下限および上限を設定する2つの基準電圧が存在する。これらの2つの電圧は、符号が異なる電圧とすることができる。これらの基準電圧は外部から設定することができる。異なる生化学物質が使用されるときには、これらの基準電圧を変更することができる。実際の信号はこの基準範囲内にあるべきであり、理想的にはこの基準範囲の大部分を占めるべきである。ある種の実施形態によれば、それぞれのセルの測定されたVMzeroについての知識を使用して、それぞれのセルの基準電圧を独立して設定する。このことは、ADCの完全なダイナミックレンジが使用されていることを保証することができ、それによって量子化ノイズを最小化することができる。
[0120]図6のスイッチ601によって回路600に注入される電荷の結果として、オフセットも生じうる。スイッチ601は、ADCを使用して新たな測定値を得るために積分コンデンサCint608上の電圧をリセットする目的に使用される。スイッチが閉じるたびに、ある量の電荷がそのセルの回路に注入される。この電荷注入に関しては、ソースからドレインにある数の電子が移動し、それによってある量の電荷がシステムに投入される。この電荷は、複数のコンデンサに分配され、これによってオフセットが生じる。このオフセットが一定であれば許容されるであろうが、このオフセットは一定ではない。
[0121]このような電荷注入オフセットが変動しうる理由の例を以下に示す。時間の経過とともに、2分子層の表面積は、(例えば縁の環が縮んだり、広がったりすることによって)より大きな2分子層になったり、またはより小さな2分子層になったりしうる。この変化によって、積分静電容量(例えば608)の静電容量に対する2分子層の静電容量の比は変化しうる。この比は、回路の時定数、したがってADCによって測定することができる特定の時間後の測定電圧に影響を及ぼす。この比が1回だけ決定される場合、この比の値は古いもの、したがって不正確なものとなりうる。実施形態は、この電荷注入オフセットを補償するために、電荷注入の大きさ、2分子層の静電容量、および静電容量がどのように変化しているのかを使用して、正規化を決定することができる。
[0122]図6を例として使用する。スイッチ601はシステムの電圧をリセットし、その後、スイッチ601が開かれた後の指定された時刻にADC値が測定される。このリセットおよび測定が繰り返される。このスイッチは理想的なものではないため、スイッチ601が閉じるたびに、いくらかの電荷が回路に注入される。Cbilayer626上に電荷が蓄積し、それにより、Cbilayer上に電荷が蓄積するにつれてベースライン電圧が変化する。
[0123]電荷が注入されると、電荷は回路内に分配される。主たる位置は、Cbilayer626および積分コンデンサCint608である。これらの2つのコンデンサ間の電荷の比は2分子層のサイズに依存する。積分コンデンサCint608上の電圧が変化するため、特定のセルのオフセットは時間の経過とともに変化する。この比が同じで変わらない場合には、時間が経過してもこの比は同じであり続けるため、この比が、測定されるオフセットを変化させることはないであろう。しかしながら、Cbilayer626は変化するため、Cbilayer626および積分コンデンサCint608に異なる量の電荷が注入され、それによってオフセットは変化する。半導体コンデンサでは通常そうであるように、時間が経過しても静電容量が変化しない場合にはこのような問題は存在しないであろうが、コンデンサの働きをする生化学的素子では、このことは当てはまらない。
[0124]解決策として、Cbilayer626を経時的に測定することができる。積分コンデンサCint608は半導体素子とすることができるため、積分コンデンサCint608の静電容量は通常、時間が経過しても変化しないであろう。配列決定の実行の始めにこの電荷を定量化することができる。この電荷はセルごとに異なることがある。この電荷は、較正の一部として、例えばVMzero決定の一部として決定することができる。Cbilayer626は、ファーストポイントデルタを使用して測定することができる。ファーストポイントデルタは、明モードと暗モード(dark mode)とに関して、極性、例えば方形波の極性のサイクル切り換わりの後に測定された最初の電圧の差である。ファーストポイントデルタ(FPD)とCbilayer626の間には関係がある。そのような関係はセル間で一定でありうる。
[0125]したがって、FPDの変化を使用して、VMzeroのオフセットの変化を決定することができる。この関係は、始めのサイクルについて測定された、システムに注入された電荷の量、そのセルの積分コンデンサCint608の値、Cbilayer626の初期測定値、および始めのサイクルのFPDの変化に基づく。
[0126]いくつかの実施形態では、次の技法を使用して、電荷注入の結果としてのVMzeroに対する変化を決定することができる。電荷q=C×Vであり、qは電荷、Cは静電容量、Vは電圧である。C=Cbilayer626+Cncap(積分コンデンサCint608)である。V=q/(Cbilayer+Cncap)であり、2分子層コンデンサが変化することによる電圧の変化は、dV=q(1/(Cbl_new+Cncap)−1/(Cbl_old+Cncap))である。この電圧の変化を使用して、他の正規化の前にADC値を、例えばゲインドリフト(gain drift)またはベースラインシフト(baseline shift)を補償するように修正することができる。
C.ナノ細孔の挿入
[0127]ナノ細孔は、いくつかの異なる手法で脂質2分子層に挿入することができる。例えば、チップ内の圧力に依存して膜の中に細孔をランダムに拡散させる場合、その割合は二項分布によって支配されるであろう。そのような状況では、多くのセルがナノ細孔を持たず、一部のセルが1つのナノ細孔を有し、一部のセルが2つのナノ細孔を有し、大多数のセルが1以外の数のナノ細孔を有するであろう。しかしながら、ある種の実施形態によれば、配列決定のためにはそれぞれのセルが1つのナノ細孔だけを有することが最も有利である。それぞれのセルが1つよりも多くのナノ細孔、例えば2つのナノ細孔を有する場合、その細孔からの信号は、2つの細孔からの2つの信号のある組合せとなり、それによって信号レベルは誤差を有しうる。そのため、システムは、単一細孔セルとは異なる等価回路を有する。さらに、組み合わされた信号は、異なる時刻にナノ細孔に入ったタグに由来するものとなり、このことは、所与の時刻にどの塩基であると宣言すべきかを知ることを難しくする。
[0128]ある種の実施形態によれば、エレクトロポレーションを使用して2分子層にナノ細孔を挿入することができる。エレクトロポレーションは、2分子層を横切って方形波を印加して2分子層に応力を加える。電圧が高すぎると脂質層は破裂するであろう。しかしながら、適当な電圧は、ナノ細孔をより容易に挿入しうる裂け目を提供することができる。
[0129]上で述べたとおり、それぞれのセルが正確に1つのナノ細孔を有することは有益である。これを達成するため、ある種の実施形態によれば、エレクトロポレーション信号が印加される前、印加されている間および印加された後に、それぞれのセルに対して診断的測定を実施することができる。例えば、図6A〜7を参照して上で説明した開チャネル測定と同種の電圧値を測定することができる。次いで、測定された値を分析して、測定された値が、1つのナノ細孔だけ有するセルに対して予想される値に一致するかどうかを判定することができる。単一のナノ細孔は、エレクトロポレーションプロセスの間、電圧変化を追跡することによって検出することができ、電圧がかなり変化した場合に、割り振りがうまく完了したと仮定する。いくつかの実施形態では、エレクトロポレーションプロセス中に、サイクルの暗期の2つの点間の差(すなわちダークディケイデルタ(DDD))および/またはLPDを使用して検査を実行する。
[0130]セルにナノ細孔が追加されたことが観察されたら、そのウェルに対するエレクトロポレーションプロセスを停止することができる。このプロセスは、それぞれのウェルに対して独立して実行することができる。配列決定チップの全てのセルの開チャネル電圧の電圧ヒストグラム/分布を使用して、単一ナノ細孔セルを示す開チャネル電圧または開チャネル電圧範囲を識別する診断的技法と組み合わせて、上記のプロセスを使用することができる。最初のエレクトロポレーションステップ後に細孔を持たないセルに対しては、エレクトロポレーションを繰り返すことができる。
D.開チャネル較正
[0131]エレクトロポレーションの後、タグがその場にないセルの出力電圧を測定して、そのセルの初期電圧を決定することができる。図6A〜7を参照して上で説明したとおり、この測定ADC値は開チャネル電圧と呼ばれる。後に説明するように、この開チャネル電圧の値は正規化の際に使用することができる。加えて、次のセクションで説明するように、開チャネルの値を使用して、単一のナノ細孔を有するセルを識別することもできる。
[0132]ある種の実施形態によれば、開チャネル較正プロセスの一部として、図6A〜7を参照して上で説明したサイクル減衰形状も決定することができる。例えば、対電極に提供される交番信号(VLIQ)に応答して、ADCは、積分コンデンサ、例えば図6Bの積分コンデンサCint608上の出力電圧を測定することができる。図7に示されているように、ADCによって測定される電圧は、方形波駆動信号を正確にはたどらず、むしろ、Cdbl上での電荷の蓄積の結果として、駆動信号VLIQのそれぞれのサイクル内の明期または暗期にわたる減衰を示しうる。ある種の実施形態によれば、1つのACサイクル内のそれぞれの期間の結果として生じる減衰形状を、開チャネル較正プロセスの一部として測定することができる。開チャネルの初期値は、異なる分子(例えば4つの異なる塩基)に対応するチャネルに対して予想される値を決定するのに役立ちうる。
[0133]いくつかの実施形態では、ポレーションプロセスが完了した直後に、配列決定チップのそれぞれのセルに対して開チャネル較正を実行することができる。開チャネル較正プロセスはさらに、配列決定操作中の開チャネルデータの存在に影響を及ぼすことができ、したがって、開チャネル較正プロセスは、前処理ステップの一部として、後に詳細に説明するデータ正規化プロセス中に実行することができる。
[0134]正確さをより高めるため、配列決定中に測定されたADC値を正規化することができる。いくつかの実施形態では、AC駆動電圧の明期中に取得された電圧レベルデータ(本明細書では「明モード電圧」あるいは「明期電圧」と呼ぶ)が正規化される。例えば、測定されたそれぞれの明モードデータ点を、本明細書では「開チャネル電圧」または「明モード開チャネル電圧」と呼ぶ、ナノ細孔が非挿通状態にあるときのそのセルの明モード電圧で割ることによって、明モード電圧を正規化することができる。明モード電圧レベルデータを正規化することによって、未処理のADC測定値のダイナミックレンジが、正規化された範囲に再スケーリングされる。この正規化された範囲は一般に、0から1までの間の範囲を提供するが、明モード開チャネル電圧に対して使用される具体的な値によっては1よりも大きな値も可能である。
[0135]正規化は、システムに対する変化、例えば配列決定セルの電気的特性の変化を補償することを可能にする。例えば、回路600の静電容量は、時間の経過に伴って変化することがある。例えば、2分子層の面積の物理的変化または例えばウェルの縁における2分子層の厚さの物理的変化によるコンデンサCbilayer626の静電容量。このような変化はゲインドリフトと呼ばれる。別の例として、明期と暗期の間の電荷移動の差の結果として、セル内に電荷が蓄積することがあり、ベースラインシフト(時に高速(fast)ベースラインシフト)と呼ばれる。測定回路の可変性および2分子膜の電気的特性の変化による低速(slow)ベースラインシフトが生じることもある。これらの例については後により詳細に説明する。
[0136]このような変化は、全く同じ状態に対する測定値に影響を及ぼすことがあり、それによって不安定性な状態が生じることがある。しかしながら、正規化は、このような変化を補償して、経時的に安定な正規化された値(例えば電圧または電流)を提供し、それによって核酸の配列を決定する際の正確さを高めることを可能にする。
E.単一のナノ細孔を有するウェルの識別
[0137]上で述べたとおり、配列決定チップのそれぞれのセルが1つのナノ細孔だけを有することが望ましい。ある種の実施形態によれば、開チャネル電圧(例えば明モードまたは暗モード中に、ナノ細孔の中にタグが存在しない状態で測定されたADC値)の大きさの統計的分析によって、1つのナノ細孔を有するセルを識別することができる。測定された電圧をビン(bin)に区分けし、特定の電圧ビンに含まれる電圧を有するセルの数を数えることによって、測定電圧のヒストグラム(または分布)を計算することができる。このヒストグラムを分析して、最大振幅ピークを決定することができる。すなわち、チップのセルの中で最も一般的な電圧を決定することができる。ある予想される範囲内に入るようにこの最大振幅ピークを拘束することができ、これは、指定された値よりも高い全ての測定電圧を含むヒストグラムの最後のビンを排除することによって実行することができる。
[0138]ある種の実施形態によれば、最も一般的な電圧は単一のナノ細孔セルに対応しているはずであり、エレクトロポレーションプロセスが監視されており、フィードバック機構の制御下にあったときには特にそうである。一般に、ポレーションプロセスのパラメータを事前に調整して、大部分のセルが単一の細孔だけを形成し、2つ以上の細孔を形成したりまたは細孔を全く形成しなかったりする集団が比較的に小さくなるようにすることができる。別の実施形態では、2番目に大きな振幅ピークを、ナノ細孔を1つだけ有するセルに対応するピークとして使用することができ、一方、最大振幅ピークは、無装備の(bare)2分子層を有するセル、すなわちナノ細孔を持たないセルに対応する。
[0139]図10は、ある種の実施形態に基づく、配列決定チップのセル内のナノ細孔の数を評価する例示的な方法1000を示す流れ図である。方法1000は、細孔挿入プロセスの後に(または少なくとも細孔挿入の初期ステージの後に)実行することができる。方法1000は、例えばディジタル処理装置630、後に図13および図19で説明する処理ユニットもしくは処理装置、および/または配列決定セルの回路に結合された任意の制御論理によって実行することができる。この制御論理は、(例えばさらなるポレーションステップを制御するための)制御信号をこの制御論理が提供するための順方向接続を含む。
[0140]ステップ1010で、配列決定チップ内のセルの開チャネル電圧を取得する。例えば、この開チャネル電圧は、図7を参照して上で説明し、なおかつ本開示の別の場所で説明した電圧と同様の手法で取得することができる。この開チャネル電圧の取得は、配列決定チップからの電圧を、論理システム、例えばFPGA、ASICまたはプログラム可能な処理装置において受け取ることによって達成することができる。
[0141]図11A〜11Cは、セルの異なる状態に対する見本の開チャネル電圧データを示す。図11Aは、単一ナノ細孔セルと呼ばれる、単一のナノ細孔を有するセルに対する(明期と暗期の両方の)開チャネル電圧データ1110を示す。図11Bは、ゼロセル2分子層と呼ばれる、ナノ細孔を持たないセルに対する(明期と暗期の両方の)開チャネル電圧データ1120を示す。図11Cは、短絡セルと呼ばれる、短絡を有するセルに対する(明期と暗期の両方の)開チャネル電圧データ1130を示す。
[0142]ある種の実施形態によれば、ステップ1010で取得された開チャネル電圧は、単一点測定値または多点測定値でありうる。例えば、(例えば図11Bに示された)単一の明チャネルデータ点をセルごとに測定し、それを使用して、セルの特性、すなわちそのセルが単一ナノ細孔セルなのか、ゼロナノ細孔セルなのか、短絡セルなのかなどを評価することができる。所与のセルに対するデータ点からVmzeroの値を減じることができる。多点測定値に関しては、明モード電圧の集合を平均し、平均算出の前または後にVmzeroを減じることができる。多点法は、差データ、例えば1つのサイクルの明期と暗期の間の点間の差、またはACサイクルの期間内の点間の差(例えば明期または暗期内の最初の点と最後の点との差)を計算することを含むことができる。
[0143]図11A〜11Cは、「ラストポイントデルタ」(「LPD」)法を示し、LPD法は、明期の最後の点を暗期の対応する最後の点から減じること、またはその逆を含む。図11Aでは、LPD1115が、約80ADC最下位ビット(least significant bit:LSB)であり、単一ナノ細孔セルのLPDを表す。図11Bでは、LPD1125が、ほぼ0ADC LSBであり、ゼロナノ細孔セル(すなわち無装備の2分子層を有するセル)のLPDを表す。図11Cでは、LPD1135が、約190ADC LSBであり、短絡セルのLPDを表す。短絡セルは、膜を持たないセルまたは多数の細孔を有するセルに対応することがある。後にさらに詳細に説明するように、それぞれの2分子層状態に対するADC LSBの正確な値はセルごとに異なることがあるが、図11A〜11Cは、原理上、LPDを使用して、セルの2分子層上の異なるナノ細孔構成を区別することができることを示している。したがって、ある種の実施形態によれば、ステップ1010の一部として、それぞれのセルのLPDが測定される。他の例として、ファーストポイントデルタまたはアベレージポイントデルタ(average point delta)(明期および暗期の平均値間の差)を使用することもできる。他の例では、このデルタ測定が同じ期間内の点を使用して実施され、その場合、その測定値は「ディケイデルタ」と呼ばれる。これは、このデルタが、サイクル期間内の電圧減衰の量を測定するからであり、例えば、暗期中に測定された5番目の点および10番目の点を減ずることによって、ダークディケイデルタを計算することができる。他の例では、このデルタが、通常の明期または暗期の外側で測定された平均値に対して測定され、例えば「ゼロデルタ(zero delta)」が使用される。ゼロデルタは、明期値とセルを横切ってゼロボルトが印加されたときに測定されたオフセット値、例えば平均オフセットとの間で測定される。
[0144]ステップ1020で、ステップ1010で取得した電圧値を使用してヒストグラム(本明細書では電圧分布とも呼ぶ)を計算する。このヒストグラムは、単一点測定値および/または多点測定値の両方を含む、任意のタイプの測定電圧を入力としてとることができる。上で説明したLPDの例に関しては、ヒストグラムを計算するために、測定されたLPD値の完全な範囲を複数のビンに分割することができる。例えば、測定されたADC LSBが0から255の範囲にある場合には、それらのデータを、1つのビンが1ADC LSBの幅を有する複数ビンに区分けし、それによって256個のビンを有するヒストグラムを有することができる。本開示の範囲から逸脱することなく、他のビン幅(例えば2、3など)も可能である。ビン幅を選択した後、その特定のADC値を有するセルの数を数え、ヒストグラムに追加する。
[0145]図12は、ある種の実施形態に基づく、見本のヒストグラムデータを示す。このデータには、比較的に大きな単一ナノ細孔のピーク1210が見られる。このヒストグラムの左端の部分には、ゼロナノ細孔(低電圧)を有するセル、および擬似細孔(pseudo−pore)を有するセル、例えば細孔と同様の挙動を有するセルのカウント数が示されている。ヒストグラムの右端の部分には、2つ以上の細孔を有するセルおよび短絡を有するセル(例えば膜のないセル)のカウント数が示されている。
[0146]再び図10を参照する。ステップ1030で、単一のナノ細孔を有するセル(本明細書では単一細孔セルとも呼ぶ)に対応するヒストグラムピークを識別する。ある種の実施形態によれば、ステップ1010で測定電圧データを取得するよりも前に、このピーク値もまたはピーク幅も分かっている必要はない。例えば、ピーク検出ルーチンが、ピークの境界および特性を検出して、例えば単一ナノ細孔ピークを識別することができる。例えば、所定の電圧値範囲内の最大振幅ピークの中心を、単一ナノ細孔ピークとして識別することができる。いくつかの実施形態では、この初期ピーク検出ルーチンの間、電圧範囲の端のビンまたは端付近のビンを無視することができる。例えば、図12では、ピーク1210が、ビン2からビン250の間の最大振幅ピークである。ピークを識別するための電圧範囲は、他の配列決定チップからの経験的データによって確立することができる。
[0147]ステップ1040で、単一ナノ細孔ピーク内に位置するセルの第1のセットを決定する。ある種の実施形態によれば、ステップ1040は、最大振幅ピークの識別された幅の内側の電圧を有する全てのセルを、この単一ナノ細孔セルのセットとして識別することができる。この幅パラメータは例えば、標準偏差の代用値として使用することができる半値幅(full width at half maximum)とすることができる。いくつかの実施形態では、この幅を、標準偏差の指定された数値、例えば2、3、4などとしてとることができる。ヒストグラム内の極小の測定値を使用することもできる。例えば、ゼロピークと単一ナノ細孔ピークとの間の極小値を使用して、単一ナノ細孔ピークの幅を識別するためのベースラインを決定することができる。したがって、実施形態は、ヒストグラムデータ内には極大および極小が存在すると判定することができる。さまざまな極小間のヒストグラムの積分面積、すなわち積分された面積を使用して、最大の面積を有するピークを識別することができ、全体として単一ナノ細孔セルがそのチップの最大集団であるとの仮定によれば、そのピークは、単一ナノ細孔ピークに対応するであろう。
[0148]単一のナノ細孔を有するセルに対応するヒストグラムピークは、他のタイプのセルを除外して単一ナノ細孔セルだけからなるとは限らないことを理解すべきである。図12に示されているように、このピークは幅が非常に狭いというわけではなく、そのため、このピーク内のセルの集団は単一ナノ細孔セルが支配的ではあるが、ピークの幅をどのように規定するかによっては、一部の非単一ナノ細孔セルがこのピークの範囲内の電圧を有することがあることが理解される。ある種の実施形態によれば、ピーク値に対してピークの幅を規定することができ、例えば、ヒストグラムの1つのレベルが、ヒストグラムピークの最大値のある指定された分数(例えば半値幅、1/e、119.9%レベルなど)である電圧カットオフを選択することができる。電圧カットオフは、上述の極小および極大の検出に基づいて決定することができる。カットオフの内側の電圧値は、単一ナノ細孔セルとみなされるセルのセットを規定し、非単一ナノ細孔セルの数は幅の低減とともに減少する。このカットオフの配置は、使用可能な単一ナノ細孔セルの大きな割合を捕捉することと、その一方で、単一のナノ細孔以外のものを含むセル(例えばゼロナノ細孔セル、短絡セル、2つ以上のナノ細孔を有するセル、擬似細孔セルなど)の大部分を排除することとの間のトレードオフを含む。
[0149]図12に示された例では、カットオフ1220が29ADC LSBのところに置かれており、カットオフ1230が115ADC LSBのところに置かれている。この例では、カットオフ1220が、(29ADC LSB未満の開チャネル電圧を有する)大部分の擬似細孔およびゼロ細孔セルを排除し、同様に、カットオフ1230が、(115ADC LSBよりも大きな開チャネル電圧を有する)大部分の多細孔および短絡セルを排除する。ある種の実施形態によれば、チップの正確さを向上させるために、これらのカットオフの外側の電圧を有するセルが非活性化され、またはそれらのセルの出力が選択的に除去または無視される。例えば、特性評価の後に、単一のナノ細孔を有するそれぞれのセルの固有の識別子をメモリに記憶することによって、それらのセルを効果的に標識することができる。次いで、配列決定操作中に、処理装置が、記憶された識別子に関連づけられた細孔だけを活性化することができる。非活性化されるセルが、メモリに記憶された固有の識別子によって標識された、これとは逆のケースも可能である。
[0150]ステップ1050で、識別された単一ナノ細孔セルだけを使用して配列決定操作を実行することができる。配列決定操作は、図3、5および7を参照して上で説明したとおりに進行することができる。
[0151]測定された開チャネル電圧データのヒストグラム(または分布)から単一ナノ細孔セルのセットを決定することは、固定されたカットオフ値を使用するプロセスとは対照的に仮定を最小限にすることができるため、単一のナノ細孔を有するセルを識別するロバストなプロセスとなりうる。セルはチップによって異なることがあり、異なる生化学物質が関与することがあるため、このようなロバストなプロセスは望ましい。例えば、単一ナノ細孔ピークの電圧の正確な値が分からないことがあり、異なるチップに対してさまざまなナノ細孔が使用されることがある。さらに、脂質2分子層は時間の経過とともに変化しうる。セルのゲインは、RporeとCbilayerの両方に依存するため、より大きなウェルまたは異なる溶媒(または異なる環)は、ゲイン、したがって開チャネル電圧および挿通電圧を変化させうる。
IV.配列決定操作
[0152]チップの使用可能なセルを識別した後、生成モード(production mode)を実行して、使用可能なセルごとに1つの核酸の配列を決定することができる。配列決定を実行するために、タグ付きヌクレオチドが核酸に付加されている間の積分コンデンサ(例えば積分コンデンサCint608(ncap)またはコンデンサCbilayer626)の電圧レベルを、ADC(例えばADC610)によってサンプリングおよび変換することができる。例えば対電極および作用電極を通して加えられたナノ細孔を横切る電場が、Vliqの方がVpreよりも高いような電場であるときには、加えられたその電場によって、ヌクレオチドのタグをナノ細孔の筒の中に押し込むことができる。
A.挿通
[0153]挿通事象は、タグ付きヌクレオチドが鋳型(例えば核酸断片)に取り付けられているときの事象であり、タグは、ナノ細孔の筒に出入りする。この筒への出入りは、挿通事象中に多数回、起こりうる。タグがナノ細孔の筒の中にあるときには、ナノ細孔の抵抗がより高くなることがあり、ナノ細孔を流れる電流がより小さくなることがある。
[0154]配列決定中、一部のACサイクルにおいてタグがナノ細孔の中にないことがあり(開チャネル状態と呼ばれる)、その場合、ナノ細孔の抵抗がより低いため電流は最も大きい。タグがナノ細孔の筒の中に引き寄せられたとき、そのナノ細孔は明モード(または明期)にある。タグがナノ細孔の筒から押し出されたとき、そのナノ細孔は暗モード(暗期)にある。
B.明期および暗期
[0155]ACサイクル中に、積分コンデンサ上の電圧をADCによって多数回、サンプリングすることができる。例えば、一実施形態では、システムを横切って例えば約100HzのAC電圧信号が印加され、ADCの取得率をセルあたり約2000Hzとすることができる。したがって、1ACサイクル(AC波形のサイクル)あたり約20個のデータ点(電圧測定値)が捕捉されうる。AC波形の1つのサイクルに対応するデータ点は、セットと呼ばれることがある。ACサイクルに対するデータ点のセットには、例えばVliqの方がVpreよりも低いときに捕捉されたサブセットが存在することがあり、このサブセットは、タグがナノ細孔の筒の中に押し込まれる明モード(明期)に対応することがある。別のサブセットは、例えばVliqの方がVpreよりも高いときに、加えられた電場によってタグがナノ細孔の筒から押し出される暗モード(暗期)に対応することがある。
C.測定電圧
[0156]それぞれのデータ点に関して、スイッチ601が開いているとき、積分コンデンサ(例えば積分コンデンサCint608(ncap)またはコンデンサCbilayer626)における電圧は、Vliqによる充電/放電の結果として、例えば、Vliqの方がVpreよりも高いときにはVpreからVliqへの増大として、またはVliqの方がVpreよりも低いときにはVpreからVliqへの低下として、減衰的に変化する。最終的な電圧値は、作用電極が充電するためVliqから外れることがある。積分コンデンサ上の電圧レベルの変化率は、ナノ細孔を含むことがある2分子層の抵抗の値によって支配されることがあり、ナノ細孔は、ナノ細孔の中に分子(例えばタグ付きヌクレオチドのタグ)を含むことがある。この電圧レベルは、スイッチ601が開いた後の所定の時刻に測定することができる。
[0157]スイッチ601は、このデータ取得率で動作することができる。2回のデータ取得間の比較的に短い期間の間に、通常はADCによる測定の直後に、スイッチ601を閉じることができる。このスイッチは、それぞれのサイクルで多数のデータ点が集められることを可能にする。スイッチ601が開いたままの場合、積分コンデンサ上の電圧レベル、したがってADCの出力値は完全に減衰し、そこに留まるであろう。このような多数の測定は、固定されたADCによるより高い分解能を可能にしうる(例えば8ビットから、測定数がより多いことにより14ビット。これは平均されることがある)。この多数の測定はさらに、ナノ細孔の中に挿通された分子に関する速度論的情報(kinetic information)を提供することができる。このタイミング情報は、挿通がどれくらい長く続いているのかを決定することを可能にすることがある。このタイミング情報を、核酸鎖に付加された多数のヌクレオチドの配列が決定されているかどうかを判定するのに役立てる際に使用することもできる。
[0158]ナノ細孔セルの状態を判定する目的に使用することができるncapにおける電圧を意味するための測定回路および測定回路の動作のさらなる詳細は、セクションIIに出ている。
D.正規化
[0159]正確さをより高めるために、配列決定中に捕捉されたADC出力データを正規化することができる。正規化は、サイクル内減衰サイクル形状(intracycle decay cycle shape)、ゲインドリフトおよびベースラインシフトなどのオフセットの影響を考慮することができる。上述のとおり、正規化は、測定された開チャネル電圧を使用して実行することができる。例えば、いくつかの状況では、明モード開チャネル電圧が一定であり、したがって、全ての明モードデータを同じ正規化係数で割って、正規化を実行することができる。
[0160]それぞれの配列決定セルは一般に、脂質2分子層静電容量に依存する電圧利得を有する。電圧利得は、電極対(例えば対電極210と作用電極202との)間で達成される電圧差に対応する。例えば、1つのコンデンサについて式C=q/Vが与えられた場合、同じ量の電荷が存在するときには、静電容量が増大すると電圧は低下することになる。したがって、脂質2分子層静電容量が時間とともに変化する場合には、電圧利得も時間とともに変化する。電圧利得が時間とともに変化する場合には、明モードおよび暗モード(開チャネルと挿通の両方)も時間とともに変化しうる。実際のシステムでは、時間とともに、例えば2分子層が変形するにつれて、2分子層静電容量が変化することがある。このような変化は通常、数百秒または数千秒の時間尺度で起こり、典型的な挿通事象よりもゆっくりではあるが、それでも、高い正確さでの測定が所望の場合には考慮されるべきである。
[0161]電圧利得は時間とともに変化しうるため、明モードにおける開チャネル電圧が経時的に一定でないことがあり、したがって、上述の単一値正規化(すなわち全てを同じ正規化係数で割る)は、信号全体を経時的に正規化することができないことがある。この一定値の正規化の代わりに、より複雑な可変正規化を適用することもできる。例えば、それぞれの未処理明モード測定ADC値をその点の開チャネル値の推定値で割ることによって、正規化を達成することができる。それぞれの非挿通領域に関して、開チャネル電圧の推定は、いくつかの手法によって、例えば局所平均値をとることによって、または後により詳細に説明するようにカルマン(Kallman)フィルタなどのより洗練された信号処理技法を使用することによって、実施することができる。このようにして、明モードの開チャネル値の局所推定値を取得して、データ点を、そのデータ点に対して局所的な推定された電圧を使用して正規化するようにすることができる。
[0162]他方、信号の挿通領域は難題を提供しうる。いくつかの挿通事象について、挿通速度が十分に低速である場合に使用可能な開チャネルデータが存在することがある。挿通速度が比較的に低速であるときには、タグが挿通される前に開チャネル値を測定することができる。このような開チャネル値はサイクルごとに測定することができる。これらのケースでは、限定された開チャネルデータを使用して、挿通事象中に真の開チャネル値を推定することができる。この限定された(すなわち挿通が起こっていないときに限定された)開チャネルデータを使用して、開チャネル値の局所推定値(例えばゲインドリフトを考慮するために時間内で局所的な推定値)を取得することができる。
[0163]しかしながら、明モードで開チャネルデータが捕捉されないほどに挿通が十分に高速であることもある。挿通速度が十分に高速であるときにはタグがすぐに挿通され、開チャネル値は測定されない。開チャネル電圧のこの欠如は、開チャネルの局所推定値を決定しようとするときに問題となりうる。所与の時間間隔の開チャネル値が存在しない場合には、その時間間隔の局所推定値を決定することができない。これらのケースでは、後にさらに説明するように、暗モードデータを使用して、明モードの開チャネルデータの局所推定値を決定することが可能である。
[0164]ベースラインシフトは、測定プロセス中に起こる充電および放電サイクル中にセル内のある種の要素(例えばCdbl624)上に蓄積する電荷の不均衡に関係する現象である。例えば、測定プロセス中には、図6BのCdbl624によって表されたセルの作用電極上に過剰の電荷が蓄積しうる。一例では、電荷不均衡が、ナノ細孔とタグの両方が非線形I−V特性を有することによって引き起こされる。この非線形性の結果として、充電および放電サイクルが、同じ量の電荷を容量要素に追加せず、または同じ量の電荷を除去しないことがある。例えば、負イオンおよび正イオンが、経時的に同じ速度で、一方の電極からもう一方の電極へ細孔を介して移動しないことがあり、それによって例えばウェル内に正電荷が蓄積することがある。正イオンと負イオンの透過速度の典型的な差に対処するために、デューティサイクルを暗モード60%、明モード40%とすることができるが、速度が変化したときには、デューティサイクルを変更しなければないであろう。このデューティサイクルを変更は、実行が困難であることがある。
[0165]この蓄積電荷不均衡の結果、セル内の電圧測定値は増大するであろう(例えばウェル内に正電荷が蓄積したとき)。このベースライン電圧のシフトは、電荷不均衡の結果として元来設定された反対極性の電圧と均衡を保つのに十分な大きさの電圧をそれが生成するまで増大しうる。この時点で、電荷は再び均衡を保つことができる。ベースラインシフトは、暗モード開チャネル状態と明モード開チャネル状態の両方および4つ挿通状態のそれぞれで起こりうる。このシフトの大きさおよび時定数は潜在的に、開チャネル状態および4つの挿通状態のそれぞれで異なる。その結果として、ベースラインシフトは、細孔におけるタグの確率的結合事象を反映する概ねランダムなやり方で変化しうる。
[0166]ゲインシフト現象と同様に、ベースラインシフトを補償するために、ポイントごとの可変正規化を適用することができる。例えば、この正規化は、後にさらに詳細に説明するように、それぞれの未処理の明モード測定ADC値を、その点の開チャネル値の推定値で割ることによって達成することができる。このような推定値は、局所推定値とみなすことができる。これは、この推定値が、1つの時間間隔内の単一の点または点のあるセットに対して有効であるためである。
[0167]サイクル内減衰は、1つのサイクル中に図6BのコンデンサCdbl624が1つの測定値から別の測定値に変化する結果である。Cdbl624のこの変化は、連続する測定に対して減衰がよりゆっくりとなり、それによって測定ADC値がわずかに変化するような影響を、積分コンデンサにおける電圧の減衰率に及ぼす。
[0168]このような変化を補償するためには、電圧の単一の読みだけをとればよいが、それは、多数の測定値ほどには正確でない可能性がある。いくつかの実施態様は、所与のサイクルにわたって電圧の平均値をとることによって単一の測定値を効果的に得ることができる。サイクル内減衰率の計算値または予想値に基づいて、このような平均に重みを付けることができる。このような平均値を、測定ADC値として使用することができ、潜在的に、1つのサイクル内の挿通電圧にこの平均値を与えることができる。
[0169]いくつかの状況では、開チャネル明電圧が常に使用可能であるとは限らない。このような状況では、開チャネル暗電圧が使用される。正規化に関するさらなる詳細は、米国特許出願第15/632,190号および第15/628,353号に出ている。これらの文献は、それらの全体が参照によって組み込まれている。
E.塩基の決定
[0170]正規化後、実施形態は、挿通チャネルの電圧のクラスタを決定することができる。それぞれのクラスタは、異なるタグ種、したがって異なるヌクレオチド(または塩基)に対応する。それらのクラスタを使用して、所与のヌクレオチドに対応する所与の電圧の確率を決定することができる。別の例として、それらのクラスタを使用して、異なるヌクレオチド(塩基)を区別するためのカットオフ電圧を決定することもできる。いくつかの実施形態では、正規化されたデータから、または配列決定セルの動作が経時的に十分に安定している場合には未処理のデータから、ヒストグラムが作成される。次いで、このヒストグラムに基づき、ラプラシアン混合モデル(Laplacian mixture model:LMM)を使用して、異なるヌクレオチド(塩基)を区別するためのカットオフ電圧を決定することができる。このラプラシアンの幅は、フィッティング(fitting)手順の一部として決定することができる。正の開チャネルに対する1つのラプラシアン関数と、4つのそれぞれのヌクレオチドに対する1つのラプラシアン関数の、合わせて5つのラプラシアン関数が存在しうる。クラスタはセルごとに決定することができる。
[0171]いくつかの実施形態では、例えば確率関数および正規化された信号値に基づく隠れマルコフモデル(hidden Markov model:HMM)復号器を使用して、ヌクレオチド結合状態および対応する塩基の配列が決定される。HMM復号器では、このヒストグラムおよび/または混合モデルに基づいて、特定の塩基に対応する放出確率(emission probability)を、正規化された(または正規化されていない)信号値に割り当てることができる。4つのセル状態(A、T、CおよびG)のうちのそれぞれのセル状態について、確率関数(または混合状態)は、そのセル状態にある確率を、異なる数値に割り当てることができる。
[0172]いくつかの実施形態では、ヒストグラムのビンの複数のカウント数を使用して、この確率関数を決定することができる。例えばカットオフ値、ヒストグラムのピークに対応する信号値、または混合モデルに基づく、さまざまなタイプの確率関数を決定することができる。確率関数が決定された後、(例えばCに対応する)特定の挿通事象またはセル状態に対応する、所与の時刻に測定された特定の信号値の確率を、そのセル状態に対応する確率関数を使用して決定することができる。信号値ごとに4つの確率を決定することができ、それぞれの確率関数は1つの確率を提供する。最も高い確率に対応するセル状態を、信号値に関連づけられたセル状態であると判定することができる。
[0173]配列決定操作に関するさらなる詳細は例えば、「Nanopore−Based Sequencing With Varying Voltage Stimulus(変動する電圧刺激を用いたナノ細孔ベースの配列決定)」という名称の米国特許出願第14/577,511号、「Nanopore−Based Sequencing With Varying Voltage Stimulus(変動する電圧刺激を用いたナノ細孔ベースの配列決定)」という名称の米国特許出願第14/971,667号、「Non−Destructive Bilayer Monitoring Using Measurement Of Bilayer Response To Electrical Stimulus(電気的刺激に対する2分子層応答の測定を使用した非破壊2分子層監視)」という名称の米国特許出願第15/085,700号、および「Electrical Enhancement Of Bilayer Formation(2分子層形成の電気的強化)」という名称の米国特許出願第15/085,713号に出ている。
V.データ処理システム
[0174]図13は、本発明の実施形態に基づく、ナノ細孔ベースの配列決定センサチップ1310によって捕捉されたデータを処理するための例示的なシステムのブロック図を示す。センサチップ1310は、数千個もしくは数百万個またはそれよりも多くのセルを含むことができる。上述のとおり、このデータは、センサチップ1310のセルによって、セル形成および配列決定のさまざまな段階中に捕捉されたものとすることができ、このデータは、例えば、(例えば電気回路の開路/短絡を検査するために)脂質層の形成前に、厚い脂質層の形成後に、脂質層の薄化中に、2分子層の形成後に、(例えばそれぞれのセルのナノ細孔の数を決定するため、または正規化のための開チャネルデータを測定するために)ナノ細孔の形成後に、および(例えば正規化のために)試料の配列決定中に捕捉されたものを含む。
[0175]センサチップは、100,000個以上のセル、百万個以上のセル、2百万個以上のセル、4百万個以上のセルまたは8百万個以上のセルなど、数千個または数百万個のセルを含むことができる。例示的なシステムでは、センサチップ1310が百万個のセルを含み、百万個のそれぞれのセルが、図1〜4および6に関して上で説明したナノ細孔ベースのセンサセルであり、100HzのAC信号の1回のサイクルで例えば10個のデータサンプル点を捕捉する。したがって、所与の時刻に、百万個のそれぞれのセルは、1バイト(例えば8ビット)で表された1つのデータ点を捕捉することができ、百万個のセルからの百万バイト(MB)のデータを含む1つの未処理データフレームを生成することができる。いくつかの実施態様では、データ点が、ADC出力(ADC値)からの未処理のデータ点である。いくつかの実施態様では、実際のADC値を出力するのではなく、データ点が、ADC出力からの連続した2つの未処理のデータ点間の差である。いくつかの実施態様では、セルで事象が発生したかどうかを判定するために局所事象検出器が使用され、出力データ点が、セル上で事象が発生したかどうか示す。局所事象検出器は例えば、新たなADC値と以前のADC値(または他の基準値)との差がしきい値ホールドよりも大きい場合に事象を検出する。データフレームは、いくつかのセル上に事象または状態変化がないこと、および他のいくつかのセル上に事象または状態変化があることを示すことができる。したがって、データフレームは、所与の時刻における全てのセルの全てのデータ点を含む。データ点に関するさらなる詳細は例えば、「Encoding State Change of Nanopore to Reduce Data Size(データサイズを低減させるためのナノ細孔の状態変化のコード化)」という名称の米国特許出願第14/864,400号に出ている。
[0176]未処理のデータフレームは、例えば8百万個の画素を含む画像ファイルによって表されることがあり、それぞれのセルからのデータ点は、その画像ファイルの画素のグレースケールもしくは色および/または強度によって表されることがある。それぞれのACサイクルにおいて、サンプル点ごとに1つ、合計10個の未処理データフレームが生成されることがある。例えば、明期に4つのサンプル点がとられ、暗期に6つのサンプル点がとられることがあり、またはこの逆が実施されることがある。したがって、1秒間に、1000(100サイクル×10未処理データフレーム/サイクル)個の未処理データフレームが生成されることがあり、1000個の未処理データフレームは、百万個のセルからの1ギガバイト(GB)(1MB/フレーム×1000フレーム)のデータを含むことがある。言い換えると、百万個のセルを有するセンサチップに関して、センサチップ1310の出力データ速度は、1GB/秒(GB per second:GBPS)であることがある。
[0177]図13に示されているように、センサチップ1310によって捕捉されたデータは、前処理のためにFPGA1320に送ることができる。FPGA1320は、受け取ったデータを局所メモリ1325に、例えば12GBPSのデータ速度で記憶することができる。あるいは、センサチップ1310によって捕捉されたデータを、局所メモリ1325に直接に送ることもできる。FPGA1320は、受け取ったデータを直接に(または受け取ったデータを処理し、次いでその前処理されたデータを)、例えばペリフェラル・コンポーネント・インターコネクト・エキスプレス(Peripheral Component Interconnect Express:PCIe)インタフェースを介して、PCIeバス1380に送ることができる。PCIeバス1380は、例えば8GBPSの最大データ転送速度を有する。
[0178]それぞれの未処理データフレームは、1つのセルから1つのデータサンプル点だけを含み、それぞれの塩基は、上述のとおり複数のサンプルデータ点に基づいて決定される。さらに、データ処理装置が、未処理のデータフレームをリアルタイムで処理するのに十分な資源を有していないことがある。したがって、最初に未処理のデータフレームを記憶し、次いで、塩基を決定するのに十分な未処理データフレームが使用可能であるときに、それらのデータフレームを一緒に処理することができる。例えば、FPGA1320からのデータを、1つもしくは複数の標準ディスクドライブ1360または1つもしくは複数の高速キャプチャドライブ(fast capture drive)1350に記憶することができる。それぞれの標準ディスクドライブ1360は、0.2GBPSの最大書込み速度を有することがあり、それぞれの高速キャプチャドライブ1350は、1GBPSの最大書込み速度を有することがある。それに加えてまたはその代わりに、FPGA1320からのデータを、ネットワークインタフェース1370を介してネットワーク記憶装置に送ることもできる。ネットワークインタフェース1370は、0.1GBPSの最大データ速度を有することがある。したがって、データを例えば1GBPSで保存するためには、多数のドライブまたはネットワークインタフェースが必要となることがあり、それによってシステムのコストがかなり増大することがある。さらに、PCIeバス1380の使用可能な帯域幅が、バス上での他のデータ輸送のために、例えば6GBPS(完全な帯域幅の75%)となるなど、8GBPSの完全な帯域幅よりも小さくなることがある。したがって、いくつかのケースでは、FPGA1320からのデータが十分な速さでは記憶ドライブに保存されない。データを一時的に記憶するために大きなバッファが必要となったり、または一部のデータを落とすことが必要となったりすることがある。
[0179]センサチップ1310によるデータサンプリングが完了した後、グラフィック処理ユニット1330(GPU)またはホスト処理装置1340を使用して、記憶されたデータを処理することができる。ホスト処理装置1340は、例えば約22GBPSの最大帯域幅を有する通信インタフェースを含むことができる。この最大帯域幅は、PCIeバス1380の帯域幅の限界のために完全には利用されないことがある。ホスト処理装置1340は、メインメモリ1345(例えばDRAM)に例えば12GBPSの最大データ速度でアクセスすることができる。さまざまな実施態様において、ホスト処理装置1340は、メインメモリ1345に直接にアクセスすること、または例えばノースブリッジ(north bridge)を介してアクセスすることができる。GPU1330は、数百または数千個の並列処理コアを含むことがあり、例えば200GBPSの最大データ速度でGPUメモリ1335にアクセスすることができる。GPU1330は、標準ディスクドライブ1360または高速キャプチャドライブ1350などの他の構成要素と、PCIeバス1380を介して8GBPS以下、例えば約1GBPSのデータ速度で通信することができる。GPU1330は、センサチップ1310の数千個または数百万個のセルからのデータを並列処理するのにより適していることがある。
[0180]記憶されたデータを処理するために、GPU1330が、記憶装置からデータをリードバックする必要があることがあり、そのデータリードバックの速度によってデータ処理速度が制限されることがある。したがって、センサチップ1310を使用して、例えば検定のために2時間以上データをサンプリングする場合、記憶されたデータをリードバックするのに2時間以上を要することがある。したがって、データ処理時間が非常に長くなることがある。
[0181]したがって、データ処理システムのコストを低減させ、システムのデータ処理効率を向上させるために、センサチップ1310によって捕捉されたデータをリアルタイムで処理すること、およびシステムの異なる機能ブロック間のデータ転送量を低減させることが望ましいことがある。
VI.データフレームおよびフレームマップ
[0182]図14は、本発明のいくつかの実施形態に基づく、図13のセンサチップ1310などの例示的なナノ細孔ベースの配列決定チップによって捕捉された未処理のデータフレームの例を示す。図14に示されているように、第1のナノ細孔セルからの検出信号は、波形1410によって示すことができる。波形1410は、複数のACサイクルを含むことがある。それぞれのACサイクルは、図7に関して上で説明したように暗期1412および明期1418を含むことがある。示されているように、1412および1414における信号は、ナノ細孔の中にタグがないときの、例えば挿通がないときの開チャネル値である。明期1418は、挿入期1416を含むことがあり、その間は、この間にナノ細孔の中にタグが挿通された結果として、検出信号の値が異なることがある。図14は、暗期1412の検出信号の方が明期1418の検出信号よりも高いことを示しているが、セル電圧基準(例えば電圧源Vpre605)がどのように構成されているのかによっては、暗期の検出信号の方が明期の検出信号よりも低いこともある。
[0183]それぞれのACサイクルでは、それぞれのナノ細孔セルによって、8、10、16または24個のサンプルなど、多数のデータサンプルが捕捉されることがある。一部のデータサンプル、例えばナノ細孔セルによって暗期の間に捕捉されたデータサンプルは、同じであったり、またはおおよそ同様であったりすることがある。図14のデータは、線が完全に平らである点で理想化されている。上述のとおり、測定(例えば電圧または電流)は、明および暗期中に多数回、実施することができる。それぞれの時点における値は、例えば測定の分解能に応じてわずかに異なることがある。1つのADC出力は、256個の値の範囲を有することができ、したがって、開チャネルの異なるADC出力値は、互いの少数のADC最下位ビット(LSB)内で異なりうる。
[0184]図14に示されているように、時刻t1において、配列決定チップのそれぞれのセルは、1つのサンプルを、例えば図6のADC610から捕捉することができる。例えば、最初のナノ細孔セルは1つのサンプル1422を捕捉することができ、そのサンプルは、単一のADC値を含みうる。配列決定チップ内のナノ細孔セルによって捕捉されたサンプルは、未処理データフレーム1420−1を形成することができる。同様に、時刻t2において、配列決定チップのそれぞれのセルは1つのサンプルを捕捉することができ、配列決定チップ内のナノ細孔セルによって捕捉されたサンプルは、未処理データフレーム1420−2を形成することができ、以下同様にして、処理データフレームを形成することができる。時刻tnにおいて、配列決定チップのそれぞれのセルは1つのサンプルを捕捉することができ、配列決定チップ内のナノ細孔セルによって捕捉されたサンプルは、未処理データフレーム1420−nを形成することができる。
[0185]セル形成、セル較正および配列決定のさまざまな段階中に、異なる未処理データフレームが生成されることがある。いくつかの実施形態では、異なる未処理データフレームが、セルに関連づけられた異なるパラメータを含む。例えばADC基準信号の波形(例えば時間、レベルおよび形状)、作用電極および/または対電極に印加される信号の波形などを変化させることによって、生成される未処理データフレームを動的に選択または調整することができる。
A.フレーム落とし
[0186]転送および記憶されるデータの量を減らすため、図13のFPGA1320などの前処理装置(preprocessor)は、いくつかのフレームを落とす(drop)ことができる。例えば、1つのACサイクル内の10個(例えば明期6個、暗期4個)の全ての未処理データフレームを送るのではなしに、そのACサイクル内の7つの未処理データフレームを落とし、残りの3つの未処理データフレームを送ることができる。一実施態様では、この3つの未処理データフレームが、暗期中に捕捉された1つの未処理データフレーム、および明期中に捕捉された2つの未処理データフレーム(挿入期中に捕捉された1つの未処理データフレームを含む)を含む。そのため、転送されるデータの量を、配列決定チップによって捕捉された未処理データの約30%に減らすことができる。
[0187]さまざまな実施形態において、落とされるフレームの数および落とされるフレームの位置が異なることがある。例えば、いくつかの実施形態では、暗期の第1のフレームが保持され、暗期の残りのフレームが落とされる。いくつかの実施形態では、暗期の中間のフレームが保持され、暗期の残りのフレームが落とされる。いくつかの実施形態では、暗期の最後のフレームが保持され、暗期の残りのフレームが落とされる。いくつかの実施形態では、暗期の2つ以上のフレームが保持され、暗期の残りのフレームが落とされ、それらの2つ以上のフレームが、暗期の第1のフレーム、中間フレームまたは最後のフレームのうちの少なくとも1つのフレームを含む。明期のフレームまたは明期の挿入期のフレームも同様に取り扱うことができる。いくつかのケースでは、Nn個おき(例えば10個おき)のサイクル内のデータフレームが落とされず、それらのN個おきのサイクルのデータフレームが、正規化または較正目的に使用される。
[0188]後に詳細に説明するが、フレームマップを使用して、対応する未処理データフレームを識別することができる。フレームマップは例えば、1つのサイクル内の2つの明未処理データフレームおよび1つの暗未処理データフレームを指定することができる。次いで、未処理データフレームの減らされたセットを、フレームマップに基づいて処理装置によって処理することができる。
[0189]上述の方法は、転送および記憶されるデータの量を減らすことができるが、単純にいくつかの未処理データフレームを落とすときには、例えばナノ細孔セルの検出信号の波形が少なくともいくつかのサイクルにおいて予測不可能であるかまたは不規則である場合に、有用な情報を失うことがある。ナノ細孔ベースの配列決定チップによって捕捉されたデータサンプル中のある有用な情報を失うことなく、データ転送および記憶の量を減らすことが望ましいことがある。
B.前処理
[0190]本開示のある種の態様によれば、前処理装置(例えばFPGA1320)は、ナノ細孔ベースの配列決定チップ(例えばセンサチップ1310)によって捕捉された未処理のデータを処理してさまざまな関連情報を抽出し、その関連情報を、配列決定する対象の核酸分子中の塩基をリアルタイムで決定するために処理装置(例えばGPU1330)に送る。
[0191]いくつかの例では、前処理装置が、塩基を決定するための関連情報を未処理データフレームから抽出し、抽出された情報を含むダイジェストデータフレームを生成する。ダイジェストデータフレームの数は未処理データフレームの数よりもかなり少ない。例えば、1秒間に1000個の未処理データフレーム(100サイクル×10未処理データフレーム/サイクル)が生成されることがあり、その結果、8GBのデータ(すなわち8GBPS)が得られることがある。未処理データフレームは、局所メモリ1325などのバッファに直接に送ることができ、そのバッファは、処理装置(例えばGPU1330)が1つまたは複数の塩基を識別するのに十分な情報が複数のデータフレーム中に存在するまで、未処理データフレームを一時的に記憶することができる。1つまたは複数の塩基を識別するのに必要な未処理データフレームの数は、配列決定プロセスの速度論に依存することがある。例えば、1秒で1つまたは2つの塩基が識別される例では、バッファは、ナノ細孔ベースの配列決定チップによって捕捉された1000個の未処理データフレーム(例えば8GB)を記憶することができる。新たなデータを受け取るために8GBが使用され、前処理装置によって処理されている以前に捕捉されたデータを記憶するために残りの8GBが使用されるように、このバッファを例えば16GB以上とすることができる。
[0192]いくつかの実施形態では、上で述べたように、前処理装置が、連続したフレームを比較し、実質的に同様である大部分のデータフレームを落とし、それらの同様のフレームを代表するフレームだけを保持する。例えば、前処理装置は、暗期の最初のフレーム、明期の最初のフレームおよび挿入期の最初のフレームを保持し、暗期、明期および挿入期のそれぞれの期間の後続のフレームであって、対応する期間の最初のフレームと同様のフレームを落とす。いくつかの実施形態では、前処理装置が、暗期、明期または挿入期のデータフレームの平均であるダイジェストデータフレームを生成する。いくつかの実施形態では、前処理装置が、それぞれのセルの暗期、明期または挿入期におけるデータフレーム内のデータの中央値を含むダイジェストデータフレームを生成する。このようにすると、ダイジェストデータフレームの数を、未処理データフレームの数の例えば約30%に減らすことができる。
[0193]いくつかの実施形態では、前処理装置が、未処理データフレームから事象を判定する。例えば、前処理装置は、1つのセルの2つの連続した未処理データフレーム内のデータ間の差(または1次微分係数)を決定することができ、この差がしきい値よりも大きい場合に、事象を検出することができる。データ変化の極性および/または振幅に基づいて、例えば挿通事象が起こったかどうかを判定することができる。検出された事象の情報を含むダイジェストデータフレームを生成し、塩基を決定するために処理装置に送ることができ、一方、未処理データフレームは落とすことができる。ダイジェストデータフレームの他の例は、後により詳細に説明するように未処理データフレームから生成することができる。
[0194]したがって、一部のサイクルでは、それぞれのサイクルで多数のダイジェストデータフレームを生成することができ、一部のサイクルでは、多数のサイクルを横切って1つのダイジェストデータフレーム(例えば事象情報を含むフレーム)を生成することができる。このようにすると、データ処理システムの残りの部分に送られるデータフレームをかなり減らすことができ、したがって、データ処理システムの残りの部分が高帯域幅データ通信を必要としないようにすることができる。例えば、処理装置は、ダイジェストデータフレームを受け取り、ダイジェストデータフレームをリアルタイムで処理することができることがあり、DNA分子中の決定された塩基を、標準ディスクドライブ1360または高速キャプチャドライブ1350などの局所記憶装置に送るか、または例えばネットワークインタフェース1370を介してネットワーク記憶装置に送るだけでよいことがある。一例として、ナノ細孔ベースの配列決定チップが8百万個のナノ細孔セルを含み、それぞれのナノ細孔セルを使用して1秒あたり2つの塩基を識別することができる場合には、1秒で1600万個の塩基を識別することができる。それぞれの塩基の情報が例えば4バイトで表現される場合、記憶装置に記憶されるデータは1秒で64MBである。したがって、わずか64MBPSの帯域幅を使用して、記憶装置にデータを書き込むことができる。識別された塩基の情報を記憶するには、標準ディスクドライブ1360などの単一の標準ディスクドライブで十分であることがある。
[0195]前処理装置は、捕捉されたデータからさまざまな情報を抽出することができる。例えば、いくつかのケースでは、前処理装置が、サイクルの最初のフレームのデータとそのサイクルの別のフレームのデータとの差に対応するファーストポイントデルタを、それぞれのナノ細孔セルの検出信号から抽出し、そのサイクルのそれぞれのナノ細孔セルのファーストポイントデルタを含むダイジェストデータフレームFを生成する。フレームFは、数サイクルごとに生成することができ、2分子層の形成(1つの例示的な動作段階)中に使用することができる。例えば、ファーストポイントデルタ値は、2分子層の厚さに比例する2分子層の静電容量に比例しうる。次いで、ダイジェストフレームマップを使用して、2分子層の望ましい厚さが達成されたかどうかを判定することができる。
[0196]そのようなフレームFは、他の動作段階では、例えば2分子層の形成後にはあまり使用されないか、または全く使用されない。したがって、一部のダイジェストフレームは、ある動作段階中にのみ使用されることがある。特定の段階中の前処理装置の動作を制御するため、異なる段階中に異なるフレームマップを前処理装置に提供することができる。
[0197]いくつかのケースでは、前処理装置が、サイクルの2つのフレームのデータ間の差に対応するラストポイントデルタを、それぞれのナノ細孔セルの検出信号から抽出し、そのサイクルのそれぞれのナノ細孔セルのラストポイントデルタを含むダイジェストデータフレームLを生成する。フレームLは、数サイクルごとに生成することができ、2分子層の形成中に使用することができる。
[0198]いくつかのケースでは、前処理装置が、サイクルの中間データ点を、それぞれのナノ細孔セルの検出信号から抽出し、そのサイクルのそれぞれの動作ナノ細孔セルの中間データ点を含むダイジェストデータフレームMを生成する。フレームMは、1サイクルごとに生成することができ、例えば配列決定のためのカルマンフィルタリングで使用することができる。
[0199]いくつかのケースでは、前処理装置が、1つまたは複数のサイクルの検出信号の減衰に関する情報を、それぞれのナノ細孔セルの検出信号から抽出し、その1つまたは複数のサイクルのそれぞれのナノ細孔セルの減衰情報を含むダイジェストデータフレームDを生成する。減衰情報は、期間内の2つのフレーム間の差を含むことができ、その期間中にADC値の波形がどのように変化したのかを示すことができる。フレームDは、数サイクルごとに例えば暗期中に生成することができ、2分子層形成中および配列決定中に使用することができる。例えば、暗期のフレームDを使用してナノ細孔を識別することができる。いくつかの実施形態では、この減衰情報が、ADC値の波形の変化率を含む。
[0200]いくつかのケースでは、前処理装置が、1つまたは複数のサイクルの検出信号の事象情報を、それぞれのナノ細孔セルの検出信号から抽出し、その1つまたは複数のサイクルの全てのナノ細孔セルの事象情報を含むダイジェストデータフレームEを生成する。事象は、例えば明期中のタグの挿入またはタグの欠失によって生じた検出信号のジャンプが存在するときに検出されることがある。例えば、事象情報は、挿通事象が起こったかどうか示すことがある。いくつかの実施形態では、フレームEが、事象が起こったかどうかを示す「真」または「偽」の指示(例えば「0」または「1」)を含む。例えば、1つのセルからのADC値が、1つのフレームから次のフレームにかけてあるパーセントを超えて変化した場合には、挿通事象が起こった可能性があり、フレームEは、そのセルに対する「真」または「1」を含むことができる。事象を検出しなかったセルは、対応する「偽」または「0」の値をそのフレーム内に有することができる。
[0201]いくつかのケースでは、前処理装置が、事象が起こったときのある時間の長さまたは時刻などの1つまたは複数のサイクルのタイミング情報を、それぞれのナノ細孔セルの検出信号から抽出し、時間フレームを生成する。時間フレームは、それらのセル内で検出された事象のタイミング情報を含むことができる。例えば、10個の明フレームを含むサイクルのフレーム6とフレーム7の間でセルに関する事象が起こった場合、時間フレーム内のそのセルの値を6とすることができる。いくつかの実施態様では、時間フレームが生成されず、処理装置が、他のフレームのヘッダ内のタイミング情報に基づいてタイミング情報を抽出する。
[0202]上記の例は、例示だけが目的であり、前処理装置によって抽出され、ダイジェストデータフレームに含まれる他のスペシャリティ情報(specialty information)が存在することがあることを当業者は理解するであろう。
[0203]いくつかの実施形態では、それぞれのダイジェストデータフレームがヘッダを含み、そのヘッダが、そのダイジェストデータフレームのタイムスタンプ、そのダイジェストデータフレームのタイプ、またはそのダイジェストデータフレームに関する他の情報を含む。いくつかのケースでは、1つのサイクルにおいて多数のダイジェストデータフレームが生成される。例えば、1つのサイクルにおいてファーストポイントデータフレーム(first point data frame)F、中間データ点フレームMおよび減衰フレームDが生成されることがある。いくつかのケースでは、1つのサイクルでダイジェストデータフレームが生成されない。いくつかのケースでは、多数のサイクルで1つのダイジェストデータフレームが生成される。
C.フレームマップ
[0204]上述のとおり、さまざまな実施形態において、対応するダイジェストデータフレームおよび/または未処理データフレームを識別するためにフレームマップが使用され、フレームマップは、処理装置が、どのデータフレームを受け取ったのかを知ることができ、したがってそれらのデータフレームを使用して塩基を決定することができるように、前処理装置によって処理装置に送られる。例えば、いくつかの実施形態では、サイクルごとにフレームマップが生成され、そのフレームマップは、それぞれのサイクルに含まれるフレームに関する情報を含む。いくつかの実施形態では、多数のサイクルに対して1つのフレームマップが生成され、そのフレームマップは、多数のサイクルを横切って生成されたフレームに関する情報を含む。いくつかの実施形態では、100サイクルごとに、1秒ごとに、または塩基を決定するのに十分な情報を含む未処理データフレームに対して、フレームマップが生成される。
[0205]いくつかの例では、フレームマップが、配列決定システムのユーザまたはオペレータによって予め定められている。いくつかの例では、フレームマップが、前処理装置によって動的に決定される。いくつかの例では、フレームマップが処理装置によって決定され、処理装置は、フレームマップを前処理装置に送って、そのフレームマップ内で識別されているデータフレームを要求する。
D.例示的な結果
[0206]図15は、本発明のいくつかの実施形態に基づく、例示的なナノ細孔ベースの配列決定チップによって捕捉された未処理のデータフレームを前処理することによって生成された例示的なダイジェストデータフレームを示す。図15に示されているように、配列決定検定において捕捉された複数の未処理データフレーム1510を前処理し、はるかに少数のダイジェストデータフレーム1520に変換することができる。ダイジェストデータフレーム1520は次いで、核酸分子中の塩基を識別するリアルタイム並列処理のために、1つまたは複数のサイクルのダイジェストデータフレームのタイプを識別するフレームマップとともに、GPUなどの多数のコアを有する処理装置に送られる。例えば、図15に示されているように、サイクル1の未処理データフレームを前処理し、例えば上述の15個以上の未処理データフレームではなしに、ファーストポイントデータフレームF、中間データ点フレームMおよび減衰情報フレームDを含む3つのダイジェストデータフレームに変換することができる。
[0207]サイクル2では、15個以上の未処理データフレームを処理し、中間データ点フレームMおよび減衰情報フレームDを含む2つのダイジェストデータフレームに変換することができる。上述のとおり、いくつかのケースでは、例えば正規化または較正目的で、いくつかの未処理データフレーム(例えばNサイクルごとの全ての未処理データフレーム)が前処理装置によって処理装置に送られる。さらに、変換されたダイジェストデータフレームを識別するフレームマップを生成し、処理装置に送ることができる。次いで、フレームマップ内の情報を処理装置が使用して、ダイジェストデータフレームに基づき塩基を決定することができる。
[0208]図16は、図15に示された例に対して生成された例示的なフレームマップ1600を示す。図16に示されているように、フレームマップ1600は、処理装置に順番に送られたダイジェストデータフレームのリストを識別する。例えば、最初のダイジェストデータフレームはファーストポイントデータフレームFであり、その後に中間データ点フレームMおよび減衰情報フレームDが続く。これらのフレームは、図15に示されたサイクル1内の未処理データフレームから生成されたものである。フレームマップ1600はさらに、図15に示されたサイクル2内の未処理データフレームから生成された中間データ点フレームMおよび減衰情報フレームDを識別する。フレームマップ1600はさらに、ダイジェストデータフレームの1つが事象フレームEであること、および次のダイジェストデータフレームが、フレームE内で識別された事象の時間情報を含む時間フレームTであることを識別することができる。
[0209]別の例として、例示的な1つのフレームマップを、16サイクルごとに×10{2MD}×1{RMD}と記述することができる。この例示的なフレームマップは、最初の15のそれぞれのサイクルの3つのフレーム(明期のフレームM、暗期のフレームMおよび暗期のフレームD)、および11サイクルごとの3つのフレーム(フレームR(例えば最初の未処理フレーム)、フレームMおよびフレームD)を示すことができる。
[0210]図14〜16に関して上に示した例は、配列決定期間中に集められたデータを圧縮するためのものであるが、セクションIIIにおいて上で説明したセンサセルの形成中または形成後にセンサチップから出力されたデータを圧縮する目的にそれらの技法を使用することもできることを当業者は理解するであろう。例えば、(例えば電気回路の開路/短絡を検査するために)脂質層の形成前に、2分子層の形成(例えば脂質層の薄化)中に、2分子層の形成後に、(例えばそれぞれのセルのナノ細孔の数を決定するため、または正規化のための開チャネルデータを測定するために)ナノ細孔の形成後に、および(例えば正規化のために)試料の配列決定中に、センサセルによってデータ点を測定することができる。これらのデータ点は、未処理データフレームのセットに含めて前処理装置に送ることができる。次いで、セルの状態を決定するのにダイジェストデータフレームだけを処理装置(例えばGPU1330)に送ることができるように、それらの未処理データフレームを前処理装置によって圧縮またはフィルタリングして、セル形成および配列決定プロセスの異なる段階においてセルの状態を決定するために使用することができるダイジェストデータフレームを生成することができる。セルの状態を決定する目的に使用されない可能性がある他のデータ点は処理装置に転送する必要がないことがある。
[0211]一例では、乾式検査中に、前処理装置が、それぞれのセルからの(2つの異なる未処理データフレームに含まれる)2つのデータ点間の差をとって、それぞれのセルのWPD(またはSPD、LPD、FPDおよびXPDのうちのいずれか)を含むダイジェストデータフレームを生成する。別の例では、乾式検査中に、前処理装置が、それぞれのセルからの2つのデータ点間の差をとって、それぞれのセルのSPD(またはWPD、LPD、FPDおよびXPDのうちのいずれか)を含むダイジェストデータフレームを生成する。別の例では、エレクトロポレーション中に、前処理装置が、それぞれのセルからの2つのデータ点間の差をとって、それぞれのセルのDDD(またはLPD)を含むダイジェストデータフレームを生成する。このダイジェストデータフレームを使用してセルの状態を決定することができる。
[0212]セル形成および配列決定プロセス中のさまざまな段階において、セルごとに決定される状態は例えば、乾式もしくは湿式検査段階中の開放状態もしくは短絡状態、セル内の2分子層の存在もしくは不在、セル内のナノ細孔の存在もしくは不在、または結合したタグがセルのナノ細孔に挿通されている塩基(A、T、CまたはG)を含む。セル形成および配列決定プロセス中の異なる段階においてセルの状態を決定するのに必要な、多くの異なる代替ダイジェストデータフレーム、および異なるダイジェストデータフレームの組合せを生成することができることを当業者は理解するであろう。
VII.例示的な方法
[0213]図17は、ある種の実施形態に基づく、複数(例えば100,000個以上)のDNA分子の配列を並列に決定するように構成された配列決定システムを操作する例示的な方法を示す流れ図1700である。この方法は、図13のFPGA1320などの前処理装置によって実行することができる。
[0214]ブロック1710で、配列決定システムの前処理装置(例えばFPGA1320)が、複数のセルを含むセンサチップからデータフレームのセットを受け取ることができる。それらの複数のセルのうちのそれぞれのセルを、そのセルの状態を決定するための検出信号を経時的に生成するように構成することができる。データフレームのセットのそれぞれのデータフレームは、複数のセルからの検出信号を含むことができ、異なる1つの時刻に対応することができる。いくつかの実施形態では、データフレームのセットが、複数のセルの形成中に生成されたデータフレームを含む。いくつかの実施形態では、データフレームのセットが、複数のセルの較正中または配列決定サイクル中に生成されたデータフレームを含む。セルの状態は例えば、セルの開放状態もしくは短絡状態、セル内の2分子層の存在もしくは不在、セル内のナノ細孔の存在もしくは不在、セルに関連づけられた塩基、またはこれらの任意の組合せを含むことができる。
[0215]ブロック1720で、前処理装置は、データフレームのセットの中の複数のセルの検出信号から情報を抽出して、ダイジェスト情報を取得することができる。このダイジェスト情報は、複数のセルの状態を決定する際に使用することができる。いくつかの実施形態では、ダイジェスト情報が、複数のセルのうちのそれぞれのセルについて、AC信号サイクルの明期内の最初のデータ点とAC信号サイクルの暗期内の第1のデータ点との差(すなわちFPD)を含む。いくつかの実施形態では、ダイジェスト情報が、複数のセルのうちのそれぞれのセルについて、AC信号サイクルの明期内の最後のデータ点とAC信号サイクルの暗期内の最後のデータ点との差(すなわちLPD)を含む。いくつかの実施形態では、ダイジェスト情報が、複数のセルのうちのそれぞれのセルについて、明期内の最後のデータ点と次の暗期内の最初のデータ点との差(すなわちSPDpos/neg)を含む。いくつかの実施形態では、ダイジェスト情報が、複数のセルのうちのそれぞれのセルについて、暗期内の最後のデータ点と次の明期内の最初のデータ点との差(すなわちSPDneg/pos)を含む。いくつかの実施形態では、ダイジェスト情報が、複数のセルのうちのそれぞれのセルについて、AC信号サイクルの暗期内の2つのデータ点間の差(すなわちDDD)を含む。
[0216]ブロック1730で、前処理装置は、データフレームのセットから抽出されたダイジェスト情報を含むダイジェストフレームのグループを生成することができる。このダイジェストフレームのグループの中のダイジェストフレームの数は、データフレームのセットの中のデータフレームの数よりも少ないことがある。いくつかの実施形態では、ダイジェストフレームのグループが、データフレームのセットからの1つまたは複数のデータフレームを含む。いくつかの実施形態では、前処理装置がさらに、ダイジェストフレームのグループの特性を識別するフレームマップを生成する。いくつかの実施形態では、フレームマップが、1つまたは複数の配列決定サイクルに対して生成されたダイジェストフレームを識別する。
[0217]ブロック1740で、前処理装置は、1つもしくは複数のダイジェストフレームのグループおよび/またはフレームマップを、複数のセルの状態を決定する際に使用する処理装置に送ることができる。
[0218]図17は、配列決定システムの動作を逐次プロセスとして記載しているが、それらの動作の多くは並列にまたは同時に実行することができる。加えて、動作の順序を配列しなおすこともできる。動作は、この図に含まれていない追加のステップを有することができる。いくつかの動作は任意選択であることがあり、したがって、さまざまな実施形態において省略することができる。1つのブロックに記載されたいくつかの動作を、別のブロックの動作と一緒に実行することができる。例えば、いくつかの動作を並列に実行することができる。さらに、これらの方法の実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語またはこれらの任意の組合せで実施することができる。
VIII.適応データ前処理/変換
[0219]上述のとおり、データ処理システムの前処理装置は、未処理データフレームをダイジェストデータフレームに変換して、システム内のさまざまなバスを介して送られるデータの量をかなり減らすことができる。このデータ量の低減は、さらなる処理をリアルタイムで実行することを可能にし、それによって、試験下の核酸分子中の塩基をリアルタイムで決定することを可能にしうる。したがって、システムは、少なくともある時期に、余分の帯域幅および/または処理パワーを有することができる。
[0220]いくつかのケースでは、システムが、より高い正確さ、したがって捕捉されたデータからのより多くの情報が必要であると判定する。システムは、フィードバックまたはシステムのさまざまな構成要素のステータスを前処理装置に提供して、前処理装置が、そのフィードバックおよび/またはシステムのさまざまな構成要素のステータスに基づいて、前処理装置の動作を変化させることができるようにすることができる。例えば、タグ挿入が緩慢であり、システムがフレームマップを使用しており、フレームマップが、サイクルごとに1つの未処理フレームを含み、それぞれのサイクルは、明期中の4つの未処理フレームおよび暗期中の6つの未処理フレームを含む(すなわち1サイクルあたり10個の未処理フレーム)と仮定する。他の9つの未処理フレームは無視することまたは落とすことができる。タグのドウェル時間(dwell time)が短いとシステムが判定した場合、システムは、システムがより高い正確さでタグを検出することができるように、それぞれのサイクルの10個の未処理フレームのうちの2つ以上(例えば3つ以上)の未処理フレームを含むように、フレームマップを変更することができる(すなわち落とす未処理フレームの数を減らすことができる)。タグの短いドウェル時間は例えば、ポリメラーゼの挿入速度が高められたことにより起こることがある。いくつかの実施形態では、それぞれのサイクルでより多くの未処理フレームが生成され、(落とされるのではなく)保持されるように、システムが、1サイクルあたり例えば10個よりも多くの未処理フレームを含むようにフレームマップを変更する。ドウェル時間は生化学的プロセスに依存することがある。例えば、1秒あたり1つの塩基を識別する目的に使用することができるシステムであって、ドウェルに対するしきい値が10%であるシステムについては、ドウェル時間が100msから1秒の間になるであろう。
[0221]いくつかの実施形態では、未処理データフレームが処理される手法、および試験下のサンプル中の塩基を決定するために図13のGPU1330などの処理装置に送られるデータフレームを変更するために、前処理装置が、例えば使用可能な帯域幅、受信データの品質または所望の正確さに基づいて動的にプログラムされる。例えば、処理装置が、挿通事象などの非常に少数の事象しか検出しない場合、処理装置は、より多くのダイジェストデータフレームおよび/または未処理データフレームを含むより多くのデータを求めるリクエストを前処理装置に送ることができる。例えば、前処理装置がそれまで、1サイクルあたり2つまたは3つのデータフレームを送るだけであった場合、前処理装置は、サイクルごとに4つ、6つまたはそれよりも多くのフレームを送るように要求することができ、それらのフレームは、ダイジェストデータフレーム、未処理データフレーム、またはダイジェストデータフレームと未処理データフレームの任意の組合せを含むことができる。前処理装置は、例えば1つのサイクルの明期の4つのデータ点および暗期の2つのデータ点を送るよう求められることがある。いくつかのケースでは、システムが、試料中の塩基を決定する速度が低下したと判定し、前処理装置により多くのデータを要求する。いくつかのケースでは、処理装置が余分の能力を有すると処理装置が判定し、より多くのデータをとることができ、より高い正確さのためにより多くのデータを送るよう前処理装置に要求する。
[0222]いくつかのケースでは、処理装置またはシステムの他の構成要素が能力的に十分に処理しきれない速度でデータが供給されていると、処理装置またはシステムの他の構成要素が判定したときに、処理装置またはシステムの他の構成要素が、エラー率が高まり、配列決定の品質が低下することを予想して、前処理装置によって送出されるデータの量を減らすよう求めるリクエストを前処理装置に送る。
[0223]図18は、本発明のいくつかの実施形態に基づく、適応データ処理の例示的な方法を示す流れ図1800である。この適応データ処理は、上で説明したセンサセルの形成中または形成後の異なる段階で実行することができる。ブロック1810で、図13のFPGA1320などの前処理装置が、センサチップ1310などのセンサチップから複数の未処理データフレームを受け取ることができる。いくつかの実施形態では、それらの複数の未処理データフレームが、1つまたは複数の塩基を決定するのに十分な情報を含む。例えば、それらの複数の未処理データフレームは、例えば1000個の未処理データフレームなど、毎秒受け取られる未処理データフレームを含むことがある。いくつかの実施形態では、それらの複数の未処理データフレームが、1つの期間中に、セルの開放もしくは短絡状態、セル内の2分子層の存在もしくは不在、セル内のナノ細孔の存在もしくは不在、またはセルに関連づけられた塩基を判定するのに十分な情報を含む。
[0224]ブロック1820で、前処理装置は、受け取った複数の未処理データフレームに基づいて、ダイジェストデータフレームおよび/または対応するフレームマップを、上で説明したとおりに生成することができる。生成するダイジェストデータフレームは、システムのユーザもしくはオペレータが決定し、受け取った未処理データフレームに基づいて前処理装置が動的に決定し、またはダイジェストデータフレームを使用して塩基を決定する処理装置(例えば図13のGPU1330またはホスト処理装置1340)が決定することができる。処理装置は、特定のタイプのデータフレームを要求するリクエストを前処理装置に送ることができる。ダイジェストデータフレームの例には例えば、それぞれのセルの上で説明したFDP、LDP、SPD、WPD、DDD、レールド値、(例えば中間データ点フレームM中の)中間データ点、(例えば減衰情報フレームD中の)減衰情報、(例えばファーストポイントデータフレームF中の)ファーストポイントデータ、または(例えば事象フレームE中の)事象情報を含むダイジェストデータフレームが含まれる。
[0225]ブロック1830で、前処理装置は、生成されたダイジェストデータフレームおよび/または対応するフレームマップを、PCIeバスなどのバスを介して処理装置に送ることができる。このバスは、1GBPS以上、2GBPS以上、4GBPS以上または8GBPS以上など、ダイジェストデータフレームを輸送するのに十分な帯域幅を有するものとすることができる。
[0226]ブロック1840で、処理装置は、受け取ったダイジェストデータフレームを処理して、セルの状態を、例えばフレームマップを使用して決定することができる。処理装置は例えば、1×10個、1×10個、1×10個またはそれ以上のセンサセルに関連したダイジェストデータを並列に処理することができる、1×10個、1×10個、1×10個またはそれ以上の処理コアを含むことができる。例えば、上で説明したとおり、配列決定中に、結合したタグがセルのナノ細孔に挿通された塩基および結合したタグがセルのナノ細孔から排斥された塩基を、例えば測定電圧レベル、および異なるポリメラーゼと複合体を形成した異なるタグを区別するためのカットオフ電圧レベルに基づいて決定することができる。セル形成プロセスの異なる段階中に捕捉された未処理データフレームから生成されたダイジェストデータフレームを使用して、乾式もしくは湿式検査段階中の開放状態もしくは短絡状態、セル内の2分子層の存在もしくは不在、またはセル内のナノ細孔の存在もしくは不在などの他の状態を決定することもできる。
[0227]ブロック1850で、処理装置は、異なるデータフレームが必要かどうかを判定することができる。例えば、上で説明したとおり、処理装置は、ブロック1840における処理の結果に基づいて、より多くのデータフレームが必要なのか、もしくはより少数のデータフレームが必要なのか、および/またはどのデータフレームが必要なのかを判定することができる。いくつかの実施形態では、処理装置が所望のフレームマップを決定する。
[0228]ブロック1860で、受け取ったデータフレームが適切であり、前処理装置がダイジェストデータフレームを生成する手法を変更する必要がないと処理装置が判定した場合、処理装置は、決定された塩基に関する情報を、ディスクドライブなどの記憶装置に送ることができる。
[0229]ブロック1870で、異なるデータフレームが必要であると処理装置が判定した場合、処理装置は前処理装置にリクエストを送ることができ、このリクエストは、所望のデータフレームまたは所望のフレームマップに関する情報を含むことができる。例えば、このリクエストは、より多くのデータフレームもしくはより少数のデータフレームを要求し、生成する特定のデータフレームを識別し、または所望のフレームマップを含む。
[0230]ブロック1860または1870の後、プロセスは、(あるのであれば)リクエストに基づいて、引き続き、未処理データフレームを受け取り、受け取った未処理データフレームを前処理して、ダイジェストデータフレームを生成することができる。図18は、このデータ処理を逐次プロセスとして記載しているが、それらの動作の多くは並列にまたは同時に実行することができることに留意されたい。加えて、動作の順序を配列しなおすこともできる。動作は、この図に含まれていない追加のステップを有することができる。いくつかの動作は任意選択であることがあり、したがって、さまざまな実施形態において省略することができる。1つのブロックに記載されたいくつかの動作を、別のブロックの動作と一緒に実行することができる。例えば、いくつかの動作を並列に実行することができる。さらに、これらの方法の実施形態は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語またはこれらの任意の組合せで実施することができる。
IX.コンピュータシステム
[0231]本明細書に記載されたコンピュータシステムはいずれも、適当な数のサブシステムを利用することができる。このようなサブシステムの例が図19のコンピュータシステム10に示されている。いくつかの実施形態では、コンピュータシステムが単一のコンピュータ装置を含み、その場合には、上記サブシステムを、そのコンピュータ装置の構成要素とすることができる。別の実施形態では、コンピュータシステムが、内部構成要素を含む多数のコンピュータ装置を含むことができ、それらのコンピュータ装置はそれぞれがサブシステムである。コンピュータシステムは、デスクトップおよびラップトップコンピュータ、タブレット、携帯電話ならびに他の携帯型装置を含むことができる。
[0232]図19に示されたサブシステムは、システムバス75を介して相互に接続されている。プリンタ74、キーボード78、記憶装置79、モニタ76などの追加のサブシステムが示されており、モニタ76はディスプレイアダプタ82に結合されている。入力/出力(I/O)ポート77などの当技術分野で知られている任意の数の手段(例えばUSB、FireWire(登録商標))によって、I/Oコントローラ71に結合する周辺装置および入力/出力(I/O)装置を、コンピュータシステムに接続することができる。例えば、I/Oポート77または外部インタフェース81(例えばEthernet、Wi−Fiなど)を使用して、コンピュータシステム10を、インターネットなどのワイドエリアネットワーク、マウス入力装置またはスキャナに接続することができる。システムバス75を介した相互接続は、中央処理装置73がそれぞれのサブシステムと通信すること、ならびに、中央処理装置73が、システムメモリ72または記憶装置79(例えばハードドライブなどの固定ディスクまたは光ディスク)からの複数の命令の実行およびサブシステム間の情報交換を制御することを可能にする。システムメモリ72および/または記憶装置79は、コンピュータ可読媒体を具体的に示すものであることがある。別のサブシステムは、カメラ、マイクロホン、加速度計などのデータ収集装置85である。本明細書に記載されたデータはいずれも、1つの構成要素から別の構成要素に出力することができ、またユーザに出力することができる。
[0233]コンピュータシステムは、同じ複数の構成要素またはサブシステムを含むことができ、それらは例えば、外部インタフェース81によって、内部インタフェースによって、または1つの構成要素から別の構成要素に接続し、取り外すことができる取外し可能な記憶装置を介して互いに接続されている。いくつかの実施形態では、コンピュータシステム、サブシステムまたは装置が、ネットワークを介して通信することができる。このような例では、1つのコンピュータをクライアント、別のコンピュータをサーバと考えることができ、それぞれを、同じコンピュータシステムの部分とすることができる。クライアントおよびサーバはそれぞれ、多数のシステム、サブシステムまたは構成要素を含むことができる。
[0234]実施形態の諸態様は、ハードウェア(例えば特定用途向け集積回路またはフィールドプログラマブルゲートアレイ)を使用して、および/またはコンピュータソフトウェアを、汎用的にプログラム可能な処理装置とともに、モジュール方式でもしくは統合された形で使用して、制御論理の形態で実施することができる。本明細書で使用されるとき、処理装置は、シングルコア処理装置、同じ集積チップ上のマルチコア処理装置、または単一の回路板上の多数の処理ユニットもしくはネットワーク化された多数の処理ユニットを含む。本明細書に提供された開示および教示に基づいて、当業者は、ハードウェアおよびハードウェアとソフトウェアの組合せを使用して本発明の実施形態を実施するための他の手法および/または方法を知り、理解するであろう。
[0235]本出願に記載されたソフトウェア構成要素または機能はいずれも、処理装置によって実行されるソフトウェアコードであって、例えば従来の技法またはオブジェクト指向の技法を使用する、例えばJava(登録商標)、C、C++、C#、Objective−C、Swiftまたはスクリプト言語、例えばPerlもしくはPythonなどの適当なコンピュータ言語を使用したソフトウェアコードとして実施することができる。このソフトウェアコードは、記憶および/または伝送のため、コンピュータ可読媒体上に、一連の命令またはコマンドとして記憶することができる。適当な非一時的コンピュータ可読媒体は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、磁気媒体、例えばハードドライブもしくはフロッピーディスク、または光学媒体、例えばコンパクトディスク(CD)もしくはDVD(ディジタルバーサタイルディスク)、フラッシュメモリなどを含むことができる。コンピュータ可読媒体は、このような記憶または伝送装置の任意の組合せとすることができる。
[0236]このようなプログラムはさらに、さまざまなプロトコルに準拠したインターネットを含む有線、光学および/または無線ネットワークを介して伝送されるように適合された搬送信号を使用してコード化および伝送することができる。そのため、このようなプログラムでコード化されたデータ信号を使用して、コンピュータ可読媒体を生成することができる。このプログラムコードでコード化されたコンピュータ可読媒体は、適合する装置と一緒にパッケージ化することができ、または他の装置とは別個に(例えばインターネットダウン装填によって)提供することができる。このようなコンピュータ可読媒体は、単一のコンピュータ製品(例えばハードドライブ、CDまたはコンピュータシステム全体)上または単一のコンピュータ製品内に存在してもよく、システム内またはネットワーク内の異なるコンピュータ製品上またはコンピュータ製品内に存在してもよい。本明細書に記載された結果をユーザに提供するために、コンピュータシステムは、モニタ、プリンタまたは他の適当な表示装置を含むことができる。
[0237]本明細書に記載された方法はいずれも、その全体または部分を、1つまたは複数の処理装置を含むコンピュータシステムを用いて実行することができる。この1つまたは複数の処理装置は、ステップを実行するように構成することができる。したがって、実施形態は、本明細書に記載された任意の方法のステップを実行するように構成されたコンピュータシステムを対象とすることができ、潜在的には、異なる構成要素が、対応するそれぞれのステップまたは対応するそれぞれのステップ群を実行する。番号がつけられたステップとして示されているが、本明細書の方法のステップは、同時にまたは異なる順序で実行することができる。さらに、それらのステップの一部を、他の方法の他のステップの一部とともに使用することもできる。さらに、1つのステップの全体または部分を任意選択とすることもできる。さらに、任意の方法の任意のステップを、それらのステップを実行するためのモジュール、ユニット、回路または他の手段を用いて実行することもできる。
[0238]本発明の実施形態の趣旨および範囲から逸脱することなく、特定の実施形態の特定の詳細を適当に組み合わせることができる。しかしながら、本発明の他の実施形態は、それぞれの個々の態様に関する特定の実施形態、またはそれらの個々の態様の特定の組合せに関する特定の実施形態を対象とすることがある。
[0239]「a」、「an」または「the」の使用は、そうではないとの特段の記載がない限り、「1つまたは複数の」を意味することが意図されている。「または(or)」の使用は、そうではないとの特段の記載がない限り、「包含的なまたは(inclusive or)」であること、および「排他的なまたは(exclusive or)」ではないことを意味することが意図されている。「第1の」構成要素という言及は、第2の構成要素が提供されていることを必ずしも必要としない。さらに、特に明示されていない限り、「第1の」または「第2の」構成要素という言及は、参照された構成要素を特定の位置だけに限定しない。

Claims (16)

  1. 少なくとも100,000個のDNA分子の配列を並列に決定するように構成された配列決定システムを操作する方法であって、前記方法が、前処理回路において、
    複数のセルを含むセンサチップからデータフレームの第1のセットを受け取るステップであり、前記複数のセルのうちのそれぞれのセルが、そのセルの状態を決定するための検出信号を経時的に生成するように構成されており、それぞれのデータフレームが、前記複数のセルからの検出信号を含み、異なる1つの時刻に対応する、前記ステップと、
    データフレームの前記第1のセットの中の前記複数のセルの前記検出信号から情報を抽出して、前記複数のセルの前記状態を決定する際に使用する第1のダイジェスト情報を取得するステップと、
    データフレームの前記第1のセットから抽出された前記第1のダイジェスト情報を含む1つまたは複数のダイジェストフレームの第1のグループを生成するステップであり、1つまたは複数のダイジェストフレームの前記第1のグループにおけるダイジェストフレームの数が、データフレームの前記第1のセットにおけるデータフレームの数よりも少ない、前記ステップと、
    1つまたは複数のダイジェストフレームの前記第1のグループを、前記複数のセルの前記状態を決定する際に使用する処理装置に送るステップと
    を実行することを含む、前記方法。
  2. 1つまたは複数のダイジェストフレームの前記第1のグループが、データフレームの前記第1のセットからの1つまたは複数のデータフレームを含む、請求項1に記載の方法。
  3. セルの前記状態が、
    前記セルの開放状態もしくは短絡状態、
    前記セル内の2分子層の存在もしくは不在、
    前記セル内のナノ細孔の存在もしくは不在、
    前記セルに関連づけられた塩基、または
    これらの任意の組合せ
    からなる群から選択された、請求項1に記載の方法。
  4. データフレームの前記第1のセットが、前記複数のセルの形成中に生成された、前記センサチップからのデータフレームを含む、請求項1に記載の方法。
  5. データフレームの前記第1のセットが、前記複数のセルの較正中に生成された、前記センサチップからのデータフレームを含む、請求項1に記載の方法。
  6. データフレームの前記第1のセットが、配列決定サイクルにおいて生成された、前記センサチップからのデータフレームを含む、請求項1に記載の方法。
  7. データフレームの前記第1のセットが、多数の配列決定サイクルにおいて生成された、前記センサチップからのデータフレームを含む、請求項1に記載の方法。
  8. 1つまたは複数のダイジェストフレームの前記第1のグループの特性を識別するフレームマップを生成するステップをさらに含む、請求項1に記載の方法。
  9. 前記センサチップからのデータフレームの第2のセットを使用して1つまたは複数のダイジェストフレームの第2のグループを生成するよう求めるリクエストを受け取るステップと、
    前記リクエストに基づいて、データフレームの前記第2セットの中の前記複数のセルの前記検出信号から情報を抽出して、前記複数のセルの前記状態を決定する際に使用する第2のダイジェスト情報を取得するステップと、
    データフレームの前記第2のセットから抽出された前記第2のダイジェスト情報を含む1つまたは複数のダイジェストフレームの前記第2のグループを生成するステップと、
    1つまたは複数のダイジェストフレームの前記第2のグループを前記処理装置に送るステップと
    をさらに含む、請求項1に記載の方法。
  10. 前記検出信号が、1つまたは複数のAC信号サイクル内のデータ点を含み、それぞれのAC信号サイクルが明期および暗期を含み、前記検出信号が、前記1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの明期内の1つまたは複数のデータ点と、前記1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの暗期内の1つまたは複数のデータ点とを含み、
    前記1つまたは複数のダイジェストフレームのうちのそれぞれのダイジェストフレームが、前記複数のセルのうちのそれぞれのセルについて、
    AC信号サイクルの前記明期内の最初のデータ点と前記AC信号サイクルの前記暗期内の第1のデータ点との差、
    AC信号サイクルの前記明期内の最後のデータ点と前記AC信号サイクルの前記暗期内の最後のデータ点との差、
    明期内の最後のデータ点と次の暗期内の最初のデータ点との差、
    暗期内の最後のデータ点と次の明期内の最初のデータ点との差、または
    AC信号サイクルの暗期内の2つのデータ点間の差
    を含む、
    請求項1に記載の方法。
  11. センサチップからの出力データを処理するための装置であって、前記装置が、
    前処理回路と、
    前記前処理回路に結合されたメモリと
    を備え、
    前記前処理回路が、前記センサチップからデータフレームの第1のセットを受け取るように構成されており、前記センサチップが複数のセルを含み、前記複数のセルのうちのそれぞれのセルが、そのセルの状態を決定するための検出信号を経時的に生成するように構成されており、それぞれのデータフレームが、前記複数のセルからの検出信号を含み、異なる1つの時刻に対応し、
    前記前処理回路がさらに、データフレームの前記第1のセットのうちの少なくともいくつかを前記メモリに記憶するように構成されており、
    前記前処理回路がさらに、データフレームの前記第1のセットの中の前記複数のセルの前記検出信号から情報を抽出して、前記複数のセルの前記状態を決定するための第1のダイジェスト情報を取得するように構成されており、
    前記前処理回路がさらに、データフレームの前記第1のセットから抽出された前記第1のダイジェスト情報を含む1つまたは複数のダイジェストフレームの第1のグループを生成するように構成されており、1つまたは複数のダイジェストフレームの前記第1のグループにおけるダイジェストフレームの数が、データフレームの前記第1のセットにおけるデータフレームの数よりも少なく、
    前記前処理回路がさらに、1つまたは複数のダイジェストフレームの前記第1のグループを、前記複数のセルの前記状態を決定する際に使用する処理装置に送るように構成されている、
    前記装置。
  12. 前記前処理回路が、フィールドプログラマブルゲートアレイ(FPGA)、システムオンチップ(SoC)、特定用途向け集積回路(ASIC)、プログラマブルアレイロジック(PAL)、またはコンプレックスプログラマブルロジックデバイス(CPLD)を含む、請求項11に記載の装置。
  13. 前記前処理回路がさらに、1つまたは複数のダイジェストフレームの前記第1のグループの特性を識別するフレームマップを生成するように構成された、請求項11に記載の装置。
  14. セルの前記状態が、
    前記セルの開放状態もしくは短絡状態、
    前記セル内の2分子層の存在もしくは不在、
    前記セル内のナノ細孔の存在もしくは不在、
    前記セルに関連づけられた塩基、または
    これらの任意の組合せ
    から選択された、請求項11に記載の装置。
  15. データフレームの前記第1のセットが、前記複数のセルの形成中または1つもしくは複数の配列決定サイクル中に生成された、前記センサチップからのデータフレームを含む、
    請求項11に記載の装置。
  16. 前記検出信号が、1つまたは複数のAC信号サイクル内のデータ点を含み、それぞれのAC信号サイクルが明期および暗期を含み、前記検出信号が、前記1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの明期内の1つまたは複数のデータ点と、前記1つまたは複数のAC信号サイクルのうちのそれぞれのAC信号サイクルの暗期内の1つまたは複数のデータ点とを含み、
    前記1つまたは複数のダイジェストフレームのうちのそれぞれのダイジェストフレームが、前記複数のセルのうちのそれぞれのセルについて、
    AC信号サイクルの前記明期内の最初のデータ点と前記AC信号サイクルの前記暗期内の第1のデータ点との差、
    AC信号サイクルの前記明期内の最後のデータ点と前記AC信号サイクルの前記暗期内の最後のデータ点との差、
    明期内の最後のデータ点と次の暗期内の最初のデータ点との差、
    暗期内の最後のデータ点と次の明期内の最初のデータ点との差、または
    AC信号サイクルの暗期内の2つのデータ点間の差
    を含む、請求項11に記載の装置。
JP2019531973A 2016-12-15 2017-12-14 適応ナノ細孔信号圧縮 Active JP6770197B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662435033P 2016-12-15 2016-12-15
US62/435,033 2016-12-15
PCT/EP2017/082872 WO2018109102A1 (en) 2016-12-15 2017-12-14 Adaptive nanopore signal compression

Publications (2)

Publication Number Publication Date
JP2020504816A true JP2020504816A (ja) 2020-02-13
JP6770197B2 JP6770197B2 (ja) 2020-10-14

Family

ID=60935809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019531973A Active JP6770197B2 (ja) 2016-12-15 2017-12-14 適応ナノ細孔信号圧縮

Country Status (5)

Country Link
US (2) US11139047B2 (ja)
EP (1) EP3555306B1 (ja)
JP (1) JP6770197B2 (ja)
CN (2) CN116515973A (ja)
WO (1) WO2018109102A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017223515A1 (en) * 2016-06-23 2017-12-28 F. Hoffman-La Roche Ag Formation and calibration of nanopore sequencing cells
WO2018029108A1 (en) * 2016-08-08 2018-02-15 F. Hoffmann-La Roche Ag Basecalling for stochastic sequencing processes
CN116515973A (zh) * 2016-12-15 2023-08-01 豪夫迈·罗氏有限公司 自适应纳米孔信号压缩
US11580413B2 (en) 2017-09-01 2023-02-14 Seagate Technology Llc Recovering timing information from DNA encoded data
WO2020002516A1 (en) 2018-06-27 2020-01-02 F. Hoffmann-La Roche Ag Multiplexing analog component in biochemical sensor arrays
WO2020103126A1 (zh) * 2018-11-23 2020-05-28 深圳华大智造科技有限公司 基因测序反应平台、测序芯片及相关方法、系统
EP3894056A2 (en) * 2018-12-11 2021-10-20 F. Hoffmann-La Roche AG Systems and methods for self-limiting protein pore insertion in a membrane
CN112731254B (zh) * 2021-03-31 2021-07-13 北京齐碳科技有限公司 电流测量电路校准参数的确定方法、装置、系统及设备
US20240017061A1 (en) * 2022-02-25 2024-01-18 Inovio Pharmaceuticals, Inc. Handheld Electroporation Devices, And Related Systems And Methods

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292062A (ja) * 1995-04-21 1996-11-05 Syst Design K:Kk 測定装置
JP2013519088A (ja) * 2010-02-08 2013-05-23 ジニア・テクノロジーズ・インコーポレーテッド ナノ細孔内の分子を操作するためのシステムおよび方法
JP2016504019A (ja) * 2012-11-09 2016-02-12 ジェニア・テクノロジーズ・インコーポレイテッド タグを用いた核酸の配列決定
JP2016504593A (ja) * 2013-02-05 2016-02-12 ジェニア・テクノロジーズ・インコーポレイテッド ナノポアアレイ
WO2016073318A1 (en) * 2014-11-05 2016-05-12 Genia Technologies, Inc. Exporting measurements of nanopore arrays
WO2016099673A1 (en) * 2014-12-19 2016-06-23 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6936433B2 (en) * 2000-11-27 2005-08-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US6853444B2 (en) * 2002-08-30 2005-02-08 Waleed S. Haddad Non-contact optical imaging system for biometric identification
US7298293B2 (en) * 2005-06-03 2007-11-20 Sarukkai R. Narayanan Method for encoding data
US20110008775A1 (en) * 2007-12-10 2011-01-13 Xiaolian Gao Sequencing of nucleic acids
CN102132495B (zh) * 2008-05-15 2015-04-29 皇家飞利浦电子股份有限公司 用于压缩和解压缩图像数据组的方法、设备
CN102282586B (zh) * 2009-01-19 2017-05-10 诺基亚技术有限公司 用于减少图像数据的大小的方法和装置
US8926904B2 (en) * 2009-05-12 2015-01-06 Daniel Wai-Cheong So Method and apparatus for the analysis and identification of molecules
JP5428835B2 (ja) * 2009-12-21 2014-02-26 富士通株式会社 署名装置、署名方法、および署名プログラム
US8965076B2 (en) * 2010-01-13 2015-02-24 Illumina, Inc. Data processing system and methods
US9605307B2 (en) * 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
JP5621675B2 (ja) * 2011-03-18 2014-11-12 富士通株式会社 署名装置、署名方法、および署名プログラム
JP6573899B2 (ja) * 2013-11-17 2019-09-11 クアンタム−エスアイ インコーポレイテッドQuantum−Si Incorporated 分子をプローブし、検出し、及び分析するための、外部光源を備えた集積デバイス
US9965586B2 (en) * 2014-03-20 2018-05-08 The Regents Of The University Of California Noise reduction methods for nucleic acid and macromolecule sequencing
US10006899B2 (en) * 2014-03-25 2018-06-26 Genia Technologies, Inc. Nanopore-based sequencing chips using stacked wafer technology
GB2530012A (en) * 2014-08-05 2016-03-16 Illumina Cambridge Ltd Methods and systems for data analysis and compression
US9863904B2 (en) 2014-12-19 2018-01-09 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US10935512B2 (en) 2015-09-24 2021-03-02 Roche Sequencing Solutions, Inc. Encoding state change of nanopore to reduce data size
CN105695318B (zh) * 2016-02-24 2018-10-23 严媚 一种纳米孔基因检测传感器芯片
US10155979B2 (en) 2016-03-30 2018-12-18 Roche Molecular Systems, Inc. Non-destructive bilayer monitoring using measurement of bilayer response to electrical stimulus
US10465240B2 (en) 2016-03-30 2019-11-05 Roche Sequencing Solutions, Inc. Electrical enhancement of bilayer formation
US11124827B2 (en) * 2016-06-23 2021-09-21 Roche Sequencing Solutions, Inc. Period-to-period analysis of AC signals from nanopore sequencing
WO2017223515A1 (en) 2016-06-23 2017-12-28 F. Hoffman-La Roche Ag Formation and calibration of nanopore sequencing cells
CN116515973A (zh) * 2016-12-15 2023-08-01 豪夫迈·罗氏有限公司 自适应纳米孔信号压缩
US10921284B2 (en) * 2017-04-19 2021-02-16 Roche Sequencing Solutions, Inc. Phased nanopore array

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292062A (ja) * 1995-04-21 1996-11-05 Syst Design K:Kk 測定装置
JP2013519088A (ja) * 2010-02-08 2013-05-23 ジニア・テクノロジーズ・インコーポレーテッド ナノ細孔内の分子を操作するためのシステムおよび方法
JP2016504019A (ja) * 2012-11-09 2016-02-12 ジェニア・テクノロジーズ・インコーポレイテッド タグを用いた核酸の配列決定
JP2016504593A (ja) * 2013-02-05 2016-02-12 ジェニア・テクノロジーズ・インコーポレイテッド ナノポアアレイ
WO2016073318A1 (en) * 2014-11-05 2016-05-12 Genia Technologies, Inc. Exporting measurements of nanopore arrays
WO2016099673A1 (en) * 2014-12-19 2016-06-23 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus

Also Published As

Publication number Publication date
US11139047B2 (en) 2021-10-05
EP3555306A1 (en) 2019-10-23
WO2018109102A1 (en) 2018-06-21
US20220005549A1 (en) 2022-01-06
JP6770197B2 (ja) 2020-10-14
EP3555306B1 (en) 2023-01-18
CN116515973A (zh) 2023-08-01
CN110268045B (zh) 2023-02-21
US20180173844A1 (en) 2018-06-21
CN110268045A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
JP2020504816A (ja) 適応ナノ細孔信号圧縮
US11892444B2 (en) Formation and calibration of nanopore sequencing cells
CN109952382B (zh) 随机测序方法的碱基识别
JP7366073B2 (ja) バイオケミカルセンサアレイの多重化アナログ構成要素
JP2019527819A (ja) ナノポア配列決定からのac信号の定期分析
CN109791138B (zh) 纳米孔电压方法
US20200283844A1 (en) Normalization and baseline shift removal by rotation in added data dimensions
CN111212919B (zh) 纳米孔测序单元中的双电层电容的测量
CN115485553A (zh) 用于使用捕获的电荷形成双层以及以纳米孔阵列插入孔的系统和方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200924

R150 Certificate of patent or registration of utility model

Ref document number: 6770197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250