JP2015509710A - ポリマーの測定の解析 - Google Patents

ポリマーの測定の解析 Download PDF

Info

Publication number
JP2015509710A
JP2015509710A JP2014557122A JP2014557122A JP2015509710A JP 2015509710 A JP2015509710 A JP 2015509710A JP 2014557122 A JP2014557122 A JP 2014557122A JP 2014557122 A JP2014557122 A JP 2014557122A JP 2015509710 A JP2015509710 A JP 2015509710A
Authority
JP
Japan
Prior art keywords
polymer
feature vector
measurement
measurements
derived
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014557122A
Other languages
English (en)
Other versions
JP2015509710A5 (ja
JP6226888B2 (ja
Inventor
ウィリアム レイド,スチュアート
ウィリアム レイド,スチュアート
アンソニー クラーク,ジェームス
アンソニー クラーク,ジェームス
ホワイト,ジェームス
ハーパー,ギャヴィン
Original Assignee
オックスフォード ナノポール テクノロジーズ リミテッド
オックスフォード ナノポール テクノロジーズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オックスフォード ナノポール テクノロジーズ リミテッド, オックスフォード ナノポール テクノロジーズ リミテッド filed Critical オックスフォード ナノポール テクノロジーズ リミテッド
Publication of JP2015509710A publication Critical patent/JP2015509710A/ja
Publication of JP2015509710A5 publication Critical patent/JP2015509710A5/ja
Application granted granted Critical
Publication of JP6226888B2 publication Critical patent/JP6226888B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48785Electrical and electronic details of measuring devices for physical analysis of liquid biological material not specific to a particular test method, e.g. user interface or power supply
    • G01N33/48792Data management, e.g. communication with processing unit
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y15/00Nanotechnology for interacting, sensing or actuating, e.g. quantum dots as markers in protein assays or molecular motors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/02Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6875Nucleoproteins
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Nanotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Cell Biology (AREA)
  • Human Computer Interaction (AREA)
  • Optics & Photonics (AREA)
  • Databases & Information Systems (AREA)
  • Electrochemistry (AREA)

Abstract

ナノ細孔を経るポリマーの輸送中に行われるポリマーの測定の時間順序系列を解析する。測定は、ナノ細孔中のkマーの同一性に依存し、kマーは、ポリマーのk個のポリマー単位であり、kは、正の整数である。該方法は、測定の系列から、測定の特性を表す時系列的特徴の特徴ベクトルを導出するステップと、導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの類似性を判定するステップとを含む。

Description

本発明は、一般的に、ナノ細孔を経るポリマーの輸送中に行われる、ポリマー単位を含むポリマー、例えば、制限なく、ポリヌクレオチドの測定を解析する分野に関する。
ナノ細孔測定は、一般的に膜を用いて溶液の2つのプールの間の物質の流れを制限することによって行われる。孔は、溶液の1つのプールから他への物質の輸送を可能にするために当膜内に備えられている。孔は、ナトメートルサイズの少なくとも1つの寸法を有する。物質が細孔を経て輸送されるとき、当物質の測定が行われる。最も一般的に用いられている装置構成は、分子種をナノ細孔に通すための印加電位の印加に依拠する。電極が各溶液本体に入れられ、溶液は、電解質、一般的に1M NaClなどの塩を含む。電極間の印加電位も、電解質に孔を通過させ、電流を発生させる。物質が孔を通過するとき、物質は、電流測定において直接観測されるイオンの流れを変化させる。電流遮断の程度及び物質がナノ細孔中で費やす存続時間は、その同一性を示す。
ポリマーをナノ細孔に通すことによりポリマーを解析する最初の概念は、1996年にBrantonら(米国特許第5,795,782号)により提案された。この場合、DNA分子を液膜に埋め込まれたナノ細孔に通す。電極を膜の各側に設置し、印加電位を用いて、DNA分子を膜の1つの側から他に駆動する。DNA分子の輸送中に、孔を経る膜貫通電流を測定する。異なる配列のDNAは、DNAがナノ細孔を通過するときに異なる観測電流を生じさせることが示された。これらの初期の実験は、ポリマーがナノ細孔に自由に移動するヌクレオチドのホモポリマーを用いて実施された。これらの実験においては、ポリマーの輸送の速度が非常に速く(約5μ秒/塩基)、そのため、ポリマー内の個々のヌクレオチドの特性を決定することが困難である。
迅速なDNA輸送の限界を克服するために、Brantonらは、ナノ細孔を通るDNAの輸送の速度を制御するためのポリメラーゼの使用を開示している。この的確な解決策は、当分野の多くの研究者により採用され、適応され、これが多くの刊行物につながった。基本的概念は、分子モーター又は分子ブレーキを含み得る、ポリマーの運動に対する歯止めを設けることである。
初期の研究は、DNAの運動を制御するためのポリメラーゼの使用に集中していた。クレノウ断片を用いて多くの研究が行われたが、これらの実験は、ナノ細孔の上部におけるDNA−酵素複合体の短い存続時間によって制限された。この弱い結合を補償するために多くのスキームが開発された(例えば、Olasagastiら、Nat Nanotechnol.、2010年11月、5巻(11号)、798〜806頁、Ashkenasyら、Angew Chem Int Ed Engl.、2005年2月、44巻(9号)、1401〜4頁)。
2010年に、Phi29 DNAポリメラーゼ(DNAP)がナノ細孔の上部で機能し得ることがAkesonらによって開示された(例えば、Liebermanら、J. Am Chem Soc.、2010年12月22日、132号(50巻)、17961〜72、61/402、903)。鋳型DNAに対するPhi29DNAPの結合の強さは、複数の酵素サイクルをナノ細孔の上部で行わせることを可能にし、DNAが引かれて、歯止めがかけられた状態でナノ細孔を通過させることを可能にするのに十分であった。本論文は、酵素の運動が抑制された条件下でナノ細孔を経るDNAの運動を制御するためにPhi29DNAPを用いることができたことも明らかにした。これらの条件では、酵素活性に不可欠であるMg2+は、金属キレート化剤エチレンジアミン四酢酸(EDTA)の添加により効率的に除去される。印加電位は、DNA鎖に対して力をもたらし、Phi29DNAPは、細孔中の鎖の「アンジッピング(unzipping)」を制限した。この研究で、ナノ細孔系における酵素が分子モーターとして又は分子ブレーキとして機能し得ることが示された。
ポリメラーゼを分子歯止めとして用いることに加えて、ナノ細孔中のポリヌクレオチドの制御された移動を可能にするためにいくつかのヘリカーゼファミリーを用いることができる(例えば、米国特許出願公開第61/549,998号(N115020)、米国特許出願公開第61/581,332号(N115505)、米国特許出願公開第61/581,340号(N115506))。ヘリカーゼは、それらをナノ細孔系に適するものにする多くの特性を有する。
標的1本鎖DNAの輸送を減速させる代替方法は、標的鎖の長さに沿ってssDNAのさらなる部分をハイブリダイズすること(hyb−DNA)である。DNAの標的鎖は、印加電位のもとで細孔を通して速やかに供給される。鎖の2本鎖部分がナノ細孔の狭窄部に到達したならば、鎖の輸送は、中断され、電流が定位置のポリマーにより読み取られることが可能となる。hyb−DNA部分は、印加電界の力によりアンハイブリダイズされ(un-hybridised)、標的DNA鎖は、他のhyb−DNAに遭遇するまで、ナノ細孔を転位し続ける。このようにして、多くの定位置におけるDNA鎖の電流シグネチャ(current signatures)が得られる。複雑な試料調製技術を用いることにより、Derringtonらは、このアプローチを用いたDNAの鎖の配列を決定する方法を提案している。これらのアプローチから得られたデータは、以下の重要な特徴を共有する。DNAの輸送は、個別的段階で起こり、各段階は、ナノ細孔中のポリマーの位置を表し、各ポリマーの位置は、特有の電流レベルを有する。電流レベルは、分散と呼ばれる、変動を時折示し得る。これらの特徴は、「ノイズの多いステップ波」の形をとるシグナルをもたらす。
より一般的には、システムのいくつかの特性は、ナノ細孔中のポリマー単位及び行われる当特性の測定に依存する。例えば、測定システムは、絶縁膜にナノ細孔を配置し、分析対象分子の存在下でナノ細孔を経る電圧駆動イオン輸送を測定することによって構築することができる。ナノ細孔を経るポリマーの制御された移動は、ポリマーの配列を示す多くの異なるレベルの測定をもたらす。
以前の開発において、焦点は、ポリマーの基礎をなす配列を決定することに合わせられた。一般的にこれらのアプローチにおいては、信号内の状態のそれぞれは、これらの状態の電流レベルを参照データからの既知電流レベルと比較することによって独立に解析した。この方法は、電流信号をポリマー配列の推定に変換するものである。これを述べる代替的方法は、該方法が情報を信号空間から配列空間に変換するということである。しかし、配列を確実に決定することができる測定システムを開発するうえで実際的な困難がある。
各測定の値がk個のポリマー単位の群に依存することは、現在公知のナノ細孔の大部分を含む、多くの種類の測定システムに特有のものである。ここで、kは、複数の整数であり、k個のポリマー単位は、以後、「kマー」と呼ぶ。これは、複数のポリマー単位が観測イオン電流に寄与しており、測定システムが測定されるポリマー単位より大きい「ブラントリーダーヘッド(blunt reader head)」を有すると概念的に考えられるためである。そのような状況では、分解される異なるkマーの数は、k乗増加する。例えば、n個の可能なポリマー単位が存在する場合、分解される異なるkマーの数は、nである。異なるkマーの測定の間に明らかな分離があることが望ましいが、これらの測定の一部が重複することは一般的である。特にkマーの数が高い場合、異なるkマーによってもたらされる測定を分解することが困難となり得る。これは、ポリマーに関する情報、例えば、ポリマー単位の基礎をなす配列の推定を得るのに不利となる。
多くの研究が、単一ポリマー単位に依存する分解可能な測定を可能とする測定システムの設計を目的とした。しかし、例えば、基礎をなす物理的若しくは生物学的システムにおける固有の変動及び/又は測定される特性の大きさが小さいため不可避である測定ノイズにより様々な程度に生じ得る測定の変動のため、これは、実際には困難であることが証明された。他の研究は、kマーに依存する測定を受け入れたが、異なるkマーからの測定が互いから分解可能である測定システムの設計を目的とした。しかし、実際的な限界は、これが非常に困難であることを再び意味している。いくつかの異なるkマーによってもたらされるシグナルの分布は、しばしば重複し得る。
本発明によれば、ナノ細孔を経るポリマーの輸送中に行われるポリマーの測定の時間順序系列を解析する方法であって、測定が、ナノ細孔中のkマーの同一性に依存し、kマーがポリマーのk個のポリマー単位であり、kが正の整数であり、該方法が、
測定の系列から、測定の特性を表す時系列的特徴の特徴ベクトルを導出するステップと、
導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの類似性を判定するステップと
を含む、方法を提供する。
以前の研究で、測定から正確な配列を得ようと試みたが、本発明は、多くの応用が正確なポリマー配列を決定することを必要としないという正しい認識を活用している。これらは、配列情報に頼らずに、所望の結果を安価に、迅速に、且つより高度の正確さで得ることができるかなりの数の診断、臨床、科学、遺伝学的応用を含む。特に、本発明は、測定の特性を表す時系列的特徴の特徴ベクトルの導出(derivation)を含む。導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの類似性を次に判定し、これにより、多くの応用において有用である情報が提供される。
したがって、本発明は、ポリマー配列の決定を必要としない。すなわち、測定信号の配列空間への変換が必ずしも存在しない。配列におけるすべての単一ポリマー単位を分解することは必要でないため、これは、多くの応用におけるポリマーの有用な解析を可能にするが、測定システムの運用への負担を少なくするものである。測定システムの制約に関するこの低減は、測定システムの範囲も増大させる。これにより、設計又は運用することがより容易である測定システムの使用が可能となり得る、或いは、完全な配列情報を提供することができなくても、ポリマーの特定の特性を解析するように具体的に適応される測定システムの使用が可能となり得る。
本発明の基礎をなす特徴は、生信号、すなわち、測定の時間順序系列を時系列的特徴の特徴ベクトルに変換することである。測定の系列は、ポリマーがナノ細孔を経て移動するときに得られ、したがって、これが完全でないとしても、全体的な配列に関する情報を提供する。特徴ベクトルの導出は、時系列的でもあるが、削減されたデータセットを有する表現をもたらす。この特徴ベクトルは、ポリマーの「シグネチャ」と考えることができる。次に特徴ベクトルを少なくとも1つの他の特徴ベクトルと比較して、類似性を判定する。少なくとも1つの他の特徴ベクトルは、例えば、記憶装置に保存された特徴ベクトル又は同じ方法で得られた他の特徴ベクトルであってもよい。類似性に基づいて、ポリマーの特性を得ることができる。
いくつかの信号について、連続的測定の群が各群について異なる各kマーに依存する、各kマーの十分な分解能が存在する。この場合、特徴ベクトルを導出するステップは、連続的測定の群を識別するステップ、及び各群について、群の測定の特性を表す1つ又は複数の特徴の値を導出するステップを含み得る。例えば、特徴は、測定の群の平均、測定の群の期間、測定の群の分散、測定の群の分布又はそれらのいずれかの組合せを含み得る。
本発明は、いくつかのkマーが1つの測定のみをもたらす又は測定を全くもたらさない可能性があるような、より小さい分解能を有する信号にも適用することができる。
上述のように、いくつかの場合に、導出された特徴ベクトルは、少なくとも1つのクラスについて記憶装置に保存された少なくとも1つの他の特徴ベクトルと比較することができる。この場合、類似性は、導出された特徴ベクトルの全体若しくは一部と記憶装置に保存された少なくとも1つの他の特徴ベクトルの全体との間で、又は別法として導出された特徴ベクトルの全体若しくは一部と記憶装置に保存された少なくとも1つの他の特徴ベクトルの一部との間で判定することができる。
本方法は、導出された特徴ベクトルが導出されるポリマーを、判定された類似性に基づいて前記クラスに属するものとして分類するステップをさらに含み得る。これは、検討中のポリマーの同定を可能にする。
記憶装置に保存された少なくとも1つの他の特徴ベクトルは、測定されるポリマーに応じて選択することができる。又は別法として、記憶装置に保存された複数の他の特徴ベクトルのライブラリを用いることができる。
いくつかの応用において、複合特徴ベクトルを、重複領域を有する2つ以上の特徴ベクトルから得ることができ、この場合、導出された特徴ベクトルの類似性は、複合特徴ベクトル間で判定される。複合特徴ベクトルの非重複領域は、例えば、導出された特徴ベクトルの特定の局所領域を同定するために、導出された特徴ベクトル間の類似性を判定するのに用いることができる。
したがって、本方法は、導出された特徴ベクトルの連続又は非連続領域と1つ又は複数の特徴ベクトルとの間の類似性を判定するのに用いることができる。
いくつかの応用において、導出された特徴ベクトルの複数の部分を保存された特徴ベクトルのすべて、部分又は複数の部分と比較することができる。
上述のように、他の場合に、導出された特徴ベクトルは、同じ方法を用いて導出された特徴ベクトルである少なくとも1つの他の特徴ベクトルと比較することができる。これは、検討中の複数のポリマーの特性の互いに対する同定を可能にする。この場合、本方法は、類似の特徴ベクトルのクラスターをクラスとして同定するステップと、特徴ベクトルが導出されるポリマーを同定されたクラスに属するものとして分類するステップとをさらに含み得る。
1つの例において、同じ方法を用いて導出された複数の他の特徴ベクトルが存在する場合、本方法は、特徴ベクトルの重複部分の類似性に基づく共通ポリマーの断片であるポリマーから導出される特徴ベクトルを同定するステップをさらに含み得る。
ポリマーが分類される場合、本方法は、異なるクラスに属する特徴ベクトルの数を数えるステップをさらに含み得る。これは、検討中のポリマーの集団の解析を可能にする。
ポリマーが分類される場合、本方法は、導出された特徴ベクトルが、ポリマーが属すると分類されるクラスについて特徴ベクトルと異なる局所領域を同定するステップをさらに含み得る。
ポリマーが予測される同一性を有する類似の技術において、導出された特徴ベクトルは、記憶装置に保存された特徴ベクトルと比較することができ、類似性の判定は、導出された特徴ベクトルが記憶装置に保存された少なくとも1つの他の特徴ベクトルと異なる局所領域を決定するステップを含む。
導出された特徴ベクトルが予測されるものと異なる局所領域のそのような同定は、ポリマーの長い配列の比較的に小さな領域の変化が重要である多くの応用において非常に強力である解析技術を提供する。そのような技術の1つの例は、ポリヌクレオチドであるポリマーにおける突然変異を同定することである。
本方法は、以前に行われた測定の系列について実施することができる。或いは、本方法は、ポリマーをナノ細孔を経て輸送するステップ及びポリマーの連続的な系列の測定を行うステップをさらに含み得る。
測定の系列を解析する方法は、解析に基づき標的ポリマーの存在、非存在又は量を推定する方法に用いることができる。
その場合、ポリマーは、2つ以上のポリマーの混合物を含んでいてもよく、1つ又は複数のポリマーの相対量を決定することができる。
標的ポリマーの存在、非存在又は量を推定する方法は、ポリマー分析対象物をポリマーに断片化するステップと、断片化ポリマーについて推定する方法を実施するステップとを含む方法におけるポリマー分析対象物に対して適用することができる。ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである場合、ポリマー分析対象物は、制限酵素により断片化することができる。
測定の系列を解析する方法は、ポリマーを一定の期間にわたってナノ細孔を経て繰返し輸送するステップと、各輸送中に、ポリマーの連続的な系列の測定を行うステップと、測定の各系列を解析するステップとを含む、ポリマーにおける変化を判定する方法に適用することができる。この場合、導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの間の類似性を判定するステップは、(a)測定の各系列から得られた導出特徴ベクトルと同じ少なくとも1つの他の特徴ベクトルとの間の類似性を判定するステップ又は(b)測定の系列から得られたすべての導出特徴ベクトルの間の類似性を判定するステップを含み得る。
ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである場合、本方法は、修飾塩基又は点突然変異の存在を判定するために用いることができる。
一般的に、本方法は、治療若しくは診断の指針とするために又は個人を同定するために用いることができる。
本発明は、多くの応用を有する。いくつかの非制限的例又は応用は、以下の通りである。
本発明は、ポリマーの解析のための単一分子ラベルフリー検出システム、例えば、ナノ細孔システムに適用することができる。そのようなシステムが、所定のポリマー位置における複数のモノマー単位による影響を受ける認識要素を含むことが一般的である。これらのシステムにおいて、測定とポリマー配列との関係を引き出すことは、困難ではあるが有益な又は資源デマンディング(resource demanding)であり得る。
本発明は、ポリマーシグネチャが当ポリマーの特性を示し、前記特性を確定するために正確なポリマー配列を知る必要がない、ポリマー解析システムに適用することができる。例は、一塩基多型(SNP)の検出、特定の配列の存在又は非存在、ポリマー配列の分類及び計数、ラベル及びバイオマーカーの設計、並びに修飾又は損傷DNAの同定を含むが、これらに限定されない。
本方法は、例えば、試料中の標的ポリマー分析対象物の存在、非存在又は量を確定するために用いることができる。本方法は、閾値を基準として量を測定するために用いることができる。本方法は、ポリマーの混合物中の1つ又は複数の標的ポリマーの相対量を決定するために用いることができる。
本方法は、単一試料の解析に基づき治療又は診断の指針とするために用いることができる。或いは、本方法は、例えば、個人の疾患の進行又は改善をモニターするために一定の期間にわたり複数回実施することができる。本方法は、例えば、セラノスティックとして用いる場合、治療の有効性をモニターするために用いることができる。
本方法は、例えば、短縦列反復、可変縦列反復などの存在を判定することにより、個人のDNAプロファイリングのために、個人の遺伝子指紋法のために、例えば、ミトコンドリアDNAにおけるSNPを検出するために法医学的応用に用いることができる。
すべての方法は、ポリマーのポリマー単位の配列を推定せずに実施することができる。
より十分な理解を得るために、本発明の実施形態を非限定的な例として以下の添付図面を参照して述べるものとする。
ナノ細孔を含む測定システムの概略図である。 測定システムにより経時的に測定された事象の信号のプロットを示す図である。 ナノ細孔を含む測定システムにおける2種のポリヌクレオチドの測定の度数分布のグラフである。 実験的に得られた電流測定値の組に適用した一次線形モデルからの予測値に対する643マー係数のプロットを示す図である。 実験的に得られた電流測定値の組に適用した一次線形モデルからの予測値に対する10245マー係数のプロットを示す図である。 ポリマーの測定を含む入力信号を解析する方法のフローチャートである。 図6の状態検出ステップのフローチャートである。 状態検出ステップに供した入力信号のプロットを示す図である。 得られた測定の系列のプロットを示す図である。 図6の類似性の判定ステップの例のフローチャートである。 図6の類似性の判定ステップの例のフローチャートである。 方法の実施例2における、それらの重複により同定された配列の3つの断片の特徴ベクトルのプロットを示す図である。 実施例2におけるすべてのライブラリ配列と比較した候補分子の類似性スコアのプロットを示す図である。 実施例2における最良適合ライブラリ分子と整列させた候補分子のプロットを示す図である。 実施例2における176個の候補分子の分類のヒストグラムである。 分子13に対するSNPの影響を示す、方法の実施例3における特徴ベクトルのグラフである。 実施例3における分子13における3つのSNPを有する176個の候補分子の分類のヒストグラムである。 実施例3における測定分子とライブラリ特徴ベクトルとの整列のグラフである。 実施例3における、SNPの位置を示す、測定とライブラリ特徴ベクトルとの間の位置分解差のプロットを示す図である。 実施例3における測定とSNPを有さないライブラリ特徴ベクトルとの間の位置分解差のプロットを示す図である。 方法の実施例4におけるデータとコンセンサスランドマークとの最終アライメントのプロットを示す図である。 実施例4におけるおおよその位置337における候補分子51〜60における位置分解差のプロットを示す図である。 方法の実施例5における2クラスターデータセットのアライメント類似性スコアに基づく近隣結合により形成した系統樹を示す図である。 方法の実施例5における3クラスターデータセットのアライメント類似性スコアに基づく近隣結合により形成された系統樹を示す図である。 実施例5における各同定されたクラスターに関するデータの最終アライメントによるランドマークコンセンサスのグラフである。 実施例5における各同定されたクラスターに関するデータの最終アライメントによるランドマークコンセンサスのグラフである。 実施例5における各同定されたクラスターに関するデータの最終アライメントによるランドマークコンセンサスのグラフである。 実施例5における2クラスター実験の分類のヒストグラムである。 実施例5における3クラスター実験の分類のヒストグラムである。 方法の実施例6におけるアライメント類似性スコアに基づく近隣結合により形成した系統樹を示す図である。 実施例6における3つの断片のそれぞれに関するデータの最終アライメントによるランドマークコンセンサスのグラフである。
適用することができるポリマーは、以下の通りである。
ポリマーは、生物学的ポリマーであり得る。ポリマーは、天然又は合成ポリマーであり得る。ポリマーは、ポリヌクレオチド(若しくは核酸)、タンパク質などのポリペプチド、多糖又は他のポリマーであり得る。ポリペプチドの場合、ポリマー単位は、天然又は合成のアミノ酸であり得る。多糖の場合、ポリマー単位は、単糖であり得る。
適用することができるポリヌクレオチドは、以下の通りである。
核酸などのポリヌクレオチドは、2つ以上のヌクレオチドを含む巨大分子である。ポリヌクレオチド又は核酸は、任意のヌクレオチドの任意の組合せを含み得る。ヌクレオチドは、天然又は人工のものであり得る。標的ポリヌクレオチドにおける1つ又は複数のヌクレオチドは、酸化又はメチル化され得る。標的ポリヌクレオチドにおける1つ又は複数のヌクレオチドは、損傷され得る。標的ポリヌクレオチドにおける1つ又は複数のヌクレオチドは、例えば、標識又はタグにより修飾され得る。標的ポリヌクレオチドは、1つ又は複数のスペーサーを含み得る。
ヌクレオチドは、一般的に核酸塩基、糖及び少なくとも1つのリン酸基を含む。核酸塩基は、一般的に複素環である。核酸塩基は、プリン及びピリミジン、より具体的にはアデニン、グアニン、チミン、ウラシル及びシトシンを含むが、これらに限定されない。糖は、一般的に五炭糖である。ヌクレオチド糖は、リボース及びデオキシリボースを含むが、これらに限定されない。ヌクレオチドは、一般的にリボヌクレオチド又はデオキシリボヌクレオチドである。ヌクレオチドは、一般的に一リン酸、二リン酸又は三リン酸を含む。リン酸は、ヌクレオチドの5’又は3’側に結合し得る。
ヌクレオチドは、アデノシン一リン酸(AMP)、アデノシン二リン酸(ADP)、アデノシン三リン酸(ATP)、グアノシン一リン酸(GMP)、グアノシン二リン酸(GDP)、グアノシン三リン酸(GTP)、チミジン一リン酸(TMP)、チミジン二リン酸(TDP)、チミジン三リン酸(TTP)、ウリジン一リン酸(UMP)、ウリジン二リン酸(UDP)、ウリジン三リン酸(UTP)、シチジン一リン酸(CMP)、シチジン二リン酸(CDP)、シチジン三リン酸(CTP)、5−メチルシチジン一リン酸、5−メチルシチジン二リン酸、5−メチルシチジン三リン酸、5−ヒドロキシメチルシチジン一リン酸、5−ヒドロキシメチルシチジン二リン酸、5−ヒドロキシメチルシチジン三リン酸、環状アデノシン一リン酸(cAMP)、環状グアノシン一リン酸(cGMP)、デオキシアデノシン一リン酸(dAMP)、デオキシアデノシン二リン酸(dADP)、デオキシアデノシン三リン酸(dATP)、デオキシグアノシン一リン酸(dGMP)、デオキシグアノシン二リン酸(dGDP)、デオキシグアノシン三リン酸(dGTP)、デオキシチミジン一リン酸(dTMP)、デオキシチミジン二リン酸(dTDP)、デオキシチミジン三リン酸(dTTP)、デオキシウリジン一リン酸(dUMP)、デオキシウリジン二リン酸(dUDP)、デオキシウリジン三リン酸(dUTP)、デオキシシチジン一リン酸(dCMP)、デオキシシチジン二リン酸(dCDP)及びデオキシシチジン三リン酸(dCTP)、5−メチル−2’−デオキシシチジン一リン酸、5−メチル−2’−デオキシシチジン二リン酸、5−メチル−2’−デオキシシチジン三リン酸、5−ヒドロキシメチル−2’−デオキシシチジン一リン酸、5−ヒドロキシメチル−2’−デオキシシチジン二リン酸及び5−ヒドロキシメチル−2’−デオキシシチジン三リン酸を含むが、これらに限定されない。ヌクレオチドは、好ましくはAMP、TMP、GMP、UMP、dAMP、dTMP、dGMP又はdCMPから選択される。ヌクレオチドは、脱塩基(すなわち、核酸塩基を欠く)であり得る。ヌクレオチドは、付加修飾を含み得る。特に、適切な修飾ヌクレオチドは、2’アミノピリミジン(2’−アミノシチジン及び2’−アミノウリジンなど)、2’−ヒドロキシルプリン(2’−フルオロシチジン及び2’−フルオロウリジン)などの2’−フルオロピリミジン)、ヒドロキシルピリミジン(5’−α−ボラノウリジンなど)、2’−O−メチルヌクレオチド(2’−O−メチルアデノシン、2’−O−メチルグアノシン、2’−O−メチルシチジン及び2’−O−メチルウリジンなど)、4’−チオピリミジン(4’−チオウリジン及び4’−チオシチジン)を含むが、これらに限定されず、ヌクレオチドは、核酸塩基の修飾を有する(5−ペンチニル−2’−デオキシウリジン、5−(3−アミノプロピル)ウリジン及び1,6−ジアミノヘキシル−N−5−カルバモイルメチルウリジンなど)。
ヌクレオチドは、脱塩基(すなわち、核酸塩基を欠く)であり得る。
ポリヌクレオチドは、一本鎖又は二本鎖であり得る。ポリヌクレオチドは、1つ又は複数の二本鎖領域及び1つ又は複数の一本鎖領域を含み得る。ポリヌクレオチドは、デオキシリボ核酸(DNA)又はリボ核酸(RNA)などの核酸であり得る。標的ポリヌクレオチドは、DNAの1つの鎖にハイブリダイズさせたRNAの1つの鎖を含み得る。ポリヌクレオチドは、ペプチド核酸(PNA)、グリセロール核酸(GNA)、トレオース核酸(TNA)、固定化核酸(LNA)又はヌクレオチド側鎖を有する他の合成ポリマーなどの当技術分野で公知の合成核酸であり得る。
標的ポリヌクレオチドの全体又は一部のみをこの方法を用いて特徴付けることができる。標的ポリヌクレオチドは、任意の長さであり得る。例えば、ポリヌクレオチドは、長さが少なくとも10、少なくとも50、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも400又は少なくとも500ヌクレオチド対であり得る。ポリヌクレオチドは、1000又はそれ以上のヌクレオチド対、長さが5000又はそれ以上のヌクレオチド対或いは長さが100000又はそれ以上のヌクレオチド対であり得る。
標的ポリヌクレオチドは、適切な試料中に存在する。本発明は、一般的に標的ポリヌクレオチドを含むことが公知である又は含むと推定される試料について実施される。或いは、本発明は、試料中のその存在が公知である又は予測される1つ又は複数の標的ポリヌクレオチドの同一性を確認するために試料について実施することができる。
試験することができる試料は、以下の通りである。
試料は、生体試料であり得る。本発明は、生物又は微生物から得られた又は抽出された試料についてin vitroで実施することができる。生物又は微生物は、一般的に始原生物(archaean)、原核生物又は真核生物であり、一般的に次の5つの生物界の1つに属する:植物、動物、菌、モネラ及び原生生物界。本発明は、ウイルスから得られた又は抽出された試料についてin vitroで実施することができる。試料は、好ましくは流体試料である。試料は、後に処理されて流体試料となる、元来は固体又は半固体であり得る。前記ものの例は、糞便、皮膚、組織、毛、骨及び筋肉である。試料は、一般的に患者の体液を含む。試料は、例えば、尿、血液、血漿、血清、リンパ液、唾液、間質液、涙液、粘液又は羊水から選択することができる。一般的に、試料は、ヒト由来のものであるが、代わりにウマ、ウシ、ヒツジ若しくはブタなどの商業的に養殖された動物など又は代わりにネコ若しくはイヌなどの愛玩動物であり得る他の哺乳動物から得られるものであり得る。或いは、植物由来の試料は、一般的に、穀物、マメ科植物、果実又は野菜、例えば、コムギ、オオムギ、オートムギ、カノーラ、トウモロコシ、ダイズ、コメ、バナナ、リンゴ、トマト、ジャガイモ、ブドウ、タバコ、マメ、レンティル、サトウキビ、ココア、綿などの商品作物から得られる。
試料は、非生体試料であり得る。非生体試料は、好ましくは流体試料である。非生体試料の例は、外科手術液(surgical fluids)、飲料水、海水又は河川水などの水、及び臨床検査用試薬などの工業製品試料、ポリマー試薬の合成から得られる試料を含む。
試料は、一般的に、例えば、遠心分離により又は赤血球などの不要な分子若しくは細胞をろ過により取り除く膜に通すことにより、分析する前に処理する。試料は、採取した後直ちに測定することができる。試料は、一般的に分析する前に好ましくは−70℃未満で保存することもできる。
試料は、米国特許出願公開第61/490860号に示されている工程、設計又は改良のいずれかに供することもできる。
測定システムに用いることができる膜は、以下の通りである。
あらゆる膜を本発明により用いることができる。適切な膜は、当技術分野で周知である。膜は、好ましくは両親媒性層である。両親媒性層は、親水性と親油性の両方を有するリン脂質などの両親媒性分子から形成された層である。両親媒性層は、単層又は二重層であり得る。膜は、(Gonzalez-Perezら、Langmuir、2009年、25巻、10447〜10450頁)により開示されたようなコブロックポリマーであり得る。
膜は、脂質二重層であり得る。脂質二重層は、細胞膜のモデルであり、一連の実験的研究の優れたプラットフォームとしての役割を果たす。例えば、脂質二重層は、シングルチャンネル記録による膜タンパク質のin vitroでの検討に用いることができる。或いは、脂質二重層は、一連の物質の存在を検出するためのバイオセンサーとして用いることができる。適切な両親媒性層は、平面脂質二重層、支持二重層又はリポソームを含むが、これらに限定されない。脂質二重層は、好ましくは平面脂質二重層である。適切な脂質二重層は、国際出願番号PCT/GB08/000563(国際公開第2008/102121号として公開)、国際出願番号PCT/GB08/004127(国際公開第2009/077734号として公開)及び国際出願番号PCT/GB2006/001057(国際公開第2006/100484号として公開)に開示されている。
脂質二重層を形成する方法は、当技術分野で公知である。適切な方法は、実施例で開示する。脂質二重層は、脂質単層を水溶液/空気界面上を当界面に垂直な開口部の両側を通り越して運ぶ、Montal及びMueller(Proc. Natl. Acad. Sci. USA、1972年、69巻、3561〜3566頁)の方法により一般的に形成される。
Montal及びMuellerの方法は、タンパク質細孔挿入に適する良質の脂質二重層を形成する費用対効果が高く、比較的に簡単な方法であるため一般的である。二重層の形成の他の一般的な方法は、チップディッピング、二重層ペインティング及びリポソーム二重層のパッチクランピングを含む。
好ましい実施形態において、両親媒性層は、国際出願番号PCT/GB08/004127(国際公開第2009/077734号として公開)に記載されているように形成する。
他の好ましい実施形態において、膜は、固体層である。固体層は、生体起源のものでない。言い換えると、固体層は、生物若しくは細胞などの生物学的環境に由来又はそれから単離されるものでないか、又は生物学的に利用可能な構造の合成により製造される異型である。固体層は、マイクロエレクトロニクス材料、Si、Al及びSiOなどの絶縁材料、ポリアミド、Teflon(登録商標)などのプラスチック又は二成分付加硬化シリコーンゴムなどの弾性体及びガラスなどの有機及び無機ポリマーを含むが、これらに限定されない有機及び無機材料から形成することができる。固体層は、グラフェンなどの単原子層又は数原子の厚さのみの層から形成することができる。適切なグラフェン層は、国際出願番号PCT/US2008/010637(国際公開第2009/035647号として公開)に開示されている。固体膜は、生体物質由来のナノ細孔も支持することができ、非限定的な例は、Hallら(Nat Nanotechnol.、2010年12月、5巻(12号)、874〜7頁)及びBellら(Nano Lett.、2012年1月11日、12巻(1号)、512〜7頁)並びに国際出願番号PCT/US2011/039621(国際公開第2012/005857号として公開)により開示された。
本方法は、一般的に(i)細孔を含む人工両親媒性層、(ii)細孔を含む単離天然両親媒性層又は(iii)内部に挿入された細孔を有する細胞を用いて実施される。本方法は、好ましくは人工両親媒性層用いて実施される。二重層は、細孔に加えて他の膜貫通及び/又は膜内タンパク質並びに他の分子を含み得る。適切な装置及び条件は、以下で述べる。本発明の方法は、一般的にin vitroで実施される。
適用することができるナノ細孔は、以下の通りである。
測定システムは、ナノ細孔を含む。測定は、ナノ細孔を経るポリマーの輸送中に行われる。ナノ細孔を経るポリマーの輸送は、観察することができ、全体で「事象」と呼ぶことができる測定される特性における特性信号を発生する。
ナノ細孔は、それを通してのポリマーの通過を可能にする、大まかに言ってナノメートル程度のサイズを一般的に有する細孔である。本明細書では、「細孔」への言及は、この意味でのナノ細孔を意味する。
ナノ細孔は、生体細孔(biological pore)又は固体細孔であり得る。
固体細孔は、一般的に固体層における開口部である。固体細孔は、トンネル電極(Ivanov APら、Nano Lett.、2011年1月12日、11巻(1号)、279〜85頁)又は電界効果トランジスタ(FET)素子(国際出願公開2005第/124888号)などのポリマーの代替又は追加測定を可能にする追加の構成要素と組み合わせて用いることができる。固体細孔は、例えば、国際公開第00/79257号に記載されているものを含む公知の方法により形成することができる。
ナノ細孔は、好ましくは膜貫通タンパク質細孔である。膜貫通タンパク質細孔は、水和イオンが膜の一側から膜の他側に流れることを可能にするポリペプチド又はポリペプチドの集合である。本発明において、膜貫通タンパク質細孔は、印加電位により駆動される水和イオンが膜の一側から他側に流れることを可能にする細孔を形成することができる。膜貫通タンパク質細孔は、DNA又はRNAなどのポリマーを細孔を通して移動させる。
膜貫通タンパク質細孔は、モノマー又はオリゴマーであり得る。細孔は、好ましくは6、7又は8サブユニットなどのいくつかの反復サブユニットで構成されている。細孔は、より好ましくはヘプタマー又はオクタマー細孔である。
膜貫通タンパク質細孔は、一般的にイオンが流通し得るバレル又はチャンネルを含む。細孔のサブユニットは、一般的に中心軸を取り囲み、膜貫通βバレル若しくはチャンネル又は膜貫通αらせんバンドル若しくはチャンネルに鎖を与える。
膜貫通タンパク質細孔のバレル又はチャンネルは、一般的に、ポリマー、ヌクレオチド、ポリヌクレオチド又は核酸などの分析対象物との相互作用を促進するアミノ酸を含む。これらのアミノ酸は、好ましくはバレル又はチャンネルの狭窄部の近くにある。膜貫通タンパク質細孔は、一般的にアルギニン、リシン若しくはヒスチジンなどの1つ若しくは複数の正に荷電したアミノ酸、又はチロシン若しくはトリプトファンなどの芳香族アミノ酸を含む。これらのアミノ酸は、一般的に細孔とポリマー、ヌクレオチド、ポリヌクレオチド又は核酸との間の相互作用を促進する。
本発明により使用する膜貫通タンパク質細孔は、βバレル細孔又はαらせんバンドル細孔に由来し得る。βバレル細孔は、β鎖から形成されているバレル又はチャンネルを含む。適切なβバレル細孔は、α−ヘモリシンなどのα−毒素、炭疽菌毒素及びロイコシジン、並びに恥こう菌(Mycobacterium smegmatis)ポリン(Msp)、例えば、MspA、外膜ポリンF(OmpF)、外膜ポリンG(OmpG)、外膜ホスホリパーゼA及びナイセリアオートトランスポーターリポタンパク質(NalP)などの細菌の外膜タンパク質/ポリンを含むが、これらに限定されない。αらせんバンドル細孔は、αらせんにより形成されているバレル又はチャンネルを含む。適切なαらせんバンドル細孔は、WZA及びClyA毒素などの内膜タンパク質及び外膜タンパク質を含むが、これらに限定されない。膜貫通細孔は、Msp又はα−ヘモリシン(α−HL)に由来し得る。
膜貫通タンパク質細孔は、好ましくはMsp、好ましくはMspAに由来する。そのような細孔は、オリゴマーであり、一般的にMspに由来する7、8、9又は10個のモノマーを含む。細孔は、同じモノマーを含むMspに由来するホモオリゴマー細孔であり得る。或いは、細孔は、他と異なる少なくとも1個のモノマーを含むMspに由来するヘテロオリゴマー細孔であり得る。好ましくは細孔は、MspA又はその類似体若しくはパラログに由来する。
Mspに由来するモノマーは、配列番号2又はその変異体に示す配列を含む。配列番号2は、MspAモノマーのMS−(B1)8突然変異体である。それは、次の突然変異、すなわち、D90N、D91N、D93N、D118R、D134R及びE139Kを含む。配列番号2の変異体は、配列番号2と異なるアミノ酸配列を有し、細孔を形成するその能力を保持しているポリペプチドである。細孔を形成する変異体の能力は、当技術分野で公知の方法を用いてアッセイすることができる。例えば、変異体を他の適切なサブユニットとともに脂質二重層に挿入することができ、オリゴマー化して細孔を形成するその能力を測定することができる。サブユニットを脂質二重層などの膜に挿入する方法は、当技術分野で公知である。例えば、サブユニットは、脂質二重層に拡散し、結合により脂質二重層に挿入され、機能状態に集合するように、脂質二重層を含む溶液中に精製された形で懸濁させることができる。或いは、サブユニットは、M. A. Holden、H. Bayley J.、Am. Chem. Soc.、2005年、127巻、6502〜6503頁及び国際出願番号PCT/GB2006/001057(国際公開第2006/100484号として公開)に記載されている「ピックアンドプレイス」法を用いて膜に直接挿入することができる。
配列番号2のアミノ酸配列の全長にわたって、変異体は、好ましくはアミノ酸の同一性に基づいて当配列と少なくとも50%相同である。より好ましくは、変異体は、全配列にわたって配列番号2のアミノ酸配列とアミノ酸の同一性に基づいて少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、より好ましくは少なくとも95%、97%又は99%相同であり得る。一続きの100個又はそれ以上、例えば、125、150、175若しくは200個又はそれ以上の連続したアミノ酸にわたって少なくとも80%、例えば、少なくとも85%、90%又は95%のアミノ酸の同一性(「強相同性」)が存在し得る。
当技術分野における標準的方法を用いて相同性を決定することができる。例えば、UWGCGパッケージは、例えば、そのデフォルト設定で用いられる、相同性を計算するために用いることができるBESTFITプログラムを提供する(Devereuxら(1984) Nucleic Acids Research、12巻、387〜395頁)。PILEUP及びBLASTアルゴリズムは、例えば、Altschul S. F.(1993) J Mol Evol、36巻、290〜300頁、Altschul S. F.ら(1990) J Mol Biol、215巻、403〜10頁に記載されているように相同性を計算するために又は配列を整列させるために(等価残基又は対応する配列を同定することなど(一般的にそれらのデフォルト設定で))用いることができる。BLAST解析を実施するためのソフトウエアは、National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)を介して公的に入手できる。
配列番号2は、MspAモノマーのMS−(B1)8突然変異体である。変異体は、MspAと比較してMspB、C又はDモノマーにおける突然変異のいずれかを含み得る。MspB、C又はDの成熟型は、配列番号15〜17に示されている。特に、変異体は、MspBに存在する次の置換、すなわちA138Pの置換を含み得る。変異体は、MspCに存在する次の置換、すなわちA96G、N102E及びA138Pの置換の1つ又は複数を含み得る。変異体は、MspDに存在する次の突然変異、すなわち、G1、L2V、E5Q、L8V、D13G、W21A、D22E、K47T、I49H、I68V、D91G、A96Q、N102D、S103T、V104I、S136K及びG141Aの欠失の1つ又は複数を含み得る。変異体は、MspB、C又はDの突然変異及び置換の1つ又は複数の組合せを含み得る。変異体は、突然変異L88Nを含み得る。配列番号2の変異体は、MS−B1の突然変異のすべてに加えて突然変異L88Nを有し、それはMS−B2と呼ばれる。本発明に用いられ細孔は、MS−(B2)8又はMS−(B2C)8であり得る。
アミノ酸置換は、配列番号2のアミノ酸に対して上述のものに加えて、例えば、最大1、2、3、4、5、10、20又は30置換行うことができる。同類置換は、アミノ酸を類似の化学構造、類似の化学的特性又は類似の側鎖体積の他のアミノ酸で置換するものである。導入されるアミノ酸は、それらが置換するアミノ酸と類似の極性、親水性、疎水性、塩基性度、酸性度、中性又は電荷を有し得る。或いは、同類置換は、先在性の芳香族又は脂肪族アミノ酸の代わりに芳香族又は脂肪族である他のアミノ酸を導入し得る。同類アミノ酸変化は、当技術分野で周知であり、下の表2で定義する20種の主要アミノ酸の特性に従って選択することができる。アミノ酸が類似の極性を有する場合、これも表3におけるアミノ酸側鎖の疎水性スケールを参照することにより決定することができる。
配列番号2のアミノ酸配列の1つ又は複数のアミノ酸残基は、上述のポリペプチドからさらに取り除くことができる。最大1、2、3、4、5、10、20又は30個の残基を取り除くことができ、又はそれ以上である。
変異体は、配列番号2の断片を含み得る。そのような断片は、細孔形成活性を保持している。断片は、長さが少なくとも50、100、150又は200アミノ酸であり得る。そのような断片は、細孔を生成するのに用いることができる。断片は、好ましくは配列番号2の細孔形成ドメインを含む。断片は、配列番号2の残基88、90、91、105、118及び134の1つを含まなければならない。一般的に、断片は、配列番号2の残基88、90、91、105、118及び134のすべてを含む。
1つ又は複数のアミノ酸を代わりに又はさらに上述のポリペプチドに付加することができる。延長は、配列番号2又はそのポリペプチド変異体若しくは断片のアミノ酸配列のアミノ末端又はカルボキシ末端において施すことができる。延長は、かなり短いもの、例えば、長さが1〜10アミノ酸であり得る。或いは、延長は、より長いもの、例えば、最大50又は100アミノ酸であり得る。担体タンパク質を本発明によるアミノ酸配列に融合させることができる。他の融合タンパク質は、下でより詳細に述べる。
上述のように、変異体は、配列番号2と異なるアミノ酸配列を有し、細孔を形成するその能力を保持しているポリペプチドである。変異体は、一般的に細孔形成に関与する配列番号2の領域を含む。βバレルを含むMspの細孔形成能力は、各サブユニットにおけるβシートにより与えられる。配列番号2の変異体は、一般的にβシートを形成する配列番号2の領域を含む。得られる変異体が細孔を形成するその能力を保持する限り、βシートを形成する配列番号2の領域に対して1つ又は複数の修飾を行うことができる。配列番号2の変異体は、好ましくは、そのαらせん及び/又はループ領域内の置換、付加又は欠失などの1つ又は複数の修飾を含む。
Msp由来のモノマーは、例えば、ヒスチジン残基(histタグ)、アスパラギン酸残基(aspタグ)、ストレプトアビジンタグ若しくはフラグタグの付加により、又はポリペプチドがそのような配列を天然で含まない場合に細胞からのそれらの分泌を促進するためにシグナル配列の付加により、それらの同定又は精製を促進するために修飾することができる。遺伝タグを導入することの代替法は、細孔における天然又は遺伝子改変位置上でタグを化学的に反応させることである。この例は、細孔の外側に遺伝子改変により導入されたシステインにゲルシフト試薬を反応させることであろう。これは、ヘモリシンヘテロオリゴマーを分離する方法として示された(Chem Biol、1997年7月、4巻(7号)、497〜505頁)。
Msp由来のモノマーは、リビーリング標識(revealing label)で標識することができる。リビーリング標識は、細孔が検出されることを可能にする適切な標識であり得る。適切な標識は、蛍光分子、放射性同位体、例えば、125I、35S、酵素、抗体、抗原、ポリヌクレオチド及びビオチンなどの配位子を含むが、これらに限定されない。
Msp由来のモノマーは、D−アミノ酸を用いて製造することもできる。例えば、Msp由来のモノマーは、L−アミノ酸とD−アミノ酸の混合物を含み得る。これは、そのようなタンパク質及びペプチドを製造するために当技術分野で従来続けられている。
Msp由来のモノマーは、ヌクレオチドの識別を促進するための1つ又は複数の特異的修飾を含む。Msp由来のモノマーは、細孔形成を妨げない限り、他の非特異的修飾も含み得る。多くの非特異的側鎖修飾は、当技術分野で公知であり、Msp由来のモノマーの側鎖に対して行うことができる。そのような修飾は、例えば、アルデヒドとの反応と続くNaBHによる還元によるアミノ酸の還元的アルキル化、メチルアセトイミデートによるアミジン化又は無水酢酸によるアシル化を含む。
Msp由来のモノマーは、当技術分野で公知の標準的方法を用いて製造することができる。Msp由来のモノマーは、合成により又は組換え手段により製造することができる。例えば、細孔は、in vitro翻訳転写(IVTT)により合成することができる。細孔を形成する適切な方法は、国際出願番号PCT/GB09/001690(国際公開第2010/004273号として公開)、PCT/GB09/001679(国際公開第2010/004265号として公開)又はPCT/GB10/000133(国際公開第2010/086603号として公開)に述べられている。細孔を膜に挿入する方法を述べる。
膜貫通タンパク質細孔はまた、好ましくはα−ヘモリシン(α−HL)に由来する。野生型α−HL細孔は、7つの同じモノマー又はサブユニットから形成される(すなわち、それは七量体である)。α−ヘモリシンNNの1つのモノマー又はサブユニットの配列は、配列番号4に示されている。膜貫通タンパク質細孔は、好ましくは、それぞれが配列番号4又はその変異体に示されている配列を含む7つのモノマーを含む。配列番号4のアミノ酸1、7〜21、31〜34、45〜51、63〜66、72、92〜97、104〜111、124〜136、149〜153、160〜164、173〜206、210〜213、217、218、223〜228、236〜242、262〜265、272〜274、287〜290及び294は、ループ領域を形成する。配列番号4の残基113及び147は、α−HLのバレル又はチャンネルの狭窄部の一部を形成する。
そのような実施形態において、それぞれが配列番号4又はその変異体に示されている配列を含む7つのタンパク質又はモノマーを含む細孔は、好ましくは本発明の方法に用いる。7つのタンパク質は、同じ(ホモヘプタマー)又は異なり(ヘテロヘプタマー)得る。
配列番号4の変異体は、配列番号4と異なるアミノ酸配列を有し、その細孔形成能力を保持しているタンパク質である。細孔を形成する変異体の能力は、当技術分野で公知の方法を用いてアッセイすることができる。例えば、変異体は、他の適切なサブユニットとともに脂質二重層に挿入することができ、オリゴマー化して細孔を形成するその能力を測定することができる。サブユニットを脂質二重層などの膜に挿入する方法は、当技術分野で公知である。適切な方法は、上に述べられている。
変異体は、ヘリカーゼへの共有結合又はそれとの相互作用を促進する修飾を含み得る。変異体は、好ましくはヘリカーゼへの結合を促進する1つ又は複数の反応性システイン残基を含む。例えば、変異体は、配列番号4の位置8、9、17、18、19、44、45、50、51、237、239及び287の1つ若しくは複数において且つ/又はアミノ若しくはカルボキシ末端上にシステインを含み得る。好ましい変異体は、システインによる配列番号4の位置8、9、17、237、239及び287における残基の置換を含む(A8C、T9C、N17C、K237C、S239C又はE287C)。変異体は、好ましくは国際出願番号PCT/GB09/001690(国際公開第2010/004273号として公開)、PCT/GB09/001679(国際公開第2010/004265号として公開)又はPCT/GB10/000133(国際公開第2010/086603号として公開)に記載されている変異体のいずか1つである。
変異体は、ヌクレオチドとの相互作用を促進する修飾も含み得る。
変異体は、生物、例えば、ブドウ球菌(Staphylococcus bacterium)により天然で発現される天然変異体であり得る。或いは、変異体は、大腸菌(Escherichia coli)などの細菌によりin vitroで又は組換えにより発現させることができる。変異体は、組換え技術により生成させた非天然変異体も含む。配列番号4のアミノ酸配列の全長にわたって、変異体は、好ましくはアミノ酸の同一性に基づいて当配列と少なくとも50%相同である。より好ましくは、変異体ポリペプチドは、全配列にわたって配列番号4のアミノ酸配列とアミノ酸の同一性に基づいて少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、より好ましくは少なくとも95%、97%又は99%相同であり得る。一続きの200個又はそれ以上、例えば、230、250、270若しくは280個又はそれ以上の連続したアミノ酸にわたって少なくとも80%、例えば、少なくとも85%、90%又は95%のアミノ酸の同一性(「強相同性」)が存在し得る。相同性は上述のように判定する。
アミノ酸置換は、配列番号4に対して上述のものに加えて、例えば、最大1、2、3、4、5、10、20又は30置換行うことができる。同類置換は、上述のように行うことができる。
配列番号4のアミノ酸配列の1つ又は複数のアミノ酸残基は、上述のポリペプチドからさらに取り除くことができる。最大1、2、3、4、5、10、20又は30個の残基を取り除くことができ、又はそれ以上である。
変異体は、配列番号4の断片であり得る。そのような断片は、細孔形成活性を保持している。断片は、長さが少なくとも50、100、200又は250アミノ酸であり得る。断片は、好ましくは配列番号4の細孔形成ドメインを含む。断片は、一般的に配列番号4の残基119、121、135、113及び139を含む。
1つ又は複数のアミノ酸を代わりに又はさらに上述のポリペプチドに付加することができる。延長は、配列番号4又はその変異体若しくは断片のアミノ酸配列のアミノ末端又はカルボキシ末端において施すことができる。延長は、かなり短いもの、例えば、長さが1〜10アミノ酸であり得る。或いは、延長は、より長いもの、例えば、最大50又は100アミノ酸であり得る。担体タンパク質を細孔又は変異体に融合させることができる。
上述のように、配列番号4の変異体は、配列番号4と異なるアミノ酸配列を有し、細孔を形成するその能力を保持しているサブユニットである。変異体は、一般的に細孔形成に関与する配列番号4の領域を含む。βバレルを含むα−HLの細孔形成能力は、各サブユニットにおけるβ鎖により与えられる。配列番号4の変異体は、一般的にβ鎖を形成する配列番号4の領域を含む。β鎖を形成する配列番号4のアミノ酸は、上で述べられている。得られる変異体が細孔を形成するその能力を保持する限り、β鎖を形成する配列番号4の領域に対して1つ又は複数の修飾を行うことができる。配列番号4のβ鎖領域に対して行うことができる特異的修飾は、上で述べられている。
配列番号4の変異体は、好ましくは、そのαらせん及び/又はループ領域内の置換、付加又は欠失などの1つ又は複数の修飾を含む。αらせん及びループを形成するアミノ酸は、上で述べられている。
変異体は、上で述べたようにその同定又は精製を促進するために修飾することができる。
α−HL由来の細孔は、Msp由来の細孔に準じて上述のように形成することができる。
いくつかの実施形態において、膜貫通タンパク質細孔を化学的に修飾する。細孔は、任意の方法で、任意の部位において化学的に修飾することができる。膜貫通タンパク質細孔は、好ましくは1つ又は複数のシステインへの分子の結合(システイン結合)、1つ又は複数のリシンへの分子の結合、1つ又は複数の非天然アミノ酸への分子の結合、エピトープの酵素修飾或いは末端の修飾により化学的に修飾する。そのような修飾を行う適切な方法は、当技術分野で周知である。膜貫通タンパク質細孔は、任意の分子の結合により化学的に修飾することができる。例えば、細孔は、色素又は発蛍光団の結合により化学的に修飾することができる。
細孔における任意の数のモノマーを化学的に修飾することができる。2、3、4、5、6、7、8、9又は10などの1つ又は複数のモノマーを好ましくは上述のように化学的に修飾する。
分子(細孔を化学的に修飾する)は、国際出願番号PCT/GB09/001690(国際公開第2010/004273号として公開)、PCT/GB09/001679(国際公開第2010/004265号として公開)又はPCT/GB10/000133(国際公開第2010/086603号として公開)に開示されているように細孔に直接結合又はリンカーを介して結合させることができる。
用いることができる歯止めは、以下の通りである。
ナノ細孔を経るポリマーの輸送は、歯止めで動かされるような状態で行わせることができる。この場合、ポリマーの連続するkマーは、ナノ細孔により登録される。このように、各測定は、個々のkマーに依存する。登録が十分な時間保持される場合、複数の測定の群は、個々のkマーに依存する。輸送の性質によって、登録の期間は、予測不可能であり得、長さが異なり得る。測定サンプリング速度に対する、登録の期間によって、配列におけるすべてのkマーに依存する、複数の測定又は信号測定さえ存在しない可能性がある。
ポリマーの輸送は、細孔を通るポリマーの移動を制御する分子歯止めにより制御することができる。分子歯止めは、ポリマー結合タンパク質であり得る。ポリヌクレオチドについては、ポリヌクレオチド結合タンパク質は、好ましくはポリヌクレオチド処理酵素である。ポリヌクレオチド処理酵素は、ポリヌクレオチドと相互作用し、その少なくとも1つの特性を修飾することができるポリペプチドである。酵素は、それを切断して個々のヌクレオチド又はジ若しくはトリヌクレオチドなどのヌクレオチドのより短い鎖を形成することによってポリヌクレオチドを修飾し得る。酵素は、それを配向させる又はそれを特定の位置に移動させることによってポリヌクレオチドを修飾し得る。ポリヌクレオチド処理酵素は、標的ポリヌクレオチドに結合し、細孔を通るその移動を制御することができる限り、酵素活性を示す必要がない。例えば、酵素は、その酵素活性を除去するために修飾することができ、又はそれが酵素として作用することを妨げる条件下で用いることができる。そのような条件は、以下でより詳細に述べる。
ポリヌクレオチド処理酵素は、核酸分解酵素に由来し得る。酵素の構成要素に用いるポリヌクレオチド処理酵素は、より好ましくは酵素分類(EC)群3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30及び3.1.31のいずれかのメンバーに由来する。酵素は、国際出願番号PCT/GB10/000133(国際公開第2010/086603号として公開)に開示されているもののいずれかであり得る。
好ましい酵素は、ポリメラーゼ、エキソヌクレアーゼ、ヘリカーゼ及びギラーゼなどのトポイソメラーゼである。適切な酵素は、大腸菌(E.coli)からのエキソヌクレアーゼI(配列番号8)、大腸菌(E.coli)からのエキソヌクレアーゼIII(配列番号10)、サーマス・サーモフィラス(T.thermophilus)からのRecJ(配列番号12)及びバクテリオファージラムダエキソヌクレアーゼ(配列番号14)並びにそれらの変異体を含むが、これらに限定されない。配列番号14又はその変異体に示されている配列を含む3つのサブユニットは、相互作用して、トリマーエキソヌクレアーゼを形成する。酵素は、好ましくはPhi29 DNAポリメラーゼに由来する。Phi29ポリメラーゼに由来する酵素は、配列番号6又はその変異体に示されている配列を含む。
配列番号6、8、10、12又は14の変異体は、配列番号6、8、10、12又は14と異なるアミノ酸配列を有し、ポリヌクレオチド結合能力を保持している。変異体は、ポリヌクレオチドの結合を促進し、且つ/又は高い塩濃度及び/又は室温におけるその活性を促進する修飾を含み得る。
配列番号6、8、10、12又は14のアミノ酸配列の全長にわたって、変異体は、好ましくはアミノ酸の同一性に基づいて当配列と少なくとも50%相同である。より好ましくは、変異体ポリペプチドは、全配列にわたって配列番号6、8、10、12又は14のアミノ酸配列とアミノ酸の同一性に基づいて少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、より好ましくは少なくとも95%、97%又は99%相同であり得る。一続きの200個又はそれ以上、例えば、230、250、270若しくは280個又はそれ以上の連続したアミノ酸にわたって少なくとも80%、例えば、少なくとも85%、90%又は95%のアミノ酸の同一性(「強相同性」)が存在し得る。相同性は、上述のように判定する。変異体は、配列番号2に関して上述した状態のいずれかが野生型配列と異なり得る。酵素は、上述したように細孔に共有結合し得る。
一本鎖DNAの塩基配列決定のための2つの戦略は、印加電位による又は対抗したシスからトランスへの及びトランスからシスへのナノ細孔を経るDNAの輸送である。鎖の配列決定の最も有利なメカニズムは、印加電位のもとでのナノ細孔を経る一本鎖DNAの制御された輸送である。二本鎖DNA上で漸次又は前進的に作用するエキソヌクレアーゼは、印加電位下で残りの一本鎖を通すために細孔のシス側に又は逆電位下でトランス側に用いることができる。同様に、二本鎖DNAを巻き戻すヘリカーゼも同様に用いることができる。印加電位に逆らった鎖の輸送を必要とするが、逆又は無電位下でDNAを酵素により最初に「捕らえ」なければならない配列決定応用の可能性もある。結合の後に電位を切り替え復帰させることにより、鎖は、シスからトランスに細孔を通過し、電流により延長された立体配座で保持される。一本鎖DNAエキソヌクレアーゼ又は一本鎖DNA依存性ポリメラーゼは、最近輸送された一本鎖を細孔中を印加電位に対抗して制御された段階的仕方でトランスからシスに引き戻す分子モーターとして作用し得る。或いは、一本鎖DNA依存性ポリメラーゼは、細孔を通るポリヌクレオチドの移動を減速させる分子ブレーキとして作用し得る。
好ましい実施形態において、鎖の配列決定は、Msp由来の細孔及びPhi29 DNAポリメラーゼを用いて行う。本方法は、(a)ポリヌクレオチドを溶液に加えるステップと、(b)ポリメラーゼが細孔を通る標的ポリヌクレオチドの移動を制御し、標的ポリヌクレオチドにおけるヌクレオチドの一部が細孔と相互作用するように、標的ポリヌクレオチドが、Msp由来の細孔及びPhi29 DNAポリメラーゼを含む膜内の検出器と相互作用することを可能にするステップと、(c)各相互作用時に細孔を通る電流を測定し、それにより、標的ポリヌクレオチドの配列を決定するステップとを含み、ステップ(b)及び(c)は、細孔にわたって電圧が印加された状態で実施される。標的ポリヌクレオチドがPhi29 DNAポリメラーゼ及びMsp由来の細孔と接触するとき、標的ポリヌクレオチドは、最初にPhi29 DNAポリメラーゼとの複合体を形成する。電圧が細孔にわたって印加されるとき、標的ポリヌクレオチド/Phi29 DNAポリメラーゼ複合体は、細孔との複合体を形成し、細孔を通る標的ポリヌクレオチドの移動を制御する。
野生型Phi29 DNAポリメラーゼは、ポリメラーゼ及びエキソヌクレアーゼ活性を有する。それはまた、正しい条件下で二本鎖ポリヌクレオチドをほどき得る。したがって、該酵素は、3つの様式で機能し得る。これは、下でより詳細に述べる。
Phi29 DNAポリメラーゼは、配列番号6又はその変異体に示されている配列を含み得る。配列番号6の変異体は、配列番号6と異なるアミノ酸配列を有し、ポリヌクレオチド結合活性を保持している酵素である。変異体は、下で述べる3つの様式の少なくとも1つで機能しなければならない。好ましくは、変異体は、3つのすべての様式で機能する。変異体は、ポリヌクレオチドの処理を促進し、且つ/又は高い塩濃度及び/又は室温におけるその活性を促進する修飾を含み得る。
配列番号6のアミノ酸配列の全長にわたって、変異体は、好ましくはアミノ酸の同一性に基づいて当配列と少なくとも40%相同である。より好ましくは、変異体ポリペプチドは、全配列にわたって配列番号6のアミノ酸配列とアミノ酸の同一性に基づいて少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、より好ましくは少なくとも95%、97%又は99%相同であり得る。一続きの200個又はそれ以上、例えば、230、250、270若しくは280個又はそれ以上の連続したアミノ酸にわたって少なくとも80%、例えば、少なくとも85%、90%又は95%のアミノ酸の同一性(「強相同性」)が存在し得る。相同性は、上述のように判定する。変異体は、配列番号2に関して上述した状態のいずれかが野生型配列と異なり得る。
上述のシステム、装置又は条件のいずれかは、この好ましい実施形態に従って用いることができる。塩濃度は、一般的に0.15M〜0.6Mである。塩は、好ましくはKClである。
本方法は、Phi29 DNAポリメラーゼの3つのモードに基づく3つの好ましい方法の1つで実施することができる。各方法は、配列の校正の方法を含む。第一に、本方法は、好ましくはPhi29 DNAポリメラーゼをポリメラーゼとして用いて実施する。この実施形態において、ステップ(b)及び(c)は、ポリメラーゼが印加電圧により生じた電界に対抗して標的ポリヌクレオチドを細孔を通して移動させるように、遊離ヌクレオチド及び酵素補因子の存在下で実施される。標的ポリヌクレオチドは、5’→3’方向に移動する。遊離ヌクレオチドは、上述の個々のヌクレオチドのいずれかの1つ又は複数であり得る。酵素補因子は、Phi29 DNAポリメラーゼがポリメラーゼ又はエキソヌクレアーゼとして機能することを可能にする因子である。酵素補因子は、好ましくは2価金属陽イオンである。2価金属陽イオンは、好ましくはMg2+、Mn2+、Ca2+又はCo2+である。酵素補因子は、最も好ましくはMg2+である。本方法は、好ましくは(d)ポリメラーゼが印加電圧により生じた電界と一致して標的ポリヌクレオチドを細孔を通して移動させ(すなわち、3’及び5’ 方向に)、標的ポリヌクレオチドにおけるヌクレオチドの一部が細孔と相互作用するように、遊離ヌクレオチドを除去するステップと、(e)各相互作用時に細孔を通る電流を測定し、それにより、ステップ(c)で得られた標的ポリヌクレオチドの配列を校正するステップとをさらに含み、ステップ(d)及び(e)も細孔にわたって電圧が印加された状態で実施される。
第二に、本方法は、好ましくはPhi29 DNAポリメラーゼをエキソヌクレアーゼとして用いて実施する。この実施形態において、ステップ(b)及び(c)は、ポリメラーゼが印加電圧により生じた電界と一致して標的ポリヌクレオチドを細孔を通して移動させるように、遊離ヌクレオチドの非存在下及び酵素補因子の存在下で実施される。標的ポリヌクレオチドは、3’→5’方向に移動する。本方法は、好ましくは(d)ポリメラーゼが印加電圧により生じた電界に対抗して標的ポリヌクレオチドを細孔を通して移動させ(すなわち、5’→3’方向に)、標的ポリヌクレオチドにおけるヌクレオチドの一部が細孔と相互作用するように、遊離ヌクレオチドを加えるステップと、(e)各相互作用時に細孔を通る電流を測定し、それにより、ステップ(c)で得られた標的ポリヌクレオチドの配列を校正するステップとをさらに含み、ステップ(d)及び(e)も細孔にわたって電圧が印加された状態で実施される。
第三に、本方法は、好ましくはアンジッピングモードのPhi29 DNAポリメラーゼを用いて実施する。この実施形態において、ステップ(b)及び(c)は、ポリメラーゼが印加電圧により生じた電界と一致して細孔を通る標的ポリヌクレオチドの移動を制御する(それがほどけているので)ように、遊離ヌクレオチドの非存在下及び酵素補因子の非存在下で実施される。この実施例において、ポリメラーゼは、標的ポリヌクレオチドが印加電圧の影響下で細孔中を過度に急速に移動することを妨ぐブレーキのように作用する。本方法は、好ましくは(d)標的ポリヌクレオチドがステップ(b)及び(c)におけるのと反対方向に細孔中を移動し(すなわち、それが再アニールするとき)、標的ポリヌクレオチドにおけるヌクレオチドの一部が細孔と相互作用するように、細孔にわたり印加した電圧を低下させるステップと、(e)各相互作用時に細孔を通る電流を測定し、それにより、ステップ(c)で得られた標的ポリヌクレオチドの配列を校正するステップとをさらに含み、ステップ(d)及び(e)も細孔にわたって電圧が印加された状態で実施される。
他の好ましい実施形態において、ヘリカーゼをポリヌクレオチドの歯止めとして用いる(例えば、参照により本明細書に組み込まれる、米国特許出願公開第61/549,998号(N115020)、米国特許出願公開第61/581,332号(N115505)、米国特許出願公開第61/581,340号に開示されている)。ヘリカーゼが驚くべきことに高い塩耐性を有することが示された。ヘリカーゼは、標的ポリヌクレオチドを双方向に、すなわち、印加電圧により生じた電界と一致して又は対抗して移動させ得る。したがって、本方法は、2つの好ましい様式の1つで実施することができる。標的ポリヌクレオチドが細孔中を移動する方向、すなわち、電界の方向又は反対の方向によって、異なる信号が得られる。ヘリカーゼは、一般的に標的ポリヌクレオチドを細孔を通して一度に1つのヌクレオチドで移動させる。したがって、ヘリカーゼは、一塩基歯止めのように機能し得る。標的ポリヌクレオチドにおけるヌクレオチドのすべてでないが、実質的にすべてを細孔を用いて同定することができるため、これは、標的ポリヌクレオチドの配列を決定する場合にもちろん有利である。ヘリカーゼは、一本鎖ポリヌクレオチド及び二本鎖ポリヌクレオチドの運動を制御することができる。ヘリカーゼは、印加電圧により生じた電界に対して非常に抵抗性であると思われる。「アンジッピング」条件下でのポリヌクレオチドの非常にわずかな運動が認められた。印加電圧により生じた電界に対抗してポリヌクレオチドを移動させる場合の望ましくない「後方」運動による複雑な状態が存在しないことを意味するため、これは重要である。
本方法は、(a)ヘリカーゼが細孔を通る標的ポリヌクレオチドの移動を制御し、標的ポリヌクレオチドにおけるヌクレオチドが細孔と相互作用するように、標的ポリヌクレオチドを膜貫通細孔及びヘリカーゼと接触させるステップと、(b)1つ又は複数の相互作用時に細孔を通る電流を測定して、標的ポリヌクレオチドの1つ又は複数の特性を測定し、それにより、標的ポリヌクレオチドを特徴付けるステップとを含む。
上述のように、ヘリカーゼは、ナノ細孔に対して2つの様式で機能し得る。3’→5’方向に移動するヘリカーゼについては、2つの様式は、次の通りである。第一に、本方法は、好ましくは、ヘリカーゼが印加電圧により生じた電界と一致して標的配列を細孔を通して移動させるように、ヘリカーゼを用いて実施する。この様式では、標的配列が、最終的に二重層のトランス側に移動するまで電界と一致してナノ細孔を通るように、DNAの3’末端が最初にナノ細孔に捕捉され、酵素がDNAをナノ細孔内に移動させる。或いは、本方法は、好ましくは、酵素が印加電圧により生じた電界に対抗して標的配列を細孔を通して移動させるように、実施する。この様式では、標的配列が、最終的に二重層のシス側に排出されて戻るまで印加電界に対抗してナノ細孔から引き出されるように、DNAの5’末端が最初にナノ細孔に捕捉され、酵素がDNAをナノ細孔を通して移動させる。
5’→3’方向に移動するヘリカーゼについては、2つの様式は、次の通りである。第一に、本方法は、好ましくは、ヘリカーゼが印加電圧により生じた電界と一致して標的配列を細孔を通して移動させるように、ヘリカーゼを用いて実施する。この様式では、標的配列が、最終的に二重層のトランス側に移動するまで電界と一致してナノ細孔を通るように、DNAの5’末端が最初にナノ細孔に捕捉され、酵素がDNAをナノ細孔内に移動させる。或いは、本方法は、好ましくは、酵素が印加電圧により生じた電界に対抗して標的配列を細孔を通して移動させるように、実施する。この様式では、標的配列が、最終的に二重層のシス側に排出されて戻るまで印加電界に対抗してナノ細孔から引き出されるように、DNAの3’末端が最初にナノ細孔に捕捉され、酵素がDNAをナノ細孔を通して移動させる。
用いることができる測定システムは、以下の通りである。
本方法は、細孔が膜に挿入されている膜/細孔システムを検討するのに適する装置を用いて実施することができる。本方法は、膜貫通細孔センシングに適する装置を用いて実施することができる。例えば、本装置は、水溶液を含むチャンバー及びチャンバーを2つの部分に分離するバリアを含む。バリアは、細孔を含む膜が形成されている開口部を有する。
本方法は、国際出願番号PCT/GB08/000562(国際公開第2008/102120号として公開)に記載されている装置を用いて実施することができる。
本方法は、ヌクレオチドとの1つ又は複数の相互作用時の細孔を通る電流を測定するステップを含み得る。したがって、本装置は、電位を印加し、膜及び細孔にわたる電気信号を測定することができる電気回路も含み得る。本方法は、パッチクランプ又は電圧クランプを用いて実施することができる。本方法は、好ましくは電圧クランプの使用を含む。
本発明の方法は、ヌクレオチドとの1つ又は複数の相互作用時の細孔を通る電流を測定するステップを含み得る。膜貫通タンパク質細孔を通るイオン電流を測定するための適切な条件は、当技術分野で公知であり、実施例で開示する。本方法は、一般的に膜及び細孔にわたって電圧が印加された状態で実施される。用いる電圧は、一般的に+2V〜−2V、一般的に−400mV〜+400mVである。用いる電圧は、好ましくは−400mV、−300mV、−200mV、−150mV、−100mV、−50mV、−20mV及び0mVから選択される下限並びに+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV及び+400mVから独立に選択される上限を有する範囲にある。用いる電圧は、より好ましくは100mV〜240mVの範囲にあり、最も好ましくは120mV〜220mVの範囲にある。高い印加電位を用いることによって細孔ごとに異なるヌクレオチドの間の識別を向上させることが可能である。
本方法は、一般的に金属塩、例えば、アルカリ金属塩、ハロゲン化物塩、例えば、アルカリ金属塩化物塩などの塩化物塩などの電荷担体の存在下で実施される。電荷担体は、イオン性液体又は有機塩、例えば、塩化テトラメチルアンモニウム、塩化トリメチルフェニルアンモニウム、塩化フェニルトリメチルアンモニウム又は塩化1−エチル−3−メチルイミダゾリウムを含み得る。上述の具体例としての装置において、塩は、チャンバー中に水溶液で存在する。塩化カリウム(KCl)、塩化ナトリウム(NaCl)又は塩化セシウム(CsCl)が一般的に用いられる。NaClが好ましい。塩濃度は、飽和であり得る。塩濃度は、3M又はそれ以下であり得、一般的に0.1〜2.5M、0.3〜1.9M、0.5〜1.8M、0.7〜1.7M、0.9〜1.6M又は1M〜1.4Mである。塩濃度は、好ましくは150mM〜1Mである。本方法は、好ましくは少なくとも0.3M、例えば、少なくとも0.4M、少なくとも0.5M、少なくとも0.6M、少なくとも0.8M、少なくとも1.0M、少なくとも1.5M、少なくとも2.0M、少なくとも2.5M又は少なくとも3.0Mなどの塩濃度を用いて実施される。高い塩濃度は、高い信号対ノイズ比をもたらし、ポリマーの存在を示す電流が通常の電流の変動の背景と対照して識別されることを可能にする。
本方法は、一般的に緩衝剤の存在下で実施される。上述の具体例としての装置において、緩衝剤は、チャンバー中に水溶液で存在する。あらゆる緩衝剤を本発明の方法に用いることができる。一般的に、緩衝剤は、HEPESである。他の適切な緩衝剤は、トリス−HCl緩衝剤である。本方法は、一般的に4.0〜12.0、4.5〜10.0、5.0〜9.0、5.5〜8.8、6.0〜8.7又は7.0〜8.8又は7.5〜8.5のpHで実施される。用いるpHは、好ましくは約7.5である。
本方法は、0℃〜100℃、15℃〜95℃、16℃〜90℃、17℃〜85℃、18℃〜80℃、19℃〜70℃又は20℃〜60℃で実施される。本方法は、一般的に室温で実施される。本方法は、約37℃などの酵素機能を支持する温度で場合によって実施される。
本方法は、一般的に遊離ヌクレオチド又は遊離ヌクレオチド類似物及び分子歯止め又は酵素の作用を促進する酵素補因子の存在下で実施される。遊離ヌクレオチドは、上述の個々のヌクレオチドのいずれかの1つ又は複数のものであり得る。遊離ヌクレオチドは、アデノシン一リン酸(AMP)、アデノシン二リン酸(ADP)、アデノシン三リン酸(ATP)、グアノシン一リン酸(GMP)、グアノシン二リン酸(GDP)、グアノシン三リン酸(GTP)、チミジン一リン酸(TMP)、チミジン二リン酸(TDP)、チミジン三リン酸(TTP)、ウリジン一リン酸(UMP)、ウリジン二リン酸(UDP)、ウリジン三リン酸(UTP)、シチジン一リン酸(CMP)、シチジン二リン酸(CDP)、シチジン三リン酸(CTP)、環状アデノシン一リン酸(cAMP)、環状グアノシン一リン酸(cGMP)、デオキシアデノシン一リン酸(dAMP)、デオキシアデノシン二リン酸(dADP)、デオキシアデノシン三リン酸(dATP)、デオキシグアノシン一リン酸(dGMP)、デオキシグアノシン二リン酸(dGDP)、デオキシグアノシン三リン酸(dGTP)、デオキシチミジン一リン酸(dTMP)、デオキシチミジン二リン酸(dTDP)、デオキシチミジン三リン酸(dTTP)、デオキシウリジン一リン酸(dUMP)、デオキシウリジン二リン酸(dUDP)、デオキシウリジン三リン酸(dUTP)、デオキシシチジン一リン酸(dCMP)、デオキシシチジン二リン酸(dCDP)及びデオキシシチジン三リン酸(dCTP)を含むが、これらに限定されない。遊離ヌクレオチドは、好ましくはAMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP又はdCMPから選択される。遊離ヌクレオチドは、好ましくはアデノシン三リン酸(ATP)である。酵素補因子は、酵素が機能することを可能にする因子である。酵素補因子は、好ましくは2価金属陽イオンである。2価金属陽イオンは、好ましくはMg2+、Mn2+、Ca2+又はCo2+である。酵素補因子は、最も好ましくはMg2+である。
標的ポリマーは、任意の順序で分子歯止め及び細孔と接触させることができる。標的ポリマーを分子歯止め及び細孔と接触させる場合、標的ポリマーが最初に分子歯止めとの複合体を形成することが好ましい。電圧を細孔にわたって印加するとき、標的ポリマー/分子歯止め複合体が次に細孔との複合体を形成し、細孔を通るポリマーの移動を制御する。
測定の性質は、以下の通りであり得る。
細孔を経て移動するポリマー単位に依存する特性を測定することができる。特性は、ポリマーと細孔との間の相互作用に関連し得る。ポリマーの相互作用は、細孔の狭窄部において起こり得る。測定システムは、特性を測定し、ポリマーのポリマー単位に依存する測定をもたらす。
多種多様な種類の測定を行うことができる。これは、制限なしに、電気的測定及び光学的測定を含む。可能な電気的測定は、イオン電流測定、インピーダンス測定、トンネリング測定(Ivanov APら、Nano Lett、2011年1月12日、11巻(1号)、279〜85頁)及びFET測定(国際出願公開第2005/124888号)を含む。光学的測定を電気的測定と組み合わせることができる(Soni GVら、Rev Sci Instrum、2010年1月、81巻(1号)、014301頁)。測定は、細孔を通して流れるイオン電流の測定などの膜貫通電流測定であり得る。
電気的測定は、Stoddart Dら、Proc Natl Acad Sci、12、106巻(19号)、7702〜7頁、Lieberman KRら、J Am Chem Soc、2010年、132巻(50号)、17961〜72頁及び国際出願公開第2000/28312号に記載されているような標準シングルチャンネル記録装置を用いて行うことができる。或いは、電気的測定は、例えば、国際出願公開第2009/077734号及び国際出願公開第2011/067559号に記載されているようなマルチチャンネルシステムを用いて行うことができる。
複数の特性の測定を用いることが可能である。例えば、1つの可能性は、イオン電流の測定を、例えば、FET測定、光学的測定又は両方を含む、イオン電流のほかの少なくとも1つの追加の特性の測定とともに用いることである。
測定システムは、複数の細孔を含み得る。本装置は、好ましくは複数のポリマー歯止めをさらに含む。本装置は、好ましくは本発明の方法を実施することに関する説明書をさらに含む。本装置は、アレイ又はチップなどのポリマーの解析用の従来の装置であり得る。本発明の方法に関連する上述の実施形態のいずれかは、本発明の装置に同様に適用することができる。
本装置は、好ましくは本発明の方法を実施するために設定する。
本装置は、膜及び複数の細孔を支持することができ、細孔を用いてポリマーの特徴付けを実施するように動作可能であるセンサデバイス;特徴付けを実施するための材料を保持するための少なくとも1つのレザバー;少なくとも1つのレザバーからセンサデバイスに材料を制御可能に供給するように構成された流体工学システム;並びに各試料を収容するための複数の容器を含み、流体工学システムは、試料を容器からセンサデバイスに選択的に供給するように構成されている。本装置は、すべてが参照により本明細書に組み込まれる、国際出願番号PCT/GB08/004127(国際公開第2009/077734号として公開)、PCT/GB10/000789(国際公開第2010/122293号として公開)、国際出願番号PCT/GB10/002206(まだ公開されず)、又は国際出願番号PCT/US99/25679(国際公開第00/28312号として公開)に記載されているもののいずれかであり得る。
本装置は、診断用デバイスであり得る。診断用デバイスは、ベンチトップ又は携帯用デバイスであり得る。デバイスは、カートリッジと連結して稼働させることができ、カートリッジは、ナノ細孔アッセイ構成要素を含み、流体試料を収容するためのものである。カートリッジは、デバイスに格納され又は別の方法でデバイスに作動可能に接続可能であり得る。カートリッジは、再使用又は廃棄のためにカートリッジを空にするためにその後デバイスから除去又は取り外すことができる。その後、未使用又は空のカートリッジをデバイスとともに用いることができる。カートリッジは、デバイスの不可欠な部分であり得る。この場合、デバイスは、使用後使い捨てできる。カートリッジは、一般的に流体試料を収容するための試料適用部(sample application region)を有する。試料適用部は、例えば、尿試料を直接収容するための微小流動チャンネル(microfluidic channel)又は多孔性試料パッドであり得る。試料の量は、一般的に0.25uL〜10mLであろう。試料適用部は、患者からの試料、例えば、フィンガースティックにより得られた血液の試料を直接収容する役割を果たし得る。カートリッジは、赤血球をろ過するための赤血球フィルターを含み得る。カートリッジは、塩、抗凝固剤又は緩衝剤などの乾燥試薬を含み得る。デバイスは、一般的に特徴ベクトル、患者ID及び測定結果に関する情報のようなデータを送り又は受け及び保存するためのデータ入力及び出力ポート並びに記憶装置を含む。デバイスは、リモートサーバー又は医療専門家との通信のための無線接続性を有し得る。一般的に、デバイス及びカートリッジは、特定の分析対象物の測定に限定されず、特定の分析対象物を測定する能力があり得、対象の特定の分析対象物に関する特徴ベクトルは、アップロードされ、記憶装置に保存され得る。
理想的には測定は、単一ポリマー単位(k=1であるk個のポリマー単位を含むkマーと考えることができる)に依存すると思われるが、多くの一般的な測定システムでは、測定は、kが複数の整数である、k個のポリマー単位を含むkマーに依存する。すなわち、各測定は、kマーにおけるポリマー単位のそれぞれの配列に依存する。一般的に測定は、ポリマーと測定システムとの間の相互作用に関連する特性についてのものである。
本発明のいくつかの実施形態において、ポリマー単位の小グループ、例えば、ポリマー単位のダブレット又はトリプレット(すなわち、k=2又はk=3である)に依存する測定を用いることが好ましい。他の実施形態において、ポリマー単位のより大きなグループに依存する、すなわち、「広い」分割を用いた測定を用いることが好ましい。そのような広い分割は、ホモポリマー領域を検討するのに特に有用であり得る。
測定がkマーに依存する場合、測定が可能なkマーの可能な限り多くのものについて分解可能である(すなわち、分離される)ことが望ましい。一般的にこれは、異なるkマーによってもたらされる測定が測定範囲にわたって十分に広がり、且つ/又は狭い分布を有する場合に達成することができる。これは、異なる測定システムにより様々な程度に達成され得る。しかし、異なるkマーによってもたらされる測定が分解可能であることが必須でないことが本発明の特段の利点である。
図1に脂質二重層などの生体膜2に挿入された生体細孔1であるナノ細孔を含む測定システム8の例を概略的に示す。一連のポリマー単位4を含むポリマー3は、矢印により示すように生体細孔1を経て移動する。ポリマー3は、ポリマー単位4がヌクレオチドであるポリヌクレオチドであり得る。ポリマー3は、生体細孔1の活性部分5と相互作用して、膜貫通電流などの電気的特性が生体細孔1の内側のkマーに基づいて変化することをもたらす。この例において、活性部分5は、3個のポリマー単位4のkマーと相互作用すると示されているが、これは、限定的ではない。生体膜2の各側に配置されている電極6は、電気的特性を測定する測定回路7に接続されている。したがって、測定は、生体細孔1の内側のkマーに依存する。
測定システムによる、また本発明により解析すべき入力信号である、一般的な種類の信号出力は、この信号の種類に限定されないが、「ノイズの多いステップ波」である。この形態を有する入力信号の例は、ナノ細孔を含む測定システムを用いて得られるイオン電流測定の場合について図2に示す。
この種の入力信号は、複数の測定の連続する群が同じkマーに依存する測定の入力系列を含む。各群における複数の測定は、一定であり、下で述べる多少の変動を受けやすく、したがって、測定システムの状態に対応する、信号における「レベル」を形成する。信号は、大きい組であり得る、一組のレベルの間を移動する。機器類のサンプリング速度及び信号上のノイズを考慮すると、レベル間の遷移は、瞬間的であると考えることができ、したがって、信号は、理想的なステップトレースによって近似することができる。
各状態に対応する測定は、事象の時間スケールにわたって一定であるが、ほとんどの場合、測定システムは、短時間スケールにわたる変動を受けやすい。変動は、例えば、電気回路及び信号処理により、特に電気生理学の特定の例における増幅器により生じる測定ノイズに起因し得る。小さな大きさの特性が測定されるため、そのような測定ノイズは不可避である。変動は、測定システムの基礎をなす物理的又は生物学的システムにおける固有の変動又は広がりにも起因し得る。ほとんどの測定システムは、測定ノイズが避けられる理想的な場合でさえ、多かれ少なかれそのような固有の変動を経験する。所定の測定システムについて、変動の両原因が寄与している可能性があり、或いはこれらのノイズ源の1つが優勢である可能性がある。
さらに、一般的に予想できないほど変化する群における測定の数の先験的知識は存在しない。
これらの変動の2つの因子及び測定の数の知識の欠如のために、例えば、群が短く、且つ/又は2つの連続する群の測定のレベルが互いに近い場合、群のいくつかを識別することが困難となり得る。
信号は、測定システムにおいて発生する物理的又は生物学的過程の結果としてこの形をとる。したがって、測定の各群は、「状態」と呼ぶことができる。
例えば、ナノ細孔を含むいくつかの測定システムにおいて、ナノ細孔を経るポリマーの輸送からなる事象は、歯止めがかかったように起こり得る。歯止めがかかった移動の各ステップ中に、ナノ細孔にわたる所定の電圧におけるナノ細孔を流れるイオン電流は、一定であり、上述の変動を受けやすい。したがって、測定の各群は、歯止めがかかった移動のステップに関連する。各ステップは、ポリマーがナノ細孔に対して各位置に存在するという状態に対応する。状態の期間中の正確な位置のある程度の変動があり得るが、状態の間にポリマーの大規模な移動がある。測定システムの性質によって、状態は、ナノ細孔における結合事象の結果として起こり得る。
測定の一部として又は登録情報をもたらす付加的源から得られる他の情報が存在し得る。この他の情報は、状態が同定されることを可能にし得るものである。
或いは、信号は、任意の形をとり得る。これらの場合、kマーに対応する測定は、発光及び遷移の組によっても記述することができる。例えば、個々のkマーに依存する測定は、これらの方法による記述に適する方法で行われる一連の測定を含み得る。
所定の測定システムがkマー及びkマーのサイズに依存する測定を可能にする程度は、実験的に検討することができる。例えば、公知のポリマーを合成し、測定システムに対してあらかじめ定めた位置に保持して、得られる測定から測定が測定システムと相互作用するkマーの同一性にどのように依存するかを検討することができる。
1つの可能なアプローチは、当該組の各ポリマーごとに異なるあらかじめ定めた位置におけるkマーを除いて同じ配列を有するポリマーの組を用いることである。測定に対する影響を検討するために、kマーのサイズ及び同一性を変化させることができる。
他の可能なアプローチは、あらかじめ定めた位置における検討中のkマーの外側のポリマー単位が当該組の各ポリマーごとに異なるポリマーの組を用いることである。そのようなアプローチの例として、図3は、ナノ細孔を含む測定システムにおける2つのポリヌクレオチドの電流測定の度数分布である。1つのポリヌクレオチド(polyTと表示)において、ナノ細孔の領域におけるすべての塩基がTであり(polyTと表示)、他のポリヌクレオチド(N11−TATGAT−N8と表示)において、特定の固定6マー(配列TATGATを有する)の左側の11塩基及び右側の8塩基は、変化可能である。図3の例は、電流測定に関して2つの鎖の優れた分離を示している。N11−TATGAT−N8により示される値の範囲も、polyTにより示されるものよりわずかに広い。この方法で、また他の配列も有するポリマーを測定することにより、問題の特定の測定システムについて、測定が良好な近似で6マーに依存することを確認することができる。
このアプローチ又は同様のものは、位置及び最小kマーの記述を決定することを可能にするあらゆる測定システムについて一般化することができる。
同様の方法論は、一般的な測定システムにおける十分な近似のkマーの位置及び幅を特定するために用いることができる。図3の例において、これは、最良近似kマーの位置を検出するために細孔に対する6マーの位置を変化させることにより(例えば、前及び後のNsの数を変化させることにより)、また固定塩基の数を6から増加又は減少させることにより達成される。kの値は、十分に狭い値の広がりを受ける最小限のものであり得る。kマーの位置は、ピーク幅を最小化するように選択することができる。
一般的な測定システムについては、異なるkマーに依存する測定がすべて一義的に分解可能であるとは限らないということが通常当てはまる。例えば、図3に関連する測定システムにおいて、固定6マーを有するDNA鎖によってもたらされる測定の範囲が2pA程度であることが認められ、このシステムのおおよその測定範囲は、30pA〜70pAである。6マーについては、4096種の可能なkマーが存在する。これらのそれぞれが2pAの同様の変動を有することを考慮すると、40pAの測定範囲においてこれらの信号が一意的に分解可能でないことは、明らかである。一部のkマーの測定が分解可能である場合でさえ、多くの他のkマーの測定はそうでないことが一般的に認められる。
多くの実際の測定システムについては、ポリマー単位のレベルで分解される単一の値を得るために、それぞれが同じポリマー単位に一部依存するk個の測定を変換する機能を特定することは可能でなく、或いは、より一般的にはkマーの測定は、kマーの数より小さいパラメーターの組によって記述可能でない。
例として、ナノ細孔を含む特定の測定システムについて、ポリヌクレオチドの実験的に得られるイオン電流測定が単純1次線形モデルによって正確に記述できないことが実証される。これは、下でより詳細に述べる2つの訓練セットについて実証される。この実証のために用いる単純1次線形モデルは、以下の通りである。
電流=和[fn(Bn)]+E
ここで、fnは、測定システムにおける各位置nに存在する各塩基Bnの係数であり、Eは、実験の変動による偶然誤差である。当技術分野で公知の多くの方法のいずれか1つを代わりに用いることができるが、データは、最小二乗法によりこのモデルに適合させる。図4及び5は、電流測定に対する最良モデル適合のプロットである。データがこのモデルにより十分に記述された場合、ポイントは、一般的実験誤差(例えば、2pA)内で対角線を厳密にたどるはずである。これは、いずれの組の係数についてもデータがこの線形モデルによって十分に記述されないことを示す場合ではない。
測定の時間順序シーケンスを解析する特定の方法を述べることとする。
本方法は、図6に示し、図6に概略的に示す解析装置10においてコンピュータにより実施することができる。解析装置10は、コンピュータ装置で実行されるコンピュータプログラムにより使用することができ、又は専用ハードウエア装置により使用することができ、又はそのいずれかの組合せにより使用することができる。いずれの場合にも、方法により使用されるデータは、解析装置10における記憶装置に保存される。コンピュータ本装置は、用いる場合、あらゆる種類のコンピュータシステムであり得るが、一般的に通常の構成のものである。コンピュータプログラムは、適切なプログラミング言語で書くことができる。コンピュータプログラムは、あらゆる種類のものであり得る、コンピュータ可読保存媒体(すなわち、非一時的媒体)、例えば、コンピューティングシステムのドライブに挿入でき、情報を磁気的、光学的若しくは光磁気的に保存することができる記録媒体;ハードドライブなどのコンピュータシステムの固定記録媒体;又はコンピュータメモリに保存することができる。
十分な時間分解能を有する入力信号11について実施され、測定が時系列的であり、いずれの群における測定の数の先験的知識もなしに同じkマーに依存する複数の測定の連続する群を含む上述の種類の一連の測定(又は下でさらに述べるような、より一般的にあらゆる数の系列(any number of series))を含む方法を最初に述べる。
そのような入力信号11の例は、先に述べたように図2に示す。
状態検出ステップS1において、入力信号11を処理して、測定の連続する群を特定する。
状態検出ステップS1は、以下のように入力信号11の微分係数の短期増加を探す図7に示す方法を用いて実施することができる。
ステップS1−1において、入力信号11を微分して、その微分係数を得る。
ステップS1−2において、ステップS1−1からの微分係数を低域フィルタリングにかけて、高周波ノイズ(微分が増幅する傾向がある)を抑制する。
ステップS1−3において、ステップS1−2からのフィルター処理微分係数を閾値処理して、測定の群間の転移点を検出し、それにより、データの群を特定する。
ステップS2において、各特定された群における測定は、各群についての特性を示す1つ又は複数の特徴の値を導出することである。最も簡単なアプローチにおいては、単一の値、例えば、平均値を導出するが、情報量を増加させるために同じ又は異なる特性を示す特徴の複数の値を用いることができる。用いることができる特徴の例は、測定の群の平均値(平均値又は中央値又は他の平均値);測定の群の期間;測定の群の分散;測定の群の分布、非対称情報;測定の信頼;又はそれらの組合せを含む。
ステップS2からの特徴出力の値は、値がそれらが導出される群と同じ順序の時間順序的である特徴ベクトル12を形成する。
ステップS2は、情報量は減少しているが、信号の重要な特性が維持されている入力信号11の表現をもたらす結果を有する。
一般的に、入力信号11と同じ順序の時間順序的である、入力信号11の特性を示す1つ又は複数の特徴の値の特徴ベクトル12を導出するためにステップS1及び/又はS2の代わりに他の方法をもう1つの選択肢として用いることができる。
特に、いくつかのkマーが1つの測定のみをもたらす又は測定を全くもたらさない程度に時間分解能がより低い場合、群を具体的に特定することは必要でなく、したがって、方法を入力信号に適用することができる。
状態検出ステップの可能な単純化は、データの2つの隣接ウインドウの平均値を比較するスライディングウインドウ解析を用いることである。閾値は、平均値の差に直接おくことができるか、又は2つのウインドウにおけるデータポイントの分散に基づいて設定することができる(例えば、Studentのt統計量を計算することにより)。これらの方法の特有の利点は、データに多くの仮定を課すことなく、適用することができる点である。
例として、図8に移動窓t検定により減力された実験的に測定された入力信号11を示す。特に、図8に淡い線として入力信号11を示す。状態検出後のレベルを黒線として重ね合わせて示す。図9に転移の間の平均値から各状態のレベルを計算した、全トレースについて得られた値を示す。
ステップS3において、ステップS2において導出された特徴ベクトル12を少なくとも1つの他の特徴ベクトル13と比較して、それらの間の類似性を判定する。点線により示されているように、他の特徴ベクトル13は、解析装置10の記憶装置15に保存されている1つ又は複数の特徴ベクトル14であってもよく、又は代わりに他のポリマーの測定の系列である入力信号11からステップS1及びS2を用いて導出された1つ又は複数の特徴ベクトル12であってもよい。
ステップS3は、検討中のポリマーに関する有用な情報を得るために様々な方法で実施することができる。ステップS3のいくつかの非限定的な例は、以下の通りである。
図10に示すステップS3の第1の例において、ステップS2において導出された特徴ベクトル12を、ライブラリとしての、少なくとも1つのクラスについての解析装置10の記憶装置15に保存されている複数の特徴ベクトル14の1つ又は複数のものである他の特徴ベクトルと比較する。この場合、ステップS3において、導出された特徴ベクトル12が判定された類似性に基づいてクラスの1つに属するとして得られるポリマーを分類する分類データ16が得られる。
記憶装置15における特徴ベクトル14により表現されるポリマーの性質によって、類似性は、導出された特徴ベクトル12の全体又は一部と記憶装置15に保存されている特徴ベクトル14の全体との間で、或いは導出された特徴ベクトル12の全体又は一部と記憶装置15に保存されている特徴ベクトル14の一部との間で判定することができる。
この場合、場合によって本方法は、例えば、同じ試料からの他のポリマーの測定の系列である入力信号11について繰り返すことができる。その場合、次のステップS4及びS5のいずれか又は両方を実施することができる。
ステップS4において、各クラスにおけるポリマーの数を数えることができる。それは、検討中のポリマーの集団のプロファイルに関する情報を提供する。
ステップS5において、導出された特徴ベクトル12を、導出された特徴ベクトル12のポリマーが属すると分類されるクラスの記憶装置15に保存されている特徴ベクトル14と再び比較する。この比較において、類似性を再び判定するが、今度は、当クラスについて導出された特徴ベクトル12が特徴ベクトル14と異なる局所領域を特定するためである。導出された特徴ベクトルが予期されるものと異なる局所領域のそのような特定は、ポリマーの長い配列の比較的に小さな領域の変化が重要である多くの応用において非常に強力である解析技術を提供するものである。そのような技術の1つの例は、ポリヌクレオチドであるポリマーにおける突然変異を特定することである。
ステップS3において、比較のために用いる特徴ベクトル13は、測定されるポリマーによって記憶装置に保存されている特徴ベクトル14から選択することができる。
記憶装置15に保存されている特徴ベクトル14は、重複領域を有する2つ以上の特徴ベクトルを含み得る。その場合、類似性は、ステップS3において判定することができ、特徴ベクトル14の非重複領域を導出された特徴ベクトル12との類似性の判定に用いる。
図11に示す第2の例において、ステップS3は、複数のポリマー、例えば、同じ試料からのポリマー又は共通ポリマーの断片であるポリマーについてステップS1及びS2を実施することによって導出された複数の特徴ベクトル12について実施する。
この第2の例において、ステップS3は、以下のステップを含む。
ステップS3−1において、複数の導出された特徴ベクトル12を互いに比較し、それらの間の類似性を判定する。
ステップS3−2において、複数の導出された特徴ベクトル12をそれらの類似性に基づいてクラスタリングする。特に、同様の特徴ベクトル12のクラスターをクラスとして特定する。ステップS3−2は、各導出された特徴ベクトル12がクラスの1つに属するものとして導出されるポリマーを分類する分類データ16をもたらす。
分類データ16は、上述のようにS4及び/又はS5により処理することができる。
第3の例において、ステップS3は、共通ポリマーの断片である複数のポリマーについてステップS1及びS2を実施することにより導出される複数の特徴ベクトル12について実施される。この場合、ステップS3において、複数の導出された特徴ベクトル12を互いに比較し、それらの間の類似性を特徴ベクトル12の重複部分について判定する。これにより、断片の入力信号から共通ポリマーに関する情報を構築することが可能となる。
ステップS3の第4の例は、ステップ5と同様であるが、導出された特徴ベクトル12と記憶装置15に保存された特徴ベクトル14との比較を含む。この比較において、類似性を判定して、導出された特徴ベクトル12が記憶装置における特徴ベクトル14と異なる局所領域を特定する。この第4の例は、上述のステップ5と同様の利点を有するが、ポリマーの予想される種類があらかじめ知られている場合に適用でき、したがって、比較は、導出された特徴ベクトル12を最初に分類する必要なしに、その予想される種類についての特徴ベクトル14と行うことができる。
類似性を判定するためにステップS3及びS5において適用することができる数学的手法の一部を述べることとする。
1つのアプローチは、既存のペアワイズダイナミックプログラミングシーケンスアライメントアルゴリズム(pairwise dynamic programming sequence alignment algorithms)、例えば、全体的アライメント用のNeedleman−Wunschアルゴルズム又は局所アライメント用のSmith−Watermanアルゴルズムを修正することである。
修正は、置換マトリックスを特徴ベクトル上で機能する距離測度(distance measure)で置換することを含み得る。例えば、距離測度は、データポイント間の電流の絶対的差の測定であり得る。距離関数は、各位置における複数の測定、例えば、電流測定の平均値及び分散も考慮し得る。
修正は、当技術分野で公知であるギャップ採点メカニズム、例えば、コンスタントギャップペナルティ、リニアギャップペナルティ又はアフィンギャップペナルティに対しても行うことができる。
これらのアルゴリズムは、2つの特徴ベクトル、距離関数及びギャップペナルティの関数であるアライメントスコアを出力する。アライメントスコアは、類似性を判定するのに用いることができる。
他の方法もこれらのタスクを達成するために用いることができるが、これらの修正アライメントアルゴリズムは、クラスタリング、コンセンサス構築及びパターンマッチングに用いることができる。
多重アライメントアルゴリズムもペアワイズアライメントについて述べたのと同様な方法で修正することができる。
上述のように、ギャップ付きアライメント技術を用いることによるマッチ特徴ベクトルの代わりの代替アプローチは、一般的に特徴ベクトルにおける連続エントリを含む、より短いサブベクトルにより特徴ベクトルを表すことである。例えば、特徴ベクトルが(1,2,3,4,5)であった場合、我々はそれを長さ3のサブベクトルにより表して、新たな表示{(1,2,3),(2,3,4),(3,4,5)}を得ることができた。我々の応用については、サブベクトルは、しばしばかなりより長い(>10)ものであり、したがって、時系列的情報の多くを維持している。
サブベクトルに基づく特徴ベクトルの類似性は、サブベクトルの組がどの程度厳密に一致しているかに基づいて定義する。これは、ギャップ付きアライメントタイプのアルゴリズムよりも比較の効率のよい手段である可能性を有する。その理由は、我々はギャップを許容せずにサブベクトルを直接比較することができるからである。
特徴サブベクトルを適切に打ち切る(例えば、各数値を0.1の最近地まで丸めることにより)場合、サブベクトルの正確又は部分的一致を用い、どの程度の割合のサブベクトルが一致又は部分的に一致するかにより類似性を計算することができる。打ち切りにより、比較のために整数計算を用いることも可能となる。或いは、ハッシュ関数をサブベクトルに適用して、速やかに比較することができるサブベクトルの存在又は非存在を意味する固定長「フィンガープリント」(例えば、Karp R.、Rabin M.(1987)「Efficient randomized pattern matching algorithms」/IBM J. Res Development、31巻、249〜260頁参照)を得ることができる。
マッチングサブストリング(matching sub-strings)に関する同様の発想が、データを短い断片に分割し、これらを大規模ライブラリと対照して適合させるBLAST(Altschul S.F.、Gish W.、Miller W. Myers E.W. & Lipman D.J. (1990)「Basic local alignment search tool」、J. Mol. Biol.、215巻、403〜410頁)のようなアルゴリズムにより用いられている。
代替アプローチは、以下のようなHMM(Hidden Markovモデル)ビタビ(Viterbi)経路を用いることである。
一般的に、対での類似性のアライメントベース及びサブベクトルベースの尺度は、同じ方法で比較される特徴ベクトルの対を扱う。結果は、特徴ベクトルA及びBの対を考えると、Bに対するAの類似性はAに対するBの類似性に等しいということである。
しかし、比較する特徴ベクトルの1つがライブラリ特徴ベクトルである場合、当特徴ベクトルが「モデル」又は「訓練配列」であったかのように問題を扱うことが自然である。この場合、アライメントは、以前に記載された(US61/538,721、GB1117574.2)「入出力経路(forced path)」訓練モデルと同様の方法で構築されたモデルを用いたHMM法を用いて実施することができる。当技術分野で公知であるビタビ以外のアルゴリズム、例えば、Forwards−Backwardsアルゴリズムも適用することができる。アライメントアルゴリズムの場合と同様に、類似性の尺度として用いることができる出力スコアが存在する。ビタビの場合、これは、経路の全尤度である。全尤度は、我々が2つの特徴ベクトルの役割を交換した場合には、等しいことが保証されないが、特に分類の問題については、これは、一般的に問題ではない。
クラスタリングについては、以下のアプローチを用いることができる。
クラスタリングは、ポリマーの測定集団からの入力信号11について実施し、ある種の類似性基準に従って存在するポリマーの数及び/又は種類を判断することを含む。
距離(又は類似性/非類似性)のマトリックスを考慮すると、階層的クラスタリングの方法は、周知であり、標準モノグラフで取り上げられる(例えば、Gordon A.D. (1999) Classification、第2版、Chapman and Hall/CRC)。階層的凝集法もCLUSTALなどのパッケージでの配列アライメントに用いることができる(Higgins D.G.及びSharp P.M. (1988) CLUSTAL: a package for performing multiple sequence alignment on a microcomputer、Gene、73巻、237〜244頁)。
全体又は局所アライメントアルゴリズムを用いて、我々が特徴ベクトルの各対の間の類似性(又は場合によって距離)の尺度を有するように、すべての特徴ベクトルを互いに対でアライメントする。これらの類似性値は、第m特徴ベクトルと第n特徴ベクトルとの類似性を含む第(m,n)入力を有する類似性マトリックスとして記録することができる。次に、当類似性マトリックスに基づいてクラスタリング技術を用いる(一般的に階層的凝集型クラスタリング)。
凝集型クラスタリングの2つの極端は、単一連結(最も類似している特徴ベクトル対に基づく凝集ステップ中のクラスターの対を採点する)及び完全連結(最も異なる特徴ベクトル対に基づくクラスターの対を採点する)クラスタリングである。類似性を判定するためのアルゴリズムの最善の組合せ及びクラスタリング技術は、所定の応用について予想されるクラスターの性質に依存する。
例えば、クラスターが高い類似性を示す特徴ベクトルの対の重複フラグメントを有する特徴ベクトルで構成されていると予想される場合、局所アライメントスコア及び単一連結凝集型クラスタリングが1つの適切な選択肢であると思われる。これの例は、配列1及び2が配列2及び3と同様に重複している、実施例2に示す。我々のクラスタリングタスクにおいて、我々がいくつかの他の特徴ベクトルに囲まれた単一クラスターとしてこれらを同定することを望むならば、我々は局所アライメントスコアを用いて、短重複領域を正しく同定することに成功する可能性が最も高いこととなる。単一連結クラスタリングは、1が2と重複を有し、2が3と重複を有するので、配列を同じクラスター中に連結することとなり、しかし、完全連結凝集型クラスタリングは、配列1及び3が配列スペースにおいて実際の重複を有さず、したがって、特徴ベクトルに関して低い類似性を有する可能性があるので、不十分な選択肢であることとなる。
クラスターが全特徴ベクトルにわたってほぼ同じであると予想される場合(例えば、特徴ベクトルが公知の対照標準と比べてほぼ同じ位置で始まり、終わることが既に確認され、我々が当対照標準とわずかに異なるクラスを発見することを期待する場合)、全体的アライメントスコア及び完全連結凝集型クラスタリングがより適切であることとなる。
多くの状況において、類似及び重複特徴ベクトルの群/クラスター/クラスを表すための単一参照特徴ベクトルを生成させることができることは有用である。以下は、これを達成するために用いることができる反復アルゴリズムの概要である。
1.長初期特徴ベクトルを生成させる。我々はこれをランドマークベクトルと呼ぶ。
2.各特徴ベクトルをランドマークベクトルとアライメントする。
3.新たな空のランドマークベクトルを生成させる。
4.ステップ2からのアライメントされた特徴ベクトルに沿って最初から最後まで移動し、アライメントした特徴ベクトルの部分pが範囲r内にある場合には、当位置における平均値をランドマークベクトルに加える。
5.ステップ4で生成したランドマークベクトルが連続反復で同じになるまで、又は反復の最大回数に到達するまで、2〜4を繰り返す。
或いは、ランドマークベクトルは、多くの又はすべての可能なアライメントに基づいて更新することができる。
それとアライメントした特徴ベクトルを用いるこの方法の結果として生成されるランドマークベクトルは、特徴ベクトルの「コンセンサス」をもたらす。
ステップ1において、特徴ベクトルのすべての対をアライメントし、最小限のレベルの類似性を条件として選択された、ほとんどの状態を含むアライメントされた対を得ることができ、初期特徴ベクトルを得るために状態をアライメントする各位置における平均をとる。代替法が可能であり、例えば、最長特徴ベクトルを選択することなどである。
ステップ2で用いるペアワイズアライメントアルゴリズムは、上に記載されている。
ステップ4において、p及びrは、特定の状況に応じて変化させることができ、平均値は、位置の他の尺度により置き換えることができ、rは、広がりの他の尺度により置き換えることができる。
このコンセンサス構築法は、特徴ベクトルに関する多重アライメントアルゴリズムを提供する。ランドマークとアライメントされた状態(landmark-aligned states)は、各特徴ベクトルを表す固定長ベクトルをもたらす。
分類へのいくつかのアプローチは、以下の通りである。
分類のタスクは、整数m>1のmクラスの1つに「問い合わせ」特徴ベクトル割り当てることである。これらのmクラスに属する記憶装置15における「標的」特徴ベクトル14のライブラリが存在する。
解決の方法は、標的特徴ベクトルが不均一(全体的レベルで相互に非類似)であるか又は均一(相互にすべて全体的に類似し、若干の比較的にわずかな差、一般的に局所的な差を伴う)であるかどうかに依存するが、方法の混合が適切である、これらの極端の間にあるケースが明らかに存在する。
不均一な場合、クラスの決定のための最も簡単な方法は、上述の方法の1つにより問い合わせ特徴ベクトルと標的特徴ベクトルとの間の類似性を計算し、問い合わせ特徴ベクトルを最大の類似性の標的特徴ベクトルを有するクラスに割り当てることである。
1クラス当たりの複数の標的特徴ベクトルが存在する場合、例えば、当クラスにおける標的特徴ベクトルにわたる平均値を含む、要約標的特徴ベクトルを各クラスごとに導き出し、前述のように処理する。アライメントベースの類似性尺度については、例えば、最初に上述の「コンセンサスビルディング」法を用いて特徴ベクトルの多重アライメントを行うことが必要である。
或いは各標的特徴ベクトルを独立に扱うことができる。例えば、最も簡単なケースにおいて、問い合わせ特徴ベクトルを最も近い標的特徴ベクトルに割り当てる。このアプローチが可能な限り成功するために、1クラス当たりの標的特徴ベクトルの異なる数の主な原因となる統計量の再重み付けがしばしば望ましい。
すべてのクラスにわたるすべての標的特徴ベクトルのアライメントは、不均一の場合には一般的に可能でないが、我々は、それにもかかわらず分類子を得るために学習アルゴリズムを用いることができる。標的特徴ベクトルに対する距離又は非類似性のベクトルは、改善された分類子を得るための多クラス線型判別分析などの多変量学習手法への入力として用いることができる。或いは、固定長ベクトルは、以前に述べたように標準ハッシングアルゴリズムを用いてサブベクトルから生成させることができ、これを学習アルゴリズムへの入力として用いる。均一の場合における学習アルゴリズムに関するそれ以上のことは、以下の通りである。
多くの方法が最も可能性の高いクラスを出力するだけでなく、分類の可能性が正しいことが、一般的に可能である。
均一の場合、同じ又は同様な方法を不均一の場合と同様に適用することができるが、特徴ベクトルにわたるランダム変動は、主要な関心事である系統的局所変動を十分にマスクし、クラス間を正しく識別するための重要な情報を提供し得る。
したがって、標的特徴ベクトル間の重要な差はどのようなものかを学習すること、又はより一般的には、既知のクラスを有する特徴ベクトルの訓練セットを考慮すると、我々が特徴ベクトルのクラスを予測することを可能にする正しい分類のための規則を学習することは、しばしばより効率的である。
不均一の場合と異なり、上述の「コンセンサスビルディング」の場合、及び学習アルゴリズムに固定長入力ベクトルとして入力されたランドマークとアライメントされた状態と同様に、特徴ベクトルを最初に共通参照特徴ベクトル(例えば、標的特徴ベクトルのコンセンサスアライメントによるランドマーク)とアライメントすることができる。
既知のクラスの特徴ベクトルの訓練セットを考えると、標準的な統計的及び機械学習分類手法は、新たな特徴ベクトルのクラスを予測するのに用いることができる。例えば、決定樹分類子(例えば、C4.5. Quinlan J.R. (1993) C4.5: Programs for Machine Learning、Morgan Kaufmann Publishers、ただしこれに限定されない)は、参照アライメント特徴ベクトルの特定の位置が1つのクラスのみの特定の値を上回ることを学習し得る。神経回路網、ランダムホレスト及びサポートベクターマシンなどのいわゆるブラックボックス法は、解釈可能な規則を必ずしも作るとは限らないが、クラスメンバーの予測を行うのに用いることができる。代替法において、専門家の知識も組み込むことができる、ベイジアンネットワークを実装することができる。
それは、クラスが参照(例えば、ゲノムの保存度がより低い領域に対応する)とのアライメントの後に同じ位置の周りに変化する場合に特に興味深い。この場合、アライメントを考慮すると、クラス内変動と比べて高いクラス間変動を有する1つ又は複数の連続的な位置を直接探すことができる。
過学習を避け、一般化可能性の発想を得るためにこれらの方法により交差検定及びホールドアウトセット(hold-out sets)などの標準技術を用いることは、一般的に有益である。
アライメントステップから始めるよりむしろ、我々も学習アルゴリズムへの入力としてサブベクトルを用いる。固定長ベクトルは、前述のように標準ハッシングアルゴリズムを用いてサブベクトルから生成させることができ、これを学習アルゴリズムへの入力として用いる。或いは、サブベクトル自体を直接用いることができる(例えば、クラス内ニアネイバーのみを有するサブベクトルを検索するアルゴリズムを用いる)。
均一又は不均一な場合に明らかに該当しない問題は、特に最初に問題空間をクラスタリング(上述の「クラスタリング」と同様に)を用いてクラスの均一群に細分化することにより、2つの場合についての方法の混合を用いて処理することができる。
例えば、ステップS5又はステップS3の第4の例において、導出された特徴ベクトル12が他の特徴ベクトルと異なる場合の局所領域の決定へのアプローチを述べることとする。
一般的に、標的特徴ベクトルとのアライメントを実施し、次いで、問い合わせ特徴ベクトルと標的特徴ベクトルとの間で異なる位置を特定する。
単一クラスからの複数の標的特徴ベクトルが存在する場合、標的特徴ベクトルから参照特徴ベクトルを生成させ(例えば、上述の「コンセンサスビルディング」で述べたランドマーク)、標的特徴ベクトルを参照特徴ベクトルとアライメントして、位置及び参照における各位置における変動の発想を得る(例えば、当位置におけるアライメントした標的特徴ベクトルの平均値及び標準偏差を計算することにより)。問い合わせ特徴ベクトルが標的クラスにおいて生じることがあり得ない値のパターンを示す局所領域は、例えば、我々が各分布を標的特徴ベクトルから推定された平均値及び標準偏差を有するガウス分布と仮定する場合、多くの連続参照アライメント状態にわたる全尤度を検討することによって特定することができる。
本方法は、上述の分類の均一な場合に述べたように特徴ベクトルのクラス間の差を検討するために拡張することができる。これらのクラスは、あらかじめ定義することができ、例えば、それらは、特定の疾患を有する及び有さない患者からのDNA試料であり得る。或いは、それらは、第一にクラスタリングにより得ることができる。
同様に、均一分類法の状況において上述の統計及び機械学習手法(決定樹など)の多くも特徴ベクトルの対又はクラス間で異なる局所領域を発見するために用いることができる。
例えば、上述のステップS3の第3の例における特徴ベクトルのフラグメントからの大特徴ベクトルのアセンブリへのアプローチを述べることとする。
本タイプの特徴ベクトルを用いるために、既存のアセンブリアルゴリズムの大部分は修正することができる。上述のコンセンサス法は、いくつかのアセンブリ応用に適切であり得る。一般的に以下の方法を用いることができる。
特徴ベクトルを最初に「打ち切る」。変換は、測定の各系列に適用され、以下のいずれか1つ又は組合せを含み得る。
1.特徴ベクトルを一連のデルタとして表すこと。
2.特徴ベクトルを電流レベルに基づく一連のクラスとして表すこと。
3.特徴ベクトルを一連のマイルストーン(十分に特徴付けられた)特徴として表すこと。
トレースを打ち切ったならば、標準アセンブリアルゴリズムを用いることができる。例えば、シード配列を抽出し、オーバーラッピングに用いることができる。次いで、オーバーラッパを特徴ベクトル空間変換を用いて読み取りに適応させる。
適用することができる既存のアセンブリアルゴリズムは、Zerbino& Birney、「Velvet Algorithms for de novo short read assembly using de Brujin graphs」、Genome Res.、2008、18巻、821〜829頁及びBatzoglou S.「Algorithmic challenges in mammalian genome sequence assembly」、(2005) Encyclopaedia of genomics, proteomics and bioinformatics、Dunn M.ら編(John Wiley and Sons、New York)を含む。
本発明のいくつかの特定の応用を非限定的な例として述べる。
第1の応用は、ステップS3の第1の例に関連する方法を用いることができる、分子の公知のライブラリ又はパネルと対照して分子を数えることにある。
ライブラリは、記憶装置15に保存された特徴ベクトル14を含む。そのようなライブラリは、特徴ベクトルを学習するための各分子又は分子の組に関する個々の実験に基づく監督又は非監督学習を用いる、後の使用のために生成することができる。
例えば、人は、公知の疾患の一組のDNA/RNA配列を有し得る。これらの測定による又はモデルから得られる分子のフィンガープリントは、事前に公知であり得る。分子の測定を考えると、これは、公知のライブラリと対照して比較し、ライブラリメンバーと分子の類似性を測定することができる。これにより、測定された各分子の同定(この同定は「他のもの」である可能性がある)及び測定された各タイプの分子の相対数の定量が可能である。
ライブラリ又は参照パネルを参照して数えることができるものの例は、以下の通りである。
発現プロファイル:特徴ベクトルを照合することによってmRNA転写物の存在量を比較すること。これは、発現レベルの変化を測定するために用いることができる。そのような遺伝子発現は、発育、疾患、疾患の治療時、1つの臓器と他の臓器との間で変化し得る。
バイオマーカーmiRNAの存在量:これらは、一般的に血液中に循環する20〜25マーRNAオリゴヌクレオチドであり、これらの群の発現レベルの変化は、特定の疾患、特に癌に関連する。定義されたパネルと比較することができ、したがって、パターンマッチングのための比較的に小さな検索空間が存在し得る。
循環血中の胎児コピー数変動:断片化胎児DNAは、母体血液中を循環する。胎児が異数性、例えば、第21、18、11染色体の付加的コピー(直ちに致命的でない主要なもの)を有する場合、細孔解析のためにそれらを濃縮し、次にこれらを参照特徴ベクトルと比較し、数えるために、例えば、対象の染色体のエクソンに対する捕捉プローブを設計することが可能であろう。これのための電流法の主な限界は、母体の染色体と胎児の染色体とを区別することが不可能であることである。PCRを用いる次の遺伝子配列決定に可視でないが、特徴ベクトルの差として可視であり得る胎児及び母体DNA間のメチル化状態の差が存在する。
比較ゲノムハイブリダイゼーション(CGH):様々なゲノム領域のコピー数の変化は、腫瘍細胞(及び上述のように胎児においても)において変化し得る。しばらくの間、これは、比較ゲノムハイブリダイゼーション、すなわち、断片化ゲノムDNAをアレイ上の一連のプローブとハイブリダイズすることにより患者/試料をレファレンスと比較することにより確認された。胎児検査と同様に、特徴ベクトル空間を用いて、これらのコピー数の変化をプロファイルすることができる。
ウイルス又は細菌負荷:感染の重症度の尺度。おそらくある形態の濃縮と併用して、血液1ml当たりの病原体RNA又はDNAのコピーの数を測定する。これは、全病原体ゲノムについて行う必要はないであろう。抗原ドリフト及び/又は抗原変動を確認するために、初期及び後期測定を行うことができる。
本方法は、疫学、例えば、同定(株特定)及び疾患がどのようにして広がり又は発生するかに適用することができる。本方法は、例えば、特定の薬物療法の有効性をモニターするのに又は身体の1つの部位から他の部位への疾患の広がり若しくは患者間の疾患の広がりをモニターするのに用いることができる。
プローブ:その一部が標的分子に結合している、プローブの小集団(例えば、バイオマーカーパネルへのアプタマー)を提供する。結合しなかったものを結合したものから分離し、非結合集団中又は結合集団中の分子を数えて、標的分子を定量する。
例えば、食物中又は培養中の生物の同一性を確定することができた。
第2の応用は、主要集団(複数可)の定量及び試料中に存在する「その他」の測定にある。
例として、DNAオリゴマーの合成を考慮することができる。現在の品質管理法は、一般的にポリアクリルアミドゲル電気泳動(PAGE)、高速液体クロマトグラフィー(HPLC)及び質量分析を含む。合成DNAの試料を測定し、存在する主要集団のシグネチャを決定することができる。次に、合成の誤りをおそらく示す、主要集団と異なる試料中の分子の数を数えることが可能である。特に、差異が特徴ベクトルの特定の位置において起こる場合、それは、合成条件を調節することによって矯正することができる系統的誤りに起因する可能性がある。ナノ細孔測定を反復することにより、改善を検証することができる可能性がある。
第3の応用は、分子の各位置における修飾/差異の測定及び分子の集団内のそれらの修飾/差異の定量にある。
1つの例は、一塩基多型(SNP)と呼ばれるものである。当位置における4つ(又はそれ以上)の許容されたヌクレオチドと比較した既知の位置。「野生型」と比較した既知の位置におけるSNPの存在及び/又は非存在。これは新しい遺伝子座の同定を可能にし得る。同様に、それは、後に述べるような非対立性相同的組換え(NAHR)におけるパラログ特異的変異体の同定を可能にし得る。
他の例は、メチル化に関係する。測定は、既知のメチル化部位において行うことができる。本方法は、それらの部位におけるメチル化の存在、非存在の確認及び/又は定量化を可能にする。本方法はまた、未知の部位の同定を可能にする。本方法は、上述のような胎児スクリーニングに用いるための、個々の分子の「バルク」メチル化状態、例えば、集団の100%が50%修飾されている又は集団の50%が100%修飾されているかどうかの推定を可能にする。特定の遺伝子のメチル化状態は、癌のバイオマーカーとして用いることができる。
他の例は、スプライシング変異体及び/又は転座切断点の同定である。これは、前述の例と同様であるが、特徴ベクトルがマッチングを停止する、又は特徴ベクトルの2分の1が1つの遺伝子座に位置し、他の半分が他所に位置する、位置を特定する。
第4の応用は、特定の既知分子の所望の信頼度での存在及び/又は非存在の識別にある。
これは、第1の応用の比較と同様であるが、ここでは1つの特定の分子への関心が存在し得る。
この方法は、例えば、急速突然変異性疾患における、関連するが、特定の信頼度で(DNA又はタンパク質配列の相同性の測定と同様)既知分子と同じでない分子の集団を同定するために用いることができる。
他の例は、スプライシング変異体と同様に、融合転写物に関係する。特定の融合転写物の検出は、癌の診断に用いられ、例えば、Bcl−abl融合転写物の存在は、白血病を示す。
他の例は、NAHRの診断に関係する。減数分裂中における類似であるが、非対立遺伝子座間の組換えは、ゲノムのかなり大きい部分の欠失又は重複をもたらし、そのような配偶子から発生する胎児の破滅的結末を伴う。これは、影響を受ける遺伝子座のコピー数の変化を引き起こし(上記のCGH参照)、また非対立性相同体の融合もたらし、これは、PSV(SNPと類似であるが、同じでない)を調べることにより検出され得る。
他の例は、導出特徴ベクトルの複数の部分を複数の保存特徴ベクトルと比較する場合に関係する。例えば、既知タンパク質ドメインのDNA配列を用いて、ライブラリ特徴ベクトルを生成させることができ、未知タンパク質をコードするDNAを測定することができる。導出された特徴ベクトルの一部は、例えば、触媒ドメインにより同定することができ、他の部分は、例えば、DNA結合ドメインにより同定することができる。このように、タンパク質の機能を推定することができる。
第5の応用は、アセンブリに関する。
より大きい分子からランダムに分割、系統的に分割又は他のメカニズムにより分割された、より小さく、部分的に重複した特徴ベクトルを読み出す分子の集合から、完全なより大きい特徴ベクトルをアセンブルすることができる。配列アセンブリに用いられるものと類似のアルゴリズム(適応)を用いることができる。或いは、分子の既知の特性(例えば、DNA配列が既知の場合)から粗鋳型特徴ベクトル及び当鋳型特徴ベクトルにマップされた小断片を生成することができる。鋳型が近似的であった場合、鋳型は、過程を通して改良することができる。
ライブラリは、実験的に得る又は情報を用いて得ることができる。
用いられるライブラリの種類の例は、制限なしに、モデルを用いて既知DNA配列から、既知タンパク質配列から、既知ポリマーから構築された特徴ベクトル、実験的に得られた特徴ベクトル、重複導出特徴ベクトルからアセンブルした特徴ベクトル、クラスター測定のコンセンサスから得られる特徴ベクトルを含み得る。ライブラリは、複数の関連特徴ベクトル、複数の非関連特徴ベクトル、不均一又は均一サイズの特徴ベクトル、局所的差異を有する類似特徴ベクトルを含み得る。
DNA断片に対応する特徴ベクトルのライブラリが実験的に得られる例は、例えば、酵素的断片化により系統的に生成された断片、又は例えば、機械的せん断により若しくは非選択的酵素作用によりランダムに生成された断片を使用し得る。ランダムに断片化された導出特徴ベクトルは、ライブラリに用いるより大きな導出特徴ベクトルに優先的にアセンブルすることができる。系統的に断片化されたライブラリは、断片化パターンと類似の領域にわたるライブラリ特徴ベクトルとして優先的に用いることができる。
特徴ベクトルのライブラリが情報を用いて得られる例は、利用可能なデータベース、例えば、公的に利用可能なDNA配列を含むNIH Genbankデータベース(Nucleic Acids Research、2011年1月、39(Database issue):D32-7)を利用し得る。例えば、それらの配列に対応する平均電流の特徴ベクトルを導出するために、以前に用いられたような訓練過程(US61/538,721、GB1117574.2、N114722)から得られたモデルを用いることができる。ライブラリは、特定の応用に興味のある配列に縮小することができる。例えば、ライブラリは、ヒトゲノムのコーディング領域に縮小することができる。
本発明の使用のいくつかの実施例を記載することとする。
以下の実験条件を用いた典型的なナノ細孔実験におけるデータ取得
緩衝溶液:1M NaCl、100mMヘペスpH8.0、1mM ATP、1mM MgCl、1mM DTT、10mMフェロシアン化カリウム(II)、10mMフェロシアン化カリウム(III)、Pt電極
ナノ細孔:MS(B2C)8MspAMS−
(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8
酵素:ヘリカーゼ100nM
電気測定は、1,2−ジフィタノイルグリセロ−3−ホスホコリン脂質(Avanti Polar Lipids)二重層に挿入した単一MspAナノ細孔から得た。二重層は、厚さ20μmのPTFEフィルム(特別注文のDelrinチャンバー中)における直径が約100μmの開口部にわたってMantal−Mueller法により形成させ、2つの1mL緩衝溶液を分離した。すべての実験は、述べた緩衝溶液中で行った。シングルチャンネル電流を1440Aデジタイザーを装備したAxopatch 200B増幅器(Molecular Devices)で測定した。シスコンパートメント(ナノ細孔及び酵素/DNAの両方を加えた)がAxopatchヘッドステージの接地端子に接続され、トランスコンパートメントがヘッドステージの活動電極に接続されるように、Pt電極を緩衝溶液に接続した。
二重層における単一細孔を得た後、DNAポリヌクレオチド及びヘリカーゼを100μLの緩衝液に加え、5分間プレインキュベートした(DNA=1.5nM、酵素=1μM)。このプレインキュベーションミックスを電気生理学チャンバーのシスコンパートメント中の900μLの緩衝液に加えて、MspAナノ細孔におけるヘリカーゼ−DNA複合体の捕捉を開始した(DNA=0.15nM、酵素=0.1μMの最終濃度を得た)。シスコンパートメントへの2価金属(1mM MgCl)及びNTP(1mM ATP)の添加により必要に応じてヘリカーゼATPアーゼ活性を開始した。実験は、+120mVの定電位で行った。
本試験に用いた分析対象物DNA試料は、ANA配列番号1〜19として示す。
DNA分子のパネルからの特定のDNA分子の同定及び定量
この実施例は、特徴ベクトルのあらかじめ決定したライブラリからの溶液中のDNA分子の同定の方法を述べる。
ライブラリの構築は、次のように実施した。ライブラリは、5キロ塩基ゲノム(PhiX174)からそれぞれ約100塩基だけ前の配列に重複した、18個の約400マー配列(ANA ID番号1〜18)を取ることにより構築した。例えば、ANA ID番号2は、ANA ID番号1と100塩基共有し、ANA ID番号3と100塩基共有する)。これらの配列は、すべての鎖に共通で、より大きいゲノムの一部でない、開始における配列及び終了における配列を含む。重複配列は、大きい類似領域の存在下でさえ、異なる分子の同定の実証を可能にする。ライブラリ特徴ベクトルは、各5マー位置(1024個の値)に関連する電流のモデルを考慮することによって平均電流について構築する。この種のモデルの決定は、以前に開示された(例えば、US61/538,721、GB1117574.2、N114722)。
配列1、2及び3の特徴ベクトルを、重複部分を示す図12に示す。各配列の共通末端(上述のような)は、この説明図について除去した。
候補分子特徴ベクトルは、以下のように得た。候補分子は、上及び実施例1で述べた実験方法を用いて得た。候補は、前述したように特定された転移の間の平均電流からなる特徴ベクトルに縮小する。
配列(ANA ID番号1〜18)の1つに属する1例の候補を考慮した。この分子を、上述のアライメントアルゴリズムを用いてライブラリ(ANA ID番号1〜18)と対照して比較した。アライメントからの出力スコアをライブラリメンバーのそれぞれとの類似性の測定として用いる。
アライメントによる比較を実施した。ライブラリ比較からの出力スコアを図13に示す。ライブラリメンバーの1つのスコアが他のすべてのライブラリメンバーのスコアよりもはるかに高いことがわかる。これは、アライメントの一連の妥当なパラメーター化にわたって当てはまる。ここで−1のギャップペナルティ及び逆数絶対差のスコアリング関数を示す(すなわち、より近い一致はより高いスコアである)。
ライブラリ分子13(ANA ID番号13)を用いたアライメントのより綿密な調査により、図14に示すようにより近い一致が実際に存在することがわかる。
これをこの実験におけるすべての候補分子(すべて分子13)について行ったところ、ほとんどの場合に分子が分子13と正しく同定されたことがわかる。分子が正しく同定されなかった場合、これらは、分子12(ANA ID番号12)と誤って同定された。これらは、一般的に主として共有された重複配列を含む、分子の部分的読みである。同定のヒストグラムを図15に示す。我々は、この実験で正しく同定された分子13の168の例を数えている。
DNA断片における一塩基多型(SNP)の測定
ライブラリ構築物及び特徴ベクトルを上で示した方法を用いて生成したが、分子13(ANA ID番号13)のライブラリ特徴ベクトルにおいて、配列に施された3つの変化[old][position][new]、T335A、G357T、C385A(ANA ID番号19)が存在した。分子13の例は、ライブラリ分子に対するこれらの位置における変化を有する(すなわち、3SNP)。ライブラリ特徴ベクトルに対するこれらのSNPの影響を図16に示す。
前の実施例のアライメントベースの同定法を繰り返したところ、これらのSNPが分子の同定に対して有意な影響を有さないことが示された。分子の大部分は、依然として正しく同定されており、SNPが与えられた場合誤って同定するわずかな傾向がある。傾向の増加は、同じ配列を共有するが、SNPを有さないANA ID番号12の配列に起因する。同定のヒストグラムを図17に示す。
SNPの判定のために、HMM及びビタビ経路をアライメントのために用いた。その理由は、これが例えば、以前に用いられたパラメーターを含むNeedleman−Wunschよりも良好な経路制約を有する(すなわち、ミスマッチSNP領域を通してより良好にアライメントする)からである。図18に示すアライメントは、以前に示した理想化ライブラリ突然変異と十分比較されている。3つのSNPが図18に明確に認められる。
176分子のデータセットについて検討することにより、これらのSNP位置を明確に同定することができる。図19にビタビアライメントライブラリと候補特徴ベクトルとの間の電流の差を示す。実測特徴のいくつかが各単一変化により影響される(すなわち、配列の単一変化がいくつかの隣接kマーに影響を及ぼす)ので、いくつかの位置における335及び357の場合において、3つのSNPが可視である。
SNPを有さないANA ID番号13のライブラリ特徴ベクトルを用いて、この実験の対照変形形態を行った。この場合、図20に示すようにライブラリとの一貫した差は確認されず、どの位置も一貫性のある逸脱を示さない。
主要集団の同定及び類似しているが、異なる亜集団の測定
この実施例は、模擬データにより機能する。60の特徴ベクトル(平均電流の)の組をANA ID番号13についてシミュレートする。シミュレーションの10例は、SNPも含む。1pAの標準偏差を有するガウスノイズを各値に加え、各ベクトル内の値の5%をランダムに削除する。データをシミュレートすることのほかに、配列のさらなる知識を用いない。
このデータセットを用いて(且つ配列の知識なしに)、前述のランドマーク法によりコンセンサスを構築する。図21にすべてのデータをコンセンサスに対してアライメントした、この方法の最終出力を示す。我々は、SNPがおおよその位置337に含まれている領域を明確に確認する。
実施例3と同じ解析を実施すると、図22に示すように、SNPが通常分子51〜60に同定されたことがわかる。
多くの集団の同定、ライブラリの生成及び相対的カウント
2つの場合を考慮する。すなわち、第1に2つの種が存在する場合及び第2に3つの種が存在する場合である。データは、実施例2のANA ID番号13、9及び5の配列を用いてシミュレートする。しかし、この実施例については、最初のデータセットのシミュレーション以外は、配列又はモデル情報を用いない。類似性の尺度として対アライメントスコアを用いて、当技術分野で公知である近隣結合により樹を構築する。図23及び24に示すように、これらのデータセットクラスターは、十分にそれぞれ2つの及び3つの集団となった。これらのクラスターを分離するための閾値を定義することができた(直線の長さが類似性を示す)ことも明らかである。
3クラスター実験の場合、各クラスターのランドマーククラスターが構築された。この結果を図25〜27に示す。
実施例2の場合と同様な同定を両実験について行った。図28及び29に2クラスター及び3クラスター実験についての3クラスターに対するカウントを示す。我々は、我々が各実験における混合を正しく定量化したことを確認する。
小特徴ベクトルからの大ライブラリ特徴ベクトルのアセンブリ
この実施例では、上述の重複配列S1〜S18からの模擬データを用いる。しかし、アセンブリ過程を示すために、我々は、配列がミスマッチ領域なしに重複するように(図12にされたように)すべての配列に共通の開始及び終了における配列を除去する(実施例2で述べたように)。配列が重複することが保証されているので、比較的単純な方法を用いることができる。これが当てはまらない場合、上述のような当技術分野で公知のものから適応させたより複雑なアセンブリアルゴリズムを用いることができる。
対アライメントスコアに基づく近隣結合による樹を実施例5と同様に構築した。しかし、比較的に大きい非類似領域を予想したので、アライメント内と同様に強くアライメントの開始又は終了におけるギャップにペナルティーを科さないスコアリング関数を用いた。樹を図30に示す。ここにすべての配列が、各配列が両側の配列と共有する約100塩基の重複を示す、他の2つの配列との類似関係を有することがわかる。
近縁性の順序の樹から進んで、アライメントした配列のコンセンサスランドマークを、当対が他の配列と結合されている特徴ベクトルとしての役割を果たす配列の対からの出力ランドマークを用いて構築する。該方法の出力は、完全にアセンブルされた特徴ベクトルである。例示のために元のデータをアセンブルされた特徴にアライメントした。3つの断片のアライメントを図31に示すが、重複を明確に確認することができる。

Claims (38)

  1. ナノ細孔を経るポリマーの輸送中に行われるポリマーの測定の時間順序系列を解析する方法であって、測定がナノ細孔中のkマーの同一性に依存し、kマーがポリマーのk個のポリマー単位であり、kが正の整数であり、前記方法が、
    測定の系列から、測定の特性を表す時系列的特徴の特徴ベクトルを導出するステップと、
    導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの類似性を判定するステップと
    を含む、方法。
  2. 前記少なくとも1つの他の特徴ベクトルが、少なくとも1つのクラスについて記憶装置に保存された少なくとも1つの他の特徴ベクトルである、請求項1に記載の方法。
  3. 前記記憶装置に保存された前記少なくとも1つの他の特徴ベクトルが、測定される前記ポリマーに応じて選択される、請求項2に記載の方法。
  4. 前記記憶装置に保存された前記少なくとも1つの他の特徴ベクトルが、断片の前記特徴ベクトルから構成された共通ポリマーの全特徴ベクトルを含む、請求項2又は3に記載の方法。
  5. 類似性を判定する前記ステップが、前記導出された特徴ベクトルの全体又は一部と前記記憶装置に保存された前記少なくとも1つの他の特徴ベクトルの全体との間の類似性を判定するステップを含む、請求項2〜4のいずれか一項に記載の方法。
  6. 類似性を判定する前記ステップが、前記導出された特徴ベクトルの全体又は一部と前記記憶装置に保存された前記少なくとも1つの他の特徴ベクトルの一部との間の類似性を判定するステップを含む、請求項2〜4のいずれか一項に記載の方法。
  7. 前記導出された特徴ベクトルが導出される前記ポリマーを、前記判定された類似性に基づいて前記クラスに属するものとして分類するステップをさらに含む、請求項2〜6のいずれか一項に記載の方法。
  8. 前記少なくとも1つの他の特徴ベクトルが、同じ方法を用いて導出された特徴ベクトルである、請求項1に記載の方法。
  9. 前記少なくとも1つの他の特徴ベクトルが、同じ方法を用いて導出された複数の特徴ベクトルであり、前記方法が、該特徴ベクトルの重複部分の類似性に基づいて共通ポリマーの断片であるポリマーから導出される特徴ベクトルを同定するステップをさらに含む、請求項8に記載の方法。
  10. 前記同定された断片の前記特徴ベクトルから前記共通ポリマーの全特徴ベクトルを構築するステップをさらに含む、請求項8に記載の方法。
  11. 前記少なくとも1つの他の特徴ベクトルが、同じ方法を用いて導出された複数の特徴ベクトルであり、前記方法が、類似の特徴ベクトルのクラスターをクラスとして同定するステップと、該特徴ベクトルが導出される前記ポリマーを同定されたクラスに属するものとして分類するステップとをさらに含む、請求項8に記載の方法。
  12. 異なるクラスに属する特徴ベクトルの数を数えるステップをさらに含む、請求項7又は11に記載の方法。
  13. 前記導出された特徴ベクトルが、前記ポリマーが属すると分類されるクラスについて特徴ベクトルと異なる局所領域を同定するステップをさらに含む、請求項7、11又は12に記載の方法。
  14. 前記少なくとも1つの他の特徴ベクトルが、記憶装置に保存された特徴ベクトルを含み、類似性を判定する前記ステップが、前記導出された特徴ベクトルが該記憶装置に保存された前記少なくとも1つの他の特徴ベクトルと異なる局所領域を決定するステップを含む、請求項1に記載の方法。
  15. 連続的測定の群が各群について異なる各kマーに依存し、
    特徴ベクトルを導出する前記ステップが、連続的測定の群を識別するステップ、及び各群について、該群の測定の特性を表す1つ又は複数の特徴の値を導出するステップを含む、
    請求項1〜14のいずれか一項に記載の方法。
  16. 前記特徴が
    前記測定の群の平均、
    前記測定の群の期間、
    前記測定の群の分散、
    非対称情報、
    前記測定の信頼情報、
    前記測定の群の分布又は
    それらのいずれかの組合せ
    を含む、請求項1〜15のいずれか一項に記載の方法。
  17. 前記測定が電気測定である、請求項1〜16のいずれか一項に記載の方法。
  18. 前記測定がナノ細孔を通るイオン電流の測定を含む、請求項1〜17のいずれか一項に記載の方法。
  19. 前記測定が、イオン電流のほかの少なくも1つの追加の特性の測定をさらに含む、請求項18に記載の方法。
  20. 少なくも1つの追加の特性の前記測定がFET測定、光学的測定又は両方を含む、請求項19に記載の方法。
  21. 前記ポリマーが生物学的ポリマーである、請求項1〜20のいずれか一項に記載の方法。
  22. 前記ポリマーがポリヌクレオチドであり、前記ポリマー単位がヌクレオチドである、請求項1〜21のいずれか一項に記載の方法。
  23. 前記ナノ細孔が生体細孔である、請求項1〜22のいずれか一項に記載の方法。
  24. 前記ナノ細孔を経る前記ポリマーの前記輸送が、連続するkマーが前記ナノ細孔により登録される歯止めで動かされるような状態で行われる、請求項1〜23のいずれか一項に記載の方法。
  25. 前記ポリマーの前記輸送が分子歯止めにより制御される、請求項1〜24のいずれか一項に記載の方法。
  26. 前記分子歯止めがポリマー結合タンパク質である、請求項25に記載の方法。
  27. ナノ細孔を経て前記ポリマーを輸送するステップと、
    前記ポリマーの連続する系列の測定を行うステップと
    をさらに含む、請求項1〜26のいずれか一項に記載の方法。
  28. 標的ポリマーの存在、非存在又は量を推定する方法であって、
    ナノ細孔を経てポリマーを輸送するステップと、
    該ポリマーの連続する系列の測定を行うステップと、
    請求項1から26までのいずれか一項に記載の方法を用いて測定の系列を解析するステップと、
    該解析に基づいて標的ポリマーの存在、非存在又は量を推定するステップと
    を含む、方法。
  29. 前記ポリマーが2つ以上のポリマーの混合物を含み、1つ又は複数のポリマーの相対量が決定される、請求項28に記載の方法。
  30. ポリマー分析対象物中の標的ポリマーの存在、非存在又は量を推定する方法であって、
    該ポリマー分析対象物をポリマーに断片化するステップと、
    該断片化ポリマーについて請求項28又は29に記載の方法を実施するステップと
    を含む、方法。
  31. 前記ポリマーがポリヌクレオチドであり、前記ポリマー単位がヌクレオチドであり、前記ポリマー分析対象物が制限酵素により断片化される、請求項30に記載の方法。
  32. ポリマーのポリマー単位の全配列を推定することなく、該ポリマーの存在、非存在又は量が決定される、請求項28〜31のいずれか一項に記載の方法。
  33. ポリマーの変化を判定する方法であって、
    ポリマーを一定の期間にわたってナノ細孔を経て繰返し輸送するステップと、
    各輸送中に、該ポリマーの連続的な系列の測定を行うステップと、
    請求項1から26までのいずれか一項に記載の方法を用いて測定の各系列を解析するステップとを含み、前記導出された特徴ベクトルと少なくとも1つの他の特徴ベクトルとの間の類似性を判定する前記ステップが、(a)測定の各系列から得られた前記導出特徴ベクトルと同じ少なくとも1つの他の特徴ベクトルとの間の類似性を判定するステップ又は(b)測定の系列から得られたすべての前記導出特徴ベクトルの間の類似性を判定するステップを含む、方法。
  34. 前記ポリマーがポリヌクレオチドであり、前記ポリマー単位がヌクレオチドであり、前記方法が修飾塩基又は点突然変異の存在を判定するために用いられる、請求項28〜33のいずれか一項に記載の方法。
  35. 治療又は診断の指針とするために用いられる請求項28〜34のいずれか一項に記載の方法。
  36. コンピュータ装置により実行することができ、請求項1〜35のいずれか一項に記載の方法を実施するための実行に基づいて構成されたコンピュータプログラム。
  37. 請求項1〜35のいずれか一項に記載の方法を実施するように構成された解析装置。
  38. 請求項37に記載の解析装置と、
    ポリマーがそれを通して移動することができるナノ細孔を含む測定システムとを含み、該測定システムが移動するポリマーの連続する系列の測定を行うように配置されている、診断装置。
JP2014557122A 2012-02-16 2013-02-18 ポリマーの測定の解析 Active JP6226888B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261599573P 2012-02-16 2012-02-16
US61/599,573 2012-02-16
PCT/GB2013/050381 WO2013121224A1 (en) 2012-02-16 2013-02-18 Analysis of measurements of a polymer

Publications (3)

Publication Number Publication Date
JP2015509710A true JP2015509710A (ja) 2015-04-02
JP2015509710A5 JP2015509710A5 (ja) 2017-08-31
JP6226888B2 JP6226888B2 (ja) 2017-11-08

Family

ID=47749886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014557122A Active JP6226888B2 (ja) 2012-02-16 2013-02-18 ポリマーの測定の解析

Country Status (10)

Country Link
US (2) US20150057948A1 (ja)
EP (2) EP2814980B8 (ja)
JP (1) JP6226888B2 (ja)
KR (1) KR102106499B1 (ja)
CN (1) CN104321441B (ja)
AU (1) AU2013220179B2 (ja)
BR (1) BR112014020211A2 (ja)
CA (1) CA2866587C (ja)
IN (1) IN2014DN06795A (ja)
WO (1) WO2013121224A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531901A (ja) * 2011-09-23 2014-12-04 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
KR20200024169A (ko) * 2017-09-15 2020-03-06 일루미나, 인코포레이티드 서열-검출 시스템

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
US8285719B1 (en) 2008-08-08 2012-10-09 The Research Foundation Of State University Of New York System and method for probabilistic relational clustering
GB201202519D0 (en) 2012-02-13 2012-03-28 Oxford Nanopore Tech Ltd Apparatus for supporting an array of layers of amphiphilic molecules and method of forming an array of layers of amphiphilic molecules
CA2866587C (en) 2012-02-16 2022-07-26 Oxford Nanopore Technologies Limited Analysis of measurements of a polymer
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
GB201222928D0 (en) 2012-12-19 2013-01-30 Oxford Nanopore Tech Ltd Analysis of a polynucleotide
CN115851894A (zh) * 2014-10-16 2023-03-28 牛津楠路珀尔科技股份有限公司 聚合物的分析
GB201418512D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Electrical device with detachable components
US10302972B2 (en) 2015-01-23 2019-05-28 Pacific Biosciences Of California, Inc. Waveguide transmission
US10794895B2 (en) 2015-02-05 2020-10-06 President And Fellows Of Harvard College Nanopore sensor including fluidic passage
GB201508669D0 (en) 2015-05-20 2015-07-01 Oxford Nanopore Tech Ltd Methods and apparatus for forming apertures in a solid state membrane using dielectric breakdown
WO2017024049A1 (en) 2015-08-06 2017-02-09 Pacific Biosciences Of California, Inc. Single-molecule nanofet sequencing systems and methods
US10783268B2 (en) 2015-11-10 2020-09-22 Hewlett Packard Enterprise Development Lp Data allocation based on secure information retrieval
CN108779170A (zh) 2016-03-02 2018-11-09 牛津纳米孔技术公司 突变孔
US11514289B1 (en) * 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
EP3482196B1 (en) 2016-07-05 2022-02-23 Quantapore, Inc. Optically based nanopore sequencing
ES2967443T3 (es) * 2016-07-06 2024-04-30 Guardant Health Inc Procedimientos de perfilado de fragmentoma de ácidos nucleicos sin células
GB201611770D0 (en) 2016-07-06 2016-08-17 Oxford Nanopore Tech Microfluidic device
US20190204296A1 (en) * 2016-08-18 2019-07-04 The Regents Of The University Of California Nanopore sequencing base calling
US11080301B2 (en) 2016-09-28 2021-08-03 Hewlett Packard Enterprise Development Lp Storage allocation based on secure data comparisons via multiple intermediaries
US20200251184A1 (en) * 2016-12-16 2020-08-06 Osaka University Classification analysis method, classification analysis device, and storage medium for classification analysis
GB201707122D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
GB201707138D0 (en) * 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Machine learning analysis of nanopore measurements
GB2569630B (en) 2017-12-21 2022-10-12 Sharp Life Science Eu Ltd Droplet Interfaces in Electro-wetting Devices
AU2018353924A1 (en) 2017-12-29 2019-07-18 Clear Labs, Inc. Automated priming and library loading device
WO2019149626A1 (de) 2018-02-02 2019-08-08 Bayer Aktiengesellschaft Bekämpfung resistenter schadorganismen
WO2019204720A1 (en) * 2018-04-20 2019-10-24 The Regents Of The University Of California Nucleic acid sequencing methods and computer-readable media for practicing same
US20210205814A1 (en) 2018-05-24 2021-07-08 Oxford Nanopore Technologies Limited Droplet interfaces in electro-wetting devices
GB201814369D0 (en) 2018-09-04 2018-10-17 Oxford Nanopore Tech Ltd Method for determining a polymersequence
JP2022513138A (ja) 2018-11-28 2022-02-07 オックスフォード ナノポール テクノロジーズ ピーエルシー 感知システムおよび動作方法
GB201819378D0 (en) * 2018-11-28 2019-01-09 Oxford Nanopore Tech Ltd Analysis of nanopore signal using a machine-learning technique
KR20210138594A (ko) 2019-03-12 2021-11-19 옥스포드 나노포어 테크놀로지즈 피엘씨 나노포어 감지 디바이스 및 이를 작동하는 방법 및 형성하는 방법
WO2020236995A1 (en) * 2019-05-22 2020-11-26 Icahn School Of Medicine At Mount Sinai Method for de novo detection, identification and fine mapping of multiple forms of nucleic acid modifications
CN110628597B (zh) * 2019-10-19 2023-04-25 上海新微技术研发中心有限公司 拉曼光谱法生物分子测序方法
US11651281B2 (en) * 2020-05-18 2023-05-16 International Business Machines Corporation Feature catalog enhancement through automated feature correlation
CN113030548A (zh) * 2021-03-09 2021-06-25 南京邮电大学 基于局域阈值的纳米孔检测电流信号特征信息提取方法及装置
GB202103605D0 (en) 2021-03-16 2021-04-28 Oxford Nanopore Tech Ltd Alignment of target and reference sequences of polymer units
WO2022243692A1 (en) 2021-05-19 2022-11-24 Oxford Nanopore Technologies Plc Methods for complement strand sequencing
WO2023029044A1 (zh) * 2021-09-06 2023-03-09 百图生科(北京)智能技术有限公司 用于单细胞测序的方法、装置、设备、介质和程序产品
CN113837036A (zh) * 2021-09-09 2021-12-24 成都齐碳科技有限公司 生物聚合物的表征方法、装置、设备及计算机存储介质
CN114908358A (zh) * 2022-04-14 2022-08-16 广州孔确基因科技有限公司 一种两亲性分子层的制备方法及装置
GB202215442D0 (en) 2022-10-19 2022-11-30 Oxford Nanopore Tech Plc Analysis of a polymer
WO2024099985A1 (en) 2022-11-10 2024-05-16 Bayer Aktiengesellschaft Targeted crop protection product application based on genetic profiles
GB202216905D0 (en) 2022-11-11 2022-12-28 Oxford Nanopore Tech Plc Novel pore monomers and pores

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795782A (en) * 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
JPH11178575A (ja) * 1997-12-22 1999-07-06 Hitachi Ltd Dna塩基配列解析装置、方法及び記録媒体
JP2002325581A (ja) * 2001-04-27 2002-11-12 Adgene Co Ltd 核酸溶解曲線及び核酸解離曲線を用いた未知あるいは既知核酸変異検出法及び表示法
WO2006028508A2 (en) * 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
JP2010524436A (ja) * 2007-04-04 2010-07-22 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ナノポアを使用するための組成物、デバイス、システム、及び方法
JP2010539966A (ja) * 2007-10-05 2010-12-24 イシス イノベーション リミテッド 分子アダプター
JP2011527191A (ja) * 2008-07-07 2011-10-27 オックスフォード ナノポア テクノロジーズ リミテッド 塩基検出細孔

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128587A (en) * 1997-01-14 2000-10-03 The Regents Of The University Of California Method and apparatus using Bayesian subfamily identification for sequence analysis
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
WO2000039333A1 (en) 1998-12-23 2000-07-06 Jones Elizabeth Louise Sequencing method using magnifying tags
EP1192453B1 (en) 1999-06-22 2012-02-15 President and Fellows of Harvard College Molecular and atomic scale evaluation of biopolymers
US6936433B2 (en) 2000-11-27 2005-08-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US20020197618A1 (en) 2001-01-20 2002-12-26 Sampson Jeffrey R. Synthesis and amplification of unstructured nucleic acids for rapid sequencing
JP2003256435A (ja) 2002-03-06 2003-09-12 Fujitsu Ltd 配列データ統合処理方法、配列データ統合処理装置及び配列データ統合処理プログラム
US7220405B2 (en) 2003-09-08 2007-05-22 E. I. Du Pont De Nemours And Company Peptide-based conditioners and colorants for hair, skin, and nails
US20050136408A1 (en) 2003-12-19 2005-06-23 May Tom-Moy Methods and systems for characterizing a polymer
JP2005176730A (ja) 2003-12-19 2005-07-07 Hitachi Ltd cDNA配列をゲノム配列にマッピングする方法
US7279337B2 (en) 2004-03-10 2007-10-09 Agilent Technologies, Inc. Method and apparatus for sequencing polymers through tunneling conductance variation detection
KR100614827B1 (ko) 2004-05-06 2006-08-25 재단법인서울대학교산학협력재단 양방향 은닉 마코프 모델을 이용한 완숙한마이크로알엔에이 위치예측방법 및 이를 구현하기 위한컴퓨터 프로그램을 기록한 저장매체
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
US20060019259A1 (en) 2004-07-22 2006-01-26 Joyce Timothy H Characterization of biopolymers by resonance tunneling and fluorescence quenching
US20130071837A1 (en) 2004-10-06 2013-03-21 Stephen N. Winters-Hilt Method and System for Characterizing or Identifying Molecules and Molecular Mixtures
US20060086626A1 (en) 2004-10-22 2006-04-27 Joyce Timothy H Nanostructure resonant tunneling with a gate voltage source
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
WO2007065025A2 (en) 2005-11-29 2007-06-07 Wisconsin Alumni Research Foundation Method of dna analysis using micro/nanochannel
US20100291548A1 (en) 2006-03-12 2010-11-18 Applera Corporation Methods of Detecting Target Nucleic Acids
US8116988B2 (en) 2006-05-19 2012-02-14 The University Of Chicago Method for indexing nucleic acid sequences for computer based searching
US7731826B2 (en) 2006-08-17 2010-06-08 Electronic Bio Sciences, Llc Controlled translocation of a polymer in an electrolytic sensing system
US8003319B2 (en) 2007-02-02 2011-08-23 International Business Machines Corporation Systems and methods for controlling position of charged polymer inside nanopore
US20110121840A1 (en) 2007-02-20 2011-05-26 Gurdial Singh Sanghera Lipid Bilayer Sensor System
WO2009035647A1 (en) 2007-09-12 2009-03-19 President And Fellows Of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
US8628940B2 (en) 2008-09-24 2014-01-14 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
CN102245760A (zh) 2008-07-07 2011-11-16 牛津纳米孔技术有限公司 酶-孔构建体
EP3029467B1 (en) 2008-09-22 2020-01-08 University of Washington Msp nanopores and related methods
CA2741996A1 (en) 2008-10-29 2010-05-14 Trustees Of Boston University Sequence preserved dna conversion
US8452546B1 (en) 2008-11-07 2013-05-28 Electronic Biosciences, Inc. Method for deducing a polymer sequence from a nominal base-by-base measurement
GB0820927D0 (en) * 2008-11-14 2008-12-24 Isis Innovation Method
WO2010086602A1 (en) 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Hybridization linkers
KR101797773B1 (ko) 2009-01-30 2017-11-15 옥스포드 나노포어 테크놀로지즈 리미티드 막횡단 시퀀싱에서 핵산 구축물용 어댑터
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
US8986928B2 (en) 2009-04-10 2015-03-24 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
KR20110138286A (ko) 2009-04-20 2011-12-26 옥스포드 나노포어 테크놀로지즈 리미티드 지질 이분자층 센서 어레이
EP3196645B1 (en) 2009-09-18 2019-06-19 President and Fellows of Harvard College Bare single-layer graphene membrane having a nanopore enabling high-sensitivity molecular detection and analysis
EP2507387B1 (en) 2009-12-01 2017-01-25 Oxford Nanopore Technologies Limited Biochemical analysis instrument and method
US8748091B2 (en) 2009-12-18 2014-06-10 The Board Of Trustees Of The University Of Illinois Characterizing stretched polynucleotides in a synthetic nanopassage
US8324914B2 (en) 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
CA2790666C (en) 2010-02-23 2019-08-06 University Of Washington Analyte sequencing with nanopores
CN103154729B (zh) 2010-06-08 2015-01-07 哈佛大学校长及研究员协会 具有由石墨烯支持的人工脂质膜的纳米孔装置
EP2614156B1 (en) 2010-09-07 2018-08-01 The Regents of The University of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
US9068221B2 (en) 2011-02-09 2015-06-30 Life Technologies Corporation Method of analysis of genetic markers
AU2012215135B9 (en) 2011-02-11 2017-03-09 Oxford Nanopore Technologies Limited Mutant pores
US20120316075A1 (en) 2011-03-30 2012-12-13 Noblegen Biosciences, Inc. Sequence preserved dna conversion for optical nanopore sequencing
CN108051578B (zh) 2011-04-04 2020-07-24 哈佛大学校长及研究员协会 通过局部电位测量进行的纳米孔感测
EP2715343B1 (en) 2011-05-27 2019-10-02 Oxford Nanopore Technologies Limited Coupling method
US9145623B2 (en) 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
WO2013014451A1 (en) 2011-07-25 2013-01-31 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
US20160162634A1 (en) 2011-09-23 2016-06-09 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
CN104039979B (zh) 2011-10-21 2016-08-24 牛津纳米孔技术公司 使用孔和Hel308解旋酶表征目标多核苷酸的酶方法
KR102086182B1 (ko) 2011-12-29 2020-03-06 옥스포드 나노포어 테크놀로지즈 리미티드 효소 방법
EP2798083B1 (en) 2011-12-29 2017-08-09 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase
CN104254771B (zh) 2012-01-20 2018-01-12 吉尼亚科技公司 基于纳米孔的分子检测与测序
CA2866587C (en) 2012-02-16 2022-07-26 Oxford Nanopore Technologies Limited Analysis of measurements of a polymer
AU2013221356B2 (en) 2012-02-16 2018-10-18 The Regents Of The University Of California Nanopore sensor for enzyme-mediated protein translocation
WO2013153359A1 (en) 2012-04-10 2013-10-17 Oxford Nanopore Technologies Limited Mutant lysenin pores
US10612083B2 (en) 2012-04-19 2020-04-07 University Of Washington Through Its Center For Commercialization Methods and compositions for generating reference maps for nanopore-based polymer analysis
GB2517875A (en) 2012-06-08 2015-03-04 Pacific Biosciences California Modified base detection with nanopore sequencing
WO2014013262A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Enzyme construct
US11155860B2 (en) 2012-07-19 2021-10-26 Oxford Nanopore Technologies Ltd. SSB method
EP3741847A1 (en) 2012-07-19 2020-11-25 Oxford Nanopore Technologies Limited Modified helicases
EP2911771B1 (en) 2012-10-26 2017-01-18 Oxford Nanopore Technologies Limited Droplet interfaces
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
GB201222928D0 (en) 2012-12-19 2013-01-30 Oxford Nanopore Tech Ltd Analysis of a polynucleotide
CN105934522B (zh) 2013-11-26 2021-07-20 伊鲁米那股份有限公司 用于多核苷酸测序的组合物和方法
WO2015140535A1 (en) 2014-03-21 2015-09-24 Oxford Nanopore Technologies Limited Analysis of a polymer from multi-dimensional measurements
GB201408652D0 (en) 2014-05-15 2014-07-02 Oxford Nanopore Tech Ltd Model adjustment during analysis of a polymer from nanopore measurements
US9925679B2 (en) 2014-05-19 2018-03-27 I+D+M Creative, Llc Devices and methods for assisting with slicing items
CN115851894A (zh) 2014-10-16 2023-03-28 牛津楠路珀尔科技股份有限公司 聚合物的分析

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795782A (en) * 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
JPH11178575A (ja) * 1997-12-22 1999-07-06 Hitachi Ltd Dna塩基配列解析装置、方法及び記録媒体
JP2002325581A (ja) * 2001-04-27 2002-11-12 Adgene Co Ltd 核酸溶解曲線及び核酸解離曲線を用いた未知あるいは既知核酸変異検出法及び表示法
WO2006028508A2 (en) * 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
JP2010524436A (ja) * 2007-04-04 2010-07-22 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ナノポアを使用するための組成物、デバイス、システム、及び方法
JP2010539966A (ja) * 2007-10-05 2010-12-24 イシス イノベーション リミテッド 分子アダプター
JP2011527191A (ja) * 2008-07-07 2011-10-27 オックスフォード ナノポア テクノロジーズ リミテッド 塩基検出細孔

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOHN J. KASIANOWICZ: "Nanoscopic Porous Sensors", ANNUAL REVIEW OF ANALYTICAL CHEMISTRY, vol. 1, no. 1, JPN6016031936, 2008, pages 737 - 766, XP055020130, ISSN: 0003481628, DOI: 10.1146/annurev.anchem.1.031207.112818 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531901A (ja) * 2011-09-23 2014-12-04 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
JP2019066484A (ja) * 2011-09-23 2019-04-25 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
KR20200024169A (ko) * 2017-09-15 2020-03-06 일루미나, 인코포레이티드 서열-검출 시스템
JP2020530257A (ja) * 2017-09-15 2020-10-22 イルミナ インコーポレイテッド 配列検出システム
KR102620326B1 (ko) * 2017-09-15 2024-01-02 일루미나, 인코포레이티드 서열-검출 시스템

Also Published As

Publication number Publication date
BR112014020211A2 (pt) 2017-07-04
JP6226888B2 (ja) 2017-11-08
AU2013220179B2 (en) 2018-11-08
EP2814980B8 (en) 2020-06-10
CN104321441A (zh) 2015-01-28
AU2013220179A1 (en) 2014-09-04
CA2866587A1 (en) 2013-08-22
EP2814980B1 (en) 2020-04-15
EP3736339B1 (en) 2022-07-27
EP3736339A1 (en) 2020-11-11
KR20140125874A (ko) 2014-10-29
CN104321441B (zh) 2016-10-19
IN2014DN06795A (ja) 2015-05-22
US20150057948A1 (en) 2015-02-26
US11959906B2 (en) 2024-04-16
KR102106499B1 (ko) 2020-05-04
EP2814980A1 (en) 2014-12-24
WO2013121224A1 (en) 2013-08-22
CA2866587C (en) 2022-07-26
US20190154655A1 (en) 2019-05-23

Similar Documents

Publication Publication Date Title
US11959906B2 (en) Analysis of measurements of a polymer
KR102551897B1 (ko) 폴리머의 분석
US11085077B2 (en) Analysis of a polynucleotide via a nanopore system
Deamer et al. Three decades of nanopore sequencing
JP5328362B2 (ja) 細孔を使用する方法
US11104947B2 (en) Nanopore sequencing of polynucleotides with multiple passes
US20230039783A1 (en) Protein and Peptide Fingerprinting and Sequencing by Nanopore Translocation of Peptide-Oligonucleotide Complexes
WO2023094806A1 (en) Nanopore measurement signal analysis
CN118120017A (zh) 纳米孔测量信号分析

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170421

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20170713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170724

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20170724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171010

R150 Certificate of patent or registration of utility model

Ref document number: 6226888

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250