JP2016534742A - 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定 - Google Patents

量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定 Download PDF

Info

Publication number
JP2016534742A
JP2016534742A JP2016542834A JP2016542834A JP2016534742A JP 2016534742 A JP2016534742 A JP 2016534742A JP 2016542834 A JP2016542834 A JP 2016542834A JP 2016542834 A JP2016542834 A JP 2016542834A JP 2016534742 A JP2016534742 A JP 2016534742A
Authority
JP
Japan
Prior art keywords
value
nucleobase
tunneling
trans
substrate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016542834A
Other languages
English (en)
Inventor
パラシャント ナグパル
パラシャント ナグパル
アンシュリ チャテジー
アンシュリ チャテジー
ジョセフ カサマダ リボー
ジョセフ カサマダ リボー
Original Assignee
ザ リージェンツ オブ ザ ユニヴァーシティ オブ コロラド,ア ボディ コーポレイト
ザ リージェンツ オブ ザ ユニヴァーシティ オブ コロラド,ア ボディ コーポレイト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ リージェンツ オブ ザ ユニヴァーシティ オブ コロラド,ア ボディ コーポレイト, ザ リージェンツ オブ ザ ユニヴァーシティ オブ コロラド,ア ボディ コーポレイト filed Critical ザ リージェンツ オブ ザ ユニヴァーシティ オブ コロラド,ア ボディ コーポレイト
Publication of JP2016534742A publication Critical patent/JP2016534742A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01QSCANNING-PROBE TECHNIQUES OR APPARATUS; APPLICATIONS OF SCANNING-PROBE TECHNIQUES, e.g. SCANNING PROBE MICROSCOPY [SPM]
    • G01Q60/00Particular types of SPM [Scanning Probe Microscopy] or microscopes; Essential components thereof
    • G01Q60/10STM [Scanning Tunnelling Microscopy] or apparatus therefor, e.g. STM probes
    • G01Q60/12STS [Scanning Tunnelling Spectroscopy]
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/601Detection means characterised by use of a special device being a microscope, e.g. atomic force microscopy [AFM]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Nanotechnology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

天然及び合成かつ修飾及び未修飾のDNA、RNA、PNA、DNA/RNAヌクレオチドを同定し配列決定するのに有用な技術、方法、デバイス、及び組成物を開示する。開示された技術、方法、デバイス、及び組成物は、QM−Seqと呼ばれるナノエレクトロニクス量子トンネリング分光法を用いて種々の修飾、DNA/RNA損傷、及びヌクレオチド構造を同定するのに有用である。本方法及び組成物は、一本鎖ヌクレオチド及びポリヌクレオチド高分子を沈着させるための荷電平滑基板の使用、修飾または未修飾のDNA/RNA/PNAを走査すること、未知の核酸塩基の電子署名を、同一または類似の条件下(例えば、前記核酸塩基は酸性環境である)で得られた天然及び合成、修飾及び未修飾の核酸塩基、及び二次/三次構造を含む既知の核酸塩基の電子指紋のデータベースに対して比較することを含み得る。【選択図】図1A

Description

[関連出願の相互参照]
本願は、2013年9月13日に出願された米国仮出願第61/877,634号に基づき、米国特許法第119条(35 U.S.C.§119)に従って優先権の利益を主張するものであり、これらの全ては、参照により本明細書に組み込まれる。
開示された方法、デバイス、組成物、及びシステムは、核酸の同定及び配列決定に関する。
個別化医療及び急速に進化する遺伝学分野用の新規の診断ツールには、安価で、高速で、信頼性のある、無酵素で、かつ高スループットな配列決定技術を要する。近年開発されたいくつかのDNA配列決定技術は、配列決定コスト及び時間の削減を試みているが、報告された核酸配列は、統計的に有意なアンサンブル平均である。これらのアンサンブル平均を用いて、ヌクレオチド配列と生理的挙動の間のいくつかの相関を導出することができるが、微量レベルの遺伝的変異または突然変異は、生物学的機能を支配し得る。これは、多剤耐性菌、すなわち、超強力な細菌や、薬物療法前に名目上微量に存在している高速変異病原菌の急速な発生により例示される。ペニシリンベースの抗生物質に対する耐性を引き起こすβ−ラクタマーゼなどのDNA配列をコードする薬剤耐性の高速同定に伴う近年の研究では、これらの技術が適時に標的を定めた医療介入の提供に不可欠であるため、迅速かつ高スループットな配列決定をするための信頼性のある単一分子配列決定ツールの必要性を浮き彫りにしていることが示されている。現在の第2世代配列決定技術は、ディープ及びウルトラディープ(ポリヌクレオチド当たり約100個の読み取り)配列決定法及び単一コピーPCR(ポリメラーゼ連鎖反応)増幅を用いて、単一ヌクレオチド多型(SNP)を検出することが可能である。しかしながら、これらの方法は、高価で技術的に複雑であり、臨床設定での適用を困難にしている。近年の研究では、医療用及び非侵襲的な臨床応用に単細胞ゲノムが使用できる可能性について概説しているが、これらの研究には、単一分子からのDNAの酵素増幅、及び従来の配列決定ツール(光学マーカー)を用いたDNA配列決定が伴う。従って、DNAを同定するための本技術は、配列バイアスをもたらし、かつ、微量試料または単細胞試料のDNA配列の検出に誤差をもたらす可能性がある酵素ベースのDNA増幅に依存している。他の新規技術では、デノボ配列決定での配列決定誤差を改善するため、DNA分子のみの配列決定が可能な核酸マーカー及び特異的酵素の使用が試されている。
DNA配列の電子同定は、DNA増幅を行わない無酵素技術を提供するため、次世代の配列決定技術の候補である。この方法は、他の技術と関連付けられた処理時間及び誤差を低減させる可能性を提供する。いくつかのグループは、ポアに沿ったイオン電流変化もしくは塩基がポアを横切る際のトンネリング電流減衰のいずれかに基づく、DNAヌクレオチドのナノポアコンダクタンスを用いて検証している。これらの実験では、非常に小さな正孔を通るようにDNAを作製し、そこでその構造がプローブされる。しかしながら、この方法では、単一分子分解能が欠如しており、かつ、ヌクレオチド修飾によるコンダクタンスの変化が不十分であるため、診断及びエピゲノム同定に使用できる可能性が制限されてしまう。他の研究は、単一分子の検出及び同定用の走査型トンネリング顕微鏡について行われている。走査型トンネリング顕微鏡を用いた単一DNA分子のイメージングは達成されているが、個々のヌクレオチド、ヌクレオシド、及び核酸塩基を正確に、再現性をもって、かつ効率的に同定及び識別する信頼性のある方法またはデバイス、あるいは、複数のヌクレオチド、ヌクレオシド、核酸塩基、及びその組み合わせを持つ分子中のヌクレオチド、ヌクレオシド、及び核酸塩基の配列を決定する能力については何も提供されていない。
RNA配列決定には、固有の課題がある。近年、大規模並列RNA配列決定により、低分子RNA特性化、とりわけ転写開始部位同定を含む、希少な転写産物の遺伝子発現及び同定の高スループットな定量化が可能になっている。しかしながら、ほとんどのRNA配列決定法は、cDNA合成のみならず、ランダムヘキサマーによるプライミング、ライゲーション、増幅、及び配列決定を含む、複数レベルでバイアスをもたらす多くの操作に依存している。さらに、多くの汎用天然(5−メチルシトシン、プソイドウリジン)及び化学修飾(N7−メチルグアニン)は、cDNA合成中に逆転写酵素を停止しないため、高スループットDNA配列決定法を用いて検出されない。広く用いられる逆転写酵素は、人工物をcDNAに導入する、例えば、RNA二次構造の領域のヌクレオチドを削除する傾向があることでも知られている。これにより、得られたcDNAの配列決定パターンが「ぼやけ」てしまう。さらに、現在の配列決定技術によって検出されないDNAメチル化は、がん細胞の主要マーカーであることが分かっており、がん性細胞と非がん性細胞の間に起こる体細胞変化を区別するのに用いられている。
本明細書で開示された技術、方法、デバイス、及び組成物を用いて、未知のヌクレオチド、ヌクレオシド、または核酸塩基の同一性を決定することができる。ここで、本方法は、未知のヌクレオチド、ヌクレオシド、及び核酸塩基を量子トンネリングによって分析することと、未知のヌクレオチド、ヌクレオシド、及び核酸塩基の1つまたは複数の電子パラメータを決定し、該電子パラメータを用いてヌクレオチド、ヌクレオシド、及び核酸塩基の署名を決定することと、未知の塩基の電子署名を1つまたは複数の既知のヌクレオチド、ヌクレオシド、及び核酸塩基の電子指紋と比較することと、未知のヌクレオチドの、ヌクレオシドの、及び核酸塩基の電子署名を既知の塩基(例えば、修飾及び未修飾のDNAヌクレオチドアデニン、A、チミン、T、グアニン、G、シトシン、C、RNAヌクレオチドA、G、C、ウラシル、U、ペプチド核酸(PNA)及び他の人工核酸高分子、ヌクレオチド修飾、例えば、メチル化、5−カルボキシ、5−ホルミル、5−ヒドロキシメチル、5−メチルデオキシ、5−メチル、5−ヒドロキシメチル、N6−メチル−デオキシアデノシン、RNA二次/三次構造の決定に用いた他の修飾、例えば、N−メチルイサト酸無水物(NMIA)、または硫酸ジメチル(DMS))の電子指紋にマッチングさせることと、それにより、未知の核酸塩基、核酸塩基修飾、または核酸高分子二次/三次構造を同定することを含む。多くの実施形態では、未知の核酸塩基を特定の生化学的条件または環境、例えば、酸性、中性、または塩基性pHから選択されるpH環境に置きながら、該核酸塩基の電子署名を決定してもよい。多くの実施形態では、核酸塩基の電子署名は、生化学的条件、例えば、pH環境によって変わる。いくつかの実施形態では、未知の核酸塩基の同一性は、酸性環境で決定され、ここで、種々の修飾及び未修飾の核酸塩基を区別することができる。多くの実施形態では、未知の核酸塩基の開示された同定方法には、1つまたは複数の標準電子指紋を含み、未知の核酸塩基の電子署名を1つまたは複数の標準電子指紋にマッチングさせるコンピューティングデバイスを含んでもよい。
開示された技術を用いて、ポリヌクレオチドの5’末端を標識することによってポリヌクレオチド(または、1つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを有する他の高分子)の3’−>5’順序を決定することができる。多くの場合、ポリヌクレオチドとは、1つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む高分子のことを言う。いくつかの実施形態では、これは、特定の5’または3’末端特異的プライマータグをライゲーションすることで(場合によっては、T4リガーゼを用いることで)、既知の配列の5’−及び3’−末端を持つテンプレートを作製することで達成される。開示された方法、デバイス、及び組成物を用いて、ポリヌクレオチド(または、1つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む他の高分子)の配列を同定することで、未知のDNA/RNA/PNA試料の指向性が明らかになるであろう。
本明細書に記載されるマイクロ流体デバイスを用いて、2つ以上の異なる環境条件において核酸塩基の電子署名を同時またはほぼ同時に決定するためのpHを変えることができる。マイクロ流体チャネルを用いて、図26に示すように、単一DNAウェルからDNA(例えば、一本鎖DNA)を供給することができ、ここで、チャネルを異なる高分子電解質(ポリアニオン及びポリカチオン)で被覆して、環境のpHを所望の値に変更及び維持する。次いで、単一金属チップ、または複数のチップ(例えば、並列配列決定については後述のように)を用いて、異なるpH環境及び他の生化学的条件で核酸塩基を配列決定することができる。
開示された方法を用いて、本明細書に記載される固有の電子指紋を用いて複数の未知のヌクレオチド/核酸塩基を同定することもでき、ここで、電子指紋は、1つまたは複数の生物物理学的電子パラメータ、例えば、HOMOレベル、LUMOレベル、バンドギャップ、電子及び正孔のファウラー−ノルトハイム過渡電圧、トンネリング曲線の勾配、電子及び正孔のトンネリングバリアハイト、電子及び正孔のバリアハイト差、電子及び正孔の有効質量、異なる生化学的条件における電子及び正孔の有効質量の比率などの値を含む。未知の修飾または未修飾のヌクレオチド/核酸塩基を同定するために、これらの生物物理学的電子パラメータを種々の組み合わせで用いてもよい。多くの場合、未知のヌクレオチド/核酸塩基の同一性は、高い信頼性で決定される。開示された方法は、クラスタリング方法の使用を含んでもよく、ここで、多くの既知の核酸塩基/ヌクレオチドの1つまたは複数の生物物理学的電子パラメータを用いて電子指紋を作成し、これを、未知の核酸塩基/ヌクレオチドに対して決定された電子署名と比較することができる。多くの場合、電子パラメータは、コンピュータプログラムの電子データとして保存され、これを用いて、未知の核酸塩基/ヌクレオチドに対して決定された電子パラメータを選択し、既知のヌクレオチド/核酸塩基の同様に構成された指紋(電子署名に対して選択されたものと同じパラメータの値を含む)と比較することができる。開示された方法を用いて、自動的に配列決定し、核酸塩基をロバストな配列決定技術及びソフトウェア解析に呼び出すことができる。
未知の核酸塩基の同一性を決定するのに有用な組成物についても開示する。いくつかの実施形態では、核酸塩基の同一性を決定するための基板が開示され、ここで、基板は、平滑な高配向金基板、例えば、金(111)であってもよい。いくつかの実施形態では、基板は荷電され、1つまたは複数のイオン性分子、例えば、ポリ−L−リシンを含む溶液で処理され、ここで、イオン性分子は、一本鎖DNAなどの負に帯電したポリマーが金基板に結合するのに役立つ。
ヌクレオチド/核酸塩基の化学修飾も、開示された方法を用いて決定される。場合によっては、化学修飾は、ポリヌクレオチド、または、1つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む他の高分子の二次/三次核酸高分子構造を決定するのに有用であり得る。場合によっては、ポリヌクレオチドは、N−メチルイサト酸無水物(NMIA)、硫酸ジメチル(DMS)などを用いて修飾してもよい。DNA/RNA/PNAの化学修飾も、エピジェネティックマーカー及び核酸損傷を決定するのに有用であり得る。場合によっては、化学修飾は、5−カルボキシ、5−ホルミル、5−ヒドロキシメチル、5−メチルデオキシ、5−メチル、5−ヒドロキシメチル、N6−メチル−デオキシアデノシンなどであってもよい。化学修飾は、開示された電子指紋を用いて、未修飾のDNA/RNA/PNAヌクレオチドと同時に決定してもよい。
複数の実施形態を開示するが、当業者には、以下の詳細な説明から本発明のさらに他の実施形態が明らかになるであろう。明らかになるように、本発明は、本発明の精神及び範囲から逸脱することなく、述べられた種々の態様の修正を介して実行してもよい。
従って、詳細な説明は、本質的に説明のためのものであって、制限的なものではないと見なすべきである。
量子分子配列決定(QM−Seq)を用いた、DNA、RNA、PNAなどの核酸高分子の配列決定。(a)クリーンな金(111)表面上に沈着させた一本鎖(ss)DNAを示すQuanT−Seqの図である。3工程の押出沈着スキームを用いて、配位エントロピーを減少させた延伸、線状化DNA及びRNA分子を再現性良く得る。QM−Seq電子スペクトル(トンネリングデータ)を得るのに用いた金属チップは、「読取ヘッド」として作用する。(b)QM−Seqは、ヌクレオチドを介した電子及び正孔のナノ電子トンネリングを利用して、固有の電子指紋を提供する。両方の核酸塩基(正確な縮尺率ではない)間で有意差が観察され得る酸性条件下でのプリン及びピリミジンのフロンティアバンド構造、HOMO及びLUMO分子軌道の概略図を示す。共役度の違い及び化学的に異なる核酸塩基(ここでは、アデニン及びチミン)は、異なる電子状態及びエネルギーギャップをもたらす。(c〜g)対応する化学構造とともに、各(デオキシ)リボヌクレオチドの代表的なQM−Seqスペクトル(トンネリングデータ)。R−は、デオキシリボヌクレオチド(DNA)及びリボヌクレオチド(RNA)に対してそれぞれ、HまたはOHのいずれかであってよい。スペクトルデータは、酸性条件下で測定した。ここで示すスペクトルは、DNAヌクレオチド(A、C、G、T)及びRNAヌクレオチド(U)に対応する。示した構造は、(c)(デオキシ)アデノシン5’−モノリン酸、(d)(デオキシ)グアノシン5’−モノリン酸、(e)(デオキシ)シチジン5’−モノリン酸、(f)チミジン5’−モノリン酸、及び(g)ウリジン5’−モノリン酸である。A、G、C、T/Uヌクレオチドは、それぞれ、緑色、黒色、青色、及び赤色で常に示される。 核酸塩基、デオキシヌクレオシド、及びリボヌクレオシドのフロンティア分子軌道:プリンの例として(a)アデニン、デオキシアデノシン、及びアデノシン;ピリミジンの例として(b)シトシン、デオキシシチジン、及びシチジンに対して設定されたB3LYP関数及び6−311G(2d、2p)基底系による密度汎関数(DFT)計算を用いたHOMO、LUMO分子軌道構造。陰影は、波動関数の異なる位相を示す。 走査型トンネリング顕微鏡−走査トンネリング分光法(STM−STS)を用いた単一DNA分子の配列決定。(a)DNA処理スキームを示す図である。変性一本鎖(ss)DNAを、押出沈着技術を用いてポリ−L−リシンで修飾したクリーンな金(111)表面上に沈着させ、配列決定用の細長い線状化DNAテンプレートを再現性良く得る。(b)正に帯電した金(111)表面上に沈着させたssDNAヌクレオチドの地形画像、I−V及びdI/dV、または状態密度(DOS)スペクトルを得るためのSTM−STSの概略図。電子トンネリング電流データを用いてトンネリング確率を提供するための単一ヌクレオチドを介した電子または正孔トンネリング。A、G、C、Tヌクレオチドは、可能であれば、異なる陰影によって区別される。(c〜f)中性pHでのDNAヌクレオチド(モノリン酸塩)、アデノシン5’−モノリン酸(c)、デオキシグアノシン5’−モノリン酸(d)、デオキシシチジン5’−モノリン酸(e)、及びデオキシチミジン5’−モノリン酸(f)の化学構造。 DNAヌクレオチドのSTM−STSを用いて得られた電子指紋。(a)酸性条件下(表面を0.1M HClで洗浄した)におけるA、G、C、及びTのHOMO(負)及びLUMO(正)レベルの分布。LUMOレベル(正電圧ピーク)の明確な分離を用いて、プリン(A、G)からピリミジン(C、T)を同定し、HOMOレベルの差を用いてピリミジン(TからC)を分離した。(b)酸性条件下でのLUMOとHOMOエネルギーレベル間のエネルギーギャップ。(c)酸性(HCl)、中性(HO)、及び塩基性(NaOH)pH条件下でのチミンのHOMO/LUMOレベル。矢印は、酸性、中性、及び塩基性pH条件間でのLUMOレベルのシフトを示す。(d)酸性条件下でのケト−エノール互変異性化を含む、異なるpH条件下でのチミンの生化学的構造、中性及び塩基性条件間での酸−塩基挙動。(e)過渡電圧(Vtrans)及び三角トンネリングの勾配(トンネリングエネルギーバリアに比例)によって特徴付けられた、酸性条件下でのチミンの電子ファウラー−ノルトハイムプロット。非常に小さな電圧で、トンネリングは、台形/長方形になるため、線形勾配(勾配は対数になる)からの偏移を示す。(f)4つ全てのヌクレオチドの、酸性条件下での電子(Vtrans,e−)及び正孔(Vtrans,h+)の過渡電圧の確率密度関数。ファウラー−ノルトハイムトンネリングのVtrans,e−/Vtrans,h+及び勾配(S)は、それぞれ、HOMO/LUMOレベル及びエネルギーバンドギャップ(「バンドギャップ」)と同じ挙動を示す。 DNAヌクレオチドの電子指紋。(a)酸性条件下でのポリ−L−リシン−修飾表面(0.1M HClで洗浄)上のA、G、C、及びTの測定したHOMO(負)及びLUMO(正)レベルのボックスプロット。ボックスプロットは、第2及び第3四分位(25〜75%)を含むが、ひげは、5〜95%のデータを示す。プロトン化分子中で、LUMOレベル(正電圧ピーク)の明確な分離を用いて、プリン(A、G)からピリミジン(C、T)を同定し、HOMOレベルの差を用いてピリミジン(TからC)を分離した。(b)酸性条件下でのLUMOとHOMOエネルギーレベル間のエネルギーギャップ。このエネルギーギャップは、中性分子とは異なり得る。(c)酸性(HCl)、中性(HO)、及び塩基性(NaOH)pH条件下でのチミンのHOMO/LUMOレベル。(d)酸性条件下でのケト−エノール互変異性化を含む、異なるpH条件下でのチミンの生化学的構造、中性及び塩基性条件間での酸−塩基挙動。(e)4つ全てのヌクレオチドの、酸性条件下での電子(Vtrans,e )及び正孔(Vtrans,h+)の過渡電圧の分布。Vtrans,e−及びVtrans,h+は、それぞれ、HOMO/LUMOレベル及びエネルギーバンドギャップと同じ挙動を示す。(f)過渡電圧(Vtrans,e−)及び三角トンネリングの勾配(トンネリングエネルギーバリアに比例)によって特徴付けられた、酸性条件下でのチミンの電子ファウラー−ノルトハイムプロット。概略図は、低電圧での直接トンネリングから高バイアス電圧での三角トンネリングへの遷移を示す。非常に低い電圧(ゼロバイアス限界)で、バリアは長方形になり、トンネリング電流は、印加したバイアス電圧での対数勾配を示す。 STM−STSを用いたベータ−ラクタマーゼ遺伝子ampRの配列決定。(a)酸性条件下でのポリ−L−リシンで修飾した金上のアデニンの特性化。実線の緑色線はdI/dVまたは状態密度を示し、破線の灰色線はI−Vデータであり、点線の緑色線はHOMO及びLUMOエネルギーレベルの分布を示す。(b)1091nt ampR遺伝子の単一ssDNA分子のSTM画像。画像は、DNAがポリ−L−リシンで修飾した金基板の上部で線状化していることで、STS同定が簡単にできることを示している。(c)酸性条件下でのA、G、C、及びTの電子指紋を用いて、STM−STSを用いて測定した(b)に示す強調領域におけるDNAヌクレオチドの同定。同定したヌクレオチドは色分けされる(黒色:AまたはG、青色:C、及び赤色:T)。(d)(c)からのSTSデータを用いた一次(強調)及び二次同定に基づいて同定したampR配列。 RNAヌクレオチドの電子指紋及びDNAとの比較:(a)酸性条件下でのRNAヌクレオチドの単一分子測定のアンサンブルのHOMO及びLUMOエネルギーのボックスプロットであり、ボックスは25〜75%を含むが、ひげは値の5%〜95%を示す。(b)プリン及びピリミジンの2つの異なるエネルギーレベルを示す、酸性条件下でのRNAヌクレオチドの測定したエネルギーバンドギャップのボックスプロット。(c〜d)DNA及びRNA上の同じ核酸塩基のHOMO/LUMOエネルギーレベルの分布の比較。(c)デオキシアデノシンとアデノシンの比較。(d)デオキシシチジンとシチジンの比較。 STM−STSを用いた単一ヌクレオチド修飾の同定。(a)酸性条件下において、ポリ−L−リシン被覆金(111)基板上に沈着させた、硫酸ジメチル(DMS)で処理されたアデニンオリゴマーのSTM画像。(示すように)隣接ヌクレオチド上のメチル化及び非メチル化アデニンの簡易同定により、この新規配列決定技術を用いて単一ヌクレオチド修飾を検出する可能性が強調される。(b)DMSによるアデニンメチル化の反応生成物。(c)7−メチルグアニン及び開環をもつその加水分解生成物を生成するためのDMSによるグアニンの反応スキーム。(d)非メチル化(実線)及びメチル化(破線)アデニンの酸性条件下でのHOMO/LUMOレベルの分布。(e)グアニン(実線)、メチル化グアニン(点線)及び開環メチル化グアニン(破線)の酸性条件下でのHOMO/LUMOレベルの分布。 QM−Seqを用いた単一ヌクレオチド修飾の同定。(a)DMSによるシトシンメチル化の反応生成物。(b)非メチル化(青色)シトシン及びメチル化シトシン(紫色)の酸性条件下でのHOMO及びLUMO位置のボックスプロット(25〜75%四分位)。ひげは5%〜95%百分率を示し、中心線は中央値である。(c〜d)非メチル化シトシン(c)及びメチル化シトシン(d)のトンネリングスペクトル(I−V、点線の曲線)及び(dI/dV、実線の曲線)。両方とも同じ縦軸(電圧)である。重ね合わせた青色及び紫色線は、各分布に対するピーク位置上の差を示すための視覚補助である。 I−V及び電子状態密度(dI/dV)スペクトルの測定。(a)中性pHでのシトシンのSTS電流(I)−電圧(V)曲線。(b)ピーク位置(HOMO及びLUMOエネルギーレベル)及びそのエネルギーギャップを示すその導関数。他の図に示すトンネリング署名は、各核酸塩基について測定した少なくとも20個の独立した分光データのアンサンブルを表す確率密度関数である。I−Vスペクトルの独立した測定の各々について、導関数dI/dVを用いて、HOMO及びLUMOレベル及びエネルギーバンドギャップを同定した。次いで、これらを用いて、HOMO及びLUMOレベル両方のエネルギー位置、及びエネルギーバンドギャップからの正規分布を表す確率密度関数を生成した。電子署名の多分散性は、配位エントロピー、すなわち、室温での熱エネルギーにより支援される異なる分子配座を介した荷電トンネリングによって引き起こされることが多い。 それぞれのpKaによる異なるpH条件下でのヌクレオチドの化学構造。上から下に、(a)アデニン(A)、(b)グアニン(G)、(c)シトシン(C)、及び(d)チミン(T)。チミンは、酸性条件下にて9.9で単一pKaを有し、エノール化及びプロトン化を経てもよい。 グアニンLUMO/HOMOレベルにおけるpHの効果。酸性(0.1M HClで洗浄した)、中性(HO)、及び塩基性(0.1M NaOH)pHで、金(111)表面上に沈着させたグアニンのLUMO(正ピーク)及びHOMO(負ピーク)レベルの分布。矢印は、酸性、中性、及び塩基性条件間でのLUMO及びHOMOレベルのシフトを示す。グアニンは、酸性(pHは第1のpKa約3.2〜3.3未満である)、中性、及び塩基性条件(その第2のpKa約9.2〜9.6を上回る)で3つの生化学的構造を示す。同様に、異性体の正孔捕獲により、pHが増加する(酸性から、中性、塩基性条件に)につれて、HOMOレベルの着実な増加をもたらす(正孔をトンネルしにくくなる)。しかしながら、酸性及び塩基性条件(図11)での複数の共鳴構造により、中性条件と比べてより簡単な電子トンネリング(より低いLUMOレベル)をもたらす。さらに、塩基性条件(pKa2による)でのさらなる静電反発力は、電子トンネリング確率を改善し、塩基性pHのLUMOレベルのさらなる低下をもたらす。 グアニンの生データ及び統計:(a)酸性条件下でのグアニンの生電流−電圧(I−V)曲線。(b)(a)の生スペクトルまたはdI/dV、矢印は、各スペクトル上の第1の著しい負/正ピークとして同定されたHOMO/LUMOレベルを示す。(c〜e)データセットに適合させた正規確率密度関数(図4a、4bにも示す曲線で示される)によって重ね合わされた、グアニンのHOMO(c)、LUMO(d)、及びエネルギーギャップ(e)の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。 アデニンLUMO/HOMOレベルにおけるpHの効果。酸性(0.1M HClで洗浄した)、中性(HO)、及び塩基性(0.1M NaOH)pHで、金(111)表面上に沈着させたアデニンのLUMO(正ピーク)及びHOMO(負ピーク)レベルの分布。アデニンは任意のpH条件(荷電及び非荷電の両方)で複数の共鳴構造を有するが、そのトンネリング確率におけるpHの有意な効果は観察されない(共鳴構造の間の荷電の消散による)。pHの増加に伴うHOMOレベルの小幅な増加は、酸性pH(正荷電による)で正孔トンネリングがより容易になることによるものであり得る。 アデニンの生データ及び統計:(a)酸性条件下でのアデニンの生電流−電圧(I−V)曲線。(b)(a)の生スペクトルまたはdI/dV、矢印は、各スペクトル上の第1の著しい負/正ピークとして同定されたHOMO/LUMOレベルを示す。(c〜e)データセットに適合させた正規確率密度関数(図4a、4bにも示す曲線で示される)によって重ね合わされた、アデニンのHOMO(c)、LUMO(d)、及びエネルギーギャップ(e)の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。 シトシンLUMO/HOMOレベルにおけるpHの効果。酸性(0.1M HClで洗浄した)、中性(HO)、及び塩基性(0.1M NaOH)pHで、金(111)表面上に沈着させたシトシンのLUMO(正ピーク)及びHOMO(負ピーク)レベルの分布。シトシンは、そのpKa約4.4を上回る2つの主要構造で明確なpH効果を有するが、中性と塩基性条件の間では差は見られない。しかしながら、酸性条件下でのプロトン化形態は、電子を捕捉しやすい効果を示し、LUMOエネルギーレベルを増加させる。 シトシンの生データ及び統計:(a)酸性条件下でのシトシンの生電流−電圧(I−V)曲線。(b)(a)の生スペクトルまたはdI/dV、矢印は、各スペクトル上の第1の著しい負/正ピークとして同定されたHOMO/LUMOレベルを示す。(c〜e)データセットに適合させた正規確率密度関数(図4a、4bにも示す曲線で示される)によって重ね合わされた、シトシンのHOMO(c)、LUMO(d)、及びエネルギーギャップ(e)の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。 QuanT−Seqを用いた単一ヌクレオチド修飾の同定。(a)DMSによるアデニンのメチル化の反応生成物。(b)DMSによるグアニンのメチル化の反応生成物。(c)酸性条件下で、ポリ−リシンで修飾した金(111)表面上に沈着させたアデニン及びメチル化アデニンのHOMO及びLUMOエネルギーレベル分布のボックスプロット。メチル基の付加により、正孔トンネリング確率を減少させることでHOMOレベルをシフトさせる。(d)酸性条件下で、ポリ−リシンで修飾した金(111)表面上に沈着させたグアニン及びメチル化グアニンのHOMO及びLUMOエネルギーレベル分布のボックスプロット。 チミンの生データ及び統計:(a)酸性条件下でのチミンの生電流−電圧(I−V)曲線。(b)(a)の生スペクトルまたはdI/dV、矢印は、各スペクトル上の第1の著しい負/正ピークとして同定されたHOMO/LUMOレベルを示す。(c〜e)データセットに適合させた正規確率密度関数(図4a、4bにも示す曲線で示される)によって重ね合わされた、チミン(棒)のHOMO(c)、LUMO(d)、及びエネルギーギャップ(e)の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。 グラフェンに吸収されたアデニン(核酸塩基)のHOMO、LUMO、及びエネルギーギャップ分散への配置エネルギー寄与−出典Ahmedら、ここでは、導電性基板の上に配置された異なる配置での核酸塩基のDFTシミュレーションと、DFT理論に基づく局所状態密度への導電性基板の寄与を記載している。線は、異なる角度(中心で重ね合わせた配座)でのグラフェンに吸収された窒素原子の局所状態密度(LDOS)である。黄色斜線領域は、フェルミレベル近くの主ピークに対応する。灰色陰影ボックスは、可能な全ての配座(0°〜90°)を考慮したフェルミレベル近くの主ピーク(正及び負)の分布を表す。 ファウラー−ノルトハイムプロットからの(トンネリングと電界放射レジームの間の)電子及び正孔過渡電圧におけるpHの効果。(a)アデニン(A)、(b)グアニン(G)、(c)シトシン(C)、及び(d)チミン(T)の電子(Vtrans,e−)及び正孔(Vtrans,h+)のVtransを示す。矢印は、酸性(HCl)、中性(HO)、及び塩基性(NaOH)条件間でのVtrans,e−及びVtrans,h+のシフトを示す。これら全ての遷移は、LUMO及びHOMOレベルの各変化を模倣しているため、1つの潜在的な生物物理学的性能指数としてVtransの役割が確認される。 DNAヌクレオチドグアニン、シトシン、及びチミンのトンネリング特性。グアニン(a)、シトシン(b)、及びチミン(c)のI−V(破線)、dI/dVまたは状態密度(実線)、及びLUMO及びHOMOレベルの確率分布(点線)。点線は、LUMO及びHOMOエネルギーレベル両方に適合させた正規確率分布関数である。 押出沈着技術を用いたssDNAの線状化。押出無しで裸の金上に沈着させたssDNAのSTM画像(a)、押出でポリ−L−リシンで修飾した金上に沈着させたssDNAのSTM画像(b)。ポリ−L−リシン被覆及び押出沈着スキームの役割は、このSTMデータではっきりと見ることができ、線状化DNAにより、単一ヌクレオチドのSTSを明確に同定することができる(図25)。 STM−STSを用いた単一ヌクレオチド修飾の同定。(a)DMSによるシトシンのメチル化の反応生成物。(b)酸性条件下で、ポリ−リシンで修飾した金(111)表面上に沈着させたシトシン及びメチル化シトシンのHOMO及びLUMOエネルギーレベル分布。メチル基の付加により、正孔トンネリング確率を減少させることでHOMOレベルをシフトさせる。 単一分子DNA検出能力。開示された技術を用いて生理学的濃度を模倣するために低濃度のssDNA(2回蒸留水またはTE緩衝液(トリス(ヒドロキシメチル)アミノエタン−エチレンジアミン四酢酸(またはEDTA)緩衝液中で1〜5nM)を用いて、いくつかの線状化DNA鎖を、STM−STS配列決定を用いて検出することができる。ここで示す試料走査では、DNA分子は、超平滑金(111)基板上に小さな走査面積(1μm×1μm)で見つかった。このことは、この配列決定技術が非常に低濃度のDNA分子を検出し、配列決定する能力を示している。 マイクロ流体デバイスでチャネルを形成している基板を示す。チャネル寸法(幅)は、100ナノメートル(nm=10−9m)〜50マイクロメートル(μm)の間で変化し得る。 (a)単式光学リソグラフィ後に異方性KOHエッチングを用いて光学的に作成したチップパターンのセンチメートル縮尺の写真である。(b)金から作られた高忠実度かつ周期的にパターン化されたSTMチップを示すSEM画像。超平坦/超平滑基板上の大面積(cm×cm)縮尺のSTMチップを用いて、2μm×2μm表面を走査し、大規模並列走査及びチップからの単純読み出しによって、図に示すものと同様のcm縮尺にわたる全配列を作成することができる。(c)1メガピクセル(または1メガチップ)2cm×2cmチップを示す。電圧を複数のチップに同時に印加することができ、電流を回収、保存し、複数のチップからの全ての電流値を同時に読み取ってもよい(CCDカメラと同様)。電流を読み取った後、別のバイアス電圧を印加して、塊状の2cm×2cm基板にわたって全電流−電圧曲線を再作成することができる。マイクロ流体チャネルに数千のゲノムを同時に配置し、線状化し、読み取ることができる。圧電を用いて試料を数オングストローム動かすことで、次の核酸塩基の配列決定をすることができ、かつ、−該処理を繰り返して、追加の核酸塩基を解析することができる。従って、単一2マイクロメートルにおいて、大規模並列シーケンサの走査動作(または圧電走査)により、単純マイクロ流体デバイスを用いてパターン化された比較的大きな試料バイオチップ上の可能な全ての核酸塩基を配列決定することができる。 自動化方式による塩基呼び出し方法を示す概略図。 反応性に基づく構造決定。RNA SHAPE及び/またはDMS分子による化学修飾電子指紋を用いて、かつ、SHAPEまたはDMSが反応した一本鎖領域を束縛させたRNA構造ソフトウェアを用いて、二次/三次核酸構造、ここではRNAを得た。 RNA構造決定中の反応対未反応ヌクレオチドの割り当て。 クラスタリング方法は、RNAヌクレオチドを高い信頼性で割り当てる。斜線は、正確な塩基呼び出しを示す。大文字は未修飾RNAヌクレオチドであり、小文字は修飾RNAヌクレオチドである。 QM−Seqで実験的に測定したHIV−RNaseのRNA構造(上パネル)。下パネルは、RNA折り畳みソフトウェアを用いて予測したin silicoで束縛されていないRNA構造を示す。 (上)3パラメータ電子状態(HOMO−LUMO−エネルギーギャップ)と、(下)多次元生物物理学的パラメータ(>9パラメータ、限定するものではないが、HOMO、LUMO、エネルギーギャップ、電子及び正孔のトンネリングバリアハイト、トンネリングバリアハイト差、電子及び正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへのトンネリングバリアプロファイル変化に対応する電圧、ヌクレオチドトンネリングにおける電子及び正孔の有効質量、電子及び正孔の有効質量の比率、対応するファウラー−ノルトハイムプロットの勾配)とを用いた比較。全ては、量子トンネリング分光走査から算出し、HIV−1 RNAse上のQM−Seqによって得られた電子指紋として用いた。電子状態は、RNAプリン及びピリミジン間の同定に役立つが、多変数電子指紋により、この図(下)に示すように4つ全ての核酸塩基の一意的な同定を高精度で行うことができる。 酸性条件下でのポリ−リシン被覆超平坦金(111)基板上で決定されたDNAヌクレオチド(A、T、G、C)同定のための電子指紋として用いた異なる生物物理学的パラメータ。a)LUMOレベル、b)HOMOレベル、c)電子のバリアハイト、d)正孔のバリアハイト、e)分子の全トンネリングバリアハイト、f)個々のヌクレオチドを介した荷電トンネリングの電子及び正孔の有効質量の比率、g)電子及びh)正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへの過渡電圧。 中性条件下での修飾金(111)基板上で決定されたRNAヌクレオチド(A、U、G、C)同定のための電子指紋として用いた異なる生物物理学的パラメータ。a)LUMOレベル、b)HOMOレベル、c)電子のバリアハイト、d)正孔のバリアハイト、e)分子の全トンネリングバリアハイト、f)個々のヌクレオチドを介した荷電トンネリングの電子及び正孔の有効質量の比率、g)電子及びh)正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへの過渡電圧。 自動化方式による塩基呼び出し方法を示す概略図。 核酸塩基の同一性、基板上での位置、及びポリヌクレオチド中の配列の決定方法の実施形態を示すフローチャート。
本開示の前に、トンネリング分光法を用いたDNA配列決定の課題は、各ヌクレオチドの固有のトンネリングスペクトルを同定することであった。DNAヌクレオチドの量子トンネリング分光法は、個々の核酸塩基、ヌクレオシド、及びヌクレオチドの電子状態密度を表す。本明細書には、未知のヌクレオチドの同定を助けるために、同一性が未知のヌクレオチド(未知のヌクレオシド、ヌクレオチド、または核酸塩基)の電子署名と比較して用いられる修飾及び未修飾のDNA及びRNA核酸塩基、ヌクレオシド、及びヌクレオチドの固有の指紋決定に用いられる方法、デバイス、及び組成物を開示している。一本鎖(ss)DNA及び二本鎖(ds)DNA両方のヌクレオチドを同定する以前の試みは、一般に、4つのDNA核酸塩基、ヌクレオシド、及びヌクレオチドの固有のトンネリングスペクトルを決定することができなかった。
開示された方法、デバイス、及び組成物も、RNAの既存の配列決定方法の限界の緩和に役立つ。開示された方法、デバイス、及び組成物を、単一分子レベルでの非増幅テンプレートによるRNAの直接配列決定に用いてもよい。多くの場合、本開示は、細胞または組織から得たRNA分子の同一性及び存在度を決定することに役立つ。さらに、本開示の、単一分子のヌクレオチド(DNA/RNA)修飾に対する固有の電子トンネリングスペクトル(トンネリングデータ)固有の電子トンネリングスペクトル(トンネリングデータ)の同定により、疾患の早期検出に対する有用なエピゲノム技術を提供することができる。エピゲノム研究により、ゲノムの動的状態、特に、病状及び発生生物学を決定するそれらの役割についての洞察を提供することができる。
開示された方法、デバイス、及び組成物は、ノイズがほとんどなく高い再現性があるトンネリングデータまたはI−Vデータを回収する。以前の方法では、再現性に欠け、信号対雑音比が低いという問題があった。本開示の方法、デバイス、及び組成物は、種々の方法でデータ回収を高める。例えば、開示された方法、デバイス、及び組成物は、イオン性ポリマーで被覆される超平滑荷電表面を用いる。1つの実施形態では、金(111)荷電表面は、ポリ−リシンで被覆してもよい。イオン性ポリマーの使用は、核酸骨格の配向に役立ち、これにより、以前の方法よりも再現性が高くかつ信号対雑音比が高いトンネリングデータを提供することができる。さらに、開示された方法、デバイス、及び組成物は、指紋データを回収するための定義された環境で用いてもよい。例えば、開示された方法、デバイス、及び組成物は、高または低pH環境で量子トンネリングを行い、種々の修飾及び未修飾の核酸塩基、ヌクレオチド、及びヌクレオシドを区別するの役立つ。定義された環境の使用により、得られるトンネリングデータの向上にも役立つ。
ナノ電子トンネリングは、ナノスケールで発生する量子物理学的プロセスである。ナノ電子トンネリングは、別個の原子または分子の波動関数が重複する傾向を利用したものである。電圧バイアスまたはバイアスが印加されると(原子と接触している基板の原子近くに位置する金属チップの電位が増大または減少することで)、チップと原子/分子の間の電子または正孔のいずれかのトンネリングが、電位バリアを超えて発生し得る。古典的な電荷伝導は、名目上、高電位の領域から低電位の領域へと発生する(ここで、2つの領域は、下流電位バイアスによって分離される)(電流は高電位から低電位へと流れる)が、量子トンネリングは、電位バリアハイトを超えて物理的な接触なく発生し(従って、分子状態密度は、測定によって乱されない)、ここで、トンネリング確率は、バリアハイトの増加に伴い減少する。波動関数重複により分子の1つに電子を注入する(電子トンネリング)かまたは、該分子の1つから抽出する(正孔トンネリング)ことができる。
電子状態密度を表すヌクレオチドのトンネリング電流スペクトル。本明細書で開示されるのは、ヌクレオチド同定に使用される固有の指紋を作成するためのトンネリング電流データの使用である。モデリングし、実験することによって、一本鎖(ss)DNA及び二本鎖(ds)DNAの両方、RNA、PNA、他の核酸高分子、DNA/RNA/PNAヌクレオチド修飾、核酸構造から異なるヌクレオチドを同定し、区別するいくつかの試みがなされている。しかしながら、本開示まで、ssDNA上でのグアニン(G)塩基のみ、トンネリング顕微鏡を用いた部分的な同定しかできていない。
本明細書で提示されるのは、単一分子DNA/RNA/PNA配列決定を用いて行ったヌクレオチド、ヌクレオシド、及び核酸塩基A、G、T、C、及びUの固有の電子指紋を決定するための最初のデモンストレーションである。さらに、修飾ヌクレオチド/核酸塩基の固有の指紋についても開示する。核酸塩基は、シトシン(「C」と略す)、グアニン(「G」と略す)、アデニン(「A」と略す)、チミン(「T」と略す)、及びウラシル(「U」と略す)のことを言う。C、G、A、及びTは、デオキシリボ核酸(DNA)に見ることができ、C、G、A、及びUは、リボ核酸(RNA)に見ることができる。図1は、ヌクレオチドA、G、C、T、及びUに対する量子トンネリング分光法によって決定された電子指紋を示す。ヌクレオシド、ヌクレオチド、及び核酸塩基という用語は、交換可能に用いられ、天然及び合成かつ修飾及び未修飾のヌクレオシド、ヌクレオチド、及び核酸塩基のことを言う。
開示された技術は、量子トンネリングデータを用いて、未知のヌクレオチド、ヌクレオシド、及び核酸塩基の電子署名を作成し、それらの同一性を決定するのに役立ち、室温(即ち、約20〜25℃)または1K〜300Kの極低温度で行ってもよい。場合によっては、ヌクレオチド、ヌクレオシド、及び核酸塩基の電子状態は、生物物理学的条件または環境、例えば、ヌクレオチド、ヌクレオシド、または核酸塩基を解析するpHに応じてシフトしてもよい。場合によっては、ヌクレオチド、ヌクレオシド、または核酸塩基の異なる状態を酸性pH(即ち、約7未満のpH)で同定してもよい。多くの実施形態では、電子パラメータを決定するのに用いた環境のpHは、約3未満である。
修飾及び未修飾のヌクレオチド、ヌクレオシド、及び核酸塩基の指紋は、種々の生物物理学的条件または環境で決定され、これらの電子状態はシフトしてもよい。これは、いくつかの生物物理学的条件下において類似または重複するパラメータ値を有し得る核酸塩基を区別するのに役立つ。これは、核酸塩基を同じ環境で決定された既知の核酸塩基の署名と比較することによって該核酸塩基を同定することに役立つ。上述のように、核酸塩基の指紋を所与のpHで決定し、同じpHで得られた既知の核酸塩基の指紋と比較してもよい。他の環境では、指紋は、pH以外の特定の特質、例えば、モル濃度、極性、疎水性などを有する環境で決定してもよい。種々の実施形態では、核酸塩基は、アルコール、塩、または無極性溶媒もしくは溶質を所与の量で含む環境で決定してもよい。
本明細書に開示されているように、「トンネリング電流データ」または「電流データ」または「I−Vデータ」とは、種々のバイアス電圧にて量子トンネリングで測定した電流及び電圧(バイアス電圧)データのことを言う。トンネリング電流データは、トンネリング電流測定から得られたI−V、dI/dV、及び/またはI/Vデータのことを言う。ほとんどの場合、種々のパラメータまたは値は、トンネリング電流データから導出される。パラメータには、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)(後述)の値を含み得る。
本明細書に開示されているように、「署名」または「電子署名」とは、未知の同一性のヌクレオチドに対して回収されたI−Vデータから導出されたパラメータの3つまたはそれ以上の値のことを言う。署名の作成に使用されるパラメータには、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)が含まれ、このうちの任意の3つまたはそれ以上を用いて、署名を作成してもよい。例えば、いくつかの実施形態では、未知のヌクレオチドの電子署名は、LUMO、HOMO、及びバンドギャップの値を含み得る。他の実施形態では、電子署名は、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値を含み得る。
本明細書に開示されているように、「指紋」または「電子指紋」とは、既知の同一性のヌクレオチドに対して回収されたI−Vデータから導出されたパラメータの3つまたはそれ以上の値のことを言う。既知のヌクレオチドの指紋を作成するのに選択されたパラメータは、既知のヌクレオチドが比較される未知のヌクレオチドの署名を作成するのに選択されたものと同じである。電子署名の作成に用いた所与のパラメータ値は、値+/−標準偏差もしくはある範囲の値として表してもよい。指紋の作成に用いるパラメータには、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)が含まれる。いくつかの実施形態では、未知の核酸塩基の電子署名には、LUMO、HOMO、及びバンドギャップの値を含み得、この署名は、既知の核酸塩基の電子指紋と比較してもよく、ここで、指紋は、同じパラメータ−LUMO、HOMO、及びバンドギャップの値を含む。他の実施形態では、署名は、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値を含み得、LUMO、HOMO、バンドギャップ、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値を含む指紋と比較してもよい。
開示された技術を用いて、1つまたは複数のヌクレオチド、ヌクレオシド、または核酸塩基を含むポリ核酸、ポリヌクレオチド、及び他の高分子を配列決定してもよい。
多くの場合、炎焼なまし処理された平坦な、テンプレートを剥離した超平滑金(111)結晶ファセット基板を用いてもよい。ここでの指定(111)は、金原子の暴露上面の結晶構造を示す。この目的のために他の配向(例えば、100)を用いてもよい。超平滑基板は、表面粗さが非常に低く、例えば、平面から約1.0nm未満の変動である。本明細書に記載されるのは、後述のように炎焼なまし及びテンプレート剥離処理を用いた超平滑基板を得る方法である。いくつかの実施形態では、他の基板を用いてもよい。いくつかの実施形態では、他の導電性基板、例えば、グラフェン、高配向熱分解黒鉛(HOPG)、金(または他の金属)を被覆した原子的に平坦な新たに劈開した雲母、銅(111)、銀などの他の超平滑金属を用いてもよい。多くの場合、基板は、走査及び量子トンネリング分光法の目的のために導電性でなければならず、かつ、単一分子を簡単に同定するために平滑でなければならない。
いくつかの実施形態では、ポリヌクレオチドは線状化DNAであってよく、ポリヌクレオチドは開示された超平滑基板上に引き延ばしてもよい。これは、個々のヌクレオチドを分離し、走査するためのこれらの配位エントロピーを減少させるのに役立つ。これは、糖骨格の代わりに、核酸塩基を介した荷電トンネリングの研究に役立つ。場合によっては、基板は、荷電基板であってもよい。例えば、基板が金の場合、正に帯電した金(111)表面を調製してもよい。
いくつかの実施形態では、正に帯電した金基板は、押出沈着技術を用いて作製される。まず、新たに調製した超平滑金(111)表面をプラズマ洗浄装置(例えば、オゾンプラズマ洗浄装置)で処理し、均一に負に帯電した表面を調製する。多くの実施形態では、金をイオン溶液、例えば、ポリ−L−リシンなどの正に帯電した分子で処理し、均一に被覆した正に帯電した金表面を作製してもよい。いくつかの実施形態では、押出沈着技術には、細長い線状ssDNAを金基板上に分散させるために3つの工程処理を伴う。第1の工程では、金(111)表面を化学溶液で処理することで帯電させてもよい。場合によっては、金表面をポリ−L−リシン、例えば、10ppmポリ−L−リシン溶液で被覆することで正に帯電させてもよい。超平滑表面の被覆に使用される他の分子には、任意のポリカチオン性ポリマー、例えば、ポリアリルアミン塩酸塩、カテコールアミンポリマー、アミノシラン(アミノプロピルエトキシシラン)、またはエポキシド修飾シラン(3’グリシドキシプロピルトリムエトキシシラン)を含み得る。他の実施形態では、電圧を印加して基板に骨格を電子的に結合させることによって、糖骨格の負荷電の静電固定を行うことができる。場合によっては、化学溶液は、静電相互作用を介して負に帯電したリン酸骨格が正に帯電した基板に結合するのに役立つ。ポリヌクレオチドのの配列決定に用いた実施形態では、酸性条件は、ヌクレオチド、例えば、ピリミジン−CまたはT、及びプリン−GまたはAの解析に役立つ。
押出沈着技術の第2の工程には、一本鎖DNA(ssDNA)を溶融させることを含み得る。例えば、ssDNAは、ssDNAを加熱することで、例えば、95℃で5分間加熱することで溶融させてもよい。ほとんどの実施形態では、溶融させたssDNAを急冷することで、ssDNA中に二次及び/または三次構造が形成または再形成されるのを防ぐのに役立つ。いくつかの実施形態では、急冷には、氷上で5分間フラッシュ冷却することを含み得る。多くの実施形態では、dsDNA及び短いモノヌクレオチドssDNAは、三次構造を含まず;約1kbよりも長いssDNAは、二次構造を形成し得る。多くの場合、正に帯電した表面は、二次構造の形成を分散または防止するのに役立つ。
押出沈着処理の第3の工程には、ssDNAを金基板上に押し出すことを含み得る。場合によっては、並進運動を用いて、DNA分注装置、例えば、ピペットから荷電基板上に線状化DNA鎖を沈着させ、引き延ばしてもよい。
いくつかの実施形態では、化学的にエッチングされたチップをナノ電子トンネリングに用いてもよい。いくつかの実施形態では、白金−イリジウムチップ(80:20Pt−Ir)を用いてもよい。他の実施形態では、他の適当なSTMチップを用いてもよい。用いてもよい他のいくつかの汎用チップは、タングステン、金、炭素、及び白金金属である。汎用される他のチップは、Pt、I、W、Au、Ag、Cu、カーボンナノチューブ、及びその組み合わせである。
公知及び未知のヌクレオチドは、ヌクレオチドを介して電子及び正孔をトンネリングすることで研究される。場合によっては、研究されるヌクレオチドは、図1a及び1bに示すように線状化された、一本鎖ポリヌクレオチドである。
トンネリング電流分光法(電流(I)−電圧(V))は、分子の局在電子状態密度(dI/dVスペクトル、図10及び以下により詳細に述べる)を直接測定してもよく、ヌクレオチドの生化学的構造(図1)に基づいて固有の電子指紋を提供するように作用する。
量子トンネリングを用いて分子分解能(図10a)でのヌクレオチドの電子署名が得られる。場合によっては、電子状態密度(DOS)は、電流−電圧(I−V)スペクトルの第1導関数、それぞれ、最低空分子軌道(LUMO)エネルギーレベル及び最高被占分子軌道(HOMO)エネルギーレベルとしてそれぞれ割り当てられた第1の著しい正ピーク及び第1の著しい負ピークから得てもよい。多くの場合、第1の著しいピークは、最大dI/dVの少なくとも約30%のピークであり、または、電流−電圧スペクトルの第1導関数(ここで、第1導関数は、電子及び正孔トンネリングの生体分子及び約±1.0Vを超える状態密度を表す)であってもよい。場合によっては、約±1.0V(0〜+1.0Vまたは0〜−1.0V)未満で発生するピークは、導電性基板または環境からの軽微な汚染を示し得る。これらの第1ピーク間の差は、LUMO/HOMOエネルギーギャップまたは「バンドギャップ」として割り当て(指定し)てもよい(図10b)。電子トンネリングピーク(ここでは、正バイアス電圧の印加時)は、分子のLUMOレベルに対応し、正孔トンネリングピーク(ここでは、負バイアス電圧の印加時)は、分子のHOMOレベルに対応する。LUMOとHOMOレベルの間の差は、分子のエネルギーバンドギャップである。
各核酸塩基に固有のさらなる生物物理学的パラメータも、変曲点で過渡電圧(Vtrans)によって分離された2つの異なるトンネリングレジーム(直接トンネリング及びファウラー−ノルトハイムトンネリング)を用いて算出することができる。量子トンネリングの2つの主モデルを、シュレーディンガー方程式に適用したWKB近似に基づいて開発した。絶縁体によって分離された電極間のトンネリングのシモンズモデル(式1)は、両方のレジームでのトンネリング電流を記述しており、印加したバイアス電圧及び元々のトンネリングバリア効果に依存する。
ここで、φは、トンネリングバリアの形状が長方形から台形及び三角形に変化する際に、印加した電圧に比例する平均バリアハイトであり、mは有効電子質量であり、hは減少したプランク定数であり、dは平均トンネリング距離であり、Aは有効トンネリング面積であり、qは素電荷であり、Vは印加したバイアス電圧である。モデルは、平均バリアハイト(φ)のみが必要である際に、トンネリングバリアの任意の形状に対して包括的である。
量子トンネリングに用いられる他の解析アプローチは、WKB近似からも導出されるストラットンモデル(式2)に基づく。シモンズ及びストラットンモデルは両方とも同じ電流密度の記述から始まるが、異なる組の方程式を生成するトンネリング確率積分を解くために異なる近似を取った。量子トンネリングを記述するためのストラットン方程式は:
ここで、mは電子質量であり、kはボルツマン定数であり、Tは温度であり、b(V)及びc(V)はトンネリング確率のテーラー展開から得られる2つのパラメータであり、以下のように定義される:
ここで、a=2√2m/h及びx並びにxは、トンネリングギャップの両側がφ−ξ=0の位置であり、ξは電極のフェルミエネルギーであり、φはエネルギーバリア(x及びVに依存)である。
これらのパラメータは、トンネリング電流に依存した温度で実験的に適合することができるが、モデルは、ここで用いた配列決定条件を記述する際に、Iαsinh(qVtr/h)の形態に単純化した。この関係を用いて、ln(I/V)対V−1プロット上の最小(Vtrans)を数パーセントの誤差内の以下の式として導出した:
シモンズモデルを用いて、高バイアス電圧(qV>φ)に対する単純化したファウラー−ノルトハイム方程式を導出する。これは以下の形態を取る:
両方のモデルを組み合わせて、FNプロットから直接抽出した実験データを用いて、元々のバリアハイト(φ)及び「有効」トンネリング距離(d√m)を直接算出するための式を導出することができる:
ここで、Sは、高バイアス電圧(qV>φ)で対応するln(I/V)対V−1の勾配である。ストラットン及びシモンズは両方ともシュレーディンガー(WKB)の同一近似を用いており、唯一の差はトンネリング確率積分の処理だけであることに留意されたい。ハートマンは、WKB近似の厳密解に対して両方のモデルを比較し、ストラットン及びシモンズモデルは両方とも厳密解から数パーセントの誤差内である。両方のモデルを用いた近似によって、実験分光分析データを、両方のモデルの非線形性の取り扱いにくさによりさもなければ不可能であろういずれかのモデルに適合することができる。
この方法により、最大9つのパラメータ(HOMO電圧、LUMO電圧、エネルギーバンドギャップVtrans,e−、Vtrans,h+、Φ0,e−、Φ0,h−、Δφ、及びmeff e−/meff h+)を調べることでヌクレオチドを定量的に比較することができる。多くの実施形態では、署名は、少なくとも3つのパラメータの値を分析することによって決定される。ほとんどの実施形態では、3つを超えるパラメータを用いて署名を決定する。例えば、4つ、5つ、6つ、7つ、8つ、または9つのパラメータ値を用いて、同じパラメータ値を含む指紋と比較するための署名を決定してもよい。
ヌクレオチド指紋及び署名は、ヌクレオチドを量子トンネリングに提示し、その後、トンネリング電流データを回収し分析することによって決定される。多くの場合、量子トンネリングヌクレオチド指紋を作成するために、個々のヌクレオチド分子(例えば、アデニンの単一分子)上の約15〜約50点からトンネリング電流データを回収する。さらに、約20個の異なる個々の分子の量子トンネリングデータを回収し、これは、ヌクレオチドの統計的に正確な指紋作成に役立つ。
DNAのいくつかの既知のヌクレオチドの確率密度曲線(電圧、V、またはエネルギー、eV、対確率密度関数(dI/dV))が決定されている。いくつかの確率密度曲線を図4a、4b、4c、4f、8d、8e、12、14、16、21、22、及び24bに示す。これらの曲線は、独立した測定の統計分布であり、ガウス曲線(式S1、以下。Ni:規格化定数、V:印加したバイアス電圧、μi:平均、σi:標準偏差)の正規化合計に適合させている。
これらのパラメータに用いて、HOMOレベル、LUMOレベル、及びエネルギーギャップ(バンドギャップ)からなる所与のヌクレオチドの電子指紋を作成してもよい。多くの実施形態では、既知の核酸塩基の核酸塩基指紋を用いて、未知のヌクレオチドまたはポリヌクレオチドDNA分子から回収された量子トンネリング署名を分析し、ヌクレオチドの同一性及びポリヌクレオチドの配列を決定してもよい。
核酸生化学は、核酸が見られる環境によって定義してもよい。場合によっては、周囲のpHが、核酸、例えば、核酸塩基/ヌクレオチドの構造に影響を及ぼし得る。いくつかの実施形態では、pHを変えることで、異なる構造をもつ核酸塩基が得られる場合がある。この効果は、図11に示すように核酸塩基のpKの上及び/または下で起こり得る。さらに、酸−塩基挙動に加えて、他の生化学的変化も極端なpH(酸性または塩基性のいずれか)で起こり得る。例えば、チミンは、エノール化Tがケト形よりも優位な酸性pHで互変異性体を形成し得る。
DNAヌクレオチドの相対荷電により、システムpHに応じて電子または正孔トンネリングのいずれかを容易にすることができる。例えば、いくつかの実施形態では、正に帯電したDNAヌクレオチド種により、正孔トンネリングを容易にし、電子トンネリング(LUMO)のエネルギーレベルを増すことができ、負に帯電した種は反対の挙動を示し得る(図12、14)。この効果は、2つのpK(図12)に沿ったグアニンヌクレオチドのスペクトルシフトで観察することができ、ここで、ヌクレオチドは、酸性pH下での正に帯電した構造と塩基性pH下での負に帯電した構造の間で遷移する。いくつかの実施形態では、静電相互作用は、従って、荷電トンネリングの確率を変化させる(電荷斥力を増加させる)ため、異なる(低い)LUMO及びHOMOレベルが得られる。
個々のヌクレオチドのトンネリング署名(または指紋)は、異なる環境条件下で、例えば、異なるpH条件下で異なり得る。多くの場合では、ヌクレオチドを介した電子/正孔トンネリング電流は、異なる環境条件下で回収される。異なる環境条件下での量子トンネリング署名の違いは、場合によっては、核酸塩基のケト−エノール互変異性体の存在によるためであり、これは、(図11及び以下に述べるように)異なるpH条件下で異なり得る。特定のケト−エノール互変異性体の存在または不在により、異なる核酸塩基間、例えば、プリン(A、G)とピリミジン(C、T)の間の電子/正孔トンネリング確率の分離をもたらすことがある。
ヌクレオチドの荷電密度は、これらの効果に対するエネルギー増大/減少を決定することに役立つ。場合によっては、いくつかの共役構造を有し得るプリンは、単一原子(図11)上に局在した荷電を有し得るピリミジンと比較して著しく還元されている任意の原子上に局在電荷を有してもよい。いくつかの実施形態では、共役効果は、トンネリングエネルギーシフトに著しい影響を及ぼし、酸性条件(図4c、12、14、16)下で簡単に観察され、例えば、ここで、プリンは、ピリミジン(例えば、図14のアデニンデータ)よりも著しく小さい効果を示す。
多くの場合、HOMO−LUMO及びエネルギーギャップパラメータの使用により、エネルギーギャップ(プリンA、2.73eV及びG、2.58eVとピリミジンC、4.43eV及びT、4.82eVとの間には約1.7〜2eVの差がある)及びLUMOレベル(プリンA、1.61V及びG、1.49VとピリミジンC、3.13V及びT、3.08Vとの間には約1.5eVの差がある)に基づいて酸性条件下でピリミジン(C、T)からプリン(A、G)を区別するのに役立つ。いくつかの実施形態では、CとTは、これらのHOMOエネルギーレベル差(C、−1.30VとT、−1.74Vとの間の約0.45eVの差)に基づいて区別またはデコンボリュートしてもよい。別の実施形態では、AとGは、塩基性pHでのこれらのLUMOレベル(A、1.72VとT、1.33Vとの間の約0.40eVの差)を用いて識別/区別/デコンボリュートしてもよい。核酸塩基A、T、G、及びCの特徴的なLUMO、HOMO、及びバンドギャップ値を表Iに示す。表Iは、中性、酸性、及び塩基性pH環境で決定されたこれらの値を示す。従って、いくつかの実施形態では、1つまたは複数のpH値(酸性、塩基性、及び中性)でヌクレオチド上の量子トンネリングデータを回収し、そのヌクレオチドのLUMO、HOMO、及びバンドギャップ値を決定し、既知の同一性のヌクレオチドに対して予め決定された値と比較することによって、未知のヌクレオチドの同一性を決定することができる。
グアニン:多くの場合、グアニンは、酸性条件(酸性pHは、第1のpK約3.2〜3.3未満である)、中性条件、及び塩基性条件(その第2のpK約9.2〜9.6を上回る)で3つの異なる生化学的構造を示し得る。場合によっては、異性体の正孔捕獲により、pHが増加する(酸性から、中性、塩基性条件に)につれて、HOMOレベルの着実な増加をもたらすことがある(正孔をトンネルしにくくなる)。いくつかの実施形態では、酸性及び塩基性条件(図11)での複数の共鳴構造により、中性条件と比べてより簡単な電子トンネリング(より低いLUMOレベル)をもたらすことがある。場合によっては、塩基性条件(pKaによる)でのさらなる静電反発力は、電子トンネリング確率を改善し、塩基性pHのLUMOレベルのさらなる低下をもたらすことがある。
アデニン:多くの場合、アデニンは、任意のpH条件(荷電及び非荷電の両方)で複数の共鳴構造を示し得る。ほとんどの場合、pH変化は、アデニンのトンネリング確率に著しい影響を及ぼさない。場合によっては、このpH効果の欠如は、共鳴構造の間の荷電の消散によるものであろう。場合によっては、アデニンは、pHの増加に伴うHOMOレベルの増加を示し得、場合によっては、酸性pH(正荷電による)で正孔トンネリングがより容易になることによるものであり得る。
シトシン:多くの実施形態では、シトシンは、2つの主要構造で異なるpH効果を有し得る。例えば、いくつかの実施形態では、シトシンは、そのpK約4.4を上回り、中性と塩基性条件の間では差は見られない。他の場合では、シトシンが酸性条件下でプロトン化形態である場合、電子捕捉効果を示し、LUMOエネルギーレベルの増加をもたらすことがある。
種々の核酸塩基を識別/区別するために、トンネリング電流データを他の方法で分析してもよい。いくつかの実施形態では、ファウラー−ノルトハイム(F−N)プロットを用いてトンネリング電流を分析してもよい。これらのプロットは、単一ヌクレオチドを介したかまたはポリヌクレオチドの個々のヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定することに役立つ。トンネリング電流(I)−電圧(V)データをln(I/V)対(1/V)としてプロットしてもよい。いくつかの実施形態では、このプロットは、過渡電圧(Vtrans)及びトンネリングレジーム(三角形バリア)の勾配を抽出するのに役立つ。Vtransは、F−Nプロット上の最小値(異なるレジーム間の遷移点に等しい)として決定される。Sは、高バイアス(1/Vの小さい値)でのF−Nプロットの勾配である。この値は、電子トンネリングには負勾配をとり、正孔トンネリングには正勾配をとる。図4eは、ヌクレオチドTのF−Nプロットの一例である。場合によっては、過渡電圧Vtrans,e−は、トンネリングから電界放射レジームへの遷移を表し、勾配Sは、トンネリングバリア(ここでは、電子)の尺度である。場合によっては、ヌクレオチド配列を介した電子(Vtrans,e−)及び正孔(Vtrans,h+)トンネリングのこれらの生物物理学的パラメータは、電子署名の構成要素を同定することを表し、HOMO−LUMO及びバンドギャップ値と同じように用いて、未知のヌクレオチド及びポリヌクレオチド配列を特徴付けし、同定してもよい。
場合によっては、Vtrans,e−及びVtrans,h+値を用いて、異なる環境条件下で、例えば、pHで異なる核酸塩基を区別してもよい。場合によっては、酸性、中性、及び塩基性条件下で決定されたVtrans,e−及びVtrans,h+値を用いて、2つまたはそれ以上の核酸塩基を区別してもよい。多くの実施形態では、1つまたは複数のパラメータを用いることで、2つまたはそれ以上の核酸塩基を区別するのに役立つ。場合によっては、パラメータをVtrans,e−、Vtrans,h+、S、HOMO、LUMO、またはバンドエネルギー(バンドギャップ)値から選択してもよい。多くの実施形態では、パラメータを1つまたは複数の異なる条件下、例えば、酸性、中性、または塩基性条件下で決定してもよい。
多くの場合、トンネリングから電界放出への過渡電圧、及び荷電トンネリングのバリアを示す勾配などのトンネリングデータの分析から追加のパラメータを抽出してもよい。これらのトンネリング定数、Vtrans,h+、Vtrans,e−、S=S+S(ここで、S=S電子トンネリング、S=正孔トンネリング)は、電荷がトンネリングする分子の特徴であってもよい。場合によっては、これらのパラメータを、個々のヌクレオチドに対して決定し、これらの区別に役立ててもよい。いくつかの実施形態では、これらのパラメータをHOMO−LUMO及びバンドギャップ値と組み合わせて、核酸塩基同一性の決定及びヌクレオチド指紋の作成に役立ててもよい。いくつかの実施形態では、Vtrans,h+を用いた正孔トンネリング確率の変化の決定をHOMOレベルのように用いて、異なるpH条件下でヌクレオチドの同一性を決定することができる。
さらに、ファウラー−ノルトハイムプロットを用いて、電子及び正孔(Vtrans,e−及びVtrans,h+)両方のトンネリング過渡電圧、及びエネルギーバリア(S)(図4e及び表III)を同定することができる。同時に、最大6つのパラメータ(VHOMO、VLUMO、エネルギーギャップ、S、Vtrans,e−、Vtrans,h+)を用いて、単一ヌクレオチドの同一性を同定し、有効にすることができる。
多くの実施形態では、酸性環境は、区別可能なヌクレオチド異性体の形成に役立つ。A、G、T、及びCのpKaは、それぞれ、約4.1、3.3、9.9、及び4.4である。多くの場合、酸性環境を用いて、バンドギャップ、HOMO、LUMO、Vtrans、及びS値(図4a、4b、4e、4f)を用いて単一ヌクレオチドを再現性良く配列決定することができる。いくつかの実施形態では、酸性pH下で行った単一STM−STS測定を用いて、一本鎖DNA(STMを用いて)及び単一ヌクレオチド(STSデータを用いて、図5aにAを示し、図22にT、G、Cを示す)を配列決定してもよい。他の実施形態では、複数のpH環境下で行った複数のSTM−STS測定を用いて、一本鎖DNA及び単一ヌクレオチドを配列決定してもよい。いくつかの実施形態では、開示された方法によりDNA及び/またはヌクレオチド同一性を決定する時間尺度は、秒または分のオーダーであってもよい。
多くの実施形態では、開示された技術は、約85%、90%、95%、96%、97%、または99%精度を超えてポリヌクレオチドを配列決定することができる。いくつかの実施形態では、本願技術を用いて、約30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt、200nt、300nt、400nt、500nt、1k nt、2k nt、3k nt、4k nt、5k nt、または10k ntを超えるポリヌクレオチドを配列決定してもよい。多くの場合、開示された技術を用いて、ポリヌクレオチドの3’−>5’順序を決定することができる。場合によっては、一本鎖DNAの末端を標識することで、3’−>5’指向性を決定してもよい。いくつかの実施形態では、3’または5’末端を標識する。例えば、特定の5’または3’末端特異的プライマータグをもつリガーゼ、例えば、T4リガーゼを用いて、標識を達成してもよい。ライゲーション工程により、5’−または3’−末端をマークしたテンプレートを作成してもよい。場合によっては、標識末端近くの配列が分かっている。開示された配列決定法を用いて、既知の配列は標識によって同定され、これにより、未知のDNA試料の指向性が明らかになるであろう。
開示された方法に用いて、修飾核酸塩基を区別し、同定してもよい。いくつかの実施形態では、本開示の技術に用いて、天然、合成、及び/または、修飾のヌクレオチド及び核酸塩基を含むヌクレオチド及び核酸塩基を区別し、同定してもよい。天然のヌクレオチドは、アデニン、グアニン、シトシン、チミン、ウラシル、及びイノシンを含む修飾及び未修飾の核酸塩基を含み得る。いくつかの実施形態では、開示された方法を用いて、2’OH基をもつリボース糖を含む他のA、U、G、C RNA塩基の同一性を決定してもよい。場合によっては、核酸塩基を、例えば、メチル化によって修飾してもよい。いくつかの実施形態では、RNA、DNA、及び/または糖骨格で用いた種々の追加の化学修飾を検出することができる。いくつかの実施形態では、開示された方法を用いて、1−メチル−7−ニトロイサト酸無水物、またはベンゾイルシアニド、または他の求電子試薬、ジヒドロキシ−3−エトキシ−2−ブタノン(ケトキサール)、CMCT(1−シクロヘキシル−(2−モルホリノエチル)カルボジイミドメト−p−トルエンスルホネート)、または脱アミノ化塩基、例えば、亜硫酸水素塩による脱アミノ化を検出してもよい。メチル化核酸塩基には、メチルシトシン、メチルアデニン、メチルグアニン、メチルウリジン、メチルイノシン、5−メチルシトシン、5−ヒドロキシメチルシトシン、7−メチルグアノシン、N6−メチルアデノシン、及びO6−メチルグアニンが含まれる。
開示された組成物、方法、及び技術を用いて、種々の分子の電子署名を決定してもよい。場合によっては、分子はヌクレオチドまたは核酸塩基であってもよい。多くの実施形態では、開示された技術及び組成物は、これらの電子状態密度に基づいて分子を同定し、区別してもよい。いくつかの実施形態では、電子状態密度は、トンネリング分光法(相関STM−STS)を用いて決定される。いくつかの実施形態では、異なる電子署名は、pH環境に応じて分子ごとに同定可能であり、かつ、異なっていてもよい。多くの場合、ヌクレオチドは、酸性、塩基性、及び/または中性条件下で分析してもよい。いくつかの実施形態では、ヌクレオチド及びこれらの対応する互変異性体構造の酸−塩基挙動は、未知のヌクレオチドの同定に役立つ。
ポリマー鎖、特に、ポリヌクレオチドの検出及び配列決定に役立たせるために、本開示の技術を自動化してもよい。いくつかの実施形態では、高分解能STSを用いて単一鎖を配列決定し、単一ヌクレオチド分解能をもつ高速単一分子配列決定を提供してもよい。開示された技術は、単一ヌクレオチド及び修飾の高速で、安価で、正確で、無酵素で、かつ高スループットな同定を開発し、生物医学的応用における次世代の配列決定技術の代替手段を提供することができる。
本願の技術、方法、デバイス、及び組成物を用いて、基板上のポリヌクレオチドの配列決定をしてもよい。場合によっては、基板は金(111)である。いくつかの実施形態では、基板は、マイクロ流体チャネルまたはウェルを形成する。いくつかの実施形態では、マイクロ流体チャネルまたはウェルは、超平滑基板、例えば、金(金(111))で被覆される。多くの実施形態では、複数のポリヌクレオチドを、開示された技術を用いて別個のチャネルまたはウェルで同時に配列決定してもよい。多くの場合、マイクロ流体ウェルは、ポリヌクレオチド、例えば、一本鎖ポリヌクレオチドをマイクロ流体チャネルに供給してもよく、ここで、開示された技術を用いてポリヌクレオチドの配列決定をする。
単一STMチップ及び単一金(111)基板を用いて低濃度のDNAまたはRNAの配列決定をしてもよいため、複数のマイクロ流体チャネル及びウェル並びに複数のSTMチップを用いて、複数のポリヌクレオチド(RNAまたはDNA分子)を開示された基板上で同時に押し出し、配列決定してもよい。この高速で、高スループットで、無酵素な、単一分子DNA配列決定技術の作業コストは非常に低い。単純金基板では、全ゲノム配列を単一基板上に作ることができ、全配列決定にかかる作業コスト(数十ドルに)及び時間(数時間または数分)が大幅に減少する。いくつかの実施形態では、多くの個々の単一ポリヌクレオチドを同時に配列決定する場合、時間を数時間未満に減少させることができる。
本開示はさらに、核酸塩基、ヌクレオシド、及び/またはヌクレオチドのトンネリング電流データを取得することと;トンネリング電流データから少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの電子署名を導出することと、ここで、電子署名は、HOMO(eV)値、LUMO(eV)値、バンドギャップ(eV)値、Vtrans(V)値、Vtrans(V)値、φe−(eV)値、φh+(eV)値、me−/mh+値、及びΔφ(eV)値からなる群から選択され;少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの電子署名を一連の対応する電子指紋参照値にマッチングさせることと;それによって、核酸塩基、ヌクレオシド、及び/またはヌクレオチドを同定することを含む、核酸塩基、ヌクレオシド、及び/またはヌクレオチドの同定方法を提供する。ここで、デオキシアデノシンは、HOMO(eV)値が−1.39±0.3であり;LUMO(eV)値が1.42±0.24であり;バンドギャップ(eV)値が2.81±0.41であり;Vtrans(V)値が1.14±0.2であり;Vtrans(V)値が−0.51±0.32であり;φe−(eV)値が1.45±0.57であり;φh+(eV)値が1.03±0.61であり;me−/mh+値が0.29±0.23であり、Δφ(eV)値が2.48±0.98である一連の対応する電子指紋参照値を含み;アデノシンは、HOMO(eV)値が−1.44±0.2であり;LUMO(eV)値が1.47±0.21であり;バンドギャップ(eV)値が2.9±0.27であり;Vtrans(V)値が1.26±0.26であり;Vtrans(V)値が−0.63±0.23であり;φe−(eV)値が2.06±0.72であり;φh+(eV)値が1.25±0.59であり;me−/mh+値が0.43±0.17であり、Δφ(eV)値が3.3±0.93である一連の対応する電子指紋参照値を含み;メチル化デオキシアデノシンは、HOMO(eV)値が−2.04±0.28であり;LUMO(eV)値が2.06±0.37であり;バンドギャップ(eV)値が4.1±0.25であり;Vtrans(V)値が1.47±0.37であり;Vtrans(V)値が−0.91±0.27であり;φe−(eV)値が1.6±0.36であり;φh+(eV)値が1.28±0.41であり;me−/mh+値が1.21±0.98であり、Δφ(eV)値が2.87±0.74である一連の対応する電子指紋参照値を含み;デオキシグアノシンは、HOMO(eV)値が−1.36±0.19であり;LUMO(eV)値が1.48±0.24であり;バンドギャップ(eV)値が2.84±0.27であり;Vtrans(V)値が1.13±0.13であり;Vtrans(V)値が−0.48±0.29であり;φe−(eV)値が1.33±0.3であり;φh+(eV)値が0.79±0.5であり;me−/mh+値が0.32±0.25であり、Δφ(eV)値が2.12±0.65である一連の対応する電子指紋参照値を含み;グアノシンは、HOMO(eV)値が−1.4±0.31であり;LUMO(eV)値が1.47±0.19であり;バンドギャップ(eV)値が2.86±0.31であり;Vtrans(V)値が1.13±0.17であり;Vtrans(V)値が−0.59±0.15であり;φe−(eV)値が1.97±0.44であり;φh+(eV)値が1.07±0.44であり;me−/mh+値が0.54±0.19であり、Δφ(eV)値が3.04±0.72である一連の対応する電子指紋参照値を含み;メチル化デオキシグアノシンは、HOMO(eV)値が−2.24±0.42であり;LUMO(eV)値が2.3±0.64であり;バンドギャップ(eV)値が4.53±0.85であり;Vtrans(V)値が1.5±0.46であり;Vtrans(V)値が−1.33±0.55であり;φe−(eV)値が3.29±1.36であり;φh+(eV)値が3.25±1.69であり;me−/mh+値が1.13±0.72であり、Δφ(eV)値が6.54±2.98である一連の対応する電子指紋参照値を含み;デオキシシチジンは、HOMO(eV)値が−1.81±0.34であり;LUMO(eV)値が2.39±0.4であり;バンドギャップ(eV)値が4.2±0.49であり;Vtrans(V)値が1.34±0.31であり;Vtrans(V)値が−0.8±0.26であり;φe−(eV)値が2.62±0.89であり;φh+(eV)値が1.57±0.63であり;me−/mh+値が0.64±0.31であり、Δφ(eV)値が4.19±1.17である一連の対応する電子指紋参照値を含み;シチジンは、HOMO(eV)値が−1.4±0.24であり;LUMO(eV)値が2.2±0.22であり;バンドギャップ(eV)値が3.6±0.25であり;Vtrans(V)値が1.59±0.28であり;Vtrans−(V)値が−0.59±0.33であり;φe−(eV)値が3.17±0.63であり;φh+(eV)値が1.23±0.68であり;me−/mh+値が0.39±0.25であり、Δφ(eV)値が4.4±1である一連の対応する電子指紋参照値を含み;メチル化デオキシシチジンは、HOMO(eV)値が−2.78±0.39であり;LUMO(eV)値が2.62±0.59であり;バンドギャップ(eV)値が5.4±0.36であり;Vtrans+(V)値が1.62±0.37であり;Vtrans(V)値が−1.89±0.29であり;φe−(eV)値が3.07±0.8であり;φh+(eV)値が3.4±1.13であり;me−/mh+値が1.18±1.46であり、Δφ(eV)値が6.46±1.89である一連の対応する電子指紋参照値を含み;チミジンは、HOMO(eV)値が−1.38±0.19であり;LUMO(eV)値が2.68±0.3であり;バンドギャップ(eV)値が4.06±0.32であり;Vtrans(V)値が1.43±0.37であり;Vtrans(V)値が−0.44±0.19であり;φe−(eV)値が2.75±0.69であり;φh+(eV)値が0.85±0.4であり;me−/mh+値が0.33±0.17であり、Δφ(eV)値が3.61±0.73である一連の対応する電子指紋参照値を含み;及びウラシルは、HOMO(eV)値が−1.51±0.25であり;LUMO(eV)値が2.04±0.25であり;バンドギャップ(eV)値が3.54±0.31であり;Vtrans(V)値が1.53±0.34であり;Vtrans(V)値が−0.9±0.36であり;φe−(eV)値が3.71±1.36であり;φh+(eV)値が1.98±1.09であり;me−/mh+値が0.68±0.29であり、Δφ(eV)値が5.68±1.61である一連の対応する電子指紋参照値を含む。
本開示はさらに、ヌクレオシドのトンネリング電流データを取得することと、ここで、核酸塩基、ヌクレオシド、及び/またはヌクレオチドの同一性は公知であり;トンネリング電流データから少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの電子署名を導出することと;電子署名から一連の電子指紋参照値を開発することと、ここで、一連の電子指紋参照値は、核酸塩基、ヌクレオシド、及び/またはヌクレオチドを同定することができる、核酸塩基、ヌクレオシド、及び/またはヌクレオチドの一連の電子指紋参照値の開発方法を提供する。
別の態様では、一連の電子指紋参照値は、第2の核酸塩基、ヌクレオシド、及び/またはヌクレオチドから第1の核酸塩基、ヌクレオシド、及び/またはヌクレオチドを区別することができ、ここで、第1の核酸塩基、ヌクレオシド、及び/またはヌクレオチド、並びに第2の核酸塩基、ヌクレオシド、及び/またはヌクレオチドは、異なるヌクレオシドである。
別の態様では、電子署名は、HOMO(eV)値、LUMO(eV)値、バンドギャップ(eV)値、Vtrans(V)値、Vtrans(V)値、φe−(eV)値、φh+(eV)値、me−/mh+値、及びΔφ(eV)値からなる群から選択される。
別の態様では、一連の電子指紋参照値は、HOMO(eV)値、LUMO(eV)値、バンドギャップ(eV)値、Vtrans(V)値、Vtrans(V)値、φe−(eV)値、φh+(eV)値、me−/mh+値、及びΔφ(eV)値からなる群から選択される。
本開示はさらに、核酸配列の決定方法を提供し、ここで、核酸配列は、DNA、修飾DNA、RNA、修飾RNA、PNA、修飾PNA、及びそのいずれかの組み合わせからなる群から選択され、核酸配列は、核酸塩基及び帯電した骨格を含む。
開示された技術を用いて、剥離した金基板を用いた大規模並列配列決定を提供してもよい。1つの実施形態では、テンプレート剥離を用いて基板を調製し、テンプレートを剥離した金基板を用いて大規模並列STMイメージングを行ってもよい。1つの実施形態では、光リソグラフィの後に、KOHエッチングなどの異方性エッチングを用いて、チップを光学的に作成してもよい。
実施例
実施例1−LUMO、HOMO、及びバンドギャップ値
フレームアニール処理した平坦な、テンプレートを剥離した超平滑金(111)基板(以下を参照されたい)。基板から引き延ばされたヌクレオチドをもつ線状化DNAを調製するため(糖骨格の代わりに核酸塩基を介した荷電トンネリングを試験するため)、正に帯電した金(111)表面を調製し、以下で詳述する新規の押出沈着技術で用いるために開発した(図1a)。
STM基板調製
フレームアニール処理された金(111)表面をテンプレート剥離によって得た。一般のテンプレート剥離処理では、熱的に蒸発させた金(Au)フィルムをシリコン(100)上でフレームアニール処理し、または他のインデックスマッチした基板(金(111)をSi(100)に45°の配向で形成し、金(111)配向を生成した。金被覆は洗浄したシリコン基板に接着しないため、エポキシ、電着させた金属、または金に接着し得る他のポリマーフィルムを用いて剥離することができる。剥離したフィルムにより、原子的に平坦な(平坦なシリコンウェハの滑らかさを模倣する)金(111)基板が明らかになる(Nagpalら、Science.325,594,2009に記載)。剥離した直後、表面をOプラズマで2分間処理し(Jelight Company INC UVO Cleaner Model No.42)、(正に帯電した高分子電解質を吸着させるために)表面を均一に負に帯電させた。裸の金試料では、まず、500μlの0.1M HCl、0.1M NaSO、または0.1M NaOHを表面上に添加し、圧縮空気で乾燥させた。その後、1μlのDNA溶液(オリゴマーまたはampRのいずれか)を表面上で並進運動で伸長し、乾燥させた。ポリ−L−リシン試料では、25μlの10ppm溶液(分子量70,000〜150,00g/mol、Sigma,USAから購入)を、清浄化した金基板上に添加した後、室温で5分間インキュベーションし、500μlの再蒸留水で洗浄し、圧縮空気で乾燥させた。STM−STSのDNA試料を上述のように調製した。さらに、試料を同じ濃度の500μlの水、酸、または塩基で洗浄し、圧縮空気で乾燥させた。
STMのssDNAオリゴマー及びssDNA ampR DNA
一本鎖オリゴマー(ポリ(dA)15、ポリ(dC)15、ポリ(dG)15、ポリ(dT)15)をInvitrogen、USAから購入した。DNAオリゴマーを0.1M NaSO溶液中に20μΜの濃度で溶解させ、使用するまで−20℃で保存した。NanoDrop 2000分光光度計(Thermo Scientific、USA)を用いてDNA濃度を測定した。
配列決定用のDNA鎖を線状化するための押出沈着技術
金基板上で細長い線状ssDNAを分散させるため、3工程の手順を行った。第1に、金(111)表面に上述のように10ppmポリ−L−リシン溶液によって被覆させることで、金(111)表面を正に帯電させた。第2に、ssDNAを95℃で5分間溶融させた後、氷上で5分間フラッシュ冷却した。場合によっては、dsDNA及び短いモノヌクレオチドssDNA鎖は三次構造を含まないが、1kb長のssDNAは二次構造を形成することができる。一般に、溶融させることにより、DNA上の二次構造を除去するのに役立ち、正に帯電した表面の使用により、二次構造を分散させるのに役立つ。表面上の正電荷は、静電相互作用を介してリン酸骨格に結合するポリ−L−リシンペプチドによって提供された。ほとんどの場合、例えば、配列決定の目的のため、酸性条件を用いて、4つのヌクレオチド−CまたはT及びプリン−GまたはAをデコンボリュートする/区別する/識別することができる。第3に、ssDNA分散(1〜5nM)を修飾金(111)表面上に並進運動で押し出し、線状化DNA鎖(図23、後述)を形成した。ポリヌクレオチドを異なる状況で押し出した。特定の例として、2つの実施形態:ピペットチップ(0.1〜1μl)を用いて、沈着させながら並進運動を徐々に適用する実施形態と;マイクロ流体を用いる実施形態について説明し、ここで、ポリヌクレオチドを片面に添加し、毛細管力によりナノ/マイクロチャネルを介してポリヌクレオチドを押し出した。
DNAを正に帯電した金表面上に沈着させた後、押出運動によって、負に帯電したリン酸骨格と正に帯電した表面との相互作用によりDNAを金表面上に固定化することができる。この相互作用は、原子的に平坦な金の上部にヌクレオチドを暴露させ、これらのSTSスペクトルの測定を用いてのヌクレオチドの配列決定をすることができる。この方法により、ssDNAを線状化することで二次構造を減少させるだけでなく、ノイズ及びバックグラウンド信号をリボース糖及びリン酸骨格から減少させる。
ポリ−L−リシンによる表面修飾は、両方の間の類似のエネルギーギャップを保ちながら、LUMOレベルのエネルギーを低下させ、HOMOレベルのエネルギーを増加させるという一般的な効果を有した。この効果は、表面の相対pHを増加させるリシン残基の僅かな塩基成分によるものである。
化学的にエッチングされた白金−イリジウムチップ(80:20 Pt−Ir)を用いて、相関したSTM及びSTS研究を、線状化DNAヌクレオチド(図1a及び図3a、3b)を介した電子及び正孔のトンネリングによって行った。トンネリング電流分光データ(電流(I)−電圧(V))は、分子の局在電子状態密度(dI/dVスペクトル、図10及び上の説明)の直接測定であり、ヌクレオチドの生化学的構造(図1及び図3a、3b)に基づいて固有の電子指紋を作成するのに役立つように作用する。種々のDNAヌクレオチドの異なるトンネリング署名を同定するため、ヌクレオチドを介した電子/正孔トンネリングを異なるpH条件下で調べた。異なるpH条件下(図11及び後述)での核酸塩基のケト−エノール互変異性体の存在により、プリン(A、G)とピリミジン(C、T)の間の電子/正孔トンネリング確率を分離するのに役立ち、これら2つのグループを区別するのに役立つ。
イメージング及び分光法
Agilent Technologies、USAから購入した化学的にエッチングされたPt−Irチップ(80:20)を用いて、走査トンネリング顕微鏡画像を修飾分子イメージングPicoSPM IIで得た。機器を室温及び大気圧下で操作した。トンネリング接合パラメータを100pAのトンネリング電流及び0.1Vの試料バイアス電圧で設定した。高電流/電圧によるDNA試料の劣化を避けるために、前述の接合パラメータによって90V/sの走査速度で分光法測定を得た。電流−電圧(I−V)スペクトルの情報を含む走査トンネリング分光データを用いて、Matlabによってその導関数dI/dVを得た。dI/dVは、以下に述べるように電子局所状態密度に比例する。LUMO及びHOMOレベルのエネルギーバンド割り当ては、第1の著しい正及び負ピークをそれぞれスペクトル上に割り当てることで行った(図10)。LUMO値とHOMO値の間のエネルギー差は、電子LUMO−HOMOエネルギーバンドギャップを定義する。各ヌクレオチドは、プリン及びピリミジン間の一次同定のHOMO/LUMO及びエネルギーギャップに基づいて割り当てた。C及びTの同定は、これらのLUMO及びHOMOレベル差に基づくものであった。
各ピクセルに対応するX−Y位置を用いて、データポイント間の距離を算出した。この情報も用いて、各ヌクレオチドが約0.65nmのサイズを有する際に、配列に割り当てた。ヌクレオチド配列の空間的測定に基づいて、2つの隣接測定間の距離をnmで算出し、0.65で割った。そのため、各測定は隣接ヌクレオチドに対応し、位置はその順序の算出のためにのみ用いた。従って、量子分子配列決定走査を用いて配列を同定した。まず、各ヌクレオチドに対して、生物物理学的パラメータ、例えば、HOMO、LUMO、バンドギャップ、過渡電圧(正及び負)、電子/正孔有効質量の比率、電子及び正孔のφ、及びΔφを同定した。参照ライブラリ(よく特徴付けられた既知の配列、例えば、修飾を欠いたホモポリヌクレオチドからのトレーニングセット上で決定された)からの同定したパラメータを用いて、機械学習モデルを参照として構築した。その後、未知のスペクトルを処理してパラメータを抽出し、それらをトレーニングセットと比較して、各個々のグループの確率をトレーニングセットから同定した。最も高い確率をもつグループを元々のスペクトルに割り当て、配列アラインメントに用いる。この方法により配列を同定することができる。注釈付き配列(ここでは、例えば、ampR)に対して同定された配列決定の精度を確認するため、基本ローカルアラインメント検索ツール(BLAST)を用いて、同定した配列を、National Center for Biotechnology information(寄託番号EF680734.1、www.ncbi.nlm.nih.gov/nuccore/EF680734.1にて入手)にて入手したampR配列と比較した。この場合、測定した配列を参照に整列させるためにBLASTを用いる。配列アラインメントに加えて、得られたデータを用いて、新規の配列アノテーションにデノボアセンブルすることもできる。
密度関数理論シミュレーション:図2に示し、かつ、Phys.Rev.140,A1133,C.C.J.Roothaan Rev.Mod.Phys.23,69−89,及びJ.Comput.Chem.14,1347−1363(1993)に記載された制限ハートリーフォック法を用いて、GAMESSソフトウェアパッケージに設定されたB3LYP関数及び6−311G(2d、2p)基底による密度関数理論を用いた電子構造計算を行った。デオキシヌクレオチド及びリボヌクレオチドと比較する中性核酸塩基には、J.Chem.Phys.77,3654(1982)及びJ.Chem.Phys.80,3265(1984)に記載された6−311G(2d、2p)基底系を用いた。これは、ガウス軌道のsplit−valence triple zeta記述であるため、正確な結果を提供する。単離した核酸塩基上の、pHによる異なる互変異性体の研究事例では、J.Chem.Phys.77,3654(1982)及びJ.Chem.Phys.80,3265(1984)に記載される6−31++G(2d、2p)基底系を用いた。水素及び重原子両方の拡散関数の追加により、荷電分子がより良く記述される。核酸塩基、ヌクレオチド、またはヌクレオシドの各々の構造をJmolソフトウェアで統合した特徴を用いて最初に最適化した。GAMESSの電子算出中に構造最適化をさらに算出した。MacMolPltを用いて分子軌道を描いた。
酸性pHで行ったSTS測定により、ケト/エノール異性体の形成が容易となる。酸性pH環境は、強酸、例えば、HClを添加して達成してもよい。多くの実施形態では、pH環境は、任意の酸、塩基、またはpH緩衝液を添加して達成してもよく、例えば、酸は、硫酸、クエン酸、硝酸、乳酸、炭酸、リン酸、ホウ酸、シュウ酸、及び酢酸を含み得る。ほとんどの実施形態では、pH環境を変えるために酸を用いた。多くの実施形態では、酸は3を下回るpKaを有し、所望のヌクレオチド化学修飾を確実に達成するのに役立つ。デオキシリボヌクレオチドの場合では、これは図11から分かるであろう。多くの場合、酸性pHで行ったSTSにより、電子及び正孔のトンネリング確率をそれぞれ示す最低空分子軌道(LUMO)レベルと最高被占分子軌道(HOMO)レベルを分離することができる。この分離は、図4aのVまたはeV対確率プロットから分かるであろう。この分離は、図4bに示すエネルギー「バンドギャップ」またはHOMO−LUMOレベル間の差でも分かるであろう。いくつかの実施形態では、ヌクレオチドC(−1.30±0.17eV)及びT(−1.74±0.29eV)のHOMOレベル(または正孔トンネリング確率)は、図4aで分かるように分離を示すこともある。C及びTのHOMOレベル間の分離は、これらのケト及びエノール化構造(図11)によるものであろう。
塩基性条件を用いて、核酸塩基を区別してもよい。場合によっては、塩基性pHは、アデニンヌクレオチドとグアニンヌクレオチド(A及びG)を区別するのに役立つ。これらの場合、LUMOレベルは、Aでは約1.72±0.19eV、Gでは約1.33±0.17eVであってもよい。いくつかの実施形態では、塩基性pHは、強塩基、例えば、NaOHの添加によって達成され得る。多くの場合、所望のpH環境は、カリウム、アンモニウム、カルシウム、マグネシウム、バリウム、アルミニウム、鉄、及び亜鉛、水酸化リチウム)を含む種々の酸、塩基、または緩衝液の添加によって達成され得る。ほとんどの場合、塩基性pHの達成に用いた塩基は、9を上回るpKaを有し、所望のヌクレオチド化学修飾を確実に達成するのに役立つ。場合によっては、A及びGのHOMOレベルは、塩基性条件下で異なっていてもよい。3つの異なる環境における4つのヌクレオチド、A、T、G、及びCの値は、表Iに記載されている。
場合によっては、生化学の違いは、他の異性体に見られ、異なるpH条件下で単一ヌクレオチドのSTSを用いて検出される(図4c、12、14、16)。例えば、アデニン、グアニン、及びシトシンと異なるチミン核酸塩基(T)は、(酸性条件下で形成された)エノール異性体を介して電荷(電子及び正孔の両方)をトンネリングし得る(図4c、4d、11、表I)。この効果は共役によるものであろう。酸性、中性、及び塩基性pH下での単一Tヌクレオチドを介したSTS分光法により、これらの生化学的変化が実証され、これは、単一分子を介して電荷がトンネリングしやすいことによるものであろう(図4c、d)。単一TヌクレオチドのLUMOレベルは、電子トンネリングしやすいことによりpHの増加に伴って減少する(静電反発力の効果と思われる、図4d、11、上述)。LUMO及びHOMOレベルにおけるpHの同様の効果は、他のヌクレオチド(図12、14、16)にも観察される。例えば、グアニンの2つのpKa値及び得られた異性体は、STSデータを用いて分かる(図12、表I)。従って、(これらのpKa値によって決定された)異なるpH条件下で形成された生化学的構造、核酸塩基互変異性体、及び他の異性体は、LUMO及びHOMO値をそれぞれ用いてモニタリングした際の電子及び正孔トンネリングの確率を用いて追跡した(バンドギャップに沿って、図4a、4b、4c、12、14、16、表I)。
DFT研究を用いて、異なるpH条件下での(例えば、図11及び上述のように)ヌクレオチド及び核酸塩基のケト−エノール互変異性体のプロトン化及び脱プロトン化酸/塩基の存在により、異なるpH条件下でのプリン(A、G)とピリミジン(C、T)の間の電子/正孔トンネリング確率を分離することができるとの仮説を立てた。得られた量子分子配列決定(QM−Seq)電子署名は異なっていることで、ロバストな生化学的ヌクレオチド同定方法の開発がもたらされる。
実施例2−新規のQM−Seq署名としての生物物理学的パラメータ
配列決定アプリケーションに対して核酸塩基を容易に同定するための追加の生物物理学的性能指数またはパラメータを開発するため、トンネリング電流の詳細な分析を単一分子(ここでは、デオキシヌクレオチド)から解析した。ファウラー−ノルトハイム(F−N)プロットを用いてトンネリング電流を分析し、単一ヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定した。トンネリング電流(I)−電圧(V)データをln(I/V)対(1/V)としてプロットし、図4eのTのF−Nプロットに示すように、(三角形バリアの)トンネリングレジームの過渡電圧(Vtrans)を抽出した。過渡電圧Vtrans,e−は、トンネリングから電界放射レジームへの遷移を表し、トンネリングバリア(ここでは、電子)の尺度である。ヌクレオチド配列を介した電子(Vtrans,e−)及び正孔(Vtrans,h+)トンネリングのこれらのパラメータは、電子署名の構成要素を同定することを表し、HOMO−LUMO及びバンドギャップ値と同じように用いて、配列を特徴付けし、同定してもよい(以下に記載)。図4fに示すように個々のヌクレオチドに対するこれらのパラメータを抽出する際に、酸性条件下でVtrans,e−及びVtrans,h+値の明確な分離が観察される(表III、前述及び以下に記載)。図21及び表IIIに示すように異なるpH条件下でも電子及び正孔過渡電圧の同様のシフトが観察された。従って、HOMO−LUMOレベル、エネルギーバンドギャップ、Vtrans,h+、及びVtrans,e−を生物物理学的パラメータとして用いることで、荷電(電子及び正孔)トンネリングデータによってヌクレオチドを同定することができる。
リボヌクレオチド同定のためのQM−Seq署名:実験的な生物物理学的及び生化学的研究に沿ったDFT調査によって、酸性pHにより区別可能な署名(A、G、T、及びCのpKは、それぞれ、4.1、3.3、9.9、及び4.4である)が確実に形成されることを同定した。これを用いて、単一ヌクレオチド(エネルギーバンドギャップ、HOMO−LUMO、図4a、4b、4e、4fのVtrans,h+、及びVtrans,e−、表I及びIIIのDNAのQM−Seqデータ、表IIのRNAのQM−Seqデータ)再現性良く同定し、高速かつ正確な電子同定を行うことができる。さらに、DFT研究により、RNAピリミジン核酸塩基の量子署名または電子指紋が、DNAとは異なり得ることが示唆された。直接RNA配列決定におけるQM−Seqの可能性及び量子署名の一意性を評価するため、酸性条件下で(図7a、b、表II)RNAホモオリゴヌクレオチドのQM−Seq生物物理学的パラメータを測定した。QM−Seq署名を明確に分離することで、RNAプリン(A/G)及びピリミジン(C/U)を迅速に同定することができる。しかしながら、分子エントロピー及び2’ヒドロキシル化糖骨格にわたる電荷雲の非局在化による署名分散により、ヌクレオチド間のさらなる区別が防止される。RNA及びDNA間のプリン(図7c)及びピリミジン(図7d)QM−Seq署名を比較することで、DFTシミュレーションで示唆されるようにピリミジン核酸塩基の指紋間の明確な区別が示される。2’ヒドロキシル化糖骨格がRNA及びDNAヌクレオチドを区別するため、核酸塩基への電荷の強局在により、プリンヌクレオチドの署名の違いが防止される(図7c、表II)。これらの結果は、ヌクレオチド生化学的構造とこれらのQM−Seq署名の間の関係をまとめており、固有のQM−Seq電子指紋を用いて単一分子を高速で配列決定できる能力を実証している。
インビトロ転写に用いたRNA産生:MAXIscriptキット(Applied Biosystems)を用いて、抽出されたDNA遺伝子からのインビトロ転写によってRNA試料を調製した。500〜1000ngのDNAテンプレート、1μlのATP 10mM、1μlのCTP 10mM、1μlのGTP 10mM、1μlのUTP 10mM、1μlのヌクレアーゼフリー水をPCR管中で混合した。その後、2μlの10×転写緩衝液を添加し、完全に混合した。最後に、2μlのSP6ポリメラーゼ酵素を反応物に添加し、スピン渦を生成させた。ポリメラーゼ以外の全ての試薬は組み立てるために室温で保持した(反応物を氷中で組み立てることで、テンプレートDNAを沈殿させることができることに留意されたい)。その後、溶液を室温で1時間インキュベートした。インキュベーション後、1μlのTURBO DNaseを添加してテンプレートDNAを分解し、37℃で30分間インキュベートした。その後、溶液を1.5mL遠心分離管に移し、エタノール沈殿させた。25μlのヌクレアーゼフリー水、5μlの酢酸ナトリウム(pH=5.5で3M)、及び3容量の冷やした無水エタノールを添加した。溶液を−20℃で少なくとも30分間インキュベートした。その後、生成物を最高速度で15分間遠心分離し、エタノール(70%)で2回洗浄した。最後に、RNAペレットを15μlの0.5×TE緩衝液で再懸濁させた。
N−メチルイサト酸無水物によるRNA修飾:10μlの折り畳まれたRNAに、10μlのN−メチルイサト酸無水物(NMIA)溶液(DMSO中に130mMのNMIA)を添加する。37℃で2.5時間インキュベートする。さらに反応物を上述のようにエタノール沈殿させる。RNAペレットを10μlの0.5×TE緩衝液中で再懸濁させる。
硫酸ジメチルによるRNA修飾:10μlの折り畳まれたRNAに、10μlのDMS溶液(メタノール中の0.8mMのDMS(硫酸ジメチル、SPEX CertiPrep、USA))を添加する。両方の管を37℃で2時間インキュベートする。さらに反応物を上述のようにエタノール沈殿させる。RNAペレットを10μlの0.5×TE緩衝液中で再懸濁させる。
データ分析:各核酸塩基からの各トンネリング電流データからいくつかのパラメータを抽出した(HOMO、LUMO、バンドギャップ、過渡電圧(正及び負)、電子/正孔有効質量の比率、電子及び正孔のφ、及びΔφ)。配列決定及び構造の両方を同時に同定することができるソーティングアルゴリズムを開発している(図1)。
まず、未修飾ホモオリゴマーまたは修飾(NMIAまたはDMSのいずれかで修飾)ホモオリゴマーのいずれかにおいて、パラメータ、例えば、HOMO、LUMO、バンドギャップ、過渡電圧(正及び負)、電子/正孔有効質量の比率、電子及び正孔のφ、及びΔφを同定した。個々の修飾/未修飾オリゴから同定したパラメータ(修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列からのトレーニングセット上で決定された)を用いて、機械学習モデル(例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデル)を構築した。このモデルでは、パラメータは互いに独立し、参照と比較されるように(単純に)想定されている。その後、各グループに関連する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア/確率は、参照(呼び出しグループ)として定義する。その後、未知のスペクトルを処理して、パラメータを抽出し、これらのパラメータをトレーニングセットと比較して、トレーニングセットから各個々のグループの確率を同定した。最も高い確率のグループを元々のスペクトルに割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類(教師あり機械学習)の他の機械学習処理またはアルゴリズムには、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング(メタアルゴリズム)、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ(決定木、決定グラフなど)、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率近似(PAC)学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Proaftn、及び多基準分類アルゴリズムが含まれる。
他の実施形態では、トンネリング電流データから導出されたパラメータ値、例えば、HOMO、LUMO、バンドギャップ、過渡電圧(正及び負)、電子/正孔有効質量の比率、電子及び正孔のφ、及びΔφを同定した。種々の環境において、未修飾ホモオリゴマーまたは修飾(NMIAまたはDMSのいずれかで修飾)ホモオリゴマーの両方に対するこれらの値を同定した。「トレーニングセット」と呼ばれるこれらの同定されたパラメータは、修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得た。その後、トレーニングセットからのパラメータ値を用いて、参照として機械学習モデルを構築した。種々の機械学習モデル、例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデルを用いてもよい。このモデルでは、パラメータは互いに独立し、参照と比較されるように(単純に)想定されている。その後、新規のデータポイントが各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア/確率は、呼び出しグループとして定義する。
次に、未知の核酸塩基のトンネリング電流データを回収する。このトンネリング電流データを処理し、種々のパラメータ:HOMO、LUMO、エネルギーバンドギャップVtrans,e−、Vtrans,h+、φ0,e−、φ0,h+、Δφ、及びmeff e−/meff h+の値を決定した。その後、未知の核酸塩基がトレーニングセットからの個々のグループに属する確率を同定するために、これらの値をトレーニングセットから得た値と比較した。呼び出されたグループ(未知の核酸塩基のグループとマッチングする確率が最も高いグループ)をその核酸塩基に割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類(教師あり機械学習)の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング(メタアルゴリズム)、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ(決定木、決定グラフなど)、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率的近似(PAC)学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Proaftn、及び多基準分類アルゴリズムが含まれる。
実施例3−過渡電圧値
配列決定アプリケーションでの核酸塩基の同定にさらに役立たせるため、単一分子(ここでは、ヌクレオチド)からのトンネリング電流の詳細な分析も行った。これらの実験では、ファウラー−ノルトハイム(F−N)プロットを用いてトンネリング電流を分析した。この分析を行い、単一ヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定した。(三角形バリアの)トンネリングレジームの過渡電圧(Vtrans)及び勾配を抽出するために、トンネリング電流(I)−電圧(V)データをln(I/V)対(1/V)としてプロットした。この分析の一例を、図4eのTに対するF−Nプロットに示す。過渡電圧Vtrans,e−は、トンネリングから電界放射レジームへの遷移を表し、勾配Sは、トンネリングバリア(ここでは、電子)の尺度である。
トンネリングから電界放出への過渡電圧、及び荷電トンネリングのバリアを示す勾配などのトンネリングデータを入念に分析するため、3つの生物物理学的パラメータ/定数を抽出してもよい。これらのトンネリング定数(Vtrans,h+、Vtrans,e−、S=S+S)は、電荷がトンネリングする分子(ここでは、ヌクレオチド)の特徴であり、HOMO−LUMO及びバンドギャップのぞれぞれに対する追加の性能指数の開発に用いた。例えば、Vtrans,h+を用いた正孔トンネリング確率の変化を分析するため、異なるpH条件下でヌクレオチドHOMOレベルのように用いることができることが観察された(図21、表III)。同様に、Vtrans,e−は、LUMOレベルのように、電子トンネリングしやすさを表す(低い値は、電子トンネリングしやすさを表す)。勾配Sは、これらの生体分子で観察されたバンドギャップを模倣する。より入念な分析により、これらのファウラー−ノルトハイム(F−N)過渡電圧(Vtrans)には類似の挙動が観察された(図21、表III)。Vtransは、三角トンネリングから電子または正孔のいずれかの電界放出へのシフトを表す。Vtransは、HOMO(Vtrans,h+)及びLUMO(Vtrans,e−)レベルと同じ、pHによるパターンを示し、これにより、DNAのような生体分子に応用したF−Nトンネリングの背後には生物物理学的理論が確認される。従って、これらのトンネリングパラメータを、今回の研究で開発した追加の新規のQM−Seq署名/性能指数として用いることができる。
過渡電圧(Vtrans)を測定することで生体分子中の直接トンネリングからファウラー−ノルトハイムトンネリングへの遷移を用いて、トンネリングバリアハイト(金属チップフェルミレベル(E)及びフロンティア分子軌道、即ち、HOMOまたはLUMOのいずれかの間のエネルギーオフセット)を推定する。印加したバイアス電圧(バイアス)がバリアハイト未満である場合、直接トンネリングは主要な輸送機構に割り当てる。ゼロバイアス限界では、バリアは長方形と仮定され、有効電子質量がある場所がバリアハイトとして近似することができる。dはトンネリング距離であり、h(h=h/2π)はプランク定数である。高バイアス電圧では、伝導機構はファウラー−ノルトハイムトンネリングまたは電界放出により支配され、三角形バリアを近似することができる。従って、直接トンネリング(F−Nプロット上での対数)からファウラー−ノルトハイムトンネリング(F−Nプロット上での直線)への遷移は、F−Nプロット(ln(I/V)対1/V)上での変曲点(Vtrans)を示す。トンネリング曲線の形状が長方形(V=0V)から台形(V<Φ/e)へ、その後三角形(V>Φ/e)への遷移は、バイアスが増すにつれて見ることができる。従って、Vtransは、長方形から三角形バリアへの遷移を測定するため、生体分子中でのトンネリング輸送に関連付けられた元々の長方形バリアの高さを測定する実験的な方法を提供する。
これらの実験により、ヌクレオチド配列を介した電子(Vtrans,e−)及び正孔(Vtrans,h+)トンネリングのパラメータは、署名構成要素を表し、HOMO−LUMO及びバンドギャップ値と同じように用いて配列を特徴付けて、同定することが示唆される。図4fに示すように、個々のヌクレオチドのこれらのパラメータを抽出する際に、酸性条件下でのVtrans,e−及びVtrans,h+値の分離が観察される(表III、及び上述)。図21及び表IIIに示すように、異なるpH条件下での電子及び正孔過渡電圧の同様なシフトについても観察された。従って、署名(またはパラメータ)を同定する構成要素としてHOMO−LUMOレベル、Vtrans、及び勾配(S)を用いて、荷電(電子及び正孔)トンネリングデータによりヌクレオチドを分離することができる。
実施例4−AmpR配列決定
例えば、以下により詳細に説明するように、開示された技術を用いて、ベータ−ラクタム抗生物質への耐性をコードするampR遺伝子の85nt及び700nt領域と、HIV−1 RNase配列の350nt領域の配列の電子指紋(またはトンネリングデータ)を決定した。本開示の技術は、単一量子分子配列決定走査/読取において95%を上回る成功率で、これらの配列決定プロジェクトに対する成功を収めた。ここで、成功とは、未知のヌクレオチドの同一性と既知の配列の同一性とをマッチングさせることと定義する。多くの実施形態では、成功率は、約96%、97%、98%、または99%より高くてもよい。
上述の生物物理学的及び生化学的研究を用いて、酸性pHを用いて区別可能な異性体(A、G、T、及びCのpKaは、それぞれ、4.1、3.3、9.9、及び4.4である)の形成を促進することができ、これらの区別可能な異性体を用いて、単一ヌクレオチド(バンドギャップ、HOMO−LUMO、Vtrans、及びS、図4a、4b、4e、4fを用いて)を再現性良く配列決定することができることが確認された。
これらの実験では、酸性pH下での単一STM−STS測定を用いて、単一分子DNA(STMを用いて)及び単一ヌクレオチド(図5aにAを示し、図22にT、G、Cを示すSTSデータを用いて)を配列決定した。これは、分の時間尺度内で達成可能であった。
薬剤耐性及び変異性病原体を研究するためのこの方法の単純さ及び潜在用途を実証するために、細菌性抗生物質耐性遺伝子ampRの配列決定を行った。ampR遺伝子は、ペニシリン由来の抗生物質を阻害するβ−ラクタマーゼをコードするため、病原体治療に有用である。生理学的レベル(以下を参照、図24)を模倣するため、ssDNA溶液を低濃度(1〜5nM)で調製した。
アンピシリン耐性遺伝子(ampR)遺伝子の一本鎖DNAを2工程で得た。まず、Phusion High−Fidelity PCRキット(Thermo Scientific、USA)を用いたポリメラーゼ連鎖反応(PCR)によって、二本鎖ampR DNAをプラスミドpZ12LUCプラスミド(Expressys、Germany)から増幅させた。GeneJET Plasmid Miniprepキット(Thermo Scientific、USA)を用いて、プラスミドpZ12LUCを大腸菌株DH5α−Z1から抽出した。フォワード(CGAGCTCGTAAACTTGGTCTGA)及びリバースプライマー(GTGAAGACGAAAGGGCCTCG)(Invitrogen、USA)を用いて、ampR遺伝子の1091bpを増幅させた。テンプレートDNA及びフォワードまたはリバースプライマーのみとして二本鎖ampRを用いて2回のPCRによって一本鎖ampR DNAを得た。ZymoClean Gel DNA回収キット(Zymo Research、USA)によるゲル抽出を用いて各反応の生成物を精製し、0.1M NaSO中の5nM(1.7ng/μL)に希釈した(生理学的濃度を模倣するため、図25)。NanoDrop 2000分光光度計(Thermo Scientific、USA)を用いてDNA濃度を測定した。
上述の3工程の押出沈着技術を用いて、ssDNAの細長い線状鎖の単一分子を基板上に再現性良く沈着させた(図6b及び図23)。ampR DNAの単一鎖のSTMイメージング及びSTS分光法を同時に行った(図6b、6c、6dに示す)。STS走査測定セットアップは、1nmの方位分解能を有した(圧電スキャナー及びセットアップの分解能によって制限される、以下を参照)。STS走査を用いて、ヌクレオチドを各測定で正確に同定し、隣接の核酸塩基も95%を超える精度で二次同定技術(Methodsを参照)を用いて同定した(図6c)。全体として、全40個のヌクレオチドを、ampR遺伝子の85塩基領域内で無事に同定した(図6c、6d)。
図36は、本発明のいくつかの実施形態によるシーケンサ100(ポリヌクレオチド配列決定デバイス)の一例を示す。図36に示すように、読取ヘッド106は、試料108の上に配置されている。前述したように、試料108は、基板上に配置された1つまたは複数のヌクレオチドをもつ一本鎖のDNAまたはRNA試料である。基板は、平坦に配向(111)した金であってもよい。いくつかの実施形態では、試料108は横移動ステージ110上に配置され、読取ヘッド106は固定されている。いくつかの他の実施形態では、読取ヘッド106を横移動ステージに取り付けながら、試料108を固定してもよい。読取ヘッド106は、上述したように、かつ、図1a及び3bに示すように単一チップ読取ヘッドであってもよく、あるいは、図27(a)〜(c)に示すようにチップアレイであってもよい。試料108は、例えば、上記の実施例1〜3で述べたように、かつ、図3b及び27(c)に示すように調製してもよい。試料108の上の読取ヘッド106の配置は、例えば、図1a、3b、及び27a〜27cに示す。試料108の調製図は、図3aに示し、先に詳しく説明した。
図36にさらに示すように、バイアス電圧発生器104によって試料108と読取ヘッド106の間にバイアス電圧Vを生成し、電流センサ116によって電流Iを測定する。プロセッサ102によってバイアス電圧発生器104を制御し、バイアス電圧Vの範囲にわたって走査することができ、各バイアス電圧Vの電流Iは、電流センサ116によって読み取られ、プロセッサ102に提供される。従って、プロセッサ102は、試料108の上の読取ヘッド106の各x−y位置のI/V曲線(あるいは、スペクトル、トンネリングデータと呼ばれる)を回収することができる。図36にさらに示すように、プロセッサ102は、横移動ステージ110に連結するスキャナー112を制御するように連結される。横移動ステージ110は、例えば、スキャナー112によって指示された際に読取ヘッド106に対して試料108を移動させることが可能な圧電x−y−zステージであってもよい。しかしながら、試料108を正確にを移動させることが可能ないずれの横移動ステージを利用してもよい。
従って、プロセッサ102は、読取ヘッド106に対する試料108の位置を制御し、データ骨格104にさらに連結することができるため、データストレージ126、メモリー124、インタフェース122、及びユーザインタフェース120に連結することができる。データストレージ126は、メモリーハードドライブ、FLASHドライブ、磁気ドライブなどの固定ストレージであってもよい。メモリー124は、データ及びソフトウェア命令を保存することができる揮発性または不揮発性メモリーであってもよい。インタフェース122は、外部装置またはネットワークに接続する任意のインタフェースであってもよい。例えば、インタフェース122を用いて、シーケンサ100を、シーケンサ100によって取得された電子署名データの分析を行う外部コンピューティングシステムに連結してもよい。ユーザインタフェース120は、例えば、ビデオスクリーン、オーディオデバイス、キーボード、ポインターデバイス、タッチスクリーン、または、プロセッサ102がユーザと通信できる他のデバイスであってもよい。
図37は、図36に示すシーケンサ100などの配列決定デバイス上で実行され、DNAまたはRNAの1つまたは複数の鎖の配列決定をもたらすプロセス200を示す。図37に示すように、プロセス100は、工程202で読取ヘッド106を位置決めすることで開始される。図36に示すように、読取ヘッド106の位置決めは、読取ヘッド106に対して試料108を移動させることで達成してもよい。走査位置決めは、(x,y)=(0,0)として任意に指定された開始位置にチップを位置決めすることで行ってもよい。さらに、走査パターンに従ってx、y位置を介して反復してもよい。z位置(読取ヘッド106と試料108の間の距離)は、プロセス200の実行前に、金のトンネリング情報を用いた較正工程によって調整し、固定することができる。工程204では、現在の(x,y)位置での読取ヘッド106上の各読取チップのI/Vデータを取得する。工程206では、トンネリングデータまたはI/Vデータを後の分析用に保存してもよい。いくつかの実施形態では、トンネリングデータまたはI/Vデータの分析は、データ取得と同時に行ってもよい。
工程208では、プロセッサ102は、走査が終わったかどうか確認する。基板上の各x−y位置でトンネリングデータが回収されると、走査は終了する。いくつかの実施形態では、ユーザは、分析のためにx−y位置の一部を選択してもよい。走査が終了していない場合、プロセッサ102は、工程202に戻り、読取ヘッド106は、試料108の上の次のx−y位置に位置決めされる。走査が終了している場合、データ分析が次いで工程210で開始される。いくつかの実施形態では、シーケンサ100上のプロセッサ102によってデータ分析を行ってもよく、シーケンサ100は、取得したトンネリングデータをさらなる分析用に別個のコンピュータに送信してもよい。従って、いくつかの実施形態では、プロセッサ102は、データを分析用コンピュータ(不図示)に提供してもよく、ここで、このプロセスの残り部分が達成される。
工程210では、取得したトンネリングデータまたはI/Vデータに基づいて、個々のヌクレオチドのx−y位置が得られる。このプロセスは、例えば、図10a〜10bに対して示され、上述されている。特に、dI/dVデータを分析して、LUMO及びHOMOピークを同定することができ、これにより、読取ヘッド106が試料108におけるヌクレオチドの上に配置されていることが示唆される。低電圧ピークのみが得られた場合、読取ヘッド106は、金基板の上に配置されている。マルチチップアレイでは、各チップからのデータを別々に分析して、試料108における個々のヌクレオチドの位置を決定することができる。
工程212では、ヌクレオチドの上であると同定される各x−y位置で、個々のパラメータを、トンネリング電流データまたはI/Vデータを用いて算出する。明細書を通じて説明したパラメータには、dI/dV、I/V、HOMO、LUMO、エネルギーバンドギャップ、Vtrans,e−、Vtrans,h+、Φ,e−、Φ0,h−、Δφ、及びmeff e−/meff h−を含み得る(上述のように、かつ、図36及び37に示すように)。ヌクレオチドの3つまたはそれ以上のパラメータ値の回収には、未知のヌクレオチドの電子署名を含む。
工程214では、工程212で得られたヌクレオチドの署名と、同じ環境で回収された既知のヌクレオチドのパラメータ値のデータベースとの比較に基づいて、未知のヌクレオチドを同定する。比較のため、未知の核酸塩基(例えば、HOMO、LUMO、バンドギャップ、Vtrans,e−、Vtrans,h+)の署名を決定するために選択されたパラメータ値を、既知の核酸塩基(実施例2に上述のように)からの同じパラメータ(この場合、HOMO、LUMO、バンドギャップ、Vtrans,e−、Vtrans,h+)値と比較する。種々の実施形態では、既知の核酸塩基のパラメータ値を表VIII〜Xに提供する。いくつかの実施形態では、既知の核酸塩基(修飾及び未修飾)のこれらの値は、値の「参照ライブラリ」と呼ばれ、データベースに電子データとして保存してもよい。
(修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得たトレーニングセット上で決定された)個々の修飾または未修飾のオリゴから同定したパラメータを用いて、機械学習モデル(例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデル)を構築した。このモデルでは、パラメータは互いに独立し、参照と比較されるように(単純に)想定されている。その後、パラメータ指紋が各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。パラメータ指紋が特定のグループからである最も高いスコア/確率を定義する。その後、未知のパラメータ指紋をモデルと比較して、モデルにおいてトレーニングセットからの各個々のグループに属するパラメータ指紋の確率を同定した。最も高い確率をもつグループを元々のスペクトルに割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。いくつかの実施形態では、核酸塩基を同定する際に、パラメータ指紋をモデルに加えてもよい。
使用可能なデータ分類(教師あり機械学習)の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング(メタアルゴリズム)、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ(決定木、決定グラフなど)、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率近似(PAC)学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Proaftn、及び多基準分類アルゴリズムが含まれる。
上述のように、トンネリング電流データから導出されたパラメータ値、例えば、HOMO、LUMO、バンドギャップ、過渡電圧(正及び負)、電子/正孔有効質量の比率、電子及び正孔のψ、及びΔψを同定した。種々の環境において、未修飾ホモオリゴマーまたは修飾(NMIAまたはDMSのいずれかで修飾)ホモオリゴマーの両方に対するこれらの値を同定した。「トレーニングセット」と呼ばれるこれらの同定されたパラメータは、修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得た。その後、トレーニングセットからのパラメータ値を用いて、参照として機械学習モデルを構築した。種々の機械学習モデル、例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデルを用いてもよい。このモデルでは、パラメータは互いに独立し、参照と比較されるように(単純に)想定されている。その後、新規のデータポイントが各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア/確率は、呼び出しグループとして定義する。
次に、未知の核酸塩基のトンネリング電流データを回収する。このトンネリング電流データを処理し、種々のパラメータ:HOMO、LUMO、エネルギーバンドギャップVtrans,e−、Vtrans,h+、φ0,e−、φ0,h+、Δφ、及びmeff e−/meff h+の値を決定した。その後、未知の核酸塩基がトレーニングセットからの個々のグループに属する確率を同定するために、これらの値をトレーニングセットから得た値と比較した。呼び出されたグループ(未知の核酸塩基のグループとマッチングする確率が最も高いグループ)をその核酸塩基に割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類(教師あり機械学習)の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング(メタアルゴリズム)、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ(決定木、決定グラフなど)、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率的近似(PAC)学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Proaftn、及び多基準分類アルゴリズムが含まれる。
工程216では、データ分析が完了していない場合(例えば、各同定した核酸塩基部位の全てのデータが分析されていない場合)、プロセスは、工程212に戻る。しかしながら、全てのデータが分析されている場合、プロセスは、工程218で決定された配列を表示する。
実施例5−修飾核酸塩基の検出
これらの実験では、硫酸ジメチル(DMS)を用いてDNAオリゴマーをメチル化した(図8a)。メチル化は、エピジェネティック遺伝子サイレンシングの修飾に特に重要であり、ガンなどの疾患の早期発症の検出に使用できる可能性がある。DNAメチル化は、非メチル化ヌクレオチド(図8b、8c、24a)と比べてメチル化ヌクレオチドの生化学的構造の変化をもたらす。硫酸ジメチルは、DNAと反応して、一本鎖領域上のグアニン及びアデニンをメチル化することが知られているが、シトシンは、限られた程度しか反応しないことが知られている。インビボで、DNAは、メチル化シトシン塩基、特に、5−メチルシトシンを含み得る。他の潜在的なメチル化塩基には、5−ヒドロキシメチルシトシン、7−メチルグアノシン、N6−メチルアデノシンが含まれる。
メチル化は、荷電トンネリング確率を変化させ得るため、スペクトル中で得られた結果を調べるためにSTS測定を行った。観察されたように(図8、24、表VI)、プリンまたはピリミジン環の化学修飾は共役に影響を及ぼし、電子及び正孔の両方のトンネリング確率を低下させる。
DNAのメチル化
メタノール中で800μΜに希釈した後の硫酸ジメチル(DMS)(SPEX CertiPrep、USA)を用いて、DNAメチル化を行った。10μlのDNAオリゴマー(20μΜ)を10μlの800μΜ DMS(DNAオリゴマーに対して2.6過剰に等しい)と混合し、室温で24時間インキュベートした。標準エタノール沈殿を用いてメチル化DNAを沈殿させた。溶液を無菌再蒸留水で90μlに希釈した後、10μlの酢酸ナトリウム(3M、pH5.5)と200μlの冷やした無水エタノールを加えた。溶液を混合し、−20℃で少なくとも20分間インキュベートした。その後、13、000rpmで15分間遠心分離し、上清を除去した。得られたDNAペレットを500μL及び1000μlの70%エタノールで2回洗浄した後、遠心分離を行った。その後、洗浄したDNAを無菌水中に再懸濁させ、Nanodropを用いて濃度を決定した。得られたメチル化DNAを0.1M NaSOを用いて半分に希釈し、STMで測定した。
グアニン及びアデニンヌクレオチドのメチル化(図8b、8c)により、LUMO及びHOMO両方のエネルギーレベルの増加をもたらし、各HOMO/LUMOエネルギーギャップ(図8d、8e)の増加ももたらした。観察された電子エネルギーレベルの変化は、プリンのメチル化により、図8b、8cの異性体に示すように共役が失われたことによるものであろう。共役が失われることで、電子及び正孔の両方のトンネリングバリアがより大きくなることがある(図8d、8e、表VI)。メチル化は、ピリミジン(図9a、9b、表VI)でも調べ、対応する電子シフトが観察された。これらの調査後、DNA単一鎖をメチル化した。これらの研究結果から、メチル化及び非メチル化ヌクレオチドが単一核酸塩基分解能で区別され得ることが実証された(図8a)。単一DNA分子のみならずそれら分子内の単一ヌクレオチド修飾を検出するこの技術の応用性について、これらの結果は指し示している。
実施例6−大規模並列配列決定
開示された方法を用いた大規模並列配列決定を種々の方法で達成してもよい。1つの実施形態では、CCDまたはカメラチップと同様の1メガピクセル(または1メガチップ)2cm×2cmチップをプロセスで用いる。例えば、電圧を複数のチップに同時に印加し、電流を回収、保存し、複数のチップから全ての電流値を同時に読み取ってもよい(CCDと同様)。電流の読取後、別のバイアス電圧を印加などし、塊状の2cm×2cm基板にわたって全電流−電圧曲線を再作成してもよい。従って、数千のゲノムを載置し、同時に読み取ってもよい。圧電を用いて、試料を数オングストローム移動させることで、次の核酸塩基の配列決定を行うことができ−このプロセスを繰り返して、追加の核酸塩基を分析する。従って、単一2マイクロメートル走査動作(または圧電走査)において、大規模並列シーケンサとしてセットアップされた開示の方法は、単純マイクロ流体デバイスを用いてパターン化された比較的大きな試料バイオチップ上の可能な全ての核酸塩基の配列決定をすることができる。種々の実施形態では、ポリヌクレオチドを、種々のサイズを有する、例えば、約1.0cm未満の基板上に押し出してもよい。
図27aは、単式光学リソグラフィ後に異方性KOHエッチングを用いて光学的に作成したチップパターンのセンチメートル縮尺の写真である。マルチチップシーケンサは、修飾テンプレート剥離処理(Nagpalら、Science、325、594、2009)を用いて製造されたメガピクセルチップアレイを用いて作製されるであろう。あるいは保護されたシリコン(100)表面の円穴または角穴の光リソグラフィを用いることで、自己限定性の異方性水酸化カリウムエッチング(KOHエッチング)処理を利用して、滑らかなシリコンウェハ上にパターン化された逆ピラミッド型のディベット(divets)を作製した。逆ピラミッドチップは周期的であり、周期性、包装、及びパターニングは、暴露されたシリコンウェハの光リソグラフィを用いて簡単に変更される。その後、これらの逆ピラミッドを金、銀、または銅金属で被覆後、エポキシによる裏込めかまたは厚電子沈着金属層バッキングにより機械的に安定なフィルムが可能になる。これらの新規金属はシリコンテンプレートに接着しないため、これらのパターン化されたメガピクセルチップアレイを剥離し、このメガピクセルチップアレイを用いて、リーダーアレイ及びCCD型メガピクセルリーダーによるパターン化された量子配列決定リーダーが作製されるであろう。マイクロ流体デバイスの寸法は、メガピクセルチップリーダーの周期性とマッチングしているため、ヌクレオチド配列、修飾及び構造の大規模並列データの取得及び検出が可能である。図27bは、金から作られた高忠実度かつ周期的にパターン化されたSTMチップを示すSEM画像である。超平坦基板上の大面積(cm×cm)縮尺STMチップを用いて、2μm×2μm表面を走査し、図に示すものと同様のチップからの大規模並列走査及び単純読み出しによって、cm縮尺にわたる全配列を作製してもよい。
本明細書で開示された全ての参照は、特許または非特許に関わらず、各々が引用例として含まれるかのように、それら全体が参照により組み込まれる。
本開示をある程度細かく記載したが、本開示は一例としてなされ、本明細書の特許請求の範囲に記載される本開示の精神から逸脱することなく詳細または構造の変化を施せると理解されたい。
アンピシリン耐性遺伝子(ampR)遺伝子の一本鎖DNAを2工程で得た。まず、Phusion High−Fidelity PCRキット(Thermo Scientific、USA)を用いたポリメラーゼ連鎖反応(PCR)によって、二本鎖ampR DNAをプラスミドpZ12LUCプラスミド(Expressys、Germany)から増幅させた。GeneJET Plasmid Miniprepキット(Thermo Scientific、USA)を用いて、プラスミドpZ12LUCを大腸菌株DH5瘁|Z1から抽出した。フォワード(配列番号1:CGAGCTCGTAAACTTGGTCTGA)及びリバースプライマー(配列番号2:GTGAAGACGAAAGGGCCTCG)(Invitrogen、USA)を用いて、ampR遺伝子の1091bpを増幅させた。テンプレートDNA及びフォワードまたはリバースプライマーのみとして二本鎖ampRを用いて2回のPCRによって一本鎖ampR DNAを得た。ZymoClean Gel DNA回収キット(Zymo Research、USA)によるゲル抽出を用いて各反応の生成物を精製し、0.1M NaSO中の5nM(1.7ng/・k)に希釈した(生理学的濃度を模倣するため、図25)。NanoDrop 2000分光光度計(Thermo Scientific、USA)を用いてDNA濃度を測定した。

Claims (63)

  1. 第1の未知の核酸塩基の同定方法であって、
    走査型トンネリング顕微鏡を用いてトンネリング電流データを回収して前記第1の未知の核酸塩基の電子署名を決定することと;
    前記第1の未知の核酸塩基の電子署名と、1つまたは複数の既知の核酸塩基の電子指紋を比較することとと;
    前記第1の未知の核酸塩基の電子署名を、既知の核酸塩基の電子指紋にマッチングさせることと、それによって;
    前記第1の未知の核酸塩基を同定すること
    とを含む前記方法。
  2. 前記第1の未知の核酸塩基の電子署名と前記既知の核酸塩基の電子指紋とが、LUMO、HOMO、Bandgap、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの値を含む、請求項1に記載の方法。
  3. 前記第1の未知の核酸塩基が、1つまたは複数のリン酸塩分子を介して第2の未知の核酸塩基に共有結合している、請求項1〜2のいずれか1項に記載の方法。
  4. 第2の未知の核酸塩基が、請求項1に記載の方法によって同定される、請求項3に記載の方法。
  5. 前記第1の未知の核酸塩基が、修飾及び未修飾のアデニン、グアニン、シトシン、チミン、及びウラシルからなる群から選択される、請求項1〜4のいずれか1項に記載の方法。
  6. 前記第1の未知の核酸塩基の電子署名を、酸性、中性、及び塩基性から選択される1つまたは複数のpH環境で決定し、同じpH環境で回収された前記1つまたは複数の既知の塩基の電子指紋と比較する、請求項1〜5のいずれか1項に記載の方法。
  7. 前記pH環境が塩基性である、請求項6に記載の方法。
  8. 前記pHが9よりも大きい、請求項7に記載の方法。
  9. 前記pH環境が酸性である、請求項6に記載の方法。
  10. 前記pHが3未満である、請求項9に記載の方法。
  11. 第2のpH環境が塩基性である、請求項9または10のいずれか1項に記載の方法。
  12. 前記pHが9よりも大きい、請求項11に記載の方法。
  13. 前記第1の未知の核酸塩基が、リボースまたはデオキシリボース分子に共有結合している、請求項1〜12のいずれか1項に記載の方法。
  14. 前記第1の未知の核酸塩基がメチル化核酸塩基である、請求項1〜13のいずれか1項に記載の方法。
  15. 前記第1の未知の核酸塩基の電子署名が、滑らかに規則的な金基板上で決定される、請求項1〜14のいずれか1項に記載の方法。
  16. 前記滑らかに規則的な金基板がAu(111)である、請求項15に記載の方法。
  17. 前記滑らかに規則的な金基板にプラズマ洗浄を施す、請求項16に記載の方法。
  18. 前記滑らかに規則的な金基板が被覆されている、請求項15〜17のいずれか1項に記載の方法。
  19. 前記基板を1つまたは複数のイオン性分子を含む溶液で処理することで前記被覆を形成する、請求項18に記載の方法。
  20. 前記溶液がポリ−L−リシンを含み、前記基板が荷電している、請求項19に記載の方法。
  21. 前記核酸塩基がポリヌクレオチド中のヌクレオチドである、請求項15〜20のいずれか1項に記載の方法。
  22. 前記ポリヌクレオチドを押出及び沈着処理によって前記基板上に沈着させ、前記ポリヌクレオチドを並進運動によって前記基板の上に押し出す、請求項21に記載の組成物。
  23. 前記基板がチャネルまたはウェルを含む、請求項11〜20のいずれか1項に記載の組成物。
  24. 前記チャネルまたはウェルが、マイクロ流体チャネルまたはウェルである、請求項23に記載の組成物。
  25. 基板は滑らかに規則的な金基板である、前記基板と、
    前記基板上の被覆と;
    前記基板に接触する1つまたは複数の核酸塩基と
    を含む組成物。
  26. 基板がAu(111)である、請求項25に記載の組成物。
  27. 前記基板が荷電している、請求項25〜26のいずれか1項に記載の組成物。
  28. 前記基板にプラズマ洗浄を施す、請求項25〜27のいずれか1項に記載の組成物。
  29. 前記基板を1つまたは複数のイオン性分子を含む溶液で処理することで前記被覆を形成する、請求項25〜28のいずれか1項に記載の組成物。
  30. 前記溶液がポリ−L−リシンを含み、前記基板が荷電している、請求項29に記載の組成物。
  31. 前記1つまたは複数の核酸塩基が、ポリヌクレオチドに共有結合している、請求項25〜30のいずれか1項に記載の組成物。
  32. 前記ポリヌクレオチドを押出及び沈着処理によって前記基板上に沈着させ、前記ポリヌクレオチドを並進運動によって前記基板の上に押し出す、請求項31に記載の組成物。
  33. 前記基板がチャネルまたはウェルを含む、請求項25〜32のいずれか1項に記載の組成物。
  34. 前記チャネルまたはウェルが、マイクロ流体チャネルまたはウェルである、請求項33に記載の組成物。
  35. 未知の核酸塩基の電子署名を決定するための、請求項25〜34のいずれか1項に記載の組成物の使用。
  36. 前記電子署名が、LUMO、HOMO、Bandgap、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの値を含む、請求項35に記載の使用。
  37. 前記1つまたは複数の核酸塩基が、1つまたは複数のリン酸塩分子を介して第2の未知の核酸塩基に共有結合している、請求項35〜26のいずれか1項に記載の使用。
  38. 前記第2の未知の核酸塩基が、LUMO、HOMO、Bandgap、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つの値を含む前記第2の未知の核酸塩基の電子署名を決定することによって同定される、請求項37に記載の使用。
  39. 前記1つまたは複数の核酸塩基が、修飾または未修飾のアデニン、グアニン、シトシン、チミン、及びウラシルからなる群から選択される、請求項35〜38のいずれか1項に記載の使用。
  40. 前記1つまたは複数の核酸塩基の電子署名を、酸性、中性、及び塩基性から選択される1つまたは複数のpH環境で決定し、同じpH環境で回収された前記1つまたは複数の既知の塩基の電子指紋と比較する、請求項35〜39のいずれか1項に記載の使用。
  41. 前記pH環境が塩基性である、請求項40に記載の使用。
  42. 前記pHが9よりも大きい、請求項41に記載の使用。
  43. 前記pH環境が酸性である、請求項40に記載の使用。
  44. 前記pHが3未満である、請求項43に記載の使用。
  45. 第2のpH環境が塩基性である、請求項41〜44のいずれか1項に記載の使用。
  46. 前記pHが9よりも大きい、請求項45に記載の使用。
  47. 第1の未知のヌクレオチドの同定方法であって、
    ポリ−リシン被覆超平滑配向金(111)表面上に配置されている未知のヌクレオチドに走査トンネリング分光法を行うことと;
    酸性pHで前記未知のヌクレオチドに対する走査トンネリングデータを回収することと;
    前記走査トンネリングデータを処理して、LUMO、HOMO、Bandgap、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の値から選択される3つまたはそれ以上のパラメータの値を生成することと;
    前記HOMO値が−1.09〜−1.69であり;
    前記LUMO値が約1.66〜1.18であり;
    前記Bandgap値が約3.22〜2.40であり;
    前記Vtrans+値が約1.34〜0.96であり;
    前記Vtrans−値が約−0.19〜−0.83であり;
    前記Φe−値が約2.02〜0.88であり;
    前記Φh+値が約1.64〜0.42であり;
    前記me−/mh+値が約0.52〜0.06;及び/または
    前記ΔΦ値が約3.46〜1.5である場合、
    前記ヌクレオチドをアデニンとして同定することと;または
    前記HOMO値が−1.17〜−1.55であり;
    前記LUMO値が1.72〜1.24であり;
    前記Bandgap値が3.11〜2.57であり;
    前記Vtrans+値が1.26〜1であり;
    前記Vtrans−値が−0.19〜−0.77であり;
    前記Φe−値が1.63〜1.03であり;
    前記Φh+値が1.29〜0.29であり;
    前記me−/mh+値が0.57〜0.07であり;
    前記ΔΦ値が2.77〜1.47である場合、
    前記ヌクレオチドをグアニンとして同定することと;または
    前記HOMO値が−1.47〜−2.15であり;
    前記LUMO値が2.79〜1.99であり;
    前記Bandgap値が4.69〜3.71であり;
    前記Vtrans+値が1.65〜1.03であり;
    前記Vtrans−値が−0.54〜−1.06であり;
    前記Φe−値が3.51〜1.73であり;
    前記Φh+値が2.2〜0.94であり;
    e−/mh+値が0.95〜0.33であり;
    前記ΔΦ値が5.36〜3.02である場合、
    前記ヌクレオチドをシトシンとして同定することと;または
    前記HOMO値が−1.19〜−1.57であり;
    前記LUMO値が2.98〜2.38であり;
    前記Bandgap値が4.38〜3.74であり;
    前記Vtrans+値が1.8〜1.06であり;
    前記Vtrans−値が−0.25〜−0.63であり;
    前記Φe−値が3.44〜2.06であり;
    前記Φh+値が1.25〜0.45であり;
    e−/mh+値が0.5〜0.16であり;
    前記ΔΦ値が4.34〜2.88である場合、
    前記ヌクレオチドをチミンとして同定することと
    を含む前記方法。
  48. プロセッサと;
    少なくとも1つの量子トンネリングチップを有する読取ヘッドと;
    ポリヌクレオチドに結合している核酸塩基の1つまたは複数の群を含む試料を支持するステージと;
    前記プロセッサに連結し、前記読取ヘッドと前記ステージの間に電圧を提供するバイアス電圧と;
    前記バイアス電圧と前記読取ヘッドの間に連結され、前記プロセッサに電流を提供する電流センサと
    を含むシーケンサであって、
    前記プロセッサは、指示を実行して、前記試料にわたる一連の位置で電子署名データを取得し、位置に従って前記電子署名データを保存し、
    個々の核酸塩基は、前記電子署名データに基づいて同定することができる
    前記シーケンサ。
  49. 前記読取ヘッドが単一チップ読取ヘッドである、請求項48に記載のシーケンサ。
  50. 前記読取ヘッドが、マルチチップアレイであり、前記マルチチップアレイが、前記マルチチップアレイの個々のチップからの電流を独立して読み取ることができるように配置されている、請求項48に記載のシーケンサ。
  51. 前記マルチチップアレイの個々のチップからの電流を同時に読み取る、請求項50に記載のシーケンサ。
  52. 前記ポリヌクレオチドを、導電性基板の上に押し出す、請求項48に記載のシーケンサ。
  53. 前記導電性基板が、ポリヌクレオチドが押し出されるチャネルを含む、請求項52に記載のシーケンサ。
  54. 前記導電性基板が平坦な(111)金基板である、請求項52または53に記載のシーケンサ。
  55. 前記プロセッサが、命令を実行して、
    (a)開始位置で前記試料に対して前記読取ヘッドを位置決めし;
    (b)前記電圧を走査し、前記電流を測定し、電子署名データを取得し;
    (c)前記読取ヘッドと前記試料の間の位置に対する前記電子署名データを保存し;
    (d)走査パターンに従って前記試料に対する前記読取ヘッドを再位置決めし;
    (e)前記走査パターンが完了するまで、工程(b)〜(e)を繰り返す、請求項48に記載のシーケンサ。
  56. 前記プロセッサがさらに、命令を実行して、
    前記電子署名データに基づいて前記核酸塩基の位置を同定し;
    前記電子署名データから前記同定位置でのパラメータ指紋を算出し;
    前記パラメータ指紋に基づいて前記核酸塩基を同定する、請求項48に記載のシーケンサ。
  57. 前記電子署名データを別個のコンピューティングシステムに提供し、前記別個のコンピューティングシステムが、命令を実行して、
    前記電子署名データに基づいて前記核酸塩基の位置を同定し;
    前記電子署名データから前記同定位置でのパラメータ指紋を算出し;
    前記パラメータ指紋に基づいて前記核酸塩基を同定する、請求項48に記載のシーケンサ。
  58. 前記電子署名データからdI/dV、HOMO、及びLUMOパラメータを算出することと;
    前記パラメータを前記導電性基板のものと比較することと;
    前記導電性基板のみの上のどこに前記チップが配置されており、かつ、前記比較に基づいて核酸塩基の上のどこに前記チップが配置されているかを同定すること
    によって前記核酸塩基の位置を同定する、請求項56または58に記載のシーケンサ。
  59. パラメータ指紋を算出することが、LUMO、HOMO、Bandgap、Vtrans+(V)、Vtrans−(V)、Φe−(eV)、Φh+(eV)、me−/mh+、及びΔΦ(eV)の群から選択される前記パラメータの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、または少なくとも9つを含む前記電子署名データから算出することを含む、請求項56または57に記載のシーケンサ。
  60. 前記パラメータ指紋に基づいて前記核酸塩基を同定することが、前記パラメータ指紋を指紋データベースに保存されている既知の指紋と比較することを含む、請求項59に記載のシーケンサ。
  61. 前記パラメータ指紋を比較することが、前記パラメータ指紋が、前記指紋データベースに保存されている既知の指紋のグループ内である確率を決定することを含む、請求項60に記載のシーケンサ。
  62. 1つまたは複数の核酸塩基を含む組成物を同定するデバイスであって、
    金基板はプラズマ洗浄を施されている滑らかに規則的なAu(111)である、前記金基板と、;
    イオン性ポリマーを含むイオン性被覆と
    を含む、前記デバイス。
  63. 前記ポリマーがポリ−リシンである、請求項62に記載のデバイス。
JP2016542834A 2013-09-13 2014-09-12 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定 Pending JP2016534742A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361877634P 2013-09-13 2013-09-13
US61/877,634 2013-09-13
PCT/US2014/055512 WO2015038972A1 (en) 2013-09-13 2014-09-12 Quantum molecular sequencing (qm-seq): identification of unique nanoelectronic tunneling spectroscopy fingerprints for dna, rna, and single nucleotide modifications

Publications (1)

Publication Number Publication Date
JP2016534742A true JP2016534742A (ja) 2016-11-10

Family

ID=51662307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016542834A Pending JP2016534742A (ja) 2013-09-13 2014-09-12 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定

Country Status (7)

Country Link
US (1) US20160222445A1 (ja)
EP (1) EP3044330A1 (ja)
JP (1) JP2016534742A (ja)
KR (1) KR20160052557A (ja)
CN (1) CN105531379A (ja)
CA (1) CA2924021A1 (ja)
WO (1) WO2015038972A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10364461B2 (en) 2014-12-08 2019-07-30 The Regents Of The University Of Colorado Quantum molecular sequencing (QM-SEQ): identification of unique nanoelectronic tunneling spectroscopy fingerprints for DNA, RNA, and single nucleotide modifications
CN108491641A (zh) * 2018-03-27 2018-09-04 安徽理工大学 一种基于量子退火法的概率积分法参数反演方法
CN112345799B (zh) * 2020-11-04 2023-11-14 浙江师范大学 一种基于单分子电学检测的pH测量方法
WO2022246473A1 (en) * 2021-05-20 2022-11-24 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods to determine rna structure and uses thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003083437A2 (en) * 2002-03-22 2003-10-09 Quantum Logic Devices, Inc. Method and apparatus for identifying molecular species on a conductive surface
US7468271B2 (en) * 2005-04-06 2008-12-23 President And Fellows Of Harvard College Molecular characterization with carbon nanotube control
US20090121133A1 (en) * 2007-11-14 2009-05-14 University Of Washington Identification of nucleic acids using inelastic/elastic electron tunneling spectroscopy

Also Published As

Publication number Publication date
KR20160052557A (ko) 2016-05-12
WO2015038972A1 (en) 2015-03-19
CA2924021A1 (en) 2015-03-19
US20160222445A1 (en) 2016-08-04
EP3044330A1 (en) 2016-07-20
CN105531379A (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
Wang et al. Nanopore sequencing technology, bioinformatics and applications
JP6946292B2 (ja) ゲノム分析のためのシステムおよび方法
CN104703700B (zh) 用于核酸测序的方法和试剂盒
KR102447079B1 (ko) 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
US7604941B2 (en) Nucleotide sequencing via repetitive single molecule hybridization
JP6226888B2 (ja) ポリマーの測定の解析
US11789906B2 (en) Systems and methods for genomic manipulations and analysis
Ding et al. Single-molecule mechanical identification and sequencing
US11034998B2 (en) Method for label-free single-molecule DNA sequencing and device for implementing same
Perkel Making contact with sequencing's fourth generation
US20150284783A1 (en) Methods and compositions for analyzing nucleic acid
Graveley Power sequencing
JP2016534742A (ja) 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定
MacKenzie et al. An introduction to nanopore sequencing: past, present, and future considerations
JPWO2007013370A1 (ja) 核酸の塩基配列を決定する方法及び装置
CN103975329B (zh) 一种基因分析方法及装置
Kim et al. Reading single DNA with DNA polymerase followed by atomic force microscopy
US10364461B2 (en) Quantum molecular sequencing (QM-SEQ): identification of unique nanoelectronic tunneling spectroscopy fingerprints for DNA, RNA, and single nucleotide modifications
Rand et al. Electronic mapping of a bacterial genome with dual solid-state nanopores and active single-molecule control
US20160273033A1 (en) Quantum molecular sequencing (qm-seq): identification of unique nanoelectronic tunnneling spectroscopy fingerprints for dna, rna, and single nucleotide modifications
Lizardi Next-generation sequencing-by-hybridization
Curras-Alonso et al. Spatial transcriptomics for respiratory research and medicine
US20210301336A1 (en) Method for label-free single-molecule dna sequencing and device for implementing same
Korshoj Quantum Techniques for Single-Molecule Nucleic Acid Sequencing
US20220081714A1 (en) Storing temporal data into dna