JP2016534742A

JP2016534742A - 量子分子配列決定（ｑｍ−ｓｅｑ）：ナノエレクトロニクストンネリング分光法を用いたｄｎａ、ｒｎａ、及び単一ヌクレオチド修飾に対する固有指紋の同定

Info

Publication number: JP2016534742A
Application number: JP2016542834A
Authority: JP
Inventors: パラシャントナグパル; アンシュリチャテジー; ジョセフカサマダリボー
Original assignee: ザリージェンツオブザユニヴァーシティオブコロラド，アボディコーポレイト
Priority date: 2013-09-13
Filing date: 2014-09-12
Publication date: 2016-11-10
Also published as: KR20160052557A; WO2015038972A1; CA2924021A1; US20160222445A1; EP3044330A1; CN105531379A

Abstract

天然及び合成かつ修飾及び未修飾のＤＮＡ、ＲＮＡ、ＰＮＡ、ＤＮＡ／ＲＮＡヌクレオチドを同定し配列決定するのに有用な技術、方法、デバイス、及び組成物を開示する。開示された技術、方法、デバイス、及び組成物は、ＱＭ−Ｓｅｑと呼ばれるナノエレクトロニクス量子トンネリング分光法を用いて種々の修飾、ＤＮＡ／ＲＮＡ損傷、及びヌクレオチド構造を同定するのに有用である。本方法及び組成物は、一本鎖ヌクレオチド及びポリヌクレオチド高分子を沈着させるための荷電平滑基板の使用、修飾または未修飾のＤＮＡ／ＲＮＡ／ＰＮＡを走査すること、未知の核酸塩基の電子署名を、同一または類似の条件下（例えば、前記核酸塩基は酸性環境である）で得られた天然及び合成、修飾及び未修飾の核酸塩基、及び二次／三次構造を含む既知の核酸塩基の電子指紋のデータベースに対して比較することを含み得る。【選択図】図１Ａ

Description

[関連出願の相互参照]
本願は、２０１３年９月１３日に出願された米国仮出願第６１／８７７，６３４号に基づき、米国特許法第１１９条（３５Ｕ．Ｓ．Ｃ．§１１９）に従って優先権の利益を主張するものであり、これらの全ては、参照により本明細書に組み込まれる。

開示された方法、デバイス、組成物、及びシステムは、核酸の同定及び配列決定に関する。

個別化医療及び急速に進化する遺伝学分野用の新規の診断ツールには、安価で、高速で、信頼性のある、無酵素で、かつ高スループットな配列決定技術を要する。近年開発されたいくつかのＤＮＡ配列決定技術は、配列決定コスト及び時間の削減を試みているが、報告された核酸配列は、統計的に有意なアンサンブル平均である。これらのアンサンブル平均を用いて、ヌクレオチド配列と生理的挙動の間のいくつかの相関を導出することができるが、微量レベルの遺伝的変異または突然変異は、生物学的機能を支配し得る。これは、多剤耐性菌、すなわち、超強力な細菌や、薬物療法前に名目上微量に存在している高速変異病原菌の急速な発生により例示される。ペニシリンベースの抗生物質に対する耐性を引き起こすβ−ラクタマーゼなどのＤＮＡ配列をコードする薬剤耐性の高速同定に伴う近年の研究では、これらの技術が適時に標的を定めた医療介入の提供に不可欠であるため、迅速かつ高スループットな配列決定をするための信頼性のある単一分子配列決定ツールの必要性を浮き彫りにしていることが示されている。現在の第２世代配列決定技術は、ディープ及びウルトラディープ（ポリヌクレオチド当たり約１００個の読み取り）配列決定法及び単一コピーＰＣＲ（ポリメラーゼ連鎖反応）増幅を用いて、単一ヌクレオチド多型（ＳＮＰ）を検出することが可能である。しかしながら、これらの方法は、高価で技術的に複雑であり、臨床設定での適用を困難にしている。近年の研究では、医療用及び非侵襲的な臨床応用に単細胞ゲノムが使用できる可能性について概説しているが、これらの研究には、単一分子からのＤＮＡの酵素増幅、及び従来の配列決定ツール（光学マーカー）を用いたＤＮＡ配列決定が伴う。従って、ＤＮＡを同定するための本技術は、配列バイアスをもたらし、かつ、微量試料または単細胞試料のＤＮＡ配列の検出に誤差をもたらす可能性がある酵素ベースのＤＮＡ増幅に依存している。他の新規技術では、デノボ配列決定での配列決定誤差を改善するため、ＤＮＡ分子のみの配列決定が可能な核酸マーカー及び特異的酵素の使用が試されている。

ＤＮＡ配列の電子同定は、ＤＮＡ増幅を行わない無酵素技術を提供するため、次世代の配列決定技術の候補である。この方法は、他の技術と関連付けられた処理時間及び誤差を低減させる可能性を提供する。いくつかのグループは、ポアに沿ったイオン電流変化もしくは塩基がポアを横切る際のトンネリング電流減衰のいずれかに基づく、ＤＮＡヌクレオチドのナノポアコンダクタンスを用いて検証している。これらの実験では、非常に小さな正孔を通るようにＤＮＡを作製し、そこでその構造がプローブされる。しかしながら、この方法では、単一分子分解能が欠如しており、かつ、ヌクレオチド修飾によるコンダクタンスの変化が不十分であるため、診断及びエピゲノム同定に使用できる可能性が制限されてしまう。他の研究は、単一分子の検出及び同定用の走査型トンネリング顕微鏡について行われている。走査型トンネリング顕微鏡を用いた単一ＤＮＡ分子のイメージングは達成されているが、個々のヌクレオチド、ヌクレオシド、及び核酸塩基を正確に、再現性をもって、かつ効率的に同定及び識別する信頼性のある方法またはデバイス、あるいは、複数のヌクレオチド、ヌクレオシド、核酸塩基、及びその組み合わせを持つ分子中のヌクレオチド、ヌクレオシド、及び核酸塩基の配列を決定する能力については何も提供されていない。

ＲＮＡ配列決定には、固有の課題がある。近年、大規模並列ＲＮＡ配列決定により、低分子ＲＮＡ特性化、とりわけ転写開始部位同定を含む、希少な転写産物の遺伝子発現及び同定の高スループットな定量化が可能になっている。しかしながら、ほとんどのＲＮＡ配列決定法は、ｃＤＮＡ合成のみならず、ランダムヘキサマーによるプライミング、ライゲーション、増幅、及び配列決定を含む、複数レベルでバイアスをもたらす多くの操作に依存している。さらに、多くの汎用天然（５−メチルシトシン、プソイドウリジン）及び化学修飾（Ｎ７−メチルグアニン）は、ｃＤＮＡ合成中に逆転写酵素を停止しないため、高スループットＤＮＡ配列決定法を用いて検出されない。広く用いられる逆転写酵素は、人工物をｃＤＮＡに導入する、例えば、ＲＮＡ二次構造の領域のヌクレオチドを削除する傾向があることでも知られている。これにより、得られたｃＤＮＡの配列決定パターンが「ぼやけ」てしまう。さらに、現在の配列決定技術によって検出されないＤＮＡメチル化は、がん細胞の主要マーカーであることが分かっており、がん性細胞と非がん性細胞の間に起こる体細胞変化を区別するのに用いられている。

本明細書で開示された技術、方法、デバイス、及び組成物を用いて、未知のヌクレオチド、ヌクレオシド、または核酸塩基の同一性を決定することができる。ここで、本方法は、未知のヌクレオチド、ヌクレオシド、及び核酸塩基を量子トンネリングによって分析することと、未知のヌクレオチド、ヌクレオシド、及び核酸塩基の１つまたは複数の電子パラメータを決定し、該電子パラメータを用いてヌクレオチド、ヌクレオシド、及び核酸塩基の署名を決定することと、未知の塩基の電子署名を１つまたは複数の既知のヌクレオチド、ヌクレオシド、及び核酸塩基の電子指紋と比較することと、未知のヌクレオチドの、ヌクレオシドの、及び核酸塩基の電子署名を既知の塩基（例えば、修飾及び未修飾のＤＮＡヌクレオチドアデニン、Ａ、チミン、Ｔ、グアニン、Ｇ、シトシン、Ｃ、ＲＮＡヌクレオチドＡ、Ｇ、Ｃ、ウラシル、Ｕ、ペプチド核酸（ＰＮＡ）及び他の人工核酸高分子、ヌクレオチド修飾、例えば、メチル化、５−カルボキシ、５−ホルミル、５−ヒドロキシメチル、５−メチルデオキシ、５−メチル、５−ヒドロキシメチル、Ｎ６−メチル−デオキシアデノシン、ＲＮＡ二次／三次構造の決定に用いた他の修飾、例えば、Ｎ−メチルイサト酸無水物（ＮＭＩＡ）、または硫酸ジメチル（ＤＭＳ））の電子指紋にマッチングさせることと、それにより、未知の核酸塩基、核酸塩基修飾、または核酸高分子二次／三次構造を同定することを含む。多くの実施形態では、未知の核酸塩基を特定の生化学的条件または環境、例えば、酸性、中性、または塩基性ｐＨから選択されるｐＨ環境に置きながら、該核酸塩基の電子署名を決定してもよい。多くの実施形態では、核酸塩基の電子署名は、生化学的条件、例えば、ｐＨ環境によって変わる。いくつかの実施形態では、未知の核酸塩基の同一性は、酸性環境で決定され、ここで、種々の修飾及び未修飾の核酸塩基を区別することができる。多くの実施形態では、未知の核酸塩基の開示された同定方法には、１つまたは複数の標準電子指紋を含み、未知の核酸塩基の電子署名を１つまたは複数の標準電子指紋にマッチングさせるコンピューティングデバイスを含んでもよい。

開示された技術を用いて、ポリヌクレオチドの５’末端を標識することによってポリヌクレオチド（または、１つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを有する他の高分子）の３’−＞５’順序を決定することができる。多くの場合、ポリヌクレオチドとは、１つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む高分子のことを言う。いくつかの実施形態では、これは、特定の５’または３’末端特異的プライマータグをライゲーションすることで（場合によっては、Ｔ４リガーゼを用いることで）、既知の配列の５’−及び３’−末端を持つテンプレートを作製することで達成される。開示された方法、デバイス、及び組成物を用いて、ポリヌクレオチド（または、１つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む他の高分子）の配列を同定することで、未知のＤＮＡ／ＲＮＡ／ＰＮＡ試料の指向性が明らかになるであろう。

本明細書に記載されるマイクロ流体デバイスを用いて、２つ以上の異なる環境条件において核酸塩基の電子署名を同時またはほぼ同時に決定するためのｐＨを変えることができる。マイクロ流体チャネルを用いて、図２６に示すように、単一ＤＮＡウェルからＤＮＡ（例えば、一本鎖ＤＮＡ）を供給することができ、ここで、チャネルを異なる高分子電解質（ポリアニオン及びポリカチオン）で被覆して、環境のｐＨを所望の値に変更及び維持する。次いで、単一金属チップ、または複数のチップ（例えば、並列配列決定については後述のように）を用いて、異なるｐＨ環境及び他の生化学的条件で核酸塩基を配列決定することができる。

開示された方法を用いて、本明細書に記載される固有の電子指紋を用いて複数の未知のヌクレオチド／核酸塩基を同定することもでき、ここで、電子指紋は、１つまたは複数の生物物理学的電子パラメータ、例えば、ＨＯＭＯレベル、ＬＵＭＯレベル、バンドギャップ、電子及び正孔のファウラー−ノルトハイム過渡電圧、トンネリング曲線の勾配、電子及び正孔のトンネリングバリアハイト、電子及び正孔のバリアハイト差、電子及び正孔の有効質量、異なる生化学的条件における電子及び正孔の有効質量の比率などの値を含む。未知の修飾または未修飾のヌクレオチド／核酸塩基を同定するために、これらの生物物理学的電子パラメータを種々の組み合わせで用いてもよい。多くの場合、未知のヌクレオチド／核酸塩基の同一性は、高い信頼性で決定される。開示された方法は、クラスタリング方法の使用を含んでもよく、ここで、多くの既知の核酸塩基／ヌクレオチドの１つまたは複数の生物物理学的電子パラメータを用いて電子指紋を作成し、これを、未知の核酸塩基／ヌクレオチドに対して決定された電子署名と比較することができる。多くの場合、電子パラメータは、コンピュータプログラムの電子データとして保存され、これを用いて、未知の核酸塩基／ヌクレオチドに対して決定された電子パラメータを選択し、既知のヌクレオチド／核酸塩基の同様に構成された指紋（電子署名に対して選択されたものと同じパラメータの値を含む）と比較することができる。開示された方法を用いて、自動的に配列決定し、核酸塩基をロバストな配列決定技術及びソフトウェア解析に呼び出すことができる。

未知の核酸塩基の同一性を決定するのに有用な組成物についても開示する。いくつかの実施形態では、核酸塩基の同一性を決定するための基板が開示され、ここで、基板は、平滑な高配向金基板、例えば、金（１１１）であってもよい。いくつかの実施形態では、基板は荷電され、１つまたは複数のイオン性分子、例えば、ポリ−Ｌ−リシンを含む溶液で処理され、ここで、イオン性分子は、一本鎖ＤＮＡなどの負に帯電したポリマーが金基板に結合するのに役立つ。

ヌクレオチド／核酸塩基の化学修飾も、開示された方法を用いて決定される。場合によっては、化学修飾は、ポリヌクレオチド、または、１つまたは複数のヌクレオチド、ヌクレオシド、核酸塩基、またはその組み合わせを含む他の高分子の二次／三次核酸高分子構造を決定するのに有用であり得る。場合によっては、ポリヌクレオチドは、Ｎ−メチルイサト酸無水物（ＮＭＩＡ）、硫酸ジメチル（ＤＭＳ）などを用いて修飾してもよい。ＤＮＡ／ＲＮＡ／ＰＮＡの化学修飾も、エピジェネティックマーカー及び核酸損傷を決定するのに有用であり得る。場合によっては、化学修飾は、５−カルボキシ、５−ホルミル、５−ヒドロキシメチル、５−メチルデオキシ、５−メチル、５−ヒドロキシメチル、Ｎ６−メチル−デオキシアデノシンなどであってもよい。化学修飾は、開示された電子指紋を用いて、未修飾のＤＮＡ／ＲＮＡ／ＰＮＡヌクレオチドと同時に決定してもよい。

複数の実施形態を開示するが、当業者には、以下の詳細な説明から本発明のさらに他の実施形態が明らかになるであろう。明らかになるように、本発明は、本発明の精神及び範囲から逸脱することなく、述べられた種々の態様の修正を介して実行してもよい。
従って、詳細な説明は、本質的に説明のためのものであって、制限的なものではないと見なすべきである。

量子分子配列決定（ＱＭ−Ｓｅｑ）を用いた、ＤＮＡ、ＲＮＡ、ＰＮＡなどの核酸高分子の配列決定。（ａ）クリーンな金（１１１）表面上に沈着させた一本鎖（ｓｓ）ＤＮＡを示すＱｕａｎＴ−Ｓｅｑの図である。３工程の押出沈着スキームを用いて、配位エントロピーを減少させた延伸、線状化ＤＮＡ及びＲＮＡ分子を再現性良く得る。ＱＭ−Ｓｅｑ電子スペクトル（トンネリングデータ）を得るのに用いた金属チップは、「読取ヘッド」として作用する。（ｂ）ＱＭ−Ｓｅｑは、ヌクレオチドを介した電子及び正孔のナノ電子トンネリングを利用して、固有の電子指紋を提供する。両方の核酸塩基（正確な縮尺率ではない）間で有意差が観察され得る酸性条件下でのプリン及びピリミジンのフロンティアバンド構造、ＨＯＭＯ及びＬＵＭＯ分子軌道の概略図を示す。共役度の違い及び化学的に異なる核酸塩基（ここでは、アデニン及びチミン）は、異なる電子状態及びエネルギーギャップをもたらす。（ｃ〜ｇ）対応する化学構造とともに、各（デオキシ）リボヌクレオチドの代表的なＱＭ−Ｓｅｑスペクトル（トンネリングデータ）。Ｒ−は、デオキシリボヌクレオチド（ＤＮＡ）及びリボヌクレオチド（ＲＮＡ）に対してそれぞれ、ＨまたはＯＨのいずれかであってよい。スペクトルデータは、酸性条件下で測定した。ここで示すスペクトルは、ＤＮＡヌクレオチド（Ａ、Ｃ、Ｇ、Ｔ）及びＲＮＡヌクレオチド（Ｕ）に対応する。示した構造は、（ｃ）（デオキシ）アデノシン５’−モノリン酸、（ｄ）（デオキシ）グアノシン５’−モノリン酸、（ｅ）（デオキシ）シチジン５’−モノリン酸、（ｆ）チミジン５’−モノリン酸、及び（ｇ）ウリジン５’−モノリン酸である。Ａ、Ｇ、Ｃ、Ｔ／Ｕヌクレオチドは、それぞれ、緑色、黒色、青色、及び赤色で常に示される。核酸塩基、デオキシヌクレオシド、及びリボヌクレオシドのフロンティア分子軌道：プリンの例として（ａ）アデニン、デオキシアデノシン、及びアデノシン；ピリミジンの例として（ｂ）シトシン、デオキシシチジン、及びシチジンに対して設定されたＢ３ＬＹＰ関数及び６−３１１Ｇ（２ｄ、２ｐ）基底系による密度汎関数（ＤＦＴ）計算を用いたＨＯＭＯ、ＬＵＭＯ分子軌道構造。陰影は、波動関数の異なる位相を示す。走査型トンネリング顕微鏡−走査トンネリング分光法（ＳＴＭ−ＳＴＳ）を用いた単一ＤＮＡ分子の配列決定。（ａ）ＤＮＡ処理スキームを示す図である。変性一本鎖（ｓｓ）ＤＮＡを、押出沈着技術を用いてポリ−Ｌ−リシンで修飾したクリーンな金（１１１）表面上に沈着させ、配列決定用の細長い線状化ＤＮＡテンプレートを再現性良く得る。（ｂ）正に帯電した金（１１１）表面上に沈着させたｓｓＤＮＡヌクレオチドの地形画像、Ｉ−Ｖ及びｄＩ／ｄＶ、または状態密度（ＤＯＳ）スペクトルを得るためのＳＴＭ−ＳＴＳの概略図。電子トンネリング電流データを用いてトンネリング確率を提供するための単一ヌクレオチドを介した電子または正孔トンネリング。Ａ、Ｇ、Ｃ、Ｔヌクレオチドは、可能であれば、異なる陰影によって区別される。（ｃ〜ｆ）中性ｐＨでのＤＮＡヌクレオチド（モノリン酸塩）、アデノシン５’−モノリン酸（ｃ）、デオキシグアノシン５’−モノリン酸（ｄ）、デオキシシチジン５’−モノリン酸（ｅ）、及びデオキシチミジン５’−モノリン酸（ｆ）の化学構造。ＤＮＡヌクレオチドのＳＴＭ−ＳＴＳを用いて得られた電子指紋。（ａ）酸性条件下（表面を０．１ＭＨＣｌで洗浄した）におけるＡ、Ｇ、Ｃ、及びＴのＨＯＭＯ（負）及びＬＵＭＯ（正）レベルの分布。ＬＵＭＯレベル（正電圧ピーク）の明確な分離を用いて、プリン（Ａ、Ｇ）からピリミジン（Ｃ、Ｔ）を同定し、ＨＯＭＯレベルの差を用いてピリミジン（ＴからＣ）を分離した。（ｂ）酸性条件下でのＬＵＭＯとＨＯＭＯエネルギーレベル間のエネルギーギャップ。（ｃ）酸性（ＨＣｌ）、中性（Ｈ_２Ｏ）、及び塩基性（ＮａＯＨ）ｐＨ条件下でのチミンのＨＯＭＯ／ＬＵＭＯレベル。矢印は、酸性、中性、及び塩基性ｐＨ条件間でのＬＵＭＯレベルのシフトを示す。（ｄ）酸性条件下でのケト−エノール互変異性化を含む、異なるｐＨ条件下でのチミンの生化学的構造、中性及び塩基性条件間での酸−塩基挙動。（ｅ）過渡電圧（Ｖ_{ｔｒａｎｓ}）及び三角トンネリングの勾配（トンネリングエネルギーバリアに比例）によって特徴付けられた、酸性条件下でのチミンの電子ファウラー−ノルトハイムプロット。非常に小さな電圧で、トンネリングは、台形／長方形になるため、線形勾配（勾配は対数になる）からの偏移を示す。（ｆ）４つ全てのヌクレオチドの、酸性条件下での電子（Ｖ_{ｔｒａｎｓ，ｅ−}）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）の過渡電圧の確率密度関数。ファウラー−ノルトハイムトンネリングのＶ_{ｔｒａｎｓ，ｅ−}／Ｖ_{ｔｒａｎｓ，ｈ＋}及び勾配（Ｓ）は、それぞれ、ＨＯＭＯ／ＬＵＭＯレベル及びエネルギーバンドギャップ（「バンドギャップ」）と同じ挙動を示す。ＤＮＡヌクレオチドの電子指紋。（ａ）酸性条件下でのポリ−Ｌ−リシン−修飾表面（０．１ＭＨＣｌで洗浄）上のＡ、Ｇ、Ｃ、及びＴの測定したＨＯＭＯ（負）及びＬＵＭＯ（正）レベルのボックスプロット。ボックスプロットは、第２及び第３四分位（２５〜７５％）を含むが、ひげは、５〜９５％のデータを示す。プロトン化分子中で、ＬＵＭＯレベル（正電圧ピーク）の明確な分離を用いて、プリン（Ａ、Ｇ）からピリミジン（Ｃ、Ｔ）を同定し、ＨＯＭＯレベルの差を用いてピリミジン（ＴからＣ）を分離した。（ｂ）酸性条件下でのＬＵＭＯとＨＯＭＯエネルギーレベル間のエネルギーギャップ。このエネルギーギャップは、中性分子とは異なり得る。（ｃ）酸性（ＨＣｌ）、中性（Ｈ_２Ｏ）、及び塩基性（ＮａＯＨ）ｐＨ条件下でのチミンのＨＯＭＯ／ＬＵＭＯレベル。（ｄ）酸性条件下でのケト−エノール互変異性化を含む、異なるｐＨ条件下でのチミンの生化学的構造、中性及び塩基性条件間での酸−塩基挙動。（ｅ）４つ全てのヌクレオチドの、酸性条件下での電子（Ｖ_{ｔｒａｎｓ，ｅ} ⁻）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）の過渡電圧の分布。Ｖ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}は、それぞれ、ＨＯＭＯ／ＬＵＭＯレベル及びエネルギーバンドギャップと同じ挙動を示す。（ｆ）過渡電圧（Ｖ_{ｔｒａｎｓ，ｅ−}）及び三角トンネリングの勾配（トンネリングエネルギーバリアに比例）によって特徴付けられた、酸性条件下でのチミンの電子ファウラー−ノルトハイムプロット。概略図は、低電圧での直接トンネリングから高バイアス電圧での三角トンネリングへの遷移を示す。非常に低い電圧（ゼロバイアス限界）で、バリアは長方形になり、トンネリング電流は、印加したバイアス電圧での対数勾配を示す。ＳＴＭ−ＳＴＳを用いたベータ−ラクタマーゼ遺伝子ａｍｐＲの配列決定。（ａ）酸性条件下でのポリ−Ｌ−リシンで修飾した金上のアデニンの特性化。実線の緑色線はｄＩ／ｄＶまたは状態密度を示し、破線の灰色線はＩ−Ｖデータであり、点線の緑色線はＨＯＭＯ及びＬＵＭＯエネルギーレベルの分布を示す。（ｂ）１０９１ｎｔａｍｐＲ遺伝子の単一ｓｓＤＮＡ分子のＳＴＭ画像。画像は、ＤＮＡがポリ−Ｌ−リシンで修飾した金基板の上部で線状化していることで、ＳＴＳ同定が簡単にできることを示している。（ｃ）酸性条件下でのＡ、Ｇ、Ｃ、及びＴの電子指紋を用いて、ＳＴＭ−ＳＴＳを用いて測定した（ｂ）に示す強調領域におけるＤＮＡヌクレオチドの同定。同定したヌクレオチドは色分けされる（黒色：ＡまたはＧ、青色：Ｃ、及び赤色：Ｔ）。（ｄ）（ｃ）からのＳＴＳデータを用いた一次（強調）及び二次同定に基づいて同定したａｍｐＲ配列。ＲＮＡヌクレオチドの電子指紋及びＤＮＡとの比較：（ａ）酸性条件下でのＲＮＡヌクレオチドの単一分子測定のアンサンブルのＨＯＭＯ及びＬＵＭＯエネルギーのボックスプロットであり、ボックスは２５〜７５％を含むが、ひげは値の５％〜９５％を示す。（ｂ）プリン及びピリミジンの２つの異なるエネルギーレベルを示す、酸性条件下でのＲＮＡヌクレオチドの測定したエネルギーバンドギャップのボックスプロット。（ｃ〜ｄ）ＤＮＡ及びＲＮＡ上の同じ核酸塩基のＨＯＭＯ／ＬＵＭＯエネルギーレベルの分布の比較。（ｃ）デオキシアデノシンとアデノシンの比較。（ｄ）デオキシシチジンとシチジンの比較。ＳＴＭ−ＳＴＳを用いた単一ヌクレオチド修飾の同定。（ａ）酸性条件下において、ポリ−Ｌ−リシン被覆金（１１１）基板上に沈着させた、硫酸ジメチル（ＤＭＳ）で処理されたアデニンオリゴマーのＳＴＭ画像。（示すように）隣接ヌクレオチド上のメチル化及び非メチル化アデニンの簡易同定により、この新規配列決定技術を用いて単一ヌクレオチド修飾を検出する可能性が強調される。（ｂ）ＤＭＳによるアデニンメチル化の反応生成物。（ｃ）７−メチルグアニン及び開環をもつその加水分解生成物を生成するためのＤＭＳによるグアニンの反応スキーム。（ｄ）非メチル化（実線）及びメチル化（破線）アデニンの酸性条件下でのＨＯＭＯ／ＬＵＭＯレベルの分布。（ｅ）グアニン（実線）、メチル化グアニン（点線）及び開環メチル化グアニン（破線）の酸性条件下でのＨＯＭＯ／ＬＵＭＯレベルの分布。ＱＭ−Ｓｅｑを用いた単一ヌクレオチド修飾の同定。（ａ）ＤＭＳによるシトシンメチル化の反応生成物。（ｂ）非メチル化（青色）シトシン及びメチル化シトシン（紫色）の酸性条件下でのＨＯＭＯ及びＬＵＭＯ位置のボックスプロット（２５〜７５％四分位）。ひげは５％〜９５％百分率を示し、中心線は中央値である。（ｃ〜ｄ）非メチル化シトシン（ｃ）及びメチル化シトシン（ｄ）のトンネリングスペクトル（Ｉ−Ｖ、点線の曲線）及び（ｄＩ／ｄＶ、実線の曲線）。両方とも同じ縦軸（電圧）である。重ね合わせた青色及び紫色線は、各分布に対するピーク位置上の差を示すための視覚補助である。Ｉ−Ｖ及び電子状態密度（ｄＩ／ｄＶ）スペクトルの測定。（ａ）中性ｐＨでのシトシンのＳＴＳ電流（Ｉ）−電圧（Ｖ）曲線。（ｂ）ピーク位置（ＨＯＭＯ及びＬＵＭＯエネルギーレベル）及びそのエネルギーギャップを示すその導関数。他の図に示すトンネリング署名は、各核酸塩基について測定した少なくとも２０個の独立した分光データのアンサンブルを表す確率密度関数である。Ｉ−Ｖスペクトルの独立した測定の各々について、導関数ｄＩ／ｄＶを用いて、ＨＯＭＯ及びＬＵＭＯレベル及びエネルギーバンドギャップを同定した。次いで、これらを用いて、ＨＯＭＯ及びＬＵＭＯレベル両方のエネルギー位置、及びエネルギーバンドギャップからの正規分布を表す確率密度関数を生成した。電子署名の多分散性は、配位エントロピー、すなわち、室温での熱エネルギーにより支援される異なる分子配座を介した荷電トンネリングによって引き起こされることが多い。それぞれのｐＫａによる異なるｐＨ条件下でのヌクレオチドの化学構造。上から下に、（ａ）アデニン（Ａ）、（ｂ）グアニン（Ｇ）、（ｃ）シトシン（Ｃ）、及び（ｄ）チミン（Ｔ）。チミンは、酸性条件下にて９．９で単一ｐＫａを有し、エノール化及びプロトン化を経てもよい。グアニンＬＵＭＯ／ＨＯＭＯレベルにおけるｐＨの効果。酸性（０．１ＭＨＣｌで洗浄した）、中性（Ｈ_２Ｏ）、及び塩基性（０．１ＭＮａＯＨ）ｐＨで、金（１１１）表面上に沈着させたグアニンのＬＵＭＯ（正ピーク）及びＨＯＭＯ（負ピーク）レベルの分布。矢印は、酸性、中性、及び塩基性条件間でのＬＵＭＯ及びＨＯＭＯレベルのシフトを示す。グアニンは、酸性（ｐＨは第１のｐＫａ約３．２〜３．３未満である）、中性、及び塩基性条件（その第２のｐＫａ約９．２〜９．６を上回る）で３つの生化学的構造を示す。同様に、異性体の正孔捕獲により、ｐＨが増加する（酸性から、中性、塩基性条件に）につれて、ＨＯＭＯレベルの着実な増加をもたらす（正孔をトンネルしにくくなる）。しかしながら、酸性及び塩基性条件（図１１）での複数の共鳴構造により、中性条件と比べてより簡単な電子トンネリング（より低いＬＵＭＯレベル）をもたらす。さらに、塩基性条件（ｐＫａ２による）でのさらなる静電反発力は、電子トンネリング確率を改善し、塩基性ｐＨのＬＵＭＯレベルのさらなる低下をもたらす。グアニンの生データ及び統計：（ａ）酸性条件下でのグアニンの生電流−電圧（Ｉ−Ｖ）曲線。（ｂ）（ａ）の生スペクトルまたはｄＩ／ｄＶ、矢印は、各スペクトル上の第１の著しい負／正ピークとして同定されたＨＯＭＯ／ＬＵＭＯレベルを示す。（ｃ〜ｅ）データセットに適合させた正規確率密度関数（図４ａ、４ｂにも示す曲線で示される）によって重ね合わされた、グアニンのＨＯＭＯ（ｃ）、ＬＵＭＯ（ｄ）、及びエネルギーギャップ（ｅ）の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。アデニンＬＵＭＯ／ＨＯＭＯレベルにおけるｐＨの効果。酸性（０．１ＭＨＣｌで洗浄した）、中性（Ｈ_２Ｏ）、及び塩基性（０．１ＭＮａＯＨ）ｐＨで、金（１１１）表面上に沈着させたアデニンのＬＵＭＯ（正ピーク）及びＨＯＭＯ（負ピーク）レベルの分布。アデニンは任意のｐＨ条件（荷電及び非荷電の両方）で複数の共鳴構造を有するが、そのトンネリング確率におけるｐＨの有意な効果は観察されない（共鳴構造の間の荷電の消散による）。ｐＨの増加に伴うＨＯＭＯレベルの小幅な増加は、酸性ｐＨ（正荷電による）で正孔トンネリングがより容易になることによるものであり得る。アデニンの生データ及び統計：（ａ）酸性条件下でのアデニンの生電流−電圧（Ｉ−Ｖ）曲線。（ｂ）（ａ）の生スペクトルまたはｄＩ／ｄＶ、矢印は、各スペクトル上の第１の著しい負／正ピークとして同定されたＨＯＭＯ／ＬＵＭＯレベルを示す。（ｃ〜ｅ）データセットに適合させた正規確率密度関数（図４ａ、４ｂにも示す曲線で示される）によって重ね合わされた、アデニンのＨＯＭＯ（ｃ）、ＬＵＭＯ（ｄ）、及びエネルギーギャップ（ｅ）の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。シトシンＬＵＭＯ／ＨＯＭＯレベルにおけるｐＨの効果。酸性（０．１ＭＨＣｌで洗浄した）、中性（Ｈ_２Ｏ）、及び塩基性（０．１ＭＮａＯＨ）ｐＨで、金（１１１）表面上に沈着させたシトシンのＬＵＭＯ（正ピーク）及びＨＯＭＯ（負ピーク）レベルの分布。シトシンは、そのｐＫａ約４．４を上回る２つの主要構造で明確なｐＨ効果を有するが、中性と塩基性条件の間では差は見られない。しかしながら、酸性条件下でのプロトン化形態は、電子を捕捉しやすい効果を示し、ＬＵＭＯエネルギーレベルを増加させる。シトシンの生データ及び統計：（ａ）酸性条件下でのシトシンの生電流−電圧（Ｉ−Ｖ）曲線。（ｂ）（ａ）の生スペクトルまたはｄＩ／ｄＶ、矢印は、各スペクトル上の第１の著しい負／正ピークとして同定されたＨＯＭＯ／ＬＵＭＯレベルを示す。（ｃ〜ｅ）データセットに適合させた正規確率密度関数（図４ａ、４ｂにも示す曲線で示される）によって重ね合わされた、シトシンのＨＯＭＯ（ｃ）、ＬＵＭＯ（ｄ）、及びエネルギーギャップ（ｅ）の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。ＱｕａｎＴ−Ｓｅｑを用いた単一ヌクレオチド修飾の同定。（ａ）ＤＭＳによるアデニンのメチル化の反応生成物。（ｂ）ＤＭＳによるグアニンのメチル化の反応生成物。（ｃ）酸性条件下で、ポリ−リシンで修飾した金（１１１）表面上に沈着させたアデニン及びメチル化アデニンのＨＯＭＯ及びＬＵＭＯエネルギーレベル分布のボックスプロット。メチル基の付加により、正孔トンネリング確率を減少させることでＨＯＭＯレベルをシフトさせる。（ｄ）酸性条件下で、ポリ−リシンで修飾した金（１１１）表面上に沈着させたグアニン及びメチル化グアニンのＨＯＭＯ及びＬＵＭＯエネルギーレベル分布のボックスプロット。チミンの生データ及び統計：（ａ）酸性条件下でのチミンの生電流−電圧（Ｉ−Ｖ）曲線。（ｂ）（ａ）の生スペクトルまたはｄＩ／ｄＶ、矢印は、各スペクトル上の第１の著しい負／正ピークとして同定されたＨＯＭＯ／ＬＵＭＯレベルを示す。（ｃ〜ｅ）データセットに適合させた正規確率密度関数（図４ａ、４ｂにも示す曲線で示される）によって重ね合わされた、チミン（棒）のＨＯＭＯ（ｃ）、ＬＵＭＯ（ｄ）、及びエネルギーギャップ（ｅ）の位置のヒストグラム。斜線ボックスは、平均±標準偏差を含む曲線の面積を示す。グラフェンに吸収されたアデニン（核酸塩基）のＨＯＭＯ、ＬＵＭＯ、及びエネルギーギャップ分散への配置エネルギー寄与−出典Ａｈｍｅｄら、ここでは、導電性基板の上に配置された異なる配置での核酸塩基のＤＦＴシミュレーションと、ＤＦＴ理論に基づく局所状態密度への導電性基板の寄与を記載している。線は、異なる角度（中心で重ね合わせた配座）でのグラフェンに吸収された窒素原子の局所状態密度（ＬＤＯＳ）である。黄色斜線領域は、フェルミレベル近くの主ピークに対応する。灰色陰影ボックスは、可能な全ての配座（０°〜９０°）を考慮したフェルミレベル近くの主ピーク（正及び負）の分布を表す。ファウラー−ノルトハイムプロットからの（トンネリングと電界放射レジームの間の）電子及び正孔過渡電圧におけるｐＨの効果。（ａ）アデニン（Ａ）、（ｂ）グアニン（Ｇ）、（ｃ）シトシン（Ｃ）、及び（ｄ）チミン（Ｔ）の電子（Ｖ_{ｔｒａｎｓ，ｅ−}）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）のＶ_{ｔｒａｎｓ}を示す。矢印は、酸性（ＨＣｌ）、中性（Ｈ_２Ｏ）、及び塩基性（ＮａＯＨ）条件間でのＶ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}のシフトを示す。これら全ての遷移は、ＬＵＭＯ及びＨＯＭＯレベルの各変化を模倣しているため、１つの潜在的な生物物理学的性能指数としてＶ_{ｔｒａｎｓ}の役割が確認される。ＤＮＡヌクレオチドグアニン、シトシン、及びチミンのトンネリング特性。グアニン（ａ）、シトシン（ｂ）、及びチミン（ｃ）のＩ−Ｖ（破線）、ｄＩ／ｄＶまたは状態密度（実線）、及びＬＵＭＯ及びＨＯＭＯレベルの確率分布（点線）。点線は、ＬＵＭＯ及びＨＯＭＯエネルギーレベル両方に適合させた正規確率分布関数である。押出沈着技術を用いたｓｓＤＮＡの線状化。押出無しで裸の金上に沈着させたｓｓＤＮＡのＳＴＭ画像（ａ）、押出でポリ−Ｌ−リシンで修飾した金上に沈着させたｓｓＤＮＡのＳＴＭ画像（ｂ）。ポリ−Ｌ−リシン被覆及び押出沈着スキームの役割は、このＳＴＭデータではっきりと見ることができ、線状化ＤＮＡにより、単一ヌクレオチドのＳＴＳを明確に同定することができる（図２５）。ＳＴＭ−ＳＴＳを用いた単一ヌクレオチド修飾の同定。（ａ）ＤＭＳによるシトシンのメチル化の反応生成物。（ｂ）酸性条件下で、ポリ−リシンで修飾した金（１１１）表面上に沈着させたシトシン及びメチル化シトシンのＨＯＭＯ及びＬＵＭＯエネルギーレベル分布。メチル基の付加により、正孔トンネリング確率を減少させることでＨＯＭＯレベルをシフトさせる。単一分子ＤＮＡ検出能力。開示された技術を用いて生理学的濃度を模倣するために低濃度のｓｓＤＮＡ（２回蒸留水またはＴＥ緩衝液（トリス（ヒドロキシメチル）アミノエタン−エチレンジアミン四酢酸（またはＥＤＴＡ）緩衝液中で１〜５ｎＭ）を用いて、いくつかの線状化ＤＮＡ鎖を、ＳＴＭ−ＳＴＳ配列決定を用いて検出することができる。ここで示す試料走査では、ＤＮＡ分子は、超平滑金（１１１）基板上に小さな走査面積（１μｍ×１μｍ）で見つかった。このことは、この配列決定技術が非常に低濃度のＤＮＡ分子を検出し、配列決定する能力を示している。マイクロ流体デバイスでチャネルを形成している基板を示す。チャネル寸法（幅）は、１００ナノメートル（ｎｍ＝１０^−９ｍ）〜５０マイクロメートル（μｍ）の間で変化し得る。（ａ）単式光学リソグラフィ後に異方性ＫＯＨエッチングを用いて光学的に作成したチップパターンのセンチメートル縮尺の写真である。（ｂ）金から作られた高忠実度かつ周期的にパターン化されたＳＴＭチップを示すＳＥＭ画像。超平坦／超平滑基板上の大面積（ｃｍ×ｃｍ）縮尺のＳＴＭチップを用いて、２μｍ×２μｍ表面を走査し、大規模並列走査及びチップからの単純読み出しによって、図に示すものと同様のｃｍ縮尺にわたる全配列を作成することができる。（ｃ）１メガピクセル（または１メガチップ）２ｃｍ×２ｃｍチップを示す。電圧を複数のチップに同時に印加することができ、電流を回収、保存し、複数のチップからの全ての電流値を同時に読み取ってもよい（ＣＣＤカメラと同様）。電流を読み取った後、別のバイアス電圧を印加して、塊状の２ｃｍ×２ｃｍ基板にわたって全電流−電圧曲線を再作成することができる。マイクロ流体チャネルに数千のゲノムを同時に配置し、線状化し、読み取ることができる。圧電を用いて試料を数オングストローム動かすことで、次の核酸塩基の配列決定をすることができ、かつ、−該処理を繰り返して、追加の核酸塩基を解析することができる。従って、単一２マイクロメートルにおいて、大規模並列シーケンサの走査動作（または圧電走査）により、単純マイクロ流体デバイスを用いてパターン化された比較的大きな試料バイオチップ上の可能な全ての核酸塩基を配列決定することができる。自動化方式による塩基呼び出し方法を示す概略図。反応性に基づく構造決定。ＲＮＡＳＨＡＰＥ及び／またはＤＭＳ分子による化学修飾電子指紋を用いて、かつ、ＳＨＡＰＥまたはＤＭＳが反応した一本鎖領域を束縛させたＲＮＡ構造ソフトウェアを用いて、二次／三次核酸構造、ここではＲＮＡを得た。ＲＮＡ構造決定中の反応対未反応ヌクレオチドの割り当て。クラスタリング方法は、ＲＮＡヌクレオチドを高い信頼性で割り当てる。斜線は、正確な塩基呼び出しを示す。大文字は未修飾ＲＮＡヌクレオチドであり、小文字は修飾ＲＮＡヌクレオチドである。ＱＭ−Ｓｅｑで実験的に測定したＨＩＶ−ＲＮａｓｅのＲＮＡ構造（上パネル）。下パネルは、ＲＮＡ折り畳みソフトウェアを用いて予測したｉｎｓｉｌｉｃｏで束縛されていないＲＮＡ構造を示す。（上）３パラメータ電子状態（ＨＯＭＯ−ＬＵＭＯ−エネルギーギャップ）と、（下）多次元生物物理学的パラメータ（＞９パラメータ、限定するものではないが、ＨＯＭＯ、ＬＵＭＯ、エネルギーギャップ、電子及び正孔のトンネリングバリアハイト、トンネリングバリアハイト差、電子及び正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへのトンネリングバリアプロファイル変化に対応する電圧、ヌクレオチドトンネリングにおける電子及び正孔の有効質量、電子及び正孔の有効質量の比率、対応するファウラー−ノルトハイムプロットの勾配）とを用いた比較。全ては、量子トンネリング分光走査から算出し、ＨＩＶ−１ＲＮＡｓｅ上のＱＭ−Ｓｅｑによって得られた電子指紋として用いた。電子状態は、ＲＮＡプリン及びピリミジン間の同定に役立つが、多変数電子指紋により、この図（下）に示すように４つ全ての核酸塩基の一意的な同定を高精度で行うことができる。酸性条件下でのポリ−リシン被覆超平坦金（１１１）基板上で決定されたＤＮＡヌクレオチド（Ａ、Ｔ、Ｇ、Ｃ）同定のための電子指紋として用いた異なる生物物理学的パラメータ。ａ）ＬＵＭＯレベル、ｂ）ＨＯＭＯレベル、ｃ）電子のバリアハイト、ｄ）正孔のバリアハイト、ｅ）分子の全トンネリングバリアハイト、ｆ）個々のヌクレオチドを介した荷電トンネリングの電子及び正孔の有効質量の比率、ｇ）電子及びｈ）正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへの過渡電圧。中性条件下での修飾金（１１１）基板上で決定されたＲＮＡヌクレオチド（Ａ、Ｕ、Ｇ、Ｃ）同定のための電子指紋として用いた異なる生物物理学的パラメータ。ａ）ＬＵＭＯレベル、ｂ）ＨＯＭＯレベル、ｃ）電子のバリアハイト、ｄ）正孔のバリアハイト、ｅ）分子の全トンネリングバリアハイト、ｆ）個々のヌクレオチドを介した荷電トンネリングの電子及び正孔の有効質量の比率、ｇ）電子及びｈ）正孔の直接トンネリングからファウラー−ノルトハイムトンネリングへの過渡電圧。自動化方式による塩基呼び出し方法を示す概略図。核酸塩基の同一性、基板上での位置、及びポリヌクレオチド中の配列の決定方法の実施形態を示すフローチャート。

本開示の前に、トンネリング分光法を用いたＤＮＡ配列決定の課題は、各ヌクレオチドの固有のトンネリングスペクトルを同定することであった。ＤＮＡヌクレオチドの量子トンネリング分光法は、個々の核酸塩基、ヌクレオシド、及びヌクレオチドの電子状態密度を表す。本明細書には、未知のヌクレオチドの同定を助けるために、同一性が未知のヌクレオチド（未知のヌクレオシド、ヌクレオチド、または核酸塩基）の電子署名と比較して用いられる修飾及び未修飾のＤＮＡ及びＲＮＡ核酸塩基、ヌクレオシド、及びヌクレオチドの固有の指紋決定に用いられる方法、デバイス、及び組成物を開示している。一本鎖（ｓｓ）ＤＮＡ及び二本鎖（ｄｓ）ＤＮＡ両方のヌクレオチドを同定する以前の試みは、一般に、４つのＤＮＡ核酸塩基、ヌクレオシド、及びヌクレオチドの固有のトンネリングスペクトルを決定することができなかった。

開示された方法、デバイス、及び組成物も、ＲＮＡの既存の配列決定方法の限界の緩和に役立つ。開示された方法、デバイス、及び組成物を、単一分子レベルでの非増幅テンプレートによるＲＮＡの直接配列決定に用いてもよい。多くの場合、本開示は、細胞または組織から得たＲＮＡ分子の同一性及び存在度を決定することに役立つ。さらに、本開示の、単一分子のヌクレオチド（ＤＮＡ／ＲＮＡ）修飾に対する固有の電子トンネリングスペクトル（トンネリングデータ）固有の電子トンネリングスペクトル（トンネリングデータ）の同定により、疾患の早期検出に対する有用なエピゲノム技術を提供することができる。エピゲノム研究により、ゲノムの動的状態、特に、病状及び発生生物学を決定するそれらの役割についての洞察を提供することができる。

開示された方法、デバイス、及び組成物は、ノイズがほとんどなく高い再現性があるトンネリングデータまたはＩ−Ｖデータを回収する。以前の方法では、再現性に欠け、信号対雑音比が低いという問題があった。本開示の方法、デバイス、及び組成物は、種々の方法でデータ回収を高める。例えば、開示された方法、デバイス、及び組成物は、イオン性ポリマーで被覆される超平滑荷電表面を用いる。１つの実施形態では、金（１１１）荷電表面は、ポリ−リシンで被覆してもよい。イオン性ポリマーの使用は、核酸骨格の配向に役立ち、これにより、以前の方法よりも再現性が高くかつ信号対雑音比が高いトンネリングデータを提供することができる。さらに、開示された方法、デバイス、及び組成物は、指紋データを回収するための定義された環境で用いてもよい。例えば、開示された方法、デバイス、及び組成物は、高または低ｐＨ環境で量子トンネリングを行い、種々の修飾及び未修飾の核酸塩基、ヌクレオチド、及びヌクレオシドを区別するの役立つ。定義された環境の使用により、得られるトンネリングデータの向上にも役立つ。

ナノ電子トンネリングは、ナノスケールで発生する量子物理学的プロセスである。ナノ電子トンネリングは、別個の原子または分子の波動関数が重複する傾向を利用したものである。電圧バイアスまたはバイアスが印加されると（原子と接触している基板の原子近くに位置する金属チップの電位が増大または減少することで）、チップと原子／分子の間の電子または正孔のいずれかのトンネリングが、電位バリアを超えて発生し得る。古典的な電荷伝導は、名目上、高電位の領域から低電位の領域へと発生する（ここで、２つの領域は、下流電位バイアスによって分離される）（電流は高電位から低電位へと流れる）が、量子トンネリングは、電位バリアハイトを超えて物理的な接触なく発生し（従って、分子状態密度は、測定によって乱されない）、ここで、トンネリング確率は、バリアハイトの増加に伴い減少する。波動関数重複により分子の１つに電子を注入する（電子トンネリング）かまたは、該分子の１つから抽出する（正孔トンネリング）ことができる。

電子状態密度を表すヌクレオチドのトンネリング電流スペクトル。本明細書で開示されるのは、ヌクレオチド同定に使用される固有の指紋を作成するためのトンネリング電流データの使用である。モデリングし、実験することによって、一本鎖（ｓｓ）ＤＮＡ及び二本鎖（ｄｓ）ＤＮＡの両方、ＲＮＡ、ＰＮＡ、他の核酸高分子、ＤＮＡ／ＲＮＡ／ＰＮＡヌクレオチド修飾、核酸構造から異なるヌクレオチドを同定し、区別するいくつかの試みがなされている。しかしながら、本開示まで、ｓｓＤＮＡ上でのグアニン（Ｇ）塩基のみ、トンネリング顕微鏡を用いた部分的な同定しかできていない。

本明細書で提示されるのは、単一分子ＤＮＡ／ＲＮＡ／ＰＮＡ配列決定を用いて行ったヌクレオチド、ヌクレオシド、及び核酸塩基Ａ、Ｇ、Ｔ、Ｃ、及びＵの固有の電子指紋を決定するための最初のデモンストレーションである。さらに、修飾ヌクレオチド／核酸塩基の固有の指紋についても開示する。核酸塩基は、シトシン（「Ｃ」と略す）、グアニン（「Ｇ」と略す）、アデニン（「Ａ」と略す）、チミン（「Ｔ」と略す）、及びウラシル（「Ｕ」と略す）のことを言う。Ｃ、Ｇ、Ａ、及びＴは、デオキシリボ核酸（ＤＮＡ）に見ることができ、Ｃ、Ｇ、Ａ、及びＵは、リボ核酸（ＲＮＡ）に見ることができる。図１は、ヌクレオチドＡ、Ｇ、Ｃ、Ｔ、及びＵに対する量子トンネリング分光法によって決定された電子指紋を示す。ヌクレオシド、ヌクレオチド、及び核酸塩基という用語は、交換可能に用いられ、天然及び合成かつ修飾及び未修飾のヌクレオシド、ヌクレオチド、及び核酸塩基のことを言う。

開示された技術は、量子トンネリングデータを用いて、未知のヌクレオチド、ヌクレオシド、及び核酸塩基の電子署名を作成し、それらの同一性を決定するのに役立ち、室温（即ち、約２０〜２５℃）または１Ｋ〜３００Ｋの極低温度で行ってもよい。場合によっては、ヌクレオチド、ヌクレオシド、及び核酸塩基の電子状態は、生物物理学的条件または環境、例えば、ヌクレオチド、ヌクレオシド、または核酸塩基を解析するｐＨに応じてシフトしてもよい。場合によっては、ヌクレオチド、ヌクレオシド、または核酸塩基の異なる状態を酸性ｐＨ（即ち、約７未満のｐＨ）で同定してもよい。多くの実施形態では、電子パラメータを決定するのに用いた環境のｐＨは、約３未満である。

修飾及び未修飾のヌクレオチド、ヌクレオシド、及び核酸塩基の指紋は、種々の生物物理学的条件または環境で決定され、これらの電子状態はシフトしてもよい。これは、いくつかの生物物理学的条件下において類似または重複するパラメータ値を有し得る核酸塩基を区別するのに役立つ。これは、核酸塩基を同じ環境で決定された既知の核酸塩基の署名と比較することによって該核酸塩基を同定することに役立つ。上述のように、核酸塩基の指紋を所与のｐＨで決定し、同じｐＨで得られた既知の核酸塩基の指紋と比較してもよい。他の環境では、指紋は、ｐＨ以外の特定の特質、例えば、モル濃度、極性、疎水性などを有する環境で決定してもよい。種々の実施形態では、核酸塩基は、アルコール、塩、または無極性溶媒もしくは溶質を所与の量で含む環境で決定してもよい。

本明細書に開示されているように、「トンネリング電流データ」または「電流データ」または「Ｉ−Ｖデータ」とは、種々のバイアス電圧にて量子トンネリングで測定した電流及び電圧（バイアス電圧）データのことを言う。トンネリング電流データは、トンネリング電流測定から得られたＩ−Ｖ、ｄＩ／ｄＶ、及び／またはＩ／Ｖ^２データのことを言う。ほとんどの場合、種々のパラメータまたは値は、トンネリング電流データから導出される。パラメータには、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）（後述）の値を含み得る。

本明細書に開示されているように、「署名」または「電子署名」とは、未知の同一性のヌクレオチドに対して回収されたＩ−Ｖデータから導出されたパラメータの３つまたはそれ以上の値のことを言う。署名の作成に使用されるパラメータには、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）が含まれ、このうちの任意の３つまたはそれ以上を用いて、署名を作成してもよい。例えば、いくつかの実施形態では、未知のヌクレオチドの電子署名は、ＬＵＭＯ、ＨＯＭＯ、及びバンドギャップの値を含み得る。他の実施形態では、電子署名は、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値を含み得る。

本明細書に開示されているように、「指紋」または「電子指紋」とは、既知の同一性のヌクレオチドに対して回収されたＩ−Ｖデータから導出されたパラメータの３つまたはそれ以上の値のことを言う。既知のヌクレオチドの指紋を作成するのに選択されたパラメータは、既知のヌクレオチドが比較される未知のヌクレオチドの署名を作成するのに選択されたものと同じである。電子署名の作成に用いた所与のパラメータ値は、値＋／−標準偏差もしくはある範囲の値として表してもよい。指紋の作成に用いるパラメータには、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）が含まれる。いくつかの実施形態では、未知の核酸塩基の電子署名には、ＬＵＭＯ、ＨＯＭＯ、及びバンドギャップの値を含み得、この署名は、既知の核酸塩基の電子指紋と比較してもよく、ここで、指紋は、同じパラメータ−ＬＵＭＯ、ＨＯＭＯ、及びバンドギャップの値を含む。他の実施形態では、署名は、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値を含み得、ＬＵＭＯ、ＨＯＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値を含む指紋と比較してもよい。

開示された技術を用いて、１つまたは複数のヌクレオチド、ヌクレオシド、または核酸塩基を含むポリ核酸、ポリヌクレオチド、及び他の高分子を配列決定してもよい。

多くの場合、炎焼なまし処理された平坦な、テンプレートを剥離した超平滑金（１１１）結晶ファセット基板を用いてもよい。ここでの指定（１１１）は、金原子の暴露上面の結晶構造を示す。この目的のために他の配向（例えば、１００）を用いてもよい。超平滑基板は、表面粗さが非常に低く、例えば、平面から約１．０ｎｍ未満の変動である。本明細書に記載されるのは、後述のように炎焼なまし及びテンプレート剥離処理を用いた超平滑基板を得る方法である。いくつかの実施形態では、他の基板を用いてもよい。いくつかの実施形態では、他の導電性基板、例えば、グラフェン、高配向熱分解黒鉛（ＨＯＰＧ）、金（または他の金属）を被覆した原子的に平坦な新たに劈開した雲母、銅（１１１）、銀などの他の超平滑金属を用いてもよい。多くの場合、基板は、走査及び量子トンネリング分光法の目的のために導電性でなければならず、かつ、単一分子を簡単に同定するために平滑でなければならない。

いくつかの実施形態では、ポリヌクレオチドは線状化ＤＮＡであってよく、ポリヌクレオチドは開示された超平滑基板上に引き延ばしてもよい。これは、個々のヌクレオチドを分離し、走査するためのこれらの配位エントロピーを減少させるのに役立つ。これは、糖骨格の代わりに、核酸塩基を介した荷電トンネリングの研究に役立つ。場合によっては、基板は、荷電基板であってもよい。例えば、基板が金の場合、正に帯電した金（１１１）表面を調製してもよい。

いくつかの実施形態では、正に帯電した金基板は、押出沈着技術を用いて作製される。まず、新たに調製した超平滑金（１１１）表面をプラズマ洗浄装置（例えば、オゾンプラズマ洗浄装置）で処理し、均一に負に帯電した表面を調製する。多くの実施形態では、金をイオン溶液、例えば、ポリ−Ｌ−リシンなどの正に帯電した分子で処理し、均一に被覆した正に帯電した金表面を作製してもよい。いくつかの実施形態では、押出沈着技術には、細長い線状ｓｓＤＮＡを金基板上に分散させるために３つの工程処理を伴う。第１の工程では、金（１１１）表面を化学溶液で処理することで帯電させてもよい。場合によっては、金表面をポリ−Ｌ−リシン、例えば、１０ｐｐｍポリ−Ｌ−リシン溶液で被覆することで正に帯電させてもよい。超平滑表面の被覆に使用される他の分子には、任意のポリカチオン性ポリマー、例えば、ポリアリルアミン塩酸塩、カテコールアミンポリマー、アミノシラン（アミノプロピルエトキシシラン）、またはエポキシド修飾シラン（３’グリシドキシプロピルトリムエトキシシラン）を含み得る。他の実施形態では、電圧を印加して基板に骨格を電子的に結合させることによって、糖骨格の負荷電の静電固定を行うことができる。場合によっては、化学溶液は、静電相互作用を介して負に帯電したリン酸骨格が正に帯電した基板に結合するのに役立つ。ポリヌクレオチドのの配列決定に用いた実施形態では、酸性条件は、ヌクレオチド、例えば、ピリミジン−ＣまたはＴ、及びプリン−ＧまたはＡの解析に役立つ。

押出沈着技術の第２の工程には、一本鎖ＤＮＡ（ｓｓＤＮＡ）を溶融させることを含み得る。例えば、ｓｓＤＮＡは、ｓｓＤＮＡを加熱することで、例えば、９５℃で５分間加熱することで溶融させてもよい。ほとんどの実施形態では、溶融させたｓｓＤＮＡを急冷することで、ｓｓＤＮＡ中に二次及び／または三次構造が形成または再形成されるのを防ぐのに役立つ。いくつかの実施形態では、急冷には、氷上で５分間フラッシュ冷却することを含み得る。多くの実施形態では、ｄｓＤＮＡ及び短いモノヌクレオチドｓｓＤＮＡは、三次構造を含まず；約１ｋｂよりも長いｓｓＤＮＡは、二次構造を形成し得る。多くの場合、正に帯電した表面は、二次構造の形成を分散または防止するのに役立つ。

押出沈着処理の第３の工程には、ｓｓＤＮＡを金基板上に押し出すことを含み得る。場合によっては、並進運動を用いて、ＤＮＡ分注装置、例えば、ピペットから荷電基板上に線状化ＤＮＡ鎖を沈着させ、引き延ばしてもよい。

いくつかの実施形態では、化学的にエッチングされたチップをナノ電子トンネリングに用いてもよい。いくつかの実施形態では、白金−イリジウムチップ（８０：２０Ｐｔ−Ｉｒ）を用いてもよい。他の実施形態では、他の適当なＳＴＭチップを用いてもよい。用いてもよい他のいくつかの汎用チップは、タングステン、金、炭素、及び白金金属である。汎用される他のチップは、Ｐｔ、Ｉ、Ｗ、Ａｕ、Ａｇ、Ｃｕ、カーボンナノチューブ、及びその組み合わせである。

公知及び未知のヌクレオチドは、ヌクレオチドを介して電子及び正孔をトンネリングすることで研究される。場合によっては、研究されるヌクレオチドは、図１ａ及び１ｂに示すように線状化された、一本鎖ポリヌクレオチドである。

トンネリング電流分光法（電流（Ｉ）−電圧（Ｖ））は、分子の局在電子状態密度（ｄＩ／ｄＶスペクトル、図１０及び以下により詳細に述べる）を直接測定してもよく、ヌクレオチドの生化学的構造（図１）に基づいて固有の電子指紋を提供するように作用する。

量子トンネリングを用いて分子分解能（図１０ａ）でのヌクレオチドの電子署名が得られる。場合によっては、電子状態密度（ＤＯＳ）は、電流−電圧（Ｉ−Ｖ）スペクトルの第１導関数、それぞれ、最低空分子軌道（ＬＵＭＯ）エネルギーレベル及び最高被占分子軌道（ＨＯＭＯ）エネルギーレベルとしてそれぞれ割り当てられた第１の著しい正ピーク及び第１の著しい負ピークから得てもよい。多くの場合、第１の著しいピークは、最大ｄＩ／ｄＶの少なくとも約３０％のピークであり、または、電流−電圧スペクトルの第１導関数（ここで、第１導関数は、電子及び正孔トンネリングの生体分子及び約±１．０Ｖを超える状態密度を表す）であってもよい。場合によっては、約±１．０Ｖ（０〜＋１．０Ｖまたは０〜−１．０Ｖ）未満で発生するピークは、導電性基板または環境からの軽微な汚染を示し得る。これらの第１ピーク間の差は、ＬＵＭＯ／ＨＯＭＯエネルギーギャップまたは「バンドギャップ」として割り当て（指定し）てもよい（図１０ｂ）。電子トンネリングピーク（ここでは、正バイアス電圧の印加時）は、分子のＬＵＭＯレベルに対応し、正孔トンネリングピーク（ここでは、負バイアス電圧の印加時）は、分子のＨＯＭＯレベルに対応する。ＬＵＭＯとＨＯＭＯレベルの間の差は、分子のエネルギーバンドギャップである。

各核酸塩基に固有のさらなる生物物理学的パラメータも、変曲点で過渡電圧（Ｖ_{ｔｒａｎｓ}）によって分離された２つの異なるトンネリングレジーム（直接トンネリング及びファウラー−ノルトハイムトンネリング）を用いて算出することができる。量子トンネリングの２つの主モデルを、シュレーディンガー方程式に適用したＷＫＢ近似に基づいて開発した。絶縁体によって分離された電極間のトンネリングのシモンズモデル（式１）は、両方のレジームでのトンネリング電流を記述しており、印加したバイアス電圧及び元々のトンネリングバリア効果に依存する。

ここで、φは、トンネリングバリアの形状が長方形から台形及び三角形に変化する際に、印加した電圧に比例する平均バリアハイトであり、ｍ^＊は有効電子質量であり、ｈは減少したプランク定数であり、ｄは平均トンネリング距離であり、Ａは有効トンネリング面積であり、ｑは素電荷であり、Ｖは印加したバイアス電圧である。モデルは、平均バリアハイト（φ）のみが必要である際に、トンネリングバリアの任意の形状に対して包括的である。

量子トンネリングに用いられる他の解析アプローチは、ＷＫＢ近似からも導出されるストラットンモデル（式２）に基づく。シモンズ及びストラットンモデルは両方とも同じ電流密度の記述から始まるが、異なる組の方程式を生成するトンネリング確率積分を解くために異なる近似を取った。量子トンネリングを記述するためのストラットン方程式は：

ここで、ｍは電子質量であり、ｋはボルツマン定数であり、Ｔは温度であり、ｂ（Ｖ）及びｃ（Ｖ）はトンネリング確率のテーラー展開から得られる２つのパラメータであり、以下のように定義される：
ここで、ａ＝２√２ｍ^＊／ｈ及びｘ_１並びにｘ_２は、トンネリングギャップの両側がφ−ξ＝０の位置であり、ξは電極のフェルミエネルギーであり、φはエネルギーバリア（ｘ及びＶに依存）である。

これらのパラメータは、トンネリング電流に依存した温度で実験的に適合することができるが、モデルは、ここで用いた配列決定条件を記述する際に、Ｉαｓｉｎｈ（ｑＶtｒ／ｈ）の形態に単純化した。この関係を用いて、ｌｎ（Ｉ／Ｖ^２）対Ｖ^−１プロット上の最小（Ｖ_{ｔｒａｎｓ}）を数パーセントの誤差内の以下の式として導出した：

シモンズモデルを用いて、高バイアス電圧（ｑＶ＞φ_０）に対する単純化したファウラー−ノルトハイム方程式を導出する。これは以下の形態を取る：

両方のモデルを組み合わせて、ＦＮプロットから直接抽出した実験データを用いて、元々のバリアハイト（φ_０）及び「有効」トンネリング距離（ｄ√ｍ^＊）を直接算出するための式を導出することができる：

ここで、Ｓは、高バイアス電圧（ｑＶ＞φ_０）で対応するｌｎ（Ｉ／Ｖ^２）対Ｖ^−１の勾配である。ストラットン及びシモンズは両方ともシュレーディンガー（ＷＫＢ）の同一近似を用いており、唯一の差はトンネリング確率積分の処理だけであることに留意されたい。ハートマンは、ＷＫＢ近似の厳密解に対して両方のモデルを比較し、ストラットン及びシモンズモデルは両方とも厳密解から数パーセントの誤差内である。両方のモデルを用いた近似によって、実験分光分析データを、両方のモデルの非線形性の取り扱いにくさによりさもなければ不可能であろういずれかのモデルに適合することができる。

この方法により、最大９つのパラメータ（ＨＯＭＯ電圧、ＬＵＭＯ電圧、エネルギーバンドギャップＶ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}、Φ_０，ｅ−、Φ_０，ｈ−、Δφ、及びｍ_{ｅｆｆｅ−}／ｍ_{ｅｆｆｈ＋}）を調べることでヌクレオチドを定量的に比較することができる。多くの実施形態では、署名は、少なくとも３つのパラメータの値を分析することによって決定される。ほとんどの実施形態では、３つを超えるパラメータを用いて署名を決定する。例えば、４つ、５つ、６つ、７つ、８つ、または９つのパラメータ値を用いて、同じパラメータ値を含む指紋と比較するための署名を決定してもよい。

ヌクレオチド指紋及び署名は、ヌクレオチドを量子トンネリングに提示し、その後、トンネリング電流データを回収し分析することによって決定される。多くの場合、量子トンネリングヌクレオチド指紋を作成するために、個々のヌクレオチド分子（例えば、アデニンの単一分子）上の約１５〜約５０点からトンネリング電流データを回収する。さらに、約２０個の異なる個々の分子の量子トンネリングデータを回収し、これは、ヌクレオチドの統計的に正確な指紋作成に役立つ。

ＤＮＡのいくつかの既知のヌクレオチドの確率密度曲線（電圧、Ｖ、またはエネルギー、ｅＶ、対確率密度関数（ｄＩ／ｄＶ））が決定されている。いくつかの確率密度曲線を図４ａ、４ｂ、４ｃ、４ｆ、８ｄ、８ｅ、１２、１４、１６、２１、２２、及び２４ｂに示す。これらの曲線は、独立した測定の統計分布であり、ガウス曲線（式Ｓ１、以下。Ｎｉ：規格化定数、Ｖ：印加したバイアス電圧、μｉ：平均、σｉ：標準偏差）の正規化合計に適合させている。

これらのパラメータに用いて、ＨＯＭＯレベル、ＬＵＭＯレベル、及びエネルギーギャップ（バンドギャップ）からなる所与のヌクレオチドの電子指紋を作成してもよい。多くの実施形態では、既知の核酸塩基の核酸塩基指紋を用いて、未知のヌクレオチドまたはポリヌクレオチドＤＮＡ分子から回収された量子トンネリング署名を分析し、ヌクレオチドの同一性及びポリヌクレオチドの配列を決定してもよい。

核酸生化学は、核酸が見られる環境によって定義してもよい。場合によっては、周囲のｐＨが、核酸、例えば、核酸塩基／ヌクレオチドの構造に影響を及ぼし得る。いくつかの実施形態では、ｐＨを変えることで、異なる構造をもつ核酸塩基が得られる場合がある。この効果は、図１１に示すように核酸塩基のｐＫ_ａの上及び／または下で起こり得る。さらに、酸−塩基挙動に加えて、他の生化学的変化も極端なｐＨ（酸性または塩基性のいずれか）で起こり得る。例えば、チミンは、エノール化Ｔがケト形よりも優位な酸性ｐＨで互変異性体を形成し得る。

ＤＮＡヌクレオチドの相対荷電により、システムｐＨに応じて電子または正孔トンネリングのいずれかを容易にすることができる。例えば、いくつかの実施形態では、正に帯電したＤＮＡヌクレオチド種により、正孔トンネリングを容易にし、電子トンネリング（ＬＵＭＯ）のエネルギーレベルを増すことができ、負に帯電した種は反対の挙動を示し得る（図１２、１４）。この効果は、２つのｐＫ_ａ（図１２）に沿ったグアニンヌクレオチドのスペクトルシフトで観察することができ、ここで、ヌクレオチドは、酸性ｐＨ下での正に帯電した構造と塩基性ｐＨ下での負に帯電した構造の間で遷移する。いくつかの実施形態では、静電相互作用は、従って、荷電トンネリングの確率を変化させる（電荷斥力を増加させる）ため、異なる（低い）ＬＵＭＯ及びＨＯＭＯレベルが得られる。

個々のヌクレオチドのトンネリング署名（または指紋）は、異なる環境条件下で、例えば、異なるｐＨ条件下で異なり得る。多くの場合では、ヌクレオチドを介した電子／正孔トンネリング電流は、異なる環境条件下で回収される。異なる環境条件下での量子トンネリング署名の違いは、場合によっては、核酸塩基のケト−エノール互変異性体の存在によるためであり、これは、（図１１及び以下に述べるように）異なるｐＨ条件下で異なり得る。特定のケト−エノール互変異性体の存在または不在により、異なる核酸塩基間、例えば、プリン（Ａ、Ｇ）とピリミジン（Ｃ、Ｔ）の間の電子／正孔トンネリング確率の分離をもたらすことがある。

ヌクレオチドの荷電密度は、これらの効果に対するエネルギー増大／減少を決定することに役立つ。場合によっては、いくつかの共役構造を有し得るプリンは、単一原子（図１１）上に局在した荷電を有し得るピリミジンと比較して著しく還元されている任意の原子上に局在電荷を有してもよい。いくつかの実施形態では、共役効果は、トンネリングエネルギーシフトに著しい影響を及ぼし、酸性条件（図４ｃ、１２、１４、１６）下で簡単に観察され、例えば、ここで、プリンは、ピリミジン（例えば、図１４のアデニンデータ）よりも著しく小さい効果を示す。

多くの場合、ＨＯＭＯ−ＬＵＭＯ及びエネルギーギャップパラメータの使用により、エネルギーギャップ（プリンＡ、２．７３ｅＶ及びＧ、２．５８ｅＶとピリミジンＣ、４．４３ｅＶ及びＴ、４．８２ｅＶとの間には約１．７〜２ｅＶの差がある）及びＬＵＭＯレベル（プリンＡ、１．６１Ｖ及びＧ、１．４９ＶとピリミジンＣ、３．１３Ｖ及びＴ、３．０８Ｖとの間には約１．５ｅＶの差がある）に基づいて酸性条件下でピリミジン（Ｃ、Ｔ）からプリン（Ａ、Ｇ）を区別するのに役立つ。いくつかの実施形態では、ＣとＴは、これらのＨＯＭＯエネルギーレベル差（Ｃ、−１．３０ＶとＴ、−１．７４Ｖとの間の約０．４５ｅＶの差）に基づいて区別またはデコンボリュートしてもよい。別の実施形態では、ＡとＧは、塩基性ｐＨでのこれらのＬＵＭＯレベル（Ａ、１．７２ＶとＴ、１．３３Ｖとの間の約０．４０ｅＶの差）を用いて識別／区別／デコンボリュートしてもよい。核酸塩基Ａ、Ｔ、Ｇ、及びＣの特徴的なＬＵＭＯ、ＨＯＭＯ、及びバンドギャップ値を表Ｉに示す。表Ｉは、中性、酸性、及び塩基性ｐＨ環境で決定されたこれらの値を示す。従って、いくつかの実施形態では、１つまたは複数のｐＨ値（酸性、塩基性、及び中性）でヌクレオチド上の量子トンネリングデータを回収し、そのヌクレオチドのＬＵＭＯ、ＨＯＭＯ、及びバンドギャップ値を決定し、既知の同一性のヌクレオチドに対して予め決定された値と比較することによって、未知のヌクレオチドの同一性を決定することができる。

グアニン：多くの場合、グアニンは、酸性条件（酸性ｐＨは、第１のｐＫ_ａ約３．２〜３．３未満である）、中性条件、及び塩基性条件（その第２のｐＫ_ａ約９．２〜９．６を上回る）で３つの異なる生化学的構造を示し得る。場合によっては、異性体の正孔捕獲により、ｐＨが増加する（酸性から、中性、塩基性条件に）につれて、ＨＯＭＯレベルの着実な増加をもたらすことがある（正孔をトンネルしにくくなる）。いくつかの実施形態では、酸性及び塩基性条件（図１１）での複数の共鳴構造により、中性条件と比べてより簡単な電子トンネリング（より低いＬＵＭＯレベル）をもたらすことがある。場合によっては、塩基性条件（ｐＫａ_２による）でのさらなる静電反発力は、電子トンネリング確率を改善し、塩基性ｐＨのＬＵＭＯレベルのさらなる低下をもたらすことがある。

アデニン：多くの場合、アデニンは、任意のｐＨ条件（荷電及び非荷電の両方）で複数の共鳴構造を示し得る。ほとんどの場合、ｐＨ変化は、アデニンのトンネリング確率に著しい影響を及ぼさない。場合によっては、このｐＨ効果の欠如は、共鳴構造の間の荷電の消散によるものであろう。場合によっては、アデニンは、ｐＨの増加に伴うＨＯＭＯレベルの増加を示し得、場合によっては、酸性ｐＨ（正荷電による）で正孔トンネリングがより容易になることによるものであり得る。

シトシン：多くの実施形態では、シトシンは、２つの主要構造で異なるｐＨ効果を有し得る。例えば、いくつかの実施形態では、シトシンは、そのｐＫ_ａ約４．４を上回り、中性と塩基性条件の間では差は見られない。他の場合では、シトシンが酸性条件下でプロトン化形態である場合、電子捕捉効果を示し、ＬＵＭＯエネルギーレベルの増加をもたらすことがある。

種々の核酸塩基を識別／区別するために、トンネリング電流データを他の方法で分析してもよい。いくつかの実施形態では、ファウラー−ノルトハイム（Ｆ−Ｎ）プロットを用いてトンネリング電流を分析してもよい。これらのプロットは、単一ヌクレオチドを介したかまたはポリヌクレオチドの個々のヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定することに役立つ。トンネリング電流（Ｉ）−電圧（Ｖ）データをｌｎ（Ｉ／Ｖ^２）対（１／Ｖ）としてプロットしてもよい。いくつかの実施形態では、このプロットは、過渡電圧（Ｖ_{ｔｒａｎｓ}）及びトンネリングレジーム（三角形バリア）の勾配を抽出するのに役立つ。Ｖ_{ｔｒａｎｓ}は、Ｆ−Ｎプロット上の最小値（異なるレジーム間の遷移点に等しい）として決定される。Ｓは、高バイアス（１／Ｖの小さい値）でのＦ−Ｎプロットの勾配である。この値は、電子トンネリングには負勾配をとり、正孔トンネリングには正勾配をとる。図４ｅは、ヌクレオチドＴのＦ−Ｎプロットの一例である。場合によっては、過渡電圧Ｖ_{ｔｒａｎｓ，ｅ−}は、トンネリングから電界放射レジームへの遷移を表し、勾配Ｓは、トンネリングバリア（ここでは、電子）の尺度である。場合によっては、ヌクレオチド配列を介した電子（Ｖ_{ｔｒａｎｓ，ｅ−}）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）トンネリングのこれらの生物物理学的パラメータは、電子署名の構成要素を同定することを表し、ＨＯＭＯ−ＬＵＭＯ及びバンドギャップ値と同じように用いて、未知のヌクレオチド及びポリヌクレオチド配列を特徴付けし、同定してもよい。

場合によっては、Ｖ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}値を用いて、異なる環境条件下で、例えば、ｐＨで異なる核酸塩基を区別してもよい。場合によっては、酸性、中性、及び塩基性条件下で決定されたＶ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}値を用いて、２つまたはそれ以上の核酸塩基を区別してもよい。多くの実施形態では、１つまたは複数のパラメータを用いることで、２つまたはそれ以上の核酸塩基を区別するのに役立つ。場合によっては、パラメータをＶ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}、Ｓ、ＨＯＭＯ、ＬＵＭＯ、またはバンドエネルギー（バンドギャップ）値から選択してもよい。多くの実施形態では、パラメータを１つまたは複数の異なる条件下、例えば、酸性、中性、または塩基性条件下で決定してもよい。

多くの場合、トンネリングから電界放出への過渡電圧、及び荷電トンネリングのバリアを示す勾配などのトンネリングデータの分析から追加のパラメータを抽出してもよい。これらのトンネリング定数、Ｖ_{ｔｒａｎｓ，ｈ＋}、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｓ＝Ｓ_ｅ＋Ｓ_ｈ（ここで、Ｓ_ｅ＝Ｓ電子トンネリング、Ｓ_ｈ＝正孔トンネリング）は、電荷がトンネリングする分子の特徴であってもよい。場合によっては、これらのパラメータを、個々のヌクレオチドに対して決定し、これらの区別に役立ててもよい。いくつかの実施形態では、これらのパラメータをＨＯＭＯ−ＬＵＭＯ及びバンドギャップ値と組み合わせて、核酸塩基同一性の決定及びヌクレオチド指紋の作成に役立ててもよい。いくつかの実施形態では、Ｖ_{ｔｒａｎｓ，ｈ＋}を用いた正孔トンネリング確率の変化の決定をＨＯＭＯレベルのように用いて、異なるｐＨ条件下でヌクレオチドの同一性を決定することができる。

さらに、ファウラー−ノルトハイムプロットを用いて、電子及び正孔（Ｖ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}）両方のトンネリング過渡電圧、及びエネルギーバリア（Ｓ）（図４ｅ及び表ＩＩＩ）を同定することができる。同時に、最大６つのパラメータ（Ｖ_ＨＯＭＯ、Ｖ_ＬＵＭＯ、エネルギーギャップ、Ｓ、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}）を用いて、単一ヌクレオチドの同一性を同定し、有効にすることができる。

多くの実施形態では、酸性環境は、区別可能なヌクレオチド異性体の形成に役立つ。Ａ、Ｇ、Ｔ、及びＣのｐＫａは、それぞれ、約４．１、３．３、９．９、及び４．４である。多くの場合、酸性環境を用いて、バンドギャップ、ＨＯＭＯ、ＬＵＭＯ、Ｖ_{ｔｒａｎｓ}、及びＳ値（図４ａ、４ｂ、４ｅ、４ｆ）を用いて単一ヌクレオチドを再現性良く配列決定することができる。いくつかの実施形態では、酸性ｐＨ下で行った単一ＳＴＭ−ＳＴＳ測定を用いて、一本鎖ＤＮＡ（ＳＴＭを用いて）及び単一ヌクレオチド（ＳＴＳデータを用いて、図５ａにＡを示し、図２２にＴ、Ｇ、Ｃを示す）を配列決定してもよい。他の実施形態では、複数のｐＨ環境下で行った複数のＳＴＭ−ＳＴＳ測定を用いて、一本鎖ＤＮＡ及び単一ヌクレオチドを配列決定してもよい。いくつかの実施形態では、開示された方法によりＤＮＡ及び／またはヌクレオチド同一性を決定する時間尺度は、秒または分のオーダーであってもよい。

多くの実施形態では、開示された技術は、約８５％、９０％、９５％、９６％、９７％、または９９％精度を超えてポリヌクレオチドを配列決定することができる。いくつかの実施形態では、本願技術を用いて、約３０ｎｔ、４０ｎｔ、５０ｎｔ、６０ｎｔ、７０ｎｔ、８０ｎｔ、９０ｎｔ、１００ｎｔ、２００ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔ、１ｋｎｔ、２ｋｎｔ、３ｋｎｔ、４ｋｎｔ、５ｋｎｔ、または１０ｋｎｔを超えるポリヌクレオチドを配列決定してもよい。多くの場合、開示された技術を用いて、ポリヌクレオチドの３’−＞５’順序を決定することができる。場合によっては、一本鎖ＤＮＡの末端を標識することで、３’−＞５’指向性を決定してもよい。いくつかの実施形態では、３’または５’末端を標識する。例えば、特定の５’または３’末端特異的プライマータグをもつリガーゼ、例えば、Ｔ４リガーゼを用いて、標識を達成してもよい。ライゲーション工程により、５’−または３’−末端をマークしたテンプレートを作成してもよい。場合によっては、標識末端近くの配列が分かっている。開示された配列決定法を用いて、既知の配列は標識によって同定され、これにより、未知のＤＮＡ試料の指向性が明らかになるであろう。

開示された方法に用いて、修飾核酸塩基を区別し、同定してもよい。いくつかの実施形態では、本開示の技術に用いて、天然、合成、及び／または、修飾のヌクレオチド及び核酸塩基を含むヌクレオチド及び核酸塩基を区別し、同定してもよい。天然のヌクレオチドは、アデニン、グアニン、シトシン、チミン、ウラシル、及びイノシンを含む修飾及び未修飾の核酸塩基を含み得る。いくつかの実施形態では、開示された方法を用いて、２’ＯＨ基をもつリボース糖を含む他のＡ、Ｕ、Ｇ、ＣＲＮＡ塩基の同一性を決定してもよい。場合によっては、核酸塩基を、例えば、メチル化によって修飾してもよい。いくつかの実施形態では、ＲＮＡ、ＤＮＡ、及び／または糖骨格で用いた種々の追加の化学修飾を検出することができる。いくつかの実施形態では、開示された方法を用いて、１−メチル−７−ニトロイサト酸無水物、またはベンゾイルシアニド、または他の求電子試薬、ジヒドロキシ−３−エトキシ−２−ブタノン（ケトキサール）、ＣＭＣＴ（１−シクロヘキシル−（２−モルホリノエチル）カルボジイミドメト−ｐ−トルエンスルホネート）、または脱アミノ化塩基、例えば、亜硫酸水素塩による脱アミノ化を検出してもよい。メチル化核酸塩基には、メチルシトシン、メチルアデニン、メチルグアニン、メチルウリジン、メチルイノシン、５−メチルシトシン、５−ヒドロキシメチルシトシン、７−メチルグアノシン、Ｎ６−メチルアデノシン、及びＯ６−メチルグアニンが含まれる。

開示された組成物、方法、及び技術を用いて、種々の分子の電子署名を決定してもよい。場合によっては、分子はヌクレオチドまたは核酸塩基であってもよい。多くの実施形態では、開示された技術及び組成物は、これらの電子状態密度に基づいて分子を同定し、区別してもよい。いくつかの実施形態では、電子状態密度は、トンネリング分光法（相関ＳＴＭ−ＳＴＳ）を用いて決定される。いくつかの実施形態では、異なる電子署名は、ｐＨ環境に応じて分子ごとに同定可能であり、かつ、異なっていてもよい。多くの場合、ヌクレオチドは、酸性、塩基性、及び／または中性条件下で分析してもよい。いくつかの実施形態では、ヌクレオチド及びこれらの対応する互変異性体構造の酸−塩基挙動は、未知のヌクレオチドの同定に役立つ。

ポリマー鎖、特に、ポリヌクレオチドの検出及び配列決定に役立たせるために、本開示の技術を自動化してもよい。いくつかの実施形態では、高分解能ＳＴＳを用いて単一鎖を配列決定し、単一ヌクレオチド分解能をもつ高速単一分子配列決定を提供してもよい。開示された技術は、単一ヌクレオチド及び修飾の高速で、安価で、正確で、無酵素で、かつ高スループットな同定を開発し、生物医学的応用における次世代の配列決定技術の代替手段を提供することができる。

本願の技術、方法、デバイス、及び組成物を用いて、基板上のポリヌクレオチドの配列決定をしてもよい。場合によっては、基板は金（１１１）である。いくつかの実施形態では、基板は、マイクロ流体チャネルまたはウェルを形成する。いくつかの実施形態では、マイクロ流体チャネルまたはウェルは、超平滑基板、例えば、金（金（１１１））で被覆される。多くの実施形態では、複数のポリヌクレオチドを、開示された技術を用いて別個のチャネルまたはウェルで同時に配列決定してもよい。多くの場合、マイクロ流体ウェルは、ポリヌクレオチド、例えば、一本鎖ポリヌクレオチドをマイクロ流体チャネルに供給してもよく、ここで、開示された技術を用いてポリヌクレオチドの配列決定をする。

単一ＳＴＭチップ及び単一金（１１１）基板を用いて低濃度のＤＮＡまたはＲＮＡの配列決定をしてもよいため、複数のマイクロ流体チャネル及びウェル並びに複数のＳＴＭチップを用いて、複数のポリヌクレオチド（ＲＮＡまたはＤＮＡ分子）を開示された基板上で同時に押し出し、配列決定してもよい。この高速で、高スループットで、無酵素な、単一分子ＤＮＡ配列決定技術の作業コストは非常に低い。単純金基板では、全ゲノム配列を単一基板上に作ることができ、全配列決定にかかる作業コスト（数十ドルに）及び時間（数時間または数分）が大幅に減少する。いくつかの実施形態では、多くの個々の単一ポリヌクレオチドを同時に配列決定する場合、時間を数時間未満に減少させることができる。

本開示はさらに、核酸塩基、ヌクレオシド、及び／またはヌクレオチドのトンネリング電流データを取得することと；トンネリング電流データから少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの電子署名を導出することと、ここで、電子署名は、ＨＯＭＯ（ｅＶ）値、ＬＵＭＯ（ｅＶ）値、バンドギャップ（ｅＶ）値、Ｖｔｒａｎｓ_＋（Ｖ）値、Ｖｔｒａｎｓ_＋（Ｖ）値、φ_ｅ−（ｅＶ）値、φ_ｈ＋（ｅＶ）値、ｍ_ｅ−／ｍ_ｈ＋値、及びΔφ（ｅＶ）値からなる群から選択され；少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの電子署名を一連の対応する電子指紋参照値にマッチングさせることと；それによって、核酸塩基、ヌクレオシド、及び／またはヌクレオチドを同定することを含む、核酸塩基、ヌクレオシド、及び／またはヌクレオチドの同定方法を提供する。ここで、デオキシアデノシンは、ＨＯＭＯ（ｅＶ）値が−１．３９±０．３であり；ＬＵＭＯ（ｅＶ）値が１．４２±０．２４であり；バンドギャップ（ｅＶ）値が２．８１±０．４１であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．１４±０．２であり；Ｖｔｒａｎｓ_＋（Ｖ）値が−０．５１±０．３２であり；φ_ｅ−（ｅＶ）値が１．４５±０．５７であり；φ_ｈ＋（ｅＶ）値が１．０３±０．６１であり；ｍ_ｅ−／ｍ_ｈ＋値が０．２９±０．２３であり、Δφ（ｅＶ）値が２．４８±０．９８である一連の対応する電子指紋参照値を含み；アデノシンは、ＨＯＭＯ（ｅＶ）値が−１．４４±０．２であり；ＬＵＭＯ（ｅＶ）値が１．４７±０．２１であり；バンドギャップ（ｅＶ）値が２．９±０．２７であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．２６±０．２６であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．６３±０．２３であり；φ_ｅ−（ｅＶ）値が２．０６±０．７２であり；φ_ｈ＋（ｅＶ）値が１．２５±０．５９であり；ｍ_ｅ−／ｍ_ｈ＋値が０．４３±０．１７であり、Δφ（ｅＶ）値が３．３±０．９３である一連の対応する電子指紋参照値を含み；メチル化デオキシアデノシンは、ＨＯＭＯ（ｅＶ）値が−２．０４±０．２８であり；ＬＵＭＯ（ｅＶ）値が２．０６±０．３７であり；バンドギャップ（ｅＶ）値が４．１±０．２５であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．４７±０．３７であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．９１±０．２７であり；φ_ｅ−（ｅＶ）値が１．６±０．３６であり；φ_ｈ＋（ｅＶ）値が１．２８±０．４１であり；ｍ_ｅ−／ｍ_ｈ＋値が１．２１±０．９８であり、Δφ（ｅＶ）値が２．８７±０．７４である一連の対応する電子指紋参照値を含み；デオキシグアノシンは、ＨＯＭＯ（ｅＶ）値が−１．３６±０．１９であり；ＬＵＭＯ（ｅＶ）値が１．４８±０．２４であり；バンドギャップ（ｅＶ）値が２．８４±０．２７であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．１３±０．１３であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．４８±０．２９であり；φ_ｅ−（ｅＶ）値が１．３３±０．３であり；φ_ｈ＋（ｅＶ）値が０．７９±０．５であり；ｍ_ｅ−／ｍ_ｈ＋値が０．３２±０．２５であり、Δφ（ｅＶ）値が２．１２±０．６５である一連の対応する電子指紋参照値を含み；グアノシンは、ＨＯＭＯ（ｅＶ）値が−１．４±０．３１であり；ＬＵＭＯ（ｅＶ）値が１．４７±０．１９であり；バンドギャップ（ｅＶ）値が２．８６±０．３１であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．１３±０．１７であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．５９±０．１５であり；φ_ｅ−（ｅＶ）値が１．９７±０．４４であり；φ_ｈ＋（ｅＶ）値が１．０７±０．４４であり；ｍ_ｅ−／ｍ_ｈ＋値が０．５４±０．１９であり、Δφ（ｅＶ）値が３．０４±０．７２である一連の対応する電子指紋参照値を含み；メチル化デオキシグアノシンは、ＨＯＭＯ（ｅＶ）値が−２．２４±０．４２であり；ＬＵＭＯ（ｅＶ）値が２．３±０．６４であり；バンドギャップ（ｅＶ）値が４．５３±０．８５であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．５±０．４６であり；Ｖｔｒａｎｓ_＋（Ｖ）値が−１．３３±０．５５であり；φ_ｅ−（ｅＶ）値が３．２９±１．３６であり；φ_ｈ＋（ｅＶ）値が３．２５±１．６９であり；ｍ_ｅ−／ｍ_ｈ＋値が１．１３±０．７２であり、Δφ（ｅＶ）値が６．５４±２．９８である一連の対応する電子指紋参照値を含み；デオキシシチジンは、ＨＯＭＯ（ｅＶ）値が−１．８１±０．３４であり；ＬＵＭＯ（ｅＶ）値が２．３９±０．４であり；バンドギャップ（ｅＶ）値が４．２±０．４９であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．３４±０．３１であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．８±０．２６であり；φ_ｅ−（ｅＶ）値が２．６２±０．８９であり；φ_ｈ＋（ｅＶ）値が１．５７±０．６３であり；ｍ_ｅ−／ｍ_ｈ＋値が０．６４±０．３１であり、Δφ（ｅＶ）値が４．１９±１．１７である一連の対応する電子指紋参照値を含み；シチジンは、ＨＯＭＯ（ｅＶ）値が−１．４±０．２４であり；ＬＵＭＯ（ｅＶ）値が２．２±０．２２であり；バンドギャップ（ｅＶ）値が３．６±０．２５であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．５９±０．２８であり；Ｖ_{ｔｒａｎｓ−}（Ｖ）値が−０．５９±０．３３であり；φ_ｅ−（ｅＶ）値が３．１７±０．６３であり；φ_ｈ＋（ｅＶ）値が１．２３±０．６８であり；ｍ_ｅ−／ｍ_ｈ＋値が０．３９±０．２５であり、Δφ（ｅＶ）値が４．４±１である一連の対応する電子指紋参照値を含み；メチル化デオキシシチジンは、ＨＯＭＯ（ｅＶ）値が−２．７８±０．３９であり；ＬＵＭＯ（ｅＶ）値が２．６２±０．５９であり；バンドギャップ（ｅＶ）値が５．４±０．３６であり；Ｖ_{ｔｒａｎｓ＋}（Ｖ）値が１．６２±０．３７であり；Ｖｔｒａｎｓ₋（Ｖ）値が−１．８９±０．２９であり；φ_ｅ−（ｅＶ）値が３．０７±０．８であり；φ_ｈ＋（ｅＶ）値が３．４±１．１３であり；ｍ_ｅ−／ｍ_ｈ＋値が１．１８±１．４６であり、Δφ（ｅＶ）値が６．４６±１．８９である一連の対応する電子指紋参照値を含み；チミジンは、ＨＯＭＯ（ｅＶ）値が−１．３８±０．１９であり；ＬＵＭＯ（ｅＶ）値が２．６８±０．３であり；バンドギャップ（ｅＶ）値が４．０６±０．３２であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．４３±０．３７であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．４４±０．１９であり；φ_ｅ−（ｅＶ）値が２．７５±０．６９であり；φ_ｈ＋（ｅＶ）値が０．８５±０．４であり；ｍ_ｅ−／ｍ_ｈ＋値が０．３３±０．１７であり、Δφ（ｅＶ）値が３．６１±０．７３である一連の対応する電子指紋参照値を含み；及びウラシルは、ＨＯＭＯ（ｅＶ）値が−１．５１±０．２５であり；ＬＵＭＯ（ｅＶ）値が２．０４±０．２５であり；バンドギャップ（ｅＶ）値が３．５４±０．３１であり；Ｖｔｒａｎｓ_＋（Ｖ）値が１．５３±０．３４であり；Ｖｔｒａｎｓ₋（Ｖ）値が−０．９±０．３６であり；φ_ｅ−（ｅＶ）値が３．７１±１．３６であり；φ_ｈ＋（ｅＶ）値が１．９８±１．０９であり；ｍ_ｅ−／ｍ_ｈ＋値が０．６８±０．２９であり、Δφ（ｅＶ）値が５．６８±１．６１である一連の対応する電子指紋参照値を含む。

本開示はさらに、ヌクレオシドのトンネリング電流データを取得することと、ここで、核酸塩基、ヌクレオシド、及び／またはヌクレオチドの同一性は公知であり；トンネリング電流データから少なくとも１つ、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの電子署名を導出することと；電子署名から一連の電子指紋参照値を開発することと、ここで、一連の電子指紋参照値は、核酸塩基、ヌクレオシド、及び／またはヌクレオチドを同定することができる、核酸塩基、ヌクレオシド、及び／またはヌクレオチドの一連の電子指紋参照値の開発方法を提供する。

別の態様では、一連の電子指紋参照値は、第２の核酸塩基、ヌクレオシド、及び／またはヌクレオチドから第１の核酸塩基、ヌクレオシド、及び／またはヌクレオチドを区別することができ、ここで、第１の核酸塩基、ヌクレオシド、及び／またはヌクレオチド、並びに第２の核酸塩基、ヌクレオシド、及び／またはヌクレオチドは、異なるヌクレオシドである。

別の態様では、電子署名は、ＨＯＭＯ（ｅＶ）値、ＬＵＭＯ（ｅＶ）値、バンドギャップ（ｅＶ）値、Ｖｔｒａｎｓ_＋（Ｖ）値、Ｖｔｒａｎｓ₋（Ｖ）値、φ_ｅ−（ｅＶ）値、φ_ｈ＋（ｅＶ）値、ｍ_ｅ−／ｍ_ｈ＋値、及びΔφ（ｅＶ）値からなる群から選択される。

別の態様では、一連の電子指紋参照値は、ＨＯＭＯ（ｅＶ）値、ＬＵＭＯ（ｅＶ）値、バンドギャップ（ｅＶ）値、Ｖｔｒａｎｓ_＋（Ｖ）値、Ｖｔｒａｎｓ₋（Ｖ）値、φ_ｅ−（ｅＶ）値、φ_ｈ＋（ｅＶ）値、ｍ_ｅ−／ｍ_ｈ＋値、及びΔφ（ｅＶ）値からなる群から選択される。

本開示はさらに、核酸配列の決定方法を提供し、ここで、核酸配列は、ＤＮＡ、修飾ＤＮＡ、ＲＮＡ、修飾ＲＮＡ、ＰＮＡ、修飾ＰＮＡ、及びそのいずれかの組み合わせからなる群から選択され、核酸配列は、核酸塩基及び帯電した骨格を含む。

開示された技術を用いて、剥離した金基板を用いた大規模並列配列決定を提供してもよい。１つの実施形態では、テンプレート剥離を用いて基板を調製し、テンプレートを剥離した金基板を用いて大規模並列ＳＴＭイメージングを行ってもよい。１つの実施形態では、光リソグラフィの後に、ＫＯＨエッチングなどの異方性エッチングを用いて、チップを光学的に作成してもよい。
実施例
実施例１−ＬＵＭＯ、ＨＯＭＯ、及びバンドギャップ値

フレームアニール処理した平坦な、テンプレートを剥離した超平滑金（１１１）基板（以下を参照されたい）。基板から引き延ばされたヌクレオチドをもつ線状化ＤＮＡを調製するため（糖骨格の代わりに核酸塩基を介した荷電トンネリングを試験するため）、正に帯電した金（１１１）表面を調製し、以下で詳述する新規の押出沈着技術で用いるために開発した（図１ａ）。
ＳＴＭ基板調製

フレームアニール処理された金（１１１）表面をテンプレート剥離によって得た。一般のテンプレート剥離処理では、熱的に蒸発させた金（Ａｕ）フィルムをシリコン（１００）上でフレームアニール処理し、または他のインデックスマッチした基板（金（１１１）をＳｉ（１００）に４５°の配向で形成し、金（１１１）配向を生成した。金被覆は洗浄したシリコン基板に接着しないため、エポキシ、電着させた金属、または金に接着し得る他のポリマーフィルムを用いて剥離することができる。剥離したフィルムにより、原子的に平坦な（平坦なシリコンウェハの滑らかさを模倣する）金（１１１）基板が明らかになる（Ｎａｇｐａｌら、Ｓｃｉｅｎｃｅ．３２５，５９４，２００９に記載）。剥離した直後、表面をＯ_３プラズマで２分間処理し（ＪｅｌｉｇｈｔＣｏｍｐａｎｙＩＮＣＵＶＯＣｌｅａｎｅｒＭｏｄｅｌＮｏ．４２）、（正に帯電した高分子電解質を吸着させるために）表面を均一に負に帯電させた。裸の金試料では、まず、５００μｌの０．１ＭＨＣｌ、０．１ＭＮａ_２ＳＯ_４、または０．１ＭＮａＯＨを表面上に添加し、圧縮空気で乾燥させた。その後、１μｌのＤＮＡ溶液（オリゴマーまたはａｍｐＲのいずれか）を表面上で並進運動で伸長し、乾燥させた。ポリ−Ｌ−リシン試料では、２５μｌの１０ｐｐｍ溶液（分子量７０，０００〜１５０，００ｇ／ｍｏｌ、Ｓｉｇｍａ，ＵＳＡから購入）を、清浄化した金基板上に添加した後、室温で５分間インキュベーションし、５００μｌの再蒸留水で洗浄し、圧縮空気で乾燥させた。ＳＴＭ−ＳＴＳのＤＮＡ試料を上述のように調製した。さらに、試料を同じ濃度の５００μｌの水、酸、または塩基で洗浄し、圧縮空気で乾燥させた。
ＳＴＭのｓｓＤＮＡオリゴマー及びｓｓＤＮＡａｍｐＲＤＮＡ

一本鎖オリゴマー（ポリ（ｄＡ）_１５、ポリ（ｄＣ）_１５、ポリ（ｄＧ）_１５、ポリ（ｄＴ）_１５）をＩｎｖｉｔｒｏｇｅｎ、ＵＳＡから購入した。ＤＮＡオリゴマーを０．１ＭＮａ_２ＳＯ_４溶液中に２０μΜの濃度で溶解させ、使用するまで−２０℃で保存した。ＮａｎｏＤｒｏｐ２０００分光光度計（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いてＤＮＡ濃度を測定した。
配列決定用のＤＮＡ鎖を線状化するための押出沈着技術

金基板上で細長い線状ｓｓＤＮＡを分散させるため、３工程の手順を行った。第１に、金（１１１）表面に上述のように１０ｐｐｍポリ−Ｌ−リシン溶液によって被覆させることで、金（１１１）表面を正に帯電させた。第２に、ｓｓＤＮＡを９５℃で５分間溶融させた後、氷上で５分間フラッシュ冷却した。場合によっては、ｄｓＤＮＡ及び短いモノヌクレオチドｓｓＤＮＡ鎖は三次構造を含まないが、１ｋｂ長のｓｓＤＮＡは二次構造を形成することができる。一般に、溶融させることにより、ＤＮＡ上の二次構造を除去するのに役立ち、正に帯電した表面の使用により、二次構造を分散させるのに役立つ。表面上の正電荷は、静電相互作用を介してリン酸骨格に結合するポリ−Ｌ−リシンペプチドによって提供された。ほとんどの場合、例えば、配列決定の目的のため、酸性条件を用いて、４つのヌクレオチド−ＣまたはＴ及びプリン−ＧまたはＡをデコンボリュートする／区別する／識別することができる。第３に、ｓｓＤＮＡ分散（１〜５ｎＭ）を修飾金（１１１）表面上に並進運動で押し出し、線状化ＤＮＡ鎖（図２３、後述）を形成した。ポリヌクレオチドを異なる状況で押し出した。特定の例として、２つの実施形態：ピペットチップ（０．１〜１μｌ）を用いて、沈着させながら並進運動を徐々に適用する実施形態と；マイクロ流体を用いる実施形態について説明し、ここで、ポリヌクレオチドを片面に添加し、毛細管力によりナノ／マイクロチャネルを介してポリヌクレオチドを押し出した。

ＤＮＡを正に帯電した金表面上に沈着させた後、押出運動によって、負に帯電したリン酸骨格と正に帯電した表面との相互作用によりＤＮＡを金表面上に固定化することができる。この相互作用は、原子的に平坦な金の上部にヌクレオチドを暴露させ、これらのＳＴＳスペクトルの測定を用いてのヌクレオチドの配列決定をすることができる。この方法により、ｓｓＤＮＡを線状化することで二次構造を減少させるだけでなく、ノイズ及びバックグラウンド信号をリボース糖及びリン酸骨格から減少させる。

ポリ−Ｌ−リシンによる表面修飾は、両方の間の類似のエネルギーギャップを保ちながら、ＬＵＭＯレベルのエネルギーを低下させ、ＨＯＭＯレベルのエネルギーを増加させるという一般的な効果を有した。この効果は、表面の相対ｐＨを増加させるリシン残基の僅かな塩基成分によるものである。

化学的にエッチングされた白金−イリジウムチップ（８０：２０Ｐｔ−Ｉｒ）を用いて、相関したＳＴＭ及びＳＴＳ研究を、線状化ＤＮＡヌクレオチド（図１ａ及び図３ａ、３ｂ）を介した電子及び正孔のトンネリングによって行った。トンネリング電流分光データ（電流（Ｉ）−電圧（Ｖ））は、分子の局在電子状態密度（ｄＩ／ｄＶスペクトル、図１０及び上の説明）の直接測定であり、ヌクレオチドの生化学的構造（図１及び図３ａ、３ｂ）に基づいて固有の電子指紋を作成するのに役立つように作用する。種々のＤＮＡヌクレオチドの異なるトンネリング署名を同定するため、ヌクレオチドを介した電子／正孔トンネリングを異なるｐＨ条件下で調べた。異なるｐＨ条件下（図１１及び後述）での核酸塩基のケト−エノール互変異性体の存在により、プリン（Ａ、Ｇ）とピリミジン（Ｃ、Ｔ）の間の電子／正孔トンネリング確率を分離するのに役立ち、これら２つのグループを区別するのに役立つ。
イメージング及び分光法

ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、ＵＳＡから購入した化学的にエッチングされたＰｔ−Ｉｒチップ（８０：２０）を用いて、走査トンネリング顕微鏡画像を修飾分子イメージングＰｉｃｏＳＰＭＩＩで得た。機器を室温及び大気圧下で操作した。トンネリング接合パラメータを１００ｐＡのトンネリング電流及び０．１Ｖの試料バイアス電圧で設定した。高電流／電圧によるＤＮＡ試料の劣化を避けるために、前述の接合パラメータによって９０Ｖ／ｓの走査速度で分光法測定を得た。電流−電圧（Ｉ−Ｖ）スペクトルの情報を含む走査トンネリング分光データを用いて、Ｍａｔｌａｂによってその導関数ｄＩ／ｄＶを得た。ｄＩ／ｄＶは、以下に述べるように電子局所状態密度に比例する。ＬＵＭＯ及びＨＯＭＯレベルのエネルギーバンド割り当ては、第１の著しい正及び負ピークをそれぞれスペクトル上に割り当てることで行った（図１０）。ＬＵＭＯ値とＨＯＭＯ値の間のエネルギー差は、電子ＬＵＭＯ−ＨＯＭＯエネルギーバンドギャップを定義する。各ヌクレオチドは、プリン及びピリミジン間の一次同定のＨＯＭＯ／ＬＵＭＯ及びエネルギーギャップに基づいて割り当てた。Ｃ及びＴの同定は、これらのＬＵＭＯ及びＨＯＭＯレベル差に基づくものであった。

各ピクセルに対応するＸ−Ｙ位置を用いて、データポイント間の距離を算出した。この情報も用いて、各ヌクレオチドが約０．６５ｎｍのサイズを有する際に、配列に割り当てた。ヌクレオチド配列の空間的測定に基づいて、２つの隣接測定間の距離をｎｍで算出し、０．６５で割った。そのため、各測定は隣接ヌクレオチドに対応し、位置はその順序の算出のためにのみ用いた。従って、量子分子配列決定走査を用いて配列を同定した。まず、各ヌクレオチドに対して、生物物理学的パラメータ、例えば、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、過渡電圧（正及び負）、電子／正孔有効質量の比率、電子及び正孔のφ_０、及びΔφ_０を同定した。参照ライブラリ（よく特徴付けられた既知の配列、例えば、修飾を欠いたホモポリヌクレオチドからのトレーニングセット上で決定された）からの同定したパラメータを用いて、機械学習モデルを参照として構築した。その後、未知のスペクトルを処理してパラメータを抽出し、それらをトレーニングセットと比較して、各個々のグループの確率をトレーニングセットから同定した。最も高い確率をもつグループを元々のスペクトルに割り当て、配列アラインメントに用いる。この方法により配列を同定することができる。注釈付き配列（ここでは、例えば、ａｍｐＲ）に対して同定された配列決定の精度を確認するため、基本ローカルアラインメント検索ツール（ＢＬＡＳＴ）を用いて、同定した配列を、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙｉｎｆｏｒｍａｔｉｏｎ（寄託番号ＥＦ６８０７３４．１、ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｎｕｃｃｏｒｅ／ＥＦ６８０７３４．１にて入手）にて入手したａｍｐＲ配列と比較した。この場合、測定した配列を参照に整列させるためにＢＬＡＳＴを用いる。配列アラインメントに加えて、得られたデータを用いて、新規の配列アノテーションにデノボアセンブルすることもできる。

密度関数理論シミュレーション：図２に示し、かつ、Ｐｈｙｓ．Ｒｅｖ．１４０，Ａ１１３３，Ｃ．Ｃ．Ｊ．ＲｏｏｔｈａａｎＲｅｖ．Ｍｏｄ．Ｐｈｙｓ．２３，６９−８９，及びＪ．Ｃｏｍｐｕｔ．Ｃｈｅｍ．１４，１３４７−１３６３（１９９３）に記載された制限ハートリーフォック法を用いて、ＧＡＭＥＳＳソフトウェアパッケージに設定されたＢ３ＬＹＰ関数及び６−３１１Ｇ（２ｄ、２ｐ）基底による密度関数理論を用いた電子構造計算を行った。デオキシヌクレオチド及びリボヌクレオチドと比較する中性核酸塩基には、Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．７７，３６５４（１９８２）及びＪ．Ｃｈｅｍ．Ｐｈｙｓ．８０，３２６５（１９８４）に記載された６−３１１Ｇ（２ｄ、２ｐ）基底系を用いた。これは、ガウス軌道のｓｐｌｉｔ−ｖａｌｅｎｃｅｔｒｉｐｌｅｚｅｔａ記述であるため、正確な結果を提供する。単離した核酸塩基上の、ｐＨによる異なる互変異性体の研究事例では、Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．７７，３６５４（１９８２）及びＪ．Ｃｈｅｍ．Ｐｈｙｓ．８０，３２６５（１９８４）に記載される６−３１＋＋Ｇ（２ｄ、２ｐ）基底系を用いた。水素及び重原子両方の拡散関数の追加により、荷電分子がより良く記述される。核酸塩基、ヌクレオチド、またはヌクレオシドの各々の構造をＪｍｏｌソフトウェアで統合した特徴を用いて最初に最適化した。ＧＡＭＥＳＳの電子算出中に構造最適化をさらに算出した。ＭａｃＭｏｌＰｌｔを用いて分子軌道を描いた。

酸性ｐＨで行ったＳＴＳ測定により、ケト／エノール異性体の形成が容易となる。酸性ｐＨ環境は、強酸、例えば、ＨＣｌを添加して達成してもよい。多くの実施形態では、ｐＨ環境は、任意の酸、塩基、またはｐＨ緩衝液を添加して達成してもよく、例えば、酸は、硫酸、クエン酸、硝酸、乳酸、炭酸、リン酸、ホウ酸、シュウ酸、及び酢酸を含み得る。ほとんどの実施形態では、ｐＨ環境を変えるために酸を用いた。多くの実施形態では、酸は３を下回るｐＫａを有し、所望のヌクレオチド化学修飾を確実に達成するのに役立つ。デオキシリボヌクレオチドの場合では、これは図１１から分かるであろう。多くの場合、酸性ｐＨで行ったＳＴＳにより、電子及び正孔のトンネリング確率をそれぞれ示す最低空分子軌道（ＬＵＭＯ）レベルと最高被占分子軌道（ＨＯＭＯ）レベルを分離することができる。この分離は、図４ａのＶまたはｅＶ対確率プロットから分かるであろう。この分離は、図４ｂに示すエネルギー「バンドギャップ」またはＨＯＭＯ−ＬＵＭＯレベル間の差でも分かるであろう。いくつかの実施形態では、ヌクレオチドＣ（−１．３０±０．１７ｅＶ）及びＴ（−１．７４±０．２９ｅＶ）のＨＯＭＯレベル（または正孔トンネリング確率）は、図４ａで分かるように分離を示すこともある。Ｃ及びＴのＨＯＭＯレベル間の分離は、これらのケト及びエノール化構造（図１１）によるものであろう。

塩基性条件を用いて、核酸塩基を区別してもよい。場合によっては、塩基性ｐＨは、アデニンヌクレオチドとグアニンヌクレオチド（Ａ及びＧ）を区別するのに役立つ。これらの場合、ＬＵＭＯレベルは、Ａでは約１．７２±０．１９ｅＶ、Ｇでは約１．３３±０．１７ｅＶであってもよい。いくつかの実施形態では、塩基性ｐＨは、強塩基、例えば、ＮａＯＨの添加によって達成され得る。多くの場合、所望のｐＨ環境は、カリウム、アンモニウム、カルシウム、マグネシウム、バリウム、アルミニウム、鉄、及び亜鉛、水酸化リチウム）を含む種々の酸、塩基、または緩衝液の添加によって達成され得る。ほとんどの場合、塩基性ｐＨの達成に用いた塩基は、９を上回るｐＫａを有し、所望のヌクレオチド化学修飾を確実に達成するのに役立つ。場合によっては、Ａ及びＧのＨＯＭＯレベルは、塩基性条件下で異なっていてもよい。３つの異なる環境における４つのヌクレオチド、Ａ、Ｔ、Ｇ、及びＣの値は、表Ｉに記載されている。

場合によっては、生化学の違いは、他の異性体に見られ、異なるｐＨ条件下で単一ヌクレオチドのＳＴＳを用いて検出される（図４ｃ、１２、１４、１６）。例えば、アデニン、グアニン、及びシトシンと異なるチミン核酸塩基（Ｔ）は、（酸性条件下で形成された）エノール異性体を介して電荷（電子及び正孔の両方）をトンネリングし得る（図４ｃ、４ｄ、１１、表Ｉ）。この効果は共役によるものであろう。酸性、中性、及び塩基性ｐＨ下での単一Ｔヌクレオチドを介したＳＴＳ分光法により、これらの生化学的変化が実証され、これは、単一分子を介して電荷がトンネリングしやすいことによるものであろう（図４ｃ、ｄ）。単一ＴヌクレオチドのＬＵＭＯレベルは、電子トンネリングしやすいことによりｐＨの増加に伴って減少する（静電反発力の効果と思われる、図４ｄ、１１、上述）。ＬＵＭＯ及びＨＯＭＯレベルにおけるｐＨの同様の効果は、他のヌクレオチド（図１２、１４、１６）にも観察される。例えば、グアニンの２つのｐＫａ値及び得られた異性体は、ＳＴＳデータを用いて分かる（図１２、表Ｉ）。従って、（これらのｐＫａ値によって決定された）異なるｐＨ条件下で形成された生化学的構造、核酸塩基互変異性体、及び他の異性体は、ＬＵＭＯ及びＨＯＭＯ値をそれぞれ用いてモニタリングした際の電子及び正孔トンネリングの確率を用いて追跡した（バンドギャップに沿って、図４ａ、４ｂ、４ｃ、１２、１４、１６、表Ｉ）。

ＤＦＴ研究を用いて、異なるｐＨ条件下での（例えば、図１１及び上述のように）ヌクレオチド及び核酸塩基のケト−エノール互変異性体のプロトン化及び脱プロトン化酸／塩基の存在により、異なるｐＨ条件下でのプリン（Ａ、Ｇ）とピリミジン（Ｃ、Ｔ）の間の電子／正孔トンネリング確率を分離することができるとの仮説を立てた。得られた量子分子配列決定（ＱＭ−Ｓｅｑ）電子署名は異なっていることで、ロバストな生化学的ヌクレオチド同定方法の開発がもたらされる。
実施例２−新規のＱＭ−Ｓｅｑ署名としての生物物理学的パラメータ

配列決定アプリケーションに対して核酸塩基を容易に同定するための追加の生物物理学的性能指数またはパラメータを開発するため、トンネリング電流の詳細な分析を単一分子（ここでは、デオキシヌクレオチド）から解析した。ファウラー−ノルトハイム（Ｆ−Ｎ）プロットを用いてトンネリング電流を分析し、単一ヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定した。トンネリング電流（Ｉ）−電圧（Ｖ）データをｌｎ（Ｉ／Ｖ^２）対（１／Ｖ）としてプロットし、図４ｅのＴのＦ−Ｎプロットに示すように、（三角形バリアの）トンネリングレジームの過渡電圧（Ｖ_{ｔｒａｎｓ}）を抽出した。過渡電圧Ｖ_{ｔｒａｎｓ，ｅ−}は、トンネリングから電界放射レジームへの遷移を表し、トンネリングバリア（ここでは、電子）の尺度である。ヌクレオチド配列を介した電子（Ｖ_{ｔｒａｎｓ，ｅ−}）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）トンネリングのこれらのパラメータは、電子署名の構成要素を同定することを表し、ＨＯＭＯ−ＬＵＭＯ及びバンドギャップ値と同じように用いて、配列を特徴付けし、同定してもよい（以下に記載）。図４ｆに示すように個々のヌクレオチドに対するこれらのパラメータを抽出する際に、酸性条件下でＶ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}値の明確な分離が観察される（表ＩＩＩ、前述及び以下に記載）。図２１及び表ＩＩＩに示すように異なるｐＨ条件下でも電子及び正孔過渡電圧の同様のシフトが観察された。従って、ＨＯＭＯ−ＬＵＭＯレベル、エネルギーバンドギャップ、Ｖ_{ｔｒａｎｓ，ｈ＋}、及びＶ_{ｔｒａｎｓ，ｅ−}を生物物理学的パラメータとして用いることで、荷電（電子及び正孔）トンネリングデータによってヌクレオチドを同定することができる。

リボヌクレオチド同定のためのＱＭ−Ｓｅｑ署名：実験的な生物物理学的及び生化学的研究に沿ったＤＦＴ調査によって、酸性ｐＨにより区別可能な署名（Ａ、Ｇ、Ｔ、及びＣのｐＫ_ａは、それぞれ、４．１、３．３、９．９、及び４．４である）が確実に形成されることを同定した。これを用いて、単一ヌクレオチド（エネルギーバンドギャップ、ＨＯＭＯ−ＬＵＭＯ、図４ａ、４ｂ、４ｅ、４ｆのＶ_{ｔｒａｎｓ，ｈ＋}、及びＶ_{ｔｒａｎｓ，ｅ−}、表Ｉ及びＩＩＩのＤＮＡのＱＭ−Ｓｅｑデータ、表ＩＩのＲＮＡのＱＭ−Ｓｅｑデータ）再現性良く同定し、高速かつ正確な電子同定を行うことができる。さらに、ＤＦＴ研究により、ＲＮＡピリミジン核酸塩基の量子署名または電子指紋が、ＤＮＡとは異なり得ることが示唆された。直接ＲＮＡ配列決定におけるＱＭ−Ｓｅｑの可能性及び量子署名の一意性を評価するため、酸性条件下で（図７ａ、ｂ、表ＩＩ）ＲＮＡホモオリゴヌクレオチドのＱＭ−Ｓｅｑ生物物理学的パラメータを測定した。ＱＭ−Ｓｅｑ署名を明確に分離することで、ＲＮＡプリン（Ａ／Ｇ）及びピリミジン（Ｃ／Ｕ）を迅速に同定することができる。しかしながら、分子エントロピー及び２’ヒドロキシル化糖骨格にわたる電荷雲の非局在化による署名分散により、ヌクレオチド間のさらなる区別が防止される。ＲＮＡ及びＤＮＡ間のプリン（図７ｃ）及びピリミジン（図７ｄ）ＱＭ−Ｓｅｑ署名を比較することで、ＤＦＴシミュレーションで示唆されるようにピリミジン核酸塩基の指紋間の明確な区別が示される。２’ヒドロキシル化糖骨格がＲＮＡ及びＤＮＡヌクレオチドを区別するため、核酸塩基への電荷の強局在により、プリンヌクレオチドの署名の違いが防止される（図７ｃ、表ＩＩ）。これらの結果は、ヌクレオチド生化学的構造とこれらのＱＭ−Ｓｅｑ署名の間の関係をまとめており、固有のＱＭ−Ｓｅｑ電子指紋を用いて単一分子を高速で配列決定できる能力を実証している。

インビトロ転写に用いたＲＮＡ産生：ＭＡＸＩｓｃｒｉｐｔキット（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を用いて、抽出されたＤＮＡ遺伝子からのインビトロ転写によってＲＮＡ試料を調製した。５００〜１０００ｎｇのＤＮＡテンプレート、１μｌのＡＴＰ１０ｍＭ、１μｌのＣＴＰ１０ｍＭ、１μｌのＧＴＰ１０ｍＭ、１μｌのＵＴＰ１０ｍＭ、１μｌのヌクレアーゼフリー水をＰＣＲ管中で混合した。その後、２μｌの１０×転写緩衝液を添加し、完全に混合した。最後に、２μｌのＳＰ６ポリメラーゼ酵素を反応物に添加し、スピン渦を生成させた。ポリメラーゼ以外の全ての試薬は組み立てるために室温で保持した（反応物を氷中で組み立てることで、テンプレートＤＮＡを沈殿させることができることに留意されたい）。その後、溶液を室温で１時間インキュベートした。インキュベーション後、１μｌのＴＵＲＢＯＤＮａｓｅを添加してテンプレートＤＮＡを分解し、３７℃で３０分間インキュベートした。その後、溶液を１．５ｍＬ遠心分離管に移し、エタノール沈殿させた。２５μｌのヌクレアーゼフリー水、５μｌの酢酸ナトリウム（ｐＨ＝５．５で３Ｍ）、及び３容量の冷やした無水エタノールを添加した。溶液を−２０℃で少なくとも３０分間インキュベートした。その後、生成物を最高速度で１５分間遠心分離し、エタノール（７０％）で２回洗浄した。最後に、ＲＮＡペレットを１５μｌの０．５×ＴＥ緩衝液で再懸濁させた。

Ｎ−メチルイサト酸無水物によるＲＮＡ修飾：１０μｌの折り畳まれたＲＮＡに、１０μｌのＮ−メチルイサト酸無水物（ＮＭＩＡ）溶液（ＤＭＳＯ中に１３０ｍＭのＮＭＩＡ）を添加する。３７℃で２．５時間インキュベートする。さらに反応物を上述のようにエタノール沈殿させる。ＲＮＡペレットを１０μｌの０．５×ＴＥ緩衝液中で再懸濁させる。

硫酸ジメチルによるＲＮＡ修飾：１０μｌの折り畳まれたＲＮＡに、１０μｌのＤＭＳ溶液（メタノール中の０．８ｍＭのＤＭＳ（硫酸ジメチル、ＳＰＥＸＣｅｒｔｉＰｒｅｐ、ＵＳＡ））を添加する。両方の管を３７℃で２時間インキュベートする。さらに反応物を上述のようにエタノール沈殿させる。ＲＮＡペレットを１０μｌの０．５×ＴＥ緩衝液中で再懸濁させる。

データ分析：各核酸塩基からの各トンネリング電流データからいくつかのパラメータを抽出した（ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、過渡電圧（正及び負）、電子／正孔有効質量の比率、電子及び正孔のφ_０、及びΔφ_０）。配列決定及び構造の両方を同時に同定することができるソーティングアルゴリズムを開発している（図１）。

まず、未修飾ホモオリゴマーまたは修飾（ＮＭＩＡまたはＤＭＳのいずれかで修飾）ホモオリゴマーのいずれかにおいて、パラメータ、例えば、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、過渡電圧（正及び負）、電子／正孔有効質量の比率、電子及び正孔のφ_０、及びΔφ_０を同定した。個々の修飾／未修飾オリゴから同定したパラメータ（修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列からのトレーニングセット上で決定された）を用いて、機械学習モデル（例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデル）を構築した。このモデルでは、パラメータは互いに独立し、参照と比較されるように（単純に）想定されている。その後、各グループに関連する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア／確率は、参照（呼び出しグループ）として定義する。その後、未知のスペクトルを処理して、パラメータを抽出し、これらのパラメータをトレーニングセットと比較して、トレーニングセットから各個々のグループの確率を同定した。最も高い確率のグループを元々のスペクトルに割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類（教師あり機械学習）の他の機械学習処理またはアルゴリズムには、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング（メタアルゴリズム）、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ（決定木、決定グラフなど）、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率近似（ＰＡＣ）学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Ｐｒｏａｆｔｎ、及び多基準分類アルゴリズムが含まれる。

他の実施形態では、トンネリング電流データから導出されたパラメータ値、例えば、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、過渡電圧（正及び負）、電子／正孔有効質量の比率、電子及び正孔のφ_０、及びΔφ_０を同定した。種々の環境において、未修飾ホモオリゴマーまたは修飾（ＮＭＩＡまたはＤＭＳのいずれかで修飾）ホモオリゴマーの両方に対するこれらの値を同定した。「トレーニングセット」と呼ばれるこれらの同定されたパラメータは、修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得た。その後、トレーニングセットからのパラメータ値を用いて、参照として機械学習モデルを構築した。種々の機械学習モデル、例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデルを用いてもよい。このモデルでは、パラメータは互いに独立し、参照と比較されるように（単純に）想定されている。その後、新規のデータポイントが各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア／確率は、呼び出しグループとして定義する。

次に、未知の核酸塩基のトンネリング電流データを回収する。このトンネリング電流データを処理し、種々のパラメータ：ＨＯＭＯ、ＬＵＭＯ、エネルギーバンドギャップＶ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}、φ_０，ｅ−、φ_０，ｈ＋、Δφ、及びｍ_{ｅｆｆｅ−}／ｍ_{ｅｆｆｈ＋}の値を決定した。その後、未知の核酸塩基がトレーニングセットからの個々のグループに属する確率を同定するために、これらの値をトレーニングセットから得た値と比較した。呼び出されたグループ（未知の核酸塩基のグループとマッチングする確率が最も高いグループ）をその核酸塩基に割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類（教師あり機械学習）の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング（メタアルゴリズム）、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ（決定木、決定グラフなど）、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率的近似（ＰＡＣ）学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Ｐｒｏａｆｔｎ、及び多基準分類アルゴリズムが含まれる。
実施例３−過渡電圧値

配列決定アプリケーションでの核酸塩基の同定にさらに役立たせるため、単一分子（ここでは、ヌクレオチド）からのトンネリング電流の詳細な分析も行った。これらの実験では、ファウラー−ノルトハイム（Ｆ−Ｎ）プロットを用いてトンネリング電流を分析した。この分析を行い、単一ヌクレオチドを介した荷電トンネリングを支配する基礎となる生物物理学的パラメータを同定した。（三角形バリアの）トンネリングレジームの過渡電圧（Ｖ_{ｔｒａｎｓ}）及び勾配を抽出するために、トンネリング電流（Ｉ）−電圧（Ｖ）データをｌｎ（Ｉ／Ｖ^２）対（１／Ｖ）としてプロットした。この分析の一例を、図４ｅのＴに対するＦ−Ｎプロットに示す。過渡電圧Ｖ_{ｔｒａｎｓ，ｅ−}は、トンネリングから電界放射レジームへの遷移を表し、勾配Ｓは、トンネリングバリア（ここでは、電子）の尺度である。

トンネリングから電界放出への過渡電圧、及び荷電トンネリングのバリアを示す勾配などのトンネリングデータを入念に分析するため、３つの生物物理学的パラメータ／定数を抽出してもよい。これらのトンネリング定数（Ｖ_{ｔｒａｎｓ，ｈ＋}、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｓ＝Ｓ_ｅ＋Ｓ_ｈ）は、電荷がトンネリングする分子（ここでは、ヌクレオチド）の特徴であり、ＨＯＭＯ−ＬＵＭＯ及びバンドギャップのぞれぞれに対する追加の性能指数の開発に用いた。例えば、Ｖ_{ｔｒａｎｓ，ｈ＋}を用いた正孔トンネリング確率の変化を分析するため、異なるｐＨ条件下でヌクレオチドＨＯＭＯレベルのように用いることができることが観察された（図２１、表ＩＩＩ）。同様に、Ｖ_{ｔｒａｎｓ，ｅ−}は、ＬＵＭＯレベルのように、電子トンネリングしやすさを表す（低い値は、電子トンネリングしやすさを表す）。勾配Ｓは、これらの生体分子で観察されたバンドギャップを模倣する。より入念な分析により、これらのファウラー−ノルトハイム（Ｆ−Ｎ）過渡電圧（Ｖ_{ｔｒａｎｓ}）には類似の挙動が観察された（図２１、表ＩＩＩ）。Ｖ_{ｔｒａｎｓ}は、三角トンネリングから電子または正孔のいずれかの電界放出へのシフトを表す。Ｖ_{ｔｒａｎｓ}は、ＨＯＭＯ（Ｖ_{ｔｒａｎｓ，ｈ＋}）及びＬＵＭＯ（Ｖ_{ｔｒａｎｓ，ｅ−}）レベルと同じ、ｐＨによるパターンを示し、これにより、ＤＮＡのような生体分子に応用したＦ−Ｎトンネリングの背後には生物物理学的理論が確認される。従って、これらのトンネリングパラメータを、今回の研究で開発した追加の新規のＱＭ−Ｓｅｑ署名／性能指数として用いることができる。

過渡電圧（Ｖ_{ｔｒａｎｓ}）を測定することで生体分子中の直接トンネリングからファウラー−ノルトハイムトンネリングへの遷移を用いて、トンネリングバリアハイト（金属チップフェルミレベル（Ｅ_Ｆ）及びフロンティア分子軌道、即ち、ＨＯＭＯまたはＬＵＭＯのいずれかの間のエネルギーオフセット）を推定する。印加したバイアス電圧（バイアス）がバリアハイト未満である場合、直接トンネリングは主要な輸送機構に割り当てる。ゼロバイアス限界では、バリアは長方形と仮定され、有効電子質量がある場所がバリアハイトとして近似することができる。ｄはトンネリング距離であり、ｈ（ｈ＝ｈ／２π）はプランク定数である。高バイアス電圧では、伝導機構はファウラー−ノルトハイムトンネリングまたは電界放出により支配され、三角形バリアを近似することができる。従って、直接トンネリング（Ｆ−Ｎプロット上での対数）からファウラー−ノルトハイムトンネリング（Ｆ−Ｎプロット上での直線）への遷移は、Ｆ−Ｎプロット（ｌｎ（Ｉ／Ｖ^２）対１／Ｖ）上での変曲点（Ｖ_{ｔｒａｎｓ}）を示す。トンネリング曲線の形状が長方形（Ｖ＝０Ｖ）から台形（Ｖ＜Φ_Ｂ／ｅ）へ、その後三角形（Ｖ＞Φ_Ｂ／ｅ）への遷移は、バイアスが増すにつれて見ることができる。従って、Ｖ_{ｔｒａｎｓ}は、長方形から三角形バリアへの遷移を測定するため、生体分子中でのトンネリング輸送に関連付けられた元々の長方形バリアの高さを測定する実験的な方法を提供する。

これらの実験により、ヌクレオチド配列を介した電子（Ｖ_{ｔｒａｎｓ，ｅ−}）及び正孔（Ｖ_{ｔｒａｎｓ，ｈ＋}）トンネリングのパラメータは、署名構成要素を表し、ＨＯＭＯ−ＬＵＭＯ及びバンドギャップ値と同じように用いて配列を特徴付けて、同定することが示唆される。図４ｆに示すように、個々のヌクレオチドのこれらのパラメータを抽出する際に、酸性条件下でのＶ_{ｔｒａｎｓ，ｅ−}及びＶ_{ｔｒａｎｓ，ｈ＋}値の分離が観察される（表ＩＩＩ、及び上述）。図２１及び表ＩＩＩに示すように、異なるｐＨ条件下での電子及び正孔過渡電圧の同様なシフトについても観察された。従って、署名（またはパラメータ）を同定する構成要素としてＨＯＭＯ−ＬＵＭＯレベル、Ｖ_{ｔｒａｎｓ}、及び勾配（Ｓ）を用いて、荷電（電子及び正孔）トンネリングデータによりヌクレオチドを分離することができる。
実施例４−ＡｍｐＲ配列決定

例えば、以下により詳細に説明するように、開示された技術を用いて、ベータ−ラクタム抗生物質への耐性をコードするａｍｐＲ遺伝子の８５ｎｔ及び７００ｎｔ領域と、ＨＩＶ−１ＲＮａｓｅ配列の３５０ｎｔ領域の配列の電子指紋（またはトンネリングデータ）を決定した。本開示の技術は、単一量子分子配列決定走査／読取において９５％を上回る成功率で、これらの配列決定プロジェクトに対する成功を収めた。ここで、成功とは、未知のヌクレオチドの同一性と既知の配列の同一性とをマッチングさせることと定義する。多くの実施形態では、成功率は、約９６％、９７％、９８％、または９９％より高くてもよい。

上述の生物物理学的及び生化学的研究を用いて、酸性ｐＨを用いて区別可能な異性体（Ａ、Ｇ、Ｔ、及びＣのｐＫａは、それぞれ、４．１、３．３、９．９、及び４．４である）の形成を促進することができ、これらの区別可能な異性体を用いて、単一ヌクレオチド（バンドギャップ、ＨＯＭＯ−ＬＵＭＯ、Ｖ_{ｔｒａｎｓ}、及びＳ、図４ａ、４ｂ、４ｅ、４ｆを用いて）を再現性良く配列決定することができることが確認された。

これらの実験では、酸性ｐＨ下での単一ＳＴＭ−ＳＴＳ測定を用いて、単一分子ＤＮＡ（ＳＴＭを用いて）及び単一ヌクレオチド（図５ａにＡを示し、図２２にＴ、Ｇ、Ｃを示すＳＴＳデータを用いて）を配列決定した。これは、分の時間尺度内で達成可能であった。

薬剤耐性及び変異性病原体を研究するためのこの方法の単純さ及び潜在用途を実証するために、細菌性抗生物質耐性遺伝子ａｍｐＲの配列決定を行った。ａｍｐＲ遺伝子は、ペニシリン由来の抗生物質を阻害するβ−ラクタマーゼをコードするため、病原体治療に有用である。生理学的レベル（以下を参照、図２４）を模倣するため、ｓｓＤＮＡ溶液を低濃度（１〜５ｎＭ）で調製した。

アンピシリン耐性遺伝子（ａｍｐＲ）遺伝子の一本鎖ＤＮＡを２工程で得た。まず、ＰｈｕｓｉｏｎＨｉｇｈ−ＦｉｄｅｌｉｔｙＰＣＲキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いたポリメラーゼ連鎖反応（ＰＣＲ）によって、二本鎖ａｍｐＲＤＮＡをプラスミドｐＺ１２ＬＵＣプラスミド（Ｅｘｐｒｅｓｓｙｓ、Ｇｅｒｍａｎｙ）から増幅させた。ＧｅｎｅＪＥＴＰｌａｓｍｉｄＭｉｎｉｐｒｅｐキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いて、プラスミドｐＺ１２ＬＵＣを大腸菌株ＤＨ５α−Ｚ１から抽出した。フォワード（ＣＧＡＧＣＴＣＧＴＡＡＡＣＴＴＧＧＴＣＴＧＡ）及びリバースプライマー（ＧＴＧＡＡＧＡＣＧＡＡＡＧＧＧＣＣＴＣＧ）（Ｉｎｖｉｔｒｏｇｅｎ、ＵＳＡ）を用いて、ａｍｐＲ遺伝子の１０９１ｂｐを増幅させた。テンプレートＤＮＡ及びフォワードまたはリバースプライマーのみとして二本鎖ａｍｐＲを用いて２回のＰＣＲによって一本鎖ａｍｐＲＤＮＡを得た。ＺｙｍｏＣｌｅａｎＧｅｌＤＮＡ回収キット（ＺｙｍｏＲｅｓｅａｒｃｈ、ＵＳＡ）によるゲル抽出を用いて各反応の生成物を精製し、０．１ＭＮａ_２ＳＯ_４中の５ｎＭ（１．７ｎｇ／μＬ）に希釈した（生理学的濃度を模倣するため、図２５）。ＮａｎｏＤｒｏｐ２０００分光光度計（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いてＤＮＡ濃度を測定した。

上述の３工程の押出沈着技術を用いて、ｓｓＤＮＡの細長い線状鎖の単一分子を基板上に再現性良く沈着させた（図６ｂ及び図２３）。ａｍｐＲＤＮＡの単一鎖のＳＴＭイメージング及びＳＴＳ分光法を同時に行った（図６ｂ、６ｃ、６ｄに示す）。ＳＴＳ走査測定セットアップは、１ｎｍの方位分解能を有した（圧電スキャナー及びセットアップの分解能によって制限される、以下を参照）。ＳＴＳ走査を用いて、ヌクレオチドを各測定で正確に同定し、隣接の核酸塩基も９５％を超える精度で二次同定技術（Ｍｅｔｈｏｄｓを参照）を用いて同定した（図６ｃ）。全体として、全４０個のヌクレオチドを、ａｍｐＲ遺伝子の８５塩基領域内で無事に同定した（図６ｃ、６ｄ）。

図３６は、本発明のいくつかの実施形態によるシーケンサ１００（ポリヌクレオチド配列決定デバイス）の一例を示す。図３６に示すように、読取ヘッド１０６は、試料１０８の上に配置されている。前述したように、試料１０８は、基板上に配置された１つまたは複数のヌクレオチドをもつ一本鎖のＤＮＡまたはＲＮＡ試料である。基板は、平坦に配向（１１１）した金であってもよい。いくつかの実施形態では、試料１０８は横移動ステージ１１０上に配置され、読取ヘッド１０６は固定されている。いくつかの他の実施形態では、読取ヘッド１０６を横移動ステージに取り付けながら、試料１０８を固定してもよい。読取ヘッド１０６は、上述したように、かつ、図１ａ及び３ｂに示すように単一チップ読取ヘッドであってもよく、あるいは、図２７（ａ）〜（ｃ）に示すようにチップアレイであってもよい。試料１０８は、例えば、上記の実施例１〜３で述べたように、かつ、図３ｂ及び２７（ｃ）に示すように調製してもよい。試料１０８の上の読取ヘッド１０６の配置は、例えば、図１ａ、３ｂ、及び２７ａ〜２７ｃに示す。試料１０８の調製図は、図３ａに示し、先に詳しく説明した。

図３６にさらに示すように、バイアス電圧発生器１０４によって試料１０８と読取ヘッド１０６の間にバイアス電圧Ｖを生成し、電流センサ１１６によって電流Ｉを測定する。プロセッサ１０２によってバイアス電圧発生器１０４を制御し、バイアス電圧Ｖの範囲にわたって走査することができ、各バイアス電圧Ｖの電流Ｉは、電流センサ１１６によって読み取られ、プロセッサ１０２に提供される。従って、プロセッサ１０２は、試料１０８の上の読取ヘッド１０６の各ｘ−ｙ位置のＩ／Ｖ曲線（あるいは、スペクトル、トンネリングデータと呼ばれる）を回収することができる。図３６にさらに示すように、プロセッサ１０２は、横移動ステージ１１０に連結するスキャナー１１２を制御するように連結される。横移動ステージ１１０は、例えば、スキャナー１１２によって指示された際に読取ヘッド１０６に対して試料１０８を移動させることが可能な圧電ｘ−ｙ−ｚステージであってもよい。しかしながら、試料１０８を正確にを移動させることが可能ないずれの横移動ステージを利用してもよい。

従って、プロセッサ１０２は、読取ヘッド１０６に対する試料１０８の位置を制御し、データ骨格１０４にさらに連結することができるため、データストレージ１２６、メモリー１２４、インタフェース１２２、及びユーザインタフェース１２０に連結することができる。データストレージ１２６は、メモリーハードドライブ、ＦＬＡＳＨドライブ、磁気ドライブなどの固定ストレージであってもよい。メモリー１２４は、データ及びソフトウェア命令を保存することができる揮発性または不揮発性メモリーであってもよい。インタフェース１２２は、外部装置またはネットワークに接続する任意のインタフェースであってもよい。例えば、インタフェース１２２を用いて、シーケンサ１００を、シーケンサ１００によって取得された電子署名データの分析を行う外部コンピューティングシステムに連結してもよい。ユーザインタフェース１２０は、例えば、ビデオスクリーン、オーディオデバイス、キーボード、ポインターデバイス、タッチスクリーン、または、プロセッサ１０２がユーザと通信できる他のデバイスであってもよい。

図３７は、図３６に示すシーケンサ１００などの配列決定デバイス上で実行され、ＤＮＡまたはＲＮＡの１つまたは複数の鎖の配列決定をもたらすプロセス２００を示す。図３７に示すように、プロセス１００は、工程２０２で読取ヘッド１０６を位置決めすることで開始される。図３６に示すように、読取ヘッド１０６の位置決めは、読取ヘッド１０６に対して試料１０８を移動させることで達成してもよい。走査位置決めは、（ｘ，ｙ）＝（０，０）として任意に指定された開始位置にチップを位置決めすることで行ってもよい。さらに、走査パターンに従ってｘ、ｙ位置を介して反復してもよい。ｚ位置（読取ヘッド１０６と試料１０８の間の距離）は、プロセス２００の実行前に、金のトンネリング情報を用いた較正工程によって調整し、固定することができる。工程２０４では、現在の（ｘ，ｙ）位置での読取ヘッド１０６上の各読取チップのＩ／Ｖデータを取得する。工程２０６では、トンネリングデータまたはＩ／Ｖデータを後の分析用に保存してもよい。いくつかの実施形態では、トンネリングデータまたはＩ／Ｖデータの分析は、データ取得と同時に行ってもよい。

工程２０８では、プロセッサ１０２は、走査が終わったかどうか確認する。基板上の各ｘ−ｙ位置でトンネリングデータが回収されると、走査は終了する。いくつかの実施形態では、ユーザは、分析のためにｘ−ｙ位置の一部を選択してもよい。走査が終了していない場合、プロセッサ１０２は、工程２０２に戻り、読取ヘッド１０６は、試料１０８の上の次のｘ−ｙ位置に位置決めされる。走査が終了している場合、データ分析が次いで工程２１０で開始される。いくつかの実施形態では、シーケンサ１００上のプロセッサ１０２によってデータ分析を行ってもよく、シーケンサ１００は、取得したトンネリングデータをさらなる分析用に別個のコンピュータに送信してもよい。従って、いくつかの実施形態では、プロセッサ１０２は、データを分析用コンピュータ（不図示）に提供してもよく、ここで、このプロセスの残り部分が達成される。

工程２１０では、取得したトンネリングデータまたはＩ／Ｖデータに基づいて、個々のヌクレオチドのｘ−ｙ位置が得られる。このプロセスは、例えば、図１０ａ〜１０ｂに対して示され、上述されている。特に、ｄＩ／ｄＶデータを分析して、ＬＵＭＯ及びＨＯＭＯピークを同定することができ、これにより、読取ヘッド１０６が試料１０８におけるヌクレオチドの上に配置されていることが示唆される。低電圧ピークのみが得られた場合、読取ヘッド１０６は、金基板の上に配置されている。マルチチップアレイでは、各チップからのデータを別々に分析して、試料１０８における個々のヌクレオチドの位置を決定することができる。

工程２１２では、ヌクレオチドの上であると同定される各ｘ−ｙ位置で、個々のパラメータを、トンネリング電流データまたはＩ／Ｖデータを用いて算出する。明細書を通じて説明したパラメータには、ｄＩ／ｄＶ、Ｉ／Ｖ^２、ＨＯＭＯ、ＬＵＭＯ、エネルギーバンドギャップ、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}、Φ_，ｅ−、Φ_０，ｈ−、Δφ、及びｍ_{ｅｆｆｅ−}／ｍ_{ｅｆｆｈ−}を含み得る（上述のように、かつ、図３６及び３７に示すように）。ヌクレオチドの３つまたはそれ以上のパラメータ値の回収には、未知のヌクレオチドの電子署名を含む。

工程２１４では、工程２１２で得られたヌクレオチドの署名と、同じ環境で回収された既知のヌクレオチドのパラメータ値のデータベースとの比較に基づいて、未知のヌクレオチドを同定する。比較のため、未知の核酸塩基（例えば、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}）の署名を決定するために選択されたパラメータ値を、既知の核酸塩基（実施例２に上述のように）からの同じパラメータ（この場合、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、Ｖ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}）値と比較する。種々の実施形態では、既知の核酸塩基のパラメータ値を表ＶＩＩＩ〜Ｘに提供する。いくつかの実施形態では、既知の核酸塩基（修飾及び未修飾）のこれらの値は、値の「参照ライブラリ」と呼ばれ、データベースに電子データとして保存してもよい。

（修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得たトレーニングセット上で決定された）個々の修飾または未修飾のオリゴから同定したパラメータを用いて、機械学習モデル（例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデル）を構築した。このモデルでは、パラメータは互いに独立し、参照と比較されるように（単純に）想定されている。その後、パラメータ指紋が各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。パラメータ指紋が特定のグループからである最も高いスコア／確率を定義する。その後、未知のパラメータ指紋をモデルと比較して、モデルにおいてトレーニングセットからの各個々のグループに属するパラメータ指紋の確率を同定した。最も高い確率をもつグループを元々のスペクトルに割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。いくつかの実施形態では、核酸塩基を同定する際に、パラメータ指紋をモデルに加えてもよい。

使用可能なデータ分類（教師あり機械学習）の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング（メタアルゴリズム）、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ（決定木、決定グラフなど）、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率近似（ＰＡＣ）学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Ｐｒｏａｆｔｎ、及び多基準分類アルゴリズムが含まれる。

上述のように、トンネリング電流データから導出されたパラメータ値、例えば、ＨＯＭＯ、ＬＵＭＯ、バンドギャップ、過渡電圧（正及び負）、電子／正孔有効質量の比率、電子及び正孔のψ_０、及びΔψを同定した。種々の環境において、未修飾ホモオリゴマーまたは修飾（ＮＭＩＡまたはＤＭＳのいずれかで修飾）ホモオリゴマーの両方に対するこれらの値を同定した。「トレーニングセット」と呼ばれるこれらの同定されたパラメータは、修飾を含むかまたは欠いたホモポリヌクレオチドなどのよく特徴付けられた既知の配列から得た。その後、トレーニングセットからのパラメータ値を用いて、参照として機械学習モデルを構築した。種々の機械学習モデル、例えば、新規のデータポイントが特定のグループ中に属するベイズ確率に基づいて予め定義されたグループを分類するナイーブベイズモデルを用いてもよい。このモデルでは、パラメータは互いに独立し、参照と比較されるように（単純に）想定されている。その後、新規のデータポイントが各グループに属する全スコアまたは確率を算出し、アウトプットとして提供する。特定のグループからの最も高いスコア／確率は、呼び出しグループとして定義する。

次に、未知の核酸塩基のトンネリング電流データを回収する。このトンネリング電流データを処理し、種々のパラメータ：ＨＯＭＯ、ＬＵＭＯ、エネルギーバンドギャップＶ_{ｔｒａｎｓ，ｅ−}、Ｖ_{ｔｒａｎｓ，ｈ＋}、φ_０，ｅ−、φ_０，ｈ＋、Δφ、及びｍ_{ｅｆｆｅ−}／ｍ_{ｅｆｆｈ＋}の値を決定した。その後、未知の核酸塩基がトレーニングセットからの個々のグループに属する確率を同定するために、これらの値をトレーニングセットから得た値と比較した。呼び出されたグループ（未知の核酸塩基のグループとマッチングする確率が最も高いグループ）をその核酸塩基に割り当て、配列アラインメントに用いた。この方法論により、配列決定及び構造の両方を同時に同定することができる。使用可能なデータ分類（教師あり機械学習）の他の機械学習処理には、分析的学習、人工ニューラルネットワーク、逆伝搬、ブースティング（メタアルゴリズム）、ベイズ統計、事例ベース推論、決定木の学習、帰納論理プログラム、ガウス過程回帰、データ取扱いの群方法、カーネル推定量、学習オートマトン、最小メッセージ長さ（決定木、決定グラフなど）、多線部分空間学習、ナイーブベイズ分類器、最近傍アルゴリズム、確率的近似（ＰＡＣ）学習、リップルダウンルール、知識獲得方法論、記号機械学習アルゴリズム、サブ記号機械学習アルゴリズム、サポートベクターマシン、ランダムフォレスト、分類器アンサンブル、順序分類、データ前処理、不均衡データセットの取扱い、統計的関係学習、Ｐｒｏａｆｔｎ、及び多基準分類アルゴリズムが含まれる。

工程２１６では、データ分析が完了していない場合（例えば、各同定した核酸塩基部位の全てのデータが分析されていない場合）、プロセスは、工程２１２に戻る。しかしながら、全てのデータが分析されている場合、プロセスは、工程２１８で決定された配列を表示する。
実施例５−修飾核酸塩基の検出

これらの実験では、硫酸ジメチル（ＤＭＳ）を用いてＤＮＡオリゴマーをメチル化した（図８ａ）。メチル化は、エピジェネティック遺伝子サイレンシングの修飾に特に重要であり、ガンなどの疾患の早期発症の検出に使用できる可能性がある。ＤＮＡメチル化は、非メチル化ヌクレオチド（図８ｂ、８ｃ、２４ａ）と比べてメチル化ヌクレオチドの生化学的構造の変化をもたらす。硫酸ジメチルは、ＤＮＡと反応して、一本鎖領域上のグアニン及びアデニンをメチル化することが知られているが、シトシンは、限られた程度しか反応しないことが知られている。インビボで、ＤＮＡは、メチル化シトシン塩基、特に、５−メチルシトシンを含み得る。他の潜在的なメチル化塩基には、５−ヒドロキシメチルシトシン、７−メチルグアノシン、Ｎ６−メチルアデノシンが含まれる。

メチル化は、荷電トンネリング確率を変化させ得るため、スペクトル中で得られた結果を調べるためにＳＴＳ測定を行った。観察されたように（図８、２４、表ＶＩ）、プリンまたはピリミジン環の化学修飾は共役に影響を及ぼし、電子及び正孔の両方のトンネリング確率を低下させる。
ＤＮＡのメチル化

メタノール中で８００μΜに希釈した後の硫酸ジメチル（ＤＭＳ）（ＳＰＥＸＣｅｒｔｉＰｒｅｐ、ＵＳＡ）を用いて、ＤＮＡメチル化を行った。１０μｌのＤＮＡオリゴマー（２０μΜ）を１０μｌの８００μΜ ＤＭＳ（ＤＮＡオリゴマーに対して２．６過剰に等しい）と混合し、室温で２４時間インキュベートした。標準エタノール沈殿を用いてメチル化ＤＮＡを沈殿させた。溶液を無菌再蒸留水で９０μｌに希釈した後、１０μｌの酢酸ナトリウム（３Ｍ、ｐＨ５．５）と２００μｌの冷やした無水エタノールを加えた。溶液を混合し、−２０℃で少なくとも２０分間インキュベートした。その後、１３、０００ｒｐｍで１５分間遠心分離し、上清を除去した。得られたＤＮＡペレットを５００μＬ及び１０００μｌの７０％エタノールで２回洗浄した後、遠心分離を行った。その後、洗浄したＤＮＡを無菌水中に再懸濁させ、Ｎａｎｏｄｒｏｐを用いて濃度を決定した。得られたメチル化ＤＮＡを０．１ＭＮａ_２ＳＯ_４を用いて半分に希釈し、ＳＴＭで測定した。

グアニン及びアデニンヌクレオチドのメチル化（図８ｂ、８ｃ）により、ＬＵＭＯ及びＨＯＭＯ両方のエネルギーレベルの増加をもたらし、各ＨＯＭＯ／ＬＵＭＯエネルギーギャップ（図８ｄ、８ｅ）の増加ももたらした。観察された電子エネルギーレベルの変化は、プリンのメチル化により、図８ｂ、８ｃの異性体に示すように共役が失われたことによるものであろう。共役が失われることで、電子及び正孔の両方のトンネリングバリアがより大きくなることがある（図８ｄ、８ｅ、表ＶＩ）。メチル化は、ピリミジン（図９ａ、９ｂ、表ＶＩ）でも調べ、対応する電子シフトが観察された。これらの調査後、ＤＮＡ単一鎖をメチル化した。これらの研究結果から、メチル化及び非メチル化ヌクレオチドが単一核酸塩基分解能で区別され得ることが実証された（図８ａ）。単一ＤＮＡ分子のみならずそれら分子内の単一ヌクレオチド修飾を検出するこの技術の応用性について、これらの結果は指し示している。
実施例６−大規模並列配列決定

開示された方法を用いた大規模並列配列決定を種々の方法で達成してもよい。１つの実施形態では、ＣＣＤまたはカメラチップと同様の１メガピクセル（または１メガチップ）２ｃｍ×２ｃｍチップをプロセスで用いる。例えば、電圧を複数のチップに同時に印加し、電流を回収、保存し、複数のチップから全ての電流値を同時に読み取ってもよい（ＣＣＤと同様）。電流の読取後、別のバイアス電圧を印加などし、塊状の２ｃｍ×２ｃｍ基板にわたって全電流−電圧曲線を再作成してもよい。従って、数千のゲノムを載置し、同時に読み取ってもよい。圧電を用いて、試料を数オングストローム移動させることで、次の核酸塩基の配列決定を行うことができ−このプロセスを繰り返して、追加の核酸塩基を分析する。従って、単一２マイクロメートル走査動作（または圧電走査）において、大規模並列シーケンサとしてセットアップされた開示の方法は、単純マイクロ流体デバイスを用いてパターン化された比較的大きな試料バイオチップ上の可能な全ての核酸塩基の配列決定をすることができる。種々の実施形態では、ポリヌクレオチドを、種々のサイズを有する、例えば、約１．０ｃｍ未満の基板上に押し出してもよい。

図２７ａは、単式光学リソグラフィ後に異方性ＫＯＨエッチングを用いて光学的に作成したチップパターンのセンチメートル縮尺の写真である。マルチチップシーケンサは、修飾テンプレート剥離処理（Ｎａｇｐａｌら、Ｓｃｉｅｎｃｅ、３２５、５９４、２００９）を用いて製造されたメガピクセルチップアレイを用いて作製されるであろう。あるいは保護されたシリコン（１００）表面の円穴または角穴の光リソグラフィを用いることで、自己限定性の異方性水酸化カリウムエッチング（ＫＯＨエッチング）処理を利用して、滑らかなシリコンウェハ上にパターン化された逆ピラミッド型のディベット（ｄｉｖｅｔｓ）を作製した。逆ピラミッドチップは周期的であり、周期性、包装、及びパターニングは、暴露されたシリコンウェハの光リソグラフィを用いて簡単に変更される。その後、これらの逆ピラミッドを金、銀、または銅金属で被覆後、エポキシによる裏込めかまたは厚電子沈着金属層バッキングにより機械的に安定なフィルムが可能になる。これらの新規金属はシリコンテンプレートに接着しないため、これらのパターン化されたメガピクセルチップアレイを剥離し、このメガピクセルチップアレイを用いて、リーダーアレイ及びＣＣＤ型メガピクセルリーダーによるパターン化された量子配列決定リーダーが作製されるであろう。マイクロ流体デバイスの寸法は、メガピクセルチップリーダーの周期性とマッチングしているため、ヌクレオチド配列、修飾及び構造の大規模並列データの取得及び検出が可能である。図２７ｂは、金から作られた高忠実度かつ周期的にパターン化されたＳＴＭチップを示すＳＥＭ画像である。超平坦基板上の大面積（ｃｍ×ｃｍ）縮尺ＳＴＭチップを用いて、２μｍ×２μｍ表面を走査し、図に示すものと同様のチップからの大規模並列走査及び単純読み出しによって、ｃｍ縮尺にわたる全配列を作製してもよい。

本明細書で開示された全ての参照は、特許または非特許に関わらず、各々が引用例として含まれるかのように、それら全体が参照により組み込まれる。

本開示をある程度細かく記載したが、本開示は一例としてなされ、本明細書の特許請求の範囲に記載される本開示の精神から逸脱することなく詳細または構造の変化を施せると理解されたい。

アンピシリン耐性遺伝子（ａｍｐＲ）遺伝子の一本鎖ＤＮＡを２工程で得た。まず、ＰｈｕｓｉｏｎＨｉｇｈ−ＦｉｄｅｌｉｔｙＰＣＲキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いたポリメラーゼ連鎖反応（ＰＣＲ）によって、二本鎖ａｍｐＲＤＮＡをプラスミドｐＺ１２ＬＵＣプラスミド（Ｅｘｐｒｅｓｓｙｓ、Ｇｅｒｍａｎｙ）から増幅させた。ＧｅｎｅＪＥＴＰｌａｓｍｉｄＭｉｎｉｐｒｅｐキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いて、プラスミドｐＺ１２ＬＵＣを大腸菌株ＤＨ５瘁|Ｚ１から抽出した。フォワード（配列番号１：ＣＧＡＧＣＴＣＧＴＡＡＡＣＴＴＧＧＴＣＴＧＡ）及びリバースプライマー（配列番号２：ＧＴＧＡＡＧＡＣＧＡＡＡＧＧＧＣＣＴＣＧ）（Ｉｎｖｉｔｒｏｇｅｎ、ＵＳＡ）を用いて、ａｍｐＲ遺伝子の１０９１ｂｐを増幅させた。テンプレートＤＮＡ及びフォワードまたはリバースプライマーのみとして二本鎖ａｍｐＲを用いて２回のＰＣＲによって一本鎖ａｍｐＲＤＮＡを得た。ＺｙｍｏＣｌｅａｎＧｅｌＤＮＡ回収キット（ＺｙｍｏＲｅｓｅａｒｃｈ、ＵＳＡ）によるゲル抽出を用いて各反応の生成物を精製し、０．１ＭＮａ_２ＳＯ_４中の５ｎＭ（１．７ｎｇ／・k）に希釈した（生理学的濃度を模倣するため、図２５）。ＮａｎｏＤｒｏｐ２０００分光光度計（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ＵＳＡ）を用いてＤＮＡ濃度を測定した。

Claims

第１の未知の核酸塩基の同定方法であって、
走査型トンネリング顕微鏡を用いてトンネリング電流データを回収して前記第１の未知の核酸塩基の電子署名を決定することと；
前記第１の未知の核酸塩基の電子署名と、１つまたは複数の既知の核酸塩基の電子指紋を比較することとと；
前記第１の未知の核酸塩基の電子署名を、既知の核酸塩基の電子指紋にマッチングさせることと、それによって；
前記第１の未知の核酸塩基を同定すること
とを含む前記方法。
前記第１の未知の核酸塩基の電子署名と前記既知の核酸塩基の電子指紋とが、ＬＵＭＯ、ＨＯＭＯ、Ｂａｎｄｇａｐ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値から選択される少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの値を含む、請求項１に記載の方法。
前記第１の未知の核酸塩基が、１つまたは複数のリン酸塩分子を介して第２の未知の核酸塩基に共有結合している、請求項１〜２のいずれか１項に記載の方法。
第２の未知の核酸塩基が、請求項１に記載の方法によって同定される、請求項３に記載の方法。
前記第１の未知の核酸塩基が、修飾及び未修飾のアデニン、グアニン、シトシン、チミン、及びウラシルからなる群から選択される、請求項１〜４のいずれか１項に記載の方法。
前記第１の未知の核酸塩基の電子署名を、酸性、中性、及び塩基性から選択される１つまたは複数のｐＨ環境で決定し、同じｐＨ環境で回収された前記１つまたは複数の既知の塩基の電子指紋と比較する、請求項１〜５のいずれか１項に記載の方法。
前記ｐＨ環境が塩基性である、請求項６に記載の方法。
前記ｐＨが９よりも大きい、請求項７に記載の方法。
前記ｐＨ環境が酸性である、請求項６に記載の方法。
前記ｐＨが３未満である、請求項９に記載の方法。
第２のｐＨ環境が塩基性である、請求項９または１０のいずれか１項に記載の方法。
前記ｐＨが９よりも大きい、請求項１１に記載の方法。
前記第１の未知の核酸塩基が、リボースまたはデオキシリボース分子に共有結合している、請求項１〜１２のいずれか１項に記載の方法。
前記第１の未知の核酸塩基がメチル化核酸塩基である、請求項１〜１３のいずれか１項に記載の方法。
前記第１の未知の核酸塩基の電子署名が、滑らかに規則的な金基板上で決定される、請求項１〜１４のいずれか１項に記載の方法。
前記滑らかに規則的な金基板がＡｕ（１１１）である、請求項１５に記載の方法。
前記滑らかに規則的な金基板にプラズマ洗浄を施す、請求項１６に記載の方法。
前記滑らかに規則的な金基板が被覆されている、請求項１５〜１７のいずれか１項に記載の方法。
前記基板を１つまたは複数のイオン性分子を含む溶液で処理することで前記被覆を形成する、請求項１８に記載の方法。
前記溶液がポリ−Ｌ−リシンを含み、前記基板が荷電している、請求項１９に記載の方法。
前記核酸塩基がポリヌクレオチド中のヌクレオチドである、請求項１５〜２０のいずれか１項に記載の方法。
前記ポリヌクレオチドを押出及び沈着処理によって前記基板上に沈着させ、前記ポリヌクレオチドを並進運動によって前記基板の上に押し出す、請求項２１に記載の組成物。
前記基板がチャネルまたはウェルを含む、請求項１１〜２０のいずれか１項に記載の組成物。
前記チャネルまたはウェルが、マイクロ流体チャネルまたはウェルである、請求項２３に記載の組成物。
基板は滑らかに規則的な金基板である、前記基板と、
前記基板上の被覆と；
前記基板に接触する１つまたは複数の核酸塩基と
を含む組成物。
基板がＡｕ（１１１）である、請求項２５に記載の組成物。
前記基板が荷電している、請求項２５〜２６のいずれか１項に記載の組成物。
前記基板にプラズマ洗浄を施す、請求項２５〜２７のいずれか１項に記載の組成物。
前記基板を１つまたは複数のイオン性分子を含む溶液で処理することで前記被覆を形成する、請求項２５〜２８のいずれか１項に記載の組成物。
前記溶液がポリ−Ｌ−リシンを含み、前記基板が荷電している、請求項２９に記載の組成物。
前記１つまたは複数の核酸塩基が、ポリヌクレオチドに共有結合している、請求項２５〜３０のいずれか１項に記載の組成物。
前記ポリヌクレオチドを押出及び沈着処理によって前記基板上に沈着させ、前記ポリヌクレオチドを並進運動によって前記基板の上に押し出す、請求項３１に記載の組成物。
前記基板がチャネルまたはウェルを含む、請求項２５〜３２のいずれか１項に記載の組成物。
前記チャネルまたはウェルが、マイクロ流体チャネルまたはウェルである、請求項３３に記載の組成物。
未知の核酸塩基の電子署名を決定するための、請求項２５〜３４のいずれか１項に記載の組成物の使用。
前記電子署名が、ＬＵＭＯ、ＨＯＭＯ、Ｂａｎｄｇａｐ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値から選択される少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの値を含む、請求項３５に記載の使用。
前記１つまたは複数の核酸塩基が、１つまたは複数のリン酸塩分子を介して第２の未知の核酸塩基に共有結合している、請求項３５〜２６のいずれか１項に記載の使用。
前記第２の未知の核酸塩基が、ＬＵＭＯ、ＨＯＭＯ、Ｂａｎｄｇａｐ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値から選択される少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つの値を含む前記第２の未知の核酸塩基の電子署名を決定することによって同定される、請求項３７に記載の使用。
前記１つまたは複数の核酸塩基が、修飾または未修飾のアデニン、グアニン、シトシン、チミン、及びウラシルからなる群から選択される、請求項３５〜３８のいずれか１項に記載の使用。
前記１つまたは複数の核酸塩基の電子署名を、酸性、中性、及び塩基性から選択される１つまたは複数のｐＨ環境で決定し、同じｐＨ環境で回収された前記１つまたは複数の既知の塩基の電子指紋と比較する、請求項３５〜３９のいずれか１項に記載の使用。
前記ｐＨ環境が塩基性である、請求項４０に記載の使用。
前記ｐＨが９よりも大きい、請求項４１に記載の使用。
前記ｐＨ環境が酸性である、請求項４０に記載の使用。
前記ｐＨが３未満である、請求項４３に記載の使用。
第２のｐＨ環境が塩基性である、請求項４１〜４４のいずれか１項に記載の使用。
前記ｐＨが９よりも大きい、請求項４５に記載の使用。
第１の未知のヌクレオチドの同定方法であって、
ポリ−リシン被覆超平滑配向金（１１１）表面上に配置されている未知のヌクレオチドに走査トンネリング分光法を行うことと；
酸性ｐＨで前記未知のヌクレオチドに対する走査トンネリングデータを回収することと；
前記走査トンネリングデータを処理して、ＬＵＭＯ、ＨＯＭＯ、Ｂａｎｄｇａｐ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の値から選択される３つまたはそれ以上のパラメータの値を生成することと；
前記ＨＯＭＯ値が−１．０９〜−１．６９であり；
前記ＬＵＭＯ値が約１．６６〜１．１８であり；
前記Ｂａｎｄｇａｐ値が約３．２２〜２．４０であり；
前記Ｖ_{ｔｒａｎｓ＋}値が約１．３４〜０．９６であり；
前記Ｖ_{ｔｒａｎｓ−}値が約−０．１９〜−０．８３であり；
前記Φ_ｅ−値が約２．０２〜０．８８であり；
前記Φ_ｈ＋値が約１．６４〜０．４２であり；
前記ｍ_ｅ−／ｍ_ｈ＋値が約０．５２〜０．０６；及び／または
前記ΔΦ値が約３．４６〜１．５である場合、
前記ヌクレオチドをアデニンとして同定することと；または
前記ＨＯＭＯ値が−１．１７〜−１．５５であり；
前記ＬＵＭＯ値が１．７２〜１．２４であり；
前記Ｂａｎｄｇａｐ値が３．１１〜２．５７であり；
前記Ｖ_{ｔｒａｎｓ＋}値が１．２６〜１であり；
前記Ｖ_{ｔｒａｎｓ−}値が−０．１９〜−０．７７であり；
前記Φ_ｅ−値が１．６３〜１．０３であり；
前記Φ_ｈ＋値が１．２９〜０．２９であり；
前記ｍ_ｅ−／ｍ_ｈ＋値が０．５７〜０．０７であり；
前記ΔΦ値が２．７７〜１．４７である場合、
前記ヌクレオチドをグアニンとして同定することと；または
前記ＨＯＭＯ値が−１．４７〜−２．１５であり；
前記ＬＵＭＯ値が２．７９〜１．９９であり；
前記Ｂａｎｄｇａｐ値が４．６９〜３．７１であり；
前記Ｖ_{ｔｒａｎｓ＋}値が１．６５〜１．０３であり；
前記Ｖ_{ｔｒａｎｓ−}値が−０．５４〜−１．０６であり；
前記Φ_ｅ−値が３．５１〜１．７３であり；
前記Φ_ｈ＋値が２．２〜０．９４であり；
ｍ_ｅ−／ｍ_ｈ＋値が０．９５〜０．３３であり；
前記ΔΦ値が５．３６〜３．０２である場合、
前記ヌクレオチドをシトシンとして同定することと；または
前記ＨＯＭＯ値が−１．１９〜−１．５７であり；
前記ＬＵＭＯ値が２．９８〜２．３８であり；
前記Ｂａｎｄｇａｐ値が４．３８〜３．７４であり；
前記Ｖ_{ｔｒａｎｓ＋}値が１．８〜１．０６であり；
前記Ｖ_{ｔｒａｎｓ−}値が−０．２５〜−０．６３であり；
前記Φ_ｅ−値が３．４４〜２．０６であり；
前記Φ_ｈ＋値が１．２５〜０．４５であり；
ｍ_ｅ−／ｍ_ｈ＋値が０．５〜０．１６であり；
前記ΔΦ値が４．３４〜２．８８である場合、
前記ヌクレオチドをチミンとして同定することと
を含む前記方法。
プロセッサと；
少なくとも１つの量子トンネリングチップを有する読取ヘッドと；
ポリヌクレオチドに結合している核酸塩基の１つまたは複数の群を含む試料を支持するステージと；
前記プロセッサに連結し、前記読取ヘッドと前記ステージの間に電圧を提供するバイアス電圧と；
前記バイアス電圧と前記読取ヘッドの間に連結され、前記プロセッサに電流を提供する電流センサと
を含むシーケンサであって、
前記プロセッサは、指示を実行して、前記試料にわたる一連の位置で電子署名データを取得し、位置に従って前記電子署名データを保存し、
個々の核酸塩基は、前記電子署名データに基づいて同定することができる
前記シーケンサ。
前記読取ヘッドが単一チップ読取ヘッドである、請求項４８に記載のシーケンサ。
前記読取ヘッドが、マルチチップアレイであり、前記マルチチップアレイが、前記マルチチップアレイの個々のチップからの電流を独立して読み取ることができるように配置されている、請求項４８に記載のシーケンサ。
前記マルチチップアレイの個々のチップからの電流を同時に読み取る、請求項５０に記載のシーケンサ。
前記ポリヌクレオチドを、導電性基板の上に押し出す、請求項４８に記載のシーケンサ。
前記導電性基板が、ポリヌクレオチドが押し出されるチャネルを含む、請求項５２に記載のシーケンサ。
前記導電性基板が平坦な（１１１）金基板である、請求項５２または５３に記載のシーケンサ。
前記プロセッサが、命令を実行して、
（ａ）開始位置で前記試料に対して前記読取ヘッドを位置決めし；
（ｂ）前記電圧を走査し、前記電流を測定し、電子署名データを取得し；
（ｃ）前記読取ヘッドと前記試料の間の位置に対する前記電子署名データを保存し；
（ｄ）走査パターンに従って前記試料に対する前記読取ヘッドを再位置決めし；
（ｅ）前記走査パターンが完了するまで、工程（ｂ）〜（ｅ）を繰り返す、請求項４８に記載のシーケンサ。
前記プロセッサがさらに、命令を実行して、
前記電子署名データに基づいて前記核酸塩基の位置を同定し；
前記電子署名データから前記同定位置でのパラメータ指紋を算出し；
前記パラメータ指紋に基づいて前記核酸塩基を同定する、請求項４８に記載のシーケンサ。
前記電子署名データを別個のコンピューティングシステムに提供し、前記別個のコンピューティングシステムが、命令を実行して、
前記電子署名データに基づいて前記核酸塩基の位置を同定し；
前記電子署名データから前記同定位置でのパラメータ指紋を算出し；
前記パラメータ指紋に基づいて前記核酸塩基を同定する、請求項４８に記載のシーケンサ。
前記電子署名データからｄＩ／ｄＶ、ＨＯＭＯ、及びＬＵＭＯパラメータを算出することと；
前記パラメータを前記導電性基板のものと比較することと；
前記導電性基板のみの上のどこに前記チップが配置されており、かつ、前記比較に基づいて核酸塩基の上のどこに前記チップが配置されているかを同定すること
によって前記核酸塩基の位置を同定する、請求項５６または５８に記載のシーケンサ。
パラメータ指紋を算出することが、ＬＵＭＯ、ＨＯＭＯ、Ｂａｎｄｇａｐ、Ｖ_{ｔｒａｎｓ＋}（Ｖ）、Ｖ_{ｔｒａｎｓ−}（Ｖ）、Φ_ｅ−（ｅＶ）、Φ_ｈ＋（ｅＶ）、ｍ_ｅ−／ｍ_ｈ＋、及びΔΦ（ｅＶ）の群から選択される前記パラメータの少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、または少なくとも９つを含む前記電子署名データから算出することを含む、請求項５６または５７に記載のシーケンサ。
前記パラメータ指紋に基づいて前記核酸塩基を同定することが、前記パラメータ指紋を指紋データベースに保存されている既知の指紋と比較することを含む、請求項５９に記載のシーケンサ。
前記パラメータ指紋を比較することが、前記パラメータ指紋が、前記指紋データベースに保存されている既知の指紋のグループ内である確率を決定することを含む、請求項６０に記載のシーケンサ。
１つまたは複数の核酸塩基を含む組成物を同定するデバイスであって、
金基板はプラズマ洗浄を施されている滑らかに規則的なＡｕ（１１１）である、前記金基板と、；
イオン性ポリマーを含むイオン性被覆と
を含む、前記デバイス。
前記ポリマーがポリ−リシンである、請求項６２に記載のデバイス。