JP2007530020A

JP2007530020A - 核酸の配列決定のための方法および手段

Info

Publication number: JP2007530020A
Application number: JP2007504316A
Authority: JP
Inventors: リンナルソン，ステン
Original assignee: ゲニゾンバイオサイエンシスインコーポレイテッド
Priority date: 2004-03-25
Filing date: 2005-03-17
Publication date: 2007-11-01
Also published as: GB0406769D0; US20070287151A1; GB2413796B; GB2413796A; AU2005225525A1; WO2005093094A3; EP1737977A2; CA2559541A1; CN101014719A; WO2005093094A2

Abstract

一群の核酸プローブが、所望の配列情報への鋳型を含む核酸にアニールされ、鋳型内での各プローブに相補的な配列の存在または非存在の判定を含むことによって配列情報を提供する、核酸配列決定、特に高密度フィンガープリンティングに関する。鋳型に少なくとも部分的に関連する参照配列が使用される。

Description

本発明は、核酸の配列決定に関する。

本発明は、特に、所望の配列情報に対する鋳型を含む核酸に一群の核酸プローブがアニーリングされる「高密度フィンガープリンティング」に関し、鋳型内の各プローブに対する相補的な配列の存在または非存在の判定によって配列情報がもたらされる。本発明の一部は、少なくとも部分的に鋳型に関連する参照配列の使用に基づき、既存の配列決定技術に伴う様々な問題を克服し、標準的な試薬および装置を用いて極めて大量の配列を１日の内に得ることを可能にする。好ましい実施形態では、さらなる利点を発揮することが可能になる。本発明は、配列解析用のアルゴリズムおよび技術、ならびに配列決定のための装置およびシステムにも関する。本発明は、当該技術において容易に利用することができる標準的なベンチトップ機器のみを利用し、膨大な配列決定に向けた努力を自動化することを可能にする。

本発明は、各プローブが鋳型にハイブリダイズするか否かを判定することによって標的の「ハイブリダイゼーションスペクトル」を形成する連続的工程における一群のプローブのハイブリダイゼーションに関与するものであり、各プローブは一もしくは複数のオリゴヌクレオチド分子を含む。好ましくは、一群のプローブと鋳型鎖の長さを調節することで、「表示プローブ」（鋳型鎖に確実にハイブリダイズするプローブ）とともに任意の所定の鋳型鎖の高密度範囲が確定される。本発明は、得られたハイブリダイゼーションスペクトルと、鋳型鎖に類似する一もしくは複数の配列を含むことが期待される参照データベースとを比較することにより、一もしくは複数の参照配列内における鋳型鎖の一もしくは複数の予想される位置を決定することに、さらに関与する。本発明は、鋳型鎖のハイブリダイゼーションスペクトルを、その一もしくは複数の位置で期待されるハイブリダイゼーションスペクトルと比較することをさらに可能にし、それによって鋳型鎖の少なくとも部分的な配列情報が得られる。

ゲノム研究では多くの異なる方法が用いられるが、直接配列決定が最も重要なものである。実際、配列決定が十分かつ効率的に実施できる場合、ゲノミクスにおける主要な科学的問題のうちの３つ（配列の決定、遺伝子型同定、および遺伝子発現解析）すべてに対処することが可能であろう。モデル種の配列決定が可能で、個体の全ゲノム配列決定による遺伝子型同定が可能であり、ｃＤＮＡへの変換および配列決定（各ｍＲＮＡのコピー数を直接計数する）によりＲＮＡ集団を徹底的に解析することが可能であろう。

配列決定によって対処可能な科学的および医学的問題の他の例として、エピゲノミクス（ゲノム内のメチル化シトシンの研究−メチル化されていないシトシンからウリジンへのｂｉｓｕｌｆｉｔｅ変換と、それに続く得られた配列と変換されていない鋳型配列との比較による）、タンパク質−タンパク質相互作用（酵母２ハイブリッド実験で得られたヒットの配列決定による）、タンパク質−ＤＮＡ相互作用（染色体の免疫沈降後に得られたＤＮＡ断片の配列決定による）、ならびに多数のその他が含まれる。それ故、ＤＮＡ配列決定には高効率的な方法が望ましい。

しかし、マイクロアレイおよびＰＣＲ断片解析などの補助的方法に取って代わるためには、配列決定の極めて高度なスループットが要求される。例えば、生細胞は、約３００，０００個のメッセンジャーＲＮＡのコピーを含み、各コピーの平均塩基長が約２，０００である。したがって、１個の細胞内でさえＲＮＡを完全に配列決定するのに、６億個のヌクレオチドをプローブしなければならない。多数の異なる細胞種からなる複雑な組織では、細胞種に特異的な転写物がさらに希釈されるために、作業がなお一層困難なものになる。これらの要求を満たすには、１日にギガベースのスループットが必要となる。下記の表は、各実験に要求されるスループットに関する見積もりの一部を示す（他に指定されないかぎり、ヒト）。

本発明は、上記のすべてを適正なコストで手の届く範囲内に設定する。

ＤＮＡの配列決定のための方法
蛍光ジデオキシヌクレオチドを用いるサンガーの配列決定（サンガー（Ｓａｎｇｅｒ）ら、ＰＮＡＳ７４ｎｏ．１２：５４６３−５４６７頁、１９７７年）は、最も広く用いられる方法であり、９６ひいては３８４−キャピラリーのシークエンサにおいて自動化に成功している。しかしながら、該方法は、鋳型の各塩基位置に対応する多数の断片の物理的分離に依存するため、極めて高度なスループットをもつ配列決定（現行の最高の機器は１日あたり最大２００万のヌクレオチド配列を生成する）まで容易に拡張可能ではない。

一群のプローブから選択されたプローブを用いて標的ポリヌクレオチドをプローブすることよって間接的に配列を得ることも可能である。

ハイブリダイゼーションによる配列決定（sequencing by hybridization; ＳＢＨ）では、最大で特定の長さのすべてのあり得る配列を表す一群のプローブが使用され（すなわち、１セットがすべてｋ量体、ｋはマイクロアレイ表面上に適合可能なプローブの数によって制限；１００万本のプローブではｋ＝１０を用いることが可能）、鋳型がハイブリダイズされる。プローブセットから鋳型配列を再構築することは、複雑であり、ハイブリダイゼーションの動態の性質が本質的に予測不可能であることや、より大きな鋳型の配列決定に必要とされるプローブの数の組み合わせが膨大になることによって一層困難なものになる。たとえこれらの問題を克服可能であるとしても、各鋳型に対する何百万ものプローブを保有する１つのマイクロアレイが必要とされ、アレイは通常再利用できないことから、スループットは必然的に低いものになる。

ＳＢＨに対する代替アプローチは、固体表面上に鋳型を置き、次いで一群のプローブを連続的にハイブリダイズさせることである。このアプローチを用いて多数の鋳型を同時に配列決定することが可能であるが、プロトコルの本質が連続的であることによって一群のプローブのサイズが必然的に制限される。結果として、極めて短い鋳型に限って配列決定できる。実際、ｋ量体のプローブによって配列決定可能と期待される長さは、２^ｋにすぎない。すなわち１６３８４プローブ（ｋ＝７）を用いると１２８ヌクレオチドである。実際のハイブリダイゼーション時間では、かかるプロトコルは実現可能ではない。ドルマナク（Ｄｒｍａｎａｃ）ら、ＮａｔｕｒｅＢｉｏｔｅｃｈ１９９８年（１６）：５４−８頁）の筆者らは、そこで同時にハイブリダイズ可能な何百もの分離膜上にある各鋳型を複製することによって同問題の克服に努めている。しかしながら、かかる次善策では、スループットが制限され、鋳型調製方法に関してさらなる要望が提起される。

ナノポアシーケンシング（ＵＳゲノミクス（ＵＳＧｅｎｏｍｉｃｓ）、米国特許第６３５５４２０号明細書）では、長いＤＮＡ分子が２つの反応チャンバを分離するナノポアを通過させられるにつれて、結合したプローブをチャンバ間の伝導度における変化として検出可能であるという事実が利用される。すべてのあり得るｋ−量体のサブセットでＤＮＡを修飾することにより、部分配列を推定することが可能である。ナノポアのアプローチによる完全配列の獲得に対してこれまで実現可能な戦略が全く提案されていないが、もしそれが可能であれば、原理的には驚異的なスループット（３０分以内にヒトゲノム１セット程度）が達成可能であろう。

合成による配列決定（sequencing by synthesis; ＳＢＳ）においては、様々なアプローチが設計されてきた。

配列決定のスループットを増大させるためには、例えばガラス表面または類似の反応チャンバの上で多数の鋳型上での各塩基の取り込みを同時に視覚化できることが望ましいであろう。これはＳＢＳによって達成される（例えば、マラメデ（Ｍａｌａｍｅｄｅ）ら、米国特許第４８６３８４９号明細書、クマール（Ｋｕｍａｒ）、米国特許第５９０８７５５号明細書）。ＳＢＳに対しては２つのアプローチがある。すなわち、各々の取り込まれたヌクレオチドから放出された副産物が検出されるか、または永久的に付着した標識が検出される。

パイロシーケンシング（例えば、国際公開第９３／２３５６４号パンフレット）では、取り込まれた各単量体の副産物を無機二リン酸塩（ＰＰｉ）の形態で検出することによって鋳型の配列が決定される。すべての鋳型分子の反応の同期化状態を保つために、単量体が一度に１つずつ付加され、次の付加前に取り込まれていない単量体が分解される。しかしながら、多重の取り込みを阻止できないことから、単独重合体のサブ配列（同一単量体のラン）が問題を起こす。（鋳型の小分画での取り込みの欠如または取り込みの誤りによって最終的に真のシグナルを破壊することから）最終的に同期化が崩れ、現行の最高のシステムは、約２００，０００塩基／日の組み合わされたスループットによっても約２０〜３０塩基しか読み取ることができない。

サンガー配列決定は各鋳型に対して精巧な装置（すなわちキャピラリー）を必要とする一方で、パイロシーケンシングは単一の反応チャンバ内で容易に並列化することができる。米国特許第６２７４３２０号明細書では、光ファイバに付着されたタンデムリピート線状１本鎖ＤＮＡ分子を生成し、ここで並列処理が可能なパイロシーケンシング反応において解析される、ローリングサークル増幅の利用が記載されている。原理上、かかるシステムのスループットは、表面積（鋳型分子数）、反応速度およびイメージング機器（解像度）によってのみ制限される。しかしながら、ＰＰｉが検出可能なシグナルに変換される前に検出器から遠くへ拡散することを阻止する必要性は、反応部位の数が実際上制限されなければならないことを意味する。米国特許第６２７４３２０号明細書では、各反応が光ファイバの先端表面に位置する小型の反応容器内で生じるように制約されることから、ファイバ１本あたりの配列数が１つに制限されている。

さらにより制限的であるのは、パイロシーケンシングによって得られる読み取り長さの短さ（＜５０ｂｐ）である。かかる短い配列は、全ゲノム配列決定において常に有用とは限らず、反応の平衡を保つセットが複雑であるが故に、読み取り長さの大幅な拡張が困難になる。報告されている最大１００ｂｐの読み取り長さは、極まれであって特定の鋳型についてのものである。

放出された標識の検出を備える類似のスキームが米国特許第６２５５０８３号明細書に記載されている。ヌクレオチドの連続的付加およびエキソヌクレアーゼによって開裂された標識の検出を備えるスキームが国際公開第０１／２３６１０号パンフレットに記載されている。

放出された標識または副産物の検出における主要な利点は、鋳型が後続する工程において無標識状態のままである点である。しかしながら、シグナルが鋳型から遠くに拡散することから、かかる配列決定スキームをマイクロアレイなどの固体表面上で並列化させることは困難でありうる。

様々な態様において本発明は、先行技術の課題に巧妙に対処する。

本発明は、一態様において、従属請求項および明細書に記載される様々な実施形態とともに、請求項１に記載される配列決定方法を提供する。

請求項１の方法において、ローリングサークル増幅による該鋳型分子の増幅は、標的配列の多重コピーを含むタンデムリピート増幅産物が形成されるように増幅プライマーの伸長および鎖置換を引き起こす条件下で、ポリメラーゼおよび三リン酸塩を添加する工程を含んでもよい。

使用されるプローブ群は、さらに下記で説明されるように完全群または部分群であってよい。

鋳型の配列に対する参照配列は類似配列になろう。参照配列と鋳型の間の類似性は、多数の方法で測定可能である。例えば、同一ヌクレオチド位置の割合が広く利用される。より高度な測定では、例えばスミス−ウォーターマン（Ｓｍｉｔｈ−Ｗａｔｅｒｍａｎ）のアライメントのように挿入および欠失の測定が可能になり、ダービン（Ｄｕｒｂｉｎ）ら「ＢｉｏｌｏｇｉｃａｌＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓ」（ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ１９９８年）のように確率的類似性スコア（ｐｒｏｂａｂｉｌｉｓｔｉｃｓｉｍｉｌａｒｉｔｙｓｃｏｒｅ）が提供される。

本発明の方法に要求される類似度は、使用されるプローブの数と特異性、ハイブリダイゼーションデータの質、鋳型の長さおよび参照データベースのサイズを含むいくつかの因子によって決定される。例えばシミュレーションによると、マッチプローブとミスマッチプローブの間で５℃の融点差がある（変動係数が１℃の）条件下で、２５６本のプローブおよび１００ｂｐの鋳型を有する参照としてのヒトゲノムの利用、それから最大で５％の配列の相違が許容可能であることが示される。これは例えば、参照としてヒトゲノムを利用してゴリラゲノムの配列決定を行うことに対応する。さらにプローブ数の増加、鋳型の長さの減少またはマッチ／ミスマッチの識別の改善により、例えば５〜１０％、最大で１０％、５〜２０％、１０〜２０％または最大で２０％といったなお一層類似性が低い配列が参照として使用されうる。

本発明は、再配列決定、発現プロファイリング、遺伝的変動の解析または評価、およびエピゲノミクスなどにおいて、様々な方法で適用可能である。

配列決定されるべき核酸はいかなるものも対象とすることができ、全ゲノム、ＢＡＣ、一もしくは複数の染色体、ｃＤＮＡおよび／またはｍＲＮＡであるとか、これらから得られるあるいはこれらを由来とするものであってもよい。

一もしくは複数の入力分子は、例えば、ｄｓＤＮＡ、ＤＮＡ／ＲＮＡ、ｄｓＲＮＡ、ｓｓＤＮＡまたはｓｓＲＮＡを例とする２本鎖あるいは１本鎖であってよい。

様々な実施形態が以下のように実施されうる。

第１工程（工程１）は断片化、特に短い断片のショットガンライブラリの生成を含みうる。例えば、以下の方法を含む、断片を生成する酵素的および／または機械的方法を用いてもよい。
酵素的：
○ＤｎａｓｅＩによる分解（Ｍｎ^２＋の存在下）、次いでダングリングｓｓＤＮＡ末端の充填および／または酵素による短縮；
○ＭｂｏＩなどの比較的よく用いられるカッターによる切断；
○ＣｖｉＪＩ、ＣｖｉＪＩ^＊などの極めてよく用いられるカッターによる部分的切断；
○制限酵素の混合による切断；
機械的：
○フレンチプレス；
○超音波処理；
○剪断；
上記各々の次に酵素による短縮および末端修復を行ってもよい。；
ＰＣＲ
○ヘキサマーなどのランダムプライミング配列の使用（場合によってｎｅｓｔｅｄＰＣＲのための配列を用いてテイリングされる）；
○変性プライマーまたは低ストリンジェンシーの条件を用いたＰＣＲによる；
○遺伝子ファミリーに特異的なプライマー（など）を用いたＰＣＲによる

ＰＣＲのアプローチにおいて、ＲＣＡ（ローリングサークル増幅）プライマーのアニーリング部位を導入する配列でプライマーのテイリングを行うことで、場合によってこの工程を工程２と組み合わせてもよい。

場合によって、後述するように、第１工程の後に工程「Ｘ」を実施してもよい。

第２工程（工程２）（場合によって工程Ｘに後続する）は、ＲＣＡプライマーのアニーリング配列の導入を含みうる。これは例えば、ベクター（例えば細菌ベクター、ファージなど）内へのクローニング、次いでクローニング部位ならびにプライマーのモチーフの外側に置かれる制限酵素を用いる切断；一端もしくは両端での２本鎖アダプターのライゲーション；または各末端でのヘアピンアダプターのライゲーション（同時環状化を引き起こす）による場合がある。取り込まれうる任意の追加的で機能的な特徴には、環状化を促進する特徴および／またはヘルパーオリゴが下流分析のＦＲＥＴにおいてドナーまたはアクセプタとして機能しうるヘルパーオリゴ結合部位が含まれる。

場合によって、後述するように、工程２の後に工程「Ｘ」を実施してもよい。

第３工程（工程３）は、１本鎖環状ＤＮＡの生成を含みうる。これは例えば、融解およびマラカス形状での末端間の自己アニーリングの後のヘアピンアダプターのライゲーション；ｄｓＤＮＡの自己ライゲーションとそれに続く融解；ｄｓＤＮＡ環を形成するためのヘルパー断片へのライゲーションとそれに続く融解；ダンベル形状でのｄｓＤＮＡの両末端へのヘアピンアダプターのライゲーション；ヘルパーのリンカー（ＲＣＡプライマーとしても機能しうる）を用いてのｓｓＤＮＡの自己ライゲーションによる場合がある。

工程２および３は、場合によって単一の工程に統合してもよく、そこでは例えば環状化によってＲＣＡプライマーのアニーリング配列および任意の他の望ましい特徴が同時に導入される。

第４の工程（工程４）は、ローリングサークル増幅（ＲＣＡ）を含みうる。これは以下のプロトコルに従う場合がある。
・環状ｓｓＤＮＡに対してＲＣＡプライマーをアニールする。プライマーは固定化のために使用可能な反応性部分を保有する必要がある。
・ＲＣＡプライマーの付着基を用い、プライマー／鋳型複合体を活性化したアレイの表面にランダムに固定化する。同表面上のプライマー／鋳型複合体の密度は、ＲＣＡ増幅後に重複産物（ｏｖｅｒｌａｐｐｉｎｇｐｒｏｄｕｃｔｓ）を生成することなく表面上のプライマー／鋳型複合体が最大数になるのに最適化される必要がある（下記参照）。同表面上のプライマー／鋳型複合体の密度は、例えばプライマー／鋳型複合体の濃度、表面上の付着部位の密度および／または反応条件（時間、緩衝液、温度など）によって制御されうる。
・ＲＣＡプライマーの付着基を利用して、活性化したアレイの表面にプライマーをランダムに固定化する。同表面上のプライマーの密度は、ＲＣＡ増幅後に重複産物を生成することなく表面上のプライマー／鋳型複合体が最大数になるのに最適化される必要がある（下記参照）。同表面上のプライマーの密度は、例えばプライマーの濃度、表面上の付着部位の密度および／または反応条件（時間、緩衝液、温度など）によって制御されうる。
・ＲＣＡプライマーを環状ｓｓＤＮＡにアニールする。プライマーは、固定化のために使用可能な反応性部分を保有する必要がある。

固定化およびアニーリングの後、次いで
・ポリメラーゼおよび４つのｄＮＴＰを添加することでローリングサークル増幅を開始する。
・場合によってＲＣＡにＦＲＥＴにおける蛍光ドナーまたは蛍光アクセプタとして機能可能な蛍光標識を組み込む。
・場合によってＲＣＡに、
○タグに対して親和性を有する多価リンカー分子を用いる、内部架橋によるＲＣＡ産物の縮合；
○タグに対して親和性を有する分子とコンジュゲートされる蛍光標識を用いる、増幅後の標識、
といった複数の目的のために使用可能なアフィニティータグを組み込む。

あるいは、ＲＣＡを溶液中で実施し、増幅後に産物を固定化してもよい。例えば、増幅および固定化に対して同一のプライマーを使用してもよい。別の選択肢では、固定化基を保有する修飾されたｄＮＴＰを増幅過程で取り込み、次いで取り込まれた固定化基を用いて増幅産物を固定化してもよい。例えば、ビオチン−ｄＵＴＰ、またはアミノアリル−ｄＵＴＰ（シグマ（Ｓｉｇｍａ））を使用してもよい。

第５の工程すなわち工程５では、配列決定を行う。
・後述するように、一群の非固有プローブの連続ハイブリダイゼーションを用い、アレイ上で様々な鋳型の完全配列または部分配列を決定する。
・場合によって各鋳型の配列情報を、探索中の試料の典型的な配列のデータベースと比較することにより、試料内における各標的の相対比率および／またはデータベースに対する任意の遺伝的または他の構造的な差異を判定する。

工程Ｘについては既に触れている。それは断片サイズの範囲（理想的には極めて優れた解像度１〜１０％ＣＶを有する）の選択工程である。利用可能な技術として以下のものが挙げられる。
・○ｄｓＤＮＡによるＰＡＧＥ
○ｓｓＤＮＡによるＰＡＧＥ
○アガロースゲル
を用いたゲル電気泳動および溶出による；
・クロマトグラフィー（例えばＨＰＬＣ、ＦＰＬＣ）による；
・アフィニティータグ、例えばｃＤＮＡ上での３’−ビオチンの使用。

これらの工程は、本発明の態様および実施形態に従って方法の工程を実施する好ましい任意の工程および方法の開示を提供する。本明細書では、本発明の態様および実施形態として本明細書において逐語的に定義されるように、工程内で開示される特徴のすべての組み合わせが提供される。

本発明は、先に記載の配列決定方法を改善した新規配列決定方法の開発に基づく一方、それらの困難の大部分を回避することを可能にする。それは、並列化しやすく（サイズ分画が不要）、長い読み取り長さに対して可能性をもたらす戦略である。

本発明に従う方法は、３つの基本工程を含みうる。第１に、複数の鋳型鎖を含む試料から局所的に増幅された鋳型分子のランダムアレイが生成される（好ましくは単一の工程で）。第２に、ランダムアレイは、アレイ上で増幅された各鋳型内の各プローブに相補的な配列の存在または非存在の判定を伴う、一群のプローブを用いた連続ハイブリダイゼーションに従う。第３に、こうして得られたハイブリダイゼーションスペクトルを、あり得る挿入、欠失、多型、スプライス変異体または注目すべき他の配列上の特徴の決定を可能にする方法を有する参照配列データベースと比較する。比較工程は、探索工程とそれに続く整列化工程にさらに分かれる場合がある。

ランダムアレイ合成（Ｒａｎｄｏｍａｒｒａｙｓｙｎｔｈｅｓｉｓ）
増幅された鋳型を高密度で提供するには多数のアプローチが存在する。第１に、増幅された鋳型を機械的手段によってアレイ化してもよいが、各々個別の鋳型分子に対して別々の増幅反応が必要である（それ故にスループットが制限されてコストが増大する）。第２に、ｉｎ−ｇｅｌＰＣＲを用いて鋳型をｉｎｓｉｔｕで増幅してもよい（例えば、米国特許第６４８５９４４号明細書およびミトラＲＤ（ＭｉｔｒａＲＤ）、チャーチＧＭ（ＣｈｕｒｃｈＧＭ）、「ＩｎｓｉｔｕｌｏｃａｌｉｚｅｄａｍｐｌｉｆｉｃａｔｉｏｎａｎｄｃｏｎｔａｃｔｒｅｐｌｉｃａｔｉｏｎｏｆｍａｎｙｉｎｄｉｖｉｄｕａｌＤＮＡｍｏｌｅｃｕｌｅｓ」、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ１９９９年：２７（２４）：ｅ３４に記載の通り）が、ゲルの使用が必要である（それ故に後続するハイブリダイゼーション反応と著しく干渉する。）。

本発明では、複数の鋳型分子を含む試料から単一の反応でランダムアレイを合成するために、ローリングサークル増幅が有利に利用される。最大１０^５〜１０^７／ｍｍ^２の密度が達成可能である。本発明の実施形態において利用されるランダムアレイ合成プロトコルは以下を含みうる。
ａ．活性化表面を有する表面（例えばガラス）を提供する。
ｂ．好ましくは共有結合を介してプライマーを付着させる。または共有結合の代わりに、強力な非共有結合（ビオチン／ストレプトアビジンなど）を用いてもよい。
ｂ．好ましくは検出機器に適する密度で環状１本鎖鋳型を添加する。
ｃ．鋳型をプライマーにアニールする。
ｄ．ローリングサークル増幅を用いて増幅することで、各位置で表面に付着した長い１本鎖タンデムリピート鋳型が生成する。

リザーディ（Ｌｉｚａｒｄｉ）らは、「アイソサーマル・ローリングサークル増幅を利用した変異検出および一分子計数（Ｍｕｔａｔｉｏｎｄｅｔｅｃｔｉｏｎａｎｄｓｉｎｇｌｅ−ｍｏｌｅｃｕｌｅｃｏｕｎｔｉｎｇｕｓｉｎｇｉｓｏｔｈｅｒｍａｌｒｏｌｌｉｎｇｃｉｒｃｌｅａｍｐｌｉｆｉｃａｔｉｏｎ）」：ＮａｔｕｒｅＧｅｎｅｔｉｃｓ第１９巻、２２５頁を著している。

この手順の修正には、固定化前に環状鋳型分子の活性化プライマーへの予備アニーリングを行うこと、および／またはプライマーへのアニーリングの際に環状化され、ライゲーション反応を用いて閉じられる「開環」鋳型分子を提供することが含まれる。

「適切な密度」とは、好ましくはスループットを最大にする密度である。例えば、できるだけ多数の検出器（または検出器内の画素）が単一の鋳型分子を確実に検出する限界希釈である。任意の規則的なアレイ上での完全な限界希釈では、すべての位置の３７％が単一の鋳型を保持し（ポアソン分布の形態故に）、残りが１つも保持しないか２つ以上保持することになる。

例えば、６μｍの画素サイズを有するＴｅｃａｎＬＳ４００上では、７．５×２．２ｃｍの反応表面が４，５００万画素を有する。限界希釈（ポアソン分布）を用いると、同画素の３７％が単一の鋳型、すなわち１７００万の鋳型を保持する。各鋳型上での１５０個のヌクレオチドの配列決定では、１５０サイクルで２．５Ｇｂの配列がもたらされる。５分のサイクル時間で１日のスループットは約５Ｇｂｐであり、これはヒトゲノムの完全配列２セットに相当する。実際、信頼性よく特徴を検出するには２画素以上が必要でありうるが、検出器が単一の画素であるか複数の画素であるかに同じ論理が適用できる。

固相のＲＣＡに適する鋳型については、収量（鋳型配列のコピー数による）が最適化される一方で、下流の適用に適する配列が提供される必要がある。概して、小さい鋳型が好ましい。特に鋳型は、プライマー結合配列が２０〜２５ｂｐおよびインサートが４０〜５００ｂｐから構成可能である。ここでインサートは４０〜１５０ｂｐであってもよい。しかしながら、最大５００ｂｐまたは最大１０００ｂｐまたは最大５０００ｂｐの鋳型も考えられるが、同鋳型は配列決定段階でより低いコピー数、それ故により低いシグナルをもたらすことになる。最初に線状鋳型を環状化させてかつ環状化後にＲＣＡを開始させるのに、プライマー結合配列を使用してもよい。または鋳型は、別々のＲＣＡプライマーの結合部位を含みうる。

ローリングサークル増幅を施された鋳型から生成されるシグナルを増大させるために、それらを濃縮する必要がありうる。ＲＣＡ産物が本質的に元の環状鋳型の１０００もしくはさらに１００００もの数のタンデムリピートからなる１本鎖ＤＮＡ分子であることから、同分子は極めて長いものになる。例えば、１００ｂｐの鋳型は、ＲＣＡを用いて１０００倍に増幅されると約３０μｍとなり、それ故に数個の異なる画素（５μｍ画素の解解像を仮定）を横切ってそのシグナルを拡散させることになる。細いｓｓＤＮＡ産物は、単に３０μｍの画素領域の極めて小さい部分を占めることから検出不能でありうるために、より低解像度の機器を用いても役に立たない可能性がある。したがって、シグナルを小さい領域内に濃縮できることが望ましい。

（リザーディ（Ｌｉｚａｒｄｉ）ら、上記）では、架橋剤としてエピトープで標識されたヌクレオチドおよび多価抗体を用いることによってＲＣＡ産物が縮合される。代替アプローチには、ストレプトアビジンによって架橋されたビオチン化ヌクレオチドが含まれる。

あるいは、ＣＴＡＢ（例えば、ブルームフェルド（Ｂｌｏｏｍｆｅｌｄ）「ＤＮＡｃｏｎｄｅｎｓａｔｉｏｎｂｙｍｕｌｔｉｖａｌｅｎｔｃａｔｉｏｎｓ」ｉｎ「Ｂｉｏｐｏｌｙｍｅｒｓ：ＮｕｃｌｅｉｃＡｃｉｄＳｃｉｅｎｃｅｓ」を参照）などのＤＮＡ濃縮剤を用いると濃縮が行われうる。

ＲＣＡプライマーオリゴヌクレオチドを表面に固定化させるために、多種のアプローチが著されている（例えば、リンドルーズ（Ｌｉｎｄｒｏｏｓ）ら、「Ｍｉｎｉｓｅｑｕｅｎｃｉｎｇｏｎｏｌｉｇｏｎｕｃｌｅｏｔｉｄｅａｒｒａｙｓ：ｃｏｍｐａｒｉｓｏｎｏｆｉｍｍｏｂｉｌｉｓａｔｉｏｎｃｈｅｍｉｓｔｒｉｅｓ」、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ２００１年：２９（１３）ｅ６９を参照）。例えば、ビオチン化オリゴは、ストレプトアビジンでコーティングされたアレイに付着されうる。ＮＨ_２で修飾されたオリゴは、エポキシシランで誘導体化されたまたはイソチオシアネートでコーティングされたスライドガラスに共有結合で付着されうる。スクシニル化されたオリゴは、アミノフェニルもしくはアミノプロピル由来のガラスとペプチド結合によってカップリングされうる。また、ジスルフィドで修飾されたオリゴは、チオール／ジスルフィド交換反応によってメルカプトシラン化されたガラス上に固定化されうる。さらに多数のものが文献に記載されている。

短いプローブの連続ハイブリダイゼーションによる再配列決定
本発明の配列決定アプローチは、各々のプローブおよび標的に対するマッチ／ミスマッチの識別を伴う、一群のプローブのハイブリダイゼーションを含む。その結果は、各標的の「スペクトル」である。さらに、提供される参照配列においてスペクトルが位置決めされアライメントされることで、参照に対する標的の配列における差異が高精度で判定可能である。

同スペクトルを利用することで、（１）参照配列内に各標的配列を明確に位置づけ、（２）標的と参照配列の間のあらゆる配列上の差異を正確に決定することが可能になるように、プローブ群および標的の長さが最適化される。

第１の要求を満たすために、同群が（情報理論的な意味で）十分な情報を含むことで、標的が厳密に位置づけられる。単一の特異的な標的を位置づけるのには単一の長い特異的なプローブで十分であるが、予測される各標的に対して別々のプローブが必要とされるため、それを使用することはできない。その代わり、短い非固有プローブが使用される。最適な群であれば、１本のプローブあたり１ビットの情報に対応する、各標的へのハイブリダイズの統計的確率が５０％であるプローブが使用される。５０本のかかるプローブであれば、１０兆を超える標的を識別する能力を有する。かかる群は、誤りおよび遺伝的多型に対して柔軟性があるという更なる利点を有する。発明者らの実験では、最大１０ＳＮＰの存在下でさえ、一群の１００本の４量体プローブがヒトトランスクリプトームにおいて１００ｂｐの標的を固有に配置する能力があることが示されている。

第２の要求を満たすために、プローブ群は、標的をカバーする必要があり、配列差異がスペクトルにおいて明確な変化をもたらすように設計されなければならない。例えば、一群のすべてのあり得る４量体プローブは４倍の冗長性を有する任意の所定の標的を完全にカバーするであろう。任意の単一ヌクレオチド変化により、４本のプローブのハイブリダイゼーションの失敗および４本の他の特徴的なプローブの獲得という結果を招くであろう。

プローブ群の感度は以下のように算出可能である。

プローブは、一もしくは複数のオリゴヌクレオチドの混合物である。同混合物および各オリゴヌクレオチドの配列は、プローブの特異性を定める。プローブの希釈因子は、プローブが含むオリゴヌクレオチドの数である。プローブの有効な特異性は、標的に結合するのと同じ確率を有する非変性オリゴヌクレオチドの長さによって与えられる。例えば、最初の位置がすべての４つのヌクレオチド間で変化する（すなわち完全に変性される）４つのオリゴヌクレオチドからなる６量体プローブは、５つのヌクレオチドの有効な特異性を有する。

一群とは、任意の所定のｋの長さの標的が同群内の１本および１本のみのプローブによってハイブリダイズされるという特性を有する１セットのｋ量体プローブである。したがって、一群は完全で冗長性のない１セットのプローブである。

１プローブ群の複雑度（ｃｏｍｐｌｅｘｉｔｙ）Ｃは、群内のプローブ数である。

一群内における位置の感度は、その位置で識別可能な異なる標的のセットである。例えば、プローブがある位置（ＧＣ／ＡＴで示される）で混合されたＧＣまたは混合されたＡＴである群は、Ｇ−Ａ、ＣＡ、Ｃ−ＴおよびＧ−Ｔの差異（すなわち転移）に感度を示すが、塩基転換（ＧからＣなど）には示さない。

完全なプローブ群によるプロービングの場合、標的内の各位置が群内の各位置、すなわちｋが互い違いに重なったプローブによって確実にプローブされる。しかしながら、各位置の感度が異なる場合があることから、標的内の一部の差異はｋより少ないプローブによってのみ検出可能である。

例えば、（ＧＣＡＴ）（ＧＣ／ＡＴ）（ＧＣ／ＡＴ）（Ｇ／Ｃ／Ａ／Ｔ）（Ｇ／Ｃ／Ａ／Ｔ）（ＧＣ／ＡＴ）（ＧＣ／ＡＴ）（ＧＣＡＴ）によって与えられる群は、８つの位置を有する（すなわちｋ＝８）。最初と最後の位置は完全に変性されることから、これらの位置によって標的内の変化が全く検出されない。転移（ＧＣ＜−＞ＡＴ）が６つの位置によって検出される一方、塩基転換（ＧＡ＜−＞ＣＴ）が各プローブ内の２つの位置のみによって検出される。各位置の有効な特異性を合計することによって有効な特異性の算出が可能である。すなわち、０＋０．５＋０．５＋１＋１＋０．５＋０．５＋０＝４ｂｐである。

重要な標的では、プローブが標的内で繰り返される場合が多くなるであろう。かかるプローブは、依然として他方とハイブリダイズすることから任意の単一の位置での変化に対するその感度を失わせる。

標的の長さをＬと仮定すると、発明者らは少なくとも１本のプローブがその位置での変化に感度を示す確率（標的内の各位置に対する）を算出することができる。まず発明者らは、何本のプローブが反復のない標的内での注目される変化に感度を示すかを解明する必要がある。このｋ_ｃについては、先例において転移では６であり、塩基転換では２である。

次いで、発明者らは、任意の所定のプローブが標的における他の位置の一もしくは複数に存在する（すなわちそれが繰り返される）という確率ｐ（Ｒ）が

であるという点に着目する。

２ｋ_ｃに感度を示すプローブのすべてが繰り返されるとは限らないという確率ｐ（Ｓ）が

である。

任意の変化がｋ_ｃプローブの消失およびｋ_ｃの新たなプローブの出現を引き起こすことから指数は２ｋ_ｃである。

発明者らは、現在では標的の長さで与えられる感度を算出することができる。例えば、Ｃ＝２５６、ｋ_ｃ＝２、Ｌ＝１２０は、ｐ＝９８％を与える、すなわち２５６本のプローブを有する群がすべての塩基転換の９８％（および転移の１００％、ｋ_ｃ＝６）に感度を示す。もし発明者らが、有効なｋ_ｃが１になるように群内のプローブの半分だけを使用する場合、塩基転換ではｐ＝８６％で、転移では９９．７％である（ｋ_ｃ＝３）。（６３％の転移を有する）ヒトのような種であれば、全体の平均感度は９５％である。

ＳＮＰの数が標的の長さに比べて少ない限り、すなわち１本のプローブ長の範囲内で複数のＳＮＰが生じない限り、この理論は厳密に有効である。実際の実験において、これはほぼ常に真実である。つまり例えば、ヒトゲノムＤＮＡは１０００ヌクレオチドあたりＳＮＰを１つ程度含むことから、７つの塩基内に２つのＳＮＰが存在する可能性は極めて低い。

実際、発明者らは、１つのＳＮＰを得るのに少なくとも２本の感度の優れたプローブを必要とする場合がある（すなわちハイブリダイゼーションデータが誤りやすいのが理由）。この場合、確率Ｐ（Ｓ）は１−ｐ（Ｒ）^{２ｋｃ−ｌ}になり、計算結果もまた単純である。

にもかかわらず、群のサブセットを用いて行う場合（時間と試薬を節約するため）、標的内の任意の位置が１本鎖もしくはそれ以外の上で確実にプローブされることが望ましい場合がある。換言すれば、発明者らは、プローブされない任意のｋ量体が反対鎖上で確実にプローブされるようにプローブのサブセットを探索する。かかるサブセットは、（Ｇ／Ａ）、（Ｃ／Ｔ）、（Ｇ／Ｔ）または（Ｃ／Ａ）を中央位置に配置することによって取得可能である。例えば（Ｇ／Ａ）は標的内のＧおよびＡをプローブできないであろう。ここで反対鎖がＣまたはＴであることが保証される場合にはプローブされる。他のバリエーションもあり得る。

（ＧＣ／ＡＴ）の変性位置は、２つの望ましい特徴を有する。第１に、それは各プローブ内の個々のオリゴが類似の融点を有することを保証する（それらがすべてのＧＣまたはすべてのＡＴであるため）。第２に、同位置はヒトのすべてのＳＮＰの６３％を表す転移に対して感度を示すであろう。

短いオリゴマープローブのハイブリダイゼーション
本発明では、一群のプローブが標的に対して連続的にハイブリダイズされることが示される。プローブ群の複雑度を制限するために、プローブを短く保つこと、好ましくは３〜６ｂｐだけの有効な特異性を有することが望まれる。ここで発明者らは、短いオリゴマープローブをハイブリダイズするための要求事項について記載する。

プローブはそれ自体のために有効にハイブリダイズするために安定化されるか、全く安定化されない。さらに安定化によってプローブと標的内に存在しうる任意の内部二次構造との競合が促進される。多種の方法において安定化が達成可能である。
・ハイブリダイゼーション反応において、塩、ＣＴＡＢ、マグネシウム、安定化タンパク質を例とする安定化添加剤を介する。
・プローブの複雑度を増大させずにその長さを拡張させる変性位置の添加を介する。例えば、「Ｎ」位置で拡張された６量体プローブは、実際には４つのオリゴヌクレオチドの混合物であってそれぞれが７塩基長を有するであろう。ＧとＣの混合またはＡとＴの混合を示す（ＧＣ／ＡＴ）位置は、プローブを１塩基分拡張させる一方、複雑度を２倍にするにすぎないだろう（それを４倍にする代わりに）。
・Ｌｏｃｋｅｄｎｕｃｌｅｉｃａｃｉｄ（ＬＮＡ）（エキシコン（Ｅｘｉｑｏｎ）、デンマーク）、ペプチド核酸および／またはマイナー・グルーブ・バインダー（エポック・バイオサイエンシーズ（ＥｐｏｃｈＢｉｏｓｃｉｅｎｃｅｓ）、米国）を例とするプローブ化学反応の修飾を介する。
・ＣＴＡＢ緩衝液中でハイブリダイズされるＬＮＡを有する変性プローブを例とする上記の組み合わせ。

これらの中で、１番目は標的をも安定化させることになる（それ故、潜在的にハイブリダイゼーションを阻止する安定な二次構造を誘導する）。プローブを選択的に安定化させる方法が好ましい。

ハイブリダイゼーションの検出
ハイブリダイゼーションの検出においては多数のアプローチが知られている。
・直接蛍光。プローブが標識され、標的にハイブリダイズされるプローブの上昇する局所濃度によってハイブリダイゼーションが検出される。これは高倍率、共焦点光学または全内部反射蛍光（ＴＩＲＦ）を必要とする場合がある。
・エネルギー伝達。プローブがクエンチャーまたはドナーによって標識され、標的が相手のドナーまたはクエンチャーによって標識される。ハイブリダイゼーションがドナー蛍光の減少および／またはクエンチャー蛍光における増加によって検出される。
・単一の塩基伸長。ハイブリダイズされたプローブが蛍光染色を取り込む単一の塩基伸長反応におけるプライマーとして機能する（あるいは、パイロシーケンシングなどでは放出されたＰＰｉが検出されうる）。

好ましいアプローチが以下に示される。
プローブは、エピ蛍光顕微鏡またはレーザースキャナーで検出可能な、例えばＣｙ３などの蛍光体によって標識される。多数の他の適切な染色は市販されている。プローブは、ハイブリダイズされたアレイの場所で、すべての液体中に存在するバックグラウンドを超えて、濃度の局所的上昇の検出を可能にするのに最適化された濃度でアレイにハイブリダイズされる。例えば、４００ｎＭが使用可能であり、または光学的設定に依存してプローブは１ｎＭ〜５００ｎＭもしくはさらに５００ｎＭ〜５μＭであってもハイブリダイズされうる。この検出スキームの利点は、それが洗浄工程を回避することから平衡ハイブリダイゼーション条件で検出の進行が可能であり、これによってマッチ／ミスマッチの識別が促進されるという点である。

エネルギー伝達アプローチが以下に示される。
標的は、蛍光ドナーによって恒久的にハイブリダイズされたヘルパーオリゴヌクレオチドを保有する。短いプローブを融解させる洗浄に耐えるようにヘルパーが設計される。プローブはダーククエンチャーを保有する。例えば、ドナーは蛍光色素でクエンチャーはＥｃｌｉｐｓｅダーククエンチャー（エポック・バイオサイエンシーズ（ＥｐｏｃｈＢｉｏｓｃｉｅｎｃｅｓ））であってもよい。多数の他のドナー／クエンチャーのペアが既知である（例えば、ホーグランド、Ｒ．Ｐ．（Ｈａｕｇｌａｎｄ、Ｒ．Ｐ．）、「Ｈａｎｄｂｏｏｋｏｆｆｌｕｏｒｅｓｃｅｎｔｐｒｏｂｅｓａｎｄｒｅｓｅａｒｃｈｃｈｅｍｉｃａｌｓ」、モレキュラープローブス（ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓＩｎｃ．）、米国を参照）。一般に、長距離にわたってクエンチング可能なフォレスター半径が長いプローブを有することが望ましい。プローブのハイブリダイゼーション時に、ドナー蛍光体のクエンチングによってハイブリダイゼーションが検出される。

スペクトルの探索および調整
標的のスペクトルが与えられると、発明者らはまず参照配列内の標的の位置を探索し、配列差異を考慮する。単に標的と同じサイズの窓を用いて参照配列を走査し、各位置に対して期待されるスペクトルを算出し、同位置で期待されるスペクトルを観察されたスペクトルと比較することによって探索を行うことができる。最高のスコアを有する一もしくは複数の位置が返される。

本発明の方法によって短期間に極めて多数のハイブリダイゼーションスペクトルが生成されることから、探索工程を最適化することが重要である。例えば、現行の実施では、ハイエンドワークステーション上で１秒あたり１２億個のマッチを得るペースでスペクトル検索が進行し、発明者らは１台の配列決定機器に対応するのに１０台のワークステーションが必要となると推定する。プログラム可能なハードウェア、すなわちフィールドプログラマブルゲートアレイ（ＦＰＧＡ）を用いて探索を促進することは本発明の別の態様である。探索アルゴリズムをＭｉｔｒｉｏｎ−Ｃ（ＭｉｔｒｉｏｎＡＢ、スウェーデン）に翻訳することにより、１台のワークステーションコンピュータ内のたった２個のＦＰＧＡチップを用いて３０倍に加速することが可能である。

一旦一もしくは複数のあり得る位置が見出されてくると、発明者らは観察されたスペクトルと期待されるスペクトルの間の任意の相違を説明する参照配列に対する修飾を探索する。発明者らは、この段階でＳＮＰ、短いｉｎｄｅｌ、長いｉｎｄｅｌ、マイクロサテライト、スプライス変異体などを例とする関連する修飾を参照配列に導入する場合がある。各修飾または修飾の組み合わせに対して、発明者らは観察されたスペクトルと期待されるスペクトルの間の類似性に対して再度スコアを計算する。最もあり得る修飾された１つまたは複数の参照配列が返される。極めて大きなパラメータ空間を探索するための方法は当該技術において既知である。例えば、ギブスサンプリング、マルコフ鎖モンテカルロ（ＭＣＭＣ）およびメトロポリス−ヘイスティング（Ｍｅｔｒｏｐｏｌｉｓ−Ｈａｓｔｉｎｇｓ）アルゴリズムが挙げられる。

スペクトルを比較する場合、単純な２進数の重なりスコアを利用するか（両スペクトルにおいてハイブリダイズするもしくはハイブリダイズしない各プローブに対して１のスコアリング、その他の場合は０）、またはより精巧な統計的アプローチではスペクトルの重なりの段階的もしくは確率的測定を利用してもよい。複数の標的が標的内の同じ位置に位置する場合、任意の配列差異における信頼性を評価するのにより高レベルな解析を行ってもよい。

自動化された高スループット配列決定のための装置
本発明に従う方法は、検出器の上部または内部に設置された反応チャンバを介して単に多数の試薬液を循環させることによって実施可能であることから特に自動化に適し、場合によって熱制御を伴う。

一例では、検出器は、例えばフィルタキューブを介して導かれた白色光によって操作されることで、各標的に結合された蛍光体に適する別々の励起光および放射光の光路が創出されうるＣＣＤ撮像装置である。例えば、コダック（Ｋｏｄａｋ）ＫＡＦ−１６８０１ＥＣＣＤが利用可能で、１６７０万の画素および２秒以下のイメージング時間を有する。かかる機器における１日の配列決定のスループットは最大で１０Ｇｂｐであろう。

反応チャンバは、
・光へのアクセスの容易さ
・閉じた反応チャンバ
・反応チャンバからの試薬の注入および除去のための注入口
・大気および試薬のチャンバへの出入りを可能にする流出口
を提供する。

図３に示されるように、イメージング機器内での挿入に適する標準マイクロアレイのスライドフォーマット内に反応チャンバを構築してもよい。反応チャンバは機器内に挿入され、すべての配列決定反応の間そこに残存しうる。定着したプロトコルに従ってポンプおよび試薬フラスコが試薬を供給し、コンピュータがポンプとスキャナーの両方を制御し、反応と走査の間を交互に行う。場合により、反応チャンバを温度制御してもよい。また場合により、チャンバ上の複数の位置でのイメージングを可能にするように、位置決め段階で反応チャンバを配置してもよい。

試薬の流れを指示するのに、ディスペンサユニットを電動弁に接続してもよい。ここではコンピュータの制御下で全体システムが稼働する。統合されたシステムとは、スキャナー、ディスペンサ、弁および容器ならびに制御用コンピュータで構成されるものであろう。

本発明の更なる態様に従い、
取り込まれたまたは放出された標識を検出可能なイメージング部品、
イメージング部品に１サイクルあたり少なくとも１回アクセス可能なように一もしくは複数の付着した鋳型を保持するための反応チャンバ、
試薬を反応チャンバに提供するための試薬分配システム
を含む、本発明の方法を実施するための機器が提供される。

反応チャンバは、少なくとも１００／ｃｍ^２、場合によって少なくとも１，０００／ｃｍ^２、少なくとも１０，０００／ｃｍ^２または少なくとも１００，０００／ｃｍ^２、または少なくとも１，０００，０００／ｃｍ^２、少なくとも１０，０００，０００／ｃｍ^２または少なくとも１００，０００，０００／ｃｍ^２の密度で付着した鋳型を提供し、イメージング部品はそれらを決定しうる。

イメージング部品では、例えば光電子増倍管、フォトダイオード、電荷結合素子、ＣＭＯＳイメージングチップ、近接場走査型顕微鏡、遠視野共焦点顕微鏡、広視野落射型顕微鏡および全内部反射顕微鏡からなる群から選択されるシステムまたは素子が利用されうる。

イメージング部品は、蛍光標識を検出しうる。

イメージング部品は、レーザー誘導蛍光を検出しうる。

本発明に従う機器の一実施形態では、反応チャンバが、透明な表面、蓋、および反応チャンバを試薬分配システムに取り付けるためのポートを含む閉構造である。ここで透明な表面はその内部表面上に鋳型分子を保持し、イメージング部品は透明な表面を介するイメージングが可能である。

本発明の更なる態様は、１本鎖ＤＮＡ分子のランダムアレイを提供する。ここで、
各々の該分子は初期配列の少なくとも２つのタンデムリピートコピーからなり、
各々の該分子は密度１０^３〜１０^７／ｃｍ^２、好ましくは１０^４〜１０^５／ｃｍ^２、または好ましくは１０^５／ｃｍ^２〜１０^７／ｃｍ^２の密度でランダムな位置で表面上に固定され、
各々の該初期配列は１本鎖もしくは２本鎖のＲＮＡまたはＤＮＡ分子の混合物を含む初期標的のＤＮＡまたはＲＮＡライブラリからのランダム断片を示し、
すべての該ＤＮＡ分子の該初期配列はほぼ同一の長さである。

一般に、同分子は、初期配列の少なくとも１００、通常で少なくとも１０００、または少なくとも２０００、好ましくは最大で２００００のタンデムリピートコピーを含むことになる。同分子は初期配列の５０以上のタンデムリピートコピーを含む可能性があり、これは標準の顕微鏡を用いて検出可能である。

好ましくは、初期配列は５０％ＣＶ以内、好ましくは５〜５０％ＣＶ以内、好ましくは１０％ＣＶ以内、好ましくは５％ＣＶ以内の長さに等しい。すなわち変動係数（ＣＶ）が例えば５％であるような分布を有する。ＣＶは平均で除される標準偏差である。初期配列の長さは等しい可能性がある。

初期標的ライブラリは、例えば一もしくは複数のＲＮＡライブラリ、ｍＲＮＡライブラリ、ｃＤＮＡライブラリ、ゲノムＤＮＡライブラリ、プラスミドＤＮＡライブラリまたはＤＮＡ分子のライブラリであるかあるいはそれらを含みうる。

本発明の更なる態様は、１セットまたは一群のプローブを提供する。ここで、
各プローブは一もしくは複数のオリゴヌクレオチドからなり、
各々の該オリゴヌクレオチドは安定化され、
各々の該オリゴヌクレオチドはレポーター部分を保有し、
各プローブの有効な特異性は３〜１０ｂｐであり、
プローブセットは標的配列内のすべての位置の少なくとも１０％に統計学的にハイブリダイズする。

有効な特異性は４〜６ｂｐでありうる。有効な特異性は３、４、５、６、７、８、９または１０ｂｐでありうる。

プローブセットは、標的配列内のすべての位置の少なくとも２５％、少なくとも５０％、少なくとも９０％、または標的配列内のすべての位置の１００％に統計学的にハイブリダイズしうる。

プローブセットは、標的または標的の反転表示（ｒｅｖｅｒｓｅｃｏｍｐｌｅｍｅｎｔ）内の各位置がその位置でセット内の少なくとも１本のプローブによってハイブリダイズされるように、標的配列またはその反転表示内ですべての位置の１００％にハイブリダイズしうる。

標的配列は任意の標的配列であってよい。

変性位置の導入、固定化核酸単量体の導入、ペプチド核酸単量体の導入および副溝結合の導入の一もしくは複数により、本発明に従うプローブセットを安定化してもよい。

レポーター部分を、例えば蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および標識されたヌクレオチドによるプライマー伸長における遊離３’−ＯＨまたはハイブリダイゼーション後の化学標識におけるアミンを例とする酵素的または化学的手段によって標識可能な化学反応基からなる群から選択してもよい。

応用例
遺伝子発現プロファイリング
ｃＤＮＡ断片をランダムに配列決定することにより、それに対応するＲＮＡの発現レベルが各ＲＮＡ由来の断片の発生数を計数することによって定量可能である。構造的特徴（スプライス変異体、５’／３’ＵＴＲ変異体など）および遺伝的多型を同時に発見することが可能である。

遺伝的プロファイリング
参照ゲノムに対する配列差異の発生に着目することで個々の遺伝子型を同定するのに、全ゲノムのショットガンシーケンシングが利用可能である。例えば、この方法によってＳＮＰおよびｉｎｄｅｌ（挿入／欠失）は容易に発見され、その遺伝子型が同定される。ヘテロ接合体部位を識別するために、両方の対立遺伝子が確実に配列決定されるのに高密度の断片範囲が必要でありうる。

本発明の開示に照らして、当業者にとっては本発明のさらなる態様および実施形態が明らかになろう。本明細書ではいずれかの箇所で引用されるすべての文献が参照として援用される。

実施例１
カンタループのＤＮＡ鋳型の調製

入力
２本鎖ＤＮＡ鋳型

鋳型の分取：
発明者らは、５’−ＧＣ−３’を認識し、その間を切断して平滑末端化する制限酵素ＣｖｉＪＩ^＊（ユルクス（ＥＵＲｘ）、ポーランド）を用いた。発明者らは以下のように制限反応を設定した。

反応物を３７℃で１時間インキュベートした。

製造業者のプロトコルに従ってＰＣＲクリーンアップキット（キアゲン（Ｑｉａｇｅｎ））を用いて開裂ＤＮＡを精製した。

発明者らは、２％アガロースゲル上の分画を分析し、鋳型の特定のバッチおよび酵素に対する最適な反応条件を特定した（図１、４〜８ラインを参照）。

発明者らは、最適な開裂反応を繰り返すことで、全体で５μｇのＤＮＡを得た（図１、１ライン）。

鋳型サイズの選択：
発明者らは、８％の変性されていないＰＡＧＥ（４０ｃｍ高、１ｍｍ厚）上でＤＮＡを精製した。各ウェルにｌμｇ以下のＤＮＡを充填し、目的の領域である９５〜１０５のラダーを含ませた。ラダーは９５、１００および１０５の塩基対で３つのＰＣＲ断片からなった。

発明者らは、ＳＹＢＲゴールドを用いてゲルを染色し、スキャナー上の結果を解析し、その注目領域（９５〜１０５ｂｐ）を切断し、製造業者のプロトコルに従ってＥｌｕｔａＴｕｂｅ（商標）（ファーメンタス（Ｆｅｒｍｅｎｔａｓ））を用いてＤＮＡの望ましい領域を電気溶出させた。

アダプターライゲーション：
ライゲーションにおいて１つのアダプターを用いた。
５’ＧＣＡＧＡＡＴＧＣＧＣＧＧＣＣＧＣＣＴＴＡＧ３’
３’ＣＧＴＣＴＴＡＣＧＣＧＣＣＧＧＣＧＧＡＡＴＣ５’

それは５’リン酸塩および内部ＮｏｔＩ部位を含んだ。

発明者らは、以下のライゲーション混合物を調製した。

２５℃で１５分間インキュベートした。

製造業者のプロトコルに従ってＰＣＲクリーンアップ（キアゲン（Ｑｉａｇｅｎ））を用いて精製した。図２を参照のこと。

制限消化物ＮｏｔＩ：
発明者らは以下の反応を設定した。

１晩にわたり３７℃で４時間インキュベートした。

製造業者のプロトコルに従ってＰＣＲクリーンアップ（キアゲン（Ｑｉａｇｅｎ））を用いて試料を精製した。

発明者らは、ＰＣＲクリーンアップを用いて精製を繰り返すことで、できるだけ多くの余分のアダプターを除去した。

鋳型の環状化：
発明者らは、リンカーオリゴ５’−ＣＧＴＣＴＴＡＣＧＣＧＣＣＧＧＣＧＧＡＡＴＣＣＧＴＣＴＴＡＣＧＣＧＣＣＧＧＣＧＧＡＡＴＣ−３’の存在下で試料を変性させることによって１本鎖環を形成した。

発明者らは以下を混合した。

９３℃に３分間加熱し、冷えるまで氷上に置き、迅速に回転させた。

２×Ｑｕｉｃｋライゲーション緩衝液（ＮＥＢ）５０μｌおよびＱｕｉｃｋリガーゼ（ＮＥＢ）１μｌを添加し、短時間混合した。

２５℃で１５分間インキュベートした。

この段階で環を形成し、ＲＣＡにおいて試料を維持できる。図３を参照のこと。

固定化：
５μＭのＲＣＡプライマー（付加的な５’−ＡＡＡＡＡＡＡＡＡＡ−Ｃ６−ＮＨ−３’テイルを有する環状化リンカーと同一、ここでＣ６は６つの炭素リンカーでＮＨはアミン基）を１５％ＤＭＳＯを含むｐＨ９．０の１００ｍＭ炭酸塩緩衝液中のＳＡＬ−１スライド（アスパー・バイオテック（ＡｓｐｅｒＢｉｏｔｅｃｈ）、エストニア）上に固定化した。

２３℃で１０時間インキュベートした。

スライド表面上での活性部位の残存を阻止した。まず炭酸塩緩衝液（上記のとおりであるが４０ｍＭ）中の１５ｍＭグルタミン酸に３０℃で４０分間漬けてから、ｐＨ８．０で２ｍｇ／ｍｌのポリアクリル酸に室温で１０分間漬けた。

環状鋳型を緩衝液１（２×ＳＳＣ、０．１％ＳＤＳ）で３０℃で２時間アニーリングし、次いで緩衝液１で２０分間洗浄し、次いで緩衝液２（２×ＳＳＣ、０．１％Ｔｗｅｅｎ）で３０分間洗浄し、次いで０．１×ＳＳＣでリンスし、次いで１．５ｍＭＭｇＣｌ_２でリンスした。

増幅：
Ｐｈｉ２９緩衝液、１ｍＭｄＮＴＰ、０．０５ｍｇ／ｍＬＢＳＡおよび０．１６ｕ／μＬＰｈｉ２９酵素（すべてをＮＥＢ、米国から入手）の中でローリングサークル増幅を３０℃で２時間実施した。

環状化リンカーに相補的で６−ＦＡＭで標識されたレポーターオリゴヌクレオチドを上記のようにアニールした後、緩衝液３（５ｍＭトリスｐＨ８．０、３．５ｍＭＭｇＣｌ_２、１．５ｍＭ（ＮＨ_４）_２ＳＯ_４、０．０１ｍＭＣＴＡＢ）に漬けた。図４は、明確に視認される個々のＲＣＡ産物を含むスライドのごく一部を示す。

プローブ群のハイブリダイゼーション：
（ＧＣＡＴ）（ＧＣ／ＡＴ）（ＧＣ／ＡＴ）（Ｇ／Ｃ／Ａ／Ｔ）（ＧＣ／ＡＴ）（Ｇ／Ｃ／Ａ／Ｔ）（ＧＣ／ＡＴ）のスキームに従って各プローブを設計した。ここで各々は、位置２、４および６で固定化核酸（エキシコン（Ｅｘｉｑｏｎ）、デンマーク）および３’末端でＥｃｌｉｐｓｅダーククエンチャー（エポック・バイオサイエンシーズ（ＥｐｏｃｈＢｉｏｓｃｉｅｎｃｅｓ）、米国）を有する。

プローブを緩衝液３中、１００ｎＭでハイブリダイズした。各プローブに対して温度ランプを使用することで、マッチ／ミスマッチの識別における最適温度を見出した。図５は、２つのマッチ／ミスマッチペアのハイブリダイゼーションの結果を示す。

時間が次第に経過する場合のＣｖｉＪ^＊によるｃＤＮＡ試料（レーン４）の開裂結果を示すゲル像を示す。１００ｂｐに向けての平均断片長における漸減が観察される（１００ｂｐがサイズ標準の最短の断片である、レーン３）。最適な開裂反応がレーン１内に重点され、約１００ｂｐの断片が精製される。アダプターライゲーションを示す。レーン１はサイズマーカー、レーン２はライゲートされていない断片、レーン３および４はライゲートされた断片である。大部分の断片が正確にライゲートされる。環状化の前（レーン１）および後（レーン２）の断片試料を示す。レーン３は精製後の結果を示す。レーン３でリンカーが存在しないことを確認する。４８８ｎｍレーザーおよび６ＦＡＭのフィルタを用い、Ｔｅｃａｎ（商標）ＬＳ４００を４μｍの解像度で用いて走査されたランダムアレイスライドから得られた約０．８×２．４ｍｍの切片を示す。スポットは個々の環状鋳型分子から生成された増幅産物を表す。融点分析によって測定された短いオリゴヌクレオチドプローブの安定性を示す。１００ｍＭトリスｐＨ８．０、５０ｍＭＮａＣｌ中でのＣＴＡＢの効果を示す。ＴａｑＥｘｐｒｅｓｓ緩衝液（ジェネティクス（ＧＥＮＥＴＩＸ）、英国）中でのＬＮＡの効果を示す。ＴａｑＥｘｐｒｅｓｓ緩衝液中でのＬＮＡの特異性を示す。変性位置を導入する効果を示す。ここで５ＬＮＡを有する７量体（左）、５ＬＮＡを有する７量体および２つの変性位置（中央）、３ＬＮＡを有する７量体および２つの変性位置（右）である。ランダムアレイにハイブリダイズされ、蛍光顕微鏡によって可視化された、ＦＡＭで標識されたユニバーサル２０量体プローブ（左群）およびＴＡＭＲＡで標識された７量体プローブ（中央）を示す。アレイは２つの鋳型を用いて合成され、それらの両方がユニバーサルプローブに結合する必要があるが、配列ＣＧＡＡＣＣＴで７量体に結合する必要があるのはそれらの片方のみである。ニコン（Ｎｉｋｏｎ）ＴＥ２０００倒立顕微鏡上で２０倍の倍率でニコン（Ｎｉｋｏｎ）ＤＳ１ＱＭＣＣＤカメラを使用して画像が取得された。右手群は期待どおりすべてのＴＡＭＲＡで標識された特徴がＦＡＭ陽性でもあることを示す色合成画像を示す。

Claims

核酸の配列決定方法であって、
各々がプライマーのアニーリング配列および標的配列を含む複数の環状１本鎖ＤＮＡ鋳型分子を含有するＤＮＡ試料を提供する工程と、
以下の工程によって、固定化および増幅された鋳型分子のランダムアレイを形成する工程と、
前記鋳型分子を増幅プライマーと接触させ前記プライマーのアニーリング配列にアニールさせることによって、アニールしたプライマー／鋳型の複合体を形成すること、
ローリングサークル増幅によって前記鋳型分子を増幅すること、
前記鋳型のアニーリング前に前記増幅プライマー、増幅前に前記プライマー／鋳型複合体、または増幅後に前記増幅された鋳型、を固定化することによって、固体支持体上に前記増幅された鋳型分子を確実に固定化すること、
テスト条件下で一群のプローブによってタンデムリピート増幅産物を探索し、各プローブについてそれが前記テスト条件下で前記標的配列にハイブリダイズするか否かを判定することによって、前記標的のハイブリダイゼーションスペクトルを得る工程と、
前記ハイブリダイゼーションスペクトルを、前記ＤＮＡ鋳型の配列に対する一または複数の参照配列を含むことが期待される、複数の参照配列を含む参照データベース内の参照配列についてのハイブリダイゼーションスペクトルと比較することにより、一または複数の参照配列における前記標的配列の位置と予想される一または複数の位置を判定する工程と、
場合によって、実際のハイブリダイゼーションスペクトルと前記一または複数の位置で期待されるハイブリダイゼーションスペクトルとの比較することにより、前記標的配列の予想される配列および／または一もしくは複数の参照配列と比較した前記標的配列の配列における差異を計算する工程と、を含む、方法。
一または複数の参照配列と比較した前記標的配列の配列における差異を計算する工程を含み、前記差異は、一塩基多型、挿入、欠失、選択的スプライシング、選択的転写開始部位、選択的ポリアデニル化、及びマイクロサテライトからなる群から選択される差異の一または複数または組み合わせである、請求項１に記載の方法。
前記一群のプローブが３〜１０塩基の有効な特異性を有するプローブを含む、請求項１または２に記載の方法。
前記有効な特異性が４〜６個の塩基である、請求項３に記載の方法。
各標的配列のサイズおよび前記一群のプローブの全部または一部の有効な特異性が、各プローブの各標的に対するハイブリダイゼーションの統計的確率が５％〜９５％であるように調節される、請求項１〜４のいずれか一項に記載の方法。
前記統計的確率が１０％〜９０％である、請求項５に記載の方法。
前記統計的確率が２５％〜７５％である、請求項６に記載の方法。
前記統計的確率が４０％〜６０％である、請求項７に記載の方法。
複数のプローブ群によって探索する工程を含み、各プローブ群内の各プローブが他の各プローブ群内の各プローブと異なる、請求項１〜８のいずれか一項に記載の方法。
前記参照データベースが、前記標的配列として同一種由来の核酸配列から作成される、請求項１〜９のいずれか一項に記載の方法。
前記参照データベースが、前記標的配列と異なる種由来の核酸配列から作成される、請求項１〜９のいずれか一項に記載の方法。
１本鎖ＤＮＡ分子のランダムアレイを形成する工程を含み、
前記分子のそれぞれは初期配列の少なくとも２つのタンデムリピートコピーからなり、
前記分子のそれぞれは１０^３〜１０^７／ｃｍ^２の密度で表面上のランダムな位置に固定化され、
前記初期配列のそれぞれは１本鎖もしくは２本鎖ＲＮＡまたはＤＮＡ分子の混合物を含む初期標的ＤＮＡまたはＲＮＡライブラリからのランダム断片を表し、
すべての前記ＤＮＡ分子の前記初期配列はほぼ同じ長さである、請求項１〜１１のいずれか一項に記載の方法。
各分子が初期配列の少なくとも１０００のタンデムリピートコピーを含む、請求項１２に記載の方法。
前記密度が１０^５／ｃｍ^２〜１０^７／ｃｍ^２である、請求項１２または１３に記載の方法。
前記初期配列が５０％ＣＶ以内で同じ長さである、請求項１２〜１４のいずれか一項に記載の方法。
前記初期配列が１０％ＣＶ以内で同じ長さである、請求項１５に記載の方法。
前記初期配列が５％ＣＶ以内で同じ長さである、請求項１６に記載の方法。
前記初期標的ライブラリがＲＮＡライブラリ、ｍＲＮＡライブラリ、ｃＤＮＡライブラリ、ゲノムＤＮＡライブラリ、プラスミドＤＮＡライブラリまたはＤＮＡ分子のライブラリである、請求項１２〜１７のいずれか一項に記載の方法。
前記プローブ群において、
各プローブは一または複数のオリゴヌクレオチドからなり、
前記オリゴヌクレオチドのそれぞれは安定化され、
前記オリゴヌクレオチドのそれぞれはレポーター部分を有し、
各プローブの有効な特異性は３〜１０ｂｐであり、
前記プローブセットは、ランダムなまたは任意の標的配列内のすべての位置の少なくとも１０％が、該プローブセット内の少なくとも１本のプローブと統計的にハイブリダイズするようになっている、請求項１〜１８のいずれか一項に記載の方法。
前記有効な特異性が４〜６ｂｐである、請求項１９に記載の方法。
前記プローブ群が標的配列内のすべての位置の少なくとも２５％に統計的にハイブリダイズする、請求項１９または２０に記載の方法。
前記プローブ群が標的配列内のすべての位置の少なくとも５０％に統計的にハイブリダイズする、請求項２１に記載の方法。
前記プローブ群が標的配列内のすべての位置の少なくとも９０％に統計的にハイブリダイズする、請求項２２に記載の方法。
前記プローブ群が標的配列内のすべての位置の１００％に統計的にハイブリダイズする、請求項２３に記載の方法。
変性位置の導入、ＬｏｃｋｅｄＮｕｃｅｌｅｉｃＡｃｉｄ（ＬＮＡ）単量体の導入、ペプチド核酸（ＰＮＡ）単量体の導入およびマイナーグルーブバインダー（ＭＧＢ）の導入の一もしくは複数によって安定化される、請求項１９〜２４のいずれか一項に記載の方法。
前記レポーター部分は、蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および、標識されたヌクレオチドによるプライマー伸長のための遊離３’−ＯＨもしくはハイブリダイゼーション後の化学標識のためのアミンを例とする酵素的または化学的手段によって標識可能な化学反応基からなる群から選択される、請求項１９〜２５のいずれか一項に記載の方法。
前記ハイブリダイゼーションスペクトルは、ホストコンピュータに取り付けられるフィールドプログラマブルゲートアレイ（ＦＰＧＡ）およびコンピュータ可読記憶デバイスを含むスペクトル検索機器を用いて比較され、
前記ＦＰＧＡはスペクトル検索を行うように設定され、
前記コンピュータ可読記憶デバイスは参照ヌクレオチド配列およびハイブリダイゼーションスペクトルセットを格納し、
前記ホストコンピュータは前記参照ヌクレオチド配列および各々の前記ハイブリダイゼーションスペクトルを有する前記ＦＰＧＡを提供するように設定され、
前記ＦＰＧＡは、参照ヌクレオチド配列およびハイブリダイゼーションスペクトルとともに提供される場合、前記ハイブリダイゼーションスペクトルと前記参照ヌクレオチド配列の間で最もよくマッチする前記一もしくは複数の位置を格納するように前記コンピュータ可読記憶装置に書き込む、請求項１〜２６のいずれか一項に記載の方法。
請求項１〜２７のいずれか一項に記載の方法を制御するようにプログラムされるコンピュータプロセッサ。
請求項２８に記載のコンピュータプロセッサ用のプログラムを有するコンピュータ可読デバイス。
請求項１〜２７のいずれか一項に記載の方法の実行から、核酸に対する配列情報を提供するようにプログラムされるコンピュータプロセッサ。
請求項３０に記載のコンピュータプロセッサ用のプログラムを有するコンピュータ可読デバイス。
１本鎖ＤＮＡ分子のランダムアレイであって、
前記分子のそれぞれは初期配列の少なくとも２つのタンデムリピートコピーからなり、
前記分子のそれぞれは１０^３〜１０^７／ｃｍ^２の密度で表面上のランダムな位置に固定化され、
前記初期配列のそれぞれは１本鎖もしくは２本鎖ＲＮＡまたはＤＮＡ分子の混合物を含む初期標的ＤＮＡあるいはＲＮＡライブラリからのランダム断片を表し、
すべての前記ＤＮＡ分子の前記初期配列はほぼ同じ長さである、ランダムアレイ。
各分子が初期配列の少なくとも１０００のタンデムリピートコピーを含む、請求項３２に記載のランダムアレイ。
前記密度が１０^５／ｃｍ^２〜１０^７／ｃｍ^２である、請求項３２または３３に記載のランダムアレイ。
前記初期配列が５０％ＣＶ以内で同じ長さである、請求項３２〜３４のいずれか一項に記載のランダムアレイ。
前記初期配列が１０％ＣＶ以内で同じ長さである、請求項３５に記載のランダムアレイ。
前記初期配列が５％ＣＶ以内で同じ長さである、請求項３６に記載のランダムアレイ。
前記初期標的ライブラリが、ＲＮＡライブラリ、ｍＲＮＡライブラリ、ｃＤＮＡライブラリ、ゲノムＤＮＡライブラリ、プラスミドＤＮＡライブラリまたはＤＮＡ分子のライブラリである、請求項３２〜３７のいずれか一項に記載のランダムアレイ。
各プローブが一もしくは複数のオリゴヌクレオチドからなり、
前記オリゴヌクレオチドのそれぞれは安定化され、
前記オリゴヌクレオチドのそれぞれはレポーター部分を有し、
各プローブの有効な特異性は３〜１０ｂｐであり、
前記プローブセットは、ランダムなまたは任意の標的配列内のすべての位置の少なくとも１０％がプローブセット内の少なくとも１本のプローブと統計的にハイブリダイズするようになっている、プローブセット。
前記有効な特異性が４〜６ｂｐである、請求項３９に記載のプローブセット。
標的配列内のすべての位置の少なくとも２５％、少なくとも５０％、少なくとも９０％に統計的にハイブリダイズする、請求項３９または４０に記載のプローブセット。
標的配列内のすべての位置の１００％に統計的にハイブリダイズする、請求項４１に記載のプローブセット。
変性位置の導入、ＬｏｃｋｅｄＮｕｃｅｌｅｉｃＡｃｉｄ（ＬＮＡ）単量体の導入、ペプチド核酸（ＰＮＡ）単量体の導入およびマイナーグルーブバインダー（ＭＧＢ）の導入の一もしくは複数によって安定化される、請求項３９〜４２のいずれか一項に記載のプローブセット。
前記レポーター部分は、蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および、標識されたヌクレオチドによるプライマー伸長のための遊離３’−ＯＨもしくはハイブリダイゼーション後の化学標識のためのアミンを例とする酵素的または化学的手段によって標識可能な化学反応基とからなる群から選択される、請求項３９〜４３のいずれか一項に記載のプローブセット。
ホストコンピュータに取り付けられたフィールドプログラマブルゲートアレイ（ＦＰＧＡ）およびコンピュータ可読記憶デバイスを含むスペクトル検索機器であって、
前記ＦＰＧＡはスペクトル検索を行うように設定され、
前記コンピュータ可読記憶デバイスは参照ヌクレオチド配列およびハイブリダイゼーションスペクトルセットを格納し、
前記ホストコンピュータは前記参照ヌクレオチド配列および各々の前記ハイブリダイゼーションスペクトルを有する前記ＦＰＧＡを提供するように設定され、
前記ＦＰＧＡは、参照ヌクレオチド配列およびハイブリダイゼーションスペクトルとともに提供される場合、前記ハイブリダイゼーションスペクトルと前記参照ヌクレオチド配列の間で最もよくマッチする前記一もしくは複数の位置を格納するように前記コンピュータ可読記憶装置に書き込む、スペクトル検索機器。