JP2005537030A

JP2005537030A - 核酸を分析する方法

Info

Publication number: JP2005537030A
Application number: JP2004555256A
Authority: JP
Inventors: ユージーンワイ．チャン，; エリックナレッフスキー，
Original assignee: ユー．エス．ジェノミクス，インコーポレイテッド
Priority date: 2002-05-09
Filing date: 2003-05-09
Publication date: 2005-12-08
Also published as: EP1540017A2; AU2003302463A8; WO2004048514A3; US20030235854A1; AU2003302463A1; WO2004048514A2; EP1540017A4

Abstract

核酸を分析するための方法が本明細書中に開示される。１つの実施形態において、被験体のハプロタイプを決定する方法であって、該方法は、該被験体由来の伸長ポリヌクレオチドを提供する工程であって、該ポリヌクレオチドが、少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーで各々同じように標識される複数の標的部位を含み、ここで、該少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーは、該被験体のハプロタイプについての情報を提供する、工程；静止検出ステーションに関連して核酸を移動し、そして該検出ステーションで該複数の標識された部位を検出することにより、被験体のハプロタイプを決定する工程、を包含する、方法が提供される。

Description

（発明の分野）
本発明は、一般に、ＤＮＡサンプルのハプロタイプを決定するための方法に関する。

（発明の背景）
天然の配列変化（すなわち、多型）は、全てのゲノム情報の基本的な特性である。任意の２つのヒト染色体（ハプロイド）は、複数の部位および型の多型を示す。いくつかの多型は、機能的重要性を有し、かつ疾患を引き起こすかまたは疾患に関連するが、多くはそうではない。

従来のハプロタイピング法は、ＰＣＲまたはクローニングによるＤＮＡ増幅、および広範な最適化を必要とする。これらの方法は、遅く、労働集約的であり、かつ実行が高価であり、そして大規模な関連研究、すなわち慣用的臨床診断に適していない。ＤＮＡの分析に関連する現在の技術はまた、大集団を分析する能力において固有に制限されている。遺伝子方法は、代表的に、ゲノムの領域の個々の分析に頼る。例えば、１回のＰＣＲ反応が、データ点１つ当たりに必要である。従って、集団の研究では、ＳＮＰが１つずつの様式で独立して分析される必要があり、このことは高いコストおよび長時間の分析につながる。現在の方法によるＳＮＰ分析の時間およびコストは、用いられる技術に関わらず、４〜５時間（非多重化）、および約１ドルである。これらの方法は、質量分析、ビーズアレイ、切断アレイ、ハイブリダイゼーションアレイ、プライマー伸長、キャピラリー電気泳動およびＴａｑＭａｎのような異なる方法を含む。５，０００個のＳＮＰの分析は、１台の９６ウェルリアルタイムＰＣＲ機器の大学の研究室の設定で見積もった場合、連続的に実行して、約１０日および５，０００ドルかかり、これはハプロタイプ情報の作成のための時間を含んでいない。

大きなサンプル集団およびＤＮＡの長いストレッチと共に使用されるハプロタイピングのための速くて安価な方法の必要性が、この分野に存在する。

（発明の要旨）
本発明の方法または装置は、ハプロタイプの作成のための、数キロベース長のＤＮＡの直接線形分析に関する。本発明は、ＤＮＡのセグメント上の複数のマーカーを検出し、これらのマーカーの間の距離を決定する方法を提供する。本発明は、いくつかの遺伝子座で、同時にＤＮＡを迅速にハプロタイピングするために使用され得る。

本発明は広範に、核酸を迅速にハプロタイピングするための方法に関し、この核酸は、ＤＮＡまたはＲＮＡである。本発明の１つの局面において、被験体のハプロタイプを決定する方法が記載される。この方法は、それぞれが少なくとも第１のユニット特異的マーカーと第２のユニット特異的マーカー（この第１のユニット特異的マーカーおよび第２のユニット特異的マーカーは、被験体におけるハプロタイプについての情報を提供する）で同様に標識されている複数の標的部位を含む、被験体由来の伸長ポリヌクレオチドを提供する工程；核酸を固定検出ステーションに対して移動させ、そしてこの検出ステーションで、複数の標識部位を検出し、それにより被験体のハプロタイプを決定する工程を包含する。

この実施形態の１つの実施形態において、標的部位は、塩基配列変化（例えば、単一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト反復、ジヌクレオチド反復、トリヌクレオチド反復、配列再配置、またはキメラ配列）である。

この実施形態の別の実施形態において、このユニット特異的マーカーは、識別可能な特性を有する蛍光ハイブリダイゼーションプローブである。このような識別可能な特性としては、蛍光発光スペクトル分布、寿命、強度、バースト持続時間および分極異方性が挙げられる。

この実施形態の別の実施形態において、ハイブリダイゼーションプローブは、ＤＮＡ、ＲＮＡ、ロック核酸（ＬＮＡ）、およびペプチド核酸（ＰＮＡ）であり得る。この実施形態の別の実施形態において、蛍光ハイブリダイゼーションプローブは、単色素分子、エネルギー移動色素対、ナノ粒子、蛍光ナノクリスタル、挿入色素、分子ビーコンおよび量子ドットが挙げられる。本発明の別の実施形態において、各蛍光ハイブリダイゼーションプローブは、複数の標的部位の１つに特異的にハイブリダイズする。

別の実施形態において、本発明の方法は、被験体におけるハプロタイプに関する情報を提供する第３のユニット特異的マーカーをさらに含む。さらに別の実施形態において、本発明の方法はまた、被験体におけるハプロタイプに関する情報を提供する第４のユニット特異的マーカーを含む。

被験体は、例えば、哺乳動物被験体（例えば、ヒト）であり得る。

別の実施形態において、ユニット特異的マーカーは、単プローブまたは、一緒に作用して標的を同定する各標的に特異的な多プローブである。本発明の単プローブは、オリゴＤＮＡ、オリゴＲＮＡ、オリゴビーコン、オリゴペプチド核酸、オリゴロック核酸、およびキメラオリゴであり得る。本発明の多プローブは、ハイブリダイゼーション対、インベーダオリゴ対、ライゲーションオリゴ対、ミスマッチ伸長５’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および３’−エキソヌクレアーゼ対であり得る。

本発明は、任意の核酸（例えば、ＰＣＲ増幅ＤＮＡまたはＰＣＲ増幅ＲＮＡを含むＤＮＡまたはＤＮＡ）を分析するために使用され得る。

本発明の一実施形態において、固定検出ステーションは、アバランシェ光ダイオードまたは電荷結合デバイスと光連絡している。

別の実施形態において、核酸は、少なくとも１つの分子モーターの作用によって、固定検出ステーションに対して移動される。さらに別の実施形態において、核酸は、溶液中の複数の分子モーターの作用によって、固定検出ステーションに対して移動される。さらに別の実施形態において、核酸は、流体力学的な力の作用によって、固定検出ステーションに対して移動される。

別の実施形態において、検出ステーションは、少なくとも１つのドナー蛍光団、ならびに第１のユニット特異的マーカーおよび第２のユニット特異的マーカー（各々は、少なくとも１つのアクセプター蛍光団を含む）を含む。別の実施形態において、この検出ステー本は、少なくとも１つのアクセプター蛍光団、ならびに第１のユニット特異的マーカーおよび第２のユニット特異的マーカー（各々は少なくとも１つのドナー蛍光団を含む）を含む。

いくつかの局面において、検出ステーションは、蛍光共鳴エネルギー移動を検出する。

別の実施形態において、本発明の方法による核酸の分析は、この核酸内の標的部位の線形配置に関する情報を提供する。

別の実施形態において、検出ステーションは、核酸の複数の標的部位を同時に検出する。一実施形態において、ユニット特異的マーカーは、共焦点顕微鏡によって検出される。別の実施形態において、複数の標的部位は、異なる色の蛍光ハイブリダイゼーションプローブでこれらの複数の部位の各々を標識することによって識別される。

別の局面において、本発明は、被験体のハプロタイプを決定する方法を提供し、この方法は、各々が少なくとも１つの識別可能なユニット特異的マーカーで標識された複数の選択された遺伝マーカーを含む被験体由来の伸長ポリヌクレオチドを移動させる工程であって、ここでこれらの複数の選択された遺伝マーカーが、この被験体におけるハプロタイプに関する情報を、チャネルを介して提供する工程；これらのユニットが検出ステーションに対して移動する場合、これらの複数の選択された遺伝マーカーを、検出ステーションに曝露する工程であって、ここでこれらの複数の部位が、この検出ステーションと相互作用して、このチャネル内またはこのチャネルの縁部で検出可能なシグナルを生成する、工程；および次いで、この相互作用から生じたシグナルを逐次的に検出して、このポリヌクレオチドを分析し、それにより被験体のハプロタイプを決定する工程、を包含する。

一実施形態において、検出ステーションは、電磁放射線、消光源、および蛍光励起源から選択される因子を含む。この因子は、蛍光励起源、ならびにハイブリダイゼーションプローブを含む第１のユニット特異的マーカーおよび第２のユニット特異的マーカーを含み得る。

別の実施形態において、本発明は、核酸プール中の核酸集団のハプロタイプを決定する方法を含み、この核酸集団は少なくとも第１の核酸集団および少なくとも第２の核酸集団を含み、ここでこの方法は、伸長ポリヌクレオチドのプールを提供する工程であって、ここでこの集団中のポリヌクレオチドは、複数の標的部位を含み、これらの標的部位の各々は、少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーで同様に標識され、そしてここでこの少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーは、このプールにおけるハロタイプに関する情報を提供し、さらにここで、この標的部位は、選択された遺伝マーカーである、工程；このプールのポリヌクレオチドを固定検出ステーションに通過させる工程；この固定検出ステーションで、この蛍光ハイブリダイゼーションプローブを検出する工程；ならびに、このポリヌクレオチドが検出器を通過した場合、この蛍光プローブを測定し、それによりこのプール中のポリヌクレオチドの種のハプロタイプを決定する工程、を包含する。

一実施形態において、これらの標的部位は、単一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト反復、ジヌクレオチド反復、トリヌクレオチド反復、配列再配置およびキメラ配列から選択される塩基配列変化である。

別の実施形態において、ユニット特異的マーカーは、識別可能な特性を有する蛍光ハイブリダイゼーションプローブである。この識別可能な特性は、例えば、蛍光発光スペクトル分布、寿命、強度、バースト持続時間、および分極異方性であり得る。

蛍光ハイブリダイゼーションプローブとしては、例えば、単色素分子、エネルギー移動色素対、ナノ粒子、量子ドット、蛍光ナノクリスタル、挿入色素、または分子ビーコンが挙げられる。

いくつかの実施形態において、各々の発光ハイブリダイゼーションプローブが、複数の標的部位の一つに特異的にハイブリダイズする。発光ハイブリダイゼーションプローブは、例えば、ＤＮＡ、ＲＮＡ、ロックド核酸、またはペプチド核酸であり得る。

さらなる実施形態において、核酸の集団は、プール中のハロタイプについての情報を提供する第３のユニット特異的マーカーを含む。さらなる実施形態において、核酸の集団は、プール中のハロタイプについての情報を提供する第４のユニット特異的マーカーを含む。

いくつかの実施形態において、ユニット特異的マーカーは、各々の標的について特異的である単プローブまたは一緒に作動して標的を同定する多プローブである。単プローブは、例えば、オリゴＤＮＡ、オリゴＲＮＡ、オリゴビーコン、オリゴペプチド核酸、オリゴロックド核酸、およびキメラオリゴであり得る。多プローブは、例えば、ハイブリダイゼーション対、インベーダーオリゴ対、ライゲーションオリゴ対、ミスマッチ伸長５’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および３’エキソヌクレアーゼ対であり得る。

プール中のポリヌクレオチドは、例えば、ＤＮＡ、ＲＮＡ、またはその混合物であり得る。

いくつかの局面において、定常検出ステーションは、アバランシェ光ダイオードまたは電荷結合素子と光連絡する。

いくつかの実施形態において、検出ステーションは、蛍光共鳴エネルギー移動を検出する。本発明のいくつかの局面において、検出ステーションは、少なくとも１つのドナー蛍光物質ならびに第１のユニット特異的マーカーおよび第２のユニット特異的マーカー（各々が、少なくとも１つのアクセプター蛍光物質を含む）を含む。別の実施形態において、検出ステーションは、少なくとも１つのアクセプター蛍光物質ならびに第１のユニット特異的マーカーおよび第２のユニット特異的マーカー（各々が、少なくとも１つのドナー蛍光物質を含む）を含む。

別の実施形態において、複数の部位が、複数の部位の各々を異なる色の発光ハイブリダイゼーションプローブで標識化することにより、識別される。１つの実施形態において、第１の集団は、１つの個体由来のポリヌクレオチドを含み、そして第２の集団は、異なる個体由来のポリヌクレオチドを含む。別の実施形態において、第１の集団は、健康な状態の被験体由来のポリヌクレオチドを含み、そして第２の集団は、疾患状態の同じ被験体由来のポリヌクレオチドを含む。被験体は、例えば、哺乳動物（ヒトのような）であり得る。

別の局面において、本発明は、ポリヌクレオチド、第１のライゲーションオリゴヌクレオチドおよび第２のライゲーションオリゴヌクレオチドを提供することにより、被験体のハプロタイプを決定する方法を包含し、ここで第１のライゲーションオリゴヌクレオチドは、第１の標識化された部分と結合され、前記被験体におけるハプロタイプについての情報を提供する標的ポリヌクレオチド、前記第１のライゲーションポリヌクレオチドの３’末端での問い合わせヌクレオチド、および、必要に応じて、問い合わせヌクレオチドに隣接するミスマッチオリゴヌクレオチドにおける配列に相補性の第１の定常配列を含む。第２のライゲーションオリゴヌクレオチドは、第２の標識化された部分と結合され、前記被験体におけるハプロタイプについての情報を提供する標的ポリヌクレオチド、前記第２のライゲーションポリヌクレオチドの３’末端での問い合わせヌクレオチド、および、必要に応じて、問い合わせヌクレオチドに隣接するミスマッチオリゴヌクレオチドにおける配列に相補性の第２の定常配列を含む。有効量の第１のライゲーションオリゴヌクレオチドが、ポリヌクレオチドにアニールされ、プライムされた第１のテンプレートを生じ、このテンプレートは、ポリメラーゼ活性のために十分な条件の下で、有効量のポリメラーゼ酵素および少なくとも２つの型のヌクレオチドトリホスフェートと組み合わされ、それにより、第１の延長されたポリヌクレオチドを形成する。有効量の第２のライゲーションオリゴヌクレオチドが、ポリヌクレオチドにアニールされ、プライムされた第２のテンプレートを生じ、このテンプレートは、ポリメラーゼ活性のために十分な条件の下で、有効量のポリメラーゼ酵素および少なくとも２つの型のヌクレオチドトリホスフェートと組み合わされ、それにより、第２の延長されたポリヌクレオチドを形成する。延長された（ｅｌｏｎｇａｔｅｄ）第１のオリゴヌクレオチドおよび延長された（ｅｌｏｎｇａｔｅｄ）第２のオリゴヌクレオチドは、伸長される（ｅｘｔｅｎｄｅｄ）；そして第１の標識化された部分および第２の標識化された部分は、検出される。これにより、ハロタイプを決定する。

別の局面において、標識化された部分は、伸長され延長されたポリヌクレオチドを定常検出ステーションに対して移動することにより検出される。この実施形態の別の局面において、蛍光共鳴エネルギー移動が、検出される。

他に定義されない限り、本明細書中で使用される全ての技術用語および科学用語は、本発明が属する当業者により通常理解されるとおりの同じ意味を有する。本明細書中に記載されるのと類似のまたは等しい方法および物質が、本発明の実施または試験において使用され得るが、適切な方法および物質は、以下に記載される。本明細書中で述べられる全ての刊行物、特許出願、特許、および他の参考文献は、その全体において参考として援用される。矛盾する場合は、本明細書（定義を含める）が、制御する。さらに、物質、方法、および例は、例示のみであり、限定を意図しない。

本発明の他の特徴および利点は、以下の詳細な説明および添付の特許請求の範囲から明らかである。

（発明の詳細な説明）
本明細書中で使用されるように、用語「選択的」、「選択的に」、「特異的な」、「特異的に」、「本質的に」、「均一に」などは、指示された事象が特定の程度まで起こることを意味する。特に、ヌクレオチドのそのハイブリダイゼーション標的に対するパーセント同一性は、９０％より大きく、好ましくは９５％より大きく、最も好ましくは、９９％より大きい。

本明細書中で使用されるように、用語「ユニット特異的情報」は、核酸ポリマーのユニットの１つ、いくつか、または全てについての任意の構造的情報をいう。本発明の方法に従って核酸を分析することにより得られる構造的情報は、核酸の特徴的な特性の同定を包含し得、この特性が（今度は）、例えば、サンプル中の核酸の存在の同定、または核酸ポリマーの関連の決定、核酸ポリマーの大きさの同定、核酸ポリマーにおける２つ以上の個々のユニットもしくはユニット特異的マーカーの間の近接もしくは隔たりの同定、核酸ポリマー中の２つ以上の個々のユニットもしくはユニット特異的マーカーの順序の同定、および／または核酸ポリマーのユニットもしくはユニット特異的マーカーの一般組成の同定を可能にする。生物学的分子の構造および機能が相互依存しているために、構造的情報は、核酸ポリマーの機能についての重要な情報を明らかにし得る。本発明は、核酸ポリマーの不完全な標識化から得られるデータの編集に基づいて核酸ポリマーを分析するための方法である。本方法は、単ユニット標識もしくは多重ユニット標識（両方が本明細書中でユニット特異的マーカーといわれる)、一本鎖核酸ポリマー、二本鎖核酸ポリマー、またはその組み合わせから生成されるデータを使用して実施され得る。

本明細書中で使用される場合、用語「標的部位」は、配列が変動する核酸の配列をいう。例としては、単一のヌクレオチドバリエーション、ヌクレオチド繰り返し、複数塩基欠失（コンセンサス配列から欠失される１つより多くのヌクレオチド）、複数塩基挿入（コンセンサス配列から挿入される１つより多くのヌクレオチド）、マイクロサテライト繰り返し（代表的に５〜１０００繰り返し単位を有する少数のヌクレオチド繰り返し）、ジヌクレオチド繰り返し、トリヌクレオチド繰り返し、配列再配置（転座および複製を含む）、キメラ配列（異なる遺伝子起源からの２つの配列が、一緒に融合される）、などのような、異なる形態で存在する多型が挙げられるが、これに限定されない。配列多型の中で、ヒトゲノムにおける最も頻繁な多型は、単一塩基バリエーションであり、単一ヌクレオチド多型（ＳＮＰ）とも呼ばれる。ＳＮＰは、ゲノム全体に大量に、安定にかつ広く分布している。

ユニット特異的マーカーは、本明細書中で、特異的な標的部位に結合、アニールまたはハイブリダイズするプローブとして使用される。本明細書中で使用されるように、用語「プローブ」は、特異的な標的部位に結合、アニールまたはハイブリダイズする物質を言う。プローブの例としては、ＤＮＡ、ＲＮＡ、ロックド核酸（ＬＮＡ）、ペプチド核酸（ＰＮＡ）、ビーコンオリゴヌクレオチド（ｏｌｉｇｏ）、またはキメラオリゴが挙げられるが、これらに限定されない。ユニット特異的マーカーは、例えば、２塩基対プローブ、３塩基対プローブ、４塩基対プローブ、および５塩基対プローブから選択される一連の異なる核酸プローブであり得る。

ＰＮＡは、糖ホスフェート骨格が、一般に２−アミノエチル−グリシン結合から構成されるペプチド骨格と置き換えられた核酸アナログである。核酸塩基は、アミノ窒素へのメチルカルボニルリンカーを介して骨格に結合される。生じるアナログは、荷電しておらず、アキラルであると同時に、Ｗａｔｓｏｎ−Ｃｒｉｃｋ塩基対を介してＤＮＡおよびＲＮＡを認識する能力を保っている。ＰＮＡは、酵素分解に耐性があり、生きている細胞において安定である。一般に、ＰＮＡと核酸との間のハイブリッドは、高められた熱力学的安定性および特有のイオン特性を示す。

ＬＮＡ、ロックド核酸は、ＲＮＡオリゴマーの合成に使用されるＲＮＡ誘導体である。ＬＮＡは、ＰＮＡと異なり、ＤＮＡおよびＲＮＡ中に見出される同じホスフェート骨格を有し、この骨格が、ＬＮＡオリゴマーがホスホジエステル結合の形成により形成されることを可能にする。ＬＮＡは、ヌクレオチドがリボースの２’−酸素を４’−炭素と結合するメチレン架橋を含む点において、ＲＮＡと異なる。このことは、糖におけるロックされた３’−エンド形態を生じ、この形態は、リボースのコンフォメーションの融通性を減少し、ホスフェートバックボーンの組織化を増大する。この改変は、ＬＮＡのその相補的核酸への結合親和性を増大する。

本明細書中で使用される場合、「標識化ユニット特異的マーカー」は、特定のユニット（単数または複数）を同定するポリマーにおける任意のユニット特異的マーカーである。標識化ユニット特異的マーカーとしては、例えば、特定のユニット（単数または複数）、タンパク質、ペプチド、核酸、多糖、短いオリゴマー、ｔＲＮＡなどに結合される蛍光マーカーを含み、このマーカーは、特定のユニット（単数または複数）を認識かつ結合し、これは、例えば固有の標識化特性を有するもしくは外因性の標識を含むことにより、または抗体のような別の検出分子と結合することにより、検出され得る。

その標識が少なくとも１つの他の標識化ユニット特異的マーカーと異なる場合、「識別可能な特性」を有するように、本明細書中で使用されるような標識化ユニット特異的マーカーが標識化される。代表的には、標識化ユニット特異的マーカーは、異なる発光放出スペクトル分布、寿命、強度、バースト持続時間、または極性非等方性に基づいて互いに区別される。

本明細書中で記載される核酸分析を使用して、ポリマーの個々のフラグメントに対する多重プローブのハイブリダイゼーションパターンを分析することにより、ＤＮＡフラグメントを同定し得る。ＤＮＡの未知のフラグメントに結合される多重プローブの数、型、順序およびプローブ間の距離が、決定され得る。この情報を使用して、差示的に発現された遺伝子の数を明白に同定し得る。さらに、本発明の方法は、特定の発現された遺伝子の実際の数を厳密に定量し得る。大量の情報が生成した場合、本発明の方法は、発現した遺伝子の選択もアッセイされるべき未知の核酸の選択も必要としない。本発明の方法は、生成したハイブリダイゼーションパターンのコンピューター分析により未知の発現された遺伝子を同定し得る。次いで、ＤＮＡプローブの段階的分析（ｌｉｎｅａｒａｎａｌｙｓｉｓ）から得られたデータを、データベースにおける情報と適合して、標的ＤＮＡの組成または同一性を決定する。このように、本方法を使用して、ハロタイプを決定し得、ハイブリダイゼーション反応からの情報を分析し得、次いで、この方法は、遺伝子発現パターンの診断および決定に適用され得る。

本明細書中で使用される場合、用語「単プローブ」は、標的配列に特異的にアニールまたはハイブリダイズする発光ハイブリダイゼーションプローブをいう。

本明細書中で使用される場合、用語「多プローブ」は、標的部位を同定するのに一緒に作用する発光ハイブリダイゼーションプローブをいう。同じ標的部位に特異的にアニールまたはハイブリダイズすることにより、複数の標的部位に特異的にアニールまたはハイブリダイズすることにより、プローブを異なる結合親和力で使用することにより、多プローブが一緒に作用し得、その結果、標的部位への特異的なアニールまたはハイブリダイゼーションは、特定の温度で起こる。多プローブは、ハイブリダイゼーション対、５’−エキソヌクレアーゼオリゴヌクレオチド対、エネルギー移動オリゴヌクレオチド対、または３’−エキソヌクレアーゼ対であり得る。

標識化部分は、検出可能である部分である。標識化部分の例としては、色素（例えば、蛍光色素分子）、量子ドット、発光ナノ結晶、分子ビーコンおよび放射活性粒子が挙げられる。

本明細書中で使用される場合、用語「発光ハイブリダイゼーションプローブ」は、発光放出を含む、識別可能な特性を有するプローブをいい、この特性は、スペクトル分布、寿命分布、強度分布、または発光の極性非等方性分布により区別され得る。これらの分布は、単一色素分子、エネルギー移動対、ナノ粒子、量子ドット、発光ナノ粒子、または分子ビーコンをも有する発光ハイブリダイゼーションプローブにより引き起こされる。

用語「分子ビーコン」は、均一の溶液中での特異的核酸の存在を報告するシステムをいう。これらのプローブは、これらがその標的にハイブリダイズする場合、自発的蛍光発生的（ｆｌｕｏｒｏｇｅｎｉｃ）コンフォメーション変化を経る。完全に相補的な標的のみがこの応答を引き出す。これは、特異的なアニールまたはハイブリダイゼーションが、標的が適合しないヌクレオチドまたは欠失を含む場合、起こらないためである。

蛍光共鳴エネルギー移動（ＦＲＥＴ）は、２つの色素分子の電子的励起状態の間の距離依存相互作用であり、このエネルギー移動において励起は、光子を放出することなくドナー分子からアクセプター分子に移動される。ＦＲＥＴは、分子間分離の−６乗に依存しており、このことは、生物学的高分子の寸法に適合可能である距離にわたってＦＲＥＴを有用にしている。従って、ＦＲＥＴは、分子の近接における変化を生成する種々の生物学的現象を調査する重要な技術である。

ドナー分子およびアクセプター分子は、近く接近しなければならない（代表的に、１０〜１００Å）。アクセプターの吸収スペクトルは、ドナーの蛍光発光スペクトルと重ならなければならない。大部分の適用において、ドナー色素およびアクセプター色素は異なり、この場合、ＦＲＥＴは、アクセプターの感作蛍光の出現によって、またはドナー蛍光のクエンチによって、検出され得る。ドナーおよびアクセプターが同じである場合、ＦＲＥＴは、生じる蛍光脱分極によって検出され得る。

励起の際に、ドナー発蛍光団は、特徴的な寿命（ｔ）を有する蛍光光子を放出する。ドナーの発光バンドと重なる吸収バンドを有する第二の発蛍光団に近く（５〜１０ｎｍ）接近することにより、第二の発蛍光団の励起（アクセプター）をもたらし、その速度は、これらの間の距離の６乗に反比例する。従って、ドナー蛍光およびその寿命は、ドナー−アクセプター距離に依存する。ＦＲＥＴの測定は、蛍光強度の変化、またはドナー蛍光寿命の測定に基づき得る。

この技術は、色素分子のいくつかの異常な特性を利用する。蛍光色素を使用するＦＲＥＴ測定において、その色素分子は、代表的に、１つの波長の光で励起され、そしてデータは、より長い波長で収集される。

本明細書中で使用される場合、「エネルギー移動色素対」とは、２つの色素分子の電子的励起状態の間の、距離に依存する相互作用をいい、ここで、励起は、１つの色素（ドナー発蛍光団）から別の色素（アクセプター発蛍光団）に、光子の放出なしで移動される。これらの２つの色素分子は、一般に、切断可能に修飾されたヌクレオチドの反対側に位置し、その結果、切断が、これらの色素の互いに対する接近性を変化させ、そしてこれによって、ポリヌクレオチド上の色素の蛍光出力を変化させる。

本明細書中で使用される場合、「量子ドット」とは、発光ハイブリダイゼーションプローブと共に使用される標識であり、これは、コア、キャップおよび親水性付着基を含む。「コア」とは、ナノ粒子の大きさの半導体である。この半導体の大きさは、約１ｎｍ〜約１０ｎｍの範囲である。このコアは、より好ましくは、半導体であり、そして大きさが約２ｎｍ〜約５ｎｍの範囲である。最も好ましくは、このコアは、ＣｄＳまたはＣｄＳｅである。この点に関して、ＣｄＳｅが、コアとして特に好ましく、特に、約４．２ｎｍの大きさで好ましい。

「キャップ」とは、コアの半導体とは異なる半導体であり、そしてコアに結合し、これによって、コア上に表面層を形成する。キャップは、所定の半導体コアと組み合わせられる場合に、発光量子ドットを生じるようでなければならない。好ましくは、キャップはＺｎＳまたはＣｄＳである。より好ましくは、キャップは、ＺｎＳである。特に、コアがＣｄＳｅまたはＣｄＳである場合には、キャップは好ましくはＺｎＳであり、そしてコアがＣｄＳｅである場合には、キャップは好ましくは、ＣｄＳである。

「付着基」とは、この用語が本明細書中で使用される場合、発光半導体量子ドットのキャップの表面に、例えば任意の適切な物理的会合または化学的会合によって、付着し得、そしてこの量子ドットをもはや発光性にすることなく、この量子ドットを水溶性にし得る、任意の有機基をいう。従って、付着基は、親水性部分を含む。好ましくは、付着基は、メルカプト酢酸である。

本明細書中において使用される場合、「蛍光ナノ結晶」とは、光褪色に抵抗し、発光波長スペクトルを共有し、そして高い量子収量で、不連続ピークの発光スペクトルで蛍光を発し得る、発光ハイブリダイゼーションプローブに対して使用される結晶である。

本明細書中において使用される場合、「蛍光ナノ粒子」とは、光褪色に抵抗し、発光波長スペクトルを共有し、そして高い量子収量で、不連続ピークの発光スペクトルで蛍光を発し得る、発光ハイブリダイゼーションプローブに対して使用される粒子である。

本明細書中において使用される場合、「単一の色素」とは、発光ハイブリダイゼーションプローブと共に使用される蛍光標識である。この標識としては、ＴＡＭＲＡ、Ｃｙ３、Ｃｙ５、ＣａｓｃａｄｅＢｌｕｅ、およびＩＲ８００が挙げられ得る。

本明細書中において使用される場合、「挿入色素」とは、核酸と疎水性相互作用することによってこの核酸を標識し得る色素である。挿入色素の例は、エチジウムブロマイドである。

本明細書中において使用される場合、用語「侵入オリゴヌクレオチド」とは、その３’末端に、プローブオリゴヌクレオチドの５’末端に位置する配列と実質的に同じである配列を含む、オリゴヌクレオチドをいう；これらの領域は、相補的な標的核酸に沿った標的部位へのハイブリダイゼーションについて、競合する。

本明細書中において使用される場合、用語「連結オリゴヌクレオチド」とは、標的部位の少なくとも一部と相補的であり、そして標的部位とハイブリダイズして、一本鎖領域および二本鎖領域を有するハイブリッドを形成する、オリゴヌクレオチドをいう。このハイブリッドは、複数のオリゴヌクレオチド三リン酸（例えば、ＡＴＰ、ＣＴＰ、ＧＴＰ、ＴＴＰ、ＵＴＰ）およびポリメラーゼ酵素と接触し得、これによって、ハイブリッドに順番に連結し、複数のオリゴヌクレオチド三リン酸の少なくともいくらかを、二本鎖領域まで伸長させ、これによって、標的部位の一部分に相補的な核酸鎖を合成する。

本明細書中において使用される場合、「問い合わせヌクレオチド」とは、連結オリゴヌクレオチドの３’末端におけるヌクレオチドである。問い合わせヌクレオチドは、連結オリゴヌクレオチドがハイブリダイズされる標的部位と塩基対またはミスマッチを形成し得る。

本明細書中において使用される場合、「ミスマッチ伸長エキソヌクレアーゼオリゴヌクレオチド」とは、ＤＮＡポリメラーゼによるプライマー伸長効率の、ミスマッチの５’末端または３’末端に対するマッチした５’末端または３’末端の差の測定に依存する、オリゴヌクレオチドである。１つの例において、３’末端において１つの塩基が異なる２つの検出プライマーが設計される；一方は、標的部位のＤＮＡ配列の１つの種に正確に相補的であり、そして他方は、標的部位のＤＮＡ配列の別の種に正確に相補的である。これらのプライマーは、目的の塩基を越えて３’末端とハイブリダイズし、そしてプライマー伸長速度は、ＤＮＡポリメラーゼおよびデオキシヌクレオチドとのインキュベーションの後に、測定される。検出プライマーがテンプレートに正確にマッチする場合、高い伸長速度が観察される。対照的に、検出プライマーの３’末端がテンプレートに正確にはマッチしない（ミスマッチの）場合、プライマー伸長速度は、ずっと低くなる。次いで、ＤＮＡポリメラーゼによるプライマー伸長効率の、ミスマッチの３’末端に対するマッチした３’末端の差が、１塩基の識別のために使用され得る。

本明細書中において使用される場合、「サンプルチャンバ」とは、サンプルが問い合わせのために調製されるコンテナである。サンプルチャンバとしては、例えば、フロースルーキャピラリー、カバーガラス付きのスライドガラス、マイクロチップ、またはサンプルの取り扱いを可能にする任意の他の適切なサンプルチャンバが挙げられる。サンプルチャンバは、例えば、サンプルが通って流れるチャネルであり得る。

サンプルは、種々の異なる手段によって（例えば、分子モーターによってか、電気泳動力によってか、流体力学的力によってか、またはこれらの組み合わせによって）、チャネルを通って流れ得る。

「検出ステーション」とは、本明細書中において使用される場合、サンプル上のマーカーが問い合わせられる、サンプルチャンバ内の領域である。この問い合わせは、マーカー自体から発せられる（固有の）シグナルを検出してか、またはマーカーを、検出可能なシグナルをこのマーカーに発生させる因子と接触させることによって、達成される。検出ステーションは、任意の材料（気体を含む）から構成され得る。好ましくは、ステーションは、非液体材料である。「非液体」とは、当該分野におけるその通常の意味を有する。液体とは、非固体の、非気体の材料であり、それらの間での構成分子の自由な運動（しかし、分離する傾向はない）によって特徴付けられる。別の好ましい実施形態において、このステーションは、固体材料である。検出ステーションは、検出ステーションにおいて問い合わせられるサンプルの検出を可能にするデバイスに関連し得る。例えば、検出ステーションは、アバランシェフォトダイオードまたは電荷結合素子と光学通信し得る。検出ステーションは、例えば、共焦点レーザースポットであり得、これは、標識されたサンプルが通って流れるチャネルに焦点を合わせる。レーザーは、光学トレインを通る位置から遠隔であり得、そしてこの位置に指向され得る。

ユニット特異的マーカーと検出ステーションとの間の相互作用が、ポリマー依存性のインパルスを生じる場合、このステーションは、「シグナル発生ステーション」である。シグナル発生ステーションの１つの型は、相互作用ステーションである。本明細書中において使用される場合、「相互作用ステーションまたは部位」とは、ポリマーのユニット特異的マーカーが因子と相互作用し、そして因子に対して十分に接近して近くに位置し、これによってこれらが相互作用し得る領域である。例えば、発蛍光団についての相互作用ステーションは、これらがエネルギー的に相互作用してシグナルを生じるために十分に近い領域である。

本明細書中において使用される場合、「延びたポリヌクレオチド」または「延びた核酸」とは、螺旋状でも超螺旋状でもない核酸である。例えば、この核酸は、およそ線状になるように延びる。

本発明は、広範には、核酸の大きい集団を分析するための、単一分子の遺伝子の分析の使用に関する。本発明の１つの実施形態において、ＤＮＡの直接分析は、ＤＮＡのプールが集団を調べ、そしてその集団がゲノム内の特定の位置において差異を有するか否かを決定することを可能にする。このことは、反応からのＤＮＡがプールされ、同じ反応チューブ内で一緒に調製され、次いで、特定の集団に存在する状態を示す別個の単一の分子として分析されることを可能にする。試験サンプル集団およびコントロール集団の各々の状態が比較されて、集団の間の差異を同定し、従って、集団の間に遺伝的差異が存在するか否かの問題に取り組む。これは、集団が表現型の差異（例えば、疾患および非疾患）によって分離される場合に、特に有用である。

本発明の別の実施形態において、症例の集団およびコントロール集団由来のＤＮＡが、それらのそれぞれの単一の反応容器内に別々にプールされる。従って、各反応チューブは、集団（試験サンプルまたはコントロール集団のいずれか）の１つのサブセットのＤＮＡの全てについて、等しい量のＤＮＡを含む。集団の選択された位置が、長いＰＣＲを使用する分析のために選択される。長いＰＣＲ反応は、異なる反応混合物に対して実施され、従って、反応混合物の各々に存在するそれぞれのハプロタイプの全てを増幅する。次いで、集団の各々から得られるＰＣＲ産物混合物は、タグ化され、洗浄され、そして単一分子検出システムを通して送信される。従って、試験サンプルとコントロール反応混合物との比較は、それぞれの集団の各々に存在するかまたは存在しない、特定のハプロタイプの決定を可能にする。このシステムの他の実施形態は、サンプル調製の異なる方法に関し、この方法としては、目的の領域の増幅を包含せず、その代わりに、配列特異的タグを使用するＤＮＡの部位の直接のタグ化を包含する方法が挙げられる。さらなる実施形態はまた、分析されるべきゲノムの特定の領域の認識のための、標的化クローニング方法を包含する。

本発明はまた、広範に、単一分子の分析の使用を介して実施され得る、フラグメントハプロタイプ決定を記載する。本発明の１つの実施形態において、この方法は、多重化された単一分子検出の使用を包含する。例えば、ゲノムの領域にわたるハプロタイプの分析は、ＤＮＡフラグメントの単離／増幅、ゲノムの多型領域の差次的タグ化、および単一分子の検出を使用する差次的タグ化パターンの区別を包含し得る。この方法は、図１に概略的に記載されている。

特定の実施形態において、本発明は、２つの異なる遺伝子座における、一塩基多型を検出するための方法を記載する。この方法は、１つのみの位置で配列が異なるテンプレートの間を区別し得る、蛍光標識オリゴヌクレオチドを使用するＤＮＡの増幅に関する。複数の識別オリゴ（各々が、異なる発蛍光団と結合体化される）の同時の使用は、複数の遺伝子座の同時の増幅を可能にする。ＰＣＲ産物は、単一の分子および分子集団の分析のために適合された分析プラットフォーム（例えば、ＧＥＮＥＥＮＧＩＮＥ^ＴＭ）で分析される。１つのこのようなシステムの詳細は、米国特許第６，３５５，４２０号に見出され、これは、本明細書中に参考として特に援用される。単一分子の検出様式は、発蛍光団のセットが相関するか否かを試験するために使用され、これは、対立遺伝子の連結、および従って、ハプロタイプの同定を示す。

（ハプロタイプ決定）
ＳＮＰは、複雑な疾患関連研究（連鎖分析）（ここで、疾患変異の接近して近付く遺伝マーカー（ハプロタイプ）の特定の対立遺伝子（相同染色体の同じ遺伝子座に存在する２つ以上の遺伝子のうちの１つ）が、その疾患と一貫して関連付けられる）のための、理想的な遺伝マーカーとして働く。新たに推定されたＳＮＰ情報の、既知のＳＮＰライブラリーとの比較は、ヒト疾患の複雑な遺伝成分の説明を可能にし、これによって、薬物発見のプロセスを加速する。ＳＮＰはまた、集団研究、進化研究および法医学的研究、ならびに多型プロフィールのための良好なマーカーである。これらは、個体の遺伝プロフィールに基づいて、疾患の危険性を評価する可能性、または薬物応答を予測する可能性を与える。さらに、ＳＮＰプロフィールは、個々の患者に対して薬物処置をあつらえ、処置の効力および安全性を改善するために使用され得る。

ハプロタイプは、単一の染色体上に位置する遺伝決定因子のセットであり、そして代表的に、染色体の領域における対立遺伝子（遺伝子の代替の配列の全て）の特定の組み合わせを含む。換言すれば、ハプロタイプは、個々の染色体上の、段階付けられた配列情報である。非常に頻繁に、染色体上の段階付けられたＳＮＰは、ハプロタイプを規定する。２つのヒト染色体上の２つのハプロタイプの組み合わせは、最終的に、ヒト細胞の遺伝プロフィールを決定する。特異的遺伝子マーカーと疾患変異との間の連結を決定するものは、ハプロタイプである。ＳＮＰをスコア付けする現在の方法（例えば、ハイブリダイゼーションマイクロアレイまたは直接ゲル配列決定）（Ｌａｎｄｇｒｅｎら、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ，８：７６９−７７６，１９９８に概説される）は、個々のＳＮＰの型を正確に決定し得るが、二倍体の対のどちらの染色体が、各多型に関連するかを決定し得ない。ハプロタイプの段階付けされた情報なしでは、異なるハプロタイプの多数の可能性に起因して、二倍体関連を検出することが不可能であるかもしれない。

遺伝子型から推定されるハプロタイプは、代表的に、以下のように、多量でなされる（推定ハプロタイプ）：目的の領域が、ＰＣＲで増幅され、その遺伝子型が決定され、そしてそのハプロタイプが、ホモ接合個体から推定される。遺伝子型は、両方の染色体の混合物に対する多量の測定に基づくので、この遺伝子型決定アプローチは、多数のＳＮＰマーカーという重大な制限を有する。

集団の分析のために使用される現在のゲノミクス技術としては、サンガーの配列決定およびＰＣＲまたは他の型の酵素的増幅に基づく方法が挙げられる。ハプロタイプは、遺伝の分析のために数キロベースのＤＮＡ〜数メガベースの大きさのＤＮＡにわたって作製される必要があるので、ＰＣＲとサンガー配列決定との両方に基づく技術は、しばしば不十分である。従って、遺伝分析の既存の方法は、ＤＮＡの長い伸長にわたるハプロタイプの同定を可能にしない。

伝統的に、関連研究は、少数のマーカーを含む、単純な、単一遺伝子の疾患についてのみ成功しており、ここで、異なるハプロタイプの可能な組み合わせは、制限されている。従って、ハプロタイプは、代表的に、多くの個体を型決定すること、ならびにホモ接合性情報および親の情報の利用可能性によって、遺伝子型から推定され得る。しかし、大部分の疾患は複雑であり、そして複数の遺伝子を含む。多遺伝子性の関連研究については、さらにより多くのマーカーが必要とされ、従って、可能なハプロタイプの数が大きい。これらの場合において、遺伝子型からハプロタイプを推定することは、非常に困難である。

ハプロタイプ決定の１つの方法は、マイクロサテライトマーカーを、ゲノムの特定の位置（例えば、１００ｋｂ、２００ｋｂ、および３００ｋｂ）において使用する。１００ｋｂの位置をＰＣＲでアッセイすることによって、２つの異なる大きさのＰＣＲ産物が得られ、一方は「Ａ」と記載され、そして他方は「ａ」と記載される。２００ｋｂの位置および３００ｋｂの位置は、同様に、ＢｂおよびＣｃを生じる。遺伝を理解する目的で、どのマイクロサテライトマーカーが同時に遺伝するかを知り、マーカーのどの組合せが特定の表現型特性を生じるかを決定させることが重要である。遺伝子座の２つのコピー上のマーカーの、多くの可能な組み合わせが存在する。その目的は、マーカーの組み合わせの統計学的補正が、遺伝パターンを追跡し得るように、ハプロタイプ、または物理的に遺伝したマーカーの線形順序を決定することである。ＰＣＲに依存する技術を用いて、単離物における１つの個体の分析は、ハプロタイプを生じ得ない。しかし、この制限は、その個体の親のマーカーを分析するというさらなる努力によって、回避され得る。この情報を用いて、ハプロタイプが、統計学的に再構築され得る。

ハプロタイプ決定する別の方法は、一塩基多型（ＳＮＰ）を使用して、先祖（家族性ではない）遺伝を決定する。多くのＳＮＰが、１つの共通の先祖から受け継がれた、ＤＮＡの共有される領域を見出すためにスコア付けされる。次いで、このゲノムのこれらの共有される領域（約３０キロベースであることが要求される）が、目的の表現型特性に結び付けられ得る。どの領域が、シャッフルされた領域であるかを決定するために、ハプロタイプの決定は、重要である。しかし、候補遺伝子領域のＳＮＰ分析は、現在の技術を用いると困難であり、表現型を組み立てるためには、親の情報が必要とされ、そしてＳＮＰは二対立遺伝子（ｂｉａｌｌｅｌｉｃ）（２つのみの可能な多型を有する）であるので、いくつかのヘテロ接合性二対立遺伝子ＳＮＰの伸長は、現在の技術を使用して、ハプロタイプに組み立てられ得ない。その結果、完全な直系がアッセイされる場合でさえも、この情報は失われ、そして回復され得ない。

ハプロタイプ決定のための別の従来の代替は、対立遺伝子特異的ポリメラーゼ連鎖反応（対立遺伝子特異的ＰＣＲ、ＲｕａｎｏおよびＫｉｄｄ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，１７：８３９２，１９８９）であり、これは、ハプロタイプ決定を指向するために、最も通常に使用される方法である。これらの反応において、ＳＮＰ特異的ＰＣＲプライマーが、２つの染色体から特定のハプロタイプを区別し、そして増幅するために、設計される。このような反応は、ストリンジェントな反応条件、および各標的に対する個々の最適化を必要とする。従って、このアプローチは、大規模のハイスループットのハプロタイプ決定には適さない。より重要なことには、このようなアッセイは、ＰＣＲ増幅の長さの制限に供され、そして数キロベース（ｋｂ）より大きく離れたＳＮＰの型を決定し得ない。さらに、このような増幅に基づく型決定は、しばしば、サンプル取り扱いプロセスの間の、サンプルＤＮＡ以外の少量のゲノムＤＮＡの夾雑によって、複雑にされる。

他のハプロタイプ決定方法としては、単一精子または単一染色体の測定が挙げられる（例えば、Ｒｕａｎｏら、ＰＮＡＳ、８７：６２９６−６３００、１９９０およびＺｈａｎｇら、ＰＮＡＳ，８９：５８４７−５８５１，１９９２を参照のこと）。単一精子選別アッセイにおいて、個々の選別された精子由来のＰＣＲで増幅されたＤＮＡが、遺伝子型決定される。２つのハプロタイプを明らかにするために十分な統計学的信頼度を得るために、個体由来の複数精子細胞（少なくとも３〜５）が型決定される。原理的には、この選別アプローチは、染色体に適用され得る。しかし、この技術は複雑であり、そして現在まで、ほんのいくつかの研究室においてのみ成功している。

分子クローニング方法は、個体のＤＮＡ（またはｃＤＮＡ）の標的領域をベクター内にクローニングし、そして単一のコロニーから得られたＤＮＡを遺伝子型決定する。各個体について、２つのハプロタイプを得るために、複数のコロニーが必要とされる。この方法は、多くの実験室によって使用されているが、非常に労働集約型であり、時間を消費し、そしていくつかの場合においては、実施することが困難であり得る。容易な代替物が存在しないので、研究者らは、この方法の使用を強制される。

ＡＦＭ（原子間力顕微鏡）画像化（Ｗｏｏｌｌｅｙら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，１８：７６０−７６３，２０００およびＴａｔｏｎら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，１８：７１３，２０００）は、個々のＤＮＡ分子上の多型部位を直接可視化することを可能にする。この方法は、高解像度の単層カーボンナノチューブを備えるＡＦＭを利用して、ＤＮＡフラグメント中の、１００〜１０，０００個の塩基を含む複数の多型部位を直接読み取る。このアプローチは、標識されたオリゴヌクレオチドプローブの、ＤＮＡフラグメント中の標的配列への特異的ハイブリダイゼーション、引き続くＡＦＭによる標識の存在および空間的位置の直接の読み取りを包含する。このようなシステムのスループットおよび感度は、まだ実証されていない。

（サンプルの調製）
遺伝子座特異的なハプロタイプ分析は、ゲノムからＤＮＡの領域の単離を必要とする。これらのサンプル調製法は、クローニング、ＰＣＲまたは他のＤＮＡ単離の方法を含み得る。本発明のこの実施形態において、ポリメラーゼ連鎖反応（ＰＣＲ）が、サンプル単離の好ましい方法である。ＰＣＲは、分析のために特異的であるゲノムの領域を単離するために、目的の領域について行われる。ＰＣＲは、数百塩基〜１００００塩基対を超える範囲にわたって利用され得る。ＰＣＲの長さが長くなるほど、得られるハプロタイプ決定の情報が多くなる。ロングＰＣＲ（ＬｏｎｇＰＣＲ）または他の類似の技術を用いて、所望のフラグメントを作製し得る。ＰＣＲは、単分子ハプロタイプ分析において使用するのに簡便である。なぜなら、単分子分析は、従来のＳＮＰ分析ではこの決定が可能でない場合に、ハプロタイプ決定を可能にするからである。クローニングまたは他のフラグメント単離技術が、従来のＳＮＰ分析についても可能であり、これは、２コピーの二倍体ゲノムが物理的に分離されるためである。ＰＣＲ分析において、２コピーの二倍体ゲノムが両方とも増幅され、目的の領域の２コピーの合成混合物を作製する。こうして、ＰＣＲで増幅したＤＮＡ領域は、単分子検出の技術を用いる分析に特に適する。

（タギング化学（Ｔａｇｇｉｎｇｃｈｅｍｓｔｒｙ））
ゲノムの異なる部位にＤＮＡをタギングする複数の方法がある。これらは、配列特異的なオリゴヌクレオチドまたは、他のハイブリダイズ用試薬（例えば、ペプチド核酸）を用いる、目的の領域への直接ハイブリダイゼーションを含む。タギングする他の方法としては、プライマー伸長反応、リガーゼ指向配列検出の使用および、配列の検出のための蛍光共鳴エネルギー伝達の使用が挙げられる。

４ヌクレオチド標識スキームを、作製し、標的ＤＮＡのＡ、Ｃ、ＧおよびＴを別個のラベルで標識し得る。ステーションを直線的に通過するように移動する場合、このような分子は、シグナルの線形順序を作製し、これは、標的ＤＮＡ上のヌクレオチドの線形順序に対応する。４ヌクレオチドストラテジーの使用の利点は、データ解釈の容易さおよび、ユニット特異的なマーカーの全配列が標識された単一のポリマーから決定され得るという事実である。しかし、４つ全ての塩基に外来の標識を加えることにより、立体障害の問題を生じ得る。この問題を減らすために、ヌクレオチドのいくつか、または全ての固有の特性を用いて、ヌクレオチドを標識し得る。上記のように、プリンおよびピリミジンの各々が、別個の吸収スペクトル特性を有するため、ヌクレオチドは、固有に標識される。本明細書中に記載される標識スキームの各々において、ヌクレオチドは、外来性にか、または、固有に、標識され得るが、４ヌクレオチド標識法が用いられる場合、少なくともいくらかのヌクレオチドが固有に標識されることが好ましい。外来の標識が４ヌクレオチド標識スキームとともに用いられる場合、標識が、小さく、かつ電荷が中性であり、立体障害を減少することがまた好ましい。

４つのうち３つのヌクレオチドが標識される、３ヌクレオチド標識スキームがまた実施され得る。４つのうち３つのヌクレオチドのみが標識される場合、本発明の方法により作成されたデータの分析は、４つ全てのヌクレオチドが標識される場合よりもより複雑である。４番目の標識されていない型のヌクレオチドの数および位置が別個に決定されなければならないため、このデータはより複雑である。４番目のヌクレオチドの数および位置を決定するための１つの方法は、標識された核酸分子の２つの別のセットの分析を利用する。例えば、１つの核酸分子が、Ａ、ＣおよびＧで標識され、そして、他方がＣ、ＧおよびＴで標識され得る。２セットからの標識されたヌクレオチドの線形順序の分析は、配列データを得る。各セットについて選択された３つのヌクレオチドは、２セットが４つ全ての標識されたヌクレオチドを含む限りは、多くの異なる可能性を有し得る。例えば、ＡＣＧのセットは、標識されたＣＧＴ、ＡＣＴまたはＡＧＴのセットと組にされ得る。

４番目のヌクレオチドを含む配列がまた、ネガティブ標識ストラテジーを用いる、少なくとも２つの差次的に標識されたポリマーのセットではなく、１標識されたポリマーのみを用いることによって決定され、ポリマー上の４番目のヌクレオチドの位置を同定し得る。ネガティブ標識は、標識されていないユニットに基づく配列情報の同定を含む。例えば、核酸分子の３つのヌクレオチドが、単一の型のシグナルを提供するラベルで標識される場合、ポリマー骨格に沿った標識されていない点が、４番目のヌクレオチドによるものに違いない。このことは、核酸分子上の標識されたヌクレオチド間の距離を決定することによって達成され得る。

オリゴヌクレオチド上のｄＮＴＰは、種々の検出可能な部分で標識され得、その結果、標識されたオリゴヌクレオチドでタグ化したＤＮＡが検出され得る。ｄＮＴＰは、ＴＡＭＲＡ、Ｃｙ５、Ｃｙ３、ＩＲＤ８００、フルオレセイン、ＴｅｘａｓＲｅｄ、緑色蛍光タンパク質および他の蛍光ラベルで蛍光標識され得る。ｄＮＴＰは、赤色、橙色、緑色、紫色および青色を含む、別個の着色蛍光剤で標識され得る。ｄＮＴＰはまた、^３Ｈ、^１４Ｃ、^３２Ｐまたは^１２５Ｉで放射能標識され得る。ｄＮＴＰはまた、西洋ワサビペルオキシダーゼ、アルカリホスファターゼおよび他の酵素的に検出可能な触媒で酵素標識され得る。ｄＮＴＰはまた、他の分子へのその親和性によって（例えば、アビジン−ビオチン、プロテインＡ−ＩｇＧ）、そして、他の特異的な相互作用を介して標識され得る。

（プライマー伸長が媒介する化学および読み出し）
ロングＰＣＲで作製したフラグメントの多色分析と組み合せてプライマー伸長技術を用いて、単分子ハプロタイプ分析を作製し得る。ハプロタイプ決定されるＤＮＡ配列を、１つ以上のＳＮＰ特異的なプライマーとハイブリダイズさせる。これらのプライマーは、実際のＳＮＰのちょうど５’の配列に特異的である。次いで、４つのうち１、２、または３のヌクレオチドを識別可能なラベルで標識する（例えば、ｄＣＴＰ−Ｃｙ５（Ａｍｅｒｓｈａｍ）およびｄＵＴＰ−ＴＡＭＲＡ（ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ）蛍光ヌクレオチドを用いて、ＤＮＡ鎖上のハプロタイプが決定され得る）。プライマー伸長は、標識されたヌクレオチドのみの存在下で実施される。ＳＮＰに対して特異的にアニールするヌクレオチドは、プライマーを標識されたヌクレオチドで伸長させる。

どのＳＮＰとどの標識されたヌクレオチドを同時に分析するかの選択に注意を払わなければならない。ＳＮＰの３’末端のヌクレオチドが、ＳＮＰ自体にハイブリダイズするものとは、別の標識されたヌクレオチドにハイブリダイズする場合、このヌクレオチドは、二重に標識され、潜在的に結果をあいまいにする。また、ＳＮＰの３’末端のヌクレオチドがＳＮＰ自体と同じヌクレオチドである場合、このヌクレオチドはまた、ＳＮＰと同じヌクレオチドで標識され得る。このことは、次のヌクレオチドが同じヌクレオチドである限りは生じ得る。このストレッチの３’、次のヌクレオチドが別の標識されたヌクレオチドとハイブリダイズしないか、または、上記のように同じ二重標識が生じることに注意を払わなければならない。技術のこの制限は、標識されたヌクレオチドは、１番目のヌクレオチドの伸長の間に大部分が使い果たされるように、過剰量の標識されたヌクレオチドを用いないことによって克服され得る。

ロングＰＣＲのフラグメントは、ＳＮＰ特異的なプライマーにハイブリダイズし、２標識ｄＮＴＰのみの存在下で伸長する（図２）。ｄＮＴＰのみの取り込みは、塩基間の相補性が存在する場合に生じる。２つＳＮＰのアッセイは、４つの別個の可能なハプロタイプ（２^２バージョン）を可能にする。プライマー伸長についての２つの別に着色されたｄＮＴＰおよび分子のインターカレーター（ｉｎｔｅｒｃａｌａｔｏｒ）についての３番目の色（例えば、緑色）を用いて、４つの別個の色の組み合わせは、別個のハプロタイプの識別を可能にした。データのサンプルアウトプットを図３に示す。

図３Ａのサンプルアウトプットにおいて、ハプロタイプＡとハプロタイプＢの両方が混合物中に存在する。両方のハプロタイプが５０／５０増幅され、そしてまた、９０％の検出／化学効率が存在することを仮定する。非効率な検出／化学は、他のハプロタイプチャネルに「バックグラウンド」を作製する。例えば、ハプロタイプＡの認識から生じたバックグラウンドは、ハプロタイプＢおよびＣのチャネルにおいて９％であり、ハプロタイプＤチャネルにおいて１％である。この非効率性は、この種の分析における説明される必要があり、そしてまた、配列部位の認識のためにさらなる色を使用することによって、さらに緩和され得る。

パネルＡにおいて、ハプロタイプＡおよびＢが、同じ量で存在する。ハプロタイプＡが存在する場合、９０％の検出／化学効率が想定され、細い点線の棒によって表されるリードアウトを期待する。ハプロタイプＡチャネルに９０％のシグナル、ハプロタイプＢチャネルに９％のシグナル、ハプロタイプＣチャネルに９％のシグナル、そしてハプロタイプＤチャネルに１％のシグナルが存在する。このことは、ハプロタイプＢおよびＣのハプロタイプＡに対する類似性が、ハプロタイプＤのハプロタイプＡに対する類似性よりも高いことに起因する。ハプロタイプＡがハプロタイプＢまたはハプロタイプＣと間違えられるためには、１つの蛍光ラベルが、誤っているかまたは読まれないことが必要であり、一方で、ハプロタイプＡがハプロタイプＤと間違えられるためには、２つの蛍光ラベルが誤っているか、または読まれないことが必要である。ハプロタイプＢが存在する場合、再度、９０％の検出／化学効率が想定され、黒い平行線模様の棒によって表されるリードアウトを期待する。ハプロタイプＢは、シトシンおよびインターカラント上、色２で標識される。ＤＮＡがインターカラントで標識されるほとんど１００％の機会が存在し、従って、インターカラントは効率計算に計算されない。従って、ハプロタイプＢは、その蛍光色素が誤っているかまたは読まれない場合、ハプロタイプＤと間違えられるのみであり得る。

データ分析は、検出化学および標識化学の非効率さを考慮に入れることを必要とする。さらに、混合物中に存在する２つのハプロタイプの差次的な増幅が存在し得る（これらが１：１の比で存在する場合でさえ）。以下の実施例は、これらの対立遺伝子の差次的な増幅ならびに不完全な化学／検出の両方を考慮したシグナルアウトプット案を例示する。

図３Ｂにおいて、ハプロタイプＢおよびハプロタイプＣが混合物中に存在することは明らかであり、これは、非効率さのために、ハプロタイプＢおよびＣが互いに由来し得ない（すなわち、各々が各々自体において固有である）ためである。パネルＢにおいて、ハプロタイプＢおよびＣが同じ量で存在する。この場合、ハプロタイプＢは、図３Ａと同じ割合で、点線の棒により表される。ハプロタイプＣのリードアウトは、黒い平行線模様の棒によって表される。ハプロタイプＢのように、ハプロタイプＣは、１つのみの発蛍光団および緑色インターカラントで標識される。ハプロタイプＣは、この発蛍光団がシトシン上の色２の代わりに、チミジン上の色１であるという点でハプロタイプＢと異なる。９０％の検出／化学効率を想定すると、９０％のハプロタイプＣに対するリードアウトがＣチャネルにはっきりと見え、１０％のリードアウトがＤチャネルにはっきりと見える。ハプロタイプＤと同様に、ハプロタイプＣは、１つのみの発蛍光団を失わなければならず、従って、発蛍光団が付着していないハプロタイプＤと混同し得るのみである。ハプロタイプＣおよびハプロタイプＤを示すシグナルが同じ値であったとしても、２つのハプロタイプのみが混合物中にあり、ハプロタイプＢとハプロタイプＣのみが、サンプル中に存在すると結論付けなければならない。この分析は、他の例に対しても期待され得、これらの非効率さにもかかわらず、ハプロタイプが依然として、２つの別個の色のｄＮＴＰとインターカレーター色のみの使用により疑いなく決定され得るということに当てはまる。

図３Ｃにおいて、再び、ハプロタイプＢとハプロタイプＣの両方が存在するが、ハプロタイプＢは、ハプロタイプＣが存在する量の１０倍で存在する。リードアウトは、ハプロタイプＣについてのシグナルがハプロタイプＢについてのシグナルに関して１０倍消失することを除いて、第２の場合においてと同じである。ハプロタイプＣのこの低い相対濃度でさえ、ハプロタイプＣが存在しなければならないことが明らかである。ハプロタイプＢの９０％の検出／化学効率から生じるエラーは、Ｃチャネルでは目立たない。従って、ハプロタイプＢとハプロタイプＣのみが存在し得ることが既知である場合、ハプロタイプＣチャネルにおけるいかなるシグナルの検出も、ハプロタイプＣが存在しているに違いないことを意味する。

（ＳＮＰベースの識別のためのＰＮＡを用いるハイブリダイゼーションベースのアプローチ）
ＳＮＰベースの識別のための同じ型のアプローチのために、２色ＰＮＡを用い得る。２つの別の色で標識したＰＮＡは、１本鎖ＤＮＡまたは２本鎖ＤＮＡのいずれかにハイブリダイズする。ハイブリダイゼーション混合物を洗浄し、浄化し、そして、直接分析のために、単分子リーダーに導入する。特定のＳＮＰにハイブリダイズするように作製されたＰＮＡは、２つの別の蛍光部分で標識され得る。ハイブリダイゼーションの後、着色したインターカラントを３番目の色として添加し得、検出器を通過させてＤＮＡ上の別の蛍光標識の色および位置を見出すか、または、単純に観察して標識したＤＮＡ上の色の組み合わせを見出すことによって、標識したＤＮＡを、検出し得る。

（４色分析を用いるプライマー伸長）
上記の３色分析と同様に、ＳＮＰハプロタイプ分析に１つの追加の蛍光ｄＮＴＰを用いることによって、さらなる情報が得られ得る。蛍光ｄＵＴＰおよびｄＣＴＰに加えて、蛍光ｄＡＴＰが容易に入手され得る。例えば、ＩＲ７０−ｄＡＴＰ（Ｌｉ−Ｃｏｒ）を４番目の色（ｄＮＴＰからの３色と、インターカレーターからの４番目の色）として利用し得る。図４において、多色蛍光ハプロタイプの別の場合が分析され得る。この模式図において、Ｔが１番目の色（例えば、橙色（ＩＲ））で標識され、Ｃが２番目の色（例えば、赤色（Ｒ））で標識され、Ａが３番目の色（例えば、緑色（Ｇ））で標識され、そして、ＤＮＡが、インターカレーターで標識した４番目の色（例えば、青色（Ｂ））で標識される。このアッセイは、図３における３色分析のように設定される。このように、９０％の検出／化学効率からのエラーは、多くの状況における低いレベルの種々のハプロタイプの存在から区別され得る。

図４において、ロングＰＣＲフラグメントをＳＮＰ特異的なプライマーとハイブリダイズさせ、３つのｄＮＴＰのみの存在下で伸長させる。ｄＮＴＰの取り込みは、塩基間に相補性が存在する場合にのみ生じる。２つのＳＮＰのアッセイは、４つの異なる可能なハプロタイプ（２^２バージョン）を可能にする。プライマー伸長のための３色別個に着色されたｄＮＴＰおよび分子のインターカレーターのための４番目の色を用いると、４つの別の色の組み合わせが、別のハプロタイプの識別を可能にする。

（４つのプライマー伸長した塩基の４色分析を用いるハプロタイプ分析）
プライマー伸長反応はまた、４つの別個に標識されたｄＮＴＰと共に用いられ得る。１つの例において、Ｔは色１（例えば、橙色）、Ｃは色２（例えば、赤色）、Ａは色３（例えば、青色）、およびＧは色４（例えば、緑色）である。ハプロタイプＡは、ＳＮＰ１についてＴ、ＳＮＰ２についてＣを有し、ハプロタイプＢは、ＳＮＰ１についてＡ、ＳＮＰ２についてＣを有し、ハプロタイプＣは、ＳＮＰ１についてＴ、ＳＮＰ２についてＧを有し、そして、ハプロタイプＤは、ＳＮＰ１についてＡ、ＳＮＰ２についてＧを有する。各ｄＮＴＰは、異なるスペクトル的に識別可能な発蛍光団を有する。

このシナリオにおいて、４色スペクトル識別を可能にするＳＮＰの対を用いる、４色分析の使用は、４つの塩基の明白な識別を容易にする。ハプロタイプＡは青色および橙色であり、ハプロタイプＢは青色および赤色であり、ハプロタイプＣは橙色および緑色であり、そして、ハプロタイプＤは青色および緑色である。この例において、４つのハプロタイプの各々は、固有の色の組み合わせにより決定される。

（多色単分子ハプロタイプ分析の制限）
単分子検出を用いる、ハプロタイプの多色分析には特定の制限がある。例えば、選択されるＳＮＰの対は、存在する種々の多型が４つの別のプライマー伸長した生成物を生じるようにされる必要がある。この方法論は、以下のシナリオでは機能しない。Ｔは色１（例えば、橙色）で標識され、そしてＡが色２（例えば、青色）で標識される。ハプロタイプＡは、ＳＮＰ１についてＴ、ＳＮＰ２についてＴを有し、ハプロタイプＢは、ＳＮＰ１についてＴ、ＳＮＰ２についてＡを有し、ハプロタイプＣは、ＳＮＰ１についてＡ、ＳＮＰ２についてＡを有し、そして、ハプロタイプＤは、ＳＮＰ１についてＡ、ＳＮＰ２についてＴを有する。従って、ハプロタイプＡは青色であり、ハプロタイプＢは青色および橙色であり、ハプロタイプＣは橙色であり、そして、ハプロタイプＤは橙色および青色である。ハプロタイプＡおよびＤは、色の組み合わせによって識別不可能である。従って、固有の色の組み合わせは、４つの異なるハプロタイプについて作製されない。この様式において、単分子検出の非効率さは、分析を複雑にし、ＳＮＰのこの組み合わせについて、ハプロタイプ決定を不可能にさえする。ＳＮＰは、４つの塩基の別の組み合わせが塩基のプライマー伸長の際に取り込まれるように選択される必要がある。

（直接ＤＮＡ分析を用いるＳＮＰアッセイ検出のために使用されるさらなる化学）
ＳＮＰ検出のための１つの方法としては、直接ハイブリダイゼーションが挙げられる。ＤＮＡは、多色配列特異的標識化のための別の化学を用いて問い合わされ得る。オリゴヌクレオチドの場合、ＳＮＰの組み合わせが、アッセイされる４つのオリゴヌクレオチドに、独立したハプロタイプ情報を与えさせることを想定して、４つの別のオリゴヌクレオチドを用いて、目的の部位にハイブリダイズさせ得る。

別の発蛍光団で標識した競合するオリゴヌクレオチドをＤＮＡサンプルに導入し、オリゴヌクレオチドの競合を可能にするストリンジェントな条件下でハイブリダイズさせる。正しいマッチが、適切なハプロタイプを決定させる。この型の分析が、正しい配列特異的タギング化学と共に、ｓｓＤＮＡおよびｄｓＤＮＡで用いられ得る。このアプローチは、検出方法論のために識別可能なラベルを取り込む、任意の型のｓｓＤＮＡまたはｄｓＤＮＡ配列タギング化学で達成され得る。

１つの例において、ＳＮＰ１は、ＡまたはＴとハイブリダイズし得、ＳＮＰ２はＣまたはＧとハイブリダイズし得る。ＳＮＰ１がＡにハイブリダイズする場合に、ＳＮＰ１に特異的にハイブリダイズするオリゴヌクレオチドは、色１（例えば、青色）で標識される。ＳＮＰ１がＴにハイブリダイズする場合に、ＳＮＰ１に特異的にハイブリダイズするオリゴヌクレオチドは、色２（例えば、橙色）で標識される。ＳＮＰ２がＣにハイブリダイズする場合に、ＳＮＰ２に特異的にハイブリダイズするオリゴヌクレオチドは、色３（例えば、赤色）で標識される。ＳＮＰ２がＧにハイブリダイズする場合に、ＳＮＰ２に特異的にハイブリダイズするオリゴヌクレオチドは、色４（例えば、緑色）で標識される。ハプロタイプＡは、ＳＮＰ１についてＴ、ＳＮＰ２についてＣを有し、ハプロタイプＢはＳＮＰ１についてＡ、ＳＮＰ２についてＣを有し、ハプロタイプＣはＳＮＰ１についてＴ、ＳＮＰ２についてＧを有し、そして、ハプロタイプＤはＳＮＰ１についてＡ、ＳＮＰ２についてＧを有する。ハプロタイプＡは青色および橙色であり、ハプロタイプＢは青色および赤色であり、ハプロタイプＣは橙色および緑色であり、そして、ハプロタイプＤは青色および緑色である。この例において、４つのハプロタイプの各々が、固有の色の組み合わせにより決定される。

この方法は、２つのＳＮＰが同じヌクレオチドにハイブリダイズした場合でさえ、使用され得る。このオリゴヌクレオチドは、ユニットとして標識される。各オリゴヌクレオチドは、通常、１つのＳＮＰにハイブリダイズし得るのみであり、他のＳＮＰにはハイブリダイズし得ない。それゆえ、ＳＮＰ１がＡにハイブリダイズし、ＳＮＰ２がまたＡにハイブリダイズする場合でさえ、「Ａ」ＳＮＰ１に特異的にハイブリダイズするオリゴ１は、２つのＳＮＰを囲む配列が完全に同じであるというありそうにない状況下以外では、「Ａ」ＳＮＰ２とハイブリダイズしない。

（ＤＮＡの相補鎖をアッセイすることによる確認）
ＳＮＰハプロタイプの確認は、ＤＮＡの相補鎖のアッセイを介して行われ得る。この分析は、蛍光標識したｄＮＴＰの同じ混合物を用いる、ハプロタイプの確認を可能にする。

図５において、反応＃１は、プライマー伸長産物の二重色検出をアッセイし、ハプロタイプが連続した様式でＴおよびＣであることを決定する。反応＃２は、別のチューブで実施され、そしてまた、ｄＮＴＰの同じ蛍光標識された混合物を用いてアッセイされる。プライマー伸長反応は、逆方向のプライマー伸長産物を、目的の領域の相補鎖を認識するプライマーと共に用いて行われる。この様式において、ハプロタイプは、ＤＮＡの逆方向の鎖の分析を用いて確認される。ハプロタイプを確認する能力は、誤ったポジティブなハプロタイプと誤ったネガティブなハプロタイプの割合を低下させる。

（ｄＮＴＰ上の色のローテーションによる確認）
相補鎖分析による確認と同様に、ｄＮＴＰの色のローテーションは、混合物中に存在するハプロタイプのより確実な確認を可能にする。この方法は、４つの別のｄＮＴＰの組込みにおける任意のエラーおよび差異を克服することを可能にする。例えば、ＤＮＡの鎖上の連続した位置にＡおよびＧを有するハプロタイプは、１つの実験においては赤色および緑色であり得る。確認反応において、反応混合物中に導入されるＡおよびＧは、橙色および青色であり得る。第１の実験における赤色および緑色の存在と、第２の実験における橙色と青色の存在は、この系において確認されるハプロタイプを示す。

（３つのＳＮＰハプロタイプのアッセイ）
３つまたは４つのＳＮＰハプロタイプは、非常に多くのＳＮＰを分析することが必要であるので、実行することはより困難である。この実施形態において、単一分子分析の化学における効率の悪さは、より精巧なデータ分析を必要とする。３つのハプロタイプおよび３つの色を用いる分析に関して、単一分子の化学／検出における効率の悪さは分析を複雑にする。

１００％効率の検出および配列特異的化学の場合、８つの可能なハプロタイプの各々は、異なる発蛍光団で標識された４つの塩基を使用すると、特有の色特性（ｃｏｌｏｒｓｉｇｎａｔｕｒｅ）を有する。しかし、検出化学および検出は効率の悪い化学、光退色、または不活性な発蛍光団に起因して不十分であるので、これらの色の組み合わせは、表１および図６に示されるように混同され得る。図６において、Ｃは色１（長い破線で示される）であり、Ｇは色２（短い破線で示される）であり、Ｔは色３（長い破線、続いて短い破線で示される）であり、そしてＡは色４（実線で示される）である。

効率的な検出および配列特異的化学によって、図６における８つの可能なハプロタイプの各々は、異なる発蛍光団で標識された４つの塩基を使用すると特有の色特性を有する。しかし、検出化学および検出は効率の悪い化学、光退色、および不活性な発蛍光団に起因して不十分であるので、これらの色の組み合わせは、混同され得る。ハプロタイプ３（Ａを検出することができない）は、ハプロタイプ６について混同され得る。ハプロタイプ３は、Ｔを検出することが不可能な場合、ハプロタイプ８と混同される。ハプロタイプ１は、ハプロタイプ５と重複する。これらは区別することができない。他の標識化ストラテジーは、ハプロタイプの全てを区別するために必要とされる。ハプロタイプ１，３、６および８が反応混合液に存在し、検出／化学の効率が９０％であった場合、ハプロタイピングデータ（ｈａｐｌｏｔｙｐｉｎｇｄａｔａ）のスナップショットを表１に示す。

（表１．反応混合液中のハプロタイプの存在の相対値）

色スキームのこの実施形態において、この標識化ストラテジーは、効率的ではない。なぜなら、ハプロタイプを適合するための特有の色スキームが存在しないからである。異なる色スキームからのバックグラウンドシグナルは、適合するアウトプットシグナルを混同しない。ハプロタイプ２を示すバックグラウンドシグナルは８であり、反応セットにおいて正確に示されるハプロタイプとは明らかに区別される。しかし、ハプロタイプが示されることが知られていない場合、ハプロタイプ１をハプロタイプ５とは区別することができず、そしてハプロタイプ３をハプロタイプ７と区別することもできない。

これは、誤差が検出およびＳＮＰ位に依存して変化した標識化化学に関連した状況では克服され得る。ハプロタイプ１および５の存在は、ハプロタイプ２および４となって現れる誤差を生じる。ハプロタイプ１は、ＳＮＰ位２の標識を喪失する場合、ハプロタイプ２となって現れる。ハプロタイプ５は、ＳＮＰ１位の標識を喪失する場合、ハプロタイプ２となって現れる。この標識の喪失がこれらの位置とは異なる場合、ハプロタイプ２となって現れるシグナルの差は、ハプロタイプ１と５との間を区別するために使用され得る。

より効率的な標識化スキームは、３つのＳＮＰハプロタイプの評価において使用され得る。１つの可能性のある標識化スキームは、異なる発蛍光団で標識されたＡ、Ｔ、Ｇであり、ＳＮＰの二重対立遺伝子的な性質は、特有の色スキームを有する８つの異なる可能性のあるハプロタイプの適合を可能にする。この標的スキームの使用は、図６と同じ色スキームを用いて図７に示されるように、異なるハプロタイプ間により多くの「クロストーク」を形成する。

表２は、特定の反応混合物におけるハプロタイプ１、３、６および８との反応混合物を試験する。検出／化学の効率は、９０％である。

（表２反応混合物におけるハプロタイプの存在の相対値）

バックグラウンドクロストークは、括弧中に示される。ハプロタイプ７は、最も高いバックグラウンドレベルを有する。この値にもかかわらず、シグナル対ノイズは、測定されるべきサンプルに存在するハプロタイプにとってなお十分に高い。このタグ化スキームを使用して、ハプロタイプ分析は、３つまたは４つのＳＮＰに広げ得る。制限は、異なるＳＮＰの各々について可能な色の数から生じる。各ＳＮＰに対して１つの異なる色が必要とされる。

５つのＳＮＰハプロタイプはまた、タグ化アプローチの慎重な使用によって決定され得る。図８に示される標識化スキームにおいて、最初の４つのＳＮＰ、Ａ、Ｃ、Ｔ、Ｇは、それぞれ異なる色、色１（例えば、青色の実線）、色２（例えば、赤色の長い破線）、色３（例えば、オレンジ色の長い破線に続く短い破線）、および色４（例えば、緑色の短い破線）。５番目のＧは、混合タグ化アプローチの使用によって区別され、ｄＧＴＰは、色４（例えば、緑色）で標識されたｄＧＴＰおよび色５（例えば、紫色）で標識されたｄＧＴＰの５０／５０割合で示される。この様式において、ハプロタイプは、ＤＮＡの１つのフラグメント上に同時に存在する５つの色検出によって検出される。２つのＳＮＰが同じヌクレオチドに特異的にハイブリダイズする場合、１：２：１の割合で両方とも色１、色１および色２、および両方とも色２が現れる。同様に、このアプローチは、５つより多いＳＮＰおよび各々のハプロタイプに適用され得る。

（マルチカラー単一分子分析のための特別条件）
例えば、プライマー伸張、特に４色アッセイについて、発蛍光団の選択および光の系は、単一分子産物の成功した結果のために特に重要である。４つの発蛍光団の発光スペクトルは、単一分子レベルで個々の発蛍光団を十分に区別し得るために相当十分に分離されることが必要である。本発明は、このマルチカラー分析を可能にする波長および発蛍光団の選択を開示する。

（表３）

他の当該分野で公知の発蛍光団もまた、使用され得る。

（単一分子検出ハプロタイプ分析の装置についての特別条件）
本発明は、スライド／カバースリップ、キャピラリー、またはマイクロチップを備えるサンプルを保持する装置を使用して実施され得る。１実施形態は、米国特許第６，４０３，３１１号および同第６，３５５，４２０号に記載されるようなフロースルーナノチップの使用による。

ＰＣＲは、分析されるゲノムの十分なコピーが反応混合物中に存在するか否かを分析するために必要とされない。この反応は、ゲノムＤＮＡ上で直接生じ得る。

（２つより多い集団の分析）
集団をプールする技術および単一分子遺伝学を用いたその後の分析は、さらに２つより多い集団の遺伝学の相関に適用され得る。２つより多い集団の方法論は、異なる大きなファウンダ（ｆｏｕｎｄｅｒ）集団が、単一反応物を用いて質量を比較され得る、複雑な民族分析を可能にする。ゲノム長に沿った異なる部位を、この技術を用いて比較し、個々の集団についての異なる反応物の必要性を非常に単純にし得る。

本発明の１実施形態において、ＤＮＡ集団をプールした後、このＤＮＡは増幅される。挿入／欠損分析は、ＤＮＡ上で実施され得る。この後に、ハプロタイプ分析が行われる。

本発明の別の実施形態において、このＤＮＡはプール後には増幅されない。直接線形分析は、ＤＮＡ上で実施され、ＳＮＰ分析が実施される。次いで、他の遺伝学バリエーション様マイクロサテライト、ＳＮＰ、変異などが見出され得る。

（オーダー標識ストラテジー（ｏｒｄｅｒｅｄｌａｂｅｌｓｔｒａｔｅｇｙ）を用いるポリマー分析法）
上記の本発明の標識化ＤＮＡフラグメントは、米国特許第６，４０３，３１１号に開示される方法を用いて分析され得る。この特許は、以下に示されるポリマーを分析する方法を詳説する。

本明細書で使用される場合、「標識されたユニット特異的マーカー」とは、特定のユニットを同定するポリマーに特異的な任意のユニットマーカーである。標識されたユニット特異的マーカーとしては、例えば、特定のユニット、タンパク質、ペプチド、核酸、多糖、短いオリゴマー、ｔＲＮＡなどに結合される蛍光マーカーが挙げられ、これらは、特定のユニットを認識し、結合し、そして例えば、元来標識された特性を有するか、または外因性標識を含めることによって、あるいは抗体のような別の検出分子に結合することによって検出され得る。

ポリマー依存性インパルスから得られたデータは、コンピューターのメモリーシステムである、データベースまたはデータファイルに保存され得る。各ポリマーからのデータは、メモリーシステムに保存され得、その結果、例えば、各ポリマーに対して特有の識別子を割り当てることによって、他のポリマーについてのデータプロセッサによって独立してアクセスされ得る。

このデータから得られた情報およびどのように分析されたかについての情報は、シグナルを生成する因子と相互作用を引き起こした標識されたユニット特異的マーカーの数および型に依存する。例えば、特異的な型の標識を有する単一ポリマー各々のユニット特異的マーカー（ユニット特異的マーカーの各型（例えば、核酸Ａの全て））は標識され、次いで、ポリマー内の各ユニット特異的マーカーの順序を、単一ポリマーの分析から決定し得る。しかし、核酸の４ユニットのうち１つだけが標識される場合、より多くのデータが核酸の完全配列を決定するために必要である。さらに、データ分析方法は、ポリマーが一本鎖または二本鎖または他の複合体であるか否かに依存して変動する。いくつかの標識スキームおよびこれらのスキームによって生成されたコンピューターシステムデータを用いる分析方法が、以下にさらに詳細に記載される。この標識ストラテジーは、議論を簡略化するために核酸に関して記載される。しかし、これらのストラテジーの各々は、全てのポリマーを標識するのに有用である。

標識のいくつかの異なるストラテジーが可能であり、これらとしては、標識されたユニットの異なる型、標識されたユニットの異なる割合、および一本鎖標識または二本鎖標識の順列が挙げられる。以下の記載は、本発明に従う有用な標識ストラテジーの例である。しかし、本発明は、以下の例示的な記載に限定されない。本明細書に記載される標識方法およびこのような方法により得られたデータは、議論を簡単にするためにＤＮＡを参照して記載される。しかし、本発明は、ＤＮＡを分析する方法に限定されるのではなく、個々のモノマーユニットから構成される任意のポリマーの型が利用され得る。以下の説明がＤＮＡまたは核酸を参照する場合、任意の多くのポリマーが置換され得、そしてこの説明がヌクレオチド、塩基（すなわち、具体的には、Ａ、Ｃ、Ｔ、もしくはＧ）を参照する場合、これらの用語は、所望されるポリマーの特定のモノマーユニットで置換され得ることが、当業者に明らかである。例えば、このポリマーは、ペプチドであり得、そしてこの場合、モノマーユニットは、アミノ酸である。最も単純な標識スキームは、異なる標識での全４種類のヌクレオチドを標識することに関する。３つ、２つ、または１つのユニットが標識される標識スキーム、あるいはユニットの多様な組み合わせが、多重ヌクレオチドにわたってユニット特異的マーカーを用いて標識される標識スキームもまた、可能である。

ヌクレオチド間の距離は、いくつかの方法によって決定され得る。まず、ポリマーおよびステーションは、線形様式および一定速度で互いに関連して移動し得、その結果、核酸分子の単一ユニット特異的マーカーが単一の時間間隔でこのステーションを通過する。２つの時間間隔が検出可能なシグナル間で消失する場合、検出可能シグナルを生成することができない標識されていないヌクレオチドがこの位置に存在する。ユニット特異的マーカー間の距離を決定する方法は、無作為な１塩基標識を参照して以下で詳細に議論される。あるいは、ポリマーおよびステーションは、互いに相互作用を引き起こし得、その結果、各ユニット特異的マーカーは、検出可能シグナルを同時に生じるようにステーションで同時に相互作用する。生じた検出可能シグナルの各々は、ユニット特異的マーカーが位置付けられるポリマーに沿った位置で生じる。検出可能シグナル間の距離は、標識されていないユニット特異的マーカーが核酸分子に沿ったどこかに位置付けられるか否かを決定するために直接計算され得る。

別の標識スキームにおいて、無作為な１ヌクレオチド標識スキームもまた使用され得る。この方法において、集団の分析および／またはＤＮＡ瞬間移動速度のいずれかによって得られた距離情報を使用して、２つの標識されたヌクレオチドを分離するヌクレオチドの数を決定する。４つの別個に標識された標的分子の分析により、完全な配列を得る。

塩基間の距離を決定する２つの方法がある。１つは、ＤＮＡ移動の瞬間速度を決定することを必要とし、これは、特定標識に対するエネルギー移動またはクエンチングの持続時間から容易に算出される。もう１つは、標的ＤＮＡ分子の集団およびその対応するガウス距離分布を分析することを含む。

瞬間速度法は、シグナル間の分離の時間（ｔ）により乗じられる、ＤＮＡ移動の既知の瞬間速度（ｖ）に基づく距離分離の決定を含む。瞬間速度は、相互作用ステーションによって、標識されたヌクレオチドが通過するために要する時間を測定することにより見出される。因子の濃縮された領域の長さ（ｄ）は既知であるので（因子の局在化領域、例えば、濃縮されたドナーの蛍光体領域の厚みの較正および物理的測定による）、この速度は、単にｖ＝ｄ／ｔである。プロットされるとき、連続的な検出可能シグナルから得られるエネルギー放射パターンにおける変化を示す生データの分析は、曲線を生成し、この曲線は、左から右へと２つのエネルギー強度の減少が続く、２つのエネルギー強度の増加を示す。第１のエネルギー強度減少からの水平域（ｔ．_１で示される）は、第２の水平域のそれ（ｔ．_２）の２倍である。相互作用ステーションの長さは、５１Åとして与えられる。この与えられた情報から、標識されたヌレレオチドの数が知られる。さらに、この２つの分離の距離は、ＤＮＡ移動の速度をドナー強度水平域の時間に関連付けることにより決定される。

標識されたヌクレオチドの数は、簡単に強度減少の数により示される。２つの強度減少がある場合、ＤＮＡ上に２つの検出可能な標識があるはずである。塩基分離の距離を決定するために、ＤＮＡ移動の瞬間速度を知ることが必要であり、これは、１つの標識されたヌクレオチドが、因子の局在化領域および因子の局在化された領域の長さを横切る時間を知ることにより見出される。因子の局在化された領域の長さは、５１Åとして与えられる。１つの標識されたヌクレオチドが、因子の局在化領域を横切る時間は、第１の強度減少および第１の強度増加によって境界される（灰色の影の領域、７．５ｓとして示される）。ＤＮＡ移動の速度は、６．８Å／ｓである。塩基分離は、速度（６．８Å）によって乗じられる、１０塩基対に等しい標識ヌクレオチドを分離する時間（ｔ．ｓｕｂ．１＝５ｓ）から派生する。交差検証の方法として、５１Å_−ｔ２ｖはまた、塩基分離を生じる。

集団法では、標識されたヌクレオチドの全集団が考慮される。速度法については必要であるような、因子の局在化領域の長さおよび瞬間速度の知識は、必ずしも必要ではない。集団分析の使用は、個々の核酸分子に対する正確な測定の必要性をなくする。

各々がナノチャネルを横断する５つの核酸分子を用いる集団分析の例を以下に説明する。同一のＤＮＡフラグメントの集団を代表する５つの分子を調製する。一定の電場では、第１の標識ヌクレオチドと第２の標識ヌクレオチドとの間の検出時間は、すべてのＤＮＡ分子について同一であるべきである。実験条件下では、これらの時間はわずかに異なり、時間のガウス分布に至る。このガウス分布のピークは、２つの標識ヌクレオチド間の分離の距離（ｄ）の特徴である。

１ヌクレオチドのランダムに標識された核酸分子の集団を利用するさらなる例（６つの分子が集団を代表する）は、集団分析の概念および距離情報の決定をさらに説明する。核酸は末端標識され、参照点を提供する。十分な核酸分子で、任意の２つのＡ間の距離が決定され得る。２つの分子は、サブ集団として考慮されるとき、塩基分離分子を伝達し、４および６塩基分離の分布が生成される。同じ論理を集団の残りに拡張して、ＤＮＡ上のすべてのＡの位置が決定され得る。全配列は、その他の３つの塩基（Ｃ、Ｇ、およびＴ）についてこのプロセスを繰り返すことにより生成される。

上記に記載の例におけるユニット特異的マーカーの１つのタイプのすべてを標識することに加え、標識されるべきヌクレオチドのすべてのヌクレオチドまたはマーカーが標識されるわけではない種々の標識スキームを用いることが可能である。ランダムに標識されたフラグメントの大集団では、標的ＤＮＡ上の連続するＡ間の距離が見出され得る。末端標識は、ＤＮＡの端部と最初のＡとの間の距離を同定するために供される。その他のヌクレオチドについて同じ分析を繰り返すことは、その核酸分子の集団内のＡのすべての位置を識別するデータをコンパイルすることにより１６マーの配列を生成する。これらのステップは、次いで、核酸の集団中のその他のヌクレオチドにユニット特異的なマーカーを用いて繰り返され得る。このような方法を用いることの利点は、立体影響の欠如および標識の容易さを含む。このタイプの標識は、ランダム標識化と称される。「ランダム標識」されているポリマーは、すべてより少ない特定タイプのユニット特異的マーカーが標識されているポリマーである。ランダム標識されたポリマーの特定タイプのどのユニット特異的マーカーが標識されるかは未知である。

類似のタイプの分析は、４つのヌクレオチドの各々を、集団内で不完全に、しかし同時に標識することにより実施され得る。例えば、４つのヌクレオチドの各々は、色、サイズなどの異なる物理的特徴を生じるそれ自身のユニット特異的マーカーで部分的に標識され得る。これは、単一の集団分析からすべてのヌクレオチドについての情報を含むデータセットを生成するために達成され得る。例えば、この方法は、２つのヌクレオチド対を一度に部分的に標識することにより達成され得る。２つのヌクレオチドを標識することは、核酸鎖の２つのヌクレオチドを認識し、そして単一の蛍光分子のような標識を含むユニット特異的マーカーを用いることによって立体妨害効果を低下することを通じて可能である。Ｇｏｏｄｗｉｎら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、２１（４）：８０３〜８０６、１９９３およびＨａｒｄｉｎｇおよびＫｅｌｌｅｒ、ＴｒｅｎｄｓＢｉｏｔｅｃｈｎｏｌ、１０（１−２）：５５〜５７、１９９２は、完全に標識された２つのヌクレオチドをもつ大きな蛍光核酸分子は達成することは可能であることを示した。研究された分子の平均サイズは、７ＫＢであった。３つのヌクレオチドの部分的標識化もまた可能である。例えば、３つのヌクレオチドの各々は、異なるユニット特異的マーカーで部分的に標識される。この場合、３つの特異的ヌクレオチド対の組み合わせで部分的に標識されている一本鎖核酸分子の集団が生成され、そして分析され得る。

本発明の方法はまた、二本鎖核酸を用いて達成され得る。二本鎖核酸では、鎖の２つ上で単一のヌクレオチドが標識されるとき、２つのヌクレオチドについての情報が、鎖の各々について利用可能になる。例えば、Ａのランダムおよび部分的標識化において、ＡおよびＴについての知識が利用可能になる。２つの異なって標識される核酸サンプルが調製される標識化戦略が用いられ得る。最初のサンプルは、同じ蛍光体でランダムに標識された２つの非相補的ヌクレオチドを有し得る。非相補的対のヌクレオチドは、ＡＣ、ＡＧ、ＴＣ、およびＴＧである。第２のサンプルは、ランダムに標識されたそのヌクレオチドの１つを有し得る。第２のサンプルについて選択されたヌクレオチドは、４つのヌクレオチドの任意の１つであり得る。提供された例では、この２つの非相補的ヌクレオチドは、ＡおよびＣであるように選択され、そして単一のヌクレオチドは、Ａであるように選択される。２つのサンプルが調製され、１つはＡおよびＣで標識され、そしてもう１つは、Ａで標識される。核酸は、ゲノムから消化され、末端標識され、精製され、そして分析される。このような手順は、当業者に周知である。各フラグメントからの情報は、２つの相補鎖の群の１つにソートされる。情報をソートすることは、集団分析が、すべての所望のヌクレオチドの位置を決定することを可能にする。データの第１の群は、１つの鎖上のすべてのＡおよびＣの既知の位置を提供する。データの第２の群は、すべてのＡの既知の位置を提供する。これら２つのデータセットの組み合わせは、１つの鎖上のすべてのＡおよびＣの位置を示す。同じ手順が、相補鎖に適用され、その鎖上のＡおよびＣの位置を決定し得る。得られるデータは、この鎖がＡおよびＣの相補的ヌクレオチド対（Ａ：ＴおよびＣ：Ｇ）を含むという仮定を基に、核酸の両鎖の全配列を示す。配列を交差確認するために、このプロセスは、ＴＧ、ＴＣおよびＡＧのような非相補的ヌクレオチドのその他の対について繰り返され得る。

一本鎖の２つのヌクレオチドを標識するスキームはまた、ＤＮＡの１つの鎖上の２つのヌクレオチドが完全に標識ヌクレオチドで置換されているとき、二本鎖ＤＮＡ上で実施され得る。２ヌクレオチド標識化の背後にある理論を保持しながら、２つの外因的に標識されるヌクレオチドにより課せられる立体的拘束を低減するために、相補鎖の各々上の１つのヌクレオチドを完全に標識し、同じ末端を達成することが可能である。この方法は、各鎖が異なる標識で標識される二本鎖ＤＮＡを用いることを含む。６つの異なって標識された二本鎖ＤＮＡのセットは、配列情報を提供するために適切であるデータセットを生成する。ＤＮＡの各相補鎖は、標識されたヌクレオチドの１つを有するべきである。この二重鎖ＤＮＡセットの各々では、２つの異なるヌクレオチドの等価物（可能な組み合わせは、ＡＣ、ＡＧ、ＡＴ、ＣＧ、ＣＴ、ＧＴ）が標識される。両方の相補鎖が標識されたアデニンを有するとき、これは組み合わせＡＴに等価である。二重鎖の２ヌクレオチド標識化において、利点は、各鎖上の１つのヌクレオチドのみが標識され、一本鎖ＤＮＡ上の２ヌクレオチド標識化に比較してより長い標識鎖が合成されることを可能にすることである。実際、１つの完全に標識されたヌクレオチドをもつＤＮＡフラグメントの合成は、１０ｋｂよりかなり長い長さで達成され得ることが示されている（Ｇｏｏｄｗｉｎら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、２１（４）：８０３〜８０６、１９９３、ならびにＨａｒｄｉｎｇおよびＫｅｌｌｅｒ、ＴｒｅｎｄｓＢｉｏｔｅｃｈｎｏｌ、１０（１−２）：５５〜５７、１９９２）。

１つより多くの物理的特徴を、標識に含めることにより、同じ一時的フレーム内の核酸の同時および重複読み取りは、単一の物理的特徴のみが含められるときより、標識ヌクレオチドの位置についてのより正確かつ迅速な情報を提供し得る。例えば、ヌクレオチドの各々は、二重または三重の蛍光体を含み得、各蛍光体の各々は、別個に検出され、同じサンプルから別個の読み取りを提供し得る。

単一のヌクレオチド標識化法の種々の組み合わせに加え、２つ以上の隣接するヌクレオチドは特異的に標識され得る。上記に記載のように、ユニット特異的マーカーは、個々のヌクレオチドに特異的であるマーカー、および複数ヌクレオチドに特異的であるマーカーを含む。複数ヌクレオチドは、隣接し得るか、そうでなくてもよい２つ以上のヌクレオチドを含む。例えば、ユニット特異的マーカーが、タンパク質の複合体である場合、このタンパク質の複合体は、互いに隣接しているか、またはランダムヌクレオチドによって分離されている特異的ヌクレオチドと相互作用し得る。このタイプの分析は特に有用である。なぜなら、シグナルの検出は、単一のヌクレオチド分析でより少ない解像度を必要とするに過ぎないからである。分析が複雑になるほど、システムの解像度はより大きくなる。本明細書で用いられるとき、解像度は、用いられる適切なシグナル検出方法によって分離され得るヌクレオチドの数をいう。

好ましくは、シグナル検出方法は、ナノチャネル分析、近距離場走査顕微鏡、原子間力顕微鏡、走査型電子顕微鏡、導波構造などのような方法を含む。

ユニット特異的マーカーがより多くのヌクレオチドの数に亘りかつ認識すると、ユニット特異的マーカーは、検出の低解像度手段により従うようになる。任意の所定数のヌクレオチドに亘るマーカーについて、用いられ得る異なるユニット特異的マーカーの数は、式４’’によって規定され、ここで、ｎは、このユニット特異的マーカーによって検出されるヌクレオチドの数である。２つのヌクレオチドに亘るユニット特異的マーカーは、ヌクレオチド対の１６の組み合わせの１つに特異的であり得る。これらは、ＡＣ、ＡＧ、ＡＴ、ＡＡ、ＣＣ、ＣＡ、ＣＧ、ＣＴ、ＧＡ、ＧＧ、ＧＣ、ＧＴ、ＴＡ、ＴＣ、ＴＧ、およびＴＴを含む。３つのヌクレオチドに亘るユニット特異的マーカーは、６４の３ヌクレオチド対の組み合わせの組み合わせの１つに特異的であり得る。３より多いヌクレオチド対の組み合わせもまた用いられ得、そしてこの数は、上記の式に従って増加し得る。これらのタイプのユニット特異的マーカーを用い、ヌクレオチド配列情報は、異なる手段の数により再構築され得る。このユニット特異的マーカーの再構築から生成される情報は、配列情報の生成に制限されず、さらに、明瞭にフラグメントを識別するために用いられ得、配列内に見出されるヌクレオチドのその組み合わせの特異的数などを提供する。

核酸分子に結合したトリプレットユニット特異的マーカーの種々の組み合わせは、これらの方法を用いて解読かつ分析され得る。核酸上のこのトリプレットユニット特異的マーカー正確な位置を知ることなく、結合核酸フラグメントに与えられ特異性は、Ｎ／４^ｎとして与えられ、ここで、Ｎは、標的核酸のフラグメント中のヌクレオチドの数であり、そしてｎは、この核酸分子上の結合された部位の数である。核酸の鎖が長くなるほど、特定システムの特異性は低くなる。結合されたユニット特異的マーカーの特異性は、トリプレットユニット特異的マーカーの正確な位置を決定することにより増加され得る。この場合、この特異性は、１／４^ｎまで増加し、これは、Ｎマーが核酸の標的鎖に結合した場合と同じである。

トリプレットユニット特異的マーカーのセットから核酸分子の配列を決定するための最も簡単な方法は、一度に２トリプレット１ユニット特異的マーカーを、６４ユニットの特異的マーカーが調査されるまで、調査することである。トリプレットユニット特異的マーカーの１つが、分析の間に一定に保たれる場合、この分析は最も単純である。１つの例では、核酸の短いストレッチが、２つのトリプレットユニット特異的マーカーを用いて分析される。このトリプレットユニット特異的マーカーは、ＣＧＸおよびＧＸＸである。これらのマーカーを用い、最初のＡＣＧトリプレットの後の２つの基礎となる位置が決定され得る。６３の異なるトリプレットを初期フラグメントＡＣＧとともに用い、隣接ヌクレオチドおよびＡＣＧ間に介在するヌクレオチドの連続配列についての情報が決定され得る。

配列分析のこれらの方法を用い、他のタイプのハイブリダイゼーションなどの分析で生じる問題が避けられる。例えば、ヒトゲノム中のＡｌｕ反復のような反復配列は、ハイブリダイゼーション配列決定方法を用いる分析の問題を生じる。このような問題は、本明細書に記載の方法を用いて避けられる。本明細書に記載される方法を用い、反復の数は、各々の状態で結合された異なるトリプレットによって簡単にカウントされ得る。ハイブリダイゼーション配列決定分析は、２つのプローブ配列間に見出されるプローブの直線上の順序または数の決定を可能にしない。結合されたプローブの直線上の順序および正確な数の定量は、ハイブリダイゼーションによる配列決定において直面する困難性を迂回するさらなる順序の情報を可能にする。本発明の方法は、従って、迅速および簡単である。

トリプレットを用いる方法などは、ユニット特異的マーカーは、連続的に実施される必要はない。例えば、いくつかのトリプレットは同時にアッセイされ得、なおより迅速な分析の方法を提供する。同時分析における唯一の制限は、用いられるトリプレットユニット特異的マーカーのいずれもが、互いに重複すべきではないことである。従って、１つの特定のトリプレット配列の選択は、その配列と重複し得るトリプレット配列の同時使用を除外する。例えば、トリプレット配列ＡＣＧが分析のために選択される場合、６４セットのトリプレットのうちの４が、このトリプレットを用いる同時分析の間で用いられないかも知れない。これらは、ＸＸＡ、ＸＡＣ、ＧＸＸ、およびＣＧＸを含む。数学的には、トリプレット標識がそれとの同時プロービングを除外し得るフラグメントの最大数は、以下の等式によって決定される：
２［σ４^２＋４^１］または一般に２［σ４^ｎ−１＋４^ｎ−２４^１］
ここで、ｎは、標識によってまたがられるヌクレオチドの数である。合計は、当初に選択されたＡＣＧトリプレットでの同時アッセイから最大で４０フラグメントが除外される。従って、合計で２４の異なるフラグメントが一度にアッセイされ得る。

二本鎖核酸分析はまた、方向特異的標識を用いて達成され得る。方向特異的標識は、いずれかの鎖上のＡＣＧトリプレットのようなヌクレオチドの組み合わせ間の区別を可能にする。方向特異的標識の場合には、中心結合標識の逆転は、それが、対向する鎖上に結合した標識であることを示す。これらの標識は、５’から３’または３’から５’への方向性を有している。

本発明の方法の１つの使用は、ポリマー内のニユットの配列を決定することである。核酸のようなポリマーのユニットの配列を識別することは、このポリマーの機能を理解すること、および細胞または組織のような生理学的環境におけるこのポリマーの役割を決定することで重要なステップである。現在用いられている配列決定方法は、遅くかつ面倒である。本発明の方法は、かなりより迅速で、かつ非常に短時間で有意により多くの配列データを生成する。

本明細書に記載される分析方法は、線形的または非線形的である。部分的に標識されたポリマーから得られたデータに基づく配列情報を生成するための方法は、ポリマー依存性インパルスを生成する任意の方法によって得られたデータに適用され得る。このタイプのデータからのポリマーの配列の再構築は、本発明の統合局面である。ポリマー依存性インパルスを検出する方法によって得られたデータである限り、それが線形的様式で得られた否かにかかわらず、このデータは、本発明の方法に従って分析され得る。

シグナルは、逐次的または同時に検出され得る。本明細書で用いられるとき、単一のポリマーの異なるユニット特異的マーカーからのシグナルが、時間を置いて検出されるとき、「逐次的に」検出される。必ずしもユニット特異的マーカーのすべてが「逐次的に」検出される必要はなく、または「逐次的に」シグナルを検出するためのシグナルを生成する必要はない。ユニット特異的マーカーが、ステーションに逐次的に曝されるとき、このユニット特異的マーカーおよびステーションは、互いに対して移動する。本明細書で用いられるとき、語句「ユニット特異的マーカーおよびステーションは、互いに対して移動する」は、ユニット特異的マーカーおよびステーションのいずれかが、両者とも移動するか、または２つのうちの１つのみが移動し、そして他方が、少なくとも、ユニット特異的マーカーとステーションとの間の相互作用の時間の間に静止したままであることを意味する。このユニット特異的マーカーおよびステーションは、任意の機構によって互いに対して移動され得る。例えば、このステーションは、静止したままであり得、そしてポリマーは、電流によってこのステーションを超えて引かれ得る。ポリマーを移動するためのその他の方法は、制限されずに、磁場、機械的な力、流れる液体媒体、圧力システム、重力、およびポリマーがＤＮＡであるとき、例えば、ＤＮＡポリメラーゼまたはヘリカーゼのような分子モーター、またはポリマーがアクチンのようなペプチドであるとき、例えば、ミオシンを含む。１つの例では、ポリマーは、水動力学的に移動され、例えば、サンプルは、流体流れストリームに同調することにより検出器を超えて流れる溶液中に存在する。この流体は、圧力または減圧のいずれかを用いることにより駆動される。

このポリマーの動きは、ポリマーを案内するためのチャネル、溝またはリングの使用により支援され得る。あるいは、ステーションは、移動され得、そしてポリマーは、静止を維持され得る。例えば、ステーションは、ポリマーの長さに沿って案内される走査チップ内に保持され得る。

別の実施形態では、シグナルは、同時に検出される。本明細書で用いられるとき、シグナルは、ポリマーの複数の標識されたユニット特異的マーカーがステーションに一度に曝されるようにすることにより「同時に検出」される。複数のユニット特異的マーカーは、複数の相互作用部位を用いることにより一度にステーションに曝され得る。シグナルは、これらの部位の各々で同時に検出され得る。例えば、複数のステーションは、ポリマーのユニット特異的マーカーに対応するスペース内の特異的位置に局在化され得る。ポリマーが複数ステーションの相互作用する近傍内にもたらされるとき、シグナルは同時に生成される。これは、例えば、ユニット特異的マーカー間の距離に等しい実質的に等価な距離で配置されたステーションの直線状アレイで具現化され得る。ポリマーは、ステーションに対し、各ユニット特異的マーカーがステーションに対し相互作用する近傍内にあり同時にシグナルを生じるように位置決めされ得る。

複数のポリマーは、１つより多くのポリマーを個々のステーションに対して一度に移動させることにより同時に分析され得る。これらポリマーは、類似であるか、または別個であり得る。ポリマーが類似である場合、同じであるか、または異なるユニット特異的マーカーが同時に検出され得る。

本発明に従う、ポリマーがステーションを超えて移動するための好ましい方法は、電場を利用する。電場は、チャネルを通じてポリマーを引っ張るために用いられ得る。なぜなら、ポリマーは、いくつかの研究で先に示されているように、付与された場の方向に伸張かつ整列されるようになる（Ｂｕｓｔａｍａｎｔｅ、Ａｎｎｕ．Ｒｅｖ．Ｂｉｏｐｈｙｓ．Ｃｈｅｍ．、２０：４１５〜４６、１９９１；Ｇｕｒｒｉｅｒｉら、Ｂｉｏｃｈｅｍｉｓｒｙ、２９（１３）：３３９６〜３４０１、１９９０；およびＭａｔｓｕｍｏｔｏら、Ｊ．ＭｏｌＢｉｏｌ．、１５２：５０１〜５１６、１９８１）。

ポリマーをステーションを超えて移動する別の方法は、分子モーターの使用を含む。分子モーターは、ポリマーと物理的に相互作用し、そしてステーションを超えてポリマーを引っ張るデバイスである。分子モーターは、ＤＮＡおよびＲＮＡポリメラーゼおよびヘリカーゼを含むがこれらに制限されるわけではない。ＤＮＡポリメラーゼは、効率的な分子モーターとして機能することが示されている。好ましくは、ＤＮＡ上にクランプするポリメラーゼの領域の内径は、二本鎖ＤＮＡのそれに類似している。さらに、大量のＤＮＡは、直線状様式でこのクランプを通じてたどり得る。分子モーターは、その全体の内容が本明細書によって参考として援用される米国特許第６，２１０，８９６号により詳細に記載されている。

ＤＮＡポリメラーゼＩＩＩホロ酵素のβ−サブユニットの全体の構造は、直径が８０Åであり、内径は約３５Åである。比較して、完全ターンの二重Ｂ形態ＤＮＡは、約３４Åである。βサブユニットは、滑動クランプ機構と称される機構でＤＮＡの周りに適合し、ＤＮＡ複製の間にホロ酵素の前進的運動を仲介する。βサブユニットは、複製の間にＤＮＡを取り囲み、ホロ酵素に前進性を与えることが十分理解されている（Ｂｌｏｏｍら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２７１：３０６９９〜７０８、１９９６；Ｆｕら、ＥＭＢＯＪ．、１５：４４１４〜２２、１９９６；Ｇｒｉｅｐ、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、２３２．、：１８０〜９、１９９５；ＨｅｒｅｎｄｅｅｎおよびＫｅｌｌｙ、Ｃｅｌｌ、８４：５〜８、１９９６；Ｎａｋｔｉｎｉｓら、Ｃｅｌｌ、８４（１）：１３７〜１４５、１９９６；Ｐａｚ−Ｅｌｉｚｕｒら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２７１：２４８２〜９０、１９９６およびＳｋａｌｉｔｅｒら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ、２７１：２４９１〜６、１９９６）。滑動クランプは、ポリメラーゼの前進性の機構であるので、それは、必然的に、大量のＤＮＡが、クランプを通じて直線状様式でたどることを意味する。数キロベースが、一度にクランプを通って進む（ＫｏｒｎｂｅｒｇおよびＢａｋｅｒ、ＤＮＡＲｅｐｌｉｃａｔｉｏｎ、Ｗ．Ｈ．Ｆｒｅｅｍａｎ、ＮｅｗＹｏｒｋ、１９９１）。

検出可能なシグナル（ポリマー依存性インパルス）は、検出ステーションで生成され、そこでは、検出されるべきポリマーの部分（例えば、ユニット特異的マーカー）が、シグナルまたはポリマー依存性インパルスを生成するために剥き出される。ユニット特異的マーカーとステーションとの間の相互作用が、ポリマー依存性インパルスを生成するとき、このステーションは、「シグナル生成ステーション」である。１つのタイプのシグナル生成ステーションは、相互作用ステーションである。本明細書で用いられるとき、「相互作用ステーションまたは部位」は、ポリマーのユニット特異的マーカーが因子と相互作用する領域であり、そして、この因子に対して十分近傍に位置決めされ、それによってそれらは相互作用し得る。蛍光体の相互作用ステーションは、例えば、それらがエネルギー的に相互作用してシグナルを生成するように十分近接している領域である。

１つの実施形態における相互作用ステーションは、チャネルを形成する壁に付着されたアクセプター蛍光体のような局在化因子が、このチャネルを通過するポリマーと相互作用し得るナノチャネルの領域である。ポリマーが因子の局在化領域を通過する点は、相互作用ステーションである。ポリマーの各標識されたユニット特異的マーカーは因子によって通過するので、検出可能なシグナルが生成される。この因子は、種々の方法でチャネルの領域内に局在化され得る。例えば、この因子は、チャネルの壁を形成する材料中に包埋され得るか、またはこの因子は、壁材料の表面に付着され得る。あるいは、この因子は、チャネルから所定の距離に位置決めされるが、光を導波管を通じてチャネルの領域に輸送し得る光源であり得る。複数のポリマーが複数のチャネルを通じて輸送される装置がまた用いられ得る。本発明のこれらおよびその他の関連する実施形態は、以下により詳細に論議される。ポリマーの動きは、ポリマーを案内するための溝またはリングの使用により支援され得る。

相互作用ステーションを生成するその他の配列が、本発明によって受け入れられる。例えば、ポリマーは、壁の表面につながれるか、または壁の中に包埋された分子モーターを通過し得、それによって、ポリマーのユニット特異的マーカーを、好ましくは近接因子の相互作用する近傍の特異的位置にもたらし、それによって相互作用ステーションを規定する。分子モーターは、ポリマーと相互作用する、ポリメラーゼ、ヘリカーゼ、またはアクチンのような生物学的化合物であり、そして各ユニット特異的マーカーを超えてポリマーの長さに沿って輸送される。同様に、ポリマーは、動きから保持され得、そしてリーダーは、ポリマーに沿って移動され得、このリーダーはそれに付着した因子をもつ。例えば、この因子は、ポリマーの長さに沿って案内される走査チップ内に保持され得る。相互作用ステーションは、次いで、この因子がポリマーの各ユニット特異的マーカーの相互作用する近傍に移動するときに作製される。

ポリマーのユニット特異的マーカーと相互作用ステーションで相互作用する因子は、電磁場放射、クエンチング源、および蛍光励起源からなる群から選択される。本明細書で用いられるとき「電磁放射」は、電磁波により生成されるエネルギーである。電磁場放射は、直接光源の形態であり得るか、またはそれは、ドナー蛍光体のような光放射化合物によって発せられ得る。本明細書で用いられるとき「光」は、可視、赤外および紫外を含む任意の波長の電磁エネルギーを含む。

本明細書で用いられるとき、クエンチング源は、光放射源の性質を変えるか、または変え得る任意の実体である。変えられる性質は、蛍光強度寿命、スペクトル、蛍光、または燐光を含み得る。

本明細書で用いられるとき、蛍光励起源は、蛍光を発し得るか、または光子放射（すなわち、電磁放射、定方向電場、温度、蛍光、放射、シンチレーション、物理的接触、または機械的破壊）を生じ得る任意の実体である。例えば、ユニット特異的マーカーが、放射活性化合物で標識されるとき、放射活性放射は、蛍光を生じるシンチレーション層である因子の分子励起を引き起こす。

ポリマーのユニット特異的マーカーが因子に曝されるとき、この２つの間の相互作用がシグナルを生成する。このシグナルは、ポリマーについての情報を提供する。例えば、タンパク質ポリマーの特定のタイプのすべてのユニット特異的マーカー、例えば、すべてのアラニンが、特定の発光化合物で標識される場合（内因的または外因的）、そのときは、その発光化合物のシグナル特徴が、上記因子との相互作用の際に検出され、このシグナルは、アラニン残基がポリマー上の特定のその位置に存在することを示す。ユニット特異的マーカーの各タイプ、例えば、アミノ酸の各タイプが、別個の発光パターンを有する異なる発光化合物で標識される場合、各アミノ酸は、上記因子と相互作用し、別個のシグナルを生成する。ポリマーの各ユニット特異的マーカーについてどの各シグナルであるかを決定することにより、ユニットの配列が決定され得る。

ユニット特異的マーカーと因子との間の相互作用は、種々の形態をとり得るが、ユニット特異的マーカーとこの因子とが互いに物理的に接触している必要はない。相互作用の例は以下のようである。第１のタイプの相互作用は、電磁場放射である因子および発光化合物であるユニット特異的マーカー（発光化合物で、内因的にか、または外因的にかのいずれかで標識される）を含む。発光するユニット特異的マーカーが、電磁場放射（適切な波長のレーザービームによるか、またはドナー蛍光体から発せられる電磁放射など）と接触するとき、この電磁放射は、発光化合物が特定波長の電磁放射を発するようにする。次いで、このシグナルを測定する。このシグナルは、発光の特徴的パターンを示し、そしてそれ故、ポリマーの特定の標識ユニット特異的マーカーが存在することを示す。この場合には、ポリマーのこのユニット特異的マーカーは、「発光化合物から電磁放射の放射を検出可能に影響する」といわれる。

第２のタイプの相互作用は、蛍光励起源である因子および発光または放射活性化合物であるポリマーのユニット特異的マーカーを含む。発光するユニット特異的マーカーは、蛍光励起源と接触されるとき、この蛍光励起源は、発光化合物が特定波長の電磁放射を発するようにする。放射活性ユニット特異的マーカーが、蛍光励起源と接触されるとき、このユニット特異的マーカーから発せられる核放射は、蛍光励起源が特定波長の電磁放射を発するようにする。次いで、シグナルが測定される。

これらタイプの相互作用のバリエーションは、相互作用の第３の要素である、シグナルを生成する際に関連する近傍の化合物の存在を含む。例えば、ユニット特異的マーカーは、ドナー蛍光体である発光化合物で標識され得、そして近傍化合物は、アクセプター蛍光体であり得る。発光化合物が、励起状態に配置され、そしてアクセプター蛍光体の近傍にもたらされる場合、エネルギー移動が、ドナーとアクセプターとの間で生じ、発光するユニット特異的マーカーの存在の測定として検出され得る。発光化合物は、それを、（レーザービームのような）光りに曝すことによるか、またはそれを蛍光励起源に曝すことにより、「励起」状態に配置され得る。

別の相互作用は、クエンチング源である近傍化合物を含む。この例では、発光するユニット特異的マーカーは、それを光りに曝すことにより、電磁放射を発するようにされる。発光化合物が、クエンチング源の近傍に配置される場合、この発光するユニット特異的マーカーからのシグナルが改変される。

上記に記載の相互作用に沿った相互作用のセットがここで生成され得るが、しかし、発光化合物は、近傍の化合物であり、そしてユニット特異的マーカーは、クエンチング源またはアクセプター源のいずれかである。これらの事例では、因子は、近傍化合物によって発せられる電磁放射であり、そしてシグナルは、このユニット特異的マーカーを近傍化合物との相互作用する近傍にもたらすことにより発せられ、ユニット特異的マーカーとこのような放射との間の相互作用の特徴である。

これら相互作用の各々が検出可能なシグナルを生成する機構は、当該分野で公知である。例示の目的で、本発明に従う、ドナーおよびアクセプター蛍光体が検出可能なシグナルを生成する機構、このタイプの相互作用から生じることが知られている実際的な制限、およびこのような制限を低減またはなくする方法は、以下に提示される。

本発明の分析の別の好適な方法は、放射活性的に標識されたポリマーの使用を含む。放射活性放射のタイプは、用いられる検出デバイスのタイプに影響する。一般に、α、β、およびγ放射を含む３つの異なるタイプの核放射がある。α放射は、物質における広範なイオン化を引き起こし、そしてイオン化チャンバーおよび比例するカウンターによる個々の計数を可能にするが、より興味深いことに、物質と相互作用するα放射はまた、蛍光に至り得る分子励起を引き起こし得る。蛍光は、シンチレーションとして調べられ得る。α崩壊より弱いβ崩壊は、適切なシグナルを生成するように増幅され得る。γ放射は、励起エネルギーの内部変換から生じる。γ線のシンチレーション計数は、効率的であり、そして強いシグナルを生成する。ヨウ化ナトリウム結晶は、入射γ放射で蛍光を発する。

本明細書で用いられとき、「シンチレーション」層または材料は、核放射による励起に応答して蛍光または光を発する任意のタイプの物質である。シンチレーション材料は、当該分野で周知である。共鳴構造を有する芳香族炭化水素は優れたシンチレーターである。アントラセンおよびスチルベンは、このような化合物のカテゴリーに入る。無機結晶もまた蛍光を発することが知られている。これらの化合物が発光するために、無機結晶は、価電子帯と伝導帯との間にエネルギーレベルを生成する、少量の不純物を有さなければならない。励起と脱励起がそれ故に生じ得る。多くに場合で、この脱励起は、燐光光子放射を通じて生じ得、長寿命の検出に至る。特定の共通のシンチレーターは、ＮａＩ（Ｔ１）、ＺｎＳ（Ａｇ）、アントラセン、スチルベン、およびプラスチック燐光体を含む。

核放射を測定する多くの方法が当該分野で公知であり、そして霧箱デバイスおよび泡箱デバイス、定電流イオンチャンバー、パルスカウンター、ガスカウンター（すなわち、Ｇｅｉｇｅｒ−Ｍｕｌｌｅｒカウンター）、半導体検出器（表面バリア検出器、リチウムドリフト検出器、内因性ゲルマニウム検出器）、シンチレーションカウンター、Ｃｅｒｅｎｋｏｖ検出器などのようなデバイスを含む。

放射線標識されたポリマーの分析は、ポリマー依存性インパルスを生成するその他の手段と同一である。例えば、放射線標識されたＡをもつサンプルは、サンプルＤＮＡ上のＡの相対的間隔を決定するためのシステムによって分析され得る。放射シグナルの検出間の時間は、分析されるポリマーの特徴である。標識されたＤＮＡの４つの集団（Ａ、Ｃ、Ｇ、Ｔ）の分析は、分析されるポリマーの配列を生じ得る。ＤＮＡの配列はまた、二重標識されたＤＮＡおよび単一標識されたＤＮＡの組み合わせの分析を含むより複雑なスキームで分析され得る。同じフラグメントのＡ標識バージョンの分析が続くＡおよびＣ標識されたフラグメントの分析は、ＡおよびＣの位置の知識を生じる。この手順が相補鎖について繰り返される場合に配列が知られる。このシステムは、ポリマー（ポリペプチド、ＲＮＡ、炭水化物など）、サイズ、濃度、タイプ、同一性、存在、配列および数の分析のためにさらに用いられ得る。

上記に記載の方法は、ポリマーについての構造的情報を決定するために、単一のポリマーについて、または１つより多いポリマーについて実施され得る。

本明細書で用いられるとき、「検出可能なポリマー」は、従来の技術によって検知され得る任意のタイプのシグナルまたはポリマー依存性インパルスである。生成されるシグナルは、ステーションおよびユニット特異的マーカー、および存在する場合、近傍化合物のタイプに依存する。１つの実施形態では、シグナルは、ポリマーの標識された（内因的または外因的）ユニット特異的マーカーによるか、または近傍化合物による発光から得られる電磁放射である。別の実施形態では、シグナルは、放射活性放射のシンチレーション層との相互作用から生じる蛍光である。検出されたシグナルは、分析のためにデータベース中に記憶され得る。記憶されたシグナルを分析する１つの方法は、記憶されたシグナルを、別のポリマーからのシグナルのパターンに比較し、２つのポリマーの関連性を決定することによる。検出されたシグナルの分析のための別の方法は、検出されたシグナルを、公知のポリマーのシグナル特徴の既知のパターンに比較し、分析されているポリマーの既知のポリマーとの関連性を決定することによる。シグナルの比較は、以下により詳細に論議される。

１つより多い検出可能なシグナルが検出され得る。例えば、第１の個々のユニット特異的マーカーは、因子またはステーションと相互作用し得、第１の検出可能なシグナルを生成し、そして第２の個々のユニット特異的マーカーは、因子またはステーションと相互作用し得、第１の検出可能なシグナルとは異なる第２の検出可能なシグナルを生成する。これは、単一のポリマー上で、１つより多いタイプのユニット特異的マーカーが検出されることを可能にする。

一旦、シグナルが生成されると、次いで、それは検出され得る。特定のタイプの検出手段は、ユニット特異的マーカーと因子との間で生じる相互作用のタイプに依存する生成シグナルのタイプに依存する。本発明の方法に含まれる多くの相互作用は、電磁放射シグナルを生成する。電磁シグナルを検出するための多くの方法が当該分野で公知であり、二次元および三次元造影システムを含む。これらおよびその他のシステムは、ＰＣＴ特許出願ＷＯ９８／３５０１２および米国特許第６，３５５，４２０号により詳細に記載されている。

この方法に含まれるその他の相互作用は、核放射シグナルを生成する。ポリマー上の放射標識が、ステーションのような検出の規定された領域を通過するとき、核放射が発せられ、そのある部分は、放射検出の規定された領域を通過する。核放射の検出器は、放射検出の規定された領域の近傍に配置され、発せられた放射シグナルを捕獲する。核放射を測定する多くの方法が当該分野で公知であり、霧箱デバイスおよび泡箱デバイス、定電流イオンチャンバー、パルスカウンター、ガスカウンター（すなわち、Ｇｅｉｇｅｒ−Ｍｕｌｌｅｒカウンター）、半導体検出器（表面バリア検出器、リチウムドリフト検出器、内因性ゲルマニウム検出器）、シンチレーションカウンター、Ｃｅｒｅｎｋｏｖ検出器などを含む。

その他のタイプの発生シグナルが当該分野で周知であり、そして当業者に公知である多くの検出手段を有している。これらの中では、対向電極、磁気共鳴、および圧電走査チップが含まれる。対向するナノ電極は、静電容量の測定により機能し得る。２つの対向する電極は、エネルギー貯蔵のすべての領域を生成し、これは、２つの電極間で有効である。２つの対向する電極の静電容量は、これら電極の間に異なる材料が配置されるとき変化することが知られている。この値は、誘電率として知られている。誘電率の変化は、２つの電極を横切る電圧における変化として測定され得る。現在の例では、ポリマーの異なるヌクレオチド塩基またはユニット特異的マーカーは、異なる誘電率を生じ得る。この静電容量は、等式：Ｃ＝ＫＣ_０を通じて、ポリマーのユニット特異的マーカーの誘電率として変化し、ここで、Ｋは、誘電率であり、そしてＣ_０は、任意の塩基が不在下の静電容量である。ナノ電極の電圧偏向が次いで測定デバイスに出力され、時間とともに変化するシグナルを記録する。

ナノサイズのＮＭＲ検出デバイスを、特異的スピン標識ポリマーユニット特異的マーカーの通過を検出するために構築し得る。このナノサイズのＮＭＲ検出デバイスは、掃引され得る磁石、および一定周波数の電磁エネルギーでポリマーを照射する手段（これは、電磁周波数が掃引される間に磁場定数を保持することと同一である）からなる。電磁場が、正確な強度に到達するとき、核はエネルギーを吸収し、そして共鳴が起こる。この吸収は、小さな電流がサンプルを取り囲むアンテナコイル中に流れることを可能にする。シグナルは増幅され、そして記録デバイスに出力される。既知の標識化合物には、検出の時間は、質問の化合物の完全なスペクトルが要求されるＮＭＲ検出の電流手段よりかなり迅速である。既知の標識されたポリマーのユニット特異的マーカーは、特定の領域中に既知の化学的シフトを有し、それによって、完全なスペクトル掃引を実施する必要性をなくし、マイクロまたはミリ秒まで塩基あたりの検出の時間を低減する。

ナノスケール圧電走査チップは、チップで、異なるポリマーユニット特異的マーカーの物理的接触を基に、ポリマーの異なるユニット特異的マーカーを読み取るために用いられ得る。ポリマーユニット特異的マーカーのサイズおよび形状に依存して、異なる圧電シグナルが生成され、一連のユニット特異的マーカー依存性変化を生成する。ユニット特異的マーカー上の標識は、ネイティブユニットとは物理的に異なり、そして圧電走査チップを経由して検出のための準備完了手段を生成し得る。ポリマーユニット特異的マーカーのチップとの接触に際し、圧電結晶は変化し、そして検出デバイスに出力される電流を生じる。ホリマーユニット特異的マーカーのチップとの相互作用により生成された電流の大きさおよび持続時間は、ポリマーユニット特異的マーカーの特徴である。

線形分析の１つの好ましいタイプでは、標識ポリマーは、ナノチャネルによって、標識ポリマーがステーションを通過するとき、このステーションと標識ポリマーとの間の相互作用から生じるシグナルが空間的に閉じ込められるようにステーションに対する相対位置に固定される。好ましくは、チャネルは、標識ポリマーの直径に対応し、そして積分された時間に亘り標識ポリマーからの多くの放射を捕獲し得る造影システムに対してＤＮＡを固定する。この方法は、個々の分子の強度の分析について特異的である。このナノチャネルシステムは、例として提供され、そして以下により詳細に論議される。任意の手段を用い、シグナルを経時的に分析し得る光学的方法による分析のために標識ポリマーを所定の大きさ（ｄｉｍｅｎｓｉｏｎ）に固定し得る。分析のために標識ポリマーを位置決め得るデバイスの例は、ナノチャネルアレイ、一体ナノ製作導波管、および種々の格子を含む。

（分子モーター）
上記に記載の分析は、以下に簡単に記載される米国特許第６，２１０，８９６号に記載のような分子モーターの使用により実施され得る。

本発明の方法および生成物は、ＷＯ９８／３５０１２および米国特許第６，３５５，４２０号に記載の線形分析法に類似の様式で、ポリマーについて構造的情報を決定するために有用である。従って、１つの局面では、本発明の方法は、ポリマーの１つ、いくつか、またはすべてのユニットを識別するために用いられ得る。これは、骨格上の特定の位置で検出されるシグナルが特定の標識ユニットの存在の特徴であるか否かを決定することによって、個々のユニットのタイプおよびそのポリマーの骨格上のその位置を識別することにより達成される。

１つの局面では、本発明は、ポリマーを分析するための方法である。この方法は、複数のポリマーの個々のユニットを、分子モーターを因子に対してポリマーを移動させることにより、電磁放射源、クエンチング源、および蛍光励起源からなる群から選択される因子に曝す工程、およびポリマーのこれらユニットと因子との間の相互作用から生じるシグナルを検出する工程を包含する。

この方法は、線形分析のための方法であり、そこでは、シグナルは逐次的に検出される。本明細書で用いられるとき、単一のポリマーの異なるユニットからのシグナルが時間間隔を離して検出されるとき、シグナルは「逐次的に」検出される。必ずしもユニットのすべてが「逐次的に」検出される必要はなく、または「逐次的に」シグナルを検出するためのシグナルを生成する必要はない。ユニットが、因子またはステーションに逐次的に曝されるとき、このユニットおよび因子またはステーションは、互いに対して移動する。本明細書で用いられるとき、語句「ユニットおよびステーションは、互いに対して移動する」は、ユニットおよび因子の両方が移動するか、またはこの２つの１つのみが移動し、そしてその他が少なくともこのユニットと因子との間の相互作用の時間の間に静置のままであるかのいずれかを意味する。

ユニットおよび因子は、分子モーターによって互いに対して移動される。本明細書で用いられるとき、「分子モーター」は、ポリマーと物理的に相互作用し、かつポリマーを、単一のステーションを通過して移動される生物学的分子である。好ましくは、この分子モーターは、ポリマーと相互作用し、かつこのポリマーの長さに沿ってポリマーに対して移動するタンパク質またはタンパク質複合体のような分子である。この分子モーターは、ポリマーの各ユニットと逐次的様式で相互作用する。この分子モーターとポリマーとの間の物理的相互作用は、例えば、ファンデルワールス力のような分子間に生じる分子力に基づく。本発明の方法に従う有用な分子モーターのタイプは、分析されるポリマーのタイプに依存する。例えば、ＤＮＡポリメラーゼまたはヘリカーゼのような分子モーターは、ポリマーがＤＮＡであるとき有用である。ＲＮＡポリメラーゼのような分子モーターは、ポリマーがＲＮＡであるとき有用であり、そしてミオシンのような分子モーターは、例えば、ポリマーがアクチンのようなペプチドであるとき有用である。分子モーターは、制限されないで、ヘリカーゼ、ＲＮＡポリメラーゼ、ＤＮＡポリメラーゼ、キネシン、ダイネシン、アクチンおよびミオシンを含む。当業者は、本明細書に記載のパラメーターに基づき、本発明に従って有用なその他の分子モーターを容易に識別し得る。

ＤＮＡポリメラーゼは、効率的な分子モーターとして機能することが示されている。好ましくは、ＤＮＡ上にクランプするこのポリメラーゼの領域の内径は、二本鎖ＤＮＡのそれと類似である。大量のＤＮＡは、直線状様式でクランプを通り得る。ＤＮＡポリメラーゼＩＩＩホロ酵素のｂ−サブユニットの全体の構造は、約３５オングストロームの内径を有して８０オングストローム直径である。対照的に、二重鎖Ｂ−形態ＤＮＡの完全ターンは、約３４オングストロームである。このベータサブユニットは、ＤＮＡの周りに、スライディングクランプ機構と称される機構で適合し、ＤＮＡ複製の間にホロ酵素のプロセシング運動を仲介する。ｂ−サブユニットは、複製の間にＤＮＡを取り囲み、ホロ酵素にプロセッシング能力を与えることが良く理解されている（Ｂｌｏｏｍら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７１：３０６９９−７０８、１９９６；Ｆｕら、ＥＭＢＯ．Ｊ．、１５：４４１４−２２、１９９６；Ｇｒｉｅｐ、Ａｎａｌ．Ｂｉｏｃｈｅｍ．、２３２：１８０−９、１９９５；ＨｅｒｅｎｄｅｅｎおよびＫｅｌｌｙ、Ｃｅｌｌ、８４：５−８、１９９６；Ｎａｋｔｉｎｉｓら、Ｃｅｌｌ、８４（１）：１３７−１４５、１９９６；Ｐａｚ−Ｅｌｉｚｕｒら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２７１：２４８２−９０、１９９６およびＳｋａｌｉｔｅｒら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．、２７１：２４９１−６、１９９６）。スライディングクランプは、ポリメラーゼにとって、プロセッシング能力の機構であるので、それは、必然的に、大量のＤＮＡがクランプを、直線状様式で通ることを意味する。数キロベースが一度にクランプを通って通り抜ける（ＫｏｒｎｂｅｒｇおよびＢａｋｅｒ、ＤＮＡＲｅｐｌｉｃａｔｉｏｎ、Ｗ．Ｈ．Ｆｒｅｅｍａｎ、ＮｅｗＹｏｒｋ、１９９１）。

ＲＮＡポリメラーゼはまた、ＤＮＡポリメラーゼのように、効率的な分子モーターとして機能し得る。ＲＮＡポリメラーゼの領域の内径は、それがＲＮＡ上にクランプし得、そしてユニット毎に前進してＲＮＡを下流に移動し得るようである。ＲＮＡポリメラーゼは、例えば、Ｔ７ＲＮＡポリメラーゼ、Ｔ３またはＳＰ６ＲＮＡポリメラーゼ、Ｅ．ｃｏｌｉＲＮＡポリメラーゼなどを含む。ＲＮＡポリメラーゼを用いるＲＮＡ転写の適切な条件は、当該分野で公知である。

別の好ましいタイプの分子モーターは、ヘリカーゼである。ヘリカーゼは先に記載されている。例えば、米国特許第５，８８８，７９２号を参照のこと。ヘリカーゼは、核酸骨格に沿って移動し、そして核酸を、ＤＮＡ複製、修復、組換え、転写、ｍＲＮＡスプライシング、翻訳およびリボソームアセンブリのプロセスが生じ得るように解く。ヘリカーゼは、ＲＮＡヘリカーゼおよびＤＮＡヘリカーゼの両方を含む。核酸分子モーターは、核酸分子の骨格に沿って移動するような分子モーターを含み、そして、例えば、ポリメラーゼおよびヘリカーゼを含む。

複数のポリマーは、１つより多くのポリマーを、個々の分子モーター上の個々のシグナルステーションに対して移動させることによって同時に分析され得る。これらポリマーは類似または別個であり得る。ポリマーが類似である場合、同じかまたは異なるユニットが同時に検出され得る。ポリマーの移動は、分子モーター単独によって達成され得るか、またはポリマーを案内するためのチャネル、溝またはリングによって支援され得る。あるいは、分子モーターおよび因子が移動され得、そしてポリマーは静止したままであり得る。例えば、因子は分子モーターに付着され得、そしてポリマーが表面に固定され得る。この場合、因子が付着した分子モーターは、静止ポリマーの長さを下流に走査し得る。

本発明の方法は、以下の非制限的な例について記載され、それは例示の目的のみに提供される。この例は、ＤＮＡおよび蛍光の分析に言及するが、当業者は、それがすべてのポリマーおよびすべての請求されるシステムに適用可能であることを理解し得る。この例では、ＤＮＡポリメラーゼは、いくつかの蛍光分子、例えば、ドナー蛍光分子で標識される。一致する蛍光体、例えば、アクセプター蛍光体で標識されたＤＮＡ分子が、次いで、プライマー伸長を行うことを始めるＤＮＡポリメラーゼのテンプレートとして用いられる。アクセプター蛍光体がドナー蛍光体を超えて移動するとき、蛍光共鳴エネルギー移動（ＦＲＥＴ）が起こる。ＦＲＥＴは、ドナーおよびアクセプター蛍光体が、約１オングストローム〜１００オングストロームの範囲内で緊密範囲相互作用を行うときに生じる。この距離は、標識をもつ単一のヌクレオチドがポリメラーゼ上の蛍光体を通過するとき達成される。

分子モーターを用いるＦＲＥＴ分析は、溶液中の単一分子上で、または固体平坦媒体上の平行反応として実施され得る。それはまた、複数ウェルのディシュ中におけるように異なる溶液中の平行反応中で実施され得る。この反応が平坦固体媒体上で実施される実施形態では、標識ポリマーまたは標識分子モーターのいずれかが、この表面上に直接またはリンカーを解して固定化され得る。ポリマーが表面上に付着される場合、分子モーターが次に添加され、そして分子モーターが表面につながれる場合、ポリマーが添加され得、反応を開始する。このようにして、複数のドナー−アクセプター反応部位の同時線形読み取りが生じ得、システムのスループットを増大する。この分子モーターがＤＮＡポリメラーゼであるとき、ＤＮＡの数キロベースの配列が迅速に得られ得る。配列決定の大体の速度は、１カメラシステムで１メガ塩基／時間に達し得る。

分子モーターとして供され得る蛍光標識酵素とタンパク質との複合体の調製は、当該分野で周知である。酵素上の複数のアミン、カルボキシル、およびスルフヒドリル部位の利用可能性は、標識のこれら分子への結合を簡単にする。多くのタンパク質は、官能化され、活性の損失なくして蛍光誘導体を生成し、これには、例えば、抗体、西洋ワサビペルオキシダーゼ、グルコースオキシダーゼ、ｂ−ガラクトシダーゼ、アルカリホスファターゼ、アクチン、およびミオシンを含む。分子モーターは、類似の様式で、機能的活性を損失することなく容易に誘導体化され得る。さらに、米国特許第６，３５５，４２０号に記載のような当該分野で公知の方法を用いて標識がポリマー中に取り込まれ得る。例えば、標識は、市販され利用可能なヌクレオチドまたはアミノ酸ポリマーを用いるか、または一級アミノ基に連結され得るスクシンイミジルエステル誘導体としてポリマー中に取り込まれ得る。

市販され利用可能な多くの蛍光標識は、分子モーターおよび／またはポリマーのようなタンパク質へのそれらの結合を可能にする官能基を有している。これらの標識は、制限されないで、フルオレセインイソチオシアネート、ＮＨＳ−フルオレセイン、ヨードアセタミドフルオレセイン、フルオレセイン−５−マレイミド、ＳＡＭＳＡ−フルオレセイン、フルオレセイン−５−チオセミカルバジドなどを含む。当業者は、たった１つのタイプの標識でさえ利用可能な結合技法の広範な選択のため、本発明の方法のために標識を選択する際に大きな柔軟性を有している。ローダミンの改変体、Ｃｙ−ｄｙｅｓ（Ａｍｅｒｓｈａｍ−Ｐｈａｒｍａｃｉａ）、Ａｌｅｘａ−ｄｙｅｓ（Ｍｏｌｅｃｕｌａｒｐｒｏｂｅｓ）、ＴｅｘａｓＲｅｄｓなどは、広範な範囲の利用可能な波長、光安定性、エネルギー移動スペクトル、および化学的適合性に役立つ。良好な吸収、安定励起、および高蛍光量子収率は、標識の重要な特性である。

蛍光結合体の例として、分子モーターへのフルオレセインイソチオシアネート（ＦＩＴＣ）結合体が記載される。フルオレセインイソチオシアネートは、プロトタイプの蛍光色素である。それは、２つの構造的異性体で存在する。１つは環下部の５−位または６−位で改変される。これら２つの異性体は、蛍光性質に関し光学的に等価である。イソチオシアネート基は、アミンおよびスルフヒドリルのような求核原子と反応するが、唯一の安定産物は、タンパク質中のＥ−およびＮ−末端アミンのような一級アミン基とである。イソチオシアネート基とＦＩＴＣとの間の反応は、チオ尿素連結を生じ、そして脱離基はない。ＦＩＴＣは、ストック溶液としてＤＭＦ中に溶解され、そして次に６以上のｐＨで水性反応混合物に添加される。貯蔵は、−２０℃で光から保護され、そして乾燥条件下である。ＦＩＴＣの最大吸収は、４９５μｍであり、そして最大放射は５２０ｎｍにある。酵素の溶液は、通常、０．１Ｍの炭酸ナトリウム、ｐＨ９中で調製され、そして少なくとも２ｍｇ／ｍｌの濃度である。ＦＩＴＣは、１ｍｇ／ｍｌの濃度でＤＭＳＯ／ＤＭＦ中のストックに溶解され、そして光から保護される。暗くした実験室で、５０〜１００μｌのＦＩＴＣ溶液が各ミリリットルのタンパク質溶液（２ｍｇ／ｍｌとする）に添加される。反応は４℃で一晩である。反応は、５０ｍＭの最終濃度までの塩化アンモニウムの添加により停止する。残存するイソシアネート基は、さらに２時間後、ブロックされる。誘導体は、ＰＢＳでのゲル濾過を用いて精製される。

好ましい実施形態では、蛍光色素およびそのエネルギー移動対が注意深く選択されシグナル生成を最大にする。これは、以下に提示される式により記載されるパラメーターを考慮することにより達成され得る。蛍光エネルギー移動（ＦＲＥＴ）は、ドナー蛍光放射とアクセプター蛍光吸収のスペクトル重複に関連し、Ｊ（ドナー放射（ｆＤ）アクセプター吸収（ε_Ａ）の正規化されたスペクトル重複）として決定される。正規化スペクトル重複の重要性を要約する等式は：Ｊ＝∫εＡ（λ）ｆＤ（λ）λ^４ｄλ／∫ｆＤ（λ）ｄλとして与えられる。

このＪ因子は、ドナー蛍光体からアクセプター蛍光体へのエネルギー移動が５０％である距離であるＦｏｒｓｔｅｒエネルギー移動距離の決定で特に重要である。このＦｏｒｓｔｅｒ距離はまた、ＦＲＥＴ配列決定方法の解像度を決定する。一般に、このＦｏｒｓｔｅｒ距離は、５オングストロームと１００オングストロームとの間と小さくその間で変化し得る。

これらの変数は、本発明者らのＦＲＥＴ配列決定システムにおける使用のための最適ドナー−アクセプター対の選択で考慮されている。Ｊ因子は重要であるが、しかし、最適性能のためにシステム中に作動されるべきさらなる因子があり、例えば、１）スペクトルバンドの鋭さ、２）スペクトルバンド間のクロストークの欠如、３）ポリマーマトリックス中に選択された標識を固定化する能力、および４）ＤＮＡ中への取り込みのために用いられる共通標識と一致する能力である。

その他の因子が、適正な蛍光標識対を選択する際に考慮され得る。例えば、標識のスペクトル重複は、エネルギー移動に十分であるべきである。アクセプター蛍光体の直接励起を最小にすることにより、励起レベルにおけるクロストークは避けられ得る。さらに、ドナー蛍光体の放射は、アクセプター蛍光体からの検出バンドを妨害すべきではない。このようにして、測定される蛍光事象は、適切であり、そしてエネルギー移動の発生の指標である。理想的な条件下で、ドナーおよびアクセプター蛍光は鋭く、そしてスペクトルの広がりを受けない。さらに、標識の量子収率、光安定性、および断面積における考慮がある。これらパラメーターのすべては、既知および市販され利用可能な標識の既知の性質を基に当業者によって容易に操作され得る。

当業者は、分子モーターおよび／またはポリマーの蛍光標識化の程度を確認し得る。蛍光体結合分子における蛍光標識化のレベルは、サンプルの吸収または蛍光放射のいずれかにより決定される。分子あたりの蛍光体分子の数は、Ｆ／Ｍ比と呼ばれる。この値は、酵素−蛍光体複合体のすべての調製において測定される。理想的Ｆ／Ｍ比が、特定分子（分子モーターまたはポリマー）の分子−蛍光体の組み合わせについて決定される。蛍光体の既知の吸光係数を用い、誘導体化レベルの決定が、過剰の蛍光体を除去した後になされ得る。

標識された分子モーターの活性は、結合および精製の後に分子モーター蛍光体複合体の生存率を評価する標準的なアッセイを用いて確認され得る。種々の分子モーターは、活性確認のためのそれら自身のアッセイをもつ。ＤＮＡポリメラーゼ、およびＦＩＴＣへの結合後のその活性は以下に論議され、この主題についてさらに明確にする。この例は、本発明の範囲をいかなるようにも制限しない。

ＤＮＡポリメラーゼ−蛍光体複合体は、ジデオキシ配列決定反応でチェックされ、改変された分子モーターがその鎖伸長機能を実施する能力を確認する。プライマーアニーリング、標識化、および停止反応が行われ、一本鎖のジデオキシ停止産物の長さを決定し、そしてまた伸長産物の塩基正確さをアッセイする。４つのジデオキシヌクレオチドについての反応混合物を、最終分析のために４つの色度自動化キャピラリーゲル電気泳動（ＡＢＩ３７７０など）に供する。既知のＭ１３ｓｓＤＮＡ配列決定テンプレートとの配列の一致は、ポリメラーゼ−蛍光体複合体の完全性を確認する。

１つの例では、分子モーター（すなわち、ＤＮＡポリメラーゼ）のアレイが、スライドグラスの表面に結合され得る。これらポリメラーゼは、アクセプター分子の励起スペクトルと部分的に重複する放射スペクトルを有するドナー蛍光分子で標識される。テンプレートアクセプター標識ポリマー（すなわち、ＤＮＡ）が、適切な伸長プライマーとともに反応混合物中に提供される。反応は、デオキシヌクレオチドの混合物で開始される。鎖伸長は、テンプレートＤＮＡ上のアクセプターがポリメラーゼ上のドナーの近傍に移動されることを可能にする。一旦、アクセプターが、固定化されたポリメラーゼ分子上のドナーのエネルギー移動近傍内にくると、非放射エネルギーが生じる。アクセプターからの感作された蛍光放射が誘導される。物質からの時間的に間隔を置いた蛍光放射は、テンプレート分子についてのヌクレオチド情報の質問を可能にする。

空間的に異なる配向の分子の統計学的分析は、以下により詳細に論議されるように速度およびコスト有効性をもつ配列の完全かつ正確な再構築を可能にする。本発明の方法は、それ故、Ｓａｎｇｅｒ配列決定のような伝統的な非線形配列決定が必要とする、かなりより長い読み取り長さ、および分離方法を完全になくすことを可能にする。

本発明の線形分析方法の別の例では、テンプレートは、ガラス表面に固定され得、そしてポリメラーゼは溶液中で移動可能である。ドナー蛍光分子は、アクセプターに対向するようにＤＮＡ分子上に位置決めされ得る。一連の相互作用は、二重鎖ＤＮＡを解くヘリカーゼ分子のような異なる分子モーターによって仲介され得る。このシナリオでは、ヘリカーゼ分子は、蛍光でタグ化され、そして蛍光分子で非対照的に標識されている複合体を解くことを可能にする。非対照的標識化は、ポリマーについての情報を解読する容易さを可能にする。

別の例では、分子モーターおよびポリマーは溶液中であり得る。この分析の方法は、表面に付着される分子モーターまたはポリマーのいずれかがなくても実施され得る。分子モーターおよびポリマーは、溶液中を互いに対して移動し得る。単一の分子モーターが溶液中に存在するとき、相互作用から生じる個々のシグナルは、分析の標準的な方法により検出かつ分析され得る。

ポリマーまたは分子モーターを支持体につなぐこと、システム成分を標識すること、分子モーターとポリマーとの間に相互作用を引き起こすこと、および検出方法、例えば、蛍光共鳴エネルギー移動などに含まれる方法は、本明細書ならびにＷＯ９８／３５０１２および米国特許第６，３５５，４２０号に記載されている。標識化、生体分子を固定化することなどのためのその他の方法は、当業者に公知である。例えば、Ｓｃｈａｆｅｒら、Ｎａｔｕｒｅ、３５２（６３３４）：４４４〜８、１９９１は、標識化および検出を記載している。

本発明は、ポリマーの少なくとも１つのユニットと因子との間、またはこのユニットがステーションに曝されるときの相互作用から生じるシグナルを検出することによりポリマーを分析する改善された方法を包含する。ポリマーを「分析すること」により、それは、ポリマーの構造についての特定の情報、例えば、そのサイズ、そのユニットの順序、他のポリマーに対するその関連性、そのユニットの同一性、またはその存在を得ることを意味する。生物学的分子の構造および機能は相互依存性であるので、この構造情報は、ポリマーの機能についての重要な情報を示し得る。

本発明の方法はまた、ポリマーのその他の構造的性質を識別するために有用である。本発明の方法に従ってポリマーを分析することによって得られる構造情報は、ポリマーの特徴的性質の識別を含み得、これは（次に）、例えば、サンプル中のポリマーの存在の識別またはポリマーの関連性の決定、ポリマーのサイズの識別、ポリマーの２つ以上の個々のユニット間の近接度または距離、ポリマー内の２つ以上の個々にユニットの順序の識別、および／またはポリマーのユニットの一般的組成の識別を可能にする。このような特徴は、サンプル中の特定のポリマーの存在または不在を決定することのような、種々の目的に有用である。例えば、ポリマーが核酸であるとき、本発明の方法は、特定の遺伝子配列が細胞または組織中で発現されているか否かを決定するために用いられ得る。特定の配列の存在または不在は、サンプル内の任意のポリマーが、目的のポリマー中にのみ見出される個々のユニットの特徴的パターンを発現しているか否かを決定することにより、すなわち、検出されたシグナルを、既知のポリマーのシグナルの既知のパターンと比較し、既知のポリマーに対する分析されているポリマーの関連性を決定することにより確立され得る。目的のポリマーの全配列は、サンプル中のポリマーの存在または不在を確立するために決定される必要はない。同様に、これらの方法は、１つのポリマーから検出されたシグナルを、別のポリマーからのシグナルのパターンと比較し、２つのポリマーの関連性を決定するために有用である。

ポリマーの２つの個々のユニットの近接度またはそれらの間の距離は、本発明の方法に従って決定され得る。いくつかの理由のために、２つのユニットの近接度またはそれらの間の距離を決定し得ることは重要である。ポリマーの各ユニットは、骨格に沿って特異的な位置を有している。ユニットの配列は、既知のポリマーの青写真として供される。未知ポリマー上の２つ以上のユニット間の距離は、既知ポリマーの青写真と比較され得て、それらが関連しているか否かを決定する。さらに、２つのユニット間の距離を決定する能力は、存在するのであれば、いくつのユニットが目的の２つのユニットの間に存在するのかを決定するために重要である。

一般に、本発明の線形ポリマー分析の方法は、ポリマーの標識ユニットと、電磁放射源、クエンチング源および蛍光励起源からなる群から選択される因子との間の相互作用から生じるシグナルを検出することにより実施される。本明細書で用いられるとき、「シグナル」は、ポリマーの標識ユニットの構造特徴についての情報を伝達または運搬し、そして検出され得る、検出可能な物理量である。好ましくは、この物理量は、電磁放射である。このシグナルは、エネルギー移動、クエンチング、放射活性などから生じ得る。このシグナルは、特定の標識ユニットに特異的であるが、１つより多くの特定の標識ユニットを有するポリマーは、１つより多くの同一のシグナルを有する。さらに、特定タイプの各標識ユニットは、それらが異なる標識を有する場合、異なるシグナルを生じ得る。

シグナルを検出するために用いられる方法は、生成される物理量のタイプに依存する。例えば、この物理量が、電磁放射である場合、そのときは、このシグナルは光学的に検出される。本明細書で用いられるとき、「光学的に検出可能な」シグナルは、光検出造影システムにより検出され得る電磁放射の形態にあるシグナルに基づく光である。

「複数のポリマー」は、少なくとも２つのポリマーである。１つの実施形態における複数のポリマーは、少なくとも５０のポリマーであり、そして別の実施形態では、少なくとも１００のポリマーである。

これらのシグナルは、ポリマーに関する任意のタイプの構造情報を提供し得る。例えば、これらのシグナルは、ポリマーの全配列の全体または部分、シグナルの順序、または標識ユニット間の距離の指標としてのシグナル間の分離の時間を提供し得る。

本明細書で用いられるとき、「類似のポリマー」は、少なくとも１つの重複領域を有するポリマーである。類似のポリマーは、ポリマーの均一集団またはポリマーの不均一集団であり得る。本明細書で用いられるポリマーの「均一集団」は、同一ポリマーの群である。類似のポリマーの「不均一集団」は、同一ではないが、同一ユニットの少なくとも１つの重複領域を含む類似のポリマーの群である。核酸における重複領域は、代表的には、少なくとも１０の連続ヌクレオチドからなる。いくつかの場合には、重複領域は、少なくとも、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、または２２の連続ヌクレオチドからなる。

本明細書で用いられるとき、「ポリマー」は、結合によってともに結合される個々のユニットの直線状骨格を有する化合物である。いくつかの場合では、このポリマーの骨格は、分岐され得る。好ましくは、この骨格は分岐していない。用語「骨格」は、ポリマー化学の分野におけるその通常の意味が与えられる。ポリマーは、骨格組成において均一であり得、それによって、ペプチド−核酸（核酸に連結されるアミノ酸を有し、そして増加した安定性を有する）のようなともに結合したポリマーユニットの可能な任意の組み合わせを含む。好ましい実施形態では、これらポリマーは、骨格組成において不均一であり、そして、例えば、核酸、ポリペプチド、多糖、炭水化物、ポリウレタン、ポリカーボネート、ポリ尿素、ポリエチレンイミン、ポリアリーレンスルフィド、ポリシロキサン、ポリイミド、ポリアセテート、ポリアミド、ポリエステル、またはポリチオエステルである。最も好適な実施形態では、ポリマーは、核酸またはポリペプチドである。本明細書で用いられるとき、「核酸」は、デオキシリボース核酸（ＤＮＡ）またはリボース核酸（ＲＮＡ）のようなヌクレオチドから構成されるバイオポリマーである。本明細書で用いられるとき、ポリペプチドは、連結アミノ酸から構成されるバイオポリマーである。

ポリマーの連結ユニットに関して本明細書で用いられるとき、「連結された」または「連結」は、２つの実体が任意の物理化学的手段により互いに結合されていることを意味する。当業者に公知の任意の連結、共有または非共有が含まれる。このような連結は当業者に周知である。特定のポリマーの個々のユニットを連結する天然に通常見出されるような天然の連結が最も一般的である。天然の連結は、例えば、アミド、エステルおよびチオエステル連結を含む。本発明の方法により分析されるポリマーの個々にユニットは、しかし、合成または改変された連結により結合され得る。ユニットが共有結合により連結されるポリマーが最も一般的であるが、水素結合などもまた含む。

ポリマーは、複数の個々のユニットから構成される。本明細書で用いられるとき、「個々のユニット」は、その他の構築ブロックまたはモノマーに直接または間接的に連結され得、ポリマーを形成する構築ブロックまたはモノマーである。ポリマーは、好ましくは、少なくとも２つの異なる連結ユニットのポリマーである。この少なくとも２つの異なる連結されたユニットは、以下により詳細に論議されるように、異なるシグナルを生成するか、またはそれを生成するために標識され得る。特定のタイプのユニットは、ポリマーのタイプに依存する。例えば、ＤＮＡは、アデニン、シトシン、グアニン、チミン、５−メチルシトシン、２−アミノプリン、２−アミノ−６−クロロプリン、２，６−ジアミノプリン、ヒポキサンチン、およびその他の天然および非天然に存在するヌクレオ塩基、置換および非置換芳香族成分のようなプリンおよびピリミジンから構成されるデオキシリボースリン酸骨格から構成されるバイオポリマーである。ＲＮＡは、ＤＮＡについて記載されたようなプリンおよびピリミジン（しかし、ここで、チミンの代わりにウラシルが置換される）のユニットから構成されるリボースリン酸骨格から構成されるバイオポリマーである。これらのＤＮＡヌクレオチドは、それらの５’または３’ヒドロキシル基により互いに連結され得、それによってエステル連結を形成する。上記のＲＮＡヌクレオチドは、それらの５’、３’または２’ヒドロキシル基により互いに連結され得、それによってエステル連結を形成する。あるいは、５’、３’または２’アミノ基を有するＤＮＡまたはＲＮＡユニットは、アミノ基によりポリマーのその他のユニットに連結され得、それによってアミド連結を形成する。

核酸が文字の配列で表されるとき、それは、他であることが注記されなければ、ヌクレオチドが左から右に５’→３’順序にあり、しかも、「Ａ」はアデニンを示し、「Ｃ」はシチジンを示し、「Ｇ」はグアノシンを示し、「Ｔ」はチミジンを示し、そして「Ｕ」はウラシルを示すことが理解される。

これらポリマーは、本来あるネイティブまた天然に存在するポリマーであるか、または本来存在しない天然に存在しないポリマーであり得る。代表的には、これらポリマーは、天然に存在するポリマーの少なくとも一部分を含む。これらポリマーは、単離され得るか、またはデノボ（ｄｅｎｏｖｏ）で合成される。例えば、これらポリマーは、天然の供給源から単離され得、例えば、切断およびゲル分離によるように、精製されるか、または例えば、（ｉ）例えば、ポリメラーゼ連鎖反応（ＰＣＲ）によりインビトロで増幅されるか；（ｉｉ）例えば、化学的合成により合成されるか；（ｉｉｉ）クローニングなどにより組換えにより産生されるかで合成され得る。

ポリマーまたはその少なくとも１つの標識ユニットは、因子またはステーションと相互作用し得る形態にあり、その相互作用のシグナル特徴を生成する。このような相互作用を行い得るポリマーの標識されたユニットは、標識されているといわれる。ポリマーの標識されたユニットが、その相互作用を行い得、特徴的なシグナルを生成する場合、ポリマーは、内因的に標識されているといわれる。外因的な標識がポリマーに付加される必要は必ずしもない。しかし、非ネイティブ分子が、特徴的シグナルを生成する相互作用を生成するためにポリマーの個々の標識ユニットに付着されなければならない場合、ポリマーは外因的に標識されているといわれる。この「標識」は、例えば、光放射、エネルギー受容、蛍光、放射活性、またはクエンチングであり得る。いくつかの実施形態では、この標識されたポリマーは、外因的に標識されたポリマーであり、そしてその他の実施形態では、それは、内因的に標識されたポリマーである。

ポリマーの多くの天然に存在するユニットは、発光化学的またはクエンチャーである。例えば、ネイティブ核酸分子のヌクレオチドは、別個の吸収スペクトルを有し、例えば、Ａ、Ｇ、Ｔ、Ｃ、およびＵは、それぞれ、２５９ｎｍ、２５２ｎｍ、２６７ｎｍ、２７１ｎｍ、および２５８ｎｍに吸収最大を有している。内因性標識を含む改変ユニットもまた、ポリマー中に取り込まれ得る。核酸分子は、例えば、発光化合物のエネルギー放射パターンまたはクエンチング化合物の特徴を有する以下の改変ヌクレオチドユニットのいずれかを含み得る：２，４−ジチオウラシル、２，４−ジセレノウラシル、ヒポキサンチン、メルカプトプリン、２−アミノプリン、およびセレノプリン。

本発明の方法に従う、有用な標識のタイプ、適切な標識を選択するためのガイドライン、およびポリマーに外因性標識を付加するための方法は、ＷＯ９８／３５０１２および米国特許第６，３５５，４２０号により詳細に提供されている。

本明細書で用いられるとき、「標識ユニット」は、特定のユニット（単数または複数）を識別するポリマー中の任意の標識されたユニットである。標識されたユニットは、たとえば、蛍光マーカー、および内因的および外因的に標識されたユニットを含む。

試験ポリマーを特徴付けるための方法は、複数のポリマーの各々についてポリマー依存性インパルスを得ること、この複数のポリマーのこのこのポリマー依存性インパルスを比較すること、このポリマーのポリマー依存性インパルス間の類似性に基づきポリマーの関連性を決定すること、および関連するポリマーのポリマー依存性インパルスに基づき試験ポリマーを特徴付けることによって実施される。

本明細書で用いられるとき、「ポリマー依存性インパルス」は、ポリマーの単一ユニットのみの構造的特徴についての情報を伝達または運搬する検出可能な物理量である。この物理量は、検出され得る任意の形態であり得る。例えば、この物理量は、電磁放射、化学的コンダクタンス、電気的コンダクタンスなどであり得る。このポリマー依存性インパルスは、エネルギー移動、クエンチング、コンダクタンスの変化、機械的変化、抵抗変化、または任意のその他の変化から生じ得る。このポリマー依存性インパルスは、特定のユニットに特異的であるが、１つより多くの特定の標識されたユニットを有するポリマーは、１つより多くの同一のポリマー依存性インパルスを有する。さらに、特定タイプの各ユニットは、それらが異なる標識を有する場合、異なるポリマー依存性インパルスを生じ得る。

ポリマー依存性インパルスを検出するために用いられる方法は、生成される物理量のタイプに依存する。例えば、物理量が電磁放射である場合、ポリマー依存性イパルスは、光学的に検出される。本明細書で用いられるとき、「光学的に検出可能な」ポリマー依存性インパルスは、光検出造影システムによって検出され得る電磁放射の形態にある光を基礎にしたシグナルである。この物理量が化学的コンダクタンスであるとき、このポリマー依存性インパルスは、化学的に検出される。「化学的に検出される」ポリマー依存性インパルスは、化学的コンダクタンスを測定するための標準的な手段によって検出され得るイオンコンダクタンスのような化学的濃度または電荷における変化の形態にあるシグナルである。この物理量が電気的シグナルである場合、このポリマー依存性インパルスは、抵抗または静電容量における変化の形態にある。

本明細書で用いられるとき、「ポリマーの関連性」は、そのポリマーに特有であるポリマーの特徴的パターンを識別することにより決定され得る。例えば、ポリマーが核酸である場合、このポリマー内の１０の連続するヌクレオチドの実質的に任意の配列が、その核酸分子の特有の特徴であり得る。１０ヌクレオチドの同じ配列を示すその他の任意の核酸分子は、関連するポリマーであり得る。

「複数のポリマー」は、少なくとも２つのポリマーである。好ましくは、複数のポリマーは、少なくとも５０のポリマーであり、そしてより好ましくは、少なくとも１００のポリマーである。

このポリマー依存性インパルスは、ポリマーについての任意のタイプの構造情報を提供し得る。例えば、これらのシグナルは、ポリマーの全配列の全部または一部、ポリマー依存性インパルスの順序、またはユニット間の距離の指標としてのポリマー依存性インパルス間の分離の時間を提供し得る。

このポリマー依存性インパルスは、ポリマーのユニットとシグナル生成ステーションにおける環境との間で生じる相互作用よって得られる。本明細書で用いられるとき、「シグナル生成ステーション」は、ユニットが環境と相互作用し、ポリマー依存性インパルスを生成する領域であるステーションである。本発明のいくつかの局面では、このポリマー依存性インパルスは、規定された領域における、電磁放射、クエンチング源、および蛍光励起源からなる群から選択される因子との、上記ユニットと相互作用し得、検出可能なシグナルを生成する接触から生じる。その他の局面では、ポリマー依存性インパルスは、分子との相互作用に応答してコンダクタンスにおける特異的変化を行い得る化学的環境との規定された領域における接触から生じる。特定構造をもつ分子は、化学的環境と相互作用するとき、コンダクタンスの変化が生じる。この特定構造に特異的であるこの変化は、一時的変化であり得、例えば、コンダクタンスが変化するために必要な時間の長さは、この相互作用が特定構造または物理的変化を含むことの指標であり得る。例えば、この相互作用の強度における変化は、特定構造との相互作用の指標であり得る。その他の局面では、ポリマー依存性インパルスは、ポリマーユニットに隣接して位置決めされる微小電極またはナノ電極間のユニットの移動によって引き起こされる静電容量または抵抗における変化から生じる。例えば、シグナル生成ステーションは、ポリマーユニットの対向する側面上に位置決めされる微小電極またはナノ電極を含み得る。これら電極を超えるユニットの移動の結果として生じる抵抗またはコンダクタンスの変化は、特定ユニットに特異的である。

２つの個々のユニット間の距離を決定するための方法がまた本発明に包含される。連結ユニットのポリマーの２つの個々のユニット間の距離を決定するために、ポリマーは、シグナル生成ステーションに対して直線的に通過させられ、そして２つの個々のユニットの各々がシグナル生成ステーションによって通過されるときに生成されるポリマー依存性インパルスが測定される。次いで、このステップの各々が複数の同様のポリマーについて繰り返される。ポリマーの各ユニットがシグナル生成ステーションによって連続的に通過されるとき、ポリマーは、シグナル生成ステーションに対して線形的に通過するといわれる。

ステップの各々が、複数の同様のポリマーについて繰り返され、データセットを生成する。２つの個々のユニット間の距離が、次いで、データセットを分析することにより複数の類似のポリマーから得られる情報に基づき決定され得る。

この方法はまた、標識を含むポリマーの量を識別するための方法を含む。例えば、サンプル中の特定ユニットまたはユニットの組み合わせを有するポリマーの数を決定することが可能である。ｍＲＮＡサンプルにおいては、例えば、サンプル中に存在する特定のｍＲＮＡの数が決定され得る。これは、所望のｍＲＮＡ分子のパターンまたはサイン特徴を識別することにより達成され得る。ＲＮＡのサンプルは、次いで、本発明の方法に従って分析され得、そして特定のパターンまたはサインを有するｍＲＮＡの数が決定され得る。

現在、ヒトゲノムの５％より少ない部分が配列決定されている。これは、すべての個体の配列である、ヒト配列知識における理想の小フラクションに翻訳される。例えば、ヒト集団について、１．４×１０^１９（５０億の人々×３．×１０^９塩基／ヒト）がある。今のところ、ヒト遺伝子情報の２×１０^−１０％のみが知られている。すべての全世界的努力によるヒトゲノムの配列決定の速度は、粗く、＞＄１／塩基のコストで、３×１０^９／１５年、または５５０，０００塩基／日である。本明細書に記載の本発明の方法による配列決定は、配列決定の速度における通常でないブレークスルーを構成する。一人のヒトゲノムを１つの機械で終了するための推定時間は、約１５時間である。パラレルのいくつかの動的アレイは、一時間以内で一人のヒトゲノムの配列を終了し得る。

連結ユニットのポリマーを配列決定する方法もまた、本発明によって包含される。この方法は、ポリマーの各々の少なくとも一部分がポリマーの他の部分と同一の連結ユニットの配列を有する、複数の重複するポリマーの各々からポリマー依存性インパルスを得ること、およびこのポリマー依存性インパルスを比較し、複数のポリマー中で同一である連結ユニットの配列を得ることにより達成される。

複数の重複するポリマーは、各ポリマーが、他のポリマーと同一である連結ユニットのその配列の少なくとも一部分を有するポリマーのセットである。同一である配列の部分は、重複領域と称され、そしてそれは、少なくとも１０の連続するユニットを含む。

本発明の別の局面では、連結ユニットのポリマーのユニットの順序が、このポリマーを、シグナル生成ステーションに対して直線的に移動させること、および各々が特徴的なポリマー依存性インパルスを生じる２つの個々のユニットの各々が、シグナル生成ステーションによって通過されるとき生成されるポリマー依存性インパルスを測定することによって決定され得る。これらのステップは、複数の類似のポリマーについて繰り返され、そして少なくとも２つの個々のユニットの順序が、これら複数の類似のポリマーから得られた情報を基に決定される。

一セットのポリマー（ここで、このセットのうちのこれらのポリマーの各々は、連結されたユニットの別個のポリマーである）を分析する方法は、本発明によって包含される。本方法は、ポリマーのセットを互いに平行に配向させる工程、およびそのポリマーのポリマー特異的な特徴を検出する工程を包含する。

ポリマーのセットは、互いに平行に配向される。これらのポリマーは、それらのポリマーを互いに平行に配向させ得る任意の手段によって、配向され得る。例えば、電場は、それらのポリマーを平行形態で配向させるために、適用され得る。好ましくは、この配向工程は、溶媒を含まないゲル中である。

本明細書中で使用される場合、「ポリマー特異的な特徴」は、その配列（ｓｅｑｕｅｎｃｅ）に関係する、ポリマーの任意の構造的特徴である。例えば、ポリマー特異的な特徴としては、ポリマーについての情報（例えば、ポリマーの長さ、ポリマー中に連結されるユニットの順序、ポリマーのうちのユニットの間の距離、ポリマー中のユニットの近接性、ポリマーのうちの１つのユニット、いくつかのユニットまたは全てのユニットの配列、およびポリマーの存在）が挙げられ得るが、これらに限定されない。

１つより多くの物理的特徴を標識中に含むことによって、同じ時間枠内での核酸の同時的かつ反復した読み取り物は、１つの物理的特徴のみが含まれる場合より、標識されたヌクレオチド位置についてのより正確かつ迅速な情報を提供し得る。このサンプルは、例えば、異なる波長の発蛍光団で標識され得る。この発蛍光団の各々は、同じサンプル由来の別個の読み取り物を提供するよう、別々に検出され得る。例えば、ポリマーのユニットの終端は、第１の波長を放射する発蛍光団で標識され得、そして１セットの内部ユニットは、第２の波長を放射する発蛍光団で標識され得る。このポリマーがシグナルステーション（ｓｉｇｎａｌｓｔａｔｉｏｎ）を通って移動される場合、両方の波長は、検出されて、両方のセットの標識についての情報を提供し得る。

本発明の方法についての１つの使用は、ポリマー内のユニットの配列を検出することである。ポリマー（例えば、核酸）のユニットの配列を同定することは、そのポリマーの機能を理解すること、および生理学的環境（例えば、細胞または組織）におけるポリマーの役割を決定することにおいて、重要な工程である。現在使用される配列決定方法は、遅くかつ面倒である。本発明の方法は、ずっと迅速であり、そして非常に短い時間期間において、ずっと多くの配列データを調製する。

検出可能なシグナルは、シグナルステーションで形成される。本明細書中で使用される場合、「シグナルステーション」は、検出されるべきポリマーの一部分（例えば、標識されたユニット）が曝されて、シグナルを形成する領域である。このステーションは、気体を含めた任意の物質からなり得る。好ましくは、このステーションは非液体物質である。「非液体物質（ｎｏｎ−ｌｉｑｕｉｄ）」は、当該分野における通常の意味を有する。液体は、構成分子のそれらの間での自由な移動によって特徴付けられるが分離する傾向を有さない、非固体性、非気体性の物質である。別の好ましい実施形態において、このステーションは固体物質である。

シグナルステーションは、相互作用ステーションである。本明細書中で使用される場合、「相互作用ステーションまたは相互作用部位」は、ポリマーの標識されたユニットが、因子と相互作用する領域であり、そして相互作用性の近接にある因子に関して位置決めされる。本明細書中で使用される場合、「相互作用性の近接」は、そのユニットとその因子とが相互作用し得る、十分な近接にあることを意味する。例えば、発蛍光団のための相互作用ステーションは、それらが十分近くにあってその結果それらがエネルギー的に相互作用してシグナルを形成する領域である。

好ましい実施形態における相互作用ステーションは、分子モーターまたは支持体に結合した、局在化された因子（例えば、アクセプター発蛍光団）が、分子モーターを通り抜けてポリマーと相互作用し得る、分子モーターの領域である。ポリマーが因子の局在化領域を通る位置が、相互作用ステーションである。各々の標識されるポリマーのユニットが因子のそばを通る場合、検出可能なシグナルが形成される。因子は、種々の方法でチャネルの領域内に局在化され得る。例えば、因子は、ポリマーが分子モーターと相互作用する部位で、直接的またはリンカーによって分子モーターに対して物理的に結合され得る。あるいは、ポリマーの全てのユニットが通る支持体の領域に因子が結合されるかぎり、分子モーターは支持体に結合され得、そして因子もまた支持体に結合され得る。例えば、因子は、チャネルの壁を形成する物質中、またはその物質の表面上に包埋され得、ここで、この分子モーターは壁に結合しそしてポリマーをそのチャネルを通って移動させる。あるいは、因子は、分子モーターまたは支持体から離れて位置付けられるが、波長ガイドを通るチャネルの領域に対して直接的に光を移送し得る光供給源であり得る。本発明のこれらの実施形態および他の関連の実施形態は、以下により詳細に考察される。ポリマーの移動は、ポリマーを導くための溝（ｇｒｏｏｖｅ）またはリング（ｒｉｎｇ）の使用によって補助され得る。

相互作用ステーションを形成するための他の手はずは、本発明によって包含される。例えば、ポリマーは、壁の表面に繋留されるかまたは壁の中に包埋される分子モーターを通過され得、これによって特定の位置に、好ましくは近接の因子に対して相互作用可能に近接して、連続してポリマーの標識化ユニットを運び、これによって相互作用ステーションを規定する。分子モーターは、ポリメラーゼ、ヘリカーゼ、またはアクチンのような、ポリマーと相互作用する化合物および各々の標識化ユニットを通ってポリマーの長さに沿って移送される化合物である。同様に、ポリマーは移動から捕捉され得、そして読み取り機はポリマーに沿って移動し得、この読み取り機は分子モーターでありそしてその分子モーターに因子を結合させている。

相互作用ステーションでポリマーの標識化ユニットと相互作用する因子は、電磁放射線、消光性（ｑｕｅｎｃｈｉｎｇ）供給源、および蛍光励起供給源からなる群より選択される。本明細書中で使用される場合、「電磁放射線」は、電磁波によって生じるエネルギーである。電磁放射線は、直接的な光供給源の形態であり得るか、またはこれは、光放射性化合物（例えば、ドナー発蛍光団）によって放射され得る。本明細書中で使用される場合、「光」は、可視、赤外および紫外を含む、任意の波長の電磁エネルギーを含む。

本明細書中で使用される場合、消光性供給源は、光放射供給源の特性を変更するかまたは変更し得る、任意の実体である。変更される特性としては、蛍光持続時間（ｌｉｆｅｔｉｍｅ）強度、スペクトル、蛍光、またはりん光が挙げられ得る。

本明細書中で使用される場合、蛍光励起供給源は、蛍光発光し得るかまたはフォトンの放射（すなわち、電磁放射線、指向された電場、温度、蛍光、放射線、シンチレーション、物理的接触、または機械的崩壊）を起こし得る、任意の実体である。例えば、標識されたユニットが放射性化合物で標識される場合、放射活性の放射は、因子の分子励起を引き起こし、このことは、蛍光発光を生じるシンチレーションの層である。

ポリマーの標識されたユニットが因子に曝される場合、これらの二者の間の相互作用はシグナルを生じる。このシグナルは、ポリマーについての情報を提供する。例えば、タンパク質ポリマーのうちの特定型のすべての標識されたユニット（例えば、全てアラニン）が特定の光放射性化合物で（内因性または外因性）標識される場合、この光放射性化合物のシグナル特性が因子との相互作用の際に検出されるときに、このシグナルは、アラニン残基がポリマー上のその特定の位置に存在することを表す。各々の型の標識されるユニット（例えば、各々の型のアミノ酸）が別個の光放射パターンを有する異なる光放射化合物で標識される場合、各々のアミノ酸は因子と相互作用して別個のシグナルを生じる。ポリマーの各々の標識されたユニットに対する各々のシグナルが何であるかを決定することによって、ユニットの配列が決定され得る。

標識されたユニットと因子との間の相互作用は、種々の形態をとり得るが、標識されたユニットと因子とが物理的に互いに接触することを必要としない。相互作用の例は、以下の通りである。第１の型の相互作用は、電磁放射線である因子および光放射性化合物であるポリマーの標識されたユニット（光放射性化合物で内因性に標識されるかまたは外因性に標識されるかのいずれか）を含む。光放射性標識化ユニットが（例えば、適切な波長のレーザー光線によるか、またはドナー発蛍光団から放射された電磁放射線による）電磁放射線と接触する場合、この電磁放射線は、光放射性化合物に特定の波長の電磁放射線を放射させる。次いで、シグナルが測定される。このシグナルは、光放射の特徴的なパターンを提示し、そしてこれによりポリマーの特定の標識されたユニットが存在することを示す。この場合において、ポリマーの標識されたユニットは、「光放射性化合物からの電磁放射線の放射に検出可能に影響を与える」と言われる。

第２の型の相互作用は、蛍光励起供給源である因子、および光放射性化合物または放射性化合物であるポリマーの標識されたユニットを含む。光放射性標識化ユニットが蛍光励起供給源と接触する場合、この蛍光励起供給源は、光放射性化合物に特定の波長の電磁放射線を放射させる。放射性標識化ユニットが蛍光励起供給源と接触する場合、その標識化ユニットから放射された放射線は、蛍光励起供給源に特定の波長の電磁放射線を放射させる。次いで、このシグナルが検出される。

これらの型の種々の相互作用は、相互作用の第３の要素、シグナル形成に関与する近位の化合物の存在を含む。例えば、標識されたユニットは、ドナー発蛍光団である光放射性化合物で標識され得、そして近接化合物は、アクセプター発蛍光団であり得る。光放射性化合物が励起状態に置かれ、そしてアクセプター発蛍光団に近位に運ばれる場合、ドナーとアクセプターとの間にエネルギー転移が起こり、光放射性である標識されたユニットの存在の測定として検出され得るシグナルを生じる。光放射性化合物は、これを光（例えば、レーザー光）に曝すことによるかまたはこれを蛍光励起供給源に曝すことによって、「励起」状態に置かれ得る。

別の相互作用は、消光性供給源である近位の化合物を含む。この例において、光放出性標識化ユニットは、これを光に曝すことによって電磁放射線を放射させられる。光放射性化合物が消光性供給源に近位に置かれる場合、光放出性標識化ユニットからのシグナルは、変更される。

上記の相互作用に対して並列の相互作用のセットは、本明細書中に作出され得るが、光放射性化合物は、近位の化合物であり、そして標識されたユニットは、消光性供給源であるかまたはアクセプター供給源であるかのいずれかである。これらの例において、因子は近位の化合物によって放出される電磁放射線であり、そしてシグナル（標識されたユニットとこのような放射との間の相互作用の特徴）は、標識されたユニットを近位の化合物と相互作用可能に近位に運ぶことによって生じる。

これらの相互作用の各々が検出可能なシグナルを形成するメカニズムは、当該分野で公知である。例示的な目的のために、ドナー発蛍光団とアクセプター発蛍光団とが本発明に従って相互作用するメカニズムは検出可能なシグナルを形成し、このことはこの型の相互作用からの結果であることが知られる実施上の制限を含み、そしてこのような制限を軽減または除外する方法は、以下に記載される。

本発明の分析の別の好ましい方法は、放射能標識されたポリマーの使用を含む。放射能性の放射の型は、使用される検出デバイスの型に影響する。一般的に、α放射、β放射およびγ放射を含む、３つの異なる型の核の放射が存在する。α放射は、物質における過度のイオン化を引き起こし、そしてイオン化チャンバおよび比例計数管による個々の計数測定を可能にするが、さらに興味深いことに、物質と相互作用するα放射はまた、分子励起を引き起こし得、このことは結果として蛍光発光を引き起こし得る。この蛍光発光は、シンチレーションといわれる。α崩壊より弱いβ崩壊は、増幅されて適切なシグナルを生じ得る。γ放射は、励起エネルギーの内的転換から起こる。γ線のシンチレーション計数測定は有効であり、そして強力なシグナルを形成する。ヨウ化ナトリウム結晶は、入射のγ放射で蛍光発光する。

本明細書中で使用される場合、「シンチレーション」相または「シンチレーション」物質は、放射線による励起に応答して蛍光発光するかまたは光を放射する、任意の型の物質である。シンチレーション物質は、当該分野で周知である。共鳴構造を有する芳香属性炭化水素は、優れたシンチレーターである。アントラセンおよびスチルベンは、このような化合物の範疇に帰する。無機結晶もまた、蛍光発光することが知られる。これらの化合物が発光するためには、無機結晶は少量の不純物を有さなければならず、これらは、価電子帯と伝導帯との間のエネルギーレベルを作出する。従って、励起および脱離励起（ｄｅｅｘｃｉｔａｔｉｏｎ）が起こり得る。多くの場合において、この脱離励起は、リン光性フォトン放射を通して起こり得、これは長持続性の検出へと導く。いくつかの通常のシンチレーターとしては、ＮａＩ（Ｔｉ）、ＺｎＳ（Ａｇ）、アントラセン、スチルベンおよび人工のリン光団（ｐｈｏｓｐｈｏｒ）が挙げられる。

放射線を測定する多くの方法は当該分野で公知であり、そしてこれら方法としては、以下が挙げられる：霧箱デバイスおよび泡箱デバイスのようなデバイス、定電流イオンチャンバ、パルス計数器、ガス計数器（すなわち、Ｇｅｉｇｅｒ−Ｍｕｌｌｅｒ計数器）、固体状態検出器（表面障壁検出器、リチウム拡散検出器、内在性（ｉｎｔｒｉｎｓｉｃ）ゲルマニウム検出器）、シンチレーションカウンタ、チェレンコフ（Ｃｅｒｅｎｋｏｖ）検出器、など。

放射標識されたポリマーの分析は、シグナルを生じる他の手段と同じである。例えば、放射標識されたＡを有するサンプルは、サンブルＤＮＡ上のＡの相対的な間隙形成を測定するためのシステムにより、分析され得る。放射性シグナルの検出の間の時間は、分析されるポリマーに特徴的である。標識されたＤＮＡの４つの集団（Ａ、Ｃ、Ｇ、Ｔ）の分析は、分析される核酸の配列を生じ得る。ＤＮＡの配列はまた、二重標識されたＤＮＡおよび単一標識されたＤＮＡの組み合わせの分析を含む、より複雑なスキームで分析され得る。Ａ（ａ）およびＣで標識されたフラグメントの分析、その後のＡ（ａ）で標識されたバージョンの同一フラグメントの分析は、ＡおよびＣの位置の知見を生じる。この手順が相補鎖に対して繰り返される場合に、この配列が知られる。この系はさらに、ポリマー（ポリペプチド、ＲＮＡ、炭水化物など）、大きさ、濃度、型、同一性、存在、配列および数の分析に対して使用され得る。

上記の方法は、単独のポリマーまたは１つより多くのポリマーについて実施されて、そのポリマーについての構造情報を決定し得る。

本明細書中で使用される場合、「検出可能なシグナル」は、慣用的な技術によって意味づけられ得る、任意の型の電磁放射線シグナルである。形成されるシグナルは、位置の型、ならびに標識されたユニットおよび存在する場合に近位の化合物に、依存する。１つの実施形態において、シグナルは、ポリマーの（内因性または外因性に）標識されたユニットによるか、または近位の化合物による光放射から結果として生じる電磁放射線である。別の実施形態において、シグナルは、シンチレーション相との放射能放射の相互作用から結果として生じる蛍光発光である。検出されたシグナルは、分析のためデータベースに記憶され得る。記憶されたシグナルを分析するための１つの方法は、別のポリマーからのシグナルのパターンと記憶されたシグナルを比較して、これら２つのポリマーの関連性を決定することによる。検出されたシグナルを分析するための別の方法は、既知のポリマーに特徴的である既知のパターンのシグナルと、検出されたシグナルを比較して、既知のポリマーに対して分析されたポリマーの関連性を決定する。シグナルの比較は、以下により詳細に考察される。

１つより多くの検出可能シグナルが検出され得る。例えば、第１の別個に標識されたユニットは、因子と相互作用して、第１の検出可能なシグナルを形成し得、そして第２の別個の標識されたユニットは、因子と相互作用して、第１の検出可能なシグナルとは異なる第２の検出可能なシグナルを形成し得る。このことは、１つより多くの型の標識されたユニットが、単独のポリマー上で検出されることを可能にする。

一旦シグナルが形成されると、次いでこのシグナルは検出され得る。特定の型の検出手段は、標識されたユニットと因子との間に起こる相互作用の型に当然依存する、形成されるシグナルの型に依存する。本発明の方法に関与する多くの相互作用は、電磁放射線シグナルを形成する。電磁放射線シグナルを検出するための多くの方法が当該分野で公知であり、これら方法としては、二次元および三次元の画像処理システムが挙げられる。これらのシステムおよび他のシステムは、ＰＣＴ出願ＷＯ９８／３５０１２ならびに米国特許第６，３５５，４２０号および同６，４０３，３１１号により詳細に記載される。

光学検出可能なシグナルが形成され、検出され、そしてデータベースに記憶されて、そしてこれらのシグナルが分析されてポリマーについての構造情報を決定し得る。コンピューターは、ポリマーについてのデータを収集するために使用される同一のコンピューターであっても、またはデータ分析に供される別個のコンピューターであってもよい。本発明を実行するのに適切なコンピューターシステムは、代表的に、ユーザーに情報を表示する出力デバイス、出力デバイスに連絡された中央ユニット、およびユーザーからの入力を受け入れる入力デバイスを備える。中央ユニットは一般的に、相互連絡機構を介してメモリシステムと連絡されたプロセッサを備える。入力デバイスおよび出力デバイスはまた、相互連絡機構を介して、プロセッサシステムおよびメモリシステムに連絡される。検出されたシグナルのデータ分析のためのコンピュータープログラムは、ＣＣＤ製造業者から容易に利用可能である。

本発明の方法は、ポリマーが分子モーター介して移動するにつれて、ポリマーの個々の標識されたユニットに対して特異的な検出可能なシグナルを形成する、任意のデバイスを使用して達成され得る。この型の分析を可能にする１つの型のデバイスは、分子モーターを使用して、相互作用ステーションを通るポリマーの直線的な移動を促進するデバイスであり、ここで、この相互作用ステーションは、電磁放射線供給源、消光性供給源、発光フィルム相、および蛍光発光励起供給源からなる群より選択される因子を含む。好ましくは、この因子は分子モーターに十分近くにあり、そして光放射化合物および分子モーターによって移動される消光物質（ｑｕｅｎｃｈｅｒ）からなる群より選択されるパートナー化合物と、検出可能に相互作用するのに十分な量で存在する。

好ましくは、分子モーターは支持体に繋留される。本明細書中で使用される場合、「支持体」は、任意の固体表面（例えば、スライドまたはビーズ）であるが、半固体物質（例えば、ゲルまたは脂質二重層）は含まない。

別の好ましい実施形態において、分子モーターもポリマーも支持体に繋留されない。この完全な方法は、上記されるような液体中で実施され得る。

別の実施形態において、分子モーターは、少なくとも１つのチャネルを有する壁物質に繋留され得る。この配置は、ポリマーが分子モーターによって移動されるにつれてこのポリマーを誘導するのに有用である。壁物質は、少なくとも１つのチャネルを支持し得る、任意の寸法の固体障壁または半固体障壁である。半固体物質は、自己支持性物質であり、例えば、ポリアクリルアミドゲルのようなゲル物質であり得る。例えば、壁物質は、単一の支持物質からなり得、これらは、導電性であっても非導電性であってもよく、光透過可能であっても光透過不能であってもよく、透明であっても不透明であってもよい。いくつかの例において、因子は、壁物質内に包埋される。これらの例において、壁物質は、非導電性相、光透過可能な層または透明な層から、単独でかまたは部分的に作られて、壁物質中に形成されるチャネルに対して因子が曝されることを可能にして、シグナル形成を可能にする。壁物質がこれらの物質から僅かに部分的に作られる場合、残りの壁物質は、導電性相、光透過不能である層、または不透明層から作られ得、これらは、シグナル形成を妨げる。いくつかの場合において、壁物質は、異なる物質の層から作り上げられる。例えば、壁物質は、１つの導電性相および１つの非導電性相から作られ得る。あるいは、壁物質は、２つの導電性相に囲まれた、１つの非導電性相から作られ得る。複数の層および物質の種々の組み合わせは、本発明の壁物質に包含される。

因子は、この実施形態において壁物質に繋留され得るか、またはこれは分子モーターに繋留され得る。

本明細書中で使用される場合、「発光フィルム相」は、本質的に発光性であるか、または励起もしくは照明のうちのいくつかの手段によって発光性にされる、フィルム（例えば、電気光学フィルム箔および内部反射により照射された高指数フィルム）である。

本明細書中で使用される場合、「物質遮蔽」は、エネルギー転移または消光を防止するかまたは制限する、任意の物質である。このような物質としては、導電性物質、高指数物質、および光透過不能物質が挙げられるが、これらに限定されない。好ましい実施形態において、物質遮蔽は、導電性の物質遮蔽である。本明細書中で使用される場合、「導電性物質遮蔽」は、ドナー供給源とアクセプター供給源との間のエネルギー転移を防止するのに少なくとも十分に導電性である物質である。

本明細書中で使用される場合、「導電性物質」は、ドナーとアクセプターとの間のエネルギー転移を防止するのに少なくとも十分に導電性である物質である。

本明細書中で使用される場合、「非導電性物質」は、ドナーとアクセプターとの間のエネルギー転移を可能にする量より少ない量を伝導する物質である。

本明細書中で使用される場合、「光透過可能な物質」は、使用される特定の電磁放射線、消光性供給源、または蛍光発光励起供給源によって形成される波長の光に対して透過可能である物質である。

本明細書中で使用される場合、「光透過不能な物質」は、使用される特定の電磁放射線、消光性供給源、または蛍光発光励起供給源によって形成される波長の光に対して透過不能である物質である。

本明細書中で使用される場合、「チャネル」は、ポリマーが通過し得る、媒体を通る通路である。チャネルは、ポリマーがこれを通過し得る限り、任意の寸法を有し得る。例えば、チャネルは、非分枝性の直線的な円筒形のチャネルであり得るか、またはチャネルは内部連絡された曲がりくねったチャネルの分枝性のネットワークであり得る。好ましくは、チャネルは直線的なナノチャネルかまたはマイクロチャネルである。本明細書中で使用される場合、「ナノチャネル」は、ナノメートルのオーダーの寸法を有するチャネルである。ナノチャネルの平均径は１ｎｍと９９９ｎｍとの間である。本明細書中で使用される場合、「マイクロチャネル」は、マイクロメートルのオーダーの寸法を有するチャネルである。マイクロチャネルの平均径は、１ｍｍと１ｍｍとの間である。本発明に従う、有用なチャネルの好ましい仕様および寸法は、以下に詳細に記載される。好ましい実施形態において、チャネルは壁の中に固定される。

因子は、壁物質または分子モーターのチャネルを通過しているパートナー光放射性化合物でエネルギー転移を受けるかまたは消光することによってパートナー化合物と検出可能に相互作用する様式で、壁物質または分子モーターに取り付けられる。パートナー化合物と相互作用するため、因子はチャネルにすぐ近位に置かれ得る。例えば、因子は、チャネルの内側に取り付けられ得るか、壁物質の外部表面に取り付けられ得るか、チャネルの円周を取り囲む壁物質の外表面の集中した領域に取り付けられ得るか、壁物質内に包埋され得るか、チャネルを取り囲む壁物質の中に密集した輪の形態で包埋され得るか、分子モーターの局在した領域に取り付けられ得るか、または分子モーターの表面上に取り付けられ得る。必要に応じて、因子は、壁物質もしくは分子モーターの表面全体を覆い得るか、またはこれら全体にわたって包埋され得る。因子が局在されない場合にシグナル形成を向上させるために、マスクを使用して壁物質または分子モーターのいくつかの領域を覆い得、その結果、因子の局在される領域のみが曝される。本明細書中で使用される場合、「マスク」は、任意のサイズまたは形状の開口を有する物体（ｏｂｊｅｃｔ）である。１つより多くの因子が壁物質またはモーターに取り付けられて、因子がパートナー因子に曝される場合に異なるシグナルを形成し得る。

因子は、当該分野で公知の取り付けを実施する任意の手段によって、壁物質または分子モーターの表面に取り付けられ得る。生体材料を結合体化するための方法の例は、Ｈｅｒｍａｎｓｏｎ，Ｇ．Ｔ．，ＢｉｏｃｏｎｊｕｇａｔｅＴｅｃｈｎｉｑｕｅｓ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃ．，ＳａｎＤｉｅｇｏ，１９９６に提示される。

因子が壁物質または分子モーターの表面に取り付けられる場合、壁物質もしくは分子モーターに直接的に取りつけられ得るか、またはリンカーを介して取りつけられ得る。因子の取り付けに関して本明細書中で使用される場合、「リンカー」は、壁物質または分子モーターに対して光放射性化合物または消光性化合物を繋留する分子である。リンカーは、当該分野で周知である。これらとしては、ヘテロまたはホモの両機能性リンカーが挙げられる。通常使用されるリンカーとしては、種々の長さのアルカンが挙げられる。

因子は、パートナーの光放射性化合物と検出可能に相互作用するのに十分な量で、壁物質または分子モーターに取り付けられる。本明細書中で使用される場合、「パートナー光放射性化合物」は、上記の通りであるが、因子の直ぐ近位に置かれる場合に特異的に相互作用しそしてエネルギー転移または消光を受ける、光放射性化合物である。パートナー光放射性化合物の量および必要とされる因子の量は、使用される因子および光放射性化合物の型に依存する。

本明細書中で使用される場合、「複数のステーション」は、少なくとも２つのステーションである。好ましくは、複数のステーションは少なくとも３つのステーションである。別の好ましい実施形態において、複数のステーションは少なくとも５つのステーションである。

ＰＣＴ出願ＷＯ９８／３５０１２および米国特許第６，３５５，４２０号は、プレート内に包埋された発蛍光団を有するナノチャネルプレートの最適な設計の詳細な記載、および本発明の方法を実施するために有用な他の物品を提供する。しかし、本発明の方法は、本明細書中または優先のＰＣＴ出願に記載された製造業者の物品の使用に限定されない。これらの例示は、説明目的のためにだけに提供される。本発明の方法は、ポリマーの複数の標識されたユニットが固定されたステーションに関して移動され得、そしてシグナルが得られ得る任意の系を使用して、実施され得る。

分子モーターと共に有用である上記のナノチャネルの各々は、単なる一例である。従って、任意の１つの要素または要素の組み合わせを含むこれら実施形態に関して記載される各々の制限が各ナノチャネル内に含まれ得ることが、予想される。物質を異にする複数の層を有するフィルムの調製は、当該分野で記述されている（例えば、米国特許第５，４６２，４６７号、Ｆｅｒｒｅｉｒａら、ＴｈｉｎＳｏｌｉｄＦｉｌｍｓ、２４４；８０６−８０９、１９９４）。

（実施例１．眼の色についての遺伝子座を決定する方法。）
単一分子遺伝子分析を使用した集団分析のためのＤＮＡプール化の一般的な概要は、図１０に示される。具体的な実施例として、集団からのＤＮＡがプールされ、ポリメラーゼ連鎖反応（ＰＣＲ）を使用して遺伝子座を増幅し、ハプロタイプについて蛍光的にタグ化し、洗浄し、一つの分子分析器／ナノチップ構成に導入する。使用するスキーマの簡単な記載は、４つのプライマー伸長された塩基の４色の単一分子分析を使用しているハプロタイプ分析のために記載されている。この特定の実施形態では、プライマー伸長反応が、４つの異なって標識されたｄＮＴＰとともに使用される。各々のｄＮＴＰは、異なるスペクトルで識別可能な蛍光団を有する。この特定の場合において、さまざまな色の組合せの一致する検出が分析される。

このシナリオにおいて、４色スペクトル区別を可能にする一対のＳＮＰを用いて、４色分析の使用は、４つの塩基の明白な区別を容易にする。この様式において、４つのハプロタイプの各々は、ユニークな色の組合せで決定される。分析からの結果データは、集団の特定のハプロタイプの有無の決定を可能にする。ＰＣＲ分析は、集団からのＤＮＡを全て増幅し、そして、個々のハプロタイプを計数する能力は、どのハプロタイプがその集団に存在するか、および違いが存在し得る場所の決定を生じる。単一分子分析なしで、タグ付けおよびプールのスキーマは、ハプロタイプの適切な決定を可能にしない。プールされたＤＮＡからのバルク蛍光が測定される場合、集団の各々で、分析のために使用される４つの色が存在し、そして、個々のハプロタイプは、決定され得ない。この実施例のためのサンプルデータ出力は、また、図１０に示される。

ＤＮＡのプールされた集団のデータ出力から、問題の表現型の原因となるハプロタイプを決定し得る。この場合、２つの集団間のハプロタイプの有無の違いは、ハプロタイプＤである。眼の色について、このハプロタイプＤは、存在するならば、茶色の眼の色を与える優性対立遺伝子を認識する。このプール方法は、このように極めて強力で、簡単なプール化、反応および分析手順を使用して、集団の関係を可能にする。

（実施例２．プール化：ロングＰＣＲ、タグ付け、線形分析。）
ケースおよびコントロールからのＤＮＡは、それぞれプールされる。次いで、２つの反応混合物を、１５キロベースの長さである反応産物を生成するためにロングＰＣＲを使用して増幅する。次いで、各々の反応産物を、ＰＣＲ産物の長さに沿って、４つの異なるＳＮＰでタグ化する（図１１）。タグ化は、蛍光タグ化オリゴヌクレオチドを使用して達成される。オリゴヌクレオチドは、目的のＳＮＰに標的化され、そして同じ色の蛍光団でタグ化される。次いで、ＰＣＲ産物は、ナノチャネルシステムに導入される。ナノチャネルシステムにおいて、蛍光タグ化されたＤＮＡを、ナノチャネルシステムに導入し、そして流体力学的に小さいナノメートルサイズのチャネルに通される。チャネルの収縮によって、ＤＮＡが伸長されて、線形様式で読み取られ得る。線形分析は、このように分子の集団に存在するハプロタイプの決定を可能にする。ナノチャネルシステムを通過する各々の分子に起因する分子のサインは、集団における１つの特定のハプロタイプを表す。以下の図は、プール化、ＰＣＲおよび線形分析を用いたハプロタイプ分析法のプロセスを概略的に例示する。

（実施例３．プール化：配列特異的蛍光タグ化、単一分子分析。）
この特定の例では、集団からのＤＮＡは、プールされ、そして、ＤＮＡは、予めの増幅なしで蛍光的に直接タグ化され、それから単一分子分析のために反応チャンバに導入される（図１１）。この場合、ＤＮＡは、配列特異的プライマーのプライマー伸長を使用して、２つの異なるＳＮＰ部位で、タグ化される。問い合わせられる各々の部位で、異なる組合せを有する４つの可能性のあるハプロタイプが、存在する。このように、表現型の違いと相関している特定のハプロタイプの有無は、付随するハプロタイプを規定する。

（実施例４．ＤＮＡプール化：マイクロサテライトマーカーのＰＣＲ増幅、プールされたＤＮＡ集団の単一分子検出。）
この特定の実施例は、異なる型の情報と集団における表現型の違いとの相関を示す。マイクロサテライトマーカーは、ＰＣＲ増幅される。増幅されたマイクロサテライトマーカーの対立遺伝子は、異なる長さを有する。次いで、ＤＮＡは、インターカレータ分子当たり、セットの数の塩基対を認識する蛍光インターカレート色素で染色される。次いで、増幅されたマイクロサテライトマーカーの集団は、単一分子分析システムに導かれる。ＤＮＡの異なる長さは、さまざまなＤＮＡフラグメントの積分強度を使用して決定される。

（実施例５．ＤＮＡプール化、単一の短い６マータグを使用するタグ化、違いについてのプールされた集団データの分析。）
ゲノムの複数の部位を認識する単一の短い６マータグの使用は、配列の認識、ならびにまた多型、挿入および欠失の決定を可能にする。この実施例は、タグ化された配列が小さいゲノムを表し得る非増幅例を例示する。小さいゲノムのタグ化は、どんな違いが特定の実験に存在し得るかについての認識を可能にする。１つのそのような実験は、ゲノムにおける遺伝子挿入部位の認識を含み得る。次いで、表現型の違いの相関は、挿入される遺伝子の部位に対して一致され得る。

（実施例６．プライマー伸長実験の反応工程。）
プライマー伸長方法は、５つの工程に分けられる。（１）ゲノムＤＮＡサンプルからＤＮＡ上でロングＰＣＲを実行すること；（２）９５℃でＤＮＡを変性させること；（３）プライマー産物をハイブリダイズし、そして、蛍光標識されたｄＮＴＰの存在下で、それらを伸長すること；（４）セファデックススピンカラムを使用してサンプルを洗浄すること；ならびに（５）サンプルを多色単一分子光学式読み取り装置に導入すること。

この実験の分析は、最初から最後まで３時間のオーダーにあると推定される。ロングＰＣＲ工程は、分析の工程５において確認される。ここで、二重色産物の存在は、ロングＰＣＲ産物の両方が存在すること、およびハプロタイプが同様に存在することを示す。あるいは、ロングＰＣＲ産物は、リアルタイムＰＣＲまたはゲル電気泳動を使用して検査され得る。

ロングＰＣＲは、Ｃｈｅｎｇら、ＰＮＡＳ、９１：５６９５−５６９９，１９９４によって示されるように、２３キロベースまでの長さのＤＮＡ長を達成し得る。実施例プロトコルは、以下の通りである（Ｃｈｅｎｇら、ＰＮＡＳ、９１：５６９５−５６９９、１９９４）。ＰＣＲ増幅（５０μｌまたは１００μｌ）を、ＭｉｃｒｏＡｍｐ管を使用してＰｅｒｋｉｎ−ＥｌｍｅｒＧｅｎｅＡｍｐＰＣＲＳｙｓｔｅｍ９６００で行われた。全４つのｄＮＴＰは、０．２ｍＭであったが、他の成分は変動された。手動の「ホットスタート」のために、サンプルが約９０秒間７５〜８０℃であるまで、Ｍｇ^２＋を控えておき、次いで、２５ｍＭストックから添加した。サイクルは、以下の通りだった：９４℃で１０秒間の変性、変動する５〜２２分間の６８℃のアニーリングおよび伸長。１２〜１４分より長い時間の間、自動伸長特徴を使用して１サイクル当たり１５〜２０秒を加え、最終的に１６〜２２分になった。標的コピー数および長さに依存して、２５〜３８サイクルが使われた。大部分の実行（合計６−１０時間）は、９４℃で保持される最初の１０秒、および７２℃で保持する最後の１０分を含んだ。

（実施例７．実験計画（色、チップ考慮およびフォーマット）。）
光学セットアップの１つの実施例は、４色共焦点レーザーベースシステムを含む（図９）。レーザー入力は、スペクトル的に分離された色の励起および検出を可能にする波長の組合せである。本出願のために使用され得るレーザーの多くの可能な組合せが、存在する。例えば、アルゴンイオンレーザは４８８ｎｍ、ＨｅＣｄレーザー４４１ｎｍ、４０５ｎｍレーザー、５３２ダイオードレーザー、６３３ＨｅＮｅレーザー、マルチラインＡｒ：Ｋｒレーザー（ＵＶからＩＲまでのレーザー線を有する）で発する。実質的に、可視、ＵＶおよびＩＲスペクトルを通して、いかなるレーザー波長も、可能である。色素化学と適合する４レーザー波長の組合せが、サンプルの多色励起のために使われる。レーザー光線は、組み合わされて、レーザーが１００×１．４ＮＡ油浸潤物体である対物レンズを通して９０°の角度で反射され得る４色のダイクロイックミラーを通過する。試料チャンバは、例えば、フロースルーキャピラリー、カバースリップを有するガラススライド、マイクロチップ、またはサンプルの取扱いを可能にする他の適切な試料チャンバである。次いで、サンプルからの蛍光放射は、対物レンズによって向けられ、捕らえられ、マルチダイクロイックに通されて放射を４つのスペクトル的に異なった放射に分離する。信号は、装置の画像平面にあるファイバー結合アバランシェフォトダイオードによって捕らえられる。次いで、ＡＰＤから出力信号は、コンピュータによって集められて、適切に分析される。

（実施例８．単一ヌクレオチド多型およびハプロタイプの決定のためのＰＣＲ産物の多色単一分子検出の使用）
合成ＤＮＡテンプレートを構築し、そしてＡＢ、Ａｂ、ａＢおよびａｂと指定した（図１２、上側）。各々の対立遺伝子に特異的なＰＣＲオリゴを得、ここで、各々のオリゴの３’末端は、同族配列および最後から二番目の位置で一塩基のミスマッチに相補的な塩基を含んだ（配列番号１−４、図１２、下側）。短い連結を経て、３つの蛍光団（ＴＡＭＲＡ、Ｃｙ２またはＩＲＤ８００）のうちの１つに接合される５’末端を有する各々のオリゴが、化学的に合成された。増幅反応は、これらの蛍光オリゴ、およびＡ遺伝子座が多様でありかつＢ遺伝子座が一定に維持されるテンプレート（図１３）またはその逆（図１４）の組合せを用いて実施した。

ＰＣＲ産物の電気泳動的分析は、それらのテンプレートに対するオリゴの特異性を確認した：Ａ遺伝子座が多様である場合、ＴＡＭＲＡを、ＴＡＭＲＡ結合オリゴの３’末端がその同族のテンプレートに一致した場合のみ、ＰＣＲ産物に組み込まれた（図１５）。Ｂ遺伝子座が多様な場合に、同様の結果が得られた（図１６）。図１７に示すように、ＰＣＲ産物へのＴＡＭＲＡの組み込みは、ＰＣＲバンドのエチジウムブロミド（ＥｔＢｒ）強度によってＴＡＭＲＡ強度の量を除算することによってデンシトメトリーを使用して定量化された。これらのＴＡＭＲＡ指数は、ＰＣＲ反応の特異性を定量化するために、各々の識別的なＰＣＲ反応に対して算出された（図１８）。

ＧＥＮＥＥＮＧＩＮＥ^ＴＭ分析は、ＤＮＡテンプレートＡｂおよびａｂを使用して、識別的なＰＣＲ反応で実行された。これらの反応は、ｂ対立遺伝子に特異的なＣｙ５オリゴ、ならびにＡおよびａ対立遺伝子に特異的なＴＡＭＲＡオリゴまたはＩＲオリゴを含んだ（図１８を参照）。フリーなオリゴは、反応混合物をＳ４００ミニスピンカラムに通すことによって取り除かれた。ＴＡＭＲＡとＣｙ５との相関（左）またはＣｙ５とＴＡＭＲＡの相関（右）を、測定した（図１９）。予期した通りに、相関は、ＴＡＭＲＡオリゴおよびＣｙ５オリゴが適切な対立遺伝子と一致したＰＣＲ反応だけにおいて観察された。蛍光標識されたオリゴが単に混ぜ合わせられるときに、相関は観察されなかった。その４つのレーザーのうちの２つだけが利用されるときでさえ、ＧＥＮＥＥＮＧＩＮＥ^ＴＭがどのようにＤＮＡハプロタイプを決定するために使用され得るかを、この実験は、例示する。

上で記載されているアッセイは、固定されたＤＮＡ遺伝子座に連結されるＳＮＰを検出することによって、２つの反応で未知のＤＮＡサンプルのハプロタイピングを可能にする。５’遺伝子座の異なる対立遺伝子に特異的な２つの識別センスオリゴを、３’遺伝子座の異なる対立遺伝子に特異的な２つの識別アンチセンスオリゴと組み合わせることによって（それぞれは、例えば、ＧＥＮＥＥＮＧＩＮＥ^ＴＭによって検出される４つの蛍光団のうちの１と結合体化される）、所定のＤＮＡサンプルのハプロタイプは、単回のＰＣＲ反応において決定される。

（等価物）
特定の実施形態が詳細に本明細書において開示されたが、これは説明の目的のみのための例示の方法としてなされ、添付の特許請求の範囲の範囲に関して制限することを意図しない。特に、さまざまな置換、変更および改変が特許請求の範囲によって規定される本発明の精神と範囲から逸脱することなく、本発明になされ得ることが発明者によって企図される。例えば、プローブまたは標識タイプの選択は、本明細書において記載されている実施形態についての知識を有する当業者には慣用的な事項であると考えられている。他の局面、利点および改変は、添付の特許請求の範囲の範囲内であるとみなされる。

図１は、単一分子分析を使用するフラグメントハプロタイプ化の概略的な表示である。（１）標的ＤＮＡの増幅；（２）種々の対立遺伝子に独特なＤＮＡ配列に相補的な検出可能に標識化されたプローブのハイブリダイゼーション；（３）ＤＮＡ配列上の標識化部分および位置を検出するセンサーによる、伸長され、通過した標識化ＤＮＡの検出；（４）検出される標識の量およびそれが検出される位置を描写するセンサーからの読み出し。図２は、単一ヌクレオチド多型（ＳＮＰ）をハロタイプ化する際の長いＰＣＲおよび蛍光塩基の使用の概略図である。４つの異なるハロタイプが、４つの異なる色の組み合わせで標識される。この図において、異なる組み合わせが、Ｔ（太字）およびＣ（イタリック体）でハロタイプＡとして、Ｃ（イタリック体）でハロタイプＢとして；Ｔ（太字）でハロタイプＣとしてそしてハロタイプＤとして示される。図３は、図２に示されるＳＮＰについてのハロタイプ化方法の使用からのサンプルアウトプットである。ハロタイプＡは、チミジン（本明細書でＴとして示される）上の色１で、シトシン（本明細書でＣとして示される）およびインターカラント（ｉｎｔｅｒｃａｌａｎｔ）上の色２で、標識され得る。ハロタイプＢは、シトシン（本明細書でＣとして示される）およびインターカラント上の色２で、標識され得る。ハロタイプＣは、チミジン（本明細書でＴとして示される）およびインターカレント上で色１で、標識される。ハロタイプＤは、インターカレントで標識される。図４は、ＳＮＰをハロタイプ化するためのプライマー伸長４色分析方法を示す概略図である。この概略図において、Ｔは、第１の色（例えば、オレンジ（ＩＲ−長いダッシュ、続く短いダッシュで表される））、Ｃは、第２の色（例えば、赤（Ｒ−長いダッシュ線で表される））で標識され、Ａは、第３の色（例えば、緑（Ｇ−実線で表される））そしてＤＮＡは、第４の色（例えば、青（Ｂ））で標識されるインターカレーターで標識される。このアッセイは、図３で表される３色分析として設定される。図５は、蛍光標識されるｄＮＴＰの同じ混合物を使用する相補鎖をアッセイすることによる１つのＤＮＡ鎖についてのハロタイプ化結果の確認を表す概略図である。図６は、３つのＳＮＰ分析において存在する標識組み合わせを表す概略図である。Ｃは、色１（長いダッシュラインで表される）であり、Ｇは、色２（短いダッシュラインで表される）であり、Ｔは、色３（長いダッシュ、続く短いダッシュで表される）であり、そしてＡは、色４（実線で表される）である。図７は、図６のスキームと比べた場合、３つのＳＮＰをハプロタイプ化するためのより効果的な標識化スキームを表す概略図である。１つの可能性のある標識化スキームは、Ａであり、ＴおよびＧは、異なる蛍光物質で標識化され、ＳＮＰの二対立遺伝子特質（ｂｉａｌｌｅｉｃｎａｔｕｒｅ）は、８つの異なる、可能性のあるハプロタイプを、独特な色のスキームと合わせることを可能にする。図８は、５つのハプロタイプ化アッセイのための標識化スキームを表す概略図である。第１の４つのＳＮＰ、Ａ、Ｃ、ＴおよびＧは、４つの異なる色で標識化される。５番目のＧは、混合物タグ化アプローチ（ｍｉｘｔｕｒｅｔａｇｇｉｎｇａｐｐｒｏａｃｈ）の使用を介して識別され、この混合物タグ化アプローチにおいて、ｄＧＴＰは、色４で標識化されたｄＧＴＰ（短い破線で表される）および色５で標識化されたｄＧＴＰ（短い２つのダッシュを伴う長いダッシュで表される）の５０／５０の集合で表される。図９は、実施されるべき４色分析を可能にする共焦光学システムである。図１０は、被験体のハロタイプを特定の表現型で分析するのに使用される工程を示す概略図であり、そして２つの集団における特定のＳＮＰの存在を示すグラフである。図１１は、プールされたハロタイプの集団を分析するための２つの方法を示す概略図である。上のスキームにおいて、プールされたＤＮＡは、長いＰＣＲを経、続いてｓｓＤＮＡへと変性する。この型の分析において、異なるプローブが、区別して標識化される必要はない。なぜなら、ハロタイプを同定するために測定されるのは、ＤＮＡ上の位置であるからである。下のスキームにおいて、プールされたＤＮＡは、蛍光プライマーで標識化され、その各々は、特定のＳＮＰに特異的である。次いで、これらのプライマーは、単一分子分析を使用する直接蛍光読出し（ｒｅａｄｏｕｔ）を介して検出される。図１２は、上部では、２つのＳＮＰの２つの対立遺伝子の配列：Ａ、ａ、Ｂおよびｂを示す概略図である。下部では、概略図は、オリゴを問題のＤＮＡ（上部に示される）にアニール化する方法を示す。図１３は、ＤＮＡについてのＰＣＲ産物を位置Ａでの異なるＳＮＰで区別した標識化を示す概略図である。同じオリゴの区別した標識化を使用して、結果を確かめ得る。左側の状態では、ＩＲＤ８００で標識化されたオリゴは、１つの遺伝子座での「ｂ」ＳＮＰについて特異的であり、ＴＡＭＲＡで標識化されたオリゴは、「Ａ」ＳＮＰについて特異的であり、そしてＣｙ５で標識化されたオリゴは、「ａ」ＳＮＰについて特異的であるかまたはその逆である。右側の状態において、Ｃｙ５で標識化されたオリゴは、１つの遺伝子座での「ｂ」ＳＮＰについて特異的であり、ＴＡＭＲＡで標識化されたオリゴは、「Ａ」ＳＮＰについて特異的であり、そしてＩＲＤ８００で標識化されたオリゴは、「ａ」ＳＮＰについて特異的であるかまたはその逆である。図１４は、同じことがＢ遺伝子座について当てはまることを示す概略図であり、ここで、「Ｂ」ＳＮＰおよび「ｂ」ＳＮＰを検出するために使用されるオリゴは、ＴＡＭＲＡで区別されて標識化される。図１５は、染色なし(上)および臭化エチジウム染色（下）のＴＡＭＲＡ蛍光を示すゲル写真である。レーン１および４において、存在するＳＮＰは、ＴＡＭＲＡで標識化される。ゲル（下）は、ＰＣＲ産物が、テンプレートが存在しており、このテンプレートがただＴＡＭＲＡで標識されていない全ての場合において産生されたことを示す。図１６は、Ｂ遺伝子座と結合されるＴＡＭＲＡ蛍光を示すゲル写真である。図１７は、臭化エチジウム蛍光に対してＴＡＭＲＡ蛍光について写真濃度計で測定されるゲル写真である。図１８は、種々の標識化および異なるＳＮＰ組み合わせの下で蛍光写真濃度計を示す一連のグラフである。図１９は、以前の蛍光写真濃度計の相関分析の結果を示す２つのグラフである。

Claims

被験体のハプロタイプを決定する方法であって、該方法は、該被験体由来の伸長ポリヌクレオチドを提供する工程であって、該ポリヌクレオチドが、少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーで各々同じように標識される複数の標的部位を含み、ここで、該少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーは、該被験体のハプロタイプについての情報を提供する、工程；
静止検出ステーションに関連して核酸を移動し、そして該検出ステーションで該複数の標識された部位を検出することにより、被験体のハプロタイプを決定する工程、
を包含する、方法。
請求項１に記載の方法であって、ここで、前記標的部位は、一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト繰り返し、ジヌクレオチド繰り返し、トリヌクレオチド繰り返し、配列再編成、およびキメラ配列からなる群から選択される塩基配列バリエーションである、方法。
請求項１に記載の方法であって、ここで、第１および第２のユニット特異的マーカーは、識別可能な特徴を有する発光ハイブリダイゼーションプローブである、方法。
請求項３に記載の方法であって、ここで、前記識別可能な特徴は、発光放出スペクトル分布、寿命、強度、バースト持続時間、および偏光異方性からなる群から選択される、方法。
請求項３に記載の方法であって、ここで、前記発光ハイブリダイゼーションプローブは、単一色素分子、エネルギー移動色素対、ナノ粒子、量子ドット、発光ナノ結晶、インターカレート色素、または分子ビーコンを含む、方法。
請求項３に記載の方法であって、ここで、各々の発光ハイブリダイゼーションプローブが、複数の標的部位のうちの１つに特異的にハイブリダイズする、方法。
請求項６に記載の方法であって、ここで、前記発光ハイブリダイゼーションプローブが、ＤＮＡ、ＲＮＡ、ロックされた核酸、およびペプチド核酸からなる群から選択される、方法。
請求項１に記載の方法であって、第３のユニット特異的マーカーをさらに含み、ここで、該第３のユニット特異的マーカーが、前記被験体のハプロタイプについての情報を提供する、方法。
請求項８に記載の方法であって、第４のユニット特異的なマーカーをさらに含み、ここで、該第４のユニット特異的マーカーは、前記被験体のハプロタイプについての情報を提供する、方法。
請求項１に記載の方法であって、ここで、前記ユニット特異的マーカーは、各々の標的に特異的である単一のプローブ、または標的を同定するために一緒に作用する複数のプローブである、方法。
請求項１０に記載の方法であって、ここで、前記一つのプローブが、オリゴＤＮＡ、オリゴＲＮＡ、オリゴビーコン、オリゴペプチド核酸、オリゴロックされた核酸、およびキメラオリゴからなる群から選択される、方法。
請求項１０に記載の方法であって、ここで、前記複数のプローブが、ハイブリダイゼーション対、侵入者オリゴ対、ライゲーションオリゴ対、ミスマッチ伸長５’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および３’−エキソヌクレアーゼ対からなる群から選択される、方法。
請求項１に記載の方法であって、ここで、前記核酸が、ＤＮＡである、方法。
請求項１３に記載の方法であって、ここで、前記核酸が、ＰＣＲ増幅されたＤＮＡである、方法。
請求項１に記載の方法であって、ここで、前記静止検出ステーションは、アバランシェフォトダイオードまたは電荷結合素子と光連絡される、方法。
請求項１４に記載の方法であって、ここで、前記核酸が、少なくとも一つの分子モータの作動で移動する、方法。
請求項１６に記載の方法であって、ここで、前記少なくとも一つの分子モータが、溶液中の複数の分子モータである、方法。
請求項１４に記載の方法であって、ここで、前記核酸が、流体力学的力の動作で移動する、方法。
請求項１４に記載の方法であって、ここで、前記検出ステーションが、少なくとも一つのドナー蛍光団を含み、そしてここで、第１のユニット特異的マーカーおよび第２のユニット特異的マーカーが各々少なくとも１つのアクセプター蛍光団を含む、方法。
請求項１４に記載の方法であって、ここで、前記検出ステーションが、少なくとも一つのアクセプター蛍光団を含み、そしてここで、第１のユニット特異的マーカーおよび第２のユニット特異的マーカーが各々少なくとも１つのドナー蛍光団を含む、方法。
請求項１に記載の方法であって、ここで、前記検出ステーションが、蛍光共鳴エネルギー移動を検出する、方法。
請求項１に記載の方法であって、ここで、前記核酸の分析が、該核酸の内の標的部位の線形配置についての情報を提供する、方法。
請求項１に記載の方法であって、ここで、前記検出ステーションが、同時に前記核酸の複数の標的部位を検出する、方法。
請求項２３に記載の方法であって、ここで、前記ユニット特異的マーカーが、共焦点顕微鏡によって検出される、方法。
請求項２３に記載の方法であって、ここで、前記複数の部位が、異なる色の発光ハイブリダイゼーションプローブを用いて各々の該複数の部位を標識することによって区別される、方法。
被験体のハプロタイプを決定する方法であって、該方法が、少なくとも一つの識別可能なユニット特異的マーカーで各々標識される複数の選択された遺伝子マーカーを含む、該被験体由来の伸長ポリヌクレオチドを、チャネルを通して移動する工程であって、ここで、該複数の選択された遺伝マーカーが、該被験体のハプロタイプについての情報を提供する、工程；
該ユニットが該検出ステーションに対して移動する場合に、該複数の標識された選択された遺伝マーカーを検出ステーションに暴露する工程であって、ここで、該複数の部位が、該検出ステーションと相互作用して、該チャネル内または該チャネルの縁部で検出可能シグナルを生じる、工程；および
該相互作用から生じる該シグナルを連続的に検出して、該ポリヌクレオチドを分析し、それによって、被験体のハプロタイプを決定する工程、
を包含する、方法。
請求項２６に記載の方法であって、ここで、前記検出ステーションが、電磁放射線、クエンチング供給源および蛍光励起源からなる群から選択される因子を含む、方法。
請求項２７に記載の方法であって、ここで、前記因子が、蛍光励起供給源を含み、そして前記第１のユニット特異的マーカーおよび前記第２のユニット特異的マーカーが、蛍光ハイブリダイゼーションプローブを含む、方法。
少なくとも第１の集団および少なくとも第２の集団を含んでいる核酸のプールの中の核酸の１集団のハプロタイプを決定する方法であって、該方法が、以下：
伸長ポリヌクレオチドのプールを提供する工程であって、ここで、１集団のポリヌクレオチドが、少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーで各々同じように標識された複数の標的部位を含み、ここで、該少なくとも第１のユニット特異的マーカーおよび第２のユニット特異的マーカーが、該プールのハプロタイプについての情報を提供し、さらにここで、該標的部位が、選択された遺伝子マーカーである、工程；
静止検出ステーションを過ぎて、該プールのポリヌクレオチドを移動する工程；
該発光ハイブリダイゼーションプローブを静止検出ステーションで検出する工程；ならびに
検出器のそばを該ポリヌクレオチドが通るときに、該発光プローブを測定し、それによって、該プール中のポリヌクレオチドの種のハプロタイプを決定する工程、
を包含する、方法。
請求項２９に記載の方法であって、ここで、前記標的部位が、一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト繰り返し、ジヌクレオチド繰り返し、トリヌクレオチド繰り返し、配列再編成、およびキメラ配列からなる群から選択される塩基配列バリエーションである、方法。
請求項２９に記載の方法であって、ここで、前記ユニット特異的マーカーが、識別可能な特徴を有する発光ハイブリダイゼーションプローブである、方法。
請求項３１に記載の方法であって、ここで、前記識別可能な特徴は、発光放出スペクトル分布、寿命、強度、バースト持続時間、および偏光異方性からなる群から選択される、方法。
請求項３１に記載の方法であって、ここで、前記発光ハイブリダイゼーションプローブは、単一色素分子、エネルギー移動色素対、ナノ粒子、量子ドット、発光ナノ結晶、インターカレート色素、または分子ビーコンを含む、方法。
請求項３１に記載の方法であって、ここで、各々の発光ハイブリダイゼーションプローブが、複数の標的部位のうちの１つに特異的にハイブリダイズする、方法。
請求項３４に記載の方法であって、ここで、前記発光ハイブリダイゼーションプローブは、ＤＮＡ、ＲＮＡ、ロックされた核酸、およびペプチド核酸からなる群から選択される、方法。
請求項２９に記載の方法であって、第３のユニット特異的マーカーをさらに含み、ここで、該第３のユニット特異的マーカーが、前記プールのハプロタイプについての情報を提供する、方法。
請求項３６に記載の方法であって、第４のユニット特異的なマーカーをさらに含み、ここで、該第４のユニット特異的マーカーは、前記プールのハプロタイプについての情報を提供する、方法。
請求項２９に記載の方法であって、ここで、前記ユニット特異的マーカーは、各々の標的に特異的である単一のプローブ、または標的を同定するために一緒に作用する複数のプローブである、方法。
請求項３８に記載の方法であって、ここで、前記単一のプローブが、オリゴＤＮＡ、オリゴＲＮＡ、オリゴビーコン、オリゴペプチド核酸、オリゴロックされた核酸、およびキメラオリゴからなる群から選択される、方法。
請求項３８に記載の方法であって、ここで、前記複数のプローブが、ハイブリダイゼーション対、侵入者オリゴ対、ライゲーションオリゴ対、ミスマッチ伸長５’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および３’−エキソヌクレアーゼ対からなる群から選択される、方法。
請求項２９に記載の方法であって、ここで、前記ポリヌクレオチドが、ＤＮＡである、方法。
請求項２９に記載の方法であって、ここで、前記静止検出ステーションが、アバランシェフォトダイオードまたは電荷結合素子と光連絡される、方法。
請求項２９に記載の方法であって、ここで、前記検出ステーションが、蛍光共鳴エネルギー移動を検出する、方法。
請求項２９に記載の方法であって、ここで、前記検出ステーションが、少なくとも一つのドナー蛍光団を含み、そしてここで、第１のユニット特異的マーカーおよび第２のユニット特異的マーカーが各々少なくとも１つのアクセプター蛍光団を含む、方法。
請求項２９に記載の方法であって、ここで、前記検出ステーションが、少なくとも一つのアクセプター蛍光団を含み、そしてここで、第１のユニット特異的マーカーおよび第２のユニット特異的マーカーが各々少なくとも１つのドナー蛍光団を含む、方法。
請求項２９に記載の方法であって、ここで、前記複数の部位が、異なる色の発光ハイブリダイゼーションプローブを用いて各々の該複数の部位を標識することによって区別される、方法。
請求項２９に記載の方法であって、ここで、前記第１の集団が、１つの個体からのポリヌクレオチドを含み、そして、前記第２の集団が、異なる個体からのポリヌクレオチドを含む、方法。
請求項２９に記載の方法であって、ここで、前記第１の集団が、被験体の健康状態からのポリヌクレオチドを含み、そして、前記第２の集団が、同じ被験体の疾患状態からのポリヌクレオチドを含む、方法。
被験体のハプロタイプを決定する方法であって、該方法が、以下：
ポリヌクレオチド、第１のライゲーションオリゴヌクレオチドおよび第２のライゲーションオリゴヌクレオチドを提供する工程であって、ここで、該第１のライゲーションオリゴヌクレオチドが、第１の標識された部分と関連し、そして該被験体におけるハプロタイプついての情報に提供する標的ポリヌクレオチドの配列と相補的な第１の一定の配列、該第１のライゲーションポリヌクレオチドの３’末端の問い合わせヌクレオチド、および必要に応じて、該問い合わせヌクレオチドに隣接したミスマッチオリゴヌクレオチドを提供し、そして、ここで該第２のライゲーションオリゴヌクレオチドが、第２の標識された部分と関連し、そして該被験体におけるハプロタイプついての情報に提供する標的ポリヌクレオチドの配列と相補的な第２の一定の配列、該第２のライゲーションポリヌクレオチドの３’末端の問い合わせヌクレオチド、および必要に応じて、該問い合わせヌクレオチドに隣接したミスマッチオリゴヌクレオチドを提供する、工程；
有効量の該第１のライゲーションオリゴヌクレオチドを該ポリヌクレオチドにアニールして、プライムされた第１のテンプレートを得る工程；
ポリメラーゼ活性に充分な条件下で、プライムされたテンプレートと有効量のポリメラーゼ酵素および少なくとも２つの型のヌクレオチド三リン酸と組み合わせて、それによって、第１の伸長ポリヌクレオチドを形成する工程；
有効量の該第２のライゲーションオリゴヌクレオチドを該ポリヌクレオチドにアニールして、プライムされた第２のテンプレートを得る工程；
ポリメラーゼ活性に充分な条件下で、プライムされた第２のテンプレートと有効量のポリメラーゼ酵素および少なくとも２つの型のヌクレオチド三リン酸と組み合わせて、それによって、第２の伸長ポリヌクレオチドを形成する工程；
該伸長された第１のポリヌクレオチドおよび該伸長された第２のポリヌクレオチドを伸長する、工程；ならびに
該第１の標識された部分および第２の標識した部分を検出して、それによって、ハプロタイプを決定する工程、
を包含する、方法。