(発明の要旨)
本発明の方法または装置は、ハプロタイプの作成のための、数キロベース長のDNAの直接線形分析に関する。本発明は、DNAのセグメント上の複数のマーカーを検出し、これらのマーカーの間の距離を決定する方法を提供する。本発明は、いくつかの遺伝子座で、同時にDNAを迅速にハプロタイピングするために使用され得る。
本発明は広範に、核酸を迅速にハプロタイピングするための方法に関し、この核酸は、DNAまたはRNAである。本発明の1つの局面において、被験体のハプロタイプを決定する方法が記載される。この方法は、それぞれが少なくとも第1のユニット特異的マーカーと第2のユニット特異的マーカー(この第1のユニット特異的マーカーおよび第2のユニット特異的マーカーは、被験体におけるハプロタイプについての情報を提供する)で同様に標識されている複数の標的部位を含む、被験体由来の伸長ポリヌクレオチドを提供する工程;核酸を固定検出ステーションに対して移動させ、そしてこの検出ステーションで、複数の標識部位を検出し、それにより被験体のハプロタイプを決定する工程を包含する。
この実施形態の1つの実施形態において、標的部位は、塩基配列変化(例えば、単一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト反復、ジヌクレオチド反復、トリヌクレオチド反復、配列再配置、またはキメラ配列)である。
この実施形態の別の実施形態において、このユニット特異的マーカーは、識別可能な特性を有する蛍光ハイブリダイゼーションプローブである。このような識別可能な特性としては、蛍光発光スペクトル分布、寿命、強度、バースト持続時間および分極異方性が挙げられる。
この実施形態の別の実施形態において、ハイブリダイゼーションプローブは、DNA、RNA、ロック核酸(LNA)、およびペプチド核酸(PNA)であり得る。この実施形態の別の実施形態において、蛍光ハイブリダイゼーションプローブは、単色素分子、エネルギー移動色素対、ナノ粒子、蛍光ナノクリスタル、挿入色素、分子ビーコンおよび量子ドットが挙げられる。本発明の別の実施形態において、各蛍光ハイブリダイゼーションプローブは、複数の標的部位の1つに特異的にハイブリダイズする。
別の実施形態において、本発明の方法は、被験体におけるハプロタイプに関する情報を提供する第3のユニット特異的マーカーをさらに含む。さらに別の実施形態において、本発明の方法はまた、被験体におけるハプロタイプに関する情報を提供する第4のユニット特異的マーカーを含む。
被験体は、例えば、哺乳動物被験体(例えば、ヒト)であり得る。
別の実施形態において、ユニット特異的マーカーは、単プローブまたは、一緒に作用して標的を同定する各標的に特異的な多プローブである。本発明の単プローブは、オリゴDNA、オリゴRNA、オリゴビーコン、オリゴペプチド核酸、オリゴロック核酸、およびキメラオリゴであり得る。本発明の多プローブは、ハイブリダイゼーション対、インベーダオリゴ対、ライゲーションオリゴ対、ミスマッチ伸長5’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および3’−エキソヌクレアーゼ対であり得る。
本発明は、任意の核酸(例えば、PCR増幅DNAまたはPCR増幅RNAを含むDNAまたはDNA)を分析するために使用され得る。
本発明の一実施形態において、固定検出ステーションは、アバランシェ光ダイオードまたは電荷結合デバイスと光連絡している。
別の実施形態において、核酸は、少なくとも1つの分子モーターの作用によって、固定検出ステーションに対して移動される。さらに別の実施形態において、核酸は、溶液中の複数の分子モーターの作用によって、固定検出ステーションに対して移動される。さらに別の実施形態において、核酸は、流体力学的な力の作用によって、固定検出ステーションに対して移動される。
別の実施形態において、検出ステーションは、少なくとも1つのドナー蛍光団、ならびに第1のユニット特異的マーカーおよび第2のユニット特異的マーカー(各々は、少なくとも1つのアクセプター蛍光団を含む)を含む。別の実施形態において、この検出ステー本は、少なくとも1つのアクセプター蛍光団、ならびに第1のユニット特異的マーカーおよび第2のユニット特異的マーカー(各々は少なくとも1つのドナー蛍光団を含む)を含む。
いくつかの局面において、検出ステーションは、蛍光共鳴エネルギー移動を検出する。
別の実施形態において、本発明の方法による核酸の分析は、この核酸内の標的部位の線形配置に関する情報を提供する。
別の実施形態において、検出ステーションは、核酸の複数の標的部位を同時に検出する。一実施形態において、ユニット特異的マーカーは、共焦点顕微鏡によって検出される。別の実施形態において、複数の標的部位は、異なる色の蛍光ハイブリダイゼーションプローブでこれらの複数の部位の各々を標識することによって識別される。
別の局面において、本発明は、被験体のハプロタイプを決定する方法を提供し、この方法は、各々が少なくとも1つの識別可能なユニット特異的マーカーで標識された複数の選択された遺伝マーカーを含む被験体由来の伸長ポリヌクレオチドを移動させる工程であって、ここでこれらの複数の選択された遺伝マーカーが、この被験体におけるハプロタイプに関する情報を、チャネルを介して提供する工程;これらのユニットが検出ステーションに対して移動する場合、これらの複数の選択された遺伝マーカーを、検出ステーションに曝露する工程であって、ここでこれらの複数の部位が、この検出ステーションと相互作用して、このチャネル内またはこのチャネルの縁部で検出可能なシグナルを生成する、工程;および次いで、この相互作用から生じたシグナルを逐次的に検出して、このポリヌクレオチドを分析し、それにより被験体のハプロタイプを決定する工程、を包含する。
一実施形態において、検出ステーションは、電磁放射線、消光源、および蛍光励起源から選択される因子を含む。この因子は、蛍光励起源、ならびにハイブリダイゼーションプローブを含む第1のユニット特異的マーカーおよび第2のユニット特異的マーカーを含み得る。
別の実施形態において、本発明は、核酸プール中の核酸集団のハプロタイプを決定する方法を含み、この核酸集団は少なくとも第1の核酸集団および少なくとも第2の核酸集団を含み、ここでこの方法は、伸長ポリヌクレオチドのプールを提供する工程であって、ここでこの集団中のポリヌクレオチドは、複数の標的部位を含み、これらの標的部位の各々は、少なくとも第1のユニット特異的マーカーおよび第2のユニット特異的マーカーで同様に標識され、そしてここでこの少なくとも第1のユニット特異的マーカーおよび第2のユニット特異的マーカーは、このプールにおけるハロタイプに関する情報を提供し、さらにここで、この標的部位は、選択された遺伝マーカーである、工程;このプールのポリヌクレオチドを固定検出ステーションに通過させる工程;この固定検出ステーションで、この蛍光ハイブリダイゼーションプローブを検出する工程;ならびに、このポリヌクレオチドが検出器を通過した場合、この蛍光プローブを測定し、それによりこのプール中のポリヌクレオチドの種のハプロタイプを決定する工程、を包含する。
一実施形態において、これらの標的部位は、単一ヌクレオチド多型、多塩基欠失、多塩基挿入、マイクロサテライト反復、ジヌクレオチド反復、トリヌクレオチド反復、配列再配置およびキメラ配列から選択される塩基配列変化である。
別の実施形態において、ユニット特異的マーカーは、識別可能な特性を有する蛍光ハイブリダイゼーションプローブである。この識別可能な特性は、例えば、蛍光発光スペクトル分布、寿命、強度、バースト持続時間、および分極異方性であり得る。
蛍光ハイブリダイゼーションプローブとしては、例えば、単色素分子、エネルギー移動色素対、ナノ粒子、量子ドット、蛍光ナノクリスタル、挿入色素、または分子ビーコンが挙げられる。
いくつかの実施形態において、各々の発光ハイブリダイゼーションプローブが、複数の標的部位の一つに特異的にハイブリダイズする。発光ハイブリダイゼーションプローブは、例えば、DNA、RNA、ロックド核酸、またはペプチド核酸であり得る。
さらなる実施形態において、核酸の集団は、プール中のハロタイプについての情報を提供する第3のユニット特異的マーカーを含む。さらなる実施形態において、核酸の集団は、プール中のハロタイプについての情報を提供する第4のユニット特異的マーカーを含む。
いくつかの実施形態において、ユニット特異的マーカーは、各々の標的について特異的である単プローブまたは一緒に作動して標的を同定する多プローブである。単プローブは、例えば、オリゴDNA、オリゴRNA、オリゴビーコン、オリゴペプチド核酸、オリゴロックド核酸、およびキメラオリゴであり得る。多プローブは、例えば、ハイブリダイゼーション対、インベーダーオリゴ対、ライゲーションオリゴ対、ミスマッチ伸長5’−エキソヌクレアーゼオリゴ対、エネルギー移動オリゴ対、および3’エキソヌクレアーゼ対であり得る。
プール中のポリヌクレオチドは、例えば、DNA、RNA、またはその混合物であり得る。
いくつかの局面において、定常検出ステーションは、アバランシェ光ダイオードまたは電荷結合素子と光連絡する。
いくつかの実施形態において、検出ステーションは、蛍光共鳴エネルギー移動を検出する。本発明のいくつかの局面において、検出ステーションは、少なくとも1つのドナー蛍光物質ならびに第1のユニット特異的マーカーおよび第2のユニット特異的マーカー(各々が、少なくとも1つのアクセプター蛍光物質を含む)を含む。別の実施形態において、検出ステーションは、少なくとも1つのアクセプター蛍光物質ならびに第1のユニット特異的マーカーおよび第2のユニット特異的マーカー(各々が、少なくとも1つのドナー蛍光物質を含む)を含む。
別の実施形態において、複数の部位が、複数の部位の各々を異なる色の発光ハイブリダイゼーションプローブで標識化することにより、識別される。1つの実施形態において、第1の集団は、1つの個体由来のポリヌクレオチドを含み、そして第2の集団は、異なる個体由来のポリヌクレオチドを含む。別の実施形態において、第1の集団は、健康な状態の被験体由来のポリヌクレオチドを含み、そして第2の集団は、疾患状態の同じ被験体由来のポリヌクレオチドを含む。被験体は、例えば、哺乳動物(ヒトのような)であり得る。
別の局面において、本発明は、ポリヌクレオチド、第1のライゲーションオリゴヌクレオチドおよび第2のライゲーションオリゴヌクレオチドを提供することにより、被験体のハプロタイプを決定する方法を包含し、ここで第1のライゲーションオリゴヌクレオチドは、第1の標識化された部分と結合され、前記被験体におけるハプロタイプについての情報を提供する標的ポリヌクレオチド、前記第1のライゲーションポリヌクレオチドの3’末端での問い合わせヌクレオチド、および、必要に応じて、問い合わせヌクレオチドに隣接するミスマッチオリゴヌクレオチドにおける配列に相補性の第1の定常配列を含む。第2のライゲーションオリゴヌクレオチドは、第2の標識化された部分と結合され、前記被験体におけるハプロタイプについての情報を提供する標的ポリヌクレオチド、前記第2のライゲーションポリヌクレオチドの3’末端での問い合わせヌクレオチド、および、必要に応じて、問い合わせヌクレオチドに隣接するミスマッチオリゴヌクレオチドにおける配列に相補性の第2の定常配列を含む。有効量の第1のライゲーションオリゴヌクレオチドが、ポリヌクレオチドにアニールされ、プライムされた第1のテンプレートを生じ、このテンプレートは、ポリメラーゼ活性のために十分な条件の下で、有効量のポリメラーゼ酵素および少なくとも2つの型のヌクレオチドトリホスフェートと組み合わされ、それにより、第1の延長されたポリヌクレオチドを形成する。有効量の第2のライゲーションオリゴヌクレオチドが、ポリヌクレオチドにアニールされ、プライムされた第2のテンプレートを生じ、このテンプレートは、ポリメラーゼ活性のために十分な条件の下で、有効量のポリメラーゼ酵素および少なくとも2つの型のヌクレオチドトリホスフェートと組み合わされ、それにより、第2の延長されたポリヌクレオチドを形成する。延長された(elongated)第1のオリゴヌクレオチドおよび延長された(elongated)第2のオリゴヌクレオチドは、伸長される(extended);そして第1の標識化された部分および第2の標識化された部分は、検出される。これにより、ハロタイプを決定する。
別の局面において、標識化された部分は、伸長され延長されたポリヌクレオチドを定常検出ステーションに対して移動することにより検出される。この実施形態の別の局面において、蛍光共鳴エネルギー移動が、検出される。
他に定義されない限り、本明細書中で使用される全ての技術用語および科学用語は、本発明が属する当業者により通常理解されるとおりの同じ意味を有する。本明細書中に記載されるのと類似のまたは等しい方法および物質が、本発明の実施または試験において使用され得るが、適切な方法および物質は、以下に記載される。本明細書中で述べられる全ての刊行物、特許出願、特許、および他の参考文献は、その全体において参考として援用される。矛盾する場合は、本明細書(定義を含める)が、制御する。さらに、物質、方法、および例は、例示のみであり、限定を意図しない。
本発明の他の特徴および利点は、以下の詳細な説明および添付の特許請求の範囲から明らかである。
(発明の詳細な説明)
本明細書中で使用されるように、用語「選択的」、「選択的に」、「特異的な」、「特異的に」、「本質的に」、「均一に」などは、指示された事象が特定の程度まで起こることを意味する。特に、ヌクレオチドのそのハイブリダイゼーション標的に対するパーセント同一性は、90%より大きく、好ましくは95%より大きく、最も好ましくは、99%より大きい。
本明細書中で使用されるように、用語「ユニット特異的情報」は、核酸ポリマーのユニットの1つ、いくつか、または全てについての任意の構造的情報をいう。本発明の方法に従って核酸を分析することにより得られる構造的情報は、核酸の特徴的な特性の同定を包含し得、この特性が(今度は)、例えば、サンプル中の核酸の存在の同定、または核酸ポリマーの関連の決定、核酸ポリマーの大きさの同定、核酸ポリマーにおける2つ以上の個々のユニットもしくはユニット特異的マーカーの間の近接もしくは隔たりの同定、核酸ポリマー中の2つ以上の個々のユニットもしくはユニット特異的マーカーの順序の同定、および/または核酸ポリマーのユニットもしくはユニット特異的マーカーの一般組成の同定を可能にする。生物学的分子の構造および機能が相互依存しているために、構造的情報は、核酸ポリマーの機能についての重要な情報を明らかにし得る。本発明は、核酸ポリマーの不完全な標識化から得られるデータの編集に基づいて核酸ポリマーを分析するための方法である。本方法は、単ユニット標識もしくは多重ユニット標識(両方が本明細書中でユニット特異的マーカーといわれる)、一本鎖核酸ポリマー、二本鎖核酸ポリマー、またはその組み合わせから生成されるデータを使用して実施され得る。
本明細書中で使用される場合、用語「標的部位」は、配列が変動する核酸の配列をいう。例としては、単一のヌクレオチドバリエーション、ヌクレオチド繰り返し、複数塩基欠失(コンセンサス配列から欠失される1つより多くのヌクレオチド)、複数塩基挿入(コンセンサス配列から挿入される1つより多くのヌクレオチド)、マイクロサテライト繰り返し(代表的に5〜1000繰り返し単位を有する少数のヌクレオチド繰り返し)、ジヌクレオチド繰り返し、トリヌクレオチド繰り返し、配列再配置(転座および複製を含む)、キメラ配列(異なる遺伝子起源からの2つの配列が、一緒に融合される)、などのような、異なる形態で存在する多型が挙げられるが、これに限定されない。配列多型の中で、ヒトゲノムにおける最も頻繁な多型は、単一塩基バリエーションであり、単一ヌクレオチド多型(SNP)とも呼ばれる。SNPは、ゲノム全体に大量に、安定にかつ広く分布している。
ユニット特異的マーカーは、本明細書中で、特異的な標的部位に結合、アニールまたはハイブリダイズするプローブとして使用される。本明細書中で使用されるように、用語「プローブ」は、特異的な標的部位に結合、アニールまたはハイブリダイズする物質を言う。プローブの例としては、DNA、RNA、ロックド核酸(LNA)、ペプチド核酸(PNA)、ビーコンオリゴヌクレオチド(oligo)、またはキメラオリゴが挙げられるが、これらに限定されない。ユニット特異的マーカーは、例えば、2塩基対プローブ、3塩基対プローブ、4塩基対プローブ、および5塩基対プローブから選択される一連の異なる核酸プローブであり得る。
PNAは、糖ホスフェート骨格が、一般に2−アミノエチル−グリシン結合から構成されるペプチド骨格と置き換えられた核酸アナログである。核酸塩基は、アミノ窒素へのメチルカルボニルリンカーを介して骨格に結合される。生じるアナログは、荷電しておらず、アキラルであると同時に、Watson−Crick塩基対を介してDNAおよびRNAを認識する能力を保っている。PNAは、酵素分解に耐性があり、生きている細胞において安定である。一般に、PNAと核酸との間のハイブリッドは、高められた熱力学的安定性および特有のイオン特性を示す。
LNA、ロックド核酸は、RNAオリゴマーの合成に使用されるRNA誘導体である。LNAは、PNAと異なり、DNAおよびRNA中に見出される同じホスフェート骨格を有し、この骨格が、LNAオリゴマーがホスホジエステル結合の形成により形成されることを可能にする。LNAは、ヌクレオチドがリボースの2’−酸素を4’−炭素と結合するメチレン架橋を含む点において、RNAと異なる。このことは、糖におけるロックされた3’−エンド形態を生じ、この形態は、リボースのコンフォメーションの融通性を減少し、ホスフェートバックボーンの組織化を増大する。この改変は、LNAのその相補的核酸への結合親和性を増大する。
本明細書中で使用される場合、「標識化ユニット特異的マーカー」は、特定のユニット(単数または複数)を同定するポリマーにおける任意のユニット特異的マーカーである。標識化ユニット特異的マーカーとしては、例えば、特定のユニット(単数または複数)、タンパク質、ペプチド、核酸、多糖、短いオリゴマー、tRNAなどに結合される蛍光マーカーを含み、このマーカーは、特定のユニット(単数または複数)を認識かつ結合し、これは、例えば固有の標識化特性を有するもしくは外因性の標識を含むことにより、または抗体のような別の検出分子と結合することにより、検出され得る。
その標識が少なくとも1つの他の標識化ユニット特異的マーカーと異なる場合、「識別可能な特性」を有するように、本明細書中で使用されるような標識化ユニット特異的マーカーが標識化される。代表的には、標識化ユニット特異的マーカーは、異なる発光放出スペクトル分布、寿命、強度、バースト持続時間、または極性非等方性に基づいて互いに区別される。
本明細書中で記載される核酸分析を使用して、ポリマーの個々のフラグメントに対する多重プローブのハイブリダイゼーションパターンを分析することにより、DNAフラグメントを同定し得る。DNAの未知のフラグメントに結合される多重プローブの数、型、順序およびプローブ間の距離が、決定され得る。この情報を使用して、差示的に発現された遺伝子の数を明白に同定し得る。さらに、本発明の方法は、特定の発現された遺伝子の実際の数を厳密に定量し得る。大量の情報が生成した場合、本発明の方法は、発現した遺伝子の選択もアッセイされるべき未知の核酸の選択も必要としない。本発明の方法は、生成したハイブリダイゼーションパターンのコンピューター分析により未知の発現された遺伝子を同定し得る。次いで、DNAプローブの段階的分析(linear analysis)から得られたデータを、データベースにおける情報と適合して、標的DNAの組成または同一性を決定する。このように、本方法を使用して、ハロタイプを決定し得、ハイブリダイゼーション反応からの情報を分析し得、次いで、この方法は、遺伝子発現パターンの診断および決定に適用され得る。
本明細書中で使用される場合、用語「単プローブ」は、標的配列に特異的にアニールまたはハイブリダイズする発光ハイブリダイゼーションプローブをいう。
本明細書中で使用される場合、用語「多プローブ」は、標的部位を同定するのに一緒に作用する発光ハイブリダイゼーションプローブをいう。同じ標的部位に特異的にアニールまたはハイブリダイズすることにより、複数の標的部位に特異的にアニールまたはハイブリダイズすることにより、プローブを異なる結合親和力で使用することにより、多プローブが一緒に作用し得、その結果、標的部位への特異的なアニールまたはハイブリダイゼーションは、特定の温度で起こる。多プローブは、ハイブリダイゼーション対、5’−エキソヌクレアーゼオリゴヌクレオチド対、エネルギー移動オリゴヌクレオチド対、または3’−エキソヌクレアーゼ対であり得る。
標識化部分は、検出可能である部分である。標識化部分の例としては、色素(例えば、蛍光色素分子)、量子ドット、発光ナノ結晶、分子ビーコンおよび放射活性粒子が挙げられる。
本明細書中で使用される場合、用語「発光ハイブリダイゼーションプローブ」は、発光放出を含む、識別可能な特性を有するプローブをいい、この特性は、スペクトル分布、寿命分布、強度分布、または発光の極性非等方性分布により区別され得る。これらの分布は、単一色素分子、エネルギー移動対、ナノ粒子、量子ドット、発光ナノ粒子、または分子ビーコンをも有する発光ハイブリダイゼーションプローブにより引き起こされる。
用語「分子ビーコン」は、均一の溶液中での特異的核酸の存在を報告するシステムをいう。これらのプローブは、これらがその標的にハイブリダイズする場合、自発的蛍光発生的(fluorogenic)コンフォメーション変化を経る。完全に相補的な標的のみがこの応答を引き出す。これは、特異的なアニールまたはハイブリダイゼーションが、標的が適合しないヌクレオチドまたは欠失を含む場合、起こらないためである。
蛍光共鳴エネルギー移動(FRET)は、2つの色素分子の電子的励起状態の間の距離依存相互作用であり、このエネルギー移動において励起は、光子を放出することなくドナー分子からアクセプター分子に移動される。FRETは、分子間分離の−6乗に依存しており、このことは、生物学的高分子の寸法に適合可能である距離にわたってFRETを有用にしている。従って、FRETは、分子の近接における変化を生成する種々の生物学的現象を調査する重要な技術である。
ドナー分子およびアクセプター分子は、近く接近しなければならない(代表的に、10〜100Å)。アクセプターの吸収スペクトルは、ドナーの蛍光発光スペクトルと重ならなければならない。大部分の適用において、ドナー色素およびアクセプター色素は異なり、この場合、FRETは、アクセプターの感作蛍光の出現によって、またはドナー蛍光のクエンチによって、検出され得る。ドナーおよびアクセプターが同じである場合、FRETは、生じる蛍光脱分極によって検出され得る。
励起の際に、ドナー発蛍光団は、特徴的な寿命(t)を有する蛍光光子を放出する。ドナーの発光バンドと重なる吸収バンドを有する第二の発蛍光団に近く(5〜10nm)接近することにより、第二の発蛍光団の励起(アクセプター)をもたらし、その速度は、これらの間の距離の6乗に反比例する。従って、ドナー蛍光およびその寿命は、ドナー−アクセプター距離に依存する。FRETの測定は、蛍光強度の変化、またはドナー蛍光寿命の測定に基づき得る。
この技術は、色素分子のいくつかの異常な特性を利用する。蛍光色素を使用するFRET測定において、その色素分子は、代表的に、1つの波長の光で励起され、そしてデータは、より長い波長で収集される。
本明細書中で使用される場合、「エネルギー移動色素対」とは、2つの色素分子の電子的励起状態の間の、距離に依存する相互作用をいい、ここで、励起は、1つの色素(ドナー発蛍光団)から別の色素(アクセプター発蛍光団)に、光子の放出なしで移動される。これらの2つの色素分子は、一般に、切断可能に修飾されたヌクレオチドの反対側に位置し、その結果、切断が、これらの色素の互いに対する接近性を変化させ、そしてこれによって、ポリヌクレオチド上の色素の蛍光出力を変化させる。
本明細書中で使用される場合、「量子ドット」とは、発光ハイブリダイゼーションプローブと共に使用される標識であり、これは、コア、キャップおよび親水性付着基を含む。「コア」とは、ナノ粒子の大きさの半導体である。この半導体の大きさは、約1nm〜約10nmの範囲である。このコアは、より好ましくは、半導体であり、そして大きさが約2nm〜約5nmの範囲である。最も好ましくは、このコアは、CdSまたはCdSeである。この点に関して、CdSeが、コアとして特に好ましく、特に、約4.2nmの大きさで好ましい。
「キャップ」とは、コアの半導体とは異なる半導体であり、そしてコアに結合し、これによって、コア上に表面層を形成する。キャップは、所定の半導体コアと組み合わせられる場合に、発光量子ドットを生じるようでなければならない。好ましくは、キャップはZnSまたはCdSである。より好ましくは、キャップは、ZnSである。特に、コアがCdSeまたはCdSである場合には、キャップは好ましくはZnSであり、そしてコアがCdSeである場合には、キャップは好ましくは、CdSである。
「付着基」とは、この用語が本明細書中で使用される場合、発光半導体量子ドットのキャップの表面に、例えば任意の適切な物理的会合または化学的会合によって、付着し得、そしてこの量子ドットをもはや発光性にすることなく、この量子ドットを水溶性にし得る、任意の有機基をいう。従って、付着基は、親水性部分を含む。好ましくは、付着基は、メルカプト酢酸である。
本明細書中において使用される場合、「蛍光ナノ結晶」とは、光褪色に抵抗し、発光波長スペクトルを共有し、そして高い量子収量で、不連続ピークの発光スペクトルで蛍光を発し得る、発光ハイブリダイゼーションプローブに対して使用される結晶である。
本明細書中において使用される場合、「蛍光ナノ粒子」とは、光褪色に抵抗し、発光波長スペクトルを共有し、そして高い量子収量で、不連続ピークの発光スペクトルで蛍光を発し得る、発光ハイブリダイゼーションプローブに対して使用される粒子である。
本明細書中において使用される場合、「単一の色素」とは、発光ハイブリダイゼーションプローブと共に使用される蛍光標識である。この標識としては、TAMRA、Cy3、Cy5、Cascade Blue、およびIR800が挙げられ得る。
本明細書中において使用される場合、「挿入色素」とは、核酸と疎水性相互作用することによってこの核酸を標識し得る色素である。挿入色素の例は、エチジウムブロマイドである。
本明細書中において使用される場合、用語「侵入オリゴヌクレオチド」とは、その3’末端に、プローブオリゴヌクレオチドの5’末端に位置する配列と実質的に同じである配列を含む、オリゴヌクレオチドをいう;これらの領域は、相補的な標的核酸に沿った標的部位へのハイブリダイゼーションについて、競合する。
本明細書中において使用される場合、用語「連結オリゴヌクレオチド」とは、標的部位の少なくとも一部と相補的であり、そして標的部位とハイブリダイズして、一本鎖領域および二本鎖領域を有するハイブリッドを形成する、オリゴヌクレオチドをいう。このハイブリッドは、複数のオリゴヌクレオチド三リン酸(例えば、ATP、CTP、GTP、TTP、UTP)およびポリメラーゼ酵素と接触し得、これによって、ハイブリッドに順番に連結し、複数のオリゴヌクレオチド三リン酸の少なくともいくらかを、二本鎖領域まで伸長させ、これによって、標的部位の一部分に相補的な核酸鎖を合成する。
本明細書中において使用される場合、「問い合わせヌクレオチド」とは、連結オリゴヌクレオチドの3’末端におけるヌクレオチドである。問い合わせヌクレオチドは、連結オリゴヌクレオチドがハイブリダイズされる標的部位と塩基対またはミスマッチを形成し得る。
本明細書中において使用される場合、「ミスマッチ伸長エキソヌクレアーゼオリゴヌクレオチド」とは、DNAポリメラーゼによるプライマー伸長効率の、ミスマッチの5’末端または3’末端に対するマッチした5’末端または3’末端の差の測定に依存する、オリゴヌクレオチドである。1つの例において、3’末端において1つの塩基が異なる2つの検出プライマーが設計される;一方は、標的部位のDNA配列の1つの種に正確に相補的であり、そして他方は、標的部位のDNA配列の別の種に正確に相補的である。これらのプライマーは、目的の塩基を越えて3’末端とハイブリダイズし、そしてプライマー伸長速度は、DNAポリメラーゼおよびデオキシヌクレオチドとのインキュベーションの後に、測定される。検出プライマーがテンプレートに正確にマッチする場合、高い伸長速度が観察される。対照的に、検出プライマーの3’末端がテンプレートに正確にはマッチしない(ミスマッチの)場合、プライマー伸長速度は、ずっと低くなる。次いで、DNAポリメラーゼによるプライマー伸長効率の、ミスマッチの3’末端に対するマッチした3’末端の差が、1塩基の識別のために使用され得る。
本明細書中において使用される場合、「サンプルチャンバ」とは、サンプルが問い合わせのために調製されるコンテナである。サンプルチャンバとしては、例えば、フロースルーキャピラリー、カバーガラス付きのスライドガラス、マイクロチップ、またはサンプルの取り扱いを可能にする任意の他の適切なサンプルチャンバが挙げられる。サンプルチャンバは、例えば、サンプルが通って流れるチャネルであり得る。
サンプルは、種々の異なる手段によって(例えば、分子モーターによってか、電気泳動力によってか、流体力学的力によってか、またはこれらの組み合わせによって)、チャネルを通って流れ得る。
「検出ステーション」とは、本明細書中において使用される場合、サンプル上のマーカーが問い合わせられる、サンプルチャンバ内の領域である。この問い合わせは、マーカー自体から発せられる(固有の)シグナルを検出してか、またはマーカーを、検出可能なシグナルをこのマーカーに発生させる因子と接触させることによって、達成される。検出ステーションは、任意の材料(気体を含む)から構成され得る。好ましくは、ステーションは、非液体材料である。「非液体」とは、当該分野におけるその通常の意味を有する。液体とは、非固体の、非気体の材料であり、それらの間での構成分子の自由な運動(しかし、分離する傾向はない)によって特徴付けられる。別の好ましい実施形態において、このステーションは、固体材料である。検出ステーションは、検出ステーションにおいて問い合わせられるサンプルの検出を可能にするデバイスに関連し得る。例えば、検出ステーションは、アバランシェフォトダイオードまたは電荷結合素子と光学通信し得る。検出ステーションは、例えば、共焦点レーザースポットであり得、これは、標識されたサンプルが通って流れるチャネルに焦点を合わせる。レーザーは、光学トレインを通る位置から遠隔であり得、そしてこの位置に指向され得る。
ユニット特異的マーカーと検出ステーションとの間の相互作用が、ポリマー依存性のインパルスを生じる場合、このステーションは、「シグナル発生ステーション」である。シグナル発生ステーションの1つの型は、相互作用ステーションである。本明細書中において使用される場合、「相互作用ステーションまたは部位」とは、ポリマーのユニット特異的マーカーが因子と相互作用し、そして因子に対して十分に接近して近くに位置し、これによってこれらが相互作用し得る領域である。例えば、発蛍光団についての相互作用ステーションは、これらがエネルギー的に相互作用してシグナルを生じるために十分に近い領域である。
本明細書中において使用される場合、「延びたポリヌクレオチド」または「延びた核酸」とは、螺旋状でも超螺旋状でもない核酸である。例えば、この核酸は、およそ線状になるように延びる。
本発明は、広範には、核酸の大きい集団を分析するための、単一分子の遺伝子の分析の使用に関する。本発明の1つの実施形態において、DNAの直接分析は、DNAのプールが集団を調べ、そしてその集団がゲノム内の特定の位置において差異を有するか否かを決定することを可能にする。このことは、反応からのDNAがプールされ、同じ反応チューブ内で一緒に調製され、次いで、特定の集団に存在する状態を示す別個の単一の分子として分析されることを可能にする。試験サンプル集団およびコントロール集団の各々の状態が比較されて、集団の間の差異を同定し、従って、集団の間に遺伝的差異が存在するか否かの問題に取り組む。これは、集団が表現型の差異(例えば、疾患および非疾患)によって分離される場合に、特に有用である。
本発明の別の実施形態において、症例の集団およびコントロール集団由来のDNAが、それらのそれぞれの単一の反応容器内に別々にプールされる。従って、各反応チューブは、集団(試験サンプルまたはコントロール集団のいずれか)の1つのサブセットのDNAの全てについて、等しい量のDNAを含む。集団の選択された位置が、長いPCRを使用する分析のために選択される。長いPCR反応は、異なる反応混合物に対して実施され、従って、反応混合物の各々に存在するそれぞれのハプロタイプの全てを増幅する。次いで、集団の各々から得られるPCR産物混合物は、タグ化され、洗浄され、そして単一分子検出システムを通して送信される。従って、試験サンプルとコントロール反応混合物との比較は、それぞれの集団の各々に存在するかまたは存在しない、特定のハプロタイプの決定を可能にする。このシステムの他の実施形態は、サンプル調製の異なる方法に関し、この方法としては、目的の領域の増幅を包含せず、その代わりに、配列特異的タグを使用するDNAの部位の直接のタグ化を包含する方法が挙げられる。さらなる実施形態はまた、分析されるべきゲノムの特定の領域の認識のための、標的化クローニング方法を包含する。
本発明はまた、広範に、単一分子の分析の使用を介して実施され得る、フラグメントハプロタイプ決定を記載する。本発明の1つの実施形態において、この方法は、多重化された単一分子検出の使用を包含する。例えば、ゲノムの領域にわたるハプロタイプの分析は、DNAフラグメントの単離/増幅、ゲノムの多型領域の差次的タグ化、および単一分子の検出を使用する差次的タグ化パターンの区別を包含し得る。この方法は、図1に概略的に記載されている。
特定の実施形態において、本発明は、2つの異なる遺伝子座における、一塩基多型を検出するための方法を記載する。この方法は、1つのみの位置で配列が異なるテンプレートの間を区別し得る、蛍光標識オリゴヌクレオチドを使用するDNAの増幅に関する。複数の識別オリゴ(各々が、異なる発蛍光団と結合体化される)の同時の使用は、複数の遺伝子座の同時の増幅を可能にする。PCR産物は、単一の分子および分子集団の分析のために適合された分析プラットフォーム(例えば、GENEENGINETM)で分析される。1つのこのようなシステムの詳細は、米国特許第6,355,420号に見出され、これは、本明細書中に参考として特に援用される。単一分子の検出様式は、発蛍光団のセットが相関するか否かを試験するために使用され、これは、対立遺伝子の連結、および従って、ハプロタイプの同定を示す。
(ハプロタイプ決定)
SNPは、複雑な疾患関連研究(連鎖分析)(ここで、疾患変異の接近して近付く遺伝マーカー(ハプロタイプ)の特定の対立遺伝子(相同染色体の同じ遺伝子座に存在する2つ以上の遺伝子のうちの1つ)が、その疾患と一貫して関連付けられる)のための、理想的な遺伝マーカーとして働く。新たに推定されたSNP情報の、既知のSNPライブラリーとの比較は、ヒト疾患の複雑な遺伝成分の説明を可能にし、これによって、薬物発見のプロセスを加速する。SNPはまた、集団研究、進化研究および法医学的研究、ならびに多型プロフィールのための良好なマーカーである。これらは、個体の遺伝プロフィールに基づいて、疾患の危険性を評価する可能性、または薬物応答を予測する可能性を与える。さらに、SNPプロフィールは、個々の患者に対して薬物処置をあつらえ、処置の効力および安全性を改善するために使用され得る。
ハプロタイプは、単一の染色体上に位置する遺伝決定因子のセットであり、そして代表的に、染色体の領域における対立遺伝子(遺伝子の代替の配列の全て)の特定の組み合わせを含む。換言すれば、ハプロタイプは、個々の染色体上の、段階付けられた配列情報である。非常に頻繁に、染色体上の段階付けられたSNPは、ハプロタイプを規定する。2つのヒト染色体上の2つのハプロタイプの組み合わせは、最終的に、ヒト細胞の遺伝プロフィールを決定する。特異的遺伝子マーカーと疾患変異との間の連結を決定するものは、ハプロタイプである。SNPをスコア付けする現在の方法(例えば、ハイブリダイゼーションマイクロアレイまたは直接ゲル配列決定)(Landgrenら、Genome Research,8:769−776,1998に概説される)は、個々のSNPの型を正確に決定し得るが、二倍体の対のどちらの染色体が、各多型に関連するかを決定し得ない。ハプロタイプの段階付けされた情報なしでは、異なるハプロタイプの多数の可能性に起因して、二倍体関連を検出することが不可能であるかもしれない。
遺伝子型から推定されるハプロタイプは、代表的に、以下のように、多量でなされる(推定ハプロタイプ):目的の領域が、PCRで増幅され、その遺伝子型が決定され、そしてそのハプロタイプが、ホモ接合個体から推定される。遺伝子型は、両方の染色体の混合物に対する多量の測定に基づくので、この遺伝子型決定アプローチは、多数のSNPマーカーという重大な制限を有する。
集団の分析のために使用される現在のゲノミクス技術としては、サンガーの配列決定およびPCRまたは他の型の酵素的増幅に基づく方法が挙げられる。ハプロタイプは、遺伝の分析のために数キロベースのDNA〜数メガベースの大きさのDNAにわたって作製される必要があるので、PCRとサンガー配列決定との両方に基づく技術は、しばしば不十分である。従って、遺伝分析の既存の方法は、DNAの長い伸長にわたるハプロタイプの同定を可能にしない。
伝統的に、関連研究は、少数のマーカーを含む、単純な、単一遺伝子の疾患についてのみ成功しており、ここで、異なるハプロタイプの可能な組み合わせは、制限されている。従って、ハプロタイプは、代表的に、多くの個体を型決定すること、ならびにホモ接合性情報および親の情報の利用可能性によって、遺伝子型から推定され得る。しかし、大部分の疾患は複雑であり、そして複数の遺伝子を含む。多遺伝子性の関連研究については、さらにより多くのマーカーが必要とされ、従って、可能なハプロタイプの数が大きい。これらの場合において、遺伝子型からハプロタイプを推定することは、非常に困難である。
ハプロタイプ決定の1つの方法は、マイクロサテライトマーカーを、ゲノムの特定の位置(例えば、100kb、200kb、および300kb)において使用する。100kbの位置をPCRでアッセイすることによって、2つの異なる大きさのPCR産物が得られ、一方は「A」と記載され、そして他方は「a」と記載される。200kbの位置および300kbの位置は、同様に、BbおよびCcを生じる。遺伝を理解する目的で、どのマイクロサテライトマーカーが同時に遺伝するかを知り、マーカーのどの組合せが特定の表現型特性を生じるかを決定させることが重要である。遺伝子座の2つのコピー上のマーカーの、多くの可能な組み合わせが存在する。その目的は、マーカーの組み合わせの統計学的補正が、遺伝パターンを追跡し得るように、ハプロタイプ、または物理的に遺伝したマーカーの線形順序を決定することである。PCRに依存する技術を用いて、単離物における1つの個体の分析は、ハプロタイプを生じ得ない。しかし、この制限は、その個体の親のマーカーを分析するというさらなる努力によって、回避され得る。この情報を用いて、ハプロタイプが、統計学的に再構築され得る。
ハプロタイプ決定する別の方法は、一塩基多型(SNP)を使用して、先祖(家族性ではない)遺伝を決定する。多くのSNPが、1つの共通の先祖から受け継がれた、DNAの共有される領域を見出すためにスコア付けされる。次いで、このゲノムのこれらの共有される領域(約30キロベースであることが要求される)が、目的の表現型特性に結び付けられ得る。どの領域が、シャッフルされた領域であるかを決定するために、ハプロタイプの決定は、重要である。しかし、候補遺伝子領域のSNP分析は、現在の技術を用いると困難であり、表現型を組み立てるためには、親の情報が必要とされ、そしてSNPは二対立遺伝子(biallelic)(2つのみの可能な多型を有する)であるので、いくつかのヘテロ接合性二対立遺伝子SNPの伸長は、現在の技術を使用して、ハプロタイプに組み立てられ得ない。その結果、完全な直系がアッセイされる場合でさえも、この情報は失われ、そして回復され得ない。
ハプロタイプ決定のための別の従来の代替は、対立遺伝子特異的ポリメラーゼ連鎖反応(対立遺伝子特異的PCR、RuanoおよびKidd、Nucleic Acids Research,17:8392,1989)であり、これは、ハプロタイプ決定を指向するために、最も通常に使用される方法である。これらの反応において、SNP特異的PCRプライマーが、2つの染色体から特定のハプロタイプを区別し、そして増幅するために、設計される。このような反応は、ストリンジェントな反応条件、および各標的に対する個々の最適化を必要とする。従って、このアプローチは、大規模のハイスループットのハプロタイプ決定には適さない。より重要なことには、このようなアッセイは、PCR増幅の長さの制限に供され、そして数キロベース(kb)より大きく離れたSNPの型を決定し得ない。さらに、このような増幅に基づく型決定は、しばしば、サンプル取り扱いプロセスの間の、サンプルDNA以外の少量のゲノムDNAの夾雑によって、複雑にされる。
他のハプロタイプ決定方法としては、単一精子または単一染色体の測定が挙げられる(例えば、Ruanoら、PNAS、87:6296−6300、1990およびZhangら、PNAS,89:5847−5851,1992を参照のこと)。単一精子選別アッセイにおいて、個々の選別された精子由来のPCRで増幅されたDNAが、遺伝子型決定される。2つのハプロタイプを明らかにするために十分な統計学的信頼度を得るために、個体由来の複数精子細胞(少なくとも3〜5)が型決定される。原理的には、この選別アプローチは、染色体に適用され得る。しかし、この技術は複雑であり、そして現在まで、ほんのいくつかの研究室においてのみ成功している。
分子クローニング方法は、個体のDNA(またはcDNA)の標的領域をベクター内にクローニングし、そして単一のコロニーから得られたDNAを遺伝子型決定する。各個体について、2つのハプロタイプを得るために、複数のコロニーが必要とされる。この方法は、多くの実験室によって使用されているが、非常に労働集約型であり、時間を消費し、そしていくつかの場合においては、実施することが困難であり得る。容易な代替物が存在しないので、研究者らは、この方法の使用を強制される。
AFM(原子間力顕微鏡)画像化(Woolleyら、Nature Biotechnology,18:760−763,2000およびTatonら、Nature Biotechnology,18:713,2000)は、個々のDNA分子上の多型部位を直接可視化することを可能にする。この方法は、高解像度の単層カーボンナノチューブを備えるAFMを利用して、DNAフラグメント中の、100〜10,000個の塩基を含む複数の多型部位を直接読み取る。このアプローチは、標識されたオリゴヌクレオチドプローブの、DNAフラグメント中の標的配列への特異的ハイブリダイゼーション、引き続くAFMによる標識の存在および空間的位置の直接の読み取りを包含する。このようなシステムのスループットおよび感度は、まだ実証されていない。
(サンプルの調製)
遺伝子座特異的なハプロタイプ分析は、ゲノムからDNAの領域の単離を必要とする。これらのサンプル調製法は、クローニング、PCRまたは他のDNA単離の方法を含み得る。本発明のこの実施形態において、ポリメラーゼ連鎖反応(PCR)が、サンプル単離の好ましい方法である。PCRは、分析のために特異的であるゲノムの領域を単離するために、目的の領域について行われる。PCRは、数百塩基〜10000塩基対を超える範囲にわたって利用され得る。PCRの長さが長くなるほど、得られるハプロタイプ決定の情報が多くなる。ロングPCR(Long PCR)または他の類似の技術を用いて、所望のフラグメントを作製し得る。PCRは、単分子ハプロタイプ分析において使用するのに簡便である。なぜなら、単分子分析は、従来のSNP分析ではこの決定が可能でない場合に、ハプロタイプ決定を可能にするからである。クローニングまたは他のフラグメント単離技術が、従来のSNP分析についても可能であり、これは、2コピーの二倍体ゲノムが物理的に分離されるためである。PCR分析において、2コピーの二倍体ゲノムが両方とも増幅され、目的の領域の2コピーの合成混合物を作製する。こうして、PCRで増幅したDNA領域は、単分子検出の技術を用いる分析に特に適する。
(タギング化学(Tagging chemstry))
ゲノムの異なる部位にDNAをタギングする複数の方法がある。これらは、配列特異的なオリゴヌクレオチドまたは、他のハイブリダイズ用試薬(例えば、ペプチド核酸)を用いる、目的の領域への直接ハイブリダイゼーションを含む。タギングする他の方法としては、プライマー伸長反応、リガーゼ指向配列検出の使用および、配列の検出のための蛍光共鳴エネルギー伝達の使用が挙げられる。
4ヌクレオチド標識スキームを、作製し、標的DNAのA、C、GおよびTを別個のラベルで標識し得る。ステーションを直線的に通過するように移動する場合、このような分子は、シグナルの線形順序を作製し、これは、標的DNA上のヌクレオチドの線形順序に対応する。4ヌクレオチドストラテジーの使用の利点は、データ解釈の容易さおよび、ユニット特異的なマーカーの全配列が標識された単一のポリマーから決定され得るという事実である。しかし、4つ全ての塩基に外来の標識を加えることにより、立体障害の問題を生じ得る。この問題を減らすために、ヌクレオチドのいくつか、または全ての固有の特性を用いて、ヌクレオチドを標識し得る。上記のように、プリンおよびピリミジンの各々が、別個の吸収スペクトル特性を有するため、ヌクレオチドは、固有に標識される。本明細書中に記載される標識スキームの各々において、ヌクレオチドは、外来性にか、または、固有に、標識され得るが、4ヌクレオチド標識法が用いられる場合、少なくともいくらかのヌクレオチドが固有に標識されることが好ましい。外来の標識が4ヌクレオチド標識スキームとともに用いられる場合、標識が、小さく、かつ電荷が中性であり、立体障害を減少することがまた好ましい。
4つのうち3つのヌクレオチドが標識される、3ヌクレオチド標識スキームがまた実施され得る。4つのうち3つのヌクレオチドのみが標識される場合、本発明の方法により作成されたデータの分析は、4つ全てのヌクレオチドが標識される場合よりもより複雑である。4番目の標識されていない型のヌクレオチドの数および位置が別個に決定されなければならないため、このデータはより複雑である。4番目のヌクレオチドの数および位置を決定するための1つの方法は、標識された核酸分子の2つの別のセットの分析を利用する。例えば、1つの核酸分子が、A、CおよびGで標識され、そして、他方がC、GおよびTで標識され得る。2セットからの標識されたヌクレオチドの線形順序の分析は、配列データを得る。各セットについて選択された3つのヌクレオチドは、2セットが4つ全ての標識されたヌクレオチドを含む限りは、多くの異なる可能性を有し得る。例えば、ACGのセットは、標識されたCGT、ACTまたはAGTのセットと組にされ得る。
4番目のヌクレオチドを含む配列がまた、ネガティブ標識ストラテジーを用いる、少なくとも2つの差次的に標識されたポリマーのセットではなく、1標識されたポリマーのみを用いることによって決定され、ポリマー上の4番目のヌクレオチドの位置を同定し得る。ネガティブ標識は、標識されていないユニットに基づく配列情報の同定を含む。例えば、核酸分子の3つのヌクレオチドが、単一の型のシグナルを提供するラベルで標識される場合、ポリマー骨格に沿った標識されていない点が、4番目のヌクレオチドによるものに違いない。このことは、核酸分子上の標識されたヌクレオチド間の距離を決定することによって達成され得る。
オリゴヌクレオチド上のdNTPは、種々の検出可能な部分で標識され得、その結果、標識されたオリゴヌクレオチドでタグ化したDNAが検出され得る。dNTPは、TAMRA、Cy5、Cy3、IRD800、フルオレセイン、Texas Red、緑色蛍光タンパク質および他の蛍光ラベルで蛍光標識され得る。dNTPは、赤色、橙色、緑色、紫色および青色を含む、別個の着色蛍光剤で標識され得る。dNTPはまた、3H、14C、32Pまたは125Iで放射能標識され得る。dNTPはまた、西洋ワサビペルオキシダーゼ、アルカリホスファターゼおよび他の酵素的に検出可能な触媒で酵素標識され得る。dNTPはまた、他の分子へのその親和性によって(例えば、アビジン−ビオチン、プロテインA−IgG)、そして、他の特異的な相互作用を介して標識され得る。
(プライマー伸長が媒介する化学および読み出し)
ロングPCRで作製したフラグメントの多色分析と組み合せてプライマー伸長技術を用いて、単分子ハプロタイプ分析を作製し得る。ハプロタイプ決定されるDNA配列を、1つ以上のSNP特異的なプライマーとハイブリダイズさせる。これらのプライマーは、実際のSNPのちょうど5’の配列に特異的である。次いで、4つのうち1、2、または3のヌクレオチドを識別可能なラベルで標識する(例えば、dCTP−Cy5(Amersham)およびdUTP−TAMRA(Molecular Probes)蛍光ヌクレオチドを用いて、DNA鎖上のハプロタイプが決定され得る)。プライマー伸長は、標識されたヌクレオチドのみの存在下で実施される。SNPに対して特異的にアニールするヌクレオチドは、プライマーを標識されたヌクレオチドで伸長させる。
どのSNPとどの標識されたヌクレオチドを同時に分析するかの選択に注意を払わなければならない。SNPの3’末端のヌクレオチドが、SNP自体にハイブリダイズするものとは、別の標識されたヌクレオチドにハイブリダイズする場合、このヌクレオチドは、二重に標識され、潜在的に結果をあいまいにする。また、SNPの3’末端のヌクレオチドがSNP自体と同じヌクレオチドである場合、このヌクレオチドはまた、SNPと同じヌクレオチドで標識され得る。このことは、次のヌクレオチドが同じヌクレオチドである限りは生じ得る。このストレッチの3’、次のヌクレオチドが別の標識されたヌクレオチドとハイブリダイズしないか、または、上記のように同じ二重標識が生じることに注意を払わなければならない。技術のこの制限は、標識されたヌクレオチドは、1番目のヌクレオチドの伸長の間に大部分が使い果たされるように、過剰量の標識されたヌクレオチドを用いないことによって克服され得る。
ロングPCRのフラグメントは、SNP特異的なプライマーにハイブリダイズし、2標識dNTPのみの存在下で伸長する(図2)。dNTPのみの取り込みは、塩基間の相補性が存在する場合に生じる。2つSNPのアッセイは、4つの別個の可能なハプロタイプ(22バージョン)を可能にする。プライマー伸長についての2つの別に着色されたdNTPおよび分子のインターカレーター(intercalator)についての3番目の色(例えば、緑色)を用いて、4つの別個の色の組み合わせは、別個のハプロタイプの識別を可能にした。データのサンプルアウトプットを図3に示す。
図3Aのサンプルアウトプットにおいて、ハプロタイプAとハプロタイプBの両方が混合物中に存在する。両方のハプロタイプが50/50増幅され、そしてまた、90%の検出/化学効率が存在することを仮定する。非効率な検出/化学は、他のハプロタイプチャネルに「バックグラウンド」を作製する。例えば、ハプロタイプAの認識から生じたバックグラウンドは、ハプロタイプBおよびCのチャネルにおいて9%であり、ハプロタイプDチャネルにおいて1%である。この非効率性は、この種の分析における説明される必要があり、そしてまた、配列部位の認識のためにさらなる色を使用することによって、さらに緩和され得る。
パネルAにおいて、ハプロタイプAおよびBが、同じ量で存在する。ハプロタイプAが存在する場合、90%の検出/化学効率が想定され、細い点線の棒によって表されるリードアウトを期待する。ハプロタイプAチャネルに90%のシグナル、ハプロタイプBチャネルに9%のシグナル、ハプロタイプCチャネルに9%のシグナル、そしてハプロタイプDチャネルに1%のシグナルが存在する。このことは、ハプロタイプBおよびCのハプロタイプAに対する類似性が、ハプロタイプDのハプロタイプAに対する類似性よりも高いことに起因する。ハプロタイプAがハプロタイプBまたはハプロタイプCと間違えられるためには、1つの蛍光ラベルが、誤っているかまたは読まれないことが必要であり、一方で、ハプロタイプAがハプロタイプDと間違えられるためには、2つの蛍光ラベルが誤っているか、または読まれないことが必要である。ハプロタイプBが存在する場合、再度、90%の検出/化学効率が想定され、黒い平行線模様の棒によって表されるリードアウトを期待する。ハプロタイプBは、シトシンおよびインターカラント上、色2で標識される。DNAがインターカラントで標識されるほとんど100%の機会が存在し、従って、インターカラントは効率計算に計算されない。従って、ハプロタイプBは、その蛍光色素が誤っているかまたは読まれない場合、ハプロタイプDと間違えられるのみであり得る。
データ分析は、検出化学および標識化学の非効率さを考慮に入れることを必要とする。さらに、混合物中に存在する2つのハプロタイプの差次的な増幅が存在し得る(これらが1:1の比で存在する場合でさえ)。以下の実施例は、これらの対立遺伝子の差次的な増幅ならびに不完全な化学/検出の両方を考慮したシグナルアウトプット案を例示する。
図3Bにおいて、ハプロタイプBおよびハプロタイプCが混合物中に存在することは明らかであり、これは、非効率さのために、ハプロタイプBおよびCが互いに由来し得ない(すなわち、各々が各々自体において固有である)ためである。パネルBにおいて、ハプロタイプBおよびCが同じ量で存在する。この場合、ハプロタイプBは、図3Aと同じ割合で、点線の棒により表される。ハプロタイプCのリードアウトは、黒い平行線模様の棒によって表される。ハプロタイプBのように、ハプロタイプCは、1つのみの発蛍光団および緑色インターカラントで標識される。ハプロタイプCは、この発蛍光団がシトシン上の色2の代わりに、チミジン上の色1であるという点でハプロタイプBと異なる。90%の検出/化学効率を想定すると、90%のハプロタイプCに対するリードアウトがCチャネルにはっきりと見え、10%のリードアウトがDチャネルにはっきりと見える。ハプロタイプDと同様に、ハプロタイプCは、1つのみの発蛍光団を失わなければならず、従って、発蛍光団が付着していないハプロタイプDと混同し得るのみである。ハプロタイプCおよびハプロタイプDを示すシグナルが同じ値であったとしても、2つのハプロタイプのみが混合物中にあり、ハプロタイプBとハプロタイプCのみが、サンプル中に存在すると結論付けなければならない。この分析は、他の例に対しても期待され得、これらの非効率さにもかかわらず、ハプロタイプが依然として、2つの別個の色のdNTPとインターカレーター色のみの使用により疑いなく決定され得るということに当てはまる。
図3Cにおいて、再び、ハプロタイプBとハプロタイプCの両方が存在するが、ハプロタイプBは、ハプロタイプCが存在する量の10倍で存在する。リードアウトは、ハプロタイプCについてのシグナルがハプロタイプBについてのシグナルに関して10倍消失することを除いて、第2の場合においてと同じである。ハプロタイプCのこの低い相対濃度でさえ、ハプロタイプCが存在しなければならないことが明らかである。ハプロタイプBの90%の検出/化学効率から生じるエラーは、Cチャネルでは目立たない。従って、ハプロタイプBとハプロタイプCのみが存在し得ることが既知である場合、ハプロタイプCチャネルにおけるいかなるシグナルの検出も、ハプロタイプCが存在しているに違いないことを意味する。
(SNPベースの識別のためのPNAを用いるハイブリダイゼーションベースのアプローチ)
SNPベースの識別のための同じ型のアプローチのために、2色PNAを用い得る。2つの別の色で標識したPNAは、1本鎖DNAまたは2本鎖DNAのいずれかにハイブリダイズする。ハイブリダイゼーション混合物を洗浄し、浄化し、そして、直接分析のために、単分子リーダーに導入する。特定のSNPにハイブリダイズするように作製されたPNAは、2つの別の蛍光部分で標識され得る。ハイブリダイゼーションの後、着色したインターカラントを3番目の色として添加し得、検出器を通過させてDNA上の別の蛍光標識の色および位置を見出すか、または、単純に観察して標識したDNA上の色の組み合わせを見出すことによって、標識したDNAを、検出し得る。
(4色分析を用いるプライマー伸長)
上記の3色分析と同様に、SNPハプロタイプ分析に1つの追加の蛍光dNTPを用いることによって、さらなる情報が得られ得る。蛍光dUTPおよびdCTPに加えて、蛍光dATPが容易に入手され得る。例えば、IR70−dATP(Li−Cor)を4番目の色(dNTPからの3色と、インターカレーターからの4番目の色)として利用し得る。図4において、多色蛍光ハプロタイプの別の場合が分析され得る。この模式図において、Tが1番目の色(例えば、橙色(IR))で標識され、Cが2番目の色(例えば、赤色(R))で標識され、Aが3番目の色(例えば、緑色(G))で標識され、そして、DNAが、インターカレーターで標識した4番目の色(例えば、青色(B))で標識される。このアッセイは、図3における3色分析のように設定される。このように、90%の検出/化学効率からのエラーは、多くの状況における低いレベルの種々のハプロタイプの存在から区別され得る。
図4において、ロングPCRフラグメントをSNP特異的なプライマーとハイブリダイズさせ、3つのdNTPのみの存在下で伸長させる。dNTPの取り込みは、塩基間に相補性が存在する場合にのみ生じる。2つのSNPのアッセイは、4つの異なる可能なハプロタイプ(22バージョン)を可能にする。プライマー伸長のための3色別個に着色されたdNTPおよび分子のインターカレーターのための4番目の色を用いると、4つの別の色の組み合わせが、別のハプロタイプの識別を可能にする。
(4つのプライマー伸長した塩基の4色分析を用いるハプロタイプ分析)
プライマー伸長反応はまた、4つの別個に標識されたdNTPと共に用いられ得る。1つの例において、Tは色1(例えば、橙色)、Cは色2(例えば、赤色)、Aは色3(例えば、青色)、およびGは色4(例えば、緑色)である。ハプロタイプAは、SNP1についてT、SNP2についてCを有し、ハプロタイプBは、SNP1についてA、SNP2についてCを有し、ハプロタイプCは、SNP1についてT、SNP2についてGを有し、そして、ハプロタイプDは、SNP1についてA、SNP2についてGを有する。各dNTPは、異なるスペクトル的に識別可能な発蛍光団を有する。
このシナリオにおいて、4色スペクトル識別を可能にするSNPの対を用いる、4色分析の使用は、4つの塩基の明白な識別を容易にする。ハプロタイプAは青色および橙色であり、ハプロタイプBは青色および赤色であり、ハプロタイプCは橙色および緑色であり、そして、ハプロタイプDは青色および緑色である。この例において、4つのハプロタイプの各々は、固有の色の組み合わせにより決定される。
(多色単分子ハプロタイプ分析の制限)
単分子検出を用いる、ハプロタイプの多色分析には特定の制限がある。例えば、選択されるSNPの対は、存在する種々の多型が4つの別のプライマー伸長した生成物を生じるようにされる必要がある。この方法論は、以下のシナリオでは機能しない。Tは色1(例えば、橙色)で標識され、そしてAが色2(例えば、青色)で標識される。ハプロタイプAは、SNP1についてT、SNP2についてTを有し、ハプロタイプBは、SNP1についてT、SNP2についてAを有し、ハプロタイプCは、SNP1についてA、SNP2についてAを有し、そして、ハプロタイプDは、SNP1についてA、SNP2についてTを有する。従って、ハプロタイプAは青色であり、ハプロタイプBは青色および橙色であり、ハプロタイプCは橙色であり、そして、ハプロタイプDは橙色および青色である。ハプロタイプAおよびDは、色の組み合わせによって識別不可能である。従って、固有の色の組み合わせは、4つの異なるハプロタイプについて作製されない。この様式において、単分子検出の非効率さは、分析を複雑にし、SNPのこの組み合わせについて、ハプロタイプ決定を不可能にさえする。SNPは、4つの塩基の別の組み合わせが塩基のプライマー伸長の際に取り込まれるように選択される必要がある。
(直接DNA分析を用いるSNPアッセイ検出のために使用されるさらなる化学)
SNP検出のための1つの方法としては、直接ハイブリダイゼーションが挙げられる。DNAは、多色配列特異的標識化のための別の化学を用いて問い合わされ得る。オリゴヌクレオチドの場合、SNPの組み合わせが、アッセイされる4つのオリゴヌクレオチドに、独立したハプロタイプ情報を与えさせることを想定して、4つの別のオリゴヌクレオチドを用いて、目的の部位にハイブリダイズさせ得る。
別の発蛍光団で標識した競合するオリゴヌクレオチドをDNAサンプルに導入し、オリゴヌクレオチドの競合を可能にするストリンジェントな条件下でハイブリダイズさせる。正しいマッチが、適切なハプロタイプを決定させる。この型の分析が、正しい配列特異的タギング化学と共に、ssDNAおよびdsDNAで用いられ得る。このアプローチは、検出方法論のために識別可能なラベルを取り込む、任意の型のssDNAまたはdsDNA配列タギング化学で達成され得る。
1つの例において、SNP1は、AまたはTとハイブリダイズし得、SNP2はCまたはGとハイブリダイズし得る。SNP1がAにハイブリダイズする場合に、SNP1に特異的にハイブリダイズするオリゴヌクレオチドは、色1(例えば、青色)で標識される。SNP1がTにハイブリダイズする場合に、SNP1に特異的にハイブリダイズするオリゴヌクレオチドは、色2(例えば、橙色)で標識される。SNP2がCにハイブリダイズする場合に、SNP2に特異的にハイブリダイズするオリゴヌクレオチドは、色3(例えば、赤色)で標識される。SNP2がGにハイブリダイズする場合に、SNP2に特異的にハイブリダイズするオリゴヌクレオチドは、色4(例えば、緑色)で標識される。ハプロタイプAは、SNP1についてT、SNP2についてCを有し、ハプロタイプBはSNP1についてA、SNP2についてCを有し、ハプロタイプCはSNP1についてT、SNP2についてGを有し、そして、ハプロタイプDはSNP1についてA、SNP2についてGを有する。ハプロタイプAは青色および橙色であり、ハプロタイプBは青色および赤色であり、ハプロタイプCは橙色および緑色であり、そして、ハプロタイプDは青色および緑色である。この例において、4つのハプロタイプの各々が、固有の色の組み合わせにより決定される。
この方法は、2つのSNPが同じヌクレオチドにハイブリダイズした場合でさえ、使用され得る。このオリゴヌクレオチドは、ユニットとして標識される。各オリゴヌクレオチドは、通常、1つのSNPにハイブリダイズし得るのみであり、他のSNPにはハイブリダイズし得ない。それゆえ、SNP1がAにハイブリダイズし、SNP2がまたAにハイブリダイズする場合でさえ、「A」SNP1に特異的にハイブリダイズするオリゴ1は、2つのSNPを囲む配列が完全に同じであるというありそうにない状況下以外では、「A」SNP2とハイブリダイズしない。
(DNAの相補鎖をアッセイすることによる確認)
SNPハプロタイプの確認は、DNAの相補鎖のアッセイを介して行われ得る。この分析は、蛍光標識したdNTPの同じ混合物を用いる、ハプロタイプの確認を可能にする。
図5において、反応#1は、プライマー伸長産物の二重色検出をアッセイし、ハプロタイプが連続した様式でTおよびCであることを決定する。反応#2は、別のチューブで実施され、そしてまた、dNTPの同じ蛍光標識された混合物を用いてアッセイされる。プライマー伸長反応は、逆方向のプライマー伸長産物を、目的の領域の相補鎖を認識するプライマーと共に用いて行われる。この様式において、ハプロタイプは、DNAの逆方向の鎖の分析を用いて確認される。ハプロタイプを確認する能力は、誤ったポジティブなハプロタイプと誤ったネガティブなハプロタイプの割合を低下させる。
(dNTP上の色のローテーションによる確認)
相補鎖分析による確認と同様に、dNTPの色のローテーションは、混合物中に存在するハプロタイプのより確実な確認を可能にする。この方法は、4つの別のdNTPの組込みにおける任意のエラーおよび差異を克服することを可能にする。例えば、DNAの鎖上の連続した位置にAおよびGを有するハプロタイプは、1つの実験においては赤色および緑色であり得る。確認反応において、反応混合物中に導入されるAおよびGは、橙色および青色であり得る。第1の実験における赤色および緑色の存在と、第2の実験における橙色と青色の存在は、この系において確認されるハプロタイプを示す。
(3つのSNPハプロタイプのアッセイ)
3つまたは4つのSNPハプロタイプは、非常に多くのSNPを分析することが必要であるので、実行することはより困難である。この実施形態において、単一分子分析の化学における効率の悪さは、より精巧なデータ分析を必要とする。3つのハプロタイプおよび3つの色を用いる分析に関して、単一分子の化学/検出における効率の悪さは分析を複雑にする。
100%効率の検出および配列特異的化学の場合、8つの可能なハプロタイプの各々は、異なる発蛍光団で標識された4つの塩基を使用すると、特有の色特性(color signature)を有する。しかし、検出化学および検出は効率の悪い化学、光退色、または不活性な発蛍光団に起因して不十分であるので、これらの色の組み合わせは、表1および図6に示されるように混同され得る。図6において、Cは色1(長い破線で示される)であり、Gは色2(短い破線で示される)であり、Tは色3(長い破線、続いて短い破線で示される)であり、そしてAは色4(実線で示される)である。
効率的な検出および配列特異的化学によって、図6における8つの可能なハプロタイプの各々は、異なる発蛍光団で標識された4つの塩基を使用すると特有の色特性を有する。しかし、検出化学および検出は効率の悪い化学、光退色、および不活性な発蛍光団に起因して不十分であるので、これらの色の組み合わせは、混同され得る。ハプロタイプ3(Aを検出することができない)は、ハプロタイプ6について混同され得る。ハプロタイプ3は、Tを検出することが不可能な場合、ハプロタイプ8と混同される。ハプロタイプ1は、ハプロタイプ5と重複する。これらは区別することができない。他の標識化ストラテジーは、ハプロタイプの全てを区別するために必要とされる。ハプロタイプ1,3、6および8が反応混合液に存在し、検出/化学の効率が90%であった場合、ハプロタイピングデータ(haplotyping data)のスナップショットを表1に示す。
(表1.反応混合液中のハプロタイプの存在の相対値)
色スキームのこの実施形態において、この標識化ストラテジーは、効率的ではない。なぜなら、ハプロタイプを適合するための特有の色スキームが存在しないからである。異なる色スキームからのバックグラウンドシグナルは、適合するアウトプットシグナルを混同しない。ハプロタイプ2を示すバックグラウンドシグナルは8であり、反応セットにおいて正確に示されるハプロタイプとは明らかに区別される。しかし、ハプロタイプが示されることが知られていない場合、ハプロタイプ1をハプロタイプ5とは区別することができず、そしてハプロタイプ3をハプロタイプ7と区別することもできない。
これは、誤差が検出およびSNP位に依存して変化した標識化化学に関連した状況では克服され得る。ハプロタイプ1および5の存在は、ハプロタイプ2および4となって現れる誤差を生じる。ハプロタイプ1は、SNP位2の標識を喪失する場合、ハプロタイプ2となって現れる。ハプロタイプ5は、SNP1位の標識を喪失する場合、ハプロタイプ2となって現れる。この標識の喪失がこれらの位置とは異なる場合、ハプロタイプ2となって現れるシグナルの差は、ハプロタイプ1と5との間を区別するために使用され得る。
より効率的な標識化スキームは、3つのSNPハプロタイプの評価において使用され得る。1つの可能性のある標識化スキームは、異なる発蛍光団で標識されたA、T、Gであり、SNPの二重対立遺伝子的な性質は、特有の色スキームを有する8つの異なる可能性のあるハプロタイプの適合を可能にする。この標的スキームの使用は、図6と同じ色スキームを用いて図7に示されるように、異なるハプロタイプ間により多くの「クロストーク」を形成する。
表2は、特定の反応混合物におけるハプロタイプ1、3、6および8との反応混合物を試験する。検出/化学の効率は、90%である。
(表2 反応混合物におけるハプロタイプの存在の相対値)
バックグラウンドクロストークは、括弧中に示される。ハプロタイプ7は、最も高いバックグラウンドレベルを有する。この値にもかかわらず、シグナル 対 ノイズは、測定されるべきサンプルに存在するハプロタイプにとってなお十分に高い。このタグ化スキームを使用して、ハプロタイプ分析は、3つまたは4つのSNPに広げ得る。制限は、異なるSNPの各々について可能な色の数から生じる。各SNPに対して1つの異なる色が必要とされる。
5つのSNPハプロタイプはまた、タグ化アプローチの慎重な使用によって決定され得る。図8に示される標識化スキームにおいて、最初の4つのSNP、A、C、T、Gは、それぞれ異なる色、色1(例えば、青色の実線)、色2(例えば、赤色の長い破線)、色3(例えば、オレンジ色の長い破線に続く短い破線)、および色4(例えば、緑色の短い破線)。5番目のGは、混合タグ化アプローチの使用によって区別され、dGTPは、色4(例えば、緑色)で標識されたdGTPおよび色5(例えば、紫色)で標識されたdGTPの50/50割合で示される。この様式において、ハプロタイプは、DNAの1つのフラグメント上に同時に存在する5つの色検出によって検出される。2つのSNPが同じヌクレオチドに特異的にハイブリダイズする場合、1:2:1の割合で両方とも色1、色1および色2、および両方とも色2が現れる。同様に、このアプローチは、5つより多いSNPおよび各々のハプロタイプに適用され得る。
(マルチカラー単一分子分析のための特別条件)
例えば、プライマー伸張、特に4色アッセイについて、発蛍光団の選択および光の系は、単一分子産物の成功した結果のために特に重要である。4つの発蛍光団の発光スペクトルは、単一分子レベルで個々の発蛍光団を十分に区別し得るために相当十分に分離されることが必要である。本発明は、このマルチカラー分析を可能にする波長および発蛍光団の選択を開示する。
(表3)
他の当該分野で公知の発蛍光団もまた、使用され得る。
(単一分子検出ハプロタイプ分析の装置についての特別条件)
本発明は、スライド/カバースリップ、キャピラリー、またはマイクロチップを備えるサンプルを保持する装置を使用して実施され得る。1実施形態は、米国特許第6,403,311号および同第6,355,420号に記載されるようなフロースルーナノチップの使用による。
PCRは、分析されるゲノムの十分なコピーが反応混合物中に存在するか否かを分析するために必要とされない。この反応は、ゲノムDNA上で直接生じ得る。
(2つより多い集団の分析)
集団をプールする技術および単一分子遺伝学を用いたその後の分析は、さらに2つより多い集団の遺伝学の相関に適用され得る。2つより多い集団の方法論は、異なる大きなファウンダ(founder)集団が、単一反応物を用いて質量を比較され得る、複雑な民族分析を可能にする。ゲノム長に沿った異なる部位を、この技術を用いて比較し、個々の集団についての異なる反応物の必要性を非常に単純にし得る。
本発明の1実施形態において、DNA集団をプールした後、このDNAは増幅される。挿入/欠損分析は、DNA上で実施され得る。この後に、ハプロタイプ分析が行われる。
本発明の別の実施形態において、このDNAはプール後には増幅されない。直接線形分析は、DNA上で実施され、SNP分析が実施される。次いで、他の遺伝学バリエーション様マイクロサテライト、SNP、変異などが見出され得る。
(オーダー標識ストラテジー(ordered label strategy)を用いるポリマー分析法)
上記の本発明の標識化DNAフラグメントは、米国特許第6,403,311号に開示される方法を用いて分析され得る。この特許は、以下に示されるポリマーを分析する方法を詳説する。
本明細書で使用される場合、「標識されたユニット特異的マーカー」とは、特定のユニットを同定するポリマーに特異的な任意のユニットマーカーである。標識されたユニット特異的マーカーとしては、例えば、特定のユニット、タンパク質、ペプチド、核酸、多糖、短いオリゴマー、tRNAなどに結合される蛍光マーカーが挙げられ、これらは、特定のユニットを認識し、結合し、そして例えば、元来標識された特性を有するか、または外因性標識を含めることによって、あるいは抗体のような別の検出分子に結合することによって検出され得る。
ポリマー依存性インパルスから得られたデータは、コンピューターのメモリーシステムである、データベースまたはデータファイルに保存され得る。各ポリマーからのデータは、メモリーシステムに保存され得、その結果、例えば、各ポリマーに対して特有の識別子を割り当てることによって、他のポリマーについてのデータプロセッサによって独立してアクセスされ得る。
このデータから得られた情報およびどのように分析されたかについての情報は、シグナルを生成する因子と相互作用を引き起こした標識されたユニット特異的マーカーの数および型に依存する。例えば、特異的な型の標識を有する単一ポリマー各々のユニット特異的マーカー(ユニット特異的マーカーの各型(例えば、核酸Aの全て))は標識され、次いで、ポリマー内の各ユニット特異的マーカーの順序を、単一ポリマーの分析から決定し得る。しかし、核酸の4ユニットのうち1つだけが標識される場合、より多くのデータが核酸の完全配列を決定するために必要である。さらに、データ分析方法は、ポリマーが一本鎖または二本鎖または他の複合体であるか否かに依存して変動する。いくつかの標識スキームおよびこれらのスキームによって生成されたコンピューターシステムデータを用いる分析方法が、以下にさらに詳細に記載される。この標識ストラテジーは、議論を簡略化するために核酸に関して記載される。しかし、これらのストラテジーの各々は、全てのポリマーを標識するのに有用である。
標識のいくつかの異なるストラテジーが可能であり、これらとしては、標識されたユニットの異なる型、標識されたユニットの異なる割合、および一本鎖標識または二本鎖標識の順列が挙げられる。以下の記載は、本発明に従う有用な標識ストラテジーの例である。しかし、本発明は、以下の例示的な記載に限定されない。本明細書に記載される標識方法およびこのような方法により得られたデータは、議論を簡単にするためにDNAを参照して記載される。しかし、本発明は、DNAを分析する方法に限定されるのではなく、個々のモノマーユニットから構成される任意のポリマーの型が利用され得る。以下の説明がDNAまたは核酸を参照する場合、任意の多くのポリマーが置換され得、そしてこの説明がヌクレオチド、塩基(すなわち、具体的には、A、C、T、もしくはG)を参照する場合、これらの用語は、所望されるポリマーの特定のモノマーユニットで置換され得ることが、当業者に明らかである。例えば、このポリマーは、ペプチドであり得、そしてこの場合、モノマーユニットは、アミノ酸である。最も単純な標識スキームは、異なる標識での全4種類のヌクレオチドを標識することに関する。3つ、2つ、または1つのユニットが標識される標識スキーム、あるいはユニットの多様な組み合わせが、多重ヌクレオチドにわたってユニット特異的マーカーを用いて標識される標識スキームもまた、可能である。
ヌクレオチド間の距離は、いくつかの方法によって決定され得る。まず、ポリマーおよびステーションは、線形様式および一定速度で互いに関連して移動し得、その結果、核酸分子の単一ユニット特異的マーカーが単一の時間間隔でこのステーションを通過する。2つの時間間隔が検出可能なシグナル間で消失する場合、検出可能シグナルを生成することができない標識されていないヌクレオチドがこの位置に存在する。ユニット特異的マーカー間の距離を決定する方法は、無作為な1塩基標識を参照して以下で詳細に議論される。あるいは、ポリマーおよびステーションは、互いに相互作用を引き起こし得、その結果、各ユニット特異的マーカーは、検出可能シグナルを同時に生じるようにステーションで同時に相互作用する。生じた検出可能シグナルの各々は、ユニット特異的マーカーが位置付けられるポリマーに沿った位置で生じる。検出可能シグナル間の距離は、標識されていないユニット特異的マーカーが核酸分子に沿ったどこかに位置付けられるか否かを決定するために直接計算され得る。
別の標識スキームにおいて、無作為な1ヌクレオチド標識スキームもまた使用され得る。この方法において、集団の分析および/またはDNA瞬間移動速度のいずれかによって得られた距離情報を使用して、2つの標識されたヌクレオチドを分離するヌクレオチドの数を決定する。4つの別個に標識された標的分子の分析により、完全な配列を得る。
塩基間の距離を決定する2つの方法がある。1つは、DNA移動の瞬間速度を決定することを必要とし、これは、特定標識に対するエネルギー移動またはクエンチングの持続時間から容易に算出される。もう1つは、標的DNA分子の集団およびその対応するガウス距離分布を分析することを含む。
瞬間速度法は、シグナル間の分離の時間(t)により乗じられる、DNA移動の既知の瞬間速度(v)に基づく距離分離の決定を含む。瞬間速度は、相互作用ステーションによって、標識されたヌクレオチドが通過するために要する時間を測定することにより見出される。因子の濃縮された領域の長さ(d)は既知であるので(因子の局在化領域、例えば、濃縮されたドナーの蛍光体領域の厚みの較正および物理的測定による)、この速度は、単にv=d/tである。プロットされるとき、連続的な検出可能シグナルから得られるエネルギー放射パターンにおける変化を示す生データの分析は、曲線を生成し、この曲線は、左から右へと2つのエネルギー強度の減少が続く、2つのエネルギー強度の増加を示す。第1のエネルギー強度減少からの水平域(t.1で示される)は、第2の水平域のそれ(t.2)の2倍である。相互作用ステーションの長さは、51Åとして与えられる。この与えられた情報から、標識されたヌレレオチドの数が知られる。さらに、この2つの分離の距離は、DNA移動の速度をドナー強度水平域の時間に関連付けることにより決定される。
標識されたヌクレオチドの数は、簡単に強度減少の数により示される。2つの強度減少がある場合、DNA上に2つの検出可能な標識があるはずである。塩基分離の距離を決定するために、DNA移動の瞬間速度を知ることが必要であり、これは、1つの標識されたヌクレオチドが、因子の局在化領域および因子の局在化された領域の長さを横切る時間を知ることにより見出される。因子の局在化された領域の長さは、51Åとして与えられる。1つの標識されたヌクレオチドが、因子の局在化領域を横切る時間は、第1の強度減少および第1の強度増加によって境界される(灰色の影の領域、7.5sとして示される)。DNA移動の速度は、6.8Å/sである。塩基分離は、速度(6.8Å)によって乗じられる、10塩基対に等しい標識ヌクレオチドを分離する時間(t.sub.1=5s)から派生する。交差検証の方法として、51Å−t2vはまた、塩基分離を生じる。
集団法では、標識されたヌクレオチドの全集団が考慮される。速度法については必要であるような、因子の局在化領域の長さおよび瞬間速度の知識は、必ずしも必要ではない。集団分析の使用は、個々の核酸分子に対する正確な測定の必要性をなくする。
各々がナノチャネルを横断する5つの核酸分子を用いる集団分析の例を以下に説明する。同一のDNAフラグメントの集団を代表する5つの分子を調製する。一定の電場では、第1の標識ヌクレオチドと第2の標識ヌクレオチドとの間の検出時間は、すべてのDNA分子について同一であるべきである。実験条件下では、これらの時間はわずかに異なり、時間のガウス分布に至る。このガウス分布のピークは、2つの標識ヌクレオチド間の分離の距離(d)の特徴である。
1ヌクレオチドのランダムに標識された核酸分子の集団を利用するさらなる例(6つの分子が集団を代表する)は、集団分析の概念および距離情報の決定をさらに説明する。核酸は末端標識され、参照点を提供する。十分な核酸分子で、任意の2つのA間の距離が決定され得る。2つの分子は、サブ集団として考慮されるとき、塩基分離分子を伝達し、4および6塩基分離の分布が生成される。同じ論理を集団の残りに拡張して、DNA上のすべてのAの位置が決定され得る。全配列は、その他の3つの塩基(C、G、およびT)についてこのプロセスを繰り返すことにより生成される。
上記に記載の例におけるユニット特異的マーカーの1つのタイプのすべてを標識することに加え、標識されるべきヌクレオチドのすべてのヌクレオチドまたはマーカーが標識されるわけではない種々の標識スキームを用いることが可能である。ランダムに標識されたフラグメントの大集団では、標的DNA上の連続するA間の距離が見出され得る。末端標識は、DNAの端部と最初のAとの間の距離を同定するために供される。その他のヌクレオチドについて同じ分析を繰り返すことは、その核酸分子の集団内のAのすべての位置を識別するデータをコンパイルすることにより16マーの配列を生成する。これらのステップは、次いで、核酸の集団中のその他のヌクレオチドにユニット特異的なマーカーを用いて繰り返され得る。このような方法を用いることの利点は、立体影響の欠如および標識の容易さを含む。このタイプの標識は、ランダム標識化と称される。「ランダム標識」されているポリマーは、すべてより少ない特定タイプのユニット特異的マーカーが標識されているポリマーである。ランダム標識されたポリマーの特定タイプのどのユニット特異的マーカーが標識されるかは未知である。
類似のタイプの分析は、4つのヌクレオチドの各々を、集団内で不完全に、しかし同時に標識することにより実施され得る。例えば、4つのヌクレオチドの各々は、色、サイズなどの異なる物理的特徴を生じるそれ自身のユニット特異的マーカーで部分的に標識され得る。これは、単一の集団分析からすべてのヌクレオチドについての情報を含むデータセットを生成するために達成され得る。例えば、この方法は、2つのヌクレオチド対を一度に部分的に標識することにより達成され得る。2つのヌクレオチドを標識することは、核酸鎖の2つのヌクレオチドを認識し、そして単一の蛍光分子のような標識を含むユニット特異的マーカーを用いることによって立体妨害効果を低下することを通じて可能である。Goodwinら、Nucleic Acids Research、21(4):803〜806、1993およびHardingおよびKeller、Trends Biotechnol、10(1−2):55〜57、1992は、完全に標識された2つのヌクレオチドをもつ大きな蛍光核酸分子は達成することは可能であることを示した。研究された分子の平均サイズは、7KBであった。3つのヌクレオチドの部分的標識化もまた可能である。例えば、3つのヌクレオチドの各々は、異なるユニット特異的マーカーで部分的に標識される。この場合、3つの特異的ヌクレオチド対の組み合わせで部分的に標識されている一本鎖核酸分子の集団が生成され、そして分析され得る。
本発明の方法はまた、二本鎖核酸を用いて達成され得る。二本鎖核酸では、鎖の2つ上で単一のヌクレオチドが標識されるとき、2つのヌクレオチドについての情報が、鎖の各々について利用可能になる。例えば、Aのランダムおよび部分的標識化において、AおよびTについての知識が利用可能になる。2つの異なって標識される核酸サンプルが調製される標識化戦略が用いられ得る。最初のサンプルは、同じ蛍光体でランダムに標識された2つの非相補的ヌクレオチドを有し得る。非相補的対のヌクレオチドは、AC、AG、TC、およびTGである。第2のサンプルは、ランダムに標識されたそのヌクレオチドの1つを有し得る。第2のサンプルについて選択されたヌクレオチドは、4つのヌクレオチドの任意の1つであり得る。提供された例では、この2つの非相補的ヌクレオチドは、AおよびCであるように選択され、そして単一のヌクレオチドは、Aであるように選択される。2つのサンプルが調製され、1つはAおよびCで標識され、そしてもう1つは、Aで標識される。核酸は、ゲノムから消化され、末端標識され、精製され、そして分析される。このような手順は、当業者に周知である。各フラグメントからの情報は、2つの相補鎖の群の1つにソートされる。情報をソートすることは、集団分析が、すべての所望のヌクレオチドの位置を決定することを可能にする。データの第1の群は、1つの鎖上のすべてのAおよびCの既知の位置を提供する。データの第2の群は、すべてのAの既知の位置を提供する。これら2つのデータセットの組み合わせは、1つの鎖上のすべてのAおよびCの位置を示す。同じ手順が、相補鎖に適用され、その鎖上のAおよびCの位置を決定し得る。得られるデータは、この鎖がAおよびCの相補的ヌクレオチド対(A:TおよびC:G)を含むという仮定を基に、核酸の両鎖の全配列を示す。配列を交差確認するために、このプロセスは、TG、TCおよびAGのような非相補的ヌクレオチドのその他の対について繰り返され得る。
一本鎖の2つのヌクレオチドを標識するスキームはまた、DNAの1つの鎖上の2つのヌクレオチドが完全に標識ヌクレオチドで置換されているとき、二本鎖DNA上で実施され得る。2ヌクレオチド標識化の背後にある理論を保持しながら、2つの外因的に標識されるヌクレオチドにより課せられる立体的拘束を低減するために、相補鎖の各々上の1つのヌクレオチドを完全に標識し、同じ末端を達成することが可能である。この方法は、各鎖が異なる標識で標識される二本鎖DNAを用いることを含む。6つの異なって標識された二本鎖DNAのセットは、配列情報を提供するために適切であるデータセットを生成する。DNAの各相補鎖は、標識されたヌクレオチドの1つを有するべきである。この二重鎖DNAセットの各々では、2つの異なるヌクレオチドの等価物(可能な組み合わせは、AC、AG、AT、CG、CT、GT)が標識される。両方の相補鎖が標識されたアデニンを有するとき、これは組み合わせATに等価である。二重鎖の2ヌクレオチド標識化において、利点は、各鎖上の1つのヌクレオチドのみが標識され、一本鎖DNA上の2ヌクレオチド標識化に比較してより長い標識鎖が合成されることを可能にすることである。実際、1つの完全に標識されたヌクレオチドをもつDNAフラグメントの合成は、10kbよりかなり長い長さで達成され得ることが示されている(Goodwinら、Nucleic Acids Research、21(4):803〜806、1993、ならびにHardingおよびKeller、Trends Biotechnol、10(1−2):55〜57、1992)。
1つより多くの物理的特徴を、標識に含めることにより、同じ一時的フレーム内の核酸の同時および重複読み取りは、単一の物理的特徴のみが含められるときより、標識ヌクレオチドの位置についてのより正確かつ迅速な情報を提供し得る。例えば、ヌクレオチドの各々は、二重または三重の蛍光体を含み得、各蛍光体の各々は、別個に検出され、同じサンプルから別個の読み取りを提供し得る。
単一のヌクレオチド標識化法の種々の組み合わせに加え、2つ以上の隣接するヌクレオチドは特異的に標識され得る。上記に記載のように、ユニット特異的マーカーは、個々のヌクレオチドに特異的であるマーカー、および複数ヌクレオチドに特異的であるマーカーを含む。複数ヌクレオチドは、隣接し得るか、そうでなくてもよい2つ以上のヌクレオチドを含む。例えば、ユニット特異的マーカーが、タンパク質の複合体である場合、このタンパク質の複合体は、互いに隣接しているか、またはランダムヌクレオチドによって分離されている特異的ヌクレオチドと相互作用し得る。このタイプの分析は特に有用である。なぜなら、シグナルの検出は、単一のヌクレオチド分析でより少ない解像度を必要とするに過ぎないからである。分析が複雑になるほど、システムの解像度はより大きくなる。本明細書で用いられるとき、解像度は、用いられる適切なシグナル検出方法によって分離され得るヌクレオチドの数をいう。
好ましくは、シグナル検出方法は、ナノチャネル分析、近距離場走査顕微鏡、原子間力顕微鏡、走査型電子顕微鏡、導波構造などのような方法を含む。
ユニット特異的マーカーがより多くのヌクレオチドの数に亘りかつ認識すると、ユニット特異的マーカーは、検出の低解像度手段により従うようになる。任意の所定数のヌクレオチドに亘るマーカーについて、用いられ得る異なるユニット特異的マーカーの数は、式4’’によって規定され、ここで、nは、このユニット特異的マーカーによって検出されるヌクレオチドの数である。2つのヌクレオチドに亘るユニット特異的マーカーは、ヌクレオチド対の16の組み合わせの1つに特異的であり得る。これらは、AC、AG、AT、AA、CC、CA、CG、CT、GA、GG、GC、GT、TA、TC、TG、およびTTを含む。3つのヌクレオチドに亘るユニット特異的マーカーは、64の3ヌクレオチド対の組み合わせの組み合わせの1つに特異的であり得る。3より多いヌクレオチド対の組み合わせもまた用いられ得、そしてこの数は、上記の式に従って増加し得る。これらのタイプのユニット特異的マーカーを用い、ヌクレオチド配列情報は、異なる手段の数により再構築され得る。このユニット特異的マーカーの再構築から生成される情報は、配列情報の生成に制限されず、さらに、明瞭にフラグメントを識別するために用いられ得、配列内に見出されるヌクレオチドのその組み合わせの特異的数などを提供する。
核酸分子に結合したトリプレットユニット特異的マーカーの種々の組み合わせは、これらの方法を用いて解読かつ分析され得る。核酸上のこのトリプレットユニット特異的マーカー正確な位置を知ることなく、結合核酸フラグメントに与えられ特異性は、N/4nとして与えられ、ここで、Nは、標的核酸のフラグメント中のヌクレオチドの数であり、そしてnは、この核酸分子上の結合された部位の数である。核酸の鎖が長くなるほど、特定システムの特異性は低くなる。結合されたユニット特異的マーカーの特異性は、トリプレットユニット特異的マーカーの正確な位置を決定することにより増加され得る。この場合、この特異性は、1/4nまで増加し、これは、Nマーが核酸の標的鎖に結合した場合と同じである。
トリプレットユニット特異的マーカーのセットから核酸分子の配列を決定するための最も簡単な方法は、一度に2トリプレット1ユニット特異的マーカーを、64ユニットの特異的マーカーが調査されるまで、調査することである。トリプレットユニット特異的マーカーの1つが、分析の間に一定に保たれる場合、この分析は最も単純である。1つの例では、核酸の短いストレッチが、2つのトリプレットユニット特異的マーカーを用いて分析される。このトリプレットユニット特異的マーカーは、CGXおよびGXXである。これらのマーカーを用い、最初のACGトリプレットの後の2つの基礎となる位置が決定され得る。63の異なるトリプレットを初期フラグメントACGとともに用い、隣接ヌクレオチドおよびACG間に介在するヌクレオチドの連続配列についての情報が決定され得る。
配列分析のこれらの方法を用い、他のタイプのハイブリダイゼーションなどの分析で生じる問題が避けられる。例えば、ヒトゲノム中のAlu反復のような反復配列は、ハイブリダイゼーション配列決定方法を用いる分析の問題を生じる。このような問題は、本明細書に記載の方法を用いて避けられる。本明細書に記載される方法を用い、反復の数は、各々の状態で結合された異なるトリプレットによって簡単にカウントされ得る。ハイブリダイゼーション配列決定分析は、2つのプローブ配列間に見出されるプローブの直線上の順序または数の決定を可能にしない。結合されたプローブの直線上の順序および正確な数の定量は、ハイブリダイゼーションによる配列決定において直面する困難性を迂回するさらなる順序の情報を可能にする。本発明の方法は、従って、迅速および簡単である。
トリプレットを用いる方法などは、ユニット特異的マーカーは、連続的に実施される必要はない。例えば、いくつかのトリプレットは同時にアッセイされ得、なおより迅速な分析の方法を提供する。同時分析における唯一の制限は、用いられるトリプレットユニット特異的マーカーのいずれもが、互いに重複すべきではないことである。従って、1つの特定のトリプレット配列の選択は、その配列と重複し得るトリプレット配列の同時使用を除外する。例えば、トリプレット配列ACGが分析のために選択される場合、64セットのトリプレットのうちの4が、このトリプレットを用いる同時分析の間で用いられないかも知れない。これらは、XXA、XAC、GXX、およびCGXを含む。数学的には、トリプレット標識がそれとの同時プロービングを除外し得るフラグメントの最大数は、以下の等式によって決定される:
2[σ42+41]または一般に2[σ4n−1+4n−241]
ここで、nは、標識によってまたがられるヌクレオチドの数である。合計は、当初に選択されたACGトリプレットでの同時アッセイから最大で40フラグメントが除外される。従って、合計で24の異なるフラグメントが一度にアッセイされ得る。
二本鎖核酸分析はまた、方向特異的標識を用いて達成され得る。方向特異的標識は、いずれかの鎖上のACGトリプレットのようなヌクレオチドの組み合わせ間の区別を可能にする。方向特異的標識の場合には、中心結合標識の逆転は、それが、対向する鎖上に結合した標識であることを示す。これらの標識は、5’から3’または3’から5’への方向性を有している。
本発明の方法の1つの使用は、ポリマー内のニユットの配列を決定することである。核酸のようなポリマーのユニットの配列を識別することは、このポリマーの機能を理解すること、および細胞または組織のような生理学的環境におけるこのポリマーの役割を決定することで重要なステップである。現在用いられている配列決定方法は、遅くかつ面倒である。本発明の方法は、かなりより迅速で、かつ非常に短時間で有意により多くの配列データを生成する。
本明細書に記載される分析方法は、線形的または非線形的である。部分的に標識されたポリマーから得られたデータに基づく配列情報を生成するための方法は、ポリマー依存性インパルスを生成する任意の方法によって得られたデータに適用され得る。このタイプのデータからのポリマーの配列の再構築は、本発明の統合局面である。ポリマー依存性インパルスを検出する方法によって得られたデータである限り、それが線形的様式で得られた否かにかかわらず、このデータは、本発明の方法に従って分析され得る。
シグナルは、逐次的または同時に検出され得る。本明細書で用いられるとき、単一のポリマーの異なるユニット特異的マーカーからのシグナルが、時間を置いて検出されるとき、「逐次的に」検出される。必ずしもユニット特異的マーカーのすべてが「逐次的に」検出される必要はなく、または「逐次的に」シグナルを検出するためのシグナルを生成する必要はない。ユニット特異的マーカーが、ステーションに逐次的に曝されるとき、このユニット特異的マーカーおよびステーションは、互いに対して移動する。本明細書で用いられるとき、語句「ユニット特異的マーカーおよびステーションは、互いに対して移動する」は、ユニット特異的マーカーおよびステーションのいずれかが、両者とも移動するか、または2つのうちの1つのみが移動し、そして他方が、少なくとも、ユニット特異的マーカーとステーションとの間の相互作用の時間の間に静止したままであることを意味する。このユニット特異的マーカーおよびステーションは、任意の機構によって互いに対して移動され得る。例えば、このステーションは、静止したままであり得、そしてポリマーは、電流によってこのステーションを超えて引かれ得る。ポリマーを移動するためのその他の方法は、制限されずに、磁場、機械的な力、流れる液体媒体、圧力システム、重力、およびポリマーがDNAであるとき、例えば、DNAポリメラーゼまたはヘリカーゼのような分子モーター、またはポリマーがアクチンのようなペプチドであるとき、例えば、ミオシンを含む。1つの例では、ポリマーは、水動力学的に移動され、例えば、サンプルは、流体流れストリームに同調することにより検出器を超えて流れる溶液中に存在する。この流体は、圧力または減圧のいずれかを用いることにより駆動される。
このポリマーの動きは、ポリマーを案内するためのチャネル、溝またはリングの使用により支援され得る。あるいは、ステーションは、移動され得、そしてポリマーは、静止を維持され得る。例えば、ステーションは、ポリマーの長さに沿って案内される走査チップ内に保持され得る。
別の実施形態では、シグナルは、同時に検出される。本明細書で用いられるとき、シグナルは、ポリマーの複数の標識されたユニット特異的マーカーがステーションに一度に曝されるようにすることにより「同時に検出」される。複数のユニット特異的マーカーは、複数の相互作用部位を用いることにより一度にステーションに曝され得る。シグナルは、これらの部位の各々で同時に検出され得る。例えば、複数のステーションは、ポリマーのユニット特異的マーカーに対応するスペース内の特異的位置に局在化され得る。ポリマーが複数ステーションの相互作用する近傍内にもたらされるとき、シグナルは同時に生成される。これは、例えば、ユニット特異的マーカー間の距離に等しい実質的に等価な距離で配置されたステーションの直線状アレイで具現化され得る。ポリマーは、ステーションに対し、各ユニット特異的マーカーがステーションに対し相互作用する近傍内にあり同時にシグナルを生じるように位置決めされ得る。
複数のポリマーは、1つより多くのポリマーを個々のステーションに対して一度に移動させることにより同時に分析され得る。これらポリマーは、類似であるか、または別個であり得る。ポリマーが類似である場合、同じであるか、または異なるユニット特異的マーカーが同時に検出され得る。
本発明に従う、ポリマーがステーションを超えて移動するための好ましい方法は、電場を利用する。電場は、チャネルを通じてポリマーを引っ張るために用いられ得る。なぜなら、ポリマーは、いくつかの研究で先に示されているように、付与された場の方向に伸張かつ整列されるようになる(Bustamante、Annu.Rev.Biophys.Chem.、20:415〜46、1991;Gurrieriら、Biochemisry、29(13):3396〜3401、1990;およびMatsumotoら、J.Mol Biol.、152:501〜516、1981)。
ポリマーをステーションを超えて移動する別の方法は、分子モーターの使用を含む。分子モーターは、ポリマーと物理的に相互作用し、そしてステーションを超えてポリマーを引っ張るデバイスである。分子モーターは、DNAおよびRNAポリメラーゼおよびヘリカーゼを含むがこれらに制限されるわけではない。DNAポリメラーゼは、効率的な分子モーターとして機能することが示されている。好ましくは、DNA上にクランプするポリメラーゼの領域の内径は、二本鎖DNAのそれに類似している。さらに、大量のDNAは、直線状様式でこのクランプを通じてたどり得る。分子モーターは、その全体の内容が本明細書によって参考として援用される米国特許第6,210,896号により詳細に記載されている。
DNAポリメラーゼIIIホロ酵素のβ−サブユニットの全体の構造は、直径が80Åであり、内径は約35Åである。比較して、完全ターンの二重B形態DNAは、約34Åである。βサブユニットは、滑動クランプ機構と称される機構でDNAの周りに適合し、DNA複製の間にホロ酵素の前進的運動を仲介する。βサブユニットは、複製の間にDNAを取り囲み、ホロ酵素に前進性を与えることが十分理解されている(Bloomら、J.Biol.Chem.、271:30699〜708、1996;Fuら、EMBO J.、15:4414〜22、1996;Griep、Anal.Biochem.、232.、:180〜9、1995;HerendeenおよびKelly、Cell、84:5〜8、1996;Naktinisら、Cell、84(1):137〜145、1996;Paz−Elizurら、J.Biol.Chem.、271:2482〜90、1996およびSkaliterら、J.Biol.Chem、271:2491〜6、1996)。滑動クランプは、ポリメラーゼの前進性の機構であるので、それは、必然的に、大量のDNAが、クランプを通じて直線状様式でたどることを意味する。数キロベースが、一度にクランプを通って進む(KornbergおよびBaker、DNA Replication、W.H.Freeman、New York、1991)。
検出可能なシグナル(ポリマー依存性インパルス)は、検出ステーションで生成され、そこでは、検出されるべきポリマーの部分(例えば、ユニット特異的マーカー)が、シグナルまたはポリマー依存性インパルスを生成するために剥き出される。ユニット特異的マーカーとステーションとの間の相互作用が、ポリマー依存性インパルスを生成するとき、このステーションは、「シグナル生成ステーション」である。1つのタイプのシグナル生成ステーションは、相互作用ステーションである。本明細書で用いられるとき、「相互作用ステーションまたは部位」は、ポリマーのユニット特異的マーカーが因子と相互作用する領域であり、そして、この因子に対して十分近傍に位置決めされ、それによってそれらは相互作用し得る。蛍光体の相互作用ステーションは、例えば、それらがエネルギー的に相互作用してシグナルを生成するように十分近接している領域である。
1つの実施形態における相互作用ステーションは、チャネルを形成する壁に付着されたアクセプター蛍光体のような局在化因子が、このチャネルを通過するポリマーと相互作用し得るナノチャネルの領域である。ポリマーが因子の局在化領域を通過する点は、相互作用ステーションである。ポリマーの各標識されたユニット特異的マーカーは因子によって通過するので、検出可能なシグナルが生成される。この因子は、種々の方法でチャネルの領域内に局在化され得る。例えば、この因子は、チャネルの壁を形成する材料中に包埋され得るか、またはこの因子は、壁材料の表面に付着され得る。あるいは、この因子は、チャネルから所定の距離に位置決めされるが、光を導波管を通じてチャネルの領域に輸送し得る光源であり得る。複数のポリマーが複数のチャネルを通じて輸送される装置がまた用いられ得る。本発明のこれらおよびその他の関連する実施形態は、以下により詳細に論議される。ポリマーの動きは、ポリマーを案内するための溝またはリングの使用により支援され得る。
相互作用ステーションを生成するその他の配列が、本発明によって受け入れられる。例えば、ポリマーは、壁の表面につながれるか、または壁の中に包埋された分子モーターを通過し得、それによって、ポリマーのユニット特異的マーカーを、好ましくは近接因子の相互作用する近傍の特異的位置にもたらし、それによって相互作用ステーションを規定する。分子モーターは、ポリマーと相互作用する、ポリメラーゼ、ヘリカーゼ、またはアクチンのような生物学的化合物であり、そして各ユニット特異的マーカーを超えてポリマーの長さに沿って輸送される。同様に、ポリマーは、動きから保持され得、そしてリーダーは、ポリマーに沿って移動され得、このリーダーはそれに付着した因子をもつ。例えば、この因子は、ポリマーの長さに沿って案内される走査チップ内に保持され得る。相互作用ステーションは、次いで、この因子がポリマーの各ユニット特異的マーカーの相互作用する近傍に移動するときに作製される。
ポリマーのユニット特異的マーカーと相互作用ステーションで相互作用する因子は、電磁場放射、クエンチング源、および蛍光励起源からなる群から選択される。本明細書で用いられるとき「電磁放射」は、電磁波により生成されるエネルギーである。電磁場放射は、直接光源の形態であり得るか、またはそれは、ドナー蛍光体のような光放射化合物によって発せられ得る。本明細書で用いられるとき「光」は、可視、赤外および紫外を含む任意の波長の電磁エネルギーを含む。
本明細書で用いられるとき、クエンチング源は、光放射源の性質を変えるか、または変え得る任意の実体である。変えられる性質は、蛍光強度寿命、スペクトル、蛍光、または燐光を含み得る。
本明細書で用いられるとき、蛍光励起源は、蛍光を発し得るか、または光子放射(すなわち、電磁放射、定方向電場、温度、蛍光、放射、シンチレーション、物理的接触、または機械的破壊)を生じ得る任意の実体である。例えば、ユニット特異的マーカーが、放射活性化合物で標識されるとき、放射活性放射は、蛍光を生じるシンチレーション層である因子の分子励起を引き起こす。
ポリマーのユニット特異的マーカーが因子に曝されるとき、この2つの間の相互作用がシグナルを生成する。このシグナルは、ポリマーについての情報を提供する。例えば、タンパク質ポリマーの特定のタイプのすべてのユニット特異的マーカー、例えば、すべてのアラニンが、特定の発光化合物で標識される場合(内因的または外因的)、そのときは、その発光化合物のシグナル特徴が、上記因子との相互作用の際に検出され、このシグナルは、アラニン残基がポリマー上の特定のその位置に存在することを示す。ユニット特異的マーカーの各タイプ、例えば、アミノ酸の各タイプが、別個の発光パターンを有する異なる発光化合物で標識される場合、各アミノ酸は、上記因子と相互作用し、別個のシグナルを生成する。ポリマーの各ユニット特異的マーカーについてどの各シグナルであるかを決定することにより、ユニットの配列が決定され得る。
ユニット特異的マーカーと因子との間の相互作用は、種々の形態をとり得るが、ユニット特異的マーカーとこの因子とが互いに物理的に接触している必要はない。相互作用の例は以下のようである。第1のタイプの相互作用は、電磁場放射である因子および発光化合物であるユニット特異的マーカー(発光化合物で、内因的にか、または外因的にかのいずれかで標識される)を含む。発光するユニット特異的マーカーが、電磁場放射(適切な波長のレーザービームによるか、またはドナー蛍光体から発せられる電磁放射など)と接触するとき、この電磁放射は、発光化合物が特定波長の電磁放射を発するようにする。次いで、このシグナルを測定する。このシグナルは、発光の特徴的パターンを示し、そしてそれ故、ポリマーの特定の標識ユニット特異的マーカーが存在することを示す。この場合には、ポリマーのこのユニット特異的マーカーは、「発光化合物から電磁放射の放射を検出可能に影響する」といわれる。
第2のタイプの相互作用は、蛍光励起源である因子および発光または放射活性化合物であるポリマーのユニット特異的マーカーを含む。発光するユニット特異的マーカーは、蛍光励起源と接触されるとき、この蛍光励起源は、発光化合物が特定波長の電磁放射を発するようにする。放射活性ユニット特異的マーカーが、蛍光励起源と接触されるとき、このユニット特異的マーカーから発せられる核放射は、蛍光励起源が特定波長の電磁放射を発するようにする。次いで、シグナルが測定される。
これらタイプの相互作用のバリエーションは、相互作用の第3の要素である、シグナルを生成する際に関連する近傍の化合物の存在を含む。例えば、ユニット特異的マーカーは、ドナー蛍光体である発光化合物で標識され得、そして近傍化合物は、アクセプター蛍光体であり得る。発光化合物が、励起状態に配置され、そしてアクセプター蛍光体の近傍にもたらされる場合、エネルギー移動が、ドナーとアクセプターとの間で生じ、発光するユニット特異的マーカーの存在の測定として検出され得る。発光化合物は、それを、(レーザービームのような)光りに曝すことによるか、またはそれを蛍光励起源に曝すことにより、「励起」状態に配置され得る。
別の相互作用は、クエンチング源である近傍化合物を含む。この例では、発光するユニット特異的マーカーは、それを光りに曝すことにより、電磁放射を発するようにされる。発光化合物が、クエンチング源の近傍に配置される場合、この発光するユニット特異的マーカーからのシグナルが改変される。
上記に記載の相互作用に沿った相互作用のセットがここで生成され得るが、しかし、発光化合物は、近傍の化合物であり、そしてユニット特異的マーカーは、クエンチング源またはアクセプター源のいずれかである。これらの事例では、因子は、近傍化合物によって発せられる電磁放射であり、そしてシグナルは、このユニット特異的マーカーを近傍化合物との相互作用する近傍にもたらすことにより発せられ、ユニット特異的マーカーとこのような放射との間の相互作用の特徴である。
これら相互作用の各々が検出可能なシグナルを生成する機構は、当該分野で公知である。例示の目的で、本発明に従う、ドナーおよびアクセプター蛍光体が検出可能なシグナルを生成する機構、このタイプの相互作用から生じることが知られている実際的な制限、およびこのような制限を低減またはなくする方法は、以下に提示される。
本発明の分析の別の好適な方法は、放射活性的に標識されたポリマーの使用を含む。放射活性放射のタイプは、用いられる検出デバイスのタイプに影響する。一般に、α、β、およびγ放射を含む3つの異なるタイプの核放射がある。α放射は、物質における広範なイオン化を引き起こし、そしてイオン化チャンバーおよび比例するカウンターによる個々の計数を可能にするが、より興味深いことに、物質と相互作用するα放射はまた、蛍光に至り得る分子励起を引き起こし得る。蛍光は、シンチレーションとして調べられ得る。α崩壊より弱いβ崩壊は、適切なシグナルを生成するように増幅され得る。γ放射は、励起エネルギーの内部変換から生じる。γ線のシンチレーション計数は、効率的であり、そして強いシグナルを生成する。ヨウ化ナトリウム結晶は、入射γ放射で蛍光を発する。
本明細書で用いられとき、「シンチレーション」層または材料は、核放射による励起に応答して蛍光または光を発する任意のタイプの物質である。シンチレーション材料は、当該分野で周知である。共鳴構造を有する芳香族炭化水素は優れたシンチレーターである。アントラセンおよびスチルベンは、このような化合物のカテゴリーに入る。無機結晶もまた蛍光を発することが知られている。これらの化合物が発光するために、無機結晶は、価電子帯と伝導帯との間にエネルギーレベルを生成する、少量の不純物を有さなければならない。励起と脱励起がそれ故に生じ得る。多くに場合で、この脱励起は、燐光光子放射を通じて生じ得、長寿命の検出に至る。特定の共通のシンチレーターは、NaI(T1)、ZnS(Ag)、アントラセン、スチルベン、およびプラスチック燐光体を含む。
核放射を測定する多くの方法が当該分野で公知であり、そして霧箱デバイスおよび泡箱デバイス、定電流イオンチャンバー、パルスカウンター、ガスカウンター(すなわち、Geiger−Mullerカウンター)、半導体検出器(表面バリア検出器、リチウムドリフト検出器、内因性ゲルマニウム検出器)、シンチレーションカウンター、Cerenkov検出器などのようなデバイスを含む。
放射線標識されたポリマーの分析は、ポリマー依存性インパルスを生成するその他の手段と同一である。例えば、放射線標識されたAをもつサンプルは、サンプルDNA上のAの相対的間隔を決定するためのシステムによって分析され得る。放射シグナルの検出間の時間は、分析されるポリマーの特徴である。標識されたDNAの4つの集団(A、C、G、T)の分析は、分析されるポリマーの配列を生じ得る。DNAの配列はまた、二重標識されたDNAおよび単一標識されたDNAの組み合わせの分析を含むより複雑なスキームで分析され得る。同じフラグメントのA標識バージョンの分析が続くAおよびC標識されたフラグメントの分析は、AおよびCの位置の知識を生じる。この手順が相補鎖について繰り返される場合に配列が知られる。このシステムは、ポリマー(ポリペプチド、RNA、炭水化物など)、サイズ、濃度、タイプ、同一性、存在、配列および数の分析のためにさらに用いられ得る。
上記に記載の方法は、ポリマーについての構造的情報を決定するために、単一のポリマーについて、または1つより多いポリマーについて実施され得る。
本明細書で用いられるとき、「検出可能なポリマー」は、従来の技術によって検知され得る任意のタイプのシグナルまたはポリマー依存性インパルスである。生成されるシグナルは、ステーションおよびユニット特異的マーカー、および存在する場合、近傍化合物のタイプに依存する。1つの実施形態では、シグナルは、ポリマーの標識された(内因的または外因的)ユニット特異的マーカーによるか、または近傍化合物による発光から得られる電磁放射である。別の実施形態では、シグナルは、放射活性放射のシンチレーション層との相互作用から生じる蛍光である。検出されたシグナルは、分析のためにデータベース中に記憶され得る。記憶されたシグナルを分析する1つの方法は、記憶されたシグナルを、別のポリマーからのシグナルのパターンに比較し、2つのポリマーの関連性を決定することによる。検出されたシグナルの分析のための別の方法は、検出されたシグナルを、公知のポリマーのシグナル特徴の既知のパターンに比較し、分析されているポリマーの既知のポリマーとの関連性を決定することによる。シグナルの比較は、以下により詳細に論議される。
1つより多い検出可能なシグナルが検出され得る。例えば、第1の個々のユニット特異的マーカーは、因子またはステーションと相互作用し得、第1の検出可能なシグナルを生成し、そして第2の個々のユニット特異的マーカーは、因子またはステーションと相互作用し得、第1の検出可能なシグナルとは異なる第2の検出可能なシグナルを生成する。これは、単一のポリマー上で、1つより多いタイプのユニット特異的マーカーが検出されることを可能にする。
一旦、シグナルが生成されると、次いで、それは検出され得る。特定のタイプの検出手段は、ユニット特異的マーカーと因子との間で生じる相互作用のタイプに依存する生成シグナルのタイプに依存する。本発明の方法に含まれる多くの相互作用は、電磁放射シグナルを生成する。電磁シグナルを検出するための多くの方法が当該分野で公知であり、二次元および三次元造影システムを含む。これらおよびその他のシステムは、PCT特許出願WO98/35012および米国特許第6,355,420号により詳細に記載されている。
この方法に含まれるその他の相互作用は、核放射シグナルを生成する。ポリマー上の放射標識が、ステーションのような検出の規定された領域を通過するとき、核放射が発せられ、そのある部分は、放射検出の規定された領域を通過する。核放射の検出器は、放射検出の規定された領域の近傍に配置され、発せられた放射シグナルを捕獲する。核放射を測定する多くの方法が当該分野で公知であり、霧箱デバイスおよび泡箱デバイス、定電流イオンチャンバー、パルスカウンター、ガスカウンター(すなわち、Geiger−Mullerカウンター)、半導体検出器(表面バリア検出器、リチウムドリフト検出器、内因性ゲルマニウム検出器)、シンチレーションカウンター、Cerenkov検出器などを含む。
その他のタイプの発生シグナルが当該分野で周知であり、そして当業者に公知である多くの検出手段を有している。これらの中では、対向電極、磁気共鳴、および圧電走査チップが含まれる。対向するナノ電極は、静電容量の測定により機能し得る。2つの対向する電極は、エネルギー貯蔵のすべての領域を生成し、これは、2つの電極間で有効である。2つの対向する電極の静電容量は、これら電極の間に異なる材料が配置されるとき変化することが知られている。この値は、誘電率として知られている。誘電率の変化は、2つの電極を横切る電圧における変化として測定され得る。現在の例では、ポリマーの異なるヌクレオチド塩基またはユニット特異的マーカーは、異なる誘電率を生じ得る。この静電容量は、等式:C=KC0を通じて、ポリマーのユニット特異的マーカーの誘電率として変化し、ここで、Kは、誘電率であり、そしてC0は、任意の塩基が不在下の静電容量である。ナノ電極の電圧偏向が次いで測定デバイスに出力され、時間とともに変化するシグナルを記録する。
ナノサイズのNMR検出デバイスを、特異的スピン標識ポリマーユニット特異的マーカーの通過を検出するために構築し得る。このナノサイズのNMR検出デバイスは、掃引され得る磁石、および一定周波数の電磁エネルギーでポリマーを照射する手段(これは、電磁周波数が掃引される間に磁場定数を保持することと同一である)からなる。電磁場が、正確な強度に到達するとき、核はエネルギーを吸収し、そして共鳴が起こる。この吸収は、小さな電流がサンプルを取り囲むアンテナコイル中に流れることを可能にする。シグナルは増幅され、そして記録デバイスに出力される。既知の標識化合物には、検出の時間は、質問の化合物の完全なスペクトルが要求されるNMR検出の電流手段よりかなり迅速である。既知の標識されたポリマーのユニット特異的マーカーは、特定の領域中に既知の化学的シフトを有し、それによって、完全なスペクトル掃引を実施する必要性をなくし、マイクロまたはミリ秒まで塩基あたりの検出の時間を低減する。
ナノスケール圧電走査チップは、チップで、異なるポリマーユニット特異的マーカーの物理的接触を基に、ポリマーの異なるユニット特異的マーカーを読み取るために用いられ得る。ポリマーユニット特異的マーカーのサイズおよび形状に依存して、異なる圧電シグナルが生成され、一連のユニット特異的マーカー依存性変化を生成する。ユニット特異的マーカー上の標識は、ネイティブユニットとは物理的に異なり、そして圧電走査チップを経由して検出のための準備完了手段を生成し得る。ポリマーユニット特異的マーカーのチップとの接触に際し、圧電結晶は変化し、そして検出デバイスに出力される電流を生じる。ホリマーユニット特異的マーカーのチップとの相互作用により生成された電流の大きさおよび持続時間は、ポリマーユニット特異的マーカーの特徴である。
線形分析の1つの好ましいタイプでは、標識ポリマーは、ナノチャネルによって、標識ポリマーがステーションを通過するとき、このステーションと標識ポリマーとの間の相互作用から生じるシグナルが空間的に閉じ込められるようにステーションに対する相対位置に固定される。好ましくは、チャネルは、標識ポリマーの直径に対応し、そして積分された時間に亘り標識ポリマーからの多くの放射を捕獲し得る造影システムに対してDNAを固定する。この方法は、個々の分子の強度の分析について特異的である。このナノチャネルシステムは、例として提供され、そして以下により詳細に論議される。任意の手段を用い、シグナルを経時的に分析し得る光学的方法による分析のために標識ポリマーを所定の大きさ(dimension)に固定し得る。分析のために標識ポリマーを位置決め得るデバイスの例は、ナノチャネルアレイ、一体ナノ製作導波管、および種々の格子を含む。
(分子モーター)
上記に記載の分析は、以下に簡単に記載される米国特許第6,210,896号に記載のような分子モーターの使用により実施され得る。
本発明の方法および生成物は、WO98/35012および米国特許第6,355,420号に記載の線形分析法に類似の様式で、ポリマーについて構造的情報を決定するために有用である。従って、1つの局面では、本発明の方法は、ポリマーの1つ、いくつか、またはすべてのユニットを識別するために用いられ得る。これは、骨格上の特定の位置で検出されるシグナルが特定の標識ユニットの存在の特徴であるか否かを決定することによって、個々のユニットのタイプおよびそのポリマーの骨格上のその位置を識別することにより達成される。
1つの局面では、本発明は、ポリマーを分析するための方法である。この方法は、複数のポリマーの個々のユニットを、分子モーターを因子に対してポリマーを移動させることにより、電磁放射源、クエンチング源、および蛍光励起源からなる群から選択される因子に曝す工程、およびポリマーのこれらユニットと因子との間の相互作用から生じるシグナルを検出する工程を包含する。
この方法は、線形分析のための方法であり、そこでは、シグナルは逐次的に検出される。本明細書で用いられるとき、単一のポリマーの異なるユニットからのシグナルが時間間隔を離して検出されるとき、シグナルは「逐次的に」検出される。必ずしもユニットのすべてが「逐次的に」検出される必要はなく、または「逐次的に」シグナルを検出するためのシグナルを生成する必要はない。ユニットが、因子またはステーションに逐次的に曝されるとき、このユニットおよび因子またはステーションは、互いに対して移動する。本明細書で用いられるとき、語句「ユニットおよびステーションは、互いに対して移動する」は、ユニットおよび因子の両方が移動するか、またはこの2つの1つのみが移動し、そしてその他が少なくともこのユニットと因子との間の相互作用の時間の間に静置のままであるかのいずれかを意味する。
ユニットおよび因子は、分子モーターによって互いに対して移動される。本明細書で用いられるとき、「分子モーター」は、ポリマーと物理的に相互作用し、かつポリマーを、単一のステーションを通過して移動される生物学的分子である。好ましくは、この分子モーターは、ポリマーと相互作用し、かつこのポリマーの長さに沿ってポリマーに対して移動するタンパク質またはタンパク質複合体のような分子である。この分子モーターは、ポリマーの各ユニットと逐次的様式で相互作用する。この分子モーターとポリマーとの間の物理的相互作用は、例えば、ファンデルワールス力のような分子間に生じる分子力に基づく。本発明の方法に従う有用な分子モーターのタイプは、分析されるポリマーのタイプに依存する。例えば、DNAポリメラーゼまたはヘリカーゼのような分子モーターは、ポリマーがDNAであるとき有用である。RNAポリメラーゼのような分子モーターは、ポリマーがRNAであるとき有用であり、そしてミオシンのような分子モーターは、例えば、ポリマーがアクチンのようなペプチドであるとき有用である。分子モーターは、制限されないで、ヘリカーゼ、RNAポリメラーゼ、DNAポリメラーゼ、キネシン、ダイネシン、アクチンおよびミオシンを含む。当業者は、本明細書に記載のパラメーターに基づき、本発明に従って有用なその他の分子モーターを容易に識別し得る。
DNAポリメラーゼは、効率的な分子モーターとして機能することが示されている。好ましくは、DNA上にクランプするこのポリメラーゼの領域の内径は、二本鎖DNAのそれと類似である。大量のDNAは、直線状様式でクランプを通り得る。DNAポリメラーゼIIIホロ酵素のb−サブユニットの全体の構造は、約35オングストロームの内径を有して80オングストローム直径である。対照的に、二重鎖B−形態DNAの完全ターンは、約34オングストロームである。このベータサブユニットは、DNAの周りに、スライディングクランプ機構と称される機構で適合し、DNA複製の間にホロ酵素のプロセシング運動を仲介する。b−サブユニットは、複製の間にDNAを取り囲み、ホロ酵素にプロセッシング能力を与えることが良く理解されている(Bloomら、J.Biol.Chem.271:30699−708、1996;Fuら、EMBO.J.、15:4414−22、1996;Griep、Anal.Biochem.、232:180−9、1995;HerendeenおよびKelly、Cell、84:5−8、1996;Naktinisら、Cell、84(1):137−145、1996;Paz−Elizurら、J.Biol.Chem.、271:2482−90、1996およびSkaliterら、J.Biol.Chem.、271:2491−6、1996)。スライディングクランプは、ポリメラーゼにとって、プロセッシング能力の機構であるので、それは、必然的に、大量のDNAがクランプを、直線状様式で通ることを意味する。数キロベースが一度にクランプを通って通り抜ける(KornbergおよびBaker、DNA Replication、W.H.Freeman、New York、1991)。
RNAポリメラーゼはまた、DNAポリメラーゼのように、効率的な分子モーターとして機能し得る。RNAポリメラーゼの領域の内径は、それがRNA上にクランプし得、そしてユニット毎に前進してRNAを下流に移動し得るようである。RNAポリメラーゼは、例えば、T7RNAポリメラーゼ、T3またはSP6RNAポリメラーゼ、E.coliRNAポリメラーゼなどを含む。RNAポリメラーゼを用いるRNA転写の適切な条件は、当該分野で公知である。
別の好ましいタイプの分子モーターは、ヘリカーゼである。ヘリカーゼは先に記載されている。例えば、米国特許第5,888,792号を参照のこと。ヘリカーゼは、核酸骨格に沿って移動し、そして核酸を、DNA複製、修復、組換え、転写、mRNAスプライシング、翻訳およびリボソームアセンブリのプロセスが生じ得るように解く。ヘリカーゼは、RNAヘリカーゼおよびDNAヘリカーゼの両方を含む。核酸分子モーターは、核酸分子の骨格に沿って移動するような分子モーターを含み、そして、例えば、ポリメラーゼおよびヘリカーゼを含む。
複数のポリマーは、1つより多くのポリマーを、個々の分子モーター上の個々のシグナルステーションに対して移動させることによって同時に分析され得る。これらポリマーは類似または別個であり得る。ポリマーが類似である場合、同じかまたは異なるユニットが同時に検出され得る。ポリマーの移動は、分子モーター単独によって達成され得るか、またはポリマーを案内するためのチャネル、溝またはリングによって支援され得る。あるいは、分子モーターおよび因子が移動され得、そしてポリマーは静止したままであり得る。例えば、因子は分子モーターに付着され得、そしてポリマーが表面に固定され得る。この場合、因子が付着した分子モーターは、静止ポリマーの長さを下流に走査し得る。
本発明の方法は、以下の非制限的な例について記載され、それは例示の目的のみに提供される。この例は、DNAおよび蛍光の分析に言及するが、当業者は、それがすべてのポリマーおよびすべての請求されるシステムに適用可能であることを理解し得る。この例では、DNAポリメラーゼは、いくつかの蛍光分子、例えば、ドナー蛍光分子で標識される。一致する蛍光体、例えば、アクセプター蛍光体で標識されたDNA分子が、次いで、プライマー伸長を行うことを始めるDNAポリメラーゼのテンプレートとして用いられる。アクセプター蛍光体がドナー蛍光体を超えて移動するとき、蛍光共鳴エネルギー移動(FRET)が起こる。FRETは、ドナーおよびアクセプター蛍光体が、約1オングストローム〜100オングストロームの範囲内で緊密範囲相互作用を行うときに生じる。この距離は、標識をもつ単一のヌクレオチドがポリメラーゼ上の蛍光体を通過するとき達成される。
分子モーターを用いるFRET分析は、溶液中の単一分子上で、または固体平坦媒体上の平行反応として実施され得る。それはまた、複数ウェルのディシュ中におけるように異なる溶液中の平行反応中で実施され得る。この反応が平坦固体媒体上で実施される実施形態では、標識ポリマーまたは標識分子モーターのいずれかが、この表面上に直接またはリンカーを解して固定化され得る。ポリマーが表面上に付着される場合、分子モーターが次に添加され、そして分子モーターが表面につながれる場合、ポリマーが添加され得、反応を開始する。このようにして、複数のドナー−アクセプター反応部位の同時線形読み取りが生じ得、システムのスループットを増大する。この分子モーターがDNAポリメラーゼであるとき、DNAの数キロベースの配列が迅速に得られ得る。配列決定の大体の速度は、1カメラシステムで1メガ塩基/時間に達し得る。
分子モーターとして供され得る蛍光標識酵素とタンパク質との複合体の調製は、当該分野で周知である。酵素上の複数のアミン、カルボキシル、およびスルフヒドリル部位の利用可能性は、標識のこれら分子への結合を簡単にする。多くのタンパク質は、官能化され、活性の損失なくして蛍光誘導体を生成し、これには、例えば、抗体、西洋ワサビペルオキシダーゼ、グルコースオキシダーゼ、b−ガラクトシダーゼ、アルカリホスファターゼ、アクチン、およびミオシンを含む。分子モーターは、類似の様式で、機能的活性を損失することなく容易に誘導体化され得る。さらに、米国特許第6,355,420号に記載のような当該分野で公知の方法を用いて標識がポリマー中に取り込まれ得る。例えば、標識は、市販され利用可能なヌクレオチドまたはアミノ酸ポリマーを用いるか、または一級アミノ基に連結され得るスクシンイミジルエステル誘導体としてポリマー中に取り込まれ得る。
市販され利用可能な多くの蛍光標識は、分子モーターおよび/またはポリマーのようなタンパク質へのそれらの結合を可能にする官能基を有している。これらの標識は、制限されないで、フルオレセインイソチオシアネート、NHS−フルオレセイン、ヨードアセタミドフルオレセイン、フルオレセイン−5−マレイミド、SAMSA−フルオレセイン、フルオレセイン−5−チオセミカルバジドなどを含む。当業者は、たった1つのタイプの標識でさえ利用可能な結合技法の広範な選択のため、本発明の方法のために標識を選択する際に大きな柔軟性を有している。ローダミンの改変体、Cy−dyes(Amersham−Pharmacia)、Alexa−dyes(Molecular probes)、Texas Redsなどは、広範な範囲の利用可能な波長、光安定性、エネルギー移動スペクトル、および化学的適合性に役立つ。良好な吸収、安定励起、および高蛍光量子収率は、標識の重要な特性である。
蛍光結合体の例として、分子モーターへのフルオレセインイソチオシアネート(FITC)結合体が記載される。フルオレセインイソチオシアネートは、プロトタイプの蛍光色素である。それは、2つの構造的異性体で存在する。1つは環下部の5−位または6−位で改変される。これら2つの異性体は、蛍光性質に関し光学的に等価である。イソチオシアネート基は、アミンおよびスルフヒドリルのような求核原子と反応するが、唯一の安定産物は、タンパク質中のE−およびN−末端アミンのような一級アミン基とである。イソチオシアネート基とFITCとの間の反応は、チオ尿素連結を生じ、そして脱離基はない。FITCは、ストック溶液としてDMF中に溶解され、そして次に6以上のpHで水性反応混合物に添加される。貯蔵は、−20℃で光から保護され、そして乾燥条件下である。FITCの最大吸収は、495μmであり、そして最大放射は520nmにある。酵素の溶液は、通常、0.1Mの炭酸ナトリウム、pH9中で調製され、そして少なくとも2mg/mlの濃度である。FITCは、1mg/mlの濃度でDMSO/DMF中のストックに溶解され、そして光から保護される。暗くした実験室で、50〜100μlのFITC溶液が各ミリリットルのタンパク質溶液(2mg/mlとする)に添加される。反応は4℃で一晩である。反応は、50mMの最終濃度までの塩化アンモニウムの添加により停止する。残存するイソシアネート基は、さらに2時間後、ブロックされる。誘導体は、PBSでのゲル濾過を用いて精製される。
好ましい実施形態では、蛍光色素およびそのエネルギー移動対が注意深く選択されシグナル生成を最大にする。これは、以下に提示される式により記載されるパラメーターを考慮することにより達成され得る。蛍光エネルギー移動(FRET)は、ドナー蛍光放射とアクセプター蛍光吸収のスペクトル重複に関連し、J(ドナー放射(fD)アクセプター吸収(εA)の正規化されたスペクトル重複)として決定される。正規化スペクトル重複の重要性を要約する等式は:J=∫εA(λ)fD(λ)λ4dλ/∫fD(λ)dλとして与えられる。
このJ因子は、ドナー蛍光体からアクセプター蛍光体へのエネルギー移動が50%である距離であるForsterエネルギー移動距離の決定で特に重要である。このForster距離はまた、FRET配列決定方法の解像度を決定する。一般に、このForster距離は、5オングストロームと100オングストロームとの間と小さくその間で変化し得る。
これらの変数は、本発明者らのFRET配列決定システムにおける使用のための最適ドナー−アクセプター対の選択で考慮されている。J因子は重要であるが、しかし、最適性能のためにシステム中に作動されるべきさらなる因子があり、例えば、1)スペクトルバンドの鋭さ、2)スペクトルバンド間のクロストークの欠如、3)ポリマーマトリックス中に選択された標識を固定化する能力、および4)DNA中への取り込みのために用いられる共通標識と一致する能力である。
その他の因子が、適正な蛍光標識対を選択する際に考慮され得る。例えば、標識のスペクトル重複は、エネルギー移動に十分であるべきである。アクセプター蛍光体の直接励起を最小にすることにより、励起レベルにおけるクロストークは避けられ得る。さらに、ドナー蛍光体の放射は、アクセプター蛍光体からの検出バンドを妨害すべきではない。このようにして、測定される蛍光事象は、適切であり、そしてエネルギー移動の発生の指標である。理想的な条件下で、ドナーおよびアクセプター蛍光は鋭く、そしてスペクトルの広がりを受けない。さらに、標識の量子収率、光安定性、および断面積における考慮がある。これらパラメーターのすべては、既知および市販され利用可能な標識の既知の性質を基に当業者によって容易に操作され得る。
当業者は、分子モーターおよび/またはポリマーの蛍光標識化の程度を確認し得る。蛍光体結合分子における蛍光標識化のレベルは、サンプルの吸収または蛍光放射のいずれかにより決定される。分子あたりの蛍光体分子の数は、F/M比と呼ばれる。この値は、酵素−蛍光体複合体のすべての調製において測定される。理想的F/M比が、特定分子(分子モーターまたはポリマー)の分子−蛍光体の組み合わせについて決定される。蛍光体の既知の吸光係数を用い、誘導体化レベルの決定が、過剰の蛍光体を除去した後になされ得る。
標識された分子モーターの活性は、結合および精製の後に分子モーター蛍光体複合体の生存率を評価する標準的なアッセイを用いて確認され得る。種々の分子モーターは、活性確認のためのそれら自身のアッセイをもつ。DNAポリメラーゼ、およびFITCへの結合後のその活性は以下に論議され、この主題についてさらに明確にする。この例は、本発明の範囲をいかなるようにも制限しない。
DNAポリメラーゼ−蛍光体複合体は、ジデオキシ配列決定反応でチェックされ、改変された分子モーターがその鎖伸長機能を実施する能力を確認する。プライマーアニーリング、標識化、および停止反応が行われ、一本鎖のジデオキシ停止産物の長さを決定し、そしてまた伸長産物の塩基正確さをアッセイする。4つのジデオキシヌクレオチドについての反応混合物を、最終分析のために4つの色度自動化キャピラリーゲル電気泳動(ABI 3770など)に供する。既知のM13 ssDNA配列決定テンプレートとの配列の一致は、ポリメラーゼ−蛍光体複合体の完全性を確認する。
1つの例では、分子モーター(すなわち、DNAポリメラーゼ)のアレイが、スライドグラスの表面に結合され得る。これらポリメラーゼは、アクセプター分子の励起スペクトルと部分的に重複する放射スペクトルを有するドナー蛍光分子で標識される。テンプレートアクセプター標識ポリマー(すなわち、DNA)が、適切な伸長プライマーとともに反応混合物中に提供される。反応は、デオキシヌクレオチドの混合物で開始される。鎖伸長は、テンプレートDNA上のアクセプターがポリメラーゼ上のドナーの近傍に移動されることを可能にする。一旦、アクセプターが、固定化されたポリメラーゼ分子上のドナーのエネルギー移動近傍内にくると、非放射エネルギーが生じる。アクセプターからの感作された蛍光放射が誘導される。物質からの時間的に間隔を置いた蛍光放射は、テンプレート分子についてのヌクレオチド情報の質問を可能にする。
空間的に異なる配向の分子の統計学的分析は、以下により詳細に論議されるように速度およびコスト有効性をもつ配列の完全かつ正確な再構築を可能にする。本発明の方法は、それ故、Sanger配列決定のような伝統的な非線形配列決定が必要とする、かなりより長い読み取り長さ、および分離方法を完全になくすことを可能にする。
本発明の線形分析方法の別の例では、テンプレートは、ガラス表面に固定され得、そしてポリメラーゼは溶液中で移動可能である。ドナー蛍光分子は、アクセプターに対向するようにDNA分子上に位置決めされ得る。一連の相互作用は、二重鎖DNAを解くヘリカーゼ分子のような異なる分子モーターによって仲介され得る。このシナリオでは、ヘリカーゼ分子は、蛍光でタグ化され、そして蛍光分子で非対照的に標識されている複合体を解くことを可能にする。非対照的標識化は、ポリマーについての情報を解読する容易さを可能にする。
別の例では、分子モーターおよびポリマーは溶液中であり得る。この分析の方法は、表面に付着される分子モーターまたはポリマーのいずれかがなくても実施され得る。分子モーターおよびポリマーは、溶液中を互いに対して移動し得る。単一の分子モーターが溶液中に存在するとき、相互作用から生じる個々のシグナルは、分析の標準的な方法により検出かつ分析され得る。
ポリマーまたは分子モーターを支持体につなぐこと、システム成分を標識すること、分子モーターとポリマーとの間に相互作用を引き起こすこと、および検出方法、例えば、蛍光共鳴エネルギー移動などに含まれる方法は、本明細書ならびにWO98/35012および米国特許第6,355,420号に記載されている。標識化、生体分子を固定化することなどのためのその他の方法は、当業者に公知である。例えば、Schaferら、Nature、352(6334):444〜8、1991は、標識化および検出を記載している。
本発明は、ポリマーの少なくとも1つのユニットと因子との間、またはこのユニットがステーションに曝されるときの相互作用から生じるシグナルを検出することによりポリマーを分析する改善された方法を包含する。ポリマーを「分析すること」により、それは、ポリマーの構造についての特定の情報、例えば、そのサイズ、そのユニットの順序、他のポリマーに対するその関連性、そのユニットの同一性、またはその存在を得ることを意味する。生物学的分子の構造および機能は相互依存性であるので、この構造情報は、ポリマーの機能についての重要な情報を示し得る。
本発明の方法はまた、ポリマーのその他の構造的性質を識別するために有用である。本発明の方法に従ってポリマーを分析することによって得られる構造情報は、ポリマーの特徴的性質の識別を含み得、これは(次に)、例えば、サンプル中のポリマーの存在の識別またはポリマーの関連性の決定、ポリマーのサイズの識別、ポリマーの2つ以上の個々のユニット間の近接度または距離、ポリマー内の2つ以上の個々にユニットの順序の識別、および/またはポリマーのユニットの一般的組成の識別を可能にする。このような特徴は、サンプル中の特定のポリマーの存在または不在を決定することのような、種々の目的に有用である。例えば、ポリマーが核酸であるとき、本発明の方法は、特定の遺伝子配列が細胞または組織中で発現されているか否かを決定するために用いられ得る。特定の配列の存在または不在は、サンプル内の任意のポリマーが、目的のポリマー中にのみ見出される個々のユニットの特徴的パターンを発現しているか否かを決定することにより、すなわち、検出されたシグナルを、既知のポリマーのシグナルの既知のパターンと比較し、既知のポリマーに対する分析されているポリマーの関連性を決定することにより確立され得る。目的のポリマーの全配列は、サンプル中のポリマーの存在または不在を確立するために決定される必要はない。同様に、これらの方法は、1つのポリマーから検出されたシグナルを、別のポリマーからのシグナルのパターンと比較し、2つのポリマーの関連性を決定するために有用である。
ポリマーの2つの個々のユニットの近接度またはそれらの間の距離は、本発明の方法に従って決定され得る。いくつかの理由のために、2つのユニットの近接度またはそれらの間の距離を決定し得ることは重要である。ポリマーの各ユニットは、骨格に沿って特異的な位置を有している。ユニットの配列は、既知のポリマーの青写真として供される。未知ポリマー上の2つ以上のユニット間の距離は、既知ポリマーの青写真と比較され得て、それらが関連しているか否かを決定する。さらに、2つのユニット間の距離を決定する能力は、存在するのであれば、いくつのユニットが目的の2つのユニットの間に存在するのかを決定するために重要である。
一般に、本発明の線形ポリマー分析の方法は、ポリマーの標識ユニットと、電磁放射源、クエンチング源および蛍光励起源からなる群から選択される因子との間の相互作用から生じるシグナルを検出することにより実施される。本明細書で用いられるとき、「シグナル」は、ポリマーの標識ユニットの構造特徴についての情報を伝達または運搬し、そして検出され得る、検出可能な物理量である。好ましくは、この物理量は、電磁放射である。このシグナルは、エネルギー移動、クエンチング、放射活性などから生じ得る。このシグナルは、特定の標識ユニットに特異的であるが、1つより多くの特定の標識ユニットを有するポリマーは、1つより多くの同一のシグナルを有する。さらに、特定タイプの各標識ユニットは、それらが異なる標識を有する場合、異なるシグナルを生じ得る。
シグナルを検出するために用いられる方法は、生成される物理量のタイプに依存する。例えば、この物理量が、電磁放射である場合、そのときは、このシグナルは光学的に検出される。本明細書で用いられるとき、「光学的に検出可能な」シグナルは、光検出造影システムにより検出され得る電磁放射の形態にあるシグナルに基づく光である。
「複数のポリマー」は、少なくとも2つのポリマーである。1つの実施形態における複数のポリマーは、少なくとも50のポリマーであり、そして別の実施形態では、少なくとも100のポリマーである。
これらのシグナルは、ポリマーに関する任意のタイプの構造情報を提供し得る。例えば、これらのシグナルは、ポリマーの全配列の全体または部分、シグナルの順序、または標識ユニット間の距離の指標としてのシグナル間の分離の時間を提供し得る。
本明細書で用いられるとき、「類似のポリマー」は、少なくとも1つの重複領域を有するポリマーである。類似のポリマーは、ポリマーの均一集団またはポリマーの不均一集団であり得る。本明細書で用いられるポリマーの「均一集団」は、同一ポリマーの群である。類似のポリマーの「不均一集団」は、同一ではないが、同一ユニットの少なくとも1つの重複領域を含む類似のポリマーの群である。核酸における重複領域は、代表的には、少なくとも10の連続ヌクレオチドからなる。いくつかの場合には、重複領域は、少なくとも、11、12、13、14、15、16、17、18、19、20、21、または22の連続ヌクレオチドからなる。
本明細書で用いられるとき、「ポリマー」は、結合によってともに結合される個々のユニットの直線状骨格を有する化合物である。いくつかの場合では、このポリマーの骨格は、分岐され得る。好ましくは、この骨格は分岐していない。用語「骨格」は、ポリマー化学の分野におけるその通常の意味が与えられる。ポリマーは、骨格組成において均一であり得、それによって、ペプチド−核酸(核酸に連結されるアミノ酸を有し、そして増加した安定性を有する)のようなともに結合したポリマーユニットの可能な任意の組み合わせを含む。好ましい実施形態では、これらポリマーは、骨格組成において不均一であり、そして、例えば、核酸、ポリペプチド、多糖、炭水化物、ポリウレタン、ポリカーボネート、ポリ尿素、ポリエチレンイミン、ポリアリーレンスルフィド、ポリシロキサン、ポリイミド、ポリアセテート、ポリアミド、ポリエステル、またはポリチオエステルである。最も好適な実施形態では、ポリマーは、核酸またはポリペプチドである。本明細書で用いられるとき、「核酸」は、デオキシリボース核酸(DNA)またはリボース核酸(RNA)のようなヌクレオチドから構成されるバイオポリマーである。本明細書で用いられるとき、ポリペプチドは、連結アミノ酸から構成されるバイオポリマーである。
ポリマーの連結ユニットに関して本明細書で用いられるとき、「連結された」または「連結」は、2つの実体が任意の物理化学的手段により互いに結合されていることを意味する。当業者に公知の任意の連結、共有または非共有が含まれる。このような連結は当業者に周知である。特定のポリマーの個々のユニットを連結する天然に通常見出されるような天然の連結が最も一般的である。天然の連結は、例えば、アミド、エステルおよびチオエステル連結を含む。本発明の方法により分析されるポリマーの個々にユニットは、しかし、合成または改変された連結により結合され得る。ユニットが共有結合により連結されるポリマーが最も一般的であるが、水素結合などもまた含む。
ポリマーは、複数の個々のユニットから構成される。本明細書で用いられるとき、「個々のユニット」は、その他の構築ブロックまたはモノマーに直接または間接的に連結され得、ポリマーを形成する構築ブロックまたはモノマーである。ポリマーは、好ましくは、少なくとも2つの異なる連結ユニットのポリマーである。この少なくとも2つの異なる連結されたユニットは、以下により詳細に論議されるように、異なるシグナルを生成するか、またはそれを生成するために標識され得る。特定のタイプのユニットは、ポリマーのタイプに依存する。例えば、DNAは、アデニン、シトシン、グアニン、チミン、5−メチルシトシン、2−アミノプリン、2−アミノ−6−クロロプリン、2,6−ジアミノプリン、ヒポキサンチン、およびその他の天然および非天然に存在するヌクレオ塩基、置換および非置換芳香族成分のようなプリンおよびピリミジンから構成されるデオキシリボースリン酸骨格から構成されるバイオポリマーである。RNAは、DNAについて記載されたようなプリンおよびピリミジン(しかし、ここで、チミンの代わりにウラシルが置換される)のユニットから構成されるリボースリン酸骨格から構成されるバイオポリマーである。これらのDNAヌクレオチドは、それらの5’または3’ヒドロキシル基により互いに連結され得、それによってエステル連結を形成する。上記のRNAヌクレオチドは、それらの5’、3’または2’ヒドロキシル基により互いに連結され得、それによってエステル連結を形成する。あるいは、5’、3’または2’アミノ基を有するDNAまたはRNAユニットは、アミノ基によりポリマーのその他のユニットに連結され得、それによってアミド連結を形成する。
核酸が文字の配列で表されるとき、それは、他であることが注記されなければ、ヌクレオチドが左から右に5’→3’順序にあり、しかも、「A」はアデニンを示し、「C」はシチジンを示し、「G」はグアノシンを示し、「T」はチミジンを示し、そして「U」はウラシルを示すことが理解される。
これらポリマーは、本来あるネイティブまた天然に存在するポリマーであるか、または本来存在しない天然に存在しないポリマーであり得る。代表的には、これらポリマーは、天然に存在するポリマーの少なくとも一部分を含む。これらポリマーは、単離され得るか、またはデノボ(de novo)で合成される。例えば、これらポリマーは、天然の供給源から単離され得、例えば、切断およびゲル分離によるように、精製されるか、または例えば、(i)例えば、ポリメラーゼ連鎖反応(PCR)によりインビトロで増幅されるか;(ii)例えば、化学的合成により合成されるか;(iii)クローニングなどにより組換えにより産生されるかで合成され得る。
ポリマーまたはその少なくとも1つの標識ユニットは、因子またはステーションと相互作用し得る形態にあり、その相互作用のシグナル特徴を生成する。このような相互作用を行い得るポリマーの標識されたユニットは、標識されているといわれる。ポリマーの標識されたユニットが、その相互作用を行い得、特徴的なシグナルを生成する場合、ポリマーは、内因的に標識されているといわれる。外因的な標識がポリマーに付加される必要は必ずしもない。しかし、非ネイティブ分子が、特徴的シグナルを生成する相互作用を生成するためにポリマーの個々の標識ユニットに付着されなければならない場合、ポリマーは外因的に標識されているといわれる。この「標識」は、例えば、光放射、エネルギー受容、蛍光、放射活性、またはクエンチングであり得る。いくつかの実施形態では、この標識されたポリマーは、外因的に標識されたポリマーであり、そしてその他の実施形態では、それは、内因的に標識されたポリマーである。
ポリマーの多くの天然に存在するユニットは、発光化学的またはクエンチャーである。例えば、ネイティブ核酸分子のヌクレオチドは、別個の吸収スペクトルを有し、例えば、A、G、T、C、およびUは、それぞれ、259nm、252nm、267nm、271nm、および258nmに吸収最大を有している。内因性標識を含む改変ユニットもまた、ポリマー中に取り込まれ得る。核酸分子は、例えば、発光化合物のエネルギー放射パターンまたはクエンチング化合物の特徴を有する以下の改変ヌクレオチドユニットのいずれかを含み得る:2,4−ジチオウラシル、2,4−ジセレノウラシル、ヒポキサンチン、メルカプトプリン、2−アミノプリン、およびセレノプリン。
本発明の方法に従う、有用な標識のタイプ、適切な標識を選択するためのガイドライン、およびポリマーに外因性標識を付加するための方法は、WO98/35012および米国特許第6,355,420号により詳細に提供されている。
本明細書で用いられるとき、「標識ユニット」は、特定のユニット(単数または複数)を識別するポリマー中の任意の標識されたユニットである。標識されたユニットは、たとえば、蛍光マーカー、および内因的および外因的に標識されたユニットを含む。
試験ポリマーを特徴付けるための方法は、複数のポリマーの各々についてポリマー依存性インパルスを得ること、この複数のポリマーのこのこのポリマー依存性インパルスを比較すること、このポリマーのポリマー依存性インパルス間の類似性に基づきポリマーの関連性を決定すること、および関連するポリマーのポリマー依存性インパルスに基づき試験ポリマーを特徴付けることによって実施される。
本明細書で用いられるとき、「ポリマー依存性インパルス」は、ポリマーの単一ユニットのみの構造的特徴についての情報を伝達または運搬する検出可能な物理量である。この物理量は、検出され得る任意の形態であり得る。例えば、この物理量は、電磁放射、化学的コンダクタンス、電気的コンダクタンスなどであり得る。このポリマー依存性インパルスは、エネルギー移動、クエンチング、コンダクタンスの変化、機械的変化、抵抗変化、または任意のその他の変化から生じ得る。このポリマー依存性インパルスは、特定のユニットに特異的であるが、1つより多くの特定の標識されたユニットを有するポリマーは、1つより多くの同一のポリマー依存性インパルスを有する。さらに、特定タイプの各ユニットは、それらが異なる標識を有する場合、異なるポリマー依存性インパルスを生じ得る。
ポリマー依存性インパルスを検出するために用いられる方法は、生成される物理量のタイプに依存する。例えば、物理量が電磁放射である場合、ポリマー依存性イパルスは、光学的に検出される。本明細書で用いられるとき、「光学的に検出可能な」ポリマー依存性インパルスは、光検出造影システムによって検出され得る電磁放射の形態にある光を基礎にしたシグナルである。この物理量が化学的コンダクタンスであるとき、このポリマー依存性インパルスは、化学的に検出される。「化学的に検出される」ポリマー依存性インパルスは、化学的コンダクタンスを測定するための標準的な手段によって検出され得るイオンコンダクタンスのような化学的濃度または電荷における変化の形態にあるシグナルである。この物理量が電気的シグナルである場合、このポリマー依存性インパルスは、抵抗または静電容量における変化の形態にある。
本明細書で用いられるとき、「ポリマーの関連性」は、そのポリマーに特有であるポリマーの特徴的パターンを識別することにより決定され得る。例えば、ポリマーが核酸である場合、このポリマー内の10の連続するヌクレオチドの実質的に任意の配列が、その核酸分子の特有の特徴であり得る。10ヌクレオチドの同じ配列を示すその他の任意の核酸分子は、関連するポリマーであり得る。
「複数のポリマー」は、少なくとも2つのポリマーである。好ましくは、複数のポリマーは、少なくとも50のポリマーであり、そしてより好ましくは、少なくとも100のポリマーである。
このポリマー依存性インパルスは、ポリマーについての任意のタイプの構造情報を提供し得る。例えば、これらのシグナルは、ポリマーの全配列の全部または一部、ポリマー依存性インパルスの順序、またはユニット間の距離の指標としてのポリマー依存性インパルス間の分離の時間を提供し得る。
このポリマー依存性インパルスは、ポリマーのユニットとシグナル生成ステーションにおける環境との間で生じる相互作用よって得られる。本明細書で用いられるとき、「シグナル生成ステーション」は、ユニットが環境と相互作用し、ポリマー依存性インパルスを生成する領域であるステーションである。本発明のいくつかの局面では、このポリマー依存性インパルスは、規定された領域における、電磁放射、クエンチング源、および蛍光励起源からなる群から選択される因子との、上記ユニットと相互作用し得、検出可能なシグナルを生成する接触から生じる。その他の局面では、ポリマー依存性インパルスは、分子との相互作用に応答してコンダクタンスにおける特異的変化を行い得る化学的環境との規定された領域における接触から生じる。特定構造をもつ分子は、化学的環境と相互作用するとき、コンダクタンスの変化が生じる。この特定構造に特異的であるこの変化は、一時的変化であり得、例えば、コンダクタンスが変化するために必要な時間の長さは、この相互作用が特定構造または物理的変化を含むことの指標であり得る。例えば、この相互作用の強度における変化は、特定構造との相互作用の指標であり得る。その他の局面では、ポリマー依存性インパルスは、ポリマーユニットに隣接して位置決めされる微小電極またはナノ電極間のユニットの移動によって引き起こされる静電容量または抵抗における変化から生じる。例えば、シグナル生成ステーションは、ポリマーユニットの対向する側面上に位置決めされる微小電極またはナノ電極を含み得る。これら電極を超えるユニットの移動の結果として生じる抵抗またはコンダクタンスの変化は、特定ユニットに特異的である。
2つの個々のユニット間の距離を決定するための方法がまた本発明に包含される。連結ユニットのポリマーの2つの個々のユニット間の距離を決定するために、ポリマーは、シグナル生成ステーションに対して直線的に通過させられ、そして2つの個々のユニットの各々がシグナル生成ステーションによって通過されるときに生成されるポリマー依存性インパルスが測定される。次いで、このステップの各々が複数の同様のポリマーについて繰り返される。ポリマーの各ユニットがシグナル生成ステーションによって連続的に通過されるとき、ポリマーは、シグナル生成ステーションに対して線形的に通過するといわれる。
ステップの各々が、複数の同様のポリマーについて繰り返され、データセットを生成する。2つの個々のユニット間の距離が、次いで、データセットを分析することにより複数の類似のポリマーから得られる情報に基づき決定され得る。
この方法はまた、標識を含むポリマーの量を識別するための方法を含む。例えば、サンプル中の特定ユニットまたはユニットの組み合わせを有するポリマーの数を決定することが可能である。mRNAサンプルにおいては、例えば、サンプル中に存在する特定のmRNAの数が決定され得る。これは、所望のmRNA分子のパターンまたはサイン特徴を識別することにより達成され得る。RNAのサンプルは、次いで、本発明の方法に従って分析され得、そして特定のパターンまたはサインを有するmRNAの数が決定され得る。
現在、ヒトゲノムの5%より少ない部分が配列決定されている。これは、すべての個体の配列である、ヒト配列知識における理想の小フラクションに翻訳される。例えば、ヒト集団について、1.4×1019(50億の人々×3.×109塩基/ヒト)がある。今のところ、ヒト遺伝子情報の2×10−10%のみが知られている。すべての全世界的努力によるヒトゲノムの配列決定の速度は、粗く、>$1/塩基のコストで、3×109/15年、または550,000塩基/日である。本明細書に記載の本発明の方法による配列決定は、配列決定の速度における通常でないブレークスルーを構成する。一人のヒトゲノムを1つの機械で終了するための推定時間は、約15時間である。パラレルのいくつかの動的アレイは、一時間以内で一人のヒトゲノムの配列を終了し得る。
連結ユニットのポリマーを配列決定する方法もまた、本発明によって包含される。この方法は、ポリマーの各々の少なくとも一部分がポリマーの他の部分と同一の連結ユニットの配列を有する、複数の重複するポリマーの各々からポリマー依存性インパルスを得ること、およびこのポリマー依存性インパルスを比較し、複数のポリマー中で同一である連結ユニットの配列を得ることにより達成される。
複数の重複するポリマーは、各ポリマーが、他のポリマーと同一である連結ユニットのその配列の少なくとも一部分を有するポリマーのセットである。同一である配列の部分は、重複領域と称され、そしてそれは、少なくとも10の連続するユニットを含む。
本発明の別の局面では、連結ユニットのポリマーのユニットの順序が、このポリマーを、シグナル生成ステーションに対して直線的に移動させること、および各々が特徴的なポリマー依存性インパルスを生じる2つの個々のユニットの各々が、シグナル生成ステーションによって通過されるとき生成されるポリマー依存性インパルスを測定することによって決定され得る。これらのステップは、複数の類似のポリマーについて繰り返され、そして少なくとも2つの個々のユニットの順序が、これら複数の類似のポリマーから得られた情報を基に決定される。
一セットのポリマー(ここで、このセットのうちのこれらのポリマーの各々は、連結されたユニットの別個のポリマーである)を分析する方法は、本発明によって包含される。本方法は、ポリマーのセットを互いに平行に配向させる工程、およびそのポリマーのポリマー特異的な特徴を検出する工程を包含する。
ポリマーのセットは、互いに平行に配向される。これらのポリマーは、それらのポリマーを互いに平行に配向させ得る任意の手段によって、配向され得る。例えば、電場は、それらのポリマーを平行形態で配向させるために、適用され得る。好ましくは、この配向工程は、溶媒を含まないゲル中である。
本明細書中で使用される場合、「ポリマー特異的な特徴」は、その配列(sequence)に関係する、ポリマーの任意の構造的特徴である。例えば、ポリマー特異的な特徴としては、ポリマーについての情報(例えば、ポリマーの長さ、ポリマー中に連結されるユニットの順序、ポリマーのうちのユニットの間の距離、ポリマー中のユニットの近接性、ポリマーのうちの1つのユニット、いくつかのユニットまたは全てのユニットの配列、およびポリマーの存在)が挙げられ得るが、これらに限定されない。
1つより多くの物理的特徴を標識中に含むことによって、同じ時間枠内での核酸の同時的かつ反復した読み取り物は、1つの物理的特徴のみが含まれる場合より、標識されたヌクレオチド位置についてのより正確かつ迅速な情報を提供し得る。このサンプルは、例えば、異なる波長の発蛍光団で標識され得る。この発蛍光団の各々は、同じサンプル由来の別個の読み取り物を提供するよう、別々に検出され得る。例えば、ポリマーのユニットの終端は、第1の波長を放射する発蛍光団で標識され得、そして1セットの内部ユニットは、第2の波長を放射する発蛍光団で標識され得る。このポリマーがシグナルステーション(signal station)を通って移動される場合、両方の波長は、検出されて、両方のセットの標識についての情報を提供し得る。
本発明の方法についての1つの使用は、ポリマー内のユニットの配列を検出することである。ポリマー(例えば、核酸)のユニットの配列を同定することは、そのポリマーの機能を理解すること、および生理学的環境(例えば、細胞または組織)におけるポリマーの役割を決定することにおいて、重要な工程である。現在使用される配列決定方法は、遅くかつ面倒である。本発明の方法は、ずっと迅速であり、そして非常に短い時間期間において、ずっと多くの配列データを調製する。
検出可能なシグナルは、シグナルステーションで形成される。本明細書中で使用される場合、「シグナルステーション」は、検出されるべきポリマーの一部分(例えば、標識されたユニット)が曝されて、シグナルを形成する領域である。このステーションは、気体を含めた任意の物質からなり得る。好ましくは、このステーションは非液体物質である。「非液体物質(non−liquid)」は、当該分野における通常の意味を有する。液体は、構成分子のそれらの間での自由な移動によって特徴付けられるが分離する傾向を有さない、非固体性、非気体性の物質である。別の好ましい実施形態において、このステーションは固体物質である。
シグナルステーションは、相互作用ステーションである。本明細書中で使用される場合、「相互作用ステーションまたは相互作用部位」は、ポリマーの標識されたユニットが、因子と相互作用する領域であり、そして相互作用性の近接にある因子に関して位置決めされる。本明細書中で使用される場合、「相互作用性の近接」は、そのユニットとその因子とが相互作用し得る、十分な近接にあることを意味する。例えば、発蛍光団のための相互作用ステーションは、それらが十分近くにあってその結果それらがエネルギー的に相互作用してシグナルを形成する領域である。
好ましい実施形態における相互作用ステーションは、分子モーターまたは支持体に結合した、局在化された因子(例えば、アクセプター発蛍光団)が、分子モーターを通り抜けてポリマーと相互作用し得る、分子モーターの領域である。ポリマーが因子の局在化領域を通る位置が、相互作用ステーションである。各々の標識されるポリマーのユニットが因子のそばを通る場合、検出可能なシグナルが形成される。因子は、種々の方法でチャネルの領域内に局在化され得る。例えば、因子は、ポリマーが分子モーターと相互作用する部位で、直接的またはリンカーによって分子モーターに対して物理的に結合され得る。あるいは、ポリマーの全てのユニットが通る支持体の領域に因子が結合されるかぎり、分子モーターは支持体に結合され得、そして因子もまた支持体に結合され得る。例えば、因子は、チャネルの壁を形成する物質中、またはその物質の表面上に包埋され得、ここで、この分子モーターは壁に結合しそしてポリマーをそのチャネルを通って移動させる。あるいは、因子は、分子モーターまたは支持体から離れて位置付けられるが、波長ガイドを通るチャネルの領域に対して直接的に光を移送し得る光供給源であり得る。本発明のこれらの実施形態および他の関連の実施形態は、以下により詳細に考察される。ポリマーの移動は、ポリマーを導くための溝(groove)またはリング(ring)の使用によって補助され得る。
相互作用ステーションを形成するための他の手はずは、本発明によって包含される。例えば、ポリマーは、壁の表面に繋留されるかまたは壁の中に包埋される分子モーターを通過され得、これによって特定の位置に、好ましくは近接の因子に対して相互作用可能に近接して、連続してポリマーの標識化ユニットを運び、これによって相互作用ステーションを規定する。分子モーターは、ポリメラーゼ、ヘリカーゼ、またはアクチンのような、ポリマーと相互作用する化合物および各々の標識化ユニットを通ってポリマーの長さに沿って移送される化合物である。同様に、ポリマーは移動から捕捉され得、そして読み取り機はポリマーに沿って移動し得、この読み取り機は分子モーターでありそしてその分子モーターに因子を結合させている。
相互作用ステーションでポリマーの標識化ユニットと相互作用する因子は、電磁放射線、消光性(quenching)供給源、および蛍光励起供給源からなる群より選択される。本明細書中で使用される場合、「電磁放射線」は、電磁波によって生じるエネルギーである。電磁放射線は、直接的な光供給源の形態であり得るか、またはこれは、光放射性化合物(例えば、ドナー発蛍光団)によって放射され得る。本明細書中で使用される場合、「光」は、可視、赤外および紫外を含む、任意の波長の電磁エネルギーを含む。
本明細書中で使用される場合、消光性供給源は、光放射供給源の特性を変更するかまたは変更し得る、任意の実体である。変更される特性としては、蛍光持続時間(lifetime)強度、スペクトル、蛍光、またはりん光が挙げられ得る。
本明細書中で使用される場合、蛍光励起供給源は、蛍光発光し得るかまたはフォトンの放射(すなわち、電磁放射線、指向された電場、温度、蛍光、放射線、シンチレーション、物理的接触、または機械的崩壊)を起こし得る、任意の実体である。例えば、標識されたユニットが放射性化合物で標識される場合、放射活性の放射は、因子の分子励起を引き起こし、このことは、蛍光発光を生じるシンチレーションの層である。
ポリマーの標識されたユニットが因子に曝される場合、これらの二者の間の相互作用はシグナルを生じる。このシグナルは、ポリマーについての情報を提供する。例えば、タンパク質ポリマーのうちの特定型のすべての標識されたユニット(例えば、全てアラニン)が特定の光放射性化合物で(内因性または外因性)標識される場合、この光放射性化合物のシグナル特性が因子との相互作用の際に検出されるときに、このシグナルは、アラニン残基がポリマー上のその特定の位置に存在することを表す。各々の型の標識されるユニット(例えば、各々の型のアミノ酸)が別個の光放射パターンを有する異なる光放射化合物で標識される場合、各々のアミノ酸は因子と相互作用して別個のシグナルを生じる。ポリマーの各々の標識されたユニットに対する各々のシグナルが何であるかを決定することによって、ユニットの配列が決定され得る。
標識されたユニットと因子との間の相互作用は、種々の形態をとり得るが、標識されたユニットと因子とが物理的に互いに接触することを必要としない。相互作用の例は、以下の通りである。第1の型の相互作用は、電磁放射線である因子および光放射性化合物であるポリマーの標識されたユニット(光放射性化合物で内因性に標識されるかまたは外因性に標識されるかのいずれか)を含む。光放射性標識化ユニットが(例えば、適切な波長のレーザー光線によるか、またはドナー発蛍光団から放射された電磁放射線による)電磁放射線と接触する場合、この電磁放射線は、光放射性化合物に特定の波長の電磁放射線を放射させる。次いで、シグナルが測定される。このシグナルは、光放射の特徴的なパターンを提示し、そしてこれによりポリマーの特定の標識されたユニットが存在することを示す。この場合において、ポリマーの標識されたユニットは、「光放射性化合物からの電磁放射線の放射に検出可能に影響を与える」と言われる。
第2の型の相互作用は、蛍光励起供給源である因子、および光放射性化合物または放射性化合物であるポリマーの標識されたユニットを含む。光放射性標識化ユニットが蛍光励起供給源と接触する場合、この蛍光励起供給源は、光放射性化合物に特定の波長の電磁放射線を放射させる。放射性標識化ユニットが蛍光励起供給源と接触する場合、その標識化ユニットから放射された放射線は、蛍光励起供給源に特定の波長の電磁放射線を放射させる。次いで、このシグナルが検出される。
これらの型の種々の相互作用は、相互作用の第3の要素、シグナル形成に関与する近位の化合物の存在を含む。例えば、標識されたユニットは、ドナー発蛍光団である光放射性化合物で標識され得、そして近接化合物は、アクセプター発蛍光団であり得る。光放射性化合物が励起状態に置かれ、そしてアクセプター発蛍光団に近位に運ばれる場合、ドナーとアクセプターとの間にエネルギー転移が起こり、光放射性である標識されたユニットの存在の測定として検出され得るシグナルを生じる。光放射性化合物は、これを光(例えば、レーザー光)に曝すことによるかまたはこれを蛍光励起供給源に曝すことによって、「励起」状態に置かれ得る。
別の相互作用は、消光性供給源である近位の化合物を含む。この例において、光放出性標識化ユニットは、これを光に曝すことによって電磁放射線を放射させられる。光放射性化合物が消光性供給源に近位に置かれる場合、光放出性標識化ユニットからのシグナルは、変更される。
上記の相互作用に対して並列の相互作用のセットは、本明細書中に作出され得るが、光放射性化合物は、近位の化合物であり、そして標識されたユニットは、消光性供給源であるかまたはアクセプター供給源であるかのいずれかである。これらの例において、因子は近位の化合物によって放出される電磁放射線であり、そしてシグナル(標識されたユニットとこのような放射との間の相互作用の特徴)は、標識されたユニットを近位の化合物と相互作用可能に近位に運ぶことによって生じる。
これらの相互作用の各々が検出可能なシグナルを形成するメカニズムは、当該分野で公知である。例示的な目的のために、ドナー発蛍光団とアクセプター発蛍光団とが本発明に従って相互作用するメカニズムは検出可能なシグナルを形成し、このことはこの型の相互作用からの結果であることが知られる実施上の制限を含み、そしてこのような制限を軽減または除外する方法は、以下に記載される。
本発明の分析の別の好ましい方法は、放射能標識されたポリマーの使用を含む。放射能性の放射の型は、使用される検出デバイスの型に影響する。一般的に、α放射、β放射およびγ放射を含む、3つの異なる型の核の放射が存在する。α放射は、物質における過度のイオン化を引き起こし、そしてイオン化チャンバおよび比例計数管による個々の計数測定を可能にするが、さらに興味深いことに、物質と相互作用するα放射はまた、分子励起を引き起こし得、このことは結果として蛍光発光を引き起こし得る。この蛍光発光は、シンチレーションといわれる。α崩壊より弱いβ崩壊は、増幅されて適切なシグナルを生じ得る。γ放射は、励起エネルギーの内的転換から起こる。γ線のシンチレーション計数測定は有効であり、そして強力なシグナルを形成する。ヨウ化ナトリウム結晶は、入射のγ放射で蛍光発光する。
本明細書中で使用される場合、「シンチレーション」相または「シンチレーション」物質は、放射線による励起に応答して蛍光発光するかまたは光を放射する、任意の型の物質である。シンチレーション物質は、当該分野で周知である。共鳴構造を有する芳香属性炭化水素は、優れたシンチレーターである。アントラセンおよびスチルベンは、このような化合物の範疇に帰する。無機結晶もまた、蛍光発光することが知られる。これらの化合物が発光するためには、無機結晶は少量の不純物を有さなければならず、これらは、価電子帯と伝導帯との間のエネルギーレベルを作出する。従って、励起および脱離励起(deexcitation)が起こり得る。多くの場合において、この脱離励起は、リン光性フォトン放射を通して起こり得、これは長持続性の検出へと導く。いくつかの通常のシンチレーターとしては、NaI(Ti)、ZnS(Ag)、アントラセン、スチルベンおよび人工のリン光団(phosphor)が挙げられる。
放射線を測定する多くの方法は当該分野で公知であり、そしてこれら方法としては、以下が挙げられる:霧箱デバイスおよび泡箱デバイスのようなデバイス、定電流イオンチャンバ、パルス計数器、ガス計数器(すなわち、Geiger−Muller計数器)、固体状態検出器(表面障壁検出器、リチウム拡散検出器、内在性(intrinsic)ゲルマニウム検出器)、シンチレーションカウンタ、チェレンコフ(Cerenkov)検出器、など。
放射標識されたポリマーの分析は、シグナルを生じる他の手段と同じである。例えば、放射標識されたAを有するサンプルは、サンブルDNA上のAの相対的な間隙形成を測定するためのシステムにより、分析され得る。放射性シグナルの検出の間の時間は、分析されるポリマーに特徴的である。標識されたDNAの4つの集団(A、C、G、T)の分析は、分析される核酸の配列を生じ得る。DNAの配列はまた、二重標識されたDNAおよび単一標識されたDNAの組み合わせの分析を含む、より複雑なスキームで分析され得る。A(a)およびCで標識されたフラグメントの分析、その後のA(a)で標識されたバージョンの同一フラグメントの分析は、AおよびCの位置の知見を生じる。この手順が相補鎖に対して繰り返される場合に、この配列が知られる。この系はさらに、ポリマー(ポリペプチド、RNA、炭水化物など)、大きさ、濃度、型、同一性、存在、配列および数の分析に対して使用され得る。
上記の方法は、単独のポリマーまたは1つより多くのポリマーについて実施されて、そのポリマーについての構造情報を決定し得る。
本明細書中で使用される場合、「検出可能なシグナル」は、慣用的な技術によって意味づけられ得る、任意の型の電磁放射線シグナルである。形成されるシグナルは、位置の型、ならびに標識されたユニットおよび存在する場合に近位の化合物に、依存する。1つの実施形態において、シグナルは、ポリマーの(内因性または外因性に)標識されたユニットによるか、または近位の化合物による光放射から結果として生じる電磁放射線である。別の実施形態において、シグナルは、シンチレーション相との放射能放射の相互作用から結果として生じる蛍光発光である。検出されたシグナルは、分析のためデータベースに記憶され得る。記憶されたシグナルを分析するための1つの方法は、別のポリマーからのシグナルのパターンと記憶されたシグナルを比較して、これら2つのポリマーの関連性を決定することによる。検出されたシグナルを分析するための別の方法は、既知のポリマーに特徴的である既知のパターンのシグナルと、検出されたシグナルを比較して、既知のポリマーに対して分析されたポリマーの関連性を決定する。シグナルの比較は、以下により詳細に考察される。
1つより多くの検出可能シグナルが検出され得る。例えば、第1の別個に標識されたユニットは、因子と相互作用して、第1の検出可能なシグナルを形成し得、そして第2の別個の標識されたユニットは、因子と相互作用して、第1の検出可能なシグナルとは異なる第2の検出可能なシグナルを形成し得る。このことは、1つより多くの型の標識されたユニットが、単独のポリマー上で検出されることを可能にする。
一旦シグナルが形成されると、次いでこのシグナルは検出され得る。特定の型の検出手段は、標識されたユニットと因子との間に起こる相互作用の型に当然依存する、形成されるシグナルの型に依存する。本発明の方法に関与する多くの相互作用は、電磁放射線シグナルを形成する。電磁放射線シグナルを検出するための多くの方法が当該分野で公知であり、これら方法としては、二次元および三次元の画像処理システムが挙げられる。これらのシステムおよび他のシステムは、PCT出願WO98/35012ならびに米国特許第6,355,420号および同6,403,311号により詳細に記載される。
光学検出可能なシグナルが形成され、検出され、そしてデータベースに記憶されて、そしてこれらのシグナルが分析されてポリマーについての構造情報を決定し得る。コンピューターは、ポリマーについてのデータを収集するために使用される同一のコンピューターであっても、またはデータ分析に供される別個のコンピューターであってもよい。本発明を実行するのに適切なコンピューターシステムは、代表的に、ユーザーに情報を表示する出力デバイス、出力デバイスに連絡された中央ユニット、およびユーザーからの入力を受け入れる入力デバイスを備える。中央ユニットは一般的に、相互連絡機構を介してメモリシステムと連絡されたプロセッサを備える。入力デバイスおよび出力デバイスはまた、相互連絡機構を介して、プロセッサシステムおよびメモリシステムに連絡される。検出されたシグナルのデータ分析のためのコンピュータープログラムは、CCD製造業者から容易に利用可能である。
本発明の方法は、ポリマーが分子モーター介して移動するにつれて、ポリマーの個々の標識されたユニットに対して特異的な検出可能なシグナルを形成する、任意のデバイスを使用して達成され得る。この型の分析を可能にする1つの型のデバイスは、分子モーターを使用して、相互作用ステーションを通るポリマーの直線的な移動を促進するデバイスであり、ここで、この相互作用ステーションは、電磁放射線供給源、消光性供給源、発光フィルム相、および蛍光発光励起供給源からなる群より選択される因子を含む。好ましくは、この因子は分子モーターに十分近くにあり、そして光放射化合物および分子モーターによって移動される消光物質(quencher)からなる群より選択されるパートナー化合物と、検出可能に相互作用するのに十分な量で存在する。
好ましくは、分子モーターは支持体に繋留される。本明細書中で使用される場合、「支持体」は、任意の固体表面(例えば、スライドまたはビーズ)であるが、半固体物質(例えば、ゲルまたは脂質二重層)は含まない。
別の好ましい実施形態において、分子モーターもポリマーも支持体に繋留されない。この完全な方法は、上記されるような液体中で実施され得る。
別の実施形態において、分子モーターは、少なくとも1つのチャネルを有する壁物質に繋留され得る。この配置は、ポリマーが分子モーターによって移動されるにつれてこのポリマーを誘導するのに有用である。壁物質は、少なくとも1つのチャネルを支持し得る、任意の寸法の固体障壁または半固体障壁である。半固体物質は、自己支持性物質であり、例えば、ポリアクリルアミドゲルのようなゲル物質であり得る。例えば、壁物質は、単一の支持物質からなり得、これらは、導電性であっても非導電性であってもよく、光透過可能であっても光透過不能であってもよく、透明であっても不透明であってもよい。いくつかの例において、因子は、壁物質内に包埋される。これらの例において、壁物質は、非導電性相、光透過可能な層または透明な層から、単独でかまたは部分的に作られて、壁物質中に形成されるチャネルに対して因子が曝されることを可能にして、シグナル形成を可能にする。壁物質がこれらの物質から僅かに部分的に作られる場合、残りの壁物質は、導電性相、光透過不能である層、または不透明層から作られ得、これらは、シグナル形成を妨げる。いくつかの場合において、壁物質は、異なる物質の層から作り上げられる。例えば、壁物質は、1つの導電性相および1つの非導電性相から作られ得る。あるいは、壁物質は、2つの導電性相に囲まれた、1つの非導電性相から作られ得る。複数の層および物質の種々の組み合わせは、本発明の壁物質に包含される。
因子は、この実施形態において壁物質に繋留され得るか、またはこれは分子モーターに繋留され得る。
本明細書中で使用される場合、「発光フィルム相」は、本質的に発光性であるか、または励起もしくは照明のうちのいくつかの手段によって発光性にされる、フィルム(例えば、電気光学フィルム箔および内部反射により照射された高指数フィルム)である。
本明細書中で使用される場合、「物質遮蔽」は、エネルギー転移または消光を防止するかまたは制限する、任意の物質である。このような物質としては、導電性物質、高指数物質、および光透過不能物質が挙げられるが、これらに限定されない。好ましい実施形態において、物質遮蔽は、導電性の物質遮蔽である。本明細書中で使用される場合、「導電性物質遮蔽」は、ドナー供給源とアクセプター供給源との間のエネルギー転移を防止するのに少なくとも十分に導電性である物質である。
本明細書中で使用される場合、「導電性物質」は、ドナーとアクセプターとの間のエネルギー転移を防止するのに少なくとも十分に導電性である物質である。
本明細書中で使用される場合、「非導電性物質」は、ドナーとアクセプターとの間のエネルギー転移を可能にする量より少ない量を伝導する物質である。
本明細書中で使用される場合、「光透過可能な物質」は、使用される特定の電磁放射線、消光性供給源、または蛍光発光励起供給源によって形成される波長の光に対して透過可能である物質である。
本明細書中で使用される場合、「光透過不能な物質」は、使用される特定の電磁放射線、消光性供給源、または蛍光発光励起供給源によって形成される波長の光に対して透過不能である物質である。
本明細書中で使用される場合、「チャネル」は、ポリマーが通過し得る、媒体を通る通路である。チャネルは、ポリマーがこれを通過し得る限り、任意の寸法を有し得る。例えば、チャネルは、非分枝性の直線的な円筒形のチャネルであり得るか、またはチャネルは内部連絡された曲がりくねったチャネルの分枝性のネットワークであり得る。好ましくは、チャネルは直線的なナノチャネルかまたはマイクロチャネルである。本明細書中で使用される場合、「ナノチャネル」は、ナノメートルのオーダーの寸法を有するチャネルである。ナノチャネルの平均径は1nmと999nmとの間である。本明細書中で使用される場合、「マイクロチャネル」は、マイクロメートルのオーダーの寸法を有するチャネルである。マイクロチャネルの平均径は、1mmと1mmとの間である。本発明に従う、有用なチャネルの好ましい仕様および寸法は、以下に詳細に記載される。好ましい実施形態において、チャネルは壁の中に固定される。
因子は、壁物質または分子モーターのチャネルを通過しているパートナー光放射性化合物でエネルギー転移を受けるかまたは消光することによってパートナー化合物と検出可能に相互作用する様式で、壁物質または分子モーターに取り付けられる。パートナー化合物と相互作用するため、因子はチャネルにすぐ近位に置かれ得る。例えば、因子は、チャネルの内側に取り付けられ得るか、壁物質の外部表面に取り付けられ得るか、チャネルの円周を取り囲む壁物質の外表面の集中した領域に取り付けられ得るか、壁物質内に包埋され得るか、チャネルを取り囲む壁物質の中に密集した輪の形態で包埋され得るか、分子モーターの局在した領域に取り付けられ得るか、または分子モーターの表面上に取り付けられ得る。必要に応じて、因子は、壁物質もしくは分子モーターの表面全体を覆い得るか、またはこれら全体にわたって包埋され得る。因子が局在されない場合にシグナル形成を向上させるために、マスクを使用して壁物質または分子モーターのいくつかの領域を覆い得、その結果、因子の局在される領域のみが曝される。本明細書中で使用される場合、「マスク」は、任意のサイズまたは形状の開口を有する物体(object)である。1つより多くの因子が壁物質またはモーターに取り付けられて、因子がパートナー因子に曝される場合に異なるシグナルを形成し得る。
因子は、当該分野で公知の取り付けを実施する任意の手段によって、壁物質または分子モーターの表面に取り付けられ得る。生体材料を結合体化するための方法の例は、Hermanson,G.T.,Bioconjugate Techniques,Academic Press,Inc.,San Diego,1996に提示される。
因子が壁物質または分子モーターの表面に取り付けられる場合、壁物質もしくは分子モーターに直接的に取りつけられ得るか、またはリンカーを介して取りつけられ得る。因子の取り付けに関して本明細書中で使用される場合、「リンカー」は、壁物質または分子モーターに対して光放射性化合物または消光性化合物を繋留する分子である。リンカーは、当該分野で周知である。これらとしては、ヘテロまたはホモの両機能性リンカーが挙げられる。通常使用されるリンカーとしては、種々の長さのアルカンが挙げられる。
因子は、パートナーの光放射性化合物と検出可能に相互作用するのに十分な量で、壁物質または分子モーターに取り付けられる。本明細書中で使用される場合、「パートナー光放射性化合物」は、上記の通りであるが、因子の直ぐ近位に置かれる場合に特異的に相互作用しそしてエネルギー転移または消光を受ける、光放射性化合物である。パートナー光放射性化合物の量および必要とされる因子の量は、使用される因子および光放射性化合物の型に依存する。
本明細書中で使用される場合、「複数のステーション」は、少なくとも2つのステーションである。好ましくは、複数のステーションは少なくとも3つのステーションである。別の好ましい実施形態において、複数のステーションは少なくとも5つのステーションである。
PCT出願WO 98/35012および米国特許第6,355,420号は、プレート内に包埋された発蛍光団を有するナノチャネルプレートの最適な設計の詳細な記載、および本発明の方法を実施するために有用な他の物品を提供する。しかし、本発明の方法は、本明細書中または優先のPCT出願に記載された製造業者の物品の使用に限定されない。これらの例示は、説明目的のためにだけに提供される。本発明の方法は、ポリマーの複数の標識されたユニットが固定されたステーションに関して移動され得、そしてシグナルが得られ得る任意の系を使用して、実施され得る。
分子モーターと共に有用である上記のナノチャネルの各々は、単なる一例である。従って、任意の1つの要素または要素の組み合わせを含むこれら実施形態に関して記載される各々の制限が各ナノチャネル内に含まれ得ることが、予想される。物質を異にする複数の層を有するフィルムの調製は、当該分野で記述されている(例えば、米国特許第5,462,467号、Ferreiraら、Thin Solid Films、244;806−809、1994)。