JP2012517231A

JP2012517231A - 標的ゲノム配列の富化のための方法およびシステム

Info

Publication number: JP2012517231A
Application number: JP2011549483A
Authority: JP
Inventors: ゲルハルト，ダニエル; マリオン，ポール; アルバート，トーマス; ロデシュ，マシュー; リッチモンド，トッド; ジェデロー，ジェフリー
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG
Priority date: 2009-02-13
Filing date: 2010-02-11
Publication date: 2012-08-02
Also published as: US20100331204A1; WO2010091870A1; CN102317476A; CA2747389A1; EP2396423A1

Abstract

本発明は、試料中での標的化核酸配列富化のための方法およびシステムを提供する。特に、本発明は、まず、非標的核酸配列を枯渇させることにより、ハイブリダイゼーションアッセイでのハイブリダイゼーション中の標的化核酸配列の富化を提供する。

Description

発明の分野
本発明は、標的化ゲノム配列の富化のための方法およびシステムを提供する。特に、本発明は、ハイブリダイゼーションアッセイにおけるハイブリダイゼーション中に、標的ゲノム中の非標的核酸配列を枯渇させることによる、標的核酸配列の富化を提供する。

発明の背景
核酸マイクロアレイ技術の進歩により、非常に小さな領域、例えば顕微鏡スライド上に数百万の核酸配列のアレイを構築することが可能になっている（例えば、米国特許第6,375,903号および第5,143,854号）。最初、前もって合成したDNA配列をスライド上にスポットすることによりかかるアレイは作製された。しかし、現在は、米国特許第6,375,903号に記載されるようなマスクレスアレイ合成機（MAS）の構築により、オリゴヌクレオチド配列をスライド上に直接インサイチュ合成することが可能になった。

MAS装置を使用することで、マイクロアレイ上に構築されるオリゴヌクレオチド配列の選択は、研究者の特定の要求に応じて個々に調整されたアレイを作製できるように、ソフトウェア制御される。一般的に、MAS系オリゴヌクレオチドマイクロアレイ合成技術により、数百万の特有のオリゴヌクレオチドの特徴の合成を、標準的な顕微鏡スライドの非常に小さな領域で並行して行うことが可能である。一般に参照配列が公共のデータベースに登録されている数百の生物の全ゲノムが入手可能なことにより、マイクロアレイは、無数の生物から単離された核酸の配列解析を行なうために使用されている。

核酸マイクロアレイ技術は、遺伝子の発現および発見、変異の検出、対立遺伝子および進化における配列比較、ゲノムマッピング、創薬などの研究および診断の多くの分野に応用されている。多くの用途には、ヒト疾患に罹患しているヒトの全ヒトゲノム中の遺伝子バリアントおよび変異の研究が必要である。複雑な疾患の場合、これらの研究により、通常、疾患および/または疾患リスクに関連する一ヌクレオチド多形（SNP）またはSNPの組がもたらされる。一塩基の変化を見つけるためまたは全ての配列バリアントを同定するために、罹患個体または組織試料由来の通常100キロベース(Kb)を超える巨大なゲノムDNAの領域を再度配列解析することが必要となるので、かかるSNPを同定することは困難であり、しばしば結果がでない作業であることが明らかにされている。他の用途には、癌、例えばリンパ腫（Martinez-Climent JA et al., 2003, Blood 101 :3109-3117）、胃癌（Weiss MM et al., 2004, Cell. Oncol. 26:307-317）、乳癌（Callagy G et al., 2005, J. Path. 205: 388-396）および前立腺癌（Paris, PL et al., 2004, Hum. Mol. Gen. 13:1303-1313）にも関連し得る染色体配列の増加および低下の同定を伴う。このように、マイクロアレイ技術は、科学研究者および臨床医にとって、疾患および疾患の治療における治療計画の有効性の理解に非常に有用なツールである。

通常、ゲノムは複雑すぎて全体として研究することができず、ゲノムの複雑さを低下させるための技術を使う必要がある。この問題に取り組むための1つの解決策は、米国特許第6,013,440号に見られるように、特定の種類の豊富な配列をDNA試料から低減させることである。代替法には、例えばAlbert et al. (2007, Nat. Meth., 4:903-5)、Okou et al. (2007, Nat. Meth. 4:907-9)、Olson M. (2007, Nat. Meth. 4:891-892)、Hodges et al. (2007, Nat. Genet. 39:1522-1527)に記載され、米国特許出願第11/638,004号、11/970,949号および61/032,594号に見られるように、ゲノム配列を富化するための方法および組成物が使用されている。Albert et al.には、さらなる処理および解析を可能にするためのユーザーが規定する方法において、ゲノム試料の複雑さを費用効果的でかつ迅速に、効果的に低減する代替法が開示されている。また、Lovett et al. (1991, Proc. Natl. Acad. Sci. 88:9628-9632)には、バクテリア人工染色体（BAC）を使用したゲノム選択のための方法が記載されている。標的配列の富化を行ってゲノムの複雑さを低減した後に配列決定を行なうことは、ハイブリダイゼーション事象単独を測定することよりもかなり優れている。ハイブリダイゼーション事象は、マイクロアレイまたは溶液中で、標的配列および非標的配列の両方などの任意の種のハイブリダイゼーションを可能にする。複雑さ低減および配列富化を行なうことにより、研究者は、捕捉されたオンターゲット配列（例えば、アッセイの焦点となっている配列）を増加し、かつ捕捉される非標的配列（例えば、アッセイの焦点になっていない配列）の量を減少させる。

しかしながら、いずれのハイブリダイゼーションアッセイにも関連する問題は、標的核酸のハイブリダイゼーション中のアレイ上または溶液中の非標的核酸配列の二次捕捉としても知られている非標的（例えば、繰り返し）核酸配列の交差捕捉の事象である。二次捕捉は、ハイブリダイゼーションアッセイにおける複雑さ低下の効率を減少させ、実質的に、非標的の捕捉が所望の標的の捕捉を圧倒して（swamp out）、標的捕捉の効率を減少させ得る。現在の方法では、C₀t-1 DNAなどのゲノムブロッカーDNAをハイブリダイゼーションアッセイに添加して、二次捕捉を抑制している。実験にさらなるDNAが添加されないことが優先的であるが、現在の実務ではその選択肢は提供されない。

このように、ハイブリダイゼーションアッセイにおいて、好ましくない核酸の添加を含まず、同時に研究努力のための標的核酸の捕捉の効率を上げる代替法により、二次捕捉に対処する方法が必要とされている。

発明の概要
本発明は、標的化配列の富化のための方法およびシステムを提供する。特に、本発明は、ハイブリダイゼーションアッセイにおけるハイブリダイゼーション中に、非標的核酸配列を標的ゲノム中で枯渇させることにより標的核酸配列を富化することを提供する。

マイクロアレイ形式における二次捕捉反応は、標的核酸の捕捉の効率の低下をもたらす。この効率の低下は、マイクロアレイアッセイで生じるオンターゲット読み出しの割合において見られ、二次捕捉が抑制または回避されない場合、捕捉される非標的核酸の量が増加し、標的核酸が減少する。要約すると、本発明は、マイクロアレイアッセイにおいて二次捕捉を処理するための方法、システムおよび組成物である。本発明の特定の説明的態様を以下に記載する。本発明はこれらの態様に限定されない。

本発明のある態様は、ゲノム試料とプローブまたはアンプリコン由来のプローブを固相支持体上または溶液中でハイブリダイズさせることにより、例えばゲノム試料から、標的核酸配列を捕捉するための固定された核酸プローブを含む。ハイブリダイゼーションが固相支持体または基板上で起こる態様において、本発明は、使用される固相支持体に限定されないことが企図される。固相支持体または基板としては、限定されないが、スライド、チップ、ビーズ、チューブ、カラム、ウェル、プレート等が挙げられる。

本明細書に記載されるように、ハイブリダイゼーション反応は、試料を、非標的配列プローブもしくは標的配列プローブまたはその両方のいずれかが固定される1つ以上の支持体に適用する工程を含む。一態様において、試料が適用されて、第一の支持体上に固定された非標的配列にハイブリダイズし、該試料が除去されて（例えば除去される試料から非標的配列が枯渇される）、第二の支持体上に固定された標的配列プローブにハイブリダイズする2段階シナリオが提供される。好ましくは、ハイブリダイズした標的配列は、その後非選択的に溶出され、それにより試料から非標的配列が枯渇され、二次捕捉ブロッカーDNAを使用することなく標的核酸配列が富化される。

別の態様において、試料が適用され、標的配列プローブと標的配列プローブの両方の別々集団が配置された1つの支持体にハイブリダイズし、非標的および標的の核酸配列の両方のハイブリダイゼーションが同時に起こる、1段階シナリオが提供される。ハイブリダイズした標的配列は、その後別々の位置から非選択的に溶出され、それにより試料から非標的配列が枯渇され、二次捕捉ブロッカーDNAを使用することなく、同時に標的核酸配列が富化される。好ましい態様において、支持体に固定される非標的配列プローブの数または量は、ハイブリダイゼーションのための試料中に見られる非標的配列の数または量と同じであるかそれより多い。

いくつかの態様において、本発明により溶液ベース形式の標的配列の富化および非標的配列（例えば、繰り返し配列）の枯渇が提供される。好ましい一態様において、以下：
a) 溶液中で非標的核酸配列に相補的な配列を含む第一の組のハイブリダイゼーションプローブを作製する工程；
b) マイクロアレイ上で標的核酸配列に相補的な配列を含む第二の組のハイブリダイゼーションプローブを作製する工程；
c) 第一の組のプローブと試料を合わせて、第一の組のプローブを溶液中で非標的核酸にハイブリダイズさせる工程；
d) ハイブリダイズした第一の組プローブを試料から除去して、標的核酸配列を含む第一の富化溶液を形成する工程；
e) マイクロアレイ上で第二の組のプローブと第一の富化溶液を合わせて、第二の組のプローブを標的核酸にハイブリダイズさせる工程；
f) ハイブリダイズした第二の組のプローブを取り出す工程；および
g) ハイブリダイズした第二の組のプローブから標的配列を溶出して、標的核酸配列を含む第二の富化溶液を形成する工程
を含む方法による溶液ハイブリダイゼーションには、2段階シナリオが適用される。

上述の2段階液相方法の別の変形例において、第一および第二の組のハイブリダイゼーションプローブは、工程a)およびb)において溶液中に作製され、工程e)はマイクロアレイよりもむしろ溶液中で行なわれる。

2段階液相方法の最後に、標的核酸配列を含む富化溶液を、DNAまたはRNA配列決定、比較ゲノムハイブリダイゼーション(CGH)、およびDNAメチル化試験などの下流の適用のために用意する。2段階液相方法により除去され得る非標的配列の非限定的な例としては、ゲノムDNAの繰り返し配列（例えば、Alu、THE-1、LINE-1リピートなど）、メッセンジャーRNA（mRNA）中の高アバンダンス転写産物または高アバンダンス転写産物由来の相補的DNA（cDNA）、およびリボソームRNA（rRNA）の配列が挙げられる。非標的配列の除去により、稀な転写産物および調節RNAなどの標的配列の検出が向上する。これらの豊富な転写産物を除去することにより、配列決定技術による稀な転写産物の検出のための有効感度が増加し、費用が低下する。稀な転写産物の検出のためのこの利点は、2段階枯渇後の特異的な稀な転写産物の陽性選択、または豊富な転写産物の1段階枯渇の直後の残りの分子集団の配列決定のいずれかを通じて得ることができる。

上述の2段階液相方法において、特に好ましい態様は、工程a)において、プローブが固定されたマイクロアレイからハイブリダイゼーションのためのプローブを作製することである。これは、固定されたプローブ上でポリメラーゼ連鎖反応を行ない、それらを溶液中に作製することで達成される。溶液中で、ハイブリダイゼーションプローブはさらに増幅されて、3’-プライマーより過剰の5’-ビオチニル化プライマーを用いた非対称ポリメラーゼ連鎖反応により標識される。試料が溶液中にあるハイブリダイゼーション後、ストレプトアビジン固相を使用して、ビオチン標識プローブをハイブリダイズしなかった核酸配列から分離する。ハイブリダイズした標的配列は、最終的にストレプトアビジン固相上のビオチン標識プローブから溶出される。

本発明のさらなる態様は、例えばゲノム試料から、該試料を、固相上または溶液中でプローブまたはアンプリコン由来のプローブにハイブリダイズさせることにより標的核酸配列を捕捉するための固定核酸プローブを含み、標的核酸には、断片化核酸試料の5’および3’末端の一方または両方にアダプターリンカーが付加されており、アダプターリンカーは、ライゲーション媒介ポリメラーゼ連鎖反応（LM-PCR）法および配列決定適用に有用である。好ましくは、捕捉された標的核酸は、洗浄され、標的配列ハイブリダイゼーションプローブから非選択的に溶出除去される。

本明細書においては説明目的でゲノム試料が使用されているが、本発明が、起源に関係なく任意の核酸標的と組み合わせて非標的配列捕捉の枯渇を提供する場合、他の非ゲノム試料が同じ手順に供され得ることは理解されよう。本発明により提供される標的富化の効率の増加は、研究者達に、2〜3例を挙げると癌（Durkin et al., 2008, Proc. Natl. Acad. Sci. 105:246-251; Natrajan et al., 2007, Genes, Chr. And Cancer 46:607-615; Kim et al., 2006, Cell 125:1269-1281; Stallings et al., 2006 Can. Res. 66:3673-3680）、遺伝的障害（Balciuniene et al., Am. J. Hum. Genet. In press）、精神疾患（Walsh et al., 2008, Science 320:539-543; Roohi et al., 2008, J. Med. Genet. Epub 18 March 2008; Sharp et al., 2008, Nat. Genet. 40:322-328; Kumar et al., 2008, Hum. Mol. Genet. 17:628-638）ならびに進化および基礎研究（Lee et al., 2008, Hum. Mol. Gen. 17:1127-1136; Jones et al., 2007, BMC Genomics 8:402; Egan et al., 2007, Nat. Genet. 39:1384-1389; Levy et al., 2007, PLoS Biol. 5:e254; Ballif et al., 2007, Nat. Genet. 39 :1071-1073; Scherer et al., 2007, Nat. Genet. S7-S15; Feuk et al., 2006, Nat. Rev. Genet. 7:85-97）などの疾患および疾患状態に関する研究および治療における使用のための優れたツールをもたらす。

本発明は、複数の核酸分子を単離し、その遺伝的複雑さ低減する方法を提供し、該方法は、前記集団の断片化された変性核酸分子を、固相支持体に結合された同じもしくは複数の異なるオリゴヌクレオチドプローブに、該プローブに特異的にハイブリダイズする核酸分子を捕捉するためのハイブリダイズ条件下で曝露する工程、または前記集団の断片化された変性核酸分子を、同じもしくは複数の異なるオリゴヌクレオチドプローブに、ハイブリダイズ条件下で曝露し、その後、前記プローブに特異的に結合する核酸分子を捕捉するためにハイブリダイズした分子の複合体を固相支持体に結合させる工程、ここで、両方の場合において、前記断片化された変性核酸分子は、約100〜約1000ヌクレオチド残基、好ましくは約250〜約800ヌクレオチド残基、最も好ましくは約400〜約600ヌクレオチド残基の平均サイズを有する、結合しなかった核酸および非特異的にハイブリダイズした核酸を、捕捉された分子から分離する工程、捕捉された分子を非選択的に溶出する工程、ならびに任意に、溶出した捕捉された分子を用いて少なくともさらに1サイクル前述のプロセスを繰り返す工程、および/または富化された標的核酸を配列決定する工程を含む。

いくつかの態様において、標的核酸分子は、動物、植物または微生物から選択される。核の限られた試料だけが利用可能な場合、本発明の方法を実施する前に、例えば全ゲノム増幅により核酸を増幅してもよい。例えば、法医学目的には（例えば、遺伝子同定目的の法医学において）、本発明の方法（1つ以上）を実施するために前増幅が必要であり得る。

いくつかの態様において、標的核酸分子の集団は、ゲノムDNA分子の集団である。かかる態様において、プローブは、例えば1つまたは複数のエキソン、イントロンもしくは調節配列を複数の遺伝子座から規定する1つまたは複数の配列、あるいは少なくとも100kb、好ましくは少なくとも1Mbまたは前記サイズの少なくとも1つを有する少なくとも1つの単一遺伝子座の完全配列を規定する複数のプローブ、一ヌクレオチド多形（SNP）を規定する1つまたは複数のプローブ、あるいはアレイ、例えば少なくとも1つの完全染色体の完全配列を捕捉するように設計されたタイリングアレイを規定する複数のプローブから選択される。

いくつかの態様において、本発明は、断片化された核酸試料をハイブリダイゼーションのためのプローブに曝露する前または後に、アダプター分子を、核酸分子の一端もしくは両端、好ましくは両端に連結する工程を含む。いくつかの態様において、本発明の方法はさらに、少なくとも1つのプライマーを用いた標的核酸分子の増幅を含み、前記プライマーは、前記アダプター分子（1つ以上）の配列に特異的にハイブリダイズする配列を含む。いくつかの態様において、アダプター分子は自己相補的であるか、非相補的であるか、またはY-アダプター（例えば、非相補的末端、および断片化された核酸試料とアニーリングする相補的末端を含む、一度アニーリングしたオリゴヌクレオチド）である。いくつかの態様において、増幅された核酸配列は配列決定され、再配列決定アレイまたはSNPコーリングアレイにハイブリダイズされ得、該配列または遺伝子型がさらに解析され得る。

いくつかの態様において、本発明は、エキソンまたはバリアント好ましくはSNP部位などのゲノム試料中の標的核酸配列の複雑さ低減方法を提供する。これは、複雑なゲノム試料中に含まれる相補的な標的核酸配列を捕捉するためのゲノムの領域に特異的な1つ以上のゲノムプローブを合成することにより達成され得る。該富化方法は、特定のゲノム中の繰り返し配列を標的化するためのハイブリダイゼーションプローブを包含することを含む。

いくつかの態様において、本発明はさらに、特に配列決定反応を行なうことにより、富化および溶出された標的分子の核酸配列を決定する工程を含む。

いくつかの態様において、本発明は、本発明の方法を実施するための組成物および試薬を含むキットに関する。かかるキットは、限定されないが、任意の特定のマイクロアレイ適用（例えば、比較ゲノムハイブリダイゼーション、発現、クロマチン免疫沈降、比較ゲノム配列決定など）のための二本鎖アダプター分子、複数のハイブリダイゼーションプローブを含む1つ以上の固相支持体を含み得、前記プローブは、1つ以上の固相支持体上のゲノム中に見られる非標的配列および標的配列の両方に相当する配列を含む。いくつかの態様において、キットは、2種類の異なる二本鎖アダプター分子を含む。キットはさらに、DNAポリメラーゼ、T4ポリヌクレオチドキナーゼ、T4 DNAリガーゼ、ハイブリダイゼーション溶液（1つ以上）、洗浄溶液（1つ以上）および/または溶出溶液（1つ以上）から選択される少なくとも1つ以上の他の成分を含み得る。

定義
本明細書で使用する場合、用語「試料」は、その最も広い意味で使用される。1つの意味において、該用語は、任意の供給源、優先的には生物学的供給源、例えば、真核生物または原核生物いずれかから入手された被検物質または培養物を含むことを意味する。生物学的試料は、動物（ヒトなど）から入手され得、液体、固体および組織を包含する。生物学的試料としては、血液産物、例えば血漿、血清などが挙げられる。非ヒト動物由来の試料としては、限定されないが、げっ歯類、非ヒト霊長類、ヒツジ、ウシ、反芻動物、ウサギ、ブタ、ヤギ、ウマ、イヌ、ネコ、トリなどの脊椎動物由来の生物学的試料が挙げられる。さらに、本明細書で使用される場合、試料としては、植物由来の生物学的試料、例えば植物界（例えば、単子葉植物、双子葉植物等）に見られる任意の生物由来の試料が挙げられる。また、試料は、真菌、藻類、細菌等由来であり得る。本発明は試料の起源に限定されないことが企図される。本明細書で使用する場合、試料は典型的に、任意の供給源由来の核酸（例えば、DNA、RNA、cDNA、mRNA、tRNA、miRNA、rRNAなど）を含む「核酸の試料」または「核酸試料」または「標的核酸試料」または「標的試料」である。このように、本発明の方法およびシステムに使用される核酸試料は、真核生物または原核生物いずれかの任意の生物由来の核酸試料である。

本発明の目的で、「標的」または「標的配列」は、研究、単離、増幅または他のプロセスのための目的の特定の核酸配列を意味し、一本鎖配列、二本鎖配列またはそれらに相補的な配列のいずれかを含むように規定される。本発明の目的について、「非標的」または「非標的配列」は、これらの目的には関連しない核酸配列を意味し、一本鎖配列、二本鎖配列またはそれらに相補的な配列のいずれかを含むように規定される。

先に選択されたプローブは、標的または非標的核酸配列の範囲を決定する。従って、「標的」は他の核酸配列からえり分けられると思われる。「セグメント」は、核酸配列の「断片」または「部分」である場合、標的配列中の核酸の領域であると規定される。このように、「オンターゲット読み出し」は、研究者によって配列決定され、好ましい配列であると見出された標的核酸のパーセントまたは数である。「繰り返し核酸配列」は、天然に繰り返され、二次捕捉に寄与することにより標的核酸配列の捕捉の効率に影響することが知られているゲノム中の配列である。

本明細書で使用する場合、用語「単離する」は、「核酸を単離する」など核酸に関連して使用される場合、通常その天然の供給源に関連する少なくとも1つの成分または夾雑物から同定および分離される核酸配列のことをいう。単離された核酸は、天然に見られるものとは異なる形態または設定である。対照的に、非単離核酸は、天然に存在す状態に見られるDNAおよびRNAなどの核酸である。単離された核酸、オリゴヌクレオチド、またはポリヌクレオチドは、一本鎖または二本鎖の形態で存在し得る。

本明細書で使用する場合、用語「オリゴヌクレオチド」は、短いポリヌクレオチド鎖、好ましくは一本鎖のことをいう。典型的に、オリゴヌクレオチドは、200残基長未満（例えば15〜100）であるが、本明細書で使用する場合、該用語はまた、より長いポリヌクレオチド鎖を包含することも意図される。しばしば、オリゴヌクレオチドは、その長さにより言及される。例えば、24残基オリゴヌクレオチドは、「24量体」と称される。オリゴヌクレオチドは、自己ハイブリダイズまたは他のポリヌクレオチドとハイブリダイズすることにより、二次構造または三次構造を形成し得る。かかる構造としては、限定されないが、二重鎖、ヘアピン、十字型、屈曲および三重鎖が挙げられ得る。

本明細書で使用する場合、用語「ハイブリダイゼーション」は、相補的な核酸の対形成のことをいうために使用される。ハイブリダイゼーションおよびハイブリダイゼーションの強度（例えば、核酸間の結合の強度）は、核酸間の相補性の程度、関連する条件のストリンジェンシー、形成されるハイブリッドの融点（T_m）、および核酸のG:C比などの要因により影響を受ける。本発明は特定のハイブリダイゼーション条件の設定に限定されないが、好ましくはストリンジェントなハイブリダイゼーション条件が使用される。ストリンジェントなハイブリダイゼーション条件は、配列依存的で、変動性環境パラメーター（塩濃度、有機物の存在等）により異なる。一般的に、「ストリンジェント」な条件は、所定のイオン強度およびpHで特定の核酸配列についてのT_mより約5O℃〜約20℃低く選択される。好ましくは、ストリンジェントな条件は、相補的な核酸に結合する特定の核酸についての融点よりも約5℃〜10℃低い。T_mは、50％の核酸（例えば標的核酸）が完全に一致したプローブとハイブリダイズする（所定のイオン強度およびpHでの）温度である。

「ストリンジェントな条件」または「高いストリンジェンシー条件」は、例えば、50%ホルムアミド、5xSSC（0.75M NaCl、0.075Mクエン酸ナトリウム）、50mMリン酸ナトリウム（pH6.8）、0.1%ピロリン酸ナトリウム、5x Denhardt’s溶液、超音波処理サケ精子DNA（50mg/ml）、0.1% SDSおよび10%硫酸デキストラン中42℃でのハイブリダイゼーション、0.2% SSC（塩化ナトリウム/クエン酸ナトリウム）中42℃での洗浄および55℃で50%ホルムアミド、その後EDTAを含む0.1xSSCで55℃での洗浄であり得る。例示すると、限定されないが、35%ホルムアミド、5xSSCおよび0.1% (w/v)ドデシル硫酸ナトリウム（SDS）を含むバッファは45℃で16〜72時間の適度な非ストリンジェント条件でのハイブリダイズに適することが企図される。

さらに、ホルムアミド濃度は、プローブの長さおよび所望のストリンジェンシーのレベルに応じて、20〜45%の範囲で適切に調製され得るように想定される。ハイブリダイゼーション条件のさらなる例は、Molecular Cloning: A Laboratory Manual, Eds. Sambrook et al., Cold Spring Harbour Press（その全体において参照により本明細書に援用される）などのいくつかの情報源に提供される。

同様に、「ストリンジェント」な洗浄条件は、標的とプローブまたは本発明において、プローブ由来のアンプリコンとのハイブリダイゼーションについて経験的に決定される。アンプリコン/標的は、ハイブリダイズされ（例えばストリンジェントなハイブリダイゼーション条件下）、次いで連続的に濃度を低下した塩もしくは高濃度の界面活性剤を含むバッファ、または高温で、特異的対非特異的ハイブリダイゼーションについての信号対雑音比が特異的ハイブリダイゼーションの検出を容易にするように充分に高くなるまで洗浄される。ストリンジェントな温度条件には、通常、約30℃より高く、より一般的に約37℃より高く、場合によっては約45℃より高い温度が含まれる。ストリンジェントな塩条件は、通常約1000mM未満、通常約500mM未満、より一般的には約150mM未満である（Wetmur et al., 1966, J. Mol. Biol., 31 :349-370; Wetmur, 1991, Critical Reviews in Biochemistry and Molecular Biology, 26:227-259、その全体において参照により本明細書に援用される）。

本明細書で使用する場合、用語「プライマー」は、精製制限消化物の場合のように天然に存在するかまたは合成により生成されるかいずれにせよ、核酸に相補的なプライマー伸長産物の合成が誘導される条件（例えば、ヌクレオチドおよびDNAポリメラーゼなどの誘導剤の存在下で、適切な温度およびpH）におかれた場合、合成の開始点として機能し得るオリゴヌクレオチドのことをいう。好ましくは、プライマーは増幅の最大効率のためには一本鎖である。好ましくは、プライマーは、オリゴデオキシリボヌクレオチドである。プライマーは、誘導剤の存在下で伸長産物の合成を誘導するのに充分な長さである必要がある。プライマーは、ストレプトアビジン支持体上でのその後の捕捉のためにビオチン、または抗ハプテン抗体支持体上でのその後の捕捉のためにハプテン（例えばジゴキシゲニン）などの特異的結合ペアの1つのメンバーで標識されてもよい。プライマーの正確な長さは、温度、プライマーの供給源および方法の使用などの多くの因子に依存する。

本明細書で使用する場合、用語「プローブ」は、精製制限消化物の場合のように天然に存在するものであるか、または合成、組み換えもしくはPCR増幅により生成されるかにかかわらず、目的の別のオリゴヌクレオチド、例えば標的核酸配列の少なくとも一部にハイブリダイズし得るオリゴヌクレオチド（例えばヌクレオチドの配列）のことをいう。プローブは一本鎖または二本鎖であり得る。プローブは、特定の遺伝子配列の検出、同定および単離に有用である。本明細書で使用する場合、プローブは、その後の標的核酸へのハイブリダイゼーションのために、MASを使用したインサイチュ合成または当業者に公知の任意の他の方法のいずれかによりマイクロアレイ基板に固定され得る。代替的に、プローブは、液相の態様に関して、ハイブリダイゼーション培地に溶解されていてもよい。

本明細書で使用する場合、用語「アダプター(“adapter”または“adaptor”)」は、試料DNA分子の一端または両端に付加されている規定（または公知）の配列の二本鎖オリゴヌクレオチドである。試料DNA分子は、その付加前に断片化されていてもいなくてもよい。アダプターが試料DNA分子の両端に付加される場合、アダプターは、同じ（すなわち両端で相同な配列）でも異なっても（すなわちそれぞれの末端で非相同配列）よい。ライゲーション媒介ポリメラーゼ連鎖反応（LM-PCR）の目的で、用語「アダプター」および「リンカー」は、互換的に使用される。アダプターの二つの鎖は、自己相補的であるか、非相補的であるかまたは部分相補的（例えば、Y型）である。典型的に、アダプターは、12ヌクレオチド残基〜100ヌクレオチド残基、好ましくは18ヌクレオチド残基〜10ヌクレオチド残基、最も好ましくは20〜44ヌクレオチド残基の範囲である。

値の範囲が示される場合、それぞれの文中の値は、文中に明確にそれ以外が指定されなければ下限の単位の小数点第一位まで、その範囲の上限と下限の間の中間の値も具体的に開示されていると理解されたい。記載された範囲の任意の記載された値または中間の値と、該記載された範囲の任意の他の記載された値または中間の値の間のより狭い各範囲が本発明に本発明に包含される。これらのより狭い範囲の上限および下限は独立して、該範囲に含まれても含まれなくてもよく、どちらかの限界値もしくは両方の限界値が該より狭い範囲に含まれていようがまたは両方の限界値が該より狭い範囲に含まれていまいが、それぞれの範囲も本発明に包含されるが、記載された範囲において任意の具体的な限界値が除かれることがある。記載された範囲が一方または両方の限界値を含む場合、上限と下限に含まれるこれらのいずれかまたは両方を除く範囲も本発明に含まれる。

図1A〜Bは、市販のマイクロアレイ上の2段階標的配列富化方法および配列決定のためのアダプターを例示する。工程1において、DNA試料を断片化して、3’および5’末端にアダプターが結合した454 Life Sciences配列決定ライブラリーに変換する。次いで、工程2においてライブラリーをPCRにより増幅する。次いで、工程3において、アダプター連結DNA試料を繰り返しDNAエレメントに相当するフォワードおよびリバースプローブからなる第一のマイクロアレイにハイブリダイズさせる。第一マイクロアレイをハイブリダイズした繰り返しDNAと共に溶液から除去し、繰り返しDNAが枯渇した試料を得る（工程4）。次に、標的領域を同定して、これらの目的の領域を捕捉するように第二マイクロアレイを設計する。図1A〜Bは、市販のマイクロアレイ上の2段階標的配列富化方法および配列決定のためのアダプターを例示する。工程5において、ライブラリーを3日間まで第2マイクロアレイにハイブリダイズさせる。工程6において第2マイクロアレイを洗浄して、次いで工程7において標的化したDNAをマイクロアレイから非選択的に溶出する。溶出した標的DNAを工程8において増幅して、工程9において配列決定する。図2は、一般的な2段階標的配列富化方法のための本発明の方法の一態様を例示する。A) 繰り返しプローブ配列を含むマイクロアレイを、ガスケットスライド（B）を使用して、繰り返しおよび標的ゲノム配列の両方を含む断片化リンカー付加ゲノムライブラリーにハイブリダイズさせ、ハイブリダイゼーションチャンバーを作製する。C) 第1ハイブリダイゼーション由来の溶液を、標的プローブ配列を含む第2マイクロアレイに、さらなるガスケットスライド下でハイブリダイズさせ、ハイブリダイゼーションチャンバー（D）を作製する。富化された標的ゲノム配列を溶出して、標的配列について富化され、望ましくない繰り返し配列が枯渇されたゲノムライブラリーを提供する。図3は、1段階標的配列富化方法のための本発明の別の態様を例示する。A) 繰り返しプローブ配列および標的プローブ配列の両方を含むマイクロアレイを、マイクロアレイ上に見出し、断片化されたリンカー付加ゲノムライブラリーを両方に同時に適用し、混和装置（B）の適用により作製されたハイブリダイゼーションチャンバー中でハイブリダイゼーションさせた。C) 富化された標的ゲノム配列を標的プローブアレイのみから溶出し、それにより標的配列について富化され、望ましくない繰り返し配列が枯渇されたゲノムライブラリーを提供する。図4Aおよび4Bは、NimbleGenマイクロアレイ基板上の繰り返しサブトラクションに使用されるカバーを例示する。平坦方向の第一のカバーおよび側面方向の第二のカバーの両方を示す。側面方向において、カバーを含む材料の層を示す。図4Aは、ハイブリダイゼーションチャンバーを、それぞれ2つのポート、合計6つのポートで3つの均等な区画に分割するHX3カバーの寸法を示す。図4Bは、2つのポートを有する1つの区画中のハイブリダイゼーションを包含するHX1カバーの寸法を示す。図5は、溶液配列捕捉プローブプールの作製を例示する。アレイから（インサイチュで）、30サイクルのPCRによりプローブを増幅することによりプローブプールを作製する。非対称PCRによりDNAの一方を選択し、複数コピーの一本鎖DNAを作製する；標的DNAのフォワード鎖およびリバース鎖についてこれを行なう。繰り返しサブトラクションに使用する前にプローブを精製して定量する（特許公開公報WO200905039）。図6は、液相繰り返し捕捉実験を例示する。DNA試料にフォワードおよびリバースプローブを添加し、繰り返しDNAエレメントにハイブリダイズさせる。繰り返しDNAと共に溶液からプローブを除去し、繰り返しが枯渇した試料を生じ、配列捕捉直接配列決定、比較ゲノムハイブリダイゼーション（CGH）およびメチル化試験などの下流適用の準備をする。図7は、プローブ設計のためのフィンガープリント連続領域（FPC ctgl38）中のバクテリア人工染色体（BAC）配列調製のワークフローを例示する。

発明の詳細な説明
マイクロアレイアッセイにおける二次捕捉は、マイクロアレイ標的プローブ捕捉設計中に示されない配列（例えば、Alu、THE-1、LINE-1繰り返しなど）のハイブリダイゼーション系相互作用を含む。例えば、二次捕捉の1つの型は、ハイブリダイズしない試料DNAとプローブにハイブリダイズする標的DNAの間に見られる（「配列媒介性二次捕捉」）。例えば、二次捕捉において、プローブはその標的に特異的にハイブリダイズするが、標的は、非cisコピーにもハイブリダイズするいくつかの非プローブ配列（例えばAlu、THE-1、LINE-1繰り返しなど）を有する。二次捕捉の結果の一つは、標的試料中の繰り返しエレメント（例えば非標的または繰り返し配列）の特異的サブセットの富化であり、標的領域の不充分な全体の富化が引き起こされる。実際のところ、マイクロアレイ上での捕捉により富化される所望の標的配列は、局所的な配列繰り返しの望ましくない型の共富化に圧倒される。

二次捕捉をブロックする競合的、または抑制性のハイブリダイゼーションは、複合DNAを使用した場合に入手され得る潜在的に強力な繰り返しDNAシグナルの捕捉をブロックすることを含む。例えば、DNAは、溶液中、好ましくは高度な繰り返しDNA配列が富化された画分の全ゲノムDNAの存在下で、変性され、再度アニーリングされる。いずれの場合においても、（アレイはほぼ常に、繰り返しを可能な限り少量にして産生されるので）標的DNA中の高度な繰り返しDNAは、プローブ中の繰り返しエレメントよりも過剰に存在する。結果的に、かかる配列は、容易に標的中の繰り返し配列の相補鎖と結合するので、大過剰の繰り返しの同じ型の外因性コピーが添加され、それにより繰り返しの標的配列へのハイブリダイゼーションが効果的にブロッキングされる。このように、ブロッキング剤は、典型的にハイブリダイゼーション反応中に使用される。

最近、例えば植物種の標的配列の富化は、マイクロアレイアッセイにおけるハイブリダイゼーション反応中に種特異的なブロッキングDNA（例えばC₀t-1）を含ませた場合に、より効果的になることが示された。これは、二次捕捉の抑制のためであると考えられている。しかしながら、充分な量の植物由来、例えばトウモロコシ由来C₀t-1 DNAは、時間および供給源に関して課題を有する。

そのため、富化プロセスおよび方法におけるブロッカーの使用を回避するための代替的な方法が研究された。かかる方法において、MAGI Cereal Repeat Databaseバージョン3.1由来の豊富でない統計的に派生した繰り返し（SDR）およびTIGR Maize Repeat Database由来の配列が、全ての繰り返し（トウモロコシ）を設計するために使用された。該設計は、NCBIのMegablastにより検証されて、アレイの構築に使用される繰り返し配列のデータベースに対してトウモロコシB73からの454 Life Sciences由来の配列読み出しの正確性が比較された。該比較には、全部で271,000を超える読み出し（＞102Mbp）が使用された。全配列の75%は、トウモロコシ繰り返し配列に対して90%以上の配列同一性を有することが解析により示された。これは確立されたトウモロコシゲノム中の繰り返し負荷とほぼ一致しており、コンピューターマスキングされたインプット読み出しのパーセントとほぼ同じである。そのため、全ての繰り返し設計は、実施例のシステムと同様にトウモロコシゲノムの繰り返し含有量を正確に反映していると考えられる。結果的に、ハイブリダイゼーション反応は、標的核酸配列の標的配列プローブへのハイブリダイゼーションの前または後にトウモロコシゲノムの繰り返し領域を枯渇させるための繰り返し設計を利用するように設計された。

さらに、本明細書に記載のゲノムから繰り返し配列を枯渇させるための方法は、マイクロアレイスライドなどの固相または溶液中の任意のハイブリダイゼーションアッセイに利用できると考えられる。

ゲノム試料中の標的植物配列を捕捉するための既存のプロトコルは、例えば100μgのC_ot-1 DNAと共に植物ゲノムDNAを乾燥させ、次いでハイブリダイゼーションバッファで再構築し、ハイブリダイゼーションアッセイで試料をハイブリダイズさせることを研究者に求めている。現在の例示的プロトコルでは、驚くべきことにブロッカーの添加が必要なくなり、さらに選択的標的配列捕捉が維持される。

本明細書に記載されるように、本発明のシステムおよび組成物は、ハイブリダイゼーションアッセイ中の非標的配列または繰り返し配列の枯渇を提供し、それにより、標的ゲノム中の標的配列の捕捉を増加させる。本発明の特定の例示的態様を以下に記載する。本発明はこれらの態様に限定されるものではない。

本発明の一態様において、例えばマスクレスアレイ合成を使用して、2種類のマイクロアレイが設計され、一方のアレイは、天然で植物ゲノム中の繰り返し配列に結合するような繰り返しであるプローブ配列を含み、他方のアレイは、標的配列にハイブリダイズするためのプローブ配列を含むように設計される（図2）。

植物ゲノム配列のライブラリーは、GS FLX Titaniumライブラリー調製キット（454 Life Sciences, Branford, CT）を使用して作製されるものなどの、断片化されたゲノムDNAの一端または両端にアダプターまたはリンカー分子を結合させることにより作製される。例示的なプロトコルにおいて、以下の成分：65μlハイブリダイゼーション成分A、26.6μlホルムアミド、2.0μl Tween-20、1μlの増強オリゴAおよびB（454 Titaniumキット）、454 Titanium Library prepキットを使用して作製された500ngのリンカー付加DNAならびに水を最終容量125μlまでを、95℃で10分間、1.5mlチューブに添加する。

ガスケットを施したスライド（図2B）（例えばSciGene Corporation, Sunnyvale, CAにより提供される）またはハイブリダイゼーションチャンバー（例えばGrace Bio-Labs Corporation, Bend, ORにより提供される）（繰り返しサブトラクション図）をMai Tai(登録商標)ハイブリダイゼーションシステムミキサーアセンブリ(SciGene Corporation)上に設置する。DNA混合物をガスケットスライドにピペットで移す。繰り返し配列プローブを含むマイクロアレイ（図2A）を、プローブが加熱した試料と接触するように、ガスケットスライド上の逆さまにして置く。Mai Tai(登録商標)ミキサーアセンブリの先端をねじ込んできつくしめ、42℃で4日間、ミックス設定15でのハイブリダイゼーションのためにSciGeneインキュベーターに設置する。代替的に、ハイブリダイゼーションチャンバーを繰り返しアレイに取り付けて、試料を該チャンバーに供する。次いで、これをMai Tai(登録商標)ミキサーに設置し、42℃で4日間のミックス設定15でのハイブリダイゼーションのためにSciGeneインキュベーター中に置く。ハイブリダイゼーション後、ミキサーアセンブリを分離して、マイクロアレイスライドをガスケットアレイスライドから取り外し、スライドからハイブリダイゼーション混合物を回収する。繰り返しプローブマイクロアレイでの最初のハイブリダイゼーションの間に、リンカー付加ライブラリー中に見られるように繰り返し配列は、溶液標的ゲノム配列が残っているマイクロアレイにハイブリダイズすると考えられる。本明細書に記載されるシステムは、例示的な目的のためだけであり、ハイブリダイゼーションチャンバーの作製およびその後のハイブリダイゼーション後の試料の回収を可能にする任意のシステムが、本発明の使用に同等に利用可能である。

2回目のハイブリダイゼーションを行なうが、繰り返しプローブマイクロアレイを使用する代わりに標的ゲノム配列に対するプローブを有するマイクロアレイを使用する（図2C）。例えば、繰り返しアレイの除去後にガスケットスライドから回収される溶液を、95℃で5分間加熱して、標的プローブマイクロアレイが設置されたガスケットスライド上に置く（図2D）。第2のハイブリダイゼーション反応は、ゲノムライブラリーに見られるような標的ゲノム配列にハイブリダイズする標的プローブ配列を含む。標的ゲノムリンカー付加配列は、その後水酸化ナトリウムにより標的マイクロアレイから溶出され、それにより望ましくない非標的繰り返しゲノム配列の二次捕捉をブロックするための最初のブロッカーDNAを使用することなく配列決定のための富化試料が提供される。

いくつかの態様において、繰り返し配列が枯渇された1回目のハイブリダイゼーション由来のハイブリダイゼーション混合物は、例えばQiagen MinEluteカラムに適用され、結合したDNAを水で溶出することにより、標的ゲノム配列とハイブリダイゼーション反応成分が分離される。生成された標的ゲノム配列を、標的富化のための配列捕捉ワークフローに適用し、その後例えばNimbleGenアレイユーザーズガイド配列捕捉アレイ送達（Roche NimbleGen, Inc., Madison, WI）に見られるような確立されたプロトコルを行ない、標的ゲノム配列を捕捉し、記載されるように溶出する。いくつかの態様において、1回目のハイブリダイゼーション後で2回目のハイブリダイゼーション前に、溶液中に見られる標的配列を（例えばLM-PCRにより）増幅し、その後標的配列プローブでハイブリダイゼーションを行なう。使用される標的ハイブリダイゼーション法に関わらず、捕捉された標的配列は、例えば特異的にハイブリダイズした標的配列だけでなく特異的に結合した核酸も除去する400μlの100mM NaOHを用いて標的捕捉アレイから非選択的に溶出される。次いで、例えばQiagen MinEuteカラムを使用して、溶出物を反応成分から分離する。富化および溶出された標的ゲノム領域を、例えば454 GS FLX Titanium system (454 Corporation)を使用した配列決定のためのその後の適用に供する。

2アレイスライドワークフローに対する代替法は1アレイスライドワークフローである。例えば、図3に例示されるような1つのスライド上に3つの別々のアレイを含むRoche NimbleGen. Inc.により提供されたHX3スライドに見られるように、マイクロアレイを設計する。スライドの末端上のアレイの1つまたは両方の配置は繰り返しプローブ配列を含むが、中央のアレイは標的プローブ配列を含む。例えばBioMicro Corporationにより提供されるようなカバースリップを、全アレイ上に配置し、それによりハイブリダイゼーションチャンバー作製して、上述のようにハイブリダイゼーション混合物をピペットでハイブリダイゼーションチャンバーに移す。例えばNimbleGenアレイユーザーズガイド配列捕捉アレイ送達に記載されるように、全部で2つまたは3つのアレイ領域間で流体連絡が維持される場合に混合およびハイブリダイゼーションが起こる。Elution Station（Roche NimbleGen, Inc.）に規定されたプロトコルに従い標的配列を溶出し、中央のアレイにハイブリダイズした際に標的配列に結合したものだけがマイクロアレイスライドから非選択的に溶出される。このように、望ましくない繰り返し配列は、アレイ上に結合したままになるが、富化および溶出された標的ゲノム配列は下流の配列決定適用に利用される。

本発明の一態様において、ハイブリダイゼーションプローブは、ゲノム中の繰り返し配列を捕捉し、かつゲノム中の標的配列も同時に捕捉するように設計される。一態様において、マスクレスアレイ合成（または本発明のように支持体上にプローブを合成するための任意の他の方法は、該マイクロアレイ合成方法もしくはプロセスに限定されない）を使用して、2つ以上の別々のアレイ領域を含むマイクロアレイスライドなどの支持体が設計され、該アレイ領域中の支持体上にプローブが合成される。少なくとも1つのアレイ領域は、標的核酸配列にハイブリダイズ可能なハイブリダイゼーションプローブを含むように設計され、少なくとも1つのアレイ領域は、ゲノムの繰り返し核酸配列にハイブリダイズ可能なハイブリダイゼーションプローブを含むように設計される（図3A）。本発明は支持体上のアレイ領域の数に限定されず、実際少なくとも2、少なくとも3、少なくとも4、少なくとも6、少なくとも12個の領域が本発明の方法における使用に構想される。

繰り返し配列および標的配列を含む試料を、典型的に、例えばNimbleGenミキサー装置（例えばHX1ミキサー、Roche NimbleGen, Inc., Madison WI）をマイクロアレイ上に配置して提供されるようなハイブリダイゼーションチャンバーの形成を可能にするカバースリップデバイスの下に添加して、それによりスライドとミキサーの間に囲まれるハイブリダイゼーションチャンバーが作製される（図3B）。所定の時間、例えば少なくとも1日、少なくとも2日、少なくとも3日、少なくとも4日にわたり、プローブと試料核酸の間にハイブリダイゼーションが起こる。ハイブリダイゼーション中に、繰り返し配列は繰り返しプローブ配列に選択的にハイブリダイズし、標的配列は標的プローブ配列に選択的にハイブリダイズすると考えられる。ハイブリダイゼーション後、カバースリップ（例えばミキサー）を除去し、支持体を選択的に、1回以上洗浄してハイブリダイズしなかった配列および/または弱くハイブリダイズした配列を除去する。好ましい態様において、標的プローブ配列にハイブリダイズした標的核酸は、例えばNimbleGen Elution System (Roche NimbleGen, Inc.)を使用して支持体から選択的に溶出され（図3C）ハイブリダイズした繰り返し配列は溶出されない。いくつかの態様において、溶出された配列を、例えば454 GS FLX Titanium system (454 Corporation)を使用して配列決定する。

一態様において、図4に示すようなRoche NimbleGen Inc.から入手可能なHX3アレイまたはHX1アレイにおいて、反復サブトラクション(repeat subtraction)を行なう。これにより、より大きなアレイ形式からの反復サブトラクションが可能になる。

いくつかの態様において、本発明は、DNA分子の一端または両端にアダプター、例えば、ライゲーション媒介性またはLM-PCRアダプターを含む核酸分子を提供する。いくつかの態様において、これらのアダプターは、標的の末端に固定されるため、断片DNAにより、例えば、富化前にゲノムDNAの増幅が可能になり、標的配列の富化は増幅集団より生じる。アダプター結合の例示的な方法の1つは、例えば、富化された標的がGS FLX配列決定装置を用いて、454 Life Sciences（Branford、CT.）の配列解析プロトコルで直接配列され得るライブラリープロトコルを使用することにより、配列決定用ライブラリーを作製することによるものである。しかしながら、本発明は、ライブラリー作製および配列決定に使用される方法に限定されず、本発明の実施例は、本発明の可能な一態様を示しているにすぎない（例えば、当業者には、本発明での使用に等しく適した代替法が認識されよう）。

本発明のいくつかの態様において、変性（例えば、一本鎖）核酸分子、好ましくは、断片化された分子であってもよいゲノム核酸分子を含む試料を、ハイブリダイズ条件下で、マイクロアレイ基材上の複数のオリゴヌクレオチドプローブに曝露する。

本発明のいくつかの態様において、核酸分子、好ましくは断片化された分子であってもよいゲノム核酸分子を含む試料は、該断片DNA の5’ 末端と3’末端の両方にアダプターリンカー配列を含むようにさらに修飾される。アダプター配列は、自己相補的アダプター、非相補的アダプター、またはY型アダプターのいずれかであり得る。アダプター配列は、例えば、断片化された核酸のライゲーション媒介性増幅のため、ならびに配列決定目的のために使用される。アダプター連結断片はLM-PCRによって優先的に増幅され、ハイブリダイズ条件下で、マイクロアレイ基材上の複数のオリゴヌクレオチドプローブに曝露される。

本発明は、実施されるマイクロアレイアッセイの種類に限定されないことが企図され、実際、非標的領域の枯渇が所望される任意のアッセイが、本発明の方法および系の実施の恩恵を受ける。アッセイとしては、限定されないが、複雑さ低減および配列富化、比較ゲノムハイブリダイゼーション、比較ゲノム配列決定、発現、クロマチン免疫沈降-チップ（ChIP-チップ）、後成的などが挙げられる。

本発明のある態様では、標的核酸の捕捉のためのプローブは、種々の方法によって基材上に固定化される。一態様において、プローブは、スライド上に点在され得る（例えば、米国特許第6,375,903号および同第5,143,854号）。好ましい態様において、プローブは、米国特許第6,375,903号、同第7,037,659号、同第7,083,975号、同第7,157,229号に記載のような、スライド上での直接的なオリゴヌクレオチド配列のインサイチュ合成を可能にするマスクレス(maskless)アレイ合成装置（MAS）を使用することにより基材上にインサイチュで合成される。

いくつかの態様において、固相はビーズまたは粒子の集団である。ビーズは、例えば、標的試料をカラムに負荷してカラムを通過させ、プローブ/標的試料のハイブリダイゼーションがカラム内で起こるようにカラム内に充填されていてもよく、その後、遺伝的複雑さの低減および標的捕捉の向上のために標的試料配列の洗浄および溶出を行なう。いくつかの態様において、ハイブリダイゼーション速度論を向上させるため、ハイブリダイゼーションは、水性環境中に多数のプローブを懸濁状態で含む水溶液中で行なう。

本発明のある態様では、本明細書に記載のマイクロアレイ捕捉法における使用のためのハイブリダイゼーションプローブは、マイクロアレイスライド、チップ、マイクロウェル、カラム、チューブ、ビーズまたは粒子などの固相上に印刷または堆積される。基材は、例えば、ガラス、金属、セラミック、ポリマービーズなどであり得る。好ましい態様において、固相はマイクロアレイスライドであり、この場合、プローブは、マスクレスアレイ合成装置を用いてマイクロアレイスライド上で合成される。多数のオリゴヌクレオチドプローブの長さは種々であり、実験設計に依存的であり、かかるプローブが合成される可能性のみによって制限される。好ましい態様において、多数のプローブの集団の平均長さは、約20〜約100ヌクレオチド、好ましくは約40〜約85ヌクレオチド、特に、約45〜約75ヌクレオチドである。本発明のある態様では、ハイブリダイゼーションプローブは、ゲノムの内の少なくとも1つの領域に順序どおりに対応し、例えば、マスクレスアレイ合成（MAS）技術を用いて固相上に平行に提供され得る。

本発明は捕捉のための試料の型に限定されず、実際、使用される任意の試料、例えば、限定されないが、ゲノムDNAまたはRNA試料、cDNAライブラリーまたはmRNAライブラリーが、本発明に等しく適用可能であることが企図される。いくつかの態様において、本明細書で使用される核酸配列は断片化され、前記断片は、約100〜約1000ヌクレオチド残基、好ましくは約250〜約800ヌクレオチド残基、最も好ましくは約400〜約600ヌクレオチド残基の平均サイズを有する。

別の態様において、非標的配列を除去した後、標的配列の単離を行なうための2段階シナリオの第1段階は、図5および6に示すようにして溶液中で行なう。したがって、プローブを溶液中で増幅させるために、第1の固相上の反復配列プローブを、まず、ポリメラーゼ連鎖反応（PCR）に供する（図5）。次いで、ビオチニル化単鎖プローブを得るために、溶液中のプローブを、5’-ビオチニル化プライマーを用いる第2ラウンドの非対称PCRに供する。次いで、ビオチニル化プローブを溶液中で試料にハイブリダイズさせる（図 6）。次いで、最初のハイブリダイゼーション混合物を、ストレプトアビジンコーティング固相に曝露し、ハイブリダイズしたビオチニル化非標的配列を除去する。ここで非標的配列が枯渇された試料は、次いで、固相（例えば、マイクロアレイ）上または溶液中のいずれかでの第2段階の標的配列捕捉の準備ができている。代替的に、枯渇された試料は、直接配列決定、比較ゲノムハイブリダイゼーション（CGH）またはメチル化試験などの他の下流適用に使用され得る。

2段階の液相態様では、当業者には、ビオチンとストレプトアビジンのペアを他の特異的結合パートナー、例えば、固相上の抗ハプテン抗体とペアにしたハプテン標識プローブ（例えば、ジゴキシゲン標識プローブと抗ジゴキシゲニン抗体）で置き換えてもよいことが認識されよう。

本発明のある態様では、標的核酸は、典型的にデオキシリボ核酸またはリボ核酸であり、ある核酸分子型（例えば、DNA、RNAおよびcDNA）を別のものに変換することによりインビトロ合成された生成物、ならびにヌクレオチドアナログを含む合成分子を含む。断片化されたゲノムDNA分子は、特に、天然のゲノム核酸分子よりも短い分子である。当業者は、周知のプロトコルを使用し、化学的、物理的または酵素的断片化または切断によって、より大きな分子から、ランダムまたは非ランダムサイズの分子を作製することができよう。例えば、化学的断片化では、第一鉄金属（例えば、Fe-EDTA）が使用され得、物理的方法としては、超音波処理、流体力学的な力または噴霧（例えば、欧州特許出願EP 0 552 290参照）が挙げられ得、酵素的プロトコルでは、ミクロコッカスヌクレアーゼ（Mnase）またはエキソヌクレアーゼ（Exo1もしくはBal31など）または制限エンドヌクレアーゼなどのヌクレアーゼおよび部分消化反応が使用され得る。

標的核酸配列を含み得る核酸分子の集団は、かなり小さいものから、非常に大きなものまで異なり得る。特に、核酸分子（1種類または複数種）のサイズ（1種類または複数種）は、少なくとも約100塩基、少なくとも約10キロベース（kb）、少なくとも約100kb、少なくとも約1メガベース（Mb）、少なくとも約100Mb、特に、約100塩基〜約10kb、約10kb〜約100Mb、約100kb〜約100Mb、約1Mb〜約100Mbのサイズである。いくつかの態様において、核酸分子はゲノムDNAであるが、他の態様では、核酸分子はcDNAまたはRNA種（例えば、tRNA、mRNA、miRNA）である。RNAまたはcDNAは、リボソームタンパク質 mRNAまたは他の高度に発現されたRNA種などの大量の転写物を枯渇させるために使用され得る。配列決定する前に大量の分子を枯渇させることにより、調節RNAなどの希少な転写物の検出に対する感度が増大し、希少な転写物を配列決定するコストが減少する。

本発明のある態様では、標的核酸配列を含むかもしれないし、含まないかもしれない核酸分子は、動物、植物または微生物から選択され得る。いくつかの態様において、入手可能な核酸分子の試料が限定的である場合、本発明の方法を実施する前に核酸を増幅する（例えば、全ゲノム増幅によって）。例えば、事前の増幅は、法医学目的で（例えば、法医学などにおいて）本発明の態様を行なうために必要であり得る。

いくつかの態様において、核酸分子の集団は、ゲノムDNA分子の集団である。ハイブリダイゼーションプローブおよびその後のアンプリコンは、1つ以上の（例えば、複数の）エキソン、イントロンまたは1つ以上の（例えば、複数の）遺伝子座に由来する調節配列、少なくとも1つの単一の遺伝子座の完全配列（前記座は、少なくとも100kb、好ましくは少なくとも1Mbのサイズ、もしくは上記に特定した少なくとも1つのサイズを有する）、SNPを含むことが知られた部位、または少なくとも1つの完全染色体の完全配列を捕捉するように設計されたアレイ、特に、タイリングアレイを規定する配列を標的化する1つ以上の配列を含み得る。いくつかの態様において、標的配列を捕捉するために、ハイブリダイゼーションプローブ配列が1つだけ使用される。実際、本発明は、標的核酸を捕捉するために使用される異なるプローブ配列の数に限定されない。

標的核酸配列は、任意の供給源由来の核酸を精製形態または未精製形態で含む1つ以上の試料から富化されることが企図される。供給源は、生物のゲノム核酸分子の完全な相補物を含むものである必要はない。好ましくは生物学的供給源由来の試料としては、限定されないが、個々の患者からの単離物、組織試料、または細胞培養物が挙げられる。標的領域は、数メガベースの1つ以上の連続ブロック、または1つ以上の染色体のすべてのエキソンなどの、より小さいいくつかの連続もしくは不連続領域、またはSNPを含むことが知られた部位であり得る。例えば、1つまたは多数の異なる配列（1種類または複数種）、続いてプローブ由来アンプリコンを含む1つ以上のハイブリダイゼーションプローブが、1つ以上の完全染色体、1つ以上の染色体の一部分、1つのエキソン、すべてのエキソン、1つ以上の染色体のすべてのエキソン、1つ以上の遺伝子について選択された1つ以上のエキソン、イントロンおよびエキソン、遺伝子調節領域などを捕捉するように設計されたアレイ（例えば、非タイリングまたはタイリング）を支持し得る。

代替的に、所望の非ユニークまたは捕捉が困難な標的が富化される尤度を増大させるため、プローブを、実際の標的配列と関連する（例えば、同じ断片上だが、離れている）配列に指向させ得、この場合、所望の標的と関連配列の両方を含むゲノム断片が捕捉され、富化される。関連配列は、標的配列に隣接していても離れていてもよいが、当業者には、2つの部分が互いに近いほど、ゲノム断片が両方の部分を含む傾向になることが認識されよう。

本発明のいくつかの態様において、該方法は、変性およびプローブへのハイブリダイゼーション前にアダプターまたはリンカー分子を、断片化された核酸分子の一方または両方の末端にライゲートする工程を含む。本発明のいくつかの態様において、該方法は、さらに、少なくとも1種類のプライマーを用いて前記アダプター修飾核酸分子を増幅する工程を含み、前記プライマーは、前記アダプター分子（1種類または複数種）の配列に特異的にハイブリダイズする配列を含む。本発明のいくつかの態様において、二本鎖アダプターは、試料変性およびプローブへのハイブリダイゼーション前に、断片化された核酸分子の一方または両方の末端に提供される。かかる態様において、標的核酸分子は溶出後に増幅され、元の試料と比べて複雑さがさらに低減された増幅産物のプールが生成される。標的核酸分子は、例えば、非特異的ライゲーション媒介性(Ligation Mediated-)PCR（LM-PCR）を用いて多数回の増幅によって増幅され得、産物は、所望により、マイクロアレイプローブに対する1回以上の選択によってさらに富化され得る。リンカーまたはアダプターは、例えば、自由裁量サイズおよび自由裁量核酸配列を有するように、下流の解析適用、続く複雑さ低減工程に所望されることに従って提供される。アダプターリンカーは約12〜約100塩基対の範囲、例えば約18〜100塩基対、好ましくは約20〜44塩基対の範囲であり得る。いくつかの態様において、リンカーは、自己相補的、非相補的、またはYアダプターである。

アダプター分子のライゲーションにより、続く捕捉分子の増幅工程が可能になる。ライゲーションを捕捉工程の前に行なうか後に行なうかとは無関係に、いくつかの代替的な態様がある。一態様において、1つの型のアダプター分子（例えば、アダプター分子A）をライゲートすると、断片の両方の末端に同一の末端配列を有する断片集団がもたらされる。その結果、続く潜在的増幅工程で使用するプライマーは1種類だけで充分となる。代替的な態様では、2つの型のアダプター分子AおよびBが使用される。これにより、3つの異なる型：（i）一端に一方のアダプター（A）および他端に別のアダプター（B）を有する断片、（ii）両方の末端にアダプターAを有する断片、および（iii）両方の末端にアダプターBを有する断片で構成された富化された分子の集団がもたらされる。アダプターを有する富化された分子の作製は、増幅および配列決定が、例えば、454 Life Sciences Corporation GS20 and GS FLX装置（例えば、GS20 Library Prep Manual、Dec 2006、およびWO 2004/070007参照；参照によりその全体が本明細書に援用される）を用いて行なわれる場合、非常に有利である。

好ましい態様において、本発明の方法は、ハイブリダイゼーションアッセイにおいて、植物ゲノム領域内の反復領域の枯渇に使用される。本発明は、なんら特定の植物種に限定されないことが企図される。本発明で使用される植物種の例としては、限定されないが、トウモロコシ、ダイズ、モロコシ属、小麦、米、大麦、サトウキビ、野菜作物、果物作物、飼草作物、牧草、広葉植物ならびに任意の他の双子葉植物および／または単子葉植物などの経済的および／または研究関連植物種が挙げられる。

他の態様において、本発明の方法は、魚類およびサンショウウオなどの非常に高い反復含量を有する非植物ゲノムにおいて使用される。

いくつかの態様において、本発明は、本発明による方法を行なうための試薬および材料を含むキットを含む。かかるキットは、上面に1つ以上の標的遺伝子座由来の1つ以上の標的核酸配列に特異的（例えば、エキソン、イントロン、SNP配列などに特異的）な複数のハイブリダイゼーションプローブが固定化されるものまたは基材、少なくとも1つの完全染色体の完全配列を捕捉するように設計されたタイリングアレイを規定する複数のプローブ、標的ゲノム内の反復核酸配列に特異的なハイブリダイゼーションプローブ、増幅プライマー、ポリメラーゼ連鎖反応法を行なうための試薬（例えば、塩溶液、ポリメラーゼ、dNTP、増幅バッファーなど）、ライゲーション反応を行なうための試薬（例えば、ライゲーションアダプター、T4ポリヌクレオチドキナーゼ、リガーゼ、バッファーなど）、チューブ、ハイブリダイゼーション溶液、洗浄溶液、溶出溶液、磁石（1つまたは複数）、およびチューブホルダーを含み得る。いくつかの態様において、キットは、さらに、2種類以上の異なる二本鎖アダプター分子を含む。

いくつかの態様において、キットは、さらに、DNAポリメラーゼ、T4ポリヌクレオチドキナーゼ、T4 DNAリガーゼ、1つ以上のアレイハイブリダイゼーション溶液、および／または1つ以上のアレイ洗浄溶液からなる群からの少なくとも1種類以上の化合物を含む。好ましい態様において、3種類の洗浄溶液が本発明のキットに含まれ、洗浄溶液はSSC、DTTおよび任意にSDSを含む。例えば、本発明のキットは、洗浄バッファーI（0.2% SSC、0.2%（v/v）SDS、0.1mM DTT）、洗浄バッファーII（0.2% SSC、0.1mM、DTT）および／または洗浄バッファーIII（0.05% SSC、0.1mM DTT）を含む。いくつかの態様において、本発明のシステムは、さらに、非選択的溶出溶液、例えば、水酸化ナトリウムを含む溶液を含む。

実施例
以下の実施例は本発明の例示であって、なんら本発明の実施を限定しない。

実施例1-トウモロコシでのアレイ系反復サブトラクション媒介性配列捕捉（RSSC）
反復アレイ設計
カスタム720K NimbleGen マイクロアレイ（081110_Zea_mays_repeats_cap）を、MAGI Cereal Repeat Database（v3.1；http：//magi.plantgenomics.iastate.edu/ repeatdb.html）およびTIGR Maize Repeat Database（v4；http：//maize.jcvi.org/repeat_db.shtml）のトウモロコシ反復エレメントを含むように、スライド1つあたり3回合成した。設計は依頼によりオーダーされ得る。アレイ上のプローブは全長2.1Mである。720Kのプローブを含む中心のサブアレイのみをこの試験に使用した。

トウモロコシNimbleGen捕捉アレイ設計
BACフィンガープリントコンティグ（FPC Ctg138、chr 3）上の大きなゲノム領域を最初に標的化に選択した。2008年5月29日より前に公開された物理的マップに基づき、合計70個の配列決定されたBACは、このFPCコンティグ内にあり、その配列をGenBankから2008年5月29日にダウンロードした。この物理的マップは、最新の公開までアップデートされている（Maize golden path AGP v1、Release 4a.53）。配列注釈および遺伝子予測に関する詳細を図7に示す。83個の非重複予測非反復遺伝子とともに44個の無秩序配列断片を含む合計約1.5Mbをプローブ設計のためにソフトマスキングした。すべてのプローブのユニーク性/反復性およびプローブの物理的位置を、2008年3月に入手可能であったトウモロコシBAC配列の集合体に基づいて決定した。アレイ設計は、標的領域における約5bp間隔でのタイリングによって構築した。ゲノム内に平均15量体頻度を有する100個より多くのプローブを、ゲノム内に5つより多くのクローンマッチを有するプローブであったため除外した。合計41,555個のプローブを選択し、アレイ上で少なくとも17回複製した。参照ゲノム配列と調和させるため、プローブをB73 RefGen_v1（Schnable，P.S. et al、Science、326,1112-1115,（2009））に再マッピングした。最後の配列の区間を最も左側にマッピングされたプローブ（REGION0042FS000010140）の1kb上流から最も右側にマッピングされたプローブ（REGION0028FS000002032）の1kb下流まで、すなわち、Chr. 3上の183062553〜185609824bpにおいて規定した。2つの断片（183,315,664〜183,553,126bpおよび183,880,178〜183,965,661bp）は、プローブ設計に使用した配列に存在しなかったため、解析から除外した。この設計は、081028_Zea_mays_schnable_capへの依頼によりオーダーされ得る。

第2のアレイ設計を、43個の散在する遺伝子標的における約15bpの間隔でのタイリングによって構築した。ゲノムにおいて平均13量体頻度を有する500より多くのプローブを、ゲノム内に7つより多くのクローンマッチを有するプローブであったため除外した。合計16,406個のプローブを選択し、アレイ上で44回複製した。このアレイは、約350Kbpのゲノム空間を含むが、プローブ内に提示されるのはわずか123Kbである。この設計は、080328_maize_cap_springer_1への依頼によりオーダーされ得る。

トウモロコシ配列捕捉および454配列決定
DNAを2種類のトウモロコシ同系交配体、B73およびMo17の14日齢の実生から、報告されたプロトコル（Li，J. et al、Genetics 176、1469-1482（2007））を用いて単離した。700bpの平均挿入物サイズの454 GSFLX-Ti 配列決定ライブラリーを、各同系交配体に対して作製し、配列決定アダプターに基づいたプライマーを使用する7サイクル増幅に供した。QIAquick/MinElute Spin Column（QIAGEN、Valencia、CA）を用いてアンプリコンを精製した。NanoDrop ND1000（Thermo Scientific、Willmington、DE）を用いてDNAの濃度を測定し、DNA7500キット（Agilent Technologies、Santa Clara、CA）とともにAgilent Bioanalyzer2100を用いて分子量範囲を決定した。合計250ng（またはそれより少ない）の各二本鎖配列決定ライブラリーを、16ulの全NimbleGenハイブリダイゼーションカクテル溶液ならびに配列決定アダプターに相補的な20倍モル過剰の非伸長性プライマーとともにMai Taiシステム（Scigene、Sunnyvale、CA）を使用し、低ストリンジェンシー（37℃）でトウモロコシ反復サブトラクションにハイブリダイズさせた。SciGeneハイブリダイゼーション炉の回転速度をセッティング2に設定した。底面（上向き）およびサブトラクションアレイ（上面、下向き）にガスケットアレイを有する2つのスライドを分離することによりハイブリダイゼーションカクテルを回収した。目的のライブラリー断片（なおガスケットスライド上）を含む残りのハイブリダイゼーションカクテルを目的の遺伝子間隔を目的とした第2の捕捉アレイに供し、逆さま（プローブを下）にすることにより捕捉アレイをガスケットスライド上のハイブリダイゼーションカクテル上に配置した。ガスケットスライドは、再配置中、Mai-Taiリグ内のままにした。次いで、捕捉アレイをさらに4日間の42.5℃でのハイブリダイゼーションに供し、回転装置セッティング2に設定した。捕捉アレイを先に記載のとおりに洗浄し（Albert，T.J. et al、Nat. Methods 4、903-905（2007））、Roche NimbleGen Inc.から入手可能であり、以下にまとめたようにして水酸化ナトリウム法で非選択的に溶出した。

12.5ulの10M NaOHを987.5ulの水と混合し、終濃度を125mMにした。溶液を充分にボルテックスし、スピンした。ほぼ400ulの溶液を溶出チャンバに添加し、チャンバを水平位置に戻した。試料を10分間インキュベートした。ピペットを使用し、液体をピペットチップに3回吸引して出し入れして、液体がピペットチップ内にある場合は、最終混合物のきれいな1.5mlチューブに移すことにより混合した。任意の残留液を小口径ピペットチップで除去し、1.5mlチューブに添加した。最後に、中和溶液（16ulの20%酢酸）を添加し、溶出された分子をQiagen MinElute カラムで精製した。

非選択的に溶出された分子を、次いで、配列決定アダプター（12サイクル）によって増幅し、生成物を精製し、定量した。二本鎖の非選択的に溶出されたライブラリーを、454によって推奨されるようにしてemPCRのために希釈し、製造業者の条件下、4または16領域チタンPTPを使用し、454 GSFLX-Titaniumプロトコルを用いて配列決定した。emPCRの前に、希釈した二本鎖溶出ライブラリーをサーマルサイクラー内で95℃で2分間熱処理した。この加熱工程は、emPCRにおいて増幅関連人工産物を回避するのに必須であることがわかった。低品質（パラメータ：最大平均エラー=0.01、末端における最大エラー=0.01）の未加工454捕捉読み値および短い454読み値（<200bp）を、LUCYプログラムを用いて除去した。（Chou,H.H. & Holmes、M.H.，Bioinformatics、17、1093-1104（2001））。

データ解析
オンターゲット率を推定するため、すべてフィルタリングされたB73およびMo17捕捉454読み値をB73参照ゲノム配列、すなわち、B73_RefGen_v1（Schnable，P.S. et al、Science、326、1112-1115,（2009））に整列させた。BLASTアラインメント基準：95%類似性ならびに454読み値 <=15bpの5’および3’末端の両方の全非整列領域）。その最大マッチが標的領域と重複する配列読み値をオンターゲットと分類した。Interval 377外にマッピングされ得るプローブでは、標的パラログ領域は、Interval 377の内部および外部の両方にマッピングされ得るこれらのプローブの非重複配列の組と規定する。標的パラログ領域と重複する最大マッチを有する配列読み値を、オンパラログ読み値とみなす。全ゲノムCGHデータをNCBI GEOデータベース（GSE 16938）（Springer，et al. PLos Genetics、5（11）、2009）から引き出した。標的化された領域内のCGHプローブのみを用いて、標準化達成範囲(coverage)を計算した。NimbleScan（バージョン2.4、NimbleGen）を使用し、データ可視化のためのGFFファイルを作成した。解析パイプラインのためのShellおよびAWKスクリプトは、請求に応じて入手可能である。VISTAを使用し、B73およびMo17対立遺伝子配列間の配列整列を行なった（デフォルト設定で使用したLAGAN整列プログラム）。CAP3（Huang、X. & Madan、A.，Genome Res. 9、868-877,（1999））を、43-GeneアレイからのMo17読み値のアセンブリングに使用した（使用したパラメータ：オーバーラップ同一性割合>=95、オーバーラップ長さ>= 50bp）。

結果および考察
過去20年にわたって、ゲノムの複雑さの低減を得るためのいくつかのアプローチ、例えば、EST配列決定、メチル-濾過、および高Cot DNA選択（Barbazuk et al.，Bioassays 27、839-848、（2005）に概説）が試みられている。これらのアプローチのそれぞれは、ゲノムの複雑さの低減において成功裡であったが、いずれも、ハイブリダイゼーション系配列捕捉では可能なように目的配列を標的化様式で送達しない。ブロッカーとしてCot1 DNAを使用した初期実験において、本発明者らは、トウモロコシCot1 DNAによりヒトCot1 DNAと比べて配列捕捉の成績が改善されたことを見い出した（データ示さず）。この概念を拡張すると、配列捕捉技術を多くの作物ゲノムに適合することは、多くの重要な作物の各々に対する種特異的ブロック剤の作製が必要とされ得ると仮定され得る。公表されたトウモロコシCot1作製プロトコルは、わずか約10%収率を有し、ゲノムDNA消費の見通しからの作製の規模の増減ができなくなる（Zwick，M.S. et al、Genome、40、138-142（1997））。さらに、本発明者らの限度内で以前に公開されたCot1系プロトコルの使用において20回の独立した試行のうち16回により、現行の試験で得られるものより少なくとも１桁少ない富化倍数がもたらされた（Schnable、Springer、BarbazukおよびJeddeloh、非公表観察結果）。したがって、本発明者らは、一貫して複雑さが低減された試料がもたらされ得る2段階マイクロアレイ配列捕捉の使用を調べた。高度反復配列を含むDNA断片を除去するために反復サブトラクションマイクロアレイを設計した。

アレイ系反復サブトラクション配列捕捉（RSSC）のプロセスを図1に示す。RSSCは、2つの相：捕捉ライブラリー内の反復配列のアバンダンスの低減、および得られた複雑さ低減ライブラリーからの標的配列の捕捉からなる。公的に入手可能な454 GSFLX-Tiライブラリー構築プロトコルを用いて、約700bpの平均挿入物サイズを有するB73またはMo17いずれかの同系交配体のための単鎖A-Bアダプター付加配列決定ライブラリーを作製した。次いで、このライブラリーを、454 Ti A/Bアダプターに対して設計されたプライマーを用いた限定的PCRサイクルによって増幅し、精製し、品質を確認した。次に、穀類反復データベース内のトウモロコシ受諾をプローブでタイリングすることによって構築したトウモロコシ反復アレイを用いてRSSCを実行した。トウモロコシ反復アレイに加え、２種類の特異的捕捉アレイを設計した。第1の捕捉アレイ（Interval 377アレイ）は、B73同系交配体の第3染色体の約2.2Mbのゲノム長さを標的化する。このアレイは、一連の70個のオーバーラップBACの配列に基づいて設計した。Interval 377アレイは、他の作物ゲノムにおける配列決定されたゲノムの特異的領域が調査中である状況、またはゲノムが配列決定されていない場合には、目的の領域をカバーするいくつかのBACが利用可能である状況のモデルである。小麦またはマツなどの大きなゲノムに染色体がウォーキング(walking)される場合、この状況が予測されよう。第2の捕捉アレイ（43-Geneアレイ）は、ゲノム全体に分散された43個の遺伝子を標的化する。43-Geneアレイは、ゲノムが配列決定されていない場合にはいくつかの遺伝子が調査中である状況のモデルである。

Interval 377アレイのみでは、プローブ設計の前に該区間内の反復配列をマスクした（方法および補足図1参照）。表1に、両方のアレイの設計に関する統計のまとめを示す。

^a 参照配列としてB73_RefV1配列を使用（方法）
^b方法の詳細については補足図1参照
^c 標的領域は、プローブ合成で使用した非重複配列の組からなる
^d 標的領域の長さ/主標的空間の長さ
^e標的領域と重複する「フィルタリングされた遺伝子の組」⁶の構成員に基づく

2つのアレイおよび2つの遺伝子型を用いたトウモロコシ収集データの統計のまとめを表2に示す。

^a計算の際は、2つのB73局所捕捉を合わせた
^b 計算は、すべての遺伝子の併合データに対するものとした
^c 低品質読み値の除去後に残った読み値（方法）
^d 標的領域と重複する領域にマッピングされた読み値
^e オンターゲット読み値/（標的領域の長さ/B73参照のサイズ[2.3Gb⁶]）の割合
^f 標的パラログ領域と重複する領域にマッピングされた読み値
^g 測定せず
^h オンパラログ読み値/（標的パラログ領域の長さ/B73参照ゲノムのサイズ[2.3Gb⁶]）の割合

最後に、B73およびMo17から捕捉した読み値を用いたSNP予測を表3に示す。

^a 2組のB73およびMo17由来配列読み値：フィルタリングされたすべての読み値（「全」）およびオンターゲット読み値（「ターゲット」）をSNP予測に使用した。
^b 高品質SNPは、すべての整列読み値において単一対立遺伝子のものである。また、Interval 377の反復DNA領域内で同定されたSNPを除去した（方法）。

RSSCのより広い適用可能性
記載のプロトコルの使用により、規定の染色体区間および一組の分散遺伝子の両方の約1,800〜3,000倍の富化が達成された。この富化は、ヒトゲノムで達成されるものに匹敵する（Albert，T.J. et al、Nat. Methods 4、903-905（2007））。両方の捕捉について、標的化した塩基の80〜98%が捕捉配列によってカバーされた。オンターゲット読み値1,000個あたりの標的領域の平均達成範囲は、該2つの異なるアレイでの捕捉と類似しており（1.3対1.1）、アプローチの全体的なロバスト性を強調している。したがって、RSSC プロトコルは、トウモロコシゲノムの標的化したゲノム領域を再配列決定するための方法を提供し、他のゲノムにおいて同様のレベルの成績を示すことが予測される。反復サブトラクションに必要な試薬をインシリコで設計できることにより、配列捕捉を多様な種に適用する技術的ハードルが有意に低くなる。高度反復エレメントは、次世代配列決定技術と組み合わせて限定的な量の全ゲノムショットガン配列決定データのみを用いて発見され得るため、限定的な資源投資で、種-特異的反復-サブトラクションアレイを設計することが実現可能である。したがって、本発明のRSSC プロトコルは、配列決定された参照ゲノムを有する種だけでなく、ゲノムがまだ配列決定されていないものにも適用することができる。重要なことに、完全に配列決定された参照ゲノムの非存在下で行なった多型解析は実質的に煩雑でない。この技術は、集団遺伝学の試験、定量的変異を制御する遺伝子座のクローニング、ならびに作物、モデル生物および重要なことに非モデル種における対立遺伝子マイニングに適用され得る。

実施例2−トウモロコシでの溶液系反復サブトラクション媒介性配列捕捉（RSSC）
反復サブトラクションアレイ
カスタムNimbleGen 3x 720K配列捕捉マイクロアレイを、MAGI Cereal Repeat Database（v3.1；http：//magi.plantgenomics.iastate.edu/repeat_db.html）およびMaize Repeat Database（v4；http：//maize.jcvi.org/repeatdb.shtml）内にトウモロコシ反復エレメントを含むように合成した。各プローブは、Insituプライマーでの増幅が助長されるように5プライム末端および3プライム末端の両方に15量体配列を含んだ。アレイ上のプローブは合計2.1Mあるが、720Kプローブを含む中心のサブアレイだけを使用した。

トウモロコシNimbleGen配列捕捉アレイ設計
アレイ設計は実施例1と同じとした。

トウモロコシ配列捕捉ライブラリー
報告されたプロトコル（Li et al. 2007）を用いて同系交配体系B73の14日齢の実生からDNAを単離した。700bpの平均挿入物サイズの454 GS FLX-チタン配列決定ライブラリーを作製し、配列決定アダプターに基づいたプライマーを用いて8サイクルの増幅に供した。Qiagen MinElute Columnを用いてアンプリコンを精製し、NanoDrop ND1000を用いて定量した。

プローブプールおよび反復サブトラクション
液相反復サブトラクションアレイに、Grace Bio-Labs（Bend、OR）のガスケットアレイを重層し、アレイ表面上で30サイクルのPCRに供し、インサイチュで、WO2009053039、Albert and Rodesch：Methods and System for the Solution Based Sequence Enrichment and Analysis of Genomic Regions（全体が参照により本明細書に援用される）に記載のようにして反復プローブプールを生成させた。インサイチュPCR産物を、Qiagen Qiaquickカラムを用いて清浄化し、水中に溶出させた。NanoDrop ND1000を用いて試料を定量し、25 ng/μlの濃度まで希釈した。この希釈プローブプールを、次いで、非対称PCRの鋳型として使用した。非対称PCRでは、二本鎖DNAの一方の鎖のみの増幅を強制するために、ビオチンで標識した一方のプライマーを過剰に使用した。ビオチン標識プライマーによって、ビオチンがストレプトアビジンビーズ（Invitrogen，Inc.（Carlsbad、CA））に結合することにより、プローブ反復エレメントハイブリダイゼーション複合体の除去が可能になった。フォワードおよびリバース鎖について、WO 2009053039に記載のようにして15サイクルの非対称PCRを行ない、それぞれプローブプールを生成させた。フォワードおよびリバース鎖は、NanoDrop ND1000を用いて定量し、100ngの各プローブを1.5mlに1つに合わせた。別のチューブにおいて、500ngのトウモロコシチタンライブラリーを、配列決定用アダプターに相補的な100倍モル過剰の非伸長性プライマーとともに添加した。両方のチューブをEppendorf Vacufuge（Hauppauge、NY）内で60℃にて10分間乾燥させた。プローブを再水和させるため、4.8μlの水を添加し、チューブを70℃の加熱ブロック内に10分間入れた。同時に、8.0μlのハイブリダーゼーションバッファーおよび3.2μlの成分Aを試料に添加し、95℃の加熱ブロック内に10分間入れた。インキュベーション後、両方のチューブをボルテックスし、スピンした。ハイブリダイゼーションバッファー中のDNAライブラリーおよび成分Aをプローブプールに添加し、ピペットチップを用いて混合し、次いで、同じピペットチップを用いて0.2mlPCRチューブに移した。プローブプール、DNA、および非伸長性プライマーを95℃のサーモサイクラー内に2分間入れ、試験DNAの完全な変性を確実にした後、37℃で8〜24時間インキュベーションした。

反復エレメントを結合させるため、試料は、ストレプトアビジンビーズとともにインキュベートすることが必要であった。このプロセスにより、反復DNAにハイブリダイズされたビオチン標識プローブが結合され、前記エレメントの除去が可能になった。まず、100μlのビーズを1.5mlチューブに移し、磁気粒子収集装置（MPC）（Invitrogen，Inc.，Carlsbad、CA）を用いてチューブに対してペレット化し、すべての液体を除去した。以下のもの：10μlの1モルTRIS-HCl、2μlの0.5モルEDTA、400μlの5モルNaCl、および588ul?の滅菌水からなるビーズ結合洗浄バッファーでビーズを2回洗浄した。2回目の洗浄後、MPCを用いてビーズをチューブ壁に対してペレット化し、すべてのバッファーを除去した。インキュベートした試料を、ビーズを入れたチューブに添加し、軽くボルテックスし、スピンし、ビーズを試料溶液中に再懸濁させた。チューブをサーモサイクラー内で47℃で45分間インキュベートすることによりビオチンをストレプトアビジンビーズに結合させた。ビーズが沈降しないようにピペットチップを用いて試料を15分間混合した。インキュベーション後、試料をMPC内に入れ戻してペレット状にし、ビーズは、ビオチン標識プローブおよび反復DNAエレメント複合体を含む。次いで、水性反復遊離DNAを結合ビーズを含むチューブから除去し、きれいな1.5mlチューブ内に入れた。試料の容量を測定し、以下の混合物：4.8μlの水、8μlのハイブリダイゼーションバッファー、および3.2μlの成分Aで16μlにした。次いで、試料を、固相反復サブトラクションで記載のようにして標準配列捕捉ワークフローに供した。

配列決定の結果を以下の4に示す。

実施例3-キャノーラでの溶液系反復サブトラクション媒介性配列捕捉（RSSC）
-反復サブトラクションアレイ
ハクサイ(Brassica rapa subsp pekinensis)由来の完全BAC配列を2009年4月にGenBankからダウンロードした。アブラナ属(Brassica)ゲノムの125.4Mbpを表す合計970個のBAC配列を収集した。RepeatScoutアプリケーションパッケージ（v1.0.5）を使用し、一組の反復配列を規定した。簡単には、build_1mer_tableアプリケーションを使用し、該アプリケーションのためのデフォルト設定を用いて頻度表を作成した。次いで、RepeatScoutアプリケーションをこの頻度表とともに使用し、合計10.2Mbpの一組の12316 反復配列を作製した。反復配列は50bp〜15670bpの範囲のサイズであり、平均サイズは829bpおよびメジアンサイズは236bpであった。次いで、これらの反復配列に対する配列捕捉プローブをタイリングによって作製した。さらなるプローブを、キャノーラから全ゲノムショットガン（WGS）配列決定読み値の117Mbpによってタイリングにより作製した。上記のBrassica BAC配列から13量体頻度のヒストグラムを作成し、各プローブに見られる平均 13量体頻度を計算するために使用した。特定の閾値より大きい平均13量体頻度を有するプローブを反復と分類した。次いで、非重複反復プローブ配列の組をアレイ設計において使用した。固相設計のため、該反復配列の組には50bpタイリング区間を使用し、WGS配列には100bpタイリング区間を使用した。反復としてのWGS配列からのプローブの分類には閾値100を使用した。プローブをアレイ上で、フォワードとリバースの両方の向きに配置した。反復配列の組のプローブは合計296642（2×148321）であり、WGS配列由来のプローブは420018（2×210009）であった。液相設計のため、反復配列の組には25bpタイリング区間を使用し、WGS配列には50bpタイリング区間を使用した。反復としてのWGS配列からのプローブの分類には閾値80を使用した。プローブは、アレイ上においてフォワードの向きだけに配置した。反復配列の組由来のプローブは合計287813であり、WGS配列由来のプローブは424804であった。

キャノーラNimbleGen配列捕捉アレイ設計
合計769個のキャノーラEST配列を標的配列として使用し、合計514kbであった。59〜97bpの範囲のサイズの配列捕捉プローブを、1bpタイリング区間において作製した。EST配列を表す合計90000個のプローブを選択し、これらのプローブをアレイ設計において8回複製させた。

キャノーラでのワークフローは、以下のこと：特異的反復サブトラクションアレイおよび配列捕捉アレイをキャノーラゲノムから設計したこと以外、トウモロコシと同一であった。配列捕捉はキャノーラの100ngのチタンライブラリーを用いて行なったが、トウモロコシでは500ngにおいて500を使用した。他のすべてのプロセスは、トウモロコシでの説明およびRoche NimbleGenユーザーガイド
に記載のものと同一であった。

配列決定の結果を以下の表5に示す。

本出願書類に挙げたすべての刊行物および特許は、参照により本明細書に援用される。本発明の記載の方法および組成物の種々の修正および変更は、本発明の範囲および精神から逸脱することなく、当業者に自明である。本発明を特定の好ましい態様に関して記載したが、特許請求の範囲に記載の発明は、かかる特定の態様に不当に限定されないことを理解されたい。実際、関連分野の当業者に自明の記載の発明を実施するための形態の種々の修正が、以下の特許請求の範囲の範囲に含まれることを意図する。

Claims

a）非標的核酸配列および標的核酸配列を含む核酸配列を含む試料を、試料中の非標的核酸配列に相補的な配列を含む第1の組のハイブリダイゼーションプローブに適用し、ハイブリダイゼーションさせる工程、
b）ハイブリダイズされなかった標的核酸配列を含む溶液を、ハイブリダイズされた非標的配列から分離する工程、
c）ハイブリダイズされなかった標的核酸配列を含む溶液を、標的核酸配列に相補的な配列を含む第2の組のハイブリダイゼーションプローブに適用し、ハイブリダイゼーションさせる工程、ならびに
d）前記ハイブリダイズされた標的核酸配列を、第2の組のハイブリダイゼーションプローブから溶出し、それにより、試料中の標的核酸配列を富化する工程
を含む、試料中の標的核酸配列の富化方法。
工程a）およびc）を固相上で行なう、請求項１記載の方法。
固相がマイクロアレイである、請求項２記載の方法。
工程a）とc）の少なくとも一方を溶液中で行なう、請求項１記載の方法。
a）非標的核酸配列に相補的な配列を含む第1の組のハイブリダイゼーションプローブを作製する工程；
b）標的核酸配列に相補的な配列を含む第2の組のハイブリダイゼーションプローブを作製する工程；
c）第1の組のプローブを試料と合わせ、第1の組のプローブを非標的核酸にハイブリダイズさせる工程；
d）ハイブリダイズされた第1の組のプローブを試料から除去し、標的核酸配列を含む第１の富化溶液を形成する工程；
e）第2の組のプローブを第１の富化溶液と合わせ、第2の組のプローブを標的核酸にハイブリダイズさせる工程；
f）ハイブリダイズされた第2の組のプローブを除去する工程；および
g）標的配列を、ハイブリダイズされた第2の組のプローブから溶出し、標的核酸配列を含む第2の富化溶液を形成する工程
を含む、標的核酸および非標的核酸で構成された試料中の標的核酸配列の富化方法。
工程c）をマイクロアレイ上で行なう、請求項５記載の方法。
工程a）において第1の組のハイブリダイゼーションプローブを溶液中で作製し、ハイブリダイゼーション工程c）を溶液中で行なう、請求項５記載の方法。
工程a）において溶液中で第1の組のハイブリダイゼーションプローブを作製するためにマイクロアレイを使用する、請求項７記載の方法。
工程a）において溶液中で第1の組のハイブリダイゼーションプローブを、前記マイクロアレイから第1のポリメラーゼ連鎖反応によって作製する、請求項８記載の方法。
工程a）において溶液中で第1のポリメラーゼ連鎖反応によって作製した第1の組のハイブリダイゼーションプローブを、第2のポリメラーゼ連鎖反応によってさらに増幅する、請求項９記載の方法。
第2のポリメラーゼ連鎖反応が非対称であり、好ましくは、さらに、該非対称ポリメラーゼ連鎖反応において特異的結合ペア構成員の導入を含む、請求項１０記載の方法。
工程b）において第2の組のハイブリダイゼーションプローブをマイクロアレイ上で作製し、工程e）を前記マイクロアレイ上で行なう、請求項５〜１１記載の方法。
工程b）において第2の組のハイブリダイゼーションプローブを溶液中で作製し、工程e）を溶液中で行なう、請求項５〜１１記載の方法。
工程b）において溶液中で第2の組のハイブリダイゼーションプローブを作製するためにマイクロアレイを使用する、請求項１３記載の方法。
工程b）において第2の組のハイブリダイゼーションプローブを溶液中で、前記マイクロアレイから第1のポリメラーゼ連鎖反応によって作製する、請求項１４記載の方法。
工程b）において第1のポリメラーゼ連鎖反応によって溶液中で作製した第2の組のハイブリダイゼーションプローブを、第2のポリメラーゼ連鎖反応によってさらに増幅する、請求項１５記載の方法。
第2のポリメラーゼ連鎖反応が非対称であり、好ましくは、
非対称ポリメラーゼ連鎖反応において、該増幅されたハイブリダイゼーションプローブへの特異的結合ペア構成員の導入をさらに含む、
請求項１６記載の方法。
a）試料を、ハイブリダイゼーションプローブを含む基材に適用する工程、前記プローブは、非標的核酸配列に相補的な配列および標的核酸配列に相補的な配列を含み、前記非標的核酸配列に相補的な配列および標的核酸配列に相補的な配列を、試料のプローブへのハイブリダイゼーションが可能なように別々に配置する、ならびに
b）ハイブリダイズされた標的核酸配列をプローブから選択的に溶出し、それにより、試料中の標的核酸配列を富化する工程
を含む、標的核酸および非標的核酸で構成された試料中の標的核酸配列の富化方法。