JP2016532454A

JP2016532454A - Ｒｎａ−クロマチン相互作用分析のための組成物およびその使用

Info

Publication number: JP2016532454A
Application number: JP2016540399A
Authority: JP
Inventors: ルアン，イジュン; ジュヨン，メイジェン; ルオ，ジュンホン・オスカー
Original assignee: Jackson Laboratory
Current assignee: Jackson Laboratory
Priority date: 2013-09-05
Filing date: 2014-09-05
Publication date: 2016-10-20
Anticipated expiration: 2034-09-05
Also published as: EP3041952B1; WO2015035108A1; CN111979229A; KR20160048992A; SG10201801779XA; IL272171B; IL244191B; EP3041952A1; US11466307B2; SG10201913351XA; KR102310441B1; US20160177380A1; CN105899672A; SG11201600645SA; SG10201913362PA; EP3299476A1; CN105899672B; HK1252806A1; AU2014315104B2; CA2936089A1

Abstract

本明細書で記載される発明は、全部のｎｃＲＮＡに関する機能的標的を同定するための偏りのない全ゲノム戦略を実施するための試薬（例えばキット）、組成物、および方法を提供する。【選択図】図１Ａ

Description

関連出願への参照
本出願は、２０１３年９月５日に出願された米国仮出願第６１／８７３，９２８号に対する優先権およびその出願日の利益を主張し、その全内容は参照により本明細書に援用される。

非コードＲＮＡ（ｎｃＲＮＡ）は、現在ゲノム中で広く転写されていると信じられており、多数のｎｃＲＮＡが同定されている。しかし、不釣合いにも、それらの機能的役割に関してはまだほとんど分かっていない。既知のｎｃＲＮＡの機能の多くは、撹乱（ｐｅｒｔｕｒｂａｔｉｏｎ）実験により推測されており、それはｎｃＲＮＡがどの特異的な標的と相互作用しているかの詳細を欠いている。ＣＬＩＰ／ＲＩＰ−ＳｅｑおよびＣｈｉＲＰ−Ｓｅｑのような技術は、一部のｎｃＲＮＡに関してどのタンパク質因子およびクロマチン座位（ｃｈｒｏｍａｔｉｎｌｏｃｉ）と相互作用しているかの膨大な洞察を提供してきた。しかし、現在の方法は、一度に１つのｎｃＲＮＡまたは相互作用する標的を調べることに限定されている。従って、全てのｎｃＲＮＡに関する機能的標的を同定するための偏りのない全ゲノム戦略を有することが望ましい。

本発明の一側面は、以下のものを含むキットを提供する：（１）（ｉ）第１ポリヌクレオチドおよび（ｉｉ）第２ポリヌクレオチドを含むＲＮＡリンカー、ここで、第１および第２ポリヌクレオチドは、第１ライゲーション適合末端および第１ポリヌクレオチドの３’末端の３’オーバーハングにより隣接される第１二本鎖領域を形成しており、ここで、３’オーバーハングは、ランダム配列プライマーを含む；ならびに（２）（ｉｉｉ）第３ポリヌクレオチドおよび（ｉｖ）第４ポリヌクレオチドを含むＤＮＡリンカー、ここで、第３および第４ポリヌクレオチドは、平滑末端および第２ライゲーション適合末端により隣接される第２二本鎖領域を形成し、ここで、第１および第２ライゲーション適合末端は、互いにライゲーションし、または互いにライゲーションするように適合可能である。

特定の態様において、第１ライゲーション適合末端は、第２ポリヌクレオチドの３’末端における３’オーバーハングであり、第２ライゲーション適合末端は、第３ポリヌクレオチドの３’末端における３’オーバーハングであり、ここで両方の３’オーバーハングは、ライゲーションのために互いにアニーリングする。

特定の態様において、第１二本鎖領域は、ランダム配列プライマーに対して３’側を切断する第１制限酵素（ＲＥ）に関する第１認識部位を含む。
特定の態様において、第２二本鎖領域は、第３ポリヌクレオチドに対して５’側を切断する第２制限酵素（ＲＥ）に関する第２認識部位を含む。

特定の態様において、前記の第１、第２、第３、および第４ポリヌクレオチドの１つ以上は、ＤＮＡである。
特定の態様において、前記の第１、第２、第３、および第４ポリヌクレオチドの１つ以上は、修飾ヌクレオチドを含む。

特定の態様において、修飾ヌクレオチドは、ビオチン化Ｔ（チミジン）である。
特定の態様において、第１ポリヌクレオチドは、複数のポリヌクレオチドを含み、それぞれがランダム配列プライマー領域においてのみ異なっている。

特定の態様において、第１ポリヌクレオチドは、同一のランダム配列プライマーを有するポリヌクレオチドの均一な集団を含む。
特定の態様において、ランダム配列プライマーは、４個、５個、６個、７個、８個、またはより多くのヌクレオチドを含む。

特定の態様において、第１二本鎖領域は、ＲＮＡリンカーをＤＮＡリンカーと区別する独特の配列を含む。
特定の態様において、第２二本鎖領域は、ＲＮＡリンカーをＤＮＡリンカーと区別する独特の配列を含む。

特定の態様において、第１認識部位の最後のヌクレオチドは、ランダム配列プライマーに対して５’側の最後の塩基対合したヌクレオチドである。
特定の態様において、第２認識部位の最後のヌクレオチドは、平滑末端における塩基対合したヌクレオチドである。

特定の態様において、第１および第２制限酵素は同じである。
特定の態様において、第１および第２制限酵素は、独立して以下：ＡａｒＩ、ＡｃｅＩＩＩ、ＡｌｏＩ、ＢａｅＩ、Ｂｂｒ７Ｉ、ＢｂｖＩ、ＢｂｖＩＩ、ＢｃｃＩ、Ｂｃｅ８３Ｉ、ＢｃｅＡＩ、ＢｃｅｆＩ、ＢｃｇＩ、ＢｃｉＶＩ、ＢｆｉＩ、ＢｉｎＩ、ＢｐｌＩ、ＢｓａＸＩ、ＢｓｃＡＩ、ＢｓｅＭＩＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＩ、ＢｓｍＡＩ、ＢｓｍＦＩ、Ｂｓｐ２４Ｉ、ＢｓｐＣＮＩ、ＢｓｐＭＩ、ＢｓｒＩ、ＢｓｒＤＩ、ＢｓｔＦ５Ｉ、ＢｔｇＺＩ、ＢｔｓＩ、ＣｊｅＩ、ＣｊｅＰＩ、ＥｃｉＩ、Ｅｃｏ３１Ｉ、Ｅｃｏ５７Ｉ、Ｅｃｏ５７ＭＩ、ＥｃｏＰ１５Ｉ、Ｅｓｐ３Ｉ、ＦａｌＩ、ＦａｕＩ、ＦｏｋＩ、ＧｓｕＩ、ＨａｅＩＶ、ＨｇａＩ、Ｈｉｎ４Ｉ、ＨｐｈＩ、ＨｐｙＡＶ、Ｋｓｐ６３２Ｉ、ＭｂｏＩＩ、ＭｌｙＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＰｐｉＩ、ＰｓｒＩ、ＲｌｅＡＩ、ＳａｐＩ、ＳｆａＮＩ、ＳｓｐＤ５Ｉ、Ｓｔｈ１３２Ｉ、ＳｔｓＩ、ＴａｑＩＩ、ＴｓｐＤＴＩ、ＴｓｐＧＷＩ、ＴｓｐＲＩまたはＴｔｈ１１１ＩＩから選択される。

特定の態様において、第１および第２制限酵素の切断部位は、認識部位の最後のヌクレオチドに対して少なくとも約１０、１２、１４、１６、１８、２０、２２、２４、２６、２８、３０またはより多くのヌクレオチド３’側である。

特定の態様において、第１および第４ポリヌクレオチドは、脱リン酸化されている。
特定の態様において、キットは、さらにタンパク質およびポリヌクレオチドを架橋する試薬を含む。

特定の態様において、試薬はホルムアルデヒドを含む。
特定の態様において、キットは、さらに、クロマチンの構成要素（例えばヒストン）に特異的または選択的に結合する親和性試薬（例えば、抗体またはモノクローナル抗体）を含む。

特定の態様において、キットは、さらに、損傷した、または不適合な５’および／または３’突出末端を含有するＤＮＡを、５’リン酸化された平滑末端ＤＮＡに変換する末端修復混合物を含む。

特定の態様において、キットは、さらにＤＮＡリガーゼ（例えばＴ４リガーゼ）を含む。
特定の態様において、キットは、さらにタンパク質およびポリヌクレオチドの架橋を逆行させる試薬（例えばプロテイナーゼＫ）を含む。

特定の態様において、キットは、さらに第１および／または第２制限酵素（単数または複数）を含む。
特定の態様において、キットは、さらに平滑末端二本鎖ＤＮＡのＰＣＲ増幅のためのコンカテマー化（ｃｏｎｃａｔｅｎａｔｉｎｇ）アダプターの対を含む。

特定の態様において、キットは、さらにＴａｑＤＮＡポリメラーゼを含む。
特定の態様において、キットは、さらに逆転写酵素を含む。
本発明の別の側面は、対象のＲＮＡおよびＤＮＡリンカーの第１および第２二本鎖領域を含む中央領域を含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドを提供し、前記の中央領域は、以下：（１）前記の第１二本鎖領域に対して近位の部位において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグ；および（２）前記の第２二本鎖領域に対して近位の部位において、ゲノムＤＮＡの配列タグにより隣接されている。

特定の態様において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグは、前記の第１制限酵素による消化の結果もたらされる遊離末端を有する。
特定の態様において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグは、ｎｃＲＮＡが転写されるゲノム領域を独特に同定する。

特定の態様において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグは、約８〜３０塩基対の長さである。
特定の態様において、ゲノムＤＮＡの配列タグは、前記の第２制限酵素による消化の結果もたらされる遊離末端を有する。

特定の態様において、ゲノムＤＮＡの配列タグは、ゲノムＤＮＡが位置しているゲノム領域を独特に同定する。
特定の態様において、ゲノムＤＮＡの配列タグは、約８〜３０塩基対の長さである。

本発明の別の側面は、対象のＰＥＴポリヌクレオチドの２以上のメンバーを含むペアエンドタグ（ＰＥＴ）ライブラリーを提供し、ここで、ＰＥＴライブラリーのそれぞれのメンバーは、同じ前記の中央領域、および対象の非コードＲＮＡ（ｎｃＲＮＡ）の異なる前記の配列タグまたは対象のゲノムＤＮＡの異なる前記の配列タグまたは両方を含む。

本発明の別の側面は、対象のＰＥＴポリヌクレオチドを含むベクターを提供する。
特定の態様において、ベクターは、複数のコンカテマー化された対象ＰＥＴポリヌクレオチドを含む。

本発明の別の側面は、２以上の対象のＰＥＴヌクレオチドのコンカテマーを提供する。
本発明の別の側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；（２）請求項１に記載のＲＮＡリンカーおよびＤＮＡリンカーを用いて、架橋されたゲノムＤＮＡ断片の末端を架橋されたｎｃＲＮＡのｃＤＮＡの末端に近接ライゲーションに関する条件下でライゲーションし、ここで架橋されたゲノムＤＮＡ断片の前記の末端はＤＮＡリンカーにライゲーションされ、架橋されたｎｃＲＮＡのｃＤＮＡの前記の末端はＲＮＡリンカーを含み；（３）請求項２９に記載のＰＥＴポリヌクレオチドを配列決定分析のために単離し；そして、（４）それぞれの前記のＰＥＴポリヌクレオチド内のゲノムＤＮＡの配列タグおよびｎｃＲＮＡの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの前記の非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

特定の態様において、ｎｃＲＮＡおよびゲノムＤＮＡは、生きた細胞中でホルムアルデヒドに媒介される架橋により架橋される。
特定の態様において、クロマチン断片は超音波処理により生成される。

特定の態様において、架橋されたｎｃＲＮＡのｃＤＮＡは、ＲＮＡリンカーのランダム配列プライマーおよびｎｃＲＮＡ鋳型から逆転写された第１鎖ｃＤＮＡを含む。
特定の態様において、第２鎖ｃＤＮＡ合成が、近接ライゲーションの後であるが工程（３）の前に実施される。

特定の態様において、方法は、さらに、工程（２）の前に、架橋されたゲノムＤＮＡ断片の末端を修復して５’リン酸化された平滑末端ＤＮＡにすることを含む。
特定の態様において、ＤＮＡリンカーの第３ポリヌクレオチドは、脱リン酸化されており、ＤＮＡリンカーは、自己ライゲーションしない。

特定の態様において、方法は、さらに、ゲノムＤＮＡの重複している配列タグおよびｎｃＲＮＡの重複している配列タグを有する２以上のＰＥＴポリヌクレオチドのクラスターを同定することを含む。

特定の態様において、方法は、さらに、ｒＲＮＡの配列タグを含むＰＥＴポリヌクレオチドを除外することを含む。
特定の態様において、方法は、さらに、工程（２）の前にクロマチン断片の部分集合を単離または富化することを含む。

特定の態様において、クロマチン断片の部分集合は、クロマチン断片の部分集合のタンパク質構成要素に特異的な抗体を用いた免疫沈降により単離または富化される。
特定の態様において、タンパク質構成要素は、ヒストン、転写因子、ポリコーム群（ＰｃＧ）ファミリータンパク質；組み換えに関わる因子；クロマチンインスレーターもしくはクロマチンウェーバー（ｗａｖｅｒ）；メチルＣｐＧ結合タンパク質；またはＲＮＡ結合タンパク質である。

あらゆる技法（単数または複数）、試薬、実験条件、制限部位、酵素、ベクター、プライマー等を含むがそれらに限定されない本発明の一態様（例えば実施例の節においてのみ記載されている態様）を実施する目的のために開示されたあらゆる記載は、本発明の一側面においてのみ詳細に記載されている（が他の側面においては全く詳細に記載されていない）態様を含め、本発明の他の態様との組み合わせで用いられることもできることは、理解されるべきである。当業者には、他の態様に関して開示された技法および材料を本発明の本態様にどのように適合させるかは明らかであろう。

図１Ａは、ＲＮＡリンカーおよびＤＮＡリンカーの対を用いるＲＩＣｈ−ＰＥＴ法の典型的な設定の図式的な流れを示す。ｎｃＲＮＡのクロマチンに対する相互作用が、架橋により捕捉された後、クロマチン線維を破壊してＲＮＡ、ＤＮＡおよびタンパク質構成要素を有する係留（ｔｅｔｈｅｒｉｎｇ）複合体にするために超音波処理される。次いで、クロマチン断片複合体のそれぞれの中の係留されたＲＮＡおよびＤＮＡは、特異的に設計されたＲＮＡリンカーおよびＤＮＡリンカーオリゴヌクレオチドにより媒介されるライゲーション反応のセットにより連結され、それは方向および特異性に関する独特の配列バーコードも有することができる。クロマチン複合体のそれぞれの内部で、ＲＮＡの３’末端は、ＲＮＡリンカーのランダムヘキサマー突出部分にアニーリングし、続いてｃＤＮＡ合成のための逆転写が行われる。一方で、ＤＮＡリンカーが、係留されたＤＮＡ断片の平滑末端にライゲーションにより付加される。過剰なリンカーオリゴの洗浄後、付着したＲＮＡおよびＤＮＡリンカーが互いにライゲーションされ、そうして係留されたＲＮＡおよびＤＮＡ分子を連結する。架橋を逆行させた後、ハイブリッドライゲーション生成物は、そのＲＮＡが転写される位置およびそれがゲノムと相互作用する位置を同定するためのさらなる増幅、配列決定、およびマッピング分析のために、所望のサイズに断片化され、それは剪断または制限消化のどちらによってもよい。図１Ｂは、修飾ＲＮＡリンカーを用いるＲＩＣｈ−ＰＥＴ法の典型的な設定の図式的な流れを示す。図１Ｃは、直接的なＲＮＡリンカーを用いるＲＩＣｈ−ＰＥＴ法の典型的な設定の図式的な流れを示す。“Ａｐｐ”は、第１ポリヌクレオチドの５’末端における５’アデニル化を表す。図２Ａ〜２Ｃは、選択されたＲＩＣｈ−ＰＥＴライブラリーの統計、ならびに配列決定およびマッピングデータを示す。図２Ａは、（他のＰＥＴ配列と重複しない）単集合（ｓｉｎｇｌｅｔｏｎ）ＰＥＴおよびＰＥＴクラスターの比率を示す。ＰＥＴクラスターデータを用いて、おおよそ７００のＲＮＡ座位および約５０００のＤＮＡ座位が同定された。図２Ａ〜２Ｃは、選択されたＲＩＣｈ−ＰＥＴライブラリーの統計、ならびに配列決定およびマッピングデータを示す。図２Ｂは、ＲＩＣｈ−ＰＥＴデータにより同定されたＲＮＡおよびＤＮＡ座位におけるＲＮＡ−Ｓｅｑデータの強度を示す。図２Ａ〜２Ｃは、選択されたＲＩＣｈ−ＰＥＴライブラリーの統計、ならびに配列決定およびマッピングデータを示す。図２Ｃは、ＲＩＣｈ−ＰＥＴデータにより定められたｎｃＲＮＡ相互作用のほとんどがトランス作用性および染色体間であったことを示している。図３は、対象の方法の再現性および感度を実証している。図は、技術的および生物学的複製において同定されたＲＮＡ相互作用部位の比較を示す代表的な散布図を示す。既知のｌｎｃＲＮＡであるＭＡＬＡＴ１（ＰＥＴ計数１７４）およびＮＥＡＴ１（ＰＥＴ１８）は、ＰＩＣｈ−ＰＥＴデータにおいて繰り返し検出された（示されていない）。ＲＮＡＰＩＩＣｈＩＡ−ＰＥＴデータも、これらの２種類のｌｎｃＲＮＡが、おそらく同時制御のために同じＰＮＡＰＩＩ転写複合体内でも空間的に結び付いていることを示している。加えて、ＲＮＡ−ＳｅｑおよびＲＮＡ−ＰＥＴデータが、ＨｅＬａＳ３におけるｎｃＲＮＡ遺伝子の発現レベルを評価するために用いられた（データは示されていない）。両方のデータは、ＭＡＬＡＴ１は高度に発現されており、ＮＥＡＴ１は中程度のレベルで発現されており、そしてＨＯＴＡＩＲは非常に低いレベルで発現されていることを示した。ＨＯＴＡＩＲ座位におけるＲＩＣｈ−ＰＥＴマッピングは、この領域における乏しいＲＩＣｈ−ＰＥＴデータを示している（データは示されていない）。図４Ａ〜４Ｂは、ＮＥＡＴ１およびＭＡＬＡＴ１のＲＩＣｈ−ＰＥＴデータの検証に関するデータを示す。図４Ａは、ＮＥＡＴ１およびＭＡＬＡＴ１が両方ともＨｅＬａＳ３細胞において発現されており、ＲＩＣｈ−ＰＥＴデータにおいて豊富に検出されていることを示している。ＮＥＡＴ１は、ＲＮＡおよびＤＮＡタグの両方が同じ座位内の短い距離でマッピングされた点で、シス作用性のみに限定されている。ＭＡＬＡＴ１は、ＤＮＡタグのほとんどが同じ染色体においてまたは異なる染色体において大きな距離でマッピングされた点で、大部分がトランス作用性である（挿入図）。図４Ａ〜４Ｂは、ＮＥＡＴ１およびＭＡＬＡＴ１のＲＩＣｈ−ＰＥＴデータの検証に関するデータを示す。図４Ｂは、ヒトＡ５４９およびＨｅＬａＳ３におけるＲＮＡ−ＦＩＳＨ実験を示す。ＮＥＡＴ１プローブは、蛍光スポットをほとんど生成せず（ＨｅＬａＳ３細胞において核あたり１〜２個）、一方でＭＡＬＡＴ１プローブは、遥かに多くのスポットを生成した（ＨｅＬａＳ３細胞において核あたり１３個）。計数は、実験あたりプローブあたり１００個の核に基づいた。図５Ａ〜５Ｂは、ＲＩＣｈ−ＰＥＴデータを特性付けている。図５Ａは、ゲノム中のＲＮＡタグクラスターの位置のカテゴリーの円グラフを示し、それは、ＲＮＡタグの大多数が推定上のｎｃＲＮＡ領域中で見付かり、３％のみがタンパク質をコードするエキソンと重複していたことを示している。多くの既知のｎｃＲＮＡが検出され、多くの新規のｎｃＲＮＡが同定された。図５Ａ〜５Ｂは、ＲＩＣｈ−ＰＥＴデータを特性付けている。図５Ｂは、ゲノム中のＤＮＡタグクラスターの位置のカテゴリーの円グラフを示し、それは、ＤＮＡタグクラスターの大部分がタンパク質コード領域にマッピングされ、ほとんどがプロモーターまたはイントロンのどちらかにあったことを示している。図６Ａ〜６Ｂは、ＭＡＬＡＴ１相互作用による多標的および多機能を示している。図６Ａは、５９個のゲノム座位と相互作用しているＭＡＬＡＴ１の連結性（ｃｏｎｎｅｃｔｉｖｉｔｙ）マップである。図６Ａ〜６Ｂは、ＭＡＬＡＴ１相互作用による多標的および多機能を示している。図６Ｂは、それらのプロモーター領域にＭＡＬＡＴ１が存在する遺伝子が、それらのイントロン領域においてＭＡＬＡＴ１相互作用を有する遺伝子よりも高いＲＮＡ−ｓｅｑの読みを有することを示す箱ひげ図である。ＲＮＡＰＩＩＣｈＩＰ−Ｓｅｑ強度の集合プロット（ａｇｇｒｅｇａｔｉｏｎｐｌｏｔ）（示されていない）において、それらのプロモーター領域にＭＡＬＡＴ１が存在する遺伝子は、それらのイントロン領域においてＭＡＬＡＴ１相互作用を有する遺伝子よりも高いＲＮＡ−ｓｅｑの読みを有する。図７は、ＣＣＡＴ１およびそのｌｎｃＲＮＡ転写産物がいくつかの標的遺伝子に関する転写活性化因子または補助活性化因子として作用していることの概略図を示す。図８Ａは、ＳＥＱＩＤＮＯ：９に対応するＣＣＡＴ１ゲノムおよびｃＤＮＡ配列のヒト８番染色体上の位置を示す。図８Ｂは、ＳＥＱＩＤＮＯ：１〜８に対応する８種類の追加のＣＣＡＴ１ゲノムおよびｃＤＮＡ配列（それぞれＣＣＡＴ１＿ＪＡＸ＿１〜８）のヒト８番染色体上の位置を示す。黒い四角は、エキソン配列を表し、一方でエキソン配列を連結している線は、イントロン配列を表す。図９Ａは、１００万の読みあたりのｋｂあたりの読み（ＲＰＫＭ）での、ＲＮＡ−Ｓｅｑデータにより測定された（雌性細胞においてＸ染色体を特異的に標的とする）ＸＩＳＴの計数を示す。図９Ｂは、ＸＩＳＴ結合によりカバーされるそれぞれの染色体の比率を示す。

１．概観
本明細書で記載される発明は、ｎｃＲＮＡが核空間における後成的制御の役割を有するならば、それはクロマチン状態および標的遺伝子活性の調節に関する機能が発揮される染色体中の特定の位置においてクロマチンと直接または間接的にのどちらかで相互作用しなければならないであろうという認識に部分的に基づいている。従って、本明細書で記載される発明は、ｎｃＲＮＡ−クロマチン相互作用を、ＲＮＡ−ＤＮＡライゲーション、続いてペアエンドタグ配列決定（ＲＩＣｈ−ＰＥＴ）により全体的にマッピングするための新規のアプローチを提供する。

簡潔には、本明細書で記載される組成物は、３つの主な部分を含む方法で用いられることができる：１）生きた細胞（例えばインビトロで培養された細胞、または組織試料から得られた一次細胞）におけるＲＮＡ、ＤＮＡおよびタンパク質間の（好ましくは全ての）分子相互作用事象を捕捉するためのクロマチン架橋；２）係留された相互作用しているＲＮＡおよびクロマチンＤＮＡ断片の（例えば特異的に設計されたリンカー、例えばＲＮＡリンカーおよびＤＮＡリンカー対による、またはＲＮＡの３’末端の５’アデニル化されたｓｓＤＮＡもしくは５’アデニル化されたオーバーハングへのライゲーションによる）ライゲーション；ならびに、３）ゲノム中のｎｃＲＮＡの転写部位およびそれらのクロマチン標的部位の位置を決定するための、ＲＮＡ−ＤＮＡライゲーション産物またはそれに由来するタグ配列（例えばＰＥＴポリヌクレオチド）の配列決定およびマッピング分析。

従って、本発明の一側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡ（またはその断片）を含むクロマチン断片を提供し；（２）架橋されたゲノムＤＮＡ断片の末端を、架橋されたｎｃＲＮＡの末端に、近接ライゲーションに関する条件下でライゲーションし；（３）ペアエンドタグ（ＰＥＴ）ポリヌクレオチドを配列決定分析のために単離し、ここでそのＰＥＴポリヌクレオチドは、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグおよびゲノムＤＮＡの配列タグを含み；そして（４）ゲノムＤＮＡの配列タグおよびｎｃＲＮＡの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

このＲＮＡ−ＤＮＡライゲーションアプローチは、全てのｎｃＲＮＡ−クロマチン相互作用の全体的な研究に適用されるだけでなく、特定のクロマチン位置におけるＲＮＡ−タンパク質相互作用の研究にも適用されることができる。従って、染色体免疫沈降（ＣｈＩＰ）に基づくＲＩＣｈ−ＰＥＴ法は、ＲＮＡ−タンパク質−クロマチン相互作用情報の追加の特異性を提供することができるであろう。

本発明の試薬および方法は、研究、開発、薬物標的同定、薬物スクリーニング、診断、処置／有効性モニタリング、予後推定等における広い範囲の使用の可能性を有する。例えば、本発明の試薬および方法は、多数の確立された細胞株、幹細胞、ｉＰＳ細胞、および一次組織からの細胞、例えば癌および健康な組織対照由来の細胞に関するｎｃＲＮＡ−クロマチン相互作用を包括的に特性付けるために；そしてゲノムの出力の制御におけるＲＮＡ機能の限りなく複雑な世界を調べる我々の能力を著しく増大させるために用いられることができる。ＲＮＡ−クロマチンインタラクトームの特性付けの完了の成功は、ｎｃＲＮＡ種の（全てではないにしても）ほとんどに関する包括的なクロマチンアドレス帳を提供すると考えられ、それは、どのようにゲノムが健康な状態および疾患状態において機能しているかを理解するのを助けるためのゲノム情報の別の次元を加えるであろう。

本発明のいくつかの特定の態様が、下記でより詳細に記載される。
ａ）ＲＮＡリンカーおよびＤＮＡリンカーの対
第１の特定の態様において、本発明の方法は、同じクロマチン断片中の架橋されたＲＮＡおよび染色体ＤＮＡをライゲーションするために、ＲＮＡリンカーおよびＤＮＡリンカーの対を用いて実施されることができる。

従って、本発明の一側面は、以下のものを含むキットを提供する：（１）（ｉ）第１ポリヌクレオチドおよび（ｉｉ）第２ポリヌクレオチドを含むＲＮＡリンカー、ここで、第１および第２ポリヌクレオチドは、第１ライゲーション適合末端および第１ポリヌクレオチドの３’末端の３’オーバーハングにより隣接される第１二本鎖領域を形成しており、ここで、３’オーバーハングは、ランダム配列プライマーを含む；ならびに（２）（ｉｉｉ）第３ポリヌクレオチドおよび（ｉｖ）第４ポリヌクレオチドを含むＤＮＡリンカー、ここで第３および第４ポリヌクレオチドは、平滑末端および第２ライゲーション適合末端により隣接される第２二本鎖領域を形成し、ここで、第１および第２ライゲーション適合末端は、互いにライゲーションし、または互いにライゲーションするように適合可能である。

特定の態様において、第１ライゲーション適合末端は、第１ポリヌクレオチドの５’末端における５’オーバーハングであり、第２ライゲーション適合末端は、第４ポリヌクレオチドの５’末端における５’オーバーハングであり、ここで両方の５’オーバーハングは、ライゲーションのために互いにアニーリングする。

特定の態様において、第１および／または第２ライゲーション適合末端は、ライゲーションに適合可能である。例えば、ライゲーションのための必須の３’または５’オーバーハングを有する代わりに、第１および／または第２ライゲーション適合末端は、制限酵素（ＲＥ）部位を含むことができ、それは、ＲＥにより切断されてライゲーションに必要な必須の３’または５’オーバーハングを生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ（例えば自己ライゲーションを防ぐための脱リン酸化された平滑末端）、または自己ライゲーションもしくは他のライゲーション適合末端とのライゲーションを防ぐ非適合性オーバーハングを有することもできる。

特定の態様において、適合性ライゲーション末端における２個の５’または３’オーバーハングは、自己アニーリングせず、かつ互いとアニーリングしない。これは、例えば、そのオーバーハングの配列を、そのオーバーハングの配列が、少なくともリンカーが用いられるべき条件下の場合に自己アニーリングも互いとのアニーリングもしないように設計することにより成し遂げられ得る。

この設計は、例えば下流の工程がＰＣＲ増幅を含む特定の態様において有利であり得る。ある頻繁に観察されるタイプの非特異的増幅産物は、“プライマーダイマー”と呼ばれる増幅反応の鋳型非依存性の人為産物であり、それは二本鎖断片であり、その長さは典型的には２つのプライマーの長さの和に近く、１つのプライマーが他方のプライマーの上で伸長された際に生じる。結果として生じる伸長産物は、その短い長さのために効率的に増幅される望ましくない鋳型を形成する。

第１、第２、第３、および第４ポリヌクレオチドのそれぞれは、別々の容器中で、例えば合成されたポリヌクレオチドとして提供されることができ、それは凍結乾燥された（ｆｒｅｅｚｅｄｒｉｅｄ，ｌｙｏｐｈｉｌｉｚｅｄ）形態または水もしくは適切な緩衝溶液中のどちらでもよい。あるいは、第１および第２ポリヌクレオチドは、同じ容器中（凍結乾燥状態または溶液中）で、例えば１：１のモル比で、それらが予めアニーリングされたＲＮＡリンカーとして用いられることができるように、組み合わせられることができる。同様に、第３および第４ポリヌクレオチドは、同じ容器中（凍結乾燥状態または溶液中）で、例えば１：１のモル比で、それらが予めアニーリングされたＤＮＡリンカーとして用いられることができるように、組み合わせられることができる。

第２、第３、および第４ポリヌクレオチドは、実質的に均質または純粋であり（例えば、同じ容器内の個々のポリヌクレオチド分子は、同じである）、一方で、３’オーバーハング領域中の第１ポリヌクレオチドの３’末端は、ランダム配列プライマーを含む（例えば、同じ容器内の個々の第１ポリヌクレオチド分子は、それぞれが３’オーバーハング領域内で異なるランダム配列プライマーを有し得ることを除いて、同じである）。従って、第１ポリヌクレオチドは、それが実際には個々のポリヌクレオチドのランダム配列プライマー領域においてのみ異なるポリヌクレオチドの混合物である点で独特であり得る。

しかし、関連する態様において、定められた３’末端配列を有する特定のｎｃＲＮＡが対象となる場合、本発明の第１ポリヌクレオチドは、その定められた３’末端配列を有する特定のｎｃＲＮＡから特異的に第１鎖ｃＤＮＡ合成を開始するために、ランダム配列プライマー領域において同じマッチする配列を均質に含有していることができる。

ランダム配列プライマーは、一般に、非コードＲＮＡの３’末端から第１鎖ｃＤＮＡ合成を方向付けることができるように、十分な長さ（例えばヘキサマー）を有する。ヘキサマーのランダム配列が用いられることができるが、他の長さ、例えば４、５、７、８、９、１０、１１、１２のランダム配列のプライマーが用いられることもできる。

特定の態様において、ランダム配列プライマーのほとんどの３’末端は、デオキシチミジン（Ｔ）もしくはウリジン（Ｕ）、またはｍＲＮＡのポリＡ尾部中のアデニン（Ａ）と塩基対合することができる他のヌクレオチド類似体ではない。そのような設計は、ｍＲＮＡのポリＡ尾部からの逆転写を避けるのをさらに助けることができる。

第２および第３ポリヌクレオチドの３’末端の５’または３’オーバーハング（第１および第２ライゲーション適合末端）は、それらが互いにアニーリングするように相補的であるように設計されている。第２および第３ポリヌクレオチド中のオーバーハング領域の長さは、同じであることができるが、同じである必要はない。特定の態様において、両方のポリヌクレオチドのオーバーハング領域中の約２、３、４、５、６、７、８個、またはより多くのヌクレオチドは、相補的であり、塩基対（ワトソン−クリックまたはゆらぎ塩基対）を形成することができる。

特定の態様において、ＲＮＡリンカー上の第１二本鎖領域の長さは、約６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０塩基対、またはより多くの塩基対である。

特定の態様において、ＤＮＡリンカー上の第２二本鎖領域の長さは、約６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０塩基対、またはより多くの塩基対である。

特定の態様において、ライゲーションされたＲＮＡ−ＤＮＡリンカー中の第１および第２二本鎖領域の合計の長さは、約１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０塩基対、またはより多くの塩基対である。

特定の態様において、第１二本鎖領域は、第１制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第１認識部位を含むことができる。ＲＥ認識部位は、ＲＥが切断する際に、それがＲＥ部位の外側、ランダム配列プライマーに対して３’側を切断するように、戦略的に配置されることができる。これは、ＲＮＡリンカーに連結されたＲＮＡタグの生成を可能にする。例えば、ＭｍｅＩ認識部位は、第１二本鎖領域の末端に、第１二本鎖領域の他方の末端（そこでＲＮＡリンカーおよびＤＮＡリンカーが、それらのそれぞれの３’オーバーハング領域を介して連結されている）に対して遠位に配置されることができる。ＭｍｅＩ部位は、ＭｍｅＩが切断する際に、２ｂｐのオーバーハングを有する１８ｂｐの断片を含むＲＮＡタグが、連結されたｎｃＲＮＡ由来のｃＤＮＡにおいて生成されるような方向性であるように設計される。しかし、ＲＥ部位の配置は、第１二本鎖領域の末端である必要はない。より内側の配置は、対応してより短いＲＮＡタグ配列を生成する。

特定の態様において、（第１（ＩＩ型）制限酵素に関する）第１認識部位の最後のヌクレオチドは、ランダム配列プライマーに対して５’側の最後の塩基対合したヌクレオチドである。

同様に、特定の態様において、第２二本鎖領域は、第２制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第２認識部位を含むことができ、それは、第２ＲＥ認識部位に対して３’側であり第３ポリヌクレオチドに対して５’側を切断することができる。ＲＥ認識部位の方向性は、それが連結されたゲノムＤＮＡの末端配列に基づくＤＮＡタグを生成するような様式で配置される。特定の態様において、ＲＥ部位の配置は、第２二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いＤＮＡタグ配列を生成する。

特定の態様において、（第２（ＩＩ型）制限酵素に関する）第２認識部位の最後のヌクレオチドは、平滑末端における塩基対合したヌクレオチドである。
特定の態様において、第１および第２（ＩＩ型）制限酵素は同じである。他の態様において、第１および第２（ＩＩ型）制限酵素は異なる。

比較的長いタグ配列を生成するＲＥ、例えばＩ型またはＩＩＩ型ＲＥに関して、第１および第２ＲＥ認識配列の方向性は、ＲＮＡリンカー中のＲＥ部位がＤＮＡタグの生成を方向付け、一方でＤＮＡリンカー中のＲＥ部位がＲＮＡタグの生成を方向付けるように、逆転することができる。

２つの認識部位を認識するＲＥ（例えばＩＩＢ型ＲＥ）に関して、ＲＮＡおよびＤＮＡリンカーが設計されたように正しくライゲーションされて完全なＲＥ認識部位を再構成した場合にのみＲＥが切断するように、ＲＥ部位の一方がＲＮＡリンカー中にあることができ、他方がＤＮＡリンカー中にあることができる。

本発明に従って用いられることができる適切な制限酵素は、下記でより詳細に記載される。特定の態様において、第１または第２制限酵素に関する切断部位は、認識部位の最後のヌクレオチドに対して少なくとも約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０ヌクレオチドまたはより多くのヌクレオチド３’側である。

特定の態様において、ＲＮＡリンカー、ＤＮＡリンカー、または両方は、ＲＮＡタグまたはＤＮＡタグを生成するための制限酵素認識部位を有しない。
特定の態様において、第１、第２、第３、および第４ポリヌクレオチドの１つ以上は、ＤＮＡであり（例えば全てがＤＮＡであり）、またはＤＮＡおよびＲＮＡヌクレオチドの両方を含む。他の態様において、それらの全てがＲＮＡであることができる。

特定の態様において、第１、第２、第３、および第４ポリヌクレオチドの１つ以上は、修飾ヌクレオチドを含むことができる。修飾ヌクレオチドは、５’末端、３’末端に、および／または内部の位置にあることができる。

特定の態様において、修飾ヌクレオチドは、ビオチン化されたヌクレオチド、例えばビオチン化されたｄＴ（デオキシチミジン）である。ビオチン化されたヌクレオチドの存在は、そのようなビオチン化されたヌクレオチドの１個以上を含むポリヌクレオチドの、例えばビオチン結合パートナー、例えばアビジンまたはストレプトアビジンにコンジュゲートした樹脂、アガロース、ナノ粒子、金属または磁性ビーズを用いることによる親和性精製を可能にする。次いで、そのようなビーズは、磁石により分離されることができる。ビオチン化されたヌクレオチドは、ＲＮＡリンカー、ＤＮＡリンカー、または両方の中に存在することができる。この技法は、高スループット次世代配列決定、例えば単分子リアルタイム配列決定（ＰａｃｉｆｉｃＢｉｏ）；イオン半導体（ＩｏｎＴｏｒｒｅｎｔ配列決定）；パイロ配列決定（ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ）（４５４）；合成による配列決定（Ｉｌｌｕｍｉｎａ）；ライゲーションによる配列決定（ＳＯＬｉＤ配列決定）；ポロニー配列決定（ｐｏｌｏｎｙｓｅｑｕｅｎｃｉｎｇ）；大規模並行署名配列決定（ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｉｇｎａｔｕｒｅｓｅｑｕｅｎｃｉｎｇ）（ＭＰＳＳ）；ＤＮＡナノボール配列決定；Ｈｅｌｉｓｃｏｐｅ単分子配列決定と組み合わせられることもでき、またはカラービーズもしくはレーザーもしくはＦＡＣＳベースの選別のための他の抗体を用いるＬｕｍｉｎｅｘ型システムと共に用いられることもできる。

特定の態様において、修飾ヌクレオチドは、第１鎖ｃＤＮＡを逆転写により合成するランダムプライマーの能力を、例えばランダムプライマーとｎｃＲＮＡの３’末端の間のハイブリダイゼーションの安定性および／または特異性を高めることにより高める。

特定の態様において、ランダムプライミング配列は、天然に存在するＤＮＡおよびＲＮＡ中にある一般的に用いられる２’−デオキシ−Ｄ−リボースまたはＤ−リボース以外の糖を含有する少なくとも１個のヌクレオチド、例えば糖が側鎖基の付加または置換により修飾されているヌクレオチド、または糖が天然に存在するＤＮＡおよびＲＮＡ中にある一般的に用いられる２’−デオキシ−Ｄ−リボースもしくはＤ−リボースの立体異性体であるヌクレオチド、または両方を含むことができる。米国特許第６，７９４，１４２号（本明細書に参照により援用される）を参照。そのような修飾ヌクレオチドは、ランダムプライミング配列の３’末端に、またはその付近にあることができる。一態様において、修飾ランダムプライマー配列は、本質的に、３個の３’末端ヌクレオチドの少なくとも１個が２’−Ｏ−メチル−ヌクレオチド、２’−アミノ−ヌクレオチド、および２’−フルオロ−ヌクレオチドからなる群から選択される修飾ヌクレオチドであるオリゴヌクレオチドからなる。一態様において、修飾プライマー配列は、本質的に、３個の３’末端ヌクレオチドの少なくとも１個が２’−Ｏ−メチル−リボヌクレオチド、２’−デオキシ−２’−アミノ−ヌクレオチド、および２’−デオキシ−２’−フルオロ−ヌクレオチドからなる群から選択される修飾ヌクレオチドであるオリゴヌクレオチドからなる。これらの修飾は、部分の２’ＯＨへの付加、または代替部分による２’−ＯＨの置換を表す。

特定の態様において、ランダムプライミング配列は、１個以上のＬＮＡまたはＰＮＡを含む。ＲＮＡ中の異常に熱力学的に安定な構造断片、例えばヘアピンの存在は、プライマー伸長を実施するのをほぼ不可能にし得る。ＤＮＡプライマーのＬＮＡ修飾プライマーによる置き換えは、この限界を克服することができる（Fratczak et al., Biochemistry, 48(3):514-6, 2009; Uppuladinne et al., Biomol. Struct. Dyn., 31(6):539-60, 2013を参照）。

他の修飾ヌクレオチド、例えばヌクレオチド間結合をヌクレアーゼ分解に耐性にするチオホスフェート（またはホスホロチオエート、ＰＳ_４−ｘＯ_ｘ ^３−（ｘ＝０、１、２、または３）の一般化学式を有する化合物および陰イオンのファミリー）修飾、モルホリノオリゴヌクレオチド、２’Ｆ−ＡＮＡ、２’−Ｏ−アルキル等も、リンカーの安定性およびヌクレアーゼ耐性能力を高めるためにリンカーに組み込まれることができる。Verma & Eckstein, “Modified oligonucleotides: synthesis and strategy for users,” Annu. Rev. Biochem., 67:99-134, 1998（本明細書に参照により援用される）を参照。

特定の態様において、ＲＮＡリンカーおよび／またはＤＮＡリンカーは、ＲＮＡリンカーをＤＮＡリンカーから、またはＲＮＡ／ＤＮＡリンカーを他のＲＮＡ／ＤＮＡリンカーから（例えば、２セット以上のＲＮＡリンカーが一緒に用いられる場合に）区別する独特の配列（例えば“バーコード”）を含むことができる。例えば、第１および／または第２二本鎖領域（単数または複数）は、ＲＮＡリンカーをＤＮＡリンカーから区別する独特の配列を含むことができる。そのようなバーコードは、単純に独特の配列の短い一続き、例えば２、３、４、５、６、７、８、９、１０ヌクレオチド配列（またはより多く）であることができる。特定の態様において、ＲＮＡリンカーおよびＤＮＡリンカーの配列における違いは、ＲＮＡリンカーをＤＮＡリンカーから区別するために十分であることができる。特定の態様において、ＲＮＡリンカーのみまたはＤＮＡリンカーのみが、独特の配列／バーコードを有する。特定の態様において、ＲＮＡリンカーおよびＤＮＡリンカーの両方が、それらのそれぞれの独特の配列／バーコードを有する。

特定の態様において、第１ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第２ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第３ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第４ポリヌクレオチドは、脱リン酸化されている。脱リン酸化は、ポリヌクレオチドまたはＤＮＡ／ＲＮＡリンカーの自己ライゲーション、例えばそれぞれが同じクロマチン断片中の染色体ＤＮＡ断片にライゲーションしている可能性がある２個のＤＮＡリンカーの平滑末端による自己ライゲーションを避けるのを助けることができる。加えて、リンカーまたはリンカーのライゲーション可能な末端が脱リン酸化されている場合、リンカーはライゲーションしてダイマーまたはリンカーのコンカテマーを形成しそうにないと予想される。さらに、ＤＮＡリンカーは、染色体ＤＮＡ分子のリン酸化された末端にライゲーションすることができるが、染色体ＤＮＡ分子の末端を、それらがリン酸化されるまで、ライゲーションして繋ぎ合わせることができないと予想される。

代替の態様において、第１および第２ポリヌクレオチドは、ハイブリダイズしてＲＮＡリンカーを形成することができ、それは、一方の末端において、第１ヌクレオチドのランダムプライミング配列を含む３’オーバーハングを有し、他方の末端において、制限酵素に関する認識部位を含む第１ライゲーション適合部位を有する。同様に、第３および第４ポリヌクレオチドは、ハイブリダイズしてＤＮＡリンカーを形成することができ、それは、一方の末端において、染色体断片の遊離末端にライゲーションするための平滑末端を有し、他方の末端において、同じ制限酵素に関する認識部位または適合するライゲーション可能な末端を生成する適合する制限酵素に関する認識部位を含む第２ライゲーション適合末端を有する。従って、制限酵素および／またはその適合するＲＥによる消化は、ＤＮＡおよびＲＮＡリンカーをライゲーションするために用いられることができるオーバーハング（３’または５’オーバーハングであることができるであろう）を生成する。

この態様において、制限酵素消化の前に、ＤＮＡおよびＲＮＡリンカーの末端は、ライゲーション可能であってはならず（例えば、ＲＮＡリンカーは、５’オーバーハングを有することができ、ＤＮＡリンカーは、３’オーバーハングの平滑末端を有することができ、または逆もまた同様である）、そのような末端は、さらに脱リン酸化されていてよい。ＲＥ消化後、ＤＮＡおよびＲＮＡリンカーの末端においてライゲーション可能な末端が、適切なリン酸化を伴って生成される。次いで、ＤＮＡおよびＲＮＡリンカー（単数または複数）のライゲーション可能な末端は、ライゲーションされることができる。制限後のライゲーション可能な末端は、平滑末端であることができ、または５’もしくは３’オーバーハングを有する付着末端を有することもできる。特に、稀にしか切断しない制限酵素が、核酸物質を意図されない位置で切断する可能性を低減するために、および／または非常に短い断片を生成するために、用いられることができる。

対象ポリヌクレオチドは、以下のような方法による直接化学合成を含むあらゆる適切な方法により調製されることができる：Narang et al., 1979, Meth. Enzymol., 68:90-99のホスホトリエステル法；Brown et al., 1979, Meth. Enzymol., 68:109-151のホスホジエステル法；Beaucage et al., 1981, Tetrahedron Lett., 22:1859-1862のジエチルホスホルアミダイト法；および米国特許第４，４５８，０６６号の固体支持体法、それぞれ参照により本明細書に援用される。オリゴヌクレオチドおよび修飾ヌクレオチドのコンジュゲートの合成法の総説が、本明細書に参照により援用されるGoodchild, 1990, Bioconjugate Chemistry, 1(3):165-187において提供されている。

本発明の方法を実施するための１種類以上の追加の試薬も、本発明のキットに含まれていることができる。
特定の態様において、キットは、さらにタンパク質およびポリヌクレオチドを架橋する試薬、例えばホルムアルデヒド（例えば１％ホルムアルデヒド）を含む。

特定の態様において、キットは、さらにクロマチンの構成要素（例えばヒストンまたは対象の特定のｎｃＲＮＡ）に特異的にまたは選択的に結合する親和性試薬を含む。例えば、親和性試薬は、抗体（例えばモノクローナル抗体）、または機能性抗原結合断片もしくはその誘導体のいずれかであることができる。親和性試薬は、クロマチンのポリヌクレオチド構成要素にハイブリダイズする／結合することができるポリヌクレオチド（例えばアンチセンスポリヌクレオチド）であることもできる。アンチセンスポリヌクレオチドは、その後のアンチセンスポリヌクレオチドおよびその相補的標的配列の間で形成されるハイブリダイゼーション複合体の捕捉を促進するために標識されることができる。例えば、標識は、アビジンまたはストレプトアビジンでコートされたビーズにより捕捉されることができるビオチン標識（例えばビオチン化されたＵまたはＴ）であることができる。アンチセンスポリヌクレオチドは、固体支持体上で、例えばマイクロビーズまたはナノ粒子の表面上で固定されることもでき、それは、相補的標的配列の親和性捕捉のために、カラム中に充填されることができ、またはバッチ混合物中で用いられることもできる。

特定の態様において、キットは、さらに、損傷した、または不適合な５’および／または３’突出末端を含有するＤＮＡをリン酸化された平滑末端ＤＮＡに変換する末端修復混合物を含む。そのような試薬は、容易に商業的に入手可能であり、例えばＥｐｉｃｅｎｔｒｅからのＥｎｄ−Ｉｔ（商標）ＤＮＡ末端修復キットである。

特定の態様において、キットは、さらにＤＮＡリガーゼ（例えば、様々な商業的な源、例えばＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ）からのＴ４ＤＮＡリガーゼ）を含む。

特定の態様において、キットは、さらに、タンパク質およびポリヌクレオチドの架橋を逆行させる試薬（例えば、様々な商業的な源、例えばＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ）からのプロテイナーゼＫ）を含む。

特定の態様において、キットは、さらに、第１および／または第２制限酵素（単数または複数）、ならびに場合によりＲＥ消化に必要なあらゆる適切な緩衝剤または補助因子を含む。

特定の態様において、キットは、さらに、平滑末端二本鎖ＤＮＡのＰＣＲ増幅のためのコンカテマー化アダプターの対を含む。アダプターは、コンカテマー化に有用な制限酵素部位を含むことができ、ＰＣＲ増幅に適したＰＣＲプライマー配列を含むことができる。

特定の態様において、キットは、さらに、ＰＣＲ増幅のためのＴａｑＤＮＡポリメラーゼ、または他の増幅の形態（例えばローリングサークル増幅）に必要な他のＤＮＡポリメラーゼを含む。

特定の態様において、キットは、さらに、第１鎖ｃＤＮＡ合成のための逆転写酵素を含む。
本発明の別の側面は、第１および第２ライゲーション適合末端により連結された第１および第２二本鎖領域を含む中央領域を含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドを提供し、前記の中央領域は、（１）第１二本鎖領域に近位の部位において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグ；および（２）第２二本鎖領域に近位の部位において、ゲノムＤＮＡの配列タグにより隣接されている。

そのようなＰＥＴポリヌクレオチドは、ＲＮＡタグおよびＤＮＡタグの両方を含み、それぞれが、それぞれのｎｃＲＮＡおよびゲノムＤＮＡの末端配列に由来する（ペアエンドタグ）。合わせて、ペアエンドタグは、ｎｃＲＮＡおよびゲノムＤＮＡ断片が染色体断片中で互いに近接している観察された事象または出来事を表す。

特定の態様において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグは、第１制限酵素による消化の結果もたらされる遊離末端を有する。
制限酵素は、上記の制限酵素、例えばＩＩ型ＲＥ（ＩＩＳ型、ＩＩＢ型、ＩＩＧ型等）、Ｉ型ＲＥ、またはＩＩＩ型ＲＥのいずれであることもでき、それはそれらの認識部位の外側を消化することができる。あるいは、遊離末端は、ｎｃＲＮＡに対応するｃＤＮＡ上に天然に存在するＲＥ部位により生成されることもできる。好ましくは、ＲＥは、中央領域の配列に基づいて、ＲＥが中央領域の内部を切断して連結されたＤＮＡリンカーおよびＲＮＡリンカーの構造を壊さないように選択される。

特定の態様において、ｎｃＲＮＡのＲＮＡ配列タグまたはゲノムＤＮＡのＤＮＡ配列タグは、物理的剪断、例えば超音波処理、水力剪断、皮下注射針を通す吸い込みの繰り返し等による剪断の結果として生じる遊離末端を有する。

特定の態様において、ｎｃＲＮＡのＲＮＡ配列タグまたはゲノムＤＮＡのＤＮＡ配列タグは、架橋されたゲノムＤＮＡまたはｎｃＲＮＡのｃＤＮＡの平均長を低減するための非特異的エンドヌクレアーゼ、例えばミクロコッカスヌクレアーゼ（ＮＥＢカタログ番号Ｍ０２４７Ｓ）、ＤＮａｓｅＩ（ＮＥＢカタログ番号Ｍ０３０３Ｓ）、または二本鎖ＤＮＡの一方の末端から進行的に消化するエキソヌクレアーゼ、またはエンドおよびエキソヌクレアーゼの組み合わせ（例えばエキソヌクレアーゼＩＩＩおよびマングビーンヌクレアーゼ）の限定的な消化の結果生じる遊離末端を有する。消化の程度（ｅｘｔｅｎｄ）は、酵素もしくは基質濃度、消化の温度および／またはｐＨ、補助因子の利用可能性、またはそれらの組み合わせを制限することにより制御され得る。適切な消化条件は、定められた長さの標準基質を用いて、そして消化の前および後に消化産物を（ＣＥ（キャピラリー電気泳動）等の電気泳動により）調べて、予め試験されることができる。

ＲＮＡまたはＤＮＡ配列タグの長さは、ｎｃＲＮＡが転写される、またはゲノムＤＮＡが位置するゲノム領域を独特に同定するために十分であるべきである。例えば、非コードＲＮＡ（ｎｃＲＮＡ）のＲＮＡ配列タグおよび／またはＤＮＡ配列タグは、高等真核生物の比較的複雑なゲノムに関して約１０〜１００塩基対の長さ（または１５〜５０ｂｐ、２０〜４０ｂｐ、２０〜３０ｂｐ、２０〜２５ｂｐ）であることができるが、細菌または低級真核生物の比較的単純なゲノムに関してはより短くてよい（例えば６〜１０ｂｐ、８〜１０ｂｐ、８〜１２ｂｐ）。

関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドの２つ以上のメンバーを含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドライブラリーを提供し、ここで、ＰＥＴライブラリーのそれぞれのメンバーは、同じ中央領域、および非コードＲＮＡ（ｎｃＲＮＡ）の異なるＲＮＡ配列タグ、ゲノムＤＮＡの異なるＤＮＡ配列タグ、または両方を含む。

さらに別の関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
特定の態様において、ベクターは、複数のコンカテマー化された対象ＰＥＴポリヌクレオチドを含む。

本発明の別の側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；（２）本発明のＲＮＡリンカーおよびＤＮＡリンカーを用いて、架橋されたゲノムＤＮＡ断片の末端を架橋されたｎｃＲＮＡのｃＤＮＡの末端に近接ライゲーションに関する条件下でライゲーションし、ここで架橋されたゲノムＤＮＡ断片の末端はＤＮＡリンカーにライゲーションされ、架橋されたｎｃＲＮＡのｃＤＮＡの末端はＲＮＡリンカーを含み；（３）本発明のＰＥＴポリヌクレオチドを配列決定分析のために単離し；そして、（４）それぞれのＰＥＴポリヌクレオチド内のゲノムＤＮＡの配列タグおよびｎｃＲＮＡの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

特定の態様において、本発明の方法は、生きた細胞、例えば組織培養細胞または新しく解剖された組織から単離された細胞を用いて実施される。特定の態様において、生きた細胞中のｎｃＲＮＡおよびゲノムＤＮＡは、ホルムアルデヒドおよび／またはＥＧＳ（エチレングリコールビス［スクシンイミジルスクシネート］）に媒介される架橋により架橋される。タンパク質−ＤＮＡ、タンパク質−ＲＮＡおよび／またはタンパク質−タンパク質を架橋するのに適した他の類似の二官能性架橋試薬（例えば、アミドおよび／またはチオール基と反応するのに適した２以上の反応性化学基を有する二官能性架橋試薬）が用いられることもできる。ＥＧＳが用いられる場合、２つのＮＨＳ−エステル間のスペーサー領域は、１２原子のスペーサーであることができるが、より長い、またはより短いスペーサー（例えば、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０原子のスペーサー）が用いられることもできる。

ホルムアルデヒドまたはＥＧＳ（典型的には約１〜２ｍＭ、または１．５ｍＭ）が用いられる場合、ＥＧＳがまず添加され、続いて（約１％）ホルムアルデヒドが添加されることができる。反応は、グリシンにより停止されることができる。あるいは、約１％ホルムアルデヒドまたは約１％グルタルアルデヒドが用いられることができる。

他の態様において、核酸は、紫外線架橋によりクロマチンに架橋される。例えば、組織培養細胞は、約１５０ｍＪ／ｃｍ^２において、２５４ｎｍにおいて（例えば、紫外線架橋装置、例えばＳＴＲＡＴＡＬＩＮＫＥＲ（登録商標）紫外線架橋装置を用いることにより）紫外線架橋されることができる。

例えば、約１〜２×１０^８個の生きた組織培養細胞または単離された細胞は、まず収集され、室温において振盪しながら４０分間ＥＧＳで架橋され、次いで１０分間ホルムアルデヒド（約１％の終濃度；Ｓｉｇｍａ）で架橋されることができる。

プロテイナーゼ阻害剤および／またはＲＮａｓｅ阻害剤が、非特異的プロテイナーゼまたはＲＮａｓｅ消化を防ぐために添加されることができる。
次いで、細胞が適切な溶解緩衝液（例えば、５０ｍＭＨＥＰＥＳ、１ｍＭＥＤＴＡ、０．１５ＭＮａＣｌ、１％ＳＤＳ、１％ＴｒｉｔｏｎＸ−１００、０．１％デオキシコール酸ナトリウム、全てＡｍｂｉｏｎからのもの）中で溶解される。

一度架橋工程が完了したら、様々な方法が、架橋されたゲノムＤＮＡおよびｎｃＲＮＡを含むクロマチン断片を生成するために用いられることができる。
例えば、特定の態様において、クロマチン断片は、物理的剪断、例えば超音波処理、水力剪断、または皮下注射針を通す吸い込みの繰り返しにより生成される。超音波処理は、クロマチン線維を破壊してＲＮＡ、ＤＮＡおよびタンパク質構成要素を含む係留複合体にする一方で、偽の、ランダムな、または弱いｎｃＲＮＡ−クロマチン−ＤＮＡ相互作用を“振るい落とす”ために有利であり得る。

あるいは、特定の態様において、クロマチン断片は、適切な長さのＲＮＡおよびＤＮＡタグを生成するために、制御された条件下での制限酵素消化、または部分的もしくは限定的エンドおよび／またはエキソヌクレアーゼ消化により生成されることができる。

架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を生成するため、クロマチンは、超音波処理（例えば、Ｂｒａｎｓｏｎ４５０超音波細胞破砕装置を使用、２０％機関効率電力出力（ｄｕｔｙｐｏｗｅｒｏｕｔｐｕｔ）、３０秒、５〜８回で操作；またはプローブ超音波処理器を使用、３５％出力で２０秒オン／３０秒オフのサイクルで１．５分間操作）により可溶化されることができる。

他の商業的に入手可能な機器が、超音波処理のために用いられることができる。例えば、Ｃｏｖａｒｉｓ，Ｉｎｃ．からのＳ２２０Ｆｏｃｕｓｅｄ−超音波処理器は、ＡｄａｐｔｉｖｅＦｏｃｕｓｅｄＡｃｏｕｓｔｉｃｓ（商標）（ＡＦＡ）技術をＤＮＡ、ＲＮＡ、およびクロマチンの剪断のために利用する。製造業者によれば、そのソフトウェアは、標準的な方法、例えばＤＮＡの特定の断片長への剪断のための様々な予め設定されたプロトコルを組み込んでいる。あるいは、ベンチトップ超音波処理装置であるＢＩＯＲＵＰＴＯＲ（登録商標）ＵＣＤ−２００（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＣｏｒｐ．）も、超音波処理剪断のために用いられることができる。その装置は、水槽の下に配置された高出力超音波生成素子からなり、（プローブ超音波処理器と類似した）２０ｋＨｚの周波数で作動して、ＣｈＩＰ、ＭｅＤＩＰ等のような標準化されたプロトコルに適した自動化された超音波処理工程を提供する。

一度剪断されたら、クロマチンは、ＳＤＳ濃度を（例えば約０．１〜０．５％まで）下げるために（例えば１０倍）希釈される。次いで、抽出物は、（例えば４℃で１４，０００ｒｐｍにおいて１０分間の）遠心分離により澄んだ状態になる。この抽出物は、使用まで−８０℃で保管されることができる。

免疫沈降が所望される場合、約２μｇの（クロマチン構成要素に特異的な）モノクローナル抗体が、プロテインＧセファロース（Ｐｈａｒｍａｃｉａ）に結合することができる。次いで、抗体でコートされたビーズは、クロマチン抽出物と共に４℃で１６時間インキュベートされる。次いで、ビーズは洗浄される（例えばＳｉｇｍａＣｈｅｍｉｃａｌＣｏｍｐａｎｙからの以下の試薬による：洗浄緩衝液１（５０ｍＭＨＥＰＥＳ、１ｍＭＥＤＴＡ、０．１５ＭＮａＣｌ、０．１％ＳＤＳ、１％ＴｒｉｔｏｎＸ−１００、０．１％デオキシコール酸ナトリウム）；洗浄緩衝液２（５０ｍＭＨＥＰＥＳ、１ｍＭＥＤＴＡ、０．５ＭＮａＣｌ、０．１％ＳＤＳ、１％ＴｒｉｔｏｎＸ−１００、０．１％デオキシコール酸ナトリウム）で２回；洗浄緩衝液３（２０ｍＭトリス．ＨＣｌｐＨ８．０、１ｍＭＥＤＴＡ、０．２５ＭＬｉＣｌ、０．５％ＮＰ４０、０．５％デオキシコール酸ナトリウム）で１回；洗浄緩衝液４（２０ｍＭトリス．ＨＣｌｐＨ８．０、１ｍＭＥＤＴＡ）で１回）。次いで、タンパク質−ＤＮＡ複合体が、ビーズから溶離緩衝液（例えば、５０ｍＭトリス．ＨＣｌｐＨ８．０、１ｍＭＥＤＴＡ、１％ＳＤＳ）により６５℃で２０分間溶離される。次いで、溶離液は、ＳＤＳを除去するために、ＰＢＳ（Ａｍｂｉｏｎ）中で（例えば４℃で３時間）透析される。

場合により、クロマチン断片は、（例えばＥＺｌｉｎｋヨードアセチル−ＰＥＧ２−ビオチン（ＩＰＢ）（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、カタログ番号２１３３４）を用いることにより）ビオチン化され、ストレプトアビジンビーズに結合したクロマチン断片として単離されることもできる。例えば、ストレプトアビジンを有するＤＹＮＡＢＥＡＤＳ（登録商標）（ＤＹＮＡＢＥＡＤＳ（登録商標）ＭｙＯｎｅ（商標）ストレプトアビジンＣ１／Ｔ１）が、ビオチン化されたクロマチン断片を富化するために用いられることができる。

加えて、シリカ様コーティングを有するビーズが、クロマチン断片上の架橋された核酸を富化するために用いられることができる。
クロマチン断片は、剪断またはＲＥ消化後、損傷した末端または他の点でＤＮＡリンカーとのライゲーションに適していない末端を有し得る。従って、末端修復が、例えばＥｐｉｃｅｎｔｒｅからのＥｎｄ−ＩｔキットまたはＴ４ポリメラーゼ（Ｐｒｏｍｅｇａ，Ｒ０１９１）を用いて、製造業者の提案に従って実施されることができる。

第１鎖ｃＤＮＡ合成は、逆転写酵素およびＲＮＡリンカー（または下記の第２の特定の態様における修飾ＲＮＡリンカー）、例えばＳｕｐｅｒｓｃｒｉｐｔＩＩＩ第１鎖合成システム（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１８０８００５１）を用いて実施されることができる。

次いで、その平滑末端において５’リン酸化を有する修復されたクロマチンＤＮＡは、ＤＮＡリンカーとのライゲーションにおいて用いられることができる。これは、ＤＮＡライゲーションに関する適切な緩衝液および他の反応条件が提供される限り、ＲＮＡリンカーを用いる逆転写のための容器と同じ容器中で実施されることができる。ＤＮＡリガーゼ、例えばＴ４ＤＮＡリガーゼが、この反応のために用いられることができる。必要であれば、次いで、脱リン酸化されたＤＮＡリンカーは、（例えばＴ４ポリヌクレオチドキナーゼにより）リン酸化されることができる。

特定の態様において、第１鎖ｃＤＮＡ合成は、ＲＮＡリンカーを用いて実施される（ＤＮＡリンカーライゲーションの前もしくは後またはそれと同時のいずれでもよい）。
特定の態様において、架橋されたｎｃＲＮＡのｃＤＮＡは、ＲＮＡリンカーのランダム配列プライマーおよびｎｃＲＮＡ鋳型から逆転写された第１鎖ｃＤＮＡを含む。ＲＮＡリンカーの存在により、この第１鎖ｃＤＮＡおよびｎｃＲＮＡ鋳型のハイブリッド分子は、既に染色体ＤＮＡ断片の遊離末端にライゲーションされたＤＮＡリンカーにライゲーションされることができる。

一度ＲＮＡリンカーおよびＤＮＡリンカーが標的核酸のそれらのそれぞれの末端に適切にライゲーションされたら、同じクロマチン断片上のＤＮＡリンカーおよびＲＮＡリンカーを連結するために近接ライゲーションが実施されることができる。近接ライゲーションは、通常は、同じクロマチン断片上のＲＮＡおよびＤＮＡリンカーがライゲーションされる可能性が、それらの互いに対する近接のために、異なるクロマチン断片上のＲＮＡおよびＤＮＡリンカーと比較して遥かに高いように、希釈された環境において実施される。

特定の態様において、近接ライゲーションは、リンカーライゲーション工程に関して約２、３、４、５、６、７、８、９、１０、１２、１３、１４、１５、１６、７０、１８、１９、２０倍の希釈度またはより高い希釈度で実施される。

特定の態様において、近接ライゲーションは、約１×１０^８個のヒト細胞に由来する捕捉されたクロマチン断片のそれぞれの相当量に関して、約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０ｍＬまたはより多くの総ライゲーション体積で実施される。ライゲーション体積は、細胞のタイプ（例えば、由来の種またはゲノムサイズ）に基づいて適宜調節されることができる。

近接ライゲーション条件は、必要に応じて、ＤＮＡおよびＲＮＡリンカーのライゲーションを最大化するように修正または調節されることができる。あらゆるライゲーション条件は、修正または調節されることができ、それはライゲーション反応に関する時間および／または試薬の濃度の増大または減少を含むが、それらに限定されない。換言すると、ライゲーション反応は、同じクロマチン断片に架橋された別々の核酸分子の分子間ライゲーションを最大化するように調節または修正される。特に、ライゲーションは、異なる核酸分子の末端のライゲーションを最大化し、かつ環状マルチマーの形成を低減するために、核酸分子の非常に希薄な条件下で実施されることができる。

特定の態様において、その方法は、異なるクロマチン断片に架橋されたゲノムＤＮＡおよびｎｃＲＮＡの間の望まれない、または偽陽性のライゲーション事象の程度または頻度を評価することを含む。理想的な近接ライゲーション条件下では、同じクロマチン断片に架橋されたゲノムＤＮＡおよびｎｃＲＮＡのみがライゲーションされるはずである。

例えば、ＤＮＡおよびＲＮＡリンカーのあるセット（例えばリンカーセットＡ）が、１つの反応容器中で、ゲノムＤＮＡおよびＲＮＡ末端にそれぞれライゲーションするために用いられることができる。一方で、ＤＮＡおよびＲＮＡリンカーの第２のセット（例えばリンカーセットＢ）が、第２の反応容器中で、ゲノムＤＮＡおよびＲＮＡ末端にそれぞれライゲーションするために用いられることができる。次いで、２個の反応容器の内容物が、近接ライゲーションのためにプールされる。リンカーセットＡ中のＲＮＡリンカーが、両方のリンカーセットのＤＮＡリンカーにライゲーションされ得る（そしてリンカーセットＡ中のＤＮＡリンカーは両方のリンカーセットのＲＮＡリンカーにライゲーションされ得る）場合、近接ライゲーション条件は、セットＡおよびＢのリンカー間のライゲーション（例えば、セットＡ中のＲＮＡリンカーがセットＢ中のＤＮＡリンカーにライゲーションする）が存在しないか非常に稀にしか存在しない場合に最適である。逆に、近接ライゲーション条件は、セットＡおよびＢのリンカー間で著しいライゲーションが存在する場合、最適未満である。

特定の態様において、リンカーセットＡおよびＢ中のＲＮＡおよびＤＮＡリンカーの比率は、さらに調節される（例えば、必ずしも１：１ではない）ことができる。例えば、リンカーセットＡ中のＲＮＡおよびＤＮＡリンカーの、リンカーセットＢ中のＲＮＡおよびＤＮＡリンカーと比較したモル比は、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１であることができ、逆もまた同様である。

特定の態様において、本発明の第１、第２、第３、および／または第４ポリヌクレオチドは、脱リン酸化されており、ＤＮＡリンカーまたはＲＮＡリンカーは、自己ライゲーションしない。

第２鎖ｃＤＮＡ合成は、ＲＮＡリンカー−ＤＮＡリンカーライゲーションの前または後のどちらでも、例えばＳｕｐｅｒｓｃｒｉｐｔ二本鎖ｃＤＮＡ合成キット（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１１９７−０２０）を用いて完了されることができる。特定の態様において、第２鎖ｃＤＮＡ合成は、近接ライゲーションの後であるが工程（３）の前に実施される。

特定の態様において、ＤＮＡポリメラーゼ、例えばＴ４ＤＮＡポリメラーゼが、第２鎖ｃＤＮＡ合成の後に添加されることができる。
次に、クロマチン断片の架橋された核酸およびタンパク質構成要素は、プロテイナーゼＫにより架橋を逆行する（ｒｅｖｅｒｓｅｃｒｏｓｓ−ｌｉｎｋｅｄ）ことができる。典型的な反応条件では、例えば、試料は、２０μＬの分割量（ａｌｉｑｕｏｔｓ）として、１５μｌの２０ｍｇ／ｍｌプロテイナーゼＫ（Ａｍｂｉｏｎ）および場合により０．３％ＳＤＳ（Ａｍｂｉｏｎ）の存在下での６５℃における一晩インキュベーションにより、架橋を逆行することができる。次の日に、約１μＬの１０ｍｇ／ｍｌＲＮａｓｅＡ（Ｑｉａｇｅｎ）が、ＲＮＡを分解するために（例えば３７℃で４５分間）添加されることができ、続いてフェノール抽出およびＤＮＡのエタノール沈殿が行われる。

場合により、少なくとも１つの連結されて架橋を逆行した核酸分子の精製または富化が、少なくとも２つの構成要素を含む結合系を用いて実施されることができ、ここで、少なくとも１つの第１構成要素がリンカーに結合しており（例えば、例えばＲＮＡまたはＤＮＡリンカー中に組み込まれたビオチン化されたヌクレオチド）、少なくとも１つの第２構成要素が第１構成要素に結合する。構成要素は、ストレプトアビジン−ビオチン、アビジン−ビオチン、タンパク質−抗体および／または磁石／磁性物質を含むが、それらに限定されない。

特に、ビオチン化されたリンカーにライゲーションした核酸物質は、ストレプトアビジンビーズ、例えばストレプトアビジンコンジュゲート磁性ＤＹＮＡＢＥＡＤＳ（商標）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１１２０６Ｄ−１０ＭＬ）を用いて精製されることができる。ビオチン化されたリンカーを含有する核酸物質のみが、ストレプトアビジンビーズ上に固定されるであろう。別の構成要素が用いられるリンカーに結合している場合、その構成要素に適した核酸分子を精製する他のシステムが用いられることができる。

あるいは、ストレプトアビジンカラムが、ビオチン化されたビーズを捕捉するために代わりに用いられることができる。さらに別の代替案において、ビーズは、それらがＦＡＣＳ等により流れに基づく検出機器（例えばＬＵＭＩＮＥＸ（登録商標）１００（商標）、ＬＵＭＩＮＥＸ（登録商標）２００（商標）またはＢＩＯ−ＲＡＤ（登録商標）ＢＩＯ−ＰＬＥＸ（登録商標）型分析装置）上で選別または収集されることができるように、色で、または蛍光的にコートされていることができる。

結果として生じた遊離したＤＮＡは、例えばＲＥ酵素消化により対になったＤＮＡおよびＲＮＡタグを有するＰＥＴポリヌクレオチドを生成するために用いられることができる。場合により、遊離したＰＥＴポリヌクレオチドは、配列決定分析の前にさらにＰＣＲにより増幅されることができる。ＰＣＲアダプターが、ＰＣＲ増幅を実施する前に、ＰＥＴポリヌクレオチドの両方の末端に（例えばＴ４ＤＮＡリガーゼにより）ライゲーションされることができる。平滑末端の環状化されていない核酸のみが、アダプターにライゲーションされることができる。自己ライゲーションした核酸分子および環状マルチマーは、アダプターにライゲーションされることができない。

ＰＣＲアダプターは、ＰＣＲ産物の精製のための修飾ヌクレオチドも含むことができる。同様に、ストレプトアビジン−ビオチン、アビジン−ビオチン、タンパク質−抗体および／または磁石／磁性物質がこの目的のために用いられることができる。

ＰＥＴポリヌクレオチド（増幅を伴う、または伴わない）は、例えば様々な次世代配列決定、例えば４５４多重配列決定機（４５４ｌｉｆｅｓｃｉｅｎｃｅｓ）を用いる４５４配列決定に関するプロトコルに従って、直接配列決定されることができる。その技法は、Margulies et al (2005)および米国出願第２００３００６８６２９号（両方とも参照により本明細書に援用される）において教示されている。あらゆる他の高スループットまたは次世代配列決定（ＮＧＳ）法が、ＰＥＴポリヌクレオチドの配列を決定するために用いられることができる。

得られたＲＮＡ／ＤＮＡタグ配列のそれらのそれぞれのゲノム位置へのマッピングは、多くの商業的に利用可能なツール、ソフトウェア、またはサービスのいずれかを用いて実施されることができる。

一度ＰＥＴポリヌクレオチドのＲＮＡおよびＤＮＡタグが配列決定され、参照ゲノムにマッピングされたら、それぞれの連結されたＲＮＡタグおよびＤＮＡタグは、推定上のｎｃＲＮＡ−クロマチン相互作用を表す。全てのそのような観察された相互作用の集合は、参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を構成する。

特定の態様において、その方法はさらに、ゲノムＤＮＡの重複する配列タグおよびｎｃＲＮＡの重複する配列タグを有する２以上のＰＥＴポリヌクレオチドのクラスターを同定することを含む。

ＰＥＴクラスターは、ｎｃＲＮＡ−クロマチン相互作用のより信頼できる事象の繰り返される検出を反映する高い信頼度のデータであると考えられる。対照的に、ＲＮＡタグおよびＤＮＡタグの両方において他のＰＥＴ配列と重複しない単集合ＰＥＴは、弱いつながりのシグナルを表す可能性があり、ランダムなバックグラウンドノイズと区別できない可能性がある。

特定の態様において、その方法はさらに、ｒＲＮＡの配列タグを含むＰＥＴポリヌクレオチドを除外することを含む。一部のｒＲＮＡ−クロマチン−ｇＤＮＡ（ゲノムＤＮＡ）相互作用は、真に生物学的に重要であり得るが、大量（一部のデータセット中の約１／４）のｒＲＮＡ−クロマチン−ＤＮＡ相互作用の存在は、その他のより豊富でない相互作用を見えづらくする可能性がある。従って、さらなるデータ分析の前のそのようなデジタル減算は、より頻度の低いｎｃＲＮＡ−クロマチン相互作用を分析するために望ましい可能性がある。

特定の態様において、その方法はさらに、近接ライゲーション工程の前にクロマチン断片の部分集合を分離または富化することを含む。例えば、クロマチン断片の部分集合は、クロマチン断片のその部分集合のタンパク質構成要素に特異的な抗体を用いる免疫沈降により、またはクロマチン断片のその部分集合の核酸構成要素に特異的な（標識された）ポリヌクレオチドを用いるハイブリダイゼーションにより、単離または富化されることができる。これは、既知のクロマチン構成要素およびｎｃＲＮＡの間の特異的な相互作用を同定するために有用である可能性がある。

特定の態様において、タンパク質構成要素は、ヒストン、転写因子（例えば一般的な転写因子ＲＮＡＰＩＩ、ＲＮＡＰＩ、ＲＮＡＰＩＩＩ）、クロマチンを再構築するポリコーム群（ＰｃＧ）ファミリータンパク質（例えばＥＺＨ２、ならびに昆虫、哺乳類、および植物からの他のもの）；組み換えに関わる因子（例えばＰＲＤＭ９）；クロマチンインスレーターもしくはクロマチンウェーバー（例えばＣＴＣＦ）；メチルＣｐＧ結合タンパク質（例えばＭｅＣＰ２）；またはＲＮＡ結合タンパク質である。

方法のあるバリエーションにおいて、特定の標識されたｎｃＲＮＡ（例えばビオチン化）が、架橋前に細胞に添加されることができる。そのような標識されたｎｃＲＮＡは、アビジンまたはストレプトアビジンでコートされた磁性ビーズを用いることにより単離または富化されることができる。

方法のさらに別のバリエーションにおいて、対象の１以上の特定のｎｃＲＮＡに対する相補配列が、クロマチン断片に架橋されたそのような特異的なｎｃＲＮＡを（アレイまたはカラムを用いて）単離または富化するために用いられることができる。一度単離または富化されたら、そのようなクロマチン断片は、その特定のｎｃＲＮＡと相互作用するゲノムＤＮＡの領域を同定するために、その方法の残りの工程を受けることができる。

特定の態様において、その方法はさらに、１以上の観察されたｎｃＲＮＡ−クロマチン相互作用を、例えばＤＮＡ／ＲＮＡＦＩＳＨおよび免疫沈降アッセイにより検証することを含む。例えば、特定のｎｃＲＮＡが特定のゲノム座位に連結された場合、その観察を確証するために、ＤＮＡ／ＲＮＡＦＩＳＨおよび免疫沈降アッセイがそのｎｃＲＮＡを用いて実施されることができる（例えば、図４Ｂを参照）。

ｂ）修飾ＲＮＡリンカー
別の／第２の特定の態様において、本発明の方法は、同じクロマチン断片中の架橋されたＲＮＡおよび染色体ＤＮＡをライゲーションするために、１つの修飾されたＲＮＡリンカーを用いて（かつＤＮＡリンカーを用いずに）実施されることができる。

従って、本発明の別の側面は、以下のものを含む修飾ＲＮＡリンカーを提供する：（ｉ）第１ポリヌクレオチド、および（ｉｉ）第２ポリヌクレオチド、ここで、第１および第２ポリヌクレオチドは、ゲノムＤＮＡライゲーション適合末端および第１ポリヌクレオチドの３’末端における３’オーバーハングにより隣接される二本鎖領域を形成し、ここで、３’オーバーハングはランダムプライマー配列を含む。

本発明のこの側面によれば、第１ポリヌクレオチドの３’末端における３’オーバーハングは、小節ａ）（ＲＮＡおよびＤＮＡリンカー対）において記載された特定の態様におけるＲＮＡリンカーの機能と類似した機能を有し、一方でゲノムＤＮＡライゲーション適合末端は、同じクロマチン断片に架橋された平滑末端ゲノムＤＮＡをライゲーションするために用いられることができる。

特定の態様において、ライゲーション適合末端は、架橋されたゲノムＤＮＡ断片の平滑末端に対する直接のライゲーションのために平滑末端化されることができる。
別の態様において、ライゲーション適合末端は、制限酵素部位を含むことができ、それは、ＲＥにより切断されて、架橋されたゲノムＤＮＡ断片の平滑末端へのライゲーションに必要な必須の平滑末端を生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ（例えば、自己リン酸化を防ぐための脱リン酸化された平滑末端）、または自己ライゲーションを防ぐ非適合性オーバーハングを有することもできる。

特定の態様において、修飾ＲＮＡリンカーは、その３’オーバーハングまたはそのライゲーション適合末端のどちらによっても自己ライゲーションしない。
第１および第２ポリヌクレオチドは、別々の容器中で、例えば合成されたポリヌクレオチドとして提供されることができ、それは凍結乾燥された（ｆｒｅｅｚｅｄｒｉｅｄ，ｌｙｏｐｈｉｌｉｚｅｄ）形態または水もしくは適切な緩衝溶液中のどちらでもよい。あるいは、第１および第２ポリヌクレオチドは、同じ容器中（凍結乾燥状態または溶液中）で、例えば１：１のモル比で、それらが予めアニーリングされた修飾ＲＮＡリンカーとして用いられることができるように、組み合わせられることができる。

第２ポリヌクレオチドは、実質的に均質または純粋であり（例えば、同じ容器内の個々のポリヌクレオチド分子は、同じである）、一方で、３’オーバーハング領域中の第１ポリヌクレオチドの３’末端は、ランダム配列プライマーを含む。

関連する態様において、第１ポリヌクレオチドは、その定められた３’末端配列を有する特定のｎｃＲＮＡから特異的に第１鎖ｃＤＮＡ合成を開始するために、ランダム配列プライマー領域において同じマッチする配列を均質に含有していることができる。

特定の態様において、二本鎖領域は、第１制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第１制限部位を含むことができる。ＲＥ認識部位は、ＲＥが切断する際に、それがＲＥ部位の外側、ランダム配列プライマーに対して３’側を切断するように、戦略的に配置されることができる。これは、ＲＮＡリンカーに連結されたＲＮＡタグの生成を可能にする。例えば、ＭｍｅＩ認識部位は、二本鎖領域の末端に、ランダム配列プライマーを含む３’オーバーハングに対して近位に配置されることができる。ＭｍｅＩ部位は、ＭｍｅＩが切断する際に、２ｂｐのオーバーハングを有する１８ｂｐの断片を含むＲＮＡタグが、連結されたｎｃＲＮＡ由来のｃＤＮＡにおいて生成されるような方向性であるように設計される。しかし、ＲＥ部位の配置は、第１二本鎖領域の末端である必要はない。より内側の配置は、対応してより短いＲＮＡタグ配列を生成する。

特定の態様において、二本鎖領域は、ライゲーション適合末端において、またはその付近に、第２制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第２制限部位を含むことができる。ＲＥは、第２ＲＥ認識部位に対して３’側であり第１ポリヌクレオチドに対して５’側（例えば、ライゲーションされたゲノムＤＮＡ中）を切断することができる。ＲＥ認識部位の方向性は、それが、連結されたゲノムＤＮＡの末端配列に基づいてＤＮＡタグを生成するような方式で配置される。特定の態様において、ＲＥ部位の配置は、二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いＤＮＡタグ配列を生成する。

特定の態様において、（第２（ＩＩ型）制限酵素に関する）第２認識部位の最後のヌクレオチドは、ライゲーション適合性／平滑末端における塩基対合したヌクレオチドである。

特定の態様において、修飾ＲＮＡリンカーは、ＲＮＡタグまたはＤＮＡタグを生成するための制限酵素認識部位を有しない。
特定の態様において、修飾ＲＮＡリンカーは、その修飾ＲＮＡリンカーを他の修飾ＲＮＡリンカー（単数または複数）から区別する独特の配列（例えば“バーコード”）を含むことができる。

特定の態様において、第１および／または第２ポリヌクレオチドは、脱リン酸化されている。
本発明の別の側面は、以下：（１）ランダム配列プライマーに対して近位の部位において非コードＲＮＡ（ｎｃＲＮＡ）の配列タグ；および（２）ライゲーション適合末端に対して近位の部位においてゲノムＤＮＡの配列タグにより隣接されている（修飾ＲＮＡリンカーの）二本鎖領域を含む中央領域を含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドを提供する。

関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドの２以上のメンバーを含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドライブラリーを提供し、ここで、ＰＥＴライブラリーのそれぞれのメンバーは、同じ中央領域、および非コードＲＮＡ（ｎｃＲＮＡ）の異なるＲＮＡ配列タグ、ゲノムＤＮＡの異なるＤＮＡ配列タグ、または両方を含む。

さらに別の関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
本発明の別の側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；（２）本発明の修飾ＲＮＡリンカーを用いて、架橋されたゲノムＤＮＡ断片の末端を架橋されたｎｃＲＮＡのｃＤＮＡの末端に近接ライゲーションに関する条件下でライゲーションし、ここで架橋されたゲノムＤＮＡ断片の末端は修飾ＲＮＡリンカーのライゲーション適合末端にライゲーションされ、架橋されたｎｃＲＮＡのｃＤＮＡの末端は修飾ＲＮＡリンカーを含み；（３）本発明のＰＥＴポリヌクレオチドを配列決定分析のために単離し；そして、（４）それぞれのＰＥＴポリヌクレオチド内のゲノムＤＮＡの配列タグおよびｎｃＲＮＡの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

特定の態様において、架橋されたｎｃＲＮＡのｃＤＮＡは、修飾ＲＮＡリンカーのランダム配列プライマーおよびｎｃＲＮＡ鋳型から逆転写された第１鎖ｃＤＮＡを含む。修飾ＲＮＡリンカーの存在のため、この第１鎖ｃＤＮＡおよびｎｃＲＮＡ鋳型のハイブリッド分子は、染色体ＤＮＡ断片の遊離末端にライゲーションされることができる。

特定の態様において、修飾ＲＮＡリンカー上の二本鎖領域の長さは、約６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０塩基対またはより多くの塩基対である。

小節ａ）（ＲＮＡおよびＤＮＡリンカー対）において記載された第１の特定の態様において記載されたような他の態様は、一般的に適用可能であり、ここでも組み込まれる（が繰り返して述べない）。

ｃ）直接的ＲＮＡ−ＤＮＡライゲーション
別の／第３の特定の態様において、本発明の方法は、ｎｃＲＮＡの３’−ＯＨ基を、５’アデニル化された一本鎖ＤＮＡ（５’Ａｐｐ−ｓｓＤＮＡ）、例えば後で相補的ポリヌクレオチドにハイブリダイズされるｓｓＤＮＡリンカー、またはｎｃＲＮＡの３’−ＯＨ基への直接的なライゲーションのための酵素の基質の役目を果たすことができる５’アデニル化されたオーバーハングを有するｄｓＤＮＡに直接ライゲーションする特定の酵素（例えば切り詰められたＲＮＡリガーゼ２またはＲＮＬ２）を用いて実施されることができる。

従って、本発明は、同じクロマチン断片中の架橋されたｎｃＲＮＡの３’末端および架橋されたゲノムＤＮＡ断片の遊離末端をライゲーションするための代替の方法も提供する。本発明のこの側面によれば、一本鎖ＤＮＡオリゴヌクレオチドが、その５’が予めアデニル化された状態で提供される（５’ＡｐｐｓｓＤＮＡ）。次いで、ＲＮＡ−ＤＮＡリガーゼ（例えば熱安定性５’ＡｐｐＤＮＡ／ＲＮＡリガーゼ、ＮＥＢカタログ番号Ｍ０３１９ＳまたはＭ０３１９Ｌ）が、ｎｃＲＮＡの３’−ＯＨを５’ＡｐｐｓｓＤＮＡに直接連結するために用いられることができる。

製造によれば、その熱安定性５’ＡｐｐＤＮＡ／ＲＮＡリガーゼは、メタノバクテリウム・サーモオートトロフィカス（Ｍｅｔｈａｎｏｂａｃｔｅｒｉｕｍｔｈｅｒｍｏａｕｔｏｔｒｏｐｈｉｃｕｍ）からのＲＮＡリガーゼの触媒的リジンの点変異体である(Zhelkovsky and McReynolds, BMC Mol. Biol., 13:24, 2012)。この酵素は、ＡＴＰ非依存性であるが、ＲＮＡまたは一本鎖ＤＮＡ（ｓｓＤＮＡ）のどちらの３’−ＯＨ末端へのライゲーションに関しても、５’が予めアデニル化されたリンカーを必要とする。その酵素は、２’−Ｏ−メチル化された３’末端を有するＲＮＡの５’アデニル化されたリンカーへのライゲーションにおいても活性である。(Zhelkovsky and McReynolds、上記）。その変異体リガーゼは、ＲＮＡまたはｓｓＤＮＡの５’ホスフェートをアデニル化することができず、それは、望まれないライゲーション産物（コンカテマーおよび環）の形成を低減する。６５℃で機能するリガーゼの能力は、ＲＮＡライゲーション反応におけるＲＮＡの二次構造の制約をさらに低減し得る。

本発明のこの態様に関する別の適切なリガーゼは、ＲＮＡリガーゼ２、例えばＢｉｏｏＳｃｉｅｎｔｉｆｉｃ（テキサス州オースティン）からのＡＩＲ^ＴＭＲＮＡリガーゼ２（ＲＮＬ２）であり、それは、アダプターのアデニル化された５’末端をＲＮＡの３’末端に特異的にライゲーションする。同様に、その酵素は、ライゲーションに関してＡＴＰを必要としないが、アデニル化された基質を必要とし、それは、ランダムＲＮＡ分子間のライゲーションの量を劇的に低減する。そのリガーゼは、Ｔ４ＲＮＡリガーゼ２の切り詰められたバージョンである。完全長のＲＮＡリガーゼ２とは異なり、ＡＩＲ（商標）リガーゼは、アデニル化された基質を有しないＲＮＡまたはＤＮＡのリン酸化された５’末端をライゲーションしない。

あるいは、Ｔ４ＲＮＡリガーゼ１（ＮＥＢカタログ番号Ｍ０２０４ＳまたはＭ０２０４Ｌ）が、ｎｃＲＮＡの３’−ＯＨを５’ホスホリル末端を有するｓｓＤＮＡにライゲーションするために用いられ得る。

一度ｎｃＲＮＡの３’末端がｓｓＤＮＡにライゲーションされたら、相補的ｓｓＤＮＡが、ライゲーションされたｓｓＤＮＡにアニーリングして第２鎖ｃＤＮＡ合成を開始することができ、および／または同じクロマチン断片中の架橋されたゲノムＤＮＡ断片の遊離末端とのライゲーションに適した平滑末端を形成することができる。

代替の態様において、平滑末端（またはライゲーション適合末端）を一方の末端に、（上記の様々なＲＮＡリガーゼに関する一本鎖基質の役目を果たすことができる）５’アデニル化されたオーバーハングを他方の末端に有するｄｓＤＮＡリンカーが、突出しているアデニル化された５’末端がｎｃＲＮＡの３’−ＯＨに直接ライゲーションされる前に、架橋されたゲノムＤＮＡ断片の遊離末端にまずライゲーションされることができる。

同様に、上記でライゲーションされたＲＮＡリンカー−ＤＮＡリンカーまたは修飾ＲＮＡリンカーに関して記載された全ての態様またはバリエーションは、５’ＡｐｐｓｓＤＮＡおよびその相補配列の間で形成された二本鎖領域に一般的に適用可能である。

例えば、特定の態様において、５’ＡｐｐｓｓＤＮＡおよびその相補配列の間で形成された二本鎖領域は、ＲＮＡおよびＤＮＡタグ配列の生成を容易にするための１個以上のＲＥ認識部位を含むことができる。２個のＭｍｅＩ部位が、二本鎖領域の両方の末端に位置し、二本鎖領域の外側の切断を方向付けて、二本鎖領域に隣接する１８〜２０ｂｐのＲＮＡおよびＤＮＡタグを生成することができる。あるいは、１個のＲＥ部位が、ＲＮＡタグ（またはＤＮＡタグ）を生成するために用いられることができ、ＤＮＡタグ（またはＲＮＡタグ）は、物理的剪断または限定的な非特異的酵素消化（上記参照）により生成されることができる。

従って、本発明の別の側面は、以下：（ｉ）第１ポリヌクレオチドおよび（ｉｉ）第２ポリヌクレオチドを含む直接的なＲＮＡリンカーを提供し、ここで、第１および第２ポリヌクレオチドは、ゲノムＤＮＡライゲーション適合末端、および第１ポリヌクレオチドの５’末端における５’オーバーハングにより隣接される二本鎖領域を形成する。

５’オーバーハングは、場合により５’アデニル化されており、または適切な酵素、例えば５’ＤＮＡアデニル化キット（カタログ番号Ｅ２６１０ＳまたはＥ２６１０Ｌ）中のＭｔｈＲＮＡリガーゼによりアデニル化されることができる。ＲＮＡライゲーションが５’オーバーハングを用いて実施される予定である場合、（その第２ポリヌクレオチドとのアニーリングの前の）ｓｓＤＮＡとしての第１ポリヌクレオチドとは対照的に、５’オーバーハングは、直接的なＲＮＡライゲーションのための酵素に関する基質として用いられるために十分な長さ（例えば、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５塩基またはより多くの塩基）のものである。

特定の態様において、ライゲーション適合末端は、架橋されたゲノムＤＮＡ断片の平滑末端への直接的なライゲーションのために平滑末端化されることができる。
別の態様において、ライゲーション適合末端は、制限酵素部位を含むことができ、それはＲＥにより切断されて、架橋されたゲノムＤＮＡ断片の平滑末端へのライゲーションに必要な必須の平滑末端を生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ（例えば自己ライゲーションを防ぐための脱リン酸化された平滑末端）、または自己ライゲーションを防ぐ非適合性オーバーハングを有することができる。

特定の態様において、直接的なＲＮＡリンカーは、自己ライゲーションしない。例えば、第１ポリヌクレオチドの３’末端は、第１ポリヌクレオチドの自己ライゲーション（自己環状化）を防ぐために、ジデオキシヌクレオチドまたは他の修飾ヌクレオチドによりブロックされることができる。ＲＮＡ−ＤＮＡライゲーションが完了したら、第１ポリヌクレオチドのブロックされた３’末端は、ライゲーション適合末端の一部になり、ＲＥ消化により切断されてゲノムＤＮＡライゲーションのための平滑末端を作り出すことができる。

特定の態様において、二本鎖領域は、第１制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第１制限部位を含むことができる。ＲＥ認識部位は、ＲＥが切断する際に、それがＲＥ部位の外側、第１ポリヌクレオチドの５’アデニル化された末端に対して５’側を切断するように、戦略的に配置されることができる。これは、直接的なＲＮＡリンカーに連結されたＲＮＡタグの生成を可能にする。例えば、ＭｍｅＩ認識部位は、二本鎖領域の末端に、第１ポリヌクレオチドの５’オーバーハングの５’末端に対して近位に配置されることができる。ＭｍｅＩ部位は、ＭｍｅＩが切断する際に、２ｂｐのオーバーハングを有する１８ｂｐの断片を含むＲＮＡタグが、連結されたｎｃＲＮＡ由来のｃＤＮＡにおいて生成されるような方向性であるように設計される。しかし、ＲＥ部位の配置は、第１ポリヌクレオチドの末端である必要はない。より内側の配置は、対応してより短いＲＮＡタグ配列を生成する。第１ポリヌクレオチドがｓｓＤＮＡ基質として用いられる場合（その５’オーバーハングが基質として用いられる場合とは対照的に）、ＲＥ部位は第１ポリヌクレオチドの５’末端に配置されることができるため、より長いＲＮＡタグ配列が生成されることができる。

従って、特定の態様において、（第１（ＩＩ型）制限酵素に関する）第１認識部位の最後のヌクレオチドは、第１ポリヌクレオチドの５’末端である。
特定の態様において、二本鎖領域は、ライゲーション適合末端において、またはその付近に、第２制限酵素、例えばＩＩ型制限酵素（ＲＥ）に関する第２制限部位を含むことができる。ＲＥは、第２ＲＥ認識部位に対して３’側であり第１ポリヌクレオチドに対して３’側（例えば、ライゲーションされたゲノムＤＮＡ中）を切断することができる。ＲＥ認識部位の方向性は、それが、連結されたゲノムＤＮＡの末端配列に基づいてＤＮＡタグを生成するような方式で配置される。特定の態様において、ＲＥ部位の配置は、二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いＤＮＡタグ配列を生成する。

特定の態様において、直接的なＲＮＡリンカーは、ＲＮＡタグまたはＤＮＡタグを生成するための制限酵素認識部位を有しない。
特定の態様において、直接的なＲＮＡリンカーは、直接的なＲＮＡリンカーを他の直接的なＲＮＡリンカー（単数または複数）から区別する独特の配列（例えば“バーコード”）を含むことができる。

特定の態様において、第２ポリヌクレオチドは、脱リン酸化されている。
本発明のこの側面に従って生成されたＰＥＴポリヌクレオチドは、５’ＡｐｐｓｓＤＮＡおよびその相補配列（すなわち第２ポリヌクレオチド）の間で形成された二本鎖領域に対応する中央領域を含む。この領域に関する特定の配列の要求は存在せず、その領域の長さは柔軟性がある（例えば数ｂｐほどの短いもの、ＲＮＡ−ＤＮＡリガーゼの基質の要求、そして逆転写酵素に関する基質の要求を支持するために十分に長いもの）が、より長い配列が、あらゆる所望されるＲＥ認識部位、バーコード配列、または修飾ヌクレオチド（例えば親和性精製のためのビオチン化ヌクレオチド）を組み込むために用いられることができる。

従って、本発明の別の側面は、以下：（１）第１ポリヌクレオチド（５’アデニル化されていても、５’アデニル化されるのに適していてもどちらでもよい）の５’末端に対して近位の部位において非コードＲＮＡ（ｎｃＲＮＡ）の配列タグ；および（２）ライゲーション適合末端に対して近位の部位においてゲノムＤＮＡの配列タグにより隣接されている（直接的なＲＮＡリンカーの）二本鎖領域を含む中央領域を含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドを提供する。

関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドの２以上のメンバーを含むペアエンドタグ（ＰＥＴ）ライブラリーを提供し、ここで、ＰＥＴライブラリーのそれぞれのメンバーは、同じ前記の中央領域、および非コードＲＮＡ（ｎｃＲＮＡ）の異なるＲＮＡ配列タグ、ゲノムＤＮＡの異なるＤＮＡ配列タグ、または両方を含む。

さらに別の関連する側面において、本発明は、対象のＰＥＴポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
本発明のさらに別の側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；（２）ｎｃＲＮＡの３’−ＯＨを、５’を予めアデニル化されたｓｓＤＮＡにライゲーションし；（３）ｓｓＤＮＡの相補物を提供してｓｓＤＮＡおよび相補物の間で二本鎖領域を形成し、（４）必要であれば、二本鎖領域の末端において平滑末端を生成し；（５）その平滑末端を、架橋されたゲノムＤＮＡ断片の末端に、近接ライゲーションに関する条件下でライゲーションし；（６）ＰＥＴポリヌクレオチドを配列決定分析のために単離し、ここで、そのＰＥＴポリヌクレオチドは、架橋されたゲノムＤＮＡ断片のＤＮＡタグおよびｎｃＲＮＡのＲＮＡタグにより隣接された二本鎖領域を含み；そして、（７）そのＤＮＡタグおよびＲＮＡタグを参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

本発明の代替の側面は、ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む：（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；（２）ｎｃＲＮＡの３’−ＯＨを、二本鎖領域を有するｄｓＤＮＡの５’を予めアデニル化されたオーバーハングにライゲーションし、（４）必要であれば、二本鎖領域の末端において、５’を予めアデニル化されたオーバーハングに対して遠位に平滑末端を生成し；（５）その平滑末端を、架橋されたゲノムＤＮＡ断片の末端に、近接ライゲーションに関する条件下でライゲーションし；（６）ＰＥＴポリヌクレオチドを配列決定分析のために単離し、ここで、そのＰＥＴポリヌクレオチドは、架橋されたゲノムＤＮＡ断片のＤＮＡタグおよびｎｃＲＮＡのＲＮＡタグにより隣接された二本鎖領域を含み；そして、（７）そのＤＮＡタグおよびＲＮＡタグを参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関する参照ゲノム内の機能的相互作用座位を同定する。

特定の態様において、ｓｓＤＮＡの相補物（すなわち、第２ポリヌクレオチド）は、ｓｓＤＮＡと同じ長さを有する。特定の態様において、その相補物は、ｓｓＤＮＡより長いか、またはｓｓＤＮＡより短く、突出している３’または５’末端を有する二本鎖領域を形成する。後者の場合、そのオーバーハングは、酵素により埋められて、または平滑末端を生成する制限酵素により末端から切り離されることにより、ライゲーションに適した平滑末端を生成することができる。ＲＥ部位は、ｓｓＤＮＡの配列中に入るように設計されることができる。

特定の態様において、直接的なＲＮＡリンカーの第１ポリヌクレオチドの長さは、約６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０塩基またはより多くの塩基である。

小節ａ）（ＲＮＡおよびＤＮＡリンカー対）および小節ｂ）（修飾ＲＮＡリンカー）において記載された第１および第２の特定の態様において記載されたような他の態様は、それぞれ一般的に適用可能であり、ここでも組み込まれる（が繰り返して述べない）。

そのように記載された本発明の一般的な側面により、以下の節は、本発明の特定の態様に関する追加の詳細ならびに特定の量およびパラメーターを提供する。本発明は、本発明の一般的な範囲から逸脱することなく、そのような詳細を用いずに、またはわずかな修正を加えて実施されることができることは、当業者には明らかであるものとする。

２．定義
“非コードＲＮＡ（ｎｃＲＮＡ）”は、タンパク質に翻訳されないＲＮＡ分子を含む。頻度はより低いが、それは、非タンパク質コードＲＮＡ（ｎｐｃＲＮＡ）、非メッセンジャーＲＮＡ（ｎｍＲＮＡ）および機能性ＲＮＡ（ｆＲＮＡ）と呼ばれる可能性もある。それは、通常は、タンパク質をコードする以外の機能を有する機能性ＲＮＡであるが、一部は非機能性である、または既知の機能を有しない可能性がある。時々、小さいＲＮＡ（ｓＲＮＡ）という用語が、しばしば短い細菌性ｎｃＲＮＡに関して用いられる。非コードＲＮＡが転写されるＤＮＡ配列は、しばしばＲＮＡ遺伝子と呼ばれる。

非コードＲＮＡ遺伝子は、高度に豊富であり機能的に重要なＲＮＡ、例えば転移ＲＮＡ（ｔＲＮＡ）およびリボソームＲＮＡ（ｒＲＮＡ）、ならびにｓｎｏＲＮＡ（ｓｃＲＮＡを含む；ＲＮＡのヌクレオチド修飾に関する）、ｓｎＲＮＡ（スプライシングおよび他の機能に関する）、ｇＲＮＡ（ガイドＲＮＡ；ｍＲＮＡのヌクレオチド修飾に関する）、ＲＮａｓｅＰ（ｔＲＮＡの成熟に関する）ＲＮａｓｅＭＲＰ（ｒＲＮＡの成熟および／またはＤＮＡ複製に関する）、ＹＲＮＡ（ＲＮＡプロセシングおよび／またはＤＮＡ複製に関する）、テロメラーゼＲＮＡ（テロメア合成に関する）スプライシングされたリーダーＲＮＡ、ＳｍＹＲＮＡ（ｍＲＮＡのトランススプライシングに関する）、アンチセンスＲＮＡ、シス−天然アンチセンス転写産物、マイクロＲＮＡ（遺伝子制御に関する）ｓｉＲＮＡ（トランス作用性ｓｉＲＮＡを含む；遺伝子制御に関する）、ｅｘＲＮＡ、およびｐｉＲＮＡ（リピート関連ｓｉＲＮＡを含む；トランスポゾン防御に関し、他の機能である可能性もある）のようなＲＮＡ、７ＳＫＲＮＡ（ＣＤＫ９／サイクリンＴ複合体の負の制御に関する）、ならびにＸｉｓｔおよびＨＯＴＡＩＲのような例を含む長いｎｃＲＮＡを含む。ヒトゲノム内にコードされているｎｃＲＮＡの数は未知であるが、最近のトランスクリプトームおよび生物情報学の研究は、数千のｎｃＲＮＡの存在を示唆している。新規に同定されたｎｃＲＮＡの多くは、それらの機能に関して検証されていないため、多くが非機能性である可能性がある。

特定の態様において、本発明のｎｃＲＮＡは、上記で参照された種の１以上を一切含まない。例えば、特定の態様において、本発明のｎｃＲＮＡは、ｒＲＮＡを含まない。特定の態様において、本発明のｎｃＲＮＡは、ｔＲＮＡを含まない。特定の態様において、本発明のｎｃＲＮＡは、ｔＲＮＡを含まない。

“制限酵素（ＲＥ）”および“制限エンドヌクレアーゼ”は、本明細書において、二本鎖ＤＮＡを切断する酵素を含むように互換的に用いられている。その酵素は、典型的には、“制限部位”または“ＲＥ認識部位”として知られる特定の認識ヌクレオチド配列において、その内部に、またはその付近（例えば、約数塩基〜約数キロ塩基）に２つの切り込みを作り、切り込みは塩基を損傷することなく二重らせんのホスフェート主鎖のそれぞれを通る。

制限酵素は、一般に３つのタイプに分類され、それは、それらの構造およびそれらがそれらのＤＮＡ基質をそれらの認識部位において切断するかどうか、またはその認識および切断部位が互いから離れているかどうかにおいて異なる。３０００種類を越える制限酵素が、今までに詳細に研究されており、これらの６００種類より多くが、商業的に入手可能であり、その多くが、分子生物学においてＤＮＡ修飾および操作のためにルーチン的に用いられている。

Ｉ型制限酵素は、それらの認識部位と異なり、それからランダムな距離（少なくとも１０００ｂｐ）離れた部位を切断する。Ｉ型制限酵素の認識部位は非対称であり、約６〜８ヌクレオチドの非特異的スペーサーにより隔てられた２つの特異的な部分（１つは３〜４ヌクレオチドを含有し、別の部分は４〜５ヌクレオチドを含有する）からなる。これらの酵素は、多機能であり、標的ＤＮＡのメチル化状態に依存して、制限および修飾活性の両方が可能である。補助因子Ｓ−アデノシルメチオニン（ＡｄｏＭｅｔ）、加水分解されたアデノシン３リン酸（ＡＴＰ）およびマグネシウム（Ｍｇ^２＋）イオンが、それらの完全な活性のために必要とされる。

典型的なＩＩ型制限酵素は、ホモダイマーであり、通常は分割されておらず回文構造であり長さ４〜８ヌクレオチドである認識部位を有する。それらは、同じ部位においてＤＮＡを認識および切断し、それらは、それらの活性のためにＡＴＰもＡｄｏＭｅｔも用いず−それらは通常はＭｇ^２＋のみを補助因子として必要とする。最近、新規のサブファミリーの命名法（１文字接尾辞を用いて定義される）が、この大きいファミリーをＩＩ型酵素の典型的な特徴からの逸脱に基づいてサブカテゴリーに分けるために開発された。例えば、ＩＩＢ型制限酵素（例えば、ＢｃｇＩおよびＢｐｌＩ）は、ＡｄｏＭｅｔおよびＭｇ^２＋補助因子の両方を必要とする多量体であり、それらは、ＤＮＡをそれらの認識の両側で切断して、認識部位を切り抜く。ＩＩＥ型制限エンドヌクレアーゼ（例えばＮａｅＩ）は、２コピーのそれらの認識配列との相互作用後にＤＮＡを切断する。１つの認識部位は、切断のための標的として作用し、一方で他方の認識部位は、酵素切断の速度を上げるかまたは効率を向上させるアロステリック作用因子として作用する。ＩＩＥ型酵素と類似して、ＩＩＦ型制限エンドヌクレアーゼ（例えばＮｇｏＭＩＶ）は、２コピーのそれらの認識配列と相互作用するが、両方の配列を同時に切断する。ＩＩＧ型制限エンドヌクレアーゼ（Ｅｃｏ５７Ｉ）は、古典的なＩＩ型制限酵素のように単一のサブユニットを有するが、活性であるために補助因子ＡｄｏＭｅｔを必要とする。ＩＩＭ型制限エンドヌクレアーゼ、例えばＤｐｎＩは、メチル化されたＤＮＡを認識して切断することができる。ＩＩＳ型制限エンドヌクレアーゼ（例えばＦｏｋＩ）は、それらの非回文構造非対称認識部位から定められた距離においてＤＮＡを切断する。すなわち、ＩＩＳ型酵素は、それらの認識配列の外側（片側）で切断する。ＭｍｅＩならびにＩＩＳ型制限酵素のほとんどは、変動する末端の長さをもたらす。Ｄｕｎｎら（２００２）は、ＭｍｅＩは１８／２０または１９／２１塩基離れた位置をおおよそ１：１の割合で切断し得ることを示した。従って、１８／２０がＭｍｅＩ制限切断部位を記載するために用いられる場合、１９／２１も意図されている。ＩＩＴ型制限酵素（例えばＢｐｕ１０ＩおよびＢｓｌＩ）は、２個の異なるサブユニットからなる。一部は回文構造の配列を認識し、一方で他のものは非対称な認識部位を有する。

ＩＩＩ型制限酵素（例えばＥｃｏＰ１５）は、逆を向いた２つの分離した非回文構造配列を認識する。それらは、認識部位の約２０〜３０塩基対後でＤＮＡを切断する。これらの酵素は、１個より多くのサブユニットを含有し、ＤＮＡのメチル化および制限におけるそれらの役割のためにＡｄｏＭｅｔおよびＡＴＰ補助因子をそれぞれ必要とする。ＩＩＩ型酵素は、短い５〜６ｂｐの長さの非対称なＤＮＡ配列を認識し、２５〜２７ｂｐ下流を切断して短い一本鎖の５’突出を残す。それらは、２つの逆を向いたメチル化されていない認識部位の存在を、制限が起こるために必要とする。

制限酵素切断産物は、平滑末端であることができ、または５’もしくは３’オーバーハングを伴う粘着末端を有することもでき、その粘着末端断片は、それが元々切断された断片に対してだけでなく、適合する付着または粘着末端を有するあらゆる他の断片にもライゲーションされることができる。

“ヌクレオチド”は、本明細書で用いられる際、ヌクレオシドのリン酸エステル−核酸（ＤＮＡまたはＲＮＡ）の基本構造単位を含む。２個以上のヌクレオチド（例えば、２〜３０、５〜２５、１０〜１５ヌクレオチド）の短い鎖は、時々“オリゴヌクレオチド”と呼ばれ、一方でより長い鎖は、ポリヌクレオチドと呼ばれるが、その２つの用語の間に決定的な長さの限定は存在しない。ヌクレオチドという用語は、用語“核酸”と互換的に用いられることができる。ポリヌクレオチドは、一本鎖であることもそれぞれの鎖が５’末端および３’末端を有する二本鎖であることもできる。一続きの核酸の末端領域は、それぞれ５’末端および３’末端と呼ばれることができる。ポリヌクレオチド中のヌクレオチドは、天然ヌクレオチド（ＤＮＡに関してデオキシリボヌクレオチドＡ、Ｔ、Ｃ、またはＧ、およびＲＮＡに関してリボヌクレオチドＡ、Ｕ、Ｃ、Ｇ）であることができ、または修飾ヌクレオチドを含むこともでき、それは、例えば化学合成によりポリヌクレオチド中に組み込まれることができる。そのような修飾ヌクレオチドは、天然ヌクレオチドに存在しない、または欠けている追加の望ましい特性を与えることができ、修飾ヌクレオチドを含むポリヌクレオチドは、本発明の組成物および方法において用いられることができる。

用語“プライマー”または“プライミング配列”は、核酸鎖に相補的なプライマー伸長産物の合成が誘導される条件下で、すなわち４種類の異なるヌクレオシド三リン酸および伸長のための因子（例えばＤＮＡポリメラーゼまたは逆転写酵素）の存在下で、適切な緩衝液中で、かつ適切な温度において、ＤＮＡ合成の開始の点として作用することができるオリゴヌクレオチドを指す。プライマーは、一本鎖ＤＮＡであることができる。プライマーの適切な長さは、プライマーの意図される用途に依存するが、典型的には１０〜５０ヌクレオチド、例えば１５〜３５ヌクレオチドの範囲である。短いプライマー分子は、一般に鋳型との十分に安定なハイブリッド複合体を形成するためにより低い温度を必要とする。プライマーは、鋳型核酸の正確な配列を反映する必要はないが、鋳型とハイブリダイズするために十分に相補的でなければならない。所与の標的配列の増幅のための適切なプライマーの設計は、当該技術で周知であり、例えば本明細書で引用される文献において記載されている。

“プローブ”は、一般に、標的配列のｃＤＮＡまたはｍＲＮＡ、例えばＣＣＡＴ１ｎｃＲＮＡ配列またはそのｃＤＮＡの少なくとも一部の存在を検出するために用いられる、核酸分子またはそれと相補的な配列を指す。検出は、プローブおよびアッセイされる標的配列の間のハイブリダイゼーション複合体の同定により実施されることができる。プローブは、固体支持体に、または検出可能な標識に結合していることができる。プローブは、一般に一本鎖であろう。プローブ（単数または複数）は、典型的には１０〜２００ヌクレオチドを含む。プローブの個々の特性は、個々の用途に依存すると考えられ、当業者の決定する能力の範囲内である。一般に、プローブは、高ストリンジェンシーハイブリダイゼーションの条件下で、標的ｃＤＮＡまたはＲＮＡの少なくとも一部にハイブリダイズするであろう。

“アダプター”は、ライゲーションされる予定のオリゴヌクレオチド分子を指し、または核酸分子の末端にライゲーションされている。アダプターは、増幅（ＰＣＲプライマー配列を有するＰＣＲアダプター）、配列決定（配列決定プライマー配列を有する）、および／または核酸断片のベクター中への挿入（適切なクローニング配列、例えばＲＥ認識部位を有する）のために用いられることができる。

“コンカテマー”は、通常は、末端同士が連結され、場合によりリンカーまたはスペーサーにより隔てられた、少なくとも２個のヌクレオチドモノマー配列からなる。モノマーは、配列が同じである可能性も同じでない可能性もあるが、類似の構造要素（例えば本発明のＲＮＡおよびＤＮＡリンカー）を有し得る。モノマーは、同じ向きである可能性も異なる向きである可能性もある（例えば、コンカテマー内のモノマーは、互いにヘッドトゥーヘッド、ヘッドトゥーテール、または両方の混合で連結されている可能性がある）。本発明のコンカテマーは、本発明の方法に従って調製された少なくとも２つのオリゴヌクレオチド（例えばＰＥＴポリヌクレオチド）を含む。

“ライブラリー”は、同様の核酸配列、オリゴヌクレオチド、またはポリヌクレオチドの集合を含み、ライブラリーのそれぞれのメンバーは、１以上の定義する（ｄｅｆｉｎｉｎｇ）特徴を共有している。例えば、本発明のＰＥＴポリヌクレオチドのライブラリーは、２以上（例えば、数万、数十万、数百万、数千万等）の本発明のＰＥＴポリヌクレオチドを含み、それぞれのＰＥＴポリヌクレオチドは、類似または同一の構造を共有しているが、異なるＤＮＡおよび／またはＲＮＡタグ配列を有する。

“ベクター”または“組み換えベクター”は、内部に含有される遺伝物質（例えば、クローニングされた遺伝情報またはクローニングされたＤＮＡ）をある細胞から別の細胞に移動させる、または増幅することができるバクテリオファージ、プラスミド、または他の媒介物を指す、当該技術で認められている用語である。そのようなベクターは、特定の性質および特徴に応じて、異なる宿主細胞中に、トランスフェクションおよび／または形質転換、例えばリポフェクション、リン酸カルシウム沈殿、レトロウイルス送達、電気穿孔法、および微粒子銃形質転換、ならびに当該技術で利用可能なあらゆる他の分子生物学の技法により導入されることができる。

適切なベクターは、異種遺伝子配列の挿入または組み込みにより操作されているプラスミド、ウイルスベクターまたは当該技術で既知の他の媒介物を含み得る。そのようなベクターは、適切な宿主増幅のための複製起点、クローニングされた配列の効率的な転写を促進することができるプロモーター配列、クローニングされた配列の直接的な増幅のための隣接しているＰＣＲプライマーを含有し得る。ベクターは、形質転換された細胞の表現型選択を可能にする特定の遺伝子も含み得る。本発明における使用に適したベクターは、例えば、ｐＢｌｕｅＳｃｒｉｐｔ（Ｓｔｒａｔａｇｅｎｅ，カリフォルニア州ラホヤ）；ｐＢＣ、ｐＺＥｒＯ−１（Ｉｎｖｉｔｒｏｇｅｎ，カリフォルニア州カールスバッド）およびｐＧＥＭ３ｚ（Ｐｒｏｍｅｇａ，ウィスコンシン州マディソン）またはそれらの改変ベクターならびに当業者に既知の他の類似のベクターを含む。例えば、本明細書に参照により援用される米国特許第４，７６６，０７２号において開示されているｐＧＥＭベクターを参照。

“クロマチン”は、細胞核中の核酸およびタンパク質、主にヒストンの複合体を記載するために用いられ、それは塩基性色素により容易に染色され、細胞分裂の間に凝集して染色体を形成する。クロマチンは、核酸−タンパク質複合体の一例である。

“タグ”は、本明細書で用いられる際、参照ゲノム内の配列の由来を独特に同定することができる同定可能な一続きの核酸の配列を含む。タグは、そのタグを参照ゲノム中の１つまたはいくつかの位置（例えばある遺伝子または高い配列の同一性を有する関連遺伝子の二重コピー）に独特にまたは明確にマッピングする十分な長さ（通常は１８〜２０ｂｐであるが、配列の組成ならびに参照ゲノムの大きさおよび複雑さ等に応じてより短いこともできる）であることができる。本発明のＤＮＡタグは、ゲノムＤＮＡ配列に由来する。それは、ｎｃＲＮＡ、またはｎｃＲＮＡのｃＤＮＡに、例えば本発明のＤＮＡリンカーおよびＲＮＡリンカー（または本発明の修飾ＲＮＡリンカー、または本発明の直接的なＲＮＡリンカー）を通して連結されることができる。本発明のＲＮＡタグは、ｎｃＲＮＡ、またはｎｃＲＮＡから逆転写されたｃＤＮＡに由来する。ＲＮＡタグは、ゲノムＤＮＡに、例えば本発明のＤＮＡリンカーおよびＲＮＡリンカー（または本発明の修飾ＲＮＡリンカー、または本発明の直接的なＲＮＡリンカー）を通して連結されることができる。

本発明のＲＮＡまたはＤＮＡタグは、あらゆる大きさであることができるが、それが由来する親配列の大きさよりも意味があり、有利である必要がある。特定の態様において、ＤＮＡまたはＲＮＡタグの大きさは、ゲノムの複雑さにより決定される。細菌ゲノムに関して、約８ｂｐ〜約１６ｂｐのタグで十分である可能性があり、一方でヒトゲノムのような複雑なゲノムに関しては、１６〜２０ｂｐのタグが考慮され得る。

“リンカー”は、通常は特定の目的、例えば２個のポリヌクレオチドを一緒に連結するために設計された核酸の人工配列である。本発明の“ＲＮＡリンカー”は、本発明のＤＮＡリンカーに、そしてＲＮＡ、例えば架橋された非コードＲＮＡの遊離３’末端から合成されたｃＤＮＡに連結されるように設計されている。本発明の“ＤＮＡリンカー”は、本発明のＲＮＡリンカーに、そしてＤＮＡ、例えばクロマチン断片に架橋された染色体ＤＮＡの遊離末端に連結されるように設計されている。本発明の“修飾ＲＮＡリンカー”は、一方の末端（例えば平滑末端または平滑末端を生成することができるライゲーション適合末端）においてゲノムＤＮＡ断片に、そして他方の末端においてＲＮＡ、例えば架橋された非コードＲＮＡの遊離３’末端から合成されたｃＤＮＡに連結されるように設計されている。本発明の“直接的なＲＮＡリンカー”は、ｎｃＲＮＡの３’−ＯＨに予めアデニル化された５’末端を通して直接連結されるように、そして他方の末端（例えば平滑末端または平滑末端を生成することができるライゲーション適合末端）においてゲノムＤＮＡ断片に連結されるように設計されている。

“配列決定”は、生体ポリマー、この場合は核酸中の構成要素の順序を決定するために用いられる様々な方法をさす。本発明と共に用いられることができる適切な配列決定技法は、伝統的な鎖終結サンガー法、ならびに多くの商業的な源から利用可能ないわゆる次世代（高スループット）配列決定、例えば大規模並行署名配列決定（またはＭＰＳＳ、ＬｙｎｘＴｈｅｒａｐｅｕｔｉｃｓ／Ｓｏｌｅｘａ／Ｉｌｌｕｍｉｎａによる）、ポロニー配列決定（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、パイロ配列決定または“４５４配列決定”（４５４ＬｉｆｅＳｃｉｅｎｃｅｓ／ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓ）、ライゲーションによる配列決定（ＳＯＬｉＤ配列決定、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓによる）、合成による配列決定（Ｓｏｌｅｘａ／Ｉｌｌｕｍｉｎａ）、ＤＮＡナノボール配列決定、ｈｅｌｉｓｃｏｐｅ配列決定（ＨｅｌｉｃｏｓＢｉｏｓｃｉｅｎｃｅｓ）、ｉｏｎ半導体またはＩｏｎＴｏｒｒｅｎｔ配列決定（ＩｏｎＴｏｒｒｅｎｔＳｙｓｔｅｍｓＩｎｃ．／ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、および単分子リアルタイム（ＳＭＲＴ）配列決定（ＰａｃｉｆｉｃＢｉｏ）等を含む。数多くの他の高スループット配列決定法が、まだ開発されており、または完成しており、それらも本発明のＰＥＴポリヌクレオチドを配列決定するために用いられることができ、それはナノポアＤＮＡ配列決定、ハイブリダイゼーションによる配列決定、質量分析による配列決定、微小流体サンガー配列決定、透過型電子顕微鏡ＤＮＡ配列決定、ＰＮＡＰ配列決定、およびインビトロウイルス高スループット配列決定等を含む。

特定の態様において、配列決定法は、対象のＰＥＴポリヌクレオチドの両側からタグを配列決定することができ、従ってペアエンドタグの情報を提供することができる。特定の態様において、配列決定法は、変動可能な長さの長いＤＮＡ断片、例えば対象ＰＥＴポリヌクレオチドのコンカテマーにおいて読みを実施することができる。

“参照ゲノム”は、対象の生物のゲノム、またはｎｃＲＮＡおよびゲノムＤＮＡが由来するゲノムを指す。本発明の方法および組成物は、数多くの古細菌または真正細菌、原生生物、真菌（例えば出芽酵母（Ｓ．ｃｅｒｅｖｉｓａｅ）または分裂酵母）、植物、動物ゲノムを含む、完全または実質的に完全な配列が入手可能であるあらゆる参照ゲノムに適用される。例えば、ヒト、マウスおよび数多くの他の哺乳類および非哺乳類種のゲノム配列は、現在パブリックドメインにおいて容易に入手可能である。例えば、Venter et al., “The Sequence of the Human Genome,” Science, 291(5507):1304-1351, 2001を参照。他の非限定的な参照ゲノムは、数多くの非ヒト霊長類、哺乳類、げっ歯類（ラット、マウス、ハムスター、ウサギ等）、家畜動物（ウシ、ブタ、ウマ、ヒツジ、ヤギ）、鳥類（ニワトリ）、爬虫類、両生類（アフリカツメガエル）、魚類（ゼブラフィッシュ（ダニオ・レリオ（Ｄａｎｉｏｒｅｒｉｏ））、フグ）、昆虫（ショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）、蚊）、線虫、寄生生物、真菌（例えば酵母、例えば出芽酵母（Ｓ．ｃｅｒｅｖｉｓａｅ）または分裂酵母）、様々な植物、ウイルス（例えば宿主ゲノム中に組み込まれたウイルス）等を含む。

ロックド（Ｌｏｃｋｅｄ）核酸（ＬＮＡ）は、ＬＮＡヌクレオチドのリボース部分が２’酸素および４’炭素を連結する余分な架橋で修飾されている修飾ＲＮＡヌクレオチドである。その架橋は、リボースを３’−エンド立体配座で“ロック”する。ＬＮＡヌクレオチドは、所望される場合はいつでもオリゴヌクレオチド中でＤＮＡまたはＲＮＡ残基と混合されることができる。そのようなオリゴマーは、化学的に合成され、商業的に入手可能である。ロックされたリボースの立体配座は、塩基のスタッキングおよび主鎖の前組織化（ｐｒｅ−ｏｒｇａｎｉｚａｔｉｏｎ）を増進する。これは、オリゴヌクレオチドのハイブリダイゼーション特性（融解温度）著しく高める。

ペプチド核酸（ＰＮＡ）は、ＤＮＡまたはＲＮＡに類似の人工的に合成されたポリマーである。ＰＮＡオリゴマーは、相補的ＤＮＡへの結合においてより大きな特異性を示し、ＰＮＡ／ＤＮＡの塩基のミスマッチは、ＤＮＡ／ＤＮＡ二本鎖における類似のミスマッチよりも大きく不安定化する。この結合強度および特異性は、ＰＮＡ／ＲＮＡ二本鎖にも当てはまる。

本発明の“ペアエンドタグ（ＰＥＴ）ポリヌクレオチドは、一方の末端において、またはその付近に、ｎｃＲＮＡ由来のＲＮＡタグがあり、そして他方の末端において、またはその付近に、ゲノムＤＮＡ由来のＤＮＡタグがあるポリヌクレオチドであり、ここで、ｎｃＲＮＡおよびゲノムＤＮＡは、好ましくは同じクロマチン断片に架橋されている。その意味で、ＰＥＴポリヌクレオチドの２つの末端のＲＮＡおよびＤＮＡタグは対になっており、架橋の時点におけるｎｃＲＮＡおよびゲノムＤＮＡの間の物理的近接の事象を反映している。

“近接ライゲーション条件”は、近接しているライゲーション可能なポリヌクレオチド末端、例えば同じクロマチン断片に架橋されているゲノムＤＮＡおよびｎｃＲＮＡが優先的にライゲーションされる、ポリヌクレオチドライゲーション反応に関する条件を指す。一方で、近接していないライゲーション可能なポリヌクレオチド末端、例えば異なるクロマチン断片に架橋されたゲノムＤＮＡおよびｎｃＲＮＡは、ライゲーションされないか、または実質的にライゲーションされない。そのようなライゲーション条件は、同じクロマチン断片上のライゲーション可能な末端が、それらの互いに対する物理的近接のために、異なるクロマチン断片上のライゲーション可能な末端の間のライゲーションよりもライゲーションされる可能性が遥かに高いような、大体積ライゲーション（ｌａｒｇｅｖｏｌｕｍｅｌｉｇａｔｉｏｎ）を含む。

“（配列タグのゲノムへの）マッピング”は、ゲノム中の配列タグのゲノム位置の同定を含む。
“二官能性架橋剤／試薬”または“架橋剤／試薬”は、２個以上の反応基を有し、それぞれが１つの部分（例えばＤＮＡ、ＲＮＡ、またはタンパク質）と反応することができ、そうして２つの部分が別々の分子である場合にその２つの部分を架橋して一緒にする修飾剤を含む。そのような二官能性クロスリンカーは、当該技術で周知である（例えば、Isalm and Dent in Bioconjugation, Chapter 5, pp. 218-363, Groves Dictionaries Inc., ニューヨーク, 1999を参照）。例えば、ホルムアルデヒド、グルタルアルデヒド、またはアルデヒド反応基を有する他の類似の試薬は、タンパク質中の第一級アミノ基を、タンパク質またはＤＮＡ中の他の近くの窒素原子と、メチレン（−ＣＨ_２−）連結により架橋することができる。チオエーテル結合を介した連結を可能にする他の二官能性架橋剤は、マレイミド基を導入するためのＮ−スクシンイミジル−４−（Ｎ−マレイミドメチル）−シクロヘキサン−１−カルボキシレート（ＳＭＣＣ）、またはヨードアセチル基を導入するためのＮ−スクシンイミジル−４−（ヨードアセチル）−アミノベンゾエート（ＳＩＡＢ）を含む。マレイミド基またはハロアセチル基をポリペプチド上に導入する他の二官能性架橋剤は、当該技術で周知であり（例えば、米国特許出願第２００８／００５０３１０号、第２００５／０１６９９３３号を参照、ＰｉｅｒｃｅＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｃ．Ｐ．Ｏ．Ｂｏｘ１１７，Ｒｏｃｋｌａｎｄ，ＩＬ６１１０５，米国から入手可能）、以下のものを含むが、それらに限定されない：ビス-マレイミドポリエチレングリコール（ＢＭＰＥＯ）、ＢＭ（ＰＥＯ）_２、ＢＭ（ＰＥＯ）_３、Ｎ−（β−マレイミドプロピルオキシ）スクシンイミドエステル（ＢＭＰＳ）、γ−マレイミド酪酸Ｎ−スクシンイミジルエステル（ＧＭＢＳ）、ε−マレイミドカプロン酸Ｎ−ヒドロキシスクシンイミドエステル（ＥＭＣＳ）、５−マレイミド吉草酸ＮＨＳ、ＨＢＶＳ、ＳＭＣＣの“長鎖”類似体（ＬＣ−ＳＭＣＣ）であるＮ−スクシンイミジル−４−（Ｎ−マレイミドメチル）−シクロヘキサン−１−カルボキシ−（６−アミドカプロエート）、ｍ−マレイミドベンゾイル−Ｎ−ヒドロキシスクシンイミドエステル（ＭＢＳ）、４−（４−Ｎ−マレイミドフェニル）−酪酸ヒドラジドまたはＨＣｌ塩（ＭＰＢＨ）、Ｎ−スクシンイミジル３−（ブロモアセトアミド）プロピオネート（ＳＢＡＰ）、Ｎ−スクシンイミジルヨードアセテート（ＳＩＡ）、κ−マレイミドウンデカン酸Ｎ−スクシンイミジルエステル（ＫＭＵＡ）、Ｎ−スクシンイミジル４−（ｐ−マレイミドフェニル）−ブチレート（ＳＭＰＢ）、スクシンイミジル−６−（β−マレイミドプロピオンアミド）ヘキサノエート（ＳＭＰＨ）、スクシンイミジル−（４−ビニルスルホニル）ベンゾエート（ＳＶＳＢ）、ジチオビス−マレイミドエタン（ＤＴＭＥ）、１，４−ビス−マレイミドブタン（ＢＭＢ）、１，４−ビスマレイミジル−２，３−ジヒドロキシブタン（ＢＭＤＢ）、ビス−マレイミドヘキサン（ＢＭＨ）、ビス−マレイミドエタン（ＢＭＯＥ）、スルホスクシンイミジル４−（Ｎ−マレイミド−メチル）シクロヘキサン−１−カルボキシレート（スルホ−ＳＭＣＣ）、スルホスクシンイミジル（４−ヨード−アセチル）アミノベンゾエート（スルホ−ＳＩＡＢ）、ｍ−マレイミドベンゾイル−Ｎ−ヒドロキシスルホスクシンイミドエステル（スルホ−ＭＢＳ）、Ｎ−（γ−マレイミドブチリルオキシ）スルホスクシンイミドエステル（Ｎ−（γ−ｍａｌｅｉｍｉｄｏｂｕｔｒｙｌｏｘｙ）ｓｕｌｆｏｓｕｃｃｉｎｉｍｄｅｅｓｔｅｒ）（スルホ−ＧＭＢＳ）、Ｎ−（ε−マレイミドカプロイルオキシ）スルホスクシンイミドエステル（Ｎ−（ε−ｍａｌｅｉｍｉｄｏｃａｐｒｏｙｌｏｘｙ）ｓｕｌｆｏｓｕｃｃｉｍｉｄｏｅｓｔｅｒ）（スルホ−ＥＭＣＳ）、Ｎ−（κ−マレイミドウンデカノイルオキシ）スルホスクシンイミドエステル（スルホ−ＫＭＵＳ）、およびスルホスクシンイミジル４−（ｐ−マレイミドフェニル）ブチレート（スルホ−ＳＭＰＢ）。

架橋のために用いられることができるヘテロ二官能性架橋剤は、アミン反応性Ｎ−ヒドロキシスクシンイミド基（ＮＨＳ基）、および／またはカルボニル反応性ヒドラジン基を含有し得る。そのような商業的に入手可能なヘテロ二官能性架橋剤の例は、スクシンイミジル６−ヒドラジノニコチンアミドアセトンヒドラゾン（ＳＡＮＨ）、スクシンイミジル４−ヒドラジドテレフタレート塩酸塩（ＳＨＴＨ）およびスクシンイミジルヒドラジニウムニコチネート塩酸塩（ＳＨＮＨ）を含む。酸不安定性結合を有するコンジュゲートも、本発明のヒドラジンを有するベンゾジアゼピン誘導体を用いて調製されることができる。用いられることができる二官能性架橋剤の例は、スクシンイミジル−ｐ−ホルミルベンゾエート（ＳＦＢ）およびスクシンイミジル−ｐ−ホルミルフェノキシアセテート（ＳＦＰＡ）を含む。

ジスルフィド結合を介する架橋を可能にする他の二官能性架橋剤が、当該技術で既知であり、ジチオピリジル基を導入するためのＮ−スクシンイミジル−３−（２−ピリジルジチオ）プロピオネート（ＳＰＤＰ）、Ｎ−スクシンイミジル−４−（２−ピリジルジチオ）ペンタノエート（ＳＰＰ）、Ｎ−スクシンイミジル−４−（２−ピリジルジチオ）ブタノエート（ＳＰＤＢ）、Ｎ−スクシンイミジル−４−（２−ピリジルジチオ）２−スルホブタノエート（スルホ−ＳＰＤＢ）を含む。ジスルフィド基を導入するために用いられることができる他の二官能性架橋剤が、当該技術で既知であり、米国特許第６，９１３，７４８号、第６，７１６，８２１号ならびに米国特許公開第２００９／０２７４７１３号および第２０１０／０１２９３１４号において開示されており、その全部が参照により本明細書に援用される。あるいは、チオール基を導入する架橋剤、例えば２−イミノチオラン、ホモシステインチオラクトンまたはＳ−アセチルコハク酸無水物が用いられることもできる。

上記の二官能性架橋試薬の２種類以上が、クロマチン断片中のＤＮＡ、ＲＮＡ、およびタンパク質を架橋するために一緒に用いられることができる。
３．制限酵素
本発明のＤＮＡおよび／またはＲＮＡリンカーが制限酵素認識部位を含むことは、必要とされない。実際、特定の態様において、本発明のＤＮＡおよび／またはＲＮＡリンカーは、制限酵素認識部位を含まないことが望ましい可能性さえある。しかし、特定の態様において、本発明のＤＮＡおよび／またはＲＮＡリンカーは、少なくとも１個のＲＥ認識部位、例えばＩＩ型ＲＥ認識部位（例えばＩＩＳ型ＲＥ部位）を含むことができる。

一般に、ＲＥ切断の結果が、所望の長さ、例えば１０〜２０ｂｐのＤＮＡまたはＲＮＡタグを生成するならば、当該技術で既知のあらゆるＲＥおよびそれらの認識部位が用いられることができる。核酸分子内の少なくとも１個の認識部位を認識し、本発明と共に用いられることができるような制限酵素は、特に本明細書および説明的な実施例において提供される手引きを考慮すれば、当業者には明らかであろう。例えば、Current Protocols in Molecular Biology, 第2巻, 1995, 編者Ausubel, et al., Greene Publish. Assoc. & Wiley Interscience, Unit 3.1.15；および最新のＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓのカタログまたはウェブサイトの情報（２００５年およびそれ以降）を参照。

可能な制限酵素認識部位および同じ物を認識する対応する制限酵素の非排他的なリストが、下記で報告されている。
一例として、ＩＩＳ型ＲＥ、例えばＭｍｅＩは、ライゲーションされたＲＮＡ−ＤＮＡリンカーに隣接する一定の長さのＤＮＡまたはＲＮＡタグを生成するために用いられることができる。特に、ＭｍｅＩ認識部位は、ＲＮＡまたはＤＮＡリンカーの二本鎖領域の末端に、ＭｍｅＩ切断の際にそのＲＮＡまたはＤＮＡ配列に由来する１７〜２１ｂｐのタグ配列が今ライゲーションされたＲＮＡリンカーおよびＤＮＡリンカーに連結されているように、配置されることができる。１つのＭｍｅＩ部位がＲＮＡおよびＤＮＡリンカーのそれぞれの中に現れる場合、２つの生成されたタグ（１つはＤＮＡタグ、別のタグはＲＮＡタグ）が、今ライゲーションされたＲＮＡリンカーおよびＤＮＡリンカーに隣接する。その２つのタグは、さらなる下流の操作、例えばＰＣＲ増幅、コンカテマー化、または配列決定が実施されることができるように、平滑末端化により追加で処理されることができる。

本発明と共に用いられることができる一部の網羅的ではないＩＩ型制限酵素の例は、以下の制限酵素を含む：ＡａｒＩ、ＡｃｅＩＩＩ、ＡｌｏＩ、ＢａｅＩ、Ｂｂｒ７Ｉ、ＢｂｖＩ、ＢｂｖＩＩ、ＢｃｃＩ、Ｂｃｅ８３Ｉ、ＢｃｅＡＩ、ＢｃｅｆＩ、ＢｃｇＩ、ＢｃｉＶＩ、ＢｆｉＩ、ＢｉｎＩ、ＢｐｌＩ、ＢｓａＸＩ、ＢｓｃＡＩ、ＢｓｅＭＩＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＩ、ＢｓｍＡＩ、ＢｓｍＦＩ、Ｂｓｐ２４Ｉ、ＢｓｐＣＮＩ、ＢｓｐＭＩ、ＢｓｒＩ、ＢｓｒＤＩ、ＢｓｔＦ５Ｉ、ＢｔｇＺＩ、ＢｔｓＩ、ＣｊｅＩ、ＣｊｅＰＩ、ＥｃｉＩ、Ｅｃｏ３１Ｉ、Ｅｃｏ５７Ｉ、Ｅｃｏ５７ＭＩ、Ｅｓｐ３Ｉ、ＦａｌＩ、ＦａｕＩ、ＦｏｋＩ、ＧｓｕＩ、ＨａｅＩＶ、ＨｇａＩ、Ｈｉｎ４Ｉ、ＨｐｈＩ、ＨｐｙＡＶ、Ｋｓｐ６３２Ｉ、ＭｂｏＩＩ、ＭｌｙＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＰｐｉＩ、ＰｓｒＩ、ＲｌｅＡＩ、ＳａｐＩ、ＳｆａＮＩ、ＳｓｐＤ５Ｉ、Ｓｔｈ１３２Ｉ、ＳｔｓＩ、ＴａｑＩＩ、ＴｓｐＤＴＩ、ＴｓｐＧＷＩ、ＴｓｐＲＩおよびＴｔｈ１１１ＩＩ（ＲｅｂａｓｅＥｎｚｙｍｅｓのウェブサイトにおけるリストを参照：rebase.neb.com/cgi-bin/outsidelist；Szybalski, W., 1985, Gene, 40:169も参照）。所望の長さ（例えば１０〜２５ｂｐ〜数百ｂｐ）のタグ配列を生成することができる類似の特性を有する、当該技術で既知の他の適切なＲＥ酵素または後に発見される適切なＲＥ酵素も、本発明を実施するために用いられることができる。

特定の態様において、制限酵素は、ＩＩＳ型酵素である。特定の態様において、ＲＥは、約１０〜２５ｂｐまたは１５〜２０ｂｐのＤＮＡまたはＲＮＡタグ配列を生成する。特定の態様において、ＲＥは、ＭｍｅＩまたはＧｓｕＩである。

いくつかのクラスＩＩ制限酵素の認識部位および切断部位の他の例は、以下のものを含む（カッコ中にあるのは認識部位および切断部位である）：ＢｂｖＩ（ＧＣＡＧＣ８／１２）、ＨｇａＩ（ＧＡＣＧＣ５／１０）、ＢｓｍＦＩ（ＧＧＧＡＣ１０／１４）、ＳｆａＮＩ（ＧＣＡＴＣ５／９）、およびＢｓｐＩ（ＡＣＣＴＧＣ４／８）。

人工制限エンドヌクレアーゼも、用いられることができる。これらのエンドヌクレアーゼは、タンパク質工学より調製されることができる。例えば、エンドヌクレアーゼＦｏｋＩは、それがＤＮＡ基質の両方の鎖上のその認識部位からさらに離れた１個のヌクレオチドを切断するように、挿入により操作されている。Li and Chandrasegaran, Proc. Nat. Acad. Sciences USA, 90:2764-8, 1993を参照。そのような技法は、望ましい認識配列および望ましい認識部位から切断部位までの距離を有する制限エンドヌクレアーゼを調製するように適用されることができる。

従って、特定の態様において、本発明の組成物および方法に有用であり得るＲＥ酵素は、人工制限エンドヌクレアーゼ、例えば認識部位の外側でＩＩＳ型のタイプの切断断片を生成することができる人工制限エンドヌクレアーゼを含む。しかし、特定の他の態様において、本発明の組成物および方法に有用であり得るＲＥ酵素は、人工制限エンドヌクレアーゼを除外する。

特定の態様において、ＩＩＢ型制限酵素認識部位は、デザイン（ｄｅｓｉｇｎ）ＤＮＡおよび／またはＲＮＡリンカー中に組み込まれることができる。ＩＩＢ型制限酵素（例えばＢｃｇＩおよびＢｐｌＩ）は、ＡｄｏＭｅｔおよびＭｇ^２＋補助因子の両方を必要とする多量体であり、それらは、それらの認識の両側でＤＮＡを切断して認識部位を切り抜く。従って、ＩＩＢ型ＲＥ部位は、連結されたＲＮＡおよびＤＮＡリンカーにかかる（ｓｐａｎ）、もしくはまたがる（ｓｔｒａｄｄｌｅ）（例えば、ライゲーションされたＤＮＡおよびＲＮＡリンカーが完全なＩＩＢ型ＲＥ部位を再構成するように、ＲＥ部位の一部がＲＮＡリンカー上にあり、ＲＥ部位の残りの部分がＤＮＡリンカー上にある）、または完全にＲＮＡリンカーもしくはＤＮＡリンカーの内部にあるように操作されることができる。ＩＩＢ型ＲＥによる消化の際に、ＲＮＡおよびＤＮＡタグの両方が生成されることができる。

特定の態様において、ＩＩＧ型ＲＥ（例えばＡｃｕＩ）認識部位は、ＩＩＳ型ＲＥ部位の代わりに用いられることができる。そのようなＩＩＧ型ＲＥは、連続する配列を認識し、片側においてのみ切断する（ＡｃｕＩ）。

全ての適切なＩＩ型ＲＥ、例えばその認識配列の外側を片側または両側で切断するＩＩ型ＲＥの認識部位のリストは、様々な源から得られることができる。例えば、本明細書に参照により援用される、A. Pingoudにより編集されたRestriction Endonucleases (Nucleic Acids and Molecular Biology), Springer；２００４年版（２００４年１２月１日）を参照。また、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓの２０１０年のカタログおよびその後の更新（参照により本明細書に援用される）も参照。

特定の態様において、Ｉ型制限酵素も、ＲＮＡまたはＤＮＡタグ、特にＤＮＡタグを生成するために用いられることができる。例えば、Ｉ型ＲＥ認識部位は、ＤＮＡリンカー中に、ＲＥが連結された染色体ＤＮＡにおいてランダムな距離で切断するように含まれることができる。

特定の態様において、ＩＩＩ型ＲＥ認識部位（例えば、ＥｃｏＰ１５Ｉ部位）が、ＲＮＡおよび／またはＤＮＡリンカー中で用いられることができる。ＩＩＩ型ＲＥ酵素は、それらの認識配列の外側で切断し、同じＤＮＡ分子内の２個の逆向きのそのような配列を切断を成し遂げるために必要とする。それぞれの切断のための２個の必要とされる認識部位は、ＤＮＡリンカー内に完全に含有されていることができ、またはＲＮＡリンカー内に完全に含有されていることもでき、または両方のリンカー中に（正しく連結されたＲＮＡ−ＤＮＡリンカーのみがＲＥ認識部位を再生させるように）含有されていることもできる。

ＩＩＩ型制限部位（単数または複数）およびＩＩＩ型酵素（単数または複数）の例が、例えばMatsumura et al., SuperSAGE, Proc. Natl. Acad. Sci., USA 100(26):15718-23 (Dec. 2003); Moencke-Buchner et al., J. Biotechnol., 114: 99-106, 2004; Mucke et al., J. Mol. Biol,. 312: 687-698, 2001; Rao et al., J. Mol. Biol., 209: 599-606, 1989; Hadi et al., J. Mol. Biol,. 134: 655-666, 1979において記載されており、全て参照により本明細書に援用される。ＩＩＩ型制限酵素は、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＮＥＢ）から購入されることもできる。特に、本発明の態様を実施するための典型的なＩＩＩ型ＲＥは、ＩＩＩ型酵素ＥｃｏＰ１５Ｉである。ＥｃｏＰ１５Ｉの認識部位（単数または複数）は、ＣＡＧＣＡＧ（２５／２７）である。

上記の制限部位の全てが、ＤＮＡまたはＲＮＡリンカーにおいて一緒に用いられることができる。例えば、ＲＮＡリンカーは、ＩＩＳ型ＲＥ部位を含むことができ、対応するＤＮＡリンカーは、ＲＥ部位を有しない、ＩＩＧ型部位を有する、またはＩＩＩ型ＲＥ部位を有することができる、等。

４．コンカテマーおよびライブラリー
特定の態様において、本発明の単離されたＰＥＴポリヌクレオチドは、他の単離されたＰＥＴポリヌクレオチドと繋がれて、またはコンカテマー化されて、ＰＥＴポリヌクレオチドのコンカテマーを形成することができる。あらゆる数のＰＥＴポリヌクレオチドが、配列決定の目的のために、または適切なプラスミドもしくはベクター中へのクローニングのために、一緒に繋げられることができる。

従って、別の側面において、本発明は、少なくとも２個のＰＥＴポリヌクレオチドを含むＰＥＴポリヌクレオチドのコンカテマーを提供し、それぞれが、少なくとも１個のＤＮＡタグおよび少なくとも１個のＲＮＡタグを含み、ここで、ＤＮＡタグは染色体またはゲノムＤＮＡから得られ、ＲＮＡタグはｎｃＲＮＡのｃＤＮＡから得られ、ここで、ＤＮＡおよびｎｃＲＮＡのｃＤＮＡは、架橋された核酸−タンパク質複合体から、本発明のＲＮＡ／ＤＮＡリンカーおよび方法を用いて得られる。

従って、ＰＥＴポリヌクレオチドのコンカテマーのそれぞれのＰＥＴポリヌクレオチドは、ＲＮＡタグ−ＲＮＡリンカー−ＤＮＡリンカー−ＤＮＡタグ（または逆の方向性）の一般構造を有することができる。

コンカテマーは、多くの当該技術で認められている方法のいずれかにより形成されることができる。特に、長さが制御されるコンカテマー化の方法（Ruan et al.、米国特許出願公開第２００８／０１２４７０７Ａ１号、参照により本明細書に援用される）が用いられることができる。別の例において、単離されたＰＥＴポリヌクレオチドは、必要であれば、両方の末端において、その末端が（ＩＩ型）制限酵素により消化されることができる１個以上のアダプターオリゴヌクレオチド（単数または複数）に連結される前に、仕上げされる（ｐｏｌｉｓｈｅｄ）ことができる。消化産物は、個々のＰＥＴポリヌクレオチドのコンカテマー化を促進することができる適合性粘着末端を有することができる。ＲＥ部位が、ＰＥＴポリヌクレオチドの末端に連結された全部のアダプターに関して同じである場合、全部の粘着末端が、ライゲーションおよびコンカテマー化に適合性であり、個々のＰＥＴポリヌクレオチドは、ヘッドトゥーテール様式またはヘッドトゥーヘッド様式のどちらでも、独立して一緒に連結されることができる。アダプターが異なる場合、例えば、第１ＲＥ部位を有する第１アダプターがＲＮＡタグに連結されることができ、一方で第２（異なる）ＲＥ部位を有する第２アダプターがＤＮＡタグに連結されることができる。コンカテマー化の際は、全部のＰＥＴポリヌクレオチドが、ヘッドトゥーヘッド様式で連結されるであろう。

従って、ＰＥＴポリヌクレオチドのコンカテマーのそれぞれのＰＥＴポリヌクレオチドは、独立して（末端のＰＥＴポリヌクレオチドに関して）１個または（内部のポリヌクレオチドに関して）２個の別のＰＥＴポリヌクレオチドに、ヘッドトゥーテールまたはヘッドトゥーヘッド様式で連結されていることができる。特定の態様において、コンカテマー内の全部のＰＥＴポリヌクレオチドは、ヘッドトゥーヘッド様式で連結されている。

ＰＥＴポリヌクレオチドのＤＮＡおよび／またはＲＮＡリンカーは、少なくとも１個の制限酵素認識部位、例えばＩＩＳ型制限酵素（例えばＭｍｅＩまたはＧｓｕＩ）に関するＲＥ認識部位を含むことができる。

ＰＥＴポリヌクレオチドのコンカテマーは、ベクターもしくは細胞中に挿入される、またはベクターもしくは細胞においてクローニングされることができ；その細胞は、細菌細胞であることができる。ＰＥＴポリヌクレオチドのクローニングされたコンカテマーは、所望であればＲＥにより消化され、個々に単離されることができる。

コンカテマー化され得る本発明のＰＥＴポリヌクレオチドの数はＰＥＴポリヌクレオチドの長さに依存することは、明らかであると考えられ、それは、当業者により過度の実験操作なしに容易に決定されることができる。コンカテマーの形成後、多重タグは、配列分析のためにベクター中にクローニングされることができ、またはそのコンカテマーは、当業者に既知の方法により、例えば本明細書で記載される、もしくは当該技術で既知の、単分子配列決定法を含むいわゆる次世代高スループット配列決定法のいずれかにより、クローニングを用いずに直接配列決定されることもできる。従って、ＰＥＴポリヌクレオチドのコンカテマー化は、多数のＰＥＴポリヌクレオチドを単一のベクターまたはクローン内で配列決定することによる連続的な様式での核酸分子の効率的な分析を可能にする。

関連する側面において、本発明は、少なくとも２個のＰＥＴポリヌクレオチドを含むＰＥＴポリヌクレオチドのライブラリーを提供し、それぞれが少なくとも１個のＤＮＡタグおよび少なくとも１個のＲＮＡタグを含み、ここで、ＤＮＡタグは、染色体またはゲノムＤＮＡから得られ、ＲＮＡタグは、ｎｃＲＮＡのｃＤＮＡから得られ、ここで、ＤＮＡおよびｎｃＲＮＡのｃＤＮＡは、架橋された核酸−タンパク質複合体から、ＲＮＡ／ＤＮＡリンカーおよび本発明の方法を用いて得られる。

特定の態様において、ライブラリーは、１０００万までのＰＥＴポリヌクレオチド、または１００万、１０万、１万、１０００、１００、もしくは１０までのＰＥＴポリヌクレオチドを含むことができる。

特定の態様において、ライブラリーは、あらゆる増幅、例えばＰＣＲ増幅を経ていない。
特定の態様において、ライブラリーは、ライブラリー内の少なくとも２つのメンバーが、増幅、例えばＰＣＲ増幅、ローリングサークル増幅、クローニングされた遺伝物質の生物学的増幅、またはあらゆる他の既知の増幅法に由来するように、増幅されている。ＰＣＲプライマーおよびプローブの配列は、ＰＥＴポリヌクレオチドの末端に連結されたＰＣＲアダプターの情報に基づいて、またはクローニングされたＰＥＴポリヌクレオチドもしくはそのコンカテマーに隣接するクローニングベクター上のプライマー配列に基づいて調製されることができる。

次いで、ＰＥＴポリヌクレオチドを含有するＰＣＲまたは他の増幅産物は、（アダプター内の）隣接するＲＥ制限部位を認識する酵素を用いて単離されて増幅されたライブラリーを生成することができ、それは、多くの下流の分析の全てのために用いられることができる。

特定の態様において、増幅の前または後のＰＥＴポリヌクレオチドコンカテマーは、適切な大きさに関して、ゲル電気泳動およびゲルの切り出しを含むあらゆる標準的な方法により選択されることができる。適切な大きさに関する選択における主な考慮事項は、その大きさが、プライマーダイマーおよびアニーリングしなかったアダプターの大きさより上であり、特定の長い線状多量体の大きさより下であるべきであることである。特に、おおよそ１００〜１０００ｂｐ、または２００〜５００ｂｐの大きさを有するコンカテマーが、選択されることができる。従って、大きさの選択により、利点は、長い線状多量体が、それらの大きさがその大きさの範囲より上であろうために排除され得ることである。同様に、短すぎる断片、アニーリングしなかったアダプターおよびプライマーダイマーも、排除されることができる。

５．クロマチン免疫沈降（ＣｈＩＰ）
特定の態様において、本発明の方法は、特定のｎｃＲＮＡ−クロマチン／タンパク質−ＤＮＡ相互作用を同定するために用いられることができる。例えば、特定の態様において、特定のクロマチン構成要素またはタンパク質と関係するあらゆるｎｃＲＮＡ−ＤＮＡ−クロマチン相互作用を決定することは、興味深い可能性がある。本発明の方法は、さらに、対象のタンパク質を免疫沈降するためにＣｈＩＰを用いることを含む。

ＣｈＩＰは、特定のタンパク質、例えばヒストンおよび核酸に核酸−タンパク質複合体で結合する他のタンパク質と会合するゲノム領域を富化し、それによりその同定を可能にするために用いられてきた（Taverner et al., Genome Biol., 2004, 5(3):210において総説されている）。その目的は、タンパク質をＤＮＡと、それらの相互作用の部位において架橋することである。

これは、適切な固定剤、例えばホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、アセトン、メタノール、または他の二官能性架橋試薬（またはその混合物）を、培養状態の生きた細胞に直接添加することにより、迅速かつ効率的に成し遂げられることができる。次いで、これらの固定された細胞の粗製の抽出物が調製され、本発明の方法に従ってクロマチンが断片化される。例えば、断片化は、所望の平均の大きさ（例えば通常は約１ｋｂ）が達成されるような物理的剪断（例えば超音波処理、水力剪断、皮下注射針を通す吸い込みの繰り返しによる剪断）によって達成されることも、または酵素消化（例えば制限酵素消化、または制御されたタイミング、酵素濃度、温度、ｐＨ等でのエンドヌクレアーゼによる消化）によって達成されることもできる。次いで、架橋および剪断されたクロマチン断片は、対象の特定のタンパク質（例えば転写因子またはヒストン）に対して産生された抗体を用いた免疫沈降反応において用いられる。それぞれの免疫沈降で富化された架橋されたｎｃＲＮＡおよびＤＮＡ断片は、続いて本発明のＤＮＡおよびＲＮＡリンカーを用いて近接ライゲーションにより連結され、次いで（例えば熱および／またはプロテイナーゼＫ消化により）タンパク質構成要素から脱連結され、または架橋を逆行し、本発明の方法によるそれらの同定を可能にするために精製される。

ＣｈＩＰを用いる利点は、このアプローチが、ｎｃＲＮＡまたは遺伝子制御ネットワークを、そのような相互作用がクロマチンおよび他の非ヒストンタンパク質の急速な架橋によりそれらの天然の状態で存在するため、生きた細胞中で“凍結する”ことができ、それによりそれは、理論上、例えば異種性発現により強いられる可能性のある人為産物を含まない、特定のｎｃＲＮＡまたは遺伝子制御ネットワークのあらゆる時点における“真の”写真に相当することである。

６．適用
本発明の方法および組成物は、ｎｃＲＮＡおよびゲノム座位の間の相互作用を、偏りのない全体的なレベルまたは対象の特定のｎｃＲＮＡもしくは特定のクロマチン構成要素のレベルのどちらにおいても同定することを可能にする。本方法を用いて得られる情報は、多種多様な研究および開発設定において用いられることができる。

例えば、本発明は、以前には未知の、または不完全に理解された機能を有し得る特定のｎｃＲＮＡのクロマチン標的を同定するための方法を提供し、その方法は、特定のｎｃＲＮＡおよびそのゲノム標的配列の間の相互作用を、本発明の方法および組成物を用いて決定することを含む。同定されたゲノム標的配列は、ｎｃＲＮＡがその生物学的機能を発揮する候補標的に相当する。

関連する側面において、本発明は、特定の遺伝子またはゲノム領域、例えば腫瘍抑制因子遺伝子または癌遺伝子を有する遺伝子またはゲノム領域と相互作用するｎｃＲＮＡを同定するための方法を提供し、その方法は、ゲノムの特定の遺伝子またはゲノム領域およびｎｃＲＮＡの間の相互作用を、本発明の方法および組成物を用いて決定することを含む。同定されたｎｃＲＮＡは、遺伝子機能の候補調節因子（例えば、サプレッサー、エンハンサーまたは補助活性化因子）に相当する。

特定の態様において、その方法は、さらに、２以上の試料の間でｎｃＲＮＡおよび遺伝子／ゲノム領域の間の相互作用の存在／非存在または程度を比較することを含む。そのような比較は、その相互作用の生物学的重要性および試料間のあらゆる観察された違いをさらに解読するのを助けることができる。

例えば、試料の１つは、健康な対照試料であることができ、その他の試料は、疾患試料、例えば動物モデル（例えばマウスまたはラットモデル）からの疾患試料；特定の処置の前および後の疾患試料；処置の異なる段階にわたる疾患試料；特定の処置に応答した患者、または処置に抵抗性である患者、または処置後に再発した患者からの疾患試料であることができる。

特定の態様において、試料の１つは、患者由来の幹細胞または誘導多能性幹（ｉＰＳ）細胞であり、場合により、その他の試料は、そのような幹細胞またはｉＰＳ細胞から分化した細胞株であることができる。ここで、特定のｎｃＲＮＡ−クロマチン相互作用は、発生または分化プログラムの開始と関係している可能性がある。

特定の態様において、試料（単数または複数）は、ヒト、非ヒト霊長類／哺乳類、家畜動物（ウシ、ウマ、ブタ、ヒツジ、ヤギ、ニワトリ、ラクダ、ロバ、ネコ、およびイヌ）、哺乳類モデル動物（マウス、ラット、ハムスター、モルモット、ウサギまたは他のげっ歯類）、両生類（例えばアフリカツメガエル）、魚類（例えばゼブラフィッシュ）、昆虫（ショウジョウバエ）、線虫（例えばＣ．エレガンス（Ｃ．ｅｌｅｇａｎｓ））、植物、藻類、真菌（酵母、例えば出芽酵母（Ｓ．ｃｅｒｅｖｉｓａｅ）または分裂酵母）からのものであることができる。試料（単数または複数）は、確立された細胞株の組織培養物、培養された一次細胞、（新しく解剖された、または凍結された）組織生検等であることができる。

実施例９において示されるように、本発明の方法は、ｎｃＲＮＡ−ＣＣＡＴ１（結腸癌関連転写産物１）を、この座位における非常に複雑な転写産物イソ型構造を有するものとして同定した。ＲＩＣｈ−ＰＥＴデータは、ＣＣＡＴ１の可能性のある機能および基礎をなす機序の重要な洞察を提供する。具体的には、ＣＣＡＴ１座位自体が重要なエンハンサーの特徴を有すること、ＣＣＡＴ１座位は子宮頸癌細胞株であるＨｅＬａ細胞において高度に転写されていることが分かり、ＲＩＣｈ−ＰＥＴデータは、この座位からの転写産物は他のエンハンサーおよびプロモーター領域を標的とすることを示している。例えば、ＣＣＡＴ１ｎｃＲＮＡ転写産物により標的とされる１２２の座位（それぞれ３以上のＲＮＡタグによる）に関して、８８の座位は、ＲＮＡＰＩＩ相互作用を有する６のエンハンサー座位を含むエンハンサー領域である。別の３４の座位は、プロモーター領域内である。これは、ＣＣＡＴ１標的遺伝子は平均してランダムに選択された遺伝子の群よりも高度に発現されているという観察と一致する。従って、ｌｎｃＲＮＡＣＣＡＴ１は、癌遺伝子ｃ−ｍｙｃを含む遺伝子のネットワークを活性化するための転写補助因子として作用している可能性がある。

従って、本発明の別の側面は、ＣＣＡＴ１を発現している癌を処置するための方法を提供し、その方法は、ＣＣＡＴ１にコードされるｌｎｃＲＮＡの拮抗薬を投与することを含む。

関連する側面において、本発明は、ＣＣＡＴ１の遺伝子産物（例えば転写されたｌｎｃＲＮＡ）により媒介される転写活性化または同時活性化を崩壊させるための方法であって、遺伝子産物をＣＣＡＴ１にコードされるｌｎｃＲＮＡの拮抗薬と接触させることを含む方法を提供する。特定の態様において、転写活性化または同時活性化は、癌細胞において起こる。特定の態様において、転写活性化または同時活性化は、ｃ−ｍｙｃ、ＦＡＮ８４Ｂ、および／またはＳＮＸ１４に関する。特定の態様において、転写活性化または同時活性化は、ＣＣＡＴ１ゲノム座位を標的遺伝子座位に物理的に近接させることにより達成される。

特定の態様において、癌は、結腸癌（例えば結腸の腺癌）、直腸癌、子宮頚癌、肺癌、胃癌、肝臓癌、およびそれらの転移である。特定の態様において、癌は、ＣＣＡＴ１転写産物を、マッチする、または対照試料と比較して２倍、３、５、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２０、１５０、１７５、２００、２５０、３００、５００、１０００倍高いレベルで発現している。

特定の態様において、拮抗薬は、場合により例えば血清安定性、薬理学的特性または薬物動態特性等を向上させるために修飾ヌクレオチドを含み得るアンチセンスポリヌクレオチドである。修飾ヌクレオチドは、ＰＮＡ、ＬＮＡ、２’−Ｏ−アルキルもしくは他の２’修飾、および／または糖−ホスフェート主鎖における修飾を含み得る。

特定の態様において、拮抗薬は、コードされるＣＣＡＴ１ｌｎｃＲＮＡを標的とするｓｉＲＮＡまたはｍｉＲＮＡコンストラクトである。
本発明は、ＣＣＡＴ１ｌｎｃＲＮＡの拮抗薬（アンチセンス、ｓｉＲＮＡ、ｍｉＲＮＡ、または同じ物をコードする／発現するベクターも提供する。

別の側面において、本発明は、薬物スクリーニングのための方法を提供し、その方法は、薬物の有効性および本発明の方法により同定された特定の観察されたｎｃＲＮＡ−クロマチン相互作用（例えば、応答性の患者では同定されるが抵抗性の患者では同定されない相互作用）の間の統計的に有意な関連または相関を確立し、複数の候補薬物のその統計的に有意な関連または相関への作用を決定し、そしてその統計的に有意な関連または相関を促進する候補薬物を同定することを含む。

特定の態様において、候補薬物の作用は、抵抗性の患者からの試料を用いて試験される。これは、抵抗性の患者においてその統計的に有意な関連を修復する候補薬物の同定を可能にすることができる。

別の側面において、本発明は、疾患を処置するための標的遺伝子を同定するための方法を提供し、その方法は、以下の工程を含む：（１）本発明の方法を用いて、（観察されたｎｃＲＮＡ−ゲノムＤＮＡ相互作用の中から）薬物の有効性および特定のｎｃＲＮＡ−ゲノムＤＮＡ（遺伝子）相互作用の間の統計的に有意な関連（例えば、処置に応答性の患者において有効性が観察される場合はいつでも、特定のｎｃＲＮＡ−ゲノムＤＮＡ（遺伝子）の相互作用（単数または複数）が観察される；処置に応答性ではない患者において有効性が観察されない場合はいつでも、その特定のｎｃＲＮＡ−ゲノムＤＮＡ（遺伝子）の相互作用（単数または複数）が観察されない）を同定し、（２）関与するｎｃＲＮＡおよび／またはＤＮＡ（遺伝子）の発現レベルを決定し；ここで、そのＤＮＡ（遺伝子）は、薬物の有効性が増大したｎｃＲＮＡ発現およびＤＮＡ（遺伝子）発現の阻害と関係している場合、その疾患を処置するための可能性のある標的遺伝子として同定される。

本発明の組成物および方法は、特定のゲノム中のまだ未知のｎｃＲＮＡを同定するために、本発明の方法はそのようなｎｃＲＮＡを同定するための偏りのないアプローチであるため、用いられることもできる。ＰＥＴポリヌクレオチドのクラスターが、タンパク質を一切コードしていないゲノムのある領域におけるＲＮＡタグのクラスターを一貫して同定し、これらのＲＮＡタグを対応するＤＮＡタグにより表される（離れた、例えば染色体間）座位に一貫して連結する場合、そのＲＮＡタグはｎｃＲＮＡを明らかにしている可能性が高い。

本発明のスクリーニング法により同定されたあらゆる候補療法試薬または標的遺伝子は、インビトロおよび／またはインビボで、疾患または病気と相関する周知の実験モデルを用いて検証されることができる。例えば、特定のｎｃＲＮＡが癌遺伝子の発現を促進するものとして（または腫瘍抑制因子遺伝子の発現を阻害するものとして）同定され、従って候補薬物標的になった場合、ｎｃＲＮＡの拮抗薬、例えばｓｉＲＮＡ、ｍｉＲＮＡ、アンチセンス等を用いる可能性のある療法が、インビトロおよび／またはインビボでさらに検証されることができ、後者は、確立された癌モデルにおいて、例えばモデル動物、例えば処置されるべき癌のマウスモデルにおいて実施されることができる。

マウスは、薬物の発見および開発のための十分に確立されたモデルであり、多くの異なる系統が入手可能である。例えば、癌を研究するための多数の有用なモデルが、発達したいくつかのデータベース、例えばＥｍｉｃｅ(emice.nci.nih.gov)、癌モデルデータベース(cancermodels.nci.nih.gov)および癌イメージデータベース(cancerimages.nci.nih.gov)を有するヒト癌のマウスモデル・コンソーシアム、または他の源、例えばジャクソン研究所（jaxmice.jax.org/list/rax3.htmlを参照）により配布される癌研究モデルにおいて見つけられることができる。一次癌生検または細胞株のどちらかを用いるさらなる異種移植モデルが、癌を研究するために有用である。

例えば、候補ｎｃＲＮＡに対する可能性のある拮抗薬の有効性が検証され得る肺癌モデルを開発するために、６〜８匹の８週齢のメスの免疫不全マウス、例えばＣＢ１７−ＳＣＩＤベージュマウス（Ｔａｃｏｎｉｃ，カタログ番号ＣＢＳＣＢＧ）またはＮＯＤ／ＳＣＩＤ（ジャクソン研究所カタログ番号００１３０３）またはＮＳＧとしても知られているＮＯＤＳＣＩＤガンママウス（ジャクソン研究所カタログ番号５５５７）に、ヒト肺癌Ａ５４９細胞（ＡＴＣＣ（登録商標）ＣＣＬ−１８５）を皮下または左肺経由のどちらかで経胸（同所性（ｏｒｔｈｏｔｏｐｉｃ）；１０^４／ｓｕｐ細胞／２５μＬ）注射する。腫瘍を有するマウスに、中和抗ＣＸＣＬ１２もしくは免疫前血清を腹腔内注射し、または処置を与えない。あるいは、腫瘍を有するマウスを、Ｐｌａｔｉｎｏｌ（シスプラチン）もしくはＡｂｉｔｒｅｘａｔｅ（メトトレキサート）もしくはパクリタキセル、または他の化合物で処置することができる。腫瘍を、処置済みおよび未処置の様々な時点で分離する。非コードＲＮＡを、前に記載された方法に従って同定する。

７．ＣＣＡＴ１転写産物、拮抗薬、およびその使用
別の側面において、本発明は、本発明の方法により同定された様々なＣＣＡＴ１転写産物、それらのｃＤＮＡ配列（両方の鎖）、拮抗薬（例えば、これらのＣＣＡＴ１ｎｃＲＮＡ転写産物の機能に拮抗するアンチセンス配列、ｓｉＲＮＡまたはｍｉＲＮＡコンストラクト）を提供する。

ＣＣＡＴ１ｎｃＲＮＡの異なるイソ型に相当する８個の同定されたｃＤＮＡ配列が、下記でＳＥＱＩＤＮＯ：１〜８において提供されている。
＞ＣＣＡＴ１＿ＪＡＸ＿１転写産物配列；ゲノム位置：８番染色体：１２８１２８６５５〜１２８２４１５７１鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿２転写産物配列；ゲノム位置：８番染色体：１２８１２８６５５〜１２８２３２６５３鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿３転写産物配列；ゲノム位置：８番染色体：１２８１５２９８９〜１２８２３１０９４鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿４転写産物配列；ゲノム位置：８番染色体：１２８１６０４９７〜１２８２３２６５３鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿５転写産物配列；ゲノム位置：８番染色体：１２８１７２６３４〜１２８２３１０９４鎖：−

＞＿ＣＣＡＴ１＿ＪＡＸ＿６転写産物配列；ゲノム位置：８番染色体：１２８１９７８１０〜１２８２４０３７７鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿７転写産物配列；ゲノム位置：８番染色体：１２８１８６４４３〜１２８２４０３７７鎖：−

＞ＣＣＡＴ１＿ＪＡＸ＿８転写産物配列；ゲノム位置：８番染色体：１２８２１８８３３〜１２８２４０３７７鎖＝−

ＳＥＱＩＤＮＯ：１〜８のそれぞれに関して、それぞれのＣＣＡＴ１ｎｃＲＮＡ転写産物イソ型と同じ配列（ＲＮＡにおけるＵがｃＤＮＡにおいてＴで置き換わっていることを除く）を有するｃＤＮＡ配列の“−”鎖が、３’末端から５’末端へと示されている。加えて、それぞれのｃＤＮＡの“−”鎖の最初および最後のヌクレオチドも、それらはゲノム配列上の対応するヌクレオチドにマッピングされているため、示されている（例えば、ＳＥＱＩＤＮＯ：１において、５’末端における最初のｃＤＮＡヌクレオチドＣは、ヒトゲノムの８番染色体上のヌクレオチド１２８１２８６５５に対応し、５’末端における最後のｃＤＮＡヌクレオチドＴは、ヒトゲノムの８番染色体上のヌクレオチド１２８２４１５７１に対応する）。

さらに、以下の表は、ヒト８番染色体上のヌクレオチド位置により表されたそれぞれのＣＣＡＴ１転写産物のそれぞれのエキソンに関する開始および終結ヌクレオチド位置、それぞれのエキソンの長さ、および対応するゲノム配列範囲を含む、８種類の転写産物ＣＣＡＴ１＿ＪＡＸ＿１〜ＣＣＡＴ１＿ＪＡＸ＿８（それぞれＳＥＱＩＤＮＯ：１〜８）に関する追加の情報を列挙している。

これらのＣＣＡＴ１転写産物は、下記でＮＣＢＩ参照配列：ＸＲ＿１３３５００．３において記載されるＣＣＡＴ１転写産物とは異なる：

従って、一側面において、本発明は、ＣＣＡＴ１ｎｃＲＮＡ転写産物のｃＤＮＡ配列を提供し、ここで、そのｃＤＮＡ配列は、ＳＥＱＩＤＮＯ：１〜８からなる群から選択される配列により表される。

関連する側面において、本発明は、ＣＣＡＴ１ｎｃＲＮＡの拮抗薬配列を提供し、ここで、その拮抗薬配列は、ＣＣＡＴ１ｎｃＲＮＡの機能に拮抗する。
特定の態様において、その拮抗配列は、ＳＥＱＩＤＮＯ：９に対応するＣＣＡＴ１ｎｃＲＮＡの機能に拮抗しない。

特定の態様において、その拮抗薬配列は、ＳＥＱＩＤＮＯ：１〜８において示されている“−”鎖ｃＤＮＡ配列のいずれか１つに対するアンチセンス配列である。
特定の態様において、そのアンチセンス配列は、ＳＥＱＩＤＮＯ：１〜８において示されている“−”鎖ｃＤＮＡ配列のいずれか１つに、生理的条件下（例えば細胞の核中）で、または高ストリンジェンシーハイブリダイゼーション条件、例えばCold Spring Harbor Laboratory Pressにより出版された、SambrookおよびRussellによるMolecular Cloning:A Laboratory Manual、第３版、２００１（本明細書に参照により援用される）において記載されている条件下でハイブリダイズする（がＳＥＱＩＤＮＯ：９において示されている“−”鎖ｃＤＮＡ配列にはハイブリダイズしない）。１つのそのような高ストリンジェンシーハイブリダイゼーション条件は、おおよそ４５℃における６×塩化ナトリウム／クエン酸ナトリウム（ＳＳＣ）、続いて５０℃における、５５℃における、または約６０℃における、または約６５℃以上における０．２×ＳＳＣおよび０．１％ＳＤＳ中での１回以上の洗浄を含み得る。

特定の態様において、そのアンチセンス配列は、ＳＥＱＩＤＮＯ：１〜８において示されている“−”鎖ｃＤＮＡ配列のいずれか１つと、少なくともそのアンチセンス配列がｃＤＮＡ配列とハイブリダイズする領域において、少なくとも約４０％、５０％、６０％、７０％、８０％、８５％、９０％、９５％、９７％、９９％またはより大きい割合で同一である。特定の態様において、そのアンチセンス配列は、ＳＥＱＩＤＮＯ：９に約５０％、４０％、３０％、２０％より大きくない割合で同一である。

特定の態様において、アンチセンス配列は、約１０、１２、１４、１６、２０、２２、２４、２６、２８、３０ヌクレオチド長またはより大きいヌクレオチド長である。
特定の態様において、拮抗薬配列は、ＳＥＱＩＤＮＯ：１〜８において示されている“−”鎖ｃＤＮＡ配列により表されるＣＣＡＴ１ｎｃＲＮＡイソ型のいずれか１つ以上の破壊を標的とする（が、ＳＥＱＩＤＮＯ：９において示されている“−”鎖ｃＤＮＡ配列により表されるＣＣＡＴ１ｎｃＲＮＡイソ型の破壊は標的としない）ｓｉＲＮＡまたはｍｉＲＮＡ配列である。

特定の態様において、拮抗薬配列は、そのｓｉＲＮＡ／ｍｉＲＮＡをコードしているベクター、またはプロセシングされてそのｓｉＲＮＡもしくはｍｉＲＮＡになることができるＲＮａｓｅＩＩＩ（例えばＤｉｃｅｒ）に関するｄｓＲＮＡ基質である。

特定の態様において、そのｓｉＲＮＡまたはｍｉＲＮＡは、ＣＣＡＴ１ｎｃＲＮＡイソ型の破壊を標的とする約２０〜２５ヌクレオチドのガイド配列を含む。
関連する側面において、本発明は、癌または前癌病変を診断する方法であって、生物学的試料中のＳＥＱＩＤＮＯ：１〜８のいずれか１つまたはその断片の発現のレベルを測定することを含む方法を提供し、ここで、生物学的試料中のＳＥＱＩＤＮＯ：１〜８のいずれか１つまたはその断片の発現は、癌または前癌病変を示している。特定の態様において、その断片は、ＳＥＱＩＤＮＯ：９の断片ではない。

特定の態様において、その方法はさらに、生物学的試料中で測定された発現レベルを標準と比較することを含み、ここで、その生物学的試料中のＳＥＱＩＤＮＯ：１〜８のいずれか１つまたはその断片の発現のより高いレベルは、癌または前癌病変を示している。特定の態様において、その断片は、ＳＥＱＩＤＮＯ：９の断片ではない。

特定の態様において、その方法は、以下の工程を含む：（ａ）核酸を対象から得られた生物学的試料から単離し；（ｂ）ＳＥＱＩＤＮＯ：１〜８のいずれか１つを認識することができるプローブを、その核酸と、ハイブリダイゼーション複合体の形成を可能にする条件下でハイブリダイズさせ；そして（ｃ）ハイブリダイゼーション複合体の形成を標準と比較する；ここで、その生物学的試料中のハイブリダイゼーション複合体のより高いレベルは、癌または前癌病変を示している。特定の態様において、そのプローブは、ＳＥＱＩＤＮＯ：９にはハイブリダイズしない。

特定の態様において、その方法は、以下の工程を含む：（ａ）核酸を対象から得られた生物学的試料から単離し；（ｂ）単離された核酸中のＳＥＱＩＤＮＯ：１〜８のいずれか１つまたはそのいずれかの断片を増幅し；（ｃ）増幅されたＣＣＡＴ１産物を可視化し；そして（ｄ）ＣＣＡＴ１増幅産物の量を標準と比較する；ここで、より高いレベルのＣＣＡＴ−１増幅産物の存在は、癌または前癌病変を示している。特定の態様において、その断片は、ＳＥＱＩＤＮＯ：９の断片ではない。

特定の態様において、その増幅は、ＳＥＱＩＤＮＯ：１〜８の１つ以上に特異的なプローブを用いるＰＣＲ（例えばリアルタイム定量ＰＣＲ）により実施される。
特定の態様において、その標準は、癌で苦しんでいない対象におけるＣＣＡＴ−１の発現のレベルを測定することにより決定される。関連する態様において、その標準は、同じ対象の癌ではない組織におけるＣＣＡＴ−１の発現のレベルを測定することにより決定される。

特定の態様において、癌は、結腸癌（例えば結腸の腺癌）、直腸癌、子宮頚癌、肺癌、胃癌、肝臓癌、およびそれらの転移からなる群から選択される。
特定の態様において、前癌病変は、腺腫性ポリープである。

特定の態様において、生物学的試料は、組織、血液、唾液、尿、便、および骨髄試料からなる群から選択される。
本発明の関連する側面は、プローブまたはプライマーとして有用な、ＳＥＱＩＤＮＯ：１〜８のいずれか１つまたはその相補物の少なくとも８個の連続するヌクレオチドを含むオリゴヌクレオチドを提供する。特定の態様において、そのオリゴヌクレオチドは、ＳＥＱＩＤＮＯ：９にはハイブリダイズしない。

本発明の関連する側面は、生物学的試料中のＣＣＡＴ−１の発現を検出するための方法を提供し、その方法は、以下の工程を含む：（ａ）核酸を生物学的試料から単離し；（ｂ）本発明のＣＣＡＴ１オリゴヌクレオチドプローブを、その核酸に対して、ハイブリダイゼーション複合体の形成を可能にする条件下でハイブリダイズさせ；そして（ｃ）ハイブリダイゼーション複合体の形成を標準と比較し、ここで、その生物学的試料中のハイブリダイゼーション複合体のより高いレベルは、その試料におけるＣＣＡＴ−１の発現を示している。

本発明の別の関連する側面は、ｃＤＮＡまたはその断片を含むベクターを提供し、ここで、そのｃＤＮＡは、ＳＥＱＩＤＮＯ：１〜８からなる群から選択される。特定の態様において、そのｃＤＮＡ断片は、ＳＥＱＩＤＮＯ：９にはハイブリダイズしない。

本発明の別の関連する側面は、対象のベクターを含む宿主細胞を提供する。
本発明の別の関連する側面は、以下の工程を含む、癌または前癌病変を画像化する方法を提供する：（ａ）対象に本発明のＣＣＡＴ１プローブを投与し；ここで、そのプローブは指示物質分子にコンジュゲートしており；そして（ｂ）そのプローブにコンジュゲートした指示物質分子（例えば、放射性同位体、蛍光色素、可視色素またはナノ粒子）を、画像化装置により検出する。

本発明のさらなる関連する側面は、ＳＥＱＩＤＮＯ：１〜８のいずれか１つ以上により表されるＣＣＡＴ１ｎｃＲＮＡ転写産物の機能に拮抗するための方法であって、ＣＣＡＴ１ｎｃＲＮＡを対象のＣＣＡＴ１の拮抗薬配列（例えばアンチセンス、ｍｉＲＮＡまたはｓｉＲＮＡ）と接触させることを含む方法を提供する。

特定の態様において、その方法は、インビトロで実施され、そのＣＣＡＴ１ｎｃＲＮＡ転写産物は、組織培養試料からの細胞中に存在する。
特定の態様において、その方法は、インビボで実施され、それを必要とする対象に、対象のＣＣＡＴ１の拮抗薬配列（例えばアンチセンス、ｍｉＲＮＡまたはｓｉＲＮＡ）を投与することを含む。

本発明のさらに別の関連する側面は、対象のＣＣＡＴ１の拮抗薬配列（例えばアンチセンス、ｍｉＲＮＡまたはｓｉＲＮＡ）ならびに医薬的に許容できる賦形剤および／またはキャリヤーを含む医薬組成物を提供する。

本出願において記載されているあらゆる態様は、本発明の一側面の下でのみ記載された態様を含め、本発明の他の側面の他の態様と組み合わせられることができることは、理解されるべきである。

当業者は、本明細書で具体的に教示されていない技法は、以下のような標準的な分子生物学の参考書において見付けられることができることを、理解しているであろう：Cold Spring Harbor Laboratory Pressにより出版された、SambrookおよびRussellによるMolecular Cloning:A Laboratory Manual、第３版、２００１；Oligonucleotide Synthesis (M. J. Gait, 編者, 1984)；Nucleic Acid Hybridization (B. D. HamesおよびS. J. Higgins. 編者, 1984)；PCR Technology - principles and applications for DNA amplification, 1989, (編者 H. A. Erlich) Stockton Press, ニューヨーク；PCR Protocols: A Guide to Methods and Applications, 1990, (編者 M. A. Innis et al.) Academic Press, サンディエゴ；ならびにPCR Strategies, 1995, (編者 M. A. Innis et al.) Academic Press, サンディエゴ；その全部が参照により本明細書に援用される。

上記で一般的に記載された本発明は、以下の説明的な実施例への参照により、より容易に理解されると考えられ、それは説明のためだけのものであり、何らかの点において限定することは一切意図されていない。

実施例１一般的なＲＩＣｈ−ＰＥＴ方法論
ＲＮＡ−ＤＮＡライゲーション、続いてペアエンドタグ配列決定（ＲＩＣＨ−ＰＥＴ）を用いて、出願人らは、ｎｃＲＮＡ（非コードＲＮＡ）およびクロマチンの相互作用を偏りのない全ゲノム方式で研究するための、下記で記載される典型的な方法を開発してきた。

その方法の裏にある原理的な概念は、ｎｃＲＮＡの制御機能、特に長いｎｃＲＮＡ（ｌｎｃＲＮＡ）により採用された制御機能のほとんどは、おそらく特定のクロマチン座位におけるＲＮＡ−タンパク質、ＲＮＡ−ＤＮＡ、および／またはＲＮＡ−ＲＮＡ相互作用のいずれかの組み合わせによる直接または間接的接触を有するという認識に基づいている。従って、ゲノム全体におけるクロマチン位置のｎｃＲＮＡ接触アドレスの包括的収集は、個々のおよび／または集合的なｎｃＲＮＡにより媒介される全体的な影響ならびに特異的な機能を理解するためのゲノム要素の大きな構造的枠組みおよび詳細な内容を提供するであろう。

架橋により、ＲＮＡ−クロマチン相互作用が捕捉されることができる。クロマチン線維の超音波処理による断片化の後、それぞれのクロマチン複合体中でタンパク質結合により一緒に係留されたｎｃＲＮＡおよびＤＮＡ断片は、次いで、特異性を有する高スループット分析のためにＲＮＡ分子およびＤＮＡ断片の人工的な連結関係を確立するために、対象のＲＮＡおよびＤＮＡリンカーを用いたＲＮＡ−ＤＮＡライゲーションを受ける（ｓｕｂｊｅｃｔｉｖｅ）。

本発明のＲＮＡリンカーは、あらゆる係留されたＲＮＡ分子の３’末端へのアニーリングのために、そしてＲＮＡ鋳型を第１鎖ｃＤＮＡ分子に変換するための逆転写のためのプライマーとして、ランダムオリゴヌクレオチド配列、例えばランダムヘキサヌクレオチド（ｈｅｘｏｎｕｃｌｅｏｔｉｄｅｓ）を含むことができる。一方で、本発明のＤＮＡリンカーは、平滑末端クロマチンＤＮＡ断片にライゲーションされる。ＲＮＡリンカーおよびＤＮＡリンカーは、それぞれ互いに相補的であるがそれ自体には相補的ではない粘着末端を有する。従って、一度そのリンカーが相応にそれらの意図される標的に付着したら、そのＲＮＡおよびＤＮＡ断片は、ライゲーションにより共有結合的に連結されることができる。次いで、そのハイブリッドライゲーション産物は、ペアエンドタグ（ＰＥＴ）ライブラリー構築およびその後の高スループット配列決定分析を受ける（ｓｕｂｊｅｃｔｉｖｅ）。この方法に関する概略図が、図１Ａにおいて示されている。

あるいは、修飾ＲＮＡリンカーは、ＲＮＡ−ＤＮＡライゲーション工程を実施するために用いられることができる。この方法に関する概略図が、図１Ｂにおいて示されている。
加えて、直接的なＲＮＡリンカーが、ＲＮＡの３’末端を５’をアデニル化されたｓｓＤＮＡまたは５’をアデニル化されたオーバーハングに直接連結することができる特定の酵素（例えば切り詰められたＲＮＬ２）を利用することにより、ＲＮＡ−ＤＮＡライゲーション工程を実施するために用いられることができ、後者の方法に関する概略図が、図１Ｃにおいて示されている。

タグ配列をそれらのＲＮＡまたはＤＮＡとしての本来の性質からさらに識別するため、特異的なヌクレオチドバーコードが、ＲＮＡおよび／またはＤＮＡリンカー配列設計中に組み込まれることができ、次いでそれは、ＲＩＣｈ−ＰＥＴライブラリーデータセット中の対になったＲＮＡタグおよびＤＮＡタグの正確な呼び出しを可能にする。次いで、処理されたＲＮＡタグおよびＤＮＡタグ配列は、ｎｃＲＮＡおよびそれらのクロマチン標的座位を同定するために、参照ゲノム（例えばヒト由来の配列に関して参照ヒトゲノム）にマッピングされる（データは示されていない）。

特定の実験の詳細が、下記で説明目的のために提供されている。
Ｉ．細胞培養および架橋
ＨｅＬａＳ３細胞を、５％ウシ胎児血清（ＦＢＳ）（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１００８２１４７）を補ったハムＦ−１２栄養素混合物（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１１７６５−０５４）中で増殖させた。架橋された細胞のそれぞれのバッチに関して、ＥＧＳ（スペーサーアーム：１６．１Ａ；ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ，カタログ番号２１５６５）およびホルムアルデヒド（スペーサーアーム：２．０Ａ；Ｍｅｒｃｋ−Ｃａｌｂｉｏｃｈｅｍ，カタログ番号３４４１９８−２５０ＭＬ）を用いて、細胞をタンパク質−ＤＮＡ、タンパク質−ＲＮＡおよびタンパク質−タンパク質の二重架橋のために処理し、それはホルムアルデヒドのみを用いるよりも良好な連結性を提供することができた。

２４５ｍｍスクエアプレート（Ｃｏｒｎｉｎｇ，カタログ番号４３１１１０）中の約１×１０^８個の細胞を、４５ｍｌの予め温めたＤＰＢＳ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１４１９０２５０）中１．５ｍＭＥＧＳを用いて架橋し、まず７５ｒｐｍで４０分間振盪し、次いで１％ホルムアルデヒド（Ｍｅｒｃｋ−Ｃａｌｂｉｏｃｈｅｍ，カタログ番号３４４１９８−２５０ＭＬ）を添加し、２０分間振盪を保ち、続いて０．１２５Ｍグリシン（Ｐｒｏｍｅｇａ，カタログ番号Ｈ５０７１）で１０分間停止し、次いで氷冷ＤＰＢＳで２回洗浄した。次いで、プロテイナーゼ阻害剤（Ｒｏｃｈｅ，カタログ番号１１８７３５８０００１）およびＲＮａｓｅ阻害剤（例えばＳＵＰＥＲａｓｅ・Ｉｎ（商標）ＲＮａｓｅ阻害剤、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号ＡＭ２６９６）を含有する３〜５ｍｌの氷冷ＤＰＢＳを添加し、次いで細胞を剥がし、１５ｍｌ−Ｆａｌｃｏｎチューブ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号ＡＭ１２５０）に移した。このプロセスを、全ての細胞が収集されることを確実にするために必要に応じて繰り返した。細胞を２０００ｒｐｍにおいて４℃で５分間遠心沈殿させ、次いで細胞のペレットを使用まで−８０℃で保管した。

ＩＩ．細胞溶解およびクロマチンのビオチン化
細胞溶解を、以前に記載されたように実施した(Goh et al., J. Vis. Exp., (62), e3770, doi:10.3791/3770, 2012; Fullwood et al., Nature, 462:58-64, 2009, 両方とも参照により本明細書に援用される)。簡潔には、核のペレットを、氷冷洗浄緩衝液（５０ｍＭトリス−ＨＣｌｐＨ＝８．０、１５０ｍＭＮａＣｌ、１ｍＭＥＤＴＡ、１％ＴｒｉｔｏｎＸ−１００、０．１％ＳＤＳ）で２回洗浄し、１ｍＬの同じ緩衝液中で懸濁した。クロマチンを、例えば超音波処理により剪断し、約５００ｂｐの平均サイズを有する断片にした。次いで、以前に記載されたように(Kalhor et al., Nat. Biotechnol., 30:90-98, 2012, 参照により本明細書に援用される)、ＳＤＳを剪断されたクロマチンに約０．５％の終濃度になるように添加し、次いでその混合物を３７℃で１５分間インキュベートした後、ＥＺｌｉｎｋヨードアセチル−ＰＥＧ２−ビオチン（ＩＰＢ）（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ，カタログ番号２１３３４）と混合し、室温で６０分間回転させた。次いで、ストレプトアビジンビーズに結合したクロマチンに対してＲＩＣｈ−ＰＥＴライブラリー構築を行った。

ＩＩＩ．ＲＩＣｈ−ＰＥＴライブラリー構築
ストレプトアビジンビーズに結合したクロマチン中に存在するＤＮＡ断片を、Ｔ４ポリメラーゼ（Ｐｒｏｍｅｇａ，Ｒ０１９１）を用いて末端修復した後、ＳｕｐｅｒｓｃｒｉｐｔＩＩＩ第１鎖合成システム（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１８０８００５１）を用いて第１鎖合成を行った。

簡潔には、１μｇの隣接するＭｍｅＩ部位（ＩＤＴ）を含有するビオチン化ＲＮＡリンカーａ（チューブ１）およびＲＮＡリンカーｂ（チューブ２）を、アニーリング混合物（５μｌ１０ｍＭｄＮＴＰ、４０μｌＤＥＰＣ処理水）を含有する２個のチューブにそれぞれ添加し、６５℃で５分間インキュベートし、次いで氷上に少なくとも約１分間置き、次いでｃＤＮＡ合成混合物（１０μｌ１０×ＲＴ（逆転写）緩衝液、２０μｌ２５ｍＭＭｇＣｌ_２、１０μｌ０．１ＭＤＴＴ、５μｌＲＮａｓｅＯＵＴ、５μｌＳｕｐｅｒＳｃｒｉｐｔＩＩＩＲＴ）と、２５℃で１０分間、続いて５０℃で３０分間のインキュベーションのために混合した。

一晩ライゲーションを、１μｇのＤＮＡリンカーＡ（チューブ１）およびＤＮＡリンカーＢ（チューブ２）をそれぞれ用いて、ライゲーション混合物（１４０μｌ５×Ｔ４ＤＮＡリガーゼ緩衝液（ＰＥＧを含む）、３．５μｌＲＮａｓｅ阻害剤、５４６．５μｌヌクレアーゼ無含有水）中で、５μｌのＴ４ＤＮＡリガーゼを用いて、１６℃において実施した。次いで、リンカーを付加されたＤＮＡ断片を、１４μｌのＴ４ポリヌクレオチドキナーゼ（ＮＥＢ）で、ＰＮＫマスターミックス緩衝液（７０μｌ１０×Ｔ４ＤＮＡリガーゼ緩衝液、３．５μｌＲＮａｓｅ阻害剤、６１２．５μｌヌクレアーゼ無含有水）中でリン酸化し、続いて２つのチューブの近接ライゲーションを、３４μｌのＴ４ＤＮＡリガーゼにより、反応緩衝液（１０００μｌ１０×Ｔ４ＤＮＡリガーゼ緩衝液、５０μｌＲＮａｓｅ、８９１６μｌヌクレアーゼ無含有水）中で、１６℃において一晩行った。

リンカーを有するクロマチンＤＮＡ断片に対して、Ｓｕｐｅｒｓｃｒｉｐｔ二本鎖ｃＤＮＡ合成キット（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１１９７−０２０）を用いた第２鎖ｃＤＮＡ合成を行った。具体的には、クロマチン断片を第２鎖ｃＤＮＡ混合物（１１１μｌＤＥＰＣ処理水、３０μｌ５×第２鎖反応緩衝液、３μｌ１０ｍＭｄＮＴＰ混合物、１μｌ大腸菌ＤＮＡリガーゼ、４μｌ大腸菌ＤＮＡポリメラーゼＩ、１μｌ大腸菌ＲＮａｓｅＨ）と混合し、１６℃で２時間インキュベートした。その反応後、１６℃で５分間の継続されるインキュベーションのために２μｌのＴ４ＤＮＡポリメラーゼを添加した。

次いで、ＤＮＡ／ＲＮＡ/タンパク質複合体における架橋を、０．３％ＳＤＳ（Ａｍｂｉｏｎ）およびプロテイナーゼＫ（Ａｍｂｉｏｎ）による６５℃で一晩のインキュベーションにより逆行させた。ｃＤＮＡ−ＤＮＡ断片を、フェノール／クロロホルムイソプロパノール沈殿により精製した。次いで、精製されたｃＤＮＡ−ＤＮＡを、１μｌのＭｍｅＩ（ＮＥＢ）により、適切な緩衝液（５μｌ１０×ＮＥＢｕｆｆｅｒ４、５μｌの過剰なＭｍｅＩを停止させるためのビオチン化されていない半分のリンカー（Ｈａｌｆｌｉｎｋｅｒ）、５μｌ１０×ＳＡＭ）中で、３７℃において少なくとも２時間消化し、ｃＤＮＡタグ−ＲＮＡリンカー−ＤＮＡリンカー−ＤＮＡタグ構造（ペアエンドタグ、ＰＥＴ）を解除した。

次いで、ビオチン化されたＰＥＴを、ストレプトアビジンコンジュゲート磁性Ｄｙｎａｂｅａｄｓ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，カタログ番号１１２０６Ｄ−１０ＭＬ）上で、５０μｌの２×Ｂ＆Ｗ緩衝液（１０ｍＭトリス−ＨＣｌｐＨ７．５、１ｍＭＥＤＴＡ、１ＭＮａＣｌ）中で固定し、室温で４５分間揺り動かした。次いで、それぞれのＰＥＴ構造の末端を、アダプターに、１μｌのＴ４ＤＮＡリガーゼ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ，カタログ番号ＥＬ００１３）により、アダプターライゲーション緩衝液（４μｌアダプターＡ、４μｌアダプターＢ、５μｌ１０×Ｔ４ＤＮＡリガーゼ緩衝液、３６μｌヌクレアーゼ無含有水）中で、１６℃で混合しながら一晩ライゲーションした。次いで、ビーズを１×Ｂ＆Ｗ緩衝液（５ｍＭトリス−ＨＣｌｐＨ７．５、０．５ｍＭＥＤＴＡ、１ＭＮａＣｌ）で３回洗浄した。

ニック翻訳を、４μｌの大腸菌ＤＮＡポリメラーゼＩを用いて、反応混合物（３８．５μｌヌクレアーゼ無含有水、１０×ＮＥＢｕｆｆｅｒ２、２．５μｌ１０ｍＭｄＮＴＰ）中で実施し、それをＩｎｔｅｌｌｉ−ミキサー上で回転させながら（Ｆ８、３０ｒｐｍ、Ｕ＝５０、ｕ＝６０；ＥＬＭＩＬｔｄ．、ラトビア、リガ）室温で２時間インキュベートした。この後、１６ラウンドのＰＣＲを行い、ＰＥＴを増幅した。ＲＩＣｈ−ＰＥＴライブラリーを、ＩｌｌｕｍｉｎａＨｉＳｅｑ２０００上で配列決定した（２×３６ｂｐの読み）。

タンパク質およびＲＮＡの分解を防ぐ、または最小限にするため、全ての工程は、プロテアーゼ阻害剤およびＲＮａｓｅ阻害剤を含む緩衝液中で実施された。
本明細書で用いられる様々なポリヌクレオチドまたはプライマーが、下記で列挙されている：

実施例２ＲＩＣｈ−ＰＥＴライブラリーの統計学
３つのＲＩＣｈ−ＰＥＴライブラリーデータセットを、ＨｅＬａＳ３細胞からの技術的および生物学的複製を用いて生成した。

ＲＩＣｈ−ＰＥＴデータを、単集合ＰＥＴ（すなわち、ＲＮＡタグおよびＤＮＡタグの両方において他のＰＥＴ配列と重複しない）としてまたは２以上のＰＥＴ配列を有するＰＥＴクラスター（すなわち、対になったＲＮＡタグおよびＤＮＡタグ配列の両方が他のＰＥＴと重複している）としてのどちらかで分類した。ＰＥＴクラスターは、より信頼できると、またはｎｃＲＮＡ−クロマチン相互作用のより信頼できる事象の繰り返しの検出を反映する高信頼度データであると考えられ、一方で、単集合ＰＥＴは、弱い連結シグナルを表し得るが、ランダムなバックグラウンドノイズと識別できない。クラスター化基準を用いて、約５０００のクロマチン座位に結び付けられたおおよそ７００の推定上のＲＮＡ座位が同定された（図２Ａ）。

迅速な検証として、これらのＲＮＡおよびＤＮＡ座位に関するＲＮＡ−ｓｅｑシグナルがチェックされ、ＲＮＡ座位が実際にＤＮＡ座位よりも有意に高いＲＮＡ計数を有することが分かり、これは、ＲＩＣｈ−ＰＥＴデータが予想された通りであることを示唆している（図２Ｂ）。

得られたＲＮＡ−ＤＮＡ連結性データの約５分の１（約２２％）は、天然においてシス作用性（すなわち、ＲＮＡのマッピング部位からＤＮＡのマッピング部位まで１００ｋｂ未満）であると考えられることができ、一方でＲＮＡ−ＤＮＡ連結性データの大部分は、トランス作用性である（図２Ｃ）。

１つの懸念は、クロマチンＲＮＡ−ＤＮＡライゲーションアプローチは、転写がまだ進行中である場合に大部分が発生中のｍＲＮＡを捕捉する可能性があることであった。驚くべきことに、データは、ほとんどの発生中のｍＲＮＡ転写産物は、ｎｃＲＮＡ分子のおそらく遊離の３’末端を用いることに部分的に基づいている本発明の方法が発生中のｍＲＮＡからの干渉を概ね回避するように、それらの３’末端をＲＮＡポリメラーゼ複合体の中心部内に隠しているようであることを示している。

具体的には、対になったＲＩＣｈ−ＰＥＴデータのマッピングは、対になったＲＮＡおよびＤＮＡタグの間の距離を明らかにし、従って可能性のある相互作用の方式（シスまたはトランス）を示唆する。マッピングの結果は、データの小さなセットのみがシス作用性であり、大部分はトランス作用性および染色体間であることを示し、これは、ＲＩＣｈ−ＰＥＴプロトコルにおいて発生中の転写産物を捕捉する可能性が低いことを示している。

ＲＮＡタグクラスターのさらなるアノテーション分析（下記参照）は、ＲＮＡタグの３％のみがｍＲＮＡエキソンにマッピングされ、一方で大多数がｎｃＲＮＡにマッピングされることを示した。

別の懸念は、細胞中にｒＲＮＡが豊富にあることであり、一部の細胞ではｒＲＮＡは総ＲＮＡの８０％もの多さであり得るため、それはＲＮＡ関連分析に関する一般的な問題である。

ｒＲＮＡに対処するための１つの戦略は、特定の分析の開始前に用いられる回避アプローチ、例えばｍＲＮＡに関するポリＡ＋選択アプローチおよびｒＲＮＡの減算枯渇（ｓｕｂｔｒａｃｔｉｖｅｄｅｐｌｅｔｉｏｎ）を含む。我々は、ＲＩＣｈ−ＰＥＴライブラリーの１つにおいてｒＲＮＡ配列の存在度レベルを評価し、ｒＲＮＡ配列は総ＲＮＡタグの約２６％を構成していることを見出した。対照的に、ｒＲＮＡ配列に対応するＤＮＡタグはほとんど無かった（０．２３％）。従って、デジタル枯渇アプローチを用いてあらゆるさらなる分析の前に全てのｒＲＮＡ配列を除去し、ｒＲＮＡによるデータのノイズを低減することができる。

実施例３ＲＩＣｈ−ＰＥＴ法の再現性および感度
ＲＩＣｈ−ＰＥＴデータの再現性を評価するため、２つの技術的複製（並行ライブラリー構築および配列決定分析のために２つの分割量（ａｌｉｑｕｏｔｓ）に分けられた同じ細胞調製物）および２つの生物学的複製（わずかな修正を加えたほぼ同一の手順を用いてライブラリー構築における使用のために異なる時点で収集された異なる細胞調製物）を実施した。結果として得られた複製の結果は、真の再現性を示した（図３）。例えば、癌に関わっていることが知られている２つの十分に研究されたｌｎｃＲＮＡであるＮＥＡＴ１およびＭＡＬＡＴ１は、３つのライブラリー全部において再現性よく検出された（データは示されていない）。

その２つのｌｎｃＲＮＡ遺伝子は、ＲＮＡポリメラーゼＩＩ（ＲＮＡＰＩＩまたはＲＮＡＰｏｌ２）により媒介される広範囲にわたるクロマチン相互作用ループ構造において空間的に組織化されていることが分かり、これは、それらの発現が共通の転写複合体機構の下で同時制御されている可能性が最も高いことを示している。

本明細書で得られたＲＩＣｈ−ＰＥＴデータにおいて、ＭＡＬＡＴ１およびＮＥＡＴ１は両方ともＨｅＬａＳ３細胞において高度に発現されており、３つのＲＩＣｈ−ＰＥＴデータセット全部において豊富に検出された。具体的には、ＮＥＡＴ１はその細胞においてＭＡＬＡＴ１と比較して比較的少なく発現されており、従って、ＮＥＡＴ１に対するＲＩＣＨ−ＰＥＴデータ計数は、ＭＡＬＡＴ１に対するＲＩＣＨ−ＰＥＴデータ計数よりも少なかった（データは示されていない）。対照として、ＨＯＴＡＩＲは、ＨｅＬａＳ３細胞において低レベルで発現されている別の既知のｌｎｃＲＮＡであり、それは得られたＲＩＣｈ−ＰＥＴデータでは検出されなかった（データは示されていない）。

従って、ＲＩＣｈ−ＰＥＴデータにおけるｎｃＲＮＡの検出は、ｎｃＲＮＡ発現レベルと十分に相関しているようであった。
実施例４ＲＩＣｈ−ＰＥＴデータの検証
得られたＲＩＣｈ−ＰＥＴマッピングデータに基づいて、たとえこれらの２つのｎｃＲＮＡが同じ転写工場中で同時転写されているとしても、それらの相互作用特性は非常に異なることは、興味深い。具体的には、ＮＥＡＴ１のＲＮＡは限定的にシス性であり、それが転写された場所にのみ結合している；一方で、ＭＡＬＡＴ１は大部分がトランス性で外向きであり、ゲノム中の多くの座位と相互作用している（図４Ａ）。

この観察を検証するため、ＮＥＡＴ１およびＭＡＬＡＴ１のＲＮＡを蛍光プローブとして用いてＨｅＬａの核を調べるＲＮＡ−ＦＩＳＨ実験が実施された（図４Ｂ）。予想されたように、ＮＥＡＴ１プローブは、核あたり１または２個のスポットしかもたらさず、一方でＭＡＬＡＴ１プローブは、核空間全体にわたってスポットをもたらし、これはＲＩＣｈ−ＰＥＴデータにおいて観察されたことと一致している。Ａ５４９細胞におけるＮＥＡＴ１およびＭＡＬＡＴ１に関する類似のＲＮＡ−ＦＩＳＨの結果も得られた。この検証は、ＲＩＣｈ−ＰＥＴデータが、真正のシスおよびトランス相互作用の検出および識別において定性的かつ正確であることを示唆している。

実施例５ＲＩＣｈ−ＰＥＴデータの特性付け
ＲＮＡおよびＤＮＡタグクラスターを、ヒトゲノムの遺伝子コードＶ１４アノテーションに基づいて特性付けた。ＲＮＡタグクラスターの３％のみが、タンパク質をコードするエキソンと重複しており、ＲＮＡタグクラスターの大多数は、非コード領域にマッピングされ、その多くは以前に知られているｎｃＲＮＡである（１７２、２４％）。残りは、タンパク質をコードするイントロン領域、アンチセンス、および遺伝子間領域に位置する新規のｎｃＲＮＡである可能性がある（図５Ａ）。

ＲＩＣｈ−ＰＥＴデータにおいて同定された全ての推定上のｎｃＲＮＡは、ＲＮＡ−Ｓｅｑデータの支持を有し、これは、それらがＨｅＬａ細胞において活発に転写されていることを示している。逆に、ＲＩＣｈ−ＰＥＴデータのＤＮＡタグクラスターは、大部分がタンパク質をコードする遺伝子にマッピングされ、かなりの部分が遺伝子のプロモーターにマッピングされた（図５Ｂ）。

ＲＮＡおよびＤＮＡタグクラスターの周囲のクロマチン活性マークのセットに対して、さらなる分析を行った。ＲＮＡタグクラスターの中央は、ＰＮＡＰｏｌ２のシグナルおよび開放クロマチン状態に関するＤＨＳにより定められる転写活性のピークを外れており、そのような“中央を外れる”特性は鎖特異的であることを特筆することは興味深い（データは示されていない）。この鎖特異的な“中央を外れる”特性は、ＲＩＣｈ−ＰＥＴ方法論と合致しており、これはそれがＲＮＡの３’末端を捕捉するように設計されているためである。従って、ＲＮＡタグクラスターは、転写開始部位の下流であることが予想される。対照的に、クロマチン活性シグナルは、ＤＮＡタグクラスターの中央の周囲に対称的にピークがあり（データは示されていない）、これは、超音波処理によるクロマチン線維のランダムな剪断を反映している。

実施例６ＭＡＬＡＴ１は、多くのゲノム特徴と相互作用し、遺伝子活性化および遺伝子抑制の両方に関して機能している可能性がある
（単集合ＰＥＴを含む）ＭＡＬＡＴ１に結び付けられた全てのＲＩＣｈ−ＰＥＴデータを用いて、出願人らは、全染色体および全ゲノムのＭＡＬＡＴ１相互作用プロフィールを生成し、それは、ＭＡＬＡＴ１がゲノム中の大きな領域と相互作用している可能性を有することを示している（データは示されていない）。５０より多い高信頼度相互作用（タグ計数が２以上のＰＥＴクラスター）の内で、約半分は既知の遺伝子のプロモーター中に位置しており、４分の１はイントロン領域中に位置している（図６Ａ）。同じ細胞からのＲＮＡ−ＳｅｑおよびＲＮＡＰｏｌ２ＣｈＩＰ−ｓｅｑデータは、それらのプロモーター中にＭＡＬＡＴ１が存在する遺伝子は、それらのイントロン領域においてＭＡＬＡＴ１と相互作用する遺伝子よりも有意に高い転写活性を有することを示した（図６Ｂ；データは示されていない）。ＭＡＬＡＴ１は、ＳＲＳＦ２を含むいくつかのスプライシング因子と相互作用することによりスプライシング機能の調節に関わっていることが報告されていた(Tripathi et al., 2011)。

出願人らは、ＭＡＬＡＴ１のＲＮＡはＳＲＳＦ２の発現の調節にそのプロモーターと相互作用することにより直接関わっている可能性があることも見出した（データは示されていない）。これらの観察は、ＭＡＬＡＴ１は遺伝子の活性化および抑制の制御において多数の機能的役割を有し得ることを示唆している。

実施例７Ｘ染色体を越えるＸＩＳＴの機能
最も十分に特性付けられているｌｎｃＲＮＡは、ＸＩＳＴであり、それはＸ染色体の１コピーから転写され、Ｘ染色体のその他のコピー中の同じ部位に結合し（シス作用性）、さらに拡張して染色体全体を不活性化のために覆う（示されていない）。ＲＩＣｈ−ＰＥＴマッピングデータは、実際、ＸＩＳＴのＲＮＡタグと対になったＤＮＡタグがＸ染色体において非常に富んでおり、一方でバックグラウンドノイズはゲノム全体にわたって点在しており、これは、ＸＩＳＴが予想されたようにＸ染色体に特異的に結合していることを示している。

興味深いことに、１つの非Ｘ染色体においていくらかのレベルのＸＩＳＴ結合の富化が存在し、どういうわけか別の非Ｘ染色体には枯渇しているようでもあった。より多くのデータおよびさらなる分析が、この観察をさらに検証するために得られている。

実施例８ｎｃＲＮＡによる複雑な相互作用ネットワーク
本明細書で示されたＲＩＣｈ−ＰＥＴデータは、ｎｃＲＮＡ相互作用ネットワークの複雑なシステムへの最初の一瞥（ｇｌｉｍｐｓｅ）を提供してきた。１つのｎｃＲＮＡがゲノムにおいて多数の標的を有し得るという古典的な見解（ＭＡＬＡＴ１）に加えて、ある座位がｎｃＲＮＡにより相互作用されることが分かり、そしてそこから相互作用するｎｃＲＮＡが別の座位とも相互作用することが検出された点で、多くの推定上のｎｃＲＮＡ座位は“内および外”のＲＩＣｈ−ＰＥＴデータを有することが分かっていた。

多くの意味で、このｎｃＲＮＡ相互作用ネットワークは、転写因子（ＴＦ）結合ネットワークに類似しており、そこでは多くのＴＦが互いの遺伝子に転写調節のために結合する。より多くのデータは、どのようにｎｃＲＮＡが機能するか、そしてどのようにｎｃＲＮＡ相互作用ネットワークがゲノムシステムに影響を及ぼすかをさらに説明するのを助けるであろう。

実施例９ＣＣＡＴ１によりコードされるｌｎｃＲＮＡは、転写補助活性化因子である
ＲＩＣｈ−ＰＥＴ法を用いて、全体的なｎｃＲＮＡ−ゲノムＤＮＡ相互作用を同定した。同定された相互作用の中で、１つのｎｃＲＮＡ−結腸癌関連転写産物１−が特に興味深かった。

結腸癌関連転写産物１（ＣＣＡＴ１）は、最近代表差分析（ＲｅｐｒｅｓｅｎｔａｔｉｏｎａｌＤｉｆｆｅｒｅｎｃｅＡｎａｌｙｓｉｓ）（ＲＤＡ）、ｃＤＮＡクローニング、およびｃＤＮＡ末端の急速増幅（ＲＡＣＥ）を用いて発見された、２６２８ヌクレオチド長の非コードＲＮＡである(Nissan et al., “Colon cancer associated transcript-1: A novel RNA expressed in malignant and pre-malignant human tissues,” Int. J. Cancer, 13:1598-1606, 2012)。それは、結腸癌（ＣＣ）において過剰発現されているが正常な組織では過剰発現されておらず、それによりそれを可能性のある疾患特異的バイオマーカーにすることが最近発見された(Nissan et al., Int. J. Cancer, 130(7):1598-606, 2012; Alaiyan et al., BMC Cancer, 13:196, 2013)。

ＲＩＣｈ−ＰＥＴデータに基づく注意深い分析は、この座位におけるイソ型転写産物の新規の複雑なモデルを明らかにした（データは示されていない）。加えて、ＣＣＡＴ１は、子宮頚癌細胞株ＨｅＬａ細胞において高度に転写されている。

ＲＩＣｈ−ＰＥＴデータは、ＣＣＡＴ１ｌｎｃＲＮＡ転写産物が、１５番、１６番、２０番、ＸおよびＹ染色体を除く全てのヒト染色体を含め、ゲノム中の多くの他の座位を標的としていることも明らかにした（データは示されていない）。

少なくとも２つのＣＣＡＴ１タグを有するＣＣＡＴ１クロマチン標的の中で、多くが、エンハンサーまたはプロモーターにおいて最も強いｌｎｃＲＮＡ−ゲノムＤＮＡ関係を示している（データは示されていない）。例えば、少なくとも３つのＣＣＡＴＲＮＡタグと関係している１２２のＣＣＡＴ１ゲノム標的座位に関して、８８の標的座位は、ＲＮＡＰＩＩ相互作用を有するエンハンサー座位の６つを含め、エンハンサー領域中である。別の３４のＣＣＡＴ１のゲノム標的座位は、プロモーター中である。

これらのＣＣＡＴ１標的遺伝子は、ランダムに選択された対照遺伝子の集合よりも数倍高い平均発現レベルを有し、これは、ＣＣＡＴ１ｌｎｃＲＮＡが標的遺伝子発現を促進することを示唆している。

これらのＣＣＡＴ１標的遺伝子の１つは、乳癌の約８０％、結腸癌の約７０％、婦人科系癌の約９０％、肝細胞癌の約５０％、および異常なｍｙｃ発現を有する様々な血液学的腫瘍（例えばバーキットリンパ腫）を含む多種多様なヒトの癌において過剰発現されている癌遺伝子であるｃ−ｍｙｃである。追加のデータは、ＣＣＡＴ１ｌｎｃＲＮＡが、ＣＣＡＴ１座位自体ならびにｍｙｃ座位に結合し、そうしてＣＣＡＴ１およびｍｙｃ座位を物理的に近接させ、ＣＣＡＴ１座位中のエンハンサーにｍｙｃの転写を刺激させることにより機能していることを示唆している。加えて、ＣＣＡＴ１の転写されたｌｎｃＲＮＡは、タンパク質因子に結合して転写補助活性化因子の役目を果たし、そうしてｍｙｃならびに他のＣＣＡＴ１標的遺伝子、例えばＦＡＭ８４ＢおよびＳＮＸ１４の転写を直接増進している可能性がある。

実施例１０ヒトＢリンパ芽球様細胞ＧＭ１２８７８およびショウジョウバエＳ２細胞における追加の適用
上記のＲＩＣｈ−ＰＥＴ法と実質的に同じＲＩＣｈ−ＰＥＴ法を用いて、出願人らは、ＲＩＣｈ−ＰＥＴ法の一般的な適用可能性をさらに支持するため、ヒトＢリンパ芽球様細胞ＧＭ１２８７８およびショウジョウバエＳ２細胞から追加のデータを得た。

具体的には、ヒトＧＭ１２８７８細胞がＲＩＣｈ−ＰＥＴ分析のために用いられ、これは、ｎｃＲＮＡ遺伝子ＸＩＳＴがこの細胞株において高度に発現されており、一方でＲＩＣｈ−ＰＥＴ分析のために用いられた前のＨｅＬａ細胞は低レベルのＸＩＳＴ発現を有し、そしてＨＣＴ１１６は男性由来であり、従ってＸＩＳＴ発現を有しないためであった。従って、ＧＭ１２８７８は、ＸＩＳＴをＲＩＣｈ−ＰＥＴ分析のｎｃＲＮＡのクロマチンとの相互作用を検出する性能を評価するためのモデルとして用いる場合、ＲＩＣｈ−ＰＥＴ分析のための遥かに優れた細胞型である。

以前に記載されたように、ＸＩＳＴは、Ｘ染色体に特異的または優先的に結合する。図９Ａを参照、それは、１００万の読みあたりのｋｂあたりの読み（ＲＰＫＭ）でのＲＮＡ−Ｓｅｑデータにより測定されたＸＩＳＴの計数を示している；そして図９Ｂを参照、それは、ＸＩＳＴ結合により覆われるそれぞれの染色体の割合を示している。ＧＭ１２８７８細胞において、染色体のほとんどは、総染色体空間の１０〜２０％においてのみＸＩＳＴに覆われており、一方でＸ染色体は、ＸＩＳＴにより９０％近く覆われている。このカバー率は、ＸＩＳＴの他の非特異的染色体と比べたその標的とする染色体に対するほぼ６倍（５．９倍）の特異性を表している。対照的に、ＨｅＬａ細胞では、カバー率は、ＸＩＳＴの他の非特異的染色体と比べたその標的とする染色体に対する約３．４倍の特異性を表しており、ＨＣＴ１１６細胞では、予想されたように、Ｘ染色体の富化は観察されなかった。

同様に、ショウジョウバエＳ２細胞では、ｎｃＲＮＡ遺伝子ｒｏｘ２−ヒトのＸＩＳＴに相当するもの−は、Ｘ染色体に対するｒｏｘ２結合の類似の富化を示した：他の染色体と比べて５倍（データは示されていない）。具体的には、全ショウジョウバエゲノムにおけるｒｏｘ２結合データが得られた。ｒｏｘ２に連結されたＤＮＡタグの８０％より多くが、Ｘ染色体に結合し、これはＸ染色体に対する５倍の富化を表している。ＣＨＡＲＴ−ｓｅｑによる、およびＲＩＣｈ−ＰＥＴ法によるＸ染色体上のｒｏｘ２のマッピングの間で合理的に強い相関値（０．６）が観察され、これはＲＩＣｈ−ＰＥＴ法の適切性を示している。

ＲＩＣｈ−ＰＥＴデータのＲＮＡタグの大部分は非コード領域にマッピングされ、一方で約２６％のみがコード領域にあり、これは、その方法がｎｃＲＮＡに関する富化を有することを示している（データは示されていない）。ＲＩＣｈ−ＰＥＴデータのＲＮＡタグの、ショウジョウバエＳ２細胞からのＲＮＡ−ｓｅｑデータとの比較は、既知のｎｃＲＮＡに関する著しい富化を示した（データは示されていない）。

要約すると、上記の実施例において示されたデータは、本発明の方法（例えばＲＩＣｈ−ＰＥＴ法）が設計されたように作動することを実証している。ＲＩＣｈ−ＰＥＴデータにおけるＲＮＡタグの大多数は、非コード領域にマッピングされ、それらの一部は、既知のｌｎｃＲＮＡ、例えばＭＡＬＡＴ１およびＮＥＡＴ１にマッピングされた。これは、この方法が期待された通りに機能したことを強く示すものである。より重要なことだが、ＲＮＡ−ＤＮＡ連結性マッピングデータにより、出願人らは、可能性のあるｎｃＲＮＡ−クロマチン相互作用座位を全ゲノムで同定することができる。今までに行われた予備的な検証のいくつかのラインは、ＲＩＣｈ−ＰＥＴが同定したｎｃＲＮＡ相互作用は本物であることを示唆してきた。

Claims

以下：
（１）以下：
（ｉ）第１ポリヌクレオチド、および
（ｉｉ）第２ポリヌクレオチド
を含むＲＮＡリンカー、ここで、該第１および該第２ポリヌクレオチドは、第１ライゲーション適合末端および該第１ポリヌクレオチドの３’末端の３’オーバーハングにより隣接される第１二本鎖領域を形成しており、ここで、該３’オーバーハングは、ランダム配列プライマーを含む；ならびに
（２）以下：
（ｉｉｉ）第３ポリヌクレオチド、および
（ｉｖ）第４ポリヌクレオチド
を含むＤＮＡリンカー、ここで、該第３および該第４ポリヌクレオチドは、平滑末端および第２ライゲーション適合末端により隣接される第２二本鎖領域を形成する；
を含むキットであって、該第１および該第２ライゲーション適合末端が、互いにライゲーションし、または互いにライゲーションするように適合可能である前記キット。
該第１ライゲーション適合末端が、該第２ポリヌクレオチドの３’末端における３’オーバーハングであり、該第２ライゲーション適合末端が、該第３ポリヌクレオチドの３’末端における３’オーバーハングであり、両方の３’オーバーハングが、ライゲーションのために互いにアニーリングする、請求項１に記載のキット。
該第１二本鎖領域が、該ランダム配列プライマーに対して３’側を切断する第１制限酵素（ＲＥ）に関する第１認識部位を含む、請求項１に記載のキット。
該第２二本鎖領域が、該第３ポリヌクレオチドに対して５’側を切断する第２制限酵素（ＲＥ）に関する第２認識部位を含む、請求項１に記載のキット。
前記の第１、第２、第３、および第４ポリヌクレオチドの１以上がＤＮＡである、請求項１に記載のキット。
前記の第１、第２、第３、および第４ポリヌクレオチドの１以上が修飾ヌクレオチドを含む、請求項１に記載のキット。
前記の修飾ヌクレオチドがビオチン化Ｔ（チミジン）である、請求項６に記載のキット。
前記の第１ポリヌクレオチドが、複数のポリヌクレオチドを含み、それぞれがランダム配列プライマー領域においてのみ異なっている、請求項１に記載のキット。
前記の第１ポリヌクレオチドが、同一のランダム配列プライマーを有するポリヌクレオチドの均一な集団を含む、請求項１に記載のキット。
前記のランダム配列プライマーが、４個、５個、６個、７個、８個、またはより多くのヌクレオチドを含む、請求項１に記載のキット。
該第１二本鎖領域が、該ＲＮＡリンカーを該ＤＮＡリンカーと区別する独特の配列を含む、請求項１に記載のキット。
該第２二本鎖領域が、該ＲＮＡリンカーを該ＤＮＡリンカーと区別する独特の配列を含む、請求項１に記載のキット。
該第１認識部位の最後のヌクレオチドが、該ランダム配列プライマーに対して５’側の最後の塩基対合したヌクレオチドである、請求項１に記載のキット。
該第２認識部位の最後のヌクレオチドが、該平滑末端における塩基対合したヌクレオチドである、請求項１に記載のキット。
該第１および該第２制限酵素が同じである、請求項１に記載のキット。
該第１および該第２制限酵素が独立して以下：ＡａｒＩ、ＡｃｅＩＩＩ、ＡｌｏＩ、ＢａｅＩ、Ｂｂｒ７Ｉ、ＢｂｖＩ、ＢｂｖＩＩ、ＢｃｃＩ、Ｂｃｅ８３Ｉ、ＢｃｅＡＩ、ＢｃｅｆＩ、ＢｃｇＩ、ＢｃｉＶＩ、ＢｆｉＩ、ＢｉｎＩ、ＢｐｌＩ、ＢｓａＸＩ、ＢｓｃＡＩ、ＢｓｅＭＩＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＩ、ＢｓｍＡＩ、ＢｓｍＦＩ、Ｂｓｐ２４Ｉ、ＢｓｐＣＮＩ、ＢｓｐＭＩ、ＢｓｒＩ、ＢｓｒＤＩ、ＢｓｔＦ５Ｉ、ＢｔｇＺＩ、ＢｔｓＩ、ＣｊｅＩ、ＣｊｅＰＩ、ＥｃｉＩ、Ｅｃｏ３１Ｉ、Ｅｃｏ５７Ｉ、Ｅｃｏ５７ＭＩ、ＥｃｏＰ１５Ｉ、Ｅｓｐ３Ｉ、ＦａｌＩ、ＦａｕＩ、ＦｏｋＩ、ＧｓｕＩ、ＨａｅＩＶ、ＨｇａＩ、Ｈｉｎ４Ｉ、ＨｐｈＩ、ＨｐｙＡＶ、Ｋｓｐ６３２Ｉ、ＭｂｏＩＩ、ＭｌｙＩ、ＭｍｅＩ、ＭｎｌＩ、ＰｌｅＩ、ＰｐｉＩ、ＰｓｒＩ、ＲｌｅＡＩ、ＳａｐＩ、ＳｆａＮＩ、ＳｓｐＤ５Ｉ、Ｓｔｈ１３２Ｉ、ＳｔｓＩ、ＴａｑＩＩ、ＴｓｐＤＴＩ、ＴｓｐＧＷＩ、ＴｓｐＲＩまたはＴｔｈ１１１ＩＩから選択される、請求項１に記載のキット。
該第１および該第２制限酵素の切断部位が、該認識部位の最後のヌクレオチドに対して少なくとも約１０、１２、１４、１６、１８、２０ヌクレオチド、またはより多くのヌクレオチド３’側である、請求項１に記載のキット。
該第１および該第４ポリヌクレオチドが脱リン酸化されている、請求項１に記載のキット。
さらにタンパク質およびポリヌクレオチドを架橋する試薬を含む、請求項１に記載のキット。
該試薬がホルムアルデヒドを含む、請求項１９に記載のキット。
さらにクロマチンの構成要素（例えばヒストン）に特異的にまたは選択的に結合する親和性試薬（例えば抗体またはモノクローナル抗体）を含む、請求項１に記載のキット。
さらに損傷した、または不適合な５’および／または３’突出末端を含有するＤＮＡを、５’リン酸化された平滑末端ＤＮＡに変換する末端修復混合物を含む、請求項１に記載のキット。
さらにＤＮＡリガーゼ（例えばＴ４リガーゼ）を含む、請求項１に記載のキット。
さらにタンパク質およびポリヌクレオチドの架橋を逆行させる試薬（例えばプロテイナーゼＫ）を含む、請求項１に記載のキット。
さらに該第１および／または該第２制限酵素（単数または複数）を含む、請求項１に記載のキット。
さらに平滑末端二本鎖ＤＮＡのＰＣＲ増幅のためのコンカテマー化アダプターの対を含む、請求項１に記載のキット。
さらにＴａｑＤＮＡポリメラーゼを含む、請求項１に記載のキット。
さらに逆転写酵素を含む、請求項１に記載のキット。
請求項１に記載の該第１および第２二本鎖領域を含む中央領域を含むペアエンドタグ（ＰＥＴ）ポリヌクレオチドであって、前記の中央領域が、以下：
（１）前記の第１二本鎖領域に対して近位の部位において、非コードＲＮＡ（ｎｃＲＮＡ）の配列タグ；および
（２）前記の第２二本鎖領域に対して近位の部位において、ゲノムＤＮＡの配列タグ；
により隣接されている、前記ＰＥＴポリヌクレオチド。
該非コードＲＮＡ（ｎｃＲＮＡ）の配列タグが、前記の第１制限酵素による消化の結果もたらされる遊離末端を有する、請求項２９に記載のＰＥＴポリヌクレオチド。
該非コードＲＮＡ（ｎｃＲＮＡ）の配列タグが、該ｎｃＲＮＡが転写されるゲノム領域を独特に同定する、請求項２９に記載のＰＥＴポリヌクレオチド。
該非コードＲＮＡ（ｎｃＲＮＡ）の前記の配列タグが、約８〜３０塩基対の長さである、請求項２９に記載のＰＥＴポリヌクレオチド。
該ゲノムＤＮＡの配列タグが、前記の第２制限酵素による消化の結果もたらされる遊離末端を有する、請求項２９に記載のＰＥＴポリヌクレオチド。
該ゲノムＤＮＡの配列タグが、該ゲノムＤＮＡが位置しているゲノム領域を独特に同定する、請求項２９に記載のＰＥＴポリヌクレオチド。
該ゲノムＤＮＡの前記の配列タグが、約８〜３０塩基対の長さである、請求項２９に記載のＰＥＴポリヌクレオチド。
請求項２９に記載のＰＥＴポリヌクレオチドの２以上のメンバーを含むペアエンドタグ（ＰＥＴ）ライブラリーであって、該ＰＥＴライブラリーのそれぞれのメンバーが、同じ前記の中央領域、および請求項２９に記載の非コードＲＮＡ（ｎｃＲＮＡ）の異なる前記の配列タグまたは請求項２９に記載のゲノムＤＮＡの異なる前記の配列タグまたは両方を含む前記ＰＥＴライブラリー。
請求項２９に記載のＰＥＴポリヌクレオチドを含むベクター。
複数のコンカテマー化された請求項２９に記載のＰＥＴポリヌクレオチドを含む、請求項３７に記載のベクター。
２以上の請求項２９に記載のＰＥＴポリヌクレオチドのコンカテマー。
ゲノムの非コードＲＮＡ（ｎｃＲＮＡ）に関するゲノム内の機能的相互作用座位を同定する方法であって、該方法が以下の工程：
（１）架橋されたゲノムＤＮＡ断片および架橋されたｎｃＲＮＡを含むクロマチン断片を提供し；
（２）請求項１に記載のＲＮＡリンカーおよびＤＮＡリンカーを用いて、架橋されたゲノムＤＮＡ断片の末端を架橋されたｎｃＲＮＡのｃＤＮＡの末端に近接ライゲーションに関する条件下でライゲーションし、ここで該架橋されたゲノムＤＮＡ断片の前記の末端は該ＤＮＡリンカーにライゲーションされ、該架橋されたｎｃＲＮＡのｃＤＮＡの前記の末端は該ＲＮＡリンカーを含み；
（３）請求項２９に記載のＰＥＴポリヌクレオチドを配列決定分析のために単離し；そして、
（４）それぞれの前記のＰＥＴポリヌクレオチド内の該ゲノムＤＮＡの配列タグおよび該ｎｃＲＮＡの配列タグを、参照ゲノムに対してマッピングし、
それにより該参照ゲノムの前記の非コードＲＮＡ（ｎｃＲＮＡ）に関する該参照ゲノム内の機能的相互作用座位を同定する；
を含む、前記方法。
該ｎｃＲＮＡおよび該ゲノムＤＮＡが、生きた細胞中でホルムアルデヒドに媒介される架橋により架橋される、請求項４０に記載の方法。
クロマチン断片が超音波処理により生成される、請求項４０に記載の方法。
該架橋されたｎｃＲＮＡのｃＤＮＡが、該ＲＮＡリンカーのランダム配列プライマーおよび該ｎｃＲＮＡ鋳型から逆転写された第１鎖ｃＤＮＡを含む、請求項４０に記載の方法。
第２鎖ｃＤＮＡ合成が、近接ライゲーションの後であるが工程（３）の前に実施される、請求項４０に記載の方法。
さらに工程（２）の前に該架橋されたゲノムＤＮＡ断片の末端を修復して５’リン酸化された平滑末端ＤＮＡにすることを含む、請求項４０に記載の方法。
該ＤＮＡリンカーの第３ポリヌクレオチドが脱リン酸化されており、該ＤＮＡリンカーが自己ライゲーションしない、請求項４０に記載の方法。
さらに該ゲノムＤＮＡの重複している配列タグおよび該ｎｃＲＮＡの重複している配列タグを有する２以上のＰＥＴポリヌクレオチドのクラスターを同定することを含む、請求項４０に記載の方法。
さらにｒＲＮＡの配列タグを含むＰＥＴポリヌクレオチドを除外することを含む、請求項４７に記載の方法。
さらに工程（２）の前にクロマチン断片の部分集合を単離または富化することを含む、請求項４０に記載の方法。
該クロマチン断片の部分集合が、該クロマチン断片の部分集合のタンパク質構成要素に特異的な抗体を用いた免疫沈降により単離または富化される、請求項４９に記載の方法。
該タンパク質構成要素がヒストン、転写因子、ポリコーム群（ＰｃＧ）ファミリータンパク質；組み換えに関わる因子；クロマチンインスレーターもしくはクロマチンウェーバー；メチルＣｐＧ結合タンパク質；またはＲＮＡ結合タンパク質である、請求項５０に記載の方法。