JP2017529104A

JP2017529104A - Ｒｎａスティッチシーケンシング：細胞におけるｒｎａ：ｒｎａ相互作用の直接マッピングのための解析

Info

Publication number: JP2017529104A
Application number: JP2017535612A
Authority: JP
Inventors: シェンゾン，; トリ，コングェン，
Original assignee: University of California
Current assignee: University of California
Priority date: 2014-09-22
Filing date: 2015-09-18
Publication date: 2017-10-05
Also published as: US20200190574A1; WO2016048843A1; CN107109698A; EP3198063A4; CN107109698B; EP3198063A1

Abstract

細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成する方法及び構成が提供される。一部の実施形態において、該キメラＲＮＡは、細胞における少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用を特定するために用いられることができる。【選択図】図１Ａ

Description

［関連出願の参照］
本願は、２０１４年９月２２日出願の米国仮特許出願第６２／０５３，６１５号の優先権を主張する。該出願の開示全体が言及によって本願明細書に明示的に組み込まれる。

［連邦政府支援による研究開発についての記載］
本発明は、アメリカ国立衛生研究所により付与された許諾番号ＮＩＨＤＰ２ＯＤ００７４１７における政府支援によりなされたものである。政府は本発明の所定の権利を有する。

［配列表、表、又はコンピュータプログラムの参照］
本発明は、電子形式の配列表と共に出願されている。配列表は、２０１５年９月１８日に作成された１１キロバイトのサイズであるＵＣＳＤ０８９−００１ＷＯ．ＴＸＴという名のファイルで提供される。電子形式配列表の情報はその全体が言及によって本願明細書に組み込まれる。

［技術分野］
細胞において相互作用するＲＮＡを特定するための方法と構成とが提供される。

現在のところ、１つの細胞型において実質的にすべてのＲＮＡ−ＲＮＡ間相互作用を一度に直接的に分析できる効率的な方法はない。この目的を部分的に達成するためにあり、共に難点がある２種の方法が存在する。ＨＩＴＳ−ＣＬＩＰやＣＬＡＳＨなどの技術は、多くのｍｉＲＮＡの標的を検出可能である。しかしながら、両方法では、少量のＲＮＡを含むのみであるｍｉＲＮＡに重点が置かれる。このように、これらの技術はＲＮＡ−ＲＮＡ間相互作用の大部分を明らかにはできない。さらに、各技術にはさらなる難点がある。例として、ｍｉＲＮＡとその標的ｍＲＮＡとの直接ペアリングは、ＨＩＴＳ−ＣＬＩＰから直接的に推論できない。換言すると、どのｍｉＲＮＡがどのｍＲＮＡを調節するかは、ＨＩＴＳ−ＣＬＩＰからは直接的には分からない（１対１の情報はない）。

ＣＬＡＳＨ（ハイブリッドの架橋、ライゲーション、及びシーケンシング）という近年の方法では、ｍｉＲＮＡ−標的ペアを直接的に観察可能である。しかし、相互作用の数は、配列リードの数と比較して未だ少ないものであり、配列リードの２％のみがキメラであり、９８％が未だシングルリードである。ｍｉＲＮＡ−ｍＲＮＡ相互作用を十分に包含するために、複数のサンプルの非常に深いシーケンシング範囲又は調製が必要とされる。

本発明の一部の実施形態は、以下の番号付き段落に示される。

１．細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成する方法であって、ＲＮＡをタンパク質に架橋するステップと、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含む、方法。

２．前記ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる、段落１に記載の方法。

３．前記架橋はＵＶ架橋を含む、段落１又は２に記載の方法。

４．前記タンパク質を表面に固定化しやすくする薬剤に、前記タンパク質を会合するステップをさらに含む、段落１〜３のいずれか１項に記載の方法。

５．前記固定化しやすくする薬剤はビオチンを含む、段落４に記載の方法。

６．前記同じタンパク質分子に架橋された前記ＲＮＡを断片化するステップをさらに含む、段落１〜５のいずれか１つに記載の方法。

７．前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記同じタンパク質分子に架橋された前記ＲＮＡを、ＲＮＡｓｅに接触させるステップを含む、段落６に記載の方法。

８．前記同じタンパク質分子に架橋されたＲＮＡを、前記ＲＮＡを回収しやすくする薬剤に結合するステップをさらに含む、段落１〜７のいずれか１つに記載の方法。

９．前記結合は、前記ＲＮＡの末端を前記薬剤にライゲーションすることを含む、段落８に記載の方法。

１０．前記ＲＮＡを回収しやすくする前記薬剤は核酸を含む、段落９に記載の方法。

１１．前記核酸はビオチンを有する核酸を含む、段落１０に記載の方法。

１２．前記ビオチンを有する核酸を前記ＲＮＡの前記末端に結合することは、前記共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、前記ビオチンを有する核酸を、前記ＲＮＡの５’末端にライゲーションすることを含む、段落１１に記載の方法。

１３．前記ビオチンを、前記キメラＲＮＡの５’領域から取り除くステップをさらに含む、段落１２に記載の方法。

１４．前記キメラＲＮＡを回収するステップをさらに含む、段落１〜１３のいずれか１つに記載の方法。

１５．前記キメラＲＮＡを断片化するステップをさらに含む、段落１〜１４のいずれか１つに記載の方法。

１６．前記キメラＲＮＡの前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む、段落１〜１５のいずれか１つに記載の方法。

１７．前記キメラＲＮＡを逆転写してキメラｃＤＮＡを生成するステップをさらに含む、段落１〜１６のいずれか１つに記載の方法。

１８．前記キメラＲＮＡ又は前記キメラｃＤＮＡにおける前記ＲＮＡのそれぞれに由来する、前記キメラＲＮＡ又は前記キメラｃＤＮＡの配列の少なくとも一部分を決定するステップをさらに含む、段落１〜１７のいずれか１つに記載の方法。

１９．前記キメラＲＮＡに存在する前記ＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定するステップをさらに含む、段落１〜１７のいずれか１つに記載の方法。

２０．前記細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される、段落１９に記載の方法。

２１．実質的にすべての、前記細胞において相互作用するＲＮＡが特定される、段落１９に記載の方法。

２２．前記細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される、段落２１に記載の方法。

２３．前記細胞において相互作用するＲＮＡの前記特定は、自動シーケンシング装置を用いて、前記キメラＲＮＡに配列リードを行うステップを含む、段落１９〜２２のいずれか１つに記載の方法。

２４．前記細胞において相互作用するＲＮＡの前記特定は、すべての前記配列リードからキメラ配列を特定するステップを含む、段落２３に記載の方法。

２５．前記キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換するステップをさらに含む、段落１９〜２４のいずれか１つに記載の方法。

２６．前記ＲＮＡクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、段落２５に記載の方法。

２７．タンパク質に架橋されたキメラＲＮＡを含む単離複合体であって、前記キメラＲＮＡは細胞において相互作用するＲＮＡを含む、単離複合体。

２８．候補治療剤を特定するための方法であって、
段落１〜２６のいずれか１つに記載の方法を用いて、細胞において相互作用するＲＮＡを特定するステップと、
前記ＲＮＡの前記相互作用を低減又は増大する薬剤の能力を評価するステップと、を含み、
前記薬剤が前記ＲＮＡの前記相互作用を低減又は増大することができる場合に前記薬剤は候補治療剤である、方法。

２９．前記薬剤は核酸を含む、段落２８に記載の方法。

３０．前記薬剤は化合物を含む、段落２８に記載の方法。

３１．医薬作製方法であって、段落２８〜３０のいずれか１つに記載の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化するステップを含む、方法。

３２．段落３１に記載の方法を用いて作製された医薬。

３３．細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法であって、ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋するステップと、共に前記タンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含み、前記タンパク質複合体は、２つ以上の相互作用タンパク質を含む、方法。

３４．前記ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋することは無傷細胞又は細胞溶解物において行われる、段落３３に記載の方法。

３５．前記架橋はＵＶ架橋を含む、段落３３又は３４に記載の方法。

３６．前記タンパク質中間体及び／又はタンパク質複合体を、前記タンパク質中間体及び／又はタンパク質複合体の表面への固定化を促す薬剤に会合するステップをさらに含む、段落３３〜３５のいずれか１つに記載の方法。

３７．前記固定化を促す薬剤はビオチンを含む、段落３６に記載の方法。

３８．少なくとも１つの前記タンパク質分子に架橋された前記ＲＮＡを断片化するステップをさらに含む、段落３３〜３７のいずれか１つに記載の方法。

３９．前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記タンパク質中間体及び／又はタンパク質複合体に架橋された前記ＲＮＡを、ＲＮＡｓｅに接触させることを含む、段落３８に記載の方法。

４０．前記タンパク質中間体及び／又はタンパク質複合体に架橋された前記ＲＮＡを、前記ＲＮＡを回収しやすくする薬剤に結合するステップをさらに含む、段落３３〜３９のいずれか１つに記載の方法。

４１．前記結合は、前記ＲＮＡの末端を前記薬剤にライゲーションすることを含む、段落４０に記載の方法。

４２．前記ＲＮＡを回収しやすくする前記薬剤は核酸を含む、段落４１に記載の方法。

４３．前記核酸はビオチンを有する核酸を含む、段落４２に記載の方法。

４４．前記ビオチンを有する核酸を前記ＲＮＡの前記末端に結合することは、前記共にタンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップの前に、前記ビオチンを有する核酸を、前記ＲＮＡの５’末端にライゲーションすることを含む、段落４３に記載の方法。

４５．前記ビオチンを、前記キメラＲＮＡの５’末端から取り除くステップをさらに含む、段落４４に記載の方法。

４６．前記キメラＲＮＡを回収するステップをさらに含む、段落３３〜４５のいずれか１つに記載の方法。

４７．前記キメラＲＮＡを断片化するステップをさらに含む、段落３３〜４６のいずれか１つに記載の方法。

４８．前記キメラＲＮＡの前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む、段落３３〜４７のいずれか１つに記載の方法。

４９．前記キメラＲＮＡを逆転写してキメラｃＤＮＡを生成するステップをさらに含む、段落３３〜４８のいずれか１つに記載の方法。

５０．前記キメラＲＮＡ又は前記キメラｃＤＮＡにおける前記ＲＮＡのそれぞれに由来する、前記キメラＲＮＡ又は前記キメラｃＤＮＡの配列の少なくとも一部分を決定するステップをさらに含む、段落３３〜４９のいずれか１つに記載の方法。

５１．前記キメラＲＮＡに存在する前記ＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定するステップをさらに含む、段落３３〜４９のいずれか１つに記載の方法。

５２．前記細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される、段落５１に記載の方法。

５３．実質的にすべての、前記細胞において相互作用するＲＮＡが特定される、段落５１に記載の方法。

５４．前記細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される、段落５３に記載の方法。

５５．前記細胞において相互作用するＲＮＡの前記特定は、自動シーケンシング装置を用いて、前記キメラＲＮＡに配列リードを行うことを含む、段落５１〜５４のいずれか１つに記載の方法。

５６．前記細胞において相互作用するＲＮＡの前記特定は、すべての前記配列リードからキメラ配列を特定することを含む、段落５５に記載の方法。

５７．前記キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換するステップをさらに含む、段落５１〜５６のいずれか１つに記載の方法。

５８．前記ＲＮＡクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、段落５７に記載の方法。

５９．前記細胞において相互作用するＲＮＡは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋される、段落３３〜５８のいずれか１つに記載の方法。

６０．タンパク質中間体及び／又はタンパク質複合体に架橋されたキメラＲＮＡを含む単離複合体であって、前記キメラＲＮＡは細胞において相互作用するＲＮＡを含み、前記タンパク質複合体は２つ以上の相互作用タンパク質を含む、単離複合体。

６１．前記キメラＲＮＡは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋されるＲＮＡを含む、段落５９に記載の単離複合体。

図１はＲＮＡのＨｉ−Ｃを示す。図１Ａにおいて、主要な実験ステップは、１：ＲＮＡをタンパク質に架橋、２：ＲＮＡ断片化とタンパク質ビオチン化（丸はビオチンを表す）、３：固定化、４：ビオチン化ＲＮＡリンカーのライゲーション（鎖上の丸はリンカー上のビオチンである）、５：超高希薄条件下において近接ライゲーション、６：ＲＮＡ精製と逆転写、７：ビオチンプルダウン、８：配列ライブラリ構築、である。キメラＲＮＡの概略図で示されるのは、Ｐ５特異的プライマー、Ｐ５特異的プライマーとＲＮＡ１との間のバーコード、ＲＮＡ１とＲＮＡ２との間のリンカー特異的リバースプライマー、そしてＰ７領域を有する、所望されるキメラ産生物である。図示される不完全産生物において、Ｐ５領域はバーコードに隣接し、バーコードはＰ５領域とリンカーの間にあり、ＲＮＡ２領域、そしてＰ７領域がある。図１はＲＮＡのＨｉ−Ｃを示す。図１Ｂは、ＲＮＡ１−リンカー−ＲＮＡ２キメラのＰＣＲ検証を示し、Ｐ５シーケンシングプライマーからリンカーまで９１ｂｐを超えると予想され、Ｐ５からＰ７シーケンシングプライマーまで２００ｂｐを超えると予想された。ＲＮＡ１を包含できなかったことにより、Ｐ５からリンカーまで９１ｂｐの産生物が作製された。ＲＮＡ２を包含できなかったことにより、Ｐ５からリンカーまで及びＰ５からＰ７まで同様のサイズの産生物が作製された。ＰＣＲプライマーはそれぞれのレーンの上部に標識される。また、配列ライブラリのサイズ分布はバイオアナライザにより評価された。左から右へと所望のキメラ産生物において示されるのは、Ｐ５特異的フォワードプライマー、バーコード、ＲＮＡ１、リンカー（リンカー特異的プライマーと相補的）、ＲＮＡ２、及びＰ７である。不完全産生物に示されるのは、Ｐ５、バーコード、リンカー、ＲＮＡ２、及びＰ７である。図１はＲＮＡのＨｉ−Ｃを示す。図１Ｃは、ゲノムにマッピングされたＲＮＡＨｉ−Ｃデータを示す。Ｔｒｉｍ２５及びＳｎｏｒａ１ＲＮＡのライゲーションはＥＳ−１及びＥＳ−２ライブラリにおける４６ペアエンドリードにより実験的に裏付けられた。ＡｇｏＣＬＩＰ−ｓｅｑはマウスＥＳ細胞のＡＧＯＨＩＴＳ−ＣＬＩＰ（ＧＥＯ：ＧＳＭ６２２５７０）である。ＳｍａｌｌＲＮＡ−ｓｅｑは酵素切断によりもたらされた３’ヒドロキシル基を有する小型ＲＮＡのシーケンシング（ＧＥＯ：ＧＳＭ９４５９０７）である。図１はＲＮＡのＨｉ−Ｃを示す。図１Ｄは、ＲＮＡインタラクトームの大モジュールを示す。４以下の相互作用ＲＮＡに関与する小モジュールは示されない。ｓｎｏＲＮＡ、ｓｎＲＮＡ、及びｔＲＮＡに関与する相互作用は示されない。図における配列の大部分はｍＲＮＡであり、残りは偽遺伝子（ＦＰｌ３０＝ｐｓ３、Ｇｍ１６５８０、Ｇｍ１２７１５、Ｇｍ１３２２６、Ｒｐ１２８−ｐｓ３、Ｆｐｌ２８−ｐｓ１、Ｒｐｓ１６−ｐｓ２、Ｇｍ４７０７、Ｇｍ１３３４０、Ｇｍ１３４０８、Ｇｍ１５５９０、Ｇｒｌ２、Ｇｍ１１４００、Ｇｍ１７０８７、Ｇｍ１５７２５、Ｇｍ１２３４６、Ｇｍ１１４７８）、ｌｉｎｃＲＮＡ（Ｇｍ１６８６９、Ｍａｌａｔ１、Ｓｎｈｇ７、Ｇｍ１６７０２、４９３０４１７Ｈ０１Ｒｉｋ）、ｍｉＲＮＡ（Ｍｉｒ５１００、Ｍｉｒ６９２−１、Ｍｉｒ６９２−２ｂ、Ａｃ１１７６５７、Ｍｉｒ５０９９）、及びアンチセンスＲＮＡ（Ｇｍ１５４４４）である。図２はＲＮＡ相互作用部位を示す。図２Ａは、Ｅｅｆ１ａ１遺伝子の特定領域上にオーバーラップした、種々の相互作用（破線）を表す複数のＲＮＡＨｉ−Ｃリードを示す。図２はＲＮＡ相互作用部位を示す。図２Ｂは、オーバーラップするリードの「ピーク」によって相互作用部位の検出を示す。ピーク１及び２はＲＮＡ１であり、ピーク３及び４はＲＮＡ２である。図２はＲＮＡ相互作用部位を示す。図２Ｃは、種々のタイプのＲＮＡ遺伝子及びトランスポゾンの相互作用部位分布を示す。図２はＲＮＡ相互作用部位を示す。図２Ｄは、２つのＲＮＡの相互作用部位間（薄い灰色、左）と、無作為にシャッフルされた塩基間（白色、右）との結合エネルギーの分布（ΔＧ、ｋｃａｌ／ｍｏｌ）を示す。ウィルコクソン順位検定のＰ値が各パネルの下部に示される。図２はＲＮＡ相互作用部位を示す。図２Ｅは、ライゲーションされたＲＮＡ断片の接合部（ｘ軸の０位置の黒色バー）でピークになる平均ＰｈｙｌｏＰスコアにより測定される保存レベルを示す。対照は無作為選択ゲノム領域の保存レベルである。グラフに示されるように、左側のデータはＲＮＡ１を表し、右側のデータはＲＮＡ２を表す。図３Ａは、ＲＮＡ構造において、ＲＮＡの近位部位を決定する概略図を示す。核酸の概略図におけるポインタ矢印はＲＮａｓｅＩ切断部位を示す。図３Ｂは、ＲＮＡ構造において、Ｓｎｏｒａ７３にマッピングされた「切断及びライゲーション」産生物を示す。色付き水平バーは、近位部位のペアを裏付けるリードペアのクラスタを示す。近位部位における数字は、図３のパネルＥ及びＦにおける配列の数字に相当する。図３Ｃは、ＲＮＡ構造において、ＲＮａｓｅＩ切断の密度を示す。近位部位における数字は、図３のパネルＥ及びＦにおける配列の数字に相当する。図３Ｄは、ＲＮＡの任意の２つの位置間におけるライゲーション頻度のヒートマップを示す。各色付き丸はパネルＡにおける色付き水平バーに相当し、近位部位のペアを示す。図３はＲＮＡ構造を示す。図３Ｅは、許容される２次構造における１本鎖領域のフットプリントと推定近位部位を示す。図３はＲＮＡ構造を示す。図３Ｆにおいて、シーケンシングに基づく２次構造によってサポートされなかった推定近位部位のペアが、タンパク質補助ＲＮＡ折りたたみのため、インビボにおいて物理的に近接する。図４は、ＲＮＡ−ＲＮＡ相互作用をマッピングするための段階的なシーケンシングに基づく技術を示す。図５は計算部のワークフローを示す。図５Ａは、キメラＲＮＡ配列を特定するためのフローチャートを示す。挿入ボックスに示されるように、主な配列は「リンカーなし」、「リンカーのみ」、「後部のみ」、「前部のみ」、及び「ペア」の配列である。図示されるように、リンカーなし配列は、１）５’指標、２）５’指標、パート１、及びパート２、３）５’指標及びパート１、並びに４）５’指標及びパート２を有する。図示されるように、リンカーのみの配列は５’指標とパート２を有する。図示されるように、後部のみは５’指標、リンカー、及びパート２を有する。図示されるように、前部のみは５’指標及びリンカーを有する。図示されるように、ペアは５’指標、パート１、リンカー、及びパート２を有する。図５は計算部のワークフローを示す。図５Ｂでは、多数のキメラＲＮＡによって裏付けられるＲＮＡ−ＲＮＡ相互作用を特定する方法が示される。上部のパネルにはＲ１におけるセグメント、下部パネルにはＲ２におけるセグメントが示される。グラフに示されるように、キメラＲＮＡにおいてこれらはペアである。図６は予備試験結果を示す。図６Ａは、キメラｃＤＮＡのライブラリのサイズ分布を示す。１２８ｂｐはプライマー配列であることが言及される。図６は予備試験結果を示す。図６Ｂは、異なるタイプのＲＮＡ間の相互作用の割合を示す。図６は予備試験結果を示す。図６Ｃにおいて、１８のライゲーションＲＮＡペアがＳＮＯＲＡ１及びＴｒｉｍ２５にマッピングされた。マッピングされた座位はＡｇｏＣＬＩＰ−ｓｅｑデータと一致した（ＧＳＭ６２２５７０）。図６は予備試験結果を示す。図６Ｄは、誘導分化過程時のＳＮＯＲＡ１及びＴｒｉｍ２５の逆相関を示す。図示されるように、Ｔｒｉｍ２５は、約３５ＲＮＡ−ｓｅｑＲＰＫＭから、４日目に約５に減少し、一方でＳＮＯＲＡ１は０日目から６日目へと増加する。図７は、配列ライブラリ構築のCGGCATTCCTGCTGAACCGCTCTTCCGATCT方法を示す。この図はＲＮＡのＨｉ−Ｃ手法のステップ８を詳述する（図７Ａ）。逆転写（ＲＴ）アダプターをＲＮＡの３’末端に付けた。このＲＴアダプターはＲＴプライマーの断片に相補的であり、これは、Ｐ５シーケンシングプライマー、１０ｎｔバーコード、及びＢａｍＨＩ制限部位のためのアダプターも包含した。環状化後、ＢａｍＨＩ部位を含むＤＮＡオリゴをＲＴプライマー領域にハイブリダイズし、ＢａｍＨＩ消化のための２本鎖基質を得た。直線化ｓｓ−ｃＤＮＡをトランケートＰＣＲプライマーＤＰ５及びＤＰ３によって増幅して、約１００ngのｄｓ−ｃＤＮＡを得、これを変性及び再アニーリングした。二本鎖特異的ヌクレアーゼ（ＤＳＮ）を用いて、ｒＲＮＡ由来のｃＤＮＡを枯渇した。ＤＳＮは、再アニーリング処理時において以前に形成されたｄｓ−ｃＤＮＡを選択的に除去する。ｒＲＮＡ由来ｃＤＮＡはより豊富であり、ゆえに他のｃＤＮＡより速く再アニーリングすると考えられる。ＤＳＮ処理産生物は、ＩｌｌｕｍｉｎａＰＣＲプライマーＰＥ１．０及び２．０により再度ＰＣＲ増幅され、シーケンシングに適切なライブラリを生成した。ＤＳＮによるｒＲＮＡ除去をＥＳ−１に適用した。ＥＳ−２には、この図には示されていない抗体によるｒＲＮＡ除去をおこなった。最後に図示されるのは、Ｐ５、バーコード、ＲＮＡ１、アダプター、ＲＮＡ２、及びＰ７の産生物である（図７Ｂ）。図８は、ＲＮＡのＨｉ−Ｃサンプルを示す。「リードペア総数」とは各サンプルのペアエンド配列リード数である。「ＲＮＡ１−リンカー−ＲＮＡ２形態の非重複リードペア数」とは、バイオインフォマティクスパイプラインの、ステップ４．キメラｃＤＮＡの解析の出力のペアエンドリード数である。図９Ａは、第１断片化のためのＲＮａｓｅＩ濃度の最適化を示す。ＲＮａｓｅＩ処理ＥＳ細胞溶解物から、同量の２×プロテイナーゼＫバッファー（１００ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１００ｍＭのＮａＣｌ、２％ＳＤＳ、２０ｍＭのＥＤＴＡ）と１：５量の２０ｍｇ／ｍｌのプロテイナーゼＫ（ＮＥＢ）とを添加し、５５℃で２時間インキュベートした後、フェノール：クロロホルム処理とエタノール沈殿とをすることで、ＲＮＡを精製した。細胞溶解物ｍｌ毎のＲＮａｓｅＩ量は、０Ｕ（サンプル１、図９Ａ）、２．５Ｕ（サンプル２、（図９Ｂ））、３．３Ｕ（サンプル３、図９Ｃ）、５Ｕ（サンプル４、図９Ｄ）、及び１２．５（サンプル５、図９Ｅ）であった。５００〜１０００ｎｔＲＮＡ断片を産生する、ｍｌ溶解物毎に５．０ＵのＲＮａｓｅＩの濃度（サンプル４）がＲＮＡのＨｉ−Ｃのステップ２のために選択された。図９Ｂは、第１断片化のためのＲＮａｓｅＩ濃度の最適化を示す。ＲＮａｓｅＩ処理ＥＳ細胞溶解物から、同量の２×プロテイナーゼＫバッファー（１００ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１００ｍＭのＮａＣｌ、２％ＳＤＳ、２０ｍＭのＥＤＴＡ）と１：５量の２０ｍｇ／ｍｌのプロテイナーゼＫ（ＮＥＢ）とを添加し、５５℃で２時間インキュベートした後、フェノール：クロロホルム処理とエタノール沈殿とをすることで、ＲＮＡを精製した。細胞溶解物ｍｌ毎のＲＮａｓｅＩ量は、０Ｕ（サンプル１、図９Ａ）、２．５Ｕ（サンプル２、（図９Ｂ））、３．３Ｕ（サンプル３、図９Ｃ）、５Ｕ（サンプル４、図９Ｄ）、及び１２．５（サンプル５、図９Ｅ）であった。５００〜１０００ｎｔＲＮＡ断片を産生する、ｍｌ溶解物毎に５．０ＵのＲＮａｓｅＩの濃度（サンプル４）がＲＮＡのＨｉ−Ｃのステップ２のために選択された。図９Ｃは、第１断片化のためのＲＮａｓｅＩ濃度の最適化を示す。ＲＮａｓｅＩ処理ＥＳ細胞溶解物から、同量の２×プロテイナーゼＫバッファー（１００ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１００ｍＭのＮａＣｌ、２％ＳＤＳ、２０ｍＭのＥＤＴＡ）と１：５量の２０ｍｇ／ｍｌのプロテイナーゼＫ（ＮＥＢ）とを添加し、５５℃で２時間インキュベートした後、フェノール：クロロホルム処理とエタノール沈殿とをすることで、ＲＮＡを精製した。細胞溶解物ｍｌ毎のＲＮａｓｅＩ量は、０Ｕ（サンプル１、図９Ａ）、２．５Ｕ（サンプル２、（図９Ｂ））、３．３Ｕ（サンプル３、図９Ｃ）、５Ｕ（サンプル４、図９Ｄ）、及び１２．５（サンプル５、図９Ｅ）であった。５００〜１０００ｎｔＲＮＡ断片を産生する、ｍｌ溶解物毎に５．０ＵのＲＮａｓｅＩの濃度（サンプル４）がＲＮＡのＨｉ−Ｃのステップ２のために選択された。図９Ｄは、第１断片化のためのＲＮａｓｅＩ濃度の最適化を示す。ＲＮａｓｅＩ処理ＥＳ細胞溶解物から、同量の２×プロテイナーゼＫバッファー（１００ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１００ｍＭのＮａＣｌ、２％ＳＤＳ、２０ｍＭのＥＤＴＡ）と１：５量の２０ｍｇ／ｍｌのプロテイナーゼＫ（ＮＥＢ）とを添加し、５５℃で２時間インキュベートした後、フェノール：クロロホルム処理とエタノール沈殿とをすることで、ＲＮＡを精製した。細胞溶解物ｍｌ毎のＲＮａｓｅＩ量は、０Ｕ（サンプル１、図９Ａ）、２．５Ｕ（サンプル２、（図９Ｂ））、３．３Ｕ（サンプル３、図９Ｃ）、５Ｕ（サンプル４、図９Ｄ）、及び１２．５（サンプル５、図９Ｅ）であった。５００〜１０００ｎｔＲＮＡ断片を産生する、ｍｌ溶解物毎に５．０ＵのＲＮａｓｅＩの濃度（サンプル４）がＲＮＡのＨｉ−Ｃのステップ２のために選択された。図９Ｅは、第１断片化のためのＲＮａｓｅＩ濃度の最適化を示す。ＲＮａｓｅＩ処理ＥＳ細胞溶解物から、同量の２×プロテイナーゼＫバッファー（１００ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１００ｍＭのＮａＣｌ、２％ＳＤＳ、２０ｍＭのＥＤＴＡ）と１：５量の２０ｍｇ／ｍｌのプロテイナーゼＫ（ＮＥＢ）とを添加し、５５℃で２時間インキュベートした後、フェノール：クロロホルム処理とエタノール沈殿とをすることで、ＲＮＡを精製した。細胞溶解物ｍｌ毎のＲＮａｓｅＩ量は、０Ｕ（サンプル１、図９Ａ）、２．５Ｕ（サンプル２、（図９Ｂ））、３．３Ｕ（サンプル３、図９Ｃ）、５Ｕ（サンプル４、図９Ｄ）、及び１２．５（サンプル５、図９Ｅ）であった。５００〜１０００ｎｔＲＮＡ断片を産生する、ｍｌ溶解物毎に５．０ＵのＲＮａｓｅＩの濃度（サンプル４）がＲＮＡのＨｉ−Ｃのステップ２のために選択された。図１０は、ビーズにおけるリンカーライゲーション効率のテストを示す。固定化ＲＮＡをＲＮａｓｅＩ消化し、そしてビオチン標識ＲＮＡリンカーにライゲーションした（１）。ライゲーションと、タンパク質を除去するためのプロテイナーゼＫ消化との後、ＲＮＡを精製及び数量化した（１．３μｇ）（２）。そして、精製ＲＮＡにストレプトアビジン−ビオチンを行って、ビオチン標識リンカーにライゲーションしたＲＮＡを選択した（３）。ストレプトアビジンビーズに結合したＲＮＡを洗浄及び溶出、及びエタノール沈殿した後、０．２２μｇのＲＮＡを採取した。並行して、ビオチン標識ＲＮＡリンカーに同じストレプトアビジン−ビオチンプルダウン、溶出、及びエタノール沈殿を行なった（４）。ステップ３及び４におけるビオチンプルダウン、ＲＮＡ溶出、及びエタノール沈殿の効率は同様の、約１９．６％（１．９６μｇ／１０．０μｇ）であることを検討すると、ライゲーション効率（０．２２μｇ／１９．６％）／１．３μｇ＝８６％が推測される。図１１は、ＲＮＡのＨｉ−Ｃ手順の種々のステップにおけるＲＮＡサイズ分布を示す。ＥＳ−インダイレクト及びＭＥＦサンプルのみが遡及的な解析に用いられる十分な中間産生物を有した。ストレプトアビジンビーズに付けられる前のＭＥＦ（レーン１）及びＥＳ−インダイレクト（レーン２）の溶解物、固定化後の上清におけるもの（レーン３及び４）、及び近接ライゲーション後にビーズに固定化されたもの（ＥＳ−インダイレクトはレーン５、ＭＥＦはレーン６）のＲＮＡのサイズ分布を示す。ＲＮＡを、２×ＲＮＡローディング色素（ＮＥＢ）内で７０℃で５分間変性し、１．５％ネイティブアガロースゲルに流し、ＳＹＢＲＧｏｌｄ（Ｉｎｖｉｔｒｏｇｅｎ）で染色した。図１２は、配列ライブラリ構築のためのＰＣＲサイクル数の最適化を示す。ＲＮＡのＨｉ−Ｃ手順のステップ８において、ＥＳ−１サンプルの１本鎖ｃＤＮＡを、トランケート形態のＩｌｌｕｍｉｎａＰＣＲシーケンシングプライマー（ＤＰ５及びＤＰ３）を用いて１２サイクルのＰＣＲで予備増幅した。ＰＣＲ産生物を１．８×ＳＰＲＩＳｅｌｅｃｔビーズで精製し、二本鎖特異的ヌクレアーゼにより、ｒＲＮＡから合成されたｃＤＮＡを枯渇する前に、８６ｎｇの２本鎖ＤＮＡを作製した。全部で２２μｌのｒＲＮＡ−枯渇２本鎖ｃＤＮＡからの１μｌ分割量を、ＮＥＢＮｅｘｔハイフィデリティー２×ＰＣＲマスターミックス（ＮＥＢ）及びＩｌｌｕｍｉｎａＰＥプライマー１．０及び２．０を用いて、種々のＰＣＲサイクル数（１２、１５、１８）で増幅した。ＰＣＲ産生物を６％のＴＢＥＰＡＧＥゲルにおいて分析し、ＳＹＢＲＧｏｌｄ（Ｉｎｖｉｔｒｏｇｅｎ）で染色した。ゲルの結果に基づき、１８μｌの元のｒＲＮＡ−枯渇２本鎖ｃＤＮＡを１１サイクルのＰＣＲで増幅し、配列ライブラリを生成した。図１３は、ＲＮＡのＨｉ−Ｃライブラリの比較を示す（図１３Ａ〜１３Ｂ）。リンカーの５’末端（ＲＮＡ１）と３’末端（ＲＮＡ２）とにおけるリード断片は、２つのＲＮＡ−ｓｅｑ実験として個別に解析された。ＥＳ−１とＥＳ−２とのサンプル間における全ての既知のＲＮＡのリードカウント分布（ＦＰＫＭ）の散布図を対数尺度において表す。Ｒはピアソン相関、Ｓはスピアマン相関である。（図１３Ｃ）各サンプルのＦＰＫＭの階層的クラスタリング。図１４は、ＲＮＡ−ＨｉＣ−ツールのオンライン文書を示す。このオンライン資料(http://systemsbio.ucsd.edu/RNA-Hi-C)は、解析及び可視化ツールの詳細な説明、使用例、出力ファイル及び図面のサンプルを包含する。一部のツールはアプリケーションプログラミングインタフェース（ＡＰＩ）としても提供される。図１５はＲＮＡのＨｉ−Ｃデータを解析するための計算パイプライン処理を示す。図１５Ａにおいて、ＰＣＲ重複をペアエンド配列リードから除去した（ステップ１）。多重サンプルを４ｎｔ実験バーコード（「ＸＸＸＸ」、ステップ２）に基づき分離した。「Ｎ」は無作為バーコードのクレオチド、「Ｘ」は実験バーコードのヌクレオチドを示す。図１５はＲＮＡのＨｉ−Ｃデータを解析するための計算パイプライン処理を示す。図１５Ｂにおいて、フォワード（リード１）リード及びリバース（リード２）リードの各ペアを、可能な場合、入力配列ライブラリにおけるｃＤＮＡを回収するために用いた。図１５はＲＮＡのＨｉ−Ｃデータを解析するための計算パイプライン処理を示す。図１５Ｃにおいて、回収されたｃＤＮＡを、ＲＮＡ断片及びリンカー配列の構成に基づいて分類した（ステップ４）。ｃＤＮＡのＲＮＡ１−リンカー−ＲＮＡ２タイプを出力として得た。図１５はＲＮＡのＨｉ−Ｃデータを解析するための計算パイプライン処理を示す。図１５Ｄにおいて、ＲＮＡ１及びＲＮＡ２部分を個別にゲノムにマッピングした。出力は、ＲＮＡ１とＲＮＡ２とがユニークにゲノムにマッピングされたｃＤＮＡであった。図１５はＲＮＡのＨｉ−Ｃデータを解析するための計算パイプライン処理を示す。図１５Ｅにおいて、ＲＮＡ−ＲＮＡ相互作用を関連性テストに基づいて特定した。図示されるように、クラスタ１及び２はＲＮＡ１を、クラスタ３及び４はＲＮＡ２を有する。図１６はＲＮＡ−ＨｉＣ−ツール可視化特性を示す。図１６Ａにおいて、ＲＮＡ内（Ａ）及びＲＮＡ間（Ｂ）相互作用におけるＲＮＡ相互作用部位の詳細な図が示される。２つの相互作用ＲＮＡを含む２つのゲノム領域を並列にプロットした（パネルＢ）。各ＲＮＡ１−リンカー−ＲＮＡ２タイプのキメラＲＮＡは、各ゲノム領域にマッピングされたＲＮＡ１及びＲＮＡ２断片と共にプロットされ、リンカーを表す斜線によって連結された。ブロックは、オーバーラップするＲＮＡＨｉ−Ｃリードの「ピーク」を表し、これは候補ＲＮＡ相互作用部位であった。２つのＲＮＡ相互作用部位を連結する半透明多角形は強力な相互作用を表す。図１６はＲＮＡ−ＨｉＣ−ツール可視化特性を示す。図１６Ｂにおいて、ＲＮＡ内（Ａ）及びＲＮＡ間（Ｂ）相互作用におけるＲＮＡ相互作用部位の詳細な図が示される。２つの相互作用ＲＮＡを含む２つのゲノム領域を並列にプロットした（パネルＢ）。各ＲＮＡ１−リンカー−ＲＮＡ２タイプのキメラＲＮＡは、各ゲノム領域にマッピングされたＲＮＡ１及びＲＮＡ２断片と共にプロットされ、リンカーを表す斜線によって連結された。ブロックは、オーバーラップするＲＮＡＨｉ−Ｃリードの「ピーク」を表し、これは候補ＲＮＡ相互作用部位であった。２つのＲＮＡ相互作用部位を連結する半透明多角形は強力な相互作用を表す。図１６はＲＮＡ−ＨｉＣ−ツール可視化特性を示す。図１６Ｃは、ＲＮＡ−ＲＮＡ相互作用の全体図を示す。ＲＮＡ１及びＲＮＡ２断片のリード密度は、クロマチンサイトバンド模式図（ｃｈｒｏｍａｔｉｎｃｙｔｏｂａｎｄｉｄｅｏｇｒａｍ）内の影付き領域にそれぞれ示される。各特定ＲＮＡ−ＲＮＡ相互作用は、２つのＲＮＡのゲノム座位を連結する曲線として示され、相互作用ＲＮＡのタイプによって色分けされた。図１７はｍｉＲＮＡ様相互作用を伴うｓｎｏＲＮＡを示す。図１７Ａにおいて、ＲＮＡのＨｉ−ＣをｓｍａｌｌＲＮＡ−ｓｅｑ（ＧＳＭ９４５９０７）及びＡＧＯＨＩＴＳ−ＣＬＩＰ（ＧＳＭ６２２５７０）と比較する。ｓｍａｌｌＲＮＡ−ｓｅｑ及びＡＧＯＨＩＴＳ−ＣＬＩＰにおける、各タイプのＲＮＡＨｉ−Ｃ特定相互作用関与ＲＮＡの平均ＦＰＫＭを、対数尺度において示す。ＲＮＡのＨｉ−Ｃ特定相互作用におけるｍｉＲＮＡ及びｓｎｏＲＮＡは、ｓｍａｌｌＲＮＡ−ｓｅｑとＡＧＯＨＩＴＳ−ＣＬＩＰとにおいて濃縮された。図１７パネルＡに示されるように、グラフは、ｓｍａｌｌＲＮＡ−ｓｅｑデータを表すバーが、ＨＩＴＳ−ＣＬＩＰデータを表すバーの上にくるように示される。図１７はｍｉＲＮＡ様相互作用を伴うｓｎｏＲＮＡを示す。図１７Ｂは、相互作用ｓｎｏＲＮＡ及びｍＲＮＡのすべてのペア間の遺伝子発現の相関分布を示す。ＡＧＯによって結合された相互作用ｓｎｏＲＮＡ−ｍＲＮＡペア（濃い灰色）（ＡＧＯＨＩＴＳ−ＣＬＩＰによって規定）は、ＡＧＯによって結合されないペア（薄い灰色）よりも負の相関を示した（ｐ−値＝４．１８−５、コルモゴロフ−スミルノフ検定）。図示されるように、ＡＧＯ結合ピーク（ｐｅａｃｋ）は約．０７５、０．２５、０、−０．５、及び−１相関に現れる。図１７はｍｉＲＮＡ様相互作用を伴うｓｎｏＲＮＡを示す。図１７Ｃは、ハイブリダイゼーションエネルギーにより測定されるような相互作用ＲＮＡの塩基対を示す。ＡＧＯにより結合されたｓｎｏＲＮＡ及びｍＲＮＡペアは、（ＡＧＯＨＩＴＳ−ＣＬＩＰで交差、左側）は、ＡＧＯによって結合されないもの（右側）よりも強力なハイブリダイゼーションエネルギーを示した（ｐ−値＜２．２−１６、ウィルコクソン符号順位検定）。これらすべての相互作用は、無作為にシャッフルされた配列のものよりも強力なハイブリダイゼーションエネルギーを示した。図示されるように、濃い灰色は「実体」を示し、薄い灰色は「無作為」を表す。図１７はｍｉＲＮＡ様相互作用を伴うｓｎｏＲＮＡを示す。図１７Ｄでは、ｍＲＮＡのＵＴＲ領域と相互作用するｓｎｏＲＮＡを、ｓｍａｌｌＲＮＡ−ｓｅｑとＡＧＯＨＩＴＳ−ＣＬＩＰとにおいて濃縮した。ｓｎｏＲＮＡとｍＲＮＡとのコーディング領域（左）間の相互作用総数（ｙ軸）を、ｓｍａｌｌＲＮＡ−ｓｅｑ及びＡＧＯＨＩＴＳ−ＣＬＩＰ、ｓｍａｌｌＲＮＡ−ｓｅｑのみ、ＡＧＯＨＩＴＳ−ＣＬＩＰのみ、及びいずれのデータセットもなし、において検出されたものに分解する。ｓｎｏＲＮＡとｍＲＮＡとのＵＴＲ間の相互作用を同様に分解した（右）。左側の棒グラフに示されるように、上部はｓｍａｌｌＲＮＡ及びＣＬＩＰであり、その後ＣＬＩＰデータ、ｓｍａｌｌＲＮＡ、そして「いずれもなし」が続く。図１８は、ＲＮＡのＨｉ−ＣとｓｍａｌｌＲＮＡ−ｓｅｑとＡＧＯＨＩＴＳ−ＣＬＩＰとの比較である。ｓｍａｌｌＲＮＡ−ｓｅｑ、ＡＧＯＨＩＴＳ−ＣＬＩＰ、及びその両方と交差したＲＮＡＨｉ−Ｃ特定相互作用の割合を示す。ＲＮＡＨｉ−Ｃ相互作用を関与ＲＮＡのタイプによって分類し、該分類をＨＩＴＳ−ＣＬＩＰとのオーバーラップによって並べた。ｍｉｓｃ＿ＲＮＡは、ＲＮａｓｅ＿ＭＲＰ、７ＳＫＲＮＡ及びその他を含む色々なＲＮＡを示す。Ｎｏｖｅｌは未アノテーションＲＮＡを示す。図示されるように、データは上から下に、「両方とオーバーラップ」、「ｓｍａｌｌＲＮＡ−ｓｅｑとオーバーラップ」データ、及び「ＨＩＴＳ−ＣＬＩＰとオーバーラップ」データとして分かれる。図１９は酵素処理したＳＮＯＲＡ１４とＭｃｌ１ｍＲＮＡとの相互作用を示す。図１９Ａにおいて、ＳＮＯＲＡ１４のＲＮＡＨｉ−Ｃ特定相互作用部位はｓｍａｌｌＲＮＡ−ｓｅｑと交差し、ＳＮＯＲＡ１４ＲＮＡがより短い形態に酵素処理されたことが示唆された（第２行目、ピークにおける強調部分）。この酵素処理小型ＲＮＡは、ＳＮＯＲＡ１４ヘアピンの末端（２次構造の強調部分）と、Ｍｃｌ１の３’ＵＴＲのアンチセンス（（Ｂ）のＳＮＯＲＡ１４配列上部の強調部分）とに対応する。図１９は酵素処理したＳＮＯＲＡ１４とＭｃｌ１ｍＲＮＡとの相互作用を示す。図１９Ｂについて、ＳＮＯＲＡ１４のＲＮＡＨｉ−Ｃ特定相互作用部位はｓｍａｌｌＲＮＡ−ｓｅｑと交差し、ＳＮＯＲＡ１４ＲＮＡがより短い形態に酵素処理されたことが示唆され（第２行目、ピークにおける強調部分）、この酵素処理小型ＲＮＡは、ＳＮＯＲＡ１４ヘアピンの末端（２次構造の強調部分）と、Ｍｃｌ１の３’ＵＴＲのアンチセンス（（Ｂ）のＳＮＯＲＡ１４配列上部の強調部分）とに対応する。図１９は酵素処理したＳＮＯＲＡ１４とＭｃｌ１ｍＲＮＡとの相互作用を示す。図１９Ｃは、ＥＳ細胞の中内胚葉細胞への分化時に、ＳＮＯＲＡ１４ＲＮＡ及びＭｃｌ１ｍＲＮＡから処理された小型ＲＮＡの発現レベルを示す。図示されるように、Ｍｃｌ１は０日目から６日目に減少し、一方でＳＮＯＲＡ１４は０日目から６日目に増加する。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ａは、ＲＮＡの全ペアにマッピングされたリードペア数の分布を示す。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ｂは、フィッシャーの正確検定から、全てのＲＮＡペアのＦＤＲ分布を示す。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ｃは、各ＲＮＡにマッピングされたＲＮＡＨｉ−Ｃリード数（ｙ軸）とＦＰＫＭ（ｘ軸）との散布図である。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ｄは、各ＲＮＡの相互作用に関連した最小ＦＤＲ（負の対数）とそのＲＮＡのＦＰＫＭ（ｘ軸）との散布図である。ＦＰＫＭ値は、ｍｍ９に対してｂｏｗｔｉｅ２−２．２．４を用いてマウスＥＮＣＯＤＥデータセットＥＮＣＳＲ０００ＣＷ（Ｅ１４マウスＥＳ細胞からのペアエンドＲＮＡ−Ｓｅｑ）［１］からの生リードをマッピングして、その後ｃｕｆｆｌｉｎｋ２．２．１．で処理することにより得られた。ＥＮＣＳＲ０００ＣＷＣデータとＲＮＡ−Ｈｉ−ＣマウスＥＳ細胞データとに見受けられたユニークなＥｎｓｅｍｂｌＩＤを有する遺伝子全てが、パネル（Ｃ）及び（Ｄ）に包含される。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ｅは、ＲＮＡの全ペアにマッピングされたリードペア数の分布を示す。図２０はリードカウントとＦＤＲとの分布及び遺伝子発現との関係を示す。図２０Ｆは、フィッシャーの正確検定から、全てのＲＮＡペアのＦＤＲ分布を示す。図２１は、種々のタイプのＲＮＡの中で４６，７８０の特定ＲＮＡ−ＲＮＡ相互作用の分布を示す。ｒＲＮＡは実験（実験ステップ６．２）及びバイオインフォマティクス（解析ステップ６）において解析から除かれた。図２２は、ＲＮＡ−ＲＮＡ相互作用ネットワークの次数分布を示す。ノード数（ＲＮＡ）は、対数尺度においてその次数（相互作用数）に反比例し（Ａ）、スケールフリーなネットワークの特徴を示す。この特性は、ネットワークからｓｎＲＮＡ、ｓｎｏＲＮＡ、及びｔＲＮＡを除いた後も変わらなかった（Ｂ）。図２３は、種々のタイプの遺伝子及びトランスポゾンにおける相互作用部位の分布を示す。図２４は、ＲＮＡのＨｉ−Ｃ特定相互作用ＲＮＡ間の塩基の相補性の例を示す。相互作用ＲＮＡのタイプは、ｍＲＮＡ−ｍＲＮＡ（Ａ）、ｌｉｎｃＲＮＡ−ｍＲＮＡ（Ｂ）、偽遺伝子ＲＮＡ−ｍＲＮＡ（Ｃ）、ｍＲＮＡ−ＬＴＲ（Ｄ）、ＬＩＮＥ−ｍＲＮＡ（Ｅ）、ｍＲＮＡ−ｍｉＲＮＡ（Ｆ）を包含した。ＬＴＲ及びＬＩＮＥはトランスポゾン転写物を表す。ＲＮＡの３’末端を第２のＲＮＡに連結する、配列左側の曲線は、リンカー位置を表す。各相互作用をサポートするライゲーションされたキメラＲＮＡの数は、曲線の隣の括弧内に示される。ΔＧはハイブリダイゼーションエネルギーを示す。シャッフルは無作為にシャッフルされた塩基の平均ハイブリダイゼーションエネルギーを示す。図２５は、相互作用ＲＮＡの保存レベルを示す。ＲＮＡタイプによって相互作用を分類した。各タイプの相互作用について、ＲＮＡライゲーション接合部（ｘ軸の０位置）の中心にあるゲノム領域（１０００ｂｐ）の平均ＰｈｙｌｏＰスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、ＲＮＡ１−リンカー−ＲＮＡ２キメラＲＮＡのＲＮＡ１（右）及びＲＮＡ２（左）断片が示される。破線はリンカーを示す。図示されるように、図２５ＡにはｍＲＮＡ、図２５ＢにはＬＩＮＥ、図２５ＣにはＬＴＲを伴う構造が示される。図２５は、相互作用ＲＮＡの保存レベルを示す。ＲＮＡタイプによって相互作用を分類した。各タイプの相互作用について、ＲＮＡライゲーション接合部（ｘ軸の０位置）の中心にあるゲノム領域（１０００ｂｐ）の平均ＰｈｙｌｏＰスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、ＲＮＡ１−リンカー−ＲＮＡ２キメラＲＮＡのＲＮＡ１（右）及びＲＮＡ２（左）断片が示される。破線はリンカーを示す。図示されるように、図２５ＡにはｍＲＮＡ、図２５ＢにはＬＩＮＥ、図２５ＣにはＬＴＲを伴う構造が示される。図２５は、相互作用ＲＮＡの保存レベルを示す。ＲＮＡタイプによって相互作用を分類した。各タイプの相互作用について、ＲＮＡライゲーション接合部（ｘ軸の０位置）の中心にあるゲノム領域（１０００ｂｐ）の平均ＰｈｙｌｏＰスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、ＲＮＡ１−リンカー−ＲＮＡ２キメラＲＮＡのＲＮＡ１（右）及びＲＮＡ２（左）断片が示される。破線はリンカーを示す。図示されるように、図２５ＡにはｍＲＮＡ、図２５ＢにはＬＩＮＥ、図２５ＣにはＬＴＲを伴う構造が示される。図２６は、保存レベルの比較を示す。保存レベルは、相互作用部位のヌクレオチド毎の平均ＰｈｙｌｏＰスコアによって数量化された（ｙ軸）。エクソン、イントロン及びＵＴＲ保存の違いに適応させるため、アノテーションされたエクソン、イントロン、及びＵＴＲ（ゲノム特性と称される）における相互作用部位（対のバーの左側のバー）が、同じゲノム特性からの無作為にサンプリングされた２００，０００のゲノム配列（対のバーの右側のバー）と比較された。無作為にサンプリングされたゲノム配列のサイズは、相互作用のサイズと同じ平均及び変動を共有する。Ｐ−値を、片側２サンプルｔ検定から計算した。＊＊はｐ−値＜１０−１２、＊はｐ−値＜１０−６である。図２７は、ＲＮａｓｅＩ消化密度と１本鎖領域との相関を示す（図２７Ａ〜Ｄ）。各位置で終了又は開始するリード断片の数によって測定される消化頻度（ｙ軸）を既知の２次構造（ｆＲＮＡｄｂデータベースｖ３．４）（ｘ軸）と比較した。ｘ軸の括弧は２本鎖領域を表す。一本鎖（ｓｓ）及び２本鎖（ｄｓ）の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。図２７は、ＲＮａｓｅＩ消化密度と１本鎖領域との相関を示す（図２７Ａ〜Ｄ）。各位置で終了又は開始するリード断片の数によって測定される消化頻度（ｙ軸）を既知の２次構造（ｆＲＮＡｄｂデータベースｖ３．４）（ｘ軸）と比較した。ｘ軸の括弧は２本鎖領域を表す。一本鎖（ｓｓ）及び２本鎖（ｄｓ）の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。図２７は、ＲＮａｓｅＩ消化密度と１本鎖領域との相関を示す（図２７Ａ〜Ｄ）。各位置で終了又は開始するリード断片の数によって測定される消化頻度（ｙ軸）を既知の２次構造（ｆＲＮＡｄｂデータベースｖ３．４）（ｘ軸）と比較した。ｘ軸の括弧は２本鎖領域を表す。一本鎖（ｓｓ）及び２本鎖（ｄｓ）の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。図２７は、ＲＮａｓｅＩ消化密度と１本鎖領域との相関を示す（図２７Ａ〜Ｄ）。各位置で終了又は開始するリード断片の数によって測定される消化頻度（ｙ軸）を既知の２次構造（ｆＲＮＡｄｂデータベースｖ３．４）（ｘ軸）と比較した。ｘ軸の括弧は２本鎖領域を表す。一本鎖（ｓｓ）及び２本鎖（ｄｓ）の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。図２８は、分子内ライゲーションを示す。（Ａ）分子内（自己）ライゲーションを、転写物のＲＮａｓｅＩ消化、その後のリンカーライゲーションと近接ライゲーションとによって生成した。ゆえに、リンカー両側の２つのＲＮＡ断片は同じＲＮＡ分子由来であった。これらの分子内ライゲーションイベントは、連続的な転写物から生成され得たペアエンドリードを除去する、厳密なバイオインフォマティク基準で特定された。切断及びライゲーション処理のみにより生成され得るペアエンドリードがＲＮＡ構造解析に用いられた。下部パネルは、種々のＲＮＡタイプにおける分子内ライゲーション分布を示す。（Ｂ）ＲＮＡタイプにおける分子内ライゲーション数（ｙ軸）対転写長（ｘ軸）を示す。エラーバーは平均の標準偏差を示す。１０００ｎｔを超える長さにおいて遺伝子毎に１０未満のライゲーションのｌｉｎｃＲＮＡ、遺伝子毎に１０未満の自己ライゲーション及び１００ｎｔ未満の長さのｔＲＮＡ、遺伝子毎に１００を超える自己ライゲーション未満及び１００ｎｔを超える長さのｓｎｏＲＮＡ、並びに遺伝子毎に１００未満の自己ライゲーション未満及び１００ｎｔを超える長さのｓｎＲＮＡが示される。（Ｃ）検出分子内ライゲーション数（ｘ軸）によって分類されたｌｉｎｃＲＮＡ遺伝子とｍＲＮＡ遺伝子との数（影付きバー）と長さ（箱ひげ図）とが示される。図２９はＳＮＯＲＡ１４のＲＮＡＨｉ−Ｃリードを示す。図２９Ａは、ＳＮＯＲＡ１４にマッピングされた分子内ライゲーション産生物を示す。黒い部分に示されるのは、ライゲーション接合部である。影付き番号は、リンカーの５’及び３’において優位に表されたライゲーション接合部の位置である。１−６、１−４及び５−５位置の空間的近接性は、配列予測２次構造と一貫性がある（図２９Ｂ）。矢印は、配列予測２次構造において互いに近接しない３−５位置を指す。図２９はＳＮＯＲＡ１４のＲＮＡＨｉ−Ｃリードを示す。図２９Ａは、ＳＮＯＲＡ１４にマッピングされた分子内ライゲーション産生物を示す。黒い部分に示されるのは、ライゲーション接合部である。影付き番号は、リンカーの５’及び３’において優位に表されたライゲーション接合部の位置である。１−６、１−４及び５−５位置の空間的近接性は、配列予測２次構造と一貫性がある（図２９Ｂ）。矢印は、配列予測２次構造において互いに近接しない３−５位置を指す。図３０は構造的に安定した転写物を産生する推定新遺伝子を示す。図３０Ａは、ＲＮＡＨｉ−Ｃ予測の新遺伝子のゲノム位置と種間保存とを示す。図３０は構造的に安定した転写物を産生する推定新遺伝子を示す。図３０Ｂは、この新遺伝子にマッピングされた分子間ライゲーション産生物を示す。黒い部分はライゲーション接合部である。影付き番号は優位に表されたライゲーション接合部の位置である。図３０は構造的に安定した転写物を産生する推定新遺伝子を示す。図３０Ｃは、この推定遺伝子から産生された長（下）及び短（上）転写物の配列予測２次構造を示す。各塩基におけるＲＮａｓｅ消化の頻度（ヒートマップ）は予測１本鎖領域（下）と相関した。ライゲーション位置（矢印）は、配列予測２次構造において近接する。図３１は、ｍＲＮＡ断片の推定構造を示す。ＲＮＡＨｉ−Ｃリードペアは、Ｇｃｎ１ｌ１遺伝子の第２７エクソンの配列から予測される２次構造に重ね合わされた。ラベル付き曲線は、シーケンシングされたキメラＲＮＡのＲＮＡ１及びＲＮＡ２部分にそれぞれ対応する。影付き曲線はリンカーを示す。影付き曲線の黒い部分はライゲーション接合部を示す。ポインタはＲＮａｓｅＩ切断位置を表す。切断及びライゲーション処理は、２つのＲＮＡ断片の５’−３’の順番を入れ替えた。ｍＲＮＡの５’断片（塩基３１２２〜３１６３、赤色）と３’断片（３１６４〜３１９４、青色）は、シーケンシングされたキメラｃＤＮＡにおいて入れ替えられている（挿入部）。これは作図によって適切に陰影がつけられているはずである。図３２は、配列ライブラリにおいてキメラｃＤＮＡを回収するためのワークフローを示す。局所アライメントを用いて、リードペアのフォワード及びリバースリード間の任意のオーバーラップを特定した。局所アライメントを４回用いて（ＡＬＩＧＮ１〜ＡＬＩＮＧ４）、任意のリードペアの、可能性のある４タイプの構成を区別した。３タイプ（タイプ１〜３）が出力に含まれた。タイプ１のｃＤＮＡは１００ｂｐより短かった。タイプ２のｃＤＮＡは１００ｂｐ〜２００ｂｐであった。タイプ３のｃＤＮＡは２００ｂｐより長かった。質的管理として、１００ｂｐより短いがＰ５又はＰ７シーケンシングプライマーの既知の配列のないｃＤＮＡは破棄された（タイプ４）。各アライメントは、「ｌｏｃａｌ−ａｌｉｇｎ（ｓｅｑ１、ｓｅｑ２）｛Ｍ，ｍ，ｏ，ｅ｝」として表され、「ｓｅｑ１」及び「ｓｅｑ２」は２つの入力配列であり、「Ｍ」、「ｍ」、「ｏ」、「ｅ」は一致、不一致、開放ギャップ及び延長ギャップペナルティのパラメータである。各アライメントの出力（Ｘ）は、アライメントスコア（ＳｃｏｒｅＸ）、第１配列（ＢｅｇｉｎＰｏｓ１＿Ｘ，ＥｎｄＰｏｓ１＿Ｘ）及び第２配列（ＢｅｇｉｎＰｏｓ２＿Ｘ，ＥｎｄＰｏｓ２＿Ｘ）におけるアライメントの開始及び終了位置を包含した。図３３はシミュレーション解析を示す。図３３Ａは、ｃＤＮＡの予測長さ（ｙ軸）と実際の長さとの散布図を示す。２００ｂｐより長い予測長さのｃＤＮＡは包含されなかった。これはその正確な長さが予測できなかったためである。図３３はシミュレーション解析を示す。図３３Ｂは、予測ＲＮＡペアとシミュレーションＲＮＡペアとのオーバーラップを示す。図３３はシミュレーション解析を示す。図３３Ｃは、各タイプの関与ＲＮＡの予測ＲＮＡペアにおける感受性と特異性とを示す。図３４は、マウスＥＳ細胞（Ａ）及び脳（Ｂ）の観察されたＲＮＡ−ＲＮＡ相互作用ネットワーク全体の次数分布を示す。ノードの数（ＲＮＡ）は、対数尺度においてその次数（相互作用数）と反比例し、スケールフリーなネットワークの特徴を示す。

［定義］
以下の記載において、多くの用語が広範囲に用いられる。以下の定義は本代替の態様を理解しやすくするために記載される。

本明細書に用いられるように、単数（「ａ」又は「ａｎ」）は１以上を意味し得る。

本明細書に用いられるように、「約」という用語は、値を測定するために採用された方法における誤りの固有の変動、又は実験時に存在する変動を、値が包含することを示す。

本明細書に記載されるような「リボ核酸」、「ＲＮＡ」は、遺伝子のコード化、デコード化、調節、及び発現における役割に関わる、重合体分子である核酸に関する。本明細書に記載の一部の実施形態において、ＲＮＡは、生物学的反応を触媒、遺伝子発現を制御、又は細胞シグナルに対する応答を受け伝達することで、細胞において積極的役割を果たし得る。ＲＮＡにはいくつかのタイプがある。ＲＮＡは、例えば、メッセンジャーＲＮＡ（ｍＲＮＡ）、ｌｉｎｃＲＮＡ、トランスポゾンＲＮＡ、偽ＲＮＡ、調節ＲＮＡ、核内低分子ＲＮＡ（ｓｎＲＮＡ）、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、二重鎖ＲＮＡ、長鎖ノンコーディングＲＮＡ（長鎖ｎｃＲＮＡ又はｌｎｃＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡｓ）、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、及びその他のタイプの短鎖ＲＮＡを、限定することなく含み得る。一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供される。該方法は、ＲＮＡをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含み得る。一部の実施形態において、ＲＮＡは、メッセンジャーＲＮＡ（ｍＲＮＡ）、調節ＲＮＡ、核内低分子ＲＮＡ（ｓｎＲＮＡ）、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、二重鎖ＲＮＡ、長鎖ノンコーディングＲＮＡ（長鎖ｎｃＲＮＡ若しくはｌｎｃＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、又は当業者には既知のその他のタイプの短鎖ＲＮＡである。

本明細書に記載されるような「キメラＲＮＡ」は、ＲＮＡ複合体に関し、ＲＮＡ複合体は、同じタンパク質分子にライゲーションされたライゲーションＲＮＡを含み、ＲＮＡは互いにライゲーションされてこのキメラＲＮＡを形成する。一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供される。該方法は、ＲＮＡをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含み得る。一部の実施形態において、ＲＮＡは、メッセンジャーＲＮＡ（ｍＲＮＡ）、調節ＲＮＡ、核内低分子ＲＮＡ（ｓｎＲＮＡ）、二重鎖ＲＮＡ、長鎖ノンコーディングＲＮＡ（長鎖ｎｃＲＮＡ若しくはｌｎｃＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、又は当業者には既知のその他のタイプの短鎖ＲＮＡである。一部の実施形態において、単離複合体が提供され、該単離複合体はタンパク質に架橋されたキメラＲＮＡを含み、該キメラＲＮＡは細胞において相互作用するＲＮＡを含む。

本明細書に記載されるような「架橋する」又は「架橋された」とは、一方からから他方のポリマーに結合可能であるという結合に関する。架橋は、共有結合又はイオン結合を介して行われ得る。一部の実施形態において、ＲＮＡは、ＵＶ誘導架橋によってタンパク質に架橋される。紫外線によるタンパク質−核酸複合体（タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体）の照射により、核酸と、核酸に緊密に接触したタンパク質との間に、共有結合を形成させ得る。本明細書における一部の実施形態において、ＲＮＡはＵＶ照射によりタンパク質に架橋される。

架橋は、リンカーや、当業者には既知のその他の架橋方法を用いても行われ得る。一部の実施形態において、架橋は、タンパク質を共に結合するプローブや、当業者には既知のその他の架橋方法を用いて行われ得る。また架橋は、合成高分子化学や生物化学において用いられ得る。種々の条件によって開始される化学反応によって、架橋は形成され得る。架橋は、例えば、加熱、圧力変化、ｐＨ変化、紫外線、電子ビーム曝露、ガンマ線照射、及び／又は当業者には既知のその他のタイプの照射によって開始され得るが、限定はされない。さらに、架橋は、２つのポリマー間に架橋を行う化学反応をもたらす架橋試薬によっても誘導され得る。本明細書に記載の一部の実施形態において、架橋は、加熱、圧力変化、ｐＨ変化、紫外線、電子ビーム曝露、ガンマ線照射、及び／又は当業者には既知のその他のタイプの照射によって開始される。

架橋試薬は、アミン間クロスリンカー、スルフヒドリル間クロスリンカー、アミン−スルフヒドリルクロスリンカー、スルフヒドリル−炭水化物クロスリンカー、光反応性クロスリンカー、官能基選択的ライゲーション架橋試薬、インビボ架橋試薬、及びカルボキシル−アミンクロスリンカーを含み得るがこれらに限定されない。一部の実施形態において、架橋試薬は、ホルムアルデヒド、ＤＳＧ（ジスクシンイミジルグルタレート）、ＤＳＳ（ジスクシンイミジルスベレート）、ＢＳ３（ビス（スルホスクシンイミジル）スベレート）、ＴＳＡＴ（トリス−（スクシンイミジル）アミノトリアセテート）、ＢＳ（ＰＥＧ）５（ＰＥＧ化ビス（スルホスクシンイミジル）スベレート）、ＢＳ（ＰＥＧ）９（ＰＥＧ化ビス（スルホスクシンイミジル）スベレート）、ＤＳＰ（ジチオビス（スクシンイミジルプロピオネート））、ＤＴＳＳＰ（３，３’−ジチオビス（スルホスクシンイミジルプロピオネート））、ＤＳＴ（ジスクシンイミジルタルトレート）、ＢＳＯＣＯＥＳ（ビス（２−（スクシンイミドオキシカルボニルオキシ）エチル）スルホン）、ＥＧＳ（エチレングリコールビス（スクシンイミジルスクシネート））、スルホ−ＥＧＳ（エチレングリコールビス（スルホスクシンイミジルスクシネート））、ＤＭＡ（ジメチルアジピミデート）、ＤＭＰ（ジメチルピメルイミデート）、ＤＭＳ（ジメチルスベルイミデート）、ＤＴＢＰ（Ｗａｎｇ及びＲｉｃｈａｒｄ試薬）、ＤＦＤＮＢ（１，５−ジフルオロ−２，４−ジニトロベンゼン）、ＢＭＯＥ（ビスマレイミドエタン）、ＢＭＢ（１，４−ビスマレイミドブタン）、ＢＭＨ（ビスマレイミドヘキサン）、ＴＭＥＡ（トリス（２−マレイミドエチル）アミン）、ＢＭ（ＰＥＧ）２（１，８−ビスマレイミド−ジエチレングリコール）、ＢＭ（ＰＥＧ）３（１，１１−ビスマレイミド−トリエチレングリコール）、ＤＴＭＥ（ジチオビスマレイミドエタン）、ＳＩＡ（スクシンイミジルヨードアセテート）、ＳＢＡＰ（スクシンイミジル３−（ブロモアセトアミド）プロピオネート）、ＳＩＡＢ（スクシンイミジル（４−ヨードアセチル）アミノベンゾアート）、スルホ−ＳＩＡＢ（スルホスクシンイミジル（４−ヨードアセチル）アミノベンゾアート）、ＡＭＡＳ（Ｎ−α−マレイミドアセト−オキシスクシンイミドエステル）、ＢＭＰＳ（Ｎ−β−マレイミドプロピル−オキシスクシンイミドエステル）、ＧＭＢＳ（Ｎ−γ−マレイミドブチリル−オキシスクシンイミドエステル）、スルホ−ＧＭＢＳ（Ｎ−γ−マレイミドブチリル−オキシスルホスクシンイミドエステル）、ＭＢＳ（ｍ−マレイミドベンゾイル−Ｎ−ヒドロキシスクシンイミドエステル）、スルホ−ＭＢＳ（ｍ−マレイミドベンゾイル−Ｎ−ヒドロキシスルホスクシンイミドエステル）、ＳＭＣＣ（スクシンイミジル４−（Ｎ−マレイミドメチル）シクロヘキサン−１−カルボキシレート）、スルホ−ＳＭＣＣ（スルホスクシンイミジル４−（Ｎ−マレイミドメチル）シクロヘキサン−１−カルボキシレート）、ＥＭＣＳ（Ｎ−ε−マレイミドカプロイル−オキシスクシンイミドエステル）、スルホ−ＥＭＣＳ（Ｎ−ε−マレイミドカプロイル−オキシスルホスクシンイミドエステル）、ＳＭＰＢ（スクシンイミジル４−（ｐ−マレイミドフェニル）ブチレート）、スルホ−ＳＭＰＢ（スルホスクシンイミジル４−（Ｎ−マレイミドフェニル）ブチレート）、ＳＭＰＨ（スクシンイミジル６−（（ベータ−マレイミドプロピオンアミド）ヘキサノエート））、ＬＣ−ＳＭＣＣ（スクシンイミジル４−（Ｎ−マレイミドメチル）シクロヘキサン−１−カルボキシ−（６−アミドカプロエート））、スルホ−ＫＭＵＳ（Ｎ−κ−マレイミドウンデカノイル−オキシスルホスクシンイミドエステル）、ＳＰＤＰ（スクシンイミジル３−（２−ピリジルジチオ）プロピオネート）、ＬＣ−ＳＰＤＰ（スクシンイミジル６−（３（２−ピリジルジチオ）プロピオンアミド）ヘキサノエート）、スルホ−ＬＣ−ＳＰＤＰ（スルホスクシンイミジル６−（３’−（２−ピリジルジチオ）プロピオンアミド）ヘキサノエート）、ＳＭＰＴ（４−スクシンイミジルオキシカルボニル−アルファ−メチル−α（２−ピリジルジチオ）トルエン）、ＰＥＧ４−ＳＰＤＰ（ＰＥＧ化、長鎖ＳＰＤＰクロスリンカー）、ＰＥＧ１２−ＳＰＤＰ（ＰＥＧ化、長鎖ＳＰＤＰクロスリンカー）、ＳＭ（ＰＥＧ）２（ＰＥＧ化ＳＭＣＣクロスリンカー）、ＳＭ（ＰＥＧ）４（ＰＥＧ化ＳＭＣＣクロスリンカー）、ＳＭ（ＰＥＧ）６（ＰＥＧ化、長鎖ＳＭＣＣクロスリンカー）、ＳＭ（ＰＥＧ）８（ＰＥＧ化、長鎖ＳＭＣＣクロスリンカー）、ＳＭ（ＰＥＧ）１２（ＰＥＧ化、長鎖ＳＭＣＣクロスリンカー）、ＳＭ（ＰＥＧ）２４（ＰＥＧ化、長鎖ＳＭＣＣクロスリンカー）、スクシンイミジル３−（２−ピリジルジチオ）プロピオネート（ＳＰＤＰ）、ＳＭＣＣ、スクシンイミジルトランス−４−（マレイミジルメチル）シクロヘキサン−１−カルボキシレート、ＢＭＰＨ（Ｎ−β−マレイミドプロピオン酸ヒドラジド）、ＥＭＣＨ（Ｎ−ε−マレイミドカプロン酸ヒドラジド）、ＭＰＢＨ（４−（４−Ｎ−マレイミドフェニル）酪酸ヒドラジド）、ＫＭＵＨ（Ｎ−κ−マレイミドウンデカン酸ヒドラジド）、ＰＤＰＨ（３−（２−ピリジルジチオ）プロピオニルヒドラジド）、ＡＮＢ−ＮＯＳ（Ｎ−５−アジド−２−ニトロベンゾイルオキシスクシンイミド）、スルホ−ＳＡＮＰＡＨ（スルホスクシンイミジル６−（４’−アジド−２’−ニトロフェニルアミノ）ヘキサノエート）、ＳＤＡ（ＮＨＳ−ジアジリン）（スクシンイミジル４，４’−アジペンタノエート）、スルホ−ＳＤＡ（スルホ−ＮＨＳ−ジアジリン）（スルホスクシンイミジル４，４’−アジペンタノエート）、ＬＣ−ＳＤＡ（ＮＨＳ−ＬＣ−ジアジリン）（スクシンイミジル６−（４，４’−アジペンタンアミド）ヘキサノエート）、スルホ−ＬＣ−ＳＤＡ（スルホ−ＮＨＳ−ＬＣ−ジアジリン）（スルホスクシンイミジル６−（４，４’−アジペンタンアミド）ヘキサノエート）、ＳＤＡＤ（ＮＨＳ−ＳＳ−ジアジリン）（スクシンイミジル２−（（４，４’−アジペンタンアミド）エチル）−１，３’−ジチオプロピオネート）、スルホ−ＳＤＡＤ（スルホ−ＮＨＳ−ＳＳ−ジアジリン）（スルホスクシンイミジル２−（（４，４’−アジペンタンアミド）エチル）−１，３’−ジチオプロピオネート）、ＡＴＦＢ、ＳＥ、４−アジド−２，３，５，６−テトラフルオロ安息香酸、スクシンイミジルエステル、ＳＤＡ（ＮＨＳ−ジアジリン）（スクシンイミジル４，４’−アジペンタノエート）、ＳＰＢ（スクシンイミジル−［４−（ソラレン−８−イルオキシ）］−ブチレート）、Ｌ−フォト−ロイシン、Ｌ−フォト−メチオニン、ＭａｎＮＡｚ（Ｎ−アジドアセチルマンノサミンテトラアシル化）、ＧａｌＮＡｚ（Ｎ−アジドアセチルアジドガラクトサミンテトラアシル化）、ＤＣＣ（ジシクロヘキシルカルボジイミド）、ＤｙＬｉｇｈｔ５５０−ホスフィン、ＤｙＬｉｇｈｔ６５０−ホスフィン、ＥＺ−Ｌｉｎｋホスフィン−ＰＥＧ３−ビオチン、ＥＺ−Ｌｉｎｋホスフィン−ＰＥＧ４−デスチオビオチン、ＥＤＣ（１−エチル−３−（３−ジメチルアミノプロピル）カルボジイミドヒドロクロリド）、ＮＨＳ（Ｎ−ヒドロキシスクシンイミド）、スルホ−ＮＨＳ（Ｎ−ヒドロキシスルホスクシンイミド）、スルホ−ＮＨＳ（Ｎ−ヒドロキシスルホスクシンイミド）、スルホ−ＮＨＳ（Ｎ−ヒドロキシスルホスクシンイミド）又はスルホ−ＮＨＳ（Ｎ−ヒドロキシスルホスクシンイミド）を含む。

本明細書に記載されるような「固定化」は分子の捕捉に関し、捕捉は特定分子又は標識に特異的な第１の分子によって行われる。一部の実施形態において、固定化は捕捉分子を固体サポートに接着することで行われる。固体サポートはビーズ又はカラムであり得る。一部の実施形態において、固体サポートは、ストレプトアビジン又はその一部など、分子を捕捉するストレプトアビジン分子を含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。

本明細書に記載されるような「断片化」とは、核酸の消化又は分解に関し得る。本明細書に記載される方法の一部の実施形態において、ＲＮＡは酵素により断片化される。ＲＮＡ分解は種々のヌクレアーゼにより行われ得る。例えば、リボヌクレアーゼ（ＲＮＡｓｅ）は、より小さい成分へのＲＮＡの分解を触媒できるヌクレアーゼの一種である。ＲＮＡｓｅはエンドリボヌクレアーゼとエキソリボヌクレアーゼとに分かれ得る。一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供され、該方法は、ＲＮＡをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合するステップをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。

本明細書に記載されるような「ビオチン」とは、ビタミンＨ又は補酵素Ｒとしても既知の水溶性Ｂビタミンに関する。本明細書に記載の一部の実施形態において、ビオチンは、ビーズなどの固体サポートにストレプトアビジン分子で捕捉するためにＲＮＡを標識するように用いられ得る。一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供され、該方法は、ＲＮＡをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合するステップをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤にライゲーションするステップをさらに含む。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションするステップを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。

本明細書に記載されるような「タンパク質」とは、１以上のポリペプチド鎖を含む高分子に関する。ゆえにタンパク質は、ペプチド（アミド）結合によって結合されたアミノ酸モノマー鎖であり、任意の１以上のアミノ酸によって形成されたペプチドからなり得る。タンパク質又はペプチドは、少なくとも２つのアミノ酸を含み得、タンパク質又はペプチド配列に含み得るアミノ酸の最大数には制限が設けられない。アミノ酸は、例えば、アルギニン、ヒスチジン、リシン、アスパラギン酸、グルタミン酸、セリン、トレオニン、アスパラギン、グルタミン、システイン、シスチン、グリシン、プロリン、アラニン、バリン，ヒドロキシプロリン、イソロイシン、ロイシン、ピロリシン、メチオニン、フェニルアラニン、チロシン、トリプトファン、オルニチン、Ｓ−アデノシルメチオニン、及びセレノシステインであるが、限定されることはない。タンパク質は、炭水化物基などの非ペプチド成分をも含み得る。炭水化物及びその他の非ペプチド置換基は、タンパク質が生成される細胞によってタンパク質に加えられることができ、細胞型で変わり得る。代謝反応、ＤＮＡ複製を触媒すること、刺激に応答すること、及び分子を一方から他方の位置に輸送することで、タンパク質は生体内で機能し得るが、限定されることはない。例として、タンパク質は、酵素、膜貫通タンパク質、及び輸送用抗体、生体小分子や、受容体又はホルモンであり得る。一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供され、該方法は、ＲＮＡをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含む。一部の実施形態において、タンパク質は酵素である。一部の実施形態において、タンパク質は、輸送、又は代謝反応の触媒に関連する。

本明細書に記載されるような「インタラクトーム」とは、特定の細胞における一連の分子相互作用全体に関する。該用語は、分子間の物理的相互作用（タンパク質−タンパク質相互作用としても既知の、タンパク質間物理的相互作用など）に特に関するが、ＲＮＡ−ＲＮＡ相互作用、又は１以上のＲＮＡとタンパク質分子との相互作用などの、遺伝子間の一連の非直接的相互作用（遺伝子相互作用）も示し得る。一部の実施例において、インタラクトームはグラフで示され得る。一部の実施形態において、本方法及び構成は、実質的にすべてのタンパク質補助ＲＮＡ−ＲＮＡ相互作用を、１つのアッセイにおいてマッピングする。本明細書に記載の一部の実施形態において、該方法は、ＲＮＡインタラクトームの初めての全体マップを作製するために適用される。一部の実施形態において、インタラクトームは特定の細胞から作製される。一部の実施形態において、細胞はヒト由来のものである。一部の実施形態において、細胞は、がん細胞、腫瘍細胞、リンパ球、又は免疫細胞である。一部の実施形態において、インタラクトームは疾患の由来を究明又は予測するために用いられ得る。

本明細書に記載されるような「タンパク質複合体」は、群であるか又は２以上の、関連タンパク質又はポリペプチド鎖に関し、「多タンパク質複合体」としても言及され得る。一部の実施形態において、タンパク質複合体結合核酸を含む複合体が提供される。一部の実施形態において、核酸はＲＮＡである。

本明細書に記載されるような「タンパク質中間体」は、ある処理又は特定の経路において、互いに結合したり離れたりすることができるタンパク質に関し、また「タンパク質結合中間体」としても言及され得る。タンパク質中間体が結合すると考えられる例として、転写、翻訳、及び代謝経路などの処理が、限定されることなく含まれる。タンパク質結合中間体の例として、ポリメラーゼ、核酸結合タンパク質、ＲＮＡ認識モチーフタンパク質、ヘテロリボヌクレオタンパク質粒子、及び当業者に既知のその他のタンパク質結合中間体が限定されることなく含まれ得る。一部の実施形態において、タンパク質中間体結合核酸を含む複合体が提供される。一部の実施形態において、核酸はＲＮＡである。一部の実施形態において、タンパク質中間体は、他のタンパク質中間体と相互作用して、タンパク質複合体を形成し、タンパク質複合体はタンパク質中間体を含むものである。

［発明の詳細な説明］
本明細書において開示されるのは、細胞におけるＲＮＡ―ＲＮＡ直接相互作用を特定するための方法及び構成である。一部の実施形態において、該方法及び構成は、細胞における少なくとも約１００、少なくとも約５００、少なくとも約１０００、又は約１０００を超えるＲＮＡ−ＲＮＡ相互作用を特定するために用いられ得る。一部の実施形態において、方法及び構成は、約１００、約２００、約３００、約３００、約５００、約６００、約７００、約８００、約９００、約１０００、約２０００、約３０００、約４０００、約５０００、約６０００、約７０００、約８０００、約９０００、若しくは約１０，０００のＲＮＡ−ＲＮＡ相互作用、又は任意の２つのこれら前述の値の間の、任意の他の数のＲＮＡ−ＲＮＡ相互作用を特定するために用いられ得る。その他の実施形態において、該方法及び構成は、細胞における、実質的にすべてのＲＮＡ−ＲＮＡ直接相互作用を特定するために用いられ得る。例として、該方法及び構成は、細胞における、少なくとも約７０％、少なくとも約８０％、少なくとも約９０％、又は約９０％を超えるＲＮＡ−ＲＮＡ直接相互作用を特定するために用いられ得る。一部の実施形態において、該方法及び構成は、細胞における、少なくとも約７０％、少なくとも約８０％、少なくとも約９０％、若しくは約１００％のＲＮＡ−ＲＮＡ直接相互作用、又は任意の２つの前述の値の間の、任意の他のパーセントのものを特定するために用いられ得る。この方法は、任意の特定のＲＮＡ配列に対する知識によるものではなく、この有益性の１つは未知のＲＮＡ−ＲＮＡ相互作用を特定することにある。

ゲノムの約５％のみがタンパク質に翻訳されるＲＮＡをコードする。ゲノムの約５０％が、マイクロＲＮＡ及び長鎖ｎｃＲＮＡ（２００ｎｔより長い）などのノンコーディングＲＮＡ（ｎｃＲＮＡ）を含むＲＮＡに転写される。ｎｃＲＮＡは、タンパク質関連相互作用を介して、他のＲＮＡとしばしば相互作用する。ゆえに、ＲＮＡ−ＲＮＡ直接相互作用は、タンパク質に基づく捕捉方法を用いて特定され得る。一部の実施形態において、該ＲＮＡ−ＲＮＡ直接相互作用は、タンパク質に基づく捕捉方法を用いて特定され得る。

ＲＮＡ−ＲＮＡ相互作用はＲＮＡ調節機能に必須であるものの、これらを全体的に調査する技術は未だ存在しない。ＨＩＴＳ−ＣＬＩＰ（Ｎａｔｕｒｅ、４６０、４７９−４８６）及びＣＬＡＳＨ（Ｃｅｌｌ、１５３，６５４−６６５）を含む利用可能な技術は、選択タンパク質に付けられたＲＮＡをマッピングできるのみである。そのような、一度に１つのタンパク質、という手法では、ＲＮＡインタラクトーム全体をマッピングできない。

一部の実施形態において、本方法及び構成は、実質的にすべてのタンパク質補助ＲＮＡ−ＲＮＡ相互作用を、１つのアッセイでマッピングする。本明細書に記載の一部の実施形態において、該方法は、ＲＮＡインタラクトームの初めての全体マップを作製するために適用されている。一部の実施形態において、該方法及び構成は、タンパク質特異的抗体の必要性又はタグ付けされたタンパク質発現の必要性がないというものである。このため、ＲＮＡインタラクトームの偏りのないマッピングが可能になる。知るところでは、他の方法では、一度に１つのＲＮＡ結合タンパク質を扱えるのみである。本明細書に記載の実施形態により、ＲＮＡ−ＲＮＡ相互作用が複数のＲＮＡ結合タンパク質について特定され得るという驚くべき結果がもたらされる。

一部の実施形態では、本方法及び構成によって、架橋する前に任意の外来的ヌクレオチド又はタンパク質コード遺伝子を導入する（ＣＬＡＳＨ）ことなく、内在的細胞条件が解析される。一部の実施形態は、形質転換細胞株を必要とする（ＣＬＡＳＨ）というより、任意の細胞型又は組織を解析するために広く適用可能である。

一部の実施形態では、本方法及び構成によって、ＨＩＴＳ−ＣＬＩＰの大きな短所が克服される。ＨＩＴＳ−ＣＬＩＰで推定されたＲＮＡ−ＲＮＡ相互作用は、解析された細胞において必ずしも起こるわけではなかった。これは、ＨＩＴＳ−ＣＬＩＰにおいて共に出現する任意の２つのＲＮＡについて、いずれかのＲＮＡが標的タンパク質の異なるコピーに独立的に接着することからもたらされ得たという理由による。しかしながら、一部の実施形態において、本方法及び構成はＲＮＡの物理的相互作用を確実に示す。

マウス胚性幹（ｅｍｂｒｙｏｎｉｃｓｔｅｍ、ＥＳ）細胞のＲＮＡインタラクトームがマッピングされており、本明細書において、新しい発見が以下に示される。

１．長鎖ＲＮＡはしばしば相互に作用する。数千のｍＲＮＡ−ｍＲＮＡ相互作用と、数百のｌｉｎｃＲＮＡ−ｍＲＮＡ、トランスポゾンＲＮＡ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ相互作用とが、マウスＥＳ細胞において存在する。

２．長鎖ＲＮＡ間の相互作用では、転写物の小片がしばしば用いられる。タンパク質相互作用ドメインとの類似について、ＲＮＡ相互作用部位の概念が本明細書に示される。ＲＮＡ相互作用部位では、長鎖ＲＮＡ相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。

３．ＲＮＡインタラクトームはスケールフリーなネットワークであり、強力に連結されたいくつかの、ｌｉｎｃＲＮＡ及びｍＲＮＡのハブを有する。例示の実施形態において、Ｍａｌａｔ１ｌｉｎｃＲＮＡ及びＳｌｃ２ａ３ｍＲＮＡである２つのハブ間の相互作用が、２色の単一分子ＲＮＡ−ＦＩＳＨを用いて実験において検証されている。

４．実質的に、すべての発現ｓｎｏＲＮＡは、ｍｉＲＮＡ様小型ＲＮＡへと酵素処理されて、ＲＩＳＣ複合体においてｍＲＮＡと相互作用する。

本方法及び構成の一部の実施形態は、分子間相互作用をマッピングするために用いられ得るが、ＲＮＡ構造に関する特有の情報もまた示し得る。ＲＮＡのＨｉ−Ｃの分子内リードにより、ＲＮＡの種々のセグメントの空間的近接情報が得られた。そのように、初めてそうした情報が高スループットな手法で利用可能になった。さらに、同アッセイ時に、すべてのＲＮＡの１本鎖領域が副産物として取得された。例示の実施形態において、ＲＮＡはタンパク質によって曲げられ、そうした四次構造はＨｉ−Ｃの分子内リードにより捕捉された。

一部の実施形態において、該方法は、（１）ＲＮＡ１とＲＮＡ２とをタンパク質（又はタンパク質中間体若しくはタンパク質複合体）に架橋して、複合体を形成するステップと、（２）タンパク質を標識する（例えばビオチン）ステップと、（３）ＲＮＡを断片化するステップと、（４）標識したタンパク質（例えばビオチン−ストレプトアビジン−ビーズ）を捕捉するステップと、（５）ビオチンタグ付きＲＮＡリンカーをＲＮＡ１及びＲＮＡ２の５’末端にライゲーションするステップと、（６）キメラを形成するＲＮＡ１−リンカー−ＲＮＡ２をライゲーションするために近接ライゲーションを行うステップと、（７）複合体をプロテアーゼ処理して、ＲＮＡ１−リンカー−ＲＮＡ２キメラを放出する（ＤＮＡｓｅ処理）ステップと、（８）ビオチンタグ付きＲＮＡリンカーに相補的なＤＮＡプローブにハイブリダイズして、ライゲーションしなかったビオチン化ＲＮＡリンカーを除去するためにＴ７エキソヌクレアーゼで処理するステップと、（９）最終シーケンシング支援のため、核酸を約１５０ｎｔに断片化するステップと、（１０）ストレプトアビジンビーズを用いてＲＮＡ１−リンカー−ＲＮＡ２キメラを捕捉するステップと、（１１）ＲＮＡ１−リンカー−ＲＮＡ２をｃＤＮＡに変換して、ｃＤＮＡの少なくとも一部のシーケンシングを行うステップと、を含む。一部の実施形態において、ＲＮＡ１とＲＮＡ２とを特定するために、バイオインフォマティクスが用いられる。

本方法及び構成は、新規治療ターゲットを開拓するＲＮＡ治療の企業による使用、ＲＮＡ−ＲＮＡ相互作用研究を行うリサーチャーによる使用、及びデバイスや試薬の企業による研究及び発見デバイスのための開発を含む、種々の環境で適用できる。

ノンコーディングＲＮＡ（ｎｃＲＮＡ）は、遺伝子発現調節を含む、広範な範囲の細胞プロセスに関わる。マイクロＲＮＡ（ｍｉＲＮＡ）及び長鎖ｎｃＲＮＡ（ｌｎｃＲＮＡｓ）は既知の調節機能を有する２つの分類のｎｃＲＮＡである。転写後又はエピジェネティクスレベルでの遺伝子発現を調節するこれらのｎｃＲＮＡの能力により、ｎｃＲＮＡを用いた治療の新しい機会がもたらされる。ｎｃＲＮＡやメッセンジャーＲＮＡ（ｍＲＮＡ）間の直接相互作用の特定は、ｎｃＲＮＡの調節機能の理解において避けられないステップである。ｍｉＲＮＡ及びｌｉｎｃＲＮＡ標的は、その他のｎｃＲＮＡの潜在的な調節機能を発見するように設計もされる本明細書の実施形態に記載の技術によって特定可能な相互作用のごく一部であるのみである。しかしながら、これら２つの分類のｎｃＲＮＡのみによって推し進められる診断や治療法の市場は既に重要なものである。

ｍｉＲＮＡは、遺伝子発現の主要な調節因子としての役割を担うノンコーディングリボ核酸群である。近年の研究において、特にがん、心血管性、及び神経性疾患である疾患におけるｍｉＲＮＡの重要性がさらに明らかになっている。大規模クローニングの試みにより、ｍｉＲＮＡの豊富さと多様性が明らかにされている。ヒトゲノムは１０００までのｍｉＲＮＡをコードすると推定されており、これらは、すべての遺伝子の３分の１を調節すると予測される。神経プロセスにおいて、ｍｉＲＮＡは、中枢神経系（ＣＮＳ）の発達と可塑性との主要な媒介物である。外傷性脊髄損傷、外傷性脳損傷、アルツハイマー病、パーキンソン病、及びハンチントン病という多様な神経障害に、ｍｉＲＮＡが関わることが多くの裏付けにより示される。ｍｉＲＮＡ由来の調節の大きな特徴は、複数の代謝遺伝子を調節する肝臓特異的なｍｉＲ−１２２によって例示されるように、機能的に関連する複数のｍＲＮＡを調節する単一のｍｉＲＮＡの能力にある。所定のｍｉＲＮＡは、平均して、エフェクター分子が細胞経路及びネットワークの種々の部位で機能する数百の転写を調節可能である。このため、ｍｉＲＮＡは、細胞プログラム間で迅速に切替え可能であり、ゆえに、ヒトゲノムの主要な調節因子としてしばしば捉えられている。

最初のヒトｍｉＲＮＡが発見されたのはたった１０年前であるが、ｍｉＲＮＡを用いた治療は既にフェーズ２の臨床試験に入った（Ｓａｎｔａｒｉｓが開発した、ｍｉＲ−１２２アンタゴニストのＳＰＣ３６４９が、ウイルス複製を阻害するためにＨＣＶ患者に投与される）。発見から開発へのこのような速い展開は、ヒト疾患の重大な調節因子としてのｍｉＲＮＡの重要性を反映しており、現在の薬剤開発パイプラインに対する魅力のある追加物となり得る新しい薬効分類を生み出す可能性を秘めている。

ｍｉＲＮＡを用いた治療開発に用いられる原理となるものは、薬剤標的から薬剤へと道すじをとるその他の標的治療に対するものと同様である。例として、標的特定及び標的検証は、疾患プロセスに原因として関わるｍｉＲＮＡの選択に重要である。さらに、十分な効能、特異性、及び無毒性を確実にするために、慎重な薬剤開発が必要とされる。しかしながら、ｍｉＲＮＡは、他のいずれとも関連しない薬剤標的分類をなすことから、新規の補助的技術と方法とがまた必要とされる。ｍｉＲＮＡの治療可能性の利用において大きく欠落しているのは、ｍｉＲＮＡの標的ｍＲＮＡを特定するアッセイである。一部の実施形態において、本方法及び構成は、治療方法と組成物との開発に使用され得る。

がん治療市場は現在のところ１千億近くであり、次の５年で急激に拡大すると見込まれる。マイクロＲＮＡを用いた治療法は当該分野の最先端となっている。一部のアナリストによると、治療的ｍｉＲＮＡ毎の１．５億ドルのマーケットに基づき、治療可能性のある５０のｍｉＲＮＡが使用認可されることを考慮すると、７５億ドルに相当する市場を占めると推測される。

一部の実施形態において、本構成及び方法は、いずれのｍｉＲＮＡによる治療的適用においても避けられない欠落を埋めるものである。本方法及び構成のその他の適用には、神経障害における治療的適用や研究所を含む。

ｌｉｎｃＲＮＡは、エピジェネティクスリモデリング複合体とクロマチンとの相互作用を媒介可能である２００ｎｔを超える長さのタンパク質ノンコーディング転写物である。ヒトのがんにおけるｌｎｃＲＮＡ機能をより深く理解することで、可能性のある標的がん遺伝子数を増やせるだけでなく、アンチセンスＲＮＡ又は標的ｌｎｃＲＮＡ−タンパク質相互作用によって媒介される遺伝子調節など、新規の抗がん治療の開発を促すこともできる。正常状態と疾患状態とにおけるｌｎｃＲＮＡの役割をより深く理解することで、ｌｎｃＲＮＡが、診断又は予測バイオマーカーとしても使用できるということが考えられる。例として、ｌｎｃＲＮＡＨＯＴＡＩＲは、原発性乳がん及び転移において発現が増加し、原発性腫瘍におけるその発現レベルは最終的な転移と死亡についての強力な予測因子となる。臨床について見ると、前立腺がんにおいて多く過剰発現される前立腺がん抗原３（ＰＣＡ３）という名のｌｎｃＲＮＡは、図らずも尿に見受けられ、テストが容易である。再度の前立腺生検の必要性決定を支援する初めての尿用分子テストであるＰｒｏｇｅｎｓａＰＣＡ３テストという名の市販のキットは、近年、ＦＤＡにより臨床適用について認可された。ｌｎｃＲＮＡの疾患調節における重要性はがんに限ったことではない。ｌｎｃＲＮＡはまた遺伝的病態にも重要な役割を果たすとＧｉｂｂは記載しており、ｌｎｃＲＮＡ調節解除は短指症やＨＥＬＬＰ症候群に関連している。他のｌｎｃＲＮＡでは、アルツハイマー病経路における重要な酵素についてｍＲＮＡを安定化することが示された。ｌｎｃＲＮＡが主要なヒト疾患に緊密に関連し、疾患診断及び予後において、タンパク質コードＲＮＡと比較してより高い能力があり得るということを、多くの証拠が示唆している。さらに、現在利用可能な薬剤及びツール化合物の大部分は作用の阻害機構を示しており、治療的有用性のためにエフェクター又は経路の活性を増大可能な医薬剤が相対的に欠如している。実際に、種々の遺伝性疾患において不足する腫瘍抑制因子、成長因子、転写因子及び遺伝子を含む多くの遺伝子の上向き調節は、特定の状態において望まれるものである。多くの報告において、ｌｎｃＲＮＡがＲＮＡｉトリガーによってしばしば抑制され得ることが示される。他の遺伝子を抑制するＲＮＡｉによる標的ｌｎｃＲＮＡは、遺伝子発現を活性化可能である。一部の実施形態において、該方法及び構成は、対象細胞において上向き調節された遺伝子の有無を検出するために用いられ得る。一部の実施形態において、細胞は腫瘍細胞、がん細胞、又は免疫細胞を含む。一部の実施形態において、該方法は、上向き調節された遺伝子の情報を含むトランスクリプトームの評価により、疾患又は疾患の転帰を特定又は予測するために用いられ得る。

このように、一部の実施形態において、本方法及び構成はｍｉＲＮＡ治療法市場の企業に使用され得、該企業は、がん細胞における遺伝子調節ネットワークをノーマライズするか、又は心血管及び筋肉疾患を処置するためにｍｉＲＮＡの再現を利用する。例示の実施形態において、本方法及び構成は、候補産生物を検証し、また新規の標的を開拓するために利用され得る。

一部の実施形態において、本方法及び構成は、ＲＮＡのＨｉ−Ｃキットを製造するために用いられ得る。その他の実施形態において、本方法及び構成は、研究用オリゴヌクレオチドを提供するために用いられ得る。例として、本方法及び構成は、包括的ｌｎｃＲＮＡ標的ＲＮＡｉトリガーライブラリの文脈において利用され得る。一部の実施形態において、本方法及び構成は、ＲＮＡｉ標的化のために可能性のあるｌｎｃＲＮＡ候補を特定するように用いられる。

一実施形態において、細胞におけるＲＮＡ−ＲＮＡ相互作用をマッピングする技術が提供される。一実施形態において、該方法及び構成は、１つの実験で実質的にすべてのＲＮＡ−ＲＮＡ相互作用を偏りなくマッピングし、１対１の分解能（どのＲＮＡがどのＲＮＡと相互作用するか）を提供する。一部の実施形態は、新規の実験的構成要素と新規の計算方法とを包含する。一部の実施形態は、所定の細胞型の細胞から開始して、この細胞型の、直接的に相互作用するＲＮＡの一覧をマッピングする。本方法及び構成は、マウスの胚性幹細胞に適用され、１つの実験を用いて４０４９のＲＮＡ−ＲＮＡ相互作用を特定した。一実施形態において、実験的構成要素は、これらの細胞を入力として、実質的にすべてのＲＮＡ−ＲＮＡ直接相互作用をキメラＲＮＡ分子に形質転換し、そしてペアエンドシーケンシングを用いてこれらのキメラＲＮＡをシーケンシングする。一部の実施形態は、（１）すべてのタンパク質−ＲＮＡ複合体（タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体）を磁性ビーズに固定化すること、（２）相互作用ＲＮＡに近接によるライゲーションを行うこと、（３）キメラＲＮＡ分子を選択的に精製すること、（４）キメラ転写の高スループットシーケンシングを行うこと、を含む。本明細書に記載の一実施形態において、該方法は、これらのシーケンシングデータを入力として高信頼性ＲＮＡ−ＲＮＡ相互作用の一覧を作製するバイオインフォマティクプログラムを使用することをさらに含み得る。

現在、一細胞型における実質的にすべてのＲＮＡ−ＲＮＡ相互作用を一度に直接的に分析できる効率的な方法はない。部分的にこの目的を達成するために存在する２種類の方法があり、共に脆弱性がある。まず、インビボにおいて１つのみのｍｉＲＮＡ／ｌｉｎｃＲＮＡの標的を実験的に特性評価することが先駆的技術と考えられる［Ｌａｌ等、２０１１年；Ｂａｉｇｕｄｅ等、２０１２年；Ｋｒｅｔｚ等、２０１３年］。次に、多数のｍｉＲＮＡの標的を検出可能なＨＩＴＳ−ＣＬＩＰやＣＬＡＳＨなどのその他の技術も制限がある。主要な共通の一制限は、共に、ごく一部のＲＮＡを含むのみであるｍｉＲＮＡに集中することである。このように、これらの技術では大部分のＲＮＡ−ＲＮＡ相互作用を明らかにすることができない。さらに各技術にはそれ独自の特定の脆弱性がある。

架橋免疫沈降法によって単離されたＲＮＡの高スループットシーケンシング（ＨＩＴＳ−ＣＬＩＰ）は、現在のところ、ｍｉＲＮＡ標的のゲノム全体の解析について最も信頼のおける方法である［Ｃｈｉ等、２００９年］。ＨＩＴＳ−ＣＬＩＰは、組織に存在するｍｉＲＮＡの全捕集物、そしてｍｉＲＮＡによって調節されるｍＲＮＡのすべての捕集物を特定可能にする。しかしながら、ｍｉＲＮＡとその標的ｍＲＮＡとの直接ペアリングは、ＨＩＴＳ−ＣＬＩＰから直接的に推論できない。換言すると、どのｍｉＲＮＡがどのｍＲＮＡを調節するかは、ＨＩＴＳ−ＣＬＩＰからは直接的には分からない（１対１の情報はない）。

ＣＬＡＳＨ（ｃｒｏｓｓ−ｌｉｎｋｉｎｇ，ｌｉｇａｔｉｏｎ，ａｎｄｓｅｑｕｅｎｃｉｎｇｏｆｈｙｂｒｉｄｓ、ハイブリッドの架橋、ライゲーション、及びシーケンシング）という名称の近年の方法では、ｍＲＮＡ−標的ペアを直接的に観察可能である。しかし、相互作用の数は、配列リードの数と比較して未だ少ないものであり、配列リードの２％のみがキメラであり、９８％が未だシングルリードである。ｍｉＲＮＡ−ｍＲＮＡ相互作用を十分に包含するために、複数のサンプルのより深いシーケンシング範囲又は調製が必要とされる。

一部の実施形態において、本方法及び構成は、ＲＮＡキメラを作製及び濃縮するために実験的及び計算的構成要素を包含し、すべてのＲＮＡ−ＲＮＡ相互作用情報の、偏りのない、ゲノム全体の、直接的なアッセイがマッピングされ得る。

一部の実施形態において、本方法及び構成では、
１．キメラＲＮＡを用いて１対１の分解能ですべてのＲＮＡ−ＲＮＡ相互作用を直接的にアッセイすること、
２．ライゲーション効率及び相互作用特定の精度を向上させるために特定のリンカーを使用すること、
３．所望のキメラＲＮＡ−ＲＮＡ産生物の選択的精製が、ライゲーションされなかった産生物の除去及びビオチンプルダウンにより行われること、
４．ＲＮＡリガーゼの代わりにシーケンシングアダプターを付加するためにｓｓＤＮＡサークリガーゼ（Ｃｉｒｃｌｉｇａｓｅ）を使用することによって高スループットシーケンシングのためにライブラリ調製の効率を向上すること、が提供される。

一部の実施形態において、本方法及び構成では、
１．実験ステップによって生成されたすべての配列リードからキメラＲＮＡ配列を特定すること、
２．それらのキメラをアノテーションＲＮＡクラスタに形質転換すること、
３．統計テストを用いてこれらのＲＮＡクラスタ間の強力な直接的相互作用を特定すること、が可能である。

上記において言及されたように、一部の技術では、インビボにおいて１つのみのｍｉＲＮＡ／ｌｉｎｃＲＮＡの標的が特性評価される（例えば、Ｌａｌ等、２０１１年；Ｂａｉｇｕｄｅ等、２０１２年；ＲＮＡｉｎｔｅｒａｃｔｏｍｅａｎａｌｙｓｉｓ）。

上記において言及されたように、一部の技術では、多数のｍｉＲＮＡの標的を検出可能だが、ｍｉＲＮＡに限られる（例えば、これも直接的な１対１の情報を欠いたＨＩＴＳ−ＣＬＩＰ、ＰＡＲ−ＣＬＩＰ、及びごく一部のキメラＲＮＡのみを提供するＣＬＡＳＨ）。このように、本明細書に記載の本実施形態は、ＲＮＡをｍｉＲＮＡなど小さいサブセットに制限しないことで、先行する方法に対する有利性をもたらす。

例示の一実施形態は、図４に示される。簡潔に言えば、細胞はＵＶ架橋によってインビボにおいて架橋される。ＵＶ架橋には、ＲＮＡが対象タンパク質に共有結合されるが、タンパク質は互いに架橋されないという有利性がある。
ＲＮＡとタンパク質との間に形成される共有結合相互作用は、架橋ＲＮＡ断片の厳密な精製を可能にする。細胞は溶解され、溶解物は、ＲＮａｓｅＩによる部分的ＲＮａｓｅ消化に供される。また、タンパク質において、システイン残基はビオチン化される。タンパク質−ＲＮＡ複合体（タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸、を含む複合体であって、核酸はＲＮＡである）を含むタンパク質は、ストレプトアビジンビーズに固定化される。そして、ＲＮＡの５’末端は、続くキメラＲＮＡの選択的精製を容易にするために、ビオチンタグ付きＲＮＡリンカー（２４ｎｔ）にライゲーションされる。次に、架橋ＲＮＡ断片間のライゲーションに有利である希薄条件下で、近接によるライゲーションがビーズにおいて行われる。タンパク質−ＲＮＡ複合体（タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸、を含む複合体であって、核酸はＲＮＡである）はストレプトアビジンビーズから溶出され、結合タンパク質を消化することでＲＮＡが回収される。そして、精製ＲＮＡを、２４ｎｔＲＮＡリンカーに相補的であるＤＮＡプローブにハイブリダイズして、ライゲーションしなかったビオチン化ＲＮＡリンカーを除去するためにＴ７エキソヌクレアーゼで処理する。結果として、適切にライゲーションされたキメラＲＮＡのみが接合部においてビオチンタグ付きリンカーを含む。キメラＲＮＡライブラリは、平均１５０ヌクレオチドに再度断片化され、ライゲーション接合部はストレプトアビジン被膜磁性ビーズでプルダウンされる。最終産生物は約１５０ｎｔのキメラＲＮＡのライブラリである。このライブラリでは、Ｒ１−リンカー−Ｒ２の形態のキメラが濃縮されると予測され、Ｒ１及びＲ２は相互作用ＲＮＡの断片である。このライブラリはｃＤＮＡに変換され、ペアエンド次世代シーケンシングでシーケンシングされる。

シーケンシングされたｃＤＮＡのバイオインフォマティクス解析の例示の一実施形態は、図５に示される。まず、他と完全に同じである両末端のリードについて、ＰＣＲ重複が除去される。そして、シーケンシング用に送られた断片が回収され、各リードペアの２末端間でＢＬＡＳＴアライメントに基づいて、断片長が推定された。そこから、Ｒ１−リンカー−Ｒ２構成を有するインフォマティブキメラＲＮＡが選択され、Ｒ１及びＲ２は相互作用ＲＮＡの断片である（図５Ａ）。キメラＲＮＡを収集後、Ｒ１及びＲ２断片はゲノムにアライメントし戻されて、多数のオーバーラップアライメントリードによってサポートされたクラスタが、（Ｕｎｉｏｎ−Ｆｉｎｄアルゴリズムを用いて）Ｒ１及びＲ２プールのために並行に生成される。

次に、ライゲーションされたキメラ（Ｒ１−リンカー−Ｒ２）の数に基づいてＲ１及びＲ２プール内のクラスタ間の強力な相互作用を特定するために、超幾何テストが行われる。Ｒ１及びＲ２プールにおけるクラスタのゲノムアノテーションによって、種々のタイプの強力な相互作用が測定される（図５Ｂ）。

マウスの胚性幹（ＥＳ）細胞を用いて２つの独立した実験が行われた。これらの２つの実験は類似する結果をもたらした。ｃＤＮＡは７５ｎｔから２００ｎｔの範囲であり（図６Ａ、プライマーの１２８ｎｔ分を減算する）、約２４００万の非重複ペアエンドリードをもたらした。Ｒ１−リンカー−Ｒ２形態のキメラＲＮＡが特定された（２４０万）。全部で４０４９の相互作用が超幾何テストによって特定され、異なるタイプの相互作用に分類され（図６Ｂ）、ｓｎｏＲＮＡ−ｍＲＮＡ相互作用が最も豊富である。２４２の相互作用において、ｓｎｏＲＮＡはｍＲＮＡの３’ＵＴＲを標的とし、ｓｎｏＲＮＡがより小さい分子へとプロセスされ、ｍｉＲＮＡのように機能するという近年提案された仮説を裏付ける［Ｂｒａｍｅｉｅｒ等、２０１１年；Ｓｃｏｔｔ等、２０１１年］。例として、１８の非重複キメラＲＮＡは、ＳＮＯＲＡ１ｓｎｏＲＮＡをＴｒｉｍ２５ｍＲＮＡの３’ＵＴＲに結合する（図６Ｃ）。アルゴノートタンパク質プルダウンと次のＲＮＡシーケンシング（ＣＬＩＰ−ｓｅｑ）のデータにより［Ｌｕｅｎｇ等、２０１１年］、ＳＮＯＲＡ１とＴｒｉｍ２５とがアルゴノートに付加されたことが確認された（図６Ｃ）。ＥＳ細胞分化の経過解析［Ｓｈｕ等、２０１２年］により、逆相関が確認され（図６Ｄ）、これは１つのＲＮＡが他を抑制するという着想に添うものである。

本技術による原理証明実験により、４０４９ペアの相互作用ＲＮＡ一覧が作製された。ｐ値とサポートリードペア数とに基づき、上位１０の相互作用が表１に示される。

表１は、胚性幹細胞におけるＲＮＡ−スティッチ−Ｓｅｑにより特定されたＲＮＡ−ＲＮＡ相互作用の上位１０を示す。各行では、相互作用ＲＮＡ１や相互作用ＲＮＡ２という名称の相互作用ＲＮＡペアの情報が示される。この相互作用ペアにより形成され、且つペアエンド配列リードとして反映されるキメラＲＮＡの数が最後の列に示される。双方向矢印は直接相互作用を示す。

ＲＮＡ−ＲＮＡ相互作用によって、多くの生物学的プロセスが調節される（Ｋｒｅｔｚ，Ｍ．等、Ｃｏｎｔｒｏｌｏｆｓｏｍａｔｉｃｔｉｓｓｕｅｄｉｆｆｅｒｅｎｔｉａｔｉｏｎｂｙｔｈｅｌｏｎｇｎｏｎ−ｃｏｄｉｎｇＲＮＡＴＩＮＣＲ、Ｎａｔｕｒｅ４９３、２３１−２３５、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１１６６１（２０１３年））が、ＲＮＡインタラクトーム全体の解析には未だ困難がある。例示の実施形態において、インビボにおけるタンパク質補助ＲＮＡ−ＲＮＡ相互作用をマッピングするために、ＲＮＡのＨｉ−Ｃ法が用いられた。特定のＲＮＡ結合タンパク質の選択をしないことで（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ、Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ、Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ、Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年）；Ｈｅｌｗａｋ，Ａ．、Ｋｕｄｌａ，Ｇ．、Ｄｕｄｎａｋｏｖａ，Ｔ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＭａｐｐｉｎｇｔｈｅｈｕｍａｎｍｉＲＮＡｉｎｔｅｒａｃｔｏｍｅｂｙＣＬＡＳＨｒｅｖｅａｌｓｆｒｅｑｕｅｎｔｎｏｎｃａｎｏｎｉｃａｌｂｉｎｄｉｎｇ、Ｃｅｌｌ１５３、６５４−６６５、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１３．０３．０４３（２０１３年）；Ｋｕｄｌａ，Ｇ．、Ｇｒａｎｎｅｍａｎ，Ｓ．、Ｈａｈｎ，Ｄ．、Ｂｅｇｇｓ，Ｊ．Ｄ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、Ｃｒｏｓｓ−ｌｉｎｋｉｎｇ，ｌｉｇａｔｉｏｎ，ａｎｄｓｅｑｕｅｎｃｉｎｇｏｆｈｙｂｒｉｄｓｒｅｖｅａｌｓＲＮＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓｉｎｙｅａｓｔ、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１０８、１００１０−１００１５、ｄｏｉ：１０．１０７３／ｐｎａｓ．１０１７３８６１０８（２０１１年））、該手法はＲＮＡインタラクトームの特定可能部分をに大きく拡大した。この技術を使用することで、４６，７８０のＲＮＡ−ＲＮＡ相互作用からなるマウス胚性幹細胞のＲＮＡインタラクトームマッピングが可能になった。ＲＮＡインタラクトームは、ハブとして現れるｌｉｎｃＲＮＡ及びｍＲＮＡを伴うスケールフリーなネットワークである。相互作用は、単一分子ＲＮＡ蛍光インサイツハイブリダイゼーション法を用いて、２つのハブ、Ｍａｌａｔ１とＳｌｃ２ａ３との間で検証された。塩基対が長鎖ＲＮＡの相互作用部位で観察され、トランスポゾンＲＮＡ−ｍＲＮＡ及びｌｉｎｃＲＮＡ−ｍＲＮＡ相互作用において特に強力であった。このことで、トランスで作用する新しいタイプの調節配列が明らかにされた。仮定的な役割と矛盾せず、ＲＮＡ相互作用部位は転写物の他の領域よりも進化的に保存された。ＲＮＡのＨｉ−Ｃ法は、１本鎖領域のフットプリントと各ＲＮＡの空間的近位部位とを共に明らかにすることで、ＲＮＡ構造の新規の情報も提供する。このように、細胞生理の最小摂動を伴うタンパク質補助ＲＮＡインタラクトームの偏りのないマッピングが、先行の方法に対して有利であり、ＲＮＡ機能検証の範囲を大きく拡大する。

ＲＮＡ分子間の相互作用は主要な調節の役割を発揮し、アルゴノートタンパク質（ＡＲＧＯＮＡＵＴＥ、ＡＧＯ）（Ｍｅｉｓｔｅｒ，Ｇ．、Ａｒｇｏｎａｕｔｅｐｒｏｔｅｉｎｓ：ｆｕｎｃｔｉｏｎａｌｉｎｓｉｇｈｔｓａｎｄｅｍｅｒｇｉｎｇｒｏｌｅｓ、Ｎａｔｕｒｅｒｅｖｉｅｗｓ．Ｇｅｎｅｔｉｃｓ１４、４４７−４５９、ｄｏｉ：１０．１０３８／ｎｒｇ３４６２（２０１３年））、ＰＵＭ２、ＱＫＩ（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ、Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年））、及びｓｎｏＲＮＡタンパク質（Ｇｒａｎｎｅｍａｎ，Ｓ．、Ｋｕｄｌａ，Ｇ．、Ｐｅｔｆａｌｓｋｉ，Ｅ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＩｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｒｏｔｅｉｎｂｉｎｄｉｎｇｓｉｔｅｓｏｎＵ３ｓｎｏＲＮＡａｎｄｐｒｅ−ｒＲＮＡｂｙＵＶｃｒｏｓｓ−ｌｉｎｋｉｎｇａｎｄｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔａｎａｌｙｓｉｓｏｆｃＤＮＡｓ、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１０６、９６１３−９６１８、ｄｏｉ：１０．１０７３／ｐｎａｓ．０９０１９９７１０６（２００９年））などの、ＲＮＡ結合タンパク質によってしばしば媒介される（Ｒａｙ，Ｄ．等、ＡｃｏｍｐｅｎｄｉｕｍｏｆＲＮＡ−ｂｉｎｄｉｎｇｍｏｔｉｆｓｆｏｒｄｅｃｏｄｉｎｇｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｎａｔｕｒｅ４９９、１７２−１７７、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２３１１（２０１３年））。ＰＡＲ−ＣＬＩＰ（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ、Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年））、ＨＩＴＳ−ＣＬＩＰ（Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ、Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年））、及びＣＬＡＳＨ（Ｈｅｌｗａｋ，Ａ．、Ｋｕｄｌａ，Ｇ．、Ｄｕｄｎａｋｏｖａ，Ｔ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ、ＭａｐｐｉｎｇｔｈｅｈｕｍａｎｍｉＲＮＡｉｎｔｅｒａｃｔｏｍｅｂｙＣＬＡＳＨｒｅｖｅａｌｓｆｒｅｑｕｅｎｔｎｏｎｃａｎｏｎｉｃａｌｂｉｎｄｉｎｇ、Ｃｅｌｌ１５３、６５４−６６５、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１３．０３．０４３（２０１３年）；Ｋｕｄｌａ，Ｇ．、Ｇｒａｎｎｅｍａｎ，Ｓ．、Ｈａｈｎ，Ｄ．、Ｂｅｇｇｓ，Ｊ．Ｄ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、Ｃｒｏｓｓ−ｌｉｎｋｉｎｇ，ｌｉｇａｔｉｏｎ，ａｎｄｓｅｑｕｅｎｃｉｎｇｏｆｈｙｂｒｉｄｓｒｅｖｅａｌｓｒｎａ−ｒｎａ interactionｓｉｎｙｅａｓｔ、ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１０８、１００１０−１００１５、ｄｏｉ：１０．１０７３／ｐｎａｓ．１０１７３８６１０８（２０１１年））などの近年の進展にも関わらず、すべてのタンパク質補助ＲＮＡ−ＲＮＡ相互作用をマッピングするには困難な課題が残る。

これら３つの手法のそれぞれにおいて、実験ごとに、１つのＲＮＡ結合タンパク質により媒介される相互作用のみが解析可能である。加えて、各実験には、タンパク質特異的抗体か（ＨＩＴＳ−ＣＬＩＰ又はＰＡＲ−ＣＬＩＰ）、又は形質転換細胞株におけるタグ付きタンパク質の安定的な発現（ＣＬＡＳＨ）のいずれかが要求される。さらに、ＨＩＴＳ−ＣＬＩＰ又はＰＡＲ−ＣＬＩＰにおいて共出現する任意の２つのＲＮＡは、標的タンパク質の種々のコピーにいずれかのＲＮＡが独立的に付加されることからもたらされ得る。例として、それぞれが異なるＲＮＡに結合される約１０のＡＧＯタンパク質が細胞に存在すると考えると、これら１０のＲＮＡは、ＡＧＯＨＩＴＳ−ＣＬＩＰからの相互作用として特定され得る。ゆえに、ＨＩＴＳ−ＣＬＩＰ及びＰＡＲ−ＣＬＩＰ推定ＲＮＡ−ＲＮＡ相互作用は、解析細胞において必ずしも発生するわけではなかった。

本明細書に記載の例示の実施形態において、インビボでのタンパク質補助ＲＮＡ−ＲＮＡ相互作用を検出するために、ＲＮＡのＨｉ−Ｃ法を用いた。この方法では、ＲＮＡはその結合タンパク質に架橋され、ビオチン化ＲＮＡリンカーにライゲーションされて、ＲＮＡ１及びＲＮＡ２であるＲＮＡが、ＲＮＡ１−リンカー−ＲＮＡ２形態のキメラＲＮＡを形成する同じタンパク質に共結合される。これらのリンカー包含キメラＲＮＡはストレプトアビジン被膜磁性ビーズを用いて単離され、ペアエンドシーケンシングに供される（方法、図１Ａ，図７）。このように、各非重複ペアエンドリードが分子相互作用を示す。

ＲＮＡのＨｉ−Ｃ法には、ＲＮＡ−ＲＮＡ相互作用のマッピングにいくつかの有利性がある。第１に、同じタンパク質分子によってまとめられたＲＮＡのみが捕捉され、異なるＲＮＡが同じタンパク質の異なるコピーに独立的に結合されるときに相互作用するとして考えられ得るＨＩＴＳ−ＣＬＩＰの不利な点を克服する。第２に、選択マーカーとしてビオチン化リンカーを使用することで、タンパク質特的抗体の必要性又はタグ付きタンパク質を発現する必要性が退けられる。このため、ＲＮＡインタラクトームの偏りのないマッピングが可能になる。当該技術分野において述べられるように、その他の方法は、一度に１つのＲＮＡ結合タンパク質を扱えるのみであり得る。このように、この方法では、一度に１つを超えるＲＮＡ結合タンパク質を効率的に扱えるという驚くべき効果がもたらされる。第３として、高希薄条件においてストレプトアビジンビーズにＲＮＡライゲーションステップを行うことで、他の近接するＲＮＡに無作為にライゲーションするＲＮＡからもたらされる偽陽性が最小化される。第４として、ＲＮＡリンカーは、ライゲーション部位にわたるシーケンシングリードを示す明確な境界を与え、シーケンシングリードのマッピングにおける不明確さを退ける。第５として、ＲＮＡのＨｉ−Ｃは、架橋する前に、任意の外来的ヌクレオチドを導入することなく内在的細胞条件直接的に解析する（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ、Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｌａｌ，Ａ．等、ＣａｐｔｕｒｅｏｆｍｉｃｒｏＲＮＡ−ｂｏｕｎｄｍＲＮＡｓｉｄｅｎｔｉｆｉｅｓｔｈｅｔｕｍｏｒｓｕｐｐｒｅｓｓｏｒｍｉＲ−３４ａａｓａｒｅｇｕｌａｔｏｒｏｆｇｒｏｗｔｈｆａｃｔｏｒｓｉｇｎａｌｉｎｇ、ＰＬｏＳｇｅｎｅｔｉｃｓ７、ｅ１００２３６３、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｇｅｎ．１００２３６３（２０１１年）；Ｂａｉｇｕｄｅ，Ｈ．、Ａｈｓａｎｕｌｌａｈ，Ｌｉ，Ｚ．、Ｚｈｏｕ，Ｙ．、＆Ｒａｎａ，Ｔ．Ｍ．、ｍｉＲ−ＴＲＡＰ：ａｂｅｎｃｈｔｏｐｃｈｅｍｉｃａｌｂｉｏｌｏｇｙｓｔｒａｔｅｇｙｔｏｉｄｅｎｔｉｆｙｍｉｃｒｏＲＮＡｔａｒｇｅｔｓ、ＡｎｇｅｗＣｈｅｍＩｎｔＥｄＥｎｇｌ５１、５８８０−５８８３、ｄｏｉ：１０．１００２／ａｎｉｅ．２０１２０１５１２（２０１２年））；又はタンパク質コード遺伝子（Ｈｅｌｗａｋ，Ａ．、Ｋｕｄｌａ，Ｇ．、Ｄｕｄｎａｋｏｖａ，Ｔ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＭａｐｐｉｎｇｔｈｅｈｕｍａｎｍｉＲＮＡｉｎｔｅｒａｃｔｏｍｅｂｙＣＬＡＳＨｒｅｖｅａｌｓｆｒｅｑｕｅｎｔｎｏｎｃａｎｏｎｉｃａｌｂｉｎｄｉｎｇ、Ｃｅｌｌ１５３，６５４−６６５，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１３．０３．０４３（２０１３年））。第６として、ＰＣＲ増幅前に、無作為の６つのヌクレオチドバーコードを各キメラＲＮＡに付加し、続いて同一のバーコードを有する完全にオーバーラップするシーケンシングリードを１度のみ計数することで、潜在的ＰＣＲ増幅バイアスが除かれる。（Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ、Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年）；Ｌｏｅｂ，Ｇ．Ｂ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｍｉＲ−１５５ｂｉｎｄｉｎｇｍａｐｒｅｖｅａｌｓｗｉｄｅｓｐｒｅａｄｎｏｎｃａｎｏｎｉｃａｌｍｉｃｒｏＲＮＡｔａｒｇｅｔｉｎｇ、Ｍｏｌｅｃｕｌａｒｃｅｌｌ４８、７６０−７７０、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１２．１０．００２（２０１２年）；Ｗａｎｇ，Ｚ．等、ｉＣＬＩＰｐｒｅｄｉｃｔｓｔｈｅｄｕａｌｓｐｌｉｃｉｎｇｅｆｆｅｃｔｓｏｆＴＩＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓ、ＰＬｏＳｂｉｏｌｏｇｙ８、ｅ１０００５３０，ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｂｉｏ．１０００５３０（２０１０年）；Ｋｏｎｉｇ，Ｊ．等、ｉＣＬＩＰｒｅｖｅａｌｓｔｈｅｆｕｎｃｔｉｏｎｏｆｈｎＲＮＰｐａｒｔｉｃｌｅｓｉｎｓｐｌｉｃｉｎｇａｔｉｎｄｉｖｉｄｕａｌｎｕｃｌｅｏｔｉｄｅｒｅｓｏｌｕｔｉｏｎ、Ｎａｔｕｒｅｓｔｒｕｃｔｕｒａｌ＆ｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ１７、９０９−９１５、ｄｏｉ：１０．１０３８／ｎｓｍｂ．１８３８（２０１０年））。

例示の実施形態において、ＥＳ‐１及びＥＳ−２として示される技術上僅かな違いのあるマウスの胚性幹（ＥＳ）細胞において、２つの独立的なＲＮＡＨｉ−Ｃアッセイが行われた（図８〜１２）。単一のタンパク質の代わりに、大きいタンパク質複合体（Ｚｈａｏ，Ｊ．等、Ｇｅｎｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｏｌｙｃｏｍｂ−ａｓｓｏｃｉａｔｅｄＲＮＡｓｂｙＲＩＰ−ｓｅｑ、Ｍｏｌｅｃｕｌａｒｃｅｌｌ４０、９３９−９５３、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１０．１２．０１１（２０１０年））、又は細胞小器官より会合されたＲＮＡの制御のため、ヌクレオチド間とタンパク質間との両方、及びタンパク質間（ＥＳ−インダイレクト）の共有結合を形成する２つの架橋剤（ホルムアルデヒド及びＥＧＳ）を用いてＲＮＡのＨｉ−Ｃライブラリが生成された（Ｎｏｗａｋ，Ｄ．Ｅ．、Ｔｉａｎ，Ｂ．＆Ｂｒａｓｉｅｒ，Ａ．Ｒ．、Ｔｗｏ−ｓｔｅｐｃｒｏｓｓ−ｌｉｎｋｉｎｇｍｅｔｈｏｄｆｏｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＮＦ−ｋａｐｐａＢｇｅｎｅｎｅｔｗｏｒｋｂｙｃｈｒｏｍａｔｉｎｉｍｍｕｎｏｐｒｅｃｉｐｉｔａｔｉｏｎ、ＢｉｏＴｅｃｈｎｉｑｕｅｓ３９、７１５−７２５（２００５年）；Ｚｅｎｇ，Ｐ．Ｙ．、Ｖａｋｏｃ，Ｃ．Ｒ．、Ｃｈｅｎ，Ｚ．Ｃ．、Ｂｌｏｂｅｌ，Ｇ．Ａ．＆Ｂｅｒｇｅｒ，Ｓ．Ｌ．、Ｉｎｖｉｖｏｄｕａｌｃｒｏｓｓ−ｌｉｎｋｉｎｇｆｏｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｉｎｄｉｒｅｃｔＤＮＡ−ａｓｓｏｃｉａｔｅｄｐｒｏｔｅｉｎｓｂｙｃｈｒｏｍａｔｉｎｉｍｍｕｎｏｐｒｅｃｉｐｉｔａｔｉｏｎ、ＢｉｏＴｅｃｈｎｉｑｕｅｓ４１、６９４、６９６、６９８（２００６年））。マウス胚性線維芽細胞（ＭＥＦ）から、他のライブラリが生成され、バイオインフォマティクス品質評価のためにもう１つのデータセットを提供した（図１３）。各ライブラリは、所望の形態（ＲＮＡ１−リンカー−ＲＮＡ２）及び長さのＲＮＡ構築物を含むことが確認された（図１Ｂ）。各ライブラリは、平均で、４７３０万のペアエンドリードを産生するためにシーケンシングされ、その中で、約１５１０万の非重複ペアエンドリードが所望のキメラ形態を表した（図１Ｃ）。

ＲＮＡのＨｉ−Ｃデータを解析し可視化するために、一連のバイオインフォマティクスツール（ＲＮＡ−ＨｉＣ−ツール）が作製された（図１４〜１５）。ＲＮＡ−ＨｉＣ−ツールは解析ステップを自動化し、該ステップは、ＰＣＲ重複除去、多重サンプル分離、リンカー配列特定、ジャンクションリード分離、相互作用ＲＮＡの判定、統計評価実行、ＲＮＡ相互作用タイプのカテゴライズ、相互作用部位の判定、及びＲＮＡ構造の解析（方法）を含む。また、ＲＮＡ内のＲＮＡインタラクトームと近位部位とについて、可視化ツールが提供される（図１６）。

ＲＮＡＨｉ−Ｃライブラリの４つが比較された。（リンカーの左右側のリード断片について個別に算出された）ＦＰＫＭの相関によると、ＥＳ−１及びＥＳ−２は最も類似するものであり、ＥＳ−インダイレクト、そしてＭＥＦが後に続く（図１３）。ＥＳ−１から特定された相互作用ＲＮＡペアとＥＳ−２から特定された相互作用ＲＮＡペアとは強固なオーバーラップを示した（（ｐ値＜１０^−３５、並べ替え検定）。ＭＥＦにおいて特定された相関関係は、ＥＳサンプルのいずれかのものと有意にオーバーラップしなかった（各オーバーラップについてｐ値＝１、並べ替え検定）。例として、Ｔｒｉｍ２５ＲＮＡの３’ＵＴＲと核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）のＳｎｏｒａ１との相互作用は、ＥＳ−１及びＥＳ−２サンプルのそれぞれ２４及び２２のペアエンドリードによって裏付けられたが、ＥＳ−インダイレクト又はＭＥＦライブラリでは検出されなかった（図１Ｃ）。Ｓｎｏｒａ１を含め、ｍＲＮＡとの相互作用として特定された１７２の数のｓｎｏＲＮＡが、ＡＧＯＨＩＴＳ−ＣＬＩＰ（図１Ｃ）と小型ＲＮＡシーケンシングデータ（Ｙｕ，Ｐ．等、Ｓｐａｔｉｏｔｅｍｐｏｒａｌｃｌｕｓｔｅｒｉｎｇｏｆｔｈｅｅｐｉｇｅｎｏｍｅｒｅｖｅａｌｓｒｕｌｅｓｏｆｄｙｎａｍｉｃｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ２３、３５２−３６４、ｄｏｉ：１０．１１０１／ｇｒ．１４４９４９．１１２（２０１３年））（図１Ｃ、図１７〜１９）によって裏付けられ、発現ｓｎｏＲＮＡ遺伝子の大部分がｍｉＲＮＡ様小型ＲＮＡへと酵素処理され、ＲＩＳＣ複合体においてｍＲＮＡと相互作用したことが示される（Ｅｎｄｅｒ，Ｃ．等、ＡｈｕｍａｎｓｎｏＲＮＡｗｉｔｈｍｉｃｒｏＲＮＡ−ｌｉｋｅｆｕｎｃｔｉｏｎｓ、Ｍｏｌｅｃｕｌａｒｃｅｌｌ３２、５１９−５２８、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２００８．１０．０１７（２００８年）；Ｂｒａｍｅｉｅｒ，Ｍ．、Ｈｅｒｗｉｇ，Ａ．、Ｒｅｉｎｈａｒｄｔ，Ｒ．、Ｗａｌｔｅｒ，Ｌ．＆Ｇｒｕｂｅｒ，Ｊ．、ＨｕｍａｎｂｏｘＣ／ＤｓｎｏＲＮＡｓｗｉｔｈｍｉＲＮＡｌｉｋｅｆｕｎｃｔｉｏｎｓ：ｅｘｐａｎｄｉｎｇｔｈｅｒａｎｇｅｏｆｒｅｇｕｌａｔｏｒｙＲＮＡｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３９、６７５−６８６、ｄｏｉ：１０．１０９３／ｎａｒ／ｇｋｑ７７６（２０１１年））（テキストＳ１）。

そして、その他のＲＮＡがｍｉＲＮＡ生合成への同様のプロセスを経るか、またｍＲＮＡと相互作用し得るかを理解することが望まれた。そのためには、ＲＮＡのＨｉ−Ｃにより特定された相互作用ＲＮＡが、ＥＳ細胞において、小型ＲＮＡシーケンシング（小型ＲＮＡ−ｓｅｑ）によって見出されたもの及びＡＧＯタンパク質と結合するもの（ＨＩＴＳ−ＣＬＩＰ）と交差された（Ｓ．Ｗ．Ｃｈｉ、Ｊ．Ｂ．Ｚａｎｇ、Ａ．Ｍｅｌｅ、Ｒ．Ｂ．Ｄａｒｎｅｌｌ、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ、Ｎａｔｕｒｅ４６０、４７９（２００９年７月２３日））。小型ＲＮＡ−ｓｅｑでは、「Ｄｉｃｅｒ又はその他のＲＮＡ処理酵素による酵素切断からもたらされる３’ヒドロキシル基を有するｍｉＲＮＡ及びその他の小型ＲＮＡ」が選択的にシーケンシングされた（イルミナ、「ＴｒｕＳｅｑ（Ｒ）ＳａｍｌｌＲＮＡＳａｍｐｌｅＰｒｅｐａｒａｔｉｏｎＧｕｉｄｅ」（２０１４年））。ｍｉＲＮＡを除いて、ｓｎｏＲＮＡ、偽遺伝子ＲＮＡ、ｍＲＮＡＵＴＲを含む他のＲＮＡ型も小型ＲＮＡプールに寄与し、ＡＧＯに付加された（図１７Ａ）。さらに、ＲＮＡのＨｉ−Ｃにより特定された相互作用ＲＮＡペアの大部分が、ＡＧＯＨＩＴＳ−ＣＬＩＰデータにおいて共出現した（図１８）。このデータにより、ＤＩＣＥＲ又は他のＲＮＡ処理酵素により消化され、且つＲＩＳＣ複合体に組み込まれるノンｍｉＲＮＡが存在することが示唆される。

ノンｍｉＲＮＡ遺伝子のどのタイプがｍｉＲＮＡ様生合成を受け得るかを明らかにするため、ＲＮＡのＨｉ−Ｃによって特定されたＲＮＡ−ＲＮＡ相互作用に以下のフィルターを行った。

１．相互作用が１つのｍＲＮＡ（標的と称される）ともう一つのＲＮＡ（ソースＲＮＡ）に関わる。

２．ソースＲＮＡは酵素切断により小型ＲＮＡ処理される（小型ＲＮＡ−ｓｅｑにおいてＦＰＫＭ＞０）。

３．標的とソースＲＮＡとはＡＧＯＨＩＴＳ−ＣＬＩＰに出現する（両ＲＮＡでＦＰＫＭ＞０）。

４．ソースにおけるＲＮＡＨｉ−Ｃ特定相互作用部位と、標的ＲＮＡとは強力な塩基対形成を示す（ｐ値＜０．０５、すべてのペアエンドリードのＲＮＡ１配列とＲＮＡ２配列との結合エネルギーを、無作為にシャッフルしたヌクレオチド配列の結合エネルギーと比較するウィルコクソン符号順位検定）。

これらのフィルターを、総数３０２のＲＮＡ−ＲＮＡ相互作用が通過した。これらの相互作用におけるソースＲＮＡの大多数（７９％）はｓｎｏＲＮＡであった（表２）。ゆえに、ｓｎｏＲＮＡは機能解析において優先された。

表２は、ｍｉＲＮＡ様ＲＮＡを示す。ＲＮＡのＨｉ−Ｃにより特定されたＲＮＡ−ＲＮＡ相互作用は、（１）ｍＲＮＡ（標的と称される）ともう一つのＲＮＡ（ソースＲＮＡと称される）に関わること、（２）ソースＲＮＡが小型ＲＮＡ−ｓｅｑに存在すること、（３）標的とソースＲＮＡとがＡＧＯＨＩＴＳ−ＣＬＩＰに出現すること、（４）ソース及び標的ＲＮＡにおけるＲＮＡＨｉ−Ｃ特定相互作用部位が強力な塩基対形成を示すこと、によってフィルターされた。２列目は１〜３の基準を満たした相互作用部位数を表す。３列目は１〜４の基準を満たした相互作用部位数を表す。４列目は１〜４の基準を満たした相互作用数を表す。

多数のｓｎｏＲＮＡがｍｉＲＮＡ様短鎖ＲＮＡに酵素処理され、ｍＲＮＡと相互作用したと仮定された。この仮定は、ｍＲＮＡとｓｎｏＲＮＡとの両方がＡＧＯによって結合された、９１９のＲＮＡＨｉ−Ｃ特定ｓｎｏＲＮＡ−ｍＲＮＡ相互作用によって裏付けられた。さらにＡＧＯ結合ｓｎｏＲＮＡとその相互作用ｍＲＮＡとは、ＥＳ細胞の中内胚葉への誘導分化時に、反相関発現変化を示した（Ｐ．Ｙｕ等．、Ｓｐａｔｉｏｔｅｍｐｏｒａｌｃｌｕｓｔｅｒｉｎｇｏｆｔｈｅｅｐｉｇｅｎｏｍｅｒｅｖｅａｌｓｒｕｌｅｓｏｆｄｙｎａｍｉｃｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ２３，３５２（２０１３年２月））（図１７Ｂ）。加えて、ＡＧＯ結合ｓｎｏＲＮＡとその標的ｍＲＮＡとは、ＡＧＯ結合のないものよりも、強力な塩基対形成を示した（図１７Ｃ）。最後に、ｓｎｏＲＮＡから処理された小型ＲＮＡは、ｍＲＮＡのＵＴＲ領域と指示的に相互作用した。ＲＮＡ−ＲＮＡ相互作用に関する４９７のｓｎｏＲＮＡから、２４３がＵＴＲ領域と相互作用し、その中で２２３（９２％）が小型ＲＮＡ−ｓｅｑにおいて検出され、これは、酵素切断を受けたことを示唆する（図１７Ｄ）。比較すると、非ＵＴＲ領域と相互作用するその他の２５４のｓｎｏＲＮＡは、より少ない小型ＲＮＡ（５５％）を含有した。さらに、非ＵＴＲ相互作用ｓｎｏＲＮＡよりも、２倍のＵＲＴ相互作用ｓｎｏ−ｓｉＲＮＡがＡＧＯ結合であった（ｐ値＜２．２^−１６、カイ二乗検定）。例えば、Ｓｎｏｒａ１４ＲＮＡは、Ｍｃｌ１ｍＲＮＡの３’ＵＴＲを標的とした（図１９Ａ）。Ｓｎｏｒａ１４ＲＮＡの相互作用部位（１１０〜１３５ｎｔ）は、酵素処理された小型ＲＮＡ及びＡＧＯ結合領域と正確にオーバーラップした。Ｓｎｏｒａ１４ＲＮＡの酵素処理した部分はヘアピンループの完全に一方側に位置し（図１９Ｂ）、Ｍｃｌ１ＵＴＲの標的部位に対して強力な結合親和性（−６０ｋＣａｌ／ｍｏｌ）を示す。処理Ｓｎｏｒａ１４ＲＮＡの発現はＭｃｌ１ｍＲＮＡのものと反相関した（図１９Ｃ）。共に考慮すると、ＥＳ細胞において９００を超えるｍＲＮＡと相互作用する、多数のｓｎｏＲＮＡ遺伝子由来低分子干渉ＲＮＡについて、このデータは示唆する。

ＥＳ−１及びＥＳ−２ライブラリは、ＥＳ細胞におけるＲＮＡインタラクトームを推定するために統合された。このデータは、両断片が独自にゲノム（ｍｍ９）をマッピングする２つのＲＮＡ断片に明確に分離された４５４万の非重複ペアエンドリードを包含する。４６，７８０のＲＮＡ間相互作用が特定された（ＦＤＲ＜０．０５、フィッシャーの正確検定）（図２０）。ｍＲＮＡ−ｓｎｏＲＮＡ相互作用は最も豊富なタイプであったが、数千のｍＲＮＡ−ｍＲＮＡ、及び数百のｌｉｎｃＲＮＡ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、ｍｉＲＮＡ−ｍＲＮＡの相互作用も検出された（図２１）。これはおそらく、任意の生体について記載される最初のＲＮＡインタラクトームである。こうして、シミュレーションにより、実験及び分析手法全体について、約６６％の感受性と９３％の特異性が示唆された（テキストＳ２）。

［ＲＮＡのＨｉ−Ｃのシミュレーション分析］
＜１．１データ合成＞その実験及び計算方法を含むＲＮＡＨｉ−Ｃの感受性と特異性とを推定するために、シミュレーション解析を行った。データ生成プロセスを計算で再現することによる１００万ペアエンドリードをシミュレーションした。シミュレーションに用いられたパラメータは、実際のデータに由来した。シミュレーションされたデータ生成プロセスは、以下のとおりである。

各ペアエンドリードについて（２×１００塩基）、
１．同等の可能性のある４つのサンプルバーコードから１サンプルバーコードを選択し、６ｎｔ無作為バーコードと連結した（図１５Ａのように）。

２．このペアエンドリードを、［０．１、０．３、０．１、０．３、０．２］の可能性をそれぞれ有する[リンカーのみ、リンカーなし、ＲＮＡ１−リンカー、リンカー−ＲＮＡ２、ＲＮＡ１−リンカー−ＲＮＡ２]のリストからのｃＤＮＡの一タイプに割り当てた（図１５Ｃのように）。

３．このリードペアがリンカ−包含タイプに割り当てられる場合に、同等の可能性のある１又は２のリンカーを無作為に選択する。僅かな割合のリンカ−包含リードペアが２つのリンカーを含むということが言及され、同等の可能性の利用は、最悪の場合を推定するための確かな選択であった。

４．ステップ２で決定されたｃＤＮＡタイプに従って、ＲＮＡ１及びＲＮＡ２部のために配列を生成する。ＲＮＡ１とＲＮＡ２とについて、
ａ．ｌ〜Ｕｎｉｆ（１５，１５０）から長さをシミュレートする。

ｂ．以下の可能性に基づいて、［「ｍｉＲＮＡ」、「ｍＲＮＡ」、「ｌｉｎｃＲＮＡ」、「ｓｎｏＲＮＡ」、「ｓｎＲＮＡ」、「ｔＲＮＡ」］からＲＮＡタイプを選択する。

ｉ．長さｌ＜５０の場合、［０．２、０．２、０．１、０．２、０．２、０．１］を使用。

ｉｉ．そうでなければ、［０．０５、０．４、０．２、０．２、０．１、０．０５］を使用。

ｃ．Ｅｎｓｅｍｂｌ（リリース６７、マウスＮＣＢＩＭ３７）から、サンプルのＲＮＡタイプに従って、ＲＮＡを無作為に選択する。

ｄ．選択したＲＮＡから長さｌを有する配列セグメントを無作為に取得する。

５．バーコード、リンカー、及びステップ１、３、４から生成されたＲＮＡ断片を連結し、合成ｃＤＮＡ配列を作製する。

６．ステップ５における合成ｃＤＮＡが１００ｂｐ又はより長い場合、それぞれフォワード及びリバース鎖における合成ｃＤＮＡの２つの末端からの１００塩基を取る。

７．ステップ５における合成ｃＤＮＡが１００ｂｐより短い場合、そのフォワード及びリバース鎖をフォワード及びリバースリードとして割り当て、Ｐ５及びＰ７プライマー配列を２つのリードに連結する。

８．各塩基において０．０１の比率でシーケンシングエラーをシミュレートする（Ｎ．Ｊ．Ｌｏｍａｎ等、Ｐｅｒｆｏｒｍａｎｃｅｃｏｍｐａｒｉｓｏｎｏｆｂｅｎｃｈｔｏｐｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｓｅｑｕｅｎｃｉｎｇｐｌａｔｆｏｒｍｓ、Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ３０、４３４（２０１２年５月））。

ステップ１〜５では、実験方式に合致するｃＤＮＡ配列をシミュレートし、ステップ６〜８では、このｃＤＮＡ配列に基づいてペアエンドリードをシミュレートした。シミュレートされた相互作用ＲＮＡペアとｃＤＮＡタイプと各部分の長さ（該当する場合、ＲＮＡ１、リンカー、及びＲＮＡ２）が計算による予測と比較するために保存された。

＜１．２中間及び最終結果の評価＞２つの中間解析ステップについて感受性及び特異性、並びに最終予測を評価するために、合成データを用いた。

まず、予測されたｃＤＮＡの長さ（ＲＮＡ−ＨｉＣ−ツールのステップ３の出力）を実際の長さと比較した（表３）。このステップ「３、配列ライブラリにおいてｃＤＮＡを回収」では、各ｃＤＮＡをその長さについて４つのタイプに、つまりタイプ１（＜１００ｂｐ）；タイプ２（１００〜２００ｂｐ）；タイプ３（＞２００ｂｐ）；タイプ４（不明）に、割り当てる（図３２）。各タイプを予測するために、アルゴリズムにより高い感受性及び特異性を得た。２００ｂｐより短いｃＤＮＡのごく僅かなもののみが（０．５８％）、２００ｂｐより長いと予測された。このエラーは、フォワード及びリバースリードのオーバーラップが少しあったためであり（通常は０〜５ｂｐｓ）、これは局所アライメントにより検出されなかった。

表３は、予測及び実際のｃＤＮＡ長の範囲の比較を示す。各タイプ（列１〜４）の予測ｃＤＮＡのカウントを、それらの実際のタイプ（行）と比較する。

予測の長さが２００ｂｐより短いとき（タイプ１とタイプ２）、正確な長さを予測できた。これらの場合には、シミュレートされたｃＤＮＡの長さに、予測の長さが多くは正確に合致した（図３３Ａ）。

次に、各ｃＤＮＡの予測キメラ構成（ＲＮＡ−ＨｉＣ−ツールのステップ４の出力）を合成構成と比較した。「４．キメラｃＤＮＡの解析」のステップにおいて、リンカー配列の存在に基づいて、アルゴリズムによりｃＤＮＡを５つのカテゴリに割り当てた。アルゴリズムは、「ＲＮＡ１−リンカー−ＲＮＡ２」形態のｃＤＮＡに対して、９９．８９％感受性及び９５．８２％特異性に達した（表４）。

表４は、予測及び実際のｃＤＮＡ構成の比較を示す。予測構成のｃＤＮＡのカウント（列）をその実際の構成（行）と比較する。

最後に、予測ＲＮＡ−ＲＮＡ相互作用とシミュレートＲＮＡ−ＲＮＡ相互作用とを比較した。シミュレーションされたデータセットは２００，２００のキメラＲＮＡペア包含し、その中で１３１，５７１のＲＮＡペアが検出された（感受性＝６５．７２％、特異性＝９２．５７％、図３３Ｃ）。各タイプのＲＮＡの相互作用に対する感受性及び特異性も個別に計算した（図３３Ｃ）。関与するＲＮＡタイプに関わらず、この方法は偽陽性をほとんど示さなかった（特異性≧９０％）。トランスポゾンＲＮＡ又はｓｎＲＮＡに関与しなかった相互作用は、それに関与するものよりも少ない偽陰性を示した。これは、トランスポゾンとｓｎＲＮＡとの配列の反復的特性によるものであった。最悪のケースはＬＩＮＥＲＮＡに関与し、感受性が５２％に下落した。トランスポゾンＲＮＡに関与する相互作用の約半分がこの方法によって特定できなかったであろうということが控えめにも推測された。トランスポゾンＲＮＡに関与しない相互作用の約２／３〜３／４が、特定されたであろうと推測された。

ＲＮＡ毎の相互作用パートナーの数は非常に不均衡である。ＥＳ細胞のＲＮＡインタラクトームは、べき法則を満たす次数分布を有する（Ｐ（ｋ）〜ｋ^−γ、γ＝３）スケールフリーなネットワークであった（図２２Ａ）（Ｂａｒａｂａｓｉ，Ａ．Ｌ．＆Ｏｌｔｖａｉ，Ｚ．Ｎ．、Ｎｅｔｗｏｒｋｂｉｏｌｏｇｙ：ｕｎｄｅｒｓｔａｎｄｉｎｇｔｈｅｃｅｌｌ’ｓｆｕｎｃｔｉｏｎａｌｏｒｇａｎｉｚａｔｉｏｎ、Ｎａｔｕｒｅｒｅｖｉｅｗｓ、Ｇｅｎｅｔｉｃｓ５、１０１−１１３、ｄｏｉ：１０．１０３８／ｎｒｇ１２７２（２００４年））。スケールフリー特性が、強く接続された少数のｓｎｏＲＮＡ、ｓｎＲＮＡ、及びｔＲＮＡによってもたらされているかを理解するために、それらをネットワークから取り除いた。ｍＲＮＡ、ｌｉｎｃＲＮＡ、ｍｉＲＮＡ、偽遺伝子ＲＮＡ、及びアンチセンスＲＮＡのみからなる相互作用はスケールフリーであった（図２２Ｂ）。多くのｍＲＮＡ、偽遺伝子ＲＮＡ、及びｌｉｎｃＲＮＡがハブとして（多数の接続を有するノード、図１Ｄ）現れた。最大のｍＲＮＡハブは、これは２１のｍＲＮＡと２つのｌｉｎｃＲＮＡと相互作用するＳｕｖ４２０ｈ２であった。最大のｌｉｎｃＲＮＡハブは、ｍＲＮＡハブＳｌｃ２ａ３を含む４つのｍＲＮＡと相互作用するＭａｌａｔ１であった。

相互作用ＲＮＡの大部分は（８３．０５％）、オーバーラップするＲＮＡＨｉ−Ｃリードを示し（図２Ａ）、相互作用はＲＮＡの特定のセグメントにしばしば集中するということが示唆される。オーバーラップリード断片の「ピーク」を特定し、と「相互作用部位」と呼称した（図２Ｂ）。相互作用部位は、ｍｉＲＮＡ（成熟ｍｉＲＮＡ全体）、ｍＲＮＡ、ｌｉｎｃＲＮＡだけでなく、偽遺伝子及びトランスポゾンＲＮＡにも現れた（図２Ｃ）。２０００を超える相互作用部位が、Ｌ１、ＳＩＮＥ、ＥＲＶＫ、ＭａＬＲ、及びＥＲＶ１トランスポゾンＲＮＡにあり（図２３）、その他のＲＮＡとの頻繁な相互作用が示唆される（Ｓｈａｌｇｉ，Ｒ．、Ｐｉｌｐｅｌ，Ｙ．＆Ｏｒｅｎ，Ｍ．、Ｒｅｐｒｅｓｓｉｏｎｏｆｔｒａｎｓｐｏｓａｂｌｅ−ｅｌｅｍｅｎｔｓ−ａｍｉｃｒｏＲＮＡａｎｔｉ−ｃａｎｃｅｒｄｅｆｅｎｓｅｍｅｃｈａｎｉｓｍ？Ｔｒｅｎｄｓｉｎｇｅｎｅｔｉｃｓ：ＴＩＧ２６、２５３−２５９、ｄｏｉ：１０．１０１６／ｊ．ｔｉｇ．２０１０．０３．００６（２０１０年）；Ｙｕａｎ，Ｚ．、Ｓｕｎ，Ｘ．、Ｌｉｕ，Ｈ．＆Ｘｉｅ，Ｊ．、ＭｉｃｒｏＲＮＡｇｅｎｅｓｄｅｒｉｖｅｄｆｒｏｍｒｅｐｅｔｉｔｉｖｅｅｌｅｍｅｎｔｓａｎｄｅｘｐａｎｄｅｄｂｙｓｅｇｍｅｎｔａｌｄｕｐｌｉｃａｔｉｏｎｅｖｅｎｔｓｉｎｍａｍｍａｌｉａｎｇｅｎｏｍｅｓ、ＰｌｏＳｏｎｅ６、ｅ１７６６６、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００１７６６６（２０１１年））。

異なるタイプのＲＮＡ−ＲＮＡ相互作用によって塩基の相補性が用いられるかが推論された。相互作用ＲＮＡペアのハイブリダイゼーションエネルギーは、ライケーションされた断片（ＲＮＡ１、ＲＮＡ２）のペアの平均ハイブリダイゼーションエネルギーによって推定され（Ｂｅｌｌａｏｕｓｏｖ，Ｓ．、Ｒｅｕｔｅｒ，Ｊ．Ｓ．、Ｓｅｅｔｉｎ，Ｍ．Ｇ．＆Ｍａｔｈｅｗｓ，Ｄ．Ｈ．、ＲＮＡｓｔｒｕｃｔｕｒｅ：ｗｅｂｓｅｒｖｅｒｓｆｏｒＲＮＡｓｅｃｏｎｄａｒｙｓｔｒｕｃｔｕｒｅｐｒｅｄｉｃｔｉｏｎａｎｄａｎａｌｙｓｉｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ４１、Ｗ４７１−Ｗ４７４、ｄｏｉ：Ｄｏｉ１０．１０９３／Ｎａｒ／Ｇｋｔ２９０（２０１３年））、塩基の無作為シャッフルによって生成された対照ＲＮＡのハイブリダイゼーションエネルギーと比較された。相補性塩基は、ほぼすべてのタイプのＲＮＡ−ＲＮＡ相互作用において好ましいものであり、トランスポゾンＲＮＡ−ｍＲＮＡ、ｍＲＮＡ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、ｌｉｎｃＲＮＡ−ｍＲＮＡ、ｍｉＲＮＡ−ｍＲＮＡ相互作用において最も見受けられる（ｐ値＜２．４^−１８）が、ＬＴＲ−偽遺伝子ＲＮＡ相互作用では観察されなかった（図２Ｄ、図２４）。このデータは、塩基対形成が、長鎖ＲＮＡにおける配列特異的転写後調節を促すという新しいメカニズムを示唆するものである。

これらのＲＮＡ−ＲＮＡ相互作用が配列特異的である場合、ＲＮＡ相互作用部位は選択圧力下にあるはずである。種間保存レベル（Ｃｏｏｐｅｒ，Ｇ．Ｍ．等、Ｄｉｓｔｒｉｂｕｔｉｏｎａｎｄｉｎｔｅｎｓｉｔｙｏｆｃｏｎｓｔｒａｉｎｔｉｎｍａｍｍａｌｉａｎｇｅｎｏｍｉｃｓｅｑｕｅｎｃｅ．Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ１５、９０１−９１３、ｄｏｉ：１０．１１０１／ｇｒ．３５７７４０５（２００５年））は相互作用部位において大きく増加し、保存のピークは、２つのＲＮＡ断片の接合部を正確に指し示すということが分かった（図２Ｄ）。ｌｉｎｃＲＮＡ、偽遺伝子ＲＮＡ、トランスポゾンＲＮＡ、又は他のｍＲＮＡと相互作用するとき、ｍＲＮＡの相互作用部位は、転写物の残余部分よりも保存された（図２５）。ｌｉｎｃＲＮＡ及び偽遺伝子ＲＮＡの相互作用部位では、ｌｉｎｃＲＮＡｓ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、及び偽遺伝子ＲＮＡ−トランスポゾンＲＮＡ相互作用において、大きく保存された（図２５）。相互作用部位における保存の増大は、エクソン−イントロン境界によるものではなかった（図２６）。考え合わせると、長鎖ＲＮＡの相互作用において、塩基の相補性が広まり、進化的に選択される。これについて、新規のタイプの、ゲノムにおいてコードされる調節情報が示唆される。

ＲＮＡのＨｉ−Ｃは、本質的に、分子間相互作用をマッピングするために設計されているが、ＲＮＡのＨｉ−ＣがＲＮＡの２次構造及び３次構造を明らかにすることが分かった。上述のすべての分析は、分子間リードに基づく。分子内リードを見ることで、ＲＮＡ構造についていくつかのことが分かる。まず、ＲＮａｓｅＩ消化部位の密度によって、ＲＮＡの１本鎖領域のフットプリントが特定された（ＲＮａｓｅＩ消化はライゲーション前に行われた。図１Ａのステップ２、図２７参照）。次に、各ＲＮＡの空間的近位部位を近接ライゲーションによって捕捉した（図１Ａのステップ５）。全部で６７，２２１のリードペアが個別の遺伝子にマッピングされたが、互いに２，０００ｂｐ内又は同じ鎖上ではなく、ゆえに分子内切断及びライゲーションから生成されたものである（図２８Ａ）。切断及びライゲーション配列のそれぞれは、配列リードにおけるＲＮＡ１及びＲＮＡ２の配向とゲノムにおけるその配向とを比較することで、２つの構造分類の１つに明らかに割り当て可能である（図３Ａ）。例として、２７７の切断及びライゲーション配列が、Ｓｎｏｒａ７３転写物から作製された（図３Ｂ）。ＲＮａｓｅＩ消化部位の密度（図３Ｃ）により、ＲＮＡの１本鎖領域が強く予測された（ヒートマップ、図３Ｅ）。６つのペアの近位部位が検出された（図３Ｄの丸）。各ペアは、オーバーラップライゲーション位置を有する３つ以上の切断及びライゲーション配列によってサポートされた（図３Ｂの黒い箇所）。６つの近位部位ペアのうち５つは、通常許容される２次構造において物理的に近接した（図３Ｅの矢印）。Ｓｎｏｒａ１４では、シーケンシングされた推定２次構造によると、推定近位部位のペアは離れているようであった（図２９）。しかしながら、リボ核タンパク質ＤＹＳＫＥＲＩＮは、インビボにおいてＳｎｏｒａ１４転写物を曲げ（Ｋｉｓｓ，Ｔ．、Ｆａｙｅｔ−Ｌｅｂａｒｏｎ，Ｅ．＆Ｊａｄｙ，Ｂ．Ｅ．、ＢｏｘＨ／ＡＣＡｓｍａｌｌｒｉｂｏｎｕｃｌｅｏｐｒｏｔｅｉｎｓ、Ｍｏｌｅｃｕｌａｒｃｅｌｌ３７、５９７−６０６、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１０．０１．０３２（２０１０年））、切断及びライゲーション配列によって予測されたように、２つのシュードウリジル化（ｐｓｅｕｄｏｕｒｉｄｙｌａｔｉｏｎ）ループを互いに近づける（図３Ｆ）。構造情報も、ｍＲＮＡの新しい転写物及び一部分において得られ得る（図３０〜図３１）。現在のところ、任意の個々のＲＮＡの空間的近位塩基の決定は大きな課題としてある。ＲＮＡのＨｉ−Ｃは、数千のＲＮＡについて分子内空間的近位情報を提供する。さらに、あらゆるＲＮＡの１本鎖フットプリントが共にマッピングされる。このように、ＲＮＡのＨｉ−Ｃにより、ＲＮＡ構造調査範囲が大きく広がった。

ＲＮＡ相互作用のマッピングに極めて重要であるのは選択である。ＲＮＡのＨｉ−Ｃにおいて選択可能なリンカーを導入することで、相互作用ＲＮＡの偏りのない選択が可能になり、ＲＮＡインタラクトームの全体的なマッピングを可能にする。ＥＳ細胞におけるＲＮＡ毎の相互作用パートナーの数は非常に不均衡であり、スケールフリーなＲＮＡネットワークをもたらす。長鎖ＲＮＡ間の相互作用では、転写物の小片がしばしば用いられた。タンパク質相互作用ドメインとの類似について、ＲＮＡ相互作用部位の概念が示された。ＲＮＡ相互作用部位では、長鎖ＲＮＡ相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。ＲＮＡ構造はＲＮＡのＨｉ−Ｃによってもマッピングされ得る。本明細書に示されるのは、ＲＮＡがタンパク質によって曲げられ、そうした３次構造がＲＮＡＨｉ−Ｃの分子内リードによって明らかにされた例示的実施形態である。こうして、この方法とデータにより、ＲＮＡの機能と調節との役割調査が今後は非常に容易になるはずである。

［ソフトウエアの利用］
ＲＮＡのＨｉ−Ｃツールソフトウエアは、http://systemsbio.ucsd.edu/RNA-Hi-Cにおいて利用可能であり、この開示について、その全体が言及によって本願明細書に組み込まれる。

［材料と方法］
＜細胞培養＞
未分化のマウスＥ１４ＥＳ細胞をフィーダーなしの条件下で培養した。ＥＳ細胞をゼラチン被膜ディッシュに播種し、１５％ウシ胎仔血清（ＦＢＳ；ＧｅｍｉｎｉＧｅｍｃｅｌｌ）、０．０５５ｍＭの２−メルカプトエタノール（Ｓｉｇｍａ）、２ｍＭのグルタマックス（ＧＩＢＣＯ）、０．１ｍＭのＭＥＭ非必須アミノ酸（ＧＩＢＣＯ）、５，０００Ｕ／ｍｌのペニシリン／ストレプトマイシン（ＧＩＢＣＯ）、及び１，０００Ｕ／ｍｌのＬＩＦ（Ｍｉｌｌｉｐｏｒｅ）で補完したダルベッコ改変イーグル培地（ＤＭＥＭ；ＧＩＢＣＯ）において培養した。インキュベータにおいて、細胞を３７℃、５％ＣＯ_２で保持した。

１５％ウシ胎仔血清（ＦＢＳ；ＧｅｍｉｎｉＧｅｍｃｅｌｌ）、０．０５５ｍＭの２−メルカプトエタノール（Ｓｉｇｍａ）、２ｍＭのグルタマックス（ＧＩＢＣＯ）、０．１ｍＭのＭＥＭ非必須アミノ酸（ＧＩＢＣＯ）、５，０００Ｕ／ｍｌのペニシリン／ストレプトマイシン（ＧＩＢＣＯ）で補完したＤＭＥＭ（ＧＩＢＣＯ）において、マウスの胚性線維芽細胞（ＭＥＦ）を、１５ｃｍディッシュで培養した。ＭＥＦも、インキュベータにおいて３７℃、５％ＣＯ_２で保持した。

ショウジョウバエＳ２細胞（Ｉｎｖｉｔｒｏｇｅｎ）を、１０％の熱失活ウシ胎仔血清（ＦＢＳ；ＧｅｍｉｎｉＧｅｍｃｅｌｌ）及び５ｍｌの１：１００のペニシリン／ストレプトマイシン（ＧＩＢＣＯ）で補完したシュナイダーショウジョウバエ培地（ＧＩＢＣＯ）において、１５ｃｍプレートで、インキュベータにおいて２８℃、ＣＯ_２なしで、保持した。

＜組織切開及び調製＞
マウスの扱いは、カリフォルニアサンディエゴ大学動物実験委員会に認められたものであった。雌生体（Ｃ５７ＢＬ／６Ｊ由来）は頚椎脱臼により犠牲となった。全脳を直ちに回収して、氷温のＰＢＳで３回リンスし、急速凍結した。マウスの凍結全脳を、乳鉢と乳棒とを用いて、液体窒素内で微細粉末にした。組織粉末をドライアイス床上のペトリディッシュに迅速に移し、ＵＶクロスリンカー（２５４ｎｍ）において４００ｍＪ／ｃｍ^２で、ドライアイス上で３回照射し、各照射の間にやさしくかき混ぜた。架橋された粉末状組織を直ちに溶解し、記載されたようなＲＮＡＨｉ−Ｃ法をおこなった。

＜ＲＮＡのＨｉ−Ｃ法の概要＞
ＲＮＡのＨｉ−Ｃは、（ｉ）外来的分子を遺伝子的又は一過的に導入することなく、偏りのない方法で、インビボにおける相互作用ＲＮＡを捕捉する、（ｉｉ）細胞溶解後に形成される非生理的な会合を厳密に除去可能にする（Ｓ．Ｍｉｌｉ、Ｊ．Ａ．Ｓｔｅｉｔｚ、ＲＮＡ１０、１６９２（２００４年））、（ｉｉｉ）近接ライゲーションされたキメラＲＮＡを選択する、（ｉｖ）相互作用ＲＮＡの明確なバイオインフォマティク的特定を可能にする、ように設計された。これらの目的は、（ｉ）ストレプトアビジンビーズにおいて、すべてのＲＮＡ−タンパク質複合体（タンパク質及び核酸、核酸を伴う中間タンパク質、又は核酸結合タンパク質複合体を含む複合体であって、該核酸はＲＮＡである）を架橋及び固定化し、変性条件によって非特異的結合を除去する、（ｉｉ）キメラＲＮＡ構築物の選択的濃縮を促すためにビオチンタグ付きＲＮＡリンカーを付ける、（ｉｉｉ）シーケンシングリードペアから相互作用ＲＮＡを明確に分離するために、リンカー配列を用いる、ことで達成され得る。

＜ステップ１：ＲＮＡをタンパク質に架橋＞
光反応性ヌクレオチド塩基とアミノ酸とに共有結合を形成するために、ＵＶ照射を用いた。ＵＶ照射により、ＲＮＡ内のヌクレオチド塩基の一時的な高反応性状態がもたらされ、配座摂動を引き起こし得る追加的要素なく、その接触点でアミノ酸とのみの共有結合形成を誘導する（Ｉ．Ｇ．Ｐａｓｈｅｖ、Ｓ．Ｉ．Ｄｉｍｉｔｒｏｖ、Ｄ．Ａｎｇｅｌｏｖ、ＴｒｅｎｄｓｉｎＢｉｏｃｈｅｍｉｃａｌＳｃｉｅｎｃｅｓ１６、３２３（１９９１年））。２５４ｎｍでのＵＶ照射は、アミノ酸が異なる波長を吸収するためタンパク質−タンパク質架橋を促進しない。具体的には、細胞を氷温のＰＢＳ内で２回洗浄し、氷上の氷温のＰＢＳ内において４００ｍＪ／ｃｍ^２のＵＶ−Ｃ（２５４ｎｍ）で照射した。細胞をスクレーピングにより採取し、４℃において５分間、１，０００×ｇで遠心分離することによりペレット化した。細胞のペレットを液体窒素内で急速凍結し、−８０℃で保管した。

タンパク質−タンパク質複合体も架橋されるＲＮＡＨｉ−Ｃライブラリ（ＥＳ−インダイレクト）を生成した。これは、タンパク質相互作用によって結合したＲＮＡを捕捉するためであった。インビボでの２重架橋方法を、以前に検証されたパラメータで適用した（Ｉｌｌｕｍｉｎａ、「ＴｒｕＳｅｑ（Ｒ）ＳａｍｌｌＲＮＡＳａｍｐｌｅＰｒｅｐａｒａｔｉｏｎＧｕｉｄｅ」（２０１４年）；Ｐ．Ｙｕ等、Ｓｐａｔｉｏｔｅｍｐｏｒａｌｃｌｕｓｔｅｒｉｎｇｏｆｔｈｅｅｐｉｇｅｎｏｍｅｒｅｖｅａｌｓｒｕｌｅｓｏｆｄｙｎａｍｉｃｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ２３、３５２（２０１３年、２月）；Ｎ．Ｊ．Ｌｏｍａｎ等、Ｐｅｒｆｏｒｍａｎｃｅｃｏｍｐａｒｉｓｏｎｏｆｂｅｎｃｈｔｏｐｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｓｅｑｕｅｎｃｉｎｇｐｌａｔｆｏｒｍｓ、Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ３０、４３４（２０１２年５月））。短時間で、細胞を室温のＰＢＳでまずリンスして、シェーカーにおいて室温で４０分間、ＰＢＳ内で新しく調製した１．５ｍＭのエチルグリコールビス（スクシンイミジルスクシネート）（ＥＧＳ、ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ、イリノイ州、ロックフォード）で処理した。細胞を、１％の最終濃度になるようにホルムアルデヒド（ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ、イリノイ州、ロックフォード）でさらに処理し、２０分間室温で搖動させてインキュベートした。グリシンを２５０ｍＭの最終濃度になるように添加し、１０分間室温でインキュベートして、架橋反応をクエンチした。そして、細胞をＰＢＳで１回洗浄し、スクレーピングし、４℃において５分間、１，０００×ｇでペレット化して、液体窒素内で急速凍結し、−８０℃で保管した。

タンパク質−タンパク質複合体も架橋される対照実験（ＥＳ−インダイレクト）を行った。これは、タンパク質相互作用によって結合したＲＮＡを制御するものである。こうして、インビボでの２重架橋方法を、以前に検証されたパラメータで適用した（Ｓ．Ｋ．Ｋｕｒｄｉｓｔａｎｉ、Ｍ．Ｇｒｕｎｓｔｅｉｎ、Ｍｅｔｈｏｄｓ３１、９０（２００３年）；Ｄ．Ｅ．Ｎｏｗａｋ、Ｂ．Ｔｉａｎ、Ａ．Ｒ．Ｂｒａｓｉｅｒ、ＢｉｏＴｅｃｈｎｉｑｕｅｓ３９、７１５（２００５年）；Ｊ．Ｚｈａｎｇ等、Ｍｅｔｈｏｄｓ５８、２８９（２０１２年））。短時間で、細胞を室温のＰＢＳでまずリンスして、シェーカーにおいて室温で４０分間、ＰＢＳ内で新しく調製した１．５ｍＭのエチルグリコールビス（スクシンイミジルスクシネート）（ＥＧＳ、ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ、イリノイ州、ロックフォード）で処理した。細胞を、１％の最終濃度になるようにホルムアルデヒド（ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ、イリノイ州、ロックフォード）でさらに処理し、２０分間室温で搖動してインキュベートした。グリシンを２５０ｍＭの最終濃度になるように添加し、１０分間室温でインキュベートして、架橋反応をクエンチした。そして、細胞をＰＢＳで１回洗浄し、スクレーピングし、４℃において５分間、１，０００×ｇでペレット化して、液体窒素内で急速凍結し、−８０℃で保管した。

＜ステップ２：細胞溶解、ＲＮＡ断片化、及びタンパク質のビオチン化＞
−８０℃で保管された、約６×１０^８の架橋細胞を氷上で解凍し、約３倍量の溶解バッファー（５０ｍＭのＴｒｉｓ−ＨＣｌ、ｐＨ７．５、１００ｍＭのＮａＣｌ、０．１％のＳＤＳ、１％のＩＧＥＰＡＬＣＡ−６３０、０．５％のデオキシコール酸ナトリウム、１：２０量のＥＤＴＡ非含有完全プロテアーゼ阻害剤カクテルで補完した１ｍＭのＥＤＴＡ（Ｒｏｃｈｅ））に再懸濁した。氷上で２０分間溶解を行った。細胞片と不溶解性クロマチンとを、４℃で１０分間、２０，０００×ｇの遠心分離で除去した。上清を採取し、溶解物ｍｌ毎に１０μｌのＴＵＲＢＯＤＮａｓｅの濃度のＴＵＲＢＯＤＮａｓｅ（Ｉｎｖｉｔｒｏｇｅｎ）で、２０分間３７℃で処理した。溶解物ｍｌ毎に１０μｌの１：１００希釈のＲＮａｓｅＩ（ＮＥＢ）を添加し、３７℃で３分間インキュベートすることで、ＲＮＡを約１０００〜２０００ｎｔ（ＥＳ−１）又は約１０００ｎｔ（ＥＳ−２）断片に消化した。ＲＮａｓｅＩ処理の後、溶解物を直ちに氷へと、少なくとも５分間移した。ＲＮａｓｅＩ及び音波処理による断片化により、ＲＮＡライゲーションには不適合な５’−ＯＨ及び３’−Ｐ末端が残り、これは望ましくないＲＮＡライゲーションを抑制する。ＤＮａｓｅ消化を停止するために、２５ｍＭ最終濃度になるようにＥＤＴＡ（Ａｍｂｉｏｎ）を添加し、混合物を４℃で１５分間回転させてインキュベートした。氷上で２０分間の溶解後、５％デューティサイクルで２０分、１４０ワットのピーク入射パワー、及び４℃でバースト毎に２００サイクルという設定で、懸濁液を音波処理（ＣｏｖａｒｉｓＥ２２０）により直接的に断片化することで、断片化された２重架橋（ＥＳ−インダイレクト）溶解物を調製した。

異種間の実験について、約３×１０^８のＥ１４ｍＥＳ細胞と３×１０^８のショウジョウバエＳ２細胞を個別に溶解して、タンパク質のビオチン化前に混合した。

緩やかに結合したタンパク質を解離するために、５００ｍＭのＮａＣｌ最終濃度を添加し、該溶液を４℃で１０分間回転させてインキュベートした。タンパク質複合体と非架橋ＲＮＡとをさらに解離し、ＲＮａｓｅＩ活性を停止するために、ＳＤＳを０．３％最終濃度になるように添加し、６５℃において１５分間、７５０ｒ．ｐ．ｍで揺らして、該混合物をインキュベートした。溶液混合物を室温に冷却後、溶解物に、１：５量の２５ｍＭ（１３．５６ｍｇ／ｍｌ）ＥＺｌｉｎｋヨードアセチル−ＰＥＧ２−ビオチン（ＩＰＢ）（ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ）を添加し、該混合物を暗所にて９０分間室温で回転させることで、システイン残基をビオチン化した。５ｍＭ濃度にＤＴＴを添加して、室温で１５分間インキュベートすることで、ビオチン化反応をクエンチした。ＳＤＳを中和するために、ＴｒｉｔｏｎＸ−１００（Ｓｉｇｍａ）を２％最終濃度になるように添加し、３７℃で１５分間インキュベートした。溶解物サンプルを、室温において２リットルの透析バッファー（２０ｍＭのＴｒｉｓ−ＨＣｌ、ｐＨ７．５、１ｍＭのＥＤＴＡ）で、２０ｋＤカットオフのＳｌｉｄｅ−Ａ−Ｌｙｚｅｒ透析カセット（ＰｉｅｒｃｅＰｒｏｔｅｉｎＲｅｓｅａｒｃｈＰｒｏｄｕｃｔｓ、イリノイ州、ロックフォード）において透析して、過剰なビオチンを除去した。透析バッファーを、２時間毎に１回、少なくとも３回交換した。透析後に、溶解物を１５ｍｌチューブに移した。

＜ステップ３：ビーズへの固定化＞
タンパク質−ＲＮＡ複合体は、ストレプトアビジン被膜ビーズ（２００ｃｍ^２の表面積と等しい、８００μｌのＭｙＯｎｅストレプトアビジンＴ１ビーズ）において、低いビーズ面密度で固定化される。固体表面に固定化することの有利性には、（ｉ）非架橋オリゴヌクレオチド間の無作為な分子間ライゲーションを低減（Ｒ．Ｋａｌｈｏｒ、Ｈ．Ｔｊｏｎｇ、Ｎ．Ｊａｙａｔｈｉｌａｋａ、Ｆ．Ａｌｂｅｒ、Ｌ．Ｃｈｅｎ、ＮａｔＢｉｏｔｅｃｈ３０、９０（２０１２年））、（ｉｉ）効率的なバッファー交換が可能、（ｉｉｉ）よく洗浄することで非生理的相互作用を除去、ということを含む。

８００μｌのＭｙＯｎｅＴ１ビーズをＰＢＳＴ（０．１％Ｔｗｅｅｎ−２０を含むＰＢＳ）で３回洗浄し、８００μｌの同じバッファーに再懸濁して、ビオチン化溶解物へと移した。ビーズ−溶解物懸濁液を室温で４５分間回転させた。このインキュベーション時に、中和した２００μｌの２５ｍＭＩＰＢを調製した。これは、同じモル濃度のＤＴＴを添加し、室温で少なくとも３０分間インキュベートすることで行われた。磁性スタンドを用いてビーズを固定化し、大半の上清を吸引して、４ｍｌの上清が残った。ビーズを残余の溶液に再懸濁し、そして２００μｌの中和ＩＰＢを添加した。ビオチンタグ付きＲＮＡリンカーに関与するその後のステップを妨げ得る固定化後の過剰未結合ストレプトアビジンを飽和させるために、ＩＰＢを用いた。タンパク質に非共有的に結合又は非特異的タンパク質−タンパク質相互作用により非共有的に結合した望ましくないＲＮＡを除去する（Ｓ．Ｃ．Ｋｗｏｎ等、ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ２０，１１２２（２０１３年）；Ａ．Ｃａｓｔｅｌｌｏ等、Ｎａｔ．Ｐｒｏｔｏｃｏｌｓ８、４９１（２０１３年））ために、ビーズを氷温の変性洗浄バッファーＩ（５０ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、０．５％リチウムドデシルサルフェート、５００ｍＭ塩化リチウム、７ｍＭのＥＤＴＡ、３ｍＭのＥＧＴＡ、５ｍＭのＤＴＴ）で３回洗浄し、洗浄毎に４℃で５分間回転された。そして、氷温の高塩濃度洗浄バッファーＩＩ（５０ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１ＭのＮａＣｌ、０．１％ＳＤＳ、１％ＩＧＥＰＡＬＣＡ−６３０、１％デオキシコール酸ナトリウム、５ｍＭのＥＤＴＡ、２．５ｍＭのＥＧＴＡ、５ｍＭのＤＴＴ）、洗浄バッファーＩＩＩ（１×ＰＢＳ、１％ＴｒｉｔｏｎＸ−１００、１ｍＭのＥＤＴＡ、１ｍＭのＤＴＴ）、及びＰＮＫ洗浄バッファー（２０ｍＭのＴｒｉｓ−ＨＣｌｐＨ７．５、１０ｍＭのＭｇＣｌ_２、０．２％Ｔｗｅｅｎ−２０、１ｍＭのＤＴＴ）で、ビーズを洗浄した（各バッファーにつき２回、２回目の洗浄時に４℃で５分間回転させる）。

＜ステップ４：ビオチンタグ付きＲＮＡリンカーのライゲーション＞
次に、ビオチンタグ付きＲＮＡリンカー(5'-rCrUrArG/iBiodT/rArGrCrCrCrArUrGrCrArArUrGrCrGrArGrGrA)(配列番号1)をＲＮＡの５’末端に付けた。ビオチンタグ付きリンカーは、ライゲーションされたＲＮＡを濃縮するための選択マーカーとしての役割を担い、また、ライゲーション接合部を含んだ任意の配列リードを明確に分ける明らかな境界線を引くものである。ＲＮＡリンカーの５’末端は、リンカー環状化又は連結をしないように、ライゲーションから一時的に「遮断」された。これは、ライゲーションには不適合だがリン酸化により「再活性化」され得る５’−ＯＨ基とリンカーを合成することで行った。しかし、ＲＮａｓｅＩはリンカーライゲーションに不適合な５’−ＯＨ末端を残すので、５’末端は、Ｔ４ポリヌクレオチドキナーゼ（ＰＮＫ）、３’ホスファターゼマイナス（ＮＥＢ）でまずリン酸化された。ＲＮＡの３’末端を３’−Ｐから３’−ＯＨに変化させて、自己ライゲーションを受けやすくする、そのさらなる３’ホスファターゼ活性のため、野生型Ｔ４ＰＮＫは用いられなかった。

洗浄バッファーを取り除き、次に１００μｌのＰＮＫ反応混合物（７３μｌのＲＮａｓｅ非含有水、１０μｌの１０×ＰＮＫバッファー、１０μｌの１０ｍＭＡＴＰ、５μｌの１０Ｕ／μｌＴ４ＰＮＫ（３’ホスファターゼマイナス）（ＮＥＢ）、２μｌのＲＮＡｓｉｎＰｌｕｓ（Ｐｒｏｍｅｇａ））にビーズを再懸濁し、２分毎に５秒間、１，２００ｒ．ｐ．ｍで断続的に揺らして３７℃で１時間インキュベートすることで、これを行った。洗浄バッファーＩ、ＩＩ、ＩＩＩ、及びＰＮＫでビーズを洗浄し、各バッファーにつき２回で、２回目の洗浄時に４℃で５分間回転させる。ＲＮＡリンカーをリン酸化し得、ＲＮＡの３’−末端にライゲーションさせる可能性のある、任意の残余ＰＮＫを除去するために、氷温洗浄を用いた。洗浄バッファーを取り除いた後、２μｌのＲＮＡｓｉｎＰｌｕｓ（Ｐｒｏｍｅｇａ）、１６μｌの１０ｍＭＡＴＰ、１６μｌの１０×ＲＮＡリガーゼバッファー、１６μｌの１ｍｇ／ｍｌＢＳＡ、３０μｌの２０μＭビオチン標識リンカー、６４μｌの５０％ＰＥＧ８０００（ＮＥＢ）、１６μｌの１０Ｕ／μｌのＴ４ＲＮＡリガーゼ１（ＮＥＢ）を含む、１６０μｌのＲＮＡライゲーション反応混合物を添加することで、ビオチンタグ付きＲＮＡリンカーをＲＮＡの５’−末端にライゲーションした。ライゲーションを３７℃で１時間行い、２分毎に１５秒間、１，２００ｒ．ｐ．ｍで断続的に揺らして１６℃で一晩行った。Ｔ４ＲＮＡリガーゼの活性を促進して、ビーズの凝集を防止するために、ＢＳＡを添加した。ドナーとアクセプターの末端濃度を増大させることで分子間ライゲーションを促進するために、ＰＥＧを用いた（Ｄ．Ｂ．Ｍｕｎａｆｏ、Ｇ．Ｂ．Ｒｏｂｂ、ＲＮＡ１６、２５３７（２０１０年））。

＜ステップ５：近接ライゲーション＞
次に、ビーズを氷温の洗浄バッファーＩＩで２回、氷温の洗浄バッファーＩＩＩで１回、及びＰＮＫ洗浄バッファーで洗浄した。近接ライゲーションを調製するために、Ｔ４ＰＮＫの３’ホスファターゼ活性を用いてＲＮＡ３’−末端をまず脱リン酸化し、３’ヒドロキシル基が残った（Ｉ．Ｈｕｐｐｅｒｔｚ等、Ｍｅｔｈｏｄｓ６５、２７４（２０１４年））。洗浄バッファーを処分した後、７３μｌのＲＮａｓｅ非含有水、２０μｌの５×ＰＮＫバッファーｐＨ６．５（３５０ｍＭＴｒｉｓ−ＨＣｌｐＨ６．５、５０ｍＭＭｇＣｌ_２、１０ｍＭＤＴＴ）、５μｌの１０Ｕ／μｌＴ４ＰＮＫ（３’ホスファターゼマイナス）（ＮＥＢ）、２μｌのＲＮＡｓｉｎＰｌｕｓ（Ｐｒｏｍｅｇａ）と、ビーズを混合し、２分毎に５秒間、１，２００ｒ．ｐ．ｍで断続的に揺らして３７℃で２０分間インキュベートした。ビーズをＰＮＫ洗浄バッファーで１回
洗浄した。１００μｌのＰＮＫ反応混合物（７３μｌのＲＮａｓｅ非含有水、１０μｌの１０×ＰＮＫバッファー、１０μｌの１０ｍＭＡＴＰ、５μｌの１０Ｕ／μｌＴ４ＰＮＫ（３’ホスファターゼマイナス）（ＮＥＢ）、２μｌのＲＮＡｓｉｎＰｌｕｓ（Ｐｒｏｍｅｇａ））において、断続的に揺らして３７℃で１時間、ビオチン標識リンカーの５’−末端をリン酸化した。リン酸化後、ビーズをＰＮＫ洗浄バッファー内で２回洗浄した。そして、複合体間ライゲーションを最小化するために、１５ｍｌの全量の反応物（８．９ｍｌのＲＮａｓｅ非含有水、１．５ｍｌの１０ｍＭＡＴＰ、１．５ｍｌの１０×ＲＮＡリガーゼバッファー、７５μｌの２０ｍｇ／ｍｌＢＳＡ（ＮＥＢ）、２５μｌの１ＭＤＴＴ、２．２５ｍｌの１００％ＤＭＳＯ、０．７５ｍｌの１０Ｕ／μｌＴ４ＲＮＡリガーゼ１（ＮＥＢ））において、高希薄条件下で近接ライゲーションを行った。近接ライゲーションは３７℃で１時間行われ、連続的に回転させて１６℃で一晩行われた。高度に構造化したＲＮＡのライゲーションを促進するために、ジメチルスルホキシド（ＤＭＳＯ）を１５％（ｖ／ｖ）最終濃度になるように添加した。

＜ステップ６：所望のＲＮＡ−ＲＮＡ相互作用の選択及び抽出と逆転写＞
翌日、ＥＤＴＡを２５ｍＭの最終濃度になるように添加して、ビーズをチューブ壁において収集するときに分子間ライゲーションが発生することを防ぐために４℃で１５分間回転させることで、ライゲーションを停止した。ビーズをＰＢＳＴ内で１回洗浄した。次に、タンパク質−ＲＮＡ複合体を、１００μｌの溶出バッファー（１００ｍＭＴｒｉｓ−ＨＣｌｐＨ７．５、５０ｍＭＮａＣｌ、１０ｍＭＥＤＴＡ、１％ＳＤＳ、１０ｍＭＤＴＴ、２．５ｍＭＤ−ビオチン（Ｉｎｖｉｔｒｏｇｅｎ））において、５分間９５℃に加熱することで、ストレプトアビジンビーズから２回溶出した。得られた溶液を合わせ、５０μｌの８００Ｕ／ｍｌプロテイナーゼ（ＮＥＢ）と混合し、５５℃で２時間インキュベートした。そして、混合物に４００μｌの最終量までＲＮａｓｅ非含有水を足した。ＲＮＡを、４００μｌのフェノール：クロロホルム：イソアミルアルコール（１２５：２４：１、ｐＨ４．５）（Ａｍｂｉｏｎ）内で抽出し、１０００ｒ．ｐ．ｍ．で揺らして３７℃で２０分間インキュベートした。混合物を２ｍｌのＭａＸｔｒａｃｔ高密度フェーズロックゲルチューブ（Ｑｉａｇｅｎ）に移し、室温で５分間、１６，０００×ｇで遠心分離した。４００μｌのクロロホルムを同じＭａＸｔｒａｃｔチューブに添加して、室温で５分間、１６，０００×ｇで遠心分離することで、残余のフェノールを除去した。遠心分離後、水相を新しいチューブに写した。１ｍｌの１：１のエタノール：イソプロパノールと共に、１：９量の３Ｍ酢酸ナトリウムｐＨ５．２、１．５μｌのｇｌｙｃｏｂｌｕｅ（Ａｍｂｉｏｎ）を添加して、−２０℃で一晩インキュベートすることで、ＲＮＡを沈殿させた。沈殿したＲＮＡを、４℃で３０分間、２１，０００ｇで遠心分離することでペレット化した。上清を処分した後、ペレットを８０％エタノールで２回洗浄し、エタノールが完全に蒸発するまで風乾した。この段階で精製されたＲＮＡは、リンカーなしのＲＮＡ（ＲＮＡ１又はＲＮＡ２）、リンカーとライゲーションされるが他のＲＮＡと近接ライゲーションされないＲＮＡ（５’−リンカー−ＲＮＡ２）、及び５’−ＲＮＡ１−リンカー−ＲＮＡ２形態の所望のキメラ構築物の混合物であった。ＲＮＡ１は、ビオチンタグ付きリンカーを選択することで枯渇され得る。ゆえに、非インフォマティブ５’−リンカー−ＲＮＡ２も、Ｔ７エキソヌクレアーゼを用いた次の反応において枯渇された。

６．１．末端リンカー（５’−リンカー−ＲＮＡ２）からビオチンを除去。これは、二重鎖のＤＮＡから５’モノヌクレオチドを除去するだけでなく、ＲＮＡ−ＤＮＡハイブリッドのＲＮＡ鎖においてエキソヌクレアーゼ活性を示すＴ７エキソヌクレアーゼのＲＮａｓｅＨ活性に基づくものであった（Ｋ．Ｓｈｉｎｏｚａｋｉ、Ｏ．Ｔｕｎｅｋｏ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ５、４２４５（１９７８年））。相補的ＤＮＡオリゴヌクレオチド(5'-T*C*G*C*ATTGCATGGGCTACTAGCAT(配列番号２)、*は、Ｔ７エキソヌクレアーゼによる消化を阻害するためのホスホロチオエート結合を示す）（Ｔ．Ｔ．Ｎｉｋｉｆｏｒｏｖ、Ｒ．Ｂ．Ｒｅｎｄｌｅ、Ｍ．Ｌ．Ｋｏｔｅｗｉｃｚ、Ｙ．Ｈ．Ｒｏｇｅｒｓ、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ３、２８５（１９９４年））をＲＮＡリンカーにアニーリングし、ＲＮＡリンカーと相補的ＤＮＡ鎖との間に２本鎖ＤＮＡ−ＲＮＡハイブリッドを形成した。アニーリング後に、ＲＮＡリンカーの５’−末端が窪み、ＤＮＡ鎖の３’−末端が突出するように、相補的ＤＮＡ鎖を設計した。そして、アニーリング産生物をＴ７エキソヌクレアーゼで処理した。

１７μｌのＲＮａｓｅ非含有水、４μｌの１０×ＮＥＢｕｆｆｅｒ４、７μｌの１００μＭ相補的ＤＮＡオリゴ内に、ＲＮＡペレットを再懸濁した。７０℃で５分間変性し、６０℃まで徐々に温度を下げて（−０．１℃／ｓ）、６０℃でさらに５分間インキュベートした後、３７度まで徐々に冷却し（−０．１℃／ｓ）、３７℃で１５分間インキュベートすることで、アニーリングを行った。そして、アニーリングされた混合物を、８μｌの１０Ｕ／μｌＴ７エキソヌクレアーゼ（ＮＥＢ）、４μｌの１ｍｇ／ｍｌＢＳＡに混合して、３０分間３７℃でインキュベートし、さらに３０分間３０℃でインキュベートした。ＤＮＡオリゴヌクレオチドと、任意の汚染ゲノムＤＮＡとを、ＴＵＲＢＯＤＮａｓｅの厳密な処理を用いて除去した。４４μｌのＲＮａｓｅ非含有水、１０μｌの１０×ＴＵＲＢＯＤＮａｓｅバッファー、６μｌのＴＵＲＢＯＤＮａｓｅ（Ｉｎｖｉｔｒｏｇｅｎ）を添加し、得られた混合物を３７℃で１時間インキュベートした。ＤＮａｓｅ処理されたＲＮＡを、上述のようなフェノール：クロロホルム抽出及びエタノール沈殿によって精製した。

６．２．ＥＳ−２、ＭＥＦサンプルにおいて、抗体を用いたＤＮＡ−ＲＮＡハイブリッドの枯渇によりｒＲＮＡを除去（ＧｅｎｅＲｅａｄｒＲＮＡＤｅｐｌｅｔｉｏｎＫｉｔ（Ｑｉａｇｅｎ））。以下の変更を伴い、製造者の指示に従ってｒＲＮＡを除去した。２００ヌクレオチドより短いＲＮＡを除去するＲＮｅａｓｙＭｉｎＥｌｕｔｅスピンカラムを用いて、枯渇ＲＮＡをを除去する代わりに、過剰ｒＲＮＡ捕捉プローブを厳密なＤＮａｓｅ処理により除去した。また、ＤＮａｓｅ処理されたＲＮＡを、上述のようなフェノール：クロロホルム抽出及びエタノール沈殿によって精製した。

６．３．ＲＮＡせん断。エタノール沈殿後、製造者によるプロトコルに従ってＲＮａｓｅＩＩＩ断片化キットを用いて、ＩｌｌｕｍｉｎａＨｉＳｅｑによるシーケンシングに最適な１５０〜４００ｂｐのサイズ範囲にＲＮＡを断片化した。断片化ＲＮＡを、２．２×ＳＰＲＩＳｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓ）により精製し、上述のようにエタノール沈殿をおこなった。

６．４．逆転写アダプターとのライゲーション。次に、ＲＴ反応のプライマーとして機能する３’逆転写（ＲＴ）アダプター(/5rApp/AGATCGGAAGAGCGGTTCAG/3ddC/（配列番号３）)に、ＲＮＡをライゲーションした。エタノール沈殿後、２０μｌのライゲーション反応混合物（１μｌのＲＮＡｓｉｎＰｌｕｓ（Ｐｒｏｍｅｇａ）、２μｌの１０×ＲＮＡリガーゼバッファー、７μｌの２０μＭである予備アデニル化されたＬ３−Ａｐｐアダプター、８μｌの５０％ＰＥＧ８０００（ＮＥＢ）、２μｌの２００Ｕ／μｌＴ４ＲＮＡリガーゼ２、トランケートされたＫＱ（ＮＥＢ））に、ＲＮＡペレットを再懸濁した。反応物を１６℃で一晩インキュベートした
６．５．逆転写。ライゲーション後、ＲＮＡを、２×ＳＰＲＩＳｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓ）により精製し、ＲＮａｓｅ非含有水内で溶出した。以下のＲＴ反応は２μｇのＲＮＡについて記載しており、より量の多いＲＮＡについてはそれに応じてスケールアップされた。各実験又は複製について、個々の実験バーコード配列を含む異なるＲＴプライマーを用いた。各ＲＴプライマーは5’-/5Phos/NNXXXXNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT（配列番号４）の形態を有する。この手法では、すべての配列リードペアの第１リードは、NNNNXXXXNN（配列番号５）（ＲＴプライマーのものの逆相補）の構成を取るバーコードを含み、NはＰＣＲ重複を除去するための無作為の６ｎｔバーコードである（Ｇ．Ｂ．Ｌｏｅｂ等、Ｍｏｌｅｃｕｌａｒｃｅｌｌ４８、７６０（２０１２年１２月１４日）；Ｚ．Ｗａｎｇ等、ＰＬｏＳＢｉｏｌ８、ｅ１０００５３０（２０１０年）；Ｊ．Ｋｏｎｉｇ等、Ｎａｔｕｒｅｓｔｒｕｃｔｕｒａｌ＆ｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ１７、９０９（２０１０年７月）；Ｓ．Ｗ．Ｃｈｉ、Ｊ．Ｂ．Ｚａｎｇ、Ａ．Ｍｅｌｅ、Ｒ．Ｂ．Ｄａｒｎｅｌｌ、Ｎａｔｕｒｅ４６０、４７９（２００９年７月２３日））。同一のマッピング位置及び無作為のバーコードを有する任意の２つのペアエンドリードは単に１つとしてカウントされ得る。XXXXは、多重シーケンシングのための固定の４ｎｔサンプルバーコードである（ＥＳ−１ではＡＧＧＴ、ＥＳ−２ではＣＧＣＣ、ＥＳ−インダイレクトではＣＡＴＴ、ＭＥＦではＣＧＣＣ）。任意の２つの４ｎｔサンプルバーコードは３つのヌクレオチドによって異なり、変異又はシーケンシングエラーによる混乱の可能性を退ける。

ｃＤＮＡ合成のため、９μｌのＲＮＡを１μｌの１０ｍＭｄＮＴＰ及び１μｌの５０μＭＲＴプライマーと混合した。混合物を６５℃で５分間加熱し、少なくとも２分間、氷で急速冷却した。４μｌの５×Ｆｉｒｓｔ−Ｓｔｒａｎｄバッファー（Ｉｎｖｉｔｒｏｇｅｎ）、１μｌのＤＴＴ０．１Ｍ、１μｌのＲＮａｓｉｎＰｌｕｓ、１μｌの１０ｍｇ／ｍｌＴ４遺伝子３２タンパク質（ＮＥＢ）を添加した。得られた混合物を５０℃で２分間インキュベートした後、誤ったプライミングを最小化するために逆トランスクリプターゼ酵素を添加した。そして、２μｌの２００Ｕ／μｌＳｕｐｅｒｓｃｒｉｐｔＩＩＩ逆トランスクリプターゼ（Ｉｎｖｉｔｒｏｇｅｎ）を溶液に添加した。それから、ＲＴ反応混合物を５０℃で４５分間、５５℃で２０分間インキュベートし、その後４℃で保持した。ここで、逆トランスクリプターゼ酵素の熱失活は、ＲＮＡ−ｃＤＮＡハイブリッドを保存するために省略された。

＜ステップ７：キメラＲＮＡ−ＤＮＡハイブリッドのビオチンプルダウン＞
ストレプトアビジン−ビオチンアフィニティー精製を用いてキメラＲＮＡ−ＤＮＡハイブリッドを濃縮した。配列リードペアの実質的な断片が、リードペアの一端においてＲＮＡ−リンカー又はリンカー−ＲＮＡ接合部を包含できるように、２回目のＲＮＡ断片化及び逆転写の後に、このプルダウンを行った。

具体的には、１×ＴｗｅｅｎＢ＆Ｗバッファー（５ｍＭのＴｒｉｓ−ＨＣｌｐＨ８．０、０．５ｍＭのＥＤＴＡ、１ＭのＮａＣｌ、０．０５％Ｔｗｅｅｎ）で２回洗浄し、１×Ｂ＆Ｗバッファー（５ｍＭのＴｒｉｓ−ＨＣｌｐＨ８．０、０．５ｍＭのＥＤＴＡ、１ＭのＮａＣｌ）で１回洗浄することで、５０μｌのＭｙｏｎｅＣ１ビーズ（Ｉｎｖｉｔｒｏｇｅｎ）を調製した。そして、ビーズを１００μｌの２×Ｂ＆Ｗバッファー（１０ｍＭのＴｒｉｓ−ＨＣｌｐＨ８．０、１ｍＭのＥＤＴＡ、２ＭのＮａＣｌ）で再懸濁した。ＲＴ混合物に、１００μｌの最終量までＲＮａｓｅ非含有水を足した後、１００μｌのＣ１ビーズ懸濁液と合わせ、回転させて３０分間、ＲＴでインキュベートした。ビーズを回収して、１×Ｂ＆Ｗバッファーで３回洗浄した後、新しいチューブに移して、その後にＴＥバッファーｐＨ８．０で１回洗浄した。次に、５０μｌのＲＮａｓｅＨ溶出混合物（３９．５μｌのＲＮａｓｅ非含有水、５μｌの１０×ＲＮａｓｅＨ反応バッファー、０．５μｌの１０％Ｔｗｅｅｎ−２０、５μｌの５Ｕ／μｌＲＮａｓｅＨ（ＮＥＢ））内で、３７℃で１時間、ＲＮＡ鎖を完全に消化することで、ｃＤＮＡ鎖をストレプトアビジンビーズから放出した。磁性濃縮器を用いてチューブ壁でビーズを採取し、後の操作のために上清を新しいチューブに採取した。ＲＮａｓｅＨを７０℃で２０分加熱することで不活性化した。２．２×ＳＰＲＩＳｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓ）（ｖ／ｖ）によって、ｃＤＮＡを精製した。

＜ステップ８：配列ライブラリ構築＞
ＵＶ誘導架橋部位がしばしば逆転写を停止して、５’アダプターを欠損したトランケートｃＤＮＡをもたらすこと（Ｙ．Ｓｕｇｉｍｏｔｏ等、ＧｅｎｏｍｅＢｉｏｌｏｇｙ１３、Ｒ６７（２０１２年））を考慮して、環状化方法を採用して、トランケートｃＤＮＡからでも配列ライブラリを構築可能にした（Ｉ．Ｈｕｐｐｅｒｔｚ等、Ｍｅｔｈｏｄｓ６５、２７４（２０１４年））（図７）。ＲＴプライマーは、ＩｌｌｕｍｉｎａＰＥＰＣＲフォワードプライマー１．０(5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT)（配列番号６）及びＰＥＰＣＲリバースプライマー２．０ (5'-CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT)（配列番号：７）によってＰＣＲ増幅のプライミングを行うために、アダプター領域を包含し、ＢａｍＨＩ制限部位及び配列バーコードが隣接する。

８．１．環状化。ｃＤＮＡをＣｉｒｃＬｉｇａｓｅＩＩ（Ｅｐｉｃｅｎｔｒｅ）によって環状化した。短時間で、ｃＤＮＡを、２０μｌのＣｉｒｃＬｉｇａｓｅ反応混合物（１２μｌの滅菌水、２μｌのＣｉｒｃＬｉｇａｓｅＩＩ１０×反応バッファー、１μｌの５０ｍＭＭｎＣｌ_２、４μｌの５Ｍベタイン、１μｌの１００Ｕ／μｌＣｉｒｃＬｉｇａｓｅＩＩ（Ｅｐｉｃｅｎｔｒｅ））内でＳＰＲＩＳｅｌｅｃｔビーズから溶出し、６０℃で２時間インキュベートした。反応物を８０℃で１０分間インキュベートすることで、ＣｉｒｃＬｉｇａｓｅＩＩを不活性化した。

８．２．再直線化。相補的ＤＮＡオリゴをＲＴプライマーにアニーリングし、ＢａｍＨＩ制限に適した短２本鎖領域を生成した。この方法ではまた、他の内在性ＢａｍＨＩ制限部位におけるＢａｍＨＩ活性が阻止される。次に、ＢａｍＨＩを適用し、次のＰＣＲ増幅のプライミングを行うために５’末端と３’末端とにアダプターを有する直線ｃＤＮＡを生成した。その後、オリゴアニーリング混合物（４３μｌの水、６μｌの１０×ＦａｓｔＤｉｇｅｓｔバッファー（Ｆｅｒｍｅｎｔａｓ）、５μｌの２０μＭＣｕｔ＿ｏｌｉｇｏ(5'-GTTCAGGATCCACGACGCTCTTCAAAA/3InvdT/)（配列番号８））をＣｉｒｃＬｉｇａｓｅＩＩ反応物に添加した。２分間９５℃に加熱し、その後、９５℃から開始して毎サイクル後に温度を１℃、２５℃まで下げる、各２０秒の７１サイクル、そして２５℃に保持することで、アニーリングを行った。６μｌのＦａｓｔＤｉｇｅｓｔＢａｍＨＩ（Ｆｅｒｍｅｎｔａｓ）を添加し、３７℃で３０分間インキュベートした。再直線化されたｃＤＮＡを２×ＳＰＲＩＳｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓ）（ｖ／ｖ）によって精製し、ヌクレアーゼ非含有水内で溶出した。

８．３．第１のＰＣＲ予備増幅とサイズ選択。１本鎖ｃＤＮＡを、少数のサイクル（６サイクル）で、ＰＣＲプライマーのトランケートされたもの（フォワードプライマーＤＰ５、5’-CACGACGCTCTTCCGATCT（配列番号９）；リバースプライマーＤＰ３、5’-CTGAACCGCTCTTCCGATCT（配列番号１０）)を用いてＰＣＲによってまず予備増幅した。この段階でサイズ選択を行うことにより、最終ライブラリが望ましくないより小さいサイズの断片（プライマー−ダイマー、バーコード及び／又はＲＮＡリンカーのみを含む産生物）であまり汚染されないということが分かった。

６サイクルのＰＣＲを、２０μｌのＮＥＢＮｅｘｔハイフィデリティー２×ＰＣＲマスターミックス（ＮＥＢ）、０．６２５μＭの各ＤＰ５・ＤＰ３プライマーを含む４０μｌ反応物内で、９８℃で３０秒間の初期変性を１サイクル；９８℃で１０秒間、６５℃で３０秒間、７２℃で３０秒間での増幅を６サイクル；その後７２℃で５分間最終伸長；及び４℃で保持、という温度を用いておこなった。ＰＣＲ産生物を１．８×ＳＰＲＩＳｅｌｅｃｔビーズ（ｖ／ｖ）で精製し、Ｅ−ｇｅｌＥＸ２％アガロースゲル（Ｉｎｖｉｔｒｏｇｅｎ）を用いてサイズ選択を行った。１５０ｂｐ〜３５０のＤＮＡ断片をゲルから除き、ＭｉｎＥｌｕｔｅゲル抽出キット（Ｑｉａｇｅｎ）を用いて精製した。

８．４．二本鎖特異的ヌクレアーゼ（ＤＳＮ）手法によるｒＲＮＡ除去（Ｈ．Ｙｉ等、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ３９、ｅ１４０（２０１１年））（ＥＳ−１、ＥＳ−インダイレクト）。ｒＲＮＡを低減するために、ＥＳ−１及びＥＳ−インダイレクトライブラリからのｃＤＮＡ、ｓｓ−ｃＤＮＡも、トランケートＰＣＲプライマーＤＰ５・ＤＰ３を用いて予備増幅した。しかしながら、１．８×ＳＰＲＩＳｅｌｅｃｔビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒＧｅｎｏｍｉｃｓ）（ｖ／ｖ）による精製後に８０〜１００ｎｇのｃＤＮＡが得られるまで、ＰＣＲサイクル数を増加した。これがＤＮＡ量を大きく低減することからアガロースゲルによるサイズ選択を省略した。ＳＰＲＩＳｅｌｅｃｔビーズからの溶出ＤＮＡを、１８μｌの最終量まで、４．５μｌのハイブリダイゼーションバッファー（２ＭのＮａＣｌ、２００ｍＭのＨＥＰＥＳ、ｐＨ８．０）及び滅菌水（必要であれば）に混合した。得られた混合物を９８℃で２分間変性し、サーマルサイクラーにおいて６８℃で５時間再アニーリングした。反応混合チューブがまだサーマルサイクラーにある時に、２０μｌの、６８℃に予め加熱した２×ＤＳＮバッファー（Ａｘｘｏｒａ）を反応混合物に添加し、上下に１０回ピペッティングしてよく撹拌し、反応物を１０分間６８℃でインキュベートした。２μｌの１Ｕ／μｌＤＳＮ酵素（Ａｘｘｏｒａ）を添加、混合、及び６８℃で２５分以上インキュベートした。反応混合チューブに４０μｌの２×ＤＳＮ停止溶液（Ａｘｘｏｒａ）を添加し、よく撹拌し、チューブを氷に移すことで反応を停止した。そして、反応混合物を１．８×ＳＰＲＩＳｅｌｅｃｔビーズを用いて精製した。

８．５．最終ＰＣＲ増幅。全長ＰＣＲプライマーＰＥ１．０及び２．０（Ｉｌｌｕｍｉｎａ）を用いて、前のステップで産生されたＤＮＡにＰＣＲ増幅を行った。過剰増幅を避けるために小分量のＤＮＡで試験的なＰＣＲを行うことで、ＰＣＲサイクル数を入念に設定した。ＰＣＲ産生物を１．８×ＳＰＲＩＳｅｌｅｃｔビーズ（ｖ／ｖ）によって精製し、２５０〜５５０の断片をサイズ選択した（１２０〜４２０ｂｐインサート＋約１３０ｂｐ、ｔｈｅｃｏｍｂｉｎｅｄｌｅｎｇｔｈｏｆＩｌｌｕｍｉｎａＰＥ１．０／２．０の合わせた長さ）。最終ライブラリをＱｕｂｉｔ（Ｉｎｖｉｔｒｏｇｅｎ）及びｑＰＣＲで定量化し、バイオアナライザー（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）で品質確認を行い、ＩｌｌｕｍｉｎａＨｉＳｅｑプラットフォームのペアエンドシーケンシングに出した。

＜ＲＮＡのＨｉ−Ｃに用いられるオリゴヌクレオチド配列＞
本手法に用いられるカスタム設計ＲＮＡ及びＤＮＡオリゴヌクレオチドは、
ビオチン化ＲＮＡリンカー（ＲＮａｓｅ非含有、ＨＰＬＣ精製、ＩＤＴ製）：5' - rCrUrA rG/iBiodT/rA rGrCrCrCrArU rGrCrA rArUrG rCrGrA rGrGrA - 3'（配列番号１１）、
ＲＮＡリンカーを有する相補的ＤＮＡ鎖（ＲＮａｓｅ非含有、ＨＰＬＣ精製、Ｓｉｇｍａ製）：5' -T*C*G*C*ATTGCATGGGCTACTAGCAT - 3'（配列番号１２）、
予備アデニル化ＲＴアダプター（ＲＮａｓｅ非含有、ＨＰＬＣ精製、ＩＤＴ製）：5’ /5rApp/AGATCGGAAGAGCGGTTCAG/3ddC/（配列番号１３）、
ＲＴプライマー（（Ｉ．Ｈｕｐｐｅｒｔｚ等、Ｍｅｔｈｏｄｓ６５、２７４（２０１４年））より適応）（ＲＮａｓｅ非含有、ＨＰＬＣ精製、Ｓｉｇｍａ製）：ＥＳ−１サンプルのＲＴプライマー：5’/5Phos/NNAGGTNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT（配列番号１４）、ＥＳ−２サンプル及びＭＥＦサンプルのＲＴプライマー（異なるレーンにシーケンシングされる）：5’/5Phos/NNCGCCNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT（配列番号１５）、ＥＳ−インダイレクトサンプルのＲＴプライマー：5’ /5Phos/NNCATTNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT（配列番号１６）、
Ｃｕｔ＿ｏｌｉｇｏ（ＨＰＬＣ精製、ＩＤＴ製）：5'-GTTCAGGATCCACGACGCTCTTCAAAA/3InvdT/- 3'（配列番号１７）、ＢａｍＨＩ制限部位は下線で示される、
トランケートＰＣＲフォワードプライマーＤＰ５（ＨＰＬＣ精製、ＩＤＴ製）：5’-CACGACGCTCTTCCGATCT（配列番号１８）、
トランケートＰＣＲリバースプライマーＤＰ３（ＨＰＬＣ精製、ＩＤＴ製）：5’- CTGAACCGCTCTTCCGATCT（配列番号１９）、
ＩｌｌｕｍｉｎａＰＥＰＣＲフォワードプライマー１．０（ＰＡＧＥ精製、Ｓｉｇｍａ製）：5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT（配列番号２０）、
ＩｌｌｕｍｉｎａＰＥＰＣＲリバースプライマー２．０（ＰＡＧＥ精製、Ｓｉｇｍａ製）：5’-CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT（配列番号２１）、である。

＜計算パイプライン処理（ＲＮＡ−ＨｉＣ−ツール）＞
ＲＮＡ−ＨｉＣ−ツールはＲＮＡのＨｉ−Ｃデータ解析のためのコマンドラインツールパッケージである。これはＰｙｔｈｏｎ及びＲで書かれ、ＧｉｔＨｕｂによりバージョン管理されている。全資料についてはhttp://systemsbio.ucsd.edu/RNA-Hi-Cにある。該パイプライン処理は、ペアエンド配列リードを入力とする（図１５Ａ）。ＲＮＡリンカーのオリゴヌクレオチド配列と多重シーケンシングに用いられるサンプルバーコードとも、パイプライン処理に提供される必要がある。主要な出力は、１．ＲＮＡ１−リンカー−ＲＮＡ２の形態のキメラｃＤＮＡリストを含む、解析されたｃＤＮＡライブラリ（図７、図１５Ｃの最終産生物参照）、２．すべてのキメラｃＤＮＡのＲＮＡ１及びＲＮＡ２のゲノム位置（図１５Ｄ）、３．キメラｃＤＮＡの統計的強化から推定される相互作用ＲＮＡペア（図１５Ｅ）を含む。解析ステップは以下のとおりである。

〔１．ＰＣＲ重複除去〕
フォワードリードは（図１５Ａのリード１）は５’末端において４ｎｔサンプルバーコード及び６ｎｔ無作為バーコードを含む。リードペアは、２つのリードペアが同一の配列を有し、同一のバーコード（１０ｎｔ）を含む場合に、他のリードペアのＰＣＲ重複と分類されて、破棄される。「ｒｅｍｏｖｅ＿ｄｕｐ＿ＰＥ．ｐｙ」というツールがこの機能を提供し、非重複リードを含むｆａｓｔｑ／ｆａｓｔａファイルを生成し、除去された重複数をレポートする。

〔２．多重シーケンシングリードを対応実験サンプルに割り当て〕
「ｓｐｌｉｔ＿ｌｉｂｒａｒｙ＿ｐａｉｒｅｎｄ．ｐｙ」というツールが、各リードのサンプルバーコードをサンプルバーコードリストのもの（ユーザ入力テキストファイル）と一致させて、各ペアエンドリードをサンプルに割り当て、各サンプルに割り当てられたリードのｆａｓｔｑ／ｆａｓｔａファイルと、割り当てられないリードのｆａｓｔｑ／ｆａｓｔａファイルとを生成する。

〔３．シーケンシングライブラリにおけるｃＤＮＡ回収〕
このステップでは、もしあるなら、全てのリードペアにおける２つの末端のオーバーラップ領域が特定される。また、可能であるときに、シーケンシングライブラリにおけるｃＤＮＡ配列全体も回収される。

オーバーラップが存在する場合、そのリードペアは、１００ｂｐ〜２００ｂｐ（Ｐ５及びＰ７の長さはカウントしない）のｃＤＮＡからシーケンシングされた（図３２、タイプ２）。この場合、ｃＤＮＡ配列全体は、フォワードリード（リード１）をリバースリード（リード２）の非オーバーラップ領域とを連結することで完全に包含される。

ｃＤＮＡが１００ｂｐより短い場合、ｃＤＮＡの２つの末端におけるＰ５及びＰ７プライマーの存在が確認された（タイプ１）。Ｐ５又はＰ７を含まないものは破棄された（タイプ４）。

オーバーラップがないと、リードペアは、２００ｂｐよりも長いｃＤＮＡからシーケンシングされ、その配列は部分的に回収されるのみであり得る（図３２、タイプ３）。

この機能は、「ｒｅｃｏｖｅｒＦｒａｇｍｅｎｔ．ｐｙ」によってなされ、これは局所アライメントを用いてオーバーラップ領域を特定するものである。リード長さ（各末端で１００ｂｐ）と比較してオーバーラップが小さいとき（１５ｂｐ以下）、局所アライメントは非感受的であり得る。この非感受性を解決するため、「ｒｅｃｏｖｅｒＦｒａｇｍｅｎｔ．ｐｙ」は、最初のアライメント後に、特定できるオーバーラップがないリードペアを収集し（図３２、ＡＬＩＧＮ１）、各リードをその長さの３分の１にトランケートし（各リードの３’で３３ｂｐを保持）、局所アライメントを繰り返す（ＡＬＩＧＮ４）。

〔４．キメラｃＤＮＡの解析〕
このステップではｃＤＮＡがその構成に基づいて分類される（図１５Ｃ）。これは、完全に（図３２、タイプ１及びタイプ２）又は部分的に（タイプ３）回収されたｃＤＮＡ配列と、リンカー配列とを、入力として用いる。ｃＤＮＡにおけるリンカー位置を特定し、リンカー配列位置に基づいて、以下のものを含むｃＤＮＡの５分類を生成する。

１．リンカーなし。リンカー配列を含まない、任意のタイプ１又はタイプ２ｃＤＮＡはこの分類に属する。この分類はさらに３つの副分類に分けられ、以下のものを含む。

ａ．バーコードのみ。ｃＤＮＡ全体が１０ｎｔバーコード（４ｎｔサンプルバーコード＋６ｎｔ無作為バーコード）であり、非ライゲーションＲＴプライマの汚染によりもたらされたと考えられる。

ｂ．単一のＲＮＡ。ｃＤＮＡ全体がＲＮＡの連続的な断片である。

ｃ．ＲＮＡ１−ＲＮＡ２。これらはリンカーライゲーション前の近接ライゲーションからもたらされたと考えられる。

リンカーを包含する分類の４つには、以下のものが含まれる。

２．ＲＮＡ１−リンカー−ＲＮＡ２。これらは所望のキメラＲＮＡからもたらされた。２つのリードが２つの個別のＲＮＡ遺伝子に完全にアライメントされる任意のリンカー非含有のタイプ３ｃＤＮＡも、この分類に入れられた。ＲＮＡ１側及びＲＮＡ２側の両方が少なくとも５ｂｐの配列を含むことが要求された。

３．リンカー−ＲＮＡ２。リンカーは、ＲＮＡの５’末端に正常にライゲーションされたが、近接ライゲーションでは成功しなかった。

４．ＲＮＡ１−リンカー。リンカーはＲＮＡの３’末端にライゲーションされた。これは、３’−ＯＨ基を有するＲＮＡ又はＲＮＡ断片から、又は第２の断片化ステップ時におけるＲＮＡ１−リンカー−ＲＮＡ２キメラからの一方のＲＮＡ（ＲＮＡ２）切断から発生したと考えられる。

５．リンカーのみ。ｃＤＮＡ全体がバーコード及びリンカー配列であった。

このステップでは、ＲＮＡ１−リンカー−ＲＮＡ２分類に属するｃＤＮＡリストが出力される。

〔５．ゲノムへのマッピング〕
そして、すべての解析はＲＮＡ１−リンカー−ＲＮＡ２タイプのリードペアに基づくものであった。まず、リンカーのＲＮＡ１側又はＲＮＡ２側に１５未満ｂｐを含む任意のｃＤＮＡは破棄された。これは、マッピングステップにおいて１５ｂｐ以下の配列をユニークにマッピングすることが困難であるためである。そして、リンカー各側の２つのＲＮＡ断片（ＲＮＡ１及びＲＮＡ２）は、Ｂｏｗｔｉｅバージョン０．１２．７（Ｂ．Ｌａｎｇｍｅａｄ、Ｃ．Ｔｒａｐｎｅｌｌ、Ｍ．Ｐｏｐ、Ｓ．Ｌ．Ｓａｌｚｂｅｒｇ、ＧｅｎｏｍｅＢｉｏｌｏｇｙ１０、（２００９年））及びパラメーター−ｆ −ｎ１ −ｌ１５ −ｅ２００ −ｐ９ -Ｓを用いて、マウスゲノムｍｍ９／ＮＣＢＩ３７に個別にマッピングされた。「Ｓｔｉｔｃｈ−ｓｅｑ＿Ａｌｉｇｎｅｒ．ｐｙ」において適用されるこのステップでは、ＲＮＡ１とＲＮＡ２とがゲノムにユニークにマッピングされたリードペアが出力される。

さらなる感受性の可能性のあるマッピング方法が、Ｂｏｗｔｉｅ２（Ｂ．Ｌａｎｇｍｅａｄ、Ｓ．Ｌ．Ｓａｌｚｂｅｒｇ、ＮａｔＭｅｔｈｏｄｓ９、３５７（２０１２年４月））の「−−ｓｅｎｓｉｔｉｖｅ−ｌｏｃａｌ」モードをパラメーター「−Ｄ１５ −Ｒ２ −Ｎ０ −Ｌ２０ −ｉＳ，１，０．７５」と共に用いてテストされた。この「ｍｕｌｔｉｓｅｅｄａｌｉｇｎｍｅｎｔ」では２０ｂｐのシードが用いられ、任意のシードにおける不整合０、シード間の９ｂｐ間隔（ｃｅｉｌ（１＋０．７５×√１００））、１５までの連続シード延長試験、及び２回までの「再シード」を可能にした。この代替的方法によって、Ｂｏｗｔｉｅ０．１２．７よりやや少ないユニークなアライメントが特定されるという結果を得た。従って、Ｂｏｗｔｉｅ０．１２．７の結果が次のステップに用いられた。

〔６．相互作用ＲＮＡペアの特定〕
ｍＲＮＡ、ｌｉｎｃＲＮＡ、ｒＲＮＡ、ｓｎＲＮＡ、ｓｎｏＲＮＡ、ｍｉＲＮＡ、ｍｉｓｃ＿ＲＮＡ、ｔＲＮＡ、及びトランスポゾンの遺伝子を含む、Ｅｎｓｅｍｂｌ（リリース６７、マウスＮＣＢＩＭ３７）から、アノテーションを取り出した。同じトランスポゾンの異なるゲノムコピーは、この解析において異なる遺伝子として捉えられた。ｒＲＮＡにマッピングされたリードはさらなる解析から除かれた。（ＲＮＡ１−リンカー−ＲＮＡ２タイプのＲＮＡ１又はＲＮＡ２からの）ユニークにアライメントされたリードの数は、すべての遺伝子においてカウントされた。５未満のリードカウントを有するいずれの遺伝子も除外された。次に、任意の２つの遺伝子間の会合はフィッシャーの正確検定でテストされた。帰無仮説は、遺伝子Ａと遺伝子Ｂとは配列リードに独立して寄与するというものであった。対立仮説は、リードカウントに対するこれらの寄与が関連するというものであった。ｃ_Ａ、ｃ_Ｂはそれぞれ遺伝子Ａと遺伝子Ｂのリードカウントとして表され、Ｉ_Ａ，Ｂは、２遺伝子が同じリードペアに共出現する、共出現のリードカウントとして表される。検定統計量として

を用いて、フィッシャーの正確検定が各遺伝子ペアに行われ、

は、遺伝子Ａではない他の遺伝子（遺伝子Ｂ）のリードカウントであった。ｐ値とＦＤＲとを（ベンジャミン−ホッホバーグ法（Ｙ．Ｂｅｎｊａｍｉｎｉ、Ｙ．Ｈｏｃｈｂｅｒｇ、ＪｏｕｒｎａｌｏｆｔｈｅＲｏｙａｌＳｔａｔｉｓｔｉｃａｌＳｏｃｉｅｔｙ．５７、２８９（１９９５年））、すべての遺伝子ペアについて計算した。このステップでは、ＦＤＲ＜０．０５且つ倍率変化（ｆｏｌｄ−ｃｈａｎｇｅ、ＦＣ）≧３である遺伝子ペアが出力される。ＦＣは

として計算され、Ｉ′_Ａ，Ｂは対照サンプル（ＥＳ−インダイレクト）の共出現リードカウントであった。このステップは、その相互作用領域、サポートペア数、有意性のｐ値、ＦＤＲ、及び倍率変化（ｆｏｌｄ−ｃｈａｎｇｅ）の情報を有する強力な相互作用ＲＮＡペアを出力する「Ｓｅｌｅｃｔ＿ｓｔｒｏｎｇＩｎｔｅｒａｃｔｉｏｎ＿ＲＮＡ．ｐｙ」において適用された。

〔７．ＲＮＡ相互作用部位の特定〕
ＲＮＡ相互作用部位は、ＲＮＡ−ＲＮＡ相互作用に度々寄与する連続的なＲＮＡセグメントとして定義された。ＲＮＡ相互作用部位は、複数のオーバーラップリードと、他のＲＮＡとの頻繁な共出現（近接ライゲーション）とを有する連続的なＲＮＡセグメントとして、ＲＮＡのＨｉ−Ｃデータから推定された。まず、５以上のユニークにアライメントされたリードに含まれる任意の連続的なＲＮＡセグメントを候補の相互作用部位として特定した。次に、任意の２つの候補部位間の関連をフィッシャーの正確検定でテストした。帰無仮説は、候補部位Ａと遺伝子Ｂが配列リードに独立的に寄与するというものであった。対立仮説は、リードカウントに対するこれらの寄与が関連するというものであった。ｃ_Ａ、ｃ_Ｂはそれぞれ候補部位Ａ及びＢのリードカウントとして表され、Ｉ_Ａ，Ｂは、２つの部位が同じリードペアに共出現する、共出現のリードカウントとして表される。検定統計量として

を用いて、フィッシャーの正確検定が各部位ペアに行われ、

は、Ａではない他の候補部位（Ｂ）のリードカウントであった。ｐ値とＦＤＲと（ベンジャミン−ホッホバーグ法）を、すべての候補部位ペアについて計算した。有意な関連（ＦＤＲ＜０．０５）を示す候補部位が、ＲＮＡ相互作用部位と考えられた。このステップは、特定されたＲＮＡ相互作用部位を出力する「Ｓｅｌｅｃｔ＿ｓｔｒｏｎｇＩｎｔｅｒａｃｔｉｏｎ＿ｐｐ．ｐｙ」において自動化された。

「Ｐｌｏｔ＿ｉｎｔｅｒａｃｔｉｏｎ．ｐｙ」というツールは、ＲＮＡ相互作用部位とこれらの部位のライゲーションイベントとを視覚化するために開発された（図１６Ａ〜図１６Ｂ）。例えば２つの遺伝子の位置である、入力としての任意の２つのゲノム領域から、このツールは、ＲＮＡ１−リンカー−ＲＮＡ２形態のすべてのサポートリードペアを表示し、ＲＮＡ１とＲＮＡ２とは２つのゲノム位置のそれぞれにアライメントされた。各ＲＮＡペアのリンカーもプロットされた。このツールはまた、もしあるなら、入力領域におけるＲＮＡ相互作用部位や、これら部位間の特定された相互作用もプロットする。

「Ｐｌｏｔ＿Ｃｉｒｃｏｓ．Ｒ」というツールは、ＲＮＡ−ＲＮＡインタラクトームの全体図を提供する（図１６Ｃ）。これは、ゲノム全体を円としてプロットし、任意のＲＮＡ−ＲＮＡ相互作用を２つの寄与遺伝子を繋ぐ湾曲線としてプロットする。異なるタイプのＲＮＡに関与する相互作用は異なる色で示される。ＲＮＡ１とＲＮＡ２リード断片の密度は、内円として、すべての染色体と共に表示される。その他の解析及び視覚化ツールはhttp://systemsbio.ucsd.edu/RNA-Hi-Cに記載される。

＜ＲＮＡ相互作用部位間の結合エネルギー＞
２つのＲＮＡ相互作用部位間の結合エネルギーを、ＲＮＡｓｔｒｕｃｔｕｒｅバージョン５．６のＤｕｐｌｅｘＦｏｌｄプログラムにより計算した（Ｓ．Ｂｅｌｌａｏｕｓｏｖ、Ｊ．Ｓ．Ｒｅｕｔｅｒ、Ｍ．Ｇ．Ｓｅｅｔｉｎ、Ｄ．Ｈ．Ｍａｔｈｅｗｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ４１、Ｗ４７１（２０１３年７月））。２つの相互作用部位間の塩基対をＭｉＲａｎｄａバージョン３．３ａにより決定した（Ｄ．Ｂｅｔｅｌ、Ａ．Ｋｏｐｐａｌ、Ｐ．Ａｇｉｕｓ、Ｃ．Ｓａｎｄｅｒ、Ｃ．Ｌｅｓｌｉｅ、ＧｅｎｏｍｅＢｉｏｌ１１（２０１０年））。

＜ＲＮＡ相互作用部位の保存レベル＞
ＲＮＡ１−リンカー−ＲＮＡ２カテゴリのすべてのリードペア（ステップ４の出力）について、一方はＲＮＡ１−リンカーのライゲーション接合部の中心にあり、他方はリンカー−ＲＮＡ２のライゲーション接合部の中心にある、２つの１０００ｂｐゲノム領域のＰｈｙｌｏＰ保存スコアを取得した（Ｇ．Ｍ．Ｃｏｏｐｅｒ等、ＧｅｎｏｍｅＲｅｓ１５、９０１（２００５年７月））。すべてのＲＮＡ１−リンカー−ＲＮＡ２タイプリードペアの平均ＰｈｙｌｏＰスコアをプロットした。対照として、同数の同じ長さの無作為ゲノム領域からの平均ＰｈｙｌｏＰスコアを取得した。

＜ネットワーク解析＞
特定されたＲＮＡ−ＲＮＡ相互作用（ステップ６の出力）を表形式に変換し、視覚化のためＣｙｔｏｓｃａｐｅ３．１．０（Ｒ．Ｓａｉｔｏ等、ＮａｔＭｅｔｈｏｄｓ９、１０６９（２０１２年１１月））にインポートした。各ノードは遺伝子を表し、遺伝子型により色分けされた。各ノード数をＣｙｔｏｓｃａｐｅにより計算した。

＜分子内切断及びライゲーションから生成されたリードペアの検出＞
ＲＮＡ１−リンカー−ＲＮＡ２タイプのリードペア（ステップ６の出力）から開始して、自己相互作用ＲＮＡから生成されたペアエンドリードを特定するために、以下のフィルターを適用した。

１．２つの異なる遺伝子にマッピングされたリードペアを除いた。

２．リードペアが同じ遺伝子にマッピングされる場合、（１）リンカー配列の任意の断片を含まない、（２）フォワード及びリバースリードが２０００ｂｐ内の対向鎖にマッピングされる、（３）正鎖にマッピングされたリードがペア内のゲノムにおいて負鎖にマッピングされたリードより小さい座標を有する、というペアも除いた。このステップは構造解析において無傷の（連続的な）ＲＮＡ断片の含有を最小化する。

＜ＲＮＡ折りたたみ及び２次構造予測＞
既知である又は通常容認される構造を有するＲＮＡの構造情報を、ｆＲＮＡｄｂデータベースｖ３．４（Ｔ．Ｍｉｔｕｙａｍａ等、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ３７、Ｄ８９（２００９年１月））からＤＯＴ形式（グラフ記述言語）でダウンロードした。コマンドラインバージョンのＶＡＲＮＡアプレットバージョン３．９を用いてＤＯＴファイルから図を描画した（Ｋ．Ｄａｒｔｙ、Ａ．Ｄｅｎｉｓｅ、Ｙ．Ｐｏｎｔｙ、Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２５、１９７４（２００９年８月１日））。ｆＲＮＡｄｂに構造情報がないＲＮＡについて、その２次構造を、ＲＮＡｓｔｒｕｃｔｕｒｅバージョン５．６の「Ｆｏｌｄ」プログラムを用いて、配列に基づいて予測した（Ｓ．Ｂｅｌｌａｏｕｓｏｖ、Ｊ．Ｓ．Ｒｅｕｔｅｒ、Ｍ．Ｇ．Ｓｅｅｔｉｎ、Ｄ．Ｈ．Ｍａｔｈｅｗｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ４１、Ｗ４７１（２０１３年７月））。

［ＲＮＡのＨｉ−Ｃの対照実験］
第１の対照実験では、手順において架橋ステップを省略した。第２の対照実験では、タンパク質のビオチン化ステップを省略した。第３の対照実験では、マウスＥＳ細胞とショウジョウバエＳ２細胞との混合細胞溶解物において全手順を行った。

まず、約３×１０^８マウスＥＳ細胞の非架橋対照を行った。ストレプトアビジンビーズにタンパク質と共に固定化されたＲＮＡを、上述のようにタンパク質消化により精製した。精製ＲＮＡは、ＱｕｂｉｔＲＮＡＨＳアッセイ（Ｉｎｖｉｔｒｏｇｅｎ）により定量化された。ＲＮＡはアッセイの検出限界（２５０ｐｇ／μｌ）より少ないものであった。サンプル量は２０μｌ（上述と同じ）であり、これはＲＮＡ量が５ｎｇ以下であったことを示唆する。この時点で、リンカー選択及びライブラリー構築ができる見込みがないため実験を停止した。上述の実験では、精製ＲＮＡはこのステップでμｇ範囲にあるものであった。

次に、３×１０^８マウスＥＳ細胞にタンパク質のビオチン化を行わない（架橋を保持）ことで、他の対照を行った。ビーズから精製されたＲＮＡはＱｕｂｉｔＲＮＡＨＳアッセイの検出限界より少ないものであることが分かった。

３つ目に、３×１０^８ショウジョウバエＳ２細胞と３×１０^８マウスＥＳ細胞とで実験を開始した（異種対照）。細胞を架橋し、溶解した。２つの細胞株からの溶解物を混合後、タンパク質のビオチン化及び近接ライゲーションを行った。配列ライブラリ（Ｆｌｙ−Ｍｍ）を作製するために、混合物に残りの実験手順を行った。Ｆｌｙ−Ｍｍは２７，７４８，６８８のリードペアを包含した。重複リードを除去し、リンカーによって分けた後、１６，８８１，３２６のＲＮＡ１−ＲＮＡ２ペアが存在した。各ＲＮＡ部分（ＲＮＡ１又はＲＮＡ２のいずれか）をハエゲノム（ｄｍ６）にマッピングし、マウスゲノム（ｍｍ９）にマッピングした。全部で７，１８８，７６９のペアが、マウス又はハエゲノムのいずれにもマッピングできない少なくとも一部分（ＲＮＡ１又はＲＮＡ２のいずれか）を有した。残余の９，６９２，５５７のＲＮＡ１−ＲＮＡ２ペアはゲノムにマッピングされた両方の部分を有し、その中で、８，４８４，８０７ペアが１つのゲノムのみにユニークにマッピングされた各ＲＮＡ部分を有した。これらのマッピングされたＲＮＡペアの分布は以下のとおりである（表６）。２種にマッピングされたＲＮＡペアの割合は、０．５２％（４４，２２９／８，４８４，８０７）である。

さらに、ＥＳ−１ライブラリ（純粋マウスサンプル）が上述の解析を受けたらどうなるかが検討された。０．５５％のＲＮＡ１−ＲＮＡ２ペアが、マウスゲノムにユニークにマッピングされた一方のＲＮＡ部分と、ハエゲノムにユニークにマッピングされた他方の部分とを有し得るということが分かった。ゆえに、Ｆｌｙ−Ｍｍサンプルの「汚染率」（０．５２％）は、ＥＳ−１サンプルのもの（０．５５％）よりもさらに低いものであり、実験上の汚染（おそらくは無作為ライゲーションのため）が非常に低いのでインフォマティク手法のエラー範囲に該当したということが示唆される。

［２重架橋とＵＶ架橋との違い］
ＦＡ−ＤＳＧ２重架橋を、ＲＡＰシーケンシングにおいて、ソラレン架橋及びホルムアルデヒド（ＦＡ）架橋と比較した（Ｊ．Ｍ．Ｅｎｇｒｅｉｔｚ等、ＲＮＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓｅｎａｂｌｅｓｐｅｃｉｆｉｃｔａｒｇｅｔｉｎｇｏｆｎｏｎｃｏｄｉｎｇＲＮＡｓｔｏｎａｓｃｅｎｔＰｒｅ−ｍＲＮＡｓａｎｄｃｈｒｏｍａｔｉｎｓｉｔｅｓ．Ｃｅｌｌ１５９、１８８（２０１４年９月２５日））。架橋後に、Ｅｎｇｒｅｉｔｚ等はアンチセンスオリゴヌクレオチドを用いて核内Ｍａｌａｔ１ＲＮＡを精製し、Ｍａｌａｔ１と共に精製されたＲＮＡをシーケンシングした。Ｅｎｇｒｅｉｔｚ等は、２重架橋と他の２つの架橋法との間で、Ｍａｌａｔ１標的の少々のオーバーラップを認めた。１つのＲＮＡを除いて、２重架橋においてＭａｌａｔ１と共精製された数百のＲＮＡはすべてユニークであった（Ｅｎｇｒｅｉｔｚ等の付録表３）。Ｅｎｇｒｅｉｔｚ等は、これを、２重架橋が「複数のタンパク質中間体を介して非直接に結合されたＲＮＡを効率的に捕捉」できるという考えによるものであるとした。ＵＶ架橋（本発明の方法）は核酸から核酸の架橋においてソラレンほど効果的でなはく、全体的にＦＡほど効果的ではない。公開されたデータに基づくと、ＵＶ架橋及び２重架橋によって検出されたＲＮＡペアが大きくオーバーラップするとは予期されなかった。

さらに具体的には、ｓｎｏＲＮＡは短く（約１５０ｎｔ）、ｍＲＮＡと相互作用するときに、ｓｎｏＲＮＰタンパク質複合体を包囲するか又はその内にあり得る。２重架橋は、ｓｎｏＲＮＰ複合体全体を保持すると考えられる。ｓｎｏＲＮＰ複合体は、ＲＮａｓｅＩがｓｎｏＲＮＡを切断するのを妨げ、またＲＮＡライゲーションを抑止すると考えられる。ゆえに、ｓｎｏＲＮＡに関与する検出相互作用における大きな差は予期されるものであった。

［ｍｉＲＮＡ様相互作用を有する他のＲＮＡ］
その他のＲＮＡがｍｉＲＮＡ生合成と同様のプロセスを経るか、またｍＲＮＡと相互作用し得るかが検討された。ＲＮＡのＨｉ−Ｃにより、ＥＳ細胞において、小型ＲＮＡシーケンシング（小型ＲＮＡ−ｓｅｑ）によって見出されたもの及びＡＧＯタンパク質と結合するもの（ＨＩＴＳ−ＣＬＩＰ）との相互作用ＲＮＡが特定された。小型ＲＮＡ−ｓｅｑでは、「Ｄｉｃｅｒ又はその他のＲＮＡ処理酵素による酵素切断からもたらされる３’ヒドロキシル基を有するｍｉＲＮＡ及びその他の小型ＲＮＡ」が選択的にシーケンシングされた。ｍｉＲＮＡを除いて、ｓｎｏＲＮＡ、偽遺伝子ＲＮＡ、ｍＲＮＡＵＴＲを含む他のＲＮＡ型も小型ＲＮＡプールに寄与し、ＡＧＯに付加された（図１７）。さらに、ＲＮＡのＨｉ−Ｃにより特定された相互作用ＲＮＡペアの大部分が、ＡＧＯＨＩＴＳ−ＣＬＩＰデータにおいて共出現した（図１８）。このデータにより、ＤＩＣＥＲ又は他のＲＮＡ処理酵素により消化され、且つＲＩＳＣ複合体に組み込まれるノンｍｉＲＮＡが存在することが示唆される。

総数３０２のＲＮＡ−ＲＮＡ相互作用がこれらのフィルターを通過した。これらの相互作用におけるソースＲＮＡの大多数（７９％）はｓｎｏＲＮＡであった（表ＳＴ２）。ゆえに、ｓｎｏＲＮＡは機能解析において優先された。

多数のｓｎｏＲＮＡがｍｉＲＮＡ様短鎖ＲＮＡに酵素処理され、ｍＲＮＡと相互作用したと仮定された。この仮定は、ｍＲＮＡとｓｎｏＲＮＡとの両方がＡＧＯによって結合された、９１９のＲＮＡＨｉ−Ｃ特定ｓｎｏＲＮＡ−ｍＲＮＡ相互作用によって裏付けられた。さらにＡＧＯ結合ｓｎｏＲＮＡとその相互作用ｍＲＮＡとは、ＥＳ細胞の中内胚葉への誘導分化時に、反相関発現変化を示した（Ｐ．Ｙｕ等．、Ｓｐａｔｉｏｔｅｍｐｏｒａｌｃｌｕｓｔｅｒｉｎｇｏｆｔｈｅｅｐｉｇｅｎｏｍｅｒｅｖｅａｌｓｒｕｌｅｓｏｆｄｙｎａｍｉｃｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ２３，３５２（２０１３年２月））（図１７Ｂ）。加えて、ＡＧＯ結合ｓｎｏＲＮＡとその標的ｍＲＮＡとは、ＡＧＯ結合のないものよりも、強力な塩基対形成を示した（図１７Ｃ）。最後に、ｓｎｏＲＮＡから処理された小型ＲＮＡは、ｍＲＮＡのＵＴＲ領域と指示的に相互作用した。ＲＮＡ−ＲＮＡ相互作用に関する４９７のｓｎｏＲＮＡから、２４３がＵＴＲ領域と相互作用し、その中で２２３（９２％）が小型ＲＮＡ−ｓｅｑにおいて検出され、これは、酵素切断を受けたことを示唆する（図１７Ｄ）。比較すると、非ＵＴＲ領域と相互作用するその他の２５４のｓｎｏＲＮＡは、より少ない小型ＲＮＡ（５５％）を含有した。さらに、非ＵＴＲ相互作用ｓｎｏＲＮＡよりも、２倍のＵＲＴ相互作用ｓｎｏ−ｓｉＲＮＡがＡＧＯ結合であった（ｐ値＜２．２^−１６、カイ二乗検定）。例えば、Ｓｎｏｒａ１４ＲＮＡは、Ｍｃｌ１ｍＲＮＡの３’ＵＴＲを標的とした（図１９Ａ）。Ｓｎｏｒａ１４ＲＮＡの相互作用部位（１１０〜１３５ｎｔ）は、酵素処理された小型ＲＮＡ（薄紫色のレーン）及びＡＧＯ結合領域（緑色のレーン）と正確にオーバーラップした。Ｓｎｏｒａ１４ＲＮＡの酵素処理した部分はヘアピンループの完全に一方側に位置し（図１９Ｂ）、Ｍｃｌ１ＵＴＲの標的部位に対して強力な結合親和性（−６０ｋＣａｌ／ｍｏｌ）を示す。処理Ｓｎｏｒａ１４ＲＮＡの発現はＭｃｌ１ｍＲＮＡのものと負の相関を示した（図１９Ｃ）。共に考慮すると、ＥＳ細胞において９００を超えるｍＲＮＡと相互作用する、多数のｓｎｏＲＮＡ遺伝子由来低分子干渉ＲＮＡについて、このデータは示唆する。

［摂動のないインビボにおけるＲＮＡ−ＲＮＡインタラクトームマッピングとＲＮＡ構造］
ＲＮＡ−ＲＮＡインタラクトーム全体の解析には未だ困難がある。任意の摂動なく、インビボにおける任意の単一のタンパク質に含まれるＲＮＡ−ＲＮＡ相互作用をマッピングするために、ＲＮＡのＨｉ−Ｃ技術が開発された。ＲＮＡ−ＲＮＡインタラクトームは、胚性幹細胞において体系的にマッピングされ、４６，７８０の相互作用を明らかにした。ＲＡＰ−ｓｅｑ１を用いて７つの相互作用を検証した。このインタラクトームでは、大部分のｍｉＲＮＡ及びｌｉｎｃＲＮＡは１つのｍＲＮＡとそれぞれが特異的に相互作用し、これは「乱雑な」ＲＮＡ相互作用という現在の定説と矛盾する。塩基対は、長鎖ＲＮＡ間の相互作用領域で観察され、トランスで作用する調節配列分類を示唆した。さらに、ＲＮＡのＨｉ−Ｃは、１本鎖領域のフットプリントと各ＲＮＡの空間的近位部位とを共に明らかにすることで、ＲＮＡ構造の新規の情報を提供する。このように、細胞生理の最小摂動を伴うタンパク質補助ＲＮＡインタラクトームの偏りのないマッピングが、先行の方法に対して有利であり、ＲＮＡ機能検証の範囲を大きく拡大する。この技術により、内在性レベルのＲＮＡ発現を摂動することなく、ＲＮＡ−ＲＮＡインタラクトームの特定可能部分が大きく拡大される。

［ＲＮＡのＨｉ−Ｃのシミュレーション分析］
＜データ合成＞その実験及び計算方法を含むＲＮＡＨｉ−Ｃの感受性と特異性とを推定するために、シミュレーション解析を行った。データ生成プロセスを計算で再現することによって、１００万ペアエンドリードをシミュレーションした。シミュレーションに用いられたパラメータは、実際のデータに由来した。シミュレーションされたデータ生成プロセスは、以下のとおりである。

３．このリードペアがリンカ−包含タイプに割り当てられる場合に、同等の可能性のある１又は２のリンカーを無作為に選択する。僅かな割合のリンカ−包含リードペアが２つのリンカーを含むということが言及され、同等の可能性の利用は、最悪の場合を推定するための保存的な選択であった。

４．ステップ２で決定されたｃＤＮＡタイプに従って、ＲＮＡ１部分及びＲＮＡ２部分のために配列を生成する。ＲＮＡ１とＲＮＡ２とについて、
ａ．ｌ〜Ｕｎｉｆ（１５，１５０）から長さをシミュレートする。

８．各塩基において０．０１の比率でシーケンスエラーをシミュレートする（Ｎ．Ｊ．Ｌｏｍａｎ等、Ｐｅｒｆｏｒｍａｎｃｅｃｏｍｐａｒｉｓｏｎｏｆｂｅｎｃｈｔｏｐｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔｓｅｑｕｅｎｃｉｎｇｐｌａｔｆｏｒｍｓ、Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ３０、４３４（２０１２年５月））。

＜中間及び最終結果の評価＞
２つの中間解析ステップの感受性及び特異性、並びに最終予測を評価するために、合成データを用いた。

まず、プログラムが特定したｃＤＮＡの長さ（ＲＮＡ−ＨｉＣ−ツールのステップ３の出力）を実際（合成）の長さと比較した（表８）。このステップ「３、配列ライブラリにおいてｃＤＮＡを回収」では、各ｃＤＮＡをその長さについて４つのタイプに、つまりタイプ１（＜１００ｂｐ）；タイプ２（１００〜２００ｂｐ）；タイプ３（＞２００ｂｐ）；タイプ４（不明）に、割り当てる（図Ｓ３２）。各タイプを特定するために、アルゴリズムにより高い感受性及び特異性を得た。２００ｂｐより短いｃＤＮＡのごく僅かなもののみが（０．５８％）、２００ｂｐより長いと特定された。このエラーは、フォワード及びリバースリードのオーバーラップが少しあったためであり（通常は０〜５ｂｐｓ）、これは局所アライメントにより検出されなかった。

表８は、プロクラム特定及び実際のｃＤＮＡ長の範囲の比較を示す。各タイプ（列１〜４）のプロクラム特定ｃＤＮＡのカウントを、それらの実際のタイプ（行）と比較する。

プログラム特定の長さが２００ｂｐより短いとき（タイプ１とタイプ２）、正確な長さを計算できた。これらの場合には、シミュレートされたｃＤＮＡの長さに、プログラム特定の長さが多くは正確に合致した（図３３Ａ）。

次に、プログラムにより各ｃＤＮＡのキメラ構成が特定され、それらを（ＲＮＡ−ＨｉＣ−ツールのステップ４の出力）を合成構成と比較した。「４．キメラｃＤＮＡの解析」のステップにおいて、リンカー配列の存在に基づいて、アルゴリズムによりｃＤＮＡを５つのカテゴリに割り当てた。アルゴリズムは、「ＲＮＡ１−リンカー−ＲＮＡ２」形態のｃＤＮＡに対して、９９．８９％感受性及び９５．８２％特異性に達した（表９）。

表９は、プログラム特定及び実際のｃＤＮＡ構成の比較を示す。プログラム特定のｃＤＮＡのカウント（列）をその実際の構成（行）と比較する。

最後に、プログラムがＲＮＡ−ＲＮＡ相互作用を特定及びシミュレートし、これらが比較された。シミュレーションされたデータセットは２００，２００のキメラＲＮＡペア包含し、その中で１３１，５７１のＲＮＡペアが検出された（感受性＝６５．７２％、特異性＝９２．５７％、図ＳＴ１−Ｃ）。各タイプのＲＮＡの相互作用についての感受性及び特異性も個別に計算した（図３３Ｃ）。関与するＲＮＡタイプに関わらず、この方法は偽陽性をほとんど示さなかった（特異性≧９０％）。トランスポゾンＲＮＡ又はｓｎＲＮＡに関与しなかった相互作用は、それに関与するものよりも少ない偽陰性を示した。これは、トランスポゾンとｓｎＲＮＡとの配列の反復的特性によるものであった。最悪のケースはＬＩＮＥＲＮＡに関与し、感受性が５２％に下落した。トランスポゾンＲＮＡに関与する相互作用の約半分がこの方法によって特定できなかったであろうということが控えめにも推測された。トランスポゾンＲＮＡに関与しない相互作用の約２／３〜３／４が特定されたであろうと推測された。

［ＲＡＰ−ｓｅｑによる検証］
マウスＥＳ細胞におけるＭａｌａｔ１ＲＡＰ−シーケンシング実験を行った。架橋後に、５つのアンチセンスオリゴヌクレオチドを用いてＭａｌａｔ１プルダウンを行い、そしてＭａｌａｔ１と共に精製された他のＲＮＡをシーケンシングした。対照として、アクチンＲＡＰ−シーケンシングを行った。Ｍａｌａｔ１ＲＮＡ自体は、アクチンＲＡＰ−ｓｅｑよりも、Ｍａｌａｔ１ＲＡＰ−ｓｅｑにおいて５．８１倍の増加を示し、精製の妥当性を確認した。ＲＮＡのＨｉ−Ｃにおいて、Ｔｆｒｃ、Ｓｌｃ２ａ３、Ｅｉｆ４ａ２、及び０６１０００７Ｐ１４ＲｉｋＲＮＡと相互作用する「ハブ」ｌｉｎｃＲＮＡとしてのＭａｌａｔ１が報告された。これらのＲＮＡは、アクチンＲＡＰ−ｓｅｑよりも、Ｍａｌａｔ１ＲＡＰ−ｓｅｑにおいて、１４．６（０６１０００７Ｐ１４Ｒｉｋ）、４．５３（Ｓｌｃ２ａ３）、３．３８（Ｅｉｆ４ａ２）、及び２．３９（Ｔｆｒｃ）倍の増加を示した（最大カイ二乗検定、ｐ値＜０．０００３）。これは、ＲＮＡのＨｉ−Ｃ及びＭａｌａｔ１ＲＡＰ−ｓｅｑから、Ｍａｌａｔ１標的の大きなオーバーラップを示唆する。

他の検証として、ＴｆｒｃＲＡＰ−ｓｅｑ実験を行った。Ｔｆｒｃは、ＲＮＡのＨｉ−ＣからＭａｌａｔ１相互作用ＲＮＡとして特定された（図１Ｄ）。Ｔｆｒｃプルダウンが逆にＭａｌａｔ１を特定可能かが検討された。ＴｆｒｃＲＮＡ自体は、アクチンＲＡＰ−ｓｅｑと比較してＴｆｒｃＲＡＰ−ｓｅｑにおいて２．８７倍の増加を示した。同じデータセットで、Ｍａｌａｔ１ＲＮＡは、ＴｆｒｃＲＡＰ−ｓｅｑをアクチンＲＡＰ−ｓｅｑと比較して、３．８４倍の増加を示した（ｐ値＜２．２×１０^−１６、帰無仮説倍率変化（ｆｏｌｄ−ｃｈａｎｇｅ）＝１をテストして得られた）。

ＲＮＡのＨｉ−Ｃによって特定されたようなＴｆｒｃと相互作用する他のＲＮＡを確認し、またＴｆｒｃＲＡＰ−ｓｅｑによって検証できた。ＲＮＡのＨｉ−Ｃデータは、Ｔｆｒｃと相互作用する全部で５つのＲＮＡを特定した。Ｍａｌａｔ１以外で、その他の４つはすべてｓｎｏＲＮＡ、つまりＳｎｏｒｄ１３、ＳＮＯＲＡ３、Ｓｎｏｒｄ５２、ＳＮＯＲＡ７４であった。アクチンＲＡＰ−ｓｅｑと比較されたＴｆｒｃＲＡＰ−ｓｅｑにおいて、これら４つのｓｎｏＲＮＡのうちの３つが倍の増加を示し（Ｓｎｏｒｄ１３について１．４倍、ＳＮＯＲＡ３について１３．６倍、ＳＮＯＲＡ７４について８．７倍）、これらの相互作用が確認された（カイ二乗検定、ｐ値＜０．００００２）。まとめると、ＲＡＰ−ｓｅｑにおいて、ほぼすべてのＲＮＡＨｉ−Ｃ特定相互作用が確認された。２タイプの実験（ＲＮＡのＨｉ−Ｃ及びＲＡＰ−ｓｅｑ）で、マウスＥＳ細胞において、（上述の）少数のＲＮＡ相互作用が「実体」として提示された。

［ｓｎｏＲＮＡ−ｍＲＮＡ相互作用とｍＲＮＡシュードウリジンとの比較］
シュードウリジル化（ｐｓｅｕｄｏｕｒｉｄｙｌａｔｉｏｎ）シーケンシングデータ（Ψ−ｓｅｑ）をＲＮＡ相互作用部位と比較した。Ｓｃｈｗａｒｔｚ等は、酵母及びマウスの骨髄由来樹状細胞（ＢＭＤＤＣ）において、Ψ−ｓｅｑを行った。ＢＭＤＤＣのΨ−ｓｅｑデータを回収し（ＣＭＣ処理ＧＳＭ１４６４２３４及び対照ＧＳＭ１４６４２３５）、文献に記載のバイオインフォマティク手法を用いて、シュードウリジン（Ψ−部位）と称した。簡潔に、正しい鎖と方向において「Ｕ」に隣接する５を超えるＣＭＣ処理リードを有し、３より大きいΨ−ｆｃ値を有するものとして、Ψ−部位を決定した。これにより、全部で８，１９４，１３１の「Ｕ」位置から３８６のΨ−部位がもたらされた（０．００４７１％の「Ｕ」がΨ−部位であった）。

次に、これらの３８６のΨ−部位を、ＲＮＡのＨｉ−Ｃ特定ＲＮＡ相互作用部位と比較した。Ψ−ｓｅｑ及びＲＮＡＨｉ−Ｃは異なる細胞型において行われるということが認められた。しかし、ＲＮＡ相互作用部位内において、全部で５５１，６３４の「Ｕ」のうちで、９３がΨ−部位であった（０．０１０９％）。ゆえに、ＲＮＡのＨｉ−Ｃによって決定されたＲＮＡ相互作用部位は、Ψ−部位に富むものであった（オッズ比＝４．４、カイ二乗検定ｐ値＝７．７０×１０^−９５）。

さらに、Ψ−部位が、ＲＮＡのＨｉ−Ｃによって検出されたｓｎｏＲＮＡ−ｍＲＮＡ相互作用に富むかが検討された。ｓｎｏＲＮＡ関与相互作用部位内において、全部で１３６，５３５の「Ｕ」のうち、５７のΨ−部位が存在した（０．０３８１％）。トランスクリプトーム全体と比較して、ＲＮＡのＨｉ−Ｃにより検出されたｓｎｏＲＮＡ関与相互作用部位は、非常にΨ−部位に富むものであった（オッズ比＝１０．２、カイ二乗検定ｐ値＜１×１０^−１００）。ｓｎｏＲＮＡはＲＮＡシュードウリジル化に寄与することで知られるが、これらのデータは、どのｓｎｏＲＮＡが具体的に原因となり得るかを示すものである（表１０）。

表１０は、Ψ−部位とＲＮＡ相互作用部位との関連性テストの２元分割表である。

ＲＮＡ分子間の相互作用は主要な調節の役割を発揮し、アルゴノートタンパク質（ＡＲＧＯＮＡＵＴＥ、ＡＧＯ）、ＰＵＭ２、ＱＫＩ、及びｓｎｏＲＮＰタンパク質（Ｍｅｉｓｔｅｒ，Ｇ．、Ａｒｇｏｎａｕｔｅｐｒｏｔｅｉｎｓ：ｆｕｎｃｔｉｏｎａｌｉｎｓｉｇｈｔｓａｎｄｅｍｅｒｇｉｎｇｒｏｌｅｓ．ＮａｔＲｅｖＧｅｎｅｔ１４、４４７−４５９、ｄｏｉ：１０．１０３８／ｎｒｇ３４６２（２０１３年）；Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ．Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｇｒａｎｎｅｍａｎ，Ｓ．、Ｋｕｄｌａ，Ｇ．、Ｐｅｔｆａｌｓｋｉ，Ｅ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＩｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｒｏｔｅｉｎｂｉｎｄｉｎｇｓｉｔｅｓｏｎＵ３ｓｎｏＲＮＡａｎｄｐｒｅ−ｒＲＮＡｂｙＵＶｃｒｏｓｓ−ｌｉｎｋｉｎｇａｎｄｈｉｇｈ−ｔｈｒｏｕｇｈｐｕｔａｎａｌｙｓｉｓｏｆｃＤＮＡｓ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１０６、９６１３−９６１８、ｄｏｉ：１０．１０７３／ｐｎａｓ．０９０１９９７１０６（２００９年）））などの、ＲＮＡ結合タンパク質によってしばしば媒介される（Ｒａｙ，Ｄ．等、ＡｃｏｍｐｅｎｄｉｕｍｏｆＲＮＡ−ｂｉｎｄｉｎｇｍｏｔｉｆｓｆｏｒｄｅｃｏｄｉｎｇｇｅｎｅｒｅｇｕｌａｔｉｏｎ．Ｎａｔｕｒｅ４９９、１７２−１７７、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２３１１（２０１３年））。ＰＡＲ−ＣＬＩＰ４、ＨＩＴＳ−ＣＬＩＰ６、及びＣＬＡＳＨ７，８，などの近年の進展にも関わらず、すべてのタンパク質補助ＲＮＡ−ＲＮＡ相互作用をマッピングするには困難な課題が残る（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ．Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ．Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年）；Ｈｅｌｗａｋ，Ａ．、Ｋｕｄｌａ，Ｇ．、Ｄｕｄｎａｋｏｖａ，Ｔ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＭａｐｐｉｎｇｔｈｅｈｕｍａｎｍｉＲＮＡｉｎｔｅｒａｃｔｏｍｅｂｙＣＬＡＳＨｒｅｖｅａｌｓｆｒｅｑｕｅｎｔｎｏｎｃａｎｏｎｉｃａｌｂｉｎｄｉｎｇ．Ｃｅｌｌ１５３、６５４−６６５，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１３．０３．０４３（２０１３年）；Ｋｕｄｌａ，Ｇ．、Ｇｒａｎｎｅｍａｎ，Ｓ．、Ｈａｈｎ，Ｄ．、Ｂｅｇｇｓ，Ｊ．Ｄ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、Ｃｒｏｓｓ−ｌｉｎｋｉｎｇ，ｌｉｇａｔｉｏｎ，ａｎｄｓｅｑｕｅｎｃｉｎｇｏｆｈｙｂｒｉｄｓｒｅｖｅａｌｓＲＮＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓｉｎｙｅａｓｔ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０８、１００１０−１００１５、ｄｏｉ：１０．１０７３／ｐｎａｓ．１０１７３８６１０８（２０１１年））。これら３つの手法のそれぞれにおいて、実験ごとに、１つのＲＮＡ結合タンパク質により媒介される相互作用のみが解析可能である。ＨＩＴＳ−ＣＬＩＰ及びＰＡＲ−ＣＬＩＰは相互作用ＲＮＡペアを直接的にマッピングすることはできない。加えて、各実験には、タンパク質特異的抗体か（ＨＩＴＳ−ＣＬＩＰ又はＰＡＲ−ＣＬＩＰ）、又は形質転換細胞株におけるタグ付きタンパク質の安定的な発現（ＣＬＡＳＨ）のいずれかが要求される。

以前の手法は、提案された相互作用の１又は複数の成分の異所性発現がしばしば必要とされるものである。そうした方法は、ルシフェラーゼレポーターアッセイを含み、合成ＲＮＡの使用が標的捕捉を再現する（Ｎｉｃｏｌａｓ，Ｆ．Ｅ．、ＥｘｐｅｒｉｍｅｎｔａｌｖａｌｉｄａｔｉｏｎｏｆｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｕｓｉｎｇａｌｕｃｉｆｅｒａｓｅｒｅｐｏｒｔｅｒｓｙｓｔｅｍ．Ｍｅｔｈｏｄｓｉｎｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ７３２、１３９−１５２、ｄｏｉ：１０．１００７／９７８−１−６１７７９−０８３−６＿１１（２０１１年）；Ｌａｌ，Ａ．等、ＣａｐｔｕｒｅｏｆｍｉｃｒｏＲＮＡ−ｂｏｕｎｄｍＲＮＡｓｉｄｅｎｔｉｆｉｅｓｔｈｅｔｕｍｏｒｓｕｐｐｒｅｓｓｏｒｍｉＲ−３４ａａｓａｒｅｇｕｌａｔｏｒｏｆｇｒｏｗｔｈｆａｃｔｏｒｓｉｇｎａｌｉｎｇ．ＰＬｏＳＧｅｎｅｔ７、ｅ１００２３６３、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｇｅｎ．１００２３６３（２０１１年））。異所性発現が内在性発現レベルを再現することは稀であることから、これらの結果を、インビボの相互作用というより潜在的相互作用として理解することが賢明である。ｍｉＲＮＡが多くのｍＲＮＡと「乱雑に」相互作用する傾向があるという前提は、主に異所性発現を用いたデータ由来であるということが言及される（Ｄｕ，Ｔ．＆Ｚａｍｏｒｅ，Ｐ．Ｄ．、ＢｅｇｉｎｎｉｎｇｔｏｕｎｄｅｒｓｔａｎｄｍｉｃｒｏＲＮＡｆｕｎｃｔｉｏｎ．ＣｅｌｌＲｅｓ１７、６６１−６６３、ｄｏｉ：１０．１０３８／ｃｒ．２００７．６７（２００７年））。

インビボでのタンパク質補助ＲＮＡ−ＲＮＡ相互作用を検出するために、ＲＮＡのＨｉ−Ｃ法はもたらされた。この方法では、ＲＮＡ分子がその結合タンパク質と架橋され、ビオチン化ＲＮＡリンカーにライゲーションされ、同じタンパク質によって共結合されたＲＮＡ分子が、ＲＮＡ１−リンカー−ＲＮＡ２形態のキメラＲＮＡを形成する。これらのリンカー包含キメラＲＮＡはストレプトアビジン被膜磁性ビーズを用いて単離され、ペアエンドシーケンシングを受ける（方法、図１Ａ、図７）。このように、各非重複ペアエンドリードが分子相互作用を反映する。この技術の一部の設計態様は、染色体高次構造捕捉（ｃｈｒｏｍｏｓｏｍｅｃｏｎｆｏｒｍａｔｉｏｎｃａｐｔｕｒｅ）法により着想を得たものである（Ｋａｌｈｏｒ，Ｒ．、Ｔｊｏｎｇ，Ｈ．、Ｊａｙａｔｈｉｌａｋａ，Ｎ．、Ａｌｂｅｒ，Ｆ．＆Ｃｈｅｎ，Ｌ．、Ｇｅｎｏｍｅａｒｃｈｉｔｅｃｔｕｒｅｓｒｅｖｅａｌｅｄｂｙｔｅｔｈｅｒｅｄｃｈｒｏｍｏｓｏｍｅｃｏｎｆｏｒｍａｔｉｏｎｃａｐｔｕｒｅａｎｄｐｏｐｕｌａｔｉｏｎ−ｂａｓｅｄｍｏｄｅｌｉｎｇ．Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ３０、９０−９８、ｄｏｉ：１０．１０３８／ｎｂｔ．２０５７（２０１２年）；Ｂｅｌｔｏｎ，Ｊ．Ｍ．等、Ｈｉ−Ｃ：ａｃｏｍｐｒｅｈｅｎｓｉｖｅｔｅｃｈｎｉｑｕｅｔｏｃａｐｔｕｒｅｔｈｅｃｏｎｆｏｒｍａｔｉｏｎｏｆｇｅｎｏｍｅｓ．Ｍｅｔｈｏｄｓ５８、２６８−２７６、ｄｏｉ：１０．１０１６／ｊ．ｙｍｅｔｈ．２０１２．０５．００１（２０１２年））。

ＲＮＡのＨｉ−Ｃ法には、ＲＮＡ−ＲＮＡ相互作用をマッピングするためのいくつかの有利性がある。第１に、ＲＮＡのＨｉ−Ｃでは、架橋前に任意の外来的ヌクレオチド又はタンパク質コード遺伝子を導入することなく、内在的細胞特性が直接的に解析される。（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ．Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｈｅｌｗａｋ，Ａ．、Ｋｕｄｌａ，Ｇ．、Ｄｕｄｎａｋｏｖａ，Ｔ．＆Ｔｏｌｌｅｒｖｅｙ，Ｄ．、ＭａｐｐｉｎｇｔｈｅｈｕｍａｎｍｉＲＮＡｉｎｔｅｒａｃｔｏｍｅｂｙＣＬＡＳＨｒｅｖｅａｌｓｆｒｅｑｕｅｎｔｎｏｎｃａｎｏｎｉｃａｌｂｉｎｄｉｎｇ．Ｃｅｌｌ１５３、６５４−６６５、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１３．０３．０４３（２０１３年）；Ｌａｌ，Ａ．等、ＣａｐｔｕｒｅｏｆｍｉｃｒｏＲＮＡ−ｂｏｕｎｄｍＲＮＡｓｉｄｅｎｔｉｆｉｅｓｔｈｅｔｕｍｏｒｓｕｐｐｒｅｓｓｏｒｍｉＲ−３４ａａｓａｒｅｇｕｌａｔｏｒｏｆｇｒｏｗｔｈｆａｃｔｏｒｓｉｇｎａｌｉｎｇ．ＰＬｏＳＧｅｎｅｔ７、ｅ１００２３６３、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｇｅｎ．１００２３６３（２０１１年）；Ｂａｉｇｕｄｅ，Ｈ．、Ａｈｓａｎｕｌｌａｈ，Ｌｉ，Ｚ．、Ｚｈｏｕ，Ｙ．＆Ｒａｎａ，Ｔ．Ｍ．、ｍｉＲ−ＴＲＡＰ：ａｂｅｎｃｈｔｏｐｃｈｅｍｉｃａｌｂｉｏｌｏｇｙｓｔｒａｔｅｇｙｔｏｉｄｅｎｔｉｆｙｍｉｃｒｏＲＮＡｔａｒｇｅｔｓ．ＡｎｇｅｗＣｈｅｍＩｎｔＥｄＥｎｇｌ５１、５８８０−５８８３、ｄｏｉ：１０．１００２／ａｎｉｅ．２０１２０１５１２（２０１２年））。このため、ＲＮＡ又はタンパク質発現レベルを変化させることで発生する偽相互作用をレポートするという不確実性が除かれる。さらに、ＲＮＡのＨｉ−Ｃを組織サンプル解析によく適応させる。第２に、選択マーカーとしてビオチン化リンカーを使用することで、タンパク質特的抗体の必要性又はタグ付きタンパク質を発現する必要性が退けられる。このため、ＲＮＡ−ＲＮＡインタラクトームの偏りのないマッピングが可能になる。文献に記載されるように、その他の方法は、一度に１つのＲＮＡ結合タンパク質を扱えるのみであり得る。第３として、同じ単一のタンパク質分子によってまとめられたＲＮＡのみが捕捉され、同じタンパク質の異なるコピーに独立的に結合される独立ＲＮＡ分子を捕捉することを避ける（前述の偽相互作用をもたらし得る）（Ｈａｆｎｅｒ，Ｍ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＲＮＡ−ｂｉｎｄｉｎｇｐｒｏｔｅｉｎａｎｄｍｉｃｒｏＲＮＡｔａｒｇｅｔｓｉｔｅｓｂｙＰＡＲ−ＣＬＩＰ．Ｃｅｌｌ１４１、１２９−１４１、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１０．０３．００９（２０１０年）；Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ．Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年））。第４として、高希薄条件においてストレプトアビジンビーズにＲＮＡライゲーションステップを行うことで、他の近接するＲＮＡに無作為にライゲーションするＲＮＡからもたらされる偽陽性が最小化される。第５として、ＲＮＡリンカーは、ライゲーション部位にわたるシーケンシングリードを表す明確な境界を与えることで、シーケンシングリードのマッピングにおける不明確さを退ける。第６として、ＰＣＲ増幅前に、無作為の６つのヌクレオチドバーコードを各キメラＲＮＡに付加し、続いて同一のバーコードを有する完全にオーバーラップするシーケンシングリードを１度のみ計数することで、潜在的ＰＣＲ増幅バイアスが除かれる（Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ．Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年）；Ｌｏｅｂ，Ｇ．Ｂ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｍｉＲ−１５５ｂｉｎｄｉｎｇｍａｐｒｅｖｅａｌｓｗｉｄｅｓｐｒｅａｄｎｏｎｃａｎｏｎｉｃａｌｍｉｃｒｏＲＮＡｔａｒｇｅｔｉｎｇ．ＭｏｌＣｅｌｌ４８、７６０−７７０、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１２．１０．００２（２０１２年）；Ｗａｎｇ，Ｚ．等、ｉＣＬＩＰｐｒｅｄｉｃｔｓｔｈｅｄｕａｌｓｐｌｉｃｉｎｇｅｆｆｅｃｔｓｏｆＴＩＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓ．ＰＬｏＳＢｉｏｌ８、ｅ１０００５３０、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｂｉｏ．１０００５３０（２０１０年）；Ｋｏｎｉｇ，Ｊ．等、ｉＣＬＩＰｒｅｖｅａｌｓｔｈｅｆｕｎｃｔｉｏｎｏｆｈｎＲＮＰｐａｒｔｉｃｌｅｓｉｎｓｐｌｉｃｉｎｇａｔｉｎｄｉｖｉｄｕａｌｎｕｃｌｅｏｔｉｄｅｒｅｓｏｌｕｔｉｏｎ．ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ１７、９０９−９１５、ｄｏｉ：１０．１０３８／ｎｓｍｂ．１８３８（２０１０年））。

例示の実施形態において、ＥＳ‐１及びＥＳ−２として示される、技術上僅かな違いのあるマウスの胚性幹（ＥＳ）細胞において、２つの独立的なＲＮＡＨｉ−Ｃアッセイが行われた（表５、図９〜１２）。ＲＮＡ非直接相互作用のライブラリが、「複数のタンパク質中間体を介して非直接的に結合したＲＮＡを効率的に捕捉する」（ＥＳ−インダイレクト）２つの架橋剤（ホルムアルデヒド及びＥＧＳ）を用いて、生成された（Ｅｎｇｒｅｉｔｚ，Ｊ．Ｍ．等、ＲＮＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓｅｎａｂｌｅｓｐｅｃｉｆｉｃｔａｒｇｅｔｉｎｇｏｆｎｏｎ−ｃｏｄｉｎｇＲＮＡｓｔｏｎａｓｃｅｎｔＰｒｅ−ｍＲＮＡｓａｎｄｃｈｒｏｍａｔｉｎｓｉｔｅｓ、Ｃｅｌｌ１５９、１８８−１９９、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１４．０８．０１８（２０１４年）；Ｎｏｗａｋ，Ｄ．Ｅ．、Ｔｉａｎ，Ｂ．＆Ｂｒａｓｉｅｒ，Ａ．Ｒ．、Ｔｗｏ−ｓｔｅｐｃｒｏｓｓ−ｌｉｎｋｉｎｇｍｅｔｈｏｄｆｏｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＮＦ−ｋａｐｐａＢｇｅｎｅｎｅｔｗｏｒｋｂｙｃｈｒｏｍａｔｉｎｉｍｍｕｎｏｐｒｅｃｉｐｉｔａｔｉｏｎ、Ｂｉｏｔｅｃｈｎｉｑｕｅｓ３９、７１５−７２５（２００５年）；Ｚｅｎｇ，Ｐ．Ｙ．、Ｖａｋｏｃ，Ｃ．Ｒ．、Ｃｈｅｎ，Ｚ．Ｃ．、Ｂｌｏｂｅｌ，Ｇ．Ａ．＆Ｂｅｒｇｅｒ，Ｓ．Ｌ、Ｉｎｖｉｖｏｄｕａｌｃｒｏｓｓ−ｌｉｎｋｉｎｇｆｏｒｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｉｎｄｉｒｅｃｔＤＮＡ−ａｓｓｏｃｉａｔｅｄｐｒｏｔｅｉｎｓｂｙｃｈｒｏｍａｔｉｎｉｍｍｕｎｏｐｒｅｃｉｐｉｔａｔｉｏｎ、ＢｉｏＴｅｃｈｎｉｑｕｅｓ４１、６９４−６９８（２００６年）；Ｚｈａｏ，Ｊ．等、Ｇｅｎｏｍｅ−ｗｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｏｌｙｃｏｍｂ−ａｓｓｏｃｉａｔｅｄＲＮＡｓｂｙＲＩＰ−ｓｅｑ、ＭｏｌＣｅｌｌ４０、９３９−９５３、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１０．１２．０１１（２０１０年））。マウス胚性線維芽細胞（ＭＥＦ）とマウスの脳とから、２つの他の固有ライブラリが生成され、バイオインフォマティクス品質評価のためにさらに２つのデータセットを提供した（図１３）。各ライブラリは、所望の形態（ＲＮＡ１−リンカー−ＲＮＡ２）及び長さのＲＮＡ構築物を含むことが確認された（図１Ｂ）。各ライブラリは、平均で、４７３０万のペアエンドリードを産生するためにシーケンシングされ、その中で、約１５１０万の非重複ペアエンドリードが所望のキメラ形態を表した（図１Ｃ）。加えて、３つの対照実験が行われた。第１及び第２の対照実験は、それぞれ架橋ステップ（非架橋対照）、タンパク質のビオチン化ステップ（非ビオチン化対照）を排除した（ＲＮＡのＨｉ−Ｃの対照実験）。第３の対照実験は、ショウジョウバエＳ２細胞とマウスＥＳ細胞をを用いてＲＮＡの無作為ライゲーションの規模をテストした（異種対照）。架橋後、タンパク質のビオチン化及び近接ライゲーション前に２つの細胞株の溶解物を混合した。混合物に残りの実験手順を行い、配列ライブラリを得た（Ｆｌｙ−Ｍｍ）。２種にマッピングされたＲＮＡペアの割合（偽陽性）は０．５２％であった。しかしながら、ＥＳ−１配列ライブラリに同じインフォマティクス解析を行ったとき、０．５５％のＲＮＡペアが２種（マウス及びハエゲノム）にマッピングされ、実験的偽陽性（おそらく無作為ライゲーションのため）がインフォマティクス手法のエラー範囲より少ないということが示唆された（ＲＮＡのＨｉ−Ｃの対照実験）。

表５はＲＮＡのＨｉ−Ｃサンプルを示す。「リードペア総数」とは各サンプルのペアエンド配列リード数である。「ＲＮＡ１−リンカー−ＲＮＡ２形態の非重複リードペア数」とは、バイオインフォマティクスパイプラインの、ステップ４．キメラｃＤＮＡの解析の出力のペアエンドリード数である。

ＲＮＡのＨｉ−Ｃデータを解析し可視化するために、一連のバイオインフォマティクスツール（ＲＮＡ−ＨｉＣ−ツール）を作製した（図１４〜１５）。ＲＮＡ−ＨｉＣ−ツールは解析ステップを自動化し、該ステップは、ＰＣＲ重複除去、複合的サンプル分離、リンカー配列特定、ジャンクションリード分離、相互作用ＲＮＡの判定、統計評価実行、ＲＮＡ相互作用タイプのカテゴライズ、相互作用部位の判定、及びＲＮＡ構造の解析（方法）を含む。ＲＮＡ内のＲＮＡ−ＲＮＡインタラクトームと近位部位とについて、可視化ツールが提供される（図１６）。

ＲＮＡＨｉ−Ｃライブラリの５つが比較された。（リンカーの左右側のリード断片について個別に算出された）ＦＰＫＭの相関によると、ＥＳ−１及びＥＳ−２は最も類似するものであり、ＥＳ−インダイレクト、そしてＭＥＦ及び脳組織が後に続く（図１３）。ＥＳ−１から特定された相互作用ＲＮＡペアとＥＳ−２から特定された相互作用ＲＮＡペアとは強固なオーバーラップを示した（（ｐ−値＜１０−３５、並べ替え検定）（表６）。ＭＥＦにおいて特定された相関関係は、ＥＳサンプルのいずれかのものと有意にオーバーラップしなかった（各オーバーラップについてｐ値＝１、並べ替え検定）。例として、Ｔｒｉｍ２５ＲＮＡの３’ＵＴＲと核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）のＳｎｏｒａ１との相互作用は、ＥＳ−１及びＥＳ−２サンプルのそれぞれ２４及び２２のペアエンドリードによって裏付けられたが、ＥＳ−インダイレクト（２重架橋とＵＶ架橋との違い）又はＭＥＦライブラリでは検出されなかった（図１Ｃ）。Ｓｎｏｒａ１を含め、１７２の数のｓｎｏＲＮＡが、ＡＧＯＨＩＴＳ−ＣＬＩＰデータ（緑色のレーン、図１Ｃ）及び酵素処理された小型ＲＮＡ（赤色のレーン、図１Ｃ、図１７〜１９）において検出され、ｍＲＮＡと相互作用したとして特定された（Ｙｕ，Ｐ．等、Ｓｐａｔｉｏｔｅｍｐｏｒａｌｃｌｕｓｔｅｒｉｎｇｏｆｔｈｅｅｐｉｇｅｎｏｍｅｒｅｖｅａｌｓｒｕｌｅｓｏｆｄｙｎａｍｉｃｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｇｅｎｏｍｅｒｅｓ２３、３５２−３６４、ｄｏｉ：１０．１１０１／ｇｒ．１４４９４９．１１２（２０１３年））。これは、ｓｎｏＲＮＡ遺伝子からの転写物がｍｉＲＮＡ様小型ＲＮＡへと酵素処理され、ＲＩＳＣ複合体においてｍＲＮＡと相互作用し得たという提示を裏付ける（Ｅｎｄｅｒ，Ｃ．等、ＡｈｕｍａｎｓｎｏＲＮＡｗｉｔｈｍｉｃｒｏＲＮＡ−ｌｉｋｅｆｕｎｃｔｉｏｎｓ、ＭｏｌＣｅｌｌ３２、５１９−５２８、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２００８．１０．０１７（２００８年）；Ｂｒａｍｅｉｅｒ，Ｍ．、Ｈｅｒｗｉｇ，Ａ．、Ｒｅｉｎｈａｒｄｔ，Ｒ．、Ｗａｌｔｅｒ，Ｌ．＆Ｇｒｕｂｅｒ，Ｊ．、ＨｕｍａｎｂｏｘＣ／ＤｓｎｏＲＮＡｓｗｉｔｈｍｉＲＮＡｌｉｋｅｆｕｎｃｔｉｏｎｓ：ｅｘｐａｎｄｉｎｇｔｈｅｒａｎｇｅｏｆｒｅｇｕｌａｔｏｒｙＲＮＡｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３９、６７５−６８６、ｄｏｉ：１０．１０９３／ｎａｒ／ｇｋｑ７７６（２０１１年））。（ｍｉＲＮＡ様相互作用を有する他のＲＮＡ）
表６は２つのゲノムにマッピングされたリードペアの分布を示す。この表に含まれないリードは、いずれのゲノムにもマッピングできないか、又は両ゲノムにマッピングされた同じＲＮＡ部分を有するかのいずれかであった。ＲＮＡ部分はリンカー配列のいずれかの側のリード配列である。

ＥＳ−１及びＥＳ−２ライブラリは、ＥＳ細胞におけるＲＮＡインタラクトームを推定するために統合された。このデータは、両断片が独自にゲノム（ｍｍ９）をマッピングする２つのＲＮＡ断片に明確に分離された４５４万の非重複ペアエンドリードを包含する。４６，７８０のＲＮＡ間相互作用が特定された（ＦＤＲ＜０．０５、ベンジャミン及びホッホバーグ補正を伴うフィッシャーの正確検定）（図２０）。予期されたように、ＲＮＡ発現レベル（ＦＰＫＭ）は、各ＲＮＡのＲＮＡＨｉ−Ｃリード数との相関が弱いが、ＦＰＫＭは相互作用の統計的有意性（ＦＤＲ）と相関しない（図２０Ｃ〜図２０Ｄ）。ｍＲＮＡ−ｓｎｏＲＮＡ相互作用は最も豊富なタイプであったが、数千のｍＲＮＡ−ｍＲＮＡ、及び数百のｌｉｎｃＲＮＡ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、ｍｉＲＮＡ−ｍＲＮＡの相互作用も検出された（図２１）。これはおそらく、任意の生体について記載される最初のＲＮＡ−ＲＮＡインタラクトームである。シミュレーションにより、実験及び分析手法全体について、約６６％の感受性と９３％の特異性が示唆された（ＲＮＡのＨｉ−Ｃのシミュレーション分析）。

より大きな規模で相互作用を確認するために、ＲＮＡアンチセンスオリゴヌクレオチド精製シーケンシングを行った（ＲＡＰ−ｓｅｑ）（Ｅｎｇｒｅｉｔｚ，Ｊ．Ｍ．等、ＲＮＡ−ＲＮＡｉｎｔｅｒａｃｔｉｏｎｓｅｎａｂｌｅｓｐｅｃｉｆｉｃｔａｒｇｅｔｉｎｇｏｆｎｏｎｃｏｄｉｎｇＲＮＡｓｔｏｎａｓｃｅｎｔＰｒｅ−ｍＲＮＡｓａｎｄｃｈｒｏｍａｔｉｎｓｉｔｅｓ．Ｃｅｌｌ１５９、１８８−１９９、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１４．０８．０１８（２０１４年））。まず、Ｍａｌａｔ１ＲＡＰ−ｓｅｑとＡｃｔｂＲＡＰ−ｓｅｑ（対照）とが行われて、Ｍａｌａｔ１に関与する相互作用をテストした（ｓｎｏＲＮＡ−ｍＲＮＡ相互作用とｍＲＮＡシュードウリジンとの比較）。Ｍａｌａｔ１ＲＮＡ自体は、ＡｃｔｂＲＡＰ−ｓｅｑよりもＭａｌａｔ１ＲＡＰ−ｓｅｑにおいて５．８１倍の増加を示し、精製の妥当性を確認した。ＲＮＡのＨｉ−Ｃが示すＭａｌａｔ１相互作用ＲＮＡは（図１Ｄ）、ＡｃｔｂＲＡＰ−ｓｅｑよりも、Ｍａｌａｔ１ＲＡＰ−ｓｅｑにおいて、１４．６（０６１０００７Ｐ１４Ｒｉｋ）、４．５３（Ｓｌｃ２ａ３）、３．３８（Ｅｉｆ４ａ２）、及び２．３９（Ｔｆｒｃ）倍の増加を示した（ｐ値＜０．０００３、カイ二乗検定）。これは、ＲＮＡのＨｉ−Ｃ及びＭａｌａｔ１ＲＡＰ−ｓｅｑにおける、Ｍａｌａｔ１標的の大きなオーバーラップを示唆する。次に、ＴｆｒｃＲＡＰ−ｓｅｑによって、ＴｆｒｃＲＡＰが逆にＭａｌａｔ１を特定し得るかが検討された（ｓｎｏＲＮＡ−ｍＲＮＡ相互作用とｍＲＮＡシュードウリジンとの比較）。ＴｆｒｃＲＮＡ自体は、ＡｃｔｂＲＡＰ−ｓｅｑと比較してＴｆｒｃＲＡＰ−ｓｅｑにおいて２．８７倍の増加を示した。Ｍａｌａｔ１は３．８４倍の増加を示した（ｐ値＜２．２×１０−１６、帰無仮説倍率変化（ｆｏｌｄ−ｃｈａｎｇｅ）＝１をテストして得られた）。さらに、ＲＮＡのＨｉ−Ｃによって特定された他の４つのＴｆｒｃ相互作用ＲＮＡのうちの３つが、１．４〜１３．６倍の増加を示した（ｐ値＜０．００００２、カイ二乗検定）。合わせて、ＲＡＰ−ｓｅｑによって、追加の７つのＲＮＡＨｉ−Ｃ特定相互作用が確認された。

ＲＮＡ−ＲＮＡ相互作用は「驚くほど乱雑な」ものとして報告されている（Ｄｕ，Ｔ．＆Ｚａｍｏｒｅ，Ｐ．Ｄ．、ＢｅｇｉｎｎｉｎｇｔｏｕｎｄｅｒｓｔａｎｄｍｉｃｒｏＲＮＡｆｕｎｃｔｉｏｎ．ＣｅｌｌＲｅｓ１７、６６１−６６３、ｄｏｉ：１０．１０３８／ｃｒ．２００７．６７（２００７年））。１つの細胞型において、各ｍｉＲＮＡは３００〜１０００のｍＲＮＡと相互作用することが示唆され、類似する事項がｌｉｎｃＲＮＡについて提示された（Ｃｈｉ，Ｓ．Ｗ．、Ｚａｎｇ，Ｊ．Ｂ．、Ｍｅｌｅ，Ａ．＆Ｄａｒｎｅｌｌ，Ｒ．Ｂ．、ＡｒｇｏｎａｕｔｅＨＩＴＳ−ＣＬＩＰｄｅｃｏｄｅｓｍｉｃｒｏＲＮＡ−ｍＲＮＡｉｎｔｅｒａｃｔｉｏｎｍａｐｓ．Ｎａｔｕｒｅ４６０、４７９−４８６、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０８１７０（２００９年）；Ｇｕｔｔｍａｎ，Ｍ．等、Ｃｈｒｏｍａｔｉｎｓｉｇｎａｔｕｒｅｒｅｖｅａｌｓｏｖｅｒａｔｈｏｕｓａｎｄｈｉｇｈｌｙｃｏｎｓｅｒｖｅｄｌａｒｇｅｎｏｎ−ｃｏｄｉｎｇＲＮＡｓｉｎｍａｍｍａｌｓ．Ｎａｔｕｒｅ４５８、２２３−２２７、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０７６７２（２００９年））。しかしながら、観察されたＲＮＡ−ＲＮＡインタラクトーム（４６，７８０の相互作用）は、べき法則を満たす次数分布を伴う、スケールフリーなネットワークである（図１Ｄ、図３４）（Ｂａｒａｂａｓｉ，Ａ．Ｌ．＆Ｏｌｔｖａｉ，Ｚ．Ｎ．、Ｎｅｔｗｏｒｋｂｉｏｌｏｇｙ：ｕｎｄｅｒｓｔａｎｄｉｎｇｔｈｅｃｅｌｌ‘ｓｆｕｎｃｔｉｏｎａｌｏｒｇａｎｉｚａｔｉｏｎ．ＮａｔＲｅｖＧｅｎｅｔ５、１０１−１１３、ｄｏｉ：１０．１０３８／ｎｒｇ１２７２（２００４年））。換言すると、ＲＮＡ−ＲＮＡ相互作用において関与したＲＮＡの大部分は、具体的な相互作用パートナーを有し、所定数の相互作用パートナーを有するＲＮＡの数は、相互作用パートナーの数が増加すると指数関数的に減少する。この全体的な特性は、相互作用がｍＲＮＡ、ｌｉｎｃＲＮＡ、ｍｉＲＮＡ、偽遺伝子ＲＮＡ、及びａｎｄアンチセンス転写のみに制限されても変わらない（図１Ｄ）。さらに、マウスの脳由来のＲＮＡ−ＲＮＡインタラクトーム（５７，８３３の相互作用）はスケールフリーであり（図３４Ｂ）、この全体的な特性が細胞型特異的ではないことを示唆する。各細胞型において、大半のｍｉＲＮＡ及びｌｉｎｃＲＮＡは１〜３のｍＲＮＡと相互作用し、その８０％を超えるものが１つのｍＲＮＡと特異的に相互作用した（図１Ｅ）。つまり、「乱雑な」ＲＮＡは、ＲＮＡのＨｉ−Ｃ由来のＲＮＡ−ＲＮＡインタラクトームにおいて例外である。これは、以前の方法とは異なり、ＲＮＡのＨｉ−Ｃが、内在性細胞条件において各個々のタンパク質分子に共接着されたＲＮＡ分子を直接的に捕捉したためであるということが推測される。

相互作用ＲＮＡの大部分は（８３．０５％）、オーバーラップするＲＮＡＨｉ−Ｃリードを示し（図３Ａ）、相互作用はＲＮＡの特定のセグメントにしばしば集中するということが示唆される。オーバーラップリード断片の「ピーク」を特定し、と「相互作用部位」と呼称した（図３Ｂ）。相互作用部位は、ｍｉＲＮＡ（成熟ｍｉＲＮＡ全体）、ｍＲＮＡ、ｌｉｎｃＲＮＡだけでなく、偽遺伝子及びトランスポゾンＲＮＡにも現れた（図３Ｃ）。２０００を超える相互作用部位が、Ｌ１、ＳＩＮＥ、ＥＲＶＫ、ＭａＬＲ、及びＥＲＶ１トランスポゾンＲＮＡにあり（表７）、その他のＲＮＡとの頻繁な相互作用が示唆される（Ｓｈａｌｇｉ，Ｒ．、Ｐｉｌｐｅｌ，Ｙ．＆Ｏｒｅｎ，Ｍ．、Ｒｅｐｒｅｓｓｉｏｎｏｆｔｒａｎｓｐｏｓａｂｌｅ−ｅｌｅｍｅｎｔｓ−ａｍｉｃｒｏＲＮＡａｎｔｉ−ｃａｎｃｅｒｄｅｆｅｎｓｅｍｅｃｈａｎｉｓｍ？Ｔｒｅｎｄｓｉｎｇｅｎｅｔｉｃｓ：ＴＩＧ２６、２５３−２５９、ｄｏｉ：１０．１０１６／ｊ．ｔｉｇ．２０１０．０３．００６（２０１０年）；Ｙｕａｎ，Ｚ．、Ｓｕｎ，Ｘ．、Ｌｉｕ，Ｈ．＆Ｘｉｅ，Ｊ．、ＭｉｃｒｏＲＮＡｇｅｎｅｓｄｅｒｉｖｅｄｆｒｏｍｒｅｐｅｔｉｔｉｖｅｅｌｅｍｅｎｔｓａｎｄｅｘｐａｎｄｅｄｂｙｓｅｇｍｅｎｔａｌｄｕｐｌｉｃａｔｉｏｎｅｖｅｎｔｓｉｎｍａｍｍａｌｉａｎｇｅｎｏｍｅｓ、ＰｌｏＳｏｎｅ６、ｅ１７６６６、ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００１７６６６（２０１１年））。さらに、シュードウリジンは、ｓｎｏＲＮＡ−ｍＲＮＡ相互作用のｍＲＮＡ相互作用部位において濃縮され、一部のＲＮＡセグメントが所定のタイプのＲＮＡ相互作用に有利に働くという考えを確かにする（Ｓｃｈｗａｒｔｚ，Ｓ．等、Ｔｒａｎｓｃｒｉｐｔｏｍｅ−ｗｉｄｅｍａｐｐｉｎｇｒｅｖｅａｌｓｗｉｄｅｓｐｒｅａｄｄｙｎａｍｉｃ−ｒｅｇｕｌａｔｅｄｐｓｅｕｄｏｕｒｉｄｙｌａｔｉｏｎｏｆｎｃＲＮＡａｎｄｍＲＮＡ．Ｃｅｌｌ１５９、１４８−１６２、ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１４．０８．０２８（２０１４年））。

表７は、種々のタイプの遺伝子及びトランスポゾンにおける相互作用部位の分布を示す。Ｎｏｖｅｌは未アノテーション遺伝子領域を示す。

異なるタイプのＲＮＡ−ＲＮＡ相互作用により塩基の相補性が用いられるかが問われた。相互作用ＲＮＡペアのハイブリダイゼーションエネルギーは、ライケーションされた断片（ＲＮＡ１、ＲＮＡ２）のペアの平均ハイブリダイゼーションエネルギーによって推定され、塩基の無作為シャッフルによって生成された対照ＲＮＡのハイブリダイゼーションエネルギーと比較された（Ｒａｙ，Ｄ．等、ＡｃｏｍｐｅｎｄｉｕｍｏｆＲＮＡ−ｂｉｎｄｉｎｇｍｏｔｉｆｓｆｏｒｄｅｃｏｄｉｎｇｇｅｎｅｒｅｇｕｌａｔｉｏｎ、Ｎａｔｕｒｅ４９９、１７２−１７７、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２３１１（２０１３年）；Ｂｅｌｌａｏｕｓｏｖ，Ｓ．、Ｒｅｕｔｅｒ，Ｊ．Ｓ．、Ｓｅｅｔｉｎ，Ｍ．Ｇ．＆Ｍａｔｈｅｗｓ，Ｄ．Ｈ．、ＲＮＡｓｔｒｕｃｔｕｒｅ：ｗｅｂｓｅｒｖｅｒｓｆｏｒＲＮＡｓｅｃｏｎｄａｒｙｓｔｒｕｃｔｕｒｅｐｒｅｄｉｃｔｉｏｎａｎｄａｎａｌｙｓｉｓ、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ４１、Ｗ４７１−Ｗ４７４、ｄｏｉ：Ｄｏｉ１０．１０９３／Ｎａｒ／Ｇｋｔ２９０（２０１３年））。相補性塩基は、ほぼすべてのタイプのＲＮＡ−ＲＮＡ相互作用において好ましいものであり、トランスポゾンＲＮＡ−ｍＲＮＡ、ｍＲＮＡ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、ｌｉｎｃＲＮＡ−ｍＲＮＡ、ｍｉＲＮＡ−ｍＲＮＡ相互作用において最も見受けられる（ｐ値＜２．４^−１８）が、ＬＴＲ−偽遺伝子ＲＮＡ相互作用では観察されなかった（図３Ｄ、図２４）。このデータは、塩基対形成が、長鎖ＲＮＡにおける配列特異的転写後調節を促すという新しいメカニズムを示唆するものである。

これらのＲＮＡ−ＲＮＡ相互作用が配列特異的である場合、ＲＮＡ相互作用部位は選択圧力下にあるはずである（Ｇｏｎｇ，Ｃ．＆Ｍａｑｕａｔ，Ｌ．Ｅ．、ｌｎｃＲＮＡｓｔｒａｎｓａｃｔｉｖａｔｅＳＴＡＵ１−ｍｅｄｉａｔｅｄｍＲＮＡｄｅｃａｙｂｙｄｕｐｌｅｘｉｎｇｗｉｔｈ３’ ＵＴＲｓｖｉａＡｌｕｅｌｅｍｅｎｔｓ、Ｎａｔｕｒｅ４７０、２８４−２８８、ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０９７０１（２０１１年））。種間保存レベルは相互作用部位において大きく増加し、保存のピークは、２つのＲＮＡ断片の接合部を正確に指し示すということが分かった（図３Ｄ）（Ｃｏｏｐｅｒ，Ｇ．Ｍ．等、Ｄｉｓｔｒｉｂｕｔｉｏｎａｎｄｉｎｔｅｎｓｉｔｙｏｆｃｏｎｓｔｒａｉｎｔｉｎｍａｍｍａｌｉａｎｇｅｎｏｍｉｃｓｅｑｕｅｎｃｅ．Ｇｅｎｏｍｅｒｅｓ１５、９０１−９１３、ｄｏｉ：１０．１１０１／ｇｒ．３５７７４０５（２００５年））。ｌｉｎｃＲＮＡ、偽遺伝子ＲＮＡ、トランスポゾンＲＮＡ、又は他のｍＲＮＡと相互作用するとき、ｍＲＮＡの相互作用部位は、転写物の残余部分よりも保存された（図２５）。ｌｉｎｃＲＮＡ及び偽遺伝子ＲＮＡの相互作用部位では、ｌｉｎｃＲＮＡｓ−ｍＲＮＡ、偽遺伝子ＲＮＡ−ｍＲＮＡ、及び偽遺伝子ＲＮＡ−トランスポゾンＲＮＡ相互作用において、大きく保存された（図２５）。相互作用部位における保存の増大は、エクソン−イントロン境界によるものではなかった（図２６）。考え合わせると、長鎖ＲＮＡの相互作用において、塩基の相補性が広まる。相補領域は進化的に保存される。

ＲＮＡのＨｉ−Ｃ設計は、本質的に、分子間相互作用をマッピングするためのものであるが、ＲＮＡのＨｉ−ＣがＲＮＡの２次構造及び３次構造を明らかにすることが分かった。上述のすべての分析は、分子間リードに基づく。分子内リードを見ることで、ＲＮＡ構造の２つの特徴が理解された。まず、ＲＮａｓｅＩ消化部位の密度によって、ＲＮＡの１本鎖領域のフットプリントが特定された（ＲＮａｓｅＩ消化はライゲーション前に行われた。図１Ａのステップ２、図２７参照）。次に、各ＲＮＡの空間的近位部位を近接ライゲーションによって捕捉した（図１Ａのステップ５）。全部で６７，２２１のリードペアが個別の遺伝子にマッピングされたが、互いに２，０００ｂｐ内又は同じ鎖上でマッピングされず、ゆえに分子内切断及びライゲーションから生成されたものである（図２８）。切断及びライゲーション配列のそれぞれは、配列リードにおけるＲＮＡ１及びＲＮＡ２の配向とゲノムにおけるその配向とを比較することで、２つの構造分類の１つに明らかに割り当てられることができる（図４Ａ）。これらのリードは、１，６９６の既知の遺伝子と６７８の新規の遺伝子からのものを含む、２，３７４のＲＮＡに空間的近接情報を与えた。例として、２７７の切断及びライゲーション配列が、Ｓｎｏｒａ７３転写物から作製された（図４Ｂ）。ＲＮａｓｅＩ消化部位の密度（図４Ｃ）により、ＲＮＡの１本鎖領域が強く予測された（ヒートマップ、図４Ｅ）。６つの近位部位ペアが検出された（図４Ｄの丸）。各ペアは、オーバーラップライゲーション位置を有する３つ以上の切断及びライゲーション配列によってサポートされた（図４Ｂの黒い箇所）。６つの近位部位ペアのうち５つは、通常許容される２次構造において物理的に近接した（図４Ｅの同色矢印）。Ｓｎｏｒａ１４では、シーケンシングされた推定２次構造によると、推定近位部位のペアは離れているようであった（図２９）。しかしながら、リボ核タンパク質ＤＹＳＫＥＲＩＮは、インビボにおいてＳｎｏｒａ１４転写物を曲げ、切断及びライゲーション配列によって予測されたように、２つのシュードウリジル化（ｐｓｅｕｄｏｕｒｉｄｙｌａｔｉｏｎ）ループを互いに近づける（図４Ｆの矢印）（Ｋｉｓｓ，Ｔ．、Ｆａｙｅｔ−Ｌｅｂａｒｏｎ，Ｅ．＆Ｊａｄｙ，Ｂ．Ｅ．、ＢｏｘＨ／ＡＣＡｓｍａｌｌｒｉｂｏｎｕｃｌｅｏｐｒｏｔｅｉｎｓ、Ｍｏｌｃｅｌｌ３７、５９７−６０６、ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１０．０１．０３２（２０１０年））。構造情報も、ｍＲＮＡの新しい転写物及び一部分において得られ得る（図３０〜図３１）。現在のところ、任意の個々のＲＮＡの空間的近位塩基の決定は大きな課題としてある。ＥＳ細胞におけるＲＮＡのＨｉ−Ｃは、数千のＲＮＡについて分子内空間的近位情報を提供する。さらに、あらゆるＲＮＡの１本鎖フットプリントが共にマッピングされる。このように、ＲＮＡのＨｉ−Ｃにより、ＲＮＡ構造調査範囲が大きく広がった。

ＲＮＡ相互作用のマッピングに重要であるのは選択である。ＲＮＡのＨｉ−Ｃにおいて選択可能なリンカーを導入することで、相互作用ＲＮＡの偏りのない選択が可能になり、ＲＮＡ−ＲＮＡインタラクトームの全体的なマッピングを可能にする。ＥＳ細胞におけるＲＮＡ毎の相互作用パートナーの数は非常に不均衡であり、スケールフリーなＲＮＡネットワークをもたらす。長鎖ＲＮＡ間の相互作用では、転写物の小片がしばしば用いられた。タンパク質相互作用ドメインとの類似について、ＲＮＡ相互作用部位の概念が示された。ＲＮＡ相互作用部位では、長鎖ＲＮＡ相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。ＲＮＡ構造はＲＮＡのＨｉ−Ｃによってもマッピングされ得る。本明細書において、ＲＮＡがタンパク質によって曲げられ、そうした３次構造がＲＮＡＨｉ−Ｃの分子内リードによって明らかにされた実施例が示される。この方法とデータにより、ＲＮＡの機能と調節との役割調査が今後は非常に容易になるはずである。

ソフトウエアの利用
ＲＮＡのＨｉ−Ｃツールソフトウエアは、http://systemsbio.ucsd.edu/RNA-Hi-Cにおいて利用可能である。

上述されたことにより、本開示の種々の実施形態が例示を目的として本明細書に記載されたものであり、且つ本開示の範囲と趣旨とから離れることなく種々の変形が行われ得るということが理解され得る。従って、本明細書に記載の種々の実施形態は、以下の請求項によって示される真の範囲と趣旨とを限定することを意図しない。

［追加的実施形態］
一部の実施形態において、キメラＲＮＡを生成する方法は細胞において相互作用するＲＮＡを含み、該方法は、ＲＮＡをタンパク質に架橋することと、同じタンパク質分子に共に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成することとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質は少なくとも１つのシステインにおいてビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤とライゲーションすることをさらに含む。一部の実施形態において、ＲＮＡはビオチンタグ付きＲＮＡリンカーとライゲーションされる。一部の実施形態において、ビオチンタグ付きＲＮＡリンカーは２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、若しくは３０ヌクレオチド長、又は任意の前述の値の間の任意の長さである。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。一部の実施形態において、該方法は、ＤＮＡ混入を排除するためのＤＮＡｓｅ処理をさらに含む。一部の実施形態において、キメラＲＮＡの断片化は、ＲＮＡの部分的消化を促す条件下で、キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、キメラＲＮＡを逆転写してキメラｃＤＮＡを生成することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡ又はキメラｃＤＮＡにおけるＲＮＡのそれぞれに由来する、キメラＲＮＡ又はキメラｃＤＮＡの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡに存在するＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するＲＮＡが特定される。一部の実施形態において、細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、自動シーケンシング装置を用いて、キメラＲＮＡに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、ＲＮＡクラスタの直接相互作用を特定することをさらに含む。

一部の実施形態において、単離複合体が提供される。該単離複合体は、タンパク質に架橋されたキメラＲＮＡを含み得、該キメラＲＮＡは、細胞において相互作用するＲＮＡを含む。また単離複合体は、タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む複合体をも含み得、該核酸はＲＮＡである。一部の実施形態において、単離複合体は、タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体を含み、該核酸はＲＮＡである。

一部の実施形態において、候補治療剤を特定するための方法が提供され、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するＲＮＡを特定することと、ＲＮＡの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がＲＮＡの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するＲＮＡを特定する方法は、ＲＮＡをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成することとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチン含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。一部の実施形態において、キメラＲＮＡの断片化は、ＲＮＡの部分的消化を促す条件下で、キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法はキメラＲＮＡを逆転写してキメラｃＤＮＡを生成することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡ又はキメラｃＤＮＡにおけるＲＮＡのそれぞれに由来する、キメラＲＮＡ又はキメラｃＤＮＡの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡに存在するＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するＲＮＡが特定される。一部の実施形態において、細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、自動シーケンシング装置を用いて、キメラＲＮＡに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、ＲＮＡクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。

一部の実施形態において、医薬作製方法が提供され、該方法は本明細書に記載のいずれかの実施形態の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化することを含む。一部の実施形態において、特定された薬剤の製剤化は候補治療剤を特定するための方法によっておこなわれ、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するＲＮＡを特定することと、ＲＮＡの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がＲＮＡの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するＲＮＡを特定するための方法は、ＲＮＡをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成することとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。一部の実施形態において、キメラＲＮＡの断片化は、ＲＮＡの部分的消化を促す条件下で、キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法はキメラＲＮＡを逆転写してキメラｃＤＮＡを生成することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡ又はキメラｃＤＮＡにおけるＲＮＡのそれぞれに由来する、キメラＲＮＡ又はキメラｃＤＮＡの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡに存在するＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するＲＮＡが特定される。一部の実施形態において、細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、自動シーケンシング装置を用いて、キメラＲＮＡに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、ＲＮＡクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。

一部の実施形態において、医薬が提供され、該医薬は本明細書に記載のいずれかの実施形態の方法を用いて作製される。一部の実施形態において、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化することを含む。一部の実施形態において、特定された薬剤を製剤化することは、候補治療剤を特定するための方法によって行われ、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するＲＮＡを特定することと、ＲＮＡの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がＲＮＡの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するＲＮＡ特定する方法は、ＲＮＡをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成することとを含む。一部の実施形態において、ＲＮＡをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、同じタンパク質分子に架橋されたＲＮＡをＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。一部の実施形態において、キメラＲＮＡの断片化は、ＲＮＡの部分的消化を促す条件下で、キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法はキメラＲＮＡを逆転写してキメラｃＤＮＡを生成することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡ又はキメラｃＤＮＡにおけるＲＮＡのそれぞれに由来する、キメラＲＮＡ又はキメラｃＤＮＡの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡに存在するＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するＲＮＡが特定される。一部の実施形態において、細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、自動シーケンシング装置を用いて、キメラＲＮＡに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、ＲＮＡクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。

一部の実施形態において、細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法が提供され、該方法は、ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋することと、共にタンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成することとを含み、該タンパク質複合体は、２つ以上の相互作用タンパク質を含む。一部の実施形態において、ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はＵＶ架橋を含む。一部の実施形態において、該方法は、タンパク質中間体及び／又はタンパク質複合体の表面への固定化を促す薬剤に、タンパク質中間体及び／又はタンパク質複合体を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、少なくとも１つのタンパク質分子に架橋されたＲＮＡを断片化することをさらに含む。一部の実施形態において、断片化は、ＲＮＡの部分的消化を促す条件下で、タンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法は、タンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡを、ＲＮＡを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、ＲＮＡの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、ＲＮＡを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をＲＮＡの末端に結合することは、共にタンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成する前に、ビオチンを有する核酸を、ＲＮＡの５’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラＲＮＡの５’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラＲＮＡを回収することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡを断片化することをさらに含む。一部の実施形態において、キメラＲＮＡの断片化は、ＲＮＡの部分的消化を促す条件下で、キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む。一部の実施形態において、該方法はキメラＲＮＡを逆転写してキメラｃＤＮＡを生成することをさらに含む。一部の実施形態において、該方法は、キメラＲＮＡに存在するＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも１００、少なくとも５００、少なくとも１０００、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するＲＮＡが特定される。一部の実施形態において、細胞における、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、自動シーケンシング装置を用いて、キメラＲＮＡに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するＲＮＡの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、ＲＮＡクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、細胞において相互作用するＲＮＡは、タンパク質中間体又はタンパク質複合体において異なるタンパク質に架橋される。

一部の実施形態において、タンパク質中間体又はタンパク質複合体に架橋されたキメラＲＮＡを含む単離複合体が提供され、キメラＲＮＡは細胞において相互作用するＲＮＡを含み、タンパク質複合体は２つ以上の相互作用タンパク質を含む。一部の実施形態において、キメラＲＮＡは、前記タンパク質中間体又はタンパク質複合体において異なるタンパク質に架橋されるＲＮＡを含む。

本明細書に記載されるそれぞれの参考文献はその全体が言及によって本明細書に組み込まれる。

［参考文献］
1. Engreitz,J. M. et al. RNA-RNA interactions enable specific targeting of noncoding RNAsto nascent Pre-mRNAs and chromatin sites. Cell 159, 188-199,doi:10.1016/j.cell.2014.08.018 (2014).
2. Ray, D.et al. A compendium of RNA-binding motifs for decoding gene regulation. Nature499, 172-177, doi:10.1038/nature12311 (2013).
3. Meister,G. Argonaute proteins: functional insights and emerging roles. Nat Rev Genet14, 447-459, doi:10.1038/nrg3462 (2013).
4. Hafner,M. et al. Transcriptome-wide identification of RNA-binding protein and microRNAtarget sites by PAR-CLIP. Cell 141, 129-141, doi:10.1016/j.cell.2010.03.009(2010).
5. Granneman,S., Kudla, G., Petfalski, E. & Tollervey, D. Identification of proteinbinding sites on U3 snoRNA and pre-rRNA by UV cross-linking and high-throughputanalysis of cDNAs. Proceedings of the National Academy of Sciences of theUnited States of America 106, 9613-9618, doi:10.1073/pnas.0901997106 (2009).
6. Chi, S.W., Zang, J. B., Mele, A. & Darnell, R. B. Argonaute HITS-CLIP decodesmicroRNA-mRNA interaction maps. Nature 460, 479-486, doi:10.1038/nature08170(2009).
7. Helwak,A., Kudla, G., Dudnakova, T. & Tollervey, D. Mapping the human miRNAinteractome by CLASH reveals frequent noncanonical binding. Cell 153, 654-665,doi:10.1016/j.cell.2013.03.043 (2013).
8. Kudla,G., Granneman, S., Hahn, D., Beggs, J. D. & Tollervey, D. Cross-linking,ligation, and sequencing of hybrids reveals RNA-RNA interactions in yeast. ProcNatl Acad Sci U S A 108, 10010-10015, doi:10.1073/pnas.1017386108 (2011).
9. Nicolas,F. E. Experimental validation of microRNA targets using a luciferase reportersystem. Methods in molecular biology 732, 139-152,doi:10.1007/978-1-61779-083-6_11 (2011).
10. Lal, A.et al. Capture of microRNA-bound mRNAs identifies the tumor suppressor miR-34aas a regulator of growth factor signaling. PLoS Genet 7, e1002363,doi:10.1371/journal.pgen.1002363 (2011).
11. Du, T.& Zamore, P. D. Beginning to understand microRNA function. Cell Res 17,661-663, doi:10.1038/cr.2007.67 (2007).
12. Kalhor,R., Tjong, H., Jayathilaka, N., Alber, F. & Chen, L. Genome architecturesrevealed by tethered chromosome conformation capture and population-basedmodeling. Nature biotechnology 30, 90-98, doi:10.1038/nbt.2057 (2012).
13. Belton,J. M. et al. Hi-C: a comprehensive technique to capture the conformation ofgenomes. Methods 58, 268-276, doi:10.1016/j.ymeth.2012.05.001 (2012).
14. Baigude,H., Ahsanullah, Li, Z., Zhou, Y. & Rana, T. M. miR-TRAP: a benchtopchemical biology strategy to identify microRNA targets. Angew Chem Int Ed Engl51, 5880-5883, doi:10.1002/anie.201201512 (2012).
15. Loeb, G.B. et al. Transcriptome-wide miR-155 binding map reveals widespreadnoncanonical microRNA targeting. Mol Cell 48, 760-770,doi:10.1016/j.molcel.2012.10.002 (2012).
16. Wang, Z.et al. iCLIP predicts the dual splicing effects of TIA-RNA interactions. PLoSBiol 8, e1000530, doi:10.1371/journal.pbio.1000530 (2010).
17. Konig,J. et al. iCLIP reveals the function of hnRNP particles in splicing atindividual nucleotide resolution. Nat Struct Mol Biol 17, 909-915,doi:10.1038/nsmb.1838 (2010).
18. Nowak,D. E., Tian, B. & Brasier, A. R. Two-step cross-linking method foridentification of NF-kappaB gene network by chromatin immunoprecipitation.Biotechniques 39, 715-725 (2005).
19. Zeng, P.Y., Vakoc, C. R., Chen, Z. C., Blobel, G. A. & Berger, S. L. In vivo dualcross-linking for identification of indirect DNA-associated proteins bychromatin immunoprecipitation. BioTechniques 41, 694-698 (2006).
20. Zhao, J.et al. Genome-wide identification of polycomb-associated RNAs by RIP-seq. MolCell 40, 939-953, doi:10.1016/j.molcel.2010.12.011 (2010).
21. Yu, P.et al. Spatiotemporal clustering of the epigenome reveals rules of dynamic generegulation. Genome Res 23, 352-364, doi:10.1101/gr.144949.112 (2013).
22. Ender,C. et al. A human snoRNA with microRNA-like functions. Mol Cell 32, 519-528,doi:10.1016/j.molcel.2008.10.017 (2008).
23. Brameier,M., Herwig, A., Reinhardt, R., Walter, L. & Gruber, J. Human box C/DsnoRNAs with miRNA like functions: expanding the range of 調節ＲＮＡs. Nucleic Acids Res 39, 675-686, doi:10.1093/nar/gkq776 (2011).
24. Guttman,M. et al. Chromatin signature reveals over a thousand highly conserved largenon-coding RNAs in mammals. Nature 458, 223-227, doi:10.1038/nature07672(2009).
25. Barabasi,A. L. & Oltvai, Z. N. Network biology: understanding the cell's functionalorganization. Nat Rev Genet 5, 101-113, doi:10.1038/nrg1272 (2004).
26. Shalgi,R., Pilpel, Y. & Oren, M. Repression of transposable-elements - a microRNAanti-cancer defense mechanism？ Trends in genetics : TIG 26, 253-259,doi:10.1016/j.tig.2010.03.006 (2010).
27. Yuan,Z., Sun, X., Liu, H. & Xie, J. MicroRNA genes derived from repetitiveelements and expanded by segmental duplication events in mammalian genomes.PloS one 6, e17666, doi:10.1371/journal.pone.0017666 (2011).
28. Schwartz,S. et al. Transcriptome-wide mapping reveals widespread dynamic-regulatedpseudouridylation of ncRNA and mRNA. Cell 159, 148-162,doi:10.1016/j.cell.2014.08.028 (2014).
29. Bellaousov,S., Reuter, J. S., Seetin, M. G. & Mathews, D. H. RNAstructure: web serversfor RNA secondary structure prediction and analysis. Nucleic Acids Research 41,W471-W474, doi:Doi 10.1093/Nar/Gkt290 (2013).
30. Gong, C.& Maquat, L. E. lncRNAs transactivate STAU1-mediated mRNA decay byduplexing with 3' UTRs via Alu elements. Nature 470, 284-288,doi:10.1038/nature09701 (2011).
31. Cooper,G. M. et al. Distribution and intensity of constraint in mammalian genomicsequence. Genome Res 15, 901-913, doi:10.1101/gr.3577405 (2005).
32. Kiss,T., Fayet-Lebaron, E. & Jady, B. E. Box H/ACA small ribonucleoproteins. MolCell 37, 597-606, doi:10.1016/j.molcel.2010.01.032 (2010).

Claims

細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成する方法であって、
ＲＮＡをタンパク質に架橋するステップと、
共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含む、方法。
前記ＲＮＡをタンパク質に架橋するステップは無傷細胞又は細胞溶解物において行われる、請求項１に記載の方法。
前記架橋はＵＶ架橋を含む、請求項１又は２に記載の方法。
前記タンパク質を表面に固定化しやすくする薬剤に、前記タンパク質を会合するステップをさらに含む、請求項１〜３のいずれか１項に記載の方法。
前記固定化しやすくする薬剤はビオチンを含む、請求項４に記載の方法。
前記同じタンパク質分子に架橋された前記ＲＮＡを断片化するステップをさらに含む、請求項１〜５のいずれか１項に記載の方法。
前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記同じタンパク質分子に架橋された前記ＲＮＡを、ＲＮＡｓｅに接触させるステップを含む、請求項６に記載の方法。
前記同じタンパク質分子に架橋された前記ＲＮＡを、前記ＲＮＡを回収しやすくする薬剤に結合するステップをさらに含む、請求項１〜７のいずれか１項に記載の方法。
前記結合は、前記ＲＮＡの末端を前記薬剤にライゲーションすることを含む、請求項８に記載の方法。
前記ＲＮＡを回収しやすくする前記薬剤は核酸を含む、請求項９に記載の方法。
前記核酸はビオチンを有する核酸を含む、請求項１０に記載の方法。
前記ビオチンを有する核酸を前記ＲＮＡの前記末端に結合することは、前記共に同じタンパク質分子に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップの前に、前記ビオチンを有する核酸を、前記ＲＮＡの５’末端にライゲーションすることを含む、請求項１１に記載の方法。
前記ビオチンを、前記キメラＲＮＡの５’領域から取り除くステップをさらに含む、請求項１２に記載の方法。
前記キメラＲＮＡを回収するステップをさらに含む、請求項１〜１３のいずれか１項に記載の方法。
前記キメラＲＮＡを断片化するステップをさらに含む、請求項１〜１４のいずれか１項に記載の方法。
前記キメラＲＮＡの前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む、請求項１〜１５のいずれか１項に記載の方法。
前記キメラＲＮＡを逆転写してキメラｃＤＮＡを生成するステップをさらに含む、請求項１〜１６のいずれか１項に記載の方法。
前記キメラＲＮＡ又は前記キメラｃＤＮＡにおける前記ＲＮＡのそれぞれに由来する、前記キメラＲＮＡ又は前記キメラｃＤＮＡの配列の少なくとも一部分を決定するステップをさらに含む、請求項１〜１７のいずれか１項に記載の方法。
前記キメラＲＮＡに存在する前記ＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定するステップをさらに含む、請求項１〜１７のいずれか１項に記載の方法。
前記細胞において、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される、請求項１９に記載の方法。
実質的にすべての、前記細胞において相互作用するＲＮＡが特定される、請求項１９に記載の方法。
前記細胞において、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される、請求項２１に記載の方法。
前記細胞において相互作用するＲＮＡの前記特定は、自動シーケンシング装置を用いて、前記キメラＲＮＡに配列リードを行うステップを含む、請求項１９〜２２のいずれか１項に記載の方法。
前記細胞において相互作用するＲＮＡの前記特定は、すべての前記配列リードからキメラ配列を特定するステップを含む、請求項２３に記載の方法。
前記キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換するステップをさらに含む、請求項１９〜２４のいずれか１項に記載の方法。
前記ＲＮＡクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、請求項２５に記載の方法。
タンパク質に架橋されたキメラＲＮＡを含む単離複合体であって、前記キメラＲＮＡは細胞において相互作用するＲＮＡを含む、単離複合体。
候補治療剤を特定するための方法であって、
請求項１〜２６のいずれか１項に記載の方法を用いて、細胞において相互作用するＲＮＡを特定するステップと、
前記ＲＮＡの前記相互作用を低減又は増大する薬剤の能力を評価するステップと、を含み、
前記薬剤が前記ＲＮＡの前記相互作用を低減又は増大することができる場合に前記薬剤は候補治療剤である、方法。
前記薬剤は核酸を含む、請求項２８に記載の方法。
前記薬剤は化合物を含む、請求項２８に記載の方法。
医薬作製方法であって、請求項２８〜３０のいずれか１項に記載の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化するステップを含む、方法。
請求項３１に記載の方法を用いて作製された医薬。
細胞において相互作用するＲＮＡを含むキメラＲＮＡを生成するための方法であって、
ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋するステップと、
共にタンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップとを含み、
前記タンパク質複合体は２つ以上の相互作用タンパク質を含む、方法。
前記ＲＮＡをタンパク質中間体及び／又はタンパク質複合体に架橋するステップは無傷細胞又は細胞溶解物において行われる、請求項３３に記載の方法。
前記架橋はＵＶ架橋を含む、請求項３３又は３４に記載の方法。
前記タンパク質中間体及び／又はタンパク質複合体を、前記タンパク質中間体及び／又はタンパク質複合体を表面に固定化しやすくする薬剤に会合するステップをさらに含む、請求項３３〜３５のいずれか１項に記載の方法。
前記固定化しやすくする薬剤はビオチンを含む、請求項３６に記載の方法。
少なくとも１つのタンパク質分子に架橋された前記ＲＮＡを断片化するステップをさらに含む、請求項３３〜３７のいずれか１項に記載の方法。
前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記タンパク質中間体及び／又はタンパク質複合体に架橋された前記ＲＮＡを、ＲＮＡｓｅに接触させることを含む、請求項３８に記載の方法。
前記タンパク質中間体及び／又はタンパク質複合体に架橋された前記ＲＮＡを、前記ＲＮＡを回収しやすくする薬剤に結合するステップをさらに含む、請求項３３〜３９のいずれか１項に記載の方法。
前記結合は、前記ＲＮＡの末端を前記薬剤にライゲーションすることを含む、請求項４０に記載の方法。
前記ＲＮＡを回収しやすくする前記薬剤は核酸を含む、請求項４１に記載の方法。
前記核酸はビオチンを有する核酸を含む、請求項４２に記載の方法。
前記ビオチンを有する核酸を前記ＲＮＡの前記末端に結合することは、前記共にタンパク質中間体及び／又はタンパク質複合体に架橋されたＲＮＡをライゲーションしてキメラＲＮＡを形成するステップの前に、前記ビオチンを有する核酸を、前記ＲＮＡの５’末端にライゲーションすることを含む、請求項４３に記載の方法。
前記ビオチンを、前記キメラＲＮＡの５’末端から取り除くステップをさらに含む、請求項４４に記載の方法。
前記キメラＲＮＡを回収するステップをさらに含む、請求項３３〜４５のいずれか１項に記載の方法。
前記キメラＲＮＡを断片化するステップをさらに含む、請求項３３〜４６のいずれか１項に記載の方法。
前記キメラＲＮＡの前記断片化は、前記ＲＮＡの部分的消化を促す条件下で、前記キメラＲＮＡを、ＲＮＡｓｅに接触させることを含む、請求項３３〜４７のいずれか１項に記載の方法。
前記キメラＲＮＡを逆転写してキメラｃＤＮＡを生成するステップをさらに含む、請求項３３〜４８のいずれか１項に記載の方法。
前記キメラＲＮＡ又は前記キメラｃＤＮＡにおける前記ＲＮＡのそれぞれに由来する、前記キメラＲＮＡ又は前記キメラｃＤＮＡの配列の少なくとも一部分を決定するステップをさらに含む、請求項３３〜４９のいずれか１項に記載の方法。
前記キメラＲＮＡに存在する前記ＲＮＡを特定することで、細胞において相互作用するＲＮＡを特定するステップをさらに含む、請求項３３〜４９のいずれか１項に記載の方法。
前記細胞において、少なくとも１００、少なくとも５００、少なくとも１０００の、又は１０００を超える、ＲＮＡ−ＲＮＡ相互作用が特定される、請求項５１に記載の方法。
実質的にすべての、前記細胞において相互作用するＲＮＡが特定される、請求項５１に記載の方法。
前記細胞において、少なくとも７０％、少なくとも８０％、少なくとも９０％の、又は９０％を超える、ＲＮＡ−ＲＮＡ直接相互作用が特定される、請求項５３に記載の方法。
前記細胞において相互作用するＲＮＡの前記特定は、自動シーケンシング装置を用いて、前記キメラＲＮＡに配列リードを行うことを含む、請求項５１〜５４のいずれか１項に記載の方法。
前記細胞において相互作用するＲＮＡの前記特定は、すべての前記配列リードからキメラ配列を特定することを含む、請求項５５に記載の方法。
前記キメラＲＮＡをアノテーションＲＮＡクラスタに、コンピュータを用いて形質転換するステップをさらに含む、請求項５１〜５６のいずれか１項に記載の方法。
前記ＲＮＡクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、請求項５７に記載の方法。
前記細胞において相互作用するＲＮＡは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋される、請求項３３〜５８のいずれか１項に記載の方法。
タンパク質中間体及び／又はタンパク質複合体に架橋されたキメラＲＮＡを含む単離複合体であって、前記キメラＲＮＡは細胞において相互作用するＲＮＡを含み、前記タンパク質複合体は２つ以上の相互作用タンパク質を含む、単離複合体。
前記キメラＲＮＡは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋されるＲＮＡを含む、請求項５９に記載の単離複合体。