JP2017529104A - Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析 - Google Patents

Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析 Download PDF

Info

Publication number
JP2017529104A
JP2017529104A JP2017535612A JP2017535612A JP2017529104A JP 2017529104 A JP2017529104 A JP 2017529104A JP 2017535612 A JP2017535612 A JP 2017535612A JP 2017535612 A JP2017535612 A JP 2017535612A JP 2017529104 A JP2017529104 A JP 2017529104A
Authority
JP
Japan
Prior art keywords
rna
protein
chimeric
cell
interactions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017535612A
Other languages
English (en)
Inventor
シェン ゾン,
シェン ゾン,
トリ, コン グェン,
トリ, コン グェン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of JP2017529104A publication Critical patent/JP2017529104A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

細胞において相互作用するRNAを含むキメラRNAを生成する方法及び構成が提供される。一部の実施形態において、該キメラRNAは、細胞における少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用を特定するために用いられることができる。【選択図】図1A

Description

[関連出願の参照]
本願は、2014年9月22日出願の米国仮特許出願第62/053,615号の優先権を主張する。該出願の開示全体が言及によって本願明細書に明示的に組み込まれる。
[連邦政府支援による研究開発についての記載]
本発明は、アメリカ国立衛生研究所により付与された許諾番号NIH DP2 OD007417における政府支援によりなされたものである。政府は本発明の所定の権利を有する。
[配列表、表、又はコンピュータプログラムの参照]
本発明は、電子形式の配列表と共に出願されている。配列表は、2015年9月18日に作成された11キロバイトのサイズであるUCSD089−001WO.TXTという名のファイルで提供される。電子形式配列表の情報はその全体が言及によって本願明細書に組み込まれる。
[技術分野]
細胞において相互作用するRNAを特定するための方法と構成とが提供される。
現在のところ、1つの細胞型において実質的にすべてのRNA−RNA間相互作用を一度に直接的に分析できる効率的な方法はない。この目的を部分的に達成するためにあり、共に難点がある2種の方法が存在する。HITS−CLIPやCLASHなどの技術は、多くのmiRNAの標的を検出可能である。しかしながら、両方法では、少量のRNAを含むのみであるmiRNAに重点が置かれる。このように、これらの技術はRNA−RNA間相互作用の大部分を明らかにはできない。さらに、各技術にはさらなる難点がある。例として、miRNAとその標的mRNAとの直接ペアリングは、HITS−CLIPから直接的に推論できない。換言すると、どのmiRNAがどのmRNAを調節するかは、HITS−CLIPからは直接的には分からない(1対1の情報はない)。
CLASH(ハイブリッドの架橋、ライゲーション、及びシーケンシング)という近年の方法では、miRNA−標的ペアを直接的に観察可能である。しかし、相互作用の数は、配列リードの数と比較して未だ少ないものであり、配列リードの2%のみがキメラであり、98%が未だシングルリードである。miRNA−mRNA相互作用を十分に包含するために、複数のサンプルの非常に深いシーケンシング範囲又は調製が必要とされる。
本発明の一部の実施形態は、以下の番号付き段落に示される。
1.細胞において相互作用するRNAを含むキメラRNAを生成する方法であって、RNAをタンパク質に架橋するステップと、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含む、方法。
2.前記RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる、段落1に記載の方法。
3.前記架橋はUV架橋を含む、段落1又は2に記載の方法。
4.前記タンパク質を表面に固定化しやすくする薬剤に、前記タンパク質を会合するステップをさらに含む、段落1〜3のいずれか1項に記載の方法。
5.前記固定化しやすくする薬剤はビオチンを含む、段落4に記載の方法。
6.前記同じタンパク質分子に架橋された前記RNAを断片化するステップをさらに含む、段落1〜5のいずれか1つに記載の方法。
7.前記断片化は、前記RNAの部分的消化を促す条件下で、前記同じタンパク質分子に架橋された前記RNAを、RNAseに接触させるステップを含む、段落6に記載の方法。
8.前記同じタンパク質分子に架橋されたRNAを、前記RNAを回収しやすくする薬剤に結合するステップをさらに含む、段落1〜7のいずれか1つに記載の方法。
9.前記結合は、前記RNAの末端を前記薬剤にライゲーションすることを含む、段落8に記載の方法。
10.前記RNAを回収しやすくする前記薬剤は核酸を含む、段落9に記載の方法。
11.前記核酸はビオチンを有する核酸を含む、段落10に記載の方法。
12.前記ビオチンを有する核酸を前記RNAの前記末端に結合することは、前記共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、前記ビオチンを有する核酸を、前記RNAの5’末端にライゲーションすることを含む、段落11に記載の方法。
13.前記ビオチンを、前記キメラRNAの5’領域から取り除くステップをさらに含む、段落12に記載の方法。
14.前記キメラRNAを回収するステップをさらに含む、段落1〜13のいずれか1つに記載の方法。
15.前記キメラRNAを断片化するステップをさらに含む、段落1〜14のいずれか1つに記載の方法。
16.前記キメラRNAの前記断片化は、前記RNAの部分的消化を促す条件下で、前記キメラRNAを、RNAseに接触させることを含む、段落1〜15のいずれか1つに記載の方法。
17.前記キメラRNAを逆転写してキメラcDNAを生成するステップをさらに含む、段落1〜16のいずれか1つに記載の方法。
18.前記キメラRNA又は前記キメラcDNAにおける前記RNAのそれぞれに由来する、前記キメラRNA又は前記キメラcDNAの配列の少なくとも一部分を決定するステップをさらに含む、段落1〜17のいずれか1つに記載の方法。
19.前記キメラRNAに存在する前記RNAを特定することで、細胞において相互作用するRNAを特定するステップをさらに含む、段落1〜17のいずれか1つに記載の方法。
20.前記細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される、段落19に記載の方法。
21.実質的にすべての、前記細胞において相互作用するRNAが特定される、段落19に記載の方法。
22.前記細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される、段落21に記載の方法。
23.前記細胞において相互作用するRNAの前記特定は、自動シーケンシング装置を用いて、前記キメラRNAに配列リードを行うステップを含む、段落19〜22のいずれか1つに記載の方法。
24.前記細胞において相互作用するRNAの前記特定は、すべての前記配列リードからキメラ配列を特定するステップを含む、段落23に記載の方法。
25.前記キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換するステップをさらに含む、段落19〜24のいずれか1つに記載の方法。
26.前記RNAクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、段落25に記載の方法。
27.タンパク質に架橋されたキメラRNAを含む単離複合体であって、前記キメラRNAは細胞において相互作用するRNAを含む、単離複合体。
28.候補治療剤を特定するための方法であって、
段落1〜26のいずれか1つに記載の方法を用いて、細胞において相互作用するRNAを特定するステップと、
前記RNAの前記相互作用を低減又は増大する薬剤の能力を評価するステップと、を含み、
前記薬剤が前記RNAの前記相互作用を低減又は増大することができる場合に前記薬剤は候補治療剤である、方法。
29.前記薬剤は核酸を含む、段落28に記載の方法。
30.前記薬剤は化合物を含む、段落28に記載の方法。
31.医薬作製方法であって、段落28〜30のいずれか1つに記載の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化するステップを含む、方法。
32.段落31に記載の方法を用いて作製された医薬。
33.細胞において相互作用するRNAを含むキメラRNAを生成するための方法であって、RNAをタンパク質中間体及び/又はタンパク質複合体に架橋するステップと、共に前記タンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含み、前記タンパク質複合体は、2つ以上の相互作用タンパク質を含む、方法。
34.前記RNAをタンパク質中間体及び/又はタンパク質複合体に架橋することは無傷細胞又は細胞溶解物において行われる、段落33に記載の方法。
35.前記架橋はUV架橋を含む、段落33又は34に記載の方法。
36.前記タンパク質中間体及び/又はタンパク質複合体を、前記タンパク質中間体及び/又はタンパク質複合体の表面への固定化を促す薬剤に会合するステップをさらに含む、段落33〜35のいずれか1つに記載の方法。
37.前記固定化を促す薬剤はビオチンを含む、段落36に記載の方法。
38.少なくとも1つの前記タンパク質分子に架橋された前記RNAを断片化するステップをさらに含む、段落33〜37のいずれか1つに記載の方法。
39.前記断片化は、前記RNAの部分的消化を促す条件下で、前記タンパク質中間体及び/又はタンパク質複合体に架橋された前記RNAを、RNAseに接触させることを含む、段落38に記載の方法。
40.前記タンパク質中間体及び/又はタンパク質複合体に架橋された前記RNAを、前記RNAを回収しやすくする薬剤に結合するステップをさらに含む、段落33〜39のいずれか1つに記載の方法。
41.前記結合は、前記RNAの末端を前記薬剤にライゲーションすることを含む、段落40に記載の方法。
42.前記RNAを回収しやすくする前記薬剤は核酸を含む、段落41に記載の方法。
43.前記核酸はビオチンを有する核酸を含む、段落42に記載の方法。
44.前記ビオチンを有する核酸を前記RNAの前記末端に結合することは、前記共にタンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成するステップの前に、前記ビオチンを有する核酸を、前記RNAの5’末端にライゲーションすることを含む、段落43に記載の方法。
45.前記ビオチンを、前記キメラRNAの5’末端から取り除くステップをさらに含む、段落44に記載の方法。
46.前記キメラRNAを回収するステップをさらに含む、段落33〜45のいずれか1つに記載の方法。
47.前記キメラRNAを断片化するステップをさらに含む、段落33〜46のいずれか1つに記載の方法。
48.前記キメラRNAの前記断片化は、前記RNAの部分的消化を促す条件下で、前記キメラRNAを、RNAseに接触させることを含む、段落33〜47のいずれか1つに記載の方法。
49.前記キメラRNAを逆転写してキメラcDNAを生成するステップをさらに含む、段落33〜48のいずれか1つに記載の方法。
50.前記キメラRNA又は前記キメラcDNAにおける前記RNAのそれぞれに由来する、前記キメラRNA又は前記キメラcDNAの配列の少なくとも一部分を決定するステップをさらに含む、段落33〜49のいずれか1つに記載の方法。
51.前記キメラRNAに存在する前記RNAを特定することで、細胞において相互作用するRNAを特定するステップをさらに含む、段落33〜49のいずれか1つに記載の方法。
52.前記細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される、段落51に記載の方法。
53.実質的にすべての、前記細胞において相互作用するRNAが特定される、段落51に記載の方法。
54.前記細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される、段落53に記載の方法。
55.前記細胞において相互作用するRNAの前記特定は、自動シーケンシング装置を用いて、前記キメラRNAに配列リードを行うことを含む、段落51〜54のいずれか1つに記載の方法。
56.前記細胞において相互作用するRNAの前記特定は、すべての前記配列リードからキメラ配列を特定することを含む、段落55に記載の方法。
57.前記キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換するステップをさらに含む、段落51〜56のいずれか1つに記載の方法。
58.前記RNAクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、段落57に記載の方法。
59.前記細胞において相互作用するRNAは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋される、段落33〜58のいずれか1つに記載の方法。
60.タンパク質中間体及び/又はタンパク質複合体に架橋されたキメラRNAを含む単離複合体であって、前記キメラRNAは細胞において相互作用するRNAを含み、前記タンパク質複合体は2つ以上の相互作用タンパク質を含む、単離複合体。
61.前記キメラRNAは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋されるRNAを含む、段落59に記載の単離複合体。
図1はRNAのHi−Cを示す。図1Aにおいて、主要な実験ステップは、1:RNAをタンパク質に架橋、2:RNA断片化とタンパク質ビオチン化(丸はビオチンを表す)、3:固定化、4:ビオチン化RNAリンカーのライゲーション(鎖上の丸はリンカー上のビオチンである)、5:超高希薄条件下において近接ライゲーション、6:RNA精製と逆転写、7:ビオチンプルダウン、8:配列ライブラリ構築、である。キメラRNAの概略図で示されるのは、P5特異的プライマー、P5特異的プライマーとRNA1との間のバーコード、RNA1とRNA2との間のリンカー特異的リバースプライマー、そしてP7領域を有する、所望されるキメラ産生物である。図示される不完全産生物において、P5領域はバーコードに隣接し、バーコードはP5領域とリンカーの間にあり、RNA2領域、そしてP7領域がある。 図1はRNAのHi−Cを示す。図1Bは、RNA1−リンカー−RNA2キメラのPCR検証を示し、P5シーケンシングプライマーからリンカーまで91bpを超えると予想され、P5からP7シーケンシングプライマーまで200bpを超えると予想された。RNA1を包含できなかったことにより、P5からリンカーまで91bpの産生物が作製された。RNA2を包含できなかったことにより、P5からリンカーまで及びP5からP7まで同様のサイズの産生物が作製された。PCRプライマーはそれぞれのレーンの上部に標識される。また、配列ライブラリのサイズ分布はバイオアナライザにより評価された。左から右へと所望のキメラ産生物において示されるのは、P5特異的フォワードプライマー、バーコード、RNA1、リンカー(リンカー特異的プライマーと相補的)、RNA2、及びP7である。不完全産生物に示されるのは、P5、バーコード、リンカー、RNA2、及びP7である。 図1はRNAのHi−Cを示す。図1Cは、ゲノムにマッピングされたRNAHi−Cデータを示す。Trim25及びSnora1RNAのライゲーションはES−1及びES−2ライブラリにおける46ペアエンドリードにより実験的に裏付けられた。Ago CLIP−seqはマウスES細胞のAGO HITS−CLIP(GEO:GSM622570)である。Small RNA−seqは酵素切断によりもたらされた3’ヒドロキシル基を有する小型RNAのシーケンシング(GEO:GSM945907)である。 図1はRNAのHi−Cを示す。図1Dは、RNAインタラクトームの大モジュールを示す。4以下の相互作用RNAに関与する小モジュールは示されない。snoRNA、snRNA、及びtRNAに関与する相互作用は示されない。図における配列の大部分はmRNAであり、残りは偽遺伝子(FPl30=ps3、Gm16580、Gm12715、Gm13226、Rp128−ps3、Fpl28−ps1、Rps16−ps2、Gm4707、Gm13340、Gm13408、Gm15590、Grl2、Gm11400、Gm17087、Gm15725、Gm12346、Gm11478)、lincRNA(Gm16869、Malat1、Snhg7、Gm16702、4930417H01Rik)、miRNA(Mir5100、Mir692−1、Mir692−2b、Ac117657、Mir5099)、及びアンチセンスRNA(Gm15444)である。 図2はRNA相互作用部位を示す。図2Aは、Eef1a1遺伝子の特定領域上にオーバーラップした、種々の相互作用(破線)を表す複数のRNAHi−Cリードを示す。 図2はRNA相互作用部位を示す。図2Bは、オーバーラップするリードの「ピーク」によって相互作用部位の検出を示す。ピーク1及び2はRNA1であり、ピーク3及び4はRNA2である。 図2はRNA相互作用部位を示す。図2Cは、種々のタイプのRNA遺伝子及びトランスポゾンの相互作用部位分布を示す。 図2はRNA相互作用部位を示す。図2Dは、2つのRNAの相互作用部位間(薄い灰色、左)と、無作為にシャッフルされた塩基間(白色、右)との結合エネルギーの分布(ΔG、kcal/mol)を示す。ウィルコクソン順位検定のP値が各パネルの下部に示される。 図2はRNA相互作用部位を示す。図2Eは、ライゲーションされたRNA断片の接合部(x軸の0位置の黒色バー)でピークになる平均PhyloPスコアにより測定される保存レベルを示す。対照は無作為選択ゲノム領域の保存レベルである。グラフに示されるように、左側のデータはRNA1を表し、右側のデータはRNA2を表す。 図3Aは、RNA構造において、RNAの近位部位を決定する概略図を示す。核酸の概略図におけるポインタ矢印はRNaseI切断部位を示す。 図3Bは、RNA構造において、Snora73にマッピングされた「切断及びライゲーション」産生物を示す。色付き水平バーは、近位部位のペアを裏付けるリードペアのクラスタを示す。近位部位における数字は、図3のパネルE及びFにおける配列の数字に相当する。 図3Cは、RNA構造において、RNaseI切断の密度を示す。近位部位における数字は、図3のパネルE及びFにおける配列の数字に相当する。図3Dは、RNAの任意の2つの位置間におけるライゲーション頻度のヒートマップを示す。各色付き丸はパネルAにおける色付き水平バーに相当し、近位部位のペアを示す。 図3はRNA構造を示す。図3Eは、許容される2次構造における1本鎖領域のフットプリントと推定近位部位を示す。 図3はRNA構造を示す。図3Fにおいて、シーケンシングに基づく2次構造によってサポートされなかった推定近位部位のペアが、タンパク質補助RNA折りたたみのため、インビボにおいて物理的に近接する。 図4は、RNA−RNA相互作用をマッピングするための段階的なシーケンシングに基づく技術を示す。 図5は計算部のワークフローを示す。図5Aは、キメラRNA配列を特定するためのフローチャートを示す。挿入ボックスに示されるように、主な配列は「リンカーなし」、「リンカーのみ」、「後部のみ」、「前部のみ」、及び「ペア」の配列である。図示されるように、リンカーなし配列は、1)5’指標、2)5’指標、パート1、及びパート2、3)5’指標及びパート1、並びに4)5’指標及びパート2を有する。図示されるように、リンカーのみの配列は5’指標とパート2を有する。図示されるように、後部のみは5’指標、リンカー、及びパート2を有する。図示されるように、前部のみは5’指標及びリンカーを有する。図示されるように、ペアは5’指標、パート1、リンカー、及びパート2を有する。 図5は計算部のワークフローを示す。図5Bでは、多数のキメラRNAによって裏付けられるRNA−RNA相互作用を特定する方法が示される。上部のパネルにはR1におけるセグメント、下部パネルにはR2におけるセグメントが示される。グラフに示されるように、キメラRNAにおいてこれらはペアである。 図6は予備試験結果を示す。図6Aは、キメラcDNAのライブラリのサイズ分布を示す。128bpはプライマー配列であることが言及される。 図6は予備試験結果を示す。図6Bは、異なるタイプのRNA間の相互作用の割合を示す。 図6は予備試験結果を示す。図6Cにおいて、18のライゲーションRNAペアがSNORA1及びTrim25にマッピングされた。マッピングされた座位はAgoCLIP−seqデータと一致した(GSM622570)。 図6は予備試験結果を示す。図6Dは、誘導分化過程時のSNORA1及びTrim25の逆相関を示す。図示されるように、Trim25は、約35RNA−seqRPKMから、4日目に約5に減少し、一方でSNORA1は0日目から6日目へと増加する。 図7は、配列ライブラリ構築のCGGCATTCCTGCTGAACCGCTCTTCCGATCT方法を示す。この図はRNAのHi−C手法のステップ8を詳述する(図7A)。逆転写(RT)アダプターをRNAの3’末端に付けた。このRTアダプターはRTプライマーの断片に相補的であり、これは、P5シーケンシングプライマー、10ntバーコード、及びBamHI制限部位のためのアダプターも包含した。環状化後、BamHI部位を含むDNAオリゴをRTプライマー領域にハイブリダイズし、BamHI消化のための2本鎖基質を得た。直線化ss−cDNAをトランケートPCRプライマーDP5及びDP3によって増幅して、約100ngのds−cDNAを得、これを変性及び再アニーリングした。二本鎖特異的ヌクレアーゼ(DSN)を用いて、rRNA由来のcDNAを枯渇した。DSNは、再アニーリング処理時において以前に形成されたds−cDNAを選択的に除去する。rRNA由来cDNAはより豊富であり、ゆえに他のcDNAより速く再アニーリングすると考えられる。DSN処理産生物は、IlluminaPCRプライマーPE1.0及び2.0により再度PCR増幅され、シーケンシングに適切なライブラリを生成した。DSNによるrRNA除去をES−1に適用した。ES−2には、この図には示されていない抗体によるrRNA除去をおこなった。最後に図示されるのは、P5、バーコード、RNA1、アダプター、RNA2、及びP7の産生物である(図7B)。 図8は、RNAのHi−Cサンプルを示す。「リードペア総数」とは各サンプルのペアエンド配列リード数である。「RNA1−リンカー−RNA2形態の非重複リードペア数」とは、バイオインフォマティクスパイプラインの、ステップ4.キメラcDNAの解析の出力のペアエンドリード数である。 図9Aは、第1断片化のためのRNaseI濃度の最適化を示す。RNaseI処理ES細胞溶解物から、同量の2×プロテイナーゼKバッファー(100mMのTris−HCl pH7.5、100mMのNaCl、2%SDS、20mMのEDTA)と1:5量の20mg/mlのプロテイナーゼK(NEB)とを添加し、55℃で2時間インキュベートした後、フェノール:クロロホルム処理とエタノール沈殿とをすることで、RNAを精製した。細胞溶解物ml毎のRNaseI量は、0U(サンプル1、図9A)、2.5U(サンプル2、(図9B))、3.3U(サンプル3、図9C)、5U(サンプル4、図9D)、及び12.5(サンプル5、図9E)であった。500〜1000ntRNA断片を産生する、ml溶解物毎に5.0UのRNaseIの濃度(サンプル4)がRNAのHi−Cのステップ2のために選択された。 図9Bは、第1断片化のためのRNaseI濃度の最適化を示す。RNaseI処理ES細胞溶解物から、同量の2×プロテイナーゼKバッファー(100mMのTris−HCl pH7.5、100mMのNaCl、2%SDS、20mMのEDTA)と1:5量の20mg/mlのプロテイナーゼK(NEB)とを添加し、55℃で2時間インキュベートした後、フェノール:クロロホルム処理とエタノール沈殿とをすることで、RNAを精製した。細胞溶解物ml毎のRNaseI量は、0U(サンプル1、図9A)、2.5U(サンプル2、(図9B))、3.3U(サンプル3、図9C)、5U(サンプル4、図9D)、及び12.5(サンプル5、図9E)であった。500〜1000ntRNA断片を産生する、ml溶解物毎に5.0UのRNaseIの濃度(サンプル4)がRNAのHi−Cのステップ2のために選択された。 図9Cは、第1断片化のためのRNaseI濃度の最適化を示す。RNaseI処理ES細胞溶解物から、同量の2×プロテイナーゼKバッファー(100mMのTris−HCl pH7.5、100mMのNaCl、2%SDS、20mMのEDTA)と1:5量の20mg/mlのプロテイナーゼK(NEB)とを添加し、55℃で2時間インキュベートした後、フェノール:クロロホルム処理とエタノール沈殿とをすることで、RNAを精製した。細胞溶解物ml毎のRNaseI量は、0U(サンプル1、図9A)、2.5U(サンプル2、(図9B))、3.3U(サンプル3、図9C)、5U(サンプル4、図9D)、及び12.5(サンプル5、図9E)であった。500〜1000ntRNA断片を産生する、ml溶解物毎に5.0UのRNaseIの濃度(サンプル4)がRNAのHi−Cのステップ2のために選択された。 図9Dは、第1断片化のためのRNaseI濃度の最適化を示す。RNaseI処理ES細胞溶解物から、同量の2×プロテイナーゼKバッファー(100mMのTris−HCl pH7.5、100mMのNaCl、2%SDS、20mMのEDTA)と1:5量の20mg/mlのプロテイナーゼK(NEB)とを添加し、55℃で2時間インキュベートした後、フェノール:クロロホルム処理とエタノール沈殿とをすることで、RNAを精製した。細胞溶解物ml毎のRNaseI量は、0U(サンプル1、図9A)、2.5U(サンプル2、(図9B))、3.3U(サンプル3、図9C)、5U(サンプル4、図9D)、及び12.5(サンプル5、図9E)であった。500〜1000ntRNA断片を産生する、ml溶解物毎に5.0UのRNaseIの濃度(サンプル4)がRNAのHi−Cのステップ2のために選択された。 図9Eは、第1断片化のためのRNaseI濃度の最適化を示す。RNaseI処理ES細胞溶解物から、同量の2×プロテイナーゼKバッファー(100mMのTris−HCl pH7.5、100mMのNaCl、2%SDS、20mMのEDTA)と1:5量の20mg/mlのプロテイナーゼK(NEB)とを添加し、55℃で2時間インキュベートした後、フェノール:クロロホルム処理とエタノール沈殿とをすることで、RNAを精製した。細胞溶解物ml毎のRNaseI量は、0U(サンプル1、図9A)、2.5U(サンプル2、(図9B))、3.3U(サンプル3、図9C)、5U(サンプル4、図9D)、及び12.5(サンプル5、図9E)であった。500〜1000ntRNA断片を産生する、ml溶解物毎に5.0UのRNaseIの濃度(サンプル4)がRNAのHi−Cのステップ2のために選択された。 図10は、ビーズにおけるリンカーライゲーション効率のテストを示す。固定化RNAをRNaseI消化し、そしてビオチン標識RNAリンカーにライゲーションした(1)。ライゲーションと、タンパク質を除去するためのプロテイナーゼK消化との後、RNAを精製及び数量化した(1.3μg)(2)。そして、精製RNAにストレプトアビジン−ビオチンを行って、ビオチン標識リンカーにライゲーションしたRNAを選択した(3)。ストレプトアビジンビーズに結合したRNAを洗浄及び溶出、及びエタノール沈殿した後、0.22μgのRNAを採取した。並行して、ビオチン標識RNAリンカーに同じストレプトアビジン−ビオチンプルダウン、溶出、及びエタノール沈殿を行なった(4)。ステップ3及び4におけるビオチンプルダウン、RNA溶出、及びエタノール沈殿の効率は同様の、約19.6%(1.96μg/10.0μg)であることを検討すると、ライゲーション効率(0.22μg/19.6%)/1.3μg=86%が推測される。 図11は、RNAのHi−C手順の種々のステップにおけるRNAサイズ分布を示す。ES−インダイレクト及びMEFサンプルのみが遡及的な解析に用いられる十分な中間産生物を有した。ストレプトアビジンビーズに付けられる前のMEF(レーン1)及びES−インダイレクト(レーン2)の溶解物、固定化後の上清におけるもの(レーン3及び4)、及び近接ライゲーション後にビーズに固定化されたもの(ES−インダイレクトはレーン5、MEFはレーン6)のRNAのサイズ分布を示す。RNAを、2×RNAローディング色素(NEB)内で70℃で5分間変性し、1.5%ネイティブアガロースゲルに流し、SYBRGold(Invitrogen)で染色した。 図12は、配列ライブラリ構築のためのPCRサイクル数の最適化を示す。RNAのHi−C手順のステップ8において、ES−1サンプルの1本鎖cDNAを、トランケート形態のIlluminaPCRシーケンシングプライマー(DP5及びDP3)を用いて12サイクルのPCRで予備増幅した。PCR産生物を1.8×SPRISelectビーズで精製し、二本鎖特異的ヌクレアーゼにより、rRNAから合成されたcDNAを枯渇する前に、86ngの2本鎖DNAを作製した。全部で22μlのrRNA−枯渇2本鎖cDNAからの1μl分割量を、NEBNextハイフィデリティー2×PCRマスターミックス(NEB)及びIlluminaPEプライマー1.0及び2.0を用いて、種々のPCRサイクル数(12、15、18)で増幅した。PCR産生物を6%のTBE PAGEゲルにおいて分析し、SYBRGold(Invitrogen)で染色した。ゲルの結果に基づき、18μlの元のrRNA−枯渇2本鎖cDNAを11サイクルのPCRで増幅し、配列ライブラリを生成した。 図13は、RNAのHi−Cライブラリの比較を示す(図13A〜13B)。リンカーの5’末端(RNA1)と3’末端(RNA2)とにおけるリード断片は、2つのRNA−seq実験として個別に解析された。ES−1とES−2とのサンプル間における全ての既知のRNAのリードカウント分布(FPKM)の散布図を対数尺度において表す。Rはピアソン相関、Sはスピアマン相関である。(図13C)各サンプルのFPKMの階層的クラスタリング。 図14は、RNA−HiC−ツールのオンライン文書を示す。このオンライン資料(http://systemsbio.ucsd.edu/RNA-Hi-C)は、解析及び可視化ツールの詳細な説明、使用例、出力ファイル及び図面のサンプルを包含する。一部のツールはアプリケーションプログラミングインタフェース(API)としても提供される。 図15はRNAのHi−Cデータを解析するための計算パイプライン処理を示す。図15Aにおいて、PCR重複をペアエンド配列リードから除去した(ステップ1)。多重サンプルを4nt実験バーコード(「XXXX」、ステップ2)に基づき分離した。「N」は無作為バーコードのクレオチド、「X」は実験バーコードのヌクレオチドを示す。 図15はRNAのHi−Cデータを解析するための計算パイプライン処理を示す。図15Bにおいて、フォワード(リード1)リード及びリバース(リード2)リードの各ペアを、可能な場合、入力配列ライブラリにおけるcDNAを回収するために用いた。 図15はRNAのHi−Cデータを解析するための計算パイプライン処理を示す。図15Cにおいて、回収されたcDNAを、RNA断片及びリンカー配列の構成に基づいて分類した(ステップ4)。cDNAのRNA1−リンカー−RNA2タイプを出力として得た。 図15はRNAのHi−Cデータを解析するための計算パイプライン処理を示す。図15Dにおいて、RNA1及びRNA2部分を個別にゲノムにマッピングした。出力は、RNA1とRNA2とがユニークにゲノムにマッピングされたcDNAであった。 図15はRNAのHi−Cデータを解析するための計算パイプライン処理を示す。図15Eにおいて、RNA−RNA相互作用を関連性テストに基づいて特定した。図示されるように、クラスタ1及び2はRNA1を、クラスタ3及び4はRNA2を有する。 図16はRNA−HiC−ツール可視化特性を示す。図16Aにおいて、RNA内(A)及びRNA間(B)相互作用におけるRNA相互作用部位の詳細な図が示される。2つの相互作用RNAを含む2つのゲノム領域を並列にプロットした(パネルB)。各RNA1−リンカー−RNA2タイプのキメラRNAは、各ゲノム領域にマッピングされたRNA1及びRNA2断片と共にプロットされ、リンカーを表す斜線によって連結された。ブロックは、オーバーラップするRNAHi−Cリードの「ピーク」を表し、これは候補RNA相互作用部位であった。2つのRNA相互作用部位を連結する半透明多角形は強力な相互作用を表す。 図16はRNA−HiC−ツール可視化特性を示す。図16Bにおいて、RNA内(A)及びRNA間(B)相互作用におけるRNA相互作用部位の詳細な図が示される。2つの相互作用RNAを含む2つのゲノム領域を並列にプロットした(パネルB)。各RNA1−リンカー−RNA2タイプのキメラRNAは、各ゲノム領域にマッピングされたRNA1及びRNA2断片と共にプロットされ、リンカーを表す斜線によって連結された。ブロックは、オーバーラップするRNAHi−Cリードの「ピーク」を表し、これは候補RNA相互作用部位であった。2つのRNA相互作用部位を連結する半透明多角形は強力な相互作用を表す。 図16はRNA−HiC−ツール可視化特性を示す。図16Cは、RNA−RNA相互作用の全体図を示す。RNA1及びRNA2断片のリード密度は、クロマチンサイトバンド模式図(chromatin cytoband ideogram)内の影付き領域にそれぞれ示される。各特定RNA−RNA相互作用は、2つのRNAのゲノム座位を連結する曲線として示され、相互作用RNAのタイプによって色分けされた。 図17はmiRNA様相互作用を伴うsnoRNAを示す。図17Aにおいて、RNAのHi−CをsmallRNA−seq(GSM945907)及びAGO HITS−CLIP(GSM622570)と比較する。smallRNA−seq及びAGO HITS−CLIPにおける、各タイプのRNAHi−C特定相互作用関与RNAの平均FPKMを、対数尺度において示す。RNAのHi−C特定相互作用におけるmiRNA及びsnoRNAは、smallRNA−seqとAGO HITS−CLIPとにおいて濃縮された。図17パネルAに示されるように、グラフは、smallRNA−seqデータを表すバーが、HITS−CLIPデータを表すバーの上にくるように示される。 図17はmiRNA様相互作用を伴うsnoRNAを示す。図17Bは、相互作用snoRNA及びmRNAのすべてのペア間の遺伝子発現の相関分布を示す。AGOによって結合された相互作用snoRNA−mRNAペア(濃い灰色)(AGO HITS−CLIPによって規定)は、AGOによって結合されないペア(薄い灰色)よりも負の相関を示した(p−値=4.18−5、コルモゴロフ−スミルノフ検定)。図示されるように、AGO結合ピーク(peack)は約.075、0.25、0、−0.5、及び−1相関に現れる。 図17はmiRNA様相互作用を伴うsnoRNAを示す。図17Cは、ハイブリダイゼーションエネルギーにより測定されるような相互作用RNAの塩基対を示す。AGOにより結合されたsnoRNA及びmRNAペアは、(AGO HITS−CLIPで交差、左側)は、AGOによって結合されないもの(右側)よりも強力なハイブリダイゼーションエネルギーを示した(p−値<2.2−16、ウィルコクソン符号順位検定)。これらすべての相互作用は、無作為にシャッフルされた配列のものよりも強力なハイブリダイゼーションエネルギーを示した。図示されるように、濃い灰色は「実体」を示し、薄い灰色は「無作為」を表す。 図17はmiRNA様相互作用を伴うsnoRNAを示す。図17Dでは、mRNAのUTR領域と相互作用するsnoRNAを、smallRNA−seqとAGO HITS−CLIPとにおいて濃縮した。snoRNAとmRNAとのコーディング領域(左)間の相互作用総数(y軸)を、smallRNA−seq及びAGO HITS−CLIP、smallRNA−seqのみ、AGO HITS−CLIPのみ、及びいずれのデータセットもなし、において検出されたものに分解する。snoRNAとmRNAとのUTR間の相互作用を同様に分解した(右)。左側の棒グラフに示されるように、上部はsmallRNA及びCLIPであり、その後CLIPデータ、smallRNA、そして「いずれもなし」が続く。 図18は、RNAのHi−CとsmallRNA−seqとAGO HITS−CLIPとの比較である。smallRNA−seq、AGO HITS−CLIP、及びその両方と交差したRNAHi−C特定相互作用の割合を示す。RNAHi−C相互作用を関与RNAのタイプによって分類し、該分類をHITS−CLIPとのオーバーラップによって並べた。misc_RNAは、RNase_MRP、7SK RNA及びその他を含む色々なRNAを示す。Novelは未アノテーションRNAを示す。図示されるように、データは上から下に、「両方とオーバーラップ」、「smallRNA−seqとオーバーラップ」データ、及び「HITS−CLIPとオーバーラップ」データとして分かれる。 図19は酵素処理したSNORA14とMcl1 mRNAとの相互作用を示す。図19Aにおいて、SNORA14のRNAHi−C特定相互作用部位はsmallRNA−seqと交差し、SNORA14RNAがより短い形態に酵素処理されたことが示唆された(第2行目、ピークにおける強調部分)。この酵素処理小型RNAは、SNORA14ヘアピンの末端(2次構造の強調部分)と、Mcl1の3’UTRのアンチセンス((B)のSNORA14配列上部の強調部分)とに対応する。 図19は酵素処理したSNORA14とMcl1 mRNAとの相互作用を示す。図19Bについて、SNORA14のRNAHi−C特定相互作用部位はsmallRNA−seqと交差し、SNORA14RNAがより短い形態に酵素処理されたことが示唆され(第2行目、ピークにおける強調部分)、この酵素処理小型RNAは、SNORA14ヘアピンの末端(2次構造の強調部分)と、Mcl1の3’UTRのアンチセンス((B)のSNORA14配列上部の強調部分)とに対応する。 図19は酵素処理したSNORA14とMcl1 mRNAとの相互作用を示す。図19Cは、ES細胞の中内胚葉細胞への分化時に、SNORA14RNA及びMcl1mRNAから処理された小型RNAの発現レベルを示す。図示されるように、Mcl1は0日目から6日目に減少し、一方でSNORA14は0日目から6日目に増加する。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Aは、RNAの全ペアにマッピングされたリードペア数の分布を示す。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Bは、フィッシャーの正確検定から、全てのRNAペアのFDR分布を示す。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Cは、各RNAにマッピングされたRNAHi−Cリード数(y軸)とFPKM(x軸)との散布図である。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Dは、各RNAの相互作用に関連した最小FDR(負の対数)とそのRNAのFPKM(x軸)との散布図である。FPKM値は、mm9に対してbowtie2−2.2.4を用いてマウスENCODEデータセットENCSR000CW(E14マウスES細胞からのペアエンドRNA−Seq)[1]からの生リードをマッピングして、その後cufflink2.2.1.で処理することにより得られた。ENCSR000CWCデータとRNA−Hi−CマウスES細胞データとに見受けられたユニークなEnsembl IDを有する遺伝子全てが、パネル(C)及び(D)に包含される。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Eは、RNAの全ペアにマッピングされたリードペア数の分布を示す。 図20はリードカウントとFDRとの分布及び遺伝子発現との関係を示す。図20Fは、フィッシャーの正確検定から、全てのRNAペアのFDR分布を示す。 図21は、種々のタイプのRNAの中で46,780の特定RNA−RNA相互作用の分布を示す。rRNAは実験(実験ステップ6.2)及びバイオインフォマティクス(解析ステップ6)において解析から除かれた。 図22は、RNA−RNA相互作用ネットワークの次数分布を示す。ノード数(RNA)は、対数尺度においてその次数(相互作用数)に反比例し(A)、スケールフリーなネットワークの特徴を示す。この特性は、ネットワークからsnRNA、snoRNA、及びtRNAを除いた後も変わらなかった(B)。 図23は、種々のタイプの遺伝子及びトランスポゾンにおける相互作用部位の分布を示す。 図24は、RNAのHi−C特定相互作用RNA間の塩基の相補性の例を示す。相互作用RNAのタイプは、mRNA−mRNA(A)、lincRNA−mRNA(B)、偽遺伝子RNA−mRNA(C)、mRNA−LTR(D)、LINE−mRNA(E)、mRNA−miRNA(F)を包含した。LTR及びLINEはトランスポゾン転写物を表す。RNAの3’末端を第2のRNAに連結する、配列左側の曲線は、リンカー位置を表す。各相互作用をサポートするライゲーションされたキメラRNAの数は、曲線の隣の括弧内に示される。ΔGはハイブリダイゼーションエネルギーを示す。シャッフルは無作為にシャッフルされた塩基の平均ハイブリダイゼーションエネルギーを示す。 図25は、相互作用RNAの保存レベルを示す。RNAタイプによって相互作用を分類した。各タイプの相互作用について、RNAライゲーション接合部(x軸の0位置)の中心にあるゲノム領域(1000bp)の平均PhyloPスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、RNA1−リンカー−RNA2キメラRNAのRNA1(右)及びRNA2(左)断片が示される。破線はリンカーを示す。図示されるように、図25AにはmRNA、図25BにはLINE、図25CにはLTRを伴う構造が示される。 図25は、相互作用RNAの保存レベルを示す。RNAタイプによって相互作用を分類した。各タイプの相互作用について、RNAライゲーション接合部(x軸の0位置)の中心にあるゲノム領域(1000bp)の平均PhyloPスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、RNA1−リンカー−RNA2キメラRNAのRNA1(右)及びRNA2(左)断片が示される。破線はリンカーを示す。図示されるように、図25AにはmRNA、図25BにはLINE、図25CにはLTRを伴う構造が示される。 図25は、相互作用RNAの保存レベルを示す。RNAタイプによって相互作用を分類した。各タイプの相互作用について、RNAライゲーション接合部(x軸の0位置)の中心にあるゲノム領域(1000bp)の平均PhyloPスコアによって、保存レベルを推定した。同じ長さの無作為ゲノム領域の保存レベルを対象としてプロットした。グラフの下部には、RNA1−リンカー−RNA2キメラRNAのRNA1(右)及びRNA2(左)断片が示される。破線はリンカーを示す。図示されるように、図25AにはmRNA、図25BにはLINE、図25CにはLTRを伴う構造が示される。 図26は、保存レベルの比較を示す。保存レベルは、相互作用部位のヌクレオチド毎の平均PhyloPスコアによって数量化された(y軸)。エクソン、イントロン及びUTR保存の違いに適応させるため、アノテーションされたエクソン、イントロン、及びUTR(ゲノム特性と称される)における相互作用部位(対のバーの左側のバー)が、同じゲノム特性からの無作為にサンプリングされた200,000のゲノム配列(対のバーの右側のバー)と比較された。無作為にサンプリングされたゲノム配列のサイズは、相互作用のサイズと同じ平均及び変動を共有する。P−値を、片側2サンプルt検定から計算した。**はp−値<10−12、*はp−値<10−6である。 図27は、RNaseI消化密度と1本鎖領域との相関を示す(図27A〜D)。各位置で終了又は開始するリード断片の数によって測定される消化頻度(y軸)を既知の2次構造(fRNAdbデータベースv3.4)(x軸)と比較した。x軸の括弧は2本鎖領域を表す。一本鎖(ss)及び2本鎖(ds)の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。 図27は、RNaseI消化密度と1本鎖領域との相関を示す(図27A〜D)。各位置で終了又は開始するリード断片の数によって測定される消化頻度(y軸)を既知の2次構造(fRNAdbデータベースv3.4)(x軸)と比較した。x軸の括弧は2本鎖領域を表す。一本鎖(ss)及び2本鎖(ds)の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。 図27は、RNaseI消化密度と1本鎖領域との相関を示す(図27A〜D)。各位置で終了又は開始するリード断片の数によって測定される消化頻度(y軸)を既知の2次構造(fRNAdbデータベースv3.4)(x軸)と比較した。x軸の括弧は2本鎖領域を表す。一本鎖(ss)及び2本鎖(ds)の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。 図27は、RNaseI消化密度と1本鎖領域との相関を示す(図27A〜D)。各位置で終了又は開始するリード断片の数によって測定される消化頻度(y軸)を既知の2次構造(fRNAdbデータベースv3.4)(x軸)と比較した。x軸の括弧は2本鎖領域を表す。一本鎖(ss)及び2本鎖(ds)の各位置で終了又は開始するリード断片の総カウントは右側のパネルに集約される。 図28は、分子内ライゲーションを示す。(A)分子内(自己)ライゲーションを、転写物のRNaseI消化、その後のリンカーライゲーションと近接ライゲーションとによって生成した。ゆえに、リンカー両側の2つのRNA断片は同じRNA分子由来であった。これらの分子内ライゲーションイベントは、連続的な転写物から生成され得たペアエンドリードを除去する、厳密なバイオインフォマティク基準で特定された。切断及びライゲーション処理のみにより生成され得るペアエンドリードがRNA構造解析に用いられた。下部パネルは、種々のRNAタイプにおける分子内ライゲーション分布を示す。(B)RNAタイプにおける分子内ライゲーション数(y軸)対転写長(x軸)を示す。エラーバーは平均の標準偏差を示す。1000ntを超える長さにおいて遺伝子毎に10未満のライゲーションのlincRNA、遺伝子毎に10未満の自己ライゲーション及び100nt未満の長さのtRNA、遺伝子毎に100を超える自己ライゲーション未満及び100ntを超える長さのsnoRNA、並びに遺伝子毎に100未満の自己ライゲーション未満及び100ntを超える長さのsnRNAが示される。(C)検出分子内ライゲーション数(x軸)によって分類されたlincRNA遺伝子とmRNA遺伝子との数(影付きバー)と長さ(箱ひげ図)とが示される。 図29はSNORA14のRNAHi−Cリードを示す。図29Aは、SNORA14にマッピングされた分子内ライゲーション産生物を示す。黒い部分に示されるのは、ライゲーション接合部である。影付き番号は、リンカーの5’及び3’において優位に表されたライゲーション接合部の位置である。1−6、1−4及び5−5位置の空間的近接性は、配列予測2次構造と一貫性がある(図29B)。矢印は、配列予測2次構造において互いに近接しない3−5位置を指す。 図29はSNORA14のRNAHi−Cリードを示す。図29Aは、SNORA14にマッピングされた分子内ライゲーション産生物を示す。黒い部分に示されるのは、ライゲーション接合部である。影付き番号は、リンカーの5’及び3’において優位に表されたライゲーション接合部の位置である。1−6、1−4及び5−5位置の空間的近接性は、配列予測2次構造と一貫性がある(図29B)。矢印は、配列予測2次構造において互いに近接しない3−5位置を指す。 図30は構造的に安定した転写物を産生する推定新遺伝子を示す。図30Aは、RNAHi−C予測の新遺伝子のゲノム位置と種間保存とを示す。 図30は構造的に安定した転写物を産生する推定新遺伝子を示す。図30Bは、この新遺伝子にマッピングされた分子間ライゲーション産生物を示す。黒い部分はライゲーション接合部である。影付き番号は優位に表されたライゲーション接合部の位置である。 図30は構造的に安定した転写物を産生する推定新遺伝子を示す。図30Cは、この推定遺伝子から産生された長(下)及び短(上)転写物の配列予測2次構造を示す。各塩基におけるRNase消化の頻度(ヒートマップ)は予測1本鎖領域(下)と相関した。ライゲーション位置(矢印)は、配列予測2次構造において近接する。 図31は、mRNA断片の推定構造を示す。RNAHi−Cリードペアは、Gcn1l1遺伝子の第27エクソンの配列から予測される2次構造に重ね合わされた。ラベル付き曲線は、シーケンシングされたキメラRNAのRNA1及びRNA2部分にそれぞれ対応する。影付き曲線はリンカーを示す。影付き曲線の黒い部分はライゲーション接合部を示す。ポインタはRNaseI切断位置を表す。切断及びライゲーション処理は、2つのRNA断片の5’−3’の順番を入れ替えた。mRNAの5’断片(塩基3122〜3163、赤色)と3’断片(3164〜3194、青色)は、シーケンシングされたキメラcDNAにおいて入れ替えられている(挿入部)。これは作図によって適切に陰影がつけられているはずである。 図32は、配列ライブラリにおいてキメラcDNAを回収するためのワークフローを示す。局所アライメントを用いて、リードペアのフォワード及びリバースリード間の任意のオーバーラップを特定した。局所アライメントを4回用いて(ALIGN1〜ALING4)、任意のリードペアの、可能性のある4タイプの構成を区別した。3タイプ(タイプ1〜3)が出力に含まれた。タイプ1のcDNAは100bpより短かった。タイプ2のcDNAは100bp〜200bpであった。タイプ3のcDNAは200bpより長かった。質的管理として、100bpより短いがP5又はP7シーケンシングプライマーの既知の配列のないcDNAは破棄された(タイプ4)。各アライメントは、「local−align(seq1、seq2){M,m,o,e}」として表され、「seq1」及び「seq2」は2つの入力配列であり、「M」、「m」、「o」、「e」は一致、不一致、開放ギャップ及び延長ギャップペナルティのパラメータである。各アライメントの出力(X)は、アライメントスコア(ScoreX)、第1配列(BeginPos1_X, EndPos1_X)及び第2配列(BeginPos2_X, EndPos2_X)におけるアライメントの開始及び終了位置を包含した。 図33はシミュレーション解析を示す。図33Aは、cDNAの予測長さ(y軸)と実際の長さとの散布図を示す。200bpより長い予測長さのcDNAは包含されなかった。これはその正確な長さが予測できなかったためである。 図33はシミュレーション解析を示す。図33Bは、予測RNAペアとシミュレーションRNAペアとのオーバーラップを示す。 図33はシミュレーション解析を示す。図33Cは、各タイプの関与RNAの予測RNAペアにおける感受性と特異性とを示す。 図34は、マウスES細胞(A)及び脳(B)の観察されたRNA−RNA相互作用ネットワーク全体の次数分布を示す。ノードの数(RNA)は、対数尺度においてその次数(相互作用数)と反比例し、スケールフリーなネットワークの特徴を示す。
[定義]
以下の記載において、多くの用語が広範囲に用いられる。以下の定義は本代替の態様を理解しやすくするために記載される。
本明細書に用いられるように、単数(「a」又は「an」)は1以上を意味し得る。
本明細書に用いられるように、「約」という用語は、値を測定するために採用された方法における誤りの固有の変動、又は実験時に存在する変動を、値が包含することを示す。
本明細書に記載されるような「リボ核酸」、「RNA」は、遺伝子のコード化、デコード化、調節、及び発現における役割に関わる、重合体分子である核酸に関する。本明細書に記載の一部の実施形態において、RNAは、生物学的反応を触媒、遺伝子発現を制御、又は細胞シグナルに対する応答を受け伝達することで、細胞において積極的役割を果たし得る。RNAにはいくつかのタイプがある。RNAは、例えば、メッセンジャーRNA(mRNA)、lincRNA、トランスポゾンRNA、偽RNA、調節RNA、核内低分子RNA(snRNA)、核小体低分子RNA(snoRNA)、二重鎖RNA、長鎖ノンコーディングRNA(長鎖ncRNA又はlncRNA)、マイクロRNA(miRNAs)、短鎖干渉RNA(siRNA)、Piwi相互作用RNA(piRNA)、及びその他のタイプの短鎖RNAを、限定することなく含み得る。一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供される。該方法は、RNAをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含み得る。一部の実施形態において、RNAは、メッセンジャーRNA(mRNA)、調節RNA、核内低分子RNA(snRNA)、核小体低分子RNA(snoRNA)、二重鎖RNA、長鎖ノンコーディングRNA(長鎖ncRNA若しくはlncRNA)、マイクロRNA(miRNA)、短鎖干渉RNA(siRNA)、Piwi相互作用RNA(piRNA)、又は当業者には既知のその他のタイプの短鎖RNAである。
本明細書に記載されるような「キメラRNA」は、RNA複合体に関し、RNA複合体は、同じタンパク質分子にライゲーションされたライゲーションRNAを含み、RNAは互いにライゲーションされてこのキメラRNAを形成する。一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供される。該方法は、RNAをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含み得る。一部の実施形態において、RNAは、メッセンジャーRNA(mRNA)、調節RNA、核内低分子RNA(snRNA)、二重鎖RNA、長鎖ノンコーディングRNA(長鎖ncRNA若しくはlncRNA)、マイクロRNA(miRNA)、短鎖干渉RNA(siRNA)、Piwi相互作用RNA(piRNA)、核小体低分子RNA(snoRNA)、又は当業者には既知のその他のタイプの短鎖RNAである。一部の実施形態において、単離複合体が提供され、該単離複合体はタンパク質に架橋されたキメラRNAを含み、該キメラRNAは細胞において相互作用するRNAを含む。
本明細書に記載されるような「架橋する」又は「架橋された」とは、一方からから他方のポリマーに結合可能であるという結合に関する。架橋は、共有結合又はイオン結合を介して行われ得る。一部の実施形態において、RNAは、UV誘導架橋によってタンパク質に架橋される。紫外線によるタンパク質−核酸複合体(タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体)の照射により、核酸と、核酸に緊密に接触したタンパク質との間に、共有結合を形成させ得る。本明細書における一部の実施形態において、RNAはUV照射によりタンパク質に架橋される。
架橋は、リンカーや、当業者には既知のその他の架橋方法を用いても行われ得る。一部の実施形態において、架橋は、タンパク質を共に結合するプローブや、当業者には既知のその他の架橋方法を用いて行われ得る。また架橋は、合成高分子化学や生物化学において用いられ得る。種々の条件によって開始される化学反応によって、架橋は形成され得る。架橋は、例えば、加熱、圧力変化、pH変化、紫外線、電子ビーム曝露、ガンマ線照射、及び/又は当業者には既知のその他のタイプの照射によって開始され得るが、限定はされない。さらに、架橋は、2つのポリマー間に架橋を行う化学反応をもたらす架橋試薬によっても誘導され得る。本明細書に記載の一部の実施形態において、架橋は、加熱、圧力変化、pH変化、紫外線、電子ビーム曝露、ガンマ線照射、及び/又は当業者には既知のその他のタイプの照射によって開始される。
架橋試薬は、アミン間クロスリンカー、スルフヒドリル間クロスリンカー、アミン−スルフヒドリルクロスリンカー、スルフヒドリル−炭水化物クロスリンカー、光反応性クロスリンカー、官能基選択的ライゲーション架橋試薬、インビボ架橋試薬、及びカルボキシル−アミンクロスリンカーを含み得るがこれらに限定されない。一部の実施形態において、架橋試薬は、ホルムアルデヒド、DSG(ジスクシンイミジルグルタレート)、DSS(ジスクシンイミジルスベレート)、BS3(ビス(スルホスクシンイミジル)スベレート)、TSAT(トリス−(スクシンイミジル)アミノトリアセテート)、BS(PEG)5(PEG化ビス(スルホスクシンイミジル)スベレート)、BS(PEG)9(PEG化ビス(スルホスクシンイミジル)スベレート)、DSP(ジチオビス(スクシンイミジルプロピオネート))、DTSSP(3,3’−ジチオビス(スルホスクシンイミジルプロピオネート))、DST(ジスクシンイミジルタルトレート)、BSOCOES(ビス(2−(スクシンイミドオキシカルボニルオキシ)エチル)スルホン)、EGS(エチレングリコールビス(スクシンイミジルスクシネート))、スルホ−EGS(エチレングリコールビス(スルホスクシンイミジルスクシネート))、DMA(ジメチルアジピミデート)、DMP(ジメチルピメルイミデート)、DMS(ジメチルスベルイミデート)、DTBP(Wang及びRichard試薬)、DFDNB(1,5−ジフルオロ−2,4−ジニトロベンゼン)、BMOE(ビスマレイミドエタン)、BMB(1,4−ビスマレイミドブタン)、BMH(ビスマレイミドヘキサン)、TMEA(トリス(2−マレイミドエチル)アミン)、BM(PEG)2(1,8−ビスマレイミド−ジエチレングリコール)、BM(PEG)3(1,11−ビスマレイミド−トリエチレングリコール)、DTME(ジチオビスマレイミドエタン)、SIA(スクシンイミジルヨードアセテート)、SBAP(スクシンイミジル3−(ブロモアセトアミド)プロピオネート)、SIAB(スクシンイミジル(4−ヨードアセチル)アミノベンゾアート)、スルホ−SIAB(スルホスクシンイミジル(4−ヨードアセチル)アミノベンゾアート)、AMAS(N−α−マレイミドアセト−オキシスクシンイミドエステル)、BMPS(N−β−マレイミドプロピル−オキシスクシンイミドエステル)、GMBS(N−γ−マレイミドブチリル−オキシスクシンイミドエステル)、スルホ−GMBS(N−γ−マレイミドブチリル−オキシスルホスクシンイミドエステル)、MBS(m−マレイミドベンゾイル−N−ヒドロキシスクシンイミドエステル)、スルホ−MBS(m−マレイミドベンゾイル−N−ヒドロキシスルホスクシンイミドエステル)、SMCC(スクシンイミジル4−(N−マレイミドメチル)シクロヘキサン−1−カルボキシレート)、スルホ−SMCC(スルホスクシンイミジル4−(N−マレイミドメチル)シクロヘキサン−1−カルボキシレート)、EMCS(N−ε−マレイミドカプロイル−オキシスクシンイミドエステル)、スルホ−EMCS(N−ε−マレイミドカプロイル−オキシスルホスクシンイミドエステル)、SMPB(スクシンイミジル4−(p−マレイミドフェニル)ブチレート)、スルホ−SMPB(スルホスクシンイミジル4−(N−マレイミドフェニル)ブチレート)、SMPH(スクシンイミジル6−((ベータ−マレイミドプロピオンアミド)ヘキサノエート))、LC−SMCC(スクシンイミジル4−(N−マレイミドメチル)シクロヘキサン−1−カルボキシ−(6−アミドカプロエート))、スルホ−KMUS(N−κ−マレイミドウンデカノイル−オキシスルホスクシンイミドエステル)、SPDP(スクシンイミジル3−(2−ピリジルジチオ)プロピオネート)、LC−SPDP(スクシンイミジル6−(3(2−ピリジルジチオ)プロピオンアミド)ヘキサノエート)、スルホ−LC−SPDP(スルホスクシンイミジル6−(3’−(2−ピリジルジチオ)プロピオンアミド)ヘキサノエート)、SMPT(4−スクシンイミジルオキシカルボニル−アルファ−メチル−α(2−ピリジルジチオ)トルエン)、PEG4−SPDP(PEG化、長鎖SPDPクロスリンカー)、PEG12−SPDP(PEG化、長鎖SPDPクロスリンカー)、SM(PEG)2(PEG化SMCCクロスリンカー)、SM(PEG)4(PEG化SMCCクロスリンカー)、SM(PEG)6(PEG化、長鎖SMCCクロスリンカー)、SM(PEG)8(PEG化、長鎖SMCCクロスリンカー)、SM(PEG)12(PEG化、長鎖SMCCクロスリンカー)、SM(PEG)24(PEG化、長鎖SMCCクロスリンカー)、スクシンイミジル3−(2−ピリジルジチオ)プロピオネート(SPDP)、SMCC、スクシンイミジルトランス−4−(マレイミジルメチル)シクロヘキサン−1−カルボキシレート、BMPH(N−β−マレイミドプロピオン酸ヒドラジド)、EMCH(N−ε−マレイミドカプロン酸ヒドラジド)、MPBH(4−(4−N−マレイミドフェニル)酪酸ヒドラジド)、KMUH(N−κ−マレイミドウンデカン酸ヒドラジド)、PDPH(3−(2−ピリジルジチオ)プロピオニルヒドラジド)、ANB−NOS(N−5−アジド−2−ニトロベンゾイルオキシスクシンイミド)、スルホ−SANPAH(スルホスクシンイミジル6−(4’−アジド−2’−ニトロフェニルアミノ)ヘキサノエート)、SDA(NHS−ジアジリン)(スクシンイミジル4,4’−アジペンタノエート)、スルホ−SDA(スルホ−NHS−ジアジリン)(スルホスクシンイミジル4,4’−アジペンタノエート)、LC−SDA(NHS−LC−ジアジリン)(スクシンイミジル6−(4,4’−アジペンタンアミド)ヘキサノエート)、スルホ−LC−SDA(スルホ−NHS−LC−ジアジリン)(スルホスクシンイミジル6−(4,4’−アジペンタンアミド)ヘキサノエート)、SDAD(NHS−SS−ジアジリン)(スクシンイミジル2−((4,4’−アジペンタンアミド)エチル)−1,3’−ジチオプロピオネート)、スルホ−SDAD(スルホ−NHS−SS−ジアジリン)(スルホスクシンイミジル2−((4,4’−アジペンタンアミド)エチル)−1,3’−ジチオプロピオネート)、ATFB、SE、4−アジド−2,3,5,6−テトラフルオロ安息香酸、スクシンイミジルエステル、SDA(NHS−ジアジリン)(スクシンイミジル4,4’−アジペンタノエート)、SPB(スクシンイミジル−[4−(ソラレン−8−イルオキシ)]−ブチレート)、L−フォト−ロイシン、L−フォト−メチオニン、ManNAz(N−アジドアセチルマンノサミンテトラアシル化)、GalNAz(N−アジドアセチルアジドガラクトサミンテトラアシル化)、DCC(ジシクロヘキシルカルボジイミド)、DyLight550−ホスフィン、DyLight650−ホスフィン、EZ−Linkホスフィン−PEG3−ビオチン、EZ−Linkホスフィン−PEG4−デスチオビオチン、EDC(1−エチル−3−(3−ジメチルアミノプロピル)カルボジイミドヒドロクロリド)、NHS(N−ヒドロキシスクシンイミド)、スルホ−NHS(N−ヒドロキシスルホスクシンイミド)、スルホ−NHS(N−ヒドロキシスルホスクシンイミド)、スルホ−NHS(N−ヒドロキシスルホスクシンイミド)又はスルホ−NHS(N−ヒドロキシスルホスクシンイミド)を含む。
本明細書に記載されるような「固定化」は分子の捕捉に関し、捕捉は特定分子又は標識に特異的な第1の分子によって行われる。一部の実施形態において、固定化は捕捉分子を固体サポートに接着することで行われる。固体サポートはビーズ又はカラムであり得る。一部の実施形態において、固体サポートは、ストレプトアビジン又はその一部など、分子を捕捉するストレプトアビジン分子を含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。
本明細書に記載されるような「断片化」とは、核酸の消化又は分解に関し得る。本明細書に記載される方法の一部の実施形態において、RNAは酵素により断片化される。RNA分解は種々のヌクレアーゼにより行われ得る。例えば、リボヌクレアーゼ(RNAse)は、より小さい成分へのRNAの分解を触媒できるヌクレアーゼの一種である。RNAseはエンドリボヌクレアーゼとエキソリボヌクレアーゼとに分かれ得る。一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供され、該方法は、RNAをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合するステップをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。
本明細書に記載されるような「ビオチン」とは、ビタミンH又は補酵素Rとしても既知の水溶性Bビタミンに関する。本明細書に記載の一部の実施形態において、ビオチンは、ビーズなどの固体サポートにストレプトアビジン分子で捕捉するためにRNAを標識するように用いられ得る。一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供され、該方法は、RNAをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合するステップをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質はシステイン残基でビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤にライゲーションするステップをさらに含む。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションするステップを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法は、キメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。
本明細書に記載されるような「タンパク質」とは、1以上のポリペプチド鎖を含む高分子に関する。ゆえにタンパク質は、ペプチド(アミド)結合によって結合されたアミノ酸モノマー鎖であり、任意の1以上のアミノ酸によって形成されたペプチドからなり得る。タンパク質又はペプチドは、少なくとも2つのアミノ酸を含み得、タンパク質又はペプチド配列に含み得るアミノ酸の最大数には制限が設けられない。アミノ酸は、例えば、アルギニン、ヒスチジン、リシン、アスパラギン酸、グルタミン酸、セリン、トレオニン、アスパラギン、グルタミン、システイン、シスチン、グリシン、プロリン、アラニン、バリン,ヒドロキシプロリン、イソロイシン、ロイシン、ピロリシン、メチオニン、フェニルアラニン、チロシン、トリプトファン、オルニチン、S−アデノシルメチオニン、及びセレノシステインであるが、限定されることはない。タンパク質は、炭水化物基などの非ペプチド成分をも含み得る。炭水化物及びその他の非ペプチド置換基は、タンパク質が生成される細胞によってタンパク質に加えられることができ、細胞型で変わり得る。代謝反応、DNA複製を触媒すること、刺激に応答すること、及び分子を一方から他方の位置に輸送することで、タンパク質は生体内で機能し得るが、限定されることはない。例として、タンパク質は、酵素、膜貫通タンパク質、及び輸送用抗体、生体小分子や、受容体又はホルモンであり得る。一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供され、該方法は、RNAをタンパク質に架橋するステップと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含む。一部の実施形態において、タンパク質は酵素である。一部の実施形態において、タンパク質は、輸送、又は代謝反応の触媒に関連する。
本明細書に記載されるような「インタラクトーム」とは、特定の細胞における一連の分子相互作用全体に関する。該用語は、分子間の物理的相互作用(タンパク質−タンパク質相互作用としても既知の、タンパク質間物理的相互作用など)に特に関するが、RNA−RNA相互作用、又は1以上のRNAとタンパク質分子との相互作用などの、遺伝子間の一連の非直接的相互作用(遺伝子相互作用)も示し得る。一部の実施例において、インタラクトームはグラフで示され得る。一部の実施形態において、本方法及び構成は、実質的にすべてのタンパク質補助RNA−RNA相互作用を、1つのアッセイにおいてマッピングする。本明細書に記載の一部の実施形態において、該方法は、RNAインタラクトームの初めての全体マップを作製するために適用される。一部の実施形態において、インタラクトームは特定の細胞から作製される。一部の実施形態において、細胞はヒト由来のものである。一部の実施形態において、細胞は、がん細胞、腫瘍細胞、リンパ球、又は免疫細胞である。一部の実施形態において、インタラクトームは疾患の由来を究明又は予測するために用いられ得る。
本明細書に記載されるような「タンパク質複合体」は、群であるか又は2以上の、関連タンパク質又はポリペプチド鎖に関し、「多タンパク質複合体」としても言及され得る。一部の実施形態において、タンパク質複合体結合核酸を含む複合体が提供される。一部の実施形態において、核酸はRNAである。
本明細書に記載されるような「タンパク質中間体」は、ある処理又は特定の経路において、互いに結合したり離れたりすることができるタンパク質に関し、また「タンパク質結合中間体」としても言及され得る。タンパク質中間体が結合すると考えられる例として、転写、翻訳、及び代謝経路などの処理が、限定されることなく含まれる。タンパク質結合中間体の例として、ポリメラーゼ、核酸結合タンパク質、RNA認識モチーフタンパク質、ヘテロリボヌクレオタンパク質粒子、及び当業者に既知のその他のタンパク質結合中間体が限定されることなく含まれ得る。一部の実施形態において、タンパク質中間体結合核酸を含む複合体が提供される。一部の実施形態において、核酸はRNAである。一部の実施形態において、タンパク質中間体は、他のタンパク質中間体と相互作用して、タンパク質複合体を形成し、タンパク質複合体はタンパク質中間体を含むものである。
[発明の詳細な説明]
本明細書において開示されるのは、細胞におけるRNA―RNA直接相互作用を特定するための方法及び構成である。一部の実施形態において、該方法及び構成は、細胞における少なくとも約100、少なくとも約500、少なくとも約1000、又は約1000を超えるRNA−RNA相互作用を特定するために用いられ得る。一部の実施形態において、方法及び構成は、約100、約200、約300、約300、約500、約600、約700、約800、約900、約1000、約2000、約3000、約4000、約5000、約6000、約7000、約8000、約9000、若しくは約10,000のRNA−RNA相互作用、又は任意の2つのこれら前述の値の間の、任意の他の数のRNA−RNA相互作用を特定するために用いられ得る。その他の実施形態において、該方法及び構成は、細胞における、実質的にすべてのRNA−RNA直接相互作用を特定するために用いられ得る。例として、該方法及び構成は、細胞における、少なくとも約70%、少なくとも約80%、少なくとも約90%、又は約90%を超えるRNA−RNA直接相互作用を特定するために用いられ得る。一部の実施形態において、該方法及び構成は、細胞における、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは約100%のRNA−RNA直接相互作用、又は任意の2つの前述の値の間の、任意の他のパーセントのものを特定するために用いられ得る。この方法は、任意の特定のRNA配列に対する知識によるものではなく、この有益性の1つは未知のRNA−RNA相互作用を特定することにある。
ゲノムの約5%のみがタンパク質に翻訳されるRNAをコードする。ゲノムの約50%が、マイクロRNA及び長鎖ncRNA(200ntより長い)などのノンコーディングRNA(ncRNA)を含むRNAに転写される。ncRNAは、タンパク質関連相互作用を介して、他のRNAとしばしば相互作用する。ゆえに、RNA−RNA直接相互作用は、タンパク質に基づく捕捉方法を用いて特定され得る。一部の実施形態において、該RNA−RNA直接相互作用は、タンパク質に基づく捕捉方法を用いて特定され得る。
RNA−RNA相互作用はRNA調節機能に必須であるものの、これらを全体的に調査する技術は未だ存在しない。HITS−CLIP(Nature、460、479−486)及びCLASH(Cell、153,654−665)を含む利用可能な技術は、選択タンパク質に付けられたRNAをマッピングできるのみである。そのような、一度に1つのタンパク質、という手法では、RNAインタラクトーム全体をマッピングできない。
一部の実施形態において、本方法及び構成は、実質的にすべてのタンパク質補助RNA−RNA相互作用を、1つのアッセイでマッピングする。本明細書に記載の一部の実施形態において、該方法は、RNAインタラクトームの初めての全体マップを作製するために適用されている。一部の実施形態において、該方法及び構成は、タンパク質特異的抗体の必要性又はタグ付けされたタンパク質発現の必要性がないというものである。このため、RNAインタラクトームの偏りのないマッピングが可能になる。知るところでは、他の方法では、一度に1つのRNA結合タンパク質を扱えるのみである。本明細書に記載の実施形態により、RNA−RNA相互作用が複数のRNA結合タンパク質について特定され得るという驚くべき結果がもたらされる。
一部の実施形態では、本方法及び構成によって、架橋する前に任意の外来的ヌクレオチド又はタンパク質コード遺伝子を導入する(CLASH)ことなく、内在的細胞条件が解析される。一部の実施形態は、形質転換細胞株を必要とする(CLASH)というより、任意の細胞型又は組織を解析するために広く適用可能である。
一部の実施形態では、本方法及び構成によって、HITS−CLIPの大きな短所が克服される。HITS−CLIPで推定されたRNA−RNA相互作用は、解析された細胞において必ずしも起こるわけではなかった。これは、HITS−CLIPにおいて共に出現する任意の2つのRNAについて、いずれかのRNAが標的タンパク質の異なるコピーに独立的に接着することからもたらされ得たという理由による。しかしながら、一部の実施形態において、本方法及び構成はRNAの物理的相互作用を確実に示す。
マウス胚性幹(embryonic stem、ES)細胞のRNAインタラクトームがマッピングされており、本明細書において、新しい発見が以下に示される。
1.長鎖RNAはしばしば相互に作用する。数千のmRNA−mRNA相互作用と、数百のlincRNA−mRNA、トランスポゾンRNA−mRNA、偽遺伝子RNA−mRNA相互作用とが、マウスES細胞において存在する。
2.長鎖RNA間の相互作用では、転写物の小片がしばしば用いられる。タンパク質相互作用ドメインとの類似について、RNA相互作用部位の概念が本明細書に示される。RNA相互作用部位では、長鎖RNA相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。
3.RNAインタラクトームはスケールフリーなネットワークであり、強力に連結されたいくつかの、lincRNA及びmRNAのハブを有する。例示の実施形態において、Malat1 lincRNA及びSlc2a3 mRNAである2つのハブ間の相互作用が、2色の単一分子RNA−FISHを用いて実験において検証されている。
4.実質的に、すべての発現snoRNAは、miRNA様小型RNAへと酵素処理されて、RISC複合体においてmRNAと相互作用する。
本方法及び構成の一部の実施形態は、分子間相互作用をマッピングするために用いられ得るが、RNA構造に関する特有の情報もまた示し得る。RNAのHi−Cの分子内リードにより、RNAの種々のセグメントの空間的近接情報が得られた。そのように、初めてそうした情報が高スループットな手法で利用可能になった。さらに、同アッセイ時に、すべてのRNAの1本鎖領域が副産物として取得された。例示の実施形態において、RNAはタンパク質によって曲げられ、そうした四次構造はHi−Cの分子内リードにより捕捉された。
一部の実施形態において、該方法は、(1)RNA1とRNA2とをタンパク質(又はタンパク質中間体若しくはタンパク質複合体)に架橋して、複合体を形成するステップと、(2)タンパク質を標識する(例えばビオチン)ステップと、(3)RNAを断片化するステップと、(4)標識したタンパク質(例えばビオチン−ストレプトアビジン−ビーズ)を捕捉するステップと、(5)ビオチンタグ付きRNAリンカーをRNA1及びRNA2の5’末端にライゲーションするステップと、(6)キメラを形成するRNA1−リンカー−RNA2をライゲーションするために近接ライゲーションを行うステップと、(7)複合体をプロテアーゼ処理して、RNA1−リンカー−RNA2キメラを放出する(DNAse処理)ステップと、(8)ビオチンタグ付きRNAリンカーに相補的なDNAプローブにハイブリダイズして、ライゲーションしなかったビオチン化RNAリンカーを除去するためにT7エキソヌクレアーゼで処理するステップと、(9)最終シーケンシング支援のため、核酸を約150ntに断片化するステップと、(10)ストレプトアビジンビーズを用いてRNA1−リンカー−RNA2キメラを捕捉するステップと、(11)RNA1−リンカー−RNA2をcDNAに変換して、cDNAの少なくとも一部のシーケンシングを行うステップと、を含む。一部の実施形態において、RNA1とRNA2とを特定するために、バイオインフォマティクスが用いられる。
本方法及び構成は、新規治療ターゲットを開拓するRNA治療の企業による使用、RNA−RNA相互作用研究を行うリサーチャーによる使用、及びデバイスや試薬の企業による研究及び発見デバイスのための開発を含む、種々の環境で適用できる。
ノンコーディングRNA(ncRNA)は、遺伝子発現調節を含む、広範な範囲の細胞プロセスに関わる。マイクロRNA(miRNA)及び長鎖ncRNA(lncRNAs)は既知の調節機能を有する2つの分類のncRNAである。転写後又はエピジェネティクスレベルでの遺伝子発現を調節するこれらのncRNAの能力により、ncRNAを用いた治療の新しい機会がもたらされる。ncRNAやメッセンジャーRNA(mRNA)間の直接相互作用の特定は、ncRNAの調節機能の理解において避けられないステップである。miRNA及びlincRNA標的は、その他のncRNAの潜在的な調節機能を発見するように設計もされる本明細書の実施形態に記載の技術によって特定可能な相互作用のごく一部であるのみである。しかしながら、これら2つの分類のncRNAのみによって推し進められる診断や治療法の市場は既に重要なものである。
miRNAは、遺伝子発現の主要な調節因子としての役割を担うノンコーディングリボ核酸群である。近年の研究において、特にがん、心血管性、及び神経性疾患である疾患におけるmiRNAの重要性がさらに明らかになっている。大規模クローニングの試みにより、miRNAの豊富さと多様性が明らかにされている。ヒトゲノムは1000までのmiRNAをコードすると推定されており、これらは、すべての遺伝子の3分の1を調節すると予測される。神経プロセスにおいて、miRNAは、中枢神経系(CNS)の発達と可塑性との主要な媒介物である。外傷性脊髄損傷、外傷性脳損傷、アルツハイマー病、パーキンソン病、及びハンチントン病という多様な神経障害に、miRNAが関わることが多くの裏付けにより示される。miRNA由来の調節の大きな特徴は、複数の代謝遺伝子を調節する肝臓特異的なmiR−122によって例示されるように、機能的に関連する複数のmRNAを調節する単一のmiRNAの能力にある。所定のmiRNAは、平均して、エフェクター分子が細胞経路及びネットワークの種々の部位で機能する数百の転写を調節可能である。このため、miRNAは、細胞プログラム間で迅速に切替え可能であり、ゆえに、ヒトゲノムの主要な調節因子としてしばしば捉えられている。
最初のヒトmiRNAが発見されたのはたった10年前であるが、miRNAを用いた治療は既にフェーズ2の臨床試験に入った(Santarisが開発した、miR−122アンタゴニストのSPC3649が、ウイルス複製を阻害するためにHCV患者に投与される)。発見から開発へのこのような速い展開は、ヒト疾患の重大な調節因子としてのmiRNAの重要性を反映しており、現在の薬剤開発パイプラインに対する魅力のある追加物となり得る新しい薬効分類を生み出す可能性を秘めている。
miRNAを用いた治療開発に用いられる原理となるものは、薬剤標的から薬剤へと道すじをとるその他の標的治療に対するものと同様である。例として、標的特定及び標的検証は、疾患プロセスに原因として関わるmiRNAの選択に重要である。さらに、十分な効能、特異性、及び無毒性を確実にするために、慎重な薬剤開発が必要とされる。しかしながら、miRNAは、他のいずれとも関連しない薬剤標的分類をなすことから、新規の補助的技術と方法とがまた必要とされる。miRNAの治療可能性の利用において大きく欠落しているのは、miRNAの標的mRNAを特定するアッセイである。一部の実施形態において、本方法及び構成は、治療方法と組成物との開発に使用され得る。
がん治療市場は現在のところ1千億近くであり、次の5年で急激に拡大すると見込まれる。マイクロRNAを用いた治療法は当該分野の最先端となっている。一部のアナリストによると、治療的miRNA毎の1.5億ドルのマーケットに基づき、治療可能性のある50のmiRNAが使用認可されることを考慮すると、75億ドルに相当する市場を占めると推測される。
一部の実施形態において、本構成及び方法は、いずれのmiRNAによる治療的適用においても避けられない欠落を埋めるものである。本方法及び構成のその他の適用には、神経障害における治療的適用や研究所を含む。
lincRNAは、エピジェネティクスリモデリング複合体とクロマチンとの相互作用を媒介可能である200ntを超える長さのタンパク質ノンコーディング転写物である。ヒトのがんにおけるlncRNA機能をより深く理解することで、可能性のある標的がん遺伝子数を増やせるだけでなく、アンチセンスRNA又は標的lncRNA−タンパク質相互作用によって媒介される遺伝子調節など、新規の抗がん治療の開発を促すこともできる。正常状態と疾患状態とにおけるlncRNAの役割をより深く理解することで、lncRNAが、診断又は予測バイオマーカーとしても使用できるということが考えられる。例として、lncRNA HOTAIRは、原発性乳がん及び転移において発現が増加し、原発性腫瘍におけるその発現レベルは最終的な転移と死亡についての強力な予測因子となる。臨床について見ると、前立腺がんにおいて多く過剰発現される前立腺がん抗原3(PCA3)という名のlncRNAは、図らずも尿に見受けられ、テストが容易である。再度の前立腺生検の必要性決定を支援する初めての尿用分子テストであるProgensaPCA3テストという名の市販のキットは、近年、FDAにより臨床適用について認可された。lncRNAの疾患調節における重要性はがんに限ったことではない。lncRNAはまた遺伝的病態にも重要な役割を果たすとGibbは記載しており、lncRNA調節解除は短指症やHELLP症候群に関連している。他のlncRNAでは、アルツハイマー病経路における重要な酵素についてmRNAを安定化することが示された。lncRNAが主要なヒト疾患に緊密に関連し、疾患診断及び予後において、タンパク質コードRNAと比較してより高い能力があり得るということを、多くの証拠が示唆している。さらに、現在利用可能な薬剤及びツール化合物の大部分は作用の阻害機構を示しており、治療的有用性のためにエフェクター又は経路の活性を増大可能な医薬剤が相対的に欠如している。実際に、種々の遺伝性疾患において不足する腫瘍抑制因子、成長因子、転写因子及び遺伝子を含む多くの遺伝子の上向き調節は、特定の状態において望まれるものである。多くの報告において、lncRNAがRNAiトリガーによってしばしば抑制され得ることが示される。他の遺伝子を抑制するRNAiによる標的lncRNAは、遺伝子発現を活性化可能である。一部の実施形態において、該方法及び構成は、対象細胞において上向き調節された遺伝子の有無を検出するために用いられ得る。一部の実施形態において、細胞は腫瘍細胞、がん細胞、又は免疫細胞を含む。一部の実施形態において、該方法は、上向き調節された遺伝子の情報を含むトランスクリプトームの評価により、疾患又は疾患の転帰を特定又は予測するために用いられ得る。
このように、一部の実施形態において、本方法及び構成はmiRNA治療法市場の企業に使用され得、該企業は、がん細胞における遺伝子調節ネットワークをノーマライズするか、又は心血管及び筋肉疾患を処置するためにmiRNAの再現を利用する。例示の実施形態において、本方法及び構成は、候補産生物を検証し、また新規の標的を開拓するために利用され得る。
一部の実施形態において、本方法及び構成は、RNAのHi−Cキットを製造するために用いられ得る。その他の実施形態において、本方法及び構成は、研究用オリゴヌクレオチドを提供するために用いられ得る。例として、本方法及び構成は、包括的lncRNA標的RNAiトリガーライブラリの文脈において利用され得る。一部の実施形態において、本方法及び構成は、RNAi標的化のために可能性のあるlncRNA候補を特定するように用いられる。
一実施形態において、細胞におけるRNA−RNA相互作用をマッピングする技術が提供される。一実施形態において、該方法及び構成は、1つの実験で実質的にすべてのRNA−RNA相互作用を偏りなくマッピングし、1対1の分解能(どのRNAがどのRNAと相互作用するか)を提供する。一部の実施形態は、新規の実験的構成要素と新規の計算方法とを包含する。一部の実施形態は、所定の細胞型の細胞から開始して、この細胞型の、直接的に相互作用するRNAの一覧をマッピングする。本方法及び構成は、マウスの胚性幹細胞に適用され、1つの実験を用いて4049のRNA−RNA相互作用を特定した。一実施形態において、実験的構成要素は、これらの細胞を入力として、実質的にすべてのRNA−RNA直接相互作用をキメラRNA分子に形質転換し、そしてペアエンドシーケンシングを用いてこれらのキメラRNAをシーケンシングする。一部の実施形態は、(1)すべてのタンパク質−RNA複合体(タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体)を磁性ビーズに固定化すること、(2)相互作用RNAに近接によるライゲーションを行うこと、(3)キメラRNA分子を選択的に精製すること、(4)キメラ転写の高スループットシーケンシングを行うこと、を含む。本明細書に記載の一実施形態において、該方法は、これらのシーケンシングデータを入力として高信頼性RNA−RNA相互作用の一覧を作製するバイオインフォマティクプログラムを使用することをさらに含み得る。
現在、一細胞型における実質的にすべてのRNA−RNA相互作用を一度に直接的に分析できる効率的な方法はない。部分的にこの目的を達成するために存在する2種類の方法があり、共に脆弱性がある。まず、インビボにおいて1つのみのmiRNA/lincRNAの標的を実験的に特性評価することが先駆的技術と考えられる[Lal等、2011年;Baigude等、2012年;Kretz等、2013年]。次に、多数のmiRNAの標的を検出可能なHITS−CLIPやCLASHなどのその他の技術も制限がある。主要な共通の一制限は、共に、ごく一部のRNAを含むのみであるmiRNAに集中することである。このように、これらの技術では大部分のRNA−RNA相互作用を明らかにすることができない。さらに各技術にはそれ独自の特定の脆弱性がある。
架橋免疫沈降法によって単離されたRNAの高スループットシーケンシング(HITS−CLIP)は、現在のところ、miRNA標的のゲノム全体の解析について最も信頼のおける方法である[Chi等、2009年]。HITS−CLIPは、組織に存在するmiRNAの全捕集物、そしてmiRNAによって調節されるmRNAのすべての捕集物を特定可能にする。しかしながら、miRNAとその標的mRNAとの直接ペアリングは、HITS−CLIPから直接的に推論できない。換言すると、どのmiRNAがどのmRNAを調節するかは、HITS−CLIPからは直接的には分からない(1対1の情報はない)。
CLASH(cross−linking,ligation,and sequencing of hybrids、ハイブリッドの架橋、ライゲーション、及びシーケンシング)という名称の近年の方法では、mRNA−標的ペアを直接的に観察可能である。しかし、相互作用の数は、配列リードの数と比較して未だ少ないものであり、配列リードの2%のみがキメラであり、98%が未だシングルリードである。miRNA−mRNA相互作用を十分に包含するために、複数のサンプルのより深いシーケンシング範囲又は調製が必要とされる。
一部の実施形態において、本方法及び構成は、RNAキメラを作製及び濃縮するために実験的及び計算的構成要素を包含し、すべてのRNA−RNA相互作用情報の、偏りのない、ゲノム全体の、直接的なアッセイがマッピングされ得る。
一部の実施形態において、本方法及び構成では、
1.キメラRNAを用いて1対1の分解能ですべてのRNA−RNA相互作用を直接的にアッセイすること、
2.ライゲーション効率及び相互作用特定の精度を向上させるために特定のリンカーを使用すること、
3.所望のキメラRNA−RNA産生物の選択的精製が、ライゲーションされなかった産生物の除去及びビオチンプルダウンにより行われること、
4.RNAリガーゼの代わりにシーケンシングアダプターを付加するためにssDNAサークリガーゼ(Circligase)を使用することによって高スループットシーケンシングのためにライブラリ調製の効率を向上すること、が提供される。
一部の実施形態において、本方法及び構成では、
1.実験ステップによって生成されたすべての配列リードからキメラRNA配列を特定すること、
2.それらのキメラをアノテーションRNAクラスタに形質転換すること、
3.統計テストを用いてこれらのRNAクラスタ間の強力な直接的相互作用を特定すること、が可能である。
上記において言及されたように、一部の技術では、インビボにおいて1つのみのmiRNA/lincRNAの標的が特性評価される(例えば、Lal等、2011年;Baigude等、2012年;RNA interactome analysis)。
上記において言及されたように、一部の技術では、多数のmiRNAの標的を検出可能だが、miRNAに限られる(例えば、これも直接的な1対1の情報を欠いたHITS−CLIP、PAR−CLIP、及びごく一部のキメラRNAのみを提供するCLASH)。このように、本明細書に記載の本実施形態は、RNAをmiRNAなど小さいサブセットに制限しないことで、先行する方法に対する有利性をもたらす。
例示の一実施形態は、図4に示される。簡潔に言えば、細胞はUV架橋によってインビボにおいて架橋される。UV架橋には、RNAが対象タンパク質に共有結合されるが、タンパク質は互いに架橋されないという有利性がある。
RNAとタンパク質との間に形成される共有結合相互作用は、架橋RNA断片の厳密な精製を可能にする。細胞は溶解され、溶解物は、RNaseIによる部分的RNase消化に供される。また、タンパク質において、システイン残基はビオチン化される。タンパク質−RNA複合体(タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸、を含む複合体であって、核酸はRNAである)を含むタンパク質は、ストレプトアビジンビーズに固定化される。そして、RNAの5’末端は、続くキメラRNAの選択的精製を容易にするために、ビオチンタグ付きRNAリンカー(24nt)にライゲーションされる。次に、架橋RNA断片間のライゲーションに有利である希薄条件下で、近接によるライゲーションがビーズにおいて行われる。タンパク質−RNA複合体(タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸、を含む複合体であって、核酸はRNAである)はストレプトアビジンビーズから溶出され、結合タンパク質を消化することでRNAが回収される。そして、精製RNAを、24ntRNAリンカーに相補的であるDNAプローブにハイブリダイズして、ライゲーションしなかったビオチン化RNAリンカーを除去するためにT7エキソヌクレアーゼで処理する。結果として、適切にライゲーションされたキメラRNAのみが接合部においてビオチンタグ付きリンカーを含む。キメラRNAライブラリは、平均150ヌクレオチドに再度断片化され、ライゲーション接合部はストレプトアビジン被膜磁性ビーズでプルダウンされる。最終産生物は約150ntのキメラRNAのライブラリである。このライブラリでは、R1−リンカー−R2の形態のキメラが濃縮されると予測され、R1及びR2は相互作用RNAの断片である。このライブラリはcDNAに変換され、ペアエンド次世代シーケンシングでシーケンシングされる。
シーケンシングされたcDNAのバイオインフォマティクス解析の例示の一実施形態は、図5に示される。まず、他と完全に同じである両末端のリードについて、PCR重複が除去される。そして、シーケンシング用に送られた断片が回収され、各リードペアの2末端間でBLASTアライメントに基づいて、断片長が推定された。そこから、R1−リンカー−R2構成を有するインフォマティブキメラRNAが選択され、R1及びR2は相互作用RNAの断片である(図5A)。キメラRNAを収集後、R1及びR2断片はゲノムにアライメントし戻されて、多数のオーバーラップアライメントリードによってサポートされたクラスタが、(Union−Findアルゴリズムを用いて)R1及びR2プールのために並行に生成される。
次に、ライゲーションされたキメラ(R1−リンカー−R2)の数に基づいてR1及びR2プール内のクラスタ間の強力な相互作用を特定するために、超幾何テストが行われる。R1及びR2プールにおけるクラスタのゲノムアノテーションによって、種々のタイプの強力な相互作用が測定される(図5B)。
マウスの胚性幹(ES)細胞を用いて2つの独立した実験が行われた。これらの2つの実験は類似する結果をもたらした。cDNAは75ntから200ntの範囲であり(図6A、プライマーの128nt分を減算する)、約2400万の非重複ペアエンドリードをもたらした。R1−リンカー−R2形態のキメラRNAが特定された(240万)。全部で4049の相互作用が超幾何テストによって特定され、異なるタイプの相互作用に分類され(図6B)、snoRNA−mRNA相互作用が最も豊富である。242の相互作用において、snoRNAはmRNAの3’UTRを標的とし、snoRNAがより小さい分子へとプロセスされ、miRNAのように機能するという近年提案された仮説を裏付ける[Brameier等、2011年;Scott等、2011年]。例として、18の非重複キメラRNAは、SNORA1 snoRNAをTrim25 mRNAの3’UTRに結合する(図6C)。アルゴノートタンパク質プルダウンと次のRNAシーケンシング(CLIP−seq)のデータにより[Lueng等、2011年]、SNORA1とTrim25とがアルゴノートに付加されたことが確認された(図6C)。ES細胞分化の経過解析[Shu等、2012年]により、逆相関が確認され(図6D)、これは1つのRNAが他を抑制するという着想に添うものである。
本技術による原理証明実験により、4049ペアの相互作用RNA一覧が作製された。p値とサポートリードペア数とに基づき、上位10の相互作用が表1に示される。
表1は、胚性幹細胞におけるRNA−スティッチ−Seqにより特定されたRNA−RNA相互作用の上位10を示す。各行では、相互作用RNA1や相互作用RNA2という名称の相互作用RNAペアの情報が示される。この相互作用ペアにより形成され、且つペアエンド配列リードとして反映されるキメラRNAの数が最後の列に示される。双方向矢印は直接相互作用を示す。
RNA−RNA相互作用によって、多くの生物学的プロセスが調節される(Kretz,M.等、Control of somatic tissue differentiation by the long non−coding RNA TINCR、Nature493、231−235、doi:10.1038/nature11661(2013年))が、RNAインタラクトーム全体の解析には未だ困難がある。例示の実施形態において、インビボにおけるタンパク質補助RNA−RNA相互作用をマッピングするために、RNAのHi−C法が用いられた。特定のRNA結合タンパク質の選択をしないことで(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP、Cell 141、129−141、doi:10.1016/j.cell.2010.03.009 (2010年);Chi,S.W.、Zang,J.B.、Mele,A.&Darnell、R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps、Nature 460、479−486、doi:10.1038/nature08170(2009年);Helwak,A.、Kudla,G.、Dudnakova,T.&Tollervey,D.、Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding、Cell 153、654−665、doi:10.1016/j.cell.2013.03.043(2013年);Kudla,G.、Granneman,S.、Hahn,D.、Beggs,J.D.&Tollervey,D.、Cross−linking,ligation,and sequencing of hybrids reveals RNA−RNA interactions in yeast、Proceedings of the National Academy of Sciences of the United States of America 108、10010−10015、doi:10.1073/pnas.1017386108(2011年))、該手法はRNAインタラクトームの特定可能部分をに大きく拡大した。この技術を使用することで、46,780のRNA−RNA相互作用からなるマウス胚性幹細胞のRNAインタラクトームマッピングが可能になった。RNAインタラクトームは、ハブとして現れるlincRNA及びmRNAを伴うスケールフリーなネットワークである。相互作用は、単一分子RNA蛍光インサイツハイブリダイゼーション法を用いて、2つのハブ、Malat1とSlc2a3との間で検証された。塩基対が長鎖RNAの相互作用部位で観察され、トランスポゾンRNA−mRNA及びlincRNA−mRNA相互作用において特に強力であった。このことで、トランスで作用する新しいタイプの調節配列が明らかにされた。仮定的な役割と矛盾せず、RNA相互作用部位は転写物の他の領域よりも進化的に保存された。RNAのHi−C法は、1本鎖領域のフットプリントと各RNAの空間的近位部位とを共に明らかにすることで、RNA構造の新規の情報も提供する。このように、細胞生理の最小摂動を伴うタンパク質補助RNAインタラクトームの偏りのないマッピングが、先行の方法に対して有利であり、RNA機能検証の範囲を大きく拡大する。
RNA分子間の相互作用は主要な調節の役割を発揮し、アルゴノートタンパク質(ARGONAUTE、AGO)(Meister,G.、Argonaute proteins: functional insights and emerging roles、Nature reviews. Genetics 14、447−459、doi:10.1038/nrg3462(2013年))、PUM2、QKI(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP、Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年))、及びsnoRNAタンパク質(Granneman,S.、Kudla,G.、Petfalski,E.&Tollervey,D.、Identification of protein binding sites on U3 snoRNA and pre−rRNA by UV cross−linking and high−throughput analysis of cDNAs、Proceedings of the National Academy of Sciences of the United States of America 106、9613−9618、doi:10.1073/pnas.0901997106(2009年))などの、RNA結合タンパク質によってしばしば媒介される(Ray,D.等、A compendium of RNA−binding motifs for decoding gene regulation、Nature 499、172−177、doi:10.1038/nature12311(2013年))。PAR−CLIP(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP、Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年))、HITS−CLIP(Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps、Nature 460、479−486、doi:10.1038/nature08170(2009年))、及びCLASH(Helwak,A.、Kudla,G.、Dudnakova,T.&Tollervey,D、Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding、Cell 153、654−665、doi:10.1016/j.cell.2013.03.043(2013年);Kudla,G.、Granneman,S.、Hahn,D.、Beggs,J.D.&Tollervey,D.、Cross−linking,ligation, and sequencing of hybrids reveals rna−rna interactions in yeast、Proceedings of the National Academy of Sciences of the United States of America 108、10010−10015、doi:10.1073/pnas.1017386108(2011年))などの近年の進展にも関わらず、すべてのタンパク質補助RNA−RNA相互作用をマッピングするには困難な課題が残る。
これら3つの手法のそれぞれにおいて、実験ごとに、1つのRNA結合タンパク質により媒介される相互作用のみが解析可能である。加えて、各実験には、タンパク質特異的抗体か(HITS−CLIP又はPAR−CLIP)、又は形質転換細胞株におけるタグ付きタンパク質の安定的な発現(CLASH)のいずれかが要求される。さらに、HITS−CLIP又はPAR−CLIPにおいて共出現する任意の2つのRNAは、標的タンパク質の種々のコピーにいずれかのRNAが独立的に付加されることからもたらされ得る。例として、それぞれが異なるRNAに結合される約10のAGOタンパク質が細胞に存在すると考えると、これら10のRNAは、AGO HITS−CLIPからの相互作用として特定され得る。ゆえに、HITS−CLIP及びPAR−CLIP推定RNA−RNA相互作用は、解析細胞において必ずしも発生するわけではなかった。
本明細書に記載の例示の実施形態において、インビボでのタンパク質補助RNA−RNA相互作用を検出するために、RNAのHi−C法を用いた。この方法では、RNAはその結合タンパク質に架橋され、ビオチン化RNAリンカーにライゲーションされて、RNA1及びRNA2であるRNAが、RNA1−リンカー−RNA2形態のキメラRNAを形成する同じタンパク質に共結合される。これらのリンカー包含キメラRNAはストレプトアビジン被膜磁性ビーズを用いて単離され、ペアエンドシーケンシングに供される(方法、図1A,図7)。このように、各非重複ペアエンドリードが分子相互作用を示す。
RNAのHi−C法には、RNA−RNA相互作用のマッピングにいくつかの有利性がある。第1に、同じタンパク質分子によってまとめられたRNAのみが捕捉され、異なるRNAが同じタンパク質の異なるコピーに独立的に結合されるときに相互作用するとして考えられ得るHITS−CLIPの不利な点を克服する。第2に、選択マーカーとしてビオチン化リンカーを使用することで、タンパク質特的抗体の必要性又はタグ付きタンパク質を発現する必要性が退けられる。このため、RNAインタラクトームの偏りのないマッピングが可能になる。当該技術分野において述べられるように、その他の方法は、一度に1つのRNA結合タンパク質を扱えるのみであり得る。このように、この方法では、一度に1つを超えるRNA結合タンパク質を効率的に扱えるという驚くべき効果がもたらされる。第3として、高希薄条件においてストレプトアビジンビーズにRNAライゲーションステップを行うことで、他の近接するRNAに無作為にライゲーションするRNAからもたらされる偽陽性が最小化される。第4として、RNAリンカーは、ライゲーション部位にわたるシーケンシングリードを示す明確な境界を与え、シーケンシングリードのマッピングにおける不明確さを退ける。第5として、RNAのHi−Cは、架橋する前に、任意の外来的ヌクレオチドを導入することなく内在的細胞条件直接的に解析する(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP、Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年);Lal,A.等、Capture of microRNA−bound mRNAs identifies the tumor suppressor miR−34a as a regulator of growth factor signaling、PLoS genetics 7、e1002363、doi:10.1371/journal.pgen.1002363(2011年);Baigude,H.、Ahsanullah,Li,Z.、Zhou,Y.、&Rana,T.M.、miR−TRAP:a benchtop chemical biology strategy to identify microRNA targets、 Angew Chem Int Ed Engl 51、5880−5883、doi:10.1002/anie.201201512(2012年));又はタンパク質コード遺伝子(Helwak,A.、Kudla,G.、Dudnakova,T.&Tollervey,D.、Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding、Cell 153, 654−665, doi:10.1016/j.cell.2013.03.043 (2013年))。第6として、PCR増幅前に、無作為の6つのヌクレオチドバーコードを各キメラRNAに付加し、続いて同一のバーコードを有する完全にオーバーラップするシーケンシングリードを1度のみ計数することで、潜在的PCR増幅バイアスが除かれる。(Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps、Nature 460、479−486、doi:10.1038/nature08170(2009年);Loeb,G.B.等、Transcriptome−wide miR−155 binding map reveals widespread noncanonical microRNA targeting、Molecular cell 48、760−770、doi:10.1016/j.molcel.2012.10.002(2012年);Wang,Z.等、iCLIP predicts the dual splicing effects of TIA−RNA interactions、PLoS biology 8、e1000530,doi:10.1371/journal.pbio.1000530(2010年);Konig,J.等、iCLIP reveals the function of hnRNP particles in splicing at individual nucleotide resolution、Nature structural & molecular biology 17、909−915、doi:10.1038/nsmb.1838(2010年))。
例示の実施形態において、ES‐1及びES−2として示される技術上僅かな違いのあるマウスの胚性幹(ES)細胞において、2つの独立的なRNAHi−Cアッセイが行われた(図8〜12)。単一のタンパク質の代わりに、大きいタンパク質複合体(Zhao,J.等、Genome−wide identification of polycomb−associated RNAs by RIP−seq、Molecular cell 40、939−953、doi:10.1016/j.molcel.2010.12.011(2010年))、又は細胞小器官より会合されたRNAの制御のため、ヌクレオチド間とタンパク質間との両方、及びタンパク質間(ES−インダイレクト)の共有結合を形成する2つの架橋剤(ホルムアルデヒド及びEGS)を用いてRNAのHi−Cライブラリが生成された(Nowak,D.E.、Tian,B.&Brasier,A.R.、Two−step cross−linking method for identification of NF−kappaB gene network by chromatin immunoprecipitation、BioTechniques 39、715−725(2005年);Zeng,P.Y.、Vakoc,C.R.、Chen,Z.C.、Blobel,G.A.&Berger,S.L.、In vivo dual cross−linking for identification of indirect DNA−associated proteins by chromatin immunoprecipitation、BioTechniques 41、694、696、698(2006年))。マウス胚性線維芽細胞(MEF)から、他のライブラリが生成され、バイオインフォマティクス品質評価のためにもう1つのデータセットを提供した(図13)。各ライブラリは、所望の形態(RNA1−リンカー−RNA2)及び長さのRNA構築物を含むことが確認された(図1B)。各ライブラリは、平均で、4730万のペアエンドリードを産生するためにシーケンシングされ、その中で、約1510万の非重複ペアエンドリードが所望のキメラ形態を表した(図1C)。
RNAのHi−Cデータを解析し可視化するために、一連のバイオインフォマティクスツール(RNA−HiC−ツール)が作製された(図14〜15)。RNA−HiC−ツールは解析ステップを自動化し、該ステップは、PCR重複除去、多重サンプル分離、リンカー配列特定、ジャンクションリード分離、相互作用RNAの判定、統計評価実行、RNA相互作用タイプのカテゴライズ、相互作用部位の判定、及びRNA構造の解析(方法)を含む。また、RNA内のRNAインタラクトームと近位部位とについて、可視化ツールが提供される(図16)。
RNAHi−Cライブラリの4つが比較された。(リンカーの左右側のリード断片について個別に算出された)FPKMの相関によると、ES−1及びES−2は最も類似するものであり、ES−インダイレクト、そしてMEFが後に続く(図13)。ES−1から特定された相互作用RNAペアとES−2から特定された相互作用RNAペアとは強固なオーバーラップを示した((p値<10−35、並べ替え検定)。MEFにおいて特定された相関関係は、ESサンプルのいずれかのものと有意にオーバーラップしなかった(各オーバーラップについてp値=1、並べ替え検定)。例として、Trim25 RNAの3’UTRと核小体低分子RNA(snoRNA)のSnora1との相互作用は、ES−1及びES−2サンプルのそれぞれ24及び22のペアエンドリードによって裏付けられたが、ES−インダイレクト又はMEFライブラリでは検出されなかった(図1C)。Snora1を含め、mRNAとの相互作用として特定された172の数のsnoRNAが、AGO HITS−CLIP(図1C)と小型RNAシーケンシングデータ(Yu,P.等、Spatiotemporal clustering of the epigenome reveals rules of dynamic gene regulation、Genome research 23、352−364、doi:10.1101/gr.144949.112(2013年))(図1C、図17〜19)によって裏付けられ、発現snoRNA遺伝子の大部分がmiRNA様小型RNAへと酵素処理され、RISC複合体においてmRNAと相互作用したことが示される(Ender,C.等、A human snoRNA with microRNA−like functions、Molecular cell 32、519−528、doi:10.1016/j.molcel.2008.10.017(2008年);Brameier,M.、Herwig,A.、Reinhardt,R.、Walter,L.&Gruber,J.、Human box C/D snoRNAs with miRNA like functions:expanding the range of regulatory RNAs、Nucleic Acids Res 39、675−686、doi:10.1093/nar/gkq776(2011年))(テキストS1)。
そして、その他のRNAがmiRNA生合成への同様のプロセスを経るか、またmRNAと相互作用し得るかを理解することが望まれた。そのためには、RNAのHi−Cにより特定された相互作用RNAが、ES細胞において、小型RNAシーケンシング(小型RNA−seq)によって見出されたもの及びAGOタンパク質と結合するもの(HITS−CLIP)と交差された(S.W.Chi、J.B.Zang、A.Mele、R.B.Darnell、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps、Nature 460、479(2009年7月23日))。小型RNA−seqでは、「Dicer又はその他のRNA処理酵素による酵素切断からもたらされる3’ヒドロキシル基を有するmiRNA及びその他の小型RNA」が選択的にシーケンシングされた(イルミナ、「TruSeq(R) Samll RNA Sample Preparation Guide」(2014年))。miRNAを除いて、snoRNA、偽遺伝子RNA、mRNA UTRを含む他のRNA型も小型RNAプールに寄与し、AGOに付加された(図17A)。さらに、RNAのHi−Cにより特定された相互作用RNAペアの大部分が、AGO HITS−CLIPデータにおいて共出現した(図18)。このデータにより、DICER又は他のRNA処理酵素により消化され、且つRISC複合体に組み込まれるノンmiRNAが存在することが示唆される。
ノンmiRNA遺伝子のどのタイプがmiRNA様生合成を受け得るかを明らかにするため、RNAのHi−Cによって特定されたRNA−RNA相互作用に以下のフィルターを行った。
1.相互作用が1つのmRNA(標的と称される)ともう一つのRNA(ソースRNA)に関わる。
2.ソースRNAは酵素切断により小型RNA処理される(小型RNA−seqにおいてFPKM>0)。
3.標的とソースRNAとはAGO HITS−CLIPに出現する(両RNAでFPKM>0)。
4.ソースにおけるRNAHi−C特定相互作用部位と、標的RNAとは強力な塩基対形成を示す(p値<0.05、すべてのペアエンドリードのRNA1配列とRNA2配列との結合エネルギーを、無作為にシャッフルしたヌクレオチド配列の結合エネルギーと比較するウィルコクソン符号順位検定)。
これらのフィルターを、総数302のRNA−RNA相互作用が通過した。これらの相互作用におけるソースRNAの大多数(79%)はsnoRNAであった(表2)。ゆえに、snoRNAは機能解析において優先された。
表2は、miRNA様RNAを示す。RNAのHi−Cにより特定されたRNA−RNA相互作用は、(1)mRNA(標的と称される)ともう一つのRNA(ソースRNAと称される)に関わること、(2)ソースRNAが小型RNA−seqに存在すること、(3)標的とソースRNAとがAGO HITS−CLIPに出現すること、(4)ソース及び標的RNAにおけるRNAHi−C特定相互作用部位が強力な塩基対形成を示すこと、によってフィルターされた。2列目は1〜3の基準を満たした相互作用部位数を表す。3列目は1〜4の基準を満たした相互作用部位数を表す。4列目は1〜4の基準を満たした相互作用数を表す。
多数のsnoRNAがmiRNA様短鎖RNAに酵素処理され、mRNAと相互作用したと仮定された。この仮定は、mRNAとsnoRNAとの両方がAGOによって結合された、919のRNAHi−C特定snoRNA−mRNA相互作用によって裏付けられた。さらにAGO結合snoRNAとその相互作用mRNAとは、ES細胞の中内胚葉への誘導分化時に、反相関発現変化を示した(P.Yu等.、Spatiotemporal clustering of the epigenome reveals rules of dynamic gene regulation、Genome research 23, 352(2013年2月))(図17B)。加えて、AGO結合snoRNAとその標的mRNAとは、AGO結合のないものよりも、強力な塩基対形成を示した(図17C)。最後に、snoRNAから処理された小型RNAは、mRNAのUTR領域と指示的に相互作用した。RNA−RNA相互作用に関する497のsnoRNAから、243がUTR領域と相互作用し、その中で223(92%)が小型RNA−seqにおいて検出され、これは、酵素切断を受けたことを示唆する(図17D)。比較すると、非UTR領域と相互作用するその他の254のsnoRNAは、より少ない小型RNA(55%)を含有した。さらに、非UTR相互作用snoRNAよりも、2倍のURT相互作用sno−siRNAがAGO結合であった(p値<2.2−16、カイ二乗検定)。例えば、Snora14 RNAは、Mcl1 mRNAの3’UTRを標的とした(図19A)。Snora14 RNAの相互作用部位(110〜135nt)は、酵素処理された小型RNA及びAGO結合領域と正確にオーバーラップした。Snora14 RNAの酵素処理した部分はヘアピンループの完全に一方側に位置し(図19B)、Mcl1 UTRの標的部位に対して強力な結合親和性(−60kCal/mol)を示す。処理Snora14RNAの発現はMcl1 mRNAのものと反相関した(図19C)。共に考慮すると、ES細胞において900を超えるmRNAと相互作用する、多数のsnoRNA遺伝子由来低分子干渉RNAについて、このデータは示唆する。
ES−1及びES−2ライブラリは、ES細胞におけるRNAインタラクトームを推定するために統合された。このデータは、両断片が独自にゲノム(mm9)をマッピングする2つのRNA断片に明確に分離された454万の非重複ペアエンドリードを包含する。46,780のRNA間相互作用が特定された(FDR<0.05、フィッシャーの正確検定)(図20)。mRNA−snoRNA相互作用は最も豊富なタイプであったが、数千のmRNA−mRNA、及び数百のlincRNA−mRNA、偽遺伝子RNA−mRNA、miRNA−mRNAの相互作用も検出された(図21)。これはおそらく、任意の生体について記載される最初のRNAインタラクトームである。こうして、シミュレーションにより、実験及び分析手法全体について、約66%の感受性と93%の特異性が示唆された(テキストS2)。
[RNAのHi−Cのシミュレーション分析]
<1.1データ合成>その実験及び計算方法を含むRNA Hi−Cの感受性と特異性とを推定するために、シミュレーション解析を行った。データ生成プロセスを計算で再現することによる100万ペアエンドリードをシミュレーションした。シミュレーションに用いられたパラメータは、実際のデータに由来した。シミュレーションされたデータ生成プロセスは、以下のとおりである。
各ペアエンドリードについて(2×100塩基)、
1.同等の可能性のある4つのサンプルバーコードから1サンプルバーコードを選択し、6nt無作為バーコードと連結した(図15Aのように)。
2.このペアエンドリードを、[0.1、0.3、0.1、0.3、0.2]の可能性をそれぞれ有する[リンカーのみ、リンカーなし、RNA1−リンカー、リンカー−RNA2、RNA1−リンカー−RNA2]のリストからのcDNAの一タイプに割り当てた(図15Cのように)。
3.このリードペアがリンカ−包含タイプに割り当てられる場合に、同等の可能性のある1又は2のリンカーを無作為に選択する。僅かな割合のリンカ−包含リードペアが2つのリンカーを含むということが言及され、同等の可能性の利用は、最悪の場合を推定するための確かな選択であった。
4.ステップ2で決定されたcDNAタイプに従って、RNA1及びRNA2部のために配列を生成する。RNA1とRNA2とについて、
a.l〜Unif(15,150)から長さをシミュレートする。
b.以下の可能性に基づいて、[「miRNA」、「mRNA」、「lincRNA」、「snoRNA」、「snRNA」、「tRNA」]からRNAタイプを選択する。
i.長さl<50の場合、[0.2、0.2、0.1、0.2、0.2、0.1]を使用。
ii.そうでなければ、[0.05、0.4、0.2、0.2、0.1、0.05]を使用。
c.Ensembl(リリース67、マウスNCBIM37)から、サンプルのRNAタイプに従って、RNAを無作為に選択する。
d.選択したRNAから長さlを有する配列セグメントを無作為に取得する。
5.バーコード、リンカー、及びステップ1、3、4から生成されたRNA断片を連結し、合成cDNA配列を作製する。
6.ステップ5における合成cDNAが100bp又はより長い場合、それぞれフォワード及びリバース鎖における合成cDNAの2つの末端からの100塩基を取る。
7.ステップ5における合成cDNAが100bpより短い場合、そのフォワード及びリバース鎖をフォワード及びリバースリードとして割り当て、P5及びP7プライマー配列を2つのリードに連結する。
8.各塩基において0.01の比率でシーケンシングエラーをシミュレートする(N.J.Loman等、Performance comparison of benchtop high−throughput sequencing platforms、Nature biotechnology 30、434(2012年5月))。
ステップ1〜5では、実験方式に合致するcDNA配列をシミュレートし、ステップ6〜8では、このcDNA配列に基づいてペアエンドリードをシミュレートした。シミュレートされた相互作用RNAペアとcDNAタイプと各部分の長さ(該当する場合、RNA1、リンカー、及びRNA2)が計算による予測と比較するために保存された。
<1.2中間及び最終結果の評価>2つの中間解析ステップについて感受性及び特異性、並びに最終予測を評価するために、合成データを用いた。
まず、予測されたcDNAの長さ(RNA−HiC−ツールのステップ3の出力)を実際の長さと比較した(表3)。このステップ「3、配列ライブラリにおいてcDNAを回収」では、各cDNAをその長さについて4つのタイプに、つまりタイプ1(<100bp);タイプ2(100〜200bp);タイプ3(>200bp);タイプ4(不明)に、割り当てる(図32)。各タイプを予測するために、アルゴリズムにより高い感受性及び特異性を得た。200bpより短いcDNAのごく僅かなもののみが(0.58%)、200bpより長いと予測された。このエラーは、フォワード及びリバースリードのオーバーラップが少しあったためであり(通常は0〜5bps)、これは局所アライメントにより検出されなかった。
表3は、予測及び実際のcDNA長の範囲の比較を示す。各タイプ(列1〜4)の予測cDNAのカウントを、それらの実際のタイプ(行)と比較する。
予測の長さが200bpより短いとき(タイプ1とタイプ2)、正確な長さを予測できた。これらの場合には、シミュレートされたcDNAの長さに、予測の長さが多くは正確に合致した(図33A)。
次に、各cDNAの予測キメラ構成(RNA−HiC−ツールのステップ4の出力)を合成構成と比較した。「4.キメラcDNAの解析」のステップにおいて、リンカー配列の存在に基づいて、アルゴリズムによりcDNAを5つのカテゴリに割り当てた。アルゴリズムは、「RNA1−リンカー−RNA2」形態のcDNAに対して、99.89%感受性及び95.82%特異性に達した(表4)。
表4は、予測及び実際のcDNA構成の比較を示す。予測構成のcDNAのカウント(列)をその実際の構成(行)と比較する。
最後に、予測RNA−RNA相互作用とシミュレートRNA−RNA相互作用とを比較した。シミュレーションされたデータセットは200,200のキメラRNAペア包含し、その中で131,571のRNAペアが検出された(感受性=65.72%、特異性=92.57%、図33C)。各タイプのRNAの相互作用に対する感受性及び特異性も個別に計算した(図33C)。関与するRNAタイプに関わらず、この方法は偽陽性をほとんど示さなかった(特異性≧90%)。トランスポゾンRNA又はsnRNAに関与しなかった相互作用は、それに関与するものよりも少ない偽陰性を示した。これは、トランスポゾンとsnRNAとの配列の反復的特性によるものであった。最悪のケースはLINE RNAに関与し、感受性が52%に下落した。トランスポゾンRNAに関与する相互作用の約半分がこの方法によって特定できなかったであろうということが控えめにも推測された。トランスポゾンRNAに関与しない相互作用の約2/3〜3/4が、特定されたであろうと推測された。
RNA毎の相互作用パートナーの数は非常に不均衡である。ES細胞のRNAインタラクトームは、べき法則を満たす次数分布を有する(P(k)〜k−γ、γ=3)スケールフリーなネットワークであった(図22A)(Barabasi,A.L.&Oltvai,Z.N.、Network biology:understanding the cell’s functional organization、Nature reviews、Genetics 5、101−113、doi:10.1038/nrg1272(2004年))。スケールフリー特性が、強く接続された少数のsnoRNA、snRNA、及びtRNAによってもたらされているかを理解するために、それらをネットワークから取り除いた。mRNA、lincRNA、miRNA、偽遺伝子RNA、及びアンチセンスRNAのみからなる相互作用はスケールフリーであった(図22B)。多くのmRNA、偽遺伝子RNA、及びlincRNAがハブとして(多数の接続を有するノード、図1D)現れた。最大のmRNAハブは、これは21のmRNAと2つのlincRNAと相互作用するSuv420h2であった。最大のlincRNAハブは、mRNAハブSlc2a3を含む4つのmRNAと相互作用するMalat1であった。
相互作用RNAの大部分は(83.05%)、オーバーラップするRNAHi−Cリードを示し(図2A)、相互作用はRNAの特定のセグメントにしばしば集中するということが示唆される。オーバーラップリード断片の「ピーク」を特定し、と「相互作用部位」と呼称した(図2B)。相互作用部位は、miRNA(成熟miRNA全体)、mRNA、lincRNAだけでなく、偽遺伝子及びトランスポゾンRNAにも現れた(図2C)。2000を超える相互作用部位が、L1、SINE、ERVK、MaLR、及びERV1トランスポゾンRNAにあり(図23)、その他のRNAとの頻繁な相互作用が示唆される(Shalgi,R.、Pilpel,Y.&Oren,M.、Repression of transposable−elements−a microRNA anti−cancer defense mechanism? Trends in genetics:TIG 26、253−259、doi:10.1016/j.tig.2010.03.006(2010年);Yuan,Z.、Sun,X.、Liu,H.&Xie,J.、MicroRNA genes derived from repetitive elements and expanded by segmental duplication events in mammalian genomes、PloS one 6、e17666、doi:10.1371/journal.pone.0017666(2011年))。
異なるタイプのRNA−RNA相互作用によって塩基の相補性が用いられるかが推論された。相互作用RNAペアのハイブリダイゼーションエネルギーは、ライケーションされた断片(RNA1、RNA2)のペアの平均ハイブリダイゼーションエネルギーによって推定され(Bellaousov,S.、Reuter,J.S.、Seetin,M.G.&Mathews,D.H.、RNAstructure:web servers for RNA secondary structure prediction and analysis、Nucleic Acids Res 41、W471−W474、doi:Doi 10.1093/Nar/Gkt290(2013年))、塩基の無作為シャッフルによって生成された対照RNAのハイブリダイゼーションエネルギーと比較された。相補性塩基は、ほぼすべてのタイプのRNA−RNA相互作用において好ましいものであり、トランスポゾンRNA−mRNA、mRNA−mRNA、偽遺伝子RNA−mRNA、lincRNA−mRNA、miRNA−mRNA相互作用において最も見受けられる(p値<2.4−18)が、LTR−偽遺伝子RNA相互作用では観察されなかった(図2D、図24)。このデータは、塩基対形成が、長鎖RNAにおける配列特異的転写後調節を促すという新しいメカニズムを示唆するものである。
これらのRNA−RNA相互作用が配列特異的である場合、RNA相互作用部位は選択圧力下にあるはずである。種間保存レベル(Cooper,G.M.等、Distribution and intensity of constraint in mammalian genomic sequence. Genome research 15、901−913、doi:10.1101/gr.3577405(2005年))は相互作用部位において大きく増加し、保存のピークは、2つのRNA断片の接合部を正確に指し示すということが分かった(図2D)。lincRNA、偽遺伝子RNA、トランスポゾンRNA、又は他のmRNAと相互作用するとき、mRNAの相互作用部位は、転写物の残余部分よりも保存された(図25)。lincRNA及び偽遺伝子RNAの相互作用部位では、lincRNAs−mRNA、偽遺伝子RNA−mRNA、及び偽遺伝子RNA−トランスポゾンRNA相互作用において、大きく保存された(図25)。相互作用部位における保存の増大は、エクソン−イントロン境界によるものではなかった(図26)。考え合わせると、長鎖RNAの相互作用において、塩基の相補性が広まり、進化的に選択される。これについて、新規のタイプの、ゲノムにおいてコードされる調節情報が示唆される。
RNAのHi−Cは、本質的に、分子間相互作用をマッピングするために設計されているが、RNAのHi−CがRNAの2次構造及び3次構造を明らかにすることが分かった。上述のすべての分析は、分子間リードに基づく。分子内リードを見ることで、RNA構造についていくつかのことが分かる。まず、RNaseI消化部位の密度によって、RNAの1本鎖領域のフットプリントが特定された(RNaseI消化はライゲーション前に行われた。図1Aのステップ2、図27参照)。次に、各RNAの空間的近位部位を近接ライゲーションによって捕捉した(図1Aのステップ5)。全部で67,221のリードペアが個別の遺伝子にマッピングされたが、互いに2,000bp内又は同じ鎖上ではなく、ゆえに分子内切断及びライゲーションから生成されたものである(図28A)。切断及びライゲーション配列のそれぞれは、配列リードにおけるRNA1及びRNA2の配向とゲノムにおけるその配向とを比較することで、2つの構造分類の1つに明らかに割り当て可能である(図3A)。例として、277の切断及びライゲーション配列が、Snora73転写物から作製された(図3B)。RNaseI消化部位の密度(図3C)により、RNAの1本鎖領域が強く予測された(ヒートマップ、図3E)。6つのペアの近位部位が検出された(図3Dの丸)。各ペアは、オーバーラップライゲーション位置を有する3つ以上の切断及びライゲーション配列によってサポートされた(図3Bの黒い箇所)。6つの近位部位ペアのうち5つは、通常許容される2次構造において物理的に近接した(図3Eの矢印)。Snora14では、シーケンシングされた推定2次構造によると、推定近位部位のペアは離れているようであった(図29)。しかしながら、リボ核タンパク質DYSKERINは、インビボにおいてSnora14転写物を曲げ(Kiss,T.、Fayet−Lebaron,E.&Jady,B.E.、Box H/ACA small ribonucleoproteins、Molecular cell 37、597−606、doi:10.1016/j.molcel.2010.01.032(2010年))、切断及びライゲーション配列によって予測されたように、2つのシュードウリジル化(pseudouridylation)ループを互いに近づける(図3F)。構造情報も、mRNAの新しい転写物及び一部分において得られ得る(図30〜図31)。現在のところ、任意の個々のRNAの空間的近位塩基の決定は大きな課題としてある。RNAのHi−Cは、数千のRNAについて分子内空間的近位情報を提供する。さらに、あらゆるRNAの1本鎖フットプリントが共にマッピングされる。このように、RNAのHi−Cにより、RNA構造調査範囲が大きく広がった。
RNA相互作用のマッピングに極めて重要であるのは選択である。RNAのHi−Cにおいて選択可能なリンカーを導入することで、相互作用RNAの偏りのない選択が可能になり、RNAインタラクトームの全体的なマッピングを可能にする。ES細胞におけるRNA毎の相互作用パートナーの数は非常に不均衡であり、スケールフリーなRNAネットワークをもたらす。長鎖RNA間の相互作用では、転写物の小片がしばしば用いられた。タンパク質相互作用ドメインとの類似について、RNA相互作用部位の概念が示された。RNA相互作用部位では、長鎖RNA相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。RNA構造はRNAのHi−Cによってもマッピングされ得る。本明細書に示されるのは、RNAがタンパク質によって曲げられ、そうした3次構造がRNAHi−Cの分子内リードによって明らかにされた例示的実施形態である。こうして、この方法とデータにより、RNAの機能と調節との役割調査が今後は非常に容易になるはずである。
[ソフトウエアの利用]
RNAのHi−Cツールソフトウエアは、http://systemsbio.ucsd.edu/RNA-Hi-Cにおいて利用可能であり、この開示について、その全体が言及によって本願明細書に組み込まれる。
[材料と方法]
<細胞培養>
未分化のマウスE14ES細胞をフィーダーなしの条件下で培養した。ES細胞をゼラチン被膜ディッシュに播種し、15%ウシ胎仔血清(FBS;Gemini Gemcell)、0.055mMの2−メルカプトエタノール(Sigma)、2mMのグルタマックス(GIBCO)、0.1mMのMEM非必須アミノ酸(GIBCO)、5,000U/mlのペニシリン/ストレプトマイシン(GIBCO)、及び1,000U/mlのLIF(Millipore)で補完したダルベッコ改変イーグル培地(DMEM;GIBCO)において培養した。インキュベータにおいて、細胞を37℃、5%COで保持した。
15%ウシ胎仔血清(FBS;Gemini Gemcell)、0.055mMの2−メルカプトエタノール(Sigma)、2mMのグルタマックス(GIBCO)、0.1mMのMEM非必須アミノ酸(GIBCO)、5,000U/mlのペニシリン/ストレプトマイシン(GIBCO)で補完したDMEM(GIBCO)において、マウスの胚性線維芽細胞(MEF)を、15cmディッシュで培養した。MEFも、インキュベータにおいて37℃、5%COで保持した。
ショウジョウバエS2細胞(Invitrogen)を、10%の熱失活ウシ胎仔血清(FBS;Gemini Gemcell)及び5mlの1:100のペニシリン/ストレプトマイシン(GIBCO)で補完したシュナイダーショウジョウバエ培地(GIBCO)において、15cmプレートで、インキュベータにおいて28℃、COなしで、保持した。
<組織切開及び調製>
マウスの扱いは、カリフォルニアサンディエゴ大学動物実験委員会に認められたものであった。雌生体(C57BL/6J由来)は頚椎脱臼により犠牲となった。全脳を直ちに回収して、氷温のPBSで3回リンスし、急速凍結した。マウスの凍結全脳を、乳鉢と乳棒とを用いて、液体窒素内で微細粉末にした。組織粉末をドライアイス床上のペトリディッシュに迅速に移し、UVクロスリンカー(254nm)において400mJ/cmで、ドライアイス上で3回照射し、各照射の間にやさしくかき混ぜた。架橋された粉末状組織を直ちに溶解し、記載されたようなRNAHi−C法をおこなった。
<RNAのHi−C法の概要>
RNAのHi−Cは、(i)外来的分子を遺伝子的又は一過的に導入することなく、偏りのない方法で、インビボにおける相互作用RNAを捕捉する、(ii)細胞溶解後に形成される非生理的な会合を厳密に除去可能にする(S.Mili、J.A.Steitz、RNA 10、1692(2004年))、(iii)近接ライゲーションされたキメラRNAを選択する、(iv)相互作用RNAの明確なバイオインフォマティク的特定を可能にする、ように設計された。これらの目的は、(i)ストレプトアビジンビーズにおいて、すべてのRNA−タンパク質複合体(タンパク質及び核酸、核酸を伴う中間タンパク質、又は核酸結合タンパク質複合体を含む複合体であって、該核酸はRNAである)を架橋及び固定化し、変性条件によって非特異的結合を除去する、(ii)キメラRNA構築物の選択的濃縮を促すためにビオチンタグ付きRNAリンカーを付ける、(iii)シーケンシングリードペアから相互作用RNAを明確に分離するために、リンカー配列を用いる、ことで達成され得る。
<ステップ1:RNAをタンパク質に架橋>
光反応性ヌクレオチド塩基とアミノ酸とに共有結合を形成するために、UV照射を用いた。UV照射により、RNA内のヌクレオチド塩基の一時的な高反応性状態がもたらされ、配座摂動を引き起こし得る追加的要素なく、その接触点でアミノ酸とのみの共有結合形成を誘導する(I.G.Pashev、S.I.Dimitrov、D.Angelov、Trends in Biochemical Sciences 16、323(1991年))。254nmでのUV照射は、アミノ酸が異なる波長を吸収するためタンパク質−タンパク質架橋を促進しない。具体的には、細胞を氷温のPBS内で2回洗浄し、氷上の氷温のPBS内において400mJ/cmのUV−C(254nm)で照射した。細胞をスクレーピングにより採取し、4℃において5分間、1,000×gで遠心分離することによりペレット化した。細胞のペレットを液体窒素内で急速凍結し、−80℃で保管した。
タンパク質−タンパク質複合体も架橋されるRNAHi−Cライブラリ(ES−インダイレクト)を生成した。これは、タンパク質相互作用によって結合したRNAを捕捉するためであった。インビボでの2重架橋方法を、以前に検証されたパラメータで適用した(Illumina、「TruSeq(R) Samll RNA Sample Preparation Guide」(2014年);P.Yu等、Spatiotemporal clustering of the epigenome reveals rules of dynamic gene regulation、Genome research 23、352(2013年、2月);N.J.Loman等、Performance comparison of benchtop high−throughput sequencing platforms、Nature biotechnology 30、434(2012年5月))。短時間で、細胞を室温のPBSでまずリンスして、シェーカーにおいて室温で40分間、PBS内で新しく調製した1.5mMのエチルグリコールビス(スクシンイミジルスクシネート)(EGS、Pierce Protein Research Products、イリノイ州、ロックフォード)で処理した。細胞を、1%の最終濃度になるようにホルムアルデヒド(Pierce Protein Research Products、イリノイ州、ロックフォード)でさらに処理し、20分間室温で搖動させてインキュベートした。グリシンを250mMの最終濃度になるように添加し、10分間室温でインキュベートして、架橋反応をクエンチした。そして、細胞をPBSで1回洗浄し、スクレーピングし、4℃において5分間、1,000×gでペレット化して、液体窒素内で急速凍結し、−80℃で保管した。
タンパク質−タンパク質複合体も架橋される対照実験(ES−インダイレクト)を行った。これは、タンパク質相互作用によって結合したRNAを制御するものである。こうして、インビボでの2重架橋方法を、以前に検証されたパラメータで適用した(S.K.Kurdistani、M.Grunstein、Methods 31、90(2003年);D.E.Nowak、B.Tian、A.R.Brasier、BioTechniques 39、715(2005年);J.Zhang等、Methods 58、289(2012年))。短時間で、細胞を室温のPBSでまずリンスして、シェーカーにおいて室温で40分間、PBS内で新しく調製した1.5mMのエチルグリコールビス(スクシンイミジルスクシネート)(EGS、Pierce Protein Research Products、イリノイ州、ロックフォード)で処理した。細胞を、1%の最終濃度になるようにホルムアルデヒド(Pierce Protein Research Products、イリノイ州、ロックフォード)でさらに処理し、20分間室温で搖動してインキュベートした。グリシンを250mMの最終濃度になるように添加し、10分間室温でインキュベートして、架橋反応をクエンチした。そして、細胞をPBSで1回洗浄し、スクレーピングし、4℃において5分間、1,000×gでペレット化して、液体窒素内で急速凍結し、−80℃で保管した。
<ステップ2:細胞溶解、RNA断片化、及びタンパク質のビオチン化>
−80℃で保管された、約6×10の架橋細胞を氷上で解凍し、約3倍量の溶解バッファー(50mMのTris−HCl、pH7.5、100mMのNaCl、0.1%のSDS、1%のIGEPAL CA−630、0.5%のデオキシコール酸ナトリウム、1:20量のEDTA非含有完全プロテアーゼ阻害剤カクテルで補完した1mMのEDTA(Roche))に再懸濁した。氷上で20分間溶解を行った。細胞片と不溶解性クロマチンとを、4℃で10分間、20,000×gの遠心分離で除去した。上清を採取し、溶解物ml毎に10μlのTURBO DNaseの濃度のTURBO DNase(Invitrogen)で、20分間37℃で処理した。溶解物ml毎に10μlの1:100希釈のRNaseI(NEB)を添加し、37℃で3分間インキュベートすることで、RNAを約1000〜2000nt(ES−1)又は約1000nt(ES−2)断片に消化した。RNaseI処理の後、溶解物を直ちに氷へと、少なくとも5分間移した。RNaseI及び音波処理による断片化により、RNAライゲーションには不適合な5’−OH及び3’−P末端が残り、これは望ましくないRNAライゲーションを抑制する。DNase消化を停止するために、25mM最終濃度になるようにEDTA(Ambion)を添加し、混合物を4℃で15分間回転させてインキュベートした。氷上で20分間の溶解後、5%デューティサイクルで20分、140ワットのピーク入射パワー、及び4℃でバースト毎に200サイクルという設定で、懸濁液を音波処理(Covaris E220)により直接的に断片化することで、断片化された2重架橋(ES−インダイレクト)溶解物を調製した。
異種間の実験について、約3×10のE14mES細胞と3×10のショウジョウバエS2細胞を個別に溶解して、タンパク質のビオチン化前に混合した。
緩やかに結合したタンパク質を解離するために、500mMのNaCl最終濃度を添加し、該溶液を4℃で10分間回転させてインキュベートした。タンパク質複合体と非架橋RNAとをさらに解離し、RNaseI活性を停止するために、SDSを0.3%最終濃度になるように添加し、65℃において15分間、750r.p.mで揺らして、該混合物をインキュベートした。溶液混合物を室温に冷却後、溶解物に、1:5量の25mM(13.56mg/ml)EZlinkヨードアセチル−PEG2−ビオチン(IPB)(Pierce Protein Research Products)を添加し、該混合物を暗所にて90分間室温で回転させることで、システイン残基をビオチン化した。5mM濃度にDTTを添加して、室温で15分間インキュベートすることで、ビオチン化反応をクエンチした。SDSを中和するために、Triton X−100(Sigma)を2%最終濃度になるように添加し、37℃で15分間インキュベートした。溶解物サンプルを、室温において2リットルの透析バッファー(20mMのTris−HCl、pH7.5、1mMのEDTA)で、20kDカットオフのSlide−A−Lyzer透析カセット(Pierce Protein Research Products、イリノイ州、ロックフォード)において透析して、過剰なビオチンを除去した。透析バッファーを、2時間毎に1回、少なくとも3回交換した。透析後に、溶解物を15mlチューブに移した。
<ステップ3:ビーズへの固定化>
タンパク質−RNA複合体は、ストレプトアビジン被膜ビーズ(200cmの表面積と等しい、800μlのMyOneストレプトアビジンT1ビーズ)において、低いビーズ面密度で固定化される。固体表面に固定化することの有利性には、(i)非架橋オリゴヌクレオチド間の無作為な分子間ライゲーションを低減(R.Kalhor、H.Tjong、N.Jayathilaka、F.Alber、L.Chen、Nat Biotech30、90(2012年))、(ii)効率的なバッファー交換が可能、(iii)よく洗浄することで非生理的相互作用を除去、ということを含む。
800μlのMyOneT1ビーズをPBST(0.1%Tween−20を含むPBS)で3回洗浄し、800μlの同じバッファーに再懸濁して、ビオチン化溶解物へと移した。ビーズ−溶解物懸濁液を室温で45分間回転させた。このインキュベーション時に、中和した200μlの25mMIPBを調製した。これは、同じモル濃度のDTTを添加し、室温で少なくとも30分間インキュベートすることで行われた。磁性スタンドを用いてビーズを固定化し、大半の上清を吸引して、4mlの上清が残った。ビーズを残余の溶液に再懸濁し、そして200μlの中和IPBを添加した。ビオチンタグ付きRNAリンカーに関与するその後のステップを妨げ得る固定化後の過剰未結合ストレプトアビジンを飽和させるために、IPBを用いた。タンパク質に非共有的に結合又は非特異的タンパク質−タンパク質相互作用により非共有的に結合した望ましくないRNAを除去する(S.C.Kwon等、Nat Struct Mol Biol 20,1122(2013年);A.Castello等、Nat.Protocols 8、491(2013年))ために、ビーズを氷温の変性洗浄バッファーI(50mMのTris−HCl pH7.5、0.5%リチウムドデシルサルフェート、500mM塩化リチウム、7mMのEDTA、3mMのEGTA、5mMのDTT)で3回洗浄し、洗浄毎に4℃で5分間回転された。そして、氷温の高塩濃度洗浄バッファーII(50mMのTris−HCl pH7.5、1MのNaCl、0.1%SDS、1%IGEPAL CA−630、1%デオキシコール酸ナトリウム、5mMのEDTA、2.5mMのEGTA、5mMのDTT)、洗浄バッファーIII(1×PBS、1%Triton X−100、1mMのEDTA、1mMのDTT)、及びPNK洗浄バッファー(20mMのTris−HCl pH7.5、10mMのMgCl、0.2%Tween−20、1mMのDTT)で、ビーズを洗浄した(各バッファーにつき2回、2回目の洗浄時に4℃で5分間回転させる)。
<ステップ4:ビオチンタグ付きRNAリンカーのライゲーション>
次に、ビオチンタグ付きRNAリンカー(5'-rCrUrArG/iBiodT/rArGrCrCrCrArUrGrCrArArUrGrCrGrArGrGrA)(配列番号1)をRNAの5’末端に付けた。ビオチンタグ付きリンカーは、ライゲーションされたRNAを濃縮するための選択マーカーとしての役割を担い、また、ライゲーション接合部を含んだ任意の配列リードを明確に分ける明らかな境界線を引くものである。RNAリンカーの5’末端は、リンカー環状化又は連結をしないように、ライゲーションから一時的に「遮断」された。これは、ライゲーションには不適合だがリン酸化により「再活性化」され得る5’−OH基とリンカーを合成することで行った。しかし、RNaseIはリンカーライゲーションに不適合な5’−OH末端を残すので、5’末端は、T4ポリヌクレオチドキナーゼ(PNK)、3’ホスファターゼマイナス(NEB)でまずリン酸化された。RNAの3’末端を3’−Pから3’−OHに変化させて、自己ライゲーションを受けやすくする、そのさらなる3’ホスファターゼ活性のため、野生型T4PNKは用いられなかった。
洗浄バッファーを取り除き、次に100μlのPNK反応混合物(73μlのRNase非含有水、10μlの10×PNKバッファー、10μlの10mMATP、5μlの10U/μlT4PNK(3’ホスファターゼマイナス)(NEB)、2μlのRNAsin Plus(Promega))にビーズを再懸濁し、2分毎に5秒間、1,200r.p.mで断続的に揺らして37℃で1時間インキュベートすることで、これを行った。洗浄バッファーI、II、III、及びPNKでビーズを洗浄し、各バッファーにつき2回で、2回目の洗浄時に4℃で5分間回転させる。RNAリンカーをリン酸化し得、RNAの3’−末端にライゲーションさせる可能性のある、任意の残余PNKを除去するために、氷温洗浄を用いた。洗浄バッファーを取り除いた後、2μlのRNAsin Plus(Promega)、16μlの10mMATP、16μlの10×RNAリガーゼバッファー、16μlの1mg/mlBSA、30μlの20μMビオチン標識リンカー、64μlの50%PEG8000(NEB)、16μlの10U/μlのT4RNAリガーゼ1(NEB)を含む、160μlのRNAライゲーション反応混合物を添加することで、ビオチンタグ付きRNAリンカーをRNAの5’−末端にライゲーションした。ライゲーションを37℃で1時間行い、2分毎に15秒間、1,200r.p.mで断続的に揺らして16℃で一晩行った。T4RNAリガーゼの活性を促進して、ビーズの凝集を防止するために、BSAを添加した。ドナーとアクセプターの末端濃度を増大させることで分子間ライゲーションを促進するために、PEGを用いた(D.B.Munafo、G.B.Robb、RNA 16、2537(2010年))。
<ステップ5:近接ライゲーション>
次に、ビーズを氷温の洗浄バッファーIIで2回、氷温の洗浄バッファーIIIで1回、及びPNK洗浄バッファーで洗浄した。近接ライゲーションを調製するために、T4PNKの3’ホスファターゼ活性を用いてRNA3’−末端をまず脱リン酸化し、3’ヒドロキシル基が残った(I.Huppertz等、Methods 65、274(2014年))。洗浄バッファーを処分した後、73μlのRNase非含有水、20μlの5×PNKバッファー pH 6.5(350mMTris−HCl pH6.5、50mMMgCl2、10mMDTT)、5μlの10U/μlT4PNK(3’ホスファターゼマイナス)(NEB)、2μlのRNAsin Plus(Promega)と、ビーズを混合し、2分毎に5秒間、1,200r.p.mで断続的に揺らして37℃で20分間インキュベートした。ビーズをPNK洗浄バッファーで1回
洗浄した。100μlのPNK反応混合物(73μlのRNase非含有水、10μlの10×PNKバッファー、10μlの10mMATP、5μlの10U/μlT4PNK(3’ホスファターゼマイナス)(NEB)、2μlのRNAsin Plus(Promega))において、断続的に揺らして37℃で1時間、ビオチン標識リンカーの5’−末端をリン酸化した。リン酸化後、ビーズをPNK洗浄バッファー内で2回洗浄した。そして、複合体間ライゲーションを最小化するために、15mlの全量の反応物(8.9mlのRNase非含有水、1.5mlの10mMATP、1.5mlの10×RNAリガーゼバッファー、75μlの20mg/mlBSA(NEB)、25μlの1MDTT、2.25mlの100%DMSO、0.75mlの10U/μlT4RNAリガーゼ1(NEB))において、高希薄条件下で近接ライゲーションを行った。近接ライゲーションは37℃で1時間行われ、連続的に回転させて16℃で一晩行われた。高度に構造化したRNAのライゲーションを促進するために、ジメチルスルホキシド(DMSO)を15%(v/v)最終濃度になるように添加した。
<ステップ6:所望のRNA−RNA相互作用の選択及び抽出と逆転写>
翌日、EDTAを25mMの最終濃度になるように添加して、ビーズをチューブ壁において収集するときに分子間ライゲーションが発生することを防ぐために4℃で15分間回転させることで、ライゲーションを停止した。ビーズをPBST内で1回洗浄した。次に、タンパク質−RNA複合体を、100μlの溶出バッファー(100mMTris−HCl pH7.5、50mMNaCl、10mMEDTA、1%SDS、10mMDTT、2.5mMD−ビオチン(Invitrogen))において、5分間95℃に加熱することで、ストレプトアビジンビーズから2回溶出した。得られた溶液を合わせ、50μlの800U/mlプロテイナーゼ(NEB)と混合し、55℃で2時間インキュベートした。そして、混合物に400μlの最終量までRNase非含有水を足した。RNAを、400μlのフェノール:クロロホルム:イソアミルアルコール(125:24:1、pH4.5)(Ambion)内で抽出し、1000r.p.m.で揺らして37℃で20分間インキュベートした。混合物を2mlのMaXtract高密度フェーズロックゲルチューブ(Qiagen)に移し、室温で5分間、16,000×gで遠心分離した。400μlのクロロホルムを同じMaXtractチューブに添加して、室温で5分間、16,000×gで遠心分離することで、残余のフェノールを除去した。遠心分離後、水相を新しいチューブに写した。1mlの1:1のエタノール:イソプロパノールと共に、1:9量の3M酢酸ナトリウムpH5.2、1.5μlのglycoblue(Ambion)を添加して、−20℃で一晩インキュベートすることで、RNAを沈殿させた。沈殿したRNAを、4℃で30分間、21,000gで遠心分離することでペレット化した。上清を処分した後、ペレットを80%エタノールで2回洗浄し、エタノールが完全に蒸発するまで風乾した。この段階で精製されたRNAは、リンカーなしのRNA(RNA1又はRNA2)、リンカーとライゲーションされるが他のRNAと近接ライゲーションされないRNA(5’−リンカー−RNA2)、及び5’−RNA1−リンカー−RNA2形態の所望のキメラ構築物の混合物であった。RNA1は、ビオチンタグ付きリンカーを選択することで枯渇され得る。ゆえに、非インフォマティブ5’−リンカー−RNA2も、T7エキソヌクレアーゼを用いた次の反応において枯渇された。
6.1.末端リンカー(5’−リンカー−RNA2)からビオチンを除去。これは、二重鎖のDNAから5’モノヌクレオチドを除去するだけでなく、RNA−DNAハイブリッドのRNA鎖においてエキソヌクレアーゼ活性を示すT7エキソヌクレアーゼのRNaseH活性に基づくものであった(K.Shinozaki、O.Tuneko、Nucleic Acids Research 5、4245(1978年))。相補的DNAオリゴヌクレオチド(5'-T*C*G*C*ATTGCATGGGCTACTAGCAT(配列番号2)、*は、T7エキソヌクレアーゼによる消化を阻害するためのホスホロチオエート結合を示す)(T.T.Nikiforov、R.B.Rendle、M.L.Kotewicz、Y.H.Rogers、Genome Research 3、285(1994年))をRNAリンカーにアニーリングし、RNAリンカーと相補的DNA鎖との間に2本鎖DNA−RNAハイブリッドを形成した。アニーリング後に、RNAリンカーの5’−末端が窪み、DNA鎖の3’−末端が突出するように、相補的DNA鎖を設計した。そして、アニーリング産生物をT7エキソヌクレアーゼで処理した。
17μlのRNase非含有水、4μlの10×NEBuffer4、7μlの100μM相補的DNAオリゴ内に、RNAペレットを再懸濁した。70℃で5分間変性し、60℃まで徐々に温度を下げて(−0.1℃/s)、60℃でさらに5分間インキュベートした後、37度まで徐々に冷却し(−0.1℃/s)、37℃で15分間インキュベートすることで、アニーリングを行った。そして、アニーリングされた混合物を、8μlの10U/μlT7エキソヌクレアーゼ(NEB)、4μlの1mg/mlBSAに混合して、30分間37℃でインキュベートし、さらに30分間30℃でインキュベートした。DNAオリゴヌクレオチドと、任意の汚染ゲノムDNAとを、TURBO DNaseの厳密な処理を用いて除去した。44μlのRNase非含有水、10μlの10×TURBO DNaseバッファー、6μlのTURBO DNase(Invitrogen)を添加し、得られた混合物を37℃で1時間インキュベートした。DNase処理されたRNAを、上述のようなフェノール:クロロホルム抽出及びエタノール沈殿によって精製した。
6.2.ES−2、MEFサンプルにおいて、抗体を用いたDNA−RNAハイブリッドの枯渇によりrRNAを除去(GeneRead rRNA Depletion Kit (Qiagen))。以下の変更を伴い、製造者の指示に従ってrRNAを除去した。200ヌクレオチドより短いRNAを除去するRNeasy MinEluteスピンカラムを用いて、枯渇RNAをを除去する代わりに、過剰rRNA捕捉プローブを厳密なDNase処理により除去した。また、DNase処理されたRNAを、上述のようなフェノール:クロロホルム抽出及びエタノール沈殿によって精製した。
6.3.RNAせん断。エタノール沈殿後、製造者によるプロトコルに従ってRNaseIII断片化キットを用いて、Illumina HiSeqによるシーケンシングに最適な150〜400bpのサイズ範囲にRNAを断片化した。断片化RNAを、2.2×SPRISelectビーズ(Beckman Coulter Genomics)により精製し、上述のようにエタノール沈殿をおこなった。
6.4.逆転写アダプターとのライゲーション。次に、RT反応のプライマーとして機能する3’逆転写(RT)アダプター(/5rApp/AGATCGGAAGAGCGGTTCAG/3ddC/(配列番号3))に、RNAをライゲーションした。エタノール沈殿後、20μlのライゲーション反応混合物(1μlのRNAsin Plus(Promega)、2μlの10×RNAリガーゼバッファー、7μlの20μMである予備アデニル化されたL3−Appアダプター、8μlの50%PEG8000(NEB)、2μlの200U/μlT4RNAリガーゼ2、トランケートされたKQ(NEB))に、RNAペレットを再懸濁した。反応物を16℃で一晩インキュベートした
6.5.逆転写。ライゲーション後、RNAを、2×SPRISelectビーズ(Beckman Coulter Genomics)により精製し、RNase非含有水内で溶出した。以下のRT反応は2μgのRNAについて記載しており、より量の多いRNAについてはそれに応じてスケールアップされた。各実験又は複製について、個々の実験バーコード配列を含む異なるRTプライマーを用いた。各RTプライマーは5’-/5Phos/NNXXXXNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT(配列番号4)の形態を有する。この手法では、すべての配列リードペアの第1リードは、NNNNXXXXNN(配列番号5)(RTプライマーのものの逆相補)の構成を取るバーコードを含み、NはPCR重複を除去するための無作為の6ntバーコードである(G.B.Loeb等、Molecular cell 48、760(2012年12月14日);Z.Wang等、PLoS Biol 8、e1000530(2010年);J.Konig等、Nature structural&molecular biology 17、909(2010年7月);S.W.Chi、J.B.Zang、A.Mele、R.B.Darnell、Nature 460、479(2009年7月23日))。同一のマッピング位置及び無作為のバーコードを有する任意の2つのペアエンドリードは単に1つとしてカウントされ得る。XXXXは、多重シーケンシングのための固定の4ntサンプルバーコードである(ES−1ではAGGT、ES−2ではCGCC、ES−インダイレクトではCATT、MEFではCGCC)。任意の2つの4ntサンプルバーコードは3つのヌクレオチドによって異なり、変異又はシーケンシングエラーによる混乱の可能性を退ける。
cDNA合成のため、9μlのRNAを1μlの10mMdNTP及び1μlの50μMRTプライマーと混合した。混合物を65℃で5分間加熱し、少なくとも2分間、氷で急速冷却した。4μlの5×First−Strandバッファー(Invitrogen)、1μlのDTT0.1M、1μlのRNasin Plus、1μlの10mg/mlT4遺伝子32タンパク質(NEB)を添加した。得られた混合物を50℃で2分間インキュベートした後、誤ったプライミングを最小化するために逆トランスクリプターゼ酵素を添加した。そして、2μlの200U/μlSuperscriptIII逆トランスクリプターゼ(Invitrogen)を溶液に添加した。それから、RT反応混合物を50℃で45分間、55℃で20分間インキュベートし、その後4℃で保持した。ここで、逆トランスクリプターゼ酵素の熱失活は、RNA−cDNAハイブリッドを保存するために省略された。
<ステップ7:キメラRNA−DNAハイブリッドのビオチンプルダウン>
ストレプトアビジン−ビオチンアフィニティー精製を用いてキメラRNA−DNAハイブリッドを濃縮した。配列リードペアの実質的な断片が、リードペアの一端においてRNA−リンカー又はリンカー−RNA接合部を包含できるように、2回目のRNA断片化及び逆転写の後に、このプルダウンを行った。
具体的には、1×TweenB&Wバッファー(5mMのTris−HCl pH8.0、0.5mMのEDTA、1MのNaCl、0.05%Tween)で2回洗浄し、1×B&Wバッファー(5mMのTris−HCl pH8.0、0.5mMのEDTA、1MのNaCl)で1回洗浄することで、50μlのMyoneC1ビーズ(Invitrogen)を調製した。そして、ビーズを100μlの2×B&Wバッファー(10mMのTris−HCl pH8.0、1mMのEDTA、2MのNaCl)で再懸濁した。RT混合物に、100μlの最終量までRNase非含有水を足した後、100μlのC1ビーズ懸濁液と合わせ、回転させて30分間、RTでインキュベートした。ビーズを回収して、1×B&Wバッファーで3回洗浄した後、新しいチューブに移して、その後にTEバッファーpH8.0で1回洗浄した。次に、50μlのRNase H溶出混合物(39.5μlのRNase非含有水、5μlの10×RNaseH反応バッファー、0.5μlの10%Tween−20、5μlの5U/μlRNaseH(NEB))内で、37℃で1時間、RNA鎖を完全に消化することで、cDNA鎖をストレプトアビジンビーズから放出した。磁性濃縮器を用いてチューブ壁でビーズを採取し、後の操作のために上清を新しいチューブに採取した。RNaseHを70℃で20分加熱することで不活性化した。2.2×SPRISelectビーズ(Beckman Coulter Genomics)(v/v)によって、cDNAを精製した。
<ステップ8:配列ライブラリ構築>
UV誘導架橋部位がしばしば逆転写を停止して、5’アダプターを欠損したトランケートcDNAをもたらすこと(Y.Sugimoto等、Genome Biology 13、R67(2012年))を考慮して、環状化方法を採用して、トランケートcDNAからでも配列ライブラリを構築可能にした(I.Huppertz等、Methods 65、274(2014年))(図7)。RTプライマーは、Illumina PE PCRフォワードプライマー1.0(5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT)(配列番号6)及びPE PCRリバースプライマー2.0 (5'-CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT)(配列番号:7)によってPCR増幅のプライミングを行うために、アダプター領域を包含し、BamHI制限部位及び配列バーコードが隣接する。
8.1.環状化。cDNAをCircLigaseII(Epicentre)によって環状化した。短時間で、cDNAを、20μlのCircLigase反応混合物(12μlの滅菌水、2μlのCircLigaseII 10×反応バッファー、1μlの50mMMnCl2、4μlの5Mベタイン、1μlの100U/μlCircLigaseII(Epicentre))内でSPRISelectビーズから溶出し、60℃で2時間インキュベートした。反応物を80℃で10分間インキュベートすることで、CircLigaseIIを不活性化した。
8.2.再直線化。相補的DNAオリゴをRTプライマーにアニーリングし、BamHI制限に適した短2本鎖領域を生成した。この方法ではまた、他の内在性BamHI制限部位におけるBamHI活性が阻止される。次に、BamHIを適用し、次のPCR増幅のプライミングを行うために5’末端と3’末端とにアダプターを有する直線cDNAを生成した。その後、オリゴアニーリング混合物(43μlの水、6μlの10×FastDigestバッファー(Fermentas)、5μlの20μMCut_oligo(5'-GTTCAGGATCCACGACGCTCTTCAAAA/3InvdT/)(配列番号8))をCircLigaseII反応物に添加した。2分間95℃に加熱し、その後、95℃から開始して毎サイクル後に温度を1℃、25℃まで下げる、各20秒の71サイクル、そして25℃に保持することで、アニーリングを行った。6μlのFastDigest BamHI(Fermentas)を添加し、37℃で30分間インキュベートした。再直線化されたcDNAを2×SPRISelectビーズ(Beckman Coulter Genomics)(v/v)によって精製し、ヌクレアーゼ非含有水内で溶出した。
8.3.第1のPCR予備増幅とサイズ選択。1本鎖cDNAを、少数のサイクル(6サイクル)で、PCRプライマーのトランケートされたもの(フォワードプライマーDP5、5’-CACGACGCTCTTCCGATCT(配列番号9);リバースプライマーDP3、5’-CTGAACCGCTCTTCCGATCT(配列番号10))を用いてPCRによってまず予備増幅した。この段階でサイズ選択を行うことにより、最終ライブラリが望ましくないより小さいサイズの断片(プライマー−ダイマー、バーコード及び/又はRNAリンカーのみを含む産生物)であまり汚染されないということが分かった。
6サイクルのPCRを、20μlのNEBNextハイフィデリティー2×PCRマスターミックス(NEB)、0.625μMの各DP5・DP3プライマーを含む40μl反応物内で、98℃で30秒間の初期変性を1サイクル;98℃で10秒間、65℃で30秒間、72℃で30秒間での増幅を6サイクル;その後72℃で5分間最終伸長;及び4℃で保持、という温度を用いておこなった。PCR産生物を1.8×SPRISelectビーズ(v/v)で精製し、E−gelEX2%アガロースゲル(Invitrogen)を用いてサイズ選択を行った。150bp〜350のDNA断片をゲルから除き、MinEluteゲル抽出キット(Qiagen)を用いて精製した。
8.4.二本鎖特異的ヌクレアーゼ(DSN)手法によるrRNA除去(H.Yi等、Nucleic Acids Research 39、e140(2011年))(ES−1、ES−インダイレクト)。rRNAを低減するために、ES−1及びES−インダイレクトライブラリからのcDNA、ss−cDNAも、トランケートPCRプライマーDP5・DP3を用いて予備増幅した。しかしながら、1.8×SPRISelectビーズ(Beckman Coulter Genomics)(v/v)による精製後に80〜100ngのcDNAが得られるまで、PCRサイクル数を増加した。これがDNA量を大きく低減することからアガロースゲルによるサイズ選択を省略した。SPRISelectビーズからの溶出DNAを、18μlの最終量まで、4.5μlのハイブリダイゼーションバッファー(2MのNaCl、200mMのHEPES、pH8.0)及び滅菌水(必要であれば)に混合した。得られた混合物を98℃で2分間変性し、サーマルサイクラーにおいて68℃で5時間再アニーリングした。反応混合チューブがまだサーマルサイクラーにある時に、20μlの、68℃に予め加熱した2×DSNバッファー(Axxora)を反応混合物に添加し、上下に10回ピペッティングしてよく撹拌し、反応物を10分間68℃でインキュベートした。2μlの1U/μlDSN酵素(Axxora)を添加、混合、及び68℃で25分以上インキュベートした。反応混合チューブに40μlの2×DSN停止溶液(Axxora)を添加し、よく撹拌し、チューブを氷に移すことで反応を停止した。そして、反応混合物を1.8×SPRISelectビーズを用いて精製した。
8.5.最終PCR増幅。全長PCRプライマーPE1.0及び2.0(Illumina)を用いて、前のステップで産生されたDNAにPCR増幅を行った。過剰増幅を避けるために小分量のDNAで試験的なPCRを行うことで、PCRサイクル数を入念に設定した。PCR産生物を1.8×SPRISelectビーズ(v/v)によって精製し、250〜550の断片をサイズ選択した(120〜420bpインサート+約130bp、 the combined length of Illumina PE1.0/2.0の合わせた長さ)。最終ライブラリをQubit(Invitrogen)及びqPCRで定量化し、バイオアナライザー(Agilent Technologies)で品質確認を行い、Illumina HiSeqプラットフォームのペアエンドシーケンシングに出した。
<RNAのHi−Cに用いられるオリゴヌクレオチド配列>
本手法に用いられるカスタム設計RNA及びDNAオリゴヌクレオチドは、
ビオチン化RNAリンカー(RNase非含有、HPLC精製、IDT製):5' - rCrUrA rG/iBiodT/rA rGrCrCrCrArU rGrCrA rArUrG rCrGrA rGrGrA - 3'(配列番号11)、
RNAリンカーを有する相補的DNA鎖(RNase非含有、HPLC精製、Sigma製):5' -T*C*G*C*ATTGCATGGGCTACTAGCAT - 3'(配列番号12)、
予備アデニル化RTアダプター(RNase非含有、HPLC精製、IDT製):5’ /5rApp/AGATCGGAAGAGCGGTTCAG/3ddC/(配列番号13)、
RTプライマー((I.Huppertz等、Methods 65、274(2014年))より適応)(RNase非含有、HPLC精製、Sigma製):ES−1サンプルのRTプライマー:5’/5Phos/NNAGGTNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT(配列番号14)、ES−2サンプル及びMEFサンプルのRTプライマー(異なるレーンにシーケンシングされる):5’/5Phos/NNCGCCNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT(配列番号15)、ES−インダイレクトサンプルのRTプライマー:5’ /5Phos/NNCATTNNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGCTCTTCCGATCT(配列番号16)、
Cut_oligo(HPLC精製、IDT製):5'-GTTCAGGATCCACGACGCTCTTCAAAA/3InvdT/- 3'(配列番号17)、BamHI制限部位は下線で示される、
トランケートPCRフォワードプライマーDP5(HPLC精製、IDT製):5’-CACGACGCTCTTCCGATCT(配列番号18)、
トランケートPCRリバースプライマーDP3(HPLC精製、IDT製):5’- CTGAACCGCTCTTCCGATCT(配列番号19)、
Illumina PE PCRフォワードプライマー1.0(PAGE精製、Sigma製):5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(配列番号20)、
Illumina PE PCRリバースプライマー2.0(PAGE精製、Sigma製):5’-CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT(配列番号21)、である。
<計算パイプライン処理(RNA−HiC−ツール)>
RNA−HiC−ツールはRNAのHi−Cデータ解析のためのコマンドラインツールパッケージである。これはPython及びRで書かれ、GitHubによりバージョン管理されている。全資料についてはhttp://systemsbio.ucsd.edu/RNA-Hi-Cにある。該パイプライン処理は、ペアエンド配列リードを入力とする(図15A)。RNAリンカーのオリゴヌクレオチド配列と多重シーケンシングに用いられるサンプルバーコードとも、パイプライン処理に提供される必要がある。主要な出力は、1.RNA1−リンカー−RNA2の形態のキメラcDNAリストを含む、解析されたcDNAライブラリ(図7、図15Cの最終産生物参照)、2.すべてのキメラcDNAのRNA1及びRNA2のゲノム位置(図15D)、3.キメラcDNAの統計的強化から推定される相互作用RNAペア(図15E)を含む。解析ステップは以下のとおりである。
〔1.PCR重複除去〕
フォワードリードは(図15Aのリード1)は5’末端において4ntサンプルバーコード及び6nt無作為バーコードを含む。リードペアは、2つのリードペアが同一の配列を有し、同一のバーコード(10nt)を含む場合に、他のリードペアのPCR重複と分類されて、破棄される。「remove_dup_PE.py」というツールがこの機能を提供し、非重複リードを含むfastq/fastaファイルを生成し、除去された重複数をレポートする。
〔2.多重シーケンシングリードを対応実験サンプルに割り当て〕
「split_library_pairend.py」というツールが、各リードのサンプルバーコードをサンプルバーコードリストのもの(ユーザ入力テキストファイル)と一致させて、各ペアエンドリードをサンプルに割り当て、各サンプルに割り当てられたリードのfastq/fastaファイルと、割り当てられないリードのfastq/fastaファイルとを生成する。
〔3.シーケンシングライブラリにおけるcDNA回収〕
このステップでは、もしあるなら、全てのリードペアにおける2つの末端のオーバーラップ領域が特定される。また、可能であるときに、シーケンシングライブラリにおけるcDNA配列全体も回収される。
オーバーラップが存在する場合、そのリードペアは、100bp〜200bp(P5及びP7の長さはカウントしない)のcDNAからシーケンシングされた(図32、タイプ2)。この場合、cDNA配列全体は、フォワードリード(リード1)をリバースリード(リード2)の非オーバーラップ領域とを連結することで完全に包含される。
cDNAが100bpより短い場合、cDNAの2つの末端におけるP5及びP7プライマーの存在が確認された(タイプ1)。P5又はP7を含まないものは破棄された(タイプ4)。
オーバーラップがないと、リードペアは、200bpよりも長いcDNAからシーケンシングされ、その配列は部分的に回収されるのみであり得る(図32、タイプ3)。
この機能は、「recoverFragment.py」によってなされ、これは局所アライメントを用いてオーバーラップ領域を特定するものである。リード長さ(各末端で100bp)と比較してオーバーラップが小さいとき(15bp以下)、局所アライメントは非感受的であり得る。この非感受性を解決するため、「recoverFragment.py」は、最初のアライメント後に、特定できるオーバーラップがないリードペアを収集し(図32、ALIGN1)、各リードをその長さの3分の1にトランケートし(各リードの3’で33bpを保持)、局所アライメントを繰り返す(ALIGN4)。
〔4.キメラcDNAの解析〕
このステップではcDNAがその構成に基づいて分類される(図15C)。これは、完全に(図32、タイプ1及びタイプ2)又は部分的に(タイプ3)回収されたcDNA配列と、リンカー配列とを、入力として用いる。cDNAにおけるリンカー位置を特定し、リンカー配列位置に基づいて、以下のものを含むcDNAの5分類を生成する。
1.リンカーなし。リンカー配列を含まない、任意のタイプ1又はタイプ2cDNAはこの分類に属する。この分類はさらに3つの副分類に分けられ、以下のものを含む。
a.バーコードのみ。cDNA全体が10ntバーコード(4ntサンプルバーコード+6nt無作為バーコード)であり、非ライゲーションRTプライマの汚染によりもたらされたと考えられる。
b.単一のRNA。cDNA全体がRNAの連続的な断片である。
c.RNA1−RNA2。これらはリンカーライゲーション前の近接ライゲーションからもたらされたと考えられる。
リンカーを包含する分類の4つには、以下のものが含まれる。
2.RNA1−リンカー−RNA2。これらは所望のキメラRNAからもたらされた。2つのリードが2つの個別のRNA遺伝子に完全にアライメントされる任意のリンカー非含有のタイプ3cDNAも、この分類に入れられた。RNA1側及びRNA2側の両方が少なくとも5bpの配列を含むことが要求された。
3.リンカー−RNA2。リンカーは、RNAの5’末端に正常にライゲーションされたが、近接ライゲーションでは成功しなかった。
4.RNA1−リンカー。リンカーはRNAの3’末端にライゲーションされた。これは、3’−OH基を有するRNA又はRNA断片から、又は第2の断片化ステップ時におけるRNA1−リンカー−RNA2キメラからの一方のRNA(RNA2)切断から発生したと考えられる。
5.リンカーのみ。cDNA全体がバーコード及びリンカー配列であった。
このステップでは、RNA1−リンカー−RNA2分類に属するcDNAリストが出力される。
〔5.ゲノムへのマッピング〕
そして、すべての解析はRNA1−リンカー−RNA2タイプのリードペアに基づくものであった。まず、リンカーのRNA1側又はRNA2側に15未満bpを含む任意のcDNAは破棄された。これは、マッピングステップにおいて15bp以下の配列をユニークにマッピングすることが困難であるためである。そして、リンカー各側の2つのRNA断片(RNA1及びRNA2)は、Bowtieバージョン0.12.7(B.Langmead、C.Trapnell、M.Pop、S.L.Salzberg、Genome Biology 10、(2009年))及びパラメーター−f −n 1 −l 15 −e 200 −p 9 -Sを用いて、マウスゲノムmm9/NCBI37に個別にマッピングされた。「Stitch−seq_Aligner.py」において適用されるこのステップでは、RNA1とRNA2とがゲノムにユニークにマッピングされたリードペアが出力される。
さらなる感受性の可能性のあるマッピング方法が、Bowtie2(B.Langmead、S.L.Salzberg、Nat Methods 9、357(2012年4月))の「−−sensitive−local」モードをパラメーター「−D 15 −R 2 −N 0 −L 20 −i S,1,0.75」と共に用いてテストされた。この「multiseed alignment」では20bpのシードが用いられ、任意のシードにおける不整合0、シード間の9bp間隔(ceil(1+0.75×√100))、15までの連続シード延長試験、及び2回までの「再シード」を可能にした。この代替的方法によって、Bowtie0.12.7よりやや少ないユニークなアライメントが特定されるという結果を得た。従って、Bowtie0.12.7の結果が次のステップに用いられた。
〔6.相互作用RNAペアの特定〕
mRNA、lincRNA、rRNA、snRNA、snoRNA、miRNA、misc_RNA、tRNA、及びトランスポゾンの遺伝子を含む、Ensembl(リリース67、マウスNCBIM37)から、アノテーションを取り出した。同じトランスポゾンの異なるゲノムコピーは、この解析において異なる遺伝子として捉えられた。rRNAにマッピングされたリードはさらなる解析から除かれた。(RNA1−リンカー−RNA2タイプのRNA1又はRNA2からの)ユニークにアライメントされたリードの数は、すべての遺伝子においてカウントされた。5未満のリードカウントを有するいずれの遺伝子も除外された。次に、任意の2つの遺伝子間の会合はフィッシャーの正確検定でテストされた。帰無仮説は、遺伝子Aと遺伝子Bとは配列リードに独立して寄与するというものであった。対立仮説は、リードカウントに対するこれらの寄与が関連するというものであった。cA、はそれぞれ遺伝子Aと遺伝子Bのリードカウントとして表され、IA,Bは、2遺伝子が同じリードペアに共出現する、共出現のリードカウントとして表される。検定統計量として
を用いて、フィッシャーの正確検定が各遺伝子ペアに行われ、
は、遺伝子Aではない他の遺伝子(遺伝子B)のリードカウントであった。p値とFDRとを(ベンジャミン−ホッホバーグ法(Y.Benjamini、Y.Hochberg、Journal of the Royal Statistical Society.57、289(1995年))、すべての遺伝子ペアについて計算した。このステップでは、FDR<0.05且つ倍率変化(fold−change、FC)≧3である遺伝子ペアが出力される。FCは
として計算され、I′A,Bは対照サンプル(ES−インダイレクト)の共出現リードカウントであった。このステップは、その相互作用領域、サポートペア数、有意性のp値、FDR、及び倍率変化(fold−change)の情報を有する強力な相互作用RNAペアを出力する「Select_strongInteraction_RNA.py」において適用された。
〔7.RNA相互作用部位の特定〕
RNA相互作用部位は、RNA−RNA相互作用に度々寄与する連続的なRNAセグメントとして定義された。RNA相互作用部位は、複数のオーバーラップリードと、他のRNAとの頻繁な共出現(近接ライゲーション)とを有する連続的なRNAセグメントとして、RNAのHi−Cデータから推定された。まず、5以上のユニークにアライメントされたリードに含まれる任意の連続的なRNAセグメントを候補の相互作用部位として特定した。次に、任意の2つの候補部位間の関連をフィッシャーの正確検定でテストした。帰無仮説は、候補部位Aと遺伝子Bが配列リードに独立的に寄与するというものであった。対立仮説は、リードカウントに対するこれらの寄与が関連するというものであった。cA、はそれぞれ候補部位A及びBのリードカウントとして表され、IA,Bは、2つの部位が同じリードペアに共出現する、共出現のリードカウントとして表される。検定統計量として
を用いて、フィッシャーの正確検定が各部位ペアに行われ、
は、Aではない他の候補部位(B)のリードカウントであった。p値とFDRと(ベンジャミン−ホッホバーグ法)を、すべての候補部位ペアについて計算した。有意な関連(FDR<0.05)を示す候補部位が、RNA相互作用部位と考えられた。このステップは、特定されたRNA相互作用部位を出力する「Select_strongInteraction_pp.py」において自動化された。
「Plot_interaction.py」というツールは、RNA相互作用部位とこれらの部位のライゲーションイベントとを視覚化するために開発された(図16A〜図16B)。例えば2つの遺伝子の位置である、入力としての任意の2つのゲノム領域から、このツールは、RNA1−リンカー−RNA2形態のすべてのサポートリードペアを表示し、RNA1とRNA2とは2つのゲノム位置のそれぞれにアライメントされた。各RNAペアのリンカーもプロットされた。このツールはまた、もしあるなら、入力領域におけるRNA相互作用部位や、これら部位間の特定された相互作用もプロットする。
「Plot_Circos.R」というツールは、RNA−RNAインタラクトームの全体図を提供する(図16C)。これは、ゲノム全体を円としてプロットし、任意のRNA−RNA相互作用を2つの寄与遺伝子を繋ぐ湾曲線としてプロットする。異なるタイプのRNAに関与する相互作用は異なる色で示される。RNA1とRNA2リード断片の密度は、内円として、すべての染色体と共に表示される。その他の解析及び視覚化ツールはhttp://systemsbio.ucsd.edu/RNA-Hi-Cに記載される。
<RNA相互作用部位間の結合エネルギー>
2つのRNA相互作用部位間の結合エネルギーを、RNAstructureバージョン5.6のDuplexFoldプログラムにより計算した(S.Bellaousov、J.S.Reuter、M.G.Seetin、D.H.Mathews、Nucleic Acids Res 41、W471(2013年7月))。2つの相互作用部位間の塩基対をMiRandaバージョン3.3aにより決定した(D.Betel、A.Koppal、P.Agius、C.Sander、C.Leslie、Genome Biol 11(2010年))。
<RNA相互作用部位の保存レベル>
RNA1−リンカー−RNA2カテゴリのすべてのリードペア(ステップ4の出力)について、一方はRNA1−リンカーのライゲーション接合部の中心にあり、他方はリンカー−RNA2のライゲーション接合部の中心にある、2つの1000bpゲノム領域のPhyloP保存スコアを取得した(G.M.Cooper等、Genome Res 15、901(2005年7月))。すべてのRNA1−リンカー−RNA2タイプリードペアの平均PhyloPスコアをプロットした。対照として、同数の同じ長さの無作為ゲノム領域からの平均PhyloPスコアを取得した。
<ネットワーク解析>
特定されたRNA−RNA相互作用(ステップ6の出力)を表形式に変換し、視覚化のためCytoscape3.1.0(R.Saito等、Nat Methods 9、1069(2012年11月))にインポートした。各ノードは遺伝子を表し、遺伝子型により色分けされた。各ノード数をCytoscapeにより計算した。
<分子内切断及びライゲーションから生成されたリードペアの検出>
RNA1−リンカー−RNA2タイプのリードペア(ステップ6の出力)から開始して、自己相互作用RNAから生成されたペアエンドリードを特定するために、以下のフィルターを適用した。
1.2つの異なる遺伝子にマッピングされたリードペアを除いた。
2.リードペアが同じ遺伝子にマッピングされる場合、(1)リンカー配列の任意の断片を含まない、(2)フォワード及びリバースリードが2000bp内の対向鎖にマッピングされる、(3)正鎖にマッピングされたリードがペア内のゲノムにおいて負鎖にマッピングされたリードより小さい座標を有する、というペアも除いた。このステップは構造解析において無傷の(連続的な)RNA断片の含有を最小化する。
<RNA折りたたみ及び2次構造予測>
既知である又は通常容認される構造を有するRNAの構造情報を、fRNAdbデータベースv3.4(T.Mituyama等、Nucleic Acids Research 37、D89(2009年1月))からDOT形式(グラフ記述言語)でダウンロードした。コマンドラインバージョンのVARNAアプレットバージョン3.9を用いてDOTファイルから図を描画した(K.Darty、A.Denise、Y.Ponty、Bioinformatics 25、1974(2009年8月1日))。fRNAdbに構造情報がないRNAについて、その2次構造を、RNAstructureバージョン5.6の「Fold」プログラムを用いて、配列に基づいて予測した(S.Bellaousov、J.S.Reuter、M.G.Seetin、D.H.Mathews、Nucleic Acids Res 41、W471(2013年7月))。
[RNAのHi−Cの対照実験]
第1の対照実験では、手順において架橋ステップを省略した。第2の対照実験では、タンパク質のビオチン化ステップを省略した。第3の対照実験では、マウスES細胞とショウジョウバエS2細胞との混合細胞溶解物において全手順を行った。
まず、約3×10マウスES細胞の非架橋対照を行った。ストレプトアビジンビーズにタンパク質と共に固定化されたRNAを、上述のようにタンパク質消化により精製した。精製RNAは、Qubit RNA HSアッセイ(Invitrogen)により定量化された。RNAはアッセイの検出限界(250pg/μl)より少ないものであった。サンプル量は20μl(上述と同じ)であり、これはRNA量が5ng以下であったことを示唆する。この時点で、リンカー選択及びライブラリー構築ができる見込みがないため実験を停止した。上述の実験では、精製RNAはこのステップでμg範囲にあるものであった。
次に、3×10マウスES細胞にタンパク質のビオチン化を行わない(架橋を保持)ことで、他の対照を行った。ビーズから精製されたRNAはQubit RNA HSアッセイの検出限界より少ないものであることが分かった。
3つ目に、3×10ショウジョウバエS2細胞と3×10マウスES細胞とで実験を開始した(異種対照)。細胞を架橋し、溶解した。2つの細胞株からの溶解物を混合後、タンパク質のビオチン化及び近接ライゲーションを行った。配列ライブラリ(Fly−Mm)を作製するために、混合物に残りの実験手順を行った。Fly−Mmは27,748,688のリードペアを包含した。重複リードを除去し、リンカーによって分けた後、16,881,326のRNA1−RNA2ペアが存在した。各RNA部分(RNA1又はRNA2のいずれか)をハエゲノム(dm6)にマッピングし、マウスゲノム(mm9)にマッピングした。全部で7,188,769のペアが、マウス又はハエゲノムのいずれにもマッピングできない少なくとも一部分(RNA1又はRNA2のいずれか)を有した。残余の9,692,557のRNA1−RNA2ペアはゲノムにマッピングされた両方の部分を有し、その中で、8,484,807ペアが1つのゲノムのみにユニークにマッピングされた各RNA部分を有した。これらのマッピングされたRNAペアの分布は以下のとおりである(表6)。2種にマッピングされたRNAペアの割合は、0.52%(44,229/8,484,807)である。
さらに、ES−1ライブラリ(純粋マウスサンプル)が上述の解析を受けたらどうなるかが検討された。0.55%のRNA1−RNA2ペアが、マウスゲノムにユニークにマッピングされた一方のRNA部分と、ハエゲノムにユニークにマッピングされた他方の部分とを有し得るということが分かった。ゆえに、Fly−Mmサンプルの「汚染率」(0.52%)は、ES−1サンプルのもの(0.55%)よりもさらに低いものであり、実験上の汚染(おそらくは無作為ライゲーションのため)が非常に低いのでインフォマティク手法のエラー範囲に該当したということが示唆される。
[2重架橋とUV架橋との違い]
FA−DSG2重架橋を、RAPシーケンシングにおいて、ソラレン架橋及びホルムアルデヒド(FA)架橋と比較した(J.M.Engreitz等、RNA−RNA interactions enable specific targeting of noncoding RNAs to nascent Pre−mRNAs and chromatin sites. Cell 159、188(2014年9月25日))。架橋後に、Engreitz等はアンチセンスオリゴヌクレオチドを用いて核内Malat1RNAを精製し、Malat1と共に精製されたRNAをシーケンシングした。Engreitz等は、2重架橋と他の2つの架橋法との間で、Malat1標的の少々のオーバーラップを認めた。1つのRNAを除いて、2重架橋においてMalat1と共精製された数百のRNAはすべてユニークであった(Engreitz等の付録表3)。Engreitz等は、これを、2重架橋が「複数のタンパク質中間体を介して非直接に結合されたRNAを効率的に捕捉」できるという考えによるものであるとした。UV架橋(本発明の方法)は核酸から核酸の架橋においてソラレンほど効果的でなはく、全体的にFAほど効果的ではない。公開されたデータに基づくと、UV架橋及び2重架橋によって検出されたRNAペアが大きくオーバーラップするとは予期されなかった。
さらに具体的には、snoRNAは短く(約150nt)、mRNAと相互作用するときに、snoRNPタンパク質複合体を包囲するか又はその内にあり得る。2重架橋は、snoRNP複合体全体を保持すると考えられる。snoRNP複合体は、RNaseIがsnoRNAを切断するのを妨げ、またRNAライゲーションを抑止すると考えられる。ゆえに、snoRNAに関与する検出相互作用における大きな差は予期されるものであった。
[miRNA様相互作用を有する他のRNA]
その他のRNAがmiRNA生合成と同様のプロセスを経るか、またmRNAと相互作用し得るかが検討された。RNAのHi−Cにより、ES細胞において、小型RNAシーケンシング(小型RNA−seq)によって見出されたもの及びAGOタンパク質と結合するもの(HITS−CLIP)との相互作用RNAが特定された。小型RNA−seqでは、「Dicer又はその他のRNA処理酵素による酵素切断からもたらされる3’ヒドロキシル基を有するmiRNA及びその他の小型RNA」が選択的にシーケンシングされた。miRNAを除いて、snoRNA、偽遺伝子RNA、mRNA UTRを含む他のRNA型も小型RNAプールに寄与し、AGOに付加された(図17)。さらに、RNAのHi−Cにより特定された相互作用RNAペアの大部分が、AGO HITS−CLIPデータにおいて共出現した(図18)。このデータにより、DICER又は他のRNA処理酵素により消化され、且つRISC複合体に組み込まれるノンmiRNAが存在することが示唆される。
ノンmiRNA遺伝子のどのタイプがmiRNA様生合成を受け得るかを明らかにするため、RNAのHi−Cによって特定されたRNA−RNA相互作用に以下のフィルターを行った。
1.相互作用が1つのmRNA(標的と称される)ともう一つのRNA(ソースRNA)に関わる。
2.ソースRNAは酵素切断により小型RNA処理される(小型RNA−seqにおいてFPKM>0)。
3.標的とソースRNAとはAGO HITS−CLIPに出現する(両RNAでFPKM>0)。
4.ソースにおけるRNAHi−C特定相互作用部位と、標的RNAとは強力な塩基対形成を示す(p値<0.05、すべてのペアエンドリードのRNA1配列とRNA2配列との結合エネルギーを、無作為にシャッフルしたヌクレオチド配列の結合エネルギーと比較するウィルコクソン符号順位検定)。
総数302のRNA−RNA相互作用がこれらのフィルターを通過した。これらの相互作用におけるソースRNAの大多数(79%)はsnoRNAであった(表ST2)。ゆえに、snoRNAは機能解析において優先された。
多数のsnoRNAがmiRNA様短鎖RNAに酵素処理され、mRNAと相互作用したと仮定された。この仮定は、mRNAとsnoRNAとの両方がAGOによって結合された、919のRNAHi−C特定snoRNA−mRNA相互作用によって裏付けられた。さらにAGO結合snoRNAとその相互作用mRNAとは、ES細胞の中内胚葉への誘導分化時に、反相関発現変化を示した(P.Yu等.、Spatiotemporal clustering of the epigenome reveals rules of dynamic gene regulation、Genome research 23, 352(2013年2月))(図17B)。加えて、AGO結合snoRNAとその標的mRNAとは、AGO結合のないものよりも、強力な塩基対形成を示した(図17C)。最後に、snoRNAから処理された小型RNAは、mRNAのUTR領域と指示的に相互作用した。RNA−RNA相互作用に関する497のsnoRNAから、243がUTR領域と相互作用し、その中で223(92%)が小型RNA−seqにおいて検出され、これは、酵素切断を受けたことを示唆する(図17D)。比較すると、非UTR領域と相互作用するその他の254のsnoRNAは、より少ない小型RNA(55%)を含有した。さらに、非UTR相互作用snoRNAよりも、2倍のURT相互作用sno−siRNAがAGO結合であった(p値<2.2−16、カイ二乗検定)。例えば、Snora14 RNAは、Mcl1 mRNAの3’UTRを標的とした(図19A)。Snora14 RNAの相互作用部位(110〜135nt)は、酵素処理された小型RNA(薄紫色のレーン)及びAGO結合領域(緑色のレーン)と正確にオーバーラップした。Snora14 RNAの酵素処理した部分はヘアピンループの完全に一方側に位置し(図19B)、Mcl1 UTRの標的部位に対して強力な結合親和性(−60kCal/mol)を示す。処理Snora14 RNAの発現はMcl1 mRNAのものと負の相関を示した(図19C)。共に考慮すると、ES細胞において900を超えるmRNAと相互作用する、多数のsnoRNA遺伝子由来低分子干渉RNAについて、このデータは示唆する。
[摂動のないインビボにおけるRNA−RNAインタラクトームマッピングとRNA構造]
RNA−RNAインタラクトーム全体の解析には未だ困難がある。任意の摂動なく、インビボにおける任意の単一のタンパク質に含まれるRNA−RNA相互作用をマッピングするために、RNAのHi−C技術が開発された。RNA−RNAインタラクトームは、胚性幹細胞において体系的にマッピングされ、46,780の相互作用を明らかにした。RAP−seq1を用いて7つの相互作用を検証した。このインタラクトームでは、大部分のmiRNA及びlincRNAは1つのmRNAとそれぞれが特異的に相互作用し、これは「乱雑な」RNA相互作用という現在の定説と矛盾する。塩基対は、長鎖RNA間の相互作用領域で観察され、トランスで作用する調節配列分類を示唆した。さらに、RNAのHi−Cは、1本鎖領域のフットプリントと各RNAの空間的近位部位とを共に明らかにすることで、RNA構造の新規の情報を提供する。このように、細胞生理の最小摂動を伴うタンパク質補助RNAインタラクトームの偏りのないマッピングが、先行の方法に対して有利であり、RNA機能検証の範囲を大きく拡大する。この技術により、内在性レベルのRNA発現を摂動することなく、RNA−RNAインタラクトームの特定可能部分が大きく拡大される。
[RNAのHi−Cのシミュレーション分析]
<データ合成>その実験及び計算方法を含むRNA Hi−Cの感受性と特異性とを推定するために、シミュレーション解析を行った。データ生成プロセスを計算で再現することによって、100万ペアエンドリードをシミュレーションした。シミュレーションに用いられたパラメータは、実際のデータに由来した。シミュレーションされたデータ生成プロセスは、以下のとおりである。
各ペアエンドリードについて(2×100塩基)、
1.同等の可能性のある4つのサンプルバーコードから1サンプルバーコードを選択し、6nt無作為バーコードと連結した(図15Aのように)。
2.このペアエンドリードを、[0.1、0.3、0.1、0.3、0.2]の可能性をそれぞれ有する[リンカーのみ、リンカーなし、RNA1−リンカー、リンカー−RNA2、RNA1−リンカー−RNA2]のリストからのcDNAの一タイプに割り当てた(図15Cのように)。
3.このリードペアがリンカ−包含タイプに割り当てられる場合に、同等の可能性のある1又は2のリンカーを無作為に選択する。僅かな割合のリンカ−包含リードペアが2つのリンカーを含むということが言及され、同等の可能性の利用は、最悪の場合を推定するための保存的な選択であった。
4.ステップ2で決定されたcDNAタイプに従って、RNA1部分及びRNA2部分のために配列を生成する。RNA1とRNA2とについて、
a.l〜Unif(15,150)から長さをシミュレートする。
b.以下の可能性に基づいて、[「miRNA」、「mRNA」、「lincRNA」、「snoRNA」、「snRNA」、「tRNA」]からRNAタイプを選択する。
i.長さl<50の場合、[0.2、0.2、0.1、0.2、0.2、0.1]を使用。
ii.そうでなければ、[0.05、0.4、0.2、0.2、0.1、0.05]を使用。
c.Ensembl(リリース67、マウスNCBIM37)から、サンプルのRNAタイプに従って、RNAを無作為に選択する。
d.選択したRNAから長さlを有する配列セグメントを無作為に取得する。
5.バーコード、リンカー、及びステップ1、3、4から生成されたRNA断片を連結し、合成cDNA配列を作製する。
6.ステップ5における合成cDNAが100bp又はより長い場合、それぞれフォワード及びリバース鎖における合成cDNAの2つの末端からの100塩基を取る。
7.ステップ5における合成cDNAが100bpより短い場合、そのフォワード及びリバース鎖をフォワード及びリバースリードとして割り当て、P5及びP7プライマー配列を2つのリードに連結する。
8.各塩基において0.01の比率でシーケンスエラーをシミュレートする(N.J.Loman等、Performance comparison of benchtop high−throughput sequencing platforms、Nature biotechnology 30、434(2012年5月))。
ステップ1〜5では、実験方式に合致するcDNA配列をシミュレートし、ステップ6〜8では、このcDNA配列に基づいてペアエンドリードをシミュレートした。シミュレートされた相互作用RNAペアとcDNAタイプと各部分の長さ(該当する場合、RNA1、リンカー、及びRNA2)が計算による予測と比較するために保存された。
<中間及び最終結果の評価>
2つの中間解析ステップの感受性及び特異性、並びに最終予測を評価するために、合成データを用いた。
まず、プログラムが特定したcDNAの長さ(RNA−HiC−ツールのステップ3の出力)を実際(合成)の長さと比較した(表8)。このステップ「3、配列ライブラリにおいてcDNAを回収」では、各cDNAをその長さについて4つのタイプに、つまりタイプ1(<100bp);タイプ2(100〜200bp);タイプ3(>200bp);タイプ4(不明)に、割り当てる(図S32)。各タイプを特定するために、アルゴリズムにより高い感受性及び特異性を得た。200bpより短いcDNAのごく僅かなもののみが(0.58%)、200bpより長いと特定された。このエラーは、フォワード及びリバースリードのオーバーラップが少しあったためであり(通常は0〜5bps)、これは局所アライメントにより検出されなかった。
表8は、プロクラム特定及び実際のcDNA長の範囲の比較を示す。各タイプ(列1〜4)のプロクラム特定cDNAのカウントを、それらの実際のタイプ(行)と比較する。
プログラム特定の長さが200bpより短いとき(タイプ1とタイプ2)、正確な長さを計算できた。これらの場合には、シミュレートされたcDNAの長さに、プログラム特定の長さが多くは正確に合致した(図33A)。
次に、プログラムにより各cDNAのキメラ構成が特定され、それらを(RNA−HiC−ツールのステップ4の出力)を合成構成と比較した。「4.キメラcDNAの解析」のステップにおいて、リンカー配列の存在に基づいて、アルゴリズムによりcDNAを5つのカテゴリに割り当てた。アルゴリズムは、「RNA1−リンカー−RNA2」形態のcDNAに対して、99.89%感受性及び95.82%特異性に達した(表9)。
表9は、プログラム特定及び実際のcDNA構成の比較を示す。プログラム特定のcDNAのカウント(列)をその実際の構成(行)と比較する。
最後に、プログラムがRNA−RNA相互作用を特定及びシミュレートし、これらが比較された。シミュレーションされたデータセットは200,200のキメラRNAペア包含し、その中で131,571のRNAペアが検出された(感受性=65.72%、特異性=92.57%、図ST1−C)。各タイプのRNAの相互作用についての感受性及び特異性も個別に計算した(図33C)。関与するRNAタイプに関わらず、この方法は偽陽性をほとんど示さなかった(特異性≧90%)。トランスポゾンRNA又はsnRNAに関与しなかった相互作用は、それに関与するものよりも少ない偽陰性を示した。これは、トランスポゾンとsnRNAとの配列の反復的特性によるものであった。最悪のケースはLINE RNAに関与し、感受性が52%に下落した。トランスポゾンRNAに関与する相互作用の約半分がこの方法によって特定できなかったであろうということが控えめにも推測された。トランスポゾンRNAに関与しない相互作用の約2/3〜3/4が特定されたであろうと推測された。
[RAP−seqによる検証]
マウスES細胞におけるMalat1 RAP−シーケンシング実験を行った。架橋後に、5つのアンチセンスオリゴヌクレオチドを用いてMalat1プルダウンを行い、そしてMalat1と共に精製された他のRNAをシーケンシングした。対照として、アクチンRAP−シーケンシングを行った。Malat1 RNA自体は、アクチンRAP−seqよりも、Malat1 RAP−seqにおいて5.81倍の増加を示し、精製の妥当性を確認した。RNAのHi−Cにおいて、Tfrc、Slc2a3、Eif4a2、及び0610007P14RikRNAと相互作用する「ハブ」lincRNAとしてのMalat1が報告された。これらのRNAは、アクチンRAP−seqよりも、Malat1 RAP−seqにおいて、14.6(0610007P14Rik)、4.53(Slc2a3)、3.38(Eif4a2)、及び2.39(Tfrc)倍の増加を示した(最大カイ二乗検定、p値<0.0003)。これは、RNAのHi−C及びMalat1RAP−seqから、Malat1標的の大きなオーバーラップを示唆する。
他の検証として、Tfrc RAP−seq実験を行った。Tfrcは、RNAのHi−CからMalat1相互作用RNAとして特定された(図1D)。Tfrcプルダウンが逆にMalat1を特定可能かが検討された。TfrcRNA自体は、アクチンRAP−seqと比較してTfrc RAP−seqにおいて2.87倍の増加を示した。同じデータセットで、Malat1RNAは、Tfrc RAP−seqをアクチンRAP−seqと比較して、3.84倍の増加を示した(p値<2.2×10−16、帰無仮説倍率変化(fold−change)=1をテストして得られた)。
RNAのHi−Cによって特定されたようなTfrcと相互作用する他のRNAを確認し、またTfrc RAP−seqによって検証できた。RNAのHi−Cデータは、Tfrcと相互作用する全部で5つのRNAを特定した。Malat1以外で、その他の4つはすべてsnoRNA、つまりSnord13、SNORA3、Snord52、SNORA74であった。アクチンRAP−seqと比較されたTfrc RAP−seqにおいて、これら4つのsnoRNAのうちの3つが倍の増加を示し(Snord13について1.4倍、SNORA3について13.6倍、SNORA74について8.7倍)、これらの相互作用が確認された(カイ二乗検定、p値<0.00002)。まとめると、RAP−seqにおいて、ほぼすべてのRNAHi−C特定相互作用が確認された。2タイプの実験(RNAのHi−C及びRAP−seq)で、マウスES細胞において、(上述の)少数のRNA相互作用が「実体」として提示された。
[snoRNA−mRNA相互作用とmRNAシュードウリジンとの比較]
シュードウリジル化(pseudouridylation)シーケンシングデータ(Ψ−seq)をRNA相互作用部位と比較した。Schwartz等は、酵母及びマウスの骨髄由来樹状細胞(BMDDC)において、Ψ−seqを行った。BMDDCのΨ−seqデータを回収し(CMC処理GSM1464234及び対照GSM1464235)、文献に記載のバイオインフォマティク手法を用いて、シュードウリジン(Ψ−部位)と称した。簡潔に、正しい鎖と方向において「U」に隣接する5を超えるCMC処理リードを有し、3より大きいΨ−fc値を有するものとして、Ψ−部位を決定した。これにより、全部で8,194,131の「U」位置から386のΨ−部位がもたらされた(0.00471%の「U」がΨ−部位であった)。
次に、これらの386のΨ−部位を、RNAのHi−C特定RNA相互作用部位と比較した。Ψ−seq及びRNAHi−Cは異なる細胞型において行われるということが認められた。しかし、RNA相互作用部位内において、全部で551,634の「U」のうちで、93がΨ−部位であった(0.0109%)。ゆえに、RNAのHi−Cによって決定されたRNA相互作用部位は、Ψ−部位に富むものであった(オッズ比=4.4、カイ二乗検定p値=7.70×10−95)。
さらに、Ψ−部位が、RNAのHi−Cによって検出されたsnoRNA−mRNA相互作用に富むかが検討された。snoRNA関与相互作用部位内において、全部で136,535の「U」のうち、57のΨ−部位が存在した(0.0381%)。トランスクリプトーム全体と比較して、RNAのHi−Cにより検出されたsnoRNA関与相互作用部位は、非常にΨ−部位に富むものであった(オッズ比=10.2、カイ二乗検定p値<1×10−100)。snoRNAはRNAシュードウリジル化に寄与することで知られるが、これらのデータは、どのsnoRNAが具体的に原因となり得るかを示すものである(表10)。
表10は、Ψ−部位とRNA相互作用部位との関連性テストの2元分割表である。
RNA分子間の相互作用は主要な調節の役割を発揮し、アルゴノートタンパク質(ARGONAUTE、AGO)、PUM2、QKI、及びsnoRNPタンパク質(Meister,G.、Argonaute proteins:functional insights and emerging roles.Nat Rev Genet 14、447−459、doi:10.1038/nrg3462(2013年);Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP. Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年);Granneman,S.、Kudla,G.、Petfalski,E.&Tollervey,D.、Identification of protein binding sites on U3 snoRNA and pre−rRNA by UV cross−linking and high−throughput analysis of cDNAs.Proceedings of the National Academy of Sciences of the United States of America 106、9613−9618、doi:10.1073/pnas.0901997106(2009年)))などの、RNA結合タンパク質によってしばしば媒介される(Ray,D.等、A compendium of RNA−binding motifs for decoding gene regulation.Nature 499、172−177、doi:10.1038/nature12311(2013年))。PAR−CLIP4、HITS−CLIP6、及びCLASH7,8,などの近年の進展にも関わらず、すべてのタンパク質補助RNA−RNA相互作用をマッピングするには困難な課題が残る(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP.Cell 141、129−141、doi:10.1016/j.cell.2010.03.009 (2010年);Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps. Nature 460、479−486、doi:10.1038/nature08170(2009年);Helwak,A.、Kudla,G.、Dudnakova,T.&Tollervey,D.、Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell 153、654−665,doi:10.1016/j.cell.2013.03.043(2013年);Kudla,G.、Granneman,S.、Hahn,D.、Beggs,J.D.&Tollervey,D.、Cross−linking,ligation,and sequencing of hybrids reveals RNA−RNA interactions in yeast. Proc Natl Acad Sci U S A 108、10010−10015、doi:10.1073/pnas.1017386108(2011年))。これら3つの手法のそれぞれにおいて、実験ごとに、1つのRNA結合タンパク質により媒介される相互作用のみが解析可能である。HITS−CLIP及びPAR−CLIPは相互作用RNAペアを直接的にマッピングすることはできない。加えて、各実験には、タンパク質特異的抗体か(HITS−CLIP又はPAR−CLIP)、又は形質転換細胞株におけるタグ付きタンパク質の安定的な発現(CLASH)のいずれかが要求される。
以前の手法は、提案された相互作用の1又は複数の成分の異所性発現がしばしば必要とされるものである。そうした方法は、ルシフェラーゼレポーターアッセイを含み、合成RNAの使用が標的捕捉を再現する(Nicolas,F.E.、Experimental validation of microRNA targets using a luciferase reporter system. Methods in molecular biology 732、139−152、doi:10.1007/978−1−61779−083−6_11(2011年);Lal,A.等、Capture of microRNA−bound mRNAs identifies the tumor suppressor miR−34a as a regulator of growth factor signaling.PLoS Genet 7、e1002363、doi:10.1371/journal.pgen.1002363(2011年))。異所性発現が内在性発現レベルを再現することは稀であることから、これらの結果を、インビボの相互作用というより潜在的相互作用として理解することが賢明である。miRNAが多くのmRNAと「乱雑に」相互作用する傾向があるという前提は、主に異所性発現を用いたデータ由来であるということが言及される(Du,T.&Zamore,P.D.、Beginning to understand microRNA function.Cell Res 17、661−663、doi:10.1038/cr.2007.67(2007年))。
インビボでのタンパク質補助RNA−RNA相互作用を検出するために、RNAのHi−C法はもたらされた。この方法では、RNA分子がその結合タンパク質と架橋され、ビオチン化RNAリンカーにライゲーションされ、同じタンパク質によって共結合されたRNA分子が、RNA1−リンカー−RNA2形態のキメラRNAを形成する。これらのリンカー包含キメラRNAはストレプトアビジン被膜磁性ビーズを用いて単離され、ペアエンドシーケンシングを受ける(方法、図1A、図7)。このように、各非重複ペアエンドリードが分子相互作用を反映する。この技術の一部の設計態様は、染色体高次構造捕捉(chromosome conformation capture)法により着想を得たものである(Kalhor,R.、Tjong,H.、Jayathilaka,N.、Alber,F.&Chen,L.、Genome architectures revealed by tethered chromosome conformation capture and population−based modeling.Nature biotechnology 30、90−98、doi:10.1038/nbt.2057(2012年);Belton,J.M.等、Hi−C: a comprehensive technique to capture the conformation of genomes.Methods 58、268−276、doi:10.1016/j.ymeth.2012.05.001 (2012年))。
RNAのHi−C法には、RNA−RNA相互作用をマッピングするためのいくつかの有利性がある。第1に、RNAのHi−Cでは、架橋前に任意の外来的ヌクレオチド又はタンパク質コード遺伝子を導入することなく、内在的細胞特性が直接的に解析される。(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP. Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年);Helwak,A.、Kudla,G.、Dudnakova,T.&Tollervey,D.、Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell 153、654−665、doi:10.1016/j.cell.2013.03.043(2013年);Lal,A.等、Capture of microRNA−bound mRNAs identifies the tumor suppressor miR−34a as a regulator of growth factor signaling. PLoS Genet 7、e1002363、doi:10.1371/journal.pgen.1002363(2011年);Baigude,H.、Ahsanullah,Li,Z.、Zhou,Y.&Rana,T.M.、miR−TRAP:a benchtop chemical biology strategy to identify microRNA targets. Angew Chem Int Ed Engl 51、5880−5883、doi:10.1002/anie.201201512(2012年))。このため、RNA又はタンパク質発現レベルを変化させることで発生する偽相互作用をレポートするという不確実性が除かれる。さらに、RNAのHi−Cを組織サンプル解析によく適応させる。第2に、選択マーカーとしてビオチン化リンカーを使用することで、タンパク質特的抗体の必要性又はタグ付きタンパク質を発現する必要性が退けられる。このため、RNA−RNAインタラクトームの偏りのないマッピングが可能になる。文献に記載されるように、その他の方法は、一度に1つのRNA結合タンパク質を扱えるのみであり得る。第3として、同じ単一のタンパク質分子によってまとめられたRNAのみが捕捉され、同じタンパク質の異なるコピーに独立的に結合される独立RNA分子を捕捉することを避ける(前述の偽相互作用をもたらし得る)(Hafner,M.等、Transcriptome−wide identification of RNA−binding protein and microRNA target sites by PAR−CLIP. Cell 141、129−141、doi:10.1016/j.cell.2010.03.009(2010年);Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps. Nature 460、479−486、doi:10.1038/nature08170(2009年))。第4として、高希薄条件においてストレプトアビジンビーズにRNAライゲーションステップを行うことで、他の近接するRNAに無作為にライゲーションするRNAからもたらされる偽陽性が最小化される。第5として、RNAリンカーは、ライゲーション部位にわたるシーケンシングリードを表す明確な境界を与えることで、シーケンシングリードのマッピングにおける不明確さを退ける。第6として、PCR増幅前に、無作為の6つのヌクレオチドバーコードを各キメラRNAに付加し、続いて同一のバーコードを有する完全にオーバーラップするシーケンシングリードを1度のみ計数することで、潜在的PCR増幅バイアスが除かれる(Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps. Nature 460、479−486、doi:10.1038/nature08170(2009年);Loeb,G.B.等、Transcriptome−wide miR−155 binding map reveals widespread noncanonical microRNA targeting. Mol Cell 48、760−770、doi:10.1016/j.molcel.2012.10.002(2012年);Wang,Z.等、iCLIP predicts the dual splicing effects of TIA−RNA interactions. PLoS Biol 8、e1000530、doi:10.1371/journal.pbio.1000530(2010年);Konig,J.等、iCLIP reveals the function of hnRNP particles in splicing at individual nucleotide resolution. Nat Struct Mol Biol 17、909−915、doi:10.1038/nsmb.1838(2010年))。
例示の実施形態において、ES‐1及びES−2として示される、技術上僅かな違いのあるマウスの胚性幹(ES)細胞において、2つの独立的なRNAHi−Cアッセイが行われた(表5、図9〜12)。RNA非直接相互作用のライブラリが、「複数のタンパク質中間体を介して非直接的に結合したRNAを効率的に捕捉する」(ES−インダイレクト)2つの架橋剤(ホルムアルデヒド及びEGS)を用いて、生成された(Engreitz,J.M.等、RNA−RNA interactions enable specific targeting of non−coding RNAs to nascent Pre−mRNAs and chromatin sites、Cell 159、188−199、doi:10.1016/j.cell.2014.08.018(2014年);Nowak,D.E.、Tian,B.&Brasier,A.R.、Two−step cross−linking method for identification of NF−kappaB gene network by chromatin immunoprecipitation、Biotechniques 39、715−725(2005年);Zeng,P.Y.、Vakoc,C.R.、Chen,Z.C.、Blobel,G.A.&Berger,S.L、In vivo dual cross−linking for identification of indirect DNA−associated proteins by chromatin immunoprecipitation、BioTechniques 41、694−698(2006年);Zhao,J.等、Genome−wide identification of polycomb−associated RNAs by RIP−seq、Mol Cell 40、939−953、doi:10.1016/j.molcel.2010.12.011(2010年))。マウス胚性線維芽細胞(MEF)とマウスの脳とから、2つの他の固有ライブラリが生成され、バイオインフォマティクス品質評価のためにさらに2つのデータセットを提供した(図13)。各ライブラリは、所望の形態(RNA1−リンカー−RNA2)及び長さのRNA構築物を含むことが確認された(図1B)。各ライブラリは、平均で、4730万のペアエンドリードを産生するためにシーケンシングされ、その中で、約1510万の非重複ペアエンドリードが所望のキメラ形態を表した(図1C)。加えて、3つの対照実験が行われた。第1及び第2の対照実験は、それぞれ架橋ステップ(非架橋対照)、タンパク質のビオチン化ステップ(非ビオチン化対照)を排除した(RNAのHi−Cの対照実験)。第3の対照実験は、ショウジョウバエS2細胞とマウスES細胞をを用いてRNAの無作為ライゲーションの規模をテストした(異種対照)。架橋後、タンパク質のビオチン化及び近接ライゲーション前に2つの細胞株の溶解物を混合した。混合物に残りの実験手順を行い、配列ライブラリを得た(Fly−Mm)。2種にマッピングされたRNAペアの割合(偽陽性)は0.52%であった。しかしながら、ES−1配列ライブラリに同じインフォマティクス解析を行ったとき、0.55%のRNAペアが2種(マウス及びハエゲノム)にマッピングされ、実験的偽陽性(おそらく無作為ライゲーションのため)がインフォマティクス手法のエラー範囲より少ないということが示唆された(RNAのHi−Cの対照実験)。
表5はRNAのHi−Cサンプルを示す。「リードペア総数」とは各サンプルのペアエンド配列リード数である。「RNA1−リンカー−RNA2形態の非重複リードペア数」とは、バイオインフォマティクスパイプラインの、ステップ4.キメラcDNAの解析の出力のペアエンドリード数である。
RNAのHi−Cデータを解析し可視化するために、一連のバイオインフォマティクスツール(RNA−HiC−ツール)を作製した(図14〜15)。RNA−HiC−ツールは解析ステップを自動化し、該ステップは、PCR重複除去、複合的サンプル分離、リンカー配列特定、ジャンクションリード分離、相互作用RNAの判定、統計評価実行、RNA相互作用タイプのカテゴライズ、相互作用部位の判定、及びRNA構造の解析(方法)を含む。RNA内のRNA−RNAインタラクトームと近位部位とについて、可視化ツールが提供される(図16)。
RNAHi−Cライブラリの5つが比較された。(リンカーの左右側のリード断片について個別に算出された)FPKMの相関によると、ES−1及びES−2は最も類似するものであり、ES−インダイレクト、そしてMEF及び脳組織が後に続く(図13)。ES−1から特定された相互作用RNAペアとES−2から特定された相互作用RNAペアとは強固なオーバーラップを示した((p−値<10−35、並べ替え検定)(表6)。MEFにおいて特定された相関関係は、ESサンプルのいずれかのものと有意にオーバーラップしなかった(各オーバーラップについてp値=1、並べ替え検定)。例として、Trim25 RNAの3’UTRと核小体低分子RNA(snoRNA)のSnora1との相互作用は、ES−1及びES−2サンプルのそれぞれ24及び22のペアエンドリードによって裏付けられたが、ES−インダイレクト(2重架橋とUV架橋との違い)又はMEFライブラリでは検出されなかった(図1C)。Snora1を含め、172の数のsnoRNAが、AGO HITS−CLIPデータ(緑色のレーン、図1C)及び酵素処理された小型RNA(赤色のレーン、図1C、図17〜19)において検出され、mRNAと相互作用したとして特定された(Yu,P.等、Spatiotemporal clustering of the epigenome reveals rules of dynamic gene regulation、Genome res 23、352−364、doi:10.1101/gr.144949.112(2013年))。これは、snoRNA遺伝子からの転写物がmiRNA様小型RNAへと酵素処理され、RISC複合体においてmRNAと相互作用し得たという提示を裏付ける(Ender,C.等、A human snoRNA with microRNA−like functions、Mol Cell 32、519−528、doi:10.1016/j.molcel.2008.10.017(2008年);Brameier,M.、Herwig,A.、Reinhardt,R.、Walter,L.&Gruber,J.、Human box C/D snoRNAs with miRNA like functions: expanding the range of regulatory RNAs、Nucleic Acids Res 39、675−686、doi:10.1093/nar/gkq776(2011年))。(miRNA様相互作用を有する他のRNA)
表6は2つのゲノムにマッピングされたリードペアの分布を示す。この表に含まれないリードは、いずれのゲノムにもマッピングできないか、又は両ゲノムにマッピングされた同じRNA部分を有するかのいずれかであった。RNA部分はリンカー配列のいずれかの側のリード配列である。
ES−1及びES−2ライブラリは、ES細胞におけるRNAインタラクトームを推定するために統合された。このデータは、両断片が独自にゲノム(mm9)をマッピングする2つのRNA断片に明確に分離された454万の非重複ペアエンドリードを包含する。46,780のRNA間相互作用が特定された(FDR<0.05、ベンジャミン及びホッホバーグ補正を伴うフィッシャーの正確検定)(図20)。予期されたように、RNA発現レベル(FPKM)は、各RNAのRNAHi−Cリード数との相関が弱いが、FPKMは相互作用の統計的有意性(FDR)と相関しない(図20C〜図20D)。mRNA−snoRNA相互作用は最も豊富なタイプであったが、数千のmRNA−mRNA、及び数百のlincRNA−mRNA、偽遺伝子RNA−mRNA、miRNA−mRNAの相互作用も検出された(図21)。これはおそらく、任意の生体について記載される最初のRNA−RNAインタラクトームである。シミュレーションにより、実験及び分析手法全体について、約66%の感受性と93%の特異性が示唆された(RNAのHi−Cのシミュレーション分析)。
より大きな規模で相互作用を確認するために、RNAアンチセンスオリゴヌクレオチド精製シーケンシングを行った(RAP−seq)(Engreitz,J.M.等、RNA−RNA interactions enable specific targeting of noncoding RNAs to nascent Pre−mRNAs and chromatin sites. Cell 159、188−199、doi:10.1016/j.cell.2014.08.018(2014年))。まず、Malat1RAP−seqとActbRAP−seq(対照)とが行われて、Malat1に関与する相互作用をテストした(snoRNA−mRNA相互作用とmRNAシュードウリジンとの比較)。Malat1RNA自体は、ActbRAP−seqよりもMalat1RAP−seqにおいて5.81倍の増加を示し、精製の妥当性を確認した。RNAのHi−Cが示すMalat1相互作用RNAは(図1D)、ActbRAP−seqよりも、Malat1 RAP−seqにおいて、14.6(0610007P14Rik)、4.53(Slc2a3)、3.38(Eif4a2)、及び2.39(Tfrc)倍の増加を示した(p値<0.0003、カイ二乗検定)。これは、RNAのHi−C及びMalat1RAP−seqにおける、Malat1標的の大きなオーバーラップを示唆する。次に、TfrcRAP−seqによって、TfrcRAPが逆にMalat1を特定し得るかが検討された(snoRNA−mRNA相互作用とmRNAシュードウリジンとの比較)。TfrcRNA自体は、ActbRAP−seqと比較してTfrcRAP−seqにおいて2.87倍の増加を示した。Malat1は3.84倍の増加を示した(p値<2.2×10−16、帰無仮説倍率変化(fold−change)=1をテストして得られた)。さらに、RNAのHi−Cによって特定された他の4つのTfrc相互作用RNAのうちの3つが、1.4〜13.6倍の増加を示した(p値<0.00002、カイ二乗検定)。合わせて、RAP−seqによって、追加の7つのRNAHi−C特定相互作用が確認された。
RNA−RNA相互作用は「驚くほど乱雑な」ものとして報告されている(Du,T.&Zamore,P.D.、Beginning to understand microRNA function. Cell Res 17、661−663、doi:10.1038/cr.2007.67(2007年))。1つの細胞型において、各miRNAは300〜1000のmRNAと相互作用することが示唆され、類似する事項がlincRNAについて提示された(Chi,S.W.、Zang,J.B.、Mele,A.&Darnell,R.B.、Argonaute HITS−CLIP decodes microRNA−mRNA interaction maps. Nature 460、479−486、doi:10.1038/nature08170 (2009年);Guttman,M.等、Chromatin signature reveals over a thousand highly conserved large non−coding RNAs in mammals. Nature 458、223−227、doi:10.1038/nature07672(2009年))。しかしながら、観察されたRNA−RNAインタラクトーム(46,780の相互作用)は、べき法則を満たす次数分布を伴う、スケールフリーなネットワークである(図1D、図34)(Barabasi,A.L.&Oltvai,Z.N.、Network biology:understanding the cell‘s functional organization. Nat Rev Genet 5、101−113、doi:10.1038/nrg1272(2004年))。換言すると、RNA−RNA相互作用において関与したRNAの大部分は、具体的な相互作用パートナーを有し、所定数の相互作用パートナーを有するRNAの数は、相互作用パートナーの数が増加すると指数関数的に減少する。この全体的な特性は、相互作用がmRNA、lincRNA、miRNA、偽遺伝子RNA、及びandアンチセンス転写のみに制限されても変わらない(図1D)。さらに、マウスの脳由来のRNA−RNAインタラクトーム(57,833の相互作用)はスケールフリーであり(図34B)、この全体的な特性が細胞型特異的ではないことを示唆する。各細胞型において、大半のmiRNA及びlincRNAは1〜3のmRNAと相互作用し、その80%を超えるものが1つのmRNAと特異的に相互作用した(図1E)。つまり、「乱雑な」RNAは、RNAのHi−C由来のRNA−RNAインタラクトームにおいて例外である。これは、以前の方法とは異なり、RNAのHi−Cが、内在性細胞条件において各個々のタンパク質分子に共接着されたRNA分子を直接的に捕捉したためであるということが推測される。
相互作用RNAの大部分は(83.05%)、オーバーラップするRNAHi−Cリードを示し(図3A)、相互作用はRNAの特定のセグメントにしばしば集中するということが示唆される。オーバーラップリード断片の「ピーク」を特定し、と「相互作用部位」と呼称した(図3B)。相互作用部位は、miRNA(成熟miRNA全体)、mRNA、lincRNAだけでなく、偽遺伝子及びトランスポゾンRNAにも現れた(図3C)。2000を超える相互作用部位が、L1、SINE、ERVK、MaLR、及びERV1トランスポゾンRNAにあり(表7)、その他のRNAとの頻繁な相互作用が示唆される(Shalgi,R.、Pilpel,Y.&Oren,M.、Repression of transposable−elements−a microRNA anti−cancer defense mechanism? Trends in genetics:TIG 26、253−259、doi:10.1016/j.tig.2010.03.006(2010年);Yuan,Z.、Sun,X.、Liu,H.&Xie,J.、MicroRNA genes derived from repetitive elements and expanded by segmental duplication events in mammalian genomes、PloS one 6、e17666、doi:10.1371/journal.pone.0017666(2011年))。さらに、シュードウリジンは、snoRNA−mRNA相互作用のmRNA相互作用部位において濃縮され、一部のRNAセグメントが所定のタイプのRNA相互作用に有利に働くという考えを確かにする(Schwartz,S.等、Transcriptome−wide mapping reveals widespread dynamic−regulated pseudouridylation of ncRNA and mRNA. Cell 159、148−162、doi:10.1016/j.cell.2014.08.028(2014年))。
表7は、種々のタイプの遺伝子及びトランスポゾンにおける相互作用部位の分布を示す。Novelは未アノテーション遺伝子領域を示す。
異なるタイプのRNA−RNA相互作用により塩基の相補性が用いられるかが問われた。相互作用RNAペアのハイブリダイゼーションエネルギーは、ライケーションされた断片(RNA1、RNA2)のペアの平均ハイブリダイゼーションエネルギーによって推定され、塩基の無作為シャッフルによって生成された対照RNAのハイブリダイゼーションエネルギーと比較された(Ray,D.等、A compendium of RNA−binding motifs for decoding gene regulation、Nature 499、172−177、doi:10.1038/nature12311(2013年);Bellaousov,S.、Reuter,J.S.、Seetin,M.G.&Mathews,D.H.、RNAstructure:web servers for RNA secondary structure prediction and analysis、Nucleic Acids Research 41、W471−W474、doi:Doi 10.1093/Nar/Gkt290(2013年))。相補性塩基は、ほぼすべてのタイプのRNA−RNA相互作用において好ましいものであり、トランスポゾンRNA−mRNA、mRNA−mRNA、偽遺伝子RNA−mRNA、lincRNA−mRNA、miRNA−mRNA相互作用において最も見受けられる(p値<2.4−18)が、LTR−偽遺伝子RNA相互作用では観察されなかった(図3D、図24)。このデータは、塩基対形成が、長鎖RNAにおける配列特異的転写後調節を促すという新しいメカニズムを示唆するものである。
これらのRNA−RNA相互作用が配列特異的である場合、RNA相互作用部位は選択圧力下にあるはずである(Gong,C.&Maquat,L.E.、lncRNAs transactivate STAU1−mediated mRNA decay by duplexing with 3’ UTRs via Alu elements、Nature 470、284−288、doi:10.1038/nature09701(2011年))。種間保存レベルは相互作用部位において大きく増加し、保存のピークは、2つのRNA断片の接合部を正確に指し示すということが分かった(図3D)(Cooper,G.M.等、Distribution and intensity of constraint in mammalian genomic sequence. Genome res 15、901−913、doi:10.1101/gr.3577405(2005年))。lincRNA、偽遺伝子RNA、トランスポゾンRNA、又は他のmRNAと相互作用するとき、mRNAの相互作用部位は、転写物の残余部分よりも保存された(図25)。lincRNA及び偽遺伝子RNAの相互作用部位では、lincRNAs−mRNA、偽遺伝子RNA−mRNA、及び偽遺伝子RNA−トランスポゾンRNA相互作用において、大きく保存された(図25)。相互作用部位における保存の増大は、エクソン−イントロン境界によるものではなかった(図26)。考え合わせると、長鎖RNAの相互作用において、塩基の相補性が広まる。相補領域は進化的に保存される。
RNAのHi−C設計は、本質的に、分子間相互作用をマッピングするためのものであるが、RNAのHi−CがRNAの2次構造及び3次構造を明らかにすることが分かった。上述のすべての分析は、分子間リードに基づく。分子内リードを見ることで、RNA構造の2つの特徴が理解された。まず、RNaseI消化部位の密度によって、RNAの1本鎖領域のフットプリントが特定された(RNaseI消化はライゲーション前に行われた。図1Aのステップ2、図27参照)。次に、各RNAの空間的近位部位を近接ライゲーションによって捕捉した(図1Aのステップ5)。全部で67,221のリードペアが個別の遺伝子にマッピングされたが、互いに2,000bp内又は同じ鎖上でマッピングされず、ゆえに分子内切断及びライゲーションから生成されたものである(図28)。切断及びライゲーション配列のそれぞれは、配列リードにおけるRNA1及びRNA2の配向とゲノムにおけるその配向とを比較することで、2つの構造分類の1つに明らかに割り当てられることができる(図4A)。これらのリードは、1,696の既知の遺伝子と678の新規の遺伝子からのものを含む、2,374のRNAに空間的近接情報を与えた。例として、277の切断及びライゲーション配列が、Snora73転写物から作製された(図4B)。RNaseI消化部位の密度(図4C)により、RNAの1本鎖領域が強く予測された(ヒートマップ、図4E)。6つの近位部位ペアが検出された(図4Dの丸)。各ペアは、オーバーラップライゲーション位置を有する3つ以上の切断及びライゲーション配列によってサポートされた(図4Bの黒い箇所)。6つの近位部位ペアのうち5つは、通常許容される2次構造において物理的に近接した(図4Eの同色矢印)。Snora14では、シーケンシングされた推定2次構造によると、推定近位部位のペアは離れているようであった(図29)。しかしながら、リボ核タンパク質DYSKERINは、インビボにおいてSnora14転写物を曲げ、切断及びライゲーション配列によって予測されたように、2つのシュードウリジル化(pseudouridylation)ループを互いに近づける(図4Fの矢印)(Kiss,T.、Fayet−Lebaron,E.&Jady,B.E.、Box H/ACA small ribonucleoproteins、Mol cell 37、597−606、doi:10.1016/j.molcel.2010.01.032(2010年))。構造情報も、mRNAの新しい転写物及び一部分において得られ得る(図30〜図31)。現在のところ、任意の個々のRNAの空間的近位塩基の決定は大きな課題としてある。ES細胞におけるRNAのHi−Cは、数千のRNAについて分子内空間的近位情報を提供する。さらに、あらゆるRNAの1本鎖フットプリントが共にマッピングされる。このように、RNAのHi−Cにより、RNA構造調査範囲が大きく広がった。
RNA相互作用のマッピングに重要であるのは選択である。RNAのHi−Cにおいて選択可能なリンカーを導入することで、相互作用RNAの偏りのない選択が可能になり、RNA−RNAインタラクトームの全体的なマッピングを可能にする。ES細胞におけるRNA毎の相互作用パートナーの数は非常に不均衡であり、スケールフリーなRNAネットワークをもたらす。長鎖RNA間の相互作用では、転写物の小片がしばしば用いられた。タンパク質相互作用ドメインとの類似について、RNA相互作用部位の概念が示された。RNA相互作用部位では、長鎖RNA相互作用を促すために塩基対が用いられ、新しいタイプのトランス調節配列が提示される。これらのトランス調節配列は転写物の他の部分よりも進化的に保存される。RNA構造はRNAのHi−Cによってもマッピングされ得る。本明細書において、RNAがタンパク質によって曲げられ、そうした3次構造がRNAHi−Cの分子内リードによって明らかにされた実施例が示される。この方法とデータにより、RNAの機能と調節との役割調査が今後は非常に容易になるはずである。
ソフトウエアの利用
RNAのHi−Cツールソフトウエアは、http://systemsbio.ucsd.edu/RNA-Hi-Cにおいて利用可能である。
上述されたことにより、本開示の種々の実施形態が例示を目的として本明細書に記載されたものであり、且つ本開示の範囲と趣旨とから離れることなく種々の変形が行われ得るということが理解され得る。従って、本明細書に記載の種々の実施形態は、以下の請求項によって示される真の範囲と趣旨とを限定することを意図しない。
[追加的実施形態]
一部の実施形態において、キメラRNAを生成する方法は細胞において相互作用するRNAを含み、該方法は、RNAをタンパク質に架橋することと、同じタンパク質分子に共に架橋されたRNAをライゲーションしてキメラRNAを形成することとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、タンパク質は少なくとも1つのシステインにおいてビオチン化される。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤とライゲーションすることをさらに含む。一部の実施形態において、RNAはビオチンタグ付きRNAリンカーとライゲーションされる。一部の実施形態において、ビオチンタグ付きRNAリンカーは2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、若しくは30ヌクレオチド長、又は任意の前述の値の間の任意の長さである。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法は、キメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。一部の実施形態において、該方法は、DNA混入を排除するためのDNAse処理をさらに含む。一部の実施形態において、キメラRNAの断片化は、RNAの部分的消化を促す条件下で、キメラRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法は、キメラRNAを逆転写してキメラcDNAを生成することをさらに含む。一部の実施形態において、該方法は、キメラRNA又はキメラcDNAにおけるRNAのそれぞれに由来する、キメラRNA又はキメラcDNAの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラRNAに存在するRNAを特定することで、細胞において相互作用するRNAを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するRNAが特定される。一部の実施形態において、細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される。一部の実施形態において、細胞において相互作用するRNAの特定は、自動シーケンシング装置を用いて、キメラRNAに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するRNAの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、RNAクラスタの直接相互作用を特定することをさらに含む。
一部の実施形態において、単離複合体が提供される。該単離複合体は、タンパク質に架橋されたキメラRNAを含み得、該キメラRNAは、細胞において相互作用するRNAを含む。また単離複合体は、タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む複合体をも含み得、該核酸はRNAである。一部の実施形態において、単離複合体は、タンパク質及び核酸、中間タンパク質及び核酸、又はタンパク質複合体及び核酸を含む、複合体を含み、該核酸はRNAである。
一部の実施形態において、候補治療剤を特定するための方法が提供され、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するRNAを特定することと、RNAの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がRNAの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するRNAを特定する方法は、RNAをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成することとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチン含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。一部の実施形態において、キメラRNAの断片化は、RNAの部分的消化を促す条件下で、キメラRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法はキメラRNAを逆転写してキメラcDNAを生成することをさらに含む。一部の実施形態において、該方法は、キメラRNA又はキメラcDNAにおけるRNAのそれぞれに由来する、キメラRNA又はキメラcDNAの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラRNAに存在するRNAを特定することで、細胞において相互作用するRNAを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するRNAが特定される。一部の実施形態において、細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される。一部の実施形態において、細胞において相互作用するRNAの特定は、自動シーケンシング装置を用いて、キメラRNAに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するRNAの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、RNAクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。
一部の実施形態において、医薬作製方法が提供され、該方法は本明細書に記載のいずれかの実施形態の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化することを含む。一部の実施形態において、特定された薬剤の製剤化は候補治療剤を特定するための方法によっておこなわれ、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するRNAを特定することと、RNAの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がRNAの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するRNAを特定するための方法は、RNAをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成することとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。一部の実施形態において、キメラRNAの断片化は、RNAの部分的消化を促す条件下で、キメラRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法はキメラRNAを逆転写してキメラcDNAを生成することをさらに含む。一部の実施形態において、該方法は、キメラRNA又はキメラcDNAにおけるRNAのそれぞれに由来する、キメラRNA又はキメラcDNAの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラRNAに存在するRNAを特定することで、細胞において相互作用するRNAを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するRNAが特定される。一部の実施形態において、細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される。一部の実施形態において、細胞において相互作用するRNAの特定は、自動シーケンシング装置を用いて、キメラRNAに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するRNAの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、RNAクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。
一部の実施形態において、医薬が提供され、該医薬は本明細書に記載のいずれかの実施形態の方法を用いて作製される。一部の実施形態において、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化することを含む。一部の実施形態において、特定された薬剤を製剤化することは、候補治療剤を特定するための方法によって行われ、該方法は、本明細書に記載のいずれかの実施形態の方法を用いて、細胞において相互作用するRNAを特定することと、RNAの相互作用を低減又は増大する薬剤の能力を評価することとを含み、薬剤がRNAの相互作用を低減又は増大することができる場合に薬剤は候補治療剤である。一部の実施形態において、細胞において相互作用するRNA特定する方法は、RNAをタンパク質に架橋することと、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成することとを含む。一部の実施形態において、RNAをタンパク質に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質の表面への固定化を促す薬剤に、タンパク質を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、同じタンパク質分子に架橋されたRNAをRNAseに接触させることを含む。一部の実施形態において、該方法は、同じタンパク質分子に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。一部の実施形態において、キメラRNAの断片化は、RNAの部分的消化を促す条件下で、キメラRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法はキメラRNAを逆転写してキメラcDNAを生成することをさらに含む。一部の実施形態において、該方法は、キメラRNA又はキメラcDNAにおけるRNAのそれぞれに由来する、キメラRNA又はキメラcDNAの配列の少なくとも一部分を決定することをさらに含む。一部の実施形態において、該方法は、キメラRNAに存在するRNAを特定することで、細胞において相互作用するRNAを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するRNAが特定される。一部の実施形態において、細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される。一部の実施形態において、細胞において相互作用するRNAの特定は、自動シーケンシング装置を用いて、キメラRNAに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するRNAの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、RNAクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、薬剤は核酸を含む。一部の実施形態において、薬剤は化合物を含む。
一部の実施形態において、細胞において相互作用するRNAを含むキメラRNAを生成するための方法が提供され、該方法は、RNAをタンパク質中間体及び/又はタンパク質複合体に架橋することと、共にタンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成することとを含み、該タンパク質複合体は、2つ以上の相互作用タンパク質を含む。一部の実施形態において、RNAをタンパク質中間体及び/又はタンパク質複合体に架橋することは無傷細胞又は細胞溶解物において行われる。一部の実施形態において、架橋はUV架橋を含む。一部の実施形態において、該方法は、タンパク質中間体及び/又はタンパク質複合体の表面への固定化を促す薬剤に、タンパク質中間体及び/又はタンパク質複合体を会合することをさらに含む。一部の実施形態において、固定化を促す薬剤はビオチンを含む。一部の実施形態において、該方法は、少なくとも1つのタンパク質分子に架橋されたRNAを断片化することをさらに含む。一部の実施形態において、断片化は、RNAの部分的消化を促す条件下で、タンパク質中間体及び/又はタンパク質複合体に架橋されたRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法は、タンパク質中間体及び/又はタンパク質複合体に架橋されたRNAを、RNAを回収しやすくする薬剤に結合することをさらに含む。一部の実施形態において、結合は、RNAの末端を薬剤にライゲーションすることをさらに含む。一部の実施形態において、RNAを回収しやすくする薬剤は核酸を含む。一部の実施形態において、核酸はビオチンを有する核酸を含む。一部の実施形態において、ビオチンを有する核酸をRNAの末端に結合することは、共にタンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成する前に、ビオチンを有する核酸を、RNAの5’末端にライゲーションすることを含む。一部の実施形態において、該方法は、ビオチンを、キメラRNAの5’領域から取り除くことをさらに含む。一部の実施形態において、該方法はキメラRNAを回収することをさらに含む。一部の実施形態において、該方法は、キメラRNAを断片化することをさらに含む。一部の実施形態において、キメラRNAの断片化は、RNAの部分的消化を促す条件下で、キメラRNAを、RNAseに接触させることを含む。一部の実施形態において、該方法はキメラRNAを逆転写してキメラcDNAを生成することをさらに含む。一部の実施形態において、該方法は、キメラRNAに存在するRNAを特定することで、細胞において相互作用するRNAを特定することをさらに含む。一部の実施形態において、細胞における、少なくとも100、少なくとも500、少なくとも1000、又は1000を超える、RNA−RNA相互作用が特定される。一部の実施形態において、実質的にすべての、細胞において相互作用するRNAが特定される。一部の実施形態において、細胞における、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される。一部の実施形態において、細胞において相互作用するRNAの特定は、自動シーケンシング装置を用いて、キメラRNAに配列リードを行うことを含む。一部の実施形態において、細胞において相互作用するRNAの特定は、すべての配列リードからキメラ配列を特定することを含む。一部の実施形態において、該方法は、キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換することをさらに含む。一部の実施形態において、該方法は、コンピュータで行われる統計テストを用いて、RNAクラスタの直接相互作用を特定することをさらに含む。一部の実施形態において、細胞において相互作用するRNAは、タンパク質中間体又はタンパク質複合体において異なるタンパク質に架橋される。
一部の実施形態において、タンパク質中間体又はタンパク質複合体に架橋されたキメラRNAを含む単離複合体が提供され、キメラRNAは細胞において相互作用するRNAを含み、タンパク質複合体は2つ以上の相互作用タンパク質を含む。一部の実施形態において、キメラRNAは、前記タンパク質中間体又はタンパク質複合体において異なるタンパク質に架橋されるRNAを含む。
本明細書に記載されるそれぞれの参考文献はその全体が言及によって本明細書に組み込まれる。
[参考文献]
1. Engreitz,J. M. et al. RNA-RNA interactions enable specific targeting of noncoding RNAsto nascent Pre-mRNAs and chromatin sites. Cell 159, 188-199,doi:10.1016/j.cell.2014.08.018 (2014).
2. Ray, D.et al. A compendium of RNA-binding motifs for decoding gene regulation. Nature499, 172-177, doi:10.1038/nature12311 (2013).
3. Meister,G. Argonaute proteins: functional insights and emerging roles. Nat Rev Genet14, 447-459, doi:10.1038/nrg3462 (2013).
4. Hafner,M. et al. Transcriptome-wide identification of RNA-binding protein and microRNAtarget sites by PAR-CLIP. Cell 141, 129-141, doi:10.1016/j.cell.2010.03.009(2010).
5. Granneman,S., Kudla, G., Petfalski, E. & Tollervey, D. Identification of proteinbinding sites on U3 snoRNA and pre-rRNA by UV cross-linking and high-throughputanalysis of cDNAs. Proceedings of the National Academy of Sciences of theUnited States of America 106, 9613-9618, doi:10.1073/pnas.0901997106 (2009).
6. Chi, S.W., Zang, J. B., Mele, A. & Darnell, R. B. Argonaute HITS-CLIP decodesmicroRNA-mRNA interaction maps. Nature 460, 479-486, doi:10.1038/nature08170(2009).
7. Helwak,A., Kudla, G., Dudnakova, T. & Tollervey, D. Mapping the human miRNAinteractome by CLASH reveals frequent noncanonical binding. Cell 153, 654-665,doi:10.1016/j.cell.2013.03.043 (2013).
8. Kudla,G., Granneman, S., Hahn, D., Beggs, J. D. & Tollervey, D. Cross-linking,ligation, and sequencing of hybrids reveals RNA-RNA interactions in yeast. ProcNatl Acad Sci U S A 108, 10010-10015, doi:10.1073/pnas.1017386108 (2011).
9. Nicolas,F. E. Experimental validation of microRNA targets using a luciferase reportersystem. Methods in molecular biology 732, 139-152,doi:10.1007/978-1-61779-083-6_11 (2011).
10. Lal, A.et al. Capture of microRNA-bound mRNAs identifies the tumor suppressor miR-34aas a regulator of growth factor signaling. PLoS Genet 7, e1002363,doi:10.1371/journal.pgen.1002363 (2011).
11. Du, T.& Zamore, P. D. Beginning to understand microRNA function. Cell Res 17,661-663, doi:10.1038/cr.2007.67 (2007).
12. Kalhor,R., Tjong, H., Jayathilaka, N., Alber, F. & Chen, L. Genome architecturesrevealed by tethered chromosome conformation capture and population-basedmodeling. Nature biotechnology 30, 90-98, doi:10.1038/nbt.2057 (2012).
13. Belton,J. M. et al. Hi-C: a comprehensive technique to capture the conformation ofgenomes. Methods 58, 268-276, doi:10.1016/j.ymeth.2012.05.001 (2012).
14. Baigude,H., Ahsanullah, Li, Z., Zhou, Y. & Rana, T. M. miR-TRAP: a benchtopchemical biology strategy to identify microRNA targets. Angew Chem Int Ed Engl51, 5880-5883, doi:10.1002/anie.201201512 (2012).
15. Loeb, G.B. et al. Transcriptome-wide miR-155 binding map reveals widespreadnoncanonical microRNA targeting. Mol Cell 48, 760-770,doi:10.1016/j.molcel.2012.10.002 (2012).
16. Wang, Z.et al. iCLIP predicts the dual splicing effects of TIA-RNA interactions. PLoSBiol 8, e1000530, doi:10.1371/journal.pbio.1000530 (2010).
17. Konig,J. et al. iCLIP reveals the function of hnRNP particles in splicing atindividual nucleotide resolution. Nat Struct Mol Biol 17, 909-915,doi:10.1038/nsmb.1838 (2010).
18. Nowak,D. E., Tian, B. & Brasier, A. R. Two-step cross-linking method foridentification of NF-kappaB gene network by chromatin immunoprecipitation.Biotechniques 39, 715-725 (2005).
19. Zeng, P.Y., Vakoc, C. R., Chen, Z. C., Blobel, G. A. & Berger, S. L. In vivo dualcross-linking for identification of indirect DNA-associated proteins bychromatin immunoprecipitation. BioTechniques 41, 694-698 (2006).
20. Zhao, J.et al. Genome-wide identification of polycomb-associated RNAs by RIP-seq. MolCell 40, 939-953, doi:10.1016/j.molcel.2010.12.011 (2010).
21. Yu, P.et al. Spatiotemporal clustering of the epigenome reveals rules of dynamic generegulation. Genome Res 23, 352-364, doi:10.1101/gr.144949.112 (2013).
22. Ender,C. et al. A human snoRNA with microRNA-like functions. Mol Cell 32, 519-528,doi:10.1016/j.molcel.2008.10.017 (2008).
23. Brameier,M., Herwig, A., Reinhardt, R., Walter, L. & Gruber, J. Human box C/DsnoRNAs with miRNA like functions: expanding the range of 調節RNAs. Nucleic Acids Res 39, 675-686, doi:10.1093/nar/gkq776 (2011).
24. Guttman,M. et al. Chromatin signature reveals over a thousand highly conserved largenon-coding RNAs in mammals. Nature 458, 223-227, doi:10.1038/nature07672(2009).
25. Barabasi,A. L. & Oltvai, Z. N. Network biology: understanding the cell's functionalorganization. Nat Rev Genet 5, 101-113, doi:10.1038/nrg1272 (2004).
26. Shalgi,R., Pilpel, Y. & Oren, M. Repression of transposable-elements - a microRNAanti-cancer defense mechanism? Trends in genetics : TIG 26, 253-259,doi:10.1016/j.tig.2010.03.006 (2010).
27. Yuan,Z., Sun, X., Liu, H. & Xie, J. MicroRNA genes derived from repetitiveelements and expanded by segmental duplication events in mammalian genomes.PloS one 6, e17666, doi:10.1371/journal.pone.0017666 (2011).
28. Schwartz,S. et al. Transcriptome-wide mapping reveals widespread dynamic-regulatedpseudouridylation of ncRNA and mRNA. Cell 159, 148-162,doi:10.1016/j.cell.2014.08.028 (2014).
29. Bellaousov,S., Reuter, J. S., Seetin, M. G. & Mathews, D. H. RNAstructure: web serversfor RNA secondary structure prediction and analysis. Nucleic Acids Research 41,W471-W474, doi:Doi 10.1093/Nar/Gkt290 (2013).
30. Gong, C.& Maquat, L. E. lncRNAs transactivate STAU1-mediated mRNA decay byduplexing with 3' UTRs via Alu elements. Nature 470, 284-288,doi:10.1038/nature09701 (2011).
31. Cooper,G. M. et al. Distribution and intensity of constraint in mammalian genomicsequence. Genome Res 15, 901-913, doi:10.1101/gr.3577405 (2005).
32. Kiss,T., Fayet-Lebaron, E. & Jady, B. E. Box H/ACA small ribonucleoproteins. MolCell 37, 597-606, doi:10.1016/j.molcel.2010.01.032 (2010).

Claims (61)

  1. 細胞において相互作用するRNAを含むキメラRNAを生成する方法であって、
    RNAをタンパク質に架橋するステップと、
    共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含む、方法。
  2. 前記RNAをタンパク質に架橋するステップは無傷細胞又は細胞溶解物において行われる、請求項1に記載の方法。
  3. 前記架橋はUV架橋を含む、請求項1又は2に記載の方法。
  4. 前記タンパク質を表面に固定化しやすくする薬剤に、前記タンパク質を会合するステップをさらに含む、請求項1〜3のいずれか1項に記載の方法。
  5. 前記固定化しやすくする薬剤はビオチンを含む、請求項4に記載の方法。
  6. 前記同じタンパク質分子に架橋された前記RNAを断片化するステップをさらに含む、請求項1〜5のいずれか1項に記載の方法。
  7. 前記断片化は、前記RNAの部分的消化を促す条件下で、前記同じタンパク質分子に架橋された前記RNAを、RNAseに接触させるステップを含む、請求項6に記載の方法。
  8. 前記同じタンパク質分子に架橋された前記RNAを、前記RNAを回収しやすくする薬剤に結合するステップをさらに含む、請求項1〜7のいずれか1項に記載の方法。
  9. 前記結合は、前記RNAの末端を前記薬剤にライゲーションすることを含む、請求項8に記載の方法。
  10. 前記RNAを回収しやすくする前記薬剤は核酸を含む、請求項9に記載の方法。
  11. 前記核酸はビオチンを有する核酸を含む、請求項10に記載の方法。
  12. 前記ビオチンを有する核酸を前記RNAの前記末端に結合することは、前記共に同じタンパク質分子に架橋されたRNAをライゲーションしてキメラRNAを形成するステップの前に、前記ビオチンを有する核酸を、前記RNAの5’末端にライゲーションすることを含む、請求項11に記載の方法。
  13. 前記ビオチンを、前記キメラRNAの5’領域から取り除くステップをさらに含む、請求項12に記載の方法。
  14. 前記キメラRNAを回収するステップをさらに含む、請求項1〜13のいずれか1項に記載の方法。
  15. 前記キメラRNAを断片化するステップをさらに含む、請求項1〜14のいずれか1項に記載の方法。
  16. 前記キメラRNAの前記断片化は、前記RNAの部分的消化を促す条件下で、前記キメラRNAを、RNAseに接触させることを含む、請求項1〜15のいずれか1項に記載の方法。
  17. 前記キメラRNAを逆転写してキメラcDNAを生成するステップをさらに含む、請求項1〜16のいずれか1項に記載の方法。
  18. 前記キメラRNA又は前記キメラcDNAにおける前記RNAのそれぞれに由来する、前記キメラRNA又は前記キメラcDNAの配列の少なくとも一部分を決定するステップをさらに含む、請求項1〜17のいずれか1項に記載の方法。
  19. 前記キメラRNAに存在する前記RNAを特定することで、細胞において相互作用するRNAを特定するステップをさらに含む、請求項1〜17のいずれか1項に記載の方法。
  20. 前記細胞において、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される、請求項19に記載の方法。
  21. 実質的にすべての、前記細胞において相互作用するRNAが特定される、請求項19に記載の方法。
  22. 前記細胞において、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される、請求項21に記載の方法。
  23. 前記細胞において相互作用するRNAの前記特定は、自動シーケンシング装置を用いて、前記キメラRNAに配列リードを行うステップを含む、請求項19〜22のいずれか1項に記載の方法。
  24. 前記細胞において相互作用するRNAの前記特定は、すべての前記配列リードからキメラ配列を特定するステップを含む、請求項23に記載の方法。
  25. 前記キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換するステップをさらに含む、請求項19〜24のいずれか1項に記載の方法。
  26. 前記RNAクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、請求項25に記載の方法。
  27. タンパク質に架橋されたキメラRNAを含む単離複合体であって、前記キメラRNAは細胞において相互作用するRNAを含む、単離複合体。
  28. 候補治療剤を特定するための方法であって、
    請求項1〜26のいずれか1項に記載の方法を用いて、細胞において相互作用するRNAを特定するステップと、
    前記RNAの前記相互作用を低減又は増大する薬剤の能力を評価するステップと、を含み、
    前記薬剤が前記RNAの前記相互作用を低減又は増大することができる場合に前記薬剤は候補治療剤である、方法。
  29. 前記薬剤は核酸を含む、請求項28に記載の方法。
  30. 前記薬剤は化合物を含む、請求項28に記載の方法。
  31. 医薬作製方法であって、請求項28〜30のいずれか1項に記載の方法を用いて特定された薬剤を、薬学的に許容される担体において製剤化するステップを含む、方法。
  32. 請求項31に記載の方法を用いて作製された医薬。
  33. 細胞において相互作用するRNAを含むキメラRNAを生成するための方法であって、
    RNAをタンパク質中間体及び/又はタンパク質複合体に架橋するステップと、
    共にタンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成するステップとを含み、
    前記タンパク質複合体は2つ以上の相互作用タンパク質を含む、方法。
  34. 前記RNAをタンパク質中間体及び/又はタンパク質複合体に架橋するステップは無傷細胞又は細胞溶解物において行われる、請求項33に記載の方法。
  35. 前記架橋はUV架橋を含む、請求項33又は34に記載の方法。
  36. 前記タンパク質中間体及び/又はタンパク質複合体を、前記タンパク質中間体及び/又はタンパク質複合体を表面に固定化しやすくする薬剤に会合するステップをさらに含む、請求項33〜35のいずれか1項に記載の方法。
  37. 前記固定化しやすくする薬剤はビオチンを含む、請求項36に記載の方法。
  38. 少なくとも1つのタンパク質分子に架橋された前記RNAを断片化するステップをさらに含む、請求項33〜37のいずれか1項に記載の方法。
  39. 前記断片化は、前記RNAの部分的消化を促す条件下で、前記タンパク質中間体及び/又はタンパク質複合体に架橋された前記RNAを、RNAseに接触させることを含む、請求項38に記載の方法。
  40. 前記タンパク質中間体及び/又はタンパク質複合体に架橋された前記RNAを、前記RNAを回収しやすくする薬剤に結合するステップをさらに含む、請求項33〜39のいずれか1項に記載の方法。
  41. 前記結合は、前記RNAの末端を前記薬剤にライゲーションすることを含む、請求項40に記載の方法。
  42. 前記RNAを回収しやすくする前記薬剤は核酸を含む、請求項41に記載の方法。
  43. 前記核酸はビオチンを有する核酸を含む、請求項42に記載の方法。
  44. 前記ビオチンを有する核酸を前記RNAの前記末端に結合することは、前記共にタンパク質中間体及び/又はタンパク質複合体に架橋されたRNAをライゲーションしてキメラRNAを形成するステップの前に、前記ビオチンを有する核酸を、前記RNAの5’末端にライゲーションすることを含む、請求項43に記載の方法。
  45. 前記ビオチンを、前記キメラRNAの5’末端から取り除くステップをさらに含む、請求項44に記載の方法。
  46. 前記キメラRNAを回収するステップをさらに含む、請求項33〜45のいずれか1項に記載の方法。
  47. 前記キメラRNAを断片化するステップをさらに含む、請求項33〜46のいずれか1項に記載の方法。
  48. 前記キメラRNAの前記断片化は、前記RNAの部分的消化を促す条件下で、前記キメラRNAを、RNAseに接触させることを含む、請求項33〜47のいずれか1項に記載の方法。
  49. 前記キメラRNAを逆転写してキメラcDNAを生成するステップをさらに含む、請求項33〜48のいずれか1項に記載の方法。
  50. 前記キメラRNA又は前記キメラcDNAにおける前記RNAのそれぞれに由来する、前記キメラRNA又は前記キメラcDNAの配列の少なくとも一部分を決定するステップをさらに含む、請求項33〜49のいずれか1項に記載の方法。
  51. 前記キメラRNAに存在する前記RNAを特定することで、細胞において相互作用するRNAを特定するステップをさらに含む、請求項33〜49のいずれか1項に記載の方法。
  52. 前記細胞において、少なくとも100、少なくとも500、少なくとも1000の、又は1000を超える、RNA−RNA相互作用が特定される、請求項51に記載の方法。
  53. 実質的にすべての、前記細胞において相互作用するRNAが特定される、請求項51に記載の方法。
  54. 前記細胞において、少なくとも70%、少なくとも80%、少なくとも90%の、又は90%を超える、RNA−RNA直接相互作用が特定される、請求項53に記載の方法。
  55. 前記細胞において相互作用するRNAの前記特定は、自動シーケンシング装置を用いて、前記キメラRNAに配列リードを行うことを含む、請求項51〜54のいずれか1項に記載の方法。
  56. 前記細胞において相互作用するRNAの前記特定は、すべての前記配列リードからキメラ配列を特定することを含む、請求項55に記載の方法。
  57. 前記キメラRNAをアノテーションRNAクラスタに、コンピュータを用いて形質転換するステップをさらに含む、請求項51〜56のいずれか1項に記載の方法。
  58. 前記RNAクラスタの直接相互作用を、コンピュータで行われる統計テストを用いて特定するステップをさらに含む、請求項57に記載の方法。
  59. 前記細胞において相互作用するRNAは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋される、請求項33〜58のいずれか1項に記載の方法。
  60. タンパク質中間体及び/又はタンパク質複合体に架橋されたキメラRNAを含む単離複合体であって、前記キメラRNAは細胞において相互作用するRNAを含み、前記タンパク質複合体は2つ以上の相互作用タンパク質を含む、単離複合体。
  61. 前記キメラRNAは、前記タンパク質中間体又はタンパク質複合体の異なるタンパク質に架橋されるRNAを含む、請求項59に記載の単離複合体。
JP2017535612A 2014-09-22 2015-09-18 Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析 Pending JP2017529104A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462053615P 2014-09-22 2014-09-22
US62/053,615 2014-09-22
PCT/US2015/051075 WO2016048843A1 (en) 2014-09-22 2015-09-18 Rna stitch sequencing: an assay for direct mapping of rna : rna interactions in cells

Publications (1)

Publication Number Publication Date
JP2017529104A true JP2017529104A (ja) 2017-10-05

Family

ID=55581854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017535612A Pending JP2017529104A (ja) 2014-09-22 2015-09-18 Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析

Country Status (5)

Country Link
US (1) US20200190574A1 (ja)
EP (1) EP3198063A4 (ja)
JP (1) JP2017529104A (ja)
CN (1) CN107109698B (ja)
WO (1) WO2016048843A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3455379B1 (en) 2016-05-12 2023-07-05 Agency For Science, Technology And Research Ribonucleic acid (rna) interactions
CN110265084A (zh) * 2019-06-05 2019-09-20 复旦大学 预测癌症基因组中富含或缺失riboSnitch元件的方法及相关设备
CN110205365B (zh) * 2019-07-02 2023-07-25 中山大学孙逸仙纪念医院 一种高效研究rna相互作用组的高通量测序方法及其应用
WO2021113353A1 (en) * 2019-12-02 2021-06-10 Beth Israel Deaconess Medical Center, Inc. Methods for dual dna/protein tagging of open chromatin
CN111816250B (zh) * 2020-06-17 2022-02-15 华中科技大学 将大分子复合物结构映射到基因组和突变数据库的方法
CN113174429B (zh) * 2021-04-25 2022-04-29 中国人民解放军军事科学院军事医学研究院 一种基于邻位连接的检测rna病毒高级结构的方法
US11795500B2 (en) 2021-08-19 2023-10-24 Eclipse Bioinnovations, Inc. Methods for detecting RNA binding protein complexes

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010033818A2 (en) * 2008-09-19 2010-03-25 Immune Disease Institute, Inc. Mirna targets
US8748354B2 (en) * 2011-08-09 2014-06-10 The Board Of Trustees Of The Leland Stanford Junior University RNA interactome analysis
EP2581447A1 (en) * 2011-10-12 2013-04-17 Royal College of Surgeons in Ireland Selective isolation of a messenger RNA molecule having its cognate micro RNA molecules bound thereto
WO2013135910A1 (en) * 2012-03-16 2013-09-19 Max-Delbrück-Centrum für Molekulare Medizin Method for identification of the sequence of poly(a)+rna that physically interacts with protein
CN103983555B (zh) * 2014-05-28 2016-04-20 国家纳米科学中心 一种检测生物分子相互作用的方法

Also Published As

Publication number Publication date
US20200190574A1 (en) 2020-06-18
WO2016048843A1 (en) 2016-03-31
CN107109698A (zh) 2017-08-29
EP3198063A4 (en) 2018-05-02
CN107109698B (zh) 2021-07-20
EP3198063A1 (en) 2017-08-02

Similar Documents

Publication Publication Date Title
Jathar et al. Technological developments in lncRNA biology
Nguyen et al. Mapping RNA–RNA interactome and RNA structure in vivo by MARIO
CN113166797B (zh) 基于核酸酶的rna耗尽
Sun et al. Principles and innovative technologies for decrypting noncoding RNAs: from discovery and functional prediction to clinical application
JP2017529104A (ja) Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析
Ascano et al. Identification of RNA–protein interaction networks using PAR‐CLIP
AU2015205612B2 (en) Method for generating double stranded DNA libraries and sequencing methods for the identification of methylated cytosines
Sos et al. Characterization of chromatin accessibility with a transposome hypersensitive sites sequencing (THS-seq) assay
AU2021224760A1 (en) Capturing genetic targets using a hybridization approach
Cullum et al. The next generation: using new sequencing technologies to analyse gene regulation
CN105899672B (zh) 用于rna-染色质相互作用分析的组合物及其用途
US20150045237A1 (en) Method for identification of the sequence of poly(a)+rna that physically interacts with protein
Cao et al. Global in situ profiling of RNA-RNA spatial interactions with RIC-seq
JP2023547394A (ja) オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法
WO2019168771A1 (en) Improved dna library construction of immobilized chromatin immunoprecipitated dna
JP7313696B2 (ja) 増強されたRNAインタラクトーム捕捉(eRIC)
Spicuglia et al. An update on recent methods applied for deciphering the diversity of the noncoding RNA genome structure and function
US20110269647A1 (en) Method
CA3195218A1 (en) Methods of identifying protein binding sites on rna
Wang et al. Capture, amplification, and global profiling of microRNAs from low quantities of whole cell lysate
Liu et al. Genome-wide identification of protein binding sites on RNAs in mammalian cells
US11268087B2 (en) Isolation and immobilization of nucleic acids and uses thereof
US20240150830A1 (en) Phased genome scale epigenetic maps and methods for generating maps
Nguyen Development of high-throughput technologies to map RNA structures and interactions
Becker Dissecting Gene Regulation at the RNA and Chromatin Levels

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170424

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20170424