CN109477132B - 核糖核酸(rna)相互作用 - Google Patents

核糖核酸(rna)相互作用 Download PDF

Info

Publication number
CN109477132B
CN109477132B CN201780043464.2A CN201780043464A CN109477132B CN 109477132 B CN109477132 B CN 109477132B CN 201780043464 A CN201780043464 A CN 201780043464A CN 109477132 B CN109477132 B CN 109477132B
Authority
CN
China
Prior art keywords
rna
cross
interactions
linked
molecules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780043464.2A
Other languages
English (en)
Other versions
CN109477132A (zh
Inventor
Y·万
J·G·A·欧
N·纳贾
A·威尔
M·孙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN109477132A publication Critical patent/CN109477132A/zh
Application granted granted Critical
Publication of CN109477132B publication Critical patent/CN109477132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于分析核糖核酸(RNA)相互作用的方法,所述方法包括:a)在紫外线照射下使用加标签的可逆交联剂(优选加标签的补骨脂素)使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联;b)将一个或多个所述交联的RNA分子片段化;c)使用所述标签提取一个或多个所述交联的RNA片段;d)连接一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;e)逆转所述剂与一个或多个所述RNA分子的交联;f)通过对一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;以及g)分析序列文库以确定RNA相互作用。本文还公开了通过分析RNA相互作用并且将其归于临床现象来研究受试者的方法,或通过根据确定的RNA相互作用将功效评分归于药物的药物发现方法。

Description

核糖核酸(RNA)相互作用
本发明涉及用于分析核糖核酸(RNA)相互作用的方法,所述方法包括使用加标签的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联;用于分析核糖核酸(RNA)相互作用的试剂盒,所述试剂盒至少包括所述加标签的可逆交联剂;使用所述方法和/或试剂盒研究受试者的方法;以及使用所述方法和/或试剂盒的药物发现方法。
发明背景
RNA与其自身以及与其他RNA碱基配对的能力对于其在体内的功能是至关重要的。RNA在其线性序列及其二级结构和三级结构中均携带信息。虽然已经在全基因组范围内绘制RNA二级结构上取得了显著的进展,但是理解RNA的不同部分如何相互作用以形成高级结构需要相当多的成对结构信息。RNA与其他RNA相互作用(如miRNA-mRNA相互作用和lncRNA-mRNA相互作用)的能力在转录后基因调控中起重要作用。然而,RNA相互作用网络的全局性流行和动力学及其对基因调控的影响仍然很大程度上是未知的。因而,绘制不同细胞状态下的RNA结构和相互作用物组对于扩展我们对RNA功能的理解是至关重要的。
为了鉴别哪两个RNA区彼此相互作用,我们需要空间连接信息以连接物理配对的核苷酸。很多RNA交联剂(包含亚甲蓝、UV和补骨脂素)已经被用于将RNA的远离的相互作用区彼此连接。然而,这些策略的读出通常是缓慢且冗长的。用于鉴别成对相互作用的可替代的策略已经利用序列突变,随后是结构探测以检测RNA内的碱基配对配偶体。这些方法具有较高的通量,但不适用于研究全基因组。最近的策略(如CLASH、Hi-CLIP和RAP)已经利用高通量测序以鉴别与特定RNA结合蛋白或RNA种类相关的RNA相互作用的亚群。基于最近邻位连接(RPL)的方法也已经被用于以非选择性方式鉴别转录物组中的主干。然而,RPL不利用交联来鉴别稳定的相互作用,并且主要限于绘制分子内的RNA相互作用。
我们在本文中公开了一种被称作补骨脂素交联的、连接的和选择的杂交体的测序(Sequencing of Psoralen crosslinked,Ligated,and Selected Hybrids)(SPLASH)的高通量方法学,所述高通量方法学在全基因组范围内以高灵敏度和特异性绘制体内成对RNA相互作用。将SPLASH应用于人类转录物组和酵母转录物组容许研究数以千计的长程分子内和分子间RNA-RNA相互作用的多样性和动力学。例如,这容许突出RNA类别的关键结构特征的分析,包含mRNA的模块化组织、其对翻译和衰变的影响、以及非编码RNA中长程相互作用的富集。此外,分子间mRNA相互作用被组织成网络簇,并且在细胞分化期间被重塑。另外,其允许鉴别数以百计的已知的和新的snoRNA-rRNA结合位点的鉴别,从而扩展rRNA生物发生的知识库。这些结果突出了RNA相互作用物组的未充分探索的复杂性,并且为更好地理解RNA组织如何影响生物学做准备。
发明陈述
根据本发明的第一方面,提供了一种用于分析核糖核酸(RNA)相互作用的方法,所述方法包括:
a.使用加标签的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
b.将所述交联的RNA分子和/或交联的RNA分子对片段化以产生多个片段,所述多个片段包括至少一个交联的RNA片段;
c.使用所述标签从所述多个片段中提取一个或多个所述交联的RNA片段;
d.连接一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
e.逆转所述剂与所述RNA分子和/或RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
f.通过对一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;以及
g.分析序列文库以确定RNA相互作用。
在本发明的优选方法中,所述RNA存在于细胞中,并且使用所述加标签的可逆交联剂的所述交联涉及细胞摄取剂(如去垢剂)的使用。理想地,去垢剂是毛地黄皂甙,并且优选地以0.01%左右的浓度使用。在本发明的此实施方案中,在进行b部分的片段化步骤之前,从所述细胞中提取所述RNA。
本领域技术人员将理解,当操作本发明时,可以在b部分之前或之后进行c部分。
在本发明的优选方法中,所述交联剂包括呋喃并香豆素化合物,理想地,包括补骨脂素。我们已经发现,补骨脂素插入碱基配对区(无论碱基配对区是由相同的RNA链形成,还是形成在两条不同的RNA链之间)中,使得SPLASH能够询问分子内RNA相互作用和分子间RNA相互作用两者。
补骨脂素(psoralen)(也称为补骨脂素(psoralene))是被称为呋喃并香豆素的天然产物家族中的母体化合物。其通过稠合的呋喃环的添加在结构上与香豆素有关,并且可以被认为是伞形酮的衍生物。实践本文所描述的发明可以涉及这些化合物中的任何一种或更多种的使用。有利地,这些呋喃并香豆素能够可逆地和/或选择性地交联核苷酸。
在本发明的又一进一步优选的方法中,所述交联剂的所述标签包括结合对的第一构件(member)。理想地,所述标签是下列结合对中的一个的一个构件:生物素/抗生蛋白链菌素、抗原/抗体、蛋白质/蛋白质、多肽/蛋白质和多肽/多肽。因此,使用所述标签从所述多个片段中提取所述交联的RNA片段的操作涉及所述结合对的另一个构件的使用,所述结合对的另一个构件可以可选地在支撑物上被提供。
更优选地,一个或多个所述RNA分子与所述交联剂的交联以产生一个或多个交联的RNA分子的操作使用波长在约300nm至约400nm范围内的紫外线照射进行。类似地,逆转一个或多个交联连接的RNA分子的交联的操作使用不同波长(即在约200nm至不超过约300nm的范围内)的紫外线照射进行。
优选地,通过对一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库的方法步骤包括下列技术中的至少一种或更多种的使用:衔接子连接、逆转录、cDNA环化或聚合酶链反应(PCR)。
在本发明的优选的方法中,将交联的RNA分子和/或交联的RNA分子对片段化以产生多个片段的步骤包括产生在长度上具有在100个至500个碱基对范围内的平均尺寸的片段。用于将RNA片段化的常规手段或剂被用于本发明的方法中,如物理手段、化学手段或酶促手段,包含但不限于声波剪切、超声处理、流体动力学剪切、脱氧核糖核酸酶处理或核糖核酸酶处理、转座酶处理和用二价金属阳离子的热消化。
理想地,当实践本发明的方法时,所使用的交联剂的浓度被校准,使得其在每150个碱基中大约一个处交联。
理想地,当分析序列文库时,连续的成对相互作用或以小于50个碱基间隔的成对相互作用被去除,这使得人们能够将分析集中在长程分子内相互作用和分子间相互作用上。
在本发明的又一进一步优选的方法中,所述RNA分子和/或所述RNA分子对的至少一个构件被归于一个“环化评分”,所述“环化评分”被定义为每个分子内的平均碱基对相互作用距离,通过所述RNA分子的长度或所述RNA分子对的所述构件的长度被归一化。更理想地,当分析序列文库时,所述RNA分子和/或所述RNA分子对的所述至少一个构件根据其“环化评分”被分为组。
本文对环化评分的提及是对RNA形成长程成对相互作用的倾向的提及,我们已经发现所述长程成对相互作用与翻译效率有关。事实上,我们已经发现,相比于具有低环化评分的转录物,具有高环化评分的转录物倾向于更好地被翻译,此外,这些评分可以随着相应的RNA(特别是mRNA)经历构象改变而改变。例如,从ES(干)细胞中具有高环化评分转变为RA(分化的)细胞中的低环化评分的mRNA显示出翻译效率的相应减小,反之亦然(图7A)。这表明,构象改变可以作为在细胞状态改变期间控制翻译效率的潜在机制。例如,染色质基因中的一种(高迁移率族1,HMGA1)在RA分化期间展现出环化评分和翻译效率的显著减小,与其在维持ES细胞多能性中的关键作用一致(图7B)。确切地说,使用免疫印迹和qPCR分析的蛋白质和mRNA定量表明,HMGA1蛋白水平在5天的分化之后减小,然而其mRNA水平不减小(图7C、图7D)。此外,通过小鼠ES细胞和分化的细胞中的核糖体图谱测量的翻译效率显示出细胞分化时HMGA1翻译效率的相应减小(图14H),从而加强了结构重排和翻译之间的关联。
在本发明的又一进一步优选的方法中,细胞是哺乳动物的、人类的、细菌的或酵母。
最典型地,分析序列文库以确定RNA相互作用的操作包括通过一个或更多个计算区块(computational block)处理来源于序列文库的数据以确定RNA相互作用。最优选地,一种或更多种计算区块选自由下列组成的组:用于过滤来自衔接子RNA的读序的计算区块;用于过滤来自PCR重复的读序的计算区块;用于将双端读序合并为单端读序的计算区块;用于过滤来自相隔小于预定数的碱基对的分割比对(split alignment)的读序的计算区块;用于过滤来自剪接有关的假阳性相互作用的读序的计算区块;用于过滤与分子间相互作用有关的共转录转录物的读序的计算区块;用于对与相互作用的RNA对有关的数据进行分箱(bin)和过滤的计算区块;以及事实上上述区块的任何组合。
理想地,用于过滤来自相隔小于预定数量的碱基对的分割比对的读序的计算区块包括过滤来自相隔小于50个碱基对的分割比对的读序的操作。
典型地,可以使用本发明,使得确定的RNA相互作用提供与下列(除其他之外)有关的有用信息:分子间RNA相互作用、分子内RNA相互作用、一级RNA结构、二级RNA结构、三级RNA结构、四级RNA结构、基因调控、基因表达、基因翻译效率、RNA衰变率、对RNA元件有响应的代谢物和核糖体生物发生。
最有利地,本发明的方法在全基因组范围内分析RNA相互作用方面是无差别的,并且不限于分析与特异性RNA结合蛋白或RNA种类相关的RNA相互作用。
在进一步的方面,本发明涉及一种用于分析核糖核酸(RNA)相互作用的试剂盒,所述试剂盒包括:
加标签的可逆交联剂,所述加标签的可逆交联剂用于使至少一个RNA分子和/或至少一个RNA分子对的碱基配对核苷酸可逆地交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
片段化缓冲液,所述片段化缓冲液用于将所述交联的RNA分子和/或所述交联的RNA分子对片段化,以产生多个片段;
RNA连接酶,所述RNA连接酶用于连接一个或多个交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
所述剂上的所述标签的结合配偶体;以及
可选地,关于如何使用试剂盒的说明。
优选地,试剂盒还包括用于对一个或多个交联连接的RNA嵌合体测序以制备序列文库的试剂。理想地,试剂盒包括RNA连接酶、逆转录引物和DNA聚合酶中的至少一种。
最优选地,交联剂包括呋喃并香豆素化合物(如补骨脂素)。
此外,所述交联剂的所述标签包括结合对的第一构件。理想地,所述标签是下列结合对中的一个的一个构件:生物素/抗生蛋白链菌素、抗原/抗体、蛋白质/蛋白质、多肽/蛋白质和多肽/多肽。相应地,使用所述标签从所述多个片段中提取所述交联的RNA片段的操作涉及使用所述结合配偶体或所述结合对的另一个构件,所述结合对的另一个构件可以可选地在支撑物上被提供。
更优选地,试剂盒还包括剂,以便利细胞摄取交联剂到细胞中,如去垢剂,去垢剂的实例是温和去垢剂(如毛地黄皂甙),并且以约0.01%使用。
根据本发明的另一方面,提供了一种研究受试者的方法,所述方法包括:
a.从受试者获得细胞样品;
b.使用加标签的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
c.将所述交联的RNA分子和/或交联的RNA分子对片段化以产生多个片段,所述多个片段包括至少一个交联的RNA片段;
d.使用所述标签从所述多个片段中提取一个或多个所述交联的RNA片段;
e.连接一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
f.逆转所述剂与所述RNA分子和/或一个或多个RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
g.通过对一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;
h.分析序列文库以确定细胞样品中的RNA相互作用;以及
i.将确定的RNA相互作用与一组预先存在的数据进行比较,以将临床现象归于受试者。
在本发明的此优选方法中,研究受试者的方法包括下列中的至少一个:诊断受试者的临床病况、预测受试者患有临床病况的风险、筛查受试者对于特定治疗的适合性、或确定候选药物对受试者的功效。
根据本发明的又一方面,提供了一种药物发现方法,所述方法包括:
a.将RNA暴露于药物;
b.使用加标签的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
c.将所述交联的RNA分子和/或交联的RNA分子对片段化,以产生多个片段,所述多个片段包括至少一个交联的RNA片段;
d.使用所述标签从所述多个片段中提取一个或多个所述交联的RNA片段;
e.连接一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
f.逆转所述剂与所述RNA分子和/或RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
g.通过对一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;
h.分析序列文库以确定RNA相互作用;以及
i.基于确定的RNA相互作用将功效评分归于所述药物。
遍及本说明书的描述和权利要求,词语“包括(comprise)”和“含有(contain)”以及词语的变体(例如“包括(comprising)”和“包括(comprises)”)意为“包含但不限于”,并且不排除其他部分、添加剂、组分、整体或步骤。遍及本说明书的描述和权利要求,除非上下文另有要求,否则单数形式包含复数形式。特别地,在使用不定冠词的情况下,除非上下文另有要求,否则说明书将被理解为考虑复数以及单数。
本说明书中引用的全部参考文献(包含任何专利或专利申请)特此通过引用被并入。不承认任何参考文献构成现有技术。此外,不承认现有技术中的任何一个构成本领域公知常识的一部分。
本发明的每个方面的优选特征可以是如与其他方面中的任何一个结合被描述的那样。
通过下列实施例,本发明的其他特征将变得明显。一般而言,本发明扩展到本说明书(包含所附权利要求和附图)中公开的特征中的任何新颖的一个或任何新颖的组合。因此,除非与其矛盾,否则结合本发明的特定方面、实施方案或实施例描述的特征、整体、特性、化合物或化学部分将被理解为适用于本文所描述的任何其他方面、实施方案或实施例。
此外,除非另有说明,否则本文公开的任何特征可以被用作相同或相似目的的可替代的特征代替。
现在将参考下列附图和表格仅通过实施例来描述本发明,其中:
图1.SPLASH策略精确地鉴别RNA相互作用。[A]SPLASH策略的示意图。使用生物素化的补骨脂素(生物补骨脂素(biopsoralen))在体内交联RNA-RNA相互作用,并且然后片段化。含有生物补骨脂素的相互作用区通过与抗生蛋白链菌素磁珠结合被富集,并且被连接在一起。然后,将嵌合RNA克隆到cDNA文库中用于深度测序。[B]28SrRNA的二级结构上的嵌合相互作用的可视化。基于80S核糖体晶体结构,深灰色线、浅灰色线和灰色线分别代表相隔
Figure GDA0003513466450000071
相隔
Figure GDA0003513466450000072
以及相隔
Figure GDA0003513466450000073
的相互作用。[C]条形图,所述条形图显示出,基于80S rRNA晶体结构,在不同的截止点处,总RNA复制中的阳性预测值(PPV)和灵敏度。截止点“全部”表示存在于四个生物学复制中的至少一个中的相互作用,而“2/4”、“3/4”和“4/4”表示存在于至少2个、3个或4个复制中的相互作用。符号“>8”表示相互作用需要由遍及文库的至少8个嵌合读序支持。另参见图8、图9、表1;
图2.人类RNA相互作用物组的分布和功能。[A,B]饼形图,所述饼形图显示出总RNA的四个生物学复制中(左)和全部polyA(+)富集的RNA样品中(右)属于不同类别转录物的分子内[A]相互作用和分子间[B]相互作用的分布。[C]环化评分的示意图。将环化评分计算为由mRNA长度归一化的分子内相互作用的平均跨度。具有较高环化评分的mRNA参与更多长程相互作用。[D]rRNA、lncRNA和mRNA的环化评分的箱形图。使用威尔科克森秩和检验计算P值。另参见图10、图11、表2;
图3.分子内相互作用模式及其与基因调控的关联。[A]二维热图,所述二维热图显示出基于嵌合体端的位置的分子内mRNA相互作用的富集。我们根据转录物的翻译起始位点和终止位点将转录物进行比对,并且绘制来自5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基的相互作用。基于遍及具有100bp窗口的转录物的随机取样,将富集计算为-log10(p值)。黑色虚线划分了5’UTR、CDS和3’UTR之间的边界。[B]通过沿着mRNA的翻译起始和终止比对mRNA,沿着人类mRNA的分子内相互作用的频率的集合基因(Metagene)分析。我们绘制了存在于5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基中的相互作用。[C]具有最高和最低20%环化评分的mRNA中的翻译效率(Y轴)的箱形图。[D]相比于具有遍及转录物的相互作用的mRNA,仅在5’UTR中具有相互作用的mRNA中的翻译效率的箱形图。[E]密度图,所述密度图显示出基于核糖体图谱数据被有效地翻译(左图)和翻译不良(右图)的mRNA中的前5%的成对相互作用的左(灰色)端和右(黑色)端的分布。[F]相比于遍及转录物,具有被限制于5’末端的成对相互作用的基因中的衰变率(Y轴)的箱形图(左图)。3’末端处的成对相互作用倾向于阻断衰变。另参见图12、表3;
图4.SPLASH鉴别已知的和新的人类snoRNA-rRNA相互作用。[A]黑色线形图表示在SPLASH中U42B(顶部)或U80(底部)分别与18S rRNA或28S rRNA相互作用的区。浅灰色条分别是文献中U42B和U80的已知的相互作用区。Y轴表示被定位到rRNA上的嵌合读序的数量。[B]新颖的人类snoRNA-rRNA相互作用的验证。左:SPLASH数据表明,SNORA32(顶部)与5SrRNA相互作用,并且SNORD83a(底部)与18S rRNA相互作用。Y轴表示支持相互作用的嵌合读序的数量。右:在每个下拉法(pulldown)中,5S rRNA、18S rRNA和28S rRNA的单独下拉法以及SNORA32(顶部)和SNORD83a(底部)的qPCR分析证实了SPLASH数据。Y轴表示相对富集。[C]沿着5’外转录间隔区、18S rRNA和28S rRNA绘制人类U13-rRNA相互作用的SPLASH读序。U13图中的浅灰色条表示U13结合的已知位置。灰色线表示使用程序PLEXY的U13-rRNA相互作用的预测位点。将由SPLASH和PLEXY两者支持的U13靶位点加上星号。PLEXY的Y轴以kcal/mol为单位。[D]U13 rRNA和28S rRNA之间的RNA碱基配对模型。被加上星号的位点是由PLEXY预测支持的新鉴别的U13-28S相互作用。另参见图14、表4;
图5.SPLASH鉴别已知的和新的酵母snoRNA-rRNA相互作用。[A]线形图,所述线形图显示出由SPLASH检测的25S rRNA上的snR61靶位点的位置。已知的snR61结合位点的位置被标记为灰色条。星号表示既由SPLASH鉴别又由PLEXY预测的靶位点。[B]显示出snR61和25S rRNA之间的预测的相互作用的模型。25S rRNA以蓝色显示,而snR61以黑色显示。[C]线形图,所述线形图显示出snR4与18S rRNA(顶部)和25S rRNA(底部)结合的SPLASH读序计数。被加上星号的位点表示在SPLASH数据中、以及先前在CLASH数据中被鉴别的位点。除了验证先前提出的位点之外,SPLASH还鉴别18S rRNA中的新的snR4靶位点。[D]将snR61、snR4和snR30位点绘制到酵母25S rRNA的等高线图上。[E]线形图,所述线形图显示出野生型酵母和Prp43酵母突变体中的snR30-18S rRNA相互作用的SPLASH读序。[F]与野生型酵母相比,Prp43突变体中被稳定化(左)或被丢失(右)的snoRNA靶位点的热图。稳定化的位点表明,这些snoRNA可能取决于Prp43从rRNA的释放。新鉴别的需要Prp43用于释放的靶位点以红色突出显示。星号表示其中snoRNA先前已经被发现与Prp43结合的位点。另参见图13、表5;
图6.mRNA相互作用模块的功能和调控。[A,B]条形图,所述条形图显示出依据qPCR分析的X-连锁的胸腺素β4(TMSB4X)[A]和肌动蛋白(ACTB)[B]相互作用基因的富集。下列名称代表真核翻译延伸因子1α1(EEF1A1)、核糖体蛋白S27(RPS27)、β-2-微球蛋白(B2M)、真核翻译起始因子5A(EIF5A)和核糖体蛋白L35(RPL35)。Y轴表示相对于针对GFP的寡核苷酸下拉法的log10富集。误差条描绘了基于3个生物学复制的标准偏差。[C]二维热图,所述二维热图显示出基于遍及mRNA对的嵌合体端的位置的分子间相互作用的富集。我们根据转录物的翻译起始位点和终止位点对转录物进行比对,并且绘制了来自5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基的相互作用。基于遍及具有100bp窗口的转录物的随机取样,将富集计算为-log10(p值)。黑色虚线划分了5’UTR、CDS和3’UTR之间的边界。[D]淋巴母细胞样细胞的网络分析鉴别主要的mRNA-mRNA相互作用连接组分。[E]基于mRNA-mRNA相互作用的密度的分层聚类将主要组分分离成9个模块。每个模块的GO术语分析显示,模块富集具有特定功能和亚细胞定位模式的mRNA。[F]观察到的相互作用中的相互作用对的数量的条形图,相比于打乱的(shuffled)相互作用对,所述观察到的相互作用中的相互作用对两者都被细胞质定位,或其中一个在细胞质中而另一个在细胞核中。当两个RNA都在相同的细胞区室中时,2个mRNA之间的观察到的相互作用被显著地富集,并且当其在不同的区室中时,2个mRNA之间的观察到的相互作用被耗尽。另参见图14、表6;
图7.在人类ES细胞分化期间RNA相互作用物组的重塑。[A]箱形图,所述箱形图显示出小鼠ES细胞和RA细胞中对于人类ES细胞中具有高环化评分和RA细胞中具有低环化评分的保守人类mRNA的翻译效率的变化(左),反之亦然(右)。具有环化评分的减小的mRNA通常显示出翻译效率的相应减小。[B}基因HMGA1中的分子内相互作用的弧形图,所述弧形图显示出5天的RA分化之后的环化评分的减小。[C]通过qPCR在人类ES细胞和由视黄酸(RA)分化5天的ES细胞中的HMGA1和Oct4mRNA水平的分析。[D]通过免疫印迹在人类ES细胞和RA分化细胞中的HMGA1、Oct4和GAPDH蛋白水平的分析。[E,F]ES[E]细胞和RA[F]细胞中的mRNA-mRNA分子间相互作用的网络分析显示,相比于在RA细胞中,mRNA在ES细胞中被更大程度地相互连接。[G,H]基于mRNA-mRNA相互作用的密度的分层聚类鉴别相互作用网络的主要连接组分中的特定模块。代表性的富集的GO术语被显示为每个模块的标记。相比于RA相互作用模块[H],ES相互作用模块[G]被观察到被更大程度地相互连接。另参见图14、表6和表7。
图8.生物素化的补骨脂素可以进入体内并且在体内交联RNA(与图1有关)。[A]生物素化的补骨脂素的结构。[B]用生物补骨脂素处理并且在365nm照射用于UV交联的HeLa细胞的免疫荧光图像。补骨脂素存在于细胞的细胞核和细胞质两者中。在37℃0.01%毛地黄皂甙的5min处理大大增加了生物素化的补骨脂素进入细胞中。[C]在不存在0.01%毛地黄皂甙(泳道1、泳道2)和存在0.01%毛地黄皂甙(泳道3、泳道4)的情况下,用200μM补骨脂素处理(泳道2、泳道4)和不用200μM补骨脂素处理(泳道1、泳道3)的淋巴母细胞样细胞的5min足迹分析。黑色箭头表示由于补骨脂素交联的逆转录酶终止的位置。毛地黄皂甙处理不改变沿着18S rRNA和28S rRNA的补骨脂素交联的模式。[D]使用补骨脂素进行RNA相互作用的UV交联的时间量的滴定。在UV 365nm交联10、20和30min之后,使用2μg(顶部)和0.2μg(底部)的总RNA的点渍印迹。我们选择的条件(20min)被用灰色虚线框起来。[E]点渍印迹,所述点渍印迹显示出,随着我们增加添加到细胞中的生物补骨脂素的浓度(顶部),并入RNA中的生物素化的补骨脂素(生物补骨脂素)的量。生物素化的20mer(底部)用作我们的阳性对照,以估计并入RNA中的补骨脂素的量。[F,G]点渍印迹,所述点渍印迹显示,尽管对于如HeLa细胞中相似水平的并入,需要较高浓度的补骨脂素,但补骨脂素可以进入酿酒酵母和大肠杆菌细胞中。[H]使用与U14(左)和35S前体rRNA(右)互补的探针的诺瑟印迹(Northern blot)分析。U14显示在Dbp4突变细胞中在存在生物补骨脂素的情况下的超位移,从而证实了生物补骨脂素检测文献中已知的相互作用。
图9.SPLASH实验流程(与图1有关)。[A]在时间进程内用UV 254nm照射RNA时的逆转交联的量的定量。点渍印迹表明在用UV 254nm照射时保持交联的RNA的量。图的Y轴上的逆转交联的量为1-(交联的分数)。[B]已经在体外用UV 254nM照射0、5、10、15、30min的酵母EFB1 mRNA的RNA足迹分析。条带表示逆转录的终止位点。早在照射开始之后5min就发生RNA损伤(左)。损伤的百分比被定量为100(通过逆转录检测的全长转录物的百分比)。箭头表示我们用于文库制备的条件(右)。[C]在片段化之后,金属离子水解将生物素化的补骨脂素保留在RNA上。定量在片段化之前、在pH 9.2下使用碱性水解片段化之后、在使用基于Mg2+的金属离子水解片段化之后保留在RNA上的生物素化的补骨脂素(通过点渍印迹鉴别的)的量的条形图。[D]在使用优化的洗涤方案洗涤之后保持与磁珠结合的非交联EFB1 mRNA上的非特异性结合的量的qPCR定量。我们观察到,在洗涤之后,相比于输入RNA中的其原始量,洗脱RNA中的非特异性结合减少105倍。[E]在使用优化的洗涤方案洗涤之后保持与磁珠结合的生物补骨脂素交联的TrxB2 mRNA上的特异性结合的量的qPCR定量。在结合和洗涤之后,相比于输入,我们在洗脱中保留约60%的mRNA。[F]在将两个嵌合体连接在一起之后,我们设计了一种有效的嵌合体,并且然后进行逆转录。然后,我们将cDNA环化并且进行PCR扩增,以获得最终cDNA文库。[G]用于分析SPLASH文库的流程,使用经测序的2×150bp双端Illumina读序作为输入。
图10.SPLASH文库是灵敏且精确的(与图2有关)。[A]直方图,所述直方图显示出从人类淋巴母细胞样细胞中的SPLASH分析发现的嵌合体跨度的分布。分布的中位数在第300个碱基处。[B]条形图,所述条形图显示出以28S rRNA上已知的碱基对作为基准的无补骨脂素交联的文库、补骨脂素交联的文库和生物素化的补骨脂素交联的文库(SPLASH)的灵敏度和特异性。[C]定位到来自用1×连接酶SPLASH文库、0.1×连接酶SPLASH文库和无连接酶SPLASH文库制作的文库中的28S rRNA的嵌合读序的数量。相比于连接酶样品,在无连接酶样品中鉴别了很少的嵌合读序。[D]使用FreeSASA程序评估的四个淋巴母细胞样细胞SPLASH文库的测序读序的数量与每个碱基对处的溶剂可及性之间的相关性分析。补骨脂素-生物素与28S rRNA的交联没有显示出对溶剂可及表面积的任何依赖性。[E]相比于有平滑化和无平滑化的RNA邻位连接(RPL),28S rRNA上的SPLASH数据的接受者工作特征(ROC)曲线(使用已知的碱基配对信息作为真阳性)。[F]基于人类snoRNA数据库,在被测序至相似深度的RPL和SPLASH文库中检测到的已知的snoRNA-rRNA相互作用的数量。
图11.SPLASH文库的基因组分析(与图2有关)。[A]人类ES细胞、RA细胞和淋巴母细胞样细胞的2个生物学复制中的分子内(左)嵌合相互作用和分子间(右)嵌合相互作用的覆盖度之间的相关性分析。计算每个相互作用窗口的分子内相互作用相关性,同时计算每个基因对的分子间相互作用相关性。通过每个文库中鉴别的嵌合读序的总数量将读序覆盖度归一化。[B]饼图,所述饼图显示出酵母中总RNA(左)和polyA(+)富集的RNA(右)的两个生物学复制中属于不同类别转录物的分子内(顶部)相互作用和分子间(底部)相互作用的分布。[C]直方图,所述直方图显示出被发现与RNA相互作用的RNA配偶体的数量的分布(在淋巴母细胞样细胞中)。相互作用的中位数为每个mRNA 1个。
图12.SPLASH分子内相互作用的分析和验证(与图3有关)。[A]相比于随机打乱的嵌合体(右),mRNA中分子内SPLASH嵌合体(左)的相互作用能的箱形图。Y轴显示RNA杂交能(kcal/mol)。真正的嵌合体显示出较低的杂交能(通过RNAduplex计算),表明其形成更稳定的碱基对。[B]通过SPLASH在酵母snR86基因中检测到的分子内相互作用。相互作用表明长发夹的形成,与snR86的预测的二级结构一致。[C]顶部,通过SPLASH在酵母LSR1基因中检测到的分子内相互作用。100-200:1000-1100相互作用和400-500:800-900相互作用两者均与先前的交联实验一致。底部,LSR1的二级结构和可能发生100-200:1000-1100相互作用的位置。[D]顶部,通过SPLASH在酵母SCR1基因中检测到的分子内相互作用。0-100:400-500相互作用与先前的报告以及与SCR1的二级结构一致。[E]酵母mRNA YBR118W的碱基1-100和1400-1500之间的长程分子内相互作用的验证。在使用生物素化的反义DNA探针的碱基1-100的下拉法之前,将补骨脂素交联的和非补骨脂素交联的酵母总RNA片段化并且按尺寸选择在100-300个碱基之间。Y轴表示通过qPCR分析在存在或不存在补骨脂素的情况下与碱基1-100一起被下拉的片段1400-1500的log(富集)。[F]针对5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基绘制的人类mRNA中全部四个核苷酸中U的平均分数。[G]将分子内相互作用(来自淋巴母细胞样细胞)的位置K均值聚类成5个簇显示出可以发生在RNA内的不同的相互作用模式。顶部,嵌合体沿着mRNA的位置的示意图。底部,显示出相互作用的左(顶部)端和右(底部)端的位置的热图。较深的阴影。[H]显示出每个簇中mRNA的翻译效率的箱形图。具有更多端到端相互作用的mRNA(第4组、第5组)被更有效地、同时有效地翻译。使用威尔科克森秩和检验计算p值。
图13.SPLASH鉴别snoRNA-rRNA相互作用(与图4、图5有关)。[A]SPLASH沿着18SrRNA(底部)在正确区处鉴别已知的U14-18S rRNA相互作用(顶部)。顶部:定位到5S rRNA、18S rRNA和28S rRNA上的U14-rRNA嵌合读序。底部:黑色线表示沿着18S rRNA定位的U14-rRNA嵌合读序的数量,而浅灰色条表示U14-18S rRNA相互作用的已知位置。[B]顶部和中部:snoRNA-rRNA下拉法的对照。针对5S rRNA、18S rRNA和28S rRNA的生物素化的反义寡核苷酸被用于下拉rRNA。Y轴表示被归一化以通过反义探针向GFP下拉的各rRNA的log(富集)。肌动蛋白不被择性地富集在三种rRNA中的任何一种中。底部,新颖的SNORA51/ACA51-28SrRNA相互作用的验证。左:ACA51与SPLASH数据中的28S rRNA相互作用。右:通过5S rRNA、18S rRNA和28S rRNA的下拉法,用实验方法验证ACA51-28S rRNA相互作用。ACA51以最高亲和力与28S结合。[C]snR4与25S rRNA相互作用针对相互作用位点的模型,所述相互作用位点通过SPLASH鉴别并且通过PLEXY预测。[D]在存在半乳糖和葡萄糖的情况下生长的Prp43突变T-123A酵母和WT酵母。当在半乳糖中生长时,Prp43突变酵母是有缺陷的,显示出Prp43的成功缺失。
图14.通过SPLASH检测的分子间相互作用的性质(与图6、图7有关)。[A]条形图,所述条形图显示出依据人类ES细胞中EEF1A1的寡核苷酸下拉及其相互作用基因的qPCR的EEF1A1相互作用基因的log富集。针对GFP的寡核苷酸下拉被用作阴性对照。误差条描绘了基于2个生物学复制的标准偏差。下列名称代表真核翻译延伸因子1α1(EEF1A1)、核糖体蛋白S27(RPS27)、X-连锁的胸腺素β4(TMSB4X)、核糖体蛋白大P0(RPLP0)、甘油醛-3-磷酸脱氢酶(GAPDH)和肌动蛋白(ACTB)。[B]相比于mRNA中随机打乱的嵌合体(右),mRNA中分子间SPLASH嵌合体(左)的相互作用能的箱形图。Y轴表示RNA杂交能(kcal/mol)。真正的嵌合体显示出较低的杂交能(通过RNAduplex计算),表明其形成更稳定的碱基对。[C]通过沿着mRNA的翻译起始和终止将mRNA进行比对,沿着淋巴母细胞样细胞mRNA的分子间相互作用的频率的集合基因分析。我们绘制了存在于5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基中的相互作用。[D,E]条形图,所述条形图显示出在每个模块中,相比于随机打乱,观察到的与翻译效率[D]或衰变[E]关联的mRNA-mRNA对的数量。[F,G]二维热图,所述二维热图显示出对于全部ES[F]mRNA和RA[G]mRNA,嵌合体的一端与另一端之间的相互作用的富集。我们根据转录物的翻译起始位点和终止位点对转录物进行比对,并且绘制了来自5’UTR的最后200个碱基、编码区的前400个碱基和最后400个碱基、以及3’UTR的前400个碱基的相互作用。基于遍及具有100bp窗口的转录物的随机取样计算富集。黑色虚线划分了5’UTR、CDS和3’UTR之间的边界。全局地,2D热图类似于淋巴母细胞样细胞的热图。[H]条形图,所述条形图显示出HMGA1的翻译效率,如通过小鼠ES细胞和分化细胞中的核糖体图谱所测量的。在分化期间,HMGA1翻译效率减小。
表1.SPLASH的不同方案的评估(与图1有关);
表2.经测序的SPLASH文库的信息(与图1有关);
表3.常见的人类-人类相互作用和人类酵母相互作用的列表(与图2有关);
表4.淋巴母细胞样细胞snoRNA靶位点的列表(与图4有关);
表5.酵母snoRNA靶位点的列表(与图5有关);
表6.淋巴母细胞样细胞、ES细胞和RA细胞中的网络相互作用的GO分析(与图6、图7有关);
表7.验证中使用的探针和qPCR引物(与图6有关)。
方法和材料
细胞培养。HeLa细胞在补充有10%胎牛血清(FBS)和1%青霉素链霉素(PS)的达尔伯克氏改良伊格尔培养基(DMEM)中生长。人类淋巴母细胞样细胞GM12892在补充有20%FBS、1%PS和2mM L-谷氨酰胺的洛斯维公园纪念研究所培养基(Roswell Park MemorialInstitute)(RPMI)中生长。在基质胶(BD)包被的皿上在mTeSR1(干细胞技术)培养基中培养hESC系H1(WA-01,第30代)。对于视黄酸(RA)处理,将细胞以1:6的比例接种,并且在16-24hr之后用10μM的RA处理,并且在5天的处理之后收获。
人类RNA、酵母RNA和大肠杆菌RNA的交联和提取。用PBS洗涤HeLa细胞和GM12892细胞,并且在37℃用200μM的EZ-LinkTM补骨脂素-PEG3-生物素(Thermo Fisher Scientific)和0.01%w/v毛地黄皂甙(Sigma)处理5min。酿酒酵母(S288C或W303a)或大肠杆菌(大肠杆菌K12)生长至指数期(OD=0.6)、沉淀并且在TE缓冲液中洗涤,并且与2mM的EZ-Link补骨脂素-PEG3-生物素在37℃在TE中孵育10min。然后,将细胞涂布到10cm板上并且在冰上用365nm UV照射20min。通过使用TRIzol试剂(Invitrogen)分离人类RNA和大肠杆菌RNA,而使用热酸酚提取分离酵母RNA。
交联的RNA的片段化和富集。用RNA片段化缓冲液(9mM MgCl2、225mM KCl和150mMTris HCl(pH 8.3))在95℃将20μg的RNA片段化5分钟,并且在6%TBE 8M脲凝胶上进行尺寸分级分离。切除对应于90-110nt的碱基,并且在4℃洗脱过夜。将1.5μg的片段化的RNA与100μL的
Figure GDA0003513466450000131
MyOneTM抗生蛋白链菌素C1磁珠(Life Technology)在37℃孵育30min,所述
Figure GDA0003513466450000132
MyOneTM抗生蛋白链菌素C1磁珠(Life Technology)溶解在2mL的新鲜杂交缓冲液(750mM NaCl、1%SDS、50mM Tris-Cl pH 7.0、1mM EDTA、15%甲酰胺)和1ml的补充有Superase-in(1:200)的补充裂解缓冲液(50mM Tris-Cl pH 7.0、10mM EDTA、1%SDS)中。将磁珠用1mL的洗涤缓冲液(2×NaCl和柠檬酸钠(SSC)、0.5%SDS)在37℃洗涤5min,同时轻微振荡5次。
邻位连接和逆转交联。在冷的T4 PNK缓冲液中洗涤富集的交联的样品,并且在80μl反应中用0.5单位的T4 PNK酶(NEB)在37℃处理4小时。然后,我们在100μL反应中添加新鲜的1mM ATP和0.5单位的T4 PNK,并且将反应在37℃孵育1hr。在160μL反应中在16℃使用2.5单位/μL的T4 RNA连接酶I将嵌合体连接过夜,并且通过在100μL的PK缓冲液(100mM NaCl、10mM TrisCl pH 7.0、1mM EDTA、0.5%SDS)中在95℃孵育10min从磁珠中洗脱。使用TRIzol试剂提取洗脱的RNA,并且使用RNeasy纯化试剂盒(Qiagen)纯化。我们通过在冰上在UV254nm下照射5min使交联的RNA逆转。
3’衔接子连接。将逆转交联的样品重悬于6μM的3’衔接子中,并且在冰上快速冷却之前,在80℃热变性90秒。使用T4 RNA连接酶2KQ在25℃连接3’衔接子2.5小时,并且使用6%TBE 8M脲凝胶进行尺寸分级分离。切除对应于第110-130个碱基的RNA,并且在4℃洗脱过夜。
逆转录(RT)。将洗脱的样品重悬于208nM的RT引物中,在80℃热变性2min并且在冰上急冷(crash)1min。然后,使用SuperScript III(Invitrogen)将变性的样品在50℃孵育30min用于RT。通过在98℃在100mM的NaOH中使RNA降解20min,并且在6%TBE 8M脲凝胶上进行尺寸分级分离来回收cDNA。切除第200-220个碱基的cDNA,并且在室温洗脱过夜。
cDNA产物的环化和PCR。通过乙醇沉淀回收洗脱的cDNA样品、使用环化连接酶II(Epicentre)环化并且使用DNA Clean&ConcentratorTM-5(Zymo)纯化。我们使用来自引物集1(Primers Set 1)(New England Biolabs)的引物和Q5 DNA聚合酶(New EnglandBiolabs)进行PCR扩增的9-12个循环。在3%GTG Nusieve琼脂糖(Lonza)上运行PCR产物,并且凝胶提取第200-300碱基,并且使用DNA凝胶提取试剂盒(Qiagen)纯化。使用Qubit DNAHS测定(Invitrogen)定量文库,并且在Nextseq 500机器(Illumina)上测序。
人类转录物组和酵母转录物组。从UCSC基因组浏览器下载人类序列和酵母序列。将属于人类snoRNA、snRNA(从NCBI提取)、tRNA(从UCSC表浏览器提取)和rRNA的附加的序列添加至人类转录物组列表中。酵母UTR序列和非编码基因序列(包含rRNA、tRNA、snRNA、snoRNA和ncRNA)(酵母属基因组数据库)也被添加至我们的转录物组列表中。
嵌合读序的处理和检测。读序被去除衔接子并且使用SeqPrep(版本1.0-7;https://github.com/jstjohn/SeqPrep)被合并。用BWA MEM(Li and Durbin,2010)(版本0.7.12)将合并的读序定位到转录物组上(参见上文)。仅保留i)在转录物组序列中相隔>50bp、ii)不彼此反向互补、以及iii)具有≥20的定位质量的分割比对用于下游分析。通过确保i)能够使用程序STAR将其唯一地定位回人类基因组(hg19)、ii)不跨越注释的剪接点、iii)存在于四个复制中的至少两个中、iii)具有最小覆盖度2、以及iv)如果全部复制中的平均覆盖度为至少2,我们进一步过滤了经定位的转录物组读序。相互作用位点的最终覆盖度是全部复制中的归一化的覆盖度的平均值。
可获得性对于源代码和附加的材料,参见http://csb5.github.io/splash/。
SRA登录号SRP073550
SRA生物项目号(SRA Bioproject ID)PRJNA318958
细胞培养。人类HeLa细胞在补充有10%胎牛血清(FBS)和1%青霉素链霉素(PS)的达尔伯克氏改良伊格尔培养基(DMEM)中生长,并且在80%汇合度与补骨脂素交联。人类淋巴母细胞样细胞GM12892在补充有20%FBS、1%PS和2mM L-谷氨酰胺的洛斯维公园纪念研究所培养基(RPMI)中生长至6×105个细胞/mL的浓度。将20mL用于补骨脂素交联。在基质胶(BD)包被的皿上在mTeSR1(干细胞技术)培养基中培养hESC系H1(WA-01,第30传代)。每天更新培养基。每5-7天用1mg/ml分散酶(干细胞技术)常规地传代培养hESC。对于视黄酸(RA)处理,将细胞以1:6的比例接种。16-24hr之后,用10μM的RA处理细胞。每天更新培养基,并且在5天的处理之后收获细胞。
SnoRNA免疫沉淀。通过在IPP150缓冲液(6mM HEPES(pH8.0)、150mM NaCl、5mMMgCl2、0.1%诺纳德P-40(Nonidet P-40))中用琼脂糖蛋白A(Thermo FischerScientific)结合的抗-TMG(R1131)抗体进行免疫沉淀来获得snoRNA富集的样品。为了沉淀TMG帽snoRNA,将全部RNA与琼脂糖蛋白A结合的抗-TMG抗体琼脂糖磁珠在旋转轮(rotatingwheel)上在4℃孵育3小时。用蛋白酶K溶液(50mM Tris-HCl(pH7.5)、5mM EDTA和蛋白酶K(2g/l))在42℃消化磁珠结合的RNA 30min。用酚-氯仿提取RNA,并且使用乙醇沉淀浓缩。
3’衔接子引物序列。5’-CTGTAGGCACCATCAAT-3’(IDT)(SEQ ID NO:1)
逆转录引物序列。通过乙醇沉淀回收3’衔接子连接的样品,并且重悬在208nM的RT引物中,
5’AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGC/iS p18/CACTC A/iSp18/TTCAGACGTGTGCTCTTCCGATCTATTGATGGTGCCTACAG-3’(IDT)(SEQ ID NO:2)。
对照文库的制备。除了通过与抗生蛋白链菌素磁珠结合来跳过富集步骤之外,以与正常文库相同的方式制备DMSO和补骨脂素交联的文库。因为我们估计大约20ng的生物补骨脂素交联的RNA和片段化的RNA通常与抗生蛋白链菌素磁珠结合,因此我们使用与SPLASH文库生成中相同的条件,在随后的连接步骤和文库制备步骤中使用相同的量(20ng的片段化的、尺寸选择的样品)。
U14-18S rRNA相互作用的诺瑟印迹分析。从野生型、Dbp4p或Dbp8p代谢耗尽的酵母细胞中提取生物补骨脂素交联的全部RNA,并且在通过凝胶电泳(天然的,1.2%琼脂糖凝胶)分离之前,在95℃变性5分钟。通过生物补骨脂素交联的RNA种类将在凝胶中共迁移。双星号表示在Dbp4突变株中累积的超位移的U14-35S rRNA复合物。非生物补骨脂素交联的野生型RNA样品被用作背景对照。
点渍印迹分析以检测RNA上生物素化的补骨脂素的存在。根据制造商的说明,用化学发光核酸检测模块(Thermo Fisher Scientific)检测交联的RNA样品中生物素化的补骨脂素的存在。将1μg的RNA点涂在BiodyneTM B尼龙膜(Thermo Fisher Scientific)上,并且通过在80℃烘烤15分钟与膜交联。使用ChemiDocTM MP系统(BioRad)使膜可视化,并且使用软件Image J定量。
生物补骨脂素并入细胞RNA中的计算。每个阳性对照20mer寡核苷酸含有一个生物素分子。从20mer寡核苷酸和我们的点涂的交联的RNA的摩尔数、以及依据点渍印迹的20mer寡核苷酸的强度,我们可以估计补骨脂素在我们的RNA中的并入量。
HMGA1、OCT4和GAPDH的免疫印迹和qPCR分析。使用补充有1:200的蛋白酶抑制剂混合物集III(Merck)的RIPA缓冲液(150mM氯化钠、1.0%Triton X-100、0.5%脱氧胆酸钠、0.1%SDS、50mM Tris,pH 8.0)裂解人类H1 ES细胞和使用视黄酸(RA)分化5天的ES细胞。将细胞在4℃孵育20分钟,同时轻微振荡。然后,通过25G BD Precision Glide针(Becton,Dickinson and Company)使裂解物澄清总共6次,并且在4℃以12000rpm离心30分钟以沉淀不溶性级分。收集上清液,并且对于每个样品,用Bio-Rad蛋白测定染料试剂浓缩物(Bio-Rad Protein Assay Dye Reagent Concentrate)(Bio-Rad)归一化蛋白质水平。然后,将归一化的样品在12%十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)凝胶上进行尺寸分级分离,并且转移到硝化纤维素膜(Bio-Rad)上。将膜在PBST(137mM NaCl、2.7mM KCl、4.3mMNa2HPO4、1.47mM KH2PO4、0.1%吐温20)中的5%印迹级阻断剂中封闭,并且在4℃与一级抗体孵育过夜。洗涤膜,并且在室温与缀合有HRP的二级抗体孵育1小时。洗涤之后,将膜与ClarityTM Western ECL底物(Bio-Rad)孵育,并且用ChemiDocTM MP系统可视化。使用软件Image J对条带定量。下列抗体以所述稀释度使用:抗-HMGA1(cell signaling,#7777)1:50000、抗-Oct4抗体(Abcam,ab19857)1:10000、抗-GAPDH抗体(Merck,MAB374)1:50000、抗-小鼠IgG-HRP抗体(Santa Cruz,sc-2031)1:5000、以及抗-兔IgG-HRP抗体(Santa Cruz,sc-2313)1:5000。
使用Trizol试剂(Thermo Fisher Scientific)从人类ES细胞和RA分化细胞中提取全部RNA,并且根据制造商的说明,使用Brilliant II SYBR Green qRT-PCR 1-StepMaster Mix试剂盒进行qPCR分析。qPCR分析被归一化至肌动蛋白对照。
免疫荧光成像。将HeLa细胞在盖玻片上培养,并且用生物补骨脂素处理。用PBS冲洗活体处理的HeLa细胞一次,并且在室温用PBS中的4%多聚甲醛(Sigma)固定30min。将固定的细胞用PBS洗涤两次,并且通过用0.1%triton X-100(Sigma)在室温孵育30min进行透化。用PBS冲洗经透化的细胞一次,并且在室温在PBS中的8%FBS(Gibco)中封闭2小时。将封闭缓冲液中1:1000的CF488A抗生蛋白链菌素(Biotium)与细胞在室温孵育2小时。孵育之后,用PBS中的0.1%吐温20洗涤细胞,并且在室温用1:5000DAPI(Biotium)染色3min,并且用PBS洗涤三次。将制备的盖玻片转移到涂覆有Prolong Gold抗淬灭剂(Thermo Fisher)的载玻片上,并且在室温远离光干燥过夜。
通过下拉法和qPCR的分子间相互作用的验证。将10μg的经脱氧核糖核酸酶处理的补骨脂素交联的全部RNA在300μL的水中稀释。然后,将样品与100pM的对感兴趣的基因特异性的生物素化的探针在补充有Superase-in(1:200)的新鲜杂交缓冲液(750mM NaCl、1%SDS、50mM Tris-Cl pH 7.0、1mM EDTA、15%甲酰胺)中孵育,并且在37℃振荡孵育过夜。在探针杂交之后,100μL的
Figure GDA0003513466450000171
MyOneTM抗生蛋白链菌素C1磁珠被用于拉出RNA复合物。将磁珠用已经预先加温至37℃的洗涤缓冲液(0.1×NaCl和柠檬酸钠(SSC)、0.5%SDS)洗涤5次。通过与100μg的蛋白酶K(Thermo Scientific)在95μL的PK缓冲液(100mM NaCl、10mM TrisCl pH 7.0、1mM EDTA、0.5%SDS)中在50℃端到端振荡(end to end shaking)孵育45min,并且在95℃煮沸10分钟,从磁珠上洗脱RNA。通过使用TRIzol试剂回收洗脱的RNA,并且使用RNeasy MinElute纯化试剂盒(Qiagen)纯化。将回收的RNA在20μL的无核酸酶的水中洗脱,用254nm UV照射5min以逆转交联。随后将样品用于qPCR。抗-GFP寡核苷酸被用作阴性对照。
分子内相互作用的验证。将100μg的经脱氧核糖核酸酶处理的补骨脂素或DMSO交联的全部RNA用RNA片段化缓冲液(9mM MgCl2、225mM KCl和150mM Tris HCl(pH 8.3))在95℃片段化3min。片段化之后,使用6%TBE 8M脲凝胶尺寸分级分离RNA,并且切除对应于第100-300个碱基的RNA片段,并且在4℃洗脱过夜。在与分子间相互作用的下拉法相同的条件下,将5μg的RNA用于杂交。用于下拉法和qPCR的全部探针和qPCR引物序列被编译在表7中。
数据分析
计算流程的概述。通过使用snakemake工作流管理系统(版本3.4.1(Koster andRahmann,2012)),SPLASH流程自动化读序处理、定位(mapping)、相互作用检测和过滤。对于流程图,参见补充图3B。
人类转录物组。为了构建转录物组,我们从UCSC表浏览器下载了hg19 RefSeq基因的全部转录物。然后,我们基于其基因名称将同种型分组为基因,并且将最长的编码同种型当作每个基因的代表,或如果不存在,则将最长的非编码同种型当作每个基因的代表。为此,我们添加了人工精选的snoRNA版本、snRNA(从NCBI中提取)版本和tRNA(从UCSC表浏览器中提取)版本,并且还用resp代替完整的重复rRNA单元(U13369)。与使用的PDB结构匹配的单个rRNA序列(包含5S rRNA和间隔区)(参见下文)。然后,对这组序列进行重复数据删除Bbmap’s dedup.sh(options absorbcontainment=t minoverlappercent=11absorbc=f;http://sourceforge.net/projects/bbmap/)。如果任何不属于miRNA、rRNA、snoRNA、snRNA或tRNA的非编码输入的序列短于200bp,则将其标记为小的非编码RNA,否则被标记为lncRNA。
酵母转录物组。为了构建酵母转录物组,我们从UCSC表浏览器中提取酵母编码基因(sacCer3,sgdGene)的序列,并且基于Nagalakshmi等(Nagalakshmi et al.,2008)将UTR序列添加到转录物中。然后,我们补充了非编码基因的序列(包含从酵母属基因组数据库下载的rRNA、tRNA、snRNA、snoRNA和ncRNA)。然后,去除重复序列,以产生在此研究中使用的酵母转录物组。
测序读序的处理。用SeqPrep(版本1.0-7;https://github.com/jstjohn/SeqPrep)预处理读序,以去除衔接子并且将重叠的双端读序合并为高质量的单端读序。为了加速这个耗时的步骤,我们致力于分割FastQ文件来并行化处理。由于我们的双端读序中的大多数应该重叠,因此我们仅使用成功合并的双端读序用于进一步分析。用BWA MEM(版本0.7.12;以及arXiv:1303.3997v1)将合并的读序定位到转录物组上(参见上文)。我们调整了BWA的参数,使得最小长度为20的区是可检测的(-T 20;与默认值30相反)。经定位的读序被分类,并且用samtool(版本1.1)转换为BAM。然后,除第一个读序以外,我们去除了与相同起始坐标对齐并且具有相同CIGAR字符串的全部读序,所述字符串侵略性地过滤了潜在的PCR重复(Ramani et al.,2015)。
长程RNA相互作用的检测。为了检测RNA相互作用,我们浏览了BAM文件以寻找含有BWA MEM的分割比对(SA)标签的主要比对。然后,我们弃去相隔小于50bp的分割比对。这主要用作两个目的:1)因为碱基在序列中非常接近,并且因此在结构方面非常接近,因而这些在我们的基于PDB的评估(参见下文)中可能总是被评估为真,以及2)我们希望集中于长程RNA相互作用的检测。此外,我们弃去其中任一端被定位为反向互补(转录物组定位)或具有低于20的定位质量的相互作用对。后者有效地去除模糊定位的读序以及具有接近的第二最佳命中的比对(例如假基因)。
与剪接有关的假阳性相互作用的去除。为了应对由剪接事件引起的假阳性相互作用,我们使用程序STAr将来自转录物组定位的分割读序重新定位回人类基因组(hg19),并且去除任何完全跨越注释连接的读序,从而允许两端小于5bp的软裁剪(soft-clip)。运行STAR的参数是:--twopassMode Basic alignSplicedMateMapLminOverLmate 0.1--outSJfilterOverhangMin 10 6 6 6--outSJfilterCountUniqueMin 6 1 1 1--outSJfilterCountTotalMin 6 1 1 1--outSJfilterDistToOtherSJmin 5 0 5 0--alignSJDBoverhangMin 3--alignMatesGapMax 1000000--alignIntronMax 1000000--alignSJstitchMismatchNmax 5-1 5 5--outStd SAM--outSAMtype SAM--winAnchorMultimapNmax 9000--seedPerWindowNmax 1000--outSAMstrandField None--outSAMmultNmax 1--outMultimapperOrder Random--outSAMattributes All--outSAMprimaryFlag AllBestScore--outFilterMultimapScoreRange 0-outFilterMultimapNmax 9000--outFilterMismatchNmax 2--outFilterIntronMotifsNone--outFilterMatchNminOverLread 0.1--outFilterScoreMinOverLread 0.1-alignEndsTypeLocal”.--outSAMmultNmax 1--outMultimapperOrder Random--outSAMattributes All--outSAMprimaryFlag AllBestScore--outFilterMultimapScoreRange 0--outFilterMultimapNmax 9000--outFilterMismatchNmax 2--outFilterIntronMotifs None--outFilterMatchNminOverLread 0.1--outFilterScoreMinOverLread 0.1--。
从ENCODE计划数据库版本19下载连接信息(GRCh37.p13)。
核糖体RNA相互作用的评估。为了评估预测的rRNA-rRNA相互作用,我们使用人类80S核糖体(PDB 4V6X)(一种具有5埃分辨率的冷冻电镜(cryo-EM)结构)。每个相互作用对窗口被定位到PDB结构中具有最小3D距离的碱基组合上。对于每个碱基,我们计算其质心3D位置,并且如果碱基对各自的质心距离小于30埃,则将其视为真。
DMSO文库、补骨脂素文库和生物补骨脂素文库之间的灵敏度与特异性的比较。从Petrov等(Petrov et al.,2014)确定28S rRNA的真正碱基对。从Ramani等(Ramaniet al.,2015)获得RPL的结果,并且如其论文和所附的脚本中所描述的处理。在替代分析中省略平滑化步骤,以评估具有最小后处理的RPL。然后,在这两种情况下,将数据粗粒化成100个碱基窗口,用于与SPLASH直接比较。然后,通过变化阈值来获得接受者工作特征(ROC)曲线,高于所述阈值,RPL值被认为已经鉴别命中。类似地,我们变化SPLASH的阈值,系统地增加用于鉴别命中的截止点,同时仍然保留与至少两个复制和至少8的总读序具有共有区的要求。
评估生物补骨脂素的溶剂可及性。我们合并每个碱基配对核苷酸在测序读序中出现的频率,并且将相应的碱基对溶剂可及表面积(SASA)估计为鉴别的碱基对、其在前的碱基对和随后的碱基对中全部核苷酸的SASA的总和(即三个连续碱基对的总SASA)。使用FreeSASA评估核苷酸SASA。
snoRNA-rRNA相互作用的预测。用Plexy连同RNAplex(版本2.1.9)预测C/D框snoRNA和rRNA的潜在相互作用位点。为了包含较弱的相互作用,默认能量阈值被去除。每个预测的相互作用的相互作用界面和能量被记录用于可视化。
RNA相互作用的杂交能。用RNAduplex(ViennaRNA版本2.1.9)计算来自人类淋巴母细胞样细胞的1000个随机选择的非rRNA嵌合体的杂交能。对于每个观察到的相互作用,我们还通过打乱观察到的保留二核苷酸含量的序列来创建随机等同物。用高尔莫哥罗夫-斯米诺夫检验(Kolmogorov-Smirnov test)计算P值。
可视化。为了绘制经典的RNA 2D结构,我们使用VARNA(版本3.93)。使用R4RNA绘制弧形图。
依据环化评分对RNA类别的分类。通过取RNA中全部成对分子内相互作用的平均值并且除以RNA长度,计算每个mRNA的环化评分。使用威尔科克森秩和检验计算箱形图的P值。
RNA相互作用、翻译效率和衰变之间的关联。计算具有前20%和后20%的环化评分的mRNA的翻译效率(从核糖体图谱数据(Guo et al.,2010)获得)。对于分子内相互作用的位置与翻译的关联,计算相比于全部其他相互作用仅在5’UTR中具有相互作用的mRNA的翻译效率。使用小鼠ES和小鼠分化的核糖体图谱数据,从保守的mRNA估计人ES细胞和RA细胞的翻译效率。计算相比于遍及转录物具有仅存在于转录物的前三分之一和最后三分之一内的分子内相互作用的mRNA的mRNA衰变。
二维RNA相互作用物组图。为了将分子内或分子间mRNA-mRNA相互作用的全局视图生成为热图,我们分析了以每个被检测的转录物的起始/密码子周围为中心的5’UTR的最后200个碱基、CDS的前400个碱基和最后400个碱基以及3’UTR的前400个碱基。由于每个二进数代表沿着转录物的100个碱基,因此我们总共有遍及5i UTR、CDS和3’UTR区14个二进数。然后,我们计算了14×14矩阵上观察到的相互作用。
我们使用重新取样测试以访问矩阵内每个二进数中观察到的相互作用的有效值。具体地,对于每个相互作用,我们通过从与观察到的相互作用相同的转录物中随机挑选一对位置(由各位置处的非嵌合读序的覆盖度加权)来生成重新取样的相互作用。然后,我们在14×14(或10×10)矩阵中聚合全部重新取样相互作用。重新取样重复10000次。由此经验分布计算每个二进数中观察到的相互作用的数量的p值。富集值表示为log10(p值)。
不同细胞区室中的分子间mRNA相互作用的富集。我们从GEO数据库下载了登录号为GSM758560和GSM765386的GM12892淋巴母细胞样细胞系的细胞核和细胞质polyA+RNA-seq数据。使用从Ensembl下载的GTF文件(vGRCh37.75),通过STAR(v2.5.0)将原始读序定位到人类基因组(hg19)上,并且将FeatureCounts(v1.4.6)用于计算每个基因的原始读序的数量。我们取用四个样品中的两个中具有多于10个读序的基因,并且使用方差稳定化变换算法以使用DEseq2归一化遍及不同复制和条件的读序计数。通过比较细胞核样品和细胞质样品之间的归一化的读序计数,计算每个基因的细胞核与细胞质富集比。如果log2细胞核与细胞质富集比分别大于2或小于-2,则我们将基因定义为细胞核富集的或细胞质富集的。然后,我们使用重新取样以测试存在于相同细胞区室中的RNA之间的分子间相互作用(IMI)的富集的有效值。我们首先根据每个配偶体的细胞区室化对相互作用进行分组(如“细胞质RNA-细胞质RNA”和“细胞质RNA-细胞核RNA”)。然后,我们从全部表达的基因中取样相同数量的基因,这要求基因表达的分布(从非嵌合读序(其被定位而没有分割)估计,并且来源于SPLASH文库)与具有IMI的基因相似。重新取样重复10000次。将观察到的IMI的数量与来自每个细胞区室的重新取样基因集的IMI的数量进行比较,并且将观察到的IMI的相对等级相应地转换为富集p值。
分子间相互作用网络分析和与基因调控的相关性。通过使用快速贪婪算法(fast-greedy algorithm)从网络中排除全部未连接的边缘并且从网络中提取模块来构建mRNA-mRNA相互作用网络。通过提取基因表达、翻译效率和衰变率的数据集并且计算每个模块内全部基因对的成对皮尔逊相关性(Pearson correlation),我们计算了这些模块中的每个内mRNA基因对之间基因调控的相关性的有效值。然后,通过置换模块10000次来访问相关性的有效值。
相互作用模块的基因本体论(GO)富集分析。关于生物过程、分子功能和亚细胞组分,我们使用TopGO包(TopGO package)以获取酵母、淋巴母细胞样细胞、ES细胞和RA细胞中每个单独模块中基因的功能富集。将每个模块中的基因与具有检测到的分子间相互作用的全部基因进行比较。用TopGO中实施的“elim”算法计算富集的有效值水平。全部报告的富集术语基于0.05的错误发现率阈值。
结果
SPLASH方案有效地富集体内RNA-RNA杂交体
为了开发SPLASH,我们使用交联剂补骨脂素的生物素化版本(生物补骨脂素,图8A),以鉴别分子内和分子间RNA-RNA碱基配对。补骨脂素进入细胞并且插入碱基配对的核苷酸中(优先交联嘧啶,尤其是在UV 365nm下在T和U处)。然后,在经历邻位连接和转换为深度测序文库之前,使用抗生蛋白链菌素磁珠将交联的RNA提取、片段化并且富集交联区(图1A)。重要地,生物补骨脂素的使用允许在活细胞中保留RNA相互作用,类似于使用甲醛作为体内交联剂用于检测染色质免疫沉淀(ChIP)和染色质构象捕获实验(Hi-C)中的蛋白质-DNA相互作用和DNA-DNA相互作用。特别地,在UV 254nm下生物补骨脂素交联的可逆性使得在文库制备期间遍及连接的嵌合体的逆转录成为可能。生物补骨脂素上的生物素基团还允许在文库制备过程期间交联的相互作用位点的选择性富集,从而增加在非相互作用位点背景下成对相互作用的信号(图1A)。
虽然补骨脂素已经被用于在体内交联核苷酸,但是我们观察到生物补骨脂素向人类细胞内的进入是低的。为了增加生物补骨脂素的细胞摄取,我们用不同浓度的生物补骨脂素(在存在0.01%毛地黄皂甙(一种温和的去垢剂)的情况下)孵育细胞。如通过免疫荧光染色所确定的,用毛地黄皂甙处理人类细胞5min显著增加生物补骨脂素的进入(图8B)。我们证实了毛地黄皂甙的短暂处理不改变补骨脂素交联模式(图8C),并且滴定了在体内有效地交联RNA所花费的时间量(图8D)。由于RNA结构探测通常针对“单命中动力学(Single-hitKinetics)”,其中每个转录物具有很少的经修饰的分子,因此我们滴定了使用的生物补骨脂素的浓度,使得其在人类转录物组中以每150个碱基中大约一个的频率交联(图8E;实验程序)。尽管需要较高的浓度,但是生物补骨脂素也可以进入酵母和大肠杆菌并且在体内交联RNA(图8F,图8G)。我们证实了,生物补骨脂素可以在体内交联并且通过进行诺瑟印迹测定检测已知的RNA相互作用,以检测已知的RNA-RNA相互作用(如酵母中的U14-18S结合)(图8H)。
补骨脂素交联的可逆性是我们的文库制备过程的成功的关键,然而完全逆转交联通常在UV 254nm下花费约30min,从而在过程中显著地使RNA损伤。我们滴定了交联的RNA的UV 254nm暴露持续时间,并且确定了最大化逆转交联的量同时最小化UV损伤的条件(图9A,图9B)。由于文库制备过程通常涉及具有不同偏差的多个步骤,因此我们测试了两种不同的文库克隆方案,利用i)3’衔接子连接,随后是逆转录、cDNA环化和PCR(环化方案,图9F),以及ii)单独的5’衔接子连接和3’衔接子连接,随后是逆转录和PCR(RNA连接方案)(表1)。我们发现,相比于RNA连接方案,环化方案导致较少的瓶颈效应和更有效的嵌合读序的捕获,同时维持基于人类80S核糖体晶体结构的捕获真实嵌合体的相似的精确度(表1)。我们还确定了使得我们能够将交联的RNA片段化至~100个碱基而不丢失生物素基团的片段化条件(图9C)、以及使得我们能够生成具有低背景噪音的SPLASH文库的严格的连接条件和洗涤条件(图9D,图9E;实验程序)。
SPLASH计算流程以高特异性鉴别RNA相互作用
我们将SPLASH数据与强大的计算流程整合,所述计算流程被开发以精确地鉴别转录物组中的RNA-RNA相互作用。流程严格地去除PCR重复,合并双端读序,并且然后沿着人类转录物组和酵母转录物组将其分割定位,以鉴别表示RNA-RNA相互作用的嵌合读序(实验流程;图9G)。过滤嵌合读序的剪接假象,并且聚类以鉴别成对相互作用(实验程序)。此外,将连续的或间隔小于50个碱基的全部成对相互作用去除,以将分析集中于目前使用计算实验程序无法可靠预测的长程分子内相互作用和分子间相互作用(实验程序)。总体而言,我们的严格过滤保留了鉴别遍及不同转录物组的RNA-RNA相互作用的460万个嵌合读序(全部测序读序的0.4%)。所得到的相互作用跨越大范围的距离(从50个至5000个碱基),其中中值距离为300个碱基(图10A)。
为了评估灵敏度和精度,将SPLASH分析报告的分子内相互作用与人类80S核糖体的晶体结构进行比较。评价晶体结构中紧密空间邻近区表明,SPLASH预测在精度(75%)和灵敏度(78%)之间提供良好的平衡(
Figure GDA0003513466450000231
图1C;实验程序)。将大核糖体亚基的已知二级结构上的这些相互作用可视化突出了由SPLASH数据捕获的长程RNA相互作用的密集网络(图1B)。为了估计报告的相互作用中的错误发现率,我们将单独交联的人类总RNA和酵母总RNA以相等的量混合,以制备SPLASH文库。基于观察到的人类-酵母成对相互作用,我们估计了<3.7%的错误发现率,从而证实SPLASH分析提供对整体报告的错误相互作用的分数的良好控制(实验程序)。为了验证SPLASH相互作用是由补骨脂素/生物补骨脂素交联事件介导的,我们进行了不具有交联的文库、具有补骨脂素交联的文库和具有生物补骨脂素交联的文库(SPLASH)。正如预期的,由于SPLASH中通过抗生蛋白链菌素磁珠的交联位点的富集,相比于补骨脂素文库,用生物补骨脂素生成的文库显示出相似水平的高特异性和增加的灵敏度(图10B)。相反,非交联的文库显示出低的总体特异性(17%),从而证实补骨脂素/生物补骨脂素交联对于将相互作用的RNA配偶体保持紧密邻近以用于使正确的连接优先发生是必需的(图10B)。
为了进一步证实SPLASH嵌合体由于交联片段之间的连接事件富集而非随机背景连接,我们生成不具有连接酶的文库、具有连接酶的文库以及具有SPLASH中使用的连接酶的量的1/10的文库。不具有连接酶的文库显示出低水平的背景连接,表明大多数成对相互作用是由于通过生物补骨脂素交联实现的预期的邻位连接事件(表1,图10C)。此外,交联事件的频率与区的溶剂可及性之间的相关性分析证明,生物补骨脂素交联在很大程度上不依赖于溶剂可及性(图10D)。最后,针对最近发表的基于邻位连接的方法对SPLASH进行基准测试表明,SPLASH具有用于检测分子内相互作用的相似精度,同时检测明显更多的分子间相互作用(图10E,图10F)。
酵母RNA相互作用物组和人类RNA相互作用物组的总体结构
为了研究不同生物体中的RNA相互作用物组及其动力学,在人类细胞(包含Hela细胞、淋巴母细胞样细胞、人类胚胎干(ES)细胞和视黄酸(RA)分化细胞)的2-4个生物学重复上、以及野生型酿酒酵母和Prp43解旋酶突变酿酒酵母中进行SPLASH(表1,表2)。此外,我们对不同细胞系中的总RNA、poly(A)+富集的RNA群体和snoRNA富集的RNA群体进行测序,以全局性地和综合地捕获RNA-RNA相互作用。基于总共超过20亿个Illumina读序,我们鉴别了遍及不同细胞类型的>8000个分子间相互作用和>4000个分子内相互作用(表2)。我们观察到相同细胞系中生物复制之间的高度相关性(R=0.75-0.9),从而证实了SPLASH数据是可再现的(图11A)。总体而言,本研究中捕获了来自1311个基因的3497个分子内mRNA相互作用和84个lncRNA相互作用,从而为研究人类RNA结构和功能提供了丰富的资源(图2A)。分子间相互作用被发现是显著多种多样的且常见的,包含仅在人类细胞系中鉴别的990个mRNA-mRNA相互作用(图2B)。在数以千计的酵母分子内相互作用和分子间相互作用中捕获了相似的多样性,使得能够鉴别保守的人类-酵母相互作用特征(图11B,表3)。对于小于10的度,分子间相互作用网络的度分布被发现很符合幂律分布,但是伴随着具有许多具有大的度的节点的重尾(图11C)。
长程分子内RNA相互作用限定不同类别的功能性RNA
为了确定我们的鉴别的分子内相互作用是否是高度稳定的,我们计算了真实嵌合对与具有保留的二核苷酸含量的随机打乱的嵌合体之间的相互作用的能量。实际上,相比于打乱的集合,内部成对相互作用具有较低的碱基配对能量(p<10-6,KS检验,图12A),从而表明嵌合体可能是真实的。将SPLASH分子内相互作用与已知二级结构的RNA(包含酵母中的LSR1、SCR1和snR86 RNA)进行比较,进一步证实SPLASH相互作用与先前通过生物化学实验或交联实验发现的已知相互作用一致(图12B-12D)。我们还验证了酵母mRNA中的长程分子内相互作用,证明了我们的方法的再现性(图12E)。
为了确定不同类别的RNA形成长程成对相互作用的倾向是否存在差异,我们计算了“环化评分”,其是通过其长度归一化的转录物内的相互作用距离的平均值(图2C)。根据不同组的RNA的环化评分对其进行分类揭示了,rRNA和lncRNA倾向于形成比mRNA更远的相互作用(威尔科克森秩和检验,分别为p=0.0045和p=0.028,图2D)。rRNA中的长程相互作用可能有助于其复杂且高度结构化的构象。lncRNA的子集中的相似相互作用可以表明结构介导的功能,如作为骨架以招募不同的蛋白质因子用于细胞功能。
细胞内mRNA的结构组织可以影响其调控和功能。将从SPLASH推断的长程相互作用用于人类转录物组,我们沿着转录物构建了富集的相互作用位点的二维热图(图3A)。热图揭示了人类细胞中普通mRNA的高度模块化性质,其中5’非翻译区(UTR)、CDS和3’UTR中的碱基优先与相同域中的其他碱基相互作用,并且超出域边界的延伸发生在编码区的起始和终止处。序列组成被发现与观察到的模式不相关,其中mRNA起点附近的碱基具有非常低的嘧啶含量,但是高水平的补骨脂素交联(补骨脂素优先交联嘧啶;图12F)。沿着翻译起始密码子和终止密码子比对的分子内相互作用位点的集合基因分析也证实了mRNA起始附近的相互作用的富集(图3B)。
为了表征相互作用域对mRNA功能的影响,根据mRNA形成长程成对相互作用的倾向(环化评分)将其进行分组并且评估翻译效率。此分析揭示了,平均而言,相比于具有较长相互作用的mRNA,具有较短成对相互作用的mRNA被较低效率地翻译(图3C)。此外,根据转录物的成对相互作用的位置对其进行分类揭示了,仅在5’UTR中具有成对相互作用的mRNA倾向于被缓慢翻译,这与其中mRNA的5’末端阻断可以降低翻译效率的模型一致(图3D)。通过翻译效率对转录物进行分类以检测相关的相互作用模式揭示了两个附加特征。首先,有效翻译的mRNA倾向于具有跨越较长距离的嵌合体,所述嵌合体往往连接转录物的起点和终点(图3E),以支持用于核糖体再循环和有效mRNA翻译的环化模型(Wells et al.,1998)。其次,翻译不良的mRNA倾向于含有在转录物的起点附近聚类的短嵌合体(图3E),从而突出了具有5’末端相互作用的mRNA翻译不良。当mRNA基于其相互作用的位置以无偏的方式聚类时,获得了相似的结论(图12G、图12H)。总之,我们的数据表明了通过起始密码子附近的稳定结构的转录物组范围的翻译抑制作用,以及通过端对端环化增加的翻译效率。
mRNA衰变信息的分析揭示了mRNA结构对RNA稳定性的相似的影响(图3F)。相比于对照,具有限于5’末端的相互作用的基因展现出最快的衰变速率,从而表明3’末端的相互作用可能在RNA降解过程中阻断外来体复合物,并且强调结构在转录后基因调控中的重要性。
SPLASH揭示了新的rRNA-rRNA和snoRNA-RNA相互作用位点
补骨脂素插入碱基配对区(无论其是由相同的RNA链形成,还在形成在两条不同的RNA链之间)中,使得SPLASH能够询问分子内RNA相互作用和分子间RNA相互作用两者。正如预期的,SPLASH捕获了对应于5.8S-28S rRNA、以及U4-U6和U2-U6snRNA之间的充分表征的分子间相互作用。此外,SPLASH分析鉴别许多文献中已知的snoRNA-rRNA相互作用,从而验证了我们的方法的高灵敏度(图4A,图13A)。
SnoRNA是一类重要的非编码RNA,指导前核糖体RNA的成熟以形成功能性核糖体。虽然已经鉴别了一些snoRNA的结合区,但是人类核糖体中许多snoRNA-rRNA相互作用的位置仍然是难以捉摸的。最近,snoRNA-rRNA相互作用已经被猜测比先前理解的更广泛。然而,snoRNA靶标预测(尤其是对于与具有短互补延伸的rRNA结合的H/ACA snoRNA)仍然具有挑战性,并且实验策略(如CLASH)已经被主要应用于检测酵母中具有rRNA的C/D框snoRNA。
为了鉴别人类中全基因组范围的snoRNA-rRNA相互作用,对淋巴母细胞样细胞进行SPLASH。三甲基化snoRNA免疫沉淀文库以及深度测序的总RNA文库的分析鉴别了211个人类snoRNA-rRNA相互作用,对应于78个人类snoRNA(55个C/D框snoRNA和23个H/ACA snoRNA)(表4,实验程序)。基于人类snoRNA数据库,211个经鉴别的snoRNA-rRNA位点中的122个是新的,并且包含孤独基因snoRNA(如SNORA51(ACA51)和SNORD83)的靶位点。通过单独地进行5SrRNA、18S rRNA和28S rRNA的下拉法和snoRNA的qPCR,我们验证了以不同丰度捕获的三种新的snoRNA-rRNA相互作用。虽然SNORA32先前基于人类snoRNA数据库被认为仅与28S rRNA结合,但是我们鉴别并且验证了SNORA32与5S rRNA强有力地结合(图4B)。SNORD83a是一种孤独基因snoRNA,我们鉴别并且验证了其与18S rRNA结合(图4B)。我们还验证了孤独基因snoRNA ACA51与28S rRNA的弱结合(图13B),从而表明SPLASH数据即使在低嵌合读序计数下也是精确的。来自SPLASH的预测的snoRNA-rRNA相互作用位点也用snoRNA预测程序(PLEXY)整合以改进结合位点预测(图4C,图4D)。使用PLEXY,我们沿着28S rRNA将新的潜在U13-28S rRNA结合位点缩小至第4418-4424个碱基(图4D)。因此,将高通量实验数据与snoRNA预测算法结合可以便利新的snoRNA-rRNA相互作用的系统性、高分辨率的鉴别,以提高我们对核糖体生物发生的理解。
除人类snoRNA-rRNA相互作用以外,对野生型酵母和Prp43突变酵母的两个生物学复制的SPLASH分析鉴别了39个snoRNA(包含27个C/D框snoRNA和12个H/ACA snoRNA)的106个靶位点(表5)。例如,我们鉴别了snR61(一种C/D框snoRNA)的已知的靶位点以及25S rRNA上的两个新的结合位点(图5A)。通过PLEXY还预测了25S rRNA上在第2800-2900个碱基处的snR61交联位点,进一步改进此新位点的位置(图5B)。我们还鉴别了snR4 C/D框snoRNA的靶位点(其之前被认为是无活性的)。snR4-25S相互作用先前在CLASH数据中被报告为低置信度命中(在全部复制中被不可再现地发现)。在本文中,除了新的snR4-18S rRNA位点以外,我们独立地鉴别了与CLASH数据中相同的三个snR4-25S rRNA相互作用位点,以支持snR4-rRNA相互作用的存在(图5C,图5D,图13C)。我们还在全部4个生物学复制中鉴别了25S rRNA上的孤独基因C/D框snoRNA snR45的靶位点,从而表明snR45可能在25S rRNA成熟中起作用。
由于snoRNA-rRNA相互作用在与前体rRNA结合时被解旋酶去稳定化,因此过度表达解旋酶Prp43突变(prp43-T123A,图13D)的酵母细胞中的SPLASH分析被用于鉴别对于rRNA生物发生重要的附加的瞬时snoRNA-rRNA相互作用。必需的H/ACA框snR30先前被发现通过Rok1解旋酶从18S rRNA释放,并且对于35S裂解和18S rRNA前体的释放是必需的。在我们的分析中,我们在Prp43突变体中而非野生型中鉴别了snR30-18S rRNA相互作用(图5E),从而表明多个解旋酶可以在一个或多个相同的snoRNA底物上起作用以便利其从rRNA释放,或Prp43对于Rok1是必需的以从前核糖体中解开snR30。这与先前的报告(Dbp4p RNA解旋酶和Has1p RNA解旋酶两者对于从前核糖体释放U14都是必需的)是一致的。我们的顶级相互作用位点鉴别了高度可信的snoRNA-rRNA碱基对,相比于野生型细胞,所述snoRNA-rRNA碱基对优先在Prp43突变细胞中累积(图5F)。这些累积的snoRNA(包含snR59、snR60、snR41和snR55)中的许多先前被发现与Prp43直接结合,从而支持Prp43对于其释放是重要的假设。SPLASH还为Prp43突变酵母中的snR189、snR59、snR40和snR69的新的rRNA靶位点提供了证据,从而显著地扩展了snoRNA靶向和再循环中涉及的相互作用列表。
mRNA-mRNA相互作用限定共调控基因的模块
除snoRNA-rRNA相互作用以外,SPLASH分析鉴别近千种mRNA-mRNA相互作用。我们计算了这些分子间mRNA相互作用的折叠能,以确定其是否可能是稳定的。分子间成对相互作用不仅相比于具有保留的二核苷酸含量的随机打乱的嵌合体,展现出较低的折叠能(相比于-21.85kcal/mol,中值=-27.2kcal/mol,KS检验,p<10-15),而且相比于分子内mRNA相互作用(中值=-19.7kcal/mol),展现出较低的折叠能量,从而表明其可能是甚至更稳定的(图14B)。为了估计分子间RNA相互作用预测中的真阳性率,我们通过使用qPCR用实验方法测试了它们,以确定补骨脂素交联和寡核苷酸下拉法之后相互作用配偶体的富集(图6A,图6B;图14A)。总体而言,13个相互作用对中的12个被验证,从而表明来自SPLASH分析的分子间mRNA-mRNA预测的高再现性和精度(92%)。
为了研究沿着mRNA的分子间相互作用的分布,我们根据其翻译起始密码子和终止密码子在比对转录物之后绘制了沿着人类mRNA长度的相互作用密度。有趣地,大多数分子间相互作用也发生在转录物的起点附近(图14C)。然而,与分子内相互作用(其中RNA相互作用倾向于在相同域内发生)不同,分子间相互作用经常涉及将一个mRNA的起点与沿着第二个mRNA的另一个远侧区结合(图6C)。作为结果,分子间2D相互作用图显示遍及转录物域的更加广泛的相互作用模式,并且似乎是较低模块化的。
人类RNA相互作用物组的网络分析鉴别了主要的mRNA相互作用簇,由于具有RNA结合、代谢和翻译性质的基因而被强有力地富集(图6D,表6)。基于成对相互作用的密度的人类RNA相互作用物组的分层聚类鉴别了9个模块,从而显示出对于具有确定功能和遍及模块的亚细胞定位的基因的明显富集(图6E,表6)。我们观察到,mRNA倾向于与相同细胞区室中的其他mRNA相互作用(p<0.05,图6F),从而证实了物理邻近对于驱动彼此之间的分子间相互作用是必要的。我们还观察到,mRNA模块中的转录物可以在其基因调控中协调。例如,这在模块3(一大组翻译有关的基因)(其展现出对于关联的翻译效率的富集)中以及在模块1(一组RNA结合基因)(相比于对照,其显示出对于经协调的衰变率的富集)中被观察到(图14D,图14E)。这些观察结果突出了分子间mRNA相互作用作为用于协调细胞内转录后基因调控的潜在机制的作用,其中相互作用模块用于在对于RNA相互作用的富集方面改进细胞区室。
除人类细胞中RNA相互作用物组的静态图像以外,RNA相互作用物组在不同细胞状态过程中的动力学和重新连接的程度是不清楚的。为了调查研究控制细胞多能性的RNA调控网络,我们在人类ES细胞中以及在视黄酸(RA)分化细胞中进行了SPLASH。全局性地,ES细胞和RA细胞的RNA相互作用的分子内模式是高度模块化的(图14F,图14G),类似于淋巴母细胞样细胞,表明mRNA分子内相互作用的模块化模式代表不同人类细胞类型中的大多数RNA。基于我们先前的观察结果(相比于具有低环化评分的转录物,具有高环化评分的转录物倾向于被更好地翻译),我们假设,经历构象改变的mRNA可以具有在翻译效率方面的相应的改变。为了测试这个,我们计算了ES细胞和RA细胞两者中全部表达良好的基因的环化评分,并且鉴别了ES细胞中具有高环化评分的mRNA和RA细胞中具有低环化评分的mRNA,反之亦然。有趣地,从ES细胞中具有高环化评分转变为RA细胞中低环化评分的mRNA显示出翻译效率的相应减小,反之亦然(图7A)。这再次证实了所述假设(构象改变可以作为在细胞状态改变期间控制翻译效率的潜在机制)。染色质基因中的一种(高迁移率族1,HMGA1)在RA分化期间展现出环化评分和翻译效率的显著减小,这与其在维持ES细胞多能性中的关键作用一致(Shah et al.,2012)(图7B)。使用免疫印迹和qPCR分析的蛋白质和mRNA定量显示,HMGA1蛋白水平在5天的分化之后减小,然而其mRNA水平不减小(图7C,图7D)。此外,通过小鼠ES细胞和分化细胞中的核糖体图谱测量的翻译效率显示出细胞分化时HMGA1翻译效率的相应减小(图14H),从而加强了结构重排和翻译之间的关联。
ES细胞和RA细胞中分子间相互作用物组网络的分析揭示了,尽管相似数量的检测到的mRNA(ES,277个基因和402个相互作用,RA,193个基因和180个相互作用;图7E,图7F),但是相比于RA细胞,在ES细胞中,mRNA被更高程度地彼此互相连接。ES细胞和RA细胞中相互作用RNA的模块分析进一步证明,当相比于RA细胞模块时,ES细胞模块之间的RNA相互作用中的较高程度的互相连接性(图7G,图7H;表6)。为了确定ES细胞相互作用物组中的哪些模块在分化过程中被破坏,我们计算了在RA分化时从每个模块解离的基因的数量。我们观察到,对于染色质重塑过程富集的模块3在细胞分化过程中被破坏(p=0.0088),与染色质重塑在维持多能性中的重要性一致。
讨论
高通量测序的出现已经使得我们能够获得遍及不同转录物组的大量的序列信息。然而,转录物组中的信息不被局限于其线性序列,并且可以在分子内RNA相互作用和分子间RNA相互作用中被编码。因此,研究RNA分子如何与自身以及与其他配对是理解其功能的关键。SPLASH用于定位成对RNA相互作用的开发和应用已经使得能够在多种人类细胞类型和酵母细胞类型中生成转录物组范围的图,从而提供转录物如何在分子间和分子内组织以影响基因调控的全局视图。其在不同细胞状态中的应用还提供了动态相互作用物组的视图以及在人类ES细胞分化过程中其重塑的功能影响。
SPLASH数据的分析鉴别了人类相互作用物组中的数个关键特征,包含非编码RNA形成比mRNA更长范围的相互作用的倾向,以及对于mRNA采用其中UTR倾向于与其自身以及与附近的编码序列相互作用的模块化配置。有趣地,我们没有在分子间mRNA-mRNA相互作用中看到这种模块化模式,其中相互作用分布遍及整个转录物。需要后续实验以测试此观察结果的各种假设,包含翻译在维持mRNA模块性中的作用。此外,(i)起始密码子附近的密集RNA相互作用用于抑制翻译,(ii)长程端对端相互作用用于促进有效翻译,以及(iii)3’末端附近的密集相互作用用于抑制mRNA衰变的作用值得进一步调查研究。总体而言,我们的结果提供了转录物的结构组织可以在基因调控中起至关重要的作用,并且结构组织的改变以调控基因表达可能比先前预期的更广泛的证据。
在分子间,我们在人类细胞和酵母细胞中鉴别了数以千计的RNA-RNA相互作用(包含mRNA-rRNA相互作用、snoRNA-rRNA相互作用、mRNA-mRNA相互作用和mRNA-lncRNA相互作用)。我们的相互作用中的大多数是mRNA-rRNA相互作用,我们怀疑这是在翻译过程中捕获mRNA的结果。snoRNA-rRNA相互作用对于核糖体成熟是关键性的,并且snoRNA丰度的不当调控已经与疾病(如癌症)有关(Mannoor et al.,2012)。预测snoRNA-rRNA靶标(特别是对于H/ACA snoRNA)可能是具有挑战性的。在本工作中,我们检测了78个人类snoRNA(55个C/D框snoRNA和23个H/ACA snoRNA)以及39个酵母snoRNA(27个C/D框snoRNA和12个H/ACAsnoRNA)的现有的靶位点和新的靶位点。因此,人类数据集和酵母数据集之间、以及实验预测和计算预测(in silico prediction)之间的重叠可以被用于系统性地改进和优先化snoRNA-rRNA相互作用以用于进一步验证和表征。在酵母中,在靶标结合之后,至少19个解旋酶参与snoRNA的再循环。我们在不存在Prp43解旋酶的情况下稳定化的snoRNA-rRNA相互作用的鉴别突出了用于获得关于参与snoRNA释放和核糖体生物发生的其他解旋酶的附加的机制洞察的途径。
全基因组RNA相互作用网络的绘制显示出,基于相互作用网络中的连接性在模块中组织mRNA,并且相同模块中的mRNA富集特定功能和亚细胞定位。这些结果表明,含有相似功能的基因的RNA相互作用模块可以是组织结构以协调翻译和衰变,并且作为基因调控的机制。人类ES和RA相互作用网络还显示出,体内大的RNA构象改变与翻译效率的相应改变相关,表明(i)构象改变比先前理解的更广泛,以及(ii)其能够作为ES分化过程中翻译改变的潜在机制。我们还观察到,RNA相互作用物组在分化时变得较稀疏(其中在分化细胞中较少的mRNA彼此相互作用),并且染色质重塑相关模块在分化过程中额外损失。破坏这些模块中的个体相互作用的进一步的功能研究可以帮助理解这些模块的稳健性以及分化过程中涉及的关键相互作用。
总结
总之,SPLASH扩展了我们对真核转录物组的结构组织的理解,并且有助于明确RNA如何在基因调控和核糖体生物发生中与自身以及其他RNA相互作用的原理。除酵母细胞和人类细胞以外,SPLASH适用于其他生物体(如大肠杆菌),以在不同的细胞条件下询问RNA相互作用。与全基因组二级结构绘制和RNA结构建模结合,SPLASH数据可以有助于用体内信息改进我们当前的RNA结构的模型。SPLASH还可以与分子间RNA相互作用预测工具(如snoRNA预测程序)结合,以提高这些预测的精确度。富集特定RNA级分的技术可以与SPLASH结合以进一步研究稀有RNA。我们预期,使用SPLASH的今后的研究将继续阐明遍及不同生物体的细胞系统中的RNA相互作用的复杂性和动力学。
Figure GDA0003513466450000311
Figure GDA0003513466450000321
表3.常见的人类-人类和人类酵母相互作用的列表
Figure GDA0003513466450000331
Figure GDA0003513466450000341
Figure GDA0003513466450000351
Figure GDA0003513466450000361
Figure GDA0003513466450000371
Figure GDA0003513466450000381
Figure GDA0003513466450000391
Figure GDA0003513466450000401
Figure GDA0003513466450000411
Figure GDA0003513466450000421
Figure GDA0003513466450000431
表4.淋巴母细胞样细胞snoRNA靶位点的列表
Figure GDA0003513466450000441
Figure GDA0003513466450000451
Figure GDA0003513466450000461
Figure GDA0003513466450000471
Figure GDA0003513466450000481
表5.酵母snoRNA靶位点的列表
Figure GDA0003513466450000491
Figure GDA0003513466450000501
Figure GDA0003513466450000511
Figure GDA0003513466450000521
Figure GDA0003513466450000531
Figure GDA0003513466450000541
Figure GDA0003513466450000551
Figure GDA0003513466450000561
Figure GDA0003513466450000571
表7:验证中使用的探针和qPCR引物
Figure GDA0003513466450000581
Figure GDA0003513466450000591
Figure GDA0003513466450000601
序列表
<110> 科技研究局
<120> 核糖核酸(RNA)相互作用
<130> 5001P/WO
<150> SG10201603786V
<151> 2016-05-12
<160> 74
<170> PatentIn version 3.5
<210> 1
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 1
ctgtaggcac catcaat 17
<210> 2
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<220>
<221> iSp18
<222> (49)..(50)
<223> iSp18位置
<220>
<221> iSp18
<222> (55)..(56)
<223> iSp18位置
<400> 2
agatcggaag agcgtcgtgt agggaaagag tgtagatctc ggtggtcgcc actcattcag 60
acgtgtgctc ttccgatcta ttgatggtgc ctacag 96
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 3
ctggcaggat caaccaggta 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 4
gggcggtggc tcgcctcgcg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 5
tgacccgcac ttactgggaa 20
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 6
aatgatcctt ccgcaggttc a 21
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 7
acgtctgatc tgaggtcgcg 20
<210> 8
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 8
tggtccgtgt ttcaagacgg gt 22
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 9
caagacctct aatcattcgc tt 22
<210> 10
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 10
tgtcgagggc tgactttcaa t 21
<210> 11
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 11
tgcttagctt ccgagatcag a 21
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 12
aagcctacag cacccggtat t 21
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 13
gtaagaacac agcctgtggt aag 23
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 14
tcctctttct atacagtcag 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 15
atatggggta ggtttactct 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 16
gaggaaaagc gaagcgaggc 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 17
gcgaatgctt gtggaatgta 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 18
aacttgatcc aacctctttg 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 19
ggcaaacccg ttgcgaaaaa 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 20
tagttttcac gacacctgtg 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 21
accactgatt aagagtgggg 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 22
acatgatctg ggtcatcttc 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 23
ggatagcaca gcctggatag 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 24
atctcttgct cgaagtccag 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 25
tcattgccaa tggtgatgac 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 26
ctcaggagga gcaatgatct 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 27
cacattgtga actttggggg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 28
gacttcctgt aacaacgcat 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 29
gtctcaagtc agtgtacagg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 30
acccatgttt agttaattat 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 31
tcgacatgac cgataacgac 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 32
accaccacac ttgtaaatca 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 33
cacggattat ttgcctgatt 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 34
attttgcgta acctattcgc 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 35
ttagagggac aagtggcgtt 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 36
ggacatctaa gggcatcaca 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 37
gagaactttg aaggccgaag 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 38
catctctcag gaccgactga 20
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 39
gcgcccgatc tcgtctgatc tc 22
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 40
caggcggtct cccatccaag t 21
<210> 41
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 41
caggctgtgt tcttacactg ac 22
<210> 42
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 42
atgttccccc attcacaata ca 22
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 43
ggtcattacc aaggctttta g 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 44
gcagatagaa aacctactgg g 21
<210> 45
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 45
tcagagtgag cgctgggtac ag 22
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 46
ggaaggcagt agagaatggt 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 47
cgatatggct gagatcgaga 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 48
ctttggaagg cagtggattt 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 49
ctgtcaagga tgttcgtcgt 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 50
cttatttggc ctggatggtt 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 51
tcgcaaagga tctccttcat 20
<210> 52
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 52
ccaggcgttt cttcttgtg 19
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 53
actctgcatt ctcgcttcct 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 54
ctcgtttgta cccgttgatg 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 55
tggtatcgtg gaaggactca 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 56
ccagtagagg cagggatgat 20
<210> 57
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 57
agagaggcat cctcaccct 19
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 58
cacacgcagc tcattgtaga 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 59
gaaggaggag ctgctgaaac 20
<210> 60
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 60
tcggatctta gagagcttgg a 21
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 61
gactttgtca cagcccaaga 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 62
caagcaagca gaatttggaa 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 63
gaatcagaaa gcggtggatt 20
<210> 64
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 64
accagaccag ggatgagtg 19
<210> 65
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 65
catgggtaaa gagaagtctc aca 23
<210> 66
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 66
ggttctcttg tcaataccac ca 22
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 67
gattcgctgt cagagacatg a 21
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 68
cagccttggt aaccttagcg 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 69
gagaaggatg tggtccgagt 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 70
gtgcatagtc gctgcttgat 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 71
gctggtaggg agtcagaagg 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 72
ttggtttcct tcctggagtt 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 73
tcaagaaggt ggtgaagcag 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 自定义序列
<400> 74
cgctgttgaa gtcagaggag 20

Claims (28)

1.一种分析核糖核酸-核糖核酸(RNA-RNA)相互作用的方法,所述方法包括:
a.使用生物素标记的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
b.将所述交联的RNA分子和/或交联的RNA分子对片段化以产生交联的RNA分子和/或交联的RNA分子对的多个片段;
c.使用所述生物素提取从前述步骤获得所述交联的RNA分子和/或所述交联的RNA分子对;
d.连接一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
e.逆转所述剂与所述RNA分子和/或RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
f.通过对所述一个或多个连接的RNA嵌合体分子或所述一个或多个连接的RNA嵌合体对测序来制备序列文库;以及
g.分析所述序列文库以确定RNA-RNA相互作用。
2.根据权利要求1所述的方法,其中所述RNA存在于细胞中,并且使用所述生物素标记的可逆交联剂的所述交联涉及使用细胞摄取剂。
3.根据权利要求2所述的方法,其中所述细胞摄取剂包括去垢剂。
4.根据权利要求1-3中任一项所述的方法,其中c部分在b部分之前进行。
5.根据权利要求1-4中任一项所述的方法,其中所述交联剂包括呋喃并香豆素化合物。
6.根据权利要求5所述的方法,其中所述交联剂包括补骨脂素。
7.根据权利要求1-6中任一项所述的方法,其中所述交联剂的所述生物素包括结合对的第一构件,所述结合对选自生物素/抗生蛋白链菌素。
8.根据权利要求1-7中任一项的方法,其中使一个或多个所述RNA分子与交联剂交联以产生一个或多个交联的RNA分子的步骤使用波长在约300nm至约400nm范围内的紫外线照射进行。
9.根据权利要求1-8中任一项所述的方法,其中逆转一个或多个交联连接的RNA分子的交联的步骤使用波长在约200nm至不超过约300nm范围内的紫外线照射进行。
10.根据权利要求1-9中任一项所述的方法,其中通过对所述连接的RNA嵌合体分子或连接的RNA嵌合体对测序来制备序列文库的步骤包括下列中的至少一种或更多种的使用:衔接子连接、逆转录、cDNA环化或聚合酶链反应(PCR)。
11.根据权利要求1-10中任一项所述的方法,其中将所述交联的RNA分子和/或交联的RNA分子对片段化以产生多个片段的步骤包括产生在长度上具有在100个至500个碱基对范围内的平均尺寸的片段。
12.根据权利要求1-11中任一项所述的方法,其中使用的交联剂的浓度为在每150个碱基中的一个碱基处发生交联。
13.根据权利要求1-12中任一项所述的方法,其中连续的成对相互作用或由少于50个碱基间隔的成对相互作用被去除,以将分析集中在长程分子内相互作用和分子间相互作用上。
14.根据权利要求1-13中任一项所述的方法,其中所述RNA分子和/或所述RNA分子对中的至少一个构件被归于一个“环化评分”,所述“环化评分”被定义为每个分子内的平均碱基对相互作用距离,通过所述RNA分子的长度或所述RNA分子对的所述构件的长度归一化。
15.根据权利要求14所述的方法,其中所述RNA分子和/或所述RNA分子对的所述至少一个构件根据所述RNA分子和/或所述RNA分子对的所述至少一个构件的“环化评分”被分为组。
16.根据权利要求2-14中任一项所述的方法,其中所述细胞是哺乳动物的、人类的、细菌的或酵母。
17.一种用于分析核糖核酸-核糖核酸(RNA-RNA)相互作用的试剂盒,所述试剂盒包括:
生物素标记的可逆交联剂,所述生物素标记的可逆交联剂用于使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸可逆地交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
片段化缓冲液,所述片段化缓冲液用于将所述交联的RNA分子和/或交联的RNA分子对片段化,以产生多个片段;
RNA连接酶,所述RNA连接酶用于连接一个或多个交联的RNA片段,以产生交联连接的RNA嵌合体;
所述剂上的所述生物素的结合配偶体;以及
可选地,关于如何使用所述试剂盒的说明。
18.根据权利要求17所述的试剂盒,所述试剂盒还包括用于对所述交联连接的RNA嵌合体测序以制备序列文库的试剂。
19.根据权利要求18所述的试剂盒,其中用于对所述连接的RNA嵌合体测序的所述试剂包括下列中的至少一种:RNA连接酶、逆转录引物和DNA聚合酶。
20.根据权利要求17-19中任一项所述的试剂盒,其中所述交联剂包括呋喃并香豆素化合物。
21.根据权利要求20所述的试剂盒,其中所述交联剂包括补骨脂素。
22.根据权利要求17-21中任一项所述的试剂盒,其中所述交联剂的所述生物素包括结合对的第一构件,所述结合对选自生物素/抗生蛋白链菌素。
23.根据权利要求22所述的试剂盒,其中所述结合配偶体是结合对的另一个构件,所述结合对选自生物素/抗生蛋白链菌素。
24.根据权利要求17-23中任一项所述的试剂盒,所述试剂盒还包括去垢剂,以便利细胞摄取所述交联剂到细胞中。
25.根据权利要求17-24中任一项所述的试剂盒,所述试剂盒用于通过在来自受试者的细胞样品中分析RNA-RNA相互作用获得所述受试者的临床现象的方法中使用。
26.根据权利要求25所述的试剂盒,其中获得所述受试者的临床现象的步骤包括下列中的至少一个:诊断所述受试者的临床病况、预测所述受试者患有临床病况的风险、筛查所述受试者对于特定治疗的适合性、和确定候选药物对所述受试者的功效。
27.一种用于非诊断和非治疗目的的研究受试者的方法,所述方法包括:
a.从所述受试者获得细胞样品;
b.使用加标签的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
c.将所述交联的RNA分子和/或交联的RNA分子对片段化以产生多个片段,所述多个片段包括至少一个交联的RNA片段;
d.使用所述标签从所述多个片段中提取一个或多个所述交联的RNA片段;
e.连接所述一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
f.逆转所述剂与所述RNA分子和/或RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
g.通过对所述一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;
h.分析所述序列文库以确定所述细胞样品中的RNA相互作用;以及
i.将确定的RNA相互作用与一组预先存在的数据进行比较,以将一个临床现象归于所述受试者。
28.一种药物发现方法,所述方法包括:
a.将RNA暴露于药物;
b.使用生物素标记的可逆交联剂使至少一个RNA分子和/或至少一对RNA分子的碱基配对核苷酸交联,以产生至少一个交联的RNA分子和/或至少一个交联的RNA分子对;
c.将所述交联的RNA分子和/或交联的RNA分子对片段化以产生交联的RNA分子和/或交联的RNA分子对的多个片段;
d.使用所述生物素提取从前述步骤获得所述交联的RNA分子和/或所述交联的RNA分子对;
e.连接所述一个或多个所述交联的RNA片段,以产生一个或多个交联连接的RNA嵌合体;
f.逆转所述剂与所述RNA分子和/或RNA分子对的交联,以产生一个或多个连接的RNA嵌合体分子和/或一个或多个连接的RNA嵌合体对;
g.通过对所述一个或多个连接的RNA嵌合体分子或一个或多个连接的RNA嵌合体对测序来制备序列文库;
h.分析所述序列文库以确定RNA-RNA相互作用;以及
i.基于确定的RNA-RNA相互作用将一个功效评分归于所述药物。
CN201780043464.2A 2016-05-12 2017-05-12 核糖核酸(rna)相互作用 Active CN109477132B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201603786V 2016-05-12
SG10201603786V 2016-05-12
PCT/SG2017/050254 WO2017196264A1 (en) 2016-05-12 2017-05-12 Ribonucleic acid (rna) interactions

Publications (2)

Publication Number Publication Date
CN109477132A CN109477132A (zh) 2019-03-15
CN109477132B true CN109477132B (zh) 2022-05-10

Family

ID=60267460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780043464.2A Active CN109477132B (zh) 2016-05-12 2017-05-12 核糖核酸(rna)相互作用

Country Status (5)

Country Link
US (1) US11597968B2 (zh)
EP (1) EP3455379B1 (zh)
CN (1) CN109477132B (zh)
SG (1) SG11201809996QA (zh)
WO (1) WO2017196264A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201809996QA (en) 2016-05-12 2018-12-28 Agency Science Tech & Res Ribonucleic acid (rna) interactions
US11104941B2 (en) * 2018-09-28 2021-08-31 Bioo Scientific Corporation 5′ adapter comprising an internal 5′-5′ linkage
WO2020167811A1 (en) * 2019-02-12 2020-08-20 The Scripps Research Institute A cross-linking approach to map small molecule-rna binding sites in cells
CN111909991B (zh) * 2019-05-09 2021-08-03 中国科学院生物物理研究所 一种捕获rna原位高级结构及相互作用的方法
CN110205365B (zh) * 2019-07-02 2023-07-25 中山大学孙逸仙纪念医院 一种高效研究rna相互作用组的高通量测序方法及其应用
CN110567788B (zh) * 2019-09-20 2022-02-11 北京蛋白质组研究中心 一种rna-蛋白质复合物的富集和鉴定方法
CN113174429B (zh) * 2021-04-25 2022-04-29 中国人民解放军军事科学院军事医学研究院 一种基于邻位连接的检测rna病毒高级结构的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175732A1 (en) 2002-11-15 2004-09-09 Rana Tariq M. Identification of micrornas and their targets
US8071296B2 (en) 2006-03-13 2011-12-06 Agency For Science, Technology And Research Nucleic acid interaction analysis
WO2014152397A2 (en) * 2013-03-14 2014-09-25 The Broad Institute, Inc. Selective purification of rna and rna-bound molecular complexes
US20160040218A1 (en) * 2013-03-14 2016-02-11 The Broad Institute, Inc. Selective Purification of RNA and RNA-Bound Molecular Complexes
US9828600B2 (en) * 2013-09-20 2017-11-28 University Of Massachusetts Compositions and methods for constructing cDNA libraries that allow for mapping the 5′ and 3′ ends of RNAs
JP2017529104A (ja) 2014-09-22 2017-10-05 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニアThe Regents of the University of California Rnaスティッチシーケンシング:細胞におけるrna:rna相互作用の直接マッピングのための解析
SG11201809996QA (en) 2016-05-12 2018-12-28 Agency Science Tech & Res Ribonucleic acid (rna) interactions

Also Published As

Publication number Publication date
SG11201809996QA (en) 2018-12-28
WO2017196264A1 (en) 2017-11-16
US20190284622A1 (en) 2019-09-19
US11597968B2 (en) 2023-03-07
EP3455379B1 (en) 2023-07-05
CN109477132A (zh) 2019-03-15
EP3455379A1 (en) 2019-03-20
EP3455379A4 (en) 2019-05-22

Similar Documents

Publication Publication Date Title
CN109477132B (zh) 核糖核酸(rna)相互作用
Aw et al. In vivo mapping of eukaryotic RNA interactomes reveals principles of higher-order organization and regulation
Sun et al. Principles and innovative technologies for decrypting noncoding RNAs: from discovery and functional prediction to clinical application
Chujo et al. Unusual semi‐extractability as a hallmark of nuclear body‐associated architectural noncoding RNA s
Kristensen et al. The biogenesis, biology and characterization of circular RNAs
Kouno et al. C1 CAGE detects transcription start sites and enhancer activity at single-cell resolution
Krebs et al. Genome-wide single-molecule footprinting reveals high RNA polymerase II turnover at paused promoters
Nguyen et al. Mapping RNA–RNA interactome and RNA structure in vivo by MARIO
McDonel et al. Approaches for understanding the mechanisms of long noncoding RNA regulation of gene expression
Lu et al. Structural modularity of the XIST ribonucleoprotein complex
Zhu et al. The features and regulation of co-transcriptional splicing in Arabidopsis
Zhang et al. Identification and characterization of a class of MALAT1-like genomic loci
Li et al. Characterization of human salivary extracellular RNA by next-generation sequencing
Barra et al. Probing long non-coding RNA-protein interactions
CN107109698B (zh) Rna stitch测序:用于直接映射细胞中rna:rna相互作用的测定
Beltran et al. Integrator is recruited to promoter‐proximally paused RNA Pol II to generate Caenorhabditis elegans piRNA precursors
Machyna et al. Catching RNAs on chromatin using hybridization capture methods
CN111979307B (zh) 用于检测基因融合的靶向测序方法
Cao et al. Global in situ profiling of RNA-RNA spatial interactions with RIC-seq
JP2023547394A (ja) オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法
JP2013513373A (ja) Rna分析方法
US20110269647A1 (en) Method
US11898200B2 (en) Method for detecting single strand breaks in DNA
Komatsu et al. UPA-seq: prediction of functional lncRNAs using differential sensitivity to UV crosslinking
Sharma et al. Decryption of sequence, structure, and functional features of SINE repeat elements in SINEUP non-coding RNA-mediated post-transcriptional gene regulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant