CN115038710A

CN115038710A - 基于结构的靶向rna发夹环的治疗剂的设计

Info

Publication number: CN115038710A
Application number: CN202080093268.8A
Authority: CN
Inventors: F.郭; G.肖夫纳
Original assignee: University of California
Current assignee: University of California
Priority date: 2019-11-19
Filing date: 2020-11-19
Publication date: 2022-09-09
Also published as: JP2023501749A; EP4061822A4; EP4061822A1; WO2021102153A1; US20230002825A1; JP7436075B2

Abstract

本发明提供了可以用于简单且快速地确定RNA发夹环及其与抑制剂的复合物的三维结构的方法和材料。支架RNA，来自假乙醇热厌氧杆状菌(Thermoanaerobacter pseudethanolicus)的YdaO型c‑di‑AMP核糖开关，很容易形成具有直径超过

的大腔的晶体。可以将感兴趣的发夹工程化改造到该RNA的P2茎中，以便将发夹容纳在腔中。然后使融合RNA结晶，并且可以使用X射线或电子晶体学确定结构。本发明的实施方案可以用于鉴定结合发夹环以便例如引起治疗和其他生物活性的化合物。

Description

基于结构的靶向RNA发夹环的治疗剂的设计

对相关申请的交叉引用

本申请要求根据35U.S.C.第119(e)节的2019年11月19日提交并且题为“基于结构的靶向RNA发夹环的治疗剂的设计”的共同未决和共同转让的美国临时专利申请序列号62/937,657的权益，该申请通过引用并入本文。

政府支持声明

本发明是在政府支持下完成的，资助号为1616265，由美国国家科学基金会授予。政府对本发明享有一定的权利。

技术领域

本发明涉及用于确定RNA发夹环的三维结构的方法和材料。

背景技术

RNA分子对于许多疾病，诸如癌症和RNA病毒感染的发展至关重要。为此，RNA分子是极好的治疗靶标。在这种情况下，几乎所有的RNA形成对其功能至关重要的发夹二级结构。因此，有必要了解这些结构以促进靶向这些分子的治疗剂的识别和设计。然而，检查RNA的常规方法，诸如RNA干扰和反义寡核苷酸，是有限的，并且避开了强结构。虽然常规技术可以提供一些关于RNA结构的信息，但这些技术的局限性使得RNA发夹环对于治疗性抑制剂设计中来说是不受重视的靶标。

该技术领域迫切需要用于获得有关RNA发夹环三维结构信息的新方法和新材料。

发明内容

如下文详述，我们开发了新的支架定向晶体学方法，其可用于获得有关RNA发夹环的三维结构的信息。本文公开的RNA结晶支架和相关方法可以用于简单且快速地确定RNA发夹环的三维结构以及它们与其他试剂(例如抑制剂)的关联。本发明方法中使用的特定支架RNA是来自假乙醇热厌氧杆状菌(Thermoanaerobacter pseudethanolicus)的YdaO型c-di-AMP核糖开关，发现该RNA容易形成具有直径超过

的大腔的晶体。正如下面详细讨论的，我们已经确定可以将感兴趣的RNA工程化改造到该支架RNA的P2茎中，以便将发夹容纳在腔中。然后可以在与使单独的支架结晶的条件相似或不相关的条件下使所得的融合RNA结晶。然后可以使用X射线或电子晶体学技术等来确定此类分子(例如这些分子单独和/或与其他试剂缔合)的三维结构。

本文公开的RNA结晶支架和相关方法可以用于鉴定以高亲和力和特异性与靶RNA分子相互作用的化合物，诸如天然和化学修饰的寡核苷酸，以及小分子药物。这很重要，因为此类化合物与RNA发夹环之间的相互作用可以以可以在病理学，诸如癌症和RNA病毒感染中调节它们在体内的活性的方式影响这些分子的生物活性。此外，由于RNA几乎涉及生物学和疾病的每个方面，因此本文公开的方法是广泛适用的规程，可以提供有关如何特异性调节几乎任何靶RNA的信息。因此，本文公开的方法允许观察和评估靶向特定RNA的试剂，诸如寡核苷酸类似物，包括在多种生物过程中起作用的试剂，诸如涉及病毒复制(例如病原体诸如严重急性呼吸综合征冠状病毒2、丙型肝炎和寨卡的复制)的过程，涉及病理状况诸如癌症或神经退行性疾病的过程，以及涉及产生用于调节蛋白质编码基因的microRNA的过程等。

本文公开的本发明具有多个实施方案。本发明的一个实施方案是物质组合物，其包含与以下具有至少90％序列同一性的核糖核酸：GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO：1)。通常，多核苷酸包含SEQ ID NO：1的序列。在该组合物中，核糖核酸的SEQ ID NO：1的残基14-17(GAAA)用长度在4到33个核苷酸之间的核酸的异源区段替换(上述至少90％的序列同一性不包括可以在残基14-17处插入该核糖核酸中的核酸的异源区段)。在这些组合物中，核酸的异源区段通常是在天然存在的RNA分子中形成环结构的核酸区段。在本发明的某些实施方案中，核酸的异源区段包括天然存在的RNA分子中的完整的环结构，以及任选地茎结构的0-5个碱基对。任选地，这些组合物可以进一步包含与核糖核酸结合的试剂，例如与核糖核酸杂交的多核苷酸。

本发明的另一个实施方案是用于观察包含质粒的RNA结构的系统或试剂盒，该质粒包含编码与以下具有至少90％(并且任选地小于100％)同一性的核糖核酸的DNA序列：GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO：1)。在某些实施方案中，质粒进一步包含用于表达或转录核糖核酸的启动子，和/或系统或试剂盒进一步包含RNA聚合酶。任选地，该系统或试剂盒进一步包含与质粒中的一段核酸杂交的一种或多种引物。

本发明的又一个实施方案是获得关于核糖核酸结构的信息的方法。该方法包括将SEQ ID NO：1(或与SEQ ID NO：1具有至少90％的核糖核酸)的残基14-17(GAAA)用长度在4至33个核苷酸之间的核酸的异源区段替代，以形成融合核糖核酸分子，使融合RNA结晶，对融合核糖核酸分子进行X射线或电子晶体学技术，以便观察结果(例如X射线或电子晶体学技术的电子密度图)以获得关于核酸的异源区段的三维结构的信息。在这些方法的某些实施方案中，在晶体学分析之前将融合核糖核酸分子与结合核糖核酸的试剂(例如与核糖核酸杂交的多核苷酸)组合，使得RNA/试剂复合物的结构可以被观察。通常在这些方法中，晶体学分析包括与缺乏与核糖核酸结合的试剂的对照样品进行比较。任选地，在这些方法中，在X射线或电子晶体学技术之前，将多个融合核糖核酸分子与多种与核糖核酸结合的试剂组合(例如在高通量筛选中)。在本发明的一些实施方案中，将至少两种试剂与融合核糖核酸分子组合。

在本发明的说明性工作实施方案中，我们检查了pri-miRNA发夹环的九种结构。这些研究确定，长度为4-8个核苷酸的环比以前认为的更结构化，使这些和中等长度的环成为治疗剂的优秀靶标。在本发明的实施方案中，靶环不必具有特定长度，并且可以比可用示例更长或更短。这种认识和我们新的结构确定方法允许工匠能够鉴定先导寡核苷酸化合物，并快速且经济高效地进行基于结构的迭代轮次。本发明的方法具有广泛的应用，因为它们靶向对对抗传染病和癌症、年龄相关的病理和神经退行性疾病以及遗传病症诸如DiGeorge综合征等很重要的过程。

本发明的其他目的、特征和优点对于本领域技术人员来说将从以下详细描述中变得显而易见。然而，应当理解的是，详细描述和具体实施例虽然指示了本发明的一些实施方案，但以说明而非限制的方式给出。可以在本发明的范围内做出许多改变和修改而不脱离本发明的精神，并且本发明包括所有此类修改。

附图简述

附图的简要说明见下文。

图1A-1E.分析pri-miRNA末端环并搜寻潜在的结晶支架。图1(a)：显示了pri-miRNA顶端环长度的分布。图1(b)：显示了每个RNA晶体结构中存在的最大球形腔(半径为R_max)针对该结构的衍射分辨率的比较。在不对称单元中具有单个分子的晶体形式显示为绿色十字，并且所有其他晶体形式显示为黑点。图1(c)：显示了RNA的结构。图1(d)：显示了YdaO型ci-di-AMP核糖开关的二级结构。图1(e)：显示了核糖开关(PDB ID 4QK8)的晶体堆积(crystal packing)。围绕大中心通道(平行于c轴)的分子为灰色，并且在通道中放置半径为

的蓝色球体以说明其大小。在通道内终止的L2茎环为绿色。图1(f)：显示了W.T.YdaO的天然凝胶分析以及与具有来自茎的0-3个碱基对的pri-miR-9-1末端环的融合。

图2A-2F.通过支架定向晶体学确定的长度为8-6nt的pri-miRNA末端环的原子结构。在整个图中，支架P2茎的最后一个碱基对为灰色。图2A和2D-2F以立体视图显示。插图显示了环的二级结构。以在每个小图中显示的水平轮廓绘制2Fo-Fc电子密度图。图2(a)显示了pri-miR-378a(378a+0bp)。图2(b)显示了具有来自茎的一个碱基对的pri-miR-378a环(378a+1bp)。图2(c)显示了378a+1bp结构和电子密度。图2(d)显示了pri-miR-340(340+1bp)。图2(e)显示了pri-miR-300(300+0bp)。pri-miR-300中的相邻规范对是C-G，与支架中的对相同。因此，该结构是必需的300+1bp。图2(f)显示了pri-miR-202(202+1bp)。

图3A-3D.较短(4-5nt)pri-miRNA环的结构。配色方案与图2中的相同。图3(a)显示了pri-miR-208a(208a+1bp)。图3(b)显示了pri-miR-320b-2(320b-2+1bp)。图3(c)显示了pri-miR-449c(449c+1bp)。图3(d)显示了pri-miR-19b-2(19b-2+1bp)。

图4A-4E.人pri-miRNA顶端接界和环的结构共识、非规范对和不对称柔性。图4(a)显示了图2和3中所示的所有八个环的结构对齐。在大多数或所有结构中对齐良好的位置经标记。图4(b)显示了用50mM NaCl测量的八个pri-miRNA顶端接界(junction)和环的折叠ΔG值图。误差线代表获得自4-6次重复的标准偏差。每个RNA含有顶端环和来自茎的紧邻碱基对，以及五个常见的碱基对(参见图8a的RNA二级结构和表2的详细热力学参数)。图4(c)显示了观察到的和预期的具有指示顶端闭环残基对的人pri-miRNA的计数。根据5’和3’环残基的丰度估计预期计数。图4(d)显示了每个残基的平均原子位移参数(ADP)，所有环均以相同的比例绘制。5’和3’末端代表pri-miRNA茎环的末端碱基对。说明ADP分布的结构绘图呈现在图10中。图4(e)显示了通过分子动力学确定的每个残基的均方根波动(RMSF，

)。符号和颜色与图4(d)中的相同。

图5A-5K.DGCR8 Rhed结构域与pri-miRNA顶端接界的缔合。图5(a)-5(h)凝胶位移测定的量化，具有代表性的凝胶图像显示于图11。数据点代表来自三个重复实验的平均级分结合±标准误差(SE)。用Hill方程拟合数据，并显示解离常数(K_d)(±SE)。图5(i)显示了Rhed结合的自由能(RTln(Kd))与末端环长度的比较，如mfold所预测。图5(j)显示与图5(i)相同，除了用排除的非规范对中涉及的碱基调整了环长度。

图6A-6C.我们在pri-miRNA顶端接界的几个晶体结构中观察到的U-U对的系统诱变的结果(U-U对是最佳加工的pri-miRNA变体之一)。pri-miRNA顶端环中的末端残基对miRNA产生进行微调。图6(A)显示了用于测量哺乳动物细胞中miRNA成熟效率的双重pri-miRNA构建体的示意图。每个pri-miRNA片段含有发夹和每侧约30nt的侧翼序列，总共约150nt。pri-miR-9-1片段没有改变并且用于归一化。对3’pri-miRNA片段的末端环残基进行诱变。使用定量RT-PCR测量两种成熟miRNA的丰度。图6(B)显示了pri-miR-340变体的成熟效率(miR-340/miR-9比率)。图6(C)显示了pri-miR-193b变体的成熟效率。在这些散点图中，单个数据点显示为灰点。条形表示平均值和标准偏差。

图7A-7I.针对所有pri-miRNA环计算的模拟退火复合省略图。配色方案与图2和3相同。将所有图轮廓绘制为1.1σ。有关计算单个图的详细信息，参见方法部分。图7A显示378a+0bp。图7B显示378a+1bp。图7C显示340+1bp。图7D显示300+0bp。图7E显示202+1bp。图7F显示208+1bp。图7G显示449c+1bp。图7H显示320b-2+1bp。图7I显示了19b-2+1bp。

图8A-8I.用于熔解和结合测定的RNA构建体。图8(a)显示了用于光学熔解测定的短RNA寡核苷酸。常见的5bp螺旋区段用作所有发夹的茎(灰色碱基对)。pri-miRNA顶端接界和环核苷酸是黑色的。图8(b)-8(i)显示了Rhed结合测定中使用的所有pri-miRNA片段的二级结构预测。添加到茎基以增强转录的额外G-C对以黄色突出显示。方框显示了用于确定晶体结构的茎的顶端环和末端碱基对的序列。

图9A-9B.pri-miRNA末端环结构与PDB中发现的类似RNA折叠的比较。图9A显示了pri-miR-378a(378a+1，左)的8-nt环的卡通表示，图9B显示了来自RNaseP(2)、胍-I核糖开关(3)和tRNA^Phe(4)的不同结构的类似环。

图10A-10H.用原子位移参数(ADP)估计顶端环的柔性。图10(a)-图10(h)中显示的每个结构用蓝色的最低ADP到红色的最高来着色。插图显示了绘制的ADP的范围。

图11A-11H.与Rhed结合的每个pri-miRNA片段的示例凝胶位移测定。在每个凝胶上方鉴定前miRNA片段，并在凝胶中标记游离RNA和蛋白质结合的种类。结合反应中使用的Rhed二聚体浓度(μM)显示在凝胶下方。

图12A-12b.分析来自先前报道的高通量诱变和加工测定的pri-miR-223顶端环测序数据(5)。图12(a)显示了pri-miR-223发夹上部区域的预测二级结构。碱基着色反映了该RNA的Rfam条目中的进化保守水平(Rfam登录号：RF0064)。来自3p臂的主要miRNA产物以蓝色突出显示。红色字母显示相对于WT序列的突变。与插图中显示的替代二级结构相比，该模型可能是主导构象，因为它在Drosha切割位点上方产生约23bp的最佳上部茎长度，并将进化保守残基放置于茎内和将较少保守的残基放置于凸环中。图12(b)显示了热图，其显示了9nt的pri-miR-223环测序数据中C-A对的频率。左下角矩阵显示输入库中的百分比频率，右上角矩阵显示经加工的RNA中的频率。作为参考，野生型环序列沿对角线显示。C-A对在经加工的派系中富集到69％，而在输入中为22％。

图13.pri-miR-20b的NMR系综(ensemble)，显示顶端接界处的U-G对和相邻5'G残基的堆积(6)。

图14A和14B.RNA结构。图14A显示了HCV顺式作用复制元件的二级结构；并且图14B显示了HCV IRES结构域IIIb(参见，例如Quade et al.，Nature Communications volume6，Article number：7646(2015))。

发明详述

本文描述或引用的许多技术和规程是本领域技术人员充分理解的并且通常使用常规方法来使用。在对优选实施方案的描述中，可以参考形成其部分的附图，并且其中通过说明的方式显示了可以实践本发明的具体实施方案。应当理解，在不脱离本发明的范围的情况下，可以利用其他实施方案并且可以进行结构改变。

除非另有定义，否则本文使用的所有技术术语、符号和其他科学术语或术语旨在具有本发明所属领域的技术人员通常理解的含义。在一些情况下，为了清楚和/或为了便于参考，本文定义了具有普遍理解含义的术语，并且本文中包含的此类定义不一定被解释为表示与本领域通常理解的内容的实质性差异。

后生动物pri-miRNA折叠成特征性的发夹结构，在加工过程中被微处理器复合物识别。对于这种识别，连接发夹茎和环的顶端接界将DGCR8 RNA结合血红素结构域(Rhed)引导到发夹的顶端。在这里，我们描述了支架导向的晶体学方法，并报告了许多人pri-miRNA顶端接界和环的结构。这些结构揭示了一种共识，其中非规范碱基对和至少一个5’环残基堆积在发夹茎的顶部。非规范对有助于溶液中的热力学稳定性。U-U和G-A对在人pri-miRNA的顶端接界处高度富集。我们还发现Rhed更紧密地结合较长的环，从生化角度解释了为什么具有较短环的pri-miRNA通常加工不良。我们的公开为理解pri-miRNA和microRNA成熟的相关分子机制提供了结构基础。

如下文所讨论，我们开发了可用于确定pri-miRNA顶端接界和环的三维结构的方法和材料，因为它们在miRNA成熟和调节中的重要作用(7-10)。这些部分存在于pri-miRNA和pre-miRNA中，因此它们的结构影响Drosha和Dicer切割步骤(8)。顶端接界和环也是药物发现的靶标(11)。迄今为止，使用NMR光谱，仅对两个pri-miRNA顶端茎-环在无配体状态下进行了结构表征(6，11，12)。13nt的pre-miR-20b顶端环折叠成明确定义的刚性结构(6)，而弱信号表明14nt的pri-miR-21环是非结构化的(11，12)。人基因组编码1,881个pri-miRNA发夹，这些发夹彼此差异很大(13)。为了调查大量的pri-miRNA结构，我们已开发支架定向结晶技术，其能够快速确定发夹环结构，而不受晶格的干扰。我们报告了来自八种pri-miRNA的九种顶端接界和环结构以及它们与Rhed相互作用的生化表征。

本发明的实施方案包括物质组合物，其包含与以下具有至少90％序列同一性的核糖核酸：GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEO ID NO：1)。本发明的实施方案优选表现出与SEQ ID NO：1的多核苷酸序列具有至少约91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。通过将多核苷酸变体的序列与SEQ ID NO：1的全长多核苷酸的相应部分进行比较，可以容易地确定百分比同一性(其中上述序列同一性不包括可以插入到这种核糖核酸代替残基14-17的核酸的异源区段)。一些用于序列比较的技术包括使用本领域普通技术人员熟知的计算机算法，例如Align或BLAST算法(Altschul，J.Mol.Biol.219：555-565，1991；Henikoff and Henikoff，PNAS USA 89：10915-10919，1992))。可以使用默认参数。

通常，多核苷酸包含SEQ ID NO：1的序列。在该组合物中，核糖核酸的SEQ ID NO：1(GAAA)的残基14-17经长度在4到33个核苷酸之间的核酸的异源区段替换(上述至少90％的序列同一性不包括可以插入该核糖核酸残基14-17处的核酸的异源区段)。在一个说明性实施方案中，多核苷酸包含GGUUGCCGAAUCCXGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO：29)，其中X包含选自A、U、G和C的4至33个异源核苷酸(例如，在天然存在的RNA分子诸如人miRNA中包含三维结构的那些)。在这些组合物中，核酸的异源区段通常是在天然存在的RNA分子中形成三维结构(例如环结构)的核酸的异源区段。在本发明的某些实施方案中，核酸的异源区段包括天然存在的RNA分子中的完整的环结构，以及任选地茎结构的0-5个碱基对。任选地，这些组合物还可以包含与核糖核酸结合的试剂，例如与核糖核酸杂交的多核苷酸。

本发明的另一个实施方案是用于观察RNA结构的系统或试剂盒，其包含一种或多种质粒，所述一种或多种质粒包含编码与以下具有至少90％(并且任选地小于100％)同一性的核糖核酸的DNA序列：GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ IDNO：1)。在本发明的一些实施方案中，一种或多种质粒包含与序列GGTTGCCGAATCC(SEQ IDNO：27)具有至少90％同一性的多核苷酸序列和/或与序列GGTACGGAGGAACCGCTTTTTGGGGTTAATCTGCAGTGAAGCTGCAGTAGGGATACCTTCTGTCCCGCACCCGACAGCTAACTCCGGAGGCAATAAAGGAAGGAG(SEQ ID NO：28)具有至少90％同一性的多核苷酸序列。在某些实施方案中，一种或多种质粒进一步包含用于表达或转录核糖核酸的启动子，和/或系统或试剂盒进一步包含RNA聚合酶。任选地，该系统或试剂盒还包含一种或多种与质粒中的一段核酸杂交的引物。

本发明的又一个实施方案是获得关于核糖核酸结构的信息的方法。该方法包括将与SEQ ID NO：1(或与SEQ ID NO：1具有至少90％的核糖核酸)的残基14-17(GAAA)同源的残基用长度在4到33个核苷酸之间的核酸的异源区段替代(例如4、5、6或7个核苷酸等，直到达33个核苷酸的异源区段)，以形成融合核糖核酸分子，使融合RNA结晶，对结晶的融合核糖核酸分子进行结构分析诸如包括X射线或电子晶体学技术的技术，以便观察结果以获得关于核酸的异源区段的三维结构的信息。在这些方法的某些实施方案中，在晶体学分析之前将融合核糖核酸分子与结合核糖核酸的试剂(例如，与核糖核酸的异源区段结合的多核苷酸或其他试剂)组合，使得RNA/试剂复合物的结构可以被观察。通常在这些方法中，晶体学分析包括与缺乏与核糖核酸结合的试剂的对照样品进行比较。任选地，在这些方法中，在结构分析(例如X射线或电子晶体学)技术之前，将多个融合核糖核酸分子与多种与核糖核酸结合的试剂组合(例如在高通量筛选程序中)。在本发明的一些实施方案中，将至少两种药剂与融合核糖核酸分子组合。

本发明的相关实施方案包括对多核苷酸进行晶体学分析的方法。通常这些方法包括：选择第一多核苷酸，其中第一多核苷酸包含第一miRNA的多核苷酸序列；鉴定在第一miRNA中形成第一环区的多核苷酸的区段；选择第二多核苷酸，其中第二多核苷酸包含第二miRNA的多核苷酸序列；鉴定在第二个miRNA中形成第一环区的多核苷酸的区段；形成融合多核苷酸，其经选择使得包含第一多核苷酸上的第一环区的多核苷酸的区段经包含第二多核苷酸上的第一环区的多核苷酸区段替代或交换；然后对融合多核苷酸进行晶体学分析，以便观察融合多核苷酸的三维结构；从而进行多核苷酸的晶体学分析。在这些方法的某些实施方案中，第一miRNA是与以下具有至少90％序列同一性的miRNA：GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO：1)，其中：核糖核酸区段的残基14-17(GAAA)经长度在4到33个核苷酸之间的包含第二多核苷酸上的第一环区的核酸的异源区段替换。在本发明的某些实施方案中，第一多核苷酸包含SEQ ID NO：1的序列；和/或第二miRNA包括人miRNA。通常在这些方法中，晶体学分析是X射线或电子晶体学技术；和/或晶体学分析在与融合多核苷酸结合的试剂(例如，与包含第二多核苷酸上的第一环区的核酸的区段具有同源性的反义寡核苷酸)存在下进行。

在本发明的说明性工作实施方案中，我们检查了pri-miRNA发夹环的九种结构。这些研究确定，长度为4-8个核苷酸的环比以前认为的结构更结构化，使这些和中等长度的环成为治疗剂的优秀靶标。在本发明的实施方案中，靶环不必具有特定长度，并且可以比可用示例更长或更短。这种认识和我们新的结构确定方法允许工匠能够鉴定先导寡核苷酸化合物，并快速且经济高效地进行基于结构的迭代轮次。本发明的方法具有广泛的应用，因为它们靶向对抗传染病诸如2019年冠状病毒病，以及癌症、年龄相关的病理和神经退行性疾病，以及遗传疾病诸如杜氏肌营养不良症、DiGeorge综合征等很重要的过程。在一个说明中，本发明的实施方案可以用于测试和检验新的反义治疗剂，这些治疗剂经设计用于靶向与人癌症发病机制相关联的基因，尤其是那些不适合小分子或抗体抑制的癌症.

如下所述，我们确定了人微小RNA初级转录物(pri-miRNA)的三维结构(1)。简而言之，pri-miRNA在细胞核中由含有Drosha核糖核酸酶及其RNA结合伴侣蛋白DGCR8的微处理器复合物识别和切割。pri-miRNA顶端接界和环也是调节微小RNA成熟的其他RNA结合蛋白和代谢物的结合位点。更重要的是，当由试剂诸如多核苷酸、小分子等靶向时，然后可以观察到此类pri-miRNA顶端环。以这种方式，当与具有治疗潜力的药剂结合或以其他方式调节时，可以观察到成熟的功能性微小RNA及其结构。

本发明的其他方面和实施方案在以下部分中讨论。

pri-miRNA顶端环长度的调查

先前的一项研究表明，具有短(＜10nt)顶端环的pri-miRNA往往经微处理器低效率地加工(7)。考虑并以此为基础，我们基于我们使用mfold(14)产生的预测的二级结构和由miRBase(13)提供的类似结构，汇编了人pri-miRNA顶端环序列的列表。它们中的大多数(1,881个中的1,314个，70％)长度小于1cnt，最高频率在4-6nt范围(图1a)。RNA二级结构预测程序倾向于在相对较长的环中包含碱基对，这些环不一定稳定(6，11)。我们通过忽略从发夹茎分离的1或2个碱基对，部分解决了这种明显的偏差。尽管该列表可能仍然低估较长环的数量，但它仍然反映了我们所知的最佳情况。因此，对于大多数pri-miRNA识别事件，Rhed必须与相对较短的顶端环相互作用才能接近顶端接界。

支架定向晶体学

为了确定pri-miRNA顶端接界和环的三维结构，我们开发了一种支架定向结晶方法。该概念是将靶(未知)序列融合到已知结晶良好且具有可用晶体结构的支架分子上。融合物应该在与单独的支架相似的条件下结晶。晶格应该能够容纳靶部分。支架结构允许通过分子置换确定融合物的结构。

为了鉴定合适的支架，我们在蛋白质数据库中挖掘满足四个标准的RNA晶体。对于每个RNA结构条目，我们首先鉴定可以容纳在晶格腔中的最大球体，其由半径R_max表征(图1b)。我们考虑了所报告的衍射分辨率。为了简化设计，我们将搜索限制在不对称单元中具有一个分子的条目。最后，我们手动审查晶格以找到指向晶格腔的茎-环，以便NA发夹可以融合至此。在调查的数百个结构中，我们仅鉴定出一种满足这些要求的RNA，来自假乙醇热厌氧杆状菌的YdaO型c-di-AMP核糖开关(从此处起简称为YdaO)(15)。

YdaO晶格含有大溶剂通道

具有位于通道内并远离相邻分子的短P2茎(图1c，d)。核糖开关具有复杂的假二重对称“三叶草”折叠(图1d)。我们用14nt的pri-miR-9-1顶端环加上来自茎的0-3个额外的碱基对替换YdaO P2茎上的GAAA四环。在c-di-AMP配体存在下退火后，所有四种融合RNA在天然凝胶上作为单一条带迁移(图1e)，表明工程化改造的pri-mi-RNA序列不干扰支架折叠。

对于我们代表性的一组短pri-miRNA环，我们与含有环加上来自茎的不同数量的碱基对的YdaO支架生成融合物，并筛选结晶。我们成功获得含有来自pri-miRNA茎的0或1个碱基对的构建体的晶体。这些晶体属于相同的空间群P3₁21，具有相似的单元尺寸(表1)。我们收集了X射线衍射数据并确定了其结构，分辨率范围为2.71至

(表1)。对于三个pri-miRNA，我们还收集了具有79-115范围内冗余的单波长反常散射(single-wavelengthanomalous dispersion，SAD)数据。这些SAD数据有助于分阶段和细化。细化的天然结构表明支架部分与野生型(WT)的结构非常相似，C1’均方根偏差(RMSD)值范围为0.22至

下面我们描述pri-miRNA部分。与PDB中的大多数RNA环结构不同，我们的结构没有晶体与配体的接触和相互作用，并因此反映了它们自身的折叠倾向。

pri-miRNA顶端接界和环的结构

我们的pri-miRNA环结构系列涵盖了人中最常见的环长度，范围从4到8nt。最长的环是8nt，来自pri-miR-378a(称为378a+0bp，图2a和图7a)。由于RNA环可以是柔性的，它们在电子密度中通常不能很好地分辨。令我们惊讶的是，378a+0bp的2F_o-F_c图揭示了所有残基的具有清晰密度的高度结构化构象。378a+0bp结构清楚地表明环的最外层残基C1和A8形成非规范对，这创建了来自环堆积的其余部分的碱基位于其上的平台(图2b)。在5’末端，C2和U3在C1上方堆积。从3’侧看，A4、G5、A6和A7在A8上方堆积成四层。在两个碱基堆积上，C2^O2-A7^N6

U3^O4’-A6^N6

U3^N3-A6^OP2

U3^O2-A6^N7

和U3^2'OH-G5^N7

之间的氢键进一步稳定环(图2b)。除A4外，pri-miR-378a的每个环核苷酸均由H键合配位。

我们还用来自茎的一个碱基对解决了pri-miR-378a顶端环的结构(378a+1bp，图2c和图7b)。两个环的模型非常一致(环中所有非氢原子的RMSD为

图2c)。378a+1bp结构证实非规范C1-A8对。有趣的是，378a+0bp和378a+1bp几乎相同的事实表明环构象不受来自pri-miRNA茎的末端A：U对的强烈影响。

pri-miR-340(340+1bp)和pri-miR-300(300+0bp)的结构含有7nt的环。340+1bp结构证实末端A-U对的存在，其由意外的U1-U7对覆盖(图2d和图7c)。来自环的5’末端的G2和U3碱基堆积在U-U对的顶部。这仅在环顶部留下有更灵活构象的三个残基(C4、G5和U6)。在300+0bp结构中，支架的末端C-G对与pri-miR-300茎的最后一个碱基对相同，因此该结构实际上是300+1bp。与378a和340的情况一样，我们观察到U1和U7之间的非规范配对(图2e和图7d)。同样，U1、U2、U3和A4之间的碱基堆积相互作用链对环的5’末端进行排序。U6与U2碱基在氢键合距离内，几乎形成另一个非规范对。C5在密度之外，并且似乎更灵活。

在pri-miR-202(6nt的环)的结构中，我们没有观察到非规范碱基对。然而，与其他结构类似，环的5’末端处的A1碱基堆积至pri-miRNA茎的最终G-C对(图2f和图7e)。环的其余部分显示1σ处的连续电子密度，但我们无法以高置信度确定构象。总体而言，相对较长的(6-8nt的)pri-miRNA环的结构揭示广泛的碱基堆积和非规范碱基配对相互作用，可能比以前预期的更使环稳定。因此，较少的环残基是构象柔性的。

接下来，我们研究了较短的pri-miRNA末端环的结构(4-5nt，图3)。具有5nt的环的pri-miR-208a(208a+1bp)的结构揭示了位于茎的最终G-C对之上的未预测的A1-U5Hoogsteen对(图3a和图7f)。环的中央3nt，U2、C4和G3碱基堆积在一起，并在Hoogsteen对中的A1碱基上。此外，来自340+1bp的非规范U-U对在pri-miR-449c结构中的U1和U5之间重演(图3b和图7g)。位置U1和G2在末端碱基对上方堆积在一起，仅将A3和U4留在密度之外。这两个五环共享主题：两个最外面的残基形成非规范碱基对，而中间的三个残基不配对并且它们的一些碱基是堆积的。

与上述202+Ibp的结构类似，对于pri-miR-320b-2(5nt的环)，环的A1残基位于茎的末端A-U对的顶上(图3c和图7h)。最后，在pri-miR-19b-2(19b-2+1bp)的四环结构中，5’环核苷酸U1堆积在末端碱基对上方，并且A2的部分堆积相互作用在U1顶部(图3d和图7i)。U3和G4主要在电子密度之外，尽管G4^N7和A2的2’-OH(约

)之间可能有接触。这些结构证实，在较长环结构中见证的5’环残基的非规范配对和碱基堆积也主导较短环的折叠。

pri-miRNA顶端接界的结构共识

我们的pri-miRNA茎-环结构指向一组共同的定义末端环的结构特征。为了进一步说明这些特征，我们生成了所有八个pri-miRNA环的结构比对(图4a)。首先，我们总是在pri-miRNA茎的顶端观察到mfold预测的规范碱基对(5’-1与3’-1配对)。由于环的大小不同，这里我们使用5’-1表示pri-miRNA序列5’末端的第一个残基，以及3’-1表示3’末端的第一个残基。其次，在所有结构中，环5’末端的第一个核苷酸与末端碱基对碱基堆积(5’-2与5’-1/3’-1堆积)。第三，在八个环中的五个(378a、340、300、208a、449c)中，这种碱基堆积还伴随着非规范碱基对(5’-2与3’-2配对)，有效地使顶端环比所预测的短了两个核苷酸。第四，所有八个结构揭示在5’侧的至少一个额外水平的碱基堆积相互作用(5’-3堆积在5’-2上)。相比之下，只有两个结构指示3’侧的第二层堆积。除了这些共同特征之外，pri-miRNA环的其他残基似乎采用完全不同的构象或是柔性的。

非规范碱基对有助于热力学稳定性

为了测试我们观察到的顶端接界和环的结构是否有助于它们在溶液中的稳定性，我们将八个pri-miRNA序列融合到共同的5-bp螺旋区段(图8a)并使用光学熔解测量它们的热力学参数。与晶体结构一样，每个pri-miRNA序列含有顶端环和来自茎的紧邻的规范碱基对，因此包括最小的顶端接界。我们预期规范的茎碱基对对整体稳定性的贡献不同，三个pri-miRNA中的G-C或C-G对比其他中的A-U和U-A对更稳定。然而，这种差异并不能完全解释我们测量的折叠的自由能变化(ΔG)(表2)。当我们考虑到我们在三维结构中揭示的非规范对时，就会出现一种趋势。形成非规范对并且具有作为末端茎对的G-C或C-G的两个pri-miRNA(pri-mir-300和pri-mir-208a)是最稳定的，而不形成非规范碱基对并且含有A-U或U-A规范茎对的那些pri-miRNA(pri-mir-320b-2和pri-mir-19b-2)是最不稳定的(图4b)。或是含有非规范对但含有A-U/U-A茎对(pri-mir-340和pri-mir-449c)，或是不形成非规范对但具有G-C/C-G茎对(pri-mir-202)的大多数其他pri-miRNA序列稳定性中等。pri-mir-378a顶端接界/环含有由单个氢键定义的C-A非规范对，并因此显示出与来自最不稳定组的那些相似的ΔG。总之，这些数据表明pri-miRNA顶端接界处的非规范对有助于它们在溶液中的结构稳定性。

人pri-miRNA在其顶端接界处偏爱U-U和G-A对

我们接下来通过分析所有人pri-miRNA环序列来估计pri-miRNA顶端接界处的非规范对的丰度。在1,881个此类序列中，340个在5’和3’末端含有U残基，这些残基最有可能像pri-miR-340、pri-miR-300和pri-miR-449c结构一样配对(图4c)。在这些位置的所有可能组合中，U-U对是最丰富的，而预期的偶然发生是181。这种富集高度显著，因为偶然观察到U-U 340次的概率比181次的概率低3x10^-28倍。第二丰富的组合是5’-G和3’-A，观察到245次，偶然发生的可能性比奇数的最可能计数139低1x10^-16倍。其他末端组合的环序列计数诸如C-A(观察到122次)与偶然预期的差异显著较小(109次，P₁₂₂/P₁₀₉＝0.42)。因此，我们得出结论，人pri-miRNA偏爱紧邻发夹茎的U-U和G-A对。

有趣的是，已知U-U和G-A在充当闭合对时稳定发夹环(16)。我们的pri-miRNA环文库部分基于二级结构预测构建，该预测已经考虑U-U和G-A对的稳定作用。我们不认为这个小的额外能量项负责U-U和G-A作为pri-miRNA顶端环中的闭合对的富集，因为对于大多数pri-miRNA，环序列由强规范碱基对定义为pri-miRNA发夹茎的部分。此外，其他非规范对，诸如G-G、C-A和A-C，也被认为是稳定的(尽管程度略低)，但它们在pri-miRNA顶端接界处不富集。该结果表明U-U和G-A非规范对受到pri-miRNA顶端接界的偏爱，这可能是因为它们的稳定作用和/或特定的几何特征。

pri-miRNA环与其他RNA共享结构特征

我们询问我们发现的环构象是pri-miRNA独有的还是与其他RNA茎-环共享的。为了解决这个问题，我们将来自PDB的RNA发夹序列穿线到我们的pri-miRNA结构上，然后计算穿线位姿和原始PDB构象之间的RMSD(参见方法部分)。对于pri-miR-378a，我们鉴定出三个稍短(6-或7-nt)且序列不同但保留高度相似折叠的环(图9)。比较这些结构揭示了广义的环基序，我们称之为富含3’-嘌呤的堆积(图9b)。在富含3’-嘌呤的堆积中，在环的3’侧的4-5个主要是嘌呤的碱基在螺旋茎的顶部相互堆积。在离茎最远的位置可以发现一个或两个嘧啶。在环的5’侧，两个或三个嘧啶残基，最常见的是尿苷，充当堆积的残基和茎之间的接头。这些接头嘧啶与堆积的嘌呤形成氢键(有时是非规范碱基对)，从而进一步稳定整个环。更广泛地，在pri-miR-320b-2结构中，UGAA四环中的三个嘌呤相互堆积并在相邻的U-A对顶端，基本上形成了3’嘌呤堆积。许多pri-miRNA和其他发夹环含有与3’嘌呤堆积一致的序列。总体而言，这些观察结果表明pri-miRNA环结构不一定是pri-miRNA独有的，这也与之前报道的DGCR8和Drosha与许多其他细胞RNA相互作用一致(17-21)。

pri-miRNA顶端环的不对称构象柔性

由于至少有两个原因，结构稳定性和动力学对于pri-miRNA接界和环可能很重要。首先，共同的构象特征预期是稳定的。其次，动态区域使结合加工蛋白质时更容易避免空间位阻，并采用有利于加工的构象。为了研究这一点，我们首先回顾了在结构测定过程中细化的原子位移参数(ADP，也称为温度或B因子)。毫不奇怪，环顶部处的残基具有大的ADP，这表明它们是高度动态的；而靠近茎的残基，涉及共同的结构特征，诸如非规范对和碱基堆积，倾向于具有较低的ADP(图10)。重要的是，除pri-miR-378a外，大多数环显示出在环的5’区有更高稳定性和在3’区更灵活的趋势。堆积的5’残基始终比3’核苷酸更稳定。为了进一步比较结构之间的ADP，我们计算了每个残基的平均ADP，然后以相同的比例绘制它们(图4d)。在大多数结构中，ADP的峰始终位于环的中间到3’末端附近。值得注意的是，先前鉴定对高效加工很重要的UGU基序(5，10)位于环的5’区。

为了更详细地了解环动力学，我们在显式溶剂中对pri-miRNA接界和环核苷酸进行了分子动力学模拟。为简单起见，模拟仅包括pri-miRNA残基加上来自支架的两个碱基对，并且我们约束支架核苷酸的位置以防止链解旋(详见方法)。我们在300K下运行模拟1μs，并通过计算每个残基的均方根波动(RMSF)来分析产生的轨迹(图4e)。这些统计数据更明显支持中心到3’环残基样品的构象更广泛的趋势。

Rhed结合亲和力与顶端环长度的相关性

我们想知道Rhed如何识别所有pri-miRNA顶端接界，尽管环长度不同。我们通过测量Rhed对含有顶端环加上来自茎的约20bp的pri-miRNA片段的亲和力来解决这个问题(图8b-i)。我们使用电泳迁移率变动分析(EMSA)来测定每种RNA的Rhed解离常数(K_d)(图11)。Rhed结合所有pri-miRNA片段，K_d范围为1.9至9.2μM(图5a-h)。这种差异对于识别可能很重要，尤其是当pri-miRNA竞争加工机制时。我们绘制了结合的ΔG相对于总体环长度(图5i)，并注意到较长环结合更紧密的趋势。当我们根据我们的3D结构校正环长度时，这种趋势变得更加明显(长度减去非规范对中涉及的残基数，图5j)。我们的结果为pri-miRNA环长度偏好提供生化解释，尽管我们不能排除pri-miRNA茎中的差异也有助于Rhed亲和力范围的可能性。我们注意到，在环的5’侧含有UGU基序的pri-miR-340以与缺少该序列的其他构建体相似的亲和力(K_d＝3.5μM)结合Rhed。

讨论

我们提供了工作实施方案，证明支架定向晶体学可以成为RNA结构生物学的强大工具的概念验证。这种方法在很大程度上类似于流行的固定臂MBP融合技术，其中靶蛋白通过连续的α-螺旋接头以固定方向连接到MBP(22)。然而，我们的工程化改造方法将靶RNA特异性定位在支架晶体的晶格空隙中。这样的设计带来了几个额外的优势：(1)因为靶部分不破坏现有的晶格接触，融合分子可以在原始条件下结晶；(2)由于不需要重新筛选广泛的条件，结晶需要最少量的纯化融合RNA；(3)靶标不与晶格中的相邻分子相互作用，从而使其结构紧密地代表溶液中的构象。

将此技术应用于pri-miRNA识别问题提供了对八个pri-miRNA顶端接界和环结构的原子水平调查。这些环覆盖人pri-miRNA中最常见的环长度。这些结构共同揭示涉及关闭顶端环的非规范碱基对和在5’末端的进一步碱基堆积的结构共识。先前报道的pre-miR-20b的NMR结构支持这一共识(6)。pre-miR-20b茎终止于G-U对，并且相邻的5’环核苷酸(G)堆积在该对的顶部(图13)。前20种NMR解决方案的比较证实这些是分子的稳定特征。pre-miR-21的NMR研究揭示了对应于顶端接界处的两个串联U-G/G-U对的弱信号，并表明14nt的顶端环在其他方面是非结构化的(11)。除了顶端接界之外，我们和NMR结构中的顶端环在三维构象上有所不同，这表明它们的构象不是直接的特异性决定因素。这些构象与其各自的功能有关。例如，pri-miR-125a环可以用作结合叶酸的适体结构域(23)。

在pri-miRNA顶端接界处观察非规范对本身具有重要的结构和功能意义。我们的光学熔解实验表明，这些配对有助于溶液中RNA的热力学稳定性(图4b)。特别是，U-U和G-A对在人pri-miRNA的顶端接界处高度富集(图4c)。这些对通常是保守的。例如，pri-miR-340中的U-U对几乎完全保守，而核苷酸变异发生在所有其他位置。U-U对的仅有变异是在中央狐蝠(Pteropus alecto)中由U-G对替代。因此，顶端接界处的这些非规范对可能对miRNA成熟很重要，尽管它们的确切功能仍然待确定。微处理器通过在两端夹紧其茎来识别pri-miRNA发夹(24，25)。最佳pri-miRNA发夹茎长度估计为35±1bp，以内部非规范对计数(10)。我们的研究表明，必须考虑顶端接界处的末端非规范对。先前对pri-miR-16-1的高通量诱变表明，是由于茎长度超过最佳长度，并且茎顶末端的规范对的破坏增加微处理器的切割效率(10)。在pri-miR-16-1中，预期G-A对在发夹茎的末端形成并堆积。在这种情况下，G-A对将需要与相邻的规范对一起被破坏。这种抑制作用使得RNA结合蛋白和RNA解旋酶激活miRNA成熟成为可能(26)。相反，我们想象在pri-miRNA螺旋茎比最佳短的情况下，非规范对将帮助发夹适合微处理器复合物。

顶端接界的构象也可以优先由微处理器识别。事实上，微处理器在pri-miR-30a茎的第35bp位置(从基部接界开始计算)更喜欢U-G碱基对而不是Watson-Crick碱基对(10)。我们重新分析了另一个高通量诱变数据(5)，并发现C-A对在微处理器切割产物的顶端接界处高度富集(图12)。此外，5’环残基堆积的趋势和3’环部分更灵活的趋势允许UGU基序被定位和暴露以由加工机器识别。需要进一步的研究来验证这个想法。

我们对人pri-miRNA环序列的分析表明，它们中的大多数都比最佳的≥10nt短。在环长度在4-8nt之间的8个pri-miRNA中，我们观察到环长度和与Rhed结合的自由能变化之间的相关性(图5i)。当非规范对中涉及的残基从环长度的计算中排除时，相关性得到改善(图5j)。与Rhed的优先结合将pri-miRNA预备在加工的有利位置，从而为≥1cnt的最佳环长度提供生化解释(7)。ΔG_结合与Rhed的差异在1kcal/mol以内。我们相信这种适度的差异可以具有重大的生物学和病理学后果，尤其是当微处理器变得有限时(例如在许多癌细胞中)。与微处理器的优先结合，如此处所示的顶端接界与Rhed的相互作用所代表的，可能在pri-miRNA之间生成加工层次，并帮助确定miRNA表达谱。

顶端接界和环也是pre-miRNA的部分，它们被输出到细胞质并在miRNA成熟途径中经Dicer核糖核酸酶切割。先前的研究表明，pre-miRNA的茎和环长度可以影响Drosha和Dicer两者的切割效率(8)。需要进一步的研究来了解顶端接界和环结构如何有助于Dicer加工步骤。此外，开发靶向pri-miRNA、mRNA和病毒RNA发夹环的潜在治疗剂具有重大意义(11，26，27)。我们的结构表明pri-miRNA环含有比预期更多的结构，这将减少结合的熵损失。我们的结晶方法应该允许基于结构的抑制剂设计。

方法

Pri-miRNA顶端环分析

为了测量顶端环的大致大小，我们从miRBase(发行版21)下载了所有带注释的人“发夹”序列及其基因组坐标。miRBase发夹通常包括pre-miRNA部分以及来自基部茎的可变数量的额外碱基对。对于每个发夹，我们使用基因组序列在RNA的5’和3’末端延伸相同数量的核苷酸，直到总长度等于150nt。这个150nt的窗口含有完整的pri-miRNA发夹，加上基部接界两侧的一些单链RNA。然后，我们使用MFOLD(14)为所有pri-miRNA发夹生成预测的二级结构，并且通常保留得分最高的结构(即具有最低的预测的折叠自由能)。我们手动审查了所有预测，以确保它们反映了预期的发夹结构，其中成熟的miRNA序列来自茎的一条或两条链；在mfold预测替代构象的情况下，我们选择了具有最低自由能的结构，该结构包含约三个螺旋转角的茎长度。我们手动比较了二级结构与来自miRBase的二级结构，并且还消除了发夹中与茎分离并因此被认为是不稳定的1-2个碱基对。

YdaO结晶支架的PDB挖掘与鉴定

我们首先过滤PDB以获得仅含有RNA分子(无蛋白质或DNA)的X射线结构。为了鉴定晶格中的空隙，我们编写了在以下步骤中实现网格搜索算法的PyMOL脚本。(1)生成3×3×3的晶胞块(即27个拷贝的晶胞)。该块中心处的晶胞看到所有可能的晶格空隙，无论是在内部还是在晶胞之间。(2)使用沿每个晶胞轴的三个单位向量(即长度为

的a、b和c向量)，迭代生成形式为5*i*a+5*j*b+5*k*c的网格点，i、j、k的整数值小于各自晶胞边缘长度除以5。这给出了具有

间距的网格点。(3)对于每个网格点，计算到超级单元中的所有C1’原子的距离，并将最短的距离鉴定为R_local。对于每个结构，将具有最大R_local的网格点鉴定为R_max。

为了找到合适的支架，我们随后手动审查了具有大R_max值和不对称单元中的单个分子的结构。我们追踪链条寻找任何投射到晶格腔中的茎-环。在审查的数百个候选物中，只有来自YdaO核糖开关(PDBID：4QK8)的P2茎-环满足这些条件(15)。

YdaO WT和pri-miR-9-1融合RNA的制备和天然凝胶电泳

我们最初设计W.T.YdaO构建体以含有在5’末端的T7启动子序列和在3’侧的HDV核酶，以及侧翼的EcoRI和BamHI限制性位点。将该片段合成为基因块(IDT)，双消化并克隆到pUC19质粒中。通过Sanger测序验证克隆。为了用pri-miRNA茎-环替换P2环核苷酸，我们使用了两轮PCR方案。所有反应均用Q5高保真DNA聚合酶(New England Biolabs)按照制造商推荐的反应设置和循环条件进行。所有反应物均含有相同的反向引物，它与HDV的3’末端退火并含有BamHI位点(5′-CGTGGATCCGGTCCCATTC-3′)(SEQ ID NO：2)。对于第一次PCR，正向引物含有pri-miRNA序列加上支架上下游的约20nt。用于pri-miR-9-1融合的正向引物是5′-CTATAGGTTGCCGAATCCGTGGTGTGGAGTCTGGTACGGAGGAACCGCTTTTTG-3′(pri-miR-9-1+0bp)(SEQ ID NO：3)；5′-CTATAGGTTGCCGAATCCAGTGGTGTGGAGTCTTGGTACGGAGGAACCGCTTTTTG-3′(pri-miR-9-1+1bp)(SEQ ID NO：4)；5′-CTATAGGTTGCCGAATCCGAGTGGTGTGGAGTCTTCGGTACGGAGGAACCGCTTTTTG-3′(pri-miR-9-1+2bp)(SEQ ID NO：5)；5′-CTATAGGTTGCCGAATCCAGAGT GGTGTGGAGTCTTCTGGTACGGAGGAACCGCTTTTTG-3′(pri-miR-9-1+3bp)(SEQ ID NO：6)。该PCR产物经凝胶纯化，并使用1μL作为模板用于第二轮PCR。所有反应物均含有相同的反向引物和正向引物

(SEQID NO：7)，其与共同的支架残基(粗体)退火并添加T7启动子(斜体)和EcoRI位点(下划线)。第二轮PCR产物经凝胶纯化，用EcoRI和BamHI消化，并连接到pUC19中。含有期望插入物的克隆经序列验证。

对于WTYdaO和pri-miR-9-1融合构建体，我们制备了maxiprep质粒并通过用BamHI过夜消化将它们线性化。转录反应物在5mL的总体积中含有约400μg线性化模板、40mM TrispH7.5、25mM MgCl₂、4mM DTT、2mM亚精胺、40μg无机焦磷酸酶(Sigma)、0.7mg T7 RNA聚合酶和3mM每种NTP。在37℃下温育4.5hr后，将最终MgCl₂浓度调整为40mM，并将反应物温育额外的45分钟。尽管Mg²⁺浓度升高，我们仅观察到HDV核酶的部分切割。对反应物进行乙醇沉淀并用变性的10％聚丙烯酰胺平板凝胶纯化。期望产物通过UV遮蔽可视化并从凝胶上切下。凝胶片在4℃下在30mL TEN缓冲液(150mM NaCl、20mM Tris pH 7.5、1mM EDTA)中压碎并提取过夜。然后，我们将凝胶片旋转下来并在具有10kDa截留分子量(MWCO)的Amicon Ultra-15离心过滤器单元中浓缩RNA。将RNA缓冲液交换至10mM HEPES pH 7.5中3次，并浓缩至约50μL的终体积。

为了在天然凝胶上进行分析，通过将纯化的RNA稀释到5mMTris pH 7.0中来制备5μM RNA储备溶液。接下来，将2.5μL RNA与等体积的2X退火缓冲液混合，该缓冲液含有35mMTris pH 7.0、100mM KCl、10mM MgCl₂和20μM c-di-AMP(Sigma)。将混合物在90℃下加热1分钟，然后在冰上快速冷却，然后在37℃下温育15分钟。将退火的RNA与含有40mMTris pH7.0、50mM KCl、5mM MgCl₂、20％(v/V)甘油和二甲苯氰蓝(xylene cyanol)的2X上样染料混合，并用Tris-硼酸盐(TB)运行缓冲液在10％聚丙烯酰胺凝胶上进行分析。凝胶在SybrGreen II中染色并在Typhoon 9410可变模式成像仪(GE Healthcare)上扫描。

用于结晶的pri-miRNA-YdaO融合物的制备

鉴于我们观察到pri-miR-9-1融合物的HDV自切割效率较差，我们选择改变策略。代替使用核酶来创建同质的3’末端，我们使用PCR来生成转录模板，其中反义DNA链上的两个5’残基是2’-O-甲基化的。已显示这些修饰减少T7 RNA聚合酶添加的非模板化核苷酸(28)。我们利用三轮PCR方法来创建转录模板。以下所有反应物均含有相同的反向引物5′-mCmUCCTTCCTTTATTGCCTCC-3′(SEQ ID NO：8)，其中“m”表示2’-O-甲基化。对于第一轮PCR，我们设置具有Q5聚合酶的50μL反应物，以用正向引物5′-GGTACGGAGGAACCGCTTTTTG-3′(SEQID NO：9)扩增YdaO的3’片段，并进行30个循环的扩增。产物经凝胶纯化并使用1μL作为下一轮的模板。在第二轮PCR中，我们针对每个含有pri-miRNA环和茎序列的构建体使用独特的正向引物，该序列与第一阶段的3’YdaO片段退火。引物序列为

5′-CTATAGGTTGCCGAATCCATATGTGGTACGGAGGAACCGCTTTTTG-3′(19b-2+1bp)(SEQID NO：10)；

5′-CTATAGGTTGCCGAATCCGATCTGGCGGTACGGAGGAACCGCTTTTTG-3′(202+1bp)(SEQID NO：11)；

5′-CTATAGGTTGCCGAATCCGATGCTCGGTACGGAGGAACCGCTTTTTG-3′(208a+1bp)(SEQID NO：12)；

5′-CTATAGGTTGCCGAATCCGTTTACTTGGGTACGGAGGAACCGCTTTTTG-3′(300+1bp)(SEQID NO：13)；

5′-CTATAGGTTGCCGAATCCAAAGTTGGTACGGAGGAACCGCTTTTTG-3′(320b-2+1bp)(SEQID NO：14)；

5′-CTATAGGTTGCCGAATCCATGTCGTTTGGTACGGAGGAACCGCTTTTTG-3′(340+1bp)(SEQID NO：15)；

5′-CTATAGGTTGCCGAATCCACCTAGAAATGGTACGGAGGAACCGCTTTTTG-3′(378a+1bp)(SEQ ID NO：16)；和

5′-CTATAGGTTGCCGAATCCATGATTTGGTACGGAGGAACCGCTTTTTG-3′(449c+1bp)(SEQID NO：17)。

该反应物也是50μL，并使用Q5聚合酶进行30个循环。来自第二轮PCR的产物经琼脂糖凝胶电泳分析以证实扩增，并使用40μL反应物作为第三轮PCR模板而无需进一步纯化。2mL PCR反应物使用Phusion高保真DNA聚合酶(Thermo-Fisher)和正向引物

5′-GCAGAATTCTAATACGACTCACTATAGGTTGCCGAATCC-3′，(SEQ ID NO：18)并运行35个循环。

第三阶段PCR产物在HiTrap Q HP柱(GE Healthcare)上纯化。缓冲液A含有10mMNaCl和10mM HEPES pH 7.5；缓冲液B是相同的，但含有2M NaCl。用20％缓冲液B平衡柱，并以2ml/min用至50％B的线性梯度洗脱期望的DNA产物10分钟。我们分析了琼脂糖凝胶上的峰级分，以证实它们含有正确大小的单个条带。然后合并峰级分，并在Amicon过滤器单元(10kDa MWCO)中浓缩，然后用水清洗以除去过量的盐。DNA模板的浓度(约200μL终体积)由UV吸光度测定。

pri-miR-9-1融合物的转录反应如上所述建立，但体积为10mL，并含有2.8fmolDNA模板。反应在37℃下运行4小时，然后进行苯酚-氯仿提取。转录在Amicon过滤器单元(10kDa MWCO)中浓缩并用0.1M三甲胺-乙酸(TEAA)pH7.0清洗。将RNA(约2mL)注射到恒温为54℃的Waters XTerra MS C18反相HPLC柱(3.5μm粒径，尺寸为4.6x150mm)上。使用TEAA和100％乙腈作为流动相。用6％乙腈清洗柱，并以0.4ml/min用至17％乙腈的梯度洗脱RNA 80分钟。在变性10％聚丙烯酰胺凝胶上分析峰级分。合并纯的级分并使用Amicon过滤单元缓冲液交换到10mM HEPES pH7.0中。将RNA浓缩至＜50μL终体积，并由UV吸光度测定浓度。

结晶、数据收集和结构测定

所有RNA-c-diAMP复合物均如所述制备(15)。简而言之，将含有0.5mM RNA、1mM c-di-AMP、100mM KCl、10mM MgCl₂和20mM HEPES pH 7.0溶液加热至90℃持续1分钟，在冰上快速冷却，并在结晶前立即在37℃下平衡15分钟。在含有0.5mL孔溶液的24孔板中进行筛选；悬滴由1μL RNA加上1μL孔溶液组成。板在室温下温育，并且晶体通常在一周内长到满尺寸(100μm至超过200μm)。对于19b-2+1bp，孔溶液含有1.7M(NH₄)₂So₄、0.2M Li₂SO₄和0.1MHEPES pH7.1。对于202+1bp、208a+1bp和320b-2+1bp，孔含有1.9M(NH₄)₂SO₄、0.2M Li2SO₄和0.1M HEPES pH7.4。用于378a+0bp的孔溶液含有1.7M(NH₄)₂SO₄、0.2M Li₂SO₄和0.1M HEPESpH7.4。对于其余构建体，在96孔板中进行结晶，悬滴由0.4μLRNA加上0.4μL孔溶液组成。对于300+1bp，孔溶液含有1.88M(NH4)₂SO₄、0.248M Li2SO₄和0.1MHEPES pH7.4，并且对于300+0bp，它含有1.90M(NH₄)₂So₄、0.158M Li₂So₄和0.1M HEPES pH7.4。构建体340+1bp从含有1.89M(NH₄)₂SO₄、0.214MLi₂SO₄和0.1M HEPES pH 7.4的孔溶液结晶。构建体378a+1bp从1.63M(NH₄)₂SO₄、0.272M Li₂SO₄和0.1M HEPES pH 7.4结晶。对于构建体449c+1bp，孔含有1.89M(NH₄)₂SO₄、0.128M Li₂SO₄和0.1M HEPES pH 7.4。

将所有晶体短暂浸泡在含有20％(w/v)PEG3350、20％(v/v)甘油、0.2M(NH₄)₂SO₄、0.2M Li₂SO₄和0.1M HEPES pH7.3的冷冻保护剂溶液中，然后在液氮中闪冻。在先进光子源束线24-ID-C或先进光源束线8.3.1下以100K收集数据。对于所有构建体，我们收集了波长为约

的原生数据集。对于320b-2+1bp、378a+0bp和449c+1bp，我们通过分别从1、2或3个晶体中收集

约额外高冗余数据集来测量磷反常散射。使用XDS对数据进行索引、整合和缩放(29)。

在反常数据可用的情况下，我们使用组合的分子置换/单一反常散射方法(MR-SAD)生成了部分实验阶段。分子置换模型由YdaOc-di-AMP核糖开关结构(PDB ID：4QK8)组成，P2茎上的GAAA四环已从模型中除去。使用Phenix中Phaser-MR方案中的默认设置获得相位(30)。

对于所有构建体，我们通过使用Phenix对数据执行MR模型(上图)的刚体拟合(如可用，包括实验相位约束)来获得初始解决方案。这产生了具有R_工作＜30％的出色的初始模型。然后我们检查了P2茎的区域中的电子密度图。对于所有RNA，在2F_o-F_c和差异图中可以清楚地看到缺失碱基对和环的额外密度。然后我们在Coot中对缺失的残基进行建模(31)。在密度不清晰的情况下，我们停止了不完整环的建模，并用Phenix执行了另一轮坐标、ADP和TLS参数细化。这通常揭示了缺失残基的额外密度。一旦将环完全建模，我们如上述执行细化的后续轮和手动调整，直到获得合理的R因子和模型几何形状。

在Phenix中计算了模拟退火复合省略图(图7)。在19b-2+1bp、202+1bp、320b-2+1bp、340+1bp和378a+1bp的情况下，标准退火温度(5000℃)和其他默认参数产生了合理的图。然而，对于300+0bp、300+1bp和378a+0bp，默认设置生成了具有破坏密度区域的噪声图。为了提高图的质量，我们将退火温度降低到1000℃，并从省略的区域中排除散装溶剂掩模。这种类型的复合省略图被称为Polder图，并且防止溶剂掩膜遮挡较弱的密度(32)。

与PDB中已知的RNA环结构的比较

为了鉴定PDB中与我们的pri-miRNA环模型结构相似的RNA环，我们首先提取了pri-miRNA顶端接界和环的坐标。搜索池是用于鉴定上述结晶支架的同一组RNA结构。对于PDB集中的每个结构，我们使用DSSR来鉴定所有发夹环。我们从每个发夹环中提取RNA序列，并消除比pri-miRNA序列短的环。对于比pri-miRNA更长的环，我们使用滑动窗口来获得具有相同长度的环的所有片段。然后使用Rosetta中的“rna_thread”例行程序将每个环序列穿线到pri-miRNA模型上(33)。使用PyMOL脚本，我们将所得的穿线模型与原始发夹环比对，并计算两个模型之间的RMSD。我们对所有PDB结构的RMSD数据进行聚合和排序，并手动检查了具有小RMSD的环，以找到具有结构相似性的命中物。

光学熔解

用于光学熔解实验的RNA在体外从合成DNA模板(IDT)转录。使用的寡核苷酸模板序列是

和

T7启动子以斜体显示，而pri-miRNA接界/环区段以粗体显示。模板用与T7启动子互补的第二链退火，并添加到如上所述的大规模(10mL)转录反应物中。反应物用乙醇沉淀，在20％聚丙烯酰胺变性凝胶上纯化。通过UV遮蔽恢复期望的条带。凝胶提取后，将样品缓冲液交换到水中并在Amicon离心过滤器装置中浓缩。

对于每种RNA，在50mM NaCl和10mM二甲胂酸钠pH7.0中制备一组6个稀释物，使得初始吸光度范围为约1.0至0.1AU。通过加热至95℃持续1分钟并在冰上快速冷却来退火样品，然后平衡至12℃。使用配备有Peltier型温度控制样品转换器的Cary Bio 300 UV-可见分光光度计进行熔解测量。当以0.8℃/min的速率将RNA从12℃加热到92℃时，记录260nm处的吸光度。使用Prism(GraphPad，版本7)分析熔解曲线并用方程

拟合，其中吸光度(A)近似为温度(T)的函数。熵(ΔS)和焓(ΔH)的变化以及双链(m_f和b_f)和单链(m_u和b_u)线性区域的斜率(m)和y截距(b)均是拟合的。然后从这些参数推导出熔解温度和37℃下的热力学参数(表2)。

电泳迁移率变动分析

如前所述，人血红素结合的Rhed蛋白在大肠杆菌中过表达，并使用离子交换和尺寸排阻色谱法纯化(25)。通过体外转录制备放射性标记的pri-miRNA茎-环(图8b-i)。DNA模板由覆盖期望序列的反义寡核苷酸加上T7启动子组成，退火成具有T7启动子序列的有义寡核苷酸(34)。每个20μL的转录反应物含有50fmol模板、40mM Tris pH 7.5、25mM MgCl₂、4mMDTT、2mM亚精胺、2μg T7 RNA聚合酶、0.5mM ATP、UTP、CTP和GTP中的每一种3mM，和3nmol α-³²P-ATP(10μCi)。转录在37℃下运行2小时，并在变性15％聚丙烯酰胺凝胶上纯化RNA。RNA在4℃下在TEN缓冲液中提取过夜，异丙醇沉淀，并重悬浮在40μL水中。

我们采用了最近报道的EMSA规程来检查Rhed-pri-miRNA相互作用(35)。将RNA稀释在100mM NaCl、20mM Tris pH 8.0中并在90℃下加热1分钟，然后在冰上快速冷却。将退火的RNA添加到含有10％(v/v)甘油、c.1mg/ml酵母tRNA、0.1mg/ml BSA、5μg/ml肝素、0.01％(v/v)辛基苯氧基聚乙氧基乙醇(IGEPAL CA-630)、0.25单位RNase-OUT核糖核酸酶抑制剂、二甲苯氰蓝、20mM Tris pH8.0和0-20μM Rhed蛋白的结合反应物中。溶液的最终盐浓度为150mM NaCl。在加载到10％聚丙烯酰胺凝胶上之前，在室温下温育结合反应物30分钟。凝胶和电泳缓冲液均含有80mM NaCl、89.2mM Tris碱和89.0mM硼酸(最终pH 8.2)。凝胶在4℃下以110V运行45分钟，然后干燥并暴露于贮存荧光屏。随后在Typhoon扫描仪(GEHealthcare)上扫描屏幕。使用Quantity One软件(BioRad)对游离和结合的RNA条带进行量化，并用Prism中的希尔方程拟合。

分子动力学模拟

从每个晶体结构中提取对应于pri-miRNA残基加上来自支架的P2茎的两个G-C对的坐标。将氢添加到GROMACS中的模型中(36)，并将RNA溶解在具有TIP3P水分子的截短十二面体盒中。盒子足够大以将RNA与其自身的任何周期性拷贝间隔至少1nm。接下来，将K⁺和Cl^-离子添加到系统中以中和净电荷并使最终KCl浓度为0.1M。采用CHARMM27力场、Verlet截止方案和粒子网格埃瓦尔德(particle-mesh Ewald)静电学用于所有计算。将系统能量最小化，直到作用在任何原子上的最大力小于900kJ/mol/nm。系统的最终势能在-1.3x10⁵kJ/mol的范围内。

接下来，以两个步骤初始平衡系统，首先在NVT系综中，然后在NPT系综中。两种平衡模拟均使用2fs的时间步长在300K下运行2ns。在NVT期间，通过速度重新调整来控制温度。对于NPT，使用Parrinello-Rahman恒压器将压力维持在1bar。对于生产MD运行，对来自支架的G-C对应用位置约束，并且所有pri-miRNA核苷酸不受约束。所有生产模拟均在NPT中以2fs的时间步长运行，总共1μs。使用GROMACS中的rmsf和聚类功能来分析轨迹。

pri-miR-223高通量加工测定的再分析

先前报道的pri-miRNA-223加工测定的测序数据是从序列片段归档(SequenceRead Archive)下载的(登录号：SRA051323)(5)。使用Bowtie2比对对应于pri-miR-223的读段(37)。消除了任何含有未知核苷酸的读段。来自输入或选择文库的读段由其对应的条形码分隔，并用Python进行计数。

表1.pri-miRNA环融合结构的数据收集和细化统计。

表2. 50mM NaCl下pri-miRNA顶端接界和环折叠的热力学参数，报告为±标准偏差。

公开参考文献

1.Ha，M.and V.N.Kim，Regulation of microRNA biogenesis.Nat.Rev.M0l.CellBiol.，2014.15：509-24.

2.Krasilnikov，A.S.，et al.，Crystal structure of the specificity domainof ribonucleaseP.Nature，2003.421：760-4.

3.Reiss，C.W.，Y.Xiong，and S.A.Strobel，Structural Basis for LigandBinding to the Guanidine-I Riboswitch.Structure，2017.25：195-202.

4.Byrne，R.T.，et al.，The crystal strucrute of unmodified tRNAPhe fromEscherichia coli.Nucleic Acids Res.2010.38：4154-62.

5.Auyeung，V.C.，et al.，Beyond secondary structure：primary-sequencedeterminants license pri-miRNA hairpins for processing.Cell，2013.152：844-58.

6.Chen，Y.，et al.，Rbfox proteins regulate microRNA biogenesis bysequence-specific binding to their precursors and target downstreamDicer.Nucleic Acids Res.，2016.44：4381-95.

7.Zeng，Y.，R.Yi，and B.R.Cullen，Recogntiion and cleavage of primarymicroRNA precursors by the nuclear processing enzyme Drosha.EMBO J，2005.24：138-148.

8.Zhang，X.and Y.Zeng，The terminal loop region controls microRNAprocessing by Drosha and Dicer.Nucleic Acids Res，2010.38：7689-97.

9.Ma，H.，et al.，Lower and upper stem-single-stranded RNA junctionstogether determine the Drosha cleavage site.Proc Natl Acad Sci U S A，2013.110：20687-92.

10.Fang，W.and D.P.Bartel，The Menu of Features that Define PrimaryMicroRNAs and Enable Dw Novo Design of MicroRNA Genes.MOl.Cell，2015.60：131-45.

11.Shortridge，M.D.，et al.，A Macrocyclic Peptide Ligand Binds theOncogenic MicroRNA-21 Precursor and Suppresses Dicer Processing.ACSChem.BiOl.，2017.12：1611-1620.

12.Chirayil，S.，et al.，NMR characrerizarion of an oligonucleotidemodel of the miR-21pre-element.PloS One，2014.9：e108231.

13.Kozomara，A.and S.Grifriths-Jones，miRBase：inregrating microRNAannoration and deep-sequencing data.Nucleic Acids Res.，2011.39：D152-7.

14.Zuker，M.，Mfold web server for nucleic acid folding andhybridization prediction.Nucleic Acids Res，2003.31：3406-3415.

15.Gao，A.and A.Serganov，Structural insights into recognition of c-di-AMP by the ydaO riboswitch.Nat.Chem.Biol.，2014.10：787-92.

16.Serra，M.J.，T.J.Axenson，and D.H.Turner，A model for the stabilitiesof RNA hairpins based on a study of the sequence dependence of stability forhairpins of six nucleotides.Biochemistry，1994.33：14289-96.

17.Triboulet，R.，et al.，Post-transcriptional control of DGCR8expression by the Microprocessor.RNA，2009.15：1005-11.

18.Kadener，S.，et al.，Genome-wide identification of targets of thedrosha-pasha/DGCR8 complex.RNA，2009.15：537-45.

19.Macias，S.，et al.，DGCR8 HITS-CLIP reveals novel functions for theMicroprocessor.Nat.Struct.Mol.Biol.，2012.19：760-766.

20.Heras，S.R.，et al.，The Microprocessor controls the activity ofmammalian retrotransposons.Nat Struct Mol Biol，2013.20：1173-81.

21.Han，J.，et al.，Posttranscriptional crossregulation between Droshaand DGCR8.Cell，2009.136：75-84.

22.Moon，A.F.，et al.，Asynergistic approach to protein crystallization：combination of a fixed-arm carrier with surface entropy reduction.ProteinSci.，2010.19：901-13.

23.Terasaka，N.，et al.，A human microRNA precursor binding to folicacid discovered by small RNA transcriptomic SELEX.RNA，2016.22：1918-1928.

24.Nguyen，T.A.，et al.，Functional Anatomy of the HumanMicroprocessor.Cell，2015.161：1374-87.

25.Quick-Cleveland，J.，et al.，The DGCR8 RNA-binding heme domainrecognizes primary microRNAs by clamping the Hairpin.Cell Rep.，2014.7：1994-2005.

26.Michlewski，G.，et al.，Posttranscriptional regulation of miRNAsharboring conserved terminal loops.Mol Cell，2008.32：383-93.

27.Brakier-Gingras，L.，J.Charbonneau，and S.E.Butcher，Targetingframeshifting in the human immunodeficiency virus.Expert Opin.Ther.Targets，2012.16：249-58.

28.Kao，C.，M.Zheng，and S.Rudisser，A simple and efficient method roreduce nontemplated nucleotide addition at the 3 terminus of RNAs transcribedby T7 RNA polymerase.RNA，1999.5：1268-72.

29.Kabsch，W.，XDS.Acta Crystallogr.D Biol.Crystallogr.，2010.66：125-32.

30.Adams，P.D.，et al.，PHENIX：a comprehensive Python-based system formacromolecular structure solution.Acta Crystallogr D Biol Crystallogr，2010.66：213-21.

31.Emsley，P.，et al.，Features and development of Coor.ActaCrystallogr.D Biol.Crystallogr.，2010.66：486-501.

32.Liebschner，D.，et al.，Polder maps：improving OMIT maps by excludingbulk solvent.Acta crystallographica.Section D，Structural biology，2017.73：148-157.

33.Cheng，C.Y.，F.C.Chou，and R.Das，Modeling complex RNA tertiary foldswith Rosetta.Methods Enzymol.，2015.553：35-64.

34.Milligan，J.F.，et al.，Oligoribonucleotide synthesis using T7 RNApolymerase and synthetic DNA templates.Nucleic Acids Res.，1987.15：8783-98.

35.Partin，A.C.，et al.，Heme enables proper positioning of Drosha andDGCR8 on primary microRNAs.Nat.Commun.，2017.8：1737.

36.Abraham，M.J.，et al.，GROMACS：High performance molecular simulationsthrough multi-levelparallelism from laptops ro supercomputers.SoftwareX，2015.1-2：19-25.

37.Langmead，B.and S.L.Salzberg，Fast gapped-read alignment with Bowtie2.Nat.Methods，2012.9：357-9.

结论

本发明的优选实施方案的描述到此结束。出于说明和描述的目的，已经呈现了本发明的一个或多个实施方案的前述描述。它不旨在穷举或将本发明限制为所公开的精确形式。鉴于上述教导，许多修改和变化都是可能的。

本文引用的所有出版物、专利和专利申请均出于所有目的通过引用整体在此并入。

Claims

1.物质组合物，其包含与以下具有至少90％序列同一性的核糖核酸：

GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO:1)，其中：所述核糖核酸的残基14-17(GAAA)经长度在4到33个核苷酸之间的核酸的异源区段替换。

2.权利要求1所述的组合物，其进一步包含结合至所述核糖核酸的试剂。

3.权利要求2所述的组合物，其中所述试剂是与所述核糖核酸杂交的多核苷酸。

4.权利要求1所述的组合物，其中所述核酸的异源区段在天然存在的RNA分子中形成环结构。

5.权利要求4所述的组合物，其中所述核酸的异源区段包括所述天然存在的RNA分子中完整的环结构，以及任选地茎结构的0-5个碱基对。

6.用于观察RNA结构的系统/试剂盒，其包含：

质粒，其包含编码与以下具有至少90％同一性的核糖核酸的DNA序列：

GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO:1)。

7.权利要求6所述的系统/试剂盒，其进一步包含用于表达所述核糖核酸的启动子。

8.权利要求7所述的系统/试剂盒，其进一步包含RNA聚合酶。

9.权利要求6所述的系统/试剂盒，其进一步包含与所述质粒中的核酸段杂交的一种或多种引物。

10.获得关于核糖核酸的结构的信息的方法，其包括：

获得与SEQ ID NO:1具有至少90％同一性的核糖核酸；

将对应于SEQ ID NO:1中环残基14-17(GAAA)的残基用长度在4至33个核苷酸之间的核酸的异源区段取代，以形成融合核糖核酸分子；

使所述融合核糖核酸分子结晶；

对所述融合核糖核酸分子进行X射线或电子晶体学技术；和

观察所述X射线或电子晶体学技术的结果，从而获得关于所述核酸的异源区段的结构的信息。

11.权利要求10所述的方法，其中在所述晶体学分析之前将所述融合核糖核酸分子与结合至所述核糖核酸的试剂组合。

12.权利要求11所述的方法，其中所述试剂是与所述核糖核酸杂交的多核苷酸。

13.权利要求11所述的方法，其中所述晶体学分析包括与缺乏所述结合至所述核糖核酸的试剂的对照样品进行比较。

14.权利要求11所述的方法，其中在所述X射线或电子晶体学技术之前，将多个融合核糖核酸分子与多种结合至所述核糖核酸的试剂组合。

15.权利要求14所述的方法，其中将至少两种试剂与所述融合核糖核酸分子组合。

16.对多核苷酸进行晶体学分析的方法，所述方法包括：

(a)选择第一多核苷酸，其中所述第一多核苷酸包含第一miRNA的多核苷酸序列；

(b)鉴定在所述第一miRNA中形成第一环区的多核苷酸的区段；

(c)选择第二多核苷酸，其中所述第二多核苷酸包含第二miRNA的多核苷酸序列；

(d)鉴定在所述第二miRNA中形成第一环区的多核苷酸的区段；

(e)形成融合多核苷酸，其经构建使得包含所述第一多核苷酸上的第一环区的所述多核苷酸的区段经包含所述第二多核苷酸上的第一环区的所述多核苷酸的区段取代；和

(f)对所述融合多核苷酸进行晶体学分析，以便观察所述融合多核苷酸的三维结构；

从而进行所述多核苷酸的晶体学分析。

17.权利要求16所述的方法，其中所述第一miRNA是与以下具有至少90％序列同一性的miRNA：

GGUUGCCGAAUCCGAAAGGUACGGAGGAACCGCUUUUUGGGGUUAAUCUGCAGUGAAGCUGCAGUAGGGAUACCUUCUGUCCCGCACCCGACAGCUAACUCCGGAGGCAAUAAAGGAAGGAG(SEQ ID NO:1)，其中：所述核糖核酸的残基14-17(GAAA)经长度在4到33个核苷酸之间的包含所述第二多核苷酸上的第一环区的核酸的异源区段替换。

18.权利要求17所述的方法，其中：

所述第一多核苷酸包含SEQ ID NO:1的序列；和/或

所述第二miRNA包含人miRNA。

19.权利要求17所述的方法，其中所述晶体学分析是X射线或电子晶体学技术。

20.权利要求17所述的方法，其中所述晶体学分析在结合至所述融合多核苷酸的试剂存在下进行。