CN104388548B

CN104388548B - 一种高通量环状rna测序的方法

Info

Publication number: CN104388548B
Application number: CN201410604748.2A
Authority: CN
Inventors: 周俊飞; 高利芬; 陈利红; 李丽丽; 彭海; 张继; 方治伟
Original assignee: Jianghan University
Current assignee: Jianghan University
Priority date: 2014-10-31
Filing date: 2014-10-31
Publication date: 2017-01-18
Anticipated expiration: 2034-10-31
Also published as: CN104388548A

Abstract

本发明公开了一种高通量环状RNA测序的方法，属于分子生物学领域。该方法包括：人工合成外源线性ERCC‑0004‑RNA和外源环状ERCC‑0013‑RNA；对外源环状ERCC‑0013‑RNA进行质量控制；将外源线性ERCC‑0004‑RNA和外源环状ERCC‑0013‑RNA按等摩尔比混合，得到混合外源RNA；向待测序样本的总RNA中加入混合外源RNA，得到第一混合物；去除第一混合物中的核糖体RNA，得到第二混合物；对第二混合物进行3’末端生物素标记，并去除标记上生物素的套索RNA及线性RNA，得到第三混合物；去除第三混合物中的线性RNA，得到第四混合物；对第四混合物进行标准的高通量转录组测序并对测序数据进行生物学分析。本发明能够准确反映出生物体内的基因在特定条件下的表达情况，降低了的成本。

Description

一种高通量环状RNA测序的方法

技术领域

本发明涉及分子生物学领域，特别涉及一种高通量环状RNA测序的方法。

背景技术

生物体内大部分的RNA为线性，但有少部分RNA首尾连接形成环状，被称为环状RNA。早在1980年，环状RNA就首次被发现，但是30年来，由于研究方法的限制，人们对于环状RNA的了解知之甚少，直至近年来，随着高通量测序技术的高速发展，并结合生物信息学的方法，大规模的转录组数据被深入挖掘，研究者们从中发现了大量的环状RNA信息，从而使得环状RNA迅速成为RNA世界研究的新热点，继而衍生出了有针对性的环状RNA测序，这也极大地加快了对环状RNA的发现及对环状RNA功能的分析。在现有的高通量转录组测序中，通过在样本中混入外源转录本作为参考，可以直接评估差异表达基因的检测的灵敏度、高通量测序文库的质量及基因表达倍数变化。

研究环状RNA的前提是将环状RNA从生物体内分离出来，目前还没有直接从生物体内获取环状RNA的方法，只能从总RNA中去除线性RNA，间接达到富集环状RNA的目的。在现有的研究方法下，虽然能够对线性RNA分子进行消化，但是效果并不明显，从环状RNA的测序数据中可见，仅仅只有不到1％是环状RNA分子的序列，而其余的99％都是无用的数据。要获取足够分析环状RNA的有效数据量，单个样本的测序数据量需要达到100M，这对于高通量测序而言，仍然是个非常庞大的数字，这也意味着巨额的人力物力财力的投入。

发明内容

为了解决现有技术中总RNA中的环状RNA无法准确测序的问题，本发明实施例提供了一种高通量环状RNA测序的方法。所述技术方案如下：

本发明实施例提供了一种高通量环状RNA测序的方法，所述方法包括：

人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA，所述人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA，包括：

选择外源ERCC-0004基因和外源ERCC-0013基因，所述外源ERCC-0004基因如序列表中SEQ ID NO:1所示，所述外源ERCC-0013基因如序列表中SEQ ID NO:2所示；

将所述外源ERCC-0004基因和所述外源ERCC-0013基因分别克隆到原核表达载体中，分别获得克隆的外源ERCC-0004基因和克隆的外源ERCC-0013基因；

将获得的所述克隆的外源ERCC-0004基因和所述克隆的外源ERCC-0013基因进行体外转录，分别合成所述外源线性ERCC-0004-RNA和外源线性ERCC-0013-RNA；

去除所述外源线性ERCC-0013-RNA的5’端的三磷酸结构，并将所述外源线性ERCC-0013-RNA的5’端修饰羟基；

对5’端修饰羟基的所述外源线性ERCC-0013-RNA进行磷酸化修饰，合成5’端经磷酸化修饰的所述外源线性ERCC-0013-RNA；

将所述5’端经磷酸化修饰的外源线性ERCC-0013-RNA的5’端和3’端连接；

去除未环化成功的所述外源线性ERCC-0013-RNA，得到所述外源环状ERCC-0013-RNA；

对所述外源环状ERCC-0013-RNA进行质量控制；

将所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA按等摩尔比混合，得到混合外源RNA；

向待测序样本的总RNA中加入所述混合外源RNA，所述总RNA与所述混合外源RNA的质量比为2000:1，得到第一混合物；

去除所述第一混合物中的核糖体RNA，得到第二混合物；

对所述第二混合物进行3’末端生物素标记，并去除被标记上生物素的套索RNA及线性RNA，所述线性RNA包括所述总RNA中的内源线性RNA和所述外源线性ERCC-0004-RNA，得到第三混合物；

去除所述第三混合物中残留的所述线性RNA，得到第四混合物；

对所述第四混合物进行高通量转录组测序并对测序数据进行生物学分析。

进一步地，所述待测序样本的基因中不存在与所述外源ERCC-0004基因和所述外源ERCC-0013基因相同或同源性高的基因。

进一步地，对所述外源环状ERCC-0013-RNA进行质量控制，包括：

利用随机引物对所述外源环状ERCC-0013-RNA进行逆转录，合成外源ERCC-0013-cDNA，所述外源ERCC-0013-cDNA包括外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA；

利用第一引物和第二引物分别对所述外源ERCC-0013-cDNA进行实时定量PCR扩增，所述第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ IDNO:4所示的第一反向引物，所述第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物，所述第一引物用于扩增所述外源线性ERCC-0013-cDNA和所述外源环状ERCC-0013-cDNA，所述第二引物用于扩增所述外源环状ERCC-0013-cDNA，通过所述第一引物扩增获得C_T1值，通过所述第二引物扩增获得C_T2值；

通过C_T1值和C_T2值以及公式2[C_T2-C_T1]×100％，计算合成的所述外源环状ERCC-0013-RNA的环化比例，并选用环化比例超过90％的所述外源环状ERCC-0013-RNA。

具体地，采用RNA酶R去除所述第二混合物中的线性RNA。

具体地，向所述待测序样本的总RNA中，加入所述混合外源RNA，所述总RNA与所述混合外源RNA的质量比为2000:1。

进一步的，采用RNA酶R去除未环化成功的所述外源线性ERCC-0013-RNA。

具体地，采用链霉亲和素磁珠去除被标记上所述生物素的套索RNA及所述线性RNA。

具体地，所述生物学分析包括：获得所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA的相对比例、以及以所述外源环状ERCC-0013-RNA为参考分析所述待测序样本中的环状RNA基因表达变化。

本发明实施例提供的技术方案带来的有益效果是：本发明实施例提供了一种高通量环状RNA测序的方法，模拟真核生物内源转录本的特征，用于评估RNA测序工具的系统性能，及基因差异表达的检测灵敏度，通过加入人工合成的外源线性RNA与环状RNA，可以为环状RNA的表达量提供一个外源环状RNA参考基因，通过外源环状RNA的表达量，可以计算样本中内源基因的表达量变化倍数，从而更准确的反映出生物体内的基因在特定条件下的表达情况；此外，通过对具有3’未端的RNA进行生物素标记，之后再利用链霉亲和素磁珠捕获被标记上生物素的RNA的方法，进一步去除线性RNA和套索RNA，提高了样品中环状RNA的富集度，减少单个样本的环状RNA测序数据量，比常用的环状RNA高通量测序方法效率提高了14倍多，大幅的降低了高通量测序的成本。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将结合附图对实施例描述中所需要使用的附图作简单地介绍，显而易见，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的高通量环状RNA测序的方法流程图；

图2是本发明实施例提供的现有的环状RNA测序的方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明实施方式作进一步地详细描述。本方案中未特别说明的试剂均为常用市售试剂，且不同市售试剂效果差异不大。

实施例

本发明实施例提供了一种环状RNA测序的新方法，本发明实施例提供的待测序样本为莱茵衣藻，且该莱茵衣藻的品系为CC503(购自于衣藻资源中心，网址为：http://chlamycollection.org/)，如图1所示，具体方法包括：

步骤100：人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA。已有的环状RNA测序中是采用一个外源线性RNA作为参照(阴性参照)。本发明实施例中，人工合成了外源环状RNA与外源线性RNA，按比例加入总RNA后作为参照，以模拟体内稳定表达的内源环状RNA与内源线性RNA。本发明实施例提供的外源环状RNA与外源线性RNA在待测序样本中没有相同序列或同源性较高的序列，因为一旦加入总RNA中之后，是无法将外源RNA与内源RNA区分开的，若二者存在重叠，将导致结果不准确。此外，外源基因长度也不能过长，否则影响环化效率。本发明实施例将RNA对应的DNA序列转入质粒中，通过质粒增殖而增加相应的DNA的量，从而灵活获得大量DNA序列，再通过体外转录，将质粒上的DNA转录为RNA。为此，在该DNA序列前端添加了体外转录启动子序列。因转录成的RNA需要纯化，所以在DNA的末端设计了寡聚T，转录后形成寡聚A尾巴，寡聚A可用于纯化RNA。合成的外源RNA是线状，需要环化后才能成为环状RNA。由于合成时的RNA的5’端为三磷酸基团，连接时需要单磷酸基团，为此，在去掉了外源RNA的三磷酸基团后，省去了加上单磷酸基团这一步，从而合成能够环化成环状的前体RNA的状态。具体操作步骤如下：

1、选择外源ERCC-0004基因和外源ERCC-0013基因，该外源ERCC-0004基因如序列表中SEQ ID NO:1所示，该外源ERCC-0013基因如序列表中SEQ ID NO:2所示。

上述SEQ ID NO:1、SEQ ID NO:2及其互补链由生工生物工程(上海)股份有限公司合成。

通过NCBI的BLAST程序检索，没有发现生物中存在外源ERCC-0004基因和外源ERCC-0013基因、以及与外源ERCC-0004基因和外源ERCC-0013基因的同源基因。选择的外源ERCC-0004基因和外源ERCC-0013基因的长度不超过1000bp。分别在外源ERCC-0004基因和外源ERCC-0013基因的5’端和3’端分别添加了ctcgag和aagctt序列，该ctcgag和aagctt序列分别为限制性内切酶Xho I和Hind III的酶切位点，便于将外源ERCC-0004基因和外源ERCC-0013基因克隆进入原核表达载体，外源ERCC-0004基因和外源ERCC-0013基因的5’端的taatacgactcactata序列为T7转录酶的启动子序列，其余序列为可转录的序列。在taatacgactcactata序列之后连接有ggg序列，ggg序列能够增加T7转录酶的转录效率。

2、将外源ERCC-0004基因和外源ERCC-0013基因分别克隆到原核表达载体中，获得克隆的外源ERCC-0004基因和ERCC-0013基因，包括：

所选用的克隆载体为pBluescript II SK(+)(该克隆载体从长沙赢润生物技术有限公司购买，货号为VKS0288)，采用内切酶Xho I(购买自NEB公司，货号为R0146)和内切酶Hind III(购买自NEB公司，货号为R0104)对pBluescript II SK(+)载体进行双酶切。具体地，在20μl的反应体系中，包含有10μg pBluescript II SK(+)载体、20U的内切酶HindIII、20U的内切酶Xho I和2×的NEBuffer 2.1(由NEB公司提供)。将上述反应体系混合均匀，经短暂离心，于37℃保温1小时后，经80℃，20分钟将酶失活，纯化获得线性pBluescriptII SK(+)载体，该线性pBluescript II SK(+)载体的浓度为0.5μg/μl。

将外源ERCC-0004基因和外源ERCC-0013基因用无菌水溶解后，分别配制成浓度为0.5μg/μl的溶液，将外源ERCC-0004基因及其互补链按体积比1：1混合均匀，于PCR仪中依次经历94℃10分钟；65℃10分钟和37℃10分钟，形成外源ERCC-0004-双链DNA基因；将外源ERCC-0013基因及其互补链按相同的方法进行处理，获得外源ERCC-0013-双链DNA基因。

在20μl的反应体系中包括线性的pBluescript II SK(+)载体10μl、外源ERCC-0004-双链DNA基因1μl、T4DNA连接酶(购买自NEB公司，货号为M0202)400U和1×T4DNA连接酶缓冲液(随T4DNA连接酶一起购买自NEB公司)，16℃温育过夜后，65℃10分钟，使T4DNA连接酶热失活，获得含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体。按同样的方法，获得含有外源ERCC-0013基因的pBluescript II SK(+)质粒载体。

利用热激法将含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体转化进入大肠杆菌，具体方法如下：取50μl感受态细胞(由北京全式金生物技术有限公司生产，目录号为CD501)在冰浴中缓慢解冻，加入含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体，轻轻混匀，在冰浴上孵育30分钟，42℃热激30秒，快速转移至冰浴中冰浴3分钟，该过程中不要摇动离心管，然后加入300μl不含抗生素的无菌LB液体培养基(LB液体培养基成份：牛肉膏0.5g，蛋白胨1.0g，氯化钠0.5g，蒸馏水100mL，pH7.2～7.5)，于37℃，200转/分钟，复苏1小时，取复苏后的菌液200μl均匀涂布于含氨苄青霉素抗性的LB固体培养基(LB固体培养基包括：胰蛋白胨10g/L、酵母提取物5g/L、氯化钠10g/L和琼脂粉15g/L)上，待菌液完全吸收后倒置于37℃恒温培养箱中，暗培养过夜。挑取LB固体培养基上长出来的单克隆至5ml含氨苄青霉素的LB液体培养基中，经37℃，200转/分钟，摇菌扩增繁殖6-8小时，获得的菌液用于提取质粒。

利用天根生化科技(北京)有限公司生产的快速质粒小提试剂盒(货号为DP105)从上述菌液中，提取并纯化含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体的DNA，提取与纯化的方法按照随试剂盒提供的说明书进行。利用分光光度计(美国Quawell公司生产，型号为Q5000)中的双链DNA程序，检测纯化后的pBluescript II SK(+)质粒的质量浓度。利用外源ERCC-0004基因的PCR引物从纯化后的pBluescript II SK(+)质粒上扩增外源ERCC-0004基因。具体地，20μl的扩增体系包括：纯化后的pBluescript II SK(+)质粒50ng、10μl Q5高保真扩增混合物(购自于NEB公司，货号为M0492)和10μM的外源ERCC-0004基因的PCR引物(该PCR引物为正向引物与反向引物的混合物)。扩增程序如下：98℃，30秒；(98℃，8秒；56℃，20秒；72℃，20秒)×30个循环。将PCR产物利用乙醇沉淀进行纯化，纯化产物溶解于10μl无核酸酶的水中，获得外源线性ERCC-0004基因的PCR产物，利用Q5000(美国Quawell公司生产，型号为Q5000)中的双链DNA定量程序对PCR产物进行定量检测，检测结果表明：本次扩增获得的外源线性ERCC-0004基因的PCR产物浓度为610ng/μl。扩增产物送至武汉擎科生物技术有限公司测序，确认克隆的ERCC-0004的正确性，从而获得含有正确克隆外源ERCC-0004基因的Bluescript II SK(+)质粒与外源线性ERCC-0004基因的PCR产物。按同样的方法，获得含有正确克隆外源ERCC-0013基因的Bluescript II SK(+)质粒与外源线性ERCC-0013基因的PCR产物。

其中，外源ERCC-0004基因的PCR引物的正向引物如序列表中SEQ ID NO:7所示，外源ERCC-0004基因的PCR引物的反向引物如序列表中SEQ ID NO:8所示；外源ERCC-0013基因的PCR引物的正向引物如序列表中SEQ ID NO:7所示，外源ERCC-0013基因的PCR引物的反向引物如序列表中SEQ ID NO:9所示。其中，SEQ ID NO:7与SEQ ID NO:9中的多聚T序列是为了在转录时获得多聚A，用于模拟生物RNA的多聚A尾巴，多聚A尾巴可用于RNA的逆转录和纯化。

3、将克隆的外源ERCC-0004基因和ERCC-0013基因通过体外转录，合成外源线性ERCC-0004-RNA和外源线性ERCC-0013-RNA，包括：

采用T7RNA快速高效合成试剂盒(购自于NEB公司，货号为E2050)转录合成外源ERCC-0004-RNA。该试剂盒中的成份包括：无核酸酶的水、含有NTP的缓冲液混合物和T7RNA聚合酶混合物。反应体系中包括：1μg上述外源线性ERCC-0004基因的PCR产物、10μl含有NTP的缓冲液混合物和2μl T7RNA聚合酶混合物，加水补足20μl混合均匀，并短暂离心，经37℃保温2小时后，加入30μl无酶水和2μl DNase I(购自于NEB公司，货号为M0303)，混合均匀后，经37℃保温15分钟，去除DNA模板。再利用Dynabeads mRNA纯化试剂盒(由Lifetechnologies公司生产，货号为61006)进行纯化，并用50μl无核酸酶的水溶解纯化产物，获得纯化的外源线性ERCC-0004-RNA。采用同样的方法，获得纯化的外源线性ERCC-0013-RNA。

4、去除外源线性ERCC-0013-RNA的5’端的三磷酸结构，并在外源线性ERCC-0013-RNA的5’端修饰羟基。因体外合成的外源线性ERCC-0013-RNA的5’端为三磷酸结构，使得外源线性ERCC-0013-RNA的5’端无法与3’端连接形成环状，所以必须去除该5’端的三磷酸结构，再在5’端加上单磷酸结构，这样才能使得外源线性ERCC-0013-RNA的首尾相连成环状，具体步骤包括：

采用小牛肠碱性磷酸酶(购自于NEB公司，货号为M0290)去除外源线性ERCC-0013-RNA的5’端的三磷酸结构。反应体系如下：20μg纯化的外源线性ERCC-0013-RNA和7U的小牛肠碱性磷酸酶，用水补足20μl后混合均匀，经短暂离心，于37℃保温1小时，获得去除5’端的三磷酸结构的外源线性ERCC-0013-RNA。利用Dynabeads mRNA纯化试剂盒(由Lifetechnologies公司生产，货号为61006)纯化去除5’端的三磷酸结构的外源线性ERCC-0013-RNA，得到5’端为羟基的外源线性ERCC-0013-RNA。

5、对5’端修饰羟基的外源线性ERCC-0013-RNA进行磷酸化修饰，合成5’端磷酸化修饰的外源线性ERCC-0013-RNA，包括：

利用T4PNK激酶(由NEB公司，货号为M0201)修饰该5’端为羟基的外源线性ERCC-0013-RNA。随酶一起提供的有10×T4PNK激酶缓冲液。在50μl的反应体系中，包含如下成份：1×T4PNK激酶缓冲液、1mM ATP、10U T4PNK激酶、以及上述获得的5’端为羟基的外源线性ERCC-0013-RNA，用水补足至50μl并混合均匀，经短暂离心，于37℃保温30分钟。利用Dynabeads mRNA纯化试剂盒(由Life technologies公司生产，货号为61006)进行纯化，操作方法按该试剂盒的说明书进行，获得5’端磷酸化修饰的外源线性ERCC-0013-RNA。

6、将5’端磷酸化修饰的外源线性ERCC-0013-RNA的5’端和3’端连接，合成外源环状ERCC-0013-RNA，包括：

利用T4RNA连接酶I(NEB公司生产，货号为M0204)对该5’端磷酸化修饰的外源线性ERCC-0013-RNA的5’端与3’端进行连接。随该T4RNA连接酶I一起提供的成份还包括：10×T4RNA连接酶反应缓冲液、10mM ATP、10U/μl的RNA酶抑制剂和PEG 8000。在20μl的反体系中包含如下成份：1×T4RNA连接酶反应缓冲液、10U/μl的T4RNA连接酶1μl、10U/μl的RNA酶抑制剂0.5μl、浓度为10％的PEG8000、20-50μM的ATP和上述获得的5’端磷酸化修饰的外源线性ERCC-0013-RNA，用水补足20μl并混合均匀，经短暂离心，于PCR仪中于16℃过夜，经95℃2分钟终止反应，得到外源环状ERCC-0013-RNA。

纯化外源环状ERCC-0013-RNA，具体地，向得到的含有外源环状ERCC-0013-RNA的混合物中加入以下成份：5M的醋酸铵(Life technologies公司生产，货号为AM9071)10μl、无水乙醇200μl和水80μl，混合均匀，经短暂离心，置于-80℃冰箱(海尔公司生产，型号为DW-86L626)中放置30分钟；取出后经14000rpm，4℃，离心25分钟，用移液器的枪头小心吸去上层清液，向沉淀中加入700μl浓度为70％的乙醇，用于清洗沉淀，再经14000rpm，4℃，离心5分钟后吸去上层清液，于室温下干燥10分钟，用于去除残留的乙醇，再用10μl无核酸酶的水溶解沉淀，获得纯化的外源环状ERCC-0013-RNA。

7、采用RNA酶R切掉未环化成功的外源线性ERCC-0013-RNA。具体步骤包括：

在获得的纯化的外源环状ERCC-0013-RNA中，还有部分未环化成功的外源线性ERCC-0013-RNA，采用RNA酶R(由Epicentre公司生产，货号为RNR07250)消化未环化成功的外源线性ERCC-0013-RNA。随该RNA酶R一起提供的还有10×RNA酶R反应缓冲液，向获得的纯化的外源环状ERCC-0013-RNA中加入2μl 10×RNA酶R反应缓冲液、1μl 20U/μl的RNA酶R和7μl无核酸酶的水，并混合均匀，经短暂离心后于40℃保温1小时，获得去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA。

8、纯化去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA，包括：

向获得的去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA中加入以下成份：5M的醋酸铵(Life technologies公司生产，货号为AM9071)10μl、无水乙醇200μl和水80μl并混合均匀，经短暂离心，置于-80℃冰箱(海尔公司生产，型号为DW-86L626)中放置30分钟，取出后经14000rpm，4℃，离心25分钟，用移液器的枪头小心吸去上层清液，向沉淀中加入700μl浓度为70％的乙醇，用于清洗沉淀，再经14000rpm，4℃，离心5分钟后吸去上层清液，于室温下干燥10分钟，用于去除残留的乙醇，用50μl无核酸酶的水溶解沉淀，获得纯化的外源环状ERCC-0013-RNA。

步骤200：对外源环状ERCC-0013-RNA进行质量控制。即使是采用了以上去除线性ERCC-0013-RNA的步骤，外源环状ERCC-0013-RNA中仍然可能混有外源线状ERCC-0013-RNA，因此需要对外源环状ERCC-0013-RNA进行质量控制。具体步骤包括：

1、利用随机引物对合成的外源环状ERCC-0013-RNA进行逆转录，合成外源ERCC-0013-cDNA，外源ERCC-0013-cDNA包括外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA，具体步骤如下：

利用分光光度计(美国Quawell公司生产，型号为Q5000)中RNA定量程序，测定并获得上述纯化的外源环状ERCC-0013-RNA的质量浓度，本发明实施例提供的外源环状ERCC-0013-RNARNA的质量浓度为8.99ng/μl。

取纯化的外源环状ERCC-0013-RNA0.1μg，与下列成分混合：5μl浓度为1μM的6碱基随机逆转录引物(由生工生物工程(上海)股份有限公司合成)、2μl浓度为10mM的dNTP、20U的逆转录酶(美国Life technologies公司生产，货号为18064-014)、5μl浓度为100mM的DL-二硫苏糖醇(DL-Dithiothreitol，DTT，随逆转录酶一起由美国Life technologies公司提供)和10μl 5×逆转录反应缓冲液(随逆转录酶一起由美国Life technologies公司提供)，用水补足至50μl混匀后，经42℃保温2小时，75℃保温15分钟，使酶失活，合成外源ERCC-0013-cDNA。

2、利用第一引物和第二引物分别对外源ERCC-0013-cDNA进行实时定量PCR扩增，第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ ID NO:4所示的第一反向引物，第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物，第一引物用于扩增外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA，第二引物用于扩增外源环状ERCC-0013-cDNA，通过第一引物扩增获得C_T1值，通过第二引物扩增获得C_T2值。

其中，第一引物的扩增产物不跨越外源环状ERCC-0013-RNA的环化连接点，使得该第一引物可扩增外源线性ERCC-0013-cDNA，又可扩增外源环状ERCC-0013-cDNA；第二引物或其扩增产物跨越外源环状ERCC-0013-RNA的环化连接点，使得该第二引物只能扩增外源环状ERCC-0013-cDNA。

其中，第一引物和第二引物分别在两个反应体系中平行进行，且反应体系和反应条件均相同，仅引物不同。具体地，取2μl外源ERCC-0013-cDNA、3μl浓度为1μM的第一引物、10μl定量PCR混合物(由Toyobo公司生产，货号为QPS-201)和0.4μl 50倍的ROX荧光校正染料(由Toyobo公司随QPS-201一起提供)混合均匀后，经短暂离心，在Life technologiesStepOne实时定量PCR仪中按如下扩增程序进行实时定量PCR扩增：95℃20秒；95℃3秒，60℃20秒，共40个循环，在每一次循环的最后一步收集荧光信号，该荧光信号的强弱用于衡量表达量的多少。

3、通过C_T1值和C_T2值以及公式计算合成的外源环状ERCC-0013-RNA的环化比例，当环化比例超过90％时，外源环状ERCC-0013-RNA可以使用。

通过第一引物扩增获得C_T1值，该C_T1值为21.55；采用第二引物按同样的方法进行扩增，获得C_T2值，该C_T2值为21.45。将C_T1值和C_T2值代入公式计算外源环状ERCC-0013-RNA的环化比例为：若外源环状ERCC-0013-RNA的环化比例超过90％，该外源环状ERCC-0013-RNA可以使用，否则，该外源环状ERCC-0013-RNA不能使用，需重新制备外源环状ERCC-0013-RNA。其中，90％的环化比例作为外源环状ERCC-0013-RNA合格的标准仅作为经验值，该比例可根据具体情况作出调整。

步骤300：将外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA按摩尔比1:1混合，得到混合外源RNA。具体操作如下：

利用Qubit RNA分析试剂盒(由Life technologies公司生产，货号为Q32852)测定外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的质量浓度，测定方法按该试剂盒的说明书进行。在本发明实施例中，检测获得的外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的质量浓度分别为13393pg/μl和5298pg/μl。利用网站工具(网址为：http://www.basic.northwestern.edu/biotools/oligocalc.html)计算外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的分子量分别为168246.6和262445.9，通过分子量分别计算外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的摩尔浓度分别为79603.39pM和20187.02pM，由此计算，若要求外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA按等摩尔比混合，那么，二者混合的体积比应该为1：3.94。具体地，取外源线性ERCC-0004-RNA 10μl与外源环状ERCC-0013-RNA 39.4μl混合均匀后，经短暂离心，获得混合外源RNA。计算得到该混合外源RNA的摩尔浓度为32214.62pM，质量浓度为6936.66pg/μl。

步骤400：向待测序样本(莱茵衣藻)的总RNA中加入该混合外源RNA，总RNA与混合外源RNA的质量比为2000:1，得到第一混合物。该第一混合物中既有外源环状ERCC-0013-RNA，又有外源线性ERCC-0004-RNA，模拟了内源环状RNA与内源线状RNA。1/2000的混合比例既保证了有足够的外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA可以检测，又不至于添加过多外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA，占用测序通量，以至于浪费高通量测序的检测成本。具体步骤包括：

1、提取莱茵衣藻的总RNA：

取正常生长和低温胁迫条件下处于对数生长期的莱茵衣藻5ml，且所取的莱茵衣藻的数目少于4000万个，若超过4000万个，则相应减少取样体积，反之增加。4000rpm常温离心1分钟，倒去上层的培养液后，利用Trizol试剂(由Life technologies公司生产，货号为15596-018)提取莱茵衣藻的总RNA并溶解于50μl无核酸酶的水中，总RNA的提取与纯化的方法按照Trizol试剂的操作手册进行。

利用分光光度计(分光光度计由美国Quawell公司生产，型号为Q5000)中RNA定量程序，测定并获得上述提取的莱茵衣藻的总RNA的质量浓度。在本实施例中，获得的正常和胁迫的莱茵衣藻的总RNA的质量浓度分别为1.52μg/μl和0.98μg/μl。由此计算，提取的莱茵衣藻的总RNA的量分别为76μg和49μg。

2、向提取的莱茵衣藻总RNA中加入混合外源RNA，包括：

总RNA与混合外源RNA的质量比为2000:1，具体地，向正常的莱茵衣藻的总RNA中加入38ng混合外源RNA，向胁迫的莱茵衣藻的总RNA中加入24.5ng混合外源RNA，根据混合外源RNA的质量浓度(6936.66pg/μl)计算，应加入的混合外源RNA的体积分别为5.48μl和3.53μl，加入后混合均匀，经短暂离心，得到第一混合物，分别记正常的样本为N1，胁迫处理的样本为T1。

步骤500：去除第一混合物(N1和T1)中的核糖体RNA，得到第二混合物(N2和T2)。总RNA中绝大部分都是核糖体RNA(>95％)，该核糖体RNA不是环状的RNA，因此，需要消除。具体操作如下：

利用植物核糖体RNA去除试剂盒(由Epicentre公司生产，货号为MRZPL116-6)去除第一混合物中的核糖体RNA。

该试剂盒包括：RNA酶抑制剂(100U/μl)、核糖体RNA去除液、反应缓冲液、糖原(10mg/ml)、醋酸钠(3M)、无核酸酶的水、磁珠和磁珠悬浮液。

磁珠预处理：取225μl磁珠，置于磁架上，并在室温下静置1分钟，用225μl无核酸酶的水清洗一次，用225μl无核酸酶的水再清洗一次，将磁珠振荡悬浮于60μl磁珠磁浮液中，再加入1μl糖原，得到经过预处理的磁珠。

样品预处理：在40μl的反应体系中，加入以下成分：5μg第一混合物、8-10μl核糖体RNA去除液和4μl反应缓冲液，用水补足40μl，混匀后经短暂离心，68℃保温10分钟，取出后室温放置5分钟，得到经过预处理的样品混合物。

去除核糖体RNA：向经过预处理的磁珠中加入经过预处理样品混合物，用移液器的枪头吹打几次混匀，经短暂离心，于室温下保温5分钟，进行涡旋震荡，50℃保温5分钟，置于磁架上，于室温下静置1分钟，取上清液至另一离心管中，即为去除核糖体RNA的混合物。

纯化样品：将去除核糖体RNA的混合物的体积用无核酸酶的水补足至180μl，并加入以下成份：3M的醋酸铵10μl、糖原2μl，无水乙醇600μl，混合均匀，经短暂离心，置于-80℃冰箱(海尔公司生产，型号为DW-86L626)中放置30分钟，14000rpm，4℃，离心25分钟，用移液器的枪头小心吸去上层清液，再加入700μl浓度为70％的乙醇，用于清洗沉淀，再经14000rpm，4℃，离心5分钟后去除上层清液，于室温下干燥10分钟，用于去除残留的乙醇，用10μl无酶水溶解沉淀，获得纯化的去除了核糖体RNA的第一混合物，即第二混合物(N2和T2)。

步骤600：对第二混合物(N2和T2)进行3’末端生物素标记，并用链霉亲和素磁珠去除被标记上生物素的套索RNA及线性RNA，线性RNA包括总RNA中的内源线性RNA和外源线性ERCC-0004-RNA，得到第三混合物(N3和T3)，同时，回收未被标记上生物素的环状RNA分子。在第二混合物中，混杂着各种类型的RNA，包括线性RNA、环状RNA、套索RNA及其它具有特殊结构的RNA。套索RNA类似于环状RNA而功能却不同于环状RNA的分子，它由基因间的内含子区形成，结构类似于环状，但是在其首尾相连的位置有一段裸露的3’端，形似套索。在现有环状RNA测序的方法中，总RNA经核酸外切酶R消化之后，将套索RNA的3’尾巴一并切除，形成一个完整的环，混入环状RNA中，导致在测序之前无法将环状RNA和套索RNA分离，造成测序数据的浪费。这是现有环状RNA测序方法的一个明显的不足之处。

针对环状RNA与其它RNA在结构上的差异，即环状RNA为一个封闭的环状，无裸露的5’和3’末端，而线性RNA和套索RNA有裸露的3’末端。因此，通过将3’末端标记上生物素，然后利用链霉亲和素与生物素之间的高度亲和力，通过链霉亲和素磁珠进行捕获，将线性RNA和套索RNA从第二混合物中去除。具体包括：

利用3’末端生物素标记用试剂盒(货号20160，购自美国Thermo公司)，完成对第二混合物的标记，具体方法如下：将第二混合物(N2和T2)真空浓缩至5μl，向浓缩液中加入浓缩体积的25％的二甲基亚砜1.25μl，于85℃金属浴上变性5分钟，立即置冰上，同时，在冰上配制混合物，该混合物包括：变性后的浓缩液，3μl 10×连接反应缓冲液，1μl核酸酶抑制剂，1μl磷酸二异辛酯，2μl T4RNA连接酶，15μl 30％聚乙二醇，3μl无核酸酶的水，总体积30μl，混合均匀后，16℃保温过夜，得到过夜产物。

向过夜产物中加入50μl结合缓冲液(该结合缓冲液包括：0.5M NaCl、20mM Tris-HCl(PH7.5)和1mM EDTA)，于65℃金属浴上变性5分钟，立即置冰上3分钟，得到变性后的过夜产物。取100μl链霉亲和素磁珠(货号S1420，购自NEB公司)于1.5ml离心管中，加入100μl结合缓冲液，混匀，将离心管置磁架上分离1分钟，去除上清液，取下离心管，加入100μl结合缓冲液，混匀，将离心管置磁架上分离1分钟，去除上清液，取下离心管，将变性后的过夜产物加入到该离心管中，混匀，室温孵育20分钟，并不时混匀。将离心管置磁架上分离1分钟，收集上清液至另一新离心管中，约50μl，即为去除被标记上生物素的套索RNA及线性RNA，得到第三混合物。

纯化去除被标记上生物素的套索RNA及线性RNA，采用乙醇沉淀的方法进行纯化，具体方法如下：向上述去除被标记上生物素的套索RNA及线性RNA的第三混合物中加入以下成份：130μl无核酸酶的水，3M的醋酸铵18μl、10mg/ml的糖原2μl，无水乙醇600μl，混合均匀，经短暂离心，置于-80℃冰箱(海尔公司生产，型号为DW-86L626)中放置30分钟，14000rpm，4℃，离心25分钟，用移液器的枪头小心吸去上层清液，加入700μl浓度为70％的乙醇，用于清洗沉淀，再经14000rpm，4℃，离心5分钟后去除上层清液，于室温下干燥10分钟，用于去除残留的乙醇，用10μl无核酸酶的水溶解沉淀，获得了纯化的去除了被标记上生物素的套索RNA及线性RNA的第三混合物。

步骤700：进一步去除第三混合物(N3和T3)中残留的线性RNA，得到第四混合物(N4和T4)。经过3’末端标记及链霉亲和素磁珠捕获去除非环状RNA之后的第三混合物中仍然会残留一部分线性的RNA，因此需要有针对性的处理线性的RNA分子，具体包括：

利用核酸外切酶R(货号为RNR07250，购自Epicentre公司)能够酶切消化线性RNA的特性，去除第三混合物中残留的线性RNA。随核酸外切酶R一起提供的还有10×RNA酶R反应缓冲液。向纯化后第三混合物中加入2μl 10×RNA酶R反应缓冲液、1μl 20U/μl的RNA酶R和无核酸酶的水7μl，混合均匀，经短暂离心后40℃保温1小时，得到了去除残留的线性RNA的第三混合物。

纯化去除残留的线性RNA的第三混合物：将上述去除残留的线性RNA的第三混合物用无核酸酶的水补足至180μl，并加入以下成份：3M的醋酸铵10μl，10mg/ml的糖原2μl，无水乙醇600μl，混合均匀，经短暂离心，置于-80℃冰箱(海尔公司生产，型号为DW-86L626)中放置30分钟，14000rpm，4℃，离心25分钟，用移液器的枪头小心吸去上层清液，加入700μl浓度为70％的乙醇，用于清洗沉淀，再经14000rpm，4℃，离心5分钟后去除上层清液，于室温下干燥10分钟，用于去除残留的乙醇，用10μl无核酸酶的水溶解沉淀，获得了纯化的去除了残留的线性RNA的第三混合物，即第四混合物(N4和T4)。

步骤800：对第四混合物进行高通量转录组测序。如图2所示，设置对照组，将莱茵衣藻按现有的环状RNA测序方法进行平行测序。该方法包括：

步骤101：提取莱茵衣藻总RNA；步骤201：向莱茵衣藻总RNA中按2000:1的质量比加入混合外源RNA，得到第一混合物；步骤301：去除第一混合物中的核糖体RNA，得到第二混合物；步骤401：去除第二混合物中的线性RNA，该线性RNA包括总RNA中的内源线性RNA和外源线性ERCC-0004-RNA，得到混合物CK1；该混合物CK1与本发明实施例提供的第四混合物(N4和T4)均按标准的高通量Proton转录组测序方法进行测序。本发明实施例中每个样本测序的总数据量均为10M。

对测序数据进行生物学分析，其中测序数据从以下几个方面分析：通过分析第四混合物N4(胁迫处理的样本)中外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA在测序数据中的绝对量，评估文库质量。具体地，本发明实施例提供的第四混合物N4中外源线性ERCC-0004-RNA的Reads数分别为506，外源环状ERCC-0013-RNA的Reads数为5672，而外源混合RNA中外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA是按等摩尔比混合的，由此可见，该文库的制备方法能够有效去除线性RNA分子。

以外源环状ERCC-0013-RNA为参考，分析待测序样本中的环状RNA基因表达变化，具体地，分析正常生长和低温胁迫下的两个样本中的外源环状ERCC-0013-RNA的表达变化倍数，根据此变化倍数，计算内源环状RNA的表达差异。具体地，分析正常生长和低温胁迫下的两个样本中某个特定的环状RNA基因相对外源环状ERCC-0013-RNA的表达变化倍数，分析低温胁迫对基因表达水平的影响。在第四混合物N4和T4的测序结果中均发现了特定的环状RNA基因circ_000026环状RNA基因的表达。其中，在第四混合物N4中外源环状ERCC-0013-RNA的Reads数为5672，circ_000026的Reads数为1146；在第四混合物T4中外源环状ERCC-0013-RNA的Reads数为4218，circ_000026的Reads数为350；由此计算该环状RNA circ_000026在低温胁迫条件下表达量相对正常生长下的变化倍数为(350/4218)/(1146/5672)＝0.41，即在低温胁迫条件下环状RNA基因circ_000026表达下调了1/0.41＝2.4倍。以此可以类推分析其它环状RNA的表达变化倍数，从而可以进一步分析胁迫条件下环状RNA的调控机制。

此外，对比分析本发明实施例获得的第四混合物N4与现有方法获得的混合物CK1测序数据中环状RNA的数据量。本发明实施例的测序数据经生物信息学分析之后的结果见表1，混合物CK1测序的结果中，环状RNA获得的reads比例是0.0056％，而第四混合物N4获得的reads比例是0.0787％，对比之下，本发明实施例提供的方法能够将样本中的非环状RNA进一步去除，使得环状RNA的有效测序数据量提高了14倍，由此可证明本发明实施例所用的方法能显著的将样本中的环状RNA进一步富集，这将大幅度降低环状RNA测序数据量，降低成本，减少人力物力的浪费。

表1.混合物CK1和第四混合物N4的测序数据经生物信息学分析

本发明实施例提供了一种高通量环状RNA测序的方法，通过加入人工合成的外源线性RNA与环状RNA，可以为环状RNA的表达量提供一个外源环状RNA参考基因，通过外源环状RNA的表达量，可以计算样本中内源基因的表达量变化倍数，从而更准确的反映出生物体内的基因在特定条件下的表达情况；此外，通过对具有3’未端的RNA进行生物素标记，之后再利用链霉亲和素磁珠捕获被标记上生物素的RNA的方法，进一步去除线性RNA和套索RNA，提高了样品中环状RNA的富集度，减少单个样本的环状RNA测序数据量，大幅的降低了高通量测序的成本。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种高通量环状RNA测序的方法，其特征在于，所述方法包括：

对所述外源环状ERCC-0013-RNA进行质量控制；

去除所述第一混合物中的核糖体RNA，得到第二混合物；

2.根据权利要求1所述的方法，其特征在于，所述待测序样本的基因中不存在与所述外源ERCC-0004基因和所述外源ERCC-0013基因相同或同源性高的基因。

3.根据权利要求1所述的方法，其特征在于，对所述外源环状ERCC-0013-RNA进行质量控制，包括：

利用第一引物和第二引物分别对所述外源ERCC-0013-cDNA进行实时定量PCR扩增，所述第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ ID NO:4所示的第一反向引物，所述第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物，所述第一引物用于扩增所述外源线性ERCC-0013-cDNA和所述外源环状ERCC-0013-cDNA，所述第二引物用于扩增所述外源环状ERCC-0013-cDNA，通过所述第一引物扩增获得C_T1值，通过所述第二引物扩增获得C_T2值；

通过C_T1值和C_T2值以及公式计算合成的所述外源环状ERCC-0013-RNA的环化比例，并选用环化比例超过90％的所述外源环状ERCC-0013-RNA。

4.根据权利要求1所述的方法，其特征在于，采用RNA酶R去除所述第二混合物中的线性RNA。

5.根据权利要求1所述的方法，其特征在于，向所述待测序样本的总RNA中，加入所述混合外源RNA，所述总RNA与所述混合外源RNA的质量比为2000:1。

6.根据权利要求1所述的方法，其特征在于，采用RNA酶R去除未环化成功的所述外源线性ERCC-0013-RNA。

7.根据权利要求1所述的方法，其特征在于，采用链霉亲和素磁珠去除被标记上所述生物素的套索RNA及所述线性RNA。

8.根据权利要求1所述的方法，其特征在于，所述生物学分析包括：获得所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA的相对比例、以及以所述外源环状ERCC-0013-RNA为参考分析所述待测序样本中的环状RNA基因表达变化。