CN112359093B

CN112359093B - 血液中游离miRNA文库制备和表达定量的方法及试剂盒

Info

Publication number: CN112359093B
Application number: CN202011260858.3A
Authority: CN
Inventors: 李华; 谢跃华; 胡文献; 胡传圣
Original assignee: Suzhou Jingmai Biotechnology Co ltd
Current assignee: Suzhou Jingmai Biotechnology Co ltd
Priority date: 2020-11-12
Filing date: 2020-11-12
Publication date: 2021-08-27
Anticipated expiration: 2040-11-12
Also published as: CN112359093A

Abstract

本申请涉及血液中游离miRNA文库制备的方法及试剂盒，主要包括步骤：(a)从血液中分离血清或者血浆，提取游离RNA；(b)将所述游离RNA与外源RNA混合，外源RNA序列中任意一部分均不与已知的人/大鼠/小鼠的miRNA序列重合；(c)将步骤(b)中的RNA混合物加接头、反转录第一链、第二链合成及扩增，回收目标DNA片段，获得游离miRNA测序文库。还涉及miRNA表达定量的方法，所述方法包括上述的步骤(a)、(b)和(c)，以及：将所述miRNA测序文库进行二代测序和数据分析，在数据分析中，可利用衔接子RA5的S2随机标签序列作为定量化标签，去除PCR重复序列，提高检测的准确性。

Description

血液中游离miRNA文库制备和表达定量的方法及试剂盒

技术领域

本发明涉及生物技术领域，更具体地，涉及血液中游离miRNA文库制备和表达定量的方法及试剂盒。

背景技术

微小RNA（microRNA，miRNA）是一类长度约为19-25个核苷酸的非编码短RNA，它能够通过与靶基因mRNA的3 'UTR完全或不完全配对，降解靶基因mRNA或抑制其翻译。过去的研究表明miRNA在细胞内发挥重要的生物学功能，参与了多种调节途径，包括发育、病毒防御、造血过程、器官形成、细胞增殖与死亡、等等。

目前miRNA研究中最令人关注的领域之一就是对血液（血清或血浆）样本中存在的游离miRNA进行检测和定量。这些在血液中存在的相对稳定的游离miRNA引起了研究人员的极大兴趣，因为miRNA水平变化可作为潜在的多种疾病的无创性分子标志物。通过从血清或血浆中纯化RNA，研究发现癌症的发生和发展与某些游离miRNA的特定表达紧密相关。目前，高通量测序在对游离miRNA的研究及分析中，发挥着至关重要的作用。

目前市场上用于miRNA高通量文库制备的主流试剂盒，如Illumina公司TruSeq 小RNA文库制备试剂盒和NEB公司的NEBNext Multiplex 小RNA建库试剂盒，虽然难度和成本较低，但对RNA的起始用量要求都在100ng以上。血液中游离miRNA的含量较低，通常100μl的全血提取出的游离RNA量约为0.2ng–3.5ng，远达不到建库试剂盒对起始量的要求，因此无法采用该类试剂盒构建文库；通过增加取血量可以提取到足够的RNA，但可能会对受测者造成了一定的负担。因此，为了实现对微量血液中游离miRNA的高通量测序及数据分析，需要建立一种微量血液游离miRNA的文库制备与数据分析方法以及对应的试剂盒，以便满足实际需要。

发明内容

本发明的目的在于，提供血液中游离miRNA文库制备、表达定量的方法及试剂盒，适用于血液（包括微量血液）游离miRNA的文库构建、二代测序及数据分析。

本申请的第一方面，涉及一种血液中游离miRNA文库制备的方法，所述方法包括步骤：

（a）从血液中分离血清或者血浆，提取游离RNA；

（b）将所述游离RNA与外源RNA混合，外源RNA序列中任意一部分均不与已知的人/大鼠/小鼠的miRNA序列重合;

（c）将步骤（b）中的RNA混合物加接头、反转录第一链、第二链合成及扩增，回收目标DNA片段，获得游离miRNA测序文库。

在一些实施方式中，在步骤（a）中，全血样品的总体积为100μl–1ml，所述血液样品根据抗凝与否提取对应的血浆或者血清。

进一步的，从血浆或血清中提取200pg–20ng游离RNA。

在一些实施方式中，在步骤（b）中，外源RNA的长度为50nt–1000nt。

进一步的，外源RNA的长度为100nt–200nt，浓度为10ng/μl，外源RNA为人工合成的序列。外源RNA与游离RNA按照任意比例混合，使得混合后的RNA总量超过10ng。

在一些实施方式中，步骤（c）包括：

（c1）将所述RNA混合物与衔接子RA3进行连接反应，所述衔接子RA3与RNA的3’端连接，形成核酸-衔接子RA3复合物；

（c2）将所述核酸-衔接子RA3复合物与衔接子RA5进行连接反应，所述衔接子RA5与所述RNA的5’端连接，形成衔接子RA5-核酸-衔接子RA3复合物；

（c3）将所述衔接子RA5-核酸-衔接子RA3复合物与反转录引物混合，进行反转录反应，得到DNA第一链；

（c4）将所述DNA第一链与特异性结合于RA3的引物和特异性结合于RA5的引物进行混合，获得扩增产物；

（c5）将所述扩增产物进行6%聚丙烯酰胺凝胶电泳，胶块经染色后在紫外灯下识别各DNA条带，割取所需的目标DNA片段（对应于miRNA）并回收，得到制备完成的miRNA测序文库。

进一步的，所述衔接子RA3的序列为SEQ ID NO:1，衔接子RA5的序列包括固有结构S1-S2-S3。

进一步的，所述衔接子RA5的S1的序列为SEQ ID NO:2，S2为随机标签序列，是长度为11～15个碱基的随机核苷酸序列（N11-N15），S3为长度为4个碱基的固定序列。

进一步的，所述S3选自：ACGA、CCGA、CGAU、CGUA、CGUU、GACG、GCCA、GCGU、GGAA、GUCG、GUCU中的一种，为SEQ ID NO:3至SEQ ID NO:13中的一种。进一步的，在步骤（c3）中，反转录引物为能够特异性结合于衔接子RA3的反转录引物RT Primer，RT Primer的序列从5’端到3’为：CCTTGGCACCCGAGAATTCCA，即SEQ ID NO:14。

进一步的，在步骤（c4）中，能够特异性结合于衔接子RA3的引物为Primer1，Primer1的序列从5’端到3’为：CAAGCAGAAGACGGCATACGAGATGTCGTGATGTGACTGGAGTTCCTTGGCACCCGAGAATTCCA，即SEQ ID NO:15，能够特异性结合于衔接子RA5的引物为Primer2，Primer2的序列从5’端到3’为：AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA，即SEQ ID NO:16。

进一步的，Primer1序列中标下划线的8个碱基“GTCGTGAT”为index序列（索引序列，用于区分不同样品的测序数据），所述index序列可用以下十种index序列替换：ACCACTGT，TGGATCTG，CCGTTTGT，TGCTGGGT，GAGGGGTT，AGGTTGGG，GTGTGGTG，TGGTCACA，TTGACCCT，CCACTCCT（SEQ ID NO:17至SEQ ID NO:26所示）。

进一步的，在步骤（c5）中，所述目标DNA片段对应了miRNA，所述目标DNA片段的长度为miRNA的长度+测序接头的长度+S2的长度+S3的长度，其中，所述miRNA的长度为15～30bp，且所述miRNA平均长度为22bp，测序接头的长度为120bp，S2的长度为11～15bp，S3的长度为4bp。由于目标DNA片段的长度分布在22bp+120bp+S2+4bp±10bp之间，因此切胶范围设定为22bp+120bp+S2+4bp±10bp，即S2+146bp±10bp。

本申请的第二方面，涉及一种血液中游离miRNA表达定量的方法，所述方法包括上述的步骤（a）、步骤（b）和步骤（c），以及如下步骤：

（d）将所述miRNA测序文库进行二代测序，获得下机数据；

（e）通过质控工具对所述下机数据进行数据质控和预处理，得到去除了低质量序列和测序接头的有效数据，将所述衔接子RA5中的S2随机标签序列以及S3固定碱基，从有效数据的序列5’端移除，再将其与人类参考基因组序列比对，获得定位于所述人类参考基因组序列的位置信息；

（f）利用所述位置信息以及对应的所述随机标签序列，对PCR重复序列进行去除，再将获得的已去除PCR重复的序列的位置与所述人类参考基因组中的miRNA位置相比较，确定样本中所有的miRNA的表达量。

在一些实施方式中，在步骤（d）中，所述miRNA测序文库进行二代测序前，进行片段长度范围检测和浓度定量，使用Agilent 2100 Bioanalyzer进行片段长度范围检测，使用Invitrogen Qubit进行浓度定量，然后送至Illumina高通量测序平台进行测序，并获得下机数据（raw data）。

进一步的，测序平台为Illumina HiSeq、NovaSeq、或NextSeq测序平台中的一种，测序读长在50bp到150bp之间，测序模式为单端测序或者双端测序。在一些实施方式中，在步骤（e）中，质控工具为FastQC、Cutadpat、和Trimmomatic，使用序列比对软件，如Bowtie，与人类参考基因组序列进行比对。在一些实施方式中，在步骤（f）中，被序列比对软件比对到参考基因组同一位置(即序列的5’和3’端在参考基因组的位置相同)的序列若带有相同的随机标签序列S2，则视为PCR重复，并将其合并为同一条序列。进一步的，miRNA位置信息取自于miRBase(http://www.mirbase.org/)数据库，当某序列的5’端与某miRNA的5’端位置一致时，此序列记为此miRNA的测序序列。进一步的，利用获得的miRNA的测序序列计算miRNA的表达量RPM（reads per million），某个miRNA的表达量RPM为该miRNA测序序列的总量占该样品所有可比对至人类参考基因组的测序序列总量的百万分比。本申请的第三方面，涉及一种血液中游离miRNA文库制备的试剂盒，包括：衔接子RA3、衔接子RA5、反转录引物、引物Primer1和引物Primer2，所述衔接子RA3与血液样本中的游离miRNA的3’端连接，衔接子RA5与所述miRNA的5’端连接，形成RA5-核酸-衔接子RA3复合物，所述复合物与反转录引物混合进行反转录得到DNA第一链，所述DNA第一链与引物Primer1和引物Primer2混合进行PCR反应，获得扩增产物；所述衔接子RA5的序列包括固有结构S1-S2-S3，S2为随机标签序列，S3为固定碱基序列。在一些实施方式中，所述衔接子RA3的序列为SEQ ID NO:1，RA3反转录引物的序列为SEQ ID NO:14，RA3区域引物的序列为SEQ ID NO:15，RA5区域引物的序列为SEQ ID NO:16。进一步的，所述衔接子RA5的S1的序列为SEQ ID NO:2，S2为长度为11～15个碱基的随机核苷酸序列（N11-N15），S3为长度为4个碱基的固定序列。进一步的，所述S3选自：ACGA、CCGA、CGAU、CGUA、CGUU、GACG、GCCA、GCGU、GGAA、GUCG、GUCU中的一种，为SEQ IDNO:3至SEQ ID NO:13中的一种。进一步的，RA3反转录引物为能够特异性结合于衔接子RA3的反转录引物RT Primer， RT Primer的序列从5’端到3’为：CCTTGGCACCCGAGAATTCCA，即SEQ ID NO:14。进一步的，引物Primer1为能够特异性结合于衔接子RA3的引物，引物Primer2为能够特异性结合于衔接子RA5的引物，Primer1的序列从5’端到3’为：CAAGCAGAAGACGGCATACGAGATGTCGTGATGTGACTGGAGTTCCTTGGCACCCGAGAATTCCA，即SEQ ID NO:15，Primer2的序列从5’端到3’为：AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA，即SEQ ID NO:16。进一步的，Primer1序列中标下划线的8个碱基“GTCGTGAT”为index序列（索引序列，用于区分不同样品的测序数据），所述index序列至少还可用以下十种index序列替换：ACCACTGT，TGGATCTG，CCGTTTGT，TGCTGGGT，GAGGGGTT，AGGTTGGG，GTGTGGTG，TGGTCACA，TTGACCCT，CCACTCCT（SEQ ID NO:17至SEQ ID NO:26所示）。在一些实施方式中，所述试剂盒还包括：超纯水、酶以及缓冲液。

在一些实施方式中，采用所述试剂盒获得的测序文库，对二代测序的数据进行分析时，可利用衔接子RA5的S2随机标签序列作为定量化标签，去除PCR重复序列，提高检测的准确性。本申请的第四方面，涉及血液中游离miRNA文库制备的方法和试剂盒的用途，以及血液中游离miRNA表达定量的方法的用途。在一些实施方案中，本申请涉及血液中游离miRNA文库制备的方法和试剂盒的用途，用于血液中游离短RNA的扩增或/和文库制备。

在一些实施方式中，本申请涉及血液中游离miRNA表达定量的方法的用途，用于获得样本中每个miRNA的表达量，可进一步用于分析高等生物的各类特征，如发育、病毒防御、肿瘤或癌症的水平、造血过程、器官形成、细胞增殖。与现有技术相比，本发明的有益效果在于：

(1) 本发明中长度为10～15个随机核苷酸序列作为定量化标签，是衔接子RA5的一部分，与样品核酸片段连接之后，每个特定的碱基排列组合便成为每一条核酸片段的标签，不会在建库、测序以及后期生物信息学分析过程中丢失或混淆，能够用于去除PCR重复序列从而实现对微量血液游离miRNA更为精准的测序定量；

(2) 本发明通过将一段50-1000nt的外源RNA与样品混合，使得常规建库方法亦能成功构建来源于微量血液的游离miRNA测序文库；同时，通过使用目的DNA片段回收的方法从文库中去除了外源RNA，保证了下机数据中的高有效数据占比，节约了成本；

(3)本发明适合于100μl以上全血样品的游离miRNA的文库构建，由于所需血量很少（即创伤小）且建库成本较低，在科研和临床实践中可用性较强，具有广阔的应用前景；

(4)本发明提出的实验方法难度较低，所需都是常规实验技术以及容易购买到的试剂和药品,条件易得,操作简便,且后续数据分析方法亦不复杂，因此可被普通技术人员较快掌握。附图说明结合以下附图一起阅读时，将会更加充分地描述本申请内容的上述和其他特征。可以理解，这些附图仅描绘了本申请内容的若干实施方式，因此不应认为是对本申请内容范围的限定。通过采用附图，本申请内容将会得到更加明确和详细地说明。图1为血液游离miRNA的建库实验流程示意图。图2为实施例1中Agilent 2100 Bioanalyzer对由本发明提出的文库制备方法所制备的测序文库的质检结果。图3为实施例2中经过分析得到的miRNA的表达量箱线图。图4为实施例3中，本发明的方法和主流Illumina建库试剂盒得到的游离miRNA表达值的散点图（作图过程中RPM均已加1）。图5为随机标签序列所含的碱基数量与连接效率的关系。具体实施方式描述以下实施例以辅助对本申请的理解，实施例不是也不应当以任何方式解释为限制本申请的保护范围。下列实施例中未注明具体条件的实验方法，按照常规实验条件，例如Sambrook等人的分子克隆实验室手册(New York: ColdSpring Harbor Laboratory Press， 1989)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。除非有特别说明，否则实施例所用的材料均为市售产品。实施例1：获得游离miRNA测序文库对血液样本，采用如下方法获得游离miRNA测序文库：（1）用干燥采血管（非抗凝）采集人体外周血100μl，于4°C静置半小时以上，随后400g，4°C离心10分钟取上清，进一步1800g，4°C离心10分钟取上清，得到血清样品（体积约为30μl）；

（2）使用miRNeasy Serum/Plasma Kit（Qiagen，货号217184），从血清样品中提取总量约为200pg的游离RNA，用超纯水(无DNA酶和RNA酶,下同)稀释至总体积为4μl，并置于200μl薄壁PCR管中。

（3）在游离RNA中加入1μl外源RNA并混匀（即外源RNA与游离RNA按照50：1混合），外源RNA的浓度为10ng/μl，外源RNA的长度为100nt，外源RNA的序列为5’-CAACUAUUAAAGAGUAAGAUUCCAUAAUGUAAGAUAGAAAGGUCCUCAUGCAGCAUAUGCUCGCUGGCUCCGGGAAGGCUUCACGUGCAUAAUACAGAAG-3’；

（4）在步骤（3）获得的溶液中加入1μl浓度为10μM的衔接子RA3,混匀后于70℃反应2分钟,立即置于冰上冷却;

（5）在步骤（4）获得的溶液中加入2μl HML (Ligation Buffer，Illumina，货号15013206）, 1μl RNase Inhibitor （Illumina，货号15003548），1μl T4 RNA Ligase 2Deletion Mutant （Epicentre，货号LR2D11310K）混匀,28℃孵育1小时;

（6）在步骤（5）获得的溶液中加入1μl STP (Stop Solution，Illumina，货号15016304）混匀,28℃孵育15分钟;

（7）取一支新的PCR管加入1.1μl 衔接子RA5，其中S1的碱基序列为5’-GUUCAGAGUUCUACAGUCCGACGAUC-3’，S2是长度为10的随机核苷酸序列N10，S3选用ACGA，RA5浓度为10μM, 70℃孵育2分钟,反应后立即置于冰上冷却；

（8）在步骤（7）获得的溶液中加入1.1μl 10mM ATP（Illumina，货号15007432）,再分别加入1.1μl T4 RNA连接酶（Illumina，货号1000587）并混匀;

（9）从步骤（8）获得的溶液中取3μl加入步骤6获得的溶液中并混匀,28℃反应1小时;（10）在步骤（9）获得的溶液中加入1μl RNA RT Primer（10μM）并混匀,70℃反应2分钟,反应后立即置于冰上冷却;

（11）在步骤（10）获得的溶液中分别加入2μl 5×First Strand Buffer （Thermo，货号1889832）, 0.5μl dNTP Mix(12.5mM，Illumina，货号11318102）, 1μl 100mM DTT（Thermo，货号1850670）, 1μl RNase Inhibitor和1μl SuperScript II ReverseTranscriptase（Thermo，货号2008270）混匀,50℃孵育1小时;

（12）在步骤（11）获得的溶液中加入25μl PML (PCR Mix)（Illumina，货号15022681）,2μl Primer1（10μM）,2μl Primer2（10μM），混匀后进行PCR反应：98℃预变性30s，98 ℃变性10s，60 ℃退火30s，72 ℃延伸15s，执行18个循环后，72 ℃延伸10min，4 ℃保存；其中，Primer1序列中的index序列使用GTCGTGAT；

（13）将步骤（11）获得的PCR产物进行6%聚丙烯酰胺凝胶电泳，电压120V，时间1h，万分之一Gelred染液染色5分钟，然后置紫外灯下观察并拍照，割取146～166之间的条带并回收，得到制备完成的miRNA测序文库。血液游离miRNA的建库实验流程示意图见图1所示。使用Agilent 2100 Bioanalyzer对上述miRNA测序文库进行片段长度范围检测，检测结果如图2所示：图中横坐标表示片段长度（碱基数），纵坐标表示荧光吸光值，图中有3个明显的峰，最左和最后的峰为marker呈现的峰，中间的峰对应了文库的片段长度分布范围；再使用Invitrogen Qubit进行浓度定量，测定浓度为2.1ng/μl。

实施例2：miRNA的表达定量将获得的miRNA测序文库经过如下二代测序及数据分析，获得miRNA的表达量RPM：（1）将miRNA测序文库送至Illumina NextSeq 500测序平台进行测序，测序读长为75bp，测序模式为单端测序，并获得下机数据；（2）对下机数据，使用FastQC, Cutadpat和 Trimmomatic进行数据质控和预处理（使用默认参数），以得到去除了低质量序列和测序接头的有效数据；随后将RA5中的随机标签序列S2以及固定碱基S3从有效数据的序列5’端移除；随后使用序列比对软件Bowtie将得到的序列再比对到人类参考基因组序列上（允许最多1个碱基错配），获得定位于参考基因组的位置信息；（3）根据获得的序列比对位置以及对应的随机标签序列S2，对结果进行PCR重复序列的去除。具体而言，被Bowtie比对到参考基因组同一位置（即序列的5’和3’端在参考基因组的位置相同）的序列若带有相同的随机标签序列S2，则视为PCR重复，将其合并为同一条序列，即在后续表达值的计算中只算一条序列；（4）将步骤（3）中获得的已去除PCR重复的序列的位置与人类参考基因组中的miRNA位置相比较,确定样品中所有miRNA的表达量。其中，miRNA位置信息取自于miRBase数据库(http://www.mirbase.org/)；当某序列的5’端与某miRNA的5’端位置一致时，此序列记为此miRNA的测序序列；每个miRNA表达量RPM（reads per million)为该miRNA测序序列的总量占该样品所有可比对至参考基因组的测序序列总量的百万分比；所有表达的miRNA的表达量箱线图见图3。实施例3：本申请的方法与现有技术的比较为了验证本申请的血液游离miRNA的文库制备与表达量定方法能够产生可靠的结果，在此与使用现有主流Illumina建库试剂盒得到的miRNA测序结果进行了比较。从实施例1中的同一供血个体，在同一时间和地点，用干燥采血管（非抗凝）采集外周血30ml，并使用和实施例1中同样的方法获得总量约为1ug的血清游离RNA；随后，对照组：使用Illumina TruSeq Small RNA文库制备试剂盒（货号：RS-200-0012）进行文库制备，建库方法见试剂盒操作说明（该试剂盒不含外源RNA，衔接子序列亦不含有随机标签序列S2）；测序文库制备完毕后，送至Illumina NextSeq 500测序平台进行测序，测序读长为75bp，测序模式为单端测序，并获得下机数据；后续的miRNA表达定量分析流程不再包含与衔接子RA5中随机标签序列相关的去除PCR重复的步骤，其余分析流程与实施例2一致，最终确定样品中所有miRNA的表达量RPM。比较实施例2中获得的miRNA表达值与使用上述Illumina建库试剂盒获得的miRNA表达值，可以发现这两种方法产生的miRNA定量结果一致性很高（Pearson相关系数R=0.95；图4），这样的结果表明：本发明即使只需要微量的血液（低至100μl）也能成功建库并获得与使用常规入口量（20ml血液）的主流方法较为一致的游离miRNA定量结果，不仅说明了本发明的定量可靠性亦体现了本发明在血液入口量方面的优越性。进一步的，外源RNA作为本发明的主要技术特征之一，具有不可忽视的重要性：当外周血采血量低于500μl时，本申请的建库方法中若不含加入外源RNA的步骤则会导致超过70%的建库失败率；另外，随机标签序列对于准确定量miRNA亦发挥了重要作用，本发明的建库方法中若不含随机标签序列则会导致miRNA的定量结果与上述Illumina建库试剂盒的定量结果一致性变差（相关系数R降低0.1以上）。进一步的，本发明中随机标签序列包含10～15个碱基是经过反复试验并优化后的决定,当碱基的数量<10时，则随机标签复杂度较低，所能标记的miRNA数量不够覆盖样品中的miRNA数量；当碱基的数量>15时，则导致连接反应效率低下，难以达到建库的要求（碱基数量与连接效率的关系如图5所示）。固定碱基序列作为每一个miRNA序列的起始标签，可以为测序数据的提取和分析提供方便，且经过优化的固定序列组合与现有miRNA的前四个碱基序列都没有相似之处，在后续数据分析中不会造成混淆，因此非常适合作为起始标签。尽管本申请已公开了多个方面和实施方式，但是其它方面和实施方式对本领域技术人员而言将是显而易见的，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。本申请公开的多个方面和实施方式仅用于举例说明，其并非旨在限制本申请，本申请的实际保护范围以权利要求为准。

序列表

<110> 苏州京脉生物科技有限公司

<120> 血液中游离miRNA文库制备和表达定量的方法及试剂盒

<160> 26

<170> SIPOSequenceListing 1.0

<210> 1

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

tggaattctc gggtgccaag g 21

<210> 2

<211> 26

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 2

guucagaguu cuacaguccg acgauc 26

<210> 3

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 3

acga 4

<210> 4

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 4

ccga 4

<210> 5

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 5

cgau 4

<210> 6

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 6

cgua 4

<210> 7

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 7

cguu 4

<210> 8

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 8

gacg 4

<210> 9

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 9

gcca 4

<210> 10

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 10

gcgu 4

<210> 11

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 11

ggaa 4

<210> 12

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 12

gucg 4

<210> 13

<211> 4

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 13

gucu 4

<210> 14

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

ccttggcacc cgagaattcc a 21

<210> 15

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

caagcagaag acggcatacg agatgtcgtg atgtgactgg agttccttgg cacccgagaa 60

ttcca 65

<210> 16

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

aatgatacgg cgaccaccga gatctacacg ttcagagttc tacagtccga 50

<210> 17

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

accactgt 8

<210> 18

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tggatctg 8

<210> 19

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ccgtttgt 8

<210> 20

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tgctgggt 8

<210> 21

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

gaggggtt 8

<210> 22

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

aggttggg 8

<210> 23

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gtgtggtg 8

<210> 24

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

tggtcaca 8

<210> 25

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

ttgaccct 8

<210> 26

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ccactcct 8

Claims

1.血液中游离miRNA文库制备的方法，其特征在于，所述方法包括步骤：（a）从血液中分离血清或者血浆，提取游离RNA；从血浆或血清中提取200pg–20ng游离RNA；（b）将所述游离RNA与外源RNA混合，外源RNA序列中任意一部分均不与已知的人/大鼠/小鼠的miRNA序列重合; 外源RNA的长度为100nt–200nt，外源RNA为人工合成的序列，外源RNA与游离RNA按照任意比例混合，使得混合后的RNA总量超过10ng；（c）将步骤（b）中的RNA混合物加接头、反转录第一链、第二链合成及扩增，回收目标DNA片段，获得游离miRNA测序文库；将所述RNA混合物与衔接子RA3进行连接反应，衔接子RA3与RNA的3’端连接，形成核酸-衔接子RA3复合物；将所述核酸-衔接子RA3复合物与衔接子RA5进行连接反应，所述衔接子RA5与所述RNA的5’端连接，形成衔接子RA5-核酸-衔接子RA3复合物；将所述衔接子RA5-核酸-衔接子RA3复合物与反转录引物混合，进行反转录反应，得到DNA第一链；将所述DNA第一链与特异性结合于RA3的引物和特异性结合于RA5的引物进行混合，获得扩增产物；将所述扩增产物进行6%聚丙烯酰胺凝胶电泳，胶块经染色后在紫外灯下识别各DNA条带，割取所需的目标DNA片段并回收，得到制备完成的miRNA测序文库；其中，所述衔接子RA3的序列为SEQ ID NO:1，所述衔接子RA5的序列包括固有结构S1-S2-S3，S1的序列为SEQ ID NO:2，S2是随机标签序列，是长度为11～15个碱基的随机核苷酸序列，S3是长度为4个碱基的固定序列，S3为ACGA、CCGA、CGAU、CGUA、CGUU、GACG、GCCA、GCGU、GGAA、GUCG、GUCU中的一种；反转录引物为能够特异性结合于衔接子RA3的反转录引物RT Primer，RT Primer的序列从5’端到3’ 端为：CCTTGGCACCCGAGAATTCCA，能够特异性结合于衔接子RA3的引物为Primer1，Primer1的序列从5’端到3’ 端为：CAAGCAGAAGACGGCATACGAGATGTCGTGATGTGACTGGAGTTCCTTGGCACCCGAGAATTCCA，能够特异性结合于衔接子RA5的引物为Primer2，Primer2的序列从5’端到3’ 端为：AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA，其中Primer1序列中标下划线的8个碱基“GTCGTGAT”为index序列，所述index序列可用以下十种index序列替换：ACCACTGT、TGGATCTG、CCGTTTGT、TGCTGGGT、GAGGGGTT、AGGTTGGG、GTGTGGTG、TGGTCACA、TTGACCCT、CCACTCCT；所述目标DNA片段对应了miRNA，所述目标DNA片段的长度为miRNA的长度+测序接头的长度+S2的长度+S3的长度，其中，所述miRNA的长度为15～30bp，测序接头的长度为120bp，S2的长度为11～15bp，S3的长度为4bp。

2.血液中游离miRNA表达定量的方法，其特征在于，所述方法包括权利要求1所述的步骤（a）、步骤（b）和步骤（c），还包括如下步骤：（d）将所述miRNA测序文库进行二代测序，获得下机数据；（e）通过质控工具对所述下机数据进行数据质控和预处理，得到去除了低质量序列和测序接头的有效数据，将所述衔接子RA5中的S2随机标签序列以及S3固定碱基，从有效数据的序列5’端移除，再将其与人类参考基因组序列比对，获得定位于所述人类参考基因组序列的位置信息；（f）利用所述位置信息以及对应的所述S2随机标签序列，对PCR重复序列进行去除，再将获得的已去除PCR重复的序列的位置与所述人类参考基因组中的miRNA位置相比较，确定样本中所有的miRNA的表达量。

3.如权利要求2所述的血液中游离miRNA表达定量的方法，其特征在于，所述方法包括选自下组的一个或多个特征：1）在步骤（d）中，所述miRNA测序文库进行二代测序前，进行片段长度范围检测和浓度定量，使用Agilent 2100 Bioanalyzer进行片段长度范围检测，使用Invitrogen Qubit进行浓度定量，然后送至Illumina高通量测序平台进行测序，并获得下机数据；测序平台为Illumina HiSeq、NovaSeq或NextSeq测序平台中的一种，测序读长在50bp到150bp之间，测序模式为单端测序或者双端测序；（2）在步骤（e）中，质控工具为FastQC、Cutadpat和Trimmomatic，使用序列比对软件，与人类参考基因组序列进行比对；（3）在步骤（f）中，被序列比对软件比对到参考基因组同一位置的序列，即序列的5’ 端和3’端在参考基因组的位置相同的序列，若带有相同的随机标签序列S2，则视为PCR重复，并将其合并为同一条序列。

4.血液中游离miRNA文库制备的试剂盒，其特征在于，包括：外源RNA、衔接子RA3、衔接子RA5、反转录引物、引物Primer1和引物Primer2，将游离RNA与外源RNA混合，外源RNA序列中任意一部分均不与已知的人/大鼠/小鼠的miRNA序列重合; 游离RNA从血液中提取，血液中提取的游离RNA为200pg–20ng，外源RNA的长度为100nt–200nt，外源RNA为人工合成的序列，外源RNA与游离RNA按照任意比例混合，使得混合后的RNA总量超过10ng；所述衔接子RA3与血液样本中的游离miRNA的3’端连接形成核酸-衔接子RA3复合物，核酸-衔接子RA3复合物与衔接子RA5进行连接反应，衔接子RA5与所述miRNA的5’端连接形成RA5-核酸-衔接子RA3复合物，所述复合物与反转录引物混合进行反转录得到DNA第一链，所述DNA第一链与引物Primer1和引物Primer2混合进行PCR反应，获得扩增产物；所述衔接子RA3的序列为SEQID NO:1，所述衔接子RA5的序列包括固有结构S1-S2-S3，S1的序列为SEQ ID NO:2，S2为随机标签序列，S2是长度为11～15个碱基的随机核苷酸序列，S3是长度为4个碱基的固定序列，所述S3为ACGA、CCGA、CGAU、CGUA、CGUU、GACG、GCCA、GCGU、GGAA、GUCG、GUCU中的一种；反转录引物为能够特异性结合于衔接子RA3的反转录引物RT Primer，RT Primer的序列从5’端到3’ 端为：CCTTGGCACCCGAGAATTCCA，能够特异性结合于衔接子RA3的引物为Primer1，Primer1的序列从5’端到3’ 端为：CAAGCAGAAGACGGCATACGAGATGTCGTGATGTGACTGGAGTTCCTTGGCACCCGAGAATTCCA，能够特异性结合于衔接子RA5的引物为Primer2，Primer2的序列从5’端到3’ 端为：AATGATACGGCGACCACCGAGATCTACACGTTCAGAGTTCTACAGTCCGA，其中Primer1序列中标下划线的8个碱基“GTCGTGAT”为index序列，所述index序列可用以下十种index序列替换：ACCACTGT、TGGATCTG、CCGTTTGT、TGCTGGGT、GAGGGGTT、AGGTTGGG、GTGTGGTG、TGGTCACA、TTGACCCT、CCACTCCT。

5.如权利要求4所述的血液中游离miRNA文库制备的试剂盒，其特征在于，采用所述试剂盒获得的测序文库，对二代测序的数据进行分析时，可利用衔接子RA5的S2随机标签序列作为定量化标签，去除PCR重复序列，提高检测的准确性。