CN114807331A

CN114807331A - 一种短链dna的纳米孔测序方法

Info

Publication number: CN114807331A
Application number: CN202210517930.9A
Authority: CN
Inventors: 梁兴国; 胡坤灵; 宋子婷; 安然
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2022-07-29

Abstract

本发明涉及DNA测序技术领域。针对短链DNA难以进行纳米孔测序的问题，本发明提供一种短链DNA的纳米孔测序方法：待测的短链DNA，待测区T的两侧分别为B区和C区，B区和C区为互不包含的DNA片段；以短链DNA为模板设计引物对；以短链DNA为模板，以设计的引物对进行PCR扩增，得到重复含待测区T的DNA长双链；将扩增的DNA长双链进行纳米孔测序、分析结果，确定具体序列。本发明仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定，只需分析一个足够长的Read即可完成对短链DNA的测序，在一次纳米孔测序操作中，可用于同时测多个序列组成的基因组。

Description

一种短链DNA的纳米孔测序方法

技术领域

本发明涉及DNA测序技术领域，具体涉及一种短链DNA的纳米孔测序方法。

背景技术

纳米孔测序技术是一种单分子测序技术，具有序列读长长，仪器体积小，测序效率高等优点，但不适合测定短链DNA(<300bp)的序列，大大限制了其在检测单核苷酸变异(SNV)等方面的应用。另外，纳米孔测序获得的原始数据中通常含有5-8％的插入、缺失、误读等错误，故需要成千上万的Reads以上通过进行复杂的比对和计算才能获得正确的序列，工作量巨大。并且纳米孔测序的数据一般大于1G，对于仅含几十至几百个碱基对的序列的测定效率较低，且成本高昂。

Brandon D.Wilson等开发了一种可以用纳米孔测序分析短链的单链DNA的方法，通过连接和滚环扩增的方式把短链DNA扩增成长链重复序列，实现了短链DNA的扩增(文献Analytical Chemistry,2019,91,6783-6789)，但这种方法只适合单链DNA的SNV的测定。而通过PCR等技术获得的短的双链DNA不宜用此方法直接扩增。另外，当成千上万条短链序列混合时，即使要从中分析出一条正确的序列时，也需要处理所有或大部分数据。

开发能够单独分析一个Read(单Read)数据即能准确得出待测序列的方法将大大降低数据的处理量和机时。因此，要实现基于PCR产物等短链双链DNA以及其他方法获得的单链DNA的SNV的测定，做到简便易行，需要对DNA扩增方法进行本质上的改进或革新。发明内容

应用现有纳米孔测序技术对短链DNA序列进行测序时，需要复杂的扩增方法对短链DNA进行扩增，并且不能对短双链DNA直接测序，后续数据处理量大，针对上述问题，本发明提供了一种短链DNA的纳米孔测序方法。本方法直接进行PCR扩增并获取重复序列，然后用纳米孔测序仪直接测定扩增产物的序列。采用本方法设计的引物，可在PCR扩增中将短链DNA扩增成几十甚至几百倍长的DNA重复序列。纳米孔测序后，可达到只分析单个Read的数据就可以准确得到该重复序列所含待测DNA的序列。本方法即可用于未知序列的准确测序，又可用于准确鉴定SNV位点。

本发明采用的技术方案如下：

一种短链DNA的纳米孔测序方法，所述短链DNA包含待测区T，待测区T位于该短链的中间，待测区T的两侧分别为B区和C区，B区和C区为互不包含的DNA片段；

步骤一，以待测短链DNA为模板设计引物对，一条引物包含3′端序列和5′端序列，另一条引物包含3′端序列和5′端序列或者只包含3′端序列，上下游引物中至少有一条引物的5′端序列长度在20nt以上；上游引物的3′端序列同所设计的DNA的B区序列相同，5′端序列同C区序列部分相同或完全相同；下游引物的3′端序列同C序列区互补，5′端序列同B区序列部分互补或完全互补；

步骤二，以待测短链DNA为模板，采用常规的PCR条件，以步骤一设计的引物对进行PCR扩增，得到重复含待测区T的DNA长双链，待测区T的重复数至少为20次；

步骤三，将步骤二扩增的DNA长双链进行纳米孔测序；

步骤四，对步骤三的纳米孔原始测序数据进行分析，得出最终测序结果；

步骤五，根据步骤四的测序分析结果，比对分析，从而确定具体序列。

进一步地，所述短链DNA的待测区T的序列长度为1-1000bp，优选10-500bp，更优选20-200bp。

进一步地，所述步骤一设计的引物对，其中一条引物的3′端序列的长度为18-25nt，5′端序列的长度为0-25nt。

进一步地，所述步骤二待测区T的重复数为20-100次，优选20-80次，再优选30-50次。

进一步地，所述步骤二中引物浓度为1-100nM，优选2-80nM，再优选5-20nM。

该方法可用于在一次纳米孔测序操作中，同时测序多个不同的短链DNA，所述多个不同的短链DNA均满足步骤一和步骤二所限定的条件。

单个短链DNA的测序时间为1-10min；每增加一种待测序的短链DNA，测序时间相应累加，最长测定时间为24h。

在本发明中，当待测短链DNA的拷贝数小于1000时，先对短链DNA进行第一轮PCR扩增至拷贝数为1000以上的双链短链DNA。待测序的短链DNA为拷贝数为1000以上时，按照步骤二直接进行第二轮的PCR扩增、测序并分析结果。优选拷贝数为1000-3000。

与现有技术相比，本专利有具有以下有益效果：

本发明可实现T区为1-1000bp的短链DNA的纳米孔测序，且仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定，并分析出待测序列的准确序列信息，极大降低了测序数据的处理难度，一般的笔记本电脑就可以做到。本发明只需分析一个足够长的Read即可得到短链DNA的精确测序，并获得SNV分析结果。本发明可用于基因组的测序，在一次纳米孔测序操作中，同时测多个不同短链DNA序列组成的基因组，大大降低测序成本。

附图说明

图1为实施例第一轮PCR产物及模板区域分布示意图；

图2为实施例第二轮PCR引物序列设计示意图；

图3为实施例第二轮PCR扩增原理示意图；

图4为实施例纳米孔测序原始数据处理示意图；

图5为本发明短链DNA纳米孔测序流程图。

具体实施方式

下面结合具体实施例及附图对本发明做进一步详细说明。

以下实施例所用材料如下：

DNA序列由生工生物工程股份有限公司合成；2×Taq PCR StarMix with LoadingDye购自北京康润诚业生物科技有限公司(GenStar)；SQK-LSK109 MinION sequencingmachine(ONT)购自牛津纳米孔公司(Oxford Nanopore Technologies)；核酸染液(UltraGelRed)购自诺唯赞(南京)生物科技有限公司；其他化学用品购自美国西格玛奥德里奇(Sigma-Aldrich)。

以下实施例是为了证明本发明的方法具有优越性。其中，引物设计根据本发明所述要求确定，此处不再赘述。

以下每一个实施例都是一个独立的检测短链DNA的实例，每个实施例中至少检测一段短链DNA或一段含有SNV的短链DNA。当待测短链DNA多于一段时，需针对每段单独设计与之对应的引物对，并根据本发明所述要求增加相应的测序时间。

实施例1

(1)待测短链DNA及引物对设计

如图1所示，待测短链DNA包括待测区T区及分别位于T区两端的B区和C区，B区和C区为互不包含的DNA片段；

待测短链DNA的序列信息(5′→3′)：CCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGT(SEQ ID NO:1)；

其中，B区序列信息(5′→3′)：CCCGTGTACTCGTCCACTTT(长度20nt)；

T区序列信息(5′→3′)：ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT(长度36nt)；

C区序列信息(5′→3′)：GGTCATCCACAAGGCTGAGT(长度20nt)；

上游引物Pcb：如图2所示，3′端序列(双下划线)同待测DNA的正义链的B区序列相同，5′端序列(单下划线)同正义链的C区序列相同；

Pcb序列信息(5′→3′)：

(SEQ ID NO:2，长度40nt)；

下游引物Pc′b′：如图2所示，3′端序列(双下划线)同待测DNA正义链的C区互补，5′端序列(单下划线)同正义链的B区完全互补；

Pc′b′序列信息(5′→3′)：

ACC(SEQ ID NO:3，长度40nt)；

(2)利用上一步设计的引物对扩增待测短链DNA，形成含待测区T的多重重复序列(DNA长链产物)

PCR反应体系：拷贝数大于1000的待测短链DNA，1×Taq PCR StarMix withLoading Dye，上/下游引物Pcb/Pc′b′100nM；

1×Taq PCR StarMix组成：优化浓度的GenStar高浓度Taq DNA Polymerase，dNTPs，Mg²⁺,反应缓冲液和稳定剂等。

表1 PCR程序设置

随着扩增循环数的增加，含T区的目标产物浓度升高，会造成如图3的原理图所示的错开延伸长，进而形成待测区T的多重重复长序列。

(3)使用SQK-LSK109 MinION测序仪(ONT)对(2)中扩增得到的多重重复长序列进行测序。测序样品的预处理和正式测序步骤均需遵照ONT的说明书进行，控制测序时长为5-10min。

(4)对(3)的纳米孔原始测序数据进行分析：选取部分纳米孔测序结果(Reads)进行分析，选择原则为：Read的长度应＞2000nt(即待测区序列至少重复20次)。

以下为选取的结果中一个Read的结果：

@c108b7b5-ef5e-478e-ba81-45c96a5cb70d runid＝7de17488fb97253d45767dd9f6c2c06058334e16read＝759ch＝134start_time＝2022-01-25T05:05:09Z flow_cell_id＝FAR31323protocol_group_id＝20220125-liang sample_id＝sample1

CAATTGTACCGTTCAGTTACGTATTGCTGTCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCATTGTACTCGTCACTTTACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGAGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCATTAACTTTACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTGCTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCATCATGGTCATCCACAAGGATGAGTCCCGTACTCGTCCACTTTACGGGCAAACCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGATGTACTCGTCCACTTTACGGGCGAAGCCCATTTCGTGAGTCACCACCATCATGGTCTTCCACAAGGCTGGTCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGGGTTGTGCTCGTCACTTGCAGGCAGCCATTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGCTGCTCGTCCACTTTACAGGTAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAATTTCCGTTCCCATGTGCTCGTCCACTTTACGGGCAAGCCCATTTCGTGGGTCACCACCATCTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACAGGCAAAGCCTATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGGAAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCTCGTGTACTCGTCCACTTTACGGGCAAAGCCCGTAAAGGTGGACAATACAGCTGATATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTATACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGTAAGGCCGAGCCATTCATTGATCCTTACCATCATGGTCTAATCCACAAGGCTGAGTCCGTGTACCCGTCCACTTTACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCATGGGCATCCACAAGGCTGAGTCCCCCGTGTACTCGTCCACTTTGCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATCTCGTGGTCGCCACCATCATGGTCATCCACAAGGCTGGAGTCCCGTGTACTCGTCCACTTTGCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCACAGGCGCTGAAGTCCCGTGTACTCATCCACTTTGCAGGCAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAAGGCCCAGGTCCCGTGTACTCACCGTCACACTTTACAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCATGGTCATCCACAAGGCTGAGTCCAGGTCATCCACAGGCCAGGTCCCGTGTACTCGTCCACTTTACAGGCAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAGCCCATTTCGTGGAGTCACCACCATGTAGTCATCCTGAGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGAGTCATCCACGAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTATCCCGACAAGGCTGGAGAGTCCCGTGTACTCGTCCAGCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGCCATCCACAAGGCTGAGTCCCGTGTACTCGTCCGCTTTACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCATGATCATCCACAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTT

（5）根据（4）的测序分析结果，比对分析给出具体的单核苷酸变异位点。不同于传统的将所有序列按序列相似性排列后，再分析每个位置该是哪个碱基（按出现概率最大的碱基确定），而是只分析足够长的Read的测序结果即可确定单核苷酸变异位点。Read的长度要求待测区序列至少重复20次，优选重复30-100次。比对（4）中的单个Read的原始数据，并按重复单元处理待测区T的结果如下：

1.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

2.ACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGA

3.GGGCAAAAGCCCATTTCGTGGAGTCACCACCATCAT

4.ACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCAT

5.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

6.ACGGGCAAAGCCCATTTCGTGGGTCACCATCAT

7.ACGGGCAAACCCATTTCGTGAGTCACCACCATCAT

8.ACGGGCGAAGCCCATTTCGTGAGTCACCACCATCAT

9.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

10.ACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT

11.GCAGGCAGCCATTCGTGAGTCACCACCATCAT

12.ACAGGTAAAGCCCATTTCGTAGGTCACCACCATCAT

13.ACGGGCAAGCCCATTTCGTGGGTCACCACCATCT

14.AGGCAAAGCCTATTTCGTGGGTCACCACCATCAT

15.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

16.ACGGGCAAAGCCCGTAAAGGTGGACAATACAGCT

17.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

18.GTAAGGCCGAGCCATTCATTGATCCTTACCATCAT

19.ACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCAT

20.ACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCAT

21.GCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTT

22.ACGGGCAAAGCCCATCTCGTGGTCGCCACCATCAT

23.GCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCAT

24.GCAGGCAAAGCCCATTTCGTAGGTCACCACCATCAT

25.CAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCAT

26.ACAGGCAAGCCCATTTCGTGAGTCACCACCATCAT

27.GGGCAAAGCCCATTTCGTGGAGTCACCACCATGT

28.ACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGA

29.ACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCAT

30.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

31.GCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT

32.ACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCAT

33.ACGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

对齐矫正后得到准确T区域序列(5′→3′)：

ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT

测序结果准确性100％。

实施例2

(1)待测短链DNA及引物对设计

待测短链DNA包括待测区T区及分别位于T区两端的B区和C区，B区和C区为互不包含的DNA片段；

待测短链DNA的序列信息(5′→3′)：TATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGC(SEQ ID NO:4)；

其中，B区序列信息(5′→3′)：TATCCTTGATTGATTCGCTCTG(长度22nt)；

T区序列信息(5′→3′)：CGGCCAGCGTTTTAATCGTTAC(长度22nt)；

C区序列信息(5′→3′)：AATGGGTGTATTGGTTCGGC(长度20nt)；

上游引物Pcb：3′端序列(双下划线)同待测DNA的正义链的B区序列相同，5′端序列(单下划线)同正义链的C区序列相同；

Pcb序列信息(5′→3′)：

(SEQ ID NO:5，长度42nt)；

下游引物Pc′b′：3′端序列(单下划线)同待测DNA正义链的C区互补，5′端序列为0nt(即不设置5′端部分)；

Pc′b′序列信息(5′→3′)：GCCGAACCAATACACCCATT(SEQ ID NO:6，长度20nt)；

(2)利用上一步设计的引物对扩增待测短链DNA，形成含待测区T的多重重复序列(DNA长链产物)，PCR反应步骤同实施例1一致。

(3)纳米孔测序：步骤同实施例1一致，控制测序时长为5-10min。

(4)对(3)的纳米孔原始测序数据进行分析：

以下为选取的结果中一个Read的结果：

@b8cf39d8-717c-44de-9a16-2c325efbd276 runid＝7de17488fb97253d45767dd9f6c2c06058334e16read＝261ch＝312start_time＝2022-01-25T05:02:56Z flow_cell_id＝FAR31323protocol_group_id＝20220125-liang sample_id＝sample1

AAAAAAAAAAACTGTTGTACTTCGTTCAGTTACGTATTGCTGATTCGCTCTGCAAAATGCCCATGATTTTTCAATGGGTGTATTGGTTCCGGCAAATATCCTTGATTGATTCGTTTCTTAAGCCAGCGTTTAATCGTTACAATGGGTGTATTGGTTCGGCGAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAGTATCGTGATTGATTTGCTCTGCGGCCAGCGTTTTAATCTGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGATAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAGTAGATTGTATTGGTTCGGCAATTATCTTGATTGATTCGCTCTGCGACCAGCGTTTTAATCGTTACAATGGGTGTATTGAGTTAAACAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCAATTTACAATGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAACATCCTTGATTGATTTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCTTGATTGATTCTAGCTCTGCGGCCAGCGTTTTAATCGTAACAATGGATGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCCTTGTGGGTGTATTGGTTCGGCTTTTATCCTTGATTAATTCGCTCTGTGGCCAGCGTTTAATCGTTACAATGGAGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGAGTGTATTGGTTCGGCTCTTATCCTTGATTGATTCTCTGGGGCGCTGGTTGGCAATGGTGTATTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCAGCGTTTTAATCGTTACAATGGGTGTATTGGCTCGGCAAATACCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCAGCAAATATCCTCGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTACGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTATTGGTTCAGCAAACATCCTTGATTGATTCGCTCAGCGGCCAGCGTTTTAATCGTTACAATGCGTGTATTGGTTCAGCAAATATCCTTGATTAATTCGCTCTGCAGCCAGCGTTTTAATCATTACAATGGGTGTATTGGTTCGGCAAATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCTTGATTGATTCGCTCTGATTTAGGATGCGCAAAAAACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTATCCTTAATTGATTCGCTCTGCGGCCAGCGTTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTAATGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCGGCAAATATGTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGCGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCGCTGCGTGGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTCGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGC

(5)根据(4)的测序分析结果，比对(4)中的单个Read的原始数据，并按重复单元处理待测区T的结果如下：

1.TAAGCCAGCGTTTAATCGTTAC

2.CGGCCAGCGTTTTAATCGTTAC

3.CGGCCAGCGTTTTAATCTGTTAC

4.TCTGCGGCCAGCGTTTTAATCGTTAC

5.CGACCAGCGTTTTAATCGTTAC

6.CGGCCAGCGTTTTAATCAATTTAC

7.CGGCCAGCGTTTTAATCGTTAC

8.TCTGCAGCCAGCGTTTTAATCGTTAC

9.CGGCCAGCGTTTTAATCGTAAC

10.GGGCGCTGGTTGGCCTT

11.TGGCCAGCGTTTAATCGTTAC

12.CGGCCAGCGTTTTAATCGTTAC

13.GCGCTGGTTGGC

14.CGTCCAGCCATTTTGCT

15.CGTCAGCGTTTTAATCGTTAC

16.CGGCCAGCGTTTTAATCGTTAC

17.CGTCCAGCCATTTTGCT

18.CGTCCAGCCATTTGCT

19.GGGCGCTGGTTGGC

20.CGGCCAGCGTTTTAATCGTTAC

21.CAGCCAGCGTTTTAATCATTAC

22.CGGCCAGCGTTTTAATCGTTACA

23.ATTTAGGATGCGCAAAAAAC

24.CGGCCAGCGTTTTAATCGTTAC

25.CGGCCAGCGTTTTTAATCGTTAC

26.CGTCCAGCCATTTGCT

27.GGGCGCTGGTTGGC

28.CGTCCAGCCATTTTGCT

29.CGGCCAGCGTTTTAATCGTTAC

30.TGGCGTTTTAATCGTTAC

31.CGTCCAGCCATTTGCT

32.GGCCAGCGTTTTAATCGTTAC

33.CAGCCAGCGTTTTAATCGTTAC

对齐矫正后得到准确T区域序列(5′→3′)：

CGGCCAGCGTTTTAATCGTTAC

测序结果准确性100％。

实施例3

(1)分别包含单个SNV位点的两段待测短链DNA及其对应的引物对设计

待测短链DNA-a包括含一个SNV位点(G)的待测区aT区、分别位于aT区两端的aB区和aC区，aB区和aC区为互不包含的DNA片段；

待测短链DNA的序列信息(5′→3′)：TTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCT(SEQ ID NO:7)；

其中，aB区序列信息(5′→3′)：TTTGAGATAGGTAGGCCCTCG(长度21nt)；

aT区序列信息(5′→3′)：ATGATAACGTTAGTATCAATTTCAAC(长度26nt)其中，SNV位点碱基为T区域(5′→3′)第13nt处G；

aC区序列信息(5′→3′)：ACAACTTTCAGTATGACCCCT(长度21nt)；

上游引物aPcb：3′端序列(双下划线)同待测DNA-a的正义链的aB区序列相同，5′端序列(单下划线)同正义链的aC区序列相同，两部分中间含有一段短序列“AAA”；

aPcb序列信息(5′→3′)：

(SEQ ID NO:8，长度45nt)

下游引物aPc′b′：3′端序列(双下划线)同待测DNA-a正义链的aC区互补，5′端序列(单下划线)同正义链的aB区部分完全互补，两部分中间含有一段短序列“AAA”；

aPc′b′序列信息(5′→3′)：

(SEQ ID NO:9，长度45nt)

待测短链DNA-b包括含一个SNV位点(C)的待测区aT区、分别位于aT区两端的aB区和aC区，aB区和aC区为互不包含的DNA片段；

待测短链DNA的序列信息(5′→3′)：AAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCG(SEQ ID NO:10)；

其中，bB区序列信息(5′→3′)：AAATCCACGACAATCACGAAC(长度21nt)；

bT区序列信息(5′→3′)：ACTTTGCCGCCGCTGTTGTG(长度20nt)其中，SNV位点碱基为T区域(5′→3′)第11nt处C；

bC区序列信息(5′→3′)：TGTTTGGGTTGGTATTCATCG(长度21nt)；

上游引物bPcb：如图2所示，3′端序列(双下划线)同待测DNA-b的正义链的bB区序列相同，5′端序列(单下划线)同正义链的bC区序列相同，两部分中间含有一段短序列“AAA”；

bPcb序列信息(5′→3′)：

(SEQ ID NO:11，长度45nt)

下游引物bPc′b′：3′端序列(双下划线)同待测DNA-b正义链的bC区互补，5′端序列(单下划线)同正义链的bB区完全互补，两部分中间含有一段短序列“AAA”；

bPc′b′序列信息(5′→3′)：

(SEQ ID NO:12，长度45nt)

(2)利用上一步设计的两对引物对扩增两段待测短链DNA，形成含待测区T的多重重复序列(DNA长链产物)，PCR反应步骤同实施例1一致。

(3)纳米孔测序：步骤同实施例1一致，控制测序时长为10-20min。

(4)对(3)的纳米孔原始测序数据进行分析：

以下为选取的结果中含有一段待测DNA-a一个Read的结果：

@4949c9ca-e8b5-47ed-af0f-d4f5b734ec55 runid＝7de17488fb97253d45767dd9f6c2c06058334e16read＝160ch＝139start_time＝2022-01-25T05:02:57Z flow_cell_id＝FAR31323protocol_group_id＝20220125-liang sample_id＝sample1

ACAACTTTCAGTATGACTCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCCAGCACAACAGTATGACCTTTTTGAGATAGGTGGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACCGAAATTATGACCCCTAAATTTGAGATAGGTGACCCTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGTTTGGAATGAGTAGGCCCTCGATGATAACGTTATTATAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATAACGTTAGTATCAATTTCAACACAACTTTCAATTATGACCCTAAATTTGAATGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTTAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCGTTTTTAAGATGGTGAGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCTAGACCACAACATTCAGTATGACCTAAATTTGAGATAGGTGACCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCCGTATGACCCCTTTTTTTGAGATGATGACCCTCATTGATAACGTTAGTATCAATTTCAACTACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAATTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACACTGTCGACCCCTTTTTTGAGATAGGTAGGGCCTAGATGATAACGTTAGTATCAATTTCAACGCTTTTCGAGTATGACCCTAAATTTGGGAATTGGTAGGCCCCCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGATCCCTAGAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAACTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATGGTAGGCCCTCGACGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCTCTCGATGATAACGTTAGTAGCCAATTTCAACACAACTTTCAGTATGACTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATTGGTAGGCCCTAGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTAGGTAGTAACATTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGGGAATGAGGTAGGCCCTCGATGATAGCATTAGTATCAATTCAACACAACTTTCAGTATGACCCTTTTTAAATTCATTAAGGCCTCAACCACTTTATTATGACCCTAAATTTGAGATAAGTAGGCCCTCGTAATGCGGTAGTATCAATTTCCAACACAACTTTCAGTACCAGCCCCCTTTTTTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCCTTCGTTAACGTTGGTATCAATTTCAACACAACTTCAGTATGACCCCTTTTTTTGAGATAGGTGAACCTCAGTACGATAACATTCAGTGTCA

以下为选取的结果中含有一段待测DNA-b一个Read的结果：@2d0dc2a9-734c-46d3-9e0f-23e025c8d4d2 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=592ch=171 start_time=2022-01-25T05:04:15Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1

CGATGTACTTCGTTCAGTTACGTATTCTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACGATCACGTACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGACCACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCAGAAAAATCCGACAATCACGAACGGTATTCATCGTTTTAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGCGATAATTCATCGATTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGCTTAAATCACGATAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTTGGTATTCATCGTTCGGCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCGAAAAATCCGGCAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGATTGGTATTCATCGCTTAAATCCACGACAATCACGAACACTTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACGCTGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAAAATCGACATTCCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGTGGTATCATCGAAAAAATCCCGACAATCACGAACACTTTGTCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCCGTTTAAATCGACAATCACGACTTTCTTTCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATCCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTATTTGGGTTGGTATTCATCGCCGTCTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGATTTAGTATTCATCATTGCCAATCCACGACAATCACGAACGCTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACAATCACGAACCGCTGCCGCCGCTGTTGTGTTTGGGTTGGTATTCATCGAAAAAAATCCACGACAATCGCGAACACTTTGCCGCCGCCGTTGTGTGTTTGGGTTGGTGTTCATCGAGAAAATCCACGACAATCACGAACACTTTGCCGCTGTTGTGTGTTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACCGACGATCAACCTCTATCGCCGCTCACGTCTGAAGAAC

(5)根据(4)的测序分析结果，比对(4)中的单个Read的原始数据，并按重复单元处理待测区aT的结果如下：

1.ATGATAACGTTAGTATCAATTTCAAC

2.ATGATAACGTTAGTATCAATTTCCAGC

3.ATGATAACGTTAGTATCAATTTCAAC

4.ATGATAACGTTAGTATCAATTTCAAC

5.ATGATAACGTTAGTATCAATTTCAAC

6.ATGATAACGTTATTATAATTTCAAC

7.ATAACGTTAGTATCAATTTCAAC

8.ATGATAACGTTAGTATCAATTTCAAC

9.ATGATAACGTTAGTATCAATTTCAAC

10.ATGATAACGTTAGTATCAATTTCAAC

11.ATGATAACGTTAGTATCAATTTCAAC

12.TTGATAACGTTAGTATCAATTTCAACT

13.ATGATAACGTTAATTATCAATTTCAACAT

14.ATGATAACGTTAGTATCAATTTCAAC

15.ATGATAACGTTAGTATCAATTTCAAC

16.ATGATAACGTTAGTATCAATTTCAAC

17.ATGATAACGTTAGTATCAACTTCAAC

18.ATGATAACGTTAGTATCAATTTCAAC

19.ATGATAACGTTAGTAGCCAATTTCAAC

20.ATGATAACGTTAGTATCAATTTCAAC

21.ATGATAACGTTAGTATCAATTTCAAC

22.ATGATAACGTTAGTATCAATTTCAAC

23.ATGATAACGTTAGTATCAATTTTCAAC

24.ATGATAACGTTAGTATCAATTTCAAC

25.ATGATAACGTTAGTATCAATTTCAAC

26.GTAGTAACATTAGTATCAATTTCAAC

27.ATGATAGCATTAGTATCAATTCAAC

28.TAATGCGGTAGTATCAATTTCCAAC

29.ATGATAACGTTAGTATCAATTTCAAC

30.TTAACGTTGGTATCAATTTCAAC

按重复单元处理待测区bT的结果如下：

1.ACTTTGCCGCCGCTGTTGTG

2.ACTTTGCCGCCGCTGTTGTG

3.ACTTTGCCGCCGCTGTTGTG

4.ACTTTGCCGCCGCTGTTGTG

5.ACTTTGCCGCCGCTGTTGTG

6.ACTTTGCCGCCGCTGTTGTG

7.ACTTTGCCGCCGCTGTTGTG

8.ACTTTGCCGCCGCTGTTGTG

9.ACTTTGCCGCCGCTGTTGTG

10.ACTTTGCCGCCGCTGTTGTG

11.ACTTTGCCGCCGCTGTTGTG

12.ACTTTGCCGCCGCTGTTGTG

13.ACTTTGCCGCCGCTGTTGTG

14.ACTTTGCCGCCGCTGTTGTG

15.ACTTTGCCGCCGCTGTTGTG

16.ACTTTGCCGCCGCTGTTGTG

17.ACTTTGCCGCCGCTGTTGTG

18.ACTTTTGCCGCCGCTGTTGTG

19.GCTGCCGCTGTTG

20.ACACTTTGCCGCCGCTGTTGTG

21.ACTTTGTCGCCGCTGTTGTG

22.ACTTTGCCGCCGCTGTTGTG

23.CTTTCTTTCGCTGTTGTG

24.ACTTTGCCGCCGCTGTTGTG

25.ACTTTGCCGCCGCTGTTG

26.ACTTTGCCGCCGCTGTTGTG

27.GCTGCCGCCGCTGTTGTG

28.CGCTGCCGCCGCTGTTG

29.ACTTTGCCGCCGCCGTTGTG

30.ACTTTGCCGCTGTTGTG

对齐矫正后得到准确aT区域序列(5′→3′)：

ATGATAACGTTAGTATCAATTTCAAC

对齐矫正后得到准确bT区域序列(5′→3′)：

ACTTTGCCGCCGCTGTTGTG

两条短链DNA同时测序，测序结果准确性100％。

(6)根据(5)对齐矫正后得到准确aT和bT区域序列，确认位于aT区域(5′→3′)第13nt处SNV位点的碱基为G；bT区域(5′→3′)第11nt处SNV位点的碱基为C。

以上所述的实施例仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案作出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

序列表

<110> 中国海洋大学

<120> 一种短链 DNA 的纳米孔测序方法

<141> 2022-05-12

<160> 12

<170> SIPOSequenceListing 1.0

<210> 1

<211> 76

<212> DNA

<213> Artificial Sequence

<400> 1

cccgtgtact cgtccacttt acgggcaaag cccatttcgt gggtcaccac catcatggtc 60

atccacaagg ctgagt 76

<210> 2

<211> 40

<212> DNA

<213> Artificial Sequence

<400> 2

ggtcatccac aaggctgagt cccgtgtact cgtccacttt 40

<210> 3

<211> 40

<212> DNA

<213> Artificial Sequence

<400> 3

aaagtggacg agtacacggg actcagcctt gtggatgacc 40

<210> 4

<211> 64

<212> DNA

<213> Artificial Sequence

<400> 4

tatccttgat tgattcgctc tgcggccagc gttttaatcg ttacaatggg tgtattggtt 60

cggc 64

<210> 5

<211> 42

<212> DNA

<213> Artificial Sequence

<400> 5

aatgggtgta ttggttcggc tatccttgat tgattcgctc tg 42

<210> 6

<211> 20

<212> DNA

<213> Artificial Sequence

<400> 6

gccgaaccaa tacacccatt 20

<210> 7

<211> 68

<212> DNA

<213> Artificial Sequence

<400> 7

tttgagatag gtaggccctc gatgataacg ttagtatcaa tttcaacaca actttcagta 60

tgacccct 68

<210> 8

<211> 45

<212> DNA

<213> Artificial Sequence

<400> 8

acaactttca gtatgacccc taaatttgag ataggtaggc cctcg 45

<210> 9

<211> 45

<212> DNA

<213> Artificial Sequence

<400> 9

cgagggccta cctatctcaa aaaaaggggt catactgaaa gttgt 45

<210> 10

<211> 62

<212> DNA

<213> Artificial Sequence

<400> 10

aaatccacga caatcacgaa cactttgccg ccgctgttgt gtgtttgggt tggtattcat 60

cg 62

<210> 11

<211> 45

<212> DNA

<213> Artificial Sequence

<400> 11

tgtttgggtt ggtattcatc gaaaaaatcc acgacaatca cgaac 45

<210> 12

<211> 45

<212> DNA

<213> Artificial Sequence

<400> 12

gttcgtgatt gtcgtggatt taaacgatga ataccaaccc aaaca 45

Claims

1.一种短链DNA的纳米孔测序方法，其特征在于，所述短链DNA包含待测区T，待测区T位于该短链的中间，待测区T的两侧分别为B区和C区，B区和C区为互不包含的DNA片段；

步骤一，以所述短链DNA为模板设计引物对，一条引物包含3′端序列和5′端序列，另一条引物包含3′端序列和5′端序列或者只包含3′端序列，至少有一条引物的5′端序列长度在20nt以上；上游引物的3′端序列同所设计的DNA的B区序列相同，5′端序列同C区序列部分相同或完全相同；下游引物的3′端序列同C序列区互补，5′端序列同B区序列部分互补或完全互补；

步骤二，以所述短链DNA为模板，采用常规的PCR条件，以步骤一设计的引物对进行PCR扩增，得到重复含待测区T的DNA长双链，待测区T的重复数至少为20次；

步骤三，将步骤二扩增的DNA长双链进行纳米孔测序；

2.根据权利要求1所述的短链DNA 的纳米孔测序方法，其特征在于，所述短链DNA的待测区T的序列长度为1-1000bp。

3.根据权利要求2所述的短链DNA的纳米孔测序方法，其特征在于，所述短链DNA的待测区T的序列长度为10-500bp。

4.根据权利要求2所述的短链DNA的纳米孔测序方法，其特征在于，进行步骤二时，模板链的拷贝数为1000以上。

5.根据权利要求1所述的短链DNA的纳米孔测序方法，其特征在于，所述步骤二待测区T的重复数为20-100次。

6.根据权利要求1所述的短链DNA的纳米孔测序方法，其特征在于，所述步骤二中引物浓度为1-100nM。

7.根据权利要求1所述的短链DNA的纳米孔测序方法，其特征在于，该方法用于在一次纳米孔测序操作中，同时测序多个不同的短链DNA，所述多个不同的短链DNA均满足步骤一和骤二所限定的条件。

8.根据权利要求7所述的短链DNA的纳米孔测序方法，其特征在于，单个短链DNA的测序时间为1-10min；每增加一种待测序的短链DNA，测序时间相应累加，最长测定时间为24h。

9.根据权利要求1所述的短链DNA的纳米孔测序方法，其特征在于，所述步骤一设计的引物对，其中一条引物的3′端序列的长度为18-25nt，5′端序列的长度为0-25nt。