CN114807331A - 一种短链dna的纳米孔测序方法 - Google Patents

一种短链dna的纳米孔测序方法 Download PDF

Info

Publication number
CN114807331A
CN114807331A CN202210517930.9A CN202210517930A CN114807331A CN 114807331 A CN114807331 A CN 114807331A CN 202210517930 A CN202210517930 A CN 202210517930A CN 114807331 A CN114807331 A CN 114807331A
Authority
CN
China
Prior art keywords
short
region
sequence
sequencing
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210517930.9A
Other languages
English (en)
Inventor
梁兴国
胡坤灵
宋子婷
安然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202210517930.9A priority Critical patent/CN114807331A/zh
Publication of CN114807331A publication Critical patent/CN114807331A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Abstract

本发明涉及DNA测序技术领域。针对短链DNA难以进行纳米孔测序的问题,本发明提供一种短链DNA的纳米孔测序方法:待测的短链DNA,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;以短链DNA为模板设计引物对;以短链DNA为模板,以设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链;将扩增的DNA长双链进行纳米孔测序、分析结果,确定具体序列。本发明仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定,只需分析一个足够长的Read即可完成对短链DNA的测序,在一次纳米孔测序操作中,可用于同时测多个序列组成的基因组。

Description

一种短链DNA的纳米孔测序方法
技术领域
本发明涉及DNA测序技术领域,具体涉及一种短链DNA的纳米孔测序方法。
背景技术
纳米孔测序技术是一种单分子测序技术,具有序列读长长,仪器体积小,测序效率高等优点,但不适合测定短链DNA(<300bp)的序列,大大限制了其在检测单核苷酸变异(SNV)等方面的应用。另外,纳米孔测序获得的原始数据中通常含有5-8%的插入、缺失、误读等错误,故需要成千上万的Reads以上通过进行复杂的比对和计算才能获得正确的序列,工作量巨大。并且纳米孔测序的数据一般大于1G,对于仅含几十至几百个碱基对的序列的测定效率较低,且成本高昂。
Brandon D.Wilson等开发了一种可以用纳米孔测序分析短链的单链DNA的方法,通过连接和滚环扩增的方式把短链DNA扩增成长链重复序列,实现了短链DNA的扩增(文献Analytical Chemistry,2019,91,6783-6789),但这种方法只适合单链DNA的SNV的测定。而通过PCR等技术获得的短的双链DNA不宜用此方法直接扩增。另外,当成千上万条短链序列混合时,即使要从中分析出一条正确的序列时,也需要处理所有或大部分数据。
开发能够单独分析一个Read(单Read)数据即能准确得出待测序列的方法将大大降低数据的处理量和机时。因此,要实现基于PCR产物等短链双链DNA以及其他方法获得的单链DNA的SNV的测定,做到简便易行,需要对DNA扩增方法进行本质上的改进或革新。发明内容
应用现有纳米孔测序技术对短链DNA序列进行测序时,需要复杂的扩增方法对短链DNA进行扩增,并且不能对短双链DNA直接测序,后续数据处理量大,针对上述问题,本发明提供了一种短链DNA的纳米孔测序方法。本方法直接进行PCR扩增并获取重复序列,然后用纳米孔测序仪直接测定扩增产物的序列。采用本方法设计的引物,可在PCR扩增中将短链DNA扩增成几十甚至几百倍长的DNA重复序列。纳米孔测序后,可达到只分析单个Read的数据就可以准确得到该重复序列所含待测DNA的序列。本方法即可用于未知序列的准确测序,又可用于准确鉴定SNV位点。
本发明采用的技术方案如下:
一种短链DNA的纳米孔测序方法,所述短链DNA包含待测区T,待测区T位于该短链的中间,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;
步骤一,以待测短链DNA为模板设计引物对,一条引物包含3′端序列和5′端序列,另一条引物包含3′端序列和5′端序列或者只包含3′端序列,上下游引物中至少有一条引物的5′端序列长度在20nt以上;上游引物的3′端序列同所设计的DNA的B区序列相同,5′端序列同C区序列部分相同或完全相同;下游引物的3′端序列同C序列区互补,5′端序列同B区序列部分互补或完全互补;
步骤二,以待测短链DNA为模板,采用常规的PCR条件,以步骤一设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链,待测区T的重复数至少为20次;
步骤三,将步骤二扩增的DNA长双链进行纳米孔测序;
步骤四,对步骤三的纳米孔原始测序数据进行分析,得出最终测序结果;
步骤五,根据步骤四的测序分析结果,比对分析,从而确定具体序列。
进一步地,所述短链DNA的待测区T的序列长度为1-1000bp,优选10-500bp,更优选20-200bp。
进一步地,所述步骤一设计的引物对,其中一条引物的3′端序列的长度为18-25nt,5′端序列的长度为0-25nt。
进一步地,所述步骤二待测区T的重复数为20-100次,优选20-80次,再优选30-50次。
进一步地,所述步骤二中引物浓度为1-100nM,优选2-80nM,再优选5-20nM。
该方法可用于在一次纳米孔测序操作中,同时测序多个不同的短链DNA,所述多个不同的短链DNA均满足步骤一和步骤二所限定的条件。
单个短链DNA的测序时间为1-10min;每增加一种待测序的短链DNA,测序时间相应累加,最长测定时间为24h。
在本发明中,当待测短链DNA的拷贝数小于1000时,先对短链DNA进行第一轮PCR扩增至拷贝数为1000以上的双链短链DNA。待测序的短链DNA为拷贝数为1000以上时,按照步骤二直接进行第二轮的PCR扩增、测序并分析结果。优选拷贝数为1000-3000。
与现有技术相比,本专利有具有以下有益效果:
本发明可实现T区为1-1000bp的短链DNA的纳米孔测序,且仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定,并分析出待测序列的准确序列信息,极大降低了测序数据的处理难度,一般的笔记本电脑就可以做到。本发明只需分析一个足够长的Read即可得到短链DNA的精确测序,并获得SNV分析结果。本发明可用于基因组的测序,在一次纳米孔测序操作中,同时测多个不同短链DNA序列组成的基因组,大大降低测序成本。
附图说明
图1为实施例第一轮PCR产物及模板区域分布示意图;
图2为实施例第二轮PCR引物序列设计示意图;
图3为实施例第二轮PCR扩增原理示意图;
图4为实施例纳米孔测序原始数据处理示意图;
图5为本发明短链DNA纳米孔测序流程图。
具体实施方式
下面结合具体实施例及附图对本发明做进一步详细说明。
以下实施例所用材料如下:
DNA序列由生工生物工程股份有限公司合成;2×Taq PCR StarMix with LoadingDye购自北京康润诚业生物科技有限公司(GenStar);SQK-LSK109 MinION sequencingmachine(ONT)购自牛津纳米孔公司(Oxford Nanopore Technologies);核酸染液(UltraGelRed)购自诺唯赞(南京)生物科技有限公司;其他化学用品购自美国西格玛奥德里奇(Sigma-Aldrich)。
以下实施例是为了证明本发明的方法具有优越性。其中,引物设计根据本发明所述要求确定,此处不再赘述。
以下每一个实施例都是一个独立的检测短链DNA的实例,每个实施例中至少检测一段短链DNA或一段含有SNV的短链DNA。当待测短链DNA多于一段时,需针对每段单独设计与之对应的引物对,并根据本发明所述要求增加相应的测序时间。
实施例1
(1)待测短链DNA及引物对设计
如图1所示,待测短链DNA包括待测区T区及分别位于T区两端的B区和C区,B区和C区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):CCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGT(SEQ ID NO:1);
其中,B区序列信息(5′→3′):CCCGTGTACTCGTCCACTTT(长度20nt);
T区序列信息(5′→3′):ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT(长度36nt);
C区序列信息(5′→3′):GGTCATCCACAAGGCTGAGT(长度20nt);
上游引物Pcb:如图2所示,3′端序列(双下划线)同待测DNA的正义链的B区序列相同,5′端序列(单下划线)同正义链的C区序列相同;
Pcb序列信息(5′→3′):
Figure BDA0003640511360000031
(SEQ ID NO:2,长度40nt);
下游引物Pc′b′:如图2所示,3′端序列(双下划线)同待测DNA正义链的C区互补,5′端序列(单下划线)同正义链的B区完全互补;
Pc′b′序列信息(5′→3′):
Figure BDA0003640511360000041
ACC(SEQ ID NO:3,长度40nt);
(2)利用上一步设计的引物对扩增待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物)
PCR反应体系:拷贝数大于1000的待测短链DNA,1×Taq PCR StarMix withLoading Dye,上/下游引物Pcb/Pc′b′100nM;
1×Taq PCR StarMix组成:优化浓度的GenStar高浓度Taq DNA Polymerase,dNTPs,Mg2+,反应缓冲液和稳定剂等。
表1 PCR程序设置
Figure BDA0003640511360000042
随着扩增循环数的增加,含T区的目标产物浓度升高,会造成如图3的原理图所示的错开延伸长,进而形成待测区T的多重重复长序列。
(3)使用SQK-LSK109 MinION测序仪(ONT)对(2)中扩增得到的多重重复长序列进行测序。测序样品的预处理和正式测序步骤均需遵照ONT的说明书进行,控制测序时长为5-10min。
(4)对(3)的纳米孔原始测序数据进行分析:选取部分纳米孔测序结果(Reads)进行分析,选择原则为:Read的长度应>2000nt(即待测区序列至少重复20次)。
以下为选取的结果中一个Read的结果:
@c108b7b5-ef5e-478e-ba81-45c96a5cb70d runid=7de17488fb97253d45767dd9f6c2c06058334e16read=759ch=134start_time=2022-01-25T05:05:09Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
CAATTGTACCGTTCAGTTACGTATTGCTGTCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCATTGTACTCGTCACTTTACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGAGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCATTAACTTTACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTGCTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCATCATGGTCATCCACAAGGATGAGTCCCGTACTCGTCCACTTTACGGGCAAACCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGATGTACTCGTCCACTTTACGGGCGAAGCCCATTTCGTGAGTCACCACCATCATGGTCTTCCACAAGGCTGGTCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGGGTTGTGCTCGTCACTTGCAGGCAGCCATTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGCTGCTCGTCCACTTTACAGGTAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAATTTCCGTTCCCATGTGCTCGTCCACTTTACGGGCAAGCCCATTTCGTGGGTCACCACCATCTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACAGGCAAAGCCTATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGGAAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCTCGTGTACTCGTCCACTTTACGGGCAAAGCCCGTAAAGGTGGACAATACAGCTGATATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTATACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGTAAGGCCGAGCCATTCATTGATCCTTACCATCATGGTCTAATCCACAAGGCTGAGTCCGTGTACCCGTCCACTTTACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCATGGGCATCCACAAGGCTGAGTCCCCCGTGTACTCGTCCACTTTGCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATCTCGTGGTCGCCACCATCATGGTCATCCACAAGGCTGGAGTCCCGTGTACTCGTCCACTTTGCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCACAGGCGCTGAAGTCCCGTGTACTCATCCACTTTGCAGGCAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAAGGCCCAGGTCCCGTGTACTCACCGTCACACTTTACAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCATGGTCATCCACAAGGCTGAGTCCAGGTCATCCACAGGCCAGGTCCCGTGTACTCGTCCACTTTACAGGCAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAGCCCATTTCGTGGAGTCACCACCATGTAGTCATCCTGAGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGAGTCATCCACGAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTATCCCGACAAGGCTGGAGAGTCCCGTGTACTCGTCCAGCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGCCATCCACAAGGCTGAGTCCCGTGTACTCGTCCGCTTTACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCATGATCATCCACAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTT
(5)根据(4)的测序分析结果,比对分析给出具体的单核苷酸变异位点。不同于传统的将所有序列按序列相似性排列后,再分析每个位置该是哪个碱基(按出现概率最大的碱基确定),而是只分析足够长的Read的测序结果即可确定单核苷酸变异位点。Read的长度要求待测区序列至少重复20次,优选重复30-100次。比对(4)中的单个Read的原始数据,并按重复单元处理待测区T的结果如下:
1.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
2.ACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGA
3.GGGCAAAAGCCCATTTCGTGGAGTCACCACCATCAT
4.ACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCAT
5.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
6.ACGGGCAAAGCCCATTTCGTGGGTCACCATCAT
7.ACGGGCAAACCCATTTCGTGAGTCACCACCATCAT
8.ACGGGCGAAGCCCATTTCGTGAGTCACCACCATCAT
9.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
10.ACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT
11.GCAGGCAGCCATTCGTGAGTCACCACCATCAT
12.ACAGGTAAAGCCCATTTCGTAGGTCACCACCATCAT
13.ACGGGCAAGCCCATTTCGTGGGTCACCACCATCT
14.AGGCAAAGCCTATTTCGTGGGTCACCACCATCAT
15.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
16.ACGGGCAAAGCCCGTAAAGGTGGACAATACAGCT
17.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
18.GTAAGGCCGAGCCATTCATTGATCCTTACCATCAT
19.ACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCAT
20.ACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCAT
21.GCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTT
22.ACGGGCAAAGCCCATCTCGTGGTCGCCACCATCAT
23.GCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCAT
24.GCAGGCAAAGCCCATTTCGTAGGTCACCACCATCAT
25.CAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCAT
26.ACAGGCAAGCCCATTTCGTGAGTCACCACCATCAT
27.GGGCAAAGCCCATTTCGTGGAGTCACCACCATGT
28.ACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGA
29.ACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCAT
30.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
31.GCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT
32.ACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCAT
33.ACGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
对齐矫正后得到准确T区域序列(5′→3′):
ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
测序结果准确性100%。
实施例2
(1)待测短链DNA及引物对设计
待测短链DNA包括待测区T区及分别位于T区两端的B区和C区,B区和C区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):TATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGC(SEQ ID NO:4);
其中,B区序列信息(5′→3′):TATCCTTGATTGATTCGCTCTG(长度22nt);
T区序列信息(5′→3′):CGGCCAGCGTTTTAATCGTTAC(长度22nt);
C区序列信息(5′→3′):AATGGGTGTATTGGTTCGGC(长度20nt);
上游引物Pcb:3′端序列(双下划线)同待测DNA的正义链的B区序列相同,5′端序列(单下划线)同正义链的C区序列相同;
Pcb序列信息(5′→3′):
Figure BDA0003640511360000071
(SEQ ID NO:5,长度42nt);
下游引物Pc′b′:3′端序列(单下划线)同待测DNA正义链的C区互补,5′端序列为0nt(即不设置5′端部分);
Pc′b′序列信息(5′→3′):GCCGAACCAATACACCCATT(SEQ ID NO:6,长度20nt);
(2)利用上一步设计的引物对扩增待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物),PCR反应步骤同实施例1一致。
(3)纳米孔测序:步骤同实施例1一致,控制测序时长为5-10min。
(4)对(3)的纳米孔原始测序数据进行分析:
以下为选取的结果中一个Read的结果:
@b8cf39d8-717c-44de-9a16-2c325efbd276 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=261ch=312start_time=2022-01-25T05:02:56Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
AAAAAAAAAAACTGTTGTACTTCGTTCAGTTACGTATTGCTGATTCGCTCTGCAAAATGCCCATGATTTTTCAATGGGTGTATTGGTTCCGGCAAATATCCTTGATTGATTCGTTTCTTAAGCCAGCGTTTAATCGTTACAATGGGTGTATTGGTTCGGCGAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAGTATCGTGATTGATTTGCTCTGCGGCCAGCGTTTTAATCTGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGATAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAGTAGATTGTATTGGTTCGGCAATTATCTTGATTGATTCGCTCTGCGACCAGCGTTTTAATCGTTACAATGGGTGTATTGAGTTAAACAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCAATTTACAATGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAACATCCTTGATTGATTTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCTTGATTGATTCTAGCTCTGCGGCCAGCGTTTTAATCGTAACAATGGATGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCCTTGTGGGTGTATTGGTTCGGCTTTTATCCTTGATTAATTCGCTCTGTGGCCAGCGTTTAATCGTTACAATGGAGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGAGTGTATTGGTTCGGCTCTTATCCTTGATTGATTCTCTGGGGCGCTGGTTGGCAATGGTGTATTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCAGCGTTTTAATCGTTACAATGGGTGTATTGGCTCGGCAAATACCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCAGCAAATATCCTCGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTACGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTATTGGTTCAGCAAACATCCTTGATTGATTCGCTCAGCGGCCAGCGTTTTAATCGTTACAATGCGTGTATTGGTTCAGCAAATATCCTTGATTAATTCGCTCTGCAGCCAGCGTTTTAATCATTACAATGGGTGTATTGGTTCGGCAAATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCTTGATTGATTCGCTCTGATTTAGGATGCGCAAAAAACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTATCCTTAATTGATTCGCTCTGCGGCCAGCGTTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTAATGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCGGCAAATATGTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGCGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCGCTGCGTGGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTCGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGC
(5)根据(4)的测序分析结果,比对(4)中的单个Read的原始数据,并按重复单元处理待测区T的结果如下:
1.TAAGCCAGCGTTTAATCGTTAC
2.CGGCCAGCGTTTTAATCGTTAC
3.CGGCCAGCGTTTTAATCTGTTAC
4.TCTGCGGCCAGCGTTTTAATCGTTAC
5.CGACCAGCGTTTTAATCGTTAC
6.CGGCCAGCGTTTTAATCAATTTAC
7.CGGCCAGCGTTTTAATCGTTAC
8.TCTGCAGCCAGCGTTTTAATCGTTAC
9.CGGCCAGCGTTTTAATCGTAAC
10.GGGCGCTGGTTGGCCTT
11.TGGCCAGCGTTTAATCGTTAC
12.CGGCCAGCGTTTTAATCGTTAC
13.GCGCTGGTTGGC
14.CGTCCAGCCATTTTGCT
15.CGTCAGCGTTTTAATCGTTAC
16.CGGCCAGCGTTTTAATCGTTAC
17.CGTCCAGCCATTTTGCT
18.CGTCCAGCCATTTGCT
19.GGGCGCTGGTTGGC
20.CGGCCAGCGTTTTAATCGTTAC
21.CAGCCAGCGTTTTAATCATTAC
22.CGGCCAGCGTTTTAATCGTTACA
23.ATTTAGGATGCGCAAAAAAC
24.CGGCCAGCGTTTTAATCGTTAC
25.CGGCCAGCGTTTTTAATCGTTAC
26.CGTCCAGCCATTTGCT
27.GGGCGCTGGTTGGC
28.CGTCCAGCCATTTTGCT
29.CGGCCAGCGTTTTAATCGTTAC
30.TGGCGTTTTAATCGTTAC
31.CGTCCAGCCATTTGCT
32.GGCCAGCGTTTTAATCGTTAC
33.CAGCCAGCGTTTTAATCGTTAC
对齐矫正后得到准确T区域序列(5′→3′):
CGGCCAGCGTTTTAATCGTTAC
测序结果准确性100%。
实施例3
(1)分别包含单个SNV位点的两段待测短链DNA及其对应的引物对设计
待测短链DNA-a包括含一个SNV位点(G)的待测区aT区、分别位于aT区两端的aB区和aC区,aB区和aC区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):TTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCT(SEQ ID NO:7);
其中,aB区序列信息(5′→3′):TTTGAGATAGGTAGGCCCTCG(长度21nt);
aT区序列信息(5′→3′):ATGATAACGTTAGTATCAATTTCAAC(长度26nt)其中,SNV位点碱基为T区域(5′→3′)第13nt处G;
aC区序列信息(5′→3′):ACAACTTTCAGTATGACCCCT(长度21nt);
上游引物aPcb:3′端序列(双下划线)同待测DNA-a的正义链的aB区序列相同,5′端序列(单下划线)同正义链的aC区序列相同,两部分中间含有一段短序列“AAA”;
aPcb序列信息(5′→3′):
Figure BDA0003640511360000091
Figure BDA0003640511360000092
(SEQ ID NO:8,长度45nt)
下游引物aPc′b′:3′端序列(双下划线)同待测DNA-a正义链的aC区互补,5′端序列(单下划线)同正义链的aB区部分完全互补,两部分中间含有一段短序列“AAA”;
aPc′b′序列信息(5′→3′):
Figure BDA0003640511360000093
Figure BDA0003640511360000094
(SEQ ID NO:9,长度45nt)
待测短链DNA-b包括含一个SNV位点(C)的待测区aT区、分别位于aT区两端的aB区和aC区,aB区和aC区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):AAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCG(SEQ ID NO:10);
其中,bB区序列信息(5′→3′):AAATCCACGACAATCACGAAC(长度21nt);
bT区序列信息(5′→3′):ACTTTGCCGCCGCTGTTGTG(长度20nt)其中,SNV位点碱基为T区域(5′→3′)第11nt处C;
bC区序列信息(5′→3′):TGTTTGGGTTGGTATTCATCG(长度21nt);
上游引物bPcb:如图2所示,3′端序列(双下划线)同待测DNA-b的正义链的bB区序列相同,5′端序列(单下划线)同正义链的bC区序列相同,两部分中间含有一段短序列“AAA”;
bPcb序列信息(5′→3′):
Figure BDA0003640511360000101
Figure BDA0003640511360000102
(SEQ ID NO:11,长度45nt)
下游引物bPc′b′:3′端序列(双下划线)同待测DNA-b正义链的bC区互补,5′端序列(单下划线)同正义链的bB区完全互补,两部分中间含有一段短序列“AAA”;
bPc′b′序列信息(5′→3′):
Figure BDA0003640511360000103
Figure BDA0003640511360000104
(SEQ ID NO:12,长度45nt)
(2)利用上一步设计的两对引物对扩增两段待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物),PCR反应步骤同实施例1一致。
(3)纳米孔测序:步骤同实施例1一致,控制测序时长为10-20min。
(4)对(3)的纳米孔原始测序数据进行分析:
以下为选取的结果中含有一段待测DNA-a一个Read的结果:
@4949c9ca-e8b5-47ed-af0f-d4f5b734ec55 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=160ch=139start_time=2022-01-25T05:02:57Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
ACAACTTTCAGTATGACTCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCCAGCACAACAGTATGACCTTTTTGAGATAGGTGGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACCGAAATTATGACCCCTAAATTTGAGATAGGTGACCCTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGTTTGGAATGAGTAGGCCCTCGATGATAACGTTATTATAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATAACGTTAGTATCAATTTCAACACAACTTTCAATTATGACCCTAAATTTGAATGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTTAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCGTTTTTAAGATGGTGAGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCTAGACCACAACATTCAGTATGACCTAAATTTGAGATAGGTGACCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCCGTATGACCCCTTTTTTTGAGATGATGACCCTCATTGATAACGTTAGTATCAATTTCAACTACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAATTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACACTGTCGACCCCTTTTTTGAGATAGGTAGGGCCTAGATGATAACGTTAGTATCAATTTCAACGCTTTTCGAGTATGACCCTAAATTTGGGAATTGGTAGGCCCCCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGATCCCTAGAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAACTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATGGTAGGCCCTCGACGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCTCTCGATGATAACGTTAGTAGCCAATTTCAACACAACTTTCAGTATGACTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATTGGTAGGCCCTAGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTAGGTAGTAACATTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGGGAATGAGGTAGGCCCTCGATGATAGCATTAGTATCAATTCAACACAACTTTCAGTATGACCCTTTTTAAATTCATTAAGGCCTCAACCACTTTATTATGACCCTAAATTTGAGATAAGTAGGCCCTCGTAATGCGGTAGTATCAATTTCCAACACAACTTTCAGTACCAGCCCCCTTTTTTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCCTTCGTTAACGTTGGTATCAATTTCAACACAACTTCAGTATGACCCCTTTTTTTGAGATAGGTGAACCTCAGTACGATAACATTCAGTGTCA
以下为选取的结果中含有一段待测DNA-b一个Read的结果:@2d0dc2a9-734c-46d3-9e0f-23e025c8d4d2 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=592ch=171 start_time=2022-01-25T05:04:15Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
CGATGTACTTCGTTCAGTTACGTATTCTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACGATCACGTACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGACCACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCAGAAAAATCCGACAATCACGAACGGTATTCATCGTTTTAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGCGATAATTCATCGATTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGCTTAAATCACGATAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTTGGTATTCATCGTTCGGCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCGAAAAATCCGGCAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGATTGGTATTCATCGCTTAAATCCACGACAATCACGAACACTTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACGCTGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAAAATCGACATTCCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGTGGTATCATCGAAAAAATCCCGACAATCACGAACACTTTGTCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCCGTTTAAATCGACAATCACGACTTTCTTTCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATCCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTATTTGGGTTGGTATTCATCGCCGTCTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGATTTAGTATTCATCATTGCCAATCCACGACAATCACGAACGCTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACAATCACGAACCGCTGCCGCCGCTGTTGTGTTTGGGTTGGTATTCATCGAAAAAAATCCACGACAATCGCGAACACTTTGCCGCCGCCGTTGTGTGTTTGGGTTGGTGTTCATCGAGAAAATCCACGACAATCACGAACACTTTGCCGCTGTTGTGTGTTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACCGACGATCAACCTCTATCGCCGCTCACGTCTGAAGAAC
(5)根据(4)的测序分析结果,比对(4)中的单个Read的原始数据,并按重复单元处理待测区aT的结果如下:
1.ATGATAACGTTAGTATCAATTTCAAC
2.ATGATAACGTTAGTATCAATTTCCAGC
3.ATGATAACGTTAGTATCAATTTCAAC
4.ATGATAACGTTAGTATCAATTTCAAC
5.ATGATAACGTTAGTATCAATTTCAAC
6.ATGATAACGTTATTATAATTTCAAC
7.ATAACGTTAGTATCAATTTCAAC
8.ATGATAACGTTAGTATCAATTTCAAC
9.ATGATAACGTTAGTATCAATTTCAAC
10.ATGATAACGTTAGTATCAATTTCAAC
11.ATGATAACGTTAGTATCAATTTCAAC
12.TTGATAACGTTAGTATCAATTTCAACT
13.ATGATAACGTTAATTATCAATTTCAACAT
14.ATGATAACGTTAGTATCAATTTCAAC
15.ATGATAACGTTAGTATCAATTTCAAC
16.ATGATAACGTTAGTATCAATTTCAAC
17.ATGATAACGTTAGTATCAACTTCAAC
18.ATGATAACGTTAGTATCAATTTCAAC
19.ATGATAACGTTAGTAGCCAATTTCAAC
20.ATGATAACGTTAGTATCAATTTCAAC
21.ATGATAACGTTAGTATCAATTTCAAC
22.ATGATAACGTTAGTATCAATTTCAAC
23.ATGATAACGTTAGTATCAATTTTCAAC
24.ATGATAACGTTAGTATCAATTTCAAC
25.ATGATAACGTTAGTATCAATTTCAAC
26.GTAGTAACATTAGTATCAATTTCAAC
27.ATGATAGCATTAGTATCAATTCAAC
28.TAATGCGGTAGTATCAATTTCCAAC
29.ATGATAACGTTAGTATCAATTTCAAC
30.TTAACGTTGGTATCAATTTCAAC
按重复单元处理待测区bT的结果如下:
1.ACTTTGCCGCCGCTGTTGTG
2.ACTTTGCCGCCGCTGTTGTG
3.ACTTTGCCGCCGCTGTTGTG
4.ACTTTGCCGCCGCTGTTGTG
5.ACTTTGCCGCCGCTGTTGTG
6.ACTTTGCCGCCGCTGTTGTG
7.ACTTTGCCGCCGCTGTTGTG
8.ACTTTGCCGCCGCTGTTGTG
9.ACTTTGCCGCCGCTGTTGTG
10.ACTTTGCCGCCGCTGTTGTG
11.ACTTTGCCGCCGCTGTTGTG
12.ACTTTGCCGCCGCTGTTGTG
13.ACTTTGCCGCCGCTGTTGTG
14.ACTTTGCCGCCGCTGTTGTG
15.ACTTTGCCGCCGCTGTTGTG
16.ACTTTGCCGCCGCTGTTGTG
17.ACTTTGCCGCCGCTGTTGTG
18.ACTTTTGCCGCCGCTGTTGTG
19.GCTGCCGCTGTTG
20.ACACTTTGCCGCCGCTGTTGTG
21.ACTTTGTCGCCGCTGTTGTG
22.ACTTTGCCGCCGCTGTTGTG
23.CTTTCTTTCGCTGTTGTG
24.ACTTTGCCGCCGCTGTTGTG
25.ACTTTGCCGCCGCTGTTG
26.ACTTTGCCGCCGCTGTTGTG
27.GCTGCCGCCGCTGTTGTG
28.CGCTGCCGCCGCTGTTG
29.ACTTTGCCGCCGCCGTTGTG
30.ACTTTGCCGCTGTTGTG
对齐矫正后得到准确aT区域序列(5′→3′):
ATGATAACGTTAGTATCAATTTCAAC
对齐矫正后得到准确bT区域序列(5′→3′):
ACTTTGCCGCCGCTGTTGTG
两条短链DNA同时测序,测序结果准确性100%。
(6)根据(5)对齐矫正后得到准确aT和bT区域序列,确认位于aT区域(5′→3′)第13nt处SNV位点的碱基为G;bT区域(5′→3′)第11nt处SNV位点的碱基为C。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
序列表
<110> 中国海洋大学
<120> 一种短链 DNA 的纳米孔测序方法
<141> 2022-05-12
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 76
<212> DNA
<213> Artificial Sequence
<400> 1
cccgtgtact cgtccacttt acgggcaaag cccatttcgt gggtcaccac catcatggtc 60
atccacaagg ctgagt 76
<210> 2
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 2
ggtcatccac aaggctgagt cccgtgtact cgtccacttt 40
<210> 3
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 3
aaagtggacg agtacacggg actcagcctt gtggatgacc 40
<210> 4
<211> 64
<212> DNA
<213> Artificial Sequence
<400> 4
tatccttgat tgattcgctc tgcggccagc gttttaatcg ttacaatggg tgtattggtt 60
cggc 64
<210> 5
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 5
aatgggtgta ttggttcggc tatccttgat tgattcgctc tg 42
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 6
gccgaaccaa tacacccatt 20
<210> 7
<211> 68
<212> DNA
<213> Artificial Sequence
<400> 7
tttgagatag gtaggccctc gatgataacg ttagtatcaa tttcaacaca actttcagta 60
tgacccct 68
<210> 8
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 8
acaactttca gtatgacccc taaatttgag ataggtaggc cctcg 45
<210> 9
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 9
cgagggccta cctatctcaa aaaaaggggt catactgaaa gttgt 45
<210> 10
<211> 62
<212> DNA
<213> Artificial Sequence
<400> 10
aaatccacga caatcacgaa cactttgccg ccgctgttgt gtgtttgggt tggtattcat 60
cg 62
<210> 11
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 11
tgtttgggtt ggtattcatc gaaaaaatcc acgacaatca cgaac 45
<210> 12
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 12
gttcgtgatt gtcgtggatt taaacgatga ataccaaccc aaaca 45

Claims (9)

1.一种短链DNA的纳米孔测序方法,其特征在于,所述短链DNA包含待测区T,待测区T位于该短链的中间,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;
步骤一,以所述短链DNA为模板设计引物对,一条引物包含3′端序列和5′端序列,另一条引物包含3′端序列和5′端序列或者只包含3′端序列,至少有一条引物的5′端序列长度在20nt以上;上游引物的3′端序列同所设计的DNA的B区序列相同,5′端序列同C区序列部分相同或完全相同;下游引物的3′端序列同C序列区互补,5′端序列同B区序列部分互补或完全互补;
步骤二,以所述短链DNA为模板,采用常规的PCR条件,以步骤一设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链,待测区T的重复数至少为20次;
步骤三,将步骤二扩增的DNA长双链进行纳米孔测序;
步骤四,对步骤三的纳米孔原始测序数据进行分析,得出最终测序结果;
步骤五,根据步骤四的测序分析结果,比对分析,从而确定具体序列。
2.根据权利要求1所述的短链DNA 的纳米孔测序方法,其特征在于,所述短链DNA的待测区T的序列长度为1-1000bp。
3.根据权利要求2所述的短链DNA的纳米孔测序方法,其特征在于,所述短链DNA的待测区T的序列长度为10-500bp。
4.根据权利要求2所述的短链DNA的纳米孔测序方法,其特征在于,进行步骤二时,模板链的拷贝数为1000以上。
5.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤二待测区T的重复数为20-100次。
6.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤二中引物浓度为1-100nM。
7.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,该方法用于在一次纳米孔测序操作中,同时测序多个不同的短链DNA,所述多个不同的短链DNA均满足步骤一和骤二所限定的条件。
8.根据权利要求7所述的短链DNA的纳米孔测序方法,其特征在于,单个短链DNA的测序时间为1-10min;每增加一种待测序的短链DNA,测序时间相应累加,最长测定时间为24h。
9.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤一设计的引物对,其中一条引物的3′端序列的长度为18-25nt,5′端序列的长度为0-25nt。
CN202210517930.9A 2022-05-12 2022-05-12 一种短链dna的纳米孔测序方法 Pending CN114807331A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210517930.9A CN114807331A (zh) 2022-05-12 2022-05-12 一种短链dna的纳米孔测序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210517930.9A CN114807331A (zh) 2022-05-12 2022-05-12 一种短链dna的纳米孔测序方法

Publications (1)

Publication Number Publication Date
CN114807331A true CN114807331A (zh) 2022-07-29

Family

ID=82512804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210517930.9A Pending CN114807331A (zh) 2022-05-12 2022-05-12 一种短链dna的纳米孔测序方法

Country Status (1)

Country Link
CN (1) CN114807331A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101168774A (zh) * 2007-11-06 2008-04-30 东南大学 实现dna序列分析中增加测序阅读长度的测定方法
WO2017113655A1 (zh) * 2015-12-30 2017-07-06 深圳市华因康高通量生物技术研究院 引物组、锚定引物、试剂盒、文库构建及基因测序方法
US20170249421A1 (en) * 2014-09-12 2017-08-31 Illumina Cambridge Limited Detecting repeat expansions with short read sequencing data
CN107164366A (zh) * 2016-10-19 2017-09-15 中国海洋大学 一种具备双单链末端pcr产物的获得方法及其检测方法
CN108913736A (zh) * 2018-07-10 2018-11-30 中国海洋大学 单链寡核苷酸的制备方法
US20190127793A1 (en) * 2017-07-11 2019-05-02 Kabushiki Kaisha Toshiba Short-chain nucleic acid elongation primer set, assay kit, and short-chain nucleic acid elongation, amplification and detection methods
US20190169687A1 (en) * 2016-04-04 2019-06-06 Roche Sequencing Solutions, Inc. Nucleic acid sample preparation methods
CN112002376A (zh) * 2020-08-13 2020-11-27 中国海洋大学 一种dna分子记录和读取信息的方法
CN113366120A (zh) * 2018-12-07 2021-09-07 深圳华大生命科学研究院 纳米孔测序方法
US20210381034A1 (en) * 2020-06-03 2021-12-09 Xenohelix Co., Ltd Method of detecting rna
CN113862344A (zh) * 2021-09-09 2021-12-31 成都齐碳科技有限公司 基因融合的检测方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101168774A (zh) * 2007-11-06 2008-04-30 东南大学 实现dna序列分析中增加测序阅读长度的测定方法
US20170249421A1 (en) * 2014-09-12 2017-08-31 Illumina Cambridge Limited Detecting repeat expansions with short read sequencing data
WO2017113655A1 (zh) * 2015-12-30 2017-07-06 深圳市华因康高通量生物技术研究院 引物组、锚定引物、试剂盒、文库构建及基因测序方法
US20190169687A1 (en) * 2016-04-04 2019-06-06 Roche Sequencing Solutions, Inc. Nucleic acid sample preparation methods
CN107164366A (zh) * 2016-10-19 2017-09-15 中国海洋大学 一种具备双单链末端pcr产物的获得方法及其检测方法
US20190127793A1 (en) * 2017-07-11 2019-05-02 Kabushiki Kaisha Toshiba Short-chain nucleic acid elongation primer set, assay kit, and short-chain nucleic acid elongation, amplification and detection methods
CN108913736A (zh) * 2018-07-10 2018-11-30 中国海洋大学 单链寡核苷酸的制备方法
CN113366120A (zh) * 2018-12-07 2021-09-07 深圳华大生命科学研究院 纳米孔测序方法
US20210381034A1 (en) * 2020-06-03 2021-12-09 Xenohelix Co., Ltd Method of detecting rna
CN112002376A (zh) * 2020-08-13 2020-11-27 中国海洋大学 一种dna分子记录和读取信息的方法
CN113862344A (zh) * 2021-09-09 2021-12-31 成都齐碳科技有限公司 基因融合的检测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHENRU WANG ET, AL: "Roust Storage of Chinese Language in a pool of Small Single-Stranded DNA Rings and Its Facile Reading-OUT", BULLETIN OF CHEMICAL SOCIETY OF JAPAN, vol. 94, no. 1, 31 August 2020 (2020-08-31) *
王阳;贾蕾敏;董平;梁兴国;: "三核苷酸双链重复序列扩展合成特性及其机理", 生物化学与生物物理进展, no. 04, 15 April 2013 (2013-04-15) *

Similar Documents

Publication Publication Date Title
CN108300716B (zh) 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法
EP2821501B1 (en) Method and device for detecting microdeletion in chromosome sts area
CN112359093B (zh) 血液中游离miRNA文库制备和表达定量的方法及试剂盒
CN111808854B (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
CN112126986B (zh) 一种定量miRNA的测序文库制备和分析方法
CN111073961A (zh) 一种基因稀有突变的高通量检测方法
CN108148900A (zh) 基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用
CN103602735A (zh) 利用高通量测序精确测定线粒体dna高频和低频突变的方法
CN108138175A (zh) 用于分子条形码编码的试剂、试剂盒和方法
CN108165620B (zh) 标签及其制备方法和应用
CN109943654B (zh) 基于内参序列的细菌菌群组成与绝对含量检测的方法
CN110724731A (zh) 一种在多重pcr体系内加入内参定量核酸拷贝数的方法
CN108728515A (zh) 一种使用duplex方法检测ctDNA低频突变的文库构建和测序数据的分析方法
Chung et al. Tissue requirements and DNA quality control for clinical targeted next-generation sequencing of formalin-fixed, paraffin-embedded samples: a mini-review of practical issues
CN114807331A (zh) 一种短链dna的纳米孔测序方法
CN108753922A (zh) 一种构建转录组测序文库的方法及相应的接头序列和试剂盒
EP3421608B1 (en) Chromosome number quantification method
CN109825558A (zh) 一种基于引物激活的碱基突变序列扩增检测方法
CN111763668B (zh) 测序引物组及基于pcr的全基因组测序方法
CN114277114A (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN108642190B (zh) 基于14个常染色体snp遗传标记的法医学复合检测试剂盒
CN113186262B (zh) 用于mgi平台高通量测序文库快速定量的方法及试剂盒
CN116042770B (zh) 尿液中miRNA文库制备和表达定量的方法及试剂盒
CN117166064A (zh) 构建目标文库的方法、引物组和试剂盒
WO2023092601A1 (zh) Umi分子标签及其应用、接头、接头连接试剂及试剂盒和文库构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination