CN114807331A - 一种短链dna的纳米孔测序方法 - Google Patents
一种短链dna的纳米孔测序方法 Download PDFInfo
- Publication number
- CN114807331A CN114807331A CN202210517930.9A CN202210517930A CN114807331A CN 114807331 A CN114807331 A CN 114807331A CN 202210517930 A CN202210517930 A CN 202210517930A CN 114807331 A CN114807331 A CN 114807331A
- Authority
- CN
- China
- Prior art keywords
- short
- region
- sequence
- sequencing
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007672 fourth generation sequencing Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012163 sequencing technique Methods 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000012408 PCR amplification Methods 0.000 claims abstract description 8
- 239000012634 fragment Substances 0.000 claims abstract description 7
- 108020004414 DNA Proteins 0.000 claims description 97
- 230000000295 complement effect Effects 0.000 claims description 11
- 238000011144 upstream manufacturing Methods 0.000 claims description 8
- 238000001712 DNA sequencing Methods 0.000 abstract description 2
- 108091081021 Sense strand Proteins 0.000 description 15
- 238000012545 processing Methods 0.000 description 8
- 230000003252 repetitive effect Effects 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000004544 DNA amplification Effects 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- JGBUYEVOKHLFID-UHFFFAOYSA-N gelred Chemical compound [I-].[I-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 JGBUYEVOKHLFID-UHFFFAOYSA-N 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000012192 staining solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Abstract
本发明涉及DNA测序技术领域。针对短链DNA难以进行纳米孔测序的问题,本发明提供一种短链DNA的纳米孔测序方法:待测的短链DNA,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;以短链DNA为模板设计引物对;以短链DNA为模板,以设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链;将扩增的DNA长双链进行纳米孔测序、分析结果,确定具体序列。本发明仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定,只需分析一个足够长的Read即可完成对短链DNA的测序,在一次纳米孔测序操作中,可用于同时测多个序列组成的基因组。
Description
技术领域
本发明涉及DNA测序技术领域,具体涉及一种短链DNA的纳米孔测序方法。
背景技术
纳米孔测序技术是一种单分子测序技术,具有序列读长长,仪器体积小,测序效率高等优点,但不适合测定短链DNA(<300bp)的序列,大大限制了其在检测单核苷酸变异(SNV)等方面的应用。另外,纳米孔测序获得的原始数据中通常含有5-8%的插入、缺失、误读等错误,故需要成千上万的Reads以上通过进行复杂的比对和计算才能获得正确的序列,工作量巨大。并且纳米孔测序的数据一般大于1G,对于仅含几十至几百个碱基对的序列的测定效率较低,且成本高昂。
Brandon D.Wilson等开发了一种可以用纳米孔测序分析短链的单链DNA的方法,通过连接和滚环扩增的方式把短链DNA扩增成长链重复序列,实现了短链DNA的扩增(文献Analytical Chemistry,2019,91,6783-6789),但这种方法只适合单链DNA的SNV的测定。而通过PCR等技术获得的短的双链DNA不宜用此方法直接扩增。另外,当成千上万条短链序列混合时,即使要从中分析出一条正确的序列时,也需要处理所有或大部分数据。
开发能够单独分析一个Read(单Read)数据即能准确得出待测序列的方法将大大降低数据的处理量和机时。因此,要实现基于PCR产物等短链双链DNA以及其他方法获得的单链DNA的SNV的测定,做到简便易行,需要对DNA扩增方法进行本质上的改进或革新。发明内容
应用现有纳米孔测序技术对短链DNA序列进行测序时,需要复杂的扩增方法对短链DNA进行扩增,并且不能对短双链DNA直接测序,后续数据处理量大,针对上述问题,本发明提供了一种短链DNA的纳米孔测序方法。本方法直接进行PCR扩增并获取重复序列,然后用纳米孔测序仪直接测定扩增产物的序列。采用本方法设计的引物,可在PCR扩增中将短链DNA扩增成几十甚至几百倍长的DNA重复序列。纳米孔测序后,可达到只分析单个Read的数据就可以准确得到该重复序列所含待测DNA的序列。本方法即可用于未知序列的准确测序,又可用于准确鉴定SNV位点。
本发明采用的技术方案如下:
一种短链DNA的纳米孔测序方法,所述短链DNA包含待测区T,待测区T位于该短链的中间,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;
步骤一,以待测短链DNA为模板设计引物对,一条引物包含3′端序列和5′端序列,另一条引物包含3′端序列和5′端序列或者只包含3′端序列,上下游引物中至少有一条引物的5′端序列长度在20nt以上;上游引物的3′端序列同所设计的DNA的B区序列相同,5′端序列同C区序列部分相同或完全相同;下游引物的3′端序列同C序列区互补,5′端序列同B区序列部分互补或完全互补;
步骤二,以待测短链DNA为模板,采用常规的PCR条件,以步骤一设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链,待测区T的重复数至少为20次;
步骤三,将步骤二扩增的DNA长双链进行纳米孔测序;
步骤四,对步骤三的纳米孔原始测序数据进行分析,得出最终测序结果;
步骤五,根据步骤四的测序分析结果,比对分析,从而确定具体序列。
进一步地,所述短链DNA的待测区T的序列长度为1-1000bp,优选10-500bp,更优选20-200bp。
进一步地,所述步骤一设计的引物对,其中一条引物的3′端序列的长度为18-25nt,5′端序列的长度为0-25nt。
进一步地,所述步骤二待测区T的重复数为20-100次,优选20-80次,再优选30-50次。
进一步地,所述步骤二中引物浓度为1-100nM,优选2-80nM,再优选5-20nM。
该方法可用于在一次纳米孔测序操作中,同时测序多个不同的短链DNA,所述多个不同的短链DNA均满足步骤一和步骤二所限定的条件。
单个短链DNA的测序时间为1-10min;每增加一种待测序的短链DNA,测序时间相应累加,最长测定时间为24h。
在本发明中,当待测短链DNA的拷贝数小于1000时,先对短链DNA进行第一轮PCR扩增至拷贝数为1000以上的双链短链DNA。待测序的短链DNA为拷贝数为1000以上时,按照步骤二直接进行第二轮的PCR扩增、测序并分析结果。优选拷贝数为1000-3000。
与现有技术相比,本专利有具有以下有益效果:
本发明可实现T区为1-1000bp的短链DNA的纳米孔测序,且仅需选取少量的测序结果进行比对即可实现对待测序列的准确测定,并分析出待测序列的准确序列信息,极大降低了测序数据的处理难度,一般的笔记本电脑就可以做到。本发明只需分析一个足够长的Read即可得到短链DNA的精确测序,并获得SNV分析结果。本发明可用于基因组的测序,在一次纳米孔测序操作中,同时测多个不同短链DNA序列组成的基因组,大大降低测序成本。
附图说明
图1为实施例第一轮PCR产物及模板区域分布示意图;
图2为实施例第二轮PCR引物序列设计示意图;
图3为实施例第二轮PCR扩增原理示意图;
图4为实施例纳米孔测序原始数据处理示意图;
图5为本发明短链DNA纳米孔测序流程图。
具体实施方式
下面结合具体实施例及附图对本发明做进一步详细说明。
以下实施例所用材料如下:
DNA序列由生工生物工程股份有限公司合成;2×Taq PCR StarMix with LoadingDye购自北京康润诚业生物科技有限公司(GenStar);SQK-LSK109 MinION sequencingmachine(ONT)购自牛津纳米孔公司(Oxford Nanopore Technologies);核酸染液(UltraGelRed)购自诺唯赞(南京)生物科技有限公司;其他化学用品购自美国西格玛奥德里奇(Sigma-Aldrich)。
以下实施例是为了证明本发明的方法具有优越性。其中,引物设计根据本发明所述要求确定,此处不再赘述。
以下每一个实施例都是一个独立的检测短链DNA的实例,每个实施例中至少检测一段短链DNA或一段含有SNV的短链DNA。当待测短链DNA多于一段时,需针对每段单独设计与之对应的引物对,并根据本发明所述要求增加相应的测序时间。
实施例1
(1)待测短链DNA及引物对设计
如图1所示,待测短链DNA包括待测区T区及分别位于T区两端的B区和C区,B区和C区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):CCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGT(SEQ ID NO:1);
其中,B区序列信息(5′→3′):CCCGTGTACTCGTCCACTTT(长度20nt);
T区序列信息(5′→3′):ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT(长度36nt);
C区序列信息(5′→3′):GGTCATCCACAAGGCTGAGT(长度20nt);
上游引物Pcb:如图2所示,3′端序列(双下划线)同待测DNA的正义链的B区序列相同,5′端序列(单下划线)同正义链的C区序列相同;
下游引物Pc′b′:如图2所示,3′端序列(双下划线)同待测DNA正义链的C区互补,5′端序列(单下划线)同正义链的B区完全互补;
(2)利用上一步设计的引物对扩增待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物)
PCR反应体系:拷贝数大于1000的待测短链DNA,1×Taq PCR StarMix withLoading Dye,上/下游引物Pcb/Pc′b′100nM;
1×Taq PCR StarMix组成:优化浓度的GenStar高浓度Taq DNA Polymerase,dNTPs,Mg2+,反应缓冲液和稳定剂等。
表1 PCR程序设置
随着扩增循环数的增加,含T区的目标产物浓度升高,会造成如图3的原理图所示的错开延伸长,进而形成待测区T的多重重复长序列。
(3)使用SQK-LSK109 MinION测序仪(ONT)对(2)中扩增得到的多重重复长序列进行测序。测序样品的预处理和正式测序步骤均需遵照ONT的说明书进行,控制测序时长为5-10min。
(4)对(3)的纳米孔原始测序数据进行分析:选取部分纳米孔测序结果(Reads)进行分析,选择原则为:Read的长度应>2000nt(即待测区序列至少重复20次)。
以下为选取的结果中一个Read的结果:
@c108b7b5-ef5e-478e-ba81-45c96a5cb70d runid=7de17488fb97253d45767dd9f6c2c06058334e16read=759ch=134start_time=2022-01-25T05:05:09Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
CAATTGTACCGTTCAGTTACGTATTGCTGTCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCATTGTACTCGTCACTTTACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGAGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCATTAACTTTACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTGCTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCATCATGGTCATCCACAAGGATGAGTCCCGTACTCGTCCACTTTACGGGCAAACCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGATGTACTCGTCCACTTTACGGGCGAAGCCCATTTCGTGAGTCACCACCATCATGGTCTTCCACAAGGCTGGTCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGGGTTGTGCTCGTCACTTGCAGGCAGCCATTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGCTGCTCGTCCACTTTACAGGTAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAATTTCCGTTCCCATGTGCTCGTCCACTTTACGGGCAAGCCCATTTCGTGGGTCACCACCATCTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACAGGCAAAGCCTATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGGAAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCTCGTGTACTCGTCCACTTTACGGGCAAAGCCCGTAAAGGTGGACAATACAGCTGATATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTATACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGTAAGGCCGAGCCATTCATTGATCCTTACCATCATGGTCTAATCCACAAGGCTGAGTCCGTGTACCCGTCCACTTTACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCATGGGCATCCACAAGGCTGAGTCCCCCGTGTACTCGTCCACTTTGCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTTGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATCTCGTGGTCGCCACCATCATGGTCATCCACAAGGCTGGAGTCCCGTGTACTCGTCCACTTTGCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCACAGGCGCTGAAGTCCCGTGTACTCATCCACTTTGCAGGCAAAGCCCATTTCGTAGGTCACCACCATCATGGTCATCCACAAGGCCCAGGTCCCGTGTACTCACCGTCACACTTTACAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCATGGTCATCCACAAGGCTGAGTCCAGGTCATCCACAGGCCAGGTCCCGTGTACTCGTCCACTTTACAGGCAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTGGGCAAAGCCCATTTCGTGGAGTCACCACCATGTAGTCATCCTGAGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGAGTCATCCACGAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCATGGTCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGGCAAAGCCCATTTCGTGGGTCACCACCATCATGGTATCCCGACAAGGCTGGAGAGTCCCGTGTACTCGTCCAGCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCATGGCCATCCACAAGGCTGAGTCCCGTGTACTCGTCCGCTTTACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCATGATCATCCACAGGCTGAGTCCCGTGTACTCGTCCACTTTACGGCAAAGCCCATTTCGTGGGTCACCACCATCATGATCATCCACAAGGCTGAGTCCCGTGTACTCGTCCACTTT
(5)根据(4)的测序分析结果,比对分析给出具体的单核苷酸变异位点。不同于传统的将所有序列按序列相似性排列后,再分析每个位置该是哪个碱基(按出现概率最大的碱基确定),而是只分析足够长的Read的测序结果即可确定单核苷酸变异位点。Read的长度要求待测区序列至少重复20次,优选重复30-100次。比对(4)中的单个Read的原始数据,并按重复单元处理待测区T的结果如下:
1.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
2.ACGGGCAAAGCCCATTTCGTGATTCTTGCCATCGCGGA
3.GGGCAAAAGCCCATTTCGTGGAGTCACCACCATCAT
4.ACAGGCAAAGCCCATTTCGTGAGTCACCCACCATCAT
5.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
6.ACGGGCAAAGCCCATTTCGTGGGTCACCATCAT
7.ACGGGCAAACCCATTTCGTGAGTCACCACCATCAT
8.ACGGGCGAAGCCCATTTCGTGAGTCACCACCATCAT
9.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
10.ACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT
11.GCAGGCAGCCATTCGTGAGTCACCACCATCAT
12.ACAGGTAAAGCCCATTTCGTAGGTCACCACCATCAT
13.ACGGGCAAGCCCATTTCGTGGGTCACCACCATCT
14.AGGCAAAGCCTATTTCGTGGGTCACCACCATCAT
15.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
16.ACGGGCAAAGCCCGTAAAGGTGGACAATACAGCT
17.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
18.GTAAGGCCGAGCCATTCATTGATCCTTACCATCAT
19.ACAGGCAAAGCCCATTTCGTGGAGTCACCACCATCAT
20.ACGGGCAAAGCCCACATTTCGTGAGTCACCACCATCAT
21.GCAGGCAAAGCCCATTTCGTGAGTCCACCATCCTT
22.ACGGGCAAAGCCCATCTCGTGGTCGCCACCATCAT
23.GCAGGCCAAAGCCCATTTCGTGAGTCACCACCATCAT
24.GCAGGCAAAGCCCATTTCGTAGGTCACCACCATCAT
25.CAGGCAAGAGAGAAAGCCCATTTCGTGGAGTCACCATCATCAT
26.ACAGGCAAGCCCATTTCGTGAGTCACCACCATCAT
27.GGGCAAAGCCCATTTCGTGGAGTCACCACCATGT
28.ACGGGCAAAGCCCATTTCATTGAGTCACCACCATCATGA
29.ACGGAGCCAAAGCCCATTTCGTGAGTCACCACCATCAT
30.ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
31.GCACGGGCAAAGCCCATTTCGTGAGTCACCACCATCAT
32.ACGGGCAAAGCCCGTTTCCGTGGAGTTACCACCATCAT
33.ACGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
对齐矫正后得到准确T区域序列(5′→3′):
ACGGGCAAAGCCCATTTCGTGGGTCACCACCATCAT
测序结果准确性100%。
实施例2
(1)待测短链DNA及引物对设计
待测短链DNA包括待测区T区及分别位于T区两端的B区和C区,B区和C区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):TATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGC(SEQ ID NO:4);
其中,B区序列信息(5′→3′):TATCCTTGATTGATTCGCTCTG(长度22nt);
T区序列信息(5′→3′):CGGCCAGCGTTTTAATCGTTAC(长度22nt);
C区序列信息(5′→3′):AATGGGTGTATTGGTTCGGC(长度20nt);
上游引物Pcb:3′端序列(双下划线)同待测DNA的正义链的B区序列相同,5′端序列(单下划线)同正义链的C区序列相同;
下游引物Pc′b′:3′端序列(单下划线)同待测DNA正义链的C区互补,5′端序列为0nt(即不设置5′端部分);
Pc′b′序列信息(5′→3′):GCCGAACCAATACACCCATT(SEQ ID NO:6,长度20nt);
(2)利用上一步设计的引物对扩增待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物),PCR反应步骤同实施例1一致。
(3)纳米孔测序:步骤同实施例1一致,控制测序时长为5-10min。
(4)对(3)的纳米孔原始测序数据进行分析:
以下为选取的结果中一个Read的结果:
@b8cf39d8-717c-44de-9a16-2c325efbd276 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=261ch=312start_time=2022-01-25T05:02:56Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
AAAAAAAAAAACTGTTGTACTTCGTTCAGTTACGTATTGCTGATTCGCTCTGCAAAATGCCCATGATTTTTCAATGGGTGTATTGGTTCCGGCAAATATCCTTGATTGATTCGTTTCTTAAGCCAGCGTTTAATCGTTACAATGGGTGTATTGGTTCGGCGAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAGTATCGTGATTGATTTGCTCTGCGGCCAGCGTTTTAATCTGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGATAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAGTAGATTGTATTGGTTCGGCAATTATCTTGATTGATTCGCTCTGCGACCAGCGTTTTAATCGTTACAATGGGTGTATTGAGTTAAACAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCAATTTACAATGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAACATCCTTGATTGATTTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCTTGATTGATTCTAGCTCTGCGGCCAGCGTTTTAATCGTAACAATGGATGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCCTTGTGGGTGTATTGGTTCGGCTTTTATCCTTGATTAATTCGCTCTGTGGCCAGCGTTTAATCGTTACAATGGAGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGAGTGTATTGGTTCGGCTCTTATCCTTGATTGATTCTCTGGGGCGCTGGTTGGCAATGGTGTATTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTTGGTTCGGCAATTATCCTTGATTGATTCGCTCTGCGTCAGCGTTTTAATCGTTACAATGGGTGTATTGGCTCGGCAAATACCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCAGCAAATATCCTCGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTACGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTATTGGTTCAGCAAACATCCTTGATTGATTCGCTCAGCGGCCAGCGTTTTAATCGTTACAATGCGTGTATTGGTTCAGCAAATATCCTTGATTAATTCGCTCTGCAGCCAGCGTTTTAATCATTACAATGGGTGTATTGGTTCGGCAAATCCTTGATTGATCCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCTTGATTGATTCGCTCTGATTTAGGATGCGCAAAAAACAATGGGTGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTTATCCTTAATTGATTCGCTCTGCGGCCAGCGTTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAAATATCCTTGATTGATTCGCTCTGGGGCGCTGGTTGGCAATGGGTGTAATGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTTGCTAATGGGTGTATTGGTTCGGCAAATATGTGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGCGTATTGGTTCGGCTTTTATCCTTGATTGATTCGCGCTGCGTGGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCGTCCAGCCATTTGCTAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGCTCTGCAGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCAAATATCCTCGATTGATTCGCTCTGCGGCCAGCGTTTTAATCGTTACAATGGGTGTATTGGTTCGGCTTGGGTGTATTGGTTCGGCAAATATCCTTGATTGATTCGC
(5)根据(4)的测序分析结果,比对(4)中的单个Read的原始数据,并按重复单元处理待测区T的结果如下:
1.TAAGCCAGCGTTTAATCGTTAC
2.CGGCCAGCGTTTTAATCGTTAC
3.CGGCCAGCGTTTTAATCTGTTAC
4.TCTGCGGCCAGCGTTTTAATCGTTAC
5.CGACCAGCGTTTTAATCGTTAC
6.CGGCCAGCGTTTTAATCAATTTAC
7.CGGCCAGCGTTTTAATCGTTAC
8.TCTGCAGCCAGCGTTTTAATCGTTAC
9.CGGCCAGCGTTTTAATCGTAAC
10.GGGCGCTGGTTGGCCTT
11.TGGCCAGCGTTTAATCGTTAC
12.CGGCCAGCGTTTTAATCGTTAC
13.GCGCTGGTTGGC
14.CGTCCAGCCATTTTGCT
15.CGTCAGCGTTTTAATCGTTAC
16.CGGCCAGCGTTTTAATCGTTAC
17.CGTCCAGCCATTTTGCT
18.CGTCCAGCCATTTGCT
19.GGGCGCTGGTTGGC
20.CGGCCAGCGTTTTAATCGTTAC
21.CAGCCAGCGTTTTAATCATTAC
22.CGGCCAGCGTTTTAATCGTTACA
23.ATTTAGGATGCGCAAAAAAC
24.CGGCCAGCGTTTTAATCGTTAC
25.CGGCCAGCGTTTTTAATCGTTAC
26.CGTCCAGCCATTTGCT
27.GGGCGCTGGTTGGC
28.CGTCCAGCCATTTTGCT
29.CGGCCAGCGTTTTAATCGTTAC
30.TGGCGTTTTAATCGTTAC
31.CGTCCAGCCATTTGCT
32.GGCCAGCGTTTTAATCGTTAC
33.CAGCCAGCGTTTTAATCGTTAC
对齐矫正后得到准确T区域序列(5′→3′):
CGGCCAGCGTTTTAATCGTTAC
测序结果准确性100%。
实施例3
(1)分别包含单个SNV位点的两段待测短链DNA及其对应的引物对设计
待测短链DNA-a包括含一个SNV位点(G)的待测区aT区、分别位于aT区两端的aB区和aC区,aB区和aC区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):TTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCT(SEQ ID NO:7);
其中,aB区序列信息(5′→3′):TTTGAGATAGGTAGGCCCTCG(长度21nt);
aT区序列信息(5′→3′):ATGATAACGTTAGTATCAATTTCAAC(长度26nt)其中,SNV位点碱基为T区域(5′→3′)第13nt处G;
aC区序列信息(5′→3′):ACAACTTTCAGTATGACCCCT(长度21nt);
上游引物aPcb:3′端序列(双下划线)同待测DNA-a的正义链的aB区序列相同,5′端序列(单下划线)同正义链的aC区序列相同,两部分中间含有一段短序列“AAA”;
下游引物aPc′b′:3′端序列(双下划线)同待测DNA-a正义链的aC区互补,5′端序列(单下划线)同正义链的aB区部分完全互补,两部分中间含有一段短序列“AAA”;
待测短链DNA-b包括含一个SNV位点(C)的待测区aT区、分别位于aT区两端的aB区和aC区,aB区和aC区为互不包含的DNA片段;
待测短链DNA的序列信息(5′→3′):AAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCG(SEQ ID NO:10);
其中,bB区序列信息(5′→3′):AAATCCACGACAATCACGAAC(长度21nt);
bT区序列信息(5′→3′):ACTTTGCCGCCGCTGTTGTG(长度20nt)其中,SNV位点碱基为T区域(5′→3′)第11nt处C;
bC区序列信息(5′→3′):TGTTTGGGTTGGTATTCATCG(长度21nt);
上游引物bPcb:如图2所示,3′端序列(双下划线)同待测DNA-b的正义链的bB区序列相同,5′端序列(单下划线)同正义链的bC区序列相同,两部分中间含有一段短序列“AAA”;
下游引物bPc′b′:3′端序列(双下划线)同待测DNA-b正义链的bC区互补,5′端序列(单下划线)同正义链的bB区完全互补,两部分中间含有一段短序列“AAA”;
(2)利用上一步设计的两对引物对扩增两段待测短链DNA,形成含待测区T的多重重复序列(DNA长链产物),PCR反应步骤同实施例1一致。
(3)纳米孔测序:步骤同实施例1一致,控制测序时长为10-20min。
(4)对(3)的纳米孔原始测序数据进行分析:
以下为选取的结果中含有一段待测DNA-a一个Read的结果:
@4949c9ca-e8b5-47ed-af0f-d4f5b734ec55 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=160ch=139start_time=2022-01-25T05:02:57Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
ACAACTTTCAGTATGACTCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCCAGCACAACAGTATGACCTTTTTGAGATAGGTGGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACCGAAATTATGACCCCTAAATTTGAGATAGGTGACCCTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGTTTGGAATGAGTAGGCCCTCGATGATAACGTTATTATAATTTCAACACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATAACGTTAGTATCAATTTCAACACAACTTTCAATTATGACCCTAAATTTGAATGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTTAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCGTTTTTAAGATGGTGAGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCTAGACCACAACATTCAGTATGACCTAAATTTGAGATAGGTGACCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCCGTATGACCCCTTTTTTTGAGATGATGACCCTCATTGATAACGTTAGTATCAATTTCAACTACAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCACAACTTTCAGTATGACCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAATTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACACTGTCGACCCCTTTTTTGAGATAGGTAGGGCCTAGATGATAACGTTAGTATCAATTTCAACGCTTTTCGAGTATGACCCTAAATTTGGGAATTGGTAGGCCCCCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGATCCCTAGAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAACTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATGGTAGGCCCTCGACGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCTCTCGATGATAACGTTAGTAGCCAATTTCAACACAACTTTCAGTATGACTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACATAACTTTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACTCAGTATGACCCCTAAATTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTCGATGATAACGTTAGTATCAATTTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATTGGTAGGCCCTAGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGGCCTCGATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGAGATAGGTAGGCCCTAGGTAGTAACATTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTGGGAATGAGGTAGGCCCTCGATGATAGCATTAGTATCAATTCAACACAACTTTCAGTATGACCCTTTTTAAATTCATTAAGGCCTCAACCACTTTATTATGACCCTAAATTTGAGATAAGTAGGCCCTCGTAATGCGGTAGTATCAATTTCCAACACAACTTTCAGTACCAGCCCCCTTTTTTATGATAACGTTAGTATCAATTTCAACACAACTTTCAGTATGACCCCTTTTTTTGAGATAGGTAGGCCTTCGTTAACGTTGGTATCAATTTCAACACAACTTCAGTATGACCCCTTTTTTTGAGATAGGTGAACCTCAGTACGATAACATTCAGTGTCA
以下为选取的结果中含有一段待测DNA-b一个Read的结果:@2d0dc2a9-734c-46d3-9e0f-23e025c8d4d2 runid=7de17488fb97253d45767dd9f6c2c06058334e16read=592ch=171 start_time=2022-01-25T05:04:15Z flow_cell_id=FAR31323protocol_group_id=20220125-liang sample_id=sample1
CGATGTACTTCGTTCAGTTACGTATTCTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACGATCACGTACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGACCACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCAGAAAAATCCGACAATCACGAACGGTATTCATCGTTTTAAATCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGCGATAATTCATCGATTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGCTTAAATCACGATAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAAAAATTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTTGGTATTCATCGTTCGGCCCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTATTTGGGTTGGTATTCATCGAAAAATCCGGCAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGATTGGTATTCATCGCTTAAATCCACGACAATCACGAACACTTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGAAGAAATCCACGACAATCACGAACGCTGCCGCTGTTGTGTGTTGGGTTGGTATTCATCGAAAAAAATCGACATTCCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGTGGTATCATCGAAAAAATCCCGACAATCACGAACACTTTGTCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCCGTTTAAATCGACAATCACGACTTTCTTTCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATCCATCGAAAAAATCCACGACAATCACGAACACTTTGCCGCCGCTGTTGTATTTGGGTTGGTATTCATCGCCGTCTCGACAATCACGAACACTTTGCCGCCGCTGTTGTGTGTTTGATTTAGTATTCATCATTGCCAATCCACGACAATCACGAACGCTGCCGCCGCTGTTGTGTGTTTGGGTTGGTATTCATCGTTTAAATCGACAATCACGAACCGCTGCCGCCGCTGTTGTGTTTGGGTTGGTATTCATCGAAAAAAATCCACGACAATCGCGAACACTTTGCCGCCGCCGTTGTGTGTTTGGGTTGGTGTTCATCGAGAAAATCCACGACAATCACGAACACTTTGCCGCTGTTGTGTGTTTTGGGTTGGTATTCATCGTTTAAATCCACGACAATCACGAACCGACGATCAACCTCTATCGCCGCTCACGTCTGAAGAAC
(5)根据(4)的测序分析结果,比对(4)中的单个Read的原始数据,并按重复单元处理待测区aT的结果如下:
1.ATGATAACGTTAGTATCAATTTCAAC
2.ATGATAACGTTAGTATCAATTTCCAGC
3.ATGATAACGTTAGTATCAATTTCAAC
4.ATGATAACGTTAGTATCAATTTCAAC
5.ATGATAACGTTAGTATCAATTTCAAC
6.ATGATAACGTTATTATAATTTCAAC
7.ATAACGTTAGTATCAATTTCAAC
8.ATGATAACGTTAGTATCAATTTCAAC
9.ATGATAACGTTAGTATCAATTTCAAC
10.ATGATAACGTTAGTATCAATTTCAAC
11.ATGATAACGTTAGTATCAATTTCAAC
12.TTGATAACGTTAGTATCAATTTCAACT
13.ATGATAACGTTAATTATCAATTTCAACAT
14.ATGATAACGTTAGTATCAATTTCAAC
15.ATGATAACGTTAGTATCAATTTCAAC
16.ATGATAACGTTAGTATCAATTTCAAC
17.ATGATAACGTTAGTATCAACTTCAAC
18.ATGATAACGTTAGTATCAATTTCAAC
19.ATGATAACGTTAGTAGCCAATTTCAAC
20.ATGATAACGTTAGTATCAATTTCAAC
21.ATGATAACGTTAGTATCAATTTCAAC
22.ATGATAACGTTAGTATCAATTTCAAC
23.ATGATAACGTTAGTATCAATTTTCAAC
24.ATGATAACGTTAGTATCAATTTCAAC
25.ATGATAACGTTAGTATCAATTTCAAC
26.GTAGTAACATTAGTATCAATTTCAAC
27.ATGATAGCATTAGTATCAATTCAAC
28.TAATGCGGTAGTATCAATTTCCAAC
29.ATGATAACGTTAGTATCAATTTCAAC
30.TTAACGTTGGTATCAATTTCAAC
按重复单元处理待测区bT的结果如下:
1.ACTTTGCCGCCGCTGTTGTG
2.ACTTTGCCGCCGCTGTTGTG
3.ACTTTGCCGCCGCTGTTGTG
4.ACTTTGCCGCCGCTGTTGTG
5.ACTTTGCCGCCGCTGTTGTG
6.ACTTTGCCGCCGCTGTTGTG
7.ACTTTGCCGCCGCTGTTGTG
8.ACTTTGCCGCCGCTGTTGTG
9.ACTTTGCCGCCGCTGTTGTG
10.ACTTTGCCGCCGCTGTTGTG
11.ACTTTGCCGCCGCTGTTGTG
12.ACTTTGCCGCCGCTGTTGTG
13.ACTTTGCCGCCGCTGTTGTG
14.ACTTTGCCGCCGCTGTTGTG
15.ACTTTGCCGCCGCTGTTGTG
16.ACTTTGCCGCCGCTGTTGTG
17.ACTTTGCCGCCGCTGTTGTG
18.ACTTTTGCCGCCGCTGTTGTG
19.GCTGCCGCTGTTG
20.ACACTTTGCCGCCGCTGTTGTG
21.ACTTTGTCGCCGCTGTTGTG
22.ACTTTGCCGCCGCTGTTGTG
23.CTTTCTTTCGCTGTTGTG
24.ACTTTGCCGCCGCTGTTGTG
25.ACTTTGCCGCCGCTGTTG
26.ACTTTGCCGCCGCTGTTGTG
27.GCTGCCGCCGCTGTTGTG
28.CGCTGCCGCCGCTGTTG
29.ACTTTGCCGCCGCCGTTGTG
30.ACTTTGCCGCTGTTGTG
对齐矫正后得到准确aT区域序列(5′→3′):
ATGATAACGTTAGTATCAATTTCAAC
对齐矫正后得到准确bT区域序列(5′→3′):
ACTTTGCCGCCGCTGTTGTG
两条短链DNA同时测序,测序结果准确性100%。
(6)根据(5)对齐矫正后得到准确aT和bT区域序列,确认位于aT区域(5′→3′)第13nt处SNV位点的碱基为G;bT区域(5′→3′)第11nt处SNV位点的碱基为C。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
序列表
<110> 中国海洋大学
<120> 一种短链 DNA 的纳米孔测序方法
<141> 2022-05-12
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 76
<212> DNA
<213> Artificial Sequence
<400> 1
cccgtgtact cgtccacttt acgggcaaag cccatttcgt gggtcaccac catcatggtc 60
atccacaagg ctgagt 76
<210> 2
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 2
ggtcatccac aaggctgagt cccgtgtact cgtccacttt 40
<210> 3
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 3
aaagtggacg agtacacggg actcagcctt gtggatgacc 40
<210> 4
<211> 64
<212> DNA
<213> Artificial Sequence
<400> 4
tatccttgat tgattcgctc tgcggccagc gttttaatcg ttacaatggg tgtattggtt 60
cggc 64
<210> 5
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 5
aatgggtgta ttggttcggc tatccttgat tgattcgctc tg 42
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 6
gccgaaccaa tacacccatt 20
<210> 7
<211> 68
<212> DNA
<213> Artificial Sequence
<400> 7
tttgagatag gtaggccctc gatgataacg ttagtatcaa tttcaacaca actttcagta 60
tgacccct 68
<210> 8
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 8
acaactttca gtatgacccc taaatttgag ataggtaggc cctcg 45
<210> 9
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 9
cgagggccta cctatctcaa aaaaaggggt catactgaaa gttgt 45
<210> 10
<211> 62
<212> DNA
<213> Artificial Sequence
<400> 10
aaatccacga caatcacgaa cactttgccg ccgctgttgt gtgtttgggt tggtattcat 60
cg 62
<210> 11
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 11
tgtttgggtt ggtattcatc gaaaaaatcc acgacaatca cgaac 45
<210> 12
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 12
gttcgtgatt gtcgtggatt taaacgatga ataccaaccc aaaca 45
Claims (9)
1.一种短链DNA的纳米孔测序方法,其特征在于,所述短链DNA包含待测区T,待测区T位于该短链的中间,待测区T的两侧分别为B区和C区,B区和C区为互不包含的DNA片段;
步骤一,以所述短链DNA为模板设计引物对,一条引物包含3′端序列和5′端序列,另一条引物包含3′端序列和5′端序列或者只包含3′端序列,至少有一条引物的5′端序列长度在20nt以上;上游引物的3′端序列同所设计的DNA的B区序列相同,5′端序列同C区序列部分相同或完全相同;下游引物的3′端序列同C序列区互补,5′端序列同B区序列部分互补或完全互补;
步骤二,以所述短链DNA为模板,采用常规的PCR条件,以步骤一设计的引物对进行PCR扩增,得到重复含待测区T的DNA长双链,待测区T的重复数至少为20次;
步骤三,将步骤二扩增的DNA长双链进行纳米孔测序;
步骤四,对步骤三的纳米孔原始测序数据进行分析,得出最终测序结果;
步骤五,根据步骤四的测序分析结果,比对分析,从而确定具体序列。
2.根据权利要求1所述的短链DNA 的纳米孔测序方法,其特征在于,所述短链DNA的待测区T的序列长度为1-1000bp。
3.根据权利要求2所述的短链DNA的纳米孔测序方法,其特征在于,所述短链DNA的待测区T的序列长度为10-500bp。
4.根据权利要求2所述的短链DNA的纳米孔测序方法,其特征在于,进行步骤二时,模板链的拷贝数为1000以上。
5.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤二待测区T的重复数为20-100次。
6.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤二中引物浓度为1-100nM。
7.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,该方法用于在一次纳米孔测序操作中,同时测序多个不同的短链DNA,所述多个不同的短链DNA均满足步骤一和骤二所限定的条件。
8.根据权利要求7所述的短链DNA的纳米孔测序方法,其特征在于,单个短链DNA的测序时间为1-10min;每增加一种待测序的短链DNA,测序时间相应累加,最长测定时间为24h。
9.根据权利要求1所述的短链DNA的纳米孔测序方法,其特征在于,所述步骤一设计的引物对,其中一条引物的3′端序列的长度为18-25nt,5′端序列的长度为0-25nt。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210517930.9A CN114807331A (zh) | 2022-05-12 | 2022-05-12 | 一种短链dna的纳米孔测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210517930.9A CN114807331A (zh) | 2022-05-12 | 2022-05-12 | 一种短链dna的纳米孔测序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114807331A true CN114807331A (zh) | 2022-07-29 |
Family
ID=82512804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210517930.9A Pending CN114807331A (zh) | 2022-05-12 | 2022-05-12 | 一种短链dna的纳米孔测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114807331A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101168774A (zh) * | 2007-11-06 | 2008-04-30 | 东南大学 | 实现dna序列分析中增加测序阅读长度的测定方法 |
WO2017113655A1 (zh) * | 2015-12-30 | 2017-07-06 | 深圳市华因康高通量生物技术研究院 | 引物组、锚定引物、试剂盒、文库构建及基因测序方法 |
US20170249421A1 (en) * | 2014-09-12 | 2017-08-31 | Illumina Cambridge Limited | Detecting repeat expansions with short read sequencing data |
CN107164366A (zh) * | 2016-10-19 | 2017-09-15 | 中国海洋大学 | 一种具备双单链末端pcr产物的获得方法及其检测方法 |
CN108913736A (zh) * | 2018-07-10 | 2018-11-30 | 中国海洋大学 | 单链寡核苷酸的制备方法 |
US20190127793A1 (en) * | 2017-07-11 | 2019-05-02 | Kabushiki Kaisha Toshiba | Short-chain nucleic acid elongation primer set, assay kit, and short-chain nucleic acid elongation, amplification and detection methods |
US20190169687A1 (en) * | 2016-04-04 | 2019-06-06 | Roche Sequencing Solutions, Inc. | Nucleic acid sample preparation methods |
CN112002376A (zh) * | 2020-08-13 | 2020-11-27 | 中国海洋大学 | 一种dna分子记录和读取信息的方法 |
CN113366120A (zh) * | 2018-12-07 | 2021-09-07 | 深圳华大生命科学研究院 | 纳米孔测序方法 |
US20210381034A1 (en) * | 2020-06-03 | 2021-12-09 | Xenohelix Co., Ltd | Method of detecting rna |
CN113862344A (zh) * | 2021-09-09 | 2021-12-31 | 成都齐碳科技有限公司 | 基因融合的检测方法和装置 |
-
2022
- 2022-05-12 CN CN202210517930.9A patent/CN114807331A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101168774A (zh) * | 2007-11-06 | 2008-04-30 | 东南大学 | 实现dna序列分析中增加测序阅读长度的测定方法 |
US20170249421A1 (en) * | 2014-09-12 | 2017-08-31 | Illumina Cambridge Limited | Detecting repeat expansions with short read sequencing data |
WO2017113655A1 (zh) * | 2015-12-30 | 2017-07-06 | 深圳市华因康高通量生物技术研究院 | 引物组、锚定引物、试剂盒、文库构建及基因测序方法 |
US20190169687A1 (en) * | 2016-04-04 | 2019-06-06 | Roche Sequencing Solutions, Inc. | Nucleic acid sample preparation methods |
CN107164366A (zh) * | 2016-10-19 | 2017-09-15 | 中国海洋大学 | 一种具备双单链末端pcr产物的获得方法及其检测方法 |
US20190127793A1 (en) * | 2017-07-11 | 2019-05-02 | Kabushiki Kaisha Toshiba | Short-chain nucleic acid elongation primer set, assay kit, and short-chain nucleic acid elongation, amplification and detection methods |
CN108913736A (zh) * | 2018-07-10 | 2018-11-30 | 中国海洋大学 | 单链寡核苷酸的制备方法 |
CN113366120A (zh) * | 2018-12-07 | 2021-09-07 | 深圳华大生命科学研究院 | 纳米孔测序方法 |
US20210381034A1 (en) * | 2020-06-03 | 2021-12-09 | Xenohelix Co., Ltd | Method of detecting rna |
CN112002376A (zh) * | 2020-08-13 | 2020-11-27 | 中国海洋大学 | 一种dna分子记录和读取信息的方法 |
CN113862344A (zh) * | 2021-09-09 | 2021-12-31 | 成都齐碳科技有限公司 | 基因融合的检测方法和装置 |
Non-Patent Citations (2)
Title |
---|
CHENRU WANG ET, AL: "Roust Storage of Chinese Language in a pool of Small Single-Stranded DNA Rings and Its Facile Reading-OUT", BULLETIN OF CHEMICAL SOCIETY OF JAPAN, vol. 94, no. 1, 31 August 2020 (2020-08-31) * |
王阳;贾蕾敏;董平;梁兴国;: "三核苷酸双链重复序列扩展合成特性及其机理", 生物化学与生物物理进展, no. 04, 15 April 2013 (2013-04-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108300716B (zh) | 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法 | |
EP2821501B1 (en) | Method and device for detecting microdeletion in chromosome sts area | |
CN112359093B (zh) | 血液中游离miRNA文库制备和表达定量的方法及试剂盒 | |
CN111808854B (zh) | 带有分子条码的平衡接头及快速构建转录组文库的方法 | |
CN112126986B (zh) | 一种定量miRNA的测序文库制备和分析方法 | |
CN111073961A (zh) | 一种基因稀有突变的高通量检测方法 | |
CN108148900A (zh) | 基于分子标签和二代测序降低测序错误的测序方法、试剂盒及其应用 | |
CN103602735A (zh) | 利用高通量测序精确测定线粒体dna高频和低频突变的方法 | |
CN108138175A (zh) | 用于分子条形码编码的试剂、试剂盒和方法 | |
CN108165620B (zh) | 标签及其制备方法和应用 | |
CN109943654B (zh) | 基于内参序列的细菌菌群组成与绝对含量检测的方法 | |
CN110724731A (zh) | 一种在多重pcr体系内加入内参定量核酸拷贝数的方法 | |
CN108728515A (zh) | 一种使用duplex方法检测ctDNA低频突变的文库构建和测序数据的分析方法 | |
Chung et al. | Tissue requirements and DNA quality control for clinical targeted next-generation sequencing of formalin-fixed, paraffin-embedded samples: a mini-review of practical issues | |
CN114807331A (zh) | 一种短链dna的纳米孔测序方法 | |
CN108753922A (zh) | 一种构建转录组测序文库的方法及相应的接头序列和试剂盒 | |
EP3421608B1 (en) | Chromosome number quantification method | |
CN109825558A (zh) | 一种基于引物激活的碱基突变序列扩增检测方法 | |
CN111763668B (zh) | 测序引物组及基于pcr的全基因组测序方法 | |
CN114277114A (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN108642190B (zh) | 基于14个常染色体snp遗传标记的法医学复合检测试剂盒 | |
CN113186262B (zh) | 用于mgi平台高通量测序文库快速定量的方法及试剂盒 | |
CN116042770B (zh) | 尿液中miRNA文库制备和表达定量的方法及试剂盒 | |
CN117166064A (zh) | 构建目标文库的方法、引物组和试剂盒 | |
WO2023092601A1 (zh) | Umi分子标签及其应用、接头、接头连接试剂及试剂盒和文库构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |