CN114836415B - 一种mgi平台转座酶双端标签文库的制备 - Google Patents

一种mgi平台转座酶双端标签文库的制备 Download PDF

Info

Publication number
CN114836415B
CN114836415B CN202210486024.7A CN202210486024A CN114836415B CN 114836415 B CN114836415 B CN 114836415B CN 202210486024 A CN202210486024 A CN 202210486024A CN 114836415 B CN114836415 B CN 114836415B
Authority
CN
China
Prior art keywords
sequence
oligonucleotide
library
transposase
primer binding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210486024.7A
Other languages
English (en)
Other versions
CN114836415A (zh
Inventor
聂俊伟
瞿志鹏
曹林
张宇
朱涵雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Novozan Biotechnology Co ltd
Original Assignee
Nanjing Novozan Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Novozan Biotechnology Co ltd filed Critical Nanjing Novozan Biotechnology Co ltd
Priority to CN202210486024.7A priority Critical patent/CN114836415B/zh
Publication of CN114836415A publication Critical patent/CN114836415A/zh
Application granted granted Critical
Publication of CN114836415B publication Critical patent/CN114836415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种制备与非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库的方法,及其中使用的试剂,特别是一种寡核苷酸对。

Description

一种MGI平台转座酶双端标签文库的制备
技术领域
本发明涉及基因测序技术领域,尤其是一种转座酶文库的制备方法和二代测序方法。
背景技术
高通量测序技术(High-throughput sequencing technology)又称为第二代测序技术(Next-generation"sequencing technology),可简写为NGS,是指一次并行对几十万到几百万条DNA分子进行序列测定的技术,准确度高,通量大。
常规二代测序文库构建的方法是通过物理或化学的方法将双链DNA片段化,末端修复、连接接头,经PCR扩增后纯化得到文库。Tn5转座酶是转座酶的一种,可以将繁琐的DNA片段化、末端修复和接头连接反应等步骤变为一步简单的酶促反应,广泛应用于二代测序文库构建。
目前二代高通量测序平台主要包括Illumina、Ion Torrent、MGI等,根据文库模板富集过程是否在测序仪上可以分为两类,一类是以Illumina和Ion Torrent为代表,其扩增过程都是在测序仪上采用指数型PCR扩增完成的,这种指数型扩增虽然效率高,但存在False SNP、False Indel、GC偏好性、标签跳跃等问题;另一类是MGI平台的滚环扩增,其扩增过程在测序仪外进行,这种扩增方法具有线性扩增、低扩增偏向性、零错误累积、低标签跳跃的特点。MGI测序平台作为国产测序平台代表之一,依靠其错误率低、通量大等优点被广泛应用。
现有技术构建的适用于MGI平台的转座酶文库,与MGI平台非转座酶文库混合测序时,在测序引物中存在串扰问题,无法混合测序,必须包run测序,可能带来测序灵活度下降、数据量浪费等问题,造成使用体验不佳。
发明概述
发明目的
本发明的目的是提供一种MGI平台转座酶双端标签(barcode)文库制备和测序的方法,解决现有MGI转座酶文库不能与MGI非转座酶文库混测的问题,更便捷高效。
发明内容
本申请的文库制备方法如下:
片段化步骤:包括采用Tn5转座子或Tn5转座子包埋的磁珠对待测DNA样本进行处理,通过一步处理,即可获得片段化、末端修复和接头连接的片段化DNA样本;
Tn5酶促反应终止步骤:包括通过磁珠纯化或加入终止反应液,终止Tn5酶促反应;
PCR扩增步骤:包括采用带有双端barcode的引物组,对Tn5酶促反应终止步骤的产物进行PCR扩增,获得双端barcode标记的待测DNA样本;
扩增产物纯化步骤:包括对PCR扩增产物进行纯化或分选,获得纯化产物,将其作为待测DNA样本的双链测序文库;
测序步骤:包括采用MGI测序平台对待测DNA文库进行测序,获得测序数据,对测序数据进行质控和分析。
有益效果
本申请的文库制备方法,采用Tn5转座酶进行双端barcode建库测序,流程简单快速,文库质量符合测序要求;相较于现有方法,可以与MGI平台非转座酶文库混合测序,测序质量符合需求,节省时间和成本。
序列表
<110> 南京诺唯赞生物科技股份有限公司
<120> 一种MGI平台转座酶双端标签文库的制备
<160> 56
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctgtctctta tacacatct 19
<210> 2
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcgtcggcag cgtc 14
<210> 3
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtctcgtggg ctcgg 15
<210> 4
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 5
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 6
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctgataaggt cgccatgcct ctcagtacgt cagcagtt 38
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctctcagtac gtcagcagtt 20
<210> 8
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gcatggcgac cttatcag 18
<210> 9
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
caactccttg gctcacagaa cgacatggct acgatccgac tt 42
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gccatgtcgt tctgtgagcc aagg 24
<210> 11
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
caactccttg gctcacagaa cgacatggc 29
<210> 12
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ctctcagtac gtcagcagtt nnnnnnnnnn caactccttg gctcacagaa cgacatggct 60
cgtcggcagc gtcagat 77
<210> 13
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gcatggcgac cttatcagnn nnnnnnnngt ctcgtgggct cggaga 46
<210> 14
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ctctcagtac gtcagcagtt nnnnnnnnnn caactccttg gctcacagaa cgacatggcg 60
tctcgtgggc tcggaga 77
<210> 15
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gcatggcgac cttatcagnn nnnnnnnntc gtcggcagcg tcagat 46
<210> 16
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 17
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctctcagtac gtcagcagtt nnnnnnnnnn caactccttg gctcacagaa cgacatggct 60
cgtcggcagc gtcagatgtg tataagagac ag 92
<210> 18
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctgtctctta tacacatctc cgagcccacg agacnnnnnn nnnnctgata aggtcgccat 60
gc 62
<210> 19
<211> 93
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctctcagtac gtcagcagtt nnnnnnnnnn caactccttg gctcacagaa cgacatggcg 60
tctcgtgggc tcggagatgt gtataagaga cag 93
<210> 20
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ctgtctctta tacacatctg acgctgccga cgannnnnnn nnnctgataa ggtcgccatg 60
c 61
<210> 21
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
caccacaagc 10
<210> 22
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tagaggacaa 10
<210> 23
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cctagcgaat 10
<210> 24
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
attggtacaa 10
<210> 25
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cgattgtggt 10
<210> 26
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acagacttcc 10
<210> 27
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gctgagctgt 10
<210> 28
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aacctagata 10
<210> 29
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ttgccatctc 10
<210> 30
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
taatcgttca 10
<210> 31
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gttcgctcta 10
<210> 32
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tctcacgcat 10
<210> 33
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
cgccgacgca cagggtgcct cgaccgcatg gcgcggaacc atggttccgc gccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 34
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
catgcggtcg aggcaccctg tgcgtcggcg ggctgcatgc cggcatgcag cccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 35
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
cgccgacgca cagggtgcct cgaccgcatg gcgcggaacc atggttccgc gctcgtcggc 60
agcgtcagat gtgtataaga gacag 85
<210> 36
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
catgcggtcg aggcaccctg tgcgtcggcg ggctgcatgc cggcatgcag cctcgtcggc 60
agcgtcagat gtgtataaga gacag 85
<210> 37
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ttgtcttcct aagaccgctt ggcctccgac tt 32
<210> 38
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 39
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
aagtcggatc gtagccatgt cgttctgtga gccaaggagt tg 42
<210> 40
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
aactgctgac gtactgagag gcatggcgac cttatcag 38
<210> 41
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 42
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ctgtctctta tacacatctc cgagcccacg agac 34
<210> 43
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 44
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ctgtctctta tacacatctc cgagcccacg agac 34
<210> 45
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
cgccgacgca cagggtgcct cgaccgcatg gcgcggaacc atggttccgc gccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 46
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
catgcggtcg aggcaccctg tgcgtcggcg ggctgcatgc cggcatgcag cccaactcct 60
tggctcacag aacgacatgg ctacgatccg actt 94
<210> 47
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
cgccgacgca cagggtgcct cgaccgcatg gcgcggaacc atggttccgc gcgtctcgtg 60
ggctcggaga tgtgtataag agacag 86
<210> 48
<211> 86
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
catgcggtcg aggcaccctg tgcgtcggcg ggctgcatgc cggcatgcag ccgtctcgtg 60
ggctcggaga tgtgtataag agacag 86
<210> 49
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ttgtcttcct aagaccgctt ggcctccgac tt 32
<210> 50
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tcgtcggcag cgtcagatgt gtataagaga cag 33
<210> 51
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
aagtcggatc gtagccatgt cgttctgtga gccaaggagt tg 42
<210> 52
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
aactgctgac gtactgagag gcatggcgac cttatcag 38
<210> 53
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 54
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ctgtctctta tacacatctg acgctgccga cga 33
<210> 55
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 56
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ctgtctctta tacacatctg acgctgccga cga 33
附图说明
图1:本发明转座酶双端barcode文库制备方法原理图;
图2:实施例1中人血液模板gDNA样品分选文库峰型(图2A);实施例1中大肠杆菌模板gDNA样品分选文库峰型(图2B);
图3:实施例1中制备的人血液gDNA文库测序数据统计结果;
图4:实施例1中制备的大肠杆菌gDNA文库测序数据统计结果;
图5:大肠杆菌gDNA标准文库测序数据统计结果;
图6:本发明的转座式双标签滚环测序文库的例示性实施方案的示意图;
图7:现有技术的非转座式双标签滚环测序文库的例示性实施方案的示意图。
最佳实施方式
本发明涉及与非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库的构建。
在一个方面,本发明提供一种寡核苷酸对,其包含第一寡核苷酸和第二寡核苷酸,其中:第一寡核苷酸自5’端向3’端方向包含第一双端文库夹板序列、第一标签序列、修饰的单端文库夹板全序列和第一衔接序列,第二寡核苷酸自5’端向3’端方向包含第二双端文库夹板序列、第二标签序列和第二衔接序列。
在一个实施方案中,第一双端文库夹板序列和第二双端文库夹板序列构成双端文库夹板全序列。在一个实施方案中,第一双端文库夹板序列是双端文库夹板全序列的3’部分,第二双端文库夹板序列是双端文库夹板全序列的5’部分。在一个实施方案中,双端文库夹板全序列是5’-CTGATAAGGTCGCCATGCCTCTCAGTACGTCAGCAGTT-3’(SEQ ID NO:6)所示序列。在一个实施方案中,第一双端文库夹板序列是5’-CTCTCAGTACGTCAGCAGTT-3’(SEQ IDNO:7)所示序列,第二双端文库夹板序列是5’-GCATGGCGACCTTATCAG-3’(SEQ ID NO:8)所示序列。
在一个实施方案中,第一标签序列和/或第二标签序列独立是1-20个连续任意核苷酸,例如4-16个连续任意核苷酸,例如4、6、8、10、12或16个连续任意核苷酸。每个标签序列(第一标签序列和/或第二标签序列)的长度可以相同或不同。
在一个实施方案中,单端文库夹板全序列是5’-CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’(SEQ ID NO:9)所示序列。在一个实施方案中,修饰的单端文库夹板全序列中的修饰包含3’端核苷酸缺失或替代,例如1-37个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或37个,特别是13个核苷酸的缺失或替代,和/或,修饰的单端文库夹板全序列中的修饰包含5’端核苷酸缺失或替代,例如1-5个,例如1、2、3、4或5个核苷酸的缺失或替代,和/或,修饰的单端文库夹板全序列中的修饰包括5’端添加GAAGACAA。在一个实施方案中,修饰的单端文库夹板全序列是5’-CAACTCCTTGGCTCACAGAACGACATGGC-3’(SEQ ID NO:11)所示序列。
在一个实施方案中,第一衔接序列与第三寡核苷酸的3’端部分互补,第二衔接序列与第四寡核苷酸的3’端部分互补,或者,第一衔接序列与第四寡核苷酸的3’端部分互补,第二衔接序列与第三寡核苷酸的3’端部分互补。
在一个实施方案中,第三寡核苷酸自5’端向3’端方向包含第一转座酶识别序列和第一转座引物结合序列,第四寡核苷酸自5’端向3’端方向包含第二转座酶识别序列和第二转座引物结合序列。
在一个实施方案中,第一转座酶识别序列和第二转座酶识别序列相同。在一个实施方案中,第一转座酶识别序列和第二转座酶识别序列是5’-CTGTCTCTTATACACATCT-3’(SEQ ID NO:1)所示序列。
在一个实施方案中,第一转座引物结合序列和第二转座引物结合序列不同。在一个实施方案中,第一转座引物结合序列是5’-TCGTCGGCAGCGTC-3’(SEQ ID NO:2)所示序列的反向互补序列,第二转座引物结合序列是5’-GTCTCGTGGGCTCGG-3’(SEQ ID NO:3)所示序列的反向互补序列。
在一个实施方案中,第一衔接序列与第三寡核苷酸的第一转座引物结合序列互补,第二衔接序列与第四寡核苷酸的第二转座引物结合序列互补,或者,第一衔接序列与第四寡核苷酸的第二转座引物结合序列互补,第二衔接序列与第三寡核苷酸的第一转座引物结合序列互补。
在一个实施方案中,第一寡核苷酸和/或第二寡核苷酸独立为单链、双链或其组合。在一个实施方案中,第一寡核苷酸和/或第二寡核苷酸独立为正链或负链。在一个实施方案中,第一寡核苷酸为正链,第二寡核苷酸为正链。
在一个实施方案中,第一寡核苷酸是
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTCGTCGGCAGCGTCAGAT-3’(SEQ ID NO:12)所示序列,第二寡核苷酸是5’-GCATGGCGACCTTATCAGNNNNNNNNNNGTCTCGTGGGCTCGGAGA-3’(SEQ ID NO:13)所示序列,N是任意核苷酸。
在一个实施方案中,第一寡核苷酸是
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCGTCTCGTGGGCTCGGAGA-3’(SEQ ID NO:14)所示序列,第二寡核苷酸是5’-GCATGGCGACCTTATCAGNNNNNNNNNNTCGTCGGCAGCGTCAGAT-3’(SEQ ID NO:15)所示序列,N是任意核苷酸。
在一个实施方案中,所述寡核苷酸对用于制备与MGI平台非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库。
在另一个方面,本发明提供一种制备与MGI平台非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库的方法,其包括以下步骤:
(1)用转座酶复合物处理含DNA样品,所述转座酶复合物包含第三寡核苷酸和第四寡核苷酸,其中:
第三寡核苷酸自5’端向3’端方向包含第一转座酶识别序列和第一转座引物结合序列,
第四寡核苷酸自5’端向3’端方向包含第二转座酶识别序列和第二转座引物结合序列;和
(2)用本发明的寡核苷酸对扩增步骤(1)得到的标签化DNA片段。
在一个实施方案中,第一转座酶识别序列和第二转座酶识别序列相同。在一个实施方案中,第一转座酶识别序列和第二转座酶识别序列是5’-CTGTCTCTTATACACATCT-3’(SEQ ID NO:1)所示序列。
在一个实施方案中,第一转座引物结合序列和第二转座引物结合序列不同。在一个实施方案中,第一转座引物结合序列是5’-TCGTCGGCAGCGTC-3’(SEQ ID NO:2)所示序列的反向互补序列,第二转座引物结合序列是5’-GTCTCGTGGGCTCGG-3’(SEQ ID NO:3)所示序列的反向互补序列。
在一个实施方案中,第三寡核苷酸和第四寡核苷酸独立为双链或部分双链。在一个实施方案中,第一转座酶识别序列和/或第二转座酶识别序列为双链,和/或,第一转座引物结合序列和/或第二转座引物结合序列为单链。
在一个实施方案中,第三寡核苷酸的全序列是5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(SEQ ID NO:4)所示序列或其反向互补序列,第四寡核苷酸的全序列是5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(SEQ ID NO:5)所示序列或其反向互补序列。
在一个实施方案中,所述方法还包括以下步骤:
(3)回收、纯化和/或扩增步骤(2)得到的扩增产物。
在上文所述序列元件以外,本发明的寡核苷酸还可以包含测序领域已知的、有用的其它序列元件。
在本文中,“包含”涵盖“由……组成”或“本质上由……组成”。
在本文中,“双端文库夹板序列”指双端标签滚环测序中能够实现模板环化的序列。“双端文库夹板全序列”指模板环化后的前述序列。“第一双端文库夹板序列”指双端文库夹板全序列的3’部分,在环化前位于插入物的5’端。“第二双端文库夹板序列”指双端文库夹板全序列的5’部分,在环化前位于插入物的3’端。这里的方向5’端和3’端是相对而言的,可互换使用。
类似地,“单端文库夹板序列”指单端标签滚环测序中能够实现模板环化的序列。“单端文库夹板全序列”指模板环化后的前述序列。这里的方向5’端和3’端通常以标签位于插入物的3’端为基准,反之亦可。
在本文中,“标签序列”用于标记样品。
在本文中,“转座酶识别序列”指受到转座酶识别的特异性序列,例如本领域公知的Tn5转座酶的19bp核心序列。
在本文中,“转座引物结合序列”指通常与转座酶识别序列配合使用、用于区分通过转座作用结合至插入物两端的序列、可用作引物结合位点的序列,例如本领域公知的read 1和read2的反向互补序列。
本发明的转座式双标签滚环测序文库的例示性实施方案如图6所示。根据图6,本领域技术人员有能力设计用于标签序列1、标签序列2和/或文库插入物的单向或双向(即正向和/或反向)测序的引物。
本发明的转座式双标签滚环测序文库的一个例示性实施方案(例如实施例1)具有如下序列:
CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTCGTCGGCAGCGTCAGATGTGTATAAGAGACAG(SEQ ID NO:17)Xn
CTGTCTCTTATACACATCTCCGAGCCCACGAGACNNNNNNNNNNCTGATAAGGTCGCCATGC(SEQ IDNO:18)。
本发明的转座式双标签滚环测序文库的一个例示性实施方案(例如实施例2)具有如下序列:
CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(SEQ ID NO:19)Xn
CTGTCTCTTATACACATCTGACGCTGCCGACGANNNNNNNNNNCTGATAAGGTCGCCATGC(SEQ IDNO:20)。
其中,NNNNNNNNNN代表标签序列;Xn代表插入物序列,n个连续任意核苷酸,n为任意整数,例如1至10,000、7,000、6,000、5,000、4,000、3,000、2,500、2,000、1,500、1,000、900、800、700、600、500、450、400、300、200、100、90、80、70、60、50、40、30、20或10,±5%、±10%、±15%、±20%或±25%。
本发明的寡核苷酸可以是单链或双链。在单链的情况中,本发明的寡核苷酸可以是本文所述序列或其反向互补序列。在双链的情况中,本发明的寡核苷酸包含本发明所述序列及其反向互补序列。
参考例:
常规/标准,即非转座式,双标签滚环测序文库具有如图7所示的文库结构。参见CN111910258A。
在一个实施方案中,双端文库夹板全序列为
5’-CTGATAAGGTCGCCATGCCTCTCAGTACGTCAGCAGTT-3’(SEQ ID NO:6),双端文库夹板序列1(即双端文库夹板全序列的3’部分)为5’-CTCTCAGTACGTCAGCAGTT-3’(SEQ ID NO:7),双端文库夹板序列2(即双端文库夹板全序列的5’部分)为5’-GCATGGCGACCTTATCAG-3’(SEQ ID NO:8)。
单端文库夹板全序列为
5’-CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’(SEQ ID NO:9)。与之对应的成环引物序列为5’-GCCATGTCGTTCTGTGAGCCAAGG-3’(SEQ ID NO:10)。
标签序列1和标签序列2各自为10个连续核苷酸。
插入物引物结合序列为5’-AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA-3’(SEQ ID NO:16)。
实施例1:
本例对人血液gDNA、大肠杆菌gDNA样品进行本例改进的二代测序,即Tn5转座酶对样本进行NGS二代建库和测序,并对下机数据进行拆分、过滤、比对,评估本例的测序质量。本例使用的建库试剂来自南京诺唯赞的TruePrep Flexible DNA Library Prep Kit forMGI(#TDM504)。
1、片段化
(1)室温解冻5×TTBL,上下颠倒混匀后备用。确认6×TSB、TWB处于室温状态,并轻弹管壁确认无沉淀;如有沉淀,37℃加热并涡旋振荡混匀,至沉淀溶解即可。
(2)在PCR管中配制如下反应体系
组分 体积
5×TTBL 10μl
待测DNA(1ng) 1μl
TNB 10μl
<![CDATA[ddH<sub>2</sub>O]]> 29μl
注:TNB包含下述寡核苷酸:
A:5’-phos-CTGTCTCTTATACACATCT-NH2-3’(SEQ ID NO:1)
B:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(SEQ ID NO:4)
C:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(SEQ ID NO:5)
(3)上下颠倒混匀,弹去气泡,短暂离心收集反应液至管底。
(4)将反应管置于PCR仪中,运行如下反应程序:
温度 时间
55℃ 15min
16℃ Hold
(5)反应完成后立即向产物中加入10μl 6×TSB,使用移液器轻轻吹打充分混匀,于室温放置5min。
(6)将反应管置于磁力架上,待溶液澄清后(约3min)小心移除上清。
(7)将反应管从磁力架上取下,加入100μl TWB轻轻吹打重悬磁珠,再将反应管置于磁力架上,待溶液澄清后(约3min)移除上清。
(8)重复步骤7,总计漂洗两次,弃尽上清,盖上管盖,防止TNB磁珠干裂。
2、PCR扩增
(1)按照如下反应体系配制PCR扩增Mix,加入到上一步漂洗后的TNB磁珠中,轻轻涡旋振荡混匀。
Figure BDA0003629976170000051
Figure BDA0003629976170000061
其中Barcode 1和Barcode 2为引物组的上下游引物,为华大基因的测序平台的引物。具体的,Barcode 1为SEQ ID NO:13所示序列,Barcode 2为SEQ ID NO:12所示序列。
SEQ ID NO:13
5’-GCATGGCGACCTTATCAGNNNNNNNNNNGTCTCGTGGGCTCGGAGA-3’
SEQ ID NO:12
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTCGTCGGCAGCGTCAGAT-3’
Barcode 1和Barcode 2序列中,“NNNNNNNNNN”为barcode序列,N是任意核苷酸。
本例中人血液gDNA文库三个重复实验分别使用的barcode 1序列为下表中SEQ IDNO:21-23,大肠杆菌gDNA文库三个重复实验分别使用的barcode 1序列为下表中SEQ IDNO:24-26。
barcode序列 SEQ ID NO: barcode序列 SEQ ID NO:
CACCACAAGC 21 ATTGGTACAA 24
TAGAGGACAA 22 CGATTGTGGT 25
CCTAGCGAAT 23 ACAGACTTCC 26
本例中人血液gDNA文库三个重复实验分别使用的barcode 2序列为下表中SEQ IDNO:27-29,大肠杆菌gDNA文库三个重复实验分别使用的barcode 2序列为下表中SEQ IDNO:30-32。
barcode序列 SEQ ID NO: barcode序列 SEQ ID NO:
GCTGAGCTGT 27 TAATCGTTCA 30
AACCTAGATA 28 GTTCGCTCTA 31
TTGCCATCTC 29 TCTCACGCAT 32
(2)使用移液器轻轻吹打充分混匀,将反应管置于PCR仪中,运行如下反应程序:
Figure BDA0003629976170000062
3、扩增产物纯化
(1)文库扩增结束将反应管短暂离心,涡旋振荡混匀VAHTS DNAClean Beads并吸取30μl至50μl PCR产物中,使用移液器吹打10次充分混匀,室温孵育5min。
(2)将反应管短暂离心并置于磁力架上,待溶液澄清后(约5min)小心转移上清至新的PCR管中,丢弃磁珠。
(3)涡旋振荡混匀VAHTS DNA Clean Beads并吸取7.5μl至上清中,使用移液器吹打10次充分混匀,室温孵育5min。
(4)将反应管短暂离心并置于磁力架上,待溶液澄清后(约5min)小心移除上清。
(5)保持反应管始终处于磁力架上,加入200μl新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec,小心移除上清。
(6)重复步骤5,总计漂洗两次。
(7)保持反应管始终处于磁力架上,开盖空气干燥约3min。
(8)将反应管从磁力架上取出,加入22μl ddH2O洗脱。使用移液器吹打10次充分混匀,室温孵育5min。
(9)将反应管短暂离心并置于磁力架上,待溶液澄清后(约5min)小心吸取20μl上清至新的PCR管中,-20℃保存。
4.文库质量检测
构建好的文库可通过Qubit浓度检测和Bioanalyzer等基于电泳分离原理的设备检测长度来进行质量评价。本例具体的,采用Qsep400对分选后的PCR扩增产物进行检测,结果如图2所示。图2的结果显示,两种DNA样品文库分选后主峰分别为461bp、454bp与预期450bp基本相符,能够用于后续测序。
5、变性
(1)根据Input DNA的片段长度,取1pmol PCR产物至0.2mL PCR管中,若不足40μl则用ddH2O补充至40μl。
(2)Splint Oligo解冻后颠倒混匀瞬时离心后置于冰上待用,在PCR管中配制如下反应,使用移液器吹打混匀并短暂离心将反应液收集至管底,将PCR管置于PCR仪,进行如下变性反应,反应结束后立即置于冰上,冰浴2min后瞬时离心。
组分 体积
Input文库 40μl
Splint Oligo 10μl
Total 50μl
温度 时间
热盖 On
98℃ 3min
6、环化
(1)Rapid SplintBuffer解冻后颠倒混匀,置于冰上待用。
(2)在冰上配制如下单链环化反应液,使用移液器轻轻吹打混匀,短暂离心将反应液收集至管底,将上述PCR管置于PCR仪,按照如下条件进行环化反应。
Figure BDA0003629976170000071
Figure BDA0003629976170000081
温度 时间
热盖 Off
37℃ 15min
4℃ Hold
7、消化
(1)Digestion Buffer解冻后颠倒混匀,置于冰上待用。
(2)在冰上按如下体系配制消化反应液,使用移液器轻轻吹打混匀,短暂离心将反应液收集至管底,将上述PCR管置于PCR仪,按照如下条件进行消化反应,反应结束后,瞬时离心立即进行纯化。
组分 体积
上一步反应产物 70μl
Digestion Buffer 8μl
Digestion Enzyme 2μl
Total 80μl
温度 时间
热盖 Off
37℃ 10min
4℃ Hold
8、消化产物纯化
(1)提前30min取出
Figure BDA0003629976170000082
DNA Clean Beads平衡至室温,使用前充分涡旋混匀。
(2)吸取130μl
Figure BDA0003629976170000083
DNA Clean Beads至消化产物中,用移液器轻轻吹打至少10次至完全混匀,室温孵育10min。
(3)瞬时离心后,将PCR管置于磁力架中分离磁珠和液体,待溶液澄清后(约5min),小心移除上清。
(4)保持PCR管置于磁力架上,加入200μl新鲜配制的80%乙醇漂洗磁珠及管壁,小心吸取并丢弃上清。
(5)重复步骤4,尽量吸干管内液体。
(6)保持PCR管固定于磁力架上,打开PCR管管盖,室温干燥,直至磁珠表面无反光、无开裂。
(7)将PCR管从磁力架上取下,加入22μl ddH2O进行DNA洗脱,用移液器轻轻吹打至少10次至完全混匀,室温静置孵育10min。
(8)瞬时离心,将PCR管置于磁力架上,静置至液体澄清(约3min),将20μl上清转移到新的PCR管中。
(9)使用QubitTM ssDNAAssay Kit单链DNA定量试剂盒对单链DNA文库进行定量。
9、DNB制备
(1)取用0.2ml PCR管,在冰上按如下体系配制反应混合液(ssDNA根据长度大小取出40fmol量),在制备DNB时按照等数据量混入大肠杆菌gDNA标准文库(华大智造,货号1000005033,MGI平台非转座酶文库单链环)一起制备DNB进行后续测序:
组分 体积
ssDNA V
TE缓冲液 20-Vμl
DNB制备缓冲液 20μl
Total 40μl
(2)将反应混合液用漩涡振荡器震荡混匀,迷你离心机离心5s,置于PCR仪中进行引物杂交,
温度 时间
热盖 105℃
95℃ 1min
65℃ 1min
40℃ 1min
4℃ Hold
(3)取出DNB聚合酶混合液II(LC)置于冰盒上,短暂离心5s,置于冰盒上备用。当PCR仪达到4℃后取出PCR管,迷你离心机离心5s后,在冰上加入如下组分:
组分 体积
上一步 40μl
DNB聚合酶混合液I 40μl
DNB聚合酶混合液II(LC) 4μl
Total 84μl
(4)反应混合液轻弹6次混匀或涡旋混匀仪中速涡旋混匀6s,迷你离心机离心5s,即刻置于PCR仪中,反应条件如下:
温度 时间
热盖 35℃
30℃ 25min
4℃ Hold
(5)当PCR仪温度达到4℃后立即加入20μl DNB终止缓冲液。用阔口吸头缓慢地吹打混匀6次,切勿震荡及剧烈吹打。
(6)DNB制备完成后,取用2μl DNB,使用
Figure BDA0003629976170000091
ssDNAAssay Kit和
Figure BDA0003629976170000092
Fluorometer仪器进行浓度检测。
10、上机测序
测序方式为华大自主测序平台MGI2000 PE150+10+10,测序操作参考MGI2000标准操作说明,测序试剂中的测序引物需自定义替换。本例中使用的测序引物序列包括以下序列:
Figure BDA0003629976170000093
Figure BDA0003629976170000101
11、生信分析
根据文库barcode序列完成fastq拆分,过滤含接头、含N比例过高等低质量reads进行fastqQC,利用BWA软件进行比对分析,对数据质量情况、比对情况等信息进行统计与评估。
根据图3结果显示,本例构建的人血液gDNA样本MGI转座酶双端barcode文库与MGI非转座酶标准文库混测后,对测序数据进行质控分析,clean_GC平均40.96%符合人血液gDNA样本预期GC 41.1%,clean_Q20均大于98%符合质控要求(不低于90%),clean_Q30均大于95%符合质控要求(不低于85%),Mapping rate大于99%符合质控要求(不低于85%),Duplicate rate均小于2%符合质控要求(不高于10%),SoftClip均小于0.05符合质控要求(不高于0.2),PCT CHIMERAS(PAIR)均小于0.01符合质控要求(不高于0.2),这表明本例构建的人血液gDNAMGI转座酶双端barcode文库混测测序数据质量符合要求。
根据图4结果显示,本例使用的大肠杆菌gDNA样本MGI转座酶双端barcode文库与MGI非转座酶标准文库混测后,对测序数据进行质控分析,clean_GC平均50.73%符合人血液gDNA样本预期GC 50.6%,clean_Q20均大于98%符合质控要求(不低于90%),clean_Q30均大于95%符合质控要求(不低于85%),Mapping rate大于85%符合质控要求(不低于85%),Duplicate rate均小于2%符合质控要求(不高于10%),SoftClip均小于0.05符合质控要求(不高于0.2),PCT CHIMERAS(PAIR)均小于0.01符合质控要求(不高于0.2),这表明本例构建的大肠杆菌gDNAMGI转座酶双端barcode文库混测测序数据质量符合要求。
根据图5结果显示,本例使用的大肠杆菌gDNA样本MGI非转座酶标准文库与MGI转座酶双端barcode文库混测后,对测序数据进行质控分析,clean_GC平均51.12%符合人血液gDNA样本预期GC 50.6%,clean_Q20均大于98%符合质控要求(不低于90%),clean_Q30均大于95%符合质控要求(不低于85%),Mapping rate大于85%符合质控要求(不低于85%),Duplicate rate均小于2%符合质控要求(不高于10%),SoftClip均小于0.05符合质控要求(不高于0.2),PCT CHIMERAS(PAIR)均小于0.01符合质控要求(不高于0.2),这表明本例使用的大肠杆菌gDNAMGI非转座酶标准文库混测测序数据质量符合要求。
以上结果显示,本例的文库制备和测序方法,可以实现简便流程的转座酶法建库,文库质量符合测序要求;同时可以与MGI非转座酶文库混测,且不同类型文库测序质量均符合要求,无需单独测序。
实施例2:
与实施例1相同,区别仅在于:
与实施例1中的引物Barcode 1对应的Barcode 1’为SEQ ID NO:14所示序列,与实施例1中的引物Barcode 2对应的Barcode 2’为SEQ ID NO:15所示序列。
SEQ ID NO:15
5’-GCATGGCGACCTTATCAGNNNNNNNNNNTCGTCGGCAGCGTCAGAT-3’
SEQ ID NO:14
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCGTCTCGTGGGCTCGGAGA-3’
测序引物序列包括以下序列:
Figure BDA0003629976170000111
Figure BDA0003629976170000121

Claims (19)

1.一种寡核苷酸对,其包含第一寡核苷酸和第二寡核苷酸,其中:
第一寡核苷酸自5’端向3’端方向包含第一双端文库夹板序列、第一标签序列、修饰的单端文库夹板全序列和第一衔接序列,
第二寡核苷酸自5’端向3’端方向包含第二双端文库夹板序列、第二标签序列和第二衔接序列,第一双端文库夹板序列是
5’-CTCTCAGTACGTCAGCAGTT-3’(SEQ ID NO:7)所示序列,第二双端文库夹板序列是5’-GCATGGCGACCTTATCAG-3’(SEQ ID NO:8)所示序列,单端文库夹板全序列是
5’-CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’
(SEQ ID NO:9)所示序列,修饰的单端文库夹板全序列中的修饰包含3’端核苷酸缺失7、8、9、10、11、12或13个,
第一衔接序列与第三寡核苷酸的第一转座引物结合序列互补,第二衔接序列与第四寡核苷酸的第二转座引物结合序列互补,或者,第一衔接序列与第四寡核苷酸的第二转座引物结合序列互补,第二衔接序列与第三寡核苷酸的第一转座引物结合序列互补,
第三寡核苷酸自5’端向3’端方向包含第一转座酶识别序列和第一转座引物结合序列,第四寡核苷酸自5’端向3’端方向包含第二转座酶识别序列和第二转座引物结合序列,第一转座引物结合序列是
5’-TCGTCGGCAGCGTC-3’(SEQ ID NO:2)所示序列的反向互补序列,第二转座引物结合序列是5’-GTCTCGTGGGCTCGG-3’(SEQ ID NO:3)所示序列的反向互补序列,
第一寡核苷酸和第二寡核苷酸为单链。
2.根据权利要求1所述的寡核苷酸对,其中,第一标签序列和/或第二标签序列独立是1-20个连续任意核苷酸。
3.根据权利要求2所述的寡核苷酸对,其中,第一标签序列和/或第二标签序列独立是4-16个连续任意核苷酸。
4.根据权利要求3所述的寡核苷酸对,其中,第一标签序列和/或第二标签序列独立是4、6、8、10、12或16个连续任意核苷酸。
5.根据权利要求1所述的寡核苷酸对,其中,修饰的单端文库夹板全序列是5’-CAACTCCTTGGCTCACAGAACGACATGGC-3’(SEQ ID NO:11)所示序列。
6.根据权利要求1所述的寡核苷酸对,其中,修饰的单端文库夹板全序列中的修饰还包含5’端核苷酸缺失或替代。
7.根据权利要求6所述的寡核苷酸对,其中,修饰的单端文库夹板全序列中的修饰包含的5’端核苷酸缺失或替代是1、2、3、4或5个核苷酸的缺失或替代。
8.根据权利要求1所述的寡核苷酸对,其中,修饰的单端文库夹板全序列中的修饰还包含5’端添加GAAGACAA。
9.根据权利要求1所述的寡核苷酸对,其中,第一转座酶识别序列和第二转座酶识别序列是5’-CTGTCTCTTATACACATCT-3’(SEQ ID NO:1)所示序列。
10.根据权利要求1所述的寡核苷酸对,其中,第一寡核苷酸为正链,第二寡核苷酸为正链。
11.根据权利要求5所述的寡核苷酸对,其中第一衔接序列与第三寡核苷酸的第一转座引物结合序列互补,第二衔接序列与第四寡核苷酸的第二转座引物结合序列互补。
12.根据权利要求11所述的寡核苷酸对,其中第一寡核苷酸是
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCA CAGAACGACATGGCTCGTCGGCAGCGTCAGAT-3’(SEQ ID NO:12)所示序列,第二寡核苷酸是
5’-GCATGGCGACCTTATCAGNNNNNNNNNNGTCTCGTGGGCTCGGAG A-3’(SEQ ID NO:13)所示序列,N是任意核苷酸。
13.根据权利要求5所述的寡核苷酸对,其中第一衔接序列与第四寡核苷酸的第二转座引物结合序列互补,第二衔接序列与第三寡核苷酸的第一转座引物结合序列互补。
14.根据权利要求13所述的寡核苷酸对,其中第一寡核苷酸是
5’-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCA CAGAACGACATGGCGTCTCGTGGGCTCGGAGA-3’(SEQ ID NO:14)所示序列,第二寡核苷酸是
5’-GCATGGCGACCTTATCAGNNNNNNNNNNTCGTCGGCAGCGTCAGA T-3’(SEQ ID NO:15)所示序列,N是任意核苷酸。
15.根据权利要求1-14任一项所述的寡核苷酸对,其用于制备与MGI平台非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库。
16.一种制备与MGI平台非转座式双标签滚环测序文库兼容的转座式双标签滚环测序文库的方法,其包括以下步骤:
(1)用转座酶复合物处理含DNA样品,所述转座酶复合物包含第三寡核苷酸和第四寡核苷酸,其中:
第三寡核苷酸自5’端向3’端方向包含第一转座酶识别序列和第一转座引物结合序列,第一转座引物结合序列是5’-TCGTCGGCAGCGTC-3’(SEQ ID NO:2)所示序列的反向互补序列,
第四寡核苷酸自5’端向3’端方向包含第二转座酶识别序列和第二转座引物结合序列,第二转座引物结合序列是5’-GTCTCGTGGGCTCGG-3’(SEQ ID NO:3)所示序列的反向互补序列,
第三寡核苷酸和第四寡核苷酸独立为双链或部分双链,
(2)用根据权利要求1-15任一项所述的寡核苷酸对扩增步骤(1)得到的标签化DNA片段;和
(3)任选地,回收、纯化和/或扩增步骤(2)得到的扩增产物,得到测序文库。
17.根据权利要求16所述的方法,其中,第一转座酶识别序列和第二转座酶识别序列是5’-CTGTCTCTTATACACATCT-3’(SEQ ID NO:1)所示序列。
18.根据权利要求16所述的方法,其中,第一转座酶识别序列和/或第二转座酶识别序列为双链,和/或,第一转座引物结合序列和/或第二转座引物结合序列为单链。
19.根据权利要求16所述的方法,其中,第三寡核苷酸的全序列是
5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(SEQ ID NO:4)所示序列或其反向互补序列,第四寡核苷酸的全序列是
5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(SEQ ID NO:5)所示序列或其反向互补序列。
CN202210486024.7A 2022-05-06 2022-05-06 一种mgi平台转座酶双端标签文库的制备 Active CN114836415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210486024.7A CN114836415B (zh) 2022-05-06 2022-05-06 一种mgi平台转座酶双端标签文库的制备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210486024.7A CN114836415B (zh) 2022-05-06 2022-05-06 一种mgi平台转座酶双端标签文库的制备

Publications (2)

Publication Number Publication Date
CN114836415A CN114836415A (zh) 2022-08-02
CN114836415B true CN114836415B (zh) 2023-04-18

Family

ID=82567705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210486024.7A Active CN114836415B (zh) 2022-05-06 2022-05-06 一种mgi平台转座酶双端标签文库的制备

Country Status (1)

Country Link
CN (1) CN114836415B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105714383B (zh) * 2014-12-22 2018-01-23 深圳华大基因研究院 一种基于分子反向探针的测序文库构建方法和试剂
CN109576347B (zh) * 2018-12-06 2021-03-12 深圳海普洛斯医疗器械有限公司 含单分子标签的测序接头和测序文库的构建方法
CN111379031B (zh) * 2018-12-28 2024-03-19 深圳华大智造科技股份有限公司 核酸文库构建方法、得到的核酸文库及其用途
CA3140512A1 (en) * 2019-05-15 2020-11-19 Bgi Shenzhen Array and method for detecting spatial information of nucleic acids
CN112111485B (zh) * 2019-06-19 2022-03-22 深圳华大智造科技股份有限公司 合成dna纳米球互补链的方法、试剂盒和用途及测序方法
WO2021016395A1 (en) * 2019-07-22 2021-01-28 Igenomx International Genomics Corporation Methods and compositions for high throughput sample preparation using double unique dual indexing
CN112626189A (zh) * 2020-04-24 2021-04-09 北京吉因加医学检验实验室有限公司 基因测序仪的短接头、双index接头引物和双index建库体系
CN113462748A (zh) * 2021-05-11 2021-10-01 温氏食品集团股份有限公司 Dna测序文库的制备方法及试剂盒

Also Published As

Publication number Publication date
CN114836415A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN108103055B (zh) 一种单细胞rna逆转录与文库构建的方法
CN111808854B (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
CN109576347B (zh) 含单分子标签的测序接头和测序文库的构建方法
CN109486923B (zh) 多重扩增子测序用引物系统、其应用以及测序文库的构建方法
CN107893100A (zh) 一种单细胞mRNA逆转录与扩增的方法
CN110872610B (zh) 构建靶序列的测序文库的方法
AU2021209101A1 (en) Methods of targeted sequencing
CN111748637A (zh) 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法
CN112410331A (zh) 带分子标签和样本标签的接头及其单链建库方法
CN111455031A (zh) 基于Nanopore测序技术的多组学测序及分析方法
CN108531475A (zh) 一种高通量转录组文库构建方法
WO2024104216A1 (zh) 一种dna和rna混合物的处理方法
CN113462748A (zh) Dna测序文库的制备方法及试剂盒
CN114836415B (zh) 一种mgi平台转座酶双端标签文库的制备
CN112795990B (zh) 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头
CN111793623A (zh) 62个多等位snp-ngs的分型遗传标记组合物、试剂盒、鉴定体系以及分型方法
CN106283198B (zh) 用于单细胞全基因组重亚硫酸氢盐测序的文库构建方法
CN114032243B (zh) 特异性结合环丙沙星的核酸适配体及其用途
CN116515977B (zh) 基于单端接头转座酶的单细胞基因组测序试剂盒和方法
WO2023217214A1 (zh) 一种单细胞RNA m5C修饰的分析方法
CN118064555A (zh) 用于提高多样本文库均一性的方法及应用
CN115873922A (zh) 一种单细胞全长转录本建库测序方法
CN117467740A (zh) 具有独特分子标签的多样本多位点dna甲基化检测方法和试剂盒
CN117255857A (zh) 接头、接头连接试剂及试剂盒和文库构建方法
CN116497088A (zh) 一种夹板核酸分子及其试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant