CN109321984B - 一种测序用dna文库 - Google Patents

一种测序用dna文库 Download PDF

Info

Publication number
CN109321984B
CN109321984B CN201710647896.6A CN201710647896A CN109321984B CN 109321984 B CN109321984 B CN 109321984B CN 201710647896 A CN201710647896 A CN 201710647896A CN 109321984 B CN109321984 B CN 109321984B
Authority
CN
China
Prior art keywords
primer
dna
sequence
dna sequence
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710647896.6A
Other languages
English (en)
Other versions
CN109321984A (zh
Inventor
潘伟业
王占东
赵雪丹
程世月
玄兆伶
李大为
梁峻彬
陈重建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Annoroad Gene Technology Beijing Co ltd
Beijing Annoroad Medical Laboratory Co ltd
Original Assignee
Annoroad Gene Technology Beijing Co ltd
Annoroad Yiwu Medical Inspection Co ltd
Zhejiang Annoroad Bio Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Annoroad Gene Technology Beijing Co ltd, Annoroad Yiwu Medical Inspection Co ltd, Zhejiang Annoroad Bio Technology Co ltd filed Critical Annoroad Gene Technology Beijing Co ltd
Priority to CN201710647896.6A priority Critical patent/CN109321984B/zh
Publication of CN109321984A publication Critical patent/CN109321984A/zh
Application granted granted Critical
Publication of CN109321984B publication Critical patent/CN109321984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种测序用DNA文库。本发明的测序用DNA文库包括第一双链DNA分子,所述第一双链DNA分子包括第一DNA链,该第一DNA链从5'端起依次包括位于5'端的桥式引物DNA序列1、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列2的反向互补序列,所述桥式引物DNA序列1和所述桥式引物DNA序列2是测序芯片上的DNA序列,所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2用于对包含待读取DNA序列S的目的DNA片段进行特异性扩增的引物DNA序列。本发明的测序用DNA文库能够增加单轮测序反应中碱基读取复杂度,从而提高测序质量。

Description

一种测序用DNA文库
技术领域
本发明属于生物测序领域,具体涉及测序用DNA文库、以及该测序用DNA文库在二代测序中的应用。
背景技术
现有的Illumina Hiseq/Miseq是基于桥式PCR扩增和SBS测序原理的高通量芯片型测序平台,是迄今为止DNA高通量芯片型第二代测序平台中测序通量最高,单碱基判断准确度最高的平台。由于该平台芯片密度高,单芯片能产出上百G的数据量,大大超过分析一个生物样品所需要的信息量,通常需要在文库构建过程中对在同一个芯片内进行测序的样本加上唯一标签(DNA条码)的标记,在测序后进行序列进行标签拆分。
由于二代测序的原理需要对每一轮测序反应标记4种碱基的光/化学信号进行扫描成像,如果单轮测序反应的碱基复杂度太低,会造成光密度过高/过低,单轮成像的曝光过度/不足,导致信号识别质量下降。存在这种问题的文库类型包括例如:单基因扩增子文库,PCR扩增子序列都是单一的,有连续且固定的碱基排列;甲基化文库,经过BS处理后由原来的4种碱基复杂度减少为3种;限制性内切酶简单化文库,起始序列就是限制性内切酶的固定碱基排列;限制性内切酶简单甲基化文库,兼具以上三种特征。
如果这种单轮碱基复杂度较低的文库在测序芯片文库池中比例过高,会大大降低芯片读到的碱基信息的可信程度,导致测序结果不可用。
发明内容
鉴于上述现有技术中存在的不足,本发明的目的在于提供一种能够增加单轮测序反应中碱基读取复杂度、从而提高测序质量的测序用DNA文库、该测序用DNA文库的构建方法、以及该测序用DNA文库在二代测序中的应用。
本发明的发明人发现:单轮测序反应中碱基复杂度较单一时的读取困难,除了序列本身的原因外,另外一个主要原因是由于需要进行桥式PCR进行信号放大,桥式引物P7、P5是在文库制备过程中固定添加到DNA序列的5’和3’端的,而测序反应中Read1和Read2的测序引物在Illumina的标准文库制备流程中是分别和P7、P5是绑定的,而在扩增子文库中一般的设计习惯于使上游引物与P7/P5绑定在一起,下游引物与另外一端桥式引物绑定在一起。这种定向的文库制备方式导致了碱基读取的复杂度的降低。
与此相对,本发明中通过倒置测序引物,实现了在测序反应中同时读取待读取DNA序列的5’端和3’端的信息,增加了测序反应的碱基复杂度,显著的提高了测序的质量。
本发明包括:
1.一种测序用DNA文库,其包括第一双链DNA分子,
所述第一双链DNA分子包括第一DNA链,该第一DNA链从5'端起依次包括位于5'端的桥式引物DNA序列1、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列2的反向互补序列,
所述桥式引物DNA序列1和所述桥式引物DNA序列2是测序芯片上的DNA序列,所述桥式引物DNA序列1包含测序引物DNA序列1,所述桥式引物DNA序列2包含测序引物DNA序列2,
所述测序引物DNA序列1和所述测序引物DNA序列2是在对待读取DNA序列S进行读取测序时使用的引物DNA序列,
所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2是用于对包含待读取DNA序列S的目的DNA片段进行特异性扩增的引物DNA序列,
所述第一双链DNA分子还包括与所述第一DNA链完全互补的第二DNA链,
该测序用DNA文库还包括第二DNA双链分子,
所述第二双链DNA分子包括第三DNA链,该第三DNA链从5'端起依次包括位于5'端的桥式引物DNA序列2、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列1的反向互补序列,
所述第二双链DNA分子还包括与所述第三DNA链完全互补的第四DNA链。
2.根据项1所述的测序用DNA文库,其是扩增子DNA文库。
3.根据项1或2所述的测序用DNA文库,其中,所述测序引物DNA序列1和所述测序引物DNA序列2的长度分别为25~40个核苷酸,优选30~35个核苷酸。
4.根据项1~3中任一项所述的测序用DNA文库,其中,所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2的长度分别为18~22个核苷酸。
5.根据项1~4中任一项所述的测序用DNA文库,其中,所述第一DNA链、第二DNA链、第三DNA链和/或第四DNA链还包括标签DNA序列。
6.一种用于构建项1~5中任一项所述的测序用DNA文库的方法,其包括:
步骤1:使用引物组A1和引物组A2对包含待读取DNA序列S的模板进行PCR扩增,得到扩增产物;以及
步骤2:使用引物组B对所述步骤1的扩增产物进行再次PCR扩增;
其中,
所述引物组A1包含引物AF1和引物AR1,所述引物AF1从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR1从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组A2包含引物AF2和引物AR2,所述引物AF2从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR2从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组B包含引物BF和引物BR,所述引物BF是桥式引物DNA序列1,所述引物BR是桥式引物DNA序列2。
7.根据项6所述的方法,其中,
所述桥式引物DNA序列1的部分序列包含测序引物DNA序列1,和/或
所述桥式引物DNA序列2的部分序列包含测序引物DNA序列2。
8.根据项6或7所述的方法,其中,所述引物AF1、引物AR1、引物AF2和/或引物AR2还包含标签DNA序列。
9.根据项6~8中任一项所述的方法,其中,所述引物BF和/或引物BR还包含标签DNA序列。
10.一种用于构建测序用DNA文库的试剂盒,其包括:引物AF1、引物AR1、引物AF2、引物AR2、引物BF和引物BR;
所述引物AF1从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR1从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物AF2从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR2从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组B包含引物BF和引物BR,所述引物BF是桥式引物DNA序列1,所述引物BR是桥式引物DNA序列2。
11.一种测序方法,其中,以项1~5中任一项所述的测序用DNA文库作为对象进行测序。
12.根据项11所述的测序方法,其中,所述测序利用Illumina平台进行。发明效果
通过以本发明的测序用DNA文库作为对象进行测序,能够增加单轮测序反应中碱基读取复杂度、从而提高测序质量。此外,本发明的测序用DNA文库可以在匹配Illumina平台文库构建方法的前提下,不明显增加制备时间,提高测序质量和/或降低成本。
发明的具体实施方式
本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
首先,在一个方面中,本发明提供一种测序用DNA文库(本发明的测序用DNA文库),所述第一双链DNA分子包括第一DNA链,该第一DNA链从5'端起依次包括位于5'端的桥式引物DNA序列1、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列2的反向互补序列,
所述桥式引物DNA序列1和所述桥式引物DNA序列2是测序芯片上的DNA序列,所述桥式引物DNA序列1包含测序引物DNA序列1,所述桥式引物DNA序列2包含测序引物DNA序列2,
所述测序引物DNA序列1和所述测序引物DNA序列2是在对待读取DNA序列S进行读取测序时使用的引物DNA序列,
所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2是用于对包含待读取DNA序列S的目的DNA片段进行特异性扩增的引物DNA序列,
所述第一双链DNA分子还包括与所述第一DNA链完全互补的第二DNA链,
该测序用DNA文库还包括第二DNA双链分子,
所述第二双链DNA分子包括第三DNA链,该第三DNA链从5'端起依次包括位于5'端的桥式引物DNA序列2、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列1的反向互补序列,
所述第二双链DNA分子还包括与所述第三DNA链完全互补的第四DNA链。
优选地,所述测序引物DNA序列1和所述测序引物DNA序列2的长度分别为25~40个核苷酸,优选30~35个核苷酸。
优选地,所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2的长度分别为18~22个核苷酸。
在本说明书中,反向互补序列是指互补且方向相反的序列,例如5'-ATCG-3'(SEQID NO:1)的反向互补序列是5'-CGAT-3'(SEQ ID NO:2)。
优选地,所述第一DNA链、第二DNA链、第三DNA链和/或第四DNA链还可以包括标签DNA序列。
优选地,本发明的测序用DNA文库可以是扩增子DNA文库。
本发明的测序用DNA文库例如可以通过使用不同的引物组对包含待读取DNA序列S的DNA样本进行两次PCR扩增来制备。因此,在另一方面中,本发明还提供一种用于构建测序用DNA文库的方法(例如本发明的测序用DNA文库),其包括:
步骤1:使用引物组A1和引物组A2对包含待读取DNA序列S的模板进行PCR扩增,得到扩增产物;以及
步骤2:使用引物组B对所述步骤1的扩增产物进行再次PCR扩增;
其中,所述引物组A1包含引物AF1和引物AR1,所述引物AF1从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR1从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组A2包含引物AF2和引物AR2,所述引物AF2从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR2从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组B包含引物BF和引物BR,所述引物BF是桥式引物DNA序列1,所述引物BR是桥式引物DNA序列2。
优选地,所述桥式引物DNA序列1的部分序列可以包含测序引物DNA序列1,和/或,所述桥式引物DNA序列2的部分序列可以包含测序引物DNA序列2。
优选地,所述引物AF1、引物AR1、引物AF2和/或引物AR2还可以包含标签DNA序列。
优选地,所述引物BF和/或引物BR还可以包含标签DNA序列。
所述PCR扩增反应的条件可由本领域技术人员根据需要适宜选择。
在另一个方面中,本发明还提供一种用于构建测序用DNA文库(例如本发明的测序用DNA文库)的试剂盒,其包括上述引物AF1、引物AR1、引物AF2、引物AR2、引物BF和引物BR。
优选地,所述引物AF1、引物AR1、引物AF2、引物AR2、引物BF和引物BR可以分别包装。
在常规的二代测序中,桥式引物P7、P5是在文库制备过程中固定添加到DNA序列的5'和3'端的,而测序反应中Read1和Read2的测序引物在常规DNA文库制备流程中是分别和P7、P5是绑定的,而在扩增子文库中一般的设计习惯于使上游引物与P7/P5绑定在一起,下游引物与另外一端桥式引物绑定在一起。这种定向的文库制备方式导致了碱基读取的复杂度的降低。
本发明中可以分别把基因的上游引物和P7-Rd1SP和P5-Rd2SP分别绑定进行扩增,这样在进行序列读取的时候同一轮测序反应可以同时读到基因5'端和3'端的碱基,增加了这一轮反应的碱基复杂度,显著的提高了测序的质量。
本发明中可以在用一个测序引物Rd1SP/Rd2SP进行测序反应的时候,读取DNA互补双链的信息,而不是目前的单链定向信息。这种碱基复杂度较低的文库测序的时候,原理上只要通过倒置Rd1SP/Rd2SP的读取起始就可以实现。
因此,本发明还提供一种测序方法(本发明的测序方法),其中,以本发明的测序用DNA文库作为对象进行测序。所述测序可以为二代测序,优选利用Illumina平台进行。本发明的测序方法优选适用于碱基复杂度低的DNA文库(例如单基因扩增子文库、甲基化文库、限制性内切酶简单甲基化文库)的测序。
实施例
以下通过实施例对本发明进行更具体的说明。应当理解,此处所描述的实施例是用于解释本发明,而非用于限定本发明。
取8个细菌基因组DNA样本(编号:S1~S8)进行16S(V3+V4)区扩增,分别使用本发明技术与现有技术对低碱基复杂度的16S(V3+V4)区进行扩增,构建文库,对比两种技术的实验流程以及上机测序的测序质量。
实施例1(本发明技术)
分别取10ng样本S1~S8的基因组DNA作为起始样本,在反应体系中加入:10×PCRBuffer(TaKaRa),5mM dNTP Solution Set(TaKaRa),25pmol Primer F,25pmol Primer R(详见表1),1U EX taq(TaKaRa),补ddH2O至25μL。PCR反应程序设定为:95℃3min;(95℃30s,55℃30s,72℃30s)25cycles;72℃5min;4℃forever。扩增完成后进行16S扩增产物纯化:使用0.9×Ampure Beads回收纯化反应体系中的DNA,用31μL EB洗脱。使用Qubit2.0荧光计测定DNA浓度。
根据测定的浓度,将上一步样本S1~S8的扩增产物等量混合,取1ng作为PCR反应起始样本,在反应体系中加入20pmol Ann公共引物,20pmol AnnIndex-X,2×HiFi Mix(KAPA),补ddH2O至50μL。PCR反应程序设定为:95℃3min;(95℃30s,55℃30s,72℃30s,)10cycles;72℃5min;4℃forever。扩增完成后进行PCR产物纯化:使用0.9×Ampure Beads回收纯化反应体系中的DNA,用31μL EB洗脱。16S文库构建完成。文库检测:使用Agilent2100 Bioanalyzer检测文库产量,使用qPCR定量检测文库产量。
Ann公共引物序列(SEQ ID NO:3):
(5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'),
Ann Index-X引物序列(SEQ ID NO:4):
(5'-CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3')
表1
Figure BDA0001367311450000101
上机测序结果
Figure BDA0001367311450000102
Figure BDA0001367311450000111
对比例1(现有技术)
分别取10ng样本S1~S8的基因组DNA作为起始样本,在反应体系中加入:10×PCRBuffer(TaKaRa),5mM dNTP Solution Set(TaKaRa),25pmol Primer F,25pmol Primer R(详见表2),1U EX taq(TaKaRa),补ddH2O至25ul。PCR反应程序设定为:95℃3min;(95℃30s,55℃30s,72℃30s)25cycles;72℃5min;4℃forever。扩增完成后进行16S扩增产物纯化:使用0.9×Ampure Beads回收纯化反应体系中的DNA,用31μL EB洗脱。使用Qubit 2.0荧光计测定DNA浓度。
根据测定的浓度,将上一步样本S1~S8的扩增产物等量混合,取1ng作为PCR反应起始样本,在反应体系中加入20pmol Ann公共引物,20pmol Ann Index-X,2×HiFi Mix(KAPA),补ddH2O至50μL。PCR反应程序设定为:95℃3min;(95℃30s,55℃30s,72℃30s)10cycles;72℃5min;4℃forever。扩增完成后进行PCR产物纯化:使用0.9×Ampure Beads回收纯化反应体系中的DNA,用31μL EB洗脱。文库构建完成。文库检测:使用Agilent 2100Bioanalyzer检测文库产量,使用qPCR定量检测文库产量。
表2:
Figure BDA0001367311450000112
Figure BDA0001367311450000121
上机测序结果:
Figure BDA0001367311450000122
由实施例和对比例可知,对于同一个碱基复杂度低的文库,例如样本S5,本发明技术的Raw Q30Bases Rate(%)为90.78522,现有技术的Raw Q30 Bases Rate(%)为71.94701,即本发明显著提高了测序质量。
Ann公共引物序列(SEQ ID NO:3):
(5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'),
Ann Index-X(SEQ ID NO:4):
(5'-CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3')
Raw Reads:原始判读数。
Clean Reads Rate:过滤后有效读数比率。
Low-quality Reads Rate:低质量读数比率。
Raw Q30 Bases Rate:过滤前999/1000正确率碱基判读比例。
Clean Q30 Bases Rate:过滤后999/1000正确率碱基判读比例。
工业实用性
根据本发明,提供了一种能够增加单轮测序反应中碱基读取复杂度、从而提高测序质量的测序用DNA文库、该测序用DNA文库的构建方法、以及该测序用DNA文库在二代测序中的应用。
序列表
<110> 安诺优达基因科技(北京)有限公司
<120> 一种测序用DNA文库
<130> 1626SGCN
<160> 20
<170> PatentIn version 3.3
<210> 1
<211> 4
<212> DNA
<213> 人工序列
<400>
ATCG 4
<210> 2
<211> 4
<212> DNA
<213> 人工序列
<400>
CGAT 4
<210> 3
<211> 58
<212> DNA
<213> 人工序列
<400> Ann公共引物
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 58
<210> 4
<211> 64
<212> DNA
<213> 人工序列
<400> Ann Index-X
CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 64
<210> 5
<211> 45
<212> DNA
<213> 人工序列
<400> P7F-S1引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCATGCCTACGGGNGGCWGCAG 57
<210> 6
<211> 57
<212> DNA
<213> 人工序列
<400> P7F-S2引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGAGCTCCTACGGGNGGCWGCAG 57
<210> 7
<211> 57
<212> DNA
<213> 人工序列
<400> P7F-S3引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCGTGACCTACGGGNGGCWGCAG 57
<210> 8
<211> 57
<212> DNA
<213> 人工序列
<400> P7F-S4引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATCACCCTACGGGNGGCWGCAG 57
<210> 9
<211> 57
<212> DNA
<213> 人工序列
<400> P5F-S5引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTCCACTACCTACGGGNGGCWGCAG 57
<210> 10
<211> 57
<212> DNA
<213> 人工序列
<400> P5F-S6引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTATGTAGCCTACGGGNGGCWGCAG 57
<210> 11
<211> 57
<212> DNA
<213> 人工序列
<400> P5F-S7引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGCAGCCCTACGGGNGGCWGCAG 57
<210> 12
<211> 57
<212> DNA
<213> 人工序列
<400> P5F-S8引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTGATGCTCCTACGGGNGGCWGCAG 57
<210> 13
<211> 55
<212> DNA
<213> 人工序列
<400> P5R引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTGACTACHVGGGTATCTAATCC 55
<210> 14
<211> 55
<212> DNA
<213> 人工序列
<400> P7R引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACTACHVGGGTATCTAATCC 55
<210> 15
<211> 61
<212> DNA
<213> 人工序列
<400> P1-1引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCACTAGACTACHVGGGTATCTAATCC 61
<210> 16
<211> 62
<212> DNA
<213> 人工序列
<400> P1-2引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATGTAGCGACTACHVGGGTATCTAATCC 62
<210> 17
<211> 63
<212> DNA
<213> 人工序列
<400> P1-3引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGCAGCTTGACTACHVGGGTATCTAATCC 63
<210> 18
<211> 64
<212> DNA
<213> 人工序列
<400> P1-4引物
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATGCTACTGACTACHVGGGTATCTAATCC 64
<210> 19
<211> 57
<212> DNA
<213> 人工序列
<400> P2-1引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTATCATGCCTACGGGNGGCWGCAG 57
<210> 20
<211> 58
<212> DNA
<213> 人工序列
<400> P2-2引物
TACACTCTTTCCCTACACGACGCTCTTCCGATCTTGAGCTACCTACGGGNGGCWGCAG 58

Claims (13)

1.一种测序用DNA文库,其包括第一双链DNA分子,
所述第一双链DNA分子包括第一DNA链,该第一DNA链从5'端起依次包括位于5'端的桥式引物DNA序列1、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列2的反向互补序列,
所述桥式引物DNA序列1和所述桥式引物DNA序列2的一部分是测序芯片上的DNA序列,所述桥式引物DNA序列1包含测序引物DNA序列1,所述桥式引物DNA序列2包含测序引物DNA序列2,
所述测序引物DNA序列1和所述测序引物DNA序列2是在对待读取DNA序列S进行读取测序时使用的引物DNA序列,
所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2是用于对包含待读取DNA序列S的目的DNA片段进行特异性扩增的引物DNA序列,
所述第一双链DNA分子还包括与所述第一DNA链完全互补的第二DNA链,
该测序用DNA文库还包括第二DNA双链分子,
所述第二双链DNA分子包括第三DNA链,该第三DNA链从5'端起依次包括位于5'端的桥式引物DNA序列2、目的片段特异性扩增引物DNA序列1、待读取DNA序列S、目的片段特异性扩增引物DNA序列2的反向互补序列以及位于3'端的桥式引物DNA序列1的反向互补序列,
所述第二双链DNA分子还包括与所述第三DNA链完全互补的第四DNA链。
2.根据权利要求1所述的测序用DNA文库,其是扩增子DNA文库。
3.根据权利要求1所述的测序用DNA文库,其中,所述测序引物DNA序列1和所述测序引物DNA序列2的长度分别为25~40个核苷酸。
4.根据权利要求3所述的测序用DNA文库,其中,所述测序引物DNA序列1和所述测序引物DNA序列2的长度分别为30~35个核苷酸。
5.根据权利要求1所述的测序用DNA文库,其中,所述目的片段特异性扩增引物DNA序列1和所述目的片段特异性扩增引物DNA序列2的长度分别为18~22个核苷酸。
6.根据权利要求1或2所述的测序用DNA文库,其中,所述第一DNA链、第二DNA链、第三DNA链和/或第四DNA链还包括标签DNA序列。
7.一种用于构建权利要求1~5中任一项所述的测序用DNA文库的方法,其包括:
步骤1:使用引物组A1和引物组A2对包含待读取DNA序列S的模板进行PCR扩增,得到扩增产物;以及
步骤2:使用引物组B对所述步骤1的扩增产物进行再次PCR扩增;
其中,
所述引物组A1包含引物AF1和引物AR1,所述引物AF1从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR1从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组A2包含引物AF2和引物AR2,所述引物AF2从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR2从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物组B包含引物BF和引物BR,所述引物BF是桥式引物DNA序列1,所述引物BR是桥式引物DNA序列2。
8.根据权利要求7所述的方法,其中,
所述桥式引物DNA序列1的部分序列包含测序引物DNA序列1,和/或
所述桥式引物DNA序列2的部分序列包含测序引物DNA序列2。
9.根据权利要求7所述的方法,其中,所述引物AF1、引物AR1、引物AF2和/或引物AR2还包含标签DNA序列。
10.根据权利要求7所述的方法,其中,所述引物BF和/或引物BR还包含标签DNA序列。
11.一种用于构建测序用DNA文库的试剂盒,其包括:引物AF1、引物AR1、引物AF2、引物AR2、引物BF和引物BR;
所述引物AF1从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR1从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物AF2从5'端起依次包括位于5'端的桥式引物DNA序列2的部分序列和位于3'端的目的片段特异性扩增引物DNA序列1,所述引物AR2从5'端起依次包括位于5'端的桥式引物DNA序列1的部分序列和位于3'端的目的片段特异性扩增引物DNA序列2,
所述引物BF是桥式引物DNA序列1,所述引物BR是桥式引物DNA序列2。
12.一种测序方法,其中,以权利要求1~5中任一项所述的测序用DNA文库作为对象进行测序。
13.根据权利要求12所述的测序方法,其中,所述测序利用Illumina平台进行。
CN201710647896.6A 2017-08-01 2017-08-01 一种测序用dna文库 Active CN109321984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710647896.6A CN109321984B (zh) 2017-08-01 2017-08-01 一种测序用dna文库

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710647896.6A CN109321984B (zh) 2017-08-01 2017-08-01 一种测序用dna文库

Publications (2)

Publication Number Publication Date
CN109321984A CN109321984A (zh) 2019-02-12
CN109321984B true CN109321984B (zh) 2022-08-23

Family

ID=65245290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710647896.6A Active CN109321984B (zh) 2017-08-01 2017-08-01 一种测序用dna文库

Country Status (1)

Country Link
CN (1) CN109321984B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102653784A (zh) * 2011-03-03 2012-09-05 深圳华大基因科技有限公司 用于多重核酸测序的标签及其使用方法
CN103938277A (zh) * 2014-04-18 2014-07-23 中国科学院北京基因组研究所 以痕量dna为基础的二代测序文库构建方法
CN104263726A (zh) * 2014-09-25 2015-01-07 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物及扩增子测序文库的构建方法
CN104293783A (zh) * 2014-09-30 2015-01-21 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒
CN104480217A (zh) * 2014-12-26 2015-04-01 上海派森诺生物科技有限公司 一种简化基因组测序方法
CN106497926A (zh) * 2016-11-03 2017-03-15 承启医学(深圳)科技有限公司 一种用于构建微生物细菌16s rDNA可变区测序文库的扩增子引物及构建方法
CN106555226A (zh) * 2016-04-14 2017-04-05 北京京诺玛特科技有限公司 一种构建高通量测序文库的方法和试剂盒

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102653784A (zh) * 2011-03-03 2012-09-05 深圳华大基因科技有限公司 用于多重核酸测序的标签及其使用方法
CN103938277A (zh) * 2014-04-18 2014-07-23 中国科学院北京基因组研究所 以痕量dna为基础的二代测序文库构建方法
CN104263726A (zh) * 2014-09-25 2015-01-07 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物及扩增子测序文库的构建方法
CN104293783A (zh) * 2014-09-30 2015-01-21 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒
CN104480217A (zh) * 2014-12-26 2015-04-01 上海派森诺生物科技有限公司 一种简化基因组测序方法
CN106555226A (zh) * 2016-04-14 2017-04-05 北京京诺玛特科技有限公司 一种构建高通量测序文库的方法和试剂盒
CN106497926A (zh) * 2016-11-03 2017-03-15 承启医学(深圳)科技有限公司 一种用于构建微生物细菌16s rDNA可变区测序文库的扩增子引物及构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Single-Round Patterned DNA Library Microarray Aptamer Lead Identification;Jennifer A Martin等;《J Anal Methods Chem》;20150514;第2015卷;Article ID 137489第1-8页 *

Also Published As

Publication number Publication date
CN109321984A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
US11155813B2 (en) Semi-random barcodes for nucleic acid analysis
CN110409001B (zh) 一种构建捕获文库的方法和试剂盒
JP6110297B2 (ja) 高処理スクリーニング用の組合せ配列バーコード
CN106555226B (zh) 一种构建高通量测序文库的方法和试剂盒
Adey et al. Ultra-low-input, tagmentation-based whole-genome bisulfite sequencing
US20080131937A1 (en) Conversion of Target Specific Amplification to Universal Sequencing
JP2017532028A (ja) 単離されたオリゴヌクレオチドおよび核酸の配列決定におけるその使用
Ivanov et al. In-solution hybrid capture of bisulfite-converted DNA for targeted bisulfite sequencing of 174 ADME genes
US20220389416A1 (en) COMPOSITIONS AND METHODS FOR CONSTRUCTING STRAND SPECIFIC cDNA LIBRARIES
EP2611939B1 (en) Method for amplifying nucleic acids
JP6588560B2 (ja) オーバーラップするアンプリコンの選択的増幅
EP3837381A1 (en) Compositions and methods for improving library enrichment
US11859249B2 (en) Method and kit for the generation of DNA libraries for massively parallel sequencing
US20140336058A1 (en) Method and kit for characterizing rna in a composition
CN109321984B (zh) 一种测序用dna文库
CN112501249A (zh) Rna文库的制备方法、测序方法和试剂盒
CN111788316A (zh) 库制备
CN113795594A (zh) 核酸扩增和识别方法
CN114616329A (zh) 从OLIGO-DT逆转录RNA中回收TCRα和β链VDJ的探针捕获方法
CN110699428B (zh) 一种寡核苷酸库的均一化方法
WO2023050968A1 (zh) 制备dna纳米球的双链dna接头及其制备方法、试剂盒以及它们的用途
KR102187795B1 (ko) 디옥시우리딘을 이용한 차세대 염기서열 분석을 위한 라이브러리 제조 방법
WO2021166989A1 (ja) アダプター配列が付加されたdna分子を製造する方法、およびその利用
CA3218561A1 (en) Method for parallel real-time sequence analysis
JP2021182940A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 322000 1st floor, building 9, standard workshop, No.10 Gaoxin Road, Houjiang street, Yiwu City, Jinhua City, Zhejiang Province

Applicant after: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

Address before: 100176 room 701, unit 2, building 8, courtyard 88, Kechuang 6th Street, Beijing Economic and Technological Development Zone, Beijing

Applicant before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant before: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant before: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240621

Address after: Room 701, Unit 2, Building 8, No. 88 Kechuang 6th Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing, 100176

Patentee after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Country or region after: China

Patentee after: BEIJING ANNOROAD MEDICAL LABORATORY Co.,Ltd.

Address before: 322000 1st floor, building 9, standard workshop, No.10 Gaoxin Road, Houjiang street, Yiwu City, Jinhua City, Zhejiang Province

Patentee before: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Country or region before: China

Patentee before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Patentee before: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

TR01 Transfer of patent right