CN113502287A - 分子标签接头及测序文库的构建方法 - Google Patents
分子标签接头及测序文库的构建方法 Download PDFInfo
- Publication number
- CN113502287A CN113502287A CN202110721385.0A CN202110721385A CN113502287A CN 113502287 A CN113502287 A CN 113502287A CN 202110721385 A CN202110721385 A CN 202110721385A CN 113502287 A CN113502287 A CN 113502287A
- Authority
- CN
- China
- Prior art keywords
- base sequence
- fixed base
- sequence
- strand
- linker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 78
- 238000010276 construction Methods 0.000 title claims abstract description 19
- 230000000295 complement effect Effects 0.000 claims abstract description 41
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 31
- 238000000137 annealing Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000011049 filling Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 5
- 239000000047 product Substances 0.000 description 59
- 108020004414 DNA Proteins 0.000 description 32
- 238000012937 correction Methods 0.000 description 11
- 230000035772 mutation Effects 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 239000008186 active pharmaceutical agent Substances 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 238000007259 addition reaction Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了分子标签接头和测序文库的构建方法。该分子标签接头包括第一接头和第二接头,第一接头包括:第一链,第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列;第二链,第二链包括从5′端依次的第二固定碱基序列和碱基T;其中,第一链和第二链通过第一固定碱基序列和第二固定碱基序列的反向互补配对而结合;第二接头包括第二引物结合序列,第二引物结合序列与第一引物结合序列至少部分反向互补。采用该分子标签接头进行文库构建时,测序数据中没有互补链的聚簇的占比显著降低,有效聚簇的数量得到提高,达到了提高测序数据利用率、降低测序成本、提高检测灵敏度和测序深度的效果。
Description
技术领域
本申请涉及测序技术领域,尤其是涉及分子标签接头及测序文库的构建方法。
背景技术
循环肿瘤DNA(circulating tumor DNA,ctDNA)是指坏死或凋亡的肿瘤细胞释放到外周血中的肿瘤DNA片段。由于ctDNA包含了肿瘤特异性的表观遗传信息,利用ctDNA来实时检测肿瘤状态以避免穿刺手术给患者带来的痛苦也就成为了一种可行的非侵入式检测方法。但是,肿瘤的异质性使得外周血中ctDNA的含量极少,其突变频率一般也在1%以下,属于低频突变。因此,ctDNA液体活检虽然是目前精准肿瘤学应用中的热点,但如何准确检测仍然是亟待解决的问题。
下一代基因测序技术(NGS)是目前应用最广的测序技术,具有测序深度高、通量大、准确率高、灵敏度好等优势,然而NGS应用于ctDNA低频突变检测同样存在一定的技术难点。一方面,NGS不可避免地存在测序误差,单碱基错误率一般在0.1~1%之间;而另一方面,测序文库构建一般使用高保真酶进行PCR扩增,也存在10-6左右的复制错误率,并且随着PCR循环数增多而增大。这两方面的因素导致ctDNA低频突变测序分析时存在较大的背景噪音,特别是在0.1%及以下检测限的情况下,难以区分建库及测序过程中引入的错误与ctDNA本身的突变,容易出现假阳性结果。
目前,主要通过建库连接步骤,采用带有分子标签的接头,将待测核酸分子标记一个唯一可识别的序列编码,通过该唯一序列编码来区分真正的突变与建库及测序过程中引入的错误,实现低频突变的检测。带有分子标签的接头主要包括两类:一类是接头双链的随机碱基区域(用作分子标签)互补配对的,一类是接头双链的随机碱基区域不互补配对的。采用随机碱基区域互补配对的接头标记得到的最终测序数据,需要根据分子标签和起始位置进行互补双链的链间校正,随机碱基区域不互补配对的接头,同一模板DNA两条双链之间的分子标签没有对应关系,无法进行互补双链链间校正,而随机碱基区域互补配对的接头,可以进行链间校正。链间校正可以在链内校正的基础上进一步去除建库及测序过程引入的错误,识别原始模板携带极低频突变,提高ctDNA检测灵敏度。因而,选择能够进行链间校正的接头是提高检测准确性的有效方式。
链间校正时,需要来自同一原始DNA分子的两个聚簇同时存在,要求报证DNA双链同时被加上完整接头。然而现有的分子标签引入方法是在加接头时,直接连接上双链接头。因此,大量模板存在其中一条链连上完整接头、而另一条链没有完整接头的情况,这导致最终的测序数据中存在大量没有互补链聚簇的数据,占用了测序数据,影响了测序深度。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种有效提高测序深度的分子标签接头。
本申请的第一方面,提供分子标签接头,该分子标签接头包括第一接头和第二接头,第一接头包括:
第一链,第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列;
第二链,第二链包括从5′端依次的第二固定碱基序列和碱基T;
其中,第一链和第二链通过第一固定碱基序列和第二固定碱基序列的反向互补配对而结合;
第二接头包括第二引物结合序列,第二引物结合序列与第一引物结合序列至少部分反向互补。
根据本申请实施例的分子标签接头,至少具有如下有益效果:
采用该分子标签接头进行文库构建时,第一接头和第二接头必须报证连接上形成完整的接头才会开始第二轮的延伸与连接,而第一接头和第二接头的第一轮连接产物在第二轮连接失败时,其产物无法进入下一步扩增实验。从而使得测序数据中没有互补链的聚簇的占比显著降低,有效聚簇的数量得到提高,达到了提高测序数据利用率、降低测序成本、提高检测灵敏度和测序深度的效果。
在本申请的一些实施方式中,第一固定碱基序列和所述第二固定碱基序列的长度为6~12nt。
在本申请的一些实施方式中,第一固定碱基序列和所述第二固定碱基序列为任意碱基序列。其中,任意碱基序列是指对序列中碱基的种类和顺序无任何限定性要求。第一固定碱基序列和第二固定碱基序列作为任意碱基序列与随机碱基序列的区别在于,多个不同的分子标签接头的第一固定碱基序列和第二固定碱基序列为相同序列,而随机碱基序列作为分子标签在多个不同的分子标签接头中是不同的,从而在与DNA片段结合时,将不同的DNA片段区分开,使具有相同的随机碱基序列的归为同一聚簇。
在本申请的一些实施方式中,随机碱基序列的长度为8~16nt。
在本申请的一些实施方式中,第一引物结合序列包括从5′端依次的第三固定碱基序列和第四固定碱基序列。
在本申请的一些实施方式中,第二引物结合序列包括从5′端依次的第五固定碱基序列和第六固定碱基序列,第六固定碱基序列与第三固定碱基序列反向互补。
在本申请的一些实施方式中,第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT;或第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA,第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT。
本申请的第二方面,提供试剂盒,该试剂盒包括上述的分子标签接头。该试剂盒包括但不限于建库试剂盒、检测试剂盒等。
本申请的第三方面,提供测序文库的构建方法,该构建方法包括以下步骤:
提供模板、前述的第一接头、第二接头和建库引物;
使第一接头和模板接触并相互连接,得到第一连接产物;
使第一连接产物与第二接头结合,并开始延伸反应,补齐随机碱基序列在第二链上的互补序列,形成第二连接产物;
使第二连接产物中的第二固定碱基序列变性脱落,继续延伸反应,补齐第一固定碱基序列在第二链上的互补序列,并与模板连接,形成第三连接产物;
使第三连接产物与建库引物接触,扩增得到测序文库。
在本申请的一些实施方式中,形成第二连接产物过程中的反应温度为10~30℃,形成第三连接产物过程中的反应温度为60~72℃。
本申请的第四方面,提供测序文库,该测序文库采用前述的构建方法构建得到。
本申请的第五方面,提供测序方法,该测序方法采用上述的测序文库进行测序。
本申请的第六方面,提供前述分子标签接头的制备方法,该制备方法包括合成第一接头的步骤,该步骤如下:
合成第一链和第二链;
将第一链和第二链退火,得到第一接头。
本申请的第七方面,提供前述分子标签接头在制备检测血浆中循环肿瘤DNA的试剂中的应用。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
图1是本申请的一个实施例中的第一接头的示意图。
图2是本申请的一个实施例中的第二接头的示意图。
图3是本申请的一个实施例中的测序文库构建方法中第一连接产物的示意图。
图4是本申请的一个实施例中的测序文库构建方法中形成第二连接产物的过程示意图。
图5是本申请的一个实施例中的测序文库构建方法中形成第三连接产物的过程示意图。
具体实施方式
以下将结合实施例对本申请的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本申请的目的、特征和效果。显然,所描述的实施例只是本申请的一部分实施例,而不是全部实施例,基于本申请的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本申请保护的范围。
下面详细描述本申请的实施例,描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。
在本申请的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本申请的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
参考图1,示出了本申请一个实施例中分子标签接头的第一接头的第一链的示意图,第一链包括从5′端起依次的第一固定碱基序列A1、随机碱基序列A2和第一引物结合序列,第二链包括从5′端起依次的第二固定碱基序列B1和突出的碱基T。其中,第一固定碱基序列A1和第二固定碱基序列B1反向互补,从而使第一链和第二链相互结合。在其中一些具体的实施方式中,第一固定碱基序列和第二固定碱基序列的长度为6~12nt,而对于第一固定碱基序列和第二固定碱基序列的碱基种类和具体序列不做要求。在其中一些具体的实施方式中,随机碱基序列的长度为8~16nt,同样,不对其碱基种类和具体序列做特定要求。可以理解的是,在采用上述方案进行建库时,随机碱基序列在第一接头中作为分子标签使用,用于区分与分子标签接头连接的不同的DNA片段。在本申请的具体实施方式中,分子标签接头还包括第二接头,第二接头上包含第二引物结合序列,第二引物结合序列能够与第一引物结合序列至少部分反向互补从而结合。
在其中一些具体实施方式中,第一接头的制备过程包括合成第一链和第二链,然后使第一链和第二链发生退火从而形成双链接头。退火温度和退火反应体系可以根据本领域的常识获得。显然,相比于现有的接头按随机碱基序列不同和组合,逐一合成退火,该制备方法无需单独额外的退火引物,操作简单,成本较低;而相比于合成包含随机碱基区域、内切酶识别位点、固定碱基区域的单链,再用反向引物延申形成随机碱基区域互补的双链接头的方法仅需合成与退火两个步骤即可完成接头制备,操作简单,且可用于双轮(单链链内、互补双链链间)校正。
参考图2,为本申请的一些具体实施方式中的第二接头的示意图,结合图1,在其中一些具体实施方式中,第一引物结合序列包括从5′端起依次的第三固定碱基序列A3和第四固定碱基序列A4,第二引物结合序列包括从5′端起依次的第五固定碱基序列B4和第六固定碱基序列B3,第六固定碱基序列B3与第三固定碱基序列A3反向互补,从而可以使第一接头与第二接头相互连接。在其中一些具体实施方式中,第三固定碱基序列和第六固定碱基序列的长度为8~13nt,第四固定碱基序列的长度为21~24nt,而第五固定碱基序列的长度为20~30nt。第一引物结合序列和第二引物结合序列(或称为测序引物相关序列,readprimer site)根据不同的测序平台而有不同的要求。例如,对于Illumina平台而言,第三固定碱基序列可以是:AGATCGGAAGAGC,第四固定碱基序列可以是:ACACGTCTGAACTCCAGTCAC,即第一引物结合序列可以是AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC;第五固定碱基序列可以是:ACACTCTTTCCCTACACGAC,第六固定碱基序列可以是:GCTCTTCCGATCT,即第二引物结合序列可以是ACACTCTTTCCCTACACGACGCTCTTCCGATCT。对于MGI平台而言,第三固定碱基序列可以是:AAGTCGGA,第四固定碱基序列可以是:GGCCAAGCGGTCTTAGGAAGACAA,即第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(SEQ ID No.3);第五固定碱基序列可以是:TTGTCTTCCTAAGGAACGACATGGCTACGA,第六固定碱基序列可以是:TCCGACTT,即第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT(SEQ ID No.4)。但本申请实施例中的第一引物结合序列和第二引物结合序列不限于上述测序平台的序列,其它如ion torrent等也可以选择符合其要求的序列作为对应的引物结合序列参与上述分子标签接头以及测序文库的构建。
参考图3~图5,示出了使用该分子标签接头的建库方法,具体步骤为:
第一步连接反应:将模板DNA与第一接头连接,从而使模板DNA的两端都连接有第一接头,得到第一连接产物。
第二步连接反应:使第一连接产物与第二接头结合,并开始延伸反应,补齐随机碱基序列在第二链上的互补序列,形成第二连接产物;使第二连接产物中的第二固定碱基序列变性脱落,继续延伸反应,补齐第一固定碱基序列在第二链上的互补序列,并与模板连接,形成第三连接产物;
使第三连接产物与建库引物接触,扩增得到测序文库。
参考图3,为第一步连接反应得到的第一连接产物的示意图,在模板DNA的两端分别各连接有第一接头。可以理解的是,模板DNA与第一接头连接的反应需要提供相应的连接酶和合适的反应条件。其中,模板DNA可以是指从样本中直接或间接分离得到的DNA,并且在连接反应前,经过片段化、末端修复和加A等常规步骤处理。
参考图4,为第二步连接反应中形成第二连接产物的反应过程的示意图,第一连接产物和第二接头通过第三固定碱基序列A3与第六固定碱基序列B3的反向互补配对而结合,使第二接头进入到第二连接产物的第二链上,并开始延伸反应,补齐第一固定碱基序列A2在第二链上的互补序列,即在第二链上产生分子标签,形成第二连接产物。可以理解的是,第一连接产物与第二接头的结合和延伸反应需要提供相应的酶和合适的反应条件。
参考图5,为第二步连接反应中形成第三连接产物的反应过程的示意图,第二连接产物中的第二固定碱基序列B1变性脱落(如图5中的a),随后继续延伸反应,补齐第一固定碱基序列A1在第二链上的互补序列(如图5中的b),并与模板连接(如图5中的c),形成第三连接产物。在其中一些具体实施方式中,第二接头通过反向互补配对进入到第二连接产物的第二链上,最终形成的第三连接产物上为Y字型的分子标签接头。
可以理解的是,第二固定碱基序列B1的变性脱落、延伸和连接反应需要提供相应的酶和合适的反应条件。
在其中一些具体实施方式中,形成第一连接产物以及形成第二连接产物过程中的反应温度为10~30℃,形成第三连接产物过程中的反应温度为60~72℃,以使第二固定碱基序列B1能够变性脱落并进一步延伸和连接。而所选择的连接酶、聚合酶等酶需要在上述温度范围内具有良好的反应活性。
在本申请的一些具体实施方式中,还提供一种测序文库,该测序文库采用上述方法构建得到。
在本申请的一些具体实施方式中,还提供一种测序方法,该测序方法采用上述的测序文库进行测序,得到相应的测序数据。在其中一些具体实施方式中,对测序数据采用本领域熟知的一些方法进行生物信息学分析,具体可以是:根据测序数据质量值,过滤掉低质量值的数据,得到高质量值的数据;与人的基因组序列进行比对,去掉比对不上和同时比对到人基因组两个以上位置的数据,得到唯一比对的数据;与探针杂交区域比对,得到目标区域数据。
在其中一些具体实施方式中,目标区域数据的校正方法为双重校正,具体步骤如下:
①根据测序序列的分子标签以及在染色体上的起始位置,将测序数据进行聚簇,分子标签、起始位置一致,测序方向一致,则来自同一原始DNA模板的同一条DNA单链,存在3条以上满足此条件的序列,归集为一个聚簇;
②一个聚簇内的测序数据,由于来源于同一条DNA单链,理论上序列完全一致,进行单链链内校正;
③分子标签、起始位置一致,且测序方向相反所对应的两个聚簇,为来自于同一原始DNA分子互补配对的两条不同DNA单链,理论上序列完全一致,测序方向相反,可进一步进行双链链间校正,以进一步去除建库及测序过程引入的错误,识别原始模板携带极低频突变,提高检测灵敏度;而进行两轮校正后的测序数据进行变异分析;对变异数据进行解读,从而得出样本中目标基因实际的突变情况。
而在采用本申请所提供的分子标签接头进行建库时,第一轮连接后,在第二步连接反应中,包括第一连接产物与第二接头结合延伸形成第二连接产物、进一步延伸形成第三连接产物两个步骤,只有在第一连接产物与第二接头连接形成互补链的情况下,才能进行第二部分的进一步延伸与连接。而没有连接第二接头形成完整的分子标签接头导致第二轮连接失败时,无法与建库引物发生扩增反应建库。从而可以使测序数据中,没有互补链的聚簇的占比显著降低,有效聚簇的数量得到提高,达到提高测序数据利用率、降低测序成本、提高检测灵敏度的效果。
实施例1
本实施例提供一种分子标签接头,该分子标签接头包括第一接头和第二接头,第一接头包括第一链和第二链,第一链、第二链和第二接头的序列如表1所示:
表1.分子标签接头序列
第一链中,CGTCGGA为第一固定碱基序列,NNNNNNNN为随机碱基序列,AGATCGGAAGAGC为第三固定碱基序列,ACACGTCTGAACTCCAGTCAC为第四固定碱基序列,5′Phos表示5′磷酸化修饰;3′端无羟基。
第二链中,TCCGACG为第二固定碱基序列,与第一固定碱基序列反向互补,3′端无羟基。
第二接头中,ACACTCTTTCCCTACACGAC为第五固定碱基序列,GCTCTTCCGATCT为第六固定碱基序列,第六固定碱基序列和第三固定碱基序列反向互补,3′端有羟基。
第一接头的制备方法如下:
按照表2配置接头退火反应体系,取配好的反应体系,按表3程序进行退火。
表2.接头退火反应体系
10mM Tris,50mM NaCl,1mM EDTA | 20μl |
第一链(100μM) | 15μl |
第二链(100μM) | 15μl |
H<sub>2</sub>O | 50μl |
总体积 | 100μl |
表3.退火程序
序号 | 温度 | 时间 | 步骤 |
1 | 95℃ | 2分钟 | 变性 |
2 | 每30秒下降0.5℃至20℃ | 60分钟 | 退火 |
3 | 4℃ | 保持 | 暂存 |
实施例2
本实施例提供一种血浆DNA测序文库,该测序文库的构建方法如下:
1)血浆DNA提取
取3mL血浆,使用QIAamp Circulating Nucleic Acid Kit(货号:55114)提取血浆DNA,60μl洗脱,取3μl样本,使用QubitTM1X dsDNA HS Kit(货号:Q33230)进行定量。
2)末端修复和加A
取步骤1)中定量后的血浆DNA,按表4配制末端修复和加A的反应体系后,按表5中的程序进行末端修复和加A。
表4.末端修复和加A反应体系
血浆DNA | 35μl |
10×TA Buffer | 5μl |
T4 DNA聚合酶 | 1μl |
Klenow酶 | 0.5μl |
T4 DNA PNK | 1μl |
Taq酶 | 1μl |
10mM dNTP | 1μl |
100mM dATP | 1μl |
H2O | 4.5μl |
总体积 | 50μl |
表5.末端修复和加‘A’程序
序号 | 温度 | 时间 |
1 | 20℃ | 30分钟 |
2 | 65℃ | 30分钟 |
3 | 4℃ | 保持 |
3)连接反应1
取步骤2)的反应产物以及实施例1中退火得到的第一接头,按照表6配制得到连接反应1体系后,按表7程序进行连接反应1,使得加A后的双链模板DNA的两端分别连接上第一接头,得到第一连接产物。
表6.连接反应1体系
表7.连接反应1程序
序号 | 温度 | 时间 |
1 | 20℃ | 15分钟 |
2 | 4℃ | 保持 |
4)磁珠纯化
取步骤3)中的第一连接产物和AMPure XP(货号:A63882)50μl,进行磁珠纯化,洗脱至32μl,得到纯化后的第一连接产物。
5)连接反应2
取步骤5)中纯化后的第一连接产物和实施例1中的第二接头,按照表8配制连接反应2体系后,按表9程序进行连接反应2。其中,20℃条件下,第一连接产物与第二接头通过第三固定碱基序列和第六固定碱基的反向互补配对而结合,使第二接头位于第一连接产物的第二链上,在T4 DNA聚合酶作用下开始延伸反应,补齐第一链中随机碱基序列在第二链上的互补序列,形成第二连接产物。65℃条件下,第二连接产物中的第二链上的第二固定碱基序列变性脱落,在Kapa Hifi高保真酶的作用下,第二链进一步延伸,补齐第一固定碱基序列在所述第二链上的互补序列,同时,延伸完成后在Taq DNA连接酶的作用下与模板连接,形成第三连接产物。
表8.连接反应2体系
步骤4)纯化产物 | 30μl |
10×连接缓冲液 | 4μl |
第二接头(10uM) | 5μl |
T4 DNA聚合酶 | 1μl |
Kapa Hifi高保真酶 | 1μl |
Taq DNA连接酶 | 3μl |
总体积 | 40μl |
表9.连接反应2程序
6)磁珠纯化
取步骤5)中的第三连接产物和AMPure XP(货号:A63882)50μl,进行磁珠纯化,洗脱至22μl,得到纯化后的第三连接产物。
7)PCR扩增
取步骤6)中纯化后的第三连接产物以及建库引物对、按照表10中配制PCR反应体系,并根据表11中的程序进行扩增得到扩增产物。
表10.PCR反应体系
步骤6)纯化产物 | 20μl |
2×Kapa Hifi Mix | 25μl |
建库上游引物(10μM) | 2.5μl |
建库下游引物(10μM) | 2.5μl |
总体积 | 50μl |
表11.PCR程序
建库上游引物和建库下游引物分别如下所示:
AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGAC(SEQ IDNo.4);其中,3′端有羟基;NNNNNNNN为文库标签2(Index5),用于数据拆分,区分不同文库;
CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTGACTGGAGTTCAGACGTGT(SEQ ID No.5);其中,3′端有羟基;NNNNNNNN为文库标签1(Index7),用于数据拆分,区分不同文库。
8)纯化及定量
取步骤7)中的PCR扩增产物与AMPure XP(货号:A63882)50μl,进行磁珠纯化,洗脱至22μl,得到纯化后的扩增产物。
9)杂交捕获及测序
取步骤8)中纯化后的扩增产物,进行杂交捕获,进行二轮扩增后得到测序文库,测序文库经检测合格后使用Illumina高通量测序平台上机测序。
10)生信分析
将测序得到的数据,按照生物信息学分析流程进行分析。
对比实验
分别取实施例2和对比例1所提供的建库和测序方法进行实验,不同样本截取同等原始测序深度15000×,生信分析中,进行双向分子标签校准,统计双向分子标签平均深度。
其中,对比例1为KAPA HyperPrep试剂盒,是目前血浆DNA建库最好的商业化试剂盒,KAPA HyperPrep试剂盒建库严格按照说明书进行。
最终结果如表12所示:
表12.不同双向分子标签测序方法平均深度(DS Family)
血浆DNA投入量 | 5ng | 10ng | 20ng |
实施例2 | 387 | 768 | 865 |
对比例1 | 356 | 521 | 456 |
由表12中的结果可知,本申请实施例所提供的方案可显著提高双向分子标签平均深度,并且受血浆DNA投入量的影响。在15000×原始测序深度下,在投入量为5ng时,数据量饱和,相对于对比例1,本发明方案提高DS Family不明显;在投入量为10ng时,实施例2的方案可明显提高DS Family;在投入量为20ng时,由于数据量不够,对比例1建库相对10ng时反而降低了DS Family,而实施例2的方案依旧可以进一步提高DS Family。所以,本申请所提供的分子标签接头和建库方法可以显著改善数据利用率,提高检测灵敏度。
上面结合实施例对本申请作了详细说明,但是本申请不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种变化。此外,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
SEQUENCE LISTING
<110> 深圳市核子基因科技有限公司
<120> 分子标签接头及测序文库的构建方法
<130> 1
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 49
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (8)..(15)
<223> n =a或g或c或t
<400> 1
cgtcggannn nnnnnagatc ggaagagcac acgtctgaac tccagtcac 49
<210> 2
<211> 33
<212> DNA
<213> 人工序列
<400> 2
acactctttc cctacacgac gctcttccga tct 33
<210> 3
<211> 32
<212> DNA
<213> 人工序列
<400> 3
aagtcggagg ccaagcggtc ttaggaagac aa 32
<210> 4
<211> 38
<212> DNA
<213> 人工序列
<400> 4
ttgtcttcct aaggaacgac atggctacga tccgactt 38
Claims (10)
1.分子标签接头,其特征在于,包括第一接头和第二接头,所述第一接头包括:
第一链,所述第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列;
第二链,所述第二链包括从5′端依次的第二固定碱基序列和碱基T;
其中,所述第一链和所述第二链通过所述第一固定碱基序列和所述第二固定碱基序列的反向互补配对而结合;
所述第二接头包括第二引物结合序列,所述第二引物结合序列与所述第一引物结合序列至少部分反向互补;
优选的,所述第一固定碱基序列和所述第二固定碱基序列的长度为6~12nt;
优选的,所述第一固定碱基序列和所述第二固定碱基序列为任意碱基序列;
优选的,所述随机碱基序列的长度为8~16nt。
2.根据权利要求1所述的分子标签接头,其特征在于,所述第一引物结合序列包括从5′端依次的第三固定碱基序列和第四固定碱基序列。
3.根据权利要求2所述的分子标签接头,其特征在于,所述第二引物结合序列包括从5′端依次的第五固定碱基序列和第六固定碱基序列,所述第六固定碱基序列与所述第三固定碱基序列反向互补。
4.根据权利要求3所述的分子标签接头,其特征在于,所述第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,所述第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT;或所述第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA,所述第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT。
5.试剂盒,其特征在于,包括权利要求1至4任一项所述的分子标签接头。
6.测序文库的构建方法,其特征在于,包括以下步骤:
提供模板、建库引物和权利要求3或4所述的分子标签接头;
使第一接头和所述模板接触并相互连接,得到第一连接产物;
使所述第一连接产物与第二接头结合,并开始延伸反应,补齐随机碱基序列在第二链上的互补序列,形成第二连接产物;
使所述第二连接产物中的第二固定碱基序列变性脱落,继续延伸反应,补齐第一固定碱基序列在所述第二链上的互补序列,并与所述模板连接,形成第三连接产物;
使所述第三连接产物与建库引物接触,扩增得到测序文库;
优选的,形成所述第二连接产物过程中的反应温度为10~30℃,形成所述第三连接产物过程中的反应温度为60~72℃。
7.测序文库,其特征在于,采用权利要求6所述的构建方法构建得到。
8.测序方法,其特征在于,采用权利要求7所述的测序文库进行测序。
9.权利要求1所述分子标签接头的制备方法,其特征在于,包括合成第一接头的步骤,所述步骤如下:
合成第一链和第二链;
将所述第一链和所述第二链退火,得到所述第一接头。
10.权利要求1至4任一项所述的分子标签接头在制备检测血浆中循环肿瘤DNA的试剂中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721385.0A CN113502287A (zh) | 2021-06-28 | 2021-06-28 | 分子标签接头及测序文库的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110721385.0A CN113502287A (zh) | 2021-06-28 | 2021-06-28 | 分子标签接头及测序文库的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113502287A true CN113502287A (zh) | 2021-10-15 |
Family
ID=78011321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110721385.0A Pending CN113502287A (zh) | 2021-06-28 | 2021-06-28 | 分子标签接头及测序文库的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113502287A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114032288A (zh) * | 2021-12-10 | 2022-02-11 | 北京吉因加医学检验实验室有限公司 | 一种试剂盒及其制备测序用靶核苷酸的方法 |
CN114807125A (zh) * | 2022-05-20 | 2022-07-29 | 纳昂达(南京)生物科技有限公司 | 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 |
CN115786459A (zh) * | 2022-11-10 | 2023-03-14 | 江苏先声医疗器械有限公司 | 一种应用于高通量测序检测实体瘤微小残留病的方法 |
WO2023092601A1 (zh) * | 2021-11-29 | 2023-06-01 | 京东方科技集团股份有限公司 | Umi分子标签及其应用、接头、接头连接试剂及试剂盒和文库构建方法 |
WO2023137667A1 (zh) * | 2022-01-20 | 2023-07-27 | 深圳华大智造科技股份有限公司 | 一种接头及其在构建dnb文库中的应用 |
WO2024098178A1 (zh) * | 2022-11-07 | 2024-05-16 | 深圳华大智造科技股份有限公司 | 制备dna纳米球的反应体系及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108517567A (zh) * | 2018-04-20 | 2018-09-11 | 江苏康为世纪生物科技有限公司 | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 |
US20190218606A1 (en) * | 2018-01-18 | 2019-07-18 | Omigen (hangzhou) Inc. | Methods of reducing errors in deep sequencing |
CN110248675A (zh) * | 2017-01-27 | 2019-09-17 | 合成Dna技术公司 | 利用竞争性链置换构建下一代测序(ngs)文库 |
CN111041026A (zh) * | 2019-12-26 | 2020-04-21 | 北京优迅医学检验实验室有限公司 | 一种高通量测序用核酸接头和文库构建方法 |
-
2021
- 2021-06-28 CN CN202110721385.0A patent/CN113502287A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110248675A (zh) * | 2017-01-27 | 2019-09-17 | 合成Dna技术公司 | 利用竞争性链置换构建下一代测序(ngs)文库 |
US20190218606A1 (en) * | 2018-01-18 | 2019-07-18 | Omigen (hangzhou) Inc. | Methods of reducing errors in deep sequencing |
CN108517567A (zh) * | 2018-04-20 | 2018-09-11 | 江苏康为世纪生物科技有限公司 | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 |
CN111041026A (zh) * | 2019-12-26 | 2020-04-21 | 北京优迅医学检验实验室有限公司 | 一种高通量测序用核酸接头和文库构建方法 |
Non-Patent Citations (1)
Title |
---|
AMANDA RAINE 等: "SPlinted Ligation Adapter Tagging (SPLAT), a novel library preparation method for whole genome bisulphite sequencing", 《NUCLEIC ACIDS RESEARCH》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023092601A1 (zh) * | 2021-11-29 | 2023-06-01 | 京东方科技集团股份有限公司 | Umi分子标签及其应用、接头、接头连接试剂及试剂盒和文库构建方法 |
CN114032288A (zh) * | 2021-12-10 | 2022-02-11 | 北京吉因加医学检验实验室有限公司 | 一种试剂盒及其制备测序用靶核苷酸的方法 |
WO2023137667A1 (zh) * | 2022-01-20 | 2023-07-27 | 深圳华大智造科技股份有限公司 | 一种接头及其在构建dnb文库中的应用 |
CN114807125A (zh) * | 2022-05-20 | 2022-07-29 | 纳昂达(南京)生物科技有限公司 | 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 |
CN114807125B (zh) * | 2022-05-20 | 2023-09-12 | 纳昂达(南京)生物科技有限公司 | 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 |
WO2024098178A1 (zh) * | 2022-11-07 | 2024-05-16 | 深圳华大智造科技股份有限公司 | 制备dna纳米球的反应体系及其应用 |
CN115786459A (zh) * | 2022-11-10 | 2023-03-14 | 江苏先声医疗器械有限公司 | 一种应用于高通量测序检测实体瘤微小残留病的方法 |
CN115786459B (zh) * | 2022-11-10 | 2024-03-15 | 江苏先声医疗器械有限公司 | 一种应用于高通量测序检测实体瘤微小残留病的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113502287A (zh) | 分子标签接头及测序文库的构建方法 | |
CN108893466B (zh) | 测序接头、测序接头组和超低频突变的检测方法 | |
CN110036117B (zh) | 通过多联短dna片段增加单分子测序的处理量的方法 | |
CN106555226B (zh) | 一种构建高通量测序文库的方法和试剂盒 | |
US9745614B2 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
US11155855B2 (en) | Single stranded circular DNA libraries for circular consensus sequencing | |
CN111471754B (zh) | 一种通用型高通量测序接头及其应用 | |
EP3532635B1 (en) | Barcoded circular library construction for identification of chimeric products | |
CN111936635B (zh) | 用于单分子测序的单链环状dna模板的产生 | |
CN107075513A (zh) | 分离的寡核苷酸及其在核酸测序中的用途 | |
CN118421620A (zh) | 利用竞争性链置换构建下一代测序(ngs)文库 | |
CN110869515B (zh) | 用于基因组重排检测的测序方法 | |
CN111801427B (zh) | 用于单分子的单链环状dna模板的产生 | |
KR20170133270A (ko) | 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도 | |
AU2021219794A1 (en) | Methods and materials for assessing nucleic acids | |
CN116162686A (zh) | 肠癌相关基因高通量扩增子文库的制备方法、多重pcr引物对及应用 | |
JP2015500012A (ja) | 組成物中のrnaを特徴づける方法およびキット | |
CN108359723B (zh) | 一种降低深度测序错误的方法 | |
CN113913493A (zh) | 一种靶基因区域快速富集方法 | |
WO2018081666A1 (en) | Methods of single dna/rna molecule counting | |
CN112795990B (zh) | 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头 | |
CN112805380B (zh) | 制备用于测序的模块化和组合核酸样品的系统和方法 | |
CN110168087B (zh) | Dna标签及其应用 | |
CN118703629A (zh) | 一种tfeb融合基因突变的探针库、检测方法及一种试剂盒 | |
CN117568447A (zh) | 一种构建多重pcr靶向测序文库的方法及试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211015 |