CN117757895A - 一种单链dna文库构建试剂盒及其应用 - Google Patents
一种单链dna文库构建试剂盒及其应用 Download PDFInfo
- Publication number
- CN117757895A CN117757895A CN202211168289.9A CN202211168289A CN117757895A CN 117757895 A CN117757895 A CN 117757895A CN 202211168289 A CN202211168289 A CN 202211168289A CN 117757895 A CN117757895 A CN 117757895A
- Authority
- CN
- China
- Prior art keywords
- sequence
- stranded dna
- library construction
- dna library
- adaptor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020004414 DNA Proteins 0.000 title claims abstract description 145
- 102000053602 DNA Human genes 0.000 title claims abstract description 109
- 108020004682 Single-Stranded DNA Proteins 0.000 title claims abstract description 103
- 238000010276 construction Methods 0.000 title claims abstract description 78
- 238000012163 sequencing technique Methods 0.000 claims abstract description 53
- 230000003321 amplification Effects 0.000 claims abstract description 50
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000006243 chemical reaction Methods 0.000 claims abstract description 24
- 230000000903 blocking effect Effects 0.000 claims abstract description 17
- 125000006850 spacer group Chemical group 0.000 claims abstract description 14
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 9
- 239000012634 fragment Substances 0.000 claims abstract description 9
- 238000009396 hybridization Methods 0.000 claims abstract description 6
- 238000005096 rolling process Methods 0.000 claims description 26
- 230000000295 complement effect Effects 0.000 claims description 16
- 108090000623 proteins and genes Proteins 0.000 claims description 7
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 3
- 108091034117 Oligonucleotide Proteins 0.000 claims description 3
- 230000006862 enzymatic digestion Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000012408 PCR amplification Methods 0.000 abstract description 6
- 238000009825 accumulation Methods 0.000 abstract description 2
- 238000007363 ring formation reaction Methods 0.000 abstract description 2
- 238000002156 mixing Methods 0.000 description 11
- 239000000203 mixture Substances 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 7
- 239000011324 bead Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 108091028649 Multicopy single-stranded DNA Proteins 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 230000036438 mutation frequency Effects 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 108020000992 Ancient DNA Proteins 0.000 description 2
- 108020004638 Circular DNA Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000002077 nanosphere Substances 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种单链DNA文库构建试剂盒及其应用、单链DNA文库构建方法及其应用。所述单链DNA文库构建试剂盒包括所述单链DNA文库构建接头、阻隔序列、序列e和序列f以及杂交试剂、连接试剂、RCA扩增体系和PCR反应扩增体系。所述单链DNA文库构建接头包括间隔序列‑随机序列‑双链结构‑随机序列‑间隔序列;或者间隔序列‑随机序列‑双链结构;或者双链结构‑随机序列‑间隔序列。本公开通过设计特定的测序接头结构使其适用于单链DNA片段的环化、后续基于RCA原理的靶标放大以及双链文库的扩增,解决了现有单链建库技术效率低以及存在PCR扩增错误累积的问题。
Description
序列表
本申请包括以ST.26的XML格式电子提交的序列表,在此通过引用将其全部并入。上述ST.26的XML副本创建于2022年09月14日,名为012231649_sequence_listing_20220914.xml,大小为11kb。
技术领域
本发明涉及生物测序技术领域,具体涉及一种单链DNA文库构建试剂盒、单链DNA文库构建方法及其应用。
背景技术
下一代测序技术(Next Generation Sequencing,NGS),是对传统Sanger测序(双脱氧法,被称为一代测序技术)革命性的改变,能够一次并行对几十万到几百万条核酸分子进行平行序列测定,通常一次测序反应能产出不低于100Mb的测序数据,因此又称高通量测序技术(High-throughput sequencing)。经过二十多年的迅猛发展,其测序数据量已增加了100-1000倍,测序成本下降了近50000倍,并已深入到生命科学的各个领域,不仅有力地推动了基础研究的发展,也在逐渐征服临床应用。
当前市场主要的高通量测序厂家有Illumina、Thermo Fisher、华大、Roche等,其中,Illumina公司的HiSeq 2000、GA 2x、MiSeq和NextSeq等仪器已成为测序主流平台,占市场比重为约83.9%。该系列测序平台的核心原理是边合成边测序技术(Sequencing bysynthesis,SBS),主要包括三个步骤,即建库、簇生成和簇扩增及测序。建库是指对经片段化处理后(200-500bp)的待测DNA样本,在其两端分别添加上不同的接头(P7/P5,与其分别互补的接头单链为P7’/P5’),并进行PCR扩增构建DNA文库;簇生成是文库两端的已知序列与测序芯片表面流通池基底上的Oligo序列互补,并经过桥式PCR扩增形成簇的过程;簇生成后立即开始测序反应,在碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据四种不同的荧光信号确认碱基种类,在经过多个循环后,完整读取核酸序列。上述三个步骤中的第二、第三步主要是在测序仪上进行操作,因此已基本实现了流程化和自动化;但第一步的建库,由于目前主要是人工操作,且方法学上有一定局限性,即没有一种能普遍适用所有样本(浓度、片段长度、完整性等)的建库方法,因此成为了影响最终测序结果和质量最为重要的因素。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本公开实施例提供了一种单链DNA文库构建接头,所述单链DNA文库构建接头为带有粘性末端的线性寡核苷酸,所述单链DNA文库构建接头的结构包括:
间隔序列-随机序列-双链结构-随机序列-间隔序列;或者
间隔序列-随机序列-双链结构;或者
双链结构-随机序列-间隔序列;
其中,所述间隔序列起间隔作用,能够防止所述单链DNA文库构建接头的粘性末端之间的随机序列发生互补配对;所述随机序列与片段化单链DNA通过碱基互补配对进行杂交形成不完整的环状结构,以捕获目标片段化单链DNA;所述双链结构包括滚环扩增引物及测序引物的互补序列,所述滚环扩增引物用于滚环扩增所述目标片段化单链DNA,所述测序引物的互补序列用于在上机测序时引入测序引物结合序列。
在一些示例性实施方式中,所述单链DNA文库构建接头包括单链1和单链2;所述单链1从5’端到3’端包括间隔序列-随机序列-序列b-序列c-序列a-随机序列-间隔序列。
在一些示例性实施方式中,所述单链DNA文库构建接头包括单链3和单链2;所述单链3从5’端到3’端包括间隔序列-随机序列-序列b-序列c-序列a;或者所述单链3从5’端到3’端包括序列b-序列c-序列a-随机序列-间隔序列。
在一些示例性实施方式中,所述单链2与所述单链1或所述单链3的序列b-序列c-序列a反向互补,形成所述单链DNA文库构建接头的双链结构。
在一些示例性实施方式中,所述单链1包括SEQ ID No.1中列出的序列。
在一些示例性实施方式中,所述单链2包括SEQ ID No.2中列出的序列。
在一些示例性实施方式中,所述单链3包括SEQ ID No.3中列出的序列。
在一些示例性实施方式中,所述序列a为测序引物的互补序列,所述序列a的序列为5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’。
在一些示例性实施方式中,所述序列b为测序引物的互补序列,所述序列b的序列为5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-3’。
在一些示例性实施方式中,所述序列c为滚环扩增引物序列用于滚环扩增所述目标片段化单链DNA,所述序列c的序列为5’-GCACGTCACGACTTCACACG-3’。
在一些示例性实施方式中,所述随机序列为NNNN,其中四个N分别为A、T、C、G中的任一个。
本公开实施例提供了一种单链DNA文库构建试剂盒,所述单链DNA文库构建试剂盒包括上述单链DNA文库构建接头、阻隔序列、序列e和序列f以及杂交试剂、连接试剂、RCA扩增体系和PCR反应扩增体系。
在一些示例性实施方式中,所述阻隔序列为序列d:5’-Spacer C3-GTGTGAAGTCGTGACGTG-Spacer C3-3;其中Spacer C3为封闭基团,用于阻止前沿DNA聚合酶在此处以及后端的延伸。
在一些示例性实施方式中,所述序列e为i5接头引物,所述序列e的序列为5’-AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3’。
在一些示例性实施方式中,所述序列f为i7接头引物,所述序列f的序列为5’-CAAGCAGAAGACGGCATACGAGAT[i7]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T-3’。
在一些示例性实施方式中,[i5]或[i7]表示8碱基的i5和i7索引序列。
本公开实施例提供了上述单链DNA文库构建试剂盒在生物测序中的应用,其中单链DNA文库构建接头基于RCA原理进行设计,并且适用于Illumina测序仪。
本公开实施例提供了一种单链DNA文库构建方法,所述单链DNA文库构建方法包括使用上述单链DNA文库构建试剂盒。
在一些示例性实施方式中,所述单链DNA文库构建方法包括:
制备片段化单链DNA;
所述单链DNA文库构建接头对所述片段化单链DNA的捕获;
连接成环;
RCA靶标扩增;
文库扩增。
在一些示例性实施方式中,所述单链DNA为cfDNA、FFPE DNA或古DNA经变性所得;或者所述单链DNA为基因组DNA经超声或酶切法片段化后再变性所得。
在一些示例性实施方式中,所述单链DNA文库构建接头对所述段化单链DNA的捕获包括所述单链DNA文库构建接头的随机序列与所述片段化单链DNA通过碱基互补配对进行杂交,形成不完整的环状结构。
在一些示例性实施方式中,所述连接成环包括利用DNALigase或CircLigase酶将所述片段化单链DNA与单链DNA文库构建接头的另一条单链进行连接,并且脱去含随机序列的接头单链,从而获得环状单链DNA。
在一些示例性实施方式中,所述RCA靶标扩增包括在滚环扩增引物序列引导下,将所述环状单链DNA进行滚环扩增,获得线状含多拷贝靶标基因的单链DNA。
在一些示例性实施方式中,所述文库扩增包括加入阻隔序列对滚环扩增引物结合片段进行封阻,然后在PCR引物e和引物f引导下获得带有测序接头的DNA文库。
本公开实施例提供了上述单链DNA文库构建方法在生物测序中的应用,其中单链DNA文库构建接头基于RCA原理进行设计,并且适用于Illumina测序仪。
附图说明
附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开的技术方案的限制。附图中一个或多个模块的形状和大小不反映真实比例,目的只是示意说明本公开内容。
图1示出了本公开的代表性实施例的第1种接头的结构。
图2示出了本公开的代表性实施例的第2种接头的结构。
图3示出了本公开的代表性实施例的流程图。
图4示出了本公开的代表性实施例的文库浓度。
图5示出了本公开的代表性实施例的文库凝胶电泳图(3%琼脂糖凝胶)。
图6示出了本公开的代表性实施例的文库凝胶电泳图(3%琼脂糖凝胶)。
图7示出了本公开的代表性实施例的实际检测突变频率。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,下文中将对本公开的实施例进行详细说明。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。
下面将结合附图对本公开的实施例进行详细说明。实施方式可以以多个不同形式来实施。所属技术领域的普通技术人员可以很容易地理解一个事实,就是方式和内容可以在不脱离本公开的宗旨及其范围的条件下被变换为一种或多种形式。因此,本公开不被解释为仅限定在下面的实施方式所记载的内容中。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。
除非另有定义,本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些相似或等效的任何方法和材料都可以用于实践或测试本公开,但描述了优选的方法和材料。为了本公开的目的,在下文中定义了以下术语。
在本申请中,除非另外明确说明,否则单数的使用包括复数。必须注意,除非上下文另外清楚地指示,否则如本说明书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指代。在本申请中,除非另外说明,否则“或”的使用意指“和/或”。
术语“约(about)”或“约(approximately)”意指在如由本领域普通技术人员确定的特定值的可接受误差范围以内,其将部分地取决于值如何被测量或确定,即,测量系统的局限性。例如,“约”可以根据本领域的实践意指1个或多于1个标准差以内。可选地,“约”可以意指特定值的最多20%、最多10%、最多5%或最多1%的范围。在其他实例中,“约10”的量包括10和9至11的任何量。
在又其他的实例中,涉及参考数值的术语“约”也可以包括该值的正或负10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的值范围。可选地,特别是涉及生物系统或过程,术语“约”可以意指在值的一个数量级以内。当在本申请和权利要求书中描述特定值时,除非另外说明,否则术语“约”被假定意指特定值的可接受的误差范围以内。
如本说明书和一项或更多项权利要求(claim(s))中使用的,词语“包含/包括(comprising)”(和包含/包括(comprising)的任何形式,诸如“包含/包括(comprise)”和“包含/包括(comprises)”)、“具有(having)”(和具有(having)的任何形式,诸如“具有(have)”和“具有(has)”)、“包括/包含(including)”(和包括/包含(including)的任何形式,诸如“包括/包含(includes)”和“包括/包含(include)”)或“包含/含有(containing)”(和“包含/含有(containing)”的任何形式,诸如“包含/含有(contains)”和“包含/含有(contain)”)是包含性的或开放式的,并不排除另外的、未列举的要素或方法步骤。设想本说明书中讨论的任何实施方案可以参考本公开内容的任何方法或组合来实现,并且反之亦然。此外,本公开内容的组合可以用于实现本公开内容的方法。
RCA:Rolling Circle Amplification,滚环扩增。
ss-DNA:Single-stranded Deoxyribonucleotides,单链脱氧核糖核苷酸。
cfDNA:Cell-free DNA,细胞游离DNA。
FFPE DNA:Formalin-fixed and Parrffin-embedded DNA,福尔马林固定的石蜡包埋组织DNA。
NGS:Next Generation Sequencing,下一代测序技术。
传统的DNA文库制备均是通过特定接头与双链DNA的连接反应进行的,该过程中一般会涉及双链末端修复及加“A”反应;之后再通过对连接产物进行数十个PCR扩增循环以富集得到文库。但该方法不适用于一些浓度极低(如来源于血液、尿液等体液样本的cfDNA),或发生严重降解的DNA样本(如FFPE DNA、古DNA,或经亚硫酸盐或其他化学试剂处理后的DNA),这类DNA常以单链和双链混合形式存在,并且部分双链DNA还存在一条断裂链或局部碱基缺失等问题,利用此类方法建库时,可能会造成局部信息丢失,并导致假阴性结果以及灵敏度降低;除此之外,这类样本含量往往极低,如cfDNA有时会低于5ng,建库时需要更多的PCR循环数,而这又会进一步积累和放大PCR扩增中产生的偏向性误差(如错配、非特异性扩增等)。因此,开发更高效且灵敏的单链建库方法,以保证上述单链DNA信息不发生丢失,又不引入额外的扩增错误,获得高质量、符合上机要求的测序文库,对相关检测领域的发展至关重要。
滚环扩增(RCA)技术作为一种核酸等温扩增技术,能够通过随机引物在全基因组范围内对初始量低的DNA进行无差别的高质量扩增,并且将其应用于测序文库构建方面也有部分报道。其中最为著名的为华大出品的DNA纳米球(Nanoballs)建库技术,即在双链DNA片段两端接上泡状接头,通过高温变性使其形成单链,并在环化引物和DNA连接酶的作用下形成单链环状DNA,后经RCA扩增形成适用于华大基因测序仪的DNA纳米球。除此之外,专利CN 113667716 A公开了一种用于单分子测序平台(如ONT测序平台和PacBio测序平台)的测序文库构建方法,采用特异性引物对待测序分子的环状cDNA、dsDNA或RNA分子形式进行滚环扩增,一个环状序列仅产生一条含有多拷贝的长序列,即单拷贝扩增。专利CN 113549675A公开了一种茎环结构接头,分别与双链DNA片段两端连接,经高温变性形成单链环,最后对该环状DNA采用靶向引物滚环扩增以及超分支扩增形成双链DNA。
基于滚环扩增原理的文库构建方法被证实能够有效降低PCR扩增产生的错误指数积累,并适用于含量较低样本。但与此同时,目前该类方法或策略仍然只是针对双链DNA片段,并不适用于目前所亟需解决的单链DNA建库问题,且获得的文库只适用于专属的MGISEQ或单分子测序仪,而缺少适用于Illumina测序仪的单链文库构建技术。
本公开提供了一种基于RCA原理,并适用于Illumina测序仪的单链文库构建试剂盒,具体包括接头及杂交试剂、连接试剂、RCA扩增体系和PCR反应扩增体系,其中:接头序列如下:
序列a:5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’
序列b:5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-3’
序列c:5’-GCACGTCACGACTTCACACG-3’
序列d:5’-Spacer C3-GTGTGAAGTCGTGACGTG-Spacer C3-3’
序列e:5’-AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3’
序列f:5’-CAAGCAGAAGACGGCATACGAGAT[i7]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T-3’
其中,序列a可以来自测序引物,如可为测序引物read1序列;
序列b可以来自测序引物,如可为测序引物read2序列;
序列c为滚环扩增引物序列(RCA引物序列);
序列d为线状多拷贝单链DNA中的阻隔序列,其中C3间臂(Spacer-C3)为磷酸二酯键,模仿核糖的3’和5’羟基间的三碳间隔;所述C3间臂(Spacer-C3)为封闭基团,用于封闭3’引物延伸以阻止前沿DNA聚合酶在此处以及后端的延伸;
序列e和f分别为i5、i7接头引物,[i5]和[i7]表示8碱基的i5和i7索引(Index)序列,用于标记样本以区分不同样本;序列e中[i5]之前的序列为测序接头P5,用于与测序芯片表面Oligo结合,[i5]之后的序列为测序引物read1序列;序列f中[i7]之前的序列为测序接头P7,用于与测序芯片表面Oligo结合,[i7]之后的序列为测序引物read2序列。
以上寡核苷酸序列均由上海生工科技提供。
第一类接头为SEQ ID No.1和SEQ ID No.2退火杂交后的产物(图1):
SEQ ID No.1:从5’→3’,Spacer C3-NNNN-序列b-序列c-序列a-NNNN-Spacer C3
即Spacer C3-NNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGCACGTCACGACTTCACACGACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNN-C3Spacer
SEQ ID No.2与SEQ ID No.1除两端间隔基和随机碱基后的序列(即序列b-序列c-序列a)互补,即从5’→3’,AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTCGTGTGAAGTCGTGACGTGCGATCGGAAGAGCACACGTCTGAACTCCAGTCAC
其中,N表示随机碱基,即可以是A、T、C、G四种碱基中的任何一个。
第二种接头为SEQ ID No.3和SEQ ID No.2退火杂交后的产物(图2):
SEQ ID No.3:从5’→3’,Spacer C3-NNNN-序列b-序列c-序列a,即
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGCACGTCACGACTTCACACG ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNN-C3 Spacer
具体操作流程包括:
(1)制备片段化单链DNA;片段化单链DNA可以为cfDNA、FFPE DNA或古DNA经变性所得,也可以为基因组DNA经超声或酶切法等片段化后再变性所得;使片段化DNA变性的方法包括高温法、加变性剂法等。
(2)接头对片段化单链DNA的捕获:接头5’和3’两端(第一类接头)或5’端(第二类接头)的随机序列与片段化单链DNA通过碱基互补配对进行杂交,形成不完整的环状结构。
(3)连接成环:利用DNALigase(第一类接头)或CircLigase酶(第二类接头)将片段化单链DNA与接头的另一条单链进行连接,并脱去含随机序列的接头单链,形成环状单链DNA。
(4)RCA靶标扩增:在RCA引物(序列c)引导下,对(3)中经DNALigase(第一类接头)或CircLigase酶(第二类接头)连接后的完整环状单链DNA进行滚环扩增,获得线状含多拷贝靶标基因的单链DNA。
(5)文库扩增:加入阻隔序列(序列d)对RCA引物结合片段进行封阻,后在PCR引物e和引物f引导下获得带有测序接头的DNA文库。
实施例一:第一类接头引导的单链建库
(1)将SEQ ID No.1和SEQ ID No.2分别重悬于缓冲液中至100μM;缓冲液组成为10mM Tris pH7.5,2mM EDTA,50mM NaCl。
(2)将上述两种溶液各取10μL,混合于0.2mL PCR管中,涡旋混匀,短暂离心,标记为接头1;将接头1PCR管置于PCR仪(SimpliAmpTM Thermal Cycler)中,运行程序:95℃,10分钟;程序运行结束后,直接关闭PCR仪,使接头1PCR管自然冷却至室温后取出。
(3)将片段化的DNA(来源于菁良基因提供的多突变位点cfDNA标准品,突变频率1%)加入到上述0.2mL PCR管中,加入无酶水至30μL;投入DNA的总量为4.0ng,4.0ng,10ng,10ng;将含有DNA样本的PCR管放入PCR仪中,95℃孵育5分钟后,立即置于冰上骤冷,静置5分钟。
(4)在冰上配制以下反应体系:
表1:连接反应体系
将该混合体系涡旋混匀,瞬时离心后,置于PCR仪中运行:25℃,45分钟;95℃,5分钟。
(5)上一步反应结束后,经过1X AMpure XP磁珠(Agencourt AMPure XP)纯化;并配制以下滚环扩增体系:
表2:滚环扩增体系
将该混合体系涡旋混匀,瞬时离心后,置于PCR仪中运行:70℃,1h;得到线状含多拷贝靶标基因的单链DNA。
(6)上一步反应结束后,经过1.2X AMpure XP磁珠纯化,最终得18μL产物;向体系中加入2μL,100μM线状多拷贝单链DNA阻隔序列d,体系涡旋混匀,瞬时离心后,置于PCR仪中运行:95℃,2分钟;60℃,2分钟。
(7)在冰上配制以下反应体系:
表3:文库扩增体系
其中Primer Mix为序列e和f的混合物,由试剂盒(康为世纪NGS双端检索接头引物试剂盒)提供。
将混合体系涡旋混匀,短暂离心,置于PCR仪中运行以下程序:
表4:文库扩增反应程序
(8)反应结束后,经过1X AMpure XP磁珠纯化,最终得28μL产物。
(9)使用Qubit 4.0Fluorometer(invitrogen)测定浓度。
(10)测序及数据分析:使用Novaseq6000仪器(海普洛斯),并用标准分析软件对数据进行分析处理。
实施例二:第二类接头引导的单链建库
(1)将SEQ ID No.3和SEQ ID No.2分别重悬于缓冲液中至100μM;缓冲液组成为10mM Tris pH7.5,2mM EDTA,50mM NaCl。
(2)将上述两种溶液各取10μL,混合于0.2mL PCR管中,涡旋混匀,短暂离心,标记为接头2;将接头2PCR管置于PCR仪中,运行程序:96℃,10分钟;程序运行结束后,直接关闭PCR仪,使接头2PCR管自然冷却至室温后取出。
(3)将片段化的DNA(样本信息同实施例一)加入到上述0.2mLPCR管中,加入无酶水至30μL;投入DNA的总量为4.0ng,4.0ng,10ng,10ng;将含有DNA样本的PCR管放入PCR仪中,95℃孵育5分钟后,立即置于冰上骤冷,静置5分钟。
(4)在冰上配制以下反应体系:
表5:连接反应体系
将该混合体系涡旋混匀,瞬时离心后,置于PCR仪中运行:25℃,30分钟;95℃,5分钟。
(5)反应结束后,经过1X AMpure XP磁珠纯化;并配制以下单链连接成环体系:
表6:连接体系
将该混合体系涡旋混匀,瞬时离心后,置于PCR仪中运行:60℃,60分钟。
(6)配置以下反应体系:
表7:滚环扩增体系
将该混合体系涡旋混匀,瞬时离心后,置于PCR仪中运行:70℃,1h;得到线状含多拷贝靶标基因的单链DNA。
(7)上一步反应结束后,经过1.2X AMpure XP磁珠纯化,最终得18μL产物;向体系中加入2μL,100μM线状多拷贝单链DNA阻隔序列d,体系涡旋混匀,瞬时离心后,置于PCR仪中运行:95℃,2分钟;60℃,2分钟。
(8)在冰上配制以下反应体系:
表8:文库扩增体系
其中Primer Mix为序列e和f的混合物,由试剂盒提供。
将混合体系涡旋混匀,短暂离心,置于PCR仪中运行以下程序:
表9:文库扩增反应程序
(9)反应结束后,经过1X AMpure XP磁珠纯化,最终得28μL产物。
(10)浓度测定、测序及结果分析同实施例一。
通过对购买的标准品进行稀释后得到1%的突变频率进行建库,并通过Qubit4.0Fluorometer测定文库浓度,发现通过本公开的仅6个PCR扩增循环即可获得足量文库(图4),且琼脂糖凝胶电泳显示文库片段呈弥散状分布,且大小符合预期(图5和图6),表明通过本公开的方法能获得满足上机要求的文库。突变检测频率显示每组样品都能获得较为满意的结果(图7),性能略高于市售的含分子标签的建库方法,并且明显优于常规建库法。
Claims (25)
1.一种单链DNA文库构建接头,所述单链DNA文库构建接头为带有粘性末端的线性寡核苷酸,所述单链DNA文库构建接头的结构包括:
间隔序列-随机序列-双链结构-随机序列-间隔序列;或者
间隔序列-随机序列-双链结构;或者
双链结构-随机序列-间隔序列;
其中,所述间隔序列起间隔作用,能够防止所述单链DNA文库构建接头的粘性末端之间的随机序列发生互补配对;所述随机序列与片段化单链DNA通过碱基互补配对进行杂交形成不完整的环状结构,以捕获目标片段化单链DNA;所述双链结构包括滚环扩增引物及测序引物的互补序列,所述滚环扩增引物用于滚环扩增所述目标片段化单链DNA,所述测序引物的互补序列用于在上机测序时引入测序引物结合序列。
2.根据权利要求1所述的单链DNA文库构建接头,其中,所述单链DNA文库构建接头包括单链1和单链2;所述单链1从5’端到3’端包括间隔序列-随机序列-序列b-序列c-序列a-随机序列-间隔序列。
3.根据权利要求1所述的单链DNA文库构建接头,其中,所述单链DNA文库构建接头包括单链3和单链2;所述单链3从5’端到3’端包括间隔序列-随机序列-序列b-序列c-序列a;或者所述单链3从5’端到3’端包括序列b-序列c-序列a-随机序列-间隔序列。
4.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述单链2与所述单链1或所述单链3的序列b-序列c-序列a反向互补,形成所述单链DNA文库构建接头的双链结构。
5.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述单链1包括SEQID No.1中列出的序列。
6.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述单链2包括SEQID No.2中列出的序列。
7.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述单链3包括SEQID No.3中列出的序列。
8.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述序列a为测序引物的互补序列,所述序列a的序列为5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’。
9.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述序列b为测序引物的互补序列,所述序列b的序列为5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-3’。
10.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述序列c为滚环扩增引物序列用于滚环扩增所述目标片段化单链DNA,所述序列c的序列为5’-GCACGTCACGACTTCACACG-3’。
11.根据权利要求2至3中任一项所述的单链DNA文库构建接头,其中,所述随机序列为NNNN,其中四个N分别为A、T、C、G中的任一个。
12.一种单链DNA文库构建试剂盒,所述单链DNA文库构建试剂盒包括权利要求1至11中任一项所述的单链DNA文库构建接头、阻隔序列、序列e和序列f以及杂交试剂、连接试剂、RCA扩增体系和PCR反应扩增体系。
13.根据权利要求12所述的单链DNA文库构建试剂盒,其中,所述阻隔序列为序列d:5’-Spacer C3-GTGTGAAGTCGTGACGTG-Spacer C3-3;其中Spacer C3为封闭基团,用于阻止前沿DNA聚合酶在此处以及后端的延伸。
14.根据权利要求12所述的单链DNA文库构建试剂盒,其中,所述序列e为i5接头引物,所述序列e的序列为5’-AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3’。
15.根据权利要求12所述的单链DNA文库构建试剂盒,其中,所述序列f为i7接头引物,所述序列f的序列为5’-CAAGCAGAAGACGGCATACGAGAT[i7]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T-3’。
16.根据权利要求14或15所述的单链DNA文库构建试剂盒,其中,[i5]或[i7]表示8碱基的i5和i7索引序列。
17.根据权利要求12至16中任一项所述的单链DNA文库构建试剂盒在生物测序中的应用,其中单链DNA文库构建接头基于RCA原理进行设计,并且适用于Illumina测序仪。
18.一种单链DNA文库构建方法,所述单链DNA文库构建方法包括使用权利要求12至16中任一项所述的单链DNA文库构建试剂盒。
19.根据权利要求18所述的单链DNA文库构建方法,所述单链DNA文库构建方法包括:
制备片段化单链DNA;
所述单链DNA文库构建接头对所述片段化单链DNA的捕获;
连接成环;
RCA靶标扩增;
文库扩增。
20.根据权利要求19所述的单链DNA文库构建方法,其中,所述单链DNA为cfDNA、FFPEDNA或古DNA经变性所得;或者所述单链DNA为基因组DNA经超声或酶切法片段化后再变性所得。
21.根据权利要求19所述的单链DNA文库构建方法,其中,所述单链DNA文库构建接头对所述段化单链DNA的捕获包括所述单链DNA文库构建接头的随机序列与所述片段化单链DNA通过碱基互补配对进行杂交,形成不完整的环状结构。
22.根据权利要求19所述的单链DNA文库构建方法,其中,所述连接成环包括利用DNALigase或CircLigase酶将所述片段化单链DNA与单链DNA文库构建接头的另一条单链进行连接,并且脱去含随机序列的接头单链,从而获得环状单链DNA。
23.根据权利要求19所述的单链DNA文库构建方法,其中,所述RCA靶标扩增包括在滚环扩增引物序列引导下,将所述环状单链DNA进行滚环扩增,获得线状含多拷贝靶标基因的单链DNA。
24.根据权利要求19所述的单链DNA文库构建方法,其中,所述文库扩增包括加入阻隔序列对滚环扩增引物结合片段进行封阻,然后在PCR引物e和引物f引导下获得带有测序接头的DNA文库。
25.根据权利要求18至24中任一项所述的单链DNA文库构建方法在生物测序中的应用,其中单链DNA文库构建接头基于RCA原理进行设计,并且适用于Illumina测序仪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211168289.9A CN117757895A (zh) | 2022-09-23 | 2022-09-23 | 一种单链dna文库构建试剂盒及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211168289.9A CN117757895A (zh) | 2022-09-23 | 2022-09-23 | 一种单链dna文库构建试剂盒及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117757895A true CN117757895A (zh) | 2024-03-26 |
Family
ID=90313256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211168289.9A Pending CN117757895A (zh) | 2022-09-23 | 2022-09-23 | 一种单链dna文库构建试剂盒及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117757895A (zh) |
-
2022
- 2022-09-23 CN CN202211168289.9A patent/CN117757895A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110036117B (zh) | 通过多联短dna片段增加单分子测序的处理量的方法 | |
JP5986572B2 (ja) | 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定 | |
JP7379418B2 (ja) | 腫瘍のディープシークエンシングプロファイリング | |
KR102592367B1 (ko) | 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법 | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
AU2016281758B2 (en) | Reagents, kits and methods for molecular barcoding | |
EP3674413A1 (en) | Probe and method for high-throughput sequencing targeted capture target region used for detecting gene mutations as well as known and unknown gene fusion types | |
WO2013192292A1 (en) | Massively-parallel multiplex locus-specific nucleic acid sequence analysis | |
CN110869515B (zh) | 用于基因组重排检测的测序方法 | |
CN113969307A (zh) | Dna甲基化测序文库及制备方法和dna甲基化检测方法 | |
WO2013079649A1 (en) | Method and kit for characterizing rna in a composition | |
CN111801427A (zh) | 用于单分子的单链环状dna模板的产生 | |
CN118591636A (zh) | Dna甲基化文库构建方法及其文库、dna杂交捕获方法和试剂盒 | |
CN114032287B (zh) | Dna甲基化测序文库及其构建方法和检测方法 | |
KR20220130591A (ko) | 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법 | |
WO2023148235A1 (en) | Methods of enriching nucleic acids | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
EP4314283A1 (en) | Methods of preparing directional tagmentation sequencing libraries using transposon-based technology with unique molecular identifiers for error correction | |
CN117757895A (zh) | 一种单链dna文库构建试剂盒及其应用 | |
CN114196737A (zh) | 一种恒温扩增的测序方法 | |
JP2022546485A (ja) | 腫瘍高精度アッセイのための組成物および方法 | |
CN112646809A (zh) | 用于检测酶末端修复能力的核酸序列、方法及试剂盒 | |
CN116926166A (zh) | 一种长片段dna捕获方法、试剂盒及其用途 | |
KR20240032630A (ko) | 핵산의 정확한 병렬 검출 및 정량화 방법 | |
WO2022125100A1 (en) | Methods for sequencing polynucleotide fragments from both ends |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |