CN111748551A

CN111748551A - 封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法

Info

Publication number: CN111748551A
Application number: CN201910238797.1A
Authority: CN
Inventors: 胡玉刚; 曲燕; 汪彪; 唐守运; 郑文莉; 吴强
Original assignee: Naonda Nanjing Biological Technology Co ltd
Current assignee: Naonda Nanjing Biological Technology Co ltd
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2020-10-09
Anticipated expiration: 2039-03-27
Also published as: CN111748551B

Abstract

本发明提供了一种封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法。其中该封闭序列按照从5’到3’的方向包括第一封闭段以及第二封闭段，第二封闭段设置在第一封闭段下游，且第一封闭段和第二封闭段的3’端带有封闭修饰；第一封闭段和第二封闭段上的部分碱基为LNA或BNA修饰的碱基。通过在第一封闭段和第二封闭段上对部分碱基进行LNA或BNA修饰，可以增强对待封闭序列的结合能力，从而增加封闭效果；而在第一封闭段和第二封闭段的3’端进行封闭修饰，使得文库中多余的接头不能被作为引物对其他文库的接头进行扩增，这两方面的改进使得本申请的封闭序列能够减少或避免文库中多余接头的不必要的扩增以及样本标签跳跃现象。

Description

封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法

技术领域

本发明涉及高通量测序文库构建领域，具体而言，涉及一种封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法。

背景技术

随着市场上对高通量测序精准诊断重视和强劲需求，高通量测序仪需要不断的提升测序通量来满足日益增长的测序需求。为适应上述需求，Illumina公司对HiSeq3000/4000进行了升级更新，更新后的测序仪，比以前的版本在测序通量上有巨幅提升。

为了提高测序产出通量，上述测序平台均采用了规则流动槽(Patterned FlowCell Technology,PFCT)芯片和排他性扩增(Exclusive Amplification,ExAmp)成簇两种新技术。新版的测序仪通量更高，可以在单次测序过程中混入更多的样本，但也存在一个严重的问题，不同的样本标签之间相互跳跃问题比较严重。

Illumina官方给出的不同建库方式导致的样本标签跳跃水平在0.1～2％之间，这使得样本间存在严重的相互干扰问题，会导致测序检测结果的准确性降低，尤其是检测低频突变时，样本标签跳跃会大大降低低频突变的检测准确性。

发明内容

本发明的主要目的在于提供一种封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法，以解决现有技术中所构建的文库后续会存在样本标签跳跃的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种封闭序列，该封闭序列按照从5’到3’的方向包括：第一封闭段以及第二封闭段，第二封闭段设置在第一封闭段下游，且第一封闭段和第二封闭段的3’端带有封闭修饰；其中，第一封闭段和第二封闭段上的部分碱基为LNA或BNA修饰的碱基。

进一步地，第一封闭段和第二封闭段的3’端的封闭修饰为MGB修饰、C3间臂修饰，3’磷酸化修饰，3’地高辛修饰，3’生物素修饰或3’端的碱基为双脱氧碱基。

进一步地，封闭序列还包括：标签封闭段，标签封闭段位于第一封闭段和第二封闭段之间，标签封闭段采用通用封闭碱基。

进一步地，通用封闭碱基为I和/或C3间臂。

进一步地，LNA或BNA修饰的碱基在第一封闭段或第二封闭段中的数目为3～6个。

进一步地，封闭序列为Illumina测序平台的P5端封闭序列和/或P7端封闭序列；优选地，P5端封闭序列为SEQ ID NO:1：AATGATACGG+CGACCA+CCGAGAT+CTACACIIIIIIIIACACTCTTT+CCCTA+CA+CGACGCTCTTCCGATCTMGB；其中+表示LNA或BNA修饰，I为通用封闭碱基，MGB为3’端的封闭修饰；优选地，P7端封闭序列为SEQ ID NO:2：CAAG+CAGAAGA+CGGCATA+CGAGATIIIIIIIIGTGA+CTGGAGTT+CAGA+CGTGTGCTCTTCCGATCTMGB；其中+表示LNA或BNA修饰，I为通用封闭碱基，MGB为3’端的封闭修饰。

进一步地，封闭序列为MGI测序平台的第一标签接头的封闭序列或通用接头的封闭序列或第二标签接头的封闭序列；优选地，第一标签接头的封闭序列为SEQ ID NO:3：TGTGAG+C+CAAGG+AGTTGIIIIIIIIIITTGT+CTTC+CTAAGA+CCGCTTGGCCTCCGACTTMGB，其中+表示LNA或BNA修饰，I为通用封闭碱基，MGB为3’端的封闭修饰；优选地，通用接头的封闭序列为SEQ ID NO:4 SEQ ID NO:4:GAA+CGA+CATGG+CTA+CGAT+CCGACTTMGB，其中+表示LNA或BNA修饰，MGB为3’端的封闭修饰；优选地，第二标签的封闭序列为：SEQ ID NO:5:(N)_nIIIIIIIIIIGAA+CGA+CATGG+CTA+CGAT+CCGACTT-MGB，其中(N)_n表示第一封闭段，n表示第一封闭段的长度，n为20～30，(N)_n中含有3～5个C碱基的LNA修饰或BNA修饰，I为通用封闭碱基，+表示LNA或BNA修饰，MGB为3’端的封闭修饰。

为了实现上述目的，根据本发明的第二个方面，提供了一种捕获试剂盒，该捕获试剂盒包括封闭序列，封闭序列为上述任一种封闭序列。

根据本发明的第三个方面，提供了一种文库杂交捕获方法，该方法包括采用捕获试剂盒对待捕获文库进行捕获，捕获试剂盒采用上述任一种捕获试剂盒。

进一步地，在采用捕获试剂盒对待捕获文库进行捕获之前，方法还包括，对待捕获文库进行片段筛选；优选地，采用磁珠对待捕获文库依次进行第一次筛选和第二次筛选，其中，第一次筛选的文库片段与第二次筛选的文库片段的长度不同；更优选地，第一次筛选的文库片段的长度为≤200bp的文库片段，第二次筛选的文库片段的长度为≥500bp的文库片段。

进一步地，采用捕获试剂盒对待捕获文库进行捕获的步骤包括，将封闭序列与待捕获文库按照摩尔比为20:1～120：1的比例进行封闭。

根据本发明的第四个方面，提供了一种建库方法，该建库方法包括：构建片段化文库；对片段化文库进行杂交捕获，得到捕获文库；对捕获文库进行PCR扩增，得到测序文库；采用上述任一种捕获试剂盒进行杂交捕获，或者采用上述任一种方法进行杂交捕获。

应用本发明的技术方案，通过在第一封闭段和第二封闭段上对部分碱基进行LNA或BNA修饰，可以增强对待封闭序列的结合能力，从而增加封闭效果；而在第一封闭段和第二封闭段的3’端进行封闭修饰，使得文库中多余的接头不能被作为引物对其他文库的接头进行扩增，这两方面的改进使得本申请的封闭序列能够减少或避免文库中多余接头的不必要的扩增以及样本标签跳跃现象。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了现有技术中的带有双端分子标签的接头发生标签跳跃现象的示意图；以及

图2示出了现有技术中采用一对一的封闭序列封闭接头的5’端时仍存在分子标签跳跃的示意图；

图3示出了现有技术中采用一对一的封闭序列封闭接头的3’端时能够避免分子标签跳跃的示意图；

图4示出了经过双筛选后的文库混合捕获出现样本标签跳跃的现象明显比单筛选减少的结果示意图。

图5示出了采用现有的封闭序列与本申请所改进后的封闭序列对文库杂交捕获过程中的封闭效果示意图。

图6示出了文库杂交捕获过程中封闭序列分子与文库分子的不同比例对捕获效率影响的结果示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。

术语解释：

C3间臂：C3 Splicer主要用于模仿核糖的3'和5'羟基间的三碳间隔，或“替代”一个序列中未知的碱基，在核酸序列中间主要是起连接作用，并不能和互补的碱基配对而起到稳定作用，仅对前后碱基起到连接作用。

封闭序列：在文库捕获时，用于对接头序列进行结合封闭，以防止目标片段的接头与非目标片段的接头杂交而降低捕获效率。

需要说明的是，本申请中所提到的I5、I5标签序列均是指I5 index，I7和I7标签序列均是指I7 index，目前这个序列的长度一般为6～10bp，本申请的某些实施例中使用的是Illumina版的8bp长度的I5 index或I7 index。而本申请中所提及的MGI测序平台用的index长度是以10bp为例进行说明的。本申请中的针对index的标签封闭段的长度可以通过调整次黄嘌呤I和C3间臂的长度来适应不同长度的index接头的封闭。

如背景技术所提到的，现有的文库构建或测序过程中存在样本标签跳跃的现象。发明人对现有技术中的样本标签跳跃的现象进行了深入分析和研究，具体研究分析如下：

在Illumina官方给出的样本标签跳跃最严重的建库方式是PCR-Free的方式，这种建库的方式和其它建库方式的本质区别是不进行PCR扩增，所以文库只进行一次纯化，这样接头在文库中留存的比较多。同时由于文库没有进行PCR扩增，相对有效文库，接头留存在文库中的比例最高，因此PCR-Free的建库方式中，样本跳跃最严重。

如图1所示(其中，I5和I7分别代表I5标签序列(I5 index)和I7标签序列(I7index)，一般为6～10bp，本申请的某些实施例中使用的是Illumina版的8bp长度的I5index或I7 index。带星号的表示文库中的过量接头序列上的标签序列，而框起来的表示某一目的片段两端的标签序列，两种不同的标签序列分别代表不同的样本，insert代表文库中的目的片段)，Illumina测序平台的接头是Y型接头，由两条分别带有I5标签序列和I7标签序列的序列(P5接头序列与SEQ ID NO:1的唯一区别在于其碱基不带任何修饰；类似地，P7接头序列与SEQ ID NO:2的唯一区别在于其碱基不带任何修饰)部分互补退火到一起，其中接头p5端本身(图1中的通用扩增引物P5序列为SEQ ID NO:1中前20个碱基不带任何修饰的序列)就可以作为引物进行扩增，接头p7端本身不能当引物，但可以被p7引物(P7引物与带有I7标签序列的接头的3’端互补，图中带有下划线的序列，为SEQ ID NO:2中前24个碱基不带任何修饰的序列)当模板扩增后在下一轮扩增中即变成引物。所以接头存留在文库中是样本标签跳跃的根源问题，留存的接头会在后续的多文库混合捕获扩增和上机扩增过程中发生标签跳跃。

因此，发明人认为，要解决上述技术问题，则需要在建库过程中尽量除掉多余的建库接头。

同样地，在杂交捕获的过程中，由于每个文库外侧都有一个接头序列，杂交的过程中要把这部分的序列进行封闭，不然会影响捕获效率。在杂交的过程中通常加入接头互补的序列进行封闭。在杂交捕获的过程中为了节省成本，杂交捕获都是多个文库混在一起捕获，由于不同的文库带有不同标签序列，通常做法都是加入一对一的接头互补序列。发明人发现，如果加入的封闭序列的方向不对，则同样可以引起标签跳跃。具体分析如下：

如图2所示(其中，I5和I7分别代表I5标签序列和I7标签序列，框起来的I5和I7标签序列表示被捕获文库扩增引物为模板扩增得到的接头的标签序列)，当封闭序列封闭文库的5’端时，封闭序列不会当成引物扩增，但这种一对一的封闭序列会被捕获文库扩增引物(图2中带有下划线的序列，具体序列同图1)当成模板进行扩增，在下一轮扩增或后期测序时当成引物被利用引起文库标签之间跳跃。

而如图3所示，当一对一的封闭序列(文库序列与图1中接头序列相同，封闭序列是图1中接头序列的互补序列，I5，I7部分的序列也是各自标签序列的互补序列，且在3’末端有封闭修饰)封闭文库的3’端时，封闭序列的3’端要合成一个封闭修饰x，此处的x可以是C3spacer，3’磷酸化修饰，3’地高辛修饰，3’生物素修饰，3’端末尾碱基是双脱氧碱基等，这种封闭序列由于3’端合成了封闭修饰，所以不会被当成引物利用引起样本标签之间跳跃。因此，若采用一对一的封闭序列，最好对文库的3’端进行封闭。

由上述发现可知，虽然封闭文库的3’端的封闭序列的封闭效果与封闭文库的5’端的封闭序列的封闭效果相同，但是封闭3’端的封闭序列不会产生文库之间的标签跳跃，所以一对一封闭方案采用封闭3’端的封闭序列是更好的方案。

进一步实验发现，虽然一对一的封闭文库3’端的末端封闭修饰的封闭序列不会产生样本之间的标签跳跃问题，但是操作比较繁琐，而且容易造成漏加和错加。为了使封闭效果更优以及操作更简便，发明人优化了一种更便捷的通用型的封闭序列，具有如下特征：(1)标签序列区域的封闭碱基为通用碱基，比如次黄嘌呤(I)、C3间臂等间隔序列或者几者组合；(2)封闭序列的3’端封闭修饰，可以是MGB修饰、C3间臂修饰，3’磷酸化修饰，3’地高辛修饰，3’生物素修饰或3’端的碱基为双脱氧碱基。尤其是当该封闭修饰为小沟结合蛋白修饰(MGB)时，该修饰起到两方面的效果：一是封闭3’端，防止接头变成引物进行扩增，二是提升退火温度，弥补标签序列区域采用通用碱基所降低的退火温度；(3)为了增强该通用型封闭序列的结合效率，在封闭序列的上下游的非标签序列区域的部分碱基进行LNA或BNA修饰。

基于上述研究和发现的基础上，申请人提出了本申请的技术方案。在一种典型的实施方式中，提供了一种封闭序列，该封闭序列按照从5’到3’的方向包括：第一封闭段和第二封闭段，第二封闭段设置在第一封闭段下游，且第一封闭段和第二封闭段的3’端带有封闭修饰；第一封闭段和第二封闭段上部分碱基为LNA(Locked nucleic acid，锁核酸)或BNA(桥连核酸Bridged nucleic acid2',4'-BNA^NC，即2'-O,4'-aminoethylene bridgednucleic acid是含有具有NO键的六元桥连结构的化合物)修饰的碱基(主要对是C碱基进行LNA或BNA修饰)。

需要说明的是，上述第一封闭段和第二封闭段均是指不包含标签序列的封闭段的接头封闭片段。通过在第一封闭段和第二封闭段上对部分碱基进行LNA或BNA修饰，可以增强对待封闭序列的结合能力，从而增加封闭效果；而在第一封闭段和第二封闭段的3’端进行封闭修饰，使得文库中多余的接头不能被作为引物对其他文库的接头进行扩增，这两方面的改进使得本申请的封闭序列能够减少或避免文库中多余接头的不必要的扩增以及样本标签跳跃现象。

本申请的上述封闭序列中，可以是仅含有上述第一封闭段和第二封闭段的封闭序列，也可以是同时还含有标签封闭段的封闭序列。在不含有标签封闭段时，第一段封闭序列优选与第二封闭段同时进行MGB修饰，这样既不影响对接头的封闭效果，而且不受标签序列长度的限制，能够真正做到通用封闭。

而第一封闭段和第二封闭段的3’端的封闭修饰，可以采用MGB修饰、C3间臂修饰，3’磷酸化修饰，3’地高辛修饰，3’生物素修饰或3’端的碱基为双脱氧碱基。在本申请中，优选采用MGB修饰。MGB修饰相比其他的修饰形式，除了具有末端封闭做用，还具有提升封闭效果的能力，小沟结合蛋白能够使封闭序列与被封闭序列结合的更好，所以MGB在提升封闭效率方面的性能更优异。

当上述封闭序列中含有标签封闭段时，在本申请一种优选的实施例中，上述封闭序列还包括标签封闭段，标签封闭段位于第一封闭段和第二封闭段之间，该标签封闭段采用通用封闭碱基，能够对所有混在一起的文库进行统一封闭，简化了封闭操作。

上述标签封闭段中所采用的通用封闭碱基可以采用与任何碱基存在弱结合能力的碱基序列。在本申请一种优选的实施例中，该通用封闭碱基为次鸟嘌呤I和/或C3间臂。具体标签封闭段的碱基数目无特殊限定，由于本申请改进后的封闭序列在不含有标签封闭段时，同样具有很强的接头封闭效果。因而，标签封闭段的具体碱基数目，可以根据待封闭的文库中的样本标签的碱基数目合理设定。比如，可以是2～12bp、4～10bp或者优选的6～10bp的组合形式。

当采用C3间臂作为标签封闭段的修饰碱基时，以Illumina平台的P5接头的封闭序列为例，其可以是8个C3间臂，当然，该8个C3间臂也可以替换成其它序列，比如替换成8个次黄嘌呤(I)。次黄嘌呤的优点是能与所有的碱基都有微弱的配对能力，而C3间臂只是占位一个碱基的距离，与配对碱基没有结合能力，不能起到稳定的作用。

上述封闭序列中，第一封闭段和第二封闭段中LNA或BNA修饰的碱基的数目可以根据实际需要合理设定。修饰碱基数据量与第一封闭段和第二封闭段的序列长度呈负相关，序列长则需要修饰的碱基数量少，序列短则需要修饰的碱基数量多。在本申请中，发明人发现，当LNA或BNA修饰的碱基在第一封闭段或第二封闭段中的数目为3～6个碱基时，封闭序列与目的接头的结合能力最强。而当超过6个碱基时，容易产生自身的杂交，对多文库的杂交捕获不利，如12个文库杂交，每个文库500ng，总量6μg，这时为了保证杂交效果，加入的封闭序列浓度增高后，修饰碱基过多会导致封闭序列自己杂交到一起到，而使得杂交效果不佳。

针对现有技术中存在样本标签跳跃的Illumina测序平台，在本申请一种优选的实施例中，提供了一种封闭序列，该封闭序列为Illumina测序平台的P5端封闭序列和/或P7端封闭序列。具体的P5端封闭序列和/或P7端封闭序列可以按照上述所提供的原则进行合理设计。在本申请另一种优选的实施例中，P5端的封闭序列为SEQ ID NO:1：AATGATACGG+CGACCA+CCGAGAT+CTACACIIIIIIIIACACTCTTT+CCCTA+CA+CGACGCTCTTCCGATCTMGB；其中+表示其后面紧挨着的碱基进行LNA或BNA修饰(比如C+G代表的是其中的G碱基进行LNA或BNA修饰)，I表示通用封闭碱基，MGB为3’端的封闭修饰。在一种优选的实施例中，P7端封闭序列为SEQ ID NO:2：CAAG+CAGAAGA+CGGCATA+CGAGATIIIIIIIIGTGA+CTGGAGTT+CAGA+CGTGTGCTCTTCCGATCTMGB；其中+表示LNA或BNA修饰，I表示通用封闭碱基，MGB为3’端的封闭修饰。

采用上述优选实施例中的P5端封闭序列和/或P7端封闭序列，能够对多余的接头进行有效封闭，既有效减少或避免了将多余接头当作引物扩增其他文库，又减少或避免了出现将多余接头当作模板扩增后进行其他文库的扩增，从而能够有效减少或避免出现多样本文库中样本标签跳跃的现象。

本申请所提供的上述封闭序列，其封闭原则及效果并不局限于Illumina测序平台，同样适用于其他测序平台，比如MGI测序平台。在本申请一种优选的实施例中，封闭序列为MGI测序平台的上游引物封闭序列和/或下游引物封闭序列，当MGI测序文库构建过程中，存在过量接头时，同样可能出现样本标签跳跃的现象，因而，采用按照本申请上述原则设计的封闭序列同样能够降低样本标签跳跃的现象。

目前MGI平台的index还只是单端，单端index所形成的文库的测序数据是难以发现或评估在建库或测序过程中是否存在标签串扰的现象，但难以发现或评估并不意味着不存在，因而，为了尽可能减少文库中多余接头所引起的不良干扰或产生的无效数据，在本申请一种优选的实施例中，也提供了一种能够抑制目前MGI测序平台的测序文库中多余接头扩增的封闭序列。目前MGI测序平台的接头一端是通用接头，另一端是带标签的接头，因而针对该平台的封闭序列分别为通用接头的封闭序列和标签接头的封闭序列，具体的序列可以按照上述原则进行针对性地设计。在一种优选的实施例中，标签接头的封闭序列为SEQID NO:3：TGTGAG+C+CAAGG+AGTTGIIIIIIIIIITTGT+CTTC+CTAAGA+CCGCTTGGCCTCCGACTTMGB，其中+表示LNA或BNA修饰，I表示通用封闭碱基，MGB为3’端的封闭修饰。在另一种优选的实施例中，通用接头的封闭序列为SEQ ID NO:4GAA+CGA+CATGG+CTA+CGAT+CCGACTTMGB，其中+表示LNA或BNA修饰，MGB为3’端的封闭修饰。

若MGI平台的建库接头单端标签升级双端标签接头后，本发明亦可使用，优选通用接头改进成带标签的接头后，由于没有具体的接头序列信息，因而，对应的封闭序列中，标签封闭段还是用通用碱基I，而标签封闭段前面的第一封闭段的碱基用N表示，所以优选升级后的带第二标签的通用封闭序列具有如SEQ ID NO:5所示的结构(由5’至3’方向)：(N)_nIIIIIIIIIIGAA+CGA+CATGG+CTA+CGAT+CCGACTT-MGB，(N)_n表示第一封闭段，长度优选20～30bp，更优选其GC含量在40～60％之间，适合PCR扩增的一段序列，这段(N)_n序列中，用LNA或BNA修饰3～5个C碱基，IIIIIIIIII表示标签封闭段，GAA+CGA+CATGG+CTA+CGAT+CCGACTT-MGB表示第二封闭段。

根据MGI测序平台上所用的接头的序列上是单端带有标签序列，还是双端带有标签序列，上述优选实施例所涉及的封闭序列的具体序列也有所不同。如果是单端标签序列的接头，封闭序列需要一条带标签封闭段的封闭序列和一条通用接头的封闭序列，如果是双端标签接头，则需要两端都带有标签封闭段的封闭序列。

在上述各种改进的封闭序列的基础上，在本申请第二种典型的实施方式中，提供了一种捕获试剂盒，该捕获试剂盒包括封闭序列，封闭序列为上述所提供的任意一种改进的封闭序列。该捕获试剂盒中的封闭序列在捕获文库构建时，能够实现目的文库的高效捕获。

在本申请第三种典型的实施方式中，还提供了一种文库杂交捕获方法，该方法包括采用捕获试剂盒对待捕获文库进行捕获，捕获试剂盒采用上述捕获试剂盒。该捕获试剂盒中的封闭序列在捕获文库构建时，能够实现目的文库的高效捕获。

此外，为了进一步降低或避免样本标签跳跃现象，发明人在研究中还发现：在建库的过程中，如果想在多样本捕获的过程中每个样本的产出的片段大小一致，则需要在建库过程中对待捕获的文库进行双筛(即两次片段筛选)，分别去掉大的文库片段(约500bp以上)和小的文库片段(约200bp以下)，这样定量时文库质量和分子数相对更一致。这种经过双筛后的文库比单筛(仅筛掉小片段，大片段的存在会使混库不均一)后的文库在混合捕获时的产出更均匀。

而且更重要的是，经过双筛后的文库混合捕获出现样本标签跳跃的现象明显比单筛的减少很多。如图4所示，单筛只进行一次纯化，而双筛由于去掉大片段和小片段需要经过至少两次纯化，因而纯化后的文库中接头残留相对更少，因而也能从一定程度上减少样本标签跳跃现象。发明人进一步还发现，与双筛选A方案相比，双筛选B方案不仅筛选后文库的得率高，而且接头去除效果更好。两种双筛方案的区别仅在于：双筛选B第一次纯化回收加入的磁珠体积相对第二次稍少，去除小片端的能力强，第二次纯化回收加入的磁珠体积较多，文库得率高。而双筛选A在第二次纯化回收时加入的磁珠体积较少，因而回收片段得率不高。

如前述双筛文库的样本之间标签跳跃现象明显低于单筛选文库的样本之间标签跳跃水平，且双筛选B方案中样本之间标签跳跃现象明显更低。在此基础上，在本申请一种优选的实施例中，还提出了一种更优化的文库杂交捕获的方法，该方法在采用捕获试剂盒对待捕获文库进行捕获之前，还包括对待捕获文库进行片段筛选；优选地，对待捕获文库进行片段筛选的步骤包括：采用磁珠对待捕获文库进行第一次筛选和第二次筛选，其中，第一次筛选的文库片段与第二次筛选的文库片段的长度不同；更优选地，第一次筛选的文库片段的长度为≤200bp的文库片段，第二次筛选的文库片段的长度为≥500bp的文库片段。

在一种优选的实施例中，上述对待捕获文件进行片段筛选的步骤包括：采用第一体积的磁珠对待捕获文库进行第一次纯化，得到第一纯化文库；采用第二体积的磁珠对纯化文库进行第二次纯化以去除≥500bp的文库片段，得到第二纯化文库；采用第三体积的磁珠对第二纯化文库进行第三次纯化以去除≤200bp的文库片段，得到纯化后的待捕获文库。对于350～550bp的文库片段长度而言，第一体积优选为45～60μl，第二体积优选为25～30μl，第三体积优选为8～10μl。采用该优选实施例中的筛选方案，能够把大于目的片段大小或者小于目的片段大小的文库片段去除掉，但由于第三体积用量相对较少，因而纯化后的目的片段大小的文库收率会相对较低。

而在另一种优选的实施例中，对待捕获文件进行片段筛选的步骤包括：采用第一体积的磁珠对待捕获文库进行第一次纯化以去除≤200bp的文库片段，得到第一纯化文库；采用第二体积的磁珠对第一纯化文库进行第二次纯化以去除≥500bp的文库片段，得到第二纯化文库；采用第三体积的磁珠对第二纯化文库进行第三次纯化以回收目的大小的文库片段，得到纯化后的待捕获文库。对于350～550bp的文库片段长度而言，第一体积优选为15～30μl，第二体积优选为25～30μl，第三体积优选为25～30μl。采用该优选实施例中的筛选方案，不仅能够把大于目的片段大小或者小于目的片段大小的文库片段去除掉，而且由于第三体积用量相对较多，因而纯化后的目的片段大小的文库收率相对较高。

发明人还发现封闭序列分子与被封闭序列分子比例大于20：1时封闭效果更好。因而在本申请一种优选的实施例中，采用捕获试剂盒对待捕获文库进行捕获的步骤中，将封闭序列与待捕获文库按照摩尔比为20:1～120：1的比例进行封闭。

在本申请第四种典型的实施方式中，提供了一种建库方法，该建库方法包括：构建片段化文库；对片段化文库进行杂交捕获，得到捕获文库；对捕获文库进行PCR扩增，得到测序文库；采用上述捕获试剂盒进行杂交捕获，或者采用上述任一种方法进行杂交捕获。采用本申请的建库方法所构建的文库中样本标签跳跃现象显著降低。

需要说明的是，本申请所提供的封闭序列是通用型的，只要封闭序列的片段长度≥15bp就可以应用，对于封闭序列中是否包含有标签序列的封闭段，都适用。

下面将结合具体的实施例来进一步说明本申请的有益效果。

需要说明的是，以下实施例采用NanoPrep^TM DNA文库构建试剂盒(for

)(201807Version1.0)(纳昂达(南京)生物科技有限公司)所提供的文库构建流程进行。具体流程简述如下：

DNA样本片段化---末端修复和加A---接头连接---片段筛选---PCR扩增---文库纯化、定量和质检---使用Illumina平台测序或靶向捕获后测序。

还需要说明的受理，以下实施例仅是示例性说明，并不限定本申请的方法仅能采用如下方法。

实施例1建库过程中的单、双筛选

方法一：片段单选(gDNA/FFPE DNA样本推荐使用)

1、提前将NanoPrep^TM SP磁珠取出涡旋混匀，室温平衡30min后使用。

2、根据下表向接头连接完成后的连接体系的PCR管加入V1(参见表1-1)体积NanoPrep^TM SP磁珠，混合均匀，25℃孵育5～10min。

表1-1：

加入DNA(片段化后)	NanoPrep<sup>TM</sup> SP磁珠用量(V1)
		≥50ng	40μl
＜50ng	30μl

3、将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清，使用移液器吸取移弃上清。

4、沿PCR管侧壁缓慢加入150μl80％乙醇，注意勿扰动磁珠，静置30s，使用移液器吸取移弃上清。

5、重复步骤4一次。

6、将PCR管瞬时离心后放置于磁力架上，使用10μl吸头移去少量残留乙醇，注意勿吸到磁珠。

7、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。

8、移出PCR管，向PCR管中加入21μl无RNA酶的水，将磁珠悬浮均匀，25℃孵育2min。

9、将PCR管瞬时离心后放置于磁力架上2min至液体完全澄清，使用移液器吸取20μl上清，并转移至1个新的0.2ml PCR管中，置于冰上备用。

方法二：片段双选A(gDNA样本，加入DNA≥50ng推荐使用)

1、提前将NanoPrep^TM SP Beads取出涡旋混匀，室温平衡30min后使用。

2、向接头连接完成后的连接体系PCR管加入50μl体积的NanoPrep^TM SP Beads(具有对体系归零的效果)，混合均匀，25℃孵育5～10min。

5、重复步骤4一次。

7、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。

8、移出PCR管，向PCR管加入50μl Nuclease Free Water，将磁珠悬浮均匀，25℃孵育2min。

9、加入V1(参见表1-2)体积的NanoPrep^TM SP Beads(具有去除大片段的效果)，混合均匀，25℃孵育5～10min。

表1-2：

10、将PCR管瞬时离心后放置于磁力架上5min，至液体完全澄清，使用移液器吸取全部上清(50μl+V1)转移至1个新的0.2ml PCR管。

11、向装有转移上清的PCR管中加入V2体积的NanoPrep^TM SP Beads(具有去除小片段，同时回收目的片段的效果)，混合均匀，25℃孵育5～10min。

12、将PCR管瞬时离心后放置于磁力架上5min，至液体完全澄清，使用移液器吸取移弃上清。

13、将PCR管放回磁力架上，沿PCR管侧壁缓慢加入150μl80％乙醇，注意勿扰动磁珠，静置30s，使用移液器吸取移弃上清。

14、重复步骤13一次。

15、PCR管瞬时离心，放置于磁力架上，使用10μl吸头移去少量残留乙醇，注意勿吸到磁珠。

16、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。注意：切勿过分干燥，否则会降低得率。

17、移出PCR管，向PCR管中加入21μl Nuclease Free Water，使用移液器将磁珠悬浮均匀，25℃孵育2min。

18、将PCR管瞬时离心后放置于磁力架上2min，至液体完全澄清，使用移液器吸取20μl上清，转移至1个新的0.2ml PCR管中，置于冰上备用。

方法三：片段双选B(gDNA样本，加入DNA≥50ng推荐使用)

2、向接头连接完成后的连接体系PCR管加入V3(参见表1-3)体积的NanoPrep^TM SPBeads(具有对体系归零，同时去除小片段的效果)，混合均匀，25℃孵育5～10min。

表1-3：

5、重复步骤4一次。

7、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。

9、加入V4(参见表1-3)体积的NanoPrep^TM SP Beads(具有去除大片段的效果)，混合均匀，25℃孵育5～10min。

10、将PCR管瞬时离心后放置于磁力架上5min，至液体完全澄清，使用移液器吸取全部上清(50μl+V4)转移至1个新的0.2ml PCR管。

11、向装有转移上清的PCR管中加入30μl NanoPrep^TM SP Beads(具有回收目的片段的效果)，混合均匀，25℃孵育5～10min。

14、重复步骤13一次。

将上述方法一、方法二和方法三的片段筛选步骤所筛选后的文库按照试剂盒步骤进行后续的PCR扩增---文库纯化、定量和质检---使用Illumina平台测序或靶向捕获后测序步骤(即除片段筛选步骤外，其余步骤完全相同)。最后，根据测序结果进行分析样本标签跳跃现象，分析结果见图4。从图4中可以看出，单筛后测序结果中出现标签跳跃的数据占比为1.25％采用双筛选A方法所构建的文库测序结果中标签跳跃的数据占比为0.23％，而采用双筛选B方法所构建的文库测序结果中标签跳跃的数据占比仅为0.12％，是双筛选A的一半。

实施例2

采用前述NanoPrep^TM DNA文库构建试剂盒中的构建步骤，其中杂交捕获的步骤按以下进行：

真空浓缩后进行多文库混合杂交捕获时，具体的杂交文库混合步骤如下表2-1：

表2-1：

1)对照A---现有技术中的一对一封闭

1.1p5端一对一封闭序列(SEQ ID NO:6)

AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTGCGCATATGTGTAGATCTCGGTGGTCGCCGTATCATT

1.2p7端一对一封闭序列(SEQ ID NO:7)

AGATCGGAAGAGCACACGTCTGAACTCCAGTCACCTGATCGTATCTCGTATGCCGTCTTCTGCTTG

注：加粗加下划线部分是标签序列，不同封闭序列的该部分不同，该实施例使用的是IDT的udi接头和对应的封闭序列。

2)对照B---分段封闭

2.1p5端的第一段封闭序列(SEQ ID NO:8)

5’-AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT-3’。

2.2p5端的第二段封闭序列(SEQ ID NO:9)

5’-GTGTAGATCTCGGTGGTCGCCGTATCATT-3’。

2.3p7端的第一段封闭序列(SEQ ID NO:10)

5’-AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’。

2.4p7端的第二段封闭序列(SEQ ID NO:11)

5’-ATCTCGTATGCCGTCTTCTGCTTG-3’。

3)对照C---封闭标签序列用C3 Spacer(C3间臂)

3.1 P5端封闭序列(SEQ ID NO:12)

AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTXXXXXXXXGTGTAGATCTCGGTGGTCGCCGTATCATT；

3.2 P7端封闭序列(SEQ ID NO:13)

AGATCGGAAGAGCACACGTCTGAACTCCAGTCACXXXXXXXXATCTCGTATGCCGTCTTCTGCTTG；

X表示C3 Spacer。

4)本申请改进的Illumina接头通用型封闭序列

4.1通用碱基用I的封闭序列，即SEQ ID NO:1所示的P5端封闭序列和SEQ ID NO:2所示的P7端封闭序列。

4.2通用碱基用C3 Spacer的封闭序列，即SEQ ID NO:14所示的P5端封闭序列和SEQ IDNO:15所示的P7端封闭序列。

SEQ ID NO:14：

AATGATACGG+CGACCA+CCGAGAT+CTA+CACXXXXXXXXACA+CTCTTT+CCCTA+CA+CGACGCTCTTCCGATCTMGB，

SEQ ID NO:15：

CAAG+CAGAAGA+CGGCATA+CG+AGATXXXXXXXXGTGA+CTGGAGTT+CAGA+CGTGTGCT+CTTCCGATCTMGB

其中，X表示C3 Spacer，+表示LNA修饰。

4.3分段封闭序列，具体序列如下：

P5端第一段封闭序列：SEQ ID NO:16：

AATGATACGG+CGA+CCA+C+CGAGAT+CTA+CACMGB；

P5端第二段封闭序列：SEQ ID NO:17：

ACA+CT+CTTT+CCCTA+CA+CGACG+CTCTTCCGATCTMGB；

P7端第一段封闭序列：SEQ ID NO:18：

CAAG+CAGA+AGA+CGGCATA+CG+AGATMGB；

P7端第二段封闭序列：SEQ ID NO:19：

GTGA+CTGG+AGTT+CAGA+CGTGTGCT+CTTC+CGATCTMGB；

+表示LNA修饰。

具体杂交捕获步骤如下：

1、按照上表将各组分混合于一个0.2/1.5ml的低吸附离心管中，涡旋混匀，瞬时离心。

2、将离心管放入提前预热至60℃的真空浓缩仪中干燥。

3、待全部液体蒸发并完全干燥后，将离心管密封后备用。

4、取出

Exome Research Panel v1.0在冰上自然融解，使用后按需小量分装。

5、根据下表2-2配制杂交反应液，使用移液器混合均匀后加入到已经真空浓缩干燥的离心管底部，使用移液器轻柔吹吸混匀15～20次，瞬时离心，25℃孵育5～10min。

表2-2：

6、涡旋混匀杂交反应混合液，瞬时离心后，将离心管中的全部17μl杂交反应混合液转移至一个新的0.2ml PCR管中，瞬时离心，放进PCR仪中，启动如下杂交程序：

表2-3：

7、杂交文库洗脱

(1)准备工作

1、取出

Hybridization and Wash Kit中的其他试剂室温自然融解，涡旋混合均匀(注意：Wash Buffer I如果无法融解，可于65℃水浴孵育至完全融解)。

2、Dynabeads^TM M-270 Streptavidin Beads涡旋混合均匀，室温平衡30min后方可进行链霉亲和素磁珠的清洗和捕获步骤。

(2)试剂配制

1、洗脱缓冲液的配制

根据下表2-4体系配制洗脱缓冲液的1X工作液：

表2-4：

组分名称	Rnase-free水	缓冲液	总计
				2X磁珠洗脱缓冲液	160μl	160μl	320μl
10X洗脱缓冲液I	252μl	28μl	280μl
				10X洗脱缓冲液II	144μl	16μl	160μl
10X洗脱缓冲液III	144μl	16μl	160μl
				10X Stringent洗脱缓冲液	288μl	32μl	320μl

2、磁珠悬浮液配制，如表2-5。

表2-5：

(3)亲和素磁珠清洗

1、将Dynabeads^TM M-270 Streptavidin Beads涡旋混匀15s,确保完全混匀。吸取50μlM270磁珠至1个1.5ml低吸附离心管中。

2、向离心管中加入100μl1X Bead Wash Buffer，轻柔吹吸混匀10次，瞬时离心，置于磁力架上数分钟，待液体完全澄清，使用移液器移弃上清。将离心管从磁力架上移出。

3、重复步骤2两次。

4、向离心管中加入17μl磁珠悬浮液，轻柔吹吸混匀，将全部磁珠悬浮液转移至1个新的0.2ml低吸附PCR管中。

(4)链霉亲和素磁珠捕获

1、4～16h杂交反应后，调节PCR仪进入到洗脱程序。

2、将重悬的链霉亲和素磁珠加入到杂交体系中，并使用移液器轻柔吹吸混匀或涡旋混匀。

3、65℃孵育45min，每10～12min轻柔涡旋一次，确保磁珠完全重悬。

(5)热洗脱(注意：热洗脱过程操作要迅速；吹吸混匀过程中尽量避免产生气泡)

1、孵育结束后从PCR仪上取下PCR管，并向其中加入100μl65℃1X Wash Buffer I，吹吸混匀含有磁珠的杂交体系。

2、将PCR管置于磁力架上1min，待液体完全澄清后，使用移液器吸取移弃上清。

3、将PCR管从磁力架上移出，加入150μl65℃1X Stringent Wash Buffer，轻柔吹吸10次混合均匀，放进PCR仪中65℃孵育5min。

4、重复步骤2和3一次。

(6)室温洗脱

1、将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，加入150μl室温1X Wash Buffer I，涡旋混匀，室温孵育2min，期间涡旋混匀30s后静置30s，交替进行，确保充分混匀。

2、将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，加入150μl室温1X Wash Buffer II，涡旋混匀，室温孵育2min，期间涡旋混匀30s后静置30s，交替进行，确保充分混匀。

3、将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，加入150μl室温1X Wash Buffer III，涡旋混匀，室温孵育2min，期间涡旋混匀30s后静置30s，交替进行，确保充分混匀。

4、将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，之后换用10μl吸头移去少量残余Buffer。

5、将PCR管从磁力架上移出，加入22.5μl Nuclease Free Water，使用移液器轻柔吹吸10次，确保混合均匀，转移全部液体至一个新的0.2ml PCR管中。

后续的PCR扩增及文库纯化和定量步骤按照NanoPrep^TM DNA文库构建试剂盒(for

)(201807Version1.0)的说明书进行操作即可。

本申请所提供的封闭序列在标签序列区域是通用封闭碱基，不是具体的标签碱基，因而无论封闭文库的3’端和/或5’端，都不会产生文库标签跳跃的问题。本申请所提供的通用型的封闭序列有两种提升与待封闭序列杂交结合力的碱基(LNA/BNA修饰与MGB修饰)，如图5所示(其中A代表现有技术中的一对一的封闭效果，B代表现有技术中不封闭标签序列的分段封闭的封闭效果，C代表单纯用通用碱基替换标签序列的封闭效果，而LNA+MGB(通用碱基I)、LNA+MGB(通用碱基C3 spacer)和分段封闭LNA+MGB，分别代表本申请的三种不同结构的封闭序列的封闭效果)，本申请的封闭序列的封闭效果明显比现有技术中的一对一的封闭序列的封闭效果好，也比没有修饰碱基的单纯在分子标签序列区域加通用碱基的效果好，同时更比只封闭接头非标签区域的截短型的通用型封闭效果好。

实施例3

影响封闭效果的因素除了实施例2中说明的封闭序列修饰提升封闭序列与被封闭序列结合能力外，还可以通过封闭序列与被封闭文库的分子数来进一步提升。建库和杂交实验流程与实施例1和2相同，该实施例采用SEQ ID NO:1和SEQ ID No:2所示的封闭序列分别做下列杂交捕获测序，文库和封闭序列比例如下表3-1。

表3-1：文库与封闭序列混比

注：1500ng文库，400bp长度相当于6pmol分子。

捕获后测序，捕获效率在封闭序列分子与文库分子大于20：1时效果较好，而小于20：1时捕获效率相对降低，结果如图6所示。当封闭序列和文库分子数比例在20：1、30：1、50：1和120:1时均能很好的封闭，捕获效率都在90～92％之间，当封闭序列和文库分子数比例在10：1和5：1时的封闭效果相对较低。该实施例表明封闭序列分子与被封闭序列分子比例大于20：1时封闭效果更好。

从以上的描述中，可以看出，本发明上述的实施例实现了如下技术效果：本发明的封闭序列在标签序列区域是用弱的通用碱基，其与标签序列的结合能力相对较弱，但在3’末端用MGB等封闭修饰以及在非标签序列区域用LNA或BNA修饰，增强了非标签序列区域的结合能力，因而本申请的通用性的封闭序列的封闭效果明显比现有技术中封闭效果最好的一对一序列的封闭效果还好，同时大大降低了标签在混合捕获的文库中跳跃现象。

而且，本申请所提供的通用型的封闭序列是一种简单易用，高效的封闭序列，除适用于Illumina平台外，还可以适用于其他测序平台，比如MGI测序平台，因而具有推广价值。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

序列表

<110> 纳昂达（南京）生物科技有限公司

<120> 封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法

<130> PN102954NAGD

<160> 19

<170> SIPOSequenceListing 1.0

<210> 1

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (30)..(37)

<223> n代表次黄嘌呤核苷酸I

<220>

<221> misc_feature

<222> (11)..(70)

<223> 第11、17、24、47、52及54位的碱基为LNA或BNA修饰，末位碱基T为MGB修饰

<400> 1

aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 2

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (25)..(32)

<223> n代表次黄嘌呤核苷酸I

<220>

<221> misc_feature

<222> (1)..(66)

<223> 第5、12、19、37、45及49位碱基为LNA或BNA修饰，末位碱基为MGB修饰

<400> 2

caagcagaag acggcatacg agatnnnnnn nngtgactgg agttcagacg tgtgctcttc 60

cgatct 66

<210> 3

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (18)..(27)

<223> n代表次黄嘌呤核苷酸I

<220>

<221> misc_feature

<222> (1)..(59)

<223> 第7、8、13、32、36及42位碱基进行LNA或BNA修饰，末位碱基进行MGB修饰

<400> 3

tgtgagccaa ggagttgnnn nnnnnnnttg tcttcctaag accgcttggc ctccgactt 59

<210> 4

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(25)

<223> 第4、7、12、15及19位碱基进行LNA或BNA修饰，末位碱基进行MGB修饰

<400> 4

gaacgacatg gctacgatcc gactt 25

<210> 5

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(1)

<223> 第一位的n代表MGI平台接头的第一封闭段，n的长度为20~30bp,其中有3~5个LNA或BNA修饰的碱基

<220>

<221> misc_feature

<222> (2)..(11)

<223> 第2-11位的n代表次黄嘌呤核苷酸I

<220>

<221> misc_feature

<222> (1)..(36)

<223> 第15、18、23、26、29位碱基为LNA或BNA修饰，末位碱基为MGB修饰

<400> 5

nnnnnnnnnn ngaacgacat ggctacgatc cgactt 36

<210> 6

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (34)..(41)

<223> 第34-41位碱基为标签封闭段

<400> 6

agatcggaag agcgtcgtgt agggaaagag tgtgcgcata tgtgtagatc tcggtggtcg 60

ccgtatcatt 70

<210> 7

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (35)..(42)

<223> 35-42位碱基为标签封闭段

<400> 7

agatcggaag agcacacgtc tgaactccag tcacctgatc gtatctcgta tgccgtcttc 60

tgcttg 66

<210> 8

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(33)

<223> P5分段封闭序列的第一段封闭序列

<400> 8

agatcggaag agcgtcgtgt agggaaagag tgt 33

<210> 9

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(29)

<223> P5分段封闭序列的第二段封闭序列

<400> 9

gtgtagatct cggtggtcgc cgtatcatt 29

<210> 10

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(34)

<223> P7分段封闭序列的第一段封闭序列

<400> 10

agatcggaag agcacacgtc tgaactccag tcac 34

<210> 11

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(24)

<223> p7分段封闭序列的第二段封闭序列

<400> 11

atctcgtatg ccgtcttctg cttg 24

<210> 12

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (34)..(41)

<223> 34-41位的n代表C3 spacer

<400> 12

agatcggaag agcgtcgtgt agggaaagag tgtnnnnnnn ngtgtagatc tcggtggtcg 60

ccgtatcatt 70

<210> 13

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (35)..(42)

<223> 35-42位n代表C3 spacer

<400> 13

agatcggaag agcacacgtc tgaactccag tcacnnnnnn nnatctcgta tgccgtcttc 60

tgcttg 66

<210> 14

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (30)..(37)

<223> 30-37位的n代表C3 Spacer

<220>

<221> misc_feature

<222> (1)..(70)

<223> 第11、17、24、27、41、47、52及54位碱基进行LNA修饰，末位碱基进行MGB修饰

<400> 14

aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 15

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (25)..(32)

<223> 第25-32位的n代表C3spacer

<220>

<221> misc_feature

<222> (1)..(66)

<223> 第5、12、19、21、37、45、49及57位碱基进行LNA或BNA修饰，末位碱基进行MGB修饰

<400> 15

caagcagaag acggcatacg agatnnnnnn nngtgactgg agttcagacg tgtgctcttc 60

cgatct 66

<210> 16

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(29)

<223> P5分段封闭序列的第一段，第11、14、17、18、24及27位碱基进行LNA修饰，末位碱基进行MGB修饰

<400> 16

aatgatacgg cgaccaccga gatctacac 29

<210> 17

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(33)

<223> P5分段封闭的第二段，第4、6、10、15、17及22位碱基进行LNA修饰，末位碱基进行MGB修饰

<400> 17

acactctttc cctacacgac gctcttccga tct 33

<210> 18

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(24)

<223> P7分段封闭序列的第一段，第5、9、12、19及21位碱基进行LNA修饰，末位碱基进行MGB修饰

<400> 18

caagcagaag acggcatacg agat 24

<210> 19

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(34)

<223> P7分段封闭序列第二段，第5、9、13、17、25及29位碱基进行LNA修饰，末位碱基进行MGB修饰

<400> 19

gtgactggag ttcagacgtg tgctcttccg atct 34

Claims

1.一种封闭序列，其特征在于，所述封闭序列按照从5’到3’的方向包括：

第一封闭段，

第二封闭段，设置在所述第一封闭段下游，且所述第一封闭段和第二封闭段的3’端带有封闭修饰；

其中，所述第一封闭段和所述第二封闭段上的部分碱基为LNA或BNA修饰的碱基。

2.根据权利要求1所述的封闭序列，其特征在于，所述第一封闭段和第二封闭段的3’端的封闭修饰为MGB修饰、C3间臂修饰，3’磷酸化修饰，3’地高辛修饰，3’生物素修饰或3’端的碱基为双脱氧碱基。

3.根据权利要求1所述的封闭序列，其特征在于，所述封闭序列还包括：标签封闭段，所述标签封闭段位于所述第一封闭段和所述第二封闭段之间，所述标签封闭段采用通用封闭碱基。

4.根据权利要求3所述的封闭序列，其特征在于，所述通用封闭碱基为I和/或C3间臂。

5.根据权利要求1至4中任一项所述的封闭序列，其特征在于，所述LNA或BNA修饰的碱基在所述第一封闭段或所述第二封闭段中的数目为3～6个。

6.根据权利要求3所述的封闭序列，其特征在于，所述封闭序列为Illumina测序平台的P5端封闭序列和/或P7端封闭序列；

优选地，所述P5端封闭序列为SEQ ID NO:1：

AATGATACGG+CGACCA+CCGAGAT+CTACACIIIIIIIIACACTCTTT+CCCTA+CA+CGACGCTCTTCCGATCTMGB；其中+表示所述LNA或BNA修饰，I为所述通用封闭碱基，MGB为所述3’端的封闭修饰；

优选地，所述P7端封闭序列为SEQ ID NO:2：

CAAG+CAGAAGA+CGGCATA+CGAGATIIIIIIIIGTGA+CTGGAGTT+CAGA+CGTGTGCTCTTCCGATCTMGB；其中+表示LNA或BNA修饰，I为所述通用封闭碱基，MGB为所述3’端的封闭修饰。

7.根据权利要求3所述的封闭序列，其特征在于，所述封闭序列为MGI测序平台的第一标签接头的封闭序列或通用接头的封闭序列或第二标签接头的封闭序列；

优选地，所述第一标签接头的封闭序列为SEQ ID NO:3：

TGTGAG+C+CAAGG+AGTTGIIIIIIIIIITTGT+CTTC+CTAAGA+CCGCTTGGCCTCCGACTTMGB，其中+表示LNA或BNA修饰，I为所述通用封闭碱基，MGB为所述3’端的封闭修饰；

优选地，所述通用接头的封闭序列为SEQ ID NO:4：

GAA+CGA+CATGG+CTA+CGAT+CCGACTTMGB，其中+表示LNA或BNA修饰，MGB为所述3’端的封闭修饰；

优选地，所述第二标签的封闭序列为：

SEQ ID NO:5:(N)_nIIIIIIIIIIGAA+CGA+CATGG+CTA+CGAT+CCGACTTMGB，其中(N)_n表示所述第一封闭段，n表示所述第一封闭段的长度，n为20～30，所述(N)_n中含有3～5个LNA修饰或BNA修饰的碱基，I为所述通用封闭碱基，+表示LNA或BNA修饰，MGB为所述3’端的封闭修饰。

8.一种捕获试剂盒，所述捕获试剂盒包括封闭序列，其特征在于，所述封闭序列为权利要求1至7中任一项所述的封闭序列。

9.一种文库杂交捕获方法，所述方法包括采用捕获试剂盒对待捕获文库进行捕获，其特征在于，所述捕获试剂盒采用权利要求8所述的捕获试剂盒。

10.根据权利要求9所述的方法，其特征在于，在采用捕获试剂盒对待捕获文库进行捕获之前，所述方法还包括，对所述待捕获文库进行片段筛选；

优选地，采用磁珠对所述待捕获文库依次进行第一次筛选和第二次筛选，其中，第一次筛选的文库片段与所述第二次筛选的文库片段的长度不同；

更优选地，所述第一次筛选的文库片段的长度为≤200bp的文库片段，所述第二次筛选的文库片段的长度为≥500bp的文库片段。

11.根据权利要求9或10所述的方法，其特征在于，采用捕获试剂盒对待捕获文库进行捕获的步骤包括：

将所述封闭序列与所述待捕获文库按照摩尔比为20:1～120：1的比例进行封闭。

12.一种建库方法，所述建库方法包括：

构建片段化文库；

对所述片段化文库进行杂交捕获，得到捕获文库；

对所述捕获文库进行PCR扩增，得到测序文库；

其特征在于，采用权利要求8所述的捕获试剂盒进行所述杂交捕获，或者采用权利要求9至11中任一项所述的方法进行所述杂交捕获。