WO2023216030A1

WO2023216030A1 - 一种占位引物和去除方法

Info

Publication number: WO2023216030A1
Application number: PCT/CN2022/091488
Authority: WO
Inventors: 李长英; 李计广; 徐崇钧
Original assignee: 深圳华大智造科技股份有限公司
Priority date: 2022-05-07
Filing date: 2022-05-07
Publication date: 2023-11-16
Also published as: CN118401679A

Abstract

一种在测序中使用的占位引物和去除方法。所述占位引物包括3'端的阻断基团，且所述占位引物的3'端序列与测序模板的部分序列互补，5'端序列不与所述测序模板配对。一种去除引物和相关的测序方法。通过在占位引物的5'端引入一段不与模板配对的序列，利用DNA的分支迁移作用在需要去除占位引物时，可以容易地将占位引物去除。

Description

一种占位引物和去除方法

技术领域

本发明属于生物技术领域，更具体而言涉及一种在测序中使用的占位引物及其使用方法和用途。

背景技术

在现有的DNA测序过程中，经常需要利用占位引物来阻止链从特定位置开始延伸，或者防止因为测序长度较长而覆盖住仍需用到的模板序列。例如，在DNBSEQ技术的小RNA文库测序和SE400的测序中，为了防止某些插入片段长度小于测序读长的文库在测序时测到接头影响后序条形码序列的测序，会在测序开始时先用一个3’端被阻断掉的占位引物将条形码部分的接头序列覆盖住，在完成插入片段的测序之后，利用一些物理或化学方法将占位引物去除掉，然后再用正常的引物测序条形码序列。

在现有的技术中有以下几种方法来去除占位引物或者避免使用占位引物：1)先测序条形码序列，后测插入片段的序列，但这种方法会导致插入片段的测序质量降低；2)利用超过引物Tm值的高温使占位引物从模板上解离下来，但这种方法的缺点是高温可能会对测序模板造成一些损伤，而且对于Tm值较高的占位引物不适用；3)利用可以变性DNA双链的化学试剂使占位引物与模板解链，例如利用强酸、强碱、甲酰胺、尿素等，但这些化学试剂会对模板造成损害，影响测序；4)占位引物的3’端使用可以恢复成能够延伸的3’端的修饰方法进行修饰，待需要从占位引物位置处开始测序时，通过化学反应将3’端的羟基恢复，例如在占位引物的3’端用磷酸化修饰，用去磷酸化酶可以恢复3’端羟基，但这种方法需要用到额外的酶或者其他试剂，会增加成本、时间和操作步骤。

发明内容

本发明的目的在于当测序过程中使用了占位引物时，提供一种新的方法使得在不影响测序质量的情况下，可以简单、有效地去除占位引物，并且无需特殊的酶等化学试剂，可以降低成本。

因此，在第一方面，本发明提供一种在测序中使用的占位引物，所述占位引物包括3’端的阻断基团，且所述占位引物的3’端序列与测序模板的部分序列互补，5’端序列不与所述测序模板配对。

在一个实施方案中，所述阻断基团是磷酸化阻断基团、空间阻断基团、双脱氧核苷酸阻断基团或其他可以阻止3’端延伸的基团。

在一个实施方案中，所述占位引物的长度为10-300nt，优选30-70nt，更优选40-50nt。

在一个实施方案中，所述占位引物的5’端非匹配区的长度为3-200nt，优选5-50nt，更优选10-35nt。

在一个实施方案中，所述占位引物的3’端匹配区的长度为10-200nt，优选20-60nt，更优选30-50nt。

在第二方面，本发明提供了一种在聚合反应中使用的占位引物和去除引物，所述占位引物如本发明第一方面所述占位引物，所述去除引物为与所述占位引物完全互补的反向引物。

在第三方面，本发明提供了一种在聚合过程中引入占位引物和去除占位引物的方法，

所述引入占位引物包括：向测序模板中引入占位引物，所述占位引物包括3’端的阻断基团，且所述占位引物的3’端序列与所述测序模板的部分序列互补，5’端序列不与所述测序模板配对；

所述去除占位引物包括：引入与所述占位引物完全互补的反向引物，使所述反向引物先与所述占位引物的5’端结合，然后将所述占位引物从所述测序模板上置换下来。

在一个实施方案中，所述引入占位引物和去除引物的方法用于核酸序列测定。

在第四方面，本发明提供了一种测序方法，所述方法包括：

1)如本发明第三方面所述引入占位引物；

2)利用测序引物对所述待测核酸进行测序；

3)如本发明第三方面所述去除所述占位引物。

在一个实施方案中，在2)中，当文库插入片段小于测序读长时，对插入片段测序完成后，由于占位引物的存在不能继续往前延伸。

在一个实施方案中，所述测序方法还包括4)利用测序引物对待测核酸进行测序，所述待测核酸位于占位引物结合位点下游。

在一个实施方案中，所述测序引物为条形码引物，利用条形码引物对待测核酸进行测序，所述待测核酸为条形码序列，位于条形码引物结合位点下游。

在一个实施方案中，所述方法还包括对条形码序列进行测序。

本发明通过在占位引物的5’端引入一段不与模板配对的序列，利用DNA的分支迁移作用将占位引物从模板上置换下来，可以容易地将占位引物去除。

附图说明

图1的示意图示出了占位引物与测序引物同时杂交到模板上。该占位引物除了有完全与模板序列互补的序列外，其5’端还连接有一条不与接头互补的特异序列。

图2的示意图示出了当文库的插入片段小于测序读长时，插入片段被测完之后，占位引物阻止测序片段沿着模板继续延伸。

图3的示意图示出了反向引物置换占位引物。

图4示出了测试组和对照组的拆分率。

图5示出了不同条形码的准确率。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明中，占位引物的3’端序列与模板部分序列互补，5’端是一段特异序列，该特异序列不与文库或者接头序列互补。占位引物的长度为10-300nt，优选30-70nt，更优选40-50nt，其5’端非匹配区的长度为3-200nt，优选5-50nt，更优选10-35nt，其3’端匹配区的长度为10-200nt，优选20-60nt，更优选30-50nt。待阻断部分序列可以是模板上的任意序列，优选模板的条形码部分的接头序列。

在本发明中，占位引物的3’端是阻断基团，阻断基团可以阻断测序片段沿着模板继续延伸。阻断基团可以是磷酸化阻断基团、空间阻断基团、双脱氧核苷酸阻断基团或其他可以阻止3’端延伸的基团。

在测序时，占位引物的3’端与模板上的待阻断部分，例如条形码部分的接头序列互补，可以达到占位的目的。占位引物的5’端不与任何序列互补，可以作为一条单链状态的“尾巴”存在。占位引物和模板的关系如图1所示。在图1中，3’端被阻断修饰的占位引物和正常的测序引物同时杂交到模板上。测序开始之后，链从正常测序引物的3’端延伸，依次读出模板序列。占位引物由于3’端做了阻断修饰，不可以延伸，从而起到防止文库由于插入片段小于测序读长被完全测完之后，测序链将该位置的接头覆盖，影响后序条形码测序的作用。

在本发明中，在测序过程中，插入片段小于测序读长的文库序列会测到占位引物的位置，占位引物阻止测序片段沿着模板继续延伸。在文库插入片段被完全测完时，测序序列会以占位引物的5’端的“尾巴”作为模板，继续往前延伸，如图2所示。图2示出了文库插入片段被测完之后继续以占位引物的5’端为模板延伸。

在本发明中，在需要去除该占位引物时，引入一条与占位引物完全互补的反向引物并给予合适的退火温度。退火温度取决于占位引物和反向引物互补序列的长度，一般而互补序列的长度越长，需要的退火温度越高，可以通过常规的方法检测互补序列的退火温度，也可以通过模型计算的方式得到互补序列的退火温度。在加入反向引物序列后，反向引物序列先与占位引物5’端的“尾巴”结合，然后在合适的条件下会将占位引物上与模板接头结合的序列置换出来，如图3所示。图3示出了反向引物从模板上置换占位引物。占位引物与反向引物结合，形成的双链DNA从而从模板上脱离下来，形成双链的占位引物与反向引物可以被缓冲液冲走。

实施例1。

1.器材：

MGISEQ-2000测序仪、MGISEQ-2000测序试剂载片、迷你装载仪、PCR仪、PCR八连管、Eppendorf移液器一套、Effendorf高速离心机等。

2.试剂：

试剂名称

品牌

DNBSEQ-G400RS高通量测序试剂盒	MGI
新型占位引物	生工生物
5×SSC缓冲液	MGI
反向引物	生工生物
甲酰胺	生工生物
大肠杆菌文库	MGI

3.试剂准备：

1)所需引物的溶解、测试占位引物、反向引物、对照占位引物以及接头序列如下：

测试占位引物：

agagtgaccgtgcctAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(3’端做阻断修饰)(SEQ ID NO.1)；

反向引物：

TTGTCTTCCTAAGACCGCTTGGCCTCCGACTTaggcacggtcactct(SEQ ID NO.2)；

对照占位引物：AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(3’端做阻断修饰)(SEQ ID NO.3)；

说明：

文库接头序列：

AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAAXXXXXXXXXXCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT(X表示条形码序列)(SEQ ID NO.4)。

一链测序引物序列：

条形码引物序列：

将装有测试占位引物粉末和反向引物粉末的1.5毫升的离心管在Eppendorf高速离心机(5415D)上，最高转速离心5分钟；按照引物标签上的说明，用1×TE缓冲液将引物溶解至100μM的测试占位引物母液；

2)1μM对照占位引物工作液、1μM测试占位引物工作液和1μM反向引物工作液的配制：

试剂名称	体积
100Μm对照占位引物母液	100微升
5×SSC缓冲液	9.9毫升
总计	10毫升

试剂名称	体积
100μM测试占位引物母液	100微升
5×SSC缓冲液	9.9毫升
总计	10毫升

试剂名称	体积
100μM反向引物母液	100微升
5×SSC缓冲液	9.9毫升
总计	10毫升

4.操作步骤：

1)测序模板的制备，参考《DNBSEQ-G400RS高通量测序试剂套装使用说明书》对大肠杆菌文库进行DNA纳米球的制备和定量，该文库为单链环状DNA，其接头的序列为：AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAAXXXXXXXXXXCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT(X表示条形码序列)(SEQ ID NO.4)。文库的插入片段集中在450bp左右，其中小于400bp的片段含量约占总量的37％。文库中含有条形码编号为97-104的8个子文库。准备两张一样的芯片，将DNA纳米球装载到这两张DNBSEQ-G400RS测序试剂载片上。每张芯片装载两个泳道。

2)准备两套可以跑单末端测序400个循环的试剂盒；其中一套试剂盒选取两个空闲的孔位分别加入3毫升1μM的对照占位引物工作液和3毫升甲酰胺，作为对照组。另一套试剂盒选两个空闲的孔位，分别加入3毫升1μM的测试占位引物工作液和3毫升1μM的反向引物工作液，作为测试组。对照组与测试组的两个泳道作为两个重复。

3)按照《DNBSEQ-G400RS高通量测序试剂套装使用说明书》将测序试剂盒、芯片放在DNBSEQ-G400RS测序仪上。

对照组脚本设置为：

芯片装载好之后先使测序模板杂交对照占位引物，使其将DNB模板上与条形码引物杂交的部分被覆盖住；

然后杂交测序引物测序400个循环的插入片段部分；

用阻断试剂阻止插入片段部分的继续延伸；

用甲酰胺室温处理2分钟后用清洗试剂清洗，以去除对照占位引物；

杂交条形码引物，测序条形码部分10个循环。

测试组的脚本设置为：

芯片装载好之后先杂交测试占位引物，使其将DNB模板上与条形码引物杂交的部分被覆盖住；

然后杂交测序引物测序400个循环的插入片段部分；

再用阻断试剂阻止插入片段部分的继续延伸；

加入反向引物设置55℃10分钟，使反向引物与测试占位引物杂交并将其重模板上置换下来；

杂交条形码引物，测序条形码部分10个循环。

按照设置好的脚本对测试组和对照组进行测序，测序完成之后，通过软件分析得出能够通过条形码序列被拆分出来的读段占总读段的比例(拆分率)。在拆分时，部分含有错误的条形码序列也可以通过容错被准确拆分，分别计算8个条形码子文库中被完全准确拆分的读段(不含容错的读段)与该条形码子文库总读段的比例作为条形码准确率。

5.结果：

结果如图5和图6所示。图5示出了测试组和对照组的拆分率，图6示出了不同条形码的准确率。如图所示，用测试占位引物和反向引物的方法相比对照组拆分率与条形码的准确率均有明显提升。

Claims

一种在聚合反应中使用的占位引物，所述占位引物包括3’端的阻断基团，且所述占位引物的3’端序列与测序模板的部分序列互补，5’端序列不与所述测序模板配对。
根据权利要求1所述的占位引物，所述阻断基团是磷酸化阻断基团、空间阻断基团、双脱氧核苷酸阻断基团或其他可以阻止3’端延伸的基团。
根据权利要求1或2所述的占位引物，所述占位引物的长度为10-300nt，优选30-70nt，更优选40-50nt。
根据权利要求1或2所述的占位引物，所述占位引物的5’端非匹配区的长度为3-200nt，优选5-50nt，更优选10-35nt。
根据权利要求1或2所述的占位引物，所述占位引物的3’端匹配区的长度为10-200nt，优选20-60nt，更优选30-50nt。
一种在聚合反应中使用的占位引物和去除引物，所述占位引物如权利要求1-5任意所述占位引物，所述去除引物为与所述占位引物完全互补的反向引物。
根据权利要求6所述的去除引物，所述去除引物的长度为10-100nt，优选30-70nt，更优选40-50nt。
一种在聚合过程中引入占位引物和去除占位引物的方法，

所述占位引物为根据权利要求1-5任一项所述的占位引物，

所述引入占位引物包括：向测序模板中引入占位引物，所述占位引物包括3’端的阻断基团，且所述占位引物的3’端序列与所述测序模板的部分序列互补，5’端序列不与所述测序模板配对；

所述去除占位引物包括：引入与所述占位引物完全互补的反向引物，

使所述反向引物先与所述占位引物的5’端结合，然后将所述占位引物从所述测序模板上置换下来。
根据权利要求8所述的方法，其中所述引入占位引物和去除引物的方法用于核酸序列测定。
一种测序方法，所述方法包括：

1)如权利要求8所述引入占位引物；

2)利用测序引物对所述待测核酸进行测序；

3)如权利要求8所述引入去除引物去除所述占位引物。
根据权利要求10所述的方法，在2)中，当文库插入片段小于测序读长时，对插入片段测序完成后，由于占位引物的存在不能继续延伸。
根据权利要求10或11所述的方法，还包括4)利用测序引物对待测核酸进行测序，所述待测核酸位于占位引物结合位点下游。
根据权利要求12所述的方法，其中所述测序引物为条形码引物，待测核酸为条形码序列，所述条形码序列位于条形码引物结合位点下游。
根据权利要求13所述的方法，还包括对条形码序列进行测序。