发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种能有效降低PCR扩增过程中的GC偏向性,提高扩增特异性的PCR引物设计策略及相应的PCR引物对。
首先,需要说明的是,本发明是基于发明人的下列发现而完成的:
网上有许多提供免费在线引物设计服务的网址和软件,例如:NetPrimer(www.premierbiosoft.com)。常用的单机引物设计软件有很多不同的产品,各有其优点。RightprimerTM(Bio2Disk)具有超强校对功能,可将待扩增序列的可能引物在很短的时间内,通过查找Genebank,而与背景DNA校对,从而找到特异性极佳之引物。OligoTM(Molecular Biology Insights,Inc.)适合于MultiplexPCR和ConsensusPCR的引物设计,并能给出适合的PCR条件。PrimerPremier(或者Premierbiosoft),可以在核酸序列未知的情况下,通过蛋白质序列来设计引物,这一功能在仅知道部分蛋白质序列,而又想克隆新基因时特别有用。PrimerDesigner210(Scientific and Educational Software)以其短小精悍,功能齐全而得到广泛的应用。
但在实际中工作中,常规引物设计软件设计的好的引物不一定会产生好的结果,特别是那些高GC区域以及模板中有和其他目的区域相似的序列,最终导致引物扩增得到的产物特异性不强,PCR扩增效率不高,而去优化这些区域的引物又往往难以得到满意的结果。
发明人研究后认为,当前的PCR引物设计需要严格按照引物设计条件进行设计,PCR特异性和扩增效率过多依赖于引物设计的好坏,在一些重复区域、高GC区域或是有高级结构的区域引物往往难以得到好的效果,设计引物和引物优化需要花费大量的精力和物力。因而,发明人进行了一系列设计和实验探索,以期改善这一问题。并且,发明人意外地发现:在一对常规引物的5’端加上一段互补的序列,形成的具有“5’端反向互补,3’端突出”的稳定的引物二聚体结构的引物对,能够有效改善上述问题。
并且,发明人还发现在常规引物和互补序列之间设置靶序列不包含的序列作为预定酶切位点,能够在PCR后,通过对扩增产物进行预定酶切位点的酶切有效去除引物和互补序列,有利于后续文库构建、纯化。
进而,在本发明的第一方面,本发明提供了一种PCR引物对。根据本发明的实施例,该PCR引物对包括:第一引物和第二引物,其中,所述第一引物包含第一特异性序列和第一随机序列,所述第一特异性序列位于所述第一引物的3’端,所述第一随机序列位于所述第一引物的5’端,所述第二引物包含第二特异性序列和第二随机序列,所述第二特异性序列位于所述第二引物的3’端,所述第二随机序列位于所述第二引物的5’端,并且,所述第一特异性序列和所述第二特异性序列分别为针对靶序列的上游引物和下游引物,所述第一随机序列和所述第二随机序列反向互补,所述第一特异性序列和所述第一随机序列之间连接有预定酶切位点,所述第二特异性序列和所述第二随机序列之间连接有预定酶切位点,且所述PCR引物对的靶序列不包含所述预定酶切位点。发明人惊奇地发现,本发明的PCR引物对能有效降低PCR扩增过程中的GC偏向性,提高扩增特异性。具体地,用常规引物在二代测序文库PCR富集过程会带来一定的GC偏向性,而本发明的PCR引物对(有时也称为“锁定引物”)能有效降低文库PCR富集过程中的GC偏向性。并且,本发明的PCR引物对在常规引物和互补序列之间设置靶序列不包含的序列作为预定酶切位点,能够在PCR后,通过对扩增产物进行预定酶切位点的酶切有效去除引物和互补序列,有利于后续文库构建、纯化。此外,本发明的PCR引物对尤其适用于多重PCR扩增,也即针对多个靶序列设计获得的本发明的PCR引物对,能够有效地混合使用,即进行多重PCR。
在本发明的第二方面,本发明提供了一种PCR扩增试剂盒。根据本发明的实施例,该试剂盒包含前面所述的PCR引物对。根据本发明的实施例,相对于常规引物,利用该试剂盒采用本发明的PCR引物对进行PCR扩增,扩增过程中的GC偏向性低、扩增特异性高,扩增效果突出。并且,本发明的PCR引物对尤其适于作为多重PCR扩增的引物。
在本发明的第三方面,本发明提供了一种PCR扩增方法。根据本发明的实施例,该方法利用前面所述的PCR引物对或者PCR扩增试剂盒进行所述PCR扩增。由此,利用该方法能够有效实现模板的PCR扩增。并且该方法能够增加PCR扩增的特异性,有效降低非特异性产物的产生,并提高扩增效率。
在本发明的第四方面,本发明提供了一种制备DNA文库的方法。根据本发明的实施例,该方法包括以下步骤:
(1)根据前面所述的PCR扩增方法,将待测DNA样品进行第一PCR扩增,以便获得包含类环状物的第一PCR扩增产物,其中,所述第一特异性序列和所述第一随机序列之间连接有预定酶切位点,所述第二特异性序列和所述第二随机序列之间连接有预定酶切位点,且所述PCR引物对的靶序列不包含所述预定酶切位点,所述类环状物的5’端和3’端未连接,采用的PCR引物对的第一引物和第二引物的5’末端和3’末端的第1-5个碱基经过硫代修饰;以及
(2)利用所述预定酶切位点对应的酶,将所述第一PCR扩增产物进行酶切,并基于酶切产物进行文库制备,以便获得目的DNA文库。
根据本发明的实施例,利用该方法能够有效制备线性DNA文库或环状DNA文库,并且,获得的DNA文库,文库质量好,用于DNA保存或文库测序时效果好。
根据本发明的实施例,本发明的PCR引物对及其应用具有下列优点的至少之一:
1、本发明的PCR引物对的设计策略,简化了引物设计流程、优化了实验步骤,引物对的组成由3’端的特异性序列和5’端的随机序列(互补序列)组成,正反向引物通过互补序列形成一个稳定的二聚体结构,不需要满足常规引物严格的条件,大大简化了设计流程。在常规引物设计过程中需要避免引物5’端和5’端的互补、引物自身形成回文结构等,以保证引物之间不能形成二聚体结构和发生自身延伸进行PCR。但本发明的PCR引物对的设计不需要考虑这些问题,因为锁定引物自身的结构就是5’端互补稳定的二聚体且此时的二聚体的3’端还能正常的和特异性序列进行互补发生延伸,而常规引物如果5’端形成二聚体结构,3’端就没有足够的序列和特异性互补序列进行结合。并且,本发明的锁定引物2条引物之间形成5’端互补序列的势能远远大于自身回文结构,所以就算3’端和5’端有互补的序列也会优先形成5’端二聚体结构。
2、本发明的PCR扩增方法能够增加PCR扩增的特异性,有效降低非特异性产物的产生;其从PCR的第二个循环开始,引物5’端碱基(随机序列)和新生成的模板的5’端的碱基反向互补结合,引物的3’端特异性序列和新生成的模板3’端的碱基反向互补结合,也即引物和模板结合识别位点为2个(如附图3),由此,显著增加了引物和模板的结合能力,以及扩增的特异性。而引物和模板的结合率提高,扩增效率也得到了有效的提高。
3、利用本发明的PCR引物对进行PCR扩增,能够有效降低测序文库(尤其是二代测序文库)扩增中不同模板的GC偏向性,因为PCR扩增只有在模板变性后引物结合上去才能发生有效的扩增。GC偏好性的产生,是因为在一些高GC区域,PCR过程中模板复性很快,模板在引物还没有结合上去就复性了,导致这些区域不能进行有效扩增。而本发明的锁定引物和模板有2个结合位点,这样能够大大提高和模板的结合能力,进而能够有效结合那些高GC的模板,从而降低GC偏向性。
4、本发明的PCR扩增对,在常规引物(即特异性序列)和互补序列(即随机序列)之间设置靶序列不包含的序列作为预定酶切位点,以便能够在PCR后,通过对扩增产物进行预定酶切位点的酶切即可有效去除引物和互补序列,从而有利于后续文库构建、纯化。其中,因靶序列不包含USER酶的酶切位点碱基U,设预定酶切位点为USER酶的酶切位点碱基U,由此,即能方便有效地实现酶切。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
发明详细描述
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
PCR引物对
在本发明的第一方面,本发明提供了一种PCR引物对。根据本发明的实施例,该PCR引物对包括:第一引物和第二引物,其中,所述第一引物包含第一特异性序列和第一随机序列,所述第一特异性序列位于所述第一引物的3’端,所述第一随机序列位于所述第一引物的5’端,所述第二引物包含第二特异性序列和第二随机序列,所述第二特异性序列位于所述第二引物的3’端,所述第二随机序列位于所述第二引物的5’端,并且,所述第一特异性序列和所述第二特异性序列分别为针对靶序列的上游引物和下游引物,所述第一随机序列和所述第二随机序列反向互补,所述第一特异性序列和所述第一随机序列之间连接有预定酶切位点,所述第二特异性序列和所述第二随机序列之间连接有预定酶切位点,且所述PCR引物对的靶序列不包含所述预定酶切位点。发明人惊奇地发现,本发明的PCR引物对能有效降低PCR扩增过程中的GC偏向性,提高扩增特异性。具体地,用常规引物在二代测序文库PCR富集过程会带来一定的GC偏向性,而本发明的PCR引物对(有时也称为“锁定引物”)能有效降低文库PCR富集过程中的GC偏向性。并且,本发明的PCR引物对在常规引物和互补序列之间设置靶序列不包含的序列作为预定酶切位点,能够在PCR后,通过对扩增产物进行预定酶切位点的酶切有效去除引物和互补序列,有利于后续文库构建、纯化。并且,酶切产物的5’端磷酸化,3’端是突出的末端A,不需要额外进行末端修复,直接可用于接头连接。
此外,本发明的PCR引物对尤其适用于多重PCR扩增,也即针对多个靶序列设计获得的本发明的PCR引物对,能够有效地混合使用,即进行多重PCR。这是因为:1、本发明的PCR引物对本身具有很高的特异性;2、不同扩增区域引物之间都有不同的、唯一的互补随机序列,同一扩增区域的引物通过唯一的互补序列紧密联系在一起,避免了不同扩增区域引物之间的互相干扰,有利于抑制非特异性产物的产生。
其中,需要说明的是,本发明的“第一随机序列”和“第二随机序列”可以是随机序列,也可以是固定序列,只要保证两者反向互补即可。
根据本发明的实施例,所述第一特异性序列和所述第二特异性序列的TM值为55-65摄氏度,所述第一引物和所述第二引物的TM值为65-75摄氏度。由此,能够使该PCR先进行第一轮低退火温度(55-65摄氏度)的线状扩增,然后在后面的循环中采用高退火温度(65-72摄氏度)——即进行第二轮环状扩增。由于在环状扩增过程中,该轮退火温度高,特异性序列不能够单独结合到特异性位点(特异性序列的TM值只有55-65),只有当锁定引物的5’端结合到模板的5’端,同时该锁定引物的3’端结合到模板的特异性位点,该PCR才能够进行有效的扩增,也即该轮扩增实际为双结合位点的环状扩增。
本发明的PCR引物对适用于针对任何形式的待测DNA样品进行PCR扩增和文库构建。其中,需要说明的是,在本发明中所述的“待测DNA样品”和常规的理解有些不同,常规理解不包含处理过的DNA。但在本发明中,“待测DNA样品”可包括处理过的DNA以及未经处理的DNA(在构建测序文库时,一般会针对样本的基因组DNA进行打断和加测序接头处理,以得到携带相应平台测序接头的DNA片段,再经过后续扩增等步骤后,得到的产物即可用于测序,该携带相应平台测序接头的DNA片段即为“处理过的DNA片段”,相应地,为经过上述处理的,即为“未经处理的DNA”)。如果是针对未经处理的DNA,利用本发明的PCR引物对扩增,即是针对特异目标片段进行扩增;若是针对处理过的DNA,扩增的目标片段可以为整个基因组的DNA片段。
根据本发明的一些实施例,当待测DNA样品为处理过的、携带通用序列(例如测序接头)的DNA片段(这里的“通用序列”是用于与引物中特异序列配对的序列,包括测序平台接头序列,也即测序接头)时,相应地,所述第一特异性序列和所述第二特异性序列必须能够特异性识别携带通用序列的靶序列,换言之,实际上此时的靶序列实际为“通用序列+目标区域序列”;当待测DNA样品(也即PCR反应模板)为不携带通用序列的DNA片段时,相应地,所述第一特异性序列和所述第二特异性序列能够特异性识别该靶序列即可。并且,此时,如果需要构建测序文库,则可以在第一引物和第二引物的随机序列中或者特异性序列和随机序列之间设置测序接头序列(即通用序列),以便使PCR扩增产物上连接测序接头,进而能够有效用于测序平台。
根据本发明的另一些实施例,所述第一引物和所述第二引物的至少之一进一步包含标签序列,由此,可以同时对多个样本进行PCR扩增,并基于所述标签序列对各个样本进行区分。其中,所述标签序列在第一引物和第二引物中的位置没有特别限制,只要能够使其发挥区分各样本的作用,且不影响PCR扩增进行即可。根据本发明的一些具体示例,所述标签序列可以位于特异性序列和随机序列之间,由此,可以在第一引物的第一特异性序列和第一随机序列之间设置一个标签序列,和/或,在第二引物的第二特异性序列和第二随机序列之间设置一个标签序列。根据本发明的另一个实施例,所述标签序列还可以被设置为包含于随机序列中,也即为随机序列的一部分。由此,同样能够使其发挥区分各样本的作用,且并不影响PCR扩增的进行。
根据本发明的实施例,所述第一随机序列和所述第二随机序列的长度为15-45bp,所述第一特异性序列和所述第二特异性序列的长度为15-30bp。
根据本发明的实施例,所述第一引物和所述第二引物的5’末端和3’末端的第1-5个碱基经过修饰,用以有效防止酶的外切。根据本发明的一些具体示例,所述第一引物和所述第二引物的5’末端和3’末端的第1-5个碱基经过硫代修饰。
根据本发明的一些实施例,硫代修饰的种类不受特别限制,只要能够防止第一引物和所述第二引物被酶外切(例如被具有5-3’或3-5’外切酶活性的酶降解)即可。根据本发明的一些具体示例,所述硫代修饰为选自硫代磷酸型修饰、甲基硫酸型修饰和肽核酸修饰的任意一种。
根据本发明的实施例,所述预定酶切位点为USER酶的酶切位点碱基U。由此,因靶序列不包含USER酶的酶切位点碱基U,从而能够在PCR后,有效对扩增产物进行USER酶切,去除引物和互补序列,有利于后续文库构建、纯化。
此外,需要说明的是,参照图1中本发明的PCR引物对的结构示意图可知,本发明的PCR引物对的设计策略是:在一对常规引物(包括正向引物、反向引物)的5’端加上一段互补的序列,这段互补序列可以是一段随机序列也可以是一段固定序列,由此,即将PCR的一对引物设计成了5’端反向互补,3’端突出的“锁定引物”(PadlockPrimer,PP),锁定引物的引物对之间形成了一个稳定的引物二聚体结构。整个引物对每条链的长度为30-70bp,TM值较高(第一引物和第二引物的TM值一般在65-75摄氏度),其中锁定引物的5’端互补序列(即第一随机序列和第二随机序列)长度为15-45bp,其序列可以是随机的也可以是固定的;3’端(即第一特异性序列和第二特异性序列)长度为15-30bp,其和模板的靶序列互补,TM值较低(一般为55-65摄氏度)。
另外,针对本发明的PCR引物对的应用问题,本发明的PCR引物对需要通过2个不同的扩增部分(即两轮扩增)来实现PCR扩增(参照图3):在第一个扩增部分,退火温度为55-65℃,循环数为1;在第二个扩增部分,退火温度为65-72℃,循环数为5-35。在第一个扩增部分中,PCR引物对只能通过3’端的特异性序列和模板结合,因此该循环的退火温度低;在第二个扩增部分中,PCR引物对先通过5’端互补的序列(即第一随机序列和第二随机序列)和新生成的模板(即第一轮扩增的产物)结合,再通过3’端的特异性序列(即第一特异性序列和第二特异性序列)和新生成的模板结合,也即引物和模板结合识别位点为2个,而2个锚定位点的结合大大提高了引物的退火温度,因此退火温度较高。
此外,需要说明的是,在第二个扩增部分中,引物5’端和3’端只有同时和新生成的模板结合时才能够进行有效的环状扩增,这样,2个识别位点大大提高了该种PCR扩增的特异性,2个结合位点大大提高了引物和模板的结合能力,提高了该PCR的扩增效率。由此,相对于传统PCR引物,采用本发明的PCR引物对进行PCR扩增,能够显著增加PCR扩增的特异性,有效降低非特异性产物的产生,并降低扩增过程中的GC偏向性。由此,在测序中尤其是二代测序文库中应用该种引物,可以有效降低文库富集扩增中全基因组范围内的GC偏向性。
应用
进而,在本发明的第二方面,本发明还提供了一种PCR扩增试剂盒。根据本发明的实施例,该试剂盒包含前面所述的PCR引物对。根据本发明的实施例,相对于常规引物,利用该试剂盒采用本发明的PCR引物对进行PCR扩增,扩增过程中的GC偏向性低、扩增特异性高,扩增效果突出。并且,本发明的PCR引物对尤其适于作为多重PCR扩增的引物。
进一步,本发明提出了PCR引物对及包含它的试剂盒的应用。
在本发明的第三方面,本发明提供了一种PCR扩增方法。根据本发明的实施例,该方法利用前面所述的PCR引物对或者PCR扩增试剂盒进行所述PCR扩增。由此,利用该方法能够有效实现模板的PCR扩增。并且该方法能够增加PCR扩增的特异性,有效降低非特异性产物的产生,并提高扩增效率。
根据本发明的实施例,所述方法包括如下的两轮扩增:于55-65摄氏度的退火温度下,使所述PCR引物对和模板进行第一轮线状扩增;以及于65-72摄氏度的退火温度下,对第一轮线状扩增的产物进行第二轮环状扩增。这样,从PCR的第二个循环(也即第二轮环状扩增)开始,第一引物和第二引物的5’端碱基和新生成的模板5’端的碱基反向互补结合,第一引物和第二引物的3’端特异性碱基和新生成的模板3’端的碱基反向互补结合,也即引物和模板结合识别位点为2个(如附图3),从而能够增加PCR扩增的特异性,并有效降低非特异性产物的产生。
根据本发明的实施例,所述方法的扩增反应程序如下:
步骤1 |
98℃预热2min |
步骤2 |
98℃变性10s |
步骤3 |
55-65℃结合2min |
步骤4 |
72℃扩增30s |
步骤5 |
98℃变性10s |
步骤6 |
65-72℃结合1min |
步骤7 |
重复步骤5-6:5-35个循环 |
步骤8 |
72℃延伸5min |
。
由此,PCR扩增过程中的GC偏向性低、扩增特异性高,扩增效果好。
在本发明的第四方面,本发明提供了一种制备环状DNA文库的方法。
在本发明的第四方面,本发明提供了一种制备DNA文库的方法。根据本发明的实施例,该方法包括以下步骤:
(1)根据前面所述的PCR扩增方法,将待测DNA样品进行第一PCR扩增,以便获得包含类环状物的第一PCR扩增产物,其中,所述第一特异性序列和所述第一随机序列之间连接有预定酶切位点,所述第二特异性序列和所述第二随机序列之间连接有预定酶切位点,且所述PCR引物对的靶序列不包含所述预定酶切位点,所述类环状物的5’端和3’端未连接,采用的PCR引物对的第一引物和第二引物的5’末端和3’末端的第1-5个碱基经过硫代修饰;以及
(2)利用所述预定酶切位点对应的酶,将所述第一PCR扩增产物进行酶切,并基于酶切产物进行文库制备,以便获得目的DNA文库。
根据本发明的实施例,利用该方法能够有效制备线性DNA文库或环状DNA文库,并且,获得的DNA文库,文库质量好,用于DNA保存或文库测序时效果好。
根据本发明的实施例,所述预定酶切位点为USER酶的酶切位点碱基U。由此,因靶序列不包含USER酶的酶切位点碱基U,从而能够在PCR后,有效对扩增产物进行USER酶切,去除引物和互补序列,有利于后续文库构建、纯化。
根据本发明的实施例,按照如下的方法进行步骤(2):将所述包含类环状物的第一PCR扩增产物进行所述酶切以及末端修复加A,以便获得末端包含碱基A的酶切产物;将所述末端包含碱基A的酶切产物进行接头连接,以便获得连接产物,所述连接产物为线性DNA;将所述连接产物进行第二PCR扩增,以便获得第二PCR扩增产物,所述第二PCR扩增产物构成线性DNA文库,其中所述第二PCR扩增产物采用测序引物进行,所述测序引物与所述接头序列互补。由此,能够有效获得线性DNA文库,且获得的文库质量非常好。
根据本发明的一些具体示例,利用USER酶、T4多聚核酸激酶、T4 DNA聚合酶和Klenow片段进行所述酶切以及末端修复加A。由此,酶切效果好,获得的文库质量高。
根据本发明的实施例,按照如下的方法进行步骤(2):将所述包含类环状物的第一PCR扩增产物进行所述酶切,以便获得包含类环状物的酶切产物;利用连接酶将所述包含类环状物的酶切产物进行连接反应,以便使所述类环状物的5’端和3’端连接成环;去除连接产物中的线性DNA,以便获得环状DNA混合物;以及将所述环状DNA混合物进行第三PCR扩增,以便获得第三PCR扩增产物,所述第三PCR扩增产物构成环状DNA文库,其中,所述第三PCR扩增的正向引物的3’端序列与所述第一随机序列反向互补,所述第三PCR扩增的反向引物的3’端序列与所述第二随机序列反向互补。由此,能够有效获得环状DNA文库,且获得的文库质量非常好。
根据本发明的实施例,利用线性消化反应去除线性DNA。
根据本发明的实施例,在进行所述第三PCR扩增之前,进一步包括对所述环状DNA混合物进行纯化的步骤。由此,获得的文库质量好。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品,例如可以采购自Illumina公司。
实施例1:用锁定引物方法检测胎儿是否患有软骨发育不全疾病(ACH)
一、锁定引物(即本发明的PCR引物对,下面简称为“PP引物”)引物设计
设计18对多重PCR引物(如表1,均为锁定引物),包含软骨发育不全疾病所有突变位点,引物设计采用Primer3,3’端TM值在55-65摄氏度之间,且没经过任何优化,5’端互补序列随机生成,TM在65-75摄氏度之间,扩增子区域GC含量在26-75%之间(如表2,引物结构示意图如图1)。
表1:引物区间信息
注:PP:锁定引物;F:正向引物;R:反向引物。
表2:引物序列信息
注:PP:锁定引物;F:正向引物;R:反向引物;预定酶切位点设为USER酶的酶切位点碱基U;针对每条引物,由5’-3’,前18bp为随机序列,接着是1bp碱基U,最后是特异性序列。
二、实验步骤
本实验选取孕妇血浆10例进行实验,其中包括5例ACH阳性样本和5例ACH阴性样本。其中,实验设一次重复。
1.血浆游离DNA提取
分别取阳性样本和阴性样本血浆,用量200ul,用magen beads对孕妇血浆DNA进行提取,得到的产物溶于17ul TE中,备用。然后参照下述步骤制备目的文库(制备文库的流程示意图见图4)。
2.多重PCR扩增
针对提取得到的cfDNA的每一个,分别按照下表所示的扩增体系进行多重PCR:
注:正反向引物池是将表2所述的所有相应引物等比混合得到的。
扩增条件如下:
步骤1 |
98℃2min |
步骤2 |
98℃10s |
步骤3 |
58℃2min |
步骤4 |
72℃30s |
步骤5 |
98℃10s |
步骤6 |
68℃1min |
步骤7 |
重复步骤5-6,25个循环 |
步骤8 |
72℃5min |
将每一个样品的扩增产物分别用1.8倍体积的anxygen beads进行纯化,最后溶于37ul TE中,备用。
3.文库制备
将上步获得的各样品的纯化产物分别依次进行USER酶切和末端修复加“A”、接头连接和PCR扩增,具体如下:
1)USER酶切和末端修复加“A”的体系为:
其中,USER酶切和末端修复加“A”的反应程序为:20℃30min;65℃,30min。
2)接头连接的反应体系为:
接头连接的反应程序为:25℃15min;4℃10min。
然后,将得到的产物用1.2倍体积的anxygen beads进行纯化,最后溶于21TE中,备用。
3)PCR扩增
针对上步得到的各样品的连接产物,分别按照下表中的反应体系进行PCR扩增:
其中,
正向通用引物的序列为(5’-3’):
TGTGAGCCAAGGAGTTGAAGTGGCGCATTGTCTTCCTAAGACCGCTTGGCCTCCG ACTT(SEQ IDNO:37);
反向通用引物的序列为(5’-3’):GAACGACATGGCTACGATCCGACTTGG(SEQ ID NO:38)。
PCR扩增程序如下:
将得到的产物用1.2倍体积的anxygen beads进行纯化,最后溶于21TE中,即得目的文库。然后对得到的产物进行2100进行片段分析和qubit定量,结果见图5和表3。
其中,如图5所示,1-5为阳性样本,6-10位阴性样本。
表3:实验起始用量和文库产量
4.测序上机
文库质检合格后进行上机测序,采用BGI seq500测序平台,测序类型为PE50BP。
5.数据分析
将得到的测序结果进行数据分析,具体包括:对下机测序reads进行过滤,过滤掉碱基质量小于10的reads,保证用于分析碱基频率的数据都是高质量的;使用bwa(V0.7.7-r441)比对软件将过滤后的clean reads比对回人基因组参考序列HG19(GRCH37);根据比对结果计算出在待检测位点4个碱基ATCG的覆盖深度,并根据碱基深度得到最可能变异位点及其频率,测序错误及频率等情况;根据位点和引物所在位置的区间的GC分布情况及可能的测序错误频率,进行GC bias校正;使用目前最准确的变异检测工具GATK(V3.6)检测上述得到的变异位点,并使用相应突变数据库进行过滤和注释。
结果,发明人发现,利用本发明PCR引物进行多重PCR扩增和文库构建,可以准确检测低至1%的突变,具体地:在10例样本检测中,5例阳性样本均检测为阳性,检测到的突变频率分别为5.3%、7.2%、3.5%、5.6%、6.2%,5例阴性样本均检测为阴性,检测到的突变频率分别为0.3%、0.1%、0.2%、0.2%、0.1%(如表5)。并且,本发明的方法特异性好,比对率在90-94%之间,捕获效率在92-95%之间;覆盖度为100%(如表4);均一性好,0.1X平均深度大于94%(见表4,图6);稳定性好,不同样本之间差异小(见图7)。
表4:PE50+10下机数据
*均一性:大于0.1X平均reads数的扩增子数量(18/19=94.7%)。
表5:突变检测准确性
此外,发明人还进行了一系列实验,并发现本发明的PCR引物对的适用范围不限于cfDNA样本,还可以广泛应用于genomic DNA、FFPE、尿液DNA、fresh frozen等样本,也不仅限于构建BGI-Seq文库,也可以构建其他平台文库如illumina、proton。
工业实用性
本发明的PCR引物对,能够有效地用于待测DNA样品的PCR扩增,并且能有效降低PCR扩增过程中的GC偏向性,提高扩增特异性,且尤其适于作为多重PCR扩增的引物。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
SEQUENCE LISTING
<110> 深圳华大基因研究院
<120> PCR引物对及其应用
<130> PIOC3168051PCN
<160> 38
<170> PatentIn version 3.3
<210> 1
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 1
ccccccccat ccccccccut tcttcgggtg ttgactttca 40
<210> 2
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 2
ccccccccat gggcccggut tgacaatggt gtatctgggc 40
<210> 3
<211> 42
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 3
cccccccgat cggggcccut tcatccttac ttggatatgc cc 42
<210> 4
<211> 44
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 4
ccccccgcat ccggggggut cccttagaga acaaagtaaa aagc 44
<210> 5
<211> 44
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 5
ccccccgctt gggccgccut attgtgtttt tagagaagct caaa 44
<210> 6
<211> 42
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 6
ccccccggtt ccccgcggut caaagtgagc tctttgcctt tt 42
<210> 7
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 7
cccccgcctt ccggcgccut tcaaggttga agcaaaagca 40
<210> 8
<211> 42
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 8
cccccgcgat cccgccggut acatttcagc ttttgcaaac tt 42
<210> 9
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 9
cccccgcgtt gcgcgggcut gggtcaaggg aactatccca 40
<210> 10
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 10
cccccgggta ggccccggut ttggacacct tttcgtgtca 40
<210> 11
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 11
ccccgccctt cgcgcccgut gcctgctatt tgctttacca 40
<210> 12
<211> 39
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 12
ccccgccgtt gccgcgggut gtcatctgcc cccacagag 39
<210> 13
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 13
ccccggccta cggcccccut gtggagttcc actgcaaggt 40
<210> 14
<211> 37
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 14
ccccggcctt gcgcgccgut gtggaggctg acgaggc 37
<210> 15
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 15
ccccggcctt ggcgggccut tgaagatgat cgggaaacac 40
<210> 16
<211> 38
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 16
ccccgggcta cccgccggut agtgcatcca cagggacc 38
<210> 17
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 17
ccccggggat ccgcggccut gacgtgcaca acctcgacta 40
<210> 18
<211> 38
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 18
ccccggggtt ggggggggut gtgtttgccc acgacctg 38
<210> 19
<211> 38
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 19
ggggggggat ggggggggut aatgagccct cagcctgc 38
<210> 20
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 20
ccgggcccat ggggggggut caccccaaat agtttgtgcc 40
<210> 21
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 21
gggccccgat cgggggggut tgagcgcaat gagttcaata 40
<210> 22
<211> 41
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 22
ccccccggat gcggggggut tcctttctcc aaacagtgac c 41
<210> 23
<211> 41
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 23
ggcggcccaa gcggggggut gctcccaata ttacgcagtt c 41
<210> 24
<211> 41
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 24
ccgcggggaa ccggggggut catttctttt gcaggttgtc a 41
<210> 25
<211> 41
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 25
ggcgccggaa ggcgggggut catcctccta cggtgttgaa a 41
<210> 26
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 26
ccggcgggat cgcgggggut agatggcctg atggattctg 40
<210> 27
<211> 42
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 27
gcccgcgcaa cgcgggggut cacactaacg ttgtaatgcg ct 42
<210> 28
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 28
ccggggccta cccgggggut ggcactcaat aagggattgg 40
<210> 29
<211> 42
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 29
cgggcgcgaa gggcggggut gctgcttgta ttcacaccat tc 42
<210> 30
<211> 37
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 30
cccgcggcaa cggcggggut caccgccgtc tggttgg 37
<210> 31
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 31
gggggccgta ggccggggut gtgcttgagc cactggatgt 40
<210> 32
<211> 37
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 32
cggcgcgcaa ggccggggut ggcagagcgt cacagcc 37
<210> 33
<211> 37
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 33
ggcccgccaa ggccggggut cgccgctacc gcaccta 37
<210> 34
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 34
ccggcgggta gcccggggut tcttcatcac gttgtcctcg 40
<210> 35
<211> 39
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 35
ggccgcggat ccccggggut gtcctactgg catgacccc 39
<210> 36
<211> 40
<212> DNA
<213> Artificial
<220>
<223> 引物
<400> 36
ccccccccaa ccccggggut tagggacccc tcacattgtt 40
<210> 37
<211> 59
<212> DNA
<213> Artificial
<220>
<223> 正向通用引物
<400> 37
tgtgagccaa ggagttgaag tggcgcattg tcttcctaag accgcttggc ctccgactt 59
<210> 38
<211> 27
<212> DNA
<213> Artificial
<220>
<223> 反向通用引物
<400> 38
gaacgacatg gctacgatcc gacttgg 27