HK1237002B

HK1237002B - 一种用於核酸随机片段化的引物及核酸随机片段化方法

Info

Publication number: HK1237002B
Application number: HK17110727.0A
Authority: HK
Inventors: 耿春雨; 韩鸿雁; 郭冠瑛; 章文蔚; 蒋慧; 江媛
Original assignee: 深圳华大智造科技股份有限公司
Filing date: 2014-10-17
Publication date: 2022-07-08

Description

一种用于核酸随机片段化的引物及核酸随机片段化方法

技术领域

本申请涉及核酸破碎处理领域，特别是涉及一种用于核酸随机片段化的引物，以及基于该引物的核酸随机片段化的方法。

背景技术

自从罗氏发明了焦磷酸测序方法开辟了二代测序以来，直至现在，二代测序经历了一段高速发展期。但随着高通量测序的发展，高通量和低成本的样本制备环节逐渐成了测序领域的一个重点考虑的因素。各种原理的样本处理方法及自动化装置不断被研发出来，主要包括：样本片段化、核酸分子的末端处理及接头连接等。

其中样本片段化主要分为物理方法，如超声剪切，或酶学方法，即非特异的核酸内切酶处理，两种方法来实现。其中物理方法以基于专利的自适应聚焦超声（AdaptiveFocused Acoustic，AFA）技术的Covaris为主。在等温的条件下，利用几何聚焦声波能量，通过>400kHz的球面固态超声传感器，将波长为1mm的声波能量聚焦在样品上。该方法确保了核酸样品的完整性得以保留，并能实现高回收率。Covaris的仪器包括经济的M系列、单管全功率的S系列以及更高通量的E和L系列。基于物理方法打断的片段随机性良好，但是通量上也要依赖大量的Covaris打断仪，同时需要后续单独进行末端处理、加接头和PCR以及各种纯化操作。其中酶学方法有一种NEB公司推出的NEB Next dsDNAFragmentase。该试剂首先在双链DNA产生随机的切刻位点，然后通过另一种酶识别切刻位点来切割互补的DNA链，从而实现打断的目的。这种试剂可以用于基因组DNA、全基因组扩增产物和PCR产物等，随机性也较好，但是会产生一些人工短片段插入和缺失，同时也不可避免的需要后续单独进行末端处理、加接头和PCR以及相应的纯化操作。另外以Epicentra公司的Nextera试剂盒领衔的转座酶打断试剂盒，利用转座酶同时完成DNA片段化和接头的添加，从而减少样品处理的时间。

从各种操作的简便性来看，转座酶打断的方式无疑在通量及操作简便性上远远胜过其它方法，但是这种打断方式也有自身的缺点：转座酶实现转座依赖特定的19bp Me序列。因此，虽然转座酶可以通过包埋两种完全不同的接头序列而在靶序列的5’端和3’端加上不同的接头序列，但是接头均需要含有Me特定序列，从而带来的一个影响即打断所产生的片段的两端会对称的各有一个Me序列，并且由于转座酶的特殊作用使得目的序列或打断片段与Me序列之间存在一个9nt碱基缺失的缺口。靶序列邻近的两端完全一致的Me序列会对下游的一些技术应用带来影响，比如基于连接法的二代测序技术，同一条链两侧的Me序列为互补的序列，从而容易引起单链分子内部出现退火而不利于锚定引物的结合。

曾经有相关专利申请CN 102703426 A提出了一种解决办法，即将打断后的序列进行特定内切酶酶切，从而去除9nt序列和Me序列，这种方法只是利用了转座酶打断的优势将核酸序列进行随机打断，但是引入了后续接头需要单独进行加入的缺点，步骤繁琐而不易于更高通量的应用。

发明内容

本申请的目的是提供一种新的用于核酸随机片段化的引物，在此基础上，提供了一种新的DNA双随机引物破碎方法，即核酸随机片段化的方法。

为了实现上述目的，本申请采用了以下技术方案：

本申请一方面公开了一种用于核酸随机片段化的引物，该引物由若干条上游随机引物和若干条下游随机引物组成；上游随机引物的序列组成为：5’-X-Y-3’；下游随机引物的序列组成为：5’-P-Y’-X’-close-3’；其中，Y和Y’为随机序列，X为测序平台的5’端接头的全部或部分序列，X’为测序平台的3’端接头的全部或部分序列，P为磷酸化修饰，close为用于阻止3-5磷酸二酯键形成的封闭修饰。

需要说明的是，本申请的上游随机引物和下游随机引物与通常的PCR引物不同，根据设计，上游随机引物和下游随机引物是杂交结合在同一条模板链上的，并且，在延伸阶段，只有最接近的上游随机引物和下游随机引物之间，通过上游随机引物向3’端延伸，将上游随机引物和下游随机引物之间填满，由于下游随机引物的5’端具有磷酸化修饰，上游随机引物的延伸序列的3’端能与下游随机引物的5’端连接起来，即将上游随机引物及其延伸序列与下游随机引物连成一段；由于上游随机引物和下游随机引物都是随机杂交到模板上的，因此，可以实现DNA样品的随机打断破碎。不同于常规的随机引物对DNA样品进行扩增的是，本申请的引物中，只有上游随机引物延伸，并且，延伸至下游随机引物处就立即停止，不会像随机引物对DNA样品进行扩增那样，在第二轮扩增时一条上游引物的扩增链可能对应多个下游引物，从而扩增出一系列的弥散条带，影响结果的准确性。

还需要说明的是，本申请中Y和Y’两段随机序列，跟常规的随机引物的序列一样，由3-12个碱基组成，优选的由5-9个碱基组成。X和X’序列是测序平台的接头序列，为后续的测序做准备；其中X为测序平台的5’端接头的全部或部分序列，是因为，在DNA样品随机破碎后，还需要采用一对通用引物对纯化的DNA随机片段进行信号放大，即PCR扩增，该PCR扩增的引物以DNA随机片段为模板进行扩增时，可以通过引物设计补全5’端接头的全部序列，因此，在上游随机引物中X序列可以是测序平台的5’端接头的全部或部分序列；基于同样的考虑，X’为测序平台的3’端接头的全部或部分序列。

优选的，所述封闭修饰为双脱氧修饰。需要说明的是，封闭修饰的作用是避免下游随机引物的3’端延伸，也避免下游随机引物与下游随机引物之间的连接；因此，理论上，凡是可以阻止3-5磷酸二酯键形成的封闭修饰都可以用于本申请，本申请经过多方面综合考虑，证实双脱氧修饰既能起到封闭作用，又不影响随机引物的杂交。

优选的，上游随机引物的X序列的5’端还包括2-6个保护碱基；下游随机引物的X’序列3’端还包括2-6个保护碱基，并且封闭修饰在末端的一个保护碱基之上。

需要说明的是，保护碱基的作用是使得序列更稳定，可以理解，在较次的要求中，也可以不设计保护碱基。

优选的，上游随机引物的X序列和Y序列之间包括若干个间隔碱基；下游随机引物的Y’序列和X’序列之间包括若干个间隔碱基。需要说明的是，间隔碱基并不是必须的，间隔碱基的作用，同样是为了保障序列的稳定性，但是，间隔碱基在后续的纯化后的PCR扩增中是会被扩增的，也就是说，会在接头和随机打断的DNA片段之间造成间隔，因此，除非是一些特殊的要求，最好不添加间隔碱基。

本申请的一种实现方式中，上游随机引物的X序列具有Seq ID No.1所示序列，下游引物的X’序列具有Seq ID No.2所示序列；

Seq ID No.1：5’-GACCGCTTGGCCTCCGACT-3’

Seq ID No.2：5’-GTCTCCAGTCGAAGCCCGA-3’。

本申请的另一面公开了一种核酸随机片段化的方法，包括采用本申请的引物对DNA样品进行双随机锚定，具体包括，将上游随机引物和下游随机引物杂交到变性的DNA样品上，在最相邻的上游随机引物和下游随机引物之间，通过DNA聚合酶的作用，上游随机引物向3’端延伸，将上游随机引物和下游随机引物之间的序列填满，然后在DNA连接酶的作用下，将上游随机引物延伸序列的3’端与下游随机引物的5’端连接起来，即将上游随机引物及其延伸序列与下游随机引物连接成一段，通过上游随机引物和下游随机引物的随机杂交实现对DNA样品的双随机打断。

需要说明的是，本申请的方法，是将一定量的上游随机引物和下游随机引物以及变性的DNA样品，加入到反应液中，反应液中含有DNA聚合酶、DNA连接酶以及dNTP，实现延伸和连接反应的。实际上，本申请中上游随机引物和下游随机引物的杂交，上游随机引物的延伸，与常规的PCR原理相同，随机引物先杂交到变性的DNA样品上，然后在DNA聚合酶的作用下，上游随机引物的3’端开始延伸，由于只有下游随机引物的5’端有磷酸化修饰，因此，只有最相邻的上游随机引物和下游随机引物之间才能在延伸后，通过DNA连接酶连接成一段，从而保障了随机打断的准确性，避免了错误结构的引入。

优选的，在上游随机引物和下游随机引物杂交到变性的DNA样品上的过程中，上游随机引物和下游随机引物的总用量为R×n皮摩尔，其中2.7≤R≤750，n=1.515×(m÷L)，m为DNA样品的重量，单位为纳克，L为预计打断后的DNA片段长度，n为将DNA样品破碎至L长度的片段所需要的上游随机引物和下游随机引物理论用量，单位为皮摩尔。

需要说明的是，上游随机引物和下游随机引物用量是根据需要片段化的程度相关的，可以理解，上游随机引物和下游随机引物的用量越大，杂交到DNA分子链上的随机引物越密集，最相邻的上游随机引物和下游随机引物之间的距离越小，从而连接成的片段也越小，即获得的DNA片段越小，也就是说，片段化程度越高；反之，则获得的随机打断的DNA片段越大；本申请推导了理论上要将一个DNA样品破碎到L长度的片段所需要的引物用量为n，并根据大量的试验分析总结出，根据不同的破碎长度L的需求，实际上上游随机引物和下游随机引物的总用量为理论用量n的R倍，因此，即R×n皮摩尔，R越大，破碎片段L越小，L为破碎后的片段的碱基对数，单位为bp。

优选的，上游随机引物和下游随机引物的摩尔用量比为，上游随机引物：下游随机引物=1~3:1，优选为2:1，优选的R=20。

本申请的另一面公开了一种核酸文库的构建方法，包括采用本申请的核酸随机片段化的方法对DNA样品进行随机片段化，然后采用一对通用引物对双随机打断的DNA片段进行PCR扩增，即获得随机片段富集的核酸文库；该通用引物由正向引物和反向引物组成，正向引物的3’端具有与上游随机引物的测序平台的5’端接头的全部或部分序列，反向引物的3’端具有与下游随机引物的测序平台的3’端接头的反向互补序列的全部或部分。

需要说明的是，本申请的引物组中所提到的正向引物和反向引物，即常规的PCR扩增引物，该引物是针对随机破碎的DNA片段设计的，以随机破碎的DNA片段为模板进行PCR扩增，以实现随机破碎的DNA片段的信号扩大；所以，正向引物的3’端具有测序平台的5’端接头的全部或部分序列，反向引物的3’端具有测序平台的3’端接头的反向互补序列的全部或部分。由于上游随机引物和下游随机引物中含有接头的全部或部分序列，而正向引物和反向引物中也含有部分或全部序列，因此，只要PCR扩增的产物中含有全部的接头序列即可；例如，仅以上游随机引物和正向引物进行说明，上游随机引物的X序列是测序平台的5’端接头的全部序列时，正向引物的3’端可以是5’端接头的全部序列，也可以是5’端接头的5’端的部分序列，只要能够与上游随机引物的X序列杂交扩增出完整的5’端接头序列即可；同样的，上游随机引物的X序列是测序平台的5’端接头的部分序列时，可以通过正向引物补全5’端接头的序列，此时，正向引物的3’端可以是5’端接头的全部序列，也可以是补全序列以及部分与上游随机引物的X序列中的5’端接头序列杂交的序列，从而扩增出完整的5’端接头。因此，正向引物的3’端可以是测序平台的5’端接头的全部或部分序列；同样的，反向引物的3’端具有测序平台的3’端接头的反向互补序列的全部或部分。

还需要说明的是，虽然本申请的引物能够很好的保障DNA样品的随机打断，并且不会产生弥散片段干扰，但是，由于在连接上游随机引物和下游随机引物的时候并没有进行实质的PCR扩增，只是上游随机引物进行了延伸，因此，DNA随机片段的拷贝数是有限的，所以，在测序或文库构建时需要采用正向引物和反向引物对随机打断的DNA片段进行PCR扩增，并且正向引物和反向引物都是根据测序平台的接头设计的，也就是说，所有的DNA随机片段实际上都包含有测序平台接头的部分或全部序列，在测序平台的接头序列确定后，正向引物和反向引物对所有的DNA片段都会扩增，因此，称为通用引物。还需要说明的是，通常在连接成随机打断的DNA片段后，需要将连接的片段纯化出来，然后进行PCR扩增，将连接好的DNA随机打断片段纯化的方法可以参考常规的DNA纯化方法，本申请优选的采用磁珠法将DNA片段分离纯化出来。

优选的，正向引物和反向引物的5’端分别具有第二测序平台的接头序列。

需要说明的是，正向引物和反向引物的5’端分别具有第二测序平台的接头序列，这个并不是必须的；可以理解，如果只需要在一个测序平台进行测序，则只需要一个测序平台的5’端接头和3’端接头即可，第二测序平台的接头，是方便后续的测序需求。

本申请的一种实现方式中，正向引物含有Seq ID No.1所示序列，反向引物含有Seq ID No.3所示序列；

Seq ID No.3：5’-TCGGGCTTCGACTGGAGAC-3’。

由于采用以上技术方案，本申请的有益效果在于：

本申请引物及基于该引物的核酸随机片段化的方法，适用各种DNA样品，包括cDNA序列的随机破碎，上下游双随机引物可以覆盖目标序列的几乎完整序列，并达到较高的覆盖均一性，从而为后续的分子生物学操作和信息的挖掘提供了更好的基础。并且，本申请的随机破碎方法只需要几种常规的工具酶及PCR核酸扩增设备即可完成全程的样本处理，从而使得中小型科研机构、高校院所、下游应用领域独立开展高通量文库制备成为可能。同时，本发明由于只需要将目标序列进行变性，然后通过随机引物的随机锚定及聚合连接反应即可进行后续的扩增，从而具有简便、快速等优势，摆脱了对大型高端仪器设备或昂贵试剂盒的依赖，其简单易操作的特点大大降低了对技术人员的专业技能要求，极大地扩宽了大规模高通量测序的应用领域。

附图说明

图1：是本申请实施例中DNA随机破碎方法的技术分解图；

图2：是本申请实施例中条件优化的电泳结果图；

图3：是本申请实施例中条件优化的电泳结果图。

具体实施方式

本申请设计的引物，将上游随机引物和下游随机引物都结合在同一模板链上，而不是分别结合在两条互补的模板链上，其目的并不是进行PCR扩增，而是，如图1所示，利用上游随机引物的延伸，将相邻的上游随机引物和下游随机引物之间的空隙填满，再利用DNA连接酶将其连接成完整的片段。由于上游和下游引物都是随机的，因此，可以实现对DNA样品的双随机打断；又由于上游随机引物延伸至下游随机引物处就不再延伸，避免了像随机引物对DNA样品进行PCR扩增那样，在第二轮扩增时，一个上游引物的扩增链，对应多个下游引物，从而得到弥散的片段带，对后续操作造成影响。

基于本申请的引物的核酸随机片段化的方法，所需的时间短，几乎全程在PCR仪上完成，能够实现最快的样品制备，可以实现自动化的操作，相比其它方法，可有效降低人为错误操作，降低样本处理的系统误差；同时，也摆脱了对大型高端仪器设备或昂贵试剂盒的依赖。

需要说明的是，在本申请的核酸随机片段化的方法中，将上游随机引物和下游随机引物杂交到变性的DNA样品上，其中DNA样品的变性可以采用高温处理或者化学试剂变性法，高温处理的时间与温度成反比，温度越高，处理时间则越短。适宜的变性温度为98-95℃，处理时间1-5分钟，本申请的一种实现方案中选取95℃反应5分钟。化学试剂变性法常用变性试剂包含KOH、NaOH、EDTA等，本申请不做具体限定。化学试剂变性后，退火反应需中和反应体系的碱离子浓度，使反应体系保持在中性适宜的盐离子环境，中和缓冲液可以是各种低浓度的酸缓冲液，且仅对碱溶液处理组进行中和缓冲液的处理，如HCl和Tris-HCl的组合缓冲液。

可以通过调控上游随机引物、下游随机引物与模板之间的摩尔比例使得延伸产物片段大小满足测序平台需要，在此不做具体限定。本申请中，上游随机引物和下游随机引物中随机序列的个数可以有不用设计方案，包含5个随机碱基、6个随机碱基、7个随机碱基、8个随机碱基等以确保引物结合到靶序列的不同位置，这与常规的随机引物相同，在此不做具体限定。同时为防止5’随机引物和3’随机引物在后续反应中引入错误结构，将上游随机引物的5’端设计无磷酸化修饰，而下游随机引物的5’端有磷酸化修饰，且下游随机引物的3’端进行封闭修饰，以避免3-5磷酸二酯键形成，优选的为双脱氧修饰。此外，下游随机引物和上游随机引物中还可以包含后续适用于不同测序平台的接头序列。

此外，DNA聚合酶可以选用常规的DNA聚合酶，延伸后的连接酶，也是常规的DNA连接酶，在此不做具体限定。连接完成后，本申请的一种实现方式中，单链DNA纯化采用单链DNA磁珠选择法，磁珠浓度为1.0倍。PCR过程以单链DNA为模板进行扩增，实现随机破碎的DNA片段的信号放大。

本申请中，上游随机引物和下游随机引物的用量直接影响破碎后的DNA片段长度，因此，本申请优选的方案中，上游随机引物和下游随机引物按照总用量R×n皮摩尔添加到DNA样品中，2.7≤R≤750，n=1.515×(m÷L)，m为DNA样品的重量，单位为纳克，L为预计打断后的DNA片段长度；以上公式n=1.515×(m÷L)是本申请的发明人理论推导的，而R的取值范围则是根据破碎后不同的片段大小需求和大量的试验分析得出的，R值越大破碎后的片段越小。n=1.515×(m÷L)的推导过程如下：

以3G的人类基因组为例，其含有3×10⁹个碱基对，其质量摩尔浓度约为M=(3×10⁹×660) g/mol=(3×10⁶×660) ng/pmol=1.98×10⁹ng/pmol，

质量为m（ng）的基因组DNA其摩尔数n₁=m÷M=m/(3×10⁶×660×10¹²)mol，

质量为m（ng）的基因组DNA其分子数N₁=n₁×Na=m÷M×Na，

打断到L（bp）长度的分子理论所需随机引物分子数n₂=(3×10⁹÷L)×N₁

打断到L（bp）长度的分子理论所需随机引物摩尔数n=n₂÷Na

因此，n=n₂÷Na=(3×10⁹÷L)×N₁÷Na=(3×10⁹÷L)×(m÷M×Na)÷Na

=3×10⁹×m÷L÷M=(3×10⁹÷1.98×10⁹)×m÷L=1.515×m÷L pmol

其中，Na为阿伏伽德罗常数，Na=6.02×10²³

即，理论上将m纳克的3G人类基因组破碎至L长度的片段，需要用n pmol的上游随机引物和下游随机引物，但是根据大量的试验分析，为了获得L长度的片段，实际上需要加入的上游随机引物和下游随机引物总量为n pmol 的R倍，即R×n皮摩尔，L越小，R越大。

需要说明的是，根据推导公式可见，上游随机引物和下游随机引物的理论用量n与DNA样品的实际长度在理论上没有直接关系，直接影响n是需要获得的破碎片段的长度L，以及DNA样品的总重量；所以，本申请以3G的人类基因组为例推导的理论用量n的公式并不仅限于3G的人类基因组，也就是说，本申请的核酸随机片段化的方法和文库构建方法具有广泛的适用性，可以用于对包括cDNA在内的任何DNA样品的处理。

还需要说明的是，本申请的理论用量n是根据双链DNA进行推导的，而通常，在试验中获取的DNA样品也是双链DNA，因此，本申请的上游随机引物和下游随机引物的用量推导和限定具有广泛适用性。对于一些特殊的单链DNA样品，可以理解，只要替换相应的质量摩尔浓度M即可，其余相同；单链DNA质量摩尔浓度约为M=Y×324.5 g/mol，其中Y为单链DNA的长度；由于通常获得的样品都是双链DNA，因此，本申请不对单链DNA的情况进行具体限定。

下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明，不应理解为对本申请的限制。

实施例

1.引物设计

本例设计订购含有8个随机序列位点上游随机引物和下游随机引物，序列如下：

上游随机引物：5’-GACGACCGCTTGGCCTCCGACTTNNNNNNNN-3’

下游随机引物：5’-P-NNNNNNNNGTCTCCAGTCGAAGCCCGACG-ddC-3’

其中，上游随机引物中，“GACCGCTTGGCCTCCGACT”即X序列中测序平台的5’端接头的序列，5’端接头之前的“GAC”为保护碱基，“NNNNNNNN”为随机序列Y序列，X序列与Y序列之间为间隔碱基；下游随机引物中，“GTCTCCAGTCGAAGCCCGA”为X’序列的测序平台的3’端接头序列，3’端接头之后的“CG”为保护碱基，“NNNNNNNN”为随机序列Y’序列，P为磷酸化修饰，ddC为双脱氧修饰。随机序列是随机合成的，在此不做具体限定。

将合成的引物稀释到10uM备用。

2.基因组DNA序列变性

本例采用化学变性法进行，具体的，将提取的人类基因组DNA稀释到50ng/uL，按如下体系配置变性反应体系：DNA样品1ul、ddH₂O 0.6ul、变性缓冲液1ul、合计2.6ul。然后在室温反应3分钟即完成变性。本例中，变性缓冲液成分为208mM KOH，1.3mMEDTA。

3.随机引物退火

在上述变性体系中加入1uL中和缓冲液，缓冲液成分为208mMHCl，312.5mMTris-HCl，室温反应3分钟。加入退火反应液1uL，下游随机引物与上游随机引物按照1:2的比例加入到反应液中，并且，上游随机引物和下游随机引物的总浓度5.1pmol。

退火反应液配制如下：10x phi buffer 0.46ul、ddH₂O 0.03ul、上游随机引物10uM 0.34ul、下游随机引物10uM 0.17ul、合计1ul。

反应条件为，室温反应10分钟。

4.序列延伸

向上述反应体系中加入延伸反应液15.4uL，延伸反应液中dNTP浓度为0.85nmol。延伸反应液配制如下：10x phi buffer 1.54ul、纯水3.56ul、二甲基亚砜1ul、5M的甜菜碱8ul、0.25mM each的dNTP 0.85uL、2U/ul DNA聚合酶0.25uL、400U/ul DNA连接酶0.2ul，合计15.4uL。

延伸条件与测序平台适宜的文库大小有关，本例为37℃，延伸20分钟，之后65℃反应15分钟用于DNA聚合酶的热灭活。需要说明的是，由于随机片段化的片段大小是由上游随机引物和下游随机引物的总和与DNA样品的摩尔比决定的，可以理解，片段越大，延伸条件中延伸的时间则越长，反之片段越小，延伸的时间就越短，因此，延伸条件与片段大小也就是文库大小有关。

5.连接产物纯化

单链连接产物采用磁珠法纯化，本例采用1.0倍 PEG32磁珠。向上述30uL连接体系中加入30uL PEG32磁珠进行单链连接产物纯化，回溶于纯水中，即获得单链的随机打断的DNA。

6.PCR反应

以纯化的随机打断的DNA为模板进行扩增，并且设计针对上游随机引物和下游随机引物中的5’端接头和3’端接头的引物组，引物组中正向引物如Seq ID No.4所示，反向引物如Seq ID No.5所示，

Seq ID No.4：5’-TCCTAAGACCGCTTGGCCTCCGACT-3’

Seq ID No.5：5’-AGACAAGCTCGATCGGGCTTCGACTGGAGAC-3’

需要说明的是，和Seq ID No.1所示序列“GACCGCTTGGCCTCCGACT”的正向引物，以及Seq ID No.3所示序列“TCGGGCTTCGACTGGAGAC”的反向引物相比，本例的正向引物和反向引物的5’端都分别添加了第二测序平台的接头，因此获得Seq ID No.4和Seq ID No.5所示的正向引物和反向引物；可以理解，5’端添加的第二测序平台的接头并不会影响扩增，因此，Seq ID No.1和Seq ID No.3所示的正向引物和反向引物同样可以适用于本例。

PCR反应体系：纯化的单链DNA 20.5ul、2X PCR缓冲液25ul、20uM的正向引物2ul、20uM的反向引物2ul、400U/ul DNA聚合酶0.5ul，合计 50 ul。

PCR反应条件为，95℃变性3min，然后进入15个循环反应：95℃ 30sec、55℃30sec、72℃ 1min，循环完成后，72℃延伸10min，最后4℃待机。

7.测序验证

将PCR产物进行Illumina Hiseq2000 PE101测序，将测序得到reads过滤后，比对参考基因组序列，统计比对数据量及不同深度下基因组覆盖的情况，结果如表1所示。

表1 测序数据比对回参考基因组的覆盖度及均一性分布

测序读长数目（M）	4.5
		比对率	99.70%
唯一比对的读长数目（M）	4.5
		基因组覆盖度	99.99%
4X深度下基因组覆盖度	99.89%
		10X深度下基因组覆盖度	98.53%
20X深度下基因组覆盖度	96.25%
		30X深度下基因组覆盖度	85.20%
40X深度下基因组覆盖度	73.55%
		50X深度下基因组覆盖度	55.60%

比对率说明本例的双随机引物扩增得到的片段基本都是目的物种的，特异性较好；基因组覆盖度说明目标基因组基本被全覆盖，说明了本例的随机打断方法的随机性较好；不同深度下的基因组覆盖度说明了本例覆盖的均一性比较好，大部分的区域都被深度覆盖，如4X，10X，可以满足后续变异的分析。

在以上试验的基础上，本例对还进一步对不同的随机序列个数，以及上游随机引物用量和下游随机引物用量的比例进行了优化，同时，还对3中聚合酶进行的比较试验；结果如图2所示。图2中，泳道D2000为DNA marker的电泳结果，泳道1为随机碱基序列为5个，下游随机引物:上游随机引物=1:1，采用Taq DNA聚合酶的电泳结果；泳道2为随机碱基序列为5个，下游随机引物:上游随机引物=2:1，采用Taq DNA聚合酶的电泳结果；泳道3为随机碱基序列为5个，下游随机引物:上游随机引物=3:1，采用Taq DNA聚合酶的电泳结果；泳道4为随机碱基序列为5个，下游随机引物:上游随机引物=3:1，采用E.Coli DNA聚合酶I的电泳结果；泳道5为随机碱基序列为5个，下游随机引物:上游随机引物=3:1，采用klenow Fragment的电泳结果；泳道6为随机碱基序列为9个，下游随机引物:上游随机引物=2:1，klenowFragment的电泳结果；泳道7为随机碱基序列为8个，下游随机引物:上游随机引物=2:1，采用klenow Fragment的电泳结果；泳道8为随机碱基序列为5个，下游随机引物:上游随机引物=2:1，采用klenow Fragment的电泳结果；泳道9为随机碱基序列为6个，下游随机引物:上游随机引物=2:1，采用klenow Fragment的电泳结果；泳道10为随机碱基序列为7个，下游随机引物:上游随机引物=2:1，采用klenow Fragment的电泳结果。结果显示，三种聚合酶比较说明klenow fragment的效果比较好，随机碱基序列数目的比较说明8个随机碱基的随机锚定PCR效果好一些，下游随机引物和上游随机引物比例，在1-3:1均可，而2:1的比例效果较好。

在此基础上，本例进一步的，对上游随机引物和下游随机引物的总用量进行了试验，结果如图3所示。图3中，泳道D2000为DNA marker；泳道1为阴性对照；泳道2为下游随机引物:上游随机引物=2:1，随机引物总量200pmol，采用klenow Fragment的电泳结果；泳道3为下游随机引物:上游随机引物=2:1，随机引物总量51pmol，采用klenow Fragment的电泳结果；泳道4为下游随机引物:上游随机引物=2:1，随机引物总量5.1pmol，采用klenowFragment的电泳结果；泳道5为下游随机引物:上游随机引物=2:1，随机引物总量0.51pmol，采用klenow Fragment的电泳结果。结果显示，随机引物总量5.1pmol效果最好，即按照DNA样品m=50ng，打断到L=300bp计算，理论引物用量n=0.253pmol，而R=5.1/0.253约等于20，即将50ng的DNA样品破碎到300bp所需要的实际的上游随机引物和下游随机引物的用量是理论用量的20倍。对于R的取值，本例对其进行了大量的试验探讨，分析试验结果显示，以构建文库为基础，即构建文库所需要的片段大小为基础，根据所打断的长度L不同，R的取值在2.7≤R≤750之间，L越小，实际用量对理论用量的倍数越高，即R越大。R优选为20，是针对比较常规的将DNA样品打断至300bp而言的。

本例的引物，采用上游随机引物和下游随机引物的双随机锚定，实现对DNA样品的随机破碎，然后再采用引物组对纯化的随机打断的单链DNA片段进行扩增，获得可以适用于不同测序平台的DNA文库；操作简单方便，避免了对特殊设备和昂贵试剂盒的依赖，极大地扩宽了大规模高通量测序的应用领域。

以上内容是结合具体的实施方式对本申请所作的进一步详细说明，不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本申请的保护范围。

SEQUENCE LISTING

<110> 深圳华大智造科技有限公司

<120> 一种用于核酸随机片段化的引物及核酸随机片段化方法

<130> 17F24115

<160> 5

<170> PatentIn version 3.3

<210> 1

<211> 19

<212> DNA

<213> 人工序列

<400> 1

gaccgcttgg cctccgact 19

<210> 2

<211> 19

<212> DNA

<213> 人工序列

<400> 2

gtctccagtc gaagcccga 19

<210> 3

<211> 19

<212> DNA

<213> 人工序列

<400> 3

tcgggcttcg actggagac 19

<210> 4

<211> 25

<212> DNA

<213> 人工序列

<400> 4

tcctaagacc gcttggcctc cgact 25

<210> 5

<211> 31

<212> DNA

<213> 人工序列

<400> 5

agacaagctc gatcgggctt cgactggaga c 31

Claims

1.一种核酸随机片段化的方法，包括采用引物对DNA样品进行双随机锚定，所述引物由若干条上游随机引物和若干条下游随机引物组成；具体包括，将所述上游随机引物和所述下游随机引物杂交到变性的DNA样品上，在最相邻的上游随机引物和下游随机引物之间，通过DNA聚合酶的作用，上游随机引物向3’端延伸，将上游随机引物和下游随机引物之间的序列填满，然后在DNA连接酶的作用下，将上游随机引物延伸序列的3’端与下游随机引物的5’端连接起来，即将上游随机引物及其延伸序列与下游随机引物连接成一段，通过上游随机引物和下游随机引物的随机杂交实现对DNA样品的双随机打断；

将所述上游随机引物和所述下游随机引物杂交到变性的DNA样品上的过程中，所述上游随机引物和所述下游随机引物的总用量为R×n皮摩尔，其中2.7≤R≤750，n=1.515×(m÷L)，m为DNA样品的重量，单位为纳克，L为预计打断后的DNA片段长度，n为将DNA样品破碎至L长度的片段所需要的上游随机引物和下游随机引物理论用量，单位为皮摩尔；

所述上游随机引物和所述下游随机引物的摩尔用量比为上游随机引物：下游随机引物=1~3:1；

所述上游随机引物的序列组成为：5’-X-Y-3’；

所述下游随机引物的序列组成为：5’-P-Y’-X’-close-3’；

其中，Y和Y’为随机序列，X为测序平台的5’端接头的全部或部分序列，X’为测序平台的3’端接头的全部或部分序列，P为磷酸化修饰，close为用于阻止3-5磷酸二酯键形成的封闭修饰；

使用时，所述上游随机引物和下游随机引物杂交结合在同一条模板链上，通过上游随机引物向3’端延伸，将与上游随机引物最近的下游随机引物之间的空隙填满，上游随机引物的延伸序列的3’端与下游随机引物的5’端连接起来，将上游随机引物及其延伸序列与下游随机引物连成一段；

所述封闭修饰为双脱氧修饰；

所述上游随机引物的X序列的5’端还包括2-6个保护碱基；所述下游随机引物的X’序列3’端还包括2-6个保护碱基，并且所述封闭修饰在末端的一个保护碱基之上；

所述上游随机引物的X序列具有Seq ID No.1所示序列，所述下游引物的X’序列具有Seq ID No.2所示序列；

Seq ID No.1：5’-GACCGCTTGGCCTCCGACT-3’；

Seq ID No.2：5’-GTCTCCAGTCGAAGCCCGA-3’；

所述上游随机引物的X序列的5’端的保护碱基为“GAC”，所述下游随机引物的X’序列3’端的保护碱基为“CG”。

2.根据权利要求1所述的方法，其特征在于：所述上游随机引物和所述下游随机引物的摩尔用量比为上游随机引物：下游随机引物=2:1。

3.根据权利要求1所述的方法，其特征在于：R=20。

4.一种核酸文库的构建方法，包括采用权利要求1-3任一项所述的方法对DNA样品进行随机片段化，然后采用一对通用引物对双随机打断的DNA片段进行PCR扩增，即获得随机片段富集的核酸文库；所述通用引物由正向引物和反向引物组成，所述正向引物的3’端具有所述测序平台的5’端接头的全部或部分序列，所述反向引物的3’端具有所述测序平台的3’端接头的反向互补序列的全部或部分。

5.根据权利要求4所述的构建方法，其特征在于：所述正向引物和反向引物的5’端分别具有第二测序平台的接头序列。

6.根据权利要求4所述的构建方法，其特征在于：所述正向引物含有Seq ID No.1所示序列，所述反向引物含有Seq ID No.3所示序列；

Seq ID No.3：5’-TCGGGCTTCGACTGGAGAC-3’。