CN110699428B

CN110699428B - 一种寡核苷酸库的均一化方法

Info

Publication number: CN110699428B
Application number: CN201911087247.0A
Authority: CN
Inventors: 齐浩; 郜艳敏
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-11-08
Filing date: 2019-11-08
Publication date: 2021-04-20
Anticipated expiration: 2039-11-08
Also published as: CN110699428A

Abstract

本发明涉及生物技术领域，公开了一种寡核苷酸库的均一化方法。本发明可先将寡核苷酸库通过PCR的方式进行总量的放大，降低寡核苷酸合成成本；同时采用平均分子数加入等量的捕获探针，使各寡核苷酸分子数都趋于平均数，拉近各单链寡核苷酸的浓度，整个过程可以进行多次循环，达到理论上各寡核苷酸的绝对化均一；此外，配合磁珠吸附技术，可高效、简便的纯化寡核苷酸库，相比HLPC和PAGE纯化方法更加优异。

Description

一种寡核苷酸库的均一化方法

技术领域

本发明涉及生物技术领域，更具体的说是涉及一种寡核苷酸库的均一化方法。

背景技术

Oligo pool是基因组学、生物物理学、仿生生物和生物技术应用中的重要反应物；oligo pool可以作为引物和探针应用在生物核酸的扩增、富集、检测和测序过程中。研究者利用Oligo pool来实现基因组装合成；利用其作为探针来进行SNP基因分型；随着科学家发现DNA可以作为存储介质来大规模存储信息，研究者利用芯片合成Oligo pool与DNA数据存储结合将各种信息存储在DNA中。

1)应用于基因组装。随着DNA微阵列技术不断的发展，通过该技术可以产生100万种oligos用于基因组装，促进了高通量的多基因组装的研究。但是在一个oiligo pool中存在着许多oligos，并且相似的oligo之间会产生杂交，生成不需要的基因，导致不能够完全有效的利用池中的oligo。2011年，Quan等介绍了一种在芯片上进行基因合成的技术，该技术利用喷墨打印、等温核苷酸扩增和平行基因组装在单个微芯片上进行基因组装。作者为了有效的利用微阵列上合成的所用oligos，将整个微阵列划分为30个子阵列，每个子阵列包含361个二氧化硅点，用于合成单个的oligo，这样在一个芯片上可以合成10830个不同的oligos，可以合成长达30Kb的DNA。这种高通量基因组装技术需要错配敏感杂交和NGS来纠正基因合成中产生的错误，需要大量的费用。

2016年，Klein等为了解决DNA合成费用高，利用微阵列合成oligos中存在的合成长度短，合成错误率高，产率低以及池中oligos的复杂组装等问题。从DNA微阵列合成oligopool中开发了一种多路合成寡核苷酸组合的方法。Klein等尝试组装了2271个序列长度为192-252bp的oligo，并且使用‘dial-out PCR’和伊利米序列分析的方法来选择没有发生错误组装的基因，来减少基因合成中发生的错误。然而两个oligos的组装限制了目标DNA的长度，高通量测序也增加了合成成本。

为了进一步改进基因合成过程中Mcp-oligo pool的低保真、低产率、高复杂等技术问题。2017年，Wen Wan等利用微芯片合成的oligo设计合成途径，提出了一种经济和简化的从头合成基因的方法。该方法整合了整个oligo pools的扩增，去除了错误和长DNA分子的组装；合成的oligo pools无须预纯化，误差频率从14.25/Kb下降到0.53/Kb。该技术包含三个步骤：1、使用多重PCR将从微芯片上切割的整个Mcp-oligo pool进行扩增；2、高通量纠错，包括重新退火整个放大的oligo pool将错误的核苷酸暴露，用固定化纤维素柱去除误差后再用多重PCR将没有错误的oligo pool从收集的洗脱液中扩增；3、进行多重装配。利用这种方法，作者在大肠杆菌中合成了一种编码10个基因的功能性番茄红素生物蛋白。这种方法可以广泛应用于一般分子生物学实验室的基因和蛋白快速合成。

2)在高通量SNP基因检测中的应用。2002年，Hironori Iwasaki等应用短的等位基因特异性oligos来进行SNP基因检测。通过对192个个体进行10个单碱基变异的基因分型，并与单碱基延伸荧光检测法进行对比，发现基于芯片的oligos方法准确率达到99.9％。作者认为基于微阵列的oligo探针杂交方法能够快速有效的进行SNP分型。

3)在DNA data storage(DNA信息存储)中的应用。由于DNA有较高的存储密度以及较长的保存时间，使得其成为一种优良的数据存储介质。目前，体外存储过程中主要用寡核苷酸片段即DNAoligo pool，但由于在oligo pool合成过程、PCR扩增过程以及在存储过程中DNA衰减都会造成oligo pool中的oligos分布不均匀，进而导致一小部分oligos的丢失，从而导致无法正常解码也即数据的丢失。同时，由于oligo pool中各种类oligos分布不均匀(有部分oligos有较低的拷贝数)，想要(测得这部分数据)完全解码，就要增加测序深度，这势必造成资源的浪费。

利用合成的oligo pool可以高通量进行基因组装，进行SNP基因分型以及DNA信息存储等等。但是由于在合成oligo pool的过程中，合成的oligos浓度不均匀，在对合成的oligos进行扩增过程中，还会产生部分oligo不能够扩增导致oligo pool中各个oligo的浓度不均匀，产生偏差等等。导致部分基因不能合成，基因组装失败。

此外，传统上寡核苷酸的纯化依赖于基于迁移率的分离方法，例如高效液相色谱(HPLC)和聚丙烯酰胺电泳(PAGE)，然而，与这些基于移动性的纯化方法相关的成本主导了整体寡核苷酸合成成本，使得这些方法不适合高通量使用。由于长度和序列变异，库中的寡核苷酸将具有不同的迁移速率，因此将HPLC或PAGE应用于寡核苷酸库不能达到所需的纯化效果。而且，即使对于单一寡核苷酸纯化，HPLC和PAGE也难以完全除去与预期序列仅仅相差一个碱基的寡核苷酸杂质。虽然已经提出基于聚合的替代纯化技术、错配识别酶或相标记的方法，并且也被用于同时纯化寡核苷酸库，但这些技术在HPLC和PAGE上通常没有显示出更好的纯度，并且没有在单分子水平上系统地分析产品序列来表征真正的纯度。Zhang,DY等介绍的化学计量寡核苷酸库纯化的方法(SNOP)虽然可以实现同时纯化，但是前期设计以及化学修饰较为复杂。

发明内容

有鉴于此，本发明的目的在于提供一种寡核苷酸库的均一化方法，使得所述均一化方法，可使寡核苷酸库各核苷酸浓度(或分子数)更均一化；

本发明的另外一个目的在于提供一种寡核苷酸库的均一化方法，使得所述均一化方法，可使寡核苷酸库实现数量庞大的寡核苷酸的纯化，且方法简便，纯化效果优于单独的HLPC和PAGE纯化方法。

为实现上述发明目的，本发明提供如下技术方案：

一种寡核苷酸库的均一化方法，包括：

步骤1、将初始单链寡核苷酸库以及DNA标准品进行凝胶电泳，依据电泳结果，通过灰度分析DNA标准品与寡核苷酸库，计算出初始单链寡核苷酸库的平均分子数；或

将初始双链寡核苷酸库采用正、反向引物对双链寡核苷酸库进行PCR扩增，其中正向或反向引物5’末端带有磷酸基团；PCR扩增后，lambda外切酶识别带有磷酸基团的一条链并进行降解，得到总量放大的单链寡核苷酸库；将所述总量放大的单链寡核苷酸库以及DNA标准品进行凝胶电泳，依据电泳结果，通过灰度分析DNA标准品与所述总量放大的单链寡核苷酸库，计算出所述总量放大的单链寡核苷酸库的平均分子数；

步骤2、按平均分子数加入单链寡核苷酸库中每种单链寡核苷酸的捕获探针，经过杂交，高于平均分子数的单链寡核苷酸没有被捕获会处于游离状态，而低于平均分子数的单链寡核苷酸会全部被捕获，多余的捕获探针处于游离状态；捕获完成之后，经聚合酶聚合，然后将游离的单链寡核苷酸以及捕获探针经外切酶I降解，使各单链寡核苷酸分子数都趋于平均数，拉近各单链寡核苷酸的浓度，得到浓度相对均一的双链寡核苷酸文库；其中，所述捕获探针根据每种单链寡核苷酸序列设计，且5’末端带有磷酸基团；

步骤3、重复步骤1至步骤2零次或一次以上。

在本发明具体实施方式中，所述单链寡核苷酸库由一种或两种以上的单链寡核苷酸构成：所述单链寡核苷酸包括位于两端的引物1区域和引物2区域，以及位于中间的可变序列区域和特异条形码区域；更为具体地，所述单链寡核苷酸由引物1区域、可变序列区域、特异条形码区域以及引物2区域依次连接而成(5’→3’)；

在本发明具体实施方式中，所述初始双链寡核苷酸库由一种或两种以上的双链寡核苷酸构成：所述双链寡核苷酸的一条链包括位于两端的引物1区域和引物2区域，以及位于中间的可变序列区域和特异条形码区域；更为具体地，所述双链寡核苷酸的一条链由引物1区域、可变序列区域、特异条形码区域以及引物2区域依次连接而成(5’→3’)；其中，所述可变序列区域根据实际需要确定该区域核苷酸序列，例如在信息存储应用中，可变序列区域即为所存储的信息的对应序列；所述引物1区域和引物2区域的序列可按照常规引物设计原则设计，在每种寡核苷酸中两个区域的序列可以保持相同，也可以不同；

所述特异条形码区域用于区分每种寡核苷酸，其核苷酸序列由交替的强和弱核苷酸组成，所述强核苷酸为C或G，所述弱核苷酸为A或T，例如CACACA、GTGTGT、CAGTCT等，以这种方式设计条形码序列可以最小化与其互补序列杂交的标准自由能的变化；特异条形码区域的碱基长度依据寡核苷酸库中寡核苷酸的种类数而定，其参照公式2^L＝m计算，L表示特异条形码区域至少达到的碱基长度(或称个数)，m表示寡核苷酸库中寡核苷酸的种类数。此外，用不同引物区别每种氨基酸，由于引物设计原则的限制，会将寡核苷酸库的寡核苷酸种类数量限制在14000条以内，而且在有大量引物的情况下，每条引物的结合效率会有差异。而本发明使用特异条形码，则避免寡核苷酸库数量的限制，同时本发明针对引物2+条形码区域的结构进行扩增，特别是在每种寡核苷酸引物2区域序列相同的前提下，较大程度上会减少结合效率的差异。

此外，引物2区域的序列在每种寡核苷酸中也可以不同，彼此不同的引物2区域的序列与特异条形码相结合，会进一步提高寡核苷酸库的寡核苷酸种类数量。

在上述单链寡核苷酸库的基础上，本发明所述捕获探针序列为与特异条形码区和引物2区互补的序列。

本发明所述浓度相对均一的双链寡核苷酸文库可通过试剂盒纯化回收，为了能够更加高效、简便的纯化双链寡核苷酸库，本发明在最后一次重复中采用5’端修饰有生物素的捕获探针，在此基础上，本发明所述均一化方法还包括步骤4：

双链寡核苷酸文库和带有链霉亲和素的磁珠混合，通过生物素和链霉亲和素将双链寡核苷酸与磁珠结合，然后磁铁吸附，从而将浓度相对均一的双链寡核苷酸文库纯化。

在本发明具体实施方式中，所述步骤1中计算平均分子数具体为：

取已知上样体积的单链寡核苷酸库测试样品以及已知质量的DNA标准品进行聚丙烯酰胺凝胶电泳，通过灰度分析获得单链寡核苷酸库以及DNA标准品的电泳条带灰度值，按照下式计算出寡核苷酸库的平均分子数d：

m2＝m1*N2/N1；

ρ＝m2/v2；

M2＝(L/m)*325；

n2＝(ρ/M2)*N_A；

d＝n2/m；

其中，m1表示DNA标准品的质量，m2表示测试样品的质量；N1表示DNA标准品的灰度值，N2表示测试样品的灰度值；v2表示测试样品的上样体积；ρ表示单链寡核苷酸库的浓度；M2表示单链寡核苷酸库的相对分子量，L表示单链寡核苷酸库所有种类寡核苷酸的总长度，m表示单链寡核苷酸库中寡核苷酸的种类数；n2表示单链寡核苷酸库的分子数，N_A为阿伏伽德罗常数，325表示4种碱基的平均分子量。在实际的建库过程中，每种寡核苷酸的长度优选为长度一致，便于计算相对分子量M2。

针对现有寡核苷酸合成成本较高的问题，本发明均一化方法在步骤1凝胶电泳之前还包括对初始寡核苷酸库(初始时为单链寡核苷酸库，重复时为双链寡核苷酸库，此时与初始双链寡核苷酸库的步骤保持一致)进行PCR扩增进行总量放大的环节，该环节也参与重复：

采用正、反向引物对寡核苷酸库进行PCR扩增，其中正向或反向引物5’末端带有磷酸基团；

PCR扩增后，lambda外切酶识别带有磷酸基团的一条链并进行降解，得到总量放大的单链寡核苷酸库。

在本发明具体实施方式中，反向引物5’末端带有磷酸基团；所述正向引物为引物1区域的序列，所述反向引物为5’末端带有磷酸基团修饰的与引物2区域互补的序列。本发明均一化方法的流程示意图见图1(以初始单链寡核苷酸库为例说明，初始双链寡核苷酸库的流程原理相同)。

由以上技术方案可知，本发明可先将寡核苷酸库通过PCR的方式进行总量的放大，降低寡核苷酸合成成本；同时采用平均分子数加入等量的捕获探针，使各寡核苷酸分子数都趋于平均数，拉近各单链寡核苷酸的浓度，整个过程可以进行多次循环，达到理论上各寡核苷酸的绝对化均一；此外，配合磁珠吸附技术，可高效、简便的纯化寡核苷酸库，相比HLPC和PAGE纯化方法更加优异。

附图说明

图1所示为本发明所述均一化方法的流程示意图；

图2所示为聚丙烯酰胺凝胶电泳结果；其中，孔道1:已知质量的DNA标准品片段；孔道2：PCR产物；孔道3：PCR产物经Lambda exonuclease降解之后的ssDNA产物；孔道4：20bpDNA ladder；

图3所示为双链寡核苷酸库的二代测序有效数据中的一百万条序列的覆盖度结果；

图4所示为小容量寡核苷酸浓度均一化进行荧光验证的结果；其中，泳带1表示只有mix1；泳带2表示mix1+mix4聚合后的产物；泳带3表示mix1+mix4聚合和外切酶降解后产物；泳带4表示只有mix2；泳带5表示mix2+mix4聚合后产物；泳带6表示mix2+mix4聚合和外切酶降解后产物；泳带7表示只有mix3；泳带8表示mix3+mix4聚合后产物；泳带9表示mix3+mix4聚合和外切酶降解后产物。

具体实施方式

本发明公开了一种寡核苷酸库的均一化方法，本领域技术人员可以借鉴本文内容，适当改进工艺参数实现。特别需要指出的是，所有类似的替换和改动对本领域技术人员来说是显而易见的，它们都被视为包括在本发明。本发明所述均一化方法已经通过较佳实施例进行了描述，相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的均一化方法进行改动或适当变更与组合，来实现和应用本发明技术。

在本发明具体实施例中，所用实验试剂如下表1：

表1

所涉及的相关序列见表2：

表2

各缓冲溶液的配制如下：

50хTAE缓冲液：242g/L Tris-base,37.2g/L Na₂EDTA﹒2H₂O,57.1mL/L冰乙酸；

10хTBE缓冲液：108g/L Tris-base,55g/L硼酸,40mL EDTA(pH8.0)；

漂洗结合缓冲液：20mM Tris-HCl(pH7.5),0.5M NaCl,1mM EDTA(pH8.0)；

12％聚丙烯酰胺凝胶：1mL 10хTBE,3mL 40％丙烯酰胺(19：1)，6.7μLTEMED,17.6μL 30％APS，补水至10mL。

在本发明具体实施例中，寡核苷酸上引物1区域的序列和引物2区域的序列为通用引物序列，可按照引物设计原则随意设计，例如：

引物1区域的序列为SEQ ID NO:1所示序列；

引物2区域的序列：TGTTGGCTTAAAGCGCT，SEQ ID NO:2所示；或TGTCCGGCGTCCGCGAT，SEQ ID NO:3所示；

上述引物1区域的序列以及引物2区域的序列仅是为了更具体地说明本发明均一化方案，其他参照引物设计原则设计的通用引物均可以。

本发明均一化具体实施例中以一个包含256种单链寡核苷酸(每种单链寡核苷酸的长度为180nt)的库为例对本发明所述方法进行描述，该单链寡核苷酸库所对应的256条探针序列均类似于SEQ ID NO:11所示序列(AAAAAAGCGCTTTAAGCCAACAGAGTCTGTC)，区别在于与核苷酸特异条形码区序列互补的序列不同(斜体部分碱基)。在此基础上，本发明在此举例说明本发明特异条形码区域的碱基长度，依照前述公式2^L＝256，则L＝8，即在容量为256种单链寡核苷酸库中，特异条形码区域的碱基长度(个数)至少为8。

在实际扩增中，为了更好地消除聚合酶识别3’末端的差异，可将每个探针上的特异条形码区域互补序列最后一个碱基设置为相同碱基；此外，由于探针需要修饰磷酸基团或生物素，为了更好地消除这些修饰带来的空间位阻效应，在探针的上游位置可以添加1个或多个碱基A、C、T或G，这些操作并不限制本发明的技术方案，在SEQ ID NO:11所示序列的探针中，本发明在探针上游添加了5个碱基A来消除空间位阻，将每个探针上的特异条形码区域互补序列最后一个碱基设置为相同的碱基C；

下面结合实施例，进一步阐述本发明。

实施例1：将oligo pool进行PCR扩增以增大oligo pool的总分子数

①PCR体系和程序

表3

Component	50μL	Final Conc.
			H<sub>2</sub>O	21.5
5хQ5 Reaction buffer	10	1х
			dNTPs(2.5mM)	4	0.2mM
F1(100μM)	2	4μM
			R1(100μM)	2	4μM
Oligo pool(0.044ng/μL)	10	0.44ng/50μL
			Q5	0.5

F1为在SEQ ID NO:1所示序列基础上对5’端的1-5个碱基进行硫代修饰的序列，例如C*T*A*CTCCCACTCGTCTATCT；(Lambda外切酶对5’非磷酸化修饰的寡核苷酸有特别微弱的切割能力，为了防止其降解，本发明优选对F1的序列的5’端的碱基进行硫代修饰，*表示修饰碱基)；

R1为在SEQ ID NO:4所示序列基础上对5’端修饰磷酸基团的序列，例如：PO₄-AGCGCTTTAAGCCAACA；

②按照Eastep Gel and PCR Cleanup Kit说明书的操作步骤将PCR产物过柱纯化回收。

③40μL DNase/RNase-free H₂O溶解。

④Nano-100测得DNA浓度。

实施例2：Lambda Exonuclease降解恢复为单链DNA oligo pool

(1)反应体系

表4

Component	30μL	Final Conc.
			H<sub>2</sub>O	15.5	-
10хLambda exonuclease reaction buffer	3	1х
			PCR product(above)(69ng/μL)	10	23ng/μL
Lambda Exonuclease(5U/μL)	1.5	0.25U/μL

37℃温育3h，然后加入EDTA使其终浓度至10mM以终止反应。

(2)按照Eastep Geland PCR Cleanup Kit说明书的操作步骤将产物过柱纯化回收。

(3)40μL DNase/RNase-free H2O溶解。

(4)12％聚丙烯酰胺凝胶电泳验证ssDNA(SYBR Gold染色20min)，同时通过加入已知量的标准DNA并通过灰度分析测得ssDNA的浓度，聚丙烯酰胺凝胶电泳结果见图2。

(5)灰度分析过程：通过Azure进行各条带进行量化。得到孔道1和孔道3的灰度分别是415881和178776，已知孔道1的质量为m1＝29.3ng，那么孔道3的ssDNA的质量为415881/178776＝29.3/m2，计算得到孔道3的为m2＝12.6ng。已知孔道3上样量为v2＝4μL，则ssDNA的浓度为ρ＝m2/v2＝3.15ng/μL。

(6)已知每种ssDNA的长度为180nt,共有m＝256种分子。那么其相对分子质量为M2＝(L/m)*325＝180*325＝58500，1μL中共有分子数n2＝(ρ/M2)*N_A＝(3.15*10^-9/58500)*6.02*10²³＝3.24*10¹⁰，则寡核苷酸库平均分子数d＝n2/m＝3.24*10¹⁰/256＝1.26*10⁸。

实施例3：捕获探针捕获ssDNA

取对应的捕获探针(与引物2区和特异条形码区序列互补)的分子数为实施例2计算得出平均分子数(该捕获探针的分子数由厂家提供一定的浓度换算而来的，N＝c*v*N_A，c为捕获探针的浓度，v是要加入捕获探针的体积)捕获ssDNA，高于平均分子数的ssDNA没有被捕获会处于游离状态，而低于捕获探针的ssDNA会全部被捕获，多余的相应的捕获探针处于游离状态。捕获完成之后，经聚合酶聚合，然后将游离的ssDNA以及捕获探针经外切酶I降解。这样会使得文库中各种类的DNA分子数都趋于平均数，拉近各种类的DNA的浓度，使得其均一化。

(1)捕获

使用了一个含有256条不同序列的DNA oligo pool，相对应的有256条捕获探针。

表5

Component 1	50μL	Final Conc.
			Hybridization Buffer	24.7	1х
ssDNA pool(3.15ng/μL)	20	2.5х10<sup>9</sup>/条
			Capture probe(780pM)	5.3	2.5х10<sup>9</sup>/条

95℃温育3min,然后以0.1℃/s的速率降至60℃。最后60℃温育2h。

(2)延伸

表6

Component 2	15μL	Final Conc.
			H<sub>2</sub>O	2.3
10хEasyTaq Reaction buffer	6.5	1х
			dNTPs(2.5mM)	5.2	0.2mM
EasyTaq	1

首先将表6体系温育至60℃，然后将该体系与表5体系(捕获时的混合物)混合。60℃温育15min。

(3)外切酶I降解

表7

Component 3	10μL	Final Conc.
			H<sub>2</sub>O	1.7
10хExo I Reaction buffer	7.5	1х
			Exo I	0.8

将表7体系与上面延伸之后产物混合进行游离的ssDNA降解。37℃温育3h,然后80℃20min灭活外切酶I。

(4)PCR产物纯化得到均一化后的DNA pool

将上述产物用试剂盒进行PCR产物纯化。

(5)重复前述各实施例步骤

原则上实施例1-3是可以无限次重复的，直至将DNA pool绝对的均一化。

实施例4：纯化环节

在最后一次重复时，捕获探针5’端改修饰为生物素而不修饰磷酸基团，可以直接和带有链霉亲和素的磁珠混合，磁铁吸附，从而将均一化的DNA pool纯化。

(1)首先，将7μLStreptavidin Magnetic Beads(4mg/mL)用100μL漂洗结合缓冲液漂洗，震荡混匀，置于磁场处吸附30s，弃上清。

(2)重复步骤(1)一次。

(3)将实施例3得到的产物，150μL漂洗结合缓冲液以及2μL 20mg/mL的BSA加入磁珠中，混匀，置于37℃摇床温育30min。

(4)置于磁场处吸附30s，弃上清。

(5)用100μL漂洗结合缓冲液漂洗，震荡混匀，置于磁场处吸附30s，弃上清。

(6)重复步骤(5)一次。

(7)10μL0.5x TE溶解得到Stre-Bio DNA Pool。

实施例5：二代测序验证

将实施例4获得的双链寡核苷酸库进行恒温链置换扩增反应，以达到二代测序所要求的量，恒温扩增反应体系如下表8；

表8

37℃温育30min，置于磁场放置2min，吸取上清至一个新的PCR管中。然后加0.5μLProteinase K，37℃温育30min。

按照Eastep Gel and PCR Cleanup Kit说明书的操作步骤将PCR产物过柱纯化回收，送至试剂公司进行二代测序。

从测序的有效数据中取一百万的序列，经blast之后，可以看到经均一化之后覆盖度的分布更加集中。且从峰值和均值之间的差异上看，均一化之后的峰值(峰值是通过覆盖度和频率的图用高斯函数拟合得到)更加靠近均值，说明本发明的均一化是有一定效果的。内置小图是将未均一化，均一化以及均值做的柱形图，使其差异更加直观(见图3)。

实施例6：寡核苷酸浓度均一化验证

该实施例拟通过人工合成小容量单链寡核苷酸库对均一化进行简单验证(不进行PCR扩增和lambda外切酶的降解)，按照本发明步骤1和步骤2方法进行一次捕获；试验在合成的单链寡核苷酸5’端带FAM基团(用于后续电泳观测的需要)的情况下进行SNOP可行性验证。首先合成不同长度的单链DNA片段L1(90bp)，L2(73bp)，L3(60bp)及对应的捕获探针R3,R4,R5，并且分别进行不同比例的混合组分如表9/10所示，mix1:L1/L2/L3＝1:1:1；mix2:L1/L2/L3＝1:5:25；mix3:L1/L2/L3＝5/25/1；mix4:R3/R4/R5＝1:1:1。

将mix4分别与mix1/mix2/mix3混合在一起，组分如表11所示，其反应条件为：95℃加热3min，然后以0.1℃/s的速度降至60℃，最后60℃下温育2h。

接着进行聚合酶的延伸，组分如表12所示，其反应条件为：60℃温育10min。

最后外切酶降解剩余的单链寡核苷酸，组分如表13所示，其反应条件为：37℃温育3h。

反应结束后进行聚丙烯酰胺凝胶电泳，如附图4所示；从胶图中可以看出尽管初始加入的DNA片段比例不同，但通多加入相同比例的引物，最终得到比例相同的DNA片段，实现了浓度的均一化，条带的亮度一致(图中方框所示)；而加入了Exo I的处理能够将未捕获的游离单链寡核苷酸以及捕获探针降解，电泳结果上显示不出现额外的条带，泳道5和6对比以及泳道8和9对比可以看出；而泳道2由于本身三种寡核苷酸的浓度是一致的，故没有出现额外的条带。

表9

Component1	mix1(1:1:1)(10μL)	mix2(1:5:25)(10μL)	mix3(5:25:1)(10μL)
				L1	2.5(1μM)	2.5(1μM)	1.25(10μM)
L2	2.5(1μM)	1.25(10μM)	6.25(10μM)
				L3	2.5(1μM)	6.25(10μM)	2.5(1μM)
H<sub>2</sub>O	2.5	0	0

表10

Component2	mix4
		R3	2.5(1μM)
R4	2.5(1μM)
		R5	2.5(1μM)
H<sub>2</sub>O	2.5

表11

Component3	10(μL)	Final Conc.
			Hybridization Buffer	8	-
mix1/2/3	1	-
			mix4	1	25nM

表12

Component4	20(μL)	Final Conc.
			H<sub>2</sub>O	6.1
10x EasyTaq Reaction buffer	2	1x
			dNTPs(2.5mM)	1.6	0.2mM
Miture(表11)	10
			Taq DNA Pol.	0.3

表13

Component5	25(μL)	Final Conc.
			H<sub>2</sub>O	1.5
10x Exo I Reaction Buffer	2.5	1x
			Exo I(5U/μL)	1
Mixture(表12)	20

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

序列表

<110> 天津大学

<120> 一种寡核苷酸库的均一化方法

<130> MP1921910

<160> 11

<170> SIPOSequenceListing 1.0

<210> 1

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ctactcccac tcgtctatct 20

<210> 2

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tgttggctta aagcgct 17

<210> 3

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

tgtccggcgt ccgcgat 17

<210> 4

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

agcgctttaa gccaaca 17

<210> 5

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atcggtcgaa ttatctcctg ctaggcactc gctgtgccct ggactatcgt aacccatgct 60

gtttgtctct ctctgtccgg cgtccgcgat 90

<210> 6

<211> 73

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ctgctaggca ctcgctgtgc cctggactat cgtaacccat gctgtttgtc agtgtgtgtc 60

cggcgtccgc gat 73

<210> 7

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gctgtgccct ggactatcgt aacccatgct gtttgtcaga gactgtccgg cgtccgcgat 60

<210> 8

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

atcgcggacg ccggacagag agagac 26

<210> 9

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

atcgcggacg ccggacacac actgac 26

<210> 10

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

atcgcggacg ccggacagtc tctgac 26

<210> 11

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

aaaaaagcgc tttaagccaa cagagtctgt c 31

Claims

1.一种寡核苷酸库的均一化方法，其特征在于，包括：

所述初始单链寡核苷酸库由一种或两种以上的单链寡核苷酸构成：所述单链寡核苷酸包括位于两端的引物1区域和引物2区域，以及位于中间的可变序列区域和特异条形码区域；

其中，所述可变序列区域根据实际需要确定该区域核苷酸序列；所述特异条形码区域用于区分每种单链寡核苷酸，其核苷酸序列由交替的强和弱核苷酸组成，所述强核苷酸为C或G，所述弱核苷酸为A或T；

所述初始双链寡核苷酸库由一种或两种以上的双链寡核苷酸构成：所述双链寡核苷酸的一条链包括位于两端的引物1区域和引物2区域，以及位于中间的可变序列区域和特异条形码区域；

步骤3、重复步骤1至步骤2零次或一次以上。

2.根据权利要求1所述均一化方法，其特征在于，最后一次重复中所述捕获探针的5’端修饰有生物素。

3.根据权利要求2所述均一化方法，其特征在于，还包括步骤4：

4.根据权利要求1所述均一化方法，其特征在于，所述单链寡核苷酸由引物1区域、可变序列区域、特异条形码区域以及引物2区域依次连接而成。

5.根据权利要求1所述均一化方法，其特征在于，所述双链寡核苷酸的一条链由引物1区域、可变序列区域、特异条形码区域以及引物2区域依次连接而成。

6.根据权利要求1所述均一化方法，其特征在于，所述步骤1中计算平均分子数具体为：

m2＝m1*N2/N1；

ρ＝m2/v2；

M2＝(L/m)*325；

n2＝(ρ/M2)*N_A；

d＝n2/m；

其中，m1表示DNA标准品的质量，m2表示测试样品的质量；N1表示DNA标准品的灰度值，N2表示测试样品的灰度值；v2表示测试样品的上样体积；ρ表示单链寡核苷酸库的浓度；M2表示单链寡核苷酸库的相对分子量，L表示单链寡核苷酸库所有种类寡核苷酸的总长度，m表示单链寡核苷酸库中寡核苷酸的种类数；n2表示单链寡核苷酸库的分子数，N_A为阿伏伽德罗常数，325表示4种碱基的平均分子量。

7.根据权利要求1-6任意一项所述均一化方法，其特征在于，在步骤1凝胶电泳之前还包括对初始寡核苷酸库进行PCR扩增进行总量放大的环节：

采用正、反向引物对初始寡核苷酸库进行PCR扩增，其中正向或反向引物5’末端带有磷酸基团；