CN111379032A

CN111379032A - 一种用于构建同时实现基因组拷贝数变异检测和基因突变检测的测序文库的方法和试剂盒

Info

Publication number: CN111379032A
Application number: CN201811624681.3A
Authority: CN
Inventors: 贾哲; 陈迪; 张建光
Original assignee: Berry Genomics Co Ltd
Current assignee: Berry Genomics Co Ltd
Priority date: 2018-12-28
Filing date: 2018-12-28
Publication date: 2020-07-07

Abstract

本发明涉及用于构建DNA测序文库的方法和试剂盒。更具体地，本发明提供一种用于构建同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的方法，其特征在于，包括以下步骤：1)裂解细胞以释放基因組DNA；2)使用由随机引物和特异性引物组成的混合引物对基因组DNA进行预扩增；和3)对预扩增之后的基因组DNA进行二次扩增，以获得所述DNA测序文库。本发明还涉及一种同时实现单细胞基因组拷贝数变异检测和基因突变检测的方法和试剂盒。

Description

一种用于构建同时实现基因组拷贝数变异检测和基因突变检测的测序文库的方法和试剂盒

技术领域

本发明涉及用于构建DNA测序文库的方法和试剂盒。更具体地，本发明涉及用于构建能同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的方法和试剂盒。

背景技术

随着科技的进步，传统的Sanger测序已经不能完全满足研究的需要，对基因组测序，需要费用更低、通量更高、速度更快的测序技术，高通量测序(也称第二代测序)技术应运而生。高通量测序技术的核心思想是边合成边测序，即通过捕捉新合成的末端的标记来确定DNA的序列，现有的技术平台主要包括Roche/454FLX、Illumina/Hiseq、Miseq、NextSeq和Life Technologies/SOLID system、PGM、Proton等。到目前为止，Hiseq2000每个run可以达到6个人基因组30x覆盖的测序通量，约600G/run数据，在测序时间上Hiseq2500可以达到平均每8分钟读取一个碱基的速度。而且随着第二代测序技术的成熟，将其应用于临床的研究迅猛发展。

第二代测序技术在基因组拷贝数变异(Copy Number Variation,CNV)、插入缺失标记(Insertion/Deletion，InDel)、单核苷酸多态性(Single NucleotidePolymorphisms，SNP)等检测领域的应用最为成熟。

CNV是指与基因组参考序列相比，基因组中大于等于1kb的DNA片段插入、缺失、倒位、易位和/或重复，及其互相组合衍生出的复杂的染色体结构变异，其具有分布范围广、可遗传、相对稳定和高度异质性等特点。研究表明，CNV是肿瘤发生发展的重要因素，其可通过影响原癌和抑癌基因的活性而诱发肿瘤。

InDel指的是在基因组的某个位置上所发生的小片段DNA序列的插入或者删除。Indel是人类基因组中除SNP外数量最多的变异形式，其中约三分之一位于已知的基因区域内，还有一些位于决定基因功能的关键性区域如启动子区和外显子区。据报道，InDel在基因表型相关的研究中具有广泛用途，并在植物分子育种以及人类疾病诊断方面发挥重要的作用。

SNP是指由于单个核苷酸碱基的改变而导致的核酸序列的多态性，包括但碱基的转换、颠换、缺失和插入等形式。SNP在人类基因组的平均密度较高，可能代表疾病遗传机理中的某些作用因素，并且遗传稳定性较高，因此作为一类遗传标记得以广泛应用。例如，SNP可用于确定基因多态性与疾病的关系，解释个体间的表型差异对疾病的易感程度，预测和诊断疾病，研究不同基因型个体对药物反应的差异，从而指导药物开发以及临床合理用药等。

然而，这三种变异类型，CNV、InDel和SNP对于测序的要求各不相同。具体而言，CNV一般为染色体水平的缺失或重复，因此CNV检测的关键是全基因组均匀覆盖，而对测序深度的要求不高(0.06x左右)。与此相反，对于InDel和SNP的检测，则要求目标区域达到一定的测序深度(至少20x)，而对基因组其他区域没有覆盖要求。在实践中，为了节约测序成本，一般根据不同变异类型对测序的要求而选用不同的检测策略。对于CNV检测，需采用全基因组DNA建库，低覆盖深度测序的方法来实现。而对于indel和SNP的检测，则需要对特异性扩增的目的片段进行建库，深度测序才能准确做出判断，从而达到检测目的。

细胞是生物学的基本单位，通过对单个细胞进行基因组扩增和测序，可以解决用组织样本无法获得不同单个细胞的异质性信息、以及难以对罕见细胞进行常规测序的难题，从而为科学家研究单个细胞的行为、机制、与机体的关系等提供新方向，为早期检测、诊断疾病及疾病的个体化治疗提供指导。在实际应用中，往往需要在检测染色体水平的缺失或重复的同时检测单个基因是否发生SNP或InDel。对于一般样品来而言，这可以通过两次建库和上机来实现，缺点是操作繁琐，周期长，效率低。然而，对于某些细胞(例如罕见细胞)样本，由于样本量有限往往无法做到两次建库，因而无法检测全部三种变异。即使对罕见细胞样本进行全基因组深度测序，测序成本非常高的这一缺点也使其无法大规模应用。因此，迫切需要一种能快速同时实现单细胞基因组拷贝数异常检测和基因突变检测的方法。

发明内容

鉴于目前单细胞拷贝数变异与基因突变检测中所遇到的上述问题，本发明人发现了一种快速的、可同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的构建方法，其可适用于多种二代测序平台，包括但不限于如Roche/454FLX、Illumina/Hiseq、Miseq、NextSeq和Life Technologies/SOLID system、PGM、Proton等测序平台。

本发明是基于发明人的以下发现：随机引物对全基因组的无差别扩增和特异性引物对目标区域的特异性扩增可以在相同反应条件下在同一体系中进行。通过选择合适的特异性引物，并且控制预扩增反应中特异性引物与随机引物的比例，可以在实现目标区域的特异性扩增量高于其他区域的同时，使得这种特异性扩增不会影响全基因组扩增的整体均匀性。依据本发明，低至单个细胞的样本起始量，可以构建出差异性富集的高质量DNA测序文库，从而实现在低样本起始量的情况下，同时检测基因组拷贝数变异和目标区域上的基因突变。

因此，在第一个方面，本发明提供一种用于构建同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的方法，其特征在于，包括以下步骤：

1)裂解细胞以释放基因组DNA；

2)使用由随机引物和特异性引物组成的混合引物对基因组DNA进行预扩增；

3)对预扩增之后的基因组DNA进行二次扩增，以获得所述DNA测序文库。

因此，根据本发明获得的DNA测序文库可以用于同时检测基因组拷贝数变异和基因突变(即，只需测序一次)，而避免两次构建文库以分别检测基因组拷贝数变异和基因突变的繁琐步骤。

在第二个方面，本发明提供一种同时实现单细胞基因组拷贝数变异检测和基因突变检测的方法，包括以下步骤：

1)裂解细胞以释放基因组DNA；

3)对预扩增之后的基因组DNA进行二次扩增，以获得所述DNA测序文库；和

4)对所述DNA测序文库进行高通量测序以同时实现单细胞基因组拷贝数变异检测和基因突变检测。

在第三个方面，本发明提供一种用于构建同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的试剂盒，包括：用于裂解细胞以释放基因组DNA的试剂、用于预扩增的由随机引物和特异性引物组成的混合引物、用于二次扩增的引物、dNTP、缓冲液和DNA聚合酶。

在一个实施方案中，用于构建本发明的测序文库的起始材料可以是单细胞或多细胞。例如，起始材料可以为胚胎8细胞期或囊胚期的活检细胞团。

本发明中的“裂解细胞以释放基因组DNA”的步骤可以通过例如化学裂解、酶裂解、机械裂解等方法实现，从而释放其中的DNA。一般而言，化学裂解和酶裂解通常是比较温和的方法，很少会使DNA断裂，因此是DNA提取中常用的方法。在细胞裂解中常用的试剂包括Tris-HCl pH 7.4、NaCl、PMSF、EDTA、Aprotinin、Leupeptin、Triton X-100、脱氧胆酸钠、SDS、尿素、硫脲、蛋白酶K等。相比而言，机械裂解可以更剧烈和全面的裂解细胞，但也会造成DNA的断裂。常用的机械裂解方法主要包括反复冻融、超声波处理等。本领域技术人员可以根据具体的细胞类型和实验要求选择合适的裂解细胞的试剂和具体条件。在一个优选的实施方案中，采用酶裂解的方式裂解细胞释放基因组DNA。在一个优选的实施方案中，用于裂解细胞的试剂包括裂解酶例如蛋白酶K和裂解缓冲液。

在一个实施方案中，本发明的预扩增步骤中所用的混合引物中的“随机引物”是一段特殊设计的引物。从5’端至3’端，该引物包含以下三部分结构：第一部分为通用区域，此区域在不同测序平台中序列不同，长度为1至70个碱基，优选为10-50个碱基，更优选为10-30个碱基。该通用区域为最终文库结构的一部分，在二次扩增时生成能直接用于测序的文库。此外，该通用区域在一次扩增过程中使生成的产物自身形成类似发卡的结构，不再继续被扩增，使预扩增实现线性扩增，使最终结果基因组覆盖更均匀。第二部分为简并碱基区域，该区域只包含两种不互补的碱基，A和C,或A和G,或T和C,或T和G，长度为12-20个碱基，优选为5-15个碱基，更优选为5-10个碱基。该设计避免了预扩增过程中引物的交叉杂交或自杂交，以实现预扩增的均一性。第三部分为随机简并碱基区域，其中每个碱基可以是包含A、T、C、或G四种碱基，并且在最后三个随机简并碱基之间加入两个硫代修饰，长度为1-8个碱基，优选2-6个碱基，更优选3或4个碱基。本发明中特殊的简并碱基区域的设计提高了产物在基因组上的覆盖度。

在一个优选的实施方式中，本发明预扩增中所用的随机引物序列为：

5’GCTCTTCCGATCTRRRRRRRRRRN*N*N 3’

5’GCTCTTCCGATCTMMMMMMMMMMN*N*N 3’

5’GCTCTTCCGATCTYYYYYYYYYYN*N*N 3’或

5’GCTCTTCCGATCTKKKKKKKKKKN*N*N 3’，

其中R代表A或G碱基，M代表A或C碱基，Y代表C或T碱基，K代表G或T碱基。N代表随机简并碱基A/T/C/G，*代表硫代修饰。

硫代修饰是指在寡聚核苷酸合成时将连接两个单核苷酸之间的磷酸二酯键中的一个氧换成硫。加入硫代修饰后碱基不容易被核酸外切酶切掉，从而可以增加引物的特异性，防止扩增过程中引物二聚体的出现。

在一个实施方案中，本发明的预扩增步骤中所用的混合引物中的“特异性引物”从5’端至3’端包含以下两部分结构：第一部分为通用区域，在不同测序平台中序列不同，长度为1至70个碱基，优选为10-50个碱基，更优选为10-30个碱基。该通用区域为最终文库结构的一部分，在二次扩增时生成能直接用于测序的文库，与随机引物的第一部分通用区域相同；第二部分是针对目标区域设计的特异性序列，长度为10-25个碱基，优选为15-20个碱基。如本发明所用，“特异性引物”或“特异性序列”是指该引物或序列相对于待扩增的目标区域而言具有特异性，这种特异性使得针对其设计的引物或序列能够与该目标区域结合，而不与其他基因组DNA区域结合。在一个优选的实施方案中，本发明的预扩增步骤中所用的“特异性引物”的3’端包含硫代修饰(例如，在3’端的最后三个碱基中包含两个硫代修饰)，以增强其稳定性，避免在体系中被消化。针对目标区域设计的特异性序列的方法是本领域技术人员已知的，例如可以使用primer 5、primer express、beacon design、primerpremier等设计软件。在一个实施方案中，在预扩增步骤中使用一对特异性引物。在另一个实施方案中，在预扩增步骤中使用多对特异性引物。

在一个实施方案中，本发明的方法可以在检测全基因组拷贝数变异的同时，检测一个或多个基因的突变。因此，在本发明的方法中，预扩增步骤可以包括一对或多对特异性引物，所述一对或多对特异性引物针对一个或多个待检测的基因或目标区域。

在一个实施方案中，混合引物中随机引物与特异性引物的摩尔比例为40:1-150:1，优选40:1-50:1。如果该比例过高，则特异性引物的扩增效果较弱，对目标区域的扩增较少，从而无法检测目标区域的基因突变。如果该比例过低，虽然目标区域的扩增将增加，但全基因组扩增会受到特异性引物的强烈干扰，使得最终无法均匀覆盖全基因组，从而使文库质量降低，导致染色体拷贝数变异检测不够准确。如此控制随机引物与特异性引物的比例能弱化特异性扩增引物与随机引物之间的相互干扰，使得在保证特异性引物的扩增效率与特异性的同时，又不会影响全基因组水平的扩增，从而影响最终测序文库的质量。换言之，这种特意控制的比例能使随机引物和特异性引物在同一体系中很好地兼容，使得在同一反应条件下扩增的产物最终既能满足对CNV检测所需的全基因组覆盖度的要求，又能满足对基因突变(例如InDel和SNP)检测所需的测序深度的要求。

在一个实施方案中，本发明的预扩增步骤使用几个不同的退火温度。一般而言，特异性引物使用一个固定的退火温度，而随机引物由于其长度不同则需要多个退火温度。本发明人发现，特异性引物在多个退火温度的情况下仍然能够实现有效的扩增。这使得本发明的预扩增步骤可以在包括多个退火温度的单个程序中完成，从而简化建库流程。

在一个实施方案中，本发明用于二次扩增的引物从5’端开始包括两部分：第一部分为外延伸区，该区域含有可以和上机测序通用杂交引物相结合的区域；第二部分为引物匹配区，该区域可以和预扩增引物(即，随机引物和特异性引物)的通用区域杂交。在不同的实施方案中，外延伸区可以含有barcode序列，用于区分不同的样本或者给样本引入特殊的特征标记。所述barcode序列可以由ATCG四种碱基随意组合，碱基长度可以不固定。

在一个优选的实施方案中，用于二次扩增的引物序列如下：

其中index primer中下划线部分碱基代表barcode序列。

在一个实施方案中，本发明用于预扩增和二次扩增的DNA聚合酶为热稳定的聚合酶，可以是一种，也可以是两种或者两种以上的组合。此类聚合酶的实例是本领域技术人员已知的，包括但不限于LA-Taq、rTaq、Phusion、Deep Vent、Deep Vent(exo-)、Gold 360、Platinum Taq、KAPA 2G Robust。

与现有技术中的DNA测序文库相比，根据本发明的方法和试剂盒制备DNA测序文库的优点在于：(1)流程简单，缩短文库构建时间。因为本发明构建DNA测序文库仅需要三步反应，并且可以在一个反应体系中进行，中间没有纯化或者转管的步骤，因此只需3-4小时即可完成文库构建；(2)能同时实现基因组拷贝数变异的检测和一个或多个基因的基因突变的检测，从而避免现有技术中为了检测全基因组拷贝数变异和基因突变需要进行的两次建库流程，不仅节约了成本，更丰富了检测内容，赋予结果更多内涵；(3)获取不易或数量稀缺的样本，使用该方法可以为此类样本的检测提供更大的操作空间，提高了罕见样本的利用率。

下面将参考附图并结合实例来详细说明本发明。需要说明的是，本领域的技术人员应该理解本发明的附图及其实施例仅仅是为了例举的目的，并不能对本发明构成任何限制。在不矛盾的情况下，本申请中的实施例及实施例中的特征可以相互组合。

附图说明

图1：实施例2的3个样品的高通量测序结果的曼哈顿图。

图2：实施例3的6个样品的高通量测序结果的曼哈顿图。

图3：实施例4的4个样品的高通量测序结果的曼哈顿图。

图4：实施例5的1个样品的高通量测序结果的曼哈顿图(图4A)和拷贝数检测值分布图(图4B)。

具体实施方式

实施例1.根据本发明的方法构建DNA测序文库

步骤1：裂解白细胞(来自健康人的血液样本)，提取DNA。制备如表1所示的反应混合液，将其在60℃温浴20分钟，95℃温浴4分钟，然后使样本保持在4℃。

表1：

步骤2：预扩增基因组DNA。在该步骤中使用的预扩增引物包括随机引物(序列为：5’GCTCTTCCGATCTKKKKKKKKKKN*N*N 3’，其中K代表G或T碱基，N代表随机简并碱基A/T/C/G，*代表硫代修饰)和特异性引物，其中特异性引物针对HBB基因(NCBI ID:NM_000518，已知该基因的突变导致β-地中海贫血)的2号外显子和3号外显子设计，其序列如下表2所示(其中下划线所示的GCTCTTCCGATCT表示特异性引物中的通用区域)。

表2

在步骤1的反应混合物的基础上制备包含如下组分的预扩增反应体系：10μl DNA(上一步反应)、0.5μl 10mM dNTP、4μl 5×聚合酶缓冲液、一定量的预扩增引物、0.5μlkapa酶、1.6μl 25mM MgCl₂，然后用无菌H₂O将总体积补足为20μl。其中，预扩增引物的组成和含量如下表3所示。

表3

预扩增的反应方案为：：a.95℃3分钟→b.19个如下的循环：98℃20秒，15℃50秒，25℃40秒，35℃30秒，65℃40秒，72℃1分钟→c.保持在4℃。

步骤3：二次扩增。预扩增结束后，直接在预扩增反应体系的基础上制备如表4所示的二次扩增反应体系。

表4.

二次扩增的反应方案为：a.95℃3分钟→b.5个如下的循环：98℃20秒，50℃30秒，72℃1分钟→c.8个如下的循环：98℃20秒，60℃30秒，72℃1分钟→c.保持在4℃。

所得二次扩增的产物即为DNA测序文库。

实施例2.检测DNA测序文库的质量

将实施例1制备的DNA测序文库进行纯化，然后用Qubit检测浓度。空白对照浓度应<10ng/μl，样品浓度应≧10ng/μl，对浓度符合要求的样本进行qPCR定量。根据qPCR定量结果，按照测序仪标准操作规程操作，将文库进行36bp单端测序。将单端测序结果与人类基因组参考序列进行比对，检测每个样品的基因组拷贝数变异情况并对文库质量以及HBB扩增结果进行分析。

图1示出了根据实施例1制备的3个样品的高通量测序结果的曼哈顿图。如图1所示，3个样品的测序结果均显示全基因组的随机扩增比较均匀，1号至22号染色体拷贝数均为2，同时拥有2条X染色体。对每条染色体进行CNV分析，发现不存在基因组拷贝数变异(数据未显示)。此外，3个样品的测序结果均表现为散点分布集中均匀，趋势平稳，表明在本发明所设定的反应条件和反应体系下，特异性引物的加入(无论是包含或不包含硫代修饰)不会对随机引物的扩增产生明显影响，所得测序文库均满足基因组拷贝数变异检测的要求。

表5示出了本实施例的3个样品的测序结果统计以及HBB基因的扩增情况。

表5.

样品编号	Mapped reads	Map ratio	Uniq ratio	Exon2扩增数	Exon3扩增数
						RDHBBD2_H502	6569105	90.03％	72.47％	0	0
RDHBBNS_H518	7590996	82.8％	65.8％	0	1
						RDHBB72_H536	9234989	95.9％	72.2％	676	315

从以上结果可以看出，在没有添加特异性引物的情况下(样品1)，仅用随机引物并不能扩增HBB基因的exon2和exon3。此外，发明人还出乎意料地发现，特异性引物中的硫代修饰对目标区域的扩增效果具有重要影响。在特异性引物不包含硫代修饰的情况下(样品2)，目标区域并没有得到有效扩增，由于扩增后的拷贝数严重不足，测序文库不能用于有效检测HBB基因的突变情况。相反，在特异性引物中加入硫代修饰之后(样品3)，目标区域的扩增效果得到显著改善，扩增后所得的拷贝数足以检测HBB基因的突变。

实施例3.随机引物与特异性引物的比例对测序文库质量的影响

根据实施例1的方法制备DNA测序文库，区别在于预扩增引物的组成和含量如下表6所示：

表6

对制备所得的DNA测序文库进行纯化，然后用Qubit检测浓度。空白对照浓度应<10ng/μl，样品浓度应≧10ng/μl，对浓度符合要求的样本进行qPCR定量。根据qPCR定量结果，按照测序仪标准操作规程操作，将文库进行36bp单端测序。将单端测序结果与人类基因组参考序列进行比对，检测每个样品的基因组拷贝数变异情况并对文库质量以及HBB扩增结果进行分析。

图2示出了本实施例制备的6个样品的高通量测序结果的曼哈顿图。从图2可以看出，RDHBB11_H561、RDHBB1515_H585、RDHBB22_H588、RDHBB44_H504和RDHBB64_H578这5个样品的全基因组随机扩增比较均匀，1号至22号染色体拷贝数均为2，并且性染色体的拷贝数也正常。对每条染色体进行CNV分析，发现不存在基因组拷贝数变异(数据未显示)。然而，RDHBB88_H540H541样品的曼哈顿图显示，其全基因组随机扩增明显比较发散，已经不适于检测基因组拷贝数变异。

表7示出了本实施例的6个样品的测序结果统计以及HBB基因的扩增情况。

表7.

从以上结果可以看出，当随机引物与特异性引物的摩尔比例过大时(例如约200：1，样品RDHBB11_H561)，此时在预扩增步骤中发生的主要是基于随机引物的全基因组扩增，而基于特异性引物的目标区域扩增则被抑制，最终使得目标区域的扩增拷贝数不足。这种情况下，虽然不影响全基因组拷贝数变异的检测，但却无法同时检测目标区域的基因突变。然而，当随机引物与特异性引物的摩尔比例过小时(例如约25:1，样品RDHBB88_H541)，虽然目标区域的扩增数显著增加，但全基因组范围的扩增却不能满足拷贝数变异检测的需要(map ratio和uniq ratio太低)。此外，随机引物与特异性引物的摩尔比例还尤其影响特异性扩增的效果。从表7可以看出，尽管该比例为133:1(样品RDHBB1515_H585)时，特异性扩增的拷贝数也满足基因突变检测的需求，但当该比例降低至50:1(样品RDHBB44_H504)时，特异性扩增的拷贝数显著增加，使得基因突变的检测更为容易和准确。

因此，只有当随机引物与特异性引物的摩尔比例在一个合理范围内(例如40:1-150:1，优选40:1-50:1)时，全基因组扩增和目标区域扩增才能同时有效进行而不会相互干扰，使得最后产生的DNA测序文库既能满足拷贝数变异检测的需要，又能满足目标基因突变检测的需要。

实施例4：根据本发明的方法构建DNA测序文库并进行高通量测序

根据实施例1的方法制备DNA测序文库，区别在于样品是来自β地中海贫血症患者(通过现有的基因突变检测技术确认在HBB基因具有T至A的点突变)的单个白细胞，并且预扩增引物的组成和含量如下：0.8μl 50μM随机引物+1μl 0.7μM exon2引物(包含硫代修饰)+1μl 0.2μM exon3引物(包含硫代修饰)。

对制备所得的DNA测序文库进行纯化，然后用Qubit检测浓度。空白对照浓度应<10ng/μl，样品浓度应≧10ng/μl，对浓度符合要求的样本进行qPCR定量。根据qPCR定量结果，按照测序仪标准操作规程操作，将文库进行150bp双端测序。从双端测序结果中提取单端测序数据，并与人类基因组参考序列进行比对，检测每个样品的基因组拷贝数变异情况并对文库质量以及HBB扩增结果进行分析。

图3示出了本实施例制备的4个样品的高通量测序结果的曼哈顿图。从图3可以看出，4个样品的全基因组随机扩增比较均匀，1号至22号染色体拷贝数均为2，并且均拥有1条X染色体与1条Y染色体。对每条染色体进行CNV分析，发现不存在基因组拷贝数变异(数据未显示)。

表8示出了4个样品的测序结果统计以及HBB基因的扩增情况。

表8.

进一步使用双端数据进行HBB片段筛选，统计匹配至HBB基因exon2与exon3区域的reads编号，根据编号获得完整的150个碱基的序列，分析其中的基因突变，统计突变reads数量及比例，结果如下表9所示。

表9.

样品编号

染色体

位置

Reads数

突变

类型

比例

PGSPC1_H572

11

5248200

815

T→A

SNP

75.80％

PGSPC2_H577

11

5248200

1385

T→A

SNP

49.40％

PGSPC3_H578

11

5248200

918

T→A

SNP

80.80％

PGSPC4_H579

11

5248200

581

T→A

SNP

45.60％

从以上结果可以看出，本发明的DNA测序文库能够准确检测HBB基因的突变(即，11号染色体5248200位碱基T突变为A)，这与之前确认的样品突变信息一致。

实施例5：根据本发明的方法构建DNA测序文库并进行高通量测序

根据实施例1的方法制备DNA测序文库，区别在于样品是通过现有的CNV检测技术确认在22号染色体长臂存在5.96Mb缺失的gDNA样本，其中预扩增引物的组成和含量如下：0.8μl 50μM随机引物+1μl 0.7μM exon2引物(包含硫代修饰)+1μl 0.2μM exon3引物(包含硫代修饰)。

图4示出了本实施例制备的1个样品的高通量测序结果的曼哈顿图(图4A)和拷贝数检测值分布图(图4B)。从图4A可以看出，该样品的全基因组随机扩增比较均匀，在1号至22号染色体均具有2个拷贝，且拥有1条X染色体与1条Y染色体。对每条染色体进行CNV分析，发现在22号染色体上具有一段DNA缺失，即在22号染色体检测到拷贝数变异(图4B)。

表10示出了本实施例的样品的测序结果统计以及HBB基因的扩增情况。

表10.

进一步使用双端数据分析HBB基因的突变情况，未在该样品中检测到HBB基因的突变。

因此，根据本发明的方法获得的高质量文库既可以用于基因组拷贝数变异的检测，也能通过特异性扩增准确检测出样本所携带的基因突变。

需要说明的是，以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。本领域技术人员理解的是，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用于构建同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的方法，其特征在于，包括以下步骤：

1)裂解细胞以释放基因组DNA；

2.权利要求1所述的方法，其特征在于，所述细胞是8细胞期卵裂球的单细胞或囊胚期的活检细胞团。

3.权利要求1所述的方法，其特征在于，所述随机引物包含三部分结构：第一部分为通用区域，此区域在不同测序平台中序列不同；第二部分为简并碱基区域；第三部分为随机简并碱基区域。

4.根据权利要求1所述的方法，其特征在于，所述随机引物序列为：

5’GCTCTTCCGATCTRRRRRRRRRRN*N*N 3’或

5’GCTCTTCCGATCTMMMMMMMMMMN*N*N 3’或

5’GCTCTTCCGATCTYYYYYYYYYYN*N*N 3’或

5’GCTCTTCCGATCTKKKKKKKKKKN*N*N 3’，

其中R代表A或G碱基,M代表A或C碱基，Y代表C或T碱基，K代表G或T碱基，N代表随机简并碱基A/T/C/G，*代表硫代修饰。

5.根据权利要求1所述的方法，其特征在于，所述特异性引物从5’端至3’端包含以下两部分结构：第一部分为通用区域，在不同测序平台中序列不同；第二部分是针对目标区域设计的特异性序列。

6.根据权利要求1所述的方法，其特征在于，所述特异性引物在3’端包含硫代修饰。

7.根据权利要求1所述的方法，其特征在于，所述随机引物与特异性引物混合的摩尔比例为40:1-150:1，优选40:1-50:1。

8.根据权利要求1所述的方法，其特征在于，所述二次扩增使用的引物从5’端开始包括两部分：第一部分为外延伸区，该区域含有可以和上机测序通用杂交引物相结合的区域；第二部分为引物匹配区，该区域含有可以和预扩增引物杂交的区域。

9.一种用于构建同时实现单细胞基因组拷贝数变异检测和基因突变检测的DNA测序文库的试剂盒，其特征在于，包括以下组分：裂解细胞以释放基因組DNA的试剂、用于预扩增的由随机引物和特异性引物组成的混合引物、用于二次扩增的引物、dNTP、缓冲液和DNA聚合酶。

10.根据权利要求9所述的试剂盒，其特征在于，所述细胞是8细胞期卵裂球的单细胞或囊胚期的活检细胞团。

11.权利要求要求9所述的试剂盒，其特征在于，所述随机引物包含三部分结构：第一部分为通用区域，此区域在不同测序平台中序列不同；第二部分为简并碱基区域；第三部分为随机简并碱基区域。

12.权利要求要求9所述的试剂盒，其特征在于，所述随机引物序列为：

5’GCTCTTCCGATCTRRRRRRRRRRN*N*N 3’或

5’GCTCTTCCGATCTMMMMMMMMMMN*N*N 3’或

5’GCTCTTCCGATCTYYYYYYYYYYN*N*N 3’或

5’GCTCTTCCGATCTKKKKKKKKKKN*N*N 3’，

13.权利要求要求9所述的试剂盒，其特征在于，所述特异性引物从5’端至3’端包含以下两部分结构：第一部分为通用区域，在不同测序平台中序列不同；第二部分是针对目标区域设计的特异性序列。

14.权利要求要求9所述的试剂盒，其特征在于，所述特异性引物在3’端包含硫代修饰。

15.权利要求要求9所述的试剂盒，其特征在于，所述随机引物与特异性引物混合的摩尔比例为40:1-150:1，优选40:1-50:1。

16.权利要求要求9所述的试剂盒，其特征在于，所述二次扩增使用的引物从5’端开始包括两部分：第一部分为外延伸区，该区域含有可以和上机测序通用杂交引物相结合的区域；第二部分为引物匹配区，该区域含有可以和预扩增引物杂交的区域。