CN111206076A

CN111206076A - 一种基于片段分析技术的拷贝数变异通用验证方法

Info

Publication number: CN111206076A
Application number: CN202010120719.4A
Authority: CN
Inventors: 赵书民
Original assignee: Shanghai Jingzhun Biomedicine Co ltd
Current assignee: Shanghai Jingzhun Biomedicine Co ltd
Priority date: 2020-02-26
Filing date: 2020-02-26
Publication date: 2020-05-29
Anticipated expiration: 2040-02-26
Also published as: CN111206076B

Abstract

本发明涉及生物技术领域，公开了一种基于片段分析技术的拷贝数变异(CNV)通用验证方法：包括用于构建多重内标测量系统(MISS)的多态性遗传标记筛选原则；设计用于扩增多态性遗传标记的PCR引物和CNV区域内的PCR引物；对样本进行扩增并对扩增产物进行毛细管电泳片段分析，得到各个位点的基因型、各扩增产物峰的峰高或峰面积；通过MISS和z检验对CNV拷贝数进行验证。本发明提供的这种基于片段分析技术的拷贝数变异的验证方法适用于人基因组任意位置CNV的拷贝数验证；用于构建MISS系统的遗传标记与待验证CNV可以连锁也可以不连锁；不受CNV拷贝数是增加还是减少的影响；拷贝数结果基于严格的统计学检验，可靠性更高。

Description

一种基于片段分析技术的拷贝数变异通用验证方法

技术领域

本发明涉及生物技术领域，尤其涉及一种基于片段分析技术的人基因组中拷贝数变异的拷贝数验证方法。

背景技术

基因组DNA水平的变异研究是人的分子遗传研究的核心问题之一。依据基因变异所涉及人基因组DNA片段的大小，可分为(1)微小变异：通常涉及单个或多个核苷酸的变化；(2)拷贝数变异(Copy Number Variations，CNVs)：通常指长度涉及1kb或以上的DNA片段的缺失(拷贝数减少)、重复(拷贝增加)等；(2)染色体倍型变化：指至少1条或多条染色体数目的变化，如游离型的21三体综合征即是由于21号染色体完整增加了1条所致。其中，CNVs的研究是目前相关研究中的热点之一。

在全基因组范围内，传统的高分辨率核型分析技术(Yunis,1978；Trask,2002)可分辨约5Mb以上的拷贝数变化。随着分子生物学技术手段的发展，已出现一些更高通量的基于分子手段的CNVs检测方法，如比较基因组杂交(aCGH)技术、基于单核苷酸多态性的基因芯片技术(Manning and Hudgins,2010)，以及基于二代测序的CNVs检测方案(CN201680067423.2)。理论上，对于基于高通量分子检测方案所发现的特定区域的CNVs都需要采用不同的技术方案进行验证。

用于特定区域的CNVs的验证方案已有多种，包括多重连接探针扩增技术(multiplex ligation-dependent probe amplification,MLPA，Schouten等，2002)以及更为常用的实时荧光定量技术(qPCR)。qPCR需要在CNV区域设计引物与荧光探针，并采用单拷贝的内参基因通过相对定量的方式实现对特定CNV区域拷贝数计数(如申请号为201810096023.5的专利技术)。该方案操作相对简单，但所需要的引物与探针的设计要求较高，尤其是当CNVs区域存在高度同源序列时常导致相应的引物探针无法设计，而无法采用该技术方案。同时，采用实时荧光定量进行CNV拷贝数变异检测时也通常需要制备标准曲线。

MLPA是在CNV区域的高度保守区设计两条相邻的探针，在探针杂交后通过连接酶反应进行探针连接，然后通过两条探针末端的公用PCR引物进行扩增，依据信号强度对拷贝数进行相对定量。为了实现相对定量，在MLPA中需要依据其它单拷贝基因的保守区域设计多条参考探针。虽然不同的连接后探针使用公用引物进行扩增，以提供相对一致的扩增效率，但连接效率的差异仍然导致同一个反应内不同连接后探针的PCR扩增峰高存在显著差异，校准CNVs计数的标准差较大，对结果判断造成一定的干扰。同时MLPA的实验操作复杂，需要通过探针杂交、连接酶反应、PCR扩增、毛细管电泳才能实现对特定CNVs拷贝数的检验。

近年，也有人提出了利用与CNV区域紧邻的单个多态性位点、通过一代基因测序的方法进行特定区域CNV的验证方案，当基因测序发现该杂合性位点只有一个等位基因时，可提示相应的CNV区域存在拷贝数的丢失(如申请号为201811492690.1的专利技术)。该方法较好地解决了部分CNVs无法采用实时荧光定量PCR方案的问题，同时通过一代基因测序的定性判断可对缺失型CNVs的进行准确判断；但这一方案存在的问题是，一是需要在CNVs与临近区域(小于800bp)要找到合适的多态性位点且该位点在该样本中为杂合状态，二是对于拷贝数增加型的CNVs(重复)则无法采用这一技术方案进行验证。

发明内容

本发明为解决现有技术中的上述问题提出的一种基于片段分析技术的拷贝数变异通用验证方法。

为实现上述目的，本发明采用以下技术方案：

本发明提供了一种基于片段分析技术的拷贝数变异通用验证方法，包括如下步骤：

步骤一，在人基因组范围的单拷贝区域筛选n个具有高度多态性的长度多态性遗传标记；并选择特定的已知拷贝数的单拷贝内参基因作为质控位点；

步骤二，针对CNV区域和步骤一所筛选的长度多态性遗传标记及质控位点按引物设计基本原则要求设计PCR引物；

步骤三，提取基因组DNA，然后对提取的基因组DNA进行PCR扩增；

步骤四，对步骤三扩增得到的产物进行毛细管电泳片段分析，得到各个位点的基因型、各扩增产物峰的峰高或峰面积；

步骤五，将步骤四测得的峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点的拷贝数：

N＝mRR＝mR_s/R_c (式-1)

其中：

m为已知的对照样本中目标CNV区域拷贝数；RR为R_s与R_c的比值；下标s指待测样本，下标c指对照样本；

h指目标CNV扩增片段的峰高；tH指n个遗传标记全部扩增片段的峰高和；

计算质控位点的拷贝数时，上述参数替换为质控位点相应的参数。

在这一方案中，R为目标CNV区域扩增片段峰高h与n个遗传标记全部扩增片段峰高和tH的比值，这一比值即为目标CNV区域拷贝数在这一特定多重扩增系统内的一个度量值，这一方案称之为多重内标测量系统(Multiple internal scale system，MISS)；在待测样本(sample，s)中这一比值称为R_s，在对照样本(control，c)中这一比值称为R_c，m为已知对照样本中与待测CNV区域同一区域的拷贝数；

步骤六，当目标CNV区域拷贝数N不为0时，对步骤五中的待测样本中目标CNV区域拷贝数和质控位点的拷贝数N进行z检验：

当N＝0时，可依据目标CNV区域扩增片段的峰高h＝0(即未出现CNV区域的扩增产物峰)进行定性判断，对这一定性判断结果不需要进行z检验；当N不为0时，采用下述方法构建统计量z进行检验：

在n个遗传标记中，设第i个遗传标记全部扩增片段(每一遗传标记的扩增片段只有1个或2个，仅有1个扩增峰时为纯合型，有2个长度不等的扩增峰时为杂合型)的峰高和为H_i，n个遗传标记全部扩增片段的峰高和记为tH，计算二者之比，记为R_i，此比值即依据MISS系统对各个已知拷贝数(拷贝数为2)的遗传标记峰高值的度量值：

计算待测样本s与对照样本c中对应R_i值之比RR_i：

由于无论是待测样本还是对照样本，n个遗传标记中每一个遗传标记所在区域的拷贝数均为2，在相同的多重PCR扩增体系内，依据相同的MISS系统对各遗传标记的度量值理论上就相等，故n个遗传标记的RR值的理论值均为1。计算n个遗传标记的RR_i值的标准差sd：

以式-1中的RR值、n个遗传标记的RR_i的均值及其标准差sd，以及已知的对照样本中目标CNV区域拷贝数m，构建统计量z：

其中，步骤五和步骤六中所出现的峰高可以替换为步骤四中测得的对应峰面积来计算和验证拷贝数变异；

在对质控位点的拷贝数进行检验时，相应参数替换为质控位点对应的参数。

进一步地，步骤一中长度态性遗传标记的筛选标准如下：

(1)长度多态性遗传标记为插入/缺失标记(Insertion/Deletion,InDel)或复等位基因的短串联重复序列(Short tandem repeat,STR)；其中，插入/缺失标记的两个等位基因间长度差异在3-8bp，短串联重复序列的重复单元为3-5bp；

(2)长度多态性遗传标记在人群中的杂合度在0.3-0.8之间；长度多态性遗传标记的个数n为5-10；

(3)长度多态性遗传标记位于单拷贝区域。

进一步地，长度多态性遗传标记为插入/缺失标记。

进一步地，长度多态性遗传标记位于1-3个单倍型中，同一个单倍型中遗传标记间的最大遗传距离小于1cM。

进一步地，长度多态性遗传标记与待验证的CNV区域可以连锁或不连锁、也可以在或者不在同一条染色体上。

进一步地，步骤二中PCR扩增的体系包括：TaqDNA聚合酶、PCR缓冲液、引物组、人基因组DNA模板。

进一步地，引物组包括多态性遗传标记PCR引物、质控位点引物和待验证CNV区域的PCR引物。

进一步地，引物组中各PCR引物的终反应浓度为100-300pmol/L。

进一步地，人基因组DNA模板通常为1-10ng。

进一步地，在步骤六中基于z检验对已知的质控位点拷贝数检验结果正确的前提下，目标CNV区域拷贝数的判断标准为：

CF与CR有扩增产物峰且z<＝-3时，待测样本目标CNV区域为1拷贝；

CF与CR有扩增产物峰且z>＝3时，待测样本目标CNV区域为3拷贝或以上；

CF与CR有扩增产物峰且-3<z<3时，待测样本目标CNV区域为2拷贝。

进一步地，上述质控位点为X染色体上的ZFX、Y染色体上的ZFY和15号染色体上的B2M基因。

本发明采用上述技术方案，与现有技术相比，具有如下技术效果：

(1)依据本发明所提出的基于MISS系统的特定CNV拷贝数验证方案，不受CNV拷贝数是增加还是减少的影响；

(2)依据本发明所提出的基于MISS系统的特定CNV拷贝数验证方案，CNV区域内PCR引物的设计限制更低，并且不需要设计荧光探针，有效克服了实时荧光PCR方案的缺点，且采用本发明方案验证CNV拷贝数时不需要制备标准曲线；

(3)依据本发明所提出的基于MISS系统的特定CNV拷贝数验证方案，仅需要常规的DNA提取、PCR扩增与毛细管电泳，与MLPA相比与实验操作的复杂度明显降低，设计难度也更低。

(4)本发明的方法，最终通过z检验，对目标CNV拷贝数这一离散型数据进行了统计学判断，并且采用已知拷贝数质控位点作为这一方法的内部质量控制，因此目标CNV拷贝数验证结果的可靠性更高。

(5)本发明中选择用于构建MISS系统的长度多态性遗传标记与待验证CNV可以在同一条染色体上也可在不同染色体上，与待验证CNV可以连锁也可以不连锁，选择自由度高，可行度高、操作简单。

附图说明

图1为本发明实施例中待测CNV区域与长度多态性遗传标记的一种位置关系设计图，该图显示的是待测CNV区域与构建MISS系统的n个长度多态性遗传呈连锁状态；

图2为本发明实施例中的长度片段多态性遗传标记杂合型峰型图；

图3为本发明一实施例中对照样本(Z，正常男性)的毛细管电泳图谱；

图4为本发明一实施例中待检样本(P0646，正常男性)的毛细管电泳图谱；

图5为本发明一实施例中XXX型国家参考品毛细管电泳图谱；

图6为本发明一实施例中XXY型国家参考品毛细管电泳图谱。

具体实施方式

本发明提供了一种基于片段分析技术的拷贝数变异的通用验证方法。

下面通过具体实施例对本发明进行详细和具体的介绍，以使更好的理解本发明，但是下述实施例并不限制本发明范围。

实施例一

本实施例对该方法进行详细说明，该方法具体包括如下步骤：

步骤一，在人基因组范围的单拷贝区域筛选具有高度多态性的长度多态性遗传标记；筛选的标准如下：

(2)长度多态性遗传标记在人群中的杂合度在0.3-0.8之间；长度多态性遗传标记的个数为5-10；

(3)长度多态性遗传标记位于单拷贝区域，进一步地，所选择的长度多态性遗传标记间应位于1-3个单倍型(Haplotype)中，同一个单倍型中遗传标记间的最大遗传距离应小于1cM。所选择遗传标记可与待验证的CNV区域连锁或不连锁、甚至允许不在同一条染色体上。图1所示为所选择的长度多态性遗传标记位于待验证CNV区域侧翼且与其连锁。

步骤二，选择ZFX、ZFY和B2M基因作为质控位点(ZFX/Y为分别位于X染色体和Y染色体上同源单拷贝内参基因，B2M为位于15号染色体上的单拷贝内参基因)，针对CNV区域、质控位点和步骤一所筛选的长度多态性遗传标记按引物设计基本原则要求设计PCR引物。其中，CNV区域至少设计1对PCR引物，该引物在CNV区域内的位置不限；所有引物对的扩增片段长度均不等，其长度差异，依据所选择的片段分析技术平台而定。当选择一代测序平台进行片段分析技术时，所有引物对可能的扩增片段长度差异至少2bp，其它技术平台扩增片段长度差异至少3bp。此外，依据所选择的片段分析技术平台，以决定PCR引物是否进行荧光素标记。当采用一代测序平台进行片段技术分析时，所有的引物对其中1条引物应标记荧光素，优选地，应标记相同的荧光素，如FAM。如采用非荧光素作为信号报告的平台，引物可不标记荧光素。

步骤三，提取基因组DNA，然后对提取的基因组DNA进行PCR扩增。其中，PCR扩增体系包括：TaqDNA聚合酶、PCR缓冲液、引物组(包括各多态性遗传标记PCR引物、质控位点引物、所设计的待验证CNV区域PCR引物)、人基因组DNA(对照样本或待检样本)。引物组中各PCR引物的终反应浓度通常为100-300pmol/L(依据各引物的扩增效率而定)。人基因组DNA模板通常为1-10ng。

步骤五，将步骤四测得的峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点拷贝数：

N＝mRR＝mR_s/R_c (式-1)

其中：

m为已知的对照样本中目标CNV区域拷贝数；RR为R_s与R_c的比值；下标s指待测样本，下标c指对照样本

在这一方案中，R为目标CNV区域正向引物(CF)与反向引物(CR)扩增片段的峰高h与n个遗传标记全部扩增片段的峰高和tH的比值，这一比值即为目标CNV区域拷贝数在这一特定多重扩增系统内的一个度量值，这一方案称之为多重内标测量系统(Multipleinternal scale system,MISS)；在待测样本(sample,s)中这一比值称为R_s，在对照样本(control,c)中这一比值称为R_c，m为已知对照样本中与待测CNV区域同一区域的拷贝数。

待测样本CNV区域拷贝数N的取值范围为0，1，2，3或以上。

当目标CNV区域拷贝数N取值为0时，即待测样本中目标CNV区域的CF与CR无扩增片段，相应的峰高h为0，此时为定性判断，无需对判断结果进行精确度的评估。当待测样本中CF与CR出现扩增片段时，即表明待测样本CNV区域拷贝数N不为0，此时可采用z检验对待验证CNV区域拷贝数进行判断。

步骤六，当目标CNV区域拷贝数N不为0时，对步骤五中的待测样本中目标CNV区域拷贝数和质控位点拷贝数进行z验证。同时对已知拷贝数的质控位点的拷贝数检测值进行检验，是对该方案所提出的CNV通用验证方法的内部质量控制。

在n个遗传标记中(n为5-10)，设第i个遗传标记全部扩增片段(每一遗传标记的扩增片段只有1个或2个，仅有1个扩增峰时为纯合型，有2长度不等的扩增峰时为杂合型)的峰高和为H_i，n个遗传标记全部扩增片段的峰高和记为tH，计算二者之比，记为R_i，此比值即依据MISS系统对各个已知拷贝数(拷贝数为2)的遗传标记峰高值的度量值：

计算待测样本s与对照样本c中对应R_i值之比RR_i：

n个遗传标记的RR值的理论值均为1，计算其标准差sd：

n个遗传标记的RR值的理论值均为1，这一结论的理论基础如下：

如图1所示，由于人为二倍体，无论在待测样本、还是在对照样本中，目标CNV区域侧翼的长度多态性遗传标记所在区域拷贝数均2。待测样本与对照样本采用了相同的多重扩增系统进行扩增，则依据MISS系统对拷贝数为2的度量值理论上均应相等，因此n个遗传标记的RR值的理论值应均为1。当所筛选的n个遗传标记与目标CNV区域不连锁时，由于所选择的n个遗传标记均位于已知的单拷贝区域，因此，上述结论依然成立。同时，依据长度片段多态性遗传标记的峰型，可对多态性遗传标记所在单倍型(Haplotype)的拷贝数为2进行验证，如图2所示，长度片段多态性遗传标记出现两个近似1:1的峰型时(杂合型)，即可表明多态性遗传标记所在单倍型(Haplotype)的拷贝数为2。

以目标CNV区域拷贝数度量值RR、n个遗传标记拷贝数的度量值RR_i的均值及其标准差sd，以及已知的对照样本中目标CNV区域拷贝数m，构建统计量z，其中，i＝1,2,…,n，常量2指遗传标记所在单倍型(Haplotype)的拷贝数：

依据z检验统计学原理，采用下述标准对目标CNV区域的拷贝数进行判断：

CF与CR有扩增产物峰(即CNV区域拷贝数不为0)且z<＝-3时，即CNV区域拷贝数显著低于多态性遗传标记所代表的CNV侧翼的2拷贝，则CNV区域为1拷贝；

CF与CR有扩增产物峰(即CNV区域拷贝数不为0)且z>＝3时，即CNV区域拷贝数显著高于多态性遗传标记所代表的CNV侧翼的2拷贝，即为3拷贝或以上；

CF与CR有扩增产物峰(即CNV区域拷贝数不为0)且-3<z<3时，即CNV区域拷贝数与多态性遗传标记所代表的CNV侧翼的2拷贝无显著差异，即为2拷贝。

同时采用上述标准对质控位点的拷贝数进行判断，判断结果应与已知的质控位点的拷贝数一致，判断结果一致是对目标CNV区域拷贝数进行判断的前置条件。

验证实施例

本验证实施例通过验证已知拷贝数的基因来说明实施例一提供的方法的准确性和有效性。

一、相关的引物和样本信息如下：

依据实施例一中的方法，在人基因组5号染色体68.0-68.6Mb范围和70.8-71.2Mb范围分别筛选得到3和5个合适的片段长度多态性遗传标记，分别构成两个单倍型(Haplotype)。依据PCR引物设计基本原则，设计上述8个长度多态性引物的PCR扩增引物，其中一条标记FAM荧光素。上述8个长度多态性遗传标记的编号、名称、PCR引物与基因组所在位置详见表1。

表1中所示2个单倍型中的8个长度多态性遗传标记用于MISS系统的构建。ZFXY与B2M用于检验本发明所提出的通用计算模型的有效性。其中：

ZFXY是已知的用于检验人生物学性别的一个遗传标记，通过表1所示1对引物可以扩增Y染色体上的ZFY基因特异性单拷贝片段与X染色体上的ZFX基因特异性单拷贝片段，对于正常男性，X与Y的拷贝数均为1个拷贝，且二者的峰高比可指示Y染色体与X染色体的拷贝比。对于正常女性样本，相应的X染色体片段为2拷贝，Y染色体片段为0拷贝。

B2M是一个已知的人单拷贝基因----beta 2微球蛋白基因，位于人15号染色体上，在所有的正常人基因组中均应为2拷贝。

在本实施例中，ZFXY中的X与Y染色体特异性片段、B2M基因片段用于模拟待检的CNV区域。

表1依据本发明所提出的通用设计方案所设计的CNV验证系统

表2对本实施例中所采用的样本及其性质、已知目标区域的拷贝数进行介绍。

表2本实施例用来验证的样本的基本信息

其中，对照样本为一正常男性样本，则Y与X染色体拷贝数均为1，即对应通用计算模型中，待检样本Y染色体与X染色体片段计算时的m值均为1；正常样本B2M的拷贝数为2，即对应通用计算模型中，计算待检样本B2M拷贝数时的m值为2。

正常男性样本用于验证通用计算模型对拷贝数为1的计算结果准确性；正常女性样本用于验证通用计算模型对于X片段拷贝数为2的计算结果准确性。

在国家参考品样本中：XXY型指该样本中X染色体为2拷贝，Y染色体为1拷贝；XYY型指该样本中X染色体为1拷贝，Y染色体为2拷贝；XO型指该样本中X染色体为1拷贝，Y染色体为0拷贝；XXX型指该样本中X染色体为3拷贝，Y染色体为0拷贝；15号染色体三体型国家参考品是指该样本中15号染色体为3个拷贝，由于B2M基因位于15号染色体上，则预期该样本中B2M片段应为3拷贝，由于国家参考品中已指明该样本的X染色体为2拷贝，Y染色体为0拷贝。表2中所示国家参考品相应的实验编号即为相应国家参考品在参考品盘中的对应编号。

二、具体实验步骤如下：

2.1获取样本基因组DNA

待检样本采用商品化基因组DNA提取相应的基因组DNA，并统一稀释至2ng/μL，相应国家参考品同样稀释至2ng/μL。

2.2PCR扩增

将表1所示10对PCR引物混合制备引物组，同一对PCR引物对的上下游引物反应浓度相等，不同引物对的引物反应浓度在100-300pmol/L。配制如表3所示的PCR反应体系和设置如表4所示的反应程序进行PCR扩增。

表3 PCR扩增的反应体系

表4 PCR扩增的反应程序

2.3毛细管电泳片段分析

PCR产物取1μL按3500遗传分析仪片段分析操作说明常规进行毛细管电泳，毛细管电泳结果采用3500遗传分析仪配套GeneMapper软件进行分析后，得到对照样本与各待检样本中相应遗传标记的扩增产物峰峰高数据。下图3-6所示为部分样本的毛细管电泳图谱。

各毛细管电泳图谱中的下半部分的数据区域中，各PCR扩增产物峰下方第一行均为相应的等位基因名称，第二行较大数字即为相应PCR扩增产物峰的峰高。

2.4目标区域拷贝数的计算

采用本发明所提出的通用计算模型，计算待检样本中的Y染色体片段、X染色体片段与B2M基因片段的拷贝数。计算结果见表5。

表5依据本发明通用计算模型对待检样本目标区域拷贝数的计算结果

由表5可知，依据实施例一中的方法，得到各待测样本中目标区域的拷贝数与预期结果均一致。

综上所述，本发明提出的方法用来拷贝数变异的验证，可靠性高、操作简单。

以上对本发明的具体实施例进行了详细描述，但其只是作为范例，本发明并不限制于以上描述的具体实施例。

对于本领域技术人员而言，任何对本发明进行的等同修改和替换也都在本发明的范畴之中，包括但不限于：

(1)对单拷贝区域长度多态性遗传标记的全部或部分位点的替换，以及相应PCR引物的替换；

(2)对目标区域的替换、对目标区域引物的变换；

(3)对荧光素的替换；

(4)对片段分析平台的替换，如采用Qsep100同等或类似不需要荧光集团作为信号报告系统的片段分析平台等；

(5)将峰高替换为峰面积；

(6)对z检验判断界换的替换。如将本发明中的z界值(正负3)替换为正负2.58。

以上的替换或变换均未背离本发明所提出通用设计模型与计算模型的精神。因此，在不脱离本发明的精神和范围下所作的均等变换和修改，都应涵盖在本发明的范围内。

Claims

1.一种基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，包括如下步骤：

步骤二，针对CNV区域和步骤一所筛选的所述长度多态性遗传标记及质控位点按引物设计基本原则要求设计PCR引物；

步骤三，提取基因组DNA，然后对提取的所述基因组DNA进行PCR扩增；

步骤五，将步骤四测得的所述峰高通过下式计算待测样本中目标CNV区域拷贝数和质控位点的拷贝数：

N＝mRR＝mR_s/R_c (式-1)

其中：

计算质控位点的拷贝数时，上述参数替换为质控位点相应的参数；

步骤六，对步骤五中的待测样本中目标CNV区域拷贝数和质控位点的拷贝数N进行z检验：

当N＝0时，可依据目标CNV区域扩增片段的峰高h＝0，即未出现CNV区域的扩增产物峰，进行定性判断，对这一定性判断结果不需要进行z检验；当N不为0时，采用下述方法构建统计量z进行检验：

在n个遗传标记中，设第i个遗传标记全部扩增片段的峰高和为H_i，n个遗传标记全部扩增片段的峰高和记为tH，计算二者之比，记为R_i，即：

计算待测样本s与对照样本c中对应R_i值之比RR_i：

式-2中下标s与下标c分别指待测样本与对照样本；

计算n个遗传标记的RR_i值的标准差sd：

以式-1中的RR值、n个遗传标记的RR_i的均值及其标准差sd，以及已知对照样本中目标CNV区域的拷贝数m，构建统计量z：

2.根据权利要求1所述的基于片段分析技术的拷贝数变异的验证方法，其特征在于，步骤一中所述长度态性遗传标记的筛选标准如下：

(1)所述长度多态性遗传标记为插入/缺失标记或复等位基因的短串联重复序列；其中，插入/缺失标记的两个等位基因间长度差异在3-8bp，短串联重复序列的重复单元为3-5bp；

(2)所述长度多态性遗传标记在人群中的杂合度在0.3-0.8之间，个数n为5-10；

(3)所述长度多态性遗传标记位于单拷贝区域。

3.根据权利要求2所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述长度多态性遗传标记为插入/缺失标记或短串联重复序列多态性。

4.根据权利要求2所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述长度多态性遗传标记位于1-3个单倍型中，同一个所述单倍型中长度多态性遗传标记间的最大遗传距离小于1cM。

5.根据权利要求2所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述长度多态性遗传标记与待验证的CNV区域可连锁或不连锁、可在同一条染色体上或不在同一条染色体上。

6.根据权利要求1所述的基于片段分析技术的拷贝数变异的验证方法，其特征在于，步骤二中所述PCR扩增的扩增体系包括：TaqDNA聚合酶、PCR缓冲液、引物组、人基因组DNA模板。

7.根据权利要求6所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述引物组包括多态性遗传标记PCR引物、质控位点的PCR引物和待验证CNV区域的PCR引物。

8.根据权利要求7所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述引物组中各PCR引物的终反应浓度为100-300pmol/L。

9.根据权利要求6所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述人基因组DNA模板的质量为1-10ng。

10.根据权利要求1所述的基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，在步骤六中基于z检验对已知的质控位点拷贝数检验结果正确的前提下，目标CNV区域拷贝数的判断标准为：

11.根据权利要求1所述基于片段分析技术的拷贝数变异的通用验证方法，其特征在于，所述质控位点质控位点为X染色体上的ZFX、Y染色体上的ZFY和15号染色体上的B2M基因。