CN117925820A

CN117925820A - 一种用于胚胎植入前变异检测的方法

Info

Publication number: CN117925820A
Application number: CN202410091117.9A
Authority: CN
Inventors: 林婕; 陈样宜; 吴锋; 王士杰; 田苗
Original assignee: Guangzhou Phil Medical Laboratory Co ltd
Current assignee: Guangzhou Phil Medical Laboratory Co ltd
Priority date: 2024-01-22
Filing date: 2024-01-22
Publication date: 2024-04-26

Abstract

本发明属于胚胎植入前遗传检测技术领域，具体涉及一种用于胚胎植入前变异检测的方法。本发明通过不低于1X的平均测序深度的高精度的全基因组检测可以同时直接检测出胚胎的目标区域拷贝数变异(CNVs)和染色体非整倍体检测。在此基础上，所述方法还能根据CNVs区域及其上下游的有效SNPs进行家系单倍型连锁分析，可以实现直接位点检测联合间接家系连锁分析的检测策略，从而提高对待植入胚胎致病拷贝数变异诊断的准确性。同时，所述突破了目前仅能依靠家系连锁分析胚胎CNVs的局限性，为缺乏必要家系成员或者新发突变CNVs携带者的家系提供了解决方案，无需先证者或完整家系即可构建CNVs携带者单倍型，使更多的家庭获益。

Description

一种用于胚胎植入前变异检测的方法

技术领域

本发明属于胚胎植入前遗传检测技术领域，具体涉及一种用于胚胎植入前变异检测的方法。

背景技术

拷贝数变异(copy number variants，CNVs)是指染色体上大于1Kb的DNA片段的增加或减少，主要表现为亚显微水平的缺失和重复。据估计每个基因组平均有12％-16％的区域存在CNVs，CNVs涉及的基因数目、罕见性均与致病性显著相关，即CNVs越长，涉及基因越多，人群频率越低，致病的可能性就越高。致病CNVs可导致一类重要的遗传病-基因组病，其临床表现复杂多变，主要包括智力低下、发育滞后、面容异常和多发畸形等。截止目前，已明确由CNVs所致的染色体微缺失/微重复综合征已达300多种，综合发病率近1/600，占染色体畸变所致出生缺陷的一半。而染色体微缺失/微重复综合征尚无有效的根治方法，且有1/2的概率遗传给后代。因此，为预防或阻止由此引起的出生缺陷，迫切需要通过产前或胚胎植入前遗传学检测技术进行干预。

胚胎植入前遗传学检测技术可以对植入前胚胎进行致病变异诊断，选择没有疾病表型的胚胎移植入子宫，阻断疾病向子代传递。在临床上，通常采用直接位点检测联合间接家系连锁分析的检测策略以提高对待植入胚胎致病变异诊断的准确性。在胚胎单细胞水平进行CNVs直接检测难度大、准确性低，家系连锁分析是目前主要的胚胎CNVs检测策略。专利申请号为202111281421.2的发明专利提供了一种鉴别CNVs微缺失微重复综合征患病胚胎和正常胚胎的家系单倍型构建方法，使用Illumina SNP微阵列进行全基因组SNP基因型检测来构建单倍型。专利申请号为202310766070.7的发明专利提供了一种检测Chr22:q13区域拷贝数变异的核酸产品，使用多重PCR检测Chr22:q13区域及其上下游的多个SNP位点来构建家系单倍型，从而确定胚胎的基因型。专利申请号为202010255720.8的发明专利使用捕获探针对假肥大型肌营养不良症(Duchenne muscular dystrophy,DMD)家系进行单倍型连锁分析，可以预测移植胚胎是否携带DMD基因纯合缺失。以上方法均采用家系连锁分析进行的检测，但是，家系连锁单倍型分析需要采集必要的家系成员样本，包括患者夫妇双方、先证者或者夫妇双方的父母，以构建突变单倍型和野生型单倍型，对于缺乏必要家系成员或者新发突变CNVs携带者，将无法进行家系连锁分析。除此之外，CNVs附近的染色体交叉重组、位于着丝粒和端粒附近的CNVs也会给家系连锁分析带来困难。总之，目前胚胎植入前CNVs的检测还没有十分有效的检测技术。

发明内容

本发明的目的在于提供一种用于胚胎植入前变异检测的方法，所述方法不仅可以直接检出胚胎的目标区域拷贝数变异和染色体非整倍体，同时依据目标区域拷贝数变异及其上下游的信息在无需先证者或完整家系的情况下也能进行单倍型连锁分析，提高遗传检测的准确性。

本发明提供了一种用于胚胎植入前变异检测的方法，包括拷贝数变异检测和染色体非整倍体检测，包括如下步骤：

对待测胚胎的活检细胞样本进行单细胞全基因组扩增，得到扩增产物；

对所述扩增产物进行全基因组建库和测序，得到胚胎的全基因组测序原始数据，每个样本的平均测序深度不低于1X；

将所述胚胎的全基因组测序原始数据进行质控后与人类参考基因组进行比对，得到胚胎比对后的数据；

以所述胚胎比对后的数据为基础，进行目标区域拷贝数变异分析和染色体非整倍体分析。

优选的，所述拷贝数变异分析包括序列长度为4Mb及以上的拷贝数变异分析和序列长度小于4Mb的目标小片段拷贝数变异分析。

优选的，所述序列长度为4Mb及以上的拷贝数变异和染色体非整倍体分析的方法包括：

以20Kb作为分辨率，将人类参考基因组分为若干个相同大小的窗口，计算每个窗口的平均深度，以得到的每个窗口的平均深度为读段深度信号，绘制拷贝数变异图谱；

依据所述拷贝数变异图谱，得到染色体非整倍体和序列长度为4Mb及以上的拷贝数变异的检测结果。

优选的，所述序列长度小于4Mb的目标小片段拷贝数变异分析的方法包括如下步骤：

以20Kb作为分辨率，将人类参考基因组分为若干个相同大小的窗口，计算每个窗口的平均深度，以预定的关系式Ⅰ计算目标区域每个20kb窗口的Ratio_i值；

其中Ratio_i为目标区域第i个窗口的Ratio值，N_sample,i为胚胎活检细胞样本唯一比对到目标区域第i个窗口的读段数量，为n个阴性样本唯一比对到目标区域第i个窗口的读段数量，n为阴性样本总数，所述阴性样本为不具有目标区域的拷贝数变异的单细胞样本；

以预定的关系式Ⅱ计算拷贝数CN，并判定拷贝数变异类型；

拷贝数CN＝2×Ratio_i，关系式Ⅱ；

通过数据训练和校正，初步认为当所述拷贝数CN＞2.4时，所述待测胚胎活检细胞样本携带目标区域拷贝数重复变异，当所述拷贝数CN＜1.3时，所述待测胚胎活检细胞样本携带目标区域拷贝数缺失变异，当所述拷贝数≥1.3且≤2.4时，所述待测胚胎活检细胞样本不携带目标区域拷贝数变异。

优选的，当拷贝数小于0.1时，所述待测胚胎活检细胞样本携带目标区域的拷贝数纯合缺失变异，当拷贝数≥0.1且小于1.3时，所述待测胚胎活检细胞样本携带目标区域的拷贝数杂合缺失变异。

优选的，所述方法还包括单倍型分析，所述单倍型分析的方法包括如下步骤：

对所述待测胚胎的家系样本进行全基因组测序，得到家系样本的全基因组测序原始数据，每个样本的平均测序深度不低于1X；

所述家系样本包括待测胚胎的父母和待测胚胎父母的亲属样本；

当所述待测胚胎的父母具有亲属时，所述亲属样本包括待测胚胎的父母双方的父亲、母亲、哥哥、弟弟、姐姐、妹妹、待测胚胎的父母的流产的胎儿组织和待测胚胎的父母的引产的胎儿组织样本中的一种或多种样本；当所述待测胚胎的父母不具有亲属时，所述亲属样本为携带目标区域拷贝数变异的极体、精子和胚胎中的一种或多种样本；

将所述家系样本的全基因组测序原始数据进行质控后与人类参考基因组进行比对，得到家系样本比对后的数据；

对所述胚胎比对后的数据和家系样本比对后的数据进行全基因组变异分析，分别得到待测胚胎的全基因组基因型数据和家系样本的全基因组基因型数据；

分别以所述待测胚胎的全基因组基因型数据和家系样本的全基因组基因型数据为基础，分别提取待测胚胎和家系样本目标区域的拷贝数变异及其上下游1～2Mb区域范围内的SNPs；

筛选目标区域拷贝数变异携带亲本的杂合型SNPs和其配偶的纯合型SNPs，作为目标区域拷贝数变异携带者的有效分型SNPs位点；

将所述目标区域拷贝数变异携带者的有效分型SNPs位点与所述亲属样本的基因型数据进行比对，得到单倍型分型结果，所述单倍型分型结果包括亲本突变型单倍型和亲本野生型单倍型；

以所述待测胚胎目标区域的拷贝数变异及其上下游1～2Mb区域范围内的SNPs为基础进行单倍型分析：当待测胚胎与所述亲本突变型单倍型的信息一致时，所述待测胚胎携带目标区域拷贝数变异；所述待测胚胎与所述亲本野生型单倍型信息一致时，所述待测胚胎不携带目标区域拷贝数变异。

优选的，所述有效分型SNPs位点从目标区域的拷贝数变异及其上下游1～2Mb区域范围内选择，且在上下游1～2Mb区域各选择至少2个有效分型SNPs位点。

优选的，所述单倍型分型结果获得的方法包括如下步骤：

将所述目标区域拷贝数变异携带者的有效分型SNPs位点与亲属样本的基因型信息进行比对，若所述亲属样本携带目标区域拷贝数变异，则所述目标区域拷贝数变异携带者与亲属目标区域单倍型信息一致的为突变型单倍型，不一致的为野生型单倍型；

若所述亲属样本不携带目标区域拷贝数变异，则所述目标区域拷贝数携带者与亲属目标区域单倍型信息一致的为野生型单倍型，不一致的为突变型单倍型。

优选的，当所述目标区域拷贝数变异在所述胚胎的父母中为新发拷贝数变异时，所述亲属样本不能为所述胚胎的父母双方的父亲或母亲。

有益效果：

本发明提供一种用于胚胎植入前变异检测的方法，所述方法通过不低于1X的平均测序深度的高精度的全基因组检测可以同时直接检测出胚胎的目标区域拷贝数变异(CNVs)和染色体非整倍体检测。

在此基础上，本发明所述方法还能根据CNVs区域内部及其上下游的有效SNPs进行家系单倍型连锁分析，可以实现直接位点检测联合间接家系连锁分析的检测策略，从而提高对待植入胚胎致病变异诊断的准确性。

同时，所述突破了目前仅能依靠家系连锁分析胚胎CNVs的局限性，为缺乏必要家系成员或者新发突变CNVs携带者的家系提供了解决方案，无需先证者或完整家系即可构建CNVs携带者单倍型，使更多的家庭获益。

再者，本发明所述方法仅需进行一次检测，即可完成胚胎CNVs直接检测、单倍型分析、染色体非整倍体检测，简化了操作流程，减少了检测成本和周期。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。

图1为本发明所述胚胎植入前遗传检测的方法的主要图流程。

具体实施方式

本发明提供了一种用于胚胎植入前变异检测的方法，包括拷贝数变异检测和染色体非整倍体检测，包括如下步骤，具体检测流程图如图1所示：

本发明对待测胚胎的活检细胞样本进行单细胞全基因组扩增，得到扩增产物。本发明所述待测胚胎的活检细胞优选包括囊胚阶段的胚胎，且每次检测优选在胚胎发育的第5～7天从滋养外胚层中吸取5～10个细胞进行检测。本发明所述单细胞全基因组扩增优选包括多重置换扩增(MDA)、多次退火环状循环扩增(MALBAC)、简并寡核苷酸引物PCR(DOP-PCR)，或其他单细胞全基因组扩增方法；所述单细胞全基因组扩增的具体步骤没有特殊限定，依据本领域公知技术进行即可。

得到所述扩增产物后，本发明对所述扩增产物进行全基因组建库和测序，得到胚胎的全基因组测序原始数据。本发明对所述全基因组建库所使用的试剂或试剂盒以及测序平台没有特殊限定，依据官方指导手册进行即可。本发明所述测序平台优选包括Illumina或BGI测序平台，仪器参数及操作方法均优选严格参照对应测序平台的指导手册进行。本发明所述测序的类型优选包括单端测序或双端测序。本发明所述不低于1X的平均测序深度可以保证所述检测方法的高精度和准确性。

得到所述胚胎的全基因组测序原始数据后，本发明对所述胚胎的全基因组测序原始数据进行质控，得到质控后数据。本发明所述质控优选包括：使用fastqc软件获取测序数据质量报告，并使用trimmomatic软件过滤测序数据的接头、含N比例较高的读段和低质量的读段。

得到所述质控后数据后，本发明将所述质控后的数据与人类参考基因组进行比对，得到胚胎比对后的数据。本发明所述人类参考基因组优选包括hg19；所述比对的软件优选包括BWA mem，且使用不容错比对模式并且不允许空碱基间隙(gap)等相关过滤标准。

所述比对后，本发明优选采用Samtools软件将所述胚胎比对后的数据按照染色体位置进行排序并去除PCR重复序列，得到唯一比对到人类参考基因组上的读段；所述过程没有特殊限定，本领域技术人员依据常规参数进行操作即可。

得到所述唯一比对到人类参考基因组上的读段后，本发明基于所述唯一比对到人类参考基因组上的读段进行全基因组拷贝数变异分析和染色体非整倍体分析。本发明所述拷贝数变异分析优选包括序列长度为4Mb及以上的拷贝数变异分析和序列长度小于4Mb的目标小片段拷贝数变异分析。

本发明所述序列长度为4Mb及以上的拷贝数变异和染色体非整倍体分析的方法优选包括：以20Kb作为分辨率，将人类参考基因组分为若干个相同大小的窗口，统计划分所述窗口区域内的读段数量，并采用LASSO回归方法对所述窗口内的读段数量的GC偏好校正并计算每个窗口的平均深度，以得到的每个窗口的平均深度为读段深度信号，绘制拷贝数变异图谱。

得到所述拷贝数变异图谱后，本发明依据所述拷贝数变异图谱，得到染色体非整倍体和序列长度为4Mb及以上的拷贝数变异的检测结果。

本发明所述序列长度小于4Mb的目标小片段拷贝数变异分析的方法优选包括如下步骤：

构建目标区域参考数据库，包括以下步骤：

以300例阴性单细胞样本进行单细胞全基因组扩增，得到阴性单细胞样本的扩增产物；

对所述阴性单细胞样本的扩增产物进行全基因组建库和测序，得到阴性单细胞样本的全基因组测序原始数据；

将所述阴性单细胞样本的全基因组测序原始数据进行质控后与人类参考基因组进行比对，得到阴性样本比对后数据；

基于所述阴性样本比对后数据，以20Kb作为分辨率，将人类参考基因组分为M个相同大小的窗口，统计划分所述窗口区域内的读段数量，并采用LASSO回归方法对所述窗口内的读段数量的GC偏好校正。

得到所述参考数据库后，每个样本以20Kb作为分辨率，将人类参考基因组分为M个相同大小的窗口，计算每个窗口的平均深度，调用目标区域参考数据库，以预定的关系式Ⅰ计算目标区域第i个(1≤i≤M)20kb窗口的Ratio_i值；

其中Ratio_i为目标区域第i个窗口的Ratio值，N_sample,i为胚胎活检细胞样本唯一比对到目标区域第i个窗口的读段数量，为参考数据库唯一比对到目标区域第i个窗口的读段数量；

以预定的关系式Ⅱ计算拷贝数CN，并判定拷贝数变异类型；

拷贝数CN＝2×Ratio_i，关系式Ⅱ；

通过数据训练和校正，以目标区域拷贝数变异的参考基线对待测胚胎活检细胞是否携带目标拷贝数变异进行判定，初步认为当所述拷贝数CN＞2.4时，所述待测胚胎活检细胞样本携带目标区域拷贝数重复变异，当所述拷贝数CN＜1.3时，所述待测胚胎活检细胞样本携带目标区域拷贝数缺失变异，当所述拷贝数≥1.3且≤2.4时，所述待测胚胎活检细胞样本不携带目标区域拷贝数变异。

本发明所述数据训练和校正优选采用本领域中公知手段，不作特殊限定。

本发明所述阴性单细胞样本优选为外周血淋巴细胞。本发明在构建所述目标区域参考数据库的过程中，所述单细胞全基因扩增、全基因组建库和测序、质控和比对的方法和过程优选与上述技术方案所述的待测胚胎活检单细胞样本的对应方法和过程相同，不再赘述。

在本发明所述序列长度小于4Mb的目标小片段拷贝数变异分析的过程中，当拷贝数小于0.1时，所述待测胚胎活检细胞样本携带目标区域的拷贝数纯合缺失变异，当拷贝数≥0.1且小于1.3时，所述待测胚胎活检细胞样本携带目标区域的拷贝数杂合缺失变异。

基于本发明所述的检测结果，优选给与移植建议如下：选择不携带CNV的胚胎进行移植以阻断子代患病的可能性；同时优选选择整倍体胚胎进行移植，可以提高移植成功率。

在本发明中，所述方法优选还包括单倍型分析，所述单倍型分析的方法包括如下步骤：

在本发明中所述家系样本的全基因组建库和测序、质控和比对的方法和过程优选与上述技术方案中待测胚胎的活检单细胞的对应方法和过程相同，不再对其优选进行赘述。本发明所述家系样本优选包括来源于外周血淋巴细胞样本。在本发明中，当所述目标区域拷贝数变异在所述胚胎的父母中为新发拷贝数变异时，所述亲属样本不能为所述胚胎的父母双方的父亲或母亲，避免在进行单倍型分析时无法确认新发拷贝数变异的来源而导致家系连锁单倍型构建失败。

得到所述家系样本的比对后数据和胚胎比对后数据后，本发明对所述胚胎比对后的数据和家系样本比对后的数据进行全基因组变异分析，具体优选使用GATKHaplotypeCaller软件检测SNPs，通过GATK VariantFiltRation软件过滤变异位点及GATKSelectVariants软件提取SNPs信息，分别得到待测胚胎的全基因组基因型数据和家系样本的全基因组基因型数据。

得到所述待测胚胎的全基因组基因型数据和家系样本的全基因组基因型数据后，本发明分别以所述待测胚胎的全基因组基因型数据和家系样本的全基因组基因型数据为基础，分别提取待测胚胎和家系样本目标区域的拷贝数变异及其上下游1～2Mb区域范围内的SNPs。本发明优选在目标区域的拷贝数变异及其上下游1Mb区域内各选择至少2个有效分型SNPs位点；当所述有效分型SNPs位点不足或没有时，优选扩大至在目标区域的拷贝数变异及其上下游2Mb区域范围内的选择有效分型SNPs位点并优选在目标区域的拷贝数变异及其上下游2Mb区域内各选择大于4个有效分型SNPs位点。

得到所述家系样本目标区域的拷贝数变异及其上下游1～2Mb区域范围内的SNPs后，本发明筛选目标区域拷贝数变异携带亲本的杂合型SNPs和其配偶的纯合型SNPs，作为目标区域拷贝数变异携带者的有效分型SNPs位点。

得到所述目标区域拷贝数变异携带者的有效分型SNPs位点后，本发明将所述目标区域拷贝数变异携带者的有效分型SNPs位点与所述亲属样本的基因型数据进行比对，得到单倍型分型结果，所述单倍型分型结果包括亲本突变型单倍型和亲本野生型单倍型。本发明所述的比对过程具体优选包括：若所述亲属样本携带目标区域拷贝数变异，则所述目标区域拷贝数变异携带者与亲属目标区域单倍型信息一致的为突变型单倍型，不一致的为野生型单倍型；若所述亲属样本不携带目标区域拷贝数变异，则所述目标区域拷贝数携带者与亲属目标区域单倍型信息一致的为野生型单倍型，不一致的为突变型单倍型。

得到所述单倍型分型结果后，本发明优选还包括将所述胚胎父母每条单倍型标记特定颜色以区分亲本突变型单倍型和野生型单倍型。

得到所述亲本突变型单倍型和野生型单倍型后，本发明以所述待测胚胎目标区域的拷贝数变异及其上下游1～2Mb区域范围内的SNPs为基础进行单倍型分析：当待测胚胎与所述亲本突变型单倍型的信息一致时，所述待测胚胎携带目标区域拷贝数变异；所述待测胚胎与所述亲本野生型单倍型信息一致时，所述待测胚胎不携带目标区域拷贝数变异，为正常胚胎。

本发明所述方法通过不低于1X的平均测序深度的高精度的全基因组检测可以同时直接检测出胚胎的目标区域拷贝数变异(CNVs)和染色体非整倍体检测。在此基础上，本发明所述方法还能根据CNVs区域内部及其上下游的有效SNPs进行家系单倍型连锁分析，可以实现直接位点检测联合间接家系连锁分析的检测策略，从而提高对待植入胚胎致病变异诊断的准确性。同时，所述突破了目前仅能依靠家系连锁分析胚胎CNVs的局限性，为缺乏必要家系成员或者新发突变CNVs携带者的家系提供了解决方案，无需先证者或完整家系即可构建CNVs携带者单倍型，使更多的家庭获益。

为了进一步说明本发明，下面结合实施例对本发明提供的技术方案进行详细地描述，但不能将它们理解为对本发明保护范围的限定。

可以理解的是，实施例中所描述的具体实施方式仅仅用于解释本发明，而非对本发明的限定。在某些情况下，本发明相关的一些操作步骤并没有详细描述，这是为了避免本发明的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

在下述实施例中，主要原材料包括：单细胞扩增所需的裂解液、扩增酶及其缓冲液、文库构建所需相应功能的酶(末端修复酶、DNA连接酶、缺口修复酶DNA聚合酶等)、核苷酸序列(如引物、接头序列、标签序列等)、缓冲液及dNTP等组成。除非另有特别说明，本申请中用到的各种原材料、试剂、仪器和设备等均可通过市场购买得到或者可通过现有方法制备得到。

实施例1

本实施例以一种用于胚胎植入前小片段拷贝数变异检测的方法对小片段CNVs和非整倍体进行直接检测，步骤如下：

家系1中女方18号染色体69843655-70127035基因组区间缺失，大小为283Kb；X染色体878066-1422720基因组区间重复，大小为545Kb。

胚胎植入前小片段CNVs和非整倍体检测步骤如下：

(1)患者夫妇双方及其胚胎全基因组建库测序；

(a)男方和女方的外周血样本按照本领域人类血液DNA提取方法提取基因组DNA，参照建库测序平台说明书对家系基因组DNA进行全基因组建库测序。

(b)对患者夫妇的10个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照建库测序平台说明书进行全基因组建库测序。

(2)胚胎全基因组拷贝数分析

(a)数据质控和比对

使用fastqc软件获取测序数据质量报告，并使用trimmomatic软件过滤测序数据的接头、含N比例较高的读段和低质量的读段。使用BWA mem将处理后的测序数据比对到人类参考基因组hg19，进一步使用Samtools软件将比对结果按染色体位置进行排序和去除PCR重复序列，得到唯一比对到参考基因组上的读段。

(b)数据分析

以20Kb作为分辨率，将人类参考基因组分为若干个相同大小的窗口，统计划分所述窗口区域内的读段数量，计算每个窗口的平均深度，绘制CNVs图，报告染色体非整倍体、4Mb及以上CNVs。

(3)胚胎目标区域CNVs分析

分析并统计胚胎18号染色体69843655-70127035基因组区间和X染色体878066-1422720基因组区间的唯一比对读段数量，计算拷贝数CN：

其中，Ratio_i为目标区域第i个窗口的Ratio值，N_sample,i为胚胎活检细胞样本唯一比对到目标区域第i个窗口的读段数量，为参考数据库唯一比对到目标区域第i个窗口的读段数量；

拷贝数CN＝2×Ratio_i

当拷贝数CN>2.4，则报告为重复；拷贝数CN<1.3，则报告为缺失。结果如表1所示。

表1检测结果汇总

由表1可以得出：非整倍体检测结果：胚胎01、胚胎02、胚胎07、胚胎09为整倍体胚胎，胚胎03、胚胎04、胚胎05、胚胎06、胚胎08、胚胎10非整倍体检测结果异常。小片段CNVs检测结果：胚胎01不携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎02携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎03不携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎04不携带女方18号染色体拷贝数缺失，携带X染色体拷贝数重复；胚胎05不携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎06携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎07不携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎08携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎09不携带女方18号染色体拷贝数缺失和X染色体拷贝数重复；胚胎10携带女方18号染色体拷贝数缺失和X染色体拷贝数重复。

实施例1的结果表明，基于高精度的全基因组检测可以直接检出小片段CNVs。

实施例2

本实施例使用一种用于胚胎植入前小片段拷贝数变异检测的方法对东南亚型(southeastAsian,SEA)地中海贫血进行SEA缺失拷贝数检测和单倍型分析，步骤如下：

家系2中患者夫妇双方均携带SEA杂合缺失，夫妻已生育一个野生型的女儿。患者家系跨越断裂点的PCR(gap-PCR)检测结果如表2所示：

表2跨越断裂点的PCR(gap-PCR)检测结果

样本	gap-PCR
		男方	SEA杂合缺失
女方	SEA杂合缺失
		女儿	野生型
胚胎L01	SEA纯合缺失
		胚胎L02	SEA纯合缺失
胚胎L03	野生型
		胚胎L04	SEA杂合缺失
胚胎L05	SEA杂合缺失

(1)家系样本(男方、女方和女儿)全基因组建库测序

男方、女方和女儿的外周血样本按照本领域人类血液DNA提取方法提取基因组DNA，参照测序平台说明书对家系基因组DNA进行建库测序。

(2)胚胎样本全基因组建库测序

对患者夫妇的5个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照测序平台说明书进行建库测序。

(3)胚胎全基因组拷贝数分析

(a)数据质控和比对

(b)数据分析

(4)胚胎SEA区域拷贝数分析

分析并统计胚胎SEA区域(chr16：215400-234700)的唯一比对读段数量，计算拷贝数CN：

其中，Ratio_i为目标区域第i个窗口的Ratio值，N_sample，i为胚胎活检细胞样本唯一比对到目标区域第i个窗口的读段数量，为参考数据库唯一比对到目标区域第i个窗口的读段数量；

拷贝数CN＝2×Ratio_i

当拷贝数CN>2.4，则报告为重复；拷贝数CN<1.3，则报告为缺失，其中，当拷贝数CN<0.1时，报告为纯合缺失。

结果发现胚胎L01、L02为SEA纯合缺失，胚胎L03为野生型，胚胎L04、L05为SEA杂合缺失。

(5)家系单倍型构建

(a)使用软件GATK，对患者夫妇及其女儿测序数据的SEA区域及其上下游1Mb区域(chr16:1-1234700)进行等位基因型鉴定，通过GATK VariantFiltRation软件过滤变异位点及GATK SelectVariants软件提取SNPs信息，并使用GATK官方推荐方式过滤SNPs位点，除去潜在错误的SNPs；

(b)选择SEA区域及其上下游1Mb的SNPs位点中男方杂合型SNPs，女方纯合型SNPs，作为男方SEA缺失携带者的有效分型SNPs位点，女儿与男方该区域单倍型一致的为野生型单倍型(F0)，不一致的为突变型单倍型(F1)；

(c)选择SEA区域及其上下游1Mb的SNPs位点中女方杂合型SNP，男方纯合型SNPs，作为女方SEA缺失携带者的有效分型SNPs位点，女儿与女方该区域单倍型一致的为野生型单倍型(M0)，不一致的为突变型单倍型(M1)。

(6)胚胎SNP连锁分析

使用软件GATK，筛选胚胎SEA区域及其上下游1Mb的SNPs位点，根据家系单倍型的分析结果，对胚胎进行SNPs连锁单倍型分析。SNPs单倍型结果如表3所示，同时携带父源突变型F1和母源突变型M1的胚胎为SEA纯合缺失(胚胎L01、L02)，携带父源突变型F1和母源野生型M0的胚胎为SEA杂合缺失携带者(胚胎L05)，携带父源野生型F0和母源突变型M1的胚胎为SEA杂合缺失携带者(胚胎L04)，同时携带父源野生型F0和母源野生型M0的胚胎为野生型(胚胎L03)。

表3 SNPs单倍型

实施例2中检测结果如表4所示。

表4检测结果汇总

/>

实施例3

本实施例使用一种用于胚胎植入前小片段拷贝数变异检测的方法对杜氏肌营养不良(DMD)家系进行DMD拷贝数变异检测和单倍型分析，步骤如下：

家系3中女方携带DMD基因45-48号外显子缺失，男方正常，生育一个DMD男性患儿(DMD基因45-48号外显子缺失，为先证者)。

(1)家系样本(男方、女方和先证者)全基因组建库测序

男方、女方和先证者的外周血样本按照本领域人类血液DNA提取方法提取基因组DNA，参照测序平台说明书对家系基因组DNA进行建库测序。

(2)胚胎样本全基因组建库测序

对患者夫妇的3个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照测序平台说明书进行建库测序。

(3)胚胎全基因组拷贝数分析

(a)数据质控和比对

(b)数据分析

(3)胚胎DMD基因45-48号外显子区域拷贝数分析

分析并统计胚胎DMD基因45-48号外显子区域(chrX:31893229-31986603)的唯一比对读段数量，计算拷贝数CN：

拷贝数CN＝2×Ratio_i

当拷贝数CN>2.4，则报告为重复；拷贝数CN<1.3，则报告为缺失。

(4)家系单倍型构建

(a)使用软件GATK，对患者夫妇及先证者测序数据的DMD基因45-48号外显子区域及其上下游1Mb区域(chrX:30893229-32986603)进行等位基因型鉴定，通过GATKVariantFiltRation软件过滤变异位点及GATK SelectVariants软件提取SNPs信息，并使用GATK官方推荐方式过滤SNPs位点，除去潜在错误的SNPs；

(b)选择DMD基因45-48号外显子区域及其上下游1Mb的SNP位点中女方杂合型SNP，先证者与女方该区域单倍型一致的为突变型单倍型(M1)，女方另一条链为野生型单倍型(M0)。

(5)胚胎SNP连锁分析

使用软件GATK，筛选胚胎DMD基因45-48号外显子区域及其上下游1Mb的SNPs位点，根据家系单倍型的分析结果(表5)，对胚胎进行SNP连锁分析。

表5 SNPs单倍型分析结果

实施例3中的检测结果如表6所示。

表6检测结果汇总

由表6可以得出：非整倍体检测结果：胚胎J01、胚胎J02、胚胎J03非整倍体检测结果异常。小片段CNVs检测结果：胚胎J01 DMD基因45-48号外显子拷贝数正常，胚胎J02、胚胎J03 DMD基因45-48号外显子拷贝数缺失。SNP单倍型分析结果：胚胎J01携带母源野生型单倍型，胚胎J02、胚胎携带母源突变型单倍型。

实施例2和实施例3的结果表明，基于高精度的全基因组检测不仅可以直接检出非整倍体、小片段CNVs，同时还可以进行单倍型分析。

实施例4

本实施例使用一种用于胚胎植入前小片段拷贝数变异检测的方法进行不依赖于先证者或家系的东南亚型地中海贫血(southeast Asian，SEA)检测，步骤如下：

家系4中患者夫妇双方均携带SEA杂合缺失。患者夫妇双方及其胚胎gap-PCR检测结果如表7所述。

表7患者夫妇双方及其胚胎gap-PCR检测结果

样本	gap-PCR
		男方	SEA杂合缺失
女方	SEA杂合缺失
		胚胎F01	SEA纯合缺失
胚胎F02	SEA纯合缺失
		胚胎F03	SEA杂合缺失
胚胎F04	野生型
		胚胎F05	野生型
胚胎F06	SEA纯合缺失

(1)患者夫妇双方及其胚胎全基因组建库测序

(a)男方和女方的外周血样本按照本领域人类血液DNA提取方法提取基因组DNA，参照建库测序平台说明书对家系基因组DNA进行建库测序。

(b)对患者夫妇的6个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照建库测序平台说明书进行建库测序。

(2)胚胎全基因组拷贝数分析

(a)数据质控和比对

(b)数据分析

(3)胚胎SEA区域拷贝数分析

分析并统计胚胎SEA区域(chr16:215400-234700)的唯一比对读段数量，计算拷贝数CN：

拷贝数CN＝2×Ratio_i

结果发现胚胎F01、F02、F06为SEA纯合缺失，胚胎F04、F05为野生型，胚胎F03为SEA杂合缺失。

(4)胚胎SNP连锁分析

(a)使用软件GATK，对患者夫妇及其胚胎测序数据的SEA区域及其上下游1Mb区域(chr16:1-1234700)进行等位基因型鉴定，通过GATK VariantFiltRation软件过滤变异位点及GATK SelectVariants软件提取SNPs信息，并使用GATK官方推荐方式过滤SNPs位点，除去潜在错误的SNPs；

(b)选择胚胎SEA区域拷贝数分析结果为纯合型的胚胎为先证者(比如胚胎F01)；

(c)选择SEA区域及其上下游1Mb的SNPs位点中男方杂合型SNPs，女方纯合型SNPs，作为男方SEA缺失携带者的有效分型SNPs位点，先证者胚胎F01与男方该区域单倍型一致的为突变型单倍型(F1)，不一致的为野生型单倍型(F0)；

(d)选择SEA区域及其上下游1Mb的SNPs位点中女方杂合型SNPs，男方纯合型SNPs，作为女方SEA缺失携带者的有效分型SNPs位点，先证者胚胎F01与女方该区域单倍型一致的为突变型单倍型(M1)，不一致的为野生型单倍型(M0)。SNPs单倍型结果如表8所示。

表8 SNPs单倍型

(e)根据上述单倍型的分析结果，对其他胚胎进行SNPs连锁分析。同时携带父源突变型F1和母源突变型M1的胚胎为SEA纯合缺失(胚胎F01、F02、F06)，携带父源野生型F0和母源突变型M1的胚胎为SEA杂合缺失携带者(胚胎F03)，同时携带父源野生型F0和母源野生型M0的胚胎为野生型(胚胎F04、F05)。

实施例4中的检测结果汇总如表9所示。

表9检测结果汇总

实施例4的结果表明，本发明方法可以不依赖家系即可进行CNVs携带胚胎和正常胚胎的鉴别。

对比例1

本对比例采用SNP芯片分析单倍型的检测方法，对家系3进行对杜氏肌营养不良(DMD)检测。

(1)家系样本(男方、女方和先证者)SNP检测

男方、女方和先证者的外周血样本按照本领域常规方法提取基因组DNA，参照Illumina SNP芯片(Infinium Asian Screening Array-24)说明书对家系基因组DNA进行全基因组SNP检测。

(2)家系单倍型构建

(a)对患者夫妇及先证者的芯片数据进行全基因组SNP分析，筛选目的CNVs区域及其上下游1Mb的SNP位点；

(b)选择目的CNVs区域及其上下游1Mb的SNP位点中女方杂合型SNP，先证者与女方该区域单倍型一致的为突变型单倍型(M1)，女方另一条链为野生型单倍型(M0)。

(3)胚胎样本SNP检测

对患者夫妇的4个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照Illumina SNP芯片(Infinium Asian Screening Array-24)说明书进行全基因组SNP检测。

(4)胚胎SNP连锁分析

根据家系单倍型的分析结果，对胚胎进行SNP连锁分析，结果如表10所示，其中表10中的本发明方法检测结果指的是实施例3中的检测结果。

表10胚胎SNP连锁分析结果

样本	SNP芯片检测结果	本发明方法检测结果
			男方	正常	正常
女方	缺失	缺失
			先证者	缺失	缺失
胚胎J01	正常	正常
			胚胎J02	缺失	缺失
胚胎J03	缺失	缺失

将实施例3中的检测结果与对比例1的芯片连锁分析方法结果进行比较(表10)，2种检测方法结果一致，胚胎J01为野生型，胚胎J02和胚胎J03携带DMD基因45-48号外显子缺失。

对比例2

本对比例采用SNP芯片分析单倍型的检测方法，对家系4进行SEA地中海贫血检测，步骤如下：

(1)家系样本(男方、女方和先证者)SNP检测

男方、女方和先证者(患病儿子)的外周样本按照本领域常规方法提取基因组DNA，参照Illumina SNP芯片(Infinium Asian Screening Array-24)说明书对家系基因组DNA进行全基因组SNP检测。

(2)家系单倍型构建

(a)对男方、女方和先证者的SNP芯片数据进行全基因组SNP分析，筛选SEA区域及其上下游1Mb的SNP位点；

(b)选择SEA区域及其上下游1Mb的SNP位点中男方杂合型SNP，女方纯合型SNP，作为男方SEA缺失携带者的有效分型SNP位点，先证者与男方该区域单倍型一致的为突变型单倍型(F1)，不一致的为野生型单倍型(F0)；

(c)选择SEA区域及其上下游1Mb的SNP位点中女方杂合型SNP，男方纯合型SNP，作为女方SEA缺失携带者的有效分型SNP位点，先证者与女方该区域单倍型一致的为突变型单倍型(M1)，不一致的为野生型单倍型(M0)。

(3)胚胎样本SNP检测

对患者夫妇的6个胚胎活检细胞进行单细胞全基因组扩增，扩增产物参照Illumina SNP芯片(Infinium Asian Screening Array-24)说明书进行全基因组SNP检测。

(4)胚胎SNP连锁分析

筛选胚胎SEA区域及其上下游1Mb的SNP位点，根据家系单倍型的分析结果，对胚胎进行SNP连锁分析。

表11胚胎SNP连锁分析结果

样本	SNP芯片检测结果	本发明方法检测结果
			胚胎F01	SEA纯合缺失	SEA纯合缺失
胚胎F02	SEA纯合缺失	SEA纯合缺失
			胚胎F03	SEA杂合缺失	SEA杂合缺失
胚胎F04	野生型	野生型
			胚胎F05	野生型	野生型
胚胎F06	SEA纯合缺失	SEA纯合缺失

将实施例4中本发明方法与对比例2的芯片连锁分析方法结果进行比较(表11)，2种检测方法结果完全一致，表明本发明可不依赖于先证者或完整家系即可构建CNVs单倍型，并能有效应用于胚胎植入前诊断。

本发明通过对胚胎单细胞扩增产物进行全基因组建库和测序，并对测序数据进行全基因组拷贝数变异分析、染色体非整倍体检测和单倍型分析，可以一体化完成胚胎CNVs检测、单倍型分析和染色体非整倍体检测。对于对比例1～2中胚胎单细胞扩增产物进行全基因组SNP芯片检测虽然也可以完成本发明的目的，但是对于小于200Kb的CNVs将无法进行直接胚胎CNVs检测，而本发明的方法，当测序深度足够深时，可以同时进行20Kb以上CNVs的直接检测和间接单倍型连锁分析。

尽管上述实施例对本发明做出了详尽的描述，但它仅仅是本发明一部分实施例，而不是全部实施例，人们还可以根据本实施例在不经创造性前提下获得其他实施例，这些实施例都属于本发明保护范围。

Claims

1.一种用于胚胎植入前变异检测的方法，其特征在于，包括拷贝数变异检测和染色体非整倍体检测，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，所述拷贝数变异分析包括序列长度为4Mb及以上的拷贝数变异分析和序列长度小于4Mb的目标小片段拷贝数变异分析。

3.根据权利要求2所述的方法，其特征在于，所述序列长度为4Mb及以上的拷贝数变异和染色体非整倍体分析的方法包括：

4.根据权利要求2所述的方法，其特征在于，所述序列长度小于4Mb的目标小片段拷贝数变异分析的方法包括如下步骤：

以预定的关系式Ⅱ计算拷贝数CN，并判定拷贝数变异类型；

拷贝数CN＝2×Ratio_i，关系式Ⅱ；

5.根据权利要求4所述的方法，其特征在于，当拷贝数小于0.1时，所述待测胚胎活检细胞样本携带目标区域的拷贝数纯合缺失变异，当拷贝数≥0.1且小于1.3时，所述待测胚胎活检细胞样本携带目标区域的拷贝数杂合缺失变异。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括单倍型分析，所述单倍型分析的方法包括如下步骤：

对所述待测胚胎的家系样本进行全基因组建库和测序，得到家系样本的全基因组测序原始数据，每个样本的平均测序深度不低于1X；

7.根据权利要求6所述的方法，其特征在于，所述有效分型SNPs位点从目标区域的拷贝数变异及其上下游1～2Mb区域范围内选择，且在上下游1～2Mb区域各选择至少2个有效分型SNPs位点。

8.根据权利要求6所述的方法，其特征在于，所述单倍型分型结果获得的方法包括如下步骤：

9.根据权利要求6所述的方法，其特征在于，当所述目标区域拷贝数变异在所述胚胎的父母中为新发拷贝数变异时，所述亲属样本不能为所述胚胎的父母双方的父亲或母亲。