CN115216545A - 用于无创植入前非整倍体遗传检测的方法 - Google Patents
用于无创植入前非整倍体遗传检测的方法 Download PDFInfo
- Publication number
- CN115216545A CN115216545A CN202110423585.8A CN202110423585A CN115216545A CN 115216545 A CN115216545 A CN 115216545A CN 202110423585 A CN202110423585 A CN 202110423585A CN 115216545 A CN115216545 A CN 115216545A
- Authority
- CN
- China
- Prior art keywords
- dmr
- ranks
- differentially methylated
- cells
- methylation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioethics (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及植入前非整倍体遗传检测(Preimplantation genetic testingfor aneuploidy,PGT‑A)。具体而言,本发明鉴定了用于评估囊胚培养液中母源DNA污染的颗粒细胞特异性差异甲基化区域(C‑DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O‑DMR),并提供了基于上述差异甲基化区域评估中囊胚培养液中母源DNA污染的方法。与传统SNP测序法相比,本发明的测定母源DNA污染的方法更加简便、经济、省时,适合于大规模临床应用。本发明还提供了基于囊胚培养液进行无创植入前非整倍体遗传检测的方法,该方法同时检测非整倍体和母源污染率,实现了提高的检测准确率。
Description
技术领域
本发明涉及植入前非整倍体遗传检测(Preimplantation genetic testing foraneuploidy,PGT-A)。具体而言,本发明鉴定了用于评估囊胚培养液中母源DNA污染的颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR),并提供了基于上述差异甲基化区域评估囊胚培养液中母源DNA污染的方法。本发明还提供了基于囊胚培养液进行无创植入前非整倍体遗传检测的方法。
背景技术
目前,植入前非整倍体筛查Preimplantation genetic testing for aneuploidy(PGT-A)的主要流程包括分离1个或者多个胚胎细胞去评估23对染色体及亚染色体区的拷贝数,其中主要用到的胚胎细胞材料有3种,第一种是分离极体细胞去检测(1),这种方法因为缺乏父源基因组不能准确检测受精后的胚胎的问题,并且因为极体极易降解,所以后面临床上就不太用这种方法。第二种方法是分离卵裂球中的一个细胞去检测(2,3)。这种方法会影响胚胎发育,而且会降低着床潜能,同时因为只获得1个细胞去检测,会由嵌合(一个胚胎中存在多种拷贝数情况)引起的误诊,目前临床上这种方法也不常用。第三种是分离滋养外胚层中5-10个细胞活检,这种TE活检方法是目前临床上的常规检测方法(4,5)。但是据文献报道,这种活检方法对胚胎和母体有危害,且对子代长期的安全还没有充分评估,同时也存在嵌合风险。以上所有方法,都对胚胎进行了有创的操作,存在很多弊端(6)。
2013年意大利的科学家发现体外培养的囊胚培养液中存在游离DNA,这一发现为无创植入前遗传检测带来了希望(7)。2016年谢晓亮教授等人开发了一种新型的单细胞全基因组扩增方法,将培养液中微量的DNA进行了全基因组测序并计算了染色体的拷贝数,发现由培养液得到的拷贝数和用全胚胎得到的拷贝数一致率超过85%。并且由培养液结果指导移植的胚胎,最后活产率超过70%(8)。2017年有文章报道,培养液中存在母源颗粒细胞的污染(9)。颗粒细胞的污染对染色体拷贝数的评估具有致命性影响。因为颗粒细胞是2倍体,如果胚胎存在拷贝数异常,就会掩盖异常的拷贝数出现整倍体的检测结果。
目前这个领域一直对培养液中游离DNA的来源存在争议,大家不知道这些游离的DNA是来自滋养外胚层细胞,内细胞团还是早期发育过程中的细胞。2018年,有文章利用单核苷酸多态性(SNP)去定量培养液中颗粒细胞的污染量和胚胎来源DNA的量(10),需要抽取母亲的卵泡液,并且操作计算耗时耗力,并不适合大规模应用到临床上。
因此,本领域需要新的、性价比高、并且便捷的方法去计算污染量,从而提高无创植入前遗传检测的准确性。
发明内容
本发明提供一种新的途径,其根据检测囊胚培养液中存在的游离DNA进行植入前非整倍体遗传检测。本发明鉴定了囊胚培养液中游离DNA的来源及其组成成分,由此鉴定了用于评估囊胚培养液中母源DNA污染的颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR),并进一步提供了基于上述差异甲基化区域评估囊胚培养液中母源DNA污染的方法。与传统SNP测序法相比,本发明的测定母源DNA污染的方法更加简便、经济、省时,适合于大规模临床应用。本发明还提供了基于囊胚培养液进行无创植入前非整倍体遗传检测的方法,该方法同时检测染色体拷贝数和母源污染率,通过整合分析以提高临床诊断准确性。
差异甲基化区域
本发明首次发现了囊胚培养液不仅存在颗粒细胞污染,还存在极体细胞污染,并由此进一步确定了可用于评估母源DNA污染比例的颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR)。
因此,在第一方面,本发明提供了可用于评估母源DNA污染比例的颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR),其中,所述C-DMR选自表1中的至少一种(例如至少5种、至少10种、至少50种、至少80种、至少100种、至少150种、至少200种或至少500种);所述O-DMR包含选自表2中的至少一种(例如至少5种、至少10种、至少50种、至少80种、至少100种、至少150种、至少200种、至少500种或至少700种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-50中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少45种或全部50种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-80中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种或全部80种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-100中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或全部100种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-150中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种或全部150种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-200中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种、至少150种、至少160种、至少170种、至少180种、至少190种或全部200种)。
在某些实施方案中,所述C-DMR包含表1的排序1-10、排序1-50、排序1-80、排序1-100、排序1-150、排序1-200、排序1-300、排序1-400或排序1-500的差异甲基化区域。
在某些实施方案中,所述C-DMR包含表1中所示的全部差异甲基化区域。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种)。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-50中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少45种或全部50种)。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-80中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种或全部80种)。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-100中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或全部100种)。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-150中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种或全部150种)。
在某些实施方案中,所述O-DMR包含或至少包含选自表2的排序1-200中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种、至少150种、至少160种、至少170种、至少180种、至少190种或全部200种)。
在某些实施方案中,所述O-DMR包含表2的排序1-10、排序1-50、排序1-80、排序1-100、排序1-150、排序1-200、排序1-300、排序1-400、排序1-500、排序1-600或排序1-700的差异甲基化区域。
在某些实施方案中,所述O-DMR包含表2中所示的全部差异甲基化区域。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种),并且所述O-DMR包含或至少包含选自表2的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种),并且所述O-DMR包含或至少包含选自表2的排序1-50中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少45种或全部50种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种),并且所述O-DMR包含或至少包含选自表2的排序1-80中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种或全部80种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种),并且所述O-DMR包含或至少包含选自表2的排序1-100中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或全部100种)。
在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-10,并且所述O-DMR包含或至少包含选自表2的排序1-10。在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-50,并且所述O-DMR包含或至少包含选自表2的排序1-50。在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-80,并且所述O-DMR包含或至少包含选自表2的排序1-80。在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-100,并且所述O-DMR包含或至少包含选自表2的排序1-100。在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-150,并且所述O-DMR包含或至少包含选自表2的排序1-150。在某些实施方案中,所述C-DMR包含或至少包含选自表1的排序1-200,并且所述O-DMR包含或至少包含选自表2的排序1-200。在某些实施方案中,所述C-DMR包含表1中所示的全部差异甲基化区域,并且所述O-DMR包含表2中所示的全部差异甲基化区域。
评估母源DNA污染比例
在第二方面,本发明提供了一种用于评估包含胚胎游离DNA(embryonic cell-free DNA)的待测样品中母源DNA污染比例的方法,其包括:基于所述待测样品的DNA甲基化测序数据,获得颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR)的甲基化水平;其中,所述C-DMR和O-DMR如本发明第一方面中定义。
在某些实施方案中,所述方法还包括:对所述待测样品进行DNA甲基化测序,以获得其DNA甲基化测序数据。在某些实施方案中,所获得的原始测序数据经预处理以获得干净数据(clean data)。在某些实施方案中,所述预处理包括删除测序接头、扩增引物和低质量的碱基,以及任选地删除含有3个以上未被甲基化CHs的R2reads以及相应的R1reads。
在某些实施方案中,所述DNA甲基化测序选自全基因组甲基化测序或靶向甲基化测序。
在某些实施方案中,所述全基因组甲基化测序是单细胞全基因组甲基化测序技术。此类技术是本领域技术人员熟知的,参见例如Stuart T,Satija R.Integrativesingle-cell analysis.Nat Rev Genet.2019May;20(5):257-272。在某些实施方案中,所述单细胞全基因组甲基化测序技术选自scBS-seq(single-cell bisulfite sequencing,单细胞重亚硫酸盐测序)(参见例如Smallwood,S.A.et al.Single-cell genome-widebisulfite sequencing for assessing epigenetic heterogeneity.Nat.Methods 11,817–820(2014).)、snmC-seq(single-nucleus methylcytosine sequencing,单细胞核甲基胞嘧啶测序)(参见例如Luo,C.et al.Single-cell methylomes identify neuronalsubtypes and regulatory elements in mammalian cortex.Science 357,600–604(2017).)、sci-MET(single-cell combinatorial indexing for methylation analysis,单细胞组合标记甲基化检测)(参见例如Mulqueen,R.M.et al.Highly scalablegeneration of DNA methylation profiles in single cells.Nat.Biotechnol.36,428–431(2018).)、scRRBS(single-cell reduced representation bifulfite sequencing,单细胞简化代表性重亚硫酸盐测序)(参见例如Guo,H.et al.Single-cell methylomelandscapes of mouse embryonic stem cells and early embryos analyzed usingreduced representation bisulfite sequencing.Genome Res.23,2126–2135(2013).)、scTrio-seq(single-cell triple omics sequencing technique,单细胞三重组学测序)(参见例如Hou,Y.et al.Single-cell triple omics sequencing reveals genetic,epigenetic,and transcriptomic heterogeneity in hepatocellular carcinomas.CellRes.2016Mar;26(3):304-19.),其全部文献通过引用并入本文。
在某些实施方案中,所述全基因组甲基化测序基于重亚硫酸盐测序技术。
在某些示例性实施方案中,所述全基因组甲基化测序是scBS-seq。
在某些实施方案中,所述甲基化水平是指含有甲基化的胞嘧啶的读段数量与读段总数的比值。在某些实施方案中,超过3个reads覆盖的CpG位点用于所述比例的计算。
在某些实施方案中,所述方法还包括基于所获得的C-DMR和O-DMR的甲基化水平确定所述样品中母源DNA污染比例。
在某些实施方案中,所述方法还包括以下步骤:
-使用以下公式计算颗粒细胞来源DNA在样品中的比例(Pk1)和极体细胞来源DNA在样品中的比例(Pk2):
其中,k1-k3表示组分,其分别为颗粒细胞、极体细胞、囊胚;C表示C-DMR,O表示O-DMR;Pk1、Pk2、Pk3分别表示颗粒细胞来源、极体细胞来源、囊胚来源的DNA在样品中的比例;
代表所测得的C-DMR的平均甲基化水平; C/k3分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均甲基化水平参考值;aC/k1、aC/k2、aC/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均PCR扩增效率;
代表所测得的O-DMR的平均甲基化水平; 分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均甲基化水平参考值;aO/k1、aO/k2、aO/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均PCR扩增效率;
-使用以下公式计算母源DNA污染比例:P母源污染=Pk1+Pk2。
在本文中,Pk1+Pk2+Pk3=1旨在表示在使用本发明的方法计算母源DNA污染比例的过程中认为上述三种组分的比例之和为1,但这并不意味着该样品中不会存在其他来源的DNA污染,例如该样品可能还存在父源DNA污染(例如精子细胞来源的DNA污染)。因此,本发明的方法并不排除样品中还存在其他来源的DNA污染的情况,其他来源DNA污染比例可以与本发明方法提供的母源DNA污染比例联合用于无创植入前非整倍体遗传检测。
在某些实施方案中,(即,颗粒细胞中所述C-DMR的平均甲基化水平参考值)是指颗粒细胞标准品中所述C-DMR的平均甲基化水平。所述颗粒细胞标准品是指由颗粒细胞组成或基本上由颗粒细胞组成的细胞样品,其不包含卵母细胞、极体细胞和囊胚细胞。在某些实施方案中,通过对颗粒细胞标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,(即,极体细胞中所述C-DMR的平均甲基化水平参考值)是指极体细胞标准品中所述C-DMR的平均甲基化水平。所述极体细胞标准品是指由卵母细胞/极体细胞组成或基本上由卵母细胞/极体细胞组成的细胞样品,其不包含颗粒细胞和囊胚细胞。在某些实施方案中,通过对极体细胞标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,(即,囊胚中所述C-DMR的平均甲基化水平参考值)是指囊胚标准品中所述C-DMR的平均甲基化水平。所述囊胚标准品是指由囊胚或囊胚细胞组成或基本上由囊胚或囊胚细胞组成的细胞样品,其不包含颗粒细胞和卵母细胞/极体细胞。在某些实施方案中,通过对囊胚标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,(即,颗粒细胞中所述O-DMR的平均甲基化水平参考值)是指颗粒细胞标准品中所述O-DMR的平均甲基化水平。所述颗粒细胞标准品是指由颗粒细胞组成或基本上由颗粒细胞组成的细胞样品,其不包含卵母细胞、极体细胞和囊胚细胞。在某些实施方案中,通过对颗粒细胞标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,(即,极体细胞中所述O-DMR的平均甲基化水平参考值)是指极体细胞标准品中所述O-DMR的平均甲基化水平。所述极体细胞标准品是指由卵母细胞/极体细胞组成或基本上由卵母细胞/极体细胞组成的细胞样品,其不包含颗粒细胞和囊胚细胞。在某些实施方案中,通过对极体细胞标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,(即,囊胚中所述O-DMR的平均甲基化水平参考值)是指囊胚标准品中所述O-DMR的平均甲基化水平。所述囊胚标准品是指由囊胚或囊胚细胞组成或基本上由囊胚或囊胚细胞组成的细胞样品,其不包含颗粒细胞和卵母细胞/极体细胞。在某些实施方案中,通过对囊胚标准品进行与待测样品相同的测定步骤而获得。
在某些实施方案中,所述C-DMR包含表1中所示的排序1-10的差异甲基化区域,分别为93%、2%、4%。在某些实施方案中,所述C-DMR包含表1中所示的排序1-50的差异甲基化区域, 分别为90%、3%、4%。在某些实施方案中,所述C-DMR包含表1中所示的排序1-80的差异甲基化区域,分别为91%、3%、4%。在某些实施方案中,所述C-DMR包含表1中所示的排序1-100的差异甲基化区域,分别为91%、3%、4%。在某些实施方案中,所述C-DMR包含表1中所示的排序1-150的差异甲基化区域,分别为91%、3%、4%。在某些实施方案中,所述C-DMR包含表1中所示的排序1-200的差异甲基化区域, 分别为92%、3%、4%。在某些实施方案中,所述C-DMR包含表1中所示的全部差异甲基化区域,分别为92%、3%、4%。
在某些实施方案中,所述O-DMR包含表2中所示的排序1-10的差异甲基化区域,分别为22%、91%、0%。在某些实施方案中,所述O-DMR包含表2中所示的排序1-50的差异甲基化区域, 分别为31%、75%、15%。在某些实施方案中,所述O-DMR包含表2中所示的排序1-80的差异甲基化区域, 分别为24%、74%、13%。在某些实施方案中,所述O-DMR包含表2中所示的排序1-100的差异甲基化区域,分别为23%、76%、13%。在某些实施方案中,所述O-DMR包含表2中所示的排序1-150的差异甲基化区域,分别为23%、75%、13%。在某些实施方案中,所述O-DMR包含表2中所示的排序1-200的差异甲基化区域,分别为23%、77%、12%。在某些实施方案中,所述O-DMR包含表2中所示的全部差异甲基化区域, 分别为19%、82%、22%。
在某些实施方案中,所述C-DMR包含表1中所示的排序1-100的差异甲基化区域,分别为91%、3%、4%;所述O-DMR包含表2中所示的排序1-100的差异甲基化区域, 分别为23%、76%、13%。
在某些实施方案中,所述C-DMR包含表1中所示的排序1-150的差异甲基化区域,分别为91%、3%、4%;所述O-DMR包含表2中所示的排序1-150的差异甲基化区域, 分别为23%、75%、13%。
在某些实施方案中,所述C-DMR包含表1中所示的排序1-200的差异甲基化区域,分别为92%、3%、4%;所述O-DMR包含表2中所示的排序1-200的差异甲基化区域, 分别为23%、77%、12%。
在某些实施方案中,aC/k1约为0.6。在某些实施方案中,aO/k2约为0.6。在某些实施方案中,aC/k2、aC/k3、aO/k1、aO/k3约为1。在某些实施方案中,aC/k1约为0.6,aO/k2约为0.6,aC/k2、aC/k3、aO/k1、aO/k3约为1。
在某些实施方案中,所述待测样品是囊胚培养液。
植入前非整倍体遗传检测
当母源DNA污染比例确定后,本领域技术人员可以容易地将其用于植入前非整倍体遗传检测应用中。
因此,在第三方面,本发明还提供了一种基于囊胚培养液进行无创植入前非整倍体遗传检测的方法,该方法包括检测目标区域(例如染色体、亚染色体区和/或基因组上局部区域)的拷贝数和母源DNA污染比例,通过整合分析两者的检测数据确定非整倍体性及其嵌合程度、或亚染色体区或基因组上局部区域的拷贝数变异及其嵌合程度。
在某些实施方案中,所述方法包括:
-获得囊胚培养液的甲基化测序数据;
-基于所述测序数据获得目标区域的拷贝数,所述目标区域选自所关注的染色体、亚染色体、基因组上局部区域或其任意组合;
-使用第二方面所述的方法获得所述囊胚培养液中的母源DNA污染比例;
-使用所述母源DNA污染比例对所获得的目标区域的拷贝数和/或其嵌合程度进行校正;
-基于校正后的目标区域的拷贝数诊断染色体非整倍体性和/或其嵌合程度、和/或亚染色体区和/或基因组上局部区域的拷贝数变异和/或其嵌合程度;
其中,所述获得目标区域的拷贝数与所述获得母源DNA污染比例可以以任意顺序或同时进行。
在某些实施方案中,所述方法还包括:对囊胚培养液进行甲基化测序以获得测序数据。在某些实施方案中,所获得的原始测序数据经预处理以获得干净数据(clean data)。在某些实施方案中,所述预处理包括删除测序接头、扩增引物和低质量的碱基,以及任选地删除含有3个以上未被甲基化CHs的R2reads以及相应的R1reads。
通过甲基化测序技术来检测拷贝数变异(CNV)的方法是本领域技术人员已知的。由于甲基化测序的同时也获得了包括甲基化和非甲基化基因组区域的序列信息,其对染色体或基因拷贝数变异检测原理类似于基因组测序。这些基于测序数据的拷贝数变异检测方法典型地可以包括:将测序数据与参考序列进行比对,并根据测序数据匹配区域的读段(read)的累计量(深度)变化或覆盖度变化确定拷贝数的变化。
例如通过CNV-seq来检测拷贝数变异的方法详细描述于McKernan KJ,etal.Sequence and structural variation in a human genome uncovered by short-read,massively parallel ligation sequencing using two-base encoding.GenomeRes.2009;19(9):1527-1541.,其全部文献通过引用并入本文。
例如通过全基因组甲基化测序来检测拷贝数变异的方法详细描述于Bian,S.etal.Single-cell multiomics sequencing and analyses of human colorectalcancer.Science.2018Nov 30;362(6418):1060-1063.,其全部文献通过引用并入本文。
例如通过一种半靶向甲基化测序、简并代表性亚硫酸氢盐测序技术(Reducedrepresentation bisulfite sequencing,RRBS)来检测拷贝数变异的方法详细描述于Hou,Y.et al.Single-cell triple omics sequencing reveals genetic,epigenetic,andtranscriptomic heterogeneity in hepatocellular carcinomas.Cell Res.2016Mar;26(3):304-19.;其全部文献通过引用并入本文。
以上所描述的各种检测拷贝数变异的方法都可以用于测定染色体拷贝数。在某些实施方案中,所述甲基化测序技术选自CNV-seq、全基因组甲基化测序、RRBS。
在某些实施方案中,所述测序数据由多个读段(reads)组成。
在某些实施方案中,所述基于所述测序数据获得目标区域的拷贝数包括:将测序数据与参考序列进行比对,并根据测序数据匹配区域的读段(read)的累计量(深度)或覆盖度确定拷贝数的变化。
在某些实施方案中,所述参考序列是人类基因组(例如人类参考基因组hg19)。
在某些实施方案中,所述所关注的染色体包括选自下列的一种或多种染色体:染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X或Y。
在某些实施方案中,所述的亚染色体区或基因组上局部区域是指染色体上拷贝数变异大于1Mb的片段。
在某些实施方案中,本发明的进行植入前非整倍体遗传检测的方法包括根据母源DNA污染比例对所获得的目标区域(例如染色体、亚染色体和/或基因组上局部区域)的拷贝数和/或其嵌合程度进行校正的步骤。嵌合程度指胚胎中一部分细胞的染色体、亚染色体和/或基因组上局部区域和其他细胞的染色体、亚染色体和/或基因组上局部区域不一致。在某些实施方案中,所述不一致可指数目方面的不一致。在某些实施方案中,校正过程如下:如若培养液样本中有母源DNA污染,则染色体拷贝数趋向于二倍体,根据正常母源DNA的拷贝数为二以及母源DNA的污染比例,可对实际检测到的培养液样本的拷贝数进行校正,恢复无母源DNA污染前的实际拷贝数;如若培养液样本中无母源DNA污染,拷贝数是不为二的非整数,则可以通过嵌合程度的校正,得到培养液样本中整倍体细胞与非整倍体细胞的比例,进而知道胚胎的实际拷贝数。
电子实施方案
利用任何合适的计算机语言,如Java、C++或使用例如常规或面向对象技术的Perl,本申请第二或第三方面所述的方法可以作为由处理器运行的软件代码来执行。软件代码可在用于存储和/或传输的计算机可读介质上存储为一系列指令或命令,合适的介质包括随机存取存储器(RAM)、只读存储器(ROM)、诸如硬盘或软盘的磁性介质或诸如光盘(CD)或DVD(多功能数码光盘)的光学介质、闪存等。计算机可读介质可以是此类存储或传输装置的任何组合。
因此,在另一方面,本发明还提供了用于进行评估包含胚胎游离DNA(embryoniccell-free DNA)的待测样品中母源DNA污染比例的操作的计算机可读介质或计算机程序产品,其包括用多个控制计算系统的指令,所述多个指令用于控制计算系统执行第二方面任一实施方案中所述的方法。
在某些实施方案中,所述多个指令被执行时实现下述步骤:
-任选地接收所述待测样品的DNA甲基化测序数据;
-基于所述待测样品的DNA甲基化测序数据,获得颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR)的甲基化水平;其中,所述C-DMR和O-DMR如第一方面任一实施方案中定义;
-使用以下公式计算颗粒细胞来源DNA在样品中的比例(Pk1)和极体细胞来源DNA在样品中的比例(Pk2):
其中,k1-k3表示组分,其分别为颗粒细胞、极体细胞、囊胚;C表示C-DMR,O表示O-DMR;Pk1、Pk2、Pk3分别表示颗粒细胞来源、极体细胞来源、囊胚来源的DNA在样品中的比例;
代表所测得的C-DMR的平均甲基化水平; 分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均甲基化水平参考值;aC/k1、aC/k2、aC/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均PCR扩增效率;
代表所测得的O-DMR的平均甲基化水平; 分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均甲基化水平参考值;aO/k1、aO/k2、aO/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均PCR扩增效率;
-使用以下公式计算母源DNA污染比例:P母源污染=Pk1+Pk2;
在某些实施方案中,所述公式中的各参数如第二方面任一实施方案中定义。
在另一方面,本发明还提供了用于进行基于囊胚培养液的无创植入前非整倍体遗传检测的操作的计算机可读介质或计算机程序产品,其包括用多个控制计算系统的指令,所述多个指令用于控制计算系统执行第三方面任一实施方案中所述的方法。
在某些实施方案中,所述多个指令被执行时实现下述步骤:
-接收囊胚培养液的甲基化测序数据;
-基于所述测序数据获得目标区域的拷贝数,所述目标区域选自所关注的染色体、亚染色体和/或基因组上局部区域或其任意组合;
-使用第二方面所述的方法获得所述囊胚培养液中的母源DNA污染比例;
-使用所述母源DNA污染比例对所获得的目标区域的拷贝数和/或其嵌合程度进行校正;
-基于校正后的目标区域的拷贝数诊断染色体非整倍体性或其嵌合程度、或亚染色体区或基因组上局部区域的拷贝数变异或其嵌合程度;
其中,所述获得目标区域的拷贝数与所述获得母源DNA污染比例可以以任意顺序或同时进行。
在某些实施方案中,上述各步骤如第三方面任一实施方案中定义。
术语定义
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的基因组学、核酸化学、分子生物学等实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“DNA甲基化”是指为DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表现。所谓DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5号碳位共价键结合一个甲基基团,能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。
如本文中所使用的,术语“拷贝数变异”是Copy number variation(CNV),是由基因组发生重排而导致的,基因组上大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。是基因组结构变异(Structural variation,SV)的重要组成部分。可以说是染色体病的另一种重要致病机制。本文中定义的CNV是指基因组上片段长度大于1Mb的拷贝数增加或减少。
如本文中所使用的,术语“染色体非整倍性”是指其中细胞中存在错误数量的染色体的状态,包括表现具有染色体异常数量的任何遗传缺陷,例如具有比任一个染色体正常数量多或少的染色体,以及除正常对之外具有任一个染色体的多余部分,或者缺少正常对中任一个染色体的一部分。在人体细胞的情况中,它可指细胞不包含22对常染色体和一对性染色体的情况。在人生殖细胞的情况中,它可指细胞不包含23染色体中每一个的情况。当提及单个常染色体时,它可指其中多于或少于两个同源染色体存在的情况。当提及性染色体时,它可指其中多于或少于两个X或Y染色体存在,或正好两个Y染色体存在的情况。
如本文中所使用的,术语“嵌合程度”是指胚胎中一部分细胞的染色体、亚染色体和/或基因组上局部区域和其他细胞的染色体、亚染色体和/或基因组上局部区域不一致。在某些实施方案中,所述不一致特指数目方面的不一致。
如本文中所使用的,术语“差异甲基化区域(DMR)”是指在染色体DNA中的区域,其在不同来源的DNA中被差异甲基化。例如,在本发明中,颗粒细胞特异性差异甲基化区域(C-DMR)可以指,那些在颗粒细胞中被高度甲基化的区域,它们在其他胚胎细胞(例如极体细胞)中低甲基化或近乎无甲基化。例如,在本发明中,极体细胞特异性差异甲基化区域(O-DMR)可以指,那些在卵母细胞/极体细胞中被高度甲基化的区域,它们在其他细胞(例如颗粒细胞、精子)中低甲基化。
如本文中所使用的,术语“颗粒细胞(cumulus cell)”是指构成卵泡壁颗粒层的细胞。
如本文中所使用的,术语“卵母细胞(oocyte)”是指在卵子发生过程中进行减数分裂的卵原细胞。
如本文中所使用的,术语“极体细胞(polar body)”是指雌性生殖细胞形成过程中经过两次减数分裂,形成一个大形的单倍体卵细胞和2~3个小形的细胞,这些小形的细胞称为极体。
如本文中所使用的,术语“囊胚(blastocyst)”是指胚胎发育的早期阶段,由包封被称为卵裂腔的流体填充腔体的中空细胞球组成。
如本文中所使用的,术语“囊胚培养液(spent blastocyst culture media,SBM)”或“胚胎培养液(spent embryo culture media,SEM)”具有相同的含义,可互换使用,其是指在植入前的囊胚/胚胎体外培养过程中所使用过的培养液,其中存在由胚胎释放的游离DNA(cell free DNA,cfDNA)。在某些实施方案中,所述囊胚培养液是指体外培养的胚胎达到完全扩大囊胚期时的培养液。在某些实施方案中,所述囊胚培养液通过以下步骤获得:在卵母细胞回收当天通过胞浆内精子注射(ICSI)进行受精;将胚胎移至囊胚培养基中(例如在第3天);去除胚胎或桑椹周围的颗粒细胞,彻底清洗,然后在新的培养皿中单独培养(例如在第4天);当胚胎达到完全扩大囊胚期(例如第5天到第7天),收集培养液,作为囊胚培养液。
如本文中所使用的,术语“计算机可读介质”是指,用于存储、保存或包含可由计算机直接读取和访问的数据或信息的任何合适的介质。此类介质可以包括但不限于:磁性存储介质诸如软盘、硬盘存储介质和磁带;光存储介质诸光盘;电子存储介质,诸如RAM、ROM、EPROM、EEPROM等;通用硬盘和这些类型的杂交体诸如磁/光存储介质。
发明的有益效果
本发明鉴定了囊胚培养液中游离DNA的来源及其组成成分,由此鉴定了用于评估囊胚培养液中母源DNA污染的颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR),并进一步提供了基于上述差异甲基化区域评估中囊胚培养液中母源DNA污染的方法。与传统SNP测序法相比,本发明的测定母源DNA污染的方法更加简便、经济、省时,适合于大规模临床应用。本发明还提供了基于囊胚培养液进行无创植入前非整倍体遗传检测的方法,该方法同时检测染色体拷贝数和母源污染率,通过整合分析以提高临床诊断准确性。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
图1示意性地描绘了本发明一个实施方案的研究流程图。
图2显示了对囊胚培养液中游离DNA的颗粒细胞污染的评估结果。
(A)囊胚培养液样品、人类植入前的胚胎、生殖细胞和颗粒细胞中DNA甲基化水平的非监督层次聚类分析结果。GV:GV卵母细胞;MII:MII卵母细胞;PN:原核。
(B)769个CpG岛差异甲基化区域(C-DMRs)的甲基化水平的热图(Heatmap),这些区域在颗粒细胞中特异性高度甲基化。
(C)囊胚培养液cfDNA中全基因组DNA甲基化水平与C-DMR甲基化水平的相关性分析。
(D)ICM、TE、颗粒细胞和具有不同颗粒细胞污染程度(无污染、中度污染、重度污染)的三类囊胚培养液样品的全基因组DNA甲基化水平检测结果,其中,颗粒细胞污染程度根据C-DMR甲基化水平估算。
图3A-3D显示了通过scBS-seq检测染色体非整倍性的结果。
图3A:scBS-seq(内层)和MALBAC(外层)测定的HCT116细胞的CN谱。
图3B:基于不同数据量的唯一比对读段的测序结果的变异系数(CV)分布。
图3C:不同类型囊胚培养液的代表性CN谱及相应的TE活检结果。
图3D:使用scBS-seq和TE活检2种方法对具有不同颗粒细胞污染程度(无污染、中度污染、重度污染)的囊胚培养液样品进行检测得到的拷贝数结果的总体一致性率(GCR)、假阴性率(FNR)和假阳性率(FPR)分析。
图4A-4E显示了对囊胚培养液中游离DNA的极体细胞污染的评估结果。
图4A:无颗粒细胞污染样品以及植入前胚胎细胞和生殖细胞的全基因组DNA甲基化的无监督分层聚类分析结果。GV:GV卵母细胞;MII:MII卵母细胞;PN:原核。
图4B:548个卵母细胞/极体细胞特异的差异甲基化区域(O-DMRs)的甲基化水平的热图(Heatmap),这些区域在MII卵母细胞中高甲基化。
图4C:与MII卵母细胞和母原核聚在一起的三个囊胚培养液样品与其他样品在O-DMRs的甲基化水平的比较。
图4D:与母原核聚在一起的囊胚培养液样品(#S167)、与MII卵母细胞聚在一起的囊胚培养液样品(#S176)以及与母原核聚在一起的囊胚培养液样品(#S193)的染色体CN谱、TE活检结果和C-DMR、O-DMR甲基化水平的测定结果。
图4E:培养液样本中非CpG岛的甲基化水平与O-DMR甲基化水平的相关性分析结果。
图5A-5B显示了囊胚培养液中游离DNA的胚胎来源分析结果。
图5A:EPI(n=22)和TE(n=25,全部来自第六天的胚胎)的单细胞DNA甲基化数据的主成分分析结果,其基于EPI和TE之间的前300个差异表达基因的启动子区域。该单细胞多组学测序的DNA甲基化数据来自本实验室之前发表的研究(F.Zhou et al.,Reconstituting the transcriptome and DNA methylome landscapes of humanimplantation.572,660-664(2019))。
图5B:第六天囊胚培养液样品(无颗粒细胞或极体细胞污染)与EPI和TE单细胞的主成分分析结果。
图6显示了推导公式的准确性验证结果。
(A)模拟DNA掺入实验结果。计算机生成一系列不同掺入比例的极体(MII卵母细胞)、ICM/TE和颗粒细胞的模拟数据,包括三种组分之一的100%掺入(100%input),两种组分各自的50%掺入(50%+1input),一种组分的75%掺入加上另一种组分的25%掺入(75%+1input),一种组分的50%掺入加上另外两种组分的25%掺入(50%+2input),一个组分的75%掺入再加上其他两个组分的12.5%掺入(75%+2input)。图中显示了掺入百分比和预测百分比的比较结果。
(B)计算估计的百分比与实际掺入百分比的相关性分析。
图7A-7E显示了母源污染对染色体拷贝数影响的分析结果。
图7A:具有不同颗粒细胞污染比例(左)和极体细胞污染比例(右)的囊胚培养液样本的数量和百分比。
图7B:囊胚培养液中颗粒细胞的污染和极体细胞污染的相关性分析。
图7C:具有不同母源DNA净污染比例的囊胚培养液样本的数量和百分比。
图7D:具有不同颗粒细胞污染、极体细胞污染或净母源DNA污染比例的培养液样本得到的拷贝数结果和TE活检结果的性别不一致率(GDR)和假阴性率FNR。
图7E:第5天、第6天和第7天的培养液中的颗粒细胞污染比例,以及第5天和第6天的性别不一致率和假阴性率。
图8A-8B:使用top10、top50、top80、top100、top150、top200个C-DMR和O-DMR计算的颗粒细胞(cumulus)和极体细胞(polar body)的污染比例与实际掺入百分比的相关性分析。
实施例
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,本发明中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。
以下实施例中所涉及的实验方法如下所述:
1、实验设计
我们收集了194份囊胚培养液样本,经过单细胞DNA甲基化测序,获得2层信息:1)DNA甲基化信息去推断DNA来源及其比例,2)reads覆盖度推断染色体拷贝数,通过整合分析,提高临床诊断准确性。实验流程示意如图1所示。
2、人类囊胚培养液收集
本研究共纳入194个PGT-A(preimplantation genetic testing foraneuploidy)囊胚及其相应培养液。在所有这些PGT-A周期中,均在卵母细胞回收当天通过胞浆内精子注射(ICSI)进行受精。第3天,将胚胎移至囊胚培养液中。第4天,将每个压实的胚胎或桑椹再次仔细剥去周围的颗粒细胞,彻底清洗,然后在新的培养皿中单独培养(每个培养滴15μl)。从第5天到第7天,当胚胎达到完全扩大囊胚期,将其移到活组织检查皿中,用聚合酶链反应(PCR)管收集培养液。样品保存在-20℃。对相应囊胚的TE进行活检,每个活检标本单独玻璃化冷冻。用SNP阵列对活检细胞进行PGT分析。
3、囊胚培养液全基因组DNA甲基化测序
用单细胞全基因组甲基化测序法(scBS-seq)检测囊胚培养液中DNA甲基组。培养液用无核酸酶补齐到20ul体积,加入相应体积的裂解缓冲液(20mM Tris-EDTA,20毫米氯化钾,0.3%Triton X-100和1毫克/毫升蛋白酶K)在50℃条件下裂解1.5h,然后用EZ-96DNAMethylation-Direct MagPrep试剂盒进行重亚硫酸盐处理。纯化后,利用随机引物P5-N9(5’-CTACACGACGCTCTTCCGATCTNNNNNNNN-3’,SEQ ID NO:1)和Klenow聚合酶合成第一条DNA链。此步骤执行四次。用P7-N9引物(5'-AGACGTGTGCTCTTCCGATCTNNNNNNNN-3',SEQ ID NO:2)合成第二链DNA。用指数引物和Illumina通用PCR引物进行PCR扩增,获得测序文库,每个样本测5G数据。
4、DNA甲基化测序数据处理
首先,我们删除原始亚硫酸氢盐测序双端读段(reads)数据中的测序接头、扩增引物和低质量的碱基。然后,我们丢弃含有3个以上未被甲基化CHs的R2reads以及相应的R1reads。使用BS-Seeker2以端到端比对模式将这些干净读段(clean reads)映射到人类参考基因组(hg19)。未比对上的reads以局部比对方式与hg19基因组重新配对,去除微同源区的低置信度比对。接下来,使用Picard工具删除由PCR扩增引起的重复。C甲基化的reads数与总reads(甲基化和未甲基化)的比值定义为DNA甲基化水平;超过3个reads覆盖的CpG位点用于后续的计算。保留唯一比对的读段(unique mapping reads)大于100万的样品进行后续的分析。
实施例1:囊胚培养液存在颗粒细胞污染
我们将植入前胚胎、生殖细胞的DNA甲基化数据(P.Zhu et al.,Single-cell DNAmethylome sequencing of human preimplantation embryos.Nat Genet 50,12-19(2018))与囊胚培养液数据联合分析发现,培养液游离DNA的全基因组甲基化水平为13%~74%,中位数为36%,显著高于ICM和TE的甲基化水平(ICM和TE分别为24%和24%)。聚类分析表明,部分培养液样本(191份中的50份)与颗粒细胞聚在一起。这些样品的DNA甲基化水平较高(平均60%),接近颗粒细胞的DNA甲基化水平(平均71%)(图2A)。
为了准确评估囊胚培养液中颗粒细胞的比例,我们鉴定了769个颗粒细胞特异的CpG岛差异甲基化区域(C-DMRs),通过计算这769个C-DMRs在颗粒细胞标准品和其他所有胚胎细胞中的甲基化差异,根据显著性计算得到的p value值,按值大小从小到大进行了重要性排序,这些C-DMRs示于所附表1中。这些差异甲基化区域在颗粒细胞中被高度甲基化,而在其他胚胎细胞中近乎无甲基化(图2B)。同时,这些C-DMRs的平均甲基化水平与全基因组DNA甲基化水平呈正相关,表明培养液的全基因组高甲基化水平主要是由颗粒细胞的污染造成(图2C)。
通过对培养液中这些C-DMRs的甲基化水平的计算,我们确定大约一半的培养液样品(191中的95)被颗粒细胞污染(C-DMR甲基化水平高于8%,ICM/TE中C-DMR甲基化水平的平均值(4%)+3sd(1.3%))。被颗粒细胞污染的培养液样本大约一半(50/95)显示中度污染(C-DMR甲基化水平:8%-40%),另一半(45/95)显示严重污染(C-DMR甲基化水平:大于40%)(图2D)。
实施例2:单细胞全基因组甲基化测序法(scBS-seq)检测非整倍体
我们之前的研究已经证明了scBS-seq能够评估拷贝数(CN)变异(Y.Hou et al.,Cell Res 26,463 304-319(2016).;S.H.Bian et al.,Science 362,1060-+(2018).)。我们首先分析了HCT116细胞,结果显示scBS-seq和多次退火和基于环的扩增周期(MALBAC)(C.H.Zong,S.J.Lu,A.R.Chapman,X.S.Xie,Genome-Wide Detection of Single-Nucleotide and Copy-Number Variations of a Single Human Cell.Science 338,1622-1626(2012).)给出了相同的预期CN谱(图3A)。为了准确确定拷贝数变异结果的测序深度下限,我们对数据进行了随机抽样降低测序深度,结果显示在数据量为2M时,变异系数(CV)稳定低(图3B)。接着,我们对培养液样本进行了拷贝数结果的鉴定,发现大多数SEM样品(191个中的182个)给出了清晰有信息的拷贝数图;其余9个无法得到确定的结果(多于6个非整倍体片段),被定义为“非整倍体混乱”,并被丢弃。比较培养液和TE活检得到的拷贝数结果,胚胎分为4类:1)培养液整倍体与TE活检整倍体(Euploid-Euploid),2)培养液整倍体和TE活检非整倍体(Euploid-Aneuploid),3)培养液非整倍体与TE活检整倍体(Aneuploid-Euploid),4)培养液非整倍体和TE活检非整倍体(Aneuploid-Aneuploid)。非整倍体-非整倍体样本进一步分为“全倍体一致性”、“部分倍体一致性(重叠)”、“部分倍体一致性(互补)”和“部分倍体一致性(不重叠)”。图3C显示了各类别的代表性样本。通过分析2种方法检测得到的拷贝数结果发现,没有颗粒细胞污染的囊胚培养液的用2种方法检测得到的染色体倍性一致率最高(68/92,73.9%),假阴性率最低(7/51,13.7%),颗粒细胞严重污染的囊胚培养液用2种方法检测得到的染色体倍性一致率最低(46.5%)和假阴性率最高(90.0%)。无颗粒细胞污染、中度污染和重度污染的培养液的假阳性率分别为41.5%、35.0%和21.7%,表明颗粒污染掩盖了假阳性的非整倍体,这可能是嵌合体造成的(图3D)。
实施例3:囊胚培养液存在极体细胞污染
为了进一步探究培养液中游离DNA的细胞起源,我们对96例无颗粒细胞污染的样品以及植入前胚胎细胞和生殖细胞进行了聚类分析。结果表明,大多数培养液样品(96个中的92个)与ICM和TE聚在一起,1个样品(#S167)和2个样品(#S176和#S193)分别与MII卵母细胞和母原核聚在一起(图4A)。由于卵母细胞的基因组DNA和原核不应该被释放,这些培养液很可能包含极体的成分,这些极体是在减数分裂期间由卵母细胞产生的。
进一步量化极体污染,我们鉴定了548卵母细胞/极体细胞特异的差异甲基化区域(O-DMRs),通过计算这548个O-DMRs在卵母细胞标准品和囊胚细胞,颗粒细胞中的甲基化差异,根据显著性计算得到的pvalue值,按值大小从小到大进行了重要性排序,这些O-DMRs示于所附表2中。这些差异甲基化区域在MII卵母细胞中高甲基化,在胚胎植入前的胚胎细胞,颗粒细胞和精子中低甲基化(图4B)。与MII卵母细胞和母原核聚在一起的三个培养液样品在O-DMRs的甲基化水平比其他培养液样品显著更高(中位甲基化水平:#S167、#S176和#S193分别为100%、56%和79%,相对于其他培养液样品的中位甲基化水平为14%(图4C)。观察这三个培养液样本的拷贝数情况,发现均为假阴性或性别不一致:#S176和#S193的TE活检结果为“46,XY”,#S167的TE活检结果为“-21,XX”,但三个样本的培养液结果显示均为“46,XX”(图4D)。计算这三个样本的C-DMR甲基化水平可以看出,它们显然没有被颗粒细胞污染。
我们计算培养液样本在O-DMRs上的甲基化,发现大约1/3(27%,53/191)的培养液样品被极体污染(O-DMR甲基化水平高于31%,ICM/TE中O-DMR甲基化水平的平均值(22%)+3个SD(3%))。我们还检测了培养液样本的非CpG岛的甲基化水平与O-DMR甲基化水平呈正相关(图4E)。
实施例4:囊胚培养液中胚胎细胞来源于ICM和TE
为了进一步探究囊胚培养液中游离DNA的胚胎来源,我们进一步对无颗粒细胞和极体细胞污染的培养液样本进行深入分析。我们首先将最近我们组发表的单细胞多组学测序的外胚层(EPI)和滋养层(TE)样品的DNA甲基化数据(F.Zhou et al.,Reconstitutingthe transcriptome and DNA methylome landscapes of human implantation.Nature572,660-+(2019).),经主成分分析(PCA)发现,根据DNA甲基化图谱,EPI和TE可以大致分离。接着,我们加入第6天没有颗粒细胞和极体污染的培养液样品(n=61),进行主成分分析。结果表明,大约1/3(18/61)的培养液样品与TE聚在一起,大约2/3(43/61)和EPI聚在一起(图5A)。用EPI差异表达基因的甲基化水平除以TE差异表达基因的甲基化水平可以区分EPI和TE。自此,我们推断培养液中游离DNA的胚胎来源是TE和ICM(图5B)。
实施例5:培养液中母源DNA污染率的推导和染色体非整倍体分析
我们期望量化出培养液中母源DNA的污染比例。我们利用769个C-DMRs和548个O-DMRs的甲基化水平建立了在培养液中推导颗粒细胞和极性细胞DNA组分的算法,然后将这两个组分比例之和作为净母源DNA的污染比例,计算公式如下:
其中MMi代表培养液游离DNA中DMRi的甲基化水平;MCik表示组分k中DMRi的甲基化水平;Pk表示组分k对培养液游离DNA的比例贡献。DMRs有C-DMRs和O-DMRs两种类型,培养液中有囊胚、颗粒细胞和极体细胞三种成分,三种成分的净比例和为100%。DMRs的DNA甲基化水平被称为:i)C-DMRs,在颗粒细胞中为92%,囊胚中为4%,卵母细胞/极体细胞中为3%,ii)O-DMRs,在颗粒细胞中为19%,囊胚中为22%,卵母细胞/极体细胞中为82%。校正因子aik表示组分k中DMRi的PCR扩增效率,因为亚硫酸氢盐转化DNA的PCR扩增往往偏向于未甲基化的等位基因。我们的数据表明,颗粒细胞的C-DMRs校正因子aik约为0.6,极体细胞的O-DMRs校正因子aik约为0.6,其他值均为1。
为了验证该方法的准确性,我们通过计算机生成一系列不同掺入比例的ICM/TE和颗粒细胞的模拟数据以进行模拟分析(simulation analysis)。模拟数据获得方式如下:通过对MII卵母细胞(n=33)、ICM/TE(ICM,n=9;TE,n=9)、颗粒细胞(n=12)的高质量甲基化测序数据进行采样,分别合成用于模拟分析的极体细胞模拟数据(polar body)、囊胚模拟数据(blastocyte)和颗粒细胞模拟数据(cumulus cell)。从33个MII卵母细胞的每一个中随机采样了3,030,303个唯一比对读段,以合成具有100万个读段的“平均”MII卵母细胞模拟数据(即,极体细胞模拟数据)。然后,从该MII卵母细胞模拟数据中随机选择一定比例的读段,例如50%(50,000,000个读段),并将其与其他细胞类型的一定比例的读段混合,例如从囊胚模拟数据中获得50%(50,000,000个读数),产生具有大约一百万个唯一比对读段的一个混合细胞模拟数据。通过计算机生成一系列不同掺入比例的ICM/TE和颗粒细胞的模拟数据后,使用本发明的方法计算颗粒细胞和极体细胞的百分比,其结果如图6A所示,计算估计的百分比与实际掺入百分比有很好的线性相关性(R=0.99,Pearson相关)(图6B)。
接着,我们计算了实际培养液样本中各组分的比例。培养液中颗粒细胞较极体细胞造成了更严重的污染(颗粒细胞污染>60%的培养液样本数:39/182,22%;极体细胞污染>60%的培养液样本数:7/182,4%)(图7A)。培养液中颗粒细胞的污染和极体细胞污染之间有轻微的相关性(R=-0.19,Pearson相关),这可能反映了低胚胎DNA量导致高母源污染的情况(图7B)。大约三分之一(31.3%,57/182)的培养液样本显示母源DNA净污染大于60%,三分之一(34.1%,62/182)显示母源DNA净污染小于20%(图7C)。
为了探究母源污染对染色体拷贝数的影响,我们计算了由培养液得到的拷贝数结果和TE活检结果的性别不一致率(GDR)和假阴性率FNR。性别不一致率结果显示,当净母源污染比小于20%时,性别不一致率为零(0%,24中为0)。而当颗粒细胞污染比低于20%时,性别不一致率保持在18%(9/49),当极体细胞污染比低于20%时,性别不一致率保持在42%(24/57)(图7D)。
假阴性率结果显示,当净母源污染比小于20%时,假阴性率仍然很高(16%,6/37)(图7D)。对染色体拷贝数图谱的仔细检查发现,这些假阴性的培养液样本是嵌合的非整倍体,有拷贝数增加或缺失的迹象,与大多数病例(6例中的5例)的TE活检结果相匹配或互补。这表明这些胚胎同时含有非整倍体和整倍体细胞,而整倍体细胞未被TE活检取样。性别不一致率和假阴性率均随颗粒细胞、极体细胞和母源净污染率的增加而增加。当净母源污染比高于60%时,性别不一致率和假阴性率分别增加到100%(31/31)和75%(6/8)(图7D)。
我们还研究了采样时间和母源污染的关系,发现第6天的培养液中颗粒细胞污染比例性别不一致率和假阴性率比第5天样品显著低。而培养液中极体细胞污染比例和取样时间无关,证明极体细胞释放DNA是持续的过程(图7E)。
实施例6:使用不同数量的DMR对培养液中母源DNA污染率推导
我们分别使用C-DMR和O-DMR的最优先的10/50/80/100/150/200个去计算培养液中母源DNA的污染率,简言之,通过计算机生成一系列不同掺入比例的极体(MII卵母细胞)、ICM/TE和颗粒细胞的模拟数据,使用实施例5中所示的公式并基于表1和表2中的top10/50/80/100/150/200个DMR计算颗粒细胞和极体细胞的污染百分比,并比较估计的百分比与实际掺入百分比的线性相关性,需要代入计算公式中的值分别如下表所示。
检测结果分别如图8A-8B所示。结果显示,当只取top10个DMR(即,top10 C-DMR和top10 O-DMR)、top50个DMR(即,top50 C-DMR和top50 O-DMR)、top80个DMR(即,top80 C-DMR和top80 O-DMR)、top100个DMR(即,top100 C-DMR和top100 O-DMR)、top150个DMR(即,top150 C-DMR和top150 O-DMR)、top200个DMR(即,top200 C-DMR和top200 O-DMR)进行测定时,由公式推导的培养液中颗粒细胞污染比例以及极体细胞污染比例均与实际掺入比例几乎一致。以上结果表明通过使用部分表1中所示的C-DMR和表2中所示的O-DMR即可实现对母源DNA污染率的准确检测。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。
表1:C-DMRs
注:表1中所示的染色体位置参考hg19。
表2:O-DMRs
注:表2中所示的染色体位置参考hg19。
参考文献
1.Montag M,M,Strowitzki T,Toth B.Polar body biopsy.FertilSteril.2013Sep;100(3):603-7.doi:10.1016/j.fertnstert.2013.05.053.Epub 2013Jun21.PMID:23796365.
2.Ray PF,Kaeda JS,Bingham J,Roberts I,Handyside AH.Preimplantationgenetic diagnosis of beta-thalassaemia major.Lancet.1996Jun 15;347(9016):1696.doi:10.1016/s0140-6736(96)91524-x.PMID:8642985.
3.Handyside AH,Pattinson JK,Penketh RJ,Delhanty JD,Winston RM,Tuddenham EG.Biopsy of human preimplantation embryos and sexing by DNAamplification.Lancet.1989Feb 18;1(8634):347-9.doi:10.1016/s0140-6736(89)91723-6.PMID:2464730.
4.Kokkali G,Vrettou C,Traeger-Synodinos J,Jones GM,Cram DS,Stavrou D,Trounson AO,Kanavakis E,Pantos K.Birth of a healthy infant followingtrophectoderm biopsy from blastocysts for PGD of beta-thalassaemia major.HumReprod.2005Jul;20(7):1855-9.doi:10.1093/humrep/deh893.Epub 2005May 5.PMID:15878929.
5.Schoolcraft WB,Fragouli E,Stevens J,Munne S,Katz-Jaffe MG,WellsD.Clinical application of comprehensive chromosomal screening at theblastocyst stage.Fertil Steril.2010 Oct;94(5):1700-6.doi:10.1016/j.fertnstert.2009.10.015.Epub 2009Nov 25.PMID:19939370.
6.Cimadomo D,Capalbo A,Ubaldi FM,Scarica C,Palagiano A,Canipari R,Rienzi L.The Impact of Biopsy on Human Embryo Developmental Potential duringPreimplantation Genetic Diagnosis.Biomed Res Int.2016;2016:7193075.doi:10.1155/2016/7193075.Epub 2016Jan 28.PMID:26942198;PMCID:PMC4749789.
7.Stigliani S,Anserini P,Venturini PL,Scaruffi P.Mitochondrial DNAcontent in embryo culture medium is significantly associated with humanembryo fragmentation.Hum Reprod.2013Oct;28(10):2652-60.doi:10.1093/humrep/det314.Epub 2013 Jul 25.PMID:23887072.
8.Xu J,Fang R,Chen L,Chen D,Xiao JP,Yang W,Wang H,Song X,Ma T,Bo S,Shi C,Ren J,Huang L,Cai LY,Yao B,Xie XS,Lu S.Noninvasive chromosome screeningof human embryos by genome sequencing of embryo culture medium for in vitrofertilization.Proc Natl Acad Sci U S A.2016 Oct18;113(42):11907-11912.doi:10.1073/pnas.1613294113.Epub 2016 Sep 29.PMID:27688762;PMCID:PMC5081593.
9.Hammond ER,McGillivray BC,Wicker SM,Peek JC,Shelling AN,Stone P,Chamley LW,Cree LM.Characterizing nuclear and mitochondrial DNA in spentembryo culture media:genetic contamination identified.Fertil Steril.2017 Jan;107(1):220-228.e5.doi:10.1016/j.fertnstert.2016.10.015.Epub 2016Nov 16.PMID:27865449.
10.Vera-Rodriguez M,Diez-Juan A,Jimenez-Almazan J,Martinez S,NavarroR,Peinado V,Mercader A,Meseguer M,Blesa D,Moreno I,Valbuena D,Rubio C,SimonC.Origin and composition of cell-free DNA in spent medium from human embryoculture during preimplantation development.Hum Reprod.2018 Apr 1;33(4):745-756.doi:10.1093/humrep/dey028.PMID:29471395.
SEQUENCE LISTING
<110> 北京大学
<120> 用于无创植入前非整倍体遗传检测的方法
<130> IDC210005
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物P5-N9
<220>
<221> misc_feature
<222> (23)..(30)
<223> n is a, c, g, or t
<400> 1
ctacacgacg ctcttccgat ctnnnnnnnn 30
<210> 2
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> P7-N9引物
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 2
agacgtgtgc tcttccgatc tnnnnnnnn 29
Claims (14)
1.用于评估包含胚胎游离DNA(embryonic cell-free DNA)的待测样品中母源DNA污染比例的方法,其包括:基于所述待测样品的DNA甲基化测序数据,获得颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR)的甲基化水平;其中,所述C-DMR选自表1中的至少一种(例如至少5种、至少10种、至少50种、至少80种、至少100种、至少150种、至少200种或至少500种);所述O-DMR包含选自表2中的至少一种(例如至少5种、至少10种、至少50种、至少80种、至少100种、至少150种、至少200种、至少500种或至少700种)。
2.权利要求1所述的方法,其中,所述C-DMR包含:
选自表1的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种);或
选自表1的排序1-50中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少45种或全部50种);或
选自表1的排序1-80中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种或全部80种);或
选自表1的排序1-100中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或全部100种);或
选自表1的排序1-150中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种或全部150种);或
选自表1的排序1-200中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种、至少150种、至少160种、至少170种、至少180种、至少190种或全部200种)。
3.权利要求1所述的方法,其中,所述C-DMR包含表1的排序1-10、排序1-50、排序1-80、排序1-100、排序1-150、排序1-200、排序1-300、排序1-400或排序1-500的差异甲基化区域;
优选地,所述C-DMR包含表1中所示的全部差异甲基化区域。
4.权利要求1所述的方法,其中,所述O-DMR包含:
选自表2的排序1-10中的至少一种(例如至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或全部10种);或
选自表2的排序1-50中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少45种或全部50种);或
选自表2的排序1-80中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种或全部80种);或
选自表2的排序1-100中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或全部100种);或
选自表2的排序1-150中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种或全部150种);或
选自表2的排序1-200中的至少一种(例如至少10种、至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种、至少100种、至少110种、至少120种、至少130种、至少140种、至少150种、至少160种、至少170种、至少180种、至少190种或全部200种)。
5.权利要求1所述的方法,其中,所述O-DMR包含表2的排序1-10、排序1-50、排序1-80、排序1-100、排序1-150、排序1-200、排序1-300、排序1-400、排序1-500、排序1-600或排序1-700的差异甲基化区域;
优选地,所述O-DMR包含表2中所示的全部差异甲基化区域。
6.权利要求1-5任一项所述的方法,所述方法还包括基于所获得的C-DMR和O-DMR的甲基化水平确定所述待测样品中母源DNA污染比例;
优选地,所述方法还包括以下步骤:
-使用以下公式计算颗粒细胞来源DNA在样品中的比例(Pk1)和极体细胞来源DNA在样品中的比例(Pk2):
其中,k1-k3表示组分,其分别为颗粒细胞、极体细胞、囊胚;C表示C-DMR,O表示O-DMR;Pk1、Pk2、Pk3分别表示颗粒细胞来源、极体细胞来源、囊胚来源的DNA在样品中的比例;
代表所测得的C-DMR的平均甲基化水平; 分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均甲基化水平参考值;aC/k1、aC/k2、aC/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述C-DMR的平均PCR扩增效率;
代表所测得的O-DMR的平均甲基化水平; 分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均甲基化水平参考值;aO/k1、aO/k2、aO/k3为校正因子,分别表示颗粒细胞、极体细胞、囊胚中所述O-DMR的平均PCR扩增效率;
-使用以下公式计算母源DNA污染比例:P母源污染=Pk1+Pk2。
8.权利要求6或7所述的方法,其中:
9.权利要求6或7所述的方法,其中:
10.权利要求1-9任一项所述的方法,其中,所述待测样品是囊胚培养液。
11.一种使用囊胚培养液进行植入前非整倍体遗传检测的方法,所述方法包括:
-获得囊胚培养液的甲基化测序数据;
-基于所述甲基化测序数据获得目标区域的拷贝数,所述目标区域选自所关注的染色体、亚染色体区、基因组上局部区域或其任意组合;
-使用权利要求1-10任一项所述的方法获得所述囊胚培养液中的母源DNA污染比例;其中,所述获得目标区域的拷贝数与所述获得母源DNA污染比例可以以任意顺序或同时进行;
-使用所述母源DNA污染比例对所获得的目标区域的拷贝数和/或其嵌合程度进行校正;
-基于校正后的数据诊断染色体非整倍体性和/或其嵌合程度、和/或亚染色体区和/或基因组上局部区域的拷贝数变异和/或其嵌合程度。
12.能够测定颗粒细胞特异性差异甲基化区域(C-DMR)和卵母细胞/极体细胞特异性差异甲基化区域(O-DMR)的甲基化水平的试剂在制备用于植入前非整倍体遗传检测的试剂盒中的用途;其中,所述C-DMR和O-DMR如权利要求1-5任一项中定义;
优选地,所述试剂盒通过权利要求11所述的方法进行植入前非整倍体遗传检测。
13.计算机可读介质,其包括多个控制计算系统的指令,所述多个指令用于控制计算系统执行权利要求1-10任一项所述的方法,以便进行评估包含胚胎游离DNA的待测样品中母源DNA污染比例的操作。
14.计算机可读介质,其包括多个控制计算系统的指令,所述多个指令用于控制计算系统执行权利要求11所述的方法,以便进行基于囊胚培养液的植入前非整倍体遗传检测的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423585.8A CN115216545A (zh) | 2021-04-20 | 2021-04-20 | 用于无创植入前非整倍体遗传检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423585.8A CN115216545A (zh) | 2021-04-20 | 2021-04-20 | 用于无创植入前非整倍体遗传检测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115216545A true CN115216545A (zh) | 2022-10-21 |
Family
ID=83604268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110423585.8A Pending CN115216545A (zh) | 2021-04-20 | 2021-04-20 | 用于无创植入前非整倍体遗传检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115216545A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115678964A (zh) * | 2022-11-08 | 2023-02-03 | 广州女娲生命科技有限公司 | 基于胚胎培养液的植入前胚胎的无创筛选方法 |
CN115910211A (zh) * | 2022-12-15 | 2023-04-04 | 广州女娲生命科技有限公司 | 胚胎植入前dna分析检测方法及装置 |
CN118043478A (zh) * | 2023-10-20 | 2024-05-14 | 北京昌平实验室 | 用于可靠的无创胚胎植入前基因检测的方法 |
WO2024140368A1 (zh) * | 2022-12-26 | 2024-07-04 | 广州燃石医学检验所有限公司 | 一种样本交叉污染的检测方法和装置 |
-
2021
- 2021-04-20 CN CN202110423585.8A patent/CN115216545A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115678964A (zh) * | 2022-11-08 | 2023-02-03 | 广州女娲生命科技有限公司 | 基于胚胎培养液的植入前胚胎的无创筛选方法 |
WO2024098448A1 (zh) * | 2022-11-08 | 2024-05-16 | 广州女娲生命科技有限公司 | 基于胚胎培养液的植入前胚胎的无创筛选方法 |
CN115910211A (zh) * | 2022-12-15 | 2023-04-04 | 广州女娲生命科技有限公司 | 胚胎植入前dna分析检测方法及装置 |
CN115910211B (zh) * | 2022-12-15 | 2024-03-22 | 广州女娲生命科技有限公司 | 胚胎植入前dna分析检测方法及装置 |
WO2024140368A1 (zh) * | 2022-12-26 | 2024-07-04 | 广州燃石医学检验所有限公司 | 一种样本交叉污染的检测方法和装置 |
CN118043478A (zh) * | 2023-10-20 | 2024-05-14 | 北京昌平实验室 | 用于可靠的无创胚胎植入前基因检测的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11286530B2 (en) | Methods for simultaneous amplification of target loci | |
US11519035B2 (en) | Methods for simultaneous amplification of target loci | |
US11332793B2 (en) | Methods for simultaneous amplification of target loci | |
US11939634B2 (en) | Methods for simultaneous amplification of target loci | |
AU2012385961B2 (en) | Highly multiplex PCR methods and compositions | |
AU2011358564B2 (en) | Methods for non-invasive prenatal ploidy calling | |
US20130196862A1 (en) | Informatics Enhanced Analysis of Fetal Samples Subject to Maternal Contamination | |
CN115216545A (zh) | 用于无创植入前非整倍体遗传检测的方法 | |
KR20180123020A (ko) | 카피수 변이를 판정하기 위한 dna 단편 크기의 사용 | |
US20220411875A1 (en) | Methods for simultaneous amplification of target loci | |
WO2013130848A1 (en) | Informatics enhanced analysis of fetal samples subject to maternal contamination | |
US20220356526A1 (en) | Methods for simultaneous amplification of target loci | |
US20240068031A1 (en) | Methods for simultaneous amplification of target loci | |
CN115472223A (zh) | 甲基化测序数据分析方法 | |
US20240158855A1 (en) | Methods for simultaneous amplification of target loci |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |