CN117116344B - 一种单细胞水平pmp22重复变异的检测系统和方法 - Google Patents
一种单细胞水平pmp22重复变异的检测系统和方法 Download PDFInfo
- Publication number
- CN117116344B CN117116344B CN202311385076.6A CN202311385076A CN117116344B CN 117116344 B CN117116344 B CN 117116344B CN 202311385076 A CN202311385076 A CN 202311385076A CN 117116344 B CN117116344 B CN 117116344B
- Authority
- CN
- China
- Prior art keywords
- sample
- pmp22
- embryo
- region
- amplification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 101001000631 Homo sapiens Peripheral myelin protein 22 Proteins 0.000 title claims abstract description 143
- 101001082860 Homo sapiens Peroxisomal membrane protein 2 Proteins 0.000 title claims abstract description 140
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 102100030564 Peroxisomal membrane protein 2 Human genes 0.000 title claims abstract 22
- 238000000034 method Methods 0.000 title claims description 37
- 210000001161 mammalian embryo Anatomy 0.000 claims abstract description 142
- 238000012163 sequencing technique Methods 0.000 claims abstract description 87
- 238000012937 correction Methods 0.000 claims abstract description 49
- 238000010276 construction Methods 0.000 claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000013412 genome amplification Methods 0.000 claims abstract description 26
- 238000001914 filtration Methods 0.000 claims abstract description 25
- 210000004027 cell Anatomy 0.000 claims description 107
- 230000003321 amplification Effects 0.000 claims description 94
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 94
- 239000011259 mixed solution Substances 0.000 claims description 40
- 230000006037 cell lysis Effects 0.000 claims description 32
- 238000001574 biopsy Methods 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 108091005804 Peptidases Proteins 0.000 claims description 14
- 239000004365 Protease Substances 0.000 claims description 14
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims description 14
- 239000007853 buffer solution Substances 0.000 claims description 14
- 230000002068 genetic effect Effects 0.000 claims description 14
- 210000002459 blastocyst Anatomy 0.000 claims description 12
- 238000011144 upstream manufacturing Methods 0.000 claims description 12
- 235000013601 eggs Nutrition 0.000 claims description 11
- 210000002308 embryonic cell Anatomy 0.000 claims description 10
- 230000009089 cytolysis Effects 0.000 claims description 9
- 238000002347 injection Methods 0.000 claims description 8
- 239000007924 injection Substances 0.000 claims description 8
- 108020004414 DNA Proteins 0.000 claims description 7
- 238000012408 PCR amplification Methods 0.000 claims description 7
- 238000001976 enzyme digestion Methods 0.000 claims description 7
- 238000013467 fragmentation Methods 0.000 claims description 7
- 238000006062 fragmentation reaction Methods 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 7
- 239000000243 solution Substances 0.000 claims description 7
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000002864 sequence alignment Methods 0.000 claims description 6
- 210000002993 trophoblast Anatomy 0.000 claims description 6
- 241000282412 Homo Species 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 108700023863 Gene Components Proteins 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 230000000415 inactivating effect Effects 0.000 claims description 4
- 238000012800 visualization Methods 0.000 abstract description 5
- 238000003860 storage Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 167
- 102100035917 Peripheral myelin protein 22 Human genes 0.000 description 122
- 201000009009 Charcot-Marie-Tooth disease type 1A Diseases 0.000 description 18
- 210000002257 embryonic structure Anatomy 0.000 description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 101150038744 PMP22 gene Proteins 0.000 description 8
- 230000035772 mutation Effects 0.000 description 7
- 230000001717 pathogenic effect Effects 0.000 description 7
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 6
- 210000000625 blastula Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 102000054766 genetic haplotypes Human genes 0.000 description 5
- 201000000585 muscular atrophy Diseases 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 108091092878 Microsatellite Proteins 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 210000003414 extremity Anatomy 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 3
- 210000005259 peripheral blood Anatomy 0.000 description 3
- 239000011886 peripheral blood Substances 0.000 description 3
- 208000016192 Demyelinating disease Diseases 0.000 description 2
- 206010012305 Demyelination Diseases 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 206010028289 Muscle atrophy Diseases 0.000 description 2
- 206010040030 Sensory loss Diseases 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 210000002414 leg Anatomy 0.000 description 2
- 210000003141 lower extremity Anatomy 0.000 description 2
- 230000020763 muscle atrophy Effects 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 241000234282 Allium Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 206010062346 Congenital neuropathy Diseases 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 206010061159 Foot deformity Diseases 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 101710199257 Peripheral myelin protein 22 Proteins 0.000 description 1
- 206010036105 Polyneuropathy Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000001217 buttock Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 210000003007 myelin sheath Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000007830 nerve conduction Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000007171 neuropathology Effects 0.000 description 1
- 208000035824 paresthesia Diseases 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000007824 polyneuropathy Effects 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 208000026526 progressive weakness Diseases 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Ecology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Physiology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种单细胞水平PMP22重复变异的检测系统和方法,该系统包括胚胎单细胞样本的获取及储存单元、全基因组扩增单元、文库构建及二代测序单元、单细胞数据的过滤和比对单元、胚胎PMP22区域正常2拷贝数参考系构建单元和待测样本PMP22区域拷贝数判断单元;待测样本PMP22区域拷贝数判断单元用于统计待测样本参考基因组窗口中PMP22区域的比对读段数,计算待测样本矫正后每个窗口的测序深度,将待测样本与胚胎PMP22区域正常2拷贝数参考系进行样本合并和样本间矫正,得到最终用于分析的窗口读段数,判断待测样本PMP22区域拷贝数并进行可视化。
Description
技术领域
本发明涉及基因检测技术领域,具体涉及一种单细胞水平PMP22重复变异的检测系统和方法。
背景技术
腓骨肌萎缩症(Charcot-Marie-Tooth disease,CMT)是最常见的遗传性周围神经病,具有较高临床表型和遗传异质性,主要临床症状为对称性肢体远端肌肉进行性无力、萎缩,以及感觉缺失等。CMT疾病的全球发病率为1/2500-1/10000。其中,腓骨肌萎缩症1A型(Charcot-Marie-Tooth disease 1A,CMT1A)(OMIM:118220)是最常见的CMT疾病亚型,约占所有确诊CMT病例的50%。CMT1A患者的临床症状个体差异较大,典型临床表现通常在10-20岁出现,包括足部畸形、肢体远端无力及肌肉萎缩、下肢先于上肢受累且下肢症状更明显、行走和跑步困难等。CMT1A疾病的神经电生理特征为神经传导速度降低,神经活检病理学显示为脱髓鞘、运动和感觉神经“洋葱头”样改变。目前,CMT1A患者的临床诊断主要依赖于体格检查、电生理检查以及结合家族史评估。
随着分子诊断技术的发展和对发病机制研究的深入,CMT1A的致病基因得以被发现。约98%的CMT1A病例是由于17号染色体p11.2-12区域1.4Mb重复引起,该染色体区域内包含外周髓鞘蛋白22(Peripheral myelin protein 22,PMP22)基因。PMP22基因编码一种22KDa的固有四跨膜糖蛋白,参与施万细胞的生长、分化、髓鞘组装和厚度维持等关键生物学过程。PMP22基因重复会引起PMP22蛋白在细胞内质网聚集,最终导致施万细胞凋亡和脱髓鞘。CMT1A呈现常染色体显性遗传模式,患者一般存在多发性神经病家族史,伴有慢性运动障碍和感觉异常。但约10%的CMT1A患者为新发患病,或其家系成员表现为无症状。基因诊断有助于诊断亚型、指导治疗、促进遗传咨询、以及实现后代遗传学阻断。目前对于CMT1A疾病尚无有效的治疗方法。虽然CMT1A病程进展缓慢,但患者会逐渐出现感觉缺失、手足和腿部肌肉萎缩,最终只能依赖轮椅,不仅降低了患者的生活质量,同时也给家庭带来了负担。
对于该疾病家庭来说,单基因病胚胎着床前遗传学检测(preimplantationgenetic testing for monogenic defects,PGT-M)是一种有效的方式,能够阻断PMP22重复变异向后代传递。PGT-M是在经过卵胞浆内单精子注射、胚胎活检和致病变异检测后,筛选不携带致病变异的胚胎移植到子宫进行妊娠,以确保生育健康的后代。与产前诊断相比,PGT-M可避免孕妇因胎儿携带PMP22重复变异而终止妊娠时遭受生理和心理上的双重痛苦。
成人中PMP22重复的传统检测方法包括荧光原位杂交(fluorescence in situhybridization,FISH)、限制性片段长度多态性聚合酶链反应(restriction fragmentlength polymorphism PCR,RFLP-PCR)、竞争性多重PCR和多重连接依赖性探针扩增(multiplex ligation-dependent probe amplification,MLPA)。由于检测起始量的要求,上述方法均不适用于胚胎水平(单细胞水平)的检测。目前胚胎PMP22重复的检测只能依靠STR(short tandem repeat,短串联重复序列)/ SNP(single nucleotide polymorphism,单核苷酸多态性)进行连锁分析来诊断,而不是直接检测胚胎中PMP22区域的拷贝数。连锁分析需要阳性家系成员外周血样本用于构建突变单倍型,因而连锁分析的方法不适用于新发CMT1A患者家系。此外,如果突变内或突变附近的染色体发生交换均会影响连锁分析的准确性,最终可能导致放弃不受累的胚胎。PMP22重复连锁分析也可能会受到3拷贝的干扰、分辨率低以及误诊率高的影响。
综上所述,现有技术的缺点包括:
1.目前已有的对于胚胎中PMP22基因重复的检测均依赖于连锁分析,而不是直接检测胚胎中PMP22区域的拷贝数。FISH和MPLA技术是成人中PMP22重复遗传诊断的方法,但由于获得来源于胚胎的遗传物质少,无法通过上述两种方法进行检测。
2. 连锁分析需要阳性家系成员外周血样本用于构建突变单倍型,因而连锁分析的方法不适用于新发CMT1A患者家系。
3. 如果突变内或突变附近发生染色体交换会使诊断不准确,最终可能导致放弃未携带致病突变的胚胎。
4. PMP22重复的家系连锁分析也可能会受到3拷贝的干扰,或者由于分辨率低导致较高误诊率。
总体来说,仅靠连锁分析诊断胚胎中的PMP22重复的方法仍存在较多问题。本申请旨在发明一种新的技术和分析方法,可直接检测目标1.4Mb区域的拷贝数。与现有方法相比,这种基于下一代测序(next generation sequencing,NGS)的方法简单、可靠并且无需额外的实验步骤。
发明内容
本发明旨在提供一种非治疗和诊断目的的单细胞水平PMP22重复变异的检测系统和方法,所要解决的技术问题至少包括如何直接检测胚胎中PMP22区域的拷贝数。
为了实现上述目的,本发明提供一种单细胞水平PMP22重复变异的检测系统,包括本发明还提出一种单细胞水平PMP22重复变异的检测系统,包括胚胎单细胞样本的获取及储存单元、全基因组扩增单元、文库构建及二代测序单元、单细胞数据的过滤和比对单元、胚胎PMP22区域正常2拷贝数参考系构建单元和待测样本PMP22区域拷贝数判断单元,
所述的胚胎单细胞样本的获取及储存单元用于获得受精卵,培养至囊胚期,对囊胚进行外滋养层细胞活检,每个囊胚获得3至5个细胞作为后续遗传学检测的样本;将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存;
所述的全基因组扩增单元用于使用MALBAC方法对胚胎细胞样本进行全基因组扩增;所述的全基因组扩增包括样本裂解、线性扩增、指数扩增和产物纯化;
所述的文库构建及二代测序单元用于将经过产物纯化的胚胎细胞样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复和加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库;将构建好的二代文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb,下机后得到每个胚胎细胞样本的测序reads数据;
所述的单细胞数据的过滤和比对单元用于进行数据过滤和序列比对;
所述的胚胎PMP22区域正常2拷贝数参考系构建单元用于构建胚胎PMP22区域正常2拷贝数参考系;
所述的待测样本PMP22区域拷贝数判断单元用于统计待测样本参考基因组窗口中PMP22区域的比对读段数,计算待测样本矫正后每个窗口的测序深度,将待测样本与胚胎PMP22区域正常2拷贝数参考系进行样本合并和样本间矫正,得到最终用于分析的窗口读段数,判断待测样本PMP22区域拷贝数并进行可视化。
优选地,所述的胚胎单细胞样本的获取及储存单元用于通过卵胞浆内单精子注射的方式获得受精卵。
优选地,所述的样本裂解具体包括:制备细胞裂解混合液,所述的细胞裂解混合液中包含细胞裂解液和蛋白酶,在胚胎细胞样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃的细胞裂解1.5h和80℃的失活蛋白酶10min;
优选地,所述的线性扩增具体包括:在裂解后的胚胎细胞样本中加入预扩增混合液,所述的预扩增混合液中包含预扩增缓冲液和扩增酶,进行线性扩增。
优选地,所述的指数扩增具体包括:向线性扩增后的胚胎细胞样本中加入扩增混合液,所述的扩增混合液中包含扩增缓冲液和扩增酶,进行指数式扩增。
优选地,所述的产物纯化具体包括:将经过指数扩增后所得的产物进行纯化后于-20℃保存。
优选地,所述的illumina测序仪进行双端150bp测序时,平均每个样本测序深度不低于基因组的2倍。
优选地,所述的数据过滤具体包括:使用trim_galore软件对测序reads数据进行过滤,去除测序数据两端的接头序列和低质量碱基,并且仅保留序列长度>36bp的测序reads数据;
优选地,所述的序列比对具体包括:使用BWA软件,将经过数据过滤后得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段。
优选地,所述的构建胚胎PMP22区域正常2拷贝数参考系具体包括:选取100个已知PMP22区域正常的胚胎样本,统计其PMP22区域及其上下游2Mb组成的5.4Mb区域中的参考基因组窗口中的比对读段数:以100Kb的分辨率,将该5.4Mb区域中的基因组分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
使用samtools软件统计每个胚胎细胞样本x比对的总碱基数,计算每个胚胎细胞样本x的测序深度depthx:
;
其中Nmapx为胚胎细胞样本x在该5.4Mb区域中检测到的碱基数,L为该5.4M区域中人类参考基因组碱基数;
因此,每个胚胎细胞样本x的每个窗口y经测序深度矫正后的读段数为Cdepx,y :
;
其中conuntsx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数;
样本间矫正:完成每个胚胎细胞样本的测序深度矫正后进行样本间矫正,样本间归一化因子表示为Nory:
;
其中Cdepx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数,N为样本个数;
因此,在胚胎细胞样本x的窗口y上,经测序深度以及多样本间矫正后的读段数Cadjx,y为:
;
由于人类为二倍体,上述矫正得到的读段数乘以2为最终拷贝数,即最终用于分析的窗口读段数Cx,y =2 Cadjx,y ;
划分PMP22正常拷贝数阈值:分析100个已知PMP22区域正常的胚胎样本中PMP22区域的拷贝数;对于每个窗口y来说,初步确定1.4 < Cx,y <2.6 为正常范围,即拷贝数1.4和2.6为临界阈值。
优选地,所述的统计待测样本参考基因组窗口中PMP22区域的比对读段数具体包括:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数。
优选地,所述的判断待测样本PMP22区域拷贝数并进行可视化具体包括:在PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y ≥ 2.6,即判定为PMP22区域3拷贝,即重复;根据Cx,y的分布情况,绘制待测样本的拷贝数CNV图。
本发明还提出一种单细胞水平PMP22重复变异的检测方法,包括以下步骤:
S1:胚胎单细胞样本的获取及储存:
通过卵胞浆内单精子注射的方式获得受精卵,培养至囊胚期,对囊胚进行外滋养层细胞活检,每个囊胚获得3-5个细胞作为后续遗传学检测的样本;将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存;
S2:全基因组扩增:
使用MALBAC方法对胚胎细胞样本进行全基因组扩增,根据单细胞全基因组扩增试剂盒说明书进行;
S2-1:样本裂解:制备细胞裂解混合液,所述的细胞裂解混合液中包含细胞裂解液和蛋白酶,在胚胎细胞样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃的细胞裂解1.5h和80℃的失活蛋白酶10min;
S2-2:线性扩增:在裂解后的胚胎细胞样本中加入预扩增混合液,所述的预扩增混合液中包含预扩增缓冲液和扩增酶,进行线性扩增;
S2-3:指数扩增:向线性扩增后的胚胎细胞样本中加入扩增混合液,所述的扩增混合液中包含扩增缓冲液和扩增酶,进行指数式扩增;
S2-4:产物纯化:将经过指数扩增后所得的产物进行纯化后于-20℃保存:
S3:文库构建及二代测序:
首先将经过产物纯化的胚胎细胞样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复和加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库;将构建好的二代文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb,下机后得到每个胚胎细胞样本的测序reads数据;
S4:单细胞数据的过滤和比对:
S4-1:数据过滤:使用trim_galore软件对测序reads数据进行过滤,去除测序数据两端的接头序列和低质量碱基,并且仅保留序列长度>36bp的测序reads数据;
S4-2:序列比对:使用BWA软件,将步骤S4-1中得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段;
S5:构建胚胎PMP22区域正常2拷贝数参考系:
S5-1:选取100个已知PMP22区域正常的胚胎样本,统计其PMP22区域及其上下游2Mb区域组成的5.4Mb区域中的参考基因组窗口中的比对读段数:以100Kb的分辨率,将该5.4Mb区域中的基因组分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S5-2:测序深度矫正:使用samtools软件统计每个胚胎细胞样本x比对的总碱基数,计算每个胚胎细胞样本x的测序深度depthx:
;
其中Nmapx为胚胎细胞样本x在该5.4Mb区域中检测到的碱基数,L为该5.4Mb区域中人类参考基因组碱基数;
因此,每个胚胎细胞样本x的每个窗口y经测序深度矫正后的读段数为Cdepx,y :
;
其中conuntsx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数;
S5-3:样本间矫正:完成每个胚胎细胞样本的测序深度矫正后进行样本间矫正,样本间归一化因子表示为Nory:
;
其中Cdepx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数,N为样本个数;
因此,在胚胎细胞样本x的窗口y上,经测序深度以及多样本间矫正后的读段数Cadjx,y为:
;
由于人类为二倍体,上述矫正得到的读段数乘以2为最终拷贝数,即最终用于分析的窗口读段数Cx,y =2Cadjx,y ;
S5-4:划分PMP22正常拷贝数阈值:分析100个已知PMP22区域正常的胚胎样本中PMP22区域的拷贝数,对于每个窗口y来说,初步确定1.4 < Cx,y <2.6 为正常范围,即拷贝数1.4和2.6为临界阈值;
S6:待测样本PMP22区域拷贝数判断:
S6-1:统计待测样本参考基因组窗口中PMP22区域的比对读段数:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S6-2:测序深度矫正:应用步骤S5-2中的方法,计算待测样本矫正后每个窗口的测序深度;
S6-3:样本间矫正:将待测样本与胚胎PMP22区域正常2拷贝数参考系进行样本合并,参考步骤S5-3进行样本间矫正,得到最终用于分析的窗口读段数;
S6-4:待测样本PMP22区域拷贝数判断及可视化:PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y ≥ 2.6,即判定为PMP22区域3拷贝,即重复;根据Cx,y的分布情况,绘制待测样本的拷贝数CNV图。
有益效果
与现有技术相比,本发明的有益效果是:
本发明提供了一种单细胞水平针对PMP22重复变异的检测系统和分析方法,可直接检测目标1.4Mb区域的拷贝数。与现有技术中的方法相比,这种基于NGS的方法简单、可靠、无需额外的实验步骤,并且适用于所有因PMP22重复导致CMT1A疾病的患者,不受需要阳性家系成员用于构建单倍型的限制。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的具体实施方式一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是100个正常样本中PMP22区域的拷贝数分布示意图。
图2a是实施例一中胚胎1的检测结果示意图。
图2b是实施例一中胚胎2的检测结果示意图。
图2c是实施例一中胚胎3的检测结果示意图。
图3a是实施例二中胚胎1的检测结果示意图。
图3b是实施例二中胚胎2的检测结果示意图。
图3c是实施例二中胚胎3的检测结果示意图。
具体实施方式
在下文中更详细地描述了本发明以有助于对本发明的理解。
目前现有技术中针对胚胎中PMP22基因重复的检测均依赖于STR/SNP连锁分析,而不是直接检测胚胎中PMP22区域的拷贝数。连锁分析需要阳性家系成员外周血样本用于构建突变单倍型,因而连锁分析的方法不适用于新发CMT1A患者家系。此外,如果突变内或突变附近的染色体交换会使诊断不准确,最终可能导致放弃未携带致病突变的胚胎。PMP22重复连锁分析也可能会受到3拷贝的干扰、分辨率低以及误诊率高的影响。
为了解决以上问题,本发明提出一种单细胞水平PMP22重复变异的检测方法,包括以下步骤:
S1:胚胎单细胞样本的获取及储存:
通过卵胞浆内单精子注射的方式获得受精卵,培养至囊胚期(Day5或Day6),对囊胚进行外滋养层细胞活检,每个囊胚获得约3至5个细胞作为后续遗传学检测的样本。将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存;
S2:全基因组扩增:
使用MALBAC方法对胚胎细胞样本进行全基因组扩增,根据单细胞全基因组扩增试剂盒说明书进行;
S2-1:样本裂解:制备细胞裂解混合液(包含细胞裂解液和蛋白酶),在胚胎细胞样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃(1.5h)的细胞裂解和80℃(10min)失活蛋白酶;
S2-2:线性扩增:在裂解后的胚胎细胞样本中加入预扩增混合液(包含预扩增缓冲液和扩增酶),进行线性扩增;
S2-3:指数扩增:线性扩增之后向步骤S2-2中线性扩增后的胚胎细胞样本中加入扩增混合液(包含扩增缓冲液和扩增酶),进行指数式扩增;
S2-4:产物纯化:将步骤S2-3中所得的产物进行纯化后于-20℃保存;
S3:文库构建及二代测序:
首先将步骤S2-4中经过产物纯化的胚胎细胞样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复/加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库。将构建好的二代文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb(平均每个样本测序深度不低于基因组的2倍),下机后得到每个样本的测序reads数据;
S4:单细胞数据的过滤和比对:
S4-1:数据过滤:使用trim_galore软件对测序reads数据进行过滤,去除测序数据两端的接头序列、低质量碱基,并且仅保留序列长度>36bp的reads;
S4-2:序列比对:使用BWA软件,将步骤S4-1中得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段;
S5:构建胚胎PMP22区域正常2拷贝数参考系:
S5-1:选取100个已知PMP22区域正常的胚胎样本,统计其PMP22区域(1.4Mb,chr7:14200001-15500000)及其上下游2Mb参考基因组窗口中的比对读段数:以100Kb的分辨率,将该区域基因组(5.4Mb)分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S5-2:测序深度矫正:使用samtools软件统计每个胚胎细胞样本x比对的总碱基数,计算每个胚胎细胞样本x的测序深度depthx:
;
其中Nmapx为胚胎细胞样本x在该5.4Mb区域中检测到的碱基数,L为该5.4M区域中人类参考基因组碱基数;
因此,每个胚胎细胞样本x的每个窗口y经测序深度矫正后的读段数为Cdepx,y :
;
其中conuntsx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数;
S5-3:样本间矫正:完成每个胚胎细胞样本的测序深度矫正后进行样本间矫正,样本间归一化因子表示为Nory:
;
其中Cdepx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数,N为样本个数;
因此,在胚胎细胞样本x的窗口y上,经测序深度以及多样本间矫正后的读段数Cadjx,y为:
;
由于人类为二倍体,上述矫正得到的读段数乘以2为最终拷贝数,即最终用于分析的窗口读段数Cx,y = 2Cadjx,y ;
S5-4:划分PMP22正常拷贝数阈值:分析100个已知PMP22区域正常的胚胎样本中,PMP22区域的拷贝数,其拷贝数分布如图1所示。对于每个窗口y来说,初步确定1.4 < Cx,y<2.6 为正常范围,即拷贝数1.4和2.6为临界阈值;
S6:待测样本PMP22区域拷贝数判断:
S6-1:统计待测样本参考基因组窗口中PMP22区域的比对读段数:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域(共5.4M)分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S6-2:测序深度矫正:应用步骤S5-2中的方法,计算待测样本矫正后每个窗口的测序深度;
S6-3:样本间矫正:将待测样本与参考系(PMP22正常2拷贝)样本合并,参考步骤S5-3进行样本间矫正,得到最终用于分析的窗口读段数;
S6-4:待测样本PMP22区域拷贝数判断及可视化:PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y ≥ 2.6,即可判定为PMP22区域3拷贝,即重复。根据Cx,y的分布情况,绘制待测样本的拷贝数(CNV)图。
本发明还提出一种单细胞水平PMP22重复变异的检测系统,包括胚胎单细胞样本的获取及储存单元、全基因组扩增单元、文库构建及二代测序单元、单细胞数据的过滤和比对单元、胚胎PMP22区域正常2拷贝数参考系构建单元和待测样本PMP22区域拷贝数判断单元;
所述的胚胎单细胞样本的获取及储存单元用于获得受精卵,培养至囊胚期,对囊胚进行外滋养层细胞活检,每个囊胚获得3至5个细胞作为后续遗传学检测的样本;将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存;
所述的全基因组扩增单元用于使用MALBAC方法对胚胎细胞样本进行全基因组扩增;所述的全基因组扩增包括样本裂解、线性扩增、指数扩增和产物纯化;
所述的文库构建及二代测序单元用于将经过产物纯化的胚胎细胞样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复和加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库;将构建好的二代文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb,下机后得到每个胚胎细胞样本的测序reads数据;
所述的单细胞数据的过滤和比对单元用于进行数据过滤和序列比对;
所述的胚胎PMP22区域正常2拷贝数参考系构建单元用于构建胚胎PMP22区域正常2拷贝数参考系;
所述的待测样本PMP22区域拷贝数判断单元用于统计待测样本参考基因组窗口中PMP22区域的比对读段数,计算待测样本矫正后每个窗口的测序深度,将待测样本与胚胎PMP22区域正常2拷贝数参考系进行样本合并和样本间矫正,得到最终用于分析的窗口读段数,判断待测样本PMP22区域拷贝数并进行可视化。
优选地,所述的胚胎单细胞样本的获取及储存单元用于通过卵胞浆内单精子注射的方式获得受精卵。
优选地,所述的样本裂解具体包括:制备细胞裂解混合液,所述的细胞裂解混合液中包含细胞裂解液和蛋白酶,在胚胎细胞样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃的细胞裂解1.5h和80℃的失活蛋白酶10min;
优选地,所述的线性扩增具体包括:在裂解后的胚胎细胞样本中加入预扩增混合液,所述的预扩增混合液中包含预扩增缓冲液和扩增酶,进行线性扩增。
优选地,所述的指数扩增具体包括:向线性扩增后的胚胎细胞样本中加入扩增混合液,所述的扩增混合液中包含扩增缓冲液和扩增酶,进行指数式扩增。
优选地,所述的产物纯化具体包括:将经过指数扩增后所得的产物进行纯化后于-20℃保存。
优选地,所述的illumina测序仪进行双端150bp测序时,平均每个样本测序深度不低于基因组的2倍。
优选地,所述的构建胚胎PMP22区域正常2拷贝数参考系具体包括:选取100个已知PMP22区域正常的胚胎样本,统计其PMP22区域及其上下游2Mb参考基因组窗口中的比对读段数:以100Kb的分辨率,将该区域基因组分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
使用samtools软件统计每个胚胎细胞样本x比对的总碱基数,计算每个胚胎细胞样本x的测序深度depthx:
;
其中Nmapx为胚胎细胞样本x在该5.4Mb区域中检测到的碱基数,L为该5.4Mb区域中人类参考基因组碱基数;
因此,每个胚胎细胞样本x的每个窗口y经测序深度矫正后的读段数为Cdepx,y :
;
其中conuntsx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数;
样本间矫正:完成每个胚胎细胞样本的测序深度矫正后进行样本间矫正,样本间归一化因子表示为Nory:
;
其中Cdepx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数,N为样本个数;
因此,在胚胎细胞样本x的窗口y上,经测序深度以及多样本间矫正后的读段数Cadjx,y为:
;
由于人类为二倍体,上述矫正得到的读段数乘以2为最终拷贝数,即最终用于分析的窗口读段数Cx,y =2Cadjx,y ;
划分PMP22正常拷贝数阈值:分析100个已知PMP22区域正常的胚胎样本中PMP22区域的拷贝数;对于每个窗口y来说,初步确定1.4 < Cx,y <2.6 为正常范围,即拷贝数1.4和2.6为临界阈值。
优选地,所述的统计待测样本参考基因组窗口中PMP22区域的比对读段数具体包括:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数。
优选地,所述的判断待测样本PMP22区域拷贝数并进行可视化具体包括:在PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y ≥ 2.6,即判定为PMP22区域3拷贝,即重复;根据Cx,y的分布情况,绘制待测样本的拷贝数CNV图。
下面通过两个具体实施例进一步详细说明本发明所述的单细胞水平PMP22重复变异的检测方法。
实施例一:
该家系女方、女方弟弟、女方母亲和女方外公均为CMT1A疾病患者;其中女方症状最严重,表现为行走不顺、肢体末端肌肉萎缩,累及腿部、臀部和左侧小臂,而家系中其他成员症状相对较轻。经检测女方携带PMP22基因重复突变,男方未携带该基因突变。男女双方通过PGT-M进行CMT1A疾病的阻断。
S1:胚胎单细胞样本的获取及储存:
通过卵胞浆内单精子注射的方式获得8枚受精卵,其中共有3枚胚胎培养至囊胚期(胚胎1、胚胎2和胚胎3),进行外滋养层细胞活检,每个囊胚获得约3至5个细胞作为后续遗传学检测的样本。将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存。
S2:胚胎活检样本的全基因组扩增:
使用MALBAC方法对3枚胚胎的活检样本进行全基因组扩增,根据单细胞全基因组扩增试剂盒说明书进行。
S2-1:样本裂解:制备细胞裂解混合液(包含细胞裂解液和蛋白酶),在样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃(1.5h)的细胞裂解和80℃(10min)失活蛋白酶;
S2-2:线性扩增:在裂解后细胞样本中加入预扩增混合液(包含预扩增缓冲液和扩增酶),进行线性扩增;
S2-3:指数扩增:线性扩增之后向S2-2中加入扩增混合液(包含扩增缓冲液和扩增酶),进行指数式扩增;
S2-4:产物纯化:将S2-3所得产物进行纯化后于-20℃保存;
S3:文库构建及二代测序:
首先将S2-4中样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复/加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库。将构建好的文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb(平均每个样本测序深度不低于基因组的2倍),下机后得到每个样本的测序reads数据;
S4:下机数据的过滤和比对:
S4-1:数据过滤:使用trim_galore软件对数据进行过滤,去除测序数据两端的接头序列、低质量碱基,并且仅保留序列长度>36bp的reads;
S4-2:序列比对:使用BWA软件,将步骤S4-1中得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段;
S5:胚胎PMP22区域正常2拷贝数参考系:
用上述S5中的胚胎PMP22区域正常2拷贝数参考系样本作为对照,与待测样本一同进行后续样本间校正。
S6:待测样本PMP22区域拷贝数判断:
S6-1:统计待测样本参考基因组窗口中PMP22区域的比对读段数:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域(共5.4M)分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S6-2:测序深度矫正:应用上述S5-2中的方法,计算待测样本矫正后每个窗口的测序深度;
S6-3:样本间矫正:将待测样本与100个参考系(即前述S5中的胚胎PMP22区域正常2拷贝数参考系)样本合并,进行样本间矫正,得到最终用于分析的窗口读段数;
S6-4:待测样本在PMP22区域拷贝数的判断及可视化:PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y≥ 2.6,即可判定为PMP22区域3拷贝,即重复。根据Cx,y的分布情况,绘制待测样本胚胎1、胚胎2和胚胎3在PMP22区域的CNV图。该家系3枚胚胎的检测结果如图2a、图2b和图2c所示,胚胎1、3在PMP22区域的14个窗口均分布在1.4-2.6范围,提示该区域均为2拷贝,即该家系胚胎1、3均不携带致病变异;胚胎2在PMP22区域的14个窗口中,其中11个窗口(≥10个)的拷贝数>2.6,提示该区域为3拷贝,即该家系胚胎2携带PMP22重复变异。
实施例二:
该家系女方和女方父亲为CMT1A疾病患者,女方小时候发现为高足弓,逐渐发展为肌肉萎缩。经检测女方携带PMP22基因重复突变,男方未携带该基因突变。男女双方拟通过PGT-M进行CMT1A疾病的阻断。
S1:胚胎单细胞样本的获取及储存:
通过卵胞浆内单精子注射的方式获得8枚受精卵,其中共有3枚胚胎培养至囊胚期(胚胎1、胚胎2和胚胎3),进行外滋养层细胞活检,每个囊胚获得约3至5个细胞作为后续遗传学检测的样本。将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存。
S2:全基因组扩增:
使用MALBAC方法对3枚胚胎活检样本进行全基因组扩增,根据单细胞全基因组扩增试剂盒说明书进行。
S2-1:样本裂解:制备细胞裂解混合液(包含细胞裂解液和蛋白酶),在样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃(1.5h)的细胞裂解和80℃(10min)失活蛋白酶;
S2-2:线性扩增:在裂解后细胞样本中加入预扩增混合液(包含预扩增缓冲液和扩增酶),进行线性扩增;
S2-3:指数扩增:线性扩增之后向S2-2中加入扩增混合液(包含扩增缓冲液和扩增酶),进行指数式扩增;
S2-4:产物纯化:将S2-3所得产物进行纯化后于-20℃保存;
S3:文库构建及二代测序:
首先将S2-4中样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复/加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库。将构建好的文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb(平均每个样本测序深度不低于基因组的2倍),下机后得到每个样本的测序reads数据;
S4:单细胞数据的过滤和比对:
S4-1:数据过滤:使用trim_galore软件对数据进行过滤,去除测序数据两端的接头序列、低质量碱基,并且仅保留序列长度>36bp的reads;
S4-2:序列比对:使用BWA软件,将步骤S4-1中得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段;
S5:胚胎PMP22区域正常2拷贝数参考系:
用上述S5中的参考系样本作为对照,与待测样本一同进行后续样本间校正。
S6:待测样本PMP22区域拷贝数判断:
S6-1:统计待测样本参考基因组窗口中PMP22区域的比对读段数:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域(共5.4M)分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S6-2:测序深度矫正:应用上述S5-2中的方法,计算待测样本矫正后每个窗口的测序深度;
S6-3:样本间矫正:将待测样本与100个参考系(即前述S5中的胚胎PMP22区域正常2拷贝数参考系)样本合并,进行样本间矫正,得到最终用于分析的窗口读段数;
S6-4:待测样本在PMP22区域拷贝数的判断及可视化:PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y≥ 2.6,即可判定为PMP22区域3拷贝,即重复。根据Cx,y的分布情况,绘制待测样本胚胎1、胚胎2和胚胎3在PMP22区域的CNV图。该家系3枚胚胎的检测结果如图3a、图3b和图3c所示,胚胎1在PMP22区域的14个窗口中,其中10个窗口(≥10个)的拷贝数>2.6,提示该区域为3拷贝;胚胎2在PMP22区域的14个窗口中,其中12个窗口(≥10个)的拷贝数>2.6,提示该区域为3拷贝;即该家系胚胎1、2携带PMP22重复变异。胚胎3在PMP22区域14个窗口的拷贝数值均分布在1.4-2.6之间,提示该区域均为2拷贝,即该家系胚胎3不携带致病变异。
本发明的优点在于发明了一种单细胞水平针对PMP22重复变异的检测系统和分析方法,可直接检测目标1.4Mb区域的拷贝数。与现有方法相比,这种基于NGS的方法简单、可靠、无需额外的实验步骤,并且适用于所有因PMP22重复导致CMT1A疾病的患者,不受需要阳性家系成员用于构建单倍型的限制。
以上描述了本发明优选实施方式,然其并非用以限定本发明。本领域技术人员对在此公开的实施方案可进行并不偏离本发明范畴和精神的改进和变化。
Claims (1)
1.一种单细胞水平PMP22重复变异的检测方法,其特征在于,包括以下步骤:
S1:胚胎单细胞样本的获取及储存:
通过卵胞浆内单精子注射的方式获得受精卵,培养至囊胚期,对囊胚进行外滋养层细胞活检,每个囊胚获得3-5个细胞作为后续遗传学检测的样本;将活检得到的细胞样本收集于0.2mL PCR管中,于-80℃稳定储存;
S2:全基因组扩增:
使用MALBAC方法对胚胎细胞样本进行全基因组扩增,根据单细胞全基因组扩增试剂盒说明书进行;
S2-1:样本裂解:制备细胞裂解混合液,所述的细胞裂解混合液中包含细胞裂解液和蛋白酶,在胚胎细胞样本中加入细胞裂解混合液,放入预热的PCR仪中进行50℃的细胞裂解1.5h和80℃的失活蛋白酶10min;
S2-2:线性扩增:在裂解后的胚胎细胞样本中加入预扩增混合液,所述的预扩增混合液中包含预扩增缓冲液和扩增酶,依照单细胞全基因组扩增试剂盒说明书进行线性扩增;
S2-3:指数扩增:向线性扩增后的胚胎细胞样本中加入扩增混合液,所述的扩增混合液中包含扩增缓冲液和扩增酶,依照单细胞全基因组扩增试剂盒说明书进行指数式扩增;
S2-4:产物纯化:将经过指数扩增后所得的产物进行纯化后于-20℃保存:
S3:文库构建及二代测序:
首先将经过产物纯化的胚胎细胞样本进行DNA片段化到300bp大小,参照二代文库构建说明书依次进行末端修复和加dA尾、连接测序接头、酶切和PCR扩增,得到二代文库;将构建好的二代文库使用illumina测序仪进行双端150bp测序,平均每个样本数据量为8Gb,下机后得到每个胚胎细胞样本的测序reads数据;
S4:单细胞数据的过滤和比对:
S4-1:数据过滤:使用trim_galore软件对测序reads数据进行过滤,去除测序数据两端的接头序列和低质量碱基,并且仅保留序列长度>36bp的测序reads数据;
S4-2:序列比对:使用BWA软件,将步骤S4-1中得到的过滤后序列比对到人类参考基因组hg38;进一步使用samtools软件去除低比对质量序列和PCR过程产生的重复序列,得到唯一比对的去重读段;
S5:构建胚胎PMP22区域正常2拷贝数参考系:
S5-1:选取100个已知PMP22区域正常的胚胎样本,统计其PMP22区域及其上下游2Mb区域组成的5.4Mb区域中的参考基因组窗口中的比对读段数:以100Kb的分辨率,将该5.4Mb区域中的基因组分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S5-2:测序深度矫正:使用samtools软件统计每个胚胎细胞样本x比对的总碱基数,计算每个胚胎细胞样本x的测序深度depthx:
;
其中Nmapx为胚胎细胞样本x在该5.4Mb区域中检测到的碱基数,L为该5.4Mb区域中人类参考基因组碱基数;
因此,每个胚胎细胞样本x的每个窗口y经测序深度矫正后的读段数为Cdepx,y :
;
其中countsx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数;
S5-3:样本间矫正:完成每个胚胎细胞样本的测序深度矫正后进行样本间矫正,样本间归一化因子表示为Nory:
;
其中Cdepx,y为胚胎细胞样本x在基因组上第y个窗口比对上的读段数,N为样本个数;
因此,在胚胎细胞样本x的窗口y上,经测序深度以及多样本间矫正后的读段数Cadjx,y为:
;
由于人类为二倍体,上述矫正得到的读段数乘以2为最终拷贝数,即最终用于分析的窗口读段数Cx,y = 2Cadjx,y ;
S5-4:划分PMP22正常拷贝数阈值:分析100个已知PMP22区域正常的胚胎样本中PMP22区域的拷贝数,对于每个窗口y来说,初步确定1.4 < Cx,y <2.6 为正常范围,即拷贝数1.4和2.6为临界阈值;
S6:待测样本PMP22区域拷贝数判断:
S6-1:统计待测样本参考基因组窗口中PMP22区域的比对读段数:以100Kb为分辨率,将PMP22区域及其上下游2Mb基因组区域分为54个窗口,使用readCounter软件统计每个窗口y的比对读段数;
S6-2:测序深度矫正:应用步骤S5-2中的方法,计算待测样本矫正后每个窗口的测序深度;
S6-3:样本间矫正:将待测样本与胚胎PMP22区域正常2拷贝数参考系进行样本合并,参考步骤S5-3进行样本间矫正,得到最终用于分析的窗口读段数;
S6-4:待测样本PMP22区域拷贝数判断及可视化:PMP22区域1.4Mb中,共包含14个窗口,认为其中10个及以上窗口的Cx,y ≥ 2.6,即判定为PMP22区域3拷贝,即重复;根据Cx,y的分布情况,绘制待测样本的拷贝数CNV图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385076.6A CN117116344B (zh) | 2023-10-25 | 2023-10-25 | 一种单细胞水平pmp22重复变异的检测系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385076.6A CN117116344B (zh) | 2023-10-25 | 2023-10-25 | 一种单细胞水平pmp22重复变异的检测系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117116344A CN117116344A (zh) | 2023-11-24 |
CN117116344B true CN117116344B (zh) | 2024-07-19 |
Family
ID=88806055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311385076.6A Active CN117116344B (zh) | 2023-10-25 | 2023-10-25 | 一种单细胞水平pmp22重复变异的检测系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117116344B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116153395A (zh) * | 2023-04-17 | 2023-05-23 | 北京大学第三医院(北京大学第三临床医学院) | 一种单细胞小片段染色体拷贝数变异的检测方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5938484B2 (ja) * | 2012-01-20 | 2016-06-22 | 深▲せん▼華大基因医学有限公司Bgi Diagnosis Co., Ltd. | ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体 |
CN104745718B (zh) * | 2015-04-23 | 2018-02-16 | 北京中仪康卫医疗器械有限公司 | 一种检测人类胚胎染色体微缺失和微重复的方法 |
CN105543339B (zh) * | 2015-11-18 | 2021-07-16 | 上海序康医疗科技有限公司 | 一种同时完成基因位点、染色体及连锁分析的方法 |
US10095831B2 (en) * | 2016-02-03 | 2018-10-09 | Verinata Health, Inc. | Using cell-free DNA fragment size to determine copy number variations |
CN107529555A (zh) * | 2017-04-21 | 2018-01-02 | 上海杰傲奉生医学检验所有限公司 | 腓骨肌萎缩症相关pmp22基因拷贝数变异检测试剂盒 |
CN111052249B (zh) * | 2017-09-15 | 2024-04-05 | 深圳华大智造科技股份有限公司 | 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质 |
WO2021232388A1 (zh) * | 2020-05-22 | 2021-11-25 | 深圳华大智造科技有限公司 | 确定胚胎细胞染色体中预定位点碱基类型的方法及其应用 |
KR20220060198A (ko) * | 2020-11-04 | 2022-05-11 | 국립암센터 | 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법 |
-
2023
- 2023-10-25 CN CN202311385076.6A patent/CN117116344B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116153395A (zh) * | 2023-04-17 | 2023-05-23 | 北京大学第三医院(北京大学第三临床医学院) | 一种单细胞小片段染色体拷贝数变异的检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117116344A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104232777A (zh) | 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 | |
CN110541025B (zh) | 杜氏肌营养不良基因缺陷的检测方法、引物组合物及试剂盒 | |
CN106834502A (zh) | 一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒及方法 | |
CN105648045B (zh) | 确定胎儿目标区域单体型的方法和装置 | |
Tsai et al. | Characterization of MTM1 mutations in 31 Japanese families with myotubular myopathy, including a patient carrying 240 kb deletion in Xq28 without male hypogenitalism | |
CN105112541B (zh) | 人类胚胎脊髓性肌萎缩症突变基因检测试剂盒 | |
CN103571847A (zh) | Foxc1基因突变体及其应用 | |
JP2021108552A (ja) | 神経核内封入体病患者の検出方法 | |
CN114703278A (zh) | 一种肌萎缩侧索硬化致病基因、检测试剂盒及引物组 | |
Yu et al. | Clinical and genetic features of patients with juvenile amyotrophic lateral sclerosis with Fused in Sarcoma (FUS) mutation | |
US20220170102A1 (en) | Method for detecting smn gene copy number using smnp as reference | |
CN117116344B (zh) | 一种单细胞水平pmp22重复变异的检测系统和方法 | |
Yeetong et al. | Long-read Nanopore sequencing identified D4Z4 contractions in patients with facioscapulohumeral muscular dystrophy | |
CN116287198A (zh) | 一种检测多种疾病相关基因突变类型的引物组、试剂盒和方法 | |
CN114015768B (zh) | 检测FBN1基因突变位点c.G3901T的试剂在制备诊断马凡综合征试剂盒中的应用 | |
Yu et al. | Apparent homozygosity for a novel splicing variant in EPS8 causes congenital profound hearing loss | |
CN113528648A (zh) | 基于基因突变和dna甲基化特征判定衰老程度的方法 | |
CN112143803A (zh) | 用于妊娠期糖尿病患病风险预测的分子标志物及其用途 | |
CN108866067B (zh) | 一种雷伯氏先天性黑矇的致病突变及其检测试剂 | |
Chen et al. | Modification of phenotype by SMN2 copy numbers in two Chinese families with SMN1 deletion in two continuous generations | |
CN117025747B (zh) | 检测样本中slc34a3基因变异的试剂在制备筛查低血磷性佝偻病/骨软化症患者的产品的应用 | |
CN117925820B (zh) | 一种用于胚胎植入前变异检测的方法 | |
JP2014513958A (ja) | 補体媒介性疾患の発症を予測する方法 | |
CN116218862B (zh) | Selenoo基因突变体及其应用 | |
Zhou et al. | A Novel USH2A Variant in a Patient with Hearing Loss and Prenatal Diagnosis of a Familial Fetus: a Case Report and Literature Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |