CN113593629B - 基于半导体测序的降低无创产前检测假阳性假阴性的方法 - Google Patents
基于半导体测序的降低无创产前检测假阳性假阴性的方法 Download PDFInfo
- Publication number
- CN113593629B CN113593629B CN202110726069.2A CN202110726069A CN113593629B CN 113593629 B CN113593629 B CN 113593629B CN 202110726069 A CN202110726069 A CN 202110726069A CN 113593629 B CN113593629 B CN 113593629B
- Authority
- CN
- China
- Prior art keywords
- value
- chromosome
- values
- sequence
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 60
- 238000001514 detection method Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000004065 semiconductor Substances 0.000 title claims abstract description 22
- 230000001605 fetal effect Effects 0.000 claims abstract description 34
- 238000012937 correction Methods 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 238000007405 data analysis Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims abstract description 4
- 210000000349 chromosome Anatomy 0.000 claims description 59
- 230000008774 maternal effect Effects 0.000 claims description 18
- 238000012417 linear regression Methods 0.000 claims description 12
- 210000005259 peripheral blood Anatomy 0.000 claims description 9
- 239000011886 peripheral blood Substances 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 239000011324 bead Substances 0.000 claims description 4
- 210000002593 Y chromosome Anatomy 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012165 high-throughput sequencing Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 4
- 238000012216 screening Methods 0.000 abstract 1
- 230000005856 abnormality Effects 0.000 description 8
- 210000003754 fetus Anatomy 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 230000035935 pregnancy Effects 0.000 description 7
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 230000003169 placental effect Effects 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 208000031404 Chromosome Aberrations Diseases 0.000 description 2
- 208000036878 aneuploidy Diseases 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003793 prenatal diagnosis Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 206010067477 Cytogenetic abnormality Diseases 0.000 description 1
- 208000037492 Sex Chromosome Aberrations Diseases 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000003322 aneuploid effect Effects 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003181 biological factor Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于半导体测序的降低无创产前检测假阳性假阴性的方法,包括实验环节和测序数据分析环节;所述测序数据分析环节,包括如下步骤,测序数据获取‑序列比对和过滤‑GC校正‑统计每个分辨率窗口的序列数值并归一化‑对分辨率窗口的比例(R)值进行RUN内校正‑计算分辨率窗口的Z‑score值‑胎儿DNA浓度(fc)预测‑得出Z值、Zlength值和ZS值‑结果汇总分析。本发明既无需增加实验环节,也无需增加成本,只通过短片段富集减半数据量来进行分析和剔除母源CNV影响进行分析,使在已片筛优化实验方法的前提下胎儿浓度再度提高,通过对高胎儿浓度及剔除母源CNV影响的Z值和低胎儿浓度的Z值进行比较,从而识别假阳性假阴性样本。
Description
技术领域
本发明涉及产前诊断分子遗传学检测技术领域,特别涉及一种基于半导体测序的降低无创产前检测假阳性假阴性的方法。
背景技术
无创产前基因检测(Non-invasive prenatal testing,简称NIPT)是通过分离孕妇外周血中游离的DNA(cellfree DNA,简称cf DNA),利用大规模平行测序技术(massivelyparallel sequencing,MPS)获得胎儿染色体信息,分析胎儿染色体是否存在非整倍体异常风险的技术。目前临床上染色体数目异常的产前诊断方法仍然是创伤性的,穿刺取样会造成一定比例的流产。NIPT这种无创性采样方式(只需抽取5ML外周血)更容易被众多孕妇受检者接受。近年来NIPT在产前诊断中大规模应用。
越来越多孕妇优先选择NIPT的同时,无创产前检测假阳性假阴性样本的问题越发突出。据行业内专家报道,NIPT的回顾性分析数据显示,部分染色体异常类型存在着比较低的阳性预测值,如下表:
(Zp:代表诊断阳性;P:代表NIPT阳性;PPV:代表阳性预测值;SCA:代表类型为所有性染色体异常汇总)
母体外周血中游离DNA的来源与含量变化等生物因素会影响NIPT检测准确性。对于所检测目标疾病,会产生NIPT检测出的胎儿染色体结果与有创诊断结果不一致,即出现NIPT假阴性或假阳性结果。一般导致NIPT假阳性假阴性的常见原因有以下3种:1.胎儿游离DNA含量过低:早孕期双胎,一胎消亡变单胎;异卵双胎妊娠;辅助生殖妊娠;孕妇肥胖。2.胎儿和胎盘不一致:局限性胎盘嵌合;胎儿异常,胎盘细胞的染色体正常。3.母体自身原因造成染色体异常:母体拷贝数异常;母体为嵌合体异常;母体肿瘤携带;外源性输血或外源性淋巴细胞治疗。
如何减少无创产前检测假阳性假阴性样本的误判越来越受重视,目前行内降低假阳性假阴性普遍有如下方法:
1.加入母体测试样本,增加母体背景对照,去除母体异常引起的假阳性假阴性。但这种方法增加一定的运营成本,并不是所有实验室都能接受的,只是当发现异常样本时才会对个别增加母体测试环节,另外该环节且会导致报告周期延迟,不能广泛推广。
2.实验流程中加入片筛环节来提高胎儿浓度,实践证明该方法在一定概率下提高胎儿浓度,阳性预测值得到了提高。但在实际检测中,因个体差异,如试管婴儿(或有减胎),孕妇的年龄,孕妇的体重指数(BMI),妊娠期并发症等因素影响,部分样本在实验过程即使已加入磁珠片筛,却依然不能很好地提高胎儿浓度。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于半导体测序的降低无创产前检测假阳性假阴性的方法,既无需增加实验环节,也无需增加成本,只通过短片段富集减半数据量来进行分析和剔除母源CNV影响进行分析,使在已片筛优化实验方法的前提下胎儿浓度再度提高,通过对高胎儿浓度及剔除母源CNV影响的Z值和低胎儿浓度的Z值进行比较,从而识别假阳性假阳性样本。
为解决上述技术问题,本发明的技术方案是:一种基于半导体测序的降低无创产前检测假阳性假阴性的方法,包括实验环节和测序数据分析环节,所述实验环节采用磁珠片筛试剂盒,包括如下步骤,样本取样—分离—提取—建库—定量—上机—获得后台数据,所述样本为母体外周血;所述测序数据分析环节,包括如下步骤,测序数据获取-序列比对和过滤-GC校正-统计每个分辨率窗口的序列数值并归一化-对分辨率窗口的比例(R)值进行 RUN内校正-计算分辨率窗口的Z-score值-胎儿DNA浓度(fc)预测-得出Z值、Zlength值和ZS值-结果汇总分析。
作为本发明的进一步阐述,
优选地,所述步骤测序数据获取,包括基于获取的母体外周血游离DNA,利用高通量测序平台对待测样品进行全基因组测序以获得待测样本的染色体测序数据以及来自背景库样本的染色体测序数据的过程。
优选地,所述步骤序列比对和过滤,包括选择比对软件将半导体测序仪获得原始序列数据与人类基因组参考序列进行序列比对,然后过滤无比对(ummaped)、低比对质量(MAPQ<10)和多重复比对等对系统变异系数影响较大的序列,获得有效测序数据的过程。
优选地,所述步骤GC校正,包括首先统计每0.1%GC范围内的所有20Kb窗口的序列数值(UR)并利用LOESS算法计算获得URloess,再通过所有20Kb窗口获得期望的序列数值URe的过程,最后校正后的序列数值URcorrected经如下公式计算得到:URcorrected=UR-(URloess-URe)。
优选地,所述步骤统计每个分辨率窗口的序列数值并归一化,包括对GC校正的窗口进行合并得到合适的分辨率窗口,对每个分辨率窗口,利用每个GC校正的窗口中经校正后的序列数值,统计出比对到该分辨率窗口的序列数值(reads number,RN),然后对分辨率窗口的序列数值进行归一化处理得到每个分辨率窗口区段的比例(R)值的过程,所述比例(R)值经如下公式计算得到:公式中的n表示基因组的n个分辨率的窗口。
优选地,所述步骤对分辨率窗口的比例(R)值进行RUN内校正,包括对每个分辨率窗口区段的比例值(R),利用同批次上机样本的同一染色体区段的比例值集合,进行校正得到每个区段的RUN内校正后相对比例(CR)值的过程,所述校正后相对比例(CR)值经如下公式计算得到:公式中的k表示同批次上机样本中剔除异常值后的有效R值数。
优选地,所述步骤计算分辨率窗口窗口的Z-score值,包括定义该区域在普通人群样本中CR值的均值与标准差,进一步计算当前样本在该区域的Z-score值的过程,所述 Z-score值经如下公式计算得到:
优选地,所述步骤胎儿DNA浓度(fc)预测,使用的模型包括Y染色体比例的线性回归模型、基于游离DNA长度分布信息的线性回归模型、基于测序的片段分布的多元线性回归模型和基于人群多态性位点杂合频率的线性回归模型等方法计算得到。
优选地,所述步骤得出Z值、Zlength值和ZS值,包括通过所有测序数据重复上述1至7步骤计算获得各个目标染色体的Z值;从测序数据获取短片段部分的一半数据重复上述1至7步骤计算Zlength值;通过对染色体的每个1Mb的窗口重复上述1至7步骤计算得到每个窗口的Z-score,取中值与染色体窗口数的开平方根相乘计算得到ZS值的过程。
上述Z值、Zlength值和ZS值的计算方法如下:
Z=(Ri-Meani)/SDi,Z为当前待测样本的某个染色体的检测值,Ri为当前待测样本获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差。
Zlength=(hRi-Meani)/SDi,Zlength为当前待测样本的所有测序数据中选取一半的短片段数据计算得到某个染色体的检测值,hRi为当前待测样本的所有测序数据中选取一半的短片段数据获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差。
ZS=Med(Zi)*sqrt(N),ZS为使用中值法计算当前待测样本的某个染色体的检测值, Med(Zi)为该染色体所有分辨率窗口计算得到的Zi值的中值,N为该染色体的划分的所有分辨率窗口的数量,sqrt(N)指对窗口数值N进行开方。
优选地,所述步骤结果汇总分析,包括输出Z值、Zlength值和ZS值的结果进行比较分析,判断待测样本是否阳性或者阴性的过程,所述Zlength值和ZS值提供有效的辨别依据,有效降低基于半导体测序的无创产前检测假阳性假阴性的概率。
本发明的有益效果是:
1、本发明无需改变实验方案、无需增加测序量和检测成本的前提下,通过短片段富集减半数据量的方法,可有效将胎儿浓度提高20%-50%,把胎儿浓度提高后算出来的Z值 (Zlength),与实验优化后的Z值进行对比,Zlength可明显增加对假阳性假阴性的识别。
2、本发明剔除母源CNV影响是通过取每条染色体的ratio值的中位数进行分析后算出 Z值(ZS),该方法能有效地剔除由于母源CNV导致Z值假阳性假阴性的影响。
附图说明
图1为实施例1-1的NIPT结果图之一;
图2为实施例1-1的NIPT结果图之二;
图3为实施例1-1的NIPT结果图之三;
图4为实施例1-1的诊断结果图之一;
图5为实施例1-1的诊断结果图之二;
图6为实施例1-2的NIPT结果图;
图7为实施例1-2的诊断结果图;
图8为实施例2的NIPT结果图之一;
图9为实施例2的NIPT结果图之二;
图10为实施例3的NIPT结果图之一;
图11为实施例3的NIPT结果图之二;
图12为实施例3的NIPT结果图之三。
具体实施方式
下面通过具体实施方式对本发明作进一步详细说明。
本发明公开一种基于半导体测序的降低无创产前检测假阳性假阴性的方法,包括实验环节和测序数据分析环节,所述实验环节采用磁珠片筛试剂盒,包括如下步骤,样本取样—分离—提取—建库—定量—上机—获得后台数据,所述样本为母体外周血;所述测序数据分析环节,包括如下步骤,测序数据获取-序列比对和过滤-GC校正-统计每个分辨率窗口的序列数值并归一化-对分辨率窗口的比例(R)值进行RUN内校正-计算分辨率窗口窗口的Z-score值-胎儿DNA浓度(fc)预测-得出Z值、Zlength值和ZS值-结果汇总分析。
进一步地,所述步骤测序数据获取,包括基于获取的母体外周血游离DNA,利用高通量测序平台对待测样品进行全基因组测序以获得待测样本的染色体测序数据以及来自背景库样本的染色体测序数据的过程。
进一步地,所述步骤序列比对和过滤,包括选择比对软件将测序获得半导体测序仪获得原始序列数据与人类基因组参考序列进行序列比对,然后过滤无比对(ummaped)、低比对质量(MAPQ<10)和多重复比对等对系统变异系数影响较大的序列,获得有效测序数据的过程。
进一步地,所述步骤GC校正,包括首先统计每0.1%GC范围内的所有20Kb窗口的序列数值(UR)并利用LOESS算法计算获得URloess,再通过所有20Kb窗口获得期望的序列数值URe的过程,最后校正后的序列数值URcorrected经如下公式计算得到:URcorrected=UR-(URloess-URe)。
进一步地,所述步骤统计每个分辨率窗口的序列数值并归一化,包括对GC校正的窗口进行合并得到合适的分辨率窗口,对每个分辨率窗口,利用每个GC校正的窗口中经校正后的序列数值,统计出比对到该分辨率窗口的序列数值(reads number,RN),然后对分辨率窗口的序列数值进行归一化处理得到每个分辨率窗口区段的比例(R)值的过程,所述比例(R)值经如下公式计算得到:公式中的n表示基因组的n个分辨率的窗口。
进一步地,所述步骤对分辨率窗口的比例(R)值进行RUN内校正,包括对每个分辨率窗口区段的比例值(R),利用同批次上机样本的同一染色体区段的比例值集合,进行校正得到每个区段的RUN内校正后相对比例(CR)值的过程,所述校正后相对比例(CR)值经如下公式计算得到:公式中的k表示同批次上机样本中剔除异常值后的有效R值数。
进一步地,所述步骤计算分辨率窗口窗口的Z-score值,包括定义该区域在普通人群样本中CR值的均值与标准差,进一步计算当前样本在该区域的Z-score值的过程,所述Z-score值经如下公式计算得到:
进一步地,所述步骤胎儿DNA浓度(fc)预测,使用的模型包括Y染色体比例的线性回归模型、基于游离DNA长度分布信息的线性回归模型、基于测序的片段分布的多元线性回归模型和基于人群多态性位点杂合频率的线性回归模型等方法计算得到。
进一步地,所述步骤得出Z值、Zlength值和ZS值,包括通过所有测序数据重复上述1至7步骤计算获得各个目标染色体的Z值;从测序数据获取短片段部分的一半数据重复上述1至7步骤计算Zlength值;通过对染色体的每个1Mb的窗口重复上述1至7步骤计算得到每个窗口的Z-score,取中值与染色体窗口数的开平方根相乘计算得到ZS值的过程。
上述Z值、Zlength值和ZS值的计算方法如下:
Z=(Ri-Meani)/SDi,Z为当前待测样本的某个染色体的检测值,Ri为当前待测样本获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差。
Zlength=(hRi-Meani)/SDi,Zlength为当前待测样本的所有测序数据中选取一半的短片段数据计算得到某个染色体的检测值,hRi为当前待测样本的所有测序数据中选取一半的短片段数据获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差。
ZS=Med(Zi)*sqrt(N),ZS为使用中值法计算当前待测样本的某个染色体的检测值,Med(Zi)为该染色体所有分辨率窗口计算得到的Zi值的中值,N为该染色体的划分的所有分辨率窗口的数量,sqrt(N)指对窗口数值N进行开方。
进一步地,所述步骤结果汇总分析,包括输出Z值、Zlength值和ZS值的结果进行比较分析,判断待测样本是否阳性或者阴性的过程,所述Zlength值和ZS值提供有效的辨别依据,有效降低基于半导体测序的无创产前检测假阳性假阴性的概率。
结果汇总,基于上述3种算法输出Z值、Zlength值和ZS值的结果进行比较分析,能全面地判断待测样本是否阳性或者阴性,实践证明Zlength值和ZS值对于特殊情况的样本(比如Z值在灰色区临界、Z值阳性值不大、母源CNV影响等)提供有效的判别依据,可有效降低基于半导体测序的无创产前检测假阳性假阴性的概率。
以下本发明非整倍体异常判读方案(备注:FC>4%,ZL=Zlength-Z)
注:当样本存在其他临床指标异常时,应严格一级判断。
使用本发明方法后阳性预测值得到了有效提高:T21,T18,T13的PPV分别提高5%,4%,15%;XO的PPV提高很明显(15%),总体综合PPV提高10%。
以下以实际实施例来具体说明本发明方案:
实施例1:假阳性识别
实施例1-1:母体T21:EJ034720:Z值异常高,无法去除母体背景影响均一化,S方法即ZS值还是高的,但是可以通过ZlengthL,与Z值进行比较得出ZL=-7.77,符合chr21阴性的判断方案:C,Z>50&ZL<-5。即随着胎儿浓度的提高,检测值反而降低,图形看到红线明显往回走,识别该样本为假阳性样本,穿刺结果胎儿正常得以证实。
胎儿浓度 | 18.7 |
孕周 | 22周+4天 |
年龄 | 32 |
试管婴儿 | / |
输血/移植/肿瘤 | / |
NT | / |
Z | 73.438 |
ZS | 75.926 |
Zlength | 65.648 |
ZL | -7.77 |
本方法NIPT结果 | 阴性 |
诊断结果 | 无异常 |
NIPT结果如图1、图2和图3所示。
诊断结果如图4、图5所示,未见明显异常。
实施例1-2:本案例检测值Z>3,结合Zlength,ZSB,比较分析,符合chr21阴性的判断方案:B, 2≤Z<3&(ZS<3 or ZL<3),即识别该样本为假阳性样本,穿刺结果胎儿正常得以证实。
NIPT结果如图6所示。
诊断结果如图7所示。
实施例2:假阴性的识别
该案例其他机构检测T21假阴;采用本发明方法检测结果Z=3.9.Zlength=6.8,通过分析方法富集胎儿浓度后的Zlength值明显大于Z值,符合chr21阳性的判读方案B,3<Z≤5&ZL>1。可见能明显识别为T21阳性样本,能避免假阴性的发生。
胎儿浓度 | 17.3 |
孕周 | / |
年龄 | / |
试管婴儿 | / |
输血/移植/肿瘤 | / |
NT | / |
Z | 3.927 |
ZS | / |
Zlength | 6.845 |
ZL | 2.918 |
本方法NIPT结果 | T21 |
诊断结果 | T21 |
NIPT结果如图8和图9所示。
实施例3:去除母体异常背景
E0347样本21的Z值临界,经过剔除母源污染后的ZS值降到正常值,符合chr21阴性的判读方案:D,Z>3&ZS<3&(21存在CNV),综合判断可出阴性。如没ZS值协助判断,这样本需要重新实验,这样即增加了成本,报告也要至少延迟4天;甚至重做后也不一定能出阴性报告,导致假阳性的发生。
该样本在ZS协助判断下,发明人出具了阴性报告,经随访胎儿已出生,一切正常。可见该方法能有效避免假阳性的发生。
胎儿浓度 | 13.2 |
孕周 | 17+4 |
年龄 | 24 |
试管婴儿 | / |
输血/移植/肿瘤 | / |
NT | / |
Z | 4.03 |
ZS | 0.045 |
本方法NIPT结果 | 阴性 |
随访结果 | 胎儿已出生,一切正常 |
NIPT结果如图10、图11和图12所示。
本发明无需改变实验方案、无需增加测序量和检测成本的前提下,通过短片段富集减半数据量的方法,可有效将胎儿浓度提高20%-50%,把胎儿浓度提高后算出来的Z值(Zlength),与实验优化后的Z值进行对比,Zlength可明显增加对假阳性假阴性的识别。真阳性样本的Z值会随着胎儿浓度的提高而提高,如果没有提高反而降低的,则判断为假阳性的可能性。同时,如果数值落在灰区的临界样本,Zlength随着胎儿浓度的提高而明显提高,即说明真阳性的风险大,相反的Zlength随着胎儿浓度的提高而下降即说明真阳性的风险小,从而有效识别假阳性假阴性。
因为母体外周血浆中胎儿游离DNA含量大概占全部游离DNA的3~13%,其余大量来源于母体背景的游离DNA,同时母源染色体如果存在CNV,母源CNV区域波动会很大,导致检测的Z值偏高或者偏低(正常范围-3~3),进而影响对胎儿是否携带的判断,容易导致对结果判断失准,出现假阳性或假阴性,同时也导致Z值偏离正常范围,无法正常发放报告。本发明剔除母源CNV影响是通过取每条染色体的ratio值的中位数进行分析后算出Z值 (ZS),该方法能有效地剔除由于母源CNV导致Z值假阳性假阴性的影响。
使用本发明能有效降低无创产前基因检测(NIPT)的假阳性假阴性率。本发明开发了纯生物信息分析的方法,无需改变实验方案、无需增加测序量和检测成本的前提下,通过短片段富集减半数据量的提高胎儿浓度算出来的Z值和利用中值ratio值剔除母源干扰后算出来的Z值,与优化前的Z值进行比较,从而识别假阳性假阴性样本。对NIPT准确性的提高,本发明具有重要的价值。
以上所述,仅是本发明较佳实施方式,凡是依据本发明的技术方案对以上的实施方式所作的任何细微修改、等同变化与修饰,均属于本发明技术方案的范围内。
Claims (8)
1.一种基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于,包括实验环节和测序数据分析环节,所述实验环节采用磁珠片筛试剂盒,包括如下步骤,样本取样—分离—提取—建库—定量—上机—获得后台数据,所述样本为母体外周血;所述测序数据分析环节,包括如下步骤,测序数据获取-序列比对和过滤-GC校正-统计每个分辨率窗口的序列数值并归一化-对分辨率窗口的比例R值进行RUN内校正-计算分辨率窗口的Z-score值-胎儿DNA浓度fc预测-得出Z值、Zlength值和ZS值-结果汇总分析;
所述步骤统计每个分辨率窗口的序列数值并归一化,包括对GC校正的窗口进行合并得到合适的分辨率窗口,对每个分辨率窗口,利用每个GC校正的窗口中经校正后的序列数值,统计出比对到该分辨率窗口的序列数值reads number,简称为RN,然后对分辨率窗口的序列数值进行归一化处理得到每个分辨率窗口区段的比例R值的过程,所述比例R值经如下公式计算得到:公式中的n表示基因组的n个分辨率的窗口;
所述步骤得出Z值、Zlength值和ZS值,包括通过所有测序数据重复上述步骤计算获得各个目标染色体的Z值;从测序数据获取短片段部分的一半数据重复上述步骤计算Zlength值;通过对染色体的每个1Mb的窗口重复上述步骤计算得到每个窗口的Z-score,取中值与染色体窗口数的开平方根相乘计算得到ZS值的过程;
上述Z值、Zlength值和ZS值的计算方法如下:
Z=(Ri-Meani)/SDi,Z为当前待测样本的某个染色体的检测值,Ri为当前待测样本获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差;
Zlength=(hRi-Meani)/SDi,Zlength为当前待测样本的所有测序数据中选取一半的短片段数据计算得到某个染色体的检测值,hRi为当前待测样本的所有测序数据中选取一半的短片段数据获得的该染色体比例值,Meani为该染色体的整倍体检测值的参考比例值,SDi为该染色体的整倍体检测值的参考比例值的标准差;
ZS=Med(Zi)*sqrt(N),ZS为使用中值法计算当前待测样本的某个染色体的检测值,Med(Zi)为该染色体所有分辨率窗口计算得到的Zi值的中值,N为该染色体的划分的所有分辨率窗口的数量,sqrt(N)指对窗口数值N进行开方。
2.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤测序数据获取,包括基于获取的母体外周血游离DNA,利用高通量测序平台对待测样品进行全基因组测序以获得待测样本的染色体测序数据以及来自背景库样本的染色体测序数据的过程。
3.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤序列比对和过滤,包括选择比对软件将半导体测序仪获得的原始序列数据与人类基因组参考序列进行序列比对,然后过滤无比对ummaped、低比对质量MAPQ<10和多重复比对对系统变异系数影响较大的序列,获得有效测序数据的过程。
4.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤GC校正,包括首先统计每0.1%GC范围内的所有20Kb窗口的序列数值UR并利用LOESS算法计算获得URloess,再通过所有20Kb窗口获得期望的序列数值URe的过程,最后校正后的序列数值URcorrected经如下公式计算得到:URcorrected=UR-(URloess-URe)。
5.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤对分辨率窗口的比例R值进行RUN内校正,包括对每个分辨率窗口区段的比例值R,利用同批次上机样本的同一染色体区段的比例值集合,进行校正得到每个区段的RUN内校正后相对比例CR值的过程,所述校正后相对比例CR值经如下公式计算得到:公式中的k表示同批次上机样本中剔除异常值后的有效R值数。
6.根据权利要求5所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤计算分辨率窗口的Z-score值,包括定义染色体的某个待分析区域在普通人群样本中CR值的均值与标准差,进一步计算当前样本在染色体的某个待分析区域的Z-score值的过程,所述Z-score值经如下公式计算得到:
7.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤胎儿DNA浓度fc预测,使用的模型包括Y染色体比例的线性回归模型、基于游离DNA长度分布信息的线性回归模型、基于测序的片段分布的多元线性回归模型和基于人群多态性位点杂合频率的线性回归模型方法计算得到。
8.根据权利要求1所述的基于半导体测序的降低无创产前检测假阳性假阴性的方法,其特征在于:所述步骤结果汇总分析,包括输出Z值、Zlength值和ZS值的结果进行比较分析,判断待测样本是否阳性或者阴性的过程,所述Zlength值和ZS值提供有效的辨别依据,有效降低基于半导体测序的无创产前检测假阳性假阴性的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110726069.2A CN113593629B (zh) | 2021-06-29 | 2021-06-29 | 基于半导体测序的降低无创产前检测假阳性假阴性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110726069.2A CN113593629B (zh) | 2021-06-29 | 2021-06-29 | 基于半导体测序的降低无创产前检测假阳性假阴性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113593629A CN113593629A (zh) | 2021-11-02 |
CN113593629B true CN113593629B (zh) | 2024-02-13 |
Family
ID=78244928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110726069.2A Active CN113593629B (zh) | 2021-06-29 | 2021-06-29 | 基于半导体测序的降低无创产前检测假阳性假阴性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113593629B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105483229A (zh) * | 2015-12-21 | 2016-04-13 | 广东腾飞基因科技有限公司 | 一种检测胎儿染色体非整倍体的方法及系统 |
WO2019213811A1 (zh) * | 2018-05-07 | 2019-11-14 | 深圳市真迈生物科技有限公司 | 检测染色体非整倍性的方法、装置及系统 |
CN112712853A (zh) * | 2020-12-31 | 2021-04-27 | 北京优迅医学检验实验室有限公司 | 一种无创产前检测装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3795692A4 (en) * | 2018-05-07 | 2021-07-21 | GeneMind Biosciences Company Limited | METHOD, DEVICE AND SYSTEM FOR DETECTION OF CHROMOSOMAL ANEUPLOIDY |
-
2021
- 2021-06-29 CN CN202110726069.2A patent/CN113593629B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105483229A (zh) * | 2015-12-21 | 2016-04-13 | 广东腾飞基因科技有限公司 | 一种检测胎儿染色体非整倍体的方法及系统 |
WO2019213811A1 (zh) * | 2018-05-07 | 2019-11-14 | 深圳市真迈生物科技有限公司 | 检测染色体非整倍性的方法、装置及系统 |
CN112712853A (zh) * | 2020-12-31 | 2021-04-27 | 北京优迅医学检验实验室有限公司 | 一种无创产前检测装置 |
Non-Patent Citations (1)
Title |
---|
Noninvasive detection of fetal subchromosomal abnormalities by semiconductor sequencing of maternal plasma DNA;Ai-hua Yin et al.;《PNAS》;第112卷(第47期);第14670–14675页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113593629A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573125B (zh) | 一种基因组拷贝数变异的检测方法及包含该方法的装置 | |
CN112669901A (zh) | 基于低深度高通量基因组测序的染色体拷贝数变异检测装置 | |
CN110033860B (zh) | 一种基于机器学习的遗传代谢病检出率提升方法 | |
CN105844116B (zh) | 测序数据的处理方法和处理装置 | |
KR101614471B1 (ko) | 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치 | |
WO2020168511A1 (zh) | 染色体异常检测模型、其检测系统及染色体异常检测方法 | |
CN112365927B (zh) | Cnv检测装置 | |
KR101678962B1 (ko) | 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법 | |
CN116013419A (zh) | 检测染色体拷贝数变异的方法 | |
EP3023504A1 (en) | Method and device for detecting chromosomal aneuploidy | |
CN116240273B (zh) | 一种基于低深度全基因组测序的判断母源污染比例的方法及其应用 | |
CN113593629B (zh) | 基于半导体测序的降低无创产前检测假阳性假阴性的方法 | |
EP3797418A1 (en) | Method for determining the probability of the risk of chromosomal and genetic disorders from free dna of fetal origin | |
CN110580934B (zh) | 一种基于外周血游离dna高通量测序的妊娠期相关疾病预测方法 | |
CN110322963B (zh) | 一种新生儿遗传代谢病检测分析方法、装置及系统 | |
CN107239676B (zh) | 一种针对胚胎染色体的序列数据处理装置 | |
US20230115196A1 (en) | Method for determining pregnancy status of pregnant woman | |
CN109402247B (zh) | 一种基于dna变异计数的胎儿染色体检测系统 | |
CN110191964B (zh) | 确定生物样本中预定来源的游离核酸比例的方法及装置 | |
CN114512231A (zh) | 基于级联特征选择算法的唐氏综合征筛查系统 | |
KR101618032B1 (ko) | 비침습적 태아 염색체 이상 검출방법 | |
CN112522387B (zh) | 一种无创产前检测染色体异常的装置 | |
CN115223654A (zh) | 检测胎儿染色体非整倍体异常的方法、装置及存储介质 | |
KR20190114351A (ko) | 비침습적 산전 검사에 의한 태아 염색체의 미세결실 또는 미세증폭의 확인 방법 | |
KR102532991B1 (ko) | 태아의 염색체 이수성 검출방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |