CN109402247A - 一种基于dna变异计数的胎儿染色体检测系统 - Google Patents
一种基于dna变异计数的胎儿染色体检测系统 Download PDFInfo
- Publication number
- CN109402247A CN109402247A CN201811312407.2A CN201811312407A CN109402247A CN 109402247 A CN109402247 A CN 109402247A CN 201811312407 A CN201811312407 A CN 201811312407A CN 109402247 A CN109402247 A CN 109402247A
- Authority
- CN
- China
- Prior art keywords
- dna
- sequence
- chromosome
- short sequence
- fetal chromosomal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002759 chromosomal effect Effects 0.000 title claims abstract description 63
- 230000001605 fetal effect Effects 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title abstract description 24
- 108020004414 DNA Proteins 0.000 claims abstract description 84
- 210000000349 chromosome Anatomy 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 49
- 208000031404 Chromosome Aberrations Diseases 0.000 claims abstract description 15
- 206010067477 Cytogenetic abnormality Diseases 0.000 claims abstract description 14
- 210000004369 blood Anatomy 0.000 claims abstract description 14
- 239000008280 blood Substances 0.000 claims abstract description 14
- 230000008774 maternal effect Effects 0.000 claims abstract description 13
- 238000012163 sequencing technique Methods 0.000 claims abstract description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 6
- 210000002381 plasma Anatomy 0.000 claims description 23
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000012165 high-throughput sequencing Methods 0.000 claims description 4
- 210000001766 X chromosome Anatomy 0.000 claims description 3
- 210000002593 Y chromosome Anatomy 0.000 claims description 3
- 238000004043 dyeing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 108700024394 Exon Proteins 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 claims description 2
- 229920002472 Starch Polymers 0.000 claims 1
- 210000000746 body region Anatomy 0.000 claims 1
- 235000019698 starch Nutrition 0.000 claims 1
- 210000003754 fetus Anatomy 0.000 abstract description 17
- 238000012216 screening Methods 0.000 abstract description 11
- 230000002411 adverse Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 24
- 208000032170 Congenital Abnormalities Diseases 0.000 description 7
- 208000036878 aneuploidy Diseases 0.000 description 7
- 230000007698 birth defect Effects 0.000 description 7
- 238000006062 fragmentation reaction Methods 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 5
- 230000003322 aneuploid effect Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 210000004381 amniotic fluid Anatomy 0.000 description 3
- 231100001075 aneuploidy Toxicity 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 208000037492 Sex Chromosome Aberrations Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 238000009609 prenatal screening Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供了一种基于DNA变异计数的胎儿染色体检测方法,包括孕妇外周血样本中血浆游离DNA的获取和测序、血浆游离DNA序列和人类参考序列24条染色体上DNA长序列的比较,血浆游离DNA中的变异数的统计和比较。还公开了实现上述检测方法的系统,所述系统包括DNA短序列数据输入模块、短序列在长序列上定位模块、寻找序列差异模块、差异筛选模块、计数模块一、计数模块二,所述模块之间依次电性连接。本发明通过检测孕妇外周血中的染色体,判断胎儿是否存在染色体异常,大大降低了检测过程中对孕妇和胎儿的不良影响,本发明通过计算变异数目的方式来判断胎儿的染色体异常,比通过简单地计算序列数目的方法更加精确。
Description
技术领域
本发明涉及医学检测领域,具体涉及一种无创产前生物信息检测系统。
背景技术
21、13、18染色体非整倍体胎儿的发病率约1/500,携带这些疾病的孩子将来会给家庭和社会带来沉重的负担,而目前无创产前检测技术已经应用推广,准确性高达99.9%,绝大部分的染色体非整倍体胎儿都可以被检测出来。然而据卫生部发布的《中国出生缺陷防治报告2012》中指出,我国的出生缺陷发生率与世界中等输入国家的平均水平接近,约为5.6%,每年新增出生缺陷数约90万例,明显可见的出生缺陷约25万例,约占婴儿比例1.5%,婴儿死因中19.1%是出生缺陷直接导致。而最严重的染色体非整倍体异常只占明显可见的出生缺陷的13%,而其他87%的严重出生缺陷目前还没有有效的检测方法。
目前国内对于染色体非整倍性检查已经开始推广无创DNA筛查加高危人群羊水穿刺确诊的方法,无创DNA筛查准确度高达99.8%。中国专利公布CN103525939A公开了一种无创检测胎儿染色体非整倍体的方法和系统,该发明通过消除染色体内和染色体间测序GC偏好性的影响,构建正常男胎中X、Y染色体的Z值之间的关系模型,建立X染色体的Z值理论值与实际值差异的判定阈值,实现了胎儿染色体非整倍体,特别是性染色体非整倍体的准确检测。但是,该方法不能有效用于染色体非整倍体之外的其他染色体缺陷的检测。对于其他缺陷还是采取B超检查、羊水检查、MRI检查等,漏检率较高且羊水检查有使胎儿感染致死的可能。
目前无创产前筛查行业中普遍方法是使用孕妇血浆游离DNA全基因组低深度测序技术,随机检测全基因组上的一些DNA片段,这些DNA片段在基因组上的位置是随机的,且检测数量很少,总体上对于全基因组的覆盖少于1倍,然后对于每条染色体上的DNA片段计数,如果某条染色体上DNA片段数量与整体比例偏离正常孕妇样本的基线,则可以判断该染色体发生异常。正如,广东省妇幼保健院医学遗传中心在《无创产前诊断在胎儿染色体结构异常中的研究进展》中指出将通量测序技术应用于胎儿21体综合征的无创检测,计数cffDNA中所有染色体序列,将其与人类基因组序列对比,根据同一条染色体上多个序列计数来判断靶染色体数目是否异常。因为以前的方法对DNA片段的选取完全随机,覆盖深度低,对于染色体上某个特定区域,无法保证一定有DNA片段被检测到且有足够数量满足后续分析,所以该方法无法准确检测小片段的染色体异常。
这种方法的一个缺点是检测的精确度不够。当来自于胎儿的DNA片段占总DNA片段比例比较小的情况下(比如,少于2%),染色体3体的检测可能产生漏检(假阴性)。目前,临床上出现的漏检情况基本属于这个原因。
目前,急需一种能够高精度地检测胎儿整条染色体的异常的方法;同时,还希望能够检测出染色体上更小片段的扩增与缺失。尤其,我们希望能够降低对于来自于胎儿的DNA序列占总DNA序列的比例的要求。
发明内容
本发明提供了一种基于DNA变异计数的胎儿染色体的检测系统。该系统基于DNA变异定量技术对胎儿的染色体异常进行检测,能够检测出染色体上更小片段的扩增与缺失,对于来自与胎儿的DNA序列的比例要求降低,从而达到对遗传缺陷有较高的检出率。
一种基于DNA变异计数的胎儿染色体检测方法,包括以下步骤:
(1)获取待测孕妇外周血样本,分离样本中的血浆游离DNA;
(2)使用第二代高通量测序技术对步骤(1)得到的DNA进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)统计短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)对步骤(4)得到的差异进行筛选,筛除错误信息;
(6)基于步骤(5)得到的数据,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数;
(7)基于步骤(6)得到的数据,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A;
(8)将一个以上胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,相邻的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
在一些优选的实施方案中,步骤(1)中利用得到的血浆游离DNA构建DNA样本文库,所述步骤(2)中对构建的DNA样本文库进行测序。
在一些优选的实施方案中,步骤(1)中对分离得到的血浆游离DNA进行筛选,筛选出全部外显子、部分外显子或高频变异位点,将筛选出的DNA序列用于步骤(2)进行测序。
所述步骤(3)中人类基因组24条染色体是指22条常染色体、X染色体和Y染色体。
所述步骤(5)筛除只有一条短序列支持的变异字符或字符串。
所述步骤(5)筛除来自相同DNA模板的DNA短序列上相同位置上不一致的字符或字符串。
所述字符是指一个碱基。
所述字符串是指一串碱基。
所述变异字符是指发生变异的一个碱基。
所述变异字符串是指发生变异的一串碱基。
所述步骤(6)中采用如下方法计数,当定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,如果有m个短序列存在变异,则短序列变异数计为1,其中n和m均是大于等于1的正整数。
所述步骤(6)中采用如下方法计数,当定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,如果有m个短序列存在变异,则短序列的变异数计为m,其中n和m均是大于等于1的正整数。
所述步骤(7)中以一整条染色体作为一个染色体区域。
所述步骤(7)中以1/2、1/4或1/8长度的染色体作为一个染色体区域。
所述步骤(7)中以同一染色体的q臂、p臂记为记为两个染色体区域。
所述步骤(7)中以1M、2M、5M、10M、100M或200M碱基长度的染色体作为一个染色体区域。
一种系统,该系统包括一个或多个处理器,其被用于实施上述方法中的任意一种。
一种包括模块的系统,所述模块被配置用于实施上述方法的任意一种。
所述系统包括以下六个模块:DNA短序列数据输入模块、短序列在长序列上定位模块、寻找序列差异模块、差异筛选模块、计数模块一、计数模块二,所述模块之间依次电性连接。
所述DNA短序列数据输入模块,输入来自孕妇血浆游离DNA的短序列数据。
所述短序列在长序列上定位模块,将DNA短序列数据输入模块输入的孕妇血浆游离DNA的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上。
所述寻找序列差异模块,基于短序列在长序列上定位模块的输出,比较孕妇血浆游离DNA的短序列与人类基因组24条染色体长序列相应位置上的序列。
所述差异筛选模块,基于寻找序列差异模块的输出,筛除错误信息。
所述计数模块一,基于差异筛选模块的输出,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数。
所述计数模块二,基于计数模块一的输出,计算各个染色体区域上的短序列变异数之和,记为染色体区域变异数。
所述系统在检测胎儿染色体中的应用:
(1)获取待测孕妇外周血样本,分离样本中的血浆游离DNA;
(2)使用第二代高通量测序技术对步骤(1)得到的DNA进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列数据通过DNA短序列数据输入模块输入到短序列在长序列上定位模块中,将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)通过寻找序列差异模块,统计短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)通过差异筛选模块,对步骤(4)得到的差异进行筛选,筛除错误信息;
(6)基于步骤(5)得到的数据,通过计数模块一,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数;
(7)基于步骤(6)得到的数据,通过计数模块二,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A;
(8)将一个以上胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,相邻的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
与现有技术相比,本发明的有益效果为:
(1)本发明通过检测孕妇外周血中的染色体,判断胎儿是否存在染色体异常,大大降低了检测过程中对孕妇和胎儿的不良影响。
(2)本发明通过计算变异数目的方式来判断胎儿的染色体异常,比通过简单地计算序列数目的方法更加精确。
(3)在胎儿序列占比总游离DNA的数量偏低的情况下,仍然可以精确地预报胎儿的染色体异常。
(4)在怀孕的更早时间比如,4-6周,6-8周,8-10周就可以检测到胎儿的染色体异常。
(5)本发明可以通过选择性测序,比如通过探针捕获全外显子区域,捕获高频SNP变异区域,将检测的游离DNA测序量减少,同时将测序深度提高,最后达到高精度检测胎儿的染色体异常。
(6)本发明可以将染色体分解成许多区间,在这些区间之内使用DNA变异数计量的方法,确保能够准确检测到染色体上小片段的异常,提高了检测的遗传疾病范围。
附图说明
图1为本发明公开的基于DNA变异计数的胎儿染色体检测系统的流程图。
具体实施方式
实施例1一种基于DNA变异计数的胎儿染色体检测方法
(1)用STRECK公司的Cell-Free DNA BCT试管按照对应器材使用说明书采集待测孕5周孕妇的外周血5ml,并使用QIAGEN公司的QIAamp Circulating Nucleic Acid Kit试剂盒按照对应的试剂盒使用说明书提取待测样本中的血浆游离DNA;
(2)使用Illumina公司的Nextseq500型号高通量测序仪器对步骤(1)得到的DNA进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)使用bwa和GATK软件计算短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)对步骤(4)得到的差异进行筛选,筛除只有一条短序列支持的变异字符或字符串;
(6)基于步骤(5)得到的数据,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数,当定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,有m个短序列存在变异,短序列变异数计为m;
(7)基于步骤(6)得到的数据,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A,以1/2长度的染色体作为一个染色体区域;
(8)将100个胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,其中隐马尔科夫链模型的隐藏状态设置为
{0.80,0.81,0.82,…,1.18,1.19,1.20},相连的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
该过程的漏检率为5%。
实施例2一种基于DNA变异计数的胎儿染色体检测方法
(1)用STRECK公司的Cell-Free DNA BCT试管按照对应器材使用说明书采集待测孕10周孕妇的外周血5ml,并使用QIAGEN公司的QIAamp Circulating Nucleic Acid Kit试剂盒按照对应的试剂盒使用说明书提取待测样本中的血浆游离DNA,使用KAPA生物系统公司的KAPA Hyper Prep Kit试剂盒按照对应的试剂盒使用说明书对提取出的血浆游离DNA建文库,在文库构建的过程中使用探针引物使来自相同DNA模板的DNA序列具有相同的探针;
(2)使用Illumina公司的Nextseq500型号高通量测序仪器对步骤(1)得到的DNA样本文库进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)使用bwa和GATK软件计算短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)对步骤(4)得到的差异进行筛选,筛除来自相同DNA模板的DNA短序列上相同位置上不同的字符或字符串;
(6)基于步骤(5)得到的数据,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数,当定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,有m个短序列存在变异,则短序列变异数计为1;
(7)基于步骤(6)得到的数据,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A,以10M长度的染色体作为一个染色体区域;
(8)将10胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,其中隐马尔科夫链模型的隐藏状态设置为{0.80,0.81,0.82,…,1.18,1.19,1.20},相连的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
该过程的漏检率仅为3%。
实施例3一种基于DNA变异计数的胎儿染色体检测系统
包括以下六个模块:DNA短序列数据输入模块、短序列在长序列上定位模块、寻找序列差异模块、差异筛选模块、计数模块一、计数模块二,所述模块之间依次电性连接;所述DNA短序列数据输入模块,输入来自孕妇血浆游离DNA的短序列数据;所述短序列在长序列上定位模块,将DNA短序列数据输入模块输入的孕妇血浆游离DNA的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;所述寻找序列差异模块,基于短序列在长序列上定位模块的输出,比较孕妇血浆游离DNA的短序列与人类基因组24条染色体长序列相应位置上的序列;所述差异筛选模块,基于寻找序列差异模块的输出,筛除错误信息;所述计数模块一,基于差异筛选模块的输出,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数;所述计数模块二,基于计数模块一的输出,计算各个染色体区域上的短序列变异数之和,记为染色体区域变异数。
实施例4基于DNA变异计数的胎儿染色体检测系统在检测胎儿染色体中的应用
(1)获取待测孕妇外周血样本,分离样本中的血浆游离DNA;
(2)使用第二代高通量测序技术对步骤(1)得到的DNA进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列数据通过DNA短序列数据输入模块输入到短序列在长序列上定位模块中,将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)通过寻找序列差异模块,统计短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)通过差异筛选模块,对步骤(4)得到的差异进行筛选,筛除错误信息;
(6)基于步骤(5)得到的数据,通过计数模块一,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数;
(7)基于步骤(6)得到的数据,通过计数模块二,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A;
(8)将一个以上胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,相邻的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
该检测系统对胎儿染色体异常的漏检率仅为5%。
Claims (10)
1.一种基于DNA变异计数的胎儿染色体检测方法,其特征在于:包括以下步骤:
(1)获取待测孕妇外周血样本,分离样本中的血浆游离DNA;
(2)使用第二代高通量测序技术对步骤(1)得到的DNA进行测序,得到孕妇血浆游离DNA的短序列数据;
(3)将步骤(2)所得的短序列定位到人类基因组24条染色体长序列上相似度最高的位置上;
(4)统计短序列和长序列上相应位置有差异的字符和字符串,记录支持各个差异的短序列数、在长序列上的位置;
(5)对步骤(4)得到的差异进行筛选,筛除错误信息;
(6)基于步骤(5)得到的数据,对与人类基因组24条染色体长序列相应位置上的序列有差异的字符和字符串进行计数,记为短序列变异数;
(7)基于步骤(6)得到的数据,统计各个染色体区域上的短序列变异数之和,记为染色体区域变异数,形成向量A;
(8)将一个以上胎儿染色体无异常的孕妇外周血按照步骤(1)-(7)的方法进行处理形成标准样本,统计不同标准样本中相同染色体区域上的染色体区域变异数的平均值,形成向量B;
(9)使用如下方法得到向量C=(Ci),其中Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是向量C的第i个元素:
Ci=Ai/Bi
对向量C使用隐马尔科夫链模型计算出其中状态不等于1的元素,相邻的状态不等于1的元素对应的染色体上的区域即为染色体异常区域。
2.根据权利要求1所述的胎儿染色体检测方法,其特征在于:步骤(1)中利用得到的血浆游离DNA构建DNA样本文库,并用于步骤(2)中的测序。
3.根据权利要求1所述的胎儿染色体检测方法,其特征在于:步骤(1)中对分离得到的血浆游离DNA进行筛选,筛选出全部外显子、部分外显子或高频变异位点,将筛选出的DNA序列用于步骤(2)进行测序。
4.根据权利要求1所述的胎儿染色体检测方法,其特征在于:所述步骤(3)中人类基因组24条染色体是指22条常染色体、X染色体和Y染色体。
5.根据权利要求1所述的胎儿染色体检测方法,其特征在于:所述步骤(5)筛除只有一条短序列支持的变异字符或字符串。
6.根据权利要求1所述的胎儿染色体检测方法,其特征在于:所述步骤(5)筛除来自相同DNA模板的DNA短序列上相同位置上不一致的字符或字符串。
7.根据权利要求1所述的胎儿染色体检测方法,其特征在于:所述步骤(6)中采用如下方法计数,定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,如果有m个短序列存在变异,则短序列变异数计为1,其中n和m均为大于等于1的正整数。
8.根据权利要求1所述的胎儿染色体检测方法,其特征在于:所述步骤(6)中采用如下方法计数,定位到人类基因组24条染色体长序列某一位置上的n个DNA短序列中,如果有m个短序列存在变异,则短序列变异数计为m,其中n和m均是大于等于1的正整数。
9.根据权利要求1所述的胎儿染色体检测方法的系统,其特征在于:包括一个或多个处理器,其被用于实施权利要求1-8任一项所述的胎儿染色体检测方法。
10.根据权利要求9所述的系统,其特征在于:是一种包括模块的系统,所述模块被配置用于实施权利要求1-8任一项所述的胎儿染色体检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312407.2A CN109402247B (zh) | 2018-11-06 | 2018-11-06 | 一种基于dna变异计数的胎儿染色体检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811312407.2A CN109402247B (zh) | 2018-11-06 | 2018-11-06 | 一种基于dna变异计数的胎儿染色体检测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109402247A true CN109402247A (zh) | 2019-03-01 |
CN109402247B CN109402247B (zh) | 2020-04-07 |
Family
ID=65471865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811312407.2A Expired - Fee Related CN109402247B (zh) | 2018-11-06 | 2018-11-06 | 一种基于dna变异计数的胎儿染色体检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109402247B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021155831A1 (en) * | 2020-02-05 | 2021-08-12 | The Chinese University Of Hong Kong | Molecular analyses using long cell-free fragments in pregnancy |
CN114842472A (zh) * | 2022-07-04 | 2022-08-02 | 杭州德适生物科技有限公司 | 一种基于深度学习的染色体结构异常的检测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102108406A (zh) * | 2010-12-20 | 2011-06-29 | 北京贝瑞和康生物技术有限公司 | 检测胚胎染色体拷贝数的试剂盒、装置和方法 |
CN104951671A (zh) * | 2015-06-10 | 2015-09-30 | 东莞博奥木华基因科技有限公司 | 基于单样本外周血检测胎儿染色体非整倍性的装置 |
CN105844116A (zh) * | 2016-03-18 | 2016-08-10 | 广州市锐博生物科技有限公司 | 测序数据的处理方法和处理装置 |
CN103987856B (zh) * | 2011-12-17 | 2016-08-24 | 深圳华大基因股份有限公司 | 确定基因组是否存在异常的方法及系统 |
-
2018
- 2018-11-06 CN CN201811312407.2A patent/CN109402247B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102108406A (zh) * | 2010-12-20 | 2011-06-29 | 北京贝瑞和康生物技术有限公司 | 检测胚胎染色体拷贝数的试剂盒、装置和方法 |
CN103987856B (zh) * | 2011-12-17 | 2016-08-24 | 深圳华大基因股份有限公司 | 确定基因组是否存在异常的方法及系统 |
CN104951671A (zh) * | 2015-06-10 | 2015-09-30 | 东莞博奥木华基因科技有限公司 | 基于单样本外周血检测胎儿染色体非整倍性的装置 |
CN105844116A (zh) * | 2016-03-18 | 2016-08-10 | 广州市锐博生物科技有限公司 | 测序数据的处理方法和处理装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021155831A1 (en) * | 2020-02-05 | 2021-08-12 | The Chinese University Of Hong Kong | Molecular analyses using long cell-free fragments in pregnancy |
US11371084B2 (en) | 2020-02-05 | 2022-06-28 | The Chinese University Of Hong Kong | Molecular analyses using long cell-free fragments in pregnancy |
GB2605736A (en) * | 2020-02-05 | 2022-10-12 | Univ Hong Kong Chinese | Molecular analyses using long cell-free fragments in pregnancy |
US11591642B2 (en) | 2020-02-05 | 2023-02-28 | The Chinese University Of Hong Kong | Molecular analyses using long cell-free fragments in pregnancy |
GB2605736B (en) * | 2020-02-05 | 2023-05-24 | Univ Hong Kong Chinese | Molecular analyses using long cell-free fragments in pregnancy |
CN114842472A (zh) * | 2022-07-04 | 2022-08-02 | 杭州德适生物科技有限公司 | 一种基于深度学习的染色体结构异常的检测方法及装置 |
CN114842472B (zh) * | 2022-07-04 | 2022-09-23 | 杭州德适生物科技有限公司 | 一种基于深度学习的染色体结构异常的检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109402247B (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104232777B (zh) | 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 | |
CN104232778B (zh) | 同时确定胎儿单体型及染色体非整倍性的方法及装置 | |
CN104204220B (zh) | 一种遗传变异检测方法 | |
CN105483229B (zh) | 一种检测胎儿染色体非整倍体的方法及系统 | |
CN107423578B (zh) | 检测体细胞突变的装置 | |
CN106350589B (zh) | 一种检测遗传性血管疾病致病基因的dna文库及其应用 | |
CN104951671B (zh) | 基于单样本外周血检测胎儿染色体非整倍性的装置 | |
CN107949845A (zh) | 能够在多个平台上区分胎儿性别和胎儿性染色体异常的新方法 | |
EP3752641A1 (en) | Cell free dna deconvolution and use thereof | |
CN105219844A (zh) | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
CN112126677B (zh) | 耳聋单倍型基因突变无创检测方法 | |
CN111091868B (zh) | 一种染色体非整倍体的分析方法及系统 | |
CN106537401A (zh) | 使用母体血清dna预测胎儿单基因遗传变异的方法 | |
CN107075564A (zh) | 确定肿瘤核酸浓度的方法和装置 | |
CN116356001B (zh) | 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法 | |
CN108268752B (zh) | 一种染色体异常检测装置 | |
CN109402247A (zh) | 一种基于dna变异计数的胎儿染色体检测系统 | |
CN104520437B (zh) | 一种染色体非整倍性检测方法及装置 | |
CN106282195A (zh) | 基因突变体及其应用 | |
WO2018149114A1 (zh) | 确定胎儿染色体中微缺失微重复的方法及设备 | |
CN106591451A (zh) | 测定胎儿游离dna含量的方法及其用于实施该方法的装置 | |
CN108229099B (zh) | 数据处理方法、装置、存储介质及处理器 | |
CN109321641B (zh) | 一种基于dna片段富集及测序技术的产前无创胎儿染色体检测系统 | |
KR101618032B1 (ko) | 비침습적 태아 염색체 이상 검출방법 | |
TWI485254B (zh) | 以全基因體趨勢記分為基礎之非侵入性產前檢測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200407 |