CN107133491B - 一种获取胎儿游离dna浓度的方法 - Google Patents

一种获取胎儿游离dna浓度的方法 Download PDF

Info

Publication number
CN107133491B
CN107133491B CN201710140534.8A CN201710140534A CN107133491B CN 107133491 B CN107133491 B CN 107133491B CN 201710140534 A CN201710140534 A CN 201710140534A CN 107133491 B CN107133491 B CN 107133491B
Authority
CN
China
Prior art keywords
free dna
fetus
fetal
concentration
mother
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710140534.8A
Other languages
English (en)
Other versions
CN107133491A (zh
Inventor
梁志坤
吴英松
杨学习
李明
胡天亮
欧阳国军
翁荣涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Darui Biotechnology Co ltd
Original Assignee
Guangzhou Darui Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Darui Biotechnology Co ltd filed Critical Guangzhou Darui Biotechnology Co ltd
Priority to CN201710140534.8A priority Critical patent/CN107133491B/zh
Publication of CN107133491A publication Critical patent/CN107133491A/zh
Application granted granted Critical
Publication of CN107133491B publication Critical patent/CN107133491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Abstract

本发明公开一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。

Description

一种获取胎儿游离DNA浓度的方法
技术领域
本发明涉及无创产前检测领域,更具体地,涉及一种获取胎儿游离DNA浓度的方法。
背景技术
无创产前基因检测(NIPT)通过采集孕妇外周血,提取其中的胎儿游离DNA。利用基因测序技术并结合生物信息学分析手段,便可准确判断胎儿是否患有染色体病。当胎儿游离DNA比例过低时可能因为胎儿DNA量太少而不能被检测出来染色体是否有异常,所以胎儿游离DNA浓度检测是无创产前基因检测中至关重要的步骤。
现有成熟的胎儿游离DNA浓度检测技术都是基于Y染色体在cfDNA中的含量来确定的,由于女胎不存在Y染色体,因此这个方法不适用于女胎。也有通过划分固定区间来统计母体和胎儿cfDNA片段的数量,以求得胎儿浓度的方法。但是,由于不同样本、不同胎龄的样本,它们的cfDNA片段长度的分布不是固定不变的,该方法无法动态获取准确的统计区间,得到的结果的准确度也受到严重的影响。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种获取胎儿游离DNA浓度的方法。
为解决上述技术问题,本发明的技术方案如下:
一种获取胎儿游离DNA浓度的方法,包括以下步骤:
S1:获取母血游离DNA(cfDNA),并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
在一种优选的方案中,步骤S2中,所述高斯混合模型表示为:
Figure BDA0001241254380000021
其中,K为正整数,N(x|μii)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μii);
在一种优选的方案中,步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
Figure BDA0001241254380000022
其中
Figure BDA0001241254380000023
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
Figure BDA0001241254380000024
S23:目标函数为:
Figure BDA0001241254380000025
通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
Figure BDA0001241254380000026
更新参数:
Figure BDA0001241254380000027
Figure BDA0001241254380000028
Figure BDA0001241254380000029
S24:返回步骤S21,循环直到实现最大化结束。
在一种优选的方案中,取K的值为:K=5。
与现有技术相比,本发明技术方案的有益效果是:本发明提供一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。
附图说明
图1为本发明获取胎儿游离DNA浓度的方法的流程图。
图2为本发明步骤S2的具体流程图。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种获取胎儿游离DNA浓度的方法,包括以下步骤:
S1:获取母血游离DNA(cfDNA),并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
在具体实施过程中,步骤S2中,所述高斯混合模型表示为:
Figure BDA0001241254380000031
其中,K为正整数,N(x|μii)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μii);
如图2所示,在具体实施过程中,步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
Figure BDA0001241254380000041
其中
Figure BDA0001241254380000042
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
Figure BDA0001241254380000043
S23:目标函数为:
Figure BDA0001241254380000044
通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
Figure BDA0001241254380000045
更新参数:
Figure BDA0001241254380000046
Figure BDA0001241254380000047
Figure BDA0001241254380000048
S24:返回步骤S21,循环直到实现最大化结束。
在具体实施过程中,取K的值为:K=5。
本发明提供一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (2)

1.一种获取胎儿游离DNA浓度的方法,其特征在于,包括以下步骤:
S1:获取母血游离DNA,并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
所述高斯混合模型表示为:
Figure FDA0002359245410000011
其中,K为正整数,N(x|μi,σi)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μi,σi);
步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
Figure FDA0002359245410000012
其中
Figure FDA0002359245410000013
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
Figure FDA0002359245410000014
S23:目标函数为:
Figure FDA0002359245410000015
通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
更新参数:
Figure FDA0002359245410000017
Figure FDA0002359245410000018
Figure FDA0002359245410000021
S24:返回步骤S21,循环直到实现最大化结束;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
2.根据权利要求1所述的获取胎儿游离DNA浓度的方法,其特征在于,取K的值为:K=5。
CN201710140534.8A 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法 Active CN107133491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710140534.8A CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710140534.8A CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Publications (2)

Publication Number Publication Date
CN107133491A CN107133491A (zh) 2017-09-05
CN107133491B true CN107133491B (zh) 2020-05-29

Family

ID=59721135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710140534.8A Active CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Country Status (1)

Country Link
CN (1) CN107133491B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256296B (zh) * 2017-12-29 2021-05-25 北京科迅生物技术有限公司 数据处理装置
CN108334751B (zh) * 2018-02-06 2021-01-05 国家卫生健康委科学技术研究所 一种计算物质浓度的方法及装置
CN109461473B (zh) * 2018-09-30 2019-12-17 北京优迅医疗器械有限公司 胎儿游离dna浓度获取方法和装置
EP3916105B1 (en) * 2019-08-14 2023-01-25 BGI Genomics Co., Limited Method and device for determining fetal nucleic acid concentration in blood of pregnant woman
CN110970089B (zh) * 2019-11-29 2023-05-23 北京优迅医疗器械有限公司 胎儿浓度计算的预处理方法、预处理装置及其应用
EP4163384A4 (en) * 2020-06-04 2023-07-26 BGI Genomics Co., Limited METHOD OF DETERMINING THE STATUS OF PREGNANCY PREGNANT

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103215350A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种基于单核苷酸多态性位点的孕妇血浆中胎儿dna含量的测定方法
CN104164417A (zh) * 2014-06-26 2014-11-26 北京圣谷同创科技发展有限公司 一种外周血胎儿游离dna提取方法
CN104846089A (zh) * 2015-05-06 2015-08-19 厦门万基生物科技有限公司 一种孕妇外周血中胎儿游离dna比例的定量方法
CN105926043A (zh) * 2016-04-19 2016-09-07 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103215350A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种基于单核苷酸多态性位点的孕妇血浆中胎儿dna含量的测定方法
CN104164417A (zh) * 2014-06-26 2014-11-26 北京圣谷同创科技发展有限公司 一种外周血胎儿游离dna提取方法
CN104846089A (zh) * 2015-05-06 2015-08-19 厦门万基生物科技有限公司 一种孕妇外周血中胎儿游离dna比例的定量方法
CN105926043A (zh) * 2016-04-19 2016-09-07 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"An Advanced Model to Precisely Estimate the Cell-Free Fetal DNA Concentration inMaternal Plasma";Xiongbin Kang etc,;《PLoS ONE》;20160923;第11卷(第9期);第1-3页 *

Also Published As

Publication number Publication date
CN107133491A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN107133491B (zh) 一种获取胎儿游离dna浓度的方法
CN108573125B (zh) 一种基因组拷贝数变异的检测方法及包含该方法的装置
RU2699728C2 (ru) Способ и устройство для определения фракции внеклеточных нуклеиновых кислот в биологическом образце и их применение
CN112365927B (zh) Cnv检测装置
IL249095B2 (en) Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies
CN106096330B (zh) 一种无创产前生物信息检测分析方法
CN110268044B (zh) 一种染色体变异的检测方法及装置
JP6623400B2 (ja) 染色体異数性を測定するためのキット、装置及び方法
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测系统
CN105483229A (zh) 一种检测胎儿染色体非整倍体的方法及系统
EP3171288A1 (en) Method for prediction of fetal monogenic genetic variations using maternal serum dna
EP3023504B1 (en) Method and device for detecting chromosomal aneuploidy
CN104156631A (zh) 染色体三倍体检验方法
Mukhopadhyay Large-scale mode identification and data-driven sciences
CN112435756B (zh) 基于多数据集差异互证的肠道菌群关联疾病风险预测系统
CN111226281B (zh) 确定染色体非整倍性、构建分类模型的方法和装置
Roitberg et al. Inter-observer and intra-observer differences in measuring body length: a test in the common lizard, Zootoca vivipara
WO2024011929A1 (zh) 检测胎儿染色体非整倍体异常的方法、装置及存储介质
WO2016176846A1 (zh) 检测染色体非整倍性的试剂盒、装置和方法
CN108229099B (zh) 数据处理方法、装置、存储介质及处理器
CN110010202B (zh) 一种判断流苏石斛纯种相近度的方法的建立、判断标准以及判断方法
CN110191964B (zh) 确定生物样本中预定来源的游离核酸比例的方法及装置
KR101618032B1 (ko) 비침습적 태아 염색체 이상 검출방법
CN110970089B (zh) 胎儿浓度计算的预处理方法、预处理装置及其应用
CN109243533B (zh) 一种用于计算基因的组织特异表达的鲁棒z-score打分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liang Zhikun

Inventor after: Wu Yingsong

Inventor after: Yang Xuexi

Inventor after: Li Ming

Inventor after: Hu Tianliang

Inventor after: Ouyang Guojun

Inventor after: Weng Rongtao

Inventor before: Hu Tianliang

Inventor before: Ouyang Guojun

Inventor before: Weng Rongtao

Inventor before: Yang Xuexi

Inventor before: Liang Zhikun

GR01 Patent grant
GR01 Patent grant