CN107133491A - 一种获取胎儿游离dna浓度的方法 - Google Patents

一种获取胎儿游离dna浓度的方法 Download PDF

Info

Publication number
CN107133491A
CN107133491A CN201710140534.8A CN201710140534A CN107133491A CN 107133491 A CN107133491 A CN 107133491A CN 201710140534 A CN201710140534 A CN 201710140534A CN 107133491 A CN107133491 A CN 107133491A
Authority
CN
China
Prior art keywords
fetus
dissociative dna
parent
dna concentration
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710140534.8A
Other languages
English (en)
Other versions
CN107133491B (zh
Inventor
胡天亮
欧阳国军
翁荣涛
杨学习
梁志坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Da Rui Biotechnology Ltd
Original Assignee
Guangzhou Da Rui Biotechnology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Da Rui Biotechnology Ltd filed Critical Guangzhou Da Rui Biotechnology Ltd
Priority to CN201710140534.8A priority Critical patent/CN107133491B/zh
Publication of CN107133491A publication Critical patent/CN107133491A/zh
Application granted granted Critical
Publication of CN107133491B publication Critical patent/CN107133491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Abstract

本发明公开一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。

Description

一种获取胎儿游离DNA浓度的方法
技术领域
本发明涉及无创产前检测领域,更具体地,涉及一种获取胎儿游离DNA浓度的方法。
背景技术
无创产前基因检测(NIPT)通过采集孕妇外周血,提取其中的胎儿游离DNA。利用基因测序技术并结合生物信息学分析手段,便可准确判断胎儿是否患有染色体病。当胎儿游离DNA比例过低时可能因为胎儿DNA量太少而不能被检测出来染色体是否有异常,所以胎儿游离DNA浓度检测是无创产前基因检测中至关重要的步骤。
现有成熟的胎儿游离DNA浓度检测技术都是基于Y染色体在cfDNA中的含量来确定的,由于女胎不存在Y染色体,因此这个方法不适用于女胎。也有通过划分固定区间来统计母体和胎儿cfDNA片段的数量,以求得胎儿浓度的方法。但是,由于不同样本、不同胎龄的样本,它们的cfDNA片段长度的分布不是固定不变的,该方法无法动态获取准确的统计区间,得到的结果的准确度也受到严重的影响。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种获取胎儿游离DNA浓度的方法。
为解决上述技术问题,本发明的技术方案如下:
一种获取胎儿游离DNA浓度的方法,包括以下步骤:
S1:获取母血游离DNA(cfDNA),并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
在一种优选的方案中,步骤S2中,所述高斯混合模型表示为:
其中,K为正整数,N(x|μii)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μii);
在一种优选的方案中,步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
其中
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
S23:目标函数为:通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
更新参数:
S24:返回步骤S21,循环直到实现最大化结束。
在一种优选的方案中,取K的值为:K=5。
与现有技术相比,本发明技术方案的有益效果是:本发明提供一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。
附图说明
图1为本发明获取胎儿游离DNA浓度的方法的流程图。
图2为本发明步骤S2的具体流程图。
具体实施方式
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种获取胎儿游离DNA浓度的方法,包括以下步骤:
S1:获取母血游离DNA(cfDNA),并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
在具体实施过程中,步骤S2中,所述高斯混合模型表示为:
其中,K为正整数,N(x|μii)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μii);
如图2所示,在具体实施过程中,步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
其中
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
S23:目标函数为:通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
更新参数:
S24:返回步骤S21,循环直到实现最大化结束。
在具体实施过程中,取K的值为:K=5。
本发明提供一种获取胎儿游离DNA浓度的方法,对母体外周血中的cfDNA片段长度的数据,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的cfDNA进行量化,自动准确的获取五个波峰和对应的分布范围,得到胎儿cfDNA的浓度,为产前无创检测(NIPT)提供更加合适和可靠的胎儿浓度,具有普适性和准确性。本方法通过动态确定母体和胎儿cfDNA片段长度的分布区域,对男胎和女胎都有效,并且对于不同胎儿以及胎龄的样本,能够自动获取并识别母体和胎儿cfDNA的分布,保证了胎儿浓度的准确度。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (4)

1.一种获取胎儿游离DNA浓度的方法,其特征在于,包括以下步骤:
S1:获取母血游离DNA,并统计游离DNA片段长度;
S2:将统计游离DNA片段长度输入到高斯混合模型,采用拥有K个正态分布的高斯混合模型,对母体和胎儿的游离DNA进行量化,获取K个波峰和对应的分布范围,得到胎儿游离DNA的浓度;
S3:通过搜索比对正态分布的期望的大小,从K个正态分布分布中找出属于母体和胎儿的分布,得到对应的属于母体和胎儿的游离DNA片段数量Ni,其中i表示1到K中属于母体和胎儿的编号;
S4:与已知确定的胎儿游离DNA浓度进行三维线性拟合,得到三维线性拟合的系数,对测得的胎儿游离DNA浓度进行优化并输出结果。
2.根据权利要求1所述的获取胎儿游离DNA浓度的方法,其特征在于,步骤S2中,所述高斯混合模型表示为:
其中,K为正整数,N(x|μii)为正态分布,μi表示期望,σi表示方差,样本x以πi的概率隶属于正态分布N(x|μii)。
3.根据权利要求2所述的获取胎儿游离DNA浓度的方法,其特征在于,步骤S2中,具体步骤包括:
S21:计算样本xj发生的概率p(xj),其中j=1…n,n为正整数,p(xj)的公式为:
其中
S22:则样本xj存在,第k(k=1,2,…,K)个正态分布发生的概率为:
S23:目标函数为:通过最大似然法求得属于母体和胎儿的游离DNA片段数量:
更新参数:
S24:返回步骤S21,循环直到实现最大化结束。
4.根据权利要求2所述的获取胎儿游离DNA浓度的方法,其特征在于,取K的值为:K=5。
CN201710140534.8A 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法 Active CN107133491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710140534.8A CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710140534.8A CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Publications (2)

Publication Number Publication Date
CN107133491A true CN107133491A (zh) 2017-09-05
CN107133491B CN107133491B (zh) 2020-05-29

Family

ID=59721135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710140534.8A Active CN107133491B (zh) 2017-03-08 2017-03-08 一种获取胎儿游离dna浓度的方法

Country Status (1)

Country Link
CN (1) CN107133491B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN108334751A (zh) * 2018-02-06 2018-07-27 国家卫生计生委科学技术研究所 一种计算物质浓度的方法及装置
WO2020063052A1 (zh) * 2018-09-30 2020-04-02 北京优迅医疗器械有限公司 胎儿游离dna浓度获取方法、获取装置、存储介质及电子装置
CN110970089A (zh) * 2019-11-29 2020-04-07 北京优迅医疗器械有限公司 胎儿浓度计算的预处理方法、预处理装置及其应用
WO2021026828A1 (zh) * 2019-08-14 2021-02-18 深圳华大基因股份有限公司 确定孕妇血液中胎儿核酸浓度的方法及设备
WO2021243650A1 (zh) * 2020-06-04 2021-12-09 深圳华大基因股份有限公司 确定孕妇的孕期状态的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103215350A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种基于单核苷酸多态性位点的孕妇血浆中胎儿dna含量的测定方法
CN104164417A (zh) * 2014-06-26 2014-11-26 北京圣谷同创科技发展有限公司 一种外周血胎儿游离dna提取方法
CN104846089A (zh) * 2015-05-06 2015-08-19 厦门万基生物科技有限公司 一种孕妇外周血中胎儿游离dna比例的定量方法
CN105926043A (zh) * 2016-04-19 2016-09-07 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103215350A (zh) * 2013-03-26 2013-07-24 赛业(苏州)生物信息技术有限公司 一种基于单核苷酸多态性位点的孕妇血浆中胎儿dna含量的测定方法
CN104164417A (zh) * 2014-06-26 2014-11-26 北京圣谷同创科技发展有限公司 一种外周血胎儿游离dna提取方法
CN104846089A (zh) * 2015-05-06 2015-08-19 厦门万基生物科技有限公司 一种孕妇外周血中胎儿游离dna比例的定量方法
CN105926043A (zh) * 2016-04-19 2016-09-07 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIONGBIN KANG ETC,: ""An Advanced Model to Precisely Estimate the Cell-Free Fetal DNA Concentration inMaternal Plasma"", 《PLOS ONE》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256296A (zh) * 2017-12-29 2018-07-06 北京科迅生物技术有限公司 数据处理方法及装置
CN108256296B (zh) * 2017-12-29 2021-05-25 北京科迅生物技术有限公司 数据处理装置
CN108334751A (zh) * 2018-02-06 2018-07-27 国家卫生计生委科学技术研究所 一种计算物质浓度的方法及装置
WO2020063052A1 (zh) * 2018-09-30 2020-04-02 北京优迅医疗器械有限公司 胎儿游离dna浓度获取方法、获取装置、存储介质及电子装置
WO2021026828A1 (zh) * 2019-08-14 2021-02-18 深圳华大基因股份有限公司 确定孕妇血液中胎儿核酸浓度的方法及设备
CN110970089A (zh) * 2019-11-29 2020-04-07 北京优迅医疗器械有限公司 胎儿浓度计算的预处理方法、预处理装置及其应用
CN110970089B (zh) * 2019-11-29 2023-05-23 北京优迅医疗器械有限公司 胎儿浓度计算的预处理方法、预处理装置及其应用
WO2021243650A1 (zh) * 2020-06-04 2021-12-09 深圳华大基因股份有限公司 确定孕妇的孕期状态的方法

Also Published As

Publication number Publication date
CN107133491B (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN107133491A (zh) 一种获取胎儿游离dna浓度的方法
CN103525939B (zh) 无创检测胎儿染色体非整倍体的方法和系统
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测系统
CN105483229B (zh) 一种检测胎儿染色体非整倍体的方法及系统
CN108877949B (zh) 基于孤立森林算法和投票机制的唐氏综合症筛查方法
CN104951671B (zh) 基于单样本外周血检测胎儿染色体非整倍性的装置
CN107133495A (zh) 一种非整倍性生物信息的分析方法和分析系统
CN106096330B (zh) 一种无创产前生物信息检测分析方法
CN104169929B (zh) 用于确定胎儿是否存在性染色体数目异常的系统和装置
JP6623400B2 (ja) 染色体異数性を測定するためのキット、装置及び方法
CN108256292A (zh) 一种拷贝数变异检测装置
CN112435756B (zh) 基于多数据集差异互证的肠道菌群关联疾病风险预测系统
CN105051208A (zh) 确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质
EP3023504B1 (en) Method and device for detecting chromosomal aneuploidy
CN107622183B (zh) 一种基于多重指标的胎儿染色体倍性检测分析方法
Tentoni et al. Birthweight by gestational age in preterm babies according to a Gaussian mixture model
CN117906726B (zh) 一种活牛体尺体重数据异常检测系统
CN106778069A (zh) 确定胎儿染色体中微缺失微重复的方法及设备
AU2019480813A8 (en) Methods for determining chromosome aneuploidy and constructing classification model, and device
WO2024011929A1 (zh) 检测胎儿染色体非整倍体异常的方法、装置及存储介质
CN110010202B (zh) 一种判断流苏石斛纯种相近度的方法的建立、判断标准以及判断方法
CN104678091A (zh) 尿液分析仪的阈值设定方法和系统
TWI485254B (zh) 以全基因體趨勢記分為基礎之非侵入性產前檢測方法
CN105137011A (zh) 一种用于牛群中隐性乳房炎奶牛筛查的系统
CN109321641A (zh) 一种基于dna片段富集及测序技术的产前无创胎儿染色体检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Liang Zhikun

Inventor after: Wu Yingsong

Inventor after: Yang Xuexi

Inventor after: Li Ming

Inventor after: Hu Tianliang

Inventor after: Ouyang Guojun

Inventor after: Weng Rongtao

Inventor before: Hu Tianliang

Inventor before: Ouyang Guojun

Inventor before: Weng Rongtao

Inventor before: Yang Xuexi

Inventor before: Liang Zhikun

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant