CN109686401B - 一种识别异源低频基因组信号唯一性的方法及其应用 - Google Patents

一种识别异源低频基因组信号唯一性的方法及其应用 Download PDF

Info

Publication number
CN109686401B
CN109686401B CN201811566958.1A CN201811566958A CN109686401B CN 109686401 B CN109686401 B CN 109686401B CN 201811566958 A CN201811566958 A CN 201811566958A CN 109686401 B CN109686401 B CN 109686401B
Authority
CN
China
Prior art keywords
calculating
sample
heterologous
sample group
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811566958.1A
Other languages
English (en)
Other versions
CN109686401A (zh
Inventor
曾丰波
杨功达
胡秀弟
李凤梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Biocsi Technology Co ltd
Original Assignee
Shanghai Biocsi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Biocsi Technology Co ltd filed Critical Shanghai Biocsi Technology Co ltd
Priority to CN201811566958.1A priority Critical patent/CN109686401B/zh
Publication of CN109686401A publication Critical patent/CN109686401A/zh
Application granted granted Critical
Publication of CN109686401B publication Critical patent/CN109686401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及生物学领域,尤其涉及一种识别异源低频基因组信号唯一性的方法及其应用。所述方法包括以下步骤:S1、样本选择:S2、获得特征值;S3、计算h:不依赖对照样本组C',采用最大似然估计计算低频异源基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;S4、计算k、Δk:计算获得的所有k,求其标准差为Sk,Δk=2Sk;S5、判定异源信号的唯一性:异源信号的个数为n,若h=p2/p1∈[k‑Δk,k+Δk],则n=1,否则n>1。通过将生命科学和计算机科学相结合,本发明公开了一种新的识别基因组异源信号唯一性的方法,该方法准确率高,可重复性且成本低,可用于识别基因组样品中,除真实的低频信号之外是否含有外源污染,从而提高检测结果的准确率。

Description

一种识别异源低频基因组信号唯一性的方法及其应用
技术领域
本发明涉及生物学领域,尤其涉及一种识别异源低频基因组信号唯一性的方法及其应用。
背景技术
NIPT(无创产前诊断)和肿瘤液态活检技术,都是基于识别外周血游离DNA的异源信号。NIPT一般需要孕妇外周血游离DNA中来自胎儿的信号超过百分之四,肿瘤液态活检可以检测到低于千分之一的来自于肿瘤组织的DNA。然而实际生产过程中,会面临异源信号来源大于一个的问题。NIPT中4%的小信号可能含有采样或者生产过程中引入的其他污染信号,造成假阴性的结果,这些都是本领域技术人员所不期望看到。
近年来,随着芯片技术和第二代高通量测序技术的发展,生物信息研究人员已针对这两种不同的技术开发了许多相对应的软件用于检测基因组的结构性变异。然而如何利用生物信息学来发明一种识别异源低频基因组信号唯一性的方法至今还未报道过。
发明内容
本发明通过将生命科学和计算机科学相结合,发明了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低,解决了现有技术中NIPT等技术中出现的假阴性问题。
本发明的具体方案如下:
本发明一方面公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:获得一组含异源信号的样本组T、一组随机不含异源信号的对照样本组C、待检样本x和对照样本组C';
S2、获得特征值:得到样本组T、对照样本组C、对照样本组C'、待检样本x中所有样本的每个特征点W的值;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算低频异源基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;
S4、计算k、Δk:对样本组T和对照样本组C进行抽样,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;其中,
k=∑i(p2,i/p1,i)/100;
计算获得的所有k,求其标准差为Sk,Δk=2Sk
S5、判定异源信号的唯一性:异源信号的个数为n,
Figure BDA0001912681700000021
优选的,所述特征点W包括SNP、INDEL和甲基化位点中的一种或者其任意组合。
优选的,在S2中,所述特征值采用二代测序技术测得;
优选的,在S2中,所述特征值采用芯片技术、数字PCR或者一代测序技术测得。
优选的,若所述样本组T、对照样本组C、对照样本组C'均只有一个样本,则采取反复抽样的方法。
若样本组C和C’难以获得,可以根据已有的特征位点在人群中的频率,使用哈迪-温伯格定律进行模拟生成样本。
优选的,每次抽取其中75%-85%的特征值位点。更优选的,每次抽取其中80%的特征值位点。
优选的,所述特征点的值通过实验数据检测获得。
优选的,所述特征点的值通过计算模拟得到。
本发明第二个方面公开了上述的方法在生物学领域中的应用。
优选的,对于正常样本来说,所述方法可用于区分样本的数据是否被污染。
优选的,对于孕妇来说,所述方法可用于判断怀孕为单胎还是异卵双胎。
优选的,对于肿瘤患者来说,所述方法可用于判断肿瘤信号是一个来源还是多个来源。
本发明具有如下优点或者有益效果:
通过将生命科学和计算机科学相结合,本发明公开了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低,可用于识别基因组样品中,除真实的低频信号之外是否含有外源污染,从而提高检测结果的准确率。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制。
图1为本发明实施例1中p2值的分布示意图;
图2为本发明实施例1中p1和p2的分布示意图;
图3是本发明实施例2中p1和p2的分布示意图,其中点o代表了样本组T的结果,点*代表待检样本x的结果。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于本发明而不用于限制本发明的范围。
实施例1
本实施例公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:样本组T只有一个样本,编号2018110747S,样本为孕妇血浆游离DNA样本,单胎,孕周为18周。样本组C只有一个样本,编号2018110747F,样本为血液DNA样本,为胎儿生父。待检样本x为异卵双胎孕妇血浆游离DNA样本,编2018042088S,孕周13周。对照样本组C'中只有一个样本,编号2018042088F,样本为毛发DNA样本,为胎儿生父。
S2、获得特征值:使用二代测序技术测得样本组T、对照样本组C、对照样本组C'和待检样本x这4个样本的6000个SNP位点上各个等位基因的出现次数;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算p1,计算胎儿DNA在孕妇血浆游离DNA中的比例p1=0.487;依赖对照样本组C',采用最大似然估计计算p2,,采用抽样方法获得足够样本数。每次抽取其中80%的SNP位点,共抽取100次,获得100个样本。p2=∑w∈C′p2(w)/100=0.051。通过R语言数据处理,100个抽样的p2图形如图1所示;
h=p2/p1=0.51/0.487=1.047;
S4、计算k、Δk:样本组T只有一个样本,对照样本组C也只有一个样本,对T和C进行反复抽样,每次抽取80%个特征点,共100次,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;通过R语言数据处理,结果如图2所示,
k=∑i(p2,i/p1,i)/100=0.985;
计算获得的所有k,求其标准差为Sk,Δk=2Sk=0.0215x2=0.04;
S5、判定异源信号的唯一性:h=1.047>k+Δk=0.985+0.04=1.025,结果表明待检样本中含有超过一个异源信号。
本实施例公开了一种新的识别异源低频基因组信号唯一性的方法,该方法准确率高,可重复性且成本低。
实施例2
本实施例公开了一种识别异源低频基因组信号唯一性的方法,包括以下步骤:
S1、样本选择:选取p1∈(0.064;0.068)的孕妇血浆游离DNA样本10个,构成样本组T,选取97个男性血液样本构成样本组C,选择C'=C,选择编号2018052905样本为待检样本x;
S2、特征值获得:使用二代测序技术测得T、C、x这些样本的6000个SNP位点上各个等位基因的出现次数;
S3、计算h;通过R语言数据处理,样本组T和待测样本x的计算结果如图3所示:
样本x的p1=0.0644;p2=(∑w∈C′p2(w))/97=0.0369;
h=p2/p1=0.0369/0.0644=0.573;
S4、计算k、Δk;
k=∑i(p2,i/p1,i)/970=0.489;
Δk=0.015×2=0.03;
其中p2,i表示第i个T样本组中样本和C样本组计算所得p2。
S5、判定异源信号的唯一性:h=0.573>k+Δk=0.489+0.03=0.519;
说明待检样本x中含有超过一个异源信号。
以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

Claims (7)

1.一种识别异源低频基因组信号唯一性的方法,其特征在于,包括以下步骤:
S1、样本选择:获得一组含异源信号的样本组T、一组随机不含异源信号的对照样本组C、待检样本x和对照样本组C';
S2、获得特征值:得到样本组T、对照样本组C、对照样本组C'、待检样本x中所有样本的每个特征点W的值;
S3、计算h:不依赖对照样本组C',采用最大似然估计计算异源低频基因组总浓度p1;依赖对照样本组C',采用最大似然估计计算低频信号浓度p2,h=p2/p1;
S4、计算k、Δk:对样本组T和对照样本组C进行抽样,获得一一对应的样本对{Ti,Ci},计算对应的p1和p2;其中,
k=∑i(p2,i/p1,i)/100;
计算获得的所有k,求其标准差为Sk,Δk=2Sk
S5、判定异源信号的唯一性:异源信号的个数为n,
Figure FDA0003674191780000011
2.根据权利要求1所述的方法,其特征在于,所述特征点W包括SNP、INDEL和甲基化位点中的一种或者其任意组合。
3.根据权利要求1所述的方法,其特征在于,在S2中,所述特征值采用二代测序技术测得。
4.根据权利要求1所述的方法,其特征在于,若所述样本组T、对照样本组C、对照样本组C'均只有一个样本,则采取反复抽样的方法。
5.根据权利要求4所述的方法,其特征在于,每次抽取其中75%-85%的特征值位点。
6.根据权利要求1所述的方法,其特征在于,所述特征点的值通过实验数据检测获得。
7.根据权利要求1所述的方法,其特征在于,所述特征点的值通过计算模拟获得。
CN201811566958.1A 2018-12-19 2018-12-19 一种识别异源低频基因组信号唯一性的方法及其应用 Active CN109686401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811566958.1A CN109686401B (zh) 2018-12-19 2018-12-19 一种识别异源低频基因组信号唯一性的方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811566958.1A CN109686401B (zh) 2018-12-19 2018-12-19 一种识别异源低频基因组信号唯一性的方法及其应用

Publications (2)

Publication Number Publication Date
CN109686401A CN109686401A (zh) 2019-04-26
CN109686401B true CN109686401B (zh) 2022-08-05

Family

ID=66188509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811566958.1A Active CN109686401B (zh) 2018-12-19 2018-12-19 一种识别异源低频基因组信号唯一性的方法及其应用

Country Status (1)

Country Link
CN (1) CN109686401B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103534591A (zh) * 2010-10-26 2014-01-22 利兰·斯坦福青年大学托管委员会 通过测序分析进行的非侵入性胎儿遗传筛选
WO2014209597A2 (en) * 2013-06-28 2014-12-31 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
CN106460070A (zh) * 2014-04-21 2017-02-22 纳特拉公司 检测染色体片段中的突变和倍性
CN107254514A (zh) * 2017-05-12 2017-10-17 苏州人人基因科技有限公司 检测异源cfDNA的SNP分子标记及检测方法、用途
CN108875307A (zh) * 2018-06-29 2018-11-23 上海欧易生物医学科技有限公司 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011087760A2 (en) * 2009-12-22 2011-07-21 Sequenom, Inc. Processes and kits for identifying aneuploidy

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103534591A (zh) * 2010-10-26 2014-01-22 利兰·斯坦福青年大学托管委员会 通过测序分析进行的非侵入性胎儿遗传筛选
WO2014209597A2 (en) * 2013-06-28 2014-12-31 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
CN106460070A (zh) * 2014-04-21 2017-02-22 纳特拉公司 检测染色体片段中的突变和倍性
CN107254514A (zh) * 2017-05-12 2017-10-17 苏州人人基因科技有限公司 检测异源cfDNA的SNP分子标记及检测方法、用途
CN108875307A (zh) * 2018-06-29 2018-11-23 上海欧易生物医学科技有限公司 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法

Also Published As

Publication number Publication date
CN109686401A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
US20220010371A1 (en) Rapid aneuploidy detection
JP6534191B2 (ja) コピー数変動を決定することにおける検出の感度を向上させるための方法
IL249095B2 (en) Detection of subchromosomal aneuploidy in the fetus and variations in the number of copies
KR20170036734A (ko) 생물학적 샘플 중의 무세포 핵산의 분획을 결정하기 위한 방법 및 장치 및 이의 용도
CN105844116B (zh) 测序数据的处理方法和处理装置
JP2015506684A (ja) ゲノムのコピー数変異の有無を判断する方法、システム及びコンピューター読み取り可能な記憶媒体
US20080108071A1 (en) Methods and Systems to Determine Fetal Sex and Detect Fetal Abnormalities
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测系统
EP3171288A1 (en) Method for prediction of fetal monogenic genetic variations using maternal serum dna
KR101678962B1 (ko) 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
EP3023504A1 (en) Method and device for detecting chromosomal aneuploidy
CN108197428B (zh) 一种并行动态规划的下一代测序技术拷贝数变异检测方法
KR101963245B1 (ko) 다중 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
CN109686401B (zh) 一种识别异源低频基因组信号唯一性的方法及其应用
WO2024011929A1 (zh) 检测胎儿染色体非整倍体异常的方法、装置及存储介质
CN108229099B (zh) 数据处理方法、装置、存储介质及处理器
KR20190114351A (ko) 비침습적 산전 검사에 의한 태아 염색체의 미세결실 또는 미세증폭의 확인 방법
CN107723343A (zh) 一种基因定量分析的方法
KR101618032B1 (ko) 비침습적 태아 염색체 이상 검출방법
CN109321641B (zh) 一种基于dna片段富集及测序技术的产前无创胎儿染色体检测系统
KR102519739B1 (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
EP3907739A1 (en) Method for determining fetal fraction in maternal sample
KR102532991B1 (ko) 태아의 염색체 이수성 검출방법
Peng et al. Impact of In Vitro Cell Subculture on Mosaicism: Comparative Analysis of Chromosome Microarray and Karyotype Results
WO2020225632A1 (en) Method for the direct determination of fetal aneuploidies by non-invasive analysis of the fetal dna from maternal blood by means of dpcr

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant