CN108875307B - 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 - Google Patents

一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 Download PDF

Info

Publication number
CN108875307B
CN108875307B CN201810714037.9A CN201810714037A CN108875307B CN 108875307 B CN108875307 B CN 108875307B CN 201810714037 A CN201810714037 A CN 201810714037A CN 108875307 B CN108875307 B CN 108875307B
Authority
CN
China
Prior art keywords
depth
pregnant woman
allele
peripheral blood
cfdna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810714037.9A
Other languages
English (en)
Other versions
CN108875307A (zh
Inventor
靳超
赵琪
陈旭
史贤俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Oe Biotech Co ltd
Original Assignee
Shanghai Oe Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Oe Biotech Co ltd filed Critical Shanghai Oe Biotech Co ltd
Priority to CN201810714037.9A priority Critical patent/CN108875307B/zh
Publication of CN108875307A publication Critical patent/CN108875307A/zh
Application granted granted Critical
Publication of CN108875307B publication Critical patent/CN108875307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本发明涉及生物遗传学技术领域,特别涉及一种基于孕妇外周血中胎儿游离DNA的亲子鉴定方法。所述基于孕妇外周血中胎儿游离DNA的亲子鉴定方法所采用的检测样本易于获取,有效避免对孕妇或胎儿造成不必要的医疗风险;同时,本发明所提供的排除性指标X1以及所建立的亲子鉴定的证据价值评估模型(公式IV、公式V、公式VI等)不但能够有效避免误判,而且具有更高的鉴定效能;此外,该亲子鉴定方法操作简单,分析效率高;因此,实施本发明所提供的亲子鉴定方法获得的检验结果可进一步作为一种有效的法律证据,从而可广泛用于司法亲子鉴定等应用领域。

Description

一种基于孕妇外周血中胎儿游离DNA的亲子鉴定方法
技术领域
本发明涉及生物遗传学技术领域,特别涉及一种基于孕妇外周血中胎儿游离DNA的亲子鉴定方法。
背景技术
现有技术中,胎儿分娩前的亲子鉴定主要包括两种方案:
第一种方案是:在胎儿达到一定孕周(至少13-14周)后通过羊水穿刺,或通过绒毛膜活检等获得产前样本,采用传统的基于短串联重复(Short tandem repeat,STR)遗传标记的法医亲子鉴定试剂盒实施亲子鉴定,并依据司法鉴定技术规范《亲权鉴定技术规范》(SF/Z JD0105001-2016)以判定胎儿的生物学父亲。《亲权鉴定技术规范》给出了采用传统STR进行亲权指数计算的方法,而亲权指数作为判断遗传学证据价值的指标业已得到学界与法律界的广泛认可。
第二种方案是:通过孕妇外周血中胎儿游离DNA进行胎儿的亲子鉴定。早在1997年,香港中文大学卢煜明教授就已在孕妇外周血中发现存在胎儿游离DNA(cell freefetus DNA,cffDNA)。然而,一般情况下,胎儿的游离DNA含量较低,通常在孕12-16周的胎儿游离DNA含量为5%-10%左右。利用孕妇外周血游离DNA片段中所包含的胎儿来源的游离DNA,目前已开发出一系列遗传病的无创(对胎儿而言)检测技术,并已获得中国食品药品监督管理局(CFDA)的批准,而这一技术也被称为无创产前筛查技术(Noninvasive prenataltesting,NIPT)。由于孕妇外周血中的游离DNA是一种混合样本,既包含胎儿的游离DNA片段,也包含孕妇自身的游离DNA片段,因此要获得胎儿游离DNA片段基因分型结果用于亲权鉴定,与NIPT一样也需要采用新一代高通量基因测序(Next generation sequencing,NGS)技术。如有学者采用类似NGS技术对孕妇外周血游离DNA进行测序后,依据单核苷酸多态性(Single nucleotide polymorphism,SNP)遗传标记进行亲权关系判断,并申请了专利(CN104946773B);该专利所提供的技术方案经验性地给出判定亲权与排除亲权的标准,例如,其指出当否定位点数目大于等于5个即可否定胎儿与待定男性的亲缘关系。
然而,现有的上述任何一种技术方案在亲子鉴定实际应用中都存在一定的问题。
具体地,如果采用传统的基于STR遗传标记的亲权临床试剂盒来进行亲权鉴定,那么将无可避免地需要获取羊水或胎儿绒毛膜等产前样本。在这种情况下,无论鉴定结果如何,都会对孕妇或胎儿造成不必要的医疗风险。若认定胎儿的生物学父亲为待定男性1(非孕妇伴侣),则会在征得胎儿生母许可的情况下通过医学手段终止妊娠,然而,由于此时往往孕周较大,引产等医学手段将使孕妇面临较大的医学风险;即使排除了待定男性1为胎儿的生物学父亲的可能性,在这一鉴定过程中由于采用的是有创的医学手段以获得胎儿组织样本(羊水或绒毛膜),也使得胎儿面临流产、感染等医学风险。因此,从保护孕妇以及胎儿的权益的角度出发,传统的亲子鉴定技术方案并不是理想的选择。
虽然,以孕妇外周血胎儿游离DNA为检测样本而采用NGS的技术方案,能够为减少胎儿所面临的医学风险提供有效的帮助,但是,即使采用了NGS技术方案,现有的评价方法(如专利CN104946773B)依然存在因技术原因导致的误判问题。众所周知,孕妇外周血中的cfDNA是一种混合型样本,其为母亲细胞来源的cfDNA和胎儿细胞来源的cfDNA的混合物,且其中胎儿cfDNA比例较低,通常仅为5%-10%。并且,由于胎儿的基因组一半来自于母亲、另一半来自于父亲,所以在孕妇外周血cfDNA中真正混合的异源DNA为胎儿生父基因组,且比例为胎儿来源的cfDNA占比的一半。于是,采用NGS技术对混合样本中的低比例DNA进行检测时,依靠的是测序的覆盖深度,如检测1%的低比例DNA时,NGS的测序深度至少应达到200倍以上;而当测序深度较低时,则可能由于测序深度不足导致应检出父源等位基因时而未检出,从而在这样的位点上形成胎儿母源等位基因的“假”纯合型结果,而多个这样的位点必将导致最终亲子鉴定结果的误判。
除上述技术缺陷外,现有的NGS技术方案本身还缺乏对可能的遗传学证据价值指标的统计模型的研究;仅仅依据经验的所谓不符合位点的多少来进行亲权判断,一方面存在误判断的可能,更重要的另一方面是,由于缺乏科学的证据价值评估体系,其检验结果也难以作为一种有效的法律证据。
发明内容
针对现有技术中存在的技术问题,本发明旨在提供基于孕妇外周血中胎儿游离DNA进行亲子鉴定的证据价值评估模型。
发明人通过比对待定男性基因型是否包含孕妇cfDNA检出的胎儿生父等位基因,提出了一种不同于传统方法的排除性指标,即当待定男性基因型中不包含孕妇cfDNA检出的胎儿生父等位基因时,则可排除该待定男性为胎儿生物学父亲的可能性。依据概率的基本原理,可以推导出通过二等位基因遗传标记最低人群等位基因频率,计算这一排除性指标在“孕妇cfDNA与无亲缘关系的个体对”人群中的概率分布公式,从而使依据任意二等位基因遗传标记组合进行孕妇DNA亲子鉴定时,均可对相应遗传学证据进行证据价值评估。
设有n个相互独立的二等位基因遗传标记,第i个标记的最低等位基因频率0.2≤fi≤0.5,其对应的等位基因命名为Pi,另一个等位基因命名为Qi;依据等位基因命名,对于一个符合Hardy-Weinberg遗传平衡的群体,任意个体在第i个遗传标记上均有三种基因型:PiPi、PiQi、QiQi,对应的基因型人群频率依次为fi 2、2fi(1-fi)、(1-fi)2。采用二代测序检测孕妇cfDNA可得到四种基因型:cfDNA为PiPi型(Qi检出比例低于0.01),cfDNA为PiQi型(低频等位基因检出比例在0.2-0.5之间),cfDNA为PiQi型(低频等位基因检出比例在0.01-0.2之间),cfDNA为QiQi型(Pi检出比例低于0.01)。
孕妇与待定男性2(孕妇伴侣)或待定男性1均为无亲缘关系个体,据此,可推导出四种cfDNA基因型的检出概率为:
(1)cfDNA为PiPi型:fi 3
(2)cfDNA为PiQi型(低频等位基因检出比例在0.2-0.5之间):2fi-2fi 2
(3)cfDNA为PiQi型或PiQi(低频等位基因检出比例在0.01-0.2之间):fi-fi 2;值得补充说明的是,下标字母Q或P表示在对应的基因中该等位基因为低频等位基因;
(4)cfDNA为QiQi型:1-3fi+3fi 2-fi 3
其中,参数定义包括:
在第i个遗传标记,当cfDNA为(1)和(4)时且待定男性为与cfDNA不同的纯合型,此时胎儿与待定男性之间不符合孟德尔遗传规律,此时在该遗传标记上令x0i=1(否则,x0i=0)。对于n个相互独立的遗传标记,cfDNA与待定男性之间类似的遗传标记的个数为所有遗传标记上x0值的总和X0
在第i个遗传标记,当cfDNA为(3)且待定男性中没有检出该低频等位基因时(即待定男性为非低频等位基因的纯合型),此时胎儿与待定男性之间不符合孟德尔遗传规律,此时在该遗传标记上令x1i=1(否则,x1i=0)。对于n个相互独立的遗传标记,cfDNA与待定男性之间类似的遗传标记的个数为所有遗传标记上x1值的总和X1
在此基础上,以p0i表示第i个标记上x0i=1的概率,则p0i可按公式I通过该位点的最低等位基因频率fi计算得到:
p0i=fi 2-2fi 3+fi 4 公式I
则X0的期望值为:
Figure GDA0003280742950000041
依据X0的期望值可得到X0的总体率π0的计算公式:
Figure GDA0003280742950000042
值得补充说明的是,当π0不接近于0或1,E(X0)较大时(大于10),X0可按近似正态分布:
X0~N[E(X0),nπ0(1-π0)]
进行处理,从而得到相应X0值对应的假设待定男性与孕妇所怀胎儿为无亲缘关系的个体的概率。
在此基础上,以p1i表示第i个标记上x1i=1的概率,则p1i可按公式IV通过该位点的最低等位基因频率fi计算得到:
p1i=fi-4fi 2+6fi 3-3fi 4 公式IV
则X1的期望值为:
Figure GDA0003280742950000043
依据X1的期望值可得到X1的总体率π1的计算公式:
Figure GDA0003280742950000051
值得补充说明的是,当π1不接近于0或1,E(X1)较大时(大于10),X1可按近似正态分布:
X1~N[E(X1),nπ1(1-π1)]
进行处理,从而得到相应X1值对应的假设待定男性与孕妇所怀胎儿为无亲缘关系的个体的概率。
具体地,本发明提供了一种基于孕妇外周血中胎儿游离DNA的亲子鉴定方法,包括以下步骤:
S1:使用DNA提取试剂盒,分别提取孕妇上皮细胞基因组DNA、孕妇外周血cfDNA以及待定男性外周血基因组DNA;
S2:进行二代测序,然后对得到的二代测序数据进行质量过滤,以分别获得孕妇和待定男性的基因组DNA中的二等位基因分型子集:bgM和bgS;
S3:进行孕妇外周血cfDNA的基因型分析,以获得孕妇外周血cfDNA中的二等位基因分型子集:bgCF;
S4:将bgM、bgS与bgCF的位点交集命名为bgMSCF,从bgMSCF中剔除东亚人群中最低等位基因频率≥0.2且≤0.5(即最低等位基因频率过低)和位点间遗传距离≥10cM(即位点间遗传距离过小)的位点,得到位点数目150~300的子集:bgMSCF_150~300;
S5:设置检验水准α并确立检验假设:
假设H:待定男性与孕妇所怀胎儿为无亲缘关系的个体;
假设H':待定男性为孕妇所怀胎儿的生物学父亲;
S6:依据子集bgMSCF_150~300,通过比对bgM、bgCF以及bgS,得到150~300个位点各自的x1,将所有x1值相加后得到X1值;
S7:计算假设H下的X1的概率分布:依据子集bgMSCF_150~300的150~300个位点对应的东亚人群中最低等位基因频率值,采用公式IV、公式V、公式VI得到X1的二项分布参数(总体率),并获得X1的概率分布图,其横坐标为X1,纵坐标为概率;
S8:计算0<X1≤实测值的区间内的累计概率;
若所述累计概率远大于检验水准α,则不能拒绝假设H;
若所述累计概率远小于检验水准α,则拒绝假设H,而接受假设H';
其中,设有n个相互独立的二等位基因遗传标记,第i个标记的最低等位基因频率0.2≤fi≤0.5,其对应的等位基因为Pi,另一个等位基因则为Qi
以p1i表示第i个标记上x1i=1的概率,则p1i按照公式IV计算:
p1i=fi-4fi 2+6fi 3-3fi 4
则X1的期望值按照公式V计算:
Figure GDA0003280742950000061
X1的总体率π1按照公式VI计算:
Figure GDA0003280742950000062
优选地,所述基于孕妇外周血中胎儿游离DNA的亲子鉴定方法的S2中,所述质量过滤的条件包括:
a)人类基因组数据库Hg19,1000Genomes Phase 3Integrated Variant Calls数据库;
b)二等位基因类型:单核苷酸多态性,等位基因长度相差≤3bp的插入缺失长度多态性;
c)最低等位基因频率:东亚人群中最低等位基因频率≥0.2且≤0.5;
d)位点间遗传距离≥10cM;
e)仅包含常染色体,剔除性染色体上的二等位基因位点;
f)二代测序数据比对要求:Unique reads比中区域。
优选地,所述基于孕妇外周血中胎儿游离DNA的亲子鉴定方法的S3中,所述基因型分析的条件包括:
a)孕妇外周血cfDNA中位点的总测序深度total_depth≥200且<500;
b)比对区域:仅比对bgM中对应位点区域;
c)按测序深度从高到低排序,得到#1_depth、#2_depth、#3_depth和#4_depth四种碱基的测序深度,则基因分型要求为:
①PiPi型或QiQi型:#1_depth占total_depth的99%以上;②PiQi型或PiQi型:#2_depth占total_depth的1%~20%,且#2_depth不小于3;#3_depth与#4_depth之和小于#2_depth且不超过total_depth的1%;③PiQi型:#2_depth与total_depth之比≥20%且≤50%,#3_depth与#4_depth之和不超过total_depth的1%;
剔除不能满足以上基因分型要求的位点,以获得孕妇外周血cfDNA中的二等位基因分型子集:bgCF。
优选地,在所述基于孕妇外周血中胎儿游离DNA的亲子鉴定方法中,所述检验水准α为0.001。
由此可见,本发明所提出的排除性指标X1可用于进一步建立人群概率分布模型,在采用孕妇外周血中胎儿游离DNA进行亲子鉴定时,可获得该排除性指标X1的概率分布曲线。例如,图1分别示出了平均最低等位基因频率为0.3且位点个数分别为150、300个时的X1的概率分布曲线。
此外,本发明所提出的排除性指标X1,与传统的排除性指标X0相比,具有更好的鉴定效能。例如,如图2所示,当平均最低等位基因频率为0.3且位点个数为200个时,X1的概率分布曲线明显位于X0的概率分布曲线的右侧(即发生明显右移),这表明排除性指标X1的鉴定效能远高于X0
特别是,传统的排除性指标X0所强调的是在孕妇cfDNA中未检出胎儿生父等位基因(胎儿与母亲为相同的纯合型),与此不同,新的排除性指标X1所强调的是在孕妇cfDNA中应检出胎儿生父等位基因(母亲为纯合型,胎儿为杂合型),但检出的胎儿生父等位基因在待定男性中不存在。由于实际案件中必然有孕妇基因组DNA与待定男性1基因组DNA分型结果作为参照,因此,采用本发明所提供的排除性指标X1则能够更有效地避免误判;另外,合理地设置检验水准α并确立检验假设,还有利于实现准确判定。
综上所述,本发明所提供的基于孕妇外周血中胎儿游离DNA的亲子鉴定方法所采用的检测样本易于获取,有效避免对孕妇或胎儿造成不必要的医疗风险;同时,本发明所提供的排除性指标X1以及所建立的亲子鉴定的证据价值评估模型不但能够有效避免误判,而且具有更高的鉴定效能;此外,该亲子鉴定方法操作简单,分析效率高;因此,实施本发明所提供的亲子鉴定方法获得的检验结果可进一步作为一种有效的法律证据,从而可广泛用于司法亲子鉴定等应用领域。
附图说明
图1为不同位点数(平均最低等位基因频率为0.3)对应的X1不同取值时的概率分布曲线图;
图2为位点数为200(平均最低等位基因频率为0.3)时X0与X1各自的概率分布曲线图;
图3为实施例1中X1的概率分布曲线图。
具体实施方式
下面通过具体实施方式对本发明进行详细和具体的描述,以利于更好地理解本发明,但是下述具体实施方式并不限制本发明范围。
值得说明的是,在本发明中,孕妇cfDNA中的四种基因型的检出概率的计算公式、以及公式I和公式IV最为基础且最为重要,而公式II、公式III均依据二项分布的基本原理由公式I变换得到,同理,公式V、公式VI则依据二项分布的基本原理由公式IV变换得到。
孕妇cfDNA中的四种基因型的检出概率的计算公式的推导过程
设有一个二等位基因遗传标记,其最低等位基因频率f,对应的等位基因命名为P,另一个等位基因命名为Q,其等位基因频率命名为q,则有f+q=1。依据等位基因命名,对于一个符合Hardy-Weinberg遗传平衡的群体,任意个体在该遗传标记上均有三种基因型:PP、PQ、QQ,对应的基因型人群频率为f2、2fq、q2。采用二代测序检测孕妇cfDNA可得到四种基因型:cfDNA为PP型(Q检出比例低于0.01)、cfDNA为PQ型(低频等位基因检出比例在0.2-0.5之间)、cfDNA为PQ型(低频等位基因检出比例在0.01-0.2之间)、cfDNA为QQ型(P检出比例低于0.01)。由于孕妇与待定男性2或待定男性1之间均为无亲缘关系个体,据此可以得到表1。
表1随机生母生父对及其可能生育胎儿的基因型及其概率
Figure GDA0003280742950000091
表1第1列为孕妇在该位点的基因型,第二列为胎儿生父可能的基因型。依据现代婚姻伦理,可以认为孕妇与胎儿生父为无亲缘关系个体,因此这样的孕妇-生父对在一个符合Hardy-Weinberg遗传平衡的随机群体中的概率,即为二者相应基因型人群概率的乘积。以孕妇为PP型、生父亦为PP型为例,显然此时二者所孕育的胎儿在该位点也只能是PP型,所以胎儿PP型列与孕妇PP型、生父PP型行交叉点的概率为1,即这样的孕妇与生父所孕育的胎儿在该位点只能是PP型,1与PP型孕妇-PP型生父对概率的乘积即为此部分胎儿PP型的概率。在“胎儿基因型概率列”中,PP型、PQ型、QQ型各列下各部分概率之和即胎儿为相应基因型的概率。对于一个符合Hardy-Weinberg遗传平衡的随机群体,其子代也将符合Hardy-Weinberg遗传平衡定律:
计算胎儿PP型的概率如下:
f4+f3q+f3q+f2q2=f3(f+q)+f2q(f+q)
因为:f+q=1
所以有:
f4+f3q+f3q+f2q2=f3(f+q)+f2q(f+q)=f3+f2q=f2(f+q)=f2
同理可以得到胎儿为PQ型的总概率、QQ型的总概率,均符合Hardy-Weinberg遗传平衡定律,表明表1推导正确。
胎儿cfDNA进入孕妇母体血液,与孕妇cfDNA形成混合样本,这样所形成的孕妇cfDNA相应的基因可以依据表2推导得到,详见下表2:
表2孕妇cfDNA基因型及其概率
Figure GDA0003280742950000101
在表2中,cfDNA基因型中,明确的生父等位基因表现为低比例等位基因时,以相应大写字母的下标形式表示。如当孕妇为PP型、生父为QQ型时,胎儿为PQ型,胎儿DNA与孕妇DNA混合,在孕妇cfDNA中检出低比例的生父等位基因Q,相应的cfDNA基因型表示为PQ。依据表2可以得到:
cfDNA为PP型:f4+f3q=f3(f+q)=f3
cfDNA为QQ型:fq3+q4=q3(f+q)=q3=(1-f)3=1-3f+3f2-f3
当孕妇为PQ型,此时孕妇cfDNA将主要表现为孕妇的基因,即为PQ型且两种等位基因检出比例近似,或低比例等位基因检出比例在0.2-0.5之间。因此,此时孕妇cfDNA基因型的概率将等于孕妇自身为PQ型的概率,即为2fq,亦即孕妇为PQ型对应cfDNA基因型的7部分概率和应为2fq,推导如下:
(f3q+f2q2)+(f3q+2f2q2+fq3)+(f2q2+fq3)=2(f3q+f2q2)+2(f2q2+fq3)=2f2q(f+q)+2fq2(f+q)=2f2q+2fq2=2fq(f+q)=2fq
所以有:cfDNA为PQ型(低频等位基因检出比例在0.2-0.5之间):
2f(1-f)=2f-2f2
当孕妇为PP型,而胎儿为PQ型时,由于孕妇cfDNA以孕妇的P等位基因为主,仅能检出低比例的生父等位基因Q;反之当孕妇为QQ型时,仅能检出低比例的生父等位基因P。依据表2,此4部分的概率和为:
(f3q+f2q2)+(f2q2+fq3)=f2q(f+q)+fq2(f+q)=f2q+fq2=fq(f+q)=fq
所以有:cfDNA为PQPQ型(低频等位基因检出比例在0.01-0.2之间):f-f2
并且,依据概率的基本原理,孕妇4种cfDNA基因型的概率之和应为1,所以有:
f3+(1-3f+3f2-f3)+(2f-2f2)+(f-f2)=1
可见,以上推导过程正确。
公式I的推导过程
依据上述孕妇cfDNA中的四种基因型的检出概率的计算公式的推导过程,当孕妇cfDNA为PP型、待定男性为QQ型,或者当孕妇cfDNA为QQ型、待定男性为PP型时,x0均为1;则x0为1的概率p0可以写作:
p0=(f3q2)+(1-3f+3f2-f3)f2=f3(1-f)2+f2(1-f)3=(1-f)2(f3+f2-f3)=f2(1-f)2
=f2-2f3+f4
当以p0i表示第i个标记上x0i=1的概率时,则可得到p0i的计算公式:
p0i=fi 2-2fi 3+fi 4,即公式I。
公式IV的推导过程
依据上述孕妇cfDNA中的四种基因型的检出概率的计算公式的推导过程,当孕妇基因为PP型、孕妇cfDNA为PQ型、待定男性为PP型,或者当孕妇基因为QQ型、孕妇cfDNA为PQ型、待定男性为QQ型时,x1均为1;则x1为1的概率p1可以写作:
p1=(f3q+f2q2)f2+(f2q2+fq3)q2=f4q(f+q)+fq4(f+q)=f4q+fq4
=f4(1-f)+f(1-f)4
=f-4f2+6f3-3f4
当以p1i表示第i个标记上x1i=1的概率时,则可得到p1i的计算公式:
p1i=fi-4fi 2+6fi 3-3fi 4,即公式IV。
实施例1
涉及待定男性1,孕妇M以及待定男性2。依据本发明所提供的方法实施亲子鉴定,步骤如下:
步骤一,提取DNA:
采用市售的DNA提取试剂盒,提取孕妇M咽拭子脱落细胞基因组DNA,提取孕妇M的外周血cfDNA;同时提取待定男性1和待定男性2的外周血基因组DNA。
步骤二,进行二代测序:
对于M、A、F三者的基因组DNA,按基因组DNA重测序进行建库,平均测序深度不低于10倍;M的外周血cfDNA则采用安捷伦全外显子捕获测序试剂盒进行捕获后建库测序,平均测序深度不低于200倍。其中,建库、质控、二代测序均按常规操作实施。
步骤三,二代测序数据预处理:
对得到的二代测序数据进行质量过滤,并与人类基因组DNA参考序列(Hg19)进行比对,结合1000Genomes Phase 3Integrated Variant Calls数据,以分别获得M、A、F的基因组DNA中的二等位基因分型子集,依次命名为bgM、bgA、bgF。其中,所述质量过滤的条件包括:
a)人类基因组数据库Hg19,1000Genomes Phase 3Integrated Variant Calls数据库;
b)二等位基因类型:单核苷酸多态性(SNP),等位基因长度相差≤3bp的插入缺失长度多态性(Indels);
c)最低等位基因频率:东亚人群中最低等位基因频率≥0.2且≤0.5;
d)位点间遗传距离≥10cM;
e)仅包含常染色体,剔除性染色体上的二等位基因位点;
f)二代测序数据比对要求:Unique reads比中区域。
步骤四,孕妇外周血cfDNA的基因型分析:
所述基因型分析的条件包括:
a)孕妇外周血cfDNA中位点的总测序深度total_depth≥200且<500;
b)比对区域:仅比对bgM中对应位点区域;
c)cfDNA样本分型要求:按测序深度从高到低排序,得到#1_depth、#2_depth、#3_depth和#4_depth四种碱基的测序深度,则cfDNA分型按以下要求进行:
①PiPi型或QiQi型:#1_depth占total_depth的99%以上;
②PiQi型或PiQi型:#2_depth占total_depth的1%~20%,且#2_depth不小于3;#3_depth与#4_depth之和小于#2_depth且不超过total_depth的1%;对应位点孕妇基因组分型为PP型(前者)或QQ型(后者);
③PiQi型:#2_depth与total_depth之比≥20%且≤50%,#3_depth与#4_depth之和不超过total_depth的1%;对应位点孕妇基因组分型为PQ型;
剔除不能满足以上基因分型要求的位点,以获得孕妇外周血cfDNA中的二等位基因分型子集:bgCF。
步骤五,确定用于后续分析的二等位基因位点:
1)位点交集:bgM、bgA与bgCF的位点交集命名为bgMACF;bgM、bgF与bgCF位点交集命名为bgMFCF;
2)位点剔除:在bgMACF和/或bgMFCF中,按优先剔除最低等位基因频率过低者、其次剔除位点间遗传距离过小者;
3)分析子集:经位点剔除后得到可用于后续分析的二等位基因位点子集,bgMACF和bgMFCF中各自子集的位点数目为150~300,命名方式为集合名称_位点数目,如bgMACF_300,bgMFCF_300。
步骤六,设置检验水准α并确立检验假设:
假设H0:A与M所怀胎儿为无亲缘关系的个体;
假设H1:F与M所怀胎儿为无亲缘关系的个体;
假设H2:A为M所怀胎儿的生物学父亲;
假设H3:F为M所怀胎儿的生物学父亲;
检验水准α=0.001。
步骤七,计算统计量:
1)计算孕妇M与待定男性1之间的X1A值:依据子集bgMACF_300,按照x1i定义,通过比对孕妇基因组DNA分型(bgM)、孕妇cfDNA分型(bgCF)以及待定男性1基因组DNA分型(bgA),得到300个位点各自的x1,取和后得到X1A=15;
2)计算孕妇M与待定男性2之间的X1F值:依据子集bgMFCF_300,按照x1i定义,通过比对孕妇基因组DNA分型(bgM)、孕妇cfDNA分型(bgCF)以及待定男性2基因组DNA分型(bgF),得到300个位点各自的x1,取和后得到X1F=1。
步骤八,证据价值的评估:
获得假设H0下的X1A概率分布:依据子集bgMACF_300的300个位点对应的东亚人群中最低等位基因频率值,采用本发明中所提供的统计模型(公式IV、公式V、公式VI)得到X1A的二项分布参数,并获得X1A的概率分布曲线,其横坐标为X1A,纵坐标为概率(Probability);其期望值为20.78,总体率为0.0693,;采用excel软件中的二项分布函数BINOM.DIST,可得到当X1为不同取值时对应的概率值。在本例中,X1A=15,计算从1至15所对应的概率之和为0.1116,其远大于检验水准α,故不能拒绝H0。具体地,参见图3,即本次检验的300个二等位基因位点所对应的X1的概率分布曲线图。
获得假设H1下的X1F概率分布:依据子集bgMFCF_300的300个位点对应的东亚人群中最低等位基因频率值,采用本发明中所提供的统计模型(公式IV、公式V、公式VI)得到X1F的二项分布参数,并获得X1F的概率分布曲线,其横坐标为X1F,纵坐标为概率(Probability);本例中bgMFCF_300与bgMACF_300相同,故概率分布相同。在本例中,X1F=1,对应的概率为H1=9.96E-09,即表明F与M所怀胎儿为无亲缘关系的个体的概率为9.96E-09,其远小于检验水准α,故拒绝H1,接受H3
步骤九,得出亲子鉴定结论:
基于对证据价值的评估,认为待定男性1与孕妇M所怀胎儿为无亲缘关系的个体,支持待定男性2为孕妇M所怀胎儿的生物学父亲。
以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

Claims (4)

1.一种基于孕妇外周血中胎儿游离DNA的亲子鉴定方法,其特征在于,包括以下步骤:
S1:使用DNA提取试剂盒,分别提取孕妇上皮细胞基因组DNA、孕妇外周血cfDNA以及待定男性外周血基因组DNA;
S2:进行二代测序,然后对得到的二代测序数据进行质量过滤,以分别获得孕妇和待定男性的基因组DNA中的二等位基因分型子集:bgM和bgS;
S3:进行孕妇外周血cfDNA的基因型分析,以获得孕妇外周血cfDNA中的二等位基因分型子集:bgCF;
S4:将bgM、bgS与bgCF的位点交集命名为bgMSCF,从bgMSCF中剔除东亚人群中最低等位基因频率≥0.2且≤0.5和位点间遗传距离≥10cM的位点,得到位点数目150~300的子集:bgMSCF_150~300;
S5:设置检验水准α并确立检验假设:
假设H:待定男性与孕妇所怀胎儿为无亲缘关系的个体;
假设H':待定男性为孕妇所怀胎儿的生物学父亲;
S6:依据子集bgMSCF_150~300,通过比对bgM、bgCF以及bgS,得到150~300个位点各自的x1,将所有x1值相加后得到X1值;其中:在第i个遗传标记,当cfDNA为杂合子、其中的低频等位基因检出比例在0.01-0.2之间,且待定男性中没有检出该低频等位基因时,此时胎儿与待定男性之间不符合孟德尔遗传规律,此时在该遗传标记上令x1i=1,否则,x1i=0;对于n个相互独立的遗传标记,cfDNA与待定男性之间类似的遗传标记的个数为所有遗传标记上x1值的总和X1
S7:计算假设H下的X1的概率分布:依据子集bgMSCF_150~300的150~300个位点对应的东亚人群中最低等位基因频率值,采用以下公式IV、公式V、公式VI得到X1的二项分布参数,并获得X1的概率分布图,其横坐标为X1,纵坐标为概率;
S8:计算0<X1≤实测值的区间内的累计概率;
若所述累计概率远大于检验水准α,则不能拒绝假设H;
若所述累计概率远小于检验水准α,则拒绝假设H,而接受假设H';
其中,设有n个相互独立的二等位基因遗传标记,第i个标记的最低等位基因频率0.2≤fi≤0.5,其对应的等位基因为Pi,另一个等位基因则为Qi
以p1i表示第i个标记上x1i=1的概率,则p1i按照公式IV计算:
p1i=fi-4fi 2+6fi 3-3fi 4 公式IV;
则X1的期望值按照公式V计算:
Figure FDA0003214399600000021
X1的总体率π1按照公式VI计算:
Figure FDA0003214399600000022
2.根据权利要求1所述的基于孕妇外周血中胎儿游离DNA的亲子鉴定方法,其特征在于,在S2中,所述质量过滤的条件包括:
a)人类基因组数据库Hg19,1000 Genomes Phase 3 Integrated Variant Calls数据库;
b)二等位基因类型:单核苷酸多态性,等位基因长度相差≤3bp的插入缺失长度多态性;
c)最低等位基因频率:东亚人群中最低等位基因频率≥0.2且≤0.5;
d)位点间遗传距离≥10cM;
e)仅包含常染色体,剔除性染色体上的二等位基因位点;
f)二代测序数据比对要求:Unique reads比中区域。
3.根据权利要求1所述的基于孕妇外周血中胎儿游离DNA的亲子鉴定方法,其特征在于,在S3中,所述基因型分析的条件包括:
a)孕妇外周血cfDNA中位点的总测序深度total_depth≥200且<500;
b)比对区域:仅比对bgM中对应位点区域;
c)按测序深度从高到低排序,得到#1_depth、#2_depth、#3_depth和#4_depth四种碱基的测序深度,则基因分型要求为:
①PiPi型或QiQi型:#1_depth占total_depth的99%以上;②PiQi型或PiQi型:#2_depth占total_depth的1%~20%,且#2_depth不小于3;#3_depth与#4_depth之和小于#2_depth且不超过total_depth的1%;③PiQi型:#2_depth与total_depth之比≥20%且≤50%,#3_depth与#4_depth之和不超过total_depth的1%;
剔除不能满足以上基因分型要求的位点,以获得孕妇外周血cfDNA中的二等位基因分型子集:bgCF。
4.根据权利要求1所述的基于孕妇外周血中胎儿游离DNA的亲子鉴定方法,其特征在于,所述检验水准α为0.001。
CN201810714037.9A 2018-06-29 2018-06-29 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法 Active CN108875307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810714037.9A CN108875307B (zh) 2018-06-29 2018-06-29 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810714037.9A CN108875307B (zh) 2018-06-29 2018-06-29 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法

Publications (2)

Publication Number Publication Date
CN108875307A CN108875307A (zh) 2018-11-23
CN108875307B true CN108875307B (zh) 2021-12-03

Family

ID=64296747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810714037.9A Active CN108875307B (zh) 2018-06-29 2018-06-29 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法

Country Status (1)

Country Link
CN (1) CN108875307B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109686401B (zh) * 2018-12-19 2022-08-05 上海蓝沙生物科技有限公司 一种识别异源低频基因组信号唯一性的方法及其应用
CN110724732A (zh) * 2019-11-12 2020-01-24 陈洪亮 一种产前亲权关系鉴定的方法
CN113584178A (zh) * 2020-04-30 2021-11-02 深圳华大法医科技有限公司 一种无创亲子检测分析方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104480205A (zh) * 2014-12-10 2015-04-01 西安交通大学 一种基于全基因组str建立动物亲权鉴定系统的方法
CN107217095A (zh) * 2017-06-15 2017-09-29 广东腾飞基因科技股份有限公司 人类亲权鉴定用多重pcr引物组及检测方法
CN108048575A (zh) * 2017-11-03 2018-05-18 湖南优品司生物科技有限公司 一种用于产前无创亲子鉴定的试剂盒及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2656263B1 (en) * 2010-12-22 2019-11-06 Natera, Inc. Methods for non-invasive prenatal paternity testing
US20140100126A1 (en) * 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104480205A (zh) * 2014-12-10 2015-04-01 西安交通大学 一种基于全基因组str建立动物亲权鉴定系统的方法
CN107217095A (zh) * 2017-06-15 2017-09-29 广东腾飞基因科技股份有限公司 人类亲权鉴定用多重pcr引物组及检测方法
CN108048575A (zh) * 2017-11-03 2018-05-18 湖南优品司生物科技有限公司 一种用于产前无创亲子鉴定的试剂盒及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Informatics-based,highly accurate,noninvasive prenatal paternity testing;Allison Ryan 等;《Genetics in Medicine》;20130630;第5卷(第6期);第473-477页 *
Noninvasive prenatal paternity testing(NIPAT)through maternal plasma DNA sequencing:a pilot study;Jiang H 等;《PIoS one》;20160915;第11卷(第9期);第1-12页 *
基于高通量测序进行无创产前亲子鉴定的可行性;蒋浩君 等;《中国法医学杂志》;20170420;第150-153页 *
母血浆中胎儿游离核酸与无创性产前亲子鉴定;余谨 等;《中国法医学杂志》;20161220;第587-594页 *

Also Published As

Publication number Publication date
CN108875307A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
JP7081829B2 (ja) 無細胞試料中の腫瘍dnaの解析
CA2850785C (en) Methods and processes for non-invasive assessment of genetic variations
US10504613B2 (en) Methods and processes for non-invasive assessment of genetic variations
CN108875307B (zh) 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法
CA3189752A1 (en) Methods and processes for non-invasive assessment of genetic variations
CN108604258B (zh) 染色体异常判断方法
CN115798580B (zh) 基于基因型填补和低深度测序的一体化基因组分析方法
CN109207606A (zh) 用于亲权鉴定的ssr位点的筛选方法和应用
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
JP7333838B2 (ja) 胚における遺伝パターンを決定するためのシステム、コンピュータプログラム及び方法
WO2023246949A1 (zh) 一种用微单倍型判定无创产前亲权关系的方法
CN112823391A (zh) 基于检测限的质量控制度量
CN109777875B (zh) Shh型髓母细胞瘤甲基化位点的应用
CN111926091A (zh) 利用微卫星标记鉴定东北黑熊亲缘关系的方法
Nothnagel The definition of multilocus haplotype blocks and common diseases
EP3596229A1 (en) Method and system for nucleic acid sequencing
AU2021202041B2 (en) Analyzing tumor dna in a cellfree sample
AU2019283981B2 (en) Analyzing tumor dna in a cellfree sample
CN117925820A (zh) 一种用于胚胎植入前变异检测的方法
이선호 New Methods for SNV/InDel Calling and Haplotyping from Next Generation Sequencing Data
CN114959069A (zh) 一种鉴定豫西黑猪品种的特异分子身份证及其应用
KR20210130680A (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
CN114959068A (zh) 用于鉴定豫农黑猪种质资源的特异分子身份证及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant