CN109273046B - 一种基于概率统计模型的生物学全同胞鉴定方法 - Google Patents

一种基于概率统计模型的生物学全同胞鉴定方法 Download PDF

Info

Publication number
CN109273046B
CN109273046B CN201811223988.2A CN201811223988A CN109273046B CN 109273046 B CN109273046 B CN 109273046B CN 201811223988 A CN201811223988 A CN 201811223988A CN 109273046 B CN109273046 B CN 109273046B
Authority
CN
China
Prior art keywords
ibs
probability
str
identified
unrelated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811223988.2A
Other languages
English (en)
Other versions
CN109273046A (zh
Inventor
赵书民
靳超
赵峰
赵琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Dongnan Evidence Science Research Institute Co ltd
Original Assignee
江苏东南证据科学研究院有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 江苏东南证据科学研究院有限公司 filed Critical 江苏东南证据科学研究院有限公司
Priority to CN201811223988.2A priority Critical patent/CN109273046B/zh
Publication of CN109273046A publication Critical patent/CN109273046A/zh
Application granted granted Critical
Publication of CN109273046B publication Critical patent/CN109273046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及生物遗传学技术领域,特别涉及一种基于概率统计模型的生物学全同胞鉴定方法。本发明所提供的基于概率统计模型的生物学全同胞鉴定方法,对两名被鉴定人进行n个相互独立的STR基因座分型,依据IBS在无亲缘关系个体对人群中的二项分布IBS~B(2n,π0)和在全同胞对人群中的二项分布IBS~B(2n,π1),即可计算得到两名被鉴定人为无亲缘关系个体的概率pH0和二者为全同胞的概率pH1。本发明所述基于概率统计模型的生物学全同胞鉴定方法适用于任意数量的STR基因座,且分析效率高,因此,本发明所提供的技术方案具有广阔的应用前景与不错的市场潜力。

Description

一种基于概率统计模型的生物学全同胞鉴定方法
技术领域
本发明涉及生物遗传学技术领域,特别涉及一种基于概率统计模型的生物学全同胞鉴定方法。
背景技术
生物学全同胞是指同一对生父、生母所生的多个体。在各种亲缘关系鉴定中,生物学全同胞(以下简称为全同胞)鉴定是除亲子鉴定外最为常见的一种亲缘关系鉴定案件。进行全同胞鉴定的两名个体,在性别相同时可借助性染色体遗传标记(如同为男性时采用Y染色体STR、同为女性是采用X染色体STR)以及线粒体DNA母系遗传的特性来提供一些间接的支持证据,在性别不同时就只有线粒体DNA多态性可以提供间接的支持证据。由于线粒体DNA多态性有限,因此学界均认可在进行全同胞鉴定时还是应以高度多态性的常色体STR遗传标记为主。
现有技术中,在采用常染色体STR进行全同胞鉴定时,通常对遗传学证据的评估有两种不同的方案。
第一种方案是采用ITO算法计算两名被鉴定人间的全同胞指数(Full siblingindex,FSI)。FSI是指两名被鉴定人是全同胞的概率与两名被鉴定人是无亲缘关系个体的概率的比值,作为所获得的遗传学证据价值的一种度量。
第二种方案是采用状态一致性评分(identity by state,IBS),这也是近年来在全同胞鉴定领域研究较多的一种全同胞评价指标。IBS值是两名被鉴定人在同一个STR基因座出现相同等位基因的个数。在同一个STR基因座,若基因型相同,即2个等位基因均相同,则评分为2;若只有1个相同的等位基因,则评分为1;若无相同的等位基因则评分为0。对于一个多重STR分型系统而言,各个STR基因座的评分总和即为两名被鉴定人基于该STR多重分型系统的IBS评分。IBS用于全同胞鉴定的基本理论依据是,无亲缘关系个体间出现相同等位基因是一种随机匹配事件,但在全同胞间出现相同等位基因的概率则是由常染色体STR的孟德尔遗传规律决定的:即有25%的概率两名全同胞基因型相同,评分为2;有50%的概率两名全同胞有1个相同的等位基因,评分为1;只有25%的概率两名全同胞无相同的等位基因。由于STR遗传标记本身高度的多态性,这就决定了全同胞间出现相同等位基因的概率要远高于无亲缘关系个体间的随机匹配概率。相较于FSI而言,IBS具有明显的优势,即无需复杂运算;因此,在我国司法部于2014年颁布的《生物学全同胞关系鉴定实施规范,SF/ZJD0105002—2014》中,也采用了IBS评分作为一种评价指标。
然而,无论是上述何种评价方案,它们在全同胞鉴定案件的实际应用中都还存在一定的问题。
例如,如何评价系统效能的问题:在采用常染色体STR进行任何亲权关系鉴定时,均需要明确所采用的多重STR分型系统的效能。以二联体亲子鉴定为例,这种系统效能是指相应多重STR分型系统的非父排除率。然而,在全同胞鉴定中,无论是采用FSI还是采用IBS评分,均没有相应的系统效能评估方法。
又如,如何确定相应评价指标的阈值的问题:在采用FSI进行全同胞鉴定遗传学证据价值评估时,依据FSI的定义,当FSI>1时即倾向于支持两名被鉴定人可能是生物学全同胞。在无法评估系统的情况下,依据FSI的这一阈值进行全同胞判断存在极大的风险。因此,在实际运用中,有学者在采用Sinofiler或Identifiler等STR分型系统进行全同胞鉴定时,会经验性地把FSI的阈值设定在大于20。如果继续增加STR基因座,这一阈值是否合适以及这一阈值所对应的鉴定结果的准确性就需要重新进行研究和评估。此外,在IBS的应用中同样的存在阈值设定的问题。《生物学全同胞关系鉴定实施规范,SF/Z JD0105002—2014》中关于IBS的阈值设定清晰地体现了其关于IBS阈值设定的窘境。在该规范中,为了设定IBS的阈值,人为地规定了检测STR基因座的数目,具体分为三档——19个,29个和39个(其中,常用的19个常染色体STR基因座(vWA、D21S11、D18S51、D5S818、D7S820、D13S317、D16S539、FGA、D8S1179、D3S1358、CSF1PO、TH01、TPOX、Penta E、Penta D、D2S1338、D19S433、D12S391、D6S1043)为必检基因座)。之所以规定这三档,是因为现有技术无法对任意数目的STR基因组合所对应IBS的概率分布进行研究与评价。
因此,如何建立一种适用于生物学全同胞鉴定的统计模型,以确定全同胞鉴定的评价指标在无亲缘关系个体对人群和全同胞对人群中的概率分布特征,是本领域研究人员的研究重点与难点之一。
发明内容
由于目前普遍采用《生物学全同胞关系鉴定实施规范,SF/Z JD0105002-2014》中的IBS指标,本发明旨在通过建立合适的统计模型给出IBS评分在无亲缘关系个体对人群和全同胞对人群中的概率分布特征。
设有两名被鉴定人,比较两人在某STR基因座的分型结果可以得到三种互相排斥的结果:有2个相同的等位基因、仅有1个相同的等位基因、无相同等位基因,分别以a2=1、a1=1、a0=1表示三种状态成立,为0时则表示三种状态不成立。该两名被鉴定人在该STR基因座相同的等位基因个数即为二者在该基因座上的状态一致性评分,记作ibs。对特定个体对而言,在某个常染色体STR基因座有:a2+a1+a0=1,且ibs=2a2+a1
若对该两名被鉴定人完成n个相互独立的常染色体STR基因座分型,该两名被鉴定人之间基因型相同的基因座总个数记为A2、仅有1个等位基因相同的基因座总个数记为A1、无相同等位基因的基因座总个数记为A0,则A2、A1、A0分别为各个STR座上a2、a1、a0值的总和,且有:
A2+A1+A0=n (式1)
进一步地,依据A2、A1、A0可以计算得到无亲缘关系个体对在所检测的n个常染色体STR基因座上相同等位基因总个数,即IBS值,其计算公式为:
IBS=2×A2+1×A1+0×A0 (式2)
依据上述参数定义可知,显然a2、a1、a0均为符合二项分布的参数(取值只有0和1两种可能);依据二项分布的可加性,可知其各自的和A2、A1、A0亦为二项分布参数,并且IBS亦为二项分布参数。因此,只需要获得IBS二项分布的关键参数(总体率π)即可实现对IBS概率分布的描述。
具体地,本发明提供了一种基于概率统计模型的生物学全同胞鉴定方法,其包括以下步骤:
S1:使用DNA提取试剂盒,分别提取两名被鉴定人的生物检材基因组DNA;
S2:进行PCR扩增,实施STR分型,以获得n个相互独立的STR基因座的分型结果;
S3:建立检验假设:
原假设H0:两名被鉴定人为无亲缘关系个体;
备择假设H1:两名被鉴定人为生物学全同胞;
S4:依据两名被鉴定人的STR基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值;
S5:依据各STR基因座在人群中的等位基因频率,得到IBS在无亲缘关系个体对人群中符合二项分布IBS~B(2n,π0),IBS在全同胞对人群中符合二项分布IBS~B(2n,π1);
其中,以a2=1、a1=1、a0=1分别表示在任一STR基因座上存在2个相同的等位基因、仅存在1个相同的等位基因、无相同的等位基因的状态各自成立,a2、a1、a0分别为0时则表示上述各状态各自不成立;
设任一STR基因座有m个等位基因,并以fi表示该STR基因座上第i个等位基因的频率,其中i=1,2,3……m,则有:
Figure BDA0001835479540000041
以p2、p1、p0分别表示无亲缘关系个体对A与B之间a2、a1、a0取值为1的概率,由于A与B在同一个STR基因座上,a2、a1、a0三者中必有且仅有其一能取值为1,则有:
p2+p1+p0=1 (式3)
其中,
Figure BDA0001835479540000042
Figure BDA0001835479540000043
Figure BDA0001835479540000044
因此,在无亲缘关系个体对人群中的IBS的期望值E(IBS)为:
Figure BDA0001835479540000051
在无亲缘关系个体对人群中的IBS的总体率π0为:
Figure BDA0001835479540000052
以p2FS、p1FS分别表示全同胞对C与D之间a2、a1取值为1的概率,则有:
Figure BDA0001835479540000053
Figure BDA0001835479540000054
因此,在全同胞对人群中的IBS的期望值E(IBS)为:
Figure BDA0001835479540000055
在全同胞对人群中的IBS的总体率π1为:
Figure BDA0001835479540000056
S6:使用EXCEL软件中的BINOMDIST函数进行计算:
输入参数BINOMDIST(IBS值,2n,π0,FALSE)以计算出两名被鉴定人为无亲缘关系个体的概率pH0
输入参数BINOMDIST(IBS值,2n,π1,FALSE)以计算出两名被鉴定人为全同胞的概率pH1
S7:遗传学证据价值评估:
当pH1>pH0时,计算pH1与pH0的比值R1,其意义为:两名被鉴定人为全同胞的概率是二者为无亲缘关系个体的概率的R1倍;当pH1<pH0时,计算pH0与pH1的比值R0,其意义为:两名被鉴定人为无亲缘关系个体的概率是二者为全同胞的概率的R0倍;
当倾向于认定两名被鉴定人为无亲缘关系个体时,这一结论的犯错概率为pH1,其准确性=1-pH1;当倾向于认定两名被鉴定人为全同胞时,这一结论的犯错概率为pH0,其准确性=1-pH0
优选地,在上述基于概率统计模型的生物学全同胞鉴定方法中,步骤S2中所述的STR基因座至少包括以下19个必检基因座:vWA、D21S11、D18S51、D5S818、D7S820、D13S317、D16S539、FGA、D8S1179、D3S1358、CSF1PO、TH01、TPOX、Penta E、Penta D、D2S1338、D19S433、D12S391、D6S1043。
进一步优选地,在上述基于概率统计模型的生物学全同胞鉴定方法中,步骤S2中所述的STR基因座由所述19个必检基因座和若干个不同的补充基因座组成,其中所述的补充基因座选自:D1S1656、D2S441、D3S1744、D3S3045、D4S2366、D5S2500、D6S477、D7S1517、D7S3048、D8S1132、D10S1248、D10S1435、D10S2325、D11S2368、D13S325、D14S608、D15S659、D17S1290、D18S535、D19S253、D21S2055、D22-GATA198B05。
更进一步优选地,在上述基于概率统计模型的生物学全同胞鉴定方法中,步骤S2中所述的STR基因座由所述19个必检基因座和10个不同的所述补充基因座组成。
更进一步优选地,在上述基于概率统计模型的生物学全同胞鉴定方法中,步骤S2中所述的STR基因座由所述19个必检基因座和20个不同的所述补充基因座组成。
综上所述,本发明所提供的基于概率统计模型的生物学全同胞鉴定方法,依据n个相互独立的STR基因座在人群中的等位基因频率,即可得到IBS在两种研究人群中的概率分布特征,具体为:在无亲缘关系个体对人群中的二项分布IBS~B(2n,π0),以及在全同胞对人群中的二项分布IBS~B(2n,π1)。在此基础上,仅需要使用二项分布概率的计算工具,如EXCEL软件中的BINOMDIST函数即可方便地计算出任意IBS评分所对应的两名被鉴定人为无亲缘关系个体的概率pH0,以及该二人为全同胞的概率pH1。利用pH1与pH0的比值表征两名被鉴定人为生物学全同胞的概率是该二人为无亲缘关系个体的概率的倍数,以完成全同胞鉴定中遗传学证据的价值评价。
此外,依据IBS的二项分布的特性,也可以对任意STR多重分型系统对生物学全同胞的系统效能进行评估。STR多重分型系统在生物学全同胞鉴定中的系统效能与人为划定的IBS阈值有关。如图1所示,当以IBS小于或等于X为无亲缘关系个体的判断标准时,即可通过二项分布概率计算工具如EXCEL中的BINOMDIST来计算有多大比率的真无亲缘关系个体是符合这一判断标准的,其计算方法为在EXCEL中输入BINOMDIST(X,2n,π0,TRUE),从而得到无亲缘关系个体中IBS从0至X所对应的累计概率,此即这一多重分型系统依据这一判定阈值所能判断的无亲缘关系个体对的比率,即该多重分型系统相应阈值对应的对无亲缘关系个体对的检出率;输入BINOMDIST(X,2n,π1,TRUE)即得到生物学全同胞对中IBS从0至X所对应的累计概率,此即这一多重分型系统依据这一判定阈值把生物学全同胞误判为无亲缘关系个体对的比率,1减去这一比率即近似于该多重分型系统相应阈值对应的对无亲缘关系个体对的判断准确性。同样地,可以得到该多重分型系统判断生物学全同胞的阈值对应的检出率与准确性。本发明还成功提供了一种对STR分型系统全同胞鉴定系统效能的评估方法。
总之,本发明通过统计模型的建立,确定了全同胞鉴定的评价指标IBS在无亲缘关系个体对人群和全同胞对人群中的二项分布特征,并将其进一步成功用于生物学全同胞鉴定;此外,本发明所述基于概率统计模型的生物学全同胞鉴定方法适用于任意数量的STR基因座,且分析效率高,因此,本发明所提供的技术方案具有广阔的应用前景与不错的市场潜力。
附图说明
图1为实施例1中的19个必检基因座分型系统的IBS值的概率分布曲线图;该曲线为采用二项分布近似正态分布模拟得到,非线性模拟采用GraphPad Prism 5.0软件包;其中,左侧曲线表示IBS值对应无亲缘关系个体对人群中的概率分布,而右侧曲线则表示IBS值对应全同胞对人群中的概率分布;竖虚线高度为IBS=10时所检个体对为无亲缘关系个体的概率。
具体实施方式
下面通过具体实施方式对本发明进行详细和具体的描述,以利于更好地理解本发明,但是下述具体实施方式并不限制本发明范围。
无亲缘关系个体对人群中IBS二项分布的推导过程
依据无亲缘关系个体对A与B在该STR基因座上的基因型(纯合型或杂合型),可以对p2、p1、p0进行分解:
p2=p2_HoHo+p2_HeHe (式4)
p1=p1_HoHe+p1_HeHe (式5)
p0=p0_HoHo+p0_HoHe+p0_HeHe (式6)
其中,HoHo指A与B均为纯合型,HeHe指A与B均为杂合型,HoHe指一人为纯合型且另一人为杂合型。
在此基础上,p2、p1、p0均可以STR基因座等位基因频率fi进行表示,换言之,只要获得STR基因座在人群中的等位基因频率分布,即可获得ibs在两种研究人群(无亲缘关系个体对人群和生物学全同胞对人群)中的二项分布。
p2计算公式的推导
其中,p2_HoHo指A与B基因型相同且均为纯合子的概率,依据这一定义,p2_HoHo可以写作:
Figure BDA0001835479540000081
p2_HeHe指A与B基因型相同且均为杂合子的概率,依据这一定义,p2_HeHe可以写作:
Figure BDA0001835479540000091
从而,依据式(4)可以得到:
Figure BDA0001835479540000092
p1计算公式的推导
其中,p1_HoHe指A与B在该基因座只有1个相同的等位基因且二者中一个为纯合子且另一个为杂合子的概率。依据这一定义,p1_HoHe可以写作:
Figure BDA0001835479540000093
p1_HeHe指A与B在该基因座只有1个相同的等位基因且二者均为杂合子的概率。依据这一定义,p1_HeHe可以写作:
Figure BDA0001835479540000101
进一步地,依据p1_HoHe、p1_HeHe的计算公式和式(5),可以得到p1的计算公式如下:
Figure BDA0001835479540000102
p0计算公式的推导
依据式(3)和p2、p1的计算公式,可得到p0的计算公式为:
Figure BDA0001835479540000103
其中,p0_HoHo指A与B无相同等位基因且二者均为纯合子的概率。依据这一定义,p0_HoHo可以写作:
Figure BDA0001835479540000104
同时,p0_HoHe指A与B无相同等位基因且二者中一个为纯合子且另一个为杂合子的概率。依据这一定义,p0_HoHe可以写作:
Figure BDA0001835479540000111
此外,p0_HeHe指A与B均为杂合子且无相同的等位基因。依据这一定义,p0_HeHe可以写作:
Figure BDA0001835479540000112
依据式(6)以及p0、p0_HoHo和p0_HeHo的计算公式,可换算得到p0_HeHe的计算式如下:
Figure BDA0001835479540000113
无亲缘关系个体对人群中IBS的期望值、总体率和方差
依据a2、a1、a0的定义可知,对无亲缘关系个体对A与B采用包含n个相互独立的STR基因座进行分型检测,a2=1这样的事件所发生的次数,即A2,服从总体率为P2的二项分布,可记作A2~B(n,P2);同样的,A1服从总体率为P1的二项分布,记作A1~B(n,P1)。其中P1为各位点p2的算术平均数,P1为各位点p1的算术平均数,则有:
Figure BDA0001835479540000114
Figure BDA0001835479540000115
对于包含n个相互独立的STR基因座的分型系统而言,IBS的最大值为2n,则无亲缘关系个体对人群的IBS服从总体率为π0的二项分布:IBS~B(2n,π0)。
依据式(2)可以计算出IBS的期望值E(IBS)为:
Figure BDA0001835479540000116
则无亲缘关系个体对人群中IBS的总体率π0为:
Figure BDA0001835479540000121
全同胞对人群中IBS二项分布的推导过程
依据我国现代婚配习俗,全同胞对C与D的生物学父母可以认为是无亲缘关系个体。在某常染色体STR基因座,A与B两名无亲缘关系个体,最少可检出1种等位基因(以P表示),最多可检出4种不同的等位基因(分别以P、Q、R、S表示)。A与B生育两名个体为两次独立事件,在不考虑STR基因座自发突变的情形下,依据孟德尔遗传规律,可得到A与B不同基因型组合对应C与D间在该常染色体STR基因座a2=1、a1=1、a0=1的概率,具体列于下表1:
表1 亲代不同基因型组合对应子代全同胞对a2、a1或a0取值为1的概率
Figure BDA0001835479540000122
备注:子代可能的基因型列于第一列等号后的括号内,第一列中亲代A与B不同基因型组合对应的概率计算公式请参见(式4)~(式6);Ho表示纯合子,He表示杂合子;HoHo表示均为纯合子;HoHe表示一个为纯合子、另一个为杂合子;HeHe则表示均为杂合子。
若以p2FS、p1FS分别表示全同胞对C与D间a2、a1取值为1的概率,则依据表1可知p2FS、p1FS可分别表示为:
p2FS=p2FS_HoHo+p2FS_HeHe (式7)
p1FS=p1FS_HoHe+p1FS_HeHe (式8)
p2FS计算公式的推导
其中,p2FS_HoHo指C与D基因型相同且均为纯合子的概率,这一概率为表1中第二列各行概率值与相应A与B基因型组合概率乘积之和,即p2FS_HoHo可以写作:
Figure BDA0001835479540000131
由此可知:
Figure BDA0001835479540000132
并且,p2FS_HeHe指C与D基因型相同且均为杂合子的概率,这一概率为表1中第三列各行概率值与相应A与B基因型组合概率乘积之和,即p2FS_HeHe可以写作:
Figure BDA0001835479540000133
进一步可知:
Figure BDA0001835479540000134
从而依据式(7)得到:
Figure BDA0001835479540000135
p1FS计算公式的推导
其中,p1FS-HoHe指C与D在该基因座只有1个相同的等位基因且二者中一个为纯合子而另一个为杂合子的概率。这一概率为表1中第四列各行概率值与相应A与B基因型组合概率乘积之和,即p1FS_HoHe可写作:
Figure BDA0001835479540000136
由此可知:
Figure BDA0001835479540000141
并且,p1FS_HeHe指C与D在该基因座只有1个相同的等位基因且二者均为杂合子的概率。这一概率为表1中第五列各行概率值与相应A与B基因型组合概率乘积之和,即p1FS_HeHe可写作:
Figure BDA0001835479540000142
因此:
Figure BDA0001835479540000143
从而依据式(8)得到:
Figure BDA0001835479540000144
全同胞对人群中IBS的期望值、总体率和方差
对生物学全同胞对C与D采用包含n个相互独立的STR基因座进行分型检测,a2=1这样的事件所发生的次数,即A2FS,服从总体率为P2FS的二项分布,可记作A2~B(n,P2FS);同样的,A1FS服从总体率为P1FS的二项分布,记作A1~B(n,P1FS)。其中P2FS为各位点p2FS的算术平均数,而P1FS为各位点p1FS的算术平均数,则有:
Figure BDA0001835479540000145
Figure BDA0001835479540000146
并且,依据式(2)和二项分布的可加性,对于包含n个相互独立的STR基因座的分型系统而言,IBS的最大值为2n,则IBS在全同胞对人群中服从总体率为π1的二项分布:IBS~B(2n,π1)。
可知全同胞对人群中IBS的期望值E(IBS)为:
Figure BDA0001835479540000151
则全同胞对人群中IBS的总体率π1为:
Figure BDA0001835479540000152
实施例1
根据《生物学全同胞关系鉴定实施规范,SF/Z JD0105002—2014》,并采用本发明所述的基于概率统计模型的生物学全同胞鉴定方法对两名被鉴定人进行检测和鉴定:
步骤一,提取DNA:
采用市售的DNA提取试剂盒,分别提取两名被鉴定人的指血基因组DNA;
步骤二,STR分型:
采用Goldeneye 20A试剂盒,进行PCR扩增,对两名被鉴定人的19个必检基因座实施STR分型,以获得19个相互独立的STR基因座的分型结果;
步骤三,建立检验假设
原假设H0:两名被鉴定人为无亲缘关系个体;
备择假设H1:两名被鉴定人为生物学全同胞;
步骤四,计算统计量:
依据两名被鉴定人的19个必检基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值=10;
步骤五,获得二项分布特征:
依据Forensic Sci Int:Genet,2009,3(4),e117-e118与法医学杂志,2007,23(5):345-346两篇文献所提供的所述19个必检基因座在华东汉族人群中的等位基因频率,得到在该分型系统中,IBS在无亲缘关系个体对人群中符合二项分布IBS~B(38,0.3110),IBS在全同胞对人群中符合二项分布IBS~B(38,0.6280),其对应的概率分布参见图1;
步骤六,分别计算两名被鉴定人为无亲缘关系个体的概率pH0以及两名被鉴定人为 全同胞的概率pH1
采用EXCEL中的二项分布函数,已知IBS=10,2n=38,π0=0.3110,π1=0.6280,则:
pH0=BINOMDIST(10,38,0.3110,FALSE)=0.118129596;
pH1=BINOMDIST(10,38,0.6280,FALSE)=0.000004260。
步骤七,遗传学证据价值评估:
R0=pH0/pH1=0.118129596/0.000004260≈27726
这表明:两名被鉴定人为无亲缘关系个体的概率是二者为全同胞的概率的约27726倍。IBS=10时,将全同胞误判断为无关个体的概率为pH1=0.000004260,即IBS=10时,“倾向于认定两名被鉴定人为无亲缘关系个体”这一结论的准确性为:1-pH1=0.999995740。
实施例2
采用本发明所述的基于概率统计模型的生物学全同胞鉴定方法对《生物学全同胞关系鉴定实施规范,SF/Z JD0105002—2014》所给定阈值的效能进行评估:
根据上述实施例1可知,当采用《生物学全同胞关系鉴定实施规范,SF/ZJD0105002—2014》中的19个必检STR基因座对两名被鉴定人进行STR分型检验时,IBS在无亲缘关系个体对人群中符合二项分布IBS~B(38,0.3110),IBS在全同胞对人群中符合二项分布IBS~B(38,0.6280),则有:
IBS<=13的真无关个体为:BINOMDIST(13,38,0.3110,TURE)=0.7268
IBS>=22的全同胞为:1-BINOMDIST(21,38,0.6280,TURE)=0.7876
IBS<=13的全同胞(误判为无亲缘关系个体)为:
BINOMDIST(13,38,0.6280,TRUE)=0.0003
IBS>=22的无关个体(误判为全同胞)为:
BINOMDIST(21,38,0.3110,TRUE)=0.0006
所以,当检验19个必检STR基因座时,依据规范所给出的阈值,能得出倾向性意见的比例(即灵敏度)为:(0.7268+0.7876)/2=0.7572;
得到的倾向性意见的把握度(即特异性)为:0.9996。
以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

Claims (3)

1.一种基于概率统计模型的生物学全同胞鉴定方法,其特征在于,包括以下步骤:
S1:使用DNA提取试剂盒,分别提取两名被鉴定人的生物检材基因组DNA;
S2:进行PCR扩增,实施STR分型,以获得n个相互独立的STR基因座的分型结果;
S3:建立检验假设:
原假设H0:两名被鉴定人为无亲缘关系个体;
备择假设H1:两名被鉴定人为生物学全同胞;
S4:依据两名被鉴定人的STR基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值;
S5:依据各STR基因座在人群中的等位基因频率,得到IBS在无亲缘关系个体对人群中符合二项分布IBS~B(2n,π0),IBS在全同胞对人群中符合二项分布IBS~B(2n,π1);
其中,以a2=1、a1=1、a0=1分别表示在任一STR基因座上存在2个相同的等位基因、仅存在1个相同的等位基因、无相同的等位基因的状态各自成立,a2、a1、a0分别为0时则表示上述各状态各自不成立;
设任一STR基因座有m个等位基因,并以fi表示该STR基因座上第i个等位基因的频率,其中i=1,2,3……m,则有:
Figure FDA0001835479530000011
以p2、p1、p0分别表示无亲缘关系个体对A与B之间a2、a1、a0取值为1的概率,则有:
p2+p1+p0=1
其中,
Figure FDA0001835479530000012
Figure FDA0001835479530000013
Figure FDA0001835479530000021
因此,在无亲缘关系个体对人群中的IBS的期望值E(IBS)为:
Figure FDA0001835479530000022
在无亲缘关系个体对人群中的IBS的总体率π0为:
Figure FDA0001835479530000023
以p2FS、p1FS分别表示全同胞对C与D之间a2、a1取值为1的概率,则有:
Figure FDA0001835479530000024
Figure FDA0001835479530000025
因此,在全同胞对人群中的IBS的期望值E(IBS)为:
Figure FDA0001835479530000026
在全同胞对人群中的IBS的总体率π1为:
Figure FDA0001835479530000027
S6:使用EXCEL软件中的BINOMDIST函数进行计算:
输入参数BINOMDIST(IBS值,2n,π0,FALSE)以计算出两名被鉴定人为无亲缘关系个体的概率pH0
输入参数BINOMDIST(IBS值,2n,π1,FALSE)以计算出两名被鉴定人为全同胞的概率pH1
S7:遗传学证据价值评估:
当pH1>pH0时,计算pH1与pH0的比值R1,其意义为:两名被鉴定人为全同胞的概率是二者为无亲缘关系个体的概率的R1倍;当pH1<pH0时,计算pH0与pH1的比值R0,其意义为:两名被鉴定人为无亲缘关系个体的概率是二者为全同胞的概率的R0倍;
当倾向于认定两名被鉴定人为无亲缘关系个体时,这一结论的犯错概率为pH1,其准确性=1-pH1;当倾向于认定两名被鉴定人为全同胞时,这一结论的犯错概率为pH0,其准确性=1-pH0
2.根据权利要求1所述的基于概率统计模型的生物学全同胞鉴定方法,其特征在于,步骤S2中所述的STR基因座至少包括以下19个必检基因座:vWA、D21S11、D18S51、D5S818、D7S820、D13S317、D16S539、FGA、D8S1179、D3S1358、CSF1PO、TH01、TPOX、Penta E、Penta D、D2S1338、D19S433、D12S391、D6S1043。
3.根据权利要求2所述的基于概率统计模型的生物学全同胞鉴定方法,其特征在于,步骤S2中所述的STR基因座由所述19个必检基因座和若干个不同的补充基因座组成,其中所述的补充基因座选自:D1S1656、D2S441、D3S1744、D3S3045、D4S2366、D5S2500、D6S477、D7S1517、D7S3048、D8S1132、D10S1248、D10S1435、D10S2325、D11S2368、D13S325、D14S608、D15S659、D17S1290、D18S535、D19S253、D21S2055、D22-GATA198B05。
CN201811223988.2A 2018-10-19 2018-10-19 一种基于概率统计模型的生物学全同胞鉴定方法 Active CN109273046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811223988.2A CN109273046B (zh) 2018-10-19 2018-10-19 一种基于概率统计模型的生物学全同胞鉴定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811223988.2A CN109273046B (zh) 2018-10-19 2018-10-19 一种基于概率统计模型的生物学全同胞鉴定方法

Publications (2)

Publication Number Publication Date
CN109273046A CN109273046A (zh) 2019-01-25
CN109273046B true CN109273046B (zh) 2022-04-22

Family

ID=65193026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811223988.2A Active CN109273046B (zh) 2018-10-19 2018-10-19 一种基于概率统计模型的生物学全同胞鉴定方法

Country Status (1)

Country Link
CN (1) CN109273046B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091869A (zh) * 2020-01-13 2020-05-01 北京奇云诺德信息科技有限公司 以snp为遗传标记物的亲缘关系鉴定方法
CN115206424B (zh) * 2022-08-24 2023-04-07 温州医科大学 一种全同胞关系鉴定方法、系统、设备及存储介质
CN115206425B (zh) * 2022-08-24 2023-03-21 温州医科大学 一种三联体亲权鉴定方法、系统、设备及存储介质
CN115273976B (zh) * 2022-08-24 2023-05-05 温州医科大学 一种半同胞关系鉴定方法、系统、设备及存储介质
CN117219162A (zh) * 2023-09-12 2023-12-12 四川大学 针对肿瘤组织str图谱进行身源鉴定的证据强度评估方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101144774A (zh) * 2007-08-24 2008-03-19 张兹钧 人类STRtyper PCR扩增荧光检测试剂盒
CN101838686A (zh) * 2009-12-16 2010-09-22 公安部物证鉴定中心 亲缘关系鉴定装置及方法
CN101948919A (zh) * 2010-09-09 2011-01-19 成都大熊猫繁育研究基地 一种用于大熊猫亲子鉴定的试剂盒
CN102858998A (zh) * 2009-11-25 2013-01-02 雀巢产品技术援助有限公司 用于肠易激综合征诊断的新基因组生物标记
CN104024438A (zh) * 2012-09-28 2014-09-03 未名兴旺系统作物设计前沿实验室(北京)有限公司 Snp位点集合及其使用方法与应用
CN104134016A (zh) * 2014-07-30 2014-11-05 北京诺禾致源生物信息科技有限公司 分子水平上的系谱重建的装置和方法
CN105861668A (zh) * 2016-04-21 2016-08-17 昆明医科大学 一种法医物证学亲子鉴定和计算个人识别参数方法
CN107541554A (zh) * 2017-09-14 2018-01-05 中山大学 用于人体个体识别和/或亲权鉴定的遗传标记及其检测方法和试剂盒
CN107977550A (zh) * 2017-12-29 2018-05-01 天津科技大学 一种基于压缩的快速分析致病基因算法
CN108103184A (zh) * 2018-02-23 2018-06-01 古洁若 一种用于检测强直性脊柱炎易感风险位点的试剂盒
CN108135944A (zh) * 2014-11-25 2018-06-08 伊夫罗生物科学公司 益生菌和益生元组合物及其调节微生物组的方法和用途

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6777196B2 (en) * 1997-02-18 2004-08-17 Genentech, Inc. Neurturin receptor
US20040157220A1 (en) * 2003-02-10 2004-08-12 Purnima Kurnool Methods and apparatus for sample tracking
CN101617227B (zh) * 2006-11-30 2013-12-11 纳维哲尼克斯公司 遗传分析系统和方法
CN101921851A (zh) * 2010-08-13 2010-12-22 司法部司法鉴定科学技术研究所 一种基于Identifiler系统的肿瘤组织身源的认定方法
CN102982222B (zh) * 2011-09-02 2016-03-02 司法部司法鉴定科学技术研究所 获取无突变情形下亲缘指数的简便方法
JP6637885B2 (ja) * 2013-07-21 2020-01-29 ペンデュラム セラピューティクス, インコーポレイテッド マイクロバイオームの特性解明、モニタリング、および処置のための方法およびシステム
CN103559427B (zh) * 2013-11-12 2017-10-31 高扬 一种用数字标识生物序列和推断物种亲缘关系的方法
CN104480205B (zh) * 2014-12-10 2017-01-18 西安交通大学 一种基于全基因组str建立动物亲权鉴定系统的方法
CN104630383B (zh) * 2015-03-17 2017-03-01 内蒙古农业大学 双峰驼多态性引物及其筛选方法和鉴定亲子关系的方法
CN107609343B (zh) * 2017-08-14 2019-11-08 广州金域司法鉴定技术有限公司 亲缘关系鉴定方法、系统、计算机设备及可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101144774A (zh) * 2007-08-24 2008-03-19 张兹钧 人类STRtyper PCR扩增荧光检测试剂盒
CN102858998A (zh) * 2009-11-25 2013-01-02 雀巢产品技术援助有限公司 用于肠易激综合征诊断的新基因组生物标记
CN101838686A (zh) * 2009-12-16 2010-09-22 公安部物证鉴定中心 亲缘关系鉴定装置及方法
CN101948919A (zh) * 2010-09-09 2011-01-19 成都大熊猫繁育研究基地 一种用于大熊猫亲子鉴定的试剂盒
CN104024438A (zh) * 2012-09-28 2014-09-03 未名兴旺系统作物设计前沿实验室(北京)有限公司 Snp位点集合及其使用方法与应用
CN104134016A (zh) * 2014-07-30 2014-11-05 北京诺禾致源生物信息科技有限公司 分子水平上的系谱重建的装置和方法
CN108135944A (zh) * 2014-11-25 2018-06-08 伊夫罗生物科学公司 益生菌和益生元组合物及其调节微生物组的方法和用途
CN105861668A (zh) * 2016-04-21 2016-08-17 昆明医科大学 一种法医物证学亲子鉴定和计算个人识别参数方法
CN107541554A (zh) * 2017-09-14 2018-01-05 中山大学 用于人体个体识别和/或亲权鉴定的遗传标记及其检测方法和试剂盒
CN107977550A (zh) * 2017-12-29 2018-05-01 天津科技大学 一种基于压缩的快速分析致病基因算法
CN108103184A (zh) * 2018-02-23 2018-06-01 古洁若 一种用于检测强直性脊柱炎易感风险位点的试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Systematic detection of putative tumor suppressor genes through the combined use of exome and transcriptome sequencing;Zhao Q等;《Genome Biology》;20101231;第11卷(第11期);第1-14页 *
推导 IBS 评分在无关个体对人群中概率分布的计算公式;赵焕东等;《法医学杂志》;20181008;第34卷(第4期);第370-374页 *

Also Published As

Publication number Publication date
CN109273046A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN109273046B (zh) 一种基于概率统计模型的生物学全同胞鉴定方法
Zaidi et al. Demographic history mediates the effect of stratification on polygenic scores
Wang Sibship reconstruction from genetic data with typing errors
EP2321642B1 (en) Methods for allele calling and ploidy calling
Adie et al. Speeding disease gene discovery by sequence based candidate prioritization
Thomson et al. Validation of short tandem repeat analysis for the investigation of cases of disputed paternity
Tian et al. Estimating the genome-wide mutation rate with three-way identity by descent
US20140032128A1 (en) System and method for cleaning noisy genetic data and determining chromosome copy number
Duntsch et al. Polygenic basis for adaptive morphological variation in a threatened Aotearoa| New Zealand bird, the hihi (Notiomystis cincta)
Osada Genetic diversity in humans and non-human primates and its evolutionary consequences
Crow et al. Mutation in human populations
Reinhardt et al. Meiotic drive impacts expression and evolution of X-linked genes in stalk-eyed flies
KR102405245B1 (ko) 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
Fuller et al. Extensive recombination suppression and epistatic selection causes chromosome-wide differentiation of a selfish sex chromosome in Drosophila pseudoobscura
Inbar et al. Comparative study of population genomic approaches for mapping colony-level traits
Yin et al. Overt and concealed genetic loads revealed by QTL mapping of genotype-dependent viability in the Pacific oyster Crassostrea gigas
Mackintosh et al. Do chromosome rearrangements fix by genetic drift or natural selection? Insights from Brenthis butterflies
KR20220062265A (ko) 정자 제공자, 난모세포 제공자, 및 각 수태물 간의 유전적 관계를 결정하기 위한 시스템 및 방법(system and method for determining genetic relationships between a sperm provider, oocyte provider, and the respective conceptus)
Hatch et al. Phylogenetic relationships among the baleen whales based on maternally and paternally inherited characters
Langefeld et al. Association methods in human genetics
CN112639129A (zh) 确定新发突变在胚胎中的遗传状态的方法和装置
JP6564053B2 (ja) 細胞間または細胞群間の同一人かどうか、他人かどうか、親子かどうか、または血縁関係かどうかの判定方法
JP7446343B2 (ja) ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法
Williams Neuroscience meets quantitative genetics: using morphometric data to map genes that modulate CNS architecture
Mackintosh et al. Do chromosome rearrangements fix by genetic drift or natural selection? A test in Brenthis butterflies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211123

Address after: Room 201-1, No. 88, dongfangcheng, Xuanwu District, Nanjing, Jiangsu 210018

Applicant after: JIANGSU DONGNAN EVIDENCE SCIENCE RESEARCH INSTITUTE Co.,Ltd.

Address before: 201100 room 402, building 2, No. 138, Xinjun Ring Road, Minhang District, Shanghai

Applicant before: SHANGHAI JINGZHUN BIOMEDICINE Co.,Ltd.

Applicant before: Jiangsu southeast Evidence Science Research Institute Co., Ltd

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant