CN107832586B - 一种三个体组合亲缘关系鉴定方法及装置 - Google Patents

一种三个体组合亲缘关系鉴定方法及装置 Download PDF

Info

Publication number
CN107832586B
CN107832586B CN201711092467.3A CN201711092467A CN107832586B CN 107832586 B CN107832586 B CN 107832586B CN 201711092467 A CN201711092467 A CN 201711092467A CN 107832586 B CN107832586 B CN 107832586B
Authority
CN
China
Prior art keywords
individual
genotype
probability
relationship
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711092467.3A
Other languages
English (en)
Other versions
CN107832586A (zh
Inventor
孙宏钰
李海霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201711092467.3A priority Critical patent/CN107832586B/zh
Publication of CN107832586A publication Critical patent/CN107832586A/zh
Application granted granted Critical
Publication of CN107832586B publication Critical patent/CN107832586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种三个体组合亲缘关系鉴定方法及装置,涉及亲缘鉴定领域。用于解决现有技术中通过鉴定两两个体之间是否存在亲缘关系,来鉴定三个体之间是否存在亲缘关系的鉴定风险大的问题。该方法包括:根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型;根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘指数KI值。

Description

一种三个体组合亲缘关系鉴定方法及装置
技术领域
本发明涉及亲缘鉴定领域,主要涉及一种三个体组合亲缘关系鉴定方法及装置。
背景技术
现如今,随着人们法制观念增强,思维观念和婚姻观念的转变,关于亲缘鉴定的刑事案件和民事纠纷也随之增多,随着案件数量的增多,导致需要甄别的关系类型和范围随着社会需求的改变扩大,同时亲缘关系的明确对于刑事案件和民事纠纷提供了极其重要的科学依据。
目前,人们通过ITO法来计算两个体的亲缘指数(英文:kinship index,缩写:KI)值,来分析两两个体之间是否存在亲缘关系。其中,ITO法可以判定两人之间是否存在全同胞、半同胞、叔侄/姑侄/舅甥/姨甥,以及祖孙等关系类型。虽然ITO法公式较为简单,相对固定,计算分析较为容易,但是此法仅适用于两两个体之间的分析,因此,ITO法在三个体亲缘关系鉴定的场景下,需要将三个体拆分成两两个体来进行分析,不能充分利用该三个体的遗传信息,进而在鉴定三个体之间是否存在亲缘关系的过程中会导致结论错误的情况发生,鉴定风险大。
发明内容
本发明实施例提供一种三个体组合亲缘关系鉴定方法,用以解决现有技术中通过鉴定两两个体之间是否存在亲缘关系,来鉴定三个体之间是否存在亲缘关系的鉴定风险大的问题。
本发明实施例提供一种三个体组合亲缘关系鉴定方法,所述三个体组合包括一个可疑个体和两个已知个体;其中,所述可疑个体为需要确定亲缘关系的个体;所述已知个体为已明确具有某种亲缘关系的两个个体;所述方法包括:
根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型;
根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘指数KI值。
优选地,所述三个体组合亲缘关系类型包括三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
优选地,根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型包括:
根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y;
根据所述概率X和所述概率Y,建立所述似然比模型
Figure BDA0001461544590000021
其中,KI表示为所述三个体组合亲缘指数KI值。
优选地,根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y包括:
根据所述可疑个体的基因型和所述已知个体的基因型,确定与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据公式X=a已知×a可疑×ax,确定所述可疑个体和所述已知个体之间存在所述被鉴定亲缘关系的概率X;其中,a已知表示为已知个体的基因型概率;a可疑表示为所述可疑个体的基因型概率;ax表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据所述已知个体的基因型,确定与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率;
根据公式Y=a已知×a可疑×ay,确定所述可疑个体和所述已知个体之间不存在所述被鉴定亲缘关系的概率Y;其中,ay表示为与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率。
优选地,与所述可疑个体存在所述被鉴定亲缘关系个体的至少包括一种基因型;与所述已知个体存在所述被鉴定亲缘关系个体的至少包括一种基因型;根据所述概率X和所述概率Y,建立所述似然比模型
Figure BDA0001461544590000031
包括:
根据所述可疑个体和所述已知个体之间存在亲缘关系的概率Xm,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Yn,建立所述似然比模型
Figure BDA0001461544590000032
其中,Xm表示为第m种与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与所述已知个体存在所述被鉴定亲缘关系个体的基因型概率;m表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型个数;n表示为与所述已知个体存在所述被鉴定亲缘关系个体的基因型个数。
本发明实施例提供一种三个体组合亲缘关系鉴定装置,所述三个体组合包括一个可疑个体和两个已知个体;其中,所述可疑个体为需要确定亲缘关系的个体;所述已知个体为已明确具有某种亲缘关系的两个个体;所述装置包括:
建立模块,用于根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型;
计算模块,用于根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘指数KI值。
优选地,所述三个体组合亲缘关系类型包括三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
优选地,所述建立模块,具体用于根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y;
根据所述概率X和所述概率Y,建立所述似然比模型
Figure BDA0001461544590000041
其中,KI表示为所述三个体组合亲缘指数KI值。
优选地,所述建立模块,具体用于根据所述可疑个体的基因型和所述已知个体的基因型,确定与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据公式X=a已知×a可疑×ax,确定所述可疑个体和所述已知个体之间存在所述被鉴定亲缘关系的概率X;其中,a已知表示为已知个体的基因型概率;a可疑表示为所述可疑个体的基因型概率;ax表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据所述已知个体的基因型,确定与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率;
根据公式Y=a已知×a可疑×ay,确定所述可疑个体和所述已知个体之间不存在所述被鉴定亲缘关系的概率Y;其中,ay表示为与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率。
优选地,与所述可疑个体存在所述被鉴定亲缘关系个体的至少包括一种基因型;与所述已知个体存在所述被鉴定亲缘关系个体的至少包括一种基因型;
所述建立模块,具体用于根据所述可疑个体和所述已知个体之间存在亲缘关系的概率Xm,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Yn,建立所述似然比模型
Figure BDA0001461544590000042
其中,Xm表示为第m种与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与所述已知个体存在所述被鉴定亲缘关系个体的基因型概率;m表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型个数;n表示为与所述已知个体存在所述被鉴定亲缘关系个体的基因型个数。
本发明实施例提供一种三个体组合亲缘关系鉴定方法及装置,该方法包括:根据一个可疑个体的基因型和两个已知个体的基因型建立似然比模型;根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘关系鉴定结果,即计算三个体组合亲缘指数(英文:kinship index,缩写:KI)值。该方法中,通过充分利用三个体的基因型建立似然比模型来确定三个体之间进行亲缘关系鉴定,减少了通过两两个体之间的亲缘关系鉴定来推测三个体之间亲缘关系鉴定的误差,降低三人组合亲缘关系鉴定的风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的三个体组合亲缘关系鉴定方法的流程控制图;
图2为本发明实施例提供的为已知个体与亲生父母的亲缘关系示意图;
图3为本发明实施例提供的三个体组合亲缘关系鉴定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
亲缘指数(英文:kinship index,缩写:KI)是判定亲缘关系的重要指标。本发明实施例的技术构思为根据两个已知个体的基因型和一个可疑个体的基因型,及在特定群体无关个体中获得该基因型的概率,确定可疑个体与已知个体存在被鉴定亲缘关系的基因型概率,以及确定可疑个体与已知个体不存在亲缘关系个体的基因型概率;进而利用似然比模型确定亲缘指数KI值。这样,本发明实施例充分利用了三个体的遗传信息,减少了通过两两个体来确定可疑个体与已知个体之间是否存在亲缘关系带来的误差。
其中,个体(包括可疑个体、已知个体和特定群体无关个体)的某一基因座包括2个等位基因,不同等位基因的组合形成不同的基因型,需要说明的是,本发明实施例是以一个基因座的2个等位基因,且包括4种不同等位基因类型为例说明的,该4种类型分别为A、B、C和D。图1为本发明实施例提供的三个体组合亲缘关系鉴定方法的流程控制图,其中,三个体组合包括一个可疑个体和两个已知个体,其中,可疑个体为需要确定亲缘关系的个体;两个已知个体为已明确具有某种亲缘关系的两个个体;如图1所示,该方法包括以下步骤:
S101:根据可疑个体的基因型和已知个体的基因型建立似然比模型;
S102:根据被鉴定亲缘关系类型和似然比模型,计算三个体组合亲缘指数KI值。
在实际应用中,本发明实施例可以对多种三个体组合亲缘关系进行鉴定。优选地,三个体组合亲缘关系类型包括:三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
其中,三人全同胞关系包括三个体之间为同父同母关系。三人半同胞关系包括同父异母关系和同母异父关系。三人祖孙关系包括:一祖二孙关系、祖父(或祖母)-母(或父)-孙关系,以及祖父-祖母-孙关系等亲缘关系类型。三人表亲关系鉴定包括:二叔/姑(姨/舅)一侄(甥)关系、一叔/姑(姨/舅)二侄(甥)关系,以及叔/姑(姨/舅)一母(父)一侄(甥)关系等亲缘关系类型。具体的,如表1所示,为本发明实施例提供的三个体组合亲缘关系鉴定方法可以鉴定亲缘关系的11种三个体组合模式。其中,个体1和个体2都为已知个体。
表1
Figure BDA0001461544590000061
Figure BDA0001461544590000071
在实际应用中,可以通过利用个体基因座的等位基因来进行三个体组合亲缘关系鉴定。一般情况下,个体(包括可疑个体和已知个体)的基因座包含两个等位基因,该两个等位基因遵循遗传规律,一个来自父亲,一个来自母亲。因此,当确定已知个体的基因型和可疑个体的基因型时,就可以分别推断出各自亲生父母亲的基因型。
基于此,在步骤S101中,可以利用可疑个体的基因型和已知个体的基因型确定与可疑个体存在亲缘关系的个体(包括可疑个体的亲生父母)的基因型概率,以及利用已知个体的基因型,在与已知个体的存在亲缘关系的个体基因型中,确定与可疑个体不存在亲缘关系的个体的基因型概率;然后建立似然比模型,进而确定可疑个体与已知个体之间是否存在被鉴定亲缘关系。
优选地,步骤S101具体可以包括:根据可疑个体的基因型和已知个体的基因型,确定可疑个体和已知个体之间存在亲缘关系的概率X,以及可疑个体和已知个体之间不存在亲缘关系的概率Y;进而根据概率X和概率Y,建立似然比模型
Figure BDA0001461544590000072
其中,KI表示为三个体组合亲缘指数值。
其中,确定概率X和概率Y的具体实现方式可以包括:根据可疑个体的基因型和已知个体的基因型,确定与可疑个体具有亲缘关系个体的基因型概率,即可疑个体和已知个体之间存在亲缘关系的概率X;并同时利用可疑个体的基因型和已知个体的基因型,在与已知个体的存在亲缘关系的个体基因型中,确定与可疑个体不存在亲缘关系的个体的基因型概率,即可疑个体和已知个体之间存在不亲缘关系的概率Y。
优选地,确定概率X和概率Y的具体实现方式可以包括以下步骤:
S201:根据可疑个体的基因型和已知个体的基因型,确定与可疑个体存在被鉴定亲缘关系个体的基因型概率。
S202:根据公式X=a已知×a可疑×ax,确定可疑个体和已知个体之间存在被鉴定亲缘关系的概率X。
其中,a已知表示为已知个体的基因型概率;a可疑表示为可疑个体的基因型概率;ax表示为与可疑个体存在被鉴定亲缘关系个体的基因型概率。
S203:根据已知个体的基因型,确定与已知个体不存在被鉴定亲缘关系个体的基因型概率。
S204:根据公式Y=a已知×a可疑×ay,确定可疑个体和已知个体之间不存在被鉴定亲缘关系的概率Y;其中,ay表示为与已知个体不存在被鉴定亲缘关系个体的基因型概率。
实际应用中,与可疑个体存在被鉴定亲缘关系个体的至少包括一种基因型;与已知个体存在被鉴定亲缘关系个体的至少包括一种基因型。优选地,步骤S101具体可以包括:根据可疑个体和已知个体之间存在亲缘关系的概率Xm,以及可疑个体和已知个体之间不存在亲缘关系的概率Yn,建立似然比模型
Figure BDA0001461544590000081
其中,Xm表示为第m种与可疑个体存在被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与已知个体存在被鉴定亲缘关系个体的基因型概率;m表示为与可疑个体存在被鉴定亲缘关系个体的基因型个数;n表示为与已知个体存在被鉴定亲缘关系个体的基因型个数。
进而在步骤S102中,根据被鉴定亲缘关系类型、概率X和概率Y计算三个体组合KI值。具体的,根据被鉴定亲缘关系类型,确定可疑个体的父母所有可能的基因型及其基因型概率,以及确定已知个体的父母所有可能的基因型及其基因型概率;进而根据可疑个体的父母所有可能的基因型概率,以及已知个体的父母所有可能的基因型概率,确定鉴定结果,即计算三个体组合亲缘指数KI值。
这样,本发明实施例提供一种三个体组合亲缘关系鉴定方法,通过充分利用可疑个体的遗传信息和已知个体的遗传信息建立似然比模型,减少了在鉴定三个体之间是否存在亲缘关系的过程中,通过鉴定两两个体之间是否存在亲缘关系,进而确定三个体之间是否存在亲缘关系带来的误差。
为了清楚的描述本发明实施例,在一本发明实施例鉴定三人全同胞关系的示例中,假设个体1和个体2已知存在全同胞关系,个体3为可疑个体,被鉴定亲缘关系为个体3是否分别与个体1、个体2存在全同胞关系。
在某一基因座中,个体1的基因型为AB,个体2的基因型为CD,个体3的基因型为AC。该情况下,图2为个体1和个体2与亲生父母的亲缘关系示意图。其中,通过个体1的基因型和个体2的基因型,可以确定个体1和个体2的父母所有的基因型组合为:AD(父)和BC(母)、BC(父)和AD(母)、AC(父)和BD(母)与BD(父)和AC(母)。进一步的,根据父母的基因型确定子女所有的基因型。
基于此,个体3与已知个体之间的存在亲缘关系的概率Xm和不存在亲缘关系的概率Yn具体如表2所示。
表2
Figure BDA0001461544590000091
Figure BDA0001461544590000101
那么,
Figure BDA0001461544590000102
其中,根据个体1的基因型和个体2的基因型,可以确定与个体3的父母的基因型。特别的是,若基因型组合为AC与BD作为亲生父母,其子女的基因型不包括AC;因此,若个体3与已知个体存在亲缘关系,那么,三个个体的亲生父母基因型只能为AD和BC,即父亲分型为AD,母亲分型为BC,或父亲分型为BC,母亲分型为AD。若个体3与已知个体不存在亲缘关系,那么,已知个体的亲生父母的基因型可以是图2所示的的四种基因型组合中的任一种组合。
此外,根据孟德尔遗传定律,个体(包括可疑个体、已知个体和无关个体)的基因型概率是指个体的基因型在特定群体无关个体中存在的概率;其中,若基因型为纯合子,则基因型概率为该等位基因在特定群体无关个体中的频率的平方;若基因型为杂合子,则基因型概率为该2个等位基因在特定群体无关个体中的频率的2倍。示例的,若个体1的基因型为杂合子AD,那么,基因型为AD的概率为等位基因A在特定群体无关个体中的频率(即a)和等位基因D在特定群体无关个体中的频率(即d)乘积的2倍。
因此,若个体3是亲生父母基因型组合为AD(父)和BC(母)的子女,那么,个体3的基因型AC概率为传递父亲等位基因A概率的1/2,以及传递母亲等位基因C的概率的1/2的乘积,即1/2*1/2=1/4。由于在该示例中,个体3的亲生父母基因型只能为AD和BC,即父亲分型为AD,母亲分型为BC,或父亲分型为BC,母亲分型为AD,因此,若个体3传递父亲等位基因A的概率为1/2,传递母亲等位基因C的概率亦为1/2,那么,个体3的基因型AC概率就是1/2*1/2=1/4。同理,若个体3传递父亲等位基因C的概率为1/2,传递母亲等位基因A的概率亦为1/2,那么,个体3的基因型AC的概率就是1/2*1/2=1/4。
若个体3不是该基因型组合的子女,那么,个体3的AC基因型概率为特定群体无关个体中等位基因A的频率(即a),以及等位基因C频率(即c)乘积的2倍。类似的,个体1的基因型概率和个体2的基因型概率与个体3同理。其中,每个基因座的等位基因频率可以根据大量无关个体的群体调查得到。
在一本发明实施例鉴定三人半同胞关系的示例中,假设个体1和个体2已知存在同父异母半同胞关系,个体3为可疑个体,被鉴定亲缘关系为个体3是否分别与个体1、个体2存在同父异母半同胞关系。在某一基因座中,个体1的基因型为AB,个体2的基因型为CD,个体3的基因型为AC。该情况下,个体3与已知个体之间的存在亲缘关系的概率Xm和不存在亲缘关系的概率Yn具体如表3所示。
表3
Figure BDA0001461544590000111
那么,
Figure BDA0001461544590000121
其中,根据个体1的基因型AB和个体2的基因型CD,以及孟德尔遗传定律可知,个体1与个体2的亲生父亲的基因型包括AC、AD、BC和BD;根据个体1和个体2的亲生父亲的基因型,可以确定已知个体与个体3同一父亲的基因型,即个体3的亲生父亲的基因型为AC、AD和BC。
基于此,若个体3的亲生父亲的基因型是AC,那么,当个体3的父亲的等位基因A传递给个体3时,个体3的等位基因C在特定群体无关个体的频率是c,那么个体3的基因型AC概率为c/2。类似的,当父亲的等位基因C传递给个体3时,个体3的等位基因A的概率为等位基因A在特定群体无关个体的频率(即a),而个体3的基因型AC概率为a/2;可以理解的,个体3的基因型AC总的概率为(a+c)/2。同理,当个体3的父亲的基因型分别为AD时,个体3只能遗传到父亲的等位基因A,当个体3的父亲的基因型为BC时,个体3只能遗传到父亲的等位基因C;该两种情况下,个体3的的基因型概率为父亲将等位基因A或C传递给个体3的概率(即1/2),以及其亲生母亲传递的等位基因(即C或A)概率的乘积,即c/2或a/2。
若个体3与已知个体不存在亲缘关系,那么,个体3的基因型概率为特定群体无关个体中等位基因A的频率(即a),以及等位基因C的频率(即c)乘积的2倍。类似的,个体1的基因型概率和个体2的基因型概率与个体3同理。
在一本发明实施例鉴定三人祖孙关系鉴定的示例中,假设个体1、个体2已知存在爷孙关系(即个体2为个体1的孙子),个体3为可疑个体,被鉴定亲缘关系为个体3与个体1是否为爷孙关系。
在某一基因座中,个体1的基因型为AB,个体2的基因型为CD,个体3的基因型为AC,同样的,该情况下,根据孟德尔遗传定律可知,既是个体1的亲生儿子又是个体2和个体3的亲生父亲的基因型可为AC、AD或BC;即是个体1的亲生儿子又是个体2的亲生父亲的个体基因型为AC、AD、BC或BD。基于此,个体3分别与已知个体之间存在亲缘关系的概率Xm和不存在亲缘关系的概率Yn具体如表4所示:
表4
Figure BDA0001461544590000131
那么,
Figure BDA0001461544590000132
在一本发明实施例三人表亲关系鉴定的示例中,假设两个已知个体分别为个体1和个体2,可疑个体为个体3。在某一基因座中,个体1的基因型为AB,个体2的基因型为CD,个体3的基因型为AC;个体1与个体2存在全同胞关系,被鉴定亲缘关系为个体3与个体2、个体1同是叔侄关系。
同样的,该情况下,根据孟德尔遗传定律可知,个体1、个体2和个体3的共同父母的分型可为AC、BD或AD、BC,其中,个体3与已知个体之间存在亲缘关系的概率X包括X1至X14;个体1、2的亲生父母亲的基因型为AC、BD或AD、BC,其中,个体3与已知个体之间不存在被鉴定亲缘关系的概率Y包括Y1至Y16。基于此,个体3分别与已知个体之间的存在亲缘关系的概率Xm和不存在亲缘关系的概率Yn具体如表5所示:
表5
Figure BDA0001461544590000141
Figure BDA0001461544590000151
Figure BDA0001461544590000161
Figure BDA0001461544590000162
在实际应用中,本发明实施例可以根据上述方法,可以对各种三人全同胞关系进行推导计算,得到可疑个体的鉴定结果。
综上所述,本发明实施例提供一种三个体组合亲缘关系鉴定方法,该方法通过充分利用三个体的遗传信息建立似然比模型来确定三个体的亲缘关系鉴定,即本发明实施例通过根据两个已知个体和一个可疑个体的基因型,及在特定群体无关个体中获得的该基因型概率,确定可疑个体与已知个体存在亲缘关系的基因型概率;以及确定可疑个体与已知个体不存在亲缘关系个体的基因型概率;进而利用似然比模型,确定计算KI值,减少了仅通过两两个体之间的亲缘关系鉴定来推测三个体之间亲缘关系鉴定的误差,降低三人组合亲缘关系鉴定的风险。
如图3所示,为本发明实施例提供了一种三个体组合亲缘关系鉴定装置30的结构示意图。其中,三个体组合亲缘关系鉴定装置可以是执行图1所示的三个体组合亲缘关系鉴定方法的处理器。其中,三个体组合包括一个可疑个体和两个已知个体;可疑个体为需要确定亲缘关系的个体;已知个体为已明确具有某种亲缘关系的两个个体;该三个体组合亲缘关系鉴定装置30包括:
建立模块301,用于根据可疑个体的基因型和已知个体的基因型建立似然比模型;
计算模块302,用于根据被鉴定亲缘关系类型和似然比模型,计算三个体组合亲缘指数KI值。
优选地,三个体组合亲缘关系类型包括三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
优选地,建立模块301,具体用于根据可疑个体的基因型和已知个体的基因型,确定可疑个体和已知个体之间存在亲缘关系的概率X,以及可疑个体和已知个体之间不存在亲缘关系的概率Y;
根据概率X和概率Y,建立似然比模型
Figure BDA0001461544590000171
其中,KI表示为三个体组合亲缘指数KI值。
优选地,建立模块301,具体用于根据可疑个体的基因型和已知个体的基因型,确定与可疑个体存在被鉴定亲缘关系个体的基因型概率;
根据公式X=a已知×a可疑×ax,确定可疑个体和已知个体之间存在被鉴定亲缘关系的概率X;其中,a已知表示为已知个体的基因型概率;a可疑表示为可疑个体的基因型概率;ax表示为与可疑个体存在被鉴定亲缘关系个体的基因型概率;
根据已知个体的基因型,确定与已知个体不存在被鉴定亲缘关系个体的基因型概率;
根据公式Y=a已知×a可疑×ay,确定可疑个体和已知个体之间不存在被鉴定亲缘关系的概率Y;其中,ay表示为与已知个体不存在被鉴定亲缘关系个体的基因型概率。
优选地,与可疑个体存在被鉴定亲缘关系个体的至少包括一种基因型;与已知个体存在被鉴定亲缘关系个体的至少包括一种基因型;
建立模块301,具体用于根据可疑个体和已知个体之间存在亲缘关系的概率Xm,以及可疑个体和已知个体之间不存在亲缘关系的概率Yn,建立似然比模型
Figure BDA0001461544590000181
其中,Xm表示为第m种与可疑个体存在被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与已知个体存在被鉴定亲缘关系个体的基因型概率;m表示为与可疑个体存在被鉴定亲缘关系个体的基因型个数;n表示为与已知个体存在被鉴定亲缘关系个体的基因型个数。
应当理解,以上一种三个体组合亲缘关系鉴定装置包括的单元仅为根据该设备装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的一种三个体组合亲缘关系鉴定装置所实现的功能与上述实施例提供的三个体组合亲缘关系鉴定方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例一中已做详细描述,此处不再详细描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种三个体组合亲缘关系鉴定方法,其特征在于,所述三个体组合包括一个可疑个体和两个已知个体;其中,所述可疑个体为需要确定亲缘关系的个体;所述已知个体为已明确具有某种亲缘关系的两个个体;所述方法包括:
根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型包括根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y;根据所述概率X和所述概率Y,建立所述似然比模型
Figure FDA0003218959490000011
其中,KI表示为所述三个体组合亲缘指数KI值;
根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘指数KI值;
根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y包括:
根据所述可疑个体的基因型和所述已知个体的基因型,确定与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据公式X=a已知×a可疑×aX,确定所述可疑个体和所述已知个体之间存在所述被鉴定亲缘关系的概率X;其中,a已知表示为已知个体的基因型概率;a可疑表示为所述可疑个体的基因型概率;ax表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据所述已知个体的基因型,确定与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率;
根据公式Y=a已知×a可疑×ay,确定所述可疑个体和所述已知个体之间不存在所述被鉴定亲缘关系的概率Y;其中,ay表示为与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率。
2.根据权利要求1所述的三个体组合亲缘关系鉴定方法,其特征在于,所述三个体组合亲缘关系类型包括三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
3.根据权利要求1所述的三个体组合亲缘关系鉴定方法,其特征在于,与所述可疑个体存在所述被鉴定亲缘关系的个体至少包括一种基因型;与所述已知个体存在所述被鉴定亲缘关系的个体至少包括一种基因型;根据所述概率X和所述概率Y,建立所述似然比模型包括:
根据所述可疑个体和所述已知个体之间存在亲缘关系的概率Xm,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Yn,建立所述似然比模型
Figure FDA0003218959490000021
其中,Xm表示为第m种与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与所述已知个体存在所述被鉴定亲缘关系个体的基因型概率;m表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型个数;n表示为与所述已知个体存在所述被鉴定亲缘关系个体的基因型个数。
4.一种三个体组合亲缘关系鉴定装置,其特征在于,所述三个体组合包括一个可疑个体和两个已知个体;其中,所述可疑个体为需要确定亲缘关系的个体;所述已知个体为已明确具有某种亲缘关系的两个个体;所述装置包括:
建立模块,用于根据所述可疑个体的基因型和所述已知个体的基因型建立似然比模型,具体用于根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y;根据所述概率X和所述概率Y,建立所述似然比模型
Figure FDA0003218959490000022
其中,KI表示为所述三个体组合亲缘指数KI值;
计算模块,用于根据被鉴定亲缘关系类型和所述似然比模型,计算三个体组合亲缘指数KI值;
其中,根据所述可疑个体的基因型和所述已知个体的基因型,确定所述可疑个体和所述已知个体之间存在亲缘关系的概率X,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Y包括:
根据所述可疑个体的基因型和所述已知个体的基因型,确定与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据公式X=a已知×a可疑×aX,确定所述可疑个体和所述已知个体之间存在所述被鉴定亲缘关系的概率X;其中,a已知表示为已知个体的基因型概率;a可疑表示为所述可疑个体的基因型概率;ax表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;
根据所述已知个体的基因型,确定与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率;
根据公式Y=a已知×a可疑×ay,确定所述可疑个体和所述已知个体之间不存在所述被鉴定亲缘关系的概率Y;其中,ay表示为与所述已知个体不存在所述被鉴定亲缘关系个体的基因型概率。
5.根据权利要求4所述的三个体组合亲缘关系鉴定装置,其特征在于,所述三个体组合亲缘关系类型包括三人全同胞关系、三人半同胞关系、三人祖孙关系和三人表亲关系。
6.根据权利要求4所述的三个体组合亲缘关系鉴定装置,其特征在于,与所述可疑个体存在所述被鉴定亲缘关系的个体至少包括一种基因型;与所述已知个体存在所述被鉴定亲缘关系的个体至少包括一种基因型;
所述建立模块,具体用于根据所述可疑个体和所述已知个体之间存在亲缘关系的概率Xm,以及所述可疑个体和所述已知个体之间不存在亲缘关系的概率Yn,建立所述似然比模型
Figure FDA0003218959490000031
其中,Xm表示为第m种与所述可疑个体存在所述被鉴定亲缘关系个体的基因型概率;Yn表示为第n种与所述已知个体存在所述被鉴定亲缘关系个体的基因型概率;m表示为与所述可疑个体存在所述被鉴定亲缘关系个体的基因型个数;n表示为与所述已知个体存在所述被鉴定亲缘关系个体的基因型个数。
CN201711092467.3A 2017-11-08 2017-11-08 一种三个体组合亲缘关系鉴定方法及装置 Active CN107832586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711092467.3A CN107832586B (zh) 2017-11-08 2017-11-08 一种三个体组合亲缘关系鉴定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711092467.3A CN107832586B (zh) 2017-11-08 2017-11-08 一种三个体组合亲缘关系鉴定方法及装置

Publications (2)

Publication Number Publication Date
CN107832586A CN107832586A (zh) 2018-03-23
CN107832586B true CN107832586B (zh) 2021-11-16

Family

ID=61654867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711092467.3A Active CN107832586B (zh) 2017-11-08 2017-11-08 一种三个体组合亲缘关系鉴定方法及装置

Country Status (1)

Country Link
CN (1) CN107832586B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335641B (zh) * 2019-06-26 2023-03-28 中山大学 一种四个体组合亲缘关系鉴定方法及装置
CN113160892B (zh) * 2021-05-25 2023-12-01 北京众诚天合系统集成科技有限公司 一种混合dna分型亲缘关系确定方法及系统
CN113257363B (zh) * 2021-05-31 2023-12-08 福建傲农生物科技集团股份有限公司 一种系谱的校正方法及装置
CN115346594B (zh) * 2022-08-24 2023-09-05 温州医科大学 一种无生母参与的祖孙关系鉴定方法、系统、设备及介质
CN115198024B (zh) * 2022-08-24 2023-06-27 温州医科大学 一种生母参与的祖孙关系鉴定方法、系统、设备及介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7957907B2 (en) * 2001-03-30 2011-06-07 Sorenson Molecular Genealogy Foundation Method for molecular genealogical research
CN101539915A (zh) * 2008-03-21 2009-09-23 余俊杰 家谱建立系统
CN101838686B (zh) * 2009-12-16 2013-01-16 公安部物证鉴定中心 亲缘关系鉴定装置及方法
JP5838557B2 (ja) * 2010-07-05 2016-01-06 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
CN201999947U (zh) * 2010-11-22 2011-10-05 中山大学 亲缘关系鉴定系统
CN102250883B (zh) * 2011-07-01 2014-04-16 中山大学 一种荧光标记的x-str基因座复合pcr方法及其应用
CN102982222B (zh) * 2011-09-02 2016-03-02 司法部司法鉴定科学技术研究所 获取无突变情形下亲缘指数的简便方法
WO2013123330A1 (en) * 2012-02-15 2013-08-22 Battelle Memorial Institute Methods and compositions for identifying repeating sequences in nucleic acids

Also Published As

Publication number Publication date
CN107832586A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
CN107832586B (zh) 一种三个体组合亲缘关系鉴定方法及装置
Alkuraya Discovery of rare homozygous mutations from studies of consanguineous pedigrees
Harris et al. Evolutionary genomic dynamics of Peruvians before, during, and after the Inca Empire
JP7277438B2 (ja) ゲノムデータ解析に近縁性を活用するシステム及び方法
WO2011111599A1 (ja) 障害分析ルール抽出装置、障害分析ルール抽出方法、及び記憶媒体
Santoni et al. Simultaneous identification and prioritization of variants in familial, de novo, and somatic genetic disorders with VariantMaster
CN107609343A (zh) 亲缘关系鉴定方法、系统、计算机设备及可读存储介质
De la Puente et al. Broadening the applicability of a custom multi-platform panel of microhaplotypes: bio-geographical ancestry inference and expanded reference data
CN110335641B (zh) 一种四个体组合亲缘关系鉴定方法及装置
Wen et al. The application of short and highly polymorphic microhaplotype loci in paternity testing and sibling testing of temperature-dependent degraded samples
Kishore et al. Inferring microbial co-occurrence networks from amplicon data: a systematic evaluation
Gerard Double reduction estimation and equilibrium tests in natural autopolyploid populations
US10796036B2 (en) Prediction of inhalable particles concentration
Ricke et al. Sherlock's Toolkit: A forensic DNA analysis system
Obikee et al. Comparison of outlier techniques based on simulated data
Pipes et al. Estimating the relative proportions of SARS-CoV-2 strains from wastewater samples
Fangal CTAT mutations: a machine learning based rna-seq variant calling pipeline incorporating variant annotation, prioritization, and visualization
Swaegers et al. Restricted X chromosome introgression and support for Haldane's rule in hybridizing damselflies
Feng et al. Whole mitochondrial genome analysis of Tai-Kadai-speaking populations in Southwest China
Campbell Geographic patterns of haplogroup R1b in the British Isles
Li et al. Leveraging identity-by-descent for accurate genotype inference in family sequencing data
Zeng et al. A pipeline for classifying relationships using dense SNP/SNV data and putative pedigree information
Wu et al. Identifying novel high-impact rare disease-causing mutations, genes and pathways in exomes of Ashkenazi Jewish inflammatory bowel disease patients
Qiao et al. A novel scatterplot-based method to detect copy number variation (CNV)
Li et al. Efficient haplotype inference from pedigrees with missing data using linear systems with disjoint-set data structures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant