CN112466397A - 一种用于亲缘关系检测的方法和装置 - Google Patents
一种用于亲缘关系检测的方法和装置 Download PDFInfo
- Publication number
- CN112466397A CN112466397A CN201910849700.0A CN201910849700A CN112466397A CN 112466397 A CN112466397 A CN 112466397A CN 201910849700 A CN201910849700 A CN 201910849700A CN 112466397 A CN112466397 A CN 112466397A
- Authority
- CN
- China
- Prior art keywords
- site
- detection
- genetic relationship
- free dna
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002068 genetic effect Effects 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000001514 detection method Methods 0.000 claims abstract description 101
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 42
- 238000001914 filtration Methods 0.000 claims abstract description 35
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 230000035772 mutation Effects 0.000 claims abstract description 31
- 238000007619 statistical method Methods 0.000 claims abstract description 26
- 238000012216 screening Methods 0.000 claims abstract description 16
- 210000003470 mitochondria Anatomy 0.000 claims abstract description 8
- 210000003765 sex chromosome Anatomy 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000008774 maternal effect Effects 0.000 claims description 45
- 108020004707 nucleic acids Proteins 0.000 claims description 14
- 150000007523 nucleic acids Chemical class 0.000 claims description 14
- 102000039446 nucleic acids Human genes 0.000 claims description 14
- 239000013068 control sample Substances 0.000 claims description 12
- 210000003754 fetus Anatomy 0.000 claims description 12
- 230000008775 paternal effect Effects 0.000 claims description 12
- 238000003205 genotyping method Methods 0.000 claims description 11
- 239000000523 sample Substances 0.000 claims description 10
- 230000001605 fetal effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 210000004381 amniotic fluid Anatomy 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 1
- 206010027146 Melanoderma Diseases 0.000 description 1
- 238000002669 amniocentesis Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Abstract
本申请公开了一种用于亲缘关系检测的方法和装置。本申请方法包括基因芯片检测步骤、分析位点筛选步骤、位点过滤步骤、统计分析步骤和亲缘关系判断步骤;基因芯片检测步骤包括检测父母和母本游离DNA的基因型位点;分析位点筛选步骤包括选取父母不同纯合基因型的位点;位点过滤步骤包括过滤掉性染色体、线粒体及父母或游离DNA未检测出的位点;统计分析步骤包括进行theta值计算,分析游离DNA各位点theta值,判断是否为杂合突变,计算杂合突变基因型位点占过滤位点的比例;亲缘关系判断步骤,包括利用无亲缘关系的对照样本对比判断亲缘关系。本申请方法,采用现有芯片实现无创亲缘关系检测,成本低、易操作、周期短、准确性高。
Description
技术领域
本申请涉及基因检测领域,特别是涉及一种无创亲子鉴定的方法和装置。
背景技术
传统的检测亲缘关系的方法主要是羊水穿刺检测,这种检测成本大、风险高,会给孕妇带来很大的心理压力。目前,有一种通过订制芯片的方式来进行亲缘关系检测;这种方法虽然没有羊水穿刺检测的高风险,但是,需要设计包含多态性SNP位点的捕获芯片。订制芯片不仅成本高,而且具有操作复杂、实验周期长、测序数据浪费等缺点。
因此,亟需研发一种快速、简单、准确且低成本的无创亲缘关系检测方法,以满足使用需求。
发明内容
本申请的目的是提供一种新的用于亲缘关系检测的方法和装置。
本申请采用了以下技术方案:
本申请的一方面公开了一种用于亲缘关系检测的方法,包括基因芯片检测步骤、分析位点筛选步骤、位点过滤步骤、统计分析步骤和亲缘关系判断步骤;
基因芯片检测步骤,包括采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息;
分析位点筛选步骤,包括选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;该步骤的目的是筛选出胎儿在理论上为杂合子的位点,以方便后续分析;可以理解,如果父母均为纯合子,且基因型不同,则后代必然是杂合子,且基因型应该是唯一确定的,例如基因型父亲为AA,母亲为BB或者父亲为BB,母亲为AA的位点,那么孩子的基因型一定为AB;如果父母不是纯合子,则后代的基因型存在多种可能性,其真实概率也难以估算,这无疑会增加后续分析的难度和准确性,因此,本申请特别筛选父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;
位点过滤步骤,包括从分析位点筛选步骤获取的位点中,过滤去除性染色体、线粒体上的位点,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点;位点过滤步骤的目的是去除性染色体位点和线粒体位点的影响;另外,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点,其目的是保留在三个检测对象都同时有检测到的位点,本申请的基本原理就是,利用父本和母本的基因型,首先根据遗传规律,算出后代的理论基因型,然后通过母本游离DNA推断出胎儿实际的基因型,通过两者之间的统计分析,来判断亲缘关系,因此,原则上用于分析的位点必须要是三个检测对象都同时有检测到的位点;
统计分析步骤,包括对经过位点过滤步骤剩余的各位点分别进行基因型分型数值theta值计算,统计分析母本游离DNA中各位点的theta值,判断各位点是否发生杂合突变,计算杂合突变的基因型位点的比值,标记为ratio1;
亲缘关系判断步骤,包括采用没有亲缘关系的样本作对照样本,分析母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判定母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。其中,统计分析步骤,在确定位点有发生杂合突变时,实际上就已经能够支持样本间的亲缘关系;亲缘关系判断步骤只是进一步的用对照样本确定和验证亲缘关系的存在;对照样本可以是随机获取的与胎儿没有亲缘关系的人类基因型位点信息,或者可以采用人类参考基因组作为对照样本进行分析;本申请的一种实现方式中,具体采用的是100例已知没有亲缘关系的样本作对照。
需要说明的是,本申请的亲缘关系检测方法,父本的核酸和母本的核酸都提取自外周血,母本游离DNA提取自孕妇血浆游离DNA,其中包含有游离的胎儿DNA,本申请的方法可以真正实现无创亲缘关系检测。本申请的检测方法,直接采用现有的基因检测芯片即可,不需要订制捕获芯片,大大降低了实验、测序和分析等环节的成本,大大缩短了周期;本申请的一种实现方式中,具体采用的是IlluminaBeadChip:Illumina公司生产的GSA芯片,该芯片能够检测700078个突变,能够很好的满足本申请的检测需求;当然,不排除还可以采用其它常规或不常规使用的基因检测芯片。并且,本申请的检测方法,采用对照样本进一步分析和判断亲缘关系,大大提升了检测的准确度。
优选的,本申请检测方法的统计分析步骤中,判断各位点是否发生杂合突变,具体包括,计算所述母本游离DNA中各位点的theta值和R值的均值和标准差,theta值小于3倍标准差的位点判断为该位点有发生杂合突变。
优选的,本申请检测方法的统计分析步骤和亲缘关系判断步骤中,杂合突变的基因型位点的比值,具体采用以下方法计算获得,将判断发生杂合突变的位点数目标记为m,将统计的总的位点数目标记为N,则(m/N)×100%,即为杂合突变的基因型位点的比值。
优选的,本申请检测方法的基因芯片检测步骤中,基因检测芯片为GSA芯片或其他检测芯片。可以理解,GSA芯片是本申请一种实现方式中具体采用的基因检测芯片,本申请的关键之一是可以直接采用现有的基因检测芯片,不需要进行芯片定制,从而降低检测成本和周期;因此,不排除还可以采用GSA芯片以外的其它基因检测芯片。
优选的,本申请的亲缘关系检测方法中,母本游离DNA为提取自10个孕周以上的孕妇的游离DNA。优选的,为提取自10个孕周以上的孕妇的血浆游离DNA。
需要说明的是,孕妇怀孕后,母体外周血浆中存在游离的胎儿DNA,随着孕周增加稳定存在,且胎儿游离DNA的含量随之增加;研究显示,母体外周血浆中胎儿游离DNA含量大概占全部游离DNA的3-13%;后期游离DNA随孕妇分娩快速消失;因此,本申请优选采用10个孕周以上的母本游离DNA。
可以理解,本申请用于亲缘关系检测的方法,其全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现本申请的检测方法。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现本申请的检测方法。当本申请的检测方法中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现本申请用于亲缘关系检测的方法的全部或部分功能。
因此,本申请的另一面公开了一种用于亲缘关系检测的装置,包括基因芯片检测模块、分析位点筛选模块、位点过滤模块、统计分析模块和亲缘关系判断模块;基因芯片检测模块,包括用于采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息;分析位点筛选模块,包括用于选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;位点过滤模块,包括用于从分析位点筛选模块获取的位点中,过滤去除性染色体、线粒体上的位点,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点;统计分析模块,包括用于对经过位点过滤模块剩余的各位点分别进行基因型分型数值theta值计算,统计分析母本游离DNA中各位点的theta值,判断各位点是否发生杂合突变,计算杂合突变的基因型位点的比值,标记为ratio1;亲缘关系判断模块,包括用于采用没有亲缘关系的样本作对照样本,分析母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判定母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。
需要说明的是,本申请的装置,实际上就是采用各模块实现本申请亲缘关系检测方法中的各步骤,因此,本申请装置中各模块的优选技术方案,可以参考本申请的亲缘关系检测方法,在此不作具体限定。
本申请的再一面公开了一种用于亲缘关系检测的装置,该装置包括存储器和处理器;存储器,用于存储程序;处理器,用于通过执行存储器存储的程序以实现本申请的用于亲缘关系检测的方法。
本申请的有益效果在于:
本申请用于亲缘关系检测的方法和装置,能够实现无创亲缘关系检测,本申请采用现有的基因检测芯片进行检测,不需要订制芯片,降低了检测成本,缩短了检测周期;并且,本申请采用对照样本进一步分析和判断亲缘关系,提升了检测的准确性;本申请的亲缘关系检测方法和装置为亲缘关系检测提供了一种新的方案和途径。
附图说明
图1是本申请实施例中芯片原始数据中一个SNP位点的AB两种等位碱基的信号强弱图;
图2是本申请实施例中芯片原始数据中一个SNP位点AB两种等位碱基信号的极坐标图;
图3是本申请实施例中芯片原始数据中一个SNP位点基因型聚类分型图;
图4是本申请实施例中胎儿杂合母亲纯合位点theta值分布图;
图5是本申请实施例中胎儿游离DNA与100个非亲缘样本间杂合占比分布图。
具体实施方式
现有比较常规和传统的亲缘关系检测方法是羊水穿刺检测,但是该方法存在较大的风险。而定制芯片虽然可以实现无创检测,但是,芯片定制成本高、操作复杂、周期长,难以满足临床使用需求。
因此,本申请特别研发了一种基于现有的基因检测芯片的亲缘关系检测方法,包括基因芯片检测步骤、分析位点筛选步骤、位点过滤步骤、统计分析步骤和亲缘关系判断步骤;基因芯片检测步骤,包括采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息;分析位点筛选步骤,包括选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;位点过滤步骤,包括从分析位点筛选步骤获取的位点中,过滤去除性染色体、线粒体上的位点,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点;统计分析步骤,包括对经过位点过滤步骤剩余的各位点分别进行基因型分型数值theta值计算,统计分析母本游离DNA中各位点的theta值,判断各位点是否发生杂合突变,计算杂合突变的基因型位点的比值,标记为ratio1;亲缘关系判断步骤,包括采用没有亲缘关系的样本作对照样本,分析母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判断母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。
本申请的检测方法不需要芯片定制,具有取样方便、成本低、周期短、操作简便、结果准确等优点,并且,在本申请的一种实现方式中,对照样本采用聚类分析样本,可以进一步提高检测的精度。本申请的检测方法,(1)提高数据利用率,降低测序成本:传统的无创亲子鉴定主要通过订制SNP捕获芯片,高深度测序,一般1000×以上,并call变异来实现;操作复杂且步骤繁多,数据利用率低。(2)大大缩短检测周期:传统的芯片捕获测序,芯片需要特殊订制和评估,实验步骤至少包括DNA提取、打断、建库、芯片捕获,实验周期长,数据波动较大,比对和变异检测以及后续的统计分析需要占用大量的计算资源。
基于本申请的亲缘关系检测方法,本申请进一步研发并提出了一种用于亲缘关系检测方法的装置,包括基因芯片检测模块、分析位点筛选模块、位点过滤模块、统计分析模块和亲缘关系判断模块。本申请的装置中,各模块分别用于对应实现本申请的亲缘关系检测方法中的各步骤,使得本申请的亲缘关系检测方法能够实现自动化的分析和检测。
假设血浆中胎儿游离的DNA所占的比例为r(一般10%左右),本申请的一种实现方式中,对5240个样本聚类分析,并给出每个位点theta值和R值的均值和标准差。假设某一位点,母亲的基因型为BB(或AA)那么B信号强度与A信号强度形成的theta值,理论上应该比聚类分析时的5240个样本theta均值小r/2,结合不同位点统计的标准差与r/2之间的数量关系,本申请选取theta值小于3倍标准差的位点认为该点发生了杂合突变,即支持样本间的亲缘关系,最终统计的位点数目为m,最终计算ratio=(m/N)×100%,同时本申请选取100例已知没有亲缘关系的样本作对照,最终发现ratio值之间存在显著性差异(P<0.0001)。
本申请中涉及的一些名称解释如下:
(1)基因型:指生物的遗传型,即控制性状的基因组合类型,人是二倍体,位点基因型一般用碱基对表示,如AA、BB表示纯合,AB表示杂合。
(2)IlluminaBeadChip:Illumina公司生产的芯片,一般包括几十万个突变,其中大部分是SNP,还有少部分为indel以及片段的重复和缺失,常用的有GSA芯片(700078个突变),ASA芯片(659184个突变),本申请主要采用GSA芯片示例。
(3)Theta值:A信号强度与B信号强度的点坐标与X轴所形成的角度,如图1所示。
(4)R值:A信号强度与B信号强度之和。
(5)聚类分析:指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
(6)基因分型:本申请是指针对theta值和R值,利用5240个数据库样本的数据进行聚类分析,算出该样本在该位点所属的基因型(AA、AB或BB)。
下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
本例采用Illumina公司生产的GSA芯片进行亲缘关系检测,具体检测的方法包括:
(1)基因芯片检测步骤
采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息。
其中,母本游离DNA是孕妇12孕周的血浆游离DNA,其中包含有稳定的胎儿游离DNA。
基因芯片检测的部分原始数据,如图1至图3所示。图1为一个SNP位点的AB两种等位碱基的信号强弱图,其中横坐标表示A信号强度,纵坐标表示B信号强度,可以根据信号强度的分布初步判定某个样本,即图中一个黑点,所对应的基因型,如从左到右分别是BB,AB,AA基因型。
根据图1的结果,可以转化获得原始数据中一个SNP位点AB两种等位碱基信号的极坐标图,如图2所示。图2中,横坐标表示theta角,即B信号强度与A信号强度形成的正切夹角,纵坐标表示R,即B信号强度与A信号强度作为直角边形成直角三角形的斜边长度。
图3为芯片原始数据中一个SNP位点基因型聚类分型图。图3的横纵坐标与图1相同,主要增加了上千例样本聚类分析后,基因分型的结果,并根据离聚类中心的距离给出分型结果可信度的评分。在亲子鉴定的流程中,需要根据父母分型的结果,挑选出父母是不同纯合基因型的位点,供后面亲子鉴定统计分析。
(2)分析位点筛选步骤
本例选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;例如父本基因型为AA,母本为BB或者父本为BB,母本为AA的位点,那么胎儿的基因型一定为AB。
(3)位点过滤步骤
过滤掉性染色体、线粒体以及父母或游离DNA未检测出基因型的位点。即保留非性染色体、非线粒体,且父本、母本或母本游离DNA都有检测到的位点,用于后续分析。
(4)统计分析步骤
假设血浆中胎儿游离的DNA所占的比例为r,一般10%左右,5240个样本聚类分析会给出每个位点theta值和R值的均值和标准差。假设某一位点,母亲的基因型为BB(或AA)那么B信号强度与A信号强度形成的theta值,理论上应该比聚类分析时的5240个样本theta均值小r/2,结合不同位点统计的标准差与r/2之间的数量关系,本例选取theta值小于3倍标准差的位点认为该点发生了杂合突变,即支持样本间的亲缘关系,最终统计的位点数目为m,最终计算ratio=(m/N)×100%。计算杂合突变的基因型位点的比值,标记为ratio1。
如图4所示,图4为胎儿杂合母亲纯合位点theta值分布图,其横坐标表示theta值,纵坐标表示theta值分布。因为母亲为纯合基因型,孩子为杂合基因型,假设母亲血液中游离的胎儿DNA占比为r,那么当对外周血检测此位点的基因型时,theta值会左偏r/2,即图4所示;这样位点在统计分析的时候,认为满足亲缘关系,反之则不是。通过对筛选出来的父母为不同纯合基因型,孩子为杂合基因型位点统计分析,可以判定有亲缘关系的父母胎儿和无亲缘关系的父母胎儿之间存在显著差异,从而结合参照集判定样本之间是否存在亲缘关系。
(4)亲缘关系判断步骤
包括采用没有亲缘关系的样本作对照样本,分析母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判定母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。本例具体选取100例已知没有亲缘关系的样本作对照,最终发现ratio值之间存在显著性差异,即P<0.0001。
本例的母本游离DNA检出的胎儿游离DNA样本与100个非亲缘样本间杂合占比分布图,如图5所示。图5中,横坐标为样本编号,纵坐标为符合亲缘关系的杂合突变所占的比例。图5的结果显示,非亲缘样本,杂合比例在40%左右,而胎儿样本杂合比例在99%以上,说明非亲缘样本和亲缘样本间存在明显差异。
本例充分利用现有的芯片基因型数据;首先,根据父母基因型,挑选孩子是杂合基因型的位点;然后,通过对每个位点基因型分型数值theta,即等位碱基的强弱信号所形成的角度,统计分析,计算样本杂合基因型的比值;最后与对照样本进行比较,看是否存在显著性差异,以此判别样本间是否存在亲缘关系。本例的检测方法大大降低了无创亲子鉴定的成本,缩短了检测周期。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。
Claims (10)
1.一种用于亲缘关系检测的方法,其特征在于:包括基因芯片检测步骤、分析位点筛选步骤、位点过滤步骤、统计分析步骤和亲缘关系判断步骤;
所述基因芯片检测步骤,包括采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息;
所述分析位点筛选步骤,包括选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;
所述位点过滤步骤,包括从所述分析位点筛选步骤获取的位点中,过滤去除性染色体、线粒体上的位点,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点;
所述统计分析步骤,包括对经过所述位点过滤步骤剩余的各位点分别进行基因型分型数值theta值计算,统计分析所述母本游离DNA中各位点的theta值,判断各位点是否发生杂合突变,计算杂合突变的基因型位点占过滤位点的比值,标记为ratio1;
所述亲缘关系判断步骤,包括采用没有亲缘关系的样本作对照样本,分析所述母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判定所述母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。
2.根据权利要求1所述的方法,其特征在于:所述统计分析步骤中,判断各位点是否发生杂合突变,具体包括,计算所述母本游离DNA中各位点的theta值和R值的均值和标准差,theta值小于3倍标准差的位点判断为该位点有发生杂合突变。
3.根据权利要求1所述的方法,其特征在于:所述统计分析步骤和所述亲缘关系判断步骤中,杂合突变的基因型位点的比值,具体采用以下方法计算获得,将判断发生杂合突变的位点数目标记为m,将统计的总位点数目标记为N,则(m/N)×100%,即为杂合突变的基因型位点的比值。
4.根据权利要求1-3任一项所述的方法,其特征在于:所述基因芯片检测步骤中,所述基因检测芯片为GSA芯片。
5.根据权利要求1-3任一项所述的方法,其特征在于:所述母本游离DNA为提取自10个孕周以上的孕妇的游离DNA;优选的,为提取自10个孕周以上的孕妇的血浆游离DNA。
6.一种用于亲缘关系检测的装置,其特征在于:包括基因芯片检测模块、分析位点筛选模块、位点过滤模块、统计分析模块和亲缘关系判断模块;
所述基因芯片检测模块,包括用于采用基因检测芯片对获取自父本的核酸、母本的核酸,以及母本游离DNA进行基因检测,获取三个检测对象的基因型位点信息;
所述分析位点筛选模块,包括用于选取父本和母本均为纯合子,且父本和母本的基因型不同的位点用于后续分析;
所述位点过滤模块,包括用于从所述分析位点筛选模块获取的位点中,过滤去除性染色体、线粒体上的位点,并过滤去除父本、母本或母本游离DNA没有检出的基因型位点;
所述统计分析模块,包括用于对经过所述位点过滤模块剩余的各位点分别进行基因型分型数值theta值计算,统计分析所述母本游离DNA中各位点的theta值,判断各位点是否发生杂合突变,计算杂合突变的基因型位点的比值,标记为ratio1;
所述亲缘关系判断模块,包括用于采用没有亲缘关系的样本作对照样本,分析所述母本游离DNA中各位点相对于对照样本的杂合突变的基因型位点的比值,标记为ratio2;如果ratio1与ratio2存在显著性差异,则判断所述母本游离DNA对应的胎儿与父本和母本之间存在亲缘关系。
7.根据权利要求6所述的装置,其特征在于:所述统计分析模块中,判断各位点是否发生杂合突变,具体包括,计算所述母本游离DNA中各位点的theta值和R值的均值和标准差,theta值小于3倍标准差的位点判断为该位点有发生杂合突变。
8.根据权利要求6所述的装置,其特征在于:所述统计分析模块和所述亲缘关系判断模块中,杂合突变的基因型位点的比值,具体采用以下方法计算获得,将判断发生杂合突变的位点数目标记为m,将统计的总的位点数目标记为N,则(m/N)×100%,即为杂合突变的基因型位点的比值。
9.根据权利要求6-8任一项所述的装置,其特征在于:所述基因芯片检测模块中,所述基因检测芯片为GSA芯片。
10.一种用于亲缘关系检测的装置,其特征在于:所述装置包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于通过执行所述存储器存储的程序以实现权利要求1-5任一项所述的用于亲缘关系检测的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910849700.0A CN112466397A (zh) | 2019-09-09 | 2019-09-09 | 一种用于亲缘关系检测的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910849700.0A CN112466397A (zh) | 2019-09-09 | 2019-09-09 | 一种用于亲缘关系检测的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112466397A true CN112466397A (zh) | 2021-03-09 |
Family
ID=74807492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910849700.0A Pending CN112466397A (zh) | 2019-09-09 | 2019-09-09 | 一种用于亲缘关系检测的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112466397A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257363A (zh) * | 2021-05-31 | 2021-08-13 | 福建傲农生物科技集团股份有限公司 | 一种系谱的校正方法及装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040157220A1 (en) * | 2003-02-10 | 2004-08-12 | Purnima Kurnool | Methods and apparatus for sample tracking |
CN102770558A (zh) * | 2009-11-05 | 2012-11-07 | 香港中文大学 | 由母本生物样品进行胎儿基因组的分析 |
CN103608466A (zh) * | 2010-12-22 | 2014-02-26 | 纳特拉公司 | 非侵入性产前亲子鉴定方法 |
CN104946773A (zh) * | 2015-07-06 | 2015-09-30 | 厦门万基生物科技有限公司 | 一种利用snp进行产前亲权关系判定的方法 |
CN107217095A (zh) * | 2017-06-15 | 2017-09-29 | 广东腾飞基因科技股份有限公司 | 人类亲权鉴定用多重pcr引物组及检测方法 |
CN107423534A (zh) * | 2016-05-24 | 2017-12-01 | 郝柯 | 基因组拷贝数变异的检测方法和系统 |
CN107609343A (zh) * | 2017-08-14 | 2018-01-19 | 广州市圣鑫生物科技有限公司 | 亲缘关系鉴定方法、系统、计算机设备及可读存储介质 |
CN108220403A (zh) * | 2017-12-26 | 2018-06-29 | 北京科迅生物技术有限公司 | 特定突变位点的检测方法、检测装置、存储介质及处理器 |
CN108342455A (zh) * | 2017-06-25 | 2018-07-31 | 北京天健惠康生物科技有限公司 | 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒 |
CN109207600A (zh) * | 2017-07-06 | 2019-01-15 | 深圳华大法医科技有限公司 | 鉴定生物样本间亲缘关系的方法和系统 |
-
2019
- 2019-09-09 CN CN201910849700.0A patent/CN112466397A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040157220A1 (en) * | 2003-02-10 | 2004-08-12 | Purnima Kurnool | Methods and apparatus for sample tracking |
CN102770558A (zh) * | 2009-11-05 | 2012-11-07 | 香港中文大学 | 由母本生物样品进行胎儿基因组的分析 |
CN105779280A (zh) * | 2009-11-05 | 2016-07-20 | 香港中文大学 | 由母本生物样品鉴定新生胎儿突变 |
CN103608466A (zh) * | 2010-12-22 | 2014-02-26 | 纳特拉公司 | 非侵入性产前亲子鉴定方法 |
CN104946773A (zh) * | 2015-07-06 | 2015-09-30 | 厦门万基生物科技有限公司 | 一种利用snp进行产前亲权关系判定的方法 |
CN107423534A (zh) * | 2016-05-24 | 2017-12-01 | 郝柯 | 基因组拷贝数变异的检测方法和系统 |
CN107217095A (zh) * | 2017-06-15 | 2017-09-29 | 广东腾飞基因科技股份有限公司 | 人类亲权鉴定用多重pcr引物组及检测方法 |
CN108342455A (zh) * | 2017-06-25 | 2018-07-31 | 北京天健惠康生物科技有限公司 | 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒 |
CN109207600A (zh) * | 2017-07-06 | 2019-01-15 | 深圳华大法医科技有限公司 | 鉴定生物样本间亲缘关系的方法和系统 |
CN107609343A (zh) * | 2017-08-14 | 2018-01-19 | 广州市圣鑫生物科技有限公司 | 亲缘关系鉴定方法、系统、计算机设备及可读存储介质 |
CN108220403A (zh) * | 2017-12-26 | 2018-06-29 | 北京科迅生物技术有限公司 | 特定突变位点的检测方法、检测装置、存储介质及处理器 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257363A (zh) * | 2021-05-31 | 2021-08-13 | 福建傲农生物科技集团股份有限公司 | 一种系谱的校正方法及装置 |
CN113257363B (zh) * | 2021-05-31 | 2023-12-08 | 福建傲农生物科技集团股份有限公司 | 一种系谱的校正方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Evaluation of breast cancer susceptibility using improved genetic algorithms to generate genotype SNP barcodes | |
KR101542529B1 (ko) | 대립유전자의 바이오마커 발굴방법 | |
KR101460520B1 (ko) | 차세대 시퀀싱 데이터의 질병변이마커 검출 방법 | |
CA3009992A1 (en) | Diagnosing fetal chromosomal aneuploidy using genomic sequencing | |
Huang et al. | Evaluation of variant detection software for pooled next-generation sequence data | |
CN115052994A (zh) | 确定胚胎细胞染色体中预定位点碱基类型的方法及其应用 | |
CN114530198A (zh) | 一种用于检测样本污染水平的snp位点的筛选方法及样本污染水平的检测方法 | |
CN114999570A (zh) | 一种不依赖于先证者的单体型构建方法 | |
CN113593644A (zh) | 基于家系的低深度测序检测染色体单亲二体的方法 | |
KR20180060759A (ko) | 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 | |
Demidov et al. | ClinCNV: novel method for allele-specific somatic copy-number alterations detection | |
KR20150024232A (ko) | 질병에 대한 약물 내성 유전체로부터 내성 원인 마커의 발굴 방법 | |
CN116030892A (zh) | 一种鉴定染色体相互易位断点位置的系统和方法 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN117253539B (zh) | 基于胚系突变检测高通量测序中样本污染的方法和系统 | |
CN113308548B (zh) | 一种检测胎儿基因单倍体型的方法、装置和存储介质 | |
CN112466397A (zh) | 一种用于亲缘关系检测的方法和装置 | |
WO2021142794A1 (zh) | 确定胎儿核酸浓度的方法以及胎儿基因分型方法 | |
CN108694304B (zh) | 一种身份关系鉴定方法、装置、设备及存储介质 | |
CN110373458A (zh) | 一种地中海贫血检测的试剂盒及分析系统 | |
WO2016112539A1 (zh) | 确定胎儿核酸含量的方法和装置 | |
CN114921536A (zh) | 一种检测单亲二倍体和杂合性缺失的方法、装置、存储介质和设备 | |
CN114566213A (zh) | 家系高通量测序数据的单亲二倍体分析方法及其系统 | |
CN114171116A (zh) | 孕妇游离及本身dna评估胎儿dna浓度的方法及应用 | |
CN114517223A (zh) | 一种用于筛选snp位点的方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210309 |
|
RJ01 | Rejection of invention patent application after publication |