发明内容
本发明旨在提供一种新生儿遗传病患病风险评估的装置,以提高新生儿遗传病患病风险评估的准确性与易操作性。
为了实现上述目的,根据本发明的一个方面,提供了一种新生儿遗传病患病风险评估的装置。该装置包括:样本获取模块,用于获取新生儿出生后预定时间段内的DNA样本;测序模块,用于对样本获取模块获取的DNA样本进行测序得到DNA数据;变异数据检测模块,用于根据测序模块得到的DNA数据进行变异检测得到变异数据;注释模块,用于根据预定的注释人群频率数据库对变异数据检测模块中获得的变异数据进行注释,并对根据预定条件对注释进行过滤,得到过滤后的DNA注释数据;致病位点筛选模块,用于从注释模块中获得的DNA注释数据中筛选出至少一类致病位点;以及风险评估模块,用于根据预定的原则对致病位点筛选模块中筛选出的至少一类致病位点进行风险评估。
进一步地,DNA样本取自新生儿出生24小时后的足跟血液或唾液的DNA。
进一步地,根据测序模块得到的DNA数据进行变异检测得到变异数据包括:根据预定的人类参考基因组对DNA数据进行处理,其中,处理至少包括:比对、合并和去重;对处理后得到的DNA数据进行变异检测,并过滤质量低于阈值的位点得到变异数据。
进一步地,预定条件包括:人群频率小于5%且位于外显子/剪接位点区的“false”位点,“致病”或“可能致病”的“true”位点,其他致病性且人群频率小于5%的“true”位点。
进一步地,从DNA注释数据中筛选出至少一类致病位点包括以下至少之一:1)“1”类致病位点:ACMG标准解读后判定为“致病”或“可能致病”的位点;Clinvar数据库中判定致病为“致病”或“可能致病”带星的位点;2)“2”类致病位点:IGV验证为真位点的前提下,移码、终止变异缺失、终止变异延伸、起始密码子位点;3)“3”类致病位点:非移码缺失或插入、4个或4个以上蛋白预测软件同时预测为致病且千频小于1%、2个或2个以上剪接预测软件同时预测为致病的位点。
进一步地,预定的原则包括以下至少之一:筛查结果分为“风险升高”和“低风险”;“风险升高”的判定规则为:I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式的“1”类致病位点,为风险升高位点;II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式的“1”类致病位点,为风险升高位点;III)同一样本中同一个基因上携带2个变异位点中,出现致病性的组合为“1”+“1”、“1”+“2”、“1”+“3”三种情况时,为风险升高位点;“低风险”的判定规则为:I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式的“2”类致病位点或者“3”类致病位点,为低风险位点;II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式的“2”类致病位点或者“3”类致病位点,为低风险位点;III)同一样本中同一个基因上携带2个变异的位点中,出现致病性的组合为“2”+“2”、“3”+“3”、“2”+“3”三种情况时,为低风险位点。
应用本发明的技术方案,可一次性对较多个基因涉及的不同种疾病进行分析,评估的准确性与易操作性得到提高。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
针对目前现有技术中存在缺点,本发明基于基因捕获的二代测序技术,进行深度测序,筛查发现新的致病基因和新突变类型。
根据本发明一种典型的实施方式,提供一种新生儿遗传病患病风险评估的装置。该装置包括:样本获取模块,用于获取新生儿出生后预定时间段内的DNA样本;测序模块,用于对样本获取模块获取的DNA样本进行测序得到DNA数据;变异数据检测模块,用于根据测序模块得到的DNA数据进行变异检测得到变异数据;注释模块,用于根据预定的注释人群频率数据库对变异数据检测模块中获得的变异数据进行注释,并对根据预定条件对注释进行过滤,得到过滤后的DNA注释数据;致病位点筛选模块,用于从注释模块中获得的DNA注释数据中筛选出至少一类致病位点;以及风险评估模块,用于根据预定的原则对致病位点筛选模块中筛选出的至少一类致病位点进行风险评估。
应用本发明的技术方案,可一次性对较多个基因涉及的不同种疾病进行分析,评估的准确性与易操作性得到提高。
其中,DNA样本可以是取自新生儿出生24小时后的足跟血液或唾液DNA,当然也可以是其他方式或获得的DNA,这些样本获取方便,易于操作的进行。
根据本发明一种典型的实施方式,根据测序模块得到的DNA数据进行变异检测得到变异数据包括:根据预定的人类参考基因组对DNA数据进行处理,其中,处理至少包括:比对、合并和去重;对处理后得到的DNA数据进行变异检测,并过滤质量低于阈值的位点得到变异数据。该变异检测的步骤能够提高风险评估的准确性。
在本发明一实施方式中,预定条件包括:人群频率小于5%且位于exon/splicing(外显子/剪接位点)区的“false”位点,“致病”或“可能致病”的“true”位点,其他致病性且人群频率小于5%的“true”位点,以此来限定罕见性遗传病的检测位点。
根据本发明一种典型的实施方式,从DNA注释数据中筛选出至少一类致病位点包括以下至少之一:
1)“1”类致病位点:ACMG标准解读后判定为“致病”或“可能致病”的位点;Clinvar数据库中判定致病为“致病”或“可能致病”带星的位点;
2)“2”类致病位点:IGV验证为真位点的前提下,移码、stoploss(终止变异缺失)、stopgain(终止变异延伸)、起始密码子位点;
3)“3”类致病位点:非移码Indel(缺失或插入)、4个或4个以上蛋白预测软件同时预测为致病且千频小于1%、2个或2个以上剪接预测软件同时预测为致病的位点。
根据本发明一种典型的实施方式,预定的原则包括以下至少之一:筛查结果分为“风险升高”和“低风险”;
“风险升高”的判定规则为:
I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式的“1”类致病位点,为风险升高位点;
II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式的“1”类致病位点,为风险升高位点;
III)同一样本中同一个基因上携带2个变异的位点中,出现致病性的组合为“1”+“1”、“1”+“2”、“1”+“3”三种情况时,为风险升高位点;
“低风险”的判定规则为:
I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式的“2”类致病位点或者“3”类致病位点,为低风险位点;
II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式的“2”类致病位点或者“3”类致病位点,为低风险位点;
III)同一样本中同一个基因上携带2个变异的位点中,出现致病性的组合为“2”+“2”、“3”+“3”、“2”+“3”三种情况时,为低风险位点。
在本发明一实施例中,筛查技术主要依据:1)该疾病一旦被发现诊断,有治疗或防范后遗症的方法;2)在新生儿时期的症状并不明显;3)若不及时治疗会急速恶化,导致严重的后遗症;4)该疾病的发生率不低,成本效益上有全面筛查的必要。依据以上几个条件,可以筛选到选取相关基因涉及的疾病,定制相关探针,定制区域为该基因的全外显子及上下游10bp的区域。获取目标区域核酸进行高通量测序,通过本申请中的流程和方法,确定检测范围内基因是否出现基因突变,并且进行致病性等级分级。
在本发明一实施例中,新生儿罕见遗传病筛查项目基于高通量测序技术,依托Illumina HiSeq平台,策略是用目标区域测序,180~280bp小片段文库,Illumina HiSeq平台,PE150测序,每个样本的平均有效测序深度100X。基本内容主要为:1)完成筛查疾病种类和基因列表,位点信息确认,文献数据库整合搭建,整体数据库搭建,前期积累数据测试;2)完成足跟血血片微量建库测试实验;3)完成探针设计和定制,并做模拟数据测试;4)完成目标区域测序;5)生物信息学分析;6)位点致病性评估;7)收集阳性样本并提供相应临床材料;8)完成信息分析流程的开发并优化,完成临床数据库整合。
其中,目标区域建库测序技术可以按照如下流程进行(流程可参见图1):
1)建库
采用液相芯片捕获系统,对人特定目标区域DNA进行高效富集,然后在IlluminaHiSeq平台上进行高通量、高深度测序。建库和捕获实验可以采用商用试剂盒,严格使用说明书推荐的试剂和耗材,并参照最新优化实验流程进行操作。
实验基本流程:基因组DNA经Covaris破碎仪随机打断成长度为180~280bp的片段,经末端修复和加A尾后,在片段两端分别连接上接头制备DNA文库。带有特异index的文库与生物素标记的探针进行液相杂交,再使用带链霉素的磁珠捕获目标基因的目的片段,经PCR线性扩增后进行文库质检,检测合格后进行上机测序。
2)文库质检
可以采用琼脂糖凝胶电泳文库检测、文库浓度检测和Agilent 2100Bioanalyzer文库检测。
3)测序
经文库质检合格,即可进行Illumina测序,Hiseq PE150测序。
生物信息学分析流程可以按照如下流程进行(流程可参见图2):
1)测序数据质控
测序生产流程过滤后文件,获得的原始数据raw Data(以FASTQ格式存储),通过质量控制过滤掉低质量数据,得到clean Data。
2)变异检测
以hg19人类参考基因组进行比对、合并和去重。采用GATK进行变异检测;GATK过滤工具过滤低质量的SNP/indel位点。
3)注释和过滤
Annova注释人群频率数据库包括:GnomAD、1000g2015、1000g2015_ExAC;计算机预测软件:SIFT、Polyphen2_HVAR/HDIV、m-cap以及剪接位点预测软件;依据HGMD数据库注释信息进行过滤,过滤标准为:人群频率小于5%且位于exon/splicing区的“false”位点,“致病”或“可能致病”的“true”位点,其他致病性且人群频率小于5%的“true”位点。
致病性评估分析流程可以按照如下流程进行(流程可参见图3和4):
1)变异位点致病性分析
依据《美国医学遗传学会与基因组学学会(ACMG)》指南(简称为ACMG指南)对变异位点进行致病性分析。
2)等级划分
将通过ACMG指南判定的位点分为3类致病位点:
(1)“1”类致病位点:ACMG标准解读后判定为“致病(P)”或“可能致病(LP)”的位点;Clinvar数据库中判定致病为“致病(P)”或“可能致病(LP)”带星的位点;
(2)“2”类致病位点:IGV验证为真位点的前提下,Indel(移码)、stoploss、stopgain、起始密码子位点;
(3)“3”类致病位点:Indel(非移码)、蛋白预测(四个软件)同时为致病且千频小于1%、剪接预测(2个软件)同时预测为致病的位点;
3)筛查结果分为“风险升高”和“低风险”2类
(1)“风险升高”判定规则
(I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式(hom-AD/AR/XLD/Unknow)的“1”类致病位点,为风险升高位点;
(II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式(hom-AD/XLD/Unknow)的“1”类致病位点,为风险升高位点;
(III)同一样本中同一个基因上携带2个变异位点,出现致病性的组合为三种情况时为风险升高位点:“1”+“1”、“1”+“2”、“1”+“3”三种情况;
(2)“低风险”判定规则
(I)纯合位点中,出现显性遗传、隐性遗传、X-连锁显性遗传、不明确遗传方式(hom-AD/AR/XLD/Unknow)的“2”类致病位点或者“3”类致病位点,为低风险位点;
(II)杂合位点中,出现显性遗传、X-连锁显性遗传、不明确遗传方式(hom-AD/XLD/Unknow)的“2”类致病位点或者“3”类致病位点,为低风险位点;
(III)同一样本中同一个基因上携带2个变异位点,出现致病性的组合为三种情况时为低风险位点:“2”+“2”、“3”+“3”、“2”+“3”三种情况。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。