CN109243530B - 遗传变异判定方法、系统以及存储介质 - Google Patents
遗传变异判定方法、系统以及存储介质 Download PDFInfo
- Publication number
- CN109243530B CN109243530B CN201811383990.6A CN201811383990A CN109243530B CN 109243530 B CN109243530 B CN 109243530B CN 201811383990 A CN201811383990 A CN 201811383990A CN 109243530 B CN109243530 B CN 109243530B
- Authority
- CN
- China
- Prior art keywords
- variation
- gene
- mutation
- judgment
- automatic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种遗传变异判定方法、系统以及存储介质,其中方法包括:根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件;使用注释工具并基于自动判定规则文件对变异检测文件进行变异基因注释处理,使用评分工具并基于自动判定规则文件对变异检测文件中出现的基因组变异进行分类处理,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中;本发明的遗传变异判定方法、系统以及存储介质,能够更加准确、高效的进行基因分析注释,帮助解读人员更高效地应用评估标准,能够对海量变异位点信息实现自动化分析,提高的遗传变异判定的准确性和判定速度。
Description
技术领域
本发明涉及基因检测技术领域,尤其涉及一种遗传变异判定方法、系统以及存储介质。
背景技术
基因测序是一种新型基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性,个体的行为特征及行为合理,如癌症或白血病,运动天赋,酒量等。随着遗传病患者样本数和检测基因数量的快速增加,临床分子实验室检测得到的变异越来越多,同时伴随大量公共疾病数据库数据的不断积累,人工解读数据工作量越来越繁重,解读人员使用的解读标准不同以及解读人员对ACMG指南28条判定规则理解不同,造成变异变异解读的一致率不高。
2015年5月ACMG联合美国分子病理学学会(Association for MolecularPathology,AMP)发布的疾病变异位点的分类及解读标准,变异位点主要分成五大类:致病、疑似致病、临床意义不明确、疑似良性、良性。由于ACMG指南本身并不能将每一项评判标准的细节和参数都明确指定,因此不同的数据解读人员在具体操作中可能存在一定的差异,导致遗传病诊断结论的一致率不高。为解决以上问题,我们对ACMG指南28条判定规则细化研究,对多种应用生物医学数据库进行整理和数据清理,搭建了基于Database.bio应用系统适用于遵循孟德尔遗传方式疾病的变异位点半自动化解读系统。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种遗传变异判定方法、系统以及存储介质。
根据本发明的一个方面,提供一种遗传变异判定方法,包括:创建用于对待分析的基因样本进行致病性判定的自动判定任务,通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件;根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件;使用注释工具并基于所述自动判定规则文件对所述变异检测文件进行变异基因注释处理,生成基因变异注释结果;使用评分工具并基于所述自动判定规则文件对所述变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果;响应于接收到的用户对所述自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
可选地,所述根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件包括:获得所述多种生物医学数据库的数据信息,基于预设的数据过滤规则对所述数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表;其中,所述多种生物医学数据库包括:人群频率数据库、ClinVar、GWASCatalog、dbNSFP、InterPro domain、dbscSNV;所述自动判定规则文件包括所述变异信息数据表,所述变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格。
可选地,所述使用评分工具并基于所述自动判定规则文件对所述变异检测文件中出现的基因组变异进行分类处理包括:根据所述变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,所述变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行;使用评分工具并基于所述变异评估标准自动化规则对所述变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对所述基因组变异进行分类处理。
可选地,使用评分工具并根据能够自动执行的判决标准对所述基因组变异进行分类,得到的分类结果为假或真;将根据不能自动执行的判决标准对所述基因组变异进行分类的结果都设置为假;基于用户的修改指令,对所述基因组变异进行分类后的结果进行相应的修改。
可选地,对所述基因组变异进行分类处理得到的变异种类包括:致病的、可能致病的、意义不明确的、可能良性的和良性的;将所述自动判定规则文件、基因变异注释结果、基因变异分类结果保存在数据库或缓存中。
根据本发明的另一方面,提供一种遗传变异判定系统,包括:任务设置模块,用于创建用于对待分析的基因样本进行致病性判定的自动判定任务;基因检测模块,用于通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件;数据处理模块,用于根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件;变异注释模块,用于使用注释工具并基于所述自动判定规则文件对所述变异检测文件进行变异基因注释处理,生成基因变异注释结果;变异分类模块,用于使用评分工具并基于所述自动判定规则文件对所述变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果;修改处理模块,用于响应于接收到的用户对所述自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
可选地,所述数据处理模块,用于获得所述多种生物医学数据库的数据信息,基于预设的数据过滤规则对所述数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表;其中,所述多种生物医学数据库包括:人群频率数据库、ClinVar、GWAS Catalog、dbNSFP、InterPro domain、dbscSNV;所述自动判定规则文件包括所述变异信息数据表,所述变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格。
可选地,所述变异分类模块,用于根据所述变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,所述变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行;使用评分工具并基于所述变异评估标准自动化规则对所述变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对所述基因组变异进行分类处理。
可选地,所述变异分类模块,用于使用评分工具并根据能够自动执行的判决标准对所述基因组变异进行分类,得到的分类结果为假或真;将根据不能自动执行的判决标准对所述基因组变异进行分类的结果都设置为假;基于用户的修改指令,对所述基因组变异进行分类后的结果进行相应的修改。
可选地,对所述基因组变异进行分类处理得到的变异种类包括:致病的、可能致病的、意义不明确的、可能良性的和良性的;其中,将所述自动判定规则文件、基因变异注释结果、基因变异分类结果保存在数据库或缓存中。
根据本发明的又一方面,提供一种遗传变异判定系统,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的方法。
根据本发明的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该指令被一个或多个处理器执行时实现如上所述的方法的步骤。
本发明的遗传变异判定方法、系统以及存储介质,根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件,使用注释工具并基于自动判定规则文件对变异检测文件进行变异基因注释处理,使用评分工具并基于自动判定规则文件对变异检测文件中出现的基因组变异进行分类处理,基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中;能够更加准确、高效的进行基因分析注释,帮助解读人员更高效地应用评估标准,能够对海量变异位点信息实现自动化分析,提高的遗传变异判定的准确性和判定速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的遗传变异判定方法的一个实施例的流程示意图;
图2为本发明的遗传变异判定方法的一个实施例的数据文件输入的示意图;
图3为本发明的遗传变异判定方法的一个实施例的变异分类的示意图;
图4为本发明的遗传变异判定方法的一个实施例的对于分类结果进行修改的流程示意图;
图5A为变异自动判定结果的示意图,图5B为变异判定结果修改后的示意图;
图6为本发明的遗传变异判定系统的一个实施例的组成示意图;
图7为本发明的遗传变异判定系统的另一个实施例的组成示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
下文中的“第一”、“第二”等仅用于描述上相区别,并没有其它特殊的含义。
图1为本发明的遗传变异判定方法的一个实施例的流程示意图,本发明提出一种中心式双阈值协作遗传变异判定方法,如图1所示:
步骤101,创建用于对待分析的基因样本进行致病性判定的自动判定任务,通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件。基因样本可为符合孟德尔遗传病的NGS检测样本。创建任务并产生VCF文件(基因组变异的变异检测文件)后,需要运行标准化程序,对不同来源的输入文件统一规则,便于后期注释的变异根据基因和位置去匹配多种生物医学数据库对变异的注释结果。
用户可以使用生物信息分析系统创建自动判定任务,生成对待分析的基因样本进行变异分析和变异注释等流程,并自动执行创建的流程。
步骤102,根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件。其中,获取多种生物医学数据库的数据用于进行变异判定处理。
步骤103,使用注释工具并基于自动判定规则文件对变异检测文件进行变异基因注释处理,即对变异检测文件中出现的基因组变异进行注释处理,生成基因变异注释结果。
步骤104,使用评分工具并基于自动判定规则文件对变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果。
使用基因组变异注释工具和流程注释基因组变异,使用评分工具根据ACMG标准对基因组变异进行判定和分类。例如,使用Database.bio注释工具注释出“CHEK2,c.319G>T变异”,基于ACMG标准对变异进行致病性判定,PVS1,PM2,PP3三条判决标准(判读标准)为真,剩下25条判决标准为假,根据ACMG指南的遗传变异分类联合标准确定变异属于pathogenic(i)c等级。
步骤105,响应于接收到的用户对自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
在一个实施例中,对基因组变异进行分类处理得到的变异种类包括:致病的、可能致病的、意义不明确的、可能良性的和良性的。将自动判定规则文件、基因变异注释结果、基因变异分类结果保存在数据库或缓存中。例如,Database.bio注释工具可以输出ann(acronym of annotation)文件,该文件包括变异注释、变异判定证据(判决标准)以及变异分类的结果,ann文件存储在系统的文件存储区。用户查看变异的分类,变异的分类是按ACMG/AMP指南进行分类处理的,变异分为5类:“致病的”、“可能致病的”、“意义不明确的”、“可能良性的”和“良性的”。用户手动调整判定规则,更新基于ACMG变异分类系统中变异的分类。
ACMG/AMP指南建议根据28条判决标准将变异分为5级术语系统,根据ACMG遗传变异分类标准对变异进行分类,18条判决标准能够自动进行评估和判定,用户可根据判定证据细则在界面上手动修改每一条判决标准。如果用户调整判定规则(例如ACMG标准中的判决标准)和最终的变异分类结果,则调整的结果会存储在数据库中。
例如,CHEK2,c.319G>T变异,自动判定规则文件中的28条判决标准中,PVS1,PM2,PP3为真(T),对该变异的判定结果为“致病的(P)”;进行人工核实修改后,PP3为假(F),原判定结果是有误的,用户可以手动选择将PP3对应的F修改为T,对该变异判定结果修改为“疑似致病的(LP)”。变异判定是基于建立的多个数据表,数据表中的数据是需要不断更新的,所以系统的自动判定可能会存在错误,需要人工核实,未实现自动化的ACMG标准中的10条判决标准也需要人工核实。
在一个实施例中,获得多种生物医学数据库的数据信息,基于预设的数据过滤规则对数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表。多种生物医学数据库包括人群频率数据库、ClinVar、GWAS Catalog、dbNSFP、InterProdomain、dbscSNV等;自动判定规则文件包括变异信息数据表,变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格。
例如,多种生物医学数据库包括:人群频率数据库;人群频率数据库包括:千人基因组数据库、ESP6500外显子变异数据库、ExAC外显子数据库等。多种生物医学数据库包括:其它数据库;其他数据库包括:ClinVar、UCSC rmsk、GWAS Catalog、NHGRI临床基因组数据库、dbNSFP、InterPro domain、dbscSNV等。后台会调用各个多种生物医学数据库记录变异的信息,进而对变异进行致病性判定和分类。
以千人基因组(1000G)数据库为例,其数据主要用于ACMG的判决标准的PM2规则(在外显子测序项目(ESP),千人基因组、ExAC的对照样本中不存在(如果是隐性遗传,要求频率极低;另外对于迟发性疾病的热点突变,也是要求频率极低)(通常已知/疑似致病突变的频率低于1%,罕见的人群特有或地域特有高发疾病相关热点致病突变频率高于1%)、BA1规则(变异在外显子测序项目(ESP)、千人基因组、ExAc数据库中等位基因频率>5%)、BS1规则(变异在外显子测序项目(ESP)、千人基因组、ExAc数据库中等位基因频率大于相应疾病的人群发病率)、BS2规则(变异基因相关的疾病完全外显、且发病时间较早,对于常染色体隐性遗传疾病(AR),在健康个体中检出纯合变异;对于常染色体显性遗传疾病(AD),在健康个体中检出杂合变异;对于X连锁遗传疾病(XL),在男性个体中检出半合变异,在女性个体中检出纯合变异);PM2、BA1、BS1、BS2规则是ACMG指南的28条规则的其中4条规则;每一个遗传变异都需要判定是否满足28条规则。
ClinVar、UCSC rmsk、GWAS Catalog、NHGRI(临床基因组数据库)、dbNSFP、InterPro domain、dbscSNV是目前公用的数据库。例如,ClinVar数据库应用到ACMG标准的全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、功能结构域、致病氨基酸、致病错义突变基因、良性错义突变基因等数据表中。多种生物医学数据库的数据信息经过过滤等处理后,生成用于对基因组变异进行注释和分类的变异信息数据表,变异信息数据表被导入数据库中。变异信息数据表中的表格的具体定义如下表1所示:
表1-变异信息数据表中的表格定义
在表1中,“数据处理”的内容是各个数据表格的数据处理部分过程,即各个数据表格的数据是“数据处理”结果,用于支持ACMG标准的28条评估标准的自动化。将自动判定规则文件输入储存系统,如图2所示。
在一个实施例中,通过运行VEP和dbNSFP插件并基于自动判定规则文件对基因变异进行注释,对包括基因、转录本、结果、MetaSVM评分、GERP++评分、InterPro域等内容注释。在对基因变异注释后,基于自动判定规则文件对变异分类。VEP(Variant EffectPredictor)一种基因变异注释软件工具。使用VEP进行注释时,每个基因变异都会获得注释信息,例如基因、转录本、位置、效应等。另外还包含了部分预测,如蛋白质序列变化的SIFT、CADD得分(需要CADD数据库)和PolyPhen得分(需要PolyPhen数据库)。
dbNSFP是专对人基因组中所有潜在的非同义单核苷酸变异(nsSNV)进行功能性预测。dbNSFP是多个数据库的合集。VEP和dbNSFP都可以对变异进行注释。MetaSVM评分、GERP++评分、InterPro域等结果是从计算机软件去预测变异的保守性,侧面评估变异的功能性。通过变异统计列表显示变异分类,如图3所示,图3为变异统计列表的变异分类示例。
根据不同生物医学数据库的数据支持,实现基因变异的自动化判定,可提高评估结果的准确性和判定速度,对相关数据进行相应地处理并存储。在评估判定前对基因变异进行注释,基因变异注释结果决定基因变异的最终判读和分类结果。
在一个实施例中,根据变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行等。使用评分工具并基于变异评估标准自动化规则对变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对基因组变异进行分类处理。变异评估标准自动化部分规则(部分标签)如下表2所示:
表2-变异评估标准自动化规则表
表2中的“标签”为基于ACMG标准的判决标准,即“标签”下的每个内容是2015年ACMG指南28条证据的名称,可参考2015年ACMG指南,判决标准例如为“PVS1”、“PS2”等。“可自动化”的意思是软件能够自动输出变异判定结果,不需要人工去根据ACMG指南的规则去解读每个变异,人工解读变异需要查找大量数据库和文献。
图4为本发明的遗传变异判定方法的一个实施例的对于分类结果进行修改的流程示意图,如图4所示:
步骤401,使用评分工具并根据能够自动执行的判决标准对基因组变异进行分类,得到的分类结果为假或真。
步骤402,将根据不能自动执行的判决标准对基因组变异进行分类的结果都设置为假。
步骤403,基于用户的修改指令,对基因组变异进行分类后的结果进行相应的修改。
致病或可能致病的变异判定规则和良性或可能良性的变异判定规则都基于2015年ACMG指南设定。致病变异分级标准分别为非常强(PVS1)、强(PS1-4)、中等(PM1-6)或支持(PP1-5)证据;良性变异分级标准分别为独的立证据(BA1)、强(BS1-4)或支持(BP1-7),根据变异注释和变异评估标准自动化规则能够自动化判定18条判决标准。
为了获得更准确的结果,用户需要手动修改用户操作页面中的其它10条判决标准。18条判决标准判定后,评分系统对基因变异进行分类。评分系统执行ACMG指南的遗传变异分类联合标准规则,其它10条判决标准暂时不能自动判定,默认是假的,需用户根据规则细则手动判定。用户可以根据分类列表中的所有证据细则手动判定每个变异,默认情况下,列表中18条判决标准的自动判定,用户也可以重新判定,重判定后系统将重新评分并更新变异分类。图5A和5B所示。在用户在界面手动调整判定规则和重新对变异进行分类之后,变异判定调整后的结果和变异重新分类的结果储存在对应的应用程序中。
在一个实施例中,如图6所示,本发明提供一种遗传变异判定系统60,包括:任务设置模块61、基因检测模块62、数据处理模块63、变异注释模块64、变异分类模块65和修改处理模块66。
任务设置模块61创建用于对待分析的基因样本进行致病性判定的自动判定任务。基因检测模块62通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件。数据处理模块63根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件。变异注释模块64使用注释工具并基于自动判定规则文件对变异检测文件进行变异基因注释处理,生成基因变异注释结果。
变异分类模块65使用评分工具并基于自动判定规则文件对变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果。修改处理模块66响应于接收到的用户对自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
在一个实施例中,数据处理模块63获得多种生物医学数据库的数据信息,基于预设的数据过滤规则对数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表;其中,多种生物医学数据库包括:人群频率数据库、ClinVar、GWASCatalog、dbNSFP、InterPro domain、dbscSNV等;自动判定规则文件包括变异信息数据表,变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格。
变异分类模块64根据变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行等。变异分类模块64使用评分工具并基于变异评估标准自动化规则对变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对基因组变异进行分类处理。
变异分类模块65使用评分工具并根据能够自动执行的判决标准对基因组变异进行分类,得到的分类结果为假或真。变异分类模块65将根据不能自动执行的判决标准对基因组变异进行分类的结果都设置为假。变异分类模块65基于用户的修改指令,对基因组变异进行分类后的结果进行相应的修改。对基因组变异进行分类处理得到的变异种类包括:致病的、可能致病的、意义不明确的、可能良性的和良性的。其中,将自动判定规则文件、基因变异注释结果、基因变异分类结果保存在数据库或缓存中。
图7为根据本发明公开的遗传变异判定系统的另一个实施例的模块示意图。如图7所示,该装置可包括存储器71、处理器72、通信接口73以及总线74。存储器71用于存储指令,处理器72耦合到存储器71,处理器72被配置为基于存储器71存储的指令执行实现上述的遗传变异判定方法。
存储器71可以为高速RAM存储器、非易失性存储器(NoN-volatile memory)等,存储器71也可以是存储器阵列。存储器71还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器72可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明公开的遗传变异判定方法的一个或多个集成电路。
在一个实施例中,本发明提供一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一个实施例中的遗传变异判定方法。
上述实施例提供的遗传变异判定方法、系统以及存储介质,根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件,使用注释工具并基于自动判定规则文件对变异检测文件进行变异基因注释处理,使用评分工具并基于自动判定规则文件对变异检测文件中出现的基因组变异进行分类处理,基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中;能够更加准确、高效的进行基因分析注释,帮助解读人员更高效地应用评估标准,能够对海量变异位点信息实现自动化分析,提高评估结果的准确性和判定速度,加快符合孟德尔遗传遗传病基因分析和诊断速度。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
Claims (6)
1.一种遗传变异判定方法,其特征在于,包括:
创建用于对待分析的基因样本进行致病性判定的自动判定任务,通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件;
根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件,包括:
获得所述多种生物医学数据库的数据信息,基于预设的数据过滤规则对所述数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表;其中,所述多种生物医学数据库包括:人群频率数据库、ClinVar、GWAS Catalog、dbNSFP、InterProdomain、dbscSNV;所述自动判定规则文件包括所述变异信息数据表,所述变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格;
使用注释工具并基于自动判定规则文件对所述变异检测文件进行变异基因注释处理,生成基因变异注释结果;
使用评分工具并基于所述自动判定规则文件对所述变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果,包括:
根据所述变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,所述变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行;使用评分工具并基于所述变异评估标准自动化规则对所述变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对所述基因组变异进行分类处理;
响应于接收到的用户对所述自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
2.如权利要求1所述的方法,其特征在于,还包括:
使用评分工具并根据能够自动执行的判决标准对所述基因组变异进行分类,得到的分类结果为假或真;
将根据不能自动执行的判决标准对所述基因组变异进行分类的结果都设置为假;
基于用户的修改指令,对所述基因组变异进行分类后的结果进行相应的修改。
3.如权利要求1所述的方法,其特征在于,
对所述基因组变异进行分类处理得到的变异种类包括:致病的、可能致病的、意义不明确的、可能良性的和良性的;
将所述自动判定规则文件、基因变异注释结果、基因变异分类结果保存在数据库或缓存中。
4.一种遗传变异判定系统,其特征在于,包括:
任务设置模块,用于创建对待分析的基因样本进行致病性判定的自动判定任务;
基因检测模块,用于通过相应的分析流程生成与基因样本相对应的用于描述基因组变异的变异检测文件;
数据处理模块,用于根据多种生物医学数据库的数据生成用于对基因组变异进行注释和分类的自动判定规则文件;
其中,所述数据处理模块,用于获得所述多种生物医学数据库的数据信息,基于预设的数据过滤规则对所述数据信息进行相应地处理,生成用于对基因组变异进行注释和分类的变异信息数据表;所述多种生物医学数据库包括:人群频率数据库、ClinVar、GWASCatalog、dbNSFP、InterPro domain、dbscSNV;所述自动判定规则文件包括所述变异信息数据表,所述变异信息数据表包括:全部ClinVar变异、常见ClinVar变异、罕见ClinVar变异、功能失活基因变异、dbscSNV、功能结构域、致病氨基酸、rmsk、致病错义突变基因、良性错义突变基因、千人基因组、db_gwas和遗传方式中的一种或多种表格;
变异注释模块,用于使用注释工具并基于所述自动判定规则文件对所述变异检测文件进行变异基因注释处理,生成基因变异注释结果;
变异分类模块,用于使用评分工具并基于所述自动判定规则文件对所述变异检测文件中出现的基因组变异进行分类处理,获得基因变异分类结果;
其中,所述变异分类模块,用于根据所述变异信息数据表和ACMG遗传变异分类标准生成变异评估标准自动化规则;其中,所述变异评估标准自动化规则包括:判决标准、此判决标准的执行步骤、此判决标准能否自动执行;使用评分工具并基于所述变异评估标准自动化规则对所述变异检测文件中出现的基因组变异进行评估和判定,根据评估和判定结果对所述基因组变异进行分类处理;
修改处理模块,用于响应于接收到的用户对所述自动判定规则文件中的判定标准进行修改的指令,使用评分工具并基于修改后的判定标准对基因变异进行重新分类,并将修改后的判定标准保存在自动判定规则文件中。
5.一种遗传变异判定系统,其特征在于,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至3中任一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被一个或多个处理器执行时实现权利要求1至3任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383990.6A CN109243530B (zh) | 2018-11-20 | 2018-11-20 | 遗传变异判定方法、系统以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811383990.6A CN109243530B (zh) | 2018-11-20 | 2018-11-20 | 遗传变异判定方法、系统以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109243530A CN109243530A (zh) | 2019-01-18 |
CN109243530B true CN109243530B (zh) | 2021-08-03 |
Family
ID=65075218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811383990.6A Active CN109243530B (zh) | 2018-11-20 | 2018-11-20 | 遗传变异判定方法、系统以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109243530B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109920481B (zh) * | 2019-01-31 | 2021-06-01 | 北京诺禾致源科技股份有限公司 | Brca1/2基因变异解读数据库及其构建方法 |
CN110544508B (zh) * | 2019-07-29 | 2023-03-10 | 荣联科技集团股份有限公司 | 一种单基因遗传病基因的分析方法、装置及电子设备 |
CN110957006B (zh) * | 2019-12-14 | 2023-08-11 | 杭州联川基因诊断技术有限公司 | 一种brca1/2基因变异的解读方法 |
CN111816253A (zh) * | 2020-06-16 | 2020-10-23 | 荣联科技集团股份有限公司 | 一种基因检测解读方法及装置 |
CN114429785B (zh) * | 2022-04-01 | 2022-07-19 | 普瑞基准生物医药(苏州)有限公司 | 一种基因变异的自动分类方法、装置和电子设备 |
CN114783589B (zh) * | 2022-04-02 | 2022-10-04 | 中国医学科学院阜外医院 | 主动脉疾病遗传突变自动化解读系统HTAADVar |
WO2024138706A1 (zh) * | 2022-12-30 | 2024-07-04 | 深圳华大基因股份有限公司 | 变异的处理方法、系统、设备及存储介质 |
CN115798579B (zh) * | 2023-02-08 | 2023-05-05 | 智泽童康(广州)生物科技有限公司 | 一种遗传变异的证据判定方法、系统、装置及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156538A (zh) * | 2016-06-29 | 2016-11-23 | 天津诺禾医学检验所有限公司 | 一种全基因组变异数据的注释方法和注释系统 |
CN107194208A (zh) * | 2017-04-25 | 2017-09-22 | 北京荣之联科技股份有限公司 | 一种基因分析注释方法和装置 |
CN107247890A (zh) * | 2017-06-30 | 2017-10-13 | 张巍 | 一种用于临床诊断和预测的基因数据系统 |
CN107391965A (zh) * | 2017-08-15 | 2017-11-24 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的肺癌体细胞突变检测分析方法 |
CN108388775A (zh) * | 2018-02-05 | 2018-08-10 | 上海海云生物科技有限公司 | 基因分析导引系统及其方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160153032A9 (en) * | 2013-01-25 | 2016-06-02 | Signature Diagnostics Ag | Method for predicting a manifestation of an outcome measure of a cancer patient |
-
2018
- 2018-11-20 CN CN201811383990.6A patent/CN109243530B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156538A (zh) * | 2016-06-29 | 2016-11-23 | 天津诺禾医学检验所有限公司 | 一种全基因组变异数据的注释方法和注释系统 |
CN107194208A (zh) * | 2017-04-25 | 2017-09-22 | 北京荣之联科技股份有限公司 | 一种基因分析注释方法和装置 |
CN107247890A (zh) * | 2017-06-30 | 2017-10-13 | 张巍 | 一种用于临床诊断和预测的基因数据系统 |
CN107391965A (zh) * | 2017-08-15 | 2017-11-24 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的肺癌体细胞突变检测分析方法 |
CN108388775A (zh) * | 2018-02-05 | 2018-08-10 | 上海海云生物科技有限公司 | 基因分析导引系统及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109243530A (zh) | 2019-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109243530B (zh) | 遗传变异判定方法、系统以及存储介质 | |
Liu et al. | DNA methylation atlas of the mouse brain at single-cell resolution | |
Smolka et al. | Detection of mosaic and population-level structural variants with Sniffles2 | |
Zhao et al. | Detection of fetal subchromosomal abnormalities by sequencing circulating cell-free DNA from maternal plasma | |
CN106909806B (zh) | 定点检测变异的方法和装置 | |
CN109767810B (zh) | 高通量测序数据分析方法及装置 | |
Navarro et al. | Chromosomal speciation and molecular divergence--accelerated evolution in rearranged chromosomes | |
Scherer et al. | Quantitative comparison of within-sample heterogeneity scores for DNA methylation data | |
JP2017522908A (ja) | セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法 | |
CN116042833A (zh) | 比对和变体测序分析管线 | |
JP6066924B2 (ja) | Dna配列のデータ解析法 | |
Jakubosky et al. | Discovery and quality analysis of a comprehensive set of structural variants and short tandem repeats | |
CN110648722B (zh) | 新生儿遗传病患病风险评估的装置 | |
CN111139291A (zh) | 一种单基因遗传性疾病高通量测序分析方法 | |
EP4016533B1 (en) | Method and apparatus for machine learning based identification of structural variants in cancer genomes | |
Gong et al. | lncRNA-screen: an interactive platform for computationally screening long non-coding RNAs in large genomics datasets | |
AU2016355983A1 (en) | Methods for detecting copy-number variations in next-generation sequencing | |
Demidov et al. | ClinCNV: novel method for allele-specific somatic copy-number alterations detection | |
KR101770962B1 (ko) | 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치 | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
CN111128308B (zh) | 一种神经精神疾病新发突变信息知识平台 | |
JP7141038B2 (ja) | 発症予測装置、及び発症予測システム | |
KR102404947B1 (ko) | 기계학습 기반의 유전체 구조 변이 식별 방법 및 장치 | |
CN116564406A (zh) | 一种遗传变异自动化解读方法及设备 | |
Lavrichenko et al. | SeeCiTe: a method to assess CNV calls from SNP arrays using trio data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 1002-1, 10th floor, No.56, Beisihuan West Road, Haidian District, Beijing 100080 Applicant after: Ronglian Technology Group Co., Ltd Address before: 100080, Beijing, Haidian District, No. 56 West Fourth Ring Road, glorious Times Building, 10, 1002-1 Applicant before: UNITED ELECTRONICS Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |