CN111105844B - 体细胞变异分类方法、装置、设备及可读存储介质 - Google Patents

体细胞变异分类方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN111105844B
CN111105844B CN201911157012.4A CN201911157012A CN111105844B CN 111105844 B CN111105844 B CN 111105844B CN 201911157012 A CN201911157012 A CN 201911157012A CN 111105844 B CN111105844 B CN 111105844B
Authority
CN
China
Prior art keywords
analyzed
site
mutation
quality
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911157012.4A
Other languages
English (en)
Other versions
CN111105844A (zh
Inventor
冯菁华
毛琳琳
陈禹欣
邓俊豪
赵纤纤
赵薇薇
于世辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kingmed Diagnostics Group Co ltd
Original Assignee
Guangzhou Kingmed Diagnostics Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kingmed Diagnostics Group Co ltd filed Critical Guangzhou Kingmed Diagnostics Group Co ltd
Priority to CN201911157012.4A priority Critical patent/CN111105844B/zh
Publication of CN111105844A publication Critical patent/CN111105844A/zh
Application granted granted Critical
Publication of CN111105844B publication Critical patent/CN111105844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明涉及一种有利于提高分类一致性的体细胞变异评估分类方法、装置、计算机设备和计算机可读存储介质。该体细胞变异分类方法根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。本发明研究细化标准,对多项公共生物医学数据库进行数据抓取和数据整理,再结合中国人群数据库、肿瘤阳性位点数据库、变异解析报告注释库,搭建了一套体细胞变异分类方法及装置,适用于高通量测序结果体细胞变异的分析解读,其具有操作简便、高效、应用性强等优势,分类结果一致性高,可用于辅助临床应用,较人工分类可以节省大量的时间。

Description

体细胞变异分类方法、装置、设备及可读存储介质
技术领域
本发明涉及生物信息学及分子生物学技术领域,尤其是涉及一种体细胞变异分类方法、装置、计算机设备及可读存储介质。
背景技术
在临床基因组实验室中,高通量测序是一项必备检测技术,从外周血、骨髓穿刺液、福尔马林固定石蜡包埋组织、新鲜组织、血浆等生物样本中分析测定基因序列,用于多种癌症的辅助诊断、预后评估和用药指导。参照2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准,癌症体细胞变异可分为五大类临床意义:强临床意义、潜在临床意义、临床意义未明、疑似良性和良性。然而指南对于每一分类仅给出了提纲领性的判断标准,实际结果多通过人工解读数据。
随着癌症研究的不断深入,癌症样本检测数和检测基因数不断增多,实验室检测得到的变异数也不断增多,同时新的临床试验及公共数据库不断翻新,人工解读数据消耗时间越来越长,而且不同解读人员对解读判定规则理解不同,使得变异的分类解读一致率不高。
发明内容
基于此,有必要提供一种有利于提高分类一致性的体细胞变异分类方法、装置、计算机设备和计算机可读存储介质。
一种体细胞变异分类方法,包括如下步骤:
获取待评估样本的高通量测序数据;
将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;
根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;
对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;
对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;
根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。
一种体细胞变异分类装置,包括:
测序数据获取模块,用于获取待评估样本的高通量测序数据;
待分析差异位点获取模块,用于将所述高通量测序数据与参考序列进行比对,得到关于所述高通量测序数据中相对于所述参考序列的待分析差异位点;
质量控制模块,用于根据所述待分析差异位点的测序质量值判断所述待分析差异位点质量是否在控;
发生率和纯合值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;
位置和变异类型注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;
基因功能注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;
收录病例值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;以及
临床意义分类模块,用于根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析。
一种计算机设备,具有处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的体细胞变异分类方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述任一实施例所述的体细胞变异分类方法的步骤。
传统的指南对于每一分类仅提纲领性的判断标准,使人工解读带有差异,为解决这一问题,本发明研究细化标准,对多项公共生物医学数据库进行数据抓取和数据整理,再结合中国人群数据库、肿瘤阳性位点数据库、变异解析报告注释库,搭建了一套体细胞变异分类方法及装置,适用于高通量测序结果体细胞变异的分析解读,其具有操作简便、高效、应用性强等优势,分类结果一致性高,可用于辅助临床应用,较人工分类可以节省大量的时间。
附图说明
图1为本发明一实施例的体细胞变异分类方法的基本流程示意图;
图2为本发明一实施例的体细胞变异分类装置的基本结构框架图;
图3为案例1中比对后变异位点的原始VCF文件示例图;
图4为案例1中经评估分类后变异位点导出文件示例图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本文所述的“差异位点”是指与参考序列比对不同的位点,例如与hg19参考序列中不同的位点;所述的“变异位点”是指根据文献等证据附上意义后的差异位点;所述的“测序质量”是指对于实验方法和仪器运行导致的测序错误与真实值之间比较后得出的可信值;所述的变异位点“发生率”是指为特定人群中,某等位基因携带者的在总群体中占比;所述的变异位点“纯合值”是指为特定人群中,等位基因为纯合的携带者个数;所述的“原癌基因”、“抑癌基因”、“功能未明”以及“遗传相关”分别是指存在于生物正常细胞基因组中的癌基因、一类存在于正常细胞内可抑制细胞生长并具有潜在抑癌作用的基因、功能尚未研究明确的基因、研究证实基因功能导致遗传性疾病的基因;所述的“变异位点收录病例值”是指变异位点在特定数据库中特定人群的病例数;所述的“强临床意义”是指根据药物说明书、指南、专家共识或权威文献中在诊断、预后和治疗中有意义的变异位点;“潜在临床意义”是指小标本的文献、非直接但相关病种或研究明确的功能域在诊断、预后和治疗中有意义的变异位点;“临床意义未明”是指无文献报道的变异位点;“疑似良性”是指在人群数据库有低比例发生率且无在诊断、预后和治疗中有意义报道的变异位点;“良性”即SNP位点,在人群发生率大于等于1%的变异位点。
如图1所示,本发明一实施例提供了一种体细胞变异分类方法,其包括如下步骤:
步骤S110:获取待评估样本的高通量测序数据;
步骤S120:将高通量测序数据与参考序列进行比对,得到关于高通量测序数据中相对于所述参考序列的待分析差异位点;
步骤S130:根据待分析差异位点的测序质量值判断待分析差异位点质量是否在控;
步骤S140:对于质量在控的待分析差异位点,获取待分析差异位点的发生率和纯合值;
步骤S150:对于质量在控的待分析差异位点,对待分析差异位点的位置和变异类型分别作注释标签;
步骤S160:对于质量在控的待分析差异位点,对待分析差异位点作基因功能注释标签;
步骤S170:对于质量在控的待分析差异位点,获取待分析差异位点的变异位点收录病例值;
步骤S180:根据待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对待分析差异位点作临床意义分类分析。
可理解,在其他实施例中,步骤S140、S150、S160和S170可随意互换顺序,只要能够获得相应的结果即可。
在一个具体示例中,在步骤S130中,所述根据待分析差异位点的测序质量值判断待分析差异位点质量是否在控包括:
结合同批次多个样本的同位点的测序质量情况得到待分析差异位点的测序质量值;
根据测序质量值是否满足预设的质量阈值标准判断待分析差异位点质量是否在控,预设的质量阈值标准为同批次样本中待分析差异位点出现次数≥50%,且历史批次样本中待分析差异位点突变频率<10%且出现次数≥10%,且历史批次样本中待分析差异位点突变频率<5%且出现次数≥5%;
将不满足预设的质量阈值标准的质量不在控的待分析差异位点列入排除结果不进行后续分析处理。
可理解,同批次往往检测有多个样本,多个样本同位点之间可以作相互比较,一般来说,在有限的样本数下,一个差异位点不会重复出现,重复出现的多是背景信噪。更具体地,预设的质量阈值标准中所述同批次样本数量不小于10例,所述历史批次样本的数量不小于10000例。
在一个具体示例中,所述对于质量在控的待分析差异位点,获取待分析差异位点的发生率和纯合值包括:
判断质量在控的待分析差异位点是否收录于目标数据库中,对于收录在目标数据库中的待分析差异位点,返回其发生率和纯合值;
目标数据库包括gnomAD数据库、EXAC数据库、1000g数据库、esp6500数据库以及根据历史数据预先构建的中国人群遗传数据库中的至少一种。根据历史数据预先构建的中国人群遗传数据库可以是将历史检测的中国人群的基因变异位点及其发生率和纯合值存储记录下来,形成检索数据库。优选地,将多个目标数据库结合起来使用。
在一个具体示例中,所述对于质量在控的待分析差异位点,对待分析差异位点的位置和变异类型分别作注释标签包括:
根据参考转录本信息对待分析差异位点的位置和变异类型分别作注释标签;
位置注释标签包括:外显子(exonic)、内含子(intron)、UTR3(3’端非翻译区,UTR即Untranslated Region)和UTR5(5’端非翻译区);变异类型注释标签包括:同义突变(synonymous)、剪接(splicing)、移码删除(frameshift deletion)、移码插入(frameshiftinsertion)、非移码删除(nonframeshift deletion)、非移码插入(nonframeshiftinsertion)、错义突变(nonsynonymous SNV)、无义突变(stopgain)和终止子突变(stoploss)。
参考转录本信息可以是NCBI数据库里面参考序列(Reference Sequences)的信息。
在一个具体示例中,对于质量在控的待分析差异位点,对待分析差异位点作基因功能注释标签包括:
根据公共循证证据和/或根据历史结果预先构建的变异解析报告注释库对待分析差异位点作基因功能注释标签;
基因功能注释标签包括:原癌基因、抑癌基因、功能未明和遗传相关。
公共循证证据可以是来源于OncoKB数据库和/或OMIM数据库,如果都没有还可以在NCBI上搜索文献寻求相关信息。根据历史结果预先构建的变异解析报告注释库可以是将历史检测结果中出现的基因变异位点及其基因功能注释存储记录起来,建立起的供检索查阅的数据库。
在一个具体示例中,所述对于质量在控的待分析差异位点,获取待分析差异位点的变异位点收录病例值包括:
根据公共癌症数据库和/或根据历史结果预先构建的肿瘤阳性位点数据库,判断待分析差异位点是否收录于相应的数据库中,对于收录于相应数据库中的待分析差异位点,返回其变异位点收录病例值;
公共癌症数据库包括:COSMIC数据库、OncoKB数据库、ClinVar数据库和OMIN数据库。根据历史结果预先构建的肿瘤阳性位点数据库是将历史检测结果中的变异位点及其是否是肿瘤阳性位点的信息存储记录起来,建立起的供检索查阅的数据库。
在一个具体示例中,所述根据待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对待分析差异位点作临床意义分类分析包括:
将发生率不小于预设的SNP阈值的质量在控的待分析差异位点列入SNP分类结果;预设的SNP阈值为在gnomAD数据库、EXAC数据库、1000g数据库和/或esp6500数据库中发生率为1%,或在根据历史数据预先构建的中国人群遗传数据库中发生率为0.2%;
对于发生率小于预设的SNP阈值且纯合值>0的质量在控的待分析差异位点,或位置注释标签为内含子或UTR3或UTR5的质量在控的待分析差异位点,或变异类型注释标签为同义突变的质量在控的待分析差异位点,将其列入Tier IV分类结果;
对基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于预设的第一LOF(Loss of Function,即功能缺失)分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果,此处所用的公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第一LOF分类阈值为3例;
对于基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值低于预设的第一LOF分类阈值但高于预设的第二LOF分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第二LOF分类阈值为0例;
对于基因功能注释标签为原癌基因或抑癌基因、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于预设的第一MIS(Missence,即错义突变)分类阈值的质量在控的待分析差异位点,将其列入TierI分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第一MIS分类阈值为40例;
对于基因功能注释标签为原癌基因或抑癌基因或功能未明、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值低于预设的第一MIS分类阈值且高于预设的第二MIS分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第二MIS分类阈值为5例;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于第一Gem(Germline mutation,即胚系突变)分类阈值的质量在控的待分析差异位点,将其列入TierII分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库及肿瘤阳性位点数据库,预设的第一Gem分类阈值为4例;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于第二Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库及肿瘤阳性位点数据库,预设的第二Gem分类阈值为1例;
对于不列入SNP分类结果、Tier IV分类结果、Tier I分类结果及Tier II分类结果的质量在控的待分析差异位点,将其列入Tier III分类结果。
本文所述的Tier I为强临床意义变异,Tier II为潜在临床意义变异,Tier III为临床意义未明变异,Tier IV为疑似良性变异。
在一个具体示例中,所述根据待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对待分析差异位点作临床意义分类分析还包括:
对于位置注释标签为内含子或UTR3或UTR5,且收录在公共癌症数据库和/或肿瘤阳性位点数据中的质量在控的待分析差异位点,将其列入Tier I分类结果。
在一个具体示例中,该体细胞变异分类方法还包括根据得出的待分析差异位点的分类结果对待分析差异位点作临床意义注释标签和解释结果的步骤。
具体地,作为对上述技术方案的进一步改进,所述Tier I分类结果、Tier II分类结果、Tier III分类结果、Tier IV分类结果和SNP分类结果的变异位点的临床意义建议解释结果的步骤包括:
当所述变异位点为Tier I分类结果时,结合所述5基因临床意义注释标签包括Tier I,得出Tier I解释结果;
当所述变异位点为Tier II分类结果时,结合所述5基因临床意义注释标签包括Tier II,得出Tier II解释结果;
当所述变异位点为Tier III分类结果时,结合所述5基因临床意义注释标签包括Tier III,得出Tier III解释结果。
具体来说,通过上述临床意义建议解释结果是关于临床意义的具体的建议解析内容,具体内容来自变异解析报告注释库,本示例是将注释库中具体的建议解析附给了相应的变异位点。
进一步,如图2所示,本发明一实施例还提供了一种体细胞变异分类装置20,其包括:
测序数据获取模块210,用于获取待评估样本的高通量测序数据;
待分析差异位点获取模块220,用于将高通量测序数据与参考序列进行比对,得到关于高通量测序数据中相对于参考序列的待分析差异位点;
质量控制模块230,用于根据待分析差异位点的测序质量值判断待分析差异位点质量是否在控;
发生率和纯合值获取模块240,用于对于质量在控的待分析差异位点,获取待分析差异位点的发生率和纯合值;
位置和变异类型注释模块250,用于对于质量在控的待分析差异位点,对待分析差异位点的位置和变异类型分别作注释标签;
基因功能注释模块260,用于对于质量在控的待分析差异位点,对待分析差异位点作基因功能注释标签;
收录病例值获取模块270,用于对于质量在控的待分析差异位点,获取待分析差异位点的变异位点收录病例值;以及
临床意义分类模块280,用于根据待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对待分析差异位点作临床意义分类分析。
具体地,该质量控制模块230用于结合同批次多个样本的同位点的测序质量情况得到待分析差异位点的测序质量值,根据测序质量值是否满足预设的质量阈值标准判断待分析差异位点质量是否在控,预设的质量阈值标准为同批次样本中待分析差异位点出现次数≥50%,且历史批次样本中待分析差异位点突变频率<10%且出现次数≥10%,且历史批次样本中待分析差异位点突变频率<5%且出现次数≥5%,将不满足预设的质量阈值标准的质量不在控的待分析差异位点列入排除结果不进行后续分析处理。
该发生率和纯合值获取模块240用于判断质量在控的待分析差异位点是否收录于目标数据库中,对于收录在目标数据库中的待分析差异位点,返回其发生率和纯合值。目标数据库包括gnomAD数据库、EXAC数据库、1000g数据库、esp6500数据库以及根据历史数据预先构建的中国人群遗传数据库中的至少一种。
该位置和变异类型注释模块250用于根据参考转录本信息对待分析差异位点的位置和变异类型分别作注释标签。其中,位置注释标签包括:外显子、内含子、UTR3和UTR5;变异类型注释标签包括:同义突变、剪接、移码删除、移码插入、非移码删除、非移码插入、错义突变、无义突变和终止子突变。
该基因功能注释模块260用于根据公共循证证据和/或根据历史结果预先构建的变异解析报告注释库对待分析差异位点作基因功能注释标签。基因功能注释标签包括:原癌基因、抑癌基因、功能未明和遗传相关。
该收录病例值获取模块270用于根据公共癌症数据库和/或根据历史结果预先构建的肿瘤阳性位点数据库,判断待分析差异位点是否收录于相应的数据库中,对于收录于相应数据库中的待分析差异位点,返回其变异位点收录病例值。公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库和OMIN数据库中的至少一种。
该临床意义分类模块280用于:
将发生率不小于预设的SNP阈值的质量在控的待分析差异位点列入SNP分类结果;预设的SNP阈值为在gnomAD数据库、EXAC数据库、1000g数据库和/或esp6500数据库中发生率为1%,或在根据历史数据预先构建的中国人群遗传数据库中发生率为0.2%;
对于发生率小于预设的SNP阈值且纯合值>0的质量在控的待分析差异位点,或位置注释标签为内含子或UTR3或UTR5的质量在控的待分析差异位点,或变异类型注释标签为同义突变的质量在控的待分析差异位点,将其列入TierIV分类结果;
对基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于预设的第一LOF分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果,此处所用的公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第一LOF分类阈值为3例;
对于基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值低于预设的第一LOF分类阈值但高于预设的第二LOF分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第二LOF分类阈值为0例;
对于基因功能注释标签为原癌基因或抑癌基因、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于预设的第一MIS分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第一MIS分类阈值为40例;
对于基因功能注释标签为原癌基因或抑癌基因或功能未明、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值低于预设的第一MIS分类阈值且高于预设的第二MIS分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及肿瘤阳性位点数据库,预设的第二MIS分类阈值为5例;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于第一Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库及肿瘤阳性位点数据库,预设的第一Gem分类阈值为4例;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于第二Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库及肿瘤阳性位点数据库,预设的第二Gem分类阈值为1例;
对于不列入SNP分类结果、Tier IV分类结果、Tier I分类结果及Tier II分类结果的质量在控的待分析差异位点,将其列入Tier III分类结果。
此外,该临床意义分类模块280还用于对于位置注释标签为内含子或UTR3或UTR5,且收录在公共癌症数据库和/或肿瘤阳性位点数据中的质量在控的待分析差异位点,将其列入Tier I分类结果。
基于如上所述的实施例,本发明还提供了一种可用于体细胞变异分类的计算机设备,具有处理器和存储器,存储器上存储有计算机程序,处理器执行该计算机程序时实现上述任一实施例的体细胞变异分类方法的步骤。
本领域普通技术人员可以理解实现上述方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
据此,本发明还提供了一种可用于体细胞变异分类的计算机存储介质,其上存储有计算机程序,计算机程序被执行时实现上述任一实施例的体细胞变异分类方法的步骤。
以下结合检测案例对本发明的体细胞变异分类方法作进一步详细的说明。
案例1急性髓系白血病的体细胞变异评估分类
1.本例检测急性髓系白血病相关的30个基因全显子序列,测序数据下机后经比对得到原始差异位点74个,见示例图3;
2.变异位点质量值经预设的质量阈值筛选后,过滤失控位点49个,剩余在控位点25个;
3.变异位点在群体数据库的发生率经SNP阈值判断后,列入SNP分类结果的位点15个,剩余位点10个;
4.变异位点经变异位点的群体数据库的发生率经SNP阈值及纯合值判断、变异位点的位置注释标签判断和变异位点变异类型注释标签判断后,列入TierIV分类结果的位点7个,剩余位点3个;
5.变异位点经变异位点功能注释标签判断、变异位点变异类型注释标签判断和变异位点收录病例值判断后,列入Tier I分类结果的位点2个、Tier II分类结果的位点0个、Tier III分类结果的位点1个;
6.2个Tier I分类结果的位点、1个的Tier III分类结果变异位点的建议解释经基因临床意义注释标签得出对应基因分类的建议解析,以最终报告系统要求导出后见示例图4。
本例结果经人工遵从2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准解读,得2个Tier I位点、1个Tier III位点,与系统自动分类解读的一致率为100%。
案例2骨髓增生异常综合征的体细胞变异评估分类
1.本例检测骨髓增生异常综合征相关的31个基因全显子序列,测序数据下机后经比对得到原始差异位点77个;
2.变异位点质量值经预设的质量阈值筛选后,过滤失控位点59个,剩余在控位点18个;
3.变异位点在群体数据库的发生率经SNP阈值判断后,列入SNP分类结果的位点14个,剩余位点4个;
4.变异位点经变异位点的群体数据库的发生率经SNP阈值及纯合值判断、变异位点的位置注释标签判断和变异位点变异类型注释标签判断后,列入Tier IV分类结果的位点0个,剩余位点4个;
5.变异位点经变异位点功能注释标签判断、变异位点变异类型注释标签判断和变异位点收录病例值判断后,列入Tier I分类结果的位点2个、Tier II分类结果的位点0个、Tier III分类结果的位点2个;
6.2个Tier I分类结果的位点、2个的Tier III分类结果变异位点的建议解释经基因临床意义注释标签得出对应基因分类的建议解析,以最终报告系统要求导出。
本例结果经人工遵从2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准解读,得2个Tier I位点、2个Tier III位点,与系统自动分类解读的一致率为100%。
案例3慢性淋巴细胞白血病的体细胞变异评估分类
1.本例检测慢性淋巴细胞白血病相关的8个基因全显子序列,测序数据下机后经比对得到原始差异位点21个;
2.变异位点质量值经预设的质量阈值筛选后,过滤失控位点20个,剩余在控位点1个;
3.变异位点在群体数据库的发生率经SNP阈值判断后,列入SNP分类结果的位点1个,剩余位点0个;
4.变异位点经变异位点的群体数据库的发生率经SNP阈值及纯合值判断、变异位点的位置注释标签判断和变异位点变异类型注释标签判断后,列入Tier IV分类结果的位点0个,剩余位点0个;
5.变异位点经变异位点功能注释标签判断、变异位点变异类型注释标签判断和变异位点收录病例值判断后,列入Tier I分类结果的位点0个、Tier II分类结果的位点0个、Tier III分类结果的位点0个;
6.0个Tier I分类结果的位点、0个Tier II分类结果的位点、0个的Tier III分类结果变异位点的建议解释经基因临床意义注释标签得出对应基因分类的建议解析,以最终报告系统要求导出。
本例结果经人工遵从2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准解读,得阴性变异位点分类结果,与系统自动分类解读的一致率为100%。
案例4髓系肿瘤的体细胞变异评估分类
1.本例检测髓系肿瘤相关的99个基因全显子序列,测序数据下机后经比对得到原始差异位点214个;
2.变异位点质量值经预设的质量阈值筛选后,过滤失控位点166个,剩余在控位点48个;
3.变异位点在群体数据库的发生率经SNP阈值判断后,列入SNP分类结果的位点40个,剩余位点8个;
4.变异位点经变异位点的群体数据库的发生率经SNP阈值及纯合值判断、变异位点的位置注释标签判断和变异位点变异类型注释标签判断后,列入Tier IV分类结果的位点6个,剩余位点2个;
5.变异位点经变异位点功能注释标签判断、变异位点变异类型注释标签判断和变异位点收录病例值判断后,列入Tier I分类结果的位点0个、Tier II分类结果的位点0个、Tier III分类结果的位点2个;
6.2个的Tier III分类结果变异位点的建议解释经基因临床意义注释标签得出对应基因分类的建议解析,以最终报告系统要求导出。
本例结果经人工遵从2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准解读,得2个Tier III位点,与系统自动分类解读的一致率为100%。
案例5淋系肿瘤的体细胞变异评估分类
1.本例检测淋系肿瘤相关的88个基因全显子序列,测序数据下机后经比对得到原始差异位点220个;
2.变异位点质量值经预设的质量阈值筛选后,过滤失控位点171个,剩余在控位点49个;
3.变异位点在群体数据库的发生率经SNP阈值判断后,列入SNP分类结果的位点36个,剩余位点13个;
4.变异位点经变异位点的群体数据库的发生率经SNP阈值及纯合值判断、变异位点的位置注释标签判断和变异位点变异类型注释标签判断后,列入Tier IV分类结果的位点10个,剩余位点3个;
5.变异位点经变异位点功能注释标签判断、变异位点变异类型注释标签判断和变异位点收录病例值判断后,列入Tier I分类结果的位点1个、Tier II分类结果的位点0个、Tier III分类结果的位点2个;
6.1个Tier I分类结果的位点、2个的Tier III分类结果变异位点的建议解释经基因临床意义注释标签得出对应基因分类的建议解析,以最终报告系统要求导出。
本例结果经人工遵从2017年AMP、ASCO和CAP联合发布的癌症变异解读及报告标准解读,得1个Tier I位点、3个Tier III位点,与系统自动分类解读的一致率为50%。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种体细胞变异分类方法,其特征在于,包括如下步骤:
根据待评估样本的高通量测序数据和参考序列的比对结果获取待评估样本的待分析差异位点;
根据所述待分析差异位点的测序质量值获取质量在控的所述待分析差异位点;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;
对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;
对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;
对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;
根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析;
所述对所述待分析差异位点作临床意义分类分析的步骤包括:
将发生率不小于预设的SNP阈值的质量在控的待分析差异位点列入SNP分类结果;
对于发生率小于预设的SNP阈值且纯合值>0的质量在控的待分析差异位点,或位置注释标签为内含子或UTR3或UTR5的质量在控的待分析差异位点,或变异类型注释标签为同义突变的质量在控的待分析差异位点,将其列入Tier IV分类结果;
对基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于预设的第一LOF分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果;
对于基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值低于预设的第一LOF分类阈值但高于预设的第二LOF分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于基因功能注释标签为原癌基因或抑癌基因、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于预设的第一MIS分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果;
对于基因功能注释标签为原癌基因或抑癌基因或功能未明、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值低于预设的第一MIS分类阈值且高于预设的第二MIS分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于第一Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于不列入SNP分类结果、Tier IV分类结果、Tier I分类结果及Tier II分类结果的质量在控的待分析差异位点,将其列入Tier III分类结果;
对于所述基因功能注释标签为遗传相关、且所述位置注释标签为外显子、且所述变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值高于第二Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
其中,所述Tier I为强临床意义变异,Tier II为潜在临床意义变异,Tier III为临床意义未明变异,Tier IV为疑似良性变异。
2.如权利要求1所述的体细胞变异分类方法,其特征在于,所述根据所述待分析差异位点的测序质量值获取质量在控的所述待分析差异位点包括:
结合同批次多个样本的同位点的测序质量情况得到待分析差异位点的测序质量值;
根据所述测序质量值是否满足预设的质量阈值标准判断所述待分析差异位点质量是否在控,所述预设的质量阈值标准为同批次样本中所述待分析差异位点出现次数≥50%,且历史批次样本中所述待分析差异位点突变频率<10%且出现次数≥10%,且历史批次样本中所述待分析差异位点突变频率<5%且出现次数≥5%;
将不满足所述预设的质量阈值标准的质量不在控的所述待分析差异位点列入排除结果不进行后续分析处理,以获取质量在控的所述待分析差异位点。
3.如权利要求1或2所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值包括:
判断质量在控的所述待分析差异位点是否收录于目标数据库中,对于收录在所述目标数据库中的所述待分析差异位点,返回其发生率和纯合值;
所述目标数据库包括gnomAD数据库、EXAC数据库、1000g数据库、esp6500数据库以及根据历史数据预先构建的中国人群遗传数据库中的至少一种。
4.如权利要求3所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签包括:
根据参考转录本信息对所述待分析差异位点的位置和变异类型分别作注释标签;
所述位置注释标签包括:外显子、内含子、UTR3和UTR5;所述变异类型注释标签包括:同义突变、剪接、移码删除、移码插入、非移码删除、非移码插入、错义突变、无义突变和终止子突变。
5.如权利要求4所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签包括:
根据公共循证证据和/或根据历史结果预先构建的变异解析报告注释库对所述待分析差异位点作基因功能注释标签;
所述基因功能注释标签包括:原癌基因、抑癌基因、功能未明和遗传相关。
6.如权利要求5所述的体细胞变异分类方法,其特征在于,所述对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值包括:
根据公共癌症数据库和/或根据历史结果预先构建的肿瘤阳性位点数据库,判断所述待分析差异位点是否收录于相应的数据库中,对于收录于相应数据库中的待分析差异位点,返回其变异位点收录病例值;
所述公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库和OMIN数据库中的至少一种。
7.如权利要求6所述的体细胞变异分类方法,其特征在于,所述根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析包括:
将所述发生率不小于预设的SNP阈值的质量在控的所述待分析差异位点列入SNP分类结果;所述预设的SNP阈值为在gnomAD数据库、EXAC数据库、1000g数据库和/或esp6500数据库中发生率为1%,或在根据历史数据预先构建的中国人群遗传数据库中发生率为0.2%;
对于所述发生率小于预设的SNP阈值且纯合值>0的质量在控的所述待分析差异位点,或所述位置注释标签为内含子或UTR3或UTR5的质量在控的所述待分析差异位点,或所述变异类型注释标签为同义突变的质量在控的所述待分析差异位点,将其列入Tier IV分类结果;
对所述基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值高于预设的第一LOF分类阈值的质量在控的所述待分析差异位点,将其列入Tier I分类结果,此处所用的公共癌症数据库包括COSMIC数据库、OncoKB数据库和/或所述肿瘤阳性位点数据库,所述预设的第一LOF分类阈值为3例;
对于所述基因功能注释标签为抑癌基因、且所述位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值低于预设的第一LOF分类阈值但高于预设的第二LOF分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库及所述肿瘤阳性位点数据库,所述预设的第二LOF分类阈值为0例;
对于所述基因功能注释标签为原癌基因或抑癌基因、且所述位置注释标签为外显子、且所述变异类型注释标签为非移码删除或非移码插入或错义突变、且所述变异位点收录病例值高于预设的第一MIS分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库和/或所述肿瘤阳性位点数据库,所述预设的第一MIS分类阈值为40例;
对于所述基因功能注释标签为原癌基因或抑癌基因或功能未明、且所述位置注释标签为外显子、且所述变异类型注释标签为非移码删除或非移码插入或错义突变、且所述变异位点收录病例值低于预设的第一MIS分类阈值且高于预设的第二MIS分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库和/或所述肿瘤阳性位点数据库,所述预设的第二MIS分类阈值为5例;
对于所述基因功能注释标签为遗传相关、且所述位置注释标签为外显子、且所述变异类型注释标签为非移码删除或非移码插入或错义突变、且所述变异位点收录病例值高于第一Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库和/或所述肿瘤阳性位点数据库,所述预设的第一Gem分类阈值为4例;
对于所述基因功能注释标签为遗传相关、且所述位置注释标签为外显子、且所述变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值高于第二Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果,此处公共癌症数据库包括COSMIC数据库、OncoKB数据库、ClinVar数据库、OMIN数据库和/或所述肿瘤阳性位点数据库,所述预设的第二Gem分类阈值为1例。
8.如权利要求7所述的体细胞变异分类方法,其特征在于,所述根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析还包括:
对于所述位置注释标签为内含子或UTR3或UTR5,且收录在所述公共癌症数据库和/或所述肿瘤阳性位点数据中的质量在控的待分析差异位点,将其列入Tier I分类结果。
9.如权利要求8所述的体细胞变异分类方法,其特征在于,还包括根据得出的待分析差异位点的分类结果对所述待分析差异位点作临床意义注释标签和解释结果的步骤。
10.一种体细胞变异分类装置,其特征在于,包括:
待分析差异位点获取模块,用于根据待评估样本的高通量测序数据和参考序列的比对结果获取待评估样本的待分析差异位点;
质量控制模块,用于根据所述待分析差异位点的测序质量值获取质量在控的所述待分析差异位点;
发生率和纯合值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的发生率和纯合值;
位置和变异类型注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点的位置和变异类型分别作注释标签;
基因功能注释模块,用于对于质量在控的所述待分析差异位点,对所述待分析差异位点作基因功能注释标签;
收录病例值获取模块,用于对于质量在控的所述待分析差异位点,获取所述待分析差异位点的变异位点收录病例值;以及
临床意义分类模块,用于根据所述待分析差异位点是否质量在控以及发生率、纯合值、位置注释标签、变异类型注释标签、基因功能注释标签和变异位点收录病例值对所述待分析差异位点作临床意义分类分析;
所述对所述待分析差异位点作临床意义分类分析包括:
将发生率不小于预设的SNP阈值的质量在控的待分析差异位点列入SNP分类结果;
对于发生率小于预设的SNP阈值且纯合值>0的质量在控的待分析差异位点,或位置注释标签为内含子或UTR3或UTR5的质量在控的待分析差异位点,或变异类型注释标签为同义突变的质量在控的待分析差异位点,将其列入Tier IV分类结果;
对基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值高于预设的第一LOF分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果;
对于基因功能注释标签为抑癌基因、且位置注释标签为外显子、且变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且变异位点收录病例值低于预设的第一LOF分类阈值但高于预设的第二LOF分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于基因功能注释标签为原癌基因或抑癌基因、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于预设的第一MIS分类阈值的质量在控的待分析差异位点,将其列入Tier I分类结果;
对于基因功能注释标签为原癌基因或抑癌基因或功能未明、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值低于预设的第一MIS分类阈值且高于预设的第二MIS分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于基因功能注释标签为遗传相关、且位置注释标签为外显子、且变异类型注释标签为非移码删除或非移码插入或错义突变、且变异位点收录病例值高于第一Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于所述基因功能注释标签为遗传相关、且所述位置注释标签为外显子、且所述变异类型注释标签为剪接或移码删除或移码插入或无义突变或终止子突变、且所述变异位点收录病例值高于第二Gem分类阈值的质量在控的待分析差异位点,将其列入Tier II分类结果;
对于不列入SNP分类结果、Tier IV分类结果、Tier I分类结果及Tier II分类结果的质量在控的待分析差异位点,将其列入Tier III分类结果;
其中,所述Tier I为强临床意义变异,Tier II为潜在临床意义变异,Tier III为临床意义未明变异,Tier IV为疑似良性变异。
11.一种计算机设备,其特征在于,具有处理器和存储器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~9中任一项所述的体细胞变异分类方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1~9中任一项所述的体细胞变异分类方法的步骤。
CN201911157012.4A 2019-11-22 2019-11-22 体细胞变异分类方法、装置、设备及可读存储介质 Active CN111105844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911157012.4A CN111105844B (zh) 2019-11-22 2019-11-22 体细胞变异分类方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911157012.4A CN111105844B (zh) 2019-11-22 2019-11-22 体细胞变异分类方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN111105844A CN111105844A (zh) 2020-05-05
CN111105844B true CN111105844B (zh) 2023-06-06

Family

ID=70421367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911157012.4A Active CN111105844B (zh) 2019-11-22 2019-11-22 体细胞变异分类方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111105844B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882943B (zh) * 2022-03-29 2023-04-18 深圳裕康医学检验实验室 一种分析体细胞变异的方法及装置
CN114429785B (zh) * 2022-04-01 2022-07-19 普瑞基准生物医药(苏州)有限公司 一种基因变异的自动分类方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103374518A (zh) * 2012-04-12 2013-10-30 维里纳塔健康公司 拷贝数变异的检测和分类
CN107516021A (zh) * 2017-08-03 2017-12-26 北京百迈客生物科技有限公司 一种基于高通量测序的数据分析方法
CN109033749A (zh) * 2018-06-29 2018-12-18 深圳裕策生物科技有限公司 一种肿瘤突变负荷检测方法、装置和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10446272B2 (en) * 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
EP2582847B1 (en) * 2010-06-18 2016-10-26 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
CN102952854B (zh) * 2011-08-25 2015-01-14 深圳华大基因科技有限公司 单细胞分类和筛选方法及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103374518A (zh) * 2012-04-12 2013-10-30 维里纳塔健康公司 拷贝数变异的检测和分类
CN107516021A (zh) * 2017-08-03 2017-12-26 北京百迈客生物科技有限公司 一种基于高通量测序的数据分析方法
CN109033749A (zh) * 2018-06-29 2018-12-18 深圳裕策生物科技有限公司 一种肿瘤突变负荷检测方法、装置和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Brian H. Shirts 等.Using Somatic Mutations from Tumors to Classify Variants in Mismatch Repair Genes.The American Journal of Human Genetics.2018,第103卷(第1期),第19-29页. *
王秋菊 等.遗传变异分类标准与指南.中国科学:生命科学.2017,第47卷(第6期),第668-688页. *

Also Published As

Publication number Publication date
CN111105844A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
Mahmoud et al. Structural variant calling: the long and the short of it
Chong et al. High-resolution architecture and partner genes of MYC rearrangements in lymphoma with DLBCL morphology
Malapelle et al. Next generation sequencing techniques in liquid biopsy: focus on non-small cell lung cancer patients
Hicks et al. Novel patterns of genome rearrangement and their association with survival in breast cancer
Morey et al. Diagnosis of cutaneous melanocytic tumours by four‐colour fluorescencein situhybridisation
Lestringant et al. Optical genome mapping, a promising alternative to gold standard cytogenetic approaches in a series of acute lymphoblastic leukemias
CN110168648A (zh) 序列变异识别的验证方法和系统
Toledo et al. Next-generation sequencing for the diagnosis of hereditary pheochromocytoma and paraganglioma syndromes
JP2021516962A (ja) バリアント検出の改善
Parry et al. Genomic evaluation of multiparametric magnetic resonance imaging-visible and-nonvisible lesions in clinically localised prostate cancer
CN111105844B (zh) 体细胞变异分类方法、装置、设备及可读存储介质
CA3099057C (en) Surrogate marker and method for tumor mutation burden measurement
Muller et al. OutLyzer: software for extracting low-allele-frequency tumor mutations from sequencing background noise in clinical practice
Zalcberg et al. Multidisciplinary diagnostics of chronic lymphocytic leukemia: European Research Initiative on CLL-ERIC recommendations
Popp et al. Targeted sequencing of FH-deficient uterine leiomyomas reveals biallelic inactivating somatic fumarase variants and allows characterization of missense variants
Sahm et al. Molecular diagnostic tools for the World Health Organization (WHO) 2021 classification of gliomas, glioneuronal and neuronal tumors; an EANO guideline
JP2023523002A (ja) 染色体近接実験における構造的変異検出
WO2019046804A1 (en) IDENTIFICATION OF FALSE POSITIVE VARIANTS USING A MODEL OF IMPORTANCE
Demidov et al. ClinCNV: novel method for allele-specific somatic copy-number alterations detection
Gallon et al. Constitutional microsatellite instability, genotype, and phenotype correlations in constitutional mismatch repair deficiency
Llop et al. The role of next-generation sequencing in acute myeloid leukemia
CN111899789B (zh) 二代测序鉴定brca1/2大片段重排的方法及系统
CN107208148A (zh) 用于乳腺肿瘤的病理分级的方法和试剂盒
US20200143905A1 (en) Methods and compositions for germline variant detection
Doyle et al. Studying cancer genomics through next-generation DNA sequencing and bioinformatics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant