CN111816253A - 一种基因检测解读方法及装置 - Google Patents
一种基因检测解读方法及装置 Download PDFInfo
- Publication number
- CN111816253A CN111816253A CN202010549626.3A CN202010549626A CN111816253A CN 111816253 A CN111816253 A CN 111816253A CN 202010549626 A CN202010549626 A CN 202010549626A CN 111816253 A CN111816253 A CN 111816253A
- Authority
- CN
- China
- Prior art keywords
- variation
- gene
- interpretation
- data
- brca1
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000001514 detection method Methods 0.000 title claims abstract description 25
- 108091007743 BRCA1/2 Proteins 0.000 claims abstract description 70
- 230000007918 pathogenicity Effects 0.000 claims abstract description 26
- 238000011156 evaluation Methods 0.000 claims abstract description 19
- 206010064571 Gene mutation Diseases 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 230000001717 pathogenic effect Effects 0.000 claims description 39
- 230000007614 genetic variation Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 abstract description 3
- 230000035772 mutation Effects 0.000 description 32
- 238000004891 communication Methods 0.000 description 10
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008093 supporting effect Effects 0.000 description 7
- 101150072950 BRCA1 gene Proteins 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 101100484967 Solanum tuberosum PVS1 gene Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 108700020463 BRCA1 Proteins 0.000 description 3
- 102000036365 BRCA1 Human genes 0.000 description 3
- 108700040618 BRCA1 Genes Proteins 0.000 description 3
- 101150008921 Brca2 gene Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108700020462 BRCA2 Proteins 0.000 description 2
- 102000052609 BRCA2 Human genes 0.000 description 2
- 102100029671 E3 ubiquitin-protein ligase TRIM8 Human genes 0.000 description 2
- 101000795300 Homo sapiens E3 ubiquitin-protein ligase TRIM8 Proteins 0.000 description 2
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 2
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 2
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108700010154 BRCA2 Genes Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 208000033640 Hereditary breast cancer Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 208000014804 familial ovarian cancer Diseases 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000025581 hereditary breast carcinoma Diseases 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- JMANVNJQNLATNU-UHFFFAOYSA-N oxalonitrile Chemical compound N#CC#N JMANVNJQNLATNU-UHFFFAOYSA-N 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- -1 variation statistics Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本说明书一个或多个实施例提供一种基因检测解读方法及装置,包括:对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件,根据基因变异位点的注释文件,确定基因变异位点的解读数据,根据基因变异位点的解读数据,确定对应的临床数据。这样,通过将致病性评价条件统一化,能够实现BRCA1/2基因的自动化检测解读,实现了BRCA1/2基因变异分析流程化、智能化,利于临床应用推广。
Description
技术领域
本说明书一个或多个实施例涉及生物信息技术领域,尤其涉及一种基因检测解读方法及装置。
背景技术
BRCA1/2基因是重要的抑癌基因,可通过同源重组修复途径对DNA双链断裂进行修复。BRCA1/2基因变异情况是评估乳腺癌、卵巢癌、前列腺癌等肿瘤发病风险及化疗药物、PARP(poly ADP-ribose polymerase)抑制剂类药物等肿瘤治疗临床药效的重要评价指标,具有十分重要的临床意义。
BRCA1/2基因编码序列较长,分别为5592bp和10257bp(依据NM_007294.3、NM_000059.3转录本),致病变异具有特征性,位置广泛分布,没有明显热点变异,变异形式多样,包括单核苷酸变异、插入缺失、重排等,给变异检测解读带来困难。目前,已有一些组织建立了BRCA1/2基因解读规则,然而,各组织建立的解读规则标准不一,存在人工判定因素,无法实现自动化的基因检测解读,增加了临床应用的困难。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基因检测解读方法及装置,以解决BRCA1/2基因无法自动检测解读的问题。
基于上述目的,本说明书一个或多个实施例提供了一种基因检测解读方法,包括:
对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
根据所述注释文件,确定基因变异位点的解读数据;
根据所述解读数据,确定对应的临床数据。
可选的,根据所述注释文件,确定基因变异位点的解读数据,包括:
根据所述注释文件,查询预设的BRCA1/2变异数据库,若得到查询结果,则将所述查询结果作为所述解读数据;若未得到查询结果,则根据所述注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到所述解读数据。
可选的,所述量化致病性评价条件包括预设的致病性变异证据和预设的良性变异证据;
根据所述注释文件,按照所述致病性变异证据和良性变异证据,对基因变异点进行判定,得到所述解读数据。
可选的,所述解读数据包括各个基因变异点所对应的等级;
根据所述解读数据,确定对应的临床数据,包括:根据所述各个基因变异点所对应的等级,判定对应的致病概率,根据所述致病概率确定对应的临床意义。
可选的,所述方法还包括:
将所述BRCA1/2基因变异位点的注释文件、所述解读数据和所述临床数据保存于BRCA1/2变异数据库中。
本说明书一个或多个实施例还提供一种基因检测解读装置,包括:
分析模块,用于对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
解读模块,用于根据所述注释文件,确定基因变异位点的解读数据;
临床数据确定模块,用于根据所述解读数据,确定对应的临床数据。
可选的,所述解读模块,用于根据所述注释文件,查询预设的BRCA1/2变异数据库,若得到查询结果,则将所述查询结果作为所述解读数据;若未得到查询结果,则根据所述注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到所述解读数据。
可选的,所述量化致病性评价条件包括预设的致病性变异证据和预设的良性变异证据;
所述解读模块,用于根据所述注释文件,按照所述致病性变异证据和良性变异证据,对基因变异点进行判定,得到所述解读数据。
可选的,所述解读数据包括各个基因变异点所对应的等级;
所述临床数据确定模块,用于根据所述各个基因变异点所对应的等级,判定对应的致病概率,根据所述致病概率确定对应的临床意义。
可选的,所述还包括:将所述BRCA1/2基因变异位点的注释文件、所述解读数据和所述临床数据保存于BRCA1/2变异数据库中。
从上面所述可以看出,本说明书一个或多个实施例提供的基因检测解读方法及装置,通过对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件,根据基因变异位点的注释文件,确定基因变异位点的解读数据,根据基因变异位点的解读数据,确定对应的临床数据,通过将致病性评价条件统一化,能够实现BRCA1/2基因的自动化检测解读,实现了BRCA1/2基因变异分析流程化、智能化,利于临床应用推广。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一个或多个实施例的方法流程示意图;
图2为本说明书一个或多个实施例的装置结构框图;
图3为本说明书一个或多个实施例的电子设备的结构框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如图1所示,本说明书一个或多个实施例提供一种基因检测解读方法,包括:
S101:对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
本实施例中,对样本信息进行测序,得到测序数据,对测序数据进行质控、比对、变异位点检测分析,得到变异位点检测结果,对变异位点检测结果进行注释,得到BRCA1/2基因变异位点(以下简称基因变异位点)的注释文件。
一些实施例中,注释信息可利用基因注释工具对变异位点检测结果进行注释得到。注释信息包括但不限于phred质量值、等位基因状态、等位基因频率、变异类型、遗传模式、基因标识(用于标识基因)、转录本标识、HGVSc(人类基因组织变异协会命名DNA参考序列)标识、HGVSp(人类基因组变异协会命名蛋白质参考序列)标识、染色体编号、外显子起止位置、外显子数目及编号、内含子起止位置、内含子数目及编号、软件预测、参考数据库变异注释信息和父/母检测状态等。
S102:根据BRCA1/2基因变异位点的注释文件,确定BRCA1/2基因变异位点的解读数据;
本实施例中,根据基因变异位点的注释文件,查询预设的BRCA1/2变异数据库,若查询该BRCA1/2变异数据库得到查询结果,则将查询结果作为基因变异位点的解读数据。
若查询BRCA1/2变异数据库未得到查询结果,则根据基因变异位点的注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到基因变异位点的解读数据。
S103:根据BRCA1/2基因变异位点的解读数据,确定对应的临床数据。
本实施例中,确定出基因变异位点的解读数据后,根据解读数据查询预设的临床数据库,获得对应的临床数据。临床数据包括但不限于临床意义和判读结果。
本实施例的基因检测解读方法,通过对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件,根据基因变异位点的注释文件,确定基因变异位点的解读数据,根据基因变异位点的解读数据,确定对应的临床数据,能够实现BRCA1/2基因的自动化检测解读,利于临床应用推广。
一些本实施例中,所述量化致病性评价条件包括致病性变异证据(参考表1所示相关描述信息)和良性变异证据(参考表2所示相关描述信息)两类。其中,致病性变异证据按照由强到弱的程度可分为四个等级:非常强(PVS1)、强(PS1-PS4)、中等(PM1-PM6)及支持证据(PP1-PP4);良性变异证据按照由强到弱的程度可分为三个等级:独立证据(BA)、强(BS1-BS4)及支持证据(BP1-BP6)。
其中,对于程度为非常强的致病性变异证据(PVS1),将变异位点具体到BRCA1第1856位氨基酸和BRCA2第8309位氨基酸前,并增加1个证据注释,通过增加的证据注释体现了需考虑可能恢复BRCA1/2基因功能的自然存在的框内RNA异构体的变异。
对于程度为强的致病性变异证据(PS,pathogenic strong,其中,PS1-PS4均属于强级别致病性证据),增加两个证据数据表,包括:Clinvar数据库(该数据库是由美国国立生物技术信息中心NCBI主办的与疾病相关的人类基因组变异数据库)中BRCA1/2基因变异位点的体内外功能实验人工审核表,Clinvar数据库中BRCA1/2基因变异位点经家系验证的新发变异验证人工审核表。
对于程度为中等的致病性变异证据(PM,pathogenic moderate,其中,PM1-PM5均属于中等级别致病性变异证据),一方面,关注BRCA1/2重要结构域,BRCA1基因的Ring(氨基酸起始及终止:1-101)和BRCT(氨基酸起始及终止:1650-1863)结构域及外显子边界,BRCA2基因的DBD
(氨基酸起始及终止:2481-3186)结构域及外显子边界(对应PM1);另一方面,使用gnomAD数据库(Genome Aggregation Database,是由各国研究者联合发展起来的基因组突变频率数据库)、1000Genome遗传资源数据库作为人群频率参考数据库(对应PM2);第三方面,去除原ACMG/AMP指南(美国医学遗传学与基因组学学会和美国分子病理协会共同颁布和制定的人类基因变异致病性解读指南)中PM3关于隐性遗传病的描述。同时,增加三个证据数据表,包括:Clinvar数据库中BRCA1/2基因致病变异位点的未经验证的新发变异人工审核表,Clinvar数据库中BRCA1/2基因致病性变异位点的家系共分离的人工审核表,Clinvar数据库中BRCA1/2基因变异位点与已知致病性变异一致的人工审核表。
对于程度为支持证据的致病性变异证据(PP,pathogenic supporting,其中,PP1-PP4均属于支持等级致病性证据),一方面,去除ACMG/AMP指南中PP2关于突变类型与造成疾病发生原因的描述;另一方面,确定可靠信誉来源的支持性数据库为BRCA Exchange(汇集了全球成千上万个遗传性BRCA1和BRCA2基因变异信息的数据库)、LOVD(Leiden OpenVariation Database,莱顿开放变异数据库)、ClinVar(NCBI主办的与疾病相关的人类基因组变异数据库)、Utah database(犹他大学病理学系和ARUP实验室通过与亨茨曼癌症研究所HCI和世卫组织国际癌症研究机构IARC合作,建立的BRCA突变数据库)、ENIGMA(ENIGMA,Evidence-based Network for the Interpretation of Germline Mutant Alleles,胚系突变基因等位基因解读实证联盟,致力于BRCA1/2基因变异解读工作和标准的制定,并联系临床医生和相关机构共享BRCA1/2基因变异信息)等(对应PP4);第三方面,增加一个证据数据表,为NCCN指南(美国国家综合癌症网络)遗传性乳腺癌卵巢癌高风险临床表征表。
对于程度为独立证据的良性变异证据(BA,Benign stand-alone),使用gnomAD、1000Genome数据库作为人群频率参考数据库(对应BA1)。
对于程度为强的良性变异证据(BS,Benign strong),一方面,修正BS2(BS2为第2条BS)于早期疾病完全外显的描述,更改为该变异编码的氨基酸改变与已确认的1类良性变异相同,但发生改变的基础核苷酸不同,且无证据表明该变异会导致剪切事件;另一方面,增加三个证据数据表,包括:Clinvar数据库中BRCA1/2基因良性变异位点的体内外功能实验人工审核表,Clinvar数据库中BRCA1/2基因良性变异位点家系共分离的人工审核表,Clinvar数据库中BRCA1/2基因变异位点与已知良性变异一致的人工审核表。
对于程度为支持证据的良性变异证据(BP,Benign supporting),一方面,去除ACMG/AMP指南中BP1关于变异类型与疾病关联性的描述;另一方面,确定可靠信誉来源的支持性数据库为BRCA Exchange、LOVD、ClinVar、Utah database、ENIGMA等(对应BP5,即第5条BP)。
表1 致病性变异证据分级描述信息(部分)
表1中,ADA、RF分别是dbscSNV数据库的ADA和RF分值,dbscSNV是一个关于剪接(splicing)区的变异注释数据库,基于不同算法给出ADA和RF分值。其中,ADA基于adaptiveboosting预测,RF基于Random Forest预测变异对剪接位点改变的可能性。MetaSVM是dbNSFP数据库整合的预测分值,也是结合SIFT、PolyPhen和MutationAssessor不同预测软件的预测分值,训练SVM模型来预测变异影响。GERP++_RS是注释变异位点的保守性的GERP++_RS分值。保守性得分高的位点,变异后更有可能对基因功能有影响。
表2 良性变异证据分级描述信息(部分)
表3 BRCA1/2外显子交界区域变异
表4 证据数据表(部分)
本实施例中,根据BRCA1/2基因的变异特点,增加必要的证据模块和证据数据表,去掉不符合解读的证据模块,形成量化致病性评价条件。对于BRCA1/2变异数据库中未存储的基因变异点相关信息,根据基因变异点的注释文件,按照量化致病性评价条件对基因变异点进行判定,得到基因变异点的解读数据,能够实现基因变异点的自动化判定解读。其中,基因变异点的解读数据包括但不限于基因变异点对应的证据等级及对应的描述说明等致病性评价数据,例如,BRCA1基因的c.3679C>T(p.Q1227*)变异位点对应的证据等级为PVS1和PM2,能够为后续临床意义判定提供依据。
一些实施例中,参考表5所示,根据基因变异位点的解读数据,确定对应的临床意义,临床意义可分为五类:致病的(致病概率>0.99),可能致病的(致病概率为0.95-0.99)、意义不明确的(致病概率为0.05-0.949)、可能良性的(致病概率0.001-0.049)、良性的(致病概率<0.001)。
表5 临床意义分类规则
如表5所示,根据所得到的各个基因变异点所对应的等级,判定对应的致病概率,根据致病概率确定对应的临床意义,并得到判读结果,例如,BRCA1某变异位点,解读数据为对应的证据等级是PVS1和PM2,则该变异位点对应表5规则,可判定为可能致病的,后续报告中将提示“检测到BRCA1基因存在可能致病胚系突变”等信息。
一些实施例中,在得到基因变异点的解读数据和临床数据后,将基因变异点及其解读数据、临床数据等相关信息保存于BRCA1/2变异数据库中,实现BRCA1/2变异数据库的更新扩展,使得BRCA1/2变异数据库不断丰富,提高后续基因变异点的查询高效性。
其中,BRCA1/2变异数据库中保存有基因变异位点及其注释文件、解读数据、临床数据等,具体包括基因变异位点、致病性评价数据、临床意义、判定日期、BRCA1/2基因名称、变异标识、转录本标识、变异位点HGVSc标识、HGVSp标识、人群频率、软件预测、致病性判定标准、提交人/单位等信息。
一些实施例中,BRCA1/2变异数据库是基于Clinvar数据库的BRCA1/2基因变异组学信息所构建,并按照前述方法,根据基因变异位点的注释文件,通过分析确定出基因变异位点的解读数据、临床数据,然后保存于BRCA1/2数据库中,实现的BRCA1/2数据库的不断更新扩展。
还可以是,在得到基因变异位点的解读数据和临床数据后,输出基因变异位点及其解读数据、临床数据,在接收到确定保存的指令后,将基因变异位点的注释文件、解读数据和临床数据等信息保存于BRCA1/2变异数据库中;或者,输出基因变异位点及其解读数据、临床数据,用户对输出的数据进行修改后,在接收到修改保存的指令后,将修改后的基因变异位点的注释文件、解读数据和临床数据等信息保存于BRCA1/2变异数据库中。本实施例中,对基因变异位点进行自动化检测解读后,可对解读结果进行修正调整,保存调整后的数据。
一些实施例中,基因检测解读方法还包括:根据基因变异位点的解读数据,查询预设的医学数据库,以得到基因变异位点对应的医学解读数据,医学解读数据例如为疾病风险、降低风险的措施、可采取的治疗方法及用药指导等。
一些方式中,基因检测解读方法还包括:根据样本信息、基因变异位点的注释文件、解读数据、临床数据、医学解读数据等,按照预定的模板生成BRCA1/2基因分析报告,通过标准化的模板展现BRCA1/2基因分析报告,便于临床研究人员以熟悉的方式查看分析报告。
所生成的BRCA1/2基因分析报告至少包括样本信息、检测结果、基因变异分类解释、检测方法说明、签名和联系信息。样本信息包括受检者姓名、性别、年龄、临床诊断、治疗史、家族史、样本检测时间或样本检测机构、样本质控等信息。检测结果包括基因、变异统计、基因亚区、基因功能描述、致病性分类、证据及临床意义判定依据、疾病风险提示、指导建议等。检测方法说明描述了使用何种BRCA检测方法及该方法覆盖的指定序列区域。签名和联系信息包括实验操作、数据分析与报告撰写、报告复核人及问询联系信息等。
需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
如图2所示,本说明书一个或多个实施例还提供一种基因检测解读装置,包括:
分析模块,用于对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
解读模块,用于根据所述注释文件,确定基因变异位点的解读数据;
临床数据确定模块,用于根据所述解读数据,确定对应的临床数据。
一些实施例中,所述解读模块,用于根据所述注释文件,查询预设的BRCA1/2变异数据库,若得到查询结果,则将所述查询结果作为所述解读数据;若未得到查询结果,则根据所述注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到所述解读数据。
一些实施例中,所述量化致病性评价条件包括预设的致病性变异证据和预设的良性变异证据;
所述解读模块,用于根据所述注释文件,按照所述致病性变异证据和良性变异证据,对基因变异点进行判定,得到所述解读数据。
一些实施例中,所述解读数据包括各个基因变异点所对应的等级;
所述临床数据确定模块,用于根据所述各个基因变异点所对应的等级,判定对应的致病概率,根据所述致病概率确定对应的临床意义。
一些实施例中,还包括:将所述BRCA1/2基因变异位点的注释文件、所述解读数据和所述临床数据保存于BRCA1/2变异数据库中。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
图3示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种基因检测解读方法,其特征在于,包括:
对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
根据所述注释文件,确定基因变异位点的解读数据;
根据所述解读数据,确定对应的临床数据。
2.根据权利要求1所述的方法,其特征在于,根据所述注释文件,确定基因变异位点的解读数据,包括:
根据所述注释文件,查询预设的BRCA1/2变异数据库,若得到查询结果,则将所述查询结果作为所述解读数据;若未得到查询结果,则根据所述注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到所述解读数据。
3.根据权利要求2所述的方法,其特征在于,所述量化致病性评价条件包括预设的致病性变异证据和预设的良性变异证据;
根据所述注释文件,按照所述致病性变异证据和良性变异证据,对基因变异点进行判定,得到所述解读数据。
4.根据权利要求1所述的方法,其特征在于,所述解读数据包括各个基因变异点所对应的等级;
根据所述解读数据,确定对应的临床数据,包括:根据所述各个基因变异点所对应的等级,判定对应的致病概率,根据所述致病概率确定对应的临床意义。
5.根据权利要求2所述的方法,其特征在于,还包括:
将所述BRCA1/2基因变异位点的注释文件、所述解读数据和所述临床数据保存于BRCA1/2变异数据库中。
6.一种基因检测解读装置,其特征在于,包括:
分析模块,用于对样本信息进行分析,生成描述BRCA1/2基因变异位点的注释文件;
解读模块,用于根据所述注释文件,确定基因变异位点的解读数据;
临床数据确定模块,用于根据所述解读数据,确定对应的临床数据。
7.根据权利要求6所述的装置,其特征在于,
所述解读模块,用于根据所述注释文件,查询预设的BRCA1/2变异数据库,若得到查询结果,则将所述查询结果作为所述解读数据;若未得到查询结果,则根据所述注释文件,按照量化致病性评价条件对基因变异位点进行判定,以得到所述解读数据。
8.根据权利要求7所述的装置,其特征在于,所述量化致病性评价条件包括预设的致病性变异证据和预设的良性变异证据;
所述解读模块,用于根据所述注释文件,按照所述致病性变异证据和良性变异证据,对基因变异点进行判定,得到所述解读数据。
9.根据权利要求6所述的装置,其特征在于,所述解读数据包括各个基因变异点所对应的等级;
所述临床数据确定模块,用于根据所述各个基因变异点所对应的等级,判定对应的致病概率,根据所述致病概率确定对应的临床意义。
10.根据权利要求7所述的装置,其特征在于,还包括:将所述BRCA1/2基因变异位点的注释文件、所述解读数据和所述临床数据保存于BRCA1/2变异数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010549626.3A CN111816253A (zh) | 2020-06-16 | 2020-06-16 | 一种基因检测解读方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010549626.3A CN111816253A (zh) | 2020-06-16 | 2020-06-16 | 一种基因检测解读方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111816253A true CN111816253A (zh) | 2020-10-23 |
Family
ID=72845102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010549626.3A Pending CN111816253A (zh) | 2020-06-16 | 2020-06-16 | 一种基因检测解读方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111816253A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793638A (zh) * | 2021-11-15 | 2021-12-14 | 北京橡鑫生物科技有限公司 | 一种同源重组修复基因变异的解读方法 |
CN114496072A (zh) * | 2022-01-17 | 2022-05-13 | 北京安琪尔基因医学科技有限公司 | 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器 |
CN114783589A (zh) * | 2022-04-02 | 2022-07-22 | 中国医学科学院阜外医院 | 主动脉疾病遗传突变自动化解读系统(HTAADVar) |
TWI795139B (zh) * | 2021-12-23 | 2023-03-01 | 國立陽明交通大學 | 自動化致病突變點位的分類系統及其分類方法 |
CN117746989A (zh) * | 2024-02-20 | 2024-03-22 | 北京贝瑞和康生物技术有限公司 | 变异描述信息的处理方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018042185A1 (en) * | 2016-09-02 | 2018-03-08 | Imperial Innovations Ltd | Methods, systems and apparatus for identifying pathogenic gene variants |
US20180312928A1 (en) * | 2015-10-26 | 2018-11-01 | Cipherome | Method and system for selecting customized drug using genomic nucleotide sequence variation information and survival information of cancer patient |
CN109182483A (zh) * | 2018-09-04 | 2019-01-11 | 天津诺禾致源生物信息科技有限公司 | 基因变异解读的方法及装置 |
CN109243530A (zh) * | 2018-11-20 | 2019-01-18 | 北京荣之联科技股份有限公司 | 遗传变异判定方法、系统以及存储介质 |
CN109920481A (zh) * | 2019-01-31 | 2019-06-21 | 北京诺禾致源科技股份有限公司 | Brca1/2基因变异解读数据库及其构建方法 |
CN110957006A (zh) * | 2019-12-14 | 2020-04-03 | 杭州联川基因诊断技术有限公司 | 一种brca1/2基因变异的解读方法 |
-
2020
- 2020-06-16 CN CN202010549626.3A patent/CN111816253A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180312928A1 (en) * | 2015-10-26 | 2018-11-01 | Cipherome | Method and system for selecting customized drug using genomic nucleotide sequence variation information and survival information of cancer patient |
WO2018042185A1 (en) * | 2016-09-02 | 2018-03-08 | Imperial Innovations Ltd | Methods, systems and apparatus for identifying pathogenic gene variants |
CN109182483A (zh) * | 2018-09-04 | 2019-01-11 | 天津诺禾致源生物信息科技有限公司 | 基因变异解读的方法及装置 |
CN109243530A (zh) * | 2018-11-20 | 2019-01-18 | 北京荣之联科技股份有限公司 | 遗传变异判定方法、系统以及存储介质 |
CN109920481A (zh) * | 2019-01-31 | 2019-06-21 | 北京诺禾致源科技股份有限公司 | Brca1/2基因变异解读数据库及其构建方法 |
CN110957006A (zh) * | 2019-12-14 | 2020-04-03 | 杭州联川基因诊断技术有限公司 | 一种brca1/2基因变异的解读方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793638A (zh) * | 2021-11-15 | 2021-12-14 | 北京橡鑫生物科技有限公司 | 一种同源重组修复基因变异的解读方法 |
CN113793638B (zh) * | 2021-11-15 | 2022-03-25 | 北京橡鑫生物科技有限公司 | 一种同源重组修复基因变异的解读方法 |
TWI795139B (zh) * | 2021-12-23 | 2023-03-01 | 國立陽明交通大學 | 自動化致病突變點位的分類系統及其分類方法 |
CN114496072A (zh) * | 2022-01-17 | 2022-05-13 | 北京安琪尔基因医学科技有限公司 | 耳聋致病分析等级分类方法、装置、计算机可读存储介质及服务器 |
CN114783589A (zh) * | 2022-04-02 | 2022-07-22 | 中国医学科学院阜外医院 | 主动脉疾病遗传突变自动化解读系统(HTAADVar) |
CN114783589B (zh) * | 2022-04-02 | 2022-10-04 | 中国医学科学院阜外医院 | 主动脉疾病遗传突变自动化解读系统HTAADVar |
CN117746989A (zh) * | 2024-02-20 | 2024-03-22 | 北京贝瑞和康生物技术有限公司 | 变异描述信息的处理方法、装置及电子设备 |
CN117746989B (zh) * | 2024-02-20 | 2024-05-10 | 北京贝瑞和康生物技术有限公司 | 变异描述信息的处理方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111816253A (zh) | 一种基因检测解读方法及装置 | |
Kann | Advances in translational bioinformatics: computational approaches for the hunting of disease genes | |
Pugh et al. | VisCap: inference and visualization of germ-line copy-number variants from targeted clinical sequencing data | |
Rennie et al. | Transcriptional decomposition reveals active chromatin architectures and cell specific regulatory interactions | |
US20150066378A1 (en) | Identifying Possible Disease-Causing Genetic Variants by Machine Learning Classification | |
Sante et al. | ViVar: a comprehensive platform for the analysis and visualization of structural genomic variation | |
KR101542529B1 (ko) | 대립유전자의 바이오마커 발굴방법 | |
Mikhail et al. | Technical laboratory standards for interpretation and reporting of acquired copy-number abnormalities and copy-neutral loss of heterozygosity in neoplastic disorders: a joint consensus recommendation from the American College of Medical Genetics and Genomics (ACMG) and the Cancer Genomics Consortium (CGC) | |
Zhang et al. | PriVar: a toolkit for prioritizing SNVs and indels from next-generation sequencing data | |
Schilder et al. | echolocatoR: an automated end-to-end statistical and functional genomic fine-mapping pipeline | |
Sana et al. | GAMES identifies and annotates mutations in next-generation sequencing projects | |
KR20140061223A (ko) | 차세대 시퀀싱 데이터의 질병변이마커 검출 방법 | |
WO2021248695A1 (zh) | 基于临床特征和序列变异的单基因病名称推荐方法及系统 | |
Madubata et al. | Identification of potentially oncogenic alterations from tumor-only samples reveals Fanconi anemia pathway mutations in bladder carcinomas | |
US20240029827A1 (en) | Method for determining the pathogenicity/benignity of a genomic variant in connection with a given disease | |
Danis et al. | SvAnna: efficient and accurate pathogenicity prediction of coding and regulatory structural variants in long-read genome sequencing | |
Giannoula et al. | A system-level analysis of patient disease trajectories based on clinical, phenotypic and molecular similarities | |
DeGroat et al. | Discovering biomarkers associated and predicting cardiovascular disease with high accuracy using a novel nexus of machine learning techniques for precision medicine | |
Li et al. | Bioinformatics tools for discovery and functional analysis of single nucleotide polymorphisms | |
Tabarini et al. | Exploration of tools for the interpretation of human non-coding variants | |
CN109036572B (zh) | 一种多数据库交互方法及装置 | |
Zhao et al. | The global carrier frequency and genetic prevalence of Upshaw-Schulman syndrome | |
CN112795635A (zh) | 一种马凡综合征及相关基因的检测方法、装置和存储介质 | |
Wang et al. | DeepPerVar: a multi-modal deep learning framework for functional interpretation of genetic variants in personal genome | |
CN109065181B (zh) | 一种基于宽泛检索的多数据库交互方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |