CN114496080A - 耳聋致病性基因的筛查方法、装置、存储介质及服务器 - Google Patents
耳聋致病性基因的筛查方法、装置、存储介质及服务器 Download PDFInfo
- Publication number
- CN114496080A CN114496080A CN202210051508.9A CN202210051508A CN114496080A CN 114496080 A CN114496080 A CN 114496080A CN 202210051508 A CN202210051508 A CN 202210051508A CN 114496080 A CN114496080 A CN 114496080A
- Authority
- CN
- China
- Prior art keywords
- deafness
- data
- pathogenicity
- scoring
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010011878 Deafness Diseases 0.000 title claims abstract description 81
- 208000016354 hearing loss disease Diseases 0.000 title claims abstract description 81
- 231100000895 deafness Toxicity 0.000 title claims abstract description 80
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 76
- 230000007918 pathogenicity Effects 0.000 title claims abstract description 56
- 238000012216 screening Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000007614 genetic variation Effects 0.000 claims abstract description 22
- 230000002068 genetic effect Effects 0.000 claims description 38
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 108700028369 Alleles Proteins 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 8
- 201000010099 disease Diseases 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000002939 deleterious effect Effects 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 229910052710 silicon Inorganic materials 0.000 claims description 4
- 239000010703 silicon Substances 0.000 claims description 4
- 238000005204 segregation Methods 0.000 claims description 3
- 230000001717 pathogenic effect Effects 0.000 abstract description 8
- 230000035772 mutation Effects 0.000 description 10
- 230000007067 DNA methylation Effects 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Physiology (AREA)
- Biophysics (AREA)
- Ecology (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了一种耳聋致病性基因的筛查方法、装置、存储介质及服务器。该耳聋致病性基因的筛查方法包括:接收用户上传的基因变异数据;根据用户选择的注释信息给所述基因变异数据做注释;基于预设评分规则给注释结果评分;参照预设等级划分模型给评分结果划分优先等级;根据优先等级确定耳聋致病性。基于等级划分模型筛查出耳聋致病概率,实现了提高耳聋致病性的筛查精确度。本申请解决了由于没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的技术问题。
Description
技术领域
本申请涉及疾病筛查领域,具体而言,涉及一种耳聋致病性基因的筛查方法、装置、存储介质及服务器。
背景技术
发明人发现,耳聋致病大多数与遗传学基因变异相关,一些数据库收录了这些与耳聋相关的基因变异数据,但是并没有构建相应的等级划分模型筛查出耳聋致病概率,导致耳聋致病性的筛查不够精确。
针对相关技术中没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种耳聋致病性基因的筛查方法、装置、存储介质及服务器,以解决没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种耳聋致病性基因的筛查方法。
根据本申请的耳聋致病性基因的筛查方法包括:接收用户上传的基因变异数据;根据用户选择的注释信息给所述基因变异数据做注释;基于预设评分规则给注释结果评分;参照预设等级划分模型给评分结果划分优先等级;根据优先等级确定耳聋致病性。
进一步的,基于预设评分规则给注释结果评分包括:识别注释结果的基因组学数据信息;根据所述基因组学数据信息在预设分值-数据表格中确定在单篇文献中单次出现该种类基因或变异的第一分值;统计该种类基因或变异在单篇文献中的出现次数;将基因组学数据信息、出现次数和第一分值输入预设评分模型,得到该种类基因或变异的总分值。
进一步的,参照预设等级划分模型给评分结果划分优先等级包括:在预设等级划分模型中确定一评分结果所在的分值区域;根据分值-等级表确定与分值区域相对应的置信度等级,作为优先等级。
进一步的,接收用户上传的基因变异数据之前还包括:获取耳聋相关的遗传学数据;给所有遗传学数据做全面注释;基于预设评分规则给全面注释结果评分;参照预设等级划分规则将所有评分结果划分为多个分值区域;根据分值高低给每个分值区域赋予置信度等级。
进一步的,获取耳聋相关的遗传学数据包括:获取在PubMed中的文献数据和用户递交的基因数据;对所述文献数据进行清洗、降噪和同质性处理,得到罕见变异数据;将基因数据和罕见变异数据作为第一遗传学数据,并将遗传相关数据作为第二遗传学数据。
进一步的,注释的内容包括:变异的功能影响;变异和基因水平影响的疾病和表型相关信息;硅预测算法的结果;公共数据库不同人群等位基因频率;有意义的基因水平信息;药物-基因相互作用和精准药物能力。
进一步的,供用户选择的注释信息包括以下的一种或多种:参考基因组、剪接阈值和变异水平、识别共分离、基本信息、错义变异的致病性预测、不同群体中的等位基因频率、相关临床数据库、罕见有害变异。
为了实现上述目的,根据本申请的另一方面,提供了一种耳聋致病性筛查装置。
根据本申请的耳聋致病性筛查装置包括:接收模块,用于接收用户上传的基因变异数据;注释模块,用于根据用户选择的注释信息给所述基因变异数据做注释;评分模块,用于基于预设评分规则给注释结果评分;划分模块,用于参照预设等级划分模型给评分结果划分优先等级;确定模块,用于根据优先等级确定耳聋致病性。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机可读存储介质。
根据本申请的计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项所述的耳聋致病性基因的筛查方法。
为了实现上述目的,根据本申请的另一方面,提供了一种服务器。
根据本申请的服务器,包括:存储器和处理器,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行上述任一项所述的耳聋致病性基因的筛查方法。
在本申请实施例中,采用耳聋致病性筛查的方式,通过接收用户上传的基因变异数据;根据用户选择的注释信息给所述基因变异数据做注释;基于预设评分规则给注释结果评分;参照预设等级划分模型给评分结果划分优先等级;根据优先等级确定耳聋致病性,达到了基于等级划分模型筛查出耳聋致病概率的目的,从而实现了提高耳聋致病性的筛查精确度的技术效果,进而解决了由于没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的耳聋致病性基因的筛查方法的流程示意图;
图2是根据本申请实施例的耳聋致病性基因的筛查装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本发明实施例,提供了一种耳聋致病性基因的筛查方法,如图1所示,该方法包括如下的步骤S101至步骤S105:
步骤S101、接收用户上传的基因变异数据;
利用基于PHP的网络编程框架Lavarel搭建在线分析框架,如此,人员可以通过手机、电脑等安装相应应用处理软件,在软件界面内操作可以上传需要分析的基因变异数据。
本实施例中,优选的,上传的基因变异数据的格式支持VCF格式。也可以是支持其他格式,在此不做赘述。
步骤S102、根据用户选择的注释信息给所述基因变异数据做注释;
上传相应格式的基因变异数据后,在该软件界面中,用户还可以通过点击的形式选择注释信息(不同的注释软件),具体地,供用户选择的注释信息包括以下的一种或多种:参考基因组、剪接阈值和变异水平、识别共分离、基本信息、错义变异的致病性预测、不同群体中的等位基因频率、相关临床数据库、罕见有害变异。选择不同的注释信息,能够产生不同的注释结果,从而影响后续对该基因变异数据的评分。
本实施例中,注释的内容包括:变异的功能影响;变异和基因水平影响的疾病和表型相关信息;硅预测算法的结果;公共数据库不同人群等位基因频率;有意义的基因水平信息;药物-基因相互作用和精准药物能力。
步骤S103、基于预设评分规则给注释结果评分;
在服务器上预先配置了评分规则,能够给注释后的基因变异数据进行评分;具体地,基于预设评分规则给注释结果评分包括:识别注释结果的基因组学数据信息;根据所述基因组学数据信息在预设分值-数据表格中确定在单篇文献中单次出现该种类基因或变异的第一分值;统计该种类基因或变异在单篇文献中的出现次数;将基因组学数据信息、出现次数和第一分值输入预设评分模型,得到该种类基因或变异的总分值。
采用识别算法,可以识别出注释后的罕见变异数据用户提交的基因数据中的遗传学种类和突变位点;比如:罕见变异可以分为LOF、有害变异、可忍受错义突变、同义变异、非框移、其他变异六种种类,通过算法识别后,可以确定当前被识别的数据是以上哪个种类。
识别结束后,可以根据识别结果从中查出该种类的某个变异或基因的分数;一篇文献中很有可能多次出现该种类的基因或变异,显然也会影响最终的总分值计算,因此,进行以每篇为单位进行了出现次数的统计,最终将次数、突变位点 (在哪个位置发生突变)输入评分模型,能够计算得到该基因变异数据在某个位置的总分值,该分值可以一定程度的反应耳聋致病概率,一般认为分数越高,患病的概率越大,基于此可以实现耳聋致病概率判断。
步骤S104、参照预设等级划分模型给评分结果划分优先等级;
步骤S105、根据优先等级确定耳聋致病性。
在服务器还预设了等级划分模型,用于给评分结果划分优先等级。具体地,参照预设等级划分模型给评分结果划分优先等级包括:在预设等级划分模型中确定一评分结果所在的分值区域;根据分值-等级表确定与分值区域相对应的置信度等级,作为优先等级;最后根据优先等级确定耳聋致病性。如此实现了对分值的分级,根据不同的等级,人员可以具体判断出耳聋致病概率。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用耳聋致病性筛查的方式,通过接收用户上传的基因变异数据;根据用户选择的注释信息给所述基因变异数据做注释;基于预设评分规则给注释结果评分;参照预设等级划分模型给评分结果划分优先等级;根据优先等级确定耳聋致病性,达到了基于等级划分模型筛查出耳聋致病概率的目的,从而实现了提高耳聋致病性的筛查精确度的技术效果,进而解决了由于没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的技术问题。
根据本发明实施例,优选的,接收用户上传的基因变异数据之前还包括:
获取耳聋相关的遗传学数据;
给所有遗传学数据做全面注释;
基于预设评分规则给全面注释结果评分;
参照预设等级划分规则将所有评分结果划分为多个分值区域;
根据分值高低给每个分值区域赋予置信度等级。
在分析基因变异数据之前,首先需要将相关的遗传学数据录入,并建立相应的数据库;并且使用所有注释信息(注释软件)对所有遗传学数据逐个进行注释,最终完成全面注释;然后采用相同的预设评分规则给每个注释结果进行评分,得到与所有注释结果相对应的多个分值;分数越高,患病的概率越大;基于此逻辑,可以划分五个区域,高分区域、中高分区域、中分区域、中低分区域、低分区域;再将置信度等级和这五个分值区域相关联,高分区域对应高置信度患耳聋,根据以上的五个区域置信度等级依次递减,如此,使人员可以从中查看自己的提供的基因是否存在关联,进而判断帕金森患病概率。
根据本发明实施例,优选的,获取耳聋相关的遗传学数据包括:
获取在PubMed中的文献数据和用户递交的基因数据;
对所述文献数据进行清洗、降噪和同质性处理,得到罕见变异数据;
将基因数据和罕见变异数据作为第一遗传学数据,并将遗传相关数据作为第二遗传学数据。
PubMed是指收录相关数据信息的文献数据库;采用接口与PubMed建立连接,从而可以从中获取文献数据。基因数据由用户通过APP或电脑软件上传到服务器,再由服务器存储。文献数据中包含了不是很多类型的数据,有一大部分不是本发明需要的数据,也有数据类型不兼容的情况,因此,对获取的文献数据进行清洗、降噪、同质性处理,获取得到罕见变异数据,使获取得到的数据更为精确,以方便数据在下一步中的使用。
本实施例中,罕见变异数据为第一遗传学数据,这些数据需要配合软件、算法进行注释;即需要注释后再打分的数据归为第一遗传学数据,等待注释并打分。
本实施例中,用户提交的基因数据为第二遗传学数据,这些数据无需注释后再打分;直接可运用于下一步的等级划分中。
第二遗传学数据包括但不限于,罕见变异、单核苷酸多态性、拷贝数变异、差异表达基因、DNA甲基化基因等数据。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述耳聋致病性基因的筛查方法的装置,如图2所示,该装置包括:
接收模块10,用于接收用户上传的基因变异数据;
利用基于PHP的网络编程框架Lavarel搭建在线分析框架,如此,人员可以通过手机、电脑等安装相应应用处理软件,在软件界面内操作可以上传需要分析的基因变异数据。
本实施例中,优选的,上传的基因变异数据的格式支持VCF格式。也可以是支持其他格式,在此不做赘述。
注释模块20,用于根据用户选择的注释信息给所述基因变异数据做注释;
上传相应格式的基因变异数据后,在该软件界面中,用户还可以通过点击的形式选择注释信息(不同的注释软件),具体地,供用户选择的注释信息包括以下的一种或多种:参考基因组、剪接阈值和变异水平、识别共分离、基本信息、错义变异的致病性预测、不同群体中的等位基因频率、相关临床数据库、罕见有害变异。选择不同的注释信息,能够产生不同的注释结果,从而影响后续对该基因变异数据的评分。
本实施例中,注释的内容包括:变异的功能影响;变异和基因水平影响的疾病和表型相关信息;硅预测算法的结果;公共数据库不同人群等位基因频率;有意义的基因水平信息;药物-基因相互作用和精准药物能力。
评分模块30,用于基于预设评分规则给注释结果评分;
在服务器上预先配置了评分规则,能够给注释后的基因变异数据进行评分;具体地,基于预设评分规则给注释结果评分包括:识别注释结果的基因组学数据信息;根据所述基因组学数据信息在预设分值-数据表格中确定在单篇文献中单次出现该种类基因或变异的第一分值;统计该种类基因或变异在单篇文献中的出现次数;将基因组学数据信息、出现次数和第一分值输入预设评分模型,得到该种类基因或变异的总分值。
采用识别算法,可以识别出注释后的罕见变异数据用户提交的基因数据中的遗传学种类和突变位点;比如:罕见变异可以分为LOF、有害变异、可忍受错义突变、同义变异、非框移、其他变异六种种类,通过算法识别后,可以确定当前被识别的数据是以上哪个种类。
识别结束后,可以根据识别结果从中查出该种类的某个变异或基因的分数;一篇文献中很有可能多次出现该种类的基因或变异,显然也会影响最终的总分值计算,因此,进行以每篇为单位进行了出现次数的统计,最终将次数、突变位点 (在哪个位置发生突变)输入评分模型,能够计算得到该基因变异数据在某个位置的总分值,该分值可以一定程度的反应耳聋致病概率,一般认为分数越高,患病的概率越大,基于此可以实现耳聋致病概率判断。
划分模块40,用于参照预设等级划分模型给评分结果划分优先等级;
确定模块50,用于根据优先等级确定耳聋致病性。
在服务器还预设了等级划分模型,用于给评分结果划分优先等级。具体地,参照预设等级划分模型给评分结果划分优先等级包括:在预设等级划分模型中确定一评分结果所在的分值区域;根据分值-等级表确定与分值区域相对应的置信度等级,作为优先等级;最后根据优先等级确定耳聋致病性。如此实现了对分值的分级,根据不同的等级,人员可以具体判断出耳聋致病概率。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用耳聋致病性筛查的方式,通过接收用户上传的基因变异数据;根据用户选择的注释信息给所述基因变异数据做注释;基于预设评分规则给注释结果评分;参照预设等级划分模型给评分结果划分优先等级;根据优先等级确定耳聋致病性,达到了基于等级划分模型筛查出耳聋致病概率的目的,从而实现了提高耳聋致病性的筛查精确度的技术效果,进而解决了由于没有构建相应的等级划分模型筛查出耳聋致病概率造成的耳聋致病性的筛查不够精确的技术问题。
根据本发明实施例,优选的,接收用户上传的基因变异数据之前还包括:
获取耳聋相关的遗传学数据;
给所有遗传学数据做全面注释;
基于预设评分规则给全面注释结果评分;
参照预设等级划分规则将所有评分结果划分为多个分值区域;
根据分值高低给每个分值区域赋予置信度等级。
在分析基因变异数据之前,首先需要将相关的遗传学数据录入,并建立相应的数据库;并且使用所有注释信息(注释软件)对所有遗传学数据逐个进行注释,最终完成全面注释;然后采用相同的预设评分规则给每个注释结果进行评分,得到与所有注释结果相对应的多个分值;分数越高,患病的概率越大;基于此逻辑,可以划分五个区域,高分区域、中高分区域、中分区域、中低分区域、低分区域;再将置信度等级和这五个分值区域相关联,高分区域对应高置信度患耳聋,根据以上的五个区域置信度等级依次递减,如此,使人员可以从中查看自己的提供的基因是否存在关联,进而判断帕金森患病概率。
根据本发明实施例,优选的,获取耳聋相关的遗传学数据包括:
获取在PubMed中的文献数据和用户递交的基因数据;
对所述文献数据进行清洗、降噪和同质性处理,得到罕见变异数据;
将基因数据和罕见变异数据作为第一遗传学数据,并将遗传相关数据作为第二遗传学数据。
PubMed是指收录相关数据信息的文献数据库;采用接口与PubMed建立连接,从而可以从中获取文献数据。基因数据由用户通过APP或电脑软件上传到服务器,再由服务器存储。文献数据中包含了不是很多类型的数据,有一大部分不是本发明需要的数据,也有数据类型不兼容的情况,因此,对获取的文献数据进行清洗、降噪、同质性处理,获取得到罕见变异数据,使获取得到的数据更为精确,以方便数据在下一步中的使用。
本实施例中,罕见变异数据为第一遗传学数据,这些数据需要配合软件、算法进行注释;即需要注释后再打分的数据归为第一遗传学数据,等待注释并打分。
本实施例中,用户提交的基因数据为第二遗传学数据,这些数据无需注释后再打分;直接可运用于下一步的等级划分中。
第二遗传学数据包括但不限于,罕见变异、单核苷酸多态性、拷贝数变异、差异表达基因、DNA甲基化基因等数据。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种耳聋致病性基因的筛查方法,其特征在于,包括:
接收用户上传的基因变异数据;
根据用户选择的注释信息给所述基因变异数据做注释;
基于预设评分规则给注释结果评分;
参照预设等级划分模型给评分结果划分优先等级;
根据优先等级确定耳聋致病性。
2.根据权利要求1所述的耳聋致病性基因的筛查方法,其特征在于,基于预设评分规则给注释结果评分包括:
识别注释结果的基因组学数据信息;
根据所述基因组学数据信息在预设分值-数据表格中确定在单篇文献中单次出现该种类基因或变异的第一分值;
统计该种类基因或变异在单篇文献中的出现次数;
将基因组学数据信息、出现次数和第一分值输入预设评分模型,得到该种类基因或变异的总分值。
3.根据权利要求1所述的耳聋致病性基因的筛查方法,其特征在于,参照预设等级划分模型给评分结果划分优先等级包括:
在预设等级划分模型中确定一评分结果所在的分值区域;
根据分值-等级表确定与分值区域相对应的置信度等级,作为优先等级。
4.根据权利要求1所述的耳聋致病性基因的筛查方法,其特征在于,接收用户上传的基因变异数据之前还包括:
获取耳聋相关的遗传学数据;
给所有遗传学数据做全面注释;
基于预设评分规则给全面注释结果评分;
参照预设等级划分规则将所有评分结果划分为多个分值区域;
根据分值高低给每个分值区域赋予置信度等级。
5.根据权利要求4所述的耳聋致病性基因的筛查方法,其特征在于,获取耳聋相关的遗传学数据包括:
获取在PubMed中的文献数据和用户递交的基因数据;
对所述文献数据进行清洗、降噪和同质性处理,得到罕见变异数据;
将基因数据和罕见变异数据作为第一遗传学数据,并将遗传相关数据作为第二遗传学数据。
6.根据权利要求1或4所述的耳聋致病性基因的筛查方法,其特征在于,注释的内容包括:
变异的功能影响;变异和基因水平影响的疾病和表型相关信息;硅预测算法的结果;公共数据库不同人群等位基因频率;有意义的基因水平信息;药物-基因相互作用和精准药物能力。
7.根据权利要求1所述的耳聋致病性基因的筛查方法,其特征在于,供用户选择的注释信息包括以下的一种或多种:参考基因组、剪接阈值和变异水平、识别共分离、基本信息、错义变异的致病性预测、不同群体中的等位基因频率、相关临床数据库、罕见有害变异。
8.一种耳聋致病性基因的筛查装置,其特征在于,包括:
接收模块,用于接收用户上传的基因变异数据;
注释模块,用于根据用户选择的注释信息给所述基因变异数据做注释;
评分模块,用于基于预设评分规则给注释结果评分;
划分模块,用于参照预设等级划分模型给评分结果划分优先等级;
确定模块,用于根据优先等级确定耳聋致病性。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7中任一项所述的耳聋致病性基因的筛查方法。
10.一种服务器,包括:存储器和处理器,其特征在于,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7中任一项所述的耳聋致病性基因的筛查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210051508.9A CN114496080A (zh) | 2022-01-17 | 2022-01-17 | 耳聋致病性基因的筛查方法、装置、存储介质及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210051508.9A CN114496080A (zh) | 2022-01-17 | 2022-01-17 | 耳聋致病性基因的筛查方法、装置、存储介质及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114496080A true CN114496080A (zh) | 2022-05-13 |
Family
ID=81511763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210051508.9A Pending CN114496080A (zh) | 2022-01-17 | 2022-01-17 | 耳聋致病性基因的筛查方法、装置、存储介质及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114496080A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108592A (zh) * | 2017-12-29 | 2018-06-01 | 北京聚道科技有限公司 | 一种用于遗传变异致病性打分的机器学习模型的构建方法 |
CN109524060A (zh) * | 2018-11-19 | 2019-03-26 | 江苏科技大学 | 一种遗传病风险提示的基因测序数据处理系统与处理方法 |
CN110379458A (zh) * | 2019-07-15 | 2019-10-25 | 中国人民解放军陆军军医大学第一附属医院 | 致病性变异位点判定方法、装置、计算机设备及存储介质 |
CN111192626A (zh) * | 2019-12-31 | 2020-05-22 | 中南大学湘雅医院 | 帕金森病基因组学关联模型的构建方法、装置、服务器及存储介质 |
CN111863132A (zh) * | 2019-04-29 | 2020-10-30 | 广州欧蒙未一医学检验实验室有限公司 | 一种筛选致病性变异的方法和系统 |
CN112489727A (zh) * | 2020-12-24 | 2021-03-12 | 厦门基源医疗科技有限公司 | 一种快速获取罕见病致病位点的方法和系统 |
-
2022
- 2022-01-17 CN CN202210051508.9A patent/CN114496080A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108592A (zh) * | 2017-12-29 | 2018-06-01 | 北京聚道科技有限公司 | 一种用于遗传变异致病性打分的机器学习模型的构建方法 |
CN109524060A (zh) * | 2018-11-19 | 2019-03-26 | 江苏科技大学 | 一种遗传病风险提示的基因测序数据处理系统与处理方法 |
CN111863132A (zh) * | 2019-04-29 | 2020-10-30 | 广州欧蒙未一医学检验实验室有限公司 | 一种筛选致病性变异的方法和系统 |
CN110379458A (zh) * | 2019-07-15 | 2019-10-25 | 中国人民解放军陆军军医大学第一附属医院 | 致病性变异位点判定方法、装置、计算机设备及存储介质 |
CN111192626A (zh) * | 2019-12-31 | 2020-05-22 | 中南大学湘雅医院 | 帕金森病基因组学关联模型的构建方法、装置、服务器及存储介质 |
CN112489727A (zh) * | 2020-12-24 | 2021-03-12 | 厦门基源医疗科技有限公司 | 一种快速获取罕见病致病位点的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Carmi et al. | Sequencing an Ashkenazi reference panel supports population-targeted personal genomics and illuminates Jewish and European origins | |
Guo et al. | Estimating yields of prenatal carrier screening and implications for design of expanded carrier screening panels | |
Raychaudhuri et al. | Basic microarray analysis: grouping and feature reduction | |
RU2764557C1 (ru) | Способы и системы для трансформаций матриц, основанных на разреженных векторах | |
US20150227685A1 (en) | Systems and methods for analyzing sequence data | |
US20210174895A1 (en) | Cross-network genomic data user interface | |
Nevado et al. | Resequencing studies of nonmodel organisms using closely related reference genomes: optimal experimental designs and bioinformatics approaches for population genomics | |
KR102508971B1 (ko) | 질병 위험도 예측 방법 및 이를 수행하는 장치 | |
CN111312334B (zh) | 一种影响细胞间通讯的受体-配体系统分析方法 | |
KR20170047037A (ko) | 임상 및 바이오 정보 통합 질병 예후예측 시스템 및 방법 | |
CN111883210B (zh) | 基于临床特征和序列变异的单基因病名称推荐方法及系统 | |
Mutarelli et al. | A community-based resource for automatic exome variant-calling and annotation in Mendelian disorders | |
Zhang et al. | EnsembleCNV: an ensemble machine learning algorithm to identify and genotype copy number variation using SNP array data | |
CN114334078B (zh) | 用于推荐药物的方法、电子设备和计算机存储介质 | |
CN113555062A (zh) | 一种用于基因组碱基变异检测的数据分析系统及分析方法 | |
Cabanski et al. | ReQON: a Bioconductor package for recalibrating quality scores from next-generation sequencing data | |
Thareja et al. | Differences and commonalities in the genetic architecture of protein quantitative trait loci in European and Arab populations | |
Li et al. | Network module detection: affinity search technique with the multi-node topological overlap measure | |
Machiela et al. | GWAS Explorer: an open-source tool to explore, visualize, and access GWAS summary statistics in the PLCO Atlas | |
US20200134136A1 (en) | Cross-network genomic data user interface | |
CN107480468B (zh) | 基因样本分析方法及电子设备 | |
Karp et al. | Improving the identification of phenotypic abnormalities and sexual dimorphism in mice when studying rare event categorical characteristics | |
CN114496080A (zh) | 耳聋致病性基因的筛查方法、装置、存储介质及服务器 | |
CN111192626A (zh) | 帕金森病基因组学关联模型的构建方法、装置、服务器及存储介质 | |
CN116543911A (zh) | 一种疾病风险预测模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220513 |
|
RJ01 | Rejection of invention patent application after publication |