CN113921089B - 一种用于确认ivd基因注释数据库更新频率的方法及系统 - Google Patents

一种用于确认ivd基因注释数据库更新频率的方法及系统 Download PDF

Info

Publication number
CN113921089B
CN113921089B CN202111390311.XA CN202111390311A CN113921089B CN 113921089 B CN113921089 B CN 113921089B CN 202111390311 A CN202111390311 A CN 202111390311A CN 113921089 B CN113921089 B CN 113921089B
Authority
CN
China
Prior art keywords
database
gene
version
sites
stability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111390311.XA
Other languages
English (en)
Other versions
CN113921089A (zh
Inventor
果海池
杨鹏程
曹彦东
周洋
杨颖�
马懿
宓开拓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Anzhiyin Biotechnology Co ltd
Original Assignee
Beijing Anzhiyin Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Anzhiyin Biotechnology Co ltd filed Critical Beijing Anzhiyin Biotechnology Co ltd
Priority to CN202111390311.XA priority Critical patent/CN113921089B/zh
Publication of CN113921089A publication Critical patent/CN113921089A/zh
Application granted granted Critical
Publication of CN113921089B publication Critical patent/CN113921089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及生物信息学技术领域,具体公开一种用于确认IVD基因注释数据库的更新频率的方法,该方法能够为IVD基因注释相关软件的基因数据库更新频率提供理论依据。

Description

一种用于确认IVD基因注释数据库更新频率的方法及系统
技术领域
本申请涉及生物信息学领域,具体涉及一种用于确认IVD基因注释数据库更新频率的方法及系统。
背景技术
“IVD”全名“in vitro diagnostic products”,中文译为体外诊断产品,IVD是指医疗器械、体外诊断试剂以及药品或软件,IVD作为医疗器械的分支,有特有的界定和法规监管。
随着科技不断发展,越来越多的基因诊断试剂盒和数据分析软件等IVD产品被开发和应用于临床诊断,其中有一类数据分析软件用于基因变异位点的信息注释,提供变异位点的位点信息及相关疾病信息。此类数据分析软件只有使用最新的数据库来注释变异位点信息,才能保证后续的变异解读结果的准确性。遗憾的是,IVD产品要求产品本身必须稳定可靠,一旦发生临床功能的重大变更则需要变更注册,也就是说对于基因注释软件,不更新数据库或更新不及时都将降低解读结果的准确性。然而现有的更新数据库通常需要变更注册,频繁的变更注册对企业来说是很大的负担。因此,确定一个合理的基因注释数据库更新频率显得至关重要。
有鉴于此,提出本申请。
发明内容
为了解决上述技术问题,本申请的首要目的是提供用于确认IVD基因注释数据库更新频率的方法及系统。
为实现上述发明目的,本申请采用的技术方案如下:
本申请首先提供一种用于确认IVD基因注释数据库的更新频率的方法,方法包括如下步骤:
步骤1):选取数据库,获取数据库近几年的历次更新版本;
步骤2):在各版本数据库中,提取特定基因相关信息,筛选特定基因变异位点,将变异位点输出成新的文件;
步骤3):将步骤2)输出的文件,按数据库版本进行整理,形成基因注释数据库;
步骤4):分别统计各版本数据库中特定基因的变异位点数量与最新版本数据库中基因的变异位点数量,计算新增率;
步骤5):分别统计各版本数据库中特定基因的变异位点与最新版本数据库中基因的变异位点的更新数量,计算更新率;
步骤6):在步骤4)和5)基础上,定义数据库的稳定性,计算各版本数据库的稳定性;
步骤7):根据步骤6)的结果,结合对数据库稳定性的要求,确定数据库更新频率。
上述步骤4)-7)所述数据库为基因注释数据库。
进一步的,步骤1)中,所述数据库包括但不限于ClinVar数据库、HGMD数据库、GnomAD数据库、dbNSFP数据库、Pfam数据库、COSMIC数据库;所述近几年为近1-10年。
进一步的,步骤2)中,所述筛选出特定基因的变异位点为:首先将数据库以文本方式打开,然后根据数据库染色体和物理位置筛选特定基因的变异位点;所述变异包括但不限于SNP、InDel、SV。
进一步的,步骤3)中,所述数据库整理的格式标准应与原数据库一致,同时标记各数据库版本的更新时间。
进一步的,步骤4)中,所述新增率=(所述最新版本数据库中基因的变异位点数量-旧版本数据库中的基因变异位点数量)/旧版本数据库中的基因变异位点数量*100%;
进一步的,步骤5)中,所述更新率=数据库中更新的基因变异位点数量/旧版本数据库中的基因变异位点数量*100%;
进一步的,步骤6)进一步包括,以各版本数据库更新时间为横轴,稳定性为纵轴,作图。
进一步的,步骤6)中,所述稳定性=(1-新增率)*0.5+(1-更新率)*0.5。
进一步的,步骤7)中,所述更新频率=数据库最新版本时间-达到数据库稳定性要求的版式时间。
进一步的,上述所述特定基因可以为单个特定基因或多个特定基因。
本申请还提供一种用于确认IVD基因注释数据库的更新频率的系统,所述方法包括如下模块:
模块1):用于选取数据库,获取数据库近几年的历次更新版本;
在各版本数据库中,提取特定基因相关信息,筛选特定基因变异位点,将变异位点输出成新的文件,形成基因注释数据库;
模块3):用于将步骤2)输出的文件,按数据库版本进行整理;
模块4):用于分别统计各版本数据库中特定基因的变异位点数量与最新版本数据库中基因的变异位点数量,计算新增率;
模块5):用于分别统计各版本数据库中特定基因的变异位点与最新版本数据库中基因的变异位点的更新数量,计算更新率;
模块6):用于在步骤4)和5)基础上,定义数据库的稳定性,计算各版本数据库的稳定性;
模块7):用于根据步骤6)的结果,结合对数据库稳定性的要求,确定数据库更新频率。
进一步的,模块1)中,所述数据库包括但不限于ClinVar数据库、HGMD数据库、GnomAD数据库、dbNSFP数据库、Pfam数据库、COSMIC数据库;所述近几年为近1-10年。
进一步的,模块2)中,所述筛选出特定基因的变异位点为:首先将数据库以文本方式打开,然后根据数据库染色体和物理位置筛选特定基因的变异位点。
进一步的,步骤3)中,所述数据库整理的格式标准应与原数据库一致,同时标记好各数据库版本的更新时间。
进一步的,模块4)中,所述新增率=(所述最新版本数据库中基因的变异位点数量-旧版本数据库中的基因变异位点数量)/旧版本数据库中的基因变异位点数量*100%;
进一步的,模块5)中,所述更新率=数据库中更新的基因变异位点数量/旧版本数据库中的基因变异位点数量*100%;
进一步的,模块6)进一步包括,以各版本数据库更新时间为横轴,稳定性为纵轴,作图。
进一步的,模块6)中,所述稳定性=(1-新增率)*0.5+(1-更新率)*0.5。
进一步的,模块7)中,所述更新频率=数据库最新版本时间-达到数据库稳定性要求的版式时间。
进一步的,上述所述特定基因可以为单个特定基因或多个特定基因。
本申请还提供一种电子设备,包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行上述任一项所述的方法。
本申请还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如上述任一项所述的方法。
本申请有益的技术效果
本申请通过上述方法或系统,能够帮助用户确认IVD基因注释数据库的更新频率,为IVD基因注释相关软件的基因数据库更新频率提供理论依据,从而保证了数据分析软件解读结果的准确性问题。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1、单基因数据库的更新频率研究方法示意图;
图2、数据库时间-稳定性关系表(FBN1基因);
图3、数据库时间-稳定性关系表(BRCA1基因)。
具体实施方式
下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下术语或定义仅仅是为了帮助理解本申请而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
除非在下文中另有定义,本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本申请。
如本申请中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
本申请中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语
在适当的环境下可互换,并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。
如下为本申请的具体实施例。
实施例1本申请方法确立
为了确认基因注释数据库的更新频率,本申请公开了一种研究方法,该研究方法适用于确认单基因数据库的更新频率,同时亦适用于确认多基因数据库(多基因panel或全部基因)的更新频率。其中,确认单基因注释数据库的更新频率的研究方法,步骤如下:
步骤一:选取数据库ClinVar(本方案仅以ClinVar数据库作为研究示例,可选取的数据库包括但不限于此数据库),获取这些数据近5年的历次更新版本(可选取的年限包括但不限于5年);
步骤二:选取FBN1基因(本方案仅以FBN1基因作为研究示例,可选取的基因包括但不限于此基因);
步骤三:在ClinVar的各版本数据库中,提取步FBN1基因的相关信息,首先将数据库以文本方式打开,然后根据数据库染色体和物理位置筛选FBN1基因的变异位点,将这些变异位点输出成新的文件;
步骤四:将步骤三输出的结果,按数据库版本进行整理;
步骤五:分别统计各版本数据库中基因的变异位点数量与最新版本数据库中基因的变异位点数量计算新增率:(最新版本数据库中基因的变异位点数量-旧版本数据库中的基因变异位点数量)/旧版本数据库中的基因变异位点数量*100%。
步骤六:分别统计各版本数据库中基因的变异位点与最新版本数据库中基因的变异位点的更新数量计算更新率:数据库中更新的基因变异位点数量/旧版本数据库中的基因变异位点数量*100%。
步骤七:在步骤五和步骤六的基础上,定义数据库的稳定性:(1-新增率)*0.5+(1-更新率)*0.5,计算各版本数据库的稳定性,并以各版本数据库更新时间为横轴,稳定性为纵轴,作图。
步骤八:根据步骤七数据及图表,结合自身对数据库稳定性的要求,确定数据库更新的频率。例如:研究者需要数据库稳定性达到90%,数据库稳定性达到90%的时间为2021.6,最新版本数据库时间为2021.10,则数据库的更新频率为4个月,即数据库需要每4个月更新一次。
当确认多基因数据库(多基因panel或全部基因)的更新频率时,可采取上述方式,分别对每个基因进行研究,最终以更新频率最快的基因为标准,确定多基因数据库(多基因panel或全部基因)的更新频率。
实施例2本申请方法的性能验证
根据本上述实施例1确立的技术方案,选取ClinVar数据库中FBN1基因近五年的更新内容,整理数据后,统计新增率和更新率,并计算数据库稳定性,设定数据库稳定性要求为90%,结合数据及图表最终确认针对FBN1数据库的更新频率为4个月/次(参见图2)。
为进一步验证实施例1的技术方案,另选取ClinVar数据库中BRCA1基因近五年的更新内容,整理数据后,统计新增率和更新率,并计算数据库稳定性,设定数据库稳定性要求为70%,结合数据及图表最终确认针对BRCA1数据库的更新频率为12个月/次(参见图3)。
前述对本申请的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本申请限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本申请的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本申请的各种不同的示例性实施方案以及各种不同的选择和改变。本申请的范围意在由权利要求书及其等同形式所限定。

Claims (9)

1.一种用于确认IVD基因注释数据库的更新频率的方法,其特征在于,所述方法包括如下步骤:
步骤1):选取数据库,获取数据库近几年的历次更新版本;
步骤2):在各版本数据库中,提取特定基因相关信息,筛选特定基因变异位点,将变异位点输出成新的文件;
步骤3):将步骤2)输出的文件,按数据库版本进行整理,形成基因注释数据库;
步骤4):分别统计各版本数据库中基因的变异位点数量与最新版本数据库中基因的变异位点数量,计算新增率;
步骤5):分别统计各版本数据库中特定基因的变异位点与最新版本数据库中基因的变异位点的更新数量,计算更新率;
步骤6):在步骤4)和5)基础上,定义数据库的稳定性,计算各版本数据库的稳定性;
步骤7):根据步骤6)的结果,结合对数据库稳定性要求,确定数据库更新频率;
所述步骤4)中,所述新增率=(所述最新版本数据库中基因的变异位点数量-旧版本数据库中的基因变异位点数量)/ 旧版本数据库中的基因变异位点数量 * 100%;
所述步骤5)中,所述更新率=数据库中更新的基因变异位点数量/旧版本数据库中的基因变异位点数量*100%;
所述步骤6)中,所述稳定性=(1-新增率)*0.5+(1-更新率)*0.5;
所述步骤7)中,所述更新频率=数据库最新版本时间-达到数据库稳定性要求的版式时间。
2.根据权利要求1所述的方法,其特征在于,所述数据库包括但不限于ClinVar数据库、HGMD数据库、GnomAD数据库、dbNSFP数据库、Pfam数据库、COSMIC数据库;所述近几年为近1-10年。
3.根据权利要求1所述的方法,其特征在于,所述步骤2)中,所述筛选出特定基因的变异位点为:首先将数据库以文本方式打开,然后根据数据库中染色体和物理位置筛选特定基因的变异位点。
4.根据权利要求3所述的方法,其特征在于,所述变异包括但不限于SNP、InDel和SV。
5.权利要求1-4任一所述的方法,其特征在于,所述步骤6)进一步包括:以各版本数据库更新时间为横轴,稳定性为纵轴,作图。
6.权利要求1-4任一所述的方法,其特征在于,所述特定基因为单个特定基因或多个特定基因。
7.一种用于确认IVD基因注释数据库的更新频率的系统,其特征在于,所述系统包括如下模块:
模块1):用于选取数据库,获取数据库近几年的历次更新版本;
在各版本数据库中,提取特定基因相关信息,筛选特定基因变异位点,将变异位点输出成新的文件;
模块3):用于将步骤2)输出的文件,按数据库版本进行整理,形成基因注释数据库;
模块4):用于分别统计各版本数据库中特定基因的变异位点数量与最新版本数据库中基因的变异位点数量,计算新增率;
模块5):用于分别统计各版本数据库中特定基因的变异位点与最新版本数据库中基因的变异位点的更新数量,计算更新率;
模块6):用于在步骤4)和5)基础上,定义数据库的稳定性,计算各版本数据库的稳定性;
模块7):用于根据步骤6)的结果,结合对数据库稳定性的要求,确定数据库更新频率;
所述模块4)中,所述新增率=(所述最新版本数据库中基因的变异位点数量-旧版本数据库中的基因变异位点数量)/ 旧版本数据库中的基因变异位点数量 * 100%;
所述模块5)中,所述更新率=数据库中更新的基因变异位点数量/旧版本数据库中的基因变异位点数量*100%;
所述模块6)中,所述稳定性=(1-新增率)*0.5+(1-更新率)*0.5;
所述模块7)中,所述更新频率=数据库最新版本时间-达到数据库稳定性要求的版式时间。
8.一种电子设备,其特征在于,包括:处理器和存储器;所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-6任一项所述的方法。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-6任一项所述的方法。
CN202111390311.XA 2021-11-22 2021-11-22 一种用于确认ivd基因注释数据库更新频率的方法及系统 Active CN113921089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111390311.XA CN113921089B (zh) 2021-11-22 2021-11-22 一种用于确认ivd基因注释数据库更新频率的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111390311.XA CN113921089B (zh) 2021-11-22 2021-11-22 一种用于确认ivd基因注释数据库更新频率的方法及系统

Publications (2)

Publication Number Publication Date
CN113921089A CN113921089A (zh) 2022-01-11
CN113921089B true CN113921089B (zh) 2022-04-08

Family

ID=79247629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111390311.XA Active CN113921089B (zh) 2021-11-22 2021-11-22 一种用于确认ivd基因注释数据库更新频率的方法及系统

Country Status (1)

Country Link
CN (1) CN113921089B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305686A (zh) * 2018-03-08 2018-07-20 百世诺(北京)医疗科技有限公司 一种全自动肥厚型心肌病预后风险分析平台
CN110512007A (zh) * 2019-09-03 2019-11-29 深圳市慧思基因科技有限公司 一种对犬类基因位点集合数据库
CN110569311A (zh) * 2019-10-30 2019-12-13 上海商魁信息科技有限公司 一种数据库的数据同步方法、设备和计算机存储介质
CN110931084A (zh) * 2018-08-31 2020-03-27 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014052909A2 (en) * 2012-09-27 2014-04-03 The Children's Mercy Hospital System for genome analysis and genetic disease diagnosis
CN105740243B (zh) * 2014-12-08 2018-10-26 深圳华大基因研究院 生物信息数据库的构建方法和装置
EP3437001A1 (en) * 2016-03-29 2019-02-06 Regeneron Pharmaceuticals, Inc. Genetic variant-phenotype analysis system and methods of use
WO2018186930A1 (en) * 2017-04-06 2018-10-11 MyOmicsDx, Inc Method and kit for constructing nucleic acid library
CN107194208B (zh) * 2017-04-25 2020-10-02 荣联科技集团股份有限公司 一种基因分析注释方法和装置
CN111274123B (zh) * 2019-05-14 2025-02-14 上海戎磐网络科技有限公司 基于软件基因的安全防护软件测试集自动生成方法、架构
US11061548B1 (en) * 2019-10-18 2021-07-13 Splunk Inc. Context-sensitive user interfaces in an information technology (IT) and security operations application
US20210334645A1 (en) * 2020-04-28 2021-10-28 Nvidia Corporation Notifications determined using one or more neural networks
CN112420130A (zh) * 2020-11-03 2021-02-26 上海美吉生物医药科技有限公司 基于kegg数据库的注释方法、装置、设备和介质
CN112532630B (zh) * 2020-11-30 2021-09-24 广州瘦吧网络科技有限公司 基于算法、5g和区块链的基因大数据疾病预测系统
CN112863606B (zh) * 2021-03-08 2022-07-26 杭州微数生物科技有限公司 细菌鉴定和分型分析基因组数据库及鉴定和分型分析方法
CN113528614B (zh) * 2021-07-16 2023-05-23 烟台大学 一种植物叶际表面微生物宏基因组检测方法
CN113626567A (zh) * 2021-07-28 2021-11-09 上海基绪康生物科技有限公司 一种从生物医学文献中挖掘基因与疾病相关性信息的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305686A (zh) * 2018-03-08 2018-07-20 百世诺(北京)医疗科技有限公司 一种全自动肥厚型心肌病预后风险分析平台
CN110931084A (zh) * 2018-08-31 2020-03-27 国际商业机器公司 从非结构化文本提取和标准化突变基因用于认知搜索和分析
CN110512007A (zh) * 2019-09-03 2019-11-29 深圳市慧思基因科技有限公司 一种对犬类基因位点集合数据库
CN110569311A (zh) * 2019-10-30 2019-12-13 上海商魁信息科技有限公司 一种数据库的数据同步方法、设备和计算机存储介质

Also Published As

Publication number Publication date
CN113921089A (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
US20240153584A1 (en) Systems and methods for analyzing sequence data
Fortriede et al. Xenbase: deep integration of GEO & SRA RNA-seq and ChIP-seq data in a model organism database
KR101450784B1 (ko) 전자의무기록과 약물/질환 네트워크 정보 기반의 신약 재창출 후보 예측 방법
EP1494156A2 (en) Information management system for managing workflows
CN107194208A (zh) 一种基因分析注释方法和装置
Dutilh et al. Computational pan-genomics: status, promises and challenges
WO2019169452A1 (en) Visualising clinical and genetic data
CN113921089B (zh) 一种用于确认ivd基因注释数据库更新频率的方法及系统
Guo et al. Domain-oriented edge-based alignment of protein interaction networks
CN106778072B (zh) 针对第二代肿瘤基因组高通量测序数据的流程校正方法
CN113377765A (zh) 一种多组学数据分析系统及其数据转换方法
CN115148294B (zh) 一种基于多组学数据进行功能富集分析的分析方法、装置及应用
Liu et al. FungiExp: a user-friendly database and analysis platform for exploring fungal gene expression and alternative splicing
CN116992037A (zh) 多维知识图谱的构建方法、装置、设备及产品
Wang et al. Network modelling of topological domains using Hi-C data
Podkolodnyy et al. Ontologies in bioinformatics and systems biology
EP1503302A9 (en) Information management system for biochemical information
Xu et al. Common network pharmacology databases
Roughan Your Essential Guide to Different File Formats in Bioinformatics
Rafiq et al. Computational method for temporal pattern discovery in biomedical genomic databases
Blum et al. A clinical information display system
CN115295116B (zh) 一种用药点评方法、系统和电子设备
JP2002366594A (ja) 樹状図表示方法
Konopka et al. Comparison of genetic variants in matched samples using thesaurus annotation
CN117453752B (zh) 基于检索配置表数据模型的医院临床数据检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant