CN111276190B - 一种基于生物云平台的动态交互富集分析方法及系统 - Google Patents

一种基于生物云平台的动态交互富集分析方法及系统 Download PDF

Info

Publication number
CN111276190B
CN111276190B CN202010015063.XA CN202010015063A CN111276190B CN 111276190 B CN111276190 B CN 111276190B CN 202010015063 A CN202010015063 A CN 202010015063A CN 111276190 B CN111276190 B CN 111276190B
Authority
CN
China
Prior art keywords
enrichment
gene
dynamic
analysis
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010015063.XA
Other languages
English (en)
Other versions
CN111276190A (zh
Inventor
夏昊强
周煌凯
高川
罗玥
艾鹏
张秋雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Gene Denovo Biotechnology Co ltd
Original Assignee
Guangzhou Gene Denovo Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Gene Denovo Biotechnology Co ltd filed Critical Guangzhou Gene Denovo Biotechnology Co ltd
Priority to CN202010015063.XA priority Critical patent/CN111276190B/zh
Publication of CN111276190A publication Critical patent/CN111276190A/zh
Application granted granted Critical
Publication of CN111276190B publication Critical patent/CN111276190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于生物云平台的动态交互富集分析方法及系统,所述方法包括如下步骤:步骤S1,提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件;步骤S2,根据获得的富集目的基因和背景基因文件在平台进行富集分析;步骤S3,根据富集分析结果数据,设置分析参数,一键式展示动态交互图表,通过本发明,可实现简单、方便、快速进行动态交互富集分析的目的。

Description

一种基于生物云平台的动态交互富集分析方法及系统
技术领域
本发明涉及生物信息分析技术领域,特别是涉及一种基于生物云平台的动态交互富集分析方法及系统。
背景技术
随着高通量测序技术的快速发展,生物医学相关研究领域进入了组学数据研究时代,单个基因的研究已经不能满足研究人员的科研需求。然而,下机测序的庞大数据量给信息的有效分析和挖掘带来了新的挑战,以测序数据为例,测序结果分析通常会得到差异表达的基因或蛋白列表,但对许多无生物信息基础的科学研究人员来说,将众多基因或蛋白与某个待研究的生物学现象及其潜在机制联系起来是很困难的、也很费时间。专业生物信息分析人员将一个基因或者蛋白列表分成多个部分,通常会对基因功能进行富集分析,从而减少分析的复杂度,期望发现在生物学过程中起关键作用的生物通路,从而揭示和理解生物学过程的基本分子机制。
可见,基因功能的富集分析已经成为高通量组学数据常规手段,但目前传统的富集分析,即测序数据的富集分析须由专业的生物信息分析人员完成,且分析所得结果都为静态结果,其通常是一张富集总表和对应的富集图,无法实现动态展示,且如有需要修改之处,都需要再返回给测序公司的专业生物信息分析人员进行修改,此过程费时费力,不利于研究人员对与测序数据结合的某项具体科学研究进行解析挖掘。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于生物云平台的动态交互富集分析方法及系统,以实现简单、方便、快速进行动态交互富集分析的目的。
为达上述及其它目的,本发明提出一种基于生物云平台的动态交互富集分析方法,包括如下步骤:
步骤S1,提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件;
步骤S2,根据获得的富集目的基因和背景基因文件在平台进行富集分析;
步骤S3,根据富集分析结果数据,设置分析参数,一键式展示动态交互图表。
优选地,步骤S1进一步包括:
步骤S100,获取用户通过前端页面选择的富集目的基因文件;
步骤S101,根据富集目的基因文件是有参考基因组的模式生物或无参考基因组物种,获取背景基因文件。
优选地,于步骤S101中,若所述富集目的基因文件为有参考基因组的模式生物,则其参考基因组作为背景基因文件,或提供上传背景基因文件;若所述富集目的基因文件为无无参考基因组物种,则提供上传背景基因文件,并确定相应的背景基因文件类型和物种类型。
优选地,于步骤S3中,对于所述动态交互图表,提供用户进一步查看、修改、下载操作,所述修改包括但不限于图形颜色、字体大小、标题。
优选地,对于动态Pathway富集分析,其动态可视化pathway富集分析结果,包括但不限于结果统计表、数目统计图、显著性柱状图、显著性气泡图。
优选地,所述结果统计表展示基因富集具体结果并提供筛选,提供用用户根据Pathway、Pathway ID、KEGG B class、KEGG C class、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,根据筛选出的结果创建基因集,及供下载筛选表格;所述数目统计图展示基因在KEGG pathway中的基因数量的数目统计图及表格;所述显著性柱状图展示基因显著性富集的pathway的图形及表格,图形给出横向和纵向两种图,可选择P值或Q值进行筛选pathway画图,并可自由筛选关注的pathway条目;所述显著性气泡图展示基因显著性富集的pathway的图形及表格,可选择P值或Q值进行筛选pathway画图。
优选地,对于动态GO富集分析,其动态可视化GO富集分析结果包括但不限于总览图表,以及分组的结果统计表、二级分类柱状图、显著性柱状图,显著性气泡图。
优选地,所述结果统计表展示基因富集具体结果并提供筛选,提供用户根据GOID、GO Term、Ontology、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,根据筛选出来的结果创建基因集或下载筛选表格;所述二级分类柱状图展示分组基因在GO二级分类的基因数量图形及表格;所述显著性柱状图展示基因显著性富集的term的图形及表格,可选择P值或Q值进行筛选GO Term画图,还可自由筛选关注的GO条目;所述显著性气泡图展示基因显著性富集的term的图形及表格,可选择P值或Q值进行筛选GO Term画图。
优选地,于步骤S3后,还包括如下步骤:
于富集分析结束后通知用户分析结果。
为达到上述目的,本发明还提供一种基于生物云平台的动态交互富集分析系统,包括:
基因数据获取模块,用于提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件;
富集分析模块,用于根据获得的富集目的基因和背景基因文件,在平台进行富集分析;
动态交互模块,用于接收所述富集分析模块输出的结果,设置分析过程的参数并进行图示化展示,一键式展示动态交互图表,并提供修改参数进行交互式修改,得到动态分析结果。
与现有技术相比,本发明一种基于生物云平台的动态交互富集分析方法及系统通过提供前端页面以供用户选择上传的富集目的基因文件和背景基因文件,获取并提交上传的富集目的基因和背景基因文件,根据获得的富集目的基因和背景基因文件在平台进行富集分析,最后根据富集分析结果数据,设置分析参数,一键式展示动态交互图表,实现了简单、方便、快速进行动态交互富集分析的目的,本发明可以动态实时分析,交互性强,便于数据挖掘;一键式生成结果,降低分析门槛、提升用户体验。
附图说明
图1为本发明一种基于生物云平台的动态交互富集分析方法的步骤流程图;
图2为本发明一种基于生物云平台的动态交互富集分析系统的系统架构图;
图3为本发明实施例中动态Pathway富集分析的流程示意图;
图4为本发明实施例中动态GO富集分析的流程示意图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基于生物云平台的动态交互富集分析方法的步骤流程图。如图1所示,本发明一种基于生物云平台的动态交互富集分析方法,包括:
步骤S1,提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件。
具体地,步骤S1进一步包括:
步骤S100,获取用户通过前端页面选择的富集目的基因文件。在本发明具体实施例中,通过前端页面提供用户选择上传富集目的基因文件。
步骤S101,根据富集目的基因文件是有参考基因组的模式生物或无参考基因组物种,获取背景基因文件。在本发明具体实施例中,若所述富集目的基因文件为有参考基因组的模式生物,则其参考基因组作为背景基因文件,或提供上传背景基因文件;若所述富集目的基因文件为无参考基因组物种,则提供上传背景基因文件,并确定相应的背景基因文件类型和物种类型。在本发明具体实施例中,系统提供水稻、拟南芥、小鼠、大鼠、斑马鱼、鸡、秀丽线虫、果蝇、人等内置的背景基因文件供用户选择,或用户也可自行准备背景基因文件。
步骤S2,根据获得的富集目的基因和背景基因文件在平台进行富集分析。
GO和KEGG富集分析是目前最为常用的差异基因富集分析方法,其可以从基因功能和通路分析两个方向研究差异基因的生物学功能,是进行数据解读和挖掘的重要方法。
其中,Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表(controlled vocabulary)来全面描述生物体中基因和基因产物的属性。GO总共有三个ontology(本体),分别描述基因的分子功能(molecular function)、细胞组分(cellular component)、参与的生物过程(biological process)。GO的基本单位是term(词条、节点),每个term都对应一个属性。GO功能分析一方面给出差异表达基因的GO功能分类注释;另一方面给出差异表达基因的GO功能显著性富集分析。GO富集分析过程如下:首先,将差异表达基因向GO数据库(http://www.geneontology.org/)的各term映射,并计算每个term的基因数,从而得到具有某个GO功能的基因列表及基因数目统计。然后应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著富集的GO条目。
在GO富集分析中,P的计算公式:
其中,N为所有Unigene中具有GO注释的基因数目;n为N中差异表达基因的数目;M为所有Unigene中注释为某特定GO term的基因数目;m为注释为某特定GO term的差异表达基因数目,计算得到的pvalue通过FDR校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的GO term定义为在差异表达基因中显著富集的GO term,通过GO功能显著性富集分析能确定差异表达基因行使的主要生物学功能。
在生物体内,不同基因相互协调行使其生物学功能,基于Pathway的分析有助于更进一步了解基因的生物学功能。KEGG是有关Pathway的主要公共数据库。Pathway显著性富集分析以KEGG Pathway为单位,应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著性富集的Pathway。
在KEGG富集分析中,P的计算公式:
其中,N为所有基因(背景基因)的数量,n为差异基因(目的基因)的数量,M为所有基因中该pathway的数量,i为差异基因中注释到该pathway的数量,计算得到的pvalue通过FDR校正之后,以corrected-pvalue≤0.05为阈值,满足此条件的pathway定义为在差异表达基因中显著富集的pathway。
由于具体的富集分析计算算法与现有技术相同,在此不予赘述。
步骤S3,根据分析结果数据,设置分析参数,一键式展示动态交互图表。
优选地,于步骤S3中,对于所述动态交互图表,提供用户进一步查看、修改、下载等操作,所述修改包括但不限于图形颜色、字体大小、标题等。
优选地,于步骤S3后,在富集分析结束后通知用户,例如通过邮件通知用户分析已完成。
优选的,本发明之动态交互富集分析方法使用PHP作为后台开发语言,使用JavaScript、html进行前端页面及功能编写,使用D3(Data-Driven Documents)作为数据可视化绘图工具,数据库使用MYSQL数据库。
优选的,本方法之动态交互富集分析方法可以部署在linux服务器,用户可通过浏览器进行平台访问操作使用。
图2为本发明一种基于生物云平台的动态交互富集分析系统的系统架构图。如图2所示,本发明一种基于生物云平台的动态交互富集分析系统,包括:
基因数据获取模块201,用于提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件。
基因数据获取模块201进一步包括:
富集目的基因文件获取单元,用于获取用户通过前端页面选择的富集目的基因文件。在本发明具体实施例中,富集目的基因文件获取模块通过前端页面提供用户选择上传的富集目的基因文件。
背景基因文件获取单元,用于根据富集目的基因文件是有参考基因组的模式生物或无参考基因组物种,获取背景基因文件。在本发明具体实施例中,若所述富集目的基因文件为有参考基因组的模式生物,则背景基因文件获取单元将其参考基因组作为背景基因文件,也可提供上传背景基因文件;若所述富集目的基因文件为无无参考基因组物种,则背景基因文件获取单元提供上传背景基因文件,并确定相应的背景基因文件类型和物种类型。在本发明具体实施例中,系统提供水稻、拟南芥、小鼠、大鼠、斑马鱼、鸡、秀丽线虫、果蝇、人等内置的背景基因文件供用户选择,或用户也可自行准备背景基因文件。
富集分析模块202,用于根据获得的富集目的基因和背景基因文件,在平台进行富集分析。
动态交互模块203,用于接收所述富集分析模块202输出的结果,设置分析参数并进行图示化展示,一键式展示动态交互图表,并提供修改参数进行交互式修改,得到动态分析结果。
优选地,对于所述动态交互图表,提供用户进一步查看、修改、下载等操作,所述修改包括但不限于图形颜色、字体大小、标题等。
优选地,本发明之基于生物云平台的动态交互富集分析系统还包括:通知模块,用于在富集分析结束后通知用户,例如通过邮件通知用户分析已完成。
优选的,本发明之动态交互富集分析系统使用PHP作为后台开发语言,使用JavaScript、html进行前端页面及功能编写,使用D3(Data-Driven Documents)作为数据可视化绘图工具,数据库使用MYSQL数据库。
优选的,本方法之动态交互富集分析系统可以部署在linux服务器,用户可通过浏览器进行平台访问操作使用。
实施例
以下实施例从动态Pathway富集分析(KEGG的Pathway数据库是应用最广泛的代谢通路数据库)和动态GO富集分析两个实施例来进一步说明本发明之动态交互富集分析方法:
实施例一:动态Pathway富集分析(如图3所示)
步骤1,通过前端页面选择上传富集目的基因和背景基因的文件,提交需要进行pathway分析的数据,提交任务进行pathway富集分析;
步骤2,当pathway富集分析完成后,选择已完成的pathway富集分析进行查看,系统将读出pathway富集分析结果数据文件数据;
步骤3,返回前端页面系统,设置分析参数,进行动态可视化pathway富集分析结果展示。
所述动态可视化pathway富集分析结果,包括但不限于:结果统计表、数目统计图、显著性柱状图、显著性气泡图。
本实施例中,结果统计表展示基因富集具体结果并提供筛选,用户可根据Pathway、Pathway ID、KEGG B class、KEGG C class、Gene ID一键式查找;根据Pvalue和FDR的数值进行一键式筛选,筛选出的结果可以创建基因集,及供下载筛选表格。
本发明实施例中,数目统计图展示基因在KEGG pathway中的基因数量的数目统计图及表格。
本发明实施例中,显著性柱状图展示基因显著性富集的pathway的图形及表格,图形给出横向和纵向两种图,可选择P值或Q值进行筛选pathway画图,并可自由筛选关注的pathway条目。
本实施例中,显著性气泡图展示基因显著性富集的pathway的图形及表格,可选择P值或Q值进行筛选pathway画图。显著性气泡图RichFactor指差异表达的基因中位于该pathway条目的基因数目与所有基因中位于该pathway条目的基因总数的比值,RichFactor越大,表示富集的程度越高。通过气泡大小表示基因的数量多少,气泡越大,富集到该pathway基因数量越多;还可通过气泡颜色的深浅表示显著性的高低,颜色越红表示富集到该pathway的显著性越高。
本实施案中一键式生成的动态pathway富集分析结果均可实现查看、修改、下载等操作,所述修改包括图形颜色、字体大小、标题等。
实施例二:动态GO富集分析(如图4所示)
步骤1,通过前端页面选择需要进行GO富集分析的基因集或差异分析结果集,和GO背景基因文件,提交任务进行分析;
步骤2,平台根据步骤1获取的GO富集分析的基因集或差异分析结果集,和GO背景基因文件进行名称匹配,通过超几何检验计算目标基因集在各个GO term富集程度;当GO富集分析完成后,可选择已完成的GO富集分析进行查看,系统将读出GO富集分析结果数据文件数据;
步骤3,返回前端页面系统,设置分析参数,进行动态可视化GO富集分析结果展示;
本实施例中,所述动态可视化GO富集分析结果,包括但不限于总览图表,以及分组的结果统计表、二级分类柱状图、显著性柱状图,显著性气泡图。
本实施例中,结果统计表展示基因富集具体结果并提供筛选,用户可根据GO ID、GO Term、Ontology、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,筛选出来的结果可以创建基因集或下载筛选表格。
本实施例中,二级分类柱状图展示分组基因在GO二级分类的基因数量图形及表格。
本实施例中,显著性柱状图展示基因显著性富集的term的图形及表格,图形给出横向和纵向两种图,可选择P值或Q值进行筛选GO Term画图,还可自由筛选关注的GO条目。
本实施例中,显著性气泡图展示基因显著性富集的term的图形及表格,可选择P值或Q值进行筛选GO Term画图。显著性气泡图RichFactor指差异表达的基因中位于该term条目的基因数目与所有基因中位于该term条目的基因总数的比值,RichFactor越大,表示富集的程度越高。通过气泡大小表示基因的数量多少,气泡越大,富集到该term基因数量越多;通过气泡颜色的深浅表示显著性的高低,颜色越红表示富集到该term的显著性越高。
本实施例中一键式生成的GO富集分析结果均可实现查看、修改、下载等操作。所述修改包括图形颜色、字体大小、标题等。
综上所述,本发明一种基于生物云平台的动态交互富集分析方法及系统通过提供前端页面以供用户选择上传的富集目的基因文件和背景基因文件,获取并提交上传的富集目的基因和背景基因文件,根据获得的富集目的基因和背景基因文件在平台进行富集分析,最后根据富集分析结果数据,设置分析参数,一键式展示动态交互图表,实现了简单、方便、快速进行动态交互富集分析的目的,本发明可以动态实时分析,交互性强,便于数据挖掘;一键式生成结果,降低分析门槛、提升用户体验。
与现有技术相比,本发明具有如下有益效果:
(1)本发明具有简单、方便、快速、分析结果更丰富的优点,可提供便于筛选和快速查找的结果统计表和多种富集分析结果图;
(2)本发明可以动态实时分析,交互性强,便于数据挖掘,获得理想的富集结果;
(3)本发明可一键式进行分析参数调整和生成分析结果,无生物信息基础的研究人员也可自由调整基因集、差异阈值等参数,降低分析门槛、提升用户体验。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。

Claims (7)

1.一种基于生物云平台的动态交互富集分析方法,使用PHP作为后台开发语言,使用JavaScript、html进行前端页面及功能编写,使用D3作为数据可视化绘图工具,数据库使用MYSQL数据库,包括如下步骤:
步骤S1,提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件;
步骤S2,根据获得的富集目的基因和背景基因文件在平台进行富集分析;所述富集分析包括动态Pathway富集分析和动态可视化GO富集分析;
步骤S3,根据富集分析结果数据,设置分析参数,一键式展示动态交互图表;
步骤S1进一步包括:
步骤S100,获取用户通过前端页面选择的富集目的基因文件;
步骤S101,根据富集目的基因文件是有参考基因组的模式生物或无参考基因组物种,获取背景基因文件;
对于动态Pathway富集分析,其动态可视化pathway 富集分析结果,包括结果统计表、数目统计图、显著性柱状图、显著性气泡图;所述结果统计表展示基因富集具体结果并提供筛选,提供用户根据Pathway、Pathway ID、KEGG B class 、KEGG C class、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,根据筛选出的结果创建基因集,及供下载筛选表格;所述数目统计图展示基因在KEGG pathway中的基因数量的数目统计图及表格;所述显著性柱状图展示基因显著性富集的pathway的图形及表格,图形给出横向和纵向两种图,选择P值或Q值进行筛选pathway画图,以及自由筛选关注的pathway条目;所述显著性气泡图展示基因显著性富集的pathway的图形及表格,选择P值或Q值进行筛选pathway画图。
2.如权利要求1所述的一种基于生物云平台的动态交互富集分析方法,其特征在于:于步骤S101中,若所述富集目的基因文件为有参考基因组的模式生物,则其参考基因组作为背景基因文件,或提供上传背景基因文件;若所述富集目的基因文件为无参考基因组物种,则提供上传背景基因文件,并确定相应的背景基因文件类型和物种类型。
3.如权利要求1所述的一种基于生物云平台的动态交互富集分析方法,其特征在于:于步骤S3中,对于所述动态交互图表,提供用户进一步查看、修改、下载操作,所述修改包括图形颜色、字体大小、标题。
4.如权利要求3所述的一种基于生物云平台的动态交互富集分析方法,其特征在于:对于动态GO富集分析,其动态可视化GO富集分析结果包括总览图表,以及分组的结果统计表、二级分类柱状图、显著性柱状图,显著性气泡图。
5.如权利要求4所述的一种基于生物云平台的动态交互富集分析方法,其特征在于:所述结果统计表展示基因富集具体结果并提供筛选,提供用户根据GO ID、GO Term、Ontology、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,根据筛选出来的结果创建基因集或下载筛选表格;所述二级分类柱状图展示分组基因在GO二级分类的基因数量图形及表格;所述显著性柱状图展示基因显著性富集的term的图形及表格,选择P值或Q值进行筛选GO Term画图,以及自由筛选关注的GO条目;所述显著性气泡图展示基因显著性富集的term的图形及表格,选择P值或Q值进行筛选GO Term画图。
6.如权利要求1所述的一种基于生物云平台的动态交互富集分析方法,其特征在于,于步骤S3后,还包括如下步骤:
于富集分析结束后通知用户分析结果。
7.一种基于生物云平台的动态交互富集分析系统,使用PH P作为后台开发语言,使用JavaScript、html进行前端页面及功能编写,使用D3作为数据可视化绘图工具,数据库使用MYSQL数据库,包括:
基因数据获取模块,用于提供前端页面以供用户选择富集目的基因和背景基因文件,获取用户所选择的富集目的基因和背景基因文件;
富集分析模块,用于根据获得的富集目的基因和背景基因文件,在平台进行富集分析;所述富集分析包括动态Pathway富集分析和动态可视化GO富集分析;
动态交互模块,用于接收所述富集分析模块输出的结果,设置分析参数并进行图示化展示,一键式展示动态交互图表,并提供修改参数进行交互式修改,得到动态分析结果;
所述基因数据获取模块,还用于获取用户通过前端页面选择的富集目的基因文件;根据富集目的基因文件是有参考基因组的模式生物或无参考基因组物种,获取背景基因文件;
对于动态Pathway富集分析,其动态可视化pathway 富集分析结果,包括结果统计表、数目统计图、显著性柱状图、显著性气泡图;所述结果统计表展示基因富集具体结果并提供筛选,提供用户根据Pathway、Pathway ID、KEGG B class 、KEGG C class、Gene ID一键式查找,根据Pvalue和FDR的数值进行一键式筛选,根据筛选出的结果创建基因集,及供下载筛选表格;所述数目统计图展示基因在KEGG pathway中的基因数量的数目统计图及表格;所述显著性柱状图展示基因显著性富集的pathway的图形及表格,图形给出横向和纵向两种图,选择P值或Q值进行筛选pathway画图,以及自由筛选关注的pathway条目;所述显著性气泡图展示基因显著性富集的pathway的图形及表格,选择P值或Q值进行筛选pathway画图。
CN202010015063.XA 2020-01-07 2020-01-07 一种基于生物云平台的动态交互富集分析方法及系统 Active CN111276190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010015063.XA CN111276190B (zh) 2020-01-07 2020-01-07 一种基于生物云平台的动态交互富集分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010015063.XA CN111276190B (zh) 2020-01-07 2020-01-07 一种基于生物云平台的动态交互富集分析方法及系统

Publications (2)

Publication Number Publication Date
CN111276190A CN111276190A (zh) 2020-06-12
CN111276190B true CN111276190B (zh) 2023-09-12

Family

ID=71000112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010015063.XA Active CN111276190B (zh) 2020-01-07 2020-01-07 一种基于生物云平台的动态交互富集分析方法及系统

Country Status (1)

Country Link
CN (1) CN111276190B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368704A (zh) * 2017-07-21 2017-11-21 上海桑格信息技术有限公司 基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法
CN108664769A (zh) * 2017-03-31 2018-10-16 中国科学院上海生命科学研究院 基于癌症基因组和非特异性基因标签的大规模药物重定位方法
CN109243532A (zh) * 2017-07-21 2019-01-18 上海桑格信息技术有限公司 基于计算云平台的真核无参转录组交互分析系统及其方法
CN110010203A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN110428866A (zh) * 2019-07-23 2019-11-08 哈尔滨工业大学 基于网络融合多组学数据的癌症相关通路识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11923049B2 (en) * 2016-06-22 2024-03-05 Sophia Genetics S.A. Methods for processing next-generation sequencing genomic data
US20190034047A1 (en) * 2017-07-31 2019-01-31 Wisconsin Alumni Research Foundation Web-Based Data Upload and Visualization Platform Enabling Creation of Code-Free Exploration of MS-Based Omics Data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664769A (zh) * 2017-03-31 2018-10-16 中国科学院上海生命科学研究院 基于癌症基因组和非特异性基因标签的大规模药物重定位方法
CN107368704A (zh) * 2017-07-21 2017-11-21 上海桑格信息技术有限公司 基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法
CN109243532A (zh) * 2017-07-21 2019-01-18 上海桑格信息技术有限公司 基于计算云平台的真核无参转录组交互分析系统及其方法
CN110010203A (zh) * 2019-03-29 2019-07-12 广州基迪奥生物科技有限公司 一种基于生物云平台的交互式动态qtl分析系统及方法
CN110428866A (zh) * 2019-07-23 2019-11-08 哈尔滨工业大学 基于网络融合多组学数据的癌症相关通路识别方法

Also Published As

Publication number Publication date
CN111276190A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
Cooper et al. The Planteome database: an integrated resource for reference ontologies, plant genomics and phenomics
Barrett et al. Mining microarray data at NCBI’s Gene Expression Omnibus (GEO)
Hoban et al. Computer simulations: tools for population and evolutionary genetics
US10275711B2 (en) System and method for scientific information knowledge management
US10573406B2 (en) Method, apparatus and computer program product for metabolomics analysis
Li et al. Co-mention network of R packages: Scientific impact and clustering structure
Bik et al. Phinch: an interactive, exploratory data visualization framework for–Omic datasets
Atkinson et al. Combining semi-automated image analysis techniques with machine learning algorithms to accelerate large-scale genetic studies
Heyer et al. MAGIC Tool: integrated microarray data analysis
Ziegler et al. Zbrowse: an interactive GWAS results browser
Stražar et al. scOrange—A tool for hands-on training of concepts from single-cell data analytics
Germeier et al. Modeling crop genetic resources phenotyping information systems
Rohn et al. Creating views on integrated multidomain data
Brazma et al. [20] Data Storage and Analysis in ArrayExpress
Groth et al. Phenoclustering: online mining of cross-species phenotypes
Stöter et al. CellProfiler and KNIME: open-source tools for high-content screening
Jaiswal et al. Planteome: a resource for common reference ontologies and applications for plant biology
CN111276190B (zh) 一种基于生物云平台的动态交互富集分析方法及系统
Jalili et al. MuSERA: multiple sample enriched region assessment
Yang et al. OntoPlot: a novel visualisation for non-hierarchical associations in large ontologies
Sass et al. RAMONA: a Web application for gene set analysis on multilevel omics data
CN110008427B (zh) 一种整合多组学知识库的交互式生物信息云分析平台
CN114203259A (zh) 一种多组学数据整合分析方法和在线交互式综合分析平台
Rogowitz et al. Metadata Mapper: a web service for mapping data between independent visual analysis components, guided by perceptual rules
US20140160132A1 (en) Visual representations of structured association mappings

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant