CN113158113B - 生物信息分析工作流多用户云端访问方法、管理系统 - Google Patents

生物信息分析工作流多用户云端访问方法、管理系统 Download PDF

Info

Publication number
CN113158113B
CN113158113B CN202110539383.XA CN202110539383A CN113158113B CN 113158113 B CN113158113 B CN 113158113B CN 202110539383 A CN202110539383 A CN 202110539383A CN 113158113 B CN113158113 B CN 113158113B
Authority
CN
China
Prior art keywords
workflow
biological information
information analysis
user
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110539383.XA
Other languages
English (en)
Other versions
CN113158113A (zh
Inventor
吕晖
任永永
程志伟
李磊杰
张悦宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202110539383.XA priority Critical patent/CN113158113B/zh
Publication of CN113158113A publication Critical patent/CN113158113A/zh
Application granted granted Critical
Publication of CN113158113B publication Critical patent/CN113158113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)

Abstract

本发明涉及一种生物信息分析工作流多用户云端访问方法、管理系统,方法包括以下步骤:开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,并将二者上传至云端工作流库;云端访问用户自云端工作流库选择生物信息分析工作流,基于参数配置控件输入所需计算参数的取值,输入生物医学数据;Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,计算服务器为生物信息分析工作流分配计算资源,得到分析结果并回传给Web服务器。与现有技术相比,用户无需自行配置Web服务器、编写网络界面,能够高效率的将单用户使用的本地生物信息分析工作流转化为多用户使用的云端生物信息分析工作流,操作简单。

Description

生物信息分析工作流多用户云端访问方法、管理系统
技术领域
本发明涉及生物信息学分析技术领域,尤其是涉及一种生物信息分析工作流多用户云端访问方法、管理系统。
背景技术
生物医学数据分析,通常是由多个子分析模块串联或并联组成工作流实现的,从而保障同批次数据分析结果的一致性和可重复性。传统的生物信息分析工作流是单用户在本地建立并实现的,如单用户在Linux系统下建立多个分析软件串联或并联的分析工作流平台,输入生物医学数据后得到分析结果。
近年来,随着该领域数据的快速积累及科研需求多样性爆炸式增长,生物医学数据分析工作流的应用形式也在逐渐发生变化,由单用户在Linux系统下使用的本地平台转化为多用户以Web访问的云平台形式。为了实现这一转换,一般需要开发者自行配置Web服务器,并使用计算机编程语言编写网络界面等,还需要考虑多个用户共同访问的调度系统、配置计算系统等,需要大量领域背景之外的网络信息技术才得以实现,对于生物信息工作者而言,繁杂的技术细节使得该转换过程变得极其困难和耗时。
目前,为了实现多用户云端访问的分析工作流,常用的手段是在线设计生物信息分析工作流,即为用户提供一个在线的开发环境,用户可以在开发环境中选择所需的软件或子分析模块,并按照自己的分析要求进行串并联连接,这样能够在线建立分析工作流,将在线建立的分析工作流发布共享之后,其余的用户能够云端访问发布共享的分析工作流。但是,该策略的缺点是:开发环境中提供的软件仅为生物信息分析软件中的极少数,无法满足多样化、复杂的分析工作流的开发,而且开发过程无法调试,开发成功率低;当不同软件间的上下游接口存在差异时,容易出现开发失败。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种生物信息分析工作流多用户云端访问方法、管理系统,用户无需自行配置Web服务器、编写网络界面,开发用户只需将本地构建好的生物信息分析工作流上传至云端工作流库就可以实现共享,云端访问用户发起请求后计算服务器在云端为生物信息分析工作流分配计算资源,得到对生物医学数据的分析结果,能够高效的将单用户使用的本地生物信息分析工作流转化为多用户使用的云端生物信息分析工作流,转化效率高,操作简单。
本发明的目的可以通过以下技术方案来实现:
一种生物信息分析工作流多用户云端访问方法,包括以下步骤:
开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,将生物信息分析工作流及参数配置控件上传至云端工作流库中存储,所述参数配置控件用于传递生物信息分析工作流所需计算参数的取值,所述云端工作流库中存储有多个生物信息分析工作流及参数配置控件;
云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于该生物信息分析工作流的参数配置控件,输入生物信息分析工作流所需计算参数的取值,再输入生物医学数据;
通过Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器。
进一步的,还包括:开发用户建立结果可视化排版规则,Web服务器将分析结果按照所述结果可视化排版规则进行排版和可视化展示。
进一步的,本地的生物信息分析工作流是开发用户在本地将多个软件串并联建立的分析工作流,生物信息分析工作流按所属类别在云端工作流库中存储,开发用户还分别为每个生物信息分析工作流设置了所需计算资源、工作流简介信息和云端用户访问权限。
一种生物信息分析工作流管理系统,包括:计算服务器、Web服务器、云端工作流库、工作流发布模块和分析操作模块;
所述工作流发布模块用于实现工作流发布,在工作流发布模块中,开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,并将生物信息分析工作流及参数配置控件上传至云端工作流库中存储;
所述分析操作模块用于实现工作流的选择和数据配置,在分析操作模块中,云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于参数配置控件确定生物信息分析工作流所需计算参数的取值,并输入生物医学数据;
所述Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,所述计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器。
进一步的,所述工作流发布模块为可视化的工作流发布模块,在所述工作流发布模块中,开发用户还分别为每个生物信息分析工作流配置了所需计算资源、工作流简介信息和云端用户访问权限。
进一步的,所述分析操作模块为可视化的分析操作模块,在所述分析操作模块中,对于选定的生物信息分析工作流,基于参数配置控件可视化显示待输入的所需计算参数,包括参数名称和参数可选缺省值,Web服务器以json格式将所需计算参数的取值传递给计算服务器。
进一步的,还包括可视化的结果管理模块,在所述结果管理模块中,Web服务器将分析结果按照开发用户预设置的结果可视化排版规则进行排版和可视化展示。
进一步的,还包括可视化的分类管理模块,所述分类管理模块为工作流发布模块和分析操作模块提供可视化的生物信息分析工作流分类管理,在工作流发布模块上传生物信息分析工作流时可视化的选择生物信息分析工作流所属类别,将生物信息分析工作流按所属类别在云端工作流库中存储,在分析操作模块选择生物信息分析工作流时可视化的展示不同类别的生物信息分析工作流。
进一步的,还包括客户端和用户管理模块,开发用户和云端访问用户通过所述客户端登录Web服务器,所述用户管理模块用于进行用户信息管理和用户权限管理,用户信息包括注册信息、历史上传生物信息分析工作流信息和历史分析结果信息,用户权限包括开发用户权限和云端访问用户权限。
更进一步的,所述用户管理模块还设有专家审核单元,所述专家审核单元对开发用户上传的生物信息分析工作流的安全性及参数配置控件的合法性进行审核,通过审核的生物信息分析工作流及参数配置控件存储至云端工作流库,云端用户根据自身的权限对云端工作流库中的生物信息分析工作流进行云端访问和使用。
与现有技术相比,本发明具有以下有益效果:
(1)用户无需自行配置Web服务器、编写网络界面,开发用户只需将本地构建好的生物信息分析工作流上传至云端工作流库就可以实现在线运行和共享,云端访问用户发起请求后计算服务器在云端为生物信息分析工作流分配计算资源,得到分析结果,能够高效的将单用户使用的本地生物信息分析工作流转化为多用户在云端使用的生物信息分析工作流,转化效率高,操作简单。
(2)生物信息分析工作流是用户在本地自由构建的,突破了现有在线开发技术中对使用的软件的限定,拓宽了生物信息分析工作流的开发范围,在生物医学数据分析云平台建设领域具有重要的技术领先型和商业价值。
(3)考虑到不同的生物信息分析工作流所需计算参数差异巨大,开发用户可以自定义生物信息分析工作流所需计算参数,并为每个生物信息分析工作流建立了参数配置控件,云端访问用户根据参数配置控件输入所需计算参数的取值,再通过Web服务器传递给计算服务器,而且可视化的操作降低了参数配置的难度,在生物医学数据分析领域由命令行级参数配置转化为可视化参数配置,在本地分析工作流向云端分析工作流的转化中有巨大的行业需求。
(4)Web服务器将分析结果按照开发用户预设置的结果可视化排版规则进行排版和可视化展示,云端访问用户不需要自己设计排版规则,开发成本低,结果一致性高。
(5)本申请提供的生物信息分析工作流管理系统涵盖了生物信息分析工作流自定义上传、生物信息分析工作流分类管理、生物信息分析工作流选择及参数配置、结果可视化管理和用户系统管理,开放性高,是一整套顶层架构和技术实现,为生物信息分析工作流的积累和商业转化提供了更大的可能,具有重要的社会和商业价值。
附图说明
图1为实施例中生物信息分析工作流多用户云端访问方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例1:
一种生物信息分析工作流多用户云端访问方法,如图1所示,包括以下步骤:
S1、开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,将生物信息分析工作流及参数配置控件上传至云端工作流库中存储,参数配置控件用于传递生物信息分析工作流所需计算参数的取值,云端工作流库中存储有多个生物信息分析工作流及对应的参数配置控件;
本地的生物信息分析工作流是开发用户在本地将多个软件串并联建立的分析工作流,如单用户在Linux系统下建立的命令行级生物信息分析工作流,该生物信息分析工作流在本地运行,能够得到生物医学数据的分析结果。将一个生物信息分析工作流看作一个大型的组合式软件,不同的生物信息分析工作流所需计算参数差异巨大,不同的用户使用生物信息分析工作流时也会设定不同的参数值,本申请为生物信息分析工作流建立了配置参数控件,开发用户自定义上传的生物信息分析工作流有哪些所需计算参数,以及这些所需计算参数的可选缺省值。
为了便于管理生物信息分析工作流,本实施例中,生物信息分析工作流按所属类别在云端工作流库中存储,综合生物医学数据类别及分析目的,生物信息分析工作流的类别包括:组学数据分析类、医学数据分析类、整合分析类和数据可视化类,每个类别都是开放式可自由扩展的,又可以划分为多个子类别,子类别也可以自由扩展。
例如,组学数据分析类包含:基因组肿瘤安全用药指导、转录组差异表达分析、单细胞分析、蛋白组差异分析、甲基化差异分析等;医学数据分析类包含:横断面数据分析、纵向数据分析、可穿戴设备数据分析、酵母荧光图像显微计数分析等;整合分析类包含:多组学整合分析、基于贝叶斯估计的致病因果分析等;数据可视化类包含:数据交并集韦恩图可视化等。子类别的开放式自由扩展可极大丰富生物医学数据分析工作流的多样性。
为了便于计算服务器为生物信息分析工作流分配计算资源,开发用户还分别为每个生物信息分析工作流设置了计算所需的CPU资源和时间等;为了便于云端用户能够快速了解工作流,开发用户还分别为每个生物信息分析工作流设置了工作流简介信息,工作流简介信息可以包括:工作流可实现的子分析功能、操作步骤、运行流程、应用样例介绍、使用帮助文档、版本维护记录、所包括的子分析工作流模块等;为了便于对用户和生物信息分析工作流进行管理,保证安全性,开发用户还分别为每个生物信息分析工作流设置了云端用户访问权限。
S2、云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于该生物信息分析工作流的参数配置控件,输入生物信息分析工作流所需计算参数的取值,再输入生物医学数据;
对于选定的生物信息分析工作流,基于参数配置控件输入所需计算参数的取值,不需要存储参数取值,Web服务器直接以json格式将所需计算参数的取值传递给计算服务器,提高Web服务器Mysql数据库存储载荷。
S3、通过Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器。
分析结果的格式包括图片、表格、人工智能网络模型和结果说明文字等,对于分析结果,开发用户可以预先建立结果可视化排版规则,Web服务器将分析结果按照结果可视化排版规则进行排版和可视化展示。
一种生物信息分析工作流管理系统,包括:计算服务器、Web服务器、云端工作流库、工作流发布模块、分析操作模块、结果管理模块、分类管理模块、用户管理模块和客户端;
工作流发布模块用于实现工作流发布,在工作流发布模块中,开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,并将生物信息分析工作流及参数配置控件上传至云端工作流库中存储;
分析操作模块用于实现工作流的选择和数据配置,在分析操作模块中,云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于参数配置控件确定生物信息分析工作流所需计算参数的取值,并输入生物医学数据;
Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器;
在结果管理模块中,Web服务器将分析结果按照开发用户预设置的结果可视化排版规则进行排版和可视化展示;
分类管理模块为工作流发布模块和分析操作模块提供可视化的生物信息分析工作流分类管理,在工作流发布模块上传生物信息分析工作流时可视化的选择生物信息分析工作流所属类别,将生物信息分析工作流按所属类别在云端工作流库中存储,在分析操作模块选择生物信息分析工作流时可视化的展示不同类别的生物信息分析工作流;
开发用户和云端访问用户通过客户端登录Web服务器,用户管理模块用于进行用户信息管理和用户权限管理,用户管理模块还提供常用的安全验证、密码修改、找回密码等功能,用户信息包括注册信息、历史上传生物信息分析工作流信息和历史分析结果信息,用户权限包括开发用户权限和云端访问用户权限;
在用户管理模块还设有专家审核单元,专家审核单元对开发用户上传的生物信息分析工作流的安全性及参数配置控件的合法性进行审核,通过审核的生物信息分析工作流及参数配置控件存储至云端工作流库,未通过审查的会给出原因,提示开发用户修改;云端用户根据自身的权限对云端工作流库中的生物信息分析工作流进行云端访问和使用。
为了便于交互,工作流发布模块和分析操作模块为均为可视化界面。在工作流发布模块中,包括类别选择界面、参数配置控件建立界面、简介编辑界面等。开发用户上传生物信息分析工作流时,在类别选择界面上可视化的选择生物信息分析工作流所属类别,之后上传生物信息分析工作流。在参数配置控件建立界面,开发用户能够可视化的建立参数配置控件,如设置所需计算参数的名称、参数类别、参数属性、参数解释信息、参数可选缺省值、增删参数等。在简介编辑界面,开发用户可视化的编辑生物信息分析工作流的简介信息、所需计算资源和云端用户访问权限等信息。在云端工作流库中,通过专家审核的生物信息分析工作流按照所属类别存储。
在分析操作模块中,包括工作流选择界面、参数配置界面和数据上传界面。在工作流选择界面,按照云端访问用户的访问权限,以及生物信息分析工作流的所属类别查看不同种类的生物信息分析工作流,而且可以点击查看生物信息分析工作流的简介信息等。对于选定的生物信息分析工作流,在参数配置界面,基于参数配置控件可视化的显示待输入或待设置的所需计算参数,包括参数名称和参数可选缺省值等,Web服务器以json格式将所需计算参数的取值传递给计算服务器。在数据上传界面,上传符合格式的生物医学数据。
在结果管理模块中,Web服务器将分析结果按照开发用户预设置的结果可视化排版规则进行排版和可视化展示,获取分析结果后,识别图片、表格、人工智能网络模型等格式的结果,按照统一的标准规范的排版规则,实现图片排版、表格分页显示、一级标题自定义、二级标题自定义、三级标题自定义、图片结果解读、表格结果解读、外部超链接嵌入、结果呈现顺序等,还可以进行分析结果下载、历史分析结果分类检索、删除、查看等操作。分析结果根据开发用户设计的规则进行排版展示和可视化,所有的云端访问用户不需要自己设计排版规则,开发成本低,结果一致性高。
生物信息分析工作流是由多个软件串联或并联组成的,现有的技术中,在线开发的生物信息分析工作流能够选择的软件有限,而且需要考虑版本、接口、兼容性等问题,无法满足众多复杂的生物信息分析工作流的搭建工作。本申请不必考虑软件的有限性,因为开发用户实际上是将本地搭建好的生物信息分析工作流上传到云端,其余的云端访问用户再自云端访问这些上传的生物信息分析工作流。突破了现有技术中对使用的软件的限定,拓宽了生物信息分析工作流的开发范围,在生物医学数据分析云平台建设领域具有重要的技术领先型和商业价值。
本实施例中,使用MySQL数据库作为云端工作流库,存储用户注册信息、用户权限、生物信息分析工作流、参数配置控件和分析结果等数据。
使用2个服务器,Web服务器和计算服务器。Web服务器提供网络服务,如用户通过客户端登录时的域名解析、Nginx反向代理等,Web服务器将在分析操作模块确定的所需计算参数的取值、生物医学数据传递给计算服务器;计算服务器采用高性能计算服务器slurm作业调度系统,当有多个用户同时发起计算请求时,合理的进行计算资源分配,对生物医学数据进行计算分析并给出分析结果,并将分析结果回传给Web服务器;Web服务器根据预先建立的结果可视化排版规则对分析结果进行排版展示。
生物医学数据分析需求的多样性,内在决定了任何个人或单一机构均无法提供所有生物信息分析工作流,这同样是国内外生物医学数据分析管理平台利用度不及预期的根本原因。本申请采用开放式管理系统架构,构建从开发到发布的一站式开发环境,用户可以在本地自由构建各种各样的生物信息分析工作流,申请开发用户权限后就可以将生物信息分析工作流上传到云端工作流库,开放性高,云端访问用户可以自云端访问不同的生物信息分析工作流,不需要自行构建,一个生物信息分析工作流可以供多个用户在云端访问使用,满足了多样性的生物信息分析工作流共享。
本申请提供的生物信息分析工作流管理系统涵盖了生物信息分析工作流自定义上传、生物信息分析工作流分类管理、生物信息分析工作流选择及参数配置、结果可视化管理和用户系统管理,是一整套顶层架构和技术实现,为生物信息分析工作流的积累和商业化提供了更大的可能,具有重要的社会和商业价值。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (5)

1.一种生物信息分析工作流管理系统,其特征在于,基于生物信息分析工作流多用户云端访问方法实现,所述生物信息分析工作流多用户云端访问方法包括:
开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,将生物信息分析工作流及参数配置控件上传至云端工作流库中存储,所述参数配置控件用于传递生物信息分析工作流所需计算参数的取值,所述云端工作流库中存储有多个生物信息分析工作流及参数配置控件;
云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于该生物信息分析工作流的参数配置控件,输入生物信息分析工作流所需计算参数的取值,再输入生物医学数据;
通过Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器;
具体的,所述生物信息分析工作流管理系统包括:计算服务器、Web服务器、云端工作流库、工作流发布模块和分析操作模块;
所述工作流发布模块用于实现工作流发布,在工作流发布模块中,开发用户根据本地的生物信息分析工作流所需计算参数,建立生物信息分析工作流的参数配置控件,并将生物信息分析工作流及参数配置控件上传至云端工作流库中存储;
所述分析操作模块用于实现工作流的选择和数据配置,在分析操作模块中,云端访问用户自云端工作流库中选择一个生物信息分析工作流,基于参数配置控件确定生物信息分析工作流所需计算参数的取值,并输入生物医学数据;
所述Web服务器将生物医学数据和所需计算参数的取值传递给计算服务器,所述计算服务器为生物信息分析工作流分配计算资源,得到生物信息分析工作流对生物医学数据的分析结果,并将分析结果回传给Web服务器;
所述工作流发布模块为可视化的工作流发布模块,在所述工作流发布模块中,开发用户还分别为每个生物信息分析工作流配置了所需计算资源、工作流简介信息和云端用户访问权限;
所述分析操作模块为可视化的分析操作模块,在所述分析操作模块中,对于选定的生物信息分析工作流,基于参数配置控件可视化显示待输入的所需计算参数,包括参数名称和参数可选缺省值,Web服务器以json格式将所需计算参数的取值传递给计算服务器;
还包括可视化的结果管理模块,在所述结果管理模块中,Web服务器将分析结果按照开发用户预设置的结果可视化排版规则进行排版和可视化展示。
2.根据权利要求1所述的生物信息分析工作流管理系统,其特征在于,本地的生物信息分析工作流是开发用户在本地将多个软件串并联建立的分析工作流,生物信息分析工作流按所属类别在云端工作流库中存储。
3.根据权利要求1所述的生物信息分析工作流管理系统,其特征在于,还包括可视化的分类管理模块,所述分类管理模块为工作流发布模块和分析操作模块提供可视化的生物信息分析工作流分类管理,在工作流发布模块上传生物信息分析工作流时可视化的选择生物信息分析工作流所属类别,将生物信息分析工作流按所属类别在云端工作流库中存储,在分析操作模块选择生物信息分析工作流时可视化的展示不同类别的生物信息分析工作流。
4.根据权利要求1所述的生物信息分析工作流管理系统,其特征在于,还包括客户端和用户管理模块,开发用户和云端访问用户通过所述客户端登录Web服务器,所述用户管理模块用于进行用户信息管理和用户权限管理,用户信息包括注册信息、历史上传生物信息分析工作流信息和历史分析结果信息,用户权限包括开发用户权限和云端访问用户权限。
5.根据权利要求4所述的生物信息分析工作流管理系统,其特征在于,所述用户管理模块还设有专家审核单元,所述专家审核单元对开发用户上传的生物信息分析工作流的安全性及参数配置控件的合法性进行审核,通过审核的生物信息分析工作流及参数配置控件存储至云端工作流库,云端用户根据自身的权限对云端工作流库中的生物信息分析工作流进行云端访问和使用。
CN202110539383.XA 2021-05-17 2021-05-17 生物信息分析工作流多用户云端访问方法、管理系统 Active CN113158113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110539383.XA CN113158113B (zh) 2021-05-17 2021-05-17 生物信息分析工作流多用户云端访问方法、管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110539383.XA CN113158113B (zh) 2021-05-17 2021-05-17 生物信息分析工作流多用户云端访问方法、管理系统

Publications (2)

Publication Number Publication Date
CN113158113A CN113158113A (zh) 2021-07-23
CN113158113B true CN113158113B (zh) 2023-05-12

Family

ID=76876316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110539383.XA Active CN113158113B (zh) 2021-05-17 2021-05-17 生物信息分析工作流多用户云端访问方法、管理系统

Country Status (1)

Country Link
CN (1) CN113158113B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022007A (zh) * 2016-06-14 2016-10-12 中国科学院北京基因组研究所 面向生物组学大数据计算的云平台系统及方法
CN110838338A (zh) * 2018-08-15 2020-02-25 上海美吉生物医药科技有限公司 生物分析项目的建立系统、方法、存储介质、及电子设备
AU2020103205A4 (en) * 2020-10-20 2021-01-14 Agricultural Information Institute, Chinese Academy of Agricultural Sciences Biological information deep mining and analysis system infrastructure construction method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239675A (zh) * 2017-07-21 2017-10-10 上海桑格信息技术有限公司 基于云平台的生物信息分析系统
US11687063B2 (en) * 2018-07-24 2023-06-27 Siemens Aktiengesellschaft Semantics-based internet of things device data processing-related application installation method and apparatus
CN109766202A (zh) * 2019-01-11 2019-05-17 电子科技大学 一种基于工作流的高性能地学计算通用服务平台
CN110737485A (zh) * 2019-09-29 2020-01-31 武汉海昌信息技术有限公司 一种基于云架构的工作流配置系统和方法
CN112162727B (zh) * 2020-09-16 2024-08-02 深圳晶泰科技有限公司 云端高性能科学计算工作流设计控制系统及用户图形界面
CN112382343A (zh) * 2020-11-16 2021-02-19 天津奇云诺德生物医学有限公司 一种可视化生物信息分析流程框架系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022007A (zh) * 2016-06-14 2016-10-12 中国科学院北京基因组研究所 面向生物组学大数据计算的云平台系统及方法
CN110838338A (zh) * 2018-08-15 2020-02-25 上海美吉生物医药科技有限公司 生物分析项目的建立系统、方法、存储介质、及电子设备
AU2020103205A4 (en) * 2020-10-20 2021-01-14 Agricultural Information Institute, Chinese Academy of Agricultural Sciences Biological information deep mining and analysis system infrastructure construction method

Also Published As

Publication number Publication date
CN113158113A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
US20220382719A1 (en) Change request visualization in hierarchical systems
CN107918600B (zh) 报表开发系统及方法、存储介质和电子设备
US10558645B2 (en) Systems and methods for an enterprise data integration and troubleshooting tool
US20210117985A1 (en) Analytics engine for detecting medical fraud, waste, and abuse
US8417734B2 (en) Systems and methods for managing sets of model objects via unified management interface
CN108537008A (zh) 高通量基因测序大数据分析云平台系统
CN112801607A (zh) 一种管理服务平台及构建方法
US11620598B2 (en) Electronic board associated with a communication platform
CN112860777B (zh) 数据处理方法、装置及设备
US11755698B2 (en) Systems, methods, and devices for automation and integration of credentialing and authentication in workflows associated with computing platforms
CN110321283A (zh) 接口测试用例生成方法、装置、计算机装置及存储介质
CN115170048A (zh) 基于模型和规则的工作流实现方法、系统和介质
CN112559603B (zh) 特征提取方法、装置、设备及计算机可读存储介质
JP5822414B2 (ja) ソーシャルネットワークインターフェイスを使用した汎用シミュレーションシステム
CN113158113B (zh) 生物信息分析工作流多用户云端访问方法、管理系统
Basajja et al. Proof of concept and horizons on deployment of FAIR Data Points in the COVID-19 pandemic
CN116089490A (zh) 数据分析方法、装置、终端和存储介质
Stankovski et al. A Service-Centric Perspective for Data Mining in Complex Problem Solving Environments.
US20170046448A1 (en) Information processing device and information processing method
WO1997042589A1 (en) Integration management template method and system
US20240241758A1 (en) Flexible computing resource cluster allocation
US12132716B2 (en) Systems, methods, and devices for automation and integration of credentialing and authentication in workflows associated with computing platforms
US20220337569A1 (en) Systems, methods, and devices for automation and integration of credentialing and authentication in workflows associated with computing platforms
US20230161596A1 (en) Unified pipeline flow with common and phase-specific paths
Gosein IT Architecture Design of a Future Data Analysis System for Particle Physics at CERN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant