CN106294081B - 生物信息分析任务运行监控系统 - Google Patents

生物信息分析任务运行监控系统 Download PDF

Info

Publication number
CN106294081B
CN106294081B CN201610666198.6A CN201610666198A CN106294081B CN 106294081 B CN106294081 B CN 106294081B CN 201610666198 A CN201610666198 A CN 201610666198A CN 106294081 B CN106294081 B CN 106294081B
Authority
CN
China
Prior art keywords
task
queue
module
run
scan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610666198.6A
Other languages
English (en)
Other versions
CN106294081A (zh
Inventor
刘宝平
刘祖明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hundred Cloud Technology Co Ltd
Original Assignee
Beijing Hundred Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hundred Cloud Technology Co Ltd filed Critical Beijing Hundred Cloud Technology Co Ltd
Priority to CN201610666198.6A priority Critical patent/CN106294081B/zh
Publication of CN106294081A publication Critical patent/CN106294081A/zh
Application granted granted Critical
Publication of CN106294081B publication Critical patent/CN106294081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开一种生物信息分析任务运行监控系统,包括:WEB图形化用户界面模块、任务准备投递模块、任务扫描监控模块、任务推送反馈模块。所述任务准备投递模块、任务扫描监控模块和任务推送反馈模块使用队列调度,当任务进入该系统后,会将该任务投递到相应的集群上运行,当扫描到该任务已运行完成,则将其运行结果推送给用户,WEB图形化用户界面模块则全程可以看到该任务的运行相关信息,最终可以看到任务的运行结果,实现用户一键投递任务,任务全程自动运行、监控处理及反馈。

Description

生物信息分析任务运行监控系统
技术领域
本发明属于生物信息工程领域,涉及生物信息技术和计算机应用技术,具体地说,涉及生物信息分析任务运行监控系统。
背景技术
随着高通量测序技术的不断发展,生物数据的产出速度变得很快,据统计,全世界二代测序技术的数据产出速度为每年13Pbp,并且还在不断加速中,生物信息学研究已经正式进入大数据时代。生物信息分析除了需要大量的计算资源之外,本身是一个非常复杂的过程。因此,大部分科研工作者会选择将成熟的分析需求交由专业的生物信息分析公司进行,分为多个分析过程。在每个分析过程完成之后,需要工作人员将结果带至下一过程的分析设备处进行分析,从而使得整个分析过程太过繁琐。而且,分析完成后,用户会得到一份纸质的或word版的结题报告,用户任务的界面体验较差。另外,现有技术缺少对分析过程的监控,使得相关人员无法获知分析任务的状态。
发明内容
针对现有技术的缺陷,本发明提供一种生物信息分析任务运行监控系统。
本发明实施例提出一种生物信息分析任务运行监控系统,包括:
WEB图形化用户界面模块、任务准备投递模块、任务扫描监控模块、任务推送反馈模块;其中,
所述WEB图形化用户界面模块,用于实时呈现任务的运行相关信息,并供用户选择任务参数,进行任务投递;
所述任务准备投递模块,用于将用户通过所述WEB图形化用户界面模块投递的任务放入投递队列,通过队列调度将所述投递队列中的任务投递到预设的任务运行集群中运行,并在预设的数据库中记录所述投递队列中的任务的运行相关信息,将所述运行相关信息实时推送至所述WEB图形化用户界面模块进行呈现;
所述任务扫描监控模块,用于将投递到所述任务运行集群中的任务放入扫描队列,通过队列调度对所述扫描队列中的任务的运行状态进行监控,将运行完毕的任务放入推送队列,并在所述数据库中记录所述扫描队列中的任务的运行相关信息,选择部分信息实时推送至所述WEB图形化用户界面模块进行呈现;
所述任务推送反馈模块,用于通过队列调度将所述推送队列中成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块进行呈现。
本发明实施例提供的生物信息分析任务运行监控系统,用户可以通过WEB图形化用户界面模块进行任务投递,便于无信息学、计算机语言储备知识的使用者直观操作,在任务投递后,通过所述任务准备投递模块将任务投递到预设的任务运行集群中运行,通过所述任务扫描监控模块监控任务的运行状态,并通过所述任务推送反馈模块将成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块进行呈现,能够实现任务的一键投递、全自动运行,而且所述任务准备投递模块、任务扫描监控模块和任务推送反馈模块会将任务的运行相关信息实时推送至所述WEB图形化用户界面模块进行呈现,便于用户查看运行相关信息,实现任务的全程监控。
附图说明
图1为本发明生物信息分析任务运行监控系统一实施例的结构示意图;
图2为本发明生物信息分析任务运行监控系统另一实施例所涉及的部分流程示意图;
图3为本发明生物信息分析任务运行监控系统又一实施例所涉及的部分流程示意图;
图4为本发明生物信息分析任务运行监控系统又一实施例所涉及的部分流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参看图1,本实施例公开一种生物信息分析任务运行监控系统,包括:
WEB图形化用户界面模块1、任务准备投递模块2、任务扫描监控模块3、任务推送反馈模块4;其中,
所述WEB图形化用户界面模块1,用于实时呈现任务的运行相关信息,并供用户选择任务参数,进行任务投递;
具体地,所述WEB图形化用户界面模块1可以采用jsp+javascript/jqury技术开发,所述运行相关信息可以包括任务的详情、运行状态、运行日志、事件信息以及运行结果信息。所述任务参数具体可以包括导入的任务原始数据文件、运行结果路径、脚本参数等等。例如如下的部分参数列表:
{"expectedTime":"2016-02-1918:50:09","inputFileList":"+a/liug/aaa.fasta","outputPath":"+a/liug/tools/a20160219182009","taskType":"soft","taskPutType":"qsub","executeJobName":"a20160219182009","shellC ode:"share/nas2/genome/toolkits/fa_toolsCxS.pl-t S–i+a/liug/aaa.fasta–o+a/liug/tools/a20160219182009/aaa.fasta_fasta_lower.fasta","userCla ss":"silver_user","permData":{"s":1}}
每个参数都有自己的含义,expectedTime表示任务预期完成时间,inputFileList表示输入文件,outputPath表示任务输出路径,taskType表示该分析任务类型(soft代表运行时间较短,占用资源较少,功能较单一的任务project代表运行时间较长,占用资源较大,流程完整的一套分析任务),taskPutType任务的投递类型(qsub代表需要申请资源来运行该任务,ssh代表之际在头节点上运行该任务,不需要申请计算资源,一般用于计算量极小的任务),executeJobName任务名称,shellCode代表该任务的原始执行脚本,userClass代表用户等级,permData表示任务所需资源,其后括号中的“"s":1”表示s型号的资源申请1个。
另外,需要说明的是,所述WEB图形化用户界面模块通过restFul接口供用户进行启动、任务投递、终止、暂停、继续操作,实现用户对任务的管理。对于终止操作,会将相应的任务的运行过程终止;对于暂停操作,则会将相应的任务的运行过程挂起,当用户选择继续操作后,则恢复相应的任务的运行。
所述任务准备投递模块2,用于将用户通过所述WEB图形化用户界面模块1投递的任务放入投递队列,通过队列调度将所述投递队列中的任务投递到预设的任务运行集群中运行,并在预设的数据库中记录所述投递队列中的任务的运行相关信息,将所述运行相关信息实时推送至所述WEB图形化用户界面模块1进行呈现;
在具体实施例中,任务准备投递模块2所涉及的流程可以参照图2所示,对于用户投递的任务,任务准备投递模块2会维护一个投递队列,将所述用户投递的任务放到该队列中,同时,任务准备投递模块2会定时遍历所述投递队列中的任务,对于遍历到的每个任务,根据对应的任务参数,对该任务进行任务脚本组装,为该任务准备资源,在资源到位后,运行相应脚本将其投递到所述任务运行集群中运行,并将所述投递到预设的任务运行集群中的任务从所述投递队列中移除。另外,需要说明的是,对于每一个用户帐户,任务准备投递模块2可以为该帐户分配一个头节点以进行资源分配。此外,任务准备投递模块2会在预设的数据库中记录投递所述投递队列中的任务的运行相关信息,将所述运行相关信息实时推送至所述WEB图形化用户界面模块1进行呈现。其中,所述运行相关信息包括任务详情、任务运行状态、运行日志以及事件记录信息。进入投递队列的任务的运行状态为投递阶段,投递到所述任务运行集群中的任务的运行状态为扫描阶段。
所述任务扫描监控模块3,用于将投递到所述任务运行集群中的任务放入扫描队列,通过队列调度对所述扫描队列中的任务的运行状态进行监控,将运行完毕的任务放入推送队列,并在所述数据库中记录所述扫描队列中的任务的运行相关信息,选择部分信息实时推送至所述WEB图形化用户界面模块1进行呈现;
在具体实施例中,任务扫描监控模块3所涉及的部分流程可以参照图3所示,所述任务扫描监控模块3,具体用于定时遍历所述扫描队列中的任务,对于遍历到的每个任务,获取该任务的运行状态,若所述运行状态显示该任务运行完毕,则将该任务从所述扫描队列中移除,放入推送队列。之后,任务扫描监控模块3会判断该任务是否是所述扫描队列中的最后一个任务,若是所述扫描队列中的最后一个任务,则判断用户是否有其它任务正在运行,若用户没有其它任务正在运行,则回收为用户投递的任务分配的资源。而若所述运行状态显示该任务未运行完毕,则将该任务放回扫描队列,等待下次扫描。需要说明的是,对于一个任务,该任务运行完毕包括两种情况:第一种情况是该任务成功运行完毕,另一种情况是该任务运行错误。对于正在运行和成功运行完毕的任务,任务扫描监控模块3会在所述数据库中记录这些任务的运行相关信息,并将除成功运行完毕的任务的运行结果外的信息实时推送给所述WEB图形化用户界面模块1进行呈现。其中,运行相关信息包括任务详情、任务运行状态、运行日志以及事件记录信息。正在运行的任务的运行状态为正在运行,进入推送队列的任务的运行状态为推送阶段。对于运行错误的任务,任务扫描监控模块3会在所述数据库中记录该任务的运行相关信息,并将该任务的运行相关信息推送给管理员,以使管理员采取相应的处理措施,确保该任务重新运行成功。
所述任务推送反馈模块4,用于通过队列调度将所述推送队列中成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块1进行呈现。
在具体实施例中,所述任务推送反馈模块4所涉及的流程可以参照图4所示,所述任务推送反馈模块4,具体用于定时遍历所述推送队列中的任务,对于遍历到的每个任务,判断该任务是否成功运行完毕,若成功运行完毕,则将该任务的运行结果推送给所述WEB图形化用户界面模块1进行呈现,否则,若运行错误,则向管理员发送通知消息,以使管理员采取相应的处理措施,确保该任务重新运行成功。此外,需要说明的是,所述任务推送反馈模块4会在所述数据库中记录所述推送队列中的任务的运行相关信息,将成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块1进行呈现,而将运行错误的任务的运行相关信息作为通知消息的内容发送给管理员。
本发明实施例提供的生物信息分析任务运行监控系统,用户可以通过WEB图形化用户界面模块进行任务投递,便于无信息学、计算机语言储备知识的使用者直观操作,在任务投递后,通过所述任务准备投递模块将任务投递到预设的任务运行集群中运行,通过所述任务扫描监控模块监控任务的运行状态,并通过所述任务推送反馈模块将成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块进行呈现,能够实现任务的一键投递、全自动运行,而且所述任务准备投递模块、任务扫描监控模块和任务推送反馈模块会将任务的运行相关信息实时推送至所述WEB图形化用户界面模块进行呈现,便于用户查看运行相关信息,实现任务的全程监控。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (8)

1.一种生物信息分析任务运行监控系统,其特征在于,包括:
WEB图形化用户界面模块、任务准备投递模块、任务扫描监控模块、任务推送反馈模块;其中,
所述WEB图形化用户界面模块,用于实时呈现任务的运行相关信息,并供用户选择任务参数,进行任务投递;
所述任务准备投递模块,用于将用户通过所述WEB图形化用户界面模块投递的任务放入投递队列,通过队列调度将所述投递队列中的任务投递到预设的任务运行集群中运行,并在预设的数据库中记录所述投递队列中的任务的运行相关信息,将所述运行相关信息实时推送至所述WEB图形化用户界面模块进行呈现;
所述任务扫描监控模块,用于将投递到所述任务运行集群中的任务放入扫描队列,通过队列调度对所述扫描队列中的任务的运行状态进行监控,将运行完毕的任务放入推送队列,并在所述数据库中记录所述扫描队列中的任务的运行相关信息,选择部分信息实时推送至所述WEB图形化用户界面模块进行呈现;
所述任务推送反馈模块,用于通过队列调度将所述推送队列中成功运行完毕的任务的运行结果推送给所述WEB图形化用户界面模块进行呈现;
所述任务推送反馈模块,用于定时遍历所述推送队列中的任务,对于遍历到的每个任务,判断该任务是否成功运行完毕,若成功运行完毕,则将该任务的运行结果推送给所述WEB图形化用户界面模块进行呈现。
2.根据权利要求1所述的系统,其特征在于,所述任务准备投递模块,具体用于定时遍历所述投递队列中的任务,对于遍历到的每个任务,根据对应的任务参数,对该任务进行任务脚本组装,为该任务准备资源,在资源到位后,运行相应脚本将其投递到所述任务运行集群中运行,并将投递到所述任务运行集群中的任务从所述投递队列中移除。
3.根据权利要求1或2所述的系统,其特征在于,所述任务扫描监控模块,具体用于定时遍历所述扫描队列中的任务,对于遍历到的每个任务,获取该任务的运行状态,若所述运行状态显示该任务成功运行完毕,则将该任务从所述扫描队列中移除,放入所述推送队列。
4.根据权利要求3所述的系统,其特征在于,所述任务扫描监控模块,还用于若所述运行状态显示该任务运行错误,则向管理员发送通知消息。
5.根据权利要求3所述的系统,其特征在于,所述任务扫描监控模块,还用于若所述运行状态显示该任务正在运行,则将该任务放回所述扫描队列。
6.根据权利要求3所述的系统,其特征在于,所述任务扫描监控模块,还用于在所述扫描队列中无正在运行的任务时,判断用户投递的任务中是否存在未运行的任务,若不存在未运行的任务,则将为用户投递的任务准备的资源进行回收。
7.根据权利要求1所述的系统,其特征在于,所述任务推送反馈模块,还用于若该任务运行错误,则向管理员发送通知消息。
8.根据权利要求1所述的系统,其特征在于,所述WEB图形化用户界面模块,还用于供用户对任务进行启动、终止、暂停、继续操作。
CN201610666198.6A 2016-08-12 2016-08-12 生物信息分析任务运行监控系统 Active CN106294081B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610666198.6A CN106294081B (zh) 2016-08-12 2016-08-12 生物信息分析任务运行监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610666198.6A CN106294081B (zh) 2016-08-12 2016-08-12 生物信息分析任务运行监控系统

Publications (2)

Publication Number Publication Date
CN106294081A CN106294081A (zh) 2017-01-04
CN106294081B true CN106294081B (zh) 2019-01-04

Family

ID=57670950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610666198.6A Active CN106294081B (zh) 2016-08-12 2016-08-12 生物信息分析任务运行监控系统

Country Status (1)

Country Link
CN (1) CN106294081B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239675A (zh) * 2017-07-21 2017-10-10 上海桑格信息技术有限公司 基于云平台的生物信息分析系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917387A (zh) * 2009-11-17 2010-12-15 新奥特(北京)视频技术有限公司 一种多媒体转码集群系统
CN103514078A (zh) * 2012-06-28 2014-01-15 鸿富锦精密工业(深圳)有限公司 硬盘监视系统
CN103092698B (zh) * 2012-12-24 2017-06-13 中国科学院深圳先进技术研究院 云计算应用自动部署系统及方法
CN103942034A (zh) * 2014-03-21 2014-07-23 深圳华大基因科技服务有限公司 任务调度方法及实现该方法的电子装置
CN104407919A (zh) * 2014-12-15 2015-03-11 浪潮软件股份有限公司 一种数据处理任务调度系统及方法
CN105373428B (zh) * 2015-12-09 2020-02-11 北京奇虎科技有限公司 一种任务调度方法和系统

Also Published As

Publication number Publication date
CN106294081A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN103309731B (zh) 处理系统
Bui et al. Work queue+ python: A framework for scalable scientific ensemble applications
US20100223446A1 (en) Contextual tracing
CN109343941A (zh) 任务处理方法、装置、电子设备及计算机可读存储介质
CN110427252A (zh) 基于任务依赖关系的任务调度方法、装置及存储介质
CN107168779A (zh) 一种任务管理方法及系统
CN102893261B (zh) 空闲转换采样方法及其系统
CN110119307B (zh) 数据处理请求的处理方法、装置、存储介质及电子装置
CN108733464A (zh) 一种确定计算任务的调度方案的方法及装置
Pi et al. Profiling distributed systems in lightweight virtualized environments with logs and resource metrics
EP2524308A2 (en) Methods and apparatus for predicting the performance of a multi-tier computer software system
CN110308984A (zh) 一种用于处理地理分布式数据的跨集群计算系统
Du et al. Hawkeye: Adaptive straggler identification on heterogeneous spark cluster with reinforcement learning
CN102999317A (zh) 面向多租户的弹性多进程服务处理方法
JP5740338B2 (ja) 仮想環境運用支援システム
EP3069272B1 (en) Managing job status
US11138086B2 (en) Collecting hardware performance data
Demirbaga et al. SmartMonit: Real-time big data monitoring system
CN106294081B (zh) 生物信息分析任务运行监控系统
Li et al. MapReduce task scheduling in heterogeneous geo-distributed data centers
JP6097666B2 (ja) ジョブ管理システム
CN109412970B (zh) 数据流转系统、数据流转方法、电子设备和存储介质
Hayes et al. Design and Analytical Model of a PlatformasaService Cloud for Healthcare
WO2017017774A1 (ja) ストレージ監視システムおよびその監視方法
CN115718741A (zh) 健康数据的自动清洗方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant