CN105260243A - 一种集群作业调度方法与系统 - Google Patents

一种集群作业调度方法与系统 Download PDF

Info

Publication number
CN105260243A
CN105260243A CN201510727434.6A CN201510727434A CN105260243A CN 105260243 A CN105260243 A CN 105260243A CN 201510727434 A CN201510727434 A CN 201510727434A CN 105260243 A CN105260243 A CN 105260243A
Authority
CN
China
Prior art keywords
instrument
node
analysis
queue
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510727434.6A
Other languages
English (en)
Other versions
CN105260243B (zh
Inventor
王荣廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510727434.6A priority Critical patent/CN105260243B/zh
Publication of CN105260243A publication Critical patent/CN105260243A/zh
Application granted granted Critical
Publication of CN105260243B publication Critical patent/CN105260243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种集群作业调度方法与系统,检测高性能集群中所有节点的配置信息,在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性,在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性,根据目标分析工具的工具队列属性匹配对应的目标节点,在所述目标节点上执行所述目标分析工具,将高性能集群,Galaxy生物信息分析平台,PBS作业调度系统相融合,将集群节点类型分类,针对Galaxy平台不同分析工具的运行特点,绑定对应的节点,使分析工具在适合的节点上工作,提高了Galaxy平台分析工具的运行效率。

Description

一种集群作业调度方法与系统
技术领域
本发明涉及生物信息领域,特别是涉及一种基于集群作业调度方法与系统。
背景技术
传统的Galaxy生物信息分析平台,一般是将Galaxy平台与高性能集群简单的进行整合,平台中的各个工具运行后,直接将作业提交到集群中运行。
但是Galaxy生物信息分析平台中各个工具都有对应的运行特点,适合在不同类型的节点上运行,但现在无法针对各个工具的运行特点,针对性的将作业提交到某一节点,导致Galaxy平台中分析工具的运行效率不高,同时造成了集群计算资源的浪费。
发明内容
有鉴于此,本发明的主要目的在于提供一种集群作业调度方法与系统,可以提高Galaxy平台分析工具的运行效率。
为实现上述目的,本发明提供了一种集群作业调度方法,包括:
检测高性能集群中所有节点的配置信息;
在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
根据目标分析工具的工具队列属性匹配对应的目标节点;
在所述目标节点上执行所述目标分析工具。
优选地,检测高性能集群中所有节点的配置信息前还包括:
在高性能集群中进行PBS作业调度系统和Galaxy生物信息分析平台的配置。
优选地,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性包括:
确定各分析工具适合运行的对应节点,分别将各所述分析工具对应节点的节点队列属性标记为该分析工具的工具队列属性。
优选地,根据目标分析工具的工具队列属性匹配对应的目标节点包括:
确定目标分析工具的工具队列属性,根据该工具队列属性匹配对应的节点队列属性标记的目标节点。
优选地,所述节点的配置信息包括CPU数量,CPU主频以及内存值。
本发明还提供了一种集群作业调度系统,包括:
配置信息获取模块,用于检测高性能集群中所有节点的配置信息;
节点队列属性标记模块,用于在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
工具队列属性标记模块,用于在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
匹配模块,用于根据目标分析工具的工具队列属性匹配对应的目标节点;
执行模块,用于在所述目标节点上执行所述目标分析工具。
优选地,所述集群作业调度系统还包括:
配置模块,用于在高性能集群中进行PBS作业调度系统和Galaxy生物信息分析平台的配置。
优选地,所述节点的配置信息包括CPU数量,CPU主频以及内存值。
应用本发明提供的一种集群作业调度方法与系统,检测高性能集群中所有节点的配置信息,在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性,在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性,根据目标分析工具的工具队列属性匹配对应的目标节点,在所述目标节点上执行所述目标分析工具,将高性能集群,Galaxy生物信息分析平台,PBS作业调度系统相融合,将集群节点类型分类,针对Galaxy平台不同分析工具的运行特点,绑定对应的节点,使分析工具在适合的节点上工作,提高了Galaxy平台分析工具的运行效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明一种集群作业调度方法实施例一的流程图;
图2为本发明一种集群作业调度方法实施例一的原理示意图;
图3为本发明一种集群作业调度方法实施例一的详细原理示意图;
图4为本发明一种集群作业调度系统实施例二的结构示意图;
图5为本发明一种集群作业调度系统实施例三的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
本发明提供了一种集群作业调度方法,图1示出了本发明集群作业调度方法实施例一的流程图,包括:
步骤S101:检测高性能集群中所有节点的配置信息;
首先在高性能集群中,安装配置PBS作业调度系统,安装Galaxy生物信息分析平台,并安装分析工具如基因测序工具,检测HPC高性能集群中所有节点的配置信息,包括CPU数量CPU主频内存大小等配置信息,如对集群中节点node1的配置信息进行检测,检测到node1的配置是:胖节点,高主频,大内存。
步骤S102:在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
根据检测到的节点配置信息,在PBS作业调度系统中为节点标记不同的队列属性,如根据node1检测到的配置信息为其标记队列属性为FAT-HF-HM(胖节点-高主频-大内存)。
步骤S103:在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
在Gxlaxy生物信息分析平台中,确定各分析工具适合运行的对应节点,分别将各所述分析工具对应节点的节点队列属性标记为该分析工具的工具队列属性,如查找Galaxy平台中适合在node1上运行的分析工具,查找到分析工具bwa适合在node1上运行,为其标记队列属性FAT-HF-HM。
步骤S104:根据目标分析工具的工具队列属性匹配对应的目标节点;
要使用目标分析工具时,确定目标分析工具的工具队列属性,根据该工具队列属性匹配对应的节点队列属性标记的目标节点,如使用bwa工具时,首先查找其对应队列属性的队列FAT-HF-HM,根据队列FAT-HF-HM,查找到队列属性为FAT-HF-HM的节点node1。
步骤S105:在所述目标节点上执行所述目标分析工具。
在节点node1上开始执行分析工具bwa。
如图2所示,为本实施例的原理图,图3为本实施例具体实施过程原理图。
应用本实施例提供的一种集群作业调度方法,检测高性能集群中所有节点的配置信息,在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性,在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性,根据目标分析工具的工具队列属性匹配对应的目标节点,在所述目标节点上执行所述目标分析工具,将高性能集群,Galaxy生物信息分析平台,PBS作业调度系统相融合,将集群节点类型分类,针对Galaxy平台不同分析工具的运行特点,绑定对应的节点,使分析工具在适合的节点上工作,提高了Galaxy平台分析工具的运行效率。
实施例二:
本发明还提供了一种集群作业调度系统,图4示出了本发明集群作业调度系统实施例二的结构示意图,包括:
配置信息获取模块101,用于检测高性能集群中所有节点的配置信息;
节点队列属性标记模块102,用于在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
工具队列属性标记模块103,用于在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
匹配模块104,用于根据目标分析工具的工具队列属性匹配对应的目标节点;
执行模块105,用于在所述目标节点上执行所述目标分析工具。
本实施例中所述节点的配置信息包括CPU数量,CPU主频以及内存值,应用本实施例提供的一种集群作业调度系统,检测高性能集群中所有节点的配置信息,在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性,在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性,根据目标分析工具的工具队列属性匹配对应的目标节点,在所述目标节点上执行所述目标分析工具,将高性能集群,Galaxy生物信息分析平台,PBS作业调度系统相融合,将集群节点类型分类,针对Galaxy平台不同分析工具的运行特点,绑定对应的节点,使分析工具在适合的节点上工作,提高了Galaxy平台分析工具的运行效率。
实施例三:
图5示出了本发明集群作业调度系统实施例三的结构示意图,对应于图4,还包括:
配置模块100,用于在高性能集群中进行PBS作业调度系统和Galaxy生物信息分析平台的配置。
本实施例中所述节点的配置信息包括CPU数量,CPU主频以及内存值。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的方法和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种集群作业调度方法,其特征在于,包括:
检测高性能集群中所有节点的配置信息;
在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
根据目标分析工具的工具队列属性匹配对应的目标节点;
在所述目标节点上执行所述目标分析工具。
2.根据权利要求1所述的集群作业调度方法,其特征在于,检测高性能集群中所有节点的配置信息前还包括:
在高性能集群中进行PBS作业调度系统和Galaxy生物信息分析平台的配置。
3.根据权利要求1所述的集群作业调度方法,其特征在于,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性包括:
确定各分析工具适合运行的对应节点,分别将各所述分析工具对应节点的节点队列属性标记为该分析工具的工具队列属性。
4.根据权利要求1所述的集群作业调度方法,其特征在于,根据目标分析工具的工具队列属性匹配对应的目标节点包括:
确定目标分析工具的工具队列属性,根据该工具队列属性匹配对应的节点队列属性标记的目标节点。
5.根据权利要求1~4任一项所述的集群作业调度方法,其特征在于,所述节点的配置信息包括CPU数量,CPU主频以及内存值。
6.一种集群作业调度系统,其特征在于,包括:
配置信息获取模块,用于检测高性能集群中所有节点的配置信息;
节点队列属性标记模块,用于在PBS作业调度系统中,根据检测到的各所述节点的配置信息,分别为各所述节点标记对应的节点队列属性;
工具队列属性标记模块,用于在Gxlaxy生物信息分析平台中,根据各分析工具的运行特点,分别为各所述分析工具标记对应的工具队列属性;
匹配模块,用于根据目标分析工具的工具队列属性匹配对应的目标节点;
执行模块,用于在所述目标节点上执行所述目标分析工具。
7.根据权利要求2所述的集群作业调度系统,其特征在于,还包括:
配置模块,用于在高性能集群中进行PBS作业调度系统和Galaxy生物信息分析平台的配置。
8.根据权利要求6和7任一项所述的集群作业调度系统,其特征在于,所述节点的配置信息包括CPU数量,CPU主频以及内存值。
CN201510727434.6A 2015-10-30 2015-10-30 一种集群作业调度方法与系统 Active CN105260243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510727434.6A CN105260243B (zh) 2015-10-30 2015-10-30 一种集群作业调度方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510727434.6A CN105260243B (zh) 2015-10-30 2015-10-30 一种集群作业调度方法与系统

Publications (2)

Publication Number Publication Date
CN105260243A true CN105260243A (zh) 2016-01-20
CN105260243B CN105260243B (zh) 2018-10-12

Family

ID=55099946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510727434.6A Active CN105260243B (zh) 2015-10-30 2015-10-30 一种集群作业调度方法与系统

Country Status (1)

Country Link
CN (1) CN105260243B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273196A (zh) * 2017-05-31 2017-10-20 中国科学院北京基因组研究所 生物信息学高性能计算作业调度及系统管理套件

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294535A (zh) * 2012-02-29 2013-09-11 韩国电子通信研究院 最大化磁盘缓存效果的工作流作业调度装置及方法
CN104572306A (zh) * 2015-01-28 2015-04-29 中国石油集团川庆钻探工程有限公司地球物理勘探公司 计算机集群的资源管理方法、资源管理器
US20150248312A1 (en) * 2014-02-28 2015-09-03 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Performance-aware job scheduling under power constraints
CN104915407A (zh) * 2015-06-03 2015-09-16 华中科技大学 一种基于Hadoop多作业环境下的资源调度方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294535A (zh) * 2012-02-29 2013-09-11 韩国电子通信研究院 最大化磁盘缓存效果的工作流作业调度装置及方法
US20150248312A1 (en) * 2014-02-28 2015-09-03 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Performance-aware job scheduling under power constraints
CN104572306A (zh) * 2015-01-28 2015-04-29 中国石油集团川庆钻探工程有限公司地球物理勘探公司 计算机集群的资源管理方法、资源管理器
CN104915407A (zh) * 2015-06-03 2015-09-16 华中科技大学 一种基于Hadoop多作业环境下的资源调度方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王小磊等: "利用Galaxy 与高性能计算集群构建本地化一站式生物信息学平台", 《军事医学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273196A (zh) * 2017-05-31 2017-10-20 中国科学院北京基因组研究所 生物信息学高性能计算作业调度及系统管理套件

Also Published As

Publication number Publication date
CN105260243B (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
US10209082B2 (en) Method and apparatus for matching probe points to road segments utilizing a trajectory identifier
DE602005015600D1 (de) Vorrichtung, system und verfahren zum testen eines geräts mit eingeschränkten ressourcen
CN115455521A (zh) 给排水机房系统图生成方法、装置、设备及存储介质
CN105224708A (zh) 集成电路中网路的确定方法和装置
CN104035747A (zh) 用于并行计算的方法和装置
CN105260243A (zh) 一种集群作业调度方法与系统
CN103163406A (zh) 基于can网络汽车仪表耐久试验台
CN202524426U (zh) 一种企业云计算服务应用系统
CN104268059A (zh) 一种智能移动终端的应用程序查找方法和系统
CN104090813A (zh) 一种云数据中心的虚拟机cpu使用率的分析建模方法
CN106354926B (zh) 一种电力设计三维仿真系统
CN103246512B (zh) 一种将VG图形转换为Visio图形的方法
CN105138642A (zh) 一种基于html5的动态标绘方法及装置
CN105653205A (zh) 一种用户请求处理方法与系统
CN104933531A (zh) 一种数据分析方法及装置
CN105786686A (zh) 边界值测试方法及装置
CN110688207A (zh) 一种嵌入式任务调度方法及系统
CN103838822A (zh) 基于服务triz的服务设计冲突识别方法
CN203941424U (zh) 一种产品虚拟零部件与实际零部件间通讯实现系统
Liamwiset et al. Detection of design patterns in software design model using graph
CN103514123A (zh) 一种usb设备连接端口的识别方法及系统
CN112307589B (zh) 单位工况创建方法、装置、电子设备及存储介质
Chen et al. Simulation-based research on adjustment technology of ship block production plan
CN105512673A (zh) 汽车元器件多区域特征采集方法、汽车元器件识别方法及其在智能眼镜的应用
Aghaeepour FlowMeans: non-parametric flow cytometry data gating

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant