CN104572306B - 计算机集群的资源管理方法、资源管理器 - Google Patents

计算机集群的资源管理方法、资源管理器 Download PDF

Info

Publication number
CN104572306B
CN104572306B CN201510044203.5A CN201510044203A CN104572306B CN 104572306 B CN104572306 B CN 104572306B CN 201510044203 A CN201510044203 A CN 201510044203A CN 104572306 B CN104572306 B CN 104572306B
Authority
CN
China
Prior art keywords
calculate node
cluster
processing system
batch processing
pending operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510044203.5A
Other languages
English (en)
Other versions
CN104572306A (zh
Inventor
汤成兵
严飞
郭玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Petroleum Corp
BGP Inc
Original Assignee
BGP Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGP Inc filed Critical BGP Inc
Priority to CN201510044203.5A priority Critical patent/CN104572306B/zh
Publication of CN104572306A publication Critical patent/CN104572306A/zh
Application granted granted Critical
Publication of CN104572306B publication Critical patent/CN104572306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种计算机集群的资源管理方法、资源管理器,所述方法包括:在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;从所述集群的批处理系统管理的各个计算节点中,查找出设备信息符合获取的待执行作业的相关信息的计算节点;将查找到的计算节点的标识发送给所述集群的批处理系统;命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。

Description

计算机集群的资源管理方法、资源管理器
技术领域
本申请属于高性能计算领域,特别涉及一种在计算机集群中实现动态调度管理的技术。
背景技术
随着现代计算机技术的发展,地震勘探、预测模型的构造和模拟、工业设计以及自动化等各个领域的计算系统规模越来越大,这些大型计算系统中包含了各种应用系统、各种计算类型及海量计算资源。
为管理协调这些计算资源,通常采用PBS(portable batch system)资源管理器(即,批处理系统)解决大型计算系统中计算作业的批量提交问题,目前有三个版本:OpenPBS、Torque以及PBS pro,其中Torque为PBS的开源版本。目前大部分计算应用软件都通过PBS完成批量作业的提交及资源管理。
然而,现有的批处理系统在实际应用中,通常存在以下问题:
1、各应用软件的批处理系统间无法通信,导致各应用软件的计算资源边界模糊,容易引起资源竞争失败。
2、批处理系统策略预置,灵活性差。批处理系统所需要的计算节点、应用软件、环境配置、存储等必须事先配置好,一旦不满足提交条件,则会导致批处理作业提交失败,中断批处理作业提交进程。
3、批处理系统没有作业运行条件检查功能,即使提交的作业进入计算实体,仍然有可能因为运行条件不满足,从而导致批处理作业运行失败,造成作业重复提交,引起资源浪费。
因此,如何管理协调这些计算资源,最大限度的利用资源,在这类大规模计算系统中显得尤其重要。
发明内容
本发明的目的在于提供一种计算机集群的资源管理方法、资源管理器,以解决上述问题。
根据本发明的一方面,提供一种计算机集群的资源管理方法,所述方法包括:(A)在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;(B)从所述集群的批处理系统管理的各个计算节点中,查找设备信息符合获取的待执行作业的相关信息的计算节点;(C)将查找到的计算节点的标识发送给所述集群的批处理系统;(D)命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。
优选地,所述方法还包括:如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行空闲节点的搜索步骤:从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;当完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统;命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行。
优选地,所述将配置过的计算节点的标识发送给所述集群的批处理系统的步骤包括:检测配置过的计算节点的设备信息;如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;如果检测的设备信息不符合获取的待执行作业的相关信息,则返回执行空闲节点的搜索步骤。
优选地,所述方法还包括:如果没有查找出空闲的计算节点,则在预定时间段之后,返回执行步骤(B)。
优选地,所述方法还包括:当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将配置过的计算节点恢复到原先的设备状态。
根据本发明的另一方面,提供一种计算机集群的资源管理器,所述资源管理器包括:作业获取单元,用于在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;第一查找单元,用于从所述集群的批处理系统管理的各个计算节点中,查找设备信息符合获取的待执行作业的相关信息的计算节点;作业分配单元,用于将查找到的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。
优选地,所述资源管理器还包括:第二查找单元,用于如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行空闲节点的搜索步骤:从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;环境配置单元,用于按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;所述作业分配单元在完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行。
优选地,所述作业分配单元包括:信息检测单元,用于检测配置过的计算节点的设备信息;第一处理单元,用于如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;第二处理单元,用于如果检测的设备信息不符合获取的待执行作业的相关信息,则返回所述第二查找单元中执行空闲节点的搜索步骤。
优选地,所述资源管理器还包括:第三处理单元,用于如果没有查找出空闲的计算节点,则在预定时间段之后,并返回所述第一查找单元执行步骤(B)。
优选地,所述资源管理器还包括:资源回收单元,用于当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将查找到的计算节点恢复到原先的设备状态。
与现有技术相比,本发明不仅提高了作业在批处理过程的灵活性、消除了集群中计算资源的孤岛,而且进一步提升了大型计算系统的易用性,提高资源利用率。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是示出根据本发明的示例性实施例的计算机集群的资源管理方法的流程图;
图2是示出根据本发明的示例性实施例的计算机集群的资源管理器的结构框图;
图3是示出根据本发明的示例性实施例的在Torque批处理系统中实现动态调度的示意图。
具体实施方式
以下,将参照附图来详细说明本发明的实施例。
图1示出了本发明一种计算机集群的资源管理方法的优选实施例的流程图。
参照图1,在步骤110中,在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息。
通常,在待执行作业中包含有待执行作业所需计算节点数量、运行作业所需的应用软件名称、运行时对设备内存及缓冲区的要求、文件系统等各种参数信息,因此,在本发明中,可通过获取待执行作业的相关信息,分析待执行作业的需求,从而选择出合适的计算节点来执行作业,为筛选出合适的计算节点,在本发明一个可选的实施例中,可选择待执行作业的应用软件的种类、内存需求量、许可需求的数量、缓冲区大小、文件系统中的一个或多个信息作为筛选计算节点的条件。
在步骤120中,从所述集群的批处理系统管理的各个计算节点中,查找设备信息符合获取的待执行作业的相关信息的计算节点。
在本发明中,计算节点的设备信息主要包括计算节点的资源信息和状态信息,例如,节点上安装的各种应用程序、内存容量、缓冲区的大小以及运行的状况等。
在步骤130中,将查找到的计算节点的标识发送给所述集群的批处理系统,并在步骤140中,命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。换句话讲,就是由所述集群的批处理系统来完成待执行作业的分配、监控以及提交等。
这里,所述的标识可以是设备的名称、IP地址以及编号等能够唯一区别集群中各个计算机设备的标识信息。优选地,可利用集群的批处理系统提供预定的作业命令接口,将查找到的标识作为参数传递给所述集群的批处理系统。以下示出了PBS批处理系统中提供的qsub命令接口:
qsub[-a date_time][-A account_string][-e path][-h][-I][-j join][-kkeep][-l resource_list][-m mail_options][-n Node_allocation_Method[-L v1,[v2,[v3,[v4]]]]][-M user_list][-N name][-o path][-p priority][-q pool][-r y|n][-uuser_list][-v variable_list][-V][script]
具体实施时,可通过qsub命令接口中的的resource_list参数将查找到的计算节点的标识信息传递给批处理系统,批处理系统在接收到qsub命令后,可通过解析resource_list参数获取到查找到的计算节点。
需要说明的是,本发明包括但不限于qsub命令接口来实现信息的传递,也可利用系统提供的其他通信接口,将节点信息发送给批处理系统。
在上述实施过程中,可能会出现集群中现有的计算资源都不符合计算需求,但是集群中仍然存在空闲的计算节点,只是这种空闲节点不能运行待执行作业。为使得空闲的计算节点的资源也能得到利用,在图1所示的实施例中,所述方法还包括:如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;当完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统;命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行。
具体实施时,可根据获取的待执行作业的相关信息中的应用软件的种类配置所述空闲的计算节点的计算环境(即,各种应用软件的安装),从而使得查找到的空闲的计算节点能够运行待执行作业。此外,计算环境的配置操作还包括:各种应用软件的挂接、配置文件的更改、后台进程的启动等操作。
尽管被配置的计算节点的计算环境发生了变化,具备了运行作业的基本条件,但是,为进一步确保被配置的计算节点能够更好地运行待执行作业,还需要考虑运行作业所需的内存、缓冲区等其他相关条件,以便查找到更为合适的节点来运行待执行作业。在搜索空闲节点的实施例中,可检测配置过的计算节点的设备信息;如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;如果检测的设备信息不符合获取的待执行作业的相关信息,则继续从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点。换句话讲,就是通过检测被配置的计算节点的设备信息,来进一步确定该计算节点是否为执行作业所需的节点。
由于集群中的节点资源在预定时间段之后会发生变化,例如,当有其他的作业完成之后,会将计算节点释放会集群中。因此,在搜索空闲节点的实施例中,所述方法还包括:如果没有查找出空闲的计算节点,则在预定时间段之后,并返回执行步骤120。换言之,就是将待执行任务挂起,等待预定时间段之后,返回步骤120重新查找符合获取的待执行作业的相关信息的计算节点。
此外,为合理地利用集群中的各个节点,在配置计算节点的实施例中,所述方法还包括:当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将配置过的计算节点恢复到原先的设备状态。
由此可见,上述实施过程是以待执行作业的需求为中心,计算机集群的计算资源(例如,计算节点、网络、存储、本地缓存区、许可服务器、后台进程等)为对象,通过对待执行作业的需求和计算机集群的计算资源进行对比分析,找出最佳资源配比,从而实现计算机集群的计算资源的动态分配与回收。
图2示出了本发明一种计算机集群的资源管理器的优选实施例的结构框图。
参照图2,该资源管理器至少包括作业获取单元201、第一查找单元202以及作业分配单元203。
其中,作业获取单元201在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;第一查找单元202从所述集群的批处理系统管理的各个计算节点中,查找出设备信息符合获取的待执行作业的相关信息的计算节点;作业分配单元203将查找到的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。
通常,在待执行作业中包含有待执行作业所需计算节点数量、运行作业所需的应用软件名称、运行时对设备内存及缓冲区的要求、文件系统等各种参数信息,因此,在本发明中,可通过获取待执行作业的相关信息,分析待执行作业的需求,从而选择出合适的计算节点来执行作业,为筛选出合适的计算节点,在本发明一个可选的实施例中,可选择待执行作业的应用软件的种类、内存需求量、许可需求的数量、缓冲区大小、文件系统中的一个或多个信息作为筛选计算节点的条件。
在上述实施过程中,可能会出现集群中现有的计算资源都不符合计算需求,但是集群中仍然存在空闲的计算节点,只是这种空闲节点不能运行待执行作业。为使得空闲的计算节点的资源也能得到利用,在图2所示的实施例中,所述资源管理器还包括:第二查找单元(图中未示出),用于如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行空闲节点的搜索步骤:从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;环境配置单元(图中未示出),用于按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;所述作业分配单元203在完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行。
具体实施时,环境配置单元可根据获取的待执行作业的相关信息中的应用软件的种类配置所述空闲的计算节点的计算环境(即,各种应用软件的安装),从而使得查找到的空闲的计算节点能够运行待执行作业。此外,计算环境的配置操作还包括:各种应用软件的挂接、配置文件的更改、后台进程的启动等操作
尽管被配置的计算节点的计算环境发生了变化,具备了运行作业的基本条件,但是,为确保被配置的计算节点能够更好地运行待执行作业,还需要考虑运行作业所需的内存、缓冲区等其他相关条件,以便查找到更为合适的节点来运行待执行作业。在搜索空闲节点的实施例中,所述作业分配单元203包括:信息检测单元(图中未示出),用于检测配置过的计算节点的设备信息;第一处理单元(图中未示出),用于如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;第二处理单元(图中未示出),用于如果检测的设备信息不符合获取的待执行作业的相关信息,则返回第二查找单元中执行空闲节点的搜索步骤。
由于集群中的节点资源在预定时间段之后会发生变化,例如,当有其他的作业完成之后,会将计算节点释放会集群中。因此,在搜索空闲节点的实施例中,还包括:第三处理单元(图中未示出),用于如果没有查找出空闲的计算节点,则在预定时间段之后,并返回所述第一查找单元执行步骤(B)。
此外,为合理地利用集群中的各个节点,在配置计算节点的实施例中,所述资源管理器还包括:资源回收单元(图中未示出),用于当当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将配置过的计算节点恢复到原先的设备状态。
以下结合Torque批处理系统,对上述实施过程作进一步的说明。
图3是示出了本发明的示例性实施例的在Torque批处理系统中实现动态调度的示意图。图中所示301为计算机集群的主节点,主节点上部署有Torque批处理系统的资源与作业服务器模块(PBS-SERVER)和作业调度器模块(PBS-SCHED);图中所示302为计算机集群的各个计算节点,各个计算节点上部署有Torque批处理系统的作业执行模块(pbs-mom);图中所示303为用户提交作业的脚本、请求的资源(job scripts),图中所示304为本发明所述的资源管理器。
通常情况下,Torque批处理系统作业服务器模块(PBS-SERVER)和作业调度器模块(PBS-SCHED)是按照管理员设定的调度策略将用户提交的作业的脚本、请求的资源(jobscripts),通过作业执行模块(pbs-mom)分配给管理员指定的计算节点来运行。由于批处理系统中的调度策略是管理员设定的,灵活性差。这意味着Torque批处系统不能按照待执行作业的需求实现动态分配和回收。
为了在Torque批处理系统中实现计算机集群的计算资源的动态分配与回收,本发明提供了如图3所示的资源管理器304。
参照图3,资源管理器304的工作流程如下:
(1)资源管理器304的Read_param模块在Torque批处理系统向其管理的各个计算节点分配待执行作业之前,从用户提交的作业的脚本、请求的资源(job scripts)中,获取待执行作业的各项指标的参数信息。
(2)资源管理器304的Node_status_check模块扫描并检测集群中的各个计算节点的设备信息,从而查找出设备信息满足获取的待执行作业的相关信息的计算节点。
(3)如果Node_status_check模块没有查找出设备信息满足获取的待执行作业的相关信息的计算节点,则查找出集群中空闲的计算节点,通过App_config模块按照获取的待执行作业的相关信息配置所述空闲的计算节点的计算环境。
(4)为确保配置后的节点能全面满足作业运行的需要,可再次使用资源管理器304的Node_status_check模块对配置过的计算节点的设备信息进行检测,以便确定该计算节点能否满足作业运行的需要。
(5)资源管理器304的Scripts_startup模块利用Torque批处理系统的qsub作业命令接口,将查找到的满足获取的待执行作业的相关信息的计算节点的标识信息发送给Torque批处理系统,并命令Torque批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。
(6)为了将配置过的计算节点恢复到配置之前的设备状态,资源管理器304的res_recycle模块在配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置计算环境时加载的各种资源。
与现有技术相比,本发明不仅提高了作业在批处理过程的灵活性、消除了集群中计算资源的孤岛,而且进一步提升了大型计算系统的易用性,提高资源利用率。
尽管已参照优选实施例为和描述了本发明,但本领域技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对这些实施例进行各种修改和变换。

Claims (8)

1.一种计算机集群的资源管理方法,其特征在于,包括:
(A)在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;
(B)从所述集群的批处理系统管理的各个计算节点中,查找设备信息符合获取的待执行作业的相关信息的计算节点,其中,设备信息包括节点上安装的各种应用程序、内存容量、缓冲区的大小以及运行的状况;
(C)如果查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行步骤(D),
如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行空闲节点的搜索步骤:从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;当完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统;命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行;
(D)将查找到的计算节点的标识发送给所述集群的批处理系统;
(E)命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行。
2.如权利要求1所述的方法,其特征在于,所述将配置过的计算节点的标识发送给所述集群的批处理系统的步骤包括:
检测配置过的计算节点的设备信息;
如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;
如果检测的设备信息不符合获取的待执行作业的相关信息,则返回执行空闲节点的搜索步骤。
3.如权利要求1或2所述的方法,其特征在于,还包括:
如果没有查找出空闲的计算节点,则在预定时间段之后,返回执行步骤(B)。
4.如权利要求1或2所述的方法,其特征在于,还包括:
当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将配置过的计算节点恢复到原先的设备状态。
5.一种计算机集群的资源管理器,其特征在于,包括:
作业获取单元,用于在向所述集群的批处理系统管理的各个计算节点分配待执行作业之前,获取待执行作业的相关信息;
第一查找单元,用于从所述集群的批处理系统管理的各个计算节点中,查找设备信息符合获取的待执行作业的相关信息的计算节点,其中,设备信息包括节点上安装的各种应用程序、内存容量、缓冲区的大小以及运行的状况;
第二查找单元,用于如果没有查找出设备信息符合获取的待执行作业的相关信息的计算节点,则执行空闲节点的搜索步骤:从所述集群的批处理系统管理的各个计算节点中,查找空闲的计算节点;
环境配置单元,用于按照获取的待执行作业的相关信息配置查找到的空闲的计算节点的计算环境;
作业分配单元,用于将查找到的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给查找到的计算节点的标识所指示的计算机运行,
所述作业分配单元在完成所述计算环境的配置时,将配置过的计算节点的标识发送给所述集群的批处理系统,并命令所述集群的批处理系统将待执行作业分配给配置过的计算节点的标识所指示的计算机运行。
6.如权利要求5所述的资源管理器,其特征在于,所述作业分配单元包括:
信息检测单元,用于检测配置过的计算节点的设备信息;
第一处理单元,用于如果检测的设备信息符合获取的待执行作业的相关信息,则将配置过的计算节点的标识发送给所述集群的批处理系统;
第二处理单元,用于如果检测的设备信息不符合获取的待执行作业的相关信息,则返回所述第二查找单元中执行空闲节点的搜索步骤。
7.如权利要求5或6所述的资源管理器,其特征在于,还包括:
第三处理单元,用于如果没有查找出空闲的计算节点,则在预定时间段之后,并返回所述第一查找单元执行步骤(B)。
8.如权利要求5或6所述的资源管理器,其特征在于,还包括:
资源回收单元,用于当配置过的计算节点完成待执行作业或者配置过的计算节点的设备信息不符合获取的待执行作业的相关信息时,释放配置过的计算节点在配置所述计算环境时加载的资源,以便将查找到的计算节点恢复到原先的设备状态。
CN201510044203.5A 2015-01-28 2015-01-28 计算机集群的资源管理方法、资源管理器 Active CN104572306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510044203.5A CN104572306B (zh) 2015-01-28 2015-01-28 计算机集群的资源管理方法、资源管理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510044203.5A CN104572306B (zh) 2015-01-28 2015-01-28 计算机集群的资源管理方法、资源管理器

Publications (2)

Publication Number Publication Date
CN104572306A CN104572306A (zh) 2015-04-29
CN104572306B true CN104572306B (zh) 2018-03-09

Family

ID=53088451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510044203.5A Active CN104572306B (zh) 2015-01-28 2015-01-28 计算机集群的资源管理方法、资源管理器

Country Status (1)

Country Link
CN (1) CN104572306B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046378A (zh) * 2015-09-08 2015-11-11 电子科技大学 一种基于地震数据的作业调度方法
CN105260243B (zh) * 2015-10-30 2018-10-12 浪潮(北京)电子信息产业有限公司 一种集群作业调度方法与系统
CN105607955A (zh) * 2015-12-23 2016-05-25 浪潮集团有限公司 一种计算任务分配的方法及装置
CN106708622B (zh) * 2016-07-18 2020-06-02 腾讯科技(深圳)有限公司 集群资源处理方法和系统、资源处理集群
CN106339261A (zh) * 2016-09-18 2017-01-18 安徽爱她有果电子商务有限公司 一种计算机集群管理方法
CN108073453B (zh) * 2016-11-11 2022-05-10 阿里巴巴集团控股有限公司 分布式集群中cpu资源的调度方法以及装置
CN106844040B (zh) * 2016-12-20 2020-08-28 北京并行科技股份有限公司 一种作业提交方法、系统及服务器
CN108536541B (zh) * 2017-03-01 2022-07-08 腾讯科技(深圳)有限公司 流程引擎对象处理方法及装置
CN108279982B (zh) * 2018-02-27 2021-11-09 郑州云海信息技术有限公司 pbs资源与hadoop资源管理方法、系统及设备
CN110209549B (zh) * 2018-05-22 2022-02-22 腾讯科技(深圳)有限公司 数据处理方法、相关装置、相关设备和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831972B2 (en) * 2005-11-03 2010-11-09 International Business Machines Corporation Method and apparatus for scheduling jobs on a network
CN101459848B (zh) * 2008-12-26 2010-11-10 西安交通大学 一种分布式多格式数字视频转码结构设计方法
CN101599026A (zh) * 2009-07-09 2009-12-09 浪潮电子信息产业股份有限公司 一种具有弹性架构的集群作业调度系统
CN103713942B (zh) * 2012-09-28 2018-01-05 腾讯科技(深圳)有限公司 在集群中调度运行分布式计算框架的方法和系统
CN103810023B (zh) * 2014-03-06 2016-09-07 中国科学院信息工程研究所 一种云平台中分布式应用的智能部署方法及系统

Also Published As

Publication number Publication date
CN104572306A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN104572306B (zh) 计算机集群的资源管理方法、资源管理器
US11307890B2 (en) Methods and apparatus to manage virtual machines
CN106776005B (zh) 一种面向容器化应用的资源管理系统及方法
JP6939132B2 (ja) アプリケーション・プロファイリング・ジョブ管理システム、プログラム、及び方法
CN113243005A (zh) 按需网络代码执行系统中的基于性能的硬件仿真
US8423605B2 (en) Parallel distributed processing method and computer system
US8739169B2 (en) Method for monitoring operating experiences of images to improve workload optimization in cloud computing environments
US8286178B2 (en) Allocation and regulation of CPU entitlement for virtual processors in logical partitioned platform
US11669599B2 (en) Systems and methods for software license management
US20230342191A1 (en) Task Scheduling Method and System
CN110134738B (zh) 分布式存储系统资源预估方法、装置
CN103873534A (zh) 一种应用集群迁移方法及装置
US9507589B2 (en) Search based content inventory comparison
CN104683171A (zh) 应用软件的实时监控方法及装置
US9075647B2 (en) Preemptive guest merging for virtualization hypervisors
WO2021178084A1 (en) Automated runtime configuration for dataflows
CN102098223A (zh) 节点设备调度方法、装置和系统
US9092205B2 (en) Non-interrupting performance tuning using runtime reset
CN106844036A (zh) 物理设备的访问方法及装置
WO2021096346A1 (en) A computer-implemented system for management of container logs and its method thereof
CN109144709A (zh) 一种处理大数据平台yarn数据分配不均衡的方法
CN101488872B (zh) 生物信息计算网格系统
US20230185472A1 (en) Dynamic system workload placement in cloud infrastructures
SE2151266A1 (en) A method for determining a cycle time in a software project, a computer program product and an apparatus
CN114816731A (zh) 测试任务的分配方法、计算机可读存储介质和处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180129

Address after: 072751 Zhuozhou, Baoding, Fan Yang Road West, No. 189

Applicant after: BGP INC., CHINA NATIONAL PETROLEUM Corp.

Address before: Shuangliu County Huayang Huayang Road in Chengdu city of Sichuan Province in 610213 section of No. 216, Igawa geophysical exploration company of the Ministry of science and technology

Applicant before: CNPC CHUANQING DRILLING ENGINEERING Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200918

Address after: 100007 Beijing, Dongzhimen, North Street, No. 9, No.

Patentee after: CHINA NATIONAL PETROLEUM Corp.

Patentee after: BGP Inc., China National Petroleum Corp.

Address before: 072751 Zhuozhou, Baoding, Fan Yang Road West, No. 189

Patentee before: BGP Inc., China National Petroleum Corp.