CN103279389B - 一种主机批量负载的调度方法以及调度系统 - Google Patents

一种主机批量负载的调度方法以及调度系统 Download PDF

Info

Publication number
CN103279389B
CN103279389B CN201310154417.9A CN201310154417A CN103279389B CN 103279389 B CN103279389 B CN 103279389B CN 201310154417 A CN201310154417 A CN 201310154417A CN 103279389 B CN103279389 B CN 103279389B
Authority
CN
China
Prior art keywords
lpar
running status
sysplex
resource consumption
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310154417.9A
Other languages
English (en)
Other versions
CN103279389A (zh
Inventor
胡田
杜昆鹏
陈立伟
祝萍
刘利辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN201310154417.9A priority Critical patent/CN103279389B/zh
Publication of CN103279389A publication Critical patent/CN103279389A/zh
Application granted granted Critical
Publication of CN103279389B publication Critical patent/CN103279389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种主机批量负载的调度方法及调度系统,所述方法包括:按照采集周期采集主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成SYSPLEX;根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;采集预先设定的与所述LPAR对应的资源消耗阈值;根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。克服了现有技术中SYSPLEX内部的各LPAR的资源使用无法达到平衡状态的技术难题。

Description

一种主机批量负载的调度方法以及调度系统
技术领域
本发明是关于批量处理技术领域,特别是关于批量资源的监控技术,具体的讲是一种主机批量负载的调度方法以及调度系统。
背景技术
中央处理器(CentralProcessingUnit,CPU)是大型主机中最核心的资源,CPU资源的大小是衡量一个数据中心规模的重要指标。如何对已有的CPU资源进行充分、合理、有效的使用是数据中心日常运维中面临的重要课题。主机系统的复杂架构、虚拟化技术以及复杂应用的部署使得对主机系统CPU资源的监控、管理和负载调度变得尤为复杂,系统本身的管理方法无法适用于应用的具体部署环境和数据中心的具体运维需求。
通过虚拟化技术可以在主机上虚拟出多套操作系统,同时为了保障系统的高可用性并提高并发处理能力,通常将多台机器上的多个系统连接在一起协同工作,这样的一套由多个机器上的多个系统连接在一起而组成的新系统称之为并行耦合体SYSPLEX,而组成SYSPLEX的每个系统称之为逻辑分区LPAR。用户在SYSPLEX上部署各种应用系统,系统根据应用系统的相关定义将各类应用负载分配到各个LPAR上运行。
目前主机系统本身提供了基本的资源使用监控、调度和负载均衡功能,但这些功能都是基于系统层面的,无法从用户的角度结合应用特点进行有效的监控和负载均衡。多台机器的连接使用以及虚拟化技术的使用使得用户在评估应用的资源消耗和需求的时候无法直观的了解到真实的物理CPU使用情况,这也使得资源监控、调度和应用负载均衡变得很困难。
批量处理是主机系统的主要负载类型之一,批量负载以作业的形式被分配到SYSPLEX上的各个LPAR进行处理,LPAR上运行的各个作业消耗的资源总和即为LPAR的批量资源消耗。由于应用系统本身的特性和要求,作业被分配到SYSPLEX中的哪个LPAR上需要满足相应的条件和规则,在部署了多套复杂应用系统的主机环境中,作业在各个LPAR间的分配也变得复杂。在数据中心的实际运维中,经常出现SYSPLEX内部有的LPAR出现被分配了大量的作业,但有的LAPR却只有少量作业,这一情况使得各LPAR的CPU资源使用情况变得不均衡。在CPU资源紧张的情况下经常出现繁忙的LPARCPU资源使用率达到100%,但其他LPAR的CPU资源相对空闲的情况。这样的情况一方面使得CPU资源无法得到充分的利用,另一方面也因为在繁忙的LPAR上出现了严重的资源争抢和资源等待,从而降低了整个批量的运行效率,延长了批量的执行时间。
因此,如何实现SYSPLEX内部的各LPAR的资源使用达到平衡状态一直是困扰业界的一个难题。
发明内容
为了克服了现有技术中SYSPLEX内部的各LPAR的资源使用无法达到平衡状态的技术难题,本发明实施例提供了一种主机批量负载的调度方法以及调度系统,根据应用的运行配置需求调整批量负载分配,使各LPAR的资源使用达到平衡状态,从而使得主机系统CPU资源得以充分利用,有效提升批量运行效率。
本发明的目的之一是,提供一种主机批量负载的调度方法,所述的方法包括:按照采集周期采集主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成并行耦合体SYSPLEX;根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;采集预先设定的与所述LPAR对应的资源消耗阈值;根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。
本发明的目的之一是,提供一种主机批量负载的调度系统,所述的调度系统包括:处理服务器以及多个主机,其中,所述的处理服务器具体包括:运行指标采集模块,用于按照采集周期采集所述主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成并行耦合体SYSPLEX;资源消耗值确定模块,用于根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;资源消耗阈值采集模块,用于采集预先设定的与所述LPAR对应的资源消耗阈值;LPAR运行状态确定模块,用于根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;SYSPLEX运行状态确定模块,用于根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;批量开关控制模块,用于根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。
本发明的有益效果在于,提供了一种主机批量负载的调度方法以及调度系统,克服了现有技术中SYSPLEX内部的各LPAR的资源使用无法达到平衡状态的技术难题,通过从应用的角度对系统中的各类批量负载资源消耗进行分析,并结合当前系统的CPU使用情况评估SYSPLEX中各LPAR的忙闲程度,最后根据应用的运行配置需求调整批量负载分配,使各LPAR的资源使用达到平衡状态,从而使得主机系统CPU资源得以充分利用,有效提升批量运行效率。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种主机批量负载的调度方法的实施方式一的具体流程图;
图2为图1中的步骤S102的具体流程图;
图3为图1中的步骤S104的具体流程图;
图4为图1中的步骤S105的具体流程图;
图5为图1中的步骤S106的具体流程图;
图6为本发明实施例提供的一种主机批量负载的调度方法的实施方式二的具体流程图;
图7为本发明实施例提供的一种主机批量负载的调度系统的实施方式一的结构框图;
图8为本发明实施例提供的一种主机批量负载的调度系统中处理服务器的结构框图;
图9为本发明实施例提供的一种主机批量负载的调度系统中资源消耗值确定模块的结构框图;
图10为本发明实施例提供的一种主机批量负载的调度系统中LPAR运行状态确定模块的结构框图;
图11为本发明实施例提供的一种主机批量负载的调度系统中SYSPLEX运行状态确定模块的结构框图;
图12为本发明实施例提供的一种主机批量负载的调度系统中批量开关控制模块的结构框图;
图13为本发明实施例提供的一种主机批量负载的调度系统的实施方式二的结构框图;
图14为本发明实施例提供的一种主机批量负载的调度系统的智能调度示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,通过虚拟化技术可以在主机上虚拟出多套操作系统,同时为了保障系统的高可用性并提高并发处理能力,通常将多台机器上的多个系统连接在一起协同工作,这样的一套由多个机器上的多个系统连接在一起而组成的新系统称之为并行耦合体SYSPLEX,而组成SYSPLEX的每个主机上的系统称之为逻辑分区LPAR。用户在SYSPLEX上部署各种应用系统,系统根据应用系统的相关定义将各类应用负载分配到各个LPAR上运行。
图1为本发明实施例提供的一种主机批量负载的调度方法的实施方式一的具体流程图,由图1可知,所述的方法具体包括:
S101:按照采集周期采集主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成SYSPLEX。在具体的实施方式中,可根据系统维护人员的管理经验,总结整理需关注的CPU数据相关信息,然后定期采集LPAR对应的运行指标,可采集的运行指标如表1所示。通过表1所示的数据,可以直观掌握当前系统CPU资源的使用和分配情况,满足日常管理需求。
表1
在具体的实现方式中,可利用主机的RMF系统提供的DataPortal作为数据接口,通过httprequest将数据请求发送给RMFDataPortal,然后将返回的XML数据进行解析,从中获取系统相关运行指标。请求举例如下:http://IP地址:服务端口/gpm/perform.xml?id=指标编号&RESOURCE=LPRA名称,*,对象。
对于各LPAR上运行的作业数量和排队作业数量,本发明通过系统显示与查询工具(SystemDisplayandSearchFacility,SDSF)系统提供编程接口获取系统中各个LPAR上的作业运行和排队情况,并通过套接字SOCKET方式将数据信息传递到本发明的数据收集装置。
S102:根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;
S103:采集预先设定的与所述LPAR对应的资源消耗阈值;
S104:根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;
S105:根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;
S106:根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。
本发明在主机系统的每个LPAR上进行信息采集,通过程序收集主机资源相关信息并通过网络发送给平台端处理服务器,处理服务器将数据汇总,经过计算和转化后存入数据库。同时,处理服务器按一定周期对收集到的数据进行分析,在发现负载分配不均衡的情况下进行负载的自动调整。
图2为图1中的步骤S102的具体流程图,由图2可知,该步骤具体包括:
S201:根据所述的LPAR的运行指标确定所述LPAR的中央处理器CPU资源使用率。CPU资源使用率即为所述LPAR的CPU资源使用情况。
S202:根据所述的LPAR的运行指标确定所述LPAR的作业队列值。所述LPAR上的作业队列值是即为LPAR上等待执行的作业队列深度。
S203:根据所述的LPAR的运行指标确定所述LPAR的资源权重。LPAR的资源权重即为虚拟化条件下LPAR调度资源的权重。
S204:根据所述的CPU资源使用率、所述的作业队列值以及所述的资源权重确定所述LPAR的资源消耗值。该步骤通过如下公式进行:
资源消耗值=CPU资源使用率+作业队列值+的资源权重。
图3为图1中的步骤S104的具体流程图,由图3可知,该步骤具体包括:
S301:判断所述的资源消耗值是否超过所述的资源消耗阈值。所述的资源消耗阈值是预先设定的,每个LPAR对应一个资源消耗阈值。
S302:当判断为是时,所述的LPAR的运行状态确定为繁忙。
S303:当判断为否时,所述的LPAR的运行状态确定为空闲。
图4为图1中的步骤S105的具体流程图,由图4可知,该步骤具体包括:
S401:判断组成SYSPLEX的多个LPAR对应的运行状态是否均为繁忙;
S402:当判断为是时,所述的SYSPLEX的运行状态确定为负载均衡;
S403:当判断为否时,继续判断组成SYSPLEX的多个LPAR对应的运行状态是否均为空闲,当判断为是时,返回执行步骤S402,即所述的SYSPLEX的运行状态确定为负载均衡;
S404:当判断为否时,所述的SYSPLEX的运行状态确定为负载不均衡。
即如果SYSPLEX中同时出现繁忙和空闲的LPAR,则判定SYSPLEX的批量负载并不均衡,如果系统中各LPAR的状态都为繁忙或者都为空闲,则判定系统的批量负载均衡。
图5为图1中的步骤S106的具体流程图,由图5可知,该步骤具体包括:
S501:判断所述的SYSPLEX的运行状态是否确定为负载不均衡;
S502:当判断为是时,获取组成SYSPLEX的多个LPAR对应的运行状态;
S503:从多个LPAR对应的运行状态中识别出运行状态确定为空闲的LPAR;
S504:将运行状态确定为空闲的LPAR的批量开关设置为开启状态;
S505:从多个LPAR对应的运行状态中识别出运行状态确定为繁忙的LPAR;
S506:将运行状态确定为繁忙的LPAR的批量开关设置为关闭状态。
本发明通过SOCKET接口集中控制分布在各个LPAR上面的批量开关,实现对批量负载的调整,以达到系统之间批量负载的平衡。批量开关可用于控制各LPAR上的批量负载,当这个LPAR上的开关为开启状态时,排队中的作业可以被分配到这个LPAR上运行,当开关为关闭状态时,排队中的作业将无法被分配到这个LPAR上运行。
由于本发明的步骤S101是按照采集周期采集主机上的逻辑分区LPAR对应的运行指标,因此步骤S106执行完毕之后,下一个采集周期来临时,继续返回执行步骤1,重新采集运行指标。即本发明启动之后会进入循环执行状态。首先,采集主机中各个LPAR上的相关指标,在数据采集完成后本发明会根据预设好的规则使用均衡性检查装置检查并判定批量执行情况是否均衡。对于均衡的批量执行情况,本发明会等待后进入下一个循环,重新进行数据收集;对于不均衡的批量执行情况,本发明将调整批量开关,根据采集到的数据使用预设的规则进行运算,并根据运算的结果调整批量开关,使批量负载在各个LPAR之间均衡运行。
图6为本发明实施例提供的一种主机批量负载的调度方法的实施方式二的具体流程图,由图6可知,该方法还包括如下步骤:
S607:通过WEB服务器将采集到的所述主机上的LPAR对应的运行指标进行显示。即在具体的实施方式中,可通过WEB服务器将收集到的CPU数据以监控视图的方式展示给系统管理员使用。在实际的使用过程中,可使用程序根据主机系统的虚拟化结构和应用部署规则,将采集到的数据转化为系统维护人员关注的相关数据并通过友好的图形化界面进行展示,以实现有效的资源实时监控功能。
S608:将采集到的所述主机上的LPAR对应的运行指标进行保存。可预先建立CPU资源信息数据库,在主机上部署资源信息采集程序,按照采集周期监控和分析CPU资源的相关数据并存入数据库中。
以上是本发明实施例提供的一种主机批量负载的调度方法,该方法站在数据中心系统维护人员的角度,对主机系统CPU资源的使用情况进行全局的、直观的监控和展现,使得维护人员可以快速掌握系统CPU资源的使用情况。该方法的技术思路是评估SYSPLEX内各LPAR的忙闲程度,在发现资源使用不均衡时分析当前系统上的应用负载情况,自动在各LPAR之间进行批量负载的切换,使CPU资源的使用达到平衡状态,以提高批量运行效率。这样建立起了数据中心基于应用视角的系统资源监控和批量负载调度机制,有效的提升了数据中心主机系统管理能力。
图7为本发明实施例提供的一种主机批量负载的调度系统的实施方式一的结构框图,由图7可知,该系统具体包括处理服务器100以及多个主机200,将多台主机上的多个系统连接在一起协同工作,这样的一套由多个主机上的多个系统连接在一起而组成的新系统称之为SYSPLEX,而组成SYSPLEX的每个主机上的系统称之为逻辑分区LPAR。用户在SYSPLEX上部署各种应用系统,系统根据应用系统的相关定义将各类应用负载分配到各个LPAR上运行。在图7所示的图中,共有4个LPAR。
图8为本发明实施例提供的一种主机批量负载的调度系统中处理服务器的结构框图,由图8可知,该系统中的处理服务器100具体包括:
运行指标采集模块101,用于按照采集周期采集所述主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成SYSPLEX。在具体的实施方式中,可根据系统维护人员的管理经验,总结整理需关注的CPU数据相关信息,然后定期采集LPAR对应的运行指标,可采集的运行指标如表1所示。通过表1所示的数据,可以直观掌握当前系统CPU资源的使用和分配情况,满足日常管理需求。在具体的实现方式中,可利用主机的RMF系统提供的DataPortal作为数据接口,通过httprequest将数据请求发送给RMFDataPortal,然后将返回的XML数据进行解析,从中获取系统相关运行指标。请求举例如下:http://IP地址:服务端口/gpm/perform.xml?id=指标编号&RESOURCE=LPRA名称,*,对象。
对于各LPAR上运行的作业数量和排队作业数量,本发明通过系统显示与查询工具SDSF系统提供编程接口获取系统中各个LPAR上的作业运行和排队情况,并通过SOCKET方式将数据信息传递到本发明的数据收集装置。
资源消耗值确定模块102,用于根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;
资源消耗阈值采集模块103,用于采集预先设定的与所述LPAR对应的资源消耗阈值;
LPAR运行状态确定模块104,用于根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;
SYSPLEX运行状态确定模块105,用于根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;
批量开关控制模块106,用于根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。
本发明在主机系统的每个LPAR上进行信息采集,收集主机资源相关信息并通过网络发送给平台端处理服务器,处理服务器上的运行指标采集模块将数据汇总,经过计算和转化后存入数据库。同时,处理服务器按一定周期对收集到的数据进行分析,在发现负载分配不均衡的情况下进行负载的自动调整。
图9为本发明实施例提供的一种主机批量负载的调度系统中资源消耗值确定模块的结构框图,由图9可知,所述的资源消耗值确定模块102具体包括:
CPU资源使用率确定单元1021,用于根据所述的LPAR的运行指标确定所述LPAR的中央处理器CPU资源使用率。CPU资源使用率即为所述LPAR的CPU资源使用情况。
作业队列值确定单元1022,用于根据所述的LPAR的运行指标确定所述LPAR的作业队列值。所述LPAR上的作业队列值是即为LPAR上等待执行的作业队列深度。
资源权重确定单元1023,用于根据所述的LPAR的运行指标确定所述LPAR的资源权重。LPAR的资源权重即为虚拟化条件下LPAR调度资源的权重。
资源消耗值确定单元1024,用于根据所述的CPU资源使用率、所述的作业队列值以及所述的资源权重确定所述LPAR的资源消耗值。该单元通过如下公式进行:
资源消耗值=CPU资源使用率+作业队列值+的资源权重。
图10为本发明实施例提供的一种主机批量负载的调度系统中LPAR运行状态确定模块的结构框图,由图10可知,所述的LPAR运行状态确定模块104具体包括:
第一判断单元1041,用于判断所述的资源消耗值是否超过所述的资源消耗阈值。所述的资源消耗阈值是预先设定的,每个LPAR对应一个资源消耗阈值。
繁忙状态确定单元1042,用于当所述的第一判断单元的判断结果为是时,所述的LPAR的运行状态确定为繁忙;
空闲状态确定单元1043,用于当所述的第一判断单元的判断结果为否时,所述的LPAR的运行状态确定为空闲。
图11为本发明实施例提供的一种主机批量负载的调度系统中SYSPLEX运行状态确定模块的结构框图,由图11可知,所述的SYSPLEX运行状态确定模块105具体包括:
第二判断单元1051,用于判断组成SYSPLEX的多个LPAR对应的运行状态是否均为繁忙;
第一负载均衡确定单元1052,用于当所述的第二判断单元的判断结果为是时,所述的SYSPLEX的运行状态确定为负载均衡;
第三判断单元1053,用于当所述的第二判断单元的判断结果为否时,继续判断组成SYSPLEX的多个LPAR对应的运行状态是否均为空闲;
第二负载均衡确定单元1054,用于当所述的第三判断单元的判断结果为是时,所述的SYSPLEX的运行状态确定为负载均衡;
负载不均衡确定单元1055,用于当所述的第三判断单元的判断结果为否时,所述的SYSPLEX的运行状态确定为负载不均衡。
即如果SYSPLEX中同时出现繁忙和空闲的LPAR,则判定SYSPLEX的批量负载并不均衡,如果系统中各LPAR的状态都为繁忙或者都为空闲,则判定系统的批量负载均衡。
图12为本发明实施例提供的一种主机批量负载的调度系统中批量开关控制模块的结构框图,由图12可知,所述的批量开关控制模块106具体包括:
运行状态获取单元1061,用于当所述的SYSPLEX的运行状态确定为负载不均衡时,获取组成SYSPLEX的多个LPAR对应的运行状态;
第一识别单元1062,用于从多个LPAR对应的运行状态中识别出运行状态确定为空闲的LPAR;
第一批量开关设置单元1063,用于将运行状态确定为空闲的LPAR的批量开关设置为开启状态;
第二识别单元1064,用于从多个LPAR对应的运行状态中识别出运行状态确定为繁忙的LPAR;
第二批量开关设置单元1065,用于将运行状态确定为繁忙的LPAR的批量开关设置为关闭状态。
本发明通过SOCKET接口集中控制分布在各个LPAR上面的批量开关,实现对批量负载的调整,以达到系统之间批量负载的平衡。批量开关可用于控制各LPAR上的批量负载,当这个LPAR上的开关为开启状态时,排队中的作业可以被分配到这个LPAR上运行,当开关为关闭状态时,排队中的作业将无法被分配到这个LPAR上运行。
图13为本发明实施例提供的一种主机批量负载的调度系统的实施方式二的结构框图,由图13可知,该调度系统还包括:
WEB服务器300,用于显示采集到的所述主机上的LPAR对应的运行指标。即在具体的实施方式中,可通过WEB服务器将收集到的CPU数据以监控视图的方式展示给系统管理员使用。在实际的使用过程中,可使用程序根据主机系统的虚拟化结构和应用部署规则,将采集到的数据转化为系统维护人员关注的相关数据并通过友好的图形化界面进行展示,以实现有效的资源实时监控功能。
资源数据存储器400,用于保存采集到的所述主机上的LPAR对应的运行指标。可预先建立CPU资源信息数据库,在主机上部署资源信息采集程序,按照采集周期监控和分析CPU资源的相关数据并存入数据库中。
图14为本发明实施例提供的一种主机批量负载的调度系统的智能调度示意图。图14中所示主机系统环境由四个LPAR组成了一个SYSPLEX,每个LPAR上面均有一定数量的作业正在运行,其中LPAR1有50个作业,LPAR2有60个作业,LPAR3有2个作业,LPAR4有50个作业,此外还有80个作业在排队等待被分配到各LPAR上运行。从作业的分布来看,负载的分配并不均衡。因此图14的处理服务器定期检查CPU资源的使用情况和作业的分配情况,同时在各LPAR上部署作业是否可以运行的开关,当开关打开的情况下,排队的作业可以进入到这个LPAR开始运行,当开关处于关闭的情况下,排队的作业无法进入到这个LPAR上运行。当处理服务器检查到资源使用不平衡的情况,将自动计算各个LPAR的当前负载,关闭负载高的LPAR上面的开关,打开负载低的LPAR上的开关,这样后续排队的作业将会进入到负载低的LPAR上运行,从而使各LPAR的CPU使用达到平衡状态。在图14中,SYSPLEX的分配并不均衡,LPAR1、LPAR2、LPAR4的状态信息为繁忙,LPAR3的状态信息为空闲,因此将关闭负载高的LPAR上面的开关,打开负载低的LPAR上的开关,即关闭LPAR1、LPAR2、LPAR4的批量开关,打开LPAR3的批量开关。
综上所述,本发明提供了一种主机批量负载的调度方法以及调度系统,解决了现有技术中SYSPLEX内部的各LPAR的资源使用无法达到平衡状态的技术难题,其优势在于:
1.本发明采集的监控视图和数据指标结合了应用系统的相关数据,弥补了主机系统监控的空白,结合了应用数据的监控功能相比纯粹的系统指标监控更符合数据中心系统维护人员的实际使用需求,有助于系统维护人员快速发现、定位问题。
2.本发明的批量负载智能调度功能,有效的将系统服务能力和应用负载进行匹配,通过在主机系统设立开关的方式控制批量负载在主机系统间的分配,并通过各类系统、应用数据智能的将负载均匀的分配至各主机LPAR,实现了主机CPU资源的充分、高效利用,并使得批量执行效率显著提高。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一般计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
本领域技术人员还可以了解到本发明实施例列出的各种功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种主机批量负载的调度方法,其特征是,所述的方法包括:
按照采集周期采集主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成并行耦合体SYSPLEX;
根据所述的LPAR的运行指标确定所述LPAR的资源消耗值;
采集预先设定的与所述LPAR对应的资源消耗阈值;
根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;
根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;
根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关;
其中,根据所述的LPAR的运行指标确定所述LPAR的资源消耗值具体包括:根据所述的LPAR的运行指标确定所述LPAR的中央处理器CPU资源使用率;根据所述的LPAR的运行指标确定所述LPAR的作业队列值;根据所述的LPAR的运行指标确定所述LPAR的资源权重;根据所述的CPU资源使用率、所述的作业队列值以及所述的资源权重确定所述LPAR的资源消耗值。
2.根据权利要求1所述的调度方法,其特征是,根据所述的CPU资源使用率、所述的作业队列值以及所述的资源权重确定所述LPAR的资源消耗值通过如下公式进行:
资源消耗值=CPU资源使用率+作业队列值+的资源权重。
3.根据权利要求1所述的调度方法,其特征是,根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态具体包括:
判断所述的资源消耗值是否超过所述的资源消耗阈值;
当判断为是时,所述的LPAR的运行状态确定为繁忙;
当判断为否时,所述的LPAR的运行状态确定为空闲。
4.根据权利要求3所述的调度方法,其特征是,根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态具体包括:
判断组成SYSPLEX的多个LPAR对应的运行状态是否均为繁忙;
当判断为是时,所述的SYSPLEX的运行状态确定为负载均衡;
当判断为否时,继续判断组成SYSPLEX的多个LPAR对应的运行状态是否均为空闲,当判断为是时,所述的SYSPLEX的运行状态确定为负载均衡,否则,所述的SYSPLEX的运行状态确定为负载不均衡。
5.根据权利要求4所述的调度方法,其特征是,根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关具体包括:
当所述的SYSPLEX的运行状态确定为负载不均衡时,获取组成SYSPLEX的多个LPAR对应的运行状态;
从多个LPAR对应的运行状态中识别出运行状态确定为空闲的LPAR;
将运行状态确定为空闲的LPAR的批量开关设置为开启状态;
从多个LPAR对应的运行状态中识别出运行状态确定为繁忙的LPAR;
将运行状态确定为繁忙的LPAR的批量开关设置为关闭状态。
6.根据权利要求1或5所述的调度方法,其特征是,所述的调度方法还包括通过WEB服务器将采集到的所述主机上的LPAR对应的运行指标进行显示。
7.根据权利要求1或5所述的调度方法,其特征是,所述的调度方法还包括将采集到的所述主机上的LPAR对应的运行指标进行保存。
8.一种主机批量负载的调度系统,其特征是,所述的调度系统包括:处理服务器以及多个主机,
其中,所述的处理服务器具体包括:
运行指标采集模块,用于按照采集周期采集所述主机上的逻辑分区LPAR对应的运行指标,多个主机上的LPAR组成并行耦合体SYSPLEX;
资源消耗值确定模块,用于根据所述的LPAR的运行指标确定所述LPAR的资源消耗值,其具体包括:CPU资源使用率确定单元,用于根据所述的LPAR的运行指标确定所述LPAR的中央处理器CPU资源使用率;作业队列值确定单元,用于根据所述的LPAR的运行指标确定所述LPAR的作业队列值;资源权重确定单元,用于根据所述的LPAR的运行指标确定所述LPAR的资源权重;资源消耗值确定单元,用于根据所述的CPU资源使用率、所述的作业队列值以及所述的资源权重确定所述LPAR的资源消耗值;
资源消耗阈值采集模块,用于采集预先设定的与所述LPAR对应的资源消耗阈值;
LPAR运行状态确定模块,用于根据所述的资源消耗阈值以及所述的资源消耗值确定各个主机上的LPAR的运行状态;
SYSPLEX运行状态确定模块,用于根据各个主机上的LPAR的运行状态确定所述SYSPLEX的运行状态;
批量开关控制模块,用于根据所述SYSPLEX的运行状态控制所述主机上LPAR的批量开关。
9.根据权利要求8所述的调度系统,其特征是,所述的资源消耗值确定单元通过如下公式进行:
资源消耗值=CPU资源使用率+作业队列值+的资源权重。
10.根据权利要求8所述的调度系统,其特征是,所述的LPAR运行状态确定模块具体包括:
第一判断单元,用于判断所述的资源消耗值是否超过所述的资源消耗阈值;
繁忙状态确定单元,用于当所述的第一判断单元的判断结果为是时,所述的LPAR的运行状态确定为繁忙;
空闲状态确定单元,用于当所述的第一判断单元的判断结果为否时,所述的LPAR的运行状态确定为空闲。
11.根据权利要求10所述的调度系统,其特征是,所述的SYSPLEX运行状态确定模块具体包括:
第二判断单元,用于判断组成SYSPLEX的多个LPAR对应的运行状态是否均为繁忙;
第一负载均衡确定单元,用于当所述的第二判断单元的判断结果为是时,所述的SYSPLEX的运行状态确定为负载均衡;
第三判断单元,用于当所述的第二判断单元的判断结果为否时,继续判断组成SYSPLEX的多个LPAR对应的运行状态是否均为空闲;
第二负载均衡确定单元,用于当所述的第三判断单元的判断结果为是时,所述的SYSPLEX的运行状态确定为负载均衡;
负载不均衡确定单元,用于当所述的第三判断单元的判断结果为否时,所述的SYSPLEX的运行状态确定为负载不均衡。
12.根据权利要求11所述的调度系统,其特征是,所述的批量开关控制模块具体包括:
运行状态获取单元,用于当所述的SYSPLEX的运行状态确定为负载不均衡时,获取组成SYSPLEX的多个LPAR对应的运行状态;
第一识别单元,用于从多个LPAR对应的运行状态中识别出运行状态确定为空闲的LPAR;
第一批量开关设置单元,用于将运行状态确定为空闲的LPAR的批量开关设置为开启状态;
第二识别单元,用于从多个LPAR对应的运行状态中识别出运行状态确定为繁忙的LPAR;
第二批量开关设置单元,用于将运行状态确定为繁忙的LPAR的批量开关设置为关闭状态。
13.根据权利要求8或12所述的调度系统,其特征是,所述的调度系统还包括:WEB服务器,用于显示采集到的所述主机上的LPAR对应的运行指标。
14.根据权利要求8或12所述的调度系统,其特征是,所述的调度系统还包括资源数据存储器,用于保存采集到的所述主机上的LPAR对应的运行指标。
CN201310154417.9A 2013-04-28 2013-04-28 一种主机批量负载的调度方法以及调度系统 Active CN103279389B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310154417.9A CN103279389B (zh) 2013-04-28 2013-04-28 一种主机批量负载的调度方法以及调度系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310154417.9A CN103279389B (zh) 2013-04-28 2013-04-28 一种主机批量负载的调度方法以及调度系统

Publications (2)

Publication Number Publication Date
CN103279389A CN103279389A (zh) 2013-09-04
CN103279389B true CN103279389B (zh) 2016-06-22

Family

ID=49061922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310154417.9A Active CN103279389B (zh) 2013-04-28 2013-04-28 一种主机批量负载的调度方法以及调度系统

Country Status (1)

Country Link
CN (1) CN103279389B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391671A (zh) * 1999-09-28 2003-01-15 国际商业机器公司 计算环境中的工作负载管理
CN101419561A (zh) * 2007-10-26 2009-04-29 中兴通讯股份有限公司 一种异构多核体系中的资源管理方法及系统
CN102789398A (zh) * 2011-05-16 2012-11-21 中国联合网络通信集团有限公司 主机资源自适应管理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985951B2 (en) * 2001-03-08 2006-01-10 International Business Machines Corporation Inter-partition message passing method, system and program product for managing workload in a partitioned processing environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391671A (zh) * 1999-09-28 2003-01-15 国际商业机器公司 计算环境中的工作负载管理
CN101419561A (zh) * 2007-10-26 2009-04-29 中兴通讯股份有限公司 一种异构多核体系中的资源管理方法及系统
CN102789398A (zh) * 2011-05-16 2012-11-21 中国联合网络通信集团有限公司 主机资源自适应管理方法和装置

Also Published As

Publication number Publication date
CN103279389A (zh) 2013-09-04

Similar Documents

Publication Publication Date Title
AU2016277719B2 (en) Scaling a virtual machine instance
CN102981910B (zh) 虚拟机调度的实现方法和装置
CN105528330B (zh) 负载均衡的方法、装置、丛集和众核处理器
CN104102543B (zh) 一种云计算环境中负载调整的方法和装置
CN101488098B (zh) 基于虚拟计算技术的多核计算资源管理系统
CN103338228B (zh) 基于双加权最小连接算法的云计算负载均衡调度算法
CN103685309B (zh) 面向地图可视化瓦片服务接入的异步请求队列的建立方法
CN104881325A (zh) 一种资源调度方法和资源调度系统
CN102508718A (zh) 一种虚拟机负载均衡方法和装置
CN202565304U (zh) 分布式计算任务调度及执行系统
CN103365700A (zh) 一种面向云计算虚拟化环境的资源监测和调整系统
CN106506670A (zh) 一种云平台虚拟资源高速调度方法与系统
CN107977271A (zh) 一种数据中心综合管理系统负载均衡方法
Liu et al. A survey on virtual machine scheduling in cloud computing
CN103955398A (zh) 一种基于处理器性能监控的虚拟机共生调度方法
CN110401695A (zh) 云资源动态调度方法、装置和设备
CN106789270A (zh) 一种信息系统集中运维管理的实现方法及系统
CN108563495A (zh) 数据中心综合管理系统的云资源队列分级调度系统和方法
CN109271257A (zh) 一种虚拟机迁移部署的方法及设备
CN106131227A (zh) 负载平衡方法、元数据服务器系统及负载平衡系统
CN106201693A (zh) 一种虚拟化环境中的调度方法及系统
CN103262035A (zh) 组合式cpu/gpu体系结构系统中的装置发现和拓扑报告
CN114661462A (zh) 资源分配方法、系统、计算机可读存储介质及电子设备
CN105045667A (zh) 一种用于虚拟机vCPU调度的资源池管理方法
CN115658311A (zh) 一种资源的调度方法、装置、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant