CN102624865B - 集群负载预测方法及分布式集群管理系统 - Google Patents

集群负载预测方法及分布式集群管理系统 Download PDF

Info

Publication number
CN102624865B
CN102624865B CN201210005401.7A CN201210005401A CN102624865B CN 102624865 B CN102624865 B CN 102624865B CN 201210005401 A CN201210005401 A CN 201210005401A CN 102624865 B CN102624865 B CN 102624865B
Authority
CN
China
Prior art keywords
information
algorithm
user
prediction algorithm
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210005401.7A
Other languages
English (en)
Other versions
CN102624865A (zh
Inventor
王总辉
张涛
王云霄
陈建海
陈文智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201210005401.7A priority Critical patent/CN102624865B/zh
Publication of CN102624865A publication Critical patent/CN102624865A/zh
Application granted granted Critical
Publication of CN102624865B publication Critical patent/CN102624865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种集群负载预测方法及分布式集群管理系统。本发明的方法包括步骤:接收用户预测需求信息并解析,并将已解析的用户预测需求信息与算法池内存储的预测算法进行匹配;对算法池内的预测算法进行更新;选择匹配程度最大的预测算法及其相关参数信息建立负载预测模型,并用获取的负载数据训练该负载预测模型;使用训练好的负载预测模型对集群负载进行预测,得到预测结果。本发明的系统包括:集群调度模块、负载监控模块、负载预测模块以及决策实施模块;所述的负载预测模块包括配置文件、算法控制器以及算法执行器。本发明的技术方案应用于集群系统中,支持预测需求可配置、支持预测算法的自适应选择以及支持预测算法的可插拔。

Description

集群负载预测方法及分布式集群管理系统
技术领域
本发明涉及分布式集群系统,特别涉及一种集群负载预测方法及其对应的分布式集群管理系统。
背景技术
随着当今社会计算机技术的不断发展,分布式集群愈来愈广泛地应用于不同领域。然而,随着集群的规模的不断增大,传统的集群管理方法已不能满足规模集群的需求,因此,分布式大规模集群管理调度技术应用而生,即分布式集群管理系统。根据该系统是否对集群负载进行预测,其工作流程可分为两种类型:
第一种类型,系统对集群负载未进行预测:集群调度模块直接从负载监控模块读取负载数据,然后对数据进行解析,做出调度决策,再将调度决策发送到决策实施模块,决策实施模块根据其所处的实际物理环境对决策进行实施执行;
第二种类型,系统对集群负载进行预测:集群调度模块根据实际情况向负载预测模块发送用户预测需求信息,这种需求信息可以是人为配置的,也可以是系统根据集群当前的负载情况做出的实时需求,负载预测模块根据预测需求使用预测算法对负载进行预测,给出预测后的负载数据,发送到集群调度模块,集群调度模块分析负载数据,做出调度决策,发送到决策实施模块进行实际的实施执行。
在大规模分布式虚拟化集群资源调度领域中,由于业务的差异性造成对集群资源的使用不均衡,所以必须在间隔一定的时间内对集群整体的资源做一次调度,使集群中物理资源的使用达到一个均衡的状态;或通过调度决策使集群中的物理资源利用率提高,同时减少一些不必要的物理资源,以达到节能减排的目的。在调度的过程中,若采用如前所述的不对负载进行预测的系统时,由于集群规模大,做一次调度决策以及决策实施的时间会比较长,使得监控系统监控到的集群的实际负载数据相对滞后,系统做出的调度决策也会出现滞后的情况,不能体现实时的负载特性。据此,调度决策不能用当前的负载作为决策依据。
现有技术一种能够对集群负载进行预测分布式集群管理系统主要分为四个模块:数据监控模块、负载预测模块、集群调度模块以及决策实施模块。负载预测模块内的负载预测过程基本分为预测模型的训练阶段和预测阶段。在预测模型的训练阶段,通过对集群负载监控模块获得的历史数据进行分析,使用满足需求的预测算法建立学习模型,来挖掘资源数据变化的规律性,训练出一种预测模型;在预测阶段,在给定单位时间粒度获取监测数据,利用学习到的预测模型预测出下一时间段的性能资源数据,为资源调度决策提供基本依据。
目前的集群负载预测模型根据不同的原理主要有基于时间序列的指数加权移动平均EWMA算法和基于集群负载规律性的神经网络算法BP-NN,以及一些其他的预测算法。这些算法都是针对不同的负载规律进行预测,且各自具有不同优缺点。由于同一集群环境在不同的应用场景下,业务对集群的资源需求有很大差异,会呈现出不同的业务规律性,而预测这些不同规律性的集群负载需要采用不同的预测算法。现有技术对上述不同算法的建立是针对每一种不同的规律都开发出不同的接口以满足集群负载预测的需求。这种做法虽然可以暂时解决问题,但缺乏自适应性和灵活性。针对不同的业务规律需要选择不同的预测算法来满足负载预测需求,按当前的做法不能自适应的去选择相应的算法,需要手动修改代码完成相关需求;当有新的负载规律出现时,需要重新开发独立的接口以满足需求,而开发过程中需要重新考虑集群环境及负载类型等问题,做了很多不必要的重复工作。
发明内容
本发明要解决上述技术所存在的缺陷,提供一种自适应的算法可插拔的分布式集群负载预测方法,弥补了现有预测方法所存在的不能自适应选择算法和缺乏灵活性的问题;相应地,提供了一种分布式集群管理系统。
一种集群负载预测方法,应用于分布式集群系统,包括步骤:
在系统中设置预测算法存储单元与算法池;
预先在算法池内储存能够对集群负载进行预测的预测算法及其相关参数信息,并对算法池内的预测算法及其相关参数信息实时更新;
接收外部写入的用户预测需求信息,解析该用户预测需求信息并将该信息存储于系统中;
将已解析的用户预测需求信息逐一地与算法池内存储的预测算法进行匹配,选择出匹配程度最大的预测算法并将该预测算法及其相关参数信息更新至预测算法存储单元;
获取系统提供的负载数据;
基于预测算法存储单元内的预测算法及其相关参数信息建立负载预测模型,利用负载数据训练负载预测模型;
使用训练好的负载预测模型对集群负载进行预测,得到预测结果。
所述的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息。
进一步地,所述的接收外部写入的用户预测需求信息中,接收到的用户预测需求信息是以键-值对的方式或以XML格式存储于系统的配置文件中。
进一步地,所述的解析该用户预测需求信息并将该信息存储于系统中,包括:
对以键-值对的方式存储于配置文件中的用户预测需求信息,从配置文件中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于系统中;
若读入的信息为非法输入则系统报错;
如此反复,直到配置文件的末尾;
对以XML格式存储于配置文件中的用户预测需求信息,首先解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于系统中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至系统中;以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
进一步地,将已解析的用户预测需求信息逐一地与算法池内存储的预测算法进行匹配,选择出匹配程度最大的预测算法并将该预测算法及其相关参数信息更新至预测算法存储单元,包括步骤:
读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
针对该预测算法匹配下一条用户预测需求信息;
若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元;
若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池内未经搜索的预测算法重复上述步骤;
若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元。
本发明的集群负载预测方法具有以下技术效果:
一、支持用户预测需求可配置,通过在系统中写入用户的预测需求,且可以根据该用户的预测需求,例如用户对于负载预测的预测精度以及预测特性等预测需求完成对于负载的预测;
二、支持预测算法的自适应选择,根据已解析的用户预测需求信息对算法池中的预测算法进行匹配,实现系统自适应地选择与用户预测需求信息最大匹配的预测算法;
三、支持预测算法的可插拔,本发明的方法能够对算法池内的预测算法及其相关参数信息实时更新,即对系统不必要的预测算法进行注销及删除,对新增的预测算法进行注册及增加,简单有效;
除上述三个有益的技术效果外,本发明的方法还具有算法可控性强和可扩展性强的特性;除了分布式集群管理系统中的负载预测应用场景,本发明的方法可以应用到其他有类似需求的场景中。
一种分布式集群管理系统,包括集群调度模块、负载监控模块、负载预测模块以及决策实施模块,其特征在于,所述的负载预测模块包括配置文件、算法控制器以及算法执行器;
所述的集群调度模块,将外部输入的用户预测需求信息存储于配置文件;
所述的算法控制器,包括存储能够对集群负载进行预测的预测算法及其相关参数信息的算法池;所述的算法控制器对算法池内的预测算法及其相关参数信息实时更新,并解析配置文件中的用户预测需求信息;将已解析的用户预测需求信息逐一地与算法池内储存的预测算法进行匹配,选择匹配程度最大的预测算法,并将该预测算法及其相关参数信息发送至算法执行器;
所述的算法执行器,接收预测算法及其相关参数信息,并请求负载监控模块或外部设备监测到的负载数据;根据该预测算法及其相关参数信息建立负载预测模型,利用请求到的负载数据训练负载预测模型;使用训练好的负载预测模型对集群负载进行预测,并将得到预测结果返回至集群调度模块;
所述的集群调度模块,接收该预测结果并将该预测结果作为调度决策的参考,输出调度决策至决策实施模块;
所述的决策实施模块,接收该调度决策,根据系统所处的实际物理环境执行调度决策。
所述的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息。
进一步地,所述的用户预测需求信息以键-值对的方式或以XML格式存储于配置文件中。
进一步地,所述的算法控制器包括信息需求存储单元;
对以键-值对的方式存储于配置文件中的用户预测需求信息,所述的算法控制器从配置文件中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于所述的信息需求存储单元中;
若读入的信息为非法输入则算法控制器报错;
如此反复,直到配置文件的末尾;
对以XML格式存储于配置文件中的用户预测需求信息,所述的算法控制器首先解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于所述的信息需求存储单元中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至信息需求存储单元中;以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
进一步地,所述的算法控制器包括预测算法储存单元,所述的算法控制器实现以下步骤:
读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
针对该预测算法匹配下一条用户预测需求信息;
若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元;
若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池内未经搜索的预测算法重复上述步骤;
若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元。
在算法控制器中需完成对配置文件进行解析,以获取配置文件中写入的用户预测需求信息,所以算法控制器中所能解析的文件的格式必须和配置文件的格式一致;算法控制器根据解析的配置文件的需求信息选择满足条件的预测算法,并将与所选算法相关的参数信息一并发送到算法执行器,实现了本发明系统中预测算法的自适应选择;另外,算法控制器还负责新的预测算法的注册/和注销,当有新的满足需求的预测算法被实现时,可以通过算法控制器进行注册,算法控制器将其信息添加到可供选择的预测算法池中,以供选择;当有的算法已不能满足当前选择或为了提升算法选择效率时,可以通过算法控制器将其在算法池中进行注销,则系统在进行下一次预测算法选择时将会屏蔽此算法的信息,即对算法池内的预测算法及其相关参数信息实时更新,实现了本发明系统中算法池内预测算法的可插拔。
算法执行器根据算法控制器提供的预测算法及相关的参数信息,使用历史的负载数据对预测模型进行学习和训练,当训练完成后,可以将监测到的负载数据输入到预测模型,得到预测后的负载数据输出值,输出数据可用做集群资源调度决策的参考依据或做其他处理;另外,可以先将针对某一预测算法的预测模型存储起来,等需要用到这种预测模型时可以直接使用存储的预测模型,这样可以节省预测模型学习和训练所带来的消耗,提高效率。
综上,本发明的技术方案应用于集群系统中,支持预测需求可配置、支持预测算法的自适应选择以及支持预测算法的可插拔;同时本发明的技术方案具有预测算法可控性强和可扩展性强的特性。
附图说明
图1为本发明实施例1的集群负载预测方法的流程示意图;
图2为本发明实施例3的分布式集群管理系统的结构示意图。
具体实施方式
下面结合附图对本发明的具体实施过程作具体阐述。
实施例1
如图1所示的一种集群负载预测方法,包括步骤:
S1在系统中设置预测算法存储单元与算法池。
S2预先在算法池内储存能够对集群负载进行预测的预测算法及其相关参数信息,并对算法池内的预测算法及其相关参数信息实时更新。
S3接收外部写入的用户预测需求信息,所述的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息;接收到的用户预测需求信息是以键-值对的方式存储于系统的配置文件中的;接收到的用户预测需求信息进行解析并储存,具体包括步骤:
S301从配置文件中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于系统中;
S302重复S301,直到配置文件的末尾;
若S301中读入的信息为非法输入则系统报错,并可以跳出系统的步骤,等待外部重新写入用户预测需求信息;
S4将已解析的用户预测需求信息逐一地与算法池内存储的预测算法进行匹配,选择出匹配程度最大的预测算法并将该预测算法及其相关参数信息更新至预测算法存储单元;具体包括步骤:
S401读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
S402针对该预测算法匹配下一条用户预测需求信息;
S403若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元;
S404若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池内未经搜索的预测算法重复S401以及S402;
S405若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元。
S5获取系统提供的负载数据。
S6基于预测算法存储单元内的预测算法及其相关参数信息建立负载预测模型,利用负载数据训练负载预测模型。
S7使用训练好的负载预测模型对集群负载进行预测,得到预测结果。
实施例2
本实施例的具体步骤与实施例1一致,但在步骤S3中,接收到的用户预测需求信息是以XML格式存储于系统的配置文件中的,因此在对接收到的用户预测需求信息进行解析并储存时,具体包括步骤:
解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于系统中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至系统中;
以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
在实施例1和实施例2中,算法池可以具体为指定的系统目录下的文件或在算法信息量比较大的情况下选择的数据库,即预测算法及相关参数信息以一定格式存储于指定系统目录下的文件或者在算法信息量比较大的情况下存储于数据库。预测算法的种类很多,能够应用到分布式集群系统负载的预测算法主要包括基于模拟人脑训练活动的神经网络算法BP-NN(Back Propagation Neural Network)和基于时间序列的指数加权移动平均算法EWMA(Exponentially Weighted Moving-Average)。
写入系统的用户预测需求信息可以以键-值对的方式或以XML格式存储在配置文件中。在对配置文件中的用户预测需求信息进行解析时,首先需要判断配置文件的格式类型:
如果需求信息是以键-值对的方式存储(本发明的实施例1采用此种存储方式),则从配置文件中逐条读入数据信息并对其进行解析:
若读取的信息为合法输入,则按键-值分隔符对信息进行分割并将分割后的键信息和值信息分别存储在预先设计好的数据结构中;
若读入的信息为非法输入则系统报错;
如此反复,直到文件末尾;
如果需求信息是以XML格式存储(本发明的实施例2采用此种存储方式),则首先解析数据根节点,并将根节点及其属性信息存储到预先设计好的数据结构中,再以循环遍历的方式解析子节点及其属性信息,并存储到相应的数据结构中。依次类推,直到所有的节点信息都已解析完。
配置文件准确的解析完后,预测需求信息便存储在预先设计好的数据结构中,当需要用到预测需求信息时可以直接通过相应的数据结构索引访问到所需的预测需求信息。
根据已解析的用户预测需求信息逐一地从算法池中匹配预测算法,直到选择出与用户预测需求信息最为匹配的预测算法。基于实施例1以及实施例2的相关步骤,在具体的实施过程中可进一步遵循如下步骤:
a算法控制器读取第一条预测需求信息,并以此为关键词从预测算法文件或数据库中匹配;
b当遇到第一个匹配到的算法时,存储到相应的预测算法存储数据结构中(此数据结构只存储最大匹配的预测算法信息),并针对此算法匹配下一条预测需求信息,若能继续匹配,则依次类推,直到所有的预测信息完全匹配或存在某一条预测需求信息不能匹配;
若所有的预测信息都已完全匹配,则将匹配后的算法信息更新到预测算法存储数据结构中,提示匹配成功,退出算法选择流程;
若存在某条预测需求信息不能匹配,则先将预测算法数据结构中的已匹配的算法信息进行备份,并清空预测算法存储数据结构,再在未进行匹配的算法信息中,继续从步骤b开始执行;
c若预测算法存储文件或数据库中的所有算法都不能完全匹配预测需求信息时,算法控制器根据用户需求的强烈程度提供三种选择:
i在用户对预测算法不做要求的情况下(使用默认的配置文件),算法控制器选择默认的预测算法并将其信息更新到预测算法存储数据结构中,提示使用默认预测算法,退出预测算法选择流程;
ii在用户对预测算法需求比较温和的情况下,算法控制器比较预测算法存储数据结构和备份数据结构中最大匹配的预测算法信息并更新到预测算法存储数据结构中,提示使用温和选择模式,退出预测算法选择流程;
iii在用户对预测算法需求强烈的情况下,由于预测算法存储文件或数据库中没有能够满足要求的算法,则清空预测算法存储数据结构和备份数据结构,提示算法选择失败,退出预测算法选择流程;
d对预测算法的选择返回结果,进行相应处理。
实施例3
如图2所示的一种分布式集群管理系统,包括集群调度模块1、负载监控模块2、负载预测模块3以及决策实施模块4,负载预测模块3进一步包括配置文件301、算法控制器302以及算法执行器303。
集群调度模块1,将外部输入的用户预测需求信息存储于配置文件301,具体储存的形式在具体实施过程中可以为键-值对的方式或以XML格式。
算法控制器302,包括存储能够对集群负载进行预测的预测算法及其相关参数信息的算法池320;算法控制器302对算法池320内的预测算法及其相关参数信息实时更新,并解析配置文件301中的用户预测需求信息;将已解析的用户预测需求信息逐一地与算法池320内储存的预测算法进行匹配,选择匹配程度最大的预测算法,并将该预测算法及其相关参数信息发送至算法执行器303。
算法执行器303,接收预测算法及其相关参数信息,并请求负载监控模块2监测到的负载数据,该负载数据也可以由外部设备提供;算法控制器302得到负载数据后,根据该预测算法及其相关参数信息建立负载预测模型,并利用该负载数据训练负载预测模型;使用训练好的负载预测模型对集群负载进行预测,并将得到预测结果返回至集群调度模块1。
集群调度模块1,接收该预测结果并将该预测结果作为调度决策的参考,输出调度决策至决策实施模块4。
决策实施模块4,接收该调度决策,根据系统所处的实际物理环境执行调度决策。
本实施例输入的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息。
算法控制器302内设有信息需求存储单元321,用以储存已解析的用户预测需求信息;因配置文件301中写入的用户预测需求信息的储存方式有所不同,算法控制器302的具体解析过程包括如下两种方式:
对以键-值对的方式存储于配置文件301中的用户预测需求信息,算法控制器302从配置文件301中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则算法控制器302按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于信息需求存储单元321中;
若读入的信息为非法输入则算法控制器302报错;
如此反复,直到配置文件301的末尾。
对以XML格式存储于配置文件301中的用户预测需求信息,算法控制器302首先解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于信息需求存储单元321中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至信息需求存储单元321中;以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
算法控制器302还包括预测算法储存单元322,用以储存最大匹配的预测算法及其相关参数信息。算法控制器302具体的匹配流程包括以下步骤:
读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
针对该预测算法匹配下一条用户预测需求信息:
若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元322;
若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池320内未经搜索的预测算法重复上述步骤;
若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元322。
在本实施例中,算法池可以具体为指定的系统目录下的文件或在算法信息量比较大的情况下选择的数据库,即预测算法及相关参数信息以一定格式存储于指定系统目录下的文件或者在算法信息量比较大的情况下存储于数据库。预测算法的种类很多,能够应用到分布式集群系统负载的预测算法主要包括基于模拟人脑训练活动的神经网络算法BP-NN(BackPropagation Neural Network)和基于时间序列的指数加权移动平均算法EWMA(Exponentially Weighted Moving-Average)
将本实施例的分布式集群管理系统用于具体物理机调度的部分关键实验过程如下:
用户预测需求信息为:预测周期为3、精度为0.001;具体将该系统应用于2台物理机,负载监测模块2提供该2台物理机的负载数据;
集群调度模块1将用户预测需求信息输入到xml格式的配置文件301中:
<?xml version="1.0"encoding="UTF-8"?>
<PREDICT VERSION="0.1">
<CYCLELENGTH VALUE="3"/>
<PRECISION VALUE="0.001"/>
</PREDICT>
算法控制器302根据用户预测需求信息选择出满足需求的预测算法,即神经网络算法BP-NN,选择后的预测算法及其相关参数信息用xml格式表示如下:
<?xml version="1.0"encoding="UTF-8"?>
<CONTROLOR PREDICT="1"VERSION="0.1">
<ALGORITHM NAME="Predict_BP-NN"/>
<PARAMETER    NAME="Length"    VALUE="1000"TYPE="DOUBLE"/>
</ALGORITHM>
<CYCLELENGTH VALUE="3"/>
<PRECISION VALUE="0.001"/>
</CONTROLOR>
算法控制器302将该预测算法及其相关参数信息发送到算法执行器303,算法执行器303根据该预测算法及其相关参数信息建立预测模型,并基于输入的负载数据对该预测模型进行训练,将训练好的预测模型用于负载预测,并将预测结果输出。输入的负载信息用xml格式表示如下(时间间隙为15秒):
第一组训练数据:
<?xml version="1.0"encoding="UTF-8"?>
<DATA VERSION="0.1"TIMEINTEVAL="15">
<PM ID="pm0"CPU="0.1"MEM="4"IO="100"/PM>
<PM ID="pm1"CPU="0.05"MEM="4"IO="100"/PM>
</DATA>
第二组训练数据:
<?xml version="1.0"encoding="UTF-8"?>
<DATA VERSION="0.1"TIMEINTEVAL="15">
<PM ID="pm0"CPU="0.105"MEM="5"IO="100"/PM>
<PM ID="pm1"CPU="0.055"MEM="5"IO="100"/PM>
</DATA>
第三组训练数据:
<?xml version="1.0"encoding="UTF-8"?>
<DATA VERSION="0.1"TIMEINTEVAL="15">
<PM ID="pm0"CPU="0.11"MEM="6"IO="100"/PM>
<PM ID="pm1"CPU="0.06"MEM="6"IO="100"/PM>
</DATA>
负载预测输入数据:
<?xml version="1.0"encoding="UTF-8"?>
<DATA VERSION="0.1"TIMEINTEVAL="15">
<PM ID="pm0"CPU="0.115"MEM="7"IO="100"/PM>
<PM ID="pm1"CPU="0.065"MEM="7"IO="100"/PM>
</DATA>
负载预测输出数据:
<?xml version="1.0"encoding="UTF-8"?>
<DATA VERSION="0.1"TIMEINTEVAL="15">
<PM ID="pm0"CPU="0.123"MEM="7.200"IO="100"/PM>
<PM ID="pm1"CPU="0.071"MEM="7.200"IO="100"/PM>
</DATA>
算法执行器输出预测结果
由上述实施例可以看出,在预测需求为精度为0.001,预测周期为3的情况下,算法控制器自适应的选择了满足需求的神经网络算法BP-NN作为预测算法,并在负载趋势为上升的情况下,给出了预测结果。从预测结果可以看出,预测算法给出的预测结果符合负载上升的趋势,满足了预测需求。
本实施系统的另一特性是支持算法池320内预测算法的插拔,即算法控制器302对算法池320内的预测算法及其相关参数信息实时更新,具体可通过下述步骤实现算法池320内预测算法的可插拔:
当有满足新的用户预测需求的预测算法及其相关参数信息需要加入到算法池320内时,将预测算法以相应的数据结构存储到算法控制器302中;同时,将新的预测算法及其实现过程加入到算法控制器302中,并在算法控制器302内注册相应接口;
算法控制器302将新的预测算法及其相关参数信息添加到算法池320中,实现对算法池320内的预测算法及其相关参数信息的添加。
当需要将不能满足当前用户预测需求信息或很少使用的预测算法从算法池320中删除时,只需在算法控制器302中将要删除预测算法的相应接口进行注销即可,如此则实现了对算法池320内的预测算法及其相关参数信息的删除。
算法控制器302对算法池320内的预测算法及其相关参数信息的添加以及删除构成了对算法池320内预测算法的实时更新。

Claims (10)

1.一种集群负载预测方法,应用于分布式集群系统,包括步骤:
在系统中设置预测算法存储单元与算法池;
预先在算法池内储存能够对集群负载进行预测的预测算法及其相关参数信息,并对算法池内的预测算法及其相关参数信息实时更新;
接收外部写入的用户预测需求信息,解析该用户预测需求信息并将该信息存储于系统中;
将已解析的用户预测需求信息逐一地与算法池内存储的预测算法进行匹配,选择出匹配程度最大的预测算法并将该预测算法及其相关参数信息更新至预测算法存储单元;
获取系统提供的负载数据;
基于预测算法存储单元内的预测算法及其相关参数信息建立负载预测模型,利用负载数据训练负载预测模型;
使用训练好的负载预测模型对集群负载进行预测,得到预测结果。
2.根据权利要求1所述的集群负载预测方法,其特征在于,所述的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息。
3.根据权利要求1所述的集群负载预测方法,其特征在于,所述的接收外部写入的用户预测需求信息中,接收到的用户预测需求信息是以键-值对的方式或以XML格式存储于系统的配置文件中。
4.根据权利要求3所述的集群负载预测方法,其特征在于,所述的解析该用户预测需求信息并将该信息存储于系统中,包括:
对以键-值对的方式存储于配置文件中的用户预测需求信息,从配置文件中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于系统中;
若读入的信息为非法输入则系统报错;
如此反复,直到配置文件的末尾;
对以XML格式存储于配置文件中的用户预测需求信息,首先解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于系统中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至系统中;以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
5.根据权利要求1所述的集群负载预测方法,其特征在于,将已解析的用户预测需求信息逐一地与算法池内存储的预测算法进行匹配,选择出匹配程度最大的预测算法并将该预测算法及其相关参数信息更新至预测算法存储单元,包括步骤:
读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
针对该预测算法匹配下一条用户预测需求信息;
若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元;
若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池内未经搜索的预测算法重复上述步骤;
若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元。
6.一种分布式集群管理系统,包括集群调度模块、负载监控模块、负载预测模块以及决策实施模块,其特征在于,所述的负载预测模块包括配置文件、算法控制器以及算法执行器;
所述的集群调度模块,将外部输入的用户预测需求信息存储于配置文件;
所述的算法控制器,包括存储能够对集群负载进行预测的预测算法及其相关参数信息的算法池;所述的算法控制器对算法池内的预测算法及其相关参数信息实时更新,并解析配置文件中的用户预测需求信息;将已解析的用户预测需求信息逐一地与算法池内储存的预测算法进行匹配,选择匹配程度最大的预测算法,并将该预测算法及其相关参数信息发送至算法执行器;
所述的算法执行器,接收预测算法及其相关参数信息,并请求负载监控模块或外部设备监测到的负载数据;根据该预测算法及其相关参数信息建立负载预测模型,利用请求到的负载数据训练负载预测模型;使用训练好的负载预测模型对集群负载进行预测,并将得到预测结果返回至集群调度模块;
所述的集群调度模块,接收该预测结果并将该预测结果作为调度决策的参考,输出调度决策至决策实施模块;
所述的决策实施模块,接收该调度决策,根据系统所处的实际物理环境执行调度决策。
7.根据权利要求6所述的分布式集群管理系统,其特征在于,所述的用户预测需求信息包括用户所需的预测精度信息、预测规律类型信息、预测周期信息以及预测算法特性信息。
8.根据权利要求6所述的分布式集群管理系统,其特征在于,所述的用户预测需求信息以键-值对的方式或以XML格式存储于配置文件中。
9.根据权利要求8所述的分布式集群管理系统,其特征在于,所述的算法控制器包括信息需求存储单元;
对以键-值对的方式存储于配置文件中的用户预测需求信息,所述的算法控制器从配置文件中逐条读取所有的用户预测需求信息并判断读取的信息是否合法:
若读取的信息为合法输入,则按键-值分隔符对该信息进行分割并将分割后的键信息和值信息分别存储于所述的信息需求存储单元中;
若读入的信息为非法输入则算法控制器报错;
如此反复,直到配置文件的末尾;
对以XML格式存储于配置文件中的用户预测需求信息,所述的算法控制器首先解析用户预测需求信息的数据根节点,并将根节点及其属性信息存储于所述的信息需求存储单元中,再以循环遍历的方式解析用户预测需求信息的子节点及其属性信息,并存储至信息需求存储单元中;以此类推,直到所有的用户预测需求信息的节点信息都已解析完毕。
10.根据权利要求7所述的分布式集群管理系统,其特征在于,
所述的算法控制器包括预测算法储存单元,所述的算法控制器实现以下步骤:
读取第一条用户预测需求信息,并以此为关键词搜寻算法池内匹配该信息的预测算法;当遇到第一个与该信息适配的预测算法时,停止搜索;
针对该预测算法匹配下一条用户预测需求信息;
若该预测算法对所有的用户预测需求信息逐一适配,将该预测算法及其相关参数信息更新至预测算法储存单元;
若该预测算法对所有的用户预测需求信息不能逐一适配,则将该预测算法及其相关参数信息备份于系统中,并对算法池内未经搜索的预测算法重复上述步骤;
若算法池内所有的预测算法均不能对所有的用户预测需求逐一适配,选择备份于系统中的预测算法中与所有的用户预测需求信息最大匹配者,并将该预测算法及其相关参数信息更新至预测算法储存单元。
CN201210005401.7A 2012-01-09 2012-01-09 集群负载预测方法及分布式集群管理系统 Active CN102624865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210005401.7A CN102624865B (zh) 2012-01-09 2012-01-09 集群负载预测方法及分布式集群管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210005401.7A CN102624865B (zh) 2012-01-09 2012-01-09 集群负载预测方法及分布式集群管理系统

Publications (2)

Publication Number Publication Date
CN102624865A CN102624865A (zh) 2012-08-01
CN102624865B true CN102624865B (zh) 2014-06-18

Family

ID=46564548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210005401.7A Active CN102624865B (zh) 2012-01-09 2012-01-09 集群负载预测方法及分布式集群管理系统

Country Status (1)

Country Link
CN (1) CN102624865B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103227754B (zh) * 2013-04-16 2017-02-08 浪潮(北京)电子信息产业有限公司 一种高可用集群系统负载动态均衡方法及节点设备
JP6486939B2 (ja) 2013-09-09 2019-03-20 シーゲイト テクノロジー エルエルシーSeagate Technology LLC 電源管理を使用したモバイルデータ記憶デバイス
CN105045764A (zh) * 2015-08-11 2015-11-11 精硕世纪科技(北京)有限公司 模型集群的输入参数获取方法及系统
CN105956077B (zh) * 2016-04-29 2019-10-15 上海交通大学 基于语义需求匹配的流程挖掘系统
CN106020719A (zh) * 2016-05-13 2016-10-12 广东电网有限责任公司信息中心 一种分布式存储系统的初始参数配置方法
CN106330558A (zh) * 2016-08-31 2017-01-11 哈尔滨工业大学(威海) 应用于软件定义网络的控制器负载预测系统及方法
CN108229686B (zh) * 2016-12-14 2022-07-05 阿里巴巴集团控股有限公司 模型训练、预测方法、装置、电子设备及机器学习平台
CN107562532B (zh) * 2017-07-13 2020-11-27 华为技术有限公司 一种预测设备集群的硬件资源利用率的方法及装置
CN108564164B (zh) * 2018-01-08 2022-04-29 中山大学 一种基于spark平台的并行化深度学习方法
CN110554912B (zh) 2018-05-31 2022-05-20 杭州海康威视数字技术股份有限公司 调度设备执行任务的方法和装置
CN112100557B (zh) * 2020-09-01 2022-11-29 上海交通大学 基于内容发布订阅的组合匹配系统与方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007014383A1 (en) * 2005-07-28 2007-02-01 Siemens Power Transmission & Distribution, Inc. Load prediction based on-line and off-line training of neural networks
CN101299251A (zh) * 2008-05-07 2008-11-05 天津理工大学 基于概率逆换算法的中长期电力负荷的预测方法
CN101414366A (zh) * 2008-10-22 2009-04-22 西安交通大学 基于改进极端学习机方法的电力系统短期负荷预测方法
CN101695050A (zh) * 2009-10-19 2010-04-14 浪潮电子信息产业股份有限公司 一种基于网络流量自适应预测的动态负载均衡方法
CN101788789A (zh) * 2010-01-12 2010-07-28 北京交通大学 基于混沌混合优化算法的单元机组非线性预测控制方法
CN102063327A (zh) * 2010-12-15 2011-05-18 中国科学院深圳先进技术研究院 具有功耗意识的数据中心应用服务调度方法
WO2011110026A1 (zh) * 2010-10-29 2011-09-15 华为技术有限公司 一种实现数据中心资源负载均衡的方法及装置
CN102270309A (zh) * 2011-07-27 2011-12-07 华北电力大学 一种基于集成学习的短期电力负荷预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007014383A1 (en) * 2005-07-28 2007-02-01 Siemens Power Transmission & Distribution, Inc. Load prediction based on-line and off-line training of neural networks
CN101299251A (zh) * 2008-05-07 2008-11-05 天津理工大学 基于概率逆换算法的中长期电力负荷的预测方法
CN101414366A (zh) * 2008-10-22 2009-04-22 西安交通大学 基于改进极端学习机方法的电力系统短期负荷预测方法
CN101695050A (zh) * 2009-10-19 2010-04-14 浪潮电子信息产业股份有限公司 一种基于网络流量自适应预测的动态负载均衡方法
CN101788789A (zh) * 2010-01-12 2010-07-28 北京交通大学 基于混沌混合优化算法的单元机组非线性预测控制方法
WO2011110026A1 (zh) * 2010-10-29 2011-09-15 华为技术有限公司 一种实现数据中心资源负载均衡的方法及装置
CN102063327A (zh) * 2010-12-15 2011-05-18 中国科学院深圳先进技术研究院 具有功耗意识的数据中心应用服务调度方法
CN102270309A (zh) * 2011-07-27 2011-12-07 华北电力大学 一种基于集成学习的短期电力负荷预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Application of a Fuzzy Neural Network Combined With a Chaos Genetic Algorithm and Simulated;Gwo-Ching Liao,Ta-Peng Tsao;《IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION》;20060630;第10卷;第330页至340页 *
Gwo-Ching Liao,Ta-Peng Tsao.Application of a Fuzzy Neural Network Combined With a Chaos Genetic Algorithm and Simulated.《IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION》.2006,第10卷
杨伟,朱巧明,李培峰,钱培德.基于时间序列的服务器负载预测.《计算机工程》.2006,第32卷(第19期), *
薛正华,董小社,李炳毅,廖诗华.基于BP神经网络的集群负载预测器.《华中科技大学学报(自然科学版)》.2007,第35卷 *

Also Published As

Publication number Publication date
CN102624865A (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
CN102624865B (zh) 集群负载预测方法及分布式集群管理系统
CN109478045B (zh) 使用预测来控制目标系统
Xiong et al. Robust scheduling for multi-objective flexible job-shop problems with random machine breakdowns
Jiang et al. Energy‐efficient scheduling for a job shop using grey wolf optimization algorithm with double‐searching mode
Yang A novel cloud information agent system with Web service techniques: Example of an energy-saving multi-agent system
Wong et al. A genetic algorithm approach for production scheduling with mould maintenance consideration
Xu et al. Optimisation of partial collaborative transportation scheduling in supply chain management with 3PL using ACO
CN114399227A (zh) 一种基于数字孪生的生产调度方法、装置及计算机设备
CN103593323A (zh) 一种MapReduce任务资源配置参数的机器学习方法
CN114721833A (zh) 一种基于平台业务类型的智能云端协调方法和装置
Garcia-Santiago et al. A random-key encoded harmony search approach for energy-efficient production scheduling with shared resources
CN107885609A (zh) 业务冲突处理方法及装置、存储介质和电子设备
Roukh et al. Eco-physic: Eco-physical design initiative for very large databases
CN109445903A (zh) 基于QoS特征发现的云计算节能调度实现方法
CN114895773A (zh) 异构多核处理器的能耗优化方法、系统、装置及存储介质
Zhang et al. Hierarchical multistrategy genetic algorithm for integrated process planning and scheduling
An et al. An energy-efficient collaborative strategy of maintenance planning and production scheduling for serial-parallel systems under time-of-use tariffs
CN103365923A (zh) 用于评估数据库的分区方案的方法和装置
Fischer et al. Real-time business intelligence in the MIRABEL smart grid system
Xie et al. A Two‐Workshop Collaborative, Integrated Scheduling Algorithm considering the Prescheduling of the Root‐Subtree Processes
CN117076077A (zh) 基于大数据分析的计划调度优化方法
CN116896591A (zh) 网络数据分析模型调度方法、装置和计算机设备
Yu [Retracted] Research on Optimization Strategy of Task Scheduling Software Based on Genetic Algorithm in Cloud Computing Environment
Sun et al. Deep reinforcement-learning-guided backup for energy harvesting powered systems
Quan et al. Multi-objective evolutionary scheduling based on collaborative virtual workflow model and adaptive rules for flexible production process with operation reworking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant