CN103870904A - 一种PaaS平台健康状态管理方法和装置 - Google Patents

一种PaaS平台健康状态管理方法和装置 Download PDF

Info

Publication number
CN103870904A
CN103870904A CN201210537741.4A CN201210537741A CN103870904A CN 103870904 A CN103870904 A CN 103870904A CN 201210537741 A CN201210537741 A CN 201210537741A CN 103870904 A CN103870904 A CN 103870904A
Authority
CN
China
Prior art keywords
service node
rule
state information
running state
reasoning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210537741.4A
Other languages
English (en)
Inventor
熊龙
邓超
钱岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201210537741.4A priority Critical patent/CN103870904A/zh
Publication of CN103870904A publication Critical patent/CN103870904A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种PaaS平台健康状态管理方法和装置,管理节点可以根据服务节点的运行状态信息计算特征向量,并利用该特征向量来匹配规则,并根据利用匹配出的规则进行推理获得的推理结果,来确定该服务节点运行是否正常,并可以根据服务节点运行状态来对负载进行分配。相对于现有技术中,根据服务节点的负载与预设值比较来确定服务节点运行是否正常的方案,利用预先设置的规则进行推理可以有效解决预设值难以设定,准确性较低的问题,从而可以准确判断服务节点运行是否正常,并由此提高负载分配的准确性。

Description

一种PaaS平台健康状态管理方法和装置
技术领域
本发明涉及通信领域中的云计算领域,尤其涉及一种平台即服务(PaaS,platform-as-a-service)平台健康状态管理方法和装置。
背景技术
PaaS是一种把服务器平台或开发环境作为一种服务提供的商业模式。PaaS平台能将现有各种业务能力进行整合,具体可以归类为应用服务器、业务能力接入、业务引擎、业务开放平台、云计算。PaaS平台向下根据业务能力需要测算基础服务能力,通过基础设施即服务(IaaS,infrastructure-as-a-service)提供的应用程序编程接口(API)调用硬件资源。向上提供业务调度中心服务,实时监控PaaS平台的各种资源,并将这些资源通过API开放给软件即服务(SaaS,software-as-a-service)用户。而如何实时有效地实现PaaS平台上的各服务节点的运行状态管理,是PaaS平台实现的关键。
目前,PaaS平台上的健康状态管理方法主要包括以下两种:
第一种、PaaS平台中的健康状态管理模块从各个应用服务模块获取应用程序运行信息,然后对收集到的信息进行统计分析,并将结果与云控制器(CloudController)设定的指标进行比较,从而可以根据比较结果确定各服务节点是否运行正常,并针对运行异常的服务节点提供报警信息。
第二种、PaaS平台中的管理节点检测各服务节点的负载情况,确定各服务节点的负载是否超过阈值。对于负载超过阈值的服务节点,将所述服务节点中负载开销最大的应用程序,重新部署到负载最轻且未部署所述应用程序的服务节点;同时,保证应用程序服务质量,减少应用程序副本迁移的信令开销,实现PaaS平台的负载均衡。
现有PaaS平台上的健康状态管理方法,都是根据PaaS平台当前负载情况,通过与预设值进行比较,来确定服务节点运行是否正常,并可以进一步进行负载的分配调度。由于预设值的准确性难以保证,因此,难以保证准确确定出服务节点运行是否正常。且由于云计算环境复杂多变,根据现有方法进行负载分配时,还存在负载分配调度比较频繁,系统负荷较大的问题。
发明内容
本发明实施例提供一种PaaS平台健康状态管理方法和装置,用于提高确定出的服务节点运行状态的准确性。
一种平台即服务PaaS平台健康状态管理方法,所述方法包括:
针对每个服务节点,接收该服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态;
根据所述运行状态信息,确定特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量;
根据确定出的特征向量,从预先建立的规则库中匹配对应的规则,所述规则库中包括的每条规则包括规则前件和规则后件,每条规则的规则前件表示执行该规则的条件,每条规则的规则后件表示执行该规则的结果,且所述规则前件用于与特征向量相匹配;
根据匹配出的规则进行规则推理,确定推理结果,根据该推理结果确定该服务节点是否运行正常。
一种平台即服务PaaS平台健康状态管理装置,所述装置包括:
接收模块,用于针对每个服务节点,接收该服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态;
确定模块,用于根据所述运行状态信息,确定特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量;
匹配模块,用于根据确定模块确定出的特征向量,从预先建立的规则库中匹配对应的规则,所述规则库中包括的每条规则包括规则前件和规则后件,每条规则的规则前件表示执行该规则的条件,每条规则的规则后件表示执行该规则的结果,且所述规则前件用于与特征向量相匹配;
推理模块,用于根据匹配模块匹配出的规则进行规则推理,确定推理结果,根据该推理结果确定一个服务节点是否运行正常。
根据本发明实施例提供的方案,管理节点可以根据服务节点的运行状态信息确定特征向量,并利用该特征向量来匹配规则,并根据利用匹配出的规则进行推理获得的推理结果,来确定该服务节点运行是否正常。相对于现有技术中,根据服务节点的负载与预设值比较来确定服务节点运行是否正常的方案,利用预先设置的规则进行推理可以解决预设值难以设定,准确性较低的问题,可以准确判断服务节点运行是否正常。
附图说明
图1为本发明实施例一提供的PaaS平台健康状态管理方法的步骤流程图;
图2为本发明实施例二提供的规则匹配和推理原理示意图;
图3为本发明实施例三提供的确定运行趋势信息的方法步骤流程图;
图4为本发明实施例四提供的PaaS平台健康状态管理装置的结构示意图;
图5为本发明实施例五提供的PaaS平台健康状态管理方法的步骤流程图。
具体实施方式
在本发明实施例提供的方案中提出,可以运用专家的经验和知识总结归纳出多种规则,从而可以结合预先总结归纳出的规则,对服务节点的运行状态进行推理,并可以根据推理结果来确定服务节点是否运行正常,并可以针对运行不正常的服务节点进行负载重新分配,以及在运行正常的服务节点中进行负载分配。由于利用规则推理的方式可以准确地确定出服务节点是否发生了运行异常,因此,可以相对于现有技术,大大提高确定出的服务节点运行是否正常的准确性,从而还可以提高负载均衡的准确性。
同时,本发明实施例还进一步提出,为了适应复杂多变的云计算环境,避免负载的频繁分配,还可以对正常运行的服务节点的未来运行状态进行预测,从而可以根据服务节点当前运行状态和未来运行状态,来决策负载的分配,保证在一定时间段内的负载均衡,减轻系统频繁进行负载分配的负荷。
下面结合说明书附图和各实施例对本发明方案进行说明。
实施例一、
本发明实施例一提供一种PaaS平台健康状态管理方法,该方法的步骤流程可以如图1所示,包括:
步骤101、接收运行状态信息。
在本步骤中,可以接收一个服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态。
运行状态信息可以但不限于包括在该服务节点中,各应用程序占用的中央处理器(CPU)负荷、内存使用信息和硬盘存储使用信息中的至少一项。
步骤102、确定特征向量。
在本步骤中,根据所述运行状态信息,可以确定一个特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量。
例如,可以从运行状态信息中确定特征值,特征值可以包括所述服务节点中,CPU使用的峰峰值、CPU使用的有效值、CPU使用的均值、CPU使用的峰值(CPU使用的峰峰值、CPU使用的有效值、CPU使用的均值、CPU使用的峰值可以根据各应用程序占用的CPU负荷得到)、内存使用的峰峰值、内存使用的有效值、内存使用的均值、内存使用的峰值(内存使用的峰峰值、内存使用的有效值、内存使用的均值、内存使用的峰值可以根据内存使用信息得到)、硬盘存储使用的峰峰值、硬盘存储使用的有效值、硬盘存储使用的均值和硬盘存储使用的峰值(硬盘存储使用的峰峰值、硬盘存储使用的有效值、硬盘存储使用的均值和硬盘存储使用的峰值可以根据硬盘存储使用信息得到)。
利用确定出的特征值组成的特征向量可以表示为xt
x t = x h 1 x h 2 x h 3 x h 4 x c 1 x c 2 x c 3 x c 4 x m 1 x m 2 x m 3 x m 4
其中, x h 1 x h 2 x h 3 x h 4 分别代表硬盘存储使用的峰峰值、有效值、均值和峰值; x c 1 x c 2 x c 3 x c 4 分别代表CPU使用的峰峰值、有效值、均值和峰值; x m 1 x m 2 x m 3 x m 4 分别代表内存使用的峰峰值、有效值、均值和峰值。
步骤103、匹配规则。
在本步骤中,可以根据确定出的特征向量,从预先建立的规则库中匹配对应的规则。
在本实施例中,规则可以包括规则语句,规则语句可以包括规则关键字(if,then)、规则前件和规则后件。主要形式可以为:“if规则前件then规则后件”,其含义可以理解为,如果满足规则前件,则得到规则后件。如
Figure BDA00002575385000055
(HCPU=1表示CPU不正常);
规则前件,通常是由若干个布尔表达式通过逻辑运算符(如,(&&)或(||))组合得到的一个表达式。布尔表达式中的连接符可以是关系运算符(如,<,>,<=,>=,==等),但不能出现赋值符(=),即不能对参数直接赋值,否则可以认为规则前件为不合法的规则前件。
规则后件,通常是由期望值表达式以及相关的说明组成。期望值表达式可以由逻辑运算符与或非分隔。相关的说明可以包括参数或函数的误差限等。
必要时规则前件可以为空,规则后件不能为空。
每条规则语句还可以包括结束符,结束符可以位于规则后件之后,表示一条规则的结束。具体的,结束符可以为“;”。
规则库可以省略规则关键字和结束符,通过如下表所示的方式保存的每条规则:
  规则编号   规则所属节点   规则前件   规则后件
  0001   服务节点1   Ifa>1   B=1
  0002   服务节点2   If a>0&&a<1   B=2
  0003   服务节点3   Ifa<0   B=3
表1
具体的,可以将规则前件与所述特征向量匹配的规则,确定为匹配出的规则。且较优的,可以通过前向规则快速匹配(RETE)算法进行规则匹配。
步骤104、确定服务节点是否运行正常。
在本步骤中,可以根据匹配出的规则确定推理结果,根据该推理结果确定所述服务节点是否运行正常。
根据匹配出的规则确定推理结果,可以具体包括:
在匹配出的规则为至少两个时,按照每个匹配出的规则的优先级由高到低的顺序,依次利用每个匹配出的规则确定推理结果,并将利用匹配出的优先级最低的规则确定出的推理结果确定为根据匹配出的规则确定出的推理结果。
根据该推理结果确定该服务节点是否运行正常,可以具体包括:
根据预先设置的推理结果与运行状态的对应关系,确定该服务节点是否运行正常。具体的,在本实施例中,可以利用预制文本法的解释机制对推理结果进行解释。
进一步的,在本实施例中,还可以根据确定出的服务节点的运行状态是否正常的结果,进行负载分配,从而进一步实现PaaS平台的负载均衡。
如果确定所述服务节点运行不正常,则可以继续执行步骤105。
如果确定所述服务节点运行正常,则可以跳转执行步骤106。
步骤105、进行负载分配。
在确定一个服务节点运行不正常时,可以针对该服务节点进行负载分配,从而实现负载均衡。例如,将该服务节点中负载开销最大(如占用的CPU负荷最大,和/或,内存使用的峰峰值最大)的应用程序部署到其他服务节点。
当然,在确定一个服务节点运行不正常时,还可以针对该服务节点发出告警信息。
通过步骤101~步骤105,可以针对运行不正常的服务节点重新进行负载分配,由于运行状态是否正常是通过规则推理的方式确定,相较于现有技术中与预设值进行比较的方式,可以大大提高确定出的运行状态是否正常的结果的准确性,从而可以保证负载均衡的准确性。
步骤105执行完毕后,可以结束本流程。
步骤106、确定运行趋势信息。
在确定一个服务节点运行正常时,在本步骤中,可以利用该服务节点的运行状态信息,采用自回归方法获得该服务节点的运行趋势信息,所述运行趋势信息表示预测出的该服务节点未来的运行状态。
步骤107、进行负载分配。
由于步骤101~步骤104、以及步骤106可以针对PaaS平台中的每个服务节点分别进行,因此,在本步骤中,可以根据每个运行正常的服务节点的运行状态信息和运行趋势信息,在运行正常的服务节点中进行负载分配。
具体的,可以根据每个运行正常的服务节点的运行状态信息,确定该服务节点当前可承受负载值,并根据每个运行正常的服务节点的运行趋势信息,确定该服务节点未来可承受负载值;将待分配的应用程序,部署到当前可承受负载值和未来可承受负载值均满足该待分配的应用程序负载开销的服务节点。
从而可以进一步针对运行正常的服务节点进行负载分配,并可以保证分配了负载的服务节点在一定时间长度内都可以正常运行,无需对该服务节点的负载进行频繁调整,减少负载分配次数,减轻系统的负荷,满足云计算环境复杂多变的要求。
下面通过实施例二对实施例一中涉及的规则匹配和推理过程,即步骤102和步骤103进行说明。
实施例二、
规则匹配和推理的原理示意图可以如图2所示,假设实施例一中各步骤的执行主体为PaaS平台中的管理节点。针对每个服务节点,管理节点均可以执行以下操作:
将该服务节点发送的运行状态信息发送到推理机内核。推理机内核将根据运行状态信息确定出的特征向量写入黑板区,并利用RETE算法,对黑板区内容,和从规则库中获取的规则进行匹配,根据匹配出的规则进行推理,确定推理结果,并写入结果存储区。在结果存储区写入推理结果后,可以根据该推理结果确定该服务节点是否运行正常。
具体的,根据特征向量,采用规则推理的方法对PaaS平台健康状态进行分类的步骤可以如下:
a)将特征向量(事实)输入黑板区。
b)使用RETE算法比较规则库中的规则和数据(事实)。通过比较事实和规则的规则前件部分,决定选择执行哪些规则,何时执行规则。
c)如果待执行规则存在冲突,即同时激活了多个规则,将冲突的规则放入冲突集合。
d)解决冲突。将激活的规则按照优先级,放入规则优先级表,这些规则都匹配黑板区中的事实。如果同时有多个规则和事实匹配,则优先级最高的规则被触发。被触发规则的执行可能会产生新的事实,新的事实也被加入黑板区。
e)使用执行引擎执行规则优先级表中的规则。重复步骤a至e,直到执行完毕所有规则优先级表中的规则。
f)结果解释。推理机可以采用预置文本法的解释机制对推理结果进行解释。
在确定该服务节点运行不正常时,可以针对该服务节点发出告警信息,并将该服务节点中负载开销最大(如占用的CPU负荷最大,和/或,内存使用的峰峰值最大)的应用程序部署到其他服务节点。
在确定该服务节点运行正常时,可以确定该服务节点的运行趋势信息,从而可以根据该服务节点的运行状态信息和运行趋势信息,确定该服务节点的当前可承受负载值和未来可承受负载值,并可以将负载开销既不高于该服务节点的当前可承受负载值,也不高于该服务节点的未来可承受负载值的应用程序部署到该服务节点。
下面通过实施例三对实施例一中涉及的确定运行趋势信息的过程,即步骤106进行说明。
实施例三、
本发明实施例三提供一种确定运行趋势信息的方法,本实施例中,以利用以下模型(自回归和滑动平均(ARMA,Auto-Regressive and Moving Average)模型)确定该服务节点的运行趋势信息为例进行说明。
xt=φ01xt-1t-2xt-2+…+φpxt-pt1εt-12εt-2-…-θqεt-q
其中,
xt表示t时刻确定出的该服务节点的运行趋势信息;
xt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量,i为0或正整数;
εt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量的残差;
φ=[φ01,……φp]表示自回归参数;
θ=[θ01,……θq]表示滑动平均参数;
p表示ARMA模型的自回归阶数;
q表示ARMA模型的滑动平均阶数。
该方法的步骤流程可以如图3所示,包括:
步骤301、对采集到的运行状态信息进行平滑处理。
步骤302、判断运行状态信息是否为平稳非白噪声序列。
在本步骤中,可以判断经过平滑处理后,运行状态信息是否为平稳非白噪声序列。
若是,则可以继续执行步骤303,否则,可以返回执行步骤301。
步骤303、确定自相关函数(ACF)及偏自相关函数(PACF)。
在本步骤中,可以确定运行状态信息的ACF及PACF。
步骤304、进行ARMA模型识别。
在本步骤中,可以根据确定出的ACF和PACF,进行ARMA模型识别,得到ARMA模型的阶数p,q。
步骤305、估计ARMA模型中未知参数值φ,θ。
步骤306、模型检验。
在本步骤中,即检验残差序列是否符合白噪声分布。
如果是,则可以执行步骤307,否则,可以返回执行步骤304。
步骤307、确定运行趋势信息。
在本步骤中,可以利用获得的ARAM模型确定运行趋势信息。
与本发明实施例一~三基于同一发明构思,提供以下的装置。
实施例四、
本发明实施例四提供一种PaaS平台健康状态管理装置,该装置的结构可以如图4所示,包括:
接收模块11用于针对每个服务节点,接收该服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态;确定模块12用于根据所述运行状态信息,确定特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量;匹配模块13用于根据确定模块确定出的特征向量,从预先建立的规则库中匹配对应的规则,所述规则库中包括的每条规则包括规则前件和规则后件,每条规则的规则前件表示执行该规则的条件,每条规则的规则后件表示执行该规则的结果,且所述规则前件用于与特征向量相匹配;推理模块14用于根据匹配模块匹配出的规则进行规则推理,确定推理结果,根据该推理结果确定一个服务节点是否运行正常。
推理模块14具体用于在匹配出的规则为至少两个时,按照每个匹配出的规则的优先级由高到低的顺序,依次利用每个匹配出的规则确定推理结果,并将利用匹配出的优先级最低的规则确定出的推理结果确定为根据匹配出的规则确定出的推理结果。
所述装置还包括预测模块16和负载分配模块15:
预测模块16用于在推理模块确定一个服务节点运行正常时,利用该服务节点的运行状态信息,采用自回归方法获得该服务节点的运行趋势信息,所述运行趋势信息表示预测出的该服务节点未来的运行状态;
所述负载分配模块15用于根据每个运行正常的服务节点的运行状态信息和运行趋势信息,在运行正常的服务节点中进行负载分配。
所述预测模块16具体用于通过以下公式确定该服务节点的运行趋势信息:
xt=φ01xt-1t-2xt-2+…+φpxt-pt1εt-12εt-2-…-θqεt-q
其中,
xt表示t时刻确定出的该服务节点的运行趋势信息;
xt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量,i为0或正整数;
εt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量的残差;
φ=[φ01,……φp]表示自回归参数;
θ=[θ01,……θq]表示滑动平均参数;
p表示ARMA模型的自回归阶数;
q表示ARMA模型的滑动平均阶数。
负载分配模块15还可以用于在推理模块确定一个服务节点运行不正常时,针对该服务节点进行负载分配。
下面通过一个具体的实例对本发明实施例一~四的方案进行说明。
实施例五、
本发明实施例五提供一种PaaS平台健康状态管理方法,该方法的步骤流程可以如图5所示,包括:
步骤501、接收运行状态信息。
在本步骤中,可以接收一个服务节点的以下运行状态信息:
硬盘存储使用信息xh针对当前时刻连续10个采样数据为:{2.4312692.613896 1.615101 2.558271 2.210645 1.6626 1.157427 1.984859 1.2179212.710799};
各应用程序占用的CPU负荷xc针对当前时刻连续10个采样数据为:{0.671649994 0.214749514 0.029142646 0.334102949 0.7066622690.992276492 0.978470981 0.18364804 0.250940954 0.985941602};
内存使用信息xm针对当前时刻连续10个采样数据为:{1.084801718 1.011667146 1.100778347 0.995848495 1.4964643770.928941309 0.806414335 1.328631448 0.864629785 0.659997248}。
步骤502、确定特征向量。
根据上述接收到的运行状态信息,可以得到如下12个特征值:CPU使用的峰峰值、CPU使用的有效值、CPU使用的均值、CPU使用的峰值、内存使用的峰峰值、内存使用的有效值、内存使用的均值、内存使用的峰值、硬盘存储使用的峰峰值、硬盘存储使用的有效值、硬盘存储使用的均值和硬盘存储使用的峰值,从而可以得到特征向量xt={1.553372 2.089475493 2.01627882.710799 0.963133846 0.641862416 0.534758544 0.9922764920.836467129 1.053792038 1.027817421 1.496464377}。
步骤503、匹配规则。
在规则库中预先建立的规则如下:
If x h 4 > 2 GthenR = 1 ; (R表示资源状态1为异常,0为正常);
If x m 4 > 1 GthenR = 1 ;
If x c 3 > 0.85 thenR = 1 ;
Figure BDA00002575385000124
其中, x h 1 x h 2 x h 3 x h 4 分别代表硬盘存储使用的峰峰值、有效值、均值和峰值; x c 1 x c 2 x c 3 x c 4 分别代表CPU使用的峰峰值、有效值、均值和峰值; x m 1 x m 2 x m 3 x m 4 分别代表内存使用的峰峰值、有效值、均值和峰值。
由步骤502中得到的特征向量可知: x h 4 = 2.710799 ; x m 4 = 1.496464377 ; x c 3 = 0.992276 . 基于RETE规则推理可知:R=1。
步骤504、确定服务节点是否运行正常。
根据预置的文本解释,R表示资源状态,1为异常,0为正常。可以确定当R=1时,表示资源状态异常,因此可以确定服务节点出现运行异常。
步骤505、进行负载分配。
由步骤504可知,该服务节点出现运行异常。此时,可以针对该服务节点进行报警,并将该服务节点中CPU使用的峰峰值最大、且内存使用的峰峰值最大的应用程序重新部署到其它服务节点。
当然,如果在步骤504中确定所述服务节点运行正常,还可以根据实施例三继续确定该服务节点的运行趋势信息,并根据该服务节点的运行状态信息和运行趋势信息,在该服务节点中进行负载分配。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种平台即服务PaaS平台健康状态管理方法,其特征在于,所述方法包括:
针对每个服务节点,接收该服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态;
根据所述运行状态信息,确定特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量;
根据确定出的特征向量,从预先建立的规则库中匹配对应的规则,所述规则库中包括的每条规则包括规则前件和规则后件,每条规则的规则前件表示执行该规则的条件,每条规则的规则后件表示执行该规则的结果,且所述规则前件用于与特征向量相匹配;
根据匹配出的规则进行规则推理,确定推理结果,根据该推理结果确定该服务节点是否运行正常。
2.如权利要求1所述的方法,其特征在于,根据匹配出的规则进行规则推理,确定推理结果,具体包括:
在匹配出的规则为至少两个时,按照每个匹配出的规则的优先级由高到低的顺序,依次利用每个匹配出的规则确定推理结果,并将利用匹配出的优先级最低的规则确定出的推理结果确定为根据匹配出的规则确定出的推理结果。
3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
在确定一个服务节点运行正常时,利用该服务节点的运行状态信息,采用自回归方法获得该服务节点的运行趋势信息,所述运行趋势信息表示预测出的该服务节点未来的运行状态;
根据每个运行正常的服务节点的运行状态信息和运行趋势信息,在运行正常的服务节点中进行负载分配。
4.如权利要求3所述的方法,其特征在于,采用自回归方法获得该服务节点的运行趋势信息,具体包括:
通过以下公式确定该服务节点的运行趋势信息:
xt=φ01xt-1t-2xt-2+…+φpxt-pt1εt-12εt-2-…-θqεt-q
其中,
xt表示t时刻确定出的该服务节点的运行趋势信息;
xt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量,i为0或正整数;
εt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量的残差;
φ=[φ01,……φp]表示自回归参数;
θ=[θ01,……θq]表示滑动平均参数;
p表示ARMA模型的自回归阶数;
q表示ARMA模型的滑动平均阶数。
5.如权利要求1或2所述的方法,其特征在于,所述方法还包括:
在确定一个服务节点运行不正常时,针对该服务节点进行负载分配。
6.一种平台即服务PaaS平台健康状态管理装置,其特征在于,所述装置包括:
接收模块,用于针对每个服务节点,接收该服务节点发送的运行状态信息,所述运行状态信息表示该服务节点当前的运行状态;
确定模块,用于根据所述运行状态信息,确定特征向量,所述特征向量表示从所述运行状态信息中获得的特征值组成的向量;
匹配模块,用于根据确定模块确定出的特征向量,从预先建立的规则库中匹配对应的规则,所述规则库中包括的每条规则包括规则前件和规则后件,每条规则的规则前件表示执行该规则的条件,每条规则的规则后件表示执行该规则的结果,且所述规则前件用于与特征向量相匹配;
推理模块,用于根据匹配模块匹配出的规则进行规则推理,确定推理结果,根据该推理结果确定一个服务节点是否运行正常;
负载分配模块,用于在推理模块确定一个服务节点运行不正常时,针对该服务节点进行负载分配。
7.如权利要求6所述的装置,其特征在于,推理模块,具体用于在匹配出的规则为至少两个时,按照每个匹配出的规则的优先级由高到低的顺序,依次利用每个匹配出的规则确定推理结果,并将利用匹配出的优先级最低的规则确定出的推理结果确定为根据匹配出的规则确定出的推理结果。
8.如权利要求6或7所述的装置,其特征在于,所述装置还包括预测模块和负载分配模块:
预测模块,用于在推理模块确定一个服务节点运行正常时,利用该服务节点的运行状态信息,采用自回归方法获得该服务节点的运行趋势信息,所述运行趋势信息表示预测出的该服务节点未来的运行状态;
负载分配模块,用于根据每个运行正常的服务节点的运行状态信息和运行趋势信息,在运行正常的服务节点中进行负载分配。
9.如权利要求8所述的装置,其特征在于,所述预测模块,具体用于通过以下公式确定该服务节点的运行趋势信息:
xt=φ01xt-1t-2xt-2+…+φpxt-pt1εt-12εt-2-…-θqεt-q
其中,
xt表示t时刻确定出的该服务节点的运行趋势信息;
xt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量,i为0或正整数;
εt-i表示根据距离t时刻最近的第i+1次接收到的该服务节点运行状态信息确定出的特征向量的残差;
φ=[φ01,……φp]表示自回归参数;
θ=[θ01,……θq]表示滑动平均参数;
p表示ARMA模型的自回归阶数;
q表示ARMA模型的滑动平均阶数。
10.如权利要求6或7所述的装置,其特征在于,所述装置还包括负载分配模块:
负载分配模块,用于在推理模块确定一个服务节点运行不正常时,针对该服务节点进行负载分配。
CN201210537741.4A 2012-12-12 2012-12-12 一种PaaS平台健康状态管理方法和装置 Pending CN103870904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210537741.4A CN103870904A (zh) 2012-12-12 2012-12-12 一种PaaS平台健康状态管理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210537741.4A CN103870904A (zh) 2012-12-12 2012-12-12 一种PaaS平台健康状态管理方法和装置

Publications (1)

Publication Number Publication Date
CN103870904A true CN103870904A (zh) 2014-06-18

Family

ID=50909417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210537741.4A Pending CN103870904A (zh) 2012-12-12 2012-12-12 一种PaaS平台健康状态管理方法和装置

Country Status (1)

Country Link
CN (1) CN103870904A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790092A (zh) * 2016-12-23 2017-05-31 北京奇艺世纪科技有限公司 远程过程调用服务端控制系统及方法
CN108595333A (zh) * 2018-04-26 2018-09-28 Oppo广东移动通信有限公司 PaaS平台中应用进程的健康检查方法及装置
CN108960455A (zh) * 2018-08-10 2018-12-07 北京奇虎科技有限公司 业务运行状态分析方法、装置、计算设备及存储介质
WO2020030108A1 (zh) * 2018-08-10 2020-02-13 北京金山云网络技术有限公司 告警信息的产生方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281329A (zh) * 2011-08-02 2011-12-14 北京邮电大学 一种PaaS云平台的资源调度方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281329A (zh) * 2011-08-02 2011-12-14 北京邮电大学 一种PaaS云平台的资源调度方法和系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BERNARD FONG ETC.: "Prognostics and Health Management for wireless telemedicine networks", 《IEEE WIRELESSCOUMMUNICATIONS》 *
徐国祥 等: "《统计预测和决策》", 30 November 2008, 上海:上海财经大学出版社 *
时旺 等: "PHM系统及其故障预测模型研究", 《火力与指挥控制》 *
杨伟 等: "基于时间序列的服务器负载预测", 《计算机工程》 *
温祥西 等: "网络故障预测与健康管理关键技术综述", 《系统工程理论与实践》 *
田运: "《思维辞典》", 31 March 1996 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790092A (zh) * 2016-12-23 2017-05-31 北京奇艺世纪科技有限公司 远程过程调用服务端控制系统及方法
CN106790092B (zh) * 2016-12-23 2020-06-19 北京奇艺世纪科技有限公司 远程过程调用服务端控制系统及方法
CN108595333A (zh) * 2018-04-26 2018-09-28 Oppo广东移动通信有限公司 PaaS平台中应用进程的健康检查方法及装置
CN108960455A (zh) * 2018-08-10 2018-12-07 北京奇虎科技有限公司 业务运行状态分析方法、装置、计算设备及存储介质
WO2020030108A1 (zh) * 2018-08-10 2020-02-13 北京金山云网络技术有限公司 告警信息的产生方法、装置及电子设备
CN108960455B (zh) * 2018-08-10 2022-04-26 北京奇虎科技有限公司 业务运行状态分析方法、装置、计算设备及存储介质

Similar Documents

Publication Publication Date Title
CN108829494B (zh) 基于负载预测的容器云平台智能资源优化方法
CN112153700B (zh) 一种网络切片资源管理方法及设备
CN106803790B (zh) 一种集群系统的升级控制方法及装置
CN108989238A (zh) 一种分配业务带宽的方法以及相关设备
CN103309738A (zh) 用户作业调度方法及装置
CN105900064A (zh) 调度数据流任务的方法和装置
TW201717066A (zh) 叢集運算架構的資源規劃方法、系統及裝置
CN112068957B (zh) 资源分配方法、装置、计算机设备及存储介质
CN111510959B (zh) 一种部署nRT RIC功能的方法和设备
CN103870904A (zh) 一种PaaS平台健康状态管理方法和装置
WO2020009652A1 (en) Methods and systems for dynamic service performance prediction using transfer learning
CN113821332B (zh) 自动机器学习系统效能调优方法、装置、设备及介质
CN108616553B (zh) 云计算资源池进行资源调度的方法及装置
CN116166405A (zh) 异构场景下的神经网络任务调度策略确定方法及装置
CN114327811A (zh) 一种任务调度方法、装置、设备及可读存储介质
CN103324538B (zh) 一种异位分散集群环境分布式并发进程的设计方法
US8819239B2 (en) Distributed resource management systems and methods for resource management thereof
CN106156170B (zh) 舆情分析方法及装置
CN107070965B (zh) 一种虚拟化容器资源下的多工作流资源供给方法
CN112925634A (zh) 异构资源调度方法和系统
CN117271101B (zh) 一种算子融合方法、装置、电子设备及存储介质
WO2022026044A1 (en) Sharing of compute resources between the virtualized radio access network (vran) and other workloads
CN109788061B (zh) 计算任务部署方法及装置
CN110245688B (zh) 一种数据处理的方法及相关装置
CN116996938A (zh) 车联网任务卸载方法、终端设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140618

RJ01 Rejection of invention patent application after publication