发明内容
有鉴于此,本发明的目的是提供一种资源池业务健康的监控方法和系统,能对云计算资源池在一段时间内业务整体的运行状况进行有效监控。
为了达到上述目的,本发明提供了一种资源池业务健康的监控方法,包括有:
步骤一、为资源池中的各项资源设定对应的初始化业务分值,同时还为各项资源分别构建各自的运行状态集Y(z):{y1(z),y2(z),…,yn(z)},其中y1(z)是资源z的正常运行状态,y2(z)、…、yn(z)分别是资源z的各种非正常运行状态;
步骤二、定时采集资源池中各项资源的当前运行参数值,判断各项资源在其运行状态集中所对应的正常或非正常运行状态,然后根据其正常或非正常运行状态来分别计算各项资源的当前业务分值;
步骤三、统计资源池中所有资源的当前业务总分值,当所述业务总分值低于健康阈值时,发出报警信息。
为了达到上述目的,本发明还提供了一种资源池业务健康的监控系统,包括有:
业务健康初始化装置,用于为资源池中的各项资源设定对应的初始化业务分值,同时还为各项资源分别构建各自的运行状态集Y(z):{y1(z),y2(z),…,yn(z)},其中y1(z)是资源z的正常运行状态,y2(z)、…、yn(z)分别是资源z的各种非正常运行状态;
业务健康计算装置,用于定时采集资源池中各项资源的当前运行参数值,判断各项资源在其运行状态集中所对应的正常或非正常运行状态,然后根据其正常或非正常运行状态来分别计算各项资源的当前业务分值;
业务健康监控装置,用于统计资源池中所有资源的当前业务总分值,当所述业务总分值低于健康阈值时,发出报警信息。
与现有技术相比,本发明的有益效果是:本发明实时采集资源池中各项资源的当前运行参数,并根据每项资源的运行状态来计算获得业务整体的当前运行状况,从而极大地方便了业务管理员在后续对业务作进一步的优化操作,技术方案简单易行,并具有很强的实用性和可操作性;当某项资源包括有多个主机等物理实体时,本发明同时计算了单个主机以及所有主机两种情况下的业务分值,从而有效避免了单点超负荷的情况。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种资源池业务健康的监控方法,包括有:
步骤一、为资源池中的各项资源设定对应的初始化业务分值,同时还为各项资源分别构建各自的运行状态集Y(z):{y1(z),y2(z),…,yn(z)},其中y1(z)是资源z的正常运行状态,y2(z)、…、yn(z)分别是资源z的各种非正常运行状态;
步骤二、定时采集资源池中各项资源的当前运行参数值,判断各项资源在其运行状态集中所对应的正常或非正常运行状态,然后根据其正常或非正常运行状态来分别计算各项资源的当前业务分值;
步骤三、统计资源池中所有资源的当前业务总分值,当所述业务总分值低于健康阈值时,发出报警信息。
步骤一中,可以首先设定资源池中所有资源的初始化业务总分值,然后根据资源池中各项资源之间的权重比,再分别为每项资源设定对应的初始化业务分值。例如,如下表所示,资源池中所有资源的初始化业务总分值设为100,根据各项资源的权重比,将资源池中的各项资源的初始化业务分值分别设置如下:
根据各项资源的运行特性,每项资源可以设定多个运行状态,并构成各自的运行状态集,每个运行状态分别对应一个运行参数的不同区间范围,即根据资源的运行参数所在的区间范围来获得其对应的运行状态。例如,对于CPU来说,其运行状态集可以设定为{优,良,差},当CPU的使用率为60%~70%之间时,其运行状态为优(即正常运行状态);当CPU的使用率为70%~90%、或30%~60%之间时,其运行状态为良(即非正常运行状态1);当CPU的使用率大于90%、或小于30%时,其运行状态为差(即非正常运行状态2)。
如图2所示,图1步骤二中,计算资源池中资源z的当前业务分值,可以进一步包括有:
步骤21、采集资源z在多个时间点的运行参数值,然后统计资源z在当前时段的运行参数平均值,并保存在数据库中;
步骤22、根据资源z在当前时段的运行参数平均值,读取资源z在其运行状态集中对应的当前运行状态,并判断资源z的当前运行状态是否是正常运行状态(即y1(z))?如果是,则计算资源z的当前业务分值是:Z=Z0;如果否,则计算资源z的当前业务分值:其中,Z0是资源z的初始化业务分值,n是资源z的运行状态集中的所有运行状态总数,k是资源z的当前运行状态的非健康等级值,将运行状态集中的所有非正常运行状态按照其严重程度由轻到重的次序进行排序,每个非正常运行状态在运行状态集的所有非正常运行状态中所处的排序位置即是其对应的非健康等级值;
步骤23、从数据库中提取资源z在上一时段的运行参数平均值;
步骤24、计算资源z的运行状态动态变化值:其中,cyt(z)是资源z在当前时段的运行参数平均值,cyt-1(z)是资源z在上一时段的运行参数平均值,然后调整资源z的当前业务分值:当资源池中的某项资源的运行参数值随时间发生较大的动态变化时,则说明该项资源呈不稳定状况。
当资源池中的一项资源z包括有多个物理实体(例如多个主机)时,为了有效避免单点超负荷的情况,步骤一还可以包括有:
为资源z构建一个物理实体集W:{w1(z),w2(z),…,wm(z)},其中w1(z)、w2(z)、…、wm(z)是资源z所包括的所有物理实体,并为每个物理实体设置对应的初始化业务分值:其中,Z0是资源z的初始化业务分值,j是1到m之间的一个自然数,是资源z的物理实体集中的第j个物理实体的初始化业务分值,m是资源z的物理实体集中的物理实体总数,同时,将资源z的初始化业务分值调整为:
步骤21进一步包括有:
采集资源z的每个物理实体在多个时间点的运行参数值,然后统计每个物理实体在当前时段的运行参数平均值,并计算资源z在当前时段的运行参数平均值:其中,cyt j(z)是资源z的第j个物理实体在当前时段的运行参数平均值,同时保存在数据库中,
步骤22进一步包括有:
步骤221、根据资源z在当前时段的运行参数平均值,读取资源z在其运行状态集中对应的当前运行状态,并判断资源z的当前运行状态是否是正常运行状态?如果是,则计算资源z的当前业务分值是:Z=Z0;如果否,则计算资源z的当前业务分值:其中,n是资源z的运行状态集中的所有运行状态总数,k是资源z的当前运行状态的非健康等级值;
步骤222、根据物理实体在当前时段的运行参数平均值,读取每个物理实体在其所属资源z的运行状态集中对应的当前运行状态,并判断每个物理实体的当前运行状态是否是正常运行状态,如果是,则计算该物理实体的当前业务分值是:如果否,则计算该物理实体的当前业务分值:其中,kj是第j个物理实体的当前运行状态的非健康等级值,即将所有非正常运行状态按照其严重程度由轻到重的次序进行排序,第j个物理实体的当前运行状态在其所属资源的运行状态集的所有非正常运行状态中所处的排序位置;
步骤223、调整资源z的当前业务分值为:
如图3所示,本发明一种资源池业务健康的监控系统,包括有:
业务健康初始化装置,用于为资源池中的各项资源设定对应的初始化业务分值,同时还为各项资源分别构建各自的运行状态集Y(z):{y1(z),y2(z),…,yn(z)},其中y1(z)是资源z的正常运行状态,y2(z)、…、yn(z)分别是资源z的各种非正常运行状态;
业务健康计算装置,用于定时采集资源池中各项资源的当前运行参数值,判断各项资源在其运行状态集中所对应的正常或非正常运行状态,然后根据其正常或非正常运行状态来分别计算各项资源的当前业务分值;
业务健康监控装置,用于统计资源池中所有资源的当前业务总分值,当所述业务总分值低于健康阈值时,发出报警信息。
业务健康初始化装置中,可以首先设定资源池中所有资源的初始化业务总分值,然后根据资源池中各项资源之间的权重比,再分别为每项资源设定对应的初始化业务分值。根据各项资源的运行特性,每项资源可以设定多个运行状态,并构成各自的运行状态集,每个运行状态分别对应一个运行参数的不同区间范围,即根据资源的运行参数所在的区间范围来获得其对应的运行状态。
业务健康计算装置进一步包括有:
采集部件,用于采集每项资源在多个时间点的运行参数值,然后统计每项资源在当前时段的运行参数平均值,并保存在数据库中;
业务状态计算部件,用于根据每项资源在当前时段的运行参数平均值,读取其在运行状态集中对应的当前运行状态,然后判断各项资源的当前运行状态是否是正常运行状态,如果是,则计算该项资源的当前业务分值是:Z=Z0;如果否,则计算该项资源的当前业务分值:其中,Z0是资源z的初始化业务分值,n是资源z的运行状态集中的所有运行状态总数,k是资源z的当前运行状态的非健康等级值,将运行状态集中的所有非正常运行状态按照其严重程度由轻到重的次序进行排序,每个非正常运行状态在运行状态集的所有非正常运行状态中所处的排序位置即是其对应的非健康等级值;
业务动态计算部件,用于从数据库中提取各项资源在上一时段的运行参数平均值,然后计算各项资源的运行状态动态变化值:其中,d(z)是资源z的运行状态动态变化值,cyt(z)是资源z在当前时段的运行参数平均值,cyt-1(z)是资源z在上一时段的运行参数平均值,最后调整各项资源的当前业务分值:
当资源池中的一项资源z包括有多个物理实体(例如多个主机)时,为了有效避免单点超负荷的情况,业务健康初始化装置还可以包括有:
多实体业务初始化单元,用于为包含有多个物理实体的资源构建各自的物理实体集W:{w1(z),w2(z),…,wm(z)},其中w1(z)、w2(z)、…、wm(z)是资源z所包括的所有物理实体,并为每个物理实体设置对应的初始化业务分值:其中,Z0是资源z的初始化业务分值,j是1到m之间的一个自然数,是资源z的物理实体集中的第j个物理实体的初始化业务分值,m是资源z的物理实体集中的物理实体总数,同时,将资源z的初始化业务分值调整为:
业务健康计算装置的采集部件进一步包括有:
多实体采集单元,用于采集各项资源的所有物理实体在多个时间点的运行参数值,然后统计每个物理实体在当前时段的运行参数平均值,并计算多个物理实体所属资源在当前时段的运行参数平均值:其中,cyt j(z)是资源z的第j个物理实体在当前时段的运行参数平均值,同时保存在数据库中,
业务状态计算部件进一步包括有:
资源业务状态计算单元,用于根据多个物理实体所属资源在当前时段的运行参数平均值,读取资源在其运行状态集中对应的当前运行状态,并判断资源的当前运行状态是否是正常运行状态,如果是,则计算资源的当前业务分值是:Z=Z0;如果否,则计算资源的当前业务分值:其中,n是资源z的运行状态集中的所有运行状态总数,k是资源z的当前运行状态的非健康等级值;
多实体业务状态计算单元,用于根据物理实体在当前时段的运行参数平均值,读取资源所包含的每个物理实体在其所属资源的运行状态集中对应的当前运行状态,并判断每个物理实体的当前运行状态是否是正常运行状态,如果是,则计算该物理实体的当前业务分值是:如果否,则计算该物理实体的当前业务分值:其中,kj是第j个物理实体的当前运行状态的非健康等级值,即将所有非正常运行状态按照其严重程度由轻到重的次序进行排序,第j个物理实体的当前运行状态在其所属资源的运行状态集的所有运行状态中所处的排序位置,最后调整多个物理实体所属资源的当前业务分值为:
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。