CN102916831A - 业务系统的健康度获得方法及系统 - Google Patents

业务系统的健康度获得方法及系统 Download PDF

Info

Publication number
CN102916831A
CN102916831A CN2012103479714A CN201210347971A CN102916831A CN 102916831 A CN102916831 A CN 102916831A CN 2012103479714 A CN2012103479714 A CN 2012103479714A CN 201210347971 A CN201210347971 A CN 201210347971A CN 102916831 A CN102916831 A CN 102916831A
Authority
CN
China
Prior art keywords
service equipment
service
health degree
equipment
described service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103479714A
Other languages
English (en)
Other versions
CN102916831B (zh
Inventor
冯晋阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201210347971.4A priority Critical patent/CN102916831B/zh
Publication of CN102916831A publication Critical patent/CN102916831A/zh
Application granted granted Critical
Publication of CN102916831B publication Critical patent/CN102916831B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种业务系统的健康度获得方法及系统。该方法包括:根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度;根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。该系统包括:第一处理模块,第二处理模块和第三处理模块。根据本发明的业务系统的健康度获得方法及系统,能够对整个业务系统的状态进行准确和全面的评估。

Description

业务系统的健康度获得方法及系统
技术领域
本发明涉及通信技术领域,尤其涉及一种业务系统的健康度获得方法及系统。
背景技术
系统健康度评估是用于对业务系统的健康程度进行评估的技术。对于一个由多台网络设备、多台主机和相关的软件关联起来组成的业务系统,各个设备会对业务系统的整体效果产生一定比例的影响。通过系统健康度评估,能够帮助运维管理人员全面了解业务系统的状态。
当前主要采用基于应用的分析。这种分析方法是把一个业务应用看成为一个整体,通过直接关联系统资源与业务,所有的关联资源节点设置一个对应的权重系数,根据获取的各系统资源故障信息的返回值,对系统资源的健康度的值进行分析评定,再以对应的权重与系统资源的健康值进行计算,不断循环,直到所有关联的系统资源计算完成,然后合并为业务系统的健康度。但是,采用这种方法对业务系统的状态评估不够准确和全面。
发明内容
本发明提供一种业务系统的健康度获得方法及系统,以准确和全面的评估业务系统的状态。
为实现本发明的目的,一方面,本发明提供了一种业务系统的健康度获得方法,所述业务系统承载至少一个业务应用,所述业务应用对应所述业务系统的至少一个服务设备,所述方法包括:
根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度,所述处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延;
根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;
根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。
另一方面,本发明还提供了一种业务系统的健康度获得系统,所述业务系统承载至少一个业务应用,所述业务应用对应所述业务系统的至少一个服务设备,所述系统包括:
第一处理模块,用于根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度,所述处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延;
第二处理模块,用于根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;
第三处理模块,用于根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。
本发明根据业务系统资源层、业务应用层、服务层和客户层的四层结构,以及业务系统中多个业务应用之间的服务设备交叉共享使用的情况,确定服务设备对业务应用、系统服务和客户的影响,以及业务应用对系统服务和客户的影响,根据服务设备的处理性能信息,获得每个服务设备的健康度,再根据服务设备的健康度,获得业务应用的健康度,最后根据业务应用的健康度或者根据业务应用和部分服务设备的健康度获得整个业务系统的健康度,而对整个业务系统的状态进行准确和全面的评估。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的业务系统的健康度获得方法的实施例的流程图;
图2为本发明的业务系统的健康度获得方法的又一实施例的流程图;
图3为本发明的业务系统的健康度获得系统的实施例的结构示意图;
图4为本发明的业务系统的健康度获得系统的又一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明的业务系统的健康度获得方法的实施例的流程图,本实施例具体可适用于业务系统的健康度的获得,该业务系统承载至少一个业务应用,该业务应用对应该业务系统的至少一个服务设备,以软件和/或硬件的形式来实现,如图1所示,本实施例的业务系统的健康度获得方法的具体步骤如下:
S11:根据每个服务设备的处理性能信息,获得每个该服务设备的健康度。该处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延。
本实施例的业务系统承载至少一个业务应用,每个业务应用对应该业务系统的至少一个服务设备。每个服务设备的处理性能信息,可以反映该服务设备的健康状态。该处理性能信息包括以下信息中的一种或者多种组合:CPU(Central Processing Unit,中央处理器)平均利用率,CPU平均负载,内存利用率和Ping(Packet Internet Groper,因特网包探索器)时延。例如,一个服务设备的CPU平均负载达到90%以上,则该服务设备单从CPU平均负载这一处理性能信息来看,由于该服务设备平均负载过高,该服务设备将不适合提供新的服务或者是处理新的任务,甚至该服务设备处理当前任务的能力也将下降,那么可以确定该服务设备的健康状态不佳。本实施例则根据每个服务设备的处理性能信息,获得每个该服务设备的健康度,以获得整个业务系统的健康度。
作为一种可实施的方式,还可以根据每个服务设备的处理性能信息、平均故障间隔时间(Mean Time Between Failure,以下简称MTBF)和平均故障修复时间(Mean Time To Restoration,以下简称MTTR),获得每个该服务设备的健康度。每个服务设备在运行过程中,可能有故障发生,因此在获得服务设备的健康度的过程中,可通过服务设备的处理性能信息、MTBF和MTTR共同衡量服务设备的健康度。MTBF,为设备在两次相邻故障间的平均工作时间,也就是设备在操作使用或测试期间的平均连续无故障时间,是衡量设备可靠性、稳定性的重要指标,属于国际行业标准。MTTR,为修复一次设备故障所需要的时间,即设备由故障状态转为工作状态时修理时间的平均值,是衡量一个设备可靠性的重要指标,它的值越小说明该设备的可靠性越高。
可选的,在获取每个服务设备的处理性能信息之前,可以先对该服务设备进行可用性判断,即判断该服务设备是否可用,如果该服务设备可用,则获取该服务设备的处理性能信息,并据此获得每个该服务设备的健康度;如果该服务设备不可用,则说明该服务设备正处于故障状态,或者由于未接入业务系统或者未上电或者其他原因而不能工作,那么该服务设备的健康度为0。
S12:根据至少一个服务设备中部分服务设备或全部服务设备中每个服务设备的健康度和预先设置的每个服务设备的权重系数,获得每个业务应用的健康度。
本实施例的每个业务应用对应业务系统的至少一个服务设备,同时,多个业务应用之间的服务设备可能有交叉共享使用的情况,即一个服务设备对应多个业务应用,则一个服务设备可以影响到至少一个业务应用、至少一项系统服务、至少一位使用者。本实施例中,根据每个业务应用对应的至少一个服务设备的健康度和该业务应用对应的服务设备的权重系数,获得每个业务应用的健康度。该权重系数为根据该服务设备对其对应的业务应用、系统服务以及对应业务应用和系统服务的使用者的影响而预先设置的。由于一个服务设备对不同业务应用、不同系统服务以及不同使用者的影响不同,该服务设备对该服务设备对应的业务应用的健康度评估的影响也不同。例如,一个服务设备直接影响业务系统所承载的核心业务应用,也是该业务系统提供的核心系统服务的关键服务设备,该服务设备的使用者主要是某公司的核心部门,那么该服务设备的权重系数将相对其他服务设备较大。
S13:根据每个业务应用的健康度,或者根据每个业务应用的健康度和至少一个服务设备中除该部分服务设备之外的其他服务设备的健康度,获得该业务系统的健康度。
本实施例的一种可实施场景是,每一个服务设备均有对应的业务应用,则根据前述步骤已经获得的每个业务应用的健康度,获得整个业务系统的健康度。具体的,可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据每一个业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的。
本实施例的另一种可实施场景是,部分服务设备有对应的业务应用,其余部分服务设备虽然没有对应于业务应用,但是却对整个业务系统的健康状态有直接的影响,则根据前述步骤已经获得的每个业务应用的健康度,以及前述的其余部分服务设备的健康度,获得整个业务系统的健康度。具体的,可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积和所述其余部分服务设备的健康度与该部分对应服务设备的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据该业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的,所述其余部分服务设备的权重系数则是根据该部分服务设备对该业务系统的影响程度预先设置的。
本实施例的技术方案,根据服务设备的处理性能信息,获得每个服务设备的健康度,再根据服务设备的健康度,获得业务应用的健康度,最后根据业务应用的健康度或者根据业务应用和部分服务设备的健康度获得整个业务系统的健康度,而对整个业务系统的状态进行准确和全面的评估。
图2为本发明的业务系统的健康度获得方法的又一实施例的流程图,如图2所示,本实施例的业务系统的健康度获得方法的具体步骤如下:
S21:根据每个服务设备的处理性能信息,获得每个服务设备的繁忙度。
业务系统的每个服务设备的处理性能信息,可以反映该服务设备的运行状态,根据每个服务设备的处理性能信息,即可获得每个服务设备的繁忙度,该繁忙度可用于表示业务系统的每个服务设备运行的繁忙程度或状态。本发明的处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延。例如,一个服务设备的Ping时延达到50ms,根据预设的Ping时延繁忙阈值38ms,则该服务设备为繁忙状态。再如,一个服务设备的内存利用率达到95%,根据预设的内存利用率过载阈值85%,则该服务设备为过载状态。根据每个服务设备的至少一个处理性能信息所示的繁忙状态,获得该每个服务设备的繁忙度。
S22:根据每个服务设备的繁忙度,获得每个服务设备的健康度。
业务系统中的服务设备在运行中的繁忙程度或者状态,可反映出该服务设备的健康程度,本实施例中,根据每个服务设备的繁忙度,来获得每个服务设备的健康度。例如,服务设备的繁忙状态可以分为正常、繁忙和过载三种状态,可以认为当一个服务设备的繁忙状态为正常时,该服务设备为健康状态,即健康度高,而当该服务设备的繁忙状态为繁忙或者过载时,该服务设备为不健康状态,即健康度低。还可以将服务设备的繁忙状态分为空闲、正常、繁忙和过载四种状态,一个服务设备的繁忙状态为空闲或正常时,该服务设备为健康状态,即健康度高,而当该服务设备的繁忙状态为繁忙或者过载时,该服务设备为不健康状态,即健康度低。即根据每个服务设备的繁忙度,通过预设的规则,获得每个服务设备的健康度。
一种可实施的方式,还可以根据每个服务设备的繁忙度、MTBF和MTTR,获得每个服务设备的健康度。每个服务设备在运行过程中,可能有故障发生,因此在获得服务设备的健康度的过程中,还可通过服务设备的繁忙度、MTBF和MTTR共同衡量服务设备的健康度。MTBF,为设备在两次相邻故障间的平均工作时间,也就是设备在操作使用或测试期间的平均连续无故障时间,是衡量设备可靠性、稳定性的重要指标,属于国际行业标准。MTTR,为修复一次设备故障所需要的时间,即设备由故障状态转为工作状态时修理时间的平均值,是衡量一个设备可靠性的重要指标,它的值越小说明该设备的可靠性越高。例如,用hi表示业务系统中第i个服务设备的健康度,MTTRi表示业务系统中第i个服务设备的平均故障修复时间,MTBFi表示业务系统中第i个服务设备的平均故障间隔时间,Bi表示业务系统中第i个服务设备的繁忙度,ki1、ki2和ki3为业务系统中第i个服务设备的健康度系数,根据MTTRi、MTBFi和Bi对该业务系统中第i个服务设备的健康度的影响程度设定,ki1+ki2+ki3=1,则可以根据hi=ki1*MTTRi+ki2*MTBFi+ki3*Bi,获得该业务系统中第i个服务设备的健康度。
通过服务设备的处理性能信息,获得每个服务设备的繁忙度,再根据服务设备的繁忙度,获得服务设备的健康度,能够准确和全面的对服务设备的状态进行估评估。
可选的,在获取每个服务设备的处理性能信息之前,可以先对该服务设备进行可用性判断,即判断该服务设备是否可用,如果该服务设备可用,则获取该服务设备的处理性能信息,并据此获得每个该服务设备的健康度;如果该服务设备不可用,则说明该服务设备正处于故障状态,或者由于未接入业务系统或者未上电或者其他原因而不能工作,那么该服务设备的健康度为0。
S23:根据至少一个服务设备中部分服务设备或全部服务设备中每个服务设备的健康度和预先设置的每个服务设备的权重系数,获得每个业务应用的健康度。
本实施例的每个业务应用对应业务系统的至少一个服务设备,同时,多个业务应用之间的服务设备可能有交叉共享使用的情况,即一个服务设备对应多个业务应用,则一个服务设备可以影响到至少一个业务应用、至少一项系统服务、至少一位使用者。本实施例中,根据每个业务应用对应的至少一个服务设备的健康度和该业务应用对应的服务设备的权重系数,获得每个业务应用的健康度。该权重系数为根据该服务设备对其对应的业务应用、系统服务以及对应业务应用和系统服务的使用者的影响而预先设置的。由于一个服务设备对不同业务应用、不同系统服务以及不同使用者的影响不同,该服务设备对该服务设备对应的业务应用的健康度评估的影响也不同。例如,一个服务设备直接影响业务系统所承载的核心业务应用,也是该业务系统提供的核心系统服务的关键服务设备,该服务设备的使用者主要是某公司的核心部门,那么该服务设备的权重系数将相对其他服务设备较大。
S24:根据每个业务应用的健康度,或者根据每个业务应用的健康度和所述至少一个服务设备中除该部分服务设备之外的其他服务设备的健康度,获得该业务系统的健康度。
本实施例的一种可实施场景是,每一个服务设备均有对应的业务应用,则根据前述步骤已经获得的每个业务应用的健康度,获得整个业务系统的健康度。具体的,可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据每一个业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的。
本实施例的另一种可实施场景是,部分服务设备有对应的业务应用,其余部分服务设备虽然没有对应于业务应用,但是却对整个业务系统的健康状态有直接的影响,则根据前述步骤已经获得的每个业务应用的健康度,以及前述的其余部分服务设备的健康度,获得整个业务系统的健康度。具体的,可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积和所述其余部分服务设备的健康度与该部分对应服务设备的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据该业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的,所述其余部分服务设备的权重系数则是根据该部分服务设备对该业务系统的影响程度预先设置的。
本实施例的技术方案,根据服务设备的处理性能信息,获得每个服务设备的健康度,再根据服务设备的健康度,获得业务应用的健康度,最后根据业务应用的健康度或者根据业务应用和部分服务设备的健康度获得整个业务系统的健康度,而对整个业务系统的状态进行准确和全面的评估。
可选的,在上述实施例的基础上,S21根据每个服务设备的处理性能信息,获得每个服务设备的繁忙度,具体包括以下步骤:
S211:根据指示每个服务设备的至少两种工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度。
业务系统中的服务设备至少存在两种工作状态:不繁忙状态和繁忙状态,而处理信息则指示每个服务设备的工作状态。例如,设定处理信息中的CPU平均利用率阈值大于或等于70%,则指示该服务设备的工作状态为繁忙状态,小于70%,则指示该服务设备的工作状态为不繁忙状态。当然,服务设备的工作状态也可以分为正常、繁忙和过载三种状态,例如,Ping时延小于10ms,则指示该服务设备的工作状态为正常状态,Ping时延大于或者等于10ms并小于50ms,则指示该服务设备的工作状态为繁忙状态,Ping时延大于或者等于50ms,则指示该服务设备的工作状态为过载状态。还可以将服务设备的工作状态分为空闲、正常、繁忙和过载四种状态,例如,服务设备的内存利用率为0,则指示该服务设备的工作状态为空闲状态,内存利用率大于0同时小于或者等于50%,则指示该服务设备的工作状态为正常状态,内存利用率大于50%同时小于或者等于85%,则指示该服务设备的工作状态为繁忙状态,内存利用率大于85%,则指示该服务设备的工作状态为过载状态。而指示服务设备不同工作状态的处理性能信息对应不同的权重,以服务设备的工作状态分为正常、繁忙和过载三种状态为例,可以预设指示正常状态的处理性能信息的权重为50%,指示繁忙状态的处理性能信息的权重为30%,指示过载状态的处理性能信息的权重为20%。本实施例中,根据指示每个服务设备的工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度。例如,服务设备的工作状态分为正常、繁忙和过载三种状态,该服务设备的处理性能信息共有10个,其中指示正常状态的处理性能信息共有5个,对应的权重为50%,指示繁忙状态的处理性能信息共有3个,对应的权重为30%,指示过载状态的处理性能信息共有2个,对应的权重为20%,则该服务设备的繁忙度为50%*5+30%*3+20%*2=3.8。
根据指示每个服务设备的工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度,能够准确和全面的对服务设备的状态进行估评估。
优选地,作为一种可实施方式,在上述实施例的基础上,S12根据至少一个服务设备中部分服务设备或全部服务设备中每个服务设备的健康度和预先设置的每个服务设备的权重系数,获得每个业务应用的健康度,具体包括以下步骤:
S121:根据
Figure BDA00002154492000101
获取第I个业务应用的健康度;
其中,HI表示业务系统所承载的第I个业务应用的健康度,hi表示第I个业务应用对应的服务设备中的第i个服务设备的健康度,ki表示第i个服务设备的健康权重系数,为根据第I个业务应用对应的每个服务设备中的第i个服务设备对第I个业务应用的影响程度设定,n表示第I个业务应用对应的服务设备总个数。
业务系统所承载的业务应用,可对应该业务系统中的每一个服务设备,也可对应该业务系统中的部分服务设备。一个业务应用所对应的服务设备对该业务应用的影响程度大小是不同的,根据该影响程度的大小可预先设置一个业务应用所对应的每个服务设备的权重系数。因此本实施方式中根据每个业务应用所对应的服务设备的健康度和预先设置的该业务应用所对应的服务设备中的每个服务设备的权重系数,获得每个业务应用的健康度。
本实施例的每个业务应用对应业务系统的至少一个服务设备,同时,多个业务应用之间的服务设备可能有交叉共享使用的情况,因此根据每个业务应用所对应的服务设备的健康度和预先设置的该业务应用所对应的服务设备中的每个服务设备的权重系数,获得每个业务应用的健康度,能够更加准确和全面的反应业务应用的运行状况。
优选地,作为一种可实施方式,在上述实施例的基础上,S13根据每个业务应用的健康度,或者根据每个业务应用的健康度和至少一个服务设备中除该部分服务设备之外的其他服务设备的健康度,获得该业务系统的健康度,具体包括以下步骤:
S131:根据
Figure BDA00002154492000102
获得业务系统的健康度;
其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,si为根据每个业务应用对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的;
或者 Q S = Σ j m H j * s j + Σ i n h i * s i , 获得业务系统的健康度;
其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,hi表示至少一个服务设备中除每个业务应用对应的部分所述服务设备之外的其他服务设备中的第i个设备的健康度,si表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备中的第i个设备的权重系数,n表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备的总个数,sj与si分别为根据每个业务应用和至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备,对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。
业务系统的服务设备,可以对应于该业务系统所承载的一个业务应用,也可以对应于该业务系统所承载的多个业务应用,还可以不对应该业务系统所承载的业务应用。本实施方式中,如果业务系统所承载的全部业务应用对应了该业务系统中的全部服务设备,则根据该业务系统所承载的每个业务应用的健康度获得该业务系统的健康度。具体的,可以根据
Figure BDA00002154492000111
来获得该业务系统的健康度。其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,si为根据每个业务应用对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。例如,该业务系统共承载了5个业务应用:业务应用a、业务应用b、业务应用c、业务应用d和业务应用e,它们的健康度依次为1.8、2.2、3.4、3.5和4.1,它们权重系数均为20%,则该业务系统的健康度为1.8*20%+2.2*20%+3.4*20%+3.5*20%+4.1*20%=3。
如果业务系统所承载的全部业务应用对应了该业务系统中的部分服务设备,即该部分服务设备以外的其他服务设备不对应该业务系统所承载的任何一个业务应用,但是该部分服务设备以外的其他服务设备可以对该业务系统的运行状态产生影响。则本实施方式中,还可以根据该业务系统所承载的每个业务应用的健康度和该部分服务设备以外的其他服务设备的健康度,获得该业务系统的健康度。具体的,可以根据
Figure BDA00002154492000121
获得业务系统的健康度。其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,hi表示至少一个服务设备中除每个业务应用对应的部分所述服务设备之外的其他服务设备中的第i个设备的健康度,si表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备中的第i个设备的权重系数,n表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备的总个数,sj与si分别为根据每个业务应用和至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备,对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。例如,该业务系统共承载了5个业务应用:业务应用a、业务应用b、业务应用c、业务应用d和业务应用e,它们的健康度依次为1.8、2.2、3.4、3.5和4.1,它们权重系数均为10%。另有2个服务设备F和G不对应上述5个业务应用中的任何一个,服务设备F和G的健康度分别为2.1和1.9,它们的权重系数分别为20%和30%,则该业务系统的健康度为1.8*10%+2.2*10%+3.4*10%+3.5*10%+4.1*10%+2.1*20%+1.9*30%=2.49。
本实施例的充分考虑影响业务系统运行状况的每一个业务应用及单独影响业务系统运行状况的每一个服务设备,并且根据每一个服务设备及每一个业务应用对应的整个业务系统所提供的服务以及服务对象,预设该业务系统健康度的影响因素的权重系数,据此获得整个业务系统的健康度,能够准确和全面的整个业务系统的运行状况。
图3为本发明的业务系统的健康度获得系统的实施例的结构示意图,如图3所示,本实施例的业务系统的健康度获得系统,包括:第一处理模块1,第二处理模块2和第三处理模块3。
第一处理模块1,用于根据每个服务设备的处理性能信息,获得每个该服务设备的健康度。该处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延。
本实施例的业务系统承载至少一个业务应用,每个业务应用对应该业务系统的至少一个服务设备。每个服务设备的处理性能信息,可以反映该服务设备的健康状态。该处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延。例如,一个服务设备的CPU平均负载达到90%以上,则该服务设备单从CPU平均负载这一处理性能信息来看,由于该服务设备平均负载过高,该服务设备将不适合提供新的服务或者是处理新的任务,甚至该服务设备处理当前任务的能力也将下降,那么可以确定该服务设备的健康状态不佳。本实施例中第一处理模块1根据每个服务设备的处理性能信息,获得每个该服务设备的健康度,以获得整个业务系统的健康度。
作为一种可实施的方式,第一处理模块1还可以根据每个服务设备的处理性能信息、MTBF和MTTR,获得每个该服务设备的健康度。每个服务设备在运行过程中,可能有故障发生,因此在获得服务设备的健康度的过程中,可通过服务设备的处理性能信息、MTBF和MTTR共同衡量服务设备的健康度。MTBF,为设备在两次相邻故障间的平均工作时间,也就是设备在操作使用或测试期间的平均连续无故障时间,是衡量设备可靠性、稳定性的重要指标,属于国际行业标准。MTTR,为修复一次设备故障所需要的时间,即设备由故障状态转为工作状态时修理时间的平均值,是衡量一个设备可靠性的重要指标,它的值越小说明该设备的可靠性越高。
可选的,在获取每个服务设备的处理性能信息之前,可以先对该服务设备进行可用性判断,即判断该服务设备是否可用,如果该服务设备可用,则获取该服务设备的处理性能信息,并据此获得每个该服务设备的健康度;如果该服务设备不可用,则说明该服务设备正处于故障状态,或者由于未接入业务系统或者未上电或者其他原因而不能工作,那么该服务设备的健康度为0。
第二处理模块2,用于根据至少一个服务设备中部分服务设备或全部服务设备中每个服务设备的健康度和预先设置的每个服务设备的权重系数,获得每个业务应用的健康度。
本实施例的每个业务应用对应业务系统的至少一个服务设备,同时,多个业务应用之间的服务设备可能有交叉共享使用的情况,即一个服务设备对应多个业务应用,则一个服务设备可以影响到至少一个业务应用、至少一项系统服务、至少一位使用者。本实施例中,第二处理模块2根据每个业务应用对应的至少一个服务设备的健康度和该业务应用对应的服务设备的权重系数,获得每个业务应用的健康度。该权重系数为根据该服务设备对其对应的业务应用、系统服务以及对应业务应用和系统服务的使用者的影响而预先设置的。由于一个服务设备对不同业务应用、不同系统服务以及不同使用者的影响不同,该服务设备对该服务设备对应的业务应用的健康度评估的影响也不同。例如,一个服务设备直接影响业务系统所承载的核心业务应用,也是该业务系统提供的核心系统服务的关键服务设备,该服务设备的使用者主要是某公司的核心部门,那么该服务设备的权重系数将相对其他服务设备较大。
第三处理模块3,用于根据每个业务应用的健康度,或者根据每个业务应用的健康度和至少一个服务设备中除该部分服务设备之外的其他服务设备的健康度,获得该业务系统的健康度。
本实施例的一种可实施场景是,每一个服务设备均有对应的业务应用,则根据前述步骤已经获得的每个业务应用的健康度,获得整个业务系统的健康度。具体的,第三处理模块3可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据每一个业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的。
本实施例的另一种可实施场景是,部分服务设备有对应的业务应用,其余部分服务设备虽然没有对应于业务应用,但是却对整个业务系统的健康状态有直接的影响,则根据前述步骤已经获得的每个业务应用的健康度,以及前述的其余部分服务设备的健康度,获得整个业务系统的健康度。具体的,第三处理模块3可以通过累加每个业务应用的健康度与对应业务应用的权重系数的乘积和所述其余部分服务设备的健康度与该部分对应服务设备的权重系数的乘积,获得整个业务系统的健康度。业务应用的权重系数则是根据该业务应用对该业务系统所提供的至少一项系统服务以及该业务系统的至少一个使用者的影响程度预先设置的,所述其余部分服务设备的权重系数则是根据该部分服务设备对该业务系统的影响程度预先设置的。
本实施例的技术方案,根据服务设备的处理性能信息,获得每个服务设备的健康度,再根据服务设备的健康度,获得业务应用的健康度,最后根据业务应用的健康度或者根据业务应用和部分服务设备的健康度获得整个业务系统的健康度,而对整个业务系统的状态进行准确和全面的评估。
本实施例提供的业务系统的健康度获得系统,与图1所示的业务系统的健康度获得方法对应,具体可参见该方法实施例中的相关描述。
图4为本发明的业务系统的健康度获得系统的又一实施例的结构示意图,如图4所示,在图3所示的实施例的基础上,第一处理模块1包括:服务设备繁忙度处理单元11和服务设备健康度处理单元12。
服务设备繁忙度处理单元11,用于根据每个服务设备的处理性能信息,获得每个服务设备的繁忙度。
业务系统的每个服务设备的处理性能信息,可以反映该服务设备的运行状态,服务设备繁忙度处理单元11根据每个服务设备的处理性能信息,即可获得每个服务设备的繁忙度,该繁忙度可用于表示业务系统的每个服务设备运行的繁忙程度或状态。本发明的处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延。例如,一个服务设备的Ping时延达到50ms,根据预设的Ping时延繁忙阈值38ms,则该服务设备为繁忙状态。再如,一个服务设备的内存利用率达到95%,根据预设的内存利用率过载阈值85%,则该服务设备为过载状态。根据每个服务设备的至少一个处理性能信息所示的繁忙状态,获得该每个服务设备的繁忙度。
服务设备健康度处理单元12,用于根据每个服务设备的繁忙度,获得每个服务设备的健康度。
业务系统中的服务设备在运行中的繁忙程度或者状态,可反映出该服务设备的健康程度,本实施例中,服务设备健康度处理单元12根据每个服务设备的繁忙度,来获得每个服务设备的健康度。例如,服务设备的繁忙状态可以分为正常、繁忙和过载三种状态,可以认为当一个服务设备的繁忙状态为正常时,该服务设备为健康状态,即健康度高,而当该服务设备的繁忙状态为繁忙或者过载时,该服务设备为不健康状态,即健康度低。还可以将服务设备的繁忙状态分为空闲、正常、繁忙和过载四种状态,一个服务设备的繁忙状态为空闲或正常时,该服务设备为健康状态,即健康度高,而当该服务设备的繁忙状态为繁忙或者过载时,该服务设备为不健康状态,即健康度低。即根据每个服务设备的繁忙度,通过预设的规则,获得每个服务设备的健康度。
一种可实施的方式,服务设备健康度处理单元12还可以根据每个服务设备的繁忙度、MTBF和MTTR,获得每个服务设备的健康度。每个服务设备在运行过程中,可能有故障发生,因此在获得服务设备的健康度的过程中,还可通过服务设备的繁忙度、MTBF和MTTR共同衡量服务设备的健康度。MTBF,为设备在两次相邻故障间的平均工作时间,也就是设备在操作使用或测试期间的平均连续无故障时间,是衡量设备可靠性、稳定性的重要指标,属于国际行业标准。MTTR,为修复一次设备故障所需要的时间,即设备由故障状态转为工作状态时修理时间的平均值,是衡量一个设备可靠性的重要指标,它的值越小说明该设备的可靠性越高。例如,用hi表示业务系统中第i个服务设备的健康度,MTTRi表示业务系统中第i个服务设备的平均故障修复时间,MTBFi表示业务系统中第i个服务设备的平均故障间隔时间,Bi表示业务系统中第i个服务设备的繁忙度,ki1、ki2和ki3为业务系统中第i个服务设备的健康度系数,根据MTTRi、MTBFi和Bi对该业务系统中第i个服务设备的健康度的影响程度设定,ki1+ki2+ki3=1,则可以根据hi=ki1*MTTRi+ki2*MTBFi+ki3*Bi,获得该业务系统中第i个服务设备的健康度。
服务设备繁忙度处理单元11根据服务设备的处理性能信息,获得每个服务设备的繁忙度,服务设备健康度处理单元12再根据服务设备的繁忙度,获得服务设备的健康度,能够准确和全面的对服务设备的状态进行估评估。
可选的,服务设备繁忙度处理单元11具体用于:
根据指示每个服务设备的至少两种工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度。
业务系统中的服务设备至少存在两种工作状态:不繁忙状态和繁忙状态,而处理信息则指示每个服务设备的工作状态。例如,设定处理信息中的CPU平均利用率阈值大于或等于70%,则指示该服务设备的工作状态为繁忙状态,小于70%,则指示该服务设备的工作状态为不繁忙状态。当然,服务设备的工作状态也可以分为正常、繁忙和过载三种状态,例如,Ping时延小于10ms,则指示该服务设备的工作状态为正常状态,Ping时延大于或者等于10ms并小于50ms,则指示该服务设备的工作状态为繁忙状态,Ping时延大于或者等于50ms,则指示该服务设备的工作状态为过载状态。还可以将服务设备的工作状态分为空闲、正常、繁忙和过载四种状态,例如,服务设备的内存利用率为0,则指示该服务设备的工作状态为空闲状态,内存利用率大于0同时小于或者等于50%,则指示该服务设备的工作状态为正常状态,内存利用率大于50%同时小于或者等于85%,则指示该服务设备的工作状态为繁忙状态,内存利用率大于85%,则指示该服务设备的工作状态为过载状态。而指示服务设备不同工作状态的处理性能信息对应不同的权重,以服务设备的工作状态分为正常、繁忙和过载三种状态为例,可以预设指示正常状态的处理性能信息的权重为50%,指示繁忙状态的处理性能信息的权重为30%,指示过载状态的处理性能信息的权重为20%。本实施例中,根据指示每个服务设备的工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度。例如,服务设备的工作状态分为正常、繁忙和过载三种状态,该服务设备的处理性能信息共有10个,其中指示正常状态的处理性能信息共有5个,对应的权重为50%,指示繁忙状态的处理性能信息共有3个,对应的权重为30%,指示过载状态的处理性能信息共有2个,对应的权重为20%,则该服务设备的繁忙度为50%*5+30%*3+20%*2=3.8。
服务设备繁忙度处理单元11根据指示每个服务设备的工作状态中每个工作状态的处理性能信息的数目和每个工作状态对应的权重,获得每个服务设备的繁忙度,能够准确和全面的对服务设备的状态进行估评估。
作为一种可实施方式,第二处理模块2具体用于:
根据
Figure BDA00002154492000181
获取第I个业务应用的健康度;
其中,HI表示业务系统所承载的第I个业务应用的健康度,hi表示第I个业务应用对应的服务设备中的第i个服务设备的健康度,ki表示第i个服务设备的健康权重系数,为根据第I个业务应用对应的每个服务设备中的第i个服务设备对第I个业务应用的影响程度设定,n表示第I个业务应用对应的服务设备总个数。
业务系统所承载的业务应用,可对应该业务系统中的每一个服务设备,也可对应该业务系统中的部分服务设备。一个业务应用所对应的服务设备对该业务应用的影响程度大小是不同的,根据该影响程度的大小可预先设置一个业务应用所对应的每个服务设备的权重系数。因此本实施方式中,第二处理模块12根据每个业务应用所对应的服务设备的健康度和预先设置的该业务应用所对应的服务设备中的每个服务设备的权重系数,获得每个业务应用的健康度。
本实施例的每个业务应用对应业务系统的至少一个服务设备,同时,多个业务应用之间的服务设备可能有交叉共享使用的情况,因此第二处理模块12根据每个业务应用所对应的服务设备的健康度和预先设置的该业务应用所对应的服务设备中的每个服务设备的权重系数,获得每个业务应用的健康度,能够更加准确和全面的反应业务应用的运行状况。
优选地,作为一种可实施方式,第三处理模块3具体用于:
根据
Figure BDA00002154492000182
获得业务系统的健康度;
其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,si为根据每个业务应用对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的;
或者根据 Q S = Σ j m H j * s j + Σ i n h i * s i , 获得业务系统的健康度;
其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,hi表示至少一个服务设备中除每个业务应用对应的部分所述服务设备之外的其他服务设备中的第i个设备的健康度,si表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备中的第i个设备的权重系数,n表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备的总个数,sj与si分别为根据每个业务应用和至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备,对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。
业务系统的服务设备,可以对应于该业务系统所承载的一个业务应用,也可以对应于该业务系统所承载的多个业务应用,还可以不对应该业务系统所承载的业务应用。本实施方式中,如果业务系统所承载的全部业务应用对应了该业务系统中的全部服务设备,则第三处理模块3根据该业务系统所承载的每个业务应用的健康度获得该业务系统的健康度。具体的,第三处理模块3可以根据
Figure BDA00002154492000191
来获得该业务系统的健康度。其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,si为根据每个业务应用对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。例如,该业务系统共承载了5个业务应用:业务应用a、业务应用b、业务应用c、业务应用d和业务应用e,它们的健康度依次为1.8、2.2、3.4、3.5和4.1,它们权重系数均为20%,则该业务系统的健康度为1.8*20%+2.2*20%+3.4*20%+3.5*20%+4.1*20%=3。
如果业务系统所承载的全部业务应用对应了该业务系统中的部分服务设备,即该部分服务设备以外的其他服务设备不对应该业务系统所承载的任何一个业务应用,但是该部分服务设备以外的其他服务设备可以对该业务系统的运行状态产生影响。则本实施方式中,第三处理模块3还可以根据该业务系统所承载的每个业务应用的健康度和该部分服务设备以外的其他服务设备的健康度,获得该业务系统的健康度。具体的,第三处理模块3可以根据
Figure BDA00002154492000201
获得业务系统的健康度。其中,QS表示业务系统的健康度,Hj表示第j个业务应用的健康度,sj表示第j个业务应用的权重系数,m表示业务应用的总个数,hi表示至少一个服务设备中除每个业务应用对应的部分所述服务设备之外的其他服务设备中的第i个设备的健康度,si表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备中的第i个设备的权重系数,n表示至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备的总个数,sj与si分别为根据每个业务应用和至少一个服务设备中除每个业务应用对应的部分服务设备之外的其他服务设备,对业务系统所提供的至少一个服务和业务系统所服务的至少一个服务对象的影响程度而设置的。例如,该业务系统共承载了5个业务应用:业务应用a、业务应用b、业务应用c、业务应用d和业务应用e,它们的健康度依次为1.8、2.2、3.4、3.5和4.1,它们权重系数均为10%。另有2个服务设备F和G不对应上述5个业务应用中的任何一个,服务设备F和G的健康度分别为2.1和1.9,它们的权重系数分别为20%和30%,则该业务系统的健康度为1.8*10%+2.2*10%+3.4*10%+3.5*10%+4.1*10%+2.1*20%+1.9*30%=2.49。
本实施例的充分考虑影响业务系统运行状况的每一个业务应用及单独影响业务系统运行状况的每一个服务设备,并且根据每一个服务设备及每一个业务应用对应的整个业务系统所提供的服务以及服务对象,预设该业务系统健康度的影响因素的权重系数,据此获得整个业务系统的健康度,能够准确和全面的整个业务系统的运行状况。
本实施例提供的业务系统的健康度获得系统,与图2所示的业务系统的健康度获得方法对应,具体可参见该方法实施例中的相关描述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种业务系统的健康度获得方法,所述业务系统承载至少一个业务应用,所述业务应用对应所述业务系统的至少一个服务设备,其特征在于,所述方法包括:
根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度,所述处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延;
根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;
根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度,具体包括:
根据每个所述服务设备的处理性能信息,获得每个所述服务设备的繁忙度;
根据每个所述服务设备的繁忙度,获得每个所述服务设备的健康度。
3.根据权利要求2所述的方法,其特征在于,所述根据每个所述服务设备的处理性能信息,获得每个所述服务设备的繁忙度,具体包括:
根据指示每个所述服务设备的至少两种工作状态中每个所述工作状态的处理性能信息的数目和每个所述工作状态对应的权重,获得每个所述服务设备的繁忙度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度,具体包括:
根据获取第I个所述业务应用的健康度;
其中,HI表示第I个所述业务应用的健康度,hi表示第I个所述业务应用对应的服务设备中的第i个服务设备的健康度,ki表示所述第i个服务设备的健康权重系数,为根据所述第I个所述业务应用对应的每个所述服务设备中所述第i个服务设备对所述第I个所述业务应用的影响程度设定,n表示第I个所述业务应用对应的服务设备总个数。
5.根据权利要求1所述的方法,其特征在于,所述根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度,具体包括:
根据
Figure FDA00002154491900021
获得所述业务系统的健康度;
其中,QS表示所述业务系统的健康度,Hj表示第j个所述业务应用的健康度,sj表示第j个所述业务应用的权重系数,m表示所述业务应用的总个数,si为根据每个所述业务应用对所述业务系统所提供的至少一个服务和所述业务系统所服务的至少一个服务对象的影响程度而设置的;
或者 Q S = Σ j m H j * s j + Σ i n h i * s i , 获得所述业务系统的健康度;
其中,QS表示所述业务系统的健康度,Hj表示第j个所述业务应用的健康度,sj表示第j个所述业务应用的权重系数,m表示所述业务应用的总个数,hi表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备中的第i个设备的健康度,si表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备中的第i个设备的权重系数,n表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备的总个数,sj与si分别为根据每个所述业务应用和所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备,对所述业务系统所提供的至少一个服务和所述业务系统所服务的至少一个服务对象的影响程度而设置的。
6.一种业务系统的健康度获得系统,所述业务系统承载至少一个业务应用,所述业务应用对应所述业务系统的至少一个服务设备,其特征在于,所述系统包括:
第一处理模块,用于根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度,所述处理性能信息包括以下信息中的一种或者多种组合:CPU平均利用率,CPU平均负载,内存利用率和Ping时延;
第二处理模块,用于根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;
第三处理模块,用于根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。
7.根据权利要求6所述的系统,其特征在于,所述第一处理模块,包括:
服务设备繁忙度处理单元,用于根据每个所述服务设备的处理性能信息,获得每个所述服务设备的繁忙度;
服务设备健康度处理单元,用于根据每个所述服务设备的繁忙度,获得每个所述服务设备的健康度。
8.根据权利要求7所述的系统,其特征在于,所述服务设备繁忙度处理单元具体用于:
根据指示每个所述服务设备的至少两种工作状态中每个所述工作状态的处理性能信息的数目和每个所述工作状态对应的权重,获得每个所述服务设备的繁忙度。
9.根据权利要求6所述的系统,其特征在于,所述第二处理模块具体用于:
根据
Figure FDA00002154491900031
获取第I个所述业务应用的健康度;
其中,HI表示第I个所述业务应用的健康度,hi表示第I个所述业务应用对应的服务设备中的第i个服务设备的健康度,ki表示所述第i个服务设备的健康权重系数,为根据所述第I个所述业务应用对应的每个所述服务设备中所述第i个服务设备对所述第I个所述业务应用的影响程度设定,n表示第I个所述业务应用对应的服务设备总个数。
10.根据权利要求6所述的系统,其特征在于,所述第三处理模块具体用于:
根据
Figure FDA00002154491900032
获得所述业务系统的健康度;
其中,QS表示所述业务系统的健康度,Hj表示第j个所述业务应用的健康度,sj表示第j个所述业务应用的权重系数,m表示所述业务应用的总个数,si为根据每个所述业务应用对所述业务系统所提供的至少一个服务和所述业务系统所服务的至少一个服务对象的影响程度而设置的;
或者 Q S = Σ j m H j * s j + Σ i n h i * s i , 获得所述业务系统的健康度;
其中,QS表示所述业务系统的健康度,Hj表示第j个所述业务应用的健康度,sj表示第j个所述业务应用的权重系数,m表示所述业务应用的总个数,hi表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备中的第i个设备的健康度,si表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备中的第i个设备的权重系数,n表示所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备的总个数,sj与si分别为根据每个所述业务应用和所述至少一个服务设备中除每个所述业务应用对应的所述部分所述服务设备之外的其他所述服务设备,对所述业务系统所提供的至少一个服务和所述业务系统所服务的至少一个服务对象的影响程度而设置的。
CN201210347971.4A 2012-09-18 2012-09-18 业务系统的健康度获得方法及系统 Active CN102916831B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210347971.4A CN102916831B (zh) 2012-09-18 2012-09-18 业务系统的健康度获得方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210347971.4A CN102916831B (zh) 2012-09-18 2012-09-18 业务系统的健康度获得方法及系统

Publications (2)

Publication Number Publication Date
CN102916831A true CN102916831A (zh) 2013-02-06
CN102916831B CN102916831B (zh) 2015-05-20

Family

ID=47615069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210347971.4A Active CN102916831B (zh) 2012-09-18 2012-09-18 业务系统的健康度获得方法及系统

Country Status (1)

Country Link
CN (1) CN102916831B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152438A (zh) * 2013-04-09 2013-06-12 上海理想信息产业(集团)有限公司 一种云计算环境下业务健康度获取方法
CN104679655A (zh) * 2015-03-06 2015-06-03 国网四川省电力公司电力科学研究院 基于参数相关性的软件系统状态评估方法
CN105700990A (zh) * 2016-01-18 2016-06-22 电信科学技术第五研究所 以任务为对象的软硬件运行监控方法
CN106022575A (zh) * 2016-05-10 2016-10-12 大连商品交易所 证券期货行业信息系统的业务可用性和健康度监控方法
CN108650326A (zh) * 2018-05-18 2018-10-12 深圳源广安智能科技有限公司 一种有效的交通信息服务系统
CN108650133A (zh) * 2018-05-14 2018-10-12 深圳市联软科技股份有限公司 网络风险评估方法及系统
CN112084392A (zh) * 2020-08-27 2020-12-15 山东中创软件商用中间件股份有限公司 一种业务系统的繁忙度获取方法及相关组件
CN114064413A (zh) * 2021-11-24 2022-02-18 深圳前海微众银行股份有限公司 容器组调控方法、装置及电子设备
CN116070963A (zh) * 2023-03-06 2023-05-05 华安证券股份有限公司 一种基于大数据的线上客户服务系统健康度检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李硕: "智能网网络管理系统中业务评价系统的设计和实现", 《万方学术论文数据库》 *
潘红芳;徐家澍;秦学东等: "信息综合监控系统深化应用实践", 《电力信息化》 *
童晓薇: "一种基于网络的业务系统健康度评估方法", 《重庆理工大学学报(自然科学)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152438A (zh) * 2013-04-09 2013-06-12 上海理想信息产业(集团)有限公司 一种云计算环境下业务健康度获取方法
CN103152438B (zh) * 2013-04-09 2015-11-18 上海理想信息产业(集团)有限公司 一种云计算环境下业务健康度获取方法
CN104679655A (zh) * 2015-03-06 2015-06-03 国网四川省电力公司电力科学研究院 基于参数相关性的软件系统状态评估方法
CN104679655B (zh) * 2015-03-06 2017-09-29 国网四川省电力公司电力科学研究院 基于参数相关性的软件系统状态评估方法
CN105700990A (zh) * 2016-01-18 2016-06-22 电信科学技术第五研究所 以任务为对象的软硬件运行监控方法
CN106022575A (zh) * 2016-05-10 2016-10-12 大连商品交易所 证券期货行业信息系统的业务可用性和健康度监控方法
CN108650133A (zh) * 2018-05-14 2018-10-12 深圳市联软科技股份有限公司 网络风险评估方法及系统
CN108650326A (zh) * 2018-05-18 2018-10-12 深圳源广安智能科技有限公司 一种有效的交通信息服务系统
CN112084392A (zh) * 2020-08-27 2020-12-15 山东中创软件商用中间件股份有限公司 一种业务系统的繁忙度获取方法及相关组件
CN114064413A (zh) * 2021-11-24 2022-02-18 深圳前海微众银行股份有限公司 容器组调控方法、装置及电子设备
WO2023093031A1 (zh) * 2021-11-24 2023-06-01 深圳前海微众银行股份有限公司 容器组调控方法、装置及电子设备
CN116070963A (zh) * 2023-03-06 2023-05-05 华安证券股份有限公司 一种基于大数据的线上客户服务系统健康度检测方法

Also Published As

Publication number Publication date
CN102916831B (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN102916831B (zh) 业务系统的健康度获得方法及系统
Cetinay et al. Comparing the effects of failures in power grids under the AC and DC power flow models
Chaczko et al. Availability and load balancing in cloud computing
US9426036B1 (en) Mixture model approach for network forecasting
US20130207801A1 (en) Approach for prioritizing network alerts
US9342370B2 (en) Server migration
CN104679591A (zh) 用于在云环境中进行资源分配的方法和装置
EP2713270A1 (en) Resource scheduling method and device
CN102694868A (zh) 一种集群系统实现及任务动态分配方法
CN109873714B (zh) 云计算节点配置更新方法及终端设备
US10038589B1 (en) Network link capacity determination
CN103270501A (zh) 虚拟数据中心系统
EP3829112B1 (en) Testing and maintaining outage resilience of server resources
CN108183814A (zh) 用电信息采集系统的通信信道的故障排查方法和装置
CN114003345A (zh) 一种基于云原生的Kubernetes平台健康度确定方法和装置
GB2613125A (en) Storage level load balancing
EP3285432B1 (en) Apparatus and method for creating statistics on availability
CN106961490A (zh) 一种资源监控方法及系统、一种本地服务器
CN111526038A (zh) 业务请求分发方法、装置、计算机设备及可读存储介质
CN115983836A (zh) 一种数据处理方法及相关设备
CN102916832A (zh) 业务系统服务设备的繁忙度获得方法及系统
CN115941441A (zh) 系统链路自动化监控运维方法、系统、设备以及介质
CN103746870A (zh) Cdn分发网络的分析方法、文件分发控制中心及系统
JP2007265244A (ja) ウェブシステムの性能監視装置
US9092282B1 (en) Channel optimization in a messaging-middleware environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant