一种IT集中监控的业务系统的健康度评估方法
技术领域
本发明属于IT系统评估技术领域,尤其涉及一种IT集中监控的业务系统的健康度评估方法。
背景技术
随着全球信息化步伐的不断推进,IT服务业的分工越来越精细和明确。作为一切IT服务的基础,数据中心及相关基础设施直接关系到IT服务系统能否正常、持续、稳定运行。任何一部分的效率降低或者故障,都将导致IT服务的可用性降低,轻则造成信息访问不畅,重则带来各种不可预估的重大损失。
数据中心提供的是信息服务,也可以说是业务服务,独立的对一台设备进行监控已经不能满足未来的需求。对于管理人员来说,更关心的是数据中心提供的一个业务、一个服务是否能够正常的运行,因此,未来的监控解决方案,需要更多的从业务及服务的层面出发,将独立的物理设备,与业务紧密关联,形成业务设备视图,每个设备的可用性,都能够反映到业务的可用性上。
IT集中监控之业务系统健康度随着网络技术的发展,公司越来越多的业务出现在互联网,给用户带来诸多便捷。但是随着用户量的增加、数据量的增大,业务系统的压力也越来越大,对运行的IT基础资源要求也越来越高。业务系统出现故障,将导致许多基本业务无法开展。为了避免业务系统不可用导致关键业务的运营受到影响,如果IT管理员能通过软、硬件设备,对可能影响业务系统可用性的因素进行持续监控,并在故障发生的第一时间通知相关人员,判断故障的根源,就可以在最短时间内解决故障,减少业务系统停机时间,提升业务系统可用性,最终提高用户的满意度。
传统的监控工具主要是针对资源层次的监控,关注各种资源的运行状况,但没有对业务系统的运行状况进行整体上的评估。IT集中监控的业务系统健康度是通过CFIA理论树形逻辑关联算法,以应用系统为核心,计算关联的网络、主机、数据库、中间件的故障影响范围,得出是否导致应用系统故障,从而帮助管理者针对应用系统故障快速定位和解决。
中国专利公开号为CN102916831B,发明创造名称为一种业务系统的健康度获得方法及系统。该方法包括:根据每个所述服务设备的处理性能信息,获得每个所述服务设备的健康度;根据所述至少一个服务设备中部分所述服务设备或全部所述服务设备中每个所述服务设备的健康度和预先设置的每个所述服务设备的权重系数,获得每个所述业务应用的健康度;根据每个所述业务应用的健康度,或者根据每个所述业务应用的健康度和所述至少一个服务设备中除所述部分所述服务设备之外的其他所述服务设备的健康度,获得所述业务系统的健康度。该系统包括:第一处理模块,第二处理模块和第三处理模块。根据本发明的业务系统的健康度获得方法及系统,能够对整个业务系统的状态进行准确和全面的评估。
中国专利公开号为CN106776214A,发明创造名称为一种服务器健康度评估方法,包括步骤:S1:获取服务器的网元指标;S2:通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,指标阈值包括指标阈值上限或/和指标阈值下限;S3:实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数;S4:计算服务器的健康度。
但是,现有的业务系统的健康度评估方法由于对IT集中监控系统的变量的选择不够准确且对其利用效率不高,存在着不能够让运维监控人员从海量的告警分析、告警实时监测工作中解脱出来,而且不能够实时、快速、动态地掌握业务系统运行健康状况,导致运维人员工作效率较低和不能够有效地保障业务系统健康稳定运行的问题。
因此,发明一种IT集中监控的业务系统的健康度评估方法显得非常必要。
发明内容
(一)技术问题
基于上述的技术缺陷,本发明提供一种IT集中监控的业务系统的健康度评估方法,以解决现有的业务系统的健康度评估方法存在着不能够让运维监控人员从海量的告警分析、告警实时监测工作中解脱出来,而且不能够实时、快速、动态地掌握业务系统运行健康状况,导致运维人员工作效率较低和不能够有效地保障业务系统健康稳定运行的问题。
(二)技术方案
本发明提供的一种IT集中监控的业务系统的健康度评估方法,该健康度评估方法包括如下步骤:
步骤S101:获取IT集中监控的业务系统中关键业务点的指标;首先将网络、中间件、数据库作为配置元素进行统一管理,根据实际需要,建立各CI之间的关系模型;然后抽象出关键业务点的关键性能指标,建立关键性能指标之间的关系,并设置关键业务点的重要等级权值;
步骤S102:根据预设待评估数据进行健康评估;将所获取的预设待评估数据分为多个数据集合,通过预先设定相应的计算方式分别对多个数据集合中的预设待监控数据进行评分,并分别得到各个数据类的评分结果,其中,每个数据集合对应一种预设待监控数据;所述预设待监控数据的数据类别包括如下任意两个或两个以上的数据类:服务器数据类,虚拟机数据类,数据库数据类,中间件数据类,网络设备数据类;
步骤S103:IT集中监控服务器对各个数据类的评分结果进行加权计算;对各个数据类进行风险隐患评估得出风险等级;采用结合各数据类的风险等级和所占权重综合评估业务系统的健康度,为下一步的维护操作提供依据;在该步骤中,依照下述规则加权计算业务系统的健康度:业务系统的健康度采用综合评估扣分制,满分为100分,通过对各业务系统中的数据类进行风险隐患评估,综合考虑单个数据类的风险值和业务系统所有数据类的合计扣分情况,其中合计扣分情况需考虑数据类所占权重,根据单项数据类的最大风险值和合计风险值,确定业务系统运行的健康度。
步骤S104:IT集中监控的业务系统的健康维护;根据所述步骤S103中检测得到的业务系统的健康度的数据,进行业务系统的健康修复;
步骤S105:重新评估设定IT集中监控的业务系统的健康度数值:业务系统的性能指标主要包含响应时间和加载速度,并且可以通过控制性能健康度权重值调节业务系统健康度;
步骤S106:IT集中监控的业务系统硬件和软件的日常健康查看:针对业务系统健康评估的分数和问题处理情况,对IT集中监控的业务系统硬件和软件的日常健康查看。
进一步的,所述步骤S102中具体包括以下步骤S1021-S1024:
步骤S1021:业务系统健康状态的分类;首先将业务系统的运行状态分为可用和不可用两个状态作为业务系统健康状态;健康度是建立在业务系统可用的基础上,若业务系统不可用,那么健康度无效;
步骤S1022:收集业务系统故障数据;将业务系统关联的关键业务点的网络、中间件、数据库的运维状态分为可用和不可用两个状态,如果有不可用,那么根据所述关键业务点的风险隐患排查情况及所述关键业务点的重要等级权重计算业务系统健康度,并作为业务系统故障数据;
步骤S1023:传输健康问题数据;将检测到的健康问题数据的信息,通过IT网络,传输到存储服务器当中;
步骤S1024:IT集中监控的业务系统的健康度评分;根据步骤S1021-S1023中业务系统健康状态、业务系统故障数据、健康问题数据的三种不同类别的数据集合,通过预先设定相应的计算方式分别对数据集合中的预设待监控数据进行评分;在预设待监控数据中,针对各个数据集合中的预设待监控数据,分别对应一种相应的计算方式对其评分,并分别得到各个数据类的评分结果,以对IT集中监控的业务系统的健康度进行健康评估。
进一步的,所述步骤S104中具体包括以下步骤S1041-S1045:
步骤S1041:业务系统健康问题分析:诊断检测到的业务系统的健康度的数据,通过IT网络工程师进行数据的分析,如果是硬件设备问题,进行及时的更换;如果是业务系统软件问题,由软件工程师进行分析修复;
步骤S1042:业务系统的调试:运维人员修复完成后,进行调试和实验,保证业务系统的正常运行;
步骤S1043:健康报告和维修记录的存储与传输:通过IT集中监控的业务系统的网络或者WLAN无线网络对健康报告和维修记录传输到业务系统的服务器上进行存储;
步骤S1044:纸质报告的签字确认:将健康报告和维修记录,打印出来,由检修人员和验收人员签字确认;
步骤S1045:IT集中监控的业务系统的重新交付使用:在维修完成后,重新上线交付使用。
进一步的,在步骤S1042中,优选的,所述调试的次数设置在五次至十次之间。
进一步的,在步骤S105中,所述的IT集中监控的业务系统硬件的查看次数为每小时一次至三次。
进一步的,在步骤S105中,所述的IT集中监控的业务系统软件的健康查看为软件实时监控,并与警报装置相连接。
在另外一个方面,本发明还公开了一种IT集中监控的业务系统的健康度评估系统,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述任一项所述的健康度评估方法。
在另外一个方面,本发明还公开了一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上述任一项所述的健康度评估方法。
(三)有益效果
与现有技术相比,本发明具有如下有益效果:本发明的IT集中监控的业务系统的健康度评估方法,通过本发明的步骤S101-S104获取的健康度,使得本发明能够方便对IT集中监控的业务系统健康度的评估测量,可以让运维监控人员从海量的告警分析、告警实时监测工作中解脱出来,而且还能够掌握业务系统运行健康状况,从而提高运维人员工作效率,此外,通过步骤S105-S106的操作,能够长期有效地保障业务系统健康稳定运行,通过本发明方法中选择的变量以及对变量进行的有诸多效处理后,真正做到随时对IT集中监控的业务系统在发生健康问题前可以进行有效的预防,并且可以在事后对健康问题进行修复,保证IT集中监控的业务系统的正常运行。
附图说明
图1是本发明的IT集中监控的业务系统的健康度评估方法的流程图。
图2是本发明的根据预设待评估数据进行健康评估流程示意图。
图3是本发明的IT集中监控的业务系统的健康维护流程示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如附图1至附图3所示,本发明提出了一种IT集中监控的业务系统的健康度评估方法,具体包括以下步骤:
步骤S101:获取IT集中监控的业务系统中关键业务点的指标;首先将网络、中间件、数据库作为配置元素进行统一管理,根据实际需要,建立各CI(configuration item,配置项)之间的关系模型;然后抽象出关键业务点的关键性能指标,建立关键性能指标之间的关系,并设置关键业务点的重要等级权值;
步骤S102:根据预设待评估数据进行健康评估;将获取的所述的预设待评估数据分为多个数据集合,通过预先设定相应的计算方式分别对多个数据集合中的预设待监控数据进行评分,并分别得到各个数据类的评分结果,其中,每个数据集合对应一种预设待监控数据;所述预设待监控数据的数据类别包括如下任意两个或两个以上的数据类:服务器数据类,虚拟机数据类,数据库数据类,中间件数据类,网络设备数据类;
进一步的,参见图2可知,在上述步骤S102中,根据预设待评估数据进行健康评估的流程依照以下步骤S1021-S1024进行:
S1021:业务系统健康状态的分类;首先将业务系统的运行状态分为可用和不可用两个状态作为业务系统健康状态;健康度是建立在业务系统可用的基础上,若业务系统不可用,那么健康度无效;
S1022:收集业务系统故障数据;将业务系统关联的关键业务点的网络、中间件、数据库的运维状态分为可用和不可用两个状态,如果有不可用,那么根据所述关键业务点的风险隐患排查情况及所述关键业务点的重要等级权重计算业务系统健康度,并作为业务系统故障数据;
S1023:传输健康问题数据;将检测到的健康问题数据的信息,通过IT网络,传输到存储服务器当中;
S1024:IT集中监控的业务系统的健康度评分;根据步骤S1021-S1023中业务系统健康状态、业务系统故障数据、健康问题数据的三种不同类别的数据集合,通过预先设定相应的计算方式分别对数据集合中的预设待监控数据进行评分;在预设待监控数据中,针对各个数据集合中的预设待监控数据,分别对应一种相应的计算方式对其评分,并分别得到各个数据类的评分结果,以对IT集中监控的业务系统的健康度进行健康评估;
需要指出的是,上述步骤S1021-S1024中,基于步骤S101中的关键业务点及其权值计算业务系统故障数据的方式,以及选择基于服务器数据类、虚拟机数据类、数据库数据类、中间件数据类、网络设备数据类所构成的预设待监控数据中数据类的应用能够使得IT集中监控的业务系统的健康评估更加有效和准确。
步骤S103:IT集中监控服务器对各个数据类的评分结果进行加权计算;对各数据类进行风险隐患评估得出风险等级;采用结合各数据类的风险等级和所占权重综合评估业务系统的健康度,为下一步的维护操作提供依据;
在步骤S103中,依照下述规则加权计算业务系统的健康度:业务系统的健康度采用综合评估扣分制,满分为100分,通过对各业务系统中的数据类进行风险隐患评估,综合考虑单个数据类的风险值和业务系统所有数据类的合计扣分情况,其中合计扣分情况需考虑数据类所占权重,根据单项数据类的最大风险值和合计风险值,确定业务系统运行的健康度。
步骤S104:IT集中监控的业务系统的健康维护;根据步骤S103中检测得到的业务系统的健康度的数据,进行业务系统的健康修复;
进一步的,参见图3可知,在S104中,对IT集中监控的业务系统的健康维护流程依照以下步骤S1041-S1045进行:
S1041:业务系统健康问题分析:诊断检测到的业务系统的健康度的数据,通过IT网络工程师进行数据的分析,如果是硬件设备问题,进行及时的更换;如果是业务系统软件问题,由软件工程师进行分析修复;
S1042:业务系统的调试:运维人员修复完成后,进行调试和实验,保证业务系统的正常运行;
进一步的,在上述实施例中,具体的,所述调试的次数设置在五次至十次。
S1043:健康报告和维修记录的存储与传输:通过IT集中监控的业务系统的网络或者WLAN无线网络对健康报告和维修记录传输到业务系统的服务器上进行存储;
S1044:纸质报告的签字确认:将健康报告和维修记录,打印出来,由检修人员和验收人员签字确认;
S1045:IT集中监控的业务系统的重新交付使用:在维修完成后,重新上线交付使用;
步骤S105:重新评估设定IT集中监控的业务系统的健康度数值:业务系统的性能指标主要包含响应时间和加载速度,并且可以通过控制性能健康度权重值调节业务系统健康度;
步骤S106:IT集中监控的业务系统硬件和软件的日常健康查看:针对业务系统健康评估的分数和问题处理情况,对IT集中监控的业务系统硬件和软件的日常健康查看。
上述实施例中,所述的IT集中监控的业务系统硬件的查看次数为每小时一次至三次。
上述实施例中,所述的IT集中监控的业务系统软件的健康查看为软件实时监控,并与警报装置相连接。
综上可知,本发明的IT集中监控的业务系统的健康度评估方法的工作原理为:通过IT集中监控的服务器和计算机进行控制操作,特别是业务系统的软件程序进行操作和评估;通过获取IT集中监控的业务系统关键点的指标,并设置关键点的重要等级权值;将所述的评估数据分为多个数据集合,其中,每个数据集合对应一种预设待监控数据;预设待监控数据的数据类别包括如下任意两个或两个以上的数据类:服务器数据类,虚拟机数据类,数据库数据类,中间件数据类,网络设备数据类,以全面准确的对IT业务系统的健康进行监控;经IT集中监控服务器对各个数据类的评分结果进行加权计算,得出健康评估结果并根据检测到的数据,进行业务系统的健康修复。
本发明的IT集中监控的业务系统的健康度评估方法的有益效果包括:能够方便对IT集中监控的业务系统健康度的评估测量,可以让运维监控人员从海量的告警分析、告警实时监测工作中解脱出来,而且还能够掌握业务系统运行健康状况,从而提高运维人员工作效率,并且能够有效地保障业务系统健康稳定运行,真正做到随时对IT集中监控的业务系统在发生健康问题前可以进行有效的预防,并且可以在事后对健康问题进行修复,保证IT集中监控的业务系统的正常运行。
值得一提的是,上述的健康度评估方法可以转换为程序指令,既可以使用包括处理器和存储器的IT集中监控的业务系统的健康度评估系统来运行实现,或者也可以通过非暂态计算机可读存储介质中存储的计算机指令来实现。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。