CN109522180B - 基于监控运维系统服务的数据分析方法、装置和设备 - Google Patents

基于监控运维系统服务的数据分析方法、装置和设备 Download PDF

Info

Publication number
CN109522180B
CN109522180B CN201811230639.3A CN201811230639A CN109522180B CN 109522180 B CN109522180 B CN 109522180B CN 201811230639 A CN201811230639 A CN 201811230639A CN 109522180 B CN109522180 B CN 109522180B
Authority
CN
China
Prior art keywords
server
service
weight
service item
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811230639.3A
Other languages
English (en)
Other versions
CN109522180A (zh
Inventor
张辉
叶佳林
颜书豪
周旭军
罗勇
徐冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan United Imaging Healthcare Co Ltd
Original Assignee
Wuhan United Imaging Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan United Imaging Healthcare Co Ltd filed Critical Wuhan United Imaging Healthcare Co Ltd
Priority to CN201811230639.3A priority Critical patent/CN109522180B/zh
Publication of CN109522180A publication Critical patent/CN109522180A/zh
Application granted granted Critical
Publication of CN109522180B publication Critical patent/CN109522180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种基于监控运维系统服务的数据分析方法、装置和设备,根据各服务器的监控信息,获取各服务项目的权重;根据各所述服务项目的权重,获取各所述服务器的量化值。通过将服务器的服务状态量化为数值,运维人员可以直接根据量化值预测服务器发生故障的可能性,定位问题服务器,降低了服务器宕机的可能性;同时运维人员无需从繁多的监控数据图表中寻找有用信息,减少了运维人员工作量,提高了工作效率,降低了维护成本。

Description

基于监控运维系统服务的数据分析方法、装置和设备
技术领域
本发明涉及云数据监控领域,尤其涉及一种基于监控运维系统服务的数据分析方法、装置和设备。
背景技术
随着现代社会科技的发展,云数据越来越普及,而针对服务器的云数据监控运维业务日益成为各个数据中心面临的难题。要了解服务器每时每刻的整体运行状态,单靠几个Linux自带的性能监测命令是很难实现的,且随着服务器数量的增多,开源的监控系统已不能满足服务器运维监控的需要,那么监控运维系统就诞生了,用于将分布式服务器的数据汇总到运维系统中。
目前,对于服务器监控运维有很多相关监控技术,基本流程是,当服务器的某一个服务数据出现异常了,服务器会返回异常信息到运维系统,运维人员通过返回的告警信息定位异常服务器。
但是,对于集群服务器来说,会有海量的信息反馈到运维系统中,运维人员需要在繁多的信息中找到有用信息并定位异常服务器,将花费大量的时间和精力,增加了维护成本。
发明内容
基于此,有必要针对上述问题提供一种基于监控运维系统服务的数据分析方法、装置和设备。
第一方面,一种基于监控运维系统服务的数据分析方法,包括:
根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
上述方法通过监控运维系统获取各分布式服务器的服务信息,然后通过预设算法将服务器的服务状态量化为数值,运维人员可以直接根据量化值预测服务器发生故障的可能性,定位问题服务器,降低了服务器宕机的可能性;同时运维人员无需从繁多的监控数据图表中寻找有用信息,减少了运维人员工作量,提高了工作效率,降低了维护成本。
在其中一个实施例中,所述根据各服务器的监控信息,获取各服务项目的权重,包括:
根据各服务器的监控信息,获取各服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度;
根据所述差异系数,获取各所述服务项目的权重。
在其中一个实施例中,所述根据各服务器的监控信息,获取各服务项目的差异系数,包括:
根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;
根据所述贡献度,获取各所述服务项目的差异系数。
在其中一个实施例中,所述根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度,包括:
根据各所述服务器的监控信息,构建决策矩阵;
根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
在其中一个实施例中,所述根据所述贡献度,获取各所述服务项目的差异系数,包括:
根据各所述贡献度,获取各所述服务项目的贡献总量;
根据各所述服务项目的贡献总量,获取各所述服务项目的差异系数。
在其中一个实施例中,所述根据所述差异系数,获取各所述服务项目的权重,包括:
根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
在其中一个实施例中,所述根据各所述服务项目的权重,获取各所述服务器的量化值,包括:
根据预设的权重系数,对所述服务项目的权重进行修正,得到修正后的权重;
根据各所述修正后的权重,获取各所述服务器的量化值。
在其中一个实施例中,所述根据所述修正后的权重,获取各所述服务器的量化值,包括:
将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;
将各所述服务器对应的所有服务项目的量化值之和,确定为各所述所述服务器的量化值。
第二方面,一种基于监控运维系统服务的数据分析的装置,所述装置包括:
权重获取模块,用于根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
量化值获取模块,用于根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
上述基于监控运维系统服务的数据分析方法、装置和设备,根据各服务器的监控信息,获取各服务项目的权重;根据各所述服务项目的权重,获取各所述服务器的量化值。通过将服务器的服务状态量化为数值,运维人员可以直接根据量化值预测服务器发生故障的可能性,定位问题服务器,降低了服务器宕机的可能性;同时运维人员无需从繁多的监控数据图表中寻找有用信息,减少了运维人员工作量,提高了工作效率,降低了维护成本。
附图说明
图1为一个实施例提供的计算机设备的内部结构示意图;
图2为本申请实施例提供的一种基于监控运维系统服务的数据分析方法流程图;
图3为一个实施例提供的一种基于监控运维系统服务的数据分析方法流程图;
图4为本申请实施例提供的另一种基于监控运维系统服务的数据分析方法的流程图;
图5为一个实施例提供的一种基于监控运维系统服务的数据分析方法的流程图;
图6为一个实施例提供的基于监控运维系统服务的数据分析的装置结构示意图;
图7为另一个实施例提供的基于监控运维系统服务的数据分析的装置结构示意图。
具体实施例
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的数据分析方法可以应用于计算机设备,其内部结构图可以如图1所示。该计算机设备与复数个服务器通信连接,计算机设备自动获取各服务器的监控信息,自动计算各服务器的服务项目权重,自动判断各服务器的故障概率。该计算机设备包括通过系统总线连接的处理器、存储器、显示器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机的显示器用于显示有故障问题的服务器及故障问题相对应的服务项目,显示被计算机按优先级排序的故障问题,并显示计算机给出的故障问题的解决方案建议;显示器对有故障问题的服务器特殊显示,并图形化定位出该对应服务器的相对空间位置,该计算机设备的显示器可以是液晶显示器或者电子墨水显示器。该计算机设备的数据库用于存储监控信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于监控运维系统服务的数据分析方法。
图2为本申请实施例提供的一种基于监控运维系统服务的数据分析方法流程图,该方法的执行主体为图1所示的计算机设备,该方法可以包括以下步骤:
S201、根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息。
其中,监控信息为各分布式服务器根据自身的服务情况,返回给监控运维系统的服务项目的服务信息,例如,监控信息可以包括haoop中jvm堆使用率a的服务信息、Sink读取Channel成功率b的服务信息、zookeeper服务连接数c的服务信息等;在本实施例中,根据各服务器返回的监控信息,经过一系列运算可以得到所有服务器中各服务项目的权重,服务项目的权重用于表示该服务项目在所有的服务项目中的所占的比重,例如,若Wc为服务项目zookeeper服务连接数c的权重,则其表示的意思为第c项服务在所有服务项目中占的比重为Wc
在本实施例中,可以根据各个服务项目的重要程度来设置各服务项目的权重,也可以是根据各个服务项目的服务信息的比重来计算各服务项目的权重,还可以根据各个服务项目的服务信息计算每个服务项目之间的差异程度,根据服务项目之间的差异程度确定各服务项目的权重等。
S202、根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
在本实施例中,根据上述获取的权重,再经过预设的算法,可以得到每个服务器的量化值,其中,量化值为对应服务器的综合评价值,综合评价值的高低用来表示服务器运行状态的好坏,或者是服务器发生异常或故障的可能性大小。例如,服务项目的权重越高,对应的服务器的量化值越大,服务项目的权重越低,对应的服务器的量化值越小,可以根据该原则来根据服务项目的权重,确定服务器的量化值。
本申请提供的基于监控运维系统服务的数据分析方法,根据各服务器的监控信息,获取各服务项目的权重,根据各所述服务项目的权重,获取各所述服务器的量化值。通过量化值判断服务器的运行状态,评测出所有服务器发生故障的可能性并定位发生故障的服务器,运维人员根据量化值对服务器进行维护,降低了服务器宕机的可能性;同时运维人员无需从繁多的监控数据图表中寻找有用信息,减少了运维人员工作量,提高了工作效率,降低了维护成本。
在图2所示实施例的基础上,如图3所示,所述根据各服务器的监控信息,获取各服务项目的权重,包括:
S301、根据各服务器的监控信息,获取各服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度。
其中,差异系数,也称变差系数、离散系数、变异系数。它可以由一组数据的标准差与其均值的百分比求得,是测算数据离散程度的相对指标,是一种相对差异量数。
可选地,图4为本申请实施例提供的另一种基于监控运维系统服务的数据分析方法的流程图,如图4所示,所述根据各服务器的监控信息,获取各服务项目的差异系数,包括:
S401、根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度。
在本实施例中,若现通过部署的监控运维系统,获取服务器A、B、…、G共七台服务器的监控信息,监控的信息共有十项服务项目,包含haoop中jvm堆使用率a,hadoop中HDFS使用率b,zookeeper服务连接数c,Flume服务Source写入Channel成功率d,Sink写到存储空间成功率e,Sink读取Channel成功率f,cpu使用率g,内存使用率h,磁盘使用率i,hbase中JVM堆使用率j。监控信息如下表1:
表1
服务a 服务b 服务c 服务d 服务e 服务f 服务g 服务h 服务i 服务j
服务器A 0.271 0.53 10 0.96 0.99 0.96 0.12 0.71 0.25 0.375
服务器B 0.88 0.48 12 0.98 0.98 0.98 0.62 0.55 0.65 0.531
服务器C 0.548 0.63 8 0.99 0.96 0.99 0.85 0.89 0.78 0.685
服务器D 0.732 0.84 6 0.99 0.88 0.99 0.2 0.65 0.26 0.613
服务器E 0.726 0.98 18 0.87 0.65 0.87 0.36 0.66 0.36 0.256
服务器F 0.532 0.12 30 1 0.99 1 0.45 0.87 0.45 0.689
服务器G 0.877 0.36 50 0.5 0.6 0.5 0.75 0.45 0.84 0.365
可选地,可以利用公式
Figure GDA0003842685870000081
得到第j个服务项目的服务信息在第i台服务器中的贡献度Ρij。其中,m为服务器个数,xij为第i台服务器的第j个服务项目的服务信息。
进一步地,在图4的基础上,S401“所述根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度”,包括:根据各所述服务器的监控信息,构建决策矩阵;根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
在本实施例中,设定xmn为第m台服务器,第n项服务项目的服务信息,利用熵信息的概念,确定出多属性决策矩阵为:
Figure GDA0003842685870000091
表2
Figure GDA0003842685870000092
用上述公式
Figure GDA0003842685870000093
表示第j个服务项目的服务信息在第i台服务器Ai中的贡献度。计算出P矩阵如表2所示,即为A…G共七台服务器的每个服务信息的贡献度。
S402、根据所述贡献度,获取各所述服务项目的差异系数。
在本实施例中,根据计算的Ρij,再经过预设的算法,可以求得各服务项目的差异系数。例如,可以计算出服务项目a的每个服务信息的贡献度,将服务项目A的所有服务信息的贡献度累加求和或加权求和,得到服务项目A的贡献总量,根据贡献总量计算服务项目a的差异系数。
具体地,图5为一个实施例提供的一种基于监控运维系统服务的数据分析方法的流程图。如图5所示,S402“所述根据所述贡献度,获取各所述服务项目的差异系数”,包括:
S501、根据各所述贡献度,获取各所述服务项目的贡献总量。
根据上述的贡献度矩阵和熵值算法,利用公式
Figure GDA0003842685870000101
求出所有服务器中第j项服务的贡献总量,m为服务器的数量,Ρij是上述根据公式/>
Figure GDA0003842685870000102
计算的贡献度,Ej表示第j项服务项目的贡献总量。
其中,常数K=1/ln(m),这样能保证0<=Ej<=1,由公式可以看出,当某一个服务项目的服务信息在各个服务器的贡献度趋于一致的时候,Ej趋于1,特别是当全相等的时候,也就不用考虑该目标信息在决策中的作用。
所以可以计算出所有监控的服务项目的贡献总量Ej如下表3:
表3
Figure GDA0003842685870000103
S502、根据各所述服务项目的贡献总量,获取各所述服务项目的差异系数。
在本实施例中,dj表示第j项服务项目的各服务信息在所有服务器中一致性的程度,可以利用公式dj=1-Ej计算出各个服务项目的差异系数,如表4:
表4
Figure GDA0003842685870000104
在图2所示实施例的基础上,如图3所示,所述根据各服务器的监控信息,获取各服务项目的权重,包括:
S302、根据所述差异系数,获取各所述服务项目的权重。
其中,各服务项目的差异系数为各服务器的监控信息经过预设的算法运算而来,用于表示每个服务项目在所有服务器中的各服务信息的一致性程度。再根据计算出的差异系数,利用预设公式计算各服务项目的权重。
具体地,所述根据所述差异系数,获取各所述服务项目的权重,包括,根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
在本实施例中,根据熵值算法计算权重公式
Figure GDA0003842685870000111
计算出第j项服务项目在所有服务项目中占的权重Wj;其中,n为服务项目的总个数,dj为第j项服务的差异系数。
结合步骤S501,可以看出,当某一个服务项目的服务信息在各个服务器的贡献度趋于一致的时候,Ej趋于1,特别是当全相等的时候,也即该项服务项目的权重为零,也就不用考虑该服务项目在决策中的作用。
可选地,如果运维人员事先已有经验性的主观权重λj,则可以借助λj来对Wj进行修正,则步骤S201所述“根据各所述服务项目的权重,获取各所述服务器的量化值”,包括:根据预设的权重系数,对所述服务项目的权重进行修正,得到修正后的权重;然后,根据各所述修正后的权重,获取各所述服务器的量化值。
其中,预设的权重系数为上述公式
Figure GDA0003842685870000112
计算出的权重Wj,根据公式
Figure GDA0003842685870000113
即可计算出修正后的权重/>
Figure GDA0003842685870000114
同样表示的是第j项服务项目在所有服务项目中占的权重。而后根据修正后的权重,经过预设算法,可求得各服务器的综合评价值,即各服务器的量化值。
具体地,如果运维人员事先已有经验性的主观权重λj,所述根据所述修正后的权重,获取各所述服务器的量化值,包括,将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值。然后将各所述服务器对应的所有服务项目的量化值之和,确定为各所述所述服务器的量化值。
在本实施例中,若修正后的权重
Figure GDA0003842685870000121
为表5所示,则结合表1,服务器A中服务项目a的量化值为0.064884066*0.271、服务器A中服务项目b的量化值为0.1533132*0.53、服务器B中服务项目h的量化值为0.029*0.55。则0.064884066*0.271+0.1533132*0.53+……+0.0642*0.375为服务器A的量化值。
表5
Figure GDA0003842685870000122
可选地,若没有主观权重λj,则利用公式
Figure GDA0003842685870000123
计算出的权重Wj与服务器A…G各个服务信息乘积求和,得到综合评价值,即量化值。
服务器A…G的综合评价值(精确到两位小数),计算结果如表6所示:
表6
服务器A 服务器B 服务器C 服务器D 服务器E 服务器F 服务器G
3.38 4.19 3.02 2.24 6.02 9.69 16.03
从结果中我们可以看出服务器G分值最高,因此可以大胆预测其运行状态很好,而服务器D发生异常或故障的可能性就非常大,需要重点关注和分析服务器D返回的服务信息。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本实施例提供的基于监控运维系统服务的数据分析方法,计算机设备采用预设算法,计算各所述服务项目的权重,根据所述权重获取各所述服务器的量化值,可以分析出各个服务器的发生故障的可能性,从而达到预测和定位服务器故障的目的,降低服务器宕机的可能性,提高了工作效率。
图6为一个实施例提供的基于监控运维系统服务的数据分析的装置结构示意图。如图6所示,该基于监控运维系统服务的数据分析的装置包括:权重获取模块10、量化值获取模块20,其中:
权重获取模块10,用于根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
量化值获取模块20,用于根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
在一个实施例中,如图7所示,在图6所述的基于监控运维系统服务的数据分析的装置结构示意图基础上,所述权重获取模块10包括:
第一获取单元101,用于根据各服务器的监控信息,获取各服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度。
第二获取单元102,用于根据所述差异系数,获取各所述服务项目的权重。
在一个实施例中,第一获取单元101具体用于根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各所述服务项目的差异系数。
在一个实施例中,第一获取单元101根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度,包括:第一获取单元101用于根据各所述服务器的监控信息,构建决策矩阵;根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
在一个实施例中,第一获取单元101根据所述贡献度,获取各所述服务项目的差异系数,包括:第一获取单元101根据各所述贡献度,获取各所述服务项目的贡献总量;根据各所述服务项目的贡献总量,获取各所述服务项目的差异系数。
在一个实施例中,第二获取单元102具体用于根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
在一个实施例中,量化值获取模块20具体用于根据预设的权重系数,对所述服务项目的权重进行修正,得到修正后的权重;根据各所述修正后的权重,获取各所述服务器的量化值。
在一个实施例中,量化值获取模块20根据各所述修正后的权重,获取各所述服务器的量化值,包括:量化值获取模块20将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述所述服务器的量化值。
关于一种基于监控运维系统服务的数据分析的装置的具体限定可以参见上文中对于数据更新方法的限定,在此不再赘述。上述基于监控运维系统服务的数据分析的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备与复数个服务器通信连接,计算机设备自动获取各服务器的监控信息,自动计算各服务器的服务项目权重,自动判断各服务器的故障概率。该计算机设备包括通过系统总线连接的处理器、存储器、显示器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机的显示器用于显示有故障问题的服务器及故障问题相对应的服务项目,显示被计算机按优先级排序的故障问题,并显示计算机给出的故障问题的解决方案建议;显示器对有故障问题的服务器特殊显示,并图形化定位出该对应服务器的相对空间位置,该计算机设备的显示器可以是液晶显示器或者电子墨水显示器。该计算机设备的数据库用于存储监控信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于监控运维系统服务的数据分析的方法。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各服务器的监控信息,获取各服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度;根据所述差异系数,获取各所述服务项目的权重。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各所述服务项目的差异系数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各所述服务器的监控信息,构建决策矩阵;根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据各所述贡献度,获取各所述服务项目的贡献总量;根据各所述服务项目的贡献总量,获取各所述服务项目的差异系数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预设的权重系数,对所述服务项目的权重进行修正,得到修正后的权重;根据各所述修正后的权重,获取各所述服务器的量化值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述所述服务器的量化值。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时还实现以下步骤:
根据各服务器的监控信息,获取各服务项目的权重,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据各所述服务项目的权重,获取各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
在一个实施例中,计算机程序被处理器执行时还实现:根据各服务器的监控信息,获取各服务项目的差异系数;所述差异系数表示各所述服务项目中服务信息的一致性程度;根据所述差异系数,获取各所述服务项目的权重。
在一个实施例中,计算机程序被处理器执行时还实现:根据各所述服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各所述服务项目的差异系数。
在一个实施例中,计算机程序被处理器执行时还实现:根据各所述服务器的监控信息,构建决策矩阵;根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
在一个实施例中,计算机程序被处理器执行时还实现:根据各所述贡献度,获取各所述服务项目的贡献总量;根据各所述服务项目的贡献总量,获取各所述服务项目的差异系数。
在一个实施例中,计算机程序被处理器执行时还实现:根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
在一个实施例中,计算机程序被处理器执行时还实现:根据预设的权重系数,对所述服务项目的权重进行修正,得到修正后的权重;根据各所述修正后的权重,获取各所述服务器的量化值。
在一个实施例中,计算机程序被处理器执行时还实现:将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述所述服务器的量化值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种基于监控运维系统服务的数据分析方法,其特征在于,包括:
根据各服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各服务项目的权重;其中,任一服务项目的服务信息在各个服务器的贡献度的趋近程度与该服务项目的权重成反比关系,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据已有经验性的主观权重,对所述服务项目的权重进行修正,得到修正后的权重;
将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;
将各所述服务器对应的所有服务项目的量化值之和,确定为各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
2.根据权利要求1所述的方法,其特征在于,所述根据所述贡献度,获取各服务项目的权重,包括:
根据所述贡献度,获取各所述服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度;
根据所述差异系数,获取各所述服务项目的权重。
3.根据权利要求2所述的方法,其特征在于,所述根据各服务器的监控信息,获取各服务器的每个服务信息的贡献度,包括:
根据各所述服务器的监控信息,构建决策矩阵;
根据所述决策矩阵,获取各所述服务器的每个服务信息的贡献度。
4.根据权利要求2-3任一项所述的方法,其特征在于,所述根据所述差异系数,获取各所述服务项目的权重,包括:
根据预设的熵值算法和所述差异系数,获取各所述服务项目的权重。
5.一种基于监控运维系统服务的数据分析的装置,其特征在于,所述装置包括:
权重获取模块,用于根据各服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各服务项目的权重;其中,任一服务项目的服务信息在各个服务器的贡献度的趋近程度与该服务项目的权重成反比关系,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
量化值获取模块,用于根据已有经验性的主观权重,对所述服务项目的权重进行修正,得到修正后的权重;将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
6.根据权利要求5所述的装置,其特征在于,所述权重获取模块包括:
第一获取单元,用于根据所述贡献度,获取各所述服务项目的差异系数,所述差异系数表示各所述服务项目中服务信息的一致性程度;
第二获取单元,用于根据所述差异系数,获取各所述服务项目的权重。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
根据各服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各服务项目的权重;其中,任一服务项目的服务信息在各个服务器的贡献度的趋近程度与该服务项目的权重成反比关系,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据已有经验性的主观权重,对所述服务项目的权重进行修正,得到修正后的权重;将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
根据各服务器的监控信息,获取各所述服务器的每个服务信息的贡献度;根据所述贡献度,获取各服务项目的权重;其中,任一服务项目的服务信息在各个服务器的贡献度的趋近程度与该服务项目的权重成反比关系,所述监控信息包括各所述服务器的每个所述服务项目的服务信息;
根据已有经验性的主观权重,对所述服务项目的权重进行修正,得到修正后的权重;将各所述修正后的权重与对应的服务信息进行乘法运算,获取各所述服务项目的量化值;将各所述服务器对应的所有服务项目的量化值之和,确定为各所述服务器的量化值,所述量化值用于表示所述服务器的故障概率。
CN201811230639.3A 2018-10-22 2018-10-22 基于监控运维系统服务的数据分析方法、装置和设备 Active CN109522180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811230639.3A CN109522180B (zh) 2018-10-22 2018-10-22 基于监控运维系统服务的数据分析方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811230639.3A CN109522180B (zh) 2018-10-22 2018-10-22 基于监控运维系统服务的数据分析方法、装置和设备

Publications (2)

Publication Number Publication Date
CN109522180A CN109522180A (zh) 2019-03-26
CN109522180B true CN109522180B (zh) 2023-06-30

Family

ID=65772881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811230639.3A Active CN109522180B (zh) 2018-10-22 2018-10-22 基于监控运维系统服务的数据分析方法、装置和设备

Country Status (1)

Country Link
CN (1) CN109522180B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000556B (zh) * 2020-07-06 2023-04-28 广州西山居网络科技有限公司 客户端程序宕机显示方法、装置及可读介质
CN112015781A (zh) * 2020-08-26 2020-12-01 广东电网有限责任公司广州供电局 电力运行信息处理方法、装置、计算机设备和存储介质
CN112734056A (zh) * 2020-12-29 2021-04-30 望海康信(北京)科技股份公司 运维系统、方法及相应设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006043007A (ja) * 2004-08-02 2006-02-16 Fujitsu Ltd 診断支援プログラムおよび診断支援装置
JP2013156969A (ja) * 2012-02-01 2013-08-15 Fuji Xerox Co Ltd 障害予測システム、障害予測装置及びプログラム
CN106096047A (zh) * 2016-06-28 2016-11-09 武汉斗鱼网络科技有限公司 基于熵值法的用户分区偏好计算方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7805517B2 (en) * 2004-09-15 2010-09-28 Cisco Technology, Inc. System and method for load balancing a communications network
CN103914482B (zh) * 2013-01-07 2017-09-19 上海宝信软件股份有限公司 基于cmdb的集中监控事件影响性确定方法
CN103617110B (zh) * 2013-11-11 2016-09-07 国家电网公司 服务器设备状态检修系统
CN106910021A (zh) * 2017-02-28 2017-06-30 东方电子股份有限公司 一种基于指数对数修正的配电网运行风险估值的方法
CN107124315B (zh) * 2017-05-19 2020-10-23 国网安徽省电力公司淮南供电公司 基于snmp及ipmi协议的多服务器监测系统及监测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006043007A (ja) * 2004-08-02 2006-02-16 Fujitsu Ltd 診断支援プログラムおよび診断支援装置
JP2013156969A (ja) * 2012-02-01 2013-08-15 Fuji Xerox Co Ltd 障害予測システム、障害予測装置及びプログラム
CN106096047A (zh) * 2016-06-28 2016-11-09 武汉斗鱼网络科技有限公司 基于熵值法的用户分区偏好计算方法及系统

Also Published As

Publication number Publication date
CN109522180A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN108959934B (zh) 安全风险评估方法、装置、计算机设备和存储介质
CN109522180B (zh) 基于监控运维系统服务的数据分析方法、装置和设备
US11119878B2 (en) System to manage economics and operational dynamics of IT systems and infrastructure in a multi-vendor service environment
CN105677538A (zh) 一种基于故障预测的云计算系统自适应监测方法
US20120030522A1 (en) Fault cause extraction apparatus, fault cause extraction method, and program recording medium
US20120185737A1 (en) Fault detection apparatus, a fault detection method and a program recording medium
KR102097953B1 (ko) 고장 리스크 지표 추정 장치 및 고장 리스크 지표 추정 방법
US20070288626A1 (en) Kalman filtering for grid computing telemetry and workload management
Rodrigues et al. A spare parts inventory control model based on Prognostics and Health monitoring data under a fill rate constraint
JP7145821B2 (ja) 故障確率評価システムおよびその方法
WO2011138911A1 (ja) 障害分析装置、障害分析方法および記録媒体
Mercier et al. A condition‐based imperfect replacement policy for a periodically inspected system with two dependent wear indicators
CN110166498B (zh) 用户类别确定方法及装置、计算机设备及存储介质
Zhang et al. Reliability analysis for k-out-of-n systems with shared load and dependent components
CN111221834B (zh) 一种商品库存价值计算方法
CN114461389A (zh) 服务器集群的负载均衡方法、装置及电子设备
CN113268350B (zh) 基于云的服务构建的资源分配方法、装置、计算机设备
WO2008050323A2 (en) Method for measuring health status of complex systems
JP2015184818A (ja) サーバ、モデル適用可否判定方法およびコンピュータプログラム
CN113824590B (zh) 微服务网络的问题预测方法、计算机设备和存储介质
CN114528179B (zh) 数据采集程序状态监控方法、装置、设备及存储介质
CN110795255B (zh) 数据批量值调整方法、装置、可读存储介质和设备
CN113780666A (zh) 一种缺失值的预测方法及装置、可读存储介质
JP2021105772A (ja) リソース利用量の予測管理システム、リソース利用量の予測管理方法
CN115668150A (zh) 接口性能测试方法和装置、服务器、计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant