CN112416721A - 一种告警处理方法、系统及介质 - Google Patents

一种告警处理方法、系统及介质 Download PDF

Info

Publication number
CN112416721A
CN112416721A CN202011463541.XA CN202011463541A CN112416721A CN 112416721 A CN112416721 A CN 112416721A CN 202011463541 A CN202011463541 A CN 202011463541A CN 112416721 A CN112416721 A CN 112416721A
Authority
CN
China
Prior art keywords
alarm
solution
vector
information
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011463541.XA
Other languages
English (en)
Other versions
CN112416721B (zh
Inventor
张源升
王晓通
张鑫
任广磊
贾正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202011463541.XA priority Critical patent/CN112416721B/zh
Publication of CN112416721A publication Critical patent/CN112416721A/zh
Application granted granted Critical
Publication of CN112416721B publication Critical patent/CN112416721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种告警处理方法,初始化告警知识库,并在告警知识库中设置告警配置项;获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;根据告警配置项判断解决元素对于告警向量的相关性,根据解决元素对于告警向量的相关性选取最终解决向量,将最终解决向量转换为解决信息;根据解决信息执行对应的解决方案;本发明能够对于告警信息,引入告警向量,并对告警向量进行矩阵式计算,得到解决向量,根据向量之间的相关性,得出最优的解决方案,极大的提高了告警处理的效率。

Description

一种告警处理方法、系统及介质
技术领域
本发明涉及服务器系统设计领域,特别是涉及一种告警处理方法、系统及介质。
背景技术
目前,服务器的管理方式采用云平台进行线上管理,云平台对服务器的告警维护处理依靠人工分析和人工维护的方式,随着云平台的使用范围越来越广泛,云平台的告警类型也会越来越多,维护人员面临的告警数量也越来越大;一方面,通过人工分析和人工维护对云平台的告警进行处理的时效较长且不定性因素很多,另一方面,随着告警数量的增长,人工分析和人工维护的方式效率会越来越低,进而导致云平台的数据使用效率下降,而人工处理的能力范围有限,且寻找与告警对应的处理方式成本很高。
发明内容
本发明主要解决的技术问题是提供一种告警处理方法、系统及介质,能够解决在对服务器中的告警进行处理时,采用人工处理的方式导致云平台的数据使用效率下降以及告警处理效率低的问题。
为解决上述技术问题,本发明采用的一个技术方案是:一种告警处理方法,包括以下步骤:
初始化告警知识库,并在告警知识库中设置告警配置项;
获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;
根据告警配置项判断解决元素对于告警向量的相关性,根据解决元素对于告警向量的相关性选取最终解决向量,将最终解决向量转换为解决信息;
根据解决信息执行对应的解决方案。
进一步,所述告警配置项包括:字符向量转换表、变量关系、影响阈值、推荐阈值、公共元素和特殊元素。
进一步,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素具体为:
在收到告警信息后,提取告警信息中的告警关键字符,根据字符向量转换表将告警关键字符转换为告警向量;
对告警向量进行转置计算,得到告警向量的转置告警向量;
根据变量关系计算公共元素对于转置告警向量的公共相关系数和特殊元素对于转置告警向量的特殊相关系数;
比较所述公共相关系数与所述特殊相关系数的大小,当所述公共相关系数大于所述特殊相关系数时,选取公共元素作为与所述告警向量对应的解决元素。
进一步,所述根据告警配置项判断解决元素对于告警向量的相关性,根据解决元素对于告警向量的相关性选取最终解决向量,将最终解决向量转换为解决信息具体为:
比较所述解决元素的公共相关系数与所述影响阈值的大小,判断公共相关系数大于影响阈值的解决元素对于告警向量的强相关性为密切相关,并选取强相关性为密切相关的解决元素作为最终解决元素;
将最终解决元素组成最终解决向量;
根据字符向量转换表将最终解决向量转换为解决信息。
进一步,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素还包括:当所述公共相关系数小于所述特殊相关系数时,执行推荐措施;
所述推荐措施为:选取公共相关系数大于推荐阈值且小于影响阈值的公共元素组成推荐向量,并根据字符向量转换表将该推荐向量转换为推荐信息,并将推荐信息上报至后台。
进一步,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素中,当后台收到推荐信息时,判断推荐信息的可用性,若推荐信息的可用性为可用,则后台根据该推荐信息执行对应的措施;若推荐信息的可用性为非可用,则后台发送帮助指令;
根据帮助指令执行对应的解决措施,在执行解决措施后,将该解决措施根据字符向量转换表转换为公共元素,并将该公共元素保存至告警知识库。
进一步,所述根据解决信息执行对应的解决方案具体为:
解决信息包括可编程类解决信息和非编程类解决信息,若解决信息为可编程类解决信息,则对应的解决方案为:获取确认指令,根据确认指令将该解决信息转换为解决代码,并执行该解决代码;
若解决信息为非编程类解决信息,则对应的解决方案为:上报该解决信息至后台,后台根据该解决信息执行对应的措施。
一种告警处理系统,包括:
初始化单元、告警处理单元和告警解决单元;
所述初始化单元用于初始化告警知识库,并在告警知识库中设置告警配置项;
所述告警处理单元用于获取告警信息;所述告警处理单元通过所述告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;所述告警处理单元通过所述告警配置项判断所述解决元素对于所述告警向量的相关性;所述告警处理单元通过所述解决元素对于所述告警向量的相关性选取最终解决向量,并将最终解决向量转换为解决信息;
所述告警解决单元通过所述解决信息执行对应的解决方案。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述告警处理方法的步骤。
本发明的有益效果是:本发明能够对于告警信息,引入告警向量,并对告警向量进行矩阵式计算,得到解决向量,根据向量之间的相关性,得出最优的解决方案,极大的提高了告警处理的效率。
附图说明
图1是本发明提供的一种告警处理方法的流程图;
图2是本发明提供的一种告警处理系统的结构示意图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
本发明实施例包括:
第一方面,见图1,一种告警处理方法,包括:
首先,初始化告警知识库,设置告警知识库中的告警配置项;告警配置项包括:字符向量转换表、影响阈值、推荐阈值、公共元素
Figure BDA0002832327300000041
特殊元素
Figure BDA0002832327300000042
关系因子E、参数矩阵A和μ;其中,公共元素和特殊元素均为随机变量,设定变量关系:
Figure BDA0002832327300000051
Figure BDA0002832327300000052
其中,m的维度代表向量矩阵中的行,n的维度代表向量矩阵中的列,E代表单位向量,Im为随机变量;
对服务器的虚拟机和虚拟机上运行的服务进行监控;
当服务器的虚拟机或虚拟机上运行的服务出现异常时,都会触发告警;即发送与异常类型对应的告警信息,该异常类型有两种,分别为虚拟机的业务异常和虚拟机上运行的服务的服务异常。
在收到告警信息后,告警信息将会发送到告警知识库中,该告警知识库中初始化有告警配置项,根据告警配置项对告警信息进行处理,得到对应的解决方案;该步骤具体为:
将告警信息中的关键词提取,并将关键词根据字符向量转换表转换为告警向量X0,若关键词有n个,则X0=(a0,a1,...an);
计算X0的转置向量X得到X=(X1,X2,…,Xn)T,且X应满足:
Figure BDA0002832327300000053
根据变量关系:
Figure BDA0002832327300000054
可以代入上式,得出A,其中,矩阵A是为了将向量转换为可以进行计算的数值矩阵,可定义A为告警载荷,A中有若干个元素aij;aij即第i个分量Xi在第j个元素fj上的载荷,即表示公共元素
Figure BDA0002832327300000055
对X=(X1,X2,…,Xn)T中的任一Xi的影响系数,设影响系数为
Figure BDA0002832327300000056
(即公共相关系数),则有
Figure BDA0002832327300000057
因为
Figure BDA0002832327300000058
由此计算出特殊元素
Figure BDA0002832327300000059
对X=(X1,X2,…,Xn)T中的指定Xi产生的影响系数为σi 2(即特殊相关系数);因为
Figure BDA00028323273000000510
所以得出特殊元素
Figure BDA00028323273000000511
只对X=(X1,X2,…,Xn)T中的指定Xi产生影响;
根据上述公式,计算出对X造成影响的影响因素的公式为:
Figure BDA00028323273000000512
即对X造成影响的影响因素为公共元素和特殊元素;
此时,需要对对X造成影响的影响因素的影响系数进行计算,由上述公式可得出对X产生的影响的
Figure BDA0002832327300000061
Figure BDA0002832327300000062
与σi 2进行对比,当
Figure BDA0002832327300000063
时,说明公共元素
Figure BDA0002832327300000064
对X的影响大于特殊元素
Figure BDA0002832327300000065
对X的影响;此时,选择每个对X的影响大的元素的影响系数与设定的影响阈值进行对比,将大于影响阈值的元素组成结果向量(即最终解决向量);将该结果向量根据关键词转换规则得到由字符串组成的可识别的与告警信息对应的解决方案(即解决信息);
判断该解决方案是否为计算机可通过代码实现的方案(即是否为可编程类解决信息),若是,则计算机会发送请求指令给后台控制端,待后台控制端同意后,计算机生成与该解决方案对应的解决代码,并运行该代码,解决告警信息对应的异常;
若否,则计算机会将该解决方案(即非编程类解决信息)发送至后台控制端,后台控制端根据解决方案对异常实施人工处理。
Figure BDA0002832327300000066
时,说明特殊元素
Figure BDA0002832327300000067
对X的影响大于公共元素
Figure BDA0002832327300000068
对X的影响;表示没有对应告警信息的解决方案;此时,选择影响系数大于推荐阈值且小于影响阈值的元素组成推荐向量,并将该推荐向量根据关键词转换规则得到由字符串组成的可识别的推荐方案(即推荐信息),并将推荐方案上报至后台控制端;
当后台控制端收到推荐方案时,判断推荐方案是否可行(即判断推荐信息的可用性),若可行(即推荐信息的可用性为可用),则执行该推荐方案,若不可行(即推荐信息的可用性为非可用),则发送帮助指令,在工作人员看到帮助指令后,进行人工处理,并在人工处理后,上传与该异常对应的解决方案至知识库中。
第二方面,见图2,基于与前述实施例中一种告警处理方法同样的发明构思,本说明书实施例还提供一种告警处理系统,包括:
初始化单元、告警处理单元和告警解决单元;
初始化单元用于初始化告警知识库;所述告警知识库中设有告警配置项;
告警处理单元用于获取告警信息;所述告警处理单元通过所述告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;所述告警处理单元通过所述告警配置项判断所述解决元素对于所述告警向量的相关性;所述告警处理单元通过所述解决元素对于所述告警向量的相关性选取最终解决向量,并将最终解决向量转换为解决信息;
告警解决单元通过所述解决信息执行对应的解决方案。
第三方面,一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述告警处理方法的步骤。
区别于现有技术,采用本申请一种告警处理方法、系统及介质,可以通过本方法中的告警知识库,对不同的告警信息转换为告警向量,并对告警向量进行矩阵计算,得到对应的解决向量,通过判断该解决向量与告警向量的相关性,得出最终的解决向量并转换为解决方案,极大的提高了告警的处理效率,且此方法应用性非常广泛,可以运用在不同的数据处理场合中。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种告警处理方法,其特征在于,包括以下步骤:
初始化告警知识库,并在告警知识库中设置告警配置项;
获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;
根据告警配置项判断解决元素对于告警向量的相关性,根据解决元素对于告警向量的相关性选取最终解决向量,将最终解决向量转换为解决信息;
根据解决信息执行对应的解决方案。
2.根据权利要求1中所述的一种告警处理方法,其特征在于,所述告警配置项包括:字符向量转换表、变量关系、影响阈值、推荐阈值、公共元素和特殊元素。
3.根据权利要求2中所述的一种告警处理方法,其特征在于,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素具体为:
在收到告警信息后,提取告警信息中的告警关键字符,根据字符向量转换表将告警关键字符转换为告警向量;
对告警向量进行转置计算,得到告警向量的转置告警向量;
根据变量关系计算公共元素对于转置告警向量的公共相关系数和特殊元素对于转置告警向量的特殊相关系数;
比较所述公共相关系数与所述特殊相关系数的大小,当所述公共相关系数大于所述特殊相关系数时,选取公共元素作为与所述告警向量对应的解决元素。
4.根据权利要求3中所述的一种告警处理方法,其特征在于,所述根据告警配置项判断解决元素对于告警向量的相关性,根据解决元素对于告警向量的相关性选取最终解决向量,将最终解决向量转换为解决信息具体为:
比较所述解决元素的公共相关系数与所述影响阈值的大小,判断公共相关系数大于影响阈值的解决元素对于告警向量的强相关性为密切相关,并选取强相关性为密切相关的解决元素作为最终解决元素;
将最终解决元素组成最终解决向量;
根据字符向量转换表将最终解决向量转换为解决信息。
5.根据权利要求3中所述的一种告警处理方法,其特征在于,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素还包括:当所述公共相关系数小于所述特殊相关系数时,执行推荐措施;
所述推荐措施为:选取公共相关系数大于推荐阈值且小于影响阈值的公共元素组成推荐向量,并根据字符向量转换表将该推荐向量转换为推荐信息,并将推荐信息上报至后台。
6.根据权利要求5中所述的一种告警处理方法,其特征在于,所述获取告警信息,根据告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素中,当后台收到推荐信息时,判断推荐信息的可用性,若推荐信息的可用性为可用,则后台根据该推荐信息执行对应的措施;若推荐信息的可用性为非可用,则后台发送帮助指令;
根据帮助指令执行对应的解决措施,在执行解决措施后,将该解决措施根据字符向量转换表转换为公共元素,并将该公共元素保存至告警知识库。
7.根据权利要求1中所述的一种告警处理方法,其特征在于,所述根据解决信息执行对应的解决方案具体为:
解决信息包括可编程类解决信息和非编程类解决信息,若解决信息为可编程类解决信息,则对应的解决方案为:获取确认指令,根据确认指令将该解决信息转换为解决代码,并执行该解决代码;
若解决信息为非编程类解决信息,则对应的解决方案为:上报该解决信息至后台,后台根据该解决信息执行对应的措施。
8.一种告警处理系统,其特征在于,包括:
初始化单元、告警处理单元和告警解决单元;
所述初始化单元用于初始化告警知识库,并在告警知识库中设置告警配置项;
所述告警处理单元用于获取告警信息;所述告警处理单元通过所述告警配置项将该告警信息转换为告警向量,并对告警向量进行矩阵式计算得出与告警向量对应的解决元素;所述告警处理单元通过所述告警配置项判断所述解决元素对于所述告警向量的相关性;所述告警处理单元通过所述解决元素对于所述告警向量的相关性选取最终解决向量,并将最终解决向量转换为解决信息;
所述告警解决单元通过所述解决信息执行对应的解决方案。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述告警处理方法的步骤。
CN202011463541.XA 2020-12-11 2020-12-11 一种告警处理方法、系统及介质 Active CN112416721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011463541.XA CN112416721B (zh) 2020-12-11 2020-12-11 一种告警处理方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011463541.XA CN112416721B (zh) 2020-12-11 2020-12-11 一种告警处理方法、系统及介质

Publications (2)

Publication Number Publication Date
CN112416721A true CN112416721A (zh) 2021-02-26
CN112416721B CN112416721B (zh) 2022-09-20

Family

ID=74776615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011463541.XA Active CN112416721B (zh) 2020-12-11 2020-12-11 一种告警处理方法、系统及介质

Country Status (1)

Country Link
CN (1) CN112416721B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617625A (zh) * 2022-12-15 2023-01-17 云和恩墨(北京)信息技术有限公司 告警规则配置方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108809757A (zh) * 2018-05-22 2018-11-13 平安科技(深圳)有限公司 一种系统告警方法、存储介质和服务器
CN110096410A (zh) * 2019-03-15 2019-08-06 中国平安人寿保险股份有限公司 告警信息处理方法、系统、计算机装置及可读存储介质
CN110321268A (zh) * 2019-06-12 2019-10-11 平安科技(深圳)有限公司 一种告警信息处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108809757A (zh) * 2018-05-22 2018-11-13 平安科技(深圳)有限公司 一种系统告警方法、存储介质和服务器
CN110096410A (zh) * 2019-03-15 2019-08-06 中国平安人寿保险股份有限公司 告警信息处理方法、系统、计算机装置及可读存储介质
CN110321268A (zh) * 2019-06-12 2019-10-11 平安科技(深圳)有限公司 一种告警信息处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617625A (zh) * 2022-12-15 2023-01-17 云和恩墨(北京)信息技术有限公司 告警规则配置方法及装置

Also Published As

Publication number Publication date
CN112416721B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN111314173A (zh) 监控信息异常的定位方法、装置、计算机设备及存储介质
CN110489142B (zh) 设备软件升级的评估方法及装置、存储介质、终端
CN112416721B (zh) 一种告警处理方法、系统及介质
US11386099B2 (en) Methods and apparatuses for showing target object sequence to target user
CN111444060A (zh) 异常检测模型训练方法、异常检测方法及相关装置
Wang et al. Dimension reduction for clustering time series using global characteristics
CN113297393A (zh) 基于态势感知和大数据的情报生成方法及信息安全系统
JP2009112330A (ja) 特徴量候補作成装置および特徴量候補作成方法
CN113988303A (zh) 基于并行量子本征求解器的量子推荐方法、装置及系统
CN117312807B (zh) 一种断路器的控制状态分析方法及系统
CN107612737B (zh) 一种告警方法及其装置
CN111026087B (zh) 基于数据的含权重非线性工业系统故障检测方法及装置
CN116663338A (zh) 一种基于相似算例的仿真分析方法、装置、设备及介质
CN109540522B (zh) 轴承健康量化建模方法、装置和服务器
CN111062230B (zh) 一种性别识别模型训练方法和装置及性别识别方法和装置
CN115810419A (zh) 智慧手术室的运营管理方法、装置、设备及存储介质
CN113590436A (zh) 一种告警方法及装置
CN115630339A (zh) 一种监控文本异常节点的数据处理方法、设备及介质
CN112364900A (zh) 用于智慧建筑的设备告警管理方法、装置、客户端及介质
JP7062923B2 (ja) 可視化方法、可視化装置及び可視化プログラム
CN113296994A (zh) 一种基于国产计算平台的故障诊断系统及方法
JP5569324B2 (ja) 操業条件管理装置
CN116991620B (zh) 一种解决方案确定方法、装置、设备及介质
CN114996536B (zh) 维修方案查询方法、装置、设备及计算机可读存储介质
CN115495321B (zh) 一种超算节点使用状态自动识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant