CN114826881A - 基于关联分析的智能运维方法和计算机可读存储介质 - Google Patents

基于关联分析的智能运维方法和计算机可读存储介质 Download PDF

Info

Publication number
CN114826881A
CN114826881A CN202210401241.1A CN202210401241A CN114826881A CN 114826881 A CN114826881 A CN 114826881A CN 202210401241 A CN202210401241 A CN 202210401241A CN 114826881 A CN114826881 A CN 114826881A
Authority
CN
China
Prior art keywords
state parameter
value
method based
correlation analysis
intelligent operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210401241.1A
Other languages
English (en)
Inventor
李富强
于洋
高经郡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kejie Technology Co ltd
Original Assignee
Beijing Kejie Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kejie Technology Co ltd filed Critical Beijing Kejie Technology Co ltd
Priority to CN202210401241.1A priority Critical patent/CN114826881A/zh
Publication of CN114826881A publication Critical patent/CN114826881A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及计算机技术领域,具体涉及一种基于关联分析的智能运维方法和计算机可读存储介质,旨在尽可能地避免或减少应用系统故障造成的损失。本发明的基于关联分析的智能运维方法包括:获取目标系统中状态参数的值;根据状态参数的值判断是否满足预设的告警条件;若满足预设的告警条件,则发出告警通知;若不满足预设的告警条件,则根据状态参数的值判断是否满足预设的提前警示条件;若满足,则发出提前警示通知;否则,重复执行获取状态参数的值并进行判断的步骤。利用本发明,运维工程师能够在应用系统发生故障之前就提前进行干预,可以最大限度地避免或减小因故障造成的损失。

Description

基于关联分析的智能运维方法和计算机可读存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种基于关联分析的智能运维方法和计算机可读存储介质。
背景技术
随着计算机系统的普及和互联网的发展,企业、事业单位和政府机关会有各种各样的应用系统需要实时维护,以保障其正常运行。
相关技术通常是在监测到应用系统发生故障时,立刻由运维工程师前去排查并解决故障。然而,故障一旦发生,就会不可避免地对工业生产或商业运营等造成影响,甚至是非常严重的损失。
针对上述的相关技术,发明人认为应该采取措施尽可能地避免或减少应用系统故障造成的损失。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种基于关联分析的智能运维方法和计算机可读存储介质,能够一定程度上减少故障造成的损失。
本发明的一方面,提出一种基于关联分析的智能运维方法,所述方法包括:
获取目标系统中状态参数的值;
根据所述状态参数的值判断是否满足预设的告警条件;
若满足所述预设的告警条件,则发出告警通知。
优选地,所述状态参数为一个或多个,且两个或两个以上的所述状态参数构成状态参数组合;
所述状态参数组合为一个或多个。
优选地,所述预设的告警条件包括:任意一个所述状态参数的值超过该状态参数对应的告警阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的告警阈值组合中相应参数的阈值。
优选地,所述方法还包括:
若不满足所述预设的告警条件,则根据所述状态参数的值判断是否满足预设的提前警示条件;
若满足,则发出提前警示通知;否则,重复执行获取所述状态参数的值并进行判断的步骤。
优选地,所述预设的提前警示条件包括:任意一个所述状态参数的值超过该状态参数对应的提前警示阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的提前警示阈值组合中相应参数的阈值。
优选地,所述方法还包括:
根据告警前所述状态参数的变化情况,调整每个所述状态参数对应的提前警示阈值和/或每个所述状态参数组合对应的提前警示阈值组合。
优选地,所述方法还包括:
根据告警前所述状态参数的变化情况,添加或删除所述状态参数组合,或者调整所述状态参数组合中参数的数量或种类。
优选地,所述方法还包括:根据告警前所述状态参数的变化情况,参照历史告警案例,判断故障原因。
优选地,所述状态参数包括:内存占用率、磁盘占用率、CPU占用率和网速。
本发明的另一方面,提出一种计算机可读存储介质,存储有能够被处理器加载并执行上面所述的基于关联分析的智能运维方法的计算机程序。
与最接近的现有技术相比,本发明具有如下有益效果:
本发明的基于关联分析的智能运维方法,对应用系统的状态参数进行实时监控,并在满足预设的告警条件时发出告警通知,比起人工监控来说,可以简单、便捷地执行监控任务。本发明还可以在满足预设的提前警示条件时发出提前警示通知,使得运维工程师能够在应用系统发生故障之前就提前进行干预,可以最大限度地避免或减小因故障造成的损失。
本发明的智能运维方法还设置了状态参数的组合,以便对应用系统的运行状态进行综合判断,能够更加全面地对各种故障发出警告。本发明还可以根据告警发生前状态参数的变化情况,调整每个状态参数对应的提前警示阈值和/或每个状态参数组合对应的提前警示阈值组合。还可以根据告警前状态参数的变化情况,添加或删除状态参数组合,或者调整状态参数组合中参数的数量或种类。通过这些调整,使得提前警示更加及时和准确。另外,还可以参照历史告警案例,判断故障原因,为运维工程师快速定位故障提供有力的支持。
附图说明
图1是本发明的基于关联分析的智能运维方法实施例一的主要步骤示意图;
图2是本发明的基于关联分析的智能运维方法实施例二的主要步骤示意图;
图3是本发明的基于关联分析的智能运维方法实施例三的主要步骤示意图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本申请的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明的描述中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
图1是本发明的基于关联分析的智能运维方法实施例一的主要步骤示意图。如图1所示,本实施例的智能运维方法包括步骤A10-A30:
步骤A10,获取目标系统中状态参数的值。
其中,状态参数为一个或多个,可以包括:内存占用率、磁盘占用率、CPU占用率和网速等等。
步骤A20,根据状态参数的值判断是否满足预设的告警条件。
可以由两个或两个以上的状态参数构成一个状态参数组合。根据实际需要,可以构建一个或多个状态参数组合。
其中,预设的告警条件可以包括:任意一个状态参数的值超过该状态参数对应的告警阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的告警阈值组合中相应参数的阈值。
需要说明的是,本发明为每个状态参数组合专门设置一个告警阈值组合,组合中每个参数对应的阈值并不等于其作为单个参数使用时的告警阈值。假设CPU占用率作为单个参数使用时的告警阈值为98%,磁盘占用率作为单个参数使用时告警阈值为95%;当这两个参数作为组合使用时,对应的告警阈值组合为:{92%,90%}。状态参数组合中每个参数的值均超过对应的告警阈值组合中相应参数的阈值,指的是CPU占用率大于92%,且磁盘占用率大于90%。
另外,本申请中所说的“超过”某阈值,并不是都代表“大于”的意思,根据具体情况也有可能是“小于”,例如网速,在正常情况下是很快的,在故障情况下网速可能变得越来越小,甚至为0。
步骤A30,若满足预设的告警条件,则发出告警通知。
图2是本发明的基于关联分析的智能运维方法实施例二的主要步骤示意图。如图2所示,本实施例的智能运维方法包括步骤B10-B50:
步骤B10,获取目标系统中状态参数的值。
步骤B20,根据状态参数的值判断是否满足预设的告警条件。
其中,预设的告警条件与上面实施例一中相同,此处不再赘述。
步骤B30,若满足预设的告警条件,则发出告警通知。
步骤B40,若不满足预设的告警条件,则根据状态参数的值判断是否满足预设的提前警示条件。
其中,预设的提前警示条件包括:任意一个状态参数的值超过该状态参数对应的提前警示阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的提前警示阈值组合中相应参数的阈值。
本发明为每个参数单独设置了提前警示阈值,还为每个参数组合设置了提前警示阈值组合。仍旧拿CPU占用率和磁盘占用率来举例,假设CPU占用率和磁盘占用率均作为单个参数使用时的提前警示阈值分别设置为90%、89%,当这两个参数构成一个参数组合时,对应的提前警示阈值组合设置为{85%,80%},即当CPU占用率和磁盘占用率分别超过85%和80%时,认为满足提前警示条件。
步骤B50,若满足预设的提前警示条件,则发出提前警示通知;否则转至步骤B10。
图3是本发明的基于关联分析的智能运维方法实施例三的主要步骤示意图。如图3所示,本实施例的智能运维方法包括步骤C10-C50:
步骤C10,获取目标系统中状态参数的值。
步骤C20,根据状态参数的值判断是否满足预设的告警条件。
其中,预设的告警条件与上面实施例一中相同,此处不再赘述。
步骤C30,若满足预设的告警条件,则发出告警通知,并转至步骤C31,否则转至步骤C40。
步骤C31,根据告警前状态参数的变化情况,调整每个状态参数对应的提前警示阈值和/或每个状态参数组合对应的提前警示阈值组合。
步骤C32,根据告警前状态参数的变化情况,添加或删除状态参数组合,或者调整状态参数组合中参数的数量或种类。
步骤C33,根据告警前状态参数的变化情况,参照历史告警案例,判断故障原因。
把工程师处理历史告警案例时找到的故障结论和告警发生前的参数变化情况记录下来,并建立两者的对应关系,在以后发生告警的时候就可以由程序自动判断故障原因,为运维工程师迅速排除故障、恢复应用系统正常运行提供有力支持。
步骤C40,若不满足预设的告警条件,则根据状态参数的值判断是否满足预设的提前警示条件。
其中,预设的提前警示条件的含义与上面实施例二中相同,此处不再赘述。
步骤C50,若满足预设的提前警示条件,则发出提前警示通知;否则转至步骤C10。
在一种可选的实施例中,针对上述实施例三中的步骤C31-C33,还可以根据实际需要只执行其中的一个或两个步骤。
上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。
基于上述智能运维方法,本发明还提供了一种计算机可读存储介质的实施例,该介质中存储有能够被处理器加载并执行上述基于关联分析的智能运维方法的计算机程序。
所述计算机可读存储介质例如包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案。但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种基于关联分析的智能运维方法,其特征在于,所述方法包括:
获取目标系统中状态参数的值;
根据所述状态参数的值判断是否满足预设的告警条件;
若满足所述预设的告警条件,则发出告警通知。
2.根据权利要求1所述的基于关联分析的智能运维方法,其特征在于,
所述状态参数为一个或多个,且两个或两个以上的所述状态参数构成状态参数组合;
所述状态参数组合为一个或多个。
3.根据权利要求2所述的基于关联分析的智能运维方法,其特征在于,所述预设的告警条件包括:任意一个所述状态参数的值超过该状态参数对应的告警阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的告警阈值组合中相应参数的阈值。
4.根据权利要求3所述的基于关联分析的智能运维方法,其特征在于,所述方法还包括:
若不满足所述预设的告警条件,则根据所述状态参数的值判断是否满足预设的提前警示条件;
若满足,则发出提前警示通知;否则,重复执行获取所述状态参数的值并进行判断的步骤。
5.根据权利要求4所述的基于关联分析的智能运维方法,其特征在于,所述预设的提前警示条件包括:任意一个所述状态参数的值超过该状态参数对应的提前警示阈值,或者,任意一个状态参数组合中每个参数的值均超过对应的提前警示阈值组合中相应参数的阈值。
6.根据权利要求5所述的基于关联分析的智能运维方法,其特征在于,所述方法还包括:
根据告警前所述状态参数的变化情况,调整每个所述状态参数对应的提前警示阈值和/或每个所述状态参数组合对应的提前警示阈值组合。
7.根据权利要求5所述的基于关联分析的智能运维方法,其特征在于,所述方法还包括:
根据告警前所述状态参数的变化情况,添加或删除所述状态参数组合,或者调整所述状态参数组合中参数的数量或种类。
8.根据权利要求5所述的基于关联分析的智能运维方法,其特征在于,所述方法还包括:根据告警前所述状态参数的变化情况,参照历史告警案例,判断故障原因。
9.根据权利要求1-8中任一项所述的基于关联分析的智能运维方法,其特征在于,所述状态参数包括:内存占用率、磁盘占用率、CPU占用率和网速。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至9中任一种基于关联分析的智能运维方法的计算机程序。
CN202210401241.1A 2022-04-15 2022-04-15 基于关联分析的智能运维方法和计算机可读存储介质 Pending CN114826881A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210401241.1A CN114826881A (zh) 2022-04-15 2022-04-15 基于关联分析的智能运维方法和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210401241.1A CN114826881A (zh) 2022-04-15 2022-04-15 基于关联分析的智能运维方法和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114826881A true CN114826881A (zh) 2022-07-29

Family

ID=82536818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210401241.1A Pending CN114826881A (zh) 2022-04-15 2022-04-15 基于关联分析的智能运维方法和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114826881A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115213907A (zh) * 2022-08-05 2022-10-21 上海控创信息技术股份有限公司 基于边缘计算的运维机器人作业方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118276A (zh) * 2009-12-31 2011-07-06 北京亿阳信通软件研究院有限公司 提供性能告警服务的方法和装置
CN102970165A (zh) * 2012-11-20 2013-03-13 北京思特奇信息技术股份有限公司 一种网络设备联合分析告警系统
CN108964976A (zh) * 2018-05-31 2018-12-07 华为技术有限公司 一种基于光模块的告警提示方法及告警提示装置
CN109560956A (zh) * 2017-09-27 2019-04-02 中兴通讯股份有限公司 一种业务告警方法、装置及存储介质
CN111784537A (zh) * 2020-06-30 2020-10-16 国网信息通信产业集团有限公司 一种配电网状态参数监测方法、装置及电子设备
CN112416703A (zh) * 2020-11-06 2021-02-26 北京浪潮数据技术有限公司 云管理平台中sds状态检测方法、系统、装置及存储介质
CN112491593A (zh) * 2020-11-12 2021-03-12 中国联合网络通信集团有限公司 网元告警处理方法和装置
CN112702184A (zh) * 2019-10-23 2021-04-23 中国电信股份有限公司 故障预警方法及装置、计算机可存储介质
CN114116828A (zh) * 2020-08-31 2022-03-01 中兴通讯股份有限公司 多维网络指标的关联规则分析方法、设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118276A (zh) * 2009-12-31 2011-07-06 北京亿阳信通软件研究院有限公司 提供性能告警服务的方法和装置
CN102970165A (zh) * 2012-11-20 2013-03-13 北京思特奇信息技术股份有限公司 一种网络设备联合分析告警系统
CN109560956A (zh) * 2017-09-27 2019-04-02 中兴通讯股份有限公司 一种业务告警方法、装置及存储介质
CN108964976A (zh) * 2018-05-31 2018-12-07 华为技术有限公司 一种基于光模块的告警提示方法及告警提示装置
CN112702184A (zh) * 2019-10-23 2021-04-23 中国电信股份有限公司 故障预警方法及装置、计算机可存储介质
CN111784537A (zh) * 2020-06-30 2020-10-16 国网信息通信产业集团有限公司 一种配电网状态参数监测方法、装置及电子设备
CN114116828A (zh) * 2020-08-31 2022-03-01 中兴通讯股份有限公司 多维网络指标的关联规则分析方法、设备和存储介质
CN112416703A (zh) * 2020-11-06 2021-02-26 北京浪潮数据技术有限公司 云管理平台中sds状态检测方法、系统、装置及存储介质
CN112491593A (zh) * 2020-11-12 2021-03-12 中国联合网络通信集团有限公司 网元告警处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115213907A (zh) * 2022-08-05 2022-10-21 上海控创信息技术股份有限公司 基于边缘计算的运维机器人作业方法及系统

Similar Documents

Publication Publication Date Title
CN106776099B (zh) 一种服务熔断隔离系统和方法
CN107508831B (zh) 一种基于总线的入侵检测方法
CN104750596B (zh) 一种告警信息处理方法及服务子系统
CN114826881A (zh) 基于关联分析的智能运维方法和计算机可读存储介质
DE102013002593A1 (de) Sicherheitsüberwachungssystem und Sicherheitsüberwachungsverfahren
CN110677480B (zh) 一种节点健康管理方法、装置和计算机可读存储介质
CN114363044B (zh) 一种分层告警方法、系统、存储介质和终端
CN112346924A (zh) 一种服务器监控方法与系统
CN102694678A (zh) 告警消息传输方法及系统、网管服务器和网元设备
JP2008191839A (ja) 異常兆候検出システム
CN112511456A (zh) 流量控制方法、装置、设备、存储介质和计算机程序产品
CN111464359A (zh) 异常流量告警决策系统及方法
US9674065B2 (en) Method, apparatus and system for detecting network element load imbalance
CN110730087A (zh) 一种告警风暴的处理方法及装置
CN115766068A (zh) 一种网络安全事件等级分类方法、装置、设备、介质
CN116106618A (zh) 用电设备的告警方法、装置及物联网告警系统
US20170206125A1 (en) Monitoring system, monitoring device, and monitoring program
CN109309577A (zh) 用于sdn网络的告警处理方法、装置及系统
WO2018035765A1 (zh) 网络异常的检测方法及装置
US9264338B1 (en) Detecting upset conditions in application instances
CN108234152B (zh) 远程接口调用的网络监控的方法和系统
CN110348585B (zh) 一种电网监控信息基础事件生成及更新方法
CN112839029B (zh) 一种僵尸网络活跃度的分析方法与系统
CN104579836A (zh) 一种通过收发trap数据包监控存储服务器状态的方法
CN112636946A (zh) 边缘主节点选举方法和电力工控终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220729