CN105512788A - 一种智能运维管理方法及系统 - Google Patents

一种智能运维管理方法及系统 Download PDF

Info

Publication number
CN105512788A
CN105512788A CN201510221895.6A CN201510221895A CN105512788A CN 105512788 A CN105512788 A CN 105512788A CN 201510221895 A CN201510221895 A CN 201510221895A CN 105512788 A CN105512788 A CN 105512788A
Authority
CN
China
Prior art keywords
management
management object
intelligent operation
disposal
disposal strategies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510221895.6A
Other languages
English (en)
Inventor
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BETA SOFTWARE CO Ltd
Original Assignee
SHANGHAI BETA SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BETA SOFTWARE CO Ltd filed Critical SHANGHAI BETA SOFTWARE CO Ltd
Priority to CN201510221895.6A priority Critical patent/CN105512788A/zh
Publication of CN105512788A publication Critical patent/CN105512788A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种智能运维管理方法,通过根据管理场景设置处置策略,为需要策略的管理场景设置处置策略;根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略,根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界,将智维规则与处置策略关联起来,再根据智维规则来进行运维管理,并进行采集与越界判断;若发现有越界则根据其关联的处置策略进行处理,在为管理对象设置智维规则时可以指定一旦指标越界能关联触发的处置策略,该处置策略触发后承担了原来需要人工处理的所有事情,大大提高了管理效率、减轻了管理负担。

Description

一种智能运维管理方法及系统
技术领域
本发明涉及运维管理领域,尤其涉及一种智能运维管理方法及系统。
背景技术
随着信息化建设的深入发展,IT系统日益成为核心业务处理的关键基础设施;为了保证网络、服务器、数据库等IT资源的正常运行,需要对其进行维护;当系统出现异常时能够及时产生告警并通知到运维人员,运维人员根据告警对异常进行定位,诊断,并完成相应的维护操作。
目前的运维管理方法是:一旦发现了指标越界,基本的做法是记录在案,指标偏离正常值未必是运行故障的表现,它大多数情况是代表了运行保障质量的下降,我们可以通过事后人工统计这些越界的频度、次数,来了解问题的发生源、严重程度,进行针对性处理。通过人工方式来分析问题往往效率低下,耗费了大量的时间,而且问题发现也不够及时。
针对人工分析的弊端,我们提出“智能策略”的概念,设置智维规则时可以指定一旦指标越界能关联触发的智能策略,该智能策略触发后承担了原来需要人工处理的所有事情,如数据分析统计等等,大大提高了管理效率、减轻了管理负担。
发明内容
鉴于目前运维管理领域存在的上述不足,本发明提供一种智能运维管理方法及系统,能够在异常时触发处置策略来替代人工进行处理,提高了运维管理效率。
为达到上述目的,本发明的实施例采用如下技术方案:
一种智能运维管理方法,所述智能运维管理方法包括以下步骤:
根据管理场景设置处置策略;
根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
若发现有越界则根据其关联的处置策略进行处理。
依照本发明的一个方面,所述根据场景设置处置策略的具体实施方式可为:首先筛选出需要设置处置策略的管理场景,然后根据管理场景中的管理对象分别设置不同的处置策略。
依照本发明的一个方面,所述根据管理对象设置智维规则时,需要根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。
依照本发明的一个方面,所述智维规则包括以下要素:管理等级、管理对象类别、管理对象范围、管理指标、监测密度和判断标准。
依照本发明的一个方面,所述若发现有越界则根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
依照本发明的一个方面,所述智能运维管理方法还包括以下步骤:在根据关联的处置策略进行处理后提示用户查看结果。
一种智能运维管理系统,所述智能运维管理系统包括:
策略模块,用于根据管理场景设置处置策略;
智维模块,用于根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
采集判断模块,用于根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
处理模块,用于在发现有越界时根据其关联的处置策略进行处理。
依照本发明的一个方面,所述根据管理对象设置智维规则时,需要根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。
依照本发明的一个方面,所述在发现有越界时根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
依照本发明的一个方面,所述智能运维管理系统还包括提示模块,用于在根据关联的处置策略进行处理后提示用户查看结果。
本发明实施的优点:本发明所述的智能运维管理方法通过根据管理场景设置处置策略,为需要策略的管理场景设置处置策略;根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略,根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界,将智维规则与处置策略关联起来,再根据智维规则来进行运维管理,并进行采集与越界判断;若发现有越界则根据其关联的处置策略进行处理,在为管理对象设置智维规则时可以指定一旦指标越界能关联触发的处置策略,该处置策略触发后承担了原来需要人工处理的所有事情,大大提高了管理效率、减轻了管理负担。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述的一种智能运维管理方法示意图;
图2为本发明所述的一种智能运维管理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种智能运维管理方法,所述智能运维管理方法包括以下步骤:
步骤S1:根据管理场景设置处置策略;
所述步骤S1根据管理场景设置处置策略的具体实施方式可为:首先筛选出需要设置处置策略的管理场景,然后根据管理场景中的管理对象分别设置不同的处置策略,如数据分析统计和问题查找并解决等等。
在实际应用中,首先提炼出需要进行智能运维管理的场景,将上述场景按照处置策略规范进行开发,然后将开发完成的处置策略加入到运维管理系统中。
步骤S2:根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
所述步骤S2根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略的具体实施方式可为:在为管理场景中的管理对象进行智维规则设置时,需要关联该管理随想所在管理场景的处置策略。例如,用户设置了某条智维规则:针对所有主机设置了针对“CPU使用率”指标进行监控,则可将其关联到“高负载进程定位策略”的处置策略。
在实际应用中,在根据管理对象设置智维规则时,可根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。例如,用户设置了某条智维规则:针对所有一级主机设置了针对“CPU使用率”指标进行监控。
在实际应用中,所述智维规则可包括以下要素:管理等级、管理对象类别、管理对象范围、管理指标、监测密度和判断标准。
在实际应用中,所述管理等级具体可为:规则适用的管理对象的等级,可以按照管理重要性设置为不同的等级,如“一级”,“二级”等等,同一管理对象仅可指定一个等级。
在实际应用中,所述管理对象类别具体可为:将具备相同特征的管理对象定义为一个类别,如“路由器”,“Windows”,“Oracle”等等,同一管理对象仅可指定一个类别。
在实际应用中,所述管理对象范围具体可为:针对管理对象类别,规则所适用的管理对象的范围,所述范围具体可以是某个网段,如“192.168.1.1-192.168.1.10”,也可以是某个类别下具体的某些管理对象。
在实际应用中,所述管理指标具体可为:监测的管理对象范围的指标,如“CPU使用率”,“磁盘使用率”等,仅可为每一个范围的管理对象指定一个指标。
在实际应用中,所述监测密度具体可为:监测的频度,如设置了监测密度为“1分钟”,那么就意味着如果指标出现异常,最多1分钟内就可以被发现。
在实际应用中,所述判断标准具体可为:指标异常(越界)的条件,如监测“CPU使用率”指标,判断标准可以设置为“大于90%”,也就是说当CPU使用率大于90%的条件下认为这个管理对象的这个指标可能出现了异常。
在实际应用中,所述管理指标、监测密度和判断标准可具体是根据管理等级、管理对象类别和管理对象范围来进行设置的。
步骤S3:根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
所述步骤S3根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界的具体实施方式可为:根据智维规则中的管理指标来对管理对象进行指定的管理指标采集,然后根据采集结果及预设管理规则中的判断标准来进行阈值对比,以判断该管理对象的相关管理指标是否发生越界,也就是异常。
在实际应用中,预设管理规则中的判断标准可为:将采集结果与固定阈值进行对比判断,以判断该管理对象的相关管理指标是否发生越界。例如,预设一判断标准为CPU的使用率大于90%就越界,则其中的90%就是固定阈值。
在实际应用中,业务管理的复杂性要远高于设备管理的复杂性,它的运维复杂性在于,它不是简单地表现为好坏、通断,而是更复杂地表现为可用性问题,可用性判断也是由一批关键指标构成的,但,指标的正常与否,不能简单地以固定阈值来比对,要结合真实情况的波动来判断。因而可设定一个基线,基线就是一段随时间起伏的动态“阈值”,它来源于正常状态下某指标的“历史表现”,加以调整后作为基准线,与以后同样时段的实时指标情况做对比,如果误差在许可范围内,那么,判断为正常,否则就是越界,越界次数多,会导致系统的可用性严重下降,极端情况下会导致系统不可正常使用。例如,某CPU前段时间的历史使用率在60%~80%,则可预设其基准线为80%,超过80%则可判断为越界。
在实际应用中,所述基线可分为日基线和周基线两种。
日基线:从该指标的历史记录中选择最近某几日的数据进行综合判断;
周基线:从该指标的历史记录中选择最近某几周的数据进行综合判断。
在实际应用中,对管理对象进行指定指标采集、阈值对比时,其采集对比的密度和频率是按照所述预设管理规则中的监测密度来进行的。
步骤S4:若发现有越界则根据其关联的处置策略进行处理;
所述步骤S4若发现有越界则根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
在实际应用中,在根据关联的处置策略进行处理后还可提示用户查看结果。
例如,用户设置了某条智维规则:针对一级的所有主机设置了针对“CPU使用率”指标进行监控,并且关联了“高负载进程定位策略”。
当“CPU使用率”指标越界时,触发策略的执行。
策略首先自动检测触发前N1小时内,该主机“CPU使用率”越界次数是否达到了N2次。
如果达到了N2次,那么系统会获取当前主机的所有进程,找出CPU使用最多的10个进程。
系统将CPU使用最多的10个进程显示给用户,这样用户很容易就能找出主机CPU使用率偏高的原因。
从而实现了替代人工进行检查,承担了原来需要人工处理的所有事情,大大提高了管理效率、减轻了管理负担。
本实施例所述的智能运维管理方法通过根据管理场景设置处置策略,为需要策略的管理场景设置处置策略;根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略,根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界,将智维规则与处置策略关联起来,再根据智维规则来进行运维管理,并进行采集与越界判断;若发现有越界则根据其关联的处置策略进行处理,在为管理对象设置智维规则时可以指定一旦指标越界能关联触发的处置策略,该处置策略触发后承担了原来需要人工处理的所有事情,大大提高了管理效率、减轻了管理负担。
一种智能运维管理系统实施例
如图2所示,一种智能运维管理系统,所述智能运维管理系统包括:
策略模块1,用于根据管理场景设置处置策略;
智维模块2,用于根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
采集判断模块3,用于根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
处理模块4,用于在发现有越界时根据其关联的处置策略进行处理。
在实际应用中,在根据管理对象设置智维规则时,可根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。
在实际应用中,在发现有越界时根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
在实际应用中,所述智能运维管理系统还包括提示模块5,用于在根据关联的处置策略进行处理后提示用户查看结果。
本发明实施的优点:本发明所述的智能运维管理方法通过根据管理场景设置处置策略,为需要策略的管理场景设置处置策略;根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略,根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界,将智维规则与处置策略关联起来,再根据智维规则来进行运维管理,并进行采集与越界判断;若发现有越界则根据其关联的处置策略进行处理,在为管理对象设置智维规则时可以指定一旦指标越界能关联触发的处置策略,该处置策略触发后承担了原来需要人工处理的所有事情,大大提高了管理效率、减轻了管理负担。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种智能运维管理方法其特征在于,所述智能运维管理方法包括以下步骤:
根据管理场景设置处置策略;
根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
若发现有越界则根据其关联的处置策略进行处理。
2.根据权利要求1所述的智能运维管理方法,其特征在于,所述根据场景设置处置策略的具体实施方式可为:首先筛选出需要设置处置策略的管理场景,然后根据管理场景中的管理对象分别设置不同的处置策略。
3.根据权利要求1所述的智能运维管理方法,其特征在于,所述根据管理对象设置智维规则时,需要根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。
4.根据权利要求3所述的智能运维管理方法,其特征在于,所述智维规则包括以下要素:管理等级、管理对象类别、管理对象范围、管理指标、监测密度和判断标准。
5.根据权利要求1至4之一所述的智能运维管理方法,其特征在于,所述若发现有越界则根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
6.根据权利要求5所述的智能运维管理方法,其特征在于,所述智能运维管理方法还包括以下步骤:在根据关联的处置策略进行处理后提示用户查看结果。
7.一种智能运维管理系统,其特征在于,所述智能运维管理系统包括:
策略模块,用于根据管理场景设置处置策略;
智维模块,用于根据管理对象设置智维规则并关联管理对象所在管理场景的处置策略;
采集判断模块,用于根据智维规则对管理对象进行指定指标的采集和阈值对比判断是否有越界;
处理模块,用于在发现有越界时根据其关联的处置策略进行处理。
8.根据权利要求7所述的智能运维管理系统,其特征在于,所述根据管理对象设置智维规则时,需要根据管理对象的重要程度将管理对象分为不同的等级,再根据管理需求为不同等级的管理对象设置智维规则。
9.根据权利要求8所述的智能运维管理系统,其特征在于,所述在发现有越界时根据其关联的处置策略进行处理的具体实施方式可为:若发现有越界,则对其所对应的管理对象根据其关联的处置策略进行数据分析和联动处置。
10.根据权利要求7至9之一所述的智能运维管理系统,其特征在于,所述智能运维管理系统还包括提示模块,用于在根据关联的处置策略进行处理后提示用户查看结果。
CN201510221895.6A 2015-05-04 2015-05-04 一种智能运维管理方法及系统 Pending CN105512788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510221895.6A CN105512788A (zh) 2015-05-04 2015-05-04 一种智能运维管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510221895.6A CN105512788A (zh) 2015-05-04 2015-05-04 一种智能运维管理方法及系统

Publications (1)

Publication Number Publication Date
CN105512788A true CN105512788A (zh) 2016-04-20

Family

ID=55720750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510221895.6A Pending CN105512788A (zh) 2015-05-04 2015-05-04 一种智能运维管理方法及系统

Country Status (1)

Country Link
CN (1) CN105512788A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595625A (zh) * 2018-04-23 2018-09-28 平安科技(深圳)有限公司 Bi工具的运维方法、装置、计算机装置及存储介质
WO2018201867A1 (zh) * 2017-05-04 2018-11-08 平安科技(深圳)有限公司 一种任务提醒方法、装置、服务器及介质
CN109523034A (zh) * 2018-09-25 2019-03-26 中国船舶重工集团公司第七〇九研究所 船海数值平台运维系统及运维方法
CN110209558A (zh) * 2019-04-10 2019-09-06 星辰天合(北京)数据科技有限公司 基于软件定义存储的智能运维方法和装置
CN111861062A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 用户指标管理方法、装置、服务器及计算机可读存储介质
CN112055364A (zh) * 2019-06-06 2020-12-08 华为技术有限公司 一种网络系统分级方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103812699A (zh) * 2014-02-17 2014-05-21 无锡华云数据技术服务有限公司 基于云计算的监控管理系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201867A1 (zh) * 2017-05-04 2018-11-08 平安科技(深圳)有限公司 一种任务提醒方法、装置、服务器及介质
CN108595625A (zh) * 2018-04-23 2018-09-28 平安科技(深圳)有限公司 Bi工具的运维方法、装置、计算机装置及存储介质
CN109523034A (zh) * 2018-09-25 2019-03-26 中国船舶重工集团公司第七〇九研究所 船海数值平台运维系统及运维方法
CN109523034B (zh) * 2018-09-25 2020-08-11 中国船舶重工集团公司第七一九研究所 船海数值平台运维系统及运维方法
CN110209558A (zh) * 2019-04-10 2019-09-06 星辰天合(北京)数据科技有限公司 基于软件定义存储的智能运维方法和装置
CN111861062A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 用户指标管理方法、装置、服务器及计算机可读存储介质
CN111861062B (zh) * 2019-04-30 2023-09-26 北京嘀嘀无限科技发展有限公司 用户指标管理方法、装置、服务器及计算机可读存储介质
CN112055364A (zh) * 2019-06-06 2020-12-08 华为技术有限公司 一种网络系统分级方法及装置

Similar Documents

Publication Publication Date Title
CN105512788A (zh) 一种智能运维管理方法及系统
US11212208B2 (en) Adaptive metric collection, storage, and alert thresholds
CN111126824B (zh) 多指标关联模型训练方法及多指标异常分析方法
US10229162B2 (en) Complex event processing (CEP) based system for handling performance issues of a CEP system and corresponding method
CN110661659A (zh) 一种告警方法、装置、系统及电子设备
US9047183B2 (en) Systems and methods for detecting outages in a medical record exchange system
CN107104848B (zh) 信息技术系统监控方法及装置
CN109873853B (zh) 设备关键参数预警系统及其实现方法、电子装置
CN104021195B (zh) 基于知识库的告警关联分析方法
CN106202444A (zh) 一种数据库运维监控的实现方法
CN104052634B (zh) 信息安全监控系统及方法
CN109656786B (zh) 日志获取方法及装置
WO2021057382A1 (zh) 一种异常检测方法、装置、终端及存储介质
EP2723117A1 (en) Managed unit device, self-optimization method and system
CN105955662A (zh) 一种k-db数据表空间的扩容方法与系统
CN105471932A (zh) 一种前端应用的监控方法、设备和系统
CN113448805A (zh) 基于cpu动态阈值的监控方法、装置、设备及存储介质
JP6223594B2 (ja) 遠隔統合監視操作システム
US11146447B2 (en) Method and apparatus of establishing computer network monitoring criteria
CN103188103A (zh) 一种网管系统自监控方法
CN110363381B (zh) 一种信息处理方法和装置
CN105530118A (zh) 一种用于运维管理的采集方法及系统
CN104363129B (zh) 一种网络事件关联分析和动态预警方法
CN112749285A (zh) 一种基于知识图谱的资源预警方法、系统、设备及介质
CN105515817A (zh) 一种将管理对象进行等级化运维的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420