CN109560956A - 一种业务告警方法、装置及存储介质 - Google Patents

一种业务告警方法、装置及存储介质 Download PDF

Info

Publication number
CN109560956A
CN109560956A CN201710895964.0A CN201710895964A CN109560956A CN 109560956 A CN109560956 A CN 109560956A CN 201710895964 A CN201710895964 A CN 201710895964A CN 109560956 A CN109560956 A CN 109560956A
Authority
CN
China
Prior art keywords
alarm
multiple operational
warning strategies
numerical value
operational indicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710895964.0A
Other languages
English (en)
Inventor
王巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201710895964.0A priority Critical patent/CN109560956A/zh
Publication of CN109560956A publication Critical patent/CN109560956A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明实施例提供了一种业务告警方法、装置及存储介质。其中,该方法包括:依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,该多个业务指标分别对应业务的不同属性;在该多个业务指标的数值分别超过该多个业务指标对应的告警阈值的情况下,输出告警信息。通过上述方法,依据告警策略对业务的多个指标进行监测,只有当多个业务指标全部满足告警阈值的情况下才进行告警,从而更好地符合运维人员的告警需求,降低了误告警次数。

Description

一种业务告警方法、装置及存储介质
技术领域
本发明实施例涉及通信领域,特别涉及一种业务告警方法、装置及存储介质。
背景技术
随着通讯行业的不断发展,传统电信业务逐步饱和,移动互联网相关业务快速发展。与业务转型相适应,运营商的运维组织、目标和流程也必然会发生巨大的变革,以支撑和发展新的业务类型。
运维的重点之一是告警,这是运维人员第一时间发现故障的重要手段,传统的告警策略需要定制开发,无法满足现场各类复杂多变的告警策略诉求的快速落实,而伴随运营商业务发展,运维人员提出了越来越多且复杂的告警诉求,而且一般有告警诉求都是紧急迫切的,这日益增大了传统告警策略模式与用户诉求之间的矛盾。
传统告警是针对单一指标的,容易造成误告警,例如成功率告警,晚上业务量较低,假如某粒度只有2条消息,失败了1条,成功率就只有50%了,该场景运维人员并不需要被告警打扰。
发明内容
本发明实施例提供了一种业务告警方法、装置及存储介质,以解决现有技术中告警指标单一,误告警频繁的问题。
为解决上述问题,本发明实施例的技术方案实现如下:
一种业务告警方法,包括:
依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,所述多个业务指标分别对应业务的不同属性;
在所述多个业务指标的数值分别超过所述多个业务指标对应的告警阈值的情况下,输出告警信息。
进一步的,所述多个业务指标包括基础指标和/或组合指标。
进一步的,在所述多个业务指标包括组合指标的情况下,所述方法还包括:
依据预先设置的规则对多个基础指标进行组合,生成所述组合指标。
进一步的,所述组合方式包括布尔逻辑运算、度间比例、多粒度监控和/或维度分组。
进一步的,所述依据预先设置的告警策略获取当前周期内多个业务指标的数值包括:获取预先设置的告警策略;
根据所述告警策略中的生效时段确定当前生效的告警策略;
依据所述当前生效的告警策略获取告警所需的多个业务指标的数值。
本发明实施例还提供了一种业务告警装置,其特征在于,包括处理器、存储器,所述存储器中存储业务告警指令,所述处理器通过执行所述业务告警指令实现以下步骤:
依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,所述多个业务指标分别对应业务的不同属性;
在所述多个业务指标的数值分别超过所述多个业务指标对应的告警阈值的情况下,输出告警信息。
进一步的,所述多个业务指标包括基础指标和/或组合指标。
进一步的,在所述多个业务指标包括组合指标的情况下,所述处理器还用于:
依据预先设置的规则对多个基础指标进行组合,生成所述组合指标。
进一步的,所述处理器还用于:
获取预先设置的告警策略;
根据所述告警策略中的生效时段确定当前生效的告警策略;
依据所述当前生效的告警策略获取告警所需的多个业务指标的数值。
本发明实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。
通过上述方法,依据告警策略对业务的多个指标进行监测,只有当多个业务指标全部满足告警阈值的情况下才进行告警,从而更好地符合运维人员的告警需求,降低了误告警次数。
附图说明
图1是根据本发明实施例一的一种业务告警方法流程图;
图2是根据本发明实施例二的一种业务告警装置框图;
图3是根据本发明实施例三的一种业务告警系统框图;
图4是根据本发明实施例三的一种业务告警方法流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。需要说明的是,下列实施例中的方案在不产生冲突的情况下,方案可以任意组合。
实施例一
本发明实施例一提供了一种业务告警方法。图1是根据本发明实施例一的一种业务告警方法流程图,如图1所示,该方法包括以下步骤:
S102:依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,该多个业务指标分别对应业务的不同属性;
S104:在该多个业务指标的数值分别超过该多个业务指标对应的告警阈值的情况下,输出告警信息。
通过上述方法,依据告警策略对业务的多个指标进行监测,只有当多个业务指标全部满足告警阈值的情况下才进行告警,从而更好地符合运维人员的告警需求,降低了误告警次数。
进一步的,该多个业务指标包括基础指标和/或组合指标。
进一步的,在该多个业务指标包括组合指标的情况下,该方法还包括:依据预先设置的规则对多个基础指标进行组合,生成该组合指标。
进一步的,该组合方式包括布尔逻辑运算、度间比例、多粒度监控和/或维度分组。
基础指标:支持引入已有告警策略指标,例如:基于rest接口,定时查询某业务的业务量、成功量等指标,并提供基础指标的界面查询。
组合指标:支持界面编辑,将多个基础指标进行表达式灵活组装,形成新的组合指标;表达式支持加、减、乘、除、粒度间比例、多粒度监控、维度分组等;并支持对新增组合指标的命名和描述配置。
例子:
XX产品YY业务西南大区全局成功率(%)=filter(XX产品id&&YY业务id)sum(该局所有模块指标)group by(省份)having(省份=青海、西藏、新疆)。
上述组合指标含义说明:
从获取数据中,过滤(filter)出来XX产品的YY业务数据,因为业务被负载均衡到各个模块承担,把所有模块指标值求和(sum),得到该指标全局值;进一步在此基础上细分(group by)为各个省份维度,取(having)西南大区的相关省份出来。
通过该方式,可以基于现有基础指标组装出丰富且灵活多变的各类所需告警监控的更多指标。
进一步的,该依据预先设置的告警策略获取当前周期内多个业务指标的数值包括:获取预先设置的告警策略;根据该告警策略中的生效时段确定当前生效的告警策略;依据该当前生效的告警策略获取告警所需的多个业务指标的数值。
告警策略:支持界面编辑,基于基础指标和/或组合指标,进行阈值表达式、连续粒度、告警时段、告警名称、告警码、检测周期等配置,界面逻辑组装成操作员所需的各种各样的告警策略;并支持对告警、恢复、通知策略的命名和描述。例如:
1.配置告警信息:告警名称—2017年劳动节XX产品YY业务省份维度全局成功率(%)告警;告警码—12345;告警级别—重要;告警原因;附加信息
2.配置告警时段(2017-4-29 00:00:00~2017-5-1 23:59:59)、告警优先级
3.设置监测粒度:每5分钟
4.选择告警所需的业务指标:
XX产品YY业务省份维度全局业务量(组合指标1)>=10条
AND
XX产品YY业务省份维度全局成功率(%)(组合指标2)<95%
注:相当于把分散的各个单一基础指标和组合指标关联起来,形成网状,灵活组装,且能够避免传统单一指标告警在某些场景下无法应对的问题,例如本例中,凌晨全局业务量低于10条时,失败1条成功率就低于95%了,运维人员该场景下不希望告警,所以又组合了全局业务量指标>=10的条件,就快速实现了其诉求。
5.处置策略(告警/恢复/通知)。
实施例二
本发明实施例二提供了一种业务告警装置。图2是根据本发明实施例二的一种业务告警装置框图,如图2所示,该业务告警装置包括存储器22和处理器24,其中,该存储器中存储有业务告警指令,该处理器通过执行该业务告警指令以实现以下操作:依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,该多个业务指标分别对应业务的不同属性;在该多个业务指标的数值分别超过该多个业务指标对应的告警阈值的情况下,输出告警信息。
进一步的,该多个业务指标包括基础指标和/或组合指标。
进一步的,在该多个业务指标包括组合指标的情况下,该处理器还用于:依据预先设置的规则对多个基础指标进行组合,生成该组合指标。
进一步的,该处理器还用于:获取预先设置的告警策略;根据该告警策略中的生效时段确定当前生效的告警策略;依据该当前生效的告警策略获取告警所需的多个业务指标的数值。
实施例三
本发明实施例三提供了一种业务告警系统。图3是根据本发明实施例三的一种业务告警系统框图,如图3所示,该系统包含界面交互模块32、数据接口模块34、服务处理模块36。
本发明系统中的各模块含义如下:
界面交互模块32:为本系统与操作员之间提供界面交互功能,包括基础指标查询、组合指标和告警策略的查询和编辑、界面呈现告警等。
数据接口模块34:支持rest等接口引入已有告警基础指标;支持SNMP等接口输出告警等信息到网管系统。是整套系统的对外输入输出接口模块。
服务处理模块36:获取并解析界面交互模块的配置,定期发起基础指标获取请求,按组合指标配置进行表达式计算,按告警策略配置进行逻辑和条件组装,最终判断是否触发告警等。
本发明实施例三还提供了一种业务告警方法。图4是根据本发明实施例三的一种业务告警方法流程图,如图4所示,该方法的主要步骤包括:
步骤S401,服务处理模块根据运维用户在界面交互模块的粒度配置,定期通过数据接口模块34向第三方系统发起基础指标获取请求;
步骤S402,服务处理模块36通过数据接口模块34获取到数据,并解析出各个基础指标;
步骤S403,服务处理模块36根据组合指标配置,将相关基础指标代入表达式计算,得到组合指标值;
步骤S404,服务处理模块36根据告警策略,将相关基础指标和组合指标值代入逻辑和条件计算,得到告警策略值;
步骤S405,服务处理模块36判断告警策略值若超过阈值,向界面交互模块32和数据接口模块34发出告警,界面交互模块32将告警呈现给运维人员,数据接口模块34向网管系统发出告警;若告警策略值低于阈值,不做动作。
实施例四
这里结合具体应用场景对本发明实施例进行说明。
第一步,为数据源进行告警策略分组
S401,根据配置的定时任务,启动定时任务。
S402,查询已经配置的告警策略集合。
S403,根据告警策略中的生效时段,筛选出当前生效的告警策略。
S404,将告警策略按数据源分组。
S405,依次遍历这些数据源,处理各数据源下的告警策略。
第二步,针对某一具体数据源进行告警处理
S411,开始处理一个数据源。
S412,从已经按数据源分组的告警策略中,根据当前处理的数据源名称,取出对应的告警策略列表。
S413,根据策略中的条件依赖的数据时间粒度个数,计算时间窗口(一个固定的时间跨度)。
S414,时间窗口加上容错时间范围(业务数据可能存在延迟入库的情况)作为查询业务数据的时间范围,通过数据接口模块查询业务数据。
S415,遍历处理告警策略,依次判断各策略是否满足告警条件。
S416,处理当前数据源结束,循环处理下一个数据源。
第三步,告警处理流程
S421,开始处理一个告警策略。
S422,取该告警策略下的所有告警条件。
S423,根据这些条件依赖的数据时间粒度个数,计算该策略以当前时间作为结束时间的时间窗口。
S424,判断时间窗口内的业务数据粒度是否足够用于告警策略条件判断。如果数据粒度不足,转到S425;数据粒度足够,转到S427。
S425,判断时间窗口是否已经到达业务数据的时间范围顶端。已经到达顶端,表明业务数据粒度个数都不满足告警条件,转到S428;否则转到S426。
S426,将时间窗口向前移动一个时间粒度。
S427,判断当前时间窗口内的业务数据是否满足告警条件。满足告警条件转到S429;否则转到S428。
S428,业务数据不满足告警条件,不发送告警(或恢复)消息。然后循环处理下一个告警策略。
S429,业务数据满足告警条件,发送告警(或恢复)消息。然后循环处理下一个告警策略。
以上仅为本发明的优选实施案例,且该流程为配合本发明的描述之用,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种业务告警方法,其特征在于,包括:
依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,所述多个业务指标分别对应业务的不同属性;
在所述多个业务指标的数值分别超过所述多个业务指标对应的告警阈值的情况下,输出告警信息。
2.如权利要求1所述的方法,其特征在于,所述多个业务指标包括基础指标和/或组合指标。
3.如权利要求2所述的方法,其特征在于,在所述多个业务指标包括组合指标的情况下,所述方法还包括:
依据预先设置的规则对多个基础指标进行组合,生成所述组合指标。
4.如权利要求3所述的方法,其特征在于,所述组合方式包括布尔逻辑运算、度间比例、多粒度监控和/或维度分组。
5.如权利要求1所述的方法,其特征在于,所述依据预先设置的告警策略获取当前周期内多个业务指标的数值包括:
获取预先设置的告警策略;
根据所述告警策略中的生效时段确定当前生效的告警策略;
依据所述当前生效的告警策略获取告警所需的多个业务指标的数值。
6.一种业务告警装置,其特征在于,包括处理器、存储器,所述存储器中存储业务告警指令,所述处理器通过执行所述业务告警指令实现以下步骤:
依据预先设置的告警策略获取当前周期内多个业务指标的数值,其中,所述多个业务指标分别对应业务的不同属性;
在所述多个业务指标的数值分别超过所述多个业务指标对应的告警阈值的情况下,输出告警信息。
7.如权利要求6所述的装置,其特征在于,所述多个业务指标包括基础指标和/或组合指标。
8.如权利要求6所述的装置,其特征在于,在所述多个业务指标包括组合指标的情况下,所述处理器还用于:
依据预先设置的规则对多个基础指标进行组合,生成所述组合指标。
9.如权利要求6所述的装置,其特征在于,所述处理器还用于:
获取预先设置的告警策略;
根据所述告警策略中的生效时段确定当前生效的告警策略;
依据所述当前生效的告警策略获取告警所需的多个业务指标的数值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,使得所述处理器执行权利要求1至5中任一项所述方法的步骤。
CN201710895964.0A 2017-09-27 2017-09-27 一种业务告警方法、装置及存储介质 Pending CN109560956A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710895964.0A CN109560956A (zh) 2017-09-27 2017-09-27 一种业务告警方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710895964.0A CN109560956A (zh) 2017-09-27 2017-09-27 一种业务告警方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN109560956A true CN109560956A (zh) 2019-04-02

Family

ID=65864289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710895964.0A Pending CN109560956A (zh) 2017-09-27 2017-09-27 一种业务告警方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109560956A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111865689A (zh) * 2020-07-20 2020-10-30 南京信息职业技术学院 一种基于指标集树的告警压降方法
CN111930704A (zh) * 2020-09-29 2020-11-13 北京每日优鲜电子商务有限公司 业务报警设备控制方法、装置、设备和计算机可读介质
CN114826881A (zh) * 2022-04-15 2022-07-29 北京科杰科技有限公司 基于关联分析的智能运维方法和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130290783A1 (en) * 2012-04-27 2013-10-31 General Instrument Corporation Estimating a Severity Level of a Network Fault
CN104361713A (zh) * 2014-10-13 2015-02-18 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
US20160105462A1 (en) * 2008-12-16 2016-04-14 At&T Intellectual Property I, L.P. Systems and Methods for Rule-Based Anomaly Detection on IP Network Flow
CN105873107A (zh) * 2016-05-12 2016-08-17 西安汇龙科技股份有限公司 一种基于omc的网络性能告警的方法及装置
US20170163503A1 (en) * 2015-12-03 2017-06-08 Pearson Education, Inc. Systems and methods of alert generation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160105462A1 (en) * 2008-12-16 2016-04-14 At&T Intellectual Property I, L.P. Systems and Methods for Rule-Based Anomaly Detection on IP Network Flow
US20130290783A1 (en) * 2012-04-27 2013-10-31 General Instrument Corporation Estimating a Severity Level of a Network Fault
CN104361713A (zh) * 2014-10-13 2015-02-18 北京国双科技有限公司 一种指标数据的监测方法、装置及服务器
US20170163503A1 (en) * 2015-12-03 2017-06-08 Pearson Education, Inc. Systems and methods of alert generation
CN105873107A (zh) * 2016-05-12 2016-08-17 西安汇龙科技股份有限公司 一种基于omc的网络性能告警的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111865689A (zh) * 2020-07-20 2020-10-30 南京信息职业技术学院 一种基于指标集树的告警压降方法
CN111865689B (zh) * 2020-07-20 2022-04-08 南京信息职业技术学院 一种基于指标集树的告警压降方法
CN111930704A (zh) * 2020-09-29 2020-11-13 北京每日优鲜电子商务有限公司 业务报警设备控制方法、装置、设备和计算机可读介质
CN114826881A (zh) * 2022-04-15 2022-07-29 北京科杰科技有限公司 基于关联分析的智能运维方法和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN104125087B (zh) 一种告警信息处理方法及装置
US9258195B1 (en) Logical topology visualization
CN109560956A (zh) 一种业务告警方法、装置及存储介质
CN106789138B (zh) 一种网络告警关联分析的方法及装置
CN102820993A (zh) 网络资源监控系统和网络资源监控方法
CN106487467B (zh) 一种时间同步偏差检测方法和装置
CN103840975B (zh) 一种光纤系统的管理方法及装置
CN103036736A (zh) 一种基于数据源的组态化设备监控系统及方法
WO2016000576A1 (zh) 一种网络接口信令监测的信息处理方法及装置
CN101729294A (zh) 基于web gis拓扑地图的监控方法及系统
CN104065496A (zh) 网络拓扑图的生成方法及装置
CN104394011A (zh) 一种通过告警信息支持服务器虚拟化运维的方法
CN109688018A (zh) 一种基于设备异常的告警消息推送方法及系统
CN105871581A (zh) 云计算中报警信息的处理方法及装置
CN106656568A (zh) 一种告警同步拓扑显示的方法及装置
CN107094086A (zh) 一种信息获取方法和装置
CN113433882A (zh) 一种站房智能辅助与人工智能可视化网关控制方法及系统
CN103763127A (zh) 一种设备状态告警监控方法及系统
CN105071970B (zh) 故障分析方法和系统以及网管设备
CN104166941B (zh) 一种用于电网潮流图的告警信息可视化方法及其系统
CN104753712A (zh) 一种告警上报方法、告警上报节点及告警上报系统
CN102131205A (zh) 多模系统中的网络管理方法及系统
CN101917284B (zh) 基于omg corba北向接口的告警方法、网络设备及系统
CN105071986B (zh) 一种监控系统运行状态的方法
CN102769495B (zh) 一种光纤接入网设备通信方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190402