CN112200397A - 一种业务监测预警实现方法 - Google Patents

一种业务监测预警实现方法 Download PDF

Info

Publication number
CN112200397A
CN112200397A CN201910610275.XA CN201910610275A CN112200397A CN 112200397 A CN112200397 A CN 112200397A CN 201910610275 A CN201910610275 A CN 201910610275A CN 112200397 A CN112200397 A CN 112200397A
Authority
CN
China
Prior art keywords
transaction
service
duration
data
current window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910610275.XA
Other languages
English (en)
Other versions
CN112200397B (zh
Inventor
张伟锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Henan Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Henan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Henan Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910610275.XA priority Critical patent/CN112200397B/zh
Publication of CN112200397A publication Critical patent/CN112200397A/zh
Application granted granted Critical
Publication of CN112200397B publication Critical patent/CN112200397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种业务监测预警实现方法,属于通信技术领域。相对现有技术中业务监控中窗口时长统一,本发明提供的业务监测预警实现方法,建立业务类型与窗口时长的映射关系,根据业务数据判断其对应的业务类型后确定业务数据的当前窗口时长,以及监控模式,从而对于不同类型的业务数据采用不同的当前窗口时长和监控模式,以此可以更加准确、实时地计算各不同类型的业务数据在当前窗口时长内的指标异动级别和次数,以更准确、实时地确定业务数据的健康度。

Description

一种业务监测预警实现方法
技术领域
本发明涉及通信领域,尤其涉及一种业务监测预警实现方法。
背景技术
中国移动业务支撑网运营管理系统(简称BOMC),用于实现业务运行质量和全网运维情况的评估分析。BOMC现有的业务监测预警实现方法,业务的窗口时长统一。
由于业务运行的多样性,业务监控指标与业务运行异常的关联关系差异性大,现有的业务监测预警实现方法中业务时长无周期性变化远不能满足业务监控告警的实时性和准确性要求,无法真实的反映业务运行的健康状况,导致业务运行异常监控往往滞后于地市客户的报障。
因此,亟待一种能够实时且准确地反应业务运行状况的业务监测预警实现方法。
发明内容
为了解决上述问题,本发明提供一种业务监测预警实现方法。
第一方面,判断业务数据的业务类型,依据业务类型与窗口时长的映射关系,获得所述业务数据的当前窗口时长,以及监控模式;
基于所述监控模式,计算所述业务数据在当前窗口时长内的至少一个指标的异动级别和次数;
累积所述业务数据在所有所述指标的异动级别和次数,确定所述业务数据的健康度。
上述的方法,所述获得所述业务数据的当前窗口时长,以及监控模式,包括:
当所述当前窗口时长小于时长阈值时,所述业务数据对应第一监控模式;
当所述当前窗口时长超过时长阈值时,所述业务数据对应第二监控模式。
上述的方法,
所述指标包括:交易时长、系统失败率、业务规则失败率和交易量中至少之一;
所述第一监控模式包括:分别基于各所述指标的偏离程度和偏离次数与异动级别和异动次数的第一映射关系,按第一周期分别判断所述业务数据在所述当前窗口时长内的各所述指标的异动级别和异动次数;
所述第二监控模式包括:
分别基于各所述指标的偏离程度和偏离次数与异动级别和异动次数的第二映射关系,按第二周期分别判断所述业务数据在所述当前窗口时长内的的最后环节中交易时长、系统失败率或业务规则失败率是否存在异动,若存在异动则记录异动级别和次数,否则,分别取所述业务数据在所述当前窗口时长内的所有非最后环节中的交易时长、系统失败率或业务规则失败率的最高异动级别作为所述业务数据在当前窗口时长内的最后环节中的异动级别和次数;
和/或按第二周期判断所述业务数据在所述当前窗口时长内的所有环节的交易量的异动级别和次数。
上述的方法,
在所述第一监控模式中,所述当前窗口时长以第一周期向前滑动,所述当前窗口时长大于所述第一周期;
在所述第二监控模式中,所述当前窗口时长以第二周期向前滑动,所述当前窗口时长大于所述第二周期;
所述第一周期等于或不等于所述第二周期。
上述的方法,所述业务类型与窗口时长的映射关系,包括:
设置至少两个时长选项;
读取所述业务类型的历史数据;
从所述至少两个时长选项中选择目标时长作为所述业务类型的窗口时长,所述历史数据在所述目标时长内的交易量平均值超过预设值,且所述目标时长为至少两个时长选项中能够满足所述历史数据在各所述时长选项内的交易量平均值超过所述预设值的最小值。
上述的方法,所述业务类型与窗口时长的映射关系,还包括:
当所述业务类型的窗口时长为所述至少两个时长选项的最小值时,依据所述业务类型的历史数据,判断所述业务类型是否具有敏感期;
若在所述敏感期内,调整所述窗口时长,以使所述业务类型在敏感期的窗口时长内的交易量超过所述预设值。
上述的方法,所述累积所述业务数据在所有所述指标的异动级别和次数,确定所述业务数据的健康度中:
所述异动级别包括:无异动、一般异动、重要异动和严重异动;
对应的,所述健康度包括:健康、良好、一般和不健康;
所述业务监测预警实现方法还包括:
依据所述健康度与预警对应关系,输出相应预警。
第二方面,本发明提供一种业务管理系统,包括数据采集器、服务器和显示器;所述数据采集器采集业务数据;
所述服务器包括第一端口、存储器和处理器;
所述第一端口用于接收业务数据;
所述处理器依据所述业务数据,计算所述业务数据的异动级别和次数,以及所述业务健康度;
存储器存储所述业务数据,以及所述业务数据的异动级别信息、异动次数信息和健康度信息;
所述显示器显示所述异动级别信息、异动次数信息和健康度信息。
第三方面,本发明提供一种设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的方法的步骤。
相对现有技术中业务监控中窗口时长统一,本发明提供的业务监测预警实现方法,建立业务类型与窗口时长的映射关系,根据业务数据判断其对应的业务类型后确定业务数据的当前窗口时长,以及监控模式,从而对于不同类型的业务数据采用不同的当前窗口时长和监控模式,以此可以更加准确、实时地计算各不同类型的业务数据在当前窗口时长内的指标异动级别和次数,以更准确、实时地确定业务数据的健康度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为现有技术中固定阈值监控计算模式;
图2为现有技术中动态阈值监控计算模式;
图3为本发明一示范性实施例中的业务监测预警实现方法的流程图;
图4为对各业务类型中业务数据的窗口时长匹配过程;
图5为在第一监控模式中业务规则失败异动流程图;
图6为在第二监控模式中对各业务类型的环境进行回溯的示意图;
图7为告警严重性升级模式示意图;
图8为健康度升级模式示意图;
图9为本发明一示范性实施例中的业务管理系统的模块图。
附图标记:
200-业务管理系统;210-数据采集器;220–服务器;230-显示器。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
BOMC现有的监控计算模型,主要针对单个指标进行监控和阈值告警,包括固定阈值监控计算模式和动态阈值监控计算模式。
如图1为现有技术中固定阈值监控计算模式,固定阈值监控计算模式中根据历史经验或专家建议设置固定的告警阈值,当实际指标值超过告警阈值时,判定为业务运行不正常,进行告警。
如图2为现有技术中动态阈值监控计算模式,动态阈值监控计算模式中根据业务指标的历史数据,利用算法模型计算出业务指标的动态基线,以及动态容忍度范围,当实际指标值+/-波动值超过动态容忍度时,判定为业务运行不正常,及时告警。
上述固定阈值监控计算模式和动态阈值监控计算模式,由于针对单个指标,且对业务的窗口没有变化,因此,无法准确、实时地实现对业务的监控。
图3为本发明一示范性实施例中的业务监测预警实现方法的流程图,包括S06,S08以及S10。在步骤S06之前,还包括S02和S04。
S02:建立业务类型与窗口时长的映射关系。业务类型包括但不限于:开户、销户、补卡、缴费、变更套餐、停机、余额转移等等。
S02中包括S021、S022、S023、S024和S025。
S021:设置至少两个时长选项。该时长选项可以是2min、5min、10min或20min等等。时长选项还可以是其他时间,不限于上述选项,例如可以是1min、7min等等。若某一业务类型对应的时长选项超过20min,则认为该业务类型监控的必要性较低。
S022:读取业务类型的历史数据。例如,历史数据可以是该业务类型的最近3个月,每天从07点到23点之间的1分钟汇总数据,当然也可以最近2个月或4个月的数据。
S023:从至少两个时长选项中选择目标时长作为业务类型的窗口时长,历史数据在目标时长内的交易量平均值超过预设值,且目标时长为至少两个时长选项中能够满足历史数据在各时长选项内的交易量平均值超过预设值的最小值。
该预设值确保业务类型在窗口时长内有足够的交易量,以使得窗口时长内对该业务类型的监控具有监控价值。需要说明的是,S022中读取的历史数据可以是最近3个月的历史数据,而S023中的历史数据可以是基于最近1个月的历史数据。预设值可以5笔,也可以依实际情况设置为4笔、6笔等等。历史数据在目标时长内的交易量平均值超过5笔,且该目标时长应该是至少两个时长选项中能够满足历史数据在目标时长内的交易量平均值超过5笔的最小值,例如,历史数据在一个时长选项2min内的交易量平均值超过5笔,在一个时长选项5min内的交易量平均值也超过5笔,在一个时长选项10min内的交易量平均值也超过5笔,则选择最小的时长选项2min作为目标时长,以使得监控更具有意义。
具体的,参图4为对各业务类型中业务数据的窗口时长匹配过程,基于最近1个月的历史数据计算2min平均交易量,如超过5笔,则该业务类型的窗口时长确定为2min,且终止对该业务类型的窗口时长的确定;否则,继续基于最近1个月的历史数据计算5min平均交易量,如超过5笔,则该业务类型的窗口时长确定为5min,且终止对该业务类型的窗口时长的确定;否则,继续基于最近1个月的历史数据计算10min、15min、20min的平均交易量,以确定业务类型的窗口时长。若该业务类型在20min内的平均交易量小于5笔,则认为该业务类型的监控价值较低,可以放弃对该业务类型的监控。
S024:当业务类型的窗口时长为至少两个时长选项的最小值时,依据业务类型的历史数据,判断业务类型是否具有敏感期。
如时长选择中的最小值为2min,即业务类型的窗口时长为2min时,需要判断该业务类型是否具有敏感期,敏感期包括但不限于月初敏感、月末敏感、周末敏感、以及1天中的时间段敏感。
具体的,当业务类型的窗口时长为2min时,计算该业务类型最近3个月(或2个月、4个月等)的每月1-5日2min的平均交易量,与S023中2min的平均交易量对比,如上下偏差超过1倍,则标记该业务类型月初敏感。例如,最近3个月每月1-5日2min的平均交易量为13笔,S023中2min的平均交易量为6笔,则该业务类型月初敏感。
当业务类型的窗口时长为2min时,计算该业务类型最近3个月(或2个月、4个月等)的每月25-31日2min的平均交易量,与S023中2min的平均交易量对比,如上下偏差超过1倍,则标记该业务类型月末敏感。
当业务类型的窗口时长为2min时,计算该业务类型最近3个周末(或2个周末、4个周末等)的2min的平均交易量,与S023中2min的平均交易量对比,如上下偏差超过1倍,则标记该业务类型周末敏感。
当业务类型的窗口时长为2min时,计算该业务类型最近1天的每个时间段(如每个小时或每2个小时)中2min的平均交易量,与S023中2min的平均交易量对比,如上下偏差超过1倍,则标记该业务类型在这个时间段敏感。
此外,上述的上下偏差超过1倍认为敏感,实际中,上下偏差也可以是超过1.5倍或2倍等,认为是具有敏感期的。
S025:若在敏感期内,调整窗口时长,以使业务类型在敏感期的窗口时长内的交易量超过预设值。
可见,当业务类型的窗口时长为2min时,如果业务类型对月初敏感、月末敏感、或对周末敏感、或对一天中的时间段敏感,且在月初、月末、周末或一天中的若干个时间段的业务量小于5笔每2min,则调整该业务类型在敏感期的窗口时长。具体的,可以按上述S023选择业务类型在敏感期的窗口时长。依次,建立的业务类型与窗口时长的映射关系中,窗口时长不仅与业务类型相关,还与该业务类型是否具有敏感期以及是否在敏感期内相关。
S04:接收业务数据。该业务数据可以是单个业务类型的数据,也可以是交易数据按业务类型分类后得到的业务数据,或者是由多个地区的交易数据按业务类型分类后得到的业务数据,或者是从实厅、网厅、手机等多个渠道获得的交易数据也业务类型分类后的业务数据。
S06:判断业务数据的业务类型,依据业务类型与窗口时长的映射关系,获得业务数据的当前窗口时长,以及监控模式。
对业务数据进行特征分析,可以获得业务类型包括但不限于:开户、销户、补卡、缴费、变更套餐、停机、余额转移等等。
业务类型与窗口时长的映射关系参上述步骤S02。业务数据的窗口时长可能发生改变,参上述步骤S022和S023,基于历史数据可以确定各业务类型的窗口时长,但是,由于历史数据不断更新,使得各业务类型的交易量也会发生变化,因此,其窗口时长也会更新。此外,参上述S024和S025,即使是同一类型的数据也可能由于敏感期而发生窗口时长改变。
监控模式与窗口时长存在对应关系,因此,获得了业务数据的当前窗口时长,也就可以确定监控模式。具体的,在当前窗口时长小于时间阈值时,业务数据对应第一监控模式;在当前窗口时长超过时间阈值时,业务数据对应第二监控模式。其中,时间阈值可以是S021中时长选项中的位于两个选项之间的中间值,例如两个时长选项为2min和5min,则时长阈值可以为3min。因此,当业务类型的窗口时长为2min中,该业务类型的业务数据对应第一监控模式,而业务类型的窗口时长为5min、10min、15min、20min时,该业务类型的业务数据对应第二监控模式。
通过第一监控模式和第二监控模式的互补,在业务数据量较多或较少时,都可以提高业务监控的准确性。
S08:基于监控模式,计算业务数据在当前窗口时长内的至少一个指标的异动级别和次数。
其中,指标可以包括:交易时长、系统失败率、业务规则失败率和交易量中至少之一。当然,指标也可以包括交易时长、系统失败率、业务规则失败率和交易量中至少之二或之三,相对于现有技术中业务监控只针对单一指标,本申请业务监测预警实现方法中的指标包括交易时长、系统失败率、业务规则失败率和交易量中的至少两个,可以提高对业务数据监控的准确度。
第一监控模式包括:分别基于各指标的偏离程度和偏离次数与异动级别和异动次数的第一映射关系,按第一周期分别判断业务数据在当前窗口时长内的各指标的异动级别和异动次数。
其中,各指标的偏离程度和偏离次数与异动级别和异动次数的第一映射关系可以预先建立。具体的,下面介绍第一映射关系的建立过程。
对于交易时长的偏离程度与偏离次数与异动程度与异动次数的第一映射关系中,可以基于最近1个月的历史数据,计算出交易时长平均值。为了提高精确度,可以将历史数据中偏离平均值超过60%(或50%或70%)的毛刺数据剔除,然后再重新计算交易时长平均值。偏离平均值超过40%、60%、80%的交易时长分别对应一般异动、重要异动和严重异动;如果连续两次偏离,则取偏离程度较高的交易时长对应其异动,即如果连续两次偏离,异动次数记为一次。
对于系统失败率的偏离程度与偏离次数与异动程度与异动次数的第一映射关系中,可以基于最近1个月的历史数据计算系统失败率,以系统失败率超过1%、20%、50%分别对应一般异动、重要异动和严重异动;如果连续两次偏离,则取偏离程度较高的交易时长对应其异动,即如果连续两次偏离,异动次数记为一次。
对于业务规则失败率的偏离程度与偏离次数与异动程度与异动次数的第一映射关系中,可以基于最近1个月的历史数据,计算出业务规则失败率平均值,以在窗口时长内交易量超过5笔、业务规则失败率超过平均值,且失败率最高的业务规则比超过40%、60%、80%分别对应一般异动、重要异动和严重异动。
需要说明的是,判断业务规则失败异动时,参图5的业务规则失败异动流程图,包括:从历史库读取业务规则失败记录,计算当前时长窗口内的业务规则失败率是否超过设定的第一阈值(如三分之一或四分之一),如果超过,则对失败的业务规则按业务编码进行分类并计算失败率TOPN的排名,然后计算TOP1的失败量与总失败量的占比是否超过第二阈值(如二分之一),超过则提示业务规则失败率具有异动。例如,在当前时长窗口内,监测到变更套餐的业务中30项有20项失败,即超过设定的第一阈值,变更套餐失败的业务规则中因用户欠费的有12项,因套餐互斥的有8项,则TOP1的失败率12项,TOP2的失败率8项,TOP1的失败量占总失败量的占比超过二分之一,因此,用户欠费这个业务编码所在的业务规则失败率具有异动。
另外,如果业务规则失败率用于业务类型的最后一个环节,在TOP1失败量的业务规则中,进一步计算由同一号码引起的业务规则失败量与TOP1失败量的占比是否超过第三阈值,超过则异动消息包含业务号码,进一步精准定位业务规则失败异动原因。例如在最后一个环节,因业务规则失败,客户端由同一号码的用户连续点击19次,则需要将19次由同一号码引起的业务规则失败了进行归一化。
本申请中,通过对业务规则失败率的深度监控,可以解决业务规则设置错误的问题,提供准确的故障定位。
上述的第一阈值、第二阈值和第三阈值可以完全相等,也可以不完全相等。
对于交易量的偏离程度与偏离次数与异动程度与异动次数的第一映射关系中,可以基于最近1个月的历史数据,计算出每时刻的交易量平均值。为了提高精确度,可以将历史数据中偏离平均值超过60%(或50%或70%)的毛刺数据剔除,通过多项式算法计算出交易量动态基线,通过标准差算法计算出每时刻容忍度范围,以偏离容忍度范围超过40%、60%、80%的交易量分别对应一般异动、重要异动和严重异动。
此外,第一映射关系中,可以将两个一般异动等同于一个重要异动,将两个重要异动等同于一个严重异动。
在第一监控模式中,按第一周期判断各指标的异动级别和异动次数。具体的,第一监控模式中,当前窗口时长以第一周期向前滑动,当前窗口时长大于第一周期。第一周期可以为30s、45s或1min。
第二监控模式包括:分别基于各指标的偏离程度和偏离次数与异动级别和异动次数的第二映射关系,按第二周期分别判断业务数据在当前窗口时长内的的最后环节中交易时长、系统失败率或业务规则失败率是否存在异动,若存在异动则记录异动级别和次数,否则,分别取业务数据在当前窗口时长内的所有非最后环节中的交易时长、系统失败率或业务规则失败率的最高异动级别作为业务数据在当前窗口时长内的最后环节中的异动级别和次数;
和/或按第二周期判断业务数据在当前窗口时长内的所有环节的交易量的异动级别和次数。
第二映射关系适用于业务交易量较低的情况,例如窗口时长为5min、10min、15min或20min的业务类型中,而第一映射关系适用于业务交易量较高的情况,例如窗口时长为2min的业务类型中。具体的,如图6所示,在业务交易量较低时,可以采用对业务类型的环节进行回溯,以减少较低业务量下的异动遗漏。具体的,当业务交易量较低时,在业务类型的最后一个环节,若交易时长、系统失败率或业务规则失败率没有产生异动,则回溯查看该业务类型的所有交易环节,确定在第二周期内交易时长、系统失败率、业务规则失败率是否有异动且取异动级别最高的级别作为最后一个环节的交易时长、系统失败率或业务规则失败率的异动级别,以避免发生异动被遗漏的情况。当然,在业务交易量较高时(如窗口时长为2min时),也可以采用对业务类型的环节进行回溯。
其中,基于各指标的偏离程度和偏离次数与异动级别和异动次数的第二映射关系可以预先建立,其建立过程如下。
基于最近1个月的历史数据,在最后一个环节,计算当前窗口时长内的交易时长平均值,偏离平均值超过40%,60%,80%的交易时长分别对应一般异动、重要异动和严重异动:如果最后一个环节没有没有偏离,则回溯前面的所有环节,确定第二周期内所有环节的交易时长平均值是否存在偏离,如果非最后一个环节有偏离,则取最高级别的偏离作为最后一个环节本周期的交易时长异动,如果连续两次偏离,则取偏离程度较高的交易时长对应其异动,即如果连续两次偏离,异动次数记为一次。对于非最后一个环节的交易时长是否偏离的计算,首先计算当前窗口时长内交易时长平均值,偏离平均值超过40%、60%、80%的交易时长分别对应一般异动、重要异动和严重异动,如果连续两次偏离,则取偏离程度较高的交易时长对应其异动,即如果连续两次偏离,异动次数记为一次。
基于最近1个月的历史数据计算系统失败率,在最后一个环节,计算当前窗口时长内的系统失败率,以系统失败率超过1%、20%、50%分别对应一般异动、重要异动和严重异动;若最后一个环节没有偏离,则回溯前面的所有环节,确定第二周期内所有环节的系统失败率是否存在偏离,如果非最后一个环节有偏离,则取最高级别的偏离作为最后一个环节本周期的系统失败率异动,如果连续两次偏离,则取偏离程度较高的系统失败率对应其异动,即如果连续两次偏离,异动次数记为一次。对于非最后一个环节的系数失败率是否存在偏离的计算,以系统失败率超过1%、20%、50%分别对应一般异动、重要异动和严重异动,如果连续两次偏离,则取偏离程度较高的系统失败率对应其异动。
基于最近1个月的历史数据计算业务规则失败率,在最后一个环节,计算当前窗口时长内的业务规则失败率,以业务规则失败率超过1%、20%、50%分别对应一般异动、重要异动和严重异动;若最后一个环节没有偏离,则回溯前面的所有环节,确定第二周期内所有环节的业务规则失败率是否存在偏离,如果非最后一个环节有偏离,则取最高级别的偏离作为最后一个环节本周期的业务规则失败率异动。对于非最后一个环节的业务规则失败率是否偏离的计算,计算当前窗口时长内的系统失败率,以业务规则失败率超过1%、20%、50%分别对应一般异动、重要异动和严重异动。
基于最近1个月的历史数据计算第二周期内所有环节的交易量,以交易量为0的环节超过1/4、1/3、1/2分别对应一般异动、重要异动和严重异动。
此外,第二映射关系中,可以将两个一般异动等同于一个重要异动,将两个重要异动等同于一个严重异动。
在第二监控模式中,按第二周期判断各指标的异动级别和异动次数。具体的,第二监控模式中,当前窗口时长以第二周期向前滑动,当前窗口时长大于第二周期。第二周期可以为30s、45s或1min,可以等于或不等于第一周期。
S10:累积业务数据在所有指标的异动级别和次数,确定业务数据的健康度。
异动级别包括:无异动、一般异动、重要异动和严重异动,对应的,系统可以具有告警级别,告警级别包括:无告警、一般告警、重要告警和严重告警。如图7所示的告警严重性升级模式示意图,2个一般告警可以等于1个重要告警,2个重要告警可以等于1个严重告警。对应异动级别,健康度包括:健康、良好、一般和不健康。健康度中,如图8所示的健康度升级模式示意图,n个良好可以等于一个一般,n个一般可以等于一个不健康,n可以等于1或2或3等等。
对应的,业务监测预警实现方法中依据健康度与预警对应关系,按第三周期更新并输出相应预警。第三周期可以等于第一周期或第二周期,如30s、45s或1min。健康度与预警的对应关系中,例如,不健康状态的业务类型数量大于m输出红色预警,等于m输出橙色预警,等于k输出浅蓝色预警,小于k输出绿色正常,m与k可以配置,如m为5,k为2。
本发明实施例的业务监测预警实现方法可以是针对单个业务类型、地市业务或全省业务等。
在单个业务类型的健康度评估中,可以先统计单个业务类型最后一个环节的交易时长、系统失败率、业务规则失败率、业务量四个指标的异动级别和异动次数,并获得对应的告警级别和次数。基于上述中告警级别中,2个一般告警可以等于1个重要告警,2个重要告警可以等于1个严重告警,确定是否有严重告警,若有则为不健康状态,并输出红色预警;否则确认是否有重要告警,若有则为一般状态,并输出橙色预警;否则确认是否有一般告警,若有则为良好状态,并输出黄色预警,否则为健康状态并输出绿色正常标记。
在地市业务健康度评估中,由于涉及多种数量的业务类型,可以对各地市全部业务类型逐一进行健康度计算,统计各地市不健康、一般、良好、健康状态的各业务类型数量。基于n个良好可以等于一个一般,n个一般可以等于一个不健康,统计各地市不健康、一般、良好、监控状态的业务分类数量,并依据上述健康度与预警对应关系,输出对应的预警。
在全省业务健康度评估中,由于涉及多种数量的业务类型,可以对全省全部业务类型逐一进行健康度计算,统计全省不健康、一般、良好、健康状态的各业务类型数量。基于n个良好可以等于一个一般,n个一般可以等于一个不健康,统计各地市不健康、一般、良好、监控状态的业务分类数量,并依据上述健康度与预警对应关系,输出对应的预警。
图9为本发明又一示范性实施例中业务管理系统的结构图。业务管理系统200包括数据采集器210、服务器220和显示器230。
数据采集器210采集业务数据。服务器220包括第一端口、存储器和处理器,第一端口用于接收业务数据,处理器依据业务数据,计算业务数据的异动级别和次数,以及业务健康度。存储器存储业务数据,以及业务数据的异动级别信息、异动次数和健康度信息。显示器230显示异动级别信息、异动次数信息和健康度信息。
本申请实施例提供的业务管理系统还可以执行图1中服务器执行的方法,并实现服务器在图1所示实施例的功能,在此不再赘述。
本发明实施例还提供一种设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,计算机程序被所述处理器执行时实现上述业务监测预警实现方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述业务监测预警实现方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上所述的具体实例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种业务监测预警实现方法,其特征在于,包括:
判断业务数据的业务类型,依据业务类型与窗口时长的映射关系,获得所述业务数据的当前窗口时长,以及监控模式;
基于所述监控模式,计算所述业务数据在当前窗口时长内的至少一个指标的异动级别和次数;
累积所述业务数据在所有所述指标的异动级别和次数,确定所述业务数据的健康度。
2.根据权利要求1所述的方法,其特征在于,所述获得所述业务数据的当前窗口时长,以及监控模式,包括:
当所述当前窗口时长小于时长阈值时,所述业务数据对应第一监控模式;
当所述当前窗口时长超过时长阈值时,所述业务数据对应第二监控模式。
3.根据权利要求2所述的方法,其特征在于,
所述指标包括:交易时长、系统失败率、业务规则失败率和交易量中至少之一;
所述第一监控模式包括:分别基于各所述指标的偏离程度和偏离次数与异动级别和异动次数的第一映射关系,按第一周期分别判断所述业务数据在所述当前窗口时长内的各所述指标的异动级别和异动次数;
所述第二监控模式包括:
分别基于各所述指标的偏离程度和偏离次数与异动级别和异动次数的第二映射关系,按第二周期分别判断所述业务数据在所述当前窗口时长内的的最后环节中交易时长、系统失败率或业务规则失败率是否存在异动,若存在异动则记录异动级别和次数,否则,分别取所述业务数据在所述当前窗口时长内的所有非最后环节中的交易时长、系统失败率或业务规则失败率的最高异动级别作为所述业务数据在当前窗口时长内的最后环节中的异动级别和次数;
和/或按第二周期判断所述业务数据在所述当前窗口时长内的所有环节的交易量的异动级别和次数。
4.根据权利要求3所述的方法,其特征在于,
在所述第一监控模式中,所述当前窗口时长以第一周期向前滑动,所述当前窗口时长大于所述第一周期;
在所述第二监控模式中,所述当前窗口时长以第二周期向前滑动,所述当前窗口时长大于所述第二周期;
所述第一周期等于或不等于所述第二周期。
5.根据权利要求1所述的方法,其特征在于,所述业务类型与窗口时长的映射关系,包括:
设置至少两个时长选项;
读取所述业务类型的历史数据;
从所述至少两个时长选项中选择目标时长作为所述业务类型的窗口时长,所述历史数据在所述目标时长内的交易量平均值超过预设值,且所述目标时长为至少两个时长选项中能够满足所述历史数据在各所述时长选项内的交易量平均值超过所述预设值的最小值。
6.根据权利要求5所述的方法,其特征在于,所述业务类型与窗口时长的映射关系,还包括:
当所述业务类型的窗口时长为所述至少两个时长选项的最小值时,依据所述业务类型的历史数据,判断所述业务类型是否具有敏感期;
若在所述敏感期内,调整所述窗口时长,以使所述业务类型在敏感期的窗口时长内的交易量超过所述预设值。
7.根据权利要求1所述的方法,其特征在于,所述累积所述业务数据在所有所述指标的异动级别和次数,确定所述业务数据的健康度中:
所述异动级别包括:无异动、一般异动、重要异动和严重异动;
对应的,所述健康度包括:健康、良好、一般和不健康;
所述业务监测预警实现方法还包括:
依据所述健康度与预警对应关系,输出相应预警。
8.一种业务管理系统,其特征在于,包括数据采集器、服务器和显示器;所述数据采集器采集业务数据;
所述服务器包括第一端口、存储器和处理器;
所述第一端口用于接收业务数据;
所述处理器依据所述业务数据,计算所述业务数据的异动级别和次数,以及所述业务健康度;
存储器存储所述业务数据,以及所述业务数据的异动级别信息、异动次数信息和健康度信息;
所述显示器显示所述异动级别信息、异动次数信息和健康度信息。
9.一种设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
CN201910610275.XA 2019-07-08 2019-07-08 一种业务监测预警实现方法 Active CN112200397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910610275.XA CN112200397B (zh) 2019-07-08 2019-07-08 一种业务监测预警实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910610275.XA CN112200397B (zh) 2019-07-08 2019-07-08 一种业务监测预警实现方法

Publications (2)

Publication Number Publication Date
CN112200397A true CN112200397A (zh) 2021-01-08
CN112200397B CN112200397B (zh) 2023-10-27

Family

ID=74004550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910610275.XA Active CN112200397B (zh) 2019-07-08 2019-07-08 一种业务监测预警实现方法

Country Status (1)

Country Link
CN (1) CN112200397B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114513461A (zh) * 2022-02-11 2022-05-17 联仁健康医疗大数据科技股份有限公司 限流方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100194560A1 (en) * 2009-02-02 2010-08-05 United Parcel Service Of America, Inc. Systems and methods for enhanced business process monitoring
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN102447570A (zh) * 2010-09-30 2012-05-09 中国移动通信集团福建有限公司 一种基于健康度分析的监控装置及方法
CN103123602A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 基于java的异常报警监控方法及其装置
US20150227412A1 (en) * 2014-02-07 2015-08-13 AppDynamics, Inc. Server performance correction using remote server actions
CN105095747A (zh) * 2014-04-15 2015-11-25 阿里巴巴集团控股有限公司 一种Java应用健康度评估方法及系统
US20160191710A1 (en) * 2014-12-29 2016-06-30 Ingenio, Llc Systems and methods to determine quality of services provided over real-time communication connections
CN106022657A (zh) * 2016-06-24 2016-10-12 深圳前海征信中心股份有限公司 信用风险的监控方法及装置
CN108848515A (zh) * 2018-05-31 2018-11-20 武汉虹信技术服务有限责任公司 一种基于大数据的物联网业务质量监测平台及方法
CN109614291A (zh) * 2018-12-11 2019-04-12 上海连尚网络科技有限公司 报警方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100194560A1 (en) * 2009-02-02 2010-08-05 United Parcel Service Of America, Inc. Systems and methods for enhanced business process monitoring
CN102447570A (zh) * 2010-09-30 2012-05-09 中国移动通信集团福建有限公司 一种基于健康度分析的监控装置及方法
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN103123602A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 基于java的异常报警监控方法及其装置
US20150227412A1 (en) * 2014-02-07 2015-08-13 AppDynamics, Inc. Server performance correction using remote server actions
CN105095747A (zh) * 2014-04-15 2015-11-25 阿里巴巴集团控股有限公司 一种Java应用健康度评估方法及系统
US20160191710A1 (en) * 2014-12-29 2016-06-30 Ingenio, Llc Systems and methods to determine quality of services provided over real-time communication connections
CN106022657A (zh) * 2016-06-24 2016-10-12 深圳前海征信中心股份有限公司 信用风险的监控方法及装置
CN108848515A (zh) * 2018-05-31 2018-11-20 武汉虹信技术服务有限责任公司 一种基于大数据的物联网业务质量监测平台及方法
CN109614291A (zh) * 2018-12-11 2019-04-12 上海连尚网络科技有限公司 报警方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GILBERTO FERNANDES JR. 等: "A comprehensive survey on network anomaly detection", 《TELECOMMUNICATION SYSTEMS》, vol. 70, pages 447 - 489, XP036705363, DOI: 10.1007/s11235-018-0475-8 *
JIANTAO WANG, 等: "Efficient alarm behavior analytics for telecom networks", 《INFORMATION SCIENCES》, vol. 402, pages 1 - 14 *
张小翠: "监控阈值模型及报警事件关联规则研究", 《中国金融电脑》, no. 5, pages 76 - 81 *
郑声俊, 等: "基于运行监控技术的信息系统健康度评价体系", 《自动化应用》, no. 9, pages 105 - 106 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114513461A (zh) * 2022-02-11 2022-05-17 联仁健康医疗大数据科技股份有限公司 限流方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112200397B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US8352867B2 (en) Predictive monitoring dashboard
CN112801666B (zh) 基于企业服务总线的监控管理方法、系统、介质和设备
US7412403B2 (en) System for managing services and service provider agreements
US20070083650A1 (en) Prediction of service level compliance in it infrastructures
US8005644B1 (en) Application transaction analysis
EP2924644A1 (en) Gas meter data validation
US20170161131A1 (en) Identification of storage system elements causing performance degradation
JP4541364B2 (ja) 意味のある変動を明らかにする自動監視及び動的プロセスメトリクスの統計分析
US8150744B2 (en) Revenue assurance analytics
JP2004348740A (ja) 異常検出のための自己学習方法及びシステム
US8819224B2 (en) Health and welfare monitoring of network server operations
CN108696368B (zh) 一种网元健康状态的检测方法及设备
WO2018125628A1 (en) A network monitor and method for event based prediction of radio network outages and their root cause
US20190114596A1 (en) System for Analyzing and Improving Device Location as a Function of Time
CN109992473A (zh) 应用系统的监控方法、装置、设备及存储介质
CN113672600A (zh) 一种异常检测方法及系统
CN113590429A (zh) 一种服务器故障诊断方法、装置及电子设备
CN112200397A (zh) 一种业务监测预警实现方法
US8912918B2 (en) Method and system for optimized monitoring and identification of advanced metering infrastructure device communication failures
CN110673973B (zh) 应用程序编程接口api的异常确定方法和装置
CN111563111A (zh) 告警方法、装置、电子设备及存储介质
US11868203B1 (en) Systems and methods for computer infrastructure monitoring and maintenance
KR100323747B1 (ko) 교환망에 대한 지능형 서비스 감시 방법
CN110928748A (zh) 业务系统运行监测方法及装置
EP3345344B1 (en) Evaluation of network condition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant