CN104811344A - 网络动态业务监控方法及装置 - Google Patents

网络动态业务监控方法及装置 Download PDF

Info

Publication number
CN104811344A
CN104811344A CN201410033212.XA CN201410033212A CN104811344A CN 104811344 A CN104811344 A CN 104811344A CN 201410033212 A CN201410033212 A CN 201410033212A CN 104811344 A CN104811344 A CN 104811344A
Authority
CN
China
Prior art keywords
alarm threshold
time period
reference value
unit interval
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410033212.XA
Other languages
English (en)
Other versions
CN104811344B (zh
Inventor
潘浩源
程磊
于海明
唐亮
谷维雷
邓庆屏
陈勇文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410033212.XA priority Critical patent/CN104811344B/zh
Publication of CN104811344A publication Critical patent/CN104811344A/zh
Application granted granted Critical
Publication of CN104811344B publication Critical patent/CN104811344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网络动态业务监控方法,包括:从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数,据根据所述往期业务数据计算获得成功率参考值或者失败率参考值,对所述成功率参考值调整计算,得到调整成功率参考值,判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值;或者对所述失败率参考值进行调整计算,得到调整失败率参考值,判断所述调整失败率参考值是否大于预设的波动率告警阈值;若是,则判断该被监控时间段内的网络业务出现严重异常;并通过严重性得分判断所述严重异常的严重程度。采用上述的动态业务监控方法,提高了网络业务监控的准确性和灵活性,有效减少了误报产生的人工处理工作量。

Description

网络动态业务监控方法及装置
技术领域
本申请涉及电子商务领域,具体涉及网络动态业务监控方法,以及网络动态业务监控装置。
背景技术
随着互联网的广泛应用,电子商务(Electronic Commerce)已经日益成为主流商务模式,由于商务活动的严肃性,必须保证网络信息传递的准确及时,随之产生了大量的网络业务监控需求。
对电子商务而言,所谓网络业务监控,是指对通过网络进行的信息传递和业务流程进行严密的控制和实时监控,确保各种依赖网络进行的业务活动的顺利进行。由于电子商务中包括大量自动进行、没有人为参与的数据在网络中流动,使电子商务中网络系统对自身的业务监控至关重要。
网络业务监控包括静态业务监控和动态业务监控,网络动态业务监控是指在网络业务进行过程中,配合对网络信息流动的过程控制,对网络进行的实时监控。随着电子商务的不断发展,为了满足网络购物网络支付等实时业务对业务系统的需要,动态业务监控方法成为对业务系统监控的主导方式。
现有技术采用的动态业务监控方法,一般采用下述两种方式之一:1)判断被监控时间段内的业务成功率与预设的告警阈值之间的大小关系,如果被监控时间段内的业务成功率小于或者等于预设的告警阈值,则判定所述被监控时间段为异常事件,并发出告警;2)判断被监控时间段内的业务失败率与预设的告警阈值之间的大小关系,如果被监控时间段内的业务失败率大于预设的告警阈值,则判定所述被监控时间段为异常事件,并发出告警。所述的告警阈值的计算过程是:获取往期业务数据,并将往期业务数据对应的时间段按照相等的时间间隔划分为相等的时间单元,计算出每个时间单元内的业务成功率以及业务失败率,然后求出所有时间单元内业务成功率或者失败率的平均数以及中位数,选取上述平均数或者中位数作为告警阈值。
上述现有技术存在明显的缺陷。
首先,仅仅采用告警阈值作为判断业务是否出现异常事件的方式,在一些特定情况下不能准确反映实际的异常情况。
在上述现有技术所述的动态业务监控方法中,如果被监控时间段内的总业务数很低,例如凌晨的网购下单业务,则此时被监控时间段内出现少量的失败业务都会使该被监控时间段内的业务失败率显著增加,甚至超出预设的告警阈值,或者会使该被监控时间段内的业务成功率很小,甚至低于预设的告警阈值,从而使系统发出告警。但从整体上看,这些少量的失败业务一般并不意味电子商务系统存在系统风险,对其采取报警措施会降低报警准确性,影响业务系统的正常运转。在现有技术提供的动态业务监控方法中,仅仅根据成功率与失败率与相应的告警阈值之间的关系进行报警,无法分辨出上述情况。。
其次,上述现有技术所述的动态业务监控方法只能判断该被监控时间段是不是异常事件,如果该被监控时间段被判定为异常事件,无法进一步判断该被异常事件的严重性程度。
第三,上述现有技术所述的动态业务监控方法中,告警阈值的选择存在两难。在上述现有技术中,出现某个数量的失败业务是否需要告警,完全依赖于告警阈值的设定,使告警阈值设定面临两难。若告警条件过于苛刻(业务成功率的告警阈值设定过高,或者业务失败率的告警阈值设定过低),则一些需要告警的情况可能被漏判。相反,如果告警条件过低(业务成功率的告警阈值设定过低,或者业务失败率的告警阈值设定过高),则不应当判定为异常事件的情况却可能发出告警,从而产生大量的告警,增加了告警的工作量。
最后,在现有技术提供的上述动态业务监控方法中,针对所有的告警均采用同样的告警方式,不能针对不同业务对异常情况的敏感度以及异常情况的严重程度,选择有针对性的报警措施。
发明内容
本申请提供一种网络动态业务监控方法,以解决现有的网络动态业务监控技术存在的问题。本申请还提供一种网络动态业务监控装置。
本申请提供一种网络动态业务监控方法,包括以下步骤:
从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
根据所述往期业务数据计算获得成功率参考值;
以成功率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入成功率参考值的计算公式,对成功率参考值进行调整计算,得到调整成功率参考值;
判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值,若是,则判断该被监控时间段内的网络业务出现严重异常。
可选的,所述成功率参考值通过如下方式获得:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段;所述固定时长与被监控时间段的时长相等;以下述数据和公式之一计算所述成功率参考值:
以所述特定时间段内的各个单位时间段的平均成功业务数和各个单位时间段的平均总业务数为依据,将所述平均成功业务数除以所述各个单位时间段的平均总业务数,作为所述成功率参考值;
或者,以所述特定时间段内的各个单位时间段的成功业务数中位数和各个单位时间段的总业务数的中位数作为依据,将所述各个单位时间段的成功业务数除以所述各个单位时间段的总业务数的中位数,作为所述成功率参考值;
或者,以所述特定时间段内的各个单位时间段的成功业务数平均数与各个单位时间段的成功业务数中位数二者平均数、各个单位时间段总业务数的平均数以及各个单位时间段总业务数的中位数二者平均数为依据;将前者除以后者,作为所述成功率参考值。
可选的,所述调整成功率参考值的计算公式,具体是:在所述计算成功率参考值的计算公式中,分子加上被监控时间段内的成功业务数,分母加上被监控时间段内的总业务数。
可选的,在进行所述对调整成功率参考值进行计算的步骤之前,先判断被监控时间段的失败业务数是否大于失败样本参考数,且失败样本参考数是否大于0;
若是,则采用如下方式对成功率参考值进行调整计算:将被监控时间段内的成功业务数乘以失败业务数与失败样本参考数的比值,加在成功率参考值计算公式的分子上;将被监控时间段内的总业务数乘以失败业务数与失败样本参考数的比值,加在成功率参考值计算公式的分母上;所述失败样本参考数采用以下方式之一计算:参考时间段内,存在失败样本的各个单位时间段的失败样本的平均数;或者,参考时间段内,存在失败样本的各个单位时间段的失败样本的中位数;或者,参考时间段内,存在失败样本的各个单位时间段的失败样本的平均数,与存在失败样本的各个单位时间段的失败样本的中位数的平均数;
若否,则采用如下方法进行所述调整计算:在所述计算成功率参考值的计算公式中,分子加上被监控时间段内的成功业务数,分母加上被监控时间段内的总业务数。
可选的,在所述对成功率参考值进行调整计算的步骤之前,先判断被监控时间段的业务成功率是否小于或等于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,进入所述对成功率参考值进行调整计算的步骤;若否,则不再进入对成功率参考值进行调整计算步骤。
可选的,所述第一告警阈值采用如下算法实现:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段,并计算出每个单位时间段的业务成功率;
以下述公式计算所述第一告警阈值:所述特定时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>。
可选的,所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;并以下述公式判断所述第一告警阈值波动是否异常:
<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
可选的,若判断被监控时间段内的网络业务出现严重异常,则用波动率告警阈值减去在所述对成功率参考值进行调整计算的步骤中得到的所述调整成功率参考值,将差值乘以100,获得偏离分;偏离分越大,则所述网络业务出现的异常事件异常程度越严重。
可选的,将所述偏离分与预设的偏离分区间比较,根据其落入的偏离分区间,进行预定处理;所述偏离分区间是以偏离分分值为依据,从小到大设置的若干区间,每个区间采用不同的处理方式,且分值越大的偏离分区间,其处理方式的级别越高。
可选的,根据网络业务类型的不同设置不同的敏感度,并对应不同的敏感度设置不同的偏离分区间。
本申请还提供一种网络动态业务监控装置,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
成功率参考值计算单元,用于根据所述往期业务数据提取单元提取的往期业务数据计算获得成功率参考值;
调整成功率参考值计算单元,接收所述成功率参考值计算单元输出的成功率参考值计算结果,以成功率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入成功率参考值的计算公式,对成功率参考值进行调整计算,得到调整成功率参考值;
严重异常判断单元,用于接收所述调整成功率参考值计算单元输出的调整成功率参考值,并判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
可选的,所述网络动态业务监控装置包括:
异常事件初步判断单元,用于判断被监控时间段的业务成功率是否小于或者等于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整成功率参考值计算单元对成功率参考值进行调整计算;若否,则不启动所述调整成功率参考值计算单元。
可选的,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务成功率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>。
可选的,所述网络动态业务监控装置包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
本申请另外提供一种网络动态业务监控方法,包括以下步骤:
从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
根据所述往期业务数据计算获得失败率参考值;
以失败率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入失败率参考值的计算公式,对失败率参考值进行调整计算,得到调整失败率参考值;
判断所述调整失败率参考值是否小于或者等于预设的波动率告警阈值,若是,则判断该被监控时间段内的网络业务出现严重异常。
可选的,所述失败率参考值通过如下方式获得:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段;所述固定时长与被监控时间段的时长相等;以下述数据和公式之一计算所述失败率参考值:
以所述特定时间段内的各个单位时间段的平均失败业务数和各个单位时间段的平均总业务数为依据,将所述平均失败业务数除以所述各个单位时间段的平均总业务数,作为所述失败率参考值;
或者,以所述特定时间段内的各个单位时间段的失败业务数中位数和各个单位时间段的总业务数的中位数作为依据,将所述各个单位时间段的失败业务数除以所述各个单位时间段的总业务数的中位数,作为所述失败率参考值;
或者,以所述特定时间段内的各个单位时间段的失败业务数平均数与各个单位时间段的失败业务数中位数二者平均数、各个单位时间段总业务数的平均数以及各个单位时间段总业务数的中位数二者平均数为依据;将前者除以后者,作为所述失败率参考值。
本申请还提供一种网络动态业务监控装置,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
失败率参考值计算单元,用于根据所述往期业务数据计算获得失败率参考值;
调整失败率参考值计算单元,接收所述失败率参考值计算单元输出的失败率参考值计算结果,以失败率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入失败率参考值的计算公式,对失败率参考值进行调整计算,得到调整失败率参考值;
严重异常判断单元,用于接收所述调整失败率参考值计算单元输出的调整失败率参考值,并判断所述调整失败率参考值是否大于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
可选的,所述网络动态业务监控装置包括:
异常事件初步判断单元,用于判断被监控时间段的业务失败率是否大于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整失败率参考值计算单元对失败率参考值进行调整计算;若否,则不启动所述调整失败率参考值计算单元。
可选的,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务失败率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:1-<参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>>。
可选的,所述网络动态业务监控装置包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
与现有技术相比,本申请提供的技术方案具有以下优点:
首先,本申请所述的网络动态业务监控方法提供的告警判断方式能够有效避免直接采用阈值判断方法造成的不当判断,避免不当告警造成的资源浪费。
在现有技术提供的网络动态业务监控方法中,如果被监控时间段内的总业务数跌入低谷,且该被监控时间段内的成功业务数也比较小,则此时被监控时间段内出现少量的失败业务数都会使该被监控时间段内的业务失败率很大并且超出预设的告警阈值,或者会使该被监控时间段内的业务成功率很小并且低于预设的告警阈值,从而发出告警;
在本申请所述的网络动态业务监控方法中,采用将监控时间段内的业务数据代入成功率参考值的原计算公式,对成功率参考值进行调整计算,获得调整成功率参考值;根据调整成功率参考值的波动是否低于波动率告警阈值,判断被监控时间段内是否出现异常。当某些被监控时间段内业务量很低时,出现少量失败业务就可能到达告警阈值;而采用本申请提供的技术方案后,这种情况由于被监控时间段内总业务量比较小,将相关数值代入成功率参考值的计算公式后产生的调整成功率参考值不会相对原来的成功率参考值产生明显的向降低方向的波动,无需判断为异常。
其次,本申请优选实施方式中,还另外提供了一种用于初步判断是否出现异常事件的第一告警阈值,通过该第一告警阈值,能够对被监控时间段是否存在异常时间进行初步判断,如果经过初步判断,该被监控时间段不存在异常,则无需进行调整成功率参考值的复杂计算,可以有效减少计算资源的浪费。在进一步的优选实施方式中,提供了第一告警阈值依据往期业务数据的变化而定时更新的计算方法,更进一步的优选实施方案中,还提供了对第一告警阈值波动变化的衡量手段,以便能够发现第一告警阈值的不正常变化,以提醒进行人工干预。以上各个优选方案,都能够使该第一告警阈值的选择更为合理,从而提供最为准确的对异常事件的初步判断。
能随着监控活动的进行依据往期业务数据定时更新。如果当前被监控时间段出现的异常值较多,则判断该监控阈值相对于以往的监控阈值的波动变化大小,如果该监控阈值相对于以往的监控阈值的波动变化很大,增加了对该监控阈值进行人工调整修正的功能,增强告警的准确性。
3、本申请的另一个优选实施方式,还提供了一种异常事件严重性判断方法,首先计算出能够反应异常事件严重程度的严重性得分,并根据该严重性得分匹配合适的告警区间,执行该告警区间内的告警操作;在进一步的优选方案中,本申请所述的告警区间在不同业务性质或者不同的业务场景下,进行不同的敏感度设置,以适应对不同业务的动态业务监控需求。
此外,需要说明的是,本申请提供的网络动态业务监控方法,既可以以成功率作为监控指标,也可以以失败率为监控指标,这两种方式的技术思路完全一致,因而属于一个总的发明构思(即:网络动态业务监控方法),具有单一性。
附图说明
图1是根据本申请第一实施例提供的一种动态业务监控方法的架构图。
图2是根据本申请第二实施例提供的一种动态业务监控方法的步骤流程图。
图3是本申请第二实施例提供的箱形图示意图。
图4是根据本申请第二实施例提供的一种动态业务监控方法的步骤流程图。
图5是根据本申请第三实施例提供的一种动态业务监控装置的单元框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
实施例一
参照图1,其示出了本申请实施例一提供的一种网络动态业务监控方法的架构图。该架构图反应后续实施例的基本思路。该架构图同时反映出分别使用成功率和失败率进行动态业务监控的方法,这两种方法具有相同的本质,仅仅是选择的判断方向不同,导致两种方法选择的一些参数和具体的计算公式有所不同。
如图1所示的采用成功率进行报警判断的方法。该方法首先计算被监控时间段内的业务成功率,计算出被监控时间段内的业务成功率后,与根据往期业务数据计算出的第一告警阈值相比较,如果被监控时间段内的业务成功率小于或者等于第一告警阈值,则初步判定该被监控时间段内的业务成功率过低,所述被监控时间段就被初步判定为异常事件;反之,则不作处理。进一步地,对初步判定为异常事件的被监控时间段进行异常事件严重性判断,所述异常事件严重性判断的方法,是计算所述被监控时间段内的调整成功率参考值,并据此对初步判定的异常事件的性质进行判断,若所述调整成功率参考值小于或者等于预设的波动率告警阈值,则判断该被监控时间段出现严重异常。进一步,计算该异常事件的严重性得分,如果该异常事件的严重性得分表明该异常事件需要告警,则通过所述严重性得分匹配告警区间,并通过该告警区间内的告警方式执行告警操作;如果该异常事件的严重性得分表明该异常事件不需要告警,则不作处理。
图1同时示出采用失败率进行报警判断的方法。该方法首先计算被监控时间段内的业务失败率,计算出被监控时间段内的业务失败率后,与根据往期业务数据计算出的第一告警阈值(失败率为基准)相比较,如果被监控时间段内的业务失败率大于预设的第一告警阈值,则初步判定该被监控时间段内的业务失败率过高,所述被监控时间段就被初步判定为异常事件;反之,则不作处理。进一步地,对初步判定的异常事件的被监控时间段进行异常事件的严重性判断,所述异常事件严重性判断的方式,是计算所述被监控时间段内的调整失败率参考值,并据此对初步判定的异常事件的性质进行判断,若所述调整失败率参考值大于预设的波动率告警阈值(以失败率为基准设置的),则判断被监控时间段出现严重异常。进一步,计算该异常事件的严重性得分,如果该异常事件的严重性得分表明该异常事件需要告警,则通过所述严重性得分匹配告警区间,并通过该告警区间内的告警方式执行告警操作;如果该异常事件的严重性得分表明该异常事件不需要告警,则不作处理。
需要说明的是,本申请采用的上述两种通过业务成功率或者业务失败率的判断方法原理相同,只是对业务数据进行分析判断时业务数据核心的侧重点不同,同时体现出在不同的业务性质以及不同的业务领域当中对业务数据进行分析时的敏感度有所不同。例如,在一般的业务监控活动中,对上述应用业务失败率的判断方法适用于涉及货币支付等对业务数据非常敏感的业务场景当中;上述应用业务成功率的判断方法适用于订单提交等对业务数据的控制不是非常严格的业务场景中。根据不同的业务性质或业务领域可自主选择一种方法应用于业务监控系统中,在此不做限制。
实施例二
参照图2-图4,其示出了根据本申请实施例二的一种网络动态业务监控的方法。该方法包括图2、图4两个流程图;其中图2示出对被监控时间段初步判断异常事件的步骤,图4示出对初步判断的异常事件如何进行进一步的二次判定,并选择报警方式。本实施例二是对第一实施例提供的网络动态业务监控方法的细化方案。
本实施例采用的一种优选的技术方案实现步骤如下:
步骤S101;计算被监控时间段内的业务成功率Rate_Now_S,或者业务失败率Rate_Now_F。
本实施例中,选用获取业务数据这一时刻之前时间长度为10分钟的时间段作为被监控时间段;所述被监控时间段内业务数据包括总业务数Sum、成功业务数Sum_S以及失败业务数Sum_F。
被监控时间段内的业务成功率Rate_Now_S:
Rate _ Now _ S = Sum _ S Sum
被监控时间段内的业务失败率Rate_Now_F:
Rate _ Now _ F = Sum _ F Sum
步骤S102;从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据。
本实施例中,所述往期业务数据是以1分钟为单位存储在网络业务数据库当中的前一日所有的业务数据;并以1分钟为单位从网络业务数据库中读取往期业务数据,直到读取完前一天1440分钟每一个分钟单元内的业务数据为止。
步骤S103;计算成功率参考值,或者失败率参考值。
根据上述步骤S102获取到的往期业务数据,以10分钟为单位将往期业务数据对应的前一天总时间长度1440分钟划分为144个相等的单位时间段,并且计算出每个单位时间段T内的总业务数Total、成功业务数Total_S以及失败业务数Total_F;
并根据成功业务数Total_S/总业务数Total获得每个单位时间段T内的业务成功率;以及
失败业务数Total_F/总业务数Total获得每个单位时间段T内的业务失败率;
步骤S104;将所述每个单位时间段T内的业务成功率或者业务失败率存入网络业务比率数据库当中。
完成步骤S101至S103的业务数据准备工作后,在本步骤当中,将上述S103步骤得到的每个单位时间段T内的业务成功率或者业务失败率存储到网络业务比率数据库中。
在实际的业务中,有些业务系统当中的业务数据量比较小,在完成步骤S101至S103的操作后,没有将上述得到的每个单位时间段T内的业务成功率或者业务失败率存储到数据库中,而是在后面的操作中直接将步骤S103得到的每个单位时间段T内的业务成功率或者业务失败率直接调用,略去本步骤,本申请对此不作限制。一般地,在一个实际的业务系统当中,如果该业务系统当中业务数据量较大或者对业务数据比较敏感,则本步骤就显得尤为重要,不仅能够减小业务系统的业务数据运算压力,同时也方便观察业务数据的变化趋势等。
步骤S105;依据往期业务数据获得第一告警阈值First_Gate。
第一告警阈值First_Gate是指用来判断被监控时间段内的业务成功率Rate_Now_S或者业务失败率Rate_Now_F是否正常的一个参考比较值。第一告警阈值First_Gate可以是通过往期业务数据采取某种算法计算得来,也可以参考往期业务数据设定,在此不作限定。
本实施例中,第一告警阈值First_Gate是采用箱形图算法(参见图3)计算所得。在对大批数据进行处理时,其中包含的异常值有可能很多,异常值不容忽视,但是不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响,影响对数据的分析判断,所以要重视异常值的出现,并且分析异常值产生的原因,常常成为发现问题进而改进的核心。箱形图(参见图3)提供了识别异常值的一个标准:异常值O被定义为小于上四分位数Q1-0.5×四分位间距(上四分位数Q1-下四分位数Q3)或者大于下四分位数Q3+0.5×四分位间距的值。箱形图(参见图3)的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,它只是真实直观地表现数据形状的本来面貌;另一方面,箱形图(参见图3)判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱形图(参见图3)识别异常值的结果比较客观。
本实施例通过箱形算法计算第一告警阈值First_Gate具体步骤如下:
1)获取步骤S103所得每个单位时间段T内的业务成功率或者业务失败率;
2)将所有的单位时间段T内的业务成功率按照从大到小的规律排为一列;
3)如果采用被监控时间段内的业务成功率Rate_Now_S来作为异常事件的判断标准,则第一告警阈值First_Gate的计算过程如下:
根据箱形图(参见图3)的特点对上述的一列业务数据(即:业务成功率)取异常值截断点G3,该异常值截断点G3对应的业务成功率即为第一告警阈值First_Gate;该异常值截断点(即第一告警阈值First_Gate)的具体计算过程如下:
根据箱形图(参见图3)的特点对步骤2)所述的一列数据取上四分位数Q1和下四分位数Q3:
First_Gate=Q3-0.5×(Q1-Q3)
如果采用被监控时间段内的业务失败率Rate_Now_F来作为异常事件的判断标准,业务失败率Rate_Now_F对应的第一告警阈值First_Gate可以利用上述业务成功率Rate_Now_S对应的第一告警阈值First_Gate计算所得,即:
业务失败率Rate_Now_F对应的第一告警阈值First_Gate等于1减去业务成功率Rate_Now_S对应的第一告警阈值First_Gate所得的数值。
计算并获得第一告警阈值First_Gate后,将所述第一告警阈值First_Gate存储到网络业务阈值数据库中。
步骤S106;对第一告警阈值First_Gate进行稳定性检查。
对第一告警阈值First_Gate进行的稳定性检查是为了防止一种极端现象的出现,例如:商户A相对于被监控时间的前一天的全部时间或者大部分时间系统的服务器出现故障,但是在被监控时间所对应日的凌晨服务器恢复正常,业务数据也恢复正常,这种现象很可能导致的结果是:根据上述的计算第一告警阈值First_Gate的步骤计算所得的第一告警阈值First_Gate接近于0%或者是数据明显偏低现象,甚至等于0%都有可能,但是当前系统又处于正常的工作状态。此时,业务系统无法自身判断数据出错,就需要人工修正第一告警阈值First_Gate的值。此外,在业务监控活动的进行过程中,为了更准确的判断业务数据是否出与较大的波动范围,此时给业务监控系统增加一项新的判断功能,并相应的设定一个判断标准;
设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值First_Gate为今日第一告警阈值First_Gate;类似的,前天的网络业务数据对应的第一告警阈值First_Gate为昨日第一告警阈值First_Gate_Last;
从所述网络业务阈值数据库中获取第一告警阈值First_Gate、昨日第一告警阈值First_Gate_Last;并
计算出的结果;
如果计算结果的绝对值大于0.5,则表明该被监控时间段的第一告警阈值First_Gate相对于昨日第一告警阈值First_Gate_Last波动太大,需要进行人工调整;并且将与第一告警阈值First_Gate有关的数据记录到网络业务异常数据库中;
如果计算结果的绝对值小于0.5,则表明相对该被监控时间段的第一告警阈值First_Gate波动在可接受范围之内,不作处理。
步骤S107;对被监控时间段进行初步判断。
本步骤中,对被监控时间段内的业务数据是否存在异常进行初次判断。判断被监控时间段内的业务成功率Rate_Now_S是否小于或者等于第一告警阈值First_Gate;或者判断被监控时间段内的业务失败率Rate_Now_F是否大于第一告警阈值First_Gate。
1)采用被监控时间段内的业务成功率Rate_Now_S与第一告警阈值First_Gate比较来判断被监控时间段是否为异常事件:
如果被监控时间段内的业务成功率Rate_Now_S小于或者等于第一告警阈值First_Gate,则表明该被监控时间段内的业务成功率Rate_Now_S过低,初步判断所述被监控时间段为异常事件,并且需要对该异常事件进行进一步的判断处理;
如果被监控时间段内的业务成功率Rate_Now_S大于第一告警阈值First_Gate,不作处理。
2)相对应的,如果采用被监控时间段内的业务失败率Rate_Now_F与第一告警阈值First_Gate比较来判断被监控时间段是否为异常事件,如果所述被监控时间段内的业务失败率Rate_Now_S大于第一告警阈值First_Gate,则表明该被监控时间段内的业务失败率Rate_Now_F太高,初步判断所述被监控时间段为异常事件,并且需要对该异常事件进行进一步的判断处理;
如果被监控时间段内的业务失败率Rate_Now_F小于或者等于第一告警阈值First_Gate,不作处理即可。
根据上述的两种判断方法所描述的判断结果,如果所述被监控时间段被初步判断为异常事件,则需要对该被监控时间段进一步分析是否真正属于异常。在下面的步骤当中,将会详细介绍如何对已经初步判定为异常事件的被监控时间段进行进一步的严重性判断。
请参照图4,其示出了根据上述异常事件的初步判断结果,进一步进行二次严重性判定的方法。
所谓二次严重性判定,判断所述该被监控时间段内的业务数据出现异常的严重程度,如果该异常事件的严重性表明该需要执行报警操作,则匹配合适的告警方式并执行告警。
S201;选择初步判断为异常事件的被监控时间段进入下述步骤。
紧接着上述步骤S107,选择初步判断为异常事件的被监控时间段,进行二次严重性判断。本实施例中,对描述为异常事件的被监控时间段进行二次严重性判断,具体是指计算该被监控时间段内的业务数据的严重性得分。
对于初步判断为异常事件的被监控时间段进行二次严重性判断意义在于:在实际业务当中不同的时间段内的业务数据量是不同的,并且可能差别会很大,上述对被监控时间段是不是异常事件的初步判断方法,无法准确的衡量该时间段业务数据对网络业务的整体影响水平,有可能造成严重偏离真实情况的判断。
举例一:一般情况下,在深夜或者凌晨的时候,总业务数会比较少,假设在一个被监控时间段内的总业务数只有1笔,并且该笔业务失败了,则该被监控时间段内的业务成功率为0%,在这种情况下,,不管怎么样设置第一告警阈值First_Gate,该被监控时间段都会被判断为异常事件,并且该时间段内的业务成功率为0%,即失败率为100%,则表明该时间段内的业务数据出现的异常非常严重。但是在实际业务当中,上述在深夜或者凌晨的总业务数只有一笔并且该笔业务失败的情况时有发生,这样的情况是能被允许的,并不是像该被监控时间段内的业务失败率为100%所表达的业务数据异常非常严重。在类似这种业务数据本身随着时间的变化波动很大,并且业务数的基数比较小的情况,采用对异常事件的严重性得分进行判断,就能避免出现上述情况。
举例二:假设被监控时间段对应的第一告警阈值First_Gate的值被设定为80%,在这个基础之上有两种情况:
1)正如上述举例一中所描述的现象,该被监控时间段内的总业务数是1,失败业务数也是1,则业务成功率0%,业务失败率100%;
2)该被监控时间段内的总业务数为10,其中失败业务数为8,成功业务数为2。则该被监控时间段内的业务成功率为20%,业务失败率为80%;
比较1)、2)两种情况,按照业务成功率来比较,则1)表明的被监控时间段内业务数据的异常严重程度大于2)所描述的被监控时间段内业务数据的异常严重程度;按照业务失败率来比较,1)中所描述的被监控时间段的业务失败率也大于2)中所描述的被监控时间段内的业务失败率。按照业务失败率比较与按照业务成功比较得出相同的结论,即:则1)表明的被监控时间段内业务数据的异常严重程度大于2)所描述的被监控时间段内业务数据的异常严重程度。
但是实际业务中,却恰恰相反,2)中所描述的被监控时间段内发生的失败业务数为8远远大于1)中的1。所以,这时候,在实际的业务监控中采用严重性得分这种判断方法来对异常事件进行二次严重性判断就显得非常重要。
S202;计算失败样本参考数Med_F。
依据上述步骤S103的业务数据准备工作,获取所述每一个单位时间段T内的业务数据(总业务数、成功业务数、失败业务数);并计算:
每个单位时间段T内总样本数的平均数Avg_Sum;
每个单位时间段T内的成功样本数的平均数Avg_S;
每个单位时间段T内的失败样本数的平均数Avg_F;
找出在所有的单位时间段T中有失败业务发生的单位时间段,即:有失败样本单位时间段T_F;
计算有失败样本单位时间段T_F内失败样本数的平均数,即有失败样本平均数;
计算有失败样本单位时间段T_F内失败样本书的中位数,即有失败样本中位数;
失败样本参考数Med_F的计算方式有如下几种,可选择其中的一种:
将上述计算出的有失败样本单位时间段T_F内的有失败样本平均数作为失败样本参考数Med_F;
将上述计算出的有失败样本单位时间段T_F内的有失败样本中位数作为失败样本参考数Med_F;
将上述有失败样本平均数和有失败样本中位数二者的平均数作为失败样本参考数Med_F。
本实施例当中选取的失败样本参考数Med_F的计算方式是上述有失败样本平均数和有失败样本中位数二者的平均数。
S203;计算出调整成功率参考值Rate_Adjust_S,或者计算出调整失败率参考值Rate_Adjust_F。
(1)获取步骤S101所得成功业务数Sum_S、总业务数Sum、失败业务数Sum_F,以及步骤S202中计算所得Avg_Sum、Avg_S、Avg_F,计算成功率参考值Rate_Ref_S,或者失败率参考值Rate_Ref_F。成功率参考值Rate_Ref_S或者失败率参考值的计算可以采用以下几种计算方法当中的一种:
第一种:将各个单位时间段T内的成功样本数的平均数Avg_S除以各个单位时间段T内总样本数的平均数Avg_Sum,作为成功率参考值Rate_Ref_S:
Rate _ Ref _ S = Avg _ S Avg _ Sum
或者,将各个单位时间段T内的失败样本数的平均数Avg_F除以各个单位时间段T内总样本数的平均数Avg_Sum,作为失败率参考值Rate_Ref_F:
Rate _ Ref _ F = Avg _ F Avg _ Sum
第二种:将各个单位时间段T内的成功样本数的中位数值除以各个单位时间段T内总样本数的中位数值,作为成功率参考值Rate_Ref_S;
或者,将各个单位时间段T内的失败样本数的中位数值除以各个单位时间段T内总样本数的中位数值,作为失败率参考值Rate_Ref_F;
第三种:将各个单位时间段T内成功样本数的平均数与中位数值二者的平均数除以各个单位时间段T内总样本数的平均数与中位数值二者的平均数,作为成功率参考值Rate_Ref_S;
或者,将各个单位时间段T内失败样本数的平均数与中位数值二者的平均数除以各个单位时间段T内总样本数的平均数与中位数值二者的平均数,作为失败率参考值Rate_Ref_F。
(2)计算调整成功率参考值Rate_Adjust_S,或者调整失败率参考值Rate_Adjust_F。
优选的调整成功率参考值Rate_Adjust_S的计算方式如下:
如果被监控时间段内的失败业务数Sum_F大于所述失败样本参考数Med_F,且失败样本参考数Med_F大于0,则将被监控时间段内的业务数据代入成功率参考值Rate_Adjust_S的计算公式内的调整计算式为:
Rate _ Adjust _ S = Avg _ S + Sum _ S &times; Sum _ F Med _ F Avg _ Sum + Sum &times; Sum _ F Med _ F
其他条件下,即被监控时间段内的失败业务数Sum_F小于或者等于失败样本参考数Med_F、失败样本参考数Med_小于或者F等于0或者二者条件都满足时,调整成功率参考值Rate_Adjust_S的计算公式为:
Rate _ Adjust _ S = Avg _ S + Sum _ S Avg _ Sum + Sum
优选的调整失败率参考值Rate_Adjust_F的计算方式如下:
如果被监控时间段内的失败业务数Sum_F大于所述失败样本参考数Med_F,且失败样本参考数Med_F大于0,则将被监控时间段内的业务数据代入失败率参考值Rate_Adjust_F的计算公式内的调整计算式为:
Rate _ Adjust _ F = Avg _ F + Sum _ F &times; Sum _ F Med _ F Avg _ Sum + Sum &times; Sum _ F Med _ F
其他条件下,即被监控时间段内的失败业务数Sum_F小于或者等于失败样本参考数Med_F、失败样本参考数Med_F小于或者等于0或者二者条件都满足时,调整失败率参考值Rate_Adjust_F的计算公式为:
Rate _ Adjust _ F = Avg _ F + Sum _ F Avg _ Sum + Sum
S204;计算相对于调整成功率参考值Rate_Adjust_S对应的偏离分N,或者调整失败率参考值Rate_Adjust_F对应的偏离分N。
对应调整成功率参考值Rate_Adjust_S的偏离分的计算过程如下:
如果上述步骤S203计算所得的调整成功率参考值Rate_Adjust_S的值小于波动率告警阈值Vol_Gate的值,则将调整成功率参考值Rate_Adjust_S相对于波动率告警阈值Vol_Gate的变化波动大小规定为该异常事件的严重性得分,为了便于观察分析,可将严重性得分放大100倍以后的数值叫做偏离分N。
需要说明的是,本实施例中,上述波动率告警阈值Vol_Gate的值与第一告警阈值First_Gate的值相等,即波动率告警阈值Vol_Gate采用的是第一告警阈值First_Gate的值。除此之外,波动率告警阈值Vol_Gate也可采用专门设定的其它数值,在此不做限定。
本实施例所述偏离分计算过程如下:
偏离分N=(Vol_Gate-Rate_Adjust_S)×100
进一步地,
偏离分N=(First_Gate-Rate_Adjust_S)×100
首先分析调整成功率参考值Rate_Adjust_S,结合数据验证发现:
其一,调整成功率参考值Rate_Adjust_S与被监控时间段内的失败业务数Sum_F成反相关,且调整成功率参考值Rate_Adjust_S对监控时间段内的失败业务数Sum_F非常敏感,即使在被监控时间段内的成功业务数Sum_S、总业务数Sum远大于被监控时间段内的失败业务数Sum_F的情况下也非常敏感;
进一步地,偏离分N与被监控时间段内的失败业务数Sum_F成反相关,且偏离分N对监控时间段内的失败业务数Sum_F非常敏感,即使在被监控时间段内的成功业务数Sum_S、总业务数Sum远大于被监控时间段内的失败业务数Sum_F的情况下也非常敏感。这种敏感特性能很好的保证一些对业务数据控制非常严格的业务性质当中能够更准确的判断以及衡量被监控时间段内的业务数据出现的异常情况,比如:业务监控系统中对涉及货币的业务数据要求非常严格,如果被监控时间段内的失败业务数较小,出现1笔或者2笔失败数,这种情况下,偏离分N都能明显的反映出此时的业务出现异常的严重性。
其二,在被监控时间段内的成功业务数Sum_S、总业务数Sum很小的情况下,即使在该被监控时间段内失败业务数数Sum_F接近甚至超过成功业务数Sum_S,即业务失败率大于业务成功率,调整成功率参考值Rate_Adjust_S也不会出现大的波动变化;
进一步地,在被监控时间段内的成功业务数Sum_S、总业务数Sum很小的情况下,调整成功率参考值Rate_Adjust_S不出现大的波动变化,则偏离分N也不会发生大的变化。偏离分N的这种特性可解决以下情况,即:在深夜发生的仅有的一笔或者两笔交易均失败了,实际的业务当中,这种情况是能够被接受的。此时,被监控时间段内的总业务数Sum很小且成功业务数Sum_S也很小的情况下,偏离分N就不会因为成功业务数Sum_S较小或甚至为0产生较大的变化。
如果步骤S203计算所得的调整成功率参考值Rate_Adjust_S大于波动率告警阈值Vol_Gate规定此时的偏离分N为0。
2)调整失败率参考值Rate_Adjust_F对应的偏离分的计算过程如下:
如果上述步骤S203计算所得的调整失败率参考值Rate_Adjust_F大于波动率告警阈值Vol_Gate,则将调整失败率参考值Rate_Adjust_F相对于波动率告警阈值Vol_Gate的变化大小规定为该异常事件的严重性得分,为了便于观察分析,将严重性得分放大100倍以后的数值叫做偏离分N。
需要说明的是,本实施例中,上述波动率告警阈值Vol_Gate的值与第一告警阈值First_Gate的值相等,即波动率告警阈值Vol_Gate采用的是第一告警阈值First_Gate的值。除此之外,波动率告警阈值Vol_Gate也可采用专门设定的其它数值,在此不做限定。
本实施例所述偏离分N计算过程如下:
N=(Rate_Adjust_F-Vol_Gate)×100
进一步地,
N=(Rate_Adjust_F-First_Gate)×100
首先分析调整失败率参考值Rate_Adjust_F,结合数据的验证发现:
其一,调整失败率参考值Rate_Adjust_F与被监控时间段内的失败业务数Sum_F成正相关,与被监控时间段内的成功业务数Sum_S成反相关;
进一步地,偏离分N与被监控时间段内的失败业务数Sum_F也成正相关,与被监控时间段内的成功业务数Sum_S成反相关。并且:
被监控时间段内的失败业务数Sum_F增大,成功业务数Sum_S不变,则总业务数Sum也增大并且增大的幅度与失败业务数Sum_F增大的幅度相同,此时,偏离分N变大,但是变化的幅度较小;
被监控时间段内的失败业务数Sum_F增大,成功业务数Sum_S也增大,则总业务数Sum也增大并且增大的幅度大于失败业务数Sum_F增大的幅度,此时,偏离分N变大,但是变化的幅度很小;
被监控时间段内的失败业务数Sum_F增大,成功业务数Sum_S减小,则总业务数Sum有可能增大、减小或者不变,但此时总业务数Sum的变化幅度小于失败业务数Sum_F的变化幅度,此时,偏离分N变大,但是变化的幅度较大;
总而言之,如果被监控时间段内的失败业务数Sum_F相对于总业务数Sum的比率(即:业务失败率Rate_Now_F)增加,则偏离分N将变大;业务失败率Rate_Now_F变小,则偏离分N也变小。
如果步骤S203计算所得的调整失败率参考值Rate_Adjust_F的值依旧小于或者等于波动率告警阈值Vol_Gate规定此时的偏离分N为0。
S205;判断偏离分N是否达到告警的条件。
在判断偏离分N是否达到告警条件之前,首先需要当前业务的敏感度,设定好敏感度后,需要设定不同敏感度对应的报警条件。本实施例中,设定了高、中、低三种不同的敏感度,各敏感度与报警条件关系如下表:
告警判断 不告警 告警
高敏感度 0<N<=5 5<N
中敏感度 0<N<=10 10<N
低敏感度 0<N<=15 15<N
需要说明的是,敏感度是用来判断或者和衡量不同业务性质下该业务与具体某一业务数据之间的变化关系,敏感度是根据不同的业务性质以及不同的业务场景而设定,在此不做限制。
另外,还需要说明的是,上述高敏感度是指该业务对偏离分N表现的非常严格,在高敏感度下触发告警条件只需要很小的偏离分N。例如:在实际业务中,对于用户确认付款这一操作必须敏感,即选择高敏感度。类似的,其他涉及到货币支付等操作也必须选择高敏感度,根据上述步骤S204的结论,如果在用户付款操作中出现很小的失败业务数Sum_F,则偏离分N也较小,此时就必须采用高敏感度将付款操作中出现很小的失败业务数这一事件告警出来。原因在于:在一次付款操作中,付款金额可大可小,如果本次付款金额很大的情况下恰好本次业务操作失败,如果采用低敏感度或者中敏感度,上述付款金额很大且业务操作失败这种情况很可能不会被告警出来,则造成的损失将会很大,甚至会造成客户的投诉。如果此时采用高敏感度将上述付款金额很大且业务操作失败这一事件告警出来,能够减少投诉、降低损失。
上述低敏感度是指该业务对偏离分N变化的容忍度很大。例如,在实际的业务中,对于用户提交订单这一事件的失败业务系统的容忍度很大,可以选择较低的敏感度。
完成上述敏感度与报警条件关系的设定之后,根据上述步骤S204中计算偏离分N所得结果判断偏离分N是否达到报警条件:
如果上述步骤S204计算所得的偏离分N达到了被监控时间段对应的敏感度下设置的告警条件,即:偏离分N大于5,则执行下述步骤S206的操作;
如果上述步骤S204计算所得的偏离分N没有达到被监控时间段对应的敏感度下设置的告警条件,不作处理。
S206;如果上述步骤S205的判断结果表明该异常事件需要作出报警,则对该异常事件执行具体的告警操作。
根据S205对该被监控时间段进行二次判断后表明该时间段内的业务数据发生异常波动的变化很大,需要告警,则还需要设置适当的告警方式。本实施例中,将每个敏感度下的告警区间分为三部分,分别匹配三种不同的告警方式:旺旺/邮件、短信以及电话,如下表:
N/告警区间 不告警 旺旺/邮件 短信 电话
高敏感度 0<N<=5 5<N<=10 10<N<=15 15<N
中敏感度 0<N<=10 10<N<=20 20<N<=30 30<N
低敏感度 0<N<=15 15<N<=30 30<N<=45 45<N
根据该异常事件匹配的告警区间,执行该告警区间内的告警操作。将告警范围划分为几个告警区间,可以根据该异常事件的严重性选择不同方式的告警,比如在实际业务当中,如果连续几笔付款操作都出现异常,则需要做出紧急处理,即电话通知告警;如果出现异常的是订单提交错误,则可以选择旺旺或者邮件通知告警;如果连续几笔订单的提交出错,则选择短信通知。采取这样的告警方式,能够根据异常事件的严重性确定该异常事件告警的优先级,一定程度内能够减少损失。在实际业务当中,可以根据实际的业务情况或者其他因素设定一种或者多种告警方式,在此不作限定。
上述步骤S101-S206是本实施例采用的一种优选的技术方案,除此之外,也可以采用其它与上述步骤S101-S206所描述的技术方案相类似或者简化的技术方案,例如:
1)根据步骤S101获取被监控时间段的业务数据,计算并获得被监控业务时间段的业务成功率Rate_Now_S或者业务失败率Rate_Now_F;
2)根据步骤S107将所述业务成功率Rate_Now_S或者业务失败率Rate_Now_F与对应的第一告警阈值First_Gate相比较,若所述业务成功率Rate_Now_S小于或等于对应的第一告警阈值First_Gate;或者业务失败率Rate_Now_F大于对应的第一告警阈值Rate_Now_F,则判定被监控时间段为异常事件;
3)根据步骤S201对所述异常事件进行异常严重性判断,并按照步骤S202计算失败样本参考数Med_F;
4)完成以上几个步骤后,与步骤S203相类似,计算调整成功率参考值Rate_Adjust_S,或者调整失败率参考值Rate_Adjust_S:
此处采用的调整成功率参考值Rate_Adjust_S,或者调整失败率参考值Rate_Adjust_F的计算方式是直接将被监控时间段内的业务数和往期业务数据代入如下公式计算获得;
调整成功率参考值:
Rate _ Adjust _ S = Avg _ S + Sum _ S Avg _ Sum + Sum
调整失败率参考值:
Rate _ Adjust _ F = Avg _ F + Sum _ F Avg _ Sum + Sum
5)根据步骤4)获得调整成功率参考值Rate_Adjust_S,或者调整失败率参考值Rate_Adjust_F后,将调整成功率参考值Rate_Adjust_S或者调整失败率参考值Rate_Adjust_F与预设的波动率告警阈值Vol_Gate相比较,从而判断所述异常事件的严重程度。
需要说明的是,所述波动率告警阈值Vol_Gate既可以采用上述步骤S204中的值(第一告警阈值First_Gate),也可以依据其它算法计算获得,或者依据往期业务数据提前预设,在此不作限定。
本申请第三实施例提供一种网络动态业务监控装置。
在上述的实施例中,提供了一种网络动态业务监控方法,与之相对应的,本申请还提供了一种网络动态业务监控装置。
参照图5,其示出了根据本申请第三实施例提供的一种网络动态业务监控装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关的部分请参见方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例提供一种网络动态业务成功率监控装置,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
成功率参考值计算单元,用于根据所述往期业务数据提取单元提取的往期业务数据计算获得成功率参考值;
调整成功率参考值计算单元,接收所述成功率参考值计算单元输出的成功率参考值计算结果,以成功率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入成功率参考值的计算公式,对成功率参考值进行调整计算,得到调整成功率参考值;
严重异常判断单元,用于接收所述调整成功率参考值计算单元输出的调整成功率参考值,并判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
可选的,所述网络动态业务成功率监控装置包括:
异常事件初步判断单元,用于判断被监控时间段的业务成功率是否小于或者等于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整成功率参考值计算单元对成功率参考值进行调整计算;若否,则不启动所述调整成功率参考值计算单元。
可选的,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务成功率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>。
可选的,所述网络动态业务成功率监控装置包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
本实施例另外提供一种网络动态业务失败率监控装置,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
失败率参考值计算单元,用于根据所述往期业务数据计算获得失败率参考值;
调整失败率参考值计算单元,接收所述失败率参考值计算单元输出的失败率参考值计算结果,以失败率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入失败率参考值的计算公式,对失败率参考值进行调整计算,得到调整失败率参考值;
严重异常判断单元,用于接收所述调整失败率参考值计算单元输出的调整失败率参考值,并判断所述调整失败率参考值是否大于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
可选的,所述网络动态业务失败率监控装置包括:
异常事件初步判断单元,用于判断被监控时间段的业务失败率是否大于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整失败率参考值计算单元对失败率参考值进行调整计算;若否,则不启动所述调整失败率参考值计算单元。
可选的,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务失败率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:1-<参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>>。
可选的,所述网络动态业务失败率监控装置包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (20)

1.一种网络动态业务监控方法,其特征在于,包括以下步骤:
从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
根据所述往期业务数据计算获得成功率参考值;
以成功率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入成功率参考值的计算公式,对成功率参考值进行调整计算,得到调整成功率参考值;
判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值,若是,则判断该被监控时间段内的网络业务出现严重异常。
2.根据权利要求1所述的网络动态业务监控方法,其特征在于,所述成功率参考值通过如下方式获得:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段;所述固定时长与被监控时间段的时长相等;以下述数据和公式之一计算所述成功率参考值:
以所述特定时间段内的各个单位时间段的平均成功业务数和各个单位时间段的平均总业务数为依据,将所述平均成功业务数除以所述各个单位时间段的平均总业务数,作为所述成功率参考值;
或者,以所述特定时间段内的各个单位时间段的成功业务数中位数和各个单位时间段的总业务数的中位数作为依据,将所述各个单位时间段的成功业务数除以所述各个单位时间段的总业务数的中位数,作为所述成功率参考值;
或者,以所述特定时间段内的各个单位时间段的成功业务数平均数与各个单位时间段的成功业务数中位数二者平均数、各个单位时间段总业务数的平均数以及各个单位时间段总业务数的中位数二者平均数为依据;将前者除以后者,作为所述成功率参考值。
3.根据权利要求2所述的网络动态业务监控方法,其特征在于,所述调整成功率参考值的计算公式,具体是:在所述计算成功率参考值的计算公式中,分子加上被监控时间段内的成功业务数,分母加上被监控时间段内的总业务数。
4.根据权利要求2所述的网络动态业务监控方法,其特征在于,在进行所述对调整成功率参考值进行计算的步骤之前,先判断被监控时间段的失败业务数是否大于失败样本参考数,且失败样本参考数是否大于0;
若是,则采用如下方式对成功率参考值进行调整计算:将被监控时间段内的成功业务数乘以失败业务数与失败样本参考数的比值,加在成功率参考值计算公式的分子上;将被监控时间段内的总业务数乘以失败业务数与失败样本参考数的比值,加在成功率参考值计算公式的分母上;所述失败样本参考数采用以下方式之一计算:参考时间段内,存在失败样本的各个单位时间段的失败样本的平均数;或者,参考时间段内,存在失败样本的各个单位时间段的失败样本的中位数;或者,参考时间段内,存在失败样本的各个单位时间段的失败样本的平均数,与存在失败样本的各个单位时间段的失败样本的中位数的平均数;
若否,则采用如下方法进行所述调整计算:在所述计算成功率参考值的计算公式中,分子加上被监控时间段内的成功业务数,分母加上被监控时间段内的总业务数。
5.根据权利要求1所述的网络动态业务监控方法,其特征在于,在所述对成功率参考值进行调整计算的步骤之前,先判断被监控时间段的业务成功率是否小于或等于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,进入所述对成功率参考值进行调整计算的步骤;若否,则不再进入对成功率参考值进行调整计算步骤。
6.根据权利要求5所述的网络动态业务监控方法,其特征在于,所述第一告警阈值采用如下算法实现:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段,并计算出每个单位时间段的业务成功率;
以下述公式计算所述第一告警阈值:所述特定时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>。
7.根据权利要求6所述的网络动态业务监控方法,其特征在于,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;并以下述公式判断所述第一告警阈值波动是否异常:
<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
8.根据权利要求1所述的网络动态业务监控方法,其特征在于,若判断被监控时间段内的网络业务出现严重异常,则用波动率告警阈值减去在所述对成功率参考值进行调整计算的步骤中得到的所述调整成功率参考值,将差值乘以100,获得偏离分;偏离分越大,则所述网络业务出现的异常事件异常程度越严重。
9.根据权利要求8所述的网络动态业务监控方法,其特征在于,将所述偏离分与预设的偏离分区间比较,根据其落入的偏离分区间,进行预定处理;所述偏离分区间是以偏离分分值为依据,从小到大设置的若干区间,每个区间采用不同的处理方式,且分值越大的偏离分区间,其处理方式的级别越高。
10.根据权利要求9所述的网络动态业务监控方法,其特征在于,根据网络业务类型的不同设置不同的敏感度,并对应不同的敏感度设置不同的偏离分区间。
11.一种网络动态业务监控装置,其特征在于,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
成功率参考值计算单元,用于根据所述往期业务数据提取单元提取的往期业务数据计算获得成功率参考值;
调整成功率参考值计算单元,接收所述成功率参考值计算单元输出的成功率参考值计算结果,以成功率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入成功率参考值的计算公式,对成功率参考值进行调整计算,得到调整成功率参考值;
严重异常判断单元,用于接收所述调整成功率参考值计算单元输出的调整成功率参考值,并判断所述调整成功率参考值是否小于或者等于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
12.根据权利11所述的网络动态业务监控装置,其特征在于,包括:
异常事件初步判断单元,用于判断被监控时间段的业务成功率是否小于或者等于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整成功率参考值计算单元对成功率参考值进行调整计算;若否,则不启动所述调整成功率参考值计算单元。
13.根据权利12所述的网络动态业务监控装置,其特征在于,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务成功率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>。
14.根据权利13所述的网络动态业务监控装置,其特征在于,包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
15.一种网络动态业务监控方法,其特征在于,包括以下步骤:
从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
根据所述往期业务数据计算获得失败率参考值;
以失败率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入失败率参考值的计算公式,对失败率参考值进行调整计算,得到调整失败率参考值;
判断所述调整失败率参考值是否小于或者等于预设的波动率告警阈值,若是,则判断该被监控时间段内的网络业务出现严重异常。
16.根据权利要求15所述的网络动态业务监控方法,其特征在于,所述失败率参考值通过如下方式获得:
将所述往期业务数据以固定时长为时间单位,从所述特定时间段的起始时间点开始,将该特定时间段依次划分为多个单位时间段;所述固定时长与被监控时间段的时长相等;以下述数据和公式之一计算所述失败率参考值:
以所述特定时间段内的各个单位时间段的平均失败业务数和各个单位时间段的平均总业务数为依据,将所述平均失败业务数除以所述各个单位时间段的平均总业务数,作为所述失败率参考值;
或者,以所述特定时间段内的各个单位时间段的失败业务数中位数和各个单位时间段的总业务数的中位数作为依据,将所述各个单位时间段的失败业务数除以所述各个单位时间段的总业务数的中位数,作为所述失败率参考值;
或者,以所述特定时间段内的各个单位时间段的失败业务数平均数与各个单位时间段的失败业务数中位数二者平均数、各个单位时间段总业务数的平均数以及各个单位时间段总业务数的中位数二者平均数为依据;将前者除以后者,作为所述失败率参考值。
17.一种网络动态业务监控装置,其特征在于,包括:
往期业务数据提取单元,用于从网络业务数据记录中提取已经完成的特定时间段的网络业务数据作为往期业务数据;
失败率参考值计算单元,用于根据所述往期业务数据计算获得失败率参考值;
调整失败率参考值计算单元,接收所述失败率参考值计算单元输出的失败率参考值计算结果,以失败率参考值为基础,将被监控时间段内的网络业务数据作为历史数据的一部分,和往期业务数据一起,代入失败率参考值的计算公式,对失败率参考值进行调整计算,得到调整失败率参考值;
严重异常判断单元,用于接收所述调整失败率参考值计算单元输出的调整失败率参考值,并判断所述调整失败率参考值是否大于预设的波动率告警阈值,若是,则输出该被监控时间段内的网络业务出现严重异常的判断结果。
18.根据权利17所述的网络动态业务监控装置,其特征在于,包括:
异常事件初步判断单元,用于判断被监控时间段的业务失败率是否大于预设的第一告警阈值,若是,则初步判断所述被监控时间段内的网络业务出现异常事件,并启动所述调整失败率参考值计算单元对失败率参考值进行调整计算;若否,则不启动所述调整失败率参考值计算单元。
19.根据权利18所述的网络动态业务监控装置,其特征在于,所述第一告警阈值由第一告警阈值计算单元计算并输出,所述第一告警阈值计算单元包括:
往期业务数据划分子单元,用于将所述往期业务数据以固定时长为时间单位,从参考时间段的起始时间点开始,将参考依次划分为多个单位时间段,计算出每个单位时间段的业务失败率并输出;
第一告警阈值计算子单元,用于接收所述往期业务数据划分子单元输出所述每个单位时间段的业务成功率,并以下述公式计算所述第一告警阈值:1-<参考时间段内单位时间段的业务成功率的下四分位数-0.5*<上四分位数-下四分位数>>。
20.根据权利19所述的网络动态业务监控装置,其特征在于,包括第一告警阈值矫正单元,所述第一告警阈值矫正单元包括:
第一告警阈值获取子单元,设所述被监控时间段所在日为今天,所述参考时间段具体为昨天;根据昨天的网络业务数据对应的第一告警阈值为今日第一告警阈值;类似的,前天的网络业务数据对应的第一告警阈值为昨日第一告警阈值;
第一告警阈值波动判断子单元,用于接收所述第一告警阈值获取子单元输出的所述今日第一告警阈值、昨日第一告警阈值,并以下述公式判断所述第一告警阈值波动是否异常:<今日第一告警阈值-昨日第一告警阈值>/昨日第一告警阈值,若所述计算结果的绝对值大于0.5,则判断所述第一告警阈值波动异常。
CN201410033212.XA 2014-01-23 2014-01-23 网络动态业务监控方法及装置 Active CN104811344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410033212.XA CN104811344B (zh) 2014-01-23 2014-01-23 网络动态业务监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410033212.XA CN104811344B (zh) 2014-01-23 2014-01-23 网络动态业务监控方法及装置

Publications (2)

Publication Number Publication Date
CN104811344A true CN104811344A (zh) 2015-07-29
CN104811344B CN104811344B (zh) 2019-04-12

Family

ID=53695855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410033212.XA Active CN104811344B (zh) 2014-01-23 2014-01-23 网络动态业务监控方法及装置

Country Status (1)

Country Link
CN (1) CN104811344B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN106412979A (zh) * 2016-08-31 2017-02-15 广州市玄武无线科技股份有限公司 一种用于中间件的监控方法及装置
CN107094096A (zh) * 2017-04-19 2017-08-25 北京云端智度科技有限公司 一种自适应的cdn业务分析监控系统
CN107124290A (zh) * 2016-02-25 2017-09-01 中国移动通信集团上海有限公司 一种告警阈值生成方法及装置
CN107153593A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种互联网业务监控阈值的确定方法及装置
CN107608862A (zh) * 2017-10-13 2018-01-19 众安信息技术服务有限公司 监控告警方法、监控告警装置及计算机可读存储介质
CN107766299A (zh) * 2017-10-24 2018-03-06 携程旅游信息技术(上海)有限公司 数据指标异常的监控方法及其系统、存储介质、电子设备
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置
CN108932613A (zh) * 2017-05-25 2018-12-04 北京嘀嘀无限科技发展有限公司 互联网支付渠道的监控方法及监控装置、设备和存储介质
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN109756384A (zh) * 2017-11-01 2019-05-14 华为技术有限公司 数据源状态判定方法及装置
CN109919746A (zh) * 2019-02-01 2019-06-21 王亚萍 一种基于限定性税务业务类别的电子税务局数据预处理方法
CN109947816A (zh) * 2018-12-17 2019-06-28 阿里巴巴集团控股有限公司 模型参数计算方法、数据类型识别方法、装置和服务器
CN110474810A (zh) * 2019-08-21 2019-11-19 具东鹤 一种基于大数据的通信检测预警系统
CN110633165A (zh) * 2019-08-15 2019-12-31 平安普惠企业管理有限公司 故障处理方法、装置、系统服务器及计算机可读存储介质
WO2020048047A1 (zh) * 2018-09-03 2020-03-12 平安科技(深圳)有限公司 系统故障的预警方法、装置、设备及存储介质
CN110995506A (zh) * 2019-12-19 2020-04-10 腾讯云计算(北京)有限责任公司 告警量异常的定位方法、装置、存储介质和计算机设备
CN112115178A (zh) * 2019-06-21 2020-12-22 腾讯科技(深圳)有限公司 异常业务对象发现的方法、装置、终端设备以及存储介质
WO2021032056A1 (zh) * 2019-08-21 2021-02-25 深圳前海微众银行股份有限公司 一种处理批量任务的方法、装置、计算设备及存储介质
EP3779701A4 (en) * 2018-07-27 2021-05-26 Advanced New Technologies Co., Ltd. DATA MONITORING METHOD AND DEVICE, ELECTRONIC DEVICE AND COMPUTER READABLE STORAGE MEDIUM
CN113656243A (zh) * 2021-07-28 2021-11-16 连连(杭州)信息技术有限公司 一种业务指标监控方法、装置、设备及存储介质
CN113783749A (zh) * 2021-08-11 2021-12-10 太原市高远时代科技有限公司 一种基于网络端口检测设备故障的方法
CN113852591A (zh) * 2021-06-08 2021-12-28 天翼智慧家庭科技有限公司 基于改进四分位差法的摄像头异常访问识别与告警方法
CN114726758A (zh) * 2022-06-01 2022-07-08 山东云天安全技术有限公司 工业网络异常确定方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625740A (zh) * 2009-07-28 2010-01-13 交通银行股份有限公司 一种应用业务监控方法、装置和系统
CN103167313A (zh) * 2011-12-08 2013-06-19 中国电信股份有限公司 视频监控业务质量测试方法和系统、质量测试服务器
CN103412805A (zh) * 2013-07-31 2013-11-27 交通银行股份有限公司 一种it故障源诊断方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625740A (zh) * 2009-07-28 2010-01-13 交通银行股份有限公司 一种应用业务监控方法、装置和系统
CN103167313A (zh) * 2011-12-08 2013-06-19 中国电信股份有限公司 视频监控业务质量测试方法和系统、质量测试服务器
CN103412805A (zh) * 2013-07-31 2013-11-27 交通银行股份有限公司 一种it故障源诊断方法及系统

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN107124290A (zh) * 2016-02-25 2017-09-01 中国移动通信集团上海有限公司 一种告警阈值生成方法及装置
CN107153593B (zh) * 2016-03-02 2021-01-05 创新先进技术有限公司 一种互联网业务监控阈值的确定方法及装置
CN107153593A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 一种互联网业务监控阈值的确定方法及装置
CN106412979A (zh) * 2016-08-31 2017-02-15 广州市玄武无线科技股份有限公司 一种用于中间件的监控方法及装置
CN107094096A (zh) * 2017-04-19 2017-08-25 北京云端智度科技有限公司 一种自适应的cdn业务分析监控系统
CN108932613A (zh) * 2017-05-25 2018-12-04 北京嘀嘀无限科技发展有限公司 互联网支付渠道的监控方法及监控装置、设备和存储介质
CN107608862A (zh) * 2017-10-13 2018-01-19 众安信息技术服务有限公司 监控告警方法、监控告警装置及计算机可读存储介质
CN107608862B (zh) * 2017-10-13 2020-10-27 众安信息技术服务有限公司 监控告警方法、监控告警装置及计算机可读存储介质
CN107766299A (zh) * 2017-10-24 2018-03-06 携程旅游信息技术(上海)有限公司 数据指标异常的监控方法及其系统、存储介质、电子设备
CN107766299B (zh) * 2017-10-24 2021-05-18 携程旅游信息技术(上海)有限公司 数据指标异常的监控方法及其系统、存储介质、电子设备
CN109756384A (zh) * 2017-11-01 2019-05-14 华为技术有限公司 数据源状态判定方法及装置
CN109756384B (zh) * 2017-11-01 2021-01-15 华为技术有限公司 数据源状态判定方法及装置、计算机可读存储介质
CN108829638A (zh) * 2018-06-01 2018-11-16 阿里巴巴集团控股有限公司 一种业务数据波动处理方法及装置
US11200136B2 (en) 2018-07-27 2021-12-14 Advanced New Technologies Co., Ltd. Data monitoring methods, apparatuses, electronic devices, and computer readable storage media
EP3779701A4 (en) * 2018-07-27 2021-05-26 Advanced New Technologies Co., Ltd. DATA MONITORING METHOD AND DEVICE, ELECTRONIC DEVICE AND COMPUTER READABLE STORAGE MEDIUM
WO2020048047A1 (zh) * 2018-09-03 2020-03-12 平安科技(深圳)有限公司 系统故障的预警方法、装置、设备及存储介质
CN109947816A (zh) * 2018-12-17 2019-06-28 阿里巴巴集团控股有限公司 模型参数计算方法、数据类型识别方法、装置和服务器
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN109660402B (zh) * 2018-12-25 2021-11-30 钛马信息网络技术有限公司 业务系统实时运营监控平台及方法
CN109919746A (zh) * 2019-02-01 2019-06-21 王亚萍 一种基于限定性税务业务类别的电子税务局数据预处理方法
CN112115178B (zh) * 2019-06-21 2024-03-19 腾讯科技(深圳)有限公司 异常业务对象发现的方法、装置、终端设备以及存储介质
CN112115178A (zh) * 2019-06-21 2020-12-22 腾讯科技(深圳)有限公司 异常业务对象发现的方法、装置、终端设备以及存储介质
CN110633165B (zh) * 2019-08-15 2022-08-23 平安普惠企业管理有限公司 故障处理方法、装置、系统服务器及计算机可读存储介质
CN110633165A (zh) * 2019-08-15 2019-12-31 平安普惠企业管理有限公司 故障处理方法、装置、系统服务器及计算机可读存储介质
CN110474810A (zh) * 2019-08-21 2019-11-19 具东鹤 一种基于大数据的通信检测预警系统
WO2021032056A1 (zh) * 2019-08-21 2021-02-25 深圳前海微众银行股份有限公司 一种处理批量任务的方法、装置、计算设备及存储介质
CN110474810B (zh) * 2019-08-21 2023-09-05 内蒙古高投共建科技有限责任公司 一种基于大数据的通信检测预警系统
CN110995506B (zh) * 2019-12-19 2023-01-03 腾讯云计算(北京)有限责任公司 告警量异常的定位方法、装置、存储介质和计算机设备
CN110995506A (zh) * 2019-12-19 2020-04-10 腾讯云计算(北京)有限责任公司 告警量异常的定位方法、装置、存储介质和计算机设备
CN113852591A (zh) * 2021-06-08 2021-12-28 天翼智慧家庭科技有限公司 基于改进四分位差法的摄像头异常访问识别与告警方法
CN113852591B (zh) * 2021-06-08 2023-09-22 天翼数字生活科技有限公司 基于改进四分位差法的摄像头异常访问识别与告警方法
CN113656243A (zh) * 2021-07-28 2021-11-16 连连(杭州)信息技术有限公司 一种业务指标监控方法、装置、设备及存储介质
CN113656243B (zh) * 2021-07-28 2024-05-31 连连(杭州)信息技术有限公司 一种业务指标监控方法、装置、设备及存储介质
CN113783749A (zh) * 2021-08-11 2021-12-10 太原市高远时代科技有限公司 一种基于网络端口检测设备故障的方法
CN114726758A (zh) * 2022-06-01 2022-07-08 山东云天安全技术有限公司 工业网络异常确定方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN104811344B (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN104811344A (zh) 网络动态业务监控方法及装置
CN110633893B (zh) 一种策略效能监控方法、装置以及计算机设备
CN108256810B (zh) 保险业务审批流程处理方法和装置
CN108415990B (zh) 数据质量监控方法、装置、计算机设备和存储介质
Chen et al. A study on operational risk and credit portfolio risk estimation using data analytics
CN113095931A (zh) 贷后风险监控方法、装置及计算机设备
CN114943565A (zh) 基于智能算法的电力现货价格预测方法及装置
CN105005575A (zh) 一种企业智能预测快速开发接口方法
Coronas et al. MONTE-CARLO probabilistic valuation of concentrated solar power systems in Spain under the 2014 retroactive regulatory framework
CN111309576A (zh) 一种压力测试方法和装置
CN114387085B (zh) 流水数据处理方法、装置、计算机设备和存储介质
CN111164633B (zh) 一种评分卡模型的调整方法、装置、服务器及存储介质
CN113744043A (zh) 小微企业的信贷风险评估方法、装置及计算机设备
CN113129127A (zh) 预警方法和装置
CN113743532B (zh) 异常检测方法、装置、设备及计算机存储介质
CN115049327B (zh) 数据处理方法、装置、电子设备及存储介质
CN114816770B (zh) 一种衡量计算机服务压力状态的通用系统及实现方法
US20230394069A1 (en) Method and apparatus for measuring material risk in a data set
CN116433402B (zh) 用户电费自动化销账的分析处理装置、方法和存储介质
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN113703974B (zh) 一种预测服务器容量的方法及装置
CN113824847B (zh) 计费异常的确定方法、装置、计算设备及计算机存储介质
CN117010891A (zh) 资源转换的数据处理方法、装置、设备、介质和程序产品
CN115439229A (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN113703974A (zh) 一种预测服务器容量的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191212

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Patentee after: Innovative advanced technology Co., Ltd

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Co., Ltd.