CN115499288A - 业务监控方法、装置、设备及介质 - Google Patents
业务监控方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115499288A CN115499288A CN202210818217.8A CN202210818217A CN115499288A CN 115499288 A CN115499288 A CN 115499288A CN 202210818217 A CN202210818217 A CN 202210818217A CN 115499288 A CN115499288 A CN 115499288A
- Authority
- CN
- China
- Prior art keywords
- information
- monitoring
- abnormal
- data
- exception
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 191
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000002159 abnormal effect Effects 0.000 claims abstract description 195
- 230000007613 environmental effect Effects 0.000 claims abstract description 42
- 238000013507 mapping Methods 0.000 claims abstract description 14
- 230000005856 abnormality Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000015556 catabolic process Effects 0.000 claims description 9
- 238000006731 degradation reaction Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 21
- 230000004044 response Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 238000007664 blowing Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Alarm Systems (AREA)
Abstract
本发明涉及通信技术领域,公开了一种业务监控方法、装置、设备及介质,其中,业务监控方法包括:获取各业务的监控信息和环境条件信息;所述监控信息至少包括监控时间和目标监控数据;将所述监控信息与预设的标准信息进行对比处理,以生成目标监控数据的异常数据信息;根据所述异常数据信息和所述环境条件信息,生成异常数据产生原因;根据预设的异常处理规则和异常数据产生原因之间的映射关系,生成执行信息并执行。本方案能对业务系统进行有效监控,生成执行信息并执行。
Description
技术领域
本发明涉及监控技术领域,尤其涉及一种业务监控方法、装置、设备及 介质。
背景技术
随着近代我国各行业软件成熟度的提高以及网络技术的发展,企业的日 常经营活动已经离不开计算机系统,尤其对于运营了电商类业务的企业来说, 计算机系统甚至是企业的主力生产工具。通常来说,计算机系统的开发人员 负责开发业务功能,企业的运维人员负责计算机系统的业务监控工作。具体 的,一方面,运维人员可以采集信息化系统运行时的日常数据,从而发现计 算机系统的性能问题和运行问题,提高系统稳定性。另一方面,运维人员可 以收集系统运行时产生的业务数据,可以提升业务洞察力及业务运营能力。
目前,在业务监控过程中,通过对工作日志进行简单的对比分析,以判 断业务情况,并在数据异常时发出警告。但业务异常判断时,没有考虑环境 条件(例如:天气、节假日等)对业务影响,导致判断结果准确性差。
发明内容
鉴于以上所述现有技术的缺点,本发明提供一种业务监控方法、装置、 设备及介质,以解决上述技术问题。
本发明提供的业务监控方法,包括:
获取各业务的监控信息和环境条件信息;所述监控信息至少包括监控时 间和目标监控数据;
将所述监控信息与预设的标准信息进行对比处理,以生成目标监控数据 的异常数据信息;
根据所述异常数据信息和所述环境条件信息,生成异常数据产生原因;
根据预设的异常处理规则和异常数据产生原因之间的映射关系,生成执 行信息并执行。
于本发明的一实施例中,所述将所述监控信息与预设的标准信息进行对 比处理,以生成目标监控数据的异常数据信息,包括:
根据监控信息和预设的类别表,以获取所述目标监控数据的监控类别, 生成类别信息;
根据所述类别信息,以获取目标监控数据的标准信息;所述标准信息中 按照时间先后顺序划分有多个参考周期,所述参考周期包括标准参考数据和 异常等级评判标准;
将所述目标监控数据与所述标准信息中的标准参考数据进行对比处理, 以获取目标监控数据与标准参考数据之间的差值;
根据所述差值和所述异常等级评判标准,生成所述异常数据信息。
于本发明的一实施例中,所述根据所述差值和所述异常等级评判标准, 生成所述异常数据信息,包括:
根据所述差值和异常等级评判标准,将各所述监控信息划分为不同的异 常等级;
根据所述类别信息和所述异常等级,生成所述异常数据信息。
于本发明的一实施例中,所述根据所述差值和异常等级评判标准,将各 所述监控信息划分为不同的异常等级后,还包括:
根据各业务之间预设的关联信息,获取各关联业务的监控信息,以生成 监控信息组;
若所述监控信息组中至少两个目标监控数据生成了异常数据信息,则根 据所述监控信息组中异常数据信息的数量,获取异常覆盖范围,以生成异常 范围信息;
根据所述异常范围信息、所述差值以及所述异常等级评判标准,重新划 分所述监控信息的异常等级。
于本发明的一实施例中,所述根据异常数据产生原因和预设的异常处理 规则之间的映射关系,生成执行信息并执行,包括:
若所述异常等级为一级异常,则根据异常处理规则,将执行信息通过文 本信息通知目标对象;
若所述异常等级为二级异常,则根据异常处理规则,将执行信息通过语 音通知目标对象;
若所述异常等级为三级异常,则根据异常处理规则,将执行信息通过语 音通知目标对象,同时进行业务的熔断和降级管理;
所述一级异常、二级异常和三级异常是根据异常等级严重程度从低至高 依次划分。
于本发明的一实施例中,所述将执行信息通过文本信息通知目标对象, 包括:
将所述执行信息的生成时间与预设的工作安排表进行对比处理,以确定 文本信息的发送时间;
若所述执行信息的生成时间为目标对象的工作时间,则将执行信息实时 发送给目标对象;
若所述执行信息的生成时间为目标发送对象的非工作时间,则在目标对 象的下一工作日将所述文本信息发送给目标对象。
于本发明的一实施例中,所述根据所述异常数据信息和所述环境条件信 息,生成异常数据产生原因,包括:
根据所述异常数据信息,获取目标监控数据的历史异常数据产生原因;
根据所述历史异常数据产生原因,以获取所述异常数据信息与环境条件 信息之间的关联关系;
根据所述关联关系,以生成异常数据产生原因。
本发明提供的业务监控装置,包括:
信息获取模块,用于获取各业务的监控信息和环境条件信息;所述监控 信息至少包括监控时间和目标监控数据;
处理模块,用于将所述监控信息与预设的标准信息进行对比处理,以生 成目标监控数据的异常数据信息;
判断模块,用于根据所述异常数据信息和所述环境条件信息,生成异常 数据产生原因;
执行模块,用于根据异常数据产生原因和预设的异常处理规则之间的映 射关系,生成执行信息并执行。
本发明提供的计算机设备,包括:
一个或多个处理器和存储器;
所述存储器上存储有计算机程序,当所述一个或多个处理器执行所述程 序时,使得所述设备执行所述业务监控方法。
本发明提供的计算机可存读存储介质,其上存储有计算机程序,所述计 算机程序可被所述一个或多个处理器所执行,以使所述处理器执行所述业务 监控方法。
上述业务监控方法、装置、设备及介质所实现的方案中,对各业务系统 进行统一监控管理,且监控过程中,不仅考虑监控信息本身,还考虑环境因 素(例如天气、节假日、季节等)对目标监控数据的影响,以增加异常数据 信息的准确性,便于更加准确的判断出异常数据产生原因。
与各个业务系统单独监控管理相比,可更加直观了解到各业务的数据变 化,并在异常数据信息产生后,便于工作人员直观、快速的了解异常情况。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性 的,并不能限制本申请。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一示例性实施例示出的业务监控的实施环境示意图。
图2是本申请的一示例性实施例示出的业务监控方法的流程图;
图3是图2所示实施例中的步骤S220在一示例性的实施例中的流程图;
图4是图3所示实施例中的步骤S340在一示例性的实施例中的流程图;
图5是图4所示实施例中的步骤S420在一示例性的实施例中的流程图;
图6是图2所示实施例中的步骤S230在一示例性的实施例中的流程图;
图7是图6所示实施例中的步骤S620在一示例性的实施例中的流程图;
图8是在一示例性实施例示出的执行信息通过文本信息通知目标对象时 的流程图;
图9是本申请的一示例性实施例示出的业务监控装置的框图;
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构 示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由 本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以 通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可 以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。 需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组 合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的 基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组 件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一 种随意的改变,且其组件布局型态也可能更为复杂。
在下文描述中,探讨了大量细节,以提供对本发明实施例的更透彻的解 释,然而,对本领域技术人员来说,可以在没有这些具体细节的情况下实施 本发明的实施例是显而易见的,在其他实施例中,以方框图的形式而不是以 细节的形式来示出公知的结构和设备,以避免使本发明的实施例难以理解。
值得说明的是,业务监控主要侧重对业务状态数据的实时监控,收集数 据后对业务数据进行深入的统计分析,帮助业务发现问题,定位问题根源。
本发明实施例提供的业务监控方法,可应用在如图1所示的实施环境中, 其中,多个智能终端110与多个服务器120之间通过网络通信,智能终端110 可以为客户端,智能终端110也可以为服务端,客户端上装载有各业务的业 务系统,通过在客户端引入组件包(组件包为业务监控的程序包),以实现 业务数据采集,然后将采集的数据经过服务器120处理后发送给服务端,以 实现数据监控。
其中,智能终端110可以是智能手机、平板电脑、笔记本电脑或者可穿 戴设备等任意终端设备,但并不限于此。服务器120可以是独立的物理服务 器,也可以是多个业务服务器120构成的服务器集群或分布式系统,还可以 是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、 中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分 发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器120,在 此也不进行限制。智能终端110可以通过3G(第三代的移动信息技术)、4G (第四代的移动信息技术)、5G(第五代的移动信息技术)等无线网络与服 务端220进行通信,本处也不对此进行限制。
请参阅图2,图2是本申请的一示例性实施例示出的业务监控方法的流程 图。该方法可以应用于图1所示的实施环境。应理解的是,该方法也可以适 用于其它的示例性实施环境,并由其它实施环境中的设备具体执行,本实施 例不对该方法所适用的实施环境进行限制。
如图2所示,在一示例性的实施例中,业务监控方法至少包括步骤S210 至步骤S240,详细介绍如下:
步骤S210,获取各业务的监控信息和环境条件信息。监控信息至少包括 监控时间和目标监控数据。
首先需要说明的是,监控时间为获取目标监控数据的时间。目标监控数 据是指被监控业务的数据。所监控的业务可以包括注册业务、注销业务、保 险购买、保险理赔、投诉业务等。
在本实施例中,目标监控数据可以为请求次数、响应时间、请求数据、 响应数据等。环境条件信息指对目标监控数据具有影响的信息,包括天气、 自然灾害、经济环境变化等信息。
在一示例性实施例中,可以通过侵入式或非侵入式实现监控,通过在客 户端引入组件包,以实现客户端业务的监控。
其中,侵入式指运行的代码需依赖框架,如果将框架去掉或换一个框架, 就需要重新修改运行代码。如果使用侵入式的框架,一般需要继承或实现框 架的某一个类或接口,框架去除后运行代码将无法运行。也就是说,当引入 一个组件包后,其它运行代码或设计需要做响应的调整,以适应引入的组件 包,原有的运行代码才能继续运行。侵入式可以使引入组件跟框架更好的结 合,更容易充分的利用框架提供的功能,但对框架依赖较大,无法在框架外 使用。非侵入式,主要是利用反射和动态调用来实例化,运行代码中没有任何与框架交叉的类,将框架去除后,运行代码将不受任何影响,加上其它框 架后可以继续运行。非侵入式的代码对框架没有过多依赖,便于运行代码的 移植,但与用户代码互动的方式较为复杂。
在一示例性实施例中,可以根据实际需求选择侵入式或非侵入式以实现 监控。本实施例中选用轻微的侵入式实现接口监控,通过在各业务系统引入 组件包,以实现监控。即通过判断各业务系统是否引入组件包即可判断是否 对该业务系统进行监控。在业务系统运行期间,业务系统引入的组件包获取 业务系统的所有请求信息,包括请求的功能模块、请求的次数、响应的时间、 请求的数据和响应的数据等,并将获取的数据异步传输至业服务器。
步骤S220,将监控信息与预设的标准信息进行对比处理,以生成目标监 控数据的异常数据信息。
在一实施方式中,标准信息中按照时间先后顺序划分有多个参考周期, 参考周期包括标准参考数据和异常等级评判标准。
值得说明的是,考虑到一天中不同时段,业务情况可能并不一致,一年 中不同季节,业务情况可能也存在差别。因此,本实施例中,按照时间先后 划分多个参考周期,以便于在每个参考周期内,对目标监控数据进行分析。 且参考周期还可以以年为单位,对各年度数据进行分析。
在一示例性实施例中,根据目标监控数据的不同,异常数据信息可以为 请求网络异常、请求响应时间超过标准参考数据、请求的次数同比或环比增 加率低于标准参考数据等。
步骤S230,根据异常数据信息和环境条件信息,生成异常数据产生原因。
在一示例性的实施例中,根据目标监控数据的不同,异常数据产生的原 因可以为网络异常、超载、天气、自然灾害等。
示例性地,将环境条件信息作为生成异常数据产生原因的条件之一,以 获取不同环境条件下对数据异常产生的影响。例如雨天可能导致现场业务量 的降低,地震等自然灾害可能导致保险理赔数量的增加。
步骤S240,根据预设的异常处理规则和异常数据产生原因之间的映射关 系,生成执行信息并执行。
在一实施例中,预先拟定异常处理规则,以便于出现异常时,生成执行 信息并执行。例如,异常情况较为严重时,快速的通知目标对象,异常情况 轻微时,仅在工作日通知目标对象。
在另一实施例中,通过设置地址映射表,以记录异常数据产生原因到异 常处理规则的对应关系,当生成异常数据产生原因后,根据地址映射表,寻 找到对应异常处理规则的存储地址,以实现异常处理规格的调用。后文中的 映射关系采用同一原理,将不再赘述。
图3是图2所示实施例中步骤S220在一示例性地实施例中的流程图。如 图3所示,将监控信息与预设的标准信息进行对比处理,以生成目标监控数 据的异常数据信息时的过程可以包括步骤S310至步骤S340。
步骤S310,根据监控信息和预设的类别表,以获取目标监控数据的监控 类别,生成类别信息。
在一实施例中,通过预先设置类别表,并建立类别表与监控信息以及标 准信息之间的映射关系,以便于根据监控信息找到目标标准信息。
步骤S320,根据类别信息,以获取目标监控数据的标准信息。
其中,通过标准信息与类别信息之间的映射关系,以便于获取监控信息 后匹配标准信息。
步骤S330,将所述目标监控数据与所述标准信息中的标准参考数据进行 对比处理,以获取目标监控数据与标准参考数据之间的差值。
在一实施例中,根据监控时间,选定参考周期,并在参考周期内,将目 标监控数据与标准参考数据进行对比,以获取目标监控数据与标准参考数据 之间的差值。
步骤S340,根据差值和异常等级评判标准,生成异常数据信息。
值得说明的是,当异常数据信息生成时,则表明目标监控数据出现异常, 需要对应异常情况进行处理。
在一示例性的实施例中,业务系统受到非法攻击时,配置熔断接口以保 护业务系统。重要的业务功能出现问题(例如,请求响应速度慢)时,配置 降级接口,以保证重要业务的正常进行,降低损失。
图4是图3所示实施例中步骤S340在一示例性地实施例中的流程图。如 图4所示,根据差值和所述异常等级评判标准,生成异常数据信息时的过程 可以包括步骤S410至步骤S420。
步骤S410,根据差值和异常等级评判标准,将各监控信息划分为不同的 异常等级。
在一实施例中,异常等级根据异常严重程度从低至高依次划分为一级异 常、二级异常和三级异常。一级异常,表明目标监控数据出现异常,但异常 情况较小。二级异常,表明目标监控数据出现较为严重异常,需要工作人员 及时处理。三级异常,表面目标监控数据出现较大异常,需要立即进行熔断 和降级管理,并立即通知工作人员。异常等级的划分,以便于根据异常等级, 知道监控数据异常的严重性。
步骤S420,根据类别信息和异常等级,生成异常数据信息。
图5是图4所示实施例中步骤S420在一示例性地实施例中的流程图。如 图5所示,根据所述类别信息和所述异常等级,生成所述异常数据信息后, 可以包括步骤S510至步骤S540。
步骤S510,根据各业务之间预设的关联信息,获取各关联业务的监控信 息,以生成监控信息组。
值得说明的是,当某一目标监控数据出现异常时,同时可能多个关联业 务的目标监控数据同样出现问题,这时候若单独关注各目标监控数据的异常 情况,将不利于找出异常原因以及了解异常严重程度。
步骤S510的一实施例中,建立各业务之间的关联信息时,可以根据目标 监控数据的类型进行区分。
在一示例性实施例中,目标监控数据为响应时间。网络故障时,各业务 请求的响应时间都会受到影响,在建立业务之间的关联信息时,便可以将所 有同一通信网络覆盖的业务设置为关联业务,以便于判断是否因网络故障而 影响影响时间。
步骤S510的又一实施例中,建立各业务之间的关联信息时,还可以根据 业务类型进行区分。
在一示例性实施例中,将所有属于财产险类的保险之间建立关联信息, 当出现地震等自然灾害时,保险理赔量的请求量可能会随之增加。
步骤S520,若监控信息组中至少两个目标监控数据生成了异常数据信息, 则根据监控信息组中异常数据信息的数量,获取异常覆盖范围,以生成异常 范围信息。
值得说明的是,若监控信息组中只有一个目标监控数据生成了异常数据 信息,则不会生成异常范围信息。
步骤S530,根据异常范围信息、差值以及异常等级评判标准,重新划分 监控信息的异常等级。
值得说明的是,根据异常范围信息、差值以及异常等级评判标准,重新 划分监控信息的异常等级,以增加异常等级划分的准确性。
步骤S540,根据类别信息和异常等级,生成异常数据信息。
与步骤S410中划分的异常等级相比,步骤S410中异常等级仅根据目标 监控数据与标准参考数据之间的差值以及异常等级评判标准进行划分,当出 现同一监控信息组中多个目标监控数据异常时,则异常等级升级,通过步骤 S510至步骤S540重新划分异常等级,并生成已成数据信息。
在一示例性实施例中,根据单一目标监控数据和异常等级评判标准进行 异常等级划分时,划分为一级异常,若发现异常覆盖5个目标监控数据时, 将原一级异常升级为二级异常,若发现异常覆盖10个目标监控数据时,将原 一级异常升级为三级异常。
图6是图2所示实施例中步骤S230在一示例性地实施例中的流程图。如 图6所示,根据异常数据信息和环境条件信息,生成异常数据产生原因时, 可以包括步骤S610至步骤S630。
步骤S610,根据异常数据信息,获取目标监控数据的历史异常数据产生 原因。
在一实施例中,对历史异常数据以及历史异常数据产生原因进行存储, 以便于根据历史异常数据产生原因分析当前异常数据产生原因。
步骤S620,根据历史异常数据产生原因,以获取异常数据信息与环境条 件信息之间的关联关系。
步骤S630,根据关联关系,以生成异常数据产生原因。
通过步骤S610至步骤S630,以判断环境条件是否对异常数据产生原因造 成影响,增加监控结果准确性。
图7是图6所示实施例中步骤S620在一示例性地实施例中的流程图。如 图7所示,根据历史异常数据产生原因,以获取异常数据信息与环境条件信 息之间的关联关系时,可以包括步骤S710至步骤S750。
步骤S710,调用历史数据产生原因。
步骤S720,判断历史异常数据产生原因是否因为环境条件造成。若是, 则执行步骤S730。若否,则执行步骤S750。
通过步骤S720,以筛选出与因环境条件造成的历史异常数据。
步骤S730,判断当前的环境条件是否与历史异常数据产生时的环境条件 一致,若是,则执行步骤S740,若否,则执行步骤S750。
通过步骤S730,以筛选出与目标监控数据监控时环境条件一致的历史异 常数据。
步骤S730,确定异常数据信息与环境条件信息存在关联关系,目标监控 数据的异常由环境条件影响造成。
在一实施例中,将异常数据信息与步骤S730筛选出的历史异常数据进行 对比,判断异常情况是否一致,以判断是否因环境条件造成数据异常。
在一示例性实施例中,目标监控数据为请求量下降,环境条件信息为经 济环境下行。历史异常数据信息中存在经济下行导致请求量下降的情况,则 判断目标监控数据的异常情况是环境条件造成。
步骤S750,确定异常数据信息与环境条件信息之间无关联关系。
通过步骤S710至步骤S750,以判断异常数据的产生是否由环境条件造成。
在一实施例中,若异常等级为一级异常,则根据异常处理规则,将执行 信息通过文本信息通知目标对象。具体地,由于一级异常属于并不严重地异 常,文本信息通知目标对象即可,目标对象可在空闲时查看。文本信息通知 可包括手机短信通知、邮件通知等方式。若异常等级为二级异常,则根据异 常处理规则,将执行信息通过语音通知目标对象。二级异常时,异常等级高 于一级异常,需要目标对象立即了解到异常情况,但无需立即进行异常处理。 语音通知可包括电话语音、微信语音等。若异常等级为三级异常,则根据异 常处理规则,将执行信息通过语音通知目标对象,同时进行业务的熔断和降 级管理。三级异常情况出现时,为最高异常情况,此时不仅需要目标对象立 即了解到异常情况,且需要立即进行异常处理。在目标对象执行异常处理前, 自动进行熔断和降级处理。
值得说明的是,熔断(或称服务熔断),指当出现某一情况(如过载) 时,切断服务,从而防止应用程序不断地尝试执行可能会存在失败的操作, 造成系统瘫痪、卡死。服务熔断一般是某个服务(下游服务)故障引起,应 用于各业务之间无层级之分时。
在一示例性实施例中,A服务的X功能依赖B服务的某个接口,当B服 务接口响应很慢时,A服务X功能的响应也会被拖慢,进一步导致A服务的 线程卡在X功能上,A服务的其它功能也会卡住或拖慢。此时,就需要熔断 机制,使A服务不再请求B服务接口。
值得说明的是,降级(或称服务降级),指服务器压力剧增,为了保证 核心功能的可用性,可选择性的降低一些功能的可用性,或直接关闭该功能。 降级服务一般需要业务有层级之分,其主要是从系统整体负荷考虑。例如, 若监控的业务包括注册、保险办理等业务,由于保险办理业务层级高于注册 业务,当出现响应反应慢的情况时,关闭注册业务,保留保险办理业务。
在一示例性实施例中,降级时,可以根据响应超时时长、请求失败次数、 限流量和故障次数等作为自动降级触发条件。
如图8所示,将执行信息通过文本信息通知目标对象时,包括步骤S810 至步骤S840。
步骤S810,获取目标对象的工作安排。
步骤S820,判断执行信息生成时间是否属于目标对象的工作时间。若是, 则跳转至步骤S830,若否,则跳转至步骤S840。
步骤S830,将执行信息实时发送给目标对象。
步骤S840,在目标对象的下一工作日将所述文本信息发送给目标对象。
通过步骤S810至步骤S830,以实现根据异常等级和目标对象的工作时间 发送执行信息。以避免信息淹没无法及时查看。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后, 各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实 施过程构成任何限定。
图9是本申请的一示例性实施例示出的业务监控装置的框图。该装置可 以应用于图1所示的实施环境,并具体配置在智能终端210中。该装置也可 以适用于其它的示例性实施环境,并具体配置在其它设备中,本实施例不对 该装置所适用的实施环境进行限制。
如图9所示,该示例性的业务监控装置包括:
信息获取模块910,用于获取各业务的监控信息和环境条件信息;监控信 息至少包括监控时间和目标监控数据。
处理模块920,用于将监控信息与预设的标准信息进行对比处理,以生成 目标监控数据的异常数据信息。
判断模块930,用于根据异常数据信息和所述环境条件信息,生成异常数 据产生原因。
执行模块940,用于根据异常数据产生原因和预设的异常处理规则之间的 映射关系,生成执行信息并执行。
值得说明的是,在该示例性的业务监控装置中,执行信息的生成,不仅 考虑了目标监控数据,还考虑了环境条件对异常数据产生原因的影响,以增 加执行信息的准确性。
在另一示例性的实施例中,处理模块920包括:
类别信息生成单元,用于根据监控信息和预设的类别表,以获取所述目 标监控数据的监控类别,生成类别信息。
标准信息匹配单元,用于根据类别信息,以获取目标监控数据的标准信 息;标准信息中按照时间先后顺序划分有多个参考周期,参考周期包括标准 参考数据和异常等级评判标准。
计算单元,用于根据目标监控数据与所述标准信息中的标准参考数据进 行对比处理,以获取目标监控数据与标准参考数据之间的差值。
异常数据信息生成单元,用于根据所述差值和所述异常等级评判标准, 生成异常数据信息。
在另一示例性的实施例中,异常数据信息生成单元包括:
第一异常等级划分子单元,用于根据所述差值和异常等级评判标准,将 各所述监控信息划分为不同的异常等级。
异常数据生成子单元,用于根据所述类别信息和所述异常等级,生成所 述异常数据信息。
监控信息组生成子单元,用于根据各业务之间预设的关联信息,获取各 关联业务的监控信息,以生成监控信息组。
处理子单元,用于判断监控信息组中异常覆盖范围。若监控信息组中至 少两个目标监控数据生成了异常数据信息,则根据所述监控信息组中异常数 据信息的数量,获取异常覆盖范围,以生成异常范围信息。
第二异常等级划分子单元,用于根据所述异常范围信息、所述差值以及 所述异常等级评判标准,重新划分所述监控信息的异常等级。
在一示例性的实施例中,执行模块940包括:
识别单元,用于识别异常等级。
执行单元,若异常等级为一级异常,则根据异常处理规则,将执行信息 通过文本信息通知目标对象;若异常等级为二级异常,则根据异常处理规则, 将执行信息通过语音通知目标对象;若异常等级为三级异常,则根据异常处 理规则,将执行信息通过语音通知目标对象,同时进行业务的熔断和降级管 理。一级异常、二级异常和三级异常是根据异常等级严重程度从低至高依次 划分。
在另一示例性的实施例中,执行单元包括:
时间确认模块,用于将执行信息的生成时间与预设的工作安排表进行对 比处理,以确定文本信息的发送时间。
执行子单元,若执行信息的生成时间为目标对象的工作时间,则将执行 信息实时发送给目标对象;若执行信息的生成时间为目标发送对象的非工作 时间,则在目标对象的下一工作日将所述文本信息发送给目标对象。
在另一示例性的实施例中,判断模块930包括:
获取单元,用于根据异常数据信息,获取目标监控数据的历史异常数据 产生原因。
判断子单元,用于根据历史异常数据产生原因,以获取异常数据信息与 环境条件信息之间的关联关系。
生成单元,用于根据关联关系,以生成异常数据产生原因。
需要说明的是,上述实施例所提供的业务监控装置与上述实施例所提供 的业务监控方法属于同一构思,其中各个模块和单元执行操作的具体方式已 经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的业 务监控装置在实际应用中,可以根据需要而将上述功能分配由不同的功能模 块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全 部或者部分功能,本处也不对此进行限制。
如图10所示,计算机系统1000包括中央处理单元(Central Processing Unit,CPU)1001,其可以根据存储在只读存储器 (Read-Only Memory,ROM)1002中的程序或者从储存部分1008 加载到随机访问存储器(Random Access Memory,RAM)1003中的 程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方 法。在RAM 1003中,还存储有系统操作所需的各种程序和数据。 CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输 入/输出(Input/Output,I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包 括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1007;包括硬盘等的储存部分1008; 以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络 接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。 驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、 光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入储存部分1008。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现 为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包 括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程 图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通 信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该 计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定 的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读 信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读 存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或 器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括 但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机 访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘 只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、 磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读的信号 介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计 算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不 限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还 可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其 结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介 质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和 计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图 中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程 序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指 令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以 不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以 基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而 定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方 框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现, 或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可 以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这 些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算 机程序,该计算机程序被计算机的处理器执行时,使计算机执行如前所述的 业务监控方法。该计算机可读存储介质可以是上述实施例中描述的电子设备 中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算 机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读 存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令, 处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的 业务监控方法。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参 照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技 术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱 离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之 内。
Claims (10)
1.一种业务监控方法,其特征在于,包括:
获取各业务的监控信息和环境条件信息;所述监控信息至少包括监控时间和目标监控数据;
将所述监控信息与预设的标准信息进行对比处理,以生成目标监控数据的异常数据信息;
根据所述异常数据信息和所述环境条件信息,生成异常数据产生原因;
根据预设的异常处理规则和异常数据产生原因之间的映射关系,生成执行信息并执行。
2.如权利要求1所述的业务监控方法,其特征在于,所述将所述监控信息与预设的标准信息进行对比处理,以生成目标监控数据的异常数据信息,包括:
根据监控信息和预设的类别表,以获取所述目标监控数据的监控类别,生成类别信息;
根据所述类别信息,以获取目标监控数据的标准信息;所述标准信息中按照时间先后顺序划分有多个参考周期,所述参考周期包括标准参考数据和异常等级评判标准;
将所述目标监控数据与所述标准信息中的标准参考数据进行对比处理,以获取目标监控数据与标准参考数据之间的差值;
根据所述差值和所述异常等级评判标准,生成所述异常数据信息。
3.如权利要求2所述的业务监控方法,其特征在于,所述根据所述差值和所述异常等级评判标准,生成所述异常数据信息,包括:
根据所述差值和异常等级评判标准,将各所述监控信息划分为不同的异常等级;
根据所述类别信息和所述异常等级,生成所述异常数据信息。
4.如权利要求3所述的业务监控方法,其特征在于,所述根据所述类别信息和所述异常等级,生成所述异常数据信息后,还包括:
根据各业务之间预设的关联信息,获取各关联业务的监控信息,以生成监控信息组;
若所述监控信息组中至少两个目标监控数据生成了异常数据信息,则根据所述监控信息组中异常数据信息的数量,获取异常覆盖范围,以生成异常范围信息;
根据所述异常范围信息、所述差值以及所述异常等级评判标准,重新划分所述监控信息的异常等级。
5.如权利要求3所述的业务监控方法,其特征在于,所述根据异常数据产生原因和预设的异常处理规则之间的映射关系,生成执行信息并执行,包括:
若所述异常等级为一级异常,则根据异常处理规则,将执行信息通过文本信息通知目标对象;
若所述异常等级为二级异常,则根据异常处理规则,将执行信息通过语音通知目标对象;
若所述异常等级为三级异常,则根据异常处理规则,将执行信息通过语音通知目标对象,同时进行业务的熔断和降级管理;
所述一级异常、二级异常和三级异常是根据异常等级严重程度从低至高依次划分。
6.如权利要求5所述的业务监控方法,其特征在于,所述将执行信息通过文本信息通知目标对象,包括:
将所述执行信息的生成时间与预设的工作安排表进行对比处理,以确定文本信息的发送时间;
若所述执行信息的生成时间为目标对象的工作时间,则将执行信息实时发送给目标对象;
若所述执行信息的生成时间为目标发送对象的非工作时间,则在目标对象的下一工作日将所述文本信息发送给目标对象。
7.如权利要求1所述的业务监控方法,其特征在于,所述根据所述异常数据信息和所述环境条件信息,生成异常数据产生原因,包括:
根据所述异常数据信息,获取目标监控数据的历史异常数据产生原因;
根据所述历史异常数据产生原因,以获取所述异常数据信息与环境条件信息之间的关联关系;
根据所述关联关系,以生成异常数据产生原因。
8.一种集群限流装置,其特征在于,包括:
信息获取模块,用于获取各业务的监控信息和环境条件信息;所述监控信息至少包括监控时间和目标监控数据;
处理模块,用于将所述监控信息与预设的标准信息进行对比处理,以生成目标监控数据的异常数据信息;
判断模块,用于根据所述异常数据信息和所述环境条件信息,生成异常数据产生原因;
执行模块,用于根据异常数据产生原因和预设的异常处理规则之间的映射关系,生成执行信息并执行。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器和存储器;
所述存储器上存储有计算机程序,当所述一个或多个处理器执行所述程序时,使得所述设备执行如权利要求1-7中所述的方法。
10.一种计算机可存读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被所述一个或多个处理器所执行,以使所述处理器执行如权利要求1-7中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210818217.8A CN115499288A (zh) | 2022-07-12 | 2022-07-12 | 业务监控方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210818217.8A CN115499288A (zh) | 2022-07-12 | 2022-07-12 | 业务监控方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115499288A true CN115499288A (zh) | 2022-12-20 |
Family
ID=84467435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210818217.8A Pending CN115499288A (zh) | 2022-07-12 | 2022-07-12 | 业务监控方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115499288A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251769A (zh) * | 2023-11-16 | 2023-12-19 | 太平金融科技服务(上海)有限公司深圳分公司 | 基于监控组件的异常数据识别方法、装置、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103378982A (zh) * | 2012-04-17 | 2013-10-30 | 深圳市腾讯计算机系统有限公司 | 互联网业务运行监测方法和系统 |
CN106251017A (zh) * | 2016-08-02 | 2016-12-21 | 北京百度网讯科技有限公司 | 数据预测方法及装置 |
CN107871190A (zh) * | 2016-09-23 | 2018-04-03 | 阿里巴巴集团控股有限公司 | 一种业务指标监控方法及装置 |
CN110022227A (zh) * | 2019-03-07 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 业务处理方法、装置、设备及存储介质 |
CN110635956A (zh) * | 2019-10-23 | 2019-12-31 | 江苏国泰新点软件有限公司 | 一种设备管理方法、平台、系统、设备及存储介质 |
CN112235162A (zh) * | 2020-10-14 | 2021-01-15 | 北京嘀嘀无限科技发展有限公司 | 基于业务的监控方法、装置、电子设备及存储介质 |
CN112818295A (zh) * | 2021-01-27 | 2021-05-18 | 深圳市同行者科技有限公司 | 业务数据的监控方法、装置、设备及存储介质 |
CN112860524A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 异常行为检测方法、装置及设备 |
-
2022
- 2022-07-12 CN CN202210818217.8A patent/CN115499288A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103378982A (zh) * | 2012-04-17 | 2013-10-30 | 深圳市腾讯计算机系统有限公司 | 互联网业务运行监测方法和系统 |
CN106251017A (zh) * | 2016-08-02 | 2016-12-21 | 北京百度网讯科技有限公司 | 数据预测方法及装置 |
CN107871190A (zh) * | 2016-09-23 | 2018-04-03 | 阿里巴巴集团控股有限公司 | 一种业务指标监控方法及装置 |
CN110022227A (zh) * | 2019-03-07 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 业务处理方法、装置、设备及存储介质 |
CN110635956A (zh) * | 2019-10-23 | 2019-12-31 | 江苏国泰新点软件有限公司 | 一种设备管理方法、平台、系统、设备及存储介质 |
CN112235162A (zh) * | 2020-10-14 | 2021-01-15 | 北京嘀嘀无限科技发展有限公司 | 基于业务的监控方法、装置、电子设备及存储介质 |
CN112818295A (zh) * | 2021-01-27 | 2021-05-18 | 深圳市同行者科技有限公司 | 业务数据的监控方法、装置、设备及存储介质 |
CN112860524A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 异常行为检测方法、装置及设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251769A (zh) * | 2023-11-16 | 2023-12-19 | 太平金融科技服务(上海)有限公司深圳分公司 | 基于监控组件的异常数据识别方法、装置、设备及介质 |
CN117251769B (zh) * | 2023-11-16 | 2024-03-12 | 太平金融科技服务(上海)有限公司深圳分公司 | 基于监控组件的异常数据识别方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992398B (zh) | 一种业务系统的监控方法和监控系统 | |
US9413597B2 (en) | Method and system for providing aggregated network alarms | |
US20100070981A1 (en) | System and Method for Performing Complex Event Processing | |
CN113157545A (zh) | 业务日志的处理方法、装置、设备及存储介质 | |
CN109257200A (zh) | 大数据平台监控的方法和装置 | |
CN109947616A (zh) | 一种基于OpenStack技术的云操作系统的自动化监控运维系统 | |
EP4158480A1 (en) | Actionability metric generation for events | |
CN108390793A (zh) | 一种分析系统稳定性的方法及装置 | |
CN113342619A (zh) | 日志监控方法、系统、电子设备及可读介质 | |
CN115499288A (zh) | 业务监控方法、装置、设备及介质 | |
CN108964957B (zh) | 一种数据通信业务质量监控的方法及大数据系统 | |
CN109032904A (zh) | 被监控、管理服务器及数据获取、分析方法和管理系统 | |
CN113794719A (zh) | 一种基于Elasticsearch技术网络异常流量分析方法、装置和电子设备 | |
CN110677271A (zh) | 基于elk的大数据告警方法、装置、设备及存储介质 | |
CN114116429A (zh) | 异常日志采集方法、装置、设备、介质和产品 | |
CN113656252A (zh) | 故障定位方法、装置、电子设备以及存储介质 | |
CN110048881A (zh) | 信息监控系统、信息监控方法及装置 | |
CN117931589A (zh) | 运维故障的识别方法及装置 | |
CN112667475A (zh) | 一种风险通知方法、装置、电子设备及存储介质 | |
CN116260703A (zh) | 分布式消息服务节点cpu性能故障自恢复方法及装置 | |
CN115514618A (zh) | 告警事件的处理方法、装置、电子设备和介质 | |
CN115202973A (zh) | 应用运行状态的确定方法、装置、电子设备和介质 | |
CN113900905A (zh) | 日志监控方法、装置、电子设备及存储介质 | |
CN115150289A (zh) | 基于复合监控的异常处理方法及系统 | |
CN113760669A (zh) | 问题数据的告警方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |