CN115967827A - 一种数据指标监测告警方法、装置、设备及存储介质 - Google Patents

一种数据指标监测告警方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115967827A
CN115967827A CN202211557594.7A CN202211557594A CN115967827A CN 115967827 A CN115967827 A CN 115967827A CN 202211557594 A CN202211557594 A CN 202211557594A CN 115967827 A CN115967827 A CN 115967827A
Authority
CN
China
Prior art keywords
data
data indexes
indexes
fluctuation
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211557594.7A
Other languages
English (en)
Inventor
赵艳杰
王玉东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202211557594.7A priority Critical patent/CN115967827A/zh
Publication of CN115967827A publication Critical patent/CN115967827A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请实施例涉及数据处理技术领域,具体而言,涉及一种数据指标监测告警方法、装置、设备及存储介质,旨在全面掌握数据指标异常波动的影响范围。所述方法包括:接收待监测的多种数据指标,对所述多种数据指标进行实时监测;当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标;根据所述相关波动数据指标,生成对应的告警信息。

Description

一种数据指标监测告警方法、装置、设备及存储介质
技术领域
本申请实施例涉及数据处理技术领域,具体而言,涉及一种数据指标监测告警方法、装置、设备及存储介质。
背景技术
对于系统的开发或者运营维护者来说,监测系统中的各种数据的波动情况是一项重要的工作,在数据指标发生异常波动时,需要及时的找到数据指标发生异常波动的原因,解决相关的问题,保证系统的稳定正常运行。通常,在监测到数据指标发生异常波动时,系统会查找并定位该数据指标发生异常波动的原因,确定系统的故障的具体原因,进而解决系统的故障。
现有技术中,当监测到数据指标发生异常波动时,只会关注该数据指标本身的发生异常波动的原因,忽略了该数据指标的异常波动带来的相关数据指标的波动,无法同时全面的了解数据指标的异常波动所带来的影响。
发明内容
本申请实施例提供一种数据指标监测告警方法、装置、设备及存储介质,旨在全面掌握数据指标异常波动的影响范围。
本申请实施例第一方面提供一种数据指标监测告警方法,所述方法包括:
接收待监测的多种数据指标,对所述多种数据指标进行实时监测;
当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标;
根据所述相关波动数据指标,生成对应的告警信息。
可选地,所述当监测到所述多种数据指标中的异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标,包括:
当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值;
根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标。
可选地,所述当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值,包括:
获取所述多种数据指标的离线时间序列,所述离线时间序列为所述多种数据指标在历史时间内的指标数值;
对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
可选地,所述对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值,包括:
将所述异常数据指标的离线时间序列拆分为多个子序列,得到多个异常数据指标子序列;
针对每个所述其余数据指标,将所述其余数据指标的离线时间序列拆分为多个子序列,得到多个其余数据指标子序列,所述异常数据指标的离线时间序列和所述其余数据指标的离线时间序列是以相同的粒度进行拆分的;
根据所述多个异常数据指标子序列与所述多个其余数据指标子序列,对所述异常数据指标与所述其余数据指标进行相关性分析,得到所述异常数据指标与所述其余数据指标的相关系数值。
可选地,所述根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标,包括:
将所述相关系数值与预设的相关系数阈值进行对比;
当所述相关系数值大于所述相关系数阈值时,将所述相关系数值对应的其余数据指标确定为相关波动数据指标。
可选地,所述根据所述相关波动数据指标,生成对应的告警信息,包括:
获取所述相关波动数据指标的实时参数与预估波动参数;
根据所述相关波动数据指标的实时参数与预估波动参数,生成对应的告警信息。
可选地,所述方法还包括:
将所述告警信息与用户信息进行匹配,得到所述告警信息对应的用户账户;
将所述告警信息推送至所述用户账户。
本申请实施例第二方面提供一种数据指标监测告警装置,所述装置包括:
数据指标监测模块,用于接收待监测的多种数据指标,对所述多种数据指标进行实时监测;
波动指标确定模块,用于当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标;
告警信息生成模块,用于根据所述相关波动数据指标,生成对应的告警信息。
可选地,所述波动指标确定模块包括:
相关系数值计算子模块,用于当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值;
相关波动数据指标确定子模块,用于根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标。
可选地,所述相关系数值计算子模块包括:
离线时间序列子模块,用于获取所述多种数据指标的离线时间序列,所述离线时间序列为所述多种数据指标在历史时间内的指标数值;
相关性分析子模块,用于对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
可选地,所述相关性分析子模块包括:
第一序列拆分子模块,用于将所述异常数据指标的离线时间序列拆分为多个子序列,得到多个异常数据指标子序列;
第二序列拆分子模块,用于针对每个所述其余数据指标,将所述其余数据指标的离线时间序列拆分为多个子序列,得到多个其余数据指标子序列,所述异常数据指标的离线时间序列和所述其余数据指标的离线时间序列是以相同的粒度进行拆分的;
相关系数值确定子模块,用于根据所述多个异常数据指标子序列与所述多个其余数据指标子序列,对所述异常数据指标与所述其余数据指标进行相关性分析,得到所述异常数据指标与所述其余数据指标的相关系数值。
可选地,所述相关波动数据指标确定子模块包括:
相关系数值对比子模块,用于将所述相关系数值与预设的相关系数阈值进行对比;
相关波动数据指标确定子模块,用于当所述相关系数值大于所述相关系数阈值时,将所述相关系数值对应的其余数据指标确定为相关波动数据指标。
可选地,所述告警信息生成模块包括:
参数获取子模块,用于获取所述相关波动数据指标的实时参数与预估波动参数;
告警信息生成子模块,用于根据所述相关波动数据指标的实时参数与预估波动参数,生成对应的告警信息。
可选地,所述装置还包括:
信息匹配模块,用于将所述告警信息与用户信息进行匹配,得到所述告警信息对应的用户账户;
告警信息推送模块,用于将所述告警信息推送至所述用户账户。
本申请实施例第三方面提供一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如本申请第一方面所述的方法中的步骤。
本申请实施例第四方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本申请第一方面所述的方法的步骤。
采用本申请提供的指标监测告警方法,当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标。本申请中,对待监测的多种数据指标进行实时监测,当检测到某项数据指标发生异常波动时,确定该数据指标为异常数据指标,同时确定该异常数据指标的相关波动数据指标,进而根据该异常数据指标的相关波动数据指标,生成对应的告警信息,不仅在某项数据指标发生异常波动时确定该数据指标为异常数据指标,还确定了该异常数据指标的相关波动数据指标,可以确定异常数据指标的波动对其余数据指标的影响,生成告警信息可以对相关波动数据指标即将发生的波动进行告警,可以帮助开发者和运维人员更加全面的掌握某项数据指标波动的影响范围,有利于帮助开发者和运维人员指定更加有效的解决方案,保证系统的稳定运行。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提出的数据指标监测告警方法的流程图;
图2是本申请一实施例提出的数据指标监测告警方法的流程图;
图3是本申请一实施例提出的数据指标监测告警方法的流程图;
图4是本申请一实施例提出的数据指标监测告警方法的流程图;
图5是本申请一实施例提出的数据指标监测告警方法的流程图;
图6是本申请一实施例提出的数据指标监测告警方法的流程图;
图7是本申请一实施例提出的数据指标监测告警方法的流程图;
图8是本申请一实施例提出的数据指标监测告警装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,图1是本申请一实施例提出的数据指标监测告警方法的流程图。如图1所示,该方法包括以下步骤:
S11:接收待监测的多种数据指标,对所述多种数据指标进行实时监测。
本实施例中,数据指标是将事件和事物进行量化,形成的具体数字,可以直观的对目标进行数字化的衡量。
本实施例中,通过一个告警平台对待监测的多种数据指标进行实时监测,在告警平台中,开发者或运维人员预先输入多种需要进行监测的数据指标,告警平台对需要检测的数据指标进行监测,在某个系统中,系统中的各项数据指标会实时传输至系统的服务器,系统的服务器会将需要进行监测的数据指标实时传输至告警平台,告警平台在接收到实时的数据指标时,会进行相应的分析以及计算。
示例地,在一个视频网站系统中,待监测的数据指标可以是视频的下载量,视频的上传量,各个网口的下载/上传速率等。开发或者运维人员将上述几项数据指标输入告警平台,告警平台对上述数据指标进行监测,告警平台从视频网站的服务器中实时获取网站系统中的视频下载量,视频上传量,各个网口的下载/上传速率等数据指标的实时数据。
S12:当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标。
本实施例中,异常数据指标的含义是该数据指标此刻的波动范围高于该数据指标的正常波动范围,即该数据指标的值突然大幅度升高或者降低。相关波动数据指标指的是因为该异常数据指标的波动而导致相关性异常波动的数据指标。
本实施例中,告警平台实时监测系统中的多种数据指标,当监测到某项数据指标发送异常波动时,从该系统上的其余的数据指标中确定出相关波动数据指标,相关波动数据指标会因为异常数据指标的波动而产生异常波动。
示例地,告警平台监测异常波动的算法可以使用3sigma或者z-score识别算法,通过上述算法,可以根据每个数据指标的实时数值,分析出该指标是否发生了异常波动。
S13:根据所述相关波动数据指标,生成对应的告警信息。
本实施例中,告警信息用于管理人员或用户发出警告,可以向管理人员通知系统中的某项数据指标发生的异常波动。
本实施例中,当告警平台确定异常波动数据指标的相关波动数据指标后,根据该相关波动数据指标,生成对应的告警信息,该告警信息中至少包含了该相关波动数据指标,用户可以根据告警信息了解到发生相关波动的数据指标有哪些。
示例地,在视频网站系统中,告警平台监测到下载速度发生异常波动,进而确定相关波动数据指标为视频下载量,则生成告警信息“可能发生异常波动的指标:视频下载量”。
本实施例中,通过告警平台接收待监测的数据指标,对待监测的数据指标进行实时监测,根据待监测数据指标的实时数值,分析数据指标是否发生异常波动,当确定某项指标发生异常波动时,确定该项数据指标可能引发的相关的数据指标的波动,进而生成对应的告警信息,向用户告警可能因为某项数据指标发生的异常波动而导致的相关数据指标的异常波动,不光关注到发生异常波动的数据指标本身,还分析确定了可能因为该数据指标的异常波动而产生相关异常波动的数据指标,生成告警信息以对用户进行预警,有利于用户更全面的掌握整个系统的数据指标的波动趋势,实现了预警功能。
在本申请的另一个实施例中,在上述步骤S13之后,所述方法还包括:
S21:将所述告警信息与用户信息进行匹配,得到所述告警信息对应的用户账户。
本实施例中,告警平台支持用户订阅关注告警平台监测的数据指标,当生成告警信息后,将告警信息与平台录入的用户信息进行匹配,确定订阅该数据指标的用户,将该告警信息推送到对应的用户账户。
示例地,视频网站系统的管理人员A订阅了视频下载量,视频上传量,视频下载速率,视频上传速率等相关数据指标,当告警平台监测到视频下载量发送异常波动时,确定视频的下载速率可能发生相关波动,则将视频下下载速率可能发生相关波动作为告警信息,确定该告警信息对应的用户账户为管理人员A的用户账户。
S22:将所述告警信息推送至所述用户账户。
本实施例中,当确定告警信息对应的用户账户之后,将告警信息推送给至该用户账户。
示例地,可以通过短信或邮件的方式发送到用户账户对应的手机或邮箱中。
本实施例中,当生成告警信息之后,确定告警信息对应的用户账户,将告警信息推送至对应的用户账户,可以第一时间通知用户,对用户进行预警,方便用户及时做好准备,每个用户只会接收到自己订阅关注的数据指标的波动情况,实现了更加精细化的管理。
在本申请的另一个实施例中,上述步骤S12具体包括:
S31:当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
本实施例中,相关系数值代表了数据指标之间的相关度,两个数据指标之间的相关系数值越大,这两个数据指标之间的相关度越大,两个数据指标之间的相关系数值越小,这两个数据指标之间的相关度越小。
本实施例中,当告警平台监测到告警平台监测的多种数据指标中的某项数据指标出现异常波动时,确定出现了异常数据指标,此时分别计算该异常数据指标与告警平台监测的其余数据指标之间的相关系数值。
本实施例中,当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值,具体步骤包括:
S31-1:获取所述多种数据指标的离线时间序列,所述离线时间序列为所述多种数据指标在历史时间内的指标数值。
本实施例中,数据指标的离线时间序列就是告警平台监测到的数据指标的历史数据,这些数据为离线数据,记录了不同时间下数据指标的具体数值。
本实施例中,为了计算异常数据指标与其余数据指标之间的相关系数值,告警平台从后台存储中获取告警平台监测的多种数据指标的离线时间序列。
示例地,为了计算数据指标A与数据指标B,数据指标C之间相关系数值,告警平台从后台存储中获取数据指标A,数据指标B,数据指标C在过去一年时间的离线时间序列。
S31-2:对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
本实施例中,当获取到告警平台监测的多个数据指标的离线时间序列后,将异常数据指标的离线时间序列分别与其余的数据指标的离线时间序列进行相关性分析,得到该异常数据指标与每个其余数据指标的相关系数值。具体的步骤包括:
S31-2-1:将所述异常数据指标的离线时间序列拆分为多个子序列,得到多个异常数据指标子序列。
S31-2-2:针对每个所述其余数据指标,将所述其余数据指标的离线时间序列拆分为多个子序列,得到多个其余数据指标子序列,所述异常数据指标的离线时间序列和所述其余数据指标的离线时间序列是以相同的粒度进行拆分的。
本实施例中,数据指标的子序列是由数据指标的离线时间序列以时间为单位拆分而成的子序列。
本实施例中,首先将异常数据指标的离线时间序列以时间为单位拆分为多个子序列,得到多个异常数据指标子序列。再将其余数据指标中的每个数据指标的离线时间序列以时间为单位进行拆分,得到多个其余数据指标子序列,拆分的粒度可以根据实际情况而定,拆分的越精细,计算的结果就越准确。两个进行相关性分析的指标必须以同样的粒度进行拆分。
示例地,在视频网站系统中,告警平台监测到异常数据指标为某网口传输速率,获取到该网口传输速率的离线时间序列,该离线时间序列为该网口在最近一年时间内每天的平均传输速率。将该离线时间序列以月为单位进行拆分,则得到了12个子序列。其余数据指标为视频的上传量,视频的下载量,也将视频上传量以及视频下载量的离线时间序列以月为单位,拆分为12个子序列。
S31-2-3:根据所述多个异常数据指标子序列与所述多个其余数据指标子序列,对所述异常数据指标与所述其余数据指标进行相关性分析,得到所述异常数据指标与所述其余数据指标的相关系数值。
本实施例中,在通过步骤S31-2-1和步骤S31-2-2得到多个异常数据指标子序列和多个其余数据指标子序列后,将这多个异常数据指标的子序列和多个其余数据指标的子序列作为变量代入相关性分析函数中,得到异常数据指标与其余数据指标的相关系数值,相关性分析函数是相关性系数计算的函数,不同的相关性分析算法的侧重点不同,函数也有差别。
示例地,数据指标A为平均网络传输速度,以月为单位分为了12个子序列,分别对应1-12月这12个月的网站服务器平均网络传输速度,数据指标B为网站视频的平均下载量,也以月为单位分为12个子序列,分别对应1-12月这12个月的视频平均下载量,数据指标A与数据指标B各构成一个集合,每个集合中有12个数据,将这两个集合中的数据代入相关性分析函数中,得到一个计算结果,这个计算结果就是数据指标A与数据指标B的相关性系数值,即网站服务器平均网络传输速度与网站视频的平均下载量的相关性系数值。
以Pearson算法为例,两个连续变量(X,Y)的Pearson相关性系数(Px,y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间,接近0的变量被称为无相关性,接近1或者-1被称为具有强相关性,将数据指标A作为变量X,将数据指标B作为变量Y,将数据指标A的集合与数据指标B的集合代入Pearson相关性系数函数中,得到一个介于-1.0-1.0之间的数值,这个数值就是数据指标A与数据指标B之间的相关性系数,当该数值越接近-1.0或1.0时,代表数据指标A与数据指标B的相关性越强,当该数据越接近0时,代表数据指标A与数据指标B的相关性越弱。
另外再使用Spearman/Distance/Correction/Cross Correction等相关性方法计算异常数据指标与其余数据指标的相关性系数,上述相关性算法与Pearson算法的原理大致相同,都是通过对两组连续变量进行计算,进而得到这两组变量之间的相关性系数值,相关性系数值都在-1.0-1.0之间。使用上述算法计算多个异常数据指标与其余数据指标的相关性系数之后,对计算出的所有相关性系数进行加权平均计算,得到的加权平均后的相关性系数值,就是异常波动指标与其余数据指标之间的相关性系数值。告警检测平台会在对相关性系数值的计算中,根据异常数据指标与其余数据指标的真实波动情况,不断的调整不同算法计算出的相关系数值在加权平均时所占的权重,在进行最终计算结果的加权求和时,为计算出的相关性系数值越准确的算法计算出的相关性系数值添加越大的权重值,将计算出的相关性系数值调整到最优。
S32:根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标。
本实施例中,在得到异常数据指标与其余的数据指标之间的相关系数值之后,从告警平台监测的除异常数据指标外的其余数据指标中,筛选出即将产生相关波动的数据指标,将筛选出的数据指标作为相关波动数据指标。
本实施例中,根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标的具体步骤为:
S32-1:将所述相关系数值与预设的相关系数阈值进行对比。
本实施例中,相关系数阈值是由开发者预先设置的阈值,当两个数据指标的相关系数值高于该阈值时,代表该两个数据指标的相关性较高,当其中一个数据指标发生异常波动时,另一个数据指标一般情况下也会发送异常波动。
本实施例中,当得到每个其余数据指标与异常数据指标之间的相关系数值后,将计算得到的相关系数值与预设的相关系数阈值进行对比。
S32-2:当所述相关系数值大于所述相关系数阈值时,将所述相关系数值对应的其余数据指标确定为相关波动数据指标。
本实施例中,当某个其余数据指标与异常波动数据指标的相关系数值大于预设相关系数阈值时,将该数据指标确定为异常波动数据指标的相关波动数据指标。
本实施例中,获取了异常波动数据指标与其余数据指标的离线时间序列,将离线时间序列拆分为多个子序列,计算各个子序列之间的相关系数值,进而得到异常波动数据指标与每个其余数据指标之间的相关系数,从而筛选出相关波动数据指标,通过将离线时间序列进行拆分,精细化的分析了数据指标在每个时间段内的相关性,更加合理地确定了数据指标之间的影响关系,有利于精准的确定受到异常波动数据指标影响的其余数据指标。
在本申请的另一个实施例中,上述步骤S13具体包括:
S41:获取所述相关波动数据指标的实时参数与预估波动参数。
本实施例中,相关波动数据指标的实时参数为该相关波动数据指标当前的数值,预估波动参数为预估的该数据指标发生波动的波动范围数值。
本实施例中,生成告警信息时,告警平台确定即将发生波动的相关波动数据指标,获取该数据指标的实时参数,根据对离线时间序列的分析,获得历史上异常数据指标发生异常波动时,该相关波动指标发生的波动的大小范围值,将该范围值作为相关波动数据指标的预估波动参数。
示例地,当确定相关波动数据指标后,分析该相关波动数据指标在历史上受到的异常波动数据指标的影响,得到该数据指标的预估波动参数为超出正常波动范围10%-20%。
S42:根据所述相关波动数据指标的实时参数与预估波动参数,生成对应的告警信息。
本实施例中,当得到相关波动数据指标的实时参数与预估波动参数后,生成包括有该相关波动数据指标的指标名称,该相关波动数据指标的实时参数,该相关波动数据指标的预估波动参数的告警信息。
示例地,在一个视频网站系统中,生成的告警信息为“视频播放量可能发生异常波动,当前播放量为20000/天,未来一天可能低于正常播放量的10%-20%”。
本实施例中,在告警信息中加入了数据指标的实时参数,还加入了预估的波动参数,可以更加准确的帮助管理人员掌握系统中每个数据指标的波动趋势,方便管理人员制定更加精细的对策,也方便维护人员对系统进行维护,保证了告警平台监测的系统的稳定运行。
基于同一发明构思,本申请一实施例提供一种数据指标监测告警装置。参考图8,图8是本申请一实施例提出的数据指标监测告警装置800的示意图。如图8所示,该装置包括:
数据指标监测模块801,用于接收待监测的多种数据指标,对所述多种数据指标进行实时监测;
波动指标确定模块802,用于当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标;
告警信息生成模块803,用于根据所述相关波动数据指标,生成对应的告警信息。
可选地,所述波动指标确定模块包括:
相关系数值计算子模块,用于当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值;
相关波动数据指标确定子模块,用于根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标。
可选地,所述相关系数值计算子模块包括:
离线时间序列子模块,用于获取所述多种数据指标的离线时间序列,所述离线时间序列为所述多种数据指标在历史时间内的指标数值;
相关性分析子模块,用于对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
可选地,所述相关性分析子模块包括:
第一序列拆分子模块,用于将所述异常数据指标的离线时间序列拆分为多个子序列,得到多个异常数据指标子序列;
第二序列拆分子模块,用于针对每个所述其余数据指标,将所述其余数据指标的离线时间序列拆分为多个子序列,得到多个其余数据指标子序列,所述异常数据指标的离线时间序列和所述其余数据指标的离线时间序列是以相同的粒度进行拆分的;
相关系数值确定子模块,用于根据所述多个异常数据指标子序列与所述多个其余数据指标子序列,对所述异常数据指标与所述其余数据指标进行相关性分析,得到所述异常数据指标与所述其余数据指标的相关系数值。
可选地,所述相关波动数据指标确定子模块包括:
相关系数值对比子模块,用于将所述相关系数值与预设的相关系数阈值进行对比;
相关波动数据指标确定子模块,用于当所述相关系数值大于所述相关系数阈值时,将所述相关系数值对应的其余数据指标确定为相关波动数据指标。
可选地,所述告警信息生成模块包括:
参数获取子模块,用于获取所述相关波动数据指标的实时参数与预估波动参数;
告警信息生成子模块,用于根据所述相关波动数据指标的实时参数与预估波动参数,生成对应的告警信息。
可选地,所述装置还包括:
信息匹配模块,用于将所述告警信息与用户信息进行匹配,得到所述告警信息对应的用户账户;
告警信息推送模块,用于将所述告警信息推送至所述用户账户。
基于同一发明构思,本申请另一实施例提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请上述任一实施例所述的数据指标监测告警方法中的步骤。
基于同一发明构思,本申请另一实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现本申请上述任一实施例所述的数据指标监测告警方法中的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的数据指标监测告警方法、装置、设备及存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据指标监测告警方法,其特征在于,所述方法包括:
接收待监测的多种数据指标,对所述多种数据指标进行实时监测;
当监测到所述多种数据指标中出现异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标;
根据所述相关波动数据指标,生成对应的告警信息。
2.根据权利要求1所述的方法,其特征在于,所述当监测到所述多种数据指标中的异常数据指标时,从所述多种数据指标中确定除所述异常数据指标外,即将产生相关波动的数据指标,得到相关波动数据指标,包括:
当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值;
根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标。
3.根据权利要求2所述的方法,其特征在于,所述当监测到所述多种数据指标中出现异常数据指标时,分别计算所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值,包括:
获取所述多种数据指标的离线时间序列,所述离线时间序列为所述多种数据指标在历史时间内的指标数值;
对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值。
4.根据权利要求3所述的方法,其特征在于,所述对所述异常数据指标的离线时间序列分别与每个所述其余数据指标的离线时间序列进行相关性分析,得到所述多种数据指标中的每个其余数据指标与所述异常数据指标的相关系数值,包括:
将所述异常数据指标的离线时间序列拆分为多个子序列,得到多个异常数据指标子序列;
针对每个所述其余数据指标,将所述其余数据指标的离线时间序列拆分为多个子序列,得到多个其余数据指标子序列,所述异常数据指标的离线时间序列和所述其余数据指标的离线时间序列是以相同的粒度进行拆分的;
根据所述多个异常数据指标子序列与所述多个其余数据指标子序列,对所述异常数据指标与所述其余数据指标进行相关性分析,得到所述异常数据指标与所述其余数据指标的相关系数值。
5.根据权利要求2所述的方法,其特征在于,所述根据所述相关系数值,从所述多种数据指标中的其余数据指标中筛选出即将产生相关波动的数据指标,得到所述相关波动数据指标,包括:
将所述相关系数值与预设的相关系数阈值进行对比;
当所述相关系数值大于所述相关系数阈值时,将所述相关系数值对应的其余数据指标确定为相关波动数据指标。
6.根据权利要求1所述的方法,其特征在于,所述根据所述相关波动数据指标,生成对应的告警信息,包括:
获取所述相关波动数据指标的实时参数与预估波动参数;
根据所述相关波动数据指标的实时参数与预估波动参数,生成对应的告警信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述告警信息与用户信息进行匹配,得到所述告警信息对应的用户账户;
将所述告警信息推送至所述用户账户所在的终端设备。
8.一种数据指标监测告警装置,其特征在于,所述装置包括:
数据指标监测模块,用于接收待监测的多种数据指标,对所述多种数据指标进行实时监测;
波动指标确定模块,用于当监测到所述多种数据指标中出现异常数据指标时,确定所述异常数据指标的相关波动数据指标;
告警信息生成模块,用于根据所述相关波动数据指标,生成对应的告警信息。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1至7任一所述的方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至7任一所述的方法的步骤。
CN202211557594.7A 2022-12-06 2022-12-06 一种数据指标监测告警方法、装置、设备及存储介质 Pending CN115967827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211557594.7A CN115967827A (zh) 2022-12-06 2022-12-06 一种数据指标监测告警方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211557594.7A CN115967827A (zh) 2022-12-06 2022-12-06 一种数据指标监测告警方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115967827A true CN115967827A (zh) 2023-04-14

Family

ID=87359315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211557594.7A Pending CN115967827A (zh) 2022-12-06 2022-12-06 一种数据指标监测告警方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115967827A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546274A (zh) * 2010-12-20 2012-07-04 中国移动通信集团广西有限公司 一种通信业务中的告警监控方法及设备
CN107707376A (zh) * 2017-06-09 2018-02-16 贵州白山云科技有限公司 一种监控和告警的方法和系统
CN112751711A (zh) * 2020-12-30 2021-05-04 北京奇艺世纪科技有限公司 告警信息处理方法和装置、存储介质和电子设备
CN114004331A (zh) * 2021-10-14 2022-02-01 武汉烽火技术服务有限公司 一种基于关键指标和深度学习的故障分析方法
CN114138601A (zh) * 2021-11-26 2022-03-04 北京金山云网络技术有限公司 一种业务告警方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546274A (zh) * 2010-12-20 2012-07-04 中国移动通信集团广西有限公司 一种通信业务中的告警监控方法及设备
CN107707376A (zh) * 2017-06-09 2018-02-16 贵州白山云科技有限公司 一种监控和告警的方法和系统
CN112751711A (zh) * 2020-12-30 2021-05-04 北京奇艺世纪科技有限公司 告警信息处理方法和装置、存储介质和电子设备
CN114004331A (zh) * 2021-10-14 2022-02-01 武汉烽火技术服务有限公司 一种基于关键指标和深度学习的故障分析方法
CN114138601A (zh) * 2021-11-26 2022-03-04 北京金山云网络技术有限公司 一种业务告警方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112712113B (zh) 一种基于指标的告警方法、装置及计算机系统
CN106886481B (zh) 一种系统健康度静态分析预测方法及装置
CN106951984B (zh) 一种系统健康度动态分析预测方法及装置
US8140454B2 (en) Systems and/or methods for prediction and/or root cause analysis of events based on business activity monitoring related data
US20190228296A1 (en) Significant events identifier for outlier root cause investigation
US7412448B2 (en) Performance degradation root cause prediction in a distributed computing system
KR102118670B1 (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
US7039554B2 (en) Method and system for trend detection and analysis
US7409316B1 (en) Method for performance monitoring and modeling
CN113518011B (zh) 异常检测方法和装置、电子设备及计算机可读存储介质
CN110362612B (zh) 由电子设备执行的异常数据检测方法、装置和电子设备
CN111045894B (zh) 数据库异常检测方法、装置、计算机设备和存储介质
CN107202604B (zh) 一种告警处理方法及系统
US7197428B1 (en) Method for performance monitoring and modeling
US7369967B1 (en) System and method for monitoring and modeling system performance
US10360249B2 (en) System and method for creation and detection of process fingerprints for monitoring in a process plant
CN108764290B (zh) 模型异动的原因确定方法及装置和电子设备
CN114116391A (zh) Redis实例的健康检测方法、装置、设备及存储介质
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
CN108306997B (zh) 域名解析监控方法及装置
CN107480703B (zh) 交易故障检测方法及装置
CN115967827A (zh) 一种数据指标监测告警方法、装置、设备及存储介质
CN116232851A (zh) 一种网络异常的预警方法、装置、电子设备和存储介质
CN115774646A (zh) 一种进程预警方法、装置、电子设备和存储介质
CN112398706B (zh) 数据评估标准确定方法、装置及存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination