CN111176931A - 一种运营监控方法、装置、服务器及存储介质 - Google Patents
一种运营监控方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN111176931A CN111176931A CN201911265115.2A CN201911265115A CN111176931A CN 111176931 A CN111176931 A CN 111176931A CN 201911265115 A CN201911265115 A CN 201911265115A CN 111176931 A CN111176931 A CN 111176931A
- Authority
- CN
- China
- Prior art keywords
- target
- boundary value
- value
- monitoring data
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 153
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012806 monitoring device Methods 0.000 title description 4
- 238000004590 computer program Methods 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请属于数据分析技术领域,公开了一种运营监控方法、装置、服务器及存储介质,其中,所述方法包括:根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。通过本申请实施例,可以实现对目标时刻监测数据值偏离程度的精确衡量,提高服务器运营监控结果的准确率。
Description
技术领域
本申请属于数据分析技术领域,尤其涉及一种运营监控方法、装置、服务器及存储介质。
背景技术
在相关技术中,服务器运营监控管理一般是检测一段时间内服务器的各个性能指标实际值,并将统计的一段时间内的各个性能指标实际值不在置信区间内的值的比例来衡量当前的服务器状态。当统计的一段时间内的性能指标实际值不在置信区间内的值的比例超过比例阈值时,说明该时间段内为服务器处于异常状态,该异常状态预示着服务器故障或服务失败。通过检测这些异常状态,能尽快发现、界定主机服务器硬件故障或配置错误等软故障,并快速修复,从而避免严重故障发生或缩短故障持续时间。这种方法虽然实现简单,但在服务器的性能指标实际值与置信区间的任一边界值相差较小时,该服务器的性能指标实际值也会被识别为未在置信区间内的值,从而降低了服务器运营监控结果的准确率,甚至可能造成误报。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本申请实施例提供了一种运营监控方法、装置、服务器及存储介质,以解决现有技术中服务器运营监控结果不准确的问题。
本申请的第一方面,提供了一种运营监控方法,所述方法包括:
根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
在本申请的一些实施例中,所述根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率,包括:
根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
当预先获取的目标时刻监测数据值小于或等于所述第一边界值时,确定所述目标时刻监测数据值与所述第一边界值的第一差值;
根据所述区间长度和所述第一差值,确定目标时刻监测数据值的目标错误率。
在本申请的一些实施例中,所述根据所述区间长度和所述第一差值,确定目标时刻监测数据值的目标错误率,包括:
按照下列公式计算所述目标错误率:
其中,P为目标时刻监测数据值的目标错误率,Slow为所述目标时刻监测数据值与所述第一边界值的第一差值,Sinterval为所述目标时刻所述目标置信区间的区间长度。
在本申请的一些实施例中,所述根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率,包括:
根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
当预先获取的目标时刻监测数据值大于或等于所述第二边界值时,确定所述目标时刻监测数据值与所述第二边界值的第二差值;
根据所述区间长度和所述第二差值,确定目标时刻监测数据值的目标错误率。
在本申请的一些实施例中,所述根据所述区间长度和所述第二差值,确定目标时刻监测数据值的目标错误率,包括:
按照下列公式计算所述目标错误率:
其中,P为目标时刻监测数据值的目标错误率,Sheigh为所述目标时刻监测数据值与所述第二边界值的第二差值;Sinterval为所述目标时刻所述目标置信区间的区间长度。
在本申请的一些实施例中,根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值,包括:
从服务器的历史运营监控数据,提取与目标检测性能参数对应的监控数据;
根据与所述目标检测性能参数对应的监控数据,确定所述目标检测性能参数置信区间的第一边界值波动曲线和第二边界值波动曲线。
在本申请的一些实施例中,根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值,包括:
以目标时刻为基准时间,确定所述第一边界值波动曲线在目标时刻的第一数值;
以目标时刻为基准时间,确定所述第二边界值波动曲线在目标时刻的第二数值;
将所述第一数值作为所述目标置信区间的第一边界值以及将所述二数值作为所述目标置信区间的第二边界值。
本申请的第二方面,提供了一种运营监控装置,所述装置包括:
曲线生成模块,用于根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
第一计算模块,用于根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
第二计算模块,用于根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
信号生成模块,用于当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
本申请的第三方面,提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
本申请的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例首先根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;然后根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;之后,根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;最后,当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。可以理解,本申请实施例通过计算目标时刻监测数据值、目标时刻置信区间的第一边界值或第二边界值边界,可以得到目标时刻监测数据值的目标错误率,并根据目标错误率与设定错误率阈值的数值关系,来确定目标时刻的监测数据值可信度。这种方法,实现了对目标时刻监测数据值偏离程度的精确衡量,提高了服务器运营监控结果的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请一个实施例中的运营监控方法的流程图;
图2为本申请一个实施例中置信区间的第一边界值和第二边界值的一种变化示意图;
图3为本申请一个实施例中步骤S110的一种具体流程图;
图4为本申请一个实施例中步骤S120的一种具体流程图;
图5为本申请一个实施例中步骤S130的一种具体流程图;
图6为本申请一个实施例中步骤S130的另一种具体流程图;
图7本申请一个实施例中置信区间的第一边界值和第二边界值的另一种变化示意图;
图8本申请一个实施例中置信区间的第一边界值、第二边界值与实时数据的位置关系变化示意图;
图9为本申请实施例中一种运营监控装置的模块示意图;
图10为本申请实施例中一种服务器的示意框图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
现有的服务器运营监控管理,是检测一段时间内服务器的各个性能指标实际值,并将统计的一段时间内的各个性能指标实际值不在置信区间内的值的比例来衡量当前的服务器状态,而各个性能指标实际值是否落入置信区间内是由置信区间的长度、各个性能指标实际值与置信区间的边界值的差值等因素共同决定的。该方法虽然实现简单,但是其科学性较差。当服务器的性能指标实际值与置信区间的任一边界值的差值绝对值较小时,该服务器的性能指标实际值也会被识别为未在置信区间内,从而降低了服务器运营监控结果的准确率,甚至可能造成误报。针对上述问题,本申请提出一种运营监控方法、装置、服务出去及计算机存储介质,与现有的服务器运营监控管理相比,其科学性更高,可以实现了对目标时刻监测数据值偏离程度的精确衡量,提高了服务器运营监控结果的准确率。
如图1所示,本申请实施例提供了一种运营监控方法的实现流程示意图,本申请实施例的执行主体可以为服务器,本实施例提供的服务器可由任意的软件和/或硬件实现,所述方法包括:
步骤S110、根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
步骤S120、根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
步骤S130、根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
步骤S140、当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
下面,将对上述步骤进行详细说明。
在步骤S110中,根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线。
可以理解,所述目标置信区间,是根据历史运营监控数据所构造的服务器数据估计区间。置信区间展现的是服务器运营数据的真实值有一定概率落在测量结果的周围的程度,其给出的是服务器运营数据值的可信程度,即所要求的“一个概率”。所述置信区间的第一边界值,一般为置信区间的最小值,即左端点值。所述置信区间的第二边界值,一般为置信区间的最大值,即右端点值。
一般地,可以根据服务器的历史运营监控数据,对监控数据与时间两个变量进行曲线拟合,得到目标置信区间的第一边界值波动曲线和第二边界值波动曲线。其中,进行曲线拟合的方法,包括但不限于:最小二乘拟合、多项式拟合、正交多项式拟合。曲线拟合模型包括但不限于:整合移动平均自回归模型(Autoregressive Integrated Moving Averagemodel,AIMAM)、非线性曲线拟合模型(Nonlinear Curve Fitting,NCFM)。
如图2所示,在完成曲线拟合后,可以得到了所述目标置信区间的第一边界值变动曲线,即得到所述目标置信区间的第一边界值随时间变化而变化的趋势曲线(以时间为x轴、数据值为y轴的趋势曲线)。相应地,可以得到所述目标置信区间的第二边界值随时间变化而变化的趋势曲线(以时间为x轴、数据值为y轴的趋势曲线)。
在图2中,当前时刻运营数据值为current,当前时刻置信区间的第一边界值(即下边界值)为interval_low,置信区间的第二边界值(即上边界值)为interval_heigh。interval_low所在曲线为所述目标置信区间的第一边界值变动曲线,interval_heigh为所述目标置信区间的第二边界值变动曲线。
如图3所示,在本申请的一个实施例中,步骤S110,可以包括以下步骤:
步骤S310、从服务器的历史运营监控数据,提取与目标检测性能参数对应的监控数据。
步骤S320、根据与所述目标检测性能参数对应的监控数据,确定所述目标检测性能参数置信区间的第一边界值波动曲线和第二边界值波动曲线。
可以理解,当所述历史运营监控数据仅对应于一项性能参数时,可以直接根据所述历史运营监控数据与时间两个变量进行曲线拟合,得到目标置信区间的第一边界值波动曲线和第二边界值波动曲线。而当所述历史运营监控数据对应于至少两项性能参数时,需要先确定一个当前需要监测的性能参数,即目标检测性能参数。
需要说明的是,当所述历史运营监控数据对应于至少两项性能参数时,可以由用户实时输入、系统预先设定或其它控制方式确定各个性能参数的曲线拟合顺序。进而,相应的曲线拟合模型可以根据各个性能参数的曲线拟合顺序,依次完成对各个性能参数(例如CPU空闲时间、IO等待响应时间)的曲线拟合,得到各个性能参数置信区间的第一边界值波动曲线和第二边界值波动曲线。
这样做的好处是,可以根据历史运营数据的变化,实时调整历史运营数据的监控对象,提高了服务器历史运营数据的监控灵活性。
在步骤S120中,根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值。
如图4所示,在本申请的一个实施例中,步骤S120,可以包括以下步骤:
步骤S410、以目标时刻为基准时间,确定所述第一边界值波动曲线在目标时刻的第一数值。
步骤S420、以目标时刻为基准时间,确定所述第二边界值波动曲线在目标时刻的第二数值。
步骤S430、将所述第一数值作为所述目标置信区间的第一边界值以及将所述二数值作为所述目标置信区间的第二边界值。
可以理解,在得到所述目标置信区间的第一边界值波动曲线和第二边界值波动曲线后,可以基于目标置信区间的第一边界值波动曲线和第二边界值波动曲线,对所述历史运营监控数据进行分析。具体地,选取x轴上与目标时刻对应的点,并以该点作与y轴的平行线。该平行线与目标置信区间的第一边界值波动曲线和第二边界值波动曲线与两个交点。一个交点为所述第一边界值波动曲线在目标时刻的第一数值,另一个交点为所述所述第二边界值波动曲线在目标时刻的第二数值。如图2所述,目标时刻可以为18.00,运营数据值为current,18.00置信区间的第一边界值(即下边界值)可以为74,18.00置信区间的第二边界值(即上边界值)可以为83。因此,18.00的历史运营监控数据置信区间可以为[74,83]。
步骤S130、根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率。
如图5所示,在本申请的一个实施例中,步骤S130可以包括以下步骤:
步骤S510、根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度。
可以理解,在得到所述第一边界值和所述第二边界值后,可以以所述第一边界值和所述第二边界值为置信区间的两个端点值,形成所述置信区间。置信区间的区间长度,可以为所述第一边界值和所述第二边界值的差值绝对值。在图2中,当前时刻运营数据值为current,当前时刻置信区间的第一边界值(即下边界值)为interval_low,置信区间的第二边界值(即上边界值)为interval_heigh。则可以按照下列公式计算当前时刻所述目标置信区间的区间长度:
目标置信区间的区间长度=|interval_heigh-interval_low| 公式1
举例来说,当目标时刻为20.00时,运营数据值为69,20.00置信区间的第一边界值(即下边界值)可以为70,20.00置信区间的第二边界值(即上边界值)可以为90。因此,18.00的置信区间的区间长度为20。
步骤S520、当预先获取的目标时刻监测数据值小于或等于所述第一边界值时,确定所述目标时刻监测数据值与所述第一边界值的第一差值。
可以理解,当预先获取的目标时刻监测数据值小于或等于所述第一边界值时,可能出现两种情况。一种是目标时刻监测数据值小于所述第一边界值且差值小于或等于预定差值(比如3或5);另一种是目标时刻监测数据值小于所述第一边界值且差值大于预定差值(比如3或5)。
举例来说,目标时刻可以为18.00,运营数据值为72,18.00置信区间的第一边界值(即下边界值)可以为74,18.00置信区间的第二边界值(即上边界值)可以为83。因此,18.00的历史运营监控数据置信区间为[74,83]。其中,第一差值=|72-74|=2。
步骤S530、根据所述区间长度和所述第一差值,确定目标时刻监测数据值的目标错误率。
可以理解,所述目标错误率,用于衡量目标时刻监测数据偏离目标置信区间程度。一般地,所述目标错误率越高,表明目标时刻监测数据偏离目标置信区间程度越高,目标时刻对应数据发生异常的概率越高。
在本申请的一个实施例中,按照下列公式计算所述目标错误率P:
其中,P为目标时刻监测数据值的目标错误率,Slow为所述目标时刻监测数据值与所述第一边界值的第一差值,Sinterval为所述目标时刻所述目标置信区间的区间长度。
仍以上例进行说明,目标时刻可以为18.00,运营数据值为72,18.00置信区间的第一边界值(即下边界值)可以为74,18.00置信区间的第二边界值(即上边界值)可以为83。因此,18.00的历史运营监控数据置信区间为[74,83]。其中,第一差值=|72-74|=2,即Slow=2,Sinterval=83-74=9,P=2/(2+9)=2/11。
如图6所示,在本申请的一个实施例中,步骤S130可以包括以下步骤:
步骤S610、根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度。
可以理解,在得到所述第一边界值和所述第二边界值后,可以以所述第一边界值和所述第二边界值为置信区间的两个端点值,形成所述置信区间。置信区间的区间长度,可以为所述第一边界值和所述第二边界值的差值绝对值。在图7中,当前时刻运营数据值为current,当前时刻置信区间的第一边界值(即下边界值)为interval_low,置信区间的第二边界值(即上边界值)为interval_heigh。则可以按照公式1计算当前时刻所述目标置信区间的区间长度。
举例来说,当目标时刻为17:33时,运营数据值为88,17:33的置信区间的第一边界值(即下边界值)可以为76,17:33的置信区间的第二边界值(即上边界值)可以为85。因此,17:33的置信区间的区间长度为85-76=9。
步骤S620、当预先获取的目标时刻监测数据值大于或等于所述第二边界值时,确定所述目标时刻监测数据值与所述第二边界值的第二差值。
可以理解,当预先获取的目标时刻监测数据值大于或等于所述第二边界值时,可能出现两种情况。一种是目标时刻监测数据值大于所述第二边界值且差值小于或等于预定差值(比如3或5);另一种是目标时刻监测数据值大于所述第一边界值且差值大于预定差值(比如3或5)。
举例来说,当目标时刻为17:33时,运营数据值为88,17:33的置信区间的第一边界值(即下边界值)可以为76,17:33的置信区间的第二边界值(即上边界值)可以为85。因此,17:33的置信区间的区间长度为85-76=9。其中,第二差值=|88-85|=3。
步骤S630、根据所述区间长度和所述第二差值,确定目标时刻监测数据值的目标错误率。
可以理解,所述目标错误率,用于衡量目标时刻监测数据偏离目标置信区间程度。一般地,所述目标错误率越高,表明目标时刻监测数据偏离目标置信区间程度越高,目标时刻对应数据发生异常的概率越高。
在本申请的一个实施例中,按照下列公式计算所述目标错误率:
其中,P为目标时刻监测数据值的目标错误率,Sheigh为所述目标时刻监测数据值与所述第二边界值的第二差值;Sinterval为所述目标时刻所述目标置信区间的区间长度。
仍以上例进行说明,当目标时刻为17:33时,运营数据值为88,17:33的置信区间的第一边界值(即下边界值)可以为76,17:33的置信区间的第二边界值(即上边界值)可以为85。因此,17:33的置信区间的区间长度为85-76=9。其中,Sheigh=3,Sinterval=85-76=9,P=3/(3+9)=3/12。
步骤S140、当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
可以理解,当所述历史运营监控数据仅对应于一项性能参数时,可以仅确定一个预定错误率阈值。而当所述历史运营监控数据对应于至少两项性能参数时,则需要分别确定各个性能参数的预定错误率阈值。具体地,所述错误率阈值可以根据当前参数性能运行情况、异常发生次数、修复时长等因素综合确定,例如设定为3,本申请实施例对此不做特殊限定。
在本申请的一个实施例中,可以根据所述历史运营监控数据,求得平均错误率并将该平均错误率作为所述预定错误率阈值。进而当目标时刻的监控数据的目标错误率大于或等于预定错误率阈值时,向指定终端、服务器等设备发出预警信号,预警信号可以通过短信、电话等形式进行传输。
需要说明的是,所述求得平均错误率的方法,包括但不限于加权平均、算术平均、几何平均等方法。
在本申请的一个实施例中,如图8所示,为本申请的一个实施例中置信区间与实时数据的数值关系图。在图8中,当部分时刻实时数据与置信区间边界值的差值较小而难以确定其是否异常时,可以在利用本申请实施例公开的技术方案对这些时刻的数据进行错误率计算,当这些时刻的目标错误率大于预定错误率阈值,可以识别并标记这些异常点,并向指定终端、服务器等设备发出预警信号。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的一种运营监控方法,图9示出了本申请实施例提供的一种运营监控装置的一个实施例结构图,所述运营监控装置,包括:
曲线生成模块910,用于根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
第一计算模块920,用于根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
第二计算模块930,用于根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
信号生成模块940,用于当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
在本申请的一些实施例中,所述第二计算模块930,可以包括:
第一计算单元,用于根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
第二计算单元,用于当预先获取的目标时刻监测数据值小于或等于所述第一边界值时,确定所述目标时刻监测数据值与所述第一边界值的第一差值;
第三计算单元,用于根据所述区间长度和所述第一差值,确定目标时刻监测数据值的目标错误率。
在本申请的另一些实施例中,所述第二计算模块930,可以包括:
第三计算单元,用于根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
第四计算单元,用于当预先获取的目标时刻监测数据值大于或等于所述第二边界值时,确定所述目标时刻监测数据值与所述第二边界值的第二差值;
第五计算单元,用于根据所述区间长度和所述第二差值,确定目标时刻监测数据值的目标错误率。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例与现有技术相比存在的有益效果是:本申请实施例首先根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;然后根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;之后,根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;最后,当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。可以理解,本申请实施例通过计算目标时刻监测数据值、目标时刻置信区间的第一边界值或第二边界值边界,可以得到目标时刻监测数据值的目标错误率,并通过根据目标错误率与设定错误率阈值的关系,来确定目标时刻的监测数据值可信度。这种方法,实现了对目标时刻监测数据值偏离程度的精确衡量,提高了服务器运营监控结果的准确率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图10示出了本申请实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本申请实施例相关的部分。
如图10所示,该实施例的服务器10包括:处理器100、存储器101以及存储在所述存储器101中并可在所述处理器100上运行的计算机程序102。所述处理器100执行所述计算机程序102时实现上述各运营监控方法实施例中的步骤,例如图1所示的步骤S110至步骤S140。或者,所述处理器100执行所述计算机程序102时实现上述各装置实施例中各模块/单元的功能,例如图9所示模块910至模块940的功能。
示例性的,所述计算机程序102可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器101中,并由所述处理器100执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序102在所述服务器10中的执行过程。
所述服务器10可以是带有运营监测装置的服务器。本领域技术人员可以理解,图10仅仅是服务器10的示例,并不构成对服务器10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器10还可以包括输入输出设备、网络接入设备、总线等。
所述处理器100可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器101可以是所述服务器10的内部存储单元,例如服务器10的硬盘或内存。所述存储器101也可以是所述服务器10的外部存储设备,例如所述服务器10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器101还可以既包括所述服务器10的内部存储单元也包括外部存储设备。所述存储器101用于存储所述计算机程序以及所述服务器10所需的其它程序和数据。所述存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种运营监控方法,其特征在于,所述方法包括:
根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
2.根据权利要求1所述的运营监控方法,其特征在于,所述根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率,包括:
根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
当预先获取的目标时刻监测数据值小于或等于所述第一边界值时,确定所述目标时刻监测数据值与所述第一边界值的第一差值;
根据所述区间长度和所述第一差值,确定目标时刻监测数据值的目标错误率。
4.根据权利要求1所述的运营监控方法,其特征在于,所述根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率,包括:
根据所述第一边界值和所述第二边界值,确定目标时刻所述目标置信区间的区间长度;
当预先获取的目标时刻监测数据值大于或等于所述第二边界值时,确定所述目标时刻监测数据值与所述第二边界值的第二差值;
根据所述区间长度和所述第二差值,确定目标时刻监测数据值的目标错误率。
6.根据权利要求1所述的运营监控方法,其特征在于,根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值,包括:
从服务器的历史运营监控数据,提取与目标检测性能参数对应的监控数据;
根据与所述目标检测性能参数对应的监控数据,确定所述目标检测性能参数置信区间的第一边界值波动曲线和第二边界值波动曲线。
7.根据权利要求1所述的运营监控方法,其特征在于,根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值,包括:
以目标时刻为基准时间,确定所述第一边界值波动曲线在目标时刻的第一数值;
以目标时刻为基准时间,确定所述第二边界值波动曲线在目标时刻的第二数值;
将所述第一数值作为所述目标置信区间的第一边界值以及将所述二数值作为所述目标置信区间的第二边界值。
8.一种运营监控装置,其特征在于,所述装置包括:
曲线生成模块,用于根据服务器的历史运营监控数据,确定目标置信区间的第一边界值波动曲线和第二边界值波动曲线;
第一计算模块,用于根据所述第一边界值波动曲线和所述第二边界值波动曲线,确定目标时刻所述目标置信区间的第一边界值和第二边界值;
第二计算模块,用于根据所述第一边界值、所述第二边界值和预先获取的目标时刻监测数据值,确定目标时刻监测数据值的目标错误率;
信号生成模块,用于当所述目标错误率大于或等于预定错误率阈值时,生成预警信号。
9.一种服务器,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911265115.2A CN111176931A (zh) | 2019-12-11 | 2019-12-11 | 一种运营监控方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911265115.2A CN111176931A (zh) | 2019-12-11 | 2019-12-11 | 一种运营监控方法、装置、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111176931A true CN111176931A (zh) | 2020-05-19 |
Family
ID=70651930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911265115.2A Pending CN111176931A (zh) | 2019-12-11 | 2019-12-11 | 一种运营监控方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111176931A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722177A (zh) * | 2021-08-03 | 2021-11-30 | 北京达佳互联信息技术有限公司 | 时序指标异常检测方法、装置、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718715A (zh) * | 2015-12-23 | 2016-06-29 | 华为技术有限公司 | 异常检测方法和设备 |
CN109921955A (zh) * | 2017-12-12 | 2019-06-21 | 北京嘀嘀无限科技发展有限公司 | 业务量监控方法、系统、计算机设备和存储介质 |
CN110377447A (zh) * | 2019-07-17 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 一种异常数据检测方法、装置及服务器 |
-
2019
- 2019-12-11 CN CN201911265115.2A patent/CN111176931A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718715A (zh) * | 2015-12-23 | 2016-06-29 | 华为技术有限公司 | 异常检测方法和设备 |
CN109921955A (zh) * | 2017-12-12 | 2019-06-21 | 北京嘀嘀无限科技发展有限公司 | 业务量监控方法、系统、计算机设备和存储介质 |
CN110377447A (zh) * | 2019-07-17 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 一种异常数据检测方法、装置及服务器 |
Non-Patent Citations (1)
Title |
---|
苏为华: "《统计指标理论与方法研究》", 北京:中国物价出版社, pages: 77 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722177A (zh) * | 2021-08-03 | 2021-11-30 | 北京达佳互联信息技术有限公司 | 时序指标异常检测方法、装置、系统、设备及存储介质 |
CN113722177B (zh) * | 2021-08-03 | 2024-03-29 | 北京达佳互联信息技术有限公司 | 时序指标异常检测方法、装置、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107086944B (zh) | 一种异常检测方法和装置 | |
CN112162878B (zh) | 数据库故障发现方法、装置、电子设备及存储介质 | |
CN108564181B (zh) | 电力设备故障检测与维修方法及终端设备 | |
CN111459700A (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
CN113360359B (zh) | 指标异常数据溯源方法、装置、设备及存储介质 | |
CN109725220B (zh) | 一种变压器油冷却回路的检测方法、系统及装置 | |
KR101953558B1 (ko) | 스마트 기기 결함 관리 장치 및 방법 | |
CN110223489A (zh) | 一种工程对象的监测方法及装置 | |
CN111859050A (zh) | 一种轧机数据可视化方法、装置及服务器 | |
US20080255773A1 (en) | Machine condition monitoring using pattern rules | |
US20080288213A1 (en) | Machine condition monitoring using discontinuity detection | |
CN113945801B (zh) | 一种配电网故障定位方法、装置、设备和存储介质 | |
CN112729884B (zh) | 基于大数据的设备故障诊断方法及装置 | |
CN112380073B (zh) | 一种故障位置的检测方法、装置及可读存储介质 | |
CN111176931A (zh) | 一种运营监控方法、装置、服务器及存储介质 | |
CN112561333A (zh) | 一种考核数据处理方法、装置、电子设备及存储介质 | |
CN116861356A (zh) | 异常数据检测方法及装置、电子设备、存储介质 | |
CN108710751B (zh) | 一种输电塔局部连接松动识别方法及装置 | |
CN114157486B (zh) | 通信流量数据异常检测方法、装置、电子设备及存储介质 | |
CN111258863A (zh) | 数据异常检测方法、装置、服务器和计算机可读存储介质 | |
CN114928467A (zh) | 一种网络安全运维关联分析方法及系统 | |
CN113919691A (zh) | 一种调频服务指标测算方法及相关装置 | |
CN113608953A (zh) | 测试数据生成方法、装置、电子设备及可读存储介质 | |
CN118275034B (zh) | 一种智能抗干扰压力变送器 | |
CN117031268A (zh) | 一种开关柜状态评估方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200519 |
|
RJ01 | Rejection of invention patent application after publication |