CN111666187A - 用于检测异常响应时间的方法和装置 - Google Patents

用于检测异常响应时间的方法和装置 Download PDF

Info

Publication number
CN111666187A
CN111666187A CN202010431272.2A CN202010431272A CN111666187A CN 111666187 A CN111666187 A CN 111666187A CN 202010431272 A CN202010431272 A CN 202010431272A CN 111666187 A CN111666187 A CN 111666187A
Authority
CN
China
Prior art keywords
response time
data
training data
segmentation
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010431272.2A
Other languages
English (en)
Other versions
CN111666187B (zh
Inventor
时祎瑜
陈宇
王博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010431272.2A priority Critical patent/CN111666187B/zh
Publication of CN111666187A publication Critical patent/CN111666187A/zh
Application granted granted Critical
Publication of CN111666187B publication Critical patent/CN111666187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Complex Calculations (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种用于检测异常响应时间的方法和装置,涉及云计算技术领域。具体实现方案为:获取系统的待检测响应时间;判断待检测响应时间是否大于预先确定的系统检测阈值;若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间;其中,系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到。该方法和装置保证了预先确定的系统检测阈值的准确性,从而可以准确及时地发现系统异常情况,减少系统故障带来的一系列损失。

Description

用于检测异常响应时间的方法和装置
技术领域
本公开涉及计算机技术领域,具体涉及云计算技术领域,尤其涉及用于检测异常响应时间的方法和装置。
背景技术
响应时间反映了系统当前时刻对请求的处理能力,是表征系统运行状态的关键指标之一。在系统正常运行的情况下,响应时间的变化应该表现为在某一个固定数值附近小范围内上下波动。一旦响应时间的指标出现了大幅度的增加,说明此时系统很可能出现了故障。因此需要对响应时间指标进行监控,及时地发现异常情况,减少故障带来的一系列损失。
现有的针对响应时间指标进行监控的技术方案,采用的是恒定阈值的方式,通过观察历史指标数据波动的变化范围,设置一个固定的阈值,一旦指标数据超过这个固定阈值表示此时指标数据出现了异常。
然而,由于不同的系统特性和性能不同,显然无法对所有系统的响应时间设置同样的检测阈值。比如面对同样的请求,某些性能好的系统能快速地处理完成接收到的请求,因此这类系统的响应时间检测阈值会设置得比较小;而某些性能稍差的系统对请求的处理过程耗时较长,响应时间可能整体偏大,相应地需要设置更大的检测阈值。对于性能相同但接收到的请求复杂度不同的系统也是如此,处理复杂请求的系统往往需要更多的时间完成对请求的响应。
发明内容
本公开实施例提供了用于检测异常响应时间的方法和装置。
第一方面,本公开实施例提供了一种用于检测异常响应时间的方法,方法包括:获取系统的待检测响应时间;判断待检测响应时间是否大于预先确定的系统检测阈值;若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间;其中,系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到。
第二方面,本公开实施例提供了一种用于检测异常响应时间的装置,装置包括:待测时间获取模块,被配置成获取系统的待检测响应时间;检测阈值判断模块,被配置成判断待检测响应时间是否大于预先确定的系统检测阈值;其中,系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到;异常响应确定模块,被配置成若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间。
第三方面,本公开的实施例提供了一种电子设备/服务器/智能终端,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实施例的方法。
第四方面,本公开的实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实施例中的方法。
本公开实施例提供的用于检测异常响应时间的方法和装置,首先获取待检测响应时间;判断待检测响应时间是否大于预先确定的系统检测阈值,若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间;其中,系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到。在这一过程中,由于系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,且概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到,保证了预先确定的系统检测阈值的准确性,从而可以准确及时地发现系统异常情况,减少系统故障带来的一系列损失。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
通过阅读参照以下附图所作的对非限制性实施例详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性系统架构图;
图2a是根据本公开实施例的用于检测异常响应时间的方法的一个实施例的流程示意图;
图2b是根据本公开实施例的用于检测异常响应时间的方法的某系统在一段时间内的响应时间的示意图;
图2c是根据本公开实施例的用于检测异常响应时间的方法的某系统不包含明显异常情况的目标训练数据的示意图;
图2d是根据本公开实施例的用于检测异常响应时间的方法的检测效果的示意图;
图3是根据本公开实施例的用于检测异常响应时间的方法的一个示例性应用场景;
图4a是根据本公开实施例的用于检测异常响应时间的方法的又一个实施例的流程示意图;
图4b是根据本公开实施例的对一组历史响应时间样本进行切分后的类内散度之和序列曲线的示意图;
图4c是根据本公开实施例的图4b中的类内散度之和序列曲线中的散度切分位置的示意图;
图4d是根据本公开实施例的图4c中的类内散度之和的散度切分位置所对应的切分阈值切分历史响应数据的示意图;
图4e是根据本公开实施例的波动平滑的类内散度之和序列曲线的示意图;
图5是根据本公开实施例的用于检测异常响应时间的装置的一个实施例的示例性结构图;
图6是本公开的用来实现本申请实施例的用于检测异常响应时间的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了可以应用本公开的用于检测异常响应时间的方法或用于检测异常响应时间的装置的实施例的示例性系统架构100。
图1示出了可以应用本公开的用于检测异常响应时间的方法或用于检测异常响应时间的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如文档处理应用、音频播放应用、流媒体处理应用、多方交互应用、人工智能应用、游戏应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是支持文档处理应用的各种电子设备,包括但不限于智能终端、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
在实践中,本公开实施例所提供的用于检测异常响应时间的方法可以由终端设备101、102、103或服务器105执行,用于检测异常响应时间的装置也可以设置于终端设备101、102、103或服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
现有技术针对响应时间指标进行监控的技术方案,采用的是恒定阈值的方式,通过观察历史指标数据波动的变化范围,设置一个固定的阈值,一旦指标数据超过这个固定阈值表示此时指标数据出现了异常。这种设置阈值的技术方案需要耗费大量的人力通过观察不同系统响应时间指标的历史数据的波动设置不同阈值,整个监控配置过程繁琐并且低效。
请参考图2,图2示出了根据本公开的用于检测异常响应时间的方法的一个实施例的流程200。该用于检测异常响应时间的方法包括以下步骤:
步骤201,获取系统的待检测响应时间。
在本实施例中,用于检测异常响应时间的方法的执行主体(例如图1所示的终端或服务器)可以从本地或远程设备获取系统的待检测时间。这里的系统,是指运维人员维护其运行状态的系统。该系统可以包括硬件系统和/或软件系统。
系统的待检测响应时间,是指该系统等待检测的响应时间,该响应时间表征了系统对请求的处理能力。通常,上述执行主体可以对系统的响应时间进行监控,并对监控到的响应时间进行检测,以便及时地发现系统的异常情况,减少故障带来的一系列损失。
步骤202,判断待检测响应时间是否大于预先确定的系统检测阈值。
在本实施例中,上述执行主体在获取系统的待检测响应时间之后,可以根据预先确定的系统检测阈值,判断待检测响应时间是否大于该系统检测阈值。
这里的系统检测阈值,由于根据系统的特性或是响应时间指标本身的性质的不同,响应时间数据的波动会有较大的差异,无法对所有系统的响应时间数据设置统一的系统检测阈值,因此需要对不同的系统针对性的设置各系统的系统检测阈值。
不同系统的历史响应时间数据,其波动情况并不相同,表示他们服从的分布不同。由于概率是一种能在不同分布之间使用的衡量工具,因此可以从概率的角度来寻找不同系统的历史响应时间数据所对应的确定正常波动范围的系统检测阈值。
这里的系统检测阈值,为预设的异常概率值在概率密度函数中所对应的目标训练数据,而概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到。这里的异常的历史响应时间,可以为根据经验或实际应用场景确定的、大于正常响应时间阈值的响应时间,可以采用人工标注或数据筛选的方法来确定异常的历史响应时间。其中,正常响应时间阈值可以根据历史响应时间的分布计算确定或人工设定。
具体地,可以预先设定异常概率值p,如果某个值x在历史响应时间的数据分布中出现的概率大于p,则x是一个正常的历史响应时间;如果某个值x在历史响应时间的数据分布中出现的概率小于p,则x是一个异常的历史响应时间。因此异常概率值p是可以区分正常数据和异常数据的边界值,而历史响应时间的数据分布中异常概率值p对应的分位值,也即系统检测阈值。
对于不同的系统,可以根据系统的历史响应时间(也即响应时间的历史数据),分别计算得到历史响应时间对应的概率密度函数。再找到概率密度函数中异常概率值p对应的历史响应时间的数值,也即专属于每一个系统的响应时间的系统检测阈值。这样,只需针对不同系统设置同一个异常概率值p,即可得到不同系统的响应时间的系统检测阈值。
在通过历史响应时间找出界定响应时间正常和异常情况的系统检测阈值时,需要保证历史响应时间中不能有太多异常情况的数据。否则,找到的检测阈值会由于受到异常数据的影响而偏大,导致使用错误的阈值进行检测时可能会出现漏报本属于异常的响应时间的情况。
示例性地,如图2b所示,图2b为某系统在一段时间内的响应时间,其中凸起的曲线为响应时间的原始数据。从标注的位置看响应时间正常在3.5附近波动,方框210内是8处响应时间突升的位置,可以看出这些突升的程度不同,且在整段时间内出现较为频繁,属于包含异常情况较多的历史响应时间。如果不对方框的异常情况进行标注,则设定的阈值曲线220会在50左右的直线位置,这样偏高的检测阈值会导致漏掉第一个和第六个方框内的响应时间突升异常,造成漏报。
因此,光靠观察数据找到检测阈值还不够,还需要人工对历史响应时间数据中的异常进行标注,基于剔除异常数据之后的历史数据找到的系统检测阈值,才可以用于响应时间的异常检测。
以图2b中的方框内的明显的异常响应时间为例,剔除这些异常响应时间后,可以得到如图2c所示的不包含明显异常情况的目标训练数据。
在拟合概率密度函数时,可以首先基于剔除异常的历史响应时间后得到的目标训练数据,对目标训练数据进行拟合,以得到概率密度函数。在拟合概率密度函数时,可以采用现有技术或未来发展的技术中用于拟合概率密度函数的方法来实现,本申请对此不做限定。例如,可以根据系统的历史响应时间的分布,确定可以表征这些分布的具体的概率密度函数,之后采用有参数估计法确定概率密度函数。
在本实施例的一些可选实现方式中,系统检测阈值经由以下步骤确定:从系统原始的历史响应时间序列中,剔除异常的历史响应时间,得到初始训练数据;基于初始训练数据,确定目标训练数据;采用核密度估计函数,拟合目标训练数据的概率密度函数;将预设的异常概率值在概率密度函数中所对应的目标训练数据作为系统检测阈值。
在本实现方式中,在剔除异常的历史响应时间之后,可以得到初始训练数据,之后,可以将初始训练数据作为目标训练数据,拟合目标训练数据的概率密度函数;也可以对初始训练数据进行进一步的切分,得到切分后的分布较为集中的目标训练数据,进而拟合目标训练数据的概率密度函数。
在一个具体的示例中,基于初始训练数据,确定目标训练数据,可以采用以下目标训练数据确定步骤确定:采用目标切分阈值切分初始训练数据,得到两类切分数据;从两类切分数据中,确定数量较多的一类切分数据为目标训练数据。
在该示例中,目标切分阈值可以为预先根据经验或实际应用场景的需要所确定的切分阈值。例如,采用所确定的两类切分数据中类内散度之和最小的切分阈值作为目标切分阈值。采用该目标切分阈值,可以进一步切分出初始训练数据中数量较多、分布密度较大的目标训练数据。
在拟合概率密度函数时,由于不同系统的响应时间的分布不规则,可以采用核密度估计(KDE)方法,从响应时间数据本身的特性出发来近似拟合响应时间数据的概率分布。该方法是对响应时间数据划分小区间,在每个小区间上用某种已知的分布进行拟合,最终将不同区间上的分布求均值得出最终的概率密度函数。
具体地,对于过去预设时间周期内的n个历史响应时间数据H={x1,x2,...,xn},采用核密度估计函数估计概率密度函数的公式如下:
Figure BDA0002500678040000081
其中,
Figure BDA0002500678040000082
为概率密度函数;Kh(x;xi)为核函数,用于拟合xi附近的数据分布。
若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=0,σ=1时的正态分布是标准正态分布。在这里,以正态分布作为核函数,正态分布的均值为xi,以数据H的整体方差std(H)作为正态分布的方差σ2
历史响应时间数据H={x1,x2,...,xn}的概率密度函数即为将每个数据xi的分布累加后求均值的结果。
Figure BDA0002500678040000083
最终核密度估计拟合得到的概率密度函数在异常概率值p处的对应的目标训练数据,即为响应时间的系统检测阈值。
本实现方式中,从历史响应时间数据本身的特性出发,采用核密度估计函数来近似拟合历史响应时间数据的概率分布,所得到的概率密度函数更为准确的体现了历史响应时间数据本身的特性,从而提升了根据该概率密度函数所确定的系统检测阈值的准确性。
步骤203,若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间。
在本实施例中,对于原始的待检测响应时间,经过与步骤202基于异常点过滤和概率密度函数所确定的系统检测阈值的大小的比较,最终可以将大于系统检测阈值的待检测响应时间确定为系统异常响应时间。
在一个具体的示例中,本实施例的检测效果如图2d所示。其中曲线为原始数据,直线230为基于本申请实施例的用于检测异常响应时间的方法计算得到的检测阈值,高于检测阈值的部分会被检测为异常的响应时间。
本公开上述实施例的用于检测异常响应时间的方法,与现有技术中设置阈值的技术方案需要耗费大量的人力通过观察不同系统响应时间指标的历史数据的波动设置不同阈值,整个监控配置过程繁琐并且低效相比,由于系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,且概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到,保证了预先确定的系统检测阈值的准确性,从而可以准确及时地发现系统异常情况,减少系统故障带来的一系列损失。
以下结合图3,描述本公开的用于检测异常响应时间的方法的示例性应用场景。
如图3所示,图3示出了根据本公开的用于检测异常响应时间的方法的一个示例性应用场景。
如图3所示,用于检测异常响应时间的方法300运行于电子设备310中,可以包括:
首先,获取系统的待检测响应时间301;
之后,判断待检测响应时间301是否大于预先确定的系统检测阈值302;其中,系统检测阈值302为预设的异常概率值303在概率密度函数304中所对应的目标训练数据,概率密度函数304基于剔除异常的历史响应时间后所确定的目标训练数据305拟合得到;
最后,若待检测响应时间大于系统检测阈值302,则将待检测响应时间确定为系统异常响应时间306。
应当理解,上述图3中所示出的用于检测异常响应时间的方法的应用场景,仅为对于用于检测异常响应时间的方法的示例性描述,并不代表对该方法的限定。例如,上述图3中示出的各个步骤,可以进一步采用更为细节的实现方法。也可以在上述图3的基础上,进一步细化其中的系统检测阈值的确定步骤。
进一步参考图4,图4示出了根据本公开实施例的确定目标训练数据的一个实施例的示意性流程图。
如图4所示,本实施例的确定目标训练数据的方法400,用于拟合上述图2、图3所示的实施例中的概率密度函数,可以包括:如步骤401至步骤404所示的目标切分阈值确定步骤和包括如步骤405至步骤406所示的目标训练数据确定步骤,具体内容如下:
步骤401,从系统原始的历史响应时间序列中,确定切分阈值序列。
在本实施例中,用于检测异常响应时间的方法的执行主体(例如图1所示的终端或服务器)在训练概率密度函数时,可以获取采用本方法确定的目标训练数据。
本实施例中的确定目标训练数据的方法,可以从系统原始的历史响应时间序列中,构建切分阈值序列。例如,从历史响应时间序列中采样响应时间,构建切分阈值序列。或,从历史响应时间序列中确定所有可能的取值作为切分阈值序列。
在本实施例的一些可选的实现方式中,从系统原始的历史响应时间序列中,确定切分阈值序列可以包括:将预设时间周期内的系统原始的历史响应时间序列中的每一个历史响应时间按照从小到大顺序排序,然后再将排序后的历史响应时间作为切分阈值序列。
在本实现方式中,通过对原始的历史响应时间序列中的每一个历史响应时间按照从小到大排序,可以获取有序的切分阈值序列,从而为后续遍历切分阈值序列、观察以该切分阈值切分后计算得到的类内散度之和、进而确定切分阈值提供良好的基础,提高确定切分阈值的效率。
步骤402,采用切分阈值序列中的每一个切分阈值,计算对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,得到类内散度之和序列。
在本实施例中,通过对比上述图2a-图2c所示的实施例中的图2b和图2c可以看出,图2b中包含异常情况的原始数据分布在0~200之间,分布比较分散,图2c中理想数据常在2左右附近波动,分布较为集中。因此可以通过数据分布的离散程度来判断数据中是否包含有异常点,并采用基于类内散度的方法自动将异常点剔除出去,避免传统方法所需耗费的人工成本。
具体地,可以采用切分阈值序列中的每一个切分阈值,分别计算对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,可以得到每一个切分阈值对应的类内散度之和,从而得到类内散度之和序列。
在本实施例的一些具体的实现中,采用切分阈值序列中的每一个切分阈值,计算对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,包括:基于当前切分阈值,将系统原始的历史响应时间序列切分为第一类数据和第二类数据;计算第一类数据的离散程度与第二类数据的离散程度之和,得到采用当前切分阈值对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和。
具体地,由于异常点总是会明显偏离数据正常的波动范围,所以过滤异常数据后的数据离散程度应该远小于原始数据的离散程度。因此对于某一组原始历史响应时间数据Z(z1、z2、z3、...、zn),首先利用类内散度公式计算历史响应时间的数据离散程度
Figure BDA0002500678040000111
其中u为数据Z的均值。
之后,再设置一个切分位置i,将小于i和大于i的历史响应时间数据分为X、Y两类,计算切分后X类历史响应时间数据的离散程
Figure BDA0002500678040000112
Figure BDA0002500678040000113
Y类历史响应时间数据
Figure BDA0002500678040000114
从而可以得到X类历史响应数据和Y类历史响应数据的类内散度之和
Figure BDA0002500678040000115
Figure BDA0002500678040000116
如果s_sumi远小于s,说明按照i位置切分后数据的离散程度明显减小,表示这次切分有效的区分出了异常数据。而对于正常运行的系统来说出现异常数据是小概率事件,因此X类和Y类中数据个数更少的那类数据会被认为是异常数据。
由于是对原始的历史响应时间数据进行切分,因此最简单的方法是遍历原始的历史响应时间中所有可能的取值zi作为切分的阈值,每次切分会获得以zi切分对应的类内散度之和s_sumi,由此可以得到以不同阈值切分后的类内散度之和的序列{s_sumi}。
图4b展示了按照上述方法对一组历史响应时间样本进行切分后的类内散度之和序列曲线410,图中横坐标为数据按从小到大排序后的序号,纵坐标为以该阈值切分后计算得到的类内散度之和s_sumi
步骤403,计算每一个切分阈值所对应的类内散度之和与该切分阈值左右两侧预设尺寸窗口内的各个切分阈值的类内散度之和的梯度值之和,得到梯度值之和序列。
在本实施例中,可以计算每一个切分阈值到左右一段窗口内各个点的梯度值之和,梯度值之和越大表示类内散度之和序列曲线在该切分阈值位置突降程度越大。
步骤404,从梯度值之和序列中确定最大的梯度值之和,将计算得到最大的梯度值之和的切分阈值作为目标切分阈值。
在本实施例中,可以以梯度之和最大的切分阈值位置对应的切分阈值,作为最优的过滤异常历史响应时间点的目标切分阈值。
示例性地,图4c示出了类内散度之和的切分位置的示意图。类内散度之和的切分位置为竖线420,该竖线420所对应的为突降程度最大的位置,利用该竖线420对应的切分阈值对历史响应时间数据进行切分,得到的散点图结果如图4d所示,其中散点为原始响应时间,直线430为目标切分阈值。该基于类内散度方法寻找到的目标切分阈值,可以去除原始历史响应时间数据中异常噪声点的影响。
上述步骤401-步骤404所述的目标切分阈值确定步骤,由于采用了类内散度之和中突降程度最大的位置所对应的切分阈值作为目标切分阈值,表明该目标切分阈值左右的切分阈值所得到的类内散度之和的大小差别较大,其中较小的类内散度之和说明:采用该突降程度最大的位置所对应的切分阈值,切分后数据的离散程度明显减小,表示这次切分有效的区分出了异常数据,从而可以提高切分的准确性和有效性。
步骤405,采用目标切分阈值切分初始训练数据,得到两类切分数据。
在本实施例中,在步骤404中确定目标切分阈值之后,可以采用切分阈值将初始训练数据切分为两类切分数据,也即得到历史响应时间数据的正常数据和异常数据。
步骤406,从两类切分数据中,确定数量较多的一类切分数据为目标训练数据。
在本实施例中,对于正常运行的系统来说出现异常数据是小概率事件,因此采用切分阈值切分得到的两类数据中数量更少的那类数据会被认为是异常数据,那么数量较多的一类切分数据也即目标训练数据。
在本实施例的一些可选实现方式中,目标训练数据确定步骤还包括:判断目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值;若是,将目标训练数据作为系统原始的历史响应时间序列,跳转至执行目标切分阈值确定步骤,得到更新后的目标切分阈值,并采用更新后的目标切分阈值、将目标训练数据作为初始训练数据,跳转至执行目标训练数据确定步骤。
在本实现方式中,当类内散度之和序列曲线中存在幅度不一致的多种历史响应时间的异常数据时,可以在剔除一次历史响应时间的异常数据后,对于得到的目标训练数据重复上述确定目标切分阈值的过程,并采用新的目标切分阈值对数据再次进行切分操作,直至将明显的异常数据剔除。
在上述图2a-图2d所示的实施例中,图2d为理想的切分结果,可以看出其中不包含明显的异常点,其对应的类内散度之和序列曲线如图4e所示。该类内散度之和序列曲线整条曲线的波动平滑,即使是竖线440对应的突降程度最大的位置与其左边位置的散度值也没有明显的突降变化。
因此,经过多次实验和调整,可以为切分阈值的左、右梯度值设置为预设的平滑阈值(可以根据经验或实际应用场景确定,例如上述图2d所示的场景中所确定的平滑阈值为1),一旦最优的切分阈值对应的左或右梯度有一个小于预设的平滑阈值,表示此时曲线已经足够平滑,不需要再进行切分。
本实现方式中的目标训练数据确定步骤,可以减少目标训练数据中的异常数据,从而提高所确定的目标训练数据的准确性。
本公开上述实施例的用于检测异常响应时间的方法,与现有技术中由运维人员提前对历史数据中的异常进行标注相比,由于在确定目标训练数据时,计算每一个切分阈值所对应的类内散度之和与该切分阈值左右两侧预设尺寸窗口内的各个切分阈值的类内散度之和的梯度值之和,将其中得到最大的梯度值之和的切分阈值作为目标切分阈值,提高了确定目标切分阈值的准确率,之后基于目标切分阈值确定目标训练数据,提高了目标训练数据的准确性,从而提高了基于目标训练数据所确定的系统检测阈值的效率。
进一步参考图5,本实施例的用于检测异常响应时间的装置500,可以包括:待测时间获取模块501,被配置成获取系统的待检测响应时间;检测阈值判断模块502,被配置成判断待检测响应时间是否大于预先确定的系统检测阈值;其中,系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到;异常响应确定模块503,被配置成若待检测响应时间大于系统检测阈值,则将待检测响应时间确定为系统异常响应时间。
在本实施例的一些可选实现方式中,检测阈值判断模块中的系统检测阈值经由以下模块确定:异常时间剔除模块,被配置成从系统原始的历史响应时间序列中,剔除异常的历史响应时间,得到初始训练数据;目标数据确定模块,被配置成基于初始训练数据,确定目标训练数据;密度函数确定模块,被配置成采用核密度估计函数,拟合目标训练数据的概率密度函数;检测阈值确定模块,被配置成将预设的异常概率值在概率密度函数中所对应的目标训练数据作为系统检测阈值。
在本实施例的一些可选实现方式中,目标数据确定模块采用以下目标训练数据确定模块确定:切分数据确定模块,被配置成采用目标切分阈值切分初始训练数据,得到两类切分数据;训练数据确定模块,被配置成从两类切分数据中,确定数量较多的一类切分数据为目标训练数据。
在本实施例的一些可选实现方式中,切分数据确定模块中的目标切分阈值基于以下目标切分阈值确定模块确定:阈值序列确定模块,被配置成从系统原始的历史响应时间序列中,确定切分阈值序列;散度和序列确定模块,被配置成采用切分阈值序列中的每一个切分阈值,计算对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,得到类内散度之和序列;梯度值和序列确定模块,被配置成计算每一个切分阈值所对应的类内散度之和与该切分阈值左右两侧预设尺寸窗口内的各个切分阈值的类内散度之和的梯度值之和,得到梯度值之和序列;切分阈值确定模块,被配置成从梯度值之和序列中确定最大的梯度值之和,将计算得到最大的梯度值之和的切分阈值作为目标切分阈值。
在本实施例的一些可选实现方式中,目标训练数据确定模块还包括:平滑阈值判断模块,被配置成在从两类切分数据中,确定数量较多的一类切分数据为目标训练数据之后,判断目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值;确定模块跳转模块,被配置成若目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值,将目标训练数据作为系统原始的历史响应时间序列,跳转至采用目标切分阈值确定模块,得到更新后的目标切分阈值,并采用更新后的目标切分阈值、将目标训练数据作为初始训练数据,跳转至采用目标训练数据确定模块确定目标训练数据。
在本实施例的一些可选实现方式中,阈值序列确定模块进一步被配置成:将预设时间周期内的系统原始的历史响应时间序列中的每一个历史响应时间按照从小到大顺序排序,将排序后的历史响应时间作为切分阈值序列。
在本实施例的一些可选实现方式中,散度和序列确定模块进一步被配置成:基于当前切分阈值,将系统原始的历史响应时间序列切分为第一类数据和第二类数据;计算第一类数据的离散程度与第二类数据的离散程度之和,得到采用当前切分阈值对历史响应时间序列进行切分后得到的两类切分数据的类内散度之和。
应当理解,装置500中记载的各个单元与参考图2a-图4c描述的方法中记载的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置500及其中包含的各个单元,在此不再赘述。
如图6所示,是根据本申请实施例的用于检测异常响应时间的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的用于检测异常响应时间的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于检测异常响应时间的方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于检测异常响应时间的方法对应的程序指令/模块(例如,图5所示的待测时间获取模块501、检测阈值判断模块502、异常响应确定模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及单元,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于检测异常响应时间的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于检测异常响应时间的方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至用于检测异常响应时间的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于检测异常响应时间的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用于检测异常响应时间的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,由于系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,且概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到,保证了预先确定的系统检测阈值的准确性,从而可以准确及时地发现系统异常情况,减少系统故障带来的一系列损失。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种用于检测异常响应时间的方法,所述方法包括:
获取系统的待检测响应时间;
判断所述待检测响应时间是否大于预先确定的系统检测阈值;
若所述待检测响应时间大于所述系统检测阈值,则将所述待检测响应时间确定为系统异常响应时间;
其中,所述系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,所述概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到。
2.根据权利要求1所述的方法,其中,所述系统检测阈值经由以下步骤确定:
从系统原始的历史响应时间序列中,剔除异常的历史响应时间,得到初始训练数据;
基于初始训练数据,确定目标训练数据;
采用核密度估计函数,拟合所述目标训练数据的概率密度函数;
将预设的异常概率值在所述概率密度函数中所对应的目标训练数据作为系统检测阈值。
3.根据权利要求2所述的方法,其中,所述基于初始训练数据,确定目标训练数据采用以下目标训练数据确定步骤确定:
采用目标切分阈值切分所述初始训练数据,得到两类切分数据;
从所述两类切分数据中,确定数量较多的一类切分数据为目标训练数据。
4.根据权利要求3所述的方法,其中,所述目标切分阈值基于以下目标切分阈值确定步骤确定:
从系统原始的历史响应时间序列中,确定切分阈值序列;
采用所述切分阈值序列中的每一个切分阈值,计算对所述历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,得到类内散度之和序列;
计算每一个切分阈值所对应的类内散度之和与该切分阈值左右两侧预设尺寸窗口内的各个切分阈值的类内散度之和的梯度值之和,得到梯度值之和序列;
从所述梯度值之和序列中确定最大的梯度值之和,将计算得到所述最大的梯度值之和的切分阈值作为目标切分阈值。
5.根据权利要求4所述的方法,其中,所述目标训练数据确定步骤还包括:
在所述从所述两类切分数据中,确定数量较多的一类切分数据为目标训练数据之后,判断所述目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值;
若是,将所述目标训练数据作为所述系统原始的历史响应时间序列,跳转至执行所述目标切分阈值确定步骤,得到更新后的目标切分阈值,并采用更新后的目标切分阈值、将所述目标训练数据作为所述初始训练数据,跳转至执行所述目标训练数据确定步骤。
6.根据权利要求4所述的方法,其中,所述从系统原始的历史响应时间序列中,确定切分阈值序列包括:
将预设时间周期内的系统原始的历史响应时间序列中的每一个历史响应时间按照从小到大顺序排序,将排序后的历史响应时间作为切分阈值序列。
7.根据权利要求4所述的方法,其中,采用所述切分阈值序列中的每一个切分阈值,计算对所述历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,包括:
基于当前切分阈值,将系统原始的历史响应时间序列切分为第一类数据和第二类数据;
计算所述第一类数据的离散程度与所述第二类数据的离散程度之和,得到采用当前切分阈值对所述历史响应时间序列进行切分后得到的两类切分数据的类内散度之和。
8.一种用于检测异常响应时间的装置,所述装置包括:
待测时间获取模块,被配置成获取系统的待检测响应时间;
检测阈值判断模块,被配置成判断所述待检测响应时间是否大于预先确定的系统检测阈值;其中,所述系统检测阈值为预设的异常概率值在概率密度函数中所对应的目标训练数据,所述概率密度函数基于剔除异常的历史响应时间后所确定的目标训练数据拟合得到;
异常响应确定模块,被配置成若所述待检测响应时间大于所述系统检测阈值,则将所述待检测响应时间确定为系统异常响应时间。
9.根据权利要求8所述的装置,其中,所述检测阈值判断模块中的系统检测阈值经由以下模块确定:
异常时间剔除模块,被配置成从系统原始的历史响应时间序列中,剔除异常的历史响应时间,得到初始训练数据;
目标数据确定模块,被配置成基于初始训练数据,确定目标训练数据;
密度函数确定模块,被配置成采用核密度估计函数,拟合所述目标训练数据的概率密度函数;
检测阈值确定模块,被配置成将预设的异常概率值在所述概率密度函数中所对应的目标训练数据作为系统检测阈值。
10.根据权利要求9所述的装置,其中,所述目标数据确定模块采用以下目标训练数据确定模块确定:
切分数据确定模块,被配置成采用目标切分阈值切分所述初始训练数据,得到两类切分数据;
训练数据确定模块,被配置成从所述两类切分数据中,确定数量较多的一类切分数据为目标训练数据。
11.根据权利要求10所述的装置,其中,所述切分数据确定模块中的目标切分阈值基于以下目标切分阈值确定模块确定:
阈值序列确定模块,被配置成从系统原始的历史响应时间序列中,确定切分阈值序列;
散度和序列确定模块,被配置成采用所述切分阈值序列中的每一个切分阈值,计算对所述历史响应时间序列进行切分后得到的两类切分数据的类内散度之和,得到类内散度之和序列;
梯度值和序列确定模块,被配置成计算每一个切分阈值所对应的类内散度之和与该切分阈值左右两侧预设尺寸窗口内的各个切分阈值的类内散度之和的梯度值之和,得到梯度值之和序列;
切分阈值确定模块,被配置成从所述梯度值之和序列中确定最大的梯度值之和,将计算得到所述最大的梯度值之和的切分阈值作为目标切分阈值。
12.根据权利要求11所述的装置,其中,所述目标训练数据确定模块还包括:
平滑阈值判断模块,被配置成在所述从所述两类切分数据中,确定数量较多的一类切分数据为目标训练数据之后,判断所述目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值;
确定模块跳转模块,被配置成若所述目标切分阈值的左侧预设尺寸窗口内的梯度值之和或右侧预设尺寸窗口内的梯度值之和是否大于预设的平滑阈值,将所述目标训练数据作为所述系统原始的历史响应时间序列,跳转至采用所述目标切分阈值确定模块,得到更新后的目标切分阈值,并采用更新后的目标切分阈值、将所述目标训练数据作为所述初始训练数据,跳转至采用所述目标训练数据确定模块确定目标训练数据。
13.根据权利要求11所述的装置,其中,所述阈值序列确定模块进一步被配置成:
将预设时间周期内的系统原始的历史响应时间序列中的每一个历史响应时间按照从小到大顺序排序,将排序后的历史响应时间作为切分阈值序列。
14.根据权利要求11所述的装置,其中,所述散度和序列确定模块进一步被配置成:
基于当前切分阈值,将系统原始的历史响应时间序列切分为第一类数据和第二类数据;
计算所述第一类数据的离散程度与所述第二类数据的离散程度之和,得到采用当前切分阈值对所述历史响应时间序列进行切分后得到的两类切分数据的类内散度之和。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
CN202010431272.2A 2020-05-20 2020-05-20 用于检测异常响应时间的方法和装置 Active CN111666187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010431272.2A CN111666187B (zh) 2020-05-20 2020-05-20 用于检测异常响应时间的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010431272.2A CN111666187B (zh) 2020-05-20 2020-05-20 用于检测异常响应时间的方法和装置

Publications (2)

Publication Number Publication Date
CN111666187A true CN111666187A (zh) 2020-09-15
CN111666187B CN111666187B (zh) 2023-07-04

Family

ID=72384086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010431272.2A Active CN111666187B (zh) 2020-05-20 2020-05-20 用于检测异常响应时间的方法和装置

Country Status (1)

Country Link
CN (1) CN111666187B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215307A (zh) * 2020-11-19 2021-01-12 薛蕾 一种应用机器学习自动检测地震仪器信号异常的方法
CN112445679A (zh) * 2020-11-13 2021-03-05 上海优扬新媒信息技术有限公司 一种信息检测方法、装置、服务器及存储介质
CN113052272A (zh) * 2021-05-31 2021-06-29 北京宝兰德软件股份有限公司 一种异常检测方法、装置、电子设备及存储介质
CN115809404A (zh) * 2023-02-01 2023-03-17 北京万里红科技有限公司 一种检测阈值计算方法、装置、存储介质及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE33152E (en) * 1985-11-08 1990-01-23 Radar detection of hazardous small scale weather disturbances
US20090271664A1 (en) * 2008-04-28 2009-10-29 International Business Machines Corporation Method for monitoring dependent metric streams for anomalies
CN102221699A (zh) * 2010-03-18 2011-10-19 日本电气株式会社 卫星定位系统的异常值检测装置、检测方法及检测程序
US20150032752A1 (en) * 2013-07-24 2015-01-29 Compuware Corporation Method and system for real-time, false positive resistant, load independent and self-learning anomaly detection of measured transaction execution parameters like response times
CN106656678A (zh) * 2017-01-23 2017-05-10 西安交通大学 一种基于响应时间序列数据分析的虚拟机同驻检测方法
CN107197473A (zh) * 2017-06-15 2017-09-22 三星电子(中国)研发中心 一种终端异常状态确定方法和装置
CN108419102A (zh) * 2017-02-09 2018-08-17 腾讯科技(深圳)有限公司 一种多媒体业务管理方法、装置及服务器
CN109560984A (zh) * 2018-11-13 2019-04-02 苏宁易购集团股份有限公司 一种网络服务响应时间异常检测方法及装置
CN109978379A (zh) * 2019-03-28 2019-07-05 北京百度网讯科技有限公司 时序数据异常检测方法、装置、计算机设备和存储介质
CN110086810A (zh) * 2019-04-29 2019-08-02 西安交通大学 基于特征行为分析的被动式工控设备指纹识别方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE33152E (en) * 1985-11-08 1990-01-23 Radar detection of hazardous small scale weather disturbances
US20090271664A1 (en) * 2008-04-28 2009-10-29 International Business Machines Corporation Method for monitoring dependent metric streams for anomalies
CN102221699A (zh) * 2010-03-18 2011-10-19 日本电气株式会社 卫星定位系统的异常值检测装置、检测方法及检测程序
US20150032752A1 (en) * 2013-07-24 2015-01-29 Compuware Corporation Method and system for real-time, false positive resistant, load independent and self-learning anomaly detection of measured transaction execution parameters like response times
CN106656678A (zh) * 2017-01-23 2017-05-10 西安交通大学 一种基于响应时间序列数据分析的虚拟机同驻检测方法
CN108419102A (zh) * 2017-02-09 2018-08-17 腾讯科技(深圳)有限公司 一种多媒体业务管理方法、装置及服务器
CN107197473A (zh) * 2017-06-15 2017-09-22 三星电子(中国)研发中心 一种终端异常状态确定方法和装置
CN109560984A (zh) * 2018-11-13 2019-04-02 苏宁易购集团股份有限公司 一种网络服务响应时间异常检测方法及装置
CN109978379A (zh) * 2019-03-28 2019-07-05 北京百度网讯科技有限公司 时序数据异常检测方法、装置、计算机设备和存储介质
CN110086810A (zh) * 2019-04-29 2019-08-02 西安交通大学 基于特征行为分析的被动式工控设备指纹识别方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
THOMAS J. VEASEY等: "Anomaly Detection in Application Performance Monitoring Data" *
尚华;冯牧;张贝贝;于凤敏;: "基于Bayesian Lasso方法的变量选择和异常值检测" *
李宗林;胡光岷;周汝强;: "基于层叠模型的网络流量异常检测方法" *
马智远;崔晓飞;黄裕春;王艳;符玲;臧天磊;: "辨识谐波电流监测数据中异常数据的一种方法研究" *
黄贤源;隋立芬;翟国君;柴洪洲;: "利用Bayes估计进行多波束测深异常数据探测" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112445679A (zh) * 2020-11-13 2021-03-05 上海优扬新媒信息技术有限公司 一种信息检测方法、装置、服务器及存储介质
CN112445679B (zh) * 2020-11-13 2023-01-06 度小满科技(北京)有限公司 一种信息检测方法、装置、服务器及存储介质
CN112215307A (zh) * 2020-11-19 2021-01-12 薛蕾 一种应用机器学习自动检测地震仪器信号异常的方法
CN112215307B (zh) * 2020-11-19 2024-03-19 薛蕾 一种应用机器学习自动检测地震仪器信号异常的方法
CN113052272A (zh) * 2021-05-31 2021-06-29 北京宝兰德软件股份有限公司 一种异常检测方法、装置、电子设备及存储介质
CN115809404A (zh) * 2023-02-01 2023-03-17 北京万里红科技有限公司 一种检测阈值计算方法、装置、存储介质及电子设备
CN115809404B (zh) * 2023-02-01 2023-05-12 北京万里红科技有限公司 一种检测阈值计算方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN111666187B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
US11150974B2 (en) Anomaly detection using circumstance-specific detectors
CN111666187B (zh) 用于检测异常响应时间的方法和装置
US9652354B2 (en) Unsupervised anomaly detection for arbitrary time series
CN107766299B (zh) 数据指标异常的监控方法及其系统、存储介质、电子设备
US11176206B2 (en) Incremental generation of models with dynamic clustering
US8868474B2 (en) Anomaly detection for cloud monitoring
US20170147417A1 (en) Context-aware rule engine for anomaly detection
US11683234B2 (en) Server outlier detection
US8868993B1 (en) Data replacement policy
CN109471783B (zh) 预测任务运行参数的方法和装置
US10169719B2 (en) User configurable message anomaly scoring to identify unusual activity in information technology systems
US10705940B2 (en) System operational analytics using normalized likelihood scores
CN113837596B (zh) 一种故障确定方法、装置、电子设备及存储介质
US11736363B2 (en) Techniques for analyzing a network and increasing network availability
US20170109654A1 (en) Identifying intervals of unusual activity in information technology systems
CN109976971B (zh) 硬盘状态监测方法和装置
CN110333995A (zh) 对工业设备运行状态进行监测的方法及装置
US11438239B2 (en) Tail-based span data sampling
US9397921B2 (en) Method and system for signal categorization for monitoring and detecting health changes in a database system
CN111696095B (zh) 用于检测物体表面缺陷的方法及装置
CN117407245A (zh) 模型训练任务异常检测方法及系统、电子设备和存储介质
CN110837953A (zh) 一种自动化异常实体定位分析方法
CN114330437A (zh) 一种故障检测方法及故障分类模型的训练方法、装置
US20170109250A1 (en) Monitoring apparatus, method of monitoring and non-transitory computer-readable storage medium
US20230409421A1 (en) Anomaly detection in computer systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant