CN112131274B - 时间序列异常点的检测方法、装置、设备及可读存储介质 - Google Patents
时间序列异常点的检测方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN112131274B CN112131274B CN202011006800.6A CN202011006800A CN112131274B CN 112131274 B CN112131274 B CN 112131274B CN 202011006800 A CN202011006800 A CN 202011006800A CN 112131274 B CN112131274 B CN 112131274B
- Authority
- CN
- China
- Prior art keywords
- window
- processed
- target
- time
- time point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013507 mapping Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Fuzzy Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Debugging And Monitoring (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能领域,具体共公开了一种时间序列异常点的检测方法、装置、计算机设备及计算机可读存储介质,该方法包括:获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点;实现了通过获取时间序列中的目标窗口和待处理窗口,使采集到的样本序列相差较小,通过预置模型来确定目标窗口和待处理窗口的相似度值,避免得到的异常序列误差较大。
Description
技术领域
本发明涉及人工智能领域,尤其涉及时间序列异常点的检测方法、装置、设备及计算机可读存储介质名称。
背景技术
在AIOps领域中,时间序列是指在某一个指标按照时间的观测数据组成的序列,主机、服务器等硬件设备在运行过程中会产生大量的指标数值。如主机每秒的CPU使用率、某项业务每小时的请求量,都可以形成单变量时间序列指标数据。时间序列的异常检测则是从数据中找到与历史行为模式不同的点。
传统的时间序列异常检测方法常采用距离度量方法,即通过计算给定的单变量时间序列与预期值的距离并于给定阈值进行比较,若距离大于给定阈值,则可以判定该点为异常点。而阈值通常选取为一些基本统计量,例如中位数或90%分位数。但阈值的选定过于主观,且不适用于所有时间序列的数据异常检测。
发明内容
本发明的主要目的在于提供一种时间序列异常点的检测方法、装置、设备及计算机可读存储介质名称,旨在解决传统的时间序列异常检测方法常采用距离度量方法采集到的样本序列相差较大,导致不适用于所有的时间序列的数据异常检测,且得到的异常序列误差较大。
第一方面,本申请一种时间序列异常点的检测方法,所述时间序列异常点的检测方法包括:
获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;
根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
第二方面,本申请还提供一种时间序列异常点的检测装置,所述时间序列异常点的检测装置包括:
获取模块,用于获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
第一确定模块,用于基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;
第二确定模块,用于根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的时间序列异常点的检测方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的时间序列异常点的检测方法的步骤。
本发明实施例提出的一种时间序列异常点的检测方法、装置、设备及计算机可读存储介质,通过获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点,实现了通过获取时间序列中的目标窗口和待处理窗口,使采集到的样本序列相差较小,通过预置模型来确定目标窗口和待处理窗口的相似度值,避免得到的异常序列误差较大。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种时间序列异常点的检测方法的流程示意图;
图2为图1中的时间序列异常点的检测方法的子步骤流程示意图;
图3为图1中的时间序列异常点的检测方法的子步骤流程示意图;
图4为图1中的时间序列异常点的检测方法的子步骤流程示意图;
图5为本申请实施例中预置模型的网络层示意图;
图6为图1中的时间序列异常点的检测方法的子步骤流程示意图;
图7为本申请实施例提供的另一种时间序列异常点的检测方法的流程示意图;
图8为本申请实施例提供的一种时间序列异常点的检测装置的示意性框图;
图9为本申请一实施例涉及的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种时间序列异常点的检测方法、装置、设备及计算机可读存储介质。其中,该时间序列异常点的检测方法可应用于终端设备中,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请的实施例提供的一种时间序列异常点的检测方法的的流程示意图。
如图1所示,该时间序列异常点的检测方法包括步骤S101至步骤S103。
步骤S101、获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1。
示范性的,获取待处理时间序列的目标窗口,时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。目标窗口是指时间序列上基于窗口信息得到的包含时间序列上窗口对应的数值。例如,基于用户的操作指令,通过预置的窗口信息,获取待处理时间序列中该操作指令对应的目标窗口。基于该目标窗口的窗口信息在时间序列上滑动,采集该目标窗口在时间序列上对应的待处理窗口。
在一实施例中,具体地,参照图2,步骤S101包括:子步骤S1011至子步骤S1012。
子步骤S1011、确定待处理时间序列上待检测的目标时间点。
接收用户的操作指令,基于该操作指令确定该操作指令在待处理时间序列上对应时间点,将该时间点作为待检测的目标时间点。
子步骤S1012、基于预置窗口信息和所述目标时间点,获取所述目标时间点对应的目标窗口。
获取该目标时间点对应的预置窗口信息,该窗口信息包括窗口的长度信息等。基于该目标时间点和该预置窗口信息,得到该目标时间点对应的目标窗口。例如,当确定待处理时间序列上的目标时间点为t时刻时,该窗口信息的长度为20个时刻时,获取该待处理时间序列中t时刻之前的20个时刻对应的序列作为该t时刻的目标窗口。
在一实施例中,具体地,参照图3,步骤S101包括:子步骤S1013至子步骤S1014。
子步骤S1013、根据所述待处理时间序列,确定所述目标时间点的采集策略。
获取待处理时间序列的时长信息,基于该待处理时间序列的时长信息确定预置切分策略。根据预置切分策略对该待训练时间序列进行切分,得到该处理时间序列的多段子时间序列。例如,获取该待训练时间序列的各个时间点,确定该待训练时间序列是否小于预置时间点。若该时间点小于预置时间点,则基于预置切分策略对该时间点进行切分。例如,该训练时间序列为2018-1-1-00-00-00至2020-7-1-00-00-00,预置时间点为2020-1-1-00-00-00,则确定待训练时间序列大于预置时间点。通过预置切分策略将待训练时间序列切分为2018-1-1-00-00-00至2020-1-1-00-00-00,以及2020-1-1-00-00-00至2020-7-1-00-00-00两段待训练的子时间序列。通过不同的待训练的子时间序列,确定该待训练时间序列的采集策略。
子步骤S1014、基于所述采集策略和所述预置窗口信息,获取所述目标窗口对应的待处理窗口。
基于预置采集策略,分别对两段待训练时间序列进行采集,得到与目标窗口对应的待处理窗口。该待处理时间序列的时长信息为当前时刻2020-6-1-00-00-00时,预置时刻信息为2020-7-1-00-00-00时,则该时长信息包含预置时刻信息,通过该时长信息确定该目标时间点的采集策略。例如,确定当前时刻至2020-7-1-00-00-00的第一采集策略,确定2020-7-1-00-00-00-2020-6-1-00-00-00的第二采集策略。基于该预置窗口信息和第一采集策略在该待处理时间序列上的当前时刻至2020-7-1-00-00-00进行滑动,获取该目标窗口对应的待处理窗口。基于该窗口信息和第二采集策略在该待处理时间序列上的2020-7-1-00-00-00-2020-6-1-00-00-00中进行滑动,获取该目标窗口对应的待处理窗口。其中,在该待处理时间序列上的2020-7-1-00-00-00-2020-6-1-00-00-00中的滑动间隔大于在该待处理时间序列上的当前时刻-2020-7-1-00-00-00中的滑动间隔,且该待处理窗口的数量大于1。
步骤S102、基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值。
示范性的,通过预置模型,该预置模型是预先通过训练数据进行训练得到的。该训练数据包括待训练的窗口、相似窗口以及非相似窗口。例如,通过待训练的窗口和相似窗口以及目标窗口和非相似窗口对待训练模型进行训练,调整该模型中的权重参数,得到对应的预置模型。将该目标窗口和待处理窗口输入预置模型,运行该预置模型,得到目标窗口与待处理窗口之间的相似度值。若该待处理窗口的数量为多个时,依次将待处理窗口与目标窗口输入预置模型。例如,待处理窗口的数量为3个时,分别为待处理窗口A1、待处理窗口A2、待处理窗口A3。依次将待处理窗口A1和目标窗口输入预置模型,得到待处理窗口A1与目标窗口之间的相似度值;将待处理窗口A2和目标窗口输入预置模型,得到待处理窗口A2与目标窗口之间的相似度值;将待处理窗口A3和目标窗口输入预置模型,得到待处理窗口A3与目标窗口之间的相似度值。
在一实施例中,具体地,参照图4,步骤S102包括:子步骤S1021至子步骤S1023。
子步骤S1021、基于预置模型,将所述目标窗口和所述待处理窗口分别输入所述预置模型。
示范性的,获取预置模型,该预置模型包括孪生神经网络模型。将目标窗口和待处理窗口分别输入该预置模型,其中,该模型包括两个输入层。
子步骤S1022、通过所述预置模型的权重参数,分别获取所述目标窗口的映射参数和所述待处理窗口的映射参数。
如图5所示,预置模型包括输入层、正向传播层、反向传播层以及输出层。通过该预置模型中输入层、正向传播层、反向传播层以及输出层中的权重参数对该目标窗口中的数值进行映射,得到该目标窗口中各个数值的映射参数。
子步骤S1023、基于所述目标窗口的映射参数和所述待处理窗口的映射参数,输出所述目标窗口与所述待处理窗口之间的相似度值。
通过该预置模型中输入层、正向传播层、反向传播层以及输出层中的权重参数对该待处理窗口中的数值进行映射,得到该待处理窗口中各个数值的映射参数。基于该目标窗口中各个数值的映射参数和待处理窗口中各个数值的映射参数,得到目标窗口和待处理窗口对应的相似度值。
步骤S103、根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
示范性的,获取目标窗口与待处理窗口之间的相似度值,基于该目标窗口与待处理窗口之间的相似度值,确定该目标窗口对应的时间点为异常点。示例性的,获取预置阈值,若目标窗口与待处理窗口之间的相似度值大于预设阈值,则将其时间点标为异常点。若目标窗口与待处理窗口之间的相似度值小于预设阈值,则可以认为该时间点不是异常点。
在一实施例中,具体地,参照图6,步骤S103包括:子步骤S1031至子步骤S1032。
子步骤S1031、确定所述目标窗口与各个所述待处理窗口之间的相似度值是否小于预置阈值。
示范性的,获取预先设置的阈值,通过该预先预置的阈值确定该目标窗口对应的时间点是否为异常点。将目标窗口与待处理窗口之间的相似度值与预置阈值进行比对,若该目标窗口与待处理窗口之间的相似度值大于或等于预置阈值,则确定该目标窗口对应的时间点不是异常点;例如,预先设置的阈值为80%时,获取到目标窗口与待处理窗口之间的相似度值为85%,则确定该目标窗口对应的时间点不是异常点。
子步骤S1032、若所述目标窗口与任意一个所述待处理窗口之间的相似度值小于所述预置阈值,则确定所述目标窗口对应的目标时间点为异常点。
若该目标窗口与待处理窗口之间的相似度值小于预置阈值,则确定该目标窗口对应的时间点为异常点。例如,预先设置的阈值为80%时,若获取到目标目标窗口与待处理窗口之间的相似度值为75%时,则确定该目标窗口对应的时间点是异常点。
在本发明实施例中,通过获取时间序列中的目标窗口和待处理窗口,使采集到的样本序列相差较小,通过预置模型来确定目标窗口和待处理窗口的相似度值,避免得到的异常序列误差较大。通过预置模型将时间序列片段映射到新空间中,比较序列的相似性,避免了漏采样带来的弊端。
请参照图7,图7为实施本实施例提供的时间序列异常点的检测方法的一场景示意图,如图7所示,该时间序列异常点的检测方法包括:
步骤S201、获取待训练的窗口、相似窗口和非相似窗口。
示范性的,获取待训练的窗口、相似窗口和非相似窗口,其中待训练的窗口、相似窗口和非相似窗口的数量至少为一个。获取待训练时间序列,确定该待训练时间序列上的任意一个时间点。基于该时间点和预置窗口信息,得到待时间点对应的窗口。例如,预先设置该窗口信息的长度为20个时刻,基于该时间点,将该时间点之前的20个时刻作为该时间点对应的窗口。通过该窗口采集该待训练时间序列上的相似窗口和非相似窗口。例如,获取该时间点对应的数值,基于该数值确定该待训练时间序列上对应的时刻。例如,该时间点对应的数值为10时,获取待训练时间序列上各个时刻对应的数值,若获取到与该时间点对应的数值10时,基于该数值10对应的时刻,得到相似窗口。获取与该时间点的数值不相同数值的时刻,基于该不相同数值的时刻,得到非相似窗口。例如,获取与该时间点的数值不同的20个时刻,将这20个时刻进行组合,得到对应的非相似窗口。
具体的,所述获取待训练的窗口、相似窗口和非相似窗口包括:确定预置待训练时间序列中的任意时间点;基于所述任意时间点确定窗口信息,得到所述任意时间点对应的待训练的窗口;确定所述待训练时间序列中与所述任意时间点相匹配的时刻,并基于所述窗口信息得到对应的相似窗口;确定所述待训练时间序列中与所述任意时间点不匹配的时刻,并基于所述窗口信息得到对应的非相似窗口。
示范性的,在接收到用户的操作指令,基于用户的操作指令确定预置待训练时间序列中对应的时间点,其中,该时间点为待训练时间序列中的任意时间点。在确定操作指令对应预置待训练时间序列中的时间点时,基于该时间点确定窗口信息。例如,窗口信息包括第一预置窗口信息和第二预置窗口信息。若该时间点为当前时间点时,确定该时间点对应的窗口信息为第一预置窗口信息;若该时间点不是当前时间点时,确定该时间点对应的窗口信息为第二预置窗口信息。其中第一预置窗口信息小于第二预置窗口信息。例如,第一预置窗口信息的长度为10个时间点,第二预置窗口信息的长度为20个时间点。基于该时间点对应的窗口信息,得到该时间点对应的窗口。例如,根据该时间点的窗口信息和时间点,将该时间点之前的10个时间点作为该时间点的窗口,该窗口包括该时间点之前10个时间点对应的数值。
确定所述子时间序列中与所述任意时间点相匹配的时刻,并通过所述窗口信息得到对应的相似窗口。获取该任意时间点在待训练时间序列中对应的数值,基于该数值在该待训练时间序列中与各个时刻的数值进行匹配。若获取到与该数值相同的第一数值时,确定该第一数值对应的第一时刻与该任意点对应的时刻匹配。例如,获取待训练时间序列中任意时间点对应的数值为10时,获取待训练时间序列中数值为10对应的时刻,将该时刻作为该任意时间点的第一时刻。基于该任意时间点对应的窗口信息与该第一时刻,得到该窗口对应的相似窗口。例如,通过该任意时间点对应的窗口信息,若该窗口信息的长度为20,将该第一时刻之前20个时间点作为该任意时间点的相似窗口。
确定所述子时间序列中与所述任意时间点不相匹配的时刻,并通过所述窗口信息得到对应的非相似窗口。获取该任意时间点在待训练时间序列中对应的数值,基于该数值在该待训练时间序列中与各个时刻的数值进行匹配。若获取到与该数值不相同的第二数值时,确定该第二数值对应的第二时刻。例如,获取待训练时间序列中任意时间点对应的数值为10时,获取待训练时间序列中数值为10对应的时刻,将该时刻作为该任意时间点的第二时刻。基于该任意时间点对应的窗口信息与该第二时刻,得到该窗口对应的相似窗口。例如,通过该任意时间点对应的窗口信息,若该窗口信息的长度为20,即获取20个与任意时间点的数值不相同的第二时刻,并将这20个的第二时刻进行组合,得到该窗口对应的非相似窗口。
步骤S202、根据所述待训练的窗口、相似窗口和非相似窗口对预置待训练模型进行训练,得到训练后的预置模型。
将获取到的窗口、相似窗口和非相似窗口两两对预置待训练模型进行训练,其中,两两对预置待训练模型进行训练为窗口和相似窗口,或者窗口和非相似窗口。例如,将原始的两个窗口时序数据,即窗口L={Xt-10,Xt-9,....Xt-2,Xt-1}和相似窗口或者,L={Xt-10,Xt-9,....Xt-2,Xt-1}和非相似窗口/>分别输入如图5所示左右两个网络层,为了将两个网络的输入映射到同一片新空间中,对两个网络的权重进行共享。经过模型训练后,预置模型的网络层的映射函数根据每对窗口的标签进行训练,进而学习到了相似窗口对与非相似窗口对之间的特征差异,使得映射到新空间后相似窗口的距离相近,非相似窗口对之间的距离较远。再计算所有匹配窗口对的交叉熵作为损失函数,多次循环,通过优化损失函数进而更新网络参数,其中,w1、w2、w3、w4、w5为权重参数,xt、xt-1、xt+1为L={Xt-10,Xt-9,....Xt-2,Xt-1}、相似窗口/>或中的数值。对时间序列数据映射网络结构进行改进,随机删去网络层中的额外连接,从而大大增强模型泛化性,拓宽了适用范围的同时也简化了模型参数,减少运算复杂度,从而降低对硬件配置的要求并节约了大量计算资源。
步骤S203、获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1。
示范性的,获取待处理时间序列的目标窗口,时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。目标窗口是指时间序列上基于窗口信息得到的包含时间序列上窗口对应的数值。例如,基于用户的操作指令,通过预置的窗口信息,获取待处理时间序列中该操作指令对应的目标窗口。基于该目标窗口的窗口信息在时间序列上滑动,采集该目标窗口在时间序列上对应的待处理窗口。
步骤S204、基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值。
示范性的,通过预置模型,该预置模型是预先通过训练数据进行训练得到的。该训练数据包括待训练的窗口、相似窗口以及非相似窗口。例如,通过待训练的窗口和相似窗口以及目标窗口和非相似窗口对待训练模型进行训练,调整该模型中的权重参数,得到对应的预置模型。将该目标窗口和待处理窗口输入预置模型,运行该预置模型,得到目标窗口与待处理窗口之间的相似度值。若该待处理窗口的数量为多个时,依次将待处理窗口与目标窗口输入预置模型。例如,待处理窗口的数量为3个时,分别为待处理窗口A1、待处理窗口A2、待处理窗口A3。依次将待处理窗口A1和目标窗口输入预置模型,得到待处理窗口A1与目标窗口之间的相似度值;将待处理窗口A2和目标窗口输入预置模型,得到待处理窗口A2与目标窗口之间的相似度值;将待处理窗口A3和目标窗口输入预置模型,得到待处理窗口A3与目标窗口之间的相似度值。
步骤S205、根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
示范性的,获取目标窗口与待处理窗口之间的相似度值,基于该目标窗口与待处理窗口之间的相似度值,确定该目标窗口对应的时间点为异常点。示例性的,获取预置阈值,若目标窗口与待处理窗口之间的相似度值大于预设阈值,则将其时间点标为异常点。若目标窗口与待处理窗口之间的相似度值小于预设阈值,则可以认为该时间点不是异常点。
在本发明实施例中,通过采集非相似窗口和相似窗口让模型自动学习正负样本对之间的特征差异,省略了主观的阈值选取步骤,提升了模型的准确率。
请参照图8,图8为本申请实施例提供的一种时间序列异常点的检测装置的示意性框图。
如图8所示,该时间序列异常点的检测装置400,包括:获取模块401、第一确定模块402、第二确定模块403。
获取模块401、用于获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
第一确定模块402、基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;
第二确定模块403、用于根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
其中,获取模块401具体还用于:
确定待处理时间序列上待检测的目标时间点;
基于预置窗口信息和所述目标时间点,获取所述目标时间点对应的目标窗口。
其中,获取模块401具体还用于:
根据所述待处理时间序列,确定所述目标时间点的采集策略;
基于所述采集策略和所述预置窗口信息,获取所述目标窗口对应的待处理窗口。
其中,第一确定模块402具体还用于:
基于预置模型,将所述目标窗口和所述待处理窗口分别输入所述预置模型;
通过所述预置模型的权重参数,分别获取所述目标窗口的映射参数和所述待处理窗口的映射参数;
基于所述目标窗口的映射参数和所述待处理窗口的映射参数,输出所述目标窗口与所述待处理窗口之间的相似度值。
其中,第二确定模块403具体还用于:
确定所述目标窗口与各个所述待处理窗口之间的相似度值是否小于预置阈值;
若所述目标窗口与任意一个所述待处理窗口之间的相似度值小于所述预置阈值,则确定所述目标窗口对应的目标时间点为异常点。
其中,时间序列异常点的检测装置具体用于:
获取待训练的窗口、相似窗口和非相似窗口;
根据所述待训练的窗口、相似窗口和非相似窗口对预置待训练模型进行训练,得到训练后的预置模型。
其中,时间序列异常点的检测装置具体用于:
确定预置待训练时间序列中的任意时间点;
基于所述任意时间点确定窗口信息,得到所述任意时间点对应的待训练的窗口;
确定所述待训练时间序列中与所述任意时间点相匹配的时刻,并基于所述窗口信息得到对应的相似窗口;
确定所述待训练时间序列中与所述任意时间点不匹配的时刻,并基于所述窗口信息得到对应的非相似窗口。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述时间序列异常点的检测方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为终端。
如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种时间序列异常点的检测方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种时间序列异常点的检测方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体地计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取待处理时间序列中的目标窗口,以及获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值;
根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
在一个实施例中,所述处理器获取待处理时间序列中的目标窗口实现时,用于实现:
确定待处理时间序列上待检测的目标时间点;
基于预置窗口信息和所述目标时间点,获取所述目标时间点对应的目标窗口。
在一个实施例中,所述处理器获取所述目标窗口对应的待处理窗口实现时,用于实现:
根据所述待处理时间序列,确定所述目标时间点的采集策略;
基于所述采集策略和所述预置窗口信息,获取所述目标窗口对应的待处理窗口。
在一个实施例中,所述处理器在基于预置模型,根据所述目标窗口和待处理窗口确定所述目标窗口和待处理窗口之间的相似度值实现时,用于实现:
基于预置模型,将所述目标窗口和所述待处理窗口分别输入所述预置模型;
通过所述预置模型的权重参数,分别获取所述目标窗口的映射参数和所述待处理窗口的映射参数;
基于所述目标窗口的映射参数和所述待处理窗口的映射参数,输出所述目标窗口与所述待处理窗口之间的相似度值。
在一个实施例中,所述处理器根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点实现时,用于实现:
确定所述目标窗口与各个所述待处理窗口之间的相似度值是否小于预置阈值;
若所述目标窗口与任意一个所述待处理窗口之间的相似度值小于所述预置阈值,则确定所述目标窗口对应的目标时间点为异常点。
在一个实施例中,所述处理器获取待处理时间序列的目标窗口之前实现时,用于实现:
获取待训练的窗口、相似窗口和非相似窗口;
根据所述待训练的窗口、相似窗口和非相似窗口对预置待训练模型进行训练,得到训练后的预置模型。
在一个实施例中,所述处理器获取待训练的窗口、相似窗口和非相似窗口实现时,用于实现:
确定预置待训练时间序列中的任意时间点;
基于所述任意时间点确定窗口信息,得到所述任意时间点对应的待训练的窗口;
确定所述待训练时间序列中与所述任意时间点相匹配的时刻,并基于所述窗口信息得到对应的相似窗口;
确定所述待训练时间序列中与所述任意时间点不匹配的时刻,并基于所述窗口信息得到对应的非相似窗口。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请时间序列异常点的检方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是预置模型的存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种时间序列异常点的检测方法,其特征在于,所述时间序列异常点的检测方法包括:
确定待处理时间序列上待检测的目标时间点;
基于预置窗口信息和所述目标时间点,获取所述目标时间点对应的目标窗口;
获取目标时间点对应的数值,基于所述数值确定所述待处理时间序列上对应的时刻;
基于所述待处理时间序列上对应的时刻,获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
基于预置模型,将所述目标窗口和所述待处理窗口分别输入所述预置模型;
通过所述预置模型的权重参数,分别获取所述目标窗口的映射参数和所述待处理窗口的映射参数;
基于所述目标窗口的映射参数和所述待处理窗口的映射参数,输出所述目标窗口与所述待处理窗口之间的相似度值;
根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
2.如权利要求1所述的时间序列异常点的检测方法,其特征在于,所述获取所述目标窗口对应的待处理窗口,包括:
根据所述待处理时间序列,确定所述目标时间点的采集策略;
基于所述采集策略和所述预置窗口信息,获取所述目标窗口对应的待处理窗口。
3.如权利要求1所述的时间序列异常点的检测方法,其特征在于,所述根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点包括:
确定所述目标窗口与各个所述待处理窗口之间的相似度值是否小于预置阈值;
若所述目标窗口与任意一个所述待处理窗口之间的相似度值小于所述预置阈值,则确定所述目标窗口对应的目标时间点为异常点。
4.如权利要求1所述的时间序列异常点的检测方法,其特征在于,所述获取所述目标时间点对应的目标窗口之前,还包括:
获取待训练的窗口、相似窗口和非相似窗口;
根据所述待训练的窗口、相似窗口和非相似窗口对预置待训练模型进行训练,得到训练后的预置模型。
5.如权利要求4所述的时间序列异常点的检测方法,其特征在于,所述获取待训练的窗口、相似窗口和非相似窗口包括:
确定预置待训练时间序列中的任意时间点;
基于所述任意时间点确定窗口信息,得到所述任意时间点对应的待训练的窗口;
确定所述待训练时间序列中与所述任意时间点相匹配的时刻,并基于所述窗口信息得到对应的相似窗口;
确定所述待训练时间序列中与所述任意时间点不匹配的时刻,并基于所述窗口信息得到对应的非相似窗口。
6.一种时间序列异常点的检测装置,其特征在于,所述时间序列异常点的检测装置包括:
获取模块,用于确定待处理时间序列上待检测的目标时间点,基于预置窗口信息和所述目标时间点,获取所述目标时间点对应的目标窗口,获取目标时间点对应的数值,基于所述数值确定所述待处理时间序列上对应的时刻,基于预置窗口信息和所述待处理时间序列上对应的时刻,获取所述目标窗口对应的待处理窗口,其中,所述待处理窗口数量大于1;
第一确定模块,基于预置模型,将所述目标窗口和所述待处理窗口分别输入所述预置模型,通过所述预置模型的权重参数,分别获取所述目标窗口的映射参数和所述待处理窗口的映射参数,基于所述目标窗口的映射参数和所述待处理窗口的映射参数,输出所述目标窗口与所述待处理窗口之间的相似度值;
第二确定模块,用于根据所述相似度值,确定所述目标窗口对应的时间点是否为异常点。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至5中任一项所述的时间序列异常点的检测方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至5中任一项所述的时间序列异常点的检测方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011006800.6A CN112131274B (zh) | 2020-09-22 | 2020-09-22 | 时间序列异常点的检测方法、装置、设备及可读存储介质 |
PCT/CN2020/125004 WO2021189845A1 (zh) | 2020-09-22 | 2020-10-30 | 时间序列异常点的检测方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011006800.6A CN112131274B (zh) | 2020-09-22 | 2020-09-22 | 时间序列异常点的检测方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112131274A CN112131274A (zh) | 2020-12-25 |
CN112131274B true CN112131274B (zh) | 2024-01-19 |
Family
ID=73842731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011006800.6A Active CN112131274B (zh) | 2020-09-22 | 2020-09-22 | 时间序列异常点的检测方法、装置、设备及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112131274B (zh) |
WO (1) | WO2021189845A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114235652A (zh) * | 2021-11-30 | 2022-03-25 | 国网北京市电力公司 | 烟尘颗粒浓度异常识别方法、装置、存储介质及设备 |
CN114726581B (zh) * | 2022-03-09 | 2023-06-20 | 同济大学 | 一种异常检测方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103618651A (zh) * | 2013-12-11 | 2014-03-05 | 上海电机学院 | 一种基于信息熵和滑动窗口的网络异常检测方法及系统 |
CN105160181A (zh) * | 2015-09-02 | 2015-12-16 | 华中科技大学 | 一种数控系统指令域序列异常数据检测方法 |
CN106411597A (zh) * | 2016-10-14 | 2017-02-15 | 广东工业大学 | 一种网络流量异常检测方法及系统 |
CN106951680A (zh) * | 2017-02-21 | 2017-07-14 | 河海大学 | 一种水文时间序列异常模式检测方法 |
CN107703920A (zh) * | 2017-10-25 | 2018-02-16 | 北京交通大学 | 基于多元时间序列的列车制动系统的故障检测方法 |
WO2018077152A1 (zh) * | 2016-10-24 | 2018-05-03 | 中国银联股份有限公司 | 一种主机变量异常检测方法及系统 |
CN108509979A (zh) * | 2018-02-28 | 2018-09-07 | 努比亚技术有限公司 | 一种异常检测方法、服务器及计算机可读存储介质 |
CN109871401A (zh) * | 2018-12-26 | 2019-06-11 | 北京奇安信科技有限公司 | 一种时间序列异常检测方法及装置 |
CN111669373A (zh) * | 2020-05-25 | 2020-09-15 | 山东理工大学 | 基于时空卷积网络和拓扑感知的网络异常检测方法及系统 |
CN111679949A (zh) * | 2020-04-23 | 2020-09-18 | 平安科技(深圳)有限公司 | 基于设备指标数据的异常检测方法及相关设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4953239B2 (ja) * | 2006-12-11 | 2012-06-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 観測対象の異常を検出する技術 |
CN107194184B (zh) * | 2017-05-31 | 2020-11-17 | 成都数联易康科技有限公司 | 基于时间序列相似性分析的在院人次异常检测方法及系统 |
CN107528722B (zh) * | 2017-07-06 | 2020-10-23 | 创新先进技术有限公司 | 一种时间序列中异常点检测方法及装置 |
CN107493277B (zh) * | 2017-08-10 | 2020-06-16 | 福建师范大学 | 基于最大信息系数的大数据平台在线异常检测方法 |
CN108071941B (zh) * | 2017-12-13 | 2019-06-11 | 清华大学 | 一种基于时序向量相似度分析的爆管识别与定位方法 |
-
2020
- 2020-09-22 CN CN202011006800.6A patent/CN112131274B/zh active Active
- 2020-10-30 WO PCT/CN2020/125004 patent/WO2021189845A1/zh active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103618651A (zh) * | 2013-12-11 | 2014-03-05 | 上海电机学院 | 一种基于信息熵和滑动窗口的网络异常检测方法及系统 |
CN105160181A (zh) * | 2015-09-02 | 2015-12-16 | 华中科技大学 | 一种数控系统指令域序列异常数据检测方法 |
CN106411597A (zh) * | 2016-10-14 | 2017-02-15 | 广东工业大学 | 一种网络流量异常检测方法及系统 |
WO2018077152A1 (zh) * | 2016-10-24 | 2018-05-03 | 中国银联股份有限公司 | 一种主机变量异常检测方法及系统 |
CN106951680A (zh) * | 2017-02-21 | 2017-07-14 | 河海大学 | 一种水文时间序列异常模式检测方法 |
CN107703920A (zh) * | 2017-10-25 | 2018-02-16 | 北京交通大学 | 基于多元时间序列的列车制动系统的故障检测方法 |
CN108509979A (zh) * | 2018-02-28 | 2018-09-07 | 努比亚技术有限公司 | 一种异常检测方法、服务器及计算机可读存储介质 |
CN109871401A (zh) * | 2018-12-26 | 2019-06-11 | 北京奇安信科技有限公司 | 一种时间序列异常检测方法及装置 |
CN111679949A (zh) * | 2020-04-23 | 2020-09-18 | 平安科技(深圳)有限公司 | 基于设备指标数据的异常检测方法及相关设备 |
CN111669373A (zh) * | 2020-05-25 | 2020-09-15 | 山东理工大学 | 基于时空卷积网络和拓扑感知的网络异常检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112131274A (zh) | 2020-12-25 |
WO2021189845A1 (zh) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021204010A1 (zh) | 一种时序异常检测方法、装置、计算机设备及存储介质 | |
CN109902832B (zh) | 机器学习模型的训练方法、异常预测方法及相关装置 | |
CN108520470B (zh) | 用于生成用户属性信息的方法和装置 | |
CN112131274B (zh) | 时间序列异常点的检测方法、装置、设备及可读存储介质 | |
CN113485649B (zh) | 数据存储方法、系统、装置、介质与电子设备 | |
CN111914516B (zh) | 一种网络数据预测序列生成方法、装置、设备及存储介质 | |
CN113743607B (zh) | 异常检测模型的训练方法、异常检测方法及装置 | |
CN114861172B (zh) | 一种基于政务服务系统的数据处理方法及系统 | |
WO2020173136A1 (zh) | 应用系统的监控方法、装置、设备及存储介质 | |
CN111400126A (zh) | 网络服务异常数据检测方法、装置、设备和介质 | |
CN110140326A (zh) | 对设备的性能数据进行采样的方法和装置 | |
CN112183326A (zh) | 人脸年龄识别模型训练方法及相关装置 | |
CN111159481B (zh) | 图数据的边预测方法、装置及终端设备 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN114780338A (zh) | 主机信息处理方法、装置、电子设备和计算机可读介质 | |
CN113205189B (zh) | 训练预测模型的方法、预测方法及装置 | |
CN111967581B (zh) | 分群模型的解释方法、装置、计算机设备和存储介质 | |
CN112685799A (zh) | 设备指纹生成方法、装置、电子设备和计算机可读介质 | |
CN112214402A (zh) | 一种代码验证算法的选择方法、装置及存储介质 | |
CN115860856A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN112989203B (zh) | 素材投放方法、装置、设备和介质 | |
CN112163929B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN112328464B (zh) | 指标数据存储、相关性分析方法及计算机可读存储介质 | |
CN112651467A (zh) | 卷积神经网络的训练方法和系统以及预测方法和系统 | |
CN113260044A (zh) | 基于双层字典学习的csi指纹定位方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40040161 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |