CN113723734A - 时序数据的异常监测方法、装置、电子设备和存储介质 - Google Patents

时序数据的异常监测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113723734A
CN113723734A CN202011606882.8A CN202011606882A CN113723734A CN 113723734 A CN113723734 A CN 113723734A CN 202011606882 A CN202011606882 A CN 202011606882A CN 113723734 A CN113723734 A CN 113723734A
Authority
CN
China
Prior art keywords
monitoring
target
series data
anomaly
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011606882.8A
Other languages
English (en)
Inventor
李婷
张钧波
肖艳清
郑宇�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong City Beijing Digital Technology Co Ltd
Original Assignee
Jingdong City Beijing Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong City Beijing Digital Technology Co Ltd filed Critical Jingdong City Beijing Digital Technology Co Ltd
Priority to CN202011606882.8A priority Critical patent/CN113723734A/zh
Priority to KR1020237022348A priority patent/KR20230110636A/ko
Priority to PCT/CN2021/119159 priority patent/WO2022142494A1/zh
Priority to JP2023540756A priority patent/JP2024502098A/ja
Publication of CN113723734A publication Critical patent/CN113723734A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Abstract

本申请提出一种时序数据的异常监测方法、装置、电子设备和存储介质,其中,所述异常监测方法包括:获取时序数据的多个特征信息;根据多个特征信息生成目标特征组合;以及根据目标特征组合进行异常结果监测。本申请实施例的异常监测方法,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。

Description

时序数据的异常监测方法、装置、电子设备和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种时序数据的异常监测方法、装置、电子设备和存储介质。
背景技术
目前,时序数据的异常监测广泛应用于生产生活中,例如商圈人流量监测能够预防由人流量过多引发的事故、信息系统状态异常监测等。
相关技术中,针对时序数据的异常监测经常基于领域专家给定的规则,例如按照专家经验和日常监测值,规定各项技术指标的正常区间,在正常区间内的数据判定为正常,不在正常区间内的数据判定为异常。然而这种方法灵活性以及准确性欠佳,且成本高代价大,可扩展性低。
相关技术中,还可通过自动机器学习方法进行时序数据的异常监测,然而,该方法需要有标签信息建立起对模型优劣的评估度量,才能进行反馈调整模型和参数等,但是实际情况中标签数据获取困难。
发明内容
本申请第一方面实施例提出一种时序数据的异常监测方法,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
本申请第二方面实施例提出一种时序数据的异常监测装置。
本申请第三方面实施例提出一种电子设备。
本申请第四方面实施例提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种时序数据的异常监测方法,包括:
获取时序数据的多个特征信息;
根据所述多个特征信息生成目标特征组合;以及
根据所述目标特征组合进行异常结果监测。
根据本申请实施例的时序数据的异常监测方法,首先获取时序数据的多个特征信息,并根据多个特征信息生成目标特征组合,然后根据目标特征组合进行异常结果监测。由此,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
另外,根据本申请上述实施例的时序数据的异常监测方法还可以具有如下附加的技术特征:
在本申请的一个实施例中,所述获取时序数据的多个特征信息,包括:
获取所述时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
在本申请的一个实施例中,所述根据所述多个特征信息生成目标特征组合,包括:
根据所述多个特征信息生成多个特征组合;
从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,所述从所述多个特征组合之中选择所述目标特征组合,包括:
计算每个所述特征组合之中所述多个特征之间的相关性系数;
根据所述相关性系数从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,上述时序数据的异常监测方法还包括:
计算每个所述特征组合之中所述多个特征之间的最小方差,其中,根据所述相关性系数和所述最小方差从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,所述根据所述目标特征组合进行异常结果监测,包括:
将所述目标特征组合输入至多个异常监测模型,以生成每个所述异常监测模型识别的异常点和正常点;
根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型;
根据所述目标特征组合和所述目标异常监测模型进行异常结果监测。
在本申请的一个实施例中,所述根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型,包括:
获取所述异常点与所述正常点之间的距离;
根据所述异常点与所述正常点之间的距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
在本申请的一个实施例中,所述异常点为多个,所述方法还包括:
获取所述多个异常点与所述正常点之间的平均距离,其中,根据所述异常点与所述正常点之间的距离和所述平均距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
本申请第二方面实施例提出了一种时序数据的异常监测装置,包括:
获取模块,用于获取时序数据的多个特征信息;
生成模块,用于根据所述多个特征信息生成目标特征组合;以及
监测模块,用于根据所述目标特征组合进行异常结果监测。
本申请实施例的时序数据的异常监测装置,通过获取模块获取时序数据的多个特征信息,并通过生成模块根据多个特征信息生成目标特征组合,以及通过监测模块根据目标特征组合进行异常结果监测。由此,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
另外,根据本申请上述实施例的时序数据的异常监测装置还可以具有如下附加的技术特征:
在本申请的一个实施例中,所述获取模块,具体用于:
获取所述时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
在本申请的一个实施例中,所述生成模块,包括:
第一生成单元,用于根据所述多个特征信息生成多个特征组合;
第一选择单元,用于从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,所述第一选择单元,具体用于:
计算每个所述特征组合之中所述多个特征之间的相关性系数;
根据所述相关性系数从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,所述第一选择单元,还用于:
计算每个所述特征组合之中所述多个特征之间的最小方差,其中,根据所述相关性系数和所述最小方差从所述多个特征组合之中选择所述目标特征组合。
在本申请的一个实施例中,所述监测模块,包括:
第二生成单元,用于将所述目标特征组合输入至多个异常监测模型,以生成每个所述异常监测模型识别的异常点和正常点;
第二选择单元,用于根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型;
监测单元,用于根据所述目标特征组合和所述目标异常监测模型进行异常结果监测。
在本申请的一个实施例中,所述第二选择单元,具体用于:
获取所述异常点与所述正常点之间的距离;
根据所述异常点与所述正常点之间的距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
在本申请的一个实施例中,所述异常点为多个,所述第二选择单元,还用于:
获取所述多个异常点与所述正常点之间的平均距离,其中,根据所述异常点与所述正常点之间的距离和所述平均距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
本申请第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述第一方面实施例所述的时序数据的异常监测方法。
本申请实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述第一方面实施例所述的时序数据的异常监测方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请一个实施例的时序数据的异常监测方法的流程示意图;
图2为根据本申请另一个实施例的时序数据的异常监测方法的流程示意图;
图3为根据本申请一个实施例的时序数据的异常监测装置的方框示意图;以及
图4为根据本申请一个实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参照附图描述本申请实施例的时序数据的异常监测方法、装置、电子设备和存储介质。
本申请实施例提供的时序数据的异常监测方法,可以由电子设备来执行,该电子设备可为PC(Personal Computer,个人计算机)电脑、平板电脑或服务器等,此处不做任何限定。
在本申请实施例中,电子设备中可以设置有处理组件、存储组件和驱动组件。可选的,该驱动组件和处理组件可以集成设置,该存储组件可以存储操作系统、应用程序或其他程序模块,该处理组件通过执行存储组件中存储的应用程序来实现本申请实施例提供的时序数据的异常监测方法。
图1为根据本申请一个实施例的时序数据的异常监测方法的流程示意图。
本申请实施例的时序数据的异常监测方法,还可由本申请实施例提供的时序数据的异常监测装置执行,该装置可配置于电子设备中,以实现获取时序数据的多个特征信息,并根据多个特征信息生成目标特征组合,以及根据目标特征组合进行异常结果监测,从而无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
作为一种可能的情况,本申请实施例的时序数据的异常监测方法还可以在服务器端执行,服务器可以为云服务器,可以在云端执行该时序数据的异常监测方法。
如图1所示,该时序数据的异常监测方法,可包括:
步骤101,获取时序数据的多个特征信息。其中,多个特征信息可包括时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
需要说明的是,该实施例中所描述的时序数据,可为购物平台的销售记录数据,例如,购物平台一端时间(例如,一天、一星期、一个月等)内的销售记录数据,也可为购物平台的页面浏览记录数据,或者商圈的人流量记录数据,此处不做任何限定。其中,购物平台可包括购物网站、购物APP(Application,手机软件)和购物系统等。
步骤102,根据多个特征信息生成目标特征组合。
在本申请实施例中,电子设备可基于特征组合生成模型或预设的算法,根据多个特征信息生成目标特征组合。
需要说明的是,该实施例中所描述的特征组合生成模型可以是提前训练好的,并将其预存在电子设备的存储空间中,以方便调取使用,该存储空间不仅限于基于实体的存储空间,例如,硬盘,上述存储空间还可以是连接电子设备的网络硬盘的存储空间(云存储空间)。该实施例中所描述的预设的算法可根据实际情况进行标定。
步骤103,根据目标特征组合进行异常结果监测。
具体地,电子设备可从购物平台中获取时序数据,并对该时序数据进行解析和计算,以生成时序数据的多个特征信息,然后可根据预设的算法和多个特征信息生成目标特征组合,最后根据目标特征组合进行异常结果监测。
需要说明的是,通常情况下,时序数据中相对近期和周期变化幅度比较大的,则很可能为异常,通过本申请实施例的时序数据的异常监测方法,可以实时监测到时序数据中的相对近期和周期变化幅度。
在本申请实施例中,首先获取时序数据的多个特征信息,并根据多个特征信息生成目标特征组合,然后根据目标特征组合进行异常结果监测。由此,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
为了清楚说明上一实施例,在本申请的一个实施例中,获取时序数据的多个特征信息,可包括获取时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
在本申请实施例中,可通过下述公式(1)、(2)、(3)和(4)分别计算时序数据的临近偏差值、周期偏差值、趋势偏差值和残差值:
L=Xt-Xt-1 (1)
Figure BDA0002873814190000061
Figure BDA0002873814190000062
Figure BDA0002873814190000063
其中,L可为临近偏差值,Z可为周期偏差值,Q可为趋势偏差值,C可为残差值,Xt可为当前时刻的时序数据(即,时序值,例如,当前时刻购物平台的销售量),Xt-1可为上一时刻的时序数据,period可为周期偏差间隔(例如,星期),trend可为趋势偏差间隔(例如,1个月、2个月、15天等),
Figure BDA0002873814190000064
可为时序数据的历史均值,σ可为时序数据的方差。
具体地,电子设备在获取到时序数据之后,可根据上述公式(1)、(2)、(3)和(4)分别计算时序数据的临近偏差值、周期偏差值、趋势偏差值和残差值,然后可分别根据时序数据的临近偏差值、周期偏差值、趋势偏差值、残差值,以及预设的特征生成算法,生成时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征。其中,预设的特征生成算法可根据实际情况进行标定。
需要说明的是,该实施例中所描述的残差值越大,则可说明当前时刻偏离均值的程度越大,即越有可能是异常,其中,经典的基于统计的时序数据的异常监测方法认为偏离均值大于3倍方差即为异常,也就是说,残差值是判断时序异常很重要的特征。
另外,异常也可有不同的类型,比如过大异常、过小异常等,其中,对于过大异常则临近偏差值的计算方式可为:max(Xt-Xt-1,0),其它偏差类指标(例如,周期偏差值、趋势偏差值和残差值)计算同理,同样对于过小异常则临近偏差值的计算方式可为:min(Xt-Xt-1,0)。
进一步地,在本申请的一个实施例中,根据多个特征信息生成目标特征组合,可包括根据多个特征生信息成多个特征组合,并从多个特征组合之中选择目标特征组合。
具体地,电子设备在获取到时序数据的多个特征信息后,可将多个特征信息中的时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征进行特征的组合和降维,并最后根据特征评估的效果进行重组,以得到多个特征组合。然后电子设备可根据特征评估的效果,从多个特征组合之中选择最优(即,评估效果最好的)特征组合作为目标特征组合。
需要说明的是,该实施例中所描述的降维相当于是对特征进行相关特征合并以及去噪处理。
为了清楚说明上一实施例,在本申请的一个实施例中,从多个特征组合之中选择目标特征组合,可包括:计算每个特征组合之中多个特征之间的相关性系数,并根据相关性系数从多个特征组合之中选择目标特征组合。
需要说明的是,特征之间的相关性系数越大则可表明特征越单一,特征质量越不好,相关性通常可用皮尔逊相关系数度量,其中,皮尔逊相关系数可相当于cosine相似度。
在本申请实施例中,可通过下述公式(5)计算每个特征组合之中多个特征之间的相关性系数:
Figure BDA0002873814190000071
其中,
Figure BDA0002873814190000072
可为相关性系数,n可为时序数据中的总时间,i可为当前的时间,x1和x2可分别为两个特征(即,上述特征组合之中的两个特征),
Figure BDA0002873814190000073
Figure BDA0002873814190000074
可分别为两个特征的均值,即相当于对x1和x2进行均值化处理后的数据。
具体地,电子设备在根据多个特征信息生成多个特征组合之后,可通过上述公式(5)分别计算每个特征组合之中多个特征之间的相关性系数,并可将每个特征组合之中多个特征之间的相关性系数进行比较,以确定最小的多个特征之间的相关性系数,以及将该相关性系数对应的特征组合目标特征组合,即从每个特征组合之中选择相关性系数最小的特征组合作为目标特征组合。
进一步地,在本申请的一个实施例中,该时序数据的异常监测方法还可包括计算每个特征组合之中多个特征之间的最小方差,其中,根据相关性系数和最小方差从多个特征组合之中选择目标特征组合。
在在本申请实施例中,可通过下述公式(6)计算每个特征组合之中多个特征之间的最小方差:
Figure BDA0002873814190000081
其中,G可为多个特征之间的最小方差,x1和x2可分别为两个特征(即,上述特征组合之中的两个特征),
Figure BDA0002873814190000082
Figure BDA0002873814190000083
可分别为两个特征的均值,n可为时序数据中的总时间,i可为当前的时间。
具体地,电子设备计算出每个特征组合之中多个特征之间的相关性系数之后,还可根据上述公式(6)分别计算每个特征组合之中多个特征之间的最小方差,并可将每个特征组合之中多个特征之间的最小方差进行相互比较,以生成第一比较结果。然后电子设备还可通过上述公式(5)分别计算每个特征组合之中多个特征之间的相关性系数,并可将每个特征组合之中多个特征之间的相关性系数进行比较,以生成第二比较结果。最后,电子设备可根据第一比较结果和第二比较结果从多个特征组合之中选择目标特征组合。例如,选择最小的多个特征之间的相关性系数和最小方差,对应的特征组合作为目标特征组合。由此,可以使选择的目标特征组合更加适合当前的时序数据。
在本申请的一个实施例中,如图2所示,根据目标特征组合进行异常结果监测,可包括:
步骤201,将目标特征组合输入至多个异常监测模型,以生成每个异常监测模型识别的异常点和正常点。其中,异常点和正常点均可为多个,且多个异常监测模型可包括:KNN(k-NearestNeighbor,最邻近分类算法)模型、one-class SVM(One-Class Support VectorMachine,单类支持向量机)模型、Isolation Forest(孤立森林)模型等。
需要说明的是,该实施例中所描述的多个异常监测模型可以是提前训练好的,并将其预存在电子设备的存储空间中,以方便调取使用。
进一步地,上述多个异常监测模型的训练与生成可由相关的服务器进行,该服务器可以是云端服务器,也可以是一台电脑的主机,该服务器与可执行申请实施例提供的时序数据的异常监测方法的电子设备之间,建立有通信连接,该通信连接可以是无线网络连接和有线网络连接的至少一种。服务器可将训练完成的多个异常监测模型发送给电子设备,以便无电子设备在需要时调用,从而大大减少电子设备的计算压力。
具体地,电子设备在得到目标特征组合之后,可将目标特征组合分别输入至多个异常监测模型中,从而通过多个异常监测模型分别对该目标特征组合进行处理,以使每个异常监测模型输出异常点和正常点,即每个异常监测模型识别的异常点和正常点。
步骤202,根据每个异常监测模型输出的异常点和正常点从多个异常监测模型选择适于时序的目标异常监测模型。
在本申请的一个实施例中,根据每个异常监测模型输出的异常点和正常点从多个异常监测模型选择适于时序的目标异常监测模型,可包括获取异常点与正常点之间的距离,并根据异常点与正常点之间的距离从多个异常监测模型选择适于时序的目标异常监测模型。应说明的是,该实施例中所描述的距离可为异常点与正常点之间的最近距离。
在本申请实施例中,可通过下述公式(7),计算异常点与正常点之间的距离:
Figure BDA0002873814190000091
其中,V可为异常点与正常点之间的距离,
Figure BDA0002873814190000093
可为异常监测模型输出的所有异常点的集合,
Figure BDA0002873814190000094
可为异常监测模型输出的所有正常点的集合,xi可为异常点,xj可为正常点。
需要说明的是,本申请可通过每个异常监测模型输出的异常点和正常点之间的最近距离,对每个异常监测模型的表现进行度量,其中,该最近距离,可指的是异常点和正常点之间距离的最小值,通常情况下最小距离越远,表明异常的区分效果越明显,即模型的表现效果越好。
步骤203,根据目标特征组合和目标异常监测模型进行异常结果监测。
具体地,电子设备在获取到每个异常监测模型识别的异常点和正常点之后,可通过上述公式(7)分别计算出每个异常监测模型输出的异常点与正常点之间的最近距离,并可将每个异常监测模型输出的异常点与正常点之间的最近距离进行相互比较,以确定最远的异常点与正常点之间的最近距离,以及将该最近距离对应的异常监测模型作为目标异常监测模型。然后,电子设备根据该根据目标特征组合和目标异常监测模型进行异常结果监测。
为了提高选择适于时序的目标异常监测模型的准确度,在本申请的一个实施例中,异常点可为多个,该时序数据的异常监测方法还可包括获取多个异常点与正常点之间的平均距离,其中,根据异常点与正常点之间的距离和平均距离从多个异常监测模型选择适于时序的目标异常监测模型。应说明的是,该实施例中所描述的平均距离可为多个异常点与正常点之间的平均最近距离。
在本申请实施例中,可通过下述公式(8)计算多个异常点与正常点之间的平均距离:
Figure BDA0002873814190000092
其中,W可为多个异常点与正常点之间的平均距离,
Figure BDA0002873814190000095
可为异常监测模型输出的所有异常点的集合,
Figure BDA0002873814190000096
可为异常监测模型输出的所有正常点的集合,
Figure BDA0002873814190000097
可为异常点的个数,xi可为异常点,xj可为正常点。
需要说明的是,本申请还可通过每个异常监测模型输出的多个异常点和正常点之间的平均最近距离,对每个异常监测模型的表现进行度量,其中,该平均最近距离,可指的是多个异常点到正常点之间最近距离的平均,通常情况下平均最近距离越远,表明模型的表现性能越好。
具体地,电子设备在获取到每个异常监测模型识别的异常点和正常点之后,还可通过上述公式(8)分别计算出每个异常监测模型输出的多个异常点与正常点之间的最近距离的平均值,并可将每个异常监测模型输出的异常点与正常点之间的最近距离的平均进行相互比较,以生成第三比较结果。然后电子设备还可通过上述公式(7)分别计算出每个异常监测模型输出的异常点与正常点之间的最近距离,并可将每个异常监测模型输出的异常点与正常点之间的最近距离进行相互比较,以生成第四比较结果。最后,电子设备可根据第三比较结果和第四比较结果,从多个异常监测模型选择适于时序的目标异常监测模型。例如,选择最远的异常点与正常点之间的最近距离和最近距离的平均值,对应的异常监测模型作为目标异常监测模型。由此,可以使选择的目标异常监测模型更加适合当前的时序数据。
综上,根据本申请实施例的时序数据的异常监测方法,首先获取时序数据的多个特征信息,并根据多个特征信息生成目标特征组合,然后根据目标特征组合进行异常结果监测。由此,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
图3为根据本申请一个实施例的时序数据的异常监测装置的方框示意图;
本申请实施例的时序数据的异常监测装置,可配置于电子设备中,以实现获取时序数据的多个特征信息,并根据多个特征信息生成目标特征组合,以及根据目标特征组合进行异常结果监测,从而无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
如图3所示,该时序数据的异常监测装置300,可包括:获取模块310、生成模块320和监测模块330。
其中,获取模块310用于获取时序数据的多个特征信息。
生成模块320用于根据多个特征信息生成目标特征组合。
监测模块330用于根据目标特征组合进行异常结果监测。
在本申请的一个实施例中,获取模块310具体可用于获取时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
在本申请的一个实施例中,如图3所示,生成模块320可包括:第一生成单元321和第一选择单元322。
其中,第一生成单元321用于根据多个特征信息生成多个特征组合。
第一选择单元322用于从多个特征组合之中选择目标特征组合。
在本申请的一个实施例中,第一选择单元322具体可用于计算每个特征组合之中多个特征之间的相关性系数,并根据相关性系数从多个特征组合之中选择目标特征组合。
在本申请的一个实施例中,第一选择单元322还可用于计算每个特征组合之中多个特征之间的最小方差,其中,根据相关性系数和最小方差从多个特征组合之中选择目标特征组合。
在本申请的一个实施例中,如图3所示,监测模块330可包括:第二生成单元331、第二选择单元332和监测单元333。
其中,第二生成单元331用于将目标特征组合输入至多个异常监测模型,以生成每个异常监测模型识别的异常点和正常点。
第二选择单元332用于根据每个异常监测模型输出的异常点和正常点从多个异常监测模型选择适于时序的目标异常监测模型。
监测单元333用于根据目标特征组合和目标异常监测模型进行异常结果监测。
在本申请的一个实施例中,第二选择单元332具体可用于获取异常点与正常点之间的距离,并根据异常点与正常点之间的距离从多个异常监测模型选择适于时序的目标异常监测模型。
在本申请的一个实施例中,异常点可为多个,第二选择单元332还可用于获取多个异常点与正常点之间的平均距离,其中,根据异常点与正常点之间的距离和平均距离从多个异常监测模型选择适于时序的目标异常监测模型。
需要说明的是,本发明实施例的时序数据的异常监测装置中未披露的细节,请参照本发明实施例的时序数据的异常监测方法中所披露的细节,具体这里不再赘述。
综上,本申请实施例的时序数据的异常监测装置,通过获取模块获取时序数据的多个特征信息,并通过生成模块根据多个特征信息生成目标特征组合,以及通过监测模块根据目标特征组合进行异常结果监测。由此,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
为了实现上述实施例,如图4所示,本发明还提出一种电子设备400,包括存储器410、处理器420及存储在存储器410上并可在处理器420上运行的计算机程序,处理器420执行程序,以实现本申请前述实施例提出的时序数据的异常监测方法。
本申请实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现本申请前述实施例提出的时序数据的异常监测方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,利用目标特征组合进行异常结果监测,无需设置固定阈值以及获取标签数据,成本低,可扩展性高。
在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (18)

1.一种时序数据的异常监测方法,其特征在于,包括:
获取时序数据的多个特征信息;
根据所述多个特征信息生成目标特征组合;以及
根据所述目标特征组合进行异常结果监测。
2.如权利要求1所述的时序数据的异常监测方法,其特征在于,所述获取时序数据的多个特征信息,包括:
获取所述时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
3.如权利要求1所述的时序数据的异常监测方法,其特征在于,所述根据所述多个特征信息生成目标特征组合,包括:
根据所述多个特征信息生成多个特征组合;
从所述多个特征组合之中选择所述目标特征组合。
4.如权利要求3所述的时序数据的异常监测方法,其特征在于,所述从所述多个特征组合之中选择所述目标特征组合,包括:
计算每个所述特征组合之中所述多个特征之间的相关性系数;
根据所述相关性系数从所述多个特征组合之中选择所述目标特征组合。
5.如权利要求4所述的时序数据的异常监测方法,其特征在于,还包括:
计算每个所述特征组合之中所述多个特征之间的最小方差,其中,根据所述相关性系数和所述最小方差从所述多个特征组合之中选择所述目标特征组合。
6.如权利要求1所述的时序数据的异常监测方法,其特征在于,所述根据所述目标特征组合进行异常结果监测,包括:
将所述目标特征组合输入至多个异常监测模型,以生成每个所述异常监测模型识别的异常点和正常点;
根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型;
根据所述目标特征组合和所述目标异常监测模型进行异常结果监测。
7.如权利要求6所述的时序数据的异常监测方法,其特征在于,所述根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型,包括:
获取所述异常点与所述正常点之间的距离;
根据所述异常点与所述正常点之间的距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
8.如权利要求7所述的时序数据的异常监测方法,其特征在于,所述异常点为多个,所述方法还包括:
获取所述多个异常点与所述正常点之间的平均距离,其中,根据所述异常点与所述正常点之间的距离和所述平均距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
9.一种时序数据的异常监测装置,其特征在于,包括:
获取模块,用于获取时序数据的多个特征信息;
生成模块,用于根据所述多个特征信息生成目标特征组合;以及
监测模块,用于根据所述目标特征组合进行异常结果监测。
10.如权利要求9所述的时序数据的异常监测装置,其特征在于,所述获取模块,具体用于:
获取所述时序数据的临近偏差特征、周期偏差特征、趋势偏差特征和残差特征之中的多个特征。
11.如权利要求9所述的时序数据的异常监测装置,其特征在于,所述生成模块,包括:
第一生成单元,用于根据所述多个特征信息生成多个特征组合;
第一选择单元,用于从所述多个特征组合之中选择所述目标特征组合。
12.如权利要求11所述的时序数据的异常监测装置,其特征在于,所述第一选择单元,具体用于:
计算每个所述特征组合之中所述多个特征之间的相关性系数;
根据所述相关性系数从所述多个特征组合之中选择所述目标特征组合。
13.如权利要求12所述的时序数据的异常监测装置,其特征在于,所述第一选择单元,还用于:
计算每个所述特征组合之中所述多个特征之间的最小方差,其中,根据所述相关性系数和所述最小方差从所述多个特征组合之中选择所述目标特征组合。
14.如权利要求9所述的时序数据的异常监测装置,其特征在于,所述监测模块,包括:
第二生成单元,用于将所述目标特征组合输入至多个异常监测模型,以生成每个所述异常监测模型识别的异常点和正常点;
第二选择单元,用于根据每个所述异常监测模型输出的所述异常点和所述正常点从所述多个异常监测模型选择适于所述时序的目标异常监测模型;
监测单元,用于根据所述目标特征组合和所述目标异常监测模型进行异常结果监测。
15.如权利要求14所述的时序数据的异常监测装置,其特征在于,所述第二选择单元,具体用于:
获取所述异常点与所述正常点之间的距离;
根据所述异常点与所述正常点之间的距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
16.如权利要求15所述的时序数据的异常监测装置,其特征在于,所述异常点为多个,所述第二选择单元,还用于:
获取所述多个异常点与所述正常点之间的平均距离,其中,根据所述异常点与所述正常点之间的距离和所述平均距离从所述多个异常监测模型选择适于所述时序的目标异常监测模型。
17.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-8中任一项所述的时序数据的异常监测方法。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一项所述的时序数据的异常监测方法。
CN202011606882.8A 2020-12-30 2020-12-30 时序数据的异常监测方法、装置、电子设备和存储介质 Pending CN113723734A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202011606882.8A CN113723734A (zh) 2020-12-30 2020-12-30 时序数据的异常监测方法、装置、电子设备和存储介质
KR1020237022348A KR20230110636A (ko) 2020-12-30 2021-09-17 타이밍 데이터의 이상 모니터링 방법, 장치, 전자 기기및 저장 매체
PCT/CN2021/119159 WO2022142494A1 (zh) 2020-12-30 2021-09-17 时序数据的异常监测方法、装置、电子设备和存储介质
JP2023540756A JP2024502098A (ja) 2020-12-30 2021-09-17 時系列データの異常監視方法、装置、電子機器及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011606882.8A CN113723734A (zh) 2020-12-30 2020-12-30 时序数据的异常监测方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113723734A true CN113723734A (zh) 2021-11-30

Family

ID=78672445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011606882.8A Pending CN113723734A (zh) 2020-12-30 2020-12-30 时序数据的异常监测方法、装置、电子设备和存储介质

Country Status (4)

Country Link
JP (1) JP2024502098A (zh)
KR (1) KR20230110636A (zh)
CN (1) CN113723734A (zh)
WO (1) WO2022142494A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114595124A (zh) * 2022-05-09 2022-06-07 北京瑞莱智慧科技有限公司 时序异常检测模型评估方法、相关装置及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115994248B (zh) * 2023-03-24 2023-06-20 青岛精锐机械制造有限公司 阀门故障的数据检测方法及系统
CN116090916B (zh) * 2023-04-10 2023-06-16 淄博海草软件服务有限公司 一种企业内部采购资金核算预警系统
CN116304962B (zh) * 2023-05-25 2023-08-04 湖南东润智能仪表有限公司 一种用于水表计量数据的智能异常监测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9699205B2 (en) * 2015-08-31 2017-07-04 Splunk Inc. Network security system
CN108965055B (zh) * 2018-07-17 2021-07-13 成都信息工程大学 一种基于历史时间取点法的网络流量异常检测方法
CN111767930A (zh) * 2019-04-01 2020-10-13 北京百度网讯科技有限公司 物联网时序数据异常检测方法及其相关设备
CN110598851A (zh) * 2019-08-29 2019-12-20 北京航空航天大学合肥创新研究院 一种融合lstm和gan的时间序列数据异常检测方法
CN111104736B (zh) * 2019-12-13 2021-07-13 北京瑞莱智慧科技有限公司 基于时间序列的异常数据检测方法、装置、介质和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114595124A (zh) * 2022-05-09 2022-06-07 北京瑞莱智慧科技有限公司 时序异常检测模型评估方法、相关装置及存储介质
CN114595124B (zh) * 2022-05-09 2022-07-15 北京瑞莱智慧科技有限公司 时序异常检测模型评估方法、相关装置及存储介质

Also Published As

Publication number Publication date
WO2022142494A1 (zh) 2022-07-07
KR20230110636A (ko) 2023-07-24
JP2024502098A (ja) 2024-01-17

Similar Documents

Publication Publication Date Title
CN113723734A (zh) 时序数据的异常监测方法、装置、电子设备和存储介质
US11527984B2 (en) Abnormality determination system, motor control apparatus, and abnormality determination apparatus
US10929220B2 (en) Time series retrieval for analyzing and correcting system status
US11763198B2 (en) Sensor contribution ranking
US20150112891A1 (en) Information processor, information processing method, and program
JP2020008997A (ja) 異常検知システム
US11494638B2 (en) Learning support device and learning support method
JP6615889B2 (ja) 物理システムの品質を管理する方法、品質管理エンジン及びコンピュータで読み取り可能な記録媒体
JP7180985B2 (ja) 診断装置および診断方法
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
WO2016084326A1 (ja) 情報処理システム、情報処理方法、及び、記録媒体
WO2020136859A1 (ja) 推定装置、推定方法、及びコンピュータ読み取り可能な記録媒体
JP2020098373A (ja) 異常検出装置、異常検出プログラム、及び、異常検出方法
US20190205341A1 (en) Systems and methods for measuring collected content significance
CN108073464A (zh) 一种基于速度和加速度的时序数据异常点检测方法及装置
JP6691079B2 (ja) 検知装置、検知方法および検知プログラム
JP2020086778A (ja) 機械学習モデル構築装置および機械学習モデル構築方法
Araujo et al. Hybrid intelligent design of morphological-rank-linear perceptrons for software development cost estimation
JP2016532221A (ja) モデル適合のための装置および方法
WO2021134564A1 (en) Method and device for processing sensor data
Loyola A method for real-time error detection in low-cost environmental sensors data
US20220237348A1 (en) Information processing apparatus and information processing method
JPWO2020148838A1 (ja) 推定装置、推定方法、及びプログラム
JP7135025B2 (ja) 情報処理装置、情報処理方法およびプログラム
US20240045923A1 (en) Information processing device, information processing method, and computer program product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination