CN111538897A - 推荐的异常检测方法、装置、电子设备及可读存储介质 - Google Patents
推荐的异常检测方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN111538897A CN111538897A CN202010183405.9A CN202010183405A CN111538897A CN 111538897 A CN111538897 A CN 111538897A CN 202010183405 A CN202010183405 A CN 202010183405A CN 111538897 A CN111538897 A CN 111538897A
- Authority
- CN
- China
- Prior art keywords
- time window
- parameter
- result
- target time
- time period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Debugging And Monitoring (AREA)
Abstract
本公开提供了一种推荐的异常检测方法、装置、电子设备及可读存储介质,所述方法包括:根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数的波动程度,生成第一异常检测结果;根据目标时间窗口在当前时间周期内的真实推荐结果参数、目标时间窗口在历史时间周期内的真实推荐结果参数的波动程度生成第二异常检测结果;根据目标时间窗口在当前时间周期内的真实推荐结果参数、目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数的波动程度,生成第三异常检测结果;根据第一异常检测结果、第二异常检测结果以及第三异常检测结果确定是否存在推荐异常。本公开可以提高异常检测的准确度。
Description
技术领域
本公开涉及网络推荐技术领域,尤其涉及一种推荐的异常检测方法、装置、电子设备及可读存储介质。
背景技术
在网络推荐技术领域中,通常按照一定的推荐算法向用户推荐对象,用户可以对该对象进行访问。为了保证推荐带来的效果较好,需要确定推荐是否异常。
现有技术中,检测推荐异常的方法主要包括两种:第一种,通过推荐的结果参数和预先设定的阈值确定是否异常;第二种,统计当前时间窗口的结果参数,并与历史上同一时间窗口的结果参数进行比较,以确定是否异常。
发明人对上述方案进行研究之后发现,第一种方案中恒定的阈值导致召回异常检测的准确度较低,第二种方案中,在促销活动、节日等特殊情况下流量会发生变化,会导致异常检测的准确度较低。
发明内容
本公开提供一种推荐的异常检测方法、装置、电子设备及可读存储介质,可以采用目标时间窗的预测推荐结果参数和真实推荐结果参数的波动程度、目标时间窗口在不同时间周期内的波动程度和目标时间窗口和之前时间窗口在当前时间周期内的波动程度,确定是否存在推荐异常,由于结合了三种不同维度的波动特征,从而有助于提高异常检测的准确度。
根据本公开的第一方面,提供了一种推荐的异常检测方法,所述方法包括:
根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;
根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;
根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;
根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
根据本公开的第二方面,提供了一种推荐的异常检测装置,所述装置包括:
第一异常检测结果生成模块,用于根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;
第二异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;
第三异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;
推荐异常确定模块,用于根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
根据本公开的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述推荐的异常检测方法。
根据本公开的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述推荐的异常检测方法。
本公开提供了一种推荐的异常检测方法、装置、电子设备及可读存储介质,可以首先根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;然后根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;再然后根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;最后根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。本公开可以采用目标时间窗的预测推荐结果参数和真实推荐结果参数的波动程度、目标时间窗口在不同时间周期内的波动程度和目标时间窗口和之前时间窗口在当前时间周期内的波动程度,确定是否存在推荐异常,由于结合了三种不同维度的波动特征,从而有助于提高异常检测的准确度。
附图说明
为了更清楚地说明本公开的技术方案,下面将对本公开的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开的推荐的异常检测方法的步骤流程图;
图2示出了本公开的确定第一异常检测结果的步骤流程图;
图3示出了本公开的确定预测推荐结果参数的步骤流程图;
图4示出了本公开的确定第二异常检测结果的步骤流程图;
图5示出了本公开的确定第三异常检测结果的步骤流程图;
图6示出了本公开的确定推荐异常的步骤流程图;
图7示出了本公开的三种推荐算法的准确率示意图;
图8示出了本公开的推荐的异常检测装置的结构图;
图9示出了本公开的第一异常检测结果生成模块的结构框图;
图10示出了本公开的确定预测推荐结果参数的模块框图;
图11示出了本公开的第二异常检测结果生成模块的结构框图;
图12示出了本公开的第三异常检测结果生成模块的结构框图;
图13示出了本公开的推荐异常确定模块的结构框图;
图14示出了本公开的电子设备的结构图。
具体实施方式
下面将结合本公开中的附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开的实施例可以应用于提供推荐服务的后台服务器,用于检测向用户进行推荐之后是否存在推荐异常。其中一种典型的推荐方式是通过广告的方式向用户推荐对象,从而推荐异常为广告异常,而广告异常的情况下会影响广告收益,导致广告收益异常。
参照图1,其示出了本公开的推荐的异常检测方法的步骤流程图,具体如下:
步骤101,根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数。
其中,目标时间窗口是检测异常的时间窗口,若考虑到实时性,则目标时间窗口可以是当前时间窗口;若不考虑实时性,则目标时间窗口可以是任意一个时间窗口。时间窗口是统计推荐结果参数的时间片,例如,若每分钟统计一次推荐结果参数,则时间窗口可以是长度为一分钟的时间片。
上述时间窗口的推荐结果参数通常存在周期性的特征,在不同的时间周期内均存在该时间窗口,且该时间窗口在不同时间周期内的推荐结果参数比较接近,波动较小。例如,若时间窗口的长度是一分钟,则时间周期可以为天、周或月等,当时间周期为天时,12:00至12:01的时间窗口在12月01日、12月02日、12月03日等的推荐结果参数通常取值比较接近。
基于上述时间周期的说明可知,当前时间周期是当前时间所在的时间周期,例如,为当天、当周、当月等。
在本公开的实施例中,需要预先根据历史的真实推荐结果参数确定目标时间窗口在当前时间周期内的预测推荐结果参数。其中,历史的真实推荐结果参数包括:目标时间窗口之前的至少一个时间窗口在当前时间周期的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数。例如,若当前时间周期为2020年03月10日,目标时间窗口为18:00,则可以采用时间窗口17:00、17:01、…、17:59在当前时间周期2020年03月10日内的真实推荐结果参数,预测目标时间窗口18:00在当前时间周期2020年03月10日内的预测推荐结果参数;还可以采用时间窗口00:00、00:01、…、23:59中的任意窗口在历史时间周期2020年03月9日或2020年03月9日等的真实推荐结果参数,预测目标时间窗口18:00在当前时间周期2020年03月10日内的预测推荐结果参数。
上述推荐结果参数是推荐效果或推荐质量的数值表示,在不同场景下可以采用不同的推荐结果参数,本公开的实施例对推荐结果参数的具体形式不加以限制。例如,当推荐是广告方式时,推荐结果参数可以是广告收入;当推荐是普通方式时,推荐结果参数可以是访问率、下单率等。
本公开的实施例可以采用函数模型或深度学习模型等预测推荐结果参数,函数和深度学习模型的参数需要通过训练得到。其中,函数模型可以为线性或非线性的函数,深度学习模型可以为具有记忆能力的记忆网络,例如,RNN(Recurrent Neural Network,循环神经网络)模型。无论是函数模型还是深度学习模型,其均可以通过历史的真实推荐结果参数进行训练得到,将其中一个历史的真实推荐结果参数作为标签,以使模型得到对应的预测推荐结果参数与真实推荐结果参数无限逼近。例如,若每分钟统计一次推荐结果参数,则可以将12月01日00:00至12月14日23:59之间1440*14个推荐结果参数,按照时间顺序输入至模型中得到12月15日00:00的预测推荐结果参数,将12月15日00:00的真实推荐结果参数作为标签。从而根据大量的预测推荐结果参数和真实推荐结果参数确定损失值,若损失值在连续多轮迭代中继续减小,则可以根据损失值对模型参数的一阶导数调整模型参数,以进行下一轮迭代,直至损失值在连续多轮迭代中不再继续减小,则可以结束训练。
在正常情况下,同一时间窗口的真实推荐结果参数和预测推荐结果参数是比较接近的,若真实推荐结果参数和预测推荐结果参数相差较大,则确定第一异常检测结果为推荐异常;若真实推荐结果参数和预测推荐结果参数相差较小,则确定第一异常检测结果为推荐正常。从中可知,第一异常检测结果为真实推荐结果参数和预测推荐结果参数之间差距的异常结果。
在本公开的实施例中,采用波动程度描述真实推荐结果参数和预测推荐结果参数之间的差距,从而可以将真实推荐结果参数和预测推荐结果参数的差值,或差值与真实推荐结果参数的比值作为两者之间的波动程度;还可以将差值与预测推荐结果参数的比值作为两者之间的波动程度。波动程度是两者差距的一种表示,本公开的实施例对其具体计算方法不加以限制。
基于上述波动程度,可以设置一个波动程度阈值,从而若波动程度大于该波动程度阈值,则确定第一异常检测结果为推荐异常;否则,确定第一异常检测结果为推荐正常。
步骤102,根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果。
在实际应用中,同一时间窗口的推荐结果参数通常存在周期性的特征,在不同的时间周期内均存在该时间窗口,且该时间窗口在不同时间周期的推荐结果参数比较接近,波动较小。例如,若时间窗口的长度是一分钟,则时间周期可以为天、周或月等,当时间周期为天时,12:00至12:01的时间窗口在12月01日、12月02日、12月03日等的推荐结果参数通常取值比较接近。
基于上述规律,可以确定目标时间窗口在当前时间周期内的真实推荐结果参数,是否超出目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,若超出,则确定第二异常检测结果为推荐异常;若未超出,则确定第二异常检测结果为推荐正常。从中可知,第二异常检测结果为不同时间周期之间的波动异常结果。
上述过程中的波动程度可以是目标时间窗口在多个历史时间周期内的最大真实推荐结果参数和最小真实推荐结果参数构成的取值区间,从而若目标时间窗口在当前时间周期内的真实推荐结果参数在该取值区间内,则确定第二异常检测结果为推荐正常;否则确定第二异常检测结果为推荐异常。
步骤103,根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前。
其中,参考时间窗口是目标时间窗口之前的时间窗口。例如,若目标时间窗口为13:01的时间窗口,则参考时间窗口可以为13:00的时间窗口。
在正常情况下,在一个连续的时间段内,推荐结果参数通常在一个稳定的范围内波动,从而可以判断目标时间窗口在当前时间周期内的真实推荐结果参数是否超出了该稳定的范围。具体地,可以获取目标时间窗口之前的最近一段时间内多个参考时间窗口的真实推荐结果参数,并根据这些参考时间窗口的真实推荐结果参数确定一个波动的范围,从而若目标时间窗口的真实推荐结果参数超出了该波动的范围,则确定第三异常检测结果为推荐异常;否则确定第三异常检测结果为推荐正常。从中可知,第三异常检测结果为一个时间段内的异常结果。
在上述过程中的波动的范围可以用最大的真实推荐结果参数和最小的真实推荐结果参数表示。
可以理解,若第三异常检测结果为推荐异常,则代表目标时间窗口相对于目标时间窗口之前的时间段,真实推荐结果参数不稳定;若第三异常检测结果为推荐正常,则代表目标时间窗口相对于目标时间窗口之前的时间段,真实推荐结果参数稳定。
可以理解,步骤101、步骤102和步骤103的执行顺序可以任意调换,例如除如图1所示的顺序之外,还可以以步骤101、步骤103和步骤102的顺序执行,或,以步骤102、步骤101和步骤103的顺序执行,或,以步骤102、步骤103和步骤101的顺序执行,或,以步骤103、步骤101和步骤102的顺序执行,或,以步骤103、步骤102和步骤101的顺序执行。
步骤104,根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
在一种确定推荐异常的实施例中,若第一异常检测结果、第二异常检测结果、第三异常检测结果中至少两个均为推荐异常,则可以确定存在推荐异常;否则,确定推荐正常。可以理解,根据多个异常检测结果确定是否存在推荐异常的方法可以根据实际应用场景设定,本公开的实施例对其不加以限制。
在另一种确定推荐异常的实施例中,可以为第一异常检测结果、第二异常检测结果、第三异常检测结果设置优先级,然后基于优先级确定是否存在推荐异常。例如,若优先级最高的两个异常检测结果为推荐异常,则确定存在推荐异常;否则确定推荐正常。
可选地,在本公开的另一种实施例中,参照图2所示的确定第一异常检测结果的步骤流程图,所述步骤101包括子步骤1011至1014:
子步骤1011,根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数和所述预测推荐结果参数,确定所述目标时间窗口的波动参数,所述波动参数代表所述真实推荐结果参数和所述预测推荐结果参数之间的波动程度。
其中,波动参数可以是真实推荐结果参数和预测推荐结果参数之间的差值,或差值与真实推荐结果参数的比值,或差值与预测推荐结果参数的比值。
子步骤1012,确定所述目标时间窗口在至少一个历史时间周期内的真实推荐结果参数,确定所述目标时间窗口的最大波动参数。
其中,最大波动参数表示了目标时间窗口在至少一个历史时间周期内真实推荐结果参数的波动程度,可以是目标时间窗口在至少一个历史时间周期内的最大的真实推荐结果参数和最小的真实推荐结果参数的差值,或差值与最大的真实推荐结果参数的比值,具体如下公式:
MaxAmptw=MAX(RRPtw,d1,...,RRPtw,d2)-MIN(RRPtw,d1,...,RRPtw,d2) (1)
或,
其中,MaxAmptw为目标时间窗口tw的最大波动参数,MAX是求最大值的函数名,MIN是求最小值的函数名,RRPtw,d1是目标时间窗口tw在历史时间周期d1内的真实推荐结果参数,RRPtw,d2是目标时间窗口tw在历史时间周期d2内的真实推荐结果参数,RRPtw,d1,...,RRPtw,d2包含目标时间窗口tw在时间周期d1至d2内的多个真实推荐结果参数,其中时间周期d1是第一个时间周期,d2是最后一个时间周期,中间可能存在多个时间周期。
可以理解,相对于公式(1)中的最大波动参数,公式(2)的最大波动参数其准确度更高,不会受到真实推荐结果参数整体偏高或偏低的影响。
需要说明的是,若子步骤1011中计算的波动参数用的差值,则子步骤1012计算的最大波动参数通过公式(1)确定;若子步骤1011中计算的波动参数用的比值,则子步骤1012计算的最大波动参数通过公式(2)确定。
在实际应用中,为了避免出现最大波动参数的毛刺现象,可以将目标时间窗口tw前后的多个时间窗口的最大波动参数的最大值作为目标时间窗口tw的最大波动参数,如下公式:
MaxAmptw=MAX(MaxAmptw1,...,MaxAmptw2) (3)
其中,MaxAmptw1是将tw1作为公式(1)或(2)中的输入变量tw,而计算的时间窗口tw1的最大波动参数,MaxAmptw2是将tw2作为公式(1)或(2)中的输入变量tw而计算的时间窗口tw2的最大波动参数,tw1至tw2之间包含时间窗口tw,例如,tw可以为tw1或tw2,也可以在tw1至tw2之间。
子步骤1013,若所述目标时间窗口的所述波动参数大于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐异常。
可以理解,若目标时间窗口的波动参数大于目标时间窗口的最大波动参数,则代表目标时间窗口的预测波动参数和真实波动参数相差较大,此时可以确定存在推荐异常。
子步骤1014,若所述目标时间窗口的所述波动参数小于或等于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐正常。
可以理解,若目标时间窗口的波动参数小于或等于目标时间窗口的最大波动参数,则代表目标时间窗口的预测波动参数和真实波动参数相差较小,此时可以确定不存在推荐异常。
本公开的实施例可以采用目标时间窗口在历史时间周期内的真实推荐结果参数的波动情况,确定目标时间窗口的最大波动参数,以确定目标时间窗口的真实推荐结果参数和预测推荐结果参数是否一致,相对于通过固定的阈值确定真实推荐结果参数和预测推荐结果参数是否一致,最大波动参数反映了真实的波动,从而使得异常检测的准确度较高。
可选地,在本公开的另一种实施例中,参照图3所示的确定预测推荐结果参数的步骤流程图,所述目标时间窗口在当前时间周期内的预测推荐结果参数是通过如下步骤105至107确定的:
步骤105,将所述历史的真实推荐结果参数输入至ARRegressor模型,得到所述目标时间窗口在当前时间周期内的第一预测结果参数。
其中,ARRegressor模型用于通过历史的真实推荐结果参数,预测目标时间窗口在当前时间周期内的第一预测结果参数,第一预测结果参数是通过ARRegressor模型预测的推荐结果参数。
ARRegressor模型是一种处理时间序列的模型,训练周期短,实时性高,短期拟合效果好。ARRegressor模型的公式如下:
其中,PRRP1tw,d为目标时间窗口tw在当前时间周期d内的第一预测结果参数,I是预测时采用的历史的真实推荐结果参数的数目,历史的真实推荐结果参数可以按照时间顺序排列,RRPi为排列之后第i个历史的真实推荐结果参数,其可能是某个时间窗口在当前时间周期内的真实推荐结果参数,也可能是某个时间窗口在历史时间周期内的真实推荐结果参数,c为与时间无关的常数,为排列之后第i个真实推荐结果参数对应的权重,εi为第i个真实推荐结果参数对应的常数,c、和εi均是通过训练得到的,训练过程可以参照步骤101中说明的训练过程。
从公式(4)中可以看出,可以I个历史的真实推荐结果参数输入至公式(4)中,从而可以得到目标时间窗口tw在当前时间周期d的第一预测结果参数。如此随着时间的推移,可以预测多个时间窗口在当前时间周期内的第一预测结果参数。
步骤106,将所述历史的真实推荐结果参数输入至LSTM模型,得到所述目标时间窗口在当前时间周期内的第二预测结果参数。
其中,LSTM(Long Short-Term Memory,长短期记忆网络)模型是一种特殊的RNN模型,主要是为了解决长序列的训练过程中的梯度消失和梯度爆炸问题,相对于普通的RNN,若用于训练的序列长度很长,则LSTM的拟合效果较好,但训练周期较长,参数较复杂,训练难度较大。
LSTM模型可以通过按照时间顺序排列的真实推荐结果参数训练得到,可以一次预测多个时间窗口在一个或多个时间周期内的第二预测结果参数,第二预测结果参数是通过LSTM模型预测的预测推荐结果参数。
步骤107,根据所述ARRegressor模型的权重和所述LSTM模型的权重,将所述第一预测结果参数和所述第二预测结果参数进行加权,得到所述目标时间窗口在当前时间周期内的所述预测推荐结果参数,所述ARRegressor模型的所述权重大于所述LSTM模型的所述权重。
具体地,将目标时间窗口在当前时间周期内的第一预测结果参数和第二预测结果参数加权,得到目标时间窗口在当前时间周期内的预测推荐结果参数,可以通过如下公式计算得到预测推荐结果参数:
PRRPtw,d=w1·PRRP1tw,d+w2·PRRP2tw,d (5)
其中,PRRPtw,d为目标时间窗口tw在当前时间周期d内的预测结果参数,PRRP1tw,d为目标时间窗口tw在当前时间周期d内的第一预测结果参数,PRRP2tw,d为目标时间窗口tw在当前时间周期d内的第二预测结果参数,w1和w2分别为ARRegressor模型和LSTM模型的权重,且w1>w2。
本公开的实施例可以结合ARRegressor模型和LSTM模型预测的预测推荐结果参数进行加权,并由于ARRegressor模型的准确度较高,从而对其采用较高的权重,有助于提高预测推荐结果参数的准确度。
可选地,在本公开的另一种实施例中,参照图4所示的确定第二异常检测结果的步骤流程图,所述步骤102包括子步骤1021至1023:
子步骤1021,确定所述目标时间窗口在不同时间周期内的降低参数,在每个所述时间周期内,所述降低参数是与所述目标时间窗口的所述参考时间窗口的真实推荐结果参数相比,所述目标时间窗口的所述真实推荐结果参数的降低程度。
具体地,对于每个时间周期,可以将目标时间窗口之前的上一个时间窗口作为参考时间窗口,从而降低参数可以为该参考时间窗口在该时间周期内的真实推荐结果参数,与该目标时间窗口在该时间周期内的真实推荐结果参数的绝对差值,或,该绝对差值与参考时间窗口在该时间周期内的真实推荐结果参数的比值。当采用比值时可以得到如下得到的降低参数:
其中,RAMPtw,d为时间窗口tw在时间周期d内的降低参数,RRPtw-1,d为时间窗口tw-1在时间周期d内的真实推荐结果参数,RRPtw,d为时间窗口tw在时间周期d内的真实推荐结果参数。
为了提高降低参数的准确度,可以将目标时间窗口之前的多个时间窗口作为参考时间窗口,此时可以将多个参考时间窗口在该时间周期内的最大真实推荐结果参数作为参考时间窗口的真实推荐结果参数,从而降低参数可以为该参考时间窗口的真实推荐结果参数,与该目标时间窗口在该时间周期内的真实推荐结果参数的绝对差值,或,该绝对差值与参考时间窗口的真实推荐结果参数的比值。当采用比值时可以得到如下的降低参数:
其中,MAX(RRPtw,d,...,RRPtw-I,d)用于获取I+1个时间窗口t-I至t在时间周期d内的真实推荐结果参数RRPt,d,...,RRPt-I,d的最大值。
子步骤1022,若所述目标时间窗口在所述当前时间周期内的降低参数大于所述目标时间窗口在所述历史时间周期内的降低参数,则确定所述第二异常检测结果为推荐异常。
其中,历史时间周期为一个或多个,当历史时间周期为一个时,直接通过公式(6)或(7)计算得到目标时间窗口在该历史时间周期的降低参数;当历史时间周期为多个时,通过公式(6)或(7)计算得到目标时间窗口在多个历史时间周期的降低参数,并将最大的降低参数作目标时间窗口在历史时间周期内的降低参数。
子步骤1023,若所述目标时间窗口在所述当前时间周期内的所述降低参数小于或等于所述目标时间窗口在所述历史时间周期内的所述降低参数,则确定所述第二异常检测结果为推荐正常。
本公开的实施例可以根据目标时间窗口在多个历史时间周期内的降低参数确定是否存在推荐异常,相对于仅通过目标时间窗口在一个时间周期内的降低参数确定是否存在推荐异常,其准确度更高。
可选地,在本公开的另一种实施例中,参照图5所示的确定第三异常检测结果的步骤流程图,所述步骤103包括子步骤1031至1034:
子步骤1031,根据所述目标时间窗口的所述参考时间窗口在所述当前时间周期内的所述真实推荐结果参数,确定所述目标时间窗口的偏移量阈值,所述偏移量阈值是第一偏移量和第二偏移量中的最小值,所述第一偏移量为最大的真实推荐结果参数与平均的真实推荐结果参数的偏移量,所述第二偏移量为所述平均的真实推荐结果参数与最小的真实推荐结果参数的偏移量。
具体地,偏移量阈值可以根据如下公式确定得到:
其中,OFTtw为目标时间窗口tw的偏移量阈值,RRPtw为目标时间窗口tw在当前时间周期内的真实推荐结果参数,RRPtw,...,RRPtw-I是目标时间窗口tw及tw之前的I个时间窗口在当前时间周期内的真实推荐结果参数,MAX是求最大值的函数名,AVG是求平均值的函数名,MIN是求最小值的函数名。
子步骤1032,统计所述参考时间窗口中异常窗口的数目,所述异常窗口的真实推荐结果参数与所述目标时间窗口的所述真实推荐结果参数的差值大于所述目标时间窗口的所述偏移量阈值。
可以理解,异常窗口的真实推荐结果参数与目标时间窗口的真实推荐结果参数的差值是绝对差值,大于或等于0。
子步骤1033,若所述异常窗口的所述数目大于异常数目阈值,则确定所述第三异常检测结果为推荐异常。
其中,异常数目阈值是用于判断异常的最大异常窗口数目,可以根据实际应用场景设定,本公开的实施例对其不加以限制。
子步骤1034,若所述异常窗口的所述数目小于或等于所述异常数目阈值,则确定所述第三异常检测结果为推荐正常。
本公开的实施例可以采用目标时间窗口之前的参考时间窗口在当前时间周期内的真实推荐结果参数,确定偏移量阈值,由于不同的时间窗口之前的参考时间窗口的真实推荐结果参数不同,从而生成的偏移量阈值是动态变化的,其可以准确的描述当前时间周期内目标时间窗口前的真实推荐结果参数的波动情况,有助于提高异常检测的准确度。
可选地,在本公开的另一种实施例中,所述步骤104包括子步骤1041:
子步骤1041,若所述第一异常检测结果为推荐异常,且所述第二异常检测结果和所述第三异常检测结果中的至少一个为推荐异常,则确定存在所述推荐异常。
本公开的实施例将生成第一异常检测结果的算法称为预估降幅算法,将生成第二异常检测结果的算法称为同比降幅算法,将生成第三异常检测结果的算法称为短期环比算法。本公开的实施例对预估降幅算法、同比降幅算法和短期环比算法的准确率做了实验,得到如图7所示的准确率(即为检测为异常中真正异常的数目占比),从中可以看到预估降幅算法的准确率60%最高,同比降幅算法的准确率50%次之,短期环比算法的准确率39%最低。
基于上述实验结果,本公开的实施例在第一异常检测结果为异常,且第二异常检测结果和第三异常检测结果中的至少一个为推荐异常时,确定存在推荐异常;在第一异常检测结果、第二异常检测结果和第三异常检测结果均为推荐正常时,确定不存在推荐异常;在第一异常检测结果为正常,但第二异常检测结果和第三异常检测结果均为推荐异常时,无法给出确定的异常判断结果。
本公开的实施例可以给准确率最高的预估降幅算法以最高的优先级,只要包含其在内的至少两个算法均确定存在推荐异常,则确定推荐异常,有助于提高异常的准确度。
可选地,在本公开的另一种实施例中,参照图6所示的确定推荐异常的步骤流程图,所述步骤104包括子步骤1042至1043:
子步骤1042,若所述第一异常检测结果为推荐正常,且所述第二异常检测结果和所述第三异常检测结果均为所述推荐异常,则根据所述目标时间窗口之后的后续时间窗口在所述当前时间周期内的真实推荐结果参数以及所述后续时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第四异常检测结果,并根据所述后续时间窗口在当前时间周期内的真实推荐结果参数以及所述后续时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第五异常检测结果,所述后续时间窗口的所述参考时间窗口在所述后续时间窗口之前。
其中,后续时间窗口是目标时间窗口之后的一个时间窗口,考虑到异常检测的实时性,可以采用目标时间窗口的下一个时间窗口作为后续时间窗口。例如,若目标时间窗口为13:00,则后续时间窗口可以为13:01,相较于采用时间窗口13:00的真实推荐结果参数确定是否存在推荐异常,采用时间窗口13:01的真实推荐结果参数确定是否存在推荐异常的实时性较差。
可以理解,第四异常检测结果与步骤102生成的第二异常检测结果对应,其均采用同比降幅算法,区别仅在于针对的时间窗口不同,从而可以将后续时间窗口作为新的目标时间窗口,并采用类似步骤102的子步骤1021至1023生成第四异常检测结果;第五异常检测结果与步骤103生成的第三异常检测结果对应,其均采用短期环比算法,区别仅在于针对的时间窗口不同,从而采用类似步骤103的子步骤1031至1034生成第五异常检测结果。
子步骤1043,若所述第四异常检测结果和所述第五异常检测结果均为所述推荐异常,则确定存在推荐异常。
可以理解,若第四异常检测结果和第五异常检测结果中的至少一个为推荐正常,则确定推荐正常。
本公开的实施例可以在第一异常检测结果为推荐异常,第二异常检测结果和第三异常检测结果均为推荐正常时,通过下一时间窗口的第四异常检测结果和第五异常检测结果确定是否推荐异常,以牺牲实时性来提高异常的准确度。
综上所述,本公开提供了一种推荐的异常检测方法,包括:根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。本公开可以采用目标时间窗的预测推荐结果参数和真实推荐结果参数的波动程度、目标时间窗口在不同时间周期内的波动程度和目标时间窗口和之前时间窗口在当前时间周期内的波动程度,确定是否存在推荐异常,由于结合了三种不同维度的波动特征,从而有助于提高异常检测的准确度。
参照图8,其示出了本公开的推荐的异常检测装置的结构图,具体如下:
第一异常检测结果生成模块201,用于根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数。
第二异常检测结果生成模块202,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果。
第三异常检测结果生成模块203,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前。
推荐异常确定模块204,用于根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
可选地,在本公开的另一种实施例中,参照图9所示的第一异常检测结果生成模块的结构框图,所述第一异常检测结果生成模块201包括目标波动参数确定子模块2011、最大波动参数确定子模块2012、第一推荐异常确定子模块2013和第一推荐正常确定子模块2014:
目标波动参数确定子模块2011,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数和所述预测推荐结果参数,确定所述目标时间窗口的波动参数,所述波动参数代表所述真实推荐结果参数和所述预测推荐结果参数之间的波动程度。
最大波动参数确定子模块2012,用于确定所述目标时间窗口在至少一个历史时间周期内的真实推荐结果参数,确定所述目标时间窗口的最大波动参数。
第一推荐异常确定子模块2013,用于若所述目标时间窗口的所述波动参数大于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐异常。
第一推荐正常确定子模块2014,用于若所述目标时间窗口的所述波动参数小于或等于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐正常。
可选地,在本公开的另一种实施例中,参照图10所示的确定预测推荐结果参数的模块框图,所述目标时间窗口在当前时间周期内的预测推荐结果参数是通过如下第一结果预测模块205、第二结果预测模块206和预测结果加权模块207确定的:
第一结果预测模块205,用于将所述历史的真实推荐结果参数输入至ARRegressor模型,得到所述目标时间窗口在当前时间周期内的第一预测结果参数。
第二结果预测模块206,用于将所述历史的真实推荐结果参数输入至LSTM模型,得到所述目标时间窗口在当前时间周期内的第二预测结果参数。
预测结果加权模块207,用于根据所述ARRegressor模型的权重和所述LSTM模型的权重,将所述第一预测结果参数和所述第二预测结果参数进行加权,得到所述目标时间窗口在当前时间周期内的所述预测推荐结果参数,所述ARRegressor模型的所述权重大于所述LSTM模型的所述权重。
可选地,在本公开的另一种实施例中,参照图11所示的第二异常检测结果生成模块的结构框图,所述第二异常检测结果生成模块202包括降低参数确定子模块2021、第二推荐异常确定子模块2022和第二推荐正常确定子模块2023:
降低参数确定子模块2021,用于确定所述目标时间窗口在不同时间周期内的降低参数,在每个所述时间周期内,所述降低参数是与所述目标时间窗口的所述参考时间窗口的真实推荐结果参数相比,所述目标时间窗口的所述真实推荐结果参数的降低程度。
第二推荐异常确定子模块2022,用于若所述目标时间窗口在所述当前时间周期内的降低参数大于所述目标时间窗口在所述历史时间周期内的降低参数,则确定所述第二异常检测结果为推荐异常。
第二推荐正常确定子模块2023,用于若所述目标时间窗口在所述当前时间周期内的所述降低参数小于或等于所述目标时间窗口在所述历史时间周期内的所述降低参数,则确定所述第二异常检测结果为推荐正常。
可选地,在本公开的另一种实施例中,参照图12所示的第三异常检测结果生成模块的结构框图,所述第三异常检测结果生成模块203包括偏移量阈值确定子模块2031、异常窗口数目统计子模块2032、第三推荐异常确定子模块2033和第三推荐正常确定子模块2034:
偏移量阈值确定子模块2031,用于根据所述目标时间窗口的所述参考时间窗口在所述当前时间周期内的所述真实推荐结果参数,确定所述目标时间窗口的偏移量阈值,所述偏移量阈值是第一偏移量和第二偏移量中的最小值,所述第一偏移量为最大的真实推荐结果参数与平均的真实推荐结果参数的偏移量,所述第二偏移量为所述平均的真实推荐结果参数与最小的真实推荐结果参数的偏移量。
异常窗口数目统计子模块2032,用于统计所述参考时间窗口中异常窗口的数目,所述异常窗口的真实推荐结果参数与所述目标时间窗口的所述真实推荐结果参数的差值大于所述目标时间窗口的所述偏移量阈值。
第三推荐异常确定子模块2033,用于若所述异常窗口的所述数目大于异常数目阈值,则确定所述第三异常检测结果为推荐异常。
第三推荐正常确定子模块2034,用于若所述异常窗口的所述数目小于或等于所述异常数目阈值,则确定所述第三异常检测结果为推荐正常。
可选地,在本公开的另一种实施例中,所述推荐异常确定模块204包括第四异常确定子模块:
第四推荐异常确定子模块,用于若所述第一异常检测结果为推荐异常,且所述第二异常检测结果和所述第三异常检测结果中的至少一个为推荐异常,则确定存在所述推荐异常。
可选地,在本公开的另一种实施例中,参照图13所示的推荐异常确定模块的结构框图,所述推荐异常确定模块205包括后续时间窗口检测子模块2051和第五异常确定子模块2052:
后续时间窗口检测子模块2051,用于若所述第一异常检测结果为推荐正常,且所述第二异常检测结果和所述第三异常检测结果均为所述推荐异常,则根据所述目标时间窗口之后的后续时间窗口在所述当前时间周期内的真实推荐结果参数以及所述后续时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第四异常检测结果,并根据所述后续时间窗口在当前时间周期内的真实推荐结果参数以及所述后续时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第五异常检测结果,所述后续时间窗口的所述参考时间窗口在所述后续时间窗口之前。
第五异常确定子模块2052,用于若所述第四异常检测结果和所述第五异常检测结果均为所述推荐异常,则确定存在推荐异常。
综上所述,本公开提供了一种推荐的异常检测装置,所述装置包括:第一异常检测结果生成模块,用于根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;第二异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;第三异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;推荐异常确定模块,用于根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。本公开可以采用目标时间窗的预测推荐结果参数和真实推荐结果参数的波动程度、目标时间窗口在不同时间周期内的波动程度和目标时间窗口和之前时间窗口在当前时间周期内的波动程度,确定是否存在推荐异常,由于结合了三种不同维度的波动特征,从而有助于提高异常检测的准确度。
本公开的装置实施例可以参照方法实施例的详细说明,在此不再赘述。
本公开还提供了一种电子设备,参照图14,包括:处理器301、存储器302以及存储在所述存储器302上并可在所述处理器上运行的计算机程序3021,所述处理器301执行所述程序时实现前述实施例的推荐的异常检测方法。
本公开还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的推荐的异常检测方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的内容,并且上面对特定语言所做的描述是为了披露本公开的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的推荐的异常检测设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的保护范围之内。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种推荐的异常检测方法,其特征在于,所述方法包括:
根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;
根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;
根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;
根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
2.根据权利要求1所述的方法,其特征在于,所述根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果的步骤,包括:
根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数和所述预测推荐结果参数,确定所述目标时间窗口的波动参数,所述波动参数代表所述真实推荐结果参数和所述预测推荐结果参数之间的波动程度;
确定所述目标时间窗口在至少一个历史时间周期内的真实推荐结果参数,确定所述目标时间窗口的最大波动参数;
若所述目标时间窗口的所述波动参数大于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐异常;
若所述目标时间窗口的所述波动参数小于或等于所述目标时间窗口的所述最大波动参数,确定所述第一异常检测结果为推荐正常。
3.根据权利要求1所述的方法,其特征在于,所述目标时间窗口在当前时间周期内的预测推荐结果参数是通过如下步骤确定的:
将所述历史的真实推荐结果参数输入至ARRegressor模型,得到所述目标时间窗口在当前时间周期内的第一预测结果参数;
将所述历史的真实推荐结果参数输入至LSTM模型,得到所述目标时间窗口在当前时间周期内的第二预测结果参数;
根据所述ARRegressor模型的权重和所述LSTM模型的权重,将所述第一预测结果参数和所述第二预测结果参数进行加权,得到所述目标时间窗口在当前时间周期内的所述预测推荐结果参数,所述ARRegressor模型的所述权重大于所述LSTM模型的所述权重。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果的步骤,包括:
确定所述目标时间窗口在不同时间周期内的降低参数,在每个所述时间周期内,所述降低参数是与所述目标时间窗口的所述参考时间窗口的真实推荐结果参数相比,所述目标时间窗口的所述真实推荐结果参数的降低程度;
若所述目标时间窗口在所述当前时间周期内的降低参数大于所述目标时间窗口在所述历史时间周期内的降低参数,则确定所述第二异常检测结果为推荐异常;
若所述目标时间窗口在所述当前时间周期内的所述降低参数小于或等于所述目标时间窗口在所述历史时间周期内的所述降低参数,则确定所述第二异常检测结果为推荐正常。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果的步骤,包括:
根据所述目标时间窗口的所述参考时间窗口在所述当前时间周期内的所述真实推荐结果参数,确定所述目标时间窗口的偏移量阈值,所述偏移量阈值是第一偏移量和第二偏移量中的最小值,所述第一偏移量为最大的真实推荐结果参数与平均的真实推荐结果参数的偏移量,所述第二偏移量为所述平均的真实推荐结果参数与最小的真实推荐结果参数的偏移量;
统计所述参考时间窗口中异常窗口的数目,所述异常窗口的真实推荐结果参数与所述目标时间窗口的所述真实推荐结果参数的差值大于所述目标时间窗口的所述偏移量阈值;
若所述异常窗口的所述数目大于异常数目阈值,则确定所述第三异常检测结果为推荐异常;
若所述异常窗口的所述数目小于或等于所述异常数目阈值,则确定所述第三异常检测结果为推荐正常。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常的步骤,包括:
若所述第一异常检测结果为推荐异常,且所述第二异常检测结果和所述第三异常检测结果中的至少一个为推荐异常,则确定存在所述推荐异常。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常的步骤,包括:
若所述第一异常检测结果为推荐正常,且所述第二异常检测结果和所述第三异常检测结果均为所述推荐异常,则根据所述目标时间窗口之后的后续时间窗口在所述当前时间周期内的真实推荐结果参数以及所述后续时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第四异常检测结果,并根据所述后续时间窗口在当前时间周期内的真实推荐结果参数以及所述后续时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第五异常检测结果,所述后续时间窗口的所述参考时间窗口在所述后续时间窗口之前;
若所述第四异常检测结果和所述第五异常检测结果均为所述推荐异常,则确定存在推荐异常。
8.一种推荐的异常检测装置,其特征在于,所述装置包括:
第一异常检测结果生成模块,用于根据目标时间窗口在当前时间周期内的真实推荐结果参数和预测推荐结果参数之间的波动程度,生成第一异常检测结果;所述目标时间窗口在当前时间周期内的预测推荐结果参数是根据历史的真实推荐结果参数预测得到的,所述历史的真实推荐结果参数包括如下至少一种:所述目标时间窗口之前的至少一个时间窗口在当前时间周期内的真实推荐结果参数、至少一个任意时间窗口在历史时间周期内的真实推荐结果参数;
第二异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口在历史时间周期内的真实推荐结果参数之间的波动程度,生成第二异常检测结果;
第三异常检测结果生成模块,用于根据所述目标时间窗口在所述当前时间周期内的所述真实推荐结果参数以及所述目标时间窗口的参考时间窗口在当前时间周期内的真实推荐结果参数之间的波动程度,生成第三异常检测结果,所述目标时间窗口的参考时间窗口在所述目标时间窗口之前;
推荐异常确定模块,用于根据所述第一异常检测结果、所述第二异常检测结果以及所述第三异常检测结果确定是否存在推荐异常。
9.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的推荐的异常检测方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7中任一项所述的推荐的异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183405.9A CN111538897B (zh) | 2020-03-16 | 2020-03-16 | 推荐的异常检测方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010183405.9A CN111538897B (zh) | 2020-03-16 | 2020-03-16 | 推荐的异常检测方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111538897A true CN111538897A (zh) | 2020-08-14 |
CN111538897B CN111538897B (zh) | 2023-06-02 |
Family
ID=71974869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010183405.9A Active CN111538897B (zh) | 2020-03-16 | 2020-03-16 | 推荐的异常检测方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111538897B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112286951A (zh) * | 2020-11-26 | 2021-01-29 | 杭州数梦工场科技有限公司 | 数据检测方法及装置 |
CN115144474A (zh) * | 2022-06-27 | 2022-10-04 | 东莞灵虎智能科技有限公司 | 一种超声信号数据质量检测方法 |
CN115859209A (zh) * | 2023-02-08 | 2023-03-28 | 烟台市福山区动物疫病预防控制中心 | 基于饲料消耗数据的畜牧业家禽养殖异常识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104254019A (zh) * | 2013-06-28 | 2014-12-31 | 广州华多网络科技有限公司 | 信息推送结果检测方法和系统 |
US9727723B1 (en) * | 2014-06-18 | 2017-08-08 | EMC IP Holding Co. LLC | Recommendation system based approach in reducing false positives in anomaly detection |
CN107528722A (zh) * | 2017-07-06 | 2017-12-29 | 阿里巴巴集团控股有限公司 | 一种时间序列中异常点检测方法及装置 |
CN108322363A (zh) * | 2018-02-12 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 推送数据异常监控方法、装置、计算机设备和存储介质 |
CN110830448A (zh) * | 2019-10-16 | 2020-02-21 | 支付宝(杭州)信息技术有限公司 | 目标事件的流量异常检测方法、装置、电子设备及介质 |
-
2020
- 2020-03-16 CN CN202010183405.9A patent/CN111538897B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104254019A (zh) * | 2013-06-28 | 2014-12-31 | 广州华多网络科技有限公司 | 信息推送结果检测方法和系统 |
US9727723B1 (en) * | 2014-06-18 | 2017-08-08 | EMC IP Holding Co. LLC | Recommendation system based approach in reducing false positives in anomaly detection |
CN107528722A (zh) * | 2017-07-06 | 2017-12-29 | 阿里巴巴集团控股有限公司 | 一种时间序列中异常点检测方法及装置 |
CN108322363A (zh) * | 2018-02-12 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 推送数据异常监控方法、装置、计算机设备和存储介质 |
CN110830448A (zh) * | 2019-10-16 | 2020-02-21 | 支付宝(杭州)信息技术有限公司 | 目标事件的流量异常检测方法、装置、电子设备及介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112286951A (zh) * | 2020-11-26 | 2021-01-29 | 杭州数梦工场科技有限公司 | 数据检测方法及装置 |
CN115144474A (zh) * | 2022-06-27 | 2022-10-04 | 东莞灵虎智能科技有限公司 | 一种超声信号数据质量检测方法 |
CN115144474B (zh) * | 2022-06-27 | 2024-05-28 | 东莞灵虎智能科技有限公司 | 一种超声信号数据质量检测方法 |
CN115859209A (zh) * | 2023-02-08 | 2023-03-28 | 烟台市福山区动物疫病预防控制中心 | 基于饲料消耗数据的畜牧业家禽养殖异常识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111538897B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111538897A (zh) | 推荐的异常检测方法、装置、电子设备及可读存储介质 | |
CN108880931B (zh) | 用于输出信息的方法和装置 | |
US9696786B2 (en) | System and method for optimizing energy consumption by processors | |
US8924333B2 (en) | Detecting anomalies in real-time in multiple time series data with automated thresholding | |
JP6501982B2 (ja) | 故障リスク指標推定装置および故障リスク指標推定方法 | |
CN110020877B (zh) | 点击率的预测方法、点击率的确定方法及服务器 | |
CN110019174B (zh) | 数据质量确定方法、装置、电子设备及存储介质 | |
US20150112891A1 (en) | Information processor, information processing method, and program | |
US20170030949A1 (en) | Electrical load prediction including sparse coding | |
JP7010674B2 (ja) | 電力需要予測装置、電力需要予測方法およびプログラム | |
US20150081398A1 (en) | Determining a performance target setting | |
CN110766184A (zh) | 订单量预测方法和装置 | |
WO2014209484A1 (en) | Methods and systems for evaluating predictive models | |
US11669762B2 (en) | Apparatus and method for forecasted performance level adjustment and modification | |
CN113837806A (zh) | 产品流转量预测方法、装置、电子设备和存储介质 | |
CN113626734B (zh) | 用户行为引导方法、装置、电子设备及存储介质 | |
Nam et al. | The uncertainty of storm season changes: quantifying the uncertainty of autocovariance changepoints | |
CN114581119A (zh) | 流量预测方法以及装置 | |
CN111160951A (zh) | 激励结果的预测方法、装置、电子设备及可读存储介质 | |
CN112398670A (zh) | 流量预测方法、装置、计算设备及计算机存储介质 | |
US8732528B1 (en) | Measuring test effects using adjusted outlier data | |
JP2001014295A (ja) | データ予測方法、データ予測装置及び記録媒体 | |
CN110659954B (zh) | 作弊识别方法、装置、电子设备及可读存储介质 | |
CN112528549A (zh) | 确定任务激励参数的方法、装置、电子设备及存储介质 | |
CN110634006B (zh) | 广告点击率的预测方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |