CN112988186A - 异常检测系统的更新方法及装置 - Google Patents
异常检测系统的更新方法及装置 Download PDFInfo
- Publication number
- CN112988186A CN112988186A CN202110189257.6A CN202110189257A CN112988186A CN 112988186 A CN112988186 A CN 112988186A CN 202110189257 A CN202110189257 A CN 202110189257A CN 112988186 A CN112988186 A CN 112988186A
- Authority
- CN
- China
- Prior art keywords
- sample
- characterization
- layer
- samples
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本说明书实施例提供一种异常检测系统的更新方。该方法中包括:首先,获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;然后,将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,在所述样本表征层,确定所述n个样本对应的n个样本表征向量;在所述特征表征层,确定所述k项特征对应的k个特征表征向量;在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;基于所述样本重构结果,更新所述异常检测系统。
Description
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及异常检测系统的更新方法及装置。
背景技术
许多领域都需要进行异常检测,如网站维护、仪器性能维护、金融交易维护等领域。通常,异常检测旨在对异常数据点、或异常变化趋势进行检测、识别,从而辅助对应领域问题的溯源、判断,或及时采取应对措施,进而降低损失,保障用户体验等。
然而,目前异常检测的实现方式比较单一,难以满足日益提高的实际需求。因此,需要一种方案,可以有效提高异常检测结果的准确度和可用性。
发明内容
本说明书一个或多个实施例描述了一种异常检测系统的更新方法及装置,通过引入多维特征,并设计新的异常检测系统实现对该多维特征的处理,从而有效提高异常检测结果的准确度。
根据第一方面,提供了一种异常检测系统的更新方法,包括:获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,所述样本表征层,确定所述n个样本对应的n个样本表征向量;所述特征表征层,确定所述k项特征对应的k个特征表征向量;所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;基于所述样本重构结果,更新所述异常检测系统。
在一个实施例中,所述各个样本属于交易样本,所述k项特征包括以下中的至少一项:交易时刻、交易时段、交易金额、交易次数。
在一个实施例中,所述样本表征层包括第一编码子层和第一注意力子层;其中,所述样本表征层,确定所述n个样本对应的n个样本表征向量,包括:所述第一编码子层,对所述n个样本分别进行编码,得到n个样本编码向量;所述第一注意力子层,确定所述各个样本为所述n个样本分配的注意力权重,并利用该注意力权重对所述n个样本编码向量进行加权处理,得到对应样本的样本表征向量。
在一个实施例中,所述特征表征层包括第二编码子层和第二注意力子层;其中,所述特征表征层,确定所述k项特征对应的k个特征表征向量,包括:所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量;所述第二注意力子层,确定各项特征为所述k项特征分配的注意力权重,并利用该注意力权重对所述k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
在一个具体的实施例中,所述第二编码子层中包括时序递归网络;其中,所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量,包括:所述时序递归网络,对各项特征对应n个样本的n个特征值进行处理,得到对应特征的特征编码向量。
在一个实施例中,所述异常检测系统还包括聚合表征层,所述聚合表征层对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量;其中,所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果,包括:所述样本重构层对所述融合向量进行处理,得到所述样本重构结果。
在一个具体的实施例中,所述融合处理包括以下中的至少一种:拼接处理、加和处理、平均处理。
在一个具体的实施例中,所述聚合表征层对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量,包括:基于所述n个样本的时序,对所述n个样本表征向量进行第一融合;对所述第一融合的结果和所述k个特征表征向量进行第二融合,得到所述融合向量。
在一个实施例中,所述样本重构层包括自编码器,所述样本重构结果包括针对第n个样本的重构样本;其中,基于所述样本重构结果,更新所述异常检测系统,包括:以减小所述重构样本相较所述第n个样本的偏差为训练目标,更新所述异常检测系统。
在一个实施例中,所述样本重构层包括变分自编码器,所述样本重构结果包括针对第n个样本的重构样本与该第n个样本相同的概率;其中,基于所述样本重构结果,更新所述异常检测系统,包括:以增大所述概率为训练目标,更新所述异常检测系统。
根据第二方面,提供了一种异常检测系统的更新方法,包括:获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;将所述第二样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本预测层;其中,所述样本表征层,确定所述m个样本对应的m个样本表征向量;所述特征表征层,确定所述k项特征对应的k个特征表征向量;所述样本预测层,对所述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;基于所述预测样本和第m+1个样本,更新所述异常检测系统。
根据第三方面,提供了一种异常检测系统的更新方法,所述异常检测系统包括样本表征层、特征表征层、样本重构层和样本预测层,所述方法包括:获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;所述t个样本形成第一样本序列,所述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1;将所述第一样本序列输入异常检测系统,其中,所述样本表征层,确定所述t个样本对应的t个第一样本表征向量;所述特征表征层,确定所述k项特征对应的k个第一特征表征向量;所述样本重构层,对所述n个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果;将所述第二样本序列输入异常检测系统,其中,所述样本表征层确定所述前t-1个样本对应的t-1个第二样本表征向量;所述特征表征层,确定所述k项特征对应的k个第二特征表征向量;所述样本预测层,对所述t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本;基于所述样本重构结果、所述预测样本和第t个样本,更新所述异常检测系统。
根据第四方面,提供了一种异常检测系统的更新装置,包括:样本序列获取单元,配置为获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;样本序列处理单元,配置为将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,所述样本表征层,确定所述n个样本对应的n个样本表征向量;所述特征表征层,确定所述k项特征对应的k个特征表征向量;所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;系统更新单元,配置为基于所述样本重构结果,更新所述异常检测系统。
根据第五方面,提供了一种一种异常检测系统的更新装置,包括:样本获取单元,配置为获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;样本序列处理单元,配置为将所述第二样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本预测层;其中,所述样本表征层,确定所述m个样本对应的m个样本表征向量;所述特征表征层,确定所述k项特征对应的k个特征表征向量;所述样本预测层,对所述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;系统更新单元,配置为基于所述预测样本和第m+1个样本,更新所述异常检测系统。
根据第六方面,提供了一种一种异常检测系统的更新装置,所述异常检测系统包括样本表征层、特征表征层、样本重构层和样本预测层,所述装置包括:样本获取单元,配置为获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;所述t个样本形成第一样本序列,所述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1;第一序列处理单元,配置为将所述第一样本序列输入异常检测系统,其中,所述样本表征层,确定所述t个样本对应的t个第一样本表征向量;所述特征表征层,确定所述k项特征对应的k个第一特征表征向量;所述样本重构层,对所述n个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果;第二序列处理单元,配置为将所述第二样本序列输入异常检测系统,其中,所述样本表征层确定所述前t-1个样本对应的t-1个第二样本表征向量;所述特征表征层,确定所述k项特征对应的k个第二特征表征向量;所述样本预测层,对所述t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本;系统更新单元,配置为基于所述样本重构结果、所述预测样本和第t个样本,更新所述异常检测系统。
根据第七方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面或第三方面的方法。
根据第八方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面或第三方面的方法。
根据本说明书实施例提供的上述方法及装置,可以实现对异常检测系统的更新,利用更新后的异常检测系统对包含多维特征的样本序列进行处理,可以得到蕴含丰富表征信息的样本序列表征向量,进而有效提高异常检测结果的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的异常检测系统的使用架构示意图;
图2示出根据一个实施例的异常检测系统的结构示意图;
图3示出根据一个实施例的异常检测系统的更新方法流程图;
图4示出根据另一个实施例的异常检测系统的结构示意图;
图5示出根据另一个实施例的异常检测系统的更新方法流程图;
图6示出根据又一个实施例的异常检测系统的结构示意图;
图7示出根据又一个实施例的异常检测系统的更新方法流程图;
图8示出根据一个实施例的异常检测系统的更新装置结构图;
图9示出根据另一个实施例的异常检测系统的更新装置结构图;
图10示出根据又一个实施例的异常检测系统的更新装置结构图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
如前所述,目前异常检测的实现方式较为单一,多数异常检测算法使用的是单个特征维度的时间序列数据,例如,某个仪器在近24h内连续测得的温度数据。然而,通常情况下,时间序列的主体数据具有多个特征维度(文中或将特征维度称为特征项、特征),比如,对于某个用户参与的交易事件,可以包括每天交易金额、交易笔数、对交易平台的浏览时长等。
基于此,发明人提出,可以采集并利用多个特征维度的数据进行异常检测,从而提高异常检测结果的准确度。具体,发明人设计一种异常检测系统,可以实现对被检测主体在多个特征维度下的时间序列数据的处理,图1示出根据一个实施例的异常检测系统的使用架构示意图,如图1所示,异常检测系统中包括样本表征层(或称样本级表征层)、特征表征层(或称特征级表征层、特征项表征层)、聚合表征层,以及检测任务层,图1还示出针对某个被检测主体采集的在多个特征维度下的监测数据,该监测数据形成的数据矩阵中包括k个特征项(f1至fk)以及n个时刻或时段(t1至tn)下的特征数据,为便于描述的清楚简洁,将任意ti(其中i∈[1,n])对应的一列特征数据称为一个样本,进一步,异常检测系统对上述数据矩阵的处理包括:样本表征层确定多个样本对应的多个样本表征向量,特征表征层确定多个特征项对应的多个特征表征向量;聚合表征层对该多个样本表征向量和多个特征表征向量进行聚合处理,得到聚合表征向量;检测任务层对该聚合表征向量进行处理,得到任务输出结果,用于判定被检测主体的异常情况。如此,使用上述异常检测系统对上述多个特征项对应的多个时间序列数据进行处理,引入了更加丰富的特征数据,使得异常检测结果的精准度得到有效提高。
对于上述检测任务层,在一种实施方式中,其实现的任务可以涉及对样本的重构,在一个示例中,检测任务层输出的可以是针对上述多个样本的多个重构样本,相应地,可以通过比对该多个样本和多个重构样本,确定多个样本对应的被检测主体是否存在异常。在此种实施方式中,可以将上述检测任务层实现为样本重构层,如图2,其中示出此种实施方式下的异常检测系统200的结构示意图。
下面结合具体的实施例,介绍针对异常检测系统200的更新方法。图3示出根据一个实施例的异常检测系统的更新方法流程图,所述方法的执行主体可以实现为任何具有计算、处理能力的平台、装置、服务器或设备集群。如图3所示,所述方法包括以下步骤:
步骤S310,获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k个特征的特征值;n和k均为大于2的整数;步骤S320,将上述第一样本序列输入异常检测系统,上述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,步骤S321,在上述样本表征层,确定上述n个样本对应的n个样本表征向量;在步骤S322,在上述特征表征层,确定上述k个特征项对应的k个特征表征向量;在步骤S323,在上述样本重构层,对上述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;步骤S330,基于该样本重构结果,更新上述异常检测系统。
针对以上步骤,首先需要说明的是,上述“第一样本序列”、“第一对象”中的“第一”,以及文中他处记载的“第二”等类似用语,均是为了清楚、简洁地区分同类事物,不具有其他限定作用。
对上述步骤的展开介绍如下:
步骤S310,获取第一样本序列,其中包括按时序排列的多个样本。其中时序是指时间顺序,时间可以是样本的产生时间或采集时间,为便于描述,将该多个样本记作n个样本,可以理解,n为大于1的整数。n个样本中的各个样本包括第一对象对应多个特征的特征值,为便于描述,将该多个特征记作k个特征,可以理解,k为大于1的整数。
上述第一样本序列可以是样本序列集中任意的一个样本序列。在一个实施例中,样本序列集中的样本序列均是已知正常的样本序列。在另一个实施例中,对异常检测系统的更新采用无监督学习的方式,相应,无需知晓单个的样本序列是否存在异常,而是直接采集大量样本序列,并且,从经验上可以判断出采集的大量样本序列多为正常样本序列,如90%以上的样本序列是正常的,而非异常的,此时,基于此大量样本序列训练得到的异常检测系统同样具有良好的预测效果,可以拟合、学习到正常样本的分布。
需说明,上述异常检测系统可以应用于多个不同的场景或领域,相应,在一个实施例中,获取的样本可以是来自交易领域的交易样本,交易样本涉及的第一对象可以是参与交易的用户(或称交易用户、交易方),或者某种可以买卖的产品(如实体产品或金融产品等),交易样本涉及的k个特征项(或称k项特征)可以包括:交易时刻、交易时段、交易金额、交易次数。在一个示例中,n个样本对应n个统计日,k个特征项可以包括单日交易总额、单日交易笔数、单日交易的时间分散度(如单日发生交易所涉及的时段总数)、单日交易涉及个人主体的笔数、单日交易涉及企业主体的笔数等。在另一个实施例中,获取的样本可以是仪器性能维护领域的性能监测样本,性能检测样本涉及的第一对象可以是某类仪器,其k个特征项可以包括:温度、压力、湿度等。在还一个实施例中,获取的样本可以是来自网络维护领域的网站性能监测样本,其涉及的第一对象可以是某类网站,其k个特征项可以包括:网站注册用户的访问量、网站非注册用户的访问量、网站内容的下载次数、网站内容的购买次数、网站新用户的注册数量等。如此,对获取的样本涉及的对象和特征进行介绍。
此外,考虑到采集的原始样本中涉及多个维度的特征,不同特征的量纲不一致使得数值范围存在较大的差异,导致各个维度的原始特征数据分布差异较大,因此,在一个实施例中,可以对各个维度的原始特征数据分别进行标准化处理(normalization),使得各个维度的特征值均位于[0,1]的范围内,以构建后续使用的样本序列。
基于以上获取的第一样本序列,在步骤S320,将上述第一样本序列输入异常检测系统。其中,异常检测系统可以包括图2示出的输入层21,样本表征层22、特征表征层23和样本重构层25。输入层21,用于获取上述第一样本序列;样本表征层22和特征表征层23分别用于对第一样本序列进行样本维度和特征维度的处理,需说明,一个样本对应一个时刻或时段,所以其中样本维度也可被称为时间维度;样本重构层25用于执行涉及样本重构的任务。
步骤S320中包括步骤S321至步骤S323。具体,一方面,在步骤S321,在样本表征层22,确定上述n个样本对应的n个样本表征向量。
在一个实施例中,样本表征层22对各个样本分别进行处理,得到对应的样本表征向量。在一个具体的实施例中,样本表征层22包括第一嵌入层,相应,第一嵌入层对各个样本中的k个特征值进行嵌入式编码,得到样本编码向量,作为对应的样本表征向量。在另一个具体的实施例中,样本表征层22包括第一嵌入层和深度神经网络层,深度神经网络层对第一嵌入层输出的样本编码向量进行深度变换处理,得到对应的样本表征向量,如此得到的样本表征向量能够反映不同维度特征之间的高阶交互信息。
在另一个实施例中,样本表征层22包括第一编码子层221和第一注意力子层222,相应,本步骤可以包括:在第一编码子层221,对n个样本分别进行编码,得到n个样本编码向量;在第一注意力子层222,确定各个样本为n个样本分配的注意力权重,并该注意力权重对n个样本编码向量进行加权处理,得到对应样本的样本表征向量。
在一个具体的实施例中,第一编码子层221可以实现为上述第一嵌入层,在第一嵌入层中基于各个样本进行嵌入式编码,得到对应样本的样本编码向量。在另一个具体的实施例中,第一编码子层221可以实现为上述第一嵌入层和深度神经网络层,第一嵌入层先基于各个样本进行嵌入式编码,深度神经网络层再对嵌入式编码得到的样本编码向量进行深度变换处理,得到深度变换处理向量,作为对应的样本编码向量。
进一步,第一注意力子层222基于n个样本对应的n个样本编码向量,对n个样本编码向量进行交互处理,实现样本间的特征交互。在一个具体的实施例中,针对n个样本中任一的第一样本,确定其为n个样本分配的注意力权重可以包括:将该第一样本的样本编码向量,分别与n个样本编码向量进行对位相乘,并对得到的n个对位相乘结果进行归一化处理,得到n个注意力权重。其中归一化处理可以利用softmax函数和直接求占比的方式等实现。在另一个具体的实施例中,注意力权重的确定可以包括:先将第一样本的样本编码向量分别与n个样本编码向量进行拼接,得到n个拼接编码向量,再将该n个拼接编码向量分别输入第一注意力子层222包括的注意力打分网络中,得到n个注意力分数,进而对n个注意力分数进行归一化处理,得到n个注意力权重。如此,在得到n个注意权重后,对n个样本编码向量进行加权求和,可以得到第一样本的样本表征向量,从而丰富了样本表征向量蕴含的表征信息。
由上,可以利用样本表征层22得到n个样本表征向量。
另一方面,在步骤S322,在特征表征层23,确定上述k个特征项对应的k个特征表征向量。
在一个实施例中,特征表征层23对各项特征分别进行处理,得到对应的特征表征向量。在一个具体的实施例中,特征表征层23包括第二嵌入层,相应,第二嵌入层对各项特征对应n个样本的n个特征值进行嵌入式编码,得到特征编码向量,作为对应的特征表征向量。在另一个具体的实施例中,特征表征层23包括时序递归网络,相应,时序递归网络对各项特征对应的n个特征值进行处理,得到特征编码向量,作为对应特征的特征表征向量。在一个更具体的实施例中,其中时序递归网络可以实现为长短期记忆网络LSTM,循环神经网络RNN。
在另一个实施例中,特征表征层23包括第二编码子层231和第二注意力子层232,相应,本步骤可以包括:第二编码子层231,对k项特征分别进行编码,得到k个特征编码向量;第二注意力子层232,确定各项特征为k项特征分配的注意力权重,并利用该注意力权重对k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
在一个具体的实施例中,第二编码子层231可以实现为上述第二嵌入层,在第二嵌入层中对各项特征进行嵌入式编码,得到对应特征的特征编码向量。在另一个具体的实施例中,第二编码子层231可以实现为上述时序递归网络,时序递归网络对各项特征对应的n个特征值进行处理,得到特征编码向量。
进一步,第二注意力子层232基于k项特征对应的k个特征编码向量,对k个特征编码向量进行交互处理,实现不同特征维度间的交互。在一个具体的实施例中,针对k项特征中任一的第一特征,确定其为k项特征分配的注意力权重可以包括:将该第一特征的特征编码向量,分别与k个特征编码向量进行对位相乘,并对得到的k个对位相乘结果进行归一化处理,得到k个注意力权重。其中归一化处理可以利用softmax函数和直接求占比的方式等实现。在另一个具体的实施例中,注意力权重的确定可以包括:先将第一特征的特征编码向量分别与k个特征编码向量进行拼接,得到k个拼接向量,再将该k个拼接向量分别输入第二注意力子层232包括的注意力打分网络中,得到k个注意力分数,进而对k个注意力分数进行归一化处理,得到k个注意力权重。如此,在得到k个注意权重后,对k个特征编码向量进行加权求和,可以得到第一特征的特征表征向量,从而丰富了特征表征向量蕴含的表征信息。如此,可以得到k个特征表征向量。
以上,利用样本表征层22得到n个样本表征向量,利用特征表征层23得到k个特征表征向量。基于此,在步骤S323,在样本重构层25,对上述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果。在一个实施例中,样本重构层25直接对输入其中的n个样本表征向量和k个特征表征向量进行处理,得到上述样本重构结果。
在另一个实施例中,如图2所示,异常检测系统中还包括聚合表征层24,其对上述n个样本表征向量和k个特征表征向量进行融合处理,得到融合向量,相应地,样本重构层对融合向量进行处理,得到样本重构结果。在一个具体的实施例中,其中融合处理可以包括拼接处理,加和处理和平均处理。
在一个具体的实施例中,聚合表征层24基于n个样本的时序,或基于第一样本序列反映的样本时序,对应对n个样本表征向量进行第一融合,再对第一融合的结果和k个特征表征向量进行第二融合,得到上述融合向量。在一个更具体的实施例中,其中第一融合可以包括:利用聚合表征层24中包括的时序递归网络对n个样本表征向量进行处理,得到第一融合结果,其中时序递归网络可以采用LSTM网络或RNN网络。在另一个更具体的实施例中,其中第一融合可以包括:对n个样本表征向量进行顺序拼接,得到第一融合结果。在还一个更具体的实施例中,其中第一融合可以包括:假定n为偶数,按顺序将相邻的两个样本特征向量归为一组,得到n/2组,对组内的向量进行求平均操作,得到n/2个向量,再对此n/2个向量进行顺序拼接,得到第一融合结果。在另一个更具体的实施例中,可以先对k个特征表征向量进行第三融合,如拼接、加和或平均,再对第一融合结果和第三融合结果进行第二融合,如拼接、加和、对位相乘或平均等,得到上述融合向量。如此,可以利用聚合表征层24得到上述n个样本表征向量和k个特征表征向量的融合向量。进一步,样本重构层25对该融合向量进行处理,得到样本重构结果。
另一方面,在一个实施例中,样本重构层包括自编码器(AE,Auto Encoder),上述样本重构结果包括针对上述n个样本中若干样本的重构样本。需说明,文中若干指代一个或多个,该若干样本所对应的数量或在样本序列中的位置,可以是人工预先设定的,或随机选取的。在一个具体的实施例中,样本重构结果中包括针对第n个样本的重构样本。在另一个具体的实施例中,样本重构结果中包括针对n个样本的n个重构样本。
在另一个实施例中,样本重构层包括变分自编码器(VAE,Variational Auto-Encoder),上述样本重构结果包括针对n个样本中若干样本的若干重构样本与该若干样本相同的若干概率向量(或称重构概率向量),各概率向量中包括对应k个特征的k个概率值。需说明,该若干样本所对应的数量或在样本序列中的位置,可以是人工预先设定的,或随机选取的。在一个示例中,样本重构结果包括针对第n个样本的重构样本与该第n个样本相同的概率向量。
如此,利用样本重构层25可以得到样本重构结果。
然后,在步骤S330,基于该样本重构结果,更新异常检测系统。
在一个实施例中,样本重构结果中包括针对n个样本中若干样本的若干重构样本,相应地,本步骤可以包括:以减小各个重构样本相较n个样本中对应样本的偏差为训练目标,更新异常检测系统。在一个具体的实施例中,基于上述若干样本和若干重构样本,计算训练损失,该训练损失与各个偏差均正相关。在一个具体的实施例中,对于上述偏差,可以采用计算欧式距离、切比雪夫距离、曼哈顿距离等方式而得到。需说明,更新异常检测系统是指就是对系统中的学习参数(或称训练参数)进行调整,具体调整可以采用已有的反向传播法实现,不作赘述。
在一个示例中,样本重构结果中包括针对第n个样本的重构样本,相应,可以通过下式(1)计算该重构样本相较该第n个样本的偏差,作为训练损失,用以更新异常检测系统。
在一个实施例中,样本重构结果中包括针对n个样本中若干样本的若干重构样本与该若干样本相同的若干概率向量,相应地,本步骤可以包括:以增大该若干概率向量为训练目标,更新异常检测系统。在一个实施例中,基于上述若干概率向量,计算训练损失,该训练损失与各个概率向量的向量大小均负相关。
在一个示例中,样本重构结果中包括针对第n个样本的重构概率向量,相应,可以通过下式(2)计算训练损失,用以更新异常检测系统。
在公式(2)中,L表示训练损失,k表示样本中的特征总数,pn,i表示针对第n个样本的重构概率向量中对应第i个特征的概率值。
由上,可以实现对异常检测系统200的参数更新。通过基于样本序列集,多次重复图3中示出的以上方法步骤,可以实现对异常检测系统200的多轮迭代更新,直到参数收敛,或者达到预定的迭代次数,从而得到更新完毕、最终用于实使用的异常检测系统。
对于异常检测系统200的使用,其可以用于检测样本序列级别的异常,或者单个样本的异常,并且,样本序列级别的异常检测结果和单个样本的异常检测结果可以反映背后被检测主体的异常情况。在一个实施例中,样本重构层25针对待检测的输入样本序列输出的样本重构结果中包括针对若干输入样本的若干重构样本,此时,可以计算该若干输入样本与若干重构样本之间的距离或相似度,进一步,在距离小于预定阈值或相似度大于预定阈值的情况下,判定输入样本序列正常(或被检测主体正常),否则,判定输入样本序列异常。在另一个实施例中,样本重构层25针对待检测的输入样本序列输出的样本重构结果中包括针对第n个输入样本的重构样本,此时,可以计算该第n个输入样本与重构样本之间的距离或相似度,进一步,在距离小于预定阈值或相似度大于预定阈值的情况下,判定第n个输入样本正常(或被检测主体正常),否则,判定第n个输入样本异常。
另一方面,在一个实施例中,样本重构层25针对待检测的输入样本序列输出的样本重构结果中包括针对若干输入样本的若干重构概率向量,此时,可以基于该若干概率向量计算平均概率值或者向量的模,再与预定阈值进行比较,进一步,在平均概率值或者向量的模大于预定阈值的情况下,判定输入样本序列正常,否则判定其异常。在另一个实施例中,样本重构层25针对待检测的输入样本序列输出的样本重构结果中包括针对第n个输入样本的重构概率向量,此时,可以基于该重构概率向量计算平均概率值或者向量的模,再与预定阈值进行比较,进一步,在平均概率值或者向量的模大于预定阈值的情况下,判定第n个输入样本正常,否则判定其异常。
综上,采用本说明书实施例披露的上述方法可以实现对异常检测系统200的更新,利用更新后的异常检测系统对包含多维特征的样本序列进行处理,可以得到蕴含丰富表征信息的样本序列表征向量,进而有效提高异常检测结果的准确度。
根据另一种实施方式,对于图1中示出的检测任务层,其实现的任务可以涉及对下一个时刻或时段的样本的预测,相应,检测任务层输出的可以是基于样本序列的预测样本,在此种实施方式中,可以将检测任务层实现为样本预测层,如图4,其中示出此种实施方式下的异常检测系统400的结构示意图。
下面结合具体的实施例,介绍针对图4中示出的异常检测系统的更新方法。图5示出根据另一个实施例的异常检测系统的更新方法流程图,所述方法的执行主体可以实现为任何具有计算、处理能力的平台、装置、服务器或设备集群。如图5所示,所述方法包括以下步骤:
步骤S510,获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;步骤S520,将上述第二样本序列输入异常检测系统,上述异常检测系统包括样本表征层、特征表征层和样本预测层;在步骤S521,在样本表征层,确定上述m个样本对应的m个样本表征向量;在步骤S522,在特征表征层,确定上述k项特征对应的k个特征表征向量;在步骤S523,在上述样本预测层,对上述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;在步骤S530,基于上述预测样本和第m+1个样本,更新上述异常检测系统。
对以上步骤的说明如下:
首先在步骤S510,获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数。需说明,在图5示出的方法中,样本预测层是基于前m个样本预测随后的第m+1个样本,所以输入异常检测系统的是前m个样本形成的第二样本序列,而不包括第m+1个样本。此外关于m和n,实际上,也可以将m替换为n,二者均是针对样本序列中样本数量的数学记号。
需说明,对上述步骤S510、S521和S522的描述,可以对照前述对图3示出的方法步骤S310、S321和S322的描述。比如,对于图4和图5步骤中示出和记载的第二样本序列、输入层41、样本表征层42和特征表征层43等的描述,可以对应参见对第一样本序列、输入层21、样本表征层22和特征表征层23等的介绍。
下面,接着对步骤S523和步骤S530进行介绍。
在步骤S523,在样本预测层46,对上述m个样本表征向量和k项特征表征向量进行处理,得到预测样本。在一个实施例中,样本预测层46直接对输入其中的m个样本表征向量和k个特征表征向量进行处理,得到上述预测样本。在另一个实施例中,如图4所示,异常检测系统中还包括聚合表征层44,其对上述m个样本表征向量和k个特征表征向量进行融合处理,得到融合向量,相应地,样本预测层对融合向量进行处理,得到预测样本。需说明,对聚合表征层44的介绍可以参见对聚合表征层24的介绍,不另作赘述。另一方面,在一个实施例中,上述样本预测层包括多个全连接层,经由多个全连接层的处理可以输出上述预测样本。
在以上得到预测样本后,在步骤S530,基于上述预测样本和第m+1个样本,更新上述异常检测系统。具体,可以基于该预测样本和第m+1个样本确定预测损失,进而利用该预测损失更新异常检测系统。在一个实施例中,可以通过计算该预测样本和第m+1个样本之间的样本距离或相似度,确定预测损失,预测损失与样本距离正相关或与相似度负相关。在一个示例中,可以通过下式(3)计算训练损失,用以更新异常检测系统。
由上,可以实现对异常检测系统400的参数更新。通过基于样本集,多次重复图5中示出的以上方法步骤,可以实现对异常检测系统的多轮迭代更新,直到参数收敛,或者达到预定的迭代次数,从而得到更新完毕、最终用于实使用的异常检测系统。
对于异常检测系统400的使用,其可以用于检测样本序列级别的异常,或者单个样本的异常。在一个实施例中,针对待检测的单个目标样本,获取时间上在前产生的m个样本,形成输入样本序列,并利用异常检测系统对该输入样本序列进行处理,得到预测样本,再比对该预测样本和目标样本,若样本相差大于预定阈值,则判定该目标样本异常,若样本相差小于预定阈值,则判定该目标样本正常。在另一个实施例中,针对待检测的目标样本序列(将其中样本个数记为m+1),将其中前m个样本构成输入样本序列,并利用异常检测系统对该输入样本序列进行处理,得到预测样本,再比对该预测样本和目标样本,若样本相差大于预定阈值,则判定该目标样本序列异常,若样本相差小于预定阈值,则判定该目标样本序列正常。
综上,采用本说明书实施例披露的上述方法可以实现对图4示出的异常检测系统的更新,利用更新后的异常检测系统对包含多维特征的样本序列进行处理,可以得到蕴含丰富表征信息的样本序列表征向量,进而有效提高异常检测结果的准确度。
根据又一种实施方式,对于图1中示出的检测任务层,其可以实现为样本重构层和样本预测层,如图6,其中示出此种实施方式下的异常检测系统600的结构示意图,该异常检测系统600中可以包括输入层61、样本表征层62、特征表征层63、聚合表征层64、样本重构层65和样本预测层66,样本表征层62中可以包括第一编码子层621和第一注意力子层622,特征表征层63中可以包括第二编码子层631和第二注意力子层632。
下面结合具体的实施例,介绍针对异常检测系统600的更新方法。图7示出根据又一个实施例的异常检测系统的更新方法流程图,所述方法用于更新异常检测系统600,所述方法的执行主体可以实现为任何具有计算、处理能力的平台、装置、服务器或设备集群。如图7所示,所述方法包括以下步骤:
步骤S710,获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;上述t个样本形成第一样本序列,上述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1。步骤S720,将上述第一样本序列输入异常检测系统,其中,在步骤S721,在上述样本表征层,确定上述t个样本对应的t个第一样本表征向量;在步骤S722,在上述特征表征层,确定上述k项特征对应的k个第一特征表征向量;在步骤S723,在上述样本重构层,对上述t个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果。步骤S730,将上述第二样本序列输入异常检测系统,其中,在步骤S731,在上述样本表征层确定上述前t-1个样本对应的t-1个第二样本表征向量;在步骤S732,在上述特征表征层,确定上述k项特征对应的k个第二特征表征向量;在步骤S733,在上述样本预测层,对上述t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本。步骤S740,基于上述样本重构结果、上述预测样本和第t个样本,更新上述异常检测系统。
通过执行以上步骤,可以实现基于获取的t个样本,既通过样本重构层65输出样本重构结果,也通过样本预测层66输出预测样本。考虑到在执行针对第t个时段或时刻的样本预测任务时,不能将对应的真值样本,即t个样本中的第t个样本作为输入的一部分,而在执行样本重构任务时,需要将第t个样本作为输入的一部分,因此,可以基于t个样本分别进行两次输入,分别得到样本重构结果和预测样本,并且,对输入层61、样本表征层62、特征表征63、聚合表征层64进行复用。
具体,在步骤S720,将上述t个样本形成的第一样本序列输入异常检测系统,从而得到针对t个样本中若干样本的若干重构样本,对于步骤S730,在一个实施例中,将前t-1个样本和空白样本形成的第二样本序列,输入异常检测系统,从而得到预测样本。其中空白样本中对应k个特征项的特征值均为0或其他预设值,如10-5、10-6等。
在另一个实施例中,输入层61获取前t-1个样本形成的第二样本序列,并利用预设的缺省值(如0或10-5)对对应第t个样本的位置进行特征值填充。
在实际使用过程中,将第一样本序列输入异常检测系统后,样本重构层65和样本预测层66均有输出,此时,可以舍弃样本预测层66的输出,保留样本重构层65输出的样本重构结果;同理,将第一样本序列输入异常检测系统后,样本重构层65和样本预测层66也均有输出,此时,可以舍弃样本重构层65的输出,保留样本预测层66输出的预测样本。
进一步,在步骤S740中,基于上述样本重构结果、上述预测样本和第t个样本,更新上述异常检测系统。在一个实施例中,可以基于样本重构结果确定第一损失项,基于预测样本和第t个样本确定第二损失项,再对第一损失项和第二损失项进行加权求和,得到综合损失,进而基于综合损失,更新上述异常检测系统。需说明,加权求和所使用的权重可以是预先设定的。
此外,对图7中示出的步骤的描述,还可以参见前述对图3和图5中所示出步骤的描述。
由上,可以实现对异常检测系统的参数更新。通过基于样本集,多次重复图5中示出的以上方法步骤,可以实现对异常检测系统的多轮迭代更新,直到参数收敛,或者达到预定的迭代次数,从而得到更新完毕、最终用于实使用的异常检测系统。
对于图6示出的异常检测系统的使用,其可以用于检测样本序列级别的异常,或者单个样本的异常。在一个实施例中,针对待检测的单个目标样本,获取时间上在前产生的t-1个样本,将该t-1个样本形成的第一输入序列输入异常检测系统中,得到预测样本,并且,将该t-1个样本和单个目标样本形成的第二输入序列,输入异常检测系统中,得到样本重构结果,进一步,可以基于该预测样本和单个目标样本之间的差距进行第一打分,基于样本重构结果进行第二打分,然后基于第一打分的分数和第二打分的分数,确定综合评分,假定第一打分与预测样本和目标样本间的差距负相关,第二打分与重构概率正相关或者与原始样本和重构样本的差距负相关,那么,若综合评分大于阈值分数,则目标样本正常,否则异常。
在另一个实施例中,针对待检测的目标样本序列(将其中样本个数记为t),将其中前t-1个样本构成第一输入序列,输入异常检测系统中,得到预测样本,并且,基于该前t-1个样本和单个目标样本形成第二输入序列,输入异常检测系统中,得到样本重构结果,进一步,可以基于该预测样本和单个目标样本之间的差距进行第一打分,基于样本重构结果进行第二打分,然后基于第一打分的分数和第二打分的分数,确定综合评分,假定第一打分与预测样本和目标样本间的差距负相关,第二打分与重构概率正相关或者与原始样本和重构样本的差距负相关,那么,若综合评分大于阈值分数,则目标样本序列正常,否则异常。
综上,采用本说明书实施例披露的上述方法可以实现对图6示出的异常检测系统的更新,利用更新后的异常检测系统对包含多维特征的样本序列进行处理,可以得到蕴含丰富表征信息的样本序列表征向量,并且,异常检测结果综合了样本重构任务和样本预测任务的预测结果,从而实现了异常结果准确度的有效提高。
与上述更新方法相对应地,本说明书实施例还披露更新装置。具体如下:
图8示出根据一个实施例的异常检测系统的更新装置结构图。如图8所示,所述装置800包括:
样本序列获取单元810,配置为获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;样本序列处理单元820,配置为将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,在所述样本表征层,确定所述n个样本对应的n个样本表征向量;在所述特征表征层,确定所述k项特征对应的k个特征表征向量;在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;系统更新单元830,配置为基于所述样本重构结果,更新所述异常检测系统。
在一个实施例中,所述各个样本属于交易样本,所述k项特征包括以下中的至少一项:交易时刻、交易时段、交易金额、交易次数。
在一个实施例中,所述样本表征层包括第一编码子层和第一注意力子层;其中,在所述样本表征层,确定所述n个样本对应的n个样本表征向量,包括:在所述第一编码子层,对所述n个样本分别进行编码,得到n个样本编码向量;在所述第一注意力子层,确定所述各个样本为所述n个样本分配的注意力权重,并利用该注意力权重对所述n个样本编码向量进行加权处理,得到对应样本的样本表征向量。
在一个实施例中,所述特征表征层包括第二编码子层和第二注意力子层;其中,在所述特征表征层,确定所述k项特征对应的k个特征表征向量,包括:在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量;在所述第二注意力子层,确定各项特征为所述k项特征分配的注意力权重,并利用该注意力权重对所述k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
在一个具体的实施例中,所述第二编码子层中包括时序递归网络;其中,在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量,包括:在所述时序递归网络,对各项特征对应n个样本的n个特征值进行处理,得到对应特征的特征编码向量。
在一个实施例中,所述异常检测系统还包括聚合表征层,所述聚合表征层对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量;其中,在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果,包括:所述样本重构层对所述融合向量进行处理,得到所述样本重构结果。
在一个具体的实施例中,所述融合处理包括以下中的至少一种:拼接处理、加和处理、平均处理。
在一个具体的实施例中,在所述聚合表征层,对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量,包括:基于所述n个样本的时序,对所述n个样本表征向量进行第一融合;对所述第一融合的结果和所述k个特征表征向量进行第二融合,得到所述融合向量。
在一个实施例中,样本重构层包括自编码器,所述样本重构结果包括针对第n个样本的重构样本;所述系统更新单元830具体配置为:以减小所述重构样本相较所述第n个样本的偏差为训练目标,更新所述异常检测系统。
在一个实施例中,样本重构层包括变分自编码器,所述样本重构结果包括针对第n个样本的重构样本与该第n个样本相同的概率;所述系统更新单元830具体配置为:以增大所述概率为训练目标,更新所述异常检测系统。
图9示出根据另一个实施例的异常检测系统的更新装置结构图。如图9所示,所述装置900包括:
样本获取单元910,配置为获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;样本序列处理单元920,配置为将所述第二样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本预测层;其中,在所述样本表征层,确定所述m个样本对应的m个样本表征向量;在所述特征表征层,确定所述k项特征对应的k个特征表征向量;在所述样本预测层,对所述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;系统更新单元930,配置为基于所述预测样本和第m+1个样本,更新所述异常检测系统。
图10示出根据又一个实施例的异常检测系统的更新装置结构图,所述异常检测系统包括样本表征层、特征表征层、样本重构层和样本预测层。如图10所示,所述装置1000包括:
样本获取单元1010,配置为获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;所述t个样本形成第一样本序列,所述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1;第一序列处理单元1020,配置为将所述第一样本序列输入异常检测系统,其中,在所述样本表征层,确定t个样本对应的t个第一样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第一特征表征向量;在所述样本重构层,对所述n个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果;第二序列处理单元1030,配置为将所述第二样本序列输入异常检测系统,其中,在所述样本表征层确定所述前t-1个样本对应的t-1个第二样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第二特征表征向量;在所述样本预测层,对所述t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本;系统更新单元1040,配置为基于所述样本重构结果、所述预测样本和第t个样本,更新所述异常检测系统。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3或图5或图7所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3或图5或图7所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (25)
1.一种异常检测系统的更新方法,包括:
获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;
将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,
在所述样本表征层,确定所述n个样本对应的n个样本表征向量;
在所述特征表征层,确定所述k项特征对应的k个特征表征向量;
在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;
基于所述样本重构结果,更新所述异常检测系统。
2.根据权利要求1所述的方法,其中,所述各个样本属于交易样本,所述k项特征包括以下中的至少一项:交易时刻、交易时段、交易金额、交易次数。
3.根据权利要求1所述的方法,其中,所述样本表征层包括第一编码子层和第一注意力子层;其中,在所述样本表征层,确定所述n个样本对应的n个样本表征向量,包括:
在所述第一编码子层,对所述n个样本分别进行编码,得到n个样本编码向量;
在所述第一注意力子层,确定所述各个样本为所述n个样本分配的注意力权重,并利用该注意力权重对所述n个样本编码向量进行加权处理,得到对应样本的样本表征向量。
4.根据权利要求1所述的方法,其中,所述特征表征层包括第二编码子层和第二注意力子层;其中,在所述特征表征层,确定所述k项特征对应的k个特征表征向量,包括:
在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量;
在所述第二注意力子层,确定各项特征为所述k项特征分配的注意力权重,并利用该注意力权重对所述k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
5.根据权利要求4所述的方法,其中,所述第二编码子层中包括时序递归网络;其中,在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量,包括:
在所述时序递归网络,对各项特征对应n个样本的n个特征值进行处理,得到对应特征的特征编码向量。
6.根据权利要求1所述的方法,其中,所述异常检测系统还包括聚合表征层,在所述聚合表征层,对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量;
其中,在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果,包括:
在所述样本重构层,对所述融合向量进行处理,得到所述样本重构结果。
7.根据权利要求6所述的方法,其中,所述融合处理包括以下中的至少一种:拼接处理、加和处理、平均处理。
8.根据权利要求6所述的方法,其中,对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量,包括:
基于所述n个样本的时序,对所述n个样本表征向量进行第一融合;
对所述第一融合的结果和所述k个特征表征向量进行第二融合,得到所述融合向量。
9.根据权利要求1所述的方法,其中,所述样本重构层包括自编码器,所述样本重构结果包括针对第n个样本的重构样本;
其中,基于所述样本重构结果,更新所述异常检测系统,包括:
以减小所述重构样本相较所述第n个样本的偏差为训练目标,更新所述异常检测系统。
10.根据权利要求1所述的方法,其中,所述样本重构层包括变分自编码器,所述样本重构结果包括针对第n个样本的重构样本与该第n个样本相同的概率;
其中,基于所述样本重构结果,更新所述异常检测系统,包括:
以增大所述概率为训练目标,更新所述异常检测系统。
11.一种异常检测系统的更新方法,包括:
获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;
将所述第二样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本预测层;其中,
在所述样本表征层,确定所述m个样本对应的m个样本表征向量;
在所述特征表征层,确定所述k项特征对应的k个特征表征向量;
在所述样本预测层,对所述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;
基于所述预测样本和第m+1个样本,更新所述异常检测系统。
12.根据权利要求11所述的方法,其中,所述各个样本属于交易样本,所述k项特征包括以下中的至少一项:交易时刻、交易时段、交易金额、交易次数。
13.根据权利要求11所述的方法,其中,所述样本表征层包括第一编码子层和第一注意力子层;其中,在所述样本表征层,确定所述m个样本对应的m个样本表征向量,包括:
在所述第一编码子层,对所述m个样本分别进行编码,得到m个样本编码向量;
在所述第一注意力子层,确定所述各个样本为所述m个样本分配的注意力权重,并利用该注意力权重对所述m个样本编码向量进行加权处理,得到对应样本的样本表征向量。
14.根据权利要求11所述的方法,其中,所述特征表征层包括第二编码子层和第二注意力子层;其中,在所述特征表征层,确定所述k项特征对应的k个特征表征向量,包括:
在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量;
在所述第二注意力子层,确定各项特征为所述k项特征分配的注意力权重,并该注意力权重对所述k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
15.一种异常检测系统的更新方法,所述异常检测系统包括样本表征层、特征表征层、样本重构层和样本预测层,所述方法包括:
获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;所述t个样本形成第一样本序列,所述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1;
将所述第一样本序列输入异常检测系统,其中,在所述样本表征层,确定所述t个样本对应的t个第一样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第一特征表征向量;在所述样本重构层,对所述n个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果;
将所述第二样本序列输入异常检测系统,其中,在所述样本表征层,确定所述前t-1个样本对应的t-1个第二样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第二特征表征向量;在所述样本预测层,对该t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本;
基于所述样本重构结果、所述预测样本和第t个样本,更新所述异常检测系统。
16.一种异常检测系统的更新装置,包括:
样本序列获取单元,配置为获取第一样本序列,其中包括按时序排列的n个样本,各个样本包括第一对象对应k项特征的特征值;n和k均为大于1的整数;
样本序列处理单元,配置为将所述第一样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本重构层;其中,
在所述样本表征层,确定所述n个样本对应的n个样本表征向量;
在所述特征表征层,确定所述k项特征对应的k个特征表征向量;
在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果;
系统更新单元,配置为基于所述样本重构结果,更新所述异常检测系统。
17.根据权利要求16所述的装置,其中,所述样本表征层包括第一编码子层和第一注意力子层;其中,在所述样本表征层,确定所述n个样本对应的n个样本表征向量,包括:
在所述第一编码子层,对所述n个样本分别进行编码,得到n个样本编码向量;
在所述第一注意力子层,确定所述各个样本为所述n个样本分配的注意力权重,并利用该注意力权重对所述n个样本编码向量进行加权处理,得到对应样本的样本表征向量。
18.根据权利要求16所述的装置,其中,所述特征表征层包括第二编码子层和第二注意力子层;其中,在所述特征表征层,确定所述k项特征对应的k个特征表征向量,包括:
在所述第二编码子层,针对所述k项特征分别进行编码,得到k个特征编码向量;
在所述第二注意力子层,确定各项特征为所述k项特征分配的注意力权重,并利用该注意力权重对所述k个特征编码向量进行加权处理,得到对应特征的特征表征向量。
19.根据权利要求16所述的装置,其中,所述异常检测系统还包括聚合表征层,在所述聚合表征层,对所述n个样本表征向量和k个特征表征向量进行融合处理,得到所述融合向量;
其中,在所述样本重构层,对所述n个样本表征向量和k个特征表征向量进行处理,得到样本重构结果,包括:
在所述样本重构层,对所述融合向量进行处理,得到所述样本重构结果。
20.根据权利要求16所述的装置,其中,所述样本重构层包括自编码器,所述样本重构结果包括针对第n个样本的重构样本;
所述系统更新单元具体配置为:
以减小所述重构样本相较所述第n个样本的偏差为训练目标,更新所述异常检测系统。
21.根据权利要求16所述的装置,其中,所述样本重构层包括变分自编码器,所述样本重构结果包括针对第n个样本的重构样本与该第n个样本相同的概率;
所述系统更新单元具体配置为:
以增大所述概率为训练目标,更新所述异常检测系统。
22.一种异常检测系统的更新装置,包括:
样本获取单元,配置为获取按时序排列的m+1个样本,其中各个样本包括第二对象对应k项特征的特征值;其中前m个样本形成第二样本序列;m和k均为大于1的整数;
样本序列处理单元,配置为将所述第二样本序列输入异常检测系统,所述异常检测系统包括样本表征层、特征表征层和样本预测层;其中,
在所述样本表征层,确定所述m个样本对应的m个样本表征向量;
在所述特征表征层,确定所述k项特征对应的k个特征表征向量;
在所述样本预测层,对所述m个样本表征向量和k项特征表征向量进行处理,得到预测样本;
系统更新单元,配置为基于所述预测样本和第m+1个样本,更新所述异常检测系统。
23.一种异常检测系统的更新装置,所述异常检测系统包括样本表征层、特征表征层、样本重构层和样本预测层,所述装置包括:
样本获取单元,配置为获取按时序排列的t个样本,其中各个样本包括第一对象对应k项特征的特征值;所述t个样本形成第一样本序列,所述t个样本中前t-1个样本形成第二样本序列;t和k均为整数,且t大于2,k大于1;
第一序列处理单元,配置为将所述第一样本序列输入异常检测系统,其中,在所述样本表征层,确定所述t个样本对应的t个第一样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第一特征表征向量;在所述样本重构层,对所述n个第一样本表征向量和k个第一特征表征向量进行处理,得到样本重构结果;
第二序列处理单元,配置为将所述第二样本序列输入异常检测系统,其中,在所述样本表征层确定所述前t-1个样本对应的t-1个第二样本表征向量;在所述特征表征层,确定所述k项特征对应的k个第二特征表征向量;在所述样本预测层,对所述t-1个第二样本表征向量和k个第二特征表征向量进行处理,得到预测样本;
系统更新单元,配置为基于所述样本重构结果、所述预测样本和第t个样本,更新所述异常检测系统。
24.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-15中任一项的所述的方法。
25.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-15中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110189257.6A CN112988186B (zh) | 2021-02-19 | 2021-02-19 | 异常检测系统的更新方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110189257.6A CN112988186B (zh) | 2021-02-19 | 2021-02-19 | 异常检测系统的更新方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112988186A true CN112988186A (zh) | 2021-06-18 |
CN112988186B CN112988186B (zh) | 2022-07-19 |
Family
ID=76393443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110189257.6A Active CN112988186B (zh) | 2021-02-19 | 2021-02-19 | 异常检测系统的更新方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112988186B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659744A (zh) * | 2019-09-26 | 2020-01-07 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型、评估操作事件的方法及装置 |
US20200076842A1 (en) * | 2018-09-05 | 2020-03-05 | Oracle International Corporation | Malicious activity detection by cross-trace analysis and deep learning |
CN110909046A (zh) * | 2019-12-02 | 2020-03-24 | 上海舵敏智能科技有限公司 | 时间序列的异常检测方法及装置、电子设备、存储介质 |
CN111585997A (zh) * | 2020-04-27 | 2020-08-25 | 国家计算机网络与信息安全管理中心 | 一种基于少量标注数据的网络流量异常检测方法 |
CN111708739A (zh) * | 2020-05-21 | 2020-09-25 | 北京奇艺世纪科技有限公司 | 时序数据的异常检测方法、装置、电子设备及存储介质 |
CN111737584A (zh) * | 2020-07-31 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置 |
CN111814977A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型的方法及装置 |
CN112100387A (zh) * | 2020-11-13 | 2020-12-18 | 支付宝(杭州)信息技术有限公司 | 用于文本分类的神经网络系统的训练方法及装置 |
CN112148955A (zh) * | 2020-10-22 | 2020-12-29 | 南京航空航天大学 | 一种物联网时序数据异常检测方法及系统 |
CN112199950A (zh) * | 2020-10-16 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 用于事件检测的网络训练方法及装置 |
US20210027018A1 (en) * | 2019-07-22 | 2021-01-28 | Advanced New Technologies Co., Ltd. | Generating recommendation information |
-
2021
- 2021-02-19 CN CN202110189257.6A patent/CN112988186B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200076842A1 (en) * | 2018-09-05 | 2020-03-05 | Oracle International Corporation | Malicious activity detection by cross-trace analysis and deep learning |
US20210027018A1 (en) * | 2019-07-22 | 2021-01-28 | Advanced New Technologies Co., Ltd. | Generating recommendation information |
CN110659744A (zh) * | 2019-09-26 | 2020-01-07 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型、评估操作事件的方法及装置 |
CN110909046A (zh) * | 2019-12-02 | 2020-03-24 | 上海舵敏智能科技有限公司 | 时间序列的异常检测方法及装置、电子设备、存储介质 |
CN111585997A (zh) * | 2020-04-27 | 2020-08-25 | 国家计算机网络与信息安全管理中心 | 一种基于少量标注数据的网络流量异常检测方法 |
CN111708739A (zh) * | 2020-05-21 | 2020-09-25 | 北京奇艺世纪科技有限公司 | 时序数据的异常检测方法、装置、电子设备及存储介质 |
CN111737584A (zh) * | 2020-07-31 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 行为预测系统的更新方法及装置 |
CN111814977A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 训练事件预测模型的方法及装置 |
CN112199950A (zh) * | 2020-10-16 | 2021-01-08 | 支付宝(杭州)信息技术有限公司 | 用于事件检测的网络训练方法及装置 |
CN112148955A (zh) * | 2020-10-22 | 2020-12-29 | 南京航空航天大学 | 一种物联网时序数据异常检测方法及系统 |
CN112100387A (zh) * | 2020-11-13 | 2020-12-18 | 支付宝(杭州)信息技术有限公司 | 用于文本分类的神经网络系统的训练方法及装置 |
Non-Patent Citations (1)
Title |
---|
张怀峰等: "面向卫星电源系统的一种新颖异常检测方法", 《宇航学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112988186B (zh) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Magnetic resonance brain classification by a novel binary particle swarm optimization with mutation and time-varying acceleration coefficients | |
Springenberg et al. | Improving deep neural networks with probabilistic maxout units | |
Salehi et al. | Generative adversarial networks (GANs): An overview of theoretical model, evaluation metrics, and recent developments | |
Tomani et al. | Towards trustworthy predictions from deep neural networks with fast adversarial calibration | |
CN111738441B (zh) | 兼顾预测精度和隐私保护的预测模型训练方法及装置 | |
Sun et al. | Deep learning versus conventional methods for missing data imputation: A review and comparative study | |
CN111259264B (zh) | 一种基于生成对抗网络的时序评分预测方法 | |
Chen et al. | Costly features classification using monte carlo tree search | |
CN112115184A (zh) | 时间序列数据的检测方法、装置、计算机设备及存储介质 | |
Wu et al. | AAE-SC: A scRNA-seq clustering framework based on adversarial autoencoder | |
CN115098789A (zh) | 基于神经网络的多维兴趣融合推荐方法、装置及相关设备 | |
Wang et al. | A novel feature attention mechanism for improving the accuracy and robustness of runoff forecasting | |
CN112988186B (zh) | 异常检测系统的更新方法及装置 | |
Jang et al. | Improving classifier confidence using lossy label-invariant transformations | |
CN116595465A (zh) | 基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统 | |
Zhou et al. | A novel neural network for improved in-hospital mortality prediction with irregular and incomplete multivariate data | |
CN115795005A (zh) | 一种融合对比学习去噪优化的会话推荐方法及装置 | |
CN115829110A (zh) | 基于马尔可夫逻辑网预测用户行为的方法及装置 | |
Belharbi et al. | Non-parametric uni-modality constraints for deep ordinal classification | |
Prabhushankar et al. | Stochastic surprisal: An inferential measurement of free energy in neural networks | |
Wang et al. | Joint nonlinear feature selection and continuous values regression network | |
Wang et al. | Compressed sensing using generative models based on fisher information | |
Suresh et al. | Uncertain data analysis with regularized XGBoost | |
Jo et al. | How Much a Model be Trained by Passive Learning Before Active Learning? | |
Zhang et al. | Few-shot activity learning by dual Markov logic networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |