CN113742184B - 构建用户历史行为表示向量、用户行为异常检测方法及装置 - Google Patents
构建用户历史行为表示向量、用户行为异常检测方法及装置 Download PDFInfo
- Publication number
- CN113742184B CN113742184B CN202010509571.3A CN202010509571A CN113742184B CN 113742184 B CN113742184 B CN 113742184B CN 202010509571 A CN202010509571 A CN 202010509571A CN 113742184 B CN113742184 B CN 113742184B
- Authority
- CN
- China
- Prior art keywords
- behavior data
- app
- behavior
- user
- historical behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 259
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000005856 abnormality Effects 0.000 title claims abstract description 13
- 230000000694 effects Effects 0.000 claims abstract description 77
- 239000013604 expression vector Substances 0.000 claims abstract description 52
- 230000002159 abnormal effect Effects 0.000 claims abstract description 28
- 230000006399 behavior Effects 0.000 claims description 522
- 230000015654 memory Effects 0.000 claims description 38
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 125000004122 cyclic group Chemical group 0.000 description 6
- 206010000117 Abnormal behaviour Diseases 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及一种构建用户历史行为表示向量、用户行为异常检测方法及装置,包括:获取用户历史行为数据;将历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与每一组历史行为数据对应的历史行为特征表示向量;根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i历史行为特征表示向量和第i功能特征表示向量,生成与第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建用户历史行为表示向量,由此,可以有效利用用户行为数据实时辨别当前行为是否异常,维护用户个人信息和财产安全。
Description
技术领域
本发明实施例涉及信息安全领域,尤其涉及一种构建用户历史行为表示向量、用户行为异常检测方法及装置。
背景技术
近年来,随着移动互联网的发展,智能设备用户暴增,随之各类APP软件的数量也在快速增长,并且,各类APP软件上几乎都存储着个人信息、个人社交账号、电子银行账户等用户的关键信息,目前,常用的维护用户账号信息安全的技术是通过用户设置的密码进行保护。
但是,如果出现用户的智能设备和账号密码同时遗失并泄漏的情况,智能设备目前无法识别非原用户的异常行为操作,很可能危害到用户的信息安全,造成用户的经济损失。
发明内容
鉴于此,为解决上述智能设备无法识别非原用户的异常操作的问题,本发明实施例提供一种构建用户历史行为表示向量、用户行为异常检测方法及装置。
第一方面,本发明实施例提供一种构建用户历史行为表示向量的方法,包括:
获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;
将所述历史行为数据按照预设方式分为多个历史行为数据分组;
根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;
以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;
根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;
根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
在一个可能的实施例中,所述方法还包括:
对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;
从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;
将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;
将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数。
在一个可能的实施例中,所述方法还包括:
从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;
根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;
根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;
将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
第二方面,本发明实施例提供一种用户行为异常检测方法,包括:
获取用户当前使用的第一APP的第一行为数据;
根据所述第一行为数据,生成第一行为表示向量;
根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;
计算所述第一行为表示向量与所述输出向量之间的余弦相似度;
根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
在一个可能的实施例中,所述方法还包括:
从所述第一行为数据中提取用户第一使用行为特征和所述第一APP功能特征;
根据所述第一使用行为特征和所述第一功能特征,生成所述第一行为表示向量。
在一个可能的实施例中,所述方法还包括:
将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
第三方面,本发明实施例提供一种构建用户历史行为表示向量的装置,包括:
获取模块,用于获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;
所述获取模块,还用于将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;
生成模块,用于根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;
构建模块,用于根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
第四方面,本发明实施例提供一种用户行为异常检测装置,包括:
获取模块,用于获取用户当前使用的第一APP的第一行为数据;
生成模块,用于根据所述第一行为数据,生成第一行为表示向量;
所述生成模块,还用于根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;
计算模块,用于计算所述第一行为表示向量与所述输出向量之间的余弦相似度;
判断模块,用于根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
第五方面,本发明实施例提供一种智能设备包括:处理器和存储器,所述处理器用于执行所述存储器中存储的构建用户历史行为表示向量程序和用户行为异常检测程序,以实现上述第一方面中任一项所述的构建用户历史行为表示向量的方法或上述第二方面中任一项所述的用户行为异常检测方法。
第六方面,本发明实施例提供一种存储介质包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中任一项所述的构建用户历史行为表示向量的方法或上述第二方面中任一项所述的用户行为异常检测方法。
本发明实施例提供的构建用户历史行为表示向量的方案,通过获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数,由此方法,可以实现有效利用用户行为数据实时辨别用户当前行为是否异常,维护用户的个人信息安全和财产安全。
附图说明
图1为本发明实施例提供的一种构建用户历史行为表示向量的方法的流程示意图;
图2为本发明实施例提供的另一种构建用户历史行为表示向量的方法的流程示意图;
图3为本发明实施例提供的一种用户行为异常检测方法的流程示意图;
图4为本发明实施例提供的另一种用户行为异常检测方法的流程示意图;
图5为本发明实施例提供的一种构建用户历史行为表示向量装置的结构示意图;
图6为本发明实施例提供的一种用户行为异常检测装置的结构示意图;
图7为本发明实施例提供的一种智能设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供的一种构建用户历史行为表示向量的方法的流程示意图,如图1所示,该方法具体包括:
S11、获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息。
获取用户在使用APP过程中产生的使用行为数据,包括使用各个APP之间的先后顺序,利用skip-gram模型根据使用APP的规律挖掘出使用APP序列中的个体的特征;和使用APP时,每个APP对应的属性信息,属性信息包括APP的功能类别标签、APP介绍文本和APP开发商等信息。
S12、将所述历史行为数据按照预设方式分为多个历史行为数据分组。
把用户的历史行为按照预设的时间间隔划分为多组短期历史行为,每一组短期历史行为包括多个历史行为数据。
例如,把用户过去30天的行为按照1天的时间间隔,就可以划分为30组短期历史行为,每一天的短期历史行为包括用户当天一整天的行为数据。
S13、根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量。
将用户历史行为划分成的多组短期历史行为数据中的每一组行为数据输入到循环神经模型中,根据循环神经网络模型最终输出的结果作为每一组行为数据对应的短期历史行为特征表示向量。
S14、以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量。
根据预设的方法,从每一组短期历史行为数据中的每一个APP的属性信息中,找到对应的简介文本,对简介文本利用TF-IDF(term frequency –inverse documentfrequency)方法和注意力机制,计算得到所有APP对应的功能特征表示向量。
S15、根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量。
将所有短期历史行为分组得到的对应的历史行为表示向量和功能特征表示向量利用注意力网络,计算得到每一组历史行为数据对应的历史行为表示向量。
S16、根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
使用行为表示学习技术,将所有历史行为数据表示的历史行为表示向量构建成用户历史行为表示向量。
本发明实施例提供的构建用户历史行为表示向量的方案,通过获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数,由此方法,可以实现有效利用用户行为数据实时辨别用户当前行为是否异常,维护用户的个人信息安全和财产安全。
图2为本发明实施例提供的另一种构建用户历史行为表示向量的方法的流程示意图,如图2所示,该方法具体包括:
S21、对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序。
当用户使用APP时,产生一系列的活动行为数据,包括每一个APP的使用行为或不同APP使用的顺序行为等,将这些行为数据转换成向量表示,按照预先设定的规则,将这些行为数据向量排序,组成一个活动行为数据向量序列。
S22、从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据。
从每个APP使用顺序排列成的活动行为数据向量序列中,可以提取第k个APP对应的第k个活动特征向量序列。
进一步地,用户使用第k个APP时产生的活动行为数据就是活动行为向量序列中排序第k位的行为数据向量。
S23、将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果。
将上述提取到的第k个APP对应的第k个活动特征序列输入到对应的循环神经网络中,得到对应一层循环神经网络的输出结果,即为第k个输出结果。
S24、将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数。
将循环神经网络模型的第k个输出结果作为第k+1层的输入,同第k+1个活动序列同时输入到第k+1层神经网络中,得到第k+1个输出结果,直至将倒数第二层神经网络的输出结果同最后一个活动序列同时输入到最后一层的神经网络中,得到最后一层循环神经网络的输出结果,得到对应的这一组历史行为数据对应的历史行为特征表示向量。
其中,设定循环神经网络的层数为对应该组历史行为使用的APP总个数;k为大于或等于1且小于或等于循环神经网络层数的正整数。
S25、从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息。
S26、根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重。
本发明实施例中,首先使用IF-IDF方法提取每个APP对应的APP属性信息,然后从其属性信息中提取该APP对应的文本信息,进而提取该文本信息中的预设数量的关键词在文本中各自对应的权重。
首先需要计算某个词的词频,即某个词在文章中出现的次数与该文章出现的总次数的比值,得到如下公式1:
然后计算逆文档频文,有如下公式2:
进一步地,计算某个词对文档的重要权重,有如下公式3:
TF-IDF(词-文档)=TF*IDF (公式3)
进而对比所有词对其对应文档的权重,得到每个文档权重最大的前N个词。
S27、根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量。
本发明实施例中,根据用户的当日行为情况,构建用户的行为表示图,行为表示图就是用户和APP之间的连线图,通过这个图可以表示当天用户使用APP的统计概率分布。根据每个文档的预设数量的关键词,和各个关键词在文档中的权重,根据注意力机制,计算得到该文档对应的APP的功能特征表示向量。
首先,根据每个APP对应的关键词的向量,计算出APP的各个关键词之间的影响,利用如下公式4:
其中,aij代表当天行为的第i个APP受到第j个APP的影响,wi是用户的APP的各个关键词向量表示,W是注意力参数。计算各个关键词之间的注意力目的是为了利用APP使用功能描述文本中关键词之间的影响力,计算APP的关键词的整体分布的信息,进一步得出APP的功能特征。
其次,计算每个APP的功能特征向量,有如下公式5和如下公式6:
其中,T是指关键词对该APP的功能描述文档的权重大小。
S28、将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
将上述计算得到的所有APP各自对应的功能特征表示向量输入到注意力网络中,得到所有分组的功能特征表示向量。
首先计算第i个APP受到第j个APP的影响aij,其中W是注意力参数有如下公式7:
其次计算各个APP的功能特征表示向量的叠加值有如下公式8:
最后根据以上两个参数,计算得到用户当天行为的功能特征向量Vfunc,得到如下公式9:
本发明实施例提供的构建用户历史行为表示向量的方案,通过获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数,由此方法,可以实现有效利用用户行为数据实时辨别用户当前行为是否异常,维护用户的个人信息安全和财产安全。
图3为本发明实施例提供的一种用户行为异常检测方法的流程示意图,如图3所示,该方法具体包括:
S31、获取用户当前使用的第一APP的第一行为数据。
获取当前用户在当前使用APP过程中产生的第一行为数据,第一行为数据包括:使用行为数据和使用APP时,每个APP对应的属性信息,使用行为数据包括使用各个APP之间的先后顺序,属性信息包括APP的功能类别标签、APP介绍文本和APP开发商等信息。
S32、根据所述第一行为数据,生成第一行为表示向量。
利用skip-gram模型根据当前第一行为数据规律挖掘出对应的特征,生成当前第一行为的表示向量。
S33、根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量。
将当前第一行为的表示向量和用户历史行为表示向量输入到注意力网络中,首先计算出当前第一行为向量和用户历史行为习惯特征表示的注意力权重,进一步地,根据注意力计算结果,获得由当前第一行为向量和用户历史行为特征向量组成的新向量。
S34、计算所述第一行为表示向量与所述输出向量之间的余弦相似度。
S35、根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
计算当前第一行为向量和注意力网络模型输出的新向量的向量余弦相似度,若计算得到的余弦相似度大于或等于预设的阈值(例如0.5),则说明当前用户行为向量可以由原用户历史行为特征向量组成,判定当前用户行为属于正常行为;若计算得到的余弦相似度小于预设的阈值(例如0.5),则说明当前用户行为向量不可以由原用户历史行为特征向量组成,判定当前用户行为属于异常行为。
需要说明的是,对于阈值的设定可根据方案执行过程中的情况进行确定,例如,0.6、0.7,或者0.8,对此,本实施例不作具体限定。
本发明实施例提供的用户异常行为检测的方案,通过获取用户当前使用的第一APP的第一行为数据;根据所述第一行为数据,生成第一行为表示向量;根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;计算所述第一行为表示向量与所述输出向量之间的余弦相似度;根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常,由此方法,可以实现有效利用用户历史行为特征向量实时辨别用户当前行为是否异常,维护用户的个人信息安全和财产安全。
图4为本发明实施例提供的另一种用户行为异常检测方法的流程示意图,如图4所示,该方法具体包括:
S41、获取用户当前使用的第一APP的第一行为数据。
获取当前用户在当前使用APP过程中产生的第一行为数据,第一行为数据包括:使用行为数据和使用APP时,每个APP对应的属性信息,使用行为数据包括使用各个APP之间的先后顺序,属性信息包括APP的功能类别标签、APP介绍文本和APP开发商等信息。
S42、从所述第一行为数据中提取用户第一使用行为特征和所述第一APP功能特征。
利用skip-gram模型根据当前第一行为数据提取出对应的用户第一使用行为特征和第一APP功能特征,第一APP功能特征从属性信息中获取。
S43、根据所述第一使用行为特征和所述第一功能特征,生成所述第一行为表示向量。
本发明实施例中,利用skip-gram模型将第一使用行为特征和所述第一功能特征,生成第一行为表示向量。
首先基于用户使用APP的序列数据,使用skip-gram模型学习单个APP的使用特征向量。
进一步地,将当前用户第一行为中使用的所有APP的使用特征向量综合计算得到第一行为表示向量。
S44、将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
将当前第一行为的表示向量和用户历史行为表示向量输入到注意力网络中,首先计算出当前第一行为向量和用户历史行为习惯特征表示的注意力权重,得到注意力权重的计算公式10:
其中vi是用户的历史app行为序列集合的各个向量表示,vn是用户的当前的app行为序列向量表示,W是注意力网络的参数。
进一步地,根据注意力计算结果,获得由当前第一行为向量和用户历史行为特征向量组成的新向量vp,计算公式如下:
S45、计算所述第一行为表示向量与所述输出向量之间的余弦相似度。
S46、根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
计算当前第一行为向量和注意力网络模型输出的新向量vp的向量余弦相似度,若计算得到的余弦相似度大于或等于预设的阈值(例如0.5),则说明当前用户行为向量可以由原用户历史行为特征向量组成,判定当前用户行为属于正常行为;若计算得到的余弦相似度小于预设的阈值(例如0.5),则说明当前用户行为向量不可以由原用户历史行为特征向量组成,判定当前用户行为属于异常行为。
需要说明的是,对于阈值的设定可根据方案执行过程中的情况进行确定,例如,0.6、0.7,或者0.8,对此,本实施例不作具体限定。
本发明实施例提供的用户异常行为检测的方案,通过获取用户当前使用的第一APP的第一行为数据;根据所述第一行为数据,生成第一行为表示向量;根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;计算所述第一行为表示向量与所述输出向量之间的余弦相似度;根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常,由此方法,可以实现有效利用用户历史行为特征向量实时辨别用户当前行为是否异常,维护用户的个人信息安全和财产安全。
图5为本发明实施例提供的一种构建用户历史行为表示向量装置的结构示意图,具体包括:
获取模块501,用于获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;
所述获取模块501,还用于将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;
生成模块502,用于根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;
构建模块503,用于根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
生成模块,具体用于对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数。
构建模块,具体用于从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
本实施例提供的构建用户历史行为表示向量装置可以是如图5中所示的构建用户历史行为表示向量装置,可执行如图1-2中构建用户历史行为表示向量方法的所有步骤,进而实现图1-2所示构建用户历史行为表示向量方法的技术效果,具体请参照图1-2相关描述,为简洁描述,在此不作赘述。
图6为本发明实施例提供的一种用户行为异常检测装置的结构示意图,具体包括:
获取模块601,用于获取用户当前使用的第一APP的第一行为数据;
生成模块602,用于根据所述第一行为数据,生成第一行为表示向量;
所述生成模块602,还用于根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;
计算模块603,用于计算所述第一行为表示向量与所述输出向量之间的余弦相似度;
判断模块604,用于根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
生成模块,具体用于从所述第一行为数据中提取用户第一使用行为特征和所述第一APP功能特征;根据所述第一使用行为特征和所述第一功能特征,生成所述第一行为表示向量。
在一个可能的实施方式中,所述生成模块,还用于将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
本实施例提供的用户行为异常检测装置可以是如图6中所示的用户行为异常检测装置,可执行如图3-4中用户行为异常检测方法的所有步骤,进而实现图3-4所示用户行为异常检测方法的技术效果,具体请参照图3-4相关描述,为简洁描述,在此不作赘述。
图7为本发明实施例提供的一种智能设备的结构示意图,图7所示的智能设备700包括:至少一个处理器701、存储器702、至少一个网络接口704和其他用户接口703。智能空调700中的各个组件通过总线系统705耦合在一起。可理解,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统705。
其中,用户接口703可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器702可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectrkcallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StatkcRAM,SRAM)、动态随机存取存储器(DynamkcRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlknkDRAM,SLDRAM)和直接内存总线随机存取存储器(DkrectRambusRAM,DRRAM)。本文描述的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器702存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统7021和应用程序7022。
其中,操作系统7021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序7022,包含各种应用程序,例如媒体播放器(MedkaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序7022中。
在本发明实施例中,通过调用存储器702存储的程序或指令,具体的,可以是应用程序7022中存储的程序或指令,处理器701用于执行各方法实施例所提供的方法步骤,例如包括:
获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
在一个可能的实施方式中,对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数。
在一个可能的实施方式中,从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
或,
获取用户当前使用的第一APP的第一行为数据;根据所述第一行为数据,生成第一行为表示向量;根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;计算所述第一行为表示向量与所述输出向量之间的余弦相似度;根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
在一个可能的实施方式中,从所述第一行为数据中提取用户第一使用行为特征和所述第一APP功能特征;根据所述第一使用行为特征和所述第一功能特征,生成所述第一行为表示向量。
在一个可能的实施方式中,将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
上述本发明实施例揭示的方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(DkgktalSkgnalProcessor,DSP)、专用集成电路(ApplkcatkonSpeckfkcKntegratedCkrcukt,ASKC)、现成可编程门阵列(FkeldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplkcatkonSpeckfkcKntegratedCkrcukts,ASKC)、数字信号处理器(DkgktalSkgnalProcesskng,DSP)、数字信号处理设备(DSPDevkce,DSPD)、可编程逻辑设备(ProgrammableLogkcDevkce,PLD)、现场可编程门阵列(Fkeld-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的智能设备可以是如图7中所示的智能设备,可执行如图1-2中构建用户历史行为表示向量的方法或可执行如图3-4中用户行为异常检测方法的所有步骤,进而实现图1-2所示构建用户历史行为表示向量方法或实现图3-4所示用户行为异常检测方法的技术效果,具体请参照图1-2或图3-4相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在智能设备侧执行的构建用户历史行为表示向量的方法或用户行为异常检测方法。
所述处理器用于执行存储器中存储的计算机程序,以实现以下在智能设备侧执行的构建用户历史行为表示向量的方法或用户行为异常检测方法的步骤:
获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数。
在一个可能的实施方式中,对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数。
在一个可能的实施方式中,从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
或,
获取用户当前使用的第一APP的第一行为数据;根据所述第一行为数据,生成第一行为表示向量;根据所述第一行为表示向量,与采用构建用户历史行为表示向量的方法获取的用户历史行为表示向量,生成输出向量;计算所述第一行为表示向量与所述输出向量之间的余弦相似度;根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
在一个可能的实施方式中,从所述第一行为数据中提取用户第一使用行为特征和所述第一APP功能特征;根据所述第一使用行为特征和所述第一功能特征,生成所述第一行为表示向量。
在一个可能的实施方式中,将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种构建用户历史行为表示向量的方法,其特征在于,所述方法包括:
获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;
将所述历史行为数据按照预设方式分为多个历史行为数据分组;
根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;
以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量;
根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;
根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数;
其中,每一组历史行为数据中包括的活动行为数据为用户使用的至少一个APP时生成的活动行为数据;根据第i组历史行为数据中包括的活动行为数据,提取与所述第i组历史行为数据对应的历史行为特征表示向量,包括:
对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;
从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;
将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;
将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数;
每一组历史行为数据中包括的APP属性信息为用户使用的至少一个APP中,每一个APP分别对应的属性信息;根据第i组历史行为数据中包括的APP属性信息提取第i功能特征表示向量,具体包括:
从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;
根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;
根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;
将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
2.一种用户行为异常检测方法,其特征在于,所述方法包括:
获取用户当前使用的第一APP的第一行为数据;
根据所述第一行为数据,生成第一行为表示向量;
根据所述第一行为表示向量,与采用如权利要求1所述方法获取的用户历史行为表示向量,生成输出向量;
计算所述第一行为表示向量与所述输出向量之间的余弦相似度;
根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一行为数据,生成第一行为表示向量,具体包括:
从所述第一行为数据中提取用户第一使用行为特征和第一APP功能特征;
根据所述第一使用行为特征和所述第一APP功能特征,生成所述第一行为表示向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一行为表示向量与预获取的用户历史行为表示向量,获取输出向量,具体包括:
将所述用户历史行为表示向量和所述第一行为表示向量均输入至注意力网络中,输出所述输出向量。
5.一种构建用户历史行为表示向量的装置,其特征在于,包括:
获取模块,用于获取用户历史行为数据,其中,所述历史行为数据包括用户使用APP产生的活动行为数据,以及所使用的APP对应的APP属性信息;
所述获取模块,还用于将所述历史行为数据按照预设方式分为多个历史行为数据分组;根据每一组历史行为数据中包括的活动行为数据,提取与所述每一组历史行为数据对应的历史行为特征表示向量;以及,根据每一组历史行为数据中包括的APP属性信息提取功能特征表示向量,每一组历史行为数据中包括的活动行为数据为用户使用的至少一个APP时生成的活动行为数据,每一组历史行为数据中包括的APP属性信息为用户使用的至少一个APP中,每一个APP分别对应的属性信息;
生成模块,用于根据第i分组中分别提取的第i所述历史行为特征表示向量和第i所述功能特征表示向量,生成与所述第i分组历史行为数据对应的第i历史行为表示向量;
构建模块,用于根据所有历史行为表示向量,构建所述用户历史行为表示向量,其中i为正整数,最大取值为所述历史行为数据的总分组数;
所述生成模块,还用于对从用户使用每一个APP时生成的活动行为数据,按照预设规则进行排序;
从用户使用第k个APP时生成的活动行为数据中提取第k个活动特征序列,其中,所述用户使用第k个APP时生成的活动行为数据即为排序为第k位的行为数据;
将所述第k个活动特征序列输入至第k个神经网络中,获取第k个输出结果;
将所述第k个输出结果和第k+1个活动序列输入至第k+1个神经网络中,获取第k+1个输出结果;直至将第n-1个输出结果和第n个活动序列输入至第n个神经网络中,得到第n个输出结果,作为所述第i组历史行为数据对应的历史行为特征表示向量,其中,n为所述第i组分组数据中用户使用的APP的总个数;k为大于或者等于1,小于或者等于n的正整数;
所述生成模块,还用于从第h个APP对应的APP属性信息中提取与所述第h个APP对应的第h个文本信息;
根据所述第h个文本信息,确定预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重;
根据所述预设数量的文本关键词,以及每一个文本关键词在所述第h个文本信息中的权重,确定所述第h个APP的功能特征表示向量;
将所有APP分别对应的功能特征表示向量输入至注意力网络中,获取所述第i功能特征表示向量,其中,k为大于或者等于1,小于或者等于第i组中APP的总个数的正整数。
6.一种用户行为异常检测装置,其特征在于,包括:
获取模块,用于获取用户当前使用的第一APP的第一行为数据;
生成模块,用于根据所述第一行为数据,生成第一行为表示向量;
所述生成模块,还用于根据所述第一行为表示向量,与采用如权利要求1所述方法获取的用户历史行为表示向量,生成输出向量;
计算模块,用于计算所述第一行为表示向量与所述输出向量之间的余弦相似度;
判断模块,用于根据所述余弦相似度确定所述第一行为向量对应的第一行为是否存在异常。
7.一种智能设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的构建用户历史行为表示向量程序和用户行为异常检测程序,以实现权利要求1所述的构建用户历史行为表示向量的方法或权利要求2~4中任一项所述的用户行为异常检测方法。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1所述的构建用户历史行为表示向量的方法或权利要求2~4中任一项所述的用户行为异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010509571.3A CN113742184B (zh) | 2020-06-05 | 2020-06-05 | 构建用户历史行为表示向量、用户行为异常检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010509571.3A CN113742184B (zh) | 2020-06-05 | 2020-06-05 | 构建用户历史行为表示向量、用户行为异常检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113742184A CN113742184A (zh) | 2021-12-03 |
CN113742184B true CN113742184B (zh) | 2024-03-26 |
Family
ID=78727936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010509571.3A Active CN113742184B (zh) | 2020-06-05 | 2020-06-05 | 构建用户历史行为表示向量、用户行为异常检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113742184B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729474A (zh) * | 2014-01-23 | 2014-04-16 | 中国科学院计算技术研究所 | 用于识别论坛用户马甲账号的方法和系统 |
CN104392174A (zh) * | 2014-10-23 | 2015-03-04 | 腾讯科技(深圳)有限公司 | 应用程序动态行为的特征向量的生成方法及装置 |
CN105843947A (zh) * | 2016-04-08 | 2016-08-10 | 华南师范大学 | 基于大数据关联规则挖掘的异常行为检测方法和系统 |
CN107754212A (zh) * | 2016-08-16 | 2018-03-06 | 上海掌门科技有限公司 | 跑步运动设备及其虚拟现实交互方法 |
CN108536572A (zh) * | 2018-04-16 | 2018-09-14 | 浙江大学 | 基于AppUsage2Vec模型的智能手机App使用预测方法 |
CN108920921A (zh) * | 2018-05-24 | 2018-11-30 | 西北工业大学 | 一种针对智能手机敏感app的可持续身份认证方法 |
CN109842628A (zh) * | 2018-12-13 | 2019-06-04 | 成都亚信网络安全产业技术研究院有限公司 | 一种异常行为检测方法及装置 |
CN110347724A (zh) * | 2019-07-12 | 2019-10-18 | 深圳众赢维融科技有限公司 | 异常行为识别方法、装置、电子设备及介质 |
CN110659742A (zh) * | 2019-09-10 | 2020-01-07 | 阿里巴巴集团控股有限公司 | 获取用户行为序列的序列表示向量的方法和装置 |
CN110751557A (zh) * | 2019-10-10 | 2020-02-04 | 中国建设银行股份有限公司 | 一种基于序列模型的异常资金交易行为分析方法及系统 |
CN110796542A (zh) * | 2019-09-26 | 2020-02-14 | 北京淇瑀信息科技有限公司 | 金融风险控制方法、金融风险控制装置和电子设备 |
CN110827138A (zh) * | 2019-10-31 | 2020-02-21 | 北京芯盾时代科技有限公司 | 一种推送信息确定方法及装置 |
CN111143178A (zh) * | 2019-12-12 | 2020-05-12 | 支付宝(杭州)信息技术有限公司 | 用户行为分析方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9684775B2 (en) * | 2014-10-15 | 2017-06-20 | Qualcomm Incorporated | Methods and systems for using behavioral analysis towards efficient continuous authentication |
-
2020
- 2020-06-05 CN CN202010509571.3A patent/CN113742184B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729474A (zh) * | 2014-01-23 | 2014-04-16 | 中国科学院计算技术研究所 | 用于识别论坛用户马甲账号的方法和系统 |
CN104392174A (zh) * | 2014-10-23 | 2015-03-04 | 腾讯科技(深圳)有限公司 | 应用程序动态行为的特征向量的生成方法及装置 |
CN105843947A (zh) * | 2016-04-08 | 2016-08-10 | 华南师范大学 | 基于大数据关联规则挖掘的异常行为检测方法和系统 |
CN107754212A (zh) * | 2016-08-16 | 2018-03-06 | 上海掌门科技有限公司 | 跑步运动设备及其虚拟现实交互方法 |
CN108536572A (zh) * | 2018-04-16 | 2018-09-14 | 浙江大学 | 基于AppUsage2Vec模型的智能手机App使用预测方法 |
CN108920921A (zh) * | 2018-05-24 | 2018-11-30 | 西北工业大学 | 一种针对智能手机敏感app的可持续身份认证方法 |
CN109842628A (zh) * | 2018-12-13 | 2019-06-04 | 成都亚信网络安全产业技术研究院有限公司 | 一种异常行为检测方法及装置 |
CN110347724A (zh) * | 2019-07-12 | 2019-10-18 | 深圳众赢维融科技有限公司 | 异常行为识别方法、装置、电子设备及介质 |
CN110659742A (zh) * | 2019-09-10 | 2020-01-07 | 阿里巴巴集团控股有限公司 | 获取用户行为序列的序列表示向量的方法和装置 |
CN110796542A (zh) * | 2019-09-26 | 2020-02-14 | 北京淇瑀信息科技有限公司 | 金融风险控制方法、金融风险控制装置和电子设备 |
CN110751557A (zh) * | 2019-10-10 | 2020-02-04 | 中国建设银行股份有限公司 | 一种基于序列模型的异常资金交易行为分析方法及系统 |
CN110827138A (zh) * | 2019-10-31 | 2020-02-21 | 北京芯盾时代科技有限公司 | 一种推送信息确定方法及装置 |
CN111143178A (zh) * | 2019-12-12 | 2020-05-12 | 支付宝(杭州)信息技术有限公司 | 用户行为分析方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
基于APP使用历史主题分析的个性化推荐算法;赵海燕;张健;曹健;;电子科技;第30卷(第10期);123-126+130 * |
Also Published As
Publication number | Publication date |
---|---|
CN113742184A (zh) | 2021-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230229978A1 (en) | Debugging correctness issues in training machine learning models | |
US10609050B2 (en) | Methods and systems for malware detection | |
US11586860B2 (en) | Method for preventing the extraction of a machine learning model | |
CN113886885A (zh) | 数据脱敏方法、数据脱敏装置、设备及存储介质 | |
CN110730164B (zh) | 安全预警方法及相关设备、计算机可读存储介质 | |
CN112231224A (zh) | 基于人工智能的业务系统测试方法、装置、设备和介质 | |
WO2017132545A1 (en) | Systems and methods for generative learning | |
CN110750750A (zh) | 网页生成方法、装置、计算机设备和存储介质 | |
CN116629435A (zh) | 风险预测方法、装置、计算机设备和存储介质 | |
Cui et al. | Partial self-exciting point processes and their parameter estimations | |
Mohammadi et al. | Anomaly-based Web Attack Detection: The Application of Deep Neural Network Seq2Seq With Attention Mechanism. | |
Qi et al. | Fault detection and localization in distributed systems using recurrent convolutional neural networks | |
CN113742184B (zh) | 构建用户历史行为表示向量、用户行为异常检测方法及装置 | |
Nouioua et al. | Predictability in probabilistic discrete event systems | |
Goyal et al. | IMNRFixer: A hybrid approach to alleviate class‐imbalance problem for predicting the fixability of Non‐Reproducible bugs | |
CN116089605A (zh) | 基于迁移学习和改进词袋模型的文本情感分析方法 | |
CN113177110B (zh) | 一种虚假新闻检测方法、装置、计算机设备和存储介质 | |
CN109308295A (zh) | 一种面向数据发布的隐私暴露实时监测方法 | |
WO2022070105A1 (en) | Systems and methods for enforcing constraints to predictions | |
Reddy et al. | Detection of injections in API requests using recurrent neural networks and transformers | |
CN113742665B (zh) | 用户身份识别模型构建、用户身份验证方法及装置 | |
US20220101036A1 (en) | Systems and methods for enforcing constraints in character recognition | |
Guan et al. | A high performance fraud detection strategy prediction model | |
CN114238557A (zh) | 文本数据增强方法、装置、计算机设备和存储介质 | |
US20240070534A1 (en) | Individualized classification thresholds for machine learning models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |