CN115719506A

CN115719506A - 行为识别方法、装置、计算机设备和计算机可读存储介质

Info

Publication number: CN115719506A
Application number: CN202110967312.XA
Authority: CN
Inventors: 刘志煌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-08-23
Filing date: 2021-08-23
Publication date: 2023-02-28

Abstract

本申请实施例公开了一种行为识别方法、装置、计算机设备和计算机可读存储介质，通过获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，每个对象对应的对象特征信息和策略行为信息；针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到每个对象对应的频繁行为信息；基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类得到目标聚类结果；根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；将目标对象簇包含的待预测对象确定为使用辅助程序的对象。该方案可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用不同的应用场景，灵活度高。

Description

行为识别方法、装置、计算机设备和计算机可读存储介质

技术领域

本申请涉及通信技术领域，具体涉及一种行为识别方法、装置、计算机设备和计算机可读存储介质。

背景技术

在游戏应用或者线上竞赛，例如国际象棋竞赛的场景中，存在有些用户为了取得胜利，在游戏过程中或者竞赛过程中使用辅助程序(也可以称为外挂程序)，使用外挂程序的行为称为外挂行为。外挂行为严重影响了游戏的公平性，识别外挂行为对于游戏应用等场景的十分重要。可以通过人工设定外挂规则判定用户是否使用了外挂程序，人工设定外挂规则需要相关领域的专家预先根据场景中可能存在外挂行为进行列举及总结，确定外挂规则，外挂规则只能针对于某一应用场景，灵活性低；用户使用的外挂程序多种多样，需要不断根据用户使用的外挂程序及时更新外挂规则，应用成本高。

发明内容

本申请实施例提供一种行为识别方法，通过将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用于不同的应用场景，灵活度高。

本申请实施例提供的一种行为识别方法，包括：

获取对象集合，所述对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；

针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到所述对象对应的频繁行为信息；

基于所述对象特征信息以及所述频繁行为信息，将所述对象集合中的对象进行聚类，得到目标聚类结果；

根据所述使用辅助程序的对象样本在所述目标聚类结果的每一对象簇的分布占比，确定目标对象簇；

将所述目标对象簇包含的待预测对象确定为使用辅助程序的对象。

相应的，本申请实施例还提供的一种行为识别装置，包括：

获取单元，用于获取对象集合，所述对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；

挖掘单元，用于针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到所述对象对应的频繁行为信息；

聚类单元，用于基于所述对象特征信息以及所述频繁行为信息，将所述对象集合中的对象进行聚类，得到目标聚类结果；

第一确定单元，用于根据所述使用辅助程序的对象样本在所述目标聚类结果的每一对象簇的分布占比，确定目标对象簇；

第二确定单元，用于将所述目标对象簇包含的待预测对象确定为使用辅助程序的对象。

相应的，本申请实施例还提供的一种计算机设备，包括存储器和处理器；所述存储器存储有计算机程序，所述处理器用于运行所述存储器内的计算机程序，以执行本申请实施例提供的任一种行为识别方法。

相应的，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序被处理器加载以执行本申请实施例提供的任一种行为识别方法。

由上可知，本申请实施例通过获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到每个对象对应的频繁行为信息；基于对象特征信息以及频繁行为信息，对象集合的对象进行聚类，得到目标聚类结果；根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；将目标对象簇包含的待预测对象确定为使用辅助程序的对象。该方案通过对对象的策略行为信息进行挖掘处理，可以得到对象的频繁行为信息，频繁行为信息可以反映对象的行为特征，根据频繁行为信息进行聚类，可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用于不同的应用场景，灵活度高。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的行为识别方法的场景图；

图2是本申请实施例提供的行为识别方法的流程图；

图3是本申请实施例提供的行为识别方法的模型示意图；

图4是本申请实施例提供的行为识别方法的另一流程图；

图5是本申请实施例提供的行为识别装置示意图；

图6是本申请实施例提供的计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种行为识别方法、装置、计算机设备和计算机可读存储介质。该行为识别装置可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备。

其中，该终端可以包括手机、穿戴式智能设备、平板电脑、笔记本电脑、个人计算(PC，Personal Computer)、以及车载计算机等。

其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

例如，如图1所示，计算机设备可以获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息，和在历史竞赛中的策略行为信息；针对每个策略行为信息进行隐含行为信息挖掘处理，得到策略行为信息对应的频繁行为信息；基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到多个聚类结果，根据多个聚类结果确定目标聚类结果；根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；目标对象簇中的待预测对象即被确定为使用辅助程序的对象。该方案通过对对象的策略行为信息进行挖掘处理，可以得到对象的频繁行为信息，频繁行为信息可以反映对象的行为特征，根据频繁行为信息进行聚类，可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象是否使用了辅助程序，该方案可以适用于不同的应用场景，灵活度高。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从行为识别装置的角度进行描述，该行为识别装置具体可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备，如图2所示，该行为识别方法的流程如下；

101、获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息。

其中，对象集合可以是包含多个对象以及对象对应的信息的集合，比如可以包括使用辅助程序的对象样本，以及待预测对象，对象可以是游戏场景或者是竞赛场景中的一个虚拟对象，每个对象可以对应于一个对象标识，例如可以是游戏账号，以及一些属性信息，例如账号id、头像以及年龄等。

其中，辅助程序也可以成为外挂程序，一般指通过修改游戏或者是线上竞赛数据而为用户谋取利益的作弊程序或软件，即利用电脑技术针对一个或多个软件进行非原设操作，篡改游戏或者是线上竞赛数据原本正常的设定和规则，大幅增强对象在游戏过程或者竞赛过程具有技能和超越常规的能力，从而达到轻松获取胜利、奖励和快感的好处，通过改变软件的部分程序制作而成的作弊程序。

其中，使用辅助程序的对象样本可以是已知使用外挂程序的对象，待预测对象可以是需要进行识别，判断使用外挂程序的对象。

其中，对象特征信息可以是对象的属性信息，用于表征对象特点的信息，例如，对象的年龄、对象在应用场景下的等级(例如若该对象为某游戏的玩家，则可以是游戏等级；若该对象对应为某线上竞赛的选手，则可以是该对象的段位等)、对象在应用场景下的历史分数、性别、所在地、性格、星座、习惯使用的路数(例如，在游戏场景下，对象常用的游戏招数等)以及胜负率等。

其中，策略行为信息可以通过策略标识的行为信息，行为信息可以是包含对象在一场比赛中的全部或者部分行为的行为序列，比如，在国际象棋中，开局策略有意大利开局、双马防御、匈牙利防御、西班牙开局、西西里防御等，战术策略有闪将、双将、捉双、牵制、以及引离等，将每个开局策略以及每个战术策略用一个标识进行标记，符合该策略的行为则用该策略对应的标识，具体地，行为信息可以是agjief，将每个行为映射至对应的策略，可以得到A₁A₂A₃A₁A₂A₂，其中A₁、A₂和A₃不同策略对应的标识。

比如，具体可以是从数据库或者内存中获取对象集合，可选的，若对象集合存储在区块链中，则可以从区块链获取对象集合。

在一实施例中，可以在接收到识别请求时，例如，有游戏用户在通过游戏用户界面举报某个游戏的虚拟对象使用辅助程序，则可以获取被举报的对象对应的对象特征信息，以及在历史游戏比赛中的策略行为信息，以及获取对象样本的对应的对象特征信息，以及策略行为信息，得到对象集合。

可选的，还可以是定期获取被举报对象对应的对象特征信息，以及在历史游戏比赛中的策略行为信息，以及获取对象样本的对应的对象特征信息，以及策略行为信息，得到对象集合。

在一实施例中，策略行为信息可以是通过与已知策略的参考行为信息之间相似度，确定行为信息对应的策略，利用该策略对行为信息进行标识，得到策略行为信息，即步骤“获取对象集合”之前，具体可以是：

获取初始对象集合，以及获取策略行为信息集合，初始对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的初始对象信息和行为信息，策略行为信息集合包括至少一个已知策略的参考行为信息；

对初始对象信息进行预处理，得到对象特征信息；

根据行为信息与策略行为信息集合中每个已知策略的参考行为信息之间的相似度，确定行为信息的策略，以得到行为信息对应的策略行为信息；

基于对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息，得到对象集合。

其中，初始对象信息可以是为对对象信息进行筛选等预处理的信息，可能存在异常值以及缺失值等情况。

其中，行为信息可以是包含对象在一场比赛中的全部或者部分行为的行为序列。

由于，获取的初始对象集合中可能存在部分用户没有完善个人资料，以及随意填写与本人信息严重不符的个人资料，或者是在获取对象集合过程中部分数据丢失，导致获取的初始对象集合中的初始对象信息不完整和不正确，若不对初始对象信息进行处理，会影响后续聚类时将相似的对象聚集到一个对象簇中。

对初始对象信息进行预处理具体可以是，初始对象信息中可以包括每个对象的多个特征对应的特征数据，比如，年龄、性别、所在地、以及星座等，若特征数据丢失的数量超过阈值，则舍弃该特征，阈值可以根据具体应用场景进行灵活设置。

可选的，还可以对初始对象信息中的单值特征进行删除处理，其中，单值特征可以初始对象信息中所有对象在该特征上的特征数据值一致的特征，由于所有对象在该特征上的特征数据一致，无法表征对象与其他对象的之间区别，因此，可以对该单值特征进行删除，减少数据处理量，以及使对象特征信息能够更准确地表征对象。

可选的，还可以对初始对象信息中的异常值进行处理，例如，具体可以是将每个特征包含的特征数据进行排序，将特征数据的数值满足条件的特征数据进行过滤，该条件可以是排在前0.01％，即舍弃数值排序在前0.01％的特征数据。

可选的，对特征进行舍弃，以及对部分特征数据进行过滤之后，还存在部分特征中的特征数据缺失，可以对缺失的特征数据进行填充，使每个特征中的特征数据完整，比如，具体可以是针对特征数据为连续型的特征，利用该特征的特征数据的平均值对缺失的特征数据进行填充，针对特征数据为离散型的特征，利用常数进行填充。

可选的，还可以将初始对象信息中的特征进行变换或者组合，生成新的具有含义，且更具信息价值的特征，例如，具体可以是通过特征变换、特征平方、以及特征加减进行特征组合和特征衍生。

可选的，还可以对特征进行编码，例如对连续型特征进行分箱离散化、离散型特征进行独热(one-hot)编码。

针对行为信息，可以根据其与策略行为信息集合中每个已知策略的参考行为信息之间的相似度，确定行为信息对应的策略，例如，将相似度最高的参考行为信息的策略确定为行为信息对应的策略，将行为信息通过对应的策略的标识进行表示，例如，具体地，行为信息可以是agjief，其中的行为ahj符合策略A₁的共性特征信息，所以行为ahj可以用A₁表示，行为ef符合策略A₃的共性特征信息，所以行为ahj可以用A₃表示，行为i不符合策略共性信息集合中的任何一个策略的共性特征信息，行为i可以单独表示，例如记为1，行为信息agjief对应的策略行为信息为A₁1 A₃。

其中，行为信息与参考行为信息之间相似度可以通过其对应的特征信息进行计算，特征信息可以通过神经网络模型进行提取，即步骤“根据所述行为信息与所述策略行为信息集合中每个已知策略的参考行为信息之间的相似度”，具体可以包括：

通过训练后特征提取模型对行为信息进行行为特征提取，得到行为信息的特征信息；

通过训练后特征提取模型对策略行为信息集合中每个参考行为信息进行行为特征提取，得到参考行为信息的参考特征信息；

根据特征信息和每个参考特征信息之间的相似度，确定特征信息对应的策略，以得到特征信息的策略特征信息。

其中，特征提取可以是对行为信息或者参考行为信息进行分析和变换，以提取行为信息或者参考行为信息特征性的信息的过程，特征信息和参考特征信息可以是通过特征提取得到的信息。

在一实施例中，可以通过对初始特征提取模型进行训练，得到训练后特征提取模型，即步骤“通过训练后特征提取模型对行为信息进行行为特征提取，得到行为信息的特征信息”之前，具体可以包括：

获取行为信息样本以及策略集合；

通过初始特征提取模型对行为信息样本进行行为特征提取，得到行为信息样本的样本特征信息；

针对策略集合中的每个策略，基于样本特征信息预测行为信息样本为该策略的概率；

基于行为信息样本的策略标签以及概率，对初始特征提取模型进行训练，得到训练后特征提取模型。

其中，行为信息样本可以是初始特征提取模型的训练样本，行为信息样本携带策略标签。

其中，策略集合可以是包括多个策略的集合，其中每个策略可以相当于一个分类类别。

比如，具体可以是通过初始特征提取模型对行为信息样本进行特征提取，得到样本特征信息，通过归一化函数(softmax)或者是additive margin Softmax(AM-Softmax)函数根据样本特征信息预测行为信息样本为策略集合中每个策略的概率。

利用函数对应的损失函数，根据行为信息样本与每个策略之间的概率以及其样本标签计算损失，并通过计算得到的损失进行反向传播，对初始特征提取模型进行训练，调整初始特征提取模型的模型参数，以使得模型提取的特征更加准确，更能反应行为信息的特征，直到满足预设训练完成条件，得到训练后特征提取模型。

在一实施例中，如图3所示，初始特征提取模型可以包括BI-LSTM模型和AM-Softmax分类模型，通过初始特征模型对行为信息样本进行embeddeding或者one-hot编码等特征嵌入处理，得到行为信息样本的嵌入特征信息x，x＝[x0，x1，x2，x3]，将嵌入特征信息作为BI-LSTM模型的输入，经过BI-LSTM模型对嵌入特征信息进行编码并进行特征融合处理后得到输出y，y＝Bi-LSTM(x)。基于输出y，通过AM-Softmax分类模型预测该行为信息样本为策略集合中每个策略的概率，p＝am-softmax(yW)，W为对应的策略集合，即W＝(c₁,c₂,…,c_n)，即p＝am-softmax(<y,c₁>,<y,c₂>,...,<y,c_n>)。

根据行为信息样本的策略标签以及行为信息样本为策略集合中每个策略的概率计算损失：

其中，θ_i代表y与c_i的夹角，s可取30，m可取0.35。t表示行为信息样本的策略标签。

通过最小化该损失对初始特征提取模型进行训练，以得到训练后特征提取模型。

可选的，在应用时，可以基于训练后特征提取模型可以只包括训练后的BI-LSTM模型，不包括分类模型，通过BI-LSTM模型对初始对象集合中的行为信息以及参考行为信息进行行为特征提取，得到特征信息和参考特征信息，根据特征信息和每个参考特征信息的相似度，将相似度最大的参考特征信息对应的策略确定为行为信息的策略，根据行为信息对应的策略得到对象的策略特征信息。

102、针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息。

其中，频繁行为信息可以是基于策略行为信息挖掘得到的行为信息，表示执行该策略行为信息的对象也可能执行的行为信息。

比如，具体可以是根据每个对象的策略行为信息中每个行为的出现次数，比如将出现次数满足阈值的行为合并得到频繁行为序列。

可选的，还可以逐步挖掘频繁行为信息，提高频繁行为信息的准确性，即步骤“针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息”，具体可以是：

基于预设支持度确定策略行为信息的当前前缀信息，当前前缀信息为策略行为信息中的第一信息；

基于前缀信息挖掘对应的后缀信息，后缀信息为策略行为信息中的第二信息，第二信息与第一信息为策略行为信息中不重合的信息；

将后缀信息中满足预设支持度的子行为信息，与当前前缀信息合并，得到目标前缀信息；

基于当前前缀信息和目标前缀信息，确定每个对象对应的频繁行为信息。

其中，预设支持度可以是子行为信息的出现次数，例如，对象的一共有四个策略行为信息，预设支持度为0.5，则至少在两个策略行为信息中出现的子行为信息为满足预设支持度的子行为信息。

其中，子行为信息可以是策略行为信息中的行为，例如，行为信息为agjief，则a、g、j、i、e、以及f均为该行为信息的子行为信息。

比如，以策略行为信息包括agjief、gefaei、gbefi、bjigec四个行为序列，预设支持度为0.5为例进行说明。从长度为1的前缀信息(称为一项前缀)开始查找，将策略行为信息中满足预设支持度的子行为信息确定为当前前缀信息，在至少两个行为序列出现的子行为信息有：a、b、e、f、g以及i，将a、b、e、f、g以及i确定为当前前缀信息，每个当前前缀信息对应的后缀信息如下所示：

一项前缀	后缀信息
		a	gjief、ei
b	efi、jigec
		e	f、i、fi、c
f	aei、i
		g	jief、efaei、befi、ec
i	ef、gec

针对长度为1的当前前缀信息挖掘完成后，挖掘长度为2的前缀信息对应的后缀信息。以一项前缀信息g为例进行说明：g对应的后缀信息中满足预设支持度的子行为信息有e、f、以及i；将满足预设支持度的子行为信息和当前前缀信息进行合并，得到目标前缀信息，ge、gf、以及gi，将当前前缀a、b、e、f、g以及i，和目标前缀信息ge、gf、以及gi，作为该对象的频繁行为信息。

可选的，还可以不断对策略行为信息进行挖掘，直到当前前缀信息没有对应的后缀信息为止，即步骤“基于当前前缀信息和目标前缀信息，确定每个对象对应的频繁行为信息”，具体可以包括：

将目标前缀信息作为当前前缀信息，返回执行基于前缀信息挖掘对应的后缀信息，将后缀信息中满足预设支持度的子行为信息，与当前前缀信息合并，得到目标前缀信息，直到当前前缀信息没有对应的后缀信息；

根据得到的每个当前前缀信息，确定每个对象对应的频繁行为信息。

比如，以一项前缀信息g为例进行说明，将其对应的目标前缀信息作为当前前缀信息，继续挖掘长度为2的当前前缀信息的后缀信息，每个当前前缀信息对应的后缀信息如下所示：

二项前缀	后缀信息
		ge	f、i、fi
gf	aei、i
		gi	ef

针对二项前缀ge，满足预设支持度的子行为信息有f和i，将f和i分别与ge合并，得到目标前缀信息gef和fei。

将目标前缀信息gef和fei作为当前前缀信息，继续挖掘三项前缀对应的后缀信息。每个三项前缀对应的后缀信息如下：

三项前缀	后缀信息
		gef	i
gei

三项前缀对应的后缀信息中没有满足预设支持度的子行为信息，因此，结束挖掘频繁行为信息。将得到的每个当前前缀信息，一项前缀：a、b、e、f、g、以及i；二项前缀：ge、gf、以及gi；三项前缀：gef和fei作为频繁序列信息。

可选的，还可以基于prefixspan算法，针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息。

103、基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果。

其中，聚类可以是按照某个特定标准(如距离)把一个对象集合分割成不同的对象类或对象簇，使得同一个对象簇内的对象的相似性尽可能大，同时不在同一个对象簇中的对象的差异性也尽可能地大。

比如，具体可以是利用Kmeans聚类算法、DBSCAN聚类算法或者其他聚类算法基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果。

可选的，可以分别利用多个聚类算法，得到多个聚类结果，对多个聚类结果进行集成，得到目标聚类结果。比如有五个对象a、b、c、d、和e，得到三个聚类结果，聚类结果如下：

	a	b	c	d	e
						聚类结果1	1	1	2	2	2
聚类结果2	2	2	1	1	1
						聚类结果3	1	3	2	2	2

聚类结果1和聚类结果2将对象a和对象b分为一类，对象c、对象d、和对象e分为一类，聚类结果3将对象a分为一类，对象b分为1类，对象c、对象d、和对象e分为一类，由于更多聚类结果将对象a和对象b分为一类，对象c、对象d、和对象e分为一类，因此，目标聚类结果为对象a和对象b为一类，对象c、对象d、和对象e为一类。

可选的，还可以针对不同的特征进行聚类，例如，针对对象特征信息中的多个特征信息进行聚类，以及针对频繁行为信息中的多个特征信息进行聚类，得到多个聚类结果，在根据多个聚类结果进行集成，得到目标聚类结果，即步骤“基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果”，具体可以是：

基于对象特征信息将对象样本中的对象进行聚类，得到第一聚类结果；

基于频繁行为信息将对象样本中的对象进行聚类，得到第二聚类结果；

根据第一聚类结果和第二聚类结果确定目标聚类结果。

比如，具体可以是第一聚类结果可以包括对象特征信息中每个特征信息的聚类结果，第二聚类结果可以包括频繁行为信息中每个特征信息的聚类结果，将第一聚类结果和第二聚类结果进行集成，得到目标聚类结果。将第一聚类结果和第二聚类结果进行集成可以参考上述对基于多个聚类算法得到的多个聚类结果进行集成的过程，在此不做赘述。

104、根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇。

比如，具体可以是目标结果中的每一类为一个对象簇，每个对象簇可能包含待预测对象和使用辅助程序的对象样本，根据对象样本在每个对象簇中的占比，将对象样本占比满足条件的对象簇确定为目标对象簇，其中，条件可以是占比最高或者占比超过一定阈值。

105、将目标对象簇包含的待预测对象确定为使用辅助程序的对象。

比如，具体可以是由于同一个对象簇内的对象的相似性大，因此将目标对象簇中包含的待预测对象确定为使用辅助程序的对象。

由上可知，本申请实施例通过获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到每个对象对应的频繁行为信息；基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果；根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；将目标对象簇包含的待预测对象确定为使用辅助程序的对象。该方案通过对对象的策略行为信息进行挖掘处理，可以得到对象的频繁行为信息，频繁行为信息可以反映对象的行为特征，根据频繁行为信息进行聚类，可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用于不同的应用场景，灵活度高。

在上述实施例的基础上，下面将举例做进一步详细说明。

本实施例将从行为识别装置的角度进行描述，该行为识别装置具体可以集成在计算机设备中，该计算机设备可以是服务器。

本申请实施例提供的一种行为识别方法，如图4所示，该行为识别方法的具体流程可以如下：

201、服务器获取行为信息样本和策略集合，对初始特征提取模型进行训练，得到训练后特征提取模型。

比如，具体可以是通过one-hot编码或者是embeddeding对行为信息样本进行特征嵌入，得到行为信息样本的嵌入向量，将嵌入向量作为初始特征提取模型的输入特征，初始特征提取模型对行为信息样本的特征向量进行特征提取，得到样本特征信息，通过additive margin Softmax(AM-Softmax)函数根据样本特征信息预测行为信息样本为策略集合中每个策略的概率。

利用AM-Softmax函数对应的损失函数，根据行为信息样本与计略集合中的每个策略之间的概率以及其样本标签计算损失，并通过计算得到的损失进行反向传播，对初始特征提取模型进行训练，调整初始特征提取模型的模型参数，以使得模型提取的特征更加准确，更能反应行为信息的特征，直到满足预设训练完成条件，得到训练后特征提取模型。

202、服务器对初始对象集合中的初始对象信息进行预处理，得到对象特征信息。

比如，具体可以是，初始对象信息中可以包括每个对象的多个特征，比如，年龄、性别、所在地、以及星座等，若特征数据丢失的数量超过阈值，则舍弃该特征，阈值可以根据具体应用场景进行灵活设置。

可选的，服务器还可以对初始对象信息中的异常值进行处理，例如，具体可以是将每个特征包含的特征数据进行排序，将特征数据的数值满足条件的特征数据进行过滤，该条件可以是排在前0.01％，即舍弃数值排序在前0.01％的特征数据。

可选的，服务器对特征进行舍弃，以及对部分特征数据进行过滤之后，还存在部分特征中的特征数据缺失，可以对缺失的特征数据进行填充，使每个特征中的特征数据完整，比如，具体可以是针对特征数据为连续型的特征，利用该特征的特征数据的平均值对缺失的特征数据进行填充，针对特征数据为离散型的特征，利用常数进行填充。

可选的，服务器还可以将初始对象信息中的特征进行变换或者组合，生成新的具有含义，且更具信息价值的特征，例如，具体可以是通过特征变换、特征平方、特征加减进行特征组合和特征衍生。

服务器通过对初始对象信息进行上述处理，得到对象特征信息。

203、服务器通过训练后特征提取模型确定行为信息对应的策略行为信息，以得到对象集合。

比如，具体可以是服务器通过训练后特征提取模型基于长短期记忆(Long short-term memory,LSTM)网络，或者是由前向LSTM与后向LSTM组合成的神经网络(Bi-directional Long Short-Term Memory，Bi-LSTM)，还可以是门控神经网络(GateRecurrent Unit，GRU)，分别对行为信息和策略行为信息集合中每个参考行为信息进行特征提取，得到行为信息对应的特征信息和参考行为信息的参考特征信息。

服务器根据特征信息和每个参考特征信息之间的相似度，确定行为信息对应的策略，可选的，特征信息可以是特征向量的形式，参考特征信息可以是参考特征向量的形式，根据特征向量和参考特征向量之间的距离，计算行为信息和参考行为信息之间的相似度。其中，特征向量和参考特征向量之间的可以是曼哈顿距离(Manhattan Distance)、欧氏距离(Euclidean Distance)、切比雪夫距离(Chebyshev Distance)、余弦相似度(CosineSimilarity)、或者汉明距离(Hamming Distance)等。特征向量和参考特征向量之间的距离越近，表示行为信息和参考行为信息的相似度越大。

服务器将与行为信息相似度最大的参考行为信息的策略确定为行为信息的策略，并将行为信息通过对应的策略的标识进行表示，得到策略行为信息。

204、服务器针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息。

比如，具体可以是服务器通过prefixspan算法逐步挖掘频繁行为信息，将策略行为信息中满足预设支持度的子行为信息确定为一项前缀，针对每个一项前缀，挖掘对应的后缀信息；将对应的后缀信息中满足预设支持度的子行为信息与一项前缀合并，得到二项前缀；针对每个二项前缀，挖掘其对应的后缀信息；将对应的后缀信息中满足预设支持度的子行为信息与二项前缀合并，得到三项前缀，不断进行迭代，直到当前的前缀信息对应的后缀信息中，没有满足预设支持度的子行为信息，将得到的每个前缀作为该对象的频繁行为信息。

205、服务器基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果。

比如，具体可以是服务器利用Kmeans聚类算法、DBSCAN聚类算法或者其他聚类算法基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果。

可选的，可以分别利用多个聚类算法，得到多个聚类结果，对多个聚类结果进行集成，得到目标聚类结果。

可选的，还可以是针对对象特征信息中的多个特征信息进行聚类，以及针对频繁行为信息中的多个特征信息进行聚类，得到多个聚类结果，在根据多个聚类结果进行集成，得到目标聚类结果，

206、服务器根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇。

比如，具体可以是目标结果中的每一类为一个对象簇，每个对象簇可能包含待预测对象和使用辅助程序的对象样本，服务器根据对象样本在每个对象簇中的占比，将对象样本占比满足条件的对象簇确定为目标对象簇，其中，条件可以是占比最高或者占比超过一定阈值。

207、服务器将目标对象簇包含的待预测对象确定为使用辅助程序的对象。

比如，具体可以是服务器由于同一个对象簇内的对象的相似性大，因此将目标对象簇中包含的待预测对象确定为使用辅助程序的对象。

由上可知，本申请实施例服务器通过获取行为信息样本和策略集合，对初始特征提取模型进行训练，得到训练后特征提取模型；对初始对象集合中的初始对象信息进行预处理，得到对象特征信息；通过训练后特征提取模型确定行为信息对应的策略行为信息，以得到对象集合；针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息；基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果；根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇，将目标对象簇包含的待预测对象确定为使用辅助程序的对象。该方案通过对对象的策略行为信息进行挖掘处理，可以得到对象的频繁行为信息，频繁行为信息可以反映对象的行为特征，根据频繁行为信息进行聚类，可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用于不同的应用场景，灵活度高。

为了便于更好地实施本申请实施例提供的行为识别方法，在一实施例中还提供了一种行为识别装置。其中名词的含义与上述行为识别方法中相同，具体实现细节可以参考方法实施例中的说明。

该行为识别装置具体可以集成在计算机设备中，如图5所示，该行为识别装置可以包括：获取单元301、挖掘单元302、聚类单元303、第一确定单元304和第二确定单元305，具体如下：

(1)获取单元301：用于获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息。

在一实施例中，可以在接收到识别请求时，例如，有游戏用户在游戏中举报某个游戏对象使用辅助程序，则可以获取被举报对象对应的对象特征信息，以及在历史游戏比赛中的策略行为信息，以及获取对象样本的对应的对象特征信息，以及策略行为信息，得到对象集合。

在一实施例中，行为识别装置还可以包括集合获取单元、预处理单元、策略确定单元和集合得到单元，具体可以是：

集合获取单元：用于获取初始对象集合，以及获取策略行为信息集合，初始对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的初始对象信息和行为信息，策略行为信息集合包括至少一个已知策略的参考行为信息；

预处理单元：用于对初始对象信息进行预处理，得到对象特征信息；

策略确定单元：用于根据行为信息与策略行为信息集合中每个已知策略的参考行为信息之间的相似度，确定行为信息的策略，以得到行为信息对应的策略行为信息；

集合得到单元：用于基于对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息，得到对象集合。

可选的，还可以将初始对象信息中的特征进行变换或者组合，生成新的具有含义，且更具信息价值的特征，例如，具体可以是通过特征变换、特征平方、特征加减进行特征组合和特征衍生。

可选的，策略确定单元可以包括第一特征提取子单元、第二特征提取子单元和策略确定子单元，具体地：

第一特征提取子单元：用于通过训练后特征提取模型对行为信息进行行为特征提取，得到行为信息的特征信息；

第二特征提取子单元：用于通过训练后特征提取模型对策略行为信息集合中每个参考行为信息进行行为特征提取，得到参考行为信息的参考特征信息；

策略确定子单元：用于根据特征信息和每个参考特征信息之间的相似度，确定特征信息对应的策略，以得到特征信息的策略特征信息。

在一实施例中，策略确定单元可以包括获取子单元、样本特征提取子单元、预测子单元和训练子单元，具体地：

获取子单元：用于获取行为信息样本以及策略集合；

样本特征提取子单元：用于通过初始特征提取模型对行为信息样本进行行为特征提取，得到行为信息样本的样本特征信息；

预测子单元：用于针对策略集合中的每个策略，基于样本特征信息预测行为信息样本为策略的概率；

训练子单元：用于基于行为信息样本的策略标签以及概率，对初始特征提取模型进行训练，得到训练后特征提取模型。

(2)挖掘单元302：用于针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息。

可选的，挖掘单元302可以包括信息确定子单元、挖掘子单元、合并子单元、以及频繁信息确定子单元，具体地：

信息确定子单元：用于基于预设支持度确定策略行为信息的当前前缀信息，当前前缀信息为策略行为信息中的第一信息；

挖掘子单元：用于基于前缀信息挖掘对应的后缀信息，后缀信息为策略行为信息中的第二信息，第二信息与第一信息为策略行为信息中不重合的信息；

合并子单元：用于将后缀信息中满足预设支持度的子行为信息，与当前前缀信息合并，得到目标前缀信息；

频繁信息确定子单元：用于基于当前前缀信息和目标前缀信息，确定每个对象对应的频繁行为信息。

可选的，频繁信息确定子单元可以包括循环模块和确定模块，具体地：

循环模块：用于将目标前缀信息作为当前前缀信息，返回执行基于前缀信息挖掘对应的后缀信息，将后缀信息中满足预设支持度的子行为信息，与当前前缀信息合并，得到目标前缀信息，直到当前前缀信息没有对应的后缀信息；

确定模块：用于根据得到的每个当前前缀信息，确定每个对象对应的频繁行为信息。

(3)聚类单元303：用于基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果。

可选的，聚类单元303可以包括第一聚类子单元、第二聚类子单元和结果确定子单元，具体地：

第一聚类子单元：用于基于对象特征信息将对象样本中的对象进行聚类，得到第一聚类结果；

第二聚类子单元：用于基于频繁行为信息将对象样本中的对象进行聚类，得到第二聚类结果；

结果确定子单元：用于根据第一聚类结果和第二聚类结果确定目标聚类结果。

(4)第一确定单元304：用于根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇。

(5)第二确定单元305：用于将目标对象簇包含的待预测对象确定为使用辅助程序的对象。

由上可知，本申请实施例通过获取单元301获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；由挖掘单元302针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到每个对象对应的频繁行为信息；通过聚类单元303基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果；由第一确定单元304根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；通过第二确定单元305将目标对象簇包含的待预测对象确定为使用辅助程序的对象。该方案通过对对象的策略行为信息进行挖掘处理，可以得到对象的频繁行为信息，频繁行为信息可以反映对象的行为特征，根据频繁行为信息进行聚类，可以将行为特征相似的对象进行聚类，进而通过对象样本识别使用辅助程序的待预测对象，可以适用于不同的应用场景，灵活度高。

本申请实施例还提供一种计算机设备，该计算机设备可以是终端，也可以是服务器，如图6所示，其示出了本申请实施例所涉及的计算机设备的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器1001、一个或一个以上计算机可读存储介质(也可以称为存储介质)的存储器1002、电源1003和输入单元1004等部件。本领域技术人员可以理解，图6中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器1001是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器1002内的软件程序和/或模块，以及调用存储在存储器1002内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体监控。可选的，处理器1001可包括一个或多个处理核心；优选的，处理器1001可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和计算机程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1001中。

存储器1002可用于存储软件程序以及模块，处理器1001通过运行存储在存储器1002的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器1002可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器1002可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器1002还可以包括存储器控制器，以提供处理器1001对存储器1002的访问。

计算机设备还包括给各个部件供电的电源1003，优选的，电源1003可以通过电源管理系统与处理器1001逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源1003还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元1004，该输入单元1004可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器1001会按照如下的指令，将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器1002中，并由处理器1001来运行存储在存储器1002中的计算机程序，从而实现各种功能，如下：

获取对象集合，对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的对象特征信息和策略行为信息；

针对每个对象的策略行为信息进行隐含行为信息挖掘处理，得到对象对应的频繁行为信息；

基于对象特征信息以及频繁行为信息，将对象集合中的对象进行聚类，得到目标聚类结果；

根据使用辅助程序的对象样本在目标聚类结果的每一对象簇的分布占比，确定目标对象簇；

将目标对象簇包含的待预测对象确定为使用辅助程序的对象。

以上各个操作的具体实施可参见前面的实施例，在此不作赘述。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中各种可选实现方式中提供的方法。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成，或通过计算机程序控制相关的硬件来完成，该计算机程序可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种计算机可读存储介质，其中存储有计算机程序，该计算机程序，能够被处理器进行加载，以执行本申请实施例所提供的任一种行为识别方法。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的计算机程序，可以执行本申请实施例所提供的任一种行为识别方法，因此，可以实现本申请实施例所提供的任一种行为识别方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种行为识别方法、装置、计算机设备和计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种行为识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取对象集合之前，所述方法还包括：

获取初始对象集合，以及获取策略行为信息集合，所述初始对象集合包括使用辅助程序的对象样本和待预测对象，以及每个对象对应的初始对象信息和行为信息，所述策略行为信息集合包括至少一个已知策略的参考行为信息；

对所述初始对象信息进行预处理，得到所述对象特征信息；

根据所述行为信息与所述策略行为信息集合中每个已知策略的参考行为信息之间的相似度，确定所述行为信息的策略，以得到所述行为信息对应的策略行为信息；

基于所述对象样本和待预测对象，以及每个对象对应的所述对象特征信息和所述策略行为信息，得到所述对象集合。

3.根据权利要求2所述的方法，其特征在于，所述根据所述行为信息与所述策略行为信息集合中每个已知策略的参考行为信息之间的相似度，确定所述行为信息的策略，包括：

通过训练后特征提取模型对所述行为信息进行行为特征提取，得到所述行为信息的特征信息；

通过训练后特征提取模型对所述策略行为信息集合中每个参考行为信息进行行为特征提取，得到所述参考行为信息的参考特征信息；

根据所述特征信息和每个参考特征信息之间的相似度，确定所述行为信息对应的策略。

4.根据权利要求3所述的方法，其特征在于，所述通过训练后特征提取模型对所述行为信息进行行为特征提取，得到所述行为信息的特征信息之前，所述方法还包括：

获取行为信息样本以及策略集合；

通过初始特征提取模型对所述行为信息样本进行行为特征提取，得到所述行为信息样本的样本特征信息；

针对策略集合中的每个策略，基于所述样本特征信息预测所述行为信息样本为所述策略的概率；

基于所述行为信息样本的策略标签以及所述概率，对所述初始特征提取模型进行训练，得到训练后特征提取模型。

5.根据权利要求1所述的方法，其特征在于，所述针对每个对象的所述策略行为信息进行隐含行为信息挖掘处理，得到每个对象对应的频繁行为信息，包括：

基于预设支持度确定所述策略行为信息的当前前缀信息，所述当前前缀信息为所述策略行为信息中的第一信息；

基于所述前缀信息挖掘对应的后缀信息，所述后缀信息为所述策略行为信息中的第二信息，所述第二信息与所述第一信息为所述策略行为信息中不重合的信息；

将所述后缀信息中满足所述预设支持度的子行为信息，与所述当前前缀信息合并，得到目标前缀信息；

基于所述当前前缀信息和所述目标前缀信息，确定每个对象对应的频繁行为信息。

6.根据权利要求5所述的方法，其特征在于，所述基于所述当前前缀信息和所述目标前缀信息，确定每个对象对应的频繁行为信息，包括：

将所述目标前缀信息作为所述当前前缀信息，返回执行基于所述前缀信息挖掘对应的后缀信息，将所述后缀信息中满足所述预设支持度的子行为信息，与所述当前前缀信息合并，得到目标前缀信息，直到所述当前前缀信息没有对应的后缀信息；

7.根据权利要求1至6任一项所述的方法，其特征在于，所述基于所述对象特征信息以及所述频繁行为信息进行聚类，得到目标聚类结果，包括：

基于所述对象特征信息将所述对象样本中的对象进行聚类，得到第一聚类结果；

基于所述频繁行为信息对将述对象样本中的对象进行聚类，得到第二聚类结果；

根据所述第一聚类结果和第二聚类结果确定目标聚类结果。

8.一种行为识别装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器和处理器；所述存储器存储有计算机程序，所述处理器用于运行所述存储器内的计算机程序，以执行权利要求1至7任一项所述的行为识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序被处理器加载，以执行权利要求1至7任一项所述的行为识别方法。