CN113657536A

CN113657536A - 基于人工智能的对象分类方法、装置

Info

Publication number: CN113657536A
Application number: CN202110976483.9A
Authority: CN
Inventors: 崔健; 孙恺
Original assignee: Shenzhen Tencent Network Information Technology Co Ltd
Current assignee: Shenzhen Tencent Network Information Technology Co Ltd
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2021-11-16

Abstract

本申请提供了一种基于人工智能的对象分类方法、装置、设备及计算机可读存储介质；方法包括：从至少一个样本对象的行为数据中提取第一特征序列，其中，所述第一特征序列包括多个历史时间节点分别对应的多维度特征；基于所述第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差；对所述第一时间序列误差、所述第二特征序列和所述第三特征序列进行融合处理，得到分类阈值；基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别。通过本申请，能够精确的对待识别对象进行分类。

Description

基于人工智能的对象分类方法、装置

技术领域

本申请涉及人工智能技术，尤其涉及一种基于人工智能的对象分类方法、装置、设备及计算机可读存储介质。

背景技术

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

在现有技术的对象分类方法中，在分类时通常存在较大的分类误差且无法保证误差的偏差程度。对于如何精准的对待识别对象进行分类，相关技术尚无有效解决方案。

发明内容

本申请实施例提供一种基于人工智能的对象分类方法、装置及计算机可读存储介质，能够精确的对待识别对象进行分类。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种基于人工智能的对象分类方法，包括：

从至少一个样本对象的行为数据中提取第一特征序列，其中，所述第一特征序列包括多个历史时间节点分别对应的多维度特征；

基于所述第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差；

对所述第一时间序列误差、所述第二特征序列和所述第三特征序列进行融合处理，得到分类阈值；

基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别。

上述方案中，所述对所述目标时间序列模型进行定阶处理和参数估计处理，得到用于进行时间序列预测处理的所述时间序列模型，包括：对所述目标时间序列模型进行定阶处理，得到所述目标时间序列模型的起始预测时间节点，其中，所述起始预测时间节点为所述第四特征序列的起始时间节点；对所述目标时间序列模型进行参数估计操作，得到所述目标时间序列模型的预测参数；根据所述目标时间序列模型的起始预测时间节点和所述目标时间序列模型的预测参数，确定用于进行所述时间序列预测处理的所述时间序列模型。

上述方案中，所述基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别之后，所述方法还包括：当所述待识别对象的类别为异常类型时，拦截所述待识别对象的业务请求；当所述待识别对象的类别为正常类型时，响应所述待识别对象的业务请求。

本申请实施例提供一种基于人工智能的对象分类装置，包括：

提取模块，用于从至少一个样本对象的行为数据中提取第一特征序列，其中，所述第一特征序列包括多个历史时间节点分别对应的多维度特征；

预测模块，用于基于所述第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差；

融合模块，用于对所述第一时间序列误差、所述第二特征序列和所述第三特征序列进行融合处理，得到分类阈值；

分类模块，用于基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别。

上述方案中，所述预测模块，还用于基于所述第一特征序列调用所述时间序列模型进行时间序列预测处理，得到所述第二特征序列和第四特征序列，其中，所述第二特征序列包括所述第一特征序列之后的多个未来时间节点分别对应的多维度特征，所述第四特征序列包括所述第一特征序列的部分历史时间节点分别对应的多维度特征；确定所述第一特征序列与所述第四特征序列之间的第二时间序列误差；基于所述第二特征序列调用神经网络模型进行时间序列预测处理，得到所述第三特征序列，其中，所述第三特征序列与所述第二特征序列包括相同的所述多个未来时间节点；基于所述第二时间序列误差调用所述神经网络模型进行时间序列预测处理，得到所述第一时间序列误差。

上述方案中，所述融合模块，还用于对所述第二特征序列和所述第三特征序列进行加权平均处理，得到第五特征序列；对所述第五特征序列和所述第一时间序列误差进行求和处理，得到第六特征序列；对所述第六特征序列进行归一化处理，得到所述分类阈值。

上述方案中，所述提取模块，还用于从所述至少一个样本对象的行为数据中提取多个历史时间节点的特征数据；从所述多个历史时间节点的特征数据中选择高于波动程度阈值的数据，将选择的高于波动程度阈值的数据按照时间先后顺序进行排序处理，得到所述第一特征序列。

上述方案中，所述提取模块，还用于基于所述行为数据的原子维度指标，从所述行为数据中提取多个历史时间节点的原子维度特征数据，其中，所述原子维度指标为所述行为数据中不可再拆分的指标；基于所述行为数据的聚合维度指标，从所述行为数据中提取多个历史时间节点的聚合维度特征数据，其中，所述聚合维度指标由多个所述原子维度指标聚合而成。

上述方案中，所述基于人工智能的对象分类装置还包括：第一分类模块，用于对所述至少一个样本对象的行为数据进行聚类处理，得到每个样本对象分别所属的样本对象集合；根据所述待识别对象的行为数据与每个所述样本对象的行为数据之间的差异值，确定所述待识别对象所属的样本对象集合；将所述待识别对象所属的样本对象集合中的样本对象的类别，确定为所述待识别对象的相似类别。

上述方案中，所述分类模块，还用于针对任意一个样本对象执行以下处理：根据所述任意一个样本对象的行为数据，确定所述任意一个样本对象所属的第一样本对象集合，其中，所述第一样本对象集合中的样本对象与所述任意一个样本对象之间的距离小于半径参数；根据所述第一样本对象集合中的每一样本对象和所述半径参数，确定所述第一样本对象集合中的每一样本对象的半径参数范围内的第二样本对象集合，其中，所述第二样本对象集合的数量与所述第一样本对象集合中的样本对象的数量相同；当所述第二样本对象集合中的样本对象的数量小于领域密度阈值时，对所述第一样本对象集合中的样本对象和所述第二样本对象集合中的样本对象进行选择处理，得到所述任意一个样本对象所属的样本对象集合。

上述方案中，所述分类模块，还用于当所述待识别对象的行为数据大于所述分类阈值时，确定所述待识别对象的类别为异常类型；当所述待识别对象的行为数据小于或等于所述分类阈值时，确定所述待识别对象的类别为正常类型。

上述方案中，所述基于人工智能的对象分类装置还包括：训练模块，用于通过以下方式训练得到所述时间序列模型：对所述第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列；根据所述平稳化的第一特征序列的统计特性，在多个候选时间序列模型中确定待训练的目标时间序列模型，其中，所述多个候选时间序列模型包括自回归模型、移动平均模型和自回归移动平均模型；对所述目标时间序列模型进行定阶处理和参数估计处理，得到用于进行时间序列预测处理的所述时间序列模型。

上述方案中，所述训练模块，还用于对所述目标时间序列模型进行定阶处理，得到所述目标时间序列模型的起始预测时间节点，其中，所述起始预测时间节点为所述第四特征序列的起始时间节点；对所述目标时间序列模型进行参数估计操作，得到所述目标时间序列模型的预测参数；根据所述目标时间序列模型的起始预测时间节点和所述时间序列模型的预测参数，确定用于进行所述时间序列预测处理的所述时间序列模型。

上述方案中，所述基于人工智能的对象分类装置还包括：判断模块，用于当所述待识别对象的类别为异常类型时，拦截所述待识别对象的业务请求；当所述待识别对象的类别为正常类型时，响应所述待识别对象的业务请求。

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的基于人工智能的对象分类方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的基于人工智能的对象分类方法。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的基于人工智能的对象分类方法。

本申请实施例具有以下有益效果：

基于多维度特征的第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，结合了时间序列模型和神经网络模型进行时间预测处理，得到了第一时间序列误差，将第一时间序列误差与预测得到的第二特征序列和第三特征序列进行融合处理，所得到的分类阈值对待识别对象的行为数据进行分类处理，使得分类结果更加准确。

附图说明

图1是本申请实施例提供的基于人工智能的对象分类系统架构的一个可选的结构示意图；

图2是本申请实施例提供的基于人工智能的对象分类装置的一个可选的结构示意图；

图3至图7是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图；

图8是本申请实施例提供的基于人工智能的对象分类方法的原理示意图；

图9是本申请实施例提供的基于人工智能的对象分类方法的系统后台结构和逻辑流程示意图；

图10是本申请实施例提供的异常活跃预警系统的架构示意图；

图11是本申请实施例提供的优化粒子群算法的流程图；

图12是本申请实施例提供的基于人工智能的对象分类方法的原理示意图；

图13是本申请实施例提供的基于人工智能的对象分类方法的原理示意图；

图14是本申请实施例提供的基于人工智能的对象分类方法的原理示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)行为数据：是关于机体的行为和行为发生时环境的观察报告。例如，行为数据可以为样本对象的充值行为数据、游戏行为数据等等。

2)特征序列：包括多个时间节点的多维度特征，特征序列可以是若干个按照时间顺序排列起来的多个时间节点的多维度特征的观测值。

3)多维度特征：是至少两个维度的特征，例如，多维度特征可以包括原子维度特征和多个原子维度聚合而成的聚合维度特征。

4)未来时间节点：以当前时间节点为基准时间节点，未来时间节点是指在基准时间节点之后的时间节点，例如未来时间节点可以为明天的某个时间节点(例如，明天下午三点)。

5)历史时间节点：以当前时间节点为基准时间节点，历史时间节点是指在基准时间节点之前的时间节点，例如历史时间节点可以为昨天的某个时间节点(例如，昨天下午三点)。

在现有技术的对象分类方法中，对待分类对象进行分类通常是通过对多个分类对象的数据进行分析，总结对象的行为规律，并将异常对象的行为进行标记，总结异常对象的行为规律。结合分类对象的行为规律完成对待分类对象的分类和对待分类对象的预警和拦截策略的制定。但是，现有技术的对象分类方法的缺点也是毋庸置疑的：

在现有技术的对象分类方法中，分类策略的制定和使用，均具有较高的主观性。分类对象的数据所存在的部分隐藏规律可能没有发现。而且由于分类策略本身数量较多，分类策略总体数量较多，人工配置分类策略的成本较大，人力成本消耗较多。并且固定的分类策略无法实现所有异常行为的覆盖，且外界因素会影响对象分类的准确性，需要针对新加入的对象的行为日志来进行重新分析，时效性落后较多且无法较快的应对外界的变化。同时现有技术的对象分类方法往往无法对具有异常化行为倾向的对象进行提前介入以纠正不良习惯。

基于以上分析，申请人发现现有技术的对象分类方法无法精确的对待识别对象进行分类，针对上述问题，本申请实施例提供一种基于人工智能的对象分类方法，能够精确的对待识别对象进行分类。

本申请实施例提供的基于人工智能的对象分类方法、装置、设备和计算机可读存储介质，能够精确的对待识别对象进行分类，下面说明本申请实施例提供的基于人工智能的对象分类的电子设备的示例性应用，本申请实施例提供的电子设备可以实施为笔记本电脑，平板电脑，台式计算机，机顶盒，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)等各种类型的用户终端，也可以实施为服务器。

参见图1，图1是本申请实施例提供的基于人工智能的对象分类系统100的一个可选的架构示意图，为实现基于人工智能的对象分类应用场景，终端(示例性示出了终端400)通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合。

终端400用于供用户使用客户端410，在图形界面410-1(示例性示出了图形界面410-1)显示。终端400和服务器200通过有线或者无线网络相互连接。

在一些实施例中，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例中不做限制。

在一些实施例中，以服务器为例，例如可以是部署在云端的服务器集群，向用户开放人工智能云服务(AI as a Service，AIaaS)，AIaaS平台会把几类常见的AI服务进行拆分，并在云端提供独立或者打包的服务，这种服务模式类似于一个AI主题商城，所有的用户都可以通过应用程序编程接口的方式来接入使用AIaaS平台提供的一种或者多种人工智能服务。

例如，其中的一种人工智能云服务可以为时间序列模型和神经网络模型预测服务，即云端的服务器200封装有本申请实施例提供的时间序列模型和神经网络模型预测的程序。通过终端400(运行有客户端410，例如游戏客户端、聊天客户端等)调用云服务中的时间序列模型和神经网络模型预测服务，以使部署在云端的服务器200调用封装的时间序列模型和神经网络模型预测的程序。例如，对于游戏应用，通过基于第一特征序列调用时间序列模型和神经网络模型进行时间预测处理(用于游戏对象分类)确定待识别对象(例如游戏应用的用户)的类别，例如异常对象、正常对象等等，若待识别对象为异常对象，可以对待识别对象的游戏行为进行拦截，若待识别对象的类别为正常对象，可以允许待识别对象的游戏行为。

在一些实施例中，终端400向服务器200发送待识别对象触发的业务请求(例如充值请求、领取奖励请求等)，服务器200调用时间序列模型和神经网络模型预测接口，服务器200通过时间序列模型和神经网络模型对第一特征序列进行预测处理，确定待识别对象的类别，然后基于待识别对象的类别对待识别对象的业务请求(例如充值请求、领取奖励请求、游戏道具获取请求)进行相应处理，并将处理结果反馈至终端400。终端400接收服务器200发送的处理结果后，在图形界面410-1中显示处理结果。例如，当待识别对象的类别为异常对象时，服务器200对待识别对象的业务请求进行拦截，并将业务请求失败信息(如充值失败、领取奖励失败)反馈至终端400，终端400接收服务器200发送的业务请求失败信息，并在图形界面410-1中显示业务请求失败信息；当待识别对象的类别为正常对象时，服务器200响应待识别对象的业务请求(如允许充值，允许领取奖励)，并将业务请求成功信息(如充值成功、领取奖励成功)反馈至终端400，终端400接收服务器200发送的业务请求成功信息，并在图形界面410-1中显示业务请求成功信息。

在另一些实施例中，终端400响应于待识别对象触发的业务请求后，调用终端400中的时间序列模型和神经网络模型预测接口，终端400通过时间序列模型和神经网络模型对第一特征序列进行预测处理，确定待识别对象的类别，然后基于待识别对象的类别对待识别对象的业务请求(例如充值请求、领取奖励请求、游戏道具获取请求)进行相应处理，并在图形界面410-1中显示处理结果。例如，当待识别对象的类别为异常对象时，终端400对待识别对象的业务请求进行拦截，并在图形界面410-1中显示业务请求失败信息(如充值失败、领取奖励失败)；当待识别对象的类别为正常对象时，终端400响应待识别对象的业务请求(如充值成功、领取奖励成功)并在图形界面410-1中显示业务请求成功信息。

参见图2，图2是本申请实施例提供的基于人工智能的对象分类的服务器200的结构示意图，图2所示的服务器200包括：至少一个处理器410、存储器450、至少一个网络接口420。服务器200中的各个组件通过总线系统440耦合在一起。可理解，总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统440。

处理器410可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器450可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。

存储器450包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。

在一些实施例中，存储器450能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统451，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块452，用于经由一个或多个(有线或无线)网络接口420到达其他计算设备，示例性的网络接口420包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

在一些实施例中，本申请实施例提供的基于人工智能的对象分类装置可以采用软件方式实现，图2示出了存储在存储器450中的基于人工智能的对象分类装置455，其可以是程序和插件等形式的软件，包括以下软件模块：提取模块4551、预测模块4552、融合模块4553、分类模块4554，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的基于人工智能的对象分类装置可以采用硬件方式实现，作为示例，本申请实施例提供的基于人工智能的对象分类装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的基于人工智能的对象分类方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable LogicDevice)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

本申请实施例提供的基于人工智能的对象分类方法可以由各种类型的电子设备实施。参见图3，图3是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，将结合图3示出的步骤进行说明。

在步骤101中，从至少一个样本对象的行为数据中提取第一特征序列，其中，第一特征序列包括多个历史时间节点分别对应的多维度特征。

例如，在网络游戏应用中，样本对象可以为游戏玩家，样本对象的行为数据可以为游戏玩家在游戏进程中触发的各类游戏操作数据。

例如，从样本对象A、样本对象B以及样本对象C的行为数据中分别提取样本对象A的第一特征序列、样本对象B的第一特征序列、以及样本对象C的第一特征序列。样本对象A的第一特征序列包括样本对象A的多个历史时间节点分别对应的多维度特征，样本对象B的第一特征序列包括样本对象B的多个历史时间节点分别对应的多维度特征，样本对象C的第一特征序列包括样本对象C的多个历史时间节点分别对应的多维度特征。

参见图4，图4是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，图4示出的步骤101可以通过步骤1011至步骤1012实现。

在步骤1011中，从至少一个样本对象的行为数据中提取多个历史时间节点的特征数据。

例如，从样本对象A的行为数据中提取样本对象A的多个历史时间节点的特征数据，以此类推，还可以从样本对象B的行为数据中提取样本对象B的多个历史时间节点的特征数据，从样本对象C的行为数据中提取样本对象C的多个历史时间节点的特征数据。

在一些实施例中，上述步骤1011可以通过以下方式实现：基于行为数据的原子维度指标，从行为数据中提取多个历史时间节点的原子维度特征数据，其中，原子维度指标为行为数据中不可再拆分的指标；基于行为数据的聚合维度指标，从行为数据中提取多个历史时间节点的聚合维度特征数据，其中，聚合维度指标由多个原子维度指标聚合而成。

例如，原子维度指标可以为对象行为日志单条数据字段、设备行为日志单条数据字段、充值记录、玩家消费记录等等。原子维度特征数据可以原子维度指标的具体数值，例如对象标识数值、游戏ID数值、用户设备号信息数值、登录IP数值、此次登录时长数值、对象在设备上游戏时长数值、对象在该设备上等级成长数值、对象登录地址数值、设备内存数值等等。聚合维度指标可以分为对象角度聚合维度指标和设备角度聚合维度指标，聚合维度指标可由多个原子维度指标聚合而成。

如此，基于行为数据的原子维度指标和聚合维度指标，从行为数据中提取多个历史时间节点的特征数据，使得提取到的特征数据可以较好的反映出对象不同维度的特征，为后续时间序列模型和神经网络模型的预测处理，提供了可靠数据来源。

在步骤1012中，从多个历史时间节点的特征数据中选择高于波动程度阈值的数据，将选择的高于波动程度阈值的数据按照时间先后顺序进行排序处理，得到第一特征序列。

其中，波动程度阈值可以是预先设定的，也可以是基于大量样本数据调用神经网络模型预测得到的。

例如，分别从样本对象A的多个历史时间节点的特征数据、样本对象B的多个历史时间节点的特征数据、以及样本对象C的多个历史时间节点的特征数据中选择高于波动程度阈值的数据，分别将选择的样本对象A、样本对象B以及样本对象C的高于波动程度阈值的数据按照时间先后顺序进行排序处理，对应得到样本对象A、样本对象B以及样本对象C的第一特征序列。

衡量波动程度的统计量可以有平均偏差、极差、方差等等，可以基于多个历史节点的特征数据的平均偏差、极差、方差表征多个历史节点的特征数据的波动程度。

在步骤102中，基于第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差。

例如，时间序列可以是按时间顺序排序的、随时间变化且相互关联的数据序列。按照时间序列的统计特性分类，时间序列可以分为平稳时间序列和非平稳时间序列，其中，平稳时间序列是指时间序列的所有序列值的均值和方差没有发生系统变化的时间序列，非平稳时间序列是指时间序列的所有序列值的均值或方差随时间变化而发生变化的时间序列。

参见图4，图4是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，图4示出的步骤102可以通过步骤1021至步骤1024实现。

在步骤1021中，基于第一特征序列调用时间序列模型进行时间序列预测处理，得到第二特征序列和第四特征序列。

第二特征序列包括第一特征序列之后的多个未来时间节点分别对应的多维度特征，第四特征序列包括第一特征序列的部分历史时间节点分别对应的多维度特征。时间节点的划分粒度可以为“分钟”、“小时”、“天”等。

例如，以时间节点的划分粒度为“天”为例，第一特征序列的起始时间节点为2020年8月31日，终止时间节点为2021年7月30日。第二特征序列的起始时间节点可以为2021年8月1日，终止时间节点可以为2021年9月30日；第四特征序列的起始时间节点可以为2020年9月3日，终止时间节点可以为2021年7月30日。

在步骤1022中，确定第一特征序列与第四特征序列之间的第二时间序列误差。

第二时间序列误差可以为第一特征序列和第四特征序列的公共时间段内的特征差值。

例如，第一特征序列的起始时间节点为2020年8月31日，终止时间节点为2021年7月30日。第四特征序列的起始时间节点可以为2020年9月3日，终止时间节点可以为2021年7月30日。则可以确定第一特征序列与第四特征序列在时间段2020年9月3日至2021年7月30日之间的特征差值，并将特征差值确定为第二时间序列误差。

在步骤1023中，基于第二特征序列调用神经网络模型进行时间序列预测处理，得到第三特征序列。

第三特征序列与第二特征序列包括相同的多个未来时间节点。

例如，第二特征序列的起始时间节点可以为2021年8月1日，终止时间节点可以为2021年9月30日。则第三特征序列的起始时间节点可以为2021年8月1日，终止时间节点可以为2021年9月30日。也即，第三特征序列与第二特征序列包括相同的未来时间段2021年8月1日至2021年9月30日之间的多个未来时间节点。

在步骤1024中，基于第二时间序列误差调用神经网络模型进行时间序列预测处理，得到第一时间序列误差。

作为示例，参见图8，图8是本申请实施例提供的基于人工智能的对象分类方法的原理示意图。基于第一特征序列120调用时间序列模型121进行时间序列预测处理，得到第二特征序列124和第四特征序列122。确定第一特征序列120与第四特征序列122之间的第二时间序列误差123。基于第二特征序列124调用神经网络模型125进行时间序列预测处理，得到第三特征序列128。基于第二时间序列误差123调用神经网络模型126进行时间序列预测处理，得到第一时间序列误差127，第一时间序列误差127也称为残差或残差序列。

如此，通过调用时间序列模型对第一特征序列进行了初步时间序列预测处理，得到了第二特征序列和第四特征序列，其中，第二特征序列包括第一特征序列之后的多个未来时间节点分别对应的多维度特征，第四特征序列包括第一特征序列的部分历史时间节点分别对应的多维度特征。通过两次调用神经网络模型对第二特征序列和第二时间序列误差进行时间序列预测处理，分别得到第三特征序列和第一时间序列误差。如此，通过调用时间序列模型和神经网络模型进行了三次时间序列预测处理，有效提高了时间序列预测的准确性。

在步骤103中，对第一时间序列误差、第二特征序列和第三特征序列进行融合处理，得到分类阈值。

参见图4，图4是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，图4示出的步骤103可以通过步骤1031至步骤1033实现。

在步骤1031中，对第二特征序列和第三特征序列进行加权平均处理，得到第五特征序列。

对第二特征序列和第三特征序列进行加权平均处理，可以是将第二特征序列中包括的多个时间节点分别对应的多维度特征和第三特征序列中包括的多个时间节点分别对应的多维度特征，按照时间节点的对应关系分别进行加权平均处理，得到每一时间节点对应的加权平均处理数值结果，将每一时间节点对应的加权平均处理数值结果按时间先后顺序排列得到第五特征序列。例如，第二特征序列为{1,2,3,4}，第三特征序列为{5,6,7,8}，对第二特征序列和第三特征序列进行加权平均处理后，得到的第五特征序列为{3,4,5,6}。

再例如，第二特征序列的起始时间节点可以为2021年8月1日，终止时间节点可以为2021年9月30日。第三特征序列的起始时间节点为2021年8月1日，终止时间节点为2021年9月30日。则第五特征序列的起始时间节点可以为2021年8月1日，终止时间节点可以为2021年9月30日。

在步骤1032中，对第五特征序列和第一时间序列误差进行求和处理，得到第六特征序列。

对第五特征序列和第一时间序列误差进行求和处理，可以是将第五特征序列中包括的多个时间节点分别对应的多维度特征分别和多个时间节点分别对应的第一时间序列误差进行求和处理，得到每一时间节点对应的求和处理数值结果，将每一时间节点对应的求和处理数值结果按时间先后顺序排列得到第六特征序列。例如，第五特征序列为{1,2,3,4}，第一时间误差为{1,1,1,1}，第六特征序列为{2,3,4,5}。

在步骤1033中，对第六特征序列进行归一化处理，得到分类阈值。

例如，对第六特征序列中的多个时间节点分别对应的多维度特征进行归一化处理，得到分类阈值，其中，分类阈值用于表征第六特征序列中的多个时间节点分别对应的多维度特征的归一化规律。

作为示例，参见图8，对第二特征序列124和第三特征序列128进行加权平均处理，得到第五特征序列，对第五特征序列和第一时间序列误差127进行求和处理，得到第六特征序列，对第六特征序列进行归一化处理，得到分类阈值129。

例如，将第五特征序列中包括的多个时间节点分别对应的多维度特征分别和多个时间节点分别对应的第一时间序列误差进行求和处理，得到每一时间节点对应的求和处理数值结果，将每一时间节点对应的求和处理数值结果按时间先后顺序排列得到第六特征序列。

如此，通过对第二特征序列和第三特征序列进行加权平均处理，以及对第五特征序列和第一时间序列误差进行求和处理，并对第六特征序列进行归一化处理，得到分类阈值，从而有效提高了分类阈值的准确性。

在步骤104中，基于分类阈值对待识别对象的行为数据进行分类处理，得到待识别对象的类别。

参见图4，图4示出的步骤104可以通过步骤1041至步骤1042实现。

在步骤1041中，当待识别对象的行为数据大于分类阈值时，确定待识别对象的类别为异常类型。

例如，分类阈值可以作为样本对象行为是否异常的临界行为数据值，当待识别对象的行为数据大于样本对象行为是否异常的临界行为数据值时，则确定待识别对象的类别为异常类型。

在步骤1042中，当待识别对象的行为数据小于或等于分类阈值时，确定待识别对象的类别为正常类型。

例如，当待识别对象的行为数据小于或等于样本对象行为是否异常的临界行为数据值时，则确定待识别对象的类别为正常类型。

在一些实施例中，在步骤104中，基于分类阈值对待识别对象的行为数据进行分类处理，得到待识别对象的类别之后，执行以下处理：当待识别对象的类别为异常类型时，拦截待识别对象的业务请求；当待识别对象的类别为正常类型时，响应待识别对象的业务请求。

如此，根据待识别对象是异常类型/正常类型，进一步对待识别对象的业务请求进行拦截或响应，从而保证了异常类型的待识别对象的业务请求被拦截，以防止异常类型的待识别对象影响正常的业务运转。

参见图5，图5是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，在步骤104中，基于分类阈值对待识别对象的行为数据进行分类处理，得到待识别对象的类别之后，执行步骤105至步骤107。

在步骤105中，对至少一个样本对象的行为数据进行聚类处理，得到每个样本对象分别所属的样本对象集合。

例如，对样本对象A的行为数据、样本对象B的行为数据、样本对象C的行为数据进行聚类处理，得到样本对象A所属的样本对象集合1、样本对象B所属的样本对象集合2、样本对象C所属的样本对象集合3。

参见图6，图6是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，图6示出的步骤105可以通过步骤1051至步骤1053实现。可以针对任意一个样本对象执行以下步骤1051至1053。

在步骤1051中，根据任意一个样本对象的行为数据，确定任意一个样本对象所属的第一样本对象集合。

第一样本对象集合中的样本对象与任意一个样本对象之间的距离小于半径参数。例如，第一样本对象集合的取值范围是以第一样本对象集合中的某一样本对象为圆心，以半径参数为半径的圆。因此，第一样本对象集合中的任意两个样本对象之间的距离均小于半径参数。

在步骤1052中，根据第一样本对象集合中的每一样本对象和半径参数，确定第一样本对象集合中的每一样本对象的半径参数范围内的第二样本对象集合。

其中，第二样本对象集合的数量与第一样本对象集合中的样本对象的数量相同。

例如，分别以第一样本对象集合中的每一样本对象为圆心，并以半径参数为半径，确定第一样本对象集合中的每一样本对象的半径参数范围内的第二样本对象集合。

再例如，假设第一样本对象集合中的样本对象为样本对象D、样本对象E、样本对象F，则分别以样本对象D、样本对象E、样本对象F为圆心，并分别以半径参数为半径，确定样本对象D的半径参数范围内的第二样本对象集合、样本对象E的半径参数范围内的第二样本对象集合、样本对象F的半径参数范围内的第二样本对象集合。可以理解的是，第二样本对象集合的数量为3，第一样本对象集合中的样本对象的数量为3，即第二样本对象集合的数量与第一样本对象集合中的样本对象的数量相同。

在步骤1053中，当第二样本对象集合中的样本对象的数量小于领域密度阈值时，对第一样本对象集合中的样本对象和第二样本对象集合中的样本对象进行选择处理，得到任意一个样本对象所属的样本对象集合。

例如，领域密度阈值为5，第二样本对象集合中的样本对象的数量为4，即第二样本对象集合中的样本对象的数量小于领域密度阈值，则对第一样本对象集合中的样本对象和第二样本对象集合中的样本对象进行选择处理，得到任意一个样本对象所属的样本对象集合。

再例如，选择处理的方式可以为，对第一样本对象集合和第二样本对象集合中重合的样本对象记为一个样本对象，对第二样本对象集合中的样本对象进行选择，筛选掉第二样本对象集合中的边界样本对象。

在步骤106中，根据待识别对象的行为数据与每个样本对象的行为数据之间的差异值，确定待识别对象所属的样本对象集合。

例如，通过确定待识别对象的行为数据和每个样本对象的行为数据之间的差异值，将与待识别样本对象差异值最小的样本对象，作为与待识别样本对象行为最相似的样本对象，将与待识别样本对象差异值最小的样本对象所属的样本对象集合确定为待识别对象所属的样本对象集合。

在步骤107中，将待识别对象所属的样本对象集合中的样本对象的类别，确定为待识别对象的相似类别。

例如，待识别对象的类别为异常类别，则将待识别对象所属的样本对象集合中的样本对象的类别确定为相似的异常类别。

如此，在得到待识别对象的类别之后，通过确定待识别对象所属的样本对象集合，将待识别对象所属的样本对象集合中的样本对象确定为与待识别对象类别相似的对象。若待识别对象为异常对象，则待识别对象所属的样本对象集合中的样本对象确定为与待识别对象类别相似的对象，即潜在异常对象。从而在保证了识别异常对象的精度的同时，实现了识别异常对象的广度。进而可以无遗漏的识别出所有的异常对象。

参见图7，图7是本申请实施例提供的基于人工智能的对象分类方法的一个可选的流程示意图，在步骤101之前，通过执行步骤108至步骤110，训练得到时间序列模型。

在步骤108中，对第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列。

由于在大数定理和中心定理中要求样本同分布，即要求序列的平稳性，而时间序列模型的训练是建立在大数定理和中心定理的前提条件下的，因此，首先需要对第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列，以便于后续时间序列模型的训练。

其中，数据平稳化处理可以将非平稳化的数据转换为平稳化的数据。

在步骤109中，根据平稳化的第一特征序列的统计特性，在多个候选时间序列模型中确定待训练的目标时间序列模型，其中，多个候选时间序列模型包括自回归模型、移动平均模型和自回归移动平均模型。

例如，平稳化的第一特征序列的统计特性可以为平稳化的第一特征序列的自相关函数和偏自相关函数。可以根据平稳化的第一特征序列的自相关函数和偏自相关函数，在多个候选时间序列模型中确定待训练的目标时间序列模型。

例如，自相关函数/偏自相关函数与候选时间序列模型之间的关系如下表1所示。

表1自相关函数/偏自相关函数与候选时间序列模型之间的关系

在步骤110中，对目标时间序列模型进行定阶处理和参数估计处理，得到用于进行时间序列预测处理的时间序列模型。

在一些实施例中，上述步骤110可以通过以下方式实现：对目标时间序列模型进行定阶处理，得到目标时间序列模型的起始预测时间节点，其中，起始预测时间节点为第四特征序列的起始时间节点；对目标时间序列模型进行参数估计操作，得到目标时间序列模型的预测参数；根据目标时间序列模型的起始预测时间节点和目标时间序列模型的预测参数，确定用于进行时间序列预测处理的时间序列模型。

如此，通过根据波动程度阈值对样本对象的多个历史时间节点的特征数据进行筛选，从而保留了价值较高的特征数据，筛选掉了价值较低的特征数据。所得到的第一特征序列中的每一时间节点的特征数据均具有典型代表性，由于筛选后的第一特征序列数据量大幅缩减但是信息量却没有影响，从而有效缩短了算法运行时长，显著提高了算法运行效率。

下面，将说明本申请实施例在一个网络游戏的应用场景中的示例性应用。

在网络游戏的应用场景中，游戏玩家在游戏APP中发起业务请求，例如，游戏充值、游戏币购买等，网络游戏后台判断游戏玩家的行为是否发生异常，如果游戏玩家的行为发生异常，则网络游戏后台可以禁止游戏玩家所发起的业务请求。

在一个网络游戏的应用场景中，参见图9，图9是本申请实施例提供的基于人工智能的对象分类方法的系统后台结构和逻辑流程示意图。

以在服务器中实施基于人工智能的对象分类方法的系统后台为例，基于人工智能的对象分类方法的系统后台可以由后台逻辑模块和数据处理/缓存支持模块组成，其中数据处理/缓存支持模块可以包括数据收集部分和人工智能模型部分。数据收集部分可以将游戏玩家在游戏内的日常行为等数据上报至数据通道，并将数据通道中的数据调用人工智能模型部分以进行校验，通过对游戏玩家进行分类之后，分类结果的正常的游戏玩家才能够发起业务请求，业务请求可以用于进行支付、领取奖励等。

后台逻辑模块用于对基于人工智能的对象分类方法的系统后台进行日常管理和维护。后台管理者可以通过认证统一登录模块登录后台管理界面，在后台管理界面中显示有数据接口模块、风控策略模块、操作日志模块、黑白名单模块、拦截明细模块。

数据接口模块用于响应于针对数据接口模块的点击操作，将后台管理界面中的显示内容切换为显示初始化查询条件和策略预览数据下载。初始化查询条件，用于响应于针对显示初始化查询条件的点击操作，在后台管理界面中显示界面中显示异常活跃预警数据详情和异常预警策略效果详情。其中，异常活跃预警数据详情用于展示异常活跃预警数据，异常预警策略效果详情用于展示异常预警策略效果。策略预览数据下载，用于响应于针对策略预览数据下载的点击操作，将策略预览数据下载到后台本地。

风控策略模块用于响应于针对风控策略模块的点击操作，将后台管理界面中的显示内容切换为显示游戏策略现有配置。游戏策略现有配置，用于响应于针对游戏策略现有配置的选择操作，在后台管理界面中显示策略预览数据下载所下载的预警策略效果预览或者在后台管理界面中更改预警配置策略配置。

操作日志模块用于响应于针对操作日志模块的点击操作，在后台管理界面中显示相关操作日志全记录和查询。相关操作日志全记录和查询用于对相关操作日志的记录进行查询和显示。

黑白名单模块用于响应于针对黑白名单模块的点击操作，在后台管理界面中显示初始化查询条件。初始化查询条件用于响应于针对初始化查询条件的查询操作，在后台管理界面中显示查看相关名单数据和黑白名单数据修改。查看相关名单数据用于在后台管理界面中显示符合查询条件的相关黑白名单数据。黑白名单数据修改用于响应于修改操作，在后台管理界面中对黑白名单数据进行修改并将修改后的黑白名单数据在后台管理模块中显示。

拦截明细模块用于响应于针对拦截明细模块的点击操作，在后台管理界面中显示初始化查询条件。初始化查询条件，用于在后台管理界面中显示相关账号/设备明细和相关账号/设备告警。相关账号/设备明细用于响应于针对相关账号/设备明细的点击操作，在后台管理界面中显示拦截的相关账号/设备明细的详细信息。相关账号/设备告警用于响应于针对相关账号/设备告警的点击操作，在后台管理界面中显示拦截的相关账号/设备告警的相关信息。

数据处理/缓存支持模块用于响应于针对数据处理/缓存支持模块的点击操作，通过支付行为检测模块对待检测的游戏玩家的支付行为进行检测，对支付行为进行检测之后，通过订单信息验证模块对待检测的游戏玩家所发起的支付订单进行验证。对支付订单行为进行验证之后，通过黑白名单查询模块查询待检测的游戏玩家是否在黑白名单库中，并将查询结果发送至必要条件判定模块。必要条件判定模块用于获取判断结果，若待检测的游戏玩家在白名单库中，则符合必要条件。后台模型选择配置模块用于对时间序列模型和神经网络模型进行参数配置及训练，并将配置完成的时间序列模型和神经网络模型发送至模型筛选模块。模型筛选模块，用于从至少一个样本对象的行为数据中提取第一特征序列，其中，第一特征序列包括多个历史时间节点分别对应的多维度特征；基于第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差；对第一时间序列误差、第二特征序列和第三特征序列进行融合处理，得到分类阈值；基于分类阈值对待识别对象的行为数据进行分类处理，得到待识别对象的类别。若待识别对象的类别为异常类别，则通过异常预警模块对待识别对象进行异常预警，并将该待识别对象的相关账号/设备明细、相关账号/设备告警信息反馈至初始化查询条件进行存储。若待识别对象的类别为正常类别，则通过判定成功模块判定待识别对象通过支付行为验证。

参见图14，图14是本申请实施例提供的基于人工智能的对象分类方法的原理示意图。神经网络模型是一种按照误差逆向传播算法训练的多层前馈神经网络，是应用最广泛的神经网络。神经网络模型具有任意复杂的模式分类能力和优良的多维函数映射能力，解决了简单感知器不能解决的异或问题。从结构上讲，神经网络模型具有输入层、隐藏层和输出层；从本质上讲，神经网络模型就是以网络误差平方为目标函数、采用梯度下降法来计算目标函数的最小值。

本申请实施例通过从至少一个样本对象的行为数据中提取第一特征序列，其中，第一特征序列包括多个历史时间节点分别对应的多维度特征。其中，多维度特征可以包括原子维度特征指标和原子聚合维度特征指标。下面，以网络游戏的应用场景为例，结合下表2和表3说明原子维度特征指标和原子聚合维度特征指标。

表2原子维度特征指标

表3原子聚合维度特征指标

参见图10，图10是本申请实施例提供的异常活跃预警系统的架构示意图。

在步骤310中，将游戏端的玩家活跃行为等游戏内行为上报至数据集群。

在步骤311中，监控数据集群中各项数据，周期性进行特殊的特征工程/数据清洗。

基于数据清洗后的数据调用聚类模型31，得到用户活跃行为趋势。

在步骤312中，对用户活跃行为趋势异常的用户进行预防干预，如发布公告、邮件等。

基于清洗后的数据调用时间序列+神经网络二分类复合模型32(即，上文所提及的时间序列模型和神经网络模型)得到预测结果。

在步骤313中，确定和缓存时间序列+神经网络二分类复合模型阈值。

将预测结果与缓存的二分类模型阈值进行比较，得到判定结果。管理后台用于数据展示、策略启用/关闭，用户解封，管理员选择模型版本等等，管理后台还用于将配置信息存储至DB数据库中，并可以从DB数据库中提取展示存储信息。

若通过时间序列+神经网络二分类复合模型32所得到的分类结果显示为异常，则可以通过奖励、充值接口33进行异常活动判断，完成针对用户订单的状态判定，禁止行为异常的玩家完成相关奖励和游戏内道具获取。

总体的异常活跃预警系统如图9所示，结合数据集群中所监控的数据，对其进行周期性的特征监控和数据清洗用来进行数据分析。首先对数据进行特征分析和特征选择，其次对筛选后的数据进行时间序列+神经网络二分类复合模型预测，针对预测的结果进行缓存并启用相应的策略，另一方面对此批数据进行聚类分析得出并没有进入到黑名单的用户(但是行为很相近)并对这些用户进行预防干预，整个流程每一步的结果均存入数据库。

特征选择的作用在于保留了对基于人工智能的对象分类方法有帮助的特征，过滤掉对于基于人工智能的对象分类方法没有任何帮助且不会给基于人工智能的对象分类方法带来任何效果提升的特征。

现有技术中的特征选择主要通过单一的卡方检验、信息增益法等方式，对单个特征进行选择，但在本申请中由于需要大量的特征逻辑进行组合，单个特征的选择并不能满足需求(组合的逻辑特征太多)，因此，本申请实施例在单一特征选择的基础上递归组合特征(即对所有特征进行排列组合配对)，将子集的选择看作是一个搜索寻优问题，生成不同的组合，对组合进行评价，再与其他的组合进行比较。这样就将子集的选择看作是一个优化问题，在此基础上，使用启发式的优化粒子群算法，对特定的分类器选择最优的特征子集，对计算所得的信息增益最好的特征/组合特征进行之后的算法应用。

参见图11，图11是本申请实施例提供的优化粒子群算法的流程图。通过图11所示出的优化粒子群算法可以优化上文所述的特征选择。首先，初始化粒子群及参数设置。再令T＝1，进一步计算目标函数值，更新个体最优值Pbest及群体最优值Gbest。再判断是否满足收敛判据，若满足收敛判据，输出最优结果及迭代次数；若不满足收敛判据，更新每个粒子的位置矢量和速度矢量后，令T＝T+1，返回计算目标函数值。

将原始数据(多维度特征数据)作为输入进行特征选择。首先利用信息增益法筛选每个单一特征，在此基础上对所有突出的特征进行递归式的排列组合，对所有的排列组合结果进行配对并调用函数库的库函数，将排列组合过的特征作为x输入，对学习因子c1、c2等参数进行初始化，计算所有排列组合特征的目标函数值并得出最优结果，进而筛选得到有用特征，撇除无用的特征，提升算法后续运行效率，避免了无用特征占用算法运行时长。

对选择后的特征进行缓存记录，在每次算法运算之前都要进行特征选择运算得出相应的特征重置，以防止业务策略被摸清。调用优化粒子群算法的优势在于针对海量特征的计算优势和特征复杂度优势。

参见图12，图12是本申请实施例提供的基于人工智能的对象分类方法的原理示意图。时间序列+神经网络二分类复合模型的设计主要目的在于将特征选择后的数据结合逻辑判断指标进行二分类判断哪些用户是异常用户，实现方式为应用时间序列模型对特征选择过的数据进行预测，所得到的预测值(即上文所述的第四特征序列)和实际值(即上文所述的第一特征序列)对比，对得到的序列进行数据平稳化处理，再将残差序列(即上文所述的第二时间序列误差)标准化作为输入，根据上一步中的方法调整参数，经学习和神经网络模型建模后，对得出的误差的数据集进行预测，得到残差序列的预测值(即上文所述的第一时间序列误差)，从而进一步合并计算得到预测值(即上文所述的分类阈值)。

首先使用时间序列模型对特征选择后的数据进行线性分析预测，实际反映出特征序列的线性变化规律(随季节、时间等)，再利用神经网络模型对时间序列模型实际值误差进行预测(反映出数据的非线性变化规律)得到复合模型误差，对误差做出一个预测值(复合模型误差，即上文所述的第一时间序列误差)，这样之后的测试数据可以在时间序列模型的基础上配合误差得出一个较客观的预测值，得到复合模型预测结果(即上文所述的分类阈值)。进而在运用线性数据变化规律的基础运用了神经网络非线性预测分析，提升了预测准确率。

参见图13，图13是本申请实施例提供的基于人工智能的对象分类方法的原理示意图，可以通过以下方式训练得到时间序列模型：平稳非白噪声序列、计算样本相关系数、模型识别、参数估计、模型检验，模型检验合格则进行模型优化，得到时间序列模型，进而对序列预测。

其中，平稳非白噪声序列是对非平稳序列进行平稳化处理之后得到的；计算样本相关系数是将平稳非白噪声序列进行相关计算而得到的；模型识别可以识别时间序列模型的类型，例如，自回归模型、移动平均模型和自回归移动平均模型；参数估计是对时序序列模型的参数进行估算；模型检验可以对确定的模型类型进行检验是否合格。

为了能够客观的反映时间序列+神经网络二分类复合模型的预测效果，可以采用计算时间序列+神经网络二分类复合模型的均方根误差(Root Mean Squar ed Error，RMSE)和平均相对误差(Mean Absolute Percent Error，MAPE)来对比效果。以游戏营销活动为例，将游戏营销活动的历史数据总体划分为500个时间节点，将前400个时间节点的数据作为训练数据，后100个时间节点的数据作为测试数据进行训练，首先针对前400个数据节点的数据进行时间序列模型的序列化预测，得到模型arima(2,2,4)，再对比前400个数据节点的数据的实际值求出前400个数据节点的数据对应的残差，将前400个数据节点的数据作为输入神经网络模型并保存好参数，最后对比测试数据的预测效果。单一模型和时间序列模型与神经网络复合模型的两个指标效果对比如下表4所示。

表4单一模型和时间序列模型与神经网络复合模型的两个指标效果对比

通过上表4可知，时间序列+神经网络二分类复合模型所预测的RMSE和MAPE的值明显小于另外两种单一的预测模型，因此时间序列+神经网络二分类复合模型的预测的准确度要在一定程度上高于单一的时间序列模型和单一的神经网络模型预测的准确度，时间序列+神经网络二分类复合模型的预测误差降低了许多。此对比结果表明时间序列+神经网络二分类复合模型利用了时间预测模型线性趋势预测的优势和神经网络模型非线性趋势的预测的优势，互补了两个模型的优点，在一定程度上克服了两个模型的缺陷，反映出了数据的变化规律。

本申请实施例通过业务策略界定一个最低密度触达人数(即定义要监控的一个已确定的异常用户类似的一个即将变为异常用户的人群)，通过统计中心点在能触达密度范围内的点数到达所定义的最低密度触达人数时停止计算并返回聚合成若干个簇，并且将每一簇的数据集作为新的输入，再迭代聚合求出质心的位置。例如，设置一个异常用户能最低密度触达的用户为5个，进行20轮迭代算法运算。在每一轮迭代中，首先随机定义一定数量的随机点，对每个随机点为圆心，以最低触达用户数为条件不断向聚类内增加用户，一旦达到最低用户数阈值，这个值就是该点密度值。如果有一个高密度的点在另一个高密度的点的圈内，就把这两个点连接起来，这样可以把好多点不断地串联出来。之后，如果有低密度的点也在高密度的点的圈内，把它也连到最近的高密度点上，称之为边界点。这样所有能连到一起的点就成一了个簇，而不在任何高密度点的圈内的低密度点就是异常点。根据以上参数计算所得的每个异常行为用户都会发现五个行为相似的异常行为用户(体现在活跃、登录等用户行为方面，在聚类算法中表现为一个类)，经后期和业务测试确认预警成功率在75％以上，即被聚类出来的用户(经提示后)有75％不会继续触发异常行为的高压线。

下面继续说明本申请实施例提供的基于人工智能的对象分类装置455的实施为软件模块的示例性结构，在一些实施例中，如图2所示，存储在存储器440的基于人工智能的对象分类装置455中的软件模块可以包括：提取模块4551，用于从至少一个样本对象的行为数据中提取第一特征序列，其中，第一特征序列包括多个历史时间节点分别对应的多维度特征；预测模块4552，用于基于第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差；融合模块4553，用于对第一时间序列误差、第二特征序列和第三特征序列进行融合处理，得到分类阈值；分类模块4554，用于基于分类阈值对待识别对象的行为数据进行分类处理，得到待识别对象的类别。

在一些实施例中，预测模块4552，还用于基于第一特征序列调用时间序列模型进行时间序列预测处理，得到第二特征序列和第四特征序列，其中，第二特征序列包括第一特征序列之后的多个未来时间节点分别对应的多维度特征，第四特征序列包括第一特征序列的部分历史时间节点分别对应的多维度特征；确定第一特征序列与第四特征序列之间的第二时间序列误差；基于第二特征序列调用神经网络模型进行时间序列预测处理，得到第三特征序列，其中，第三特征序列与第二特征序列包括相同的多个未来时间节点；基于第二时间序列误差调用神经网络模型进行时间序列预测处理，得到第一时间序列误差。

在一些实施例中，融合模块4553，还用于对第二特征序列和第三特征序列进行加权平均处理，得到第五特征序列；对第五特征序列和第一时间序列误差进行求和处理，得到第六特征序列；对第六特征序列进行归一化处理，得到分类阈值。

在一些实施例中，提取模块4551，还用于从至少一个样本对象的行为数据中提取多个历史时间节点的特征数据；从多个历史时间节点的特征数据中选择高于波动程度阈值的数据，将选择的高于波动程度阈值的数据按照时间先后顺序进行排序处理，得到第一特征序列。

在一些实施例中，提取模块4551，还用于基于行为数据的原子维度指标，从行为数据中提取多个历史时间节点的原子维度特征数据，其中，原子维度指标为行为数据中不可再拆分的指标；基于行为数据的聚合维度指标，从行为数据中提取多个历史时间节点的聚合维度特征数据，其中，聚合维度指标由多个原子维度指标聚合而成。

在一些实施例中，基于人工智能的对象分类装置还包括：第一分类模块，用于对至少一个样本对象的行为数据进行聚类处理，得到每个样本对象分别所属的样本对象集合；根据待识别对象的行为数据与每个样本对象的行为数据之间的差异值，确定待识别对象所属的样本对象集合；将待识别对象所属的样本对象集合中的样本对象的类别，确定为待识别对象的相似类别。

在一些实施例中，分类模块4554，还用于针对任意一个样本对象执行以下处理：根据任意一个样本对象的行为数据，确定任意一个样本对象所属的第一样本对象集合，其中，第一样本对象集合中的样本对象与任意一个样本对象之间的距离小于半径参数；根据第一样本对象集合中的每一样本对象和半径参数，确定第一样本对象集合中的每一样本对象的半径参数范围内的第二样本对象集合，其中，第二样本对象集合的数量与第一样本对象集合中的样本对象的数量相同；当第二样本对象集合中的样本对象的数量小于领域密度阈值时，对第一样本对象集合中的样本对象和第二样本对象集合中的样本对象进行选择处理，得到任意一个样本对象所属的样本对象集合。

在一些实施例中，分类模块4554，还用于当待识别对象的行为数据大于分类阈值时，确定待识别对象的类别为异常类型；当待识别对象的行为数据小于或等于分类阈值时，确定待识别对象的类别为正常类型。

在一些实施例中，基于人工智能的对象分类装置还包括：训练模块，用于通过以下方式训练得到时间序列模型：对第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列；根据平稳化的第一特征序列的统计特性，在多个候选时间序列模型中确定待训练的目标时间序列模型，其中，多个候选时间序列模型包括自回归模型、移动平均模型和自回归移动平均模型；对目标时间序列模型进行定阶处理和参数估计处理，得到用于进行时间序列预测处理的时间序列模型。

在一些实施例中，训练模块，还用于对目标时间序列模型进行定阶处理，得到目标时间序列模型的起始预测时间节点，其中，起始预测时间节点为第四特征序列的起始时间节点；对目标时间序列模型进行参数估计操作，得到目标时间序列模型的预测参数；根据目标时间序列模型的起始预测时间节点和时间序列模型的预测参数，确定用于进行时间序列预测处理的时间序列模型。

在一些实施例中，基于人工智能的对象分类装置还包括：判断模块，用于当待识别对象的类别为异常类型时，拦截待识别对象的业务请求；当待识别对象的类别为正常类型时，响应待识别对象的业务请求。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的基于人工智能的对象分类方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

综上，通过本申请实施例具有以下有益效果：

(1)由于第一特征序列包括多个历史时间节点分别对应的多维度特征，使得第一特征序列能够更加准确的表征对象的历史行为。

(2)由于第一特征序列同时调用了时间序列模型和神经网络模型进行预测处理，双重预测处理使得预测更加准确。

(3)由于第一特征序列调用时间序列模型和神经网络模型进行时间预测处理，得到了第一时间序列误差，进一步将第一时间序列误差与预测得到的第二特征序列和第三特征序列进行融合处理，三重预测结果的融合所得到的分类阈值对待识别对象的行为数据进行分类处理，使得分类结果更加准确。

(4)基于行为数据的原子维度指标和聚合维度指标，从行为数据中提取多个历史时间节点的特征数据，使得提取到的特征数据可以较好的反映出对象不同维度的特征，为后续时间序列模型和神经网络模型的预测处理，提供了坚强的数据保障。

(5)由于在大数定理和中心定理中要求样本同分布，即要求序列的平稳性，而时间序列模型的训练是建立在大数定理和中心定理的前提条件下的，因此，首先需要对第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列，以便于后续时间序列模型的训练。

(6)通过根据波动程度阈值对样本对象的多个历史时间节点的特征数据进行筛选，从而保留了价值较高的特征数据，筛选掉了价值较低的特征数据。所得到的第一特征序列中的每一时间节点的特征数据均具有典型代表性，由于筛选后的第一特征序列数据量大幅缩减但是信息量却没有影响，从而有效缩短了算法运行时长，显著提高了算法运行效率。

(7)通过调用时间序列模型对第一特征序列进行了初步时间序列预测处理，得到了包括第一特征序列之后的多个未来时间节点分别对应的多维度特征的第二特征序列和包括第一特征序列的部分历史时间节点分别对应的多维度特征的第四特征序列。进一步，通过两次调用神经网络模型对第二特征序列和第二时间序列误差进行时间序列预测处理，分别得到第三特征序列和第一时间序列误差。如此，通过调用时间序列模型和神经网络模型进行了三次时间序列预测处理，有效提高了时间序列预测的准确性。

(8)通过对第二特征序列和第三特征序列进行加权平均处理，以及对第五特征序列和第一时间序列误差进行求和处理，并对第六特征序列进行归一化处理，得到分类阈值，从而有效提高了分类阈值的准确性。

(9)在得到待识别对象的类别之后，通过确定待识别对象所属的样本对象集合，将待识别对象所属的样本对象集合中的样本对象确定为与待识别对象类别相似的对象。若待识别对象为异常对象，则待识别对象所属的样本对象集合中的样本对象确定为与待识别对象类别相似的对象，即潜在异常对象。从而在保证了识别异常对象的精度的同时，实现了识别异常对象的广度。进而可以无遗漏的识别出所有的异常对象。

(10)根据待识别对象是异常类型/正常类型，进一步对待识别对象的业务请求进行拦截或响应，从而保证了异常类型的待识别对象的业务请求被拦截，以防止异常类型的待识别对象影响正常的业务运转。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种基于人工智能的对象分类方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差，包括：

基于所述第一特征序列调用所述时间序列模型进行时间序列预测处理，得到所述第二特征序列和第四特征序列，其中，所述第二特征序列包括所述第一特征序列之后的多个未来时间节点分别对应的多维度特征，所述第四特征序列包括所述第一特征序列的部分历史时间节点分别对应的多维度特征；

确定所述第一特征序列与所述第四特征序列之间的第二时间序列误差；

基于所述第二特征序列调用神经网络模型进行时间序列预测处理，得到所述第三特征序列，其中，所述第三特征序列与所述第二特征序列包括相同的所述多个未来时间节点；

基于所述第二时间序列误差调用所述神经网络模型进行时间序列预测处理，得到所述第一时间序列误差。

3.根据权利要求1所述的方法，其特征在于，所述对所述第一时间序列误差、所述第二特征序列和所述第三特征序列进行融合处理，得到分类阈值，包括：

对所述第二特征序列和所述第三特征序列进行加权平均处理，得到第五特征序列；

对所述第五特征序列和所述第一时间序列误差进行求和处理，得到第六特征序列；

对所述第六特征序列进行归一化处理，得到所述分类阈值。

4.根据权利要求1所述的方法，其特征在于，所述从至少一个样本对象的行为数据中提取第一特征序列，包括：

从所述至少一个样本对象的行为数据中提取多个历史时间节点的特征数据；

从所述多个历史时间节点的特征数据中选择高于波动程度阈值的数据，将选择的高于波动程度阈值的数据按照时间先后顺序进行排序处理，得到所述第一特征序列。

5.根据权利要求4所述的方法，其特征在于，所述从所述至少一个样本对象的行为数据中提取多个历史时间节点的特征数据，包括：

基于所述行为数据的原子维度指标，从所述行为数据中提取多个历史时间节点的原子维度特征数据，其中，所述原子维度指标为所述行为数据中不可再拆分的指标；

基于所述行为数据的聚合维度指标，从所述行为数据中提取多个历史时间节点的聚合维度特征数据，其中，所述聚合维度指标由多个所述原子维度指标聚合而成。

6.根据权利要求1所述的方法，其特征在于，所述基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别之后，所述方法还包括：

对所述至少一个样本对象的行为数据进行聚类处理，得到每个样本对象分别所属的样本对象集合；

根据所述待识别对象的行为数据与每个所述样本对象的行为数据之间的差异值，确定所述待识别对象所属的样本对象集合；

将所述待识别对象所属的样本对象集合中的样本对象的类别，确定为所述待识别对象的相似类别。

7.根据权利要求6所述的方法，其特征在于，所述对所述至少一个样本对象的行为数据进行聚类处理，得到每个样本对象分别所属的样本对象集合，包括：

针对任意一个样本对象执行以下处理：根据所述任意一个样本对象的行为数据，确定所述任意一个样本对象所属的第一样本对象集合，其中，所述第一样本对象集合中的样本对象与所述任意一个样本对象之间的距离小于半径参数；

根据所述第一样本对象集合中的每一样本对象和所述半径参数，确定所述第一样本对象集合中的每一样本对象的半径参数范围内的第二样本对象集合，其中，所述第二样本对象集合的数量与所述第一样本对象集合中的样本对象的数量相同；

当所述第二样本对象集合中的样本对象的数量小于领域密度阈值时，对所述第一样本对象集合中的样本对象和所述第二样本对象集合中的样本对象进行选择处理，得到所述任意一个样本对象所属的样本对象集合。

8.根据权利要求1所述的方法，其特征在于，所述基于所述分类阈值对待识别对象的行为数据进行分类处理，得到所述待识别对象的类别，包括：

当所述待识别对象的行为数据大于所述分类阈值时，确定所述待识别对象的类别为异常类型；

当所述待识别对象的行为数据小于或等于所述分类阈值时，确定所述待识别对象的类别为正常类型。

9.根据权利要求1所述的方法，其特征在于，所述基于所述第一特征序列分别调用时间序列模型和神经网络模型进行时间序列预测处理，得到第二特征序列、第三特征序列以及第一时间序列误差之前，所述方法还包括：

通过以下方式训练得到所述时间序列模型：

对所述第一特征序列进行数据平稳化处理，得到平稳化的第一特征序列；

根据所述平稳化的第一特征序列的统计特性，在多个候选时间序列模型中确定待训练的目标时间序列模型，其中，所述多个候选时间序列模型包括自回归模型、移动平均模型和自回归移动平均模型；

对所述目标时间序列模型进行定阶处理和参数估计处理，得到用于进行时间序列预测处理的所述时间序列模型。

10.一种基于人工智能的对象分类装置，其特征在于，包括：