CN110874765A

CN110874765A - 一种数据处理方法、装置、设备及存储介质

Info

Publication number: CN110874765A
Application number: CN201911006453.4A
Authority: CN
Inventors: 金诚; 何峰; 程序; 张发强; 蔡红云
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-10-22
Filing date: 2019-10-22
Publication date: 2020-03-10
Anticipated expiration: 2039-10-22
Also published as: CN110874765B

Abstract

本发明提供一种数据处理方法、装置、设备及存储介质，该方法包括：获取目标对象在第一时间的内部历史信息以及在第一时间内与目标对象具有相互关系的外部历史关联信息；基于第一神经网络模型对内部历史信息和外部历史关联信息进行分类处理，得到目标对象在第二时间内是否执行预设操作的分类结果；基于第二神经网络模型对内部历史信息和外部历史关联信息进行预测处理，得到目标对象在第二时间内执行预设操作的操作结果；基于分类结果和操作结果，得到目标对象在第二时间内的操作信息，第一时间为当前时间之前的时间，第二时间为当前时间之后的时间。本发明能够降低日常运营数据的维护成本，实现近期运营指标的精确定量预测。

Description

一种数据处理方法、装置、设备及存储介质

技术领域

本发明属于计算机技术领域，具体涉及一种数据处理方法、装置、设备及存储介质。

背景技术

现有技术通常采用时间序列模型(prophet)进行运营预测。prophet模型通常采集数月甚至数年的数据，并对未来一年或数月的数据进行预测。该模型考虑季节性因素(周期性变化)的影响s(t)、节假日因素的影响h(t)、历史趋势变化g(t)的影响，并引入∈_t拟合无法用模型描述的异常点，最终基于已知的某个运营数据指标y，预测未来该指标的变化，计算公式如下：

y(t)＝g(t)+s(t)+h(t)+∈_t，

其中，g(t)采用非线性函数和加权线性函数表达，通过控制参数变化来描述最主要的趋势；s(t)需要长期观察出周期性的变化，需手工编写调试；而节假日因素函数h(t)依靠数据分析和人工修正。

现有的prophet模型的运营预测方法需要人工及时干预：对每一个运营指标，都需要人工设计节假日(周期性规则)干预，并过一段时间进行人工修正，运营预测的维护成本较高。此外prophet模型需要采集长达数月甚至数年的数据，并对未来一年或数月进行预测，该模型采集的数据区间长度较长，适用于长线趋势预测，但不适用于近期(近在眼前的一两周或一个月)运营指标的精确定量预测。

发明内容

为了降低日常运营数据的维护成本，实现近期(近在眼前的一两周或一个月)运营指标的精确定量预测，本发明提出一种数据处理方法、装置、设备及存储介质。

一方面，本发明提出了一种数据处理方法，所述方法包括：

获取目标对象在第一时间的内部历史信息以及在所述第一时间内与所述目标对象具有相互关系的外部历史关联信息；

基于第一神经网络模型对所述内部历史信息和所述外部历史关联信息进行分类处理，得到所述目标对象在第二时间内是否执行预设操作的分类结果；

基于第二神经网络模型对所述内部历史信息和所述外部历史关联信息进行预测处理，得到所述目标对象在所述第二时间内执行所述预设操作的操作结果；

基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息；

其中，所述第一时间为当前时间之前第一预设时间的时间，所述第二时间为所述当前时间之后第二预设时间的时间。

另一方面，本发明提出了一种数据处理装置，所述装置包括：

历史信息获取模块，用于获取目标对象在第一时间的内部历史信息以及在所述第一时间内与所述目标对象具有相互关系的外部历史关联信息；

分类结果获取模块，用于基于第一神经网络模型对所述内部历史信息和所述外部历史关联信息进行分类处理，得到所述目标对象在第二时间内是否执行预设操作的分类结果；

操作结果获取模块，用于基于第二神经网络模型对所述内部历史信息和所述外部历史关联信息进行预测处理，得到所述目标对象在所述第二时间内执行所述预设操作的操作结果；

操作信息确定模块，用于基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息；

另一方面，本发明提出了一种设备，所述设备包括：处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述所述的数据处理方法。

另一方面，本发明提出了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述所述的数据处理方法。

本发明提出的一种数据处理方法、装置、设备及存储介质，综合考虑用户的内部因素和外部因素，只需要采集用户在过去一两周或者一个月的自身内部历史信息和与用户具有相互关系的外部历史关联信息，采用第一神经网络模型与第二神经网络模型结合的方式对用户在未来某一时间点或某一时间区间内的操作信息进行预测，不需要人工及时干预，只需一开始确定好用户的内部历史信息和外部历史关联信息，之后预测方案可以例行运行下去，维护成本低，且可以满足相对稳定的预测精度，预测结果鲁棒。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本发明实施例提供的数据处理的整体架构示意图。

图2是本发明实施例提供的数据处理方法的一种流程示意图。

图3是本发明实施例提供的获取第一神经网络模型的流程示意图。

图4是本发明实施例提供的获取第二神经网络模型的流程示意图。

图5是本发明实施例提供的区块链系统的一个可选的结构示意图。

图6是本发明实施例提供的区块结构一个可选的示意图。

图7是采用本发明实施例提供的数据处理方法在游戏业务场景中对每日用户登录人数进行预测的预测结果示意图。

图8是采用本发明实施例提供的数据处理方法在游戏业务场景中对每周用户平均时长进行预测的预测结果示意图。

图9是本发明实施例提供的数据处理方法的另一种流程示意图。

图10是本发明实施例提供的数据处理方法的另一种流程示意图。

图11是本发明实施例提供的数据处理方法的另一种流程示意图。

图12是本发明实施例提供的数据处理装置的结构示意图。

图13是本发明实施例提供的服务器结构示意图。

具体实施方式

随着人工智能(Artificial Intelligence,AI)的研究和进步，AI在多个领域展开研究和应用。AI是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

具体地，本发明实施例提供的方案涉及人工智能的机器学习(Machine Learning,ML)技术。ML是门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科，其专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。ML是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。ML通常包括深度学习、增强学习、迁移学习、归纳学习、示教学习等技术。而深度学习又可以进一步包括人工神经网络、深信度网络、限制波尔兹曼机、自动编码器、稀疏编码、注意学习等技术。

具体地，本发明实施例提供的方案涉及人工神经网络技术，比如，获取第一神经网络模型和第二神经网络模型的步骤涉及人工神经网络技术中的深度神经网络或卷积神经网络技术。

具体地，本申请实施例提供的技术方案具体通过如下实施例进行说明。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1是本发明实施例提供的数据处理的整体架构示意图，该数据处理的整体架构可以作为数据处理方法的实施环境。如图1所示该数据处理的整体架构可以包括数据采集与表示、第一神经网络模型、第二神经网络模型、个体层面的行为预测、群体层面的运营预测、活动指标权重识别和运营应用等。

具体地，数据采集与表示又可以包括用户历史特征采集、活动特性采集和向量化表示、用户活动参与特征采集、用户人群分类或画像分类、按天例行化采集等。

具体地，第一神经网络模型又可以包括树模型回归器、深度学习回归器、训练数据维度选择等。

具体地，第二神经网络模型又可以包括树模型分类器、深度学习分类器、训练数据维度选择等。

具体地，个体层面的行为预测又可以包括是否登录、游戏时长、是否付费、付费金额、无活动上线/上下单一活动/上线多个活动等。

具体地，群体层面的运营预测又可以包括登录人数、人均游戏时长、付费人数、付费总金额、人群分类或分类人群的运营数据预测等。

具体地，活动指标权重识别又可以包括老活动参数设计优化、单活动参与程度特征的权重识别、多活动活动特征的权重识别、新活动的参数推荐等。

需要说明的是，图1仅仅是一种示例。

在一个可行的实施例中，本发明实施例提供的数据处理方法可以运行在客户端，所述客户端可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、车载、音箱、电视、机器人等类型的实体设备，也可以包括运行于实体设备中的软体，例如虚拟机等。

在另一个可行的实施例中，本说明书提供的数据处理方法可以运行在服务器，所述服务器可以包括个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群。

图2是本发明实施例提供的一种数据处理方法的流程示意图，该数据处理方法可以运行与上述数据处理的整体架构中。本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示，所述方法可以包括：

S101.获取目标对象在第一时间的内部历史信息以及在所述第一时间内与所述目标对象具有相互关系的外部历史关联信息。

本发明实施例中，可以结合目标对象，即用户的内部因素和外部因素，对目标对象的日常运营数据进行预测，在进行日常运营预测之前，可以先对内部因素和外部因素进行确定，之后预测方案可以例行运行下去，不需要人工干预，维护成本低，且可以满足相对稳定的预测精度，预测结果鲁棒。

本发明实施例中的内部因素可以为用户的内部历史信息，以应用场景为游戏业务中的日常数据监测为例，该内部历史信息可以包括用户自身历史属性，在游戏中的等级，战力，性别，上周登录天数，上周游戏时长，自身付费情况，最后登录时间，用户对游戏的偏好等特征。

本发明实施例中的外部因素可以为所述目标对象具有相互关系的外部历史关联信息，以应用场景为游戏业务中的日常数据监测为例，该外部历史关联信息可以为用户社交相关的特征以及其他外部特征，该用户社交相关的特征可以为好友数，活跃好友数，活跃的亲密好友数，好友数的对数，好友付费情况、好友登录天数、好友在线时长等，该其他外部特征可以为在突发事件期间(例如节假日、活动)的瞬时动态参与特征等。

本发明实施例中的第一时间为当前时间之前第一预设时间的时间，优选地，该第一时间为近在眼前一两周的时间，比如近k天、近两周、本周、近3天、近1天等多尺寸时间。在实际应用中，可以选定时间窗口进行预测，具有较好的灵活性。

本发明实施例通过采集用户近k天、近2周、本周、近3天、近1天等多个尺度下的内部历史信息以及外部历史关联信息，从而实现对近在眼前一两周的时间内的日常运营数据进行精准预测。其中，k可以根据实际情况自行设定。

S103.基于第一神经网络模型对所述内部历史信息和所述外部历史关联信息进行分类处理，得到所述目标对象在第二时间内是否执行预设操作的分类结果。

S105.基于第二神经网络模型对所述内部历史信息和所述外部历史关联信息进行预测处理，得到所述目标对象在所述第二时间内执行所述预设操作的操作结果。

本发明实施例中，可以采用第一神经网络模型预测与第二神经网络模型预测相结合的方式对内部历史信息和所述外部历史关联信息进行处理。

本发明实施例中，该第二时间为当前时间之后第二预设时间的时间，比如，第k天、第1-k天内的时间范围等。即本发明实施例可以通过采集用户k天、近2周、本周、近3天、近1天等多个尺度下的内部历史信息以及外部历史关联信息，实现对某一天、某一时间区间内的日常运营数据进行预测，预测精度更高、预测范围更广。其中，k可以根据实际情况自行设定。

该分类结果可以直接为是或否的二分类结果，也可以为一个概率值，根据概率值得出是或否的二分类结果。以应用场景为游戏业务中的日常数据监测为例，该分类结果可以包括用户在未来第k天是否登录，是否付费，是否购买，是否加好友等，或用户在未来第1-k天的范围内是否登录，是否付费，是否购买，是否加好友等。其中，k可以根据实际情况自行设定。以该操作结果可以包括用户在未来第k天的游戏时长、付费金额、好友人数等，或用户在未来第1-k天内的游戏时长、付费金额、好友人数等。

在一个可行的实施例中，第一神经网络模型可以包括随机森林(andomForest)、极端梯度提升(eXtreme Gradient Boosting，Xgboost)、多层感知机(MultilayerPerceptron，MLP)等树模型分类算法。还可以包括对上述树模型分类算法与深层神经网络算法相融合形成的算法。其中，该深层神经网络算法可以包括深度兴趣网络(DeepInterest Network,DIN)、广度和深度模型(Wide and Deep)等。

在一个可行的实施例中，第二神经网络模型可以包括支持向量回归(SupportVector Regression，SVR)、逻辑回归(Logistic Regression)、岭回归(Ridge)、k近邻回归(k-nearest neighbors)等树模型回归算法。还可以包括对上述树模型回归算法与深层神经网络算法相融合形成的算法。其中，该深层神经网络算法可以包括深度兴趣网络(DeepInterest Network,DIN)、广度和深度模型(Wide and Deep)等。

本发明实施例中，如图3所示，所述第一神经网络模型的获取步骤可以包括：

S201.获取样本对象在第一样本时间的内部历史样本信息以及在所述第一样本时间内与所述样本对象具有相互关系的外部历史样本关联信息。

S203.对所述样本对象在所述第二时间内是否执行预设操作的分类结果进行标注；

S205.基于所述内部历史样本信息和所述外部历史样本关联信息对第一预设机器学习模型进行分类训练学习，在分类训练学习过程中调整所述第一预设机器学习模型的模型参数至所述第一预设机器学习模型输出的是否执行预设操作的分类结果与输入的样本对象相匹配。

S207.将当前模型参数对应的第一机器学习模型作为所述第一神经网络模型。

本发明实施例中，如图4所示，所述第二神经网络模型的获取步骤包括：

S301.获取样本对象在第一样本时间的内部历史样本信息以及在所述第一样本时间内与所述样本对象具有相互关系的外部历史样本关联信息。

S303.对所述样本对象在所述第二时间内执行预设操作的操作结果进行标注。

S305.基于所述内部历史样本信息和所述外部历史样本关联信息对第二预设机器学习模型进行训练学习，在训练学习过程中调整所述第二预设机器学习模型的模型参数至所述第二预设机器学习模型输出的执行预设操作的操作结果与输入的样本对象相匹配。

S307.将当前模型参数对应的第二机器学习模型作为所述第二神经网络模型。

本发明实施例中，在上述两个模型训练过程中，可以基于训练时求解最小损失函数时，参数收敛得到历史样本信息权重或外部历史样本信息的权重，根据权重，可以得到数据维度的相对重要性，得到对日常运营数据的预测最重要的几维指标。那在对模型更新时，为了达到更高的预测精度，可以选择对日常运营数据最重要的几维指标进行模型训练更新。相应地，在预测的时候，也可以有选择地采集对日常运营数据最重要的几维指标作为特征进行预测。

在一个可行的实施例中，S201中的样本对象在第一样本时间的内部历史样本信息以及在所述第一样本时间与所述样本对象具有相互关系的外部历史样本关联信息，S301中的样本对象在第一样本时间的内部历史样本信息以及在所述第一样本时间与所述样本对象具有相互关系的外部历史样本关联信息，可以存储于区块链系统中。参见图5，图5所示是本发明实施例提供的区块链系统的一个可选的结构示意图，多个节点之间形成组成的点对点(P2P，Peer To Peer)网络，P2P协议是一个运行在传输控制协议(TCP，TransmissionControl Protocol)协议之上的应用层协议。在区块链系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。

参见图5示出的区块链系统中各节点的功能，涉及的功能包括：

1)路由，节点具有的基本功能，用于支持节点之间的通信。

节点除具有路由功能外，还可以具有以下功能：

2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其他节点，供其他节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。

3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(Block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。

参见图6，图6为本发明实施例提供的区块结构(Block Structure)一个可选的示意图，每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值，各区块通过哈希值连接形成区块链。另外，区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了相关的信息，用于验证其信息的有效性(防伪)和生成下一个区块。

S107.基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息；其中，所述第一时间为当前时间之前第一预设时间的时间，所述第二时间为所述当前时间之后第二预设时间的时间。

本发明实施例中，可以结合上述分类算法和回归算法得到的预测结果，对用户在第二时间内的操作信息进行预测，其中，该操作信息可以为用户的行为数据。比如，用户在第二时间内是否会执行某些操作行为以及在执行某些操作行为后会得到怎样的操作信息进行汇总，从而得到用户在未来第k天、或第1-k天的操作信息。

具体地，所述基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息，可以包括；

对所述分类结果和所述操作结果进行汇总，得到所述目标对象在所述第二时间内的操作信息。

采用本发明实施例提供的方法在游戏业务场景中对每日用户登录人数进行预测的预测结果示意图可以如图7所示，图7中的横坐标为日期，纵坐标为登录人数，对每周用户平均时长进行预测的预测结果示意图可以如图8所示，图8中的横坐标为日期，纵坐标为人均游戏时长，从图7和图8中可以看出，本发明实施例可以通过采集近在眼前一两周或一个月的数据，对某一天、某一时间区间内的日常运营数据进行预测精准预测。

本发明实施例可以实现对个体层面的行为预测，具体为：结合在分类算法模块和回归算法模块得到的预测结果，每个用户在分类预测上有概率，在回归预测上有行为的连续值。

本发明实施还可以实现群体层面的行为预测，具体为：基于个体层面的行为预测结果，可以汇总得到群体层面的行为预测结果。例如，预测登录概率为50％以上的即认为该用户登录，否则不登录，即可得到群体层面的登录人数预测结果。其他运营指标也类似得到。

本发明实施例中还可以实现特定人群的行为预测，比如对特定人群的平均在线时长等运营指标进行预测，具体为：可以按照内部历史信息或所述外部历史关联信息，将用户划分不同类型的人群，然后按照S101-S107确定不同类型人群中的用户在第二时间的操作信息，接着对每个类型人群中的各个用户在第二时间的操作信息(比如，在线时长等)进行求平均值等操作，就可以实现对特定人群的平均在线时长等运营指标进行预测。

具体地，如图9所示，在所述基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息之后，所述方法还可以包括：

S109.将所述目标对象按照所述内部历史信息或所述外部历史关联信息进行分类，得到至少一个目标对象集；

S1011.获取每个目标对象集中的各个目标对象在所述第二时间内的操作信息；

S1013.对每个目标对象集中的各个目标对象在所述第二时间内的操作信息进行统计分析，得到每个目标对象集在所述第二时间内的操作信息汇总结果；其中，所述统计分析包括求和处理、求平均值处理或求加权平均值处理中的至少一种。

其中，S109-S1013中的目标对象集表征不同类型的人群。

在一个可行的实施例中，可以根据某一维度特征的取值从1～m将用户划分为不同类型，即在用户任一特征维度f下，基于该维度f上的数值大小(0～m)，做到每个f＝k(k＝0,1,2,...,m)的人群，精确预测满足f＝k的用户的平均操作信息，比如平均在线时长。假设某一特征维度f为“用户好友数”，则可以按照“用户好友数”这个特征维度将用户划分为好友数为0,1,2..,m的不同类型的人群，对每个类型的人群中各个用户的操作信息求平均值得到该类型的人群的平均操作信息。假设某一特征维度f为“亲密度”，可以将人群按亲密度划分，对每个类型的人群中各个用户的操作信息求平均值得到该类型的人群的平均操作信息。

在一些可行的实施例中，还可以依据某一维度特征的有无将用户划分为不同类型，也可以采用规则或预测模型将人群划分为不同类型，或者根据用户画像进行人群类型的划分。

本发明实施例中，还可以对单一活动的运营效果进行预估。在游戏业务场景中，“活动”是指为了某些特定目的而存在的特殊的系统，活动的目的有调节游戏节奏，增加留存，增加活跃，刺激付费，增加用户等。比如，以增加留存为目的的活动可以包括到、等级礼包、基金、月卡等。

在一个可行的实施例中，当在所述第一时间向所述目标对象推荐单一目标活动，则可以在内部历史信息和所述外部历史关联信息的基础上额外增加用户历史上在该活动中的活动参与特征，预测活动再次上线时的预估活动效果。具体地，如图10所示，若在所述第一时间向所述目标对象推荐单一目标活动，则所述方法还可以包括：

S401.获取所述目标对象在所述第一时间内参与所述目标活动的第一历史参与信息。

S403.基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行分类处理，得到在所述第二时间内是否向所述目标对象推荐所述单一目标活动的分类结果。

S405.基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行预测处理，得到在所述第二时间内向所述目标对象推荐所述单一目标活动时，所述目标对象参与所述单一目标活动的活动参与结果。

S407.基于所述在所述第二时间内是否向所述目标对象推荐所述单一目标活动的分类结果以及所述目标对象参与所述单一目标活动的活动参与结果，得到所述单一目标活动在所述第二时间内的活动成果数据。

S401-4307中的第一时间、第二时间、内部历史信息、外部历史关联信息均与S101-S107中相同，在此不再赘述。其中，S403中额外加入的第一历史参与信息表征活动参与特征，可以将所有参加活动的用户，按照单个活动的相关指标，将用户的参与程度表示为相关指标上的大小值，值越大表示在该指标上的参与程度越高。具体地，可以按天例行化对活动参与特征进行采集，采集过程可以如下；针对每个活动，从曝光好友数，点击好友数，互动好友数，积分，领奖，排名，签到次数、分享次数、点击次数、送金币次数、访问空间类次数、聊天类次数、任务完成次数等方面采集用户参与活动的特征。

S403-S405中高复用了预测日常运营数据所使用到的内部历史信息和所述外部历史关联信息，同时高复用了预测日常运营数据所使用到的第一神经网络模型和第二神经网络模型，算法模块中的算法根据实际使用情况进行优化替换或加新。此外，根据训练过程中得到的权重，可以得到活动参与程度中哪些指标关键；得到对不同的活动而言，经过统一向量化表示之后，哪些维度对不同的运营指标起到多大的作用。从而实现了使用不同维度的训练数据，完成不同层面预测目标的效果。

本发明实施例中，通过S401-S407，可以在向用户推荐所述单一目标活动时，即所述单一目标活动重新上线的活动成果数据(即预估活动效果)，比如，该预估活动效果可以为用户在活动中参与的程度与活动对用户行为提升之间量化的关系等。

在另一个可行的实施例中，当在所述第一时间向所述目标对象推荐至少两个目标活动，则可以单个活动预测的基础上，额外基于活动本身的特征属性，预测至少两个目标活动同时上线时预估活动效果。具体地，如图11所示，若在所述第一时间向所述目标对象推荐至少两个目标活动，则所述方法还可以包括：

S501.获取所述目标对象在所述第一时间内参与所述至少两个目标活动的第二历史参与信息和所述至少两个目标活动的属性信息。

S503.基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行分类处理，得到在所述第二时间内是否向所述目标对象同时推荐所述至少两个目标活动的分类结果。

S505.基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行预测处理，得到在所述第二时间内向所述目标对象同时推荐所述至少两个目标活动时，所述目标对象参与所述至少两个目标活动的活动参与结果。

S507.基于所述在所述第二时间内是否向所述目标对象同时推荐所述至少两个目标活动的分类结果以及所述目标对象参与所述至少两个目标活动的活动参与结果，得到所述至少两个目标活动在所述第二时间内的活动综合成果数据。

S501-S507中的第一时间、第二时间、内部历史信息、外部历史关联信息均与S101-S107中相同，在此不再赘述。其中，S503中额外加入的至少两个目标活动的属性信息为多个活动各自的活动特征，活动特征可以为将所有活动按照若干位特征维度表示，这样一个活动就表示成一个向量。具体地，以按天例行化对对活动特征进行采集，采集过程可以如下：针对不同活动，从活动持续时间、活动类型(商业、活跃等)、活动覆盖人群、活动所需参与人数(个人、双人、多人)、活动奖励价值、活动奖励分段数、基本奖励价值、社交压力类型、积分计算模式、任务类型与任务数等方面将活动量化为几十维度的向量化表示。

S503-S505中高复用了预测日常运营数据所使用到的内部历史信息和所述外部历史关联信息，同时高复用了预测日常运营数据所使用到的第一神经网络模型和第二神经网络模型，算法模块中的算法根据实际使用情况进行优化替换或加新。此外，根据训练过程中得到的权重，可以得到活动参与程度中哪些指标关键；得到对不同的活动而言，经过统一向量化表示之后，哪些维度对不同的运营指标起到多大的作用。从而实现了使用不同维度的训练数据，完成不同层面预测目标的效果。

本发明实施例中，通过S501-S507，可以在向用户推荐所述至少两个目标活动，即所述至少两个目标活动重新上线时的活动综合成果数据(即多个活动同时存在的综合效果)，，比如，用户参与其中一个或多个活动大概能达到的活动效果。

本发明实施例在对活动进行预测的时候，可以支持老活动的参数设计优化，以及新活动的推荐参考；并且从个体层面预测，再延伸到人群整体和特定人群层面的预测。此外，基于各个维度数据体现出的效果，可以对以往活动加以改进，提升某些维度的作用，例如优化互动列表，增加潜在可互动的人数，提升活动效果；可以将以往活动的特征结合起来，组合创造出理论上效果更优的新活动形式，降低活动创新设计的试错成本。

本发明实施例提供的数据处理方法不仅可以对日常运营数据进行预测，还可以对单一或多个活动进行预测，一方面，不需要人工及时干预，只需一开始对内部因素和外部因素进行确定，之后预测方案可以例行运行下去，维护成本低；另一方面，可针对全量的注册用户，也可将人群分类，预测结果参考价值高；另一方面，可智能化的采用相应的数据特征，完成日常长线运营数据预测、单一或多运营活动的效果预测等多个任务；另一方面分类算法和回归算法，算法可优化替换或加新，从而可以满足运营指标中诸如登录预测等分类指标，时长预测等回归指标；另一方面，综合考虑了用户自身(内部性)的登录数据，在线时长数据，以及用户在社交方面(社交外部性)的好友数、活跃好友数、亲密活跃好友数，预测精度较高；另一方面，可选定时间窗口进行预测，具有较好的灵活性；另一方面，可以按天例行化对内部历史信息和外部历史关联信息进行采集和处理，使得数据一致迭代更新，进一步提高预测精度；另一方面，可以支持老活动的参数设计优化，以及新活动的推荐参考；并且从个体层面预测，再延伸到人群整体和特定人群层面的预测；另一方面，本发明实施例提供的数据处理方法在针对千万用户级别的游戏，可以做到在本地客户端机上在可控时间内(数小时至24小时内)运行完毕。

在一个可行的实施例中，还可以通过以下方法对日常运营数据以及活动进行预测：从内部特征因素、外部特征因素中建立数学模型得到更加完备的prophet方案，降低人工维护成本、减少对长期数据的需求。

在一个可行的实施例中，还可以通过以下方法对日常运营数据以及活动进行预测：采用深度学习方法和时序模学习历史特征、活动特征、活动参与特征等内外部因素的特点，该方法的优点是当采集海量数据时，该方法的预测结果会显著高于当前方案，因此对大型游戏可能将有显著提升。

如图12所示，本发明实施例提供了一种数据处理装置，所述装置可以包括：

历史信息获取模块601，可以用于获取目标对象在第一时间的内部历史信息以及在所述第一时间内与所述目标对象具有相互关系的外部历史关联信息。

分类结果获取模块603，可以用于基于第一神经网络模型对所述内部历史信息和所述外部历史关联信息进行分类处理，得到所述目标对象在第二时间内是否执行预设操作的分类结果。

操作结果获取模块605，可以用于基于第二神经网络模型对所述内部历史信息和所述外部历史关联信息进行预测处理，得到所述目标对象在所述第二时间内执行所述预设操作的操作结果。

操作信息确定模块607，可以用于基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息。

本发明实施例中，所述操作信息确定模块可以进一步用于；对所述分类结果和所述操作结果进行汇总，得到所述目标对象在所述第二时间内的操作信息。

在一个可行的实施例中，所述装置还可以包括：

目标对象集获取模块，可以用于将所述目标对象按照所述内部历史信息或所述外部历史关联信息进行分类，得到至少一个目标对象集。

各个目标对象的操作信息获取模块，可以用于获取每个目标对象集中的各个目标对象在所述第二时间内的操作信息。

操作信息汇总结果获取模块，可以用于对每个目标对象集中的各个目标对象在所述第二时间内的操作信息进行统计分析，得到每个目标对象集在所述第二时间内的操作信息汇总结果。

其中，所述统计分析包括求和处理、求平均值处理或求加权平均值处理中的至少一种。

本发明实施例中，所述装置还可以包括第一神经网络模型获取模块，所述第一神经网络模型获取模块可以包括：

第一样本信息获取单元，可以用于获取样本对象在第一样本时间内的内部历史样本信息以及在所述第一样本时间与所述样本对象具有相互关系的外部历史样本关联信息。

第一标注单元，可以用于对所述样本对象在所述第二时间内是否执行预设操作的分类结果进行标注。

第一训练学习单元，可以用于基于所述内部历史样本信息和所述外部历史样本关联信息对第一预设机器学习模型进行分类训练学习，在分类训练学习过程中调整所述第一预设机器学习模型的模型参数至所述第一预设机器学习模型输出的是否执行预设操作的分类结果与输入的样本对象相匹配。

第一确定单元，可以用于将当前模型参数对应的第一机器学习模型作为所述第一神经网络模型。

本发明实施例中，所述装置还可以包括第二神经网络模型获取模块，所述第二神经网络模型获取模块可以包括：

第二样本信息获取单元，可以用于获取样本对象在第一样本时间内的内部历史样本信息以及在所述第一样本时间与所述样本对象具有相互关系的外部历史样本关联信息。

第二标注单元，可以用于对所述样本对象在所述第二时间内执行预设操作的操作结果进行标注。

第二训练学习单元，可以用于基于所述内部历史样本信息和所述外部历史样本关联信息对第二预设机器学习模型进行训练学习，在训练学习过程中调整所述第二预设机器学习模型的模型参数至所述第二预设机器学习模型输出的执行预设操作的操作结果与输入的样本对象相匹配。

第二确定单元，可以用于将当前模型参数对应的第二机器学习模型作为所述第二神经网络模型。

在一个可行的实施例中，若在所述第一时间向所述目标对象推荐单一目标活动，所述装置还可以包括：

第一历史参与信息获取模块，可以用于获取所述目标对象在所述第一时间参与所述目标活动的第一历史参与信息。

单一目标活动的分类结果获取模块，可以用于基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行分类处理，得到在所述第二时间是否向所述目标对象推荐所述单一目标活动的分类结果。

单一目标活动的参与结果获取模块，可以用于基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行预测处理，得到在所述第二时间向所述目标对象推荐所述单一目标活动时，所述目标对象参与所述单一目标活动的活动参与结果。

活动成果数据获取模块，可以用于基于所述在所述第二时间是否向所述目标对象推荐所述单一目标活动的分类结果以及所述目标对象参与所述单一目标活动的活动参与结果，得到所述单一目标活动在所述第二时间的活动成果数据。

在一个可行的实施例中，若在所述第一时间向所述目标对象推荐至少两个目标活动，所述装置还可以包括：

第二历史参与信息和活动属性信息获取模块，可以用于获取所述目标对象在所述第一时间参与所述至少两个目标活动的第二历史参与信息和所述至少两个目标活动的属性信息。

至少两个目标活动的分类结果获取模块，可以用于基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行分类处理，得到在所述第二时间是否向所述目标对象同时推荐所述至少两个目标活动的分类结果。

至少两个目标活动的活动参与结果获取模块，可以用于基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行预测处理，得到在所述第二时间向所述目标对象同时推荐所述至少两个目标活动时，所述目标对象参与所述至少两个目标活动的活动参与结果。

活动综合成果数据获取模块，可以用于基于所述在所述第二时间是否向所述目标对象同时推荐所述至少两个目标活动的分类结果以及所述目标对象参与所述至少两个目标活动的活动参与结果，得到所述至少两个目标活动在所述第二时间的活动综合成果数据。

需要说明的是，本发明的装置实施例与上述方法实施例基于相同的发明构思。

本发明实施例还提供了一种数据处理的设备，该设备包括处理器和存储器，该存储器中存储有至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的数据处理方法。

本发明的实施例还提供了一种存储介质，所述存储介质可设置于终端之中以保存用于实现方法实施例中一种数据处理方法相关的至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的数据处理方法。

可选地，在本发明实施例中，存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例所述存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用程序以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本发明实施例所提供的数据处理方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图13是本发明实施例提供的一种数据处理方法的服务器的硬件结构框图。如图13所示，该服务器700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(Central Processing Units，CPU)710(处理器710可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器730，一个或一个以上存储应用程序723或数据722的存储介质720(例如一个或一个以上海量存储设备)。其中，存储器730和存储介质720可以是短暂存储或持久存储。存储在存储介质720的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器710可以设置为与存储介质720通信，在服务器700上执行存储介质720中的一系列指令操作。服务器700还可以包括一个或一个以上电源760，一个或一个以上有线或无线网络接口750，一个或一个以上输入输出接口740，和/或，一个或一个以上操作系统721，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

输入输出接口740可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器700的通信供应商提供的无线网络。在一个实例中，输入输出接口740包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口740可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

本领域普通技术人员可以理解，图13所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器700还可包括比图13中所示更多或者更少的组件，或者具有与图13所示不同的配置。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和服务器实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，若在所述第一时间向所述目标对象推荐单一目标活动，则所述方法还包括：

获取所述目标对象在所述第一时间内参与所述目标活动的第一历史参与信息；

基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行分类处理，得到在所述第二时间内是否向所述目标对象推荐所述单一目标活动的分类结果；

基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息和所述第一历史参与信息进行预测处理，得到在所述第二时间内向所述目标对象推荐所述单一目标活动时，所述目标对象参与所述单一目标活动的活动参与结果；

基于所述在所述第二时间内是否向所述目标对象推荐所述单一目标活动的分类结果以及所述目标对象参与所述单一目标活动的活动参与结果，得到所述单一目标活动在所述第二时间内的活动成果数据。

3.根据权利要求1所述的方法，其特征在于，若在所述第一时间向所述目标对象推荐至少两个目标活动，则所述方法还包括：

获取所述目标对象在所述第一时间内参与所述至少两个目标活动的第二历史参与信息和所述至少两个目标活动的属性信息；

基于所述第一神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行分类处理，得到在所述第二时间内是否向所述目标对象同时推荐所述至少两个目标活动的分类结果；

基于所述第二神经网络模型对所述内部历史信息、所述外部历史关联信息、所述第二历史参与信息和所述至少两个目标活动的属性信息进行预测处理，得到在所述第二时间内向所述目标对象同时推荐所述至少两个目标活动时，所述目标对象参与所述至少两个目标活动的活动参与结果；

基于所述在所述第二时间内是否向所述目标对象同时推荐所述至少两个目标活动的分类结果以及所述目标对象参与所述至少两个目标活动的活动参与结果，得到所述至少两个目标活动在所述第二时间内的活动综合成果数据。

4.根据权利要求1所述的方法，其特征在于，所述基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息，包括：

5.根据权利要求1所述的方法，其特征在于，在所述基于所述分类结果和所述操作结果，得到所述目标对象在所述第二时间内的操作信息之后，所述方法还包括：

将所述目标对象按照所述内部历史信息或所述外部历史关联信息进行分类，得到至少一个目标对象集；

获取每个目标对象集中的各个目标对象在所述第二时间内的操作信息；

对每个目标对象集中的各个目标对象在所述第二时间内的操作信息进行统计分析，得到每个目标对象集在所述第二时间内的操作信息汇总结果；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括获取所述第一神经网络模型的步骤，所述获取所述第一神经网络模型的步骤包括：

获取样本对象在第一样本时间的内部历史样本信息以及在所述第一样本时间内与所述样本对象具有相互关系的外部历史样本关联信息；

对所述样本对象在所述第二时间内是否执行预设操作的分类结果进行标注；

基于所述内部历史样本信息和所述外部历史样本关联信息对第一预设机器学习模型进行分类训练学习，在分类训练学习过程中调整所述第一预设机器学习模型的模型参数至所述第一预设机器学习模型输出的是否执行预设操作的分类结果与输入的样本对象相匹配；

将当前模型参数对应的第一机器学习模型作为所述第一神经网络模型。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括获取所述第二神经网络模型的步骤，所述获取所述第二神经网络模型的步骤包括：

对所述样本对象在所述第二时间内执行预设操作的操作结果进行标注；

基于所述内部历史样本信息和所述外部历史样本关联信息对第二预设机器学习模型进行训练学习，在训练学习过程中调整所述第二预设机器学习模型的模型参数至所述第二预设机器学习模型输出的执行预设操作的操作结果与输入的样本对象相匹配；

将当前模型参数对应的第二机器学习模型作为所述第二神经网络模型。

8.一种数据处理装置，其特征在于，所述装置包括：

9.一种设备，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7任一所述的数据处理方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-7任一所述的数据处理方法。