CN114253951B

CN114253951B - 数据处理方法、系统及第二服务器

Info

Publication number: CN114253951B
Application number: CN202010996410.1A
Authority: CN
Inventors: 彭承晴; 王峰; 刘德超; 庄延军
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-09-21
Filing date: 2020-09-21
Publication date: 2023-09-19
Anticipated expiration: 2040-09-21
Also published as: CN114253951A

Abstract

本申请实施例提供了数据处理方法、系统及第二服务器，本申请提供的数据处理系统中，第一服务器不会计算各用户身份标识分别对应的指标数据，而是从各用户历史行为数据中提取出至少一个表征用户行为的字段信息，以得到各用户历史行为数据对应的第一字段集合，具有相同用户身份标识的用户历史行为数据对应的第一字段集合属于同一第一用户行为集合；将至少一个第一用户行为集合存储至数据库中，即对于数据库而言并未存储指标数据，节省了数据库的存储空间；第二服务器可以接收第三服务器发送的表征获取目标指标数据的第一请求，计算得到目标指标数据后发送给第三服务器，并不存储目标指标数据，节省了第二服务器的存储空间。

Description

数据处理方法、系统及第二服务器

技术领域

本申请涉及信息推荐技术领域，更具体的说，是涉及数据处理方法、系统及第二服务器。

背景技术

随着互联网的发展，信息越来越多，用户需要花费大量时间筛选出自己感兴趣的内容。针对于此，推荐系统应运而生。推荐系统用于为用户提供个性化服务，例如，根据用户的需求或者偏好，为其推荐可能感兴趣的商品、视频、音乐、新闻等各种内容。

推荐系统是基于用户的指标数据确定用户的需求或者偏好，例如，指标数据为5个小时内观看视频的平均时长，或者，指标数据为1天内浏览视频的主题等等；目前推荐系统获得各用户分别对应的指标数据的方法是：由第一服务器计算得到各用户分别对应的指标数据后存储至数据库，推荐系统从数据库中获得各用户分别对应的指标数据。

由于数据库需要存储各用户分别对应的指标数据，有的指标数据的数据量较大，占用了数据库较多的存储空间。

发明内容

有鉴于此，本申请提供了一种数据处理方法、系统及第二服务器。

为实现上述目的，本申请提供如下技术方案：

根据本申请实施例的第一方面，提供了一种数据处理系统，包括：

第一服务器，用于接收各用户历史行为数据；所述用户历史行为数据包括用户身份标识；基于各所述用户历史行为数据，获得至少一个第一用户行为集合；将所述至少一个第一用户行为集合发送至数据库；

其中，一个所述第一用户行为集合由一个所述用户身份标识，以及具有所述用户身份标识的至少一个所述用户历史行为数据对应的第一字段集合组成；一个所述用户历史行为数据对应的所述第一字段集合由从所述用户历史行为数据中提取的至少一个表征用户行为的字段信息组成；

所述数据库，用于接收所述至少一个第一用户行为集合；针对每一所述第一用户行为集合，将所述第一用户行为集合存储至与所述第一用户行为集合具有相同用户身份标识的第二用户行为集合中；

第二服务器，用于接收第三服务器发送的表征获取目标指标数据的第一请求；从预设的至少一个指标数据对应的计算逻辑信息中，确定所述目标指标数据对应的目标计算逻辑信息；一个所述指标数据对应的所述计算逻辑信息包括计算得到所述指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则；基于所述数据库存储的至少一个所述第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据；将所述至少一个用户身份标识对应的所述目标指标数据发送至所述第三服务器。

根据本申请实施例的第二方面，提供了一种数据处理方法，应用于第二服务器，所述数据处理方法包括：

接收第三服务器发送的表征获取目标指标数据的第一请求；

从预设的至少一个指标数据对应的计算逻辑信息中，确定所述目标指标数据对应的目标计算逻辑信息；一个所述指标数据对应的所述计算逻辑信息包括计算得到所述指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则；

基于所述数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据；

其中，一个所述第二用户行为集合包括一个用户身份标识以及至少一个第一字段集合，一个所述第一字段集合由从具有所述用户身份标识的一个用户历史行为数据中提取的至少一个表征用户行为的字段信息组成；

将所述至少一个用户身份标识对应的所述目标指标数据发送至所述第三服务器。

根据本申请实施例的第三方面，提供了一种第二服务器，包括：

接收模块，用于接收第三服务器发送的表征获取目标指标数据的第一请求；

第一确定模块，用于从预设的至少一个指标数据对应的计算逻辑信息中，确定所述目标指标数据对应的目标计算逻辑信息；一个所述指标数据对应的所述计算逻辑信息包括计算得到所述指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则；

计算模块，用于基于所述数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据；

其中，一个所述第二用户行为集合包括用户身份标识以及至少一个第一字段集合，一个所述第一字段集合由从具有所述用户身份标识的用户历史行为数据中提取的至少一个表征用户行为的字段信息组成；

发送模块，用于将所述至少一个用户身份标识对应的所述目标指标数据发送至所述第三服务器。

根据本申请实施例的第四方面，提供了一种第二服务器，包括：

存储器，用于存储程序；

处理器，用于执行所述程序，所述程序具体用于：

接收第三服务器发送的表征获取目标指标数据的第一请求；

根据本申请实施例的第五方面，提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述第二方面所述的数据处理方法包含的各个步骤。

根据本申请实施例的第六方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第二方面各种可能实现方式中提供的方法。

经由上述的技术方案可知，与现有技术中若从用户历史行为数据中不能提取到计算得到目标指标数据所需要至少部分字段分别对应的字段信息，例如，从用户历史行为数据中不能提取到字段信息A；但是从用户历史行为数据中可以提取到能够得到字段信息A的字段信息B，且字段信息A的数据量大于字段信息B的数据量这种应用场景相比，本申请提供的数据处理系统中，第一服务器不会计算各用户分别对应的指标数据，而是从各用户历史行为数据中提取出至少一个表征用户行为的字段信息，以得到各用户历史行为数据对应的第一字段集合，具有相同用户身份标识的用户历史行为数据对应的第一字段集合属于同一第一用户行为集合；将至少一个第一用户行为集合存储至数据库中，即对于数据库而言仅存储了从用户历史行为数据中提取出的至少一个字段信息，并未存储指标数据，节省了存储空间；第二服务器可以接收第三服务器发送的表征获取目标指标数据的第一请求，第二服务器计算得到至少一个用户身份标识对应的目标指标数据后，发送给第三服务器，第二服务器并不会存储至少一个用户身份标识对应的目标指标数据，节省了第二服务器的存储空间。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例涉及的相关技术的硬件结构的架构图；

图2为本申请实施例提供的实施环境的架构图；

图3为本申请实施例提供的应用于第二服务器的数据处理方法的流程图；

图4为本申请实施例提供的数据处理系统涉及的各设备之间的数据交互的信令图；

图5a至图5b为本申请实施例提供的至少一个第二用户行为集合的示意图；

图6为本申请实施例提供的第二服务器的一种实现方式的结构图；

图7为本申请实施例提供的第二服务器的又一实现方式的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本申请实施例提供了一种数据处理系统、方法以及第二服务器。

在介绍本申请实施例提供的技术方案之前，先对本申请实施例涉及的相关技术和实施环境进行介绍。

首先对本申请实施例涉及的相关技术进行介绍。

如图1所示，为本申请实施例涉及的相关技术的硬件结构的架构图。如图1所示硬件结构包括：第一目标服务器101、目标数据库102、至少一个第二目标服务器103以及至少一个电子设备104。

本申请实施例提供的数据处理系统是在图1所示的硬件结构上进行了改进，相关说明请参见图2。

一个或多个电子设备104将收集到的用户历史行为数据发送至第一目标服务器101。每一用户历史行为数据包括表征用户身份的用户身份标识。

第一目标服务器101预先存储有M个指标数据对应的计算逻辑信息。M为大于或等于1的正整数。第一目标服务器101获得每一用户身份标识对应的每一指标数据的过程包括：基于具有该用户身份标识的一个或多个用户历史行为数据以及该指标数据对应的计算逻辑信息，得到该用户身份标识对应的指标数据，以得到至少一个用户身份标识对应的M个指标数据；将至少一个用户身份标识对应的M个指标数据存储至目标数据库102。

上述相关技术方案中，第一目标服务器101在执行“基于具有该用户身份标识的一个或多个用户历史行为数据以及该指标数据对应的计算逻辑信息，得到该用户身份标识对应的指标数据”时包括：获得该指标数据对应的计算逻辑信息；从所述用户历史行为数据中提取出“计算得到该指标数据所需的至少一个字段”分别对应的字段信息，以得到所述用户历史行为数据对应的第三字段集合，即第三字段集合由“计算得到该指标数据所需的至少一个字段”分别对应的字段信息组成；基于具有该用户身份标识的一个或多个用户历史行为数据分别对应的第三字段集合以及计算逻辑信息，确定该用户身份标识对应的指标数据。

计算逻辑信息包括计算得到相应指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则。

下面对基于一个用户身份标识对应的一个或多个用户历史行为数据计算得到该用户身份标识对应的一个指标数据的过程进行说明。在不同应用场景中计算方法不同。下面结合应用场景进行说明。

第一种应用场景：从用户历史行为数据中不能提取到“计算得到指标数据所需要至少部分字段”分别对应的字段信息A；但是从用户历史行为数据中可以提取到能够得到字段信息A的字段信息B，且字段信息A的数据量大于字段信息B的数据量。

如若指标数据为2个小时内用户观看的视频的标题。若每一用户历史行为数据为用户身份标识在第一时间观看了视频标识第一时长。视频标识可以为视频的链接，或者，视频的ID。那么，第一目标服务器101可以从用户历史行为数据中提取到三个字段信息，分别为：第一时间、第一时长、视频标识。从用户历史行为数据提取的字段信息并不包括视频的标题。那么就需要第一目标服务器101基于视频标识获得视频的标题。视频的标题的数据量大于视频的ID的数据量。

目标数据库102存储有至少一个用户身份标识对应的指标数据，若指标数据的数据量较大，占用目标数据库102的存储空间较大，使得目标数据库102能够存储的至少一个用户身份标识对应的指标数据的个数较少。

另一方面，目标数据库102可能存储有多个相同指标数据，导致目标数据库102的数据冗余度较大，浪费目标数据库102的存储空间。

假设，有10万个用户在2个小时内均观看了视频1，那么，第一目标服务器101需要获得10万次视频1的标题，且目标数据库102需要存储10万次视频1的标题。

假设，一个用户在2个小时内多次重复观看视频1，那么，第一目标服务器101需要获得多次视频1的标题，且目标数据库102需要存储多次视频1的标题。

综上，目标数据库102对于不同用户可能需要存储多个相同的指标数据，或者，对于同一用户可能需要存储多个相同的指标数据，导致存储空间的浪费。

第二种应用场景：从用户历史行为数据中可以提取出“计算得到指标数据所需要的所有字段”对应的字段信息。

如若指标数据为5个小时内用户观看视频的平均时长。若每一用户历史行为数据为用户身份标识在第一时间观看了视频标识第一时长。视频标识可以为视频的链接，或者，视频的ID。那么，第一目标服务器101可以从用户历史行为数据中获得三个字段信息，分别为：第一时间、第一时长、视频标识。假设用户A 5个小时内观看了10个视频，即用户A对应10个用户历史行为数据。那么，对于用户A，第一目标服务器101可以从10个用户历史行为数据提取到10个第一时长，从而可以计算得到10个第一时长的平均值。

任一第二目标服务器103，用于从目标数据库102中获得各用户身份标识分别对应的M个指标数据，第二目标服务器103可以基于每一用户身份标识对应的M个指标数据，确定具有该用户身份标识的用户的需求或偏好，从而为用户推荐可能感兴趣的商品、视频、音乐、新闻中的一种或多种。

示例性的，第二目标服务器103属于推荐系统。

由于第二目标服务器103直接从目标数据库102中获得至少一个用户身份标识对应的M个指标数据。若第二目标服务器103想要增加指标数据，需要运维人员在第一目标服务器101中增加该指标数据对应的计算逻辑信息；若第二目标服务器103想要变更一指标数据，需要运维人员在第一目标服务器101中修改相应的指标数据对应的计算逻辑信息。

上述相关技术方案中，第一目标服务器是基于M个指标数据对应的时间范围存储用户历史行为数据的。下面以M=1为例进行说明，假设第一目标服务器原来存储有指标数据1的计算逻辑信息，若需要指标数据1的计算逻辑信息变更为指标数据2的计算逻辑信息，或者，保留指标数据1的计算逻辑信息且新增指标数据2的计算逻辑信息，那么，第一目标服务器存储的用户历史行为数据可能不足以得到指标数据2。

例如，指标数据1为1个小时内用户浏览视频的平均时长，那么，第一目标服务器可能仅存储1个小时内的用户历史行为数据，若指标数据2为2小时内用户浏览视频的平均时长，由于第一目标服务器仅存储了1小时内的用户历史行为数据，所以不足以得到指标数据2。第一目标服务器还需要继续接收1个小时的用户行为历史数据，才能够得到指标数据2。

上述相关技术方案中，由于第一目标服务器是基于计算得到指标数据所需的字段从用户历史行为数据中提取字段信息的，第一目标服务器存储有M个指标数据对应的计算逻辑信息，那么，第一目标服务器从用户历史行为数据中提取的字段信息为计算得到M个指标数据所需的字段对应的字段信息。

例如，若计算得到M个指标数据所需的字段为字段1、字段2、字段3、字段4，那么，从用户历史行为数据中提取的字段信息为字段1对应的字段信息1、字段2对应的字段信息2、字段3对应的字段信息3、字段4对应的字段信息4。

下面以M=1为例进行说明，假设第一目标服务器原来存储有指标数据1的计算逻辑信息，若需要指标数据1的计算逻辑信息变更为指标数据2的计算逻辑信息，或者，保留指标数据1的计算逻辑信息且新增指标数据2的计算逻辑信息，那么，第一目标服务器可能需要基于计算得到指标数据2所需字段，从用户历史行为数据中重新提取相应字段信息。

假设计算得到指标数据2所需字段为字段5以及字段6，那么，需要第一目标服务器重新从用户历史行为数据中提取字段5对应的字段信息5、字段6对应的字段信息6。

例如，指标数据1为获得2小时内用户观看过的视频的标题，计算得到指标数据1所需字段包括：用户观看视频的时间、用户观看视频的标识；若指标数据2为2个小时内的用户观看视频的平均浏览时长，计算得到指标数据2所需字段包括：用户观看视频的时间、用户观看视频的标识、用户观看视频的时长；由于计算得到指标数据1和计算得到指标数据2所需的字段不完全相同，所以第一目标服务器需要重新从用户历史行为数据中提取相应字段信息，例如，用户观看视频的时长对应的字段信息。

综上，上述相关技术方案中第一目标服务器可能需要等待一段时间才能计算得到变更后的指标数据或新增的指标数据，或者，第一目标服务器需要从用户历史行为数据中重新提取字段信息，所以导致第一目标服务器计算得到变更后的指标数据或新增的指标数据的时间较长。

综上，上述相关技术方案具有如下技术问题：

第一个技术问题：在第一种应用场景中，指标数据可能会占用数据库大量的存储空间，也可能会导致目标数据库存储空间的浪费。

第二个技术问题：上述相关技术方案中，在第一目标服务器中增加指标数据的计算逻辑信息或变更指标数据的计算逻辑信息后，可能需要重新启动第一目标服务器，在第一目标服务器重新启动过程中，第一目标服务器无法接收用户历史行为数据，也无法从用户历史行为数据中提取字段信息，可能会丢失重新启动这一时间段内的用户历史行为数据。

第三个技术问题：上述相关技术方案中，若第一目标服务器新增加指标数据的计算逻辑信息或修改某一指标数据的计算逻辑信息，第一目标服务器可能需要从用户历史行为数据中重新提取字段信息，导致第一目标服务器计算得到变更后的指标数据或新增的指标数据的时间较长。

第四个技术问题：上述相关技术方案中第一目标服务器可能需要等待一段时间才能计算得到变更后的指标数据或新增的指标数据，所以导致第一目标服务器计算得到变更后的指标数据或新增的指标数据的时间较长。

下面对本申请实施例涉及的实施环境进行说明。

如图2所示，为本申请实施例提供的实施环境的架构图，本申请实施例提供的以下数据处理方法可以应用于该实施环境，该实施环境包括：第一服务器201、数据库202、第二服务器203、至少一个第三服务器204以及至少一个电子设备104。

示例性的，第一服务器201是在上述第一目标服务器101的基础上进行的改进，但是由于第一服务器201与第一目标服务器101的功能不同，为了区分两者所以称呼不同。数据库202是在上述目标数据库102的基础上进行的改进，但是由于两者功能不同，为了区分两者所以称呼不同；第三服务器204是在上述第二目标服务器103的基础上进行的改进，但是由于两者功能不同，为了区分两者所以称呼不同。

示例性的，电子设备104可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品，例如，手机、笔记本电脑、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视、PAD等。

示例性的，电子设备104中可以有客户端，该客户端可以为应用程序客户端或网页版客户端，客户端可以为短视频类客户端，或，视频播放类客户端，或者，新闻类客户端，或者，游戏类客户端，或者，购物类客户端等等。

在一可选实施例中，不同类型客户端对应不同数据处理系统，数据处理系统包括：第一服务器201、数据库202以及第二服务器203。例如，短视频类客户端和新闻类客户端对应的数据处理系统不同。

示例性的，第一服务器201或第二服务器203或第三服务器204可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务器中心。

示例性的，不同的第三服务器204可以属于不同平台，例如，一个或多个第三服务器204属于抖音平台；一个或多个第三服务器204属于快手平台；一个或多个第三服务器204属于腾讯平台。

示例性的，第一服务器201与数据库202可以通过无线网络或有线网络建立连接并通信；第二服务器203与数据库202可以通过无线网络或有线网络建立连接并通信；第二服务器203与第三服务器204可以通过无线网络建立连接并通信。

图2仅为示例，图2中示出了两个电子设备104，两个第三服务器204，电子设备104的数目和第三服务器204的数目可以基于实际情况而定，本申请实施例并不对此进行限定。

每一电子设备104，用于获取一个或多个用户历史行为数据，将一个或多个用户历史行为数据上传至第一服务器201。

每一用户历史行为数据包括一个用户身份标识。

示例性的，电子设备104中设置有交互程序脚本，可以通过交互程序脚本收集用户历史行为数据，具体的，可以在JS代码中埋点来收集用户在页面上的用户历史行为数据，可选的，可以采用统一标准JS接口来收集用户历史行为数据，以保证用户历史行为数据采集的规范化，避免后台日志的分析解析工作。

下面举例对产生用户历史行为数据的过程进行说明。

例如，若在2020年7月31日上午10点01分用户A点击视频A并观看了10分钟，那么，可以产生用户历史行为数据，示例性的，用户历史行为数据可以为用户A在2020年7月31日上午10点01分观看视频A 10分钟。若在2020年7月31日上午10点50分用户B购买了化妆品A，那么，可以产生用户历史行为数据，示例性的，用户历史行为数据可以为用户B在2020年7月31日上午10点50分购买了化妆品A。

综上，用户在执行某个行为后，就可以产生一用户历史行为数据，用户历史行为数据记录了用户身份标识在什么时间干了什么事件。

示例性的，用户身份标识可以为电子设备的设备标识，或者，登陆电子设备的用户账号。

下面以电子设备为手机为例对设备标识进行说明，设备标识可以为手机号，或者，手机的国际移动设备识别码（International Mobile Equipment Identity，IMEI）。

第一服务器201，用于从每一用户历史行为数据中提取至少一个字段信息，以得到第一字段集合；将一个或多个用户历史行为数据对应的第一字段集合发送至数据库202。

示例性的，第一服务器201可以采用Flink工具或者Storm工具或者SparkStreaming工具从用户历史行为数据中提取至少一个表征用户行为的字段信息。

数据库202，用于存储各第一字段集合。

第二服务器203，用于对于每一第三服务器204执行以下操作：接收到第三服务器204发送的获取目标指标数据的第一请求后，基于数据库202存储的各第一字段集合，计算得到一个或多个用户身份标识分别对应的目标指标数据，将一个或多个用户身份标识分别对应的目标指标数据发送至第三服务器204。

每一第三服务器204，用于针对每一用户身份标识对应的目标指标数据，从多个待推荐信息中确定至少一个目标推荐信息；将所述至少一个目标推荐信息发送至登陆有用户身份标识的电子设备104。

本申请实施例至少可以解决上述相关技术方案中前三个技术问题。

对于第一个技术问题：数据库202不存储指标数据，仅存储从用户历史行为数据提取的字段信息，节省了存储空间。第二服务器203用于在接收到第一请求后，才会计算得到至少一个用户身份标识对应的目标指标数据，第二服务器203将至少一个用户身份标识对应的目标指标数据发送至第三服务器后，并不存储至少一个用户身份标识对应的目标指标数据，从而节省了第二服务器的存储空间。

上述相关技术方案中的目标数据库102存储第一目标服务器101计算得到的目标指标数据的时长至少为第一时刻与第二时刻的差值。

第一时刻是指第一目标服务器101将计算得到的目标指标数据存储至目标数据库的时刻；第二时刻是指最后一个第二目标服务器103从目标数据库102中取出至少一个用户身份标识对应的目标指标数据的时刻。

可以理解的是，第二目标服务器103可能有一个或多个，这些第二目标服务器103都需要从目标数据库102中获得至少一个用户身份标识对应的目标指标数据，所以在最后一个第二目标服务器103从目标数据库102中取出至少一个用户身份标识对应的目标指标数据后，目标数据库102可以删除至少一个用户身份标识对应的目标指标数据。但是在删除之前一直占用目标数据库102的存储空间。

对于第二个技术问题：若在第二服务器203中变更或增加指标数据后，需要重新启动第二服务器203，在重新启动第二服务器203的过程中，并不影响第一服务器201的运行，即第一服务器201仍可以接收用户历史行为数据，也仍然可以从用户历史行为数据中提取字段信息。不会出现丢失重新启动这一时间段内的用户历史行为数据的情况。

对于第三个技术问题：若目标指标数据的计算逻辑信息为新增指标数据的计算逻辑信息，或者，目标指标数据的计算逻辑信息为更新后的计算逻辑信息，由于第一服务器201已经从每一用户历史行为数据中提取出字段信息，第二服务器203在计算得到目标指标数据的过程中，仅需要从数据库202中相应第一字段集合中获得所需字段信息即可，无需重新从用户历史行为数据中提取字段信息，从而使得第一目标服务器101计算得到变更后的指标数据或新增的指标数据的时间较短。

下面对本申请实施例提供的数据处理方法进行说明。

如图3所示，为本申请实施例提供的应用于第二服务器的数据处理方法的流程图，该方法在实施过程中包括以下步骤S301至步骤S304。

本申请实施例中，针对每一第三服务器204均可以执行步骤S301至步骤S304；示例性的，不同第三服务器204可以同时向第二服务器发送第一请求，或者，不同第三服务器204可以在自己所需时刻向第二服务器发送第一请求。

步骤S301：接收第三服务器204发送的表征获取目标指标数据的第一请求。

示例性的，目标指标数据的数目可以为一个或多个，由于对于每一目标指标数据本申请实施例执行的方法相同，因此以第一请求为表征获得一个目标指标数据的请求为例进行说明。

示例性的，第一请求可以携带有目标指标数据的目标编号或者目标指标数据的名称。

步骤S302：从预设的至少一个指标数据对应的计算逻辑信息中，确定所述目标指标数据对应的目标计算逻辑信息。

其中，一个所述指标数据对应的所述计算逻辑信息包括计算得到所述指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则。

示例性的，指标数据为用户行为在时间维度上的累积表现，比如，5天内浏览同一视频的次数，或，1天内观看视频的平均时长，或，上线时长。

一个指标数据对应的计算规则是指计算得到所述指标数据所需的至少一个字段参与的运算。

示例性的，运算是指乘法、除法、求和、求平均值、求差值中的至少一种。

下面举例对计算得到指标数据所需的至少一个字段以及计算规则进行说明。

若指标数据3为1天内观看视频的平均时长，计算得到该指标数据3所需的字段包括：用户身份标识、用户观看视频的时间，以及，用户观看视频的时长这三个字段。

指标数据3对应的计算规则为用户观看视频的时间属于距离当前时间1天内的“对应有相同用户身份标识的”所有用户观看视频的时长的平均值。

假设用户身份标识1在1天2小时内浏览2个视频，浏览2个视频的行为分别对应用户历史行为数据1以及用户历史行为数据2。

其中，从用户历史行为数据1中提取出的字段信息包括：用户身份标识1、2020年8月3号9点整，50分钟；从用户历史行为数据2中提取出的字段信息包括：用户身份标识1、2020年8月3号10点整，60分钟。

针对用户身份标识1，得到的指标数据3=（50+60）/2=55。

若指标数据4为3个小时内浏览视频的平均完整度，计算得到该指标数据4所需的字段包括：用户身份标识、用户观看视频的时长、用户观看的视频的总时长这三个字段。

指标数据4对应的计算规则为用户观看视频的时间属于距离当前时间3个小时以内的“对应有相同身份信息标识的”所有视频对应的“用户观看该视频的时长/该视频的总长度”的平均值。

假设用户身份标识2在3个小时内浏览3个视频，浏览3个视频行为分别对应用户历史行为数据3、用户历史行为数据4以及用户历史行为数据5。

其中，从用户历史行为数据3提取出的字段信息包括：用户身份标识2、2020年8月3号9点整，50分钟，视频ID1；从用户历史行为数据4中提取出的字段信息包括：用户身份标识2、2020年8月3号10点整，60分钟，视频ID2；从用户历史行为数据5中提取出的字段信息包括：用户身份标识2、2020年8月3号10点50分，70分钟，视频ID3。

假设，基于视频ID1得到的视频总时长为100分钟，基于视频ID2得到的视频总时长为90分钟；基于视频ID3得到的视频总时长为140分钟。

那么，针对用户身份标识2而言，指标数据4=(50/100+60/90+70/140)/3=5/9。

若指标数据5为5个小时内浏览视频的平均完整度，计算得到该指标数据5所需字段包括：用户身份标识、用户观看视频的时长、用户观看的视频的总时长这三个字段。

指标数据5对应的计算规则为用户观看视频的时间属于距离当前时间5个小时以内的“对应有相同身份信息标识的”所有视频对应的“用户观看该视频的时长/该视频的总长度”的平均值。

综上，计算得到不同指标数据所需的至少一个字段可能完全不同（例如指标数据3和指标数据4）；或者，计算得到不同指标数据所需的至少一个字段不完全相同；或者，计算得到不同指标数据所需的至少一个字段完全相同（例如，指标数据4和指标数据5）。

步骤S303：基于所述数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据。

其中，一个所述第二用户行为集合包括一个用户身份标识以及至少一个第一字段集合，一个所述第一字段集合由从具有所述用户身份标识的一个用户历史行为数据中提取的至少一个表征用户行为的字段信息组成。

示例性的，不同的第二用户行为集合包含的用户身份标识不同。

示例性的，可以采用Flink工具或者Storm工具或者Spark Streaming工具从用户历史行为数据中提取至少一个表征用户行为的字段信息。

示例性的，一个用户历史行为数据对应的第一字段集合包括该用户历史行为数据中能够被提取出的所有字段信息。

下面举例对字段信息进行说明。

若用户历史行为数据为用户身份标识1在第一时间观看了视频标识第一时长。视频标识可以为视频的链接，或者，视频的ID。那么，第一服务器201可以从用户历史行为数据中获得四个字段信息，分别为：用户身份标识1、第一时间、第一时长、视频标识。该用户历史行为数据对应的第一字段集合为{第一时间，第一时长，视频标识}或者，为{用户身份标识1，第一时间，第一时长，视频标识}。

一个字段与一个字段信息相对应，例如，用户观看视频的时间（字段）对应第一时间（字段信息）；用户观看视频的时长（字段）对应第一时长（字段信息）。

示例性的，可以预先设置字段与字段信息的对应关系。

步骤S304：将所述至少一个用户身份标识分别对应的所述目标指标数据发送至所述第三服务器。

示例性的，第二服务器执行完毕步骤S304后，不会存储至少一个所述用户身份标识分别对应的所述目标指标数据，从而节省了第二服务器的存储空间。

本申请实施例提供的数据处理方法中，数据库202存储一个或多个用户历史行为数据对应的第一字段集合，一个用户历史行为数据对应的第一字段集合由从该用户历史行为数据中提取的至少一个字段信息组成；即数据库202并不存储计算好的指标数据，节省了数据库202的存储空间。第二服务器接收到表征获取目标指标数据的第一请求后，可以基于数据库存储的至少一个所述第二用户行为集合以及目标指标数据对应的目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据，并发送至第三服务器，第二服务器并不存储至少一个所述用户身份标识分别对应的所述目标指标数据，即节省了第二服务器的存储空间。

在一可选实现方式中，应用于第二服务器的数据处理方法中“步骤S303”的实现方式有多种，本申请实施例提供但不限于以下几种。

第一种实现方式包括步骤A1至步骤A2。

步骤A1：从所述数据库中获得至少一个所述第二用户行为集合。

步骤A2：基于至少一个所述第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据。

第二种实现方式包括步骤B1至步骤B2。

步骤B1：从所述数据库存储的至少一个所述第二用户行为集合中分别获得第三用户行为集合；一个所述第二用户行为集合对应的所述第三用户行为集合为所述第二用户行为集合的子集。

步骤B2：基于至少一个所述第三用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据。

上述“步骤B1”的实现方式有多种，本申请实施例提供但不限于以下四种。

在步骤B1的第一种方式中，一个所述第一字段集合包括第一字段信息，所述第一字段信息为用户行为的发生时间；所述第一请求还携带有所述目标指标数据对应的时间范围；对于每一第二用户行为集合而言，从所述数据库存储的所述第二用户行为集合中获得第三用户行为集合包括以下步骤B11至步骤B12。

步骤B11：从所述数据库存储的所述第二用户行为集合中确定包含的所述第一字段信息属于所述时间范围的至少一个目标第一字段集合。

假设第二用户行为集合包括{第一字段集合10、第一字段集合11、第一字段集合12、第一字段集合13、第一字段集合14、第一字段集合15、第一字段集合16}，若第二用户行为集合中第一字段集合14、第一字段集合15、第一字段集合16包含的第一字段信息属于时间范围，那么，至少一个目标第一字段集合包括：第一字段集合14、第一字段集合15、第一字段集合16。

步骤B12：基于所述至少一个目标第一字段集合，获得所述第三用户行为集合。

在一可选实施例中，第三用户行为集合可以为数组、链表或队列中的一种。

示例性的，在步骤B12中，所述至少一个目标第一字段集合组成第三用户行为集合。

示例性的，在步骤B12中，将所述至少一个目标第一字段集合按照包含的第一字段信息从早到晚依次排序，以得到第三用户行为集合。

假设，至少一个目标第一字段集合包括：第一字段集合14、第一字段集合15、第一字段集合16。若第一字段集合14包含的第一字段信息为2020年8月3日9:00，第一字段集合15包含的第一字段信息为2020年8月3日9:10；第一字段集合16包含的第一字段信息为2020年8月3日9:50。那么，第三用户行为集合为{第一字段集合14、第一字段集合15、第一字段集合16}。

若第三用户行为集合为一个链表，那么，第三用户行为集合包括4个节点，第一个节点包括用户身份标识，第二个节点包括第一字段集合14，第三个节点包括第一字段集合15，第四个节点包括第一字段集合16。

综上，第二服务器203从数据库得到的第三用户行为集合可以为第二用户行为集合的真子集，并不是得到第二用户行为集合，因此，节省了第二服务器203的存储空间。

示例性的，若目标指标数据对应的时间范围涵盖了第二用户行为集合中各第一字段集合包含的第一字段信息，那么，第二服务器需要从数据库中获得第二用户行为集合，此时第三用户行为集合即为第二用户行为集合。

在步骤B1的第二种实现方式中，针对每一第二用户行为集合，从数据库存储的所述第二用户行为集合中获得第三用户行为集合包括步骤B13至步骤B14。

步骤B13：从所述第二用户行为集合包含的至少一个第一字段集合中分别获得第二字段集合；一个所述第一字段集合对应的所述第二字段集合由所述第一字段集合包含的至少一个目标字段分别对应的字段信息组成；所述至少一个目标字段为计算得到所述目标指标数据所需的字段。

假设一个第一字段集合包括5个字段信息，若计算得到该目标指标数据所需的字段仅为第一字段集合包含的2个字段信息，则第一字段集合对应的第二字段集合包括2个字段信息。

步骤B14：基于至少一个所述第二字段集合，获得所述第三用户行为集合。

假设，第二用户行为集合包括3个第一字段集合，分别为第一字段集合21、第一字段集合22以及第一字段集合23；假设第一字段集合21为（第一字段信息211、字段信息212、字段信息213、字段信息214、字段信息215），第一字段集合21对应的第二字段集合为（第一字段信息211、字段信息212）；第一字段集合22为（第一字段信息221、字段信息222、字段信息223、字段信息224、字段信息225），第一字段集合22对应的第二字段集合为（第一字段信息221、字段信息222）；第一字段集合23为（第一字段信息231、字段信息232、字段信息233、字段信息234、字段信息235），第一字段集合23对应的第二字段集合为（第一字段信息231、字段信息232）。

那么，第三用户行为集合可以为{（第一字段信息211、字段信息212），（第一字段信息221、字段信息222），（第一字段信息231、字段信息232）}。

示例性的，第三用户行为集合包含的至少一个第二字段集合，是按照第二字段集合包含的第一字段信息由早到晚依次排列的。示例性的，第三用户行为集合包含的至少一个第二字段集合在时间上可以是无序的。

示例性的，第三用户行为集合可以为链表、队列或数组中任一种。

在步骤B1的第三种实现方式中，针对每一第二用户行为集合，从数据库存储的所述第二用户行为集合中获得第三用户行为集合包括步骤B15至步骤B17。

步骤B15：从所述数据库存储的所述第二用户行为集合中确定包含的所述第一字段信息属于所述时间范围的至少一个目标第一字段集合。

针对步骤B15的描述可以参见对步骤B11的描述这里不再赘述。

步骤B16：从所述数据库存储所述至少一个目标第一字段集合中分别获得第二字段集合。

一个所述目标第一字段集合对应的所述第二字段集合由所述目标第一字段集合包含的至少一个目标字段分别对应的字段信息组成；所述至少一个目标字段为计算得到所述目标指标数据所需的字段。

针对步骤B16的说明可以参见针对步骤B13的说明，这里不再赘述。

步骤B17：基于至少一个所述第二字段集合，获得所述第三用户行为集合。

针对步骤B17的说明可以参见针对步骤B14的说明，这里不再赘述。

在步骤B1的第四种实现方式中，针对每一第二用户行为集合，从数据库存储的所述第二用户行为集合中获得第三用户行为集合包括步骤B18至步骤B20。

步骤B18：从所述数据库存储的所述第二用户行为集合包含的至少一个第一字段集合中分别获得第二字段集合。

针对步骤B18的说明可以参见针对步骤B13的说明，这里不再赘述。

步骤B19：从所述数据库存储的所述第二用户行为集合包含的至少一个第二字段集合中确定包含的所述第一字段信息属于所述时间范围的至少一个目标第一字段集合。

一个第二字段集合与目标第一字段集合包含的字段数目相同，一个第二字段集合与目标第一字段集合包含的字段相同。

针对步骤B19的说明可以参见步骤B11，这里不再赘述。

步骤B20：基于所述至少一个目标第一字段集合，获得所述第三用户行为集合。

在一可选实现方式中，步骤B2“基于至少一个所述第三用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据”的实现方式有多种，本申请实施例提供但不限于以下几种。

第一种：从用户历史行为数据中不能提取到计算得到目标指标数据所需要的至少一个第二字段对应的第二字段信息；但是从用户历史行为数据中可以提取到能够得到第二字段信息的第三字段信息。

针对每一第三用户行为集合，步骤B2包括步骤B21至步骤B22。

步骤B21：对于第三用户行为集合包含的每一第一字段集合，从所述第一字段集合中获得第三字段信息，基于第三字段信息获得第二字段信息，以得到所述第三用户行为集合包含的至少一个第一字段集合分别对应的第二字段信息。

示例性的，上述第二字段信息可以为用户基础属性信息和/或用户执行行为针对对象的基础属性。

用户基础属性信息包括用户的姓名、用户的性别、用户的年龄、用户试用的电子设备的型号中的一种或多种。

以用户执行行为针对对象为视频为例，对用户执行行为针对对象的基础属性进行说明。用户执行行为针对对象的基础属性包括视频的标题、视频的总长度、视频的标签、视频所属分类中的一种或多种。

上述仅为示例，并不对用户基础属性信息、用户执行行为针对对象的基础属性进行限定。

示例性的，用户基础属性信息可以存储在用户信息数据库中；示例性的，用户执行行为针对对象的基础属性可以存储在对象对应的对象数据库中。

上述“基于第三字段信息获得第二字段信息”可以为从相应数据库中基于第三字段信息获得第二字段信息。

步骤B22：基于第三用户行为集合包含的至少一个第一字段集合对应的第二字段信息以及目标计算逻辑信息，得到所述第三用户行为集合包含的用户身份标识对应的目标指标数据。

在一可选实施例中，若计算得到目标指标数据还需要能够从用户历史行为数据中提取出的第四字段信息，则步骤B22具体用于：基于第三用户行为集合包含的至少一个第一字段集合对应的第二字段信息，以及，第三用户行为集合包含的至少一个第一字段集合对应的第四字段信息以及目标计算逻辑信息，得到所述第三用户行为集合包含的用户身份标识对应的指标数据。

第二种：从用户历史行为数据中能提取到计算得到目标指标数据所需要的所有字段对应的字段信息。

针对每一第三用户行为集合，步骤B2包括步骤B23至步骤B24。

步骤B23：对于第三用户行为集合包含的每一第一字段集合，从所述第一字段集合中获得至少一个目标字段分别对应的字段信息，以得到所述第三用户行为集合包含的至少一个第一字段集合分别对应的至少一个目标字段的字段信息。

所述至少一个目标字段为计算得到所述目标指标数据所需的字段。

步骤B24：基于所述第三用户行为集合包含的至少一个第一字段集合分别对应的至少一个目标字段的字段信息，以及，目标计算逻辑信息，得到所述第三用户行为集合包含的用户身份标识对应的目标指标数据。

可以理解的是，若多个第三服务器204需要相同的指标数据，为了避免第二服务器203每接收一次获取该指标数据的请求，就执行一次图3所示的步骤；示例性的，第二服务器203可以计算并存储至少一个用户身份标识对应的“多个第三服务器204需要的相同的”指标数据。示例性的，第二服务器203可以将自己计算得到的至少一个用户身份标识对应的“多个第三服务器204需要的相同的”指标数据存储至数据库202。示例性的，第一服务器201可以计算得到至少一个用户身份标识对应的“多个第三服务器204需要的相同的”指标数据，并存储至数据库202。

基于此，在一可选实现方式中，第一请求包括目标指标数据的目标编号。本申请实施例提供的应用于第二服务器的数据处理方法还包括以下步骤C1至步骤C4。

步骤C1：从预设的至少一个编号对应的类型中，确定所述目标编号对应的目标类型。

本申请实施例中，可以对各指标数据进行编号，并基于该指标数据是否已经存储在数据库202中分为两类，假设第一种类为该指标数据未存储在数据库中，需要第二服务器计算得到；第二种类为该指标数据已经存储在数据库中。

步骤C2：若所述目标种类为第一种类，执行步骤C3；若所述目标种类为第二种类执行步骤C4。

步骤C3：执行步骤S303。

步骤C4：从所述数据库中获得所述至少一个用户身份标识对应的所述目标指标数据。

本申请实施例还提供了一种数据处理系统，数据处理系统包括：第一服务器201、数据库202以及第二服务器203。

如图4所示，为本申请实施例提供的数据处理系统涉及的各设备之间的数据交互的信令图。

步骤S401：电子设备104将获得的一个或多个用户历史行为数据发送至第一服务器201。

图4仅为示例，图4示出了一个电子设备104，一个第三服务器204，电子设备104与第三服务器204的数目可以基于实际情况而定，并不限于图4所示的数目。

步骤S402：第一服务器201接收各用户历史行为数据，基于各所述用户历史行为数据，获得至少一个第一用户行为集合。

每一所述用户历史行为数据包括用户身份标识。

其中，一个所述第一用户行为集合由一个所述用户身份标识，以及具有所述用户身份标识的至少一个所述用户历史行为数据对应的第一字段集合组成；一个所述用户历史行为数据对应的所述第一字段集合由从所述用户历史行为数据中提取的至少一个表征用户行为的字段信息组成。

步骤S403：第一服务器201将所述至少一个第一用户行为集合发送至数据库202。

步骤S404：数据库202接收所述至少一个第一用户行为集合；针对每一所述第一用户行为集合，将所述第一用户行为集合存储至与所述第一用户行为集合具有相同用户身份标识的第二用户行为集合中。

步骤S405：第三服务器204生成表征获取目标指标数据的第一请求，发送至第二服务器203。

步骤S406：第二服务器203接收第三服务器204发送的表征获取目标指标数据的第一请求；基于所述数据库存储的至少一个所述第二用户行为集合，计算得到至少一个所述用户身份标识对应的所述目标指标数据。

第二服务器203执行步骤S406的过程可以参见针对应用于第二服务器203的数据处理方法的说明，这里不再赘述。

步骤S407：第二服务器203将所述至少一个用户身份标识对应的所述目标指标数据发送至所述第三服务器204。

示例性的，还包括：步骤S408：第三服务器204接收所述第二服务器203反馈的所述至少一个用户身份标识对应的所述目标指标数据；针对每一所述用户身份标识，基于所述用户身份标识对应的所述目标指标数据，从多个待推荐信息中确定至少一个目标推荐信息。

示例性的，还包括：步骤S409：针对每一所述用户身份标识，第三服务器204将所述至少一个目标推荐信息发送至登陆有用户身份标识的电子设备104。

本申请提供的数据处理系统中，至少可以解决上述相关技术方案中前三个技术问题，详细请参见针对图2的有益效果的描述，这里不再赘述。

在一可选实现方式中，本申请实施例提供的第一服务器201包括：存储模块、过滤模块、提取字段模块以及集合发送模块。

示例性的，存储模块可以为数据消息队列（Real-Time Source）。

示例性的，过滤模块、提取字段模块以及集合发送模块可以属于实时处理模块（Real-Time Process）。

存储模块，用于存储第一服务器201接收到各用户历史行为数据。

过滤模块，用于将存储模块存储的各用户历史行为数据中不满足要求的用户历史行为数据滤除。

下面举例对不满足要求的用户历史行为数据进行说明。

可以理解的是，用户偶然操作或错误操作得到的用户历史行为数据是不满足要求的数据。这一部分用户历史行为数据对分析用户偏好没有用处，且会产生干扰，因此对这部分用户历史行为数据进行过滤。

如当用户在点击某一视频后很快关闭，说明该视频内容可能不是用户喜欢的，或者，用户误点击该视频。但是用户的这一系列操作都将产生用户历史行为数据，所以需要对这部分用户历史行为数据进行滤除。

可以理解的是，电子设备104在向第一服务器上传用户历史行为数据的过程中，若网络不稳定，可能导致电子设备104多次重复上传同一用户历史行为数据，过滤模块需要将重复的用户历史行为数据滤除，仅保留一个即可。

提取字段模块，用于针对满足要求的每一用户历史行为数据，从用户历史行为数据中提取至少一个字段信息，以得到第一字段集合。

示例性的，对于每一用户历史行为数据，提取字段模块从用户历史行为数据中提取出能够提取的所有字段信息。

提取字段模块，还用于将对应于同一用户身份标识的一个或多个第一字段集合组成一个第一用户行为集合，以得到至少一个第一用户行为集合。

集合发送模块，用于将至少一个第一用户行为集合发送至数据库202。

在一可选实施例中，第一服务器201不计算至少一个用户身份标识对应的指标数据；在一可选实施例中，若第一指标数据是多个第三服务器共同需要的指标数据，或者，第一指标数据是一般不会发生变更的指标数据，那么，第一服务器可以计算得到第一指标数据，并存储至数据库202。

示例性的，需要在第一服务器中设置第一指标数据对应的第一计算逻辑信息，第一指标数据的数目可以有一个或多个；针对每一第一指标数据，第一服务器计算得到至少一个用户身份标识对应的第一指标数据的方法包括以下步骤D1至步骤D4。

步骤D1：从预设的至少一个指标数据对应的计算逻辑信息中，确定所述第一指标数据对应的第一计算逻辑信息。

步骤D2：基于至少一个所述第二用户行为集合以及所述第一计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述第一指标数据。

示例性的，第一服务器也可以访问数据库202。

示例性的，步骤D2可以为基于至少一个所述第一用户行为集合以及所述第一计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述第一指标数据。

步骤D3：将至少一个所述用户身份标识对应的所述第一指标数据存储至所述数据库202。

在一可选实现方式中，数据库202可以存储有至少一个第二用户行为集合，每一第二用户行为集合包括用户身份标识，不同第二用户行为集合包含的用户身份标识不同。

数据库202存储至少一个第二用户行为集合的方式有多种，本申请实施例提供但不限于以下两种。

第一种，随着时间不断累积，数据库202存储的每一第二用户行为集合包括的第一字段集合越来越多。

随着时间的流逝，电子设备104不断得到“新的”用户历史行为数据，并发送至第一服务器201。本申请实施例提及的“新的”是指时间上的新。第一服务器201不断得到“新的”用户历史行为数据，第一服务器201针对每一“新的”用户历史行为数据，得到“新的”第一字段集合。

示例性的，第一服务器201可以每得到一个“新的”第一字段集合后，将第一字段集合存储至数据库202，此时第一用户行为集合仅包括一个第一字段集合；示例性的，第一服务器201可以每隔第一预设时间段，将得到的“新的”第一字段集合存储至数据库202，此时，第一用户行为集合包括第一预设时间段内接收到的具有相应用户身份标识的用户历史行为数据对应的第一字段集合。

示例性的，第二用户行为集合可以为链表、数组、队列中的一个或多个。本申请实施例提及的第一用户行为集合或第三用户行为集合可以为链表、数组、队列中的一个或多个。下面以第二用户行为集合为例进行说明。

为了本领域技术人员更加理解本申请实施例提供给的第一种存储方式，下面以第二用户行为集合为链表为例进行说明。

如图5a至图5b所示，为本申请实施例提供的至少一个第二用户行为集合的示意图。

图5a中示出两个第二用户行为集合，分别为第二用户行为集合51以及第二用户行为集合52，图5a仅为示例，本申请并不限定数据库202包含的第二用户行为集合的数目。

假设数据库202当前时间存储的第二用户行为集合51包括7个第一字段集合，分别为第一字段集合11、第一字段集合12、第一字段集合13、第一字段集合14、第一字段集合15、第一字段集合16以及第一字段集合17；第二用户行为集合52包括4个第一字段集合，分别为第一字段集合21、第一字段集合22、第一字段集合23以及第一字段集合24。

假设第一服务器每隔第一预设时间段，将得到的“新的”用户历史行为数据对应的第一字段集合存储至数据库202中，假设用户身份标识1对应的用户在第一预设时间段内执行了两个用户行为，得到两个用户历史行为数据，用户身份标识2对应的用户在第一预设时间段内执行了三个用户行为，得到三个用户历史行为数据。

相应的，第一服务器在第一预设时间段接收到具有用户身份标识1的两个用户历史行为数据，基于这两个用户历史行为数据得到两个第一字段集合，假设分别为第一字段集合18以及第一字段集合19；第一服务器在第一预设时间段内接收到具有用户身份标识2的3个用户历史行为数据，基于这三个用户历史行为数据得到三个第一字段集合，假设分别为第一字段集合25、第一字段集合26以及第一字段集合27。

包含用户身份标识1的第一用户行为集合1包括第一字段集合18以及第一字段集合19；包含用户身份标识2的第一用户行为集合2包括第一字段集合25、第一字段集合26以及第一字段集合27。

第一服务器201将第一用户行为集合1以及第一用户行为集合2存储至数据库202。

数据库202存储第一用户行为集合1以及第一用户行为集合后，如图5b所示。即数据库202存储的两个第二用户行为集合由图5a所示的集合更新为图5b所示的集合。

示例性的，数据库202存储的每一第二用户行为集合包含一个或多个第一字段集合。一个或多个第一字段集合在第二用户行为集合中的顺序是基于一个或多个第一字段集合包含的第一字段信息由早至晚排序的。

示例性的，如图5b所示，每一第二用户行为集合包含的各第一字段集合包含的第一字段信息由左至右依次为由早到晚。

可以理解的是，数据库202的第一种存储方式解决了相关技术方案中第四个技术问题，由于数据库存储的每一第二用户行为集合包括随着时间累积的多个第一字段集合，若变更后或新增指标数据与第二服务器已有指标数据对应的时间范围不同，第二服务器可以从数据库中得到相应时间范围的第三用户行为数据集合，不会出现数据库存储的第二用户行为集合由于不满足变更后或新增指标数据对应的时间范围导致的不足以得到变更后或新增指标数据的问题。

示例性的，由于数据库存储的每一第二用户行为集合包含的第一字段集合随着时间流逝在不断累加，数据库存储的每一第二用户行为集合包含的第一字段集合越来越多。

可以理解的是，对于用户而言，用户的所需要内容或偏好可能随着时间流逝而发生改变，因此可能不会基于包含用户行为的发生时间较早的第一字段集合计算得到指标数据。

在一可选实现方式中，可以删除数据库存储的包含用户行为的发生时间较早的第一字段集合。例如，将包含的用户行为的发生时间为早于当前时间第三预设时长的第一字段集合删除。

示例性的，第三预设时长可以基于实际情况而定，本申请并不限定第三预设时长的具体值。

在另一可选实现方式中，数据库可以包括第一子数据库，以及第二子数据库，其中，第一子数据库用于存储至少一个第二用户行为集合，每一第二用户行为集合包含的第一字段集合中用户行为的发生时间至少早于当前时间第一预设时长；第二子数据库用于存储至少一个第二用户行为集合，每一第二用户行为集合包括的第一字段集合中用户行为的发生时间与当前时间的差值小于或等于第二预设时长。

示例性的，第一预设时长大于第二预设时长，第一预设时长与第二预设时长可以基于实际情况而定，本申请并不限定第一预设时长和第二预设时长的具体值。

可以理解的是，若数据库的存储空间较小，例如，仅能存储1年以内的用户历史行为数据对应的第一字段集合，可能导致无法得到指标数据，例如指标数据为2年内用户观看视频的平均时长，由于数据库仅存储了1年以内的用户历史行为数据对应的第一字段集合，所以无法得到该指标数据。

为了避免上述问题，本申请实施例采用大存储空间的数据库，例如，redis数据库。

示例性的，第一子数据库为MySQL数据库，或者，Oracle数据库；第二子数据库为redis数据库。

第二种：数据库202对于每一第一用户行为数据集合而言，将所述第一用户行为数据集合作为第二用户行为集合。

在第二种存储方式中，第一服务器每隔第二预设时间段，将得到的至少一个第一用户行为数据集合存储至数据库202。

在一可选实现方式中，数据处理系统可以包括至少一个第三服务器204，每一第三服务器204用于执行步骤E1至步骤E2。

步骤E1：显示用户界面，所述用户界面包括至少一个指标数据的名称。

步骤E2：响应于针对所述至少一个指标数据中目标指标数据的名称的选择操作，生成表征获取目标指标数据的第一请求。

综上，第三服务器204可以动态配置自己所需要的指标数据。

可选的，在选择目标指标数据后，可以设置目标指标数据对应的时间范围，此时第一请求携带有该时间范围。

上述本申请公开的实施例中详细描述了方法，对于本申请的方法可采用多种形式的装置实现，因此本申请还公开了一种装置，下面给出具体的实施例进行详细说明。

如图6所示，为本申请实施例提供的第二服务器的一种实现方式的结构图，该第二服务器包括：

接收模块601，用于接收第三服务器发送的表征获取目标指标数据的第一请求；第一确定模块602，用于从预设的至少一个指标数据对应的计算逻辑信息中，确定所述目标指标数据对应的目标计算逻辑信息；一个所述指标数据对应的所述计算逻辑信息包括计算得到所述指标数据所需的至少一个字段，以及，所述至少一个字段的计算规则；计算模块603，用于基于所述数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据；其中，一个所述第二用户行为集合包括一个用户身份标识以及至少一个第一字段集合，一个所述第一字段集合由从具有所述用户身份标识的一个用户历史行为数据中提取的至少一个表征用户行为的字段信息组成；发送模块604，用于将所述至少一个用户身份标识分别对应的所述目标指标数据发送至所述第三服务器。

在一可选实现方式中，计算模块包括：第一获取单元，用于从数据库存储的至少一个第二用户行为集合中分别获得第三用户行为集合；一个所述第二用户行为集合对应的所述第三用户行为集合为所述第二用户行为集合的子集；第一计算单元，用于基于至少一个所述第三用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据。

在一可选实现方式中，一个所述第一字段集合包括第一字段信息，所述第一字段信息为用户行为的发生时间，所述第一请求还携带有所述目标指标数据对应的时间范围，第一获取单元包括：第一确定子单元，用于从所述数据库存储的所述第二用户行为集合中确定包含的所述第一字段信息属于所述时间范围的至少一个目标第一字段集合；第一获取子单元，用于基于所述至少一个目标第一字段集合，获得所述第三用户行为集合。

在一可选实现方式中，第一获取单元包括：第二获取子单元，用于从所述第二用户行为集合包含的至少一个第一字段集合中分别获得第二字段集合；一个所述第一字段集合对应的所述第二字段集合由所述第一字段集合包含的至少一个目标字段分别对应的字段信息组成；所述至少一个目标字段为计算得到所述目标指标数据所需的字段；第三获取子单元，用于基于至少一个所述第二字段集合，获得所述第三用户行为集合。

在一可选实现方式中，所述第一请求包括所述目标指标数据的目标编号，还包括：第二确定模块，用于从预设的至少一个编号对应的类型中，确定所述目标编号对应的目标类型；触发模块，用于若所述目标种类表征由所述第二服务器计算得到所述目标指标数据，调用计算模块603；获取模块，用于若所述目标种类表征从所述数据库中获得所述目标指标数据，从所述数据库中获得所述至少一个用户身份标识对应的所述目标指标数据。

如图7所示，为本申请实施例提供的第二服务器的又一实现方式的结构图，第二服务器包括:

存储器701，用于存储程序；

处理器702，用于执行所述程序，所述程序具体用于：

接收第三服务器发送的表征获取目标指标数据的第一请求；

将所述至少一个用户身份标识分别对应的所述目标指标数据发送至所述第三服务器。

处理器702可能是一个中央处理器CPU，或者是特定集成电路ASIC（ApplicationSpecific Integrated Circuit）。

第二服务器203还可以包括通信接口703以及通信总线704，其中，存储器701、处理器702以及通信接口703通过通信总线704完成相互间的通信。

本发明实施例还提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述应用于第二服务器的任一所述的数据处理方法实施例包含的各个步骤。

本发明实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述应用于第二服务器的各种可能实现方式中提供的方法。

需要说明的是，本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器（RAM）、内存、只读存储器（ROM）、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种数据处理系统，其特征在于，包括：

第一服务器，用于接收各用户历史行为数据，所述用户历史行为数据包括用户身份标识；基于各所述用户历史行为数据，获得至少一个第一用户行为集合；将所述至少一个第一用户行为集合发送至数据库；

2.根据权利要求1所述数据处理系统，其特征在于，还包括：至少一个所述第三服务器；每一所述第三服务器用于：

显示用户界面，所述用户界面包括至少一个指标数据的名称；

响应于针对所述至少一个指标数据中目标指标数据的名称的选择操作，生成表征获取目标指标数据的第一请求。

3.根据权利要求1或2所述数据处理系统，其特征在于，所述数据库包括第一子数据库以及第二子数据库；

所述第一子数据库，用于存储至少一个所述第二用户行为集合，一个所述第一子数据库存储的所述第二用户行为集合包括的所述第一字段集合包含的用户行为的发生时间至少早于当前时间第一预设时长；

所述第二子数据库，用于存储至少一个所述第二用户行为集合，一个所述第二子数据库存储的所述第二用户行为集合包括的所述第一字段集合包含的用户行为的发生时间与当前时间的差值小于或等于第二预设时长；所述第一预设时长大于所述第二预设时长。

4.一种数据处理方法，其特征在于，应用于第二服务器，所述数据处理方法包括：

接收第三服务器发送的表征获取目标指标数据的第一请求；

基于数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据；

5.根据权利要求4所述数据处理方法，其特征在于，所述基于所述数据库存储的至少一个所述第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据包括：

从所述数据库存储的至少一个所述第二用户行为集合中分别获得第三用户行为集合；一个所述第二用户行为集合对应的所述第三用户行为集合为所述第二用户行为集合的子集；

基于至少一个所述第三用户行为集合以及所述目标计算逻辑信息，计算得到至少一个所述用户身份标识对应的所述目标指标数据。

6.根据权利要求5所述数据处理方法，其特征在于，一个所述第一字段集合包括第一字段信息，所述第一字段信息为用户行为的发生时间，所述第一请求还携带有所述目标指标数据对应的时间范围，从所述数据库存储的所述第二用户行为集合中获得第三用户行为集合包括：

从所述数据库存储的所述第二用户行为集合中确定包含的所述第一字段信息属于所述时间范围的至少一个目标第一字段集合；

基于所述至少一个目标第一字段集合，获得所述第三用户行为集合。

7.根据权利要求5所述数据处理方法，其特征在于，从数据库存储的所述第二用户行为集合中获得第三用户行为集合包括：

从所述第二用户行为集合包含的至少一个第一字段集合中分别获得第二字段集合；一个所述第一字段集合对应的所述第二字段集合由所述第一字段集合包含的至少一个目标字段分别对应的字段信息组成；所述至少一个目标字段为计算得到所述目标指标数据所需的字段；

基于至少一个所述第二字段集合，获得所述第三用户行为集合。

8.根据权利要求4至7任一所述数据处理方法，其特征在于，所述第一请求包括所述目标指标数据的目标编号，所述数据处理方法还包括：

从预设的至少一个编号对应的类型中，确定所述目标编号对应的目标类型；

若所述目标类型表征由所述第二服务器计算得到所述目标指标数据，执行所述基于所述数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据步骤；

若所述目标类型表征从所述数据库中获得所述目标指标数据，从所述数据库中获得所述至少一个用户身份标识对应的所述目标指标数据。

9.一种第二服务器，其特征在于，包括：

计算模块，用于基于数据库存储的至少一个第二用户行为集合以及所述目标计算逻辑信息，计算得到至少一个用户身份标识对应的所述目标指标数据；

10.一种第二服务器，其特征在于，包括：

存储器，用于存储程序；

处理器，用于执行所述程序，所述程序具体用于：

接收第三服务器发送的表征获取目标指标数据的第一请求；