CN111859132A

CN111859132A - 一种数据处理方法、装置及智能设备、存储介质

Info

Publication number: CN111859132A
Application number: CN202010704851.XA
Authority: CN
Inventors: 刘金林
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-21
Filing date: 2020-07-21
Publication date: 2020-10-30

Abstract

本发明实施例公开了一种数据处理方法、装置及智能设备、存储介质，其中，所述方法包括获取任务配置数据，并获取用户信息分表，该用户信息分表是基于大数据进行数据计算和分析后生成的；根据所述任务配置数据的指示从用户信息分表中筛选用户信息，在筛选过程中，是根据任务配置数据中对用户画像的要求，从用户信息分表记录的一个或者多个用户的用户画像匹配筛选的，以此来实现任务数据的精准推荐；在筛选了用户信息之后，生成任务推送信息；将所述任务推送信息发送给推送服务器，以使所述推送服务器根据所述任务描述信息向筛选得到的用户信息推送数据。

Description

一种数据处理方法、装置及智能设备、存储介质

技术领域

本申请涉及计算机应用技术领域，尤其涉及一种数据处理方法、装置及智能设备、存储介质。

背景技术

基于终端应用的信息推送是用户获取各种资讯的最便捷的方式，应用服务器可以周期性地或定时地为用户推送各种各样的信息，比如，浏览器应用的应用服务器可以向用户推荐各种新闻资讯，短视频应用的应用服务器可以向用户推荐各种短视频，同时，针对用户的一些喜好，应用服务器还可以有针对性地推送一些资讯。在一些应用场景中，推送的这些资讯例如可以是与医疗相关的医疗资讯、与金融相关的理财资讯、与游戏相关的游戏资讯等等，甚至还可以是教育、交通等等领域的相关资讯。

外部引导是指通过云端配置的方式、从大量用户中选定一批用户，智能匹配要推送的内容，通过多个通道将要推送的内容发送给这批用户的终端设备。用户的终端设备收到推送的内容后，可以按照通知栏，或者悬浮窗的形式展示出来。用户点击后跳转到app内部，通过app来显示更为丰富的推送内容。

在数据推送领域，如何为推送任务匹配用户以选定合适的用户来推送相关的内容是重要的优化方向，目前，通过提升服务器的硬件性能可以在一定程度上快捷地为推送任务选定合适的用户，但在可供选择的用户信息的数量较为庞大时，例如某些即时通讯应用的动辄上亿的用户量，在为推送任务选择合适的用户群时，仍然存在耗时长，且匹配度不够准确的问题。

发明内容

本发明实施例提供了一种数据处理方法、装置及智能设备、存储介质，可快捷完成用户与任务的匹配以进行数据推送。

一方面，本发明实施例提供了一种数据处理方法，应用于目标节点设备，所述目标节点设备为任务匹配系统中的任一节点设备，所述方法包括：

在检测到推送任务触发事件时，从所述任务匹配系统的用户服务器中读取数据协同记录，所述数据协同记录是根据所述用户服务器搜集到的用户信息生成的分表集合构建的，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取所述分表集合中满足条件的用户信息分表；

在获取到任务配置数据时，根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息；

根据所述任务配置数据中任务描述信息生成任务推送信息，所述任务推送信息包括：任务配置数据所对应的任务描述信息和筛选得到的用户信息；

将所述任务推送信息发送给推送服务器，以使所述推送服务器根据所述任务描述信息向筛选得到的用户信息推送数据。

另一方面，本发明实施例还提供了另一种数据处理方法，应用于用户服务器，该用户服务器中存储有分表集合，所述分表集合包括多个用户信息分表，所述方法包括：

接收节点设备的分表获取请求；

根据数据协同记录从所述分表集合中获取用户信息分表，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

将获取到的用户信息分表发送给所述节点设备。

相应地，本发明实施例还提供了一种数据处理装置，应用于目标节点设备，所述目标节点设备为任务匹配系统中的任一节点设备，所述装置包括：

获取模块，用于在检测到推送任务触发事件时，从所述任务匹配系统的用户服务器中读取数据协同记录，从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取分表集合中满足条件的用户信息分表，所述数据协同记录是根据所述用户服务器搜集到的用户信息生成的分表集合构建的，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

筛选模块，用于在获取到任务配置数据时，根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息；

生成模块，用于根据所述任务配置数据中任务描述信息生成任务推送信息，所述任务推送信息包括：任务配置数据所对应的任务描述信息和筛选得到的用户信息；

发送模块，用于将所述任务推送信息发送给推送服务器，以使所述推送服务器根据所述任务描述信息向筛选得到的用户信息推送数据。

相应地，本发明实施例还提供了另一种数据处理装置，应用于用户服务器，该用户服务器中存储有分表集合，所述分表集合包括多个用户信息分表，所述装置包括：

接收模块，用于接收节点设备的分表获取请求；

获取模块，用于根据数据协同记录从所述分表集合中获取用户信息分表，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

响应模块，用于将获取到的用户信息分表发送给所述节点设备。

相应地，本发明实施例还提供了一种节点设备，该节点设备包括存储装置和处理器；所述存储装置中存储有计算机程序，所述处理器执行所述计算机程序，实现上述一方面的方法。

相应地，本发明实施例还提供了一种服务器，该服务器包括存储装置和处理器；所述存储装置中存储有计算机程序，所述处理器执行所述计算机程序，实现上述另一方面的方法。

相应地，本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，该计算机程序被处理器执行时，实现上述一方面或另一方面所述的方法。

本申请通过将大量的用户信息拆分记录到不同的用户信息分表上，在进行任务和用户匹配选择合适的用户群时，根据不同的用户信息分表基于数据协同记录由多台用于进行匹配的节点设备来分别同时进行匹配处理，提高了任务与用户匹配的效率，并且分表后，基于相对较小的内存即可完成用户信息分表的缓存处理方便进行任务与用户的匹配，提高了用户匹配的准确性，使得数据推送更具针对性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种数据处理的场景架构图；

图2是本发明实施例的数据处理大致过程的流程示意图；

图3是本发明实施例的一种离线数据生成流程的示意图；

图4a是本发明实施例的进行匹配处理和数据推送的方法流程示意图；

图4b是本发明实施例的一种数据处理方法的流程示意图；

图5a是本发明实施例的一种任务配置界面示意图；

图5b是本发明实施例的另一种任务界面示意图；

图6是本发明实施例的用户终端的界面示意图；

图7是本发明实施例的其中一种关于用户信息分表获取方法的流程示意图；

图8是本发明实施例的另一种数据处理方法的流程示意图；

图9是本发明实施例的对数据协同记录的一种处理流程的示意图；

图10是本发明实施例的对用户信息分表的一种更新流程的示意图；

图11是本发明实施例的为某个节点设备分配用户信息分表的流程示意图；

图12是本发明实施例的一种数据处理装置的结构示意图；

图13是本发明实施例的另一种数据处理装置的结构示意图；

图14是本发明实施例的一种节点设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请中，主要利用云技术来实现相应的用户信息管理和数据的推送，云技术(Cloud technology)是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频应用、图片类应用和更多的门户网站应用。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。对于本申请而言，在多个方面需要利用到云技术的优势，比如一方面，对于海量用户的用户信息，可以基于云技术通过多张用户信息分表来分别记录，一张分表中仅记载合适数量的部分用户信息，比如对于1亿用户的用户信息，可以用10张用户信息分表来记录，每一张分表记录1千万用户的用户信息；另一方面，通过多个节点设备、基于协同逻辑来分别对其中的一张或两张或多张用户信息分表的数据读取，以及与相关的需要推送数据的任务的匹配处理，例如部署10个节点设备，每一个节点设备与一张用户信息分表关联，在确定某个推送任务的用户信息的过程中，每个节点设备各自进行任务与用户的匹配，得到匹配结果，选择对于任务而言较为合适的用户群，对于推送服务器而言，根据每一个节点设备的匹配结果，来推送相关数据。也就是说，本申请在处理逻辑上通过用户信息分表和数据协同记录来对用户信息分表进行管理、筛选，在硬件架构上设置多个节点设备，并行地分别基于数据协同记录和用户信息分表来进行分别匹配，多节点协同处理，可有效地节省了推送任务与用户信息匹配的时间，提高了数据推送的效率，特别是上述提及的数以千万、亿计的用户信息时，能够显著地提高数据推送的效率。

具体请参考图1所示，是本发明实施例的一种数据处理的场景架构图，在此架构图下，本申请的数据处理方案大体可以分为两个阶段，即离线阶段和在线阶段，离线阶段主要是完成数据的加工然后存入数据库解决了数据存储的问题；离线阶段主要是进行关于海量用户数据的大数据分析和计算，大数据(Bigdata)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临，大数据也吸引了越来越多的关注，大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。通过分析确定的各个用户信息分表存储在数据库中，数据库(Database)，简而言之可视为电子化的文件柜，即存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。数据库管理系统(英语：Database Management System，简称DBMS)是为管理数据库而设计的电脑软件系统，一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类，例如关系式、XML(Extensible Markup Language，即可扩展标记语言)；或依据所支持的计算机类型来作分类，例如服务器群集、移动电话；或依据所用查询语言来作分类，例如SQL(结构化查询语言(Structured Query Language)、XQuery；或依据性能冲量重点来作分类，例如最大规模、最高运行速度；亦或其他的分类方式。不论使用哪种分类方式，一些DBMS能够跨类别，如同时支持多种查询语言。

在线阶段分读取和过滤匹配两个部分，读取主要是循环把用户信息分表加载入本机磁盘，然后通过共享内存的方式读取用户信息分表到内存，最后通过合并所有当前需要推送数据的推送任务，基于用户信息分表，为推送任务匹配过滤用户信息，把匹配到用户信息的任务所对应的推送数据通过手机厂商提供的推送方式下发到匹配到的用户信息所对应的用户侧。

在图1所述的场景架构中，大量用户的终端设备101与用户服务器102完成离线阶段的相关处理，用户服务器102、匹配服务器或者称之为节点设备103、推送服务器104完成在线阶段的相关处理。下面在结合图2对数据处理过程进行详细描述，图2是本发明实施例的数据处理大致过程的流程示意图。在一个实施例中，对于用户来讲，用户服务器102、节点设备103、推送服务器104可以被认为是云服务器，云服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器，在一个实施例中，用户服务器102、节点设备103、推送服务器104所提供的功能也可以由一个云服务器实现。而终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及云服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

终端设备101是指安装了相应的应用并登陆过用户账号的终端，这些应用例如可以是WiFi管家、即时通讯应用、浏览器应用等，可以基于多个应用的用户账号来进行后续的数据处理，也可以仅仅针对一个应用的用户账号来进行后续的数据处理。终端设备101如果有检测到使用app的行为及相关的爆光、点击等用户操作相关事件，则可以生成行为日志及事件日志，并通过统一上报的方式上报到用户服务器102，在上报的时候，是以终端设备101登录的用户账号作为唯一标识来区分不同用户的行为日志和事件日志的。因此，对于用户服务器102而言，结合用户profile(用户的用户账号)，行为日志及事件日志，做好存档。每天凌晨或者其他被认为并指定的业务空闲的时段，读取出存档的这些数据，离线生成多个维度的用户信息，具体是按照指定的格式进行数据处理，得到规范格式的用户信息，然后通过流式数据处理器kalfka把用户信息发送给后台服务，后台服务根据用户信息里面的用户唯一key即用户账号，确定用户信息分表并存入数据库，这里的后台服务可以由一个专用于存储用户信息分表的服务器提供，也可以是所述用户服务器102提供。

具体如图3所示，示出了一种离线数据生成流程的示意图，终端设备101可以定期或者实时统一上报用户账号、行为日志和事件日志等。用户服务器102接收并存储用户账号profile、行为日志、事件日志hive表，在指定的空闲时间内，进行大数据分析计算，确定每一个用户账号所对应的用户信息下各个维度的内容，最后通过kalfka处理后将各个用户信息分表存入到数据库中。

在一个实施例中，基于用户账号、行为日志和事件日志生成的用户信息的格式如下表1所示。

表1

guid	厂商	沉默天数	版本	guid info	画像id列表	地区id	扩展
								32	4	4	64	1024	128	64	256

也就是说，一条用户数据，总共1576个字节。其中，guid是全局唯一标识符，用于在用户信息分表中唯一标识一条用户信息，或者称之为用户信息分表的索引值，而guid info字段用于记录用户账号。厂商也可被称之为类型标识字段，该类型标识字段主要用于标识应用账号对应应用所在终端设备的厂商类型。沉默天数主要是指本条用户信息所对应的用户账号已经没有登录的天数。版本字段是指本条用户信息所对应的用户账号登录的应用的版本号。画像id列表也可称之为画像标识字段，该字段中记录了本条用户信息所对应用户的用户画像id，具体可以包括1个或者多个用户画像的id，用户画像是根据本条用户信息所对应的用户账号通过终端设备上传的行为日志和事件日志等信息分析得到的，能够在一定程度上表示本条用户信息所对应用户的兴趣、爱好等。地区id字段主要用来记录本条用户消息所对应的用户当前所处的地区id或者已经到过的部分或全部地区id。扩展字段则可以根据需要进行使用。

在存储了上述提及的用户信息分表后，如图2所示，节点设备103基于用户信息分表、以及任务配置数据，在多维度的过滤策略的指导下，从用户信息分表中为任务配置数据所对应的任务匹配合适的用户信息。在匹配到合适的用户信息后，将任务配置数据所对应任务的任务描述信息(例如任务标识)和匹配到的所有合适的用户信息一并发送给推送服务器104，由推送服务器104推送给相应用户信息所对应的终端设备。推送服务104可以根据任务推送信息中的任务描述信息找到该任务对应的推送数据，然后基于用户信息包括的用户账号，向登录了相应用户账号的终端推送该任务对应的推送数据。

在一个实施例中，请参考图4a，是本发明实施例的进行匹配处理和数据推送的方法流程示意图。该方法可以由一个云服务器来执行，也可以是上述提及的节点设备来实现，该方法具体包括如下步骤。

S401：循环读取映射到内存中的用户信息分表中的用户信息。基于while方式循环读取分表数据，直到用户信息分表中用户信息id大于等于用户信息分表的最大用户信息id(例如上述提及的guid索引达到最大值)，表明当前用户信息分表的所有用户信息已经被读取和筛选完毕，可开启下一轮循环。

S402：将满足条件的多个需要执行数据推送的任务对应的任务配置数据加载到内存中。节点设备可以同加载并遍历匹配所有的任务，获取多个任务配置数据，基于多个任务配置数据，同时对加载到内存中的每一条用户信息进行匹配处理。S401和S402可以同时或者先后执行，先后顺序不限定。

用户信息分表可以存储在本地磁盘中，当需要进行任务配置数据和用户信息的匹配处理时，可以将用户信息分表的部分或全部内容映射缓存到内存中，以便于快速读取并进行匹配。可以逐条读取每一条用户信息与合并处理的多个任务配置数据进行匹配，当一条用户信息匹配结束后，再循环读取下一条用户信息执行相应的匹配处理。

S403：对内存中加载的用户信息分表对应的用户信息和多个任务所对应的任务配置数据进行匹配处理。主要是基于任务配置数据中的用户画像部分记录的用户画像id和用户信息的用户画像id列表中的用户画像id进行匹配，确定是否相同，策略还可以是进一步基于用户信息的厂商字段记录的厂商与业务配置数据中配置的厂商id是否一致。在匹配过程中，还需要对相应的数据协同记录进行更新，比如更新当前任务配置数据在用户信息分表的处理位置，如果是第1次加入的任务则记录当前用户信息分表中表项的开始位置(tableBeginPos)和当前读取到的位置(curPos)，tableBeginPos和curPos主要记录的是用户信息分表上当前与多个任务配置数据进行匹配处理的表项位置。

S404：根据匹配处理后得到的匹配结果得到任务推送信息，并按照任务推送信息获取分别获取多个任务所对应的待推送数据和对应的用户信息，向对应的用户信息推送这些待推送数据。在确定了用户信息后，即可将任务配置数据所对应的任务描述信息和为该任务配置数据筛选出来的用户信息，向相应用户信息所对应的客户端推送任务相关的推送数据。同时，如果到了更新数据协同记录的周期则把本节点设备更新的数据协同记录更新到服务器，例如用户服务器，这个用户服务器单点存储了所有的协同结构数据，可以将后续提及的关于某个用户信息分表的协同结构数据中的tablemapping作为key，保证读取和更新的原子性。

具体的，再请参见图4b，是本发明实施例的一种数据处理方法的流程示意图，本发明实施例的所述方法可以由云服务器来执行，其中，该方法可以由上述提及的节点设备来执行，比如图1中的任一节点设备。具体的，本发明实施例的所述方法包括如下步骤。

S410：在检测到推送任务触发事件时，从所述任务匹配系统的用户服务器中读取数据协同记录，所述数据协同记录是根据所述用户服务器搜集到的用户信息生成的分表集合构建的，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息。可以配置节点设备周期性地(比如每2小时)或者在指定时间点(比如早上8点)开始从用户服务器获取相关数据，以进行后续的推送任务。那么在周期到来时或者指定时间点到来时，即认为检测到的推送任务触发事件。在其他实施例中，还可以由管理员用户主动发起推送任务触发事件，以便于触发执行所述S410。在另一个实施例中，可以周期性地触发执行所述S410，也可以在周期性或者实时检测到存在任务配置数据需要被处理时，触发执行所述S410。

在一个实施例中，所述数据协同记录可以作为用户信息分表的元数据，节点设备可以对其进行更新。而对于用户信息分表，由用户服务器生成后存储在用户服务器的存储器中，节点设备可以先从用户服务器中获取相应的用户信息分表并存储在本地磁盘中，在需要时将存储在本地磁盘中的用户信息分表加载到共享内存中，实现用户信息分表的三级缓存，极大地方便了数据的加载，并且通过多节点设备共同维护分布式协同结构对元数据即用户信息分表进行维护，解决海量数据的计算问题，确保计算效率，每次过滤的时长在业务时限范围内。

S411：从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取所述分表集合中满足条件的用户信息分表。所述用户信息分表记录了大量的用户信息，每一条用户信息的格式如上述的表1所示，包括多个维度的内容。在S411中获取的用户信息分表可以是到用户服务器直接获取，也可以是已经从用户服务器存储到本地磁盘后，从本地磁盘中获取。分表描述信息分表描述信息是指映射关系记录项、分表状态数据记录项。

S412：获取任务配置数据。所述任务配置数据可以存储在上述提及的用户服务器中，也可以存储在一个专用于进行任务配置的服务器中。

在一个实施例中，任务配置数据可以是预先由管理员用户配置的，可以通过一个任务配置界面来配置任务的相关数据，在本发明实施例中，所示任务配置界面上设置的配置项可以包括：任务时间配置项、任务所对应的设备类型配置项、任务所对应的对象类型配置项、任务所对应的数据来源配置项中的任意一种或多种。如图5a所示，是本发明实施例的一种任务配置界面示意图，在该任务配置界面中包括了任务名或者策略名配置项，在该配置项中可以配置如图5a所示的“积分偏好用户下发任务”的任务名。同时，在该任务配置界面上还包括任务时间配置项，通过所述任务时间配置项配置得到任务有效时间、和/或任务所对应的推送数据的推送时间，例如，在图5a中，配置了本任务的任务有效时间，具体从2018年11月14日20点10分19秒开始、到2020年2月1日早上2点10分结束，在此时间范围内，可以根据后续的时间设置来推送数据，而在此时间范围外时，本任务是无效的，不会推送任务数据。同时，还设置了推送数据的推送时间，在图5a中，可以方便管理员用户选择周一至周日的任意一个或者多个或者全部时间有效，并且，在这些有效天数内，还可以设置具体开始推送数据的推送时间，比如选择中午12点0分开始推送数据，并且进一步地还可以设置推送数据的推送频率(比如半小时)、多少时长发完(比如不低于3600秒将所有推送数据向所有筛选的用户信息多对应用户)。实际上，所述时间配置项实际也是触发执行S411的一个因素，只有在这个时间段内，才开始触发获取用户信息分表，比如，以图5a为例，在2018年11月14日20点10分19秒开始、到2020年2月1日早上2点10分结束的时间范围之类，每周的每一天在中午12点开始获取用户信息分表，以便于筛选用户信息并向用户信息发送积分偏好用户下发任务所对应的推送数据。

任务配置界面还包括设备类型配置项，过所述设备类型配置项配置得到任务所对应的推送对象的终端设备的厂商类型，所示设备类型配置项对应于图5a中的厂商id，不选择的话就会被默认为所有厂商，图5a所示的各个厂商仅为举例，还可以包括国内外的更多的厂商。通过对设备类型配置项进配置，确定推送数据所要推送的用户信息对应设备的厂商的目的在于：一方面，可以对应地通过不同厂商的通知消息渠道，来推送相应的推送数据，另一方面，可以有针对性地通知部分类型的终端设备，例如，有关于厂商A的折扣资讯作为某个任务的推送数据时，在任务配置数据中仅仅在设备类型配置项中配置厂商A，这样一来，相应的折扣资讯就仅仅推送给筛选出来的用户信息所对应的用户且该用户的设备为厂商A的设备。

任务配置界面还包括对象类型配置项，通过所述对象类型配置项配置得到任务所对应的推送对象的用户画像信息。在为某个任务配置数据筛选用户信息时，以用户画像信息为主要筛选依据。在图5a中，为对象类型配置项即用户画像配置项配置1002，则表明本任务“积分偏好用户下发任务”所对应的各推送数据，仅向用户画像标识为1002的用户推送，在从用户信息分表中筛选用户信息时，基于上述表1中的画像id列表来进行筛选，如果当前分析的用户信息分表的某条用户信息的画像id列表字段中存在与对象类型配置项配置的值如1002一致，则该用户信息与本任务配置数据所对应的任务匹配，会被筛选出来以便于推送本任务配置数据所对应任务相关的推送数据。

任务配置界面还包括任务所对应的数据来源配置项，通过所述数据来源配置项配置得到任务所对应的推送数据的来源信息。在图5a所示的界面中，资讯的来源即对应数据来源配置项。数据来源配置项可以配置两种或者多种方式，比如从来源信息所指定的数据库获取推送数据，或者基于特殊的数据推送配置来获取推送数据，在图5a的示例中，管理员用户可以选择两种数据来源的配置方式，所述的WiFi-push的配置取记为基于特殊的数据推送配置来获取推送数据。其中，特殊的数据推送配置来获取推送数据时，数据推送配置界面可以参考图5b所述。

S413：根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息。在一个实施例中，筛选用户信息的方式主要是基于任务配置数据中的对象类型配置项配置的用户画像id，用户信息分表中每一条用户信息的用户画像id列表字段与任务配置数据中的用户画像id进行比较，如果存在相同的用户画像id，则表明该条用户信息所对应的用户与任务配置数据所对应的任务匹配，可以推送该任务配置数据所对应任务相关的推送数据。

在一个实施例中，处理用户画像id的匹配，还可以进行厂商id的匹配，即任务累着数据中的设备类型配置项所配置的厂商类型、与表1所示的厂商字段的值对应。也就是说，用户信息分表上某一条用户信息是否与任务配置数据匹配，需要确定用户信息的画像id列表字段中是否记录了与任务配置数据中对象类型配置项的用户画像id相同、用户信息的类型标识字段所对应的厂商类型是否与任务配置数据中设备类型配置项配置的厂商类型相同。

需要说明的是，节点设备可以同时获取到多个任务配置数据，这些任务配置数据中任务时间配置项可能相同或者重复，因此，可以多个任务配置数据可以合并处理，针对本节点设备所获取到的用户信息分表中每一条用户信息，都分别与合并处理的所有任务配置数据进行匹配，在与所有合并处理的任务匹配结束后，再读取用户信息分表上下一条用户信息与所有合并处理的任务配置数据进行匹配。

在一个实施例中，在S411中获取到的用户信息分表被存储在本地磁盘中，在根据所述任务配置数据的指示从用户信息分表中筛选用户信息的过程中，可以先将用户信息分表加载到共享内存中，然后再从共享内存中快速读取用户信息分表中每一个用户信息与任务配置数据进行匹配。当用户信息分表的数据量较大时，比如对于有1000万条用户信息的用户信息分表，可能有10G数据，那么，当检测到用户信息分表的数据量大于数据量阈值时，可以按照索引顺序，将所述满足条件的用户信息分表中目标数据量的用户信息加载到内存中，比如按照索引顺序加载其中的2G数据；将内存中缓存的目标索引的用户信息分别与当前获取到的所有任务配置数据进行匹配判断；根据匹配判断的结果为部分或者全部任务配置数据筛选得到用户信息。当然，也可以按照索引顺序加载预设条数的用户信息，比如预先加载前200万条用户信息到共享内存中，以便于后续将内存中缓存的目标索引的用户信息分别与当前获取到的所有任务配置数据进行匹配判断；根据匹配判断的结果为部分或者全部任务配置数据筛选得到用户信息。

S414：根据所述任务配置数据中任务描述信息生成任务推送信息，所述任务推送信息中包括：任务配置数据所对应的任务描述信息和筛选得到的用户信息。所述任务描述信息可以是指任务配置数据所对应任务的任务名或者任务标识，以便于后续推送服务器能够基于任务名或者任务标识找到与任务对应的推送数据的数据库。而用户信息则可以为如表1所示的完整字段的信息，也可以是仅仅包括表1中的guid info字段的内容即用户账号，基于用户账号也可以向登录了相应用户账号的终端设备推送相应的推送数据。

S415：将所述任务推送信息发送给推送服务器，以使所述推送服务器根据所述任务描述信息向筛选得到的用户信息推送数据。推送服务器可以通过多种方式将推送数据推送给筛选出来的用户信息所对应的用户终端。用户终端可以以通知的方式显示给用户，当用户点击了用户终端上的该通知后，可以跳转到相应的app内部，在app提供的界面上显示推送数据并还可以显示更多的其他数据，具体可参考图6所述，推送服务器将推送数据发送给某个被筛选出来的用户信息所对应的终端后，终端生成通知消息601并在终端桌面上显示给用户，如果用户对此通知消息感兴趣，则可以通过单击的方式点击该通知消息601，终端自动调用该通知消息601所对应的应用并运行该应用，在应用内显示该应用的一个资讯显示界面602。

在一个实施例中，在关于步骤S411中描述了用户信息分表的获取方式，其具体是基于在步骤S410中读取的数据协同记录来从分表集合中获取的。本发明实施例中所述的数据协同记录是针对多个节点设备构建的方便多个节点设备之间协同工作，避免重复工作的记录数据，该数据协同记录所对应的协同结构如下所述：

可以构建多个数据协同记录，一个数据协同记录对应一个用户信息分表，当用户服务器生成了一个新的用户信息分表后，可以为该新的用户信息分表(或者称之为目标用户信息分表)构建一个新的数据协同记录(也可以称之为目标数据协同记录)，在目标数据协同记录中记录所述目标用户信息分表已知的内容，比如上述提及的分表名称等内容，当有节点设备占用该目标用户信息分表后，可以由用户服务器或者占用你该目标用户信息分表的节点设备在目标协同数据上记录节点设备名称、更新时间等等，在目标用户信息分表被使用的过程中，由相应的节点设备更新任务名，表格开始位置、表格结束位置等等内容。而本申请实施例中所提及的所述数据协同记录的关联信息则包括上述结构体中提及的所有信息，包括：任务名、表格开始位置、表格当前位置、分表名称、任务、当前节点设备名称、最新更新时间、分表名称、节点设备名称等等。

基于上述的协同结构，在数据协同记录中记录的分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息包括：第一映射信息，所述第一映射信息指示了用户信息分表的分表名称与节点设备的节点设备名称之间的关系，即“Struct Collab”部分记载的内容；第二映射信息，所述第二映射信息指示了分表名称、任务名称、节点设备名称、对用户信息分表处理过程中对数据协同记录的更新信息之间的关系，即“Struct TableMapping”部分记载的内容；第三映射信息，所述第三映射关系指示了任务名、用户信息分表处理过程中已经被处理的表格位置之间的关系。

在一个实施例中，基于上述协同结构的数据协同记录，在所述获取用户信息分表之前，还可以如图7所示的步骤，图7是本发明实施例的其中一种关于用户信息分表获取方法的流程示意图。所述方法包括如下步骤。

S701：从用户服务器中读取数据协同记录。节点设备还可以按照要求对用户服务器中关于本节点设备所对应的数据协同记录进行更新。用户服务器在完成了离线部分的用户信息生成并得到多个用户信息分表之后，即可初始化该数据协同记录，以便于当有节点设备来读取用户信息分表时，能够更新该数据协同记录。用户服务器存储有包括多种用户信息分表的分表集合和数据协同记录，每一张或两张用户信息分表可以对应一个数据协同记录，当用户信息分表较多时，用户服务器所维护的数据协同记录就对应包括多个。用户服务器和节点设备都可以对数据协同记录进行更新。

S702：根据所述数据协同记录，在所述分表集合中确定满足条件的用户信息分表，所述满足条件的用户信息分表为：空闲用户信息分表、或异常用户信息分表，其中，空闲用户信息分表是指没有被绑定的用户信息分表。

具体的，在一个实施例中，所述S702可以包括从所述数据协同记录的关联信息中读取映射关系记录项，所述映射关系记录项用于记录分表与节点设备之间映射关系；根据所述映射关系记录项，从所述分表集合中确定没有被记录到所述映射关系记录项的用户信息分表；将所述确定的没有被记录到所述映射关系记录项的用户信息分表作为满足条件的用户信息分表。

所述数据协同记录中包括：用于记录分表与节点设备之间映射关系的映射关系记录项，因此，所述确定的满足条件的用户信息分表包括：所述分表集合中没有被记录到数据协同记录中的映射关系记录项的用户信息分表；映射关系记录项对应于上述的“StructCollab”部分记录的内容，一个用户信息分表的名称与一个节点设备的节点设备名称对应，某一个节点设备(记为第一节点设备)在从用户服务器中获取用户信息分表时，将所有的用户信息分表的名称作为关键字在所有的数据协同记录中查找，如果发现某一个用户信息分表(记为第一用户信息分表)的名称没有被任何一个数据协同记录的映射关系记录项记录，则可以认为第一用户信息分表为空闲用户信息分表，可以认为该第一用户信息分表没有被使用，第一节点设备可以获取该第一用户信息分表，以便于执行后续步骤。而如果第一节点设备没有找到空闲用户信息分表，则表明所有的用户信息分表都在被其他节点设备所使用。在所述分表集合中确定满足条件的用户信息分表失败。

具体的，在另一个实施例中，所述S702还可以包括：从所述数据协同记录的关联信息中读取映射关系记录项，所述映射关系记录项用于记录分表与节点设备之间映射关系；若所述分表集合中所有的用户信息分表均被记录到所述映射关系记录项中，则从所述数据协同记录的关联数据中读取分表状态数据记录项；根据所述分表状态数据记录项，检测所述分表集合中是否存在处于异常状态的用户信息分表。将处于异常状态的用户信息分表作为满足条件的用户信息分表。

所述数据协同记录中包括：用于记录分表与节点设备之间映射关系的映射关系记录项和分表状态数据记录项，所述确定的满足条件的用户信息分表包括：所述分表集合中被记录到数据协同记录中的映射关系记录项、但根据所述分表状态数据记录项记录的分表状态被确定为异常的用户信息分表。也就是说，在本发明实施例中，当第一节点设备通过上述的查找空闲用户信息分表的描述方式无法找到空闲用户信息分表后，可以在数据协同记录中进一步根据分表状态数据记录项来找到被其他节点设备使用但出现异常的用户信息分表，所述分表状态数据记录项对应于上述的“Struct TableMapping”。在该部分结构中lastUpdateMs项表示了某个用户信息分表在某个节点设备中的使用更新情况，以成映射关系的第二节点设备和第二用户信息分表为例，在“Struct Collab”中记录了tables为第二用户信息分表的名称，nodes为第二节点设备的节点设备名称，表明第二用户信息分表和第二节点设备之间被绑定，第二节点设备在进行任务配置数据与第二用户信息分表中的目标用户信息之间的匹配处理结束后，会更新该数据协同记录，具体更新lastUpdateMs项以更新记录最新的更新时间，如果发现第二用户信息分表所对应的数据协同记录中的该项长期没有更新(未更新的时长大于预设时长)，则认为第二用户信息分表存在异常，该第二用户信息分表被认为是异常用户信息分表，第一节点设备可以获取该第二用户信息分表，以便于第二用户信息分表在第一节点设备中被正常使用。

对于第一节点设备而言，由于“Struct tableTask”的存在，第一节点设备基于curPos的值可以知道第二节点设备最近一次用户信息与任务配置数据之间的匹配时处理到哪一个用户信息了(比如用户信息的guid)，第一节点设备就从curPos所指示的用户信息或者curPos所指示的用户信息下一用户信息开始，进行任务配置数据和用户信息之间的匹配处理。第一节点设备会实时地或者周期性地更新当前使用的用户信息分表所对应的数据协同记录，比如更新所述curPos的值。

S703：从用户服务器中获取所述确定的满足条件的用户信息分表，并存储所述满足条件的用户信息分表。在获取到用户信息分表后，可以存储在节点设备的本地存储介质中，当需要时再执行上述的S411从存储介质中获取用户信息分表。

在一个实施例中，如果获取到的满足条件的用户信息分表为空闲用户信息分表，则获取到空闲用户信息分表的节点设备会根据本节点设备的节点设备名称、该空闲用户信息分表的名称，更新该空闲用户信息分表所对应的数据协同记录。并在执行上述的S411、S412、以及S413的过程中，基于任务配置数据所对应任务的任务名、当前匹配处理的用户信息的全局唯一标识guid等执行相应的处理，更新数据协同记录。

而如果获取到的满足条件的用户信息分表为存在异常的用户信息分表即异常用户信息分表时，则上述的S413可以包括：检测所述任务配置数据所对应任务的任务名是否被记录在所述数据协同记录的分表任务数据记录项中；若是，则根据所述分表任务数据记录项确定用户信息分表项标识信息；在所述满足条件的用户信息分表中从除所述用户信息分表项标识信息之外用户信息分表项标识中筛选用户信息。分表任务数据记录项如上述协同结构中关于“StructtableTask”的描述，其记录了任务名、用户信息分表项标识信息(即tableBeginPos和curPos)，用户信息分表项标识信息记录了一个用户信息标识范围。下面以上述提及的第一节点设备、第二节点设备和第二用户信息分表为例进行说明。

第二节点设备先与第二用户信息分表绑定，第二节点设备在执行目标任务配置数据(以“积分偏好用户下发任务”为例)与第二用户信息分表中用户信息之间的匹配处理时，执行到第10万个用户信息，第二节点设备会将数据协同记录中的curPos的值更新为第10万个用户信息的标识，并更新lastUpdateMs的时间。由于第二节点设备本身出现故障，其并未继续执行“积分偏好用户下发任务”与第二用户信息分表中用户信息之间的匹配处理，超出30分钟没有更新数据协同记录，因此，第二用户信息分表被第一节点设备认定为异常用户信息分表，第一节点设备获取异常用户信息分表，开始执行任务配置数据与异常用户信息分表中的用户信息之间的匹配处理，如果第一节点设备是分析的任务配置数据也包括“积分偏好用户下发任务”，那么第一节点设备并不会从异常用户信息分表的第一个用户信息开始执行匹配处理，而是基于异常用户信息分表所对应的数据协同记录中的curPos的值，在tableBeginPos与curPos所对应的用户信息分表项标识信息之外用户信息分表项标识中筛选用户信息，因为第二节点设备可能已经将在第二用户信息分表中筛选得到的与“积分偏好用户下发任务”匹配的用户信息发送给推送服务器了。

以上内容描述了用户服务器、节点设备的处理流程。对于推送服务器而言，其同时与多个节点设备相连，每一节点设备都会通过上述描述的方式，根据一个或多个任务配置数据从用户信息分表中筛选用户信息，并最终将任务推送信息发送给推送服务器。推送服务器因此会接收N组任务推送信息，每组任务推送信息包括任务描述信息、和从用户信息分表中筛选的与该任务描述信息匹配的用户信息；分别获取为各任务描述信息所对应任务配置的推送数据；将获取到的推送数据分别向各任务描述信息匹配的用户信息执行推送处理。

基于上述实施例的描述，本申请在存储方面，按照用户信息的唯一标识做hash分表(用户信息分表的分表数可以指定)，每张用户信息分表的数据量和条数有限，方便不同内存资源、处理器资源的服务器进行用户信息的筛选，降低了对服务器的硬件资源的要求。并且，在读取过程中，本方案基于以上所描述的存储方式，使用分布式集群的方式，一张用户信息分表对应一个节点设备，共同完成所有用户信息的遍历，每个用户信息分表一天只加载一次，把用户信息分表数据加载到本地后，把这些数据存入本地磁盘，然后使用共享内存的方式做映射，如部署10个节点每个节点使用2G内存，如果100G的数据，每个节点只需要负责读取10G的数据，以2G的内存使用共享内存的方式映射，只需要映射10次(分页为1G的情况)就可以双缓冲的方式遍历一遍，提高了读取效率。并且在任务与用户信息的匹配的过程中，本方案按两个阶段处理，一个阶段是循环读取所有的数据，另外一个阶段是合并任务的匹配(10个任务，只需要做1次读取和10次匹配，即读取是共享的)，这样读取和匹配得到解耦，最终随着数据量的增加，系统的整体性能不变。

再请参见图8，是本发明实施例的另一种数据处理方法的流程示意图，本发明实施例的所述方法可以应用在云服务器中，在一个实施例中，可以有上述提及的用户服务器来实现。本发明实施例的所述方法包括如下步骤。

S801：接收节点设备的分表获取请求。在用户服务器或者云服务器中存储有分表集合，所述分表集合包括多个用户信息分表。这些分表是根据安装有相应应用的终端设备，在应用运行过程中记录并上报的用户账号、行为日志和事件日志分析得到的，用户信息分表中记录了大量的用户信息，这些用户信息的数据结构可参考前述实施例中表1的内容所示。某个节点设备可以定期向用户服务器或者云服务器发起分表获取请求，获取到一个或者两个或者更多个用户信息分表，以便于基于获取到的用户信息分表与一个或者多个任务进行匹配处理。

S802：根据数据协同记录从所述分表集合中获取用户信息分表，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息。所述数据协同记录具体结构以及应用方式可参考前述实施例中相关内容的描述，同时，在下述图9、图10以及图11所对应的实施例也会进行简要描述。

S803：将获取到的用户信息分表发送给所述节点设备。在响应所述分表获取请求获取到用户信息分表后，不仅会将获取到的用户信息分表发送给发起所述分表获取请求的节点设备，还会更新所述数据协同记录。

在一个实施例中，请参考图9所示，对数据协同记录的主要处理流程包括以下步骤。

S901：为生成的分表集合中各个用户信息分表初始化数据协同记录，该步骤可以由生成用户信息分表的用户服务器来执行，用户服务器在确定了多个用户信息分表或者得到了新的用户信息分表后，根据当前用户信息分表(tables)的数量，当前存在的节点设备(nodes)的数量，初始化每个用户信息分表和节点设备的对应关系(tablemapping)，并初始化每个节点设备处理的任务对应的用户信息分表的进度情况。

S902：多个节点设备中的某个节点设备发起用于获取用户信息分表的获取请求。节点设备可以根据需要发起所述获取请求，或者周期性地发起所述获取请求，或者在检测到需要为一个或者多个配置的推送任务确定推送对象时发起所述获取请求。

S903：将发起用于获取用户信息分表的获取请求的节点设备与为该节点设备选择确认的用户信息分表进行绑定，根据绑定结果对初始化后的数据协同记录进行更新，存储所述数据协同记录，在某个节点设备发起了用于获取用户信息分表的获取请求后，用户服务器首先找到空闲的用户信息分表或者异常的用户信息分表(即lastUpdateMs过期的分表)，然后更新记录绑定的用户信息分表与节点设备之间的相应关系的数据协同记录，更新结构体tablemapping等，以便于最终做好环境数据准备，方便加载该用户信息分表的数据，并开始循环地读取用户信息与任务配置数据进行匹配处理。

S904：对数据协同记录进行维护更新，该维护更新可以是与该数据协同记录所对应的用户信息分表绑定的节点设备发送的更新请求进行更新，例如更新前述涉及的协同结构中的最新更新时间、表格当前位置等等。主要是解决节点和分表一一对应的关系，防止其它节点也操作该分表，主要方式是遍历匹配的过程中一定周期更新协同结构中lastUpdateMs项。

S905：若检测到该数据协同记录所对应的用户信息分表处于异常状态，则解除绑定关系，也可能是由于监测到该数据协同记录所对应的用户信息分表处于异常状态(比如基于最新更新时间确定长时间未更新比如30分钟)，则重新为该用户信息分表确定其他节点设备并对数据协同记录进行更新。如上述提及的协同结构，如果lastUpdateMs超过协同系统规定的更新阀值，则认为该分表没被其它节点映射到，其它结点主动绑定一张table(默认情况下每个节点一张分表，但每个节点的分表数不会超过2个)。

在一个实施例中，请参考图10所示，对用户信息分表的更新流程主要包括以下步骤。

S1001：统计用户信息分表的数量。同时还可能会基于各个终端新上传的用户账号、行为日志和事件日志，增加用户信息分表的数据，对已有的用户信息分表中的用户信息进行更新，比如基于行为日志和事件日志更新某个用户账号所对应用户信息中的画像id列表。

S1002：判断是否有更新。如上述，可以判断是否生成了新的用户信息分表，也可以判断某些用户信息分表中的用户信息是否有更新，比如用户画像id的更新，如是，则执行下述的S1003。否则不做更新操作，等待接收分表获取请求以执行下述的S1004。

S1003：更新用户信息分表，并将更新后的用户信息分表存储到存储器中。

S1004：如果获取到分表获取请求，则为相应的节点设备授权一个或者两个或者多个用户信息分表。

在一个实施例中，请参考图11所示，为某个节点设备分配用户信息分表的流程主要包括以下步骤。

S1101：在分表集合中为目标节点设备确定目标用户信息分表，该目标用户信息分表可以为空闲用户信息分表，或者为异常用户信息分表。

在一个实施例中，所述数据协同记录中包括：用于记录分表与节点设备之间映射关系的映射关系记录项，因此，为目标节点设备确定的用户信息分表包括：所述分表集合中没有被记录到数据协同记录中的映射关系记录项的用户信息分表；数据协同记录的具体结构如前所述，映射关系记录项对应于上述的“Struct Collab”部分记录的内容，一个用户信息分表的名称与一个节点设备的节点设备名称对应，为目标节点设备获取用户信息分表时，将所有的用户信息分表的名称作为关键字在所有的数据协同记录中查找，如果发现某一个用户信息分表(记为第一用户信息分表)的名称没有被任何一个数据协同记录的映射关系记录项记录，则可以认为第一用户信息分表为空闲用户信息分表，可以认为该第一用户信息分表没有被使用，目标节点设备可以获取该目标用户信息分表，以便于后续执行前述的关于节点设备的相应处理。而如果目标节点设备没有找到空闲用户信息分表，则表明所有的用户信息分表都在被其他节点设备所使用。在所述分表集合中确定目标用户信息分表失败。

在一个实施例中，所述数据协同记录中包括：用于记录分表与节点设备之间映射关系的记录项、和分表状态数据记录项，所述确定的目标用户信息分表包括：所述分表集合中被记录到数据协同记录中的映射关系记录项、但根据所述分表状态数据记录项记录的分表状态被确定为异常的用户信息分表。也就是说，在本发明实施例中，当第一节点设备通过上述的查找空闲用户信息分表的描述方式无法找到空闲用户信息分表后，可以在数据协同记录中进一步根据分表状态数据记录项来找到被其他节点设备使用但出现异常的用户信息分表，所述分表状态数据记录项对应于上述的“Struct TableMapping”。在该部分结构中lastUpdateMs项的内容表示了某个用户信息分表在某个节点设备中的使用更新情况，以成映射关系的第二节点设备和第二用户信息分表为例，在“Struct Collab”中记录了tables为第二用户信息分表的名称，nodes为第二节点设备的节点设备名称，表明第二用户信息分表和第二节点设备之间被绑定，第二节点设备在进行任务配置数据与第二用户信息分表中的目标用户信息之间的匹配处理结束后，会主动更新该数据协同记录，具体更新lastUpdateMs项以更新记录最新的更新时间，用户服务器如果发现第二用户信息分表所对应的数据协同记录中的该项长期没有更新(未更新的时长大于预设时长)，则认为第二用户信息分表存在异常，该第二用户信息分表被认为是异常用户信息分表，用户服务器可以将第二用户信息分表作为目标用户信息分表，以便于第二用户信息分表在目标节点设备中被正常使用。同时，由于“Struct tableTask”的存在，目标节点设备基于curPos的值可以知道第二节点设备最近一次执行用户信息与任务配置数据之间的匹配时处理到哪一个用户信息了(比如用户信息的guid)，第一节点设备就从curPos所指示的用户信息或者curPos所指示的用户信息下一用户信息开始，进行任务配置数据和用户信息之间的匹配处理。

S1102：在确定了目标用户信息分表后，对数据协同记录进行更新，以绑定目标节点设备和目标用户信息分表，避免其他节点设备使用目标用户信息分表，进而避免任务和用户被重复匹配的问题发生。

S1103：将目标用户信息分表发送给目标节点设备。

S1104：目标节点设备将目标用户信息分表存储在本地磁盘中，当需要进行推送任务和用户信息的匹配处理时，将目标用户信息分表中的部分或者全部用户信息加载到共享内存中。

S1105：目标节点设备遍历目标用户信息分表中的所有用户信息，以便于完成每一条用户信息与一个或者多个任务配置数据进行匹配处理。

再请参见图12，是本发明实施例的一种数据处理装置的结构示意图，本发明实施例的所述数据处理装置可以设置在一个云服务器中，也可以可以设置在前述实施例提及的节点设备中，所述装置包括以下结构。

获取模块1201，用于在检测到推送任务触发事件时，从所述任务匹配系统的用户服务器中读取数据协同记录，从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取分表集合中满足条件的用户信息分表，所述数据协同记录是根据所述用户服务器搜集到的用户信息生成的分表集合构建的，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

筛选模块1202，用于在获取到任务配置数据时，根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息；

生成模块1203，用于根据所述任务配置数据中任务描述信息生成任务推送信息，所述任务推送信息包括：任务配置数据所对应的任务描述信息和筛选得到的用户信息；

发送模块1204，用于将所述任务推送信息发送给推送服务器，以使所述推送服务器根据所述任务描述信息向筛选得到的用户信息推送数据。

在一个实施例中，所述装置还可以包括：存储模块1205；

所述存储模块1205，用于从用户服务器中读取数据协同记录；根据所述数据协同记录，在所述分表集合中确定满足条件的用户信息分表，所述满足条件的用户信息分表为：空闲用户信息分表、或异常用户信息分表，其中，空闲用户信息分表是指没有被绑定的用户信息分表；存储所述满足条件的用户信息分表。

在一个实施例中，所述分表描述信息包括映射关系记录项，所述获取模块1201，用于从所述数据协同记录的关联信息中读取映射关系记录项，所述映射关系记录项用于记录分表与节点设备之间映射关系；根据所述映射关系记录项，从所述分表集合中确定没有被记录到所述映射关系记录项的用户信息分表；将所述确定的没有被记录到所述映射关系记录项的用户信息分表作为满足条件的用户信息分表。

在一个实施例中，所述分表描述信息包括映射关系记录项和分表状态数据记录项，所述获取模块1201，用于从所述数据协同记录的关联信息中读取映射关系记录项，所述映射关系记录项用于记录分表与节点设备之间映射关系；若所述分表集合中所有的用户信息分表均被记录到所述映射关系记录项中，则从所述数据协同记录的关联数据中读取分表状态数据记录项；根据所述分表状态数据记录项，检测所述分表集合中是否存在处于异常状态的用户信息分表。将处于异常状态的用户信息分表作为满足条件的用户信息分表。

在一个实施例中，所述满足条件的用户信息分表为处于异常状态的用户信息分表，所述筛选模块1202，具体用于检测所述任务配置数据所对应任务的任务名是否被记录在所述数据协同记录的分表任务数据记录项中；若是，则根据所述分表任务数据记录项确定用户信息分表项标识信息；在所述满足条件的用户信息分表中从除所述用户信息分表项标识信息之外的用户信息分表项标识中筛选用户信息。

在一个实施例中，所述任务配置数据是在任务配置界面上配置的，所述任务配置界面上设置有以下配置项的任意一项或多项：

任务时间配置项，通过所述任务时间配置项配置得到任务有效时间、和/或任务所对应的推送数据的推送时间；

任务所对应的设备类型配置项，通过所述设备类型配置项配置得到任务所对应的推送对象的终端设备的厂商类型；

任务所对应的对象类型配置项，通过所述对象类型配置项配置得到任务所对应的推送对象的用户画像信息；

任务所对应的数据来源配置项，通过所述数据来源配置项配置得到任务所对应的推送数据的来源信息。

在一个实施例中，所述分表集合包括多个用户信息分表，每一个用户信息分表用于记录多条用户信息，每一条用户信息与一个应用账号对应，每一条用户信息的格式包括：用于标识应用账号对应应用所在终端设备的厂商类型的类型标识字段；用户标识应用账号所对应用户的用户画像的画像标识字段。

在一个实施例中，所述筛选模块1202，具体用于当检测到用户信息分表的数据量大于数据量阈值时，按照分表索引顺序，将所述满足条件的用户信息分表中目标数据量的用户信息加载到内存中；将内存中缓存的目标索引的用户信息分别与当前获取到的所有任务配置数据进行匹配判断；根据匹配判断的结果为部分或者全部任务配置数据筛选得到用户信息。

可以理解的是，本发明实施例中各个模块的具体实现可参考前述实施例中相应内容的描述，在此不赘述。

再请参见图13，是本发明实施例的另一种数据处理装置的结构示意图，本发明实施例的所述装置可以应用于云服务器中，也可以应用在前述实施例中提及的用户服务器中，所述装置包括如下结构。

存储模块1301，用于存储分表集合，所述分表集合包括多个用户信息分表；

接收模块1302，用于接收节点设备的分表获取请求；

获取模块1303，用于根据数据协同记录从所述分表集合中获取用户信息分表，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；

响应模块1304，用于将获取到的用户信息分表发送给所述节点设备。

可以理解的是，本发明实施例中各个模块的具体实现可参考前述实施例中相应内容的描述，在此不赘述。并且，上一实施例中描述的数据处理装置与本实施例中的数据处理装置可以设置在同一个云服务器中，比如，存储模块1205和存储模块1301为云服务器中的同一模块，获取模块1201与获取模块1303为云服务器中的同一模块，

再请参见图14，是本发明实施例的一种智能设备的结构示意图，该智能设备对应于前述实施例中提及的节点设备，本发明实施例的所述智能设备具体可以是一个云服务器，所述智能设备包括存储装置1401和处理器1402，并且还包括网络接口1403、用户接口1404等。通过网络接口1403可以与其他服务器并和用户侧的终端设备建立连接传输数据，通过所述用户接口1404，管理员可以配置各种数据，比如配置某些任务配置数据，以便智能设备能够为任务配置数据匹配用户信息。

所述存储装置1401可以包括易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)；存储装置1401也可以包括非易失性存储器(non-volatile memory)，例如快闪存储器(flash memory)，固态硬盘(solid-state drive，SSD)等；存储装置1401还可以包括上述种类的存储器的组合。

所述处理器1402可以是中央处理器1402(central processing unit，CPU)。所述处理器1402还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmablelogic device，PLD)等。上述PLD可以是现场可编程逻辑门阵列(field-programmable gatearray，FPGA)，通用阵列逻辑(generic array logic，GAL)等。

可选地，所述存储装置1401还用于存储程序指令。所述处理器1402可以调用所述程序指令，实现如本申请前述实施例中所示的数据处理方法。

在一个实施例中，所述存储装置1401中存储有计算机程序，所述处理器1402执行所述计算机程序，用于：

在一个实施例中，所述分表描述信息包括映射关系记录项，所述处理器1402，用于：

从所述数据协同记录的关联信息中读取映射关系记录项，所述映射关系记录项用于记录分表与节点设备之间映射关系；

根据所述映射关系记录项，从所述分表集合中确定没有被记录到所述映射关系记录项的用户信息分表；

将所述确定的没有被记录到所述映射关系记录项的用户信息分表作为满足条件的用户信息分表。

在一个实施例中，所述分表描述信息包括映射关系记录项和分表状态数据记录项，所述处理器1402，用于：

若所述分表集合中所有的用户信息分表均被记录到所述映射关系记录项中，则从所述数据协同记录的关联数据中读取分表状态数据记录项；

根据所述分表状态数据记录项，检测所述分表集合中是否存在处于异常状态的用户信息分表。

将处于异常状态的用户信息分表作为满足条件的用户信息分表。

在一个实施例中，所述满足条件的用户信息分表为处于异常状态的用户信息分表，所述处理器1402，用于：

检测所述任务配置数据所对应任务的任务名是否被记录在所述数据协同记录的分表任务数据记录项中；

若是，则根据所述分表任务数据记录项确定用户信息分表项标识信息；

在所述满足条件的用户信息分表中从除所述用户信息分表项标识信息之外的用户信息分表项标识中筛选用户信息。

在一个实施例中，所述分表集合包括多个用户信息分表，每一个用户信息分表用于记录多条用户信息，每一条用户信息与一个应用账号对应，每一条用户信息的格式包括：

用于标识应用账号对应应用所在终端设备的厂商类型的类型标识字段；

用户标识应用账号所对应用户的用户画像的画像标识字段。

在一个实施例中，所述处理器1402，用于：

当检测到用户信息分表的数据量大于数据量阈值时，按照分表索引顺序，将所述满足条件的用户信息分表中目标数据量的用户信息加载到内存中；

将内存中缓存的目标索引的用户信息分别与当前获取到的所有任务配置数据进行匹配判断；

根据匹配判断的结果为部分或者全部任务配置数据筛选得到用户信息。

可以理解的是，本发明实施例中所述处理器1402的具体实现可参考前述实施例中相应内容的描述，在此不赘述。

同样请参考图14，本发明实施例中的一种服务器的结构与图14所示的结构相同，本发明实施例中的服务器可以对应于前述实施例中的用户服务器，该服务器的存储装置中存储有计算机程序，处理器执行该计算机程序，能够获取分表集合，所述分表集合包括多个用户信息分表，并用于接收节点设备的分表获取请求；根据数据协同记录从所述分表集合中获取用户信息分表，所述数据协同记录用于记录所述分表集合中一个或者多个用户信息分表与任务匹配系统中各个节点设备之间的关联信息；将获取到的用户信息分表发送给所述节点设备。

具体的，本发明实施例中所述处理器的具体实现可参考前述实施例中各个相关内容的具体描述，在此不赘述。并且，上一实施例中的节点设备与本实施例中的服务器可以为同一个云服务器。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明的部分实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

Claims

1.一种数据处理方法，其特征在于，应用于目标节点设备，所述目标节点设备为任务匹配系统中的任一节点设备，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述分表描述信息包括映射关系记录项，所述从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取所述分表集合中满足条件的用户信息分表，包括：

3.如权利要求1所述的方法，其特征在于，所述分表描述信息包括映射关系记录项和分表状态数据记录项，所述从所述数据协同记录的关联信息中读取分表描述信息，并根据所述分表描述信息获取所述分表集合中满足条件的用户信息分表，包括：

根据所述分表状态数据记录项，检测所述分表集合中是否存在处于异常状态的用户信息分表；

4.如权利要求3所述的方法，其特征在于，所述满足条件的用户信息分表为处于异常状态的用户信息分表，所述根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息，包括：

5.如权利要求1所述的方法，其特征在于，所述任务配置数据是在任务配置界面上配置的，所述任务配置界面上设置有以下配置项的任意一项或多项：

6.如权利要求1或5所述的方法，其特征在于，所述分表集合包括多个用户信息分表，每一个用户信息分表用于记录多条用户信息，每一条用户信息与一个应用账号对应，每一条用户信息的格式包括：

用户标识应用账号所对应用户的用户画像的画像标识字段。

7.如权利要求1所述的方法，其特征在于，所述根据所述任务配置数据的指示从所述获取到的满足条件的用户信息分表中筛选用户信息，包括：

8.一种数据处理装置，其特征在于，应用于目标节点设备，所述目标节点设备为任务匹配系统中的任一节点设备，所述装置包括：

9.一种智能设备，其特征在于，该智能设备包括存储装置和处理器；所述存储装置中存储有计算机程序，所述处理器运行所述计算机程序，实现如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质中存储有计算机程序，该计算机程序被处理器执行时，实现如权利要求1-7任一项所述的方法。