CN110502549B

CN110502549B - 用户数据处理方法、装置、计算机设备和存储介质

Info

Publication number: CN110502549B
Application number: CN201910608116.6A
Authority: CN
Inventors: 张宗祺; 徐学奎; 谢晓佳; 张鹏; 姜良雷; 王耀南
Original assignee: Merchants Union Consumer Finance Co Ltd
Current assignee: Zhaolian Consumer Finance Co ltd
Priority date: 2019-07-08
Filing date: 2019-07-08
Publication date: 2022-04-01
Anticipated expiration: 2039-07-08
Also published as: CN110502549A

Abstract

本申请涉及一种用户数据处理方法、装置、计算机设备和存储介质。方法包括：获取用户数据；当用户数据中包含第一用户标识，且在数据库中未检测到第一用户标识时，检测用户数据中是否包含第二用户标识,其中，第一用户标识的优先级高于第二用户标识；当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，生成统一标识，得到用户数据与统一标识的关联关系。采用本申请的方案能够提高数据的易用性。

Description

用户数据处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种用户数据处理方法、装置、计算机设备和存储介质。

背景技术

随着互联网的快速发展以及数据的快速增涨，人们逐渐的认识到数据在整个互联网发展中的战略重要性。数据量爆发式的增长也促进了数据的存储、计算、组织以及分析等领域的发展。在互联网数据中，各个产品大多都存在用户数据来源不一的问题。例如用户数据的来源是自有注册、外部引流或者外部账号登陆注册等，这导致用户数据之间无法统一。

发明内容

基于此，有必要针对上述技术问题，提供一种能够将用户数据与统一标识关联起来、提升用户数据易用性的用户数据处理方法、装置、计算机设备和计算机存储介质。

一种用户数据处理方法，该方法包括：

获取用户数据；

当该用户数据中包含第一用户标识，且在数据库中未检测到该第一用户标识时，检测该用户数据中是否包含第二用户标识,其中，该第一用户标识的优先级高于该第二用户标识；

当检测到该用户数据中包含第二用户标识，且在该数据库中未检测到该第二用户标识时，生成统一标识，得到该用户数据与该统一标识的关联关系。

在其中一个实施例中，当检测到该用户数据中包含第二用户标识，且在该数据库中未检测到该第二用户标识时，生成统一标识，包括：

当检测到该用户数据中包含第二用户标识，且在该数据库中未检测到该第二用户标识时，获取该用户数据中最早记录的用户标识；

根据该最早记录的用户标识生成统一标识，得到该用户数据与该统一标识的关联关系。

在其中一个实施例中，该用户数据处理方法还包括：当该用户数据中包括第一用户标识，且在该数据库中检测到该第一用户标识时，根据该第一用户标识从该数据库中获取对应的统一标识，得到该用户数据和该统一标识的关联关系。

在其中一个实施例中，该用户数据处理方法还包括：当检测到该用户数据中不包含第一用户标识、该用户数据中包含第二用户标识、且该数据库中包含该第二用户标识时，根据该第二用户标识从该数据库中获取对应的统一标识，得到该用户数据和该统一标识的关联关系。

在其中一个实施例中，该用户数据处理方法还包括：当该用户数据中不包含该第一用户标识和该第二用户标识、该用户数据中包含第三用户标识、且该数据库中不包含该第三用户标识时，根据该第三用户标识生成对应的统一标识，得到该用户数据和该统一标识的关联关系。

在其中一个实施例中，该用户数据处理方法还包括：根据该业务属性在数据库中对应存储该统一标识以及对应的用户数据，其中，该用户数据与业务属性相对应。

在其中一个实施例中，该用户数据处理方法还包括：获取该用户数据对应的用户类型；根据该用户数据以及该对应的用户类型推送对应的消息。

一种用户数据处理装置，所述装置包括：

获取模块，用于获取用户数据；

检测模块，用于当该用户数据中包含第一用户标识，且在数据库中未检测到该第一用户标识时，检测该用户数据中是否包含第二用户标识,其中，该第一用户标识的优先级高于该第二用户标识；

生成模块，用于当检测到该用户数据中包含第二用户标识，且在该数据库中未检测到该第二用户标识时，生成统一标识，得到该用户数据与该统一标识的关联关系。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取用户数据；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取用户数据；

上述用户数据处理方法、装置、计算机设备和存储介质，通过获取用户数据，检测用户数据和数据库中是否含有第一用户标识，以及用户数据和数据库中是否含有第二身份标识，生成统一标识，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

附图说明

图1为一个实施例中用户数据处理方法的应用环境图；

图2为一个实施例中用户数据处理方法的流程示意图；

图3另一个实施例中用户数据处理方法的流程示意图；

图4为为一个实施例中数据分层处理的架构示意图；

图5为一个实施例中用户数据处理装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种用户标识，但这些用户标识不受这些术语限制。这些术语仅用于将一种用户标识与另一个用户标识区分。举例来说，在不脱离本申请的范围的情况下，可以将第一用户标识称为第二用户标识，且类似地，可将第二用户标识称为第一用户标识。第一用户标识和第二用户标识两者都是用户标识，但其不是同一用户标识。

本申请实施例中提供的用户数据方法，可以应用于如图1所示的应用环境中，包括计算机设备102。其中，计算机设备102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，计算机设备102还可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种用户数据处理方法，以该方法应用于图1中的计算机设备为例进行说明，包括以下步骤：

步骤202，获取用户数据。

其中，用户数据可以是指不同来源的用户数据。例如自有账号注册、外部账号登录注册、合作方引流、潜在用户发掘以及第三方批量导入等方式。这些用户数据的来源多种多样，可能存在数据存储结构不同、客户身份标识方式不一以及数据信息真实性差异较大的问题。

具体地，电子设备从不同来源获取用户数据，并存储在数据仓库中。

本实施例中，用户数据的来源可分为自有产品注册和其他来源。自有产品注册的用户有实名和未实名之分，潜在用户的又可以大致分为用户联系人、业务咨询用户以及第三方数据导入等方式。未实名用户的用户标识可以仅为电话号码。已实名用户的用户标识可以为身份证号码。这些用户的身份标识包含电话号、身份证号码、外部账号等不同的身份标识种类，且不同来源的数据的饱和度、数据价值也相差较大。这些问题导致很难将不同来源的数据联合使用。

步骤204，当用户数据中包含第一用户标识，且在数据库中未检测到第一用户标识时，检测用户数据中是否包含第二用户标识,其中，第一用户标识的优先级高于第二用户标识。

其中，用户标识可用于唯一地标识一个用户。每个用户的用户标识不相同。用户标识具体可以是由数字、字母、符号中的至少一种组成。用户标识的优先级可依据需求设置。计算机设备在进行判断时，先判断优先级较高的用户标识。例如第一用户标识可以是身份证号码，第二用户标识可以是电话号码等不限于此。

具体地，计算机设备判断用户数据中是否包含第一用户标识。当用户数据中包含第一用户标识时，计算机设备判断数据库中是否包含第一用户标识。当计算机设备在数据库中未检测到第一用户标识时，检测用户数据中是否包含第二用户标识。

步骤206，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，生成统一标识，得到用户数据与统一标识的关联关系。

其中，统一标识可以是随机标识，也可以是根据第一用户标识生成的标识，还可以是根据第二用户标识生成的标识。统一标识中的数字、字母等的位数可以不相同，也可以相同。

具体地，当计算机设备检测到用户数据中包含第二用户标识时，判断数据库中是否存在该第二用户标识。当计算机设备在数据库中未检测到该第二用户标识时，根据第一用户标识通过编码生成统一标识，将用户数据与统一标识关联起来，得到用户数据与统一标识的关联关系。即计算机设备根据优先级最高的用户标识生成统一标识。

本实施例中，当电子设备检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，随机生成统一标识，将用户数据与统一标识关联起来，得到用户数据与统一标识的关联关系。

本实施例中，当电子设备检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，可根据用户数据中的电话号码生成统一标识，将用户数据与统一标识关联起来，得到用户数据与统一标识的关联关系。

上述用户数据处理方法中，通过获取用户数据，检测用户数据和数据库中是否含有第一用户标识，以及用户数据和数据库中是否含有第二身份标识，生成统一标识，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

在一个实施例中，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，生成统一标识，包括：当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早记录的用户标识；根据最早记录的用户标识生成统一标识，得到用户数据与统一标识的关联关系。

具体地，当计算机设备检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早记录的用户标识。由于计算机设备在数据库中均未检测到第一用户标识和第二用户标识，那么该用户数据为新用户数据。用户数据中包括了第一用户标识和第二用户标识，计算机设备获取用户数据中最早记录的用户标识。例如，最早记录的用户标识为第一身份标识，那么计算机设备按照编码规则对第一用户标识进行处理，生成统一标识，得到用户数据与统一标识的关联关系。

上述用户数据处理方法中，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早记录的用户标识，根据最早记录的用户标识生成统一标识，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

在一个实施例中，该用户数据处理方法还包括：当用户数据中包括第一用户标识，且在数据库中检测到第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

具体地，在数据库中检测到第一用户标识表示该用户的用户数据已存储。当计算机设备从不同来源中获取用户数据，检测到该用户数据中包含第一用户标识，且在数据库中检测到该第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，并将该用户数据与统一标识关联起来，得到用户数据和统一标识的关联关系。

上述用户数据处理方法中，当用户数据中包括第一用户标识，且在数据库中检测到第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，能通过统一标识将用户数据与统一标识关联起来，能够避免重复生成统一标识。

在一个实施例中，该用户数据处理方法还包括：当检测到用户数据中不包含第一用户标识、用户数据中包含第二用户标识、且数据库中包含第二用户标识时，根据第二用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

具体地，计算机设备检测用户数据中是否包含第一用户标识。当计算机设备检测到用户数据中不包含第一用户标识时，检测用户数据中是否包含第二用户标识。当计算机设备检测到用户数据中包含第二用户标识时，检测数据库中是否包含第二身份标识。当数据库中包含第二用户标识时，计算机设备根据第二用户标识从数据库中获取对应的统一标识，并将用户数据与统一标识关联起来，得到用户数据和统一标识的关联关系。

上述用户数据处理方法中，当检测到用户数据中不包含第一用户标识、用户数据中包含第二用户标识、且数据库中包含第二用户标识时，根据第二用户标识从数据库中获取对应的统一标识，能通过统一标识将用户数据与统一标识关联起来，能够避免重复生成统一标识。

在一个实施例中，该用户数据处理方法还包括：当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，根据第三用户标识生成对应的统一标识，得到用户数据和统一标识的关联关系。

其中，第三用户标识与第一用户标识和第二用户标识均不相同。且第一用户标识的优先级大于第二用户标识，第二用户标识的优先级大于第三用户标识。例如，第三用户标识可以是OpenID、第三方账号、计算机设备标识、MAC(Media Access Control，媒体访问控制)地址、IP(Internet Protocol，互联网协议)地址等不限于此，其中，OpenID是一个以用户为中心的数字身份识别框架。

具体地，当计算机设备检测到用户数据中不包含第一用户标识，且不包含第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，按照预设编码规则将第三用户标识转化为对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理方法中，当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，根据第三用户标识生成对应的统一标识，得到用户数据和统一标识的关联关系，能保证新用户均有对应的统一标识，便于数据整理。

在一个实施例中，该用户数据处理方法还包括：当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中包含第三用户标识时，从数据库中获取第三身份标识对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理方法中，当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中包含第三用户标识时，从数据库中获取第三身份标识对应的统一标识，得到用户数据和统一标识的关联关系，能保证当用户数据中不存在第一用户标识和第二用户标识时，也可以将用户数据与统一标识关联起来。

图3为另一个实施例中用户数据处理方法的流程示意图。如图3所示，一种用户数据处理方法，包括：

步骤302，获取用户数据。

步骤304，检测用户数据中是否包含第一用户标识。

具体地，电子设备检测用户数据中是否包含身份证号码，即是否通过实名认证。

步骤306，检测数据库中是否包含该第一用户标识。

具体地，电子设备检测身份证号码是否与数据库中的身份证号码关联上。

步骤308，当数据库中包含该第一用户标识时，从数据库中获取该第一用户标识对应的统一标识。

具体地，电子设备检测到身份证号码与数据库中的身份证号码关联上时，从数据库中获取身份证号码对应的统一标识。

步骤310，当数据库中不包含该第一用户标识时，或者，目标信息中不包含第一身份标识时，检测数据库中是否包含第二用户标识。

步骤312，当数据库中包含该第二用户标识时，从数据库中获取该第二用户标识对应的统一标识。

步骤314，当数据库中不包含该第二用户标识时，获取用户数据中最早出现记录的用户标识，根据用户数据中最早出现记录的用户标识生成统一标识。

步骤316，将用户数据与统一标识关联起来，得到用户数据与统一标识的关联关系。

具体地，该用户数据与统一标识的关联关系可用于增量更新，存入全量数据。

上述用户数据处理方法中，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

图4为一个实施例中数据分层处理的架构示意图。在互联网中各种数据产生于各个业务系统中，各种数据的存储相对分散，关联分析和应用较为困难，数据价值难以真正体现。数据仓库将各个系统的数据进行抽取、转换、加载，进行面向业务流程的模型建立。为了更方便的对用户数据进行分析和应用，数据集市在此基础上进行面向分析主题的用户数据模型建立，面向主题的模型建立主要是立足于数据分层处理的思想，将用户数据的处理分为四层进行处理。Hadoop是一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序，充分利用集群的威力进行高速运算和存储。Hive，架构在Hadoop之上，提供简单的SQL(Structured Query Language，结构化查询语言)查询功能，可以将SQL语句转换为MapReduce任务进行运行的数据仓库工具。如图4所示，其中，数据仓库(Data Warehouse，DW)为企业级别的决策制定过程，提供所有类型数据支持的战略集合。数据集市(Data Market，DM)是指在数据仓库的基础上，面向某个主题对象的数据管理组织集合。ODS(Operational Data Store，操作数据存储)层中的表名与源表保持一致，只存储增量数据。且ODS层中的数据是原始数数据，即目标用户信息，具有不同的用户标识。在ODS层向DM层和DIM层传递数据的过程中，将目标用户信息与统一标识相关联得到关联关系。在MID层和DM层的后续各层中以统一标识作为用户的唯一标识。MID层是指中间层，中间层用于存放增量变化的数据。例如，中间层存储在处理过程中需经常用到的临时表。DM层和DIM层可统称为基础模型层。基础模型层存储以统一标识为基础的用户各类明细数据。例如，用户各类明细数据包括注册、申请、交易等明细数据。DIM层中可存储公共参数数据，例如维表、码表等。

APP层和STA层可统称为应用层。应用成用于存储各类应用视图、指标和统计汇总。其中，APP层主要是用户各类视图，侧重用户分群、建模分析，对同一统一标识的用户数据进行合并。例如，用户的首末次申请时间、首末次申请渠道和客户近7天登陆次数统计。统计STA层则主要为各类报表、取数提供支持。应用层可以访问基础模型层中的所有数据。基础模型层中的数据包括中间层表、DM表、DIM公共参数表等。应用层不允许访问ODS层。基础模型层允许访问ODS层和中间层。通过上述数据访问规则可以为了保证数据的单一流向，便于管理数据之间的流向管理和数据血缘分析，避免数据之间随意访问，使数据的处理逻辑更加明确，减少数据加工，提高数据处理效率。

通过数据分层处理，按照主题进行数据划分，明确地定义各个层级的数据职责，在基础模型层完成明细数据的汇总，应用层直接根据模型层的数据进行加工，减少了数据之间的大量关联，显著地提高数据的处理速度，有效地屏蔽数据源变化对数据应用带来的影响。且将数据分层规整之后，可以在应用层进行快速迭代开发，较大的提高的开发迭代效率，可以快速满足业务数据需求。

在一个实施例中，用户数据与业务属性相对应。该用户数据处理方法还包括：根据业务属性对应存储统一标识以及对应的用户数据。

其中，业务属性例如可以包括业务往来、关联关系、财务状况，产品开通、基本信息、分析评价、行为特征、风险信息和接触反馈等。当计算机设备获取到用户数据时，可根据用户数据区分对应的属性。例如，用户数据中的年龄和住址等信息，对应的是业务属性中的基本信息。

具体地，计算机设备将统一标识和对应的用户数据临时存储在中间层。计算机设备从中间层获取统一标识以及对应的用户数据，其中，用户数据与业务属性相对应。计算机设备根据业务属性在基础模型层中对应存储统一标识和对应的用户数据。

上述用户数据处理方法中，根据业务属性对应存储统一标识以及对应的用户数据，使数据的处理逻辑更加明确，且使得获取的用户数据更加完善，提高数据的易用性。

在一个实施例中，该用户数据处理方法还包括：获取用户数据对应的用户类型；根据用户数据以及对应的用户类型推送对应的消息。

具体地，应用层中的APP层中保存用户各类视图，侧重于用户分群和建模分析等。计算机设备从应用层中获取用户数据以及对应的用户类型，根据用户类型以及用户数据中的用户标识推送对应的信息。例如，对不同来源的用户进行不同方式的信息推送。例如，计算机设备对外部来源的潜在用户进行自有注册的精细化信息推送。计算机设备对已注册但未实名的用户进行产品申请侧的信息推送，例如在注册时推送信息。计算机设备对用户类型为劣质的用户可以不推送信息。计算机设备对征信低于阈值的用户推送风险分担的信息等。

上述用户数据处理方法中，获取用户数据对应的用户类型，根据用户数据以及对应的用户类型推送对应的消息，能够进行精准推送，满足用户需求，降低运营成本。

在一个实施例中，一种用户数据处理方法，包括：

步骤(a1)，当用户数据中包含第一用户标识，且在数据库中未检测到第一用户标识时，检测用户数据中是否包含第二用户标识,其中，第一用户标识的优先级高于第二用户标识；

步骤(a2)，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，生成统一标识，得到用户数据与统一标识的关联关系。

步骤(a3)，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早出现记录的用户标识；

步骤(a4)，根据最早记录的用户标识生成统一标识，得到用户数据与统一标识的关联关系。

步骤(a5)，当用户数据中包括第一用户标识，且在数据库中检测到第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

步骤(a6)，当检测到用户数据中不包含第一用户标识、用户数据中包含第二用户标识、且数据库中包含第二用户标识时，根据第二用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

步骤(a7)，当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，根据第三用户标识生成对应的统一标识，得到用户数据和统一标识的关联关系。

步骤(a8)，根据业务属性在数据库中对应存储统一标识以及对应的用户数据，其中，用户数据与业务属性相对应。

步骤(a9)，获取用户数据对应的用户类型；

步骤(a10)，根据用户数据以及对应的用户类型推送对应的消息。

上述步骤(a1)至步骤(a10)中的各个步骤按照数字的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。

上述用户数据处理方法，能通过统一标识将用户数据与统一标识关联起来，能保证新用户均有对应的统一标识，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值，根据业务属性对应存储统一标识以及对应的用户数据，使数据的处理逻辑更加明确，且使得获取的用户数据更加完善。

应该理解的是，虽然图2和3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，为一个实施例中用户数据处理装置的结构框图，提供了一种用户数据处理装置，包括：获取模块502、检测模块504和生成模块506，其中：

获取模块502，用于获取用户数据。

检测模块504，用于当所述用户数据中包含第一用户标识，且在数据库中未检测到所述第一用户标识时，检测所述用户数据中是否包含第二用户标识，其中，所述第一用户标识的优先级高于所述第二用户标识。

生成模块506，用于当检测到所述用户数据中包含第二用户标识，且在所述数据库中未检测到所述第二用户标识时，生成统一标识，得到所述用户数据与所述统一标识的关联关系。

上述用户数据处理装置中，通过获取用户数据，检测用户数据和数据库中是否含有第一用户标识，以及用户数据和数据库中是否含有第二身份标识，生成统一标识，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

在一个实施例中，获取模块502用于当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早记录的用户标识。生成模块506用于根据最早记录的用户标识生成统一标识，得到用户数据与统一标识的关联关系。

上述用户数据处理装置中，当检测到用户数据中包含第二用户标识，且在数据库中未检测到第二用户标识时，获取用户数据中最早记录的用户标识，根据最早记录的用户标识生成统一标识，能通过统一标识将用户数据与统一标识关联起来，从而能够对不同来源的用户数据进行清洗，提升数据的易用性以及使用价值。

在一个实施例中，获取模块502用于当用户数据中包括第一用户标识，且在数据库中检测到第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理装置中，当用户数据中包括第一用户标识，且在数据库中检测到第一用户标识时，根据第一用户标识从数据库中获取对应的统一标识，能通过统一标识将用户数据与统一标识关联起来，能够避免重复生成统一标识。

在一个实施例中，获取模块502用于当检测到用户数据中不包含第一用户标识、用户数据中包含第二用户标识、且数据库中包含第二用户标识时，根据第二用户标识从数据库中获取对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理装置中，当检测到用户数据中不包含第一用户标识、用户数据中包含第二用户标识、且数据库中包含第二用户标识时，根据第二用户标识从数据库中获取对应的统一标识，能通过统一标识将用户数据与统一标识关联起来，能够避免重复生成统一标识。

在一个实施例中，生成模块506用于当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，根据第三用户标识生成对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理装置中，当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中不包含第三用户标识时，根据第三用户标识生成对应的统一标识，得到用户数据和统一标识的关联关系，能保证新用户均有对应的统一标识，便于数据整理。

在一个实施例中，获取模块502用于当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中包含第三用户标识时，从数据库中获取第三身份标识对应的统一标识，得到用户数据和统一标识的关联关系。

上述用户数据处理装置中，当用户数据中不包含第一用户标识和第二用户标识、用户数据中包含第三用户标识、且数据库中包含第三用户标识时，从数据库中获取第三身份标识对应的统一标识，得到用户数据和统一标识的关联关系，能保证当用户数据中不存在第一用户标识和第二用户标识时，也可以将用户数据与统一标识关联起来。

在一个实施例中，用户数据处理装置还包括存储模块。存储模块用于根据业务属性对应存储统一标识以及对应的用户数据。

上述用户数据处理装置中，根据业务属性对应存储统一标识以及对应的用户数据，使数据的处理逻辑更加明确，且使得获取的用户数据更加完善，提高数据的易用性。

在一个实施例中，用户数据处理装置还包括存储模块。获取模块502用于获取用户数据对应的用户类型。推送模块用于根据用户数据以及对应的用户类型推送对应的消息。

上述用户数据处理装置中，获取用户数据对应的用户类型，根据用户数据以及对应的用户类型推送对应的消息，能够进行精准推送，满足用户需求，降低运营成本。

关于用户数据处理装置的具体限定可以参见上文中对于用户数据处理方法的限定，在此不再赘述。上述用户数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户数据处理方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述用户数据处理方法的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述用户数据处理方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种用户数据处理方法，所述方法包括：

获取用户数据；

当所述用户数据中包含第一用户标识，且在数据库中未检测到所述第一用户标识时，检测所述用户数据中是否包含第二用户标识,其中，所述第一用户标识的优先级高于所述第二用户标识；所述第一用户标识和所述第二用户标识属于电话号、身份证号码、外部账号中的任意一种身份标识种类；

当检测到所述用户数据中包含第二用户标识，且在所述数据库中未检测到所述第二用户标识时，根据所述用户数据中优先级最高的用户标识生成统一标识，得到所述用户数据与所述统一标识的关联关系；

当所述用户数据中包括第一用户标识，且在所述数据库中检测到所述第一用户标识时，根据所述第一用户标识从所述数据库中获取对应的统一标识，得到所述用户数据和所述统一标识的关联关系；

当检测到所述用户数据中不包含第一用户标识、所述用户数据中包含第二用户标识、且所述数据库中包含所述第二用户标识时，根据所述第二用户标识从所述数据库中获取对应的统一标识，得到所述用户数据和所述统一标识的关联关系。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当检测到所述用户数据中包含第二用户标识，且在所述数据库中未检测到所述第二用户标识时，获取所述用户数据中最早记录的用户标识；

根据所述最早记录的用户标识生成统一标识，得到所述用户数据与所述统一标识的关联关系。

3.根据权利要求1或2所述的方法，其特征在于，所述第一用户标识是身份证号码，所述第二用户标识是电话号码。

4.根据权利要求1或2所述的方法，其特征在于，所述第一用户标识和所述第二用户标识由数字、字母、符号中的至少一种组成。

5.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

当所述用户数据中不包含所述第一用户标识和所述第二用户标识、所述用户数据中包含第三用户标识、且所述数据库中不包含所述第三用户标识时，根据所述第三用户标识生成对应的统一标识，得到所述用户数据和所述统一标识的关联关系。

6.根据权利要求1或2所述的方法，其特征在于，所述用户数据与业务属性相对应；

所述方法还包括：

根据所述业务属性在数据库中对应存储所述统一标识以及对应的用户数据。

7.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

获取所述用户数据对应的用户类型；

根据所述用户数据以及所述对应的用户类型推送对应的消息。

8.一种信息处理装置，其特征在于，所述装置包括：

获取模块，用于获取用户数据；

检测模块，用于当所述用户数据中包含第一用户标识，且在数据库中未检测到所述第一用户标识时，检测所述用户数据中是否包含第二用户标识,其中，所述第一用户标识的优先级高于所述第二用户标识；所述第一用户标识和所述第二用户标识属于电话号、身份证号码、外部账号中的任意一种身份标识种类；

生成模块，用于当检测到所述用户数据中包含第二用户标识，且在所述数据库中未检测到所述第二用户标识时，根据所述用户数据中优先级最高的用户标识生成统一标识，得到所述用户数据与所述统一标识的关联关系；

所述获取模块，还用于当所述用户数据中包括第一用户标识，且在所述数据库中检测到所述第一用户标识时，根据所述第一用户标识从所述数据库中获取对应的统一标识，得到所述用户数据和所述统一标识的关联关系；当检测到所述用户数据中不包含第一用户标识、所述用户数据中包含第二用户标识、且所述数据库中包含所述第二用户标识时，根据所述第二用户标识从所述数据库中获取对应的统一标识，得到所述用户数据和所述统一标识的关联关系。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。