CN110134860A

CN110134860A - 用户画像生成方法、装置和设备

Info

Publication number: CN110134860A
Application number: CN201910293802.9A
Authority: CN
Inventors: 黄馨誉
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-04-12
Filing date: 2019-04-12
Publication date: 2019-08-16
Anticipated expiration: 2039-04-12
Also published as: CN110134860B

Abstract

本申请实施例提供了一种用户画像生成方法、装置和设备，以其中方法包括：确定第一业务以及与所述第一业务的业务内容相互关联的第二业务；获取用户在第一业务下的第一用户行为数据，用户在第二业务下的第二用户行为数据、第一业务的第一业务数据、第二业务的第二业务数据以及第一业务对应的外部环境数据；其中，外部环境数据为预先确定的与第一业务的第一业务数据相关的数据；通过预先训练的用户画像确定模型，根据第一用户行为数据、第二用户行为数据、第一业务数据、第二业务数据和外部环境数据，确定用户在第一业务下的目标用户画像。通过本实施例，能够在用户涉及多个业务领域的情况下，准确确定用户画像。

Description

用户画像生成方法、装置和设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种用户画像生成方法、装置和设备。

背景技术

用户画像是在多维度上建立起来的针对用户的描述性标签，用户画像可以表示用户的各个属性。比如，用户画像可以包括年龄、性别、是否买房、是否有孩、金融抗风险能力等。通过确定用户画像，可以发掘用户需求、分析用户偏好，从而为用户提供更加匹配的互联网服务。

随着用户使用的互联网服务的增多，用户涉及的业务领域也逐渐增多，在此基础上，有必要提供一种技术方案，以在用户涉及多个业务领域的情况下，准确确定用户画像。

发明内容

本申请实施例的目的是提供一种用户画像生成方法、装置和设备，以在用户涉及多个业务领域的情况下，准确确定用户画像。

为达到上述技术目的，本申请实施例是这样实现的：

本申请实施例提供了一种用户画像生成方法，包括：

确定第一业务以及与所述第一业务的业务内容相互关联的第二业务；

获取用户在所述第一业务下的第一用户行为数据，所述用户在所述第二业务下的第二用户行为数据、所述第一业务的第一业务数据、所述第二业务的第二业务数据以及所述第一业务对应的外部环境数据；其中，所述外部环境数据为预先确定的与所述第一业务的第一业务数据相关的数据；

通过预先训练的用户画像确定模型，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像。

本申请实施例提供了一种用户画像生成装置，包括：

业务确定模块，用于确定第一业务以及与所述第一业务的业务内容相互关联的第二业务；

数据获取模块，用于获取用户在所述第一业务下的第一用户行为数据，所述用户在所述第二业务下的第二用户行为数据、所述第一业务的第一业务数据、所述第二业务的第二业务数据以及所述第一业务对应的外部环境数据；其中，所述外部环境数据为预先确定的与所述第一业务的第一业务数据相关的数据；

画像确定模块，用于通过预先训练的用户画像确定模型，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像。

本申请实施例提供了一种用户画像生成设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现上述的用户画像生成方法的步骤。

本申请实施例提供了一种存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被执行时实现上述的用户画像生成方法的步骤。

可见，通过本实施例，能够确定第一业务以及与第一业务的业务内容相互关联的第二业务，并通过预先训练的用户画像确定模型，根据用户在第一业务下的第一用户行为数据，在第二业务下的第二用户行为数据、第一业务的第一业务数据、第二业务的第二业务数据以及第一业务对应的外部环境数据，确定该用户在第一业务下的目标用户画像，从而在用户涉及多个业务领域的情况下，结合各个业务领域的多维度的数据，准确确定用户在某个业务领域下的用户画像。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的用户画像生成方法的流程示意图；

图2为本申请另一实施例提供的用户画像生成方法的流程示意图；

图3为本申请另一实施例提供的用户画像生成方法的流程示意图；

图4为本申请一实施例提供的用户画像生成装置的模块组成示意图；

图5为本申请一实施例提供的用户画像确定设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

本申请实施例提供了一种用户画像生成方法、装置和设备，以在用户涉及多个业务领域的情况下，准确确定用户画像。本申请实施例中的用户画像生成方法可以由特定设备执行，特定设备可以是用于预测用户画像的计算机设备。

图1为本申请一实施例提供的用户画像生成方法的流程示意图，如图1所示，该方法包括以下步骤：

步骤S102，确定第一业务以及与第一业务的业务内容相互关联的第二业务；

步骤S104，获取用户在第一业务下的第一用户行为数据，该用户在第二业务下的第二用户行为数据、第一业务的第一业务数据、第二业务的第二业务数据以及第一业务对应的外部环境数据；其中，外部环境数据为预先确定的与第一业务的第一业务数据相关的数据；

步骤S106，通过预先训练的用户画像确定模型，根据第一用户行为数据、第二用户行为数据、第一业务数据、第二业务数据和外部环境数据，确定该用户在第一业务下的目标用户画像。

上述步骤S102中，特定设备确定第一业务以及与第一业务的业务内容相互关联的第二业务。本实施例中，第一业务的业务内容和第二业务的业务内容相互关联，该相互关联可以体现为，第一业务的业务内容和第二业务的业务内容属于同一内容类别，或者，第一业务的业务内容和第二业务的业务内容均与用户的同一属性相关。

比如，第一业务为基金业务，第二业务包括但不限于股票业务、保险业务、理财业务、信用卡业务(如借呗)、电商业务(如XX商城)和娱乐类业务(如XX视频网站)。其中，股票业务、保险业务、理财业务、信用卡业务、基金业务的业务内容均属于金融类内容，电商业务、娱乐类业务、基金业务的业务内容均与用户的货币属性相关。

上述步骤S104中，特定设备获取用户在第一业务下的第一用户行为数据，该用户在第二业务下的第二用户行为数据、第一业务的第一业务数据、第二业务的第二业务数据以及第一业务对应的外部环境数据。

以第一业务为基金业务，第二业务包括电商业务和理财业务为例，第一用户行为数据包括但不限于购买基金、赎回基金的行为数据，第二用户行为数据包括但不限于购买商品的行为数据、购买理财的行为数据。

第一业务的第一业务数据包括但不限于第一业务的产品营销数据、打折促销数据、产品内容数据、产品上新数据等，第二业务的第二业务数据包括但不限于第二业务的产品营销数据、打折促销数据、产品内容数据、产品上新数据等。

第一业务对应的外部环境数据为预先确定的与第一业务的第一业务数据相关的数据，具体可以是影响第一业务数据的数据。以第一业务为基金业务为例，第一业务对应的外部环境数据包括但不限于利率、汇率、国内生产总值GDP(Gross Domestic Product)、消费者价格指数CPI(Consumer Price Index)等数据，以第一业务为电商业务为例，第一业务对应的外部环境数据包括但不限于关税调控数据、电商舆情数据、产品成本价格波动数据等数据。

上述步骤S106中，通过预先训练的用户画像确定模型，根据第一用户行为数据、第二用户行为数据、第一业务数据、第二业务数据和外部环境数据，确定用户在第一业务下的目标用户画像。

本实施例中，预先训练有用户画像确定模型。用户画像确定模型可以为基于深度学习的神经网络模型。用户画像确定模型包括第一子模型和第二子模型，第一子模型用于确定用户在第一业务下的初始用户画像，第二子模型用于基于第二业务对初始用户画像进行扩展，确定基于第二业务扩展后的用户在第一业务下的最终用户画像，该最终用户画像即为目标用户画像。初始用户画像与目标用户画像的区别将在后文详细描述。

第一子模型可以通过以下方式训练得到：获取用户在第一业务下的不同时期的第一历史行为数据、第一业务在不同时期的第一历史业务数据、第一业务在不同时期的历史外部环境数据、用户在第一业务下的不同时期的初始历史画像作为训练样本数据，将训练样本数据输入至第一子模型中进行训练，在第一子模型的模型参数收敛后，确定第一子模型训练完成。训练第一子模型的过程可以理解为机器学习第一历史行为数据、第一历史业务数据、历史外部环境数据和初始历史画像之间的关系的过程，通过训练完成的第一子模型，能够基于用户在第一业务下的行为数据、第一业务的业务数据和第一业务的外部环境数据，确定用户在第一业务下的初始用户画像。

由于训练第一子模型时，将不同时期的第一历史行为数据、不同时期的第一历史业务数据、不同时期的历史外部环境数据和不同时期的初始历史画像作为训练样本数据，因此训练好的第一子模型可以达到在各个时间段均能够预测用户初始画像的效果。

第二子模型可以通过以下方式训练得到：获取用户在第一业务下的不同时期的第一历史行为数据、第一业务在不同时期的第一历史业务数据、用户在第二业务下的不同时期的第二历史行为数据、第二业务在不同时期的第二历史业务数据、用户在第一业务下的不同时期的初始历史画像、基于第二业务扩展后的用户在第一业务下的不同时期的目标历史画像作为训练样本数据，将训练样本数据输入至第二子模型中进行训练，在第二子模型的模型参数收敛后，确定第二子模型训练完成。训练第二子模型的过程可以理解为：根据第一历史业务数据和第二历史业务数据机器学习第一历史行为数据和第二历史行为数据之间的第一关系，并学习初始历史画像和目标历史画像之间的第二关系，并拟合第一关系和第二关系。通过训练完成的第二子模型，能够基于用户在第一业务下的行为数据、第一业务的业务数据、用户在第二业务下的行为数据、第二业务的业务数据，对用户在第一业务下的初始用户画像进行扩展，确定基于第二业务扩展后的用户在第一业务下的目标用户画像。

由于训练第二子模型时，将不同时期的第一历史行为数据、不同时期的第一历史业务数据、不同时期的第二历史行为数据、不同时期的第二历史业务数据、不同时期的初始历史画像和不同时期的目标历史画像作为训练样本数据，因此训练好的第二子模型可以达到在各个时间段均能够预测用户画像的效果。

基于上述提及的用户画像确定模型，上述步骤S106中，根据第一用户行为数据、第二用户行为数据、第一业务数据、第二业务数据和外部环境数据，确定用户在第一业务下的目标用户画像，具体包括：

(a1)根据第一用户行为数据、第一业务数据和外部环境数据，确定用户在第一业务下的初始用户画像；

(a2)根据第一业务数据、第二业务数据、第一用户行为数据和第二用户行为数据，对初始用户画像进行扩展，得到用户在第一业务下的目标用户画像。

上述动作(a1)中，通过用户画像确定模型中的第一子模型，根据第一用户行为数据、第一业务数据和外部环境数据，确定用户在第一业务下的初始用户画像。上述动作(a2)中，通过用户画像确定模型中的第二子模型，根据第一业务数据、第二业务数据、第一用户行为数据和第二用户行为数据，对初始用户画像进行扩展，得到用户在第一业务下的目标用户画像。

初始用户画像与目标用户画像的区别在于，初始用户画像是在仅仅考虑第一业务的相关数据的情况下确定的用户画像，目标用户画像是在考虑到第二业务对用户的影响之后确定的用户在第一业务下的画像。比如，第一业务是基金业务，第二业务包括理财业务和电商业务，初始用户画像是在仅仅考虑基金业务相关数据的情况下确定的用户在基金业务下的画像，包括用户的扛风险能力值，目标用户画像是在考虑理财业务和电商业务对用户的影响之后确定的用户在基金业务下的画像，包括用户的扛风险能力值、用户在大促期间取出基金用于购物的可能概率值、用户取出基金买理财的概率值等。

上述动作(a1)的具体过程为：

(a11)确定第一业务数据与第一用户行为数据之间的第一关联关系，以及确定外部环境数据与第一用户行为数据之间的第二关联关系；

(a12)根据第一关联关系和第二关联关系，确定用户在第一业务下的初始用户画像。

具体地，第一关联关系包括但不限于正向关联和负向关联，正向关联表示第一业务数据对应的期望用户行为与第一用户行为数据对应的行为相匹配，也即在第一业务数据的影响下，用户执行了期望的行为或者类似的行为，负向关联表示第一业务数据对应的期望用户行为不为第一用户行为数据对应的行为，也即在第一业务数据的影响下，用户没有执行期望的行为或者类似的行为。第一业务数据对应的期望用户行为可以由人工设定。

同理，第二关联关系包括但不限于正向关联和负向关联，正向关联表示外部环境数据对应的期望用户行为与第二用户行为数据对应的行为相匹配，也即在外部环境数据的影响下，用户执行了期望的行为或者类似的行为，负向关联表示外部环境数据对应的期望用户行为不为第二用户行为数据对应的行为，也即在外部环境数据的影响下，用户没有执行期望的行为或者类似的行为。外部环境数据对应的期望用户行为可以由人工设定。

根据第一关联关系和第二关联关系，即能够确定第一业务数据对用户行为的影响、确定外部环境数据对用户行为的影响，从而确定用户在第一业务下的初始用户画像。

一个具体的例子中，第一业务为基金业务，第一业务数据为没有新的高利率的基金产品推出，外部环境数据为存款利率上涨，第一用户行为数据包括：用户赎回基金产品的行为数据和用户浏览各个银行的存款产品的行为数据。则通过上述动作(a11)，确定第一业务数据与第一用户行为数据之间的第一关联关系为负向关联，确定外部环境数据与第一用户行为数据之间的第二关联关系为正向关联，通过上述动作(a12)，根据第一关联关系和第二关联关系确定用户在基金业务下的初始用户画像包括：用户投资偏保守、倾向于风险低的存款而不是风险高的基金。该例中，第一业务数据对应的期望用户行为包括：购买已有基金，外部环境数据对应的期望用户行为包括：进行存款。

另一个具体的例子中，第一业务为电商业务，第一业务数据为电商商品原价销售，外部环境数据为网传电商商品不打折且有假货，第一用户行为数据包括用户往账户中充值的行为数据。则通过上述动作(a11)，确定第一业务数据与第一用户行为数据之间的第一关联关系为负向关联，确定外部环境数据与第一用户行为数据之间的第二关联关系为负向关联，通过上述动作(a12)，根据第一关联关系和第二关联关系确定用户在电商业务下的初始用户画像包括：电商忠实用户、购物重度用户。该例中，第一业务数据对应的期望用户行为包括：不在电商平台消费，外部环境数据对应的期望用户行为包括：不在电商平台消费。

可见，通过上述动作(a11)和(a12)，能够基于第一用户行为数据、第一业务数据和外部环境数据，准确确定用户在第一业务下的初始用户画像。

上述动作(a2)的具体过程为：

(a21)根据第一业务数据和第二业务数据，确定第一用户行为数据和第二用户行为数据之间的第三关联关系；

(a22)根据第三关联关系对初始用户画像进行扩展，得到目标用户画像。

具体地，第三关联关系用于表示第一用户行为数据和第二用户行为数据之间是否存在因果关系，第三关联关系包括：第一用户行为数据和第二用户行为数据之间存在因果关系，以及，第一用户行为数据和第二用户行为数据之间不存在因果关系。用户的行为受到业务数据的影响，通过分析第一业务数据和第二业务数据，能够确定第一用户行为数据和第二用户行为数据之间是否存在因果关系。进一步地，根据第三关联关系可以扩充初始用户画像，得到基于第二业务扩展后的目标用户画像。

一个具体的例子中，第一业务为基金业务，第一业务数据为没有新的高利率的基金产品推出，外部环境数据为存款利率上涨，第一用户行为数据包括：用户赎回基金产品的行为数据和用户浏览各个银行的存款产品的行为数据，通过上述过程确定初始用户画像包括：用户投资偏保守、倾向于风险低的存款而不是风险高的基金。进一步地，第二业务为电商业务，第二用户行为数据包括：购物行为数据，第二业务数据包括：商品双十一打折促销。则通过上述动作(a21)根据第一业务数据和第二业务数据，确定第一用户行为数据和第二用户行为数据之间可能存在因果关系，用户取出基金可能为了进行购物，从而基于该因果关系扩充初始用户画像，得到目标用户画像包括：用户投资偏保守、倾向于风险低的存款而不是风险高的基金，相比理财更喜欢购物。

另一个具体的例子中，第一业务为电商业务，第一业务数据为电商商品原价销售，外部环境数据为网传电商商品不打折且有假货，第一用户行为数据包括用户往账户中充值的行为数据，通过上述过程确定初始用户画像包括：电商忠实用户、购物重度用户。进一步地，第二业务为理财业务，第二用户行为数据包括：购买理财行为数据，第二业务数据包括：没有新理财上市。则通过上述动作(a21)根据第一业务数据和第二业务数据，确定第一用户行为数据和第二用户行为数据之间不存在因果关系，用户充值行为和用户购买理财行为不存在直接关系，从而扩充初始用户画像，得到目标用户画像包括：电商忠实用户、购物重度用户、可支配资金较多。

可见，通过上述动作(a21)和(a22)，能够基于第二用户行为数据、第二业务数据，对用户的初始用户画像进行扩展，得到用户在第一业务下的目标用户画像。

进一步地，本实施例中考虑到用户画像确定模型的准确性，图2为本申请另一实施例提供的用户画像生成方法的流程示意图，如图2所示，该方法在图1的基础上，还包括以下步骤：

步骤S108，在确定上述用户的目标用户画像之后，获取该用户在第一业务下的第三用户行为数据；其中，第三用户行为数据与第一用户行为数据为不同的行为数据；

步骤S110，若第三用户行为数据与该用户的目标用户画像不匹配，则根据第三用户行为数据对该用户的目标用户画像进行校正，以及，根据第三用户行为数据对用户画像确定模型进行校正。

本实施例中，在确定上述用户的目标用户画像之后，还获取该用户在第一业务下的第三用户行为数据，第三用户行为数据与第一用户行为数据为不同的行为数据。第三用户行为数据对应的用户行为可以发生在该用户的目标用户画像确定完成之后的预设时长内，比如，第三用户行为数据对应的用户行为发生在该用户的目标用户画像确定完成之后的72小时内。或者，第三用户行为数据对应的用户行为可以发生在该用户的目标用户画像确定完成之前的预设时长内，比如，第三用户行为数据对应的用户行为发生在该用户的目标用户画像确定完成之前的48小时内。一个优选的实施例中，第三用户行为数据可以为该用户的实时行为数据。

在获取第三用户行为数据之后，判断第三用户行为数据与用户的目标用户画像是否匹配，若匹配，则说明目标用户画像预测准确，若不匹配，则说明目标用户画像预测有误。若第三用户行为数据与目标用户画像不匹配，则本实施例中，可以根据第三用户行为数据对用户的目标用户画像进行校正，以及，根据第三用户行为数据对用户画像确定模型进行校正。

根据第三用户行为数据对用户的目标用户画像进行校正，可以为：将目标用户画像中与第三用户行为数据不相匹配的用户标签删除，并且，将第三用户行为数据对应的用户标签增加到目标用户画像中。

根据第三用户行为数据对用户画像确定模型进行校正，可以为：确定与第三用户行为数据相匹配的第一样本用户画像，利用第三用户行为数据和第一样本用户画像训练用户画像确定模型，以对用户画像确定模型进行校正。

本实施例中，用户画像(包括初始用户画像、目标用户画像和第一样本用户画像)均可以包括多个用户标签，用户标签可以举例为：年龄、性别、购物偏好、经济能力、抗风险能力等。本实施例中，在根据第三用户行为数据对用户画像确定模型进行校正时，可以确定与第三用户行为数据相匹配的一个或多个用户标签，将确定的用户标签组成为第一样本用户画像，将第三用户行为数据和第一样本用户画像输入至用户画像确定模型中以训练用户画像确定模型，从而对用户画像确定模型进行校正。

可见，通过本实施例，在确定出目标用户画像后，能够根据用户的行为数据对目标用户画像进行校正，并对用户画像确定模型进行校正，从而达到反馈调节用户画像确定模型的效果。若根据用户的实时行为数据对目标用户画像进行校正，并对用户画像确定模型进行校正，还能够使得用户画像确定模型达到7*24小时无间断的进行用户画像预测的功能。

进一步地，本实施例中考虑到用户画像确定模型的准确性，图3为本申请另一实施例提供的用户画像生成方法的流程示意图，如图3所示，该方法在图1的基础上，还包括以下步骤：

步骤S112，在确定上述用户的目标用户画像之后，确定与该用户在第一业务下属于同一预设类别的同类用户，并获取同类用户的目标用户画像；

步骤S114，若该用户的目标用户画像与同类用户的目标用户画像之间的差距大于预设差距，则根据同类用户的用户行为数据，对用户画像确定模型进行校正。

本实施例中，在确定上述用户的目标用户画像之后，还确定与该用户在第一业务下属于同一预设类别的同类用户，该同类用户可以举例为与上述用户在电商业务下同样属于购物重度爱好者的用户，或者举例为与上述用户在基金业务下同样属于抗风险能力低的用户。然后，获取同类用户的目标用户画像。比对该用户的目标用户画像与同类用户的目标用户画像之间的差距是否大于预设差距，具体地，可以比较该用户的目标用户画像中包括的各个用户标签与同类用户的目标用户画像中包括的各个用户标签是否重合，并且确定用户标签的重合率，若该重合率大于预设重合率阈值，则确定上述差距小于预设差距，反之，确定上述差距大于预设差距。若该用户的目标用户画像与同类用户的目标用户画像之间的差距大于预设差距，则说明用户画像确定模型不够准确，进而获取同类用户的用户行为数据，根据同类用户的用户行为数据，对用户画像确定模型进行校正。

其中，同类用户的用户行为数据对应的用户行为可以发生在同类用户的目标用户画像确定完成之后的预设时长内，比如，同类用户的用户行为数据对应的用户行为发生在同类用户的目标用户画像确定完成之后的72小时内。或者，同类用户的用户行为数据对应的用户行为可以发生在同类用户的目标用户画像确定完成之前的预设时长内，比如，同类用户的用户行为数据对应的用户行为发生在同类用户的目标用户画像确定完成之前的48小时内。一个优选的实施例中，同类用户的用户行为数据可以为同类用户的实时行为数据。

根据同类用户的用户行为数据，对用户画像确定模型进行校正，具体为：确定与同类用户的用户行为数据相匹配的第二样本用户画像，利用同类用户的用户行为数据和第二样本用户画像训练用户画像确定模型，以对用户画像确定模型进行校正。

本实施例中，用户画像(包括初始用户画像、目标用户画像和第二样本用户画像)均可以包括多个用户标签，用户标签可以举例为：年龄、性别、购物偏好、经济能力、抗风险能力等。本实施例中，在根据同类用户的用户行为数据，对用户画像确定模型进行校正时，可以确定与同类用户的用户行为数据相匹配的一个或多个用户标签，将确定的用户标签组成为第二样本用户画像，将同类用户的用户行为数据和第二样本用户画像输入至用户画像确定模型中以训练用户画像确定模型，从而对用户画像确定模型进行校正。

可见，通过本实施例，在确定出用户的目标用户画像后，能够根据同类用户的用户行为数据对用户画像确定模型进行校正，从而达到横向比对反馈调节用户画像确定模型的效果。

综上，本申请实施例中的方法至少具有以下有益效果：接入多个业务的业务数据和用户在多个业务下的行为数据，打通多个业务，使得用户画像描述更加全面；引入外部环境数据，可以扩大特征空间，使得画像描述更加准确；通过用户行为数据和同类用户的横向比对，可以及时修正模型，达到7*24小时刻画用户画像的效果。

对应上述的用户画像生成方法，本申请实施例还提供了一种用户画像生成装置，用于实现上述的用户画像生成方法，图4为本申请一实施例提供的用户画像生成装置的模块组成示意图，如图4所示，该装置包括以下模块：

业务确定模块41，用于确定第一业务以及与所述第一业务的业务内容相互关联的第二业务；

数据获取模块42，用于获取用户在所述第一业务下的第一用户行为数据，所述用户在所述第二业务下的第二用户行为数据、所述第一业务的第一业务数据、所述第二业务的第二业务数据以及所述第一业务对应的外部环境数据；其中，所述外部环境数据为预先确定的与所述第一业务的第一业务数据相关的数据；

画像确定模块43，用于通过预先训练的用户画像确定模型，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像。

可选地，所述画像确定模块43具体用于：根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像；根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像。

可选地，所述画像确定模块43还具体用于：确定所述第一业务数据与所述第一用户行为数据之间的第一关联关系，以及确定所述外部环境数据与所述第一用户行为数据之间的第二关联关系；根据所述第一关联关系和所述第二关联关系，确定所述用户在所述第一业务下的初始用户画像。

可选地，所述画像确定模块43还具体用于：根据所述第一业务数据和所述第二业务数据，确定所述第一用户行为数据和所述第二用户行为数据之间的第三关联关系；根据所述第三关联关系对所述初始用户画像进行扩展，得到所述目标用户画像。

可选地，还包括第一校正模块，用于：在确定所述用户的目标用户画像之后，获取所述用户在所述第一业务下的第三用户行为数据；其中，所述第三用户行为数据与所述第一用户行为数据为不同的行为数据；若所述第三用户行为数据与所述用户的目标用户画像不匹配，则根据所述第三用户行为数据对所述用户的目标用户画像进行校正，以及，根据所述第三用户行为数据对所述用户画像确定模型进行校正。

可选地，所述第一校正模块具体用于：确定与所述第三用户行为数据相匹配的第一样本用户画像；利用所述第三用户行为数据和所述第一样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

可选地，还包括第二校正模块，用于：在确定所述用户的目标用户画像之后，确定与所述用户在所述第一业务下属于同一预设类别的同类用户，并获取所述同类用户的目标用户画像；若所述用户的目标用户画像与所述同类用户的目标用户画像之间的差距大于预设差距，则根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正。

可选地，所述第二校正模块具体用于：确定与所述同类用户的用户行为数据相匹配的第二样本用户画像；利用所述同类用户的用户行为数据和所述第二样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

需要说明的是，本申请实施例中的用户画像确定装置能够实现前述的用户画像确定方法实施例的各个过程，并达到相同的功能和效果，这里不再赘述。

进一步地，本申请实施例还提供了一种用户画像确定设备，图5为本申请一实施例提供的用户画像确定设备的结构示意图，如图5所示，用户画像确定设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器901和存储器902，存储器902中可以存储有一个或一个以上存储应用程序或数据。其中，存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对用户画像确定设备中的一系列计算机可执行指令。更进一步地，处理器901可以设置为与存储器902通信，在用户画像确定设备上执行存储器902中的一系列计算机可执行指令。用户画像确定设备还可以包括一个或一个以上电源903，一个或一个以上有线或无线网络接口904，一个或一个以上输入输出接口905，一个或一个以上键盘906等。

在一个具体的实施例中，用户画像确定设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对用户画像确定设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

可选地，计算机可执行指令在被执行时，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像，包括：根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像；根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像。

可选地，计算机可执行指令在被执行时，根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像，包括：确定所述第一业务数据与所述第一用户行为数据之间的第一关联关系，以及确定所述外部环境数据与所述第一用户行为数据之间的第二关联关系；根据所述第一关联关系和所述第二关联关系，确定所述用户在所述第一业务下的初始用户画像。

可选地，计算机可执行指令在被执行时，根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像，包括：根据所述第一业务数据和所述第二业务数据，确定所述第一用户行为数据和所述第二用户行为数据之间的第三关联关系；根据所述第三关联关系对所述初始用户画像进行扩展，得到所述目标用户画像。

可选地，计算机可执行指令在被执行时，还包括：在确定所述用户的目标用户画像之后，获取所述用户在所述第一业务下的第三用户行为数据；其中，所述第三用户行为数据与所述第一用户行为数据为不同的行为数据；若所述第三用户行为数据与所述用户的目标用户画像不匹配，则根据所述第三用户行为数据对所述用户的目标用户画像进行校正，以及，根据所述第三用户行为数据对所述用户画像确定模型进行校正。

可选地，计算机可执行指令在被执行时，根据所述第三用户行为数据对所述用户画像确定模型进行校正，包括：确定与所述第三用户行为数据相匹配的第一样本用户画像；利用所述第三用户行为数据和所述第一样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

可选地，计算机可执行指令在被执行时，还包括：在确定所述用户的目标用户画像之后，确定与所述用户在所述第一业务下属于同一预设类别的同类用户，并获取所述同类用户的目标用户画像；若所述用户的目标用户画像与所述同类用户的目标用户画像之间的差距大于预设差距，则根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正。

可选地，计算机可执行指令在被执行时，根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正，包括：确定与所述同类用户的用户行为数据相匹配的第二样本用户画像；利用所述同类用户的用户行为数据和所述第二样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

需要说明的是，本申请实施例中的用户画像确定设备能够实现前述的用户画像确定方法实施例的各个过程，并达到相同的功能和效果，这里不再赘述。

进一步地，本申请实施例还提供了一种存储介质，用于存储计算机可执行指令，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令在被处理器执行时，能实现以下流程：

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像，包括：根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像；根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像，包括：确定所述第一业务数据与所述第一用户行为数据之间的第一关联关系，以及确定所述外部环境数据与所述第一用户行为数据之间的第二关联关系；根据所述第一关联关系和所述第二关联关系，确定所述用户在所述第一业务下的初始用户画像。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像，包括：根据所述第一业务数据和所述第二业务数据，确定所述第一用户行为数据和所述第二用户行为数据之间的第三关联关系；根据所述第三关联关系对所述初始用户画像进行扩展，得到所述目标用户画像。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，还包括：在确定所述用户的目标用户画像之后，获取所述用户在所述第一业务下的第三用户行为数据；其中，所述第三用户行为数据与所述第一用户行为数据为不同的行为数据；若所述第三用户行为数据与所述用户的目标用户画像不匹配，则根据所述第三用户行为数据对所述用户的目标用户画像进行校正，以及，根据所述第三用户行为数据对所述用户画像确定模型进行校正。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，根据所述第三用户行为数据对所述用户画像确定模型进行校正，包括：确定与所述第三用户行为数据相匹配的第一样本用户画像；利用所述第三用户行为数据和所述第一样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，还包括：在确定所述用户的目标用户画像之后，确定与所述用户在所述第一业务下属于同一预设类别的同类用户，并获取所述同类用户的目标用户画像；若所述用户的目标用户画像与所述同类用户的目标用户画像之间的差距大于预设差距，则根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正。

可选地，该存储介质存储的计算机可执行指令在被处理器执行时，根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正，包括：确定与所述同类用户的用户行为数据相匹配的第二样本用户画像；利用所述同类用户的用户行为数据和所述第二样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

需要说明的是，本申请实施例中的存储介质能够实现前述的用户画像确定方法实施例的各个过程，并达到相同的功能和效果，这里不再赘述。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种用户画像生成方法，包括：

2.根据权利要求1所述的方法，根据所述第一用户行为数据、所述第二用户行为数据、所述第一业务数据、所述第二业务数据和所述外部环境数据，确定所述用户在所述第一业务下的目标用户画像，包括：

根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像；

根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像。

3.根据权利要求2所述的方法，根据所述第一用户行为数据、所述第一业务数据和所述外部环境数据，确定所述用户在所述第一业务下的初始用户画像，包括：

确定所述第一业务数据与所述第一用户行为数据之间的第一关联关系，以及确定所述外部环境数据与所述第一用户行为数据之间的第二关联关系；

根据所述第一关联关系和所述第二关联关系，确定所述用户在所述第一业务下的初始用户画像。

4.根据权利要求2所述的方法，根据所述第一业务数据、所述第二业务数据、所述第一用户行为数据和所述第二用户行为数据，对所述初始用户画像进行扩展，得到所述用户在所述第一业务下的目标用户画像，包括：

根据所述第一业务数据和所述第二业务数据，确定所述第一用户行为数据和所述第二用户行为数据之间的第三关联关系；

根据所述第三关联关系对所述初始用户画像进行扩展，得到所述目标用户画像。

5.根据权利要求1至4任一项所述的方法，还包括：

在确定所述用户的目标用户画像之后，获取所述用户在所述第一业务下的第三用户行为数据；其中，所述第三用户行为数据与所述第一用户行为数据为不同的行为数据；

若所述第三用户行为数据与所述用户的目标用户画像不匹配，则根据所述第三用户行为数据对所述用户的目标用户画像进行校正，以及，根据所述第三用户行为数据对所述用户画像确定模型进行校正。

6.根据权利要求5所述的方法，根据所述第三用户行为数据对所述用户画像确定模型进行校正，包括：

确定与所述第三用户行为数据相匹配的第一样本用户画像；

利用所述第三用户行为数据和所述第一样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

7.根据权利要求1至4任一项所述的方法，还包括：

在确定所述用户的目标用户画像之后，确定与所述用户在所述第一业务下属于同一预设类别的同类用户，并获取所述同类用户的目标用户画像；

若所述用户的目标用户画像与所述同类用户的目标用户画像之间的差距大于预设差距，则根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正。

8.根据权利要求7所述的方法，根据所述同类用户的用户行为数据，对所述用户画像确定模型进行校正，包括：

确定与所述同类用户的用户行为数据相匹配的第二样本用户画像；

利用所述同类用户的用户行为数据和所述第二样本用户画像训练所述用户画像确定模型，以对所述用户画像确定模型进行校正。

9.一种用户画像生成装置，包括：

10.根据权利要求9所述的装置，所述画像确定模块具体用于：

11.根据权利要求10所述的装置，所述画像确定模块还具体用于：

12.根据权利要求10所述的装置，所述画像确定模块还具体用于：

13.根据权利要求9至12任一项所述的装置，还包括第一校正模块，用于：

14.根据权利要求13所述的装置，所述第一校正模块具体用于：

确定与所述第三用户行为数据相匹配的第一样本用户画像；

15.根据权利要求9至12任一项所述的装置，还包括第二校正模块，用于：

16.根据权利要求15所述的装置，所述第二校正模块具体用于：

17.一种用户画像生成设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现上述权利要求1至8任一项所述的用户画像生成方法的步骤。

18.一种存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被执行时实现上述权利要求1至8任一项所述的用户画像生成方法的步骤。