CN111640001A

CN111640001A - 基于标签关联的客户群行为预测的方法

Info

Publication number: CN111640001A
Application number: CN202010339262.6A
Authority: CN
Inventors: 陈思成; 唐玏
Original assignee: Sichuan XW Bank Co Ltd
Current assignee: Sichuan XW Bank Co Ltd
Priority date: 2020-04-26
Filing date: 2020-04-26
Publication date: 2020-09-08

Abstract

本发明涉及基于标签关联的客户群行为预测的方法，包括：A.提取出每个客户的历史数据，对每类历史数据设置标签；B.根据历史数据按照各标签建立矩阵存储结构C1，其中行为各标签，列为客户；C.将C1中数值类型的标签拆分为多个扩展标签，并建立扩展矩阵存储结构C2，其中行为扩展标签和是否参加金融贷款产品营销活动的标签，列为客户，C2中的所有值都为布尔值；D.计算出每个扩展标签的权重；E.根据扩展标签的权重计算出新的客户标签参加金融贷款产品营销活动的概率值。本发明能够计算出扩展标签两两之间的关系，并且实时预测出选定的客户群参与活动的概率和提供出相关性最大的扩展标签组合，极大的辅助了人工对客户群的筛选。

Description

基于标签关联的客户群行为预测的方法

技术领域

本发明涉及数据处理的方法，具体讲是基于标签关联的客户群行为预测的方法。

背景技术

在金融贷款产品的营销场景中，为了提升营销的转化率、降低营销成本，通常会采用大数据技术来描述客户群体，营销人员通过大数据筛选出不同的客户群体来制定不同的营销策略。

通常的大数据分析方法为：首先根据数据平台采集的客户静态属性数据和客户行为数据，采用大数据统计的方式，对每一个客户打上标签，标签类别包括客户的性别、年龄、历史贷款金额、页面访问时长等，然后通过营销人员设置标签集合来筛选出客户群，例如将(男性、35岁以上、历史最大贷款金额10万元以上)三个标签组成一个客户群，对这个客户群来进行某中金融贷款产品的营销推广，在营销推广实施完成后，根据实际客户参与情况再来统计该客户群的营销效果。

这种方案的缺点有两个，其一是系统无法实时反馈营销人员筛选出的标签集合的营销推广效果，其二是营销人员在挑选标签时具有盲目性，系统不能智能提供标签选择的建议。

发明内容

本发明提供了一种基于标签关联的客户群行为预测的方法，可以根据历史数据实时预测出该选定的客户群参与相应活动的概率，辅助人工对客户群的筛选。

本发明基于标签关联的客户群行为预测的方法，包括：

A.通过处理器从系统数据库中提取出每个客户的历史数据，对所述历史数据分类，并对每类设置标签，至少包括每个客户的性别、年龄、历史贷款金额和是否参加金融贷款产品营销活动的标签；

B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1，其中矩阵存储结构C1的行结构为所述的各标签，列结构为各客户；

C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签，并在存储结构中建立扩展矩阵存储结构C2，其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签，列结构为各客户，扩展矩阵存储结构C2中的所有值都为布尔值(如0和1)；

D.根据扩展矩阵存储结构C2中各扩展标签的值，通过随机梯度下降的方法计算出每个扩展标签的权重；

E.将新的客户标签的值带入所述的随机梯度下降的方法，根据计算出的扩展标签的权重，计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。

本发明是通过分箱的操作，将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算，将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下，客户是否参与活动的概率。因为扩展标签值、权重等数据都是基于历史数据的拟合，因此预测的结果是具有客观依据的，而不是依靠人为规则和主观判断来计算得到的。

进一步的，步骤D中，通过公式：

计算出每个扩展标签的权重，其中，y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1)，ω₀为偏置量，表示截距，n为扩展标签的数量，x_i为第i个扩展标签的取值，ω_i为第i个扩展标签的权重，j为与扩展标签i不同的扩展标签，ω_ij为当ω_i和ω_j共同出现时的权重，表示了扩展标签x_i和x_j的关联关系。

进一步的，将所述公式中的ω_ij对应的第i个扩展标签的权重ω_i和第j个扩展标签的权重ω_j，分别通过各自对应的辅助向量V_i＝(v_i1,v_i2,……,v_ik)和V_j＝(v_j1,v_j2,……,v_jk)将扩展标签表示为一个表征扩展标签特征的向量，使得ω_ij等于V_i和V_j的点乘(向量的内积)，由此将所述公式转换为：

步骤D中，根据扩展矩阵存储结构C2中各扩展标签的值，通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量V_i和V_j。

进一步的，计算出每个辅助向量后，计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度，当人工选择一个扩展标签后，系统选取出与该扩展标签的相似度最大的K个扩展标签，用于辅助人工筛选客户群。

本发明基于标签关联的客户群行为预测的方法，能够根据历史数据计算出扩展标签两两之间的关系，并且实时预测出该选定的客户群参与相应活动的概率和提供出相关性最大的扩展标签组合，极大的辅助了人工对客户群的筛选。并且，因为扩展标签值、权重等数据都是基于历史数据的拟合，因此预测的结果是具有客观依据的，而不是依靠人为规则和主观判断来计算得到的。

以下结合实施例的具体实施方式，对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下，根据本领域普通技术知识和惯用手段做出的各种替换或变更，均应包括在本发明的范围内。

附图说明

图1为本发明基于标签关联的客户群行为预测的方法的流程图。

具体实施方式

如图1所示本发明基于标签关联的客户群行为预测的方法，本实施例以预测指定的客户群参加金融产品的营销活动的概率为例，包括：

A.通过处理器从系统数据库中提取出每个客户的历史数据，包括每个客户的性别、年龄、页面访问时长、历史贷款金额等，以及每个客户最终是否参与营销活动(用0和1表示)。对所述的各种历史数据分类，并对每类设置标签，例如性别、年龄、页面访问时长、历史贷款金额分别为一个标签。

B.根据提取的每个客户的历史数据按照所述的各标签在存储结构中建立矩阵存储结构C1，其中矩阵存储结构C1的行结构为所述的各标签，列结构为各客户，如表1所示：

表1：

C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签，例如将“年龄标签”拆分为“年龄<30”、“30≤年龄<40”、“40≤年龄<50”等多个，将原N个标签扩展为P(P>N)个，并在存储结构中建立扩展矩阵存储结构C2，其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签，列结构为各客户，扩展矩阵存储结构C2中的所有值都为布尔值(如0和1)，如表2所示：

表2：

D.根据扩展矩阵存储结构C2中各扩展标签的值，通过随机梯度下降的方法计算出每个扩展标签的权重：

其中，y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值(0或1)，ω₀为偏置量，表示截距，n为扩展标签的数量，x_i为第i个扩展标签的取值，ω_i为第i个扩展标签的权重，j为与扩展标签i不同的扩展标签，ω_ij为当ω_i和ω_j共同出现时的权重，表示了扩展标签x_i和x_j的关联关系。

然后，将上述公式中的ω_ij对应的第i个扩展标签的权重ω_i和第j个扩展标签的权重ω_j，分别通过各自对应的辅助向量V_i＝(v_i1,v_i2,……,v_ik)和V_j＝(v_j1,v_j2,……,v_jk)将扩展标签表示为一个表征扩展标签特征的向量，使得ω_ij等于V_i和V_j的点乘(向量的内积)，由此将上述公式转换为：

再根据扩展矩阵存储结构C2中各扩展标签的值，通过随机梯度下降的方法计算出每个扩展标签的权重、辅助向量V_i和V_j。

E.将新的客户标签的值带入所述的随机梯度下降的方法，根据计算出的扩展标签的权重和辅助向量，计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值(例如0.2、0.9等)。

在计算出每个辅助向量后，还可以通过计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度，当人工选择一个扩展标签后，系统选取出与该扩展标签的相似度最大的K个扩展标签(如K＝3)，例如人工选择了“客户＝男”的扩展标签，系统自动选取出关联度最大的“年龄<30”、“历史贷款<50”等扩展标签，用于辅助人工筛选客户群。

本发明是通过分箱的操作，将普通的多取值的标签分解为多个0/1取值的布尔类型的扩展标签。然后通过公式计算，将历史客户的扩展标签取值、权重、以及最终客户是否参与活动的关系表示出来。通过计算出的结果能够预测出新的标签组合下，客户是否参与活动的概率。

因为扩展标签值、权重等数据都是基于历史数据的拟合，因此预测的结果是具有客观依据的，而不是依靠人为规则和主观判断来计算得到的。

Claims

1.基于标签关联的客户群行为预测的方法，其特征包括：

C.通过分箱操作将矩阵存储结构C1中数值类型的标签根据标签所在列的数值拆分为多个与所述数值的范围相适应的扩展标签，并在存储结构中建立扩展矩阵存储结构C2，其中扩展矩阵存储结构C2的行结构为所有扩展标签和是否参加金融贷款产品营销活动的标签，列结构为各客户，扩展矩阵存储结构C2中的所有值都为布尔值；

E.将新的客户标签的值带入所述的随机梯度下降的方法，根据计算出的扩展标签的权重，计算出新的客户标签对应的是否参加金融贷款产品营销活动的概率值。

2.如权利要求1所述的基于标签关联的客户群行为预测的方法，其特征为：步骤D中，通过公式：

计算出每个扩展标签的权重，其中，y表示扩展矩阵存储结构C2中客户是否参加金融贷款产品营销活动的布尔值，ω₀为偏置量，表示截距，n为扩展标签的数量，x_i为第i个扩展标签的取值，ω_i为第i个扩展标签的权重，j为与扩展标签i不同的扩展标签，ω_ij为当ω_i和ω_j共同出现时的权重，表示了扩展标签x_i和x_j的关联关系。

3.如权利要求2所述的基于标签关联的客户群行为预测的方法，其特征为：将所述公式中的ω_ij对应的第i个扩展标签的权重ω_i和第j个扩展标签的权重ω_j，分别通过各自对应的辅助向量V_i＝(v_i1,v_i2,……,v_ik)和V_j＝(v_j1,v_j2,……,v_jk)将扩展标签表示为一个表征扩展标签特征的向量，使得ω_ij等于V_i和V_j的点乘，由此将所述公式转换为：

4.如权利要求3所述的基于标签关联的客户群行为预测的方法，其特征为：计算出每个辅助向量后，计算两两辅助向量的余弦相似度作为对应的两两扩展标签之间的相似度，当人工选择一个扩展标签后，系统选取出与该扩展标签的相似度最大的K个扩展标签，用于辅助人工筛选客户群。