CN110659930A

CN110659930A - 基于用户行为的消费提质方法、装置、存储介质及设备

Info

Publication number: CN110659930A
Application number: CN201910796988.XA
Authority: CN
Inventors: 魏丞昊; 罗利; 姚秀山; 钟凯; 冯静; 黄哲学
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2019-08-27
Filing date: 2019-08-27
Publication date: 2020-01-07

Abstract

本发明提出了一种基于用户行为的消费提质方法、装置、存储介质及设备。所述方法包括：获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；根据所述原始矩阵进行预处理，得到标准化矩阵；获取预设簇的数量，所述预设簇的数量为业务类型数量；根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵；根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。本发明对存量用户的消费提质的目标业务类型明确、可操作性强。

Description

基于用户行为的消费提质方法、装置、存储介质及设备

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于用户行为的消费提质方法、装置、存储介质及设备。

背景技术

随着5G时代的到来，通信市场的竞争日趋激烈，手机普及度不断增长甚至趋于饱和，外来劳务市场的持续低迷，导致新增市场增长减缓，发展新用户的难度越来越大；由于同行竞争导致用户量和占比越来越小。在这种情况下，用户的获取和保有就成为业务发展的关键，电信业务收入中70％以上来自在网存量用户，存量用户的维系、保值、提值就成为了当前电信公司经营业务的重中之重。虽然电信企业也在开展营销侧的数据挖掘，尤其是硬聚类算法来完成了针对存量用户的简单提质清单的挖掘，例如，基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于模型的聚类算法。然而，这些挖掘结果本身对于营销人员在业务层面来说可操作性不强、提质目标套餐不明确，导致最终的提质效果不理想。因此，提出一种操作性强、目标套餐明确的基于用户行为的消费提质方法显得尤为重要。

发明内容

基于此，有必要针对上述问题，提出了一种基于用户行为的消费提质方法、装置、存储介质及设备。

第一方面，本发明提出了一种基于用户行为的消费提质方法，所述方法包括：

获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；

根据所述原始矩阵进行预处理，得到标准化矩阵；

获取预设簇的数量，所述预设簇的数量为业务类型数量；

根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵；

根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。

第二方面，本发明还提出了一种基于用户行为的消费提质装置，所述装置包括：

原始矩阵建立模块，用于获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；

预处理模块，用于根据所述原始矩阵进行预处理，得到标准化矩阵；

隶属度矩阵确定模块，用于获取预设簇的数量，所述预设簇的数量为业务类型数量，根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵，根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。

第三方面，本发明还提出了一种存储介质，存储有计算机指令程序，所述计算机指令程序被处理器执行时，使得所述处理器执行第一方面任一项所述方法的步骤。

第四方面，本发明还提出了一种计算机设备，包括至少一个存储器、至少一个处理器，所述存储器存储有计算机指令程序，所述计算机指令程序被所述处理器执行时，使得所述处理器执行第一方面任一项所述方法的步骤。

综上所述，本发明的一种基于用户行为的消费提质方法通过对存量用户的用户数据进行预处理后得到标准化矩阵，根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵，根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。存量用户的用户数据的数据挖掘结果包括标准化矩阵、与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，营销人员只需要根据标准化矩阵中用户当前的业务类型、经过优化计算得出的目标隶属度矩阵中用户在各业务类型的隶属度即可简要快速明确消费提质的目标业务类型。因此，本发明对存量用户的消费提质的目标业务类型明确、可操作性强。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为一个实施例中一种基于用户行为的消费提质方法的流程图；

图2为一个实施例中基于用户行为的消费提质方法的预处理得出标准化矩阵的流程图；

图3为一个实施例中基于用户行为的消费提质方法的选择特征字段的流程图；

图4为一个实施例中基于用户行为的消费提质方法的构建初始隶属度矩阵的流程图；

图5为一个实施例中基于用户行为的消费提质方法的计算目标隶属度矩阵及目标聚类中心的流程图；

图6为另一个实施例中基于用户行为的消费提质方法的计算目标隶属度矩阵及目标聚类中心的流程图；

图7为一个实施例中基于用户行为的消费提质方法的确定消费提质的目标业务类型的流程图；

图8为一个实施例中一种基于用户行为的消费提质装置的结构框图；

图9为一个实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，在一个实施例中，提出了一种基于用户行为的消费提质方法，所述方法包括：

S102、获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；

所述用户数据是指发生过消费行为的存量用户的所有数据，包括特征字段、特征值。比如，电信业务中的用户行为数据的特征字段包括：付费方式、套餐档次、网龄、是否绑定银行卡、是否开通4G、终端使用月份、是否开通翼支付、网龄、性别、是否开通线上支付、是否开通线下支付、翼支付消费金额、发了总额、发了余额、实际消费额度、语音时长、被叫时长、被叫次数、主叫时长、主叫次数、本地主叫次数、国内主叫次数、流量、流量时长、4G流量、融合补贴、融合余额，在此举例不作具体限定。

所述特征值为每个用户在上述特征字段的消费行为产生的数值，比如，“是否开通4G”的特征值为是、否；“终端使用月份”的特征值为11个月；“语音时长”为300分钟，在此举例不作具体限定。

所述用户身份数据包括用户标识、联系方式、住址等，其中用户标识用于唯一标识一个用户，用户标识可以是用户名称、用户ID、身份证号码等可以用于唯一标识该用户的标识。

所述用户行为数据是发生过消费行为的存量用户与消费相关的数据，比如，翼支付消费金额、发了总额、发了余额等，在此举例不作具体限定。

所述原始矩阵的每行表示同一个用户的用户数据，同一列表示同一个特征字段对应的特征值。

S104、根据所述原始矩阵进行预处理，得到标准化矩阵；

具体而言，根据所述原始矩阵对异常的特征值进行处理，然后选择相关性较大的特征字段及其对应的特征值组成标准化矩阵。通过预处理得到标注化矩阵，减少无关数据的噪音干扰，提升了本方法的效率和准确性。

所述标准化矩阵的每行表示同一个用户的用户数据，同一列表示同一个特征字段对应的特征值。

S106、获取预设簇的数量，所述预设簇的数量为业务类型数量；

所述业务类型是指消费提质的业务类型，通常指同一业务中的不同消费等级，可以理解的是，也可以把不同业务打包成不同的消费等级后再划分业务类型，在此不作具体限定。比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，电信业务中的流量套餐包括5元、10元、20元、30元共计4个业务类型则预设簇的数量为4个，电信业务中的短信套餐包括5元、10元、15元共计3个业务类型则预设簇的数量为3个，电信业务中的话费套餐和流量套餐打包后分为68元、98元、138元、168元共计4个业务类型则预设簇的数量为4个，在此举例不作具体限定。

S108、根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵；

具体而言，将所述预设簇的数量作为所述初始隶属度矩阵的列数，将所述标准化矩阵的行数作为所述初始隶属度矩阵的行数。

S110、根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。

具体而言，根据所述标准化矩阵、所述初始隶属度矩阵使用包含模糊隶属度函数以及作为距离计算的高斯核函数，通过拉格朗日乘子法推导出的聚类中心的迭代公式进行迭代，以及粒子群算法作为聚类中心进行迭代；每次迭代时，基于拉格朗日乘子法获得聚类中心迭代公式进行聚类迭代得到第一目标函数值，并且通过粒子群算法作为聚类中心进行聚类迭代得到第二目标函数值，然后根据第一目标函数值、第二目标函数值选择目标函数值小的路径作为聚类中心下一迭代路径；通过迭代最终得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。

本实施例通过存量用户的用户数据的数据挖掘结果包括标准化矩阵、与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，营销人员只需要根据标准化矩阵中用户当前的业务类型、经过优化计算得出的目标隶属度矩阵中用户在各业务类型的隶属度即可简要快速明确消费提质的目标业务类型。因此，本实施例对存量用户的消费提质的目标业务类型明确、可操作性强。

如图2所示，在一个实施例中，所述根据所述原始矩阵进行预处理，得到标准化矩阵，具体包括：

S202、根据所述原始矩阵进行空值和异常值清洗，得清洗后的用户数据矩阵；

具体而言，把原始矩阵的为空值或异常值的特征值全部置于零，得到特征值不含空值或异常值的清洗后的用户数据矩阵。

S204、根据所述清洗后的用户数据矩阵进行整合，得到整合后的用户数据矩阵；

具体而言，把清洗后的用户数据矩阵中特征字段的特征值按去重复、取最大值、最小值、平均值、求和、选择更新时间最晚至少一种方式进行整合得到整合后的用户数据矩阵，从而通过整合以提高本方法后续数据挖掘的效率和准确性。可以理解的是，整合还可以采用其他方式，比如加权求和，在此举例不作具体限定。

比如，在电信业务系统中涉及电信用户数据共有21张表格，每张表格标注着用户部分数据，其中不少数据是重复的、或者更新时间不同的，在此举例不作具体限定。

S206、根据所述整合后的用户数据矩阵进行用户行为数据对应特征字段的选择，得到标准化矩阵。

具体而言，选择需要消费提质的业务类型有关系的用户数据的特征字段及其对应的特征值作为标准化矩阵。可以理解的是，需要消费提质的业务类型不同，选择的特征字段及其对应的特征值不同，在此不作具体限定。

比如，电信业务中消费提质的目标业务类型是提升话费套餐，则从用户数据中选择语音时长、被叫时长、被叫次数、主叫时长、主叫次数、本地主叫次数、国内主叫次数等特征字段及其对应的特征值作为标准化矩阵，在此举例不作具体限定。

如图3所示，在一个实施例中，所述根据所述整合后的用户数据矩阵进行用户行为数据对应特征字段的选择，得到标准化矩阵，具体包括：

S302、根据所述整合后的用户数据矩阵采用协方差进行计算，得到与用户行为数据对应的特征字段之间的相关系数；

由于记录用户行为的数据维度较多，需要选取特征字段来进行用户行为分析，通过协方差计算出两个特征字段之间的相关系数，根据相关系数才能更好的确定特征字段之间的相关性大小。

具体而言，相关系数的协方差计算公式为：

其中，X、Y为整合后的用户数据矩阵中任意两个特征字段，X_i是第i行的特征字段X的特征值，Y_i是第i行的特征字段Y的特征值，

是整合后的用户数据矩阵中特征字段X的特征值的平均值，

是整合后的用户数据矩阵中特征字段Y的特征值的平均值，n是整合后的用户数据矩阵的行的总数即用户总数，i是1到n的自然数。

S304、根据所述用户行为数据对应的特征字段之间的相关系数进行特征字段排序；

具体而言，根据所述用户行为数据对应的特征字段之间的相关系数进行特征字段倒序或正序排序。

S306、根据特征字段排序结果按预设数量选择排名靠前的特征字段及对应的用户行为数据作为标准化矩阵。

比如，电信业务中，选取相关系数靠前的19个字段作为特征字段，包括用户ID、网龄、终端使用月份、网龄、翼支付消费金额、发了余额、发了总额、实际消费额度、语音时长、被叫时长、被叫次数、主叫时长、主叫次数、本地主叫次数、国内主叫次数流量、流量时长、4G流量、融合余额，在此举例不作具体限定。

如图4所示，在一个实施例中，所述根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵，具体包括：

S402、将所述预设簇的数量作为所述初始隶属度矩阵的列数，将所述标准化矩阵的行数作为所述初始隶属度矩阵的行数；

隶属度矩阵中每行即代表一个用户在各个业务类型的隶属度。

S404、对所述初始隶属度矩阵中每个元素的值初始化为介于0至1的任意值，且使所述初始隶属度矩阵每行的元素的值之和等于1。

所述元素的值是指特征值。通过使每个元素的值为介于0至1的任意值、每行的元素的值之和等于1，从而可以直观的看出用户在每个业务类型中的隶属度大小，简化了营销人员明确消费提质的目标业务类型的方式，从而使本方法具有较强的可操作性。

如图5所示，在一个实施例中，所述根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，具体包括：

S502、根据确定与所述预设簇的数量相同的初始聚类中心；

具体而言，随机从标准化矩阵中选取与所述预设簇的数量相同的聚类中心，对聚类中心初始化得到初始聚类中心。

聚类中心设为c_i(t)，设t＝0，对聚类中心进行初始化，得到初始聚类中心c_i(t)。

S504、根据所述初始聚类中心采用包含高斯核函数的模糊隶属度矩阵函数进行计算，得到与标准化矩阵对应的模糊隶属度矩阵；

具体而言，把初始聚类中心c_i(t)带入模糊隶属度矩阵公式计算得到与标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)。

模糊隶属度矩阵计算公式：

其中，u_ij(t+1)为此次计算后的模糊隶属度矩阵，u_ij(t)为此次计算前的模糊隶属度矩阵，m为大于1的实数，i为模糊隶属度矩阵的行数，j为模糊隶属度矩阵的列数，x_j为标准化矩阵中第j行的特征字段Y的特征值，K_G为高斯核函数，c为预设簇的数量。

对于高斯核函数K_G，对标准化矩阵中任一两行的向量x_i，x_j，则有：

其中，δ∈R²；在一个实施例中R为正无穷到负无穷的实数；在另一个实施例中R为0到10的实数，步长为0.01。

S506、根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心通过拉格朗日乘子法推导出的聚类中心的迭代公式进行计算，得到第一聚类中心；

具体而言，根据所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)、所述初始聚类中心c_i(t)通过拉格朗日乘子法推导出的聚类中心的迭代公式进行计算，得到第一聚类中心

拉格朗日乘子法推导出的计算第一聚类中心的迭代公式为：

其中，此次迭代后计算得到的c_i(t+1)即为

n为标准化矩阵的总行数，m为大于1的实数，u_ij为模糊隶属度矩阵，x_j为标准化矩阵中第j行的特征字段Y的特征值。

由于计算第一聚类中心的迭代公式中的高斯核函数K_G(x_j，c_i)中包含有聚类中心c_i分量，该c_i分量为此地迭代前的初始聚类中心c_i(t)，因此必须通过迭代来实现聚类中心c_i的更新。

S508、根据所述标准化矩阵对应的模糊隶属度矩阵、所述第一聚类中心进行计算，得到与第一聚类中心对应的第一目标函数值；

具体而言，根据所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)、所述第一聚类中心

代入目标函数值计算公式进行计算，得到与第一聚类中心

对应的第一目标函数值

第一目标函数值计算公式如下：

其中，U为隶属度矩阵，C为聚类中心，在高斯核函数中，σ越大则分离面越平滑，σ越小则分离面越细致，σ＝0.2，n为标准化矩阵的总行数，m为大于1的实数，u_ij为模糊隶属度矩阵，c_i为聚类中心，K_G为高斯核函数，c为预设簇的数量。

S510、根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心进行粒子群算法计算，得到第二聚类中心；

具体而言，根据所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)、所述初始聚类中心c_i(t)进行粒子群算法计算，得到第二聚类中心

基本PS0算法中每个粒子都是优化问题的一个可行解，由一个速度决定其更迭的方向和距离，结合粒子位置和飞行速度决定其下一代粒子位置，经过逐代搜索最后找到最优解，每次迭代中粒子根据自身极值pbest和全局极值gbest来修正自身飞行速度。其中自身pbest为粒子历代搜索得到的最优位置，全局gbest为全体粒子所搜索得到的最优位置。粒子的速度v_iq及粒子的位置c_iq更新公式分别为：

v_iq(t+1)＝wv_iq(t)+s₁r₁[p_iq(t)-c_iq(t)]+s₂r₂[g_ij(t)-c_iq(t)]

c_iq(t+1)＝c_iq(t)+v_iq(t+1)

其中，s₁与s₂为加速因子，取为正的常数，在本实施例中取值为2；r₁和r₂为0到1之间的随机数；w为惯性因子，在本实施例中取值为取值为0.5；且c_iq(t+1)为第t+1次的迭代聚类中心，其中q＝1，2，……，d，d∈R；p_iq(t)为自身极值pBest，g_ij(t)为全局极值gBest；在一个实施例中R为正无穷到负无穷的实数；在另一个实施例中R为0到10的实数，步长为0.01。

因此，把所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)、所述初始聚类中心c_i(t)代入上述公式计算得到第二聚类中心

S512、根据所述标准化矩阵对应的模糊隶属度矩阵、所述第二聚类中心进行计算，得到与第二聚类中心对应的第二目标函数值；

具体而言，根据所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)、所述第二聚类中心

进行计算，得到与第二聚类中心对应的第二目标函数值

第二目标函数值计算公式如下：

其中，U为隶属度矩阵，C为聚类中心。为了利用PSO算法(粒子群算法)求解MGKFCMS算法(高斯核函数K_G)，需要定义PSO算法适应度函数，即需要将MGKFCMS算法最小化目标函数转换为PSO算法的最大化适应度函数f(C)，最大化适应度函数f(C)可以从现有技术中选择，在此不作赘述。

粒子群算法计算聚类中心是在输入空间中对聚类中心c_i寻优，没有利用目标函数值计算公式对于

的梯度信息，而仅是在适应度函数f(C)的指引下修正迭代寻优路径和速度。

S514、根据所述第一目标函数值、所述第二目标函数值进行比较；

S516、当所述第一目标函数值小于等于所述第二目标函数值时，则把所述第一聚类中心作为迭代后的聚类中心，把所述第一目标函数值作为迭代后的目标函数值；

具体而言，当

时，

S518、当所述第一目标函数值大于所述第二目标函数值时，则把所述第二聚类中心作为迭代后的聚类中心，把所述第二目标函数值作为迭代后的目标函数值；

具体而言，当

时，

S520、获取预设的最小变化阀值；

所述预设的最小变化阀值可以是一个具体数值，比如0.001。可以理解的是，所述预设的最小变化阀值还可以根据迭代总次数设置，比如，迭代5000次以内则所述预设的最小变化阀值为0.002，迭代5000到10000次则所述预设的最小变化阀值为0.001，在此举例不作具体限定。

S522、获取迭代前的目标函数值；

具体而言，获取迭代前的目标函数值J_GKFCM(t)。

S524、根据所述迭代后的目标函数值、所述迭代前的目标函数值进行相减，得到目标函数值迭代差值；

具体而言，J_GKFCM(t+1)-J_GKFCM(t)的值即为目标函数值迭代差值。

S526、当所述目标函数值迭代差值大于所述预设的最小变化阀值时，把所述迭代后的聚类中心作为下一次迭代的初始聚类中心，把所述迭代后的目标函数值作为下一次迭代的迭代前的目标函数值把本次迭代得到的所述标准化矩阵对应的模糊隶属度矩阵作为下一次迭代的标准化矩阵，再次进行迭代执行步骤S504；

具体而言，当所述目标函数值迭代差值大于所述预设的最小变化阀值时，把所述迭代后的聚类中心c_i(t+1)作为下一次迭代的初始聚类中心，把所述迭代后的目标函数值J_GKFCM(t+1)作为下一次迭代的迭代前的目标函数值J_GKFCM(t)，把本次迭代得到的所述标准化矩阵对应的模糊隶属度矩阵u_ij(t+1)作为下一次迭代的标准化矩阵u_ij，再次进行迭代执行步骤S504。

S528、当所述目标函数值迭代差值小于等于所述预设的最小变化阀值时，则此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取迭代前的所述模糊隶属度矩阵，把迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

具体而言，当所述目标函数值迭代差值小于等于所述预设的最小变化阀值时，则此次迭代前的所述初始聚类中心c_i(t)作为与标准化矩阵对应的目标聚类中心，获取迭代前的所述模糊隶属度矩阵u_ij(t)，把迭代前的所述模糊隶属度矩阵u_ij(t)作为与标准化矩阵对应的目标隶属度矩阵。

本实施例引入了核密度函数来实现数据在高维空间的距离度量，为了简化推导过程，采用拉格朗日乘子法对包含高斯核函数的目标函数进行计算，最终得到迭代的聚类中心，隶属度矩阵，及迭代流程。由于迭代中心包含了梯度信息，在接近最优解的过程中可能会出现“之”字形搜素路径，通过利用粒子群算法(PSO)的高鲁棒性、广泛适用性和全局优化性计算出给定聚类中心和隶属度条件下的目标函数值，通过比较二者之间的大小确定新的聚类中心，提高了优化速度，可以有效地减小迭代次数。

如图6所示，在另一个实施例中，所述根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，具体包括：

S602、根据确定与所述预设簇的数量相同的初始聚类中心；

S604、根据所述初始聚类中心采用包含高斯核函数的模糊隶属度矩阵函数进行计算，得到与标准化矩阵对应的模糊隶属度矩阵；

S606、根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心通过拉格朗日乘子法推导出的聚类中心的迭代公式进行计算，得到第一聚类中心；

S606、根据所述标准化矩阵对应的模糊隶属度矩阵、所述第一聚类中心进行计算，得到与第一聚类中心对应的第一目标函数值；

S610、根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心进行粒子群算法计算，得到第二聚类中心；

S612、根据所述标准化矩阵对应的模糊隶属度矩阵、所述第二聚类中心进行计算，得到与第二聚类中心对应的第二目标函数值；

S614、根据所述第一目标函数值、所述第二目标函数值进行比较；

S616、当所述第一目标函数值小于等于所述第二目标函数值时，则把所述第一聚类中心作为迭代后的聚类中心，把所述第一目标函数值作为迭代后的目标函数值；

S618、当所述第一目标函数值大于所述第二目标函数值时，则把所述第二聚类中心作为迭代后的聚类中心，把所述第二目标函数值作为迭代后的目标函数值；

S620、获取预设迭代次数；

所述预设迭代次数是指预设一个迭代次数值用于控制迭代的总次数，从而提升本方法的效率。比如，所述预设迭代次数设置为1万次。

S622、当所述迭代总次数超过所述预设迭代次数时，则此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取此次迭代前的所述模糊隶属度矩阵，把此次迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

具体而言，当所述迭代总次数超过所述预设迭代次数时，则完成迭代。此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取此次迭代前的所述模糊隶属度矩阵，把此次迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

S624、当所述迭代总次数未超过所述预设迭代次数时，获取预设的最小变化阀值，获取迭代前的目标函数值，根据所述迭代后的目标函数值、所述迭代前的目标函数值进行相减，得到目标函数值迭代差值；

具体而言，当所述迭代总次数未超过所述预设迭代次数时，则再计算目标函数值迭代差值，根据目标函数值迭代差值判断是否进行下一次迭代。

S626、当所述目标函数值迭代差值大于所述预设的最小变化阀值时，把所述迭代后的聚类中心作为下一次迭代的初始聚类中心，把所述迭代后的目标函数值作为下一次迭代的迭代前的目标函数值把本次迭代得到的所述标准化矩阵对应的模糊隶属度矩阵作为下一次迭代的标准化矩阵，再次进行迭代执行步骤S604；

S628、当所述目标函数值迭代差值小于等于所述预设的最小变化阀值时，则此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取迭代前的所述模糊隶属度矩阵，把迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

如图7所示，在一个实施例中，提出了一种基于用户行为的消费提质方法，所述方法包括：

S702、获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；

S704、根据所述原始矩阵进行预处理，得到标准化矩阵；

S706、获取预设簇的数量，所述预设簇的数量为业务类型数量；

S708、根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵；

S710、根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心；

S712、根据所述与标准化矩阵对应的目标隶属度矩阵确定目标隶属度矩阵中每行元素的最大值；

比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，设与标准化矩阵对应的目标隶属度矩阵为u_ij，则u_ij对应的列数量为预设簇的数量共计5列，u_ij第一行元素的值为0.1，0.2，0.2，0.1，0.4则u_ij第一行的元素的最大值为第五列的0.4，u_ij第二行元素的值为0.1，0.35，0.2，0.1，0.25则u_ii第二行的元素的最大值为第二列的0.35，在此举例不作具体限定。

S714、根据所述目标隶属度矩阵中每行元素的最大值把所述隶属度矩阵的每行归类到所述目标隶属度矩阵中每行元素的最大值对应的列，得到每列的归类结果；

具体而言，根据所述目标隶属度矩阵中每行元素的最大值把所述目标隶属度矩阵中所有的行都归类到所述目标隶属度矩阵的其中一列。

比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，则u_ij对应的列数量为预设簇的数量共计5列，则把u_ij中所有行归类到5列中的其中一列，u_ij第一行的元素的最大值为第五列的元素的值则把第一行归类到第五列；则u_ij第二行的元素的最大值为第二列的元素的值则把第二行归类到第二列，在此举例不作具体限定。

S716、根据所述每列的归类结果、所述标准化矩阵的每行的当前业务类型进行计算，得到每列的归类结果中当前业务类型分布比例；

比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，则u_ij对应的列数量为预设簇的数量共计5列，每行对应一个用户，其中50行归类到了第一列，归类到第一列的用户中用户当前业务类型(即话费套餐)分布如下：35元话费套餐5人、58元话费套餐10人、88元话费套餐8人、128元话费套餐25人、158元话费套餐2人，则第一列的归类结果中当前业务类型分布比例为：35元话费套餐5人比例为10％(5/50＝10％)、58元话费套餐10人比例为20％(10/50＝20％)、88元话费套餐8人比例为16％(8/50＝10％)、128元话费套餐25人比例为50％(25/50＝50％)、158元话费套餐2人比例为4％(2/50＝4％)，在此举例不作具体限定。

S718、根据所述每列的归类结果中当前业务类型分布比例确定每列的归类结果中当前业务类型占比最大的业务类型；

比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，则u_ij对应的列数量为预设簇的数量共计5列，每行对应一个用户，其中50行归类到了第一列，第一列的当前业务类型分布比例为：35元话费套餐5人比例为10％(5/50＝10％)、58元话费套餐10人比例为20％(10/50＝20％)、88元话费套餐8人比例为16％(8/50＝10％)、128元话费套餐25人比例为50％(25/50＝50％)、158元话费套餐2人比例为4％(2/50＝4％)，则第一列的归类结果中当前业务类型占比最大的业务类型为128元话费套餐25人比例为50％(25/50＝50％)，在此举例不作具体限定。

S720、根据每列的归类结果中当前业务类型占比最大的业务类型确定每列的归类结果中对应的行的消费提质的目标业务类型。

比如，电信业务中的话费套餐包括35元、58元、88元、128元、158元共计5个业务类型则预设簇的数量为5个，则u_ij对应的列数量为预设簇的数量共计5列，每行对应一个用户，其中50行归类到了第一列，第一列的当前业务类型分布比例为：35元话费套餐5人比例为10％(5/50＝10％)、58元话费套餐10人比例为20％(10/50＝20％)、88元话费套餐8人比例为16％(8/50＝10％)、128元话费套餐25人比例为50％(25/50＝50％)、158元话费套餐2人比例为4％(2/50＝4％)，则第一列的归类结果中当前业务类型占比最大的业务类型为128元话费套餐25人比例为50％(25/50＝50％)，则归类到第一列的50行对应的用户消费提质的目标业务类型为128元话费套餐。通过数据挖掘确定消费提质的目标业务类型，可以直观的指导营销人员的营销工作，从而提高了营销的精准性。

在一个实施例中，在所述根据每列的归类结果中当前业务类型占比最大的业务类型确定每列的归类结果中对应的行的消费提质的目标业务类型之后，还包括：从所述标准化矩阵中取出该用户的当前业务类型；根据当前业务类型与消费提质的目标业务类型的差距确定消费提质的难度。从而有利于根据目标业务类型、消费提质的难度进行营销人员任务分配，从而提高了营销的精准性和营销人员资源的最优化，进一步提高了消费提质的成功率。

在一个实施例中，在所述根据每列的归类结果中当前业务类型占比最大的业务类型确定每列的归类结果中对应的行的消费提质的目标业务类型之后，还包括：根据所述标准化矩阵中用户的当前业务类型、所述消费提质的目标业务类型确定用户的消费提质方式；当所述当前业务类型大于所述消费提质的目标业务类型时，则把该用户归类到需稳固客户列表；当所述当前业务类型不大于所述消费提质的目标业务类型时，则把该用户归类到需提质客户列表。可以根据需提质客户列表进行提质营销，可以根据需稳固客户列表及时采取相关服务和营销策略确保客户不降质，从而提高了营销的精准性和营销人员资源的最优化，进一步提高了消费提质的成功率。

如图8所示，在一个实施例中，提出了一种基于用户行为的消费提质装置，所述装置包括：

原始矩阵建立模块801，用于获取用户数据，根据用户数据建立原始矩阵，所述用户数据包括用户身份数据、用户行为数据；

预处理模块802，用于根据所述原始矩阵进行预处理，得到标准化矩阵；

隶属度矩阵确定模块803，用于获取预设簇的数量，所述预设簇的数量为业务类型数量，根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵，根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心。

在一个实施例中，所述装置还包括：

消费提质目标确定模块804，用于根据所述标准化矩阵、所述标准化矩阵对应的目标隶属度矩阵确定用户当前业务类型匹配度，根据所述用户当前业务类型匹配度、所述标准化矩阵对应的目标隶属度矩阵确定消费提质的目标业务类型。存量用户的用户数据的数据挖掘结果包括标准化矩阵、与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，营销人员只需要根据标准化矩阵中用户当前的业务类型、经过优化计算得出的目标隶属度矩阵中用户在各业务类型的隶属度即可简要快速明确消费提质的目标业务类型。

图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是服务器和终端设备，所述服务器包括但不限于高性能计算机和高性能计算机集群；所述终端设备包括但不限于移动终端设备和台式终端设备，所述移动终端设备包括但不限于手机、平板电脑、智能手表和笔记本电脑，所述台式终端设备包括但不限于台式电脑和车载电脑。如图9所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现一种基于用户行为的消费提质方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行一种基于用户行为的消费提质方法。本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的一种基于用户行为的消费提质方法可以实现为一种计算机程序的形式，计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成的一种基于用户行为的消费提质装置的各个程序模板。比如，原始矩阵建立模块801、预处理模块802、隶属度矩阵确定模块803、消费提质目标确定模块804。

在一个实施例中，提出了一种存储介质，存储有计算机指令程序，所述计算机指令程序被处理器执行时，使得所述处理器执行时实现如下步骤：

根据所述原始矩阵进行预处理，得到标准化矩阵；

获取预设簇的数量，所述预设簇的数量为业务类型数量；

在一个实施例中，提出了一种计算机设备，包括至少一个存储器、至少一个处理器，所述存储器存储有计算机指令程序，所述计算机指令程序被所述处理器执行时，使得所述处理器执行时实现如下步骤：

根据所述原始矩阵进行预处理，得到标准化矩阵；

获取预设簇的数量，所述预设簇的数量为业务类型数量；

需要说明的是，上述一种基于用户行为的消费提质方法、一种基于用户行为的消费提质装置、存储介质及计算机设备属于一个总的发明构思，一种基于用户行为的消费提质方法、一种基于用户行为的消费提质装置、存储介质及计算机设备实施例中的内容可相互适用。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于用户行为的消费提质方法，所述方法包括：

根据所述原始矩阵进行预处理，得到标准化矩阵；

获取预设簇的数量，所述预设簇的数量为业务类型数量；

2.根据权利要求1所述的方法，其特征在于，所述根据所述原始矩阵进行预处理，得到标准化矩阵，具体包括：

根据所述原始矩阵进行空值和异常值清洗，得清洗后的用户数据矩阵；

根据所述清洗后的用户数据矩阵进行整合，得到整合后的用户数据矩阵；

根据所述整合后的用户数据矩阵进行用户行为数据对应特征字段的选择，得到标准化矩阵。

3.根据权利要求2所述的方法，其特征在于，所述根据所述整合后的用户数据矩阵进行用户行为数据对应特征字段的选择，得到标准化矩阵，具体包括：

根据所述整合后的用户数据矩阵采用协方差进行计算，得到与用户行为数据对应的特征字段之间的相关系数；

根据所述用户行为数据对应的特征字段之间的相关系数进行特征字段排序；

根据特征字段排序结果按预设数量选择排名靠前的特征字段及对应的用户行为数据作为标准化矩阵。

4.根据权利要求1所述的方法，其特征在于，所述根据所述标准化矩阵、所述预设簇的数量得到初始隶属度矩阵，具体包括：

将所述预设簇的数量作为所述初始隶属度矩阵的列数，将所述标准化矩阵的行数作为所述初始隶属度矩阵的行数；

对所述初始隶属度矩阵中每个元素的值初始化为介于0至1的任意值，且使所述初始隶属度矩阵每行的元素的值之和等于1。

5.根据权利要求1所述的方法，其特征在于，所述根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心，具体包括：

根据确定与所述预设簇的数量相同的初始聚类中心；

根据所述初始聚类中心采用包含高斯核函数的模糊隶属度矩阵函数进行计算，得到与标准化矩阵对应的模糊隶属度矩阵；

根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心通过拉格朗日乘子法推导出的聚类中心的迭代公式进行计算，得到第一聚类中心；

根据所述标准化矩阵对应的模糊隶属度矩阵、所述第一聚类中心进行计算，得到与第一聚类中心对应的第一目标函数值；

根据所述标准化矩阵对应的模糊隶属度矩阵、所述初始聚类中心进行粒子群算法计算，得到第二聚类中心；

根据所述标准化矩阵对应的模糊隶属度矩阵、所述第二聚类中心进行计算，得到与第二聚类中心对应的第二目标函数值；

根据所述第一目标函数值、所述第二目标函数值进行比较；

当所述第一目标函数值小于等于所述第二目标函数值时，则把所述第一聚类中心作为迭代后的聚类中心，把所述第一目标函数值作为迭代后的目标函数值；

当所述第一目标函数值大于所述第二目标函数值时，则把所述第二聚类中心作为迭代后的聚类中心，把所述第二目标函数值作为迭代后的目标函数值；

获取预设的最小变化阀值；

获取迭代前的目标函数值；

根据所述迭代后的目标函数值、所述迭代前的目标函数值进行相减，得到目标函数值迭代差值；

当所述目标函数值迭代差值大于所述预设的最小变化阀值时，把所述迭代后的聚类中心作为下一次迭代的初始聚类中心，把所述迭代后的目标函数值作为下一次迭代的迭代前的目标函数值把本次迭代得到的所述标准化矩阵对应的模糊隶属度矩阵作为下一次迭代的标准化矩阵，再次进行迭代执行所述根据所述标准化矩阵、所述初始聚类中心采用包含高斯核函数的模糊隶属度矩阵函数进行计算，得到与标准化矩阵对应的模糊隶属度矩阵；

当所述目标函数值迭代差值小于等于所述预设的最小变化阀值时，则此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取迭代前的所述模糊隶属度矩阵，把迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

6.根据权利要求5所述的方法，其特征在于，所述当所述第一目标函数值大于所述第二目标函数值时，则把所述第二聚类中心作为迭代后的聚类中心，把所述第二目标函数值作为迭代后的目标函数值之后，还包括：

获取预设迭代次数；

当所述迭代总次数超过所述预设迭代次数时，则此次迭代前的所述初始聚类中心作为与标准化矩阵对应的目标聚类中心，获取此次迭代前的所述模糊隶属度矩阵，把此次迭代前的所述模糊隶属度矩阵作为与标准化矩阵对应的目标隶属度矩阵。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述根据所述标准化矩阵、所述初始隶属度矩阵优化计算得到与标准化矩阵对应的目标隶属度矩阵及目标聚类中心之后，还包括：

根据所述与标准化矩阵对应的目标隶属度矩阵确定目标隶属度矩阵中每行元素的最大值；

根据所述目标隶属度矩阵中每行元素的最大值把所述隶属度矩阵的每行归类到所述目标隶属度矩阵中每行元素的最大值对应的列，得到每列的归类结果；

根据所述每列的归类结果、所述标准化矩阵的每行的当前业务类型进行计算，得到每列的归类结果中当前业务类型分布比例；

根据所述每列的归类结果中当前业务类型分布比例确定每列的归类结果中当前业务类型占比最大的业务类型；

根据每列的归类结果中当前业务类型占比最大的业务类型确定每列的归类结果中对应的行的消费提质的目标业务类型。

8.一种基于用户行为的消费提质装置，其特征在于，所述装置包括：

9.一种存储介质，存储有计算机指令程序，其特征在于，所述计算机指令程序被处理器执行时，使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。

10.一种计算机设备，其特征在于，包括至少一个存储器、至少一个处理器，所述存储器存储有计算机指令程序，所述计算机指令程序被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。