CN112906960A

CN112906960A - 一种非契约客户流失预测方法及系统

Info

Publication number: CN112906960A
Application number: CN202110171347.2A
Authority: CN
Inventors: 夏国恩; 彭伟; 柯利佳
Original assignee: Guangxi Zhihuijia Human Resources Co ltd
Current assignee: Guangxi Zhihuijia Human Resources Co ltd
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2021-06-04

Abstract

本发明提供一种非契约客户流失预测方法及系统，通过获取非契约客户的原始数据；进而对非契约客户的原始数据进行清洗，获得待约简数据；针对待约简数据进行属性约简处理，获得约简属性集；再根据约简属性集构建至少两个子分类器模型；针对至少两个子分类器模型进行线性集成，获得预测模型；基于预测模型输出预测结果，首先通过将多个子分类器模型进行线性集成，进而降低了单个子分类器模型的泛化误差，从而提高每个子分类器模型性能，同时减少训练时间，提高预测精度。

Description

一种非契约客户流失预测方法及系统

技术领域

本发明涉及客户流失预测领域，具体涉及一种非契约客户流失预测方法及系统。

背景技术

根据企业与客户在交易的过程中是否订立契约，可以将客户流失分为两大类：契约关系的客户流失和非契约关系的客户流失。在非契约关系中，商家与客户关系是伴随着客户的初次交易行为而开始的。客户与商家之间不需要签订合约，商家对客户的约束力较弱，客户可以随意的开始和中置商业行为，客户的购买行为和流失行为的不确定性非常大。网络客户作为一种典型的非契约型客户。其具有随机性、广泛性、转移成本低等诸多特点。因此，针对网络客户，确定保持策略，同时分析网络客户特征，对潜在流失客户进行识别和预测是当前网络客户管理和商务智能的重要研究问题。

而现有技术，以统计学方法、传统智能方法、统计学习方法、集成学习方法等为基础，其预测模型通常是针对契约客户流失进行预测。然而，由于非契约客户具备大数据特性。其采用现有针对契约客户的方式进行流失预测，往往会降低计算的准确性。

发明内容

本发明提供一种非契约客户流失预测方法及系统，用于降低预测时间，提高预测精度。

本发明第一个方面提供一种非契约客户流失预测方法，包括：

获取非契约客户的原始数据；

对所述非契约客户的原始数据进行清洗，获得待约简数据；

针对所述待约简数据进行属性约简处理，获得约简属性集；

根据所述约简属性集构建至少两个子分类器模型；

针对所述至少两个子分类器模型进行线性集成，获得预测模型；

基于所述预测模型输出预测结果。

可选地，所述对所述非契约客户的原始数据进行清洗，获得待约简数据，具体包括：

根据自组织特征映射网络对所述非契约客户的原始数据的连续属性值进行离散化处理，获得所述待约简数据。

可选地，所述至少两个子分类器模型包含第一子分类器模型、第二子分类器模型、第三子分类器模型以及第四子分类器模型。

可选地，所述第一子分类器模型的计算公式：

其中，所述x_i为输入结点；所述y_l为输出结点；所述w_ji和所述θ_j为输入层与隐层结点间的网络权值和阀值；所述v_lj和所述θ_l为隐层结点与输出层结点间的网络权值和阀值。

可选地，所述第二子分类器模型的计算公式：

其中，所述i＝1,2,…,h，所述h为隐含层的结点数；所述j＝1,2,…,n，n为输出层结点数；所述

为第p个输入样本；所述p＝1,2,…,P，所述P为样本总数；所述c_i为网络隐含层结点的中心；所述w_ij为隐含层到输出层的连接权值；所述σ为高斯函数的方差；所述y_j为第j个结点的实际输出。

可选地，所述第三子分类器模型的计算公式：

y(k)＝g(w³x(k))

x(k)＝f(w¹x_c(k)+w²(u(k-1)))

x_c(k)＝x(k-1)

其中，y,x,u,x_c分别表示m维输出结点向量，所述n维中间层结点单元向量，所述r维输入向量和n维反馈状态向量；所述w³,w²,w¹分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值；所述g(·)为输出神经元的传递函数，是中间层输出的线性组合；所述f(·)为中间层神经元的传递函数。

可选地，所述第四子分类器模型的计算公式：

其中，所述n为样本容量；所述σ为高斯函数的宽度系数；所述

为条件均值。

可选地，所述预测模型的表达式为：

其中，所述

为集成模型对第i个客户的组合预测值；所述y_ik为第k个子分类器模型对第i个客户的预测值，所述k＝1,2,…,K；w_k为模型集成中第k个子分类器模型的权重系数。

本发明第二个方面提供一种非契约客户流失预测系统，其特征在于，包括：

获取模块，用于获取非契约客户的原始数据；

清洗模块，用于对所述非契约客户的原始数据进行清洗，获得待约简数据；

预处理模块，用于针对所述待约简数据进行属性约简处理，获得约简属性集；

建模模块，用于根据所述约简属性集构建至少两个子分类器模型；针对所述至少两个子分类器模型进行线性集成，获得预测模型；

预测模块，用于基于所述预测模型输出预测结果。

本发明实施例提供的非契约客户流失预测方法及系统，通过获取非契约客户的原始数据；进而对非契约客户的原始数据进行清洗，获得待约简数据；针对待约简数据进行属性约简处理，获得约简属性集；再根据约简属性集构建至少两个子分类器模型；针对至少两个子分类器模型进行线性集成，获得预测模型；基于预测模型输出预测结果，首先通过将多个子分类器模型进行线性集成，进而降低了单个子分类器模型的泛化误差，从而提高每个子分类器模型性能，同时减少训练时间，提高预测精度。

附图说明

图1为本发明实施例提供的一种非契约客户流失预测方法的流程示意图；

图2为本发明实施例提供的一种非契约客户流失预测系统的示意图。

具体实施方式

图1为本发明实施例提供的一种非契约客户流失预测方法的流程示意图，参见图1，该方法流程包括：

步骤100、获取非契约客户的原始数据；

步骤101、对非契约客户的原始数据进行清洗，获得待约简数据；

步骤102、针对待约简数据进行属性约简处理，获得约简属性集；

步骤103、根据约简属性集构建至少两个子分类器模型；

步骤104、针对至少两个子分类器模型进行线性集成，获得预测模型；

步骤105、基于预测模型输出预测结果。

本发明实施例提供的非契约客户流失预测方法，通过获取非契约客户的原始数据；进而对非契约客户的原始数据进行清洗，获得待约简数据；针对待约简数据进行属性约简处理，获得约简属性集；再根据约简属性集构建至少两个子分类器模型；针对至少两个子分类器模型进行线性集成，获得预测模型；基于预测模型输出预测结果，首先通过将多个子分类器模型进行线性集成，进而降低了单个子分类器模型的泛化误差，从而提高每个子分类器模型性能，同时减少训练时间，提高预测精度。

可选的，由于非契约客户的原始数据来源众多，属性复杂。在一些属性之间存在共线性或彼此相关。为了避免其对于预测结果的不利影响。需要在构建模型前，针对不同系统的属性进行约简，下面给出步骤101的一种可能的实现方式：

步骤101a、根据自组织特征映射网络对非契约客户的原始数据的连续属性值进行离散化处理，获得待约简数据。

利用该自组织特征映射网络可以有效避免离散的随意性。

为了降低组成网络的差异性，增强集成模型的集成效果，本发明实施例选择不同种类的神经网络作为子分类器的建模技术，相应的，步骤103中涉及的至少两个子分类器模型包含第一子分类器模型、第二子分类器模型、第三子分类器模型以及第四子分类器模型。

可选的，第一子分类器模型的计算公式：

其中，x_i为输入结点；y_l为输出结点；w_ji和θ_j为输入层与隐层结点间的网络权值和阀值；v_lj和θ_l为隐层结点与输出层结点间的网络权值和阀值。

可选的，第二子分类器模型的计算公式：

其中，i＝1,2,…,h，h为隐含层的结点数；j＝1,2,…,n，n为输出层结点数；

为第p个输入样本；p＝1,2,…,P，P为样本总数；c_i为网络隐含层结点的中心；w_ij为隐含层到输出层的连接权值；σ为高斯函数的方差；y_j为第j个结点的实际输出。

可选的，第三子分类器模型的计算公式：

y(k)＝g(w³x(k))

x(k)＝f(w¹x_c(k)+w²(u(k-1)))

x_c(k)＝x(k-1)

其中，y,x,u,x_c分别表示m维输出结点向量，n维中间层结点单元向量，r维输入向量和n维反馈状态向量；w³,w²,w¹分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值；g(·)为输出神经元的传递函数，是中间层输出的线性组合；f(·)为中间层神经元的传递函数。

可选的，第四子分类器模型的计算公式：

其中，n为样本容量；σ为高斯函数的宽度系数；

为条件均值。

进而基于上述各子分类器模型，步骤104红红集成后的预测模型的表达式为：

其中，

为集成模型对第i个客户的组合预测值；y_ik为第k个子分类器模型对第i个客户的预测值，k＝1,2,…,K；w_k为模型集成中第k个子分类器模型的权重系数。

为了执行上述步骤，下面给出一种非契约客户流失预测系统的实现方式，图2为本发明实施例提供的一种非契约客户流失预测系统的示意图，参见图2，该系统包括：

获取模块20，用于获取非契约客户的原始数据；

清洗模块21，用于对非契约客户的原始数据进行清洗，获得待约简数据；

预处理模块22，用于针对待约简数据进行属性约简处理，获得约简属性集；

建模模块23，用于根据约简属性集构建至少两个子分类器模型；针对至少两个子分类器模型进行线性集成，获得预测模型；

预测模块24，用于基于预测模型输出预测结果。

本发明实施例提供的非契约客户流失预测系统，通过获取模块获取非契约客户的原始数据；进而清洗模块对非契约客户的原始数据进行清洗，获得待约简数据；预处理模块针对待约简数据进行属性约简处理，获得约简属性集；从而使得建模模块根据约简属性集构建至少两个子分类器模型；并针对至少两个子分类器模型进行线性集成，获得预测模型；最终预测模块基于预测模型输出预测结果。首先通过将多个子分类器模型进行线性集成，进而降低了单个子分类器模型的泛化误差，从而提高每个子分类器模型性能，同时减少训练时间，提高预测精度。

可选的，该系统可以通过一个实体设备实现，也可以通过分布式系统实现，即通过具备计算、存储以及通讯功能的多个设备节点组成的集群实现上述系统的功能。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。