CN112906960A - 一种非契约客户流失预测方法及系统 - Google Patents
一种非契约客户流失预测方法及系统 Download PDFInfo
- Publication number
- CN112906960A CN112906960A CN202110171347.2A CN202110171347A CN112906960A CN 112906960 A CN112906960 A CN 112906960A CN 202110171347 A CN202110171347 A CN 202110171347A CN 112906960 A CN112906960 A CN 112906960A
- Authority
- CN
- China
- Prior art keywords
- sub
- model
- contractual
- classifier
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000004140 cleaning Methods 0.000 claims abstract description 15
- 230000010354 integration Effects 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 210000004205 output neuron Anatomy 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007636 ensemble learning method Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种非契约客户流失预测方法及系统,通过获取非契约客户的原始数据;进而对非契约客户的原始数据进行清洗,获得待约简数据;针对待约简数据进行属性约简处理,获得约简属性集;再根据约简属性集构建至少两个子分类器模型;针对至少两个子分类器模型进行线性集成,获得预测模型;基于预测模型输出预测结果,首先通过将多个子分类器模型进行线性集成,进而降低了单个子分类器模型的泛化误差,从而提高每个子分类器模型性能,同时减少训练时间,提高预测精度。
Description
技术领域
本发明涉及客户流失预测领域,具体涉及一种非契约客户流失预测方法及系统。
背景技术
根据企业与客户在交易的过程中是否订立契约,可以将客户流失分为两大类:契约关系的客户流失和非契约关系的客户流失。在非契约关系中,商家与客户关系是伴随着客户的初次交易行为而开始的。客户与商家之间不需要签订合约,商家对客户的约束力较弱,客户可以随意的开始和中置商业行为,客户的购买行为和流失行为的不确定性非常大。网络客户作为一种典型的非契约型客户。其具有随机性、广泛性、转移成本低等诸多特点。因此,针对网络客户,确定保持策略,同时分析网络客户特征,对潜在流失客户进行识别和预测是当前网络客户管理和商务智能的重要研究问题。
而现有技术,以统计学方法、传统智能方法、统计学习方法、集成学习方法等为基础,其预测模型通常是针对契约客户流失进行预测。然而,由于非契约客户具备大数据特性。其采用现有针对契约客户的方式进行流失预测,往往会降低计算的准确性。
发明内容
本发明提供一种非契约客户流失预测方法及系统,用于降低预测时间,提高预测精度。
本发明第一个方面提供一种非契约客户流失预测方法,包括:
获取非契约客户的原始数据;
对所述非契约客户的原始数据进行清洗,获得待约简数据;
针对所述待约简数据进行属性约简处理,获得约简属性集;
根据所述约简属性集构建至少两个子分类器模型;
针对所述至少两个子分类器模型进行线性集成,获得预测模型;
基于所述预测模型输出预测结果。
可选地,所述对所述非契约客户的原始数据进行清洗,获得待约简数据,具体包括:
根据自组织特征映射网络对所述非契约客户的原始数据的连续属性值进行离散化处理,获得所述待约简数据。
可选地,所述至少两个子分类器模型包含第一子分类器模型、第二子分类器模型、第三子分类器模型以及第四子分类器模型。
可选地,所述第一子分类器模型的计算公式:
其中,所述xi为输入结点;所述yl为输出结点;所述wji和所述θj为输入层与隐层结点间的网络权值和阀值;所述vlj和所述θl为隐层结点与输出层结点间的网络权值和阀值。
可选地,所述第二子分类器模型的计算公式:
其中,所述i=1,2,…,h,所述h为隐含层的结点数;所述j=1,2,…,n,n为输出层结点数;所述为第p个输入样本;所述p=1,2,…,P,所述P为样本总数;所述ci为网络隐含层结点的中心;所述wij为隐含层到输出层的连接权值;所述σ为高斯函数的方差;所述yj为第j个结点的实际输出。
可选地,所述第三子分类器模型的计算公式:
y(k)=g(w3x(k))
x(k)=f(w1xc(k)+w2(u(k-1)))
xc(k)=x(k-1)
其中,y,x,u,xc分别表示m维输出结点向量,所述n维中间层结点单元向量,所述r维输入向量和n维反馈状态向量;所述w3,w2,w1分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值;所述g(·)为输出神经元的传递函数,是中间层输出的线性组合;所述f(·)为中间层神经元的传递函数。
可选地,所述第四子分类器模型的计算公式:
可选地,所述预测模型的表达式为:
本发明第二个方面提供一种非契约客户流失预测系统,其特征在于,包括:
获取模块,用于获取非契约客户的原始数据;
清洗模块,用于对所述非契约客户的原始数据进行清洗,获得待约简数据;
预处理模块,用于针对所述待约简数据进行属性约简处理,获得约简属性集;
建模模块,用于根据所述约简属性集构建至少两个子分类器模型;针对所述至少两个子分类器模型进行线性集成,获得预测模型;
预测模块,用于基于所述预测模型输出预测结果。
本发明实施例提供的非契约客户流失预测方法及系统,通过获取非契约客户的原始数据;进而对非契约客户的原始数据进行清洗,获得待约简数据;针对待约简数据进行属性约简处理,获得约简属性集;再根据约简属性集构建至少两个子分类器模型;针对至少两个子分类器模型进行线性集成,获得预测模型;基于预测模型输出预测结果,首先通过将多个子分类器模型进行线性集成,进而降低了单个子分类器模型的泛化误差,从而提高每个子分类器模型性能,同时减少训练时间,提高预测精度。
附图说明
图1为本发明实施例提供的一种非契约客户流失预测方法的流程示意图;
图2为本发明实施例提供的一种非契约客户流失预测系统的示意图。
具体实施方式
图1为本发明实施例提供的一种非契约客户流失预测方法的流程示意图,参见图1,该方法流程包括:
步骤100、获取非契约客户的原始数据;
步骤101、对非契约客户的原始数据进行清洗,获得待约简数据;
步骤102、针对待约简数据进行属性约简处理,获得约简属性集;
步骤103、根据约简属性集构建至少两个子分类器模型;
步骤104、针对至少两个子分类器模型进行线性集成,获得预测模型;
步骤105、基于预测模型输出预测结果。
本发明实施例提供的非契约客户流失预测方法,通过获取非契约客户的原始数据;进而对非契约客户的原始数据进行清洗,获得待约简数据;针对待约简数据进行属性约简处理,获得约简属性集;再根据约简属性集构建至少两个子分类器模型;针对至少两个子分类器模型进行线性集成,获得预测模型;基于预测模型输出预测结果,首先通过将多个子分类器模型进行线性集成,进而降低了单个子分类器模型的泛化误差,从而提高每个子分类器模型性能,同时减少训练时间,提高预测精度。
可选的,由于非契约客户的原始数据来源众多,属性复杂。在一些属性之间存在共线性或彼此相关。为了避免其对于预测结果的不利影响。需要在构建模型前,针对不同系统的属性进行约简,下面给出步骤101的一种可能的实现方式:
步骤101a、根据自组织特征映射网络对非契约客户的原始数据的连续属性值进行离散化处理,获得待约简数据。
利用该自组织特征映射网络可以有效避免离散的随意性。
为了降低组成网络的差异性,增强集成模型的集成效果,本发明实施例选择不同种类的神经网络作为子分类器的建模技术,相应的,步骤103中涉及的至少两个子分类器模型包含第一子分类器模型、第二子分类器模型、第三子分类器模型以及第四子分类器模型。
可选的,第一子分类器模型的计算公式:
其中,xi为输入结点;yl为输出结点;wji和θj为输入层与隐层结点间的网络权值和阀值;vlj和θl为隐层结点与输出层结点间的网络权值和阀值。
可选的,第二子分类器模型的计算公式:
其中,i=1,2,…,h,h为隐含层的结点数;j=1,2,…,n,n为输出层结点数;为第p个输入样本;p=1,2,…,P,P为样本总数;ci为网络隐含层结点的中心;wij为隐含层到输出层的连接权值;σ为高斯函数的方差;yj为第j个结点的实际输出。
可选的,第三子分类器模型的计算公式:
y(k)=g(w3x(k))
x(k)=f(w1xc(k)+w2(u(k-1)))
xc(k)=x(k-1)
其中,y,x,u,xc分别表示m维输出结点向量,n维中间层结点单元向量,r维输入向量和n维反馈状态向量;w3,w2,w1分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值;g(·)为输出神经元的传递函数,是中间层输出的线性组合;f(·)为中间层神经元的传递函数。
可选的,第四子分类器模型的计算公式:
进而基于上述各子分类器模型,步骤104红红集成后的预测模型的表达式为:
为了执行上述步骤,下面给出一种非契约客户流失预测系统的实现方式,图2为本发明实施例提供的一种非契约客户流失预测系统的示意图,参见图2,该系统包括:
获取模块20,用于获取非契约客户的原始数据;
清洗模块21,用于对非契约客户的原始数据进行清洗,获得待约简数据;
预处理模块22,用于针对待约简数据进行属性约简处理,获得约简属性集;
建模模块23,用于根据约简属性集构建至少两个子分类器模型;针对至少两个子分类器模型进行线性集成,获得预测模型;
预测模块24,用于基于预测模型输出预测结果。
本发明实施例提供的非契约客户流失预测系统,通过获取模块获取非契约客户的原始数据;进而清洗模块对非契约客户的原始数据进行清洗,获得待约简数据;预处理模块针对待约简数据进行属性约简处理,获得约简属性集;从而使得建模模块根据约简属性集构建至少两个子分类器模型;并针对至少两个子分类器模型进行线性集成,获得预测模型;最终预测模块基于预测模型输出预测结果。首先通过将多个子分类器模型进行线性集成,进而降低了单个子分类器模型的泛化误差,从而提高每个子分类器模型性能,同时减少训练时间,提高预测精度。
可选的,该系统可以通过一个实体设备实现,也可以通过分布式系统实现,即通过具备计算、存储以及通讯功能的多个设备节点组成的集群实现上述系统的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种非契约客户流失预测方法,其特征在于,包括:
获取非契约客户的原始数据;
对所述非契约客户的原始数据进行清洗,获得待约简数据;
针对所述待约简数据进行属性约简处理,获得约简属性集;
根据所述约简属性集构建至少两个子分类器模型;
针对所述至少两个子分类器模型进行线性集成,获得预测模型;
基于所述预测模型输出预测结果。
2.根据权利要求1所述的非契约客户流失预测方法,其特征在于,所述对所述非契约客户的原始数据进行清洗,获得待约简数据,具体包括:
根据自组织特征映射网络对所述非契约客户的原始数据的连续属性值进行离散化处理,获得所述待约简数据。
3.根据权利要求2所述的非契约客户流失预测方法,其特征在于,所述至少两个子分类器模型包含第一子分类器模型、第二子分类器模型、第三子分类器模型以及第四子分类器模型。
6.根据权利要求3所述的非契约客户流失预测方法,其特征在于,所述第三子分类器模型的计算公式:
y(k)=g(w3x(k))
x(k)=f(w1xc(k)+w2(u(k-1)))
xc(k)=x(k-1)
其中,y,x,u,xc分别表示m维输出结点向量,所述n维中间层结点单元向量,所述r维输入向量和n维反馈状态向量;所述w3,w2,w1分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值;所述g(·)为输出神经元的传递函数,是中间层输出的线性组合;所述f(·)为中间层神经元的传递函数。
9.一种非契约客户流失预测系统,其特征在于,包括:
获取模块,用于获取非契约客户的原始数据;
清洗模块,用于对所述非契约客户的原始数据进行清洗,获得待约简数据;
预处理模块,用于针对所述待约简数据进行属性约简处理,获得约简属性集;
建模模块,用于根据所述约简属性集构建至少两个子分类器模型;针对所述至少两个子分类器模型进行线性集成,获得预测模型;
预测模块,用于基于所述预测模型输出预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110171347.2A CN112906960A (zh) | 2021-02-04 | 2021-02-04 | 一种非契约客户流失预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110171347.2A CN112906960A (zh) | 2021-02-04 | 2021-02-04 | 一种非契约客户流失预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112906960A true CN112906960A (zh) | 2021-06-04 |
Family
ID=76123966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110171347.2A Pending CN112906960A (zh) | 2021-02-04 | 2021-02-04 | 一种非契约客户流失预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906960A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108199928A (zh) * | 2018-02-01 | 2018-06-22 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测方法及系统 |
CN108876034A (zh) * | 2018-06-13 | 2018-11-23 | 重庆邮电大学 | 一种改进的Lasso+RBF神经网络组合预测模型 |
CN109886758A (zh) * | 2019-03-13 | 2019-06-14 | 中南大学 | 一种基于组合分类器的客户流失预测模型 |
CN110309609A (zh) * | 2019-07-06 | 2019-10-08 | 桂林电子科技大学 | 一种基于粗糙集和小波神经网络的建筑室内空气品质评价方法 |
CN110415013A (zh) * | 2019-06-12 | 2019-11-05 | 河海大学 | 一种网约车短时出行需求的组合预测方法 |
-
2021
- 2021-02-04 CN CN202110171347.2A patent/CN112906960A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108199928A (zh) * | 2018-02-01 | 2018-06-22 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测方法及系统 |
CN108876034A (zh) * | 2018-06-13 | 2018-11-23 | 重庆邮电大学 | 一种改进的Lasso+RBF神经网络组合预测模型 |
CN109886758A (zh) * | 2019-03-13 | 2019-06-14 | 中南大学 | 一种基于组合分类器的客户流失预测模型 |
CN110415013A (zh) * | 2019-06-12 | 2019-11-05 | 河海大学 | 一种网约车短时出行需求的组合预测方法 |
CN110309609A (zh) * | 2019-07-06 | 2019-10-08 | 桂林电子科技大学 | 一种基于粗糙集和小波神经网络的建筑室内空气品质评价方法 |
Non-Patent Citations (3)
Title |
---|
人工智能西瓜书: "人工智能西瓜书学习笔记(五)——神经网络", HTTPS://BLOG.CSDN.NET/QQ_40851744/ARTICLE/DETAILS/102818143, pages 1 - 12 * |
杨小辉等: "广义回归神经网络(GRNN)在AMT 挡位判别中的应用", 机械设计与制造, pages 72 - 74 * |
王洪德等: "矿井通风系统可靠性分析与实践", 30 November 2013, 西北工业大学出版社, pages: 125 - 126 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582538B (zh) | 一种基于图神经网络的社群价值预测方法及系统 | |
Chang et al. | IoT big-data centred knowledge granule analytic and cluster framework for BI applications: a case base analysis | |
Quinn et al. | Efficient methods to compute optimal tree approximations of directed information graphs | |
CN108921342B (zh) | 一种物流客户流失预测方法、介质和系统 | |
CN113822776B (zh) | 课程推荐方法、装置、设备及存储介质 | |
CN113554175B (zh) | 一种知识图谱构建方法、装置、可读存储介质及终端设备 | |
CN114565196B (zh) | 基于政务热线的多事件趋势预判方法、装置、设备及介质 | |
Sahu et al. | Ensemble deep neural network based quality of service prediction for cloud service recommendation | |
CN114880482A (zh) | 一种基于图嵌入的关系图谱关键人员分析方法及系统 | |
Zhang et al. | Improving incremental nonnegative matrix factorization method for recommendations based on three-way decision making | |
Zhang et al. | Efficient history matching with dimensionality reduction methods for reservoir simulations | |
CN111510473B (zh) | 访问请求处理方法、装置、电子设备和计算机可读介质 | |
Liu et al. | Approximation of stochastic processes by T–S fuzzy systems | |
CN116303963A (zh) | 智慧ai平台的用户反馈分析方法及系统 | |
CN111209105A (zh) | 扩容处理方法、装置、设备及可读存储介质 | |
CN112906960A (zh) | 一种非契约客户流失预测方法及系统 | |
Aydogan-Kilic et al. | Modification of hybrid RNN-HMM model in asset pricing: univariate and multivariate cases | |
Dosdoğru | Comparative study of hybrid artificial neural network methods under stationary and nonstationary data in stock market | |
Tan et al. | A method towards Web service combination for cross-organisational business process using QoS and cluster | |
Wei et al. | Improved model identification for non-linear systems using a random subsampling and multifold modelling (RSMM) approach | |
CN115102868A (zh) | 一种基于SOM聚类与深度自编码器的web服务QoS预测方法 | |
CN114329231A (zh) | 对象特征处理方法、装置、电子设备及存储介质 | |
Mirzaeifard et al. | Dynamic graph topology learning with non-convex penalties | |
JP6977877B2 (ja) | 因果関係推定装置、因果関係推定方法および因果関係推定プログラム | |
Mohammed et al. | Location-aware deep learning-based framework for optimizing cloud consumer quality of service-based service composition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |