CN113011949A - 基于客户信息补全的XGBoost金融产品推荐方法 - Google Patents

基于客户信息补全的XGBoost金融产品推荐方法 Download PDF

Info

Publication number
CN113011949A
CN113011949A CN202110321685.XA CN202110321685A CN113011949A CN 113011949 A CN113011949 A CN 113011949A CN 202110321685 A CN202110321685 A CN 202110321685A CN 113011949 A CN113011949 A CN 113011949A
Authority
CN
China
Prior art keywords
model
customer information
recommendation
recommended
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110321685.XA
Other languages
English (en)
Inventor
周遊
李鑫
汝刚
蒋群艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Institute of Economic and Trade Technology
Original Assignee
Jiangsu Institute of Economic and Trade Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Institute of Economic and Trade Technology filed Critical Jiangsu Institute of Economic and Trade Technology
Priority to CN202110321685.XA priority Critical patent/CN113011949A/zh
Publication of CN113011949A publication Critical patent/CN113011949A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开一种推荐结果准确性高的基于客户信息补全的XGBoost金融产品推荐方法,包括如下步骤:(10)模型指标体系建立:根据企业与银行的业务往来数据,建立推荐模型指标体系;(20)样本集构建:根据模型指标体系,收集客户信息,构建推荐模型训练样本集与测试样本集;(30)客户信息补全:基于奇异值阈值法的低秩矩阵补全方法,对缺失信息进行估计,补全客户信息;(40)推荐模型获取:利用推荐模型训练样本集对XGBoost模型进行训练,利用推荐模型测试样本集对训练后的XGBoost模型进行测试,得到推荐模型;(50)金融产品推荐:根据目标客户的信息,利用推荐模型,推荐金融产品。

Description

基于客户信息补全的XGBoost金融产品推荐方法
技术领域
本发明属于银行金融产品推荐技术领域,特别是一种推荐结果准确性高的基于客户信息补全的XGBoost金融产品推荐方法。
背景技术
在为客户提供个性化服务的经营理念下,商业银行推出了种类丰富的金融服务产品。但是数量众多的产品以及不断推陈出新的服务,使客户难以及时了解并做出合理选择。此外,没有选择性地推荐金融产品,不但会造成客户选择困难,也会造成资源的浪费。如何能根据客户的特点有针对性地推荐与客户需求吻合度高的产品,是银行提高服务效率和客户满意度的有效手段。
银行客户对象可以分为个人客户与企业(机构)客户两大类。其中面向个人客户的银行产品推荐模型研究较为充分,并取得了较充分的发展。为了预测个人客户的需求和购买意向,在对其历史购买行为精准分析的基础上,银行根据自身的理财产品和自身服务的优势对客户的购买行为进行设计推荐。当前大数据、云计算技术发展迅速,利用相关技术去跟踪、捕捉客户行为特征,通过不断整合各类资源来匹配客户的运营活动,对个人客户的下一步购买行为进行精准预测,进而向客户推荐合适的银行相关产品。
与个人客户的服务需求不同,企业客户由于行业、规模、发展的阶段不同,不同种类的企业在选择金融产品时会存在巨大的差异,同时企业客户的客户行为、财务数据更为复杂,而银行掌握的数据往往不完整,这些都给银行产品推荐带来极大的困难与挑战。以客户的行为模式为基础建立金融产品推荐系统,是银行实现对客户的金融产品推荐的主要方法,如采用协同过滤推荐建模方法。但这类模型以客户行为的长期历史数据为基础才可能建立较为精确的推荐模型,对于新开户、快速成长、业务转型等企业,历史行为数据不足或参考价值显著降低,这时利用基于行为数据的模型难以获得满意的推荐结果。
银行服务对象中的企业客户与个人客户相比,涉及客户信息种类与项目更复杂,由于企业行业特征差异、发展阶段不同、财务管理要求各异,银行收集到的企业数据信息缺失更为普遍,这是银行建立产品推荐模型所面临的重要难题。以往的工作中,对于信息缺失的样本采取的处理方式主要有二种,一种是将该样本删除,二是将信息缺失项置零或用其他样本的均值替代。这样的处理方式要么破坏了数据集的多样性,要么破坏了样本信息的完整性,毫无疑问都将对推荐模型的建立和推荐结果产生不利的影响。
目前,中国发明专利申请“一种基于Xgboost和DBSCAN的精准营销方法”,(申请号202010277261.3,公开日2020.10.16)公开了一种基于XGBoost产品推荐方法,包括以下步骤:步骤1.对数据源中的银行数据进行人工标注,以此获得类别信息;步骤2.将银行数据及其标注信息整合,作为完整的数据集;步骤3.针对数据集进行探索性分析;步骤4.针对数据集进行数据预处理,划分数据集,得到训练集、测试集;步骤5.将数据输入到已经构建好的模型中进行训练,得到精准营销模型;步骤6.将待检测的银行数据输入到精准营销模型进行检测,得到客户分类结果;步骤7.进行效果验证,输出检测结果。
上述方法由于未对缺失信息进行合理估计,导致在信息缺失的情况下获得的产品推荐结果准确性不高。
发明内容
本发明的目的在于提供一种基于客户信息补全的XGBoost金融产品推荐方法,推荐结果准确性高。
实现本发明目的的技术解决方案为:
一种基于客户信息补全的XGBoost金融产品推荐方法,其特征在于,包括如下步骤:
(10)模型指标体系建立:根据企业与银行的业务往来数据,建立推荐模型指标体系,指标项包含客户财务数据和客户非财务数据;
(20)样本集构建:根据模型指标体系,收集客户信息,构建推荐模型训练样本集与测试样本集;
(30)客户信息补全:基于奇异值阈值法的低秩矩阵补全方法,对缺失信息进行估计,补全客户信息;
(40)推荐模型获取:利用推荐模型训练样本集对XGBoost模型进行训练,利用推荐模型测试样本集对训练后的XGBoost模型进行测试,得到推荐模型;
(50)金融产品推荐:根据目标客户的信息,利用推荐模型,推荐金融产品。
本发明与现有技术相比,其显著优点为:
1、推荐结果准确:本发明采用低秩矩阵补全对缺失用户信息进行补全,基于完备客户信息,再对XGBoost模型训练以获得XGBoost推荐模型,采用XGBoost推荐模型对金融产品进行推荐,从而得到符合客户需求的推荐结果,大幅提高了推荐结果的准确性。
2、指标体系更全面:本发明构建的模型指标体系包括客户财务数据和客户非财务数据两类,能更全面地反映客户的经营状态与发展趋势,从而为更科学的推荐结果提供数据支持。
附图说明
图1为本发明基于客户信息补全的XGBoost金融产品推荐方法的主流程图。
图2为图1中客户信息补全步骤的流程图。
图3为图1中金融产品推荐步骤的流程图。
图4为评分实验对比结果图。
具体实施方式
如图1所示,本发明针对信息缺失的金融产品推荐方法,包括如下步骤:
(10)模型指标体系建立:根据企业与银行的业务往来数据,建立推荐模型指标体系,指标项包含客户财务数据和客户非财务数据;
(20)样本集构建:根据模型指标体系,收集客户信息,构建推荐模型训练样本集与测试样本集。
例如,将收集到的财务指标的历年数据作为样本数据。按表1和表2选取33个财务指标和6个非财务指标,构成推荐模型的39维特征向量,随机挑选6000家企业的数据作为训练样本,1500家企业的数据作为测试样本,银行提供的69种金融产品作为推荐对象。
(30)客户信息补全:基于奇异值阈值法的低秩矩阵补全方法,对缺失信息进行估计,补全客户信息;
如图2所示,所述(30)客户信息补全步骤包括:
(31)待补全矩阵构造:以推荐模型指标项为列,训练样本集中客户样本为行,构造低秩待补全矩阵;
由于客户信息间的线性相关存在信息冗余,因此由推荐模型指标项为列、训练样本集中客户样本为行构造的待补全矩阵为低秩矩阵。
表1选取的财务指标
Figure BDA0002993120270000041
表2选取的非财务指标
Figure BDA0002993120270000042
(32)缺失信息估计:采用奇异值阈值法对待补全矩阵中的缺失信息进行估计、补全;
由于待补全矩阵为低秩矩阵,从而可以采用采用奇异值阈值法(SVT,SingularValue Thresholding)对待补全矩阵中的缺失信息进行估计、补全。
所述采用奇异值阈值法对待补全矩阵中的缺失信息进行估计可按如下步骤实现:
矩阵补全可表示为如下优化问题,
Figure BDA0002993120270000043
其中Ω为观测样本下标的集合,X为优化变量,M为真实的未知矩阵。定义投影算子PΩ:
Figure BDA0002993120270000051
从而(1)式可以简洁地表述为:
Figure BDA0002993120270000052
对其进行凸松弛,转化为一个凸优化问题:
Figure BDA0002993120270000053
SVT算法先将最优化问题(4)正则化,即有:
Figure BDA0002993120270000054
其中,τ>0。当τ→+∞时,上述最优化问题的最优解收敛到(4)式的最优解。
以此得到待补全矩阵中的缺失信息项的估计结果,将估计结果填充入待补全矩阵,完成对企业客户信息的补全。
采用低秩矩阵补全对缺失用户信息进行补全,便于XGBoost推荐模型基于完备客户信息对金融产品进行推荐,从而可以得到符合客户需求的推荐结果,能够大幅提高推荐结果的准确性。
(40)推荐模型获取:利用推荐模型训练样本集对XGBoost模型进行训练,利用推荐模型测试样本集对训练后的XGBoost模型进行测试,得到推荐模型。
对XGBoost模型的训练和测试是现有技术,为节省篇幅,在此不再赘述。
(50)金融产品推荐:根据目标客户的信息,利用推荐模型,推荐金融产品。
如图3所示,所述(50)金融产品推荐步骤包括:
(51)目标客户信息补全:以推荐模型指标项为列,目标客户信息为行构造低秩待补全矩阵,采用奇异值阈值法对待补全矩阵中的缺失信息进行估计、补全;
(52)金融产品获取:将补全的目标客户信息输入推荐模型,得到推荐给目标客户的金融产品。
本发明与现有方法推荐结果的比较以推荐结果评分方式进行。
评分标准:例如,以2015-2018年四年的样本数据,预测2019年各公司的产品清单,与2019年实际情况作比对,如该年度公司持有该产品,则为预测成功。每个公司推荐五款产品,按比例记分,最终取均值。若公司持有产品小于5,则按照公司持有产品与推荐的产品进行匹配,若在推荐的五款产品中,也同样记为预测成功。例如A客户2019年拥有产品数量为四个(a,b,c,d),如果预测出的5个分别为(a,c,d,e,f),那么针对该客户的分子值为3/4*100=75分。
实验采用上述打分规则进行推荐性能对比测试。首先用未进行数据补全的方式训练XGBoost推荐模型,在目标客户信息存在20%左右缺失的情况下平均得分为70.2,未能实现有效推荐;然后,利用本发明提出的客户信息补全方法先将缺失信息估计、补全,再训练XGBoost推荐模型,对推荐结果打分平均分达到91.8,显著高于客户信息补全前模型打分结果。
图4为打分实验对比结果图。从图4对比可以看出,采用本发明的客户信息补全方法后,由于具有更完备的数据,XGBoost推荐模型的推荐能力有了显著提高。

Claims (4)

1.一种基于客户信息补全的XGBoost金融产品推荐方法,其特征在于,包括如下步骤:
(10)模型指标体系建立:根据企业与银行的业务往来数据,建立推荐模型指标体系,指标项包含客户财务数据和客户非财务数据;
(20)样本集构建:根据模型指标体系,收集客户信息,构建推荐模型训练样本集与测试样本集;
(30)客户信息补全:基于奇异值阈值法的低秩矩阵补全方法,对缺失信息进行估计,补全客户信息;
(40)推荐模型获取:利用推荐模型训练样本集对XGBoost模型进行训练,利用推荐模型测试样本集对训练后的XGBoost模型进行测试,得到推荐模型;
(50)金融产品推荐:根据目标客户的信息,利用推荐模型,推荐金融产品。
2.根据权利要求1所述的金融产品推荐方法,其特征在于,所述(30)客户信息补全步骤包括:
(31)待补全矩阵构造:以推荐模型指标项为列,训练样本集中客户样本为行,构造低秩待补全矩阵;
(32)缺失信息估计:采用奇异值阈值法对待补全矩阵中的缺失信息进行估计、补全。
3.根据权利要求2所述的金融产品推荐方法,其特征在于,所述(32)缺失信息估计步骤具体为:
矩阵补全问题形式为如下优化问题:
Figure FDA0002993120260000011
其中Ω为观测样本下标的集合,X为优化变量,M为真实的未知矩阵;定义投影算子PΩ:
Figure FDA0002993120260000012
从而(1)式可以简洁地表述为:
Figure FDA0002993120260000013
对其进行凸松弛,转化为一个凸优化问题:
Figure FDA0002993120260000021
SVT算法先将最优化问题(4)正则化,即有:
Figure FDA0002993120260000022
其中,τ>0;当τ→+∞时,上述最优化问题的最优解收敛到(4)式的最优解。
4.根据权利要求1至3之一所述的金融产品推荐方法,其特征在于,所述(50)金融产品推荐步骤包括:
(51)目标客户信息补全:以推荐模型指标项为列,目标客户信息为行构造低秩待补全矩阵,采用奇异值阈值法对待补全矩阵中的缺失信息进行估计、补全;
(52)金融产品获取:将补全的目标客户信息输入推荐模型,得到推荐给目标客户的金融产品。
CN202110321685.XA 2021-03-25 2021-03-25 基于客户信息补全的XGBoost金融产品推荐方法 Pending CN113011949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110321685.XA CN113011949A (zh) 2021-03-25 2021-03-25 基于客户信息补全的XGBoost金融产品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110321685.XA CN113011949A (zh) 2021-03-25 2021-03-25 基于客户信息补全的XGBoost金融产品推荐方法

Publications (1)

Publication Number Publication Date
CN113011949A true CN113011949A (zh) 2021-06-22

Family

ID=76407284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110321685.XA Pending CN113011949A (zh) 2021-03-25 2021-03-25 基于客户信息补全的XGBoost金融产品推荐方法

Country Status (1)

Country Link
CN (1) CN113011949A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118096223A (zh) * 2024-04-23 2024-05-28 紫金诚征信有限公司 基于人工智能的金融产品营销方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110189191A (zh) * 2019-05-05 2019-08-30 苏宁易购集团股份有限公司 一种基于实时模型的金融产品推荐方法及系统
CN111159638A (zh) * 2019-12-26 2020-05-15 华南理工大学 基于近似低秩矩阵补全的配电网负荷缺失数据恢复方法
CN111626863A (zh) * 2020-06-02 2020-09-04 北京比财数据科技有限公司 一种金融产品的智能推荐方法
CN111783818A (zh) * 2020-04-10 2020-10-16 南通大学 一种基于Xgboost和DBSCAN的精准营销方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110189191A (zh) * 2019-05-05 2019-08-30 苏宁易购集团股份有限公司 一种基于实时模型的金融产品推荐方法及系统
CN111159638A (zh) * 2019-12-26 2020-05-15 华南理工大学 基于近似低秩矩阵补全的配电网负荷缺失数据恢复方法
CN111783818A (zh) * 2020-04-10 2020-10-16 南通大学 一种基于Xgboost和DBSCAN的精准营销方法
CN111626863A (zh) * 2020-06-02 2020-09-04 北京比财数据科技有限公司 一种金融产品的智能推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯雅莉: "矩阵补全算法与图像恢复的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2, pages 9 - 10 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118096223A (zh) * 2024-04-23 2024-05-28 紫金诚征信有限公司 基于人工智能的金融产品营销方法及装置

Similar Documents

Publication Publication Date Title
Cheriyan et al. Intelligent sales prediction using machine learning techniques
Hawkins Metaverse live shopping analytics: retail data measurement tools, computer vision and deep learning algorithms, and decision intelligence and modeling
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
CN112200538A (zh) 数据处理方法、装置、设备及存储介质
Gupta et al. Role of big data analytics in banking
Mircică Immersive and engaging digital content, data visualization tools, and location analytics in a decentralized metaverse
Yeung et al. Data analytics architectures for e-commerce platforms in cloud
Ranggadara et al. Applying customer loyalty classification with RFM and Naïve Bayes for better decision making
CN113011949A (zh) 基于客户信息补全的XGBoost金融产品推荐方法
Farooq et al. Revenue generation from recommendation system using sentimental analysis
CN115880077A (zh) 基于客户标签的推荐方法及其装置、电子设备及存储介质
Gumelar et al. NFT coin price prediction (non-fungible token) using K-nearest neighbors method
Tirno et al. An Empirical Study on the Business Intelligence (BI) Data Collection Strategy in the ICT-Based Startups in Bangladesh
Liu et al. A machine learning approach to predict customer churn of a delivery platform
Peddarapu et al. Customer Churn Prediction using Machine Learning
Chhabra et al. Knowledge discovery for scalable data mining
Afzal NNBI: A Neural Network based Business Intelligence Dashboard for a Clothing Store
Ines et al. Customer Success Analysis and Modeling in Digital Marketing
Anil et al. Predicting Early Reviewers on E-Commerce Websites
Sunil et al. Investigating the Use of Data Mining for Knowledge Discovery
El-Baz A Business Intelligence System for Governing Risks in SMEs
Limsurut et al. Event-based Feature Synthesis: Autonomous Data Science Engine
Duwadi et al. ChatGPT based recommendation system for retail shops
Jollay New Skills in Auditing: Embracing Emerging Technology in the Audit Profession
Sreelakshmi et al. An optimized approach towards increasing the sale rate in a Grocery Mart by using Association Rule Mining Approaches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210622