CN110288350A - 用户价值预测方法、装置、设备及存储介质 - Google Patents
用户价值预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110288350A CN110288350A CN201910341655.8A CN201910341655A CN110288350A CN 110288350 A CN110288350 A CN 110288350A CN 201910341655 A CN201910341655 A CN 201910341655A CN 110288350 A CN110288350 A CN 110288350A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- value
- target
- fixed reference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000004044 response Effects 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 5
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 244000000231 Sesamum indicum Species 0.000 description 2
- 235000003434 Sesamum indicum Nutrition 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000009153 huxin Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- SBNFWQZLDJGRLK-UHFFFAOYSA-N phenothrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 SBNFWQZLDJGRLK-UHFFFAOYSA-N 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户价值预测方法、装置、设备及存储介质,所述方法包括:获取待预测用户的当前资料信息;提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;采用预设规则从排序后的参考特征信息中选取目标特征信息;通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分,从而通过梯度提升树以及逻辑回归模型进行用户价值预测,达到提高预测精度的目的。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户价值预测方法、装置、设备及存储介质。
背景技术
传统的客户价值模型是一个复杂的财务模型,但它可以表明与竞争产品相比,某个供应商能够提供的价值,客户价值模型的重要性和特色就在于:该模型是建立在彻底调查卖方产品所有的构成因素、尤其是卖方产品对其客户的成本构成和利润的影响的基础上,客户价值模型是根据客户关系管理(RecencyFrequencyMonetary,RFM)进行判断,主要是根据规则来判断近度(Recency,R)、频度(Frequency,F)和额度(Monetary,M)三个维度进行细分客户群体,客户划分的维度不够充分也不够精细化,无法做到精细化的管理和服务客户,从而造成对客户价值预测的准确性不高。
发明内容
本发明的主要目的在于提出一种用户价值预测方法、装置、设备及存储介质,旨在解决对用户的价值预测的准确性不高的技术问题。
为实现上述目的,本发明提供一种用户价值预测方法,所述用户价值预测方法包括以下步骤:
获取待预测用户的当前资料信息;
提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;
计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;
采用预设规则从排序后的参考特征信息中选取目标特征信息;
通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;
根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
优选地,所述提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息之前,所述方法还包括:
提取所述历史当前资料信息中的各个用户特征信息,从所述用户特征信息选取历史特征信息;
将所述历史特征信息作为初始节点,并查找所述历史特征信息在所述用户特征信息中的历史切分点;
通过所述历史切分点将所述历史特征信息进行分组,通过所述初始节点以及分组后的历史特征信息构建所述梯度提升树。
优选地,所述提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息,包括:
提取所述当前资料信息中的各个用户特征信息,根据所述用户特征信息查找对应的特征标签信息;
通过梯度提升树获取分组后的用户特征信息的切分点;
根据所述特征标签信息以及切分点信息得到对应的参考损失函数值;
通过所述参考损失函数值对用户特征信息进行特征筛选,获得参考特征信息。
优选地,所述参考评估值包括证据权重值;
所述计算所述参考特征信息的参考评估值,并根据所述参考评估值对选择后的参考特征信息进行排序,包括:
对所述参考特征信息进行分组,根据分组的数量对所述参考特征信息进行编号;
获取编号后的参考特征信息的当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量;
根据所述当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量得到当前组证据权重值;
根据所述当前组证据权重值得到目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
优选地,所述根据所述当前组证据权重值得到目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序,包括:
获取当前组响应客户占总响应客户的响应比例以及当前组未响应客户占总未响应客户的未响应比例;
根据所述响应比例、未响应比例以及当前组证据权重值得到当前组信息量值;
获取分组个数,根据所述分组个数以及当前组信息量值得到所述目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
优选地,所述采用预设规则从排序后的参考特征信息中选取目标特征信息,包括:
获取排序后的用户特征信息对应的目标信息量值;
将所述目标信息量值与预设阈值进行比较,将超过所述预设阈值的目标信息量值对应的参考特征信息作为所述目标特征信息。
优选地,所述通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值之前,所述方法还包括:
根据所述目标特征信息生成特征矩阵;
获取预设回归系数,根据所述预设回归系数以及特征矩阵建立所述逻辑回归模型;
所述通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值,包括:
在所述逻辑回归模型满足预设条件时,更新所述预设回归系数,将更新后的预设回归系数作为所述目标特征信息对应的目标权重值。
此外,为实现上述目的,本发明还提出一种用户价值预测装置,所述用户价值预测装置包括:
获取模块,用于获取待预测用户的当前资料信息;
提取模块,用于提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;
排序模块,用于计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;
选取模块,用于采用预设规则从排序后的参考特征信息中选取目标特征信息;
量化模块,用于通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;
确定模块,用于根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
此外,为实现上述目的,本发明还提出一种用户价值预测设备,所述用户价值预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户价值预测程序,所述用户价值预测程序配置为实现如上所述的用户价值预测方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有用户价值预测程序,所述用户价值预测程序被处理器执行时实现如上文所述的用户价值预测方法的步骤。
本发明提出的用户价值预测方法,通过获取待预测用户的当前资料信息;提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;采用预设规则从排序后的参考特征信息中选取目标特征信息;通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分,从而通过梯度提升树以及逻辑回归模型进行用户价值预测,可以做到对用于进行量化的打分并且以数据说话,达到提高预测精度的目的。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的用户价值预测设备结构示意图;
图2为本发明用户价值预测方法第一实施例的流程示意图;
图3为本发明用户价值预测方法一实施例的用户价值评分界面的结构示意图;
图4为本发明用户价值预测方法第二实施例的流程示意图;
图5为本发明用户价值预测方法第三实施例的流程示意图;
图6为本发明用户价值预测装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的用户价值预测设备结构示意图。
如图1所示,该用户价值预测设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对用户价值预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及用户价值预测程序。
在图1所示的用户价值预测设备中,网络接口1004主要用于连接外网,与其他网络设备进行数据通信;用户接口1003主要用于连接用户设备,与所述用户设备进行数据通信;本发明设备通过处理器1001调用存储器1005中存储的用户价值预测程序,并执行本发明实施例提供的用户价值预测的实施方法。
基于上述硬件结构,提出本发明用户价值预测方法实施例。
参照图2,图2为本发明用户价值预测方法第一实施例的流程示意图。
在第一实施例中,所述用户价值预测方法包括以下步骤:
步骤S10,获取待预测用户的当前资料信息。
需要说明的是,本实施例的执行主体为用户价值预测设备,例如用户价值预测服务器等,还可为其他设备,本实施例对此不作限制。
在本实施例中,申请用户可通过应用程序,填写所需的信息,例如个人身份信息、职业信息和联系人信息等,完善身份认证,人脸识别和活体识别,绑定手机号码和银行卡等,为提升客户体验还可采用光学字符识别(Optical Character Recognition,OCR)等技术获取数据,目的在于确保基础信息的真实性,防止伪冒申请,还可通过监控程序,获取授权账号对应的用户的当前资料信息,从而实现对用户信息的提取。
步骤S20,提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息。
在本实施例中,可将所述当前资料信息与预设关键字信息进行比较,将所述当前资料信息中含有所述预设关键字信息的目标交易信息作为所述参考特征信息,其中,所述预设关键字信息可为用户购买产品数量以及购买产品期限等,还包括其他特征信息,本实施例对此不作限制,从而通过关键字信息进行有效信息的提取,提高用户特征的有效性。
在具体实现中,所述当前用户特征信息筛选的维度主要是从“客户的存款”、“客户学历”、“客户消费偏频次”、“客户消费金额”、“客户行为”、“客户芝麻信用分”、“客户商旅信息”等上百种维度中进行筛选利用梯度提升树进行特征值的选择,从而选择出有效的用户特征信息,达到提高用户价值预测的准确性。
步骤S30,计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序。
在本实施例中,所述参考评估值包括信息值(Information Value,IV)值和证据权重值(Weight of Evidence,WOE),根据每个特征的IV值和WOE值进行变量重要程度的排序,选出强变量进行预测。
步骤S40,采用预设规则从排序后的参考特征信息中选取目标特征信息。
需要说明的是,所述预设规则选出参考评估值大于预设阈值的参考特征信息,还可为选取排序靠前的参考特征信息,还可为其他方式进行选择,本实施例对此不作限制,在本实施例中,以所述预设规则选出参考评估值大于预设阈值的参考特征信息为例进行说明,例如客户消费偏频次特征信息对应的参考评估值为80,在所述预设阈值为50的情况下,则所述客户消费偏频次特征信息对应的参考评估值大于预设阈值,则将所述客户消费偏频次特征信息选择出,作为所述参考特征信息。
步骤S50,通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值。
在具体实现中,在用户特征信息的维度或者变量选择后根据逻辑回归模型模型进行量化,算出每个变量在用户等级中的权重,比如“客户学历”0.1个权重,“客户存款”0.25个权重,从而根据机器学习不断的训练和测试算出每个特征值的权重,将所述参考特征信息结合权重信息进行用户价值预测,达到提高数据预测的准确性的目的。
步骤60,根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
可以理解的是,每个特征值的权重确定好后就可以根据逻辑回归模型模型进行预测比如用户Y=0.1*特征值1+0.2*特征2…..+0.3*特征值N,如果算出Y=95分,在满分为100分的情况下,说明用户在我行极高的客户价值为重点服务对象,如图3所示的用户价值评分界面,在获取用户的基本信息,其中,基本信息包括用户身份识别信息、姓名信息、客户类型信息、身份证信息以及手机号信息等,可通过用户的基本信息得到用户价值分、客户信用分以及客户欺诈分,从而可根据用户资料信息得到用户价值信息,并将得到的价值信息通过用户标签的形式进行标注,从而更快速地识别出高价值客户。
在本实施例中,通过用户价值预测可极大的减少了客户经理和人为的工作量并且根据机器学习的模型更加准确并有很好的决策依据,可以更好的服务价值高的用户,并提供精细化个性化的服务。
本实施例通过上述方案,通过获取待预测用户的当前资料信息;提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;采用预设规则从排序后的参考特征信息中选取目标特征信息;通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分,从而通过梯度提升树以及逻辑回归模型进行用户价值预测,可以做到对用于进行量化的打分并且以数据说话,达到提高预测精度的目的。
在一实施例中,如图4所示,基于第一实施例提出本发明用户价值预测方法第二实施例,所述步骤S20之前,所述方法还包括:
提取所述历史当前资料信息中的各个用户特征信息,从所述用户特征信息选取历史特征信息,将所述历史特征信息作为初始节点,并查找所述历史特征信息在所述用户特征信息中的历史切分点,通过所述历史切分点将所述历史特征信息进行分组,通过所述初始节点以及分组后的历史特征信息构建所述梯度提升树。
在具体实现中,首先遍历每个用户特征信息,然后对每个用户特征信息遍历它所有可能的切分点,找到最优特征m的最优切分点j,假设我们目前总共有M个特征,首先需要从中选择出一个特征j,做为二叉树的第一个节点,然后对特征j的值选择一个切分点m.一个样本的特征j的值如果小于m,则分为一类,如果大于m,则分为另外一类,从而构建了梯度提升树的一个节点,并以此方式生成其他节点。
进一步地,所述步骤S20,包括:
步骤S201,提取所述当前资料信息中的各个用户特征信息,根据所述用户特征信息查找对应的特征标签信息。
需要说明的是,可首先获取历史用户特征信息以及对应的历史特征标签信息,根据所述历史用户特征信息以及对应的历史特征标签信息建立关系映射表,根据所述关系映射表查找所述用户特征信息对应的特征标签信息,从而实现对用户特征信息的识别。
步骤S202,通过梯度提升树获取分组后的用户特征信息的切分点。
在具体实现中,首先用x来表示训练数据,用y来表示训练数据的特征标签信息,x[i]表示训练数据的第i个特征,x_i表示第i个训练样本,minLoss表示最小的损失函数值,minLoss=Integet.max_value,feature表示是训练的数据第几纬度的特征,split表示切分点的个数,M表示样本x的特征个数,该维特征下,特征值的每个切分点,其中,具体的切分方式可以根据用户需求进行定义。
步骤S203,根据所述特征标签信息以及切分点信息得到对应的参考损失函数值。
在具体实现中,可通过以下方式进行处理:
步骤S204,通过所述参考损失函数值对用户特征信息进行特征筛选,获得参考特征信息。
本实施例提供的方案,在对用户的特征信息进行预测时,首先通过损失函数值对用户特征信息进行特征筛选,获得参考特征信息,从而从用户的特征信息中提取有效的特征信息,达到提高预测准确性的目的。
在一实施例中,如图5所示,基于第一实施例或第二实施例提出本发明用户价值预测方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤S30,包括:
步骤S301,对所述参考特征信息进行分组,根据分组的数量对所述参考特征信息进行编号。
需要说明的是,WOE是对原始自变量的一种编码形式,要对一个变量进行WOE编码,需要首先把这个变量进行分组处理,也叫离散化、分箱等等,分组后,根据分组的数量对所述参考特征信息进行编号,从而实现对参考特征信息的识别。
步骤S302,获取编号后的参考特征信息的当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量。
在本实施例中,对于第i组,当前组证据权重值WOE的计算公式如下:
其中,pyi是这个组中响应客户占所有样本中所有响应客户的比例,pni是这个组中未响应客户占样本中所有未响应客户的比例,#yi是这个组中响应客户的数量,#ni是这个组中未响应客户的数量,#yT是样本中所有响应客户的数量,#nT是样本中所有未响应客户的数量。
步骤S303,根据所述当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量得到当前组证据权重值。
从这个公式中得到,WOE表示的实际上是“当前分组中响应客户占所有响应客户的比例”和“当前分组中没有响应的客户占所有没有响应的客户的比例”的差异,对这个公式做一个简单变换,可以得到:
变换以后可以看出,WOE表示的是当前这个组中响应的客户和未响应客户的比值,和所有样本中这个比值的差异,这个差异是用这两个比值的比值,再取对数来表示的,WOE越大,这种差异越大,这个分组里的样本响应的可能性就越大,WOE越小,差异越小,这个分组里的样本响应的可能性就越小。
步骤S304,根据所述当前组证据权重值得到目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
进一步地,所述步骤S304,包括:
获取当前组响应客户占总响应客户的响应比例以及当前组未响应客户占总未响应客户的未响应比例,根据所述响应比例、未响应比例以及当前组证据权重值得到当前组信息量值,同样,对于分组i,也会有一个对应的IV值,计算公式如下:
获取分组个数,根据所述分组个数以及当前组信息量值得到所述目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
进一步地,所述步骤S40,包括:
获取排序后的用户特征信息对应的目标信息量值,将排序后的用户特征信息对应的目标信息量值与预设阈值进行比较,将超过所述预设阈值的目标信息量值对应的参考特征信息作为所述目标特征信息。
需要说明的是,所述预设阈值可为70%,还可为其他参数,本实施例对此不作限制,在本实施例中,以70%为例进行说明,获取排序后的用户特征信息对应的目标信息量值,例如80%,将所述目标信息量值与预设阈值进行比较,可知,所述目标信息量值超过预设阈值,因此,可将所述目标信息量值对应的参考特征信息作为所述目标特征信息。
进一步地,所述步骤S50,包括:
在本实施例中,还可根据所述目标特征信息生成特征矩阵,获取预设回归系数,根据所述预设回归系数以及特征矩阵建立所述逻辑回归模型,在所述逻辑回归模型满足预设条件时,更新所述预设回归系数,将更新后的预设回归系数作为所述目标特征信息对应的目标权重值。
可以理解的是,回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量,在回归方程中表示自变量x对因变量y影响大小的参数,回归系数越大表示x对y影响越大,正回归系数表示y随x增大而增大,负回归系数表示y随x增大而减小,回归系数大于0则相关系数大于0,回归系数小于0则相关系数小于0,可通过回归系数作为所述目标特征信息对应的目标权重值
本实施例提供的方案,根据所述预设回归系数以及特征矩阵建立所述逻辑回归模型,在所述逻辑回归模型满足预设条件时,更新所述预设回归系数,将更新后的预设回归系数作为所述目标特征信息对应的目标权重值,从而可结合特征的权重值进行用户价值预测,达到提高用户价值预测准确性的目的。
本发明进一步提供一种用户价值预测装置。
参照图6,图6为本发明用户价值预测装置第一实施例的功能模块示意图。
本发明用户价值预测装置第一实施例中,该用户价值预测装置包括:
获取模块10,用于获取待预测用户的当前资料信息。
在本实施例中,申请用户可通过应用程序,填写所需的信息,例如个人身份信息、职业信息和联系人信息等,完善身份认证,人脸识别和活体识别,绑定手机号码和银行卡等,为提升客户体验还可采用光学字符识别(Optical Character Recognition,OCR)等技术获取数据,目的在于确保基础信息的真实性,防止伪冒申请,还可通过监控程序,获取授权账号对应的用户的当前资料信息,从而实现对用户信息的提取。
提取模块20,用于提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息。
在本实施例中,可将所述当前资料信息与预设关键字信息进行比较,将所述当前资料信息中含有所述预设关键字信息的目标交易信息作为所述参考特征信息,其中,所述预设关键字信息可为用户购买产品数量以及购买产品期限等,还包括其他特征信息,本实施例对此不作限制,从而通过关键字信息进行有效信息的提取,提高用户特征的有效性。
在具体实现中,所述当前用户特征信息筛选的维度主要是从“客户的存款”、“客户学历”、“客户消费偏频次”、“客户消费金额”、“客户行为”、“客户芝麻信用分”、“客户商旅信息”等上百种维度中进行筛选利用梯度提升树进行特征值的选择,从而选择出有效的用户特征信息,达到提高用户价值预测的准确性。
排序模块30,用于计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序。
在本实施例中,所述参考评估值包括信息值(Information Value,IV)值和证据权重值(Weight of Evidence,WOE),根据每个特征的IV值和WOE值进行变量重要程度的排序,选出强变量进行预测。
选取模块40,用于采用预设规则从排序后的参考特征信息中选取目标特征信息。
需要说明的是,所述预设规则选出参考评估值大于预设阈值的参考特征信息,还可为选取排序靠前的参考特征信息,还可为其他方式进行选择,本实施例对此不作限制,在本实施例中,以所述预设规则选出参考评估值大于预设阈值的参考特征信息为例进行说明,例如客户消费偏频次特征信息对应的参考评估值为80,在所述预设阈值为50的情况下,则所述客户消费偏频次特征信息对应的参考评估值大于预设阈值,则将所述客户消费偏频次特征信息选择出,作为所述参考特征信息。
量化模块50,用于通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值。
在具体实现中,在用户特征信息的维度或者变量选择后根据逻辑回归模型模型进行量化,算出每个变量在用户等级中的权重,比如“客户学历”0.1个权重,“客户存款”0.25个权重,从而根据机器学习不断的训练和测试算出每个特征值的权重,将所述参考特征信息结合权重信息进行用户价值预测,达到提高数据预测的准确性的目的。
确定模块60,用于根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
可以理解的是,每个特征值的权重确定好后就可以根据逻辑回归模型模型进行预测比如用户Y=0.1*特征值1+0.2*特征2…..+0.3*特征值N,如果算出Y=95分,在满分为100分的情况下,说明用户在我行极高的客户价值为重点服务对象,如图3所示的用户价值评分界面,在获取用户的基本信息,其中,基本信息包括用户身份识别信息、姓名信息、客户类型信息、身份证信息以及手机号信息等,可通过用户的基本信息得到用户价值分、客户信用分以及客户欺诈分,从而可根据用户资料信息得到用户价值信息,并将得到的价值信息通过用户标签的形式进行标注,从而更快速地识别出高价值客户。
在本实施例中,通过用户价值预测可极大的减少了客户经理和人为的工作量并且根据机器学习的模型更加准确并有很好的决策依据,可以更好的服务价值高的用户,并提供精细化个性化的服务。
本实施例通过上述方案,通过获取待预测用户的当前资料信息;提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;采用预设规则从排序后的参考特征信息中选取目标特征信息;通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分,从而通过梯度提升树以及逻辑回归模型进行用户价值预测,可以做到对用于进行量化的打分并且以数据说话,达到提高预测精度的目的。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有用户价值预测程序,所述用户价值预测程序被处理器执行如上文所述的用户价值预测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能终端设备(可以是手机,计算机,终端设备,空调器,或者网络终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种用户价值预测方法,其特征在于,所述用户价值预测方法包括:
获取待预测用户的当前资料信息;
提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;
计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;
采用预设规则从排序后的参考特征信息中选取目标特征信息;
通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;
根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
2.如权利要求1所述的用户价值预测方法,其特征在于,所述提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息之前,所述方法还包括:
提取历史当前资料信息中的各个用户特征信息,从所述用户特征信息选取历史特征信息;
将所述历史特征信息作为初始节点,并查找所述历史特征信息在所述用户特征信息中的历史切分点;
通过所述历史切分点将所述历史特征信息进行分组,通过所述初始节点以及分组后的历史特征信息构建所述梯度提升树。
3.如权利要求1所述的用户价值预测方法,其特征在于,所述提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息,包括:
提取所述当前资料信息中的各个用户特征信息,根据所述用户特征信息查找对应的特征标签信息;
通过梯度提升树获取分组后的用户特征信息的切分点;
根据所述特征标签信息以及切分点得到对应的参考损失函数值;
通过所述参考损失函数值对用户特征信息进行特征筛选,获得参考特征信息。
4.如权利要求1至3中任一项所述的用户价值预测方法,其特征在于,所述参考评估值包括证据权重值;
所述计算所述参考特征信息的参考评估值,并根据所述参考评估值对选择后的参考特征信息进行排序,包括:
对所述参考特征信息进行分组,根据分组的数量对所述参考特征信息进行编号;
获取编号后的参考特征信息的当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量;
根据所述当前组响应客户数量、当前组未响应客户的数量、总响应客户的数量以及总未响应客户的数量得到当前组证据权重值;
根据所述当前组证据权重值得到目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
5.如权利要求4所述的用户价值预测方法,其特征在于,所述根据所述当前组证据权重值得到目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序,包括:
获取当前组响应客户占总响应客户的响应比例以及当前组未响应客户占总未响应客户的未响应比例;
根据所述响应比例、未响应比例以及当前组证据权重值得到当前组信息量值;
获取分组个数,根据所述分组个数以及当前组信息量值得到所述目标信息量值,通过所述目标信息量值对选择后的参考特征信息进行排序。
6.如权利要求5所述的用户价值预测方法,其特征在于,所述采用预设规则从排序后的参考特征信息中选取目标特征信息,包括:
获取排序后的用户特征信息对应的目标信息量值;
将排序后的用户特征信息对应的目标信息量值与预设阈值进行比较,将超过所述预设阈值的目标信息量值对应的参考特征信息作为所述目标特征信息。
7.如权利要求1至3中任一项所述的用户价值预测方法,其特征在于,所述通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值之前,所述方法还包括:
根据所述目标特征信息生成特征矩阵;
获取预设回归系数,根据所述预设回归系数以及特征矩阵建立所述逻辑回归模型;
所述通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值,包括:
在所述逻辑回归模型满足预设条件时,更新所述预设回归系数,将更新后的预设回归系数作为所述目标特征信息对应的目标权重值。
8.一种用户价值预测装置,其特征在于,所述用户价值预测装置包括:
获取模块,用于获取待预测用户的当前资料信息;
提取模块,用于提取所述当前资料信息中的各个当前用户特征信息,通过梯度提升树对所述当前用户特征信息进行特征筛选,获得参考特征信息;
排序模块,用于计算所述参考特征信息的参考评估值,并根据所述参考评估值对所述参考特征信息进行排序;
选取模块,用于采用预设规则从排序后的参考特征信息中选取目标特征信息;
量化模块,用于通过逻辑回归模型对所述目标特征信息进行量化,得到目标特征信息对应的目标权重值;
确定模块,用于根据所述目标权重值以及目标特征信息确定所述当前用户的目标价值评分。
9.一种用户价值预测设备,其特征在于,所述用户价值预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户价值预测程序,所述用户价值预测程序配置为实现如权利要求1至7中任一项所述的用户价值预测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有用户价值预测程序,所述用户价值预测程序被处理器执行时实现如权利要求1至7中任一项所述的用户价值预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910341655.8A CN110288350A (zh) | 2019-04-24 | 2019-04-24 | 用户价值预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910341655.8A CN110288350A (zh) | 2019-04-24 | 2019-04-24 | 用户价值预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110288350A true CN110288350A (zh) | 2019-09-27 |
Family
ID=68001920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910341655.8A Pending CN110288350A (zh) | 2019-04-24 | 2019-04-24 | 用户价值预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110288350A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928913A (zh) * | 2019-12-09 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 用户显示方法、装置、计算机设备及计算机可读存储介质 |
CN111105144A (zh) * | 2019-11-26 | 2020-05-05 | 苏宁金融科技(南京)有限公司 | 数据处理方法、装置和目标对象风险监控方法 |
CN111340380A (zh) * | 2020-03-03 | 2020-06-26 | 深圳市海那边科技有限公司 | 客户资源分配方法、装置以及存储介质 |
CN111444956A (zh) * | 2020-03-25 | 2020-07-24 | 平安科技(深圳)有限公司 | 低负载信息预测方法、装置、计算机系统及可读存储介质 |
CN111784040A (zh) * | 2020-06-28 | 2020-10-16 | 平安医疗健康管理股份有限公司 | 政策模拟分析的优化方法、装置及计算机设备 |
CN113923006A (zh) * | 2021-09-30 | 2022-01-11 | 北京淇瑀信息科技有限公司 | 设备数据认证方法、装置及电子设备 |
TWI815019B (zh) * | 2019-10-04 | 2023-09-11 | 仁寶電腦工業股份有限公司 | 資訊推送系統、方法與紀錄媒體 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564423A (zh) * | 2017-12-28 | 2018-09-21 | 携程旅游网络技术(上海)有限公司 | 票务订单的恶意占位识别方法、系统、设备和存储介质 |
CN108733631A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 一种数据评估方法、装置、终端设备及存储介质 |
CN108830416A (zh) * | 2018-06-13 | 2018-11-16 | 四川大学 | 基于用户行为的广告点击率预测框架及算法 |
CN108960505A (zh) * | 2018-05-31 | 2018-12-07 | 试金石信用服务有限公司 | 个人金融信用的量化评估方法、装置、系统及存储介质 |
CN109583773A (zh) * | 2018-12-04 | 2019-04-05 | 税友软件集团股份有限公司 | 一种纳税信用积分确定的方法、系统及相关装置 |
-
2019
- 2019-04-24 CN CN201910341655.8A patent/CN110288350A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564423A (zh) * | 2017-12-28 | 2018-09-21 | 携程旅游网络技术(上海)有限公司 | 票务订单的恶意占位识别方法、系统、设备和存储介质 |
CN108733631A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 一种数据评估方法、装置、终端设备及存储介质 |
CN108960505A (zh) * | 2018-05-31 | 2018-12-07 | 试金石信用服务有限公司 | 个人金融信用的量化评估方法、装置、系统及存储介质 |
CN108830416A (zh) * | 2018-06-13 | 2018-11-16 | 四川大学 | 基于用户行为的广告点击率预测框架及算法 |
CN109583773A (zh) * | 2018-12-04 | 2019-04-05 | 税友软件集团股份有限公司 | 一种纳税信用积分确定的方法、系统及相关装置 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI815019B (zh) * | 2019-10-04 | 2023-09-11 | 仁寶電腦工業股份有限公司 | 資訊推送系統、方法與紀錄媒體 |
CN111105144A (zh) * | 2019-11-26 | 2020-05-05 | 苏宁金融科技(南京)有限公司 | 数据处理方法、装置和目标对象风险监控方法 |
CN110928913A (zh) * | 2019-12-09 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 用户显示方法、装置、计算机设备及计算机可读存储介质 |
CN110928913B (zh) * | 2019-12-09 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 用户显示方法、装置、计算机设备及计算机可读存储介质 |
CN111340380A (zh) * | 2020-03-03 | 2020-06-26 | 深圳市海那边科技有限公司 | 客户资源分配方法、装置以及存储介质 |
CN111444956A (zh) * | 2020-03-25 | 2020-07-24 | 平安科技(深圳)有限公司 | 低负载信息预测方法、装置、计算机系统及可读存储介质 |
CN111444956B (zh) * | 2020-03-25 | 2023-10-31 | 平安科技(深圳)有限公司 | 低负载信息预测方法、装置、计算机系统及可读存储介质 |
CN111784040A (zh) * | 2020-06-28 | 2020-10-16 | 平安医疗健康管理股份有限公司 | 政策模拟分析的优化方法、装置及计算机设备 |
CN111784040B (zh) * | 2020-06-28 | 2023-04-25 | 平安医疗健康管理股份有限公司 | 政策模拟分析的优化方法、装置及计算机设备 |
CN113923006A (zh) * | 2021-09-30 | 2022-01-11 | 北京淇瑀信息科技有限公司 | 设备数据认证方法、装置及电子设备 |
CN113923006B (zh) * | 2021-09-30 | 2024-02-02 | 北京淇瑀信息科技有限公司 | 设备数据认证方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110288350A (zh) | 用户价值预测方法、装置、设备及存储介质 | |
US7328218B2 (en) | Constrained tree structure method and system | |
CN109919652A (zh) | 用户群体分类方法、装置、设备及存储介质 | |
CN103761254B (zh) | 多领域服务主题匹配推荐方法 | |
CN108985347A (zh) | 分类模型的训练方法、店铺分类的方法及装置 | |
CN109360097A (zh) | 基于深度学习的股票预测方法、装置、设备及存储介质 | |
CN102099803A (zh) | 用于自动回答自然语言问题的方法和计算机系统 | |
CN111309887B (zh) | 一种训练文本关键内容提取模型的方法和系统 | |
CN110503565A (zh) | 行为风险识别方法、系统、设备及可读存储介质 | |
CN107679103B (zh) | 用于实体的属性分析方法及系统 | |
CN110276677A (zh) | 基于大数据平台的还款预测方法、装置、设备及存储介质 | |
CN108322317A (zh) | 一种账号识别关联方法及服务器 | |
CN108038655A (zh) | 部门需求的推荐方法、应用服务器及计算机可读存储介质 | |
CN110362665A (zh) | 一种基于语义相似度的问答系统及方法 | |
CN111882140A (zh) | 风险评测方法、模型训练方法、装置、设备及存储介质 | |
CN110288460A (zh) | 基于前向传播的催收预测方法、装置、设备及存储介质 | |
CN106033455A (zh) | 一种处理用户操作信息的方法与设备 | |
CN110378739B (zh) | 一种数据流量匹配方法及装置 | |
Keramati et al. | Investigating factors affecting customer churn in electronic banking and developing solutions for retention | |
CN110310012A (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN111091460A (zh) | 一种数据处理方法及装置 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN117057886A (zh) | 商品推荐方法、装置、设备及存储介质 | |
CN108960501B (zh) | 一种商品防窜货方法 | |
CN115293867A (zh) | 财务报销用户画像优化方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190927 |