CN115099934A - 一种高潜客户识别方法、电子设备和存储介质 - Google Patents
一种高潜客户识别方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN115099934A CN115099934A CN202210734034.8A CN202210734034A CN115099934A CN 115099934 A CN115099934 A CN 115099934A CN 202210734034 A CN202210734034 A CN 202210734034A CN 115099934 A CN115099934 A CN 115099934A
- Authority
- CN
- China
- Prior art keywords
- model
- machine learning
- combined machine
- account
- prediction result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
本申请公开了一种高潜客户识别方法、电子设备和存储介质,包括:获取银行现有客户特征数据,作为原始数据集;将所述原始数据集拆分为测试集与训练集,训练得到组合机器学习二分类模型;将预约完成未开户客户特征数据输入至所述组合机器学习二分类模型,利用所述组合机器学习二分类模型预测客户开户意愿,得到客户开户意愿预测结果;将所述客户开户意愿预测结果排序,将高于阈值的客户推荐至外呼平台。通过上述方案,能根据客户特征建立预测模型,对预约完成未开户的高潜客户进行筛选,实现对预约完成未开户的高潜客户进行整体评估、预测和管理,将模型识别出的高潜客户对接到外呼平台,提升客户满意度及开户率,并降低再次营销成本。
Description
技术领域
本申请涉及银行领域,特别是涉及一种高潜客户识别方法、电子设备和存储介质。
背景技术
随着银行零售业务的不断发展,零售获客渠道的不断增加,银行对提升开户率及新客户的潜在价值的需求不断提升,目前,对于预约开户客户的管理存在以下问题:
其一,没有相应的平台监控预约开户情况及识别高潜客户,靠人工或者报表等传统的统计方法来对零售客户的开户情况进行监控分析,无法综合各项特征自动智能监控预约完成客户的开户情况,增大人力资源消耗;
其二,没有针对预约完成未开户的客户的再次营销措施,目前针对这些预约完成未开户的潜在客户没有进行再次营销的相关措施或措施单一,例如,对全部预约完成未开户的客户进行再次营销,会增大人力资源消耗,并且不利于提高客户满意程度及开户率。
发明内容
本申请至少提供一种高潜客户识别方法、电子设备和存储介质,能够比较精准地识别出开户高潜客户并进行再次营销,从而提高客户满意程度及开户率,降低再次营销成本。
本申请第一方面提供了一种高潜客户识别方法,包括:获取银行现有客户特征数据,作为原始数据集;将所述原始数据集拆分为测试集与训练集,训练得到组合机器学习二分类模型;将预约完成未开户客户特征数据输入至所述组合机器学习二分类模型,利用所述组合机器学习二分类模型预测客户开户意愿,得到客户开户意愿预测结果;将所述客户开户意愿预测结果排序,将高于阈值的客户推荐至外呼平台。
上述方案,根据客户特征建立组合机器学习二分类模型,对预约完成未开户的高潜客户进行筛选,实现对预约完成未开户的高潜客户进行整体评估、预测和管理,将模型识别出的高潜客户对接到外呼平台,提升客户满意度及开户率,并降低再次营销成本。
在一些实施例中,所述组合机器学习二分类模型,包括梯度提升树模型和线性回归模型,所述训练得到组合机器学习二分类模型,包括:利用所述训练集对所述梯度提升树模型和所述线性回归模型进行超参数模型调优,确定所述梯度提升树模型和所述线性回归模型的各项参数;以及,利用所述测试集对得到的所述组合机器学习二分类模型进行有效性评估。
通过将梯度提升树模型和线性回归模型建立为组合机器学习二分类模型,提高模型预测的准确度,通过超参数模型调优以及有效性评估,可以进一步提高最终训练得到的模型的预测准确度。
在一些实施例中,所述输入至组合机器学习二分类模型,包括将预约未开户客户特征数据集输入至所述梯度提升树模型,得到第一预测结果,将所述第一预测结果输入至所述线性回归模型,得到第二预测结果。
将预约未开户客户特征数据集输入梯度提升树,得到第一预测结果,将此第一预测结果输入至线性回归模型,得到第二预测结果,可进一步提高预测的准确性。
在一些实施例中,所述梯度提升树模型,包括,若干个弱学习器,其中,每个弱学习器包括一个第一结点,若干第二结点及若干第三结点;所述将预约完成未开户客户特征数据集输入至梯度提升树模型,包括:将所述预约完成未开户客户特征数据集输入至所述梯度提升树模型的不同弱学习器中的第一结点,所述不同弱学习器中的第一结点根据预设规则进行分裂,得到若干所述不同弱学习器第二结点,所述若干第二结点根据预设规则不断向下分裂,得到若干所述不同弱学习器第三结点;对所述第三结点输出的结果进行归一化处理,得到所述第一预测结果;将所述第一预测结果,输入至所述线性回归模型,得到第二预测结果。
利用梯度提升树模型中的多个弱学习器,获取多个预测结果,将多个弱学习器的预测结果进行归一化,作为第一预测结果,提高了预测的准确性,将此第一预测结果输入至线性回归模型,得到第二预测结果,进一步提高了预测的准确性。
在一些实施例中,所述输入至线性回归模型,以得到第二预测结果,包括:将所述第一预测结果,输入至所述线性回归模型,利用所述线性回归模型进行二分类预测,得到所述第二预测结果,利用所述第二预测结果预测客户开户意愿。
将第一预测结果输入至线性回归模型,得到第二预测结果,进一步提高了预测的准确性,利用线性回归模型进行二分类预测,对预约未开户客户进行分类,直观展示了预测结果。
在一些实施例中,对得到的所述组合机器学习二分类模型进行有效性评估,包括:计算所述组合机器学习二分类模型的AUC值,判断所述AUC值是否大于预设数值,若是,利用所述组合机器学习二分类模型预测客户开户意愿,否则,利用所述超参数调优重新确定所述组合机器学习二分类模型的各项参数,更新所述组合机器学习二分类模型,并重新计算所述AUC值,直至所述AUC值大于所述预设数值。
通过计算AUC值,可以对组合机器学习二分类模型进行有效性评估,得到组合机器学习二分类模型的预测效果评价,AUC值不满足预设数值,重新确定组合机器学习二分类模型的各项参数,可以提高组合机器学习二分类模型的预测效果。
在一些实施例中,所述将预测结果高于阈值的客户推荐至外呼平台,包括:将所述预测结果高于阈值的客户数据输出至外呼团队,以及,以AI外呼、短信和/或以人工致电的方式对所述预测结果高于阈值的客户进行再次营销。
将所述预测结果高于阈值的客户数据输出至外呼团队,根据实际情况使用AI外呼、短信和/或人工致电的方式对所述预测结果高于阈值的客户进行再次营销,可以提高对人力资源的利用效率以及客户的开户率。
在一些实施例中,所述获取银行现有客户特征数据,包括:利用机器人流程自动化技术,获取性别,职业,年龄,城市,开户方式,预约渠道,网点银行签约标识,第三方支付方式,风测答题,信用卡申请等数据。
通过银行现有客户的多种特征数据,可以结合多维度的数据进行客户开户预测,提高预测的准确度。
本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的高潜客户识别方法。
本申请第三方面提供了一种非易失性计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的高潜客户识别方法。
上述方案,根据客户特征建立组合机器学习二分类模型,能根据客户特征建立预测模型,对预约完成未开户的高潜客户进行筛选,实现对预约完成未开户的高潜客户进行整体评估、预测和管理,将模型识别出的高潜客户对接到外呼平台,提升客户满意度及开户率,并降低再次营销成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1是本申请的高潜客户识别方法一实施例流程示意图。
图2是本申请的电子设备一实施例的框架示意图。
图3是本申请的非易失性计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
需要说明的是,若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标志告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围则视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
请参阅图1,图1是本申请的高潜客户识别方法一实施例流程示意图。高潜客户识别方法的执行主体可以是高潜客户识别装置,例如,高潜客户识别方法可以由终端设备或服务器或其它处理设备执行,其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该高潜客户识别方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
具体而言,如图1所示,该方法可包括如下步骤:
步骤S11:获取银行现有客户特征数据,作为原始数据集。
银行现有客户是指已在银行办理过开户业务的客户,银行现有客户特征数据是指可以反映客户特征的各项指标数据,例如:性别,年龄,学历等,可根据实际情况选取银行现有客户的各项特征作为原始数据集。
步骤S12:将原始数据集拆分为测试集与训练集,训练得到组合机器学习二分类模型。
将原始数据集拆分为测试集与训练集,其中,原始数据集的拆分可以根据实际情况设置不同的拆分比例,从而得到不同大小的测试集与训练集。
将训练集输入至组合机器学习二分类模型,以训练得到组合机器学习二分类模型的各项参数,将测试集输入至组合机器学习二分类模型,以对组合机器学习二分类模型的预测效果进行评价,并根据此评价更新组合机器学习二分类模型的参数,得到组合机器学习二分类模型。
其中,组合机器学习二分类模型为组合模型,组合机器学习二分类模型的各项参数,例如:模型的学习率,最大迭代次数等参数。
步骤S13:将预约完成未开户客户特征数据输入至组合机器学习二分类模型,利用组合机器学习二分类模型预测客户开户意愿,得到客户开户意愿预测结果。
将预约完成未开户客户特征数据输入至训练得到的组合机器学习二分类模型,利用组合机器学习二分类模型预测客户开户意愿。
其中,预约完成未开户客户是指向银行预约进行开户业务但并未完成开户的客户,开户意愿预测结果用于预测客户开户意愿,即预测客户的开户概率,并根据此概率将客户分为会开户与不会开户两类。
步骤S14:将客户开户意愿预测结果排序,将高于阈值的客户推荐至外呼平台。
将客户开户意愿进行排序,得到客户开户意愿预测结果排序结果,根据实际情况设定阈值,推荐至外呼平台,例如:可将开户意愿预测结果排序在前百分之十的客户推荐至外呼平台。
本实施例中,根据客户特征建立组合机器学习二分类模型,对预约完成未开户的高潜客户进行整体评估和预测,从而对预约完成未开户的高潜客户进行筛选,通过将模型识别出的高潜客户对接到外呼平台,提升客户满意度及开户率,并降低再次营销成本与人力资源的消耗。
如上述,利用组合机器学习二分类模型预测客户开户意愿,在一些实施例中,组合机器学习二分类模型,包括:梯度提升树模型和线性回归模型,训练得到组合机器学习二分类模型,包括:利用训练集对梯度提升树模型和线性回归模型进行超参数模型调优,确定梯度提升树模型和线性回归模型的各项参数;以及,利用测试集对得到的组合机器学习二分类模型进行有效性评估。
组合机器学习二分类模型包括梯度提升树模型和线性回归模型,梯度提升树模型,也叫做梯度提升回归树模型(gradient boosting regression tree)可以用于回归预测,也可以用作分类,其构建原理为使用若干个弱学习器,结合为强学习器,以生成梯度提升树模型。
线性回归模型(Linear Regression)可以对一个或多个自变量和因变量之间关系进行建模,线性回归模型可以用来拟合出一个预测模型,对于一个新增的自变量,在没有给定与它相配对的因变量的情况下,可以使用线性回归模型对因变量的值进行预测。
进一步地,利用训练集对梯度提升树模型和线性回归模型进行超参数模型调优,超参数模型调优是指预先设定模型的各项参数,再输入训练集计算残差,即计算实际观察值(真值)与估计值(拟合值)之间的差值,从而反向更新模型的各项参数,例如:利用网格搜索的方法,可以根据实际情况设定搜索范围,搜索范围用于界定参数的取值范围,查找搜索范围内的所有的参数组合,以获得搜索范围内使得残差最小的模型,利用训练集对梯度提升树模型和线性回归模型进行超参数模型调优,可以确定梯度提升树模型和线性回归模型的各项参数,例如,梯度提升树模型的学习率,最大迭代次数及线性回归模型的回归系数等参数,其中,学习率是指每个弱学习器对预测结果的贡献,学习率下降,每个弱学习器的贡献降低,模型训练的预测效果就会下降,为了达到和高学习率相同的效果,就需要生成更多的弱学习器;最大迭代次数是指生成弱学习器的过程的执行次数,即弱学习器的个数;回归系数是指表示自变量对因变量影响大小的参数,即表示银行现有客户的各个特征数据对开户意愿预测结果的不同影响。
进一步地,确定梯度提升树模型和线性回归模型的各项参数后,利用测试集对得到的组合机器学习二分类模型进行有效性评估,以评价所获得的组合机器学习二分类模型的性能,有效性评估是对模型性能的评估,可以根据实际情况选择不同的有效性评估方法,例如,混淆矩阵评估(Confusion Matrix),ROC曲线评估,AUC评估(ROC曲线下面积)等。
本实施例中,通过将梯度提升树模型和线性回归模型建立组合机器学习二分类模型,提高模型预测的准确度,通过超参数模型调优以及有效性评估,可以进一步提高最终训练得到的模型的预测准确度。
如上述,组合机器学习二分类模型包括梯度提升树模型和线性回归模型,在一些实施例中,输入至组合机器学习二分类模型,包括:将预约未开户客户特征数据集输入至梯度提升树模型,得到第一预测结果,将第一预测结果输入至线性回归模型,得到第二预测结果。
将预约未开户客户特征数据集输入至梯度提升树模型,可以得到预约未开户客户特征数据集中不同特征的权重值,作为第一预测结果,将第一预测结果输入至线性回归模型,得到第二预测结果,第二预测结果作为组合机器学习二分类模型最终的预测结果。
本实施例中,将预约未开户客户特征数据集输入梯度提升树,得到第一预测结果,将此第一预测结果输入至线性回归模型,得到第二预测结果,可进一步提高预测的准确性。
如上述,将预约未开户客户特征数据集输入至梯度提升树模型,可以得到预约未开户客户特征数据集中不同特征的权重值,在一些实施例中,梯度提升树模型,包括,若干个弱学习器,其中,每个弱学习器包括一个第一结点,若干第二结点及若干第三结点;将预约完成未开户客户特征数据集输入至梯度提升树模型,包括:将预约完成未开户客户特征数据集输入至梯度提升树模型的不同弱学习器中的第一结点,不同弱学习器中的第一结点根据预设规则进行分裂,得到若干不同弱学习器第二结点,若干第二结点根据预设规则不断向下分裂,得到若干不同弱学习器第三结点;对第三结点输出的结果进行归一化处理,得到第一预测结果;将第一预测结果,输入至线性回归模型,得到第二预测结果。
进一步地,可按照预设规则生成若干个弱学习器,例如:按照先后顺序生成若干个弱学习器,当每个弱学习器学习完成后,计算残差并调整一次样本客户特征数据中不同特征的权重值,依次生成若干个弱学习器。
第一结点作为弱学习器的输入结点,即根结点,用于输入训练集,以及根据预设规则进行分裂,得到若干第二结点;第二结点作为弱学习器的中间结点,用于根据预设规则向下分裂得到第三结点,即叶结点;弱学习器的第三结点用于输出各个特征在此弱学习器中的权重值。
进一步地,根据预设规则进行分裂,例如,计算预约完成未开户客户特征数据集中各个特征在单个弱学习器中重要度的平均值,重要度可以通过计算结点按某个特征分裂之后残差的减少值得到,例如,计算按某个特征分裂之后残差的减少值,作为各个特征在单个弱学习器中重要度,按某个特征分裂之后残差的减少值越大,说明此特征重要度越高,并且,生成后续弱学习器时,可以根据特征的重要度更新预约完成未开户客户特征数据集中不同特征的权重值,例如,生成一个弱学习器后,根据不同特征的重要度更新预约完成未开户客户特征数据集中不同特征的权重,使得此弱学习器后一个生成的弱学习器输出结果的残差小于此弱学习器输出的结果的残差,以不断降低残差,其中,残差是指实际观察值(真值)与估计值(拟合值)之间的差。
进一步地,对多个弱学习器输出的结果进行归一化处理,得到第一预测结果,例如:对多个弱学习器输出的结果进行线性归一化处理,以去除不同特征数据之间的量纲影响,并将线性归一化处理后得到的第一预测结果,输入至线性回归模型,得到第二预测结果。
本实施例中,利用梯度提升树模型中的多个弱学习器,获取多个预测结果,将多个弱学习器的预测结果进行归一化,作为第一预测结果,提高了预测的准确性,将此第一预测结果输入至线性回归模型,得到第二预测结果,进一步提高了预测的准确性。
如上述,在一些实施例中,输入至线性回归模型,以得到第二预测结果,包括:将第一预测结果,输入至线性回归模型,利用线性回归模型进行二分类预测,得到第二预测结果,利用第二预测结果预测客户开户意愿。
利用线性回归模型进行二分类预测,得到第二预测结果,是指利用线性回归模型,得到预约未开户客户的开户概率,即第二预测结果,从而将客户划分为两类,例如:将预约未开户客户的开户概率阈值作为对客户进行分类的依据,预约未开户客户的开户概率高于阈值时将客户划分为会开户,反之则划分为不会开户。
本实施例中,将第一预测结果输入至线性回归模型,得到第二预测结果,进一步提高了预测的准确性,利用线性回归模型进行二分类预测,对预约未开户客户进行分类,直观展示了预测结果。
如上述,利用测试集对得到的组合机器学习二分类模型进行有效性评估,在一些实施例中,对得到的组合机器学习二分类模型进行有效性评估,包括:计算组合机器学习二分类模型的AUC值,判断AUC值是否大于预设数值,若是,利用组合机器学习二分类模型预测客户开户意愿,否则,利用超参数调优重新确定组合机器学习二分类模型的各项参数,更新组合机器学习二分类模型,并重新计算AUC值,直至AUC值大于预设数值。
其中,AUC值是指ROC曲线下面积,表示正类排在负类前面的概率,即模型预测正确大于模型预测不正确的概率,是判断二分类预测模型优劣的标准。
其中,ROC是指接收者操作特征曲线,ROC曲线的横坐标是假正类率,纵坐标是真正类率,相应的还有真负类率和假负类率,若一个实例是正类并且被预测为正类,即为真正类,若一个实例是正类,但是被预测成为负类,即为假负类,若一个实例是负类,但是被预测成为正类,即为假正类,若一个实例是负类,但是被预测成为负类,即为真负类。
通过计算AUC值,可以得到组合机器学习二分类模型预测正确大于模型预测不正确的概率,可以通过AUC值对组合机器学习二分类模型进行有效性评估,例如:根据实际情况预设AUC值的数值,将测试集输入至组合机器学习二分类模型,并计算AUC值,若得到的AUC值大于预设数值,可以认为此时得到的组合机器学习二分类模型预测正确的概率大于预测不正确的概率,若得到的AUC值小于预设数值,则得到的组合机器学习二分类模型预测正确的概率接近或小于预测不正确的概率,此时需要重新对组合机器学习二分类模型进行超参数调优,以更新组合机器学习二分类模型的各项参数,并重新计算AUC值,直至AUC值大于预设数值。
本实施例中,通过计算AUC值,可以对组合机器学习二分类模型进行有效性评估,得到组合机器学习二分类模型的预测效果评价,AUC值不满足预设数值,重新确定组合机器学习二分类模型的各项参数,可以提高组合机器学习二分类模型的预测效果。
如上述,将客户开户意愿预测结果排序,将高于阈值的客户推荐至外呼平台,在一些实施例中,将预测结果高于阈值的客户推荐至外呼平台,包括:将预测结果高于阈值的客户数据输出至外呼团队,以及,以AI外呼、短信和/或以人工致电的方式对预测结果高于阈值的客户进行再次营销。
其中,阈值用于限定进行推荐的客户的范围,例如,客户开户概率阈值及客户开户概率排序阈值。
在一些实施例中,可根据实际情况设定客户开户概率阈值,例如,将预测结果中客户开户概率高于0.9的客户推荐至外呼平台。
在另一些实施例中,可根据实际情况设定客户开户概率排序阈值,例如,将客户开户概率排序在前10%的客户推荐至外呼平台。
在又一些实施例中,可根据实际情况设定客户开户概率阈值与客户开户概率排序阈值,例如,将客户开户概率排序在前10%且客户开户概率高于0.9的客户推荐至外呼平台。
进一步地,对预测结果高于阈值的客户进行再次营销,例如,根据实际情况使用AI外呼、短信和/或人工致电的方式对预测结果高于阈值的客户进行再次营销,再例如,对于使用AI外呼、短信进行再次营销仍未能开户的客户,转为人工致电的方式进行再次营销。
本实施例中,将预测结果高于阈值的客户数据输出至外呼团队,根据实际情况使用AI外呼、短信和/或人工致电的方式对预测结果高于阈值的客户进行再次营销,可以提高对人力资源的利用效率以及客户的开户率。
如上述,获取银行现有客户特征数据,作为原始数据集,在一些实施例中,获取银行现有客户特征数据,包括:利用机器人流程自动化技术,获取性别,职业,年龄,城市,开户方式,预约渠道,网点银签约标识,第三方支付方式,风测答题,信用卡申请等数据。
获取银行现有客户特征数据,在一些实施例中,可以使用机器人流程自动化技术。机器人流程自动化技术(Robotic Process Automation),主要的功能是将工作信息与业务交互通过机器人来按照自先设计的流程去执行,自动完成工作信息与业务的交互。例如,机器人流程自动化技术,可以按照预先设定的获取银行现有客户特征数据流程,自动获取银行现有客户特征数据。
进一步地,获取银行现有客户的特征数据,例如:性别,职业,年龄,城市,开户方式,预约渠道,网点银行签约标识,第三方支付方式,风测答题,信用卡申请等数据,并且,可根据实际情况,选择不同的特征组合。
本实施例中,通过银行现有客户的多种特征数据,可以结合多维度的数据进行客户开户预测,提高预测的准确度。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
上述方案,根据客户特征建立组合机器学习二分类模型,对预约完成未开户的高潜客户进行筛选,实现对预约完成未开户的高潜客户进行整体评估、预测和管理,将模型识别出的高潜客户对接到外呼平台,提升客户满意度及开户率,并降低再次营销成本。
在一些实施例中,组合机器学习二分类模型,包括梯度提升树模型和线性回归模型,训练得到组合机器学习二分类模型,包括:利用训练集对梯度提升树模型和线性回归模型进行超参数模型调优,确定梯度提升树模型和线性回归模型的各项参数;以及,利用测试集对得到的组合机器学习二分类模型进行有效性评估。
在一些实施例中,输入至组合机器学习二分类模型,包括将预约未开户客户特征数据集输入至梯度提升树模型,得到第一预测结果,将第一预测结果输入至线性回归模型,得到第二预测结果。
在一些实施例中,梯度提升树模型,包括,若干个弱学习器,其中,每个弱学习器包括一个第一结点,若干第二结点及若干第三结点;
将预约完成未开户客户特征数据集输入至梯度提升树模型,包括:将预约完成未开户客户特征数据集输入至梯度提升树模型的不同弱学习器中的第一结点,不同弱学习器中的第一结点根据预设规则进行分裂,得到若干不同弱学习器第二结点,若干第二结点根据预设规则不断向下分裂,得到若干不同弱学习器第三结点;对第三结点输出的结果进行归一化处理,得到第一预测结果;将第一预测结果,输入至线性回归模型,得到第二预测结果。
在一些实施例中,输入至线性回归模型,以得到第二预测结果,包括:将第一预测结果,输入至线性回归模型,利用线性回归模型进行二分类预测,得到第二预测结果,利用第二预测结果预测客户开户意愿。
在一些实施例中,对得到的组合机器学习二分类模型进行有效性评估,包括:计算组合机器学习二分类模型的AUC值,判断AUC值是否大于预设数值,若是,利用组合机器学习二分类模型预测客户开户意愿,否则,利用超参数调优重新确定组合机器学习二分类模型的各项参数,更新组合机器学习二分类模型,并重新计算AUC值,直至AUC值大于预设数值。
在一些实施例中,将预测结果高于阈值的客户推荐至外呼平台,包括:将预测结果高于阈值的客户数据输出至外呼团队,以及,以AI外呼、短信和/或以人工致电的方式对预测结果高于阈值的客户进行再次营销。
在一些实施例中,获取银行现有客户特征数据,包括:利用机器人流程自动化技术,获取性别,职业,年龄,城市,开户方式,预约渠道,网点银行签约标识,第三方支付方式,风测答题,信用卡申请等数据。
请参阅图2,图2是本申请电子设备一实施例的框架示意图。电子设备20包括相互耦接的存储器21和处理器22,处理器22用于执行存储器21中存储的程序指令,以实现上述任一高潜客户识别方法实施例的步骤。在一个具体的实施场景中,电子设备20可以包括但不限于:微型计算机、服务器,此外,电子设备20还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器22用于控制其自身以及存储器21以实现上述任一高潜客户识别方法实施例的步骤。处理器22还可以称为CPU(Central Processing Unit,中央处理单元)。处理器22可能是一种集成电路芯片,具有信号的处理能力。处理器22还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器22可以由集成电路芯片共同实现。
请参阅图3,图3为本申请的非易失性计算机可读存储介质30一实施例的框架示意图。非易失性计算机可读存储介质30存储有能够被处理器运行的程序指令301,程序指令301用于实现上述任一高潜客户识别方法实施例的步骤。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种高潜客户识别方法,其特征在于,包括:
获取银行现有客户特征数据,作为原始数据集;
将所述原始数据集拆分为测试集与训练集,训练得到组合机器学习二分类模型;
将预约完成未开户客户特征数据输入至所述组合机器学习二分类模型,利用所述组合机器学习二分类模型预测客户开户意愿,得到客户开户意愿预测结果;
将所述客户开户意愿预测结果排序,将高于阈值的客户推荐至外呼平台。
2.如权利要求1所述的高潜客户识别方法,其特征在于,
所述组合机器学习二分类模型,包括:梯度提升树模型和线性回归模型,
所述训练得到组合机器学习二分类模型,包括:利用所述训练集对所述梯度提升树模型和所述线性回归模型进行超参数模型调优,确定所述梯度提升树模型和所述线性回归模型的各项参数;以及,
利用所述测试集对得到的所述组合机器学习二分类模型进行有效性评估。
3.如权利要求2所述的高潜客户识别方法,其特征在于,
所述输入至组合机器学习二分类模型,包括:将预约未开户客户特征数据集输入至所述梯度提升树模型,得到第一预测结果,将所述第一预测结果输入至所述线性回归模型,得到第二预测结果。
4.如权利要求3所述的高潜客户识别方法,其特征在于,
所述梯度提升树模型,包括,若干个弱学习器,其中,每个弱学习器包括一个第一结点,若干第二结点及若干第三结点;
所述将预约完成未开户客户特征数据集输入至梯度提升树模型,包括:
将所述预约完成未开户客户特征数据集输入至所述梯度提升树模型的不同弱学习器中的第一结点,所述不同弱学习器中的第一结点根据预设规则进行分裂,得到若干所述不同弱学习器的第二结点,所述若干第二结点根据预设规则不断向下分裂,得到若干所述不同弱学习器的第三结点;
对所述第三结点输出的结果进行归一化处理,得到所述第一预测结果;将所述第一预测结果,输入至所述线性回归模型,得到第二预测结果。
5.如权利要求4所述的高潜客户识别方法,其特征在于,所述输入至线性回归模型,以得到第二预测结果,包括:
将所述第一预测结果,输入至所述线性回归模型,利用所述线性回归模型进行二分类预测,得到所述第二预测结果,利用所述第二预测结果预测客户开户意愿。
6.如权利要求2任一项所述的高潜客户识别方法,其特征在于,
对得到的所述组合机器学习二分类模型进行有效性评估,包括:
计算所述组合机器学习二分类模型的AUC值,判断所述AUC值是否大于预设数值,
若是,利用所述组合机器学习二分类模型预测客户开户意愿,否则,
利用所述超参数调优重新确定所述组合机器学习二分类模型的各项参数,更新所述组合机器学习二分类模型,并重新计算所述AUC值,直至所述AUC值大于所述预设数值。
7.如权利要求1所述的高潜客户识别方法,其特征在于,
所述将预测结果高于阈值的客户推荐至外呼平台,包括:
将所述预测结果高于阈值的客户数据输出至外呼团队,以及,
以AI外呼、短信和/或以人工致电的方式对所述预测结果高于阈值的客户进行再次营销。
8.如权利要求1所述的高潜客户识别方法,其特征在于,所述获取银行现有客户特征数据,包括:
利用机器人流程自动化技术,获取性别,职业,年龄,城市,开户方式,预约渠道,网点银行签约标识,第三方支付方式,风测答题,信用卡申请等数据。
9.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至8任一项所述的高潜客户识别方法。
10.一种非易失性计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至8任一项所述的高潜客户识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210734034.8A CN115099934A (zh) | 2022-06-25 | 2022-06-25 | 一种高潜客户识别方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210734034.8A CN115099934A (zh) | 2022-06-25 | 2022-06-25 | 一种高潜客户识别方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115099934A true CN115099934A (zh) | 2022-09-23 |
Family
ID=83292907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210734034.8A Pending CN115099934A (zh) | 2022-06-25 | 2022-06-25 | 一种高潜客户识别方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115099934A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116934438A (zh) * | 2023-04-14 | 2023-10-24 | 济南明泉数字商务有限公司 | 一种基于chatGPT模型和算力的AI竞拍决策方法及系统 |
-
2022
- 2022-06-25 CN CN202210734034.8A patent/CN115099934A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116934438A (zh) * | 2023-04-14 | 2023-10-24 | 济南明泉数字商务有限公司 | 一种基于chatGPT模型和算力的AI竞拍决策方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740657B (zh) | 一种用于图像数据分类的神经网络模型的训练方法与设备 | |
US20210365963A1 (en) | Target customer identification method and device, electronic device and medium | |
CN111444952B (zh) | 样本识别模型的生成方法、装置、计算机设备和存储介质 | |
US11227217B1 (en) | Entity transaction attribute determination method and apparatus | |
CN112633962B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN111815169B (zh) | 业务审批参数配置方法及装置 | |
CN110995459B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN111754044B (zh) | 员工行为审计方法、装置、设备及可读存储介质 | |
CN111582341B (zh) | 用户异常操作预测方法及装置 | |
CN111797320B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN110516057B (zh) | 一种信访问题答复方法及装置 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN111061948B (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN113205403A (zh) | 一种企业信用等级的计算方法、装置、存储介质及终端 | |
CN116915710A (zh) | 流量预警方法、装置、设备及可读存储介质 | |
CN110378739B (zh) | 一种数据流量匹配方法及装置 | |
CN112328869A (zh) | 一种用户贷款意愿的预测方法、装置及计算机系统 | |
CN115099934A (zh) | 一种高潜客户识别方法、电子设备和存储介质 | |
CN110569363A (zh) | 一种决策流组件生成方法、装置、电子设备及存储介质 | |
US20220156573A1 (en) | Machine Learning Engine Providing Trained Request Approval Decisions | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN116912016A (zh) | 一种账单稽核方法和装置 | |
CN111091460A (zh) | 一种数据处理方法及装置 | |
CN110087230B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN112734352A (zh) | 一种基于数据维度的单据审核方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |