CN117670393A - 目标意向客户的确定方法及装置、电子设备、存储介质 - Google Patents
目标意向客户的确定方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN117670393A CN117670393A CN202311635912.1A CN202311635912A CN117670393A CN 117670393 A CN117670393 A CN 117670393A CN 202311635912 A CN202311635912 A CN 202311635912A CN 117670393 A CN117670393 A CN 117670393A
- Authority
- CN
- China
- Prior art keywords
- client
- target
- grouping
- information
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004458 analytical method Methods 0.000 claims abstract description 149
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 47
- 239000013598 vector Substances 0.000 claims description 92
- 238000013507 mapping Methods 0.000 claims description 21
- 238000000611 regression analysis Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 12
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 12
- 238000012417 linear regression Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种目标意向客户的确定方法及装置、电子设备、存储介质,涉及大数据技术领域或其他相关领域,其中,该方法包括:获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,M为正整数;基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,N为正整数;根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,第一分析结果中包含N个影响程度值;基于第一分析结果中的N个影响程度值确定目标意向客户,并向目标意向客户推送目标金融业务。本发明解决了相关技术中现有EM算法不能做到对客户进行准确分类,对客户信息进行分析后得到的分析结果不够准确、可靠性较低的技术问题。
Description
技术领域
本发明涉及大数据技术领域,具体而言,涉及一种目标意向客户的确定方法及装置、电子设备、存储介质。
背景技术
目前,金融机构使用大数据平台和机器学习技术对金融系统中的客户进行行为分析,以判断不同客户的投资种类、投资倾向和经济状况,推算他们对不同营销方案的接受程度,来吸引到更多的客户办理指定业务(例如,个人养老金业务),同时,通过对已经办理指定业务的客户(例如,已经开通个人养老金账户的客户)进行行为分析还可以推断缴存金额不同的客户选择当前缴存金额的原因,以此为依据对指定业务进行改进,来吸引更多客户增加当前缴存金额。
相关技术中,由于客户信息的数据量很大且维度很高,使用机器学习技术对大数据平台中的海量客户信息进行分析的运算量巨大,且成本过高;另外,当前使用率较高的算法(例如,最大期望算法)往往要求运算过程不断线,这对运算平台的持续性要求过高,导致运算失败的风险增大;还有,有些指定业务的正面数据较少(例如,个人养老金缴存金额超过指定阈值的客户仅为全部客户的2%),若分组不合理,在运算过程中这些正面数据极易被算法当成误差排除掉,导致运算结果出现严重偏差。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标意向客户的确定方法及装置、电子设备、存储介质,以至少解决相关技术中现有EM算法不能做到对客户进行准确分类,对客户信息进行分析后得到的分析结果不够准确、可靠性较低的技术问题。
根据本发明实施例的一个方面,提供了一种目标意向客户的确定方法,包括:获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,所述目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数;基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果,其中,每个所述指定分组条件对应一个所述分组结果,每个所述分组结果中包含R个客户群体以及每个所述客户群体中所述目标客户的所述客户信息,N为正整数,R为小于等于M的正整数;根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果,其中,所述第一分析结果中包含N个影响程度值,每个所述影响程度值对应一个所述分组结果,所述影响程度值用于指示所述指定分组条件对所述目标客户是否办理所述目标金融业务的客户决策的影响程度大小;基于所述第一分析结果中的所述N个影响程度值在所述N个分组结果中确定目标意向客户,并向所述目标意向客户推送所述目标金融业务。
可选地,基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果的步骤,包括:接收金融系统前端传输的所述N个指定分组条件;将所述客户信息集合中的M个所述目标客户的所述客户信息映射至几何空间,得到M个信息点,其中,每个所述信息点对应一个所述目标客户;对于每个所述指定分组条件,通过预设聚类算法依据所述指定分组条件在所述M个信息点中确定R个分组簇点;依据R个所述分组簇点将所有所述信息点分为R个信息组,并基于所述R个信息组确定R个所述客户群体;按照R个所述客户群体对所有所述客户信息进行整理,得到所述分组结果。
可选地,依据R个所述分组簇点将所有所述信息点分为R个信息组的步骤,包括:基于R个所述分组簇点建立R个初始信息组,并将M个所述信息点中除R个所述分组簇点以外的所有所述信息点确定为其他信息点;对于每个所述其他信息点,在所述几何空间中分别计算R个所述分组簇点与所述其他信息点之间的空间距离,得到R个距离值,并在所述R个距离值中确定最小距离值;确定所述最小距离值对应的所述分组簇点以及该分组簇点对应的所述初始信息组,并将所述最小距离值对应的所述其他信息点归并至该初始信息组;对所有所述其他信息点进行归并,直至所有所述其他信息点归并完毕,得到R个所述信息组。
可选地,根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果的步骤,包括:对于每个所述分组结果中的每个所述目标客户,确定客户状态标签,其中,所述客户状态标签用于指示所述目标客户是否已经办理所述目标金融业务,所述客户状态标签包括:已办理或未办理;对于每个所述分组结果,将所述分组结果输入至特征分析器,输出特征分析结果,其中,所述特征分析器预置所述预设分析策略,所述特征分析器用于在目标向量空间中对所述分组结果中的所有所述客户信息进行特征运算;整合所有所述分组结果对应的所述特征分析结果,得到所述第一分析结果。
可选地,将所述分组结果输入至特征分析器,输出特征分析结果的步骤,包括:对于所述分组结果中的每个所述目标客户,将所述目标客户的所述客户信息映射至所述目标向量空间,得到特征向量集合,其中,所述特征向量集合用于存储所述客户信息在所述目标向量空间中映射得到的特征向量;基于预设编码规则将所述目标客户的所述客户状态标签转化为数字标签编码;在所述目标向量空间中基于回归分析算法和所述数字标签编码对所述特征向量集合中的所有所述特征向量进行权重运算,得到权重运算结果,其中,所述权重运算结果用于记录每个所述特征向量对应的权值;基于所述权重运算结果和所述数字标签编码对每个所述特征向量进行线性加权求和,得到所述分组结果对应的所述指定分组条件的所述影响程度值,并将所述影响程度值作为所述特征分析结果。
可选地,在根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果之后,还包括:对于所述第一分析结果中的每个所述影响程度值,确定比较结果,其中,所述比较结果用于指示所述影响程度值是否小于等于第二预设阈值;在所述比较结果指示所述影响程度值小于等于第二预设阈值的情况下,筛选每个所述分组结果中客户状态标签为已办理的所述目标客户;对于每个所述分组结果中的每个所述客户群体,复制已筛选出的所述目标客户的所述客户信息,得到伪信息;为每个所述伪信息创建虚拟客户名;将所述虚拟客户名加入至所述客户群体中,并将所述伪信息加入至所述客户群体所在的所述分组结果中;根据所述预设分析策略和更新后的所述分组结果对所有所述客户信息进行重新分析,得到所述第一分析结果。
可选地,在基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果之前,还包括:对于每个所述目标客户,获取所述目标客户对所述目标金融业务的缴存数额;根据所述缴存数额确定所述目标客户的客户属性,其中,所述客户属性包括:稳定型或非稳定型;将所述客户属性为稳定型的所述目标客户以及所述目标客户的所述客户信息输入至特征分析器,输出第二分析结果,其中,所述特征分析器用于在向量空间中计算每个所述客户信息与所述缴存数额的关联度,并在所有所述关联度中确定最大关联度,所述第二分析结果用于指示所述最大关联度对应的所述客户信息;基于所述第二分析结果在所有所述目标客户中确定目标缴存意向客户,并向所述目标缴存意向客户推送目标金融业务缴存信息。
根据本发明实施例的另一方面,还提供了一种目标意向客户的确定装置,包括:获取单元,用于获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,所述目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数;分组单元,用于基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果,其中,每个所述指定分组条件对应一个所述分组结果,每个所述分组结果中包含R个客户群体以及每个所述客户群体中所述目标客户的所述客户信息,N为正整数,R为小于等于M的正整数;分析单元,用于根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果,其中,所述第一分析结果中包含N个影响程度值,每个所述影响程度值对应一个所述分组结果,所述影响程度值用于指示所述指定分组条件对所述目标客户是否办理所述目标金融业务的客户决策的影响程度大小;确定单元,用于基于所述第一分析结果中的所述N个影响程度值在所述N个分组结果中确定目标意向客户,并向所述目标意向客户推送所述目标金融业务。
可选地,所述分组单元包括:接收模块,用于接收金融系统前端传输的所述N个指定分组条件;映射模块,用于将所述客户信息集合中的M个所述目标客户的所述客户信息映射至几何空间,得到M个信息点,其中,每个所述信息点对应一个所述目标客户;第一确定模块,用于对于每个所述指定分组条件,通过预设聚类算法依据所述指定分组条件在所述M个信息点中确定R个分组簇点;第二确定模块,用于依据R个所述分组簇点将所有所述信息点分为R个信息组,并基于所述R个信息组确定R个所述客户群体;整理模块,用于按照R个所述客户群体对所有所述客户信息进行整理,得到所述分组结果。
可选地,所述第二确定模块包括:建立子模块,用于基于R个所述分组簇点建立R个初始信息组,并将M个所述信息点中除R个所述分组簇点以外的所有所述信息点确定为其他信息点;计算子模块,用于对于每个所述其他信息点,在所述几何空间中分别计算R个所述分组簇点与所述其他信息点之间的空间距离,得到R个距离值,并在所述R个距离值中确定最小距离值;确定子模块,用于确定所述最小距离值对应的所述分组簇点以及该分组簇点对应的所述初始信息组,并将所述最小距离值对应的所述其他信息点归并至该初始信息组;归并子模块,用于对所有所述其他信息点进行归并,直至所有所述其他信息点归并完毕,得到R个所述信息组。
可选地,所述分析单元包括:第三确定模块,用于对于每个所述分组结果中的每个所述目标客户,确定客户状态标签,其中,所述客户状态标签用于指示所述目标客户是否已经办理所述目标金融业务,所述客户状态标签包括:已办理或未办理;第一输入模块,用于对于每个所述分组结果,将所述分组结果输入至特征分析器,输出特征分析结果,其中,所述特征分析器预置所述预设分析策略,所述特征分析器用于在目标向量空间中对所述分组结果中的所有所述客户信息进行特征运算;整合模块,用于整合所有所述分组结果对应的所述特征分析结果,得到所述第一分析结果。
可选地,所述第一输入模块包括:映射子模块,用于对于所述分组结果中的每个所述目标客户,将所述目标客户的所述客户信息映射至所述目标向量空间,得到特征向量集合,其中,所述特征向量集合用于存储所述客户信息在所述目标向量空间中映射得到的特征向量;转化子模块,用于基于预设编码规则将所述目标客户的所述客户状态标签转化为数字标签编码;运算子模块,用于在所述目标向量空间中基于回归分析算法和所述数字标签编码对所述特征向量集合中的所有所述特征向量进行权重运算,得到权重运算结果,其中,所述权重运算结果用于记录每个所述特征向量对应的权值;求和子模块,用于基于所述权重运算结果和所述数字标签编码对每个所述特征向量进行线性加权求和,得到所述分组结果对应的所述指定分组条件的所述影响程度值,并将所述影响程度值作为所述特征分析结果。
可选地,所述目标意向客户的确定装置还包括:第四确定模块,用于对于所述第一分析结果中的每个所述影响程度值,确定比较结果,其中,所述比较结果用于指示所述影响程度值是否小于等于第二预设阈值;筛选模块,用于在所述比较结果指示所述影响程度值小于等于第二预设阈值的情况下,筛选每个所述分组结果中客户状态标签为已办理的所述目标客户;复制模块,用于对于每个所述分组结果中的每个所述客户群体,复制已筛选出的所述目标客户的所述客户信息,得到伪信息;创建模块,用于为每个所述伪信息创建虚拟客户名;加入模块,用于将所述虚拟客户名加入至所述客户群体中,并将所述伪信息加入至所述客户群体所在的所述分组结果中;分析模块,用于根据所述预设分析策略和更新后的所述分组结果对所有所述客户信息进行重新分析,得到所述第一分析结果。
可选地,所述目标意向客户的确定装置还包括:获取模块,用于对于每个所述目标客户,获取所述目标客户对所述目标金融业务的缴存数额;第五确定模块,用于根据所述缴存数额确定所述目标客户的客户属性,其中,所述客户属性包括:稳定型或非稳定型;第二输入模块,用于将所述客户属性为稳定型的所述目标客户以及所述目标客户的所述客户信息输入至特征分析器,输出第二分析结果,其中,所述特征分析器用于在向量空间中计算每个所述客户信息与所述缴存数额的关联度,并在所有所述关联度中确定最大关联度,所述第二分析结果用于指示所述最大关联度对应的所述客户信息;第六确定模块,用于基于所述第二分析结果在所有所述目标客户中确定目标缴存意向客户,并向所述目标缴存意向客户推送目标金融业务缴存信息。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的目标意向客户的确定方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的目标意向客户的确定方法。
本发明中,提出一种目标意向客户的确定方法,先获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数,再基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,N为正整数,R为小于等于M的正整数,然后根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小,最后基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
本发明中,利用金融系统数据库获取与目标金融业务关联度较高的客户作为本次目标客户,获取数据库中这些目标客户的客户信息,得到客户信息集合,再利用预设的指定分组条件对所有目标客户进行分组,相应也将目标客户对应的客户进行分组,通过对每组内的客户信息进行针对性分析得到每组对应的指定分组条件对这些客户是否办理目标金融业务的客户决策的影响程度大小进行计算,得到用于量化影响程度大小的影响程度值,最后利用计算得到的所有指定分组条件对客户决策的影响程度值在所有客户分组中选取最有意愿办理目标金融业务的目标意向客户,并向这些目标意向客户针对性推送目标金融业务的相关业务信息,本发明通过金融系统数据库选取与目标金融业务关联度较高的目标客户,通过N个指定分组条件对所有目标客户进行精细化分类,通过预设分析策略对精细化分类后各客户组的客户信息进行分析,得到各指定分组条件对客户决策的影响程度值,以影响程度值为依据在所有客户组中选取目标意向客户,向目标意向客户推送目标金融业务,可以做到准确分类和精确分析,进而解决了相关技术中现有EM算法不能做到对客户进行准确分类,对客户信息进行分析后得到的分析结果不够准确、可靠性较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的目标意向客户的确定方法的流程图;
图2是根据本发明实施例的一种可选的目标缴存意向客户的确定方法的流程图;
图3是根据本发明实施例的一种可选的基于K-means算法和线性回归算法的客户确定方法的流程图;
图4是根据本发明实施例的一种可选的目标意向客户的确定装置的示意图;
图5是根据本发明实施例的一种用于目标意向客户的确定方法的电子设备(或移动设备)的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或名词做出解释:
K-means,一种基于距离度量的聚类算法,将样本分为K个不重叠的簇,使得每个样本与所属簇的均值(质心)的距离最小化,迭代更新簇的质心直到收敛,适用于几何空间中的点集聚类。
DBSCAN,一种基于密度的聚类算法,通过定义邻域半径和最小样本数来划定核心对象和边界对象,并根据样本的密度连接性来构建聚类,可以自动发现任意形状的聚类并处理噪声点。
层次聚类,一种自底向上或自顶向下的聚类方法,通过计算样本之间的相似性或距离来构建层次结构,然后逐步合并或划分聚类,直到达到预定的停止条件,可以生成聚类的分层表示,并且不需要事先指定聚类数量。
OPTICS,一种基于密度的聚类算法,类似于DBSCAN,通过计算样本之间的可达距离和核心距离来划定核心对象和边界对象,并根据样本的可达性关系构建聚类结构。OPTICS能够克服DBSCAN在参数选择上的不确定性,提供更灵活的聚类结果。
线性回归,一种基础回归分析算法,假设特征与目标变量之间存在线性关系并通过拟合一个线性模型来预测目标变量,通过最小化预测值与实际观测值之间的残差平方和来确定模型参数,适用于特征与目标变量之间呈现线性关系的情况。
岭回归,一种用于处理多重共线性问题的回归分析算法,在,岭回归通过在损失函数中引入正则化项(即L2范数)解决了多重共线性中特征之间存在高度相关性导致传统线性回归模型不稳定的问题。
Lasso回归,一种用于处理多重共线性问题的回归分析算法,与岭回归类似,不同的是,Lasso回归采用了L1范数作为正则化项,L1范数具有稀疏性,即它倾向于将特征的权重压缩到零,从而实现特征选择,Lasso回归可以用于特征选择和降维,有助于剔除对目标变量影响较小的特征。
需要说明的是,本发明中的目标意向客户的确定方法及装置可用于大数据技术领域在对指定业务的目标意向客户进行确定和业务推送的情况下,也可用于除大数据领域之外的任何领域在对指定业务的目标意向客户进行确定和业务推送的情况下,本发明中对目标意向客户的确定方法及其装置的应用领域不做限定。
需要说明的是,本发明所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关地区的法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
本发明下述各实施例可应用于各种需要对指定业务的目标意向客户进行确定和业务推送的系统/应用/设备中,能够实现通过金融系统数据库选取与目标金融业务关联度较高的目标客户,通过N个指定分组条件对所有目标客户进行精细化分类,通过预设分析策略对精细化分类后各客户组的客户信息进行分析,得到各指定分组条件对客户决策的影响程度值,以影响程度值为依据在所有客户组中选取目标意向客户,向目标意向客户推送目标金融业务,可以做到准确分类和精确分析。
下面结合各个实施例来详细说明本发明。
实施例一
根据本发明实施例,提供了一种目标意向客户的确定方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的目标意向客户的确定方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,M为正整数。
步骤S102,基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,N为正整数。
步骤S103,根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小。
步骤S104,基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
通过上述步骤,可以先获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数,再基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,然后根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小,最后基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
本发明实施例中,利用金融系统数据库获取与目标金融业务关联度较高的客户作为本次目标客户,获取数据库中这些目标客户的客户信息,得到客户信息集合,再利用预设的指定分组条件对所有目标客户进行分组,相应也将目标客户对应的客户进行分组,通过对每组内的客户信息进行针对性分析得到每组对应的指定分组条件对这些客户是否办理目标金融业务的客户决策的影响程度大小进行计算,得到用于量化影响程度大小的影响程度值,最后利用计算得到的所有指定分组条件对客户决策的影响程度值在所有客户分组中选取最有意愿办理目标金融业务的目标意向客户,并向这些目标意向客户针对性推送目标金融业务的相关业务信息,本实施例通过金融系统数据库选取与目标金融业务关联度较高的目标客户,通过N个指定分组条件对所有目标客户进行精细化分类,通过预设分析策略对精细化分类后各客户组的客户信息进行分析,得到各指定分组条件对客户决策的影响程度值,以影响程度值为依据在所有客户组中选取目标意向客户,向目标意向客户推送目标金融业务,可以做到准确分类和精确分析,进而解决了相关技术中现有EM算法不能做到对客户进行准确分类,对客户信息进行分析后得到的分析结果不够准确、可靠性较低的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
本发明实施例的实施主体可以是金融业务系统,结合金融业务系统的筛选机制、机器学习技术、数据挖掘技术以及特征分析工具对海量客户信息进行分析,得到对目标金融业务的办理意愿较高的目标客户,向这些客户精准定向推送相关业务信息。
步骤S101,获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,M为正整数。
需要说明的是,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,本发明实施例中的金融业务系统和金融系统数据库是带有筛选和查找机制的,通过输入特定的目标金融业务(例如,个人养老金业务)可以命令金融业务系统自动筛选出与该目标金融业务的关联度大于第一预设阈值的所有目标客户,并命令金融系统数据库调取所有目标客户的客户信息并对这些客户信息进行输出,其中,客户信息包括但不限于:年收入、资产总额和贷款情况等。
步骤S102,基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,N为正整数。
需要说明的是,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,其中,R为小于等于M的正整数。
需要说明的是,指定分组条件是预先设定的,指定分组条件的来源可以是:金融系统数据库中的历史参考条件、询问客户关切的参考条件,其中,历史参考条件是指金融系统在以往对同一目标金融业务的目标意向客户进行确定时所采用的分组条件,客户关切的参考条件是指在常规业务运营维护的过程中通过调查问卷等方式采集的客户反馈中有关目标金融业务办理的条件信息。
需要说明的是,指定分组条件应该与客户信息有一定的关联关系,但不一定是一一对照的关系,举例说明,若采集的客户信息包括年收入、资产总额和贷款情况,则可以将指定分组条件设定为:收入档位、存款指数和贷款数量,其中,将收入档位设定为:高收入、中收入和低收入,每个收入档位对应一个金额区间,使得客户信息中的年收入可以落在其中一个金额区间,使得客户信息所属的目标客户可以对应一个收入档位特征。
另外,本发明实施例还可以设定存款指数的计算公式为:年存款占年收入的比例份额,具体的分组条件设置可以基于具体的目标金融业务的实际情况进行变动,本实施例在此不做限制。
可选地,步骤S102包括:接收金融系统前端传输的N个指定分组条件;将客户信息集合中的M个目标客户的客户信息映射至几何空间,得到M个信息点,其中,每个信息点对应一个目标客户;对于每个指定分组条件,通过预设聚类算法依据指定分组条件在M个信息点中确定R个分组簇点;依据R个分组簇点将所有信息点分为R个信息组,并基于R个信息组确定R个客户群体;按照R个客户群体对所有客户信息进行整理,得到分组结果。
本发明实施例还以客户信息包括年收入、资产总额和贷款情况为例对上述步骤进行详细说明。在指定分组条件设定为:收入档位、存款指数和贷款数量的情况下,基于指定分组条件建立几何空间,将客户信息转化为信息点,每个信息点以年收入、资产总额和贷款情况作为唯一的空间坐标,基于空间坐标将所有信息点映射至几何空间,再通过预设聚类算法对集合空间中的所有信息点进行聚类,得到聚类结果,再基于聚类结果生成客户分组结果。
需要说明的是,可以选用下述任意一种算法作为预设聚类算法:K-means聚类算法、DBSCAN聚类算法、层次聚类算法或者OPTICS聚类算法;在使用预设聚类算法对所有信息点进行聚类时,聚类簇点可以由算法随机指定,也可根据目标金融业务的实际情况进行预先指定,例如,可以指定已办理目标金融业务的目标客户对应的信息点为分类簇点。
可选地,依据R个分组簇点将所有信息点分为R个信息组的步骤,包括:基于R个分组簇点建立R个初始信息组,并将M个信息点中除R个分组簇点以外的所有信息点确定为其他信息点;对于每个其他信息点,在几何空间中分别计算R个分组簇点与其他信息点之间的空间距离,得到R个距离值,并在R个距离值中确定最小距离值;确定最小距离值对应的分组簇点以及该分组簇点对应的初始信息组,并将最小距离值对应的其他信息点归并至该初始信息组;对所有其他信息点进行归并,直至所有其他信息点归并完毕,得到R个信息组。
需要说明的是,在几何空间中计算两个信息点之间的空间距离时可以采用以下任意一种衡量方式:欧几里得距离、曼哈顿距离、切比雪夫距离或者马哈拉诺比斯距离,其中,N维空间中以欧几里得距离为首选的衡量方式,欧氏距离可以计算N维空间中任意两个点之间的直线距离值;曼哈顿距离可以计算任意两点沿坐标轴的绝对差值之和,也称为城市街区距离;切比雪夫距离可以计算任意两点沿坐标轴的最大差值,也称为棋盘距离;马哈拉诺比斯距离考虑了两点的坐标变量之间的相关性,通过数据标准化以及各维度的协方差矩阵计算两点距离。本发明实施例中可以基于具体的目标金融业务的实际情况选择最合适的距离衡量方式。
步骤S103,根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小。
需要说明的是,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,每个影响程度值也对应一个指定分组条件。
可选地,步骤S103包括:对于每个分组结果中的每个目标客户,确定客户状态标签,其中,客户状态标签用于指示目标客户是否已经办理目标金融业务,客户状态标签包括:已办理或未办理;对于每个分组结果,将分组结果输入至特征分析器,输出特征分析结果,其中,特征分析器预置预设分析策略,特征分析器用于在目标向量空间中对分组结果中的所有客户信息进行特征运算;整合所有分组结果对应的特征分析结果,得到第一分析结果。
需要说明的是,特征分析器可以采用传统的统计分析方法,也可以使用人工智能模型或者机器学习模型进行特征分析,针对本发明实施例中的海量客户数据,采用人工智能模型或者机器学习模型能够更好的挖掘海量客户数据中的潜在信息。
可选地,将分组结果输入至特征分析器,输出特征分析结果的步骤,包括:对于分组结果中的每个目标客户,将目标客户的客户信息映射至目标向量空间,得到特征向量集合,其中,特征向量集合用于存储客户信息在目标向量空间中映射得到的特征向量;基于预设编码规则将目标客户的客户状态标签转化为数字标签编码;在目标向量空间中基于回归分析算法和数字标签编码对特征向量集合中的所有特征向量进行权重运算,得到权重运算结果,其中,权重运算结果用于记录每个特征向量对应的权值;基于权重运算结果和数字标签编码对每个特征向量进行线性加权求和,得到分组结果对应的指定分组条件的影响程度值,并将影响程度值作为特征分析结果。
需要说明的是,目标向量空间是指对客户信息进行特征分析的特征向量空间,该特征向量空间中将每一个客户信息表示为高维特征向量,每一个维度对应一个客户特征,每一个客户都在该目标向量空间中对应一个客户特征点。
需要说明的是,在目标向量空间中基于回归分析算法和数字标签编码对特征向量集合中的所有特征向量进行权重运算,得到权重运算结果的步骤包括:将特征向量集合转换为矩阵形式,得到特征矩阵,其中,特征矩阵的每一行代表一个特征向量;使用预设编码规则对特征矩阵进行数字标签编码,得到特征编码矩阵,其中,预设编码规则选用下述任意一种:独热编码或标签编码;使用回归分析算法对特征编码矩阵和数字标签编码进行运算,得到每行元素对应的元素权值,其中,回归分析算法选用下述任意一种:线性回归、岭回归、Lasso回归,元素权值用于指示每行元素对数字标签编码的贡献程度;将每行元素对应的特征向量与元素权值进行关联,得到每个特征向量对应的权值;整合所有特征向量对应的权值,得到权重运算结果。
可选地,在执行步骤S103之后还包括:对于第一分析结果中的每个影响程度值,确定比较结果,其中,比较结果用于指示影响程度值是否小于等于第二预设阈值;在比较结果指示影响程度值小于等于第二预设阈值的情况下,筛选每个分组结果中客户状态标签为已办理的目标客户;对于每个分组结果中的每个客户群体,复制已筛选出的目标客户的客户信息,得到伪信息;为每个伪信息创建虚拟客户名;将虚拟客户名加入至客户群体中,并将伪信息加入至客户群体所在的分组结果中;根据预设分析策略和更新后的分组结果对所有客户信息进行重新分析,得到第一分析结果。
需要说明的是,对于某些正向数据过少的特定金融业务(例如,个人养老金缴存金额超过指定阈值的客户仅为全部客户的2%),在运算过程中这些正向数据极易被算法当成误差排除掉,导致运算结果出现严重偏差,因此,若在运算过程中出现严重不合理的运算结果(即,比较结果指示影响程度值小于等于第二预设阈值),可以将目标金融业务的正向数据复制一份并加入到原始数据中参与运算,防止运算偏差。
步骤S104,基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
本发明实施例中除了上述对未办理目标金融业务的目标客户的客户信息进行特征运算,确定关于办理目标金融业务的目标意向客户的方法之外,还可以对已办理目标金融业务的目标客户的客户信息进行特征分析,确定关于增加目标金融业务的缴存金额的目标缴存意向客户。
图2是根据本发明实施例的一种可选的目标缴存意向客户的确定方法的流程图,如图2所示,该方法包括如下步骤:
步骤S201,对于每个目标客户,获取目标客户对目标金融业务的缴存数额。
步骤S202,根据缴存数额确定目标客户的客户属性,其中,客户属性包括:稳定型或非稳定型。
步骤S203,将客户属性为稳定型的目标客户以及目标客户的客户信息输入至特征分析器,输出第二分析结果,其中,特征分析器用于在向量空间中计算每个客户信息与缴存数额的关联度,并在所有关联度中确定最大关联度,第二分析结果用于指示最大关联度对应的客户信息。
步骤S204,基于第二分析结果在所有目标客户中确定目标缴存意向客户,并向目标缴存意向客户推送目标金融业务缴存信息。
本发明实施例中,可以通过金融业务系统的筛选机制、机器学习技术、数据挖掘技术以及特征分析工具对海量客户信息进行分析,得到对目标金融业务的办理意愿较高的目标客户,向这些客户精准定向推送相关业务信息。
本发明实施例中,还可以通过特征分析器对所有分组后的目标客户的客户信息进行特征分析,计算每条指定分组条件对客户决策的影响程度值,以影响程度值为依据确定每个目标客户对于办理目标金融业务的意向。
本发明实施例中还通过对正向数据复制为伪数据,并将伪数据加入至原始数据集合中参与特征运算,避免了因正向数据比例过低导致特征分析器的误差校正机制将正向数据当成误差数据不允许参与运算,最后导致特征运算的结果严重出错的问题。
本发明实施例除了可以对未办理目标金融业务的目标客户的客户信息进行特征运算,确定关于办理目标金融业务的目标意向客户,还可以利用特征分析器对已办理目标金融业务的目标客户的客户信息进行特征分析,确定关于增加目标金融业务的缴存金额的目标缴存意向客户。
下面结合另一种具体的实施方式来说明本发明。
本发明实施方式中选取K-means算法和线性回归算法对客户数据进行分类和特征分析,确定有意向开通个人养老金账户的目标意向客户,以及有意向增加个人养老金缴存金额的目标缴存意向客户。
图3是根据本发明实施例的一种可选的基于K-means算法和线性回归算法的客户确定方法的流程图,如图3所示,该方法包括如下步骤:
步骤S301,获取所有涉及个人养老金业务办理的目标客户的客户信息,得到客户信息集合,其中,客户信息包括:客户收入值、存款总额和贷款数量。
步骤S302,基于客户信息设定分组条件,其中,分组条件包括:收入档位、存款指数和贷款数量。
需要说明的是,将收入档位设定为:高收入、中收入和低收入,每个收入档位对应一个金额区间,使得客户信息中的客户收入值可以落在其中一个金额区间,使得客户信息所属的目标客户可以对应一个收入档位特征;设定存款指数的计算公式为:年存款占年收入的比例份额。
步骤S303,基于K-means聚类算法、分组条件对客户信息集合中的所有客户信息进行聚类,得到聚类结果。
需要说明的是,基于分组条件建立几何空间,将客户信息转化为信息点,每个信息点以客户收入值、存款总额和贷款数量作为唯一的空间坐标,基于空间坐标将所有信息点映射至几何空间,再通过预设聚类算法对集合空间中的所有信息点进行聚类,得到聚类结果。
在进行聚类时,聚类簇点可以由算法随机指定,也可根据个人养老金业务的实际情况进行预先指定,例如,可以指定已开通个人养老金账户的目标客户对应的信息点为分类簇点。
步骤S304,基于聚类结果和客户信息集合对所有涉及个人养老金业务办理的目标客户进行分组,得到T个客户组,其中,T为正整数。
步骤S305,使用预置线性回归算法的特征分析器以客户组为单位,将每个客户组中所有客户的客户信息映射至特征向量空间进行特征分析,得到每个分组条件对客户决策的影响程度值。
需要说明的是,客户决策是指客户是否办理个人养老金的决定,客户决策与业务办理状态相对应,业务办理状态包括:已办理和未办理。
特征分析的步骤包括:将目标客户的客户信息映射至特征向量空间,得到特征向量集合,其中,特征向量集合用于存储客户信息在特征向量空间中映射得到的特征向量;基于预设编码规则将目标客户的业务办理状态转化为数字标签编码;在特征向量空间中基于线性算法和数字标签编码对特征向量集合中的所有特征向量进行权重运算,得到权重运算结果,其中,权重运算结果用于记录每个特征向量对应的权值;基于权重运算结果和数字标签编码对每个特征向量进行线性加权求和,得到分组结果对应的指定分组条件的影响程度值。
在特征向量空间中基于线性算法和数字标签编码对特征向量集合中的所有特征向量进行权重运算,得到权重运算结果的步骤包括:将特征向量集合转换为矩阵形式,得到特征矩阵,其中,特征矩阵的每一行代表一个特征向量;使用预设编码规则对特征矩阵进行数字标签编码,得到特征编码矩阵;使用线性回归算法对特征编码矩阵和数字标签编码进行运算,得到每行元素对应的元素权值,元素权值用于指示每行元素对数字标签编码的贡献程度;将每行元素对应的特征向量与元素权值进行关联,得到每个特征向量对应的权值;整合所有特征向量对应的权值,得到权重运算结果。
步骤S306,基于所有分组条件对客户决策的影响程度值在T个客户组中确定有意向开通个人养老金账户的目标意向客户,以及有意向增加个人养老金缴存金额的目标缴存意向客户。
本发明实施例中,可以通过金融业务系统的筛选机制、机器学习技术、数据挖掘技术以及特征分析工具对海量客户信息进行分析,得到对目标金融业务的办理意愿较高的目标客户,向这些客户精准定向推送相关业务信息。
本发明实施例中,还可以通过特征分析器对所有分组后的目标客户的客户信息进行特征分析,计算每条指定分组条件对客户决策的影响程度值,以影响程度值为依据确定每个目标客户对于办理目标金融业务的意向。
本发明实施例中还通过对正向数据复制为伪数据,并将伪数据加入至原始数据集合中参与特征运算,避免了因正向数据比例过低导致特征分析器的误差校正机制将正向数据当成误差数据不允许参与运算,最后导致特征运算的结果严重出错的问题。
本发明实施例除了可以对未办理目标金融业务的目标客户的客户信息进行特征运算,确定关于办理目标金融业务的目标意向客户,还可以利用特征分析器对已办理目标金融业务的目标客户的客户信息进行特征分析,确定关于增加目标金融业务的缴存金额的目标缴存意向客户。
下面结合另一种可选的实施例来说明本发明。
实施例二
本实施例中提供的一种目标意向客户的确定装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图4是根据本发明实施例的一种可选的目标意向客户的确定装置的示意图,如图4所示,该装置可以包括:获取单元41,分组单元42,分析单元43,确定单元44。
其中,获取单元41,用于获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数。
分组单元42,用于基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,N为正整数,R为小于等于M的正整数。
分析单元43,用于根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小。
确定单元44,用于基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
上述目标意向客户的确定装置,可以先通过获取单元41获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数,再通过分组单元42基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,N为正整数,R为小于等于M的正整数,然后通过分析单元43根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小,最后通过确定单元44基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
在本发明实施例中,利用金融系统数据库获取与目标金融业务关联度较高的客户作为本次目标客户,获取数据库中这些目标客户的客户信息,得到客户信息集合,再利用预设的指定分组条件对所有目标客户进行分组,相应也将目标客户对应的客户进行分组,通过对每组内的客户信息进行针对性分析得到每组对应的指定分组条件对这些客户是否办理目标金融业务的客户决策的影响程度大小进行计算,得到用于量化影响程度大小的影响程度值,最后利用计算得到的所有指定分组条件对客户决策的影响程度值在所有客户分组中选取最有意愿办理目标金融业务的目标意向客户,并向这些目标意向客户针对性推送目标金融业务的相关业务信息,上述步骤通过金融系统数据库选取与目标金融业务关联度较高的目标客户,通过N个指定分组条件对所有目标客户进行精细化分类,通过预设分析策略对精细化分类后各客户组的客户信息进行分析,得到各指定分组条件对客户决策的影响程度值,以影响程度值为依据在所有客户组中选取目标意向客户,向目标意向客户推送目标金融业务,可以做到准确分类和精确分析,进而解决了相关技术中现有EM算法不能做到对客户进行准确分类,对客户信息进行分析后得到的分析结果不够准确、可靠性较低的技术问题。
可选地,分组单元包括:接收模块,用于接收金融系统前端传输的N个指定分组条件;映射模块,用于将客户信息集合中的M个目标客户的客户信息映射至几何空间,得到M个信息点,其中,每个信息点对应一个目标客户;第一确定模块,用于对于每个指定分组条件,通过预设聚类算法依据指定分组条件在M个信息点中确定R个分组簇点;第二确定模块,用于依据R个分组簇点将所有信息点分为R个信息组,并基于R个信息组确定R个客户群体;整理模块,用于按照R个客户群体对所有客户信息进行整理,得到分组结果。
可选地,第二确定模块包括:建立子模块,用于基于R个分组簇点建立R个初始信息组,并将M个信息点中除R个分组簇点以外的所有信息点确定为其他信息点;计算子模块,用于对于每个其他信息点,在几何空间中分别计算R个分组簇点与其他信息点之间的空间距离,得到R个距离值,并在R个距离值中确定最小距离值;确定子模块,用于确定最小距离值对应的分组簇点以及该分组簇点对应的初始信息组,并将最小距离值对应的其他信息点归并至该初始信息组;归并子模块,用于对所有其他信息点进行归并,直至所有其他信息点归并完毕,得到R个信息组。
可选地,分析单元包括:第三确定模块,用于对于每个分组结果中的每个目标客户,确定客户状态标签,其中,客户状态标签用于指示目标客户是否已经办理目标金融业务,客户状态标签包括:已办理或未办理;第一输入模块,用于对于每个分组结果,将分组结果输入至特征分析器,输出特征分析结果,其中,特征分析器预置预设分析策略,特征分析器用于在目标向量空间中对分组结果中的所有客户信息进行特征运算;整合模块,用于整合所有分组结果对应的特征分析结果,得到第一分析结果。
可选地,第一输入模块包括:映射子模块,用于对于分组结果中的每个目标客户,将目标客户的客户信息映射至目标向量空间,得到特征向量集合,其中,特征向量集合用于存储客户信息在目标向量空间中映射得到的特征向量;转化子模块,用于基于预设编码规则将目标客户的客户状态标签转化为数字标签编码;运算子模块,用于在目标向量空间中基于回归分析算法和数字标签编码对特征向量集合中的所有特征向量进行权重运算,得到权重运算结果,其中,权重运算结果用于记录每个特征向量对应的权值;求和子模块,用于基于权重运算结果和数字标签编码对每个特征向量进行线性加权求和,得到分组结果对应的指定分组条件的影响程度值,并将影响程度值作为特征分析结果。
可选地,目标意向客户的确定装置还包括:第四确定模块,用于对于第一分析结果中的每个影响程度值,确定比较结果,其中,比较结果用于指示影响程度值是否小于等于第二预设阈值;筛选模块,用于在比较结果指示影响程度值小于等于第二预设阈值的情况下,筛选每个分组结果中客户状态标签为已办理的目标客户;复制模块,用于对于每个分组结果中的每个客户群体,复制已筛选出的目标客户的客户信息,得到伪信息;创建模块,用于为每个伪信息创建虚拟客户名;加入模块,用于将虚拟客户名加入至客户群体中,并将伪信息加入至客户群体所在的分组结果中;分析模块,用于根据预设分析策略和更新后的分组结果对所有客户信息进行重新分析,得到第一分析结果。
可选地,目标意向客户的确定装置还包括:获取模块,用于对于每个目标客户,获取目标客户对目标金融业务的缴存数额;第五确定模块,用于根据缴存数额确定目标客户的客户属性,其中,客户属性包括:稳定型或非稳定型;第二输入模块,用于将客户属性为稳定型的目标客户以及目标客户的客户信息输入至特征分析器,输出第二分析结果,其中,特征分析器用于在向量空间中计算每个客户信息与缴存数额的关联度,并在所有关联度中确定最大关联度,第二分析结果用于指示最大关联度对应的客户信息;第六确定模块,用于基于第二分析结果在所有目标客户中确定目标缴存意向客户,并向目标缴存意向客户推送目标金融业务缴存信息。
上述的目标意向客户的确定装置还可以包括处理器和存储器,上述获取单元41,分组单元42,分析单元43,确定单元44等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数;基于N个指定分组条件和客户信息集合对所有目标客户进行分组,得到N个分组结果,其中,每个指定分组条件对应一个分组结果,每个分组结果中包含R个客户群体以及每个客户群体中目标客户的客户信息,N为正整数,R为小于等于M的正整数;根据预设分析策略和N个分组结果对所有客户信息进行分析,得到第一分析结果,其中,第一分析结果中包含N个影响程度值,每个影响程度值对应一个分组结果,影响程度值用于指示指定分组条件对目标客户是否办理目标金融业务的客户决策的影响程度大小;基于第一分析结果中的N个影响程度值在N个分组结果中确定目标意向客户,并向目标意向客户推送目标金融业务。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述实施例一中任意一项的目标意向客户的确定方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述实施例一中任意一项的目标意向客户的确定方法。
图5是根据本发明实施例的一种用于目标意向客户的确定方法的电子设备(或移动设备)的硬件结构框图。如图5所示,电子设备可以包括一个或多个(图5中采用502a、502b,……,502n来示出)处理器502(处理器502可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器504。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种目标意向客户的确定方法,其特征在于,包括:
获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,所述目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数;
基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果,其中,每个所述指定分组条件对应一个所述分组结果,每个所述分组结果中包含R个客户群体以及每个所述客户群体中所述目标客户的所述客户信息,N为正整数,R为小于等于M的正整数;
根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果,其中,所述第一分析结果中包含N个影响程度值,每个所述影响程度值对应一个所述分组结果,所述影响程度值用于指示所述指定分组条件对所述目标客户是否办理所述目标金融业务的客户决策的影响程度大小;
基于所述第一分析结果中的所述N个影响程度值在所述N个分组结果中确定目标意向客户,并向所述目标意向客户推送所述目标金融业务。
2.根据权利要求1所述的目标意向客户的确定方法,其特征在于,基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果的步骤,包括:
接收金融系统前端传输的所述N个指定分组条件;
将所述客户信息集合中的M个所述目标客户的所述客户信息映射至几何空间,得到M个信息点,其中,每个所述信息点对应一个所述目标客户;
对于每个所述指定分组条件,通过预设聚类算法依据所述指定分组条件在所述M个信息点中确定R个分组簇点;
依据R个所述分组簇点将所有所述信息点分为R个信息组,并基于所述R个信息组确定R个所述客户群体;
按照R个所述客户群体对所有所述客户信息进行整理,得到所述分组结果。
3.根据权利要求2所述的目标意向客户的确定方法,其特征在于,依据R个所述分组簇点将所有所述信息点分为R个信息组的步骤,包括:
基于R个所述分组簇点建立R个初始信息组,并将M个所述信息点中除R个所述分组簇点以外的所有所述信息点确定为其他信息点;
对于每个所述其他信息点,在所述几何空间中分别计算R个所述分组簇点与所述其他信息点之间的空间距离,得到R个距离值,并在所述R个距离值中确定最小距离值;
确定所述最小距离值对应的所述分组簇点以及该分组簇点对应的所述初始信息组,并将所述最小距离值对应的所述其他信息点归并至该初始信息组;
对所有所述其他信息点进行归并,直至所有所述其他信息点归并完毕,得到R个所述信息组。
4.根据权利要求1所述的目标意向客户的确定方法,其特征在于,根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果的步骤,包括:
对于每个所述分组结果中的每个所述目标客户,确定客户状态标签,其中,所述客户状态标签用于指示所述目标客户是否已经办理所述目标金融业务,所述客户状态标签包括:已办理或未办理;
对于每个所述分组结果,将所述分组结果输入至特征分析器,输出特征分析结果,其中,所述特征分析器预置所述预设分析策略,所述特征分析器用于在目标向量空间中对所述分组结果中的所有所述客户信息进行特征运算;
整合所有所述分组结果对应的所述特征分析结果,得到所述第一分析结果。
5.根据权利要求4所述的目标意向客户的确定方法,其特征在于,将所述分组结果输入至特征分析器,输出特征分析结果的步骤,包括:
对于所述分组结果中的每个所述目标客户,将所述目标客户的所述客户信息映射至所述目标向量空间,得到特征向量集合,其中,所述特征向量集合用于存储所述客户信息在所述目标向量空间中映射得到的特征向量;
基于预设编码规则将所述目标客户的所述客户状态标签转化为数字标签编码;
在所述目标向量空间中基于回归分析算法和所述数字标签编码对所述特征向量集合中的所有所述特征向量进行权重运算,得到权重运算结果,其中,所述权重运算结果用于记录每个所述特征向量对应的权值;
基于所述权重运算结果和所述数字标签编码对每个所述特征向量进行线性加权求和,得到所述分组结果对应的所述指定分组条件的所述影响程度值,并将所述影响程度值作为所述特征分析结果。
6.根据权利要求1所述的目标意向客户的确定方法,其特征在于,在根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果之后,还包括:
对于所述第一分析结果中的每个所述影响程度值,确定比较结果,其中,所述比较结果用于指示所述影响程度值是否小于等于第二预设阈值;
在所述比较结果指示所述影响程度值小于等于第二预设阈值的情况下,筛选每个所述分组结果中客户状态标签为已办理的所述目标客户;
对于每个所述分组结果中的每个所述客户群体,复制已筛选出的所述目标客户的所述客户信息,得到伪信息;
为每个所述伪信息创建虚拟客户名;
将所述虚拟客户名加入至所述客户群体中,并将所述伪信息加入至所述客户群体所在的所述分组结果中;
根据所述预设分析策略和更新后的所述分组结果对所有所述客户信息进行重新分析,得到所述第一分析结果。
7.根据权利要求1所述的目标意向客户的确定方法,其特征在于,在基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果之前,还包括:
对于每个所述目标客户,获取所述目标客户对所述目标金融业务的缴存数额;
根据所述缴存数额确定所述目标客户的客户属性,其中,所述客户属性包括:稳定型或非稳定型;
将所述客户属性为稳定型的所述目标客户以及所述目标客户的所述客户信息输入至特征分析器,输出第二分析结果,其中,所述特征分析器用于在向量空间中计算每个所述客户信息与所述缴存数额的关联度,并在所有所述关联度中确定最大关联度,所述第二分析结果用于指示所述最大关联度对应的所述客户信息;
基于所述第二分析结果在所有所述目标客户中确定目标缴存意向客户,并向所述目标缴存意向客户推送目标金融业务缴存信息。
8.一种目标意向客户的确定装置,其特征在于,包括:
获取单元,用于获取金融系统数据库内M个目标客户的客户信息,得到客户信息集合,其中,所述目标客户是指与目标金融业务的关联度大于第一预设阈值的客户,M为正整数;
分组单元,用于基于N个指定分组条件和所述客户信息集合对所有所述目标客户进行分组,得到N个分组结果,其中,每个所述指定分组条件对应一个所述分组结果,每个所述分组结果中包含R个客户群体以及每个所述客户群体中所述目标客户的所述客户信息,N为正整数,R为小于等于M的正整数;
分析单元,用于根据预设分析策略和所述N个分组结果对所有所述客户信息进行分析,得到第一分析结果,其中,所述第一分析结果中包含N个影响程度值,每个所述影响程度值对应一个所述分组结果,所述影响程度值用于指示所述指定分组条件对所述目标客户是否办理所述目标金融业务的客户决策的影响程度大小;
确定单元,用于基于所述第一分析结果中的所述N个影响程度值在所述N个分组结果中确定目标意向客户,并向所述目标意向客户推送所述目标金融业务。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的目标意向客户的确定方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的目标意向客户的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311635912.1A CN117670393A (zh) | 2023-11-30 | 2023-11-30 | 目标意向客户的确定方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311635912.1A CN117670393A (zh) | 2023-11-30 | 2023-11-30 | 目标意向客户的确定方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117670393A true CN117670393A (zh) | 2024-03-08 |
Family
ID=90067514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311635912.1A Pending CN117670393A (zh) | 2023-11-30 | 2023-11-30 | 目标意向客户的确定方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117670393A (zh) |
-
2023
- 2023-11-30 CN CN202311635912.1A patent/CN117670393A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7930242B2 (en) | Methods and systems for multi-credit reporting agency data modeling | |
CN113240509B (zh) | 一种基于多源数据联邦学习的贷款风险评估方法 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
Zowid et al. | Multi-criteria inventory ABC classification using Gaussian Mixture Model | |
US11687804B2 (en) | Latent feature dimensionality bounds for robust machine learning on high dimensional datasets | |
CN111797320B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN112150298A (zh) | 数据处理方法、系统、设备及可读介质 | |
CN113345080A (zh) | 一种供应商画像建模方法及系统 | |
Chehrazi et al. | Monotone approximation of decision problems | |
CN113177643A (zh) | 一种基于大数据的自动建模系统 | |
CN113158777A (zh) | 质量评分方法、质量评分模型的训练方法及相关装置 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114997916A (zh) | 潜在用户的预测方法、系统、电子设备和存储介质 | |
CN114819777A (zh) | 一种基于数字孪生技术的企业销售业务分析管理系统 | |
CN114219003A (zh) | 样本生成模型的训练方法、装置及电子设备 | |
CN112836750A (zh) | 一种系统资源分配方法、装置及设备 | |
CN117670393A (zh) | 目标意向客户的确定方法及装置、电子设备、存储介质 | |
CN115063143A (zh) | 账户数据处理方法、装置、计算机设备和存储介质 | |
WO2022183019A1 (en) | Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact | |
CN117194966A (zh) | 对象分类模型的训练方法和相关装置 | |
CN113034264A (zh) | 客户流失预警模型的建立方法、装置、终端设备及介质 | |
CN117994017A (zh) | 构建零售信用风险预测模型的方法和线上信贷业务Scoredelta模型 | |
CN118071482A (zh) | 构建零售信用风险预测模型的方法和消费信贷业务Scorebetad模型 | |
CN114547163A (zh) | 一种基于人工智能的电子商务平台构建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |