CN112835958A - 目标客户确定方法及装置 - Google Patents
目标客户确定方法及装置 Download PDFInfo
- Publication number
- CN112835958A CN112835958A CN202110153204.9A CN202110153204A CN112835958A CN 112835958 A CN112835958 A CN 112835958A CN 202110153204 A CN202110153204 A CN 202110153204A CN 112835958 A CN112835958 A CN 112835958A
- Authority
- CN
- China
- Prior art keywords
- client
- evaluated
- customer
- target
- consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013145 classification model Methods 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000007635 classification algorithm Methods 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008685 targeting Effects 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种目标客户确定方法及装置,可用于金融领域或者其他技术领域,该目标客户确定方法包括:获取正样本客户集以及待评估客户集;根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果;根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。本发明使用机器学习模型从海量客户中挖掘出私人银行高净值目标客户,实现了准确高效的确定出目标客户的有益效果。
Description
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种目标客户确定方法及装置。
背景技术
私人银行主要是面向服务高净值人群,而随着社会中个人财富的积累,高净值人群数量逐渐增多,如何从海量客户中挖掘出私人银行目标客户,是私人银行实现智慧营销的主要挑战。当前私人银行寻找目标客户的方式往往靠资产等单维度筛选或主观人为判断,由于客户数据量巨大,且客户间存在较大的个性化差异,通过人工判断或单维度筛选难以准确辨识出高净值目标客户。因此,现有技术缺少一种更加高效和准确的确定出目标客户的方法。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种目标客户确定方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种目标客户确定方法,该方法包括:
获取正样本客户集以及待评估客户集;
根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果,其中,在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果;
根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
可选的,该目标客户确定方法,还包括:
根据所述正样本客户集和所述待评估客户集中的每个客户各自的基本特征、住宅画像特征以及消费画像特征,分别生成所述正样本客户集以及所述正样本客户集对应的客户特征数据集。
可选的,该目标客户确定方法,还包括:
获取客户的住宅地址信息;
根据所述住宅地址信息以及预设的豪宅集合确定客户的住宅画像特征,其中,所述豪宅集合包含:豪宅名称以及豪宅名称对应的豪宅边界经纬度范围。
可选的,该目标客户确定方法,还包括:
获取客户的历史消费数据;
根据所述历史消费数据以及预设的消费类型集合确定客户在每个消费类型上对应的历史消费数据,其中,所述消费类型集合包含:多个消费类型以及每个消费类型对应的消费数据关键词;
根据客户在每个消费类型上对应的历史消费数据确定客户的消费画像特征,其中,所述消费画像特征包括:每个消费类型的消费金额序列、每个消费类型的消费次数以及每个消费类型的消费占比中的至少一个。
可选的,所述根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户,包括:
从每个分类模型对应的对待评估客户的预测分类结果中确定所述待评估客户集中的每个客户各自对应的所有的预测分类结果;
根据每个客户各自对应的所有的预测分类结果确定所述待评估客户集中的目标客户。
可选的,该目标客户确定方法,还包括:
根据所述目标客户的消费场所历史数据以及预设的专家知识,确定所述目标客户对应的待推荐的服务产品,其中,所述专家知识包含:多个服务产品以及每个服务产品对应的消费场所关键词。
可选的,所述预设数量等于所述正样本客户集中的客户数量。
为了实现上述目的,根据本发明的另一方面,提供了一种目标客户确定装置,该装置包括:
客户集获取单元,用于获取正样本客户集以及待评估客户集;
分类预测单元,用于根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果,其中,在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果;
目标客户确定单元,用于根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述目标客户确定方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述目标客户确定方法中的步骤。
本发明的有益效果为:本发明实施例通过机器学习训练出分类模型来识别出待评估客户集中的目标客户,实现了准确高效的从海量客户中挖掘出私人银行高净值目标客户的有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例目标客户确定方法的流程图;
图2是本发明实施例生成客户住宅画像特征的流程图;
图3是本发明实施例生成消费画像特征的流程图;
图4是本发明从待评估客户集中确定目标客户的流程图;
图5是本发明实施例目标客户确定装置的结构框图;
图6是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本发明的目标客户确定方法及装置可应用于金融领域,也可以应用于其他技术领域。
本发明从私人银行客户发展的实际需求和实现智慧营销的目标出发,对海量客户的基本信息数据、住宅地址数据、消费交易数据、产品持有数据、转账存取款数据、三方交易数据等,进行提取和处理获得客户的重要画像特征后,构建机器学习模型,实现私人银行高净值目标客户的精准挖掘。
图1是本发明实施例目标客户确定方法的流程图,如图1所示,本实施例的目标客户确定方法包括步骤S101至步骤S103。
步骤S101,获取正样本客户集以及待评估客户集。
在本发明实施例中,本发明根据业务专家设定的高净值客户资产下限作为筛选依据,从海量客户中规则筛选出达到目标客户标准的客户,形成正样本客户集P,作为后续机器学习模型的正样本,比如选定近一年日均资产在800万以上的客户作为正样本客户等。另外根据实际情况,选择待评估客户集U,使用训练好的分类模型从待评估客户集中挖掘出潜在的高净值目标客户,例如待评估客户集可以选择近一年日均资产在5万以上且在800万以下的客户。
步骤S102,根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果。
本步骤在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果。
在本发明一个实施例中,所述预设数量等于所述正样本客户集中的客户数量。
在本发明实施例中,本步骤先获取正样本客户集P、正样本客户集P对应的客户特征数据集Fp、待评估客户集U以及待评估客户集U对应的客户特征数据集Fu。其中,客户特征数据集中包含每个客户的基本特征、住宅画像特征以及消费画像特征。本步骤的每个分类模型的建立方法如下。
输入:正样本客户集P、客户特征数据集Fp、待评估客户集U以及客户特征数据集Fu。
输出:模型Mt对部分待评估客户的预测分类结果St。
算法:首先对于基模型Mt,将正样本客户集P作为正样本,其对应客户特征数据集为Ft,p;从待评估客户集U中随机筛选出与P等人数的客户集作为负样本Ut,n(即本步骤的第一客户集),Ut,n对应客户特征数据集为Ft,n;而U中未被选出的客户集合Ut,u(即本步骤的第二客户集)作为测试集,Ut,u对应客户特征数据集为Ft,u。
然后将预设的分类模型(例如可以采用XGBOOST)作为基模型,Ft,p∪Ft,n作为训练数据集,训练好的模型为Mt。接着使用模型Mt对未被选中的客户集合Ft,u进行预测分类,得到分类结果集St={(c,St,c)|c∈Ut,u},其中St,c为模型Mt对客户c的预测类别。由此得到T个分类模型的对待评估客户的预测分类结果集S={St|t∈N and 0≤t<T}。
步骤S103,根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
在本发明实施例中,本步骤可以先从所有的对待评估客户的预测分类结果中确定所述待评估客户集中的每个客户各自对应的所有的预测分类结果,进而根据每个客户各自对应的所有的预测分类结果判断每个客户是否为目标客户,以此确定出待评估客户集中所有的目标客户。
图4是本发明从待评估客户集中确定目标客户的流程图,如图4所示,上述步骤S103的根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户,具体包括步骤S401和步骤S402。
步骤S401,从每个分类模型对应的对待评估客户的预测分类结果中确定所述待评估客户集中的每个客户各自对应的所有的预测分类结果。
步骤S402,根据每个客户各自对应的所有的预测分类结果确定所述待评估客户集中的目标客户。
在本发明可选实施例中,预测分类结果为数值化的分类结果,其中,1代表预测为目标客户,0代表预测为非目标客户。本发明根据客户对于的所有的预测分类结果进行计算,得到客户最终的预测结果,确定客户是否为目标客户。具体的,本步骤可以对客户的所有的预测分类结果进行求和,然后用求和结果除以客户的所有的预测分类结果的总个数,得到客户最终的预测结果,然后将客户最终的预测结果与预设阈值进行对比,若客户最终的预测结果大于预设阈值,则确定该客户为目标客户,反之则为非目标客户。以此确定出待评估客户集中的所有目标客户,形成目标客户集。
在本发明实施例中,每个分类模型对应的对待评估客户的预测分类结果可作为对待评测用户的一次投票,使用T个分类模型输出结果计算客户c的最终投票的结果(投票为目标客户的占比),计算方法如下。
其中,sum函数表示计算集合中元素的总和,count函数表示计算集合中的元素个数。Rc表示组合模型投票结果中判定客户c为目标客户的基模型数占比。
然后,计算客户c的最终识别结果Oc,
其中,Sthreshold是人工设定筛选阈值,一般0<Sthreshold≤1。
最后,确定的目标客户集合A={Ui|Oi=1}是从待评估客户集U中筛选出组合模型判定结果为1的客户集合。
在本发明一个实施例中,本发明的目标客户确定方法,还包括:
根据所述正样本客户集和所述待评估客户集中的每个客户各自的基本特征、住宅画像特征以及消费画像特征,分别生成所述正样本客户集以及所述正样本客户集对应的客户特征数据集。
在本发明实施例中,本发明先确定正样本客户集P和待评估客户集U中每个客户各自的基本特征、住宅画像特征以及消费画像特征,进而生成正样本客户集P对应的客户特征数据集Fp,待评估客户集U对应的客户特征数据集Fu。
在本发明一个实施例中,客户的基本特征可以包括基本信息数据、产品持有数据、转账存取款数据以及三方交易数据等。本发明可以针对正样本客户集P和待评估客户集U,提取客户的基本信息数据、产品持有数据、转账存取款数据、三方交易数据等,并整合到一起。然后根据业务经验规则将不合适的客户进行剔除,例如剔除高风险客户。最终整合得到客户基本特征集合F1={f1,c|c∈(P∪U)},其中c代表客户标识、f1,c表示客户c的基本特征。
图2是本发明实施例生成客户住宅画像特征的流程图,如图2所示,本发明生成客户的住宅画像特征的流程包括步骤S201和步骤S202。
步骤S201,获取客户的住宅地址信息。
步骤S202,根据所述住宅地址信息以及预设的豪宅集合确定客户的住宅画像特征,其中,所述豪宅集合包含:豪宅名称以及豪宅名称对应的豪宅边界经纬度范围。
在本发明实施例中,客户的住宅地址信息是否为高端住宅(后续简称豪宅),可反映客户的社会资产高低,也能体现客户的整体资产实力。本步骤介绍以生成客户c的住宅画像特征为例,首先使用客户住宅地址信息和豪宅名称进行匹配得到结果r1,然后判定客户住宅地址信息中的经纬度是否在豪宅经纬度区域内,得到结果r2,最终综合r1和r2生成客户住宅画像rc。具体算法如下。
输入:豪宅集合L={Li|i∈N and i<kn},对应的豪宅边界经纬度区域集合Z,其中N为自然数集合、kn为豪宅的数量;客户c的住宅地址信息Sc,对应经纬度(xc,yc)。
输出:判定客户c的住宅地址是否为豪宅的结果rc。
算法:首先,匹配住宅地址字符串Sc和豪宅集合L,得到匹配结果r1。计算方法如下。
其中,contain(Sc,Li)表示存在某个豪宅名称Li,满足住宅地址信息Sc包含了豪宅名称Li。
然后判定客户c住宅地址的经纬度点(xc,yc)是否在某个豪宅边界多边形顶点对应经纬度序列围成的封闭区域内,结果记为r2。以豪宅Lh为例,计算(xc,yc)是否在其顶点序列Zh=[(x0,y0),(x1,y1),...,(xn-1,yn-1),(x0,y0)]围成的区域内,得到结果fh。fh的计算流程如下:
(2)计算结果fh:
由此计算出客户c的住宅地址经纬度是否在kn个豪宅边界经纬度栅栏序列的判别结果[f0,f1,...,fkn-1]。
r2计算如下:
最后,计算客户c的住宅地址是否为豪宅的结果rc:
由此可以得到客户住宅画像特征集合F2={f2,c|c∈(P∪U)},其中f2,c=rc。
图3是本发明实施例生成消费画像特征的流程图,如图3所示,本发明生成客户的消费画像特征的流程包括步骤S301至步骤S303。
步骤S301,获取客户的历史消费数据。
步骤S302,根据所述历史消费数据以及预设的消费类型集合确定客户在每个消费类型上对应的历史消费数据,其中,所述消费类型集合包含:多个消费类型以及每个消费类型对应的消费数据关键词。
步骤S303,根据客户在每个消费类型上对应的历史消费数据确定客户的消费画像特征,其中,所述消费画像特征包括:每个消费类型的消费金额序列、每个消费类型的消费次数以及每个消费类型的消费占比中的至少一个。
在本发明实施例中,消费能力的大小以及消费的结构组成,可以较大程度的反映客户的资产实力。按照划分的消费类型集合C={Ci|i∈N and i<cn},消费类型种数为cn,类型Ci包含类别关键词集合keyi={ki,d|d∈N and d<Nk,i},其中Nk,i是关键词集合keyi的元素个数。将客户消费历史数据与各类别下的关键词匹配,得到每位客户各类别消费特征,生成客户的消费画像。例如消费金额、次数、占比等。以生成客户c的消费金额画像Feac为例,计算方法如下。
输入:MS=[(tx_site0,tx_amt0),(tx_site1,tx_amt1),...,(tx_site|MS|,tx_amt|MS|)]为客户c每次消费的明细信息,其中|MS|表示客户c消费记录MS的数量、tx_sitej为消费的场所、tx_amtj为消费的金额。Key={keyi|i∈N and i<cn}为各类别消费关键词集合。
输出:客户c的各类型消费金额序列Feac=[fea0,fea1,...,feacn-1]。
算法:首先,初始化Feac=[0,0,...,0],长度为cn。然后分别对类型Ci遍历客户c的消费明细计算对应的feai,计算方法如下。
(1)计算客户c各次消费记录(tx_sitej,tx_amtj)的属于类型Ci的金额tmpj。
其中,contain(tx_sitej,ki,d)表示类型Ci的关键词集合keyi中存在ki,d满足tx_sitej包含ki,d。
(2)计算feai。
依据以上方法,可计算出客户c的各类型消费金额序列,得到feac。类似的,计算出由此获得每位客户的各类别消费的次数、占比等特征,最后获得消费画像特征集合F3={f3,c|c∈(P∪U)},其中f3,c满足feac∈f3,c。
在本发明实施例中,本发明在从待评估客户集U中确定出目标客户集A之后,还为目标客户集A中每个目标客户生成客户画像。具体的,本发明可以根据预设的客户特征筛选参数对目标客户的客户特征数据集中的客户特征进行筛选,得到目标客户的客户画像,其中,客户特征筛选参数包括:画像特征筛选集和业务筛选特征阈值集合,画像特征筛选集用于记载客户特征数据集中的第i个客户特征是否保留,业务筛选特征阈值集合用于记载客户特征数据集中的第i个客户特征保留所需满足的条件。
在具体实施时,本发明使用业务专家设定的客户特征筛选参数,包括FC={(i,FCi)|i∈N and i<NFC}(画像特征筛选集)和FT={(i,FTi)|FTi∈R and i∈N and i<NFT}(业务筛选特征阈值集合),其中特征FCi∈{0,1}表示第i个特征是否保留,FTi表示第i个特征值保留时所需满足条件的阈值,NFC和NFT分别表示集合FC、FT的元素个数。以客户c为例,最终保留的画像信息Yc={fc,i|fc,i∈fc and FCi=1and fc,i≥FTi}。计算选每位客户的特征集合,最后得到目标客户集A的画像信息Y={Yc|c∈A}。
在本发明实施例中,在确定出目标客户后,本发明方法还包括:
根据所述目标客户的消费场所历史数据以及预设的专家知识,确定所述目标客户对应的待推荐的服务产品,其中,所述专家知识包含:多个服务产品以及每个服务产品对应的消费场所关键词。
使用目标客户消费历史数据中的场所信息,匹配专家知识生成客户所需的产品服务营销建议,例如客户常在机场消费,则可以推荐接送机服务等。以介绍生成客户c可能需要服务产品的营销推荐为例,其计算方法如下。
输出:客户c可推荐的服务产品SKc。
算法:将客户c的消费场所tx_sitec,m依次和产品服务Ki所对应的各个场所关键词sitei,j匹配,当tx_sitec,m包含关键词sitei,j时,则可以向客户c推荐产品服务Ki。由此计算得到SKc={Ki|contain(tx_sitec,m,sitei,j)},其中contain(tx_sitec,m,sitei,j)表示,客户c消费场所历史数据MEc中存在消费场所tx_sitec,m,产品服务Ki对应的场所中存在关键词sitei,j,满足tx_sitec,m包含sitei,j。
从以上实施例可以看出,本发明采用多维度特征并使用机器学习模型挖掘私人银行的目标客户,相对之前人工通过单维度规则筛选目标客户,不仅降低了目标客户筛选的工作量,也提升了目标客户筛选的准确性。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种目标客户确定装置,可以用于实现上述实施例所描述的目标客户确定方法,如下面的实施例所述。由于目标客户确定装置解决问题的原理与目标客户确定方法相似,因此目标客户确定装置的实施例可以参见目标客户确定方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是本发明实施例目标客户确定装置的结构框图,如图5所示,本发明实施例目标客户确定装置包括:客户集获取单元1、分类预测单元2以及目标客户确定单元3。
客户集获取单元1,用于获取正样本客户集以及待评估客户集。
分类预测单元2,用于根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果,其中,在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果。
在本发明一个实施例中,所述预设数量等于所述正样本客户集中的客户数量。
目标客户确定单元3,用于根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
在本发明一个实施例中,本发明的目标客户确定装置还包括:
客户特征数据集生成单元,用于根据所述正样本客户集和所述待评估客户集中的每个客户各自的基本特征、住宅画像特征以及消费画像特征,分别生成所述正样本客户集以及所述正样本客户集对应的客户特征数据集。
在本发明一个实施例中,本发明的目标客户确定装置还包括:
住宅地址信息获取单元,用于获取客户的住宅地址信息;
住宅画像特征生成单元,用于根据所述住宅地址信息以及预设的豪宅集合确定客户的住宅画像特征,其中,所述豪宅集合包含:豪宅名称以及豪宅名称对应的豪宅边界经纬度范围。
在本发明一个实施例中,本发明的目标客户确定装置还包括:
历史消费数据获取单元,用于获取客户的历史消费数据;
消费分类单元,用于根据所述历史消费数据以及预设的消费类型集合确定客户在每个消费类型上对应的历史消费数据,其中,所述消费类型集合包含:多个消费类型以及每个消费类型对应的消费数据关键词;
消费画像特征生成单元,用于根据客户在每个消费类型上对应的历史消费数据确定客户的消费画像特征,其中,所述消费画像特征包括:每个消费类型的消费金额序列、每个消费类型的消费次数以及每个消费类型的消费占比中的至少一个。
在本发明一个实施例中,所述目标客户确定单元3包括:
筛选模块,用于从每个分类模型对应的对待评估客户的预测分类结果中确定所述待评估客户集中的每个客户各自对应的所有的预测分类结果;
确定模块,用于根据每个客户各自对应的所有的预测分类结果确定所述待评估客户集中的目标客户。
在本发明一个实施例中,本发明的目标客户确定装置还包括:
待推荐的服务产品确定单元,用于根据所述目标客户的消费场所历史数据以及预设的专家知识,确定所述目标客户对应的待推荐的服务产品,其中,所述专家知识包含:多个服务产品以及每个服务产品对应的消费场所关键词。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图6所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述目标客户确定方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种目标客户确定方法,其特征在于,包括:
获取正样本客户集以及待评估客户集;
根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果,其中,在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果;
根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
2.根据权利要求1所述的目标客户确定方法,其特征在于,还包括:
根据所述正样本客户集和所述待评估客户集中的每个客户各自的基本特征、住宅画像特征以及消费画像特征,分别生成所述正样本客户集以及所述正样本客户集对应的客户特征数据集。
3.根据权利要求2所述的目标客户确定方法,其特征在于,还包括:
获取客户的住宅地址信息;
根据所述住宅地址信息以及预设的豪宅集合确定客户的住宅画像特征,其中,所述豪宅集合包含:豪宅名称以及豪宅名称对应的豪宅边界经纬度范围。
4.根据权利要求2所述的目标客户确定方法,其特征在于,还包括:
获取客户的历史消费数据;
根据所述历史消费数据以及预设的消费类型集合确定客户在每个消费类型上对应的历史消费数据,其中,所述消费类型集合包含:多个消费类型以及每个消费类型对应的消费数据关键词;
根据客户在每个消费类型上对应的历史消费数据确定客户的消费画像特征,其中,所述消费画像特征包括:每个消费类型的消费金额序列、每个消费类型的消费次数以及每个消费类型的消费占比中的至少一个。
5.根据权利要求1所述的目标客户确定方法,其特征在于,所述根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户,包括:
从每个分类模型对应的对待评估客户的预测分类结果中确定所述待评估客户集中的每个客户各自对应的所有的预测分类结果;
根据每个客户各自对应的所有的预测分类结果确定所述待评估客户集中的目标客户。
6.根据权利要求1所述的目标客户确定方法,其特征在于,还包括:
根据所述目标客户的消费场所历史数据以及预设的专家知识,确定所述目标客户对应的待推荐的服务产品,其中,所述专家知识包含:多个服务产品以及每个服务产品对应的消费场所关键词。
7.根据权利要求1所述的目标客户确定方法,其特征在于,所述预设数量等于所述正样本客户集中的客户数量。
8.根据权利要求2所述的目标客户确定方法,其特征在于,还包括:
根据预设的客户特征筛选参数对目标客户的客户特征数据集中的客户特征进行筛选,得到目标客户的客户画像。
9.一种目标客户确定装置,其特征在于,包括:
客户集获取单元,用于获取正样本客户集以及待评估客户集;
分类预测单元,用于根据所述正样本客户集以及所述待评估客户集采用预设的分类算法训练出多个分类模型,并得到每个分类模型各自对应的对待评估客户的预测分类结果,其中,在训练每个分类模型时,从所述待评估客户集中随机选中预设数量个客户形成第一客户集,将所述待评估客户集中未被选中的客户确定为第二客户集,以所述第一客户集对应的客户特征数据集以及所述正样本客户集对应的客户特征数据集作为训练数据训练出分类模型,根据分类模型以及所述第二客户集对应的客户特征数据集对所述第二客户集中的客户进行分类,得到分类模型对应的对待评估客户的预测分类结果;
目标客户确定单元,用于根据每个分类模型对应的对待评估客户的预测分类结果确定所述待评估客户集中的目标客户。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至8任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110153204.9A CN112835958A (zh) | 2021-02-04 | 2021-02-04 | 目标客户确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110153204.9A CN112835958A (zh) | 2021-02-04 | 2021-02-04 | 目标客户确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112835958A true CN112835958A (zh) | 2021-05-25 |
Family
ID=75932058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110153204.9A Pending CN112835958A (zh) | 2021-02-04 | 2021-02-04 | 目标客户确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112835958A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
CN110659922A (zh) * | 2018-06-28 | 2020-01-07 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
CN111105265A (zh) * | 2019-10-12 | 2020-05-05 | 平安银行股份有限公司 | 基于客户信息的预测方法、装置、计算机设备及存储介质 |
CN111222923A (zh) * | 2020-01-13 | 2020-06-02 | 秒针信息技术有限公司 | 一种判断潜在客户的方法及装置、电子设备和存储介质 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
US20210188290A1 (en) * | 2017-09-19 | 2021-06-24 | Ping An Technology (Shenzhen) Co., Ltd. | Driving model training method, driver identification method, apparatuses, device and medium |
-
2021
- 2021-02-04 CN CN202110153204.9A patent/CN112835958A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190102652A1 (en) * | 2016-08-31 | 2019-04-04 | Tencent Technology (Shenzhen) Company Limited | Information pushing method, storage medium and server |
US20210188290A1 (en) * | 2017-09-19 | 2021-06-24 | Ping An Technology (Shenzhen) Co., Ltd. | Driving model training method, driver identification method, apparatuses, device and medium |
CN110659922A (zh) * | 2018-06-28 | 2020-01-07 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
CN111105265A (zh) * | 2019-10-12 | 2020-05-05 | 平安银行股份有限公司 | 基于客户信息的预测方法、装置、计算机设备及存储介质 |
CN111222923A (zh) * | 2020-01-13 | 2020-06-02 | 秒针信息技术有限公司 | 一种判断潜在客户的方法及装置、电子设备和存储介质 |
CN111967971A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 银行客户数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389494B (zh) | 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置 | |
CN112085205A (zh) | 用于自动训练机器学习模型的方法和系统 | |
CN109255586B (zh) | 一种面向电子政务办事的在线个性化推荐方法 | |
CN105225135B (zh) | 潜力客户识别方法以及装置 | |
CN107230108A (zh) | 业务数据的处理方法及装置 | |
CN108401459A (zh) | 能源消费者的预测性细分 | |
KR20210082109A (ko) | 부동산 실거래가 예측 기반 부동산 예상 실거래가 산출 장치 | |
CN113379457A (zh) | 面向金融领域的智能营销方法 | |
CN116127190B (zh) | 一种数字地球资源推荐系统及方法 | |
Micheni | Diffusion of big data and analytics in developing countries | |
Hicham et al. | Analysis of unsupervised machine learning techniques for an efficient customer segmentation using clustering ensemble and spectral clustering | |
CN115983900A (zh) | 用户营销策略的构建方法、装置、设备、介质和程序产品 | |
CN114693409A (zh) | 产品匹配方法、装置、计算机设备、存储介质和程序产品 | |
Wang et al. | Computer supported data-driven decisions for service personalization: a variable-scale clustering method | |
Chen et al. | Improving the forecasting and classification of extreme events in imbalanced time series through block resampling in the joint predictor-forecast space | |
Ragapriya et al. | Machine Learning Based House Price Prediction Using Modified Extreme Boosting | |
Özgür et al. | Dynamic linear economies with social interactions | |
Sushma Rao et al. | Academic dashboard—descriptive analytical approach to analyze student admission using education data mining | |
CN112835958A (zh) | 目标客户确定方法及装置 | |
Wu et al. | Learning evolving user’s behaviors on location-based social networks | |
CN117132323A (zh) | 推荐内容的分析方法、装置、设备、介质及程序产品 | |
Esquivel et al. | Using a binary classification model to predict the likelihood of enrolment to the undergraduate program of a philippine university | |
Paireekreng et al. | An ensemble learning based model for real estate project classification | |
CN114119078A (zh) | 目标资源确定方法、装置、电子设备及介质 | |
Zhdanov et al. | Machine learning approach to optimal restaurant location search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |