CN113988955A - 潜在资产提升客户预测方法及装置 - Google Patents
潜在资产提升客户预测方法及装置 Download PDFInfo
- Publication number
- CN113988955A CN113988955A CN202111425714.3A CN202111425714A CN113988955A CN 113988955 A CN113988955 A CN 113988955A CN 202111425714 A CN202111425714 A CN 202111425714A CN 113988955 A CN113988955 A CN 113988955A
- Authority
- CN
- China
- Prior art keywords
- customer
- potential
- data
- asset
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 65
- 238000010801 machine learning Methods 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 29
- 238000003066 decision tree Methods 0.000 claims description 25
- 238000007477 logistic regression Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000000546 chi-square test Methods 0.000 claims description 4
- 238000012847 principal component analysis method Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000001737 promoting effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 240000004759 Inga spectabilis Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Technology Law (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
Abstract
本发明公开了一种潜在资产提升客户预测方法及装置,涉及人工智能和大数据技术领域,其中该方法包括:获取目标客户在预设时间段内的历史数据,历史数据包括目标客户的身份信息、历史交易数据和资产信息;将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;在目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。本发明可以精准定位潜在资产提升客户,便于为客户提供有效的营销服务,提升客户体验。
Description
技术领域
本发明涉及人工智能和大数据技术领域,尤其涉及一种潜在资产提升客户预测方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,在金融行业,大多是业务人员根据客户的资产对客户资产等级是否晋升进行人工判断,进而有针对性地为客户提供营销。该种方法过于依赖业务人员的经验,对客户的相关信息掌握不全面,无法在海量的客户信息中精准定位到资产提升概率较大的潜在客户,以至于无法为客户提供有效的营销服务,客户体验较差。
发明内容
本发明实施例提供一种潜在资产提升客户预测方法,用以精准定位潜在资产提升客户,便于为客户提供有效的营销服务,提升客户体验,该方法包括:
获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
本发明实施例还提供一种潜在资产提升客户预测装置,用以精准定位潜在资产提升客户,便于为客户提供有效的营销服务,提升客户体验,该装置包括:
数据获取模块,用于获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
概率预测模块,用于将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
客户确定模块,用于在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述潜在资产提升客户预测方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述潜在资产提升客户预测方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述潜在资产提升客户预测方法。
本发明实施例中,获取目标客户在预设时间段内的历史数据,历史数据包括目标客户的身份信息、历史交易数据和资产信息;将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;在目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。与现有技术中通过人工方式判断潜在资产提升客户的技术方案相比,本发明通过潜在客户预测模型,可以根据目标客户在预设时间段内的历史数据预测目标客户为潜在资产提升客户的概率,由于潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到,从而可以精准定位到资产提升概率较大的客户,进而可以便于为客户提供有效的营销服务,提升客户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种潜在资产提升客户预测方法的流程图;
图2为本发明实施例中提供的一种潜在客户预测模型训练与测试的方法流程图;
图3为本发明实施例中提供的一种用于模型训练与测试的数据处理的流程图;
图4为本发明实施例中提供的另一种潜在客户预测模型训练与测试的方法流程图;
图5为本发明实施例中提供的另一种潜在资产提升客户预测方法的流程图;
图6为本发明实施例中提供的一种潜在资产提升客户预测装置的示意图;
图7为本发明实施例中提供的又一种潜在资产提升客户预测装置的示意图;
图8为本发明实施例中提供的另一种潜在资产提升客户预测装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
为了能够在海量的客户信息中精准定位到资产提升概率较大的潜在客户,便于为客户提供有效的营销服务,提升客户体验,本发明实施例提供了一种潜在资产提升客户预测方法,如图1所示,该方法包括以下步骤:
步骤101,获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
步骤102,将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
步骤103,在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
与现有技术中通过人工方式判断潜在资产提升客户的技术方案相比,本发明通过潜在客户预测模型,可以根据目标客户在预设时间段内的历史数据预测目标客户为潜在资产提升客户的概率,由于潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到,从而可以精准定位到资产提升概率较大的客户,进而可以便于为客户提供有效的营销服务,提升客户体验。
在上述步骤101中,获取目标客户在预设时间段内的历史数据。
其中,上述预设时间段可以根据具体需求进行设定。例如,可以设置为最近一周,或者最近一个月等等。
另外,上述历史数据可以包括目标客户的身份信息、历史交易数据和资产信息,上述资产信息可以包括目标客户的资产负债信息、大额异动信息、产品持有信息或基金理财交易信息中的至少一个。
具体的,上述目标客户的身份信息可以为目标客户的年龄、性别、职业或者居住地等基本信息;
上述目标客户的历史交易数据可以为通过目标客户名下的账户和商家发生交易的各种交易数据;
上述目标客户的资产负债信息可以为目标客户的存款信息、贷款信息、实物资产(例如房产、汽车)等等;
上述目标客户的大额异动信息可以为目标客户在预设时间段内发生大额资金变动的信息;
上述目标客户的产品持有信息可以为目标客户的股票、理财等产品的持有情况;
上述目标客户的基金理财交易信息可以为目标客户在预设时间段内发生基金理财交易的信息。
在上述步骤102中,将步骤101获取到的目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率。
其中,潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到。
本发明一实施例中,如图2所示,为本发明实施例提供的一种潜在客户预测模型训练与测试的方法流程图,可以包括以下步骤:
步骤201,将多个客户的历史数据和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集,每一客户的历史数据包括客户的身份信息、历史交易数据和资产信息;
步骤202,利用训练集训练机器学习模型,得到潜在客户预测模型;
步骤203,利用测试集对潜在客户预测模型进行测试。
具体实施时,在上述步骤201之前,需要对多个客户的历史数据进行处理,并筛选出与预设的客户资产提升关联的特征数据,将预设的客户资产提升关联的特征数据和其对应的潜在资产提升客户概率作为样本集。
本发明一实施例中,如图3所示,为本发明实施例提供的一种用于模型训练与测试的数据处理的流程图,包括以下步骤:
步骤301,对每一客户的历史数据进行预处理,构建数据宽表。
此处,首先,获取多个客户的历史数据。具体实施时,可以通过对业务需求进行分析,设定客户群体,例如,根据持有资产将客户分成大众客户、理财客户、财富客户和私行客户四类,然后,获取目标客户群体的多个客户的历史数据。其中,每一客户的历史数据包括但不限于客户的身份信息、历史交易数据和资产信息。每一客户的资产信息包括但不限于客户的资产负债信息、大额异动信息、产品持有信息或基金理财交易信息。
然后,对多个客户的历史数据中的缺失数据和异常数据进行处理。具体可以包括:基于特定规则剔除多个客户历史数据中的异常数据(如不合法的数据),以及对多个客户的历史数据中的缺失数据进行填充。
最后,再对多个客户的历史数据进行预处理,构建数据宽表。具体的,可以通过以下方式对多个客户的历史数据进行预处理,构建数据宽表:
对每一客户的历史数据进行业务分段处理;
对每一客户的历史数据中区间型变量的数据进行最大值、最小值、均值和增长率计算的特征处理;
计算每一客户的历史数据中列名型变量的数据的占比和波动情况;
构建数据宽表。
其中,上述对每一客户的历史数据进行业务分段是为了使数据的解释性更强。
其中,上述数据宽表中每一个客户对应一条客户信息。
步骤302,对数据宽表中离散型区间变量的数据进行归一化处理。
此处,还包括,对部分异方差数据进行对数化处理。
步骤303,对数据宽表中连续型区间变量的数据进行分箱处理。
此处,是为了增强变量的可解释性。
步骤304,基于主成分分析法,对数据宽表的数据进行降维处理。
此处,是为了消除变量间的相关性。
步骤305,基于卡方检验和相关系数检验,筛选出与预设的客户资产提升关联的特征数据。
此处,预设的客户资产提升关联的特征数据可以是客户的年龄、交易量、资产增长速度等数据,可以根据具体的需求进行设定。
步骤306,将与预设的客户资产提升关联的特征数据、和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集。
此处,将样本集按照预设比例,划分为训练集和测试集。
具体实施时,在上述步骤202中,利用训练集训练机器学习模型,得到潜在客户预测模型。
本发明实施例中,可以训练多个潜在客户预测模型,如图4所示,上述步骤202,具体可以包括以下步骤:
步骤401,分别建立决策树模型和逻辑回归模型;
步骤402,利用训练集训练决策树模型,通过调整参数优化决策树模型,得到决策树潜在客户预测模型;
利用训练集训练逻辑回归模型,通过调整参数优化逻辑回归模型,得到逻辑回归潜在客户预测模型;
步骤403,从决策树潜在客户预测模型和逻辑回归潜在客户预测模型选择一种模型,确定为最终的潜在客户预测模型。
本发明实施例中,上述步骤403,具体可以包括:
分别绘制决策树潜在客户预测模型和逻辑回归潜在客户预测模型的受试者工作特征ROC曲线;
将面积最大的ROC曲线所对应的潜在客户预测模型,确定为最终的潜在客户预测模型。
如此,本发明实施例中,根据多个客户的历史数据和其对应的潜在资产提升客户概率,通过机器学习方法进行多次训练,从训练的多个模型中确定最优的潜在客户预测模型,可以实现对客户的资产是否提升进行精准预测。
需要说明的是,本发明实施例中,潜在客户预测模型只需要训练一次,在模型训练成功之后,再再次使用时只需要把预设时间段内的客户历史数据输入到固化的模型中,即可得到客户资产提升的概率,不需要每次运行都重新构建模型。
在上述步骤103中,在目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,可以确定目标客户为潜在资产提升客户。
其中,预设概率阈值可以根据具体需要进行设定,在此不做具体限定。
本发明一实施例中,在确定目标客户为潜在资产提升客户之后,如图5所示,还可以包括:
步骤501,基于对业务的分析,从目标客户在预设时间段内的历史数据中获取业务需求项对应的数据,所述业务需求项包括同业来源、产品需求、消费需求和投资需求中的至少一项;
步骤502,对所述业务需求项对应的数据进行聚类,并对聚类结果进行归因分析,确定所述目标客户资产提升的原因。
具体实施时,在步骤501中,可以从业务的角度分析客户资产提升可能的原因,大致可以确定同业来源、产品需求、消费需求和投资需求4个业务需求项。然后,从目标客户在预设时间段内的历史数据中获取业务需求项对应的数据,汇总成聚类变量表。
具体实施时,在步骤502中,对步骤501中确定的聚类变量表中的数据进行聚类,并对聚类结果进行归因分析,确定目标客户资产提升的原因。
其中,本发明实施例中的聚类方法可以是使用现有的聚类方式来实现,在此不做多余赘述。
这样,通过对目标客户的四个业务需求项对应的数据进行聚类分析,归纳目标客户资产提升的原因,可以为营销人员提供数据支持与方向,使其能精准为客户提供营销服务,提升客户体验度。
需要说明的是,本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定
本发明实施例中还提供了一种潜在资产提升客户预测装置,如下面的实施例所述。由于该装置解决问题的原理与潜在资产提升客户预测方法相似,因此该装置的实施可以参见潜在资产提升客户预测方法的实施,重复之处不再赘述。
如图6所示,为本发明实施例提供的一种潜在资产提升客户预测装置的示意图,所述装置包括:
数据获取模块601,用于获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
概率预测模块602,用于将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
客户确定模块603,用于在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
本发明实施例中,所述资产信息包括目标客户的资产负债信息、大额异动信息、产品持有信息或基金理财交易信息中的至少一个。
本发明实施例中,如图7所示,还包括原因分析模块701,用于在客户确定模块确定目标客户为潜在资产提升客户之后:
基于对业务的分析,从目标客户在预设时间段内的历史数据中获取业务需求项对应的数据,所述业务需求项包括同业来源、产品需求、消费需求和投资需求中的至少一项;
对所述业务需求项对应的数据进行聚类,并对聚类结果进行归因分析,确定所述目标客户资产提升的原因。
本发明实施例中,如图8所示,还包括模型训练与测试模块801,用于在概率预测模块将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率之前:
将多个客户的历史数据和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集,每一客户的历史数据包括客户的身份信息、历史交易数据和资产信息;
利用训练集训练机器学习模型,得到潜在客户预测模型;
利用测试集对潜在客户预测模型进行测试。
本发明实施例中,模型训练与测试模块801,具体还用于:
对每一客户的历史数据进行预处理,构建数据宽表;
对数据宽表中离散型区间变量的数据进行归一化处理;
对数据宽表中连续型区间变量的数据进行分箱处理;
基于主成分分析法,对数据宽表的数据进行降维处理;
基于卡方检验和相关系数检验,筛选出与预设的客户资产提升关联的特征数据;
将与预设的客户资产提升关联的特征数据、和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集。
本发明实施例中,模型训练与测试模块801,具体还用于:
对每一客户的历史数据进行业务分段处理;
对每一客户的历史数据中区间型变量的数据进行最大值、最小值、均值和增长率计算的特征处理;
计算每一客户的历史数据中列名型变量的数据的占比和波动情况;
构建数据宽表。
本发明实施例中,模型训练与测试模块801,具体还用于:
分别建立决策树模型和逻辑回归模型;
利用训练集训练决策树模型,通过调整参数优化决策树模型,得到决策树潜在客户预测模型;
利用训练集训练逻辑回归模型,通过调整参数优化逻辑回归模型,得到逻辑回归潜在客户预测模型;
从决策树潜在客户预测模型和逻辑回归潜在客户预测模型选择一种模型,确定为最终的潜在客户预测模型。
本发明实施例中,模型训练与测试模块801,具体还用于:
分别绘制决策树潜在客户预测模型和逻辑回归潜在客户预测模型的受试者工作特征ROC曲线;
将面积最大的ROC曲线所对应的潜在客户预测模型,确定为最终的潜在客户预测模型。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述潜在资产提升客户预测方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述潜在资产提升客户预测方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述潜在资产提升客户预测方法。
本发明实施例中,获取目标客户在预设时间段内的历史数据,历史数据包括目标客户的身份信息、历史交易数据和资产信息;将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;在目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。与现有技术中通过人工方式判断潜在资产提升客户的技术方案相比,本发明通过潜在客户预测模型,可以根据目标客户在预设时间段内的历史数据预测目标客户为潜在资产提升客户的概率,由于潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到,从而可以精准定位到资产提升概率较大的客户,进而可以便于为客户提供有效的营销服务,提升客户体验。
本发明实施例中,在确定目标用户为潜在资产提升用户之后,通过对目标客户的四个业务需求项对应的数据进行聚类分析,归纳目标客户资产提升的原因,可以为营销人员提供数据支持与方向,使其能更好地为客户进行营销服务,提升客户体验度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (19)
1.一种潜在资产提升客户预测方法,其特征在于,包括:
获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
2.如权利要求1所述的方法,其特征在于,所述资产信息包括目标客户的资产负债信息、大额异动信息、产品持有信息或基金理财交易信息中的至少一个。
3.如权利要求1所述的方法,其特征在于,确定目标客户为潜在资产提升客户之后,还包括:
基于对业务的分析,从目标客户在预设时间段内的历史数据中获取业务需求项对应的数据,所述业务需求项包括同业来源、产品需求、消费需求和投资需求中的至少一项;
对所述业务需求项对应的数据进行聚类,并对聚类结果进行归因分析,确定所述目标客户资产提升的原因。
4.如权利要求1所述的方法,其特征在于,将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率之前,还包括:
将多个客户的历史数据和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集,每一客户的历史数据包括客户的身份信息、历史交易数据和资产信息;
利用训练集训练机器学习模型,得到潜在客户预测模型;
利用测试集对潜在客户预测模型进行测试。
5.如权利要求4所述的方法,其特征在于,将多个客户的历史数据和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集之前,还包括:
对每一客户的历史数据进行预处理,构建数据宽表;
对数据宽表中离散型区间变量的数据进行归一化处理;
对数据宽表中连续型区间变量的数据进行分箱处理;
基于主成分分析法,对数据宽表的数据进行降维处理;
基于卡方检验和相关系数检验,筛选出与预设的客户资产提升关联的特征数据;
将与预设的客户资产提升关联的特征数据、和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集。
6.如权利要求5所述的方法,其特征在于,对每一客户的历史数据进行预处理,构建数据宽表,包括:
对每一客户的历史数据进行业务分段处理;
对每一客户的历史数据中区间型变量的数据进行最大值、最小值、均值和增长率计算的特征处理;
计算每一客户的历史数据中列名型变量的数据的占比和波动情况;
构建数据宽表。
7.如权利要求4所述的方法,其特征在于,利用训练集训练机器学习模型,得到潜在客户预测模型,包括:
分别建立决策树模型和逻辑回归模型;
利用训练集训练决策树模型,通过调整参数优化决策树模型,得到决策树潜在客户预测模型;
利用训练集训练逻辑回归模型,通过调整参数优化逻辑回归模型,得到逻辑回归潜在客户预测模型;
从决策树潜在客户预测模型和逻辑回归潜在客户预测模型选择一种模型,确定为最终的潜在客户预测模型。
8.如权利要求7所述的方法,其特征在于,从决策树潜在客户预测模型和逻辑回归潜在客户预测模型选择一种模型,确定为最终的潜在客户预测模型,包括:
分别绘制决策树潜在客户预测模型和逻辑回归潜在客户预测模型的受试者工作特征ROC曲线;
将面积最大的ROC曲线所对应的潜在客户预测模型,确定为最终的潜在客户预测模型。
9.一种潜在资产提升客户预测装置,其特征在于,包括:
数据获取模块,用于获取目标客户在预设时间段内的历史数据,所述历史数据包括目标客户的身份信息、历史交易数据和资产信息;
概率预测模块,用于将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率,所述潜在客户预测模型是根据多个客户的历史数据和其对应的潜在资产提升客户概率,对机器学习模型训练得到;
客户确定模块,用于在所述目标客户为潜在资产提升客户的概率大于预设概率阈值的情况下,确定目标客户为潜在资产提升客户。
10.如权利要求9所述的装置,其特征在于,所述资产信息包括目标客户的资产负债信息、大额异动信息、产品持有信息或基金理财交易信息中的至少一个。
11.如权利要求9所述的装置,其特征在于,还包括原因分析模块,用于在客户确定模块确定目标客户为潜在资产提升客户之后:
基于对业务的分析,从目标客户在预设时间段内的历史数据中获取业务需求项对应的数据,所述业务需求项包括同业来源、产品需求、消费需求和投资需求中的至少一项;
对所述业务需求项对应的数据进行聚类,并对聚类结果进行归因分析,确定所述目标客户资产提升的原因。
12.如权利要求9所述的装置,其特征在于,还包括模型训练与测试模块,用于在概率预测模块将目标客户的身份信息、历史交易数据和资产信息输入潜在客户预测模型,预测目标客户为潜在资产提升客户的概率之前:
将多个客户的历史数据和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集,每一客户的历史数据包括客户的身份信息、历史交易数据和资产信息;
利用训练集训练机器学习模型,得到潜在客户预测模型;
利用测试集对潜在客户预测模型进行测试。
13.如权利要求12所述的装置,其特征在于,模型训练与测试模块,具体还用于:
对每一客户的历史数据进行预处理,构建数据宽表;
对数据宽表中离散型区间变量的数据进行归一化处理;
对数据宽表中连续型区间变量的数据进行分箱处理;
基于主成分分析法,对数据宽表的数据进行降维处理;
基于卡方检验和相关系数检验,筛选出与预设的客户资产提升关联的特征数据;
将与预设的客户资产提升关联的特征数据、和其对应的潜在资产提升客户概率作为样本集,构建训练集和测试集。
14.如权利要求13所述的装置,其特征在于,模型训练与测试模块,具体还用于:
对每一客户的历史数据进行业务分段处理;
对每一客户的历史数据中区间型变量的数据进行最大值、最小值、均值和增长率计算的特征处理;
计算每一客户的历史数据中列名型变量的数据的占比和波动情况;
构建数据宽表。
15.如权利要求12所述的装置,其特征在于,模型训练与测试模块,具体还用于:
分别建立决策树模型和逻辑回归模型;
利用训练集训练决策树模型,通过调整参数优化决策树模型,得到决策树潜在客户预测模型;
利用训练集训练逻辑回归模型,通过调整参数优化逻辑回归模型,得到逻辑回归潜在客户预测模型;
从决策树潜在客户预测模型和逻辑回归潜在客户预测模型选择一种模型,确定为最终的潜在客户预测模型。
16.如权利要求15所述的装置,其特征在于,模型训练与测试模块,具体还用于:
分别绘制决策树潜在客户预测模型和逻辑回归潜在客户预测模型的受试者工作特征ROC曲线;
将面积最大的ROC曲线所对应的潜在客户预测模型,确定为最终的潜在客户预测模型。
17.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一所述方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111425714.3A CN113988955A (zh) | 2021-11-26 | 2021-11-26 | 潜在资产提升客户预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111425714.3A CN113988955A (zh) | 2021-11-26 | 2021-11-26 | 潜在资产提升客户预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988955A true CN113988955A (zh) | 2022-01-28 |
Family
ID=79732198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111425714.3A Pending CN113988955A (zh) | 2021-11-26 | 2021-11-26 | 潜在资产提升客户预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988955A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105225135A (zh) * | 2015-10-31 | 2016-01-06 | 广州华多网络科技有限公司 | 潜力客户识别方法以及装置 |
CN108108861A (zh) * | 2018-03-06 | 2018-06-01 | 中国银行股份有限公司 | 一种潜在客户的预测方法及装置 |
CN110766481A (zh) * | 2019-11-04 | 2020-02-07 | 泰康保险集团股份有限公司 | 客户数据处理方法、装置、电子设备及计算机可读介质 |
CN111105265A (zh) * | 2019-10-12 | 2020-05-05 | 平安银行股份有限公司 | 基于客户信息的预测方法、装置、计算机设备及存储介质 |
CN112488142A (zh) * | 2019-09-12 | 2021-03-12 | 中移(苏州)软件技术有限公司 | 一种雷达故障的预测方法、装置及存储介质 |
CN112686749A (zh) * | 2020-12-31 | 2021-04-20 | 上海竞动科技有限公司 | 一种基于逻辑回归技术的信用风险评估方法及装置 |
CN113421116A (zh) * | 2021-06-22 | 2021-09-21 | 康键信息技术(深圳)有限公司 | 用户召回分析方法、装置、设备及存储介质 |
-
2021
- 2021-11-26 CN CN202111425714.3A patent/CN113988955A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105225135A (zh) * | 2015-10-31 | 2016-01-06 | 广州华多网络科技有限公司 | 潜力客户识别方法以及装置 |
CN108108861A (zh) * | 2018-03-06 | 2018-06-01 | 中国银行股份有限公司 | 一种潜在客户的预测方法及装置 |
CN112488142A (zh) * | 2019-09-12 | 2021-03-12 | 中移(苏州)软件技术有限公司 | 一种雷达故障的预测方法、装置及存储介质 |
CN111105265A (zh) * | 2019-10-12 | 2020-05-05 | 平安银行股份有限公司 | 基于客户信息的预测方法、装置、计算机设备及存储介质 |
CN110766481A (zh) * | 2019-11-04 | 2020-02-07 | 泰康保险集团股份有限公司 | 客户数据处理方法、装置、电子设备及计算机可读介质 |
CN112686749A (zh) * | 2020-12-31 | 2021-04-20 | 上海竞动科技有限公司 | 一种基于逻辑回归技术的信用风险评估方法及装置 |
CN113421116A (zh) * | 2021-06-22 | 2021-09-21 | 康键信息技术(深圳)有限公司 | 用户召回分析方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102044205B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
CA3120412C (en) | An automated and dynamic method and system for clustering data records | |
CN109583966B (zh) | 一种高价值客户识别方法、系统、设备及存储介质 | |
US11144844B2 (en) | Refining customer financial security trades data model for modeling likelihood of successful completion of financial security trades | |
CN111160745A (zh) | 用户账户数据的处理方法及装置 | |
US11481707B2 (en) | Risk prediction system and operation method thereof | |
CN111951050A (zh) | 理财产品推荐方法及装置 | |
CN112308623A (zh) | 基于监督学习的优质客户流失预测方法、装置及存储介质 | |
CN114581249B (zh) | 基于投资风险承受能力评估的金融产品推荐方法及系统 | |
CN109977977B (zh) | 一种识别潜在用户的方法及对应装置 | |
US20230359941A1 (en) | System and method for efficient transformation prediction in a data analytics prediction model pipeline | |
CN116883065A (zh) | 商户风险预测方法及装置 | |
CN111612491A (zh) | 状态分析模型构建方法、分析方法及装置 | |
CN113781056A (zh) | 预测用户欺诈行为的方法及装置 | |
CN110457329B (zh) | 一种实现个性化推荐的方法及装置 | |
CN112506907A (zh) | 基于大数据的工程机械营销策略推送方法、系统及装置 | |
CN113988955A (zh) | 潜在资产提升客户预测方法及装置 | |
CN115167965A (zh) | 交易进度条的处理方法及装置 | |
CN115099928A (zh) | 流失客户识别方法及装置 | |
CN113240513A (zh) | 一种用户授信额度的确定方法和相关装置 | |
CN110610200B (zh) | 车商分类方法、装置、计算机设备及存储介质 | |
CN114861680B (zh) | 对话处理方法及装置 | |
CN112101816B (zh) | 审计计划智能推荐方法及装置 | |
CN115631050A (zh) | 金融产品推荐方法及装置 | |
CN118608276A (zh) | 用户还款逾期风险的检测方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |