CN114820082A - 消费额度预测方法、装置、计算机设备和存储介质 - Google Patents

消费额度预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114820082A
CN114820082A CN202210606061.7A CN202210606061A CN114820082A CN 114820082 A CN114820082 A CN 114820082A CN 202210606061 A CN202210606061 A CN 202210606061A CN 114820082 A CN114820082 A CN 114820082A
Authority
CN
China
Prior art keywords
consumption
target
prediction model
characteristic
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210606061.7A
Other languages
English (en)
Inventor
程鹏
白佳乐
任政
武文轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210606061.7A priority Critical patent/CN114820082A/zh
Publication of CN114820082A publication Critical patent/CN114820082A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种消费额度预测方法、装置、计算机设备和存储介质,涉及大数据领域。所述方法包括:从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据,并通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度,其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。采用本方法能够提高消费额度的预测精度。

Description

消费额度预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及大数据技术领域,特别是涉及一种消费额度预测方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,网上交易迅速发展,网上购物也成为了人们的一种主要购物方式,据统计,超过80%的网络用户有过网购行为。很多电商平台为了吸引用户消费,会对用户进行针对性的推销和广告推送,为了可以提高推送内容的精准性,就需要对用户的消费额度进行预测,从而为不同消费水平的用户进行不同的广告推送,对消费额度高的用户采用更准确的营销策略。
但传统的预测方法中,使用统计方法对用户消费额度进行预测时,需要大量样本数据,预测过程复杂,这使得该预测方法难以进行推广。
为解决上述问题,提出了采用人工智能对用户进行消费额度预测的方式,但是采用人工智能对用户进行消费额度预测时,难以保证预测精度。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速准确进行预测的消费额度预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种消费额度预测方法。所述方法包括:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
在其中一个实施例中,所述消费预测模型的第一层为所述gbdt,所述消费预测模型中除所述第一层以外的其他层均为所述catboost。
在其中一个实施例中,所述方法还包括:
从样本用户的历史消费数据中,获取各消费特征对应的消费数据;
根据特征权重算法和各所述消费特征对应的所述消费数据,从所述消费特征中确定所述目标消费特征;
根据所述目标消费特征对应的所述消费数据,构建训练集;
通过所述训练集对初始消费预测模型进行训练,得到所述消费预测模型。
在其中一个实施例中,所述通过所述训练集对初始消费预测模型进行训练,包括:
采用粒子群算法确定初始消费预测模型对应的最优超参数;
基于所述最优超参数,采用所述训练集对所述初始消费预测模型进行训练,得到所述消费预测模型;
其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,并采用更新所述惯性因子后的粒子群算法确定所述消费预测模型的最优超参数。
在其中一个实施例中,所述采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,包括:
根据所述粒子运动的所述历史数据,确定惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值;
根据所述惯性权重最大值、所述惯性权重最小值、所述粒子最小目标值和所述粒子最大目标值,确定惯性因子调整值;
将所述惯性权重最大值与所述惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
在其中一个实施例中,所述从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据,包括:
从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据;
针对任一所述目标消费特征,将所述目标消费特征对应的所述历史消费数据的均值,作为所述目标消费特征对应的目标消费数据。
第二方面,本申请还提供了一种消费额度预测装置。所述装置包括:
第一获取模块,用于从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
预测模块,用于通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度,其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
在其中一个实施例中,所述消费预测模型的第一层为所述gbdt,所述消费预测模型中除所述第一层以外的其他层均为所述catboost。
在其中一个实施例中,所述装置还包括:
第二获取模块,用于从样本用户的历史消费数据中,获取各消费特征对应的消费数据;
确定模块,用于根据特征权重算法和各所述消费特征对应的所述消费数据,从所述消费特征中确定所述目标消费特征;
构建模块,用于根据所述目标消费特征对应的所述消费数据,构建训练集;
训练模块,用于通过所述训练集对初始消费预测模型进行训练,得到所述消费预测模型。
在其中一个实施例中,所述训练模块还用于:
采用粒子群算法确定初始消费预测模型对应的最优超参数;
基于所述最优超参数,采用所述训练集对所述初始消费预测模型进行训练,得到所述消费预测模型;
其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,并采用更新所述惯性因子后的粒子群算法确定所述消费预测模型的最优超参数。
在其中一个实施例中,所述训练模块还用于:
根据所述粒子运动的所述历史数据,确定惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值;
根据所述惯性权重最大值、所述惯性权重最小值、所述粒子最小目标值和所述粒子最大目标值,确定惯性因子调整值;
将所述惯性权重最大值与所述惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
在其中一个实施例中,所述第一获取模块还用于:
从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据;
针对任一所述目标消费特征,将所述目标消费特征对应的所述历史消费数据的均值,作为所述目标消费特征对应的目标消费数据。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
上述消费额度预测方法、装置、计算机设备、存储介质和计算机程序产品,从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据,并通过消费预测模型对各目标特征对应的目标消费数据进行预测处理,得到目标用户对应的预测消费额度,其中,消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。基于上述消费额度预测方法、装置、计算机设备、存储介质和计算机程序产品,通过对由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型进行训练,得到消费预测模型,由于梯度提升决策树gbdt在超参数调优受限时,能保证较高预测精度,而类别提升算法catboost能减少对超参数调优的要求、避免模型过度拟合,因此,由梯度提升决策树gbdt和类别提升算法catboost构成的消费预测模型,能降低对超参数调优的要求,缩短模型训练的时间,并能够避免模型过度拟合,进而提高消费额度的预测精度。
附图说明
图1为一个实施例中消费额度预测方法的流程示意图;
图2为一个实施例中消费预测模型的示意图;
图3为另一个实施例中消费额度预测方法的流程示意图;
图4为另一个实施例中消费额度预测方法的流程示意图;
图5为另一个实施例中消费额度预测方法的流程示意图;
图6为另一个实施例中消费额度预测方法的流程示意图;
图7为一个实施例中消费预测装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种消费额度预测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。
本实施例中,该方法包括以下步骤:
步骤102,从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据。
本申请实施例中,历史消费数据为用户在消费平台上点击、浏览以及购买商品所产生的数据,例如:对某商品平均每天点击量、对某商品的总点击量、对某商品的平均总浏览量、对某商品的访问次数、点击商品的单价、用户每天消费额度、用户每周消费额度、用户每月消费额度等。
目标用户为待进行消费额度预测的用户,在对目标用户未来的消费额度进行预测时,首先可以从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据,其中,目标消费特征为消费数据的具体分类,其与用户消费水平(也即用户的预测消费额度)具有一定的关系,目标消费数据为目标消费特征的具体数值,因此,根据目标消费特征所对应的目标消费数据,可以预测出目标用户未来的消费额度。
步骤104,通过消费预测模型对各目标特征对应的目标消费数据进行预测处理,得到目标用户对应的预测消费额度;
其中,消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
本申请实施例中,可以根据之前训练得到的消费预测模型对各目标特征对应的目标消费数据进行预测处理,以得到目标用户对应的预测消费额度,其中,预测消费额度即为目标用户在未来一段时间内的消费额度,商家可以根据目标用户对应的预测消费额度,调整对目标用户的推销方式和推销内容。
其中,将由梯度提升决策树(gbdt,Gradient Boosting Decision Tree)和类别提升算法catboost构成的级联森林模型作为初始消费预测模型,对该初始消费预测模型进行训练,可以得到消费预测模型,catboost减少了对超参数调优的需求,同时在超参数调优时间较短、超参数优化程度受限的情况下,gbdt能保持较高的预测准确度,因此,通过该消费预测模型进行预测的预测精度会提高,同时,catboost可以避免模型的过度拟合(即过于紧密或精确地对应于特定数据集的分析结果,因此可能无法拟合其他数据或可靠地预测未来的观察结果),进一步提高了消费预测模型的预测准确度。
上述消费额度预测方法中,通过对由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型进行训练,得到消费预测模型,由于梯度提升决策树gbdt在超参数调优受限时,能保证较高预测精度,而类别提升算法catboost能减少对超参数调优的要求、避免模型过度拟合,因此,由梯度提升决策树gbdt和类别提升算法catboost构成的消费预测模型,能降低对超参数调优的要求,缩短模型训练的时间,并能够避免模型过度拟合,进而提高消费额度的预测精度。
在一个实施例中,如图2所示,消费预测模型的第一层为gbdt,消费预测模型中除第一层以外的其他层均为catboost。
本申请实施例中,消费预测模型的第一层为gbdt,当消费预测模型对各目标消费特征对应的目标消费数据进行预测处理时,目标消费数据输入到消费预测模型中,第一层的gbdt首先对目标消费数据进行处理,经过第一层处理后的数据输入到第二层,第二层的catboost会对第一层输出的数据进行处理,以此类推,第三层的catboost会对第二层输出的数据进行处理……直到最后一层的catboost对上一层输出的数据进行处理,最终输出目标用户对应的预测消费额度。
示例性的,以消费预测模型有3层为例,消费预测模型的第一层为gbdt,消费预测模型的第二层和第三层均为catboost,首先,将目标消费数据输入消费预测模型,消费预测模型第一层的gbdt对目标消费数据进行处理,得到第一层数据并将第一层数据向第二层传输,第二层的catboost对第一层数据进行处理,得到第二层数据并将第二层数据传输到第三层,第三层的catboost对第二层数据进行处理,最后得到目标用户的预测消费额度,并将目标用户的预测消费额度输出。
其中,gbdt可以灵活处理各种数据,将消费预测模型的第一层设置为gbdt,向消费预测模型中输入任何类型的数据,gbdt都可以灵活处理,但若整个消费预测模型的各层均设置为gbdt,训练得到的消费预测模型容易产生过度拟合,影响消费预测模型的预测准确性,catboost可以避免模型在训练过程中的过度拟合,故将消费预测模型中除第一层之外的其他层设置为catboost,不仅可以提高消费预测模型的通用性,且能够提高预测精度。
在一个示例性的实施例中,可以将消费预测模型设置为5层结构,其中第一层为gbdt,第二层、第三层、第四层、第五层均为catboost,经过实验验证,此时消费预测模型对目标用户对应的预测消费额度的预测准确性和预测精度最好。
本实施例中,通过设置消费预测模型中各层的具体结构,令消费预测模型的第一层为gbdt,消费预测模型中除第一层以外的其他层均为catboost,由于梯度提升决策树gbdt在超参数调优受限时,能保证较高预测精度,而类别提升算法catboost能减少对超参数调优的要求、避免模型过度拟合,因此,由梯度提升决策树gbdt和类别提升算法catboost构成的消费预测模型,能降低对超参数调优的要求,缩短模型训练的时间,并能够避免模型过度拟合,进而提高消费额度的预测精度。
在一个实施例中,如图3所示,所述方法还包括:
步骤302,从样本用户的历史消费数据中,获取各消费特征对应的消费数据。
本申请实施例中,消费特征指消费数据的类型,例如,消费特征可以包括某商品平均每天总点击量、总点击量、用户平均每天总浏览量、访问次数、总浏览量、平均每天点击次数、用户每周平均点击次数、用户每月点击次数、点击商品的单价等,其中,上述消费特征均为用户对某一商品进行点击、浏览、访问所形成的消费数据的类型,示例性的,A商品平均每天总点击量表示用户平均每天对A商品的点击量。消费特征还可以包括用户每天消费额度、用户每周消费额度、用户每月消费额度。
在对初始消费预测模型进行训练时,需要选取多个样本用户,并从各样本用户的历史消费数据中,获取各消费特征对应的消费数据,此时,各消费特征对应的消费数据有多个。
步骤304,根据特征权重算法和各消费特征对应的消费数据,从消费特征中确定目标消费特征。
本申请实施例中,可以根据特征权重算法和各消费特征对应的消费数据,先确定各消费特征的特征权重,再根据各消费特征的特征权重,从消费特征中确定目标消费特征,例如,可以将各消费特征按照特征权重从高到低进行排序,将排名在预设名次之前的消费特征作为目标消费特征,或者,可以设置预设特征权重,将特征权重大于或等于预设特征权重的消费特征作为目标消费特征。
示例性的,消费特征包括某商品每天点击量、总点击量、用户每天浏览量、访问次数、总浏览量、每天点击次数、用户每周点击次数、用户每月点击次数、点击商品的单价、用户每天消费额度、用户每周消费额度、用户每月消费额度,根据特征权重算法和各消费特征对应的消费数据,所确定的目标消费特征包括:某商品每天点击量、总点击量、用户每天浏览量、访问次数、总浏览量、每天点击次数、用户每周点击次数、用户每月点击次数、点击商品的单价。
示例性的,可以根据relief特征选择算法和各消费特征对应的消费数据,确定各消费特征的特征权重,relief算法是一种多类别特征提取算法,示例性的,可以根据用户的消费额度,将用户分为低消费人群、中消费人群和高消费人群,其中,用户的消费额度低于1000元/月,则该用户为低消费人群,用户的消费额度在1000~5000元/月,则该用户为中消费人群,用户的消费额度大于5000元/月,则该用户为高消费人群,根据上述对用户的分类,可以将所有消费数据分为三个样本组:低消费人群的消费数据、中消费人群的消费数据和高消费人群的消费数据,特征权重的计算过程如下:首先,从消费数据中随机选取一个消费数据a,在与消费数据a相同分类的样本组中,选取出k个最近邻样本,记为集合M;在与消费数据a不同分类的各样本组中,分别取出k个最近邻样本,记为集合N,之后,针对一个消费特征A,计算集合M中每一个元素与消费数据a在消费特征A上的差的第一平均值,并计算集合N中每一个元素与消费数据a在消费特征A上的差的第二平均值,根据第一平均值和第二平均值可以计算得到消费特征A的特征权重,根据上述计算过程,可以分别得到各消费特征的特征权重。
需要说明的是,以上用户分类方式仅作为本公开实施例的一种示例,实际上可以基于实际需要对用户进行更粗粒度或者更细粒度的划分,本公开实施例对用户分类方式不做具体限定。
上述根据第一平均值和第二平均值可以计算得到消费特征A的特征权重的过程可以参照现有技术中relief特征选择算法确定任一特征的特征权重的过程,本申请在此不再赘述。
需要说明的是,上述根据relief特征选择算法和各消费特征对应的消费数据,确定各消费特征的特征权重仅为本申请实施例中的一个示例,本申请对于特征权重算法不做具体限定。
步骤306,根据目标消费特征对应的消费数据,构建训练集。
本申请实施例中,根据目标消费特征对应的消费数据,构建训练集,其中,任一目标消费特征对应有多个消费数据,可以将各消费特征对应的部分消费数据作为训练数据,构建训练集,其他消费数据作为检验数据,构建检验集,例如,可以将80%的消费数据作为训练数据,剩余的20%的消费数据作为检验数据。
步骤308,通过训练集对初始消费预测模型进行训练,得到消费预测模型。
本申请实施例中,将训练集输入初始消费预测模型中对该初始消费预测模型进行训练,得到消费预测模型,之后可以利用检验集对消费预测模型进行检验,若检验得到的消费预测模型的预测精度不满足预测需要,可以重新利用训练集对初始消费预测模型进行训练。
本申请实施例中,通过特征权重算法计算得到各消费特征的特征权重,并根据特征权重选取目标消费特征,仅选取特征权重较大的目标消费特征对应的目标消费数据,作为训练集,也即采用更能代表用户未来消费额度的消费特征(预测能力较强)对应的消费数据对初始消费预测模型进行训练,提高消费预测模型的预测精度。
在一个实施例中,如图4所示,步骤308还包括:
步骤402,采用粒子群算法确定初始消费预测模型对应的最优超参数,其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,采用粒子运动过程中产生的历史数据,实时对粒子的惯性因子进行更新,并采用更新惯性因子后的粒子群算法确定消费预测模型的最优超参数。
本申请实施例中,超参数为是开始训练学习之前需要人为设置的参数,并不是通过训练得到的参数数据,通常在训练预测模型时,需要对超参数进行优化,给预测模型提供一组最优超参数,以提高学习和训练的效果,得到最优的预测模型。在本申请实施例中,可以采用粒子群算法来确定初始消费预测模型对应的最优超参数,利用粒子群算法确定最优超参数的过程,也即采用粒子群算法搜寻超参数的最优解的过程。
本申请实施例中,惯性因子是粒子群算法中令粒子保持原有运动速度的能力的参数,惯性因子越大,越有利于粒子的全局搜索,惯性因子越小,越有利于粒子的局部搜索。
其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,可以根据粒子在运动过程中所产生的历史数据,确定粒子在任一时刻的惯性因子,并实时更新粒子群算法中的惯性因子,得到该时刻的粒子群算法,采用更新惯性因子后的粒子群算法确定消费预测模型的最优超参数。
步骤404,基于最优超参数,采用训练集对初始消费预测模型进行训练,得到消费预测模型。
本申请实施例中,在确定好最优超参数后,就可以采用训练集对初始消费预测模型进行训练,最后得到一个最优的消费预测模型。
本申请实施例中,根据粒子运动的历史数据来实时更新粒子的惯性因子,并根据惯性因子实时更新粒子群算法,因为惯性因子与粒子的全局搜索以及局部搜索有关,实时更新惯性因子可以令粒子搜索最优解的速度和精度在任一时刻都可以保证最优,也就使根据更新后的粒子群算法确定最优超参数的速度和精度在任一时刻保证最优,提高了消费预测模型训练的速度。
在一个实施例中,如图5所示,采用粒子运动过程中产生的历史数据,实时对粒子的惯性因子进行更新,包括:
步骤502,根据粒子运动的历史数据,确定惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值。
本申请实施例中,惯性权重最大值是粒子在运动过程中曾经取过的所有惯性因子取值中的最大值,惯性权重最小值是粒子在运动过程中曾经取过的所有惯性因子取值中的最小值,粒子最小目标值是粒子在运动过程中曾经取过的所有目标函数取值中的最小值,粒子最大目标值是粒子在运动过程中曾经取过的所有目标函数取值中的最大值。
步骤504,根据惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值,确定惯性因子调整值。
本申请实施例中,惯性因子调整值用于调整粒子在运动过程中惯性因子值,其中,惯性因子调整值和惯性权重最大值与惯性权重最小值的差值成正比,且惯性因子调整值和粒子当前函数值与粒子最小目标值的差值成正比,惯性因子调整值和粒子最大目标值与粒子最小目标值的差值成反比,也即,将惯性权重最大值与惯性权重最小值的差值、以及粒子当前函数值与粒子最小目标值的差值进行乘积处理,并令上述乘积结果除以粒子最大目标值与粒子最小目标值的差值,就可以得到惯性因子调整值。
确定惯性因子调整值的过程可以参照下述公式(一):
Figure BDA0003671363920000121
其中,θ表示惯性因子调整值,ωmax表示惯性权重最大值,ωmin表示惯性权重最小值,f表示粒子当前函数值,fmin表示粒子最小目标值,fmax表示粒子最大目标值。
步骤506,将惯性权重最大值与惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
本申请实施例中,可以令惯性权重最大值减去惯性因子调整值,将惯性权重最大值与惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
确定粒子群算法在当前时刻的惯性因子的过程参照下述公式(二):
ω=ωmax-θ 公式(二)
其中,ω表示粒子群算法在当前时刻的惯性因子。
本申请实施例中,根据粒子运动的历史数据来实时更新粒子的惯性因子,并根据惯性因子实时更新粒子群算法,因为惯性因子与粒子的全局搜索以及局部搜索有关,实时更新惯性因子可以令粒子搜索最优解的速度和精度在任一时刻都可以保证最优,也就使根据更新后的粒子群算法确定最优超参数的速度和精度在任一时刻保证最优,提高了消费预测模型训练的速度。
在一个实施例中,如图6所示,步骤102包括:
步骤602,从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据。
本申请实施例中,可以从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据,其中,目标消费特征对应的历史消费数据是可以直接从平台中获取的数据,例如:以用户对某商品每天点击量为例,该目标消费特征对应的历史消费数据为,在过去一个预设周期(一周)内,用户从周一到周日每天对该商品每天的点击量,此时,目标消费特征对应的历史消费数据有7个。
步骤604,针对任一目标消费特征,将目标消费特征对应的历史消费数据的均值,作为目标消费特征对应的目标消费数据。
本申请实施例中,针对任一目标消费特征,可以将目标消费特征对应的历史消费数据的均值,作为目标消费特征对应的目标消费数据,仍以上述示例为例,用户对某商品每天点击量对应的历史数据为,在过去一个预设周期(一周)内,用户从周一到周日每天对该商品每天的点击量,将这7个数据进行均值处理,就得到了用户对某商品的平均每天点击量对应的消费数据,将用户对某商品的平均每天点击量对应的消费数据,作为用户对某商品每天点击量的目标消费数据。
本申请实施例中,将目标消费特征对应的历史消费数据的均值,作为目标消费特征对应的目标消费数据,均值后的历史消费数据更能体现用户的消费水平,避免了某一次偏离消费水平的消费对预测结果精度产生影响,通过消费预测模型对上述目标消费数据进行预测,得到的预测消费额度更加准确。
在一个示例性的实施例中,首先从样本用户的历史数据中,获取各消费特征对应的历史数据,并根据relief特征选择算法,确定各消费特征的特征权重,确定各消费特征的特征权重的过程参照上述示例中所述过程,在此不再赘述。。
以三个消费特征A、B、C为例,消费特征A的特征权重为0.8,消费特征B的特征权重为0.9,消费特征C的特征权重为0.4,预设特征权重为0.8,消费特征A和消费特征B的特征权重均大于或等于0.8,则将消费特征A和消费特征B作为目标消费特征。
在本示例中,最后选取了目标消费特征:某商品平均每天总点击量、总点击量、用户平均每天总浏览量、访问次数、总浏览量、平均每天点击次数、用户每周平均点击次数、用户每月点击次数、点击商品的单价。
其中,各目标消费特征分别对应有多个样品用户的目标消费数据,将各目标消费特征对应的80%的目标消费数据作为训练数据,构建训练集,剩余的20%的目标消费数据构建检验集。
将训练集输入到初始消费预测模型中进行训练,并使用检验集对预测精度进行检验,最终得到消费预测模型,其中,消费预测模型的第一层为gbdt,消费预测模型的其他层均为catboost。
之后利用消费预测模型对目标用户未来的消费额度进行预测,首先,从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据,并将各目标消费特征对应的历史消费数据的均值,作为各目标消费特征对应的目标消费数据,其中,目标消费特征与目标消费数据是一一对应的。其次,将各目标消费特征对应的目标消费数据输入消费预测模型中,即可得到目标用户的预测消费额度。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的消费额度预测方法的消费额度预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个消费额度预测装置实施例中的具体限定可以参见上文中对于消费额度预测方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种消费额度预测装置,包括:第一获取模块702和预测模块704,其中:
第一获取模块702,用于从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
预测模块704,用于通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度,其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
本申请实施例中,通过对由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型进行训练,得到消费预测模型,上述消费预测模型中的梯度提升决策树gbdt在超参数调优受限时,能保证较高预测精度,消费预测模型中的类别提升算法catboost能减少对超参数调优的要求、避免模型过度拟合,因此,消费预测模型能降低对超参数调优的要求,缩短了模型训练的时间,并避免模型过度拟合,提高了预测精度。
在一个实施例中,所述消费预测模型的第一层为所述gbdt,所述消费预测模型中除所述第一层以外的其他层均为所述catboost。
在一个实施例中,所述装置还包括:通过对由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型进行训练,得到消费预测模型,上述消费预测模型具有梯度提升决策树gbdt和类别提升算法catboost的优点,可以更快速、更准确地预测出目标用户的预测消费额度。
第二获取模块,用于从样本用户的历史消费数据中,获取各消费特征对应的消费数据;
确定模块,用于根据特征权重算法和各所述消费特征对应的所述消费数据,从所述消费特征中确定所述目标消费特征;
构建模块,用于根据所述目标消费特征对应的所述消费数据,构建训练集;
训练模块,用于通过所述训练集对初始消费预测模型进行训练,得到所述消费预测模型。
在一个实施例中,所述训练模块还用于:
采用粒子群算法确定初始消费预测模型对应的最优超参数;
基于所述最优超参数,采用所述训练集对所述初始消费预测模型进行训练,得到所述消费预测模型;
其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,并采用更新所述惯性因子后的粒子群算法确定所述消费预测模型的最优超参数。
在一个实施例中,所述训练模块还用于:
根据所述粒子运动的所述历史数据,确定惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值;
根据所述惯性权重最大值、所述惯性权重最小值、所述粒子最小目标值和所述粒子最大目标值,确定惯性因子调整值;
将所述惯性权重最大值与所述惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
在一个实施例中,所述第一获取模块702还用于:
从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据;
针对任一所述目标消费特征,将所述目标消费特征对应的所述历史消费数据的均值,作为所述目标消费特征对应的目标消费数据。
上述消费额度预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种消费额度预测方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种消费额度预测方法,其特征在于,所述方法包括:
从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度;
其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
2.根据权利要求1所述的方法,其特征在于,所述消费预测模型的第一层为所述gbdt,所述消费预测模型中除所述第一层以外的其他层均为所述catboost。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
从样本用户的历史消费数据中,获取各消费特征对应的消费数据;
根据特征权重算法和各所述消费特征对应的所述消费数据,从所述消费特征中确定所述目标消费特征;
根据所述目标消费特征对应的所述消费数据,构建训练集;
通过所述训练集对初始消费预测模型进行训练,得到所述消费预测模型。
4.根据权利要求3所述的方法,其特征在于,所述通过所述训练集对初始消费预测模型进行训练,包括:
采用粒子群算法确定初始消费预测模型对应的最优超参数;
基于所述最优超参数,采用所述训练集对所述初始消费预测模型进行训练,得到所述消费预测模型;
其中,在采用粒子群算法确定初始消费预测模型对应的最优超参数的过程中,采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,并采用更新所述惯性因子后的粒子群算法确定所述消费预测模型的最优超参数。
5.根据权利要求4所述的方法,其特征在于,所述采用粒子运动过程中产生的历史数据,实时对所述粒子的惯性因子进行更新,包括:
根据所述粒子运动的所述历史数据,确定惯性权重最大值、惯性权重最小值、粒子最小目标值和粒子最大目标值;
根据所述惯性权重最大值、所述惯性权重最小值、所述粒子最小目标值和所述粒子最大目标值,确定惯性因子调整值;
将所述惯性权重最大值与所述惯性因子调整值的差值,作为粒子群算法在当前时刻的惯性因子。
6.根据权利要求1所述的方法,其特征在于,所述从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据,包括:
从目标用户的历史消费数据中,获取各目标消费特征对应的历史消费数据;
针对任一所述目标消费特征,将所述目标消费特征对应的所述历史消费数据的均值,作为所述目标消费特征对应的目标消费数据。
7.一种消费额度预测装置,其特征在于,所述装置包括:
第一获取模块,用于从目标用户的历史消费数据中,获取各目标消费特征对应的目标消费数据;
预测模块,用于通过消费预测模型对各所述目标特征对应的所述目标消费数据进行预测处理,得到所述目标用户对应的预测消费额度,其中,所述消费预测模型为由梯度提升决策树gbdt和类别提升算法catboost构成的级联森林模型。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210606061.7A 2022-05-31 2022-05-31 消费额度预测方法、装置、计算机设备和存储介质 Pending CN114820082A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210606061.7A CN114820082A (zh) 2022-05-31 2022-05-31 消费额度预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210606061.7A CN114820082A (zh) 2022-05-31 2022-05-31 消费额度预测方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114820082A true CN114820082A (zh) 2022-07-29

Family

ID=82518733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210606061.7A Pending CN114820082A (zh) 2022-05-31 2022-05-31 消费额度预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114820082A (zh)

Similar Documents

Publication Publication Date Title
US20180150783A1 (en) Method and system for predicting task completion of a time period based on task completion rates and data trend of prior time periods in view of attributes of tasks using machine learning models
CN112487278A (zh) 推荐模型的训练方法、预测选择概率的方法及装置
CN110610382B (zh) 车辆销售量预测方法、装置、计算机设备和存储介质
US10726334B1 (en) Generation and use of model parameters in cold-start scenarios
CN112163963B (zh) 业务推荐方法、装置、计算机设备和存储介质
US11861654B2 (en) System and method for predicting customer behavior
CN112232833A (zh) 流失会员客群数据预测方法、模型训练方法及装置
CN113191838A (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN115630221A (zh) 终端应用界面展示数据处理方法、装置及计算机设备
CN113034168A (zh) 内容项投放方法、装置、计算机设备及存储介质
US11210624B1 (en) Method and system for determining quantity predictions
CN113313562B (zh) 产品数据处理方法、装置、计算机设备和存储介质
CN115511562A (zh) 虚拟产品推荐方法、装置、计算机设备和存储介质
CN114219184A (zh) 产品交易数据预测方法、装置、设备、介质和程序产品
CN114820082A (zh) 消费额度预测方法、装置、计算机设备和存储介质
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN117195061B (zh) 事件响应预测模型处理方法、装置和计算机设备
Lee et al. A hybrid machine learning approach for customer loyalty prediction
US20240070743A1 (en) Systems and methods for recommended sorting of search results for online searching
US20230214903A1 (en) Methods and apparatus for predicting a user acquisition event
US20240020717A1 (en) Methods and apparatus for predicting a user churn event
CN117151884A (zh) 资产管理数据处理方法、装置、计算机设备和存储介质
CN116680467A (zh) 对象推荐方法、装置、计算机设备和存储介质
CN116644826A (zh) 基于融合模型来预测用户消费的方法和系统
CN117291653A (zh) 产品销量数据预测方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination