CN114418685A - 基于XGBoost模型的资源推荐方法、装置及设备 - Google Patents

基于XGBoost模型的资源推荐方法、装置及设备 Download PDF

Info

Publication number
CN114418685A
CN114418685A CN202210056071.8A CN202210056071A CN114418685A CN 114418685 A CN114418685 A CN 114418685A CN 202210056071 A CN202210056071 A CN 202210056071A CN 114418685 A CN114418685 A CN 114418685A
Authority
CN
China
Prior art keywords
feature
preset
data
resource
xgboost model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210056071.8A
Other languages
English (en)
Inventor
卢晓萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen One Account Technology Co ltd
Original Assignee
Shenzhen One Account Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen One Account Technology Co ltd filed Critical Shenzhen One Account Technology Co ltd
Priority to CN202210056071.8A priority Critical patent/CN114418685A/zh
Publication of CN114418685A publication Critical patent/CN114418685A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于XGBoost模型的资源推荐方法、装置及设备,涉及计算机技术领域,可以解决资源推荐准确性低的问题。包括:利用历史询价数据构建的第一特征集训练XGBoost模型,利用训练完成的XGBoost模型确定第一特征集的特征重要权重;在第一特征集中剔除特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集;利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值时确定为成交预测模型;将实时资源数据输入成交预测模型,确定实时资源数据的成交预测概率;根据成交预测概率为目标主体生成下单资源推荐。

Description

基于XGBoost模型的资源推荐方法、装置及设备
技术领域
本申请涉及计算机技术领域,尤其涉及到一种基于XGBoost模型的资源推荐方法、装置及设备。
背景技术
交易平台的使用用户包括资源需求方和资源供应方,资源需求方可通过在交易平台内上传资源需求,由交易平台进行相关资源供应方以及相关资源数据的筛选,并将筛选内容推送至资源需求方所在客户端进行展示,然而鉴于匹配的相关资源供应方以及相关资源数据的数据量较大,故容易导致资源需求方需要花费大量的时间进行资源的选取。为了营造良好的用户体验,故需要结合资源需求方的实际需求,为资源需求方生成精准资源推荐。
目前在为资源需求方生成资源筛选时,主要是通过人工分析历史环比、同比、增长率等数据,判断资源需求方下单是趋势性递增或递减,还是有周期性的波动,来预测资源需求方本次针对资源的下单概率。然而传统的方法依赖于经验,主观因素太多,很难预测出资源需求方的真实需求,而且很容易受异常数据的影响,预测准确率低。
发明内容
有鉴于此,本申请提供了一种基于XGBoost模型的资源推荐方法、装置及设备,涉及计算机技术领域,可以解决在与资源推荐准确性低的问题。
根据本申请的一个方面,提供了一种基于XGBoost模型的资源推荐方法,该方法包括:
利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的所述XGBoost模型确定所述第一特征集中各个预设特征项的特征重要权重;
在所述第一特征集中剔除对应所述特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,所述第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;
利用所述第二特征集迭代训练所述XGBoost模型,直至所述XGBoost模型的模型评估指标大于第二预设指标阈值,将所述XGBoost模型确定为成交预测模型,其中,所述第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;
接收各个资源主体的实时资源数据,并将所述实时资源数据输入所述成交预测模型,确定各个所述实时资源数据的成交预测概率;
根据所述成交预测概率为所述目标主体生成下单资源推荐。
根据本申请的另一个方面,提供了一种基于XGBoost模型的资源推荐装置,该装置包括:
训练模块,用于利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的所述XGBoost模型确定所述第一特征集中各个预设特征项的特征重要权重;
剔除模块,用于在所述第一特征集中剔除对应所述特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,所述第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;
确定模块,用于利用所述第二特征集迭代训练所述XGBoost模型,直至所述XGBoost模型的模型评估指标大于第二预设指标阈值,将所述XGBoost模型确定为成交预测模型,其中,所述第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;
输入模块,用于接收各个资源主体的实时资源数据,并将所述实时资源数据输入所述成交预测模型,确定各个所述实时资源数据的成交预测概率;
生成模块,用于根据所述成交预测概率为所述目标主体生成下单资源推荐。
根据本申请的又一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于XGBoost模型的资源推荐方法。
根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于XGBoost模型的资源推荐方法。
借由上述技术方案,本申请公开了一种基于XGBoost模型的资源推荐方法、装置及设备,可首先利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重;在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;进一步利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;在接收到各个资源主体的实时资源数据后,可将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率;最终根据成交预测概率为目标主体生成下单资源推荐。通过本申请中的技术方案,针对待推送资源的目标主体,可预先利用成交预测模型对多个资源主体的实时资源数据进行成交预测概率计算,以从多个实时资源数据中选择与目标主体匹配的进行推荐,缩短目标主体对资源数据的筛选时长,从而提升客户体验,促进成交率。此外,在进行成交预测模型的训练时,可通过不断特征集的优化筛选,进而能够保证迭代训练得到的成交预测模型具有较高的预测精度,进而能够保证最终推荐结果的准确性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于XGBoost模型的资源推荐方法的流程示意图;
图2示出了本申请实施例提供的另一种基于XGBoost模型的资源推荐方法的流程示意图;
图3示出了本申请实施例提供的一种基于XGBoost模型的资源推荐装置的结构示意图;
图4示出了本申请实施例提供的另一种基于XGBoost模型的资源推荐装置的结构示意图。
具体实施方式
下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
针对目前的问题,本申请实施例提供了一种基于XGBoost模型的资源推荐方法,如图1所示,该方法包括:
101、利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重。
其中,历史询价成交数据包括目标主体在预设历史时间段内的从询价到成交全过程的数据,包括询价数据、报价数据、下单数据、发货数据、确认收货数据、申请售后数据等。
需要说明的是,对于本申请,可应用于任何交易平台内对资源需求方进行资源供应方和/或交易资源的推荐。其中,资源需求方对应于本申请中的目标主体,资源供应方对应于本申请中的资源主体,即资源主体可在交易平台上为目标主体提供交易资源,目标主体可通过在交易平台内上传资源需求,由交易平台进行相关内容的筛选,并将筛选内容推送至目标主体所在客户端进行展示以供目标主体进行下单资源选取。然而鉴于匹配的资源主体以及实时资源的数据量较大,故容易导致目标主体需要花费大量的时间进行资源的选取。对此,在本申请中,交易平台在向目标主体所在客户端推送资源之前,预先根据目标主体的历史询价数据训练得到成交预测模型,并根据成交预测模型对目标主体生成数据量较小,且更能符合目标主体对应资源需求的下单资源推荐,以便目标主体根据下单资源推荐能够较为精准、快速的进行资源的筛选,提高目标主体的客户体验,并保证交易平台本身的成交率。本申请中的技术方案可适用于任何交易场景,在本申请中的下述实施例步骤中,以交易平台为汽车修理交易平台,目标主体为修理厂,资源主体为为修理厂提供配件资源的配件商为例,对本申请中的技术方案进行说明,但不构成对本申请中技术方案应用场景的限定。
在汽车修理平台中,可包括修理厂这一目标主体与配件商这一资源主体,修理厂在平台上发布一笔车配件询价单,包含多个配件,每个配件有多种品质可以选择,平台将询价单推送给多个配件商,配件商报价后,平台从多个报价单中选择与修理厂匹配的进行推荐,帮助修理厂省去比较筛选的过程。在具体的应用场景中,在获取到修理厂的历史询价成交数据后,可将历史询价成交数据按照预设特征项进行分类,构建包括各个预设特征项的第一特征集,其中预设特征项可包括:修理厂偏好车品牌、修理厂偏好品质等级、修理厂偏好价格区间、配件商偏好车品牌、配件商偏好品质等级、配件商偏好价格区间、修理厂和配件商历史成交次数、修理厂和配件商历史成交金额、修理厂和配件商最近一次成交时间、修理厂历史申请售后次数、修理厂历史申请售后金额、修理厂最近一次申请售后时间、修理厂询价车信息、修理厂询价配件品质、修理厂询价配件个数、修理厂询价时间、修理厂历史询价成交转化率、报价配件商个数、配件商报价价格分布、配件商报无货的配件数量、配件商报价时长、配件商报价品质与修理厂询价品质是否一致。
进一步的,可利用第一特征集构建初始XGBoost模型,以利用初始XGBoost模型确定第一特征集中各个预设特征项的特征重要权重。其中XGBoost模型是一种提升树模型,是对梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的优化,XGBoost模型的思想为以每一棵树的节点预测值与节点真实值之差作为该棵树分裂生成的残差,以上一棵树分裂生成的残差为样本,拟合下一棵回归树,通过累加所有提升树的结果作为最终结果。训练的过程是通过降低偏差来不断提高最终预测的精度,模型目标函数由损失函数和正则项两部分组成,表达式为:
Figure BDA0003476273670000051
表达式中,obj表示目标函数,l表示损失函数,yi是真实值,ft(xi)是第t棵树的预测结果,
Figure BDA0003476273670000052
是模型当前预测的结果,所以
Figure BDA0003476273670000053
就是t次迭代输出的最终结果,Ω(ft)是惩罚模型的复杂度。
在利用第一特征集训练XGBoost模型时,可设定初始模型参数,将第一特征集的各个特征项对应的特征数据输入XGBoost模型,不断的添加树,不断的进行特征分裂来生长一棵树,每次添加一棵树,就是学习一个新的函数,去拟合上一次预测的残差,直到生长成的树满足初始模型参数要求,得到训练好的XGBoost模型。假定训练完成最终得到了k棵树,要预测一个样本的分数,则根据这个样本的特征,在每棵树中落到对应的一个叶子节点,每个叶子节点对应一个分数,最后将每棵树对应的分数加起来就是该样本的预测值。其中初始模型参数包括:学习速率、树的最大深度、节点分裂所需的最小损失函数下降值、迭代次数、L2正则λ参数、线程数、收缩步长等。
在利用初始XGBoost模型确定第一特征集中各个预设特征项的特征重要权重时,可统计经过第一特征集训练后的XGBoost模型的每个预设特征项作为子节点出现的次数,出现的次数越多,代表该预设特征项的特征重要权重越大,输出各个预设特征项的特征重要权重,例如预设特征项名称为配件商报无货的配件数量的特征重要权重为0.259016,配件商报价品质与修理厂询价品质是否一致的特征重要权重为0.10256。特征重要权重用于评估第一特征集中的各个预设特征项对预测结果的影响程度。
102、在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种。
其中,特征评估指标可包括:相关系数评估指标、信息值评估指标,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种。
对于本实施,可将对预测结果影响小,即特征重要权重小于预设权重阈值的预设特征项从第一特征集中删除,还可将对应相关系数评估指标、信息值评估指标小于第一预设指标阈值的预设特征项从第一特征集中删除,以得到数据饱和度较高的第二特征集。由第一特征集得到的第二特征集可包括:第一特征集中剔除对应特征重要权重小于预设权重阈值的预设特征项得到第二特征集、剔除特征评估指标小于第一预设指标阈值的预设特征项得到第二特征集、剔除对应特征重要权重小于预设权重阈值且特征评估指标小于第一预设指标阈值的预设特征项得到第二特征集。
作为另一种实施方式,特征评估指标还可包括:方差评估指标,第一预设指标阈值还包括最小方差阈值、最大方差阈值。由第一特征集得到第二特征集包括:第一特征集中剔除对应特征重要权重小于预设权重阈值的预设特征项得到第二特征集,剔除特征评估指标小于最小方差阈值或特征评估指标大于最大方差阈值的预设特征项得到第二特征集。
其中,方差阈值的设定要根据各个预设特征项的业务含义,选择合理取值范围,每个预设特征项包含大量特征数据,计算每个预设特征项的方差,使用方差阈值保证每个预设特征项的特征数据都在一定的波动范围内,没有极端偏离值。相关系数为特征与分类标签之间的相关性,预设特征项与分类标签的相关性越强,说明预设特征项与分类标签的关联性越大,说明预设特征项对分类结果越重要,选出对分类结果影响大的预设特征项有利于提高预测结果的准确度。数据信息值(Information Value,IV)的大小表示预设特征项预测能力的强弱,信息值越大,预设特征项预测能力越强,一般来说,当数据信息值小于0.02,认为特征没有预测力,当数据信息值大于等于0.02小于0.1时,认为特征预测能力低,当数据信息值大于等于0.1小于0.3时,认为特征预测能力中,当数据信息值大于等于0.3小于0.5时,认为特征预测能力高,当数据信息值大于等于0.5时,认为特征预测能力极高。
103、利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种。
对于本实施例,利用第二特征集训练XGBoost模型,判断经过第二特征集训练后的XGBoost模型的模型评估指标是否大于第二预设指标阈值,如果大于第二预设指标阈值,则将XGBoost模型确定为成交预测模型,如果小于等于第二预设指标阈值,此时可以通过网格搜索的方式将设定的初始模型参数优化,再利用第二特征集训练经过参数优化后的XGBoost模型,并确定为成交预测模型,用于输出成交概率预测结果。
其中,模型评估指标可包括:AUC(Area Under Curve)值、KS(kolmogorov-Smirnov)、准确率。AUC(Area Under Curve)值是接收者操作特征(Receiver OperatorCharacteristic,ROC)曲线下方的面积大小,AUC越大,模型判断准确性越高。KS(kolmogorov-Smirnov)用于评估模型的区分度,KS值越大,模型预测准确性越高。准确率为模型预测正确的占总的比例,准确率的值越大,模型判断准确性越高。
对设定的初始模型参数进行优化的网格搜索法具体包括:设置搜索网格:生成回归树数目由1到最大值a,回归树最大深度由1到最大值b,遍历所有生成回归树数目和回归树最大深度的参数组合,例如生成回归树数目为1、回归树最大深度为1的参数组合,生成回归树数目为1、回归树最大深度为2的参数组合…生成回归树数目为1、回归树最大深度为b的参数组合,生成回归树数目为2、回归树最大深度为1的参数组合,生成回归树数目为2、回归树最大深度为2的参数组合…生成回归树数目为2、回归树最大深度为b的参数组合,…生成回归树数目为a、回归树最大深度为b的参数组合,计算每个参数组合下的第二特征集上的预测值,当计算得到的预测值与真实值之间的误差最小时,对应的参数组合为最优参数组合包括最优生成回归树数目以及最优回归树最大深度,此时将初始模型参数设置为最优模型参数。
104、接收各个资源主体的实时资源数据,并将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率。
其中,各个资源主体的实时资源数据包括:对目标主体的询价单产生的报价,成交预测模型是最优的XGBoost模型,相对于初始XGBoost模型具有较高的预测准确性。
对于本实施例,可利用接收到的各个资源主体的实时资源数据构建第一特征集,将第一特征集输入到XGBoost模型中,得到训练后的XGBoost模型输出的特征重要权重,作为一种实施方式,在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种。将第二特征集输入到成交预测模型中,输出各个资源主体与目标主体的成交预测概率,其中,成交预测概率为目标主体选择与各个资源主体成交的可能性。例如,若资源主体1的成交预测概率为0.1038,资源主体2的成交预测概率为0.1149,资源主体3的成交预测概率为0.4638,资源主体4的成交预测概率为0.2056,相对于资源主体1、2、4,资源主体3具有较高的成交可能性。
105、根据成交预测概率为目标主体生成下单资源推荐。
对于本实施例,在生成下单资源推荐时,可生成资源推荐列表,在资源推荐列表将资源主体/资源主体的资源数据按照成交预测概率由大到小依次排列。或还可优先向目标主体推送成交预测概率最大的资源主体/资源主体。
上述一种基于XGBoost模型的资源推荐方法,可首先利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重;在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;进一步利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;在接收到各个资源主体的实时资源数据后,将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率;最终根据成交预测概率为目标主体生成下单资源推荐。通过本申请中的技术方案,针对待推送资源的目标主体,可预先利用成交预测模型对多个资源主体的实时资源数据进行成交预测概率计算,以从多个实时资源数据中选择与目标主体匹配的进行推荐,缩短目标主体对资源数据的筛选时长,从而提升客户体验,促进成交率。此外,在进行成交预测模型的训练时,可通过不断特征集的优化筛选,进而能够保证迭代训练得到的成交预测模型具有较高的预测精度,进而能够保证最终推荐结果的准确性。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了另一种基于XGBoost模型的资源推荐方法,如图2所示,该方法包括:
201、获取目标主体在预设历史时间段内产生的历史询价数据,在历史询价数据中提取与预设特征项匹配的第一特征数据。
对于本实施例,可在预先建立的数据库中提取目标主体在预设历史时间段内产生的历史询价数据,将目标主体从询价到下单或者未下单的过程作为一个周期,预设历史时间段包括至少一个上述周期,目标主体在平台上发布询价单,平台接收多个资源主体的报价单。在历史询价数据中提取与预设特征项匹配的第一特征数据,具体可包括:获取预设特征提取模板,预设特征提取模板中存储有预设特征项以及与预设特征项匹配的特征关键词;在历史询价数据中提取与特征关键词对应第一特征相似度大于预设相似度阈值的第一特征数据。
202、对第一特征数据进行预处理,得到第二特征数据,利用第二特征数据构建第一特征集。
其中,预处理包括数据清洗处理、独热编码处理、连续型变量分箱处理中的至少一种。
在具体的应用场景中,第一特征数据在包含有效数据的同时,还可包括大量的噪声数据和不相关数据,故为了保证XGBoost模型构建准确性以及防止XGBoost模型过拟合,需要对第一特征数据进行预处理。使得经过预处理后得到的第二特征数据不存在缺省值和异常值,且能够直接别计算机识别。
其中,数据清洗处理包括缺省值填充、异常值删除,缺省值填充指的是对数据缺失项进行填充,填充数据的方法包括填充平均值,具体为:确定该数据缺失项的第一特征,计算该第一特征下数据的平均值,将该平均值作为填充值。异常值指的是历史询价数据与实际情况相违背的数据,或者在系统故障下采集到的数据,对于异常值数据进行删除处理。此外,对于一些不能直接被计算机识别的历史询价数据,可进行独热编码(one-hot)处理,其目的在于使得历史询价数据能够被计算机识别,用于XGBoost模型的构建,例如在第一特征数据中的一个特征:配件商报价品质与修理厂询价品质是否一致描述为是或者否时,将是赋1,将否赋0;连续型变量分箱处理是将连续型变量离散化,防止输入XGBoost模型的数据巨大而出现过拟合的问题,例如价格的范围在0-20000之间,将0-200划分区间并赋值,比如0-100用1表示,100-500用2表示,将较大范围的数据离散化后输入到XGBoost模型中会使得模型更加稳定。
203、利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重。
对于本实施例,在利用由历史询价数据构建的第一特征集训练XGBoost模型时,实施例步骤具体可以包括:根据历史询价数据提取第一特征集中各个预设特征项对应的询价成交结果;将第一特征集确定为XGBoost模型的输入特征,将询价成交结果确定为XGBoost模型的训练标签,训练XGBoost模型,直至XGBoost模型的损失函数小于预设阈值,判定XGBoost模型训练完成。
其中,XGBoost模型属于有监督学习,有监督学习是基于训练集中的样本特征和分类结果训练机器学习模型,使得模型具有对训练集外样本分类进行预测的能力。对历史询价成交数据所代表的成交结果进行标签化,分为最终成交与最终未成交,例如,特征项:修理厂最近一次申请售后时间的标签为最终成交,特征项:配件商报无货的配件数量的标签为最终未成交。构建XGBoost模型,将标签化后的第一特征集输入XGBoost模型中进行训练,直至XGBoost模型的损失函数小于预设阈值,判定此时XGBoost模型训练完成。
在利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重时,可统计经过第一特征集训练后的XGBoost模型的每个预设特征项作为子节点出现的次数,出现的次数越多,代表该预设特征项的特征重要权重越大,输出各个预设特征项的特征重要权重,例如预设特征项名称为配件商报无货的配件数量的特征重要权重为0.259016,配件商报价品质与修理厂询价品质是否一致的特征重要权重为0.10256。特征重要权重用于评估第一特征集中的各个预设特征项对预测结果的影响程度。将对预测结果影响小的预设特征项从第一特征集中删除后再训练XGBoost模型可以提高XGBoost模型的预测准确性。
204、在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种。
对于本实施例,作为一种实施方式,在实施例步骤203确定各个预设特征项的特征重要权重后,可在第一特征集中剔除对应特征重要权重小于预设权重阈值的预设特征项,得到第三特征集,判断第三特征集中是否存在小于第一预设指标阈值的预设特征项,如果存在,那么根据第三特征集训练初始XGBoost模型,确定由第三特征集训练后的XGBoost模型的特征重要权重,重新设定特征重要权重阈值,以从第三特征集中提取预设数量个构成第四特征集,判断第四特征集中是否存在小于第一预设指标阈值的预设特征项,直到得到预设特征项的特征评估指标全部大于或者等于第一预设指标阈值的第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种。
对于本实施例,作为一种实施方式,第一预设指标阈值还包括最小方差阈值、最大方差阈值,在实施例步骤203确定各个预设特征项的特征重要权重后,在第一特征集中剔除对应特征重要权重小于预设权重阈值的预设特征项,得到第三特征集,判断第三特征集中是否存在小于最小方差阈值的预设特征项或者大于最大方差阈值的预设特征项,如果存在,那么根据第三特征集训练初始XGBoost模型,确定由第三特征集训练后的XGBoost模型的特征重要权重,重新设定特征重要权重阈值,以从第三特征集中提取预设数量个构成第四特征集,判断第四特征集中是否存在小于最小方差阈值的预设特征项或者大于最大方差阈值的预设特征项,直到得到预设特征项的特征评估指标全部大于最小方差阈值且全部小于最大方差阈值的第二特征集。
205a、利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种。
206a、接收各个资源主体的实时资源数据,并将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率。
具体实施过程可参照实施例步骤104中的相关描述,在此不再赘述。
207a、根据成交预测概率为目标主体生成下单资源推荐。
对于本实施例,实施例步骤具体可以包括:按照成交预测概率由大到小的顺序,生成各个资源主体对应实时资源数据的排序列表;将排序列表作为第一推荐资源发送给目标主体;和/或,将对应成交预测概率最大的实时资源数据作为第二推荐资源发送给目标主体。
具体的,作为一种可选方式,各个资源主体对应实时资源数据的排序列表可包括资源主体以及其对应的各个预设特征项的特征数据,按照各个资源主体的成交预测概率生成各个资源主体的排序,并按照由大到小的排序将对应的实时资源数据的排序列表作为第一推荐资源发送至目标主体所在客户端。作为另一种可选方式,还可经过筛选,确定对应成交预测概率最大的资源主体,将该资源主体的实时资源数据作为第二推荐资源展示在目标主体的下单页面上。作为又一种可选方式,还可按照由大到小的排序将对应的实时资源数据的排序列表作为第一推荐资源依次展示在目标主体的下单页面上。同时将成交预测概率最大的资源主体的实时资源数据作为第二推荐资源优先展示在目标主体的下单页面上。优先的方式可以包括加大字体,加重颜色,打上推荐标识等。
与实施例步骤205a并列的实施例步骤205b、根据第二特征集生成目标主体的用户画像。
其中,用户画像是对现实世界中用户的建模,指根据用户的属性、偏好、行为等信息,抽象出来的标签化用户模型,即给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识,通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以方便计算机处理。可以将第二特征集中的用户注册信息如注册时间、活跃度作为第一画像标签,将用户对应的下单次数、下单后成交次数、偏好品质等级等作为第二特征标签,进而依据所有的第一画像标签和所有的第二画像标签即可构建生成画像标签集,在画像标签集中各个第一画像标签和第二画像标签作为一个独立的用户画像。
206b、利用用户画像为目标主体生成下单资源推荐。
对于本实施例,实施例步骤具体可以包括:利用预设特征距离计算公式,计算各个资源主体对应实时资源数据与用户画像中至少一画像标签的第二特征相似度;将对应第二特征相似度最大的实时资源数据作为第三推荐资源发送给目标主体。
其中,预设特征距离计算公式可为任何适用于度量的距离函数公式,如可包括欧几里得距离公式(Euclidean Distance)、曼哈顿距离公式(Manhattan Distance)、杰卡德距离公式(Jaccard Distance)、马氏距离公式(Mahalanobis distance)等,具体可根据实际应用场景进行选择,在此不进行具体的限定。
本实施例公开的一种基于XGBoost模型的资源推荐方法,可首先利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重;在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;进一步利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;在接收到各个资源主体的实时资源数据后,可将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率;最终根据成交预测概率为目标主体生成下单资源推荐。通过本申请中的技术方案,针对待推送资源的目标主体,可预先利用成交预测模型对多个资源主体的实时资源数据进行成交预测概率计算,以从多个实时资源数据中选择与目标主体匹配的进行推荐,缩短目标主体对资源数据的筛选时长,从而提升客户体验,促进成交率。此外,在进行成交预测模型的训练时,可通过不断特征集的优化筛选,进而能够保证迭代训练得到的成交预测模型具有较高的预测精度,进而能够保证最终推荐结果的准确性。
进一步的,作为图1和图2所示方法的具体实现,本申请实施例提供了一种基于XGBoost模型的资源推荐装置,如图3所示,该装置包括:训练模块31、剔除模块32、确定模块33、输入模块34、生成模块35;
训练模块31,可用于利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重;
剔除模块32,可用于在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;
确定模块33,可用于利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;
输入模块34,可用于接收各个资源主体的实时资源数据,并将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率;
生成模块35,可用于根据成交预测概率为目标主体生成下单资源推荐。
在具体的应用场景中,一种基于XGBoost模型的资源推荐装置,如图4所示,该装置还包括:构建模块36,具体可包括:获取单元361、第一提取单元362、预处理单元363、构建单元364;
获取单元361,可用于获取目标主体在预设历史时间段内产生的历史询价数据;
第一提取单元362,可用于在历史询价数据中提取与预设特征项匹配的第一特征数据;
预处理单元363,可用于对第一特征数据进行预处理,得到第二特征数据,其中,预处理包括数据清洗处理、独热编码处理、连续型变量分箱处理中的至少一种;
构建单元364,可用于利用第二特征数据构建第一特征集。
相应的,为了提取第一特征数据,提取单元362,具体可用于获取预设特征提取模板,预设特征提取模板中存储有预设特征项以及与预设特征项匹配的特征关键词;在历史询价数据中提取与特征关键词对应第一特征相似度大于预设相似度阈值的第一特征数据。
在具体的应用场景中,利用由历史询价数据构建的第一特征集训练XGBoost模型,如图4所示,训练模块31,具体可包括:第二提取单元311、训练单元312;
第二提取单元311,可用于根据历史询价数据提取第一特征集中各个预设特征项对应的询价成交结果;
训练单元312,可用于将第一特征集确定为XGBoost模型的输入特征,将询价成交结果确定为XGBoost模型的训练标签,训练XGBoost模型,直至XGBoost模型的损失函数小于预设阈值,判定XGBoost模型训练完成。
在具体的应用场景中,根据成交预测概率为目标主体生成下单资源推荐,如图4所示,生成模块35,具体可包括:第一生成单元351、第一发送单元352、第二发送单元353;
第一生成单元351,可用于按照成交预测概率由大到小的顺序,生成各个资源主体对应实时资源数据的排序列表;
第一发送单元352,可用于将排序列表作为第一推荐资源发送给目标主体;和/或,
第二发送单元353,可用于将对应成交预测概率最大的实时资源数据作为第二推荐资源发送给目标主体。
在具体的应用场景中,一种基于XGBoost模型的资源推荐装置,如图4所示,该装置还包括:生成模块37,具体可包括:第二生成单元371、第一第三生成单元372;
第二生成单元371,可用于根据第二特征集生成目标主体的用户画像;
第三生成单元372,可用于利用用户画像为目标主体生成下单资源推荐。
相应的,为了利用用户画像为目标主体生成下单资源推荐,第三生成单元372,具体可用于利用预设特征距离计算公式,计算各个资源主体对应实时资源数据与用户画像中至少一画像标签的第二特征相似度;将对应第二特征相似度最大的实时资源数据作为第三推荐资源发送给目标主体。
需要说明的是,本实施例提供的一种基于XGBoost模型的资源推荐装置所涉及各功能单元的其他相应描述,可以参考图1至图2的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本实施例还提供了一种存储介质,存储介质具体可为易失性或非易失性,其上存储有计算机可读指令,该可读指令被处理器执行时实现上述如图1至图2所示的基于XGBoost模型的资源推荐方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1至图2所示的方法和图3、图4所示的虚拟装置实施例,为了实现上述目的,本实施例还提供了一种计算机设备,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的基于XGBoost模型的资源推荐方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。
通过应用本申请的技术方案,与目前现有技术相比,本申请可首先利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的XGBoost模型确定第一特征集中各个预设特征项的特征重要权重;在第一特征集中剔除对应特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;进一步利用第二特征集迭代训练XGBoost模型,直至XGBoost模型的模型评估指标大于第二预设指标阈值,将XGBoost模型确定为成交预测模型,其中,第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;在接收到各个资源主体的实时资源数据后,可将实时资源数据输入成交预测模型,确定各个实时资源数据的成交预测概率;最终根据成交预测概率为目标主体生成下单资源推荐。通过本申请中的技术方案,针对待推送资源的目标主体,可预先利用成交预测模型对多个资源主体的实时资源数据进行成交预测概率计算,以从多个实时资源数据中选择与目标主体匹配的进行推荐,缩短目标主体对资源数据的筛选时长,从而提升客户体验,促进成交率。此外,在进行成交预测模型的训练时,可通过不断特征集的优化筛选,进而能够保证迭代训练得到的成交预测模型具有较高的预测精度,进而能够保证最终推荐结果的准确性。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种基于XGBoost模型的资源推荐方法,其特征在于,包括:
利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的所述XGBoost模型确定所述第一特征集中各个预设特征项的特征重要权重;
在所述第一特征集中剔除对应所述特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,所述第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;
利用所述第二特征集迭代训练所述XGBoost模型,直至所述XGBoost模型的模型评估指标大于第二预设指标阈值,将所述XGBoost模型确定为成交预测模型,其中,所述第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;
接收各个资源主体的实时资源数据,并将所述实时资源数据输入所述成交预测模型,确定各个所述实时资源数据的成交预测概率;
根据所述成交预测概率为所述目标主体生成下单资源推荐。
2.根据权利要求1所述的方法,其特征在于,在所述利用由历史询价数据构建的第一特征集训练XGBoost模型之前,还包括:
获取目标主体在预设历史时间段内产生的历史询价数据;
在所述历史询价数据中提取与预设特征项匹配的第一特征数据;
对所述第一特征数据进行预处理,得到第二特征数据,其中,所述预处理包括数据清洗处理、独热编码处理、连续型变量分箱处理中的至少一种;
利用所述第二特征数据构建第一特征集。
3.根据权利要求2所述的方法,其特征在于,所述在所述历史询价结果数据中提取与预设特征项匹配的第一特征数据,包括:
获取预设特征提取模板,所述预设特征提取模板中存储有预设特征项以及与所述预设特征项匹配的特征关键词;
在所述历史询价数据中提取与所述特征关键词对应第一特征相似度大于预设相似度阈值的第一特征数据。
4.根据权利要求1所述的方法,其特征在于,所述利用由历史询价数据构建的第一特征集训练XGBoost模型,包括:
根据所述历史询价数据提取所述第一特征集中各个预设特征项对应的询价成交结果;
将所述第一特征集确定为所述XGBoost模型的输入特征,将所述询价成交结果确定为所述XGBoost模型的训练标签,训练所述XGBoost模型,直至所述XGBoost模型的损失函数小于预设阈值,判定所述XGBoost模型训练完成。
5.根据权利要求1所述的方法,其特征在于,根据所述成交预测概率为所述目标主体生成下单资源推荐,包括:
按照所述成交预测概率由大到小的顺序,生成各个所述资源主体对应实时资源数据的排序列表;
将所述排序列表作为第一推荐资源发送给所述目标主体;和/或,
将对应所述成交预测概率最大的实时资源数据作为第二推荐资源发送给所述目标主体。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述第二特征集生成所述目标主体的用户画像;
利用所述用户画像为所述目标主体生成下单资源推荐。
7.根据权利要求6所述的方法,其特征在于,所述利用所述用户画像为所述目标主体生成下单资源推荐,包括:
利用预设特征距离计算公式,计算各个资源主体对应实时资源数据与所述用户画像中至少一画像标签的第二特征相似度;
将对应所述第二特征相似度最大的实时资源数据作为第三推荐资源发送给所述目标主体。
8.一种基于XGBoost模型的资源推荐装置,其特征在于,包括:
训练模块,用于利用由历史询价数据构建的第一特征集训练XGBoost模型,并利用训练完成的所述XGBoost模型确定所述第一特征集中各个预设特征项的特征重要权重;
剔除模块,用于在所述第一特征集中剔除对应所述特征重要权重小于预设权重阈值和/或特征评估指标小于第一预设指标阈值的预设特征项,得到第二特征集,其中,所述第一预设指标阈值包括相关系数阈值、信息值阈值中的至少一种;
确定模块,用于利用所述第二特征集迭代训练所述XGBoost模型,直至所述XGBoost模型的模型评估指标大于第二预设指标阈值,将所述XGBoost模型确定为成交预测模型,其中,所述第二预设指标阈值包括预设AUC阈值、预设KS阈值、预设准确率阈值中的至少一种;
输入模块,用于接收各个资源主体的实时资源数据,并将所述实时资源数据输入所述成交预测模型,确定各个所述实时资源数据的成交预测概率;
生成模块,用于根据所述成交预测概率为所述目标主体生成下单资源推荐。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的基于XGBoost模型的资源推荐方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的基于XGBoost模型的资源推荐方法。
CN202210056071.8A 2022-01-18 2022-01-18 基于XGBoost模型的资源推荐方法、装置及设备 Pending CN114418685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210056071.8A CN114418685A (zh) 2022-01-18 2022-01-18 基于XGBoost模型的资源推荐方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210056071.8A CN114418685A (zh) 2022-01-18 2022-01-18 基于XGBoost模型的资源推荐方法、装置及设备

Publications (1)

Publication Number Publication Date
CN114418685A true CN114418685A (zh) 2022-04-29

Family

ID=81272912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210056071.8A Pending CN114418685A (zh) 2022-01-18 2022-01-18 基于XGBoost模型的资源推荐方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114418685A (zh)

Similar Documents

Publication Publication Date Title
Tietje Identification of a small reliable and efficient set of consistent scenarios
JP7043786B2 (ja) 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
CN108320171A (zh) 热销商品预测方法、系统及装置
US20230306449A1 (en) Pre-processing financial market data prior to machine learning training
CN109711424B (zh) 一种基于决策树的行为规则获取方法、装置及设备
CN113742492B (zh) 保险方案生成方法、装置、电子设备及存储介质
CN112148973B (zh) 一种信息推送的数据处理方法及装置
CN110322093B (zh) 信息处理方法、信息显示方法、装置及计算设备
CN110956303A (zh) 信息预测方法、装置、终端及可读存储介质
CN113469730A (zh) 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN108846695A (zh) 终端更换周期的预测方法及装置
CN112070333A (zh) 计划制定辅助装置和计划制定辅助方法
CN114139065A (zh) 基于大数据的人才筛选推荐方法、系统及可读存储介质
CN112989053A (zh) 一种期刊推荐方法及装置
CN116452212B (zh) 一种智能客服商品知识库信息管理方法及系统
CN116663909A (zh) 供应商风险识别数据处理方法及装置
CN114418685A (zh) 基于XGBoost模型的资源推荐方法、装置及设备
CN115809891A (zh) 基于替代和关联作用的多品类联合需求预测方法及装置
CN110895781A (zh) 菜品类别推荐方法、装置、电子设备及存储介质
CN115293867A (zh) 财务报销用户画像优化方法、装置、设备及存储介质
CN111768139B (zh) 备货处理方法、装置、设备及存储介质
CN113407827A (zh) 基于用户价值分类的信息推荐方法、装置、设备及介质
CN113539457A (zh) 医疗资源的推荐方法及装置、电子设备、存储介质
CN113762415A (zh) 一种基于神经网络的汽车金融产品智能匹配方法和系统
CN113191570A (zh) 基于深度学习的资金规划推荐方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination