CN112559900A - 产品推荐方法、装置、计算机设备和存储介质 - Google Patents
产品推荐方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112559900A CN112559900A CN202110216223.1A CN202110216223A CN112559900A CN 112559900 A CN112559900 A CN 112559900A CN 202110216223 A CN202110216223 A CN 202110216223A CN 112559900 A CN112559900 A CN 112559900A
- Authority
- CN
- China
- Prior art keywords
- decision tree
- rule
- rules
- importance
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003066 decision tree Methods 0.000 claims abstract description 311
- 238000011156 evaluation Methods 0.000 claims abstract description 43
- 238000012216 screening Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims description 57
- 238000012417 linear regression Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000010187 selection method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 241001134453 Lista Species 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种产品推荐方法、装置、计算机设备和存储介质。所述方法包括:根据预先训练好的的决策树模型获取不少于一条决策树规则;对所述决策树规则进行重要性评估,获取所述决策树规则对应的重要程度值;根据所述重要程度值,筛选出推荐规则;根据所述推荐规则向用户推荐产品。采用本方法能够提高对用户推荐产品的效果。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种产品推荐方法、装置、计算机设备和存储介质。
背景技术
随着经济的发展和科技的进步,人们的理财意识逐渐增强,越来越多的人将闲置资金投入到金融理财产品中。银行、基金公司等金融机构,为了向用户推销自己的理财产品,常常重点选择购买理财产品意愿较强的用户进行定向推荐,以提高产品推荐的效果。
为了能更好地了解用户的购买意愿,金融机构常常根据其所掌握的用户信息对用户进行评估,对评估出的购买理财产品意愿较强的用户进行理财产品的推荐。但是,目前金融机构在对用户进行推荐时,所使用的用户评估模型常常是基于逻辑回归算法生成的,逻辑回归算法有简单的模型内部结构,容易让使用者理解模型的预测思想,但是却存在着识别精度低的缺陷,并导致了产品推荐的准确度较低的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高产品推荐准确度的方法、装置、计算机设备和存储介质。
一种产品推荐方法,所述方法包括:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
在其中一个实施例中,还包括:获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;
根据所述训练集训练生成决策树模型。
在其中一个实施例中,还包括:提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;
根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
在其中一个实施例中,还包括:根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;
分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;
根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
在其中一个实施例中,还包括:将各决策树规则依据重要程度值从高到低进行排列;
将重要程度值排在前预设数值位的决策树规则作为推荐规则。
在其中一个实施例中,还包括:分别将各决策树规则的评估因子和所述线性回归模型中各决策树规则项的拟合参数代入至重要程度值计算公式,获取各决策树规则的重要程度值;
所述重要程度值计算公式为:
在其中一个实施例中,还包括:筛选出特征信息满足所述推荐规则的用户作为目标用户;
向所述目标用户的用户终端推送产品信息。
一种产品推荐装置,所述装置包括:
第一获取模块,用于根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
第二获取模块,用于对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
筛选模块,用于根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
推荐模块,用于根据所述推荐规则向终端推送产品信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
上述产品推荐方法、装置、计算机设备和存储介质,对决策树规则进行重要性评估,获取决策树规则对应的重要程度值;并根据决策树规则的重要程度值,从决策树规则中筛选出推荐规则,最后根据推荐规则向用户推荐产品。通过将决策树规则与重要程度值结合起来,获取重要程度值靠前的决策树规则作为推荐规则,并根据推荐规则向用户推荐产品,提高了对用户推荐产品的准确度。
附图说明
图1为一个实施例中产品推荐方法的应用环境图;
图2为一个实施例中产品推荐方法的流程示意图;
图3为一个实施例中决策树模型的结构示意图;
图4为一个实施例中获取决策树规则对应的重要程度值步骤的流程示意图;
图5为一个实施例中产品推荐装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的产品推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102和服务器104可分别单独用于执行本申请提供的产品推荐方法。终端102和服务器104也可用于协同执行本申请提供的产品推荐方法。例如,服务器104用于根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;根据所述重要程度值,从所述决策树规则中筛选出推荐规则;根据所述推荐规则向终端推送产品信息。
其中,终端102可以但不限于是包括获取和保存用户特征信息的数据保存装置,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种产品推荐方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的。
其中,决策树模型是用于根据用户的特征信息对用户进行分类的分类器,决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;样本用户是预设时间范围内被推荐产品的用户。样本用户的特征信息包括不少于一种能够体现样本用户自身特征的信息,例如性别、学历、收入、职业等;其中样本用户的特征信息可以是连续的、离散的或缺失的。样本用户的标签是用于标识样本用户是否使用推荐产品的信息。
具体地,对于从决策树模型中获取决策树规则的具体方法,本实施不作限定,可以通过不同的算法或程序对决策树规则进行提取。提取的决策树规则的数量是不少于一条,可以只提取决策树模型中的一部分决策树规则,也可以将决策树模型中的决策树规则全提取出。
步骤204,对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值。
其中,重要程度值是用于评价决策树规则重要性的指标,衡量决策树规则重要性的指标可以有多种,例如,根据决策树模型获取各分支的期望值,作为重要性指标;或根据决策树模型各分支发生的概率作为决策树规则对应的重要程度值。
具体地,分别对每条决策树规则进行重要性评估,获取每条决策树规则的重要程度值;通常情况下,在同一决策树模型中,决策树规则的重要程度值越高,使用该决策树规则进行预测时结果越准确。
步骤206,根据所述重要程度值,从所述决策树规则中筛选出推荐规则。
其中,推荐规则是根据重要程度值从决策树规则中筛选出的能够准确判定有产品使用意愿的用户的决策树规则。
具体地,不同的决策树规则对应的重要程度值通常是不同的,如何根据重要程度值获取推荐规则,本实施例不作限定。例如,可以通过设定重要程度值阈值的方式,筛选出重要程度值达到阈值的决策树规则作为推荐规则;或是根据决策树规则的重要程度值进行排序,选择重要程度值靠前的决策树规则作为推荐规则。
步骤208,根据所述推荐规则向终端推送产品信息。
具体地,根据推荐规则从用户群体中获取购买产品意愿较强的用户,并向购买产品意愿较强的用户的终端推送产品相关信息,以使得该用户能够有机会购买被推荐的产品。例如,可以根据用户的资料信息提取出用户的特征信息,根据用户的特征信息与推荐规则进行对比,选出购买产品意愿强烈的用户并对该用户进行产品推荐。
上述产品推荐方法中,对决策树规则进行重要性评估,获取决策树规则对应的重要程度值;并根据决策树规则的重要程度值,从决策树规则中筛选出推荐规则,最后根据推荐规则向用户推荐产品。通过将决策树规则与重要程度值结合起来,获取重要程度值靠前的决策树规则作为推荐规则,并根据推荐规则向用户推荐产品,提高了对用户推荐产品的准确度。
在一个实施例中,所述决策树模型通过以下方法获取:
获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;
根据所述训练集训练生成决策树模型。
其中,样本用户是过去预设时间范围内有被推荐过目标理财产品的用户;样本用户的特征信息包括样本用户的年龄,收入,学历,性别等相关信息;样本用户的标签包括样本用户是否购买目标理财产品的信息;如样本用户购买了理财产品,该样本用户的标签为1;该样本用户未购买目标理财产品,该样本用户的标签为0。训练集中包括样本用户的特征信息和样本用户的标签,其中样本用户的特征信息是一个多维向量,每一维代表一个特征信息。
具体地,在根据样本用户的数据信息获取样本用户的特征信息时之前,还包括对样本用户的数据进行清洗和预处理;其中,数据清洗步骤包括:一致性检查,用于清除重复数据和无效数据、探索缺失值的分布情况及检测异常值。数据预处理步骤具体包括:缺失值填充、异常值处理、对离散变量进行编码和对连续变量进行分布转换。其中,缺失值填充,是对离散变量使用众数来填充;对连续变量根据其分布情况进行填充;例如正态分布对应使用均值来填充,偏态分布使用中位数来填充,双峰分布使用众数来填充。
异常值处理分为两类,一类是业务上的异常值,比如原始数据库中用-9999来填充样本中的某特征的缺失值,但是该特征的取值范围是大于0的,因此-9999相当于是异常值。另一类是从特征分布的角度来评估连续变量,根据统计学中的3sigma法则,以95%分位数的标准,将超过这个阈值的数值当做异常值。之后,根据缺失值填充的标准对异常值进行相同的替换。对离散变量进行独热编码,对每一个离散变量,使用N位状态寄存器对其N个状态进行编码,得到N个0-1变量。对连续变量进行分布转换,将非正态分布转换成正态分布。经过上述处理之后,得到数值型变量,对其进行归一化处理。最后,得到s*t的用户数据集,s代表用户的数量,t代表数值型变量的个数。将用户数据集按照预设比例,划分为训练集n*t和测试集k*t。其中,训练集用于训练生成决策树模型;测试集用于对生成的决策树模型进行测试。
在根据训练集训练生成决策树模型时,使用决策树分类模型作为基分类器。例如,
将基分类器的个数设为1,基分类器的深度设为3。训练集表示为 ,其中 ,是第i个用户的特征信息,是一
个维向量;代表对应的第个用户的标签;该数据集中共有个属性特征,表示为 ,可以存储到属性列表中。将训练集D、属性列表和属性选择方法输入基分
类器,获取决策树模型。
具体生成决策树模型的方法如下:
1、构造一个节点N(N是根节点),如果训练数据集D中所有的标签都相同(记为C类):则将节点N作为叶子节点标记为C,并返回节点N。如果属性列表为空,则将节点N作为叶子节点标记为训练集D中标签比例最大的类,并返回节点N。
2、调用属性选择方法,选择最佳分裂准则;将节点N标记为最佳分裂准则。如果分裂属性特征取值是离散的,并且允许决策树进行多叉分裂,从属性列表中减去分裂属性。
3、对分裂属性特征的每一个状态取值j,训练集D中满足j的用户集合记为 。如
果为空,则新建一个叶子节点F,标记为D中标签比例最多的类,并把节点F挂在N下。否
则,递归调用属性选择方法得到子节点,将放到节点N下。最后返回节点N。
其中,属性选择方法目的是选择最好的属性作为分裂属性,使得每个分支里的类别尽可能一致。这里选择信息增益作为属性选择方法。
其中,根据信息增益的获取分裂属性的方法包括:
以为信息,其中,m代表训练数据集D中类别C的个数,代
表训练集中任意一个用户的标签是的概率,计算公式为。以属性R作为分裂属性,训练集D中,R有k个不同
的取值,训练集D根据R的值分成k组,按R进行分裂后,将数据集D中
不同的类分开还需要的信息量为。最后得到关于属性R的信息
增益为。在属性列表中选择信息增益最大的特征作为当前的
分裂属性。
本实施例中,获取样本用户的特征信息和样本用户的标签,作为训练集。并根据训练集训练生成决策树模型,为进一步根据决策树模型获取决策树规则创造了前提条件,以使得能够根据决策树规则获取推荐规则对用户进行商品推荐,提高了对用户推荐产品的准确度。
在一个实施例中,所述根据预先训练好的的决策树模型获取不少于一条决策树规则包括:
提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;
根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
具体地,决策树模型训练完成后需要提取所有的支路;在决策树模型中,支路是从根节点到非根节点之间的路径,一条支路中至少包含两个节点,即跟节点和叶子节点,还可能包含不少于一个中间节点。在决策树模型中,从根节点到任一非根节点的一条路径可以被当成一条决策树规则,每条支路生成的决策树规则是由该支路中每两个相邻节点的规则通过乘积运算生成的。
如图3所示,为一棵决策树模型。图3中,0,1,2…8代表节点的编号,该决策树有9个
节点。0代表根节点,1,2,4都属于内节点,叶子节点包括3,5,6,7,8。该决策树中所有的规则
如表1所示,将这8条规则分别记为:。
表1
在本实施例中,根据决策树模型提取出决策树规则,通过提取不同的决策树规则,为进一步对所有的决策树规则作筛选创造了前提条件。
在一个实施例中,所述对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值包括:
步骤402,根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;
具体地,对于根据决策树规则拟合生成线性回归模型的具体方法,本实施例不作具体限定。例如,可以通过多项式拟合或最小二乘法进行拟合。拟合生成的参数包括常数项参数和各决策树规则项对应的拟合参数。
步骤404,分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;
具体地,决策树规则的评估因子越高,说明在样本用户中满足该决策树规则的样本用户数量占总样本用户的比值越高;同时也象征该决策树规则筛选用户越准确。
步骤406,根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
具体地,根据所述决策树规则拟合生成线性回归模型;其中,拟合后的线性回归模
型为:;是常数项参数,是各决策树规则项的拟合参数,是
第k项决策树规则。评估因子是训练集中满足各决策树规则的样本用户数量占样本用户总
量的比值。
本实施例中,根据决策树规则拟合生成线性回归模型,分别获取线性回归模型中各决策树规则项的拟合参数;并分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;最后根据各决策树规则项的拟合参数和评估因子获取各决策树规则的重要程度值,提高了用于对用户进行推荐的决策树规则的准确度。
在一个实施例中,所述根据所述重要程度值,从所述决策树规则中筛选出推荐规则包括:
将各决策树规则依据重要程度值从高到低进行排列;
将重要程度值排在前预设数值位的决策树规则作为推荐规则。
具体地,在获取各决策树规则的重要程度值以后,将各决策树规则按照重要程度值的高低进行排序,取排在前预设数值位的决策树规则作为推荐规则。
本实施例中,通过按照重要程度值对决策树规则的重要性进行排序,筛选出重要程度值较高的决策树规则作为推荐规则,能够筛除对用户推荐时精度较低的决策树规则,提高了对用户推荐的精确度。
在一个实施例中,所述根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值包括:
分别将各决策树规则的评估因子和所述线性回归模型中各决策树规则项的拟合参数代入至重要程度值计算公式,获取各决策树规则的重要程度值;
所述重要程度值计算公式为:
本实施例中,通过根据决策树规则项的拟合参数和决策树规则的评估因子生成决策树规则的重要程度值计算公式,以使得能够根据重要程度值计算公式对决策树规则进行评估,有利于在产品推荐时选择准确度更高的决策树规则。
在一个实施例中,所述根据所述推荐规则向用户推荐产品包括:
筛选出特征信息满足所述推荐规则的用户作为目标用户;
向所述目标用户的用户终端推送产品信息。
具体地,根据用户的特征信息以及推荐规则,筛选出符合推荐规则的用户作为目标用户。进一步向目标用户定向推荐产品即可完成对产品的推荐,在向用户进行推荐时,向用户的用户终端推送产品信息,以使得用户能够通过被推送的产品信息购买被推荐的产品。由于目标用户均是满足推荐规则的用户,因此向目标用户进行推荐时的推荐成功率与直接向所有用户进行推荐相比,会大大提升。
本实施例中,根据推荐规则向用户的终端推送产品信息,使得用户能够根据被推送的产品信息购买被推送的产品,由于目标用户均是满足推荐规则的用户,提高了对用户推荐产品的成功率。
应该理解的是,虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种产品推荐装置,包括:第一获取模块501、第二获取模块502、筛选模块503和推荐模块504,其中:
第一获取模块501,用于根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
第二获取模块502,用于对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
筛选模块503,用于根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
推荐模块504,用于根据所述推荐规则向终端推送产品信息。
在一个实施例中,第一获取模块501,还用于获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;根据所述训练集训练生成决策树模型。
在一个实施例中,第一获取模块501,还用于提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
在一个实施例中,第二获取模块502,还用于根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
在一个实施例中,筛选模块503,还用于将各决策树规则依据重要程度值从高到低进行排列;将重要程度值排在前预设数值位的决策树规则作为推荐规则。
在一个实施例中,第二获取模块502,还用于分别将各决策树规则的评估因子和所述线性回归模型中各决策树规则项的拟合参数代入至重要程度值计算公式,获取各决策树规则的重要程度值;
所述重要程度值计算公式为:
在一个实施例中,推荐模块504,还用于筛选出特征信息满足所述推荐规则的用户作为目标用户;向所述目标用户的用户终端推送产品信息。
上述产品推荐装置,对决策树规则进行重要性评估,获取决策树规则对应的重要程度值;并根据决策树规则的重要程度值,从决策树规则中筛选出推荐规则,最后根据推荐规则向用户推荐产品。通过将决策树规则与重要程度值结合起来,获取重要程度值靠前的决策树规则作为推荐规则,并根据推荐规则向用户推荐产品,提高了对用户推荐产品的准确度。
关于产品推荐装置的具体限定可以参见上文中对于产品推荐方法的限定,在此不再赘述。上述产品推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种产品推荐方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;根据所述训练集训练生成决策树模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将各决策树规则依据重要程度值从高到低进行排列;将重要程度值排在前预设数值位的决策树规则作为推荐规则。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:分别将各决策树规则的评估因子和所述线性回归模型中各决策树规则项的拟合参数代入至重要程度值计算公式,获取各决策树规则的重要程度值;
所述重要程度值计算公式为:
在一个实施例中,处理器执行计算机程序时还实现以下步骤:筛选出特征信息满足所述推荐规则的用户作为目标用户;向所述目标用户的用户终端推送产品信息。
上述产品推荐装置,对决策树规则进行重要性评估,获取决策树规则对应的重要程度值;并根据决策树规则的重要程度值,从决策树规则中筛选出推荐规则,最后根据推荐规则向用户推荐产品。通过将决策树规则与重要程度值结合起来,获取重要程度值靠前的决策树规则作为推荐规则,并根据推荐规则向用户推荐产品,提高了对用户推荐产品的准确度。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;根据所述训练集训练生成决策树模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将各决策树规则依据重要程度值从高到低进行排列;将重要程度值排在前预设数值位的决策树规则作为推荐规则。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:分别将各决策树规则的评估因子和所述线性回归模型中各决策树规则项的拟合参数代入至重要程度值计算公式,获取各决策树规则的重要程度值;
所述重要程度值计算公式为:
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:筛选出特征信息满足所述推荐规则的用户作为目标用户;向所述目标用户的用户终端推送产品信息。
上述存储介质,对决策树规则进行重要性评估,获取决策树规则对应的重要程度值;并根据决策树规则的重要程度值,从决策树规则中筛选出推荐规则,最后根据推荐规则向用户推荐产品。通过将决策树规则与重要程度值结合起来,获取重要程度值靠前的决策树规则作为推荐规则,并根据推荐规则向用户推荐产品,提高了对用户推荐产品的准确度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种产品推荐方法,其特征在于,所述方法包括:
根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
根据所述推荐规则向终端推送产品信息。
2.根据权利要求1所述的方法,其特征在于,所述决策树模型通过以下方法获取:
获取样本用户的特征信息和样本用户的标签,作为训练集,其中,所述样本用户为预设时间范围内有被推荐产品的用户,所述样本用户的标签用于标识样本用户是否使用推荐产品;
根据所述训练集训练生成决策树模型。
3.根据权利要求1所述的方法,其特征在于,所述根据预先训练好的决策树模型获取不少于一条决策树规则包括:
提取所述决策树模型中的各个支路,所述支路是在决策树模型中从根节点到非根节点之间的路径;
根据支路中节点与节点之间的函数关系生成与支路对应的决策树规则。
4.根据权利要求3所述的方法,其特征在于,所述对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值包括:
根据所述决策树规则拟合生成线性回归模型,分别获取所述线性回归模型中各决策树规则项的拟合参数;
分别获取训练集中满足各决策树规则的样本用户数量占样本用户总量的比值,作为各决策树规则的评估因子;
根据各决策树规则项的拟合参数和各决策树规则的评估因子获取各决策树规则的重要程度值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述重要程度值,从所述决策树规则中筛选出推荐规则包括:
将各决策树规则依据重要程度值从高到低进行排列;
将重要程度值排在前预设数值位的决策树规则作为推荐规则。
7.根据权利要求1所述的方法,其特征在于,所述根据所述推荐规则向终端推送产品信息包括:
筛选出特征信息满足所述推荐规则的用户作为目标用户;
向所述目标用户的用户终端推送产品信息。
8.一种产品推荐装置,其特征在于,所述装置包括:
第一获取模块,用于根据预先训练好的决策树模型获取不少于一条决策树规则,所述决策树模型是根据样本用户的特征信息和样本用户的标签进行训练得到的;
第二获取模块,用于对所述决策树规则进行重要性评估,获取每条所述决策树规则对应的重要程度值;
筛选模块,用于根据所述重要程度值,从所述决策树规则中筛选出推荐规则;
推荐模块,用于根据所述推荐规则向终端推送产品信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110216223.1A CN112559900B (zh) | 2021-02-26 | 2021-02-26 | 产品推荐方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110216223.1A CN112559900B (zh) | 2021-02-26 | 2021-02-26 | 产品推荐方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112559900A true CN112559900A (zh) | 2021-03-26 |
CN112559900B CN112559900B (zh) | 2021-06-04 |
Family
ID=75034818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110216223.1A Active CN112559900B (zh) | 2021-02-26 | 2021-02-26 | 产品推荐方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559900B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113312552A (zh) * | 2021-06-10 | 2021-08-27 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备和介质 |
CN113592606A (zh) * | 2021-08-10 | 2021-11-02 | 平安银行股份有限公司 | 基于多重决策的产品推荐方法、装置、设备及存储介质 |
CN113657495A (zh) * | 2021-08-17 | 2021-11-16 | 平安科技(深圳)有限公司 | 基于概率预测模型的保险产品推荐方法、装置、设备 |
CN113961774A (zh) * | 2021-12-22 | 2022-01-21 | 四川新网银行股份有限公司 | 一种多特征组合策略的推荐方法 |
CN114168761A (zh) * | 2021-11-30 | 2022-03-11 | 上海益世界信息技术集团有限公司广州分公司 | 多媒体数据的推送方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1991879A (zh) * | 2005-12-29 | 2007-07-04 | 腾讯科技(深圳)有限公司 | 一种垃圾邮件的过滤方法 |
US20180307720A1 (en) * | 2017-04-20 | 2018-10-25 | Beijing Didi Infinity Technology And Development Co., Ltd. | System and method for learning-based group tagging |
CN109711424A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 一种基于决策树的行为规则获取方法、装置及设备 |
CN111652712A (zh) * | 2020-06-09 | 2020-09-11 | 深圳前海微众银行股份有限公司 | 基于地理信息的贷前分析方法、装置、设备与存储介质 |
-
2021
- 2021-02-26 CN CN202110216223.1A patent/CN112559900B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1991879A (zh) * | 2005-12-29 | 2007-07-04 | 腾讯科技(深圳)有限公司 | 一种垃圾邮件的过滤方法 |
US20180307720A1 (en) * | 2017-04-20 | 2018-10-25 | Beijing Didi Infinity Technology And Development Co., Ltd. | System and method for learning-based group tagging |
CN109711424A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 一种基于决策树的行为规则获取方法、装置及设备 |
CN111652712A (zh) * | 2020-06-09 | 2020-09-11 | 深圳前海微众银行股份有限公司 | 基于地理信息的贷前分析方法、装置、设备与存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113312552A (zh) * | 2021-06-10 | 2021-08-27 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备和介质 |
CN113592606A (zh) * | 2021-08-10 | 2021-11-02 | 平安银行股份有限公司 | 基于多重决策的产品推荐方法、装置、设备及存储介质 |
CN113592606B (zh) * | 2021-08-10 | 2023-08-22 | 平安银行股份有限公司 | 基于多重决策的产品推荐方法、装置、设备及存储介质 |
CN113657495A (zh) * | 2021-08-17 | 2021-11-16 | 平安科技(深圳)有限公司 | 基于概率预测模型的保险产品推荐方法、装置、设备 |
CN113657495B (zh) * | 2021-08-17 | 2023-06-30 | 平安科技(深圳)有限公司 | 基于概率预测模型的保险产品推荐方法、装置、设备 |
CN114168761A (zh) * | 2021-11-30 | 2022-03-11 | 上海益世界信息技术集团有限公司广州分公司 | 多媒体数据的推送方法、装置、电子设备及存储介质 |
CN114168761B (zh) * | 2021-11-30 | 2022-10-28 | 上海益世界信息技术集团有限公司广州分公司 | 多媒体数据的推送方法、装置、电子设备及存储介质 |
CN113961774A (zh) * | 2021-12-22 | 2022-01-21 | 四川新网银行股份有限公司 | 一种多特征组合策略的推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112559900B (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559900B (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN106485562B (zh) | 一种基于用户历史行为的商品信息推荐方法及系统 | |
CN112418653A (zh) | 一种基于机器学习算法的携号转网潜客识别系统及方法 | |
CN110263265A (zh) | 用户标签生成方法、装置、存储介质和计算机设备 | |
CN110991474A (zh) | 一种机器学习建模平台 | |
CN111695042B (zh) | 基于深度游走和集成学习的用户行为预测方法及系统 | |
CN112396428B (zh) | 一种基于用户画像数据的客群分类管理方法及装置 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN109711424A (zh) | 一种基于决策树的行为规则获取方法、装置及设备 | |
CN112232944B (zh) | 一种评分卡创建方法、装置和电子设备 | |
Alghobiri | A comparative analysis of classification algorithms on diverse datasets | |
Balabhadrapathruni et al. | A study on analysing the impact of feature selection on predictive machine learning algorithms | |
CN113034264A (zh) | 客户流失预警模型的建立方法、装置、终端设备及介质 | |
CN116701873A (zh) | 基于主客观信息融合表示的行为危险倾向预测方法及系统 | |
CN115936841A (zh) | 一种构建信贷风险评估模型的方法及装置 | |
CN116167371A (zh) | 产品的推荐方法及装置、处理器和电子设备 | |
CN114170000A (zh) | 信用卡用户风险类别识别方法、装置、计算机设备和介质 | |
CN114926261A (zh) | 汽车金融用户申请欺诈概率预测方法及介质 | |
Mendikowski et al. | Creating customers that never existed: Synthesis of e-commerce data using CTGAN | |
CN112927092A (zh) | 理赔趋势预测方法、装置、设备及存储介质 | |
CN113327048A (zh) | 基于大数据及多维特征的企业画像计算方法、介质及程序 | |
CN114817725B (zh) | 一种行为决策逻辑识别方法及系统 | |
CN116523546B (zh) | 智能读者行为分析预测系统数据采集分析的方法和装置 | |
KR20240076323A (ko) | 국가별 역직구 판매상품 및 판매가 추천 방법 | |
CN115829369A (zh) | 一种评分卡建模方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |