CN114741592B - 一种基于多模型融合的产品推荐方法、设备及介质 - Google Patents
一种基于多模型融合的产品推荐方法、设备及介质 Download PDFInfo
- Publication number
- CN114741592B CN114741592B CN202210350985.5A CN202210350985A CN114741592B CN 114741592 B CN114741592 B CN 114741592B CN 202210350985 A CN202210350985 A CN 202210350985A CN 114741592 B CN114741592 B CN 114741592B
- Authority
- CN
- China
- Prior art keywords
- product
- user
- recommendation
- data
- products
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000004927 fusion Effects 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 82
- 239000011159 matrix material Substances 0.000 claims abstract description 77
- 238000012549 training Methods 0.000 claims abstract description 59
- 230000006399 behavior Effects 0.000 claims description 40
- 238000013507 mapping Methods 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000000047 product Substances 0.000 description 390
- 230000000875 corresponding effect Effects 0.000 description 33
- 238000004422 calculation algorithm Methods 0.000 description 32
- 238000005516 engineering process Methods 0.000 description 19
- 238000007500 overflow downdraw method Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于多模型融合的产品推荐方法、设备及介质,方法包括:确定包含的第一产品的用户兴趣向量,并得到所有产品分别对应的产品标准化特征向量;根据用户兴趣向量以及产品标准化特征向量之间的相似度,得到针对用户的第一产品推荐表;根据产品浏览数据,确定产品浏览次数,并根据用户申请产品数据,确定用户的第二产品的产品申请次数;得到用户‑产品矩阵,并根据用户‑产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据NMF模型,得到第二产品推荐表;根据产品浏览数据,通过梯度提升的方式训练产品推荐模型;将第一产品推荐表和第二产品推荐表融合,得到第三产品推荐表,并通过产品推荐模型进行预测,得到最终推荐结果。
Description
技术领域
本申请涉及人工智能领域,具体涉及一种基于多模型融合的产品推荐方法、设备及介质。
背景技术
随着信息技术和大数据技术的发展,人们从信息匮乏时代步入了信息过载时代,在这种时代背景下,人们从大量的信息中找到自身感兴趣的信息难度越来越大,信息也越来越难直观展示给对它感兴趣的用户。而推荐系统的任务就是连接用户和信息、以及用户及信息之间的各种关联关系,为用户推荐合适的信息。
推荐系统通过挖掘分析用户的行为信息,找到用户的个性化需求,从而将特定的物品信息准确推荐给合适的用户,帮助用户找到他们感兴趣但很难发现的物品。多年来,用于推荐系统的各类算法已得到了诸多发展。高质量的推荐系统会使用户对系统产生依赖,因此,推荐系统不仅能为用户提供个性化服务,还能与用户建立长期稳定的合作关系,提高用户留得率,防止用户流失。
通用的推荐系统模型流程为用户行为数据在网站上最简单的存在形式就是日志,日志中记录了用户的各种行为,比如网页浏览、点击、购买、评论、评分等,如何利用好这些海量的日志数据为用户提供定制化的服务是非常关键的问题。
推荐系统成功与否的检验,归根结底最关键的是必须保证高质量的推荐效果。推荐系统技术发展至今众多的推荐算法被提出并在业界运用,经过大量的实践,很难存在可以广泛适应于任何应用场景的方案,每种推荐方法都有其局限性,比如,基于内容的推荐算法抽取的特征既要保证准确性又要具有一定的实际意义,否则很难保证推荐结果的相关性;基于关联规则的推荐算法计算量较大,并且由于采用用户数据,不可避免的存在冷启动和稀疏性问题;基于流行度的推荐算法无法针对用户提供个性化的推荐。因此在实际应用场景中,无论产品属性的定义、产品信息的复杂度、用户访问量的数量级,解决各种推荐方法受限性的一条最好的解决途径就是多种推荐算法的融合技术。
发明内容
为了解决上述问题,本申请提出了一种基于多模型融合的产品推荐方法,包括:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
在一个示例中,根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型,具体包括:
针对每个产品,根据其是否存在对应的所述产品浏览数据,为该产品生成对应的标签,并将生成标签后的产品作为训练样本,得到训练样本集;
若所述训练样本中,所述标签存在不均衡的情况,则基于过采样方法,对所述训练样本集中的边界样本进行区分,以对不同的边界样本生成不同数量的合成样本,从而实现相比于所述过采样方法之前,所述训练样本集中不同标签的训练样本的数量比更加接近1:1;
在所述训练样本中,提取所述用户的产品行为特征,并对所述产品行为特征进行预处理,以将时间戳型特征转换为距当前统计日的年份差值、将文本型特征转换为独热编码、将连续行数值型特征进行离散化分箱处理;
根据预处理后的所述产品行为特征,通过梯度提升的方式训练产品推荐模型。
在一个示例中,通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果,具体包括:
基于业务需求,确定向用户推荐的产品数量阈值;
通过所述产品推荐模型对所述第三产品推荐表中包含的产品去重后进行预测,并将选取的不超过所述产品数量阈值的推荐产品按顺序进行排列,得到最终推荐结果,并确定所述推荐产品的平均推荐得分;
若所述最终推荐结果中所述推荐产品的数量低于所述产品数量阈值,则通过所述产品推荐模型在所述所有产品中进行预测,以将满足所述平均推荐得分的产品作为推荐产品,直至所述推荐产品的数量达到所述产品数量阈值。
在一个示例中,根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量之前,所述方法还包括:
在企业运营数据库中抽取产品类型关系表和产品管理表;
按照标准预处理方式处理建模表字段信息,以对所述产品类型关系表中,表示角色产品关系的字段进行热编码处理;
针对每个所述产品,对热编码后该产品对应的产品类型进行相加,得到该产品所有的应用场景;
从所述产品管理表中筛选出所述用户与各产品相关的行为记录,并将所述行为记录中无效数据剔除。
在一个示例中,根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,具体包括:
根据所述用户的产品浏览数据,针对所述产品浏览数据中包含的每个第一产品,确定该第一产品对应的产品属性向量;
综合所有所述产品属性向量,通过求均值,得到所述用户对所述第一产品的用户兴趣向量;
根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量,具体包括:
根据所有产品对应的产品信息,进行筛选得到产品入模特征,其中,筛选方式包括以下中的至少一种:基于专家经验进行筛选、基于数值分布中指定属性对产品的区分度进行筛选、基于指标相关性进行筛选;
对所述产品入模特征进行零-均值规范化处理,得到标准化特征向量。
在一个示例中,基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表,具体包括:
针对每个用户,确定该用户对应的所述用户兴趣向量,并遍历每个所述产品标准化特征向量,计算所述用户兴趣向量与每个所述产品标准化特征向量之间的距离,得到相似度矩阵;
根据所述相似度矩阵,得到每个所述用户对应的推荐产品序列,并根据所述推荐产品序列得到针对所述用户的第一产品推荐表。
在一个示例中,根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数,具体包括:
在用户的身份信息中选取指定标识,作为所述用户的唯一标识,并根据该唯一标识生成所述用户与所述第一产品之间的第一映射关系,以及所述用户与所述用户申请产品数据中包含的第二产品之间的第二映射关系;
根据所述第一映射关系和所述第二映射关系结合,得到第三映射关系;
根据所述第三映射关系确定所述用户针对所述第一产品的产品浏览次数,以及确定所述用户针对所述第二产品的产品申请次数;
在所述产品浏览次数、所述产品申请次数中进行统计,确定有效异常值,并通过等频分箱的方式将所述有效异常值进行降噪处理;
对降噪后的所述产品浏览次数和所述产品申请次数进行归一化处理。
在一个示例中,基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表,具体包括:
根据所述归一化处理后的所述产品浏览次数和所述产品申请次数,确定对应的评分关系,并根据所述评分关系得到用户-产品矩阵,其中,所述用户-产品矩阵中的分值均为隐式正反馈,且0代表所述用户未执行的行为记录;
根据所述用户-产品矩阵进行非负矩阵分解,将输入的稀疏矩阵分解为两个稠密矩阵,所述稠密矩阵包括用户-隐含因子矩阵、产品-隐含因子矩阵;其中,两个稠密矩阵的矩阵值分别为所述用户对各因子的喜好程度、产品包含各因子的程度;
通过三折交叉验证评估预测分数的均方误差根RMSE、平均绝对误差项MAE、协调对分数FCP,并根据预测结果进行排序,得到针对所述用户的第二产品推荐表。
另一方面,本申请还提出了一种基于多模型融合的产品推荐设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
另一方面,本申请还提出了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
通过本申请提出的方法能够带来如下有益效果:
与单一类型的推荐算法方法不同,通过多推荐算法模型的融合技术,打破了单一推荐算法适应场景的局限性,融合推荐算法的一个重要原则就是通过组合应能够避免或弥补各自推荐技术的弱点,充分发挥各算法的优点。而在本文中采用的融合技术是基于内容的推荐和协同过滤推荐的组合,充分结合了基于内容推荐算法的基于产品本身特征来推荐不存在过度推荐热门;并且协同过滤推荐算法不需要对项目进行特殊处理,而是通过用户建立产品与产品之间的联系等优势。同时解决了用户历史偏好稀疏矩阵广泛存在的问题,包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等。
多模型融合算法可以比单一模型算法有极为明显的效果提升。在实际应用场景中,本文提出的改进方法还能解决常用的诸如线性加权融合法、交叉融合技术、瀑布融合法、特征融合法等多种融合技术存在融合参数固定、不能灵活适用于多种推荐场景,及用户-产品行为记录数据存在稀疏矩阵不能产生较好推荐结果等问题。此外,基于模型的融合方法选择上,二层预测模型可以使用常用的分类算法,在以往常用的类似融合效果较好的随机森林、较大熵、GBDT等方法上提出采用XGBoost方法作为二层模型融合技术,该方法作为GBDT技术的改进,GBDT以传统CART作为基分类器,而XGBoost支持线性分类器,相当于引入L1和L2正则化项的逻辑回归和线性回归,控制了模型的复杂度,同时正则项降低了模型的方差,防止模型过拟合。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中基于多模型融合的产品推荐方法的流程示意图;
图2为本申请实施例中基于内容推荐维度的流程示意图;
图3为本申请实施例中基于用户行为的协同维度的流程示意图;
图4为本申请实施例中一种场景下,基于多模型融合的产品推荐方法的流程示意图;
图5为本申请实施例中基于多模型融合的产品推荐设备的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
如图1所示,本申请实施例提供基于多模型融合的产品推荐方法,包括:
S101:根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量。
基于内容的推荐主要通过挖掘用户行为数据中体现的用户兴趣,针对用户兴趣为其推荐可能感兴趣的产品。通常来说,在确定用户兴趣向量之前,首先需要进行数据的预处理。
具体地,首先在企业运营数据库中抽取产品类型关系表和产品管理表,然后按照标准预处理方式处理建模表字段信息,以对产品类型关系表中,表示角色产品关系(Productcode)的字段进行热编码处理。此时,针对每个产品,对热编码后该产品对应的产品类型进行相加,即可得到该产品所有的应用场景从产品管理表中筛选出用户与各产品相关的行为记录,并将行为记录中无效数据剔除。比如,剔除平台已下架产品的相关记录、无关页面浏览记录、无效订单申请记录等。
此时,如图2所示,确定用户兴趣向量时,首先根据用户的产品浏览数据,针对产品浏览数据中包含的每个第一产品,确定该第一产品对应的产品属性向量,其相当于用户每一次浏览时的偏好向量,综合所有产品属性向量,通过求均值,得到用户对第一产品的用户兴趣向量。
而生成标准化特征向量时,首先根据所有产品对应的产品信息,进行筛选得到产品入模特征,其中,筛选方式包括以下中的至少一种:基于专家经验进行筛选、基于数值分布中指定属性对产品的区分度进行筛选、基于指标相关性进行筛选。数据规范化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,为了消除指标之间的量纲和取值范围差异的影响,需进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。对数据预处理完成后标准化处理可以采用的是零-均值规范化(z-score标准化),从而得到标准化特征向量。其中,标准化特征向量也可以称作产品属性向量或产品向量,其是从每个产品本身抽取出可以描述它的结构化属性,如所属银行、适宜群体、利率、金额期限等。
S102:基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表。
具体地,针对每个用户,确定该用户对应的用户兴趣向量,并遍历每个产品标准化特征向量,计算用户兴趣向量与产品标准化特征向量之间的距离,得到相似度矩阵。不同属性对于用户选择的重要性不同,对相似度的影响也不同,可以赋予权重求加权距离。这里采用的是余弦距离:将两者当作空间中两向量,强调方向夹角大小,对数值不敏感,仅表示方向上的差别。根据相似度矩阵,得到每个用户对应的由高到低排序的推荐产品序列,并根据推荐产品序列得到针对用户的第一产品推荐表。
当然,在此可以对行为记录进行预处理,在产品浏览数据中,合并用户行为表user_vist和产品相似度矩阵product_normal,形成用户完备浏览信息。然后根据用户分组,计算每个用户浏览产品的均值,后期根据时间序列分析方法求出产品权重后加以改进。此时即可通过每个用户的行为向量计算其与其他产品product_normal的相似度。
S103:根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数。
基于协同过滤的推荐方法主要基于用户行为数据进行非负矩阵分解(NMF)算法训练,基于训练后算法形成用户的第二产品推荐表,实现基于用户行为数据的个性化产品推荐,让数据从用户中来又服务到用户中去。
具体地,如图3所示,仍然可以先进行数据清洗,将无效数据剔除,然后在用户的身份信息(比如手机号)中选取指定标识,作为用户的唯一标识,并根据该唯一标识生成用户与第一产品之间的第一映射关系(用户-兴趣-产品,user—visit—item),以及用户与用户申请产品数据中包含的第二产品之间的第二映射关系(用户-申请-产品,user—apply—item)。接着将第一映射关系和第二映射关系结合,得到第三映射关系(user--item—visitcount—apply count)。
根据第三映射关系确定用户针对第一产品的产品浏览次数,以及确定用户针对第二产品的产品申请次数。在产品浏览次数、产品申请次数中进行统计,确定有效异常值,并通过等频分箱的方式,将数值较大的异常值归到正常数值范围,减弱噪声,使数据较平滑。产品浏览次数数量级一般大于产品申请次数数量级,直接加权会使评分值不合理,采用MaxAbsScaler最大值标准化,将两列数据分别归到[0,5]。用户对产品的不同行为付出的代价不同,应赋予申请行为较高的权重,浏览行为较低的权重;具体权重系数设置依据为分析数据得到3:1的对应关系。两列数据加权求和得到用户对产品的评分[0,5],代表偏好程度。
S104:基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
具体地,根据归一化处理后的产品浏览次数和产品申请次数,确定对应的评分关系,并根据评分关系得到用户-产品矩阵(user-item评分映射矩阵),其中,用户-产品矩阵与传统的电影评分推荐不同,其分值均为隐式正反馈,且0代表用户未执行的行为记录,正是我们待预测推荐的序列。
选取基于矩阵分解的协同过滤算法实现评分预测,根据用户-产品矩阵进行非负矩阵分解,将输入的稀疏矩阵分解为两个稠密矩阵,稠密矩阵包括用户-隐含因子矩阵Pu、产品-隐含因子矩阵qi。其中,两个稠密矩阵的矩阵值分别为用户对各因子的喜好程度、产品包含各因子的程度,类似于一种软分类的思想。
和分别为通过用户-隐含因子矩阵Pu和产品-隐含因子矩阵qi计算得到预测评分的两种方式。其中,为预测评分值,μ+bu+bi为偏置项,μ为常数系数,bu为用户偏置项,bi为产品偏置项。通过实验情况来看,加入偏置项虽使预测分值更接近真实分值,但使第二产品推荐表推荐结果的多样性大大降低。这就反映了推荐系统的两种分支——评分预测问题和第二产品推荐表问题,两种分支的实现效果并不呈正相关,而我们关注的是第二产品推荐表问题,所以通常不加入偏置项,但是在其他场景中可以基于实际需求,将偏置项加入。
通过三折交叉验证评估预测分数的均方误差根RMSE、平均绝对误差项MAE、协调对分数FCP,并根据预测结果进行排序,得到针对用户的第二产品推荐表。
S105:根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型。
多模型融合算法可以比单一模型算法有极为明显的效果提升,但是如何灵活有效的融合,充分发挥各个算法的长处、满足多样的用户需求是极大程度提升推荐结果质量的关键,常见的多模型融合方法有线性加权融合法、交叉融合法、瀑布融合法、特征融合法、分类器融合等,其中融合效果较好的是GBDT(Gradient Boosting Decision Tree)方法。
而本文中基于内容和协同过滤两种推荐算法粗粒度召回的基础上,使用梯度提升(比如,XGBoost)方法进行精确召回。其方法对GBDT进行了优化改进,其算法中加入了正则项,即对过多特征进行惩罚,平衡准确性与复杂性,收敛速度较快,避免过拟合,更直观反映特征重要性,使其在机器学习领域展现了很好的效果。
具体地,如图4所示,针对每个产品,根据其是否存在对应的产品浏览数据,为该产品生成对应的标签,比如,存在浏览及点击等产品数据记为1,不存在浏览的产品记为0的方式为样本打标签。并将生成标签后的产品作为训练样本,得到训练样本集。
在样本不均衡的情况下,可能造成模型精确度失准,此时可以考虑对样本集进行加工,通常应对样本不均衡的方法有欠采样和过采样等多种方式。由于现有的原始样本集本身较小,本申请采用BorderlineSMOTE方法创建新样本,该算法通过进一步对边界样本加以区分,对不同的边界样本生成不同数目的合成样本,从而改善样本的类别分布,使已浏览和未浏览产品数据记录比例相比于调整之前更加接近为1:1。
在训练样本中,提取用户的产品行为特征,并对产品行为特征进行预处理,以将时间戳型特征转换为距当前统计日的年份差值、将文本型特征转换为独热编码(one-hot编码)、将连续行数值型特征进行离散化分箱处理。
根据预处理后的产品行为特征,通过梯度提升的方式训练产品推荐模型。在模型训练过程中,将样本划分,按照7:3的比例划分训练集和测试集,然后使用CV函数训练得到最优参数集,并基于实际产品需求对参数集进行调整,得到最终的产品推荐模型。
S106:将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
具体地,基于业务需求,确定向用户推荐的产品数量阈值N。并通过产品推荐模型对第三产品推荐表中包含的产品去重后进行预测,并将选取的不超过产品数量阈值的推荐产品按顺序进行排列,得到最终推荐结果,并确定推荐产品的平均推荐得分。
若最终推荐结果中推荐产品的数量低于产品数量阈值N,则通过产品推荐模型在所有产品中进行预测,以将满足平均推荐得分的产品(达到或高于平均推荐得分)作为推荐产品,直至推荐产品的数量达到产品数量阈值。
与单一类型的推荐算法方法不同,通过多推荐算法模型的融合技术,打破了单一推荐算法适应场景的局限性,融合推荐算法的一个重要原则就是通过组合应能够避免或弥补各自推荐技术的弱点,充分发挥各算法的优点。而在本文中采用的融合技术是基于内容的推荐和协同过滤推荐的组合,充分结合了基于内容推荐算法的基于产品本身特征来推荐不存在过度推荐热门;并且协同过滤推荐算法不需要对项目进行特殊处理,而是通过用户建立产品与产品之间的联系等优势。同时解决了用户历史偏好稀疏矩阵广泛存在的问题,包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等。
多模型融合算法可以比单一模型算法有极为明显的效果提升。在实际应用场景中,本文提出的改进方法还能解决常用的诸如线性加权融合法、交叉融合技术、瀑布融合法、特征融合法等多种融合技术存在融合参数固定、不能灵活适用于多种推荐场景,及用户-产品行为记录数据存在稀疏矩阵不能产生较好推荐结果等问题。此外,基于模型的融合方法选择上,二层预测模型可以使用常用的分类算法,在以往常用的类似融合效果较好的随机森林、较大熵、GBDT等方法上提出采用XGBoost方法作为二层模型融合技术,该方法作为GBDT技术的改进,GBDT以传统CART作为基分类器,而XGBoost支持线性分类器,相当于引入L1和L2正则化项的逻辑回归和线性回归,控制了模型的复杂度,同时正则项降低了模型的方差,防止模型过拟合。
在一个实施例中,如图5所示,本申请还提出了一种基于多模型融合的产品推荐设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
在一个实施例中,本申请还提出了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种基于多模型融合的产品推荐方法,其特征在于,包括:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
2.如权利要求1所述的方法,其特征在于,根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型,具体包括:
针对每个产品,根据其是否存在对应的所述产品浏览数据,为该产品生成对应的标签,并将生成标签后的产品作为训练样本,得到训练样本集;
若所述训练样本中,所述标签存在不均衡的情况,则基于过采样方法,对所述训练样本集中的边界样本进行区分,以对不同的边界样本生成不同数量的合成样本,从而实现相比于所述过采样方法之前,所述训练样本集中不同标签的训练样本的数量比更加接近1:1;
在所述训练样本中,提取所述用户的产品行为特征,并对所述产品行为特征进行预处理,以将时间戳型特征转换为距当前统计日的年份差值、将文本型特征转换为独热编码、将连续行数值型特征进行离散化分箱处理;
根据预处理后的所述产品行为特征,通过梯度提升的方式训练产品推荐模型。
3.如权利要求2所述的方法,其特征在于,通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果,具体包括:
基于业务需求,确定向用户推荐的产品数量阈值;
通过所述产品推荐模型对所述第三产品推荐表中包含的产品去重后进行预测,并将选取的不超过所述产品数量阈值的推荐产品按顺序进行排列,得到最终推荐结果,并确定所述推荐产品的平均推荐得分;
若所述最终推荐结果中所述推荐产品的数量低于所述产品数量阈值,则通过所述产品推荐模型在所述所有产品中进行预测,以将满足所述平均推荐得分的产品作为推荐产品,直至所述推荐产品的数量达到所述产品数量阈值。
4.如权利要求1所述的方法,其特征在于,根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量之前,所述方法还包括:
在企业运营数据库中抽取产品类型关系表和产品管理表;
按照标准预处理方式处理建模表字段信息,以对所述产品类型关系表中,表示角色产品关系的字段进行热编码处理;
针对每个所述产品,对热编码后该产品对应的产品类型进行相加,得到该产品所有的应用场景;
从所述产品管理表中筛选出所述用户与各产品相关的行为记录,并将所述行为记录中无效数据剔除。
5.如权利要求4所述的方法,其特征在于,根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,具体包括:
根据所述用户的产品浏览数据,针对所述产品浏览数据中包含的每个第一产品,确定该第一产品对应的产品属性向量;
综合所有所述产品属性向量,通过求均值,得到所述用户对所述第一产品的用户兴趣向量;
根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量,具体包括:
根据所有产品对应的产品信息,进行筛选得到产品入模特征,其中,筛选方式包括以下中的至少一种:基于专家经验进行筛选、基于数值分布中指定属性对产品的区分度进行筛选、基于指标相关性进行筛选;
对所述产品入模特征进行零-均值规范化处理,得到标准化特征向量。
6.如权利要求5所述的方法,其特征在于,基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表,具体包括:
针对每个用户,确定该用户对应的所述用户兴趣向量,并遍历每个所述产品标准化特征向量,计算所述用户兴趣向量与每个所述产品标准化特征向量之间的距离,得到相似度矩阵;
根据所述相似度矩阵,得到每个所述用户对应的推荐产品序列,并根据所述推荐产品序列得到针对所述用户的第一产品推荐表。
7.如权利要求4所述的方法,其特征在于,根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数,具体包括:
在用户的身份信息中选取指定标识,作为所述用户的唯一标识,并根据该唯一标识生成所述用户与所述第一产品之间的第一映射关系,以及所述用户与所述用户申请产品数据中包含的第二产品之间的第二映射关系;
根据所述第一映射关系和所述第二映射关系结合,得到第三映射关系;
根据所述第三映射关系确定所述用户针对所述第一产品的产品浏览次数,以及确定所述用户针对所述第二产品的产品申请次数;
在所述产品浏览次数、所述产品申请次数中进行统计,确定有效异常值,并通过等频分箱的方式将所述有效异常值进行降噪处理;
对降噪后的所述产品浏览次数和所述产品申请次数进行归一化处理。
8.如权利要求7所述的方法,其特征在于,基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表,具体包括:
根据所述归一化处理后的所述产品浏览次数和所述产品申请次数,确定对应的评分关系,并根据所述评分关系得到用户-产品矩阵,其中,所述用户-产品矩阵中的分值均为隐式正反馈,且0代表所述用户未执行的行为记录;
根据所述用户-产品矩阵进行非负矩阵分解,将输入的稀疏矩阵分解为两个稠密矩阵,所述稠密矩阵包括用户-隐含因子矩阵、产品-隐含因子矩阵;其中,两个稠密矩阵的矩阵值分别为所述用户对各因子的喜好程度、产品包含各因子的程度;
通过三折交叉验证评估预测分数的均方误差根RMSE、平均绝对误差项MAE、协调对分数FCP,并根据预测结果进行排序,得到针对所述用户的第二产品推荐表。
9.一种基于多模型融合的产品推荐设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
根据所述用户的产品浏览数据,确定所述用户对所述产品浏览数据中包含的第一产品的用户兴趣向量,并根据所有产品对应的产品信息,得到所述所有产品分别对应的产品标准化特征向量;
基于内容推荐维度,根据所述用户兴趣向量以及所述产品标准化特征向量之间的相似度,得到针对所述用户的第一产品推荐表;
根据所述产品浏览数据,确定所述用户针对所述第一产品的产品浏览次数,并根据所述用户的订单数据抽取所述用户的用户申请产品数据,以确定所述用户针对所述用户申请产品数据中包含的第二产品的产品申请次数;
基于用户行为的协同维度,根据所述产品浏览次数和所述产品申请次数,得到用户-产品矩阵,并根据所述用户-产品矩阵进行非负矩阵分解训练,得到NMF模型,并根据所述NMF模型,得到针对所述用户的第二产品推荐表;
根据所述产品浏览数据,以所述所有产品作为训练样本,通过梯度提升的方式训练产品推荐模型;
将所述第一产品推荐表和所述第二产品推荐表进行融合,得到第三产品推荐表,并通过所述产品推荐模型对所述第三产品推荐表进行预测,得到用于向所述用户进行产品推荐的最终推荐结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210350985.5A CN114741592B (zh) | 2022-04-02 | 2022-04-02 | 一种基于多模型融合的产品推荐方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210350985.5A CN114741592B (zh) | 2022-04-02 | 2022-04-02 | 一种基于多模型融合的产品推荐方法、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114741592A CN114741592A (zh) | 2022-07-12 |
CN114741592B true CN114741592B (zh) | 2024-09-20 |
Family
ID=82278520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210350985.5A Active CN114741592B (zh) | 2022-04-02 | 2022-04-02 | 一种基于多模型融合的产品推荐方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114741592B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116170497B (zh) * | 2022-12-09 | 2023-10-20 | 北京国电通网络技术有限公司 | 用户行为信息推送方法、装置、电子设备和计算机介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191240A (zh) * | 2018-08-14 | 2019-01-11 | 北京九狐时代智能科技有限公司 | 一种进行商品推荐的方法和装置 |
WO2021189976A1 (zh) * | 2020-03-25 | 2021-09-30 | 平安科技(深圳)有限公司 | 一种产品信息推送方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787770A (zh) * | 2016-04-27 | 2016-07-20 | 上海遥薇(集团)有限公司 | 一种基于nmf算法的大数据商品及服务推荐方法及系统 |
US11416770B2 (en) * | 2019-10-29 | 2022-08-16 | International Business Machines Corporation | Retraining individual-item models |
CN113032682B (zh) * | 2021-04-22 | 2023-07-21 | 中国平安人寿保险股份有限公司 | 基于协同过滤的产品推荐方法、装置、设备及存储介质 |
-
2022
- 2022-04-02 CN CN202210350985.5A patent/CN114741592B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191240A (zh) * | 2018-08-14 | 2019-01-11 | 北京九狐时代智能科技有限公司 | 一种进行商品推荐的方法和装置 |
WO2021189976A1 (zh) * | 2020-03-25 | 2021-09-30 | 平安科技(深圳)有限公司 | 一种产品信息推送方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114741592A (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anastasopoulos et al. | Machine learning for public administration research, with application to organizational reputation | |
CN106447066A (zh) | 一种大数据的特征提取方法和装置 | |
CN111652735A (zh) | 基于用户行为标签特征及商品特征的保险产品推荐的方法 | |
CN114371946B (zh) | 基于云计算和大数据的信息推送方法及信息推送服务器 | |
CN117668205B (zh) | 智慧物流客服处理方法、系统、设备及存储介质 | |
Aeron et al. | Data mining framework for customer lifetime value-based segmentation | |
CN114741592B (zh) | 一种基于多模型融合的产品推荐方法、设备及介质 | |
Pinheiro et al. | Introduction to Statistical and Machine Learning Methods for Data Science | |
CN114693409A (zh) | 产品匹配方法、装置、计算机设备、存储介质和程序产品 | |
CN110210518B (zh) | 提取降维特征的方法和装置 | |
CN113869423A (zh) | 一种营销响应模型构建方法、设备及介质 | |
CN115222177A (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
Mahalle et al. | Data Acquisition and Preparation | |
Lee et al. | An enhanced memory-based collaborative filtering approach for context-aware recommendation | |
Cruz et al. | Data Mining Prospective Associated with the Purchase of Life Insurance Through Predictive Models | |
Ines et al. | Customer Success Analysis and Modeling in Digital Marketing | |
CN115099795B (zh) | 企业内部数字资源管理方法及系统 | |
KR20210112974A (ko) | 시장 집중도를 이용한 브랜드 지수 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
CN113191825A (zh) | 一种基于人工智能的客户画像模型建模方法、系统及设备 | |
CN116228370A (zh) | 产品推荐方法、装置及电子设备 | |
CN116739527A (zh) | 效率信息的生成方法、装置及电子设备 | |
Nicolae | Reflections on Methods of Digital Processing of Very Large Amounts of Accounting Information | |
Aeri et al. | Customer Churn Prediction in Telecom Services | |
CN117349793A (zh) | 用户分级方法及装置、电子设备、计算机可读存储介质 | |
CN118396713A (zh) | 目标客户的筛选方法、装置、计算机存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Cui Lele Inventor after: Ren Dexin Inventor after: Yang Baohua Inventor before: Ren Dexin Inventor before: Cui Lele Inventor before: Yang Baohua |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant |