CN111209469A - 一种个性化推荐方法、装置、计算机设备及存储介质 - Google Patents

一种个性化推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111209469A
CN111209469A CN201811367415.7A CN201811367415A CN111209469A CN 111209469 A CN111209469 A CN 111209469A CN 201811367415 A CN201811367415 A CN 201811367415A CN 111209469 A CN111209469 A CN 111209469A
Authority
CN
China
Prior art keywords
target
recommendation
algorithm
data set
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811367415.7A
Other languages
English (en)
Inventor
陈录城
张俊普
孙兆群
汪洪涛
刘希军
王浩宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haier Digital Technology Shanghai Co Ltd
Original Assignee
Haier Digital Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haier Digital Technology Shanghai Co Ltd filed Critical Haier Digital Technology Shanghai Co Ltd
Priority to CN201811367415.7A priority Critical patent/CN111209469A/zh
Publication of CN111209469A publication Critical patent/CN111209469A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种个性化推荐方法、装置、计算机设备及存储介质,所述方法包括:通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象;通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。本发明实施例的技术方案能够实现降低推荐算法的计算复杂度,并提高推荐算法的推荐精度。

Description

一种个性化推荐方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及数据挖掘技术领域,尤其涉及一种个性化推荐方法、装 置、计算机设备及存储介质。
背景技术
随着科技的进步,人工智能领域相关技术飞速发展,信息化和智能化将成 为互联网时代的主要标志,互联网的快速发展也随之引发信息量巨大且以指数 级的快速增长等问题。对于互联网所面临的挑战——信息过载,推荐算法恰好 可以在一定程度上解决这个问题,且目前已经被广泛地应用于多个领域。例如 用户在网上购物时,商家根据用户的浏览记录和购买记录向用户推荐其感兴趣 的商品。但是,用户需求通常具有不确定性和模糊性,因此优秀的推荐算法具 有非常高的研究和应用价值。
目前比较流行的推荐算法是协同过滤(Collaborative Filtering,CF)推荐算法。CF的基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给 用户推荐感兴趣的物品。以分类为基础的推荐算法包括支持向量机(SVM)算 法、朴素贝叶斯算法、自适应提升(AdaBoost)算法和随机森林(Random Forest) 算法等。
但是现有的协同过滤推荐算法存在一些问题,其推荐的结果往往需要历史 数据的积累。由于原始数据没有对应的历史数据的且历史数据具有高维性、稀 疏性等特点,这些因素严重影响推荐结果的准确性。
发明内容
本发明实施例提供一种个性化推荐方法、装置、计算机设备及存储介质, 实现降低推荐算法的计算复杂度,并提高推荐算法的推荐精度。
第一方面,本发明实施例提供了一种个性化推荐方法,包括:
通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;
通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐 对象;
通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
第二方面,本发明实施例还提供了一种个性化推荐装置,包括:
数据集获取模块,用于通过预设聚类算法对原始样本数据集进行聚类处理, 得到目标数据集;
推荐对象获取模块,用于通过优化的随机森林算法对所述目标数据集进行 分类处理,得到目标推荐对象;
对象推荐模块,用于通过协同过滤推荐算法对所述目标推荐对象进行TopN 推荐。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多 个处理器实现本发明任意实施例所提供的个性化推荐方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算 机程序,该程序被处理器执行时实现本发明任意实施例所提供的个性化推荐方 法。
本发明实施例通过采用预设聚类算法对原始样本数据进行聚类处理得到目 标数据集,然后通过优化的随机森林算法对目标数据集进行分类处理得到目标 推荐对象,最后通过协同过滤推荐算法对目标推荐对象进行TopN推荐,解决 现有协同过滤推荐算法存在的推荐精度较低的问题,实现降低推荐算法的计算 复杂度,并提高推荐算法的推荐精度。
附图说明
图1是本发明实施例一提供的一种个性化推荐方法的流程图;
图2是本发明实施例二提供的一种个性化推荐方法的流程图;
图3a是本发明实施例三提供的一种个性化推荐方法的流程图;
图3b是本发明实施例三提供的一种果蝇优化算法的流程图;
图4a是本发明实施例四提供的一种个性化推荐方法的流程图;
图4b是本发明实施例提供的一种个性化推荐方法的流程图;
图4c是本发明实施例三提供的一种个性化推荐方法与传统的协同过滤方法 在K-means的k取不同的值时推荐质量的对比效果示意图;
图5是本发明实施例五提供的一种个性化推荐装置的示意图;
图6为本发明实施例六提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此 处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部 分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示 例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或 步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同 时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可 以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于 方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种个性化推荐方法的流程图,本实施例可 适用于向用户精确地进行个性化推荐,该方法可以由个性化推荐装置来执行, 该装置可以由软件和/或硬件的方式来实现。相应的,如图1所示,该方法包括 如下操作:
S110、通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据 集。
其中,预设聚类算法可以是根据实际需求选择的聚类算法,原始样本数据 可以是用户关联的历史数据,例如,用户通过浏览器浏览过的电商商品或影视 剧等相关数据。
在本发明实施例中,在对用户进行个性化推荐之前,可以首先通过选取的 预设聚类算法对原始样本数据进行聚类处理,以降低原始样本数据的维度,避 免高维稀疏数据影响推荐质量。对原始样本数据进行聚类处理后,可以得到处 理后的目标数据集。
S120、通过优化的随机森林算法对所述目标数据集进行分类处理,得到目 标推荐对象。
其中,目标推荐对象可以是需要推荐服务的对象,如需要推荐产品的目标 用户等。
在本发明实施例中,可以采用随机森林算法对获取的目标数据集进行分类 处理,以得到目标推荐对象。需要说明的是,随机森林算法能够有效处理大量 的数据,对于不平衡的数据可以平衡误差,不容易产生出现过拟合。但随机森 林对高维稀疏的数据处理效果不理想。为此,本发明实施例首先对原始样本数 据采用预设聚类算法进行预处理得到目标数据集,随机森林对目标数据集即可 具有理想的数据处理效果。另外,为了进一步提高随机森林的分类效果,还可 以预先对随机森林进行优化。其中,优化方式可以是对随机森林的相关参数进 行优化,如随机森林中决策树所涉及到的相关参数。采用优化的随机森林算法 获取的目标推荐对象其准确性较高。
S130、通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
在本发明实施例中,对原始样本数据进行聚类处理得到目标数据集,并采 用优化的随机森林算法对目标数据集进行分类处理得到目标推荐对象后,即可 采用协同过滤推荐算法对目标推荐对象进行TopN推荐,即根据目标推荐对象 的喜好以及其他兴趣相近的用户的选择来给目标推荐对象推荐感兴趣的项目。
本发明实施例通过采用预设聚类算法对原始样本数据进行聚类处理得到目 标数据集,然后通过优化的随机森林算法对目标数据集进行分类处理得到目标 推荐对象,最后通过协同过滤推荐算法对目标推荐对象进行TopN推荐,解决 现有协同过滤推荐算法存在的推荐精度较低的问题,实现降低推荐算法的计算 复杂度,并提高推荐算法的推荐精度。
实施例二
图2是本发明实施例二提供的一种个性化推荐方法的流程图,本实施例以 上述实施例为基础进行具体化,在本实施例中,给出了通过预设聚类算法对原 始样本数据集进行聚类处理得到目标数据集的具体实现方式。相应的,如图2 所示,本实施例的方法可以包括:
S210、通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据 集。
在本发明的一个可选实施例中,所述预设聚类算法可以采用改进的K均值 K-means聚类算法。相应的,S210具体可以包括下述操作:
S211、在所述原始样本数据集中随机选取k个对象作为初始聚类中心。
在本发明实施例中,示例性的,原始样本数据集可以采用D1={x1,x2,…,xn} 的形式表示,xi(1≤i≤n)是d维向量,n是样本数据的数量。在给定分类组数 k(k≤n)的条件下,将原始样本数据分成k类:S={S1,S2,…,Sk}。其中,S集合 中的每个元素均可以随机选取一个数据对象作为一个初始聚类中心,从而实现 在原始样本数据集中随机选取k个对象作为初始聚类中心。
S212、将所述原始样本数据集中的样本按照最小距离原则分配到最近的初 始聚类中心,得到聚类结果。
在本发明实施例中,得到初始聚类中心后,可以将原始样本数据集中的样 本参照最小距离原则,将其分配至最近的初始聚类中心,从而得到对应的聚类 结果。
S213、根据所述聚类结果重新计算k个聚类中心,作为待处理聚类中心。
相应的,在本发明实施例中,可以对得到的聚类结果进行重新计算,具体 可以重新计算k个聚类中心作为新的待处理聚类中心。
S214、对所述待处理聚类中心进行样本细化处理,得到目标聚类中心。
其中,样本细化处理可以是对待处理聚类中心采取的预设细化处理方式, 如删除类别或对类别进行分级处理等。
需要说明的是,当遇到高维度的海量原始样本数据集,k的大小实际很难 被准确估计。为此,本发明实施例可以对待处理聚类中心进行样本细化的改进 处理,从而得到目标聚类中心。
在本发明的一个可选实施例中,所述对所述待处理聚类中心进行样本细化 处理,可以包括:当所述待处理聚类中心中待处理类别的样本数少于第一阈值 时,删除所述待处理类别;当所述待处理聚类中心中待处理类别的样本数大于 第二阈值时,将距离所述待处理类别对应的待处理聚类中心最近的设定数据的 样本作为新的聚类中心。
其中,第一阈值和第二阈值可以根据实际需求进行设定,例如,第一阈值 可以为0.001n,第二阈值可以为0.1n。
在本发明实施例中,在对待处理聚类中心进行样本细化处理时,可以采用 下述两种细化处理操作:当属于某个类别的样本数过少时把这个类别去除,当 属于某个类别的样本数过多且分散程度较大时把这个类别分为两个子类别。相 应的,将类别分为两个子类别可以包括:将距离该类别的待处理聚类中心最近 的2个数据样本作为新的聚类中心。具体的,可以计算每个类别下的方差并选 择出最大的方差∈max,若某个类别的最大方差∈max>ε(ε为设定的方差值)且包 含样本数量多于0.1n,则将该类别进行分裂,将距离该类别的待处理聚类中心 最近的2个数据样本作为新的聚类中心。
在本发明实施例中,可以利用K-means算法求下述公式的最小值:
Figure BDA0001868943600000061
其中,J为每个样本数据到待处理聚类中心的距离,rij表示第i个样本数据 是否属于第j个类别,属于则rij=1,否则rij=0。xi表示第i个数据样本,μj表 示第j个类别的待处理聚类中心。其中,上述公式的迭代方法可以包括:①固定 μj,得到rij。②固定rij,求出最优的μj
S215、判断目标聚类中心是否发送变化,若是,则返回执行S212;否则, 执行S216。
在本发明实施例中,可以将目标聚类中心与初始聚类中心进行对比以判断 目标聚类中心是否发生变化。如果目标聚类中心发生变化,说明还未得到最终 符合要求的目标聚类中心,则可以返回执行将原始样本数据集中的样本按照最 小距离原则分配到最近的初始聚类中心的操作,直至目标聚类中心不再发生变 化。
S216、根据所述目标聚类中心形成所述目标数据集。
在本发明实施例中,当目标聚类中心不再发生变化时,可以根据最终确定 的目标聚类中心形成目标数据集。
S220、通过优化的随机森林算法对所述目标数据集进行分类处理,得到目 标推荐对象。
S230、通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
采用上述技术方案,通过改进的K-means算法对历史数据进行聚类实现对 历史数据的降维处理,从而将高维稀疏的数据集转换成的正常数据集,以实现 降低推荐算法的计算复杂度。
实施例三
图3a是本发明实施例三提供的一种个性化推荐方法的流程图,本实施例以 上述实施例为基础进行具体化,在本实施例中,给出了通过优化的随机森林算 法对所述目标数据集进行分类处理,得到目标推荐对象的具体实现方式。相应 的,如图3a所示,本实施例的方法可以包括:
S310、通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据 集。
S320、通过优化的随机森林算法对所述目标数据集进行分类处理,得到目 标推荐对象。
相应的,S320具体可以包括下述操作:
S321、对所述目标数据集进行数据预处理,得到训练集和测试集。
其中,数据预处理可以是对数据进行诸如去噪、删除异常值及填写缺失值 等预处理操作。
在本发明实施例中,由改进的K-means聚类算法处理原始样本数据集可以 得到目标数据集。在通过优化的随机森林算法对得到的目标数据集进行分类处 理,得到目标推荐对象之前,可以首先对目标数据集进行数据预处理操作,以 使目标数据集中的数据更具准确性,从而保证个性化推荐方法的推荐精度。相 应的,对目标数据集预处理完毕后,可以对目标数据集进行划分从而得到训练 集和测试集。
S322、根据所述训练集构造至少一个目标决策树。
其中,目标决策树可以是根据实际需求构造的多种类型的决策树,如CART(Classification and Regression Trees,分类与回归树)二叉决策树等。
在本发明实施例中,可以根据训练集包括的数据构造至少一个目标决策树, 以根据决策树进一步构造随机森林。具体的,可以从目标数据集抽取训练集, 训练集中每个子样本特征维度为M,每次树进行分裂时指定一个常数m<<M作 为子样本特征个数,从m个子样本特征中选择最优的子样本特征去分裂;每棵 树都最大程度的生长,从而组合成随机森林。
S323、对所述目标决策树采用果蝇优化算法进行参数优化,得到目标参数。
需要说明的是,传统的随机森林构造方法构造出的随机森林的效果可能不 是很好。因此,在本发明实施例中,可以对构成随机森林的目标决策树的部分 参数进行优化。可选的,优化方法可以采用果蝇优化算法。
在本发明的一个可选实施例中,所述对所述目标决策树采用果蝇优化算法 进行参数优化,得到目标参数,可以包括:
采用所述果蝇优化算法对所述目标决策树的数量和建立所述目标决策树所 使用的特征的数量进行优化,得到所述目标参数。
在本发明实施例中,可选的,可以采用果蝇优化算法对目标决策树的数量 和建立目标决策树所使用的特征的数量两种参数进行优化。其中,目标决策树 的数量即为随机森林在利用最大投票数或平均值来预测之前所包括的目标决策 树的总数量;目标决策树所使用的特征的数量即为随机森林允许单个目标决策 树使用特征的最大数量。可以理解的是,当上述两种参数涉及到的数量较多时 可以让模型具备更好的性能,但分类的时间也较长;数量较少时模型的性能可 能不是很好,但分类的时间也较短。
其中,果蝇优化算法的机理源于对果蝇种群搜寻食物源的过程的模拟,分 别利用基于嗅觉原理和视觉原理的觅食行为,设计相应的嗅觉搜索环节和视觉 搜索环节,进而通过两个环节的不断迭代实现果蝇种群的进化,从而获得问题 的最优解或满意解。果蝇优化算法的步骤具体可以包括:
(1)初始化,包括果蝇位置、种群规模N及最大迭代步数maxgen等。
(2)嗅觉随机搜索,赋予果蝇个体利用嗅觉搜寻食物与随机方向与距离。
(3)初步计算,在果蝇种群中心附近,随机产生若干个果蝇个体,由于无 法得知食物的位置,需先估计与原点之距离,再计算味道浓度判定值(是距离 的倒数)。
(4)根据味道浓度的判定值代入味道浓度判定函数,计算当前每个果蝇个 体的气味浓度值。
(5)根据气味浓度值,找出当前种群中气味浓度最大(或者最小)的果蝇 个体。
(6)视觉搜索阶段,记录并保持最佳味道浓度值与其坐标,此时果蝇群体 向该位置飞去。
(7)迭代寻优。首先判断是否达到终止条件δ=maxgen,其中,δ表示迭 代次数。当δ<maxgen时,则重复步骤(2)~步骤(5),并判断此时的最佳味道浓 度值是否优于前一次迭代的最佳味道浓度,若是则执行步骤(6),否则继续重复 步骤(2)~步骤(5),循环该过程,直到当δ=maxgen时,结束算法。
如图3b所示,在采用果蝇优化算法对目标决策树的数量和建立目标决策树 所使用的特征的数量两种参数进行优化时,数据集上可以结合5折交叉验证的 方法进行优化。具体的,可以从目标数据集中选择预设数量的样本作为训练集, 剩余的数据集作为测试集来评估模型。其中,预设数量可以是根据实际需求设 定的百分比。例如,在目标数据集中随机选取80%的数据作为训练集,剩余20% 的数据作为测试集来评估模型。反复执行上述操作,直至达到设定训练测试次 数或者参数不再发生变化。其中,设定训练测试次数同样可以根据实际需求设 定,如100次或1000次等,本发明实施例对此并不进行限制。反复训练测试至 设定训练测试次数或者参数不再发生变化后,可以将每次训练测试所得到的参 数求平均值,并将求得的平均值作为最终的参数。
在本发明的一个可选实施例中,所述目标决策树可以包括二叉决策树。示 例性的,在本发明实施例中,可以利用基尼指数特征选择构造CART二叉决策 树,基尼指数公式如下:
Figure BDA0001868943600000091
其中,Gini(B)表示集合B的不确定性,GiniR(B)表示经过R=r分割后集合 B的不确定性,B1和B2表示集合B经分割后形成的两个子集。随机森林中的每 棵CART决策树都是通过不断遍历这棵树的特征子集的所有可能的分割点,寻 找Gini系数最小的特征的分割点,将数据集分成两个子集,直至满足停止条件 为止。
对于一般的决策树,假如总共有K类,样本属于第k类的概率为:pk,则 该概率分布的基尼指数为:
Figure BDA0001868943600000101
基尼指数越大,说明不确定性就越大;基尼系数越小,不确定性越小,数 据分割越彻底、越干净。
S324、根据所述目标参数构建目标模型,并根据所述目标模型和所述测试 集进行预测,得到所述目标推荐对象。
相应的,在采用果蝇优化算法对随机森林进行参数优化后,则可以利用得 到的目标参数构建最优的目标模型,然后利用测试集对构建的目标模型进行预 测从而得到最终的测试结果作为目标推荐对象。通过优化的随机森林算法能够 最大程度的找到需要推荐服务的目标推荐对象,从而提高推荐质量。
S330、通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
采用上述技术方案,通过果蝇优化算法对随机森林算法进行优化,能够提 高随机森林算法的分类结果,进而提高推荐算法的推荐精度。
实施例四
图4a是本发明实施例四提供的一种个性化推荐方法的流程图,本实施例以 上述实施例为基础进行具体化,在本实施例中,给出了通过协同过滤推荐算法 对所述目标推荐对象进行TopN推荐的具体实现方式。相应的,如图4a所示, 本实施例的方法可以包括:
S410、通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据 集。
S420、通过优化的随机森林算法对所述目标数据集进行分类处理,得到目 标推荐对象。
S430、通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
相应的,S430具体可以包括下述操作:
S431、根据对象-评分矩阵建立对象相似度矩阵和推荐项目相似度矩阵。
其中,对象可以是本发明实施例中个性化推荐方法的所涉及到的对象,如, 可以将用户作为对象。对象-评分矩阵则可以是用户-评分矩阵,对象相似度矩阵 可以是用户相似度矩阵。推荐项目可以是向对象推荐的物品、产品或其他资源 等,如购物商品或影视剧等资源。
在本发明实施例中,在通过协同过滤推荐算法对所述目标推荐对象进行 TopN推荐之前,首先要根据对象-评分矩阵建立对象相似度矩阵和推荐项目相 似度矩阵。具体的,可以首先利用对象评分数据构建对象-评分矩阵,然后利用 余弦相似度计算对象和推荐项目的相似度矩阵。假设将用户作为对象,将产品 作为推荐项目,则两个用户(或产品)表示为xi和xj(i≠j),其余弦相似度 计算可以表示为:
Figure BDA0001868943600000111
S432、根据所述对象相似度矩阵或所述推荐项目相似度矩阵对所述目标推 荐对象选出满足相似度需求的设定数量的中间对象。
其中,设定数量可以根据实际需求进行设定,如设置为k,k为正整数。中 间对象是与目标推荐对象具有一定相似度的对象,例如,目标推荐对象为用户 A,其喜欢的影视剧作品为《如懿传》,则中间对象可以是用户B,其喜欢的影 视剧作品为《画皮》。用户A和用户B所喜欢的影视剧作品均包括主演:周迅。
相应的,求出对象相似度矩阵和推荐项目相似度矩阵后,针对目标推荐对 象,可以为其选出最相似的k个对象作为中间对象。
S433、根据所述中间对象以及对象-评分矩阵形成中间对象集;其中,所述 中间对象集中包括中间对象感兴趣的项目。
具体的,可以将中间对象以及对象-评分矩阵形成一个中间对象集,其中, 中间对象集可以采用集合S(μ,k)表示。集合S(μ,k)还可以同时包括中间对象所 感兴趣的项目。
S434、提取所述中间对象集中所述中间对象感兴趣的项目,并在所述项目 中删除目标推荐对象感兴趣的项目,得到目标项目。
其中,目标项目可以是预测的目标推荐对象可能感兴趣的项目。
在本发明实施例中,可以将中间对象集中所有对象感兴趣的项目提取出来, 然后在提取的所有项目中删除目标推荐对象所感兴趣的项目,得到处理后的目 标项目。
S435、对所述目标项目进行评分与相似度加权,并计算所述目标推荐对象 对所述目标项目的兴趣度,根据所述兴趣度对所述目标项目进行排序。
进一步的,得到处理后的目标项目后,可以对目标项目进行评分与相似度 加权,并计算目标推荐对象对目标项目的兴趣度,然后根据计算所得的兴趣度 对目标项目进行排序整理。
S436、根据所述排序结果对所述目标推荐对象进行TopN推荐。
最后,可以根据目标项目的排序结果对目标推荐对象进行TopN推荐。其 中,对于每个可能推荐的项目i,对象μ对其的感兴趣的程度可以用如下公式计 算:
Figure BDA0001868943600000121
其中,rvi表示对象v对i的喜欢程度,即对象v对i的评分,wμv表示对象μ和 对象υ之间的相似度。设N(μ)为对象μ喜欢的项目集合,N(υ)为对象υ喜欢的项 目集合,那么μ和υ之间可以利用公式
Figure BDA0001868943600000122
计算相似度。
在一个具体的例子中,采用MovieLens数据集作为原始样本数据集。 MovieLens数据集是一个关于电影评分的数据集,MovieLens(1M)数据集包 含由6040个用户对3900部电影所作出的1000209个评分(从1到5)。评分越 高代表用户越喜欢该电影;每个用户至少评分20部电影。同时,该数据集包含 用户的人口统计信息(年龄,性别,职业及邮编等),电影数据表(电影id、标 题及电影类型等),电影评分表(用户id、电影id、评分1-5分及时间标签等)。
采用5折交叉验证方法,将MovieLens数据集中80%的数据作为训练集, 20%的数据作为测试集。推荐质量的评价标准采用统计精度度量方法中的均方 误差(RMSE)进行计算。均方误差通过计算预测用户的评分与用户实际评分 之间的偏差来度量预测的准确性,偏差越小则推荐质量越高。假设预测用户的 评分集合是{α1,α2,…,αn},用户的真实的评分集合是{β1,β2,…,βn},则均方误 差的计算公式为:
Figure BDA0001868943600000131
图4b是本发明实施例提供的一种个性化推荐方法的流程图,具体的,如图 4b所示,针对上述原始样本数据集D1,本发明实施例所提供的个性化推荐方法 的具体操作可以包括:
步骤1、采集用户的注册信息、浏览记录及评分数据等信息。
步骤2、数据预处理,删除一些噪声、异常值,填写缺失值等。
步骤3、用改进的K-means算法对处理后的原始样本数据集进行聚类降维, 得到数据集D2
步骤4、计算每一特征的重要性时,按照重要性降序排列,寻找对分类最 相关的一系列特征,剔除不重要特征;在建立子分类器时,利用选择得到的对 分类影响最重要的特征来构造目标决策树,多棵目标决策树组成新的随机森林, 直至不再变化,得到需要推荐产品的目标用户。同时利用果蝇优化算法优化随 机森林,以便准确得到需要推荐产品的目标用户。
如图4b所示,采用基于协同过滤推荐算法分类的具体过程如下:
步骤1、根据用户-评分矩阵建立用户相似度矩阵和产品相似度矩阵。
步骤2、针对目标用户μ,选出最相似的k个用户,用集合S(μ,k)表示,将 S中所有用户喜欢的物品提取出来并去除目标用户μ已经喜欢的物品。
步骤3、对余下的物品进行评分与相似度加权,并计算用户对产品的兴趣 度,将得到的结果进行排序。
步骤4、由排序结果对目标用户μ进行TopN推荐。
最后,还可以对模型进行评价。
图4c是本发明实施例三提供的一种个性化推荐方法与传统的协同过滤方法 在K-means的k取不同的值时推荐质量的对比效果示意图。从图4c中可以看出, 本发明实施例所提供的个性化推荐方法与传统的协同过滤方法在K-means的k 取不同的值时,具有更低的均方误差,其推荐质量更高。
采用上述技术方案,通过构建的对象相似度矩阵和推荐项目相似度矩阵对 目标推荐对象选出满足相似度需求的设定数量的中间对象,以根据中间对象以 及对象-评分矩阵形成中间对象集,对中间对象集进行项目筛选后进行评分与相 似度加权,并计算目标推荐对象对目标项目的兴趣度以对目标项目进行排序, 最后根据排序结果对目标推荐对象进行TopN推荐,能够有效提高推荐算法的 推荐精度。
实施例五
图5是本发明实施例五提供的一种个性化推荐装置的示意图,如图5所示, 所述装置包括:数据集获取模块510、推荐对象获取模块520以及对象推荐模 块530,其中:
数据集获取模块510,用于通过预设聚类算法对原始样本数据集进行聚类 处理,得到目标数据集;
推荐对象获取模块520,用于通过优化的随机森林算法对所述目标数据集 进行分类处理,得到目标推荐对象;
对象推荐模块530,用于通过协同过滤推荐算法对所述目标推荐对象进行 TopN推荐。
本发明实施例通过采用预设聚类算法对原始样本数据进行聚类处理得到目 标数据集,然后通过优化的随机森林算法对目标数据集进行分类处理得到目标 推荐对象,最后通过协同过滤推荐算法对目标推荐对象进行TopN推荐,解决 现有协同过滤推荐算法存在的推荐精度较低的问题,实现降低推荐算法的计算 复杂度,并提高推荐算法的推荐精度。
可选的,所述预设聚类算法为改进的K均值(K-means)聚类算法;数据 集获取模块510,包括:
初始聚类中心选取单元,用于在所述原始样本数据集中随机选取k个对象 作为初始聚类中心;
聚类结果获取单元,用于将所述原始样本数据集中的样本按照最小距离原 则分配到最近的初始聚类中心,得到聚类结果;
待处理聚类中心获取单元,用于根据所述聚类结果重新计算k个聚类中心, 作为待处理聚类中心;
目标聚类中心获取单元,用于对所述待处理聚类中心进行样本细化处理, 得到目标聚类中心;
返回执行单元,用于返回执行将所述原始样本数据集中的样本按照最小距 离原则分配到最近的初始聚类中心的操作,直至所述目标聚类中心不再发生变 化;
目标数据集获取单元,用于根据所述目标聚类中心形成所述目标数据集。
可选的,目标聚类中心获取单元,具体用于当所述待处理聚类中心中待处 理类别的样本数少于第一阈值时,删除所述待处理类别;
当所述待处理聚类中心中待处理类别的样本数大于第二阈值时,将距离所 述待处理类别对应的待处理聚类中心最近的设定数据的样本作为新的聚类中心。
可选的,推荐对象获取模块520,包括:
数据集获取单元,用于对所述目标数据集进行数据预处理,得到训练集和 测试集;
目标决策树构造单元,用于根据所述训练集构造至少一个目标决策树;
目标参数获取单元,用于对所述目标决策树采用果蝇优化算法进行参数优 化,得到目标参数;
目标推荐对象获取单元,用于根据所述目标参数构建目标模型,并根据所 述目标模型和所述测试集进行预测,得到所述目标推荐对象。
可选的,目标参数获取单元,具体用于采用所述果蝇优化算法对所述目标 决策树的数量和建立所述目标决策树所使用的特征的数量进行优化,得到所述 目标参数。
可选的,所述目标决策树包括二叉决策树。
可选的,对象推荐模块530,包括:
相似度矩阵建立单元,用于根据对象-评分矩阵建立对象相似度矩阵和推荐 项目相似度矩阵;
中间对象选取单元,用于根据所述对象相似度矩阵或所述推荐项目相似度 矩阵对所述目标推荐对象选出满足相似度需求的设定数量的中间对象;
中间对象集构建单元,用于根据所述中间对象以及对象-评分矩阵形成中间 对象集;其中,所述中间对象集中包括中间对象感兴趣的项目;
目标项目获取单元,用于提取所述中间对象集中所述中间对象感兴趣的项 目,并在所述项目中删除目标推荐对象感兴趣的项目,得到目标项目;
目标项目排序单元,用于对所述目标项目进行评分与相似度加权,并计算 所述目标推荐对象对所述目标项目的兴趣度,根据所述兴趣度对所述目标项目 进行排序;
推荐单元,用于根据所述排序结果对所述目标推荐对象进行TopN推荐。
上述个性化推荐装置可执行本发明任意实施例所提供的个性化推荐方法, 具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细 节,可参见本发明任意实施例提供的个性化推荐方法。
实施例六
图6为本发明实施例六提供的一种计算机设备的结构示意图。图6示出了 适于用来实现本发明实施方式的计算机设备612的框图。图6显示的计算机设 备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612 的组件可以包括但不限于:一个或者多个处理器616,存储装置628,连接不同 系统组件(包括存储装置628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器 控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总 线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构 (Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任 何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移 动的和不可移动的介质。
存储装置628可以包括易失性存储器形式的计算机系统可读介质,例如随 机存取存储器(Random Access Memory,RAM)630和/或高速缓存存储器632。 计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算 机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易 失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可 以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对 可移动非易失性光盘(例如只读光盘(Compact Disc-Read OnlyMemory, CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或 者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个 或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序 产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置 以执行本发明各实施例的功能。
具有一组(至少一个)程序模块626的程序636,可以存储在例如存储装 置628中,这样的程序模块626包括但不限于操作系统、一个或者多个应用程 序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括 网络环境的实现。程序模块626通常执行本发明所描述的实施例中的功能和/或 方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、 摄像头、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设 备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计 算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可 以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络 适配器620与一个或者多个网络(例如局域网(Local AreaNetwork,LAN), 广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当 明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块, 包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁 盘阵列(Redundant Arrays ofIndependent Disks,RAID)系统、磁带驱动器以及 数据备份存储系统等。
处理器616通过运行存储在存储装置628中的程序,从而执行各种功能应 用以及数据处理,例如实现本发明上述实施例所提供的个性化推荐方法。
也即,所述处理单元执行所述程序时实现:通过预设聚类算法对原始样本 数据集进行聚类处理,得到目标数据集;通过优化的随机森林算法对所述目标 数据集进行分类处理,得到目标推荐对象;通过协同过滤推荐算法对所述目标 推荐对象进行TopN推荐。
实施例七
本发明实施例七还提供一种存储计算机程序的计算机存储介质,所述计算 机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的个性化 推荐方法:通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据 集;通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐 对象;通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质 的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储 介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、 红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存 储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、 便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory,ROM)、可擦式可编程只读存储器((Erasable ProgrammableRead Only Memory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、 光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机 可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行 系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据 信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种 形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读 的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算 机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用 或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括—— 但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的 任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计 算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、 Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似 的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计 算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计 算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情 形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网 (WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员 会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进 行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽 然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以 上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例, 而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种个性化推荐方法,其特征在于,包括:
通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;
通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象;
通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
2.根据权利要求1所述的方法,其特征在于,所述预设聚类算法为改进的K均值K-means聚类算法;
所述通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集,包括:
在所述原始样本数据集中随机选取k个对象作为初始聚类中心;
将所述原始样本数据集中的样本按照最小距离原则分配到最近的初始聚类中心,得到聚类结果;
根据所述聚类结果重新计算k个聚类中心,作为待处理聚类中心;
对所述待处理聚类中心进行样本细化处理,得到目标聚类中心;
返回执行将所述原始样本数据集中的样本按照最小距离原则分配到最近的初始聚类中心的操作,直至所述目标聚类中心不再发生变化;
根据所述目标聚类中心形成所述目标数据集。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理聚类中心进行样本细化处理,包括:
当所述待处理聚类中心中待处理类别的样本数少于第一阈值时,删除所述待处理类别;
当所述待处理聚类中心中待处理类别的样本数大于第二阈值时,将距离所述待处理类别对应的待处理聚类中心最近的设定数据的样本作为新的聚类中心。
4.根据权利要求1-3任一所述的方法,其特征在于,所述通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象,包括:
对所述目标数据集进行数据预处理,得到训练集和测试集;
根据所述训练集构造至少一个目标决策树;
对所述目标决策树采用果蝇优化算法进行参数优化,得到目标参数;
根据所述目标参数构建目标模型,并根据所述目标模型和所述测试集进行预测,得到所述目标推荐对象。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标决策树采用果蝇优化算法进行参数优化,得到目标参数,包括:
采用所述果蝇优化算法对所述目标决策树的数量和建立所述目标决策树所使用的特征的数量进行优化,得到所述目标参数。
6.根据权利要求4或5所述的方法,其特征在于,所述目标决策树包括二叉决策树。
7.根据权利要求1所述的方法,其特征在于,所述通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐,包括:
根据对象-评分矩阵建立对象相似度矩阵和推荐项目相似度矩阵;
根据所述对象相似度矩阵或所述推荐项目相似度矩阵对所述目标推荐对象选出满足相似度需求的设定数量的中间对象;
根据所述中间对象以及对象-评分矩阵形成中间对象集;其中,所述中间对象集中包括中间对象感兴趣的项目;
提取所述中间对象集中所述中间对象感兴趣的项目,并在所述项目中删除目标推荐对象感兴趣的项目,得到目标项目;
对所述目标项目进行评分与相似度加权,并计算所述目标推荐对象对所述目标项目的兴趣度,根据所述兴趣度对所述目标项目进行排序;
根据所述排序结果对所述目标推荐对象进行TopN推荐。
8.一种个性化推荐装置,其特征在于,包括:
数据集获取模块,用于通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;
推荐对象获取模块,用于通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象;
对象推荐模块,用于通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
9.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的个性化推荐方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的个性化推荐方法。
CN201811367415.7A 2018-11-16 2018-11-16 一种个性化推荐方法、装置、计算机设备及存储介质 Pending CN111209469A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811367415.7A CN111209469A (zh) 2018-11-16 2018-11-16 一种个性化推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811367415.7A CN111209469A (zh) 2018-11-16 2018-11-16 一种个性化推荐方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN111209469A true CN111209469A (zh) 2020-05-29

Family

ID=70787606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811367415.7A Pending CN111209469A (zh) 2018-11-16 2018-11-16 一种个性化推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111209469A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767469A (zh) * 2020-06-17 2020-10-13 中国建设银行股份有限公司 一种养老服务推荐方法和装置
CN113159129A (zh) * 2021-03-24 2021-07-23 国网上海市电力公司 一种电力用户的分类方法、装置、设备及存储介质
CN113268665A (zh) * 2021-05-24 2021-08-17 平安科技(深圳)有限公司 基于随机森林的信息推荐方法、装置、设备及存储介质
CN116304886A (zh) * 2023-05-12 2023-06-23 江苏网进科技股份有限公司 一种基于机器学习的元数据智能分类方法和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070078849A1 (en) * 2005-08-19 2007-04-05 Slothouber Louis P System and method for recommending items of interest to a user
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐系统
CN105389713A (zh) * 2015-10-15 2016-03-09 南京大学 基于用户历史数据的移动流量套餐推荐算法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070078849A1 (en) * 2005-08-19 2007-04-05 Slothouber Louis P System and method for recommending items of interest to a user
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐系统
CN105389713A (zh) * 2015-10-15 2016-03-09 南京大学 基于用户历史数据的移动流量套餐推荐算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王涛,刘建国: "《摄影测量与遥感》", 31 August 2018 *
赵东: "基于群智能优化的机器学习方法研究及应用", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767469A (zh) * 2020-06-17 2020-10-13 中国建设银行股份有限公司 一种养老服务推荐方法和装置
CN113159129A (zh) * 2021-03-24 2021-07-23 国网上海市电力公司 一种电力用户的分类方法、装置、设备及存储介质
CN113268665A (zh) * 2021-05-24 2021-08-17 平安科技(深圳)有限公司 基于随机森林的信息推荐方法、装置、设备及存储介质
CN116304886A (zh) * 2023-05-12 2023-06-23 江苏网进科技股份有限公司 一种基于机器学习的元数据智能分类方法和存储介质

Similar Documents

Publication Publication Date Title
CN108073568B (zh) 关键词提取方法和装置
CN107423442B (zh) 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备
CN105224699B (zh) 一种新闻推荐方法及装置
US11301884B2 (en) Seed population diffusion method, device, information delivery system and storage medium
CN113158023B (zh) 基于混合推荐算法的公共数字生活精准分类服务方法
CN111209469A (zh) 一种个性化推荐方法、装置、计算机设备及存储介质
CN112348629A (zh) 一种商品信息推送方法和装置
CN110866782B (zh) 一种客户分类方法、系统以及电子设备
CN112395487B (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN110929166A (zh) 一种内容推荐的方法、电子设备和存储介质
CN105225135B (zh) 潜力客户识别方法以及装置
CN111444304A (zh) 搜索排序的方法和装置
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN108665148B (zh) 一种电子资源质量评价方法、装置和存储介质
CN112905897B (zh) 相似用户确定方法、向量转化模型、装置、介质及设备
CN114741603A (zh) 基于用户聚类和商品聚类的混合协同过滤推荐算法
CN114417058A (zh) 一种视频素材的筛选方法、装置、计算机设备和存储介质
CN113408301A (zh) 一种样本处理方法、装置、设备和介质
CN113326432A (zh) 一种基于决策树与推荐方法的模型优选方法
Xu Machine Learning for Flavor Development
Latha et al. Product recommendation using enhanced convolutional neural network for e-commerce platform
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
CN113762298B (zh) 相似人群扩展方法和装置
CN111651643A (zh) 候选内容的处理方法及相关设备
CN113704617A (zh) 物品推荐方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200529