CN109933678A - 艺术品推荐方法、装置、可读介质及电子设备 - Google Patents
艺术品推荐方法、装置、可读介质及电子设备 Download PDFInfo
- Publication number
- CN109933678A CN109933678A CN201910170610.9A CN201910170610A CN109933678A CN 109933678 A CN109933678 A CN 109933678A CN 201910170610 A CN201910170610 A CN 201910170610A CN 109933678 A CN109933678 A CN 109933678A
- Authority
- CN
- China
- Prior art keywords
- user
- genre labels
- potential group
- group
- art work
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种艺术品推荐方法、装置、可读介质及电子设备,首先,对艺术品的图片风格特征进行学习后在进行聚类,使得风格相近的艺术品被归类与降维,达到了解决数据的稀疏度问题;然后,特征划分狄利克雷过程模型可以对用户群组的偏好进行筛选,得到可以代表用户群组的群兴趣的风格标签,再根据这些风格标签对用户群组的群兴趣进行更细粒度地划分;最后,根据得到的各潜在群组的风格标签分布以及用户属于各潜在群组的概率分布进行个性化推荐,并生成推荐列表。本发明实施例的技术方案可以有效提升预测的准确率和召回率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种艺术品推荐方法、装置、可读介质及电子设备。
背景技术
随着互联网的发展,出现了越来越多的虚拟群组,比如购物群组、兴趣群组、社交群组等。群组用户在一定程度上可能存在着联系和相似性,通过这些相似性和联系获得群组兴趣偏好对于个性化推荐来说具有十分重要的意义。
现有的推荐方法是将群组中的用户文件组合为群组文件,并依据该群组文件为群组中的单个用户生成推荐列表。然而,在实际获取群组的兴趣偏好时,不能简单地将群组中的单个用户偏好进行加和,用户收藏和\或购买的全部艺术品并不都是可以表征群组的兴趣偏好的,此外还需要考虑到用户兴趣分布的差异性等。
发明内容
有鉴于此,本发明实施例提供了一种艺术品推荐方法、装置、可读介质及电子设备。
第一方面,本发明实施例提供了一种艺术品推荐方法,包括:
提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签信息,具体包括:
通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布,具体包括:
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
且
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述计算所述用户在每一个风格标签上的得分,具体包括:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离。
第二方面,本发明实施例提供了一种艺术品推荐装置,包括:
提取模块,用于提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
计算模块,用于根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
推荐模块,用于计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取模块具体用于:
通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述计算模块具体用于执行:
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述推荐模块具体用于:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:
评分模块,用于通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离。
第三方面,本发明提供了一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面中任一所述的方法。
第四方面,本发明提供了一种电子设备,包括:处理器、存储器和总线;
所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述电子设备运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述处理器执行如第一方面中任一所述的方法。
上述技术方案中的一个技术方案具有如下有益效果:
本发明实施例的方法中,首先,对艺术品的图片风格特征进行学习后在进行聚类,使得风格相近的艺术品被归类与降维,达到了解决数据的稀疏度问题;然后,特征划分狄利克雷过程模型可以对用户群组的偏好进行筛选,得到可以代表用户群组的群兴趣的风格标签,再根据这些风格标签对用户群组的群兴趣进行更细粒度地划分;最后,根据得到的各潜在群组的风格标签分布以及用户属于各潜在群组的概率分布进行个性化推荐,并生成推荐列表。从而可以有效提升预测的准确率和召回率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的艺术品推荐方法的一种流程示意图;
图2为本发明实施例所提供的艺术品推荐方法的另一种流程示意图;
图3为本发明实施例所提供的艺术品风格提取与标签化的流程示意图;
图4为本发明实施例所提供的艺术品推荐装置的功能方块图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于理解,下面对本发明实施例所涉及的背景概念稍作解释。
经典推荐系统
协同过滤是推荐系统中使用最为广泛的方法,其所基于的假设是有着相似兴趣的用户在未来可能有着相似的行为。目前协同过滤算法可以分为两类:基于记忆的和基于模型的。基于记忆的方法可以被归类为基于用户的或者基于物品相似度的协同过滤算法。基于用户的协同过滤算法是利用评分数据集来查找目标用户的相似用户,并通过对相似用户的项进行加权组合来预测候选项的得分。而基于模型的协同过滤方法使用机器学习技术构建推荐模型,如聚类、矩阵分解、贝叶斯个性化排名模型等。
主题模型推荐系统
随着用户数据的多样化,多维化,我们可以不再只依靠用户评分数据进行推荐,然而,多维化的数据也对推荐系统提出了新的挑战。主题模型的加入使得处理用户文件有了新的角度和新的思路。Iwata T等人认为消费者的兴趣及对产品的偏好会随着时间的变化而演变,在主题模型中加入了时间因素预测消费者在某一时间点购买的产品。主题模型中,主题可以提现消费者的购买趋势,主题受消费者购买的产品及价格的影响,因此主题模型可以分析价格分布对于消费者购买行为的影响。基于主题模型可以将用户评论和评分融合,缓和冷启动的问题。结合消费者的购买历史数据及消费者的特征,考虑消费者异质性的主题模型可以预测出消费者下一个购买的产品。主题模型的引入使得推荐系统的性能和可扩展性得到了很大的提升。
基于此,本发明实施例提供了一种艺术品推荐方法,如图1所示,该方法包括以下步骤:
S101、提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
S102、根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
S103、计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
需要说明的是,步骤S101中具体过程可参考图2和图3,图2为本发明实施例所提供的艺术品推荐方法的另一种流程示意图,图3为本发明实施例所提供的艺术品风格提取与标签化的流程示意图。S101具体通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
具体实施时,步骤S101中以用户群组中全部用户的收藏列表中艺术品图片作为输入,残差块中每个矩形图案表示卷积。设l+1层的输入为输出为则:
其中,H(·)是激活函数,C(·)是卷积运算,b是偏置量,M表示卷积核,θ是卷积运算的相关参数,如卷积补零项、步长等。
深度残差网络每次处理一张图片,在全连接层输出其特征向量。然后把所有图片的特征向量作为Kmeans算法的输入,Kmeans将特征相似的图片归为一类,赋予类别标签。下面对Kmeans对艺术品进行聚类的具体步骤进行说明:
1)随机选取k个中心点;
2)遍历所有数据,并计算其到各个中心的距离,将每个数据划分到最近的中心点;
3)计算每个簇的平均值,并作为新的中心点;
4)重复步骤2-3,直到中心点不再改变。
经过Kmeans降维后得到的用户的风格标签文档作为特征划分狄利克雷过程模型FPDPMM的输入。
具体实施时,步骤S102具体包括
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
且
在马尔科夫链达到平稳状态后,初始的用户群组将被划分为多个潜在群组。
需要说明的是,相较于传统的DPMM模型,本发明FPDPMM模型引入了一个潜在的二元向量τ={τ1,τ2,...,τL},该变量用于把一个潜在群组的兴趣划分为两个部分,即可以代表该潜在群组的群兴趣的风格标签和不可以代表该潜在群组的群兴趣的风格标签。Ω表示可以代表潜在群组的群兴趣的风格标签的集合。则可以定义变量:
其中,τl是二元控制变量,用来表示风格标签l是否可以代表该潜在群组的群兴趣,τl相互独立,且服从伯努利分布B(1,ω),ω为每个风格标签可以代表该潜在群组的群兴趣的先验概率。
那么一次迭代至少包括以下步骤:
1)抽取τl|ω~B(1,ω),l=1,2,...,L;
2)抽取|ui|~Poisson(ξ),i=1,2,...,I;
3)抽取i=1,2,...,I;
4)抽取
5)抽取θ|α~Dirichlet(α);
6)抽取ci|θ~Discrete(θ1,θ2,...,θK,θK+1),i=1,2,...,I;
7)统计得到的潜在群组的数量,并更新K值;
8)对于i=1,2,...,I,
抽取
抽取
步骤b中,假设作为群组群兴趣背景的风格标签(即可以代表群组群兴趣的风格标签)和可以代表群组群兴趣的风格标签之间相互独立,则用户ui的条件概率密度函数如下所示:
由于风格标签列表通常很大,根据大数定律及所以有:
因此,我们可以近似地认为:
由于Dirichlet分布与多项式分布共轭,在给定{c1,c2,...,cI}与τ的前提下,用户群组的收藏数据集合U的生成概率密度函数为:
具体实施时,步骤S103中具体包括:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。然后向用户推荐得分topN的风格标签所对应的艺术品。
优选地,本发明采取的评分策略是距离该风格标签的聚类中心的距离越近的艺术品的得分越高。具体为:
通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离,是为了保证分母不为0。
本发明实施例提供的技术方案具有以下有益效果:
本发明实施例的方法中,首先,对艺术品的图片风格特征进行学习后在进行聚类,使得风格相近的艺术品被归类与降维,达到了解决数据的稀疏度问题;然后,特征划分狄利克雷过程模型可以对用户群组的偏好进行筛选,得到可以代表用户群组的群兴趣的风格标签,再根据这些风格标签对用户群组的群兴趣进行更细粒度地划分;最后,根据得到的各潜在群组的风格标签分布以及用户属于各潜在群组的概率分布进行个性化推荐,并生成推荐列表。从而可以有效提升预测的准确率和召回率。
基于相同的构思,本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图4,其为本发明实施例所提供的一种艺术品推荐装置,如图4所示,该装置包括:
提取模块410,用于提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
计算模块420,用于根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
推荐模块430,用于计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取模块具体用于:
通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述计算模块具体用于执行:
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述推荐模块具体用于:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:
评分模块,用于通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离。
由于本实施例中的各单元模块能够执行图1所示的方法,本实施例未详细描述的部分,可参考对图1的相关说明。
图4是本发明的一个实施例电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry StandardArchitecture,工业标准体系结构)总线、PCI(Per-ipheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended I-ndustryStandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,也可从其它设备上获取相应的计算机程序,以在逻辑层面上形成艺术品推荐装置。处理器,执行存储器所存放的程序,以通过执行的程序实现本发明任一实施例中提供的艺术品推荐方法。
本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行本发明任一实施例中提供的艺术品推荐方法。
上述如本发明图4所示实施例提供的艺术品推荐装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行本发明任一实施例中提供的艺术品推荐方法。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元或模块分别描述。当然,在实施本发明时可以把各单元或模块的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、艺术品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、艺术品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、艺术品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (12)
1.一种艺术品推荐方法,其特征在于,所述方法包括:
提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
2.根据权利要求1所述的方法,其特征在于,所述提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签信息,具体包括:
通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布,具体包括:
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
且
4.根据权利要求1所述的方法,其特征在于,所述计算所述用户在每一个风格标签上的得分,具体包括:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离。
6.一种艺术品推荐装置,其特征在于,所述装置包括:
提取模块,用于提取用户收藏列表中各艺术品的图片特征向量,并基于各所述图片特征向量进行聚类得出用户的风格标签文档;
计算模块,用于根据各所述用户的风格标签文档,通过特征划分狄利克雷过程模型将用户群组划分为若干潜在群组,并确定各所述潜在群组的风格标签分布以及所述用户属于各潜在群组的概率分布;
推荐模块,用于计算所述用户在每一个风格标签上的得分,根据所述得分通过预设规则向用户推送相应的艺术品。
7.根据权利要求6所述的装置,其特征在于,所述提取模块具体用于:
通过深度残差网络提取户艺术品列表中各艺术品的图片特征向量,并基于所述图片特征向量通过K-means算法进行聚类得出用户的风格标签信息。
8.根据权利要求6所述的装置,其特征在于,所述计算模块具体用于执行:
步骤a、设置超参数α、β,先验参数λ、ω,初始K值,迭代次数;
步骤b、建立收藏数据集合U的生成概率密度函数:
步骤c、通过如下公式计算出风格标签l可以作为潜在群组的群兴趣的概率:
并对可以代表潜在群组的群兴趣的风格标签列表进行更新;
步骤d、根据采样结果更新通过如下公式进行计算:
步骤e、根据采样结果更新通过如下公式进行计算:
步骤f、根据采样结果更新θ,θ通过如下公式进行计算:
步骤g、更新用户所属类别:
以及,
第i个用户属于第k个潜在群组的概率为:
以及,
第i个用户属于第k+1个潜在群组的概率为:
然后通过轮盘赌选择用户i所属的潜在群组,若出现用户属于新的潜在群组情形,则更新K值;
步骤h、判断步骤f中的计算结果是否满足预设收敛条件,若是,执行步骤i,否则返回步骤c;
步骤i、输出用户i属于各潜在群组的概率分布:
以及,
潜在群组k的风格标签分布:
其中,ci为第i个用户所属的潜在群组的索引;
τ为二元变量且τ={τ1,τ2,...,τL},Ω表示可以代表潜在群组的群兴趣的风格标签的集合;
L为风格标签数量,l为风格标签,l=1,2,...,L,l的值表示其对应的风格标签在风格标签列表{1,2,3,...,L}中的索引;
I是用户数量,i=1,2,...,I,|ui|为第i个用户的收藏列表中的艺术品总数,uil为第l个风格标签在ui中出现的次数,ui={ui1,ui2,...,uiL}为第i个用户的风格标签文档,U={u1,u2,...,uI}为用户群组的收藏数据集合;
K为当前潜在群组的数量,k=1,2,...,K;
βl为潜在群组中的风格标签l的概率,θ为潜在群组的概率分布;
为第i个用户所属潜在群组的多项式,为用户群组中所有用户收藏列表中不能够代表用户群组的群兴趣的艺术品风格标签的分布,为潜在群组k的风格标签分布;
H(ci=k)为指示函数,当ci=k时,H(ci=k)=1,否则,H(ci=k)=0;
f(τ|U,c1,c2,...,cI)∝f(U|c1,c2,...,cI,τ)p(τ);
且
9.根据权利要求6所述的装置,其特征在于,所述推荐模块具体用于:
通过公式计算出用户i在风格标签上l的得分,其中,为第i个用户属于潜在群组k的概率,为潜在群组k中风格标签l的分布。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
评分模块,用于通过公式计算出艺术品j在风格标签上l的得分,其中,为第j个艺术品到风格标签上l的聚类中心的距离。
11.一种可读介质,其特征在于,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如权利要求1至5中任一所述的方法。
12.一种电子设备,其特征在于,包括:处理器、存储器和总线;所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述电子设备运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述处理器执行如权利要求1至5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910170610.9A CN109933678B (zh) | 2019-03-07 | 2019-03-07 | 艺术品推荐方法、装置、可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910170610.9A CN109933678B (zh) | 2019-03-07 | 2019-03-07 | 艺术品推荐方法、装置、可读介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109933678A true CN109933678A (zh) | 2019-06-25 |
CN109933678B CN109933678B (zh) | 2021-04-06 |
Family
ID=66986556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910170610.9A Active CN109933678B (zh) | 2019-03-07 | 2019-03-07 | 艺术品推荐方法、装置、可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933678B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457576A (zh) * | 2019-07-08 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 账户分类方法、装置、计算机设备和存储介质 |
CN110489640A (zh) * | 2019-07-16 | 2019-11-22 | 北京速途网络科技股份有限公司 | 内容推荐方法及系统 |
CN111782949A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
WO2022088417A1 (zh) * | 2020-10-29 | 2022-05-05 | 深圳大学 | 一种基于异质特征深度残差网络的内容推荐方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102004774A (zh) * | 2010-11-16 | 2011-04-06 | 清华大学 | 基于统一概率模型的个性化用户标签建模与推荐方法 |
CN103714171A (zh) * | 2013-12-31 | 2014-04-09 | 深圳先进技术研究院 | 文本聚类方法 |
US20140379719A1 (en) * | 2013-06-24 | 2014-12-25 | Tencent Technology (Shenzhen) Company Limited | System and method for tagging and searching documents |
CN105701230A (zh) * | 2016-01-19 | 2016-06-22 | 成都品果科技有限公司 | 一种基于图像内容的用户兴趣细分方法及系统 |
US9600576B2 (en) * | 2013-08-01 | 2017-03-21 | International Business Machines Corporation | Estimating data topics of computers using external text content and usage information of the users |
CN107357793A (zh) * | 2016-05-10 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 信息推荐方法和装置 |
CN108334601A (zh) * | 2018-01-31 | 2018-07-27 | 腾讯音乐娱乐科技(深圳)有限公司 | 基于标签主题模型的歌曲推荐方法、装置及存储介质 |
CN109034968A (zh) * | 2018-07-18 | 2018-12-18 | 江苏中润普达信息技术有限公司 | 一种基于粒子群算法的艺术品推荐方法 |
-
2019
- 2019-03-07 CN CN201910170610.9A patent/CN109933678B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102004774A (zh) * | 2010-11-16 | 2011-04-06 | 清华大学 | 基于统一概率模型的个性化用户标签建模与推荐方法 |
US20140379719A1 (en) * | 2013-06-24 | 2014-12-25 | Tencent Technology (Shenzhen) Company Limited | System and method for tagging and searching documents |
US9600576B2 (en) * | 2013-08-01 | 2017-03-21 | International Business Machines Corporation | Estimating data topics of computers using external text content and usage information of the users |
CN103714171A (zh) * | 2013-12-31 | 2014-04-09 | 深圳先进技术研究院 | 文本聚类方法 |
CN105701230A (zh) * | 2016-01-19 | 2016-06-22 | 成都品果科技有限公司 | 一种基于图像内容的用户兴趣细分方法及系统 |
CN107357793A (zh) * | 2016-05-10 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 信息推荐方法和装置 |
CN108334601A (zh) * | 2018-01-31 | 2018-07-27 | 腾讯音乐娱乐科技(深圳)有限公司 | 基于标签主题模型的歌曲推荐方法、装置及存储介质 |
CN109034968A (zh) * | 2018-07-18 | 2018-12-18 | 江苏中润普达信息技术有限公司 | 一种基于粒子群算法的艺术品推荐方法 |
Non-Patent Citations (2)
Title |
---|
胡学钢等: "联合主题模型的标签聚类方法", 《模式识别与人工智能》 * |
董坚峰等: "改进的基于狄利克雷混合模型的推荐算法", 《吉林大学学报(工学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457576A (zh) * | 2019-07-08 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 账户分类方法、装置、计算机设备和存储介质 |
CN110489640A (zh) * | 2019-07-16 | 2019-11-22 | 北京速途网络科技股份有限公司 | 内容推荐方法及系统 |
CN111782949A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
WO2022088417A1 (zh) * | 2020-10-29 | 2022-05-05 | 深圳大学 | 一种基于异质特征深度残差网络的内容推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109933678B (zh) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933678A (zh) | 艺术品推荐方法、装置、可读介质及电子设备 | |
Pei et al. | Interacting attention-gated recurrent networks for recommendation | |
CN110532479A (zh) | 一种信息推荐方法、装置及设备 | |
CN107358247B (zh) | 一种确定流失用户的方法及装置 | |
CN110335115A (zh) | 一种业务订单处理方法及装置 | |
CN110428298A (zh) | 一种店铺推荐方法、装置及设备 | |
Liu et al. | Structural analysis of user choices for mobile app recommendation | |
CN110489449A (zh) | 一种图表推荐方法、装置和电子设备 | |
CN109711931A (zh) | 基于用户画像的商品推荐方法、装置、设备及存储介质 | |
CN107908653A (zh) | 一种数据处理方法及装置 | |
CN109508879A (zh) | 一种风险的识别方法、装置及设备 | |
Yu et al. | Spectrum-enhanced pairwise learning to rank | |
CN110263817B (zh) | 一种基于用户账号的风险等级划分方法及装置 | |
CN110134860A (zh) | 用户画像生成方法、装置和设备 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN109903140A (zh) | 一种信用服务推荐方法、装置及设备 | |
CN109783381A (zh) | 一种测试数据生成方法、装置及系统 | |
CN109583473A (zh) | 一种特征数据的生成方法及装置 | |
Bhattacharya et al. | LAWRA: a layered wrapper feature selection approach for network attack detection | |
Rehman et al. | An intelligent context aware recommender system for real-estate | |
Yuan et al. | Matching recommendations based on siamese network and metric learning | |
CN114168804B (zh) | 一种基于异质子图神经网络的相似信息检索方法和系统 | |
Lai et al. | Social Listening for Product Design Requirement Analysis and Segmentation: A Graph Analysis Approach with User Comments Mining | |
CN108595498A (zh) | 问题反馈方法及装置 | |
CN110489640A (zh) | 内容推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |