CN110532471B - 基于门控循环单元神经网络的主动学习协同过滤方法 - Google Patents

基于门控循环单元神经网络的主动学习协同过滤方法 Download PDF

Info

Publication number
CN110532471B
CN110532471B CN201910796504.1A CN201910796504A CN110532471B CN 110532471 B CN110532471 B CN 110532471B CN 201910796504 A CN201910796504 A CN 201910796504A CN 110532471 B CN110532471 B CN 110532471B
Authority
CN
China
Prior art keywords
user
neural network
data
active learning
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910796504.1A
Other languages
English (en)
Other versions
CN110532471A (zh
Inventor
王成
陈德蕾
潘傲寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN201910796504.1A priority Critical patent/CN110532471B/zh
Publication of CN110532471A publication Critical patent/CN110532471A/zh
Application granted granted Critical
Publication of CN110532471B publication Critical patent/CN110532471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于门控循环单元神经网络的主动学习协同过滤方法,包括:获取用户评分数据集将其用户对商品评分矩阵转化为成时间序列数据,设置对应的门控循环单元神经网络结构;采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,并将门控循环单元神经网络输出与目标值进行损失计算,根据迭代算法adma进行参数的更新;利用训练得到的神经网络模型进行协同过滤推荐,实现TopN推荐。本发明方法在短时预测成功率、召回率、项目覆盖和用户覆盖上优于传统协同过滤算法;主动学习部分能够帮助模型快速建立,在一定程度上解决推荐系统的冷启动问题。

Description

基于门控循环单元神经网络的主动学习协同过滤方法
技术领域
本发明属于深度学习、数据挖掘和推荐算法领域,用于对用户感兴趣的商品的自动推荐,具体涉及一种基于门控循环单元神经网络(GRU)的主动学习协同过滤方法。
背景技术
在互联网时代,海量数据信息已经超过了人类能够接受的范围。面对信息过载的问题,有许多的解决方案。目前最广泛应用的是搜索引擎和推荐算法,搜索引擎通过给定若干个关键词,使用信息检索算法,找到相关的信息,而当用户没有关键词时,则使用不了搜索引擎。推荐算法不需要用户提供关键词,而是主动分析用户的历史数据,主动给用户提供内容服务,解决了搜索引擎在没有明确意图场景下无法使用的问题。随着互联网的发展,商品推荐、视频推荐、音乐推荐、新闻推荐等各种个性化推荐应用走上舞台。推荐算法支撑着这些应用,而协同过滤推荐算法是其中最成功的算法之一。
目前协同过滤推荐算法有三种主流推荐算法:
第一种是基于领域的协同过滤推荐算法,利用领域相似性,计算n个相似的邻居,通过邻居来推荐。基于邻域分为基于用户和基于项目两种。
基于用户:1)计算n个相似的用户;2)将n个用户喜好的项目推荐给目标用户。
基于项目:1)计算项目之间的相似度;2)将目标用户喜好项目的n个近似项目推荐给目标用户。
该方法的缺点在于用户之间还是有明显的差异性的,当系统内用户数量较少时,很难找到与该用户特别相近的用户。而随着用户数量增多,维护用户关联相似矩阵的维护成本又很高。
第二种是基于矩阵分解的协同过滤推荐算法。用户-项目交互行为,例如商品评分,可以组织成一个用户-商品评分矩阵。基于矩阵分解的推荐算法,将评分矩阵分解为若干个子矩阵。本质上是通过降维补全评分矩阵,从而得到商品的评分预测。最早的协同过滤矩阵分解,使用的是奇异值分解SVD。对于一个评分矩阵R,第一步是将评分矩阵补全,通常使用的是平均值。但是评分矩阵往往极大且稀疏,难以存储,SVD效率很低,并且补全后精度很低。
第三种是基于深度学习的协同过滤推荐算法。国内外研究深度学习应用至协同过滤推荐算法的成果中,大多数都在改进基于矩阵分解的方法,使用深度学习模型做矩阵分解。在Neural Collaborative Filtering(NCF)模型中,作者提出了一个通用框架来对协同过滤数据进行矩阵分解。NCF的输入是项目和用户的one-hot向量。嵌入层(EmbeddingLayer)将稀疏的 one-hot向量映射成embedding向量,然后输入多个全连接层,最终预测出评分值。在Deep Matrix Factorization(DMF)模型中,作者提出直接通过神经网络结构,将用户和项目投射到潜在空间中的低维向量中。DMF中有两个多层全连接模块,输入分别是评分矩阵行和列(用户对所有物品评分的情况和物品被所有用户评分的情况),两个输入向量分别通过多层全连接模块,最终得到两个隐层语义向量,使用余弦公式度量两个向量的近似程度,近似程度即为用户对该物品的喜好预测值。该方法精度较高,但存在训练时间长,冷启动的问题。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于门控循环单元神经网络的主动学习协同过滤方法,通过将数据进行时序化处理,反映用户兴趣变化,并利用主动学习动态采样数据,主动选择合适的训练集,降低门控循环单元神经网络的样本需求度,在一定程度上解决冷启动问题。
本发明采用如下技术方案:
一种基于门控循环单元神经网络的主动学习协同过滤方法,包括:
获取用户评分数据集,将其用户对商品评分矩阵转化为成时间序列数据,并设置对应的门控循环单元神经网络结构;
采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,并将门控循环单元神经网络输出与目标值进行损失计算,根据迭代算法adma进行参数的更新;
利用训练得到的神经网络模型进行协同过滤推荐,实现TopN推荐。
优选的,所述数据集中包括用户a、商品b、用户a对商品b的评分ra,b和用户a对商品b的评分时间Ta,b
所述获取用户评分数据集,将其用户对商品评分矩阵转化为成时间序列数据,具体包括:
采用以用户为单位时序化方法,按时间升序排序用户对商品评分;对于每一个用户,从一行评分数据转换成一条按评分时间排序的数据;
按评分时间排序的数据的数据格式如下:
用户u、评分
Figure RE-GDA0002238772340000021
评分
Figure RE-GDA0002238772340000022
评分
Figure RE-GDA0002238772340000023
其中,k表示用户评分商品数目,u表示用户ID,Ik表示用户u按时间顺序第k个评分的商品ID。
优选的,采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,具体包括:
采用改进MinRating策略进行主动学习,每次选取门控循环单元的Top1推荐中置信度最低的用户;假设门控循环单元给出用户u对物品i的喜好预测值为Oui,则主动学习算法主动挑选的用户如下:
Figure RE-GDA0002238772340000031
其中,uk表示第k个用户,ij表示第j个项目,k=1,2...,j=1,2,...;Top1表示每名用户推荐项目中置信度最高的项目。
优选的,采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,包括:随机选取500名用户的评分数据进行训练,后用训练得到的模型用改进MinRating策略选择10名用户加入到下一轮的模型训练。
优选的,所述门控循环单元神经网络输出为经softmax归一化后的用户u对项目i的兴趣度预测值pu,i,softmax归一化公式表示如下:
Figure RE-GDA0002238772340000032
其中,yk表示神经网络输出层代表项目i的节点输出值,n表示输出层节点数,即用户u 评价项目数。
优选的,所述设置对应的门控循环单元神经网络结构,包括:
通过对门控循环单元神经网络设置不同超参数分析得到的模型的推荐的短时预测准确率、召回率、项目覆盖数和用户覆盖率,得到最合适的超参数;各指标表示如下:
短时预测成功率:
Figure RE-GDA0002238772340000033
召回率:
Figure RE-GDA0002238772340000034
项目覆盖数:ItemCoverage=|Uu∈U(R(u)∩T(u))|
用户覆盖率:
Figure RE-GDA0002238772340000041
其中,R(u)是推荐方法给出的对于用户u的推荐列表,T(u)是用户u在测试集上的行为列表,用户集合为U,项目集合为I,I(·)是试性函数,I(true)=1,I(false)=0。
本发明的基于门控循环单元神经网络的主动学习协同过滤方法在短时预测成功率、召回率、项目覆盖和用户覆盖率上优于传统协同过滤推荐方法;本发明方法能够有效提升TopN任务的精度,有效预测用户短时的兴趣变化,并且因为同时提升了项目覆盖和用户覆盖,具有较强的发掘长尾物品的能力;本发明方法中的主动学习部分能够帮助模型快速建立,可以在一定程度上解决推荐系统的冷启动问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下列举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述及其他目的、优点和特征。
附图说明
图1为本发明整体方法框图;
图2为主动学习方法流程图;
图3为本发明中不同隐层维度的轮次-短时预测成功率图;
图4为本发明中不同隐层维度的轮次-召回率图;
图5为本发明中不同隐层维度的轮次-项目覆盖数图;
图6为本发明中不同隐层维度的轮次-用户覆盖率图;
图7为本发明中不同迭代优化方法的时间-短时预测成功率图;
图8为本发明中不同迭代优化方法的时间-召回率图;
图9为本发明中不同迭代优化方法的时间-项目覆盖数图;
图10为本发明中不同迭代优化方法的时间-用户覆盖率图;
图11为本发明中不同屏蔽率的屏蔽率-短时预测成功率图;
图12为本发明中加入主动学习影响结果图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步的详细描述。
本发明涉及的部分术语,解释如下:
1、门控循环单元神经网络GRU
门控循环单元神经网络是标准循环神经网络的改进版,门控循环单元神经网络使用了更新门与重置门。基本上,这两个门控向量决定了哪些信息最终能作为门控循环单元神经网络的输出。这两个门控机制的特殊之处在于,它们能够保存长期序列中的信息,且不会随时间而清除或因为与预测不相关而移除,这使得门控循环单元神经网络比循环神经网络更适合对时序化后的协同过滤数据建模。
2、主动学习
主动学习的假设是,机器学习算法要根据已学到的信息主动去选择数据,使用这些数据来训练模型,然后再去选择数据,不断循环。当样本只有少量有被标记时,使用主动学习,让模型主动选择最有效的几个数据,然后让专家来打标签,再喂给模型训练,可以有效地减少标记样本的代价。当样本有足够的标记时,使用主动学习,能够在使用更少的样本、更少的训练轮次下,获得更好的模型。
3、屏蔽率
当一个复杂的前馈神经网络被训练在小的数据集时,容易造成过拟合。为了防止过拟合,可以通过阻止特征检测器的共同作用来提高神经网络的性能。如在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征。这样的概率p即屏蔽率。
4、MinRating
假设用户u对电影m的评分值为ru,m,模型给出的预测数值为
Figure RE-GDA0002238772340000051
一种看法是
Figure RE-GDA0002238772340000052
最大的那部电影,才是信息量最大的电影,即对模型训练影响最大的电影。但是事实上,无法获知用户u对所有电影的评分,所以无法使用这个公式判断电影的信息量。因为用户大多会去评价或者交互自己感兴趣的电影/物品,所以预测的误差更多的出现在对用户评高评分的电影预测低分的情况,而动态采样模型评分预测中,评分值最低的电影数据,这种方法称作 MinRating。
具体的,本发明一种基于门控循环单元神经网络的主动学习协同过滤方法,包括:
获取用户评分数据集,将其用户对商品评分矩阵转化为成时间序列数据,并设置对应的门控循环单元神经网络结构;
采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,并将门控循环单元神经网络输出与目标值进行损失计算,根据迭代算法adma进行参数的更新;
利用训练得到的神经网络模型进行协同过滤推荐,实现用户感兴趣的商品的TopN推荐。
参见图1和图2所示,本实施例中,以数据集MovieLens为例,具体步骤如下:
1、初始化神经网络的参数,包括隐层参数维度、神经网络模型、迭代优化算法、屏蔽概率、TopN中N值;
2、获取公开数据集MovieLens将其用户电影评分矩阵转化为成时间序列数据;其中,数据集MovieLens包括:用户a,电影b,用户a对电影b的评分ra,b,用户a对电影b的评分时间Ta,b;这里采用的时序化方法,是以用户为单位,按时间升序排序用户电影评分,因此对于每一个用户,从之前的一行评分数据转换成一条按评分时间排序的数据,其数据格式为:
用户u,评分
Figure RE-GDA0002238772340000061
(电影I1),评分
Figure RE-GDA0002238772340000062
(电影I2),...,评分
Figure RE-GDA0002238772340000063
(电影Ik)
其中,k为用户评分电影数,u为用户ID,Ik为用户u按时间顺序第k个评分的电影ID。并将其输入到神经网络中。
3、门控循环单元神经网络输出为经归一化指数函数归一化后的用户u对项目i的兴趣度预测值pu,i。归一化指数函数归一化公式为:
Figure RE-GDA0002238772340000064
其中,yk为神经网络输出层代表项目i的节点输出值,n为输出层节点数,即用户u评价项目数。
后利用交叉熵损失函数进行损失计算,并利用adam迭代优化算法对神经网络参数进行更新。
4、采用改进MinRating策略进行主动学习,每轮训练后每次选取门控循环单元神经网络的Top1推荐(即,给每名用户推荐项目中置信度最高的项目)中置信度最低的用户。假设门控循环单元给出用户u对物品i的喜好预测值为Oui,则主动学习算法主动挑选的用户为:
Figure RE-GDA0002238772340000065
其中,uk为第k个用户,ij为第j个项目,k=1,2...,j=1,2,...。
利用主动学习主动选择合适的训练集输入用户的时间序列数据到门控循环单元神经网络中进行训练,其过程为:随机选取500名用户的评分数据进行训练,后用训练得到的模型用改进MinRating策略选择10名用户加入到下一轮的模型训练。该过程直到模型稳定结束训练。
实验验证
1、验证方法
本发明的实验通过训练集与测试集比较计算多个评价指标,来验证基于门控循环单元神经网络的主动学习协同过滤推荐方法的效果。
2、评价指标
推荐算法有许多目标,根据不同目标,有不同的评价指标。合适的评价指标可以用于定性或定量地评价推荐方法各方面的性能。短时预测成功率(shortitempredictionsuccess,sps.),度量的是推荐方法对下一次用户感兴趣/会交互的那一个物品的预测成功率。sps对时间很敏感,在TopN任务上,比准确率和召回率更严格。sps要求推荐算法对于一个用户,给出N个推荐物品,用户的下一个希望交互的物品在推荐列表内则推荐成功。sps适合用于评测会话型的推荐场景。为了度量推荐方法对项目的覆盖率,需要判断推荐方法成功推荐的项目数。而不同的用户有不同喜好的长尾物品,项目覆盖数高的推荐方法可能只对部分用户发挥了较强的长尾发掘能力,而用户覆盖率度量了推荐方法长尾发掘能力的普适性。各评价指标公式为:
短时预测成功率:
Figure RE-GDA0002238772340000071
召回率:
Figure RE-GDA0002238772340000072
项目覆盖数:ItemCoverage=|Uu∈U(R(u)∩T(u))|
用户覆盖率:
Figure RE-GDA0002238772340000073
其中,R(u)是推荐算法给出的对于用户u的推荐列表,T(u)是用户u在测试集上的行为列表,用户集合为U,项目集合为I,I(·)是试性函数,I(true)=1,I(false)=0,例如I(1>0)=1。
如下将通过具体的数据集进行实验验证。
1、数据集
本实施例使用目前必将常用的公开的Movielens数据集的介绍如表1所示。
表1
Figure RE-GDA0002238772340000081
2、实验设计
本实验设计了五组实验,比较了基于门控循环单元神经网络的协同过滤推荐方法与传统协同过滤推荐方法的区别、门控循环单元神经网络各参数的影响以及在门控循环单元神经网络中加入主动学习对结果的影响。
实验一表示在相同数据集下各算法的短时预测成功率、召回率、项目覆盖数、用户覆盖率实验结果。实验二表示在进行数据集48轮,迭代236384次情况下,门控循环单元神经网络隐藏参数维度为8、16、32、64维对短时预测成功率、召回率、项目覆盖数、用户覆盖率结果的影响;实验三表示在实验固定训练时间为3600秒,门控循环单元神经网络隐藏参数维度为32的情况下,比对Nesterov、Adam两种优化算法的对短时预测成功率、召回率、项目覆盖数、用户覆盖率结果的影响;实验四表示在门控循环单元神经网络隐藏参数维度为32、adam优化算法、遍历训练集48轮的情况下,对比屏蔽率从0到0.9在短时预测概率和召回率上的影响;实验五表示在门控循环单元神经网络隐层参数维度32,使用adam优化算法,未添加Dropout层,固定遍历50轮训练集的情况下,比较使用主动学习和不使用主动学习对短时预测成功率结果的影响。
实验一评价指标为短时预测成功率、召回率、项目覆盖数、用户覆盖率,在Movielens数据集上比较基于用户的协同过滤推荐方法、基于马尔科夫模型的协同过滤推荐方法、基于矩阵分解的协同过滤推荐方法、基于门控循环单元神经网络的协同过滤推荐方法对短时预测成功率、召回率、项目覆盖数、用户覆盖率结果的影响。
实验二评价指标为短时预测成功率、召回率、项目覆盖数、用户覆盖率,在Movielens数据集上比较神经网络隐藏参数维度对结果的影响,实验结果如图3、图4、图5和图6所示。
实验三评价指标为短时预测成功率、召回率、项目覆盖数、用户覆盖率,在Movielens数据集上比较神经网络迭代优化算法对结果的影响,实验结果如图7、图8、图9和图10所示。
实验四评价指标为短时预测概率和召回率,在Movielens数据集上比较神经网络屏蔽率对结果的影响,实验结果如图11所示。
实验五评价指标为短时预测成功率,在Movielens数据集上比较加入主动学习与不加入主动学习对结果的影响,实验结果如图12所示。
3、实验结果分析
(1)实验结果表明,基于门控循环单元神经网络的方法在短时预测成功率精度上远超过其它方法,说明该方法能够有效反映用户短时兴趣的变化,且用户覆盖率和项目覆盖率同时高于其它方法,说明其在发掘长尾物品上有很大优势。
(2)参见图3、图4、图5和图6所示,实验结果表明8维的门控循环单元神经网络在短时预测成功率、召回率、项目覆盖上略逊于16、32、64维的门控循环单元神经网络,随着维度的提高,指标会略微提升,但是维度越大耗时越长。
(3)参见图7、图8、图9和图10所示,实验结果表明在训练门控循环单元神经网络模型时,adam优化算法远比Nesterov好。对于深度学习模型,目标函数是非凸的,并且有大量局部最优解,优化算法的目标之一就是摆脱糟糕的局部最优解。在所有指标上,adam优于Nesterov,特别在项目覆盖上,可以看到Nesterov陷入的局部最优区域远差于adam。
参见图11所示,实验结果表明当Dropout概率上升时,recall不断上升,在0.6左右开始下降,而sps在短暂上升后,0.3左右开始下降。对于小概率的Dropout,sps和recall 的精度同时提高,可见适当地Dropout,会提升模型整体的能力。
参见图12所示,实验结果表明使用主动学习,能以更少的遍历轮次获得更高的效果。同时,使用主动学习,降低门控循环单元神经网络的样本需求度,能够在一定程度上解决冷启动问题。
本发明所述的基于门控循环单元神经网络的主动学习协同过滤推荐方法算法在短时预测成功率、召回率、项目覆盖和用户覆盖上优于传统协同过滤推荐方法。该算法能够有效提升 TopN任务的精度,有效预测用户短时的兴趣变化,并且因为同时提升了项目覆盖和用户覆盖,具有较强的发掘长尾物品的能力。算法中的主动学习部分能够帮助模型快速建立,可以在一定程度上解决系统的冷启动问题。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

Claims (2)

1.一种基于门控循环单元神经网络的主动学习协同过滤方法,用于对用户感兴趣的商品的自动推荐,其特征在于,包括:
获取用户评分数据集,将其用户对商品评分矩阵转化为成时间序列数据,并设置对应的门控循环单元神经网络结构;
采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,并将门控循环单元神经网络输出与目标值进行损失计算,根据迭代算法adma进行参数的更新;
利用训练得到的神经网络模型进行协同过滤推荐,实现TopN推荐;
所述数据集中包括用户a、商品b、用户a对商品b的评分ra,b和用户a对商品b的评分时间Ta,b
所述获取用户评分数据集,将其用户对商品评分矩阵转化为成时间序列数据,具体包括:
采用以用户为单位时序化方法,按时间升序排序用户对商品评分;对于每一个用户,从一行评分数据转换成一条按评分时间排序的数据;
按评分时间排序的数据的数据格式如下:
用户u、评分
Figure FDA0003587300100000011
评分
Figure FDA0003587300100000012
...、评分
Figure FDA0003587300100000013
其中,k表示用户评分商品数目,u表示用户ID,Ik表示用户u按时间顺序第k个评分的商品ID;
采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,具体包括:
采用改进MinRating策略进行主动学习,每次选取门控循环单元的Top1推荐中置信度最低的用户;假设门控循环单元给出用户u对物品i的喜好预测值为Oui,则主动学习算法主动挑选的用户如下:
Figure FDA0003587300100000014
其中,uk表示第k个用户,ij表示第j个项目,k=1,2...,j=1,2,...;Top1表示每名用户推荐项目中置信度最高的项目;
所述门控循环单元神经网络输出为经softmax归一化后的用户u对物品i的兴趣度预测值pu,i,softmax归一化公式表示如下:
Figure FDA0003587300100000021
其中,yk表示神经网络输出层代表物品i的节点输出值,n表示输出层节点数,即用户u评价项目数;
所述设置对应的门控循环单元神经网络结构,包括:
通过对门控循环单元神经网络设置不同超参数得到的神经网络模型的推荐结果的短时预测准确率、召回率、项目覆盖数和用户覆盖率进行比较,得到最合适的超参数;各指标表示如下:
短时预测成功率:
Figure FDA0003587300100000022
召回率:
Figure FDA0003587300100000023
项目覆盖数:ItemCoverage=|Uu∈U(R(u)∩T(u))|
用户覆盖率:
Figure FDA0003587300100000024
其中,R(u)是基于门控循环单元神经网络的主动学习协同过滤方法给出的对于用户u的TopN推荐列表,T(u)是用户u在测试集上的行为列表,用户集合为U,项目集合为I,I(·)是试性函数,I(true)=1,I(false)=0。
2.根据权利要求1所述的基于门控循环单元神经网络的主动学习协同过滤方法,其特征在于,采用改进MinRating主动学习算法动态采样数据,主动选择合适的训练集,输入用户的时间序列数据到门控循环单元神经网络输入层进行训练,包括:随机选取500名用户的评分数据进行训练,后用训练得到的模型用改进MinRating策略选择10名用户加入到下一轮的模型训练。
CN201910796504.1A 2019-08-27 2019-08-27 基于门控循环单元神经网络的主动学习协同过滤方法 Active CN110532471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910796504.1A CN110532471B (zh) 2019-08-27 2019-08-27 基于门控循环单元神经网络的主动学习协同过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910796504.1A CN110532471B (zh) 2019-08-27 2019-08-27 基于门控循环单元神经网络的主动学习协同过滤方法

Publications (2)

Publication Number Publication Date
CN110532471A CN110532471A (zh) 2019-12-03
CN110532471B true CN110532471B (zh) 2022-07-01

Family

ID=68664433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910796504.1A Active CN110532471B (zh) 2019-08-27 2019-08-27 基于门控循环单元神经网络的主动学习协同过滤方法

Country Status (1)

Country Link
CN (1) CN110532471B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241408B (zh) * 2020-01-21 2023-05-30 武汉轻工大学 推荐模型的构建系统及方法
CN113254795B (zh) * 2020-02-11 2023-11-07 北京京东振世信息技术有限公司 一种推荐模型的训练方法和装置
CN111723285A (zh) * 2020-05-14 2020-09-29 天津大学 一种基于评分的深度谱卷积协同过滤推荐方法
CN112085254B (zh) * 2020-08-05 2023-06-13 中国地质大学(武汉) 基于多重分形协同度量门控循环单元的预测方法及模型
CN112084415B (zh) * 2020-09-17 2024-02-02 辽宁工程技术大学 一种基于用户和项目长短期时间耦合关系分析的推荐方法
CN112380433B (zh) * 2020-11-13 2024-03-29 中国科学技术大学 面向冷启动用户的推荐元学习方法
CN113205388A (zh) * 2021-05-12 2021-08-03 中国地质大学(武汉) 一种基于矩阵分解的协同过滤推荐优化算法和装置
CN113436703B (zh) * 2021-07-02 2022-07-15 上海交通大学 基于神经网络的运动步数数据的运动模式推断方法及系统
CN113779101B (zh) * 2021-11-10 2022-03-18 北京航空航天大学 一种基于深度神经网络的时序集合推荐系统和方法
CN114510645B (zh) * 2022-04-08 2022-07-15 浙大城市学院 一种基于提取有效多目标群组来解决长尾推荐问题的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038629A (zh) * 2017-12-30 2018-05-15 北京工业大学 一种基于协同过滤的优化方法
AU2018101513A4 (en) * 2018-10-11 2018-11-15 Hui, Bo Mr Comprehensive Stock Prediction GRU Model: Emotional Index and Volatility Based
CN109062962A (zh) * 2018-06-27 2018-12-21 华南理工大学 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN109993668A (zh) * 2019-04-09 2019-07-09 桂林电子科技大学 一种基于门控循环单元神经网络的景点推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038629A (zh) * 2017-12-30 2018-05-15 北京工业大学 一种基于协同过滤的优化方法
CN109062962A (zh) * 2018-06-27 2018-12-21 华南理工大学 一种融合天气信息的门控循环神经网络兴趣点推荐方法
AU2018101513A4 (en) * 2018-10-11 2018-11-15 Hui, Bo Mr Comprehensive Stock Prediction GRU Model: Emotional Index and Volatility Based
CN109993668A (zh) * 2019-04-09 2019-07-09 桂林电子科技大学 一种基于门控循环单元神经网络的景点推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于协同过滤技术的在线学习个性化推荐系统研究;谢修娟等;《电脑知识与技术》;20180131;第14卷(第03期);全文 *
基于用户的协同过滤算法的推荐效率和个性化改进;王成等;《小型微型计算机系统》;20160331;第37卷(第03期);全文 *

Also Published As

Publication number Publication date
CN110532471A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN110532471B (zh) 基于门控循环单元神经网络的主动学习协同过滤方法
CN111523047B (zh) 基于图神经网络的多关系协同过滤算法
CN110162706B (zh) 一种基于交互数据聚类的个性化推荐方法及系统
CN108647251B (zh) 基于宽深度门循环联合模型的推荐排序方法
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN108829763B (zh) 一种基于深度神经网络的影评网站用户的属性预测方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN111861909B (zh) 一种网络细粒度图像分类方法
Su et al. Research on personalized recommendation algorithm based on ontological user interest model
CN111723285A (zh) 一种基于评分的深度谱卷积协同过滤推荐方法
Pujahari et al. Model-based collaborative filtering for recommender systems: An empirical survey
CN113343077A (zh) 一种融合用户兴趣时序波动的个性化推荐方法及系统
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置
CN115510322A (zh) 一种基于深度学习的多目标优化推荐方法
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
Hossain et al. A neural engine for movie recommendation system
Zhao et al. Improving Top‐N Recommendation Performance Using Missing Data
Chen et al. Poverty/investment slow distribution effect analysis based on Hopfield neural network
Wang et al. Dmfp: a dynamic multi-faceted fine-grained preference model for recommendation
CN112364245A (zh) 基于异构信息网络嵌入的Top-K电影推荐方法
CN112486467A (zh) 一种双重交互关系和注意力机制的交互式服务推荐方法
CN115048530A (zh) 融合邻居重要度和特征学习的图卷积推荐系统
CN115712777A (zh) 一种基于逻辑回归的文献推荐系统的排序方法
Salehi et al. Attribute-based collaborative filtering using genetic algorithm and weighted c-means algorithm
CN114564594A (zh) 一种基于双塔模型的知识图谱用户偏好实体召回方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant