CN108763493A - 一种基于深度学习的推荐方法 - Google Patents

一种基于深度学习的推荐方法 Download PDF

Info

Publication number
CN108763493A
CN108763493A CN201810536538.2A CN201810536538A CN108763493A CN 108763493 A CN108763493 A CN 108763493A CN 201810536538 A CN201810536538 A CN 201810536538A CN 108763493 A CN108763493 A CN 108763493A
Authority
CN
China
Prior art keywords
project
user
hidden
subvector
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810536538.2A
Other languages
English (en)
Other versions
CN108763493B (zh
Inventor
石鑫
屈鸿
符明晟
史冬霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Di Di Information Technology Ltd By Share Ltd
Original Assignee
Shenzhen Di Di Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Di Di Information Technology Ltd By Share Ltd filed Critical Shenzhen Di Di Information Technology Ltd By Share Ltd
Priority to CN201810536538.2A priority Critical patent/CN108763493B/zh
Publication of CN108763493A publication Critical patent/CN108763493A/zh
Application granted granted Critical
Publication of CN108763493B publication Critical patent/CN108763493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的推荐方法,属于数据挖掘技术领域,解决现有的推荐方法,不能从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量,造成推荐不准确的问题;本发明对用户的历史行为数据的隐式反馈特性进行建模,建模后学习得到用户和项目的隐因子向量;将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型;对于未出现在用户历史行为数据中的新项目,将项目的文本内容信息中通过步骤(2)得到的网络模型预测得到项目的隐因子向量,然后将其与步骤(1)得到的用户隐因子向量直接匹配,并将匹配度进行排序,得到每个用户的新项目推荐列表。本发明用于新项目的推荐。

Description

一种基于深度学习的推荐方法
技术领域
一种基于深度学习的推荐方法,用于新项目的推荐,属于数据挖掘、自然语言处理、个性化推荐等技术领域。
背景技术
基于内容的推荐,通常从项目的描述和元数据等内容信息中预测用户偏好。最基础的推荐算法是根据项目的可用的元数据进行推荐,例如在电影推荐中,电影的元数据可能包括电影的类别属性、参与的演员、制作的导演和电影的大众评分等等。然而,这将导致可以预知的推荐。例如推荐用户已经熟知的演员的电影,通常这将不是有效的推荐。另一种推荐算法是根据项目的描述信息进行推荐,例如在电影推荐中,使用电影的标题和内容简介等描述信息,这些描述信息通常使用词袋模型进行表征,通过测量描述信息的表征向量之间的相似性,可以尝试为用户推荐与该用户以前看过的电影相似的电影。这种方法需要定义一个合适的相似性度量。这样的度量通常是基于描述信息的先验知识来自定义,因此它们不一定是基于内容的推荐方法的最佳选择。因此,一些研究人员已经使用用户偏好数据来调整相似性度量。
基于协同过滤的推荐方法可以是基于邻域或基于模型的。前一种方法依赖于用户或项目之间的相似性度量,他们推荐具有类似偏好的其他用户所消费的项目,或与用户已经消费的项目类似的项目。另一方面,基于模型的方法试图建模用户和项目的潜在特征,这些特征通常表示为潜在因素的向量。潜在因素模型的有效性在Netflix奖项中的电影推荐中得以证明,由此,潜在因素模型在推荐领域的应用也越来越广泛。潜在因子向量形成了用户口味在不同方面的简洁描述,同时也形成了相应的项目特征。由于很多项目的使用数据很少甚至缺失,对于使用数据很少的项目通常不能可靠地估计这些项目的潜在因子向量,而对于使用数据缺失的项目则无法获取该项目的潜在因子向量。因此,能够从包含项目的描述和元数据的文本内容信息来预测这些项目的潜在因子向量的混合推荐方法将是有效可行的推荐方法。这就是本文研究的推荐方法。
影响用户偏好的项目的潜在因子与项目的文本内容信息之间存在着巨大的语义差距。例如,从电影的文本内容信息中提取诸如艺术风格、商业性、科技性和寓意主题等高级属性需要强大的模型,能够捕捉复杂的文本语法和语义特征。此外,单单从电影的文本内容信息中不可能获得某些属性,如导演或者演员的知名度、名誉和位置。基于内容的推荐方法目前现有的推荐算法不能从同时包含项目的描述信息和项目的元数据的文本内容信息中精确地预测项目的潜在因子。即使表征文本内容信息的词袋模型可以在学习项目的整体表示和单词表示时提供有价值的信息,但是,这种表示方式忽略每个单词周围的单词和所处位置语境的顺序信息,在挖掘内容信息时存在着很大的瓶颈。因此,如何有效地从项目的文本内容信息中挖掘出影响用户对项目偏好的高级属性,一直是推荐系统领域的研究难点和重点。
最近的研究表明了深度学习在语音识别、图像分析和自然语言处理方面的革命性进展在应对信息检索和推荐任务方面的有效性。通过将深度学习应用到推荐领域中,使推荐系统取得了最先进的性能,并获得了高质量的推荐效果,因此基于深度学习的推荐技术得到了迅猛地发展。相比于传统的推荐技术,深度学习模型可以深层次地理解用户的需求和项目的特征,同时深层次地挖掘用户对项目的历史行为交互信息。在基于内容的推荐方法中,利用深度学习中的诸如使用带滑动窗口(内核)卷积层的卷积神经网络(CNN)模型具有捕捉单词的顺序和当前位置的语境的潜力。但是,CNN中的卷积核的大小在训练期间是固定的。为了获得足够好的性能,有时需要使用具有不同的卷积核大小的多个CNN的集合。门控循环神经网络(RNN)模型是一种更自然、更自适应的文本序列建模方法。门控RNN一次接收一个单词(或多个单词),并让学习的门决定是合并还是忘记该单词。直观地说,使用门控RNN模型可以很好地建模包含项目的描述和元数据的文本内容序列的生成,从而更能有效地从项目的文本内容信息中挖掘出影响用户对项目偏好的高级属性。近年来,尝试开发推荐系统中的循环深度学习模型的研究人员较少,虽然有些方法涉及循环深度神经网络模型,但它们实际上属于基于协调过滤的推荐方法,因为它们并不包含项目的文本内容信息,事实上,深层次挖掘和理解项目的文本内容信息对准确推荐至关重要,在推荐领域中具有极高的研究和应用价值。
发明内容
本发明的目的在于:解决现有的推荐方法,不能有效地从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量,造成推荐不准确的问题;本发明提供了一种基于深度学习的推荐方法。
本发明采用的技术方案如下:
一种基于深度学习的推荐方法,其特征在于,如下步骤:
(1)对用户的历史行为数据的隐式反馈特性进行建模,建模后学习得到用户和项目的隐因子向量;
(2)将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型;
(3)对于未出现在用户历史行为数据中的新项目,将新项目的文本内容信息通过步骤(2)得到的网络模型预测得到项目的隐因子向量,然后将其与步骤(1)得到的用户隐因子向量直接匹配,并将匹配度进行排序,得到每个用户的新项目推荐列表。
进一步,所述步骤(1)中,采用基于隐式反馈的加权因子模型对用户的历史行为数据的隐式反馈特性进行建模。
进一步,所述步骤(1)的具体步骤如下:
(11)对用户历史行为数据rui进行归一化处理,通过引入一个二值变量pui,将用户u对项目i的偏好二值化为偏好矩阵其中,m表示用户的个数,n表示项目的个数;
(12)根据偏好矩阵并引入置信度变量cui,来衡量用户u对项目i的偏好的确定程度;
(13)基于确定程度,通过加权隐因子模型将用户和项目映射到共同的潜在因子低维空间,其空间维度为K,通过最小化带正则项的平方误差损失,学习得到所有用户的隐因子向量和所有项目的隐因子向量公式如下:
其中,pui为用户u对项目i的实际偏好值,xu为用户u的隐因子向量,λx为xu的精度参数,yi为项目i的隐因子向量,λy为yi的精度参数。
进一步,所述步骤(2)中,将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型。
进一步,所述步骤(2)的具体步骤如下:
(21)使用基于Attention机制的GRU网络模型的输入层将项目的文本内容数据映射为单词序列x={x1,x2,x3,…,xT},其中,T是单词序列的长度,是一个对文本内容中第t个单词的独热编码表示,V是数据集的单词表的大小,即代表所有不重复单词的个数,代表xt是一个V维向量;
(22)对于文本内容中第t个单词对应的t时刻,基于Attention机制的GRU网络模型的单词嵌入层通过线性映射将单词的独热编码表示xt转换成低维稠密向量et,公式如下:
et=Wext
其中,是单词嵌入层的参数,de是低维稠密矢量et的维度,We的每一列对应着单词表中的一个单词;
(23)单词嵌入层的输出{e1,e2,e3,…,eT}被前馈到基于Attention机制的GRU网络模型的GRU层作为输入序列,GRU层中的GRU单元在t时刻的激活同时决定了GRU单元更新它的先前激活和候选激活的多少,公式如下:
zt=σ(Wzet+Uzht-1)
rt=σ(Wret+Urht-1)
其中,Wz、Uz、Wr、Ur、W为GRU层的参数,即网络训练时自动去学习所用参数,是网络作矩阵运算时的变量,zt是表示更新门,rt表示复位门,ht-1表示先前激活,表示候选激活,ht表示t时刻的激活,对应GRU单元在t时刻的隐藏编码状态,看作是第t个单词的向量表示;
(24)基于Attention的单词池化层将隐藏编码状态向量序列h={h1,h2,h3,…,hT}压缩成一个“上下文”向量c作为项目的文本内容表示,公式如下:
ut=vTtanh(Whht)
其中,向量v和矩阵Wh是基于Attention的单词池化层的参数,T是单词序列的长度,uk为第时刻k的原始分数,ut为第时刻t的原始分数,αt代表将时刻t对应的原始分数进行softmax标准化得到的最终的分数,即应该对第t个隐藏编码状态ht给予多少关注;
(25)使用加权隐因子模型学习得到的项目的隐因子向量作为标签,对基于Attention机制的GRU网络模型进行训练,得到训练好的基于Attention机制的GRU网络模型,其目标函数如下:
其中,yi为项目i的隐因子向量,由加权隐因子模型学习得到,yi′为基于Attention机制的GRU网络模型对应的预测值,θ代表模型参数,泛指网络需要训练的所有参数。
进一步,所述步骤(3)的具体步骤如下:
(31)对于未出现在用户历史行为数据中的新项目j,从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量yj
(32)将预测的新项目j的隐因子向量yj与加权隐因子模型学习得到的目标用户u的隐因子向量xu进行匹配,并将匹配度作为预测偏好值puj,计算公式如下:
Puj=xu Tyj
式中,T表示转置运算;
(33)计算目标用户u对所有新项目的预测偏好值后,得到目标用户u的待推荐新项目列表;
(34)对待推荐新项目列表中的项目进行排序,为每个用户选取前M个预测偏好值最高的项目,得到每个用户的新项目推荐列表。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
A.本发明,从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量,能大大提高推荐的准确度。
B.本发明针对用户隐式反馈数据的特性提出了加权隐因子模型(WLFM模型),将偏好的置信度引入到用户偏好学习当中,针对隐式反馈数据的训练效率问题改进了传统的ALS算法,提升了模型的训练效率。
C.本发明基于训练好的Attention的GRU深度神经网络模型能够有效地对文本内容的时序信息进行建模和深层次挖掘,通过GRU网络模型对文本中的单词进行语义编码,通过基于Attention的池化技术自动学习单词的权重,相对于传统的BOW表示方法,基于GRU网络的单词编码结构能够实现对文本中单词语义的准确编码,同时基于Attention的池化技术相对于传统的池化技术,能够为项目文本学习更精确的,从而提升推荐性能。
D.本发明提供的基于深度学习的推荐方法,将深度神经网络模型与基于协同过滤的浅层模型融合在一起,可以同时利用用户行为信息和项目文本内容信息的混合推荐模型,解决数据稀疏性和冷启动的问题对推荐性能的影响。
附图说明
图1为本发明的方法流程示意图;
图2为本发明的整体流程示意图;
图3为本发明的WLFM模型生成示意图;
图4为本发明的基于Attention机制的GRU网络连接示意图;
图5为本发明的基于Attention机制的池化网络示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
(1)采集用户的历史行为数据,针对隐式反馈的特性,使用基于隐式反馈的加权隐因子模型(WLFM),对用户的历史行为信息进行建模,学习得到用户和项目的隐因子向量,具体步骤如下:
(11)对用户历史行为数据rui进行归一化处理,通过引入一个二值变量pui,假设有m个用户和n个项目,将用户u对项目i的偏好二值化为偏好矩阵公式如下:
(12)偏好矩阵P中同时包含了正、负反馈信息,通过引入置信度变量cui,来衡量用户u对项目i的偏好的确定程度,公式如下:
其中,α和β是超参数如果用户对项目产生了交互行为,用户喜欢该项目的置信度cui为α,如果,用户对项目没有产生过行为,用户不喜欢该项目的置信度cui为β。并且β>α,因为在隐式反馈的情况下,相比于正反馈,用户对项目负反馈信息较少,置信变量的值相对来说就会很低。由此,通过用户偏好矩阵P得到了用户置信矩阵
(13)基于确定程度,通过WLFM模型将用户和项目映射到共同的潜在因子低维空间,其空间维度为K,通过最小化带正则项的平方误差损失,学习得到所有用户的隐因子向量和所有项目的隐因子向量其中,m表示用户的个数,n表示项目的个数,公式如下:
minX,Yu,icui(pui-xu Tyi)2xu||xu||2yi||yi||2
其中,WLFM模型使用基于概率的矩阵分解模型,模型的生成过程如下:
(131)对于每个用户u,使得用户隐因子向量
(132)对于每个项目i,使得项目隐因子向量
(133)对于每个用户项目组合(u,i),使其偏好值为:
其中,cui是pui的精度参数。IK是一个K维单位矩阵。WLFM模型的概率图表示如图3所示。通过最小化带正则项的平方误差损失,学习得到所有用户隐因子向量和所有项目隐因子向量公式如下:
式中,pui为用户u对项目i的实际偏好值,λx为xu的精度参数,λy为yi的精度参数;本发明加入了cui,能够更好地衡量用户偏好的确定程度。
(2)采集项目的文本内容数据,针对项目文本内容信息的特点,使用对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型,以WLFM模型学习得到的项目的隐因子向量作为标签训练基于Attention机制的GRU网络模型,具体步骤如下:
(21)使用基于Attention机制的GRU网络模型的输入层将项目的文本内容数据映射为单词序列x={x1,x2,x3,…,xT},其中,T是单词序列的长度,是一个对文本内容中第t个单词的独热编码表示(one-hot),V是数据集的单词表的大小,即代表所有不重复单词的个数,代表xt是一个V维向量,单词序列x严格考虑单词在项目文本中的顺序,为项目的文本表示保留时序信息;
(22)对于文本内容中第t个单词对应的t时刻,基于Attention机制的GRU网络模型的单词嵌入层通过线性映射将单词的独热编码表示xt转换成低维稠密向量et,公式如下:
et=Wext
其中,是单词嵌入层的参数,de是低维稠密矢量et的维度,We的每一列对应着单词表中的一个单词,通过网络的单词嵌入层来减少输入向量xt的维度;
(23)单词嵌入层的输出{e1,e2,e3,…,eT}被前馈到基于Attention机制的GRU网络模型的GRU层作为输入序列,GRU层中的GRU单元在t时刻的激活同时决定了GRU单元更新它的先前激活和候选激活的多少,公式如下:
zt=σ(Wzet+Uzht-1)
rt=σ(Wret+Urht-1)
其中,Wz、Uz、Wr、Ur、W为GRU层的参数,即网络训练时自动去学习所用参数,是网络作矩阵运算时的变量,zt表示更新门,rt表示复位门。更新门同时决定GRU单元更新它的先前激活和候选激活的多少。复位门有效地使单元忘记先前计算的状态或者最大程度地使用先前计算的状态来计算候选激活。ht-1表示先前激活,表示候选激活,ht表示t时刻的激活,对应GRU单元在t时刻的隐藏编码状态,可看作是第t个单词的向量表示;
(24)通过基于Attention的单词池化层将隐藏编码状态向量序列h={h1,h2,h3,…,hT}压缩成一个“上下文”向量c作为项目的文本内容表示,公式如下:
ut=vTtanh(Whht)
其中,向量v和矩阵Wh是基于Attention的单词池化层的参数,T是单词序列的长度,uk为第时刻k的原始分数,ut为第t个时间步的原始分数,αt表示将第t个时间步对应的原始分数进行softmax标准化得到的最终的分数,即应该对第t个隐藏编码状态ht给予多少关注。通过Attention网络对长度为T的隐藏编码状态序列h创建了一个维度为T的Attention向量α,它的第t个元素αt是对状态ht给予的关注分数,它表明了相应时间步t的重要性,称其为Attention分数;
(25)使用加权隐因子模型学习得到的项目的隐因子向量作为标签,对基于Attention机制的GRU网络模型进行训练,其目标函数如下:
其中,yi为项目i的隐因子向量,由加权隐因子模型学习得到,y′i为基于Attention机制的GRU网络模型对应的预测值,θ代表模型参数。
(3)对于未出现在用户历史行为数据中的新项目,从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量,然后将其与WLFM模型学习得到的用户隐因子向量直接匹配,并将匹配度进行排序,得到每个用户的新项目推荐列表,将通过基于Attention机制的GRU网络模型预测得到项目的隐因子向量与WLFM模型学习得到的用户隐因子向量直接匹配,并将匹配度进行排序得到每个用户的新项目推荐列表的步骤如下:
(31)对于未出现在用户历史行为数据中的新项目j,从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量yj
(32)将预测的新项目j的隐因子向量yj与加权隐因子模型学习得到的目标用户u的隐因子向量xu进行匹配,并将匹配度作为预测偏好值puj,计算公式如下:
Puj=xu Tyj
式中,T表示转置运算;
(33)计算目标用户u对所有新项目的预测偏好值后,得到目标用户u的待推荐新项目列表;
(34)对待推荐新项目列表中的项目进行排序,为每个用户选取前M个预测偏好值最高的项目,得到每个用户的新项目推荐列表。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于深度学习的推荐方法,其特征在于,如下步骤:
(1)对用户的历史行为数据的隐式反馈特性进行建模,建模后学习得到用户和项目的隐因子向量;
(2)将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型;
(3)对于未出现在用户历史行为数据中的新项目,将新项目的文本内容信息通过步骤(2)得到的网络模型预测得到项目的隐因子向量,然后将其与步骤(1)得到的用户隐因子向量直接匹配,并将匹配度进行排序,得到每个用户的新项目推荐列表。
2.根据权利要求1所述的一种基于深度学习的推荐方法,其特征在于:所述步骤(1)中,采用基于隐式反馈的加权因子模型对用户的历史行为数据的隐式反馈特性进行建模。
3.根据权利要求2所述的一种基于深度学习的推荐方法,其特征在于:所述步骤(1)的具体步骤如下:
(11)对用户历史行为数据rui进行归一化处理,通过引入一个二值变量pui,将用户u对项目i的偏好二值化为偏好矩阵其中,m表示用户的个数,n表示项目的个数;
(12)根据偏好矩阵并引入置信度变量cui,来衡量用户u对项目i的偏好的确定程度;
(13)基于确定程度,通过加权隐因子模型将用户和项目映射到共同的潜在因子低维空间,其空间维度为K,通过最小化带正则项的平方误差损失,学习得到所有用户的隐因子向量和所有项目的隐因子向量公式如下:
其中,pui为用户u对项目i的实际偏好值,xu为用户u的隐因子向量,λx为xu的精度参数,yi为项目i的隐因子向量,λy为yi的精度参数。
4.根据权利要求1-3任意一项所述的一种基于深度学习的推荐方法,其特征在于,所述步骤(2)中,将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型。
5.根据权利要求4所述的一种基于深度学习的推荐方法,其特征在于,所述步骤(2)的具体步骤如下:
(21)使用基于Attention机制的GRU网络模型的输入层将项目的文本内容数据映射为单词序列x={x1,x2,x3,…,xT},其中,T是单词序列的长度,是一个对文本内容中第t个单词的独热编码表示,V是数据集的单词表的大小,即代表所有不重复单词的个数,代表xt是一个V维向量;
(22)对于文本内容中第t个单词对应的t时刻,基于Attention机制的GRU网络模型的单词嵌入层通过线性映射将单词的独热编码表示xt转换成低维稠密向量et,公式如下:
et=Wext
其中,是单词嵌入层的参数,de是低维稠密矢量et的维度,We的每一列对应着单词表中的一个单词;
(23)单词嵌入层的输出{e1,e2,e3,…,eT}被前馈到基于Attention机制的GRU网络模型的GRU层作为输入序列,GRU层中的GRU单元在t时刻的激活同时决定了GRU单元更新它的先前激活和候选激活的多少,公式如下:
zt=σ(Wzet+Uzhf-1)
rt=σ(Wret+Urht-1)
其中,Wz、Uz、Wr、Ur、W为GRU层的参数,即网络训练时自动去学习所用参数,是网络作矩阵运算时的变量,zt是表示更新门,rt表示复位门,ht-1表示先前激活,表示候选激活,ht表示t时刻的激活,对应GRU单元在t时刻的隐藏编码状态,看作是第t个单词的向量表示;
(24)基于Attention的单词池化层将隐藏编码状态向量序列h={h1,h2,h3,…,hT}压缩成一个“上下文”向量c作为项目的文本内容表示,公式如下:
ut=vTtanh(Whht)
其中,向量v和矩阵Wh是基于Attention的单词池化层的参数,T是单词序列的长度,uk为第时刻k的原始分数,ut为第时刻t的原始分数,αt代表将时刻t对应的原始分数进行softmax标准化得到的最终的分数,即应该对第t个隐藏编码状态ht给予多少关注;
(25)使用加权隐因子模型学习得到的项目的隐因子向量作为标签,对基于Attention机制的GRU网络模型进行训练,得到训练好的基于Attention机制的GRU网络模型,其目标函数如下:
其中,yi为项目i的隐因子向量,由加权隐因子模型学习得到,y′i为基于Attention机制的GRU网络模型对应的预测值,θ代表模型参数,泛指网络需要训练的所有参数。
6.根据权利要求5所述的一种基于深度学习的推荐方法,其特征在于,所述步骤(3)的具体步骤如下:
(31)对于未出现在用户历史行为数据中的新项目j,从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量yj
(32)将预测的新项目j的隐因子向量yj与加权隐因子模型学习得到的目标用户u的隐因子向量xu进行匹配,并将匹配度作为预测偏好值puj,计算公式如下:
puj=xu Tyj
式中,T表示转置运算;
(33)计算目标用户u对所有新项目的预测偏好值后,得到目标用户u的待推荐新项目列表;
(34)对待推荐新项目列表中的项目进行排序,为每个用户选取前M个预测偏好值最高的项目,得到每个用户的新项目推荐列表。
CN201810536538.2A 2018-05-30 2018-05-30 一种基于深度学习的推荐方法 Active CN108763493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810536538.2A CN108763493B (zh) 2018-05-30 2018-05-30 一种基于深度学习的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810536538.2A CN108763493B (zh) 2018-05-30 2018-05-30 一种基于深度学习的推荐方法

Publications (2)

Publication Number Publication Date
CN108763493A true CN108763493A (zh) 2018-11-06
CN108763493B CN108763493B (zh) 2022-06-21

Family

ID=64004029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810536538.2A Active CN108763493B (zh) 2018-05-30 2018-05-30 一种基于深度学习的推荐方法

Country Status (1)

Country Link
CN (1) CN108763493B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446430A (zh) * 2018-11-29 2019-03-08 西安电子科技大学 产品推荐的方法、装置、计算机设备及可读存储介质
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109670121A (zh) * 2018-12-18 2019-04-23 辽宁工程技术大学 基于注意力机制的项目级和特征级深度协同过滤推荐算法
CN109871504A (zh) * 2019-01-24 2019-06-11 中国科学院软件研究所 一种基于异构信息网络与深度学习的课程推荐系统
CN110083770A (zh) * 2019-04-29 2019-08-02 苏州市职业大学 一种基于特征层面更深的自注意力网络的序列推荐方法
CN110162701A (zh) * 2019-05-10 2019-08-23 腾讯科技(深圳)有限公司 内容推送方法、装置、计算机设备和存储介质
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN110245303A (zh) * 2019-06-13 2019-09-17 成都品果科技有限公司 一种协同过滤推荐系统
CN110263250A (zh) * 2019-06-12 2019-09-20 深圳前海微众银行股份有限公司 一种推荐模型的生成方法及装置
CN110516160A (zh) * 2019-08-30 2019-11-29 中国科学院自动化研究所 基于知识图谱的用户建模方法、序列推荐方法
CN110689937A (zh) * 2019-09-05 2020-01-14 郑州金域临床检验中心有限公司 编码模型训练方法、系统、设备及检测项目编码方法
CN111104601A (zh) * 2019-12-26 2020-05-05 河南理工大学 一种对抗式多反馈层级成对个性化排名方法
CN111125530A (zh) * 2019-12-24 2020-05-08 中山大学 一种基于多类型特征深度学习的信息流推荐方法
CN111177577A (zh) * 2019-12-12 2020-05-19 中国科学院深圳先进技术研究院 一种群组的项目推荐方法、智能终端以及存储装置
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111274494A (zh) * 2020-01-20 2020-06-12 重庆大学 结合深度学习和协同过滤技术的复合标签推荐方法
CN111523940A (zh) * 2020-04-23 2020-08-11 华中科技大学 一种带负反馈的基于深度强化学习的推荐方法及系统
CN111652664A (zh) * 2019-03-04 2020-09-11 富士通株式会社 训练混合元学习网络的装置和方法
CN111782964A (zh) * 2020-06-23 2020-10-16 北京智能工场科技有限公司 一种社区帖子的推荐方法
CN111967578A (zh) * 2020-08-04 2020-11-20 厦门大学 基于非补偿决策机制的深度推荐系统框架的构建方法
CN112100221A (zh) * 2019-06-17 2020-12-18 腾讯科技(北京)有限公司 一种资讯推荐方法、装置、推荐服务器及存储介质
CN112115384A (zh) * 2020-08-14 2020-12-22 南京航空航天大学 一种基于生成排序的时序推荐算法
CN112202587A (zh) * 2019-07-08 2021-01-08 富士通株式会社 用于推荐和生成网络配置的方法和装置
CN112487200A (zh) * 2020-11-25 2021-03-12 吉林大学 一种改进的包含多重边信息与多任务学习的深度推荐方法
CN112818146A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于产品图像风格的推荐方法
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN113285721A (zh) * 2021-06-10 2021-08-20 北京邮电大学 一种面向稀疏移动感知数据的重构与预测算法
CN113436703A (zh) * 2021-07-02 2021-09-24 上海交通大学 基于神经网络的运动步数数据的运动模式推断方法及系统
CN113536785A (zh) * 2021-06-15 2021-10-22 合肥讯飞数码科技有限公司 一种文本推荐方法、智能终端及计算机可读存储介质
CN113722601A (zh) * 2021-09-07 2021-11-30 南方电网数字电网研究院有限公司 电力量测信息推荐方法、装置、计算机设备和存储介质
CN114689047A (zh) * 2022-06-01 2022-07-01 鹏城实验室 基于深度学习的组合导航方法、装置、系统及存储介质
US20220277740A1 (en) * 2021-02-26 2022-09-01 Walmart Apollo, Llc Methods and apparatus for improving search retrieval using inter-utterance context
CN116453385A (zh) * 2023-03-16 2023-07-18 中山市加乐美科技发展有限公司 一种跨时空盘学机
CN117573985A (zh) * 2024-01-16 2024-02-20 四川航天职业技术学院(四川航天高级技工学校) 一种应用于智能化在线教育系统的信息推送方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440352A (zh) * 2013-09-24 2013-12-11 中国科学院自动化研究所 基于深度学习的对象间的关联分析方法及其装置
US20160259857A1 (en) * 2015-03-06 2016-09-08 Microsoft Technology Licensing, Llc User recommendation using a multi-view deep learning framework
CN105975440A (zh) * 2016-05-05 2016-09-28 浙江理工大学 一种基于图计算模型的矩阵分解并行化方法
CN106327240A (zh) * 2016-08-11 2017-01-11 中国船舶重工集团公司第七0九研究所 一种基于gru神经网络的推荐方法和系统
US20170132509A1 (en) * 2015-11-06 2017-05-11 Adobe Systems Incorporated Item recommendations via deep collaborative filtering
CN107480575A (zh) * 2016-06-07 2017-12-15 深圳市商汤科技有限公司 模型的训练方法、跨年龄人脸识别方法和对应的装置
CN107506479A (zh) * 2017-09-12 2017-12-22 迅雷计算机(深圳)有限公司 一种对象推荐方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440352A (zh) * 2013-09-24 2013-12-11 中国科学院自动化研究所 基于深度学习的对象间的关联分析方法及其装置
US20160259857A1 (en) * 2015-03-06 2016-09-08 Microsoft Technology Licensing, Llc User recommendation using a multi-view deep learning framework
US20170132509A1 (en) * 2015-11-06 2017-05-11 Adobe Systems Incorporated Item recommendations via deep collaborative filtering
CN105975440A (zh) * 2016-05-05 2016-09-28 浙江理工大学 一种基于图计算模型的矩阵分解并行化方法
CN107480575A (zh) * 2016-06-07 2017-12-15 深圳市商汤科技有限公司 模型的训练方法、跨年龄人脸识别方法和对应的装置
CN106327240A (zh) * 2016-08-11 2017-01-11 中国船舶重工集团公司第七0九研究所 一种基于gru神经网络的推荐方法和系统
CN107506479A (zh) * 2017-09-12 2017-12-22 迅雷计算机(深圳)有限公司 一种对象推荐方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
T BANSAL 等: "Ask the GRU: Multi-Task Learning for Deep Text Recommendations", 《RECSYS "16: PROCEEDINGS OF THE 10TH ACM CONFERENCE ON RECOMMENDER SYSTEMS》 *
冯斐: "基于深度学习的推荐算法研究", 《中国优秀硕士学位论文全文数据库 哲学与人文科学辑》 *
史冬霞: "基于深度学习的推荐技术研究及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄立威 等: "基于深度学习的推荐系统研究综述", 《计算机学报》 *

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446430A (zh) * 2018-11-29 2019-03-08 西安电子科技大学 产品推荐的方法、装置、计算机设备及可读存储介质
CN109446430B (zh) * 2018-11-29 2021-10-01 西安电子科技大学 产品推荐的方法、装置、计算机设备及可读存储介质
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109544306B (zh) * 2018-11-30 2021-09-21 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN109670121A (zh) * 2018-12-18 2019-04-23 辽宁工程技术大学 基于注意力机制的项目级和特征级深度协同过滤推荐算法
CN109871504A (zh) * 2019-01-24 2019-06-11 中国科学院软件研究所 一种基于异构信息网络与深度学习的课程推荐系统
CN109871504B (zh) * 2019-01-24 2020-09-29 中国科学院软件研究所 一种基于异构信息网络与深度学习的课程推荐系统
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN111652664A (zh) * 2019-03-04 2020-09-11 富士通株式会社 训练混合元学习网络的装置和方法
CN110083770A (zh) * 2019-04-29 2019-08-02 苏州市职业大学 一种基于特征层面更深的自注意力网络的序列推荐方法
CN110162701B (zh) * 2019-05-10 2023-12-19 深圳市雅阅科技有限公司 内容推送方法、装置、计算机设备和存储介质
CN110162701A (zh) * 2019-05-10 2019-08-23 腾讯科技(深圳)有限公司 内容推送方法、装置、计算机设备和存储介质
CN110263250A (zh) * 2019-06-12 2019-09-20 深圳前海微众银行股份有限公司 一种推荐模型的生成方法及装置
CN110245303A (zh) * 2019-06-13 2019-09-17 成都品果科技有限公司 一种协同过滤推荐系统
CN112100221B (zh) * 2019-06-17 2024-02-13 深圳市雅阅科技有限公司 一种资讯推荐方法、装置、推荐服务器及存储介质
CN112100221A (zh) * 2019-06-17 2020-12-18 腾讯科技(北京)有限公司 一种资讯推荐方法、装置、推荐服务器及存储介质
CN112202587A (zh) * 2019-07-08 2021-01-08 富士通株式会社 用于推荐和生成网络配置的方法和装置
CN110516160A (zh) * 2019-08-30 2019-11-29 中国科学院自动化研究所 基于知识图谱的用户建模方法、序列推荐方法
CN110689937A (zh) * 2019-09-05 2020-01-14 郑州金域临床检验中心有限公司 编码模型训练方法、系统、设备及检测项目编码方法
CN111177577A (zh) * 2019-12-12 2020-05-19 中国科学院深圳先进技术研究院 一种群组的项目推荐方法、智能终端以及存储装置
CN111177577B (zh) * 2019-12-12 2023-03-28 中国科学院深圳先进技术研究院 一种群组的项目推荐方法、智能终端以及存储装置
CN111125530B (zh) * 2019-12-24 2023-04-28 中山大学 一种基于多类型特征深度学习的信息流推荐方法
CN111125530A (zh) * 2019-12-24 2020-05-08 中山大学 一种基于多类型特征深度学习的信息流推荐方法
CN111104601B (zh) * 2019-12-26 2022-09-13 河南理工大学 一种对抗式多反馈层级成对个性化排名方法
CN111104601A (zh) * 2019-12-26 2020-05-05 河南理工大学 一种对抗式多反馈层级成对个性化排名方法
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111209386B (zh) * 2020-01-07 2022-04-12 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111274494A (zh) * 2020-01-20 2020-06-12 重庆大学 结合深度学习和协同过滤技术的复合标签推荐方法
CN111274494B (zh) * 2020-01-20 2022-09-23 重庆大学 结合深度学习和协同过滤技术的复合标签推荐方法
CN111523940A (zh) * 2020-04-23 2020-08-11 华中科技大学 一种带负反馈的基于深度强化学习的推荐方法及系统
CN111782964A (zh) * 2020-06-23 2020-10-16 北京智能工场科技有限公司 一种社区帖子的推荐方法
CN111782964B (zh) * 2020-06-23 2024-02-09 北京智能工场科技有限公司 一种社区帖子的推荐方法
CN111967578A (zh) * 2020-08-04 2020-11-20 厦门大学 基于非补偿决策机制的深度推荐系统框架的构建方法
CN111967578B (zh) * 2020-08-04 2022-06-21 厦门大学 基于非补偿决策机制的深度推荐系统框架的构建方法
CN112115384A (zh) * 2020-08-14 2020-12-22 南京航空航天大学 一种基于生成排序的时序推荐算法
CN112487200A (zh) * 2020-11-25 2021-03-12 吉林大学 一种改进的包含多重边信息与多任务学习的深度推荐方法
CN112818146A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于产品图像风格的推荐方法
US20220277740A1 (en) * 2021-02-26 2022-09-01 Walmart Apollo, Llc Methods and apparatus for improving search retrieval using inter-utterance context
US11715469B2 (en) * 2021-02-26 2023-08-01 Walmart Apollo, Llc Methods and apparatus for improving search retrieval using inter-utterance context
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN113254777B (zh) * 2021-06-07 2021-09-24 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN113285721A (zh) * 2021-06-10 2021-08-20 北京邮电大学 一种面向稀疏移动感知数据的重构与预测算法
CN113536785A (zh) * 2021-06-15 2021-10-22 合肥讯飞数码科技有限公司 一种文本推荐方法、智能终端及计算机可读存储介质
CN113436703B (zh) * 2021-07-02 2022-07-15 上海交通大学 基于神经网络的运动步数数据的运动模式推断方法及系统
CN113436703A (zh) * 2021-07-02 2021-09-24 上海交通大学 基于神经网络的运动步数数据的运动模式推断方法及系统
CN113722601A (zh) * 2021-09-07 2021-11-30 南方电网数字电网研究院有限公司 电力量测信息推荐方法、装置、计算机设备和存储介质
CN114689047A (zh) * 2022-06-01 2022-07-01 鹏城实验室 基于深度学习的组合导航方法、装置、系统及存储介质
CN114689047B (zh) * 2022-06-01 2022-09-13 鹏城实验室 基于深度学习的组合导航方法、装置、系统及存储介质
CN116453385B (zh) * 2023-03-16 2023-11-24 中山市加乐美科技发展有限公司 一种跨时空盘学机
CN116453385A (zh) * 2023-03-16 2023-07-18 中山市加乐美科技发展有限公司 一种跨时空盘学机
CN117573985A (zh) * 2024-01-16 2024-02-20 四川航天职业技术学院(四川航天高级技工学校) 一种应用于智能化在线教育系统的信息推送方法及系统
CN117573985B (zh) * 2024-01-16 2024-04-05 四川航天职业技术学院(四川航天高级技工学校) 一种应用于智能化在线教育系统的信息推送方法及系统

Also Published As

Publication number Publication date
CN108763493B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN108763493A (zh) 一种基于深度学习的推荐方法
US11468262B2 (en) Deep network embedding with adversarial regularization
CN107918782B (zh) 一种生成描述图像内容的自然语言的方法与系统
CN110796190B (zh) 具有深度学习特征的指数建模
CN108984724B (zh) 利用高维表示提高特定属性情感分类准确率方法
CN110069778B (zh) 中文融入嵌入词位置感知的商品情感分析方法
EP3361423B1 (en) Learning system, learning device, learning method, learning program, teacher data creation device, teacher data creation method, teacher data creation program, terminal device, and threshold value changing device
CN111026869B (zh) 一种利用基于多层注意力的序列生成网络进行多罪名预测的方法
Karpathy Connecting images and natural language
CN112579778B (zh) 基于多层次的特征注意力的方面级情感分类方法
CN109492157A (zh) 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN110543242B (zh) 基于bert技术的表情输入法及其装置
CN111160467A (zh) 一种基于条件随机场和内部语义注意力的图像描述方法
CN110134868B (zh) 一种基于用户偏好异构性分析的推荐方法
Wu et al. Linguistic steganalysis with graph neural networks
CN106462626A (zh) 利用深度神经网络对兴趣度建模
CN113704546A (zh) 基于空间时序特征的视频自然语言文本检索方法
CN113297369B (zh) 基于知识图谱子图检索的智能问答系统
CN114925205B (zh) 基于对比学习的gcn-gru文本分类方法
CN111538841A (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
CN111062214A (zh) 基于深度学习的集成实体链接方法及系统
CN113505307B (zh) 一种基于弱监督增强的社交网络用户地域识别方法
CN114625879A (zh) 基于自适应变分编码器的短文本聚类方法
CN105678340B (zh) 一种基于增强型栈式自动编码器的自动图像标注方法
CN113378919B (zh) 融合视觉常识和增强多层全局特征的图像描述生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant