CN110245303A - 一种协同过滤推荐系统 - Google Patents
一种协同过滤推荐系统 Download PDFInfo
- Publication number
- CN110245303A CN110245303A CN201910513329.0A CN201910513329A CN110245303A CN 110245303 A CN110245303 A CN 110245303A CN 201910513329 A CN201910513329 A CN 201910513329A CN 110245303 A CN110245303 A CN 110245303A
- Authority
- CN
- China
- Prior art keywords
- layer
- user
- article
- interactive relation
- collaborative filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 37
- 230000002452 interceptive effect Effects 0.000 claims abstract description 34
- 238000003780 insertion Methods 0.000 claims abstract description 17
- 230000037431 insertion Effects 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 230000003993 interaction Effects 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010276 construction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种协同过滤推荐系统,包括:输入和嵌入层,用于对物品进行编码,形成嵌入向量层;并用于将用户历史数据映射到所述嵌入向量层;所述用户历史数据中包括物品交互集;成对交互层,用于对所述嵌入向量层进行计算,获取物品与用户之间的二阶交互关系;深层交互层,用于对所述二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系;结果预测层,用于根据所述高阶交互关系,输出预测值向量。本发明提供的技术方案,能够解决现有推荐系统推荐效果不理想、用户体验不好的问题。
Description
技术领域
本发明涉及信息推荐技术领域,尤其涉及一种协同过滤推荐系统。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,推荐系统在很多线上服务中发挥着关键作用,比如电商、资讯等等。而其中协同过滤是推荐系统中应用最广泛的算法。
协同过滤推荐的基本思想借鉴了日常在选购商品、选择餐饮店、选择看哪种电影等等的方法。如果身边的很多朋友都选购某种商品时,那么自己就会有很大概率选择该商品。或者用户喜欢某类商品,当看到和这类商品相似的商品并且其他用户对此类商品的评价很好时,相应的购买概率就会增加很多。协同过滤推荐一般分为两类:基于用户的协同推荐和基于物品的系统推荐。
基于用户的协同推荐,通过用户对不同物品的行为,来评测用户之间的相似性,基于用户之间的相似性作出推荐。这部分推荐本质上是给相似的用户推荐其他用户喜欢的内容。计算基于用户的协同过滤推荐的方法如下:
其中,N(i)表示对物品i有过行为的用户集合,Wuv表示用户u和用户v的相似度,rvi表示用户v对物品i的打分。用户之间的相似度可以采用“用户u发生正反馈的物品与用户v发生正反馈的物品交集除以两者的并集”来进行计算。
基于物品的系统过滤,并不单纯地计算物品之间的相似性,而是通过用户对物品的操作行为记录来计算物品与物品之间的相似度,从而预测出用户对物品的喜好程度。计算基于物品的系统过滤的推荐方法如下:
其中,N(u)表示用户关联的商品的集合,Wji表示物品j和i的相似度,rui表示用户u对物品i的打分。打分规则,一般情况下使用业务设定的规则即可,物品相似度一般采用“对物品j发生正向反馈的用户和对物品i发生正向反馈的用户交集除以物品i发生正向反馈的用户”来进行计算。
可见,现有的协同过滤算法往往是基于用户或者基于物品的单位度来进行推荐,由于矩阵的稀疏性和高纬性,导致推荐系统会忽略很多重要因子,从而造成推荐效果不理想,用户体验差。例如,根据某个用户历史数据喜欢自拍分类下的滤镜,那么在类似风格的滤镜被划分到其他分类时,现有的推荐算法就无法很好的推荐相关的滤镜产品。
发明内容
本发明旨在提供一种协同过滤推荐系统,能够解决现有推荐系统推荐效果不理想、用户体验不好的问题。
为达到上述目的,本发明采用的技术方案如下:
一种协同过滤推荐系统,包括:输入和嵌入层,用于对物品进行编码,形成嵌入向量层;并用于将用户历史数据映射到所述嵌入向量层;所述用户历史数据中包括物品交互集;成对交互层,用于对所述嵌入向量层进行计算,获取物品与用户之间的二阶交互关系;深层交互层,用于对所述二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系;结果预测层,用于根据所述高阶交互关系,输出预测值向量。
进一步地,还包括:池化层,用于对所述二阶交互关系进行向量长度固定,获取物品与用户之间的预定数据格式的二阶交互关系;所述深层交互层用于对所述预定数据格式的二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系。
优选地,采用加权平均算法对所述二阶交互关系进行向量长度固定,获取物品与用户之间的预定数据格式的二阶交互关系。
进一步地,所述池化层中还包括注意力机制模块。
进一步地,所述结果预测层还用于将所述预测值向量映射为分数。
优选地,采用one-hot编码方法对物品进行编码。
本发明实施例提供的协同过滤推荐系统,与现有的基于用户的协同过滤推荐方法以及基于物品的协同过滤推荐方法相比,利用深度神经网络的协同过滤方法引入了高阶群组特征,能够有效地提高推荐效果。
附图说明
图1为本发明实施例的系统结构图一;
图2为本发明实施例的系统结构图二。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
图1和图2为本发明实施例的系统结构图,包括:
一、输入和嵌入层,用于对物品进行编码,形成嵌入向量层;并用于将用户历史数据映射到所述嵌入向量层;所述用户历史数据中包括物品交互集;
具体地,针对物品i,使用其ID特征进行one-hot编码,则构成嵌入向量进而形成嵌入向量层;其中,k表示嵌入向量层的大小。
针对用户u,使用其历史数据中的物品交互集对于每个历史项将其映射到嵌入向量层嵌入层便是由用户u在物品集pi上的一组向量构成。
二、成对交互层,用于对所述嵌入向量层进行计算,获取物品与用户之间的二阶交互关系;
具体地,对嵌入向量层进行逐元素乘积来获得一组对应关系的向量,用以描述物品i和用户u的历史交互项之间的二阶交互关系,具体公式如下:
使用内积捕获二阶物品交互可以使得物品相似性矩阵具有低秩结构,便于更好的估计物品相似性。
三、池化层,用于对所述二阶交互关系进行向量长度固定,获取物品与用户之间的预定数据格式的二阶交互关系;
由于不同用户的历史物品交互的数量是变化的,所以成对交互层的输出的大小是不固定的。因此增加池化层用户操作可变大小成对交互层的输出向量,旨在产生固定大小的向量以便于进一步处理。此方案中采用加权平均算法来固定向量的长度,获取物品与用户之间的预定数据格式的二阶交互关系,公式如下:
其中,α是归一化超参数,用于控制大小不同的Vui上的平滑。当α为1时,则不适用平滑,池化层进行标准平均汇集;当α为0时,池化层适用标准加总汇集。因此α需要针对不同的数据集单独调整。比如当用户决定是否购买衣服时,应该用户之前购买的鞋子、帽子等服装类产品具有更大的影响,而不是数码类、电子类产品。
本实施例中,池化层中还可以引入注意力机制。
四、深层交互层,用于对所述二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系;所述深层交互层还用于对所述预定数据格式的二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系。
在池化层中输出的是纬度为k的向量,其包含了历史物品和目标项目之间的二阶交互关系。通过对所述二阶交互关系进行逐层特征提取,可获取物品与用户之间的高价交互关系。本实施例中,使用如下的公式来处理深度交互层的数据:
ei=ReLU(W1eui+b1)
e2=ReLU(W2e1+b2)
…
eL=ReLU(WLeL-1+bL)
其中,Wl,bl以及el表示第l个隐藏层的权重矩阵、偏置矢量激活函数和输出向量。当网络变深时,使用Relu作为激活函数,能够更好的抵抗饱和问题,并具有良好的性能。同时采用传统的塔式结构,可以使得每个隐藏层的大小可以调整。
五、结果预测层,用于根据所述高阶交互关系,输出预测值向量。
在深层交互层中输出了从二阶到高阶物品交互聚合的预测值向量eL,使用简单的线性回归模型将eL映射为分数,具体公式如下:
其中,z,bu,bi分别表示预测层的权重向量,用户偏差和物品偏差。用户偏差和物品偏差是为了捕捉不用物品对不同用户受欢迎程度的差异。
本发明实施例提供的协同过滤推荐系统,与现有的基于用户的协同过滤推荐方法以及基于物品的协同过滤推荐方法相比,利用深度神经网络的协同过滤方法引入了高阶群组特征,能够有效地提高推荐效果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种协同过滤推荐系统,其特征在于,包括:
输入和嵌入层,用于对物品进行编码,形成嵌入向量层;并用于将用户历史数据映射到所述嵌入向量层;所述用户历史数据中包括物品交互集;
成对交互层,用于对所述嵌入向量层进行计算,获取物品与用户之间的二阶交互关系;
深层交互层,用于对所述二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系;
结果预测层,用于根据所述高阶交互关系,输出预测值向量。
2.根据权利要求1所述的协同过滤推荐系统,其特征在于,还包括:
池化层,用于对所述二阶交互关系进行向量长度固定,获取物品与用户之间的预定数据格式的二阶交互关系;
所述深层交互层用于对所述预定数据格式的二阶交互关系进行逐层特征提取,获取物品与用户之间的高价交互关系。
3.根据权利要求2所述的协同过滤推荐系统,其特征在于,采用加权平均算法对所述二阶交互关系进行向量长度固定,获取物品与用户之间的预定数据格式的二阶交互关系。
4.根据权利要求2所述的协同过滤推荐系统,其特征在于,所述池化层中还包括注意力机制模块。
5.根据权利要求1所述的协同过滤推荐系统,其特征在于,所述结果预测层还用于将所述预测值向量映射为分数。
6.根据权利要求1所述的协同过滤推荐系统,其特征在于,采用one-hot编码方法对物品进行编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910513329.0A CN110245303A (zh) | 2019-06-13 | 2019-06-13 | 一种协同过滤推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910513329.0A CN110245303A (zh) | 2019-06-13 | 2019-06-13 | 一种协同过滤推荐系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110245303A true CN110245303A (zh) | 2019-09-17 |
Family
ID=67886993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910513329.0A Pending CN110245303A (zh) | 2019-06-13 | 2019-06-13 | 一种协同过滤推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110245303A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291274A (zh) * | 2020-03-02 | 2020-06-16 | 苏州大学 | 一种物品推荐方法、装置、设备及计算机可读存储介质 |
CN112328908A (zh) * | 2020-11-11 | 2021-02-05 | 北京工业大学 | 一种基于协同过滤的个性化推荐方法 |
CN112749265A (zh) * | 2021-01-08 | 2021-05-04 | 哈尔滨工业大学 | 一种基于多信息源的智能问答系统 |
CN112818256A (zh) * | 2021-02-05 | 2021-05-18 | 武汉大学 | 一种基于神经协同过滤的推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897254A (zh) * | 2015-12-18 | 2017-06-27 | 清华大学 | 一种网络表示学习方法 |
CN108320187A (zh) * | 2018-02-02 | 2018-07-24 | 合肥工业大学 | 一种基于深度社交关系的推荐方法 |
CN108763493A (zh) * | 2018-05-30 | 2018-11-06 | 深圳市思迪信息技术股份有限公司 | 一种基于深度学习的推荐方法 |
CN109087130A (zh) * | 2018-07-17 | 2018-12-25 | 深圳先进技术研究院 | 一种基于注意力机制的推荐系统及推荐方法 |
-
2019
- 2019-06-13 CN CN201910513329.0A patent/CN110245303A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897254A (zh) * | 2015-12-18 | 2017-06-27 | 清华大学 | 一种网络表示学习方法 |
CN108320187A (zh) * | 2018-02-02 | 2018-07-24 | 合肥工业大学 | 一种基于深度社交关系的推荐方法 |
CN108763493A (zh) * | 2018-05-30 | 2018-11-06 | 深圳市思迪信息技术股份有限公司 | 一种基于深度学习的推荐方法 |
CN109087130A (zh) * | 2018-07-17 | 2018-12-25 | 深圳先进技术研究院 | 一种基于注意力机制的推荐系统及推荐方法 |
Non-Patent Citations (1)
Title |
---|
许剑东: "基于深度神经网络的协同过滤推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291274A (zh) * | 2020-03-02 | 2020-06-16 | 苏州大学 | 一种物品推荐方法、装置、设备及计算机可读存储介质 |
CN112328908A (zh) * | 2020-11-11 | 2021-02-05 | 北京工业大学 | 一种基于协同过滤的个性化推荐方法 |
CN112749265A (zh) * | 2021-01-08 | 2021-05-04 | 哈尔滨工业大学 | 一种基于多信息源的智能问答系统 |
CN112818256A (zh) * | 2021-02-05 | 2021-05-18 | 武汉大学 | 一种基于神经协同过滤的推荐方法 |
CN112818256B (zh) * | 2021-02-05 | 2022-06-03 | 武汉大学 | 一种基于神经协同过滤的推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245303A (zh) | 一种协同过滤推荐系统 | |
Rathor et al. | Comparative study of machine learning approaches for Amazon reviews | |
CN104965889B (zh) | 内容推荐方法及装置 | |
CN110378731A (zh) | 获取用户画像的方法、装置、服务器及存储介质 | |
CN109087177A (zh) | 向目标用户推荐商品的方法、装置及计算机可读存储介质 | |
CN108334558A (zh) | 一种结合标签和时间因素的协同过滤推荐方法 | |
JP7210958B2 (ja) | 商品推薦装置及びプログラム | |
CN103678329A (zh) | 推荐方法及装置 | |
CN107329994A (zh) | 一种基于用户特征的改进协同过滤推荐方法 | |
CN111310038B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN108334592A (zh) | 一种基于内容与协同过滤相结合的个性化推荐方法 | |
CN104517216A (zh) | 增强推荐系统和方法 | |
CN109447762A (zh) | 商品推荐方法及其装置、服务器、商品推荐系统 | |
CN108268464A (zh) | 一种基于协同过滤与logistic回归的个性化推荐方法及装置 | |
CN109598586A (zh) | 一种基于注意力模型的推荐方法 | |
CN110046301A (zh) | 对象推荐方法和装置 | |
CN107133811A (zh) | 一种目标用户的识别方法和装置 | |
CN109934654A (zh) | 商品推荐方法和系统 | |
CN107133843A (zh) | 一种基于协同过滤的商品推荐方法 | |
Zheng et al. | Incorporating price into recommendation with graph convolutional networks | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
Kim et al. | Recommender systems using SVD with social network information | |
CN109146644A (zh) | 一种电子商务系统 | |
Srivastava et al. | Transfer learning for resolving sparsity problem in recommender systems: human values approach | |
CN106682929B (zh) | 信息分析方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190917 |