CN113627598B - 一种用于加速推荐的孪生自编码器神经网络算法及系统 - Google Patents
一种用于加速推荐的孪生自编码器神经网络算法及系统 Download PDFInfo
- Publication number
- CN113627598B CN113627598B CN202110936911.5A CN202110936911A CN113627598B CN 113627598 B CN113627598 B CN 113627598B CN 202110936911 A CN202110936911 A CN 202110936911A CN 113627598 B CN113627598 B CN 113627598B
- Authority
- CN
- China
- Prior art keywords
- encoder
- recommendation
- user
- commodity
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Abstract
本发明涉及人工智能技术领域,具体涉及一种用于加速推荐的孪生自编码器神经网络算法及系统;该神经网络架构以孪生神经网络为主体,两个权重共享的单元是自编码器,从而实现了神经网络联合学习用户和商品表示。本发明对现有推荐系统友好,不需要重新训练整个模型,在推荐系统处理基于相似度搜索的推荐任务时,相比于常见的推荐方法速度上更快,所需空间更少;相比常见的离散推荐方法推荐更准确。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种用于加速推荐的孪生自编码器神经网络算法及系统。
背景技术
随着计算机科学技术的发展,在线商品和服务的种类和数量急剧增加,用户发现感兴趣的商品变得日益困难。推荐系统通过预先匹配用户和商品节省了用户发现商品的时间和精力,提高了在线商品服务平台效率。它被公认为解决用户信息过载问题的有效方法,被大量网上商城、音视频网站使用。基于矩阵分解的协同过滤是推荐系统中的一类重要方法,它将用户对商品的评分矩阵分解为用户和商品的低维隐因子空间,然后用户对商品的偏好通过用户和商品的向量内积表示,对所有内积结果进行排序得到推荐列表。
由于用户和商品的数量巨大,用实值来表示用户和商品占用大量磁盘、内存空间,且基于实值的推荐速度受限。
发明内容
本发明的目的在于提供一种用于加速推荐的孪生自编码器神经网络算法及系统,旨在解决现有技术中由于用户和商品的数量巨大,用实值来表示用户和商品占用大量磁盘、内存空间,且基于实值的推荐速度受限的技术问题。
为实现上述目的,本发明提供了一种用于加速推荐的孪生自编码器神经网络算法,包括如下步骤:
获取基础推荐系统,将用户和商品映射到低维隐因子空间;
预训练孪生自编码器神经网络算法,获取用于离散推荐的用户低维二值表示和商品低维二值表示;
将编码器集成到现有推荐系统,提高推荐速度。
其中,在获取基础推荐系统,将用户和商品映射到低维隐因子空间的步骤中:
将用户和商品映射到低维隐因子空间后,用户对商品的偏好,使用两者的内积表示,用户和商品因子之间的高相似度将引起推荐,通过学习用户向量矩阵和商品向量矩阵,获取用户表示矩阵和商品表示矩阵。
其中,在预训练孪生自编码器神经网络算法,获取用于离散推荐的用户低维二值表示和商品低维二值表示的步骤中:
孪生神经网络包括用户表示自编码器和商品表示自编码器,自编码器用于实现从原始高维实值向量到低维二值向量的变换。
其中,在预训练孪生自编码器神经网络算法,获取用于离散推荐的用户低维二值表示和商品低维二值表示的步骤中:
自编码器的目标函数包括重构项、正则项和评分误差项。
其中,在将编码器集成到基础推荐系统,提高推荐速度的步骤中:
孪生神经网络训练完成后,将孪生自编码器神经网络算法分别插入到推荐系统的用户表示和商品表示后面,并修改推荐的函数使用基于海明距离的相似度函数。
本发明还提供一种采用上述所述的用于加速推荐的孪生自编码器神经网络算法的推荐系统,所述推荐系统包括采集模块、编码模块和修改模块,所述采集模块与所述编码模块网络连接,所述采集模块用于获取基础推荐系统的用户和商品数据,所述编码模块根据用户和商品数据进行预训练,获得用户表示自编码器和商品表示自编码器,所述修改模块与所述编码模块网络连接,所述修改模块将用户表示自编码器和商品表示自编码器集成到基础推荐系统。
本发明的一种用于加速推荐的孪生自编码器神经网络算法及系统,该神经网络架构以孪生神经网络为主体,两个权重共享的单元是自编码器,从而实现了神经网络联合学习用户和商品表示。本发明对现有推荐系统友好,不需要重新训练整个模型,在推荐系统处理基于相似度搜索的推荐任务时,相比于常见的推荐方法速度上更快,所需空间更少;相比常见的离散推荐方法推荐更准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的孪生自编码器网络结构示意图。
图2是本发明提供的应用离散编码器提高推荐效率步骤图。
图3是本发明提供的一种用于加速推荐的孪生自编码器神经网络算法的步骤流程图。
图4是本发明和其他方法对比实验结果。
图5是本发明和基础推荐系统时间使用对比结果。
图6是本发明和基础推荐系统空间使用对比结果。
具体实施方式
请参阅图1至图3,本发明提供一种用于加速推荐的孪生自编码器神经网络算法,包括如下步骤:
S1:获取基础推荐系统,将用户和商品映射到低维隐因子空间;
S2:预训练孪生自编码器神经网络算法,获取用于离散推荐的用户低维二值表示和商品低维二值表示;
S3:将编码器集成到现有推荐系统,提高推荐速度。
其中,在步骤S1中,获取基础推荐系统,以基于矩阵分解的协同过滤推荐系统为例,它的核心是将用户和商品映射到低维隐因子空间,然后用户对商品的偏好可以使用两者的内积表示,用户和商品因子之间的高相似度将引起推荐,假设ui是i个用户向量,vj是第j个商品向量,用户i对商品j的偏好使用表示,它的核心是学习用户向量矩阵U=[u1,...,um]∈Rr×m和商品向量矩阵V=[v1,...,vn]∈Rr×n,学习这两个隐因子矩阵的目标函数是:
Sij是观察到的评分,它的索引集合为k,可以使用随机梯度下降算法(stochasticgradient descent,简称SGD)或交替最小平方(alternating least squares,简称ALS)优化,获取用户表示矩阵U和商品表示矩阵V。
在步骤S2中,预训练孪生自编码器神经网络算法。孪生自编码器神经网络算法的目的是获取用于离散推荐的用户低维二值表示和商品低维二值表示。本发明使用自编码器实现从原始高维实值向量到低维二值向量的变换。孪生神经网络包括两个自编码器:用户表示自编码器和商品表示自编码器;
自编码器的编码器是原始表示映射到低维隐空间,然后使用赫维赛德函数二值化表示。第i个用户和第j个商品的自编码器变换是:
bi=Φ(ui)=h(WT·ui)
dj=Φ(vj)=h(WT·vj)
h(·)表示赫维赛德:函数。自编码器的解码器将bi和dj重构回原始表示,解码器变换是:
这里c是偏置向量,f(·)是双曲正切函数。解码器的变换矩阵W和编码器一致,
克服了编码器梯度截断造成反向传播优化失败问题:训练孪生自编码器神经网络算法时,解码器的梯度更新作用于权重矩阵,从而编码器的权重也可以更新;
孪生自编码器的目标函数包括三项:重构项、正则项和评分误差项;
重构项是自编码器的核心,负责监督从原始向量表示在重构前后保持不变。第i个用户和第j个商品表示的重构项是:
正则项负责降低不同维度间的信息冗余,写作:
评分误差项负责微调重构的隐因子向量,写作:
在步骤S3中,将编码器集成到现有推荐系,目的是应用编码器提高推荐速度包括两个子步骤:
其一,将训练好的孪生神经网络的编码器分别插入到推荐系统的用户表示和商品表示后面;
其二修改推荐的函数使用基于海明距离的相似度函数:
请参阅图4至图6,本发明还提供一种采用上述所述的用于加速推荐的孪生自编码器神经网络算法的推荐系统,所述推荐系统包括采集模块、编码模块和修改模块,所述采集模块与所述编码模块网络连接,所述采集模块用于获取基础推荐系统的用户和商品数据,所述编码模块根据用户和商品数据进行预训练,获得用户表示自编码器和商品表示自编码器,所述修改模块与所述编码模块网络连接,所述修改模块将用户表示自编码器和商品表示自编码器集成到基础推荐系统。
在本实施方式中,本系统与基准推荐系统MF(matrix factorization)和代表性的离散推荐算法BCCF(Learning Binary Codes for Collaborative Filtering)、DCF(Discrete Collaborative Filtering)作对比,实验使用公开数据集Yelp。从两方面对比不同的方法和系统:推荐准确度和推荐效率;
推荐准确度使用NDCG作评价指标,实验中NDCG中的K值设置为{4,8,12,16,20},以下为数据集的属性和四种方法的实验结果,其中SAE代表本发明提出的孪生自编码器(Siamese Autoencoder,简称SAE),对比结果参阅图4,由实验结果可知,本发明提出的孪生自编码器神经网络算法超出同类型的离散推荐算法BCCF和基准推荐系统MF的推荐性能十分接近。这说明本发明在离散推荐中具有优势。推荐效率从时间效率和空间效率展开对比,对比的对象是基础推荐系统(因离散推荐算法具有相同的时间效率和空间效率,因此未列入对比)。时间效率实验是为目标用户从1000个商品中检索最近的5个返回,记录原始推荐系统和本发明耗费时间;空间效率实验是计算原始表示和不同离散表示占用的空间对比,实验结果请参阅图5和图6;从实验结果可知,本发明提出的方法相对基础推荐系统极大降低空间使用,推荐速度也极大提高。这说明本发明在推荐的时间效率和空间效率上具有优势;
综上,本发明方法在提高推荐系统的时间和空间效率上有一定优势,且可实现接近原始推荐系统的推荐精确度。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (4)
1.一种用于加速推荐的孪生自编码器神经网络算法,其特征在于,包括如下步骤:
获取基础推荐系统,将用户和商品映射到低维隐因子空间;
预训练孪生自编码器神经网络算法,获取用于离散推荐的用户低维二值表示和商品低维二值表示,孪生神经网络包括用户表示自编码器和商品表示自编码器,自编码器用于实现从原始高维实值向量到低维二值向量的变换,自编码器的编码器是原始表示映射到低维隐空间,然后使用赫维赛德函数二值化表示;第i个用户和第j个商品的自编码器变换是:
bi=Φ(ui)=h(WT·ui)
dj=Φ(vj)=h(WT,vj)
ui是第i个用户向量,vj是第j个商品向量,W是变化矩阵,h(·)表示赫维赛德函数,自编码器的解码器将bi和dj重构回原始表示,解码器变换是:
c是偏置向量,f(·)是双曲正切函数,解码器的变换矩阵W和编码器一致;
自编码器的目标函数包括重构项、正则项和评分误差项,重构项是自编码器的核心,负责监督从原始向量表示在重构前后保持不变,第i个用户和第j个商品表示的重构项是:
正则项负责降低不同维度间的信息冗余,写作:
评分误差项负责微调重构的隐因子向量,写作:
α为重构项权重,β为正则化项权重,γ为评分误差平方项权重;
将编码器集成到现有推荐系统,提高推荐速度。
2.如权利要求1所述的一种用于加速推荐的孪生自编码器神经网络算法,其特征在于,在获取基础推荐系统,将用户和商品映射到低维隐因子空间的步骤中:
将用户和商品映射到低维隐因子空间后,用户对商品的偏好,使用两者的内积表示,用户和商品因子之间的高相似度将引起推荐,通过学习用户向量矩阵和商品向量矩阵,获取用户表示矩阵和商品表示矩阵。
3.如权利要求2所述的一种用于加速推荐的孪生自编码器神经网络算法,其特征在于,在将编码器集成到基础推荐系统,提高推荐速度的步骤中:
孪生神经网络训练完成后,将孪生自编码器神经网络算法分别插入到推荐系统的用户表示和商品表示后面,并修改推荐的函数使用基于海明距离的相似度函数。
4.采用如权利要求3所述的用于加速推荐的孪生自编码器神经网络算法的推荐系统,其特征在于,
所述推荐系统包括采集模块、编码模块和修改模块,所述采集模块与所述编码模块网络连接,所述采集模块用于获取基础推荐系统的用户和商品数据,所述编码模块根据用户和商品数据进行预训练,获得用户表示自编码器和商品表示自编码器,所述修改模块与所述编码模块网络连接,所述修改模块将用户表示自编码器和商品表示自编码器集成到基础推荐系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110936911.5A CN113627598B (zh) | 2021-08-16 | 2021-08-16 | 一种用于加速推荐的孪生自编码器神经网络算法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110936911.5A CN113627598B (zh) | 2021-08-16 | 2021-08-16 | 一种用于加速推荐的孪生自编码器神经网络算法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113627598A CN113627598A (zh) | 2021-11-09 |
CN113627598B true CN113627598B (zh) | 2022-06-07 |
Family
ID=78385664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110936911.5A Active CN113627598B (zh) | 2021-08-16 | 2021-08-16 | 一种用于加速推荐的孪生自编码器神经网络算法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627598B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304556A (zh) * | 2018-02-06 | 2018-07-20 | 中国传媒大学 | 基于内容与协同过滤相结合的个性化推荐方法 |
CN109993595A (zh) * | 2017-12-29 | 2019-07-09 | 北京三星通信技术研究有限公司 | 个性化推荐商品及服务的方法、系统及设备 |
CN110473040A (zh) * | 2018-05-10 | 2019-11-19 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN111104604A (zh) * | 2019-11-25 | 2020-05-05 | 北京交通大学 | 基于哈希学习的轻量级社会化推荐方法 |
CN111161022A (zh) * | 2019-12-26 | 2020-05-15 | 汉口北进出口服务有限公司 | 一种商品推荐方法及装置 |
CN112150238A (zh) * | 2020-09-07 | 2020-12-29 | 湖北工业大学 | 一种基于深度神经网络的商品推荐方法及系统 |
CN112231582A (zh) * | 2020-11-10 | 2021-01-15 | 南京大学 | 一种基于变分自编码数据融合的网站推荐方法和设备 |
CN112508114A (zh) * | 2020-12-14 | 2021-03-16 | 武汉纺织大学 | 一种智能服装推荐系统及方法 |
CN112889074A (zh) * | 2018-10-29 | 2021-06-01 | 三菱电机株式会社 | 解码方法、计算机程序产品和设备 |
WO2021126076A1 (en) * | 2019-12-18 | 2021-06-24 | Pt Aplikasi Karya Anak Bangsa | Methods and systems for recommendation using a neural network |
CN113178242A (zh) * | 2021-04-25 | 2021-07-27 | 山西中医药大学 | 一种基于耦合式生成对抗网络的自动计划优化系统 |
CN113192626A (zh) * | 2021-04-13 | 2021-07-30 | 山东大学 | 基于孪生神经网络的用药方案推荐系统及方法 |
CN113256367A (zh) * | 2021-04-25 | 2021-08-13 | 西安交通大学 | 基于用户行为历史数据的商品推荐方法、系统、设备及介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8661042B2 (en) * | 2010-10-18 | 2014-02-25 | Hewlett-Packard Development Company, L.P. | Collaborative filtering with hashing |
CN106327240A (zh) * | 2016-08-11 | 2017-01-11 | 中国船舶重工集团公司第七0九研究所 | 一种基于gru神经网络的推荐方法和系统 |
US10872087B2 (en) * | 2017-10-13 | 2020-12-22 | Google Llc | Systems and methods for stochastic generative hashing |
CN108564107A (zh) * | 2018-03-21 | 2018-09-21 | 温州大学苍南研究院 | 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法 |
CN113222100A (zh) * | 2020-02-05 | 2021-08-06 | 北京三星通信技术研究有限公司 | 神经网络模型的训练方法和装置 |
-
2021
- 2021-08-16 CN CN202110936911.5A patent/CN113627598B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993595A (zh) * | 2017-12-29 | 2019-07-09 | 北京三星通信技术研究有限公司 | 个性化推荐商品及服务的方法、系统及设备 |
CN108304556A (zh) * | 2018-02-06 | 2018-07-20 | 中国传媒大学 | 基于内容与协同过滤相结合的个性化推荐方法 |
CN110473040A (zh) * | 2018-05-10 | 2019-11-19 | 北京三快在线科技有限公司 | 一种产品推荐方法及装置,电子设备 |
CN112889074A (zh) * | 2018-10-29 | 2021-06-01 | 三菱电机株式会社 | 解码方法、计算机程序产品和设备 |
CN111104604A (zh) * | 2019-11-25 | 2020-05-05 | 北京交通大学 | 基于哈希学习的轻量级社会化推荐方法 |
WO2021126076A1 (en) * | 2019-12-18 | 2021-06-24 | Pt Aplikasi Karya Anak Bangsa | Methods and systems for recommendation using a neural network |
CN111161022A (zh) * | 2019-12-26 | 2020-05-15 | 汉口北进出口服务有限公司 | 一种商品推荐方法及装置 |
CN112150238A (zh) * | 2020-09-07 | 2020-12-29 | 湖北工业大学 | 一种基于深度神经网络的商品推荐方法及系统 |
CN112231582A (zh) * | 2020-11-10 | 2021-01-15 | 南京大学 | 一种基于变分自编码数据融合的网站推荐方法和设备 |
CN112508114A (zh) * | 2020-12-14 | 2021-03-16 | 武汉纺织大学 | 一种智能服装推荐系统及方法 |
CN113192626A (zh) * | 2021-04-13 | 2021-07-30 | 山东大学 | 基于孪生神经网络的用药方案推荐系统及方法 |
CN113178242A (zh) * | 2021-04-25 | 2021-07-27 | 山西中医药大学 | 一种基于耦合式生成对抗网络的自动计划优化系统 |
CN113256367A (zh) * | 2021-04-25 | 2021-08-13 | 西安交通大学 | 基于用户行为历史数据的商品推荐方法、系统、设备及介质 |
Non-Patent Citations (5)
Title |
---|
Learning Binary Code for Personalized Fashion Recommendation;Zhi Lu 等;《CVPR》;20200109;第10554-10562页 * |
Learning Deep Binary Descriptor with Multi-Quantization;Yueqi Duan 等;《 IEEE Transactions on Pattern Analysis and Machine Intelligence》;20180723;第41卷(第8期);第1924-1938页 * |
SDDRS: Stacked Discriminative Denoising Auto-Encoder based Recommender System;KaiWang 等;《Cognitive Systems Research》;20190630;第55卷;第164-174页 * |
基于跨模态哈希学习的大规模推荐系统;李傲;《中国硕士学位论文全文数据库》;20190115;第4章 * |
改进的哈希学习高效推荐算法;应文杰 等;《计算机工程与应用》;20190403;第56卷(第9期);第75-83页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113627598A (zh) | 2021-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hastie et al. | Unsupervised learning | |
CN111680217A (zh) | 内容推荐方法、装置、设备及存储介质 | |
CN112364937B (zh) | 用户类别确定方法及装置、推荐内容确定方法、电子设备 | |
CN113177141B (zh) | 基于语义嵌入软相似性的多标签视频哈希检索方法及设备 | |
CN112395438A (zh) | 一种多标签图像的哈希码生成方法和系统 | |
CN112395487B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN112148831B (zh) | 图文混合检索方法、装置、存储介质、计算机设备 | |
CN114417058A (zh) | 一种视频素材的筛选方法、装置、计算机设备和存储介质 | |
CN116522143B (zh) | 模型训练方法、聚类方法、设备及介质 | |
CN113627598B (zh) | 一种用于加速推荐的孪生自编码器神经网络算法及系统 | |
CN112035689A (zh) | 一种基于视觉转语义网络的零样本图像哈希检索方法 | |
CN115640418B (zh) | 基于残差语义一致性跨域多视角目标网站检索方法及装置 | |
CN115048682B (zh) | 一种土地流转信息的安全存储方法 | |
CN115797795A (zh) | 基于强化学习的遥感影像问答式检索系统及方法 | |
Manoharan et al. | A comparison and analysis of soft computing techniques for content based image retrieval system | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
CN117194966A (zh) | 对象分类模型的训练方法和相关装置 | |
Liu et al. | Filter pruning by quantifying feature similarity and entropy of feature maps | |
CN112364192A (zh) | 一种基于集成学习的零样本哈希检索方法 | |
CN117078988A (zh) | 基于中心点检测与聚类的重复性单个物体提取方法 | |
CN117036743A (zh) | 哈希模型训练方法、检索方法和装置 | |
CN116932806A (zh) | 一种基于特征关联表示的图文检索方法 | |
CN117474362A (zh) | 企业转型升级的方案信息处理方法、装置及设备 | |
CN114692752A (zh) | 客户画像构建方法及装置、存储介质及电子设备 | |
CN117495563A (zh) | 基于深度神经网络的股票算法交易方法、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |