CN110263256B - 基于多模态异质信息的个性化推荐方法 - Google Patents
基于多模态异质信息的个性化推荐方法 Download PDFInfo
- Publication number
- CN110263256B CN110263256B CN201910544396.9A CN201910544396A CN110263256B CN 110263256 B CN110263256 B CN 110263256B CN 201910544396 A CN201910544396 A CN 201910544396A CN 110263256 B CN110263256 B CN 110263256B
- Authority
- CN
- China
- Prior art keywords
- user
- spot
- scenic
- preference
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000001914 filtration Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 39
- 238000012512 characterization method Methods 0.000 claims description 38
- 239000013598 vector Substances 0.000 claims description 22
- 238000005457 optimization Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012552 review Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 3
- 230000003993 interaction Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多模态异质信息的个性化推荐方法。主要解决现有技术推荐准确率低的问题。其方案为:采集用户旅游历史记录及景点的多模态异质信息;构建景点多模态特征集,并滤除噪声景点及用户信息;将用户访问记录按时间作为划分为训练集和测试集;利用景点多模态特征集中的不同特征分别结合用户的交互记录利用隐语义模型及神经网络构建个性化推荐模型来预测用户对景点的偏好;对个性化推荐模型进行优化得到优化好的推荐模型;利用优化好的推荐模型得到用户对测试目的地中所有景点的偏好分数,将评分最大的几个景点推荐给用户。本发明通过考虑景点的多模态特征可从不同视角挖掘用户偏好,能更有效的推断用户的旅行偏好,提高了推荐准确率。
Description
技术领域
本发明属于计算机数据处理技术领域,更进一步涉及一种个性化推荐方法,可用于旅游景点的推荐。
背景技术
近年来旅游业发展迅速,越来越多的人在旅游网站上分享自己的旅程导致信息量呈指数爆炸。个性化的旅游推荐能帮助人们从庞大的旅游信息中发现自己感兴趣的地点有效的解决信息过载的问题。向用户提供更智能的旅行建议,已经成为学术界和工业界的一个热门课题。
现有旅游推荐方法,主要分为协同过滤方法和基于内容的推荐方法。但是有限的用户旅游记录导致用户-景点矩阵十分稀疏,而协同过滤的方法当交互数据稀疏时预测准确率会严重下降。基于内容的推荐算法利用各种的辅助信息可以缓解数据稀疏问题。但现有的一些方法仅挖掘文本信息及旅游记录景点推荐,然而这些方法仅利用单模态的文本信息,忽略了其他模态的信息,例如景点外貌特征等。研究表明多模态的异质信息对提供个性化推荐极为重要。不同的异质反馈信息从不同方面放映了用户偏好,例如:数值评分表示用户对产品的整体态度;文本评论能够表达用户对各种产品特性的意见;而产品图像则揭示了用户对产品不同视觉的偏好。然而,这些多模态信息的异质性使得它们很难以统一的方式在推荐算法中发挥作用,难以充分利用多模态信息成为限制个性化旅游推荐准确性的一个直接问题。实际上,人们的旅游决策过程可能受地域风格和景点的地域流行度的影响,用户在不同的目的地会表达出不同的兴趣。此外,景点图像的视觉吸引力也是旅游中一个重要的影响因素,不同的用户会有不同的美学偏好,而这些因素在旅游推荐算法中常被忽视。因而现有方法存在两方面的缺点:一是不能同时考虑用户在不同地域下的动态偏好及景点的多模态特征进行个性化的推荐,二是没有考虑景点多视角的特征对不同用户旅游决策的不同程度的影响抑制了推荐的准确率。
发明内容
本发明的目的在于针对上述现有技术存在的不足,提出了一个基于多模态异质信息的个性化推荐方法,利用多视图深度表示学习和注意力机制,同时考虑用户的在不同地域下的兴趣差异和景点的不同多模态特征对用户旅游决策的影响,为用户推荐符合他们兴趣的旅游景点,提高推荐准确率。
实现本发明上述目的的技术方案是:采集旅游数据并建立构建景点多模态特征集,利用多视图深度表示学习和贝叶斯个性化排序优化策略从多个视角自动学习用户的偏好融合得到最终预测结果。其具体步骤包括如下:
(1)采集用户访问记录信息及景点的多模态异质信息,并存储至数据库,该多模态信息包括景点的评分,图像和评论;
(2)根据采集的多模态异质景点信息生成景点的多模态特征集,并根据用户的访问记录时间将每个用户的最新旅游目的地的旅游记录作为测试数据,剩下的历史旅游记录和景点的多模态特征集作为训练数据;该多模态特征集包括景点的评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C;
(3)利用隐语义模型及神经网络构建个性化推荐模型Y,输入训练数据,采用贝叶斯个性化成对排序优化方法及端到端随机梯度下降算法来优化模型Y得到优化后的模型Y*;
其中k∈B,B={s,t,p,l},其中s代表评分特征视图,t代表评论特征视图,p代表图像特征视图,l代表地域流行度特征视图;v∈V分别表示景点id,V表示数据集中所有景点的集合,u∈U表示用户id,U表示数据集中所有用户的集合;uk*,vk*,表示不同视图下用户和景点的表征,表示用户u对景点v不同特征的偏好程度;g是sigmoid函数,Φ为内积函数;
(4)将用户id及景点的多模态特征,即评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C,输入到优化好的模型Y*,得到用户对景点的最终得分;
(5)根据用户对测试目的地的所有景点的评分,按照评分排序得出评分最大的几个景点推荐给用户。
本发明与现有技术相比具有以下优点:
1.本发明由于使用从多模态的异质数据中从多视角挖掘用户的偏好,并考虑用户的旅游决策过程受到景点多视角多模态特征的不同影响,相比现有技术仅利用文本信息从单一角度挖掘用户偏好,能更全面的推断用户偏好。
2.本发明由于考虑了景点的区域流行度,并将根据景点的区域流行度生成的具有地域特征的群体偏好与用户偏好融合,有效解决用户在不同区域的旅游偏好的动态差异问题,提高了推荐准确率。
附图说明
图1是本发明的实现流程图;
图2是本发明中的构建的文本卷积网络结构图。
具体实施方式
下面结合附图对本发明的实施做进一步的详细描述。
参照图1,本实例的实现步骤如下:
步骤1.采集用户旅游访问记录及景点的多模态异质信息。
从旅游网站上采集用户的用户旅游访问记录及景点的多模态异质信息,该多模态信息包括景点的评分、图像、评论和访问人数。
步骤2.构建景点多模态特征集及数据预处理。
(2.1)根据(1)采集的多模态异质景点信息生成景点的多模态特征集:
该多模态特征集包括景点的评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C,其中:
景点的文本评论特征TC,是将所有访问过景点的用户评论先进行分词、过滤无用词,再利用训练好的word2vec词向量模型将每个词映射为一个低维向量,然后利用景点评论的中所有单词的词向量构成景点的文本内容特征矩阵TC;
景点图像特征MP,是利用一个训练好的图像美学评估网络NIMA提取得到;
景点的评分特征X,为所有用户对景点的评分信息组成的向量;
景点区域流行度特征C,为景点被所有用户的访问过的次数;
(2.2)对(1)中采集的用户访问记录信息滤除一些访问景点数不足十个的噪声用户记录,并滤除对采集的景点中访问人数不足10人的景点,得到最终用于训练和测试的用户访问记录及景点。
步骤3.划分训练数据和测试数据。
对步骤(2)中预处理后的数据,根据用户访问记录时间将每个用户的最新旅游目的地的旅游记录作为测试数据,剩下的历史旅游记录和景点的多模态特征集作为训练数据。
步骤4.利用隐语义模型及神经网络构建个性化推荐模型Y。
4.1)构建一个文本卷积网络Textcnn:
如图2所示,该网络结构依此为:一个卷积层,一个最大池化层,一个全连接层,其中卷积层使用三个1*60,2*60,3*60的卷积核;
将景点的文本特征TC输入到该Textcnn网络,输出得到相应的景点表征向量vt;
构建相应用户集合U的文本偏好表征矩阵Ut,该表征矩阵中每一行代表一个用户相应的表征向量ut,将用户表征向量ut和景点表征向量vt做内积,得到用户对景点文本特征的偏好得分预测为:yt=Φ(ut,vt);
4.2)构建一个多层感知机MLP网络Netp:
该网络结构依次为两个维度为1024*512,512*60的全连接层,其中1024为景点图像特征MP的维度;
将景点图像特征MP输入到Netp网络,得到输出的相应景点表征vp;
构建相应用户集合U的图像偏好表征矩阵Up,该表征矩阵中每一行代表一个用户相应的表征up;
将用户表征向量up和景点表征向量vp做内积,得到用户对景点图像特征的偏好得分预测为:yp=Φ(up,vp);
4.3)构建一个多层感知机MLP网络Nets,该网络包含依次为三个维度分别为N*1024,1024*512,512*60的全连接层,其中N为所有景点数;
将景点评分特征X输入到该Nets网络,得到输出的相应景点表征vs;
构建相应用户集合U的评分偏好表征矩阵Us,该特征矩阵中每一行代表一个用户相应的表征us;
将用户表征向量us和景点表征向量vs做内积,得到用户对景点评分特征的偏好得分预测为:ys=Φ(us,vs);
4.4)构建目的地集合L的表征矩阵Ul和景点集合表征矩阵Vl,该表征矩阵Ul中每一行代表一个目的地城市相应的表征ul,Vl中每一行代表一个景点相应的表征vl;
将目的地城市相应的表征ul和景点表征向量vl做内积,得到景点所在目的地群体对景点的偏好得分预测为:yl=Φ(ul,vl);
4.5)用贝叶斯个性化成对排序优化方法对该预测的偏好评分yl进行优化:
4.5.1)定义群体流行度偏好目标函数Ol如下:
其中σ是sigmoid函数,λl是正则化参数,Rl={(l,vl_i,vl_j)|l∈L∧vl_i∈l∧vl_j∈l\vl_i∧Ci>Cj)},ul为目的地l的特征向量,分别为景点vl_i,vl_j的表征向量,Ci,Cj分别表示景点vl_i,vl_j的流行度;
4.5.2)每次迭代时随机选取一个目的l,以及随机选取一个属于目的地l的景点vl_i和流行度小于景点vl_i的景点vl_j,作为训练数据,利用梯度下降算法更新目的地集合L的表征矩阵Ul和景点流行度表征矩阵Vl;
4.5.3)重复4.5.2)使目标函数最小化,得到优化后的目的地集合L的表征矩阵Ul*和景点流行度表征矩阵Vl*;
4.6)构建由两个隐藏层组成的注意力网络Netatt,其中第一隐藏层包括两个全连接层,第二隐藏层为一个全连接层;
将用户表征uk和景点表征vk输入到该Netatt网络,得到用户对景点每个特征偏好值yk的注意力分数Netatt(uk,vk):
Netatt(uk,vk)=w2relu(wuuk+wvvk+b1),
其中,k∈B,B={s,t,p,l},wu为用户表征uk的权重,wv为景点表征vk的权重,b1为偏置,这三个参数属于第一隐藏层网络参数,w2是第二隐藏层的全连接层的参数,relu为激活函数;
4.8)根据用户对景点文本特征的偏好分数yt,用户对景点评分特征的偏好分数ys,用户对景点图像特征的偏好分数yp,目的地群体对景点的偏好分数yl*及它们相应权重进行加权融合,得到用户对景点的最终偏好模型Y
步骤5.用贝叶斯个性化成对排序优化方法对个性化推荐模型Y进行优化。
5.1)定义全局目标函数O:
5.2)每次迭代随机选取一个用户u及其访问过的景点vi作为正样本,并随机选取一个用户没有访问过的景点vj作为负样本,利用梯度下降算法更新4.1)的网络文本卷积网络Textcnn,4.2)的多层感知机网络Netp,4.3)多层感知机网络Nets,4.5)的注意力网络Netatt的参数及用户表征矩阵Ut,Up,Us,使目标函数O最小化;
5.3)重复5.2)直到满足迭代停止条件,得到训练好的文本卷积网络Textcnn*,多层感知机网络Netp*,多层感知机网络Nets*,注意力网络Netatt*及用户文本偏好表征矩阵Ut*,用户图像偏好表征矩阵Up*,用户评分表征矩阵Us*;
5.4)根据5.3)优化后的网络Textcnn*,Netp*,Nets*得到分别得到优化后的景点表征vt*,vp*,vs*以及优化后的用户偏好表征矩阵Ut*,Up*,Us*得到相应的优化后的用户表征ut*,up*,us*,并根据上述用户表征和景点表征利用注意力网络Netatt*,计算得到用户对景点不同特征偏好的权值
5.6)根据5.4)和5.5)中的用户表征,目的地表征及景点表征,计算得到用户对景点的最终偏好模型Y*
步骤六.为用户推荐景点。
将测试数据中的用户id及用户对应的访问目的景点的多模态特征,即评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C,输入到优化好的模型Y*,得到用户对景点的最终得分,
根据用户对测试目的地的所有景点的预测评分,按照评分排序得出评分最大的几个景点推荐给用户。
本发明的效果通过以下实验进一步说明。
一.实验条件:
实验所用计算机配置为:Intel(R)Core(TM)i8CPU@3.5GHz,128GB内存,和单块NVIDIAGTX TITAN GPU。
实验所运行的软件环境为64为Ubuntu14.04操作系统下安装的TensorFlow1.2.0,Python3.6.3。
评价指标:准确率Precision@m,回归率Recall@m和归一化累计折损增益NDCG@m。
二.实验内容:
实验1:
利用上述评价指标,用本发明与现有六种旅游推荐算法为用户进行景点推荐,结果如表1所示。其中:
POP是现有热门推荐方法,
UCF是现有用户协同过滤推荐方法,
BPRMF是现有贝叶斯个性化排序推荐方法,
ATCF是现有基于作者主题模型的协同过滤推荐方法,
STM是现有基于静态主题模型的推荐方法,
DeepCONN为现有基于神经网络的推荐方法,
Precision@5,Recall@5和NDCG@5分别表示推荐景点数为5时的准确率,回归率,和归一化累计折损增益,
Precision@10,Recall@10和NDCG@10分别表示推荐景点数为10时的准确率,回归率,和归一化累计折损增益。
表1不同推荐算法推荐结果对比图
Methods | precision@5 | recall@5 | precision@10 | recall@10 | ndcg@5 | ndcg@10 |
POP | 0.128 | 0.135 | 0.097 | 0.183 | 0.175 | 0.184 |
UCF | 0.282 | 0.247 | 0.225 | 0.349 | 0.369 | 0.382 |
ATCF | 0.257 | 0.306 | 0.202 | 0.390 | 0.351 | 0.365 |
BPRMF | 0.229 | 0.273 | 0.229 | 0.354 | 0.331 | 0.357 |
DeepCONN | 0.295 | 0.261 | 0.240 | 0.392 | 0.369 | 0.396 |
STM | 0.265 | 0.270 | 0.208 | 0.375 | 0.343 | 0.361 |
Ours | 0.353 | 0.311 | 0.290 | 0.467 | 0.440 | 0.471 |
从表1我们可以得出以下结论:
POP方法,由于仅考虑景点的流行度而没有考虑用户偏好,在所有指标中表现最差;
UCF方法,由于仅使用访问历史来计算每个用户的相似性,而不使用任何内容信息,且因为用户的旅游访问记录较为稀疏,所以表现效果在所有个性化推荐算法中表现最差;
ATCF方法,由于加入了额外的文本信息结合协同过滤方法,比UCF推荐效果好,这表明额外的内容信息有助于推断用户的旅行偏好;
BPRMF方法,由于基于隐语义模型进行推荐,其结果比基于文本信息结合协同过滤方法ATCF方法表现要好;
STM方法,利用静态主题模型根据用户的评论建立相似性,推荐性能优于BPRMF方法
DeepC0NN方法,利用神经网络建模文本评论信息,推荐性能比BPRMF方法要好;
本发明,利用神经网络融合了景点的多模态异质信息,其所有推荐评价指标均优于现有的旅游推荐算法。
实验2:利用上述评价指标,对本发明使用各单特征视图的预测结果及融合所有特征视图进行的推荐,结果如表2所示:
其中,Image表示只利用图像特征视图,
Rating表示只利用评分特征视图,
Reviews表示只利用评论文本特征视图,
Rating+location表示利用评分特性视图和区域流行度特征视图,
Image+location表示利用图像特征视图和区域流行度特征视图,
Review+location表示利用评论特征视图和区域流行度特征视图,
all表示融合所有特征视图。
表2使用各单特征视图的预测结果及融合所有特征视图的推荐结果对比
Feature | precision@5 | recall@5 | precision@10 | recall@10 | ndcg@5 | ndcg@10 |
Rating | 0.203 | 0.173 | 0.210 | 0.339 | 0.213 | 0.278 |
Rating+location | 0.346 | 0.304 | 0.289 | 0.465 | 0.424 | 0.460 |
Image | 0.329 | 0.280 | 0.282 | 0.455 | 0.416 | 0.456 |
Image+location | 0.348 | 0.310 | 0.385 | 0.464 | 0.433 | 0.464 |
Review | 0.152 | 0.122 | 0.156 | 0.234 | 0.177 | 0.211 |
Review+location | 0.334 | 0.296 | 0.284 | 0.456 | 0.405 | 0.446 |
all | 0.353 | 0.311 | 0.290 | 0.467 | 0.440 | 0.471 |
从表2可看出,Image+location,Review+location,Rating+location的推荐结果分别优于Image,Review,Rating,这表明融合地域特征能有效解决用户在不同区域的旅游偏好的动态差异问题,提高推荐准确率;
本发明all表示的融合所有特征视图的推荐效果要优于只利用单特征视图的推荐结果。
Claims (5)
1.一种基于多模态异质信息的个性化推荐方法,包括如下步骤:
(1)采集用户访问记录信息及景点的多模态异质信息,并存储至数据库,该多模态信息包括景点的评分,图像和评论;
(2)根据采集的多模态异质景点信息生成景点的多模态特征集,并根据用户的访问记录时间将每个用户的最新旅游目的地的旅游记录作为测试数据,剩下的历史旅游记录和景点的多模态特征集作为训练数据;该多模态特征集包括景点的评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C;
(3)利用隐语义模型及神经网络构建个性化推荐模型Y,输入训练数据,采用贝叶斯个性化成对排序优化方法及端到端随机梯度下降算法来优化模型Y得到优化后的模型Y*;
其中k∈B,B={s,t,p,l},其中s代表评分特征视图,t代表评论特征视图,p代表图像特征视图,l代表地域流行度特征视图;v∈V分别表示景点id,V表示数据集中所有景点的集合,u∈U表示用户id,U表示数据集中所有用户的集合;uk*,vk*,表示不同视图下用户和景点的表征,表示用户u对景点v不同特征的偏好程度;g是sigmoid函数,Φ为内积函数;
(4)将用户id及景点的特征输入到优化好的模型Y*,得到用户对景点的最终得分;
(5)根据用户对测试目的地的所有景点的评分,按照评分排序得出评分最大的几个景点推荐给用户。
2.根据权利要求1所述的方法,其中(2)中根据采集的多模态异质景点信息生成景点的评分特征X,景点图像特征MP、文本评论特征TC及景点区域流行度特征C,分别表示如下:
该景点的文本评论特征TC,是将所有访问过景点的用户评论先进行分词、过滤无用词,再利用训练好的word2vec词向量模型将每个词映射为一个低维向量,然后利用景点评论的中所有单词的词向量构成景点的文本内容特征矩阵TC;
该景点图像特征MP,是利用一个训练好的图像美学评估网络NIMA提取得到;
该景点区域流行度特征C,为景点被所有用户的访问过的次数;
该景点的评分特征X,为所有用户对景点的评分信息。
3.根据权利要求1所述的方法,其中(3)中利用隐语义模型及神经网络构建个性化推荐模型Y,实现如下:
3a)构建一个文本卷积网络Textcnn,将景点的文本特征TC输入到该Textcnn网络,得到相应的景点表征vt,并构建相应用户集合U的文本偏好表征矩阵Ut,该表征矩阵中每一行代表一个用户相应的表征ut,得到用户对景点文本特征的偏好得分预测为:yt=Φ(ut,vt);
3b)构建多层感知机MLP网络Netp,将景点图像特征MP输入到Netp网络,得到相应的景点表征vp,构建相应用户集合U的图像偏好特征矩阵Up,该表征矩阵中每一行代表一个用户相应的表征up,得到用户对景点图像特征的偏好得分预测为:yp=Φ(up,vp);
3c)构建多层感知机MLP网络Nets,将景点评分特征X输入到该Nets网络,得到相应的景点表征vs,构建相应用户集合U的评分偏好表征矩阵Us,该表征矩阵中每一行代表一个用户相应的表征us,得到用户对景点评分特征的偏好得分预测为:ys=Φ(us,vs);
3d)构建目的地集合L的表征矩阵Ul和景点集合表征矩阵Vl,该特征矩阵Ul中每一行代表一个目的地城市相应的表征ul,Vl中每一行代表一个景点相应的表征vl,得到景点所在目的地群体对景点的偏好得分预测为:yl=Φ(ul,vl),用贝叶斯个性化成对排序优化方法对该预测的偏好评分yl进行优化,得到优化后的目的地集合L的表征矩阵Ul*和景点集合表征矩阵Vl*及yl*=Φ(ul*,vl*);
3e)构建由两个隐藏层组成的注意力网络Netatt,将不同uk,vk输入到该Netatt网络得到用户对景点每个特征偏好值yk的注意力分数Netatt(uk,vk):
Netatt(uk,vk)=w2relu(wuuk+wvvk+b1)
其中,k∈B,B={s,t,p,l},wu,wv,b1是第一隐藏层网络参数,w2是第二隐藏层网络参数,relu为激活函数;
4.根据权利要求1所述的方法,其中(3)中采用贝叶斯个性化成对排序优化方法及端到端随机梯度下降算法对对景点的最终偏好模型Y进行优化,实现如下:
3h)定义全局目标函数O:
3i)训练时,每次迭代随机选取一个用户u及其访问过的景点vi作为正样本,并随机选取一个用户没有访问过的景点vj作为负样本,利用梯度下降算法更新网络文本卷积网络Textcnn,多层感知机网络Netp,多层感知机网络Nets,由两个隐藏层组成的注意力网络Netatt的参数及用户表征矩阵Ut,Up,Us,使目标函数O最小化;
5.根据权利要求3所述的方法,其中3d)中利用贝叶斯个性化成对排序优化方法对预测评分yl进行优化,按如下步骤进行:
3d1)定义群体流行度偏好目标函数Ol如下:
其中σ是sigmoid函数,λl是正则化参数,Rl={(l,vl_i,vl_j)|l∈L∧vl_i∈l∧vl_j∈l\vl_i∧Ci>Cj)},ul为目的地l的表征向量,分别为景点vl_i,vl_j的表征向量,Ci,Cj分别表示景点vl_i,vl_j的流行度;
3d2)每次迭代时随机选取一个目的地l,以及随机选取一个属于目的地l的景点vl_i和流行度小于景点vl_i的景点vl_j,作为训练数据,利用梯度下降算法更新目的地集合L的表征矩阵Ul和景点流行度表征矩阵Vl;
3d3)重复过程3d2)使目标函数最小化,得到优化后的目的地集合L的表征矩阵Ul*和景点流行度表征矩阵Vl*,完成对目标函数Ol的优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910544396.9A CN110263256B (zh) | 2019-06-21 | 2019-06-21 | 基于多模态异质信息的个性化推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910544396.9A CN110263256B (zh) | 2019-06-21 | 2019-06-21 | 基于多模态异质信息的个性化推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263256A CN110263256A (zh) | 2019-09-20 |
CN110263256B true CN110263256B (zh) | 2022-12-02 |
Family
ID=67920493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910544396.9A Active CN110263256B (zh) | 2019-06-21 | 2019-06-21 | 基于多模态异质信息的个性化推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263256B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159539B (zh) * | 2019-12-09 | 2023-09-22 | 中国科学院计算技术研究所 | 基于多模态信息关联分析的食物推荐方法和系统 |
CN111046166B (zh) * | 2019-12-10 | 2022-10-11 | 中山大学 | 一种基于相似度修正的半隐式多模态推荐方法 |
CN111177346B (zh) * | 2019-12-19 | 2022-10-14 | 爱驰汽车有限公司 | 人机交互方法、装置、电子设备、存储介质 |
CN111581510B (zh) * | 2020-05-07 | 2024-02-09 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
CN111651558B (zh) * | 2020-05-09 | 2023-04-07 | 清华大学深圳国际研究生院 | 基于预训练语义模型的超球面协同度量推荐装置和方法 |
CN111882381B (zh) * | 2020-06-30 | 2022-06-03 | 桂林电子科技大学 | 一种基于协同记忆网络的旅游推荐方法 |
CN111984872B (zh) * | 2020-09-09 | 2021-03-16 | 北京中科研究院 | 基于迭代优化策略的多模态信息社交媒体流行度预测方法 |
CN112784153B (zh) * | 2020-12-31 | 2022-09-20 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
CN113158086B (zh) * | 2021-04-06 | 2023-05-05 | 浙江贝迩熊科技有限公司 | 一种基于深度强化学习的个性化客户推荐系统和方法 |
CN113159892B (zh) * | 2021-04-24 | 2022-05-06 | 桂林电子科技大学 | 一种基于多模态商品特征融合的商品推荐方法 |
CN113515697A (zh) * | 2021-05-27 | 2021-10-19 | 武汉理工大学 | 一种基于用户多意图的群组动态旅游路线推荐方法及系统 |
CN113722608B (zh) * | 2021-07-21 | 2024-03-22 | 中国科学院信息工程研究所 | 迭代副信息指导下基于关联关系学习的协同过滤方法及装置 |
CN116304357B (zh) * | 2023-05-16 | 2023-08-11 | 松立控股集团股份有限公司 | 一种医院停车场推荐方法、系统及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930469A (zh) * | 2016-04-23 | 2016-09-07 | 北京工业大学 | 基于Hadoop的个性化旅游推荐系统及方法 |
CN107133277A (zh) * | 2017-04-12 | 2017-09-05 | 浙江大学 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9864803B2 (en) * | 2015-07-22 | 2018-01-09 | TCL Research America Inc. | Method and system for multimodal clue based personalized app function recommendation |
-
2019
- 2019-06-21 CN CN201910544396.9A patent/CN110263256B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930469A (zh) * | 2016-04-23 | 2016-09-07 | 北京工业大学 | 基于Hadoop的个性化旅游推荐系统及方法 |
CN107133277A (zh) * | 2017-04-12 | 2017-09-05 | 浙江大学 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110263256A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263256B (zh) | 基于多模态异质信息的个性化推荐方法 | |
CN110162706B (zh) | 一种基于交互数据聚类的个性化推荐方法及系统 | |
Wang et al. | Collaborative deep learning for recommender systems | |
Lu et al. | GLR: A graph-based latent representation model for successive POI recommendation | |
CN102629275A (zh) | 面向跨媒体新闻检索的人脸-人名对齐方法及系统 | |
CN112966091B (zh) | 一种融合实体信息与热度的知识图谱推荐系统 | |
CN113268669B (zh) | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 | |
CN111222847B (zh) | 基于深度学习与非监督聚类的开源社区开发者推荐方法 | |
Lyu et al. | Weighted multi-information constrained matrix factorization for personalized travel location recommendation based on geo-tagged photos | |
CN107688870A (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
Huang et al. | Neural embedding collaborative filtering for recommender systems | |
CN115244547A (zh) | 自动并智能地探索设计空间 | |
CN115982467A (zh) | 一种去偏化用户多兴趣推荐方法、装置及存储介质 | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
CN115456707A (zh) | 提供商品推荐信息的方法、装置及电子设备 | |
Nazari et al. | Scalable and data-independent multi-agent recommender system using social networks analysis | |
Chen et al. | Exploiting aesthetic features in visual contents for movie recommendation | |
CN113256024B (zh) | 一种融合群体行为的用户行为预测方法 | |
CN116010681A (zh) | 一种召回模型的训练及检索方法、装置及电子设备 | |
CN115935067A (zh) | 面向社会化推荐的语义与结构视图融合的物品推荐方法 | |
Liao et al. | An integrated model based on deep multimodal and rank learning for point-of-interest recommendation | |
CN111159543B (zh) | 基于多级视觉相似度的个性化旅游地点推荐方法 | |
Liang et al. | Enhancing scenic recommendation and tour route personalization in tourism using UGC text mining | |
Bang et al. | Collective matrix factorization using tag embedding for effective recommender system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |