CN111915395A - 一种基于多视图注意力机制的旅游包推荐方法 - Google Patents

一种基于多视图注意力机制的旅游包推荐方法 Download PDF

Info

Publication number
CN111915395A
CN111915395A CN202010648825.XA CN202010648825A CN111915395A CN 111915395 A CN111915395 A CN 111915395A CN 202010648825 A CN202010648825 A CN 202010648825A CN 111915395 A CN111915395 A CN 111915395A
Authority
CN
China
Prior art keywords
travel
user
term
short
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010648825.XA
Other languages
English (en)
Inventor
曹杰
朱桂祥
申冬琴
陈蕾
梁伟超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunjing Business Intelligence Research Institute Nanjing Co ltd
Nanjing University of Science and Technology
Original Assignee
Yunjing Business Intelligence Research Institute Nanjing Co ltd
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunjing Business Intelligence Research Institute Nanjing Co ltd, Nanjing University of Science and Technology filed Critical Yunjing Business Intelligence Research Institute Nanjing Co ltd
Priority to CN202010648825.XA priority Critical patent/CN111915395A/zh
Publication of CN111915395A publication Critical patent/CN111915395A/zh
Priority to PCT/CN2021/095763 priority patent/WO2022007526A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多视图注意力机制的旅游包推荐方法,通过借助深度学习技术来学习旅游包的统一表征,并依据在线旅游用户的长短期点击流数据来学习用户的兴趣表征产生推荐,该方法包含即旅游包编码和用户兴趣编码,在旅游包编码模块中,通过使用单词层面和视图层面的注意力网络从旅游包的属性中选择重要的单词和视图来学习统一的旅游包表征,在用户兴趣编码模块中,通过带有旅游包层面的注意力机制的递归神经网络(Recurrent Neural Network,RNN)来学习用户偏好的动态演化,本发明还提出了一种门结构融合方法用于集成用户的长期和短期偏好以学习用户的表征。本发明的基于多视图注意力机制的旅游包推荐方法能有效地挖掘出负样本中的有用信息,降低了模型训练的计算成本。

Description

一种基于多视图注意力机制的旅游包推荐方法
技术领域
本发明涉及信息科学领域,提供了一种基于多视图注意力机制的旅游包推荐方法。
背景技术
近年来,随着互联网高速发展,旅游是在电子商务领域最成功和最受益的产业之一。在旅游电子商务中,越来越多的游客通过各种各样的在线平台收集更丰富、全面、个性化的旅游信息用于他们的旅游行程规划。因此,产生了大量的在线旅游数据,电子商务旅游平台(Online Travel Agency,OTA)也亟需通过一些新颖的数据分析和挖掘的技术手段去实现商务的潜能。旅游包通常指的是一组包含一系列包含旅游相关内容的集成包,如出发和目的地城市,旅游路线文本描述,旅游成本,行程天数,交通,住宿,分类等。大量研究已经进行了旅游包个性化推荐的研究。基于线下旅行社提供的消费数据,他们发现与传统产品相比(如电影,书籍和杂货),旅游包具有截然不同的领域特点。大多数基于用户点击流(会话)的旅游包推荐模型仅仅利用了用户当前的实时点击流数据,而忽视了历史点击流数据。另外一种推荐模型为基于用户的个性化推荐模型,实际上,随着时间的推移用户的交互行为自然形成一个行为序列,用户的长期的稳定偏好可以通过历史的行为数据刻画,短期的动机和需求可以通过当前的行为数据刻画。因此,一个较为完善的推荐模型需要考虑到用户偏好的动态变化,即不仅要考虑用户当前会话的交互信息,也要考虑到用户历史的行为信息。
深度学习是机器学习领域一个重要的研究方向,近年来在模式识别、自然语言处理、图像识别和自动驾驶等领域取得了突破性进展。截止目前,深度学习已经成为人工智能的一个热潮,为推荐系统的研究也带来了新的机遇和视野。深度学习可通过学习一种深层次非线性网络结构,表征用户和项目相关的海量数据,具有强大的从样本中学习数据集本质特征的能力,能够获取用户和项目的深层次特征表示。另一方面,深度学习通过从多源异构数据中进行自动特征学习,从而将不同数据映射到一个相同的隐空间,能够获得数据的统一表征。而目前在大多数电子商务平台的推荐模型中(如淘宝、天猫和亚马逊),更多采用是基于协同过滤改进的推荐模型,此类模型只能考虑用户的静态兴趣,而不能捕获用户的动态兴趣。因此,越来越多的学者将深度学习融入推荐系统中,研究如何整合海量的多源异构数据,构建更加贴合用户偏好需求的用户模型,以提高推荐系统的性能和用户满意度。作为本发明的贡献之一,本发明将展示一个特定的模型用于旅游包个性化推荐,它融合了多视图学习和注意力机制学习。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明的示例性实施充分利用了在线旅游网站中用户的长期和短期的点击流数据,研究一种基于多视图注意力机制的旅游包推荐方法。具体而言,NATR主要由两个核心模块构成:旅游包编码(Travel PackageEncoder)和用户兴趣编码(User Preference Encoder)。具体而言,本章节的研究贡献总结如下:(i)为了从旅游包的4种属性中准确地学习旅游包表征,在Travel Package Encoder模块中提出了一种多视图注意力机制的方法来学习统一的旅游包表征。与已有研究利用特殊辅助信息来提高推荐准确性的方法不同是,该模块采用了单词级和视图级的注意力机制分别对重要的、信息丰富的单词和视图进行有效的选择;(ii)为了从用户整体序列行为数据中捕捉兴趣动态的演化,在User Preference Encoder模块中设计了两个带有注意力机制的双向长短记忆神经网络(Bi-LSTM),分别从用户历史和当前点击流中动态学习用户的长短期偏好。与传统基于会话的推荐方法不同是,具有注意力机制的Bi-LSTM神经网络可以从用户的连续点击流中选择重要的旅游包来精确地表示用户的偏好;(iii)为了更好地集成用户长期偏好和短期偏好,进一步提出了一种门结构融合网络,这种门结构网络融合了它们的相关信息,而不是简单地进行组合。与注意力网络标量的权重不同的是,门结构向量具有更强的表征能力来控制这两种偏好的重要性。
技术方案:
一种基于多视图注意力机制的旅游包推荐方法,包括如下步骤:
步骤1):构建旅游包编码模块,即统一的旅游包的表征学习模块,得到旅游包编码模块学习后的表征向量为rj
步骤2):构建用户长期偏好编码模块和和用户短期偏好编码模块,即用户的长期兴趣表征学习模块和用户的短期兴趣表征学习模块,得到短期行为表征向量su和长期行为表征向量lu
步骤3):设计门结构融合网络模块,将步骤2得到的短期行为表征向量su和长期行为表征向量lu作为门结构融合网络模块的输入,得到用户u的偏好表征向量Ou
步骤4):通过NATR模型,即Neural Attentive Travel package Recommendation模型计算推荐分值:zk=Ou Trj,通过Adam优化器来最小化损失函数,将NATR模型中的参数调为最优配置。
进一步地,步骤1)中,旅游包编码模块依据旅游包的四种属性进行表征学习,所述四种属性包括旅游包的标题、目的地、旅游区域和旅游类型,该模块采用了单词级和视图级的注意机制分别对单词和视图进行有效的选择,给定一个旅游包xj,xj=<Title,Destination,Categories>,标题即Title包括国家/城市、景点、酒店交通和行程天数等,目的地即Destination包括一个或者少数几个单词组成的标识,通常由城市或者国家名称表示,类别即Categories包括从旅游区域(Travel Region)和旅游类型(Travel Type),经过旅游包编码模块学习后的表征向量为rj
进一步地,步骤2)中,用户长期和短期偏好编码模块分别设计了两个带有注意力机制的双向长短记忆神经网络(Bi-directional Long Short-term Memory,Bi-LSTM),分别从用户历史和当前点击流中动态学习用户的长短期偏好,有注意力机制Bi-LSTM神经网络可以从用户的连续点击流中选择重要的旅游包来精确地表示用户的偏好,用户长期和短期偏好编码模块的用户长期和短期偏好的表征向量通过带有注意力权重的旅游包上下文表征向量之和求得,给定一个目标用户u,令其短期行为和长期行为分别记为Su和Lu,则该用户的短期和长期的行为表征向量分别记为su和lu
进一步地,步骤3)具体为,令用户偏好查询向量为qu,并将短期偏好向量su和长期偏好向量lu作为输入,门结构向量Fu用于控制长短期偏好的贡献度:
Fu=sigmod(Wqqu+Wssu+Wllu+bu),
其中Wq,Ws,Wl和bu是学习的神经网络投影的参数,分别代表模型中qu,su,lu的权重矩阵,以及偏置向量,最终输出的用户u的偏好表征向量Ou可通过以下方法计算:
Ou=(1-Fu)⊙su+Fu⊙lu
其中,⊙是向量内积符号。
进一步地,步骤4)具体为,在NATR模型训练阶段,积极的标签是下一个真实购买的旅游包
Figure BDA0002572933190000041
而消极的标签是从旅游包集合X中除去
Figure BDA0002572933190000042
进行log-uniform采样形成的旅游包集合,在获得用户偏好向量Ou和旅游包的表征向量rj之后,候选旅游包中的旅游包z={z1,z2,...,z|κ|}推荐分值zk可计算得出,推荐分值计算如下:
zk=Ou Trj
κ是从X中抽样的包含积极和消极标签的子集,︳︳表示集合的模,X表示旅游包集合;
κ中旅游包的预测概率为
Figure BDA0002572933190000043
应用softmax函数去获取NATR模型的输出,即y-=softmax(z),y-是所有旅游包在会话Su中分别被购买的概率,
Figure BDA0002572933190000044
为第k个旅游包被购买的概率。
对于每一个用户,基于交叉熵定义的购买概率和真实情况的损失函数可通过以下方法计算:
Figure BDA0002572933190000045
其中yj是旅游包xj被真实购买的概率分布,具体而言,如果xj是积极标签,则yj=1,反之yj=0
有益效果:本发明构建一个新颖的多视图注意力模型Neural Attentive Travelpackage Recommendation(NATR)用于个性化旅游包推荐,能够对复杂的旅游包描述信息进行表征学习,动态地捕捉用户兴趣的动态变化,能够有效地融合用户长短期兴趣偏好,在用户兴趣编码模块中,通过带有旅游包层面的注意力机制的递归神经网络(RNN)来学习用户偏好的动态演化,而不是在匹配阶段使用传统的协同过滤和矩阵分解模型。门结构融合网络更好地集成用户长期偏好和短期偏好,这种门结构网络融合了它们的相关信息,而不是简单地进行组合,与注意力网络标量的权重不同的是,门结构向量具有更强的表征能力来控制这两种偏好的重要性。本发明借助Adam优化器来最小化损失函数
Figure BDA0002572933190000046
从而将NATR模型中的参数调为最优配置,与现有的推荐方法相比,该方法能有效地挖掘出负样本中的有用信息,进一步降低了模型训练的计算成本,因此,本发明的NATR模型可以更容易地在大量的电子商务旅游点击流数据上进行训练。
附图说明
图1是旅游包样例展示;
图2是融合用户长期和短期行为的旅游包推荐;
图3是长短期行为的点击流划分;
图4是NATR旅游包推荐模型的框架。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,根据本发明的示例性实施例,提供了一种基于多视图注意力机制的旅游包推荐方法,包括以下步骤:
步骤1):构建旅游包编码模块,即统一的旅游包的表征学习模块,得到旅游包编码模块学习后的表征向量为rj
步骤2):构建用户长期偏好编码模块和和用户短期偏好编码模块,即用户的长短期兴趣表征学习模块和用户的短期兴趣表征学习模块;
步骤3):设计门结构融合网络,得到用户u的偏好表征向量Ou
步骤4):通过NATR(Neural Attentive Travel package Recommendation)模型,计算推荐分值:zk=Ou Trj,通过Adam优化器来最小化损失函数,将NATR模型中的参数调为最优配置,所述参数为门结构融合网络中的投影参数Wq,Ws,Wl和bu
在示例性实施例中,所述的旅游包xj通常指的是包含一些旅游相关必要元素的集合,可由一个多元组xj=Title,Destination,Categories表示,标题(Title)是一个旅游包简单描述的属性,包含国家/城市、景点、酒店交通和行程天数等。目的地(Destination)是由一个或者少数几个单词组成的标识,通常由城市或者国家名称表示。类别(Categories)是一个从旅游区域(TravelRegion)和旅游类型(TravelType)这个两个角度对旅游包类型的描述。具体来说,第一类是根据旅游区域对旅游包进行划分,因此每个旅游包都分为本地/周边游,国内短线/长线游和海外短途/长途游,另一类是依据旅游类型对旅游包进行划分,包括途牛特约游,参团游,自驾游,自助游,公司包团游,本地参团游等。
旅游包编码模块将旅游的标题,目的地和类别作为旅游包不同的表征视图,旨在从这些视图里学习一个统一的旅游包的表征。由于不同类型的旅游包信息应该区分处理,同样不同的单词在同一个旅游包标题中的重要性是不同的,本发明设计了一个单词层面和视图层面的注意力网络去选择重要的单词和视图用于学习旅游包的表征。
标题编码模块的输入为旅游标题分词后的序列{w1,w2,…,wI|,其中I为该标题包含单词的数量。本发明首先使用一个谷歌开源word2ve项目来将标题转换为嵌入式向量
Figure BDA0002572933190000061
其次,将标题的嵌入式向量作为Bi-LSTM模型的输入,通过前向和反向的LSTM可以分别获得网络的输出,即:标题最终隐藏层的向量
Figure BDA0002572933190000062
最后,嵌入用户u的标识符到一个表征向量中作为用户的偏好向量qu,令
Figure BDA0002572933190000063
表旅游包标题中的第i个单词的注意力权重,其计算方法如下:
Figure BDA0002572933190000064
Figure BDA0002572933190000065
其中,Wt和bt是神经网络中学习的参数,分别代表标题编码模块中的权重矩阵和偏置向量,最终旅游包xj的标题表征是所有带有权重的单词语境表征向量之和:
Figure BDA0002572933190000066
目的地编码模块的输入为旅游目的地的标识符。本发明首先将离散型的目的地标识符转化为低维度的表征向量ec;然后使用一个多层感知机(Multi-layer Perceptron,MLP)模型来学习旅游包xj的目的地表征向量:
Figure BDA0002572933190000067
其中Wc和bc是神经网络中学习的参数,分别代表目的地编码模块中ec的权重矩阵和偏置向量。
类别编码模块的输入为旅游包的旅行区域(Travel Region,TR)和旅行类型(Travel Type,TT)。本发明首先将旅行区域(TR)和旅行类型(TT)的离散标识符分别转换为低维稠密的表征向量,记为etr和ett;然后同样使用一个MLP模型来分别学习类别旅行区域(TR)和类别旅行类型(TT)的表征向量
Figure BDA0002572933190000071
Figure BDA0002572933190000072
本发明使用多视图注意力(View-levelAttention)模块对不同类型的旅游包信息量进行建模,从而获得旅游包的表征向量。令αt,αc,αtr和αtt分别代表旅游包xj的标题,目的地,旅游区域和旅游类型的注意力权重。以标题视图的注意力权重αt为例,其计算方式如下:
Figure BDA0002572933190000073
Figure BDA0002572933190000074
其中,Wv和bv是神经网络中学习的参数,分别代表
Figure BDA0002572933190000075
的矩阵权重和偏置向量。
最终旅游包xj的统一表征向量是带有注意力权重的每一个视图上的表征向量之和,计算方法如下:
Figure BDA0002572933190000076
在示例性实施例中,用户长期和短期偏好编码模块旨在通过用户短期行为数据Su和长期行为数据Lu来学习用户u的长短期表征向量。以短期兴趣编码模块为例,本发明首先通过旅游包编码模块获得短期行为的表征向量
Figure BDA0002572933190000077
其次,借助Bi-LSTM模型去学习其短期的兴趣动机,从而获得最终的输出状态
Figure BDA0002572933190000078
即为旅游包xj的表征向量。为了针对不同用户对同一旅游包的不同信息量进行建模,本发明还设计了一个性化的注意力网络来学习同一用户点击或购买的旅游包的表征。本发明将用户u点击或者购买过的第j个旅游包的权重记为
Figure BDA0002572933190000079
该权重可以通过用户偏好和旅游包表征向量之间的交互重要性进行度量:
Figure BDA0002572933190000081
Figure BDA0002572933190000082
其中,Wp和bp是投影的参数,
Figure BDA0002572933190000083
中m=1到M,代表求和功能。最终用户短期偏好的表征向量可以通过带有注意力权重的旅游包上下文表征向量之和求得:
Figure BDA0002572933190000084
其中,|Su|是短期行为数据Su包含的旅游包数量。
类似地,本发明同样使用了Bi-LSTM和个性化注意力机制去学习最终的用户长期偏好表征lu,长期偏好表征lu和短期的计算方法一样,只是输入的数据不同。
在示例性实施例中,为了集成用户u的长期和短期偏好,本发明设计了一种门结构融合网络来衡量长期和短期偏好向量的重要性,并相应地集成这些信息。将短期偏好向量su和长期偏好向量lu作为输入,门结构向量Fu用于控制长短期偏好的贡献度:
ou=(1-Fu)⊙su+Fu⊙lu
其中,⊙是向量内积符号。
在示例性实施例中,所述的旅游包表征向量为rj和权利要求4所述的用户u偏好表征向量Ou,NATR模型的目标是依据Ou和rj预测一个包含top-K个旅游包的推荐候选集,推荐分值计算如下:
zk=Ou Trj
在示例性实施例中,所述的NATR模型在训练过程中,积极的标签是下一个真实购买的旅游包
Figure BDA0002572933190000085
而消极的标签是从旅游包集合X中除去
Figure BDA0002572933190000086
行log-uniform采样形成的旅游包集合。在获得用户偏好向量Ou和旅游包的表征向量rj之后,候选旅游包中的旅游包z={z1,z2,…,z|κ|}推荐分值zk可计算得出,其中κ是从X中抽样的包含积极和消极标签的子集,
Figure BDA0002572933190000087
是κ中旅游包的预测概率然后本发明应用softmax函数去获取NATR模型的输出,即y-=softmax(z),其中y-是旅游包在会话Su中被购买的概率。
对于每一个用户,基于交叉熵定义的购买概率和真实情况的损失函数可通过以下方法计算:
Figure BDA0002572933190000091
其中yj是旅游包xj被真实购买的概率分布。具体而言,如果xj是积极标签,则yj=1,反之yj=0。此处,本发明借助Adam优化器来最小化损失函数
Figure BDA0002572933190000092
从而将NATR模型中的参数调为最优配置。
本发明使用的电子商务旅游数据集由一个中国最大的在线旅行平台之一的Tuniu提供,Tuniu能够提供了一百万余个旅游产品,已经为提供1500万的客户提供了在线旅游预订服务。Tuniu数据集主要由从服务器日志上的页面浏览点击流数据组成,这实际上是研究在线购物行为分析的常见设置。
图1展示了3个经典的旅游包样例,完整的旅游包通常指的是包含一系列必要的旅游相关元素(如交通、景点、食宿、特色和行程天数等)组成不同集合,通常由OTA结合资源整合,市场需求以及成本控制等因素进行统一的定制。例如,从图1可以看出每个旅游包主要由标题,目的地,旅游区域和旅游类型这4种属性组成。具体而言,标题属性的文本信息比其他属性长得多,也更加详细,而目的地和类别(即旅游区域和旅游类型)属性通常由几个简单的标识词组成。
图2展示了长短期行为的点击流划分。此处,会话是通过途牛提供的点击流中的SessionID字段自动识别。令U和X分别表示用户和旅游包的集合。对于任一用户u∈U,本发明可以依据时间的排序获得其交互序列
Figure BDA0002572933190000093
其中
Figure BDA0002572933190000094
代表用户u的第n个会话,N=|Su|是用户u持有的会话数量。用户u的每一个会话
Figure BDA0002572933190000095
可以表示为
Figure BDA0002572933190000096
其中
Figure BDA0002572933190000097
是会话
Figure BDA0002572933190000098
包含的旅游包数量,
Figure BDA0002572933190000099
代表用户u操作的第j个旅游包,
Figure BDA00025729331900000910
代表操作的类型(如点击或者购买)。如图2所示,本发明选取用户购买前的最近一个会话
Figure BDA00025729331900000911
作为用户u的短期行为,记为Su,而剩余的会话作为用户u的长期行为,记为
Figure BDA0002572933190000101
图3展示了OTA一个经典的旅游包推荐场景。首先,在线用户的兴趣会随着时间动态的推移变化。直观地看,用户的行为随着时间的推移自然形成点击流,这些历史和当前的点击流可以动态地揭示用户长短期偏好。此处从用户当前点击流来看,该用户可能对南京短线游的旅游包感兴趣。如果本发明采用仅仅使用当前点击流作为输入的基于会话推荐的方法(如图3中红色方框所示),另外一系列有关于南京游的流行旅游包将会被推荐。相反地,从长期角度来看,该用户的历史点击流信息暗示着其可能对上海短线游套餐感兴趣。然而,已有研究采用的都是依赖于协同过滤和矩阵分解的基于内容推荐方法,该类方法只能对用户的静态兴趣进行建模,不能够从用户完整的点击流序列数据中捕捉用户动态的兴趣变化。
此外,在线用户历史点击流数据中蕴含的长期偏好总是影响用户当前的决定。例如,如果本发明仅仅将长短期的点击流进行简单拼接输入到协同过滤和矩阵分解的模型中,那么另外有关类似南京和上海的旅游包将会被推荐(如图3中绿色方框所示)。实际上,所示用户可能会计划购买包含与一系列与历史和当前点击流中相临近的城市旅游包(如图中5.1蓝色方框所示)。然而,传统的方法大多是基于短会话中的用户和项目的交互矩阵来建模,如何将长期偏好与短期偏好完美地结合还有待探索。
图4展示了基于深度学习架构设计的一个新颖的NATR模型框架,NATR模型可用于个性化旅游包推荐,该模型包含两个核心组件,即旅游包编码(Travel Package Encoder)和用户兴趣编码(User Preference Encoder)。与现有的方法不同,在Travel PackageEncoder模块中,通过使用单词层面和视图层面的注意力网络从旅游包的属性中选择重要的单词和视图来学习统一的旅游包表征。同时,在User Preference Encoder模块中,通过带有旅游包层面的注意力机制的递归神经网络(RNN)来学习用户偏好的动态演化,而不是在匹配阶段使用传统的协同过滤和矩阵分解模型。此外,还提出了一种门结构融合方法用于集成用户的长期和短期偏好以学习用户的表征。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于多视图注意力机制的旅游包推荐方法,其特征在于,包括如下步骤:
步骤1):构建旅游包编码模块,即统一的旅游包的表征学习模块,得到旅游包编码模块学习后的表征向量为rj
步骤2):构建用户长期偏好编码模块和和用户短期偏好编码模块,即用户的长期兴趣表征学习模块和用户的短期兴趣表征学习模块,得到短期行为表征向量su和长期行为表征向量lu
步骤3):设计门结构融合网络模块,将步骤2得到的短期行为表征向量su和长期行为表征向量lu作为门结构融合网络模块的输入,得到用户u的偏好表征向量Ou
步骤4):通过NATR模型,即Neural Attentive Travel package Recommendation模型计算推荐分值:zk=Ou Trj,通过Adam优化器来最小化损失函数,将NATR模型中的参数调为最优配置。
2.根据权利要求1所述的基于多视图注意力机制的旅游包推荐方法,其特征在于,步骤1)中,旅游包编码模块依据旅游包的四种属性进行表征学习,所述四种属性包括旅游包的标题、目的地、旅游区域和旅游类型,该模块采用了单词级和视图级的注意机制分别对单词和视图进行有效的选择,给定一个旅游包xj,xj=<Title,Destination,Categories〉,标题即Title包括国家/城市、景点、酒店交通和行程天数等,目的地即Destination包括一个或者少数几个单词组成的标识,通常由城市或者国家名称表示,类别即Categories包括从旅游区域(Travel Region)和旅游类型(Travel Type),经过旅游包编码模块学习后的表征向量为rj
3.根据权利要求1所述的基于多视图注意力机制的旅游包推荐方法,其特征在于,步骤2)中,用户长期和短期偏好编码模块分别设计了两个带有注意力机制的双向长短记忆神经网络(Bi-directional Long Short-term Memory,Bi-LSTM),分别从用户历史和当前点击流中动态学习用户的长短期偏好,有注意力机制Bi-LSTM神经网络可以从用户的连续点击流中选择重要的旅游包来精确地表示用户的偏好,用户长期和短期偏好编码模块的用户长期和短期偏好的表征向量通过带有注意力权重的旅游包上下文表征向量之和求得,给定一个目标用户u,令其短期行为和长期行为分别记为Su和Lu,则该用户的短期和长期的行为表征向量分别记为su和lu
4.根据权利要求3所述的基于多视图注意力机制的旅游包推荐方法,其特征在于,步骤3)具体为,令用户偏好查询向量为qu,并将短期偏好向量su和长期偏好向量lu作为输入,门结构向量Fu用于控制长短期偏好的贡献度:
Fu=sigmod(Wqqu+Wssu+Wllu+bu),
其中Wq,Ws,Wl和bu是学习的神经网络投影的参数,分别代表模型中qu,su,lu的权重矩阵,以及偏置向量,最终输出的用户u的偏好表征向量Ou可通过以下方法计算:
Ou=(1-Fu)⊙su+Fu⊙lu
其中,⊙是向量内积符号。
5.根据权利要求4所述的基于多视图注意力机制的旅游包推荐方法,其特征在于,步骤4)具体为,在NATR模型训练阶段,积极的标签是下一个真实购买的旅游包
Figure FDA0002572933180000021
而消极的标签是从旅游包集合X中除去
Figure FDA0002572933180000022
进行log-uniform采样形成的旅游包集合,在获得用户偏好向量Ou和旅游包的表征向量rj之后,候选旅游包中的旅游包z={z1,z2,...,z|κ|}推荐分值zk可计算得出,推荐分值计算如下:
zk=Ou Trj
κ是从X中抽样的包含积极和消极标签的子集,| |表示集合的模,X表示旅游包集合;
κ中旅游包的预测概率为
Figure FDA0002572933180000023
应用softmax函数去获取NATR模型的输出,即y-=softmax(z),y-是所有旅游包在会话Su中分别被购买的概率,
Figure FDA0002572933180000024
为第|k|个旅游包被购买的概率。
对于每一个用户,基于交叉熵定义的购买概率和真实情况的损失函数可通过以下方法计算:
Figure FDA0002572933180000025
其中yj是旅游包xj被真实购买的概率分布,具体而言,如果xj是积极标签,则yj=1,反之yj=0。
CN202010648825.XA 2020-07-07 2020-07-07 一种基于多视图注意力机制的旅游包推荐方法 Pending CN111915395A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010648825.XA CN111915395A (zh) 2020-07-07 2020-07-07 一种基于多视图注意力机制的旅游包推荐方法
PCT/CN2021/095763 WO2022007526A1 (zh) 2020-07-07 2021-05-25 一种基于多视图注意力机制的旅游包推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010648825.XA CN111915395A (zh) 2020-07-07 2020-07-07 一种基于多视图注意力机制的旅游包推荐方法

Publications (1)

Publication Number Publication Date
CN111915395A true CN111915395A (zh) 2020-11-10

Family

ID=73227596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010648825.XA Pending CN111915395A (zh) 2020-07-07 2020-07-07 一种基于多视图注意力机制的旅游包推荐方法

Country Status (2)

Country Link
CN (1) CN111915395A (zh)
WO (1) WO2022007526A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559878A (zh) * 2020-12-24 2021-03-26 山西大学 一种基于图神经网络的序列推荐系统及推荐方法
CN112784153A (zh) * 2020-12-31 2021-05-11 山西大学 融合属性特征注意力与异质类型信息的旅游景点推荐方法
CN113190751A (zh) * 2021-05-10 2021-07-30 南京理工大学 一种融合关键词生成的推荐算法
CN113536139A (zh) * 2021-09-15 2021-10-22 湖南工商大学 基于兴趣的内容推荐方法、装置、计算机设备及存储介质
CN113673773A (zh) * 2021-08-25 2021-11-19 山东科技大学 一种融合知识背景和学习时间预测的学习路径推荐方法
WO2022007526A1 (zh) * 2020-07-07 2022-01-13 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN114969547A (zh) * 2022-06-24 2022-08-30 杭州电子科技大学 一种基于多视角增强图注意神经网络的音乐推荐方法
CN115062230A (zh) * 2022-08-16 2022-09-16 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN116595157A (zh) * 2023-07-17 2023-08-15 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与系统

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637911B (zh) * 2022-02-21 2024-04-09 桂林电子科技大学 一种注意力融合感知网络的下一个兴趣点推荐方法
CN115018553B (zh) * 2022-06-30 2024-05-07 东南大学 基于深度学习的区域物流单量预测系统及方法
CN115357783B (zh) * 2022-08-01 2023-06-06 山东省计算中心(国家超级计算济南中心) 一种基于结构化多兴趣协同的企业服务快讯推荐方法
CN115691788B (zh) * 2022-10-27 2023-07-14 北京理工大学 一种基于异构数据的双重注意力耦合网络糖尿病分类系统
CN115858926B (zh) * 2022-11-29 2023-09-01 杭州电子科技大学 基于用户的复杂多模式兴趣提取与建模的序列推荐方法
CN116187767B (zh) * 2023-04-26 2023-07-14 北京网智天元大数据科技有限公司 一种基于图注意力机制的企业风险传导预测方法及系统
CN117455629A (zh) * 2023-11-24 2024-01-26 美服数字科技(广州)有限公司 一种直播带货智能推送方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885671A (zh) * 2019-02-28 2019-06-14 重庆邮电大学 基于多任务学习的问答方法
US20190228347A1 (en) * 2018-01-25 2019-07-25 Sabre Glbl Inc. Computerized Travel Itinerary Recommendation Tool and Method Using Contextual Information
CN110569353A (zh) * 2019-07-03 2019-12-13 重庆大学 一种基于注意力机制的Bi-LSTM的标签推荐方法
US20200074449A1 (en) * 2018-08-29 2020-03-05 Capital One Services, Llc Systems and methods for multi-use account system
CN110929164A (zh) * 2019-12-09 2020-03-27 北京交通大学 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107436950B (zh) * 2017-08-07 2020-12-29 苏州大学 一种旅行路线推荐方法及系统
US20200111043A1 (en) * 2018-10-04 2020-04-09 Milan Cheeks System and method for providing personalized planning
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190228347A1 (en) * 2018-01-25 2019-07-25 Sabre Glbl Inc. Computerized Travel Itinerary Recommendation Tool and Method Using Contextual Information
US20200074449A1 (en) * 2018-08-29 2020-03-05 Capital One Services, Llc Systems and methods for multi-use account system
CN109885671A (zh) * 2019-02-28 2019-06-14 重庆邮电大学 基于多任务学习的问答方法
CN110569353A (zh) * 2019-07-03 2019-12-13 重庆大学 一种基于注意力机制的Bi-LSTM的标签推荐方法
CN110929164A (zh) * 2019-12-09 2020-03-27 北京交通大学 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022007526A1 (zh) * 2020-07-07 2022-01-13 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN112559878B (zh) * 2020-12-24 2022-09-23 山西大学 一种基于图神经网络的序列推荐系统及推荐方法
CN112559878A (zh) * 2020-12-24 2021-03-26 山西大学 一种基于图神经网络的序列推荐系统及推荐方法
CN112784153A (zh) * 2020-12-31 2021-05-11 山西大学 融合属性特征注意力与异质类型信息的旅游景点推荐方法
CN113190751A (zh) * 2021-05-10 2021-07-30 南京理工大学 一种融合关键词生成的推荐算法
CN113190751B (zh) * 2021-05-10 2022-09-27 南京理工大学 一种融合关键词生成的推荐方法
CN113673773A (zh) * 2021-08-25 2021-11-19 山东科技大学 一种融合知识背景和学习时间预测的学习路径推荐方法
CN113673773B (zh) * 2021-08-25 2024-01-23 山东科技大学 一种融合知识背景和学习时间预测的学习路径推荐方法
CN113536139A (zh) * 2021-09-15 2021-10-22 湖南工商大学 基于兴趣的内容推荐方法、装置、计算机设备及存储介质
CN114969547B (zh) * 2022-06-24 2023-04-18 杭州电子科技大学 一种基于多视角增强图注意神经网络的音乐推荐方法
CN114969547A (zh) * 2022-06-24 2022-08-30 杭州电子科技大学 一种基于多视角增强图注意神经网络的音乐推荐方法
CN115062230A (zh) * 2022-08-16 2022-09-16 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN115062230B (zh) * 2022-08-16 2023-01-06 深圳市海清视讯科技有限公司 数据处理方法、装置、设备、介质和程序产品
CN116595157A (zh) * 2023-07-17 2023-08-15 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与系统
CN116595157B (zh) * 2023-07-17 2023-09-19 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与系统

Also Published As

Publication number Publication date
WO2022007526A1 (zh) 2022-01-13

Similar Documents

Publication Publication Date Title
CN111915395A (zh) 一种基于多视图注意力机制的旅游包推荐方法
CN112749339B (zh) 一种基于旅游知识图谱的旅游路线推荐方法及系统
Sun et al. Conversational recommender system
CN110795619B (zh) 一种融合多目标的教育资源个性化推荐系统及方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
Staab et al. Intelligent systems for tourism
CN110188182A (zh) 模型训练方法、对话生成方法、装置、设备及介质
CN104935963A (zh) 一种基于时序数据挖掘的视频推荐方法
WO2021139415A1 (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN107403398A (zh) 一种英语教育互联网平台及其使用方法
Xie et al. Marketing strategy of rural tourism based on big data and artificial intelligence
CN108664658A (zh) 一种考虑用户偏好动态变化的协同过滤视频推荐方法
CN107507054A (zh) 一种基于循环神经网络的推荐算法
CN106407377A (zh) 基于人工智能的搜索方法和装置
CN109684548B (zh) 一种基于用户图谱的数据推荐方法
CN114463091A (zh) 信息推送模型训练和信息推送方法、装置、设备和介质
Sarkar et al. A new point-of-interest approach based on multi-itinerary recommendation engine
Zhong et al. Design of a personalized recommendation system for learning resources based on collaborative filtering
CN111159242B (zh) 一种基于边缘计算的客户端重排序方法及系统
CN115526590A (zh) 一种结合专家知识和算法的高效人岗匹配与复推方法
CN109885748A (zh) 基于语意特征的优化推荐方法
CN116166875A (zh) 基于元路径增强的异质图神经网络的双向跨域推荐方法
Quadrana Algorithms for sequence-aware recommender systems
Fuentes et al. Best Next Preference Prediction Based on LSTM and Multi-level Interactions
CN110334236A (zh) 一种基于施密特正交化约束的细粒度检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201110

RJ01 Rejection of invention patent application after publication