CN111949877B - 一种个性化兴趣点推荐方法及系统 - Google Patents

一种个性化兴趣点推荐方法及系统 Download PDF

Info

Publication number
CN111949877B
CN111949877B CN202010816756.9A CN202010816756A CN111949877B CN 111949877 B CN111949877 B CN 111949877B CN 202010816756 A CN202010816756 A CN 202010816756A CN 111949877 B CN111949877 B CN 111949877B
Authority
CN
China
Prior art keywords
user
interest
interest point
point
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010816756.9A
Other languages
English (en)
Other versions
CN111949877A (zh
Inventor
刘凯
李观波
向继
查达仁
王雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN202010816756.9A priority Critical patent/CN111949877B/zh
Publication of CN111949877A publication Critical patent/CN111949877A/zh
Application granted granted Critical
Publication of CN111949877B publication Critical patent/CN111949877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种个性化兴趣点推荐方法及系统。本方法包括:1)根据用户及兴趣点的历史签到信息,获取用户集合、兴趣点集合和每个用户兴趣点集合;2)将每个兴趣点信息进行编码得到兴趣点向量;3)根据兴趣点签到时间信息,编码得到对应用户的时间特征向量;4)根据兴趣点签到天气信息,编码得到对应用户的天气特征向量;5)根据兴趣点签到信息,编码得到对应用户是空间特征向量;6)根据用户的上述向量,得到对应用户兴趣点矩阵;7)根据用户兴趣点矩阵训练LSTM‑Autoencoder模型,对签到序列进行修正,得到用户兴趣点访问偏好;8)根据目标用户的兴趣点访问偏好,给定时间信息、天气信息,向目标用户进行兴趣点推荐。

Description

一种个性化兴趣点推荐方法及系统
技术领域
本发明涉及兴趣点(Point-of-Interest,POI)推荐技术,尤其涉及一种个性化兴趣点推荐方法及系统,属于推荐系统领域。
背景技术
随着互联网的高速发展和移动智能设备的迅速普及,人们越来越关注自己的位置以及周边地理位置的信息,基于位置服务应用(Location-Based Services,LBS)吸引了大量用户使用。基于位置服务应用通过移动智能设备能快速得到用户的地理位置信息,及时提供相应的位置服务,例如Google、百度、必应等搜索引擎利用用户的位置信息改善搜索结果的排序;QQ、微信、微博等社交软件利用用户的社交信息和位置信息来向用户推荐好友或附近的用户;美团、大众点评等网站使用用户的兴趣点签到数据、用户的地理位置信息等分析用户的习惯,给用户推荐餐厅、商场等兴趣点。
兴趣点(Point-of-Interest,POI),泛指一切可以抽象为点的地理对象,尤其是指一些与人们生活密切相关的地理实体,如商场、公园、酒店、游乐场、停车场、地标建筑等。人们可以使用移动智能设备随时随地分享自己所处的位置,也可以对自己喜欢的兴趣点进行打卡签到,还可以把自己在这些兴趣点的体验分享到网络上,由此产生了大量的交互信息以及时间、地点、评论等丰富的辅助信息,这些信息为针对用户个性化推荐兴趣点提供了可能。基于位置服务应用通过发掘用户的偏好,帮助用户探索从未去过的兴趣点,提供更好的用户体验,还可以帮助商家推荐潜在客户,产生商业价值。因此,个性化兴趣点推荐方法的研究具有重要的意义。
目前,兴趣点推荐算法研究主要结合用户个人信息、用户社交关系、用户签到位置坐标、用户签到时间、评论信息等进行推荐。基于位置服务应用能获取用户访问兴趣点的时间记录,通过分析用户签到数据,挖掘用户签到行为的时序特征。从时间角度上,用户在工作日和节假日访问的地点会不同,在同一天中不同时间段访问的地点也会出现不同。用户的偏好不是一成不变的,而是会随着时间的变化而变化。从空间角度上,人们访问一个兴趣点后,通常会访问该兴趣点附近的地理位置,相邻的兴趣点比远距离的兴趣点具有更强的地理相关性。用户在一段时间里会有一个或多个活动中心,如公司、学校、家等,用户更倾向于访问活动中心附近的兴趣点。充分利用时间信息和空间信息可以提高兴趣点推荐的准确性,给用户带来更好的体验。
但在现实生活中经常会出现地理位置信息缺失的情况,如用户访问的位置没有GPS信号,这时用户的地理位置信息可能会丢失,导致用户的兴趣点签到序列不完整。此外,还会出现地理位置信息异常的情况,如用户访问的位置GPS信号较弱,用户的地理位置信息可能会发生“漂移”,导致用户的签到位置与实际地理位置相差较远,或者在较短的时间里用户移动了很远的距离,这些错误的兴趣点签到项应该从用户的兴趣点签到序列中删除。综上,如果能识别用户在过去特定时间访问过的兴趣点,将缺失的兴趣点签到信息进行补全,删除错误的兴趣点签到信息,将有助于挖掘正确、完整的用户偏好,提升兴趣点推荐的性能。
用户是否访问一个兴趣点不仅取决于自身的喜好,还取决于一些外部因素,如时间、天气。用户日常出行和节假日出行差别较大,用户日常访问兴趣点受到工作、学习等约束,一般倾向于访问距离较近的兴趣点,而在节假日,用户时间较充分,访问距离较远的兴趣点的可能性会提升。同样,用户的出行还会受到天气因素的影响,如晴天、雨天、雾霾等天气会影响用户是否出行、出行的目的地、出行距离等。因此,在对用户进行兴趣点推荐时,考虑外部因素的影响,在一定程度上能改善推荐的准确性。
发明内容
本发明目的是提供一种个性化用户兴趣点推荐方法,从目标用户的兴趣点访问记录出发,通过补全目标用户缺失的兴趣点访问信息,删除目标用户错误的兴趣点访问信息,挖掘目标用户的兴趣点访问偏好,并考虑外部因素的影响,实现个性化兴趣点推荐。
为实现上述目的,本发明采用如下的技术方案:
一种个性化用户兴趣点推荐方法,包括以下步骤:
步骤1,根据用户及兴趣点的历史签到信息,获取用户集合、兴趣点集合和每个用户兴趣点集合;
步骤2,将每个兴趣点信息通过嵌入模型编码得到兴趣点向量;
步骤3,根据用户的兴趣点签到时间信息,编码得到对应用户的时间特征向量;
步骤4,根据用户的兴趣点签到天气信息,编码得到对应用户的天气特征向量;
步骤5,根据用户的兴趣点签到信息,计算得到对应用户的活动中心,进一步编码得到对应用户是空间特征向量;
步骤6,根据用户的兴趣点签到序列,对序列中的每个兴趣点,分别获取步骤2中兴趣点向量,并融合步骤3中时间特征向量、步骤4中天气特征向量、步骤5中空间特征向量,得到对应用户兴趣点矩阵;
步骤7,根据步骤6中所有用户兴趣点矩阵数据,训练LSTM-Autoencoder模型,该模型分为Encoder和Decoder两部分,其中Encoder部分用于编码用户兴趣点访问偏好,Decoder部分用于修正用户兴趣点签到序列;
步骤8,使用步骤7中训练好的LSTM-Autoencoder模型,对每个用户兴趣点签到序列进行修正,得到修正后的用户签到序列;
步骤9,将步骤8中修正后的用户签到序列,通过LSTM-Autoencoder模型得到所有用户兴趣点访问偏好;
步骤10,根据目标用户的用户兴趣点访问偏好,给定时间信息、天气信息,计算在该情况下候选推荐兴趣点的推荐评分,按推荐评分从高到低的顺序向该目标用户进行兴趣点推荐。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)本发明使用兴趣点信息对兴趣点进行编码,各兴趣点不再是简单二进制编码,融入兴趣点自身的信息进行编码,使得兴趣点之间不再独立,有利于挖掘用户偏好。
(2)本发明通过编码用户时间特征,捕捉目标用户在工作日或节假日以及同一天中不同时间段兴趣点访问的时间偏好特征,有利于在指定时间情况下对目标用户进行兴趣点推荐。
(3)本发明通过编码用户天气特征,捕捉目标用户在不同天气情况下兴趣点访问的天气偏好特征,有利于在指定天气情况下对目标用户进行兴趣点推荐。
(4)本发明通过编码用户空间特征,捕捉目标用户兴趣点访问记录与活动中心的地理位置偏好特征,结合时间偏好特征和天气偏好特征,有利于完整地挖掘目标用户的兴趣点访问偏好。
(5)本发明使用LSTM-Autoencoder模型,该模型Encoder部分用于编码用户的兴趣点访问偏好,以便计算候选推荐兴趣点的推荐得分;该模型Decoder部分用于修正用户签到序列,解决用户在地理位置信息缺失的情况下,用户的兴趣点签到序列不完整的问题,同时还解决了地理位置信息异常的情况下,用户的兴趣点签到序列错误的问题。
(6)本发明融合了时间、天气、空间三种外部因素挖掘用户兴趣点访问偏好,可以在指定时间和天气的情况下,对目标用户进行个性化兴趣点推荐,帮助用户探索兴趣点,提供更好的用户体验。从商家的角度看,可以在指定时间和天气的情况下,得到各个用户访问目标商家兴趣点的可能性,向商家推荐潜在客户,产生商业价值。
附图说明
图1是本发明的系统结构图。
图2是本发明公开的LSTM-Autoencoder模型结构图。
图3是本发明公开的个性化用户兴趣点推荐方法的流程示意图。
具体实施方式
下面将结合附图,对本发明的技术方案做进一步详细说明。
一、系统结构
基于本发明的系统包括数据管理模块、特征编码模块、特征融合模块、序列修正模块、偏好挖掘模块及推荐模块,如图1所示,以下对各部分进行具体说明:
(1)数据管理模块
存储数据,存储从基于位置服务应用网站抓取的用户的签到记录数据(包含用户ID,签到位置ID,位置名称,位置类型,位置坐标,时间);
查询数据,查询存储在数据库中的数据;
数据维护,包括数据库的备份、空间检查、日志检查、安全检查等。
(2)特征编码模块
兴趣点编码,利用收集得到的兴趣点信息,通过嵌入模型编码生成兴趣点向量;
时间特征编码,根据用户在兴趣点的签到时间,编码得到时间特征向量;
天气特征编码,根据签到位置和时间,调用天气API查询天气数据,编码得到天气特征向量;
空间特征编码,使用DBSCAN算法得到用户活动中心,计算各签到位置距离用户活动中心距离,编码得到空间特征向量。
(3)特征融合模块
权重管理,管理时间特征、天气特征、空间特征的权重因子;
特征融合,将兴趣点向量与时间特征向量、天气特征向量、空间特征向量按权重因子进行融合。
(4)序列修正模块
缺失项补全,对目标用户兴趣点签到序列中缺失的兴趣点签到记录进行补全;
错误项删除,对目标用户兴趣点签到序列中错误的兴趣点签到记录进行删除;
参数管理,储存和管理LSTM-Autoencoder的Decoder部分模型参数。
(5)偏好挖掘模块
偏好挖掘,根据目标用户兴趣点签到记录,挖掘目标用户的兴趣点访问偏好;
参数管理,储存和管理LSTM-Autoencoder的Encoder部分模型参数。
(6)推荐模块
用户推荐,在指定时间和天气的情况下,向目标商家推荐潜在用户;
商家推荐,在指定时间和天气的情况下,向目标用户推荐兴趣点。
二、模型
本发明使用LSTM-Autoencoder修正用户兴趣点签到序列,挖掘用户兴趣点访问偏好。
LSTM是一种用于处理序列数据的神经网络,相比一般的神经网络,LSTM能够处理序列长度变化的数据。用户兴趣点签到序列长度不是固定的,适合使用LSTM。
Autoencoder是一种无监督学习技术,利用神经网络进行表征学习,常用于异常监测、数据去燥、数据修复等。使用Autoencoder可检测用户兴趣点签到序列中由于地理位置信息错误导致的异常项,同时还可以修复由于地理位置信息丢是导致的缺失项。
如图2所示,为LSTM-Autoencoder模型结构图,模型分为Encoder和Decoder两部分,Encoder部分用于编码用户兴趣点访问偏好,Decoder部分用于修正用户兴趣点签到序列。
在LSTM-Autoencoder的Encoder中,输入是用户u的兴趣点矩阵为Xu,兴趣点矩阵Xu由n个列向量构成,每一个列向量为一个兴趣点的向量表示,列向量xt表示目标用户u访问的第t个兴趣点的向量表示。每个LSTM单元都有一个记录在t时刻的状态向量ct,状态向量可以看作记忆单元,签到序列的每一个兴趣点向量依次输入,通过输入门it、遗忘门ft、输出门ot对记忆单元ct读取、修改,模型不断学习序列中的信息,最终Encoder得到用户兴趣点访问偏好hn。Encoder在学习第t个兴趣点信息时,需要结合前t-1个兴趣点的信息ht-1、ct-1。具体公式如下:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
ht=ottanh(ct)
其中,σ(·)表示sigmoid函数,tanh(·)表示双曲正切函数。
在LSTM-Autoencoder的Decoder中,通过用户兴趣点访问偏好hn反向重建用户兴趣点签到序列,实现兴趣点签到序列缺失项补全和异常项删除。由于Decoder反向重建用户兴趣点签到序列,产生的第一个输出为用户兴趣点签到序列最后一项,符号上将第一个输出记作ym,第二个输出记作ym-1,以此类推。Decoder在重建第t个兴趣点信息时,需要结合前一个输出yt+1,以及前面的兴趣点信息ht+1、ct+1。在具体公式如下:
it=σ(Wyiyt+1+Whiht+1+Wcict+1+bi)
ft=σ(Wyfyt+1+Whfht+1+Wcfct+1+bf)
ct=ftct+1+ittanh(Wycyt+1+Whcht+1+bc)
ot=σ(Wyoyt+1+Whoht+1+Wcoct+bo)
ht=ottanh(ct)
yt=softmax(Wht+b)
其中,σ(·)表示sigmoid函数,tanh(·)表示双曲正切函数,softmax(·)表示归一化指数函数。
三、推荐流程
如图3所示,为目标用户u在时间t和天气w的情况下对其进行兴趣点推荐的流程,具体步骤如下:
S101,获取目标用户及兴趣点历史签到信息,得到兴趣点集合L′u和签到时间集合T′u
查询并获取数据集中目标用户u访问过的兴趣点,构成目标用户u的兴趣点集合L′u和签到时间集合T′u。兴趣点集合L′u由若干个兴趣点组成,
Figure BDA0002632990850000061
Figure BDA0002632990850000062
表示用户u访问第i个兴趣点的编号。签到时间集合T′u由用户的签到时间组成,
Figure BDA0002632990850000063
表示用户u访问第i个兴趣点的时间。兴趣点集合L′u元素和签到时间集合T′u元素一一对应。
S102,编码兴趣点集合中的兴趣点,得到目标用户u兴趣点编码矩阵Lu
查询L′u中的兴趣点数据,得到各兴趣点的信息,兴趣点信息包括ID、名称、类型、坐标,利用兴趣点信息对兴趣点进行编码。ID作为兴趣点编号用于区分兴趣点,ID改变不会影响推荐结果,故不需要进行编码;兴趣点的名字和类型包含了的语义信息,使用BERT预训练模型,将兴趣点名字和类型的语义信息转化为向量表示,得到2个32维列向量xname和xtype。将xname、xtype拼接在一起得到64维列向量
Figure BDA0002632990850000064
编码该兴趣点,得到用户u第i个兴趣点的兴趣点向量
Figure BDA0002632990850000065
进一步地,得到目标用户u的兴趣点编码矩阵
Figure BDA0002632990850000066
该矩阵为64×n。
S103,编码用户时间特征,得到目标用户u的时间特征矩阵Tu
时间特征包括类别(工作日或节假日)以及时间段,用1个维度编码类别信息,0表示工作日,1表示节假日;为了避免时间段数据过于稀疏,按照4个小时进行分段,一天24小时共分为6段,分别用6个6维正交列向量表示。例如编码21:30:00,该时刻属于第6个时间段(20:00:00-24:00:00),因此表示为[0 0 0 0 0 1]T;结合类别和时间段,时间特征编码为7维列向量
Figure BDA0002632990850000067
即用户u第i个兴趣点的时间特征
Figure BDA0002632990850000068
进一步地,得到目标用户u的时间特征矩阵
Figure BDA0002632990850000071
该矩阵为7×n;n为用户u的兴趣点总数。
S104,编码用户天气特征,得到目标用户u的天气特征矩阵Wu
根据兴趣点位置信息
Figure BDA0002632990850000072
和时间
Figure BDA0002632990850000073
调用天气API获得天气信息,天气信息包括天气情况wea、实时温度tem、湿度hum,空气质量air,天气特征编码
Figure BDA0002632990850000074
即用户u第i个兴趣点的天气特征
Figure BDA0002632990850000075
进一步地,得到目标用户u的天气特征矩阵
Figure BDA0002632990850000076
Figure BDA0002632990850000077
该矩阵为4×n。
S105,编码用户空间特征,得到目标用户u的空间特征矩阵Su
将用户兴趣点签到序列中的各兴趣点位置作为DBSCAN算法的输入,经过DBSCAN算法计算,输出得到目标用户u的活动中心
Figure BDA0002632990850000078
根据序列中每个兴趣点的位置,计算每个兴趣点与活动中心的距离。以序列中第i个兴趣点为例,该兴趣点的位置为li=[loni,lati],计算li与活动中心cu的距离
Figure BDA0002632990850000079
将兴趣点i的位置li和距离
Figure BDA00026329908500000710
拼接得到目标用户u在该兴趣点i的空间特征
Figure BDA00026329908500000711
该空间特征是一个3维列向量。进一步地,得到目标用户u的空间特征矩阵
Figure BDA00026329908500000712
该矩阵为3×n。
S106,融合特征,得到目标用户u兴趣点矩阵Xu
目标用户u兴趣点编码矩阵Lu融合时间特征矩阵Tu、天气特征矩阵Wu和空间特征矩阵Su,最终目标用户u兴趣点矩阵为Xu=[Lu T αTu T βWu T γSu T]T,该矩阵为78×n,其中α、β、γ分别为时间特征、天气特征、空间特征权重因子。
S107,修正用户兴趣点签到序列,得到修正的目标用户u兴趣点矩阵为Xu′;
把目标用户u兴趣点矩阵为Xu输入到训练好的LSTM-Autoencoder模型中,通过该模型Decoder部分的输出得到修正后的目标用户u兴趣点矩阵为Xu′,若修正后的兴趣点签到序列长度为m,则该矩阵为78×m。
S108,挖掘用户兴趣点访问偏好,得到用户兴趣点访问偏好hu
把修正的目标用户u兴趣点矩阵为Xu′输入到训练好的LSTM-Autoencoder模型中,通过该模型Encoder部分的输出得到用户兴趣点访问偏好hu,hu为78维列向量。
S109,生成兴趣点推荐信息;
根据目标用户u兴趣点访问偏好向量hu,根据S103步骤中时间编码方式给定时间信息t、根据S104步骤中天气编码方式给定天气信息w,根据S105步骤计算第i个候选推荐点li的空间特征si,拼接得到该候选推荐点向量xi,xi=[li αt βw γsi]T;计算该候选推荐兴趣点的推荐评分Scoreu,i=hu Txi;重复上述步骤,对所有的候选推荐点进行推荐评分计算,根据评分从高到低,向用户推荐兴趣点。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求书所述为准。

Claims (10)

1.一种个性化兴趣点推荐方法,其步骤包括:
1)根据用户及兴趣点的历史签到信息,获取用户集合、兴趣点集合和每个用户兴趣点集合;其中目标用户u的兴趣点集合为
Figure FDA0004003530150000011
其中第i个元素
Figure FDA0004003530150000012
表示用户u访问第i个兴趣点的兴趣点编号,签到时间集合
Figure FDA0004003530150000013
其中第i个元素
Figure FDA0004003530150000014
表示用户u访问第i个兴趣点的时间;兴趣点集合L′u中元素与签到时间集合T′u中元素一一对应,n为目标用户u访问的兴趣点总数;
2)根据兴趣点编号查询每个兴趣点信息并通过嵌入模型编码得到兴趣点向量;其中目标用户u的兴趣点向量
Figure FDA0004003530150000015
其中第i个分量
Figure FDA0004003530150000016
为用户u第i个兴趣点的兴趣点向量,
Figure FDA0004003530150000017
xname为兴趣点名字向量,xtype为兴趣点类型向量;
3)根据用户的兴趣点签到时间信息,编码得到对应用户的时间特征向量;其中目标用户u的时间特征向量
Figure FDA0004003530150000018
其中第i个分量
Figure FDA0004003530150000019
为用户u访问第i个兴趣点的时间特征;
Figure FDA00040035301500000110
包括访问第i个兴趣点的时间类别信息以及时间段信息;
4)根据用户的兴趣点签到天气信息,编码得到对应用户的天气特征向量;其中目标用户u的天气特征向量
Figure FDA00040035301500000111
其中第i个分量
Figure FDA00040035301500000112
为用户u第i个兴趣点的天气特征;
5)根据用户的兴趣点签到信息,计算得到对应用户的空间特征向量;其中目标用户u的空间特征向量
Figure FDA00040035301500000113
目标用户u在该兴趣点i的空间特征
Figure FDA00040035301500000114
6)根据用户的兴趣点签到序列中每个兴趣点的兴趣点向量、时间特征向量、天气特征向量、空间特征向量,生成对应用户的兴趣点矩阵;
7)根据各用户的兴趣点矩阵数据训练LSTM-Autoencoder模型,其中LSTM-Autoencoder模型的Encoder部分用于编码用户兴趣点访问偏好,LSTM-Autoencoder模型的Decoder部分用于修正用户兴趣点签到序列;
8)使用训练好的LSTM-Autoencoder模型,对每个用户兴趣点签到序列进行修正,得到修正后的用户签到序列;
9)将目标用户u修正后的签到序列输入LSTM-Autoencoder模型得到该目标用户u的兴趣点访问偏好向量hu
10)根据目标用户u兴趣点访问偏好向量hu,确定目标用户u在给定时间信息t、天气信息w时的候选推荐兴趣点。
2.如权利要求1所述的方法,其特征在于,步骤10)中,根据给定时间信息t、天气信息w,计算该目标用户u兴趣点签到序列中每个兴趣点的空间特征及推荐评分,其中第i个候选推荐兴趣点li的空间特征为si,然后拼接得到第i个候选推荐兴趣点的向量
Figure FDA00040035301500000211
Figure FDA00040035301500000212
对应推荐评分Scoreu,i=hu Txi;然后根据推荐评分向该目标用户u推荐兴趣点;α、β、γ分别为时间特征、天气特征、空间特征权重因子。
3.如权利要求1所述的方法,其特征在于,得到目标用户u的空间特征向量Su的方法为:首先根据目标用户u访问的各兴趣点位置计算目标用户u的活动中心cu;然后计算每个兴趣点与活动中心的距离;其中第i个兴趣点的位置li与活动中心cu的距离为
Figure FDA0004003530150000021
将兴趣点i的位置li和距离
Figure FDA0004003530150000022
拼接得到目标用户u在该兴趣点i的空间特征
Figure FDA0004003530150000023
然后根据兴趣点的空间特征得到目标用户u的空间特征向量
Figure FDA0004003530150000024
4.如权利要求1所述的方法,其特征在于,目标用户u的兴趣点矩阵Xu=[Lu T αTu T βWu TγSu T]T,其中α、β、γ分别为时间特征、天气特征、空间特征的权重因子。
5.如权利要求1所述的方法,其特征在于,所述天气特征
Figure FDA0004003530150000025
包括天气情况wea、实时温度tem、湿度hum和空气质量air。
6.如权利要求1所述的方法,其特征在于,
Figure FDA0004003530150000026
包括用1个维度编码类别信息,0表示工作日、1表示节假日;按照4个小时对一天进行分段,分别用6个6维正交列向量表示每一分段信息。
7.一种个性化兴趣点推荐系统,其特征在于,包括数据管理模块、特征编码模块、特征融合模块、序列修正模块、偏好挖掘模块及推荐模块;其中,
数据管理模块,用于根据用户及兴趣点的历史签到信息,获取用户集合、兴趣点集合和每个用户兴趣点集合;其中目标用户u的兴趣点集合为
Figure FDA0004003530150000027
其中第i个元素
Figure FDA0004003530150000028
表示用户u访问第i个兴趣点的兴趣点编号,签到时间集合
Figure FDA0004003530150000029
其中第i个元素
Figure FDA00040035301500000210
表示用户u访问第i个兴趣点的时间;兴趣点集合L′u中元素与签到时间集合T′u中元素一一对应,n为目标用户u访问的兴趣点总数;
特征编码模块,用于将根据兴趣点编号查询获取的每个兴趣点信息通过嵌入模型编码得到兴趣点向量,根据用户的兴趣点签到时间信息,编码得到对应用户的时间特征向量,以及根据用户的兴趣点签到信息,计算得到对应用户的空间特征向量;其中目标用户u的空间特征向量为Su,目标用户u的兴趣点向量为Lu,目标用户u的时间特征向量为
Figure FDA0004003530150000031
其中第i个分量
Figure FDA0004003530150000032
为用户u访问第i个兴趣点的时间特征;
Figure FDA0004003530150000033
包括访问第i个兴趣点的时间类别信息以及时间段信息;以及根据用户的兴趣点签到天气信息,编码得到对应用户的天气特征向量;其中目标用户u的天气特征向量
Figure FDA0004003530150000034
Figure FDA0004003530150000035
其中第i个分量
Figure FDA0004003530150000036
为用户u第i个兴趣点的天气特征;
特征融合模块,用于根据用户的兴趣点签到序列中每个兴趣点的兴趣点向量、时间特征向量、天气特征向量、空间特征向量,生成对应用户的兴趣点矩阵;
序列修正模块,用于使用训练好的LSTM-Autoencoder模型,对每个用户兴趣点签到序列进行修正,得到修正后的用户签到序列;其中根据各用户的兴趣点矩阵数据训练LSTM-Autoencoder模型,得到训练好的LSTM-Autoencoder模型;LSTM-Autoencoder模型的Encoder部分用于编码用户兴趣点访问偏好,LSTM-Autoencoder模型的Decoder部分用于修正用户兴趣点签到序列;
偏好挖掘模块,用于将目标用户u修正后的签到序列输入LSTM-Autoencoder模型得到该目标用户u的兴趣点访问偏好向量hu
推荐模块,用于根据目标用户u兴趣点访问偏好向量hu,确定目标用户u在给定时间信息t、天气信息w时的候选推荐兴趣点。
8.如权利要求7所述的系统,其特征在于,所述推荐模块根据给定时间信息t、天气信息w,计算该目标用户u兴趣点签到序列中每个兴趣点的空间特征及推荐评分,其中第i个候选推荐兴趣点li的空间特征为si,然后拼接得到第i个候选推荐兴趣点的向量
Figure FDA00040035301500000311
Figure FDA00040035301500000312
对应推荐评分Scoreu,i=hu Txi;然后根据推荐评分向该目标用户u推荐兴趣点;α、β、γ分别为时间特征、天气特征、空间特征权重因子。
9.如权利要求7所述的系统,其特征在于,得到目标用户u的空间特征向量Su的方法为:首先根据目标用户u访问的各兴趣点位置计算目标用户u的活动中心cu;然后计算每个兴趣点与活动中心的距离;其中第i个兴趣点的位置li与活动中心cu的距离为
Figure FDA0004003530150000037
将兴趣点i的位置li和距离
Figure FDA0004003530150000038
拼接得到目标用户u在该兴趣点i的空间特征
Figure FDA0004003530150000039
然后根据兴趣点的空间特征得到目标用户u的空间特征向量
Figure FDA00040035301500000310
10.如权利要求7所述的系统,其特征在于,目标用户u的兴趣点矩阵Xu=[Lu T αTu T βWu TγSu T]T,其中α、β、γ分别为时间特征、天气特征、空间特征的权重因子。
CN202010816756.9A 2020-08-14 2020-08-14 一种个性化兴趣点推荐方法及系统 Active CN111949877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010816756.9A CN111949877B (zh) 2020-08-14 2020-08-14 一种个性化兴趣点推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010816756.9A CN111949877B (zh) 2020-08-14 2020-08-14 一种个性化兴趣点推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111949877A CN111949877A (zh) 2020-11-17
CN111949877B true CN111949877B (zh) 2023-02-28

Family

ID=73343354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010816756.9A Active CN111949877B (zh) 2020-08-14 2020-08-14 一种个性化兴趣点推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111949877B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765493B (zh) * 2021-01-04 2022-07-05 武汉大学 一种用于兴趣点推荐的获取时间偏好融合序列偏好的方法
CN112925893B (zh) * 2021-03-23 2023-09-15 苏州大学 一种对话式兴趣点推荐方法、装置、电子设备及存储介质
CN113076344B (zh) * 2021-03-26 2024-04-05 中山大学 一种基于用户App数据的个性化地点推荐方法及系统
CN114943583A (zh) * 2022-05-19 2022-08-26 北京沃东天骏信息技术有限公司 用户喜好物品信息生成方法、装置、电子设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203442A (ja) * 2013-04-10 2014-10-27 株式会社Nttドコモ レコメンド情報生成装置及びレコメンド情報生成方法
CN108804619A (zh) * 2018-05-31 2018-11-13 腾讯科技(深圳)有限公司 兴趣偏好预测方法、装置、计算机设备及存储介质
CN109062962A (zh) * 2018-06-27 2018-12-21 华南理工大学 一种融合天气信息的门控循环神经网络兴趣点推荐方法
KR20190124524A (ko) * 2018-04-26 2019-11-05 충북대학교 산학협력단 관심장소 추천 방법 및 관심장소 추천 시스템
CN110929164A (zh) * 2019-12-09 2020-03-27 北京交通大学 一种基于用户动态偏好与注意力机制的兴趣点推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203442A (ja) * 2013-04-10 2014-10-27 株式会社Nttドコモ レコメンド情報生成装置及びレコメンド情報生成方法
KR20190124524A (ko) * 2018-04-26 2019-11-05 충북대학교 산학협력단 관심장소 추천 방법 및 관심장소 추천 시스템
CN108804619A (zh) * 2018-05-31 2018-11-13 腾讯科技(深圳)有限公司 兴趣偏好预测方法、装置、计算机设备及存储介质
CN109062962A (zh) * 2018-06-27 2018-12-21 华南理工大学 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN110929164A (zh) * 2019-12-09 2020-03-27 北京交通大学 一种基于用户动态偏好与注意力机制的兴趣点推荐方法

Also Published As

Publication number Publication date
CN111949877A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111949877B (zh) 一种个性化兴趣点推荐方法及系统
Wu et al. Personalized long-and short-term preference learning for next POI recommendation
Siła-Nowicka et al. Analysis of human mobility patterns from GPS trajectories and contextual information
CN109062962B (zh) 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN113139140B (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
CN104765873A (zh) 用户相似度确定方法和装置
Zhang et al. VCG: Exploiting visual contents and geographical influence for Point-of-Interest recommendation
CN110704741B (zh) 基于时空点过程的兴趣点预测方法
US20100250366A1 (en) Merge real-world and virtual markers
Shi et al. RegNet: a neural network model for predicting regional desirability with VGI data
CN110110218B (zh) 一种身份关联方法及终端
CN115982468A (zh) 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法
CN111126422B (zh) 行业模型的建立及行业的确定方法、装置、设备及介质
Mou et al. Personalized tourist route recommendation model with a trajectory understanding via neural networks
Qian et al. Vehicle trajectory modelling with consideration of distant neighbouring dependencies for destination prediction
Sang et al. LSVP: A visual based deep neural direction learning model for point-of-interest recommendation on sparse check-in data
CN112241489A (zh) 信息推送方法、装置、可读存储介质和计算机设备
CN116776014B (zh) 多源轨迹数据表示方法及装置
Li et al. Spatio-temporal intention learning for recommendation of next point-of-interest
Liao et al. Traj2Traj: A road network constrained spatiotemporal interpolation model for traffic trajectory restoration
CN111782955A (zh) 兴趣点表示和推送方法、装置、电子设备及存储介质
CN111143534A (zh) 基于人工智能的品牌名的提取方法、装置及存储介质
CN114398462B (zh) 一种基于多源异构信息网络的目的地推荐方法及系统
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN112861474A (zh) 一种信息标注方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant