CN115982468A - 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 - Google Patents
一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 Download PDFInfo
- Publication number
- CN115982468A CN115982468A CN202310006832.3A CN202310006832A CN115982468A CN 115982468 A CN115982468 A CN 115982468A CN 202310006832 A CN202310006832 A CN 202310006832A CN 115982468 A CN115982468 A CN 115982468A
- Authority
- CN
- China
- Prior art keywords
- interest
- user
- representing
- points
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于社交网络兴趣点推荐领域,具体涉及一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,包括:数据处理,将原始数据处理成模型需要的输入数据;根据用户对兴趣点的访问提取兴趣点历史的非连续时空间隔矩阵以及结合兴趣点类型的访问历史轨迹;将用户历史轨迹访问和非连续时空间隔矩阵输入到基于深度学习的网络结构中,得到用户的行为偏好;根据用户的行为偏好在候选兴趣点列表中选取推荐兴趣点,得到有序推荐集合;在有序推荐集合中选取最优的推荐兴趣点;通过本方法有助于商家掌握用户行为特性分布,分析潜在用户,获得良好的经济、社会效益。
Description
技术领域
本发明属于社交网络兴趣点推荐领域,具体涉及一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法。
背景技术
随着移动端设备在社会生活中的快速普及,大量基于位置的社交服务应运而生。人们可以在诸如Foursquare、Yelp、Facebook以及Brightkite等基于位置的社交网络(Location-Based Social Network,LBSN)上分享他们的生活经历并发布签到记录,在国内大众点评、美团、饿了吗以及微博等基于位置的社交服务得到了飞速发展,据统计,在2019年美团的用户交易量增长了12.5%,这其中大量的兴趣点如餐饮、酒店、旅行社等服务的点评量已达数百万。基于位置的社交网络得到快速发展,导致大量的商家、用户数据快速增长,这对用户和服务提供商而言都是巨大的机遇。通过对海量的LBSN数据的分析挖掘,可以帮助服务提供商向用户推荐精准的兴趣点(Point of Interest,POI)。而下一个兴趣点推荐能够预测用户在指定时间点最有可能访问的兴趣点,其应用场景时效强使得下一个兴趣点推荐成为推荐领域中的研究热点问题。兴趣点推荐不但能够为LBSN服务提供商带来经济效益,还能为用户挖掘潜在喜好,进而为生活带来乐趣与便利。对于用户而言,准确有效的兴趣点推荐服务能够帮助用户了解生活环境进而做出访问决策,提高生活乐趣以及了解所在城市。对于商家而言,为用户提供精准的兴趣点推荐能够获取一定的经济效益,提高平台知名度,此外,还能够为用户提供个性化服务以提高用户体验,进而为服务商家分析出用户的个性化喜好特征,挖掘出热门兴趣点区域范围以实现精准营销。
近年来,基于位置的社交网络兴趣点推荐方法越来越受到物联网和电商的青睐。在对兴趣点进行推荐的方法中,通过挖掘用户长短期及其周期偏好的思想对改善用户体验和提高服务质量起到了重要的作用。现有的兴趣点推荐技术可分为协同过滤、矩阵分解、基于马尔科夫链和基于深度学习。基于协同过滤的推荐方法从用户或兴趣点出发,通过计算用户或兴趣点之间的相似度再向目标用户推荐兴趣点;基于矩阵分解的推荐方法主要从用户对兴趣点的签到记录出发构建签到矩阵,通过矩阵分解挖掘用户偏好和兴趣度属性;基于马尔科夫链的方法通过将用户访问兴趣点的轨迹建模成序列记录,假设下一个兴趣点的访问与上一个访问有关建模挖掘序列规律;基于深度学习的兴趣点推荐方法融合多种上下文信息,例如时间、空间、兴趣点类别、社交关系等构建如循环神经网络模型等相关结构、引入注意力机制等相关技术挖掘用户兴趣及兴趣点属性以此推荐用户可能访问的兴趣点。
虽然对兴趣点推荐模型进行了大量的研究,并取得了较好的成果,但仍存在一些挑战:
1、缺乏考虑挖掘用户结合兴趣点类别的周期性偏好;目前的研究方法对用户周期性兴趣研究时往往针对某一个特定兴趣点的周期兴趣,而用户结合兴趣点类别的周期性偏好是指用户有某一种类型的兴趣点或某一个特定兴趣点的固定访问偏好。此外,当用户的访问目标不够明确时,可能只考虑特定类型的兴趣点而不是某个特定的兴趣点。
2、在兴趣点推荐领域,由于用户轨迹中被访问过的兴趣点对比数据集中所有兴趣点所占比例很小,导致了严重的数据稀疏性问题。
3、近期访问的时空间隔能够反应用户短期偏好,但是由于时空间隔数值是一组连续数值,常规的方法如分桶法等需要阈值设定的合理才能保证模型的有效,因此连续时空间隔数值的嵌入存在困难。
发明内容
为解决上述技术问题,本发明提供一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,包括:
S1:获取原始数据,并对原始数据进行预处理,得到新数据集;所述原始数据包括用户访问记录数据、签到序列数据和时空信息数据;
S2:提取新数据集的相关属性生成用户访问兴趣点的签到记录;所述相关属性包括用户访问兴趣点的时间信息和兴趣点的类别、经纬度坐标信息;
S3:根据用户访问兴趣点的签到记录分别通过滑动时间窗口提取用户访问兴趣点的时空轨迹表示和非连续时空间隔矩阵;
S4:根据获取用户结合兴趣点类别的周期性偏好表示,根据时空间隔矩阵采用线性插值法嵌入非连续时空间隔矩阵提取用户高阶短期兴趣;
S5:根据用户结合兴趣点类别的周期性偏好和用户高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点,得到有序推荐集合;
S6:在有序推荐集合中选取模型预测出概率最大的兴趣点进行推荐。
本发明的有益效果:
1、本发明采用用户签到兴趣点行为数据,基于多头自注意力机制和线性插值嵌入法挖掘用户结合兴趣点类别的周期性偏好和短期兴趣,为目标用户产生新的兴趣点推荐集合,解决了数据稀疏性问题;
2、本发明综合用户访问兴趣点的类别和时空信息,分析用户的周期性访问规律和短期偏好,为目标用户推荐符合其周期偏好和短期兴趣的兴趣点;通过本发明所述的方法可帮助用户快速探索和规划出行目的;有助于商家掌握用户行为特性分布,分析潜在用户,获得良好的经济、社会效益。
附图说明
图1为本发明的结合用户周期性偏好和短期兴趣的兴趣点推荐流程图。
图2为本发明的用户偏好兴趣提取结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,如图1所示,包括:
S1:获取原始数据,并对原始数据进行预处理,得到新数据集;所述原始数据包括用户访问记录数据、签到序列数据和时空信息数据;
S2:提取新数据集的相关属性生成用户访问兴趣点的签到记录;所述相关属性包括用户访问兴趣点的时间信息和兴趣点的类别、经纬度坐标信息;
S3:根据用户访问兴趣点的签到记录分别通过滑动时间窗口提取用户访问兴趣点的时空轨迹表示和非连续时空间隔矩阵;
S4:根据获取用户结合兴趣点类别的周期性偏好表示,根据时空间隔矩阵采用线性插值法嵌入非连续时空间隔矩阵提取用户高阶短期兴趣;
S5:根据用户结合兴趣点类别的周期性偏好和用户高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点,得到有序推荐集合;
S6:在有序推荐集合中选取模型预测出概率最大的兴趣点进行推荐。
对原始数据进行预处理,得到新数据集,包括:
对原始数据进行预处理的过程包括对原始数据进行清洗;由于获取的原始数据为非结构化数据,不能直接用于数据分析,通过简单的数据清洗可以使大部分非结构化数据结构化,例如,删除重复数据、清理无效节点等。设置签到阈值;统计清洗后数据中所有用户对兴趣点的签到次数和所有兴趣点被用户签到的次数;若用户对兴趣点的签到次数小于签到阈值,则删除该用户的数据,若兴趣点被用户签到的次数小于签到阈值,则删除该兴趣点,得到新的数据集。
所述签到阈值设置为10,用户签到兴趣点的次数和所有兴趣点被用户签到的次数小于10,则认为该用户的签到数据和该兴趣点不具有代表性。
提取新数据集的相关属性,包括:
S21:从获取到的用户访问记录数据、签到序列数据和时空信息数据中获取用户和兴趣点的ID信息,签到时间戳,兴趣点类别以及兴趣点空间经纬度坐标;
S22:从获取到的数据中将签到时间戳转换为周期时间段,将签到时间信息表示为每周中的某个小时。
提取用户访问兴趣点的时空轨迹表示,包括:
提取用户访问兴趣点的非连续时空间隔矩阵,包括:
其中,表示用户访问过的兴趣点的时空间隔矩阵,表示,表示,dis(vi,vj)表示兴趣点vi和兴趣点vj之间的空间距离,u表示当前用户,T表示时间间隔,k表示按时间升序排列下的签到顺序,L表示空间间隔,tk表示访问的顺序,w表示时间窗口大小。
获取用户结合兴趣点类别的周期性偏好表示,包括:
其中,C表示用户对兴趣点的时段访问轨迹的用户轨迹表示向量,dk表示嵌入维度大小,w表示时间窗口大小,表示第i次签到的用户嵌入表示,表示第i次签到的兴趣点嵌入表示,表示第i次签到的兴趣点类别嵌入表示,表示第i次签到的时间嵌入表示,表示嵌入维度,jointi表示第i次签到的联合嵌入表示,joint表示访问轨迹的嵌入表示,表示第tk次签到的联合嵌入表示,Softsign()表示激活函数;
S42:根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量。
根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量,包括:
headi=Attention(CWi Q,CWi K,CWi V)
P=Concat(head1,head2,…,headh)WO
FFN(P)=LeakyReLU(PW1+b1)W2+b2
Period=FFN(P)+C
其中,C表示用户对兴趣点的时段访问轨迹的用户轨迹表示向量,WQ,WV和WK表示C进行线性变换的第一、第二、第三可训练矩阵,dk表示嵌入维度大小,Period(U)表示用户在时间窗口中结合兴趣点类别的周期性偏好,headi表示第i个自注意力头输出结果,Attention( )表示自注意力计算函数,Q表示查询向量,K表示键向量,V表示值向量,T表示向量转置,P表示所有自注意力头经过线性转换后的向量表示,Concat( )表示向量拼接函数,WO表示与自注意力头线性运算的可训练矩阵,FFN(P)表示全连接层运算,LeakyReLU( )表示为激活函数,W1、W2分别表示可训练矩阵,b1、b2分别表示可训练参数,Period表示用户周期偏好表示向量。
嵌入非连续时空间隔矩阵,包括:
其中,表示表示用户第i次签到的短期兴趣表示,eΔ表示签到用户轨迹的短期兴趣表示,分别表示用户第i次签到的时间间隔矩阵嵌入学习和空间间隔学习,ΔT和ΔL分别表示时间间隔矩阵和空间间隔矩阵,Upper(ΔT)和Lower(ΔT)以及Upper(ΔL)和Lower(ΔL)分别表示时间和空间间隔的最大和最小值,和以及和分别表示时空转移可训练矩阵,T表示时间间隔,LIT( )表示嵌入函数,L表示空间间隔,k表示按时间升序排列下的签到顺序,w表示时间窗口大小,tk表示访问的顺序。
根据用户结合兴趣点类别的周期性偏好和高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点,得到有序推荐集合,如图2所示,包括:
S52:根据用户结合兴趣点类别的周期性偏好和用户短期兴趣通过注意力查询,得到候选兴趣点的推荐预测概率,根据推荐预测概率对候选兴趣点进行降序排序,以TOP-N的方式向目标用户推荐用户下一个时刻点最有可能访问的兴趣点集合,得到有序推荐集合。
通过注意力查询获取候选兴趣点的推荐预测概率,包括:
Query(Q,K,V)=V·softmax(QKT)
其中,candidate(POI)表示经过嵌入后的候选兴趣点集,Period表示用户结合兴趣点类别的周期兴趣表示向量,为用户短期偏好,Q表示查询向量,K表示键向量,V表示值向量,Query( )表示推荐函数,softmax( )表示激活函数,prob表示候选兴趣点的推荐预测概率,POI表示未经嵌入的候选兴趣点集合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,其特征在于,包括:
S1:获取原始数据,并对原始数据进行预处理,得到新数据集;所述原始数据包括用户访问记录数据、签到序列数据和时空信息数据;
S2:提取新数据集的相关属性生成用户访问兴趣点的签到记录;所述相关属性包括用户访问兴趣点的时间信息和兴趣点的类别、经纬度坐标信息;
S3:根据用户访问兴趣点的签到记录分别通过滑动时间窗口提取用户访问兴趣点的时空轨迹表示和非连续时空间隔矩阵;
S4:根据获取用户结合兴趣点类别的周期性偏好表示,根据时空间隔矩阵采用线性插值法嵌入非连续时空间隔矩阵提取用户高阶短期兴趣;
S5:根据用户结合兴趣点类别的周期性偏好和用户高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点,得到有序推荐集合;
S6:在有序推荐集合中选取最优的兴趣点进行推荐。
2.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,其特征在于,对原始数据进行预处理,得到新数据集,包括:
对原始数据进行清洗;设置签到阈值;根据签到阈值统计清洗后数据中所有用户签到兴趣点的次数和所有兴趣点被用户签到的次数,如果用户签到兴趣点的次数低于签到阈值,则删除该用户的签到数据,如果某个兴趣点被用户签到的次数小于签到阈值,则删除该兴趣点,得到新数据集;
所述签到阈值设置为10,用户签到兴趣点的次数和所有兴趣点被用户签到的次数小于10,则认为该用户的签到数据和该兴趣点不具有代表性。
3.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,其特征在于,提取新数据集的相关属性,包括:
S21:从获取到的用户访问记录数据、签到序列数据和时空信息数据中获取用户和兴趣点的ID信息,签到时间戳,兴趣点类别以及兴趣点空间经纬度坐标;
S22:从获取到的数据中将签到时间戳转换为周期时间段,将签到时间信息表示为每周中的某个小时。
6.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,其特征在于,获取用户结合兴趣点类别的周期性偏好表示,包括:
其中,C表示用户对兴趣点的时段访问轨迹的用户轨迹表示向量,dk表示嵌入维度大小,w表示时间窗口大小,表示第i次签到的用户嵌入表示,表示第i次签到的兴趣点嵌入表示,表示第i次签到的兴趣点类别嵌入表示,表示第i次签到的时间嵌入表示,表示嵌入维度,jointi表示第i次签到的联合嵌入表示,joint表示访问轨迹的嵌入表示,表示第tk次签到的联合嵌入表示,Softsign( )表示激活函数;
S42:根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量。
7.根据权利要求6所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法,其特征在于,根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量,包括:
headi=Attention(CWi Q,CWi K,CWi V)
P=Concat(head1,head2,…,headh)Wo
FFN(P)=LeakyReLU(PW1+b1)W2+b2
Period=FFN(P)+C
其中,C表示用户对兴趣点的时段访问轨迹的用户轨迹表示向量,wQ,wV和WK表示C进行线性变换的第一、第二、第三可训练矩阵,dk表示嵌入维度大小,Period(U)表示用户在时间窗口中结合兴趣点类别的周期性偏好,headi表示第i个自注意力头输出结果,Attention()表示自注意力计算函数,Q表示查询向量,K表示键向量,V表示值向量,T表示向量转置,P表示所有自注意力头经过线性转换后的向量表示,Concat( )表示向量拼接函数,WO表示与自注意力头线性运算的可训练矩阵,FFN(P)表示全连接层运算,LeakyReLU( )表示为激活函数,W1、W2分别表示可训练矩阵,b1、b2分别表示可训练参数,Period表示用户周期偏好表示向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310006832.3A CN115982468A (zh) | 2023-01-04 | 2023-01-04 | 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310006832.3A CN115982468A (zh) | 2023-01-04 | 2023-01-04 | 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115982468A true CN115982468A (zh) | 2023-04-18 |
Family
ID=85962881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310006832.3A Pending CN115982468A (zh) | 2023-01-04 | 2023-01-04 | 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115982468A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633371A (zh) * | 2024-01-25 | 2024-03-01 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
CN117763492A (zh) * | 2023-12-04 | 2024-03-26 | 淮阴工学院 | 基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置 |
CN117828193A (zh) * | 2024-03-04 | 2024-04-05 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
-
2023
- 2023-01-04 CN CN202310006832.3A patent/CN115982468A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117763492A (zh) * | 2023-12-04 | 2024-03-26 | 淮阴工学院 | 基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置 |
CN117763492B (zh) * | 2023-12-04 | 2024-06-11 | 淮阴工学院 | 基于时序空间特征和偏好波动的网络安全工具智能推荐方法及装置 |
CN117633371A (zh) * | 2024-01-25 | 2024-03-01 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
CN117633371B (zh) * | 2024-01-25 | 2024-04-12 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
CN117828193A (zh) * | 2024-03-04 | 2024-04-05 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
CN117828193B (zh) * | 2024-03-04 | 2024-05-17 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Location prediction on trajectory data: A review | |
CN115982468A (zh) | 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 | |
Qi et al. | Privacy-aware point-of-interest category recommendation in internet of things | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
Sang et al. | Activity sensor: Check-in usage mining for local recommendation | |
CN111949877B (zh) | 一种个性化兴趣点推荐方法及系统 | |
CN111241425B (zh) | 一种基于层次注意力机制的poi推荐方法 | |
CN110570044A (zh) | 基于循环神经网络和注意力机制的下一个地点预测方法 | |
CN107341261A (zh) | 一种面向位置社交网络的兴趣点推荐方法 | |
CN115408618B (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
Solomon et al. | Analyzing movement predictability using human attributes and behavioral patterns | |
Zhang et al. | SEABIG: A deep learning-based method for location prediction in pedestrian semantic trajectories | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
Tang et al. | Discovering Travel Community for POI Recommendation on Location‐Based Social Networks | |
Bao et al. | Geo-social media data analytic for user modeling and location-based services | |
Liu et al. | POI Recommendation Method Using Deep Learning in Location‐Based Social Networks | |
Mou et al. | Personalized tourist route recommendation model with a trajectory understanding via neural networks | |
Yu et al. | Using information entropy and a multi-layer neural network with trajectory data to identify transportation modes | |
Shen et al. | Novel model for predicting individuals’ movements in dynamic regions of interest | |
Miyazawa et al. | City-scale human mobility prediction model by integrating GNSS trajectories and SNS data using long short-term memory | |
Wu et al. | Human movement patterns of different racial-ethnic and economic groups in US top 50 populated cities: What can social media tell us about isolation? | |
CN113032688B (zh) | 针对社交网络用户在未来给定时间的访问位置预测方法 | |
Aljeri | Big data-driven approach to analyzing spatio-temporal mobility pattern | |
CN111667106B (zh) | 一种基于社交网络的用户数据预测方法 | |
Zhang et al. | Understanding street-level urban vibrancy via spatial-temporal Wi-Fi data analytics: Case LivingLine Shanghai |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |