CN115422441A - 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 - Google Patents
一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 Download PDFInfo
- Publication number
- CN115422441A CN115422441A CN202210962016.5A CN202210962016A CN115422441A CN 115422441 A CN115422441 A CN 115422441A CN 202210962016 A CN202210962016 A CN 202210962016A CN 115422441 A CN115422441 A CN 115422441A
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- information
- check
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000007774 longterm Effects 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 15
- 230000007246 mechanism Effects 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008447 perception Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 description 7
- 238000004220 aggregation Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于社交时空信息与用户偏好的连续兴趣点推荐方法及系统。该方法包括:获取用户签到序列中用户的长期偏好特征和短期偏好特征;获取用户签到序列中每个位置上的地理空间特征;获取用户签到序列中每个位置上的用户社交信息特征;将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。解决了签到数据稀疏性,元信息利用广度不足和冷用户推荐不准确的技术问题,实现对用户签到序列进行了层次化特征提取,增加了地理空间特征,增强了用户社交信息特征,全面学习用户的行为特点,准确推荐的下一个兴趣点,优化用户的使用感受。
Description
技术领域
本发明属于数据挖掘和推荐系统技术领域,更具体地,涉及一种基于社交时空信息与用户偏好的连续兴趣点推荐方法及系统。
背景技术
互联网经历了半个多世纪的发展,规模也变得空前巨大,这些海量的数据增加了用户获取感兴趣信息的时间开销,造成信息过载问题。为了提高信息的使用率,也为了商家更有效地提供个性化推荐服务,推荐系统技术应运而生,实现用户与商家之间的共赢。
兴趣点(Point-Of-Interest,POI)在基于位置的社交网络(Location BasedSocial Networks,LBSN)中代表的是一个真实的地点信息,例如商场、学校。现有技术中通常采用连续兴趣点推荐,连续兴趣点具有较强的时间和空间性质,即根据用户过去签到的记录信息,来预测当前状态下用户可能的选择,同时由于签到需要用户亲自前往该地点,因此不同距离也影响着用户的选择,连续兴趣点推荐具备时空特性。
目前针对连续兴趣点的推荐,仍然存在以下的问题:由于用户和兴趣点的数量随着LBSN的规模扩大而增加,导致的签到数据稀疏性问题;只考虑其中一或两种元信息,忽视了其他的元信息,造成信息的考虑的遗漏,元信息利用广度不足的问题;对于一个加入LBSN不久的新用户,在没有社交网络数据的签到记录时,造成的冷用户推荐不准确的问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于社交时空信息与用户偏好的连续兴趣点推荐方法及系统,其目的在于解决签到数据稀疏性,元信息利用广度不足和冷用户推荐不准确的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于社交时空信息与用户偏好的连续兴趣点推荐方法,包括:
获取用户签到序列中用户的长期偏好特征和短期偏好特征;
统计每个用户签到序列数据集中所有兴趣点的经纬度信息,使用haversine函数计算每两个兴趣点之间的实际物理距离;
设定距离阈值,根据各所述实际地理距离构建邻接矩阵,通过邻接矩阵获取每个兴趣点的邻居集合;
遍历每个兴趣点的邻居集合,分别计算每个兴趣点和邻居节点之间的注意力系数和距离系数,对应聚合为每个兴趣点的地理空间特征;
获取所述用户签到序列中每个位置上的用户社交信息特征;
将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
可选的,所述获取用户签到序列中用户的长期偏好特征和短期偏好特征,包括:
通过多头注意力机制对输入的所述用户签到序列进行特征提取,从多个子空间学习到用户的长期偏好特征;
通过循环神经网络RNN对输入的所述用户签到序列进行特征提取,对用户的近期签到行为进行建模,学习到用户的短期偏好特征。
可选的,所述遍历每个兴趣点的邻居集合,分别计算每个兴趣点和邻居节点之间的注意力系数和距离系数,对应聚合为每个兴趣点的地理空间特征,包括:
获取目标兴趣点的初始特征以及目标兴趣点的邻居集合;
从所述邻居集合中依次获取一个兴趣点,依次计算获取的兴趣点与目标兴趣点之间的注意力系数:其中,sij为注意力打分机制,通过打分函数计算两点之间的相关性,得出一个分数,再使用softmax对分数进行归一化;a(·,·)表示的相似度计算函数,W表示可训练的参数矩阵,hj是节点j的特征;表示的是兴趣点i的邻居兴趣点集合;
可选的,所述获取所述用户签到序列中每个位置上的用户社交信息特征,包括:
根据不同用户的兴趣信息之间的偏好关联关系,构建社交网络图;
通过所述社交网络图获取用户的相似矩阵;
根据所述相似矩阵获取对应的邻居用户集,并采用随机邻居采样算法从所述邻居用户集中进行特征提取;
将提取的特征增加至目标用户,构成用户社交信息特征。
可选的,所述偏好关联关系采用类杰卡德相似度表示;
可选的,所述将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表,包括:
将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征的特征向量信息进行拼接,生成兴趣点元数据;
基于所述兴趣点元数据计算下一个兴趣点的候选集的概率分布;
选取候选集中概率最大的前k个作为用户喜好的兴趣点推荐列表。
可选的,所述兴趣点的候选集包括类别候选集和地点候选集。
可选的,在所述获取用户签到序列中用户的长期偏好特征和短期偏好特征之前,还包括:
将用户签到序列中多模态的标量信息转化为低维稠密的多模态的特征向量信息。
按照本发明的另一方面,提供了一种基于社交时空信息与用户偏好的连续兴趣点推荐系统,包括:
用户偏好追踪模块,利用循环神经网络RNN和多头注意力机制来对用户历史签到序列进行分析处理,获取用户签到序列中用户的长期偏好特征和短期偏好特征;
地理距离感知模块,利用图神经网络GNN获取所述用户签到序列中每个位置上的地理空间特征;
社交信息影响模块,使用随机邻居采样算法来从用户的社交网络图中进行特征提取,获取所述用户签到序列中每个位置上的用户社交信息特征;
候选集预测模块,用于根据所述用户偏好追踪模块、所述地理距离感知模块以及所述社交信息影响模块所获得的特征信息,进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1、对用户签到序列进行了层次化特征提取,全面地学习用户的行为特点;结合多种特性信息,形成多语义特征,丰富和增强特征表达上下文语义信息的能力,解决签到数据稀疏性的问题和元信息利用广度不足的问题,更有利于模型学习到用户的兴趣偏好、社交信息等分布特点。
2、通过构建用户的每个兴趣点的邻居集合,获取兴趣点的地理空间特征,即时空状态信息;在构建邻居集合时添加距离注意力系数,能够使得不同兴趣点之间的距离关系更加显著,也更符合兴趣点推荐的空间语义。
3、在构建用户社交信息特征时,通过随机邻居采样算法来构建特征,随机采样的方式可以模拟用户偏好在社交网络中的传播,同时也可以将相似用户的偏好特征进行吸收,从而增强用户的特征表达;建立的社交网络图和随机邻居采样算法可以解决冷用户启动推荐的问题。
4、将众多影响因素与特征融合到了一个多语义特征,使用推荐模型进行推荐时,可以利用各个部分特征的信息,使得连续兴趣点推荐具备时空特性,提高推荐效果。
附图说明
图1为本发明实施例一公开的一种基于社交时空信息与用户偏好的连续兴趣点推荐方法的流程示意图;
图2为本发明实施例一公开的用户签到序列结构的组成示例图;
图3为本发明实施例一公开的一种兴趣点距离关系示例图;
图4为本发明实施例一公开的随机采样策略的示例图;
图5为本发明实施例二公开的一种基于社交时空信息与用户偏好的连续兴趣点推荐系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
如图1所示,一种基于社交时空信息与用户偏好的连续兴趣点推荐方法,包括:
S100、获取用户签到序列中用户的长期偏好特征和短期偏好特征;
S200、统计了每个用户签到序列数据集中所有兴趣点的经纬度信息,使用haversine函数计算每两个兴趣点之间的实际物理距离;
S300、设定距离阈值,根据每个兴趣点之间的实际地理距离关系构建邻接矩阵,通过邻接矩阵获取每个兴趣点的邻居集合;
S400、遍历每个兴趣点的邻居集合,分别计算每个兴趣点和邻居节点之间的注意力系数和距离系数,对应聚合为目标兴趣点的地理空间特征。
S500、获取用户签到序列中每个位置上的用户社交信息特征;
S600、将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
可选的,S100之前,还包括:
将用户签到序列中多模态的标量信息转化为低维稠密的多模态的特征向量信息。
户签到序列中包含多模态的标量信息,需要将这些标量信息处理为向量信息。多模态特征嵌入聚合模块将这些多模态的标量编号信息通过嵌入层映射到低维稠密向量中去,具体的实现是为每一个模态都创建一个二维嵌入矩阵,示例性的,用户、兴趣点、时间区间、类别等信息的嵌入矩阵分别为:MU、MP、MT、MC。然后根据对应的模态标量信息从嵌入矩阵对应的下标中获取低维稠密向量表示:
其中,ui、lj、tτ、ck分别表示用户、POI、时间区间、POI类别的编号ID,Embedding(·)表示嵌入层,内嵌对应的矩阵信息,通过标量获取对应的特征向量。分别表示用户、兴趣点、时间区间和兴趣点类别的特征向量,d表示的是特征向量的维度大小。多模态特征嵌入聚合模块具体包括:1)用户编号嵌入层,用于将用户编号标量处理成特征向量;2)兴趣点编号嵌入层,用于将兴趣点编号标量处理成特征向量;3)时间戳区间编号嵌入层,用于将时间戳区间编号标量处理成特征向量;4)兴趣点类别编号嵌入层,用于将兴趣点类别编号标量处理成特征向量。
将用户签到序列中多模态的标量信息转化为低维稠密的多模态的特征向量信息之后,再对用户签到序列中的长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行了层次化特征提取,便于更加全面地学习用户行为特点,同时通过统计分析对层次化提供了论证。
然后将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征进行相加融合成为多语义特征,多特征按一定规则进行拼接,达到多模态特征嵌入聚合的目的,同时丰富用户个人信息,增加特征向量的表达能力。再将多语义特征输入至推荐模型中,即可生成符合用户喜好的兴趣点推荐列表。
可选的,S100具体包括:
S110、通过多头注意力机制对输入的用户签到序列进行特征提取,从多个子空间学习到用户的长期偏好特征;
S120、通过循环神经网络RNN对输入的用户签到序列进行特征提取,重点对用户的近期签到行为进行建模,学习到用户的短期偏好特征。
用户的签到记录数据具有层次化的特点,反映了用户长期和短期的偏好变化。例如,用户的签到行为往往具备周期性,在相似的时间段内用户很可能会做同一件事,时间较近的记录数据体现了用户近期的签到行为,可以从中分析出短期偏好;而时间较远的记录数据则反馈了用户潜在的签到意向,可以从中分析长期偏好。
其中,表示长期历史签到序列通过多模态特征嵌入聚合模块对应的潜在表示,|l|表示长期签到序列的长度,表示长期历史特征在第j个子空间下通过自注意力机制学习到的特征,h表示多头注意力机制子空间的个数,表示拼接符号,表示h个子空间的长期历史特征的综合特征。
采用多头注意力机制对输入的长期签到序列进行特征提取,从多个子空间学习到用户的长期偏好特征,使得提取的长期特征不随着时间的推移而发生显著改变,保留了用户长久以来的潜在签到行为特点。并且,注意力机制能够发掘签到序列中不相邻的记录之间的关系,同时多头机制可以从不同角度对用户的长期特征进行建模,从而达到更好提取效果。
其中,表示短期当前签到序列通过多模态特征嵌入聚合模块对应的潜在表示,|s|表示短期签到序列的长度,GRU(·)表示GRU模型,而Ps表示的是最终的短期当前偏好特征向量。和分别表示初始和最终的隐藏状态。
使用门控循环单元GRU对输入的近期签到序列进行建模和特征提取,GRU能够发掘签到记录中用户的周期行为,从而对用户最近一段时间内的签到偏好进行建模,学习到用户的短期偏好特征,具有显著的周期性和时效性,反映用户最近一段时间的签到行为特点。
在本实施例中,通过分别对用户长期签到序列和用户短期签到序列进行层次化建模和特征提取,能够更有效地学习到用户隐藏在签到记录中的偏好特征,更加全面地学习用户行为特点,有利于模型更好地捕捉特征信息。
获取用户签到序列中每个位置上的地理空间特征,具体包括:S200、S300、S400三个步骤。
用户对下一个签到地点的选择受到其距离远近的影响,比起距离更远的地点,用户倾向于选择近的地点作为下一个选择。距离信息需要从每个不同兴趣点之间的距离进行体现,如图3所示,a节点代表当前位置,而b节点代表用户最可能前往的地点,c节点为用户前往可能性较小的地方,用户可能前往的地点与距离相关,如图3所示,以a节点为圆心,在一定半径形成的圆形范围A内,存在的兴趣点均为下一次选择的兴趣点。在研究用户的兴趣点的地理空间特征时,需要构建用户的兴趣点邻接图。
兴趣点(Point-Of-Interest,POI)邻接图即为“POI—POI”邻接图,其描述了两个不同POI之间的距离关联关系:
Gg=<Vg,Eg,Ag>
其中,Vg表示邻接图中的POI节点信息,Eg表示的是不同POI节点之间的边信息。POI节点的边关系来源于相互之间的距离关系,首先统计了每个数据集中所有POI的经纬度信息,然后根据每对POI之间的经纬度信息计算它们之间的实际物理距离,使用haversine函数进行计算两点之间的距离;设置一个距离阈值dδ,当两个POI之间的实际地理距离小于等于dδ时,表明两个POI之间具有关联,则在两个POI节点上新增一条边。例如POI节点li和POI节点lj之间的距离小于dδ,则在图Gg的边集合Eg中新增一条双向边εij∈Eg。Ag则表示的是每个节点的特征集合,即与Vg中的POI节点一一对应,其中aj=<lj,ck>,lj和ck表示地点及其类别。
根据与目标兴趣点i距离小于dδ的兴趣点构建邻接矩阵Wg,再根据邻接矩阵Wg构建每个POI节点i的邻居集合引入了距离度量相似度β,用来计算两个兴趣点的距离上的相似度。随着距离的增大,距离相似度也随着减小。遍历目标兴趣点的邻居集合,计算目标兴趣点i和邻居节点之间的注意力系数和距离系数,聚合为目标兴趣点i的地理空间特征。遍历所有兴趣点后,构建每个兴趣点的地理空间特征。
可选的,S400具体包括:
S410、获取目标兴趣点的初始特征以及目标兴趣点的邻居集合;
S420、从邻居集合中依次获取一个兴趣点,依次计算获取的兴趣点与目标兴趣点之间的注意力系数:其中,sij为注意力打分机制,通过打分函数计算两点之间的相关性,得出一个分数,再使用softmax对分数进行归一化;a(·,·)表示的相似度计算函数,W表示可训练的参数矩阵,hj是节点j的特征;表示的是兴趣点i的邻居兴趣点集合;
其中,αij表示两个POI节点之间的归一化注意力系数,而βij表示的是两个POI节点之间的归一化距离系数,当距离变大时,βij将会减小。a(·,·)表示的相似度计算函数,d(i,j)表示的是两个POI节点之间的距离。表示的是POI节点i的邻居POI节点集合。最后通过将注意力系数和距离系数统一起来,聚合成当前POI的地理空间特征向量
其中,在遍历一个邻居节点信息后,更新一次地理空间特征向量,遍历完目标兴趣点的所有邻居节点信息之后,得到最终的地理空间特征向量h′i。
根据不同的兴趣点之间的物理距离关系进行邻接图的构建,并使用图注意力网络来对每个兴趣点及其邻居之间的关系获取其节点注意力系数来进行建模,此外,根据不同兴趣点之间的距离远近,获取其距离注意力系数,通过节点注意力系数和距离注意力系数来共同对签到序列中每一个兴趣点进行空间特征建模。在传统的图注意力网络中,邻域集合不包含具体的距离关系,而只是一种抽象的邻居,在添加距离注意力系数之后,能够使得不同兴趣点之间的距离关系更加显著,也更符合兴趣点推荐的空间语义。
可选的,S500具体包括:
S510、根据不同用户的兴趣信息之间的偏好关联关系,构建社交网络图;
S520、通过社交网络图获取用户的相似矩阵;
S530、根据相似矩阵获取对应的邻居用户集,并采用随机邻居采样算法从邻居用户集中进行特征提取;
S540、将提取的特征增加至目标用户,构成用户社交信息特征。
用户的兴趣偏好可能在朋友社交圈内传播,而用户也将受到社交网络中邻居偏好的影响。用户的社交网络图描述了不同用户之间的偏好关联关系,用户的兴趣可以受到社交网络中邻居偏好的影响,需要构建出不同用户的社交网络图关系:
Gu=<Vu,Eu,Au>
在用户社交网络图中,若两个用户之间存在偏好关联关系,则可以构建社交网络图,偏好关联关系采用类杰卡德相似度表示,如果类杰卡德相似度大于等于设定的相似度阈值sδ,则表明这些用户属于兴趣接近的群体。示例性的,用户ui和用户uj的签到集合分别为和如果两个签到集合之间类杰卡德相似度大于等于阈值sδ,则表示两个用户存在一条双向边关系εij∈Eu。其中,类杰卡德相似度公式为:
获取目标用户的相似矩阵后,还需要从中获取目标用户的用户社交信息特征。由于目标用户的相似矩阵中至少具有一个邻居,为了增强目标用户的社交特征信息,还需要提取邻居的特征,对目标用户的特征进行丰富,为了提高用户社交信息特征的获取速度,在本实施例中采用随机邻居采样算法从邻居用户集中进行特征提取,由社交信息影响模块实现,如图4所示。
随机邻居采样算法具体操作为:对于用户ui,根据用户相似矩阵Wu获取其邻居用户集并从中随机采样一名邻居用户uj,同时随机获取uj感兴趣的一个POI信息lj,最后使用多模态特征嵌入聚合层来对用户ui、邻居uj以及POI节点lj进行向量化,分别获取和并更新用户ui自身的信息特征:
利用不同用户之间历史签到记录之间的相似程度来进行社交网络的构建,并使用随机邻居采样算法来处理社交网络的信息,对于一个用户,算法会选择该用户的一位邻居用户以及邻居用户所感兴趣的一个兴趣点,并将当前用户、邻居用户以及邻居用户兴趣点的信息融合到当前用户状态上,达到兴趣传播的目的。相似用户在社交网络中的偏好变化是接近的,通过随机采样的方式可以模拟用户偏好在社交网络中的传播,同时也可以将相似用户的偏好特征进行吸收,从而增强用户的特征表达。
可选的,S600具体包括:
S610、将长期偏好特征、短期偏好特征、地理空间特征以及用户社交信息特征的特征向量信息进行拼接,生成兴趣点元数据;
S620、基于兴趣点元数据计算下一个兴趣点的候选集的概率分布;
S630、选取候选集中概率最大的前k个作为用户喜好的兴趣点推荐列表。
候选集预测模块结合上述所有不同模块之间获取的上下文语义信息,进行分析计算并为用户做出下一个POI推荐的候选集。对于给定长度为n的签到序列可以得到长度均为n-1的输入序列:和输出序列:将偏好特征表示结合当前地理空间特征以及用户社交信息特征构成兴趣点元数据。
将兴趣点元数据输入至推荐模型中,计算下一个兴趣点的候选集的概率分布。得到下一个兴趣点候选集的概率分布: 其中,兴趣点的候选集包括类别候选集C=[c1,c2,…,cn]和地点候选集L=[l1,l2,…,ln]。选取候选集中概率最大的前k个作为用户喜好的兴趣点推荐列表,k为正整数,可由用户个性化设置。
本发明实施例的技术方案,通过融合用户的长期偏好特征、短期偏好特征、地理空间特征和用户社交信息特征,获取用户在历史签到信息、时空状态信息和社交网络中的兴趣信息,对用户的兴趣数据进行全面分析,生成符合用户喜好的兴趣点推荐列表,对用户的下一个兴趣点进行合理的推荐。解决了签到数据稀疏性,元信息利用广度不足和冷用户推荐不准确的技术问题,实现对用户签到序列进行了层次化特征提取,增加了地理空间特征,增强了用户社交信息特征,实现了充分使用签到数据,全面学习用户的行为特点,准确推荐的下一个兴趣点,优化用户的使用感受。
实施例二
如图5所示,一种基于社交时空信息与用户偏好的连续兴趣点推荐系统,包括:
用户偏好追踪模块,利用循环神经网络RNN和多头注意力机制来对用户历史签到序列进行分析处理,获取用户签到序列中用户的长期偏好特征和短期偏好特征;
地理距离感知模块,利用图神经网络GNN获取用户签到序列中每个位置上的地理空间特征;
社交信息影响模块,使用随机邻居采样算法来从用户的社交网络图中进行特征提取,获取用户签到序列中每个位置上的用户社交信息特征;
候选集预测模块,用于根据用户偏好追踪模块、地理距离感知模块以及社交信息影响模块所获得的特征信息,进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
本发明实施例所提供的一种基于社交时空信息与用户偏好的连续兴趣点推荐系统可执行本发明任意实施例所提供的一种基于社交时空信息与用户偏好的连续兴趣点推荐方法,具备执行方法相应的功能模块和有益效果。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于社交时空信息与用户偏好的连续兴趣点推荐方法,其特征在于,包括:
获取用户签到序列中用户的长期偏好特征和短期偏好特征;
统计每个用户签到序列数据集中所有兴趣点的经纬度信息,使用haversine函数计算每两个兴趣点之间的实际物理距离;
设定距离阈值,根据各所述实际地理距离构建邻接矩阵,通过邻接矩阵获取每个兴趣点的邻居集合;
遍历每个兴趣点的邻居集合,分别计算每个兴趣点和邻居节点之间的注意力系数和距离系数,对应聚合为每个兴趣点的地理空间特征;
获取所述用户签到序列中每个位置上的用户社交信息特征;
将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
2.如权利要求1所述的方法,其特征在于,所述获取用户签到序列中用户的长期偏好特征和短期偏好特征,包括:
通过多头注意力机制对输入的所述用户签到序列进行特征提取,从多个子空间学习到用户的长期偏好特征;
通过循环神经网络RNN对输入的所述用户签到序列进行特征提取,对用户的近期签到行为进行建模,学习到用户的短期偏好特征。
3.如权利要求1所述的方法,其特征在于,所述遍历每个兴趣点的邻居集合,分别计算每个兴趣点和邻居节点之间的注意力系数和距离系数,对应聚合为每个兴趣点的地理空间特征,包括:
获取目标兴趣点的初始特征以及目标兴趣点的邻居集合;
从所述邻居集合中依次获取一个兴趣点,依次计算获取的兴趣点与目标兴趣点之间的注意力系数:其中,sij为注意力打分机制,通过打分函数计算两点之间的相关性,得出一个分数,再使用softmax对分数进行归一化;a(·,·)表示的相似度计算函数,W表示可训练的参数矩阵,hj是节点j的特征;表示的是兴趣点i的邻居兴趣点集合;
4.如权利要求1所述的方法,其特征在于,所述获取所述用户签到序列中每个位置上的用户社交信息特征,包括:
根据不同用户的兴趣信息之间的偏好关联关系,构建社交网络图;
通过所述社交网络图获取用户的相似矩阵;
根据所述相似矩阵获取对应的邻居用户集,并采用随机邻居采样算法从所述邻居用户集中进行特征提取;
将提取的特征增加至目标用户,构成用户社交信息特征。
6.如权利要求1所述的方法,其特征在于,所述将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表,包括:
将所述长期偏好特征、所述短期偏好特征、所述地理空间特征以及所述用户社交信息特征的特征向量信息进行拼接,生成兴趣点元数据;
基于所述兴趣点元数据计算下一个兴趣点的候选集的概率分布;
选取候选集中概率最大的前k个作为用户喜好的兴趣点推荐列表。
7.如权利要求6所述的方法,其特征在于,所述兴趣点的候选集包括类别候选集和地点候选集。
8.如权利要求1所述的方法,其特征在于,在所述获取用户签到序列中用户的长期偏好特征和短期偏好特征之前,还包括:
将用户签到序列中多模态的标量信息转化为低维稠密的多模态的特征向量信息。
9.一种基于社交时空信息与用户偏好的连续兴趣点推荐系统,其特征在于,包括:
用户偏好追踪模块,利用循环神经网络RNN和多头注意力机制来对用户历史签到序列进行分析处理,获取用户签到序列中用户的长期偏好特征和短期偏好特征;
地理距离感知模块,利用图神经网络GNN获取所述用户签到序列中每个位置上的地理空间特征;
社交信息影响模块,使用随机邻居采样算法来从用户的社交网络图中进行特征提取,获取所述用户签到序列中每个位置上的用户社交信息特征;
候选集预测模块,用于根据所述用户偏好追踪模块、所述地理距离感知模块以及所述社交信息影响模块所获得的特征信息,进行相加融合成为多语义特征,并输入至推荐模型中,生成符合用户喜好的兴趣点推荐列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210962016.5A CN115422441A (zh) | 2022-08-11 | 2022-08-11 | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210962016.5A CN115422441A (zh) | 2022-08-11 | 2022-08-11 | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115422441A true CN115422441A (zh) | 2022-12-02 |
Family
ID=84198420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210962016.5A Pending CN115422441A (zh) | 2022-08-11 | 2022-08-11 | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115422441A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116341567A (zh) * | 2023-05-29 | 2023-06-27 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
CN117633371A (zh) * | 2024-01-25 | 2024-03-01 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
-
2022
- 2022-08-11 CN CN202210962016.5A patent/CN115422441A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116341567A (zh) * | 2023-05-29 | 2023-06-27 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
CN116341567B (zh) * | 2023-05-29 | 2023-08-29 | 山东省工业技术研究院 | 基于空间与语义邻居信息的兴趣点语义标注方法及系统 |
CN117633371A (zh) * | 2024-01-25 | 2024-03-01 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
CN117633371B (zh) * | 2024-01-25 | 2024-04-12 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luan et al. | Partition-based collaborative tensor factorization for POI recommendation | |
CN109062962B (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
CN113505204B (zh) | 召回模型训练方法、搜索召回方法、装置和计算机设备 | |
CN111125453A (zh) | 基于子图同构的社交网络中意见领袖角色识别方法及存储介质 | |
CN108897750B (zh) | 融合多元上下文信息的个性化地点推荐方法及设备 | |
Liu et al. | Where your photo is taken: Geolocation prediction for social images | |
CN115408618B (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
CN110134883B (zh) | 一种异构社交网络位置实体锚链接识别方法 | |
Liu et al. | Recommending attractive thematic regions by semantic community detection with multi-sourced VGI data | |
CN116244513B (zh) | 随机群组poi推荐方法、系统、设备及存储介质 | |
Liu et al. | POI Recommendation Method Using Deep Learning in Location‐Based Social Networks | |
CN116738066A (zh) | 乡村旅游服务推荐方法、装置、电子设备及存储介质 | |
Lang et al. | POI recommendation based on a multiple bipartite graph network model | |
Zhang et al. | Automatic latent street type discovery from web open data | |
Noorian | A BERT-based sequential POI recommender system in social media | |
CN115131052A (zh) | 一种数据处理方法、计算机设备和存储介质 | |
CN110543601B (zh) | 一种基于中智集的上下文感知兴趣点推荐方法及系统 | |
Gubareva et al. | Literature Review on the Smart City Resources Analysis with Big Data Methodologies | |
Xu et al. | Tourist Attraction Recommendation Method and Data Management Based on Big Data Analysis | |
CN112650949B (zh) | 基于多源特征融合协同过滤的区域poi需求识别方法 | |
Soliman et al. | A survey of recommender systems and geographical recommendation techniques | |
Quadrana | Algorithms for sequence-aware recommender systems | |
Wang et al. | Optimization of Digital Recommendation Service System for Tourist Attractions Based on Personalized Recommendation Algorithm | |
CN113256024A (zh) | 一种融合群体行为的用户行为预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |