CN115982468A

CN115982468A - 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法

Info

Publication number: CN115982468A
Application number: CN202310006832.3A
Authority: CN
Inventors: 桑春艳; 易星宇; 廖世根; 邓欣燕
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2023-01-04
Filing date: 2023-01-04
Publication date: 2023-04-18

Abstract

本发明属于社交网络兴趣点推荐领域，具体涉及一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，包括：数据处理，将原始数据处理成模型需要的输入数据；根据用户对兴趣点的访问提取兴趣点历史的非连续时空间隔矩阵以及结合兴趣点类型的访问历史轨迹；将用户历史轨迹访问和非连续时空间隔矩阵输入到基于深度学习的网络结构中，得到用户的行为偏好；根据用户的行为偏好在候选兴趣点列表中选取推荐兴趣点，得到有序推荐集合；在有序推荐集合中选取最优的推荐兴趣点；通过本方法有助于商家掌握用户行为特性分布，分析潜在用户，获得良好的经济、社会效益。

Description

一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法

技术领域

本发明属于社交网络兴趣点推荐领域，具体涉及一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法。

背景技术

随着移动端设备在社会生活中的快速普及，大量基于位置的社交服务应运而生。人们可以在诸如Foursquare、Yelp、Facebook以及Brightkite等基于位置的社交网络(Location-Based Social Network，LBSN)上分享他们的生活经历并发布签到记录，在国内大众点评、美团、饿了吗以及微博等基于位置的社交服务得到了飞速发展，据统计，在2019年美团的用户交易量增长了12.5％，这其中大量的兴趣点如餐饮、酒店、旅行社等服务的点评量已达数百万。基于位置的社交网络得到快速发展，导致大量的商家、用户数据快速增长，这对用户和服务提供商而言都是巨大的机遇。通过对海量的LBSN数据的分析挖掘，可以帮助服务提供商向用户推荐精准的兴趣点(Point of Interest，POI)。而下一个兴趣点推荐能够预测用户在指定时间点最有可能访问的兴趣点，其应用场景时效强使得下一个兴趣点推荐成为推荐领域中的研究热点问题。兴趣点推荐不但能够为LBSN服务提供商带来经济效益，还能为用户挖掘潜在喜好，进而为生活带来乐趣与便利。对于用户而言，准确有效的兴趣点推荐服务能够帮助用户了解生活环境进而做出访问决策，提高生活乐趣以及了解所在城市。对于商家而言，为用户提供精准的兴趣点推荐能够获取一定的经济效益，提高平台知名度，此外，还能够为用户提供个性化服务以提高用户体验，进而为服务商家分析出用户的个性化喜好特征，挖掘出热门兴趣点区域范围以实现精准营销。

近年来，基于位置的社交网络兴趣点推荐方法越来越受到物联网和电商的青睐。在对兴趣点进行推荐的方法中，通过挖掘用户长短期及其周期偏好的思想对改善用户体验和提高服务质量起到了重要的作用。现有的兴趣点推荐技术可分为协同过滤、矩阵分解、基于马尔科夫链和基于深度学习。基于协同过滤的推荐方法从用户或兴趣点出发，通过计算用户或兴趣点之间的相似度再向目标用户推荐兴趣点；基于矩阵分解的推荐方法主要从用户对兴趣点的签到记录出发构建签到矩阵，通过矩阵分解挖掘用户偏好和兴趣度属性；基于马尔科夫链的方法通过将用户访问兴趣点的轨迹建模成序列记录，假设下一个兴趣点的访问与上一个访问有关建模挖掘序列规律；基于深度学习的兴趣点推荐方法融合多种上下文信息，例如时间、空间、兴趣点类别、社交关系等构建如循环神经网络模型等相关结构、引入注意力机制等相关技术挖掘用户兴趣及兴趣点属性以此推荐用户可能访问的兴趣点。

虽然对兴趣点推荐模型进行了大量的研究，并取得了较好的成果，但仍存在一些挑战：

1、缺乏考虑挖掘用户结合兴趣点类别的周期性偏好；目前的研究方法对用户周期性兴趣研究时往往针对某一个特定兴趣点的周期兴趣，而用户结合兴趣点类别的周期性偏好是指用户有某一种类型的兴趣点或某一个特定兴趣点的固定访问偏好。此外，当用户的访问目标不够明确时，可能只考虑特定类型的兴趣点而不是某个特定的兴趣点。

2、在兴趣点推荐领域，由于用户轨迹中被访问过的兴趣点对比数据集中所有兴趣点所占比例很小，导致了严重的数据稀疏性问题。

3、近期访问的时空间隔能够反应用户短期偏好，但是由于时空间隔数值是一组连续数值，常规的方法如分桶法等需要阈值设定的合理才能保证模型的有效，因此连续时空间隔数值的嵌入存在困难。

发明内容

为解决上述技术问题，本发明提供一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，包括：

S1：获取原始数据，并对原始数据进行预处理，得到新数据集；所述原始数据包括用户访问记录数据、签到序列数据和时空信息数据；

S2：提取新数据集的相关属性生成用户访问兴趣点的签到记录；所述相关属性包括用户访问兴趣点的时间信息和兴趣点的类别、经纬度坐标信息；

S3：根据用户访问兴趣点的签到记录分别通过滑动时间窗口提取用户访问兴趣点的时空轨迹表示和非连续时空间隔矩阵；

S4：根据获取用户结合兴趣点类别的周期性偏好表示，根据时空间隔矩阵采用线性插值法嵌入非连续时空间隔矩阵提取用户高阶短期兴趣；

S5：根据用户结合兴趣点类别的周期性偏好和用户高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点，得到有序推荐集合；

S6：在有序推荐集合中选取模型预测出概率最大的兴趣点进行推荐。

本发明的有益效果：

1、本发明采用用户签到兴趣点行为数据，基于多头自注意力机制和线性插值嵌入法挖掘用户结合兴趣点类别的周期性偏好和短期兴趣，为目标用户产生新的兴趣点推荐集合，解决了数据稀疏性问题；

2、本发明综合用户访问兴趣点的类别和时空信息，分析用户的周期性访问规律和短期偏好，为目标用户推荐符合其周期偏好和短期兴趣的兴趣点；通过本发明所述的方法可帮助用户快速探索和规划出行目的；有助于商家掌握用户行为特性分布，分析潜在用户，获得良好的经济、社会效益。

附图说明

图1为本发明的结合用户周期性偏好和短期兴趣的兴趣点推荐流程图。

图2为本发明的用户偏好兴趣提取结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，如图1所示，包括：

对原始数据进行预处理，得到新数据集，包括：

对原始数据进行预处理的过程包括对原始数据进行清洗；由于获取的原始数据为非结构化数据，不能直接用于数据分析，通过简单的数据清洗可以使大部分非结构化数据结构化，例如，删除重复数据、清理无效节点等。设置签到阈值；统计清洗后数据中所有用户对兴趣点的签到次数和所有兴趣点被用户签到的次数；若用户对兴趣点的签到次数小于签到阈值，则删除该用户的数据，若兴趣点被用户签到的次数小于签到阈值，则删除该兴趣点，得到新的数据集。

所述签到阈值设置为10，用户签到兴趣点的次数和所有兴趣点被用户签到的次数小于10，则认为该用户的签到数据和该兴趣点不具有代表性。

提取新数据集的相关属性，包括：

S21：从获取到的用户访问记录数据、签到序列数据和时空信息数据中获取用户和兴趣点的ID信息，签到时间戳，兴趣点类别以及兴趣点空间经纬度坐标；

S22：从获取到的数据中将签到时间戳转换为周期时间段，将签到时间信息表示为每周中的某个小时。

提取用户访问兴趣点的时空轨迹表示，包括：

其中，

表示用户访问兴趣点的时空轨迹表示，

表示用户的每一条签到记录，

u表示用户，

表示兴趣点，c_k表示兴趣点类别，t_k表示访问的时间，k表示按时间升序排列下的签到顺序。

提取用户访问兴趣点的非连续时空间隔矩阵，包括：

其中，

表示用户访问过的兴趣点的时空间隔矩阵，

表示，

表示，dis(v_i,v_j)表示兴趣点v_i和兴趣点v_j之间的空间距离，u表示当前用户，T表示时间间隔，k表示按时间升序排列下的签到顺序，L表示空间间隔，t_k表示访问的顺序，w表示时间窗口大小。

获取用户结合兴趣点类别的周期性偏好表示，包括：

S41：根据用户轨迹

将每个签到

嵌入后表示的公式为：

其中，C表示用户对兴趣点的时段访问轨迹

的用户轨迹表示向量，d_k表示嵌入维度大小，w表示时间窗口大小，

表示第i次签到的用户嵌入表示，

表示第i次签到的兴趣点嵌入表示，

表示第i次签到的兴趣点类别嵌入表示，

表示第i次签到的时间嵌入表示，

表示嵌入维度，joint_i表示第i次签到的联合嵌入表示，joint表示访问轨迹的嵌入表示，

表示第t_k次签到的联合嵌入表示，Softsign()表示激活函数；

S42：根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量。

根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量，包括：

head_i＝Attention(CW_i ^Q,CW_i ^K,CW_i ^V)

P＝Concat(head₁,head₂,…,head_h)W^O

FFN(P)＝LeakyReLU(PW₁+b₁)W₂+b₂

Period＝FFN(P)+C

其中，C表示用户对兴趣点的时段访问轨迹

的用户轨迹表示向量，W^Q,W^V和W^K表示C进行线性变换的第一、第二、第三可训练矩阵，d_k表示嵌入维度大小，Period(U)表示用户在时间窗口中结合兴趣点类别的周期性偏好，head_i表示第i个自注意力头输出结果，Attention( )表示自注意力计算函数，Q表示查询向量，K表示键向量，V表示值向量，T表示向量转置，P表示所有自注意力头经过线性转换后的向量表示，Concat( )表示向量拼接函数，W^O表示与自注意力头线性运算的可训练矩阵，FFN(P)表示全连接层运算，LeakyReLU( )表示为激活函数，W₁、W₂分别表示可训练矩阵，b₁、b₂分别表示可训练参数，_Period表示用户周期偏好表示向量。

嵌入非连续时空间隔矩阵，包括：

其中，

表示表示用户第i次签到的短期兴趣表示，e^Δ表示签到用户轨迹的短期兴趣表示，

分别表示用户第i次签到的时间间隔矩阵嵌入学习和空间间隔学习，Δ^T和Δ^L分别表示时间间隔矩阵和空间间隔矩阵，Upper(Δ^T)和Lower(Δ^T)以及Upper(Δ^L)和Lower(Δ^L)分别表示时间和空间间隔的最大和最小值，

和

以及

和

分别表示时空转移可训练矩阵，T表示时间间隔，LIT( )表示嵌入函数，L表示空间间隔，k表示按时间升序排列下的签到顺序，w表示时间窗口大小，t_k表示访问的顺序。

根据用户结合兴趣点类别的周期性偏好和高阶短期兴趣在候选兴趣点列表中选取推荐兴趣点，得到有序推荐集合，如图2所示，包括：

S51：获取到所有兴趣点的嵌入为

其中，candidate(POI)表示经过嵌入后的候选兴趣点集，e^v表示兴趣点集合中第一个兴趣点的嵌入表示，N表示兴趣点数量；

S52：根据用户结合兴趣点类别的周期性偏好和用户短期兴趣通过注意力查询，得到候选兴趣点的推荐预测概率，根据推荐预测概率对候选兴趣点进行降序排序，以TOP-N的方式向目标用户推荐用户下一个时刻点最有可能访问的兴趣点集合，得到有序推荐集合。

通过注意力查询获取候选兴趣点的推荐预测概率，包括：

Query(Q,K,V)＝V·softmax(QK^T)

其中，candidate(POI)表示经过嵌入后的候选兴趣点集，Period表示用户结合兴趣点类别的周期兴趣表示向量，

为用户短期偏好，Q表示查询向量，K表示键向量，V表示值向量，Query( )表示推荐函数，softmax( )表示激活函数，prob表示候选兴趣点的推荐预测概率，POI表示未经嵌入的候选兴趣点集合。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，包括：

S6：在有序推荐集合中选取最优的兴趣点进行推荐。

2.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，对原始数据进行预处理，得到新数据集，包括：

对原始数据进行清洗；设置签到阈值；根据签到阈值统计清洗后数据中所有用户签到兴趣点的次数和所有兴趣点被用户签到的次数，如果用户签到兴趣点的次数低于签到阈值，则删除该用户的签到数据，如果某个兴趣点被用户签到的次数小于签到阈值，则删除该兴趣点，得到新数据集；

3.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，提取新数据集的相关属性，包括：

4.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，提取用户访问兴趣点的时空轨迹表示，包括：

其中，

表示用户访问兴趣点的时空轨迹表示，

表示用户的每一条签到记录，

u表示用户，

5.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，提取用户访问兴趣点的非连续时空间隔矩阵，包括：

其中，

表示用户访问过的兴趣点的时空间隔矩阵，

表示，

6.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，获取用户结合兴趣点类别的周期性偏好表示，包括：

S41：根据用户轨迹

将每个签到

嵌入后表示的公式为：

其中，C表示用户对兴趣点的时段访问轨迹

表示第i次签到的用户嵌入表示，

表示第i次签到的兴趣点嵌入表示，

表示第i次签到的兴趣点类别嵌入表示，

表示第i次签到的时间嵌入表示，

表示第t_k次签到的联合嵌入表示，Softsign( )表示激活函数；

7.根据权利要求6所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，根据用户轨迹表示向量计算得到用户结合兴趣点的周期性偏好表示向量，包括：

head_i＝Attention(CW_i ^Q，CW_i ^K，CW_i ^V)

P＝Concat(head₁，head₂，…，head_h)W^o

FFN(P)＝LeakyReLU(PW₁+b₁)W₂+b₂

Period＝FFN(P)+C

其中，C表示用户对兴趣点的时段访问轨迹

的用户轨迹表示向量，w^Q，w^V和W^K表示C进行线性变换的第一、第二、第三可训练矩阵，d_k表示嵌入维度大小，Period(U)表示用户在时间窗口中结合兴趣点类别的周期性偏好，head_i表示第i个自注意力头输出结果，Attention()表示自注意力计算函数，Q表示查询向量，K表示键向量，V表示值向量，T表示向量转置，P表示所有自注意力头经过线性转换后的向量表示，Concat( )表示向量拼接函数，W^O表示与自注意力头线性运算的可训练矩阵，FFN(P)表示全连接层运算，LeakyReLU( )表示为激活函数，W₁、W₂分别表示可训练矩阵，b₁、b₂分别表示可训练参数，Period表示用户周期偏好表示向量。

8.根据权利要求1所述的一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法，其特征在于，嵌入非连续时空间隔矩阵，包括：