CN112069415A

CN112069415A - 一种基于异构属性网络表征学习的兴趣点推荐方法

Info

Publication number: CN112069415A
Application number: CN202010810495.XA
Authority: CN
Inventors: 于彦伟; 代少杰; 黄宇渊; 董军宇
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2020-08-13
Filing date: 2020-08-13
Publication date: 2020-12-11
Anticipated expiration: 2040-08-13
Also published as: CN112069415B

Abstract

本发明公开了一种基于异构属性网络表征学习的兴趣点推荐方法，该方法适用于在兴趣点的描述信息较为丰富、序列性比较强的签到数据集上对用户进行兴趣点的推荐，步骤包括：首先，基于用户的社交网络和签到数据集构建一个有向带权的异质属性网络；其次，基于兴趣点的文本描述获得异质网络中节点属性嵌入信息，基于多种元路径的随机游走结合自注意力机制获得节点的元路径嵌入信息；然后，将节点的属性嵌入和多种元路径嵌入信息融合，基于异构skip_gram去进行节点的表征向量学习；最后，基于表征向量的相似度，根据目标用户所处的时间、地点进行下一个兴趣点的精确推荐。

Description

一种基于异构属性网络表征学习的兴趣点推荐方法

技术领域

本发明涉及一种网络兴趣点推荐方法，尤其为一种基于异构属性网络表征学习的兴趣点推荐方法。

背景技术

近些年，平板、手环等各种智能移动设备的普遍应用显著地增强了人们对数据的产生和收集能力，生活中的每个角落都可能喷涌出大量的数据，如何利用已有的或提出新的技术从这些海量的数据中挖掘出有价值的和令人感兴趣的信息是一件非常具有挑战性的事情。在个性化推荐越来越受到学术界和工业界的重视大背景下，基于地理位置的社交网络(LBSN)领域内个性化推荐技术得到不断丰富和发展。

在基于LBSN进行个性化推荐的领域中，兴趣点的推荐是比较复杂的，对用户做出下一次签到的预测需要综合考虑的因素有很多，比如时间、当前所处地点、兴趣点的描述性文本和社交关系等上下文信息，另外，由于签到信息的产生相比于线上评论是比较昂贵的，因此会导致某些用户的签到记录稀疏，这也会提高推荐的难度。目前有很多关于兴趣点推荐的研究工作，章韵(CN 107341261 A)等人提出了一种基于时空特征的用户协同过滤的模型，但缺少对兴趣点签到顺序的有效挖掘，同时不太适用于处理签到记录稀疏的情况；俞东进(CN 109948066 A)等人提出的一种基于异构信息网络及元路径的兴趣点推荐模型，能够有效结合元路径和丰富的上下文信息，挖掘用户的偏好，但是难以应对兴趣点和用户的冷启动问题。

通过对现有的一些兴趣点推荐方法进行分析总结，传统方法在以下几个方面存在不足：1)忽视或者不重视每个用户签到顺序的影响，造成推荐兴趣点的不准确，降低用户的体验；2)通常将兴趣点表征学习为一个低维向量表示，实际上每个兴趣点承担着两种角色的作用：一个是作为用户的当前位置，即开始兴趣点；另一个是相对于上一个兴趣点，作为用户将要签到的位置，即结束兴趣点；3)忽视或不重视兴趣点独特的属性，比如地理位置、类别和描述信息等，有效利用这些外围信息，能够进一步提高推荐的准确性；4)难以处理用户或者兴趣点的冷启动问题。本方法能够有效解决这些问题，进一步提高推荐的准确性。

发明内容

本发明提供一种基于异构属性网络表征学习的兴趣点推荐方法，对时间、空间数据进行了深入挖掘与研究，并充分考虑了其他因素，尤其适用于在兴趣点的描述信息较为丰富和时序性比较强的签到数据集上进行推荐。

本发明采取的技术方案是，一种基于异构属性网络表征学习的兴趣点推荐方法，包括以下步骤：

1)依据签到用户对应的社交网络构建一个无权的社交网络图，将社交网络图定义为

2)按照每个用户在社交网络图

的签到数据集上的签到时间进行排序，并且根据签到的时间段设定合适的时间标签(例如：按照每两小时作为一个分割区间，则对于在0：00-1：59时间内的签到对应的时间标签记为0)；将用户每条签到记录中的时间戳和兴趣点映射成一个带有时间标签的兴趣点；

3)结合用户签到历史记录中的兴趣点去计算社交网络图

中各个节点间的权重，得到一个带权社交网络图

4)依据用户的签到数据集，在

的基础上构建包含用户和兴趣点的一个有向带权异构网络图

5)根据实际意义设计四种元路径，通过四种元路径获取签到兴趣点间的次序和用户社交网络信息；四种元路径分别为：用户-兴趣点-兴趣点-用户、兴趣点-用户-兴趣点、兴趣点-兴趣点-兴趣点，用户-用户-用户；在构建的网络图

上按照每一种元路径分别进行随机游走，产生训练样本；

6)结合兴趣点的属性对兴趣点属性表征向量表示进行定义；利用自注意力机制融合预定义的多种元路径信息，计算出每个节点的表征向量表示；兴趣点的属性包括理位置、类别、签到描述文本信息；

7)为每一个兴趣点设置两个角色：兴趣点的两个角色分别为起始兴趣点和结束兴趣点；起始兴趣点的定义为：相对于下一个兴趣点，当前兴趣点扮演起始兴趣点角色；结束兴趣点的定义为：相对上一个兴趣点，当前兴趣点扮演结束兴趣点角色；基于异构skip_gram算法，学习在每一种元路径下，在签到网络

中每个用户，及每个带有时间标签的兴趣点分别作为起始兴趣点与结束兴趣点的低维表征向量；

8)综合考虑当前用户所处的兴趣点、时间段、签到记录和社交情况，基于表征向量间的相似度，对用户进行TOP-n的兴趣点推荐。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，在步骤1)中，根据用户的社交数据构建一个无权的社交网络图的具体方式为：如果两个用户u_i和u_j有关联(例如好友关系)，则在社交网络图

中，在用户u_i和用户u_j之间创建一条双向边；如果两个用户u_i和用户u_j之间没有关联，则不在社交网络图

为用户u_i和用户u_j之间设置关联连接。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，在步骤2)中，首先在所有用户的签到数据集上将每一个用户的签到记录分为一类，然后在每一个用户的签到数据集上按照签到时间的先后顺序进行排序，并将签到时间映射成时间标签，将时间标签和兴趣点映射成带有时间标签的兴趣点，将带有时间标签的兴趣点定义为时间标签兴趣点；生成时间标签兴趣点的具体步骤为：令f₁：(t_stamp_i)→t_i，

其中，f₁表示签到时间戳t_stamp_i和时间标签t_i之间的一个映射关系，f₂表示将时间标签t_i和兴趣点

映射成一个带有时间标签的兴趣点

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，步骤3)中，计算节点u_i和u_j之间的权重

计算过程为：

其中，L为所有兴趣点的集合，

为用户u_i在兴趣点p_k的签到次数，

为用户u_i签到过的所有时间标签兴趣点集合

ε为常数。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，步骤4)中，在

的基础上构建包含用户和兴趣点的一个有向带权异构网络图

的具体步骤如下：

5.1)从第l个用户u_l已经排好序的签到记录开始，每次依序取出两条相邻记录记为c₁和c₂，

表示用户u_l在时间戳是t_s tamp_i时在兴趣点

签到，使用f₁：(t_stamp_i)→t_i，

获取时间标签兴趣点

和

5.2)处理用户u_l的签到记录c₁：如果用户节点u_l和节点

之间没有边，在用户节点u_l和时间标签兴趣点节点

之间创建一条双向边，权重初始化为1；如果用户节点u_l和时间标签兴趣点节点

已经存在边，在原始权重上加1；最终的权重为：

表示用户u_l在时间标签t₁所代表的时间范围内在兴趣点

签到的总次数；

5.3)处理用户u_l的签到记录c₂：检查图

中是否存在从节点

到

的有向边，如果存在从节点

到

的有向边，将从节点

到

之间的有向边的权重加1；如果不存在从节点

到

的有向边，则创建一条从节点

到

的有向边，并且将从节点

到

之间的有向边的权重初始化为1；最终的权重为

表示所有用户在

签到后又紧接着在

签到的总次数；

5.4)遍历该用户的所有签到记录；

5.5)以步骤5.1)至步骤5.4)的方式遍历所有用户，不断更新节点之间的权重。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，步骤5)的具体步骤如下：

6.1)通过带有权重的元路径随机游走产生训练所需的游走序列Seq：在随机游走的过程中节点之间的转移概率计算方式如下：

其中上标τ在这里代表节点v_i所属的类型为τ，具体包括用户节点类型U和时间标签兴趣点节点类型P；path_j表示预先定义的某一种元路径，具体包括PPP，PUP，UUU和UPPU四种元路径；

表示在当前元路径Path_j下节点

的邻域集合；

6.2)依据在不同元路径path_j下获得的游走序列Seq_j，产生训练所需要的样本对。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，步骤6)的具体实现步骤如下：

7.1)融合属性后，兴趣点属性信息嵌入的向量表示为：

其中emb_attr(v_i)为节点v_i的属性表示向量，τ为节点v_i所属的类型，

是属性映射函数T_τ的输入；

7.2)融合多种元路径信息的具体步骤如下：

7.2.1)根据预先定义的元路径表示向量的维度path_emb_dim，利用高斯分布随机初始化所有节点的元路径表示向量；

7.2.2)通过聚合函数aggr()反映邻居节点对当前节点产生影响的关系，邻居节点对当前节点产生影响的关系表示为：

其中k表示聚合的次数；计算第一次聚合

时，通过聚合当前节点v_i在元路径path_j下的邻居

来获得，

是在步骤7.2.1)步的随机初始化，k＝2时进行第二次聚合；

7.2.3)利用自注意力机制去融合当前节点在不同元路径下的信息，在当前元路径path_j上融合其他元路径的信息，自注意力的计算过程为：

，其中A_i，j的维度是path_num*1，path_num表示预定义的元路径数量，

和W_j是需要训练的参数，维度分别为1*atte_dim、atte_dim*path_emb_dim，其中atte_dim是自注意力机制预定义的一个超参数，V_i是兴趣点v_i在不同元路径下的一个表示矩阵，维度为path_emb_dim*path_num；

在融合其他元路径影响后，兴趣点v_i在元路径path_j条件下的最终元路径嵌入向量表示为：

其中，

是一个转换矩阵，

将7.2.1)步定义的元路径向量表示维度path_emb_dim转换为最终的向量表示维度emb_dim；

7.3)融合节点属性后，兴趣点v_i在元路径path_j条件下的最终表示向量为：emb(v_i，j)＝a_jemb_attr(v_i)+(1-a_j)emb_path(v_i，j)，其中a_j是用于平衡元路径信息和属性信息的重要程度的超参数。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，emb_attr(v_i)利用属性映射函数T_τ将任意维度的节点属性映射到嵌入的目标维度；节点v_i所属类型包括：用户节点类型U和时间标签兴趣点节点类型P，时间标签兴趣点类型P包括起始兴趣点类型P^(s)和结束兴趣点类型P^(e)，记为τ∈{U，P^(s)，P^(e)}；

分为两类，其中a)为：对于P类型节点，在所属该类别对应的维度下标记为1，否则标记为0，对于文本信息的描述，首先借助TF-IDF算法提取所有兴趣点描述文本信息的关键词，如果一个兴趣点的描述中包含该关键词，就在该关键词对应的维度上标记为TF-IDF值，否则就标记为0；b)为：对于U类型的节点，通过将用户去过的所有兴趣点的编码向量进行聚合操作，获得一个用户属性向量，聚合操作包括均值、加和、最大值操作。

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，实现步骤7)的具体步骤如下：

8.1)在随机游走采样获得的训练样本基础上，基于异构skip_gram模型训练目标函数，获得节点的表示向量，具体步骤如下：

节点的表征学习目标函数为：

其中，N_j(v_i)表示节点v_i在元路径下path_j通过Alias采样策略获得的邻域节点集合，

通过异构负采样对目标函数进行近似，化简后的最终目标函数为：

8.2)利用随机梯度上升算法持续训练最终目标函数中包含的参数、每个用户在签到网络上的低维向量表示u_i，j、每个时间标签兴趣点作为起始兴趣点和结束兴趣点分别的低维表示向量

和

优化的，上述基于异构属性网络表征学习的兴趣点推荐方法，步骤8)中，根据用户当前所处的地点和时间段进行兴趣点推荐的评分计算方法的步骤如下：

9.1)如果需要推荐的用户u_l和其所在的兴趣点

在训练过程中已出现，则与其他兴趣点

评分的计算方法为：

9.2)如果需要推荐的用户u_l和/或所在的兴趣点

在训练过程中未出现，首先计算出u_l和/或

的属性表征，然后按照9.1)步中评分计算方法计算评分，u_l、

计算方法分别为：u_l，j＝T_U(attr(u_l))、

9.3)按照score的高低从大到小排序，然后向用户推荐之前没有签到过的前n个兴趣点。

本发明提出了一种基于多种元路径、节点属性和社交网络数据表征学习的兴趣点推荐方法，在进行兴趣点推荐的时候既考虑了用户的社交网络影响和签到兴趣点之间顺序的影响；也考虑了兴趣点的地理位置、类别和文本描述等信息，能够针对不同的用户进行更精确的推荐；能够有效解决用户或者兴趣点的冷启动问题。

本申请的技术方案具有如下技术效果：首先基于用户的签到和社交网络数据构建了一个有向带权的异质属性网络；然后基于含有多种语义的多条元路径随机游走，产生模型的训练样本对；最后利用异构的skip_gram模型算法进行表征学习，基于向量之间的相似度进行兴趣点的推荐，得到了一种融合多元时空数据的兴趣点推荐算法。

这种融合了多元时空数据的兴趣点推荐算法有如下优点：1)相比一些传统方法构建的无向无权的同构图，本发明构建的有向带权的异质属性网络能够较为完整的保留用户签到数据所蕴含的时空时序信息；2)更加重视每个用户在不同兴趣点的签到时间顺序的影响，具体表现为：本发明根据兴趣点是用户当前所在的还是将要签到的两种情况，将其分别表征为两种向量

和

3)通过有效融合兴趣点的属性进行表征学习，能够有效应对用户或者兴趣点的冷启动问题。综上所述，本发明能够根据用户当前所在的时间和地点，进一步提高兴趣点推荐的准确度，提高用户的体验。

附图说明

图1是本发明基于用户签到和社交数据构建有向异质属性网络图的实例；

图2是本发明融合多种元路径、兴趣点属性和社交网络的兴趣点推荐方法模型图；

图1中，每张子图左上角字母是构建的顺序，深色节点代表用户，浅色节点代表时间标签兴趣点(例如：u₁代表编号是1的用户，p_5，4代表编号是5、时间标签是4的兴趣点，以此类推)，其中用户节点的属性为采用加和操作获得。。

具体实施方式

下面结合附图与具体实施例进一步阐述本发明的技术特点。

一、体系结构

本发明的系统由一个原始语料库、数据预处理模块、构图模块、融合节点属性模块、融合多种元路径信息模块、随机游走采样模块、异构skip_gram训练模块、评分计算和TOP-n兴趣点推荐模块，如图2，以下对各部分进行具体说明：

原始语料库：社交网络用户签到记录(包括用户ID，兴趣点ID，签到时间戳，兴趣点类别、兴趣点文本描述信息)和用户社交关系数据集；

数据预处理模块：将用户签到数据集按每个用户进行分类，然后将每个用户的签到记录按时间先后顺序排序；采用上述技术方案步骤2所述的方法将时间戳映射到对应的时间标签；

构图模块：按照上述技术方案，步骤1，3和4涉及到构图模块，结合签到记录数据集和用户社交网络数据集进行有向带权异质属性网络图的构建；

融合节点属性模块：在上述技术方案步骤6涉及到融合节点属性模块，首先借助TF-IDF算法提取所有兴趣点文本描述信息包含的关键词，形成兴趣点和用户的属性编码向量，然后通过属性映射函数，将任意维度的属性信息嵌入为指定的维度，得到节点的属性表示向量；

融合多种元路径信息模块：在上述技术方案中步骤6涉及到融合多种元路径信息模块，利用预先定义的多条元路径并结合自注意力机制，得到节点的元路径嵌入信息；

随机游走采样模块：在上述技术方案步骤5涉及到随机游走采样模块，在预定义的多种元路径下进行带权重的随机游走采样；

异构skip_gram模块：在上述技术方案步骤7)涉及到异构skip_gram模块，基于随机游走采样模块产生的样本对，训练异构skip_gram模型，学习获得节点的表征向量；

评分计算及推荐模块：在上述技术方案步骤8涉及到评分计算及推荐模块，基于学习到的用户和时间标签兴趣点的表示向量，按照评分计算公式计算其他兴趣点的分值，按照分值大小排序，向用户推荐前n个未曾签到过的兴趣点。

二、方法流程

对目标用户进行推荐兴趣点的详细步骤如下：

步骤1：输入用户签到和社交网络数据集，依据用户的社交网络构建一个无权的社交网络图

如果两个用户u_i和u_j有关联，例如：好友或家人关系，则在社交网络图

中，在u_i和u_j之间创建一条双向边，反之则没有；

步骤2：首先在所有用户的签到记录上按照用户进行分类，然后在每一个用户的签到记录上按照签到时间先后进行排序，并将签到的时间戳映射成时间标签，时间标签和兴趣点映射成时间标签兴趣点，在本专利涉及的方法中建议2种将签到时间映射成时间标签的方法：

1)把一天当中的二十四个小时作为分割的全集，以每两小时作为一个分割区间进行分割，则对于在0：00-1：59，2：00-3：59，4：00-5：59，6：00-7：59，8：00-9：59，10：00-11：59，12：00-13：59，14：00-15：59，16：00-17：59，18：00-19：59，20：00-21：59，22：00-23：59范围内的签到所对应的时间标签分别标记为0至11；

2)把一周的七天作为分割的全集，以每一天作为一个分割区间进行分割，则对于在周日、周一、周二、周三、周四、周五和周六时间范围内的签到所对应的时间标签分别记为0至6；

令f₁：(t_stamp_i)→t_i，

映射成一个带有时间标签的兴趣点

步骤3：利用公式

计算在社交网络图

中两个用户u_i和u_j之间的权重

其中L为所有兴趣点的集合，

为用户u_i在兴趣点p_k的签到次数，

为用户u_i签到过的所有时间标签兴趣点集合

ε为一个非常小的常数，在实际应用中间以设置为1，是防止出现u_i和u_j之间有边，但是在数据集上没有相同兴趣点的签到记录，从而导致

的情况。

步骤4：构建有向带权异质图

的具体过程如下：

1)从第l个用户u_l已经排好序的签到记录开始，每次依序选取两条相邻记录记为c₁和c₂，

表示用户u_l在时间戳t_s tamp_i时在兴趣点

签到，其中f₁：(t_stamp_i)→t_i，

f₁表示从时间戳到时间标签的一个映射关系，f₂表示将时间标签和兴趣点映射成一个时间标签兴趣点

2)从第l个用户u_l的签到记录当中读取c₁

如果节点u_l和节点

之间没有边，创建节点u_l和节点

的一条双向边，权重都初始化为1；如果节点u_l和节点

之间已经存在边，就在原始权重上加1，最终的权重为：

表示用户u_l在时间标签t₁所代表的时间范围内在兴趣点

一共签到的次数；

3)从第l个用户u_l的签到记录当中读取c₂

检查在图

中是否存在从节点

到

的有向边，如果存在，就在从节点

到

上的权重加1；否则就创建从节点

到

的一条有向边，初始化权重为1，最终的权重为

表示所有用户在

签到后紧接着在

签到的总次数；

4)遍历用户u_l的所有签到记录；

5)以上述方式遍历所有用户，不断更新节点之间的权重。

步骤5：依据预定义的多条元路径，本发明具体包括PPP，PUP，UUU和UPPU四种元路径，在构建的网络图

上随机游走，产生训练样本的具体步骤如下：

1)通过带有权重的元路径随机游走产生训练所需的游走序列Seq：

在随机游走的过程中节点之间的转移概率计算方式如下：

其中上标τ在这里代表节点v_i所属的类型为τ，具体包括用户节点类型U和时间标签兴趣点节点类型P；path_j表示预先定义的某一种元路径；

表示在当前元路径path_j下节点

的邻域集合；

2)通过在不同元路径path_j下获得的游走序列Seq_j，产生训练所需要的样本对，设定每次游走的长度为n，因为要体现节点间的顺序性，产生训练样本的具体步骤如下：

2.1)如果path_j＝PPP，

则产生的训练样本表示为

其中

表示时间标签兴趣点p_k，t在元路径path_j条件下，作为起始兴趣点的低维表示向量；

表示时间标签兴趣点p_k，t在元路径path_j条件下，作为结束兴趣点的低维表示向量；

2.2)如果path_j＝PUP，

则产生的训练样本表示为；

其中u_l，j表示用户u_l在元路径path_j＝PUP条件下的低维表示向量；

2.3)如果path_j＝UUU，

则产生的训练样本表示为

其中u_l，j表示用户u_l在元路径path_j＝UUU条件下的低维表示向量；

2.4)如果p_j＝Ua，

则产生的训练样本表示为

；

步骤6：计算融合属性后，兴趣点属性嵌入的向量表示为：

其中emb_attr(v_i)表示节点v_i的属性表示向量；利用属性映射函数T_τ将任意维度的节点属性映射到嵌入的目标维度，属性映射函数可以根据需要选择线性矩阵或者非线性矩阵，其中τ在这里代表节点v_i所属的类型，具体包括：用户节点类型U和时间标签兴趣点节点类型P，时间标签兴趣点类型P又包括起始兴趣点类型P^(s)和结束兴趣点类型P^(e)，记为τ∈{U，P^(s)，P^(e)}。

是属性映射函数T_τ的输入：a)为：对于P类型节点，在所属该类别对应的维度下标记为1，否则标记为0，对于文本信息的描述，首先借助TF-IDF算法提取所有兴趣点描述文本信息的关键词，如果一个兴趣点的描述中包含该关键词，就在该关键词对应的维度上标记为TF-IDF值，否则就标记为0；b)为：对于U类型的节点，通过将用户去过的所有兴趣点的编码向量进行聚合操作，获得一个用户属性向量，聚合操作包括均值、加和、最大值操作；

步骤7：融合多种元路径嵌入信息的具体过程为：

1)根据预先定义的元路径表示向量的维度path_emb_dim，利用高斯分布随机初始化所有节点的元路径表示向量；

2)由干节点的每个邻居都在一定程度上影响着当前节点的表示，本发明通过聚合函数aggr()来反映邻居节点对当前节点产生影响的这种关系，可采用均值、最大和最小值聚合等，表示为：

其中k表示聚合的次数，计算第一次聚合

时，通过聚合当前节点v_i在元路径path_j下的邻居

来获得，

是在步骤7.2.1)步的随机初始化，k＝2时进行第二次聚合，一般情况下，k＝2就能够得到较好的聚合结果；

3)为了在当前元路径path_j上融合其他元路径的信息，本发明利用一种自注意力机制去融合当前节点在不同元路径下的信息，自注意力的计算过程为：

其中A_i，j的维度是path_num*1，path_num表示预定义的元路径数量，

其中，

是一个转换矩阵，

步骤8：融合节点属性后，兴趣点v_i在元路径path_j条件下的最终表示向量为：emb(v_i，j)＝a_jemb_attr(v_i)+(1_a_j)emb_path(v_i，j)，其中a_j是用于平衡元路径信息和属性信息的重要程度的超参数。

步骤9：融合节点属性和多种元路径信息后，基于异构skip_gram模型去训练的具体步骤如下：

1)在随机游走采样获得的训练样本基础上，基于异构skip_gram模型训练目标函数，获得节点的表示向量，具体步骤如下：

节点的表征学习目标函数为：

其中，

表示节点v_i在元路径下path_j通过Alias采样策略获得的邻域节点集合，

2)最后利用随机梯度上升算法持续训练最终目标函数中包含的参数、每个用户在签到网络上的低维向量表示u_i，j、每个时间标签兴趣点作为起始兴趣点和结束兴趣点分别的低维表示向量

和

步骤10：根据用户当前所处的地点和时间段进行兴趣点推荐的评分计算方法具体步骤如下：

1)如果需要推荐的用户u_l和其所在的兴趣点

在训练过程中已出现，则与其他兴趣点

评分的计算方法为：

2)如果需要推荐的用户u_l和/或所在的兴趣点

在训练过程中未出现，首先计算出u_l和/或

的属性表征，计算方法为：

u_l，j＝T_U(attr(u_l))、

然后，按照1)步中评分计算方法计算评分；

3)按照score的高低从大到小排序，然后向用户推荐之前没有签到过的前n个兴趣点。

实现本发明算法的伪代码如下：

当然，上述说明并非是对本发明的限制，本发明也并不限于上述举例，本技术领域的普通技术人员，在本发明的实质范围内，作出的变化、改型、添加或替换，都应属于本发明的保护范围。

Claims

1.一种基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：包括以下步骤：

2)按照每个用户在社交网络图

的签到数据集上的签到时间进行排序，并且根据签到的时间段设定合适的时间标签；将用户每条签到记录中的时间戳和兴趣点映射成一个带有时间标签的兴趣点；

3)结合用户签到历史记录中的兴趣点去计算社交网络图

中各个节点间的权重，得到一个带权社交网络图

4)依据用户的签到数据集，在

的基础上构建包含用户和兴趣点的一个有向带权异构网络图

上按照每一种元路径分别进行随机游走，产生训练样本；

6)结合兴趣点的属性对兴趣点属性表征向量表示进行定义；利用自注意力机制融合预定义的多种元路径信息，计算出每个节点的表征向量表示；

2.根据权利要求1所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：在步骤1)中，根据用户的社交数据构建一个无权的社交网络图的具体方式为：如果两个用户u_i和u_j有关联，则在社交网络图

中，在用户u_i和用户u_j之间创建一条双向边；如果两个用户u_i和用户u_j之间没有关联，则在社交网络图

不为用户u_i和用户u_j之间设置关联连接。

3.根据权利要求1所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：在步骤2)中，首先在所有用户的签到数据集上将每一个用户的签到记录分为一类，然后在每一个用户的签到数据集上按照签到时间的先后顺序进行排序，并将签到时间映射成时间标签，将时间标签和兴趣点映射成带有时间标签的兴趣点，将带有时间标签的兴趣点定义为时间标签兴趣点；生成时间标签兴趣点的具体步骤为：令f₁:(t_stamp_i)→t_i，

映射成一个带有时间标签的兴趣点

4.根据权利要求2所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：步骤3)中，计算节点u_i和u_j之间的权重

计算过程为：

其中，L为所有兴趣点的集合，

为用户u_i在兴趣点p_k的签到次数，

为用户u_i签到过的所有时间标签兴趣点集合

ε为常数。

5.根据权利要求4所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：步骤4)中，在

的基础上构建包含用户和兴趣点的一个有向带权异构网络图

的具体步骤如下：

表示用户u_l在时间戳是t_s tamp_i时在兴趣点

签到，使用f₁:(t_stamp_i)→t_i，

获取时间标签兴趣点

和

5.2)处理用户u_l的签到记录c₁：如果用户节点u_l和节点

之间没有边，在用户节点u_l和时间标签兴趣点节点

已经存在边，在原始权重上加1；最终的权重为：

表示用户u_l在时间标签t₁所代表的时间范围内在兴趣点

签到的总次数；

5.3)处理用户u_l的签到记录c₂：检查图

中是否存在从节点

到

的有向边，如果存在从节点

到

的有向边，将从节点

到

之间的有向边的权重加1；如果不存在从节点

到

的有向边，则创建一条从节点

到

的有向边，并且将从节点

到

之间的有向边的权重初始化为1；最终的权重为

表示所有用户在

签到后又紧接着在

签到的总次数；

5.4)遍历该用户的所有签到记录；

6.根据权利要求1所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：步骤5)依据预定义的多条元路径，在构建的网络图

上随机游走，产生的训练样本的具体步骤如下：

其中上标τ在这里代表节点v_i所属的类型为τ，具体包括用户节点类型U和时间标签兴趣点节点类型P；path_j表示预先定义的某一种元路径，具体包括PPP,PUP,UUU和UPPU四种元路径；

表示在当前元路径path_j下节点

的邻域集合；

7.根据权利要求6所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：步骤6)的具体实现步骤如下：

7.1)融合属性后，兴趣点属性信息嵌入的向量表示为：

是属性映射函数T_τ的输入；

7.2)融合多种元路径信息的具体步骤如下：

其中k表示聚合的次数；计算第一次聚合

时，通过聚合当前节点v_i在元路径path_j下的邻居

来获得，

是在步骤7.2.1)步的随机初始化，k＝2时进行第二次聚合；

，

其中A_i,j的维度是path_num*1，path_num表示预定义的元路径数量，

其中，

是一个转换矩阵，

7.3)融合节点属性后，兴趣点v_i在元路径path_j条件下的最终表示向量为：emb(v_i,j)＝a_jemb_attr(v_i)+(1-a_j)emb_path(v_i,j)，其中a_j是用于平衡元路径信息和属性信息的重要程度的超参数。

8.根据权利要求7所述的基于异构属性网络表征学习的兴趣点推荐方法，其特征在于：emb_attr(v_i)利用属性映射函数T_τ将任意维度的节点属性映射到嵌入的目标维度；节点v_i所属类型包括：用户节点类型U和时间标签兴趣点节点类型P，时间标签兴趣点类型P包括起始兴趣点类型P^(s)和结束兴趣点类型P^(e)，记为τ∈{U,P^(s),P^(e)}；