CN111061961B - 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 - Google Patents

一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 Download PDF

Info

Publication number
CN111061961B
CN111061961B CN201911137480.5A CN201911137480A CN111061961B CN 111061961 B CN111061961 B CN 111061961B CN 201911137480 A CN201911137480 A CN 201911137480A CN 111061961 B CN111061961 B CN 111061961B
Authority
CN
China
Prior art keywords
interest
user
points
point
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911137480.5A
Other languages
English (en)
Other versions
CN111061961A (zh
Inventor
钱忠胜
谢晓欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi University of Finance and Economics
Original Assignee
Jiangxi University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi University of Finance and Economics filed Critical Jiangxi University of Finance and Economics
Priority to CN201911137480.5A priority Critical patent/CN111061961B/zh
Publication of CN111061961A publication Critical patent/CN111061961A/zh
Application granted granted Critical
Publication of CN111061961B publication Critical patent/CN111061961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统。首先,根据社交关系中好友与非好友对用户决策的影响,结合用户评分利用自适应带宽核密度方法,计算用户签到的个性化分布,并得出兴趣点间的相关性。然后,由于Bi‑LSTM输出的序列具有词语语义和词序列前后间语法等隐藏信息的特征,而CNN擅长从一系列特征中捕捉显著特征,故而将Bi‑LSTM和CNN叠加组成新的深层神经网络,从而学习用户和兴趣点的潜在特征。最后,通过概率矩阵方法将社交、地理位置、分类偏好以及潜在特征相融合,预测用户的个性化偏好,从而达到个性化推荐的目的。

Description

一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统
技术领域
本发明涉及信息推荐技术领域,具体涉及一种基于融合多特征的矩阵分解兴趣点推荐方法及其实现系统。
背景技术
随着智能手机及智能设备的不断发展,基于位置社交网络(Location BasedSocial Networks, 简称LBSN)的应用(如Yelp、Foursquare、街旁等)吸引着越来越多的用户共享他们的签到状态、位置以及相关评论等。基于位置的社交网络兴趣点推荐就是通过过滤社交网络中海量的信息,为用户提供最具有吸引力和最相关的兴趣点(如酒店、餐厅、景点等),减轻信息负载带来的负面影响,从而促进了兴趣点推荐在大数据时代的不断发展。
近年来,兴趣点(Point of Interest, 简称POI)推荐已经成为一个非常热门的研究课题。当前,大多数的兴趣点推荐方法都是基于用户的历史签到信息和情景信息(包括社交关系、类别信息等)以及评论信息来挖掘用户对未访问的兴趣点的偏好。但是已有的兴趣点推荐方法存在诸多问题。例如,数据稀疏问题、情景信息利用问题、评论信息在矩阵分解中的利用问题、评论信息学习模型自身的缺陷问题等。
为了降低数据的稀疏性,许多兴趣点推荐方法将用户的历史签到信息及其情景信息(如评分、地点、时间、社交关系等)结合来挖掘用户对于未签到的兴趣点的偏好。然而,在将这些情景信息以数学模型表示时,大部分都只考虑其特征中的一种情况,不能准确有效地表示该情景信息或者说会忽略该情景信息中的一些信息(例如,在考虑社交关系时仅考虑用户和好友之间的关系),这会对结果造成一定的偏差。大多数研究在矩阵分解中仅利用用户和POI的描述文档而忽略了用户本身的特征属性。诸多基于深度学习的兴趣点推荐研究中都仅仅利用一种模型学习评论文本的内容表示。然而,单个模型都或多或少存在自身的缺点,这些缺点往往都被忽略。因此,利用单个模型学习评论文本的内容表示可能会遗忘或忽视文本中的部分内容,造成推荐结果的偏差。
发明内容
有鉴于此,有必要提供一种充分利用评论文本、提供个性化推荐兴趣点的融合多特征的矩阵分解兴趣点推荐方法及其实现系统。
一种融合多特征的矩阵分解兴趣点推荐方法,包括以下步骤:
步骤一,重构多源异构特征,所述多源异构特征包括对地理位置信息、类别偏好信息和社交关系信息,对所述多源异构特征进行重构,对应得到用户评分矩阵、分类偏好矩阵、流行度矩阵和用户活跃度;
步骤二,利用文本信息挖掘用户和兴趣点的潜在模型,生成一个混合深度神经网络HDNN结构,以自上而下的方式学习文档的潜在分布表示,通过分析用户和兴趣点的评论文档,生成文档潜在模型;
步骤三,基于乘法法则融合所述多源异构特征,生成融合地理位置、类别偏好、社交关系及混合深度神经网络的多特征融合的概率矩阵分解模型,并对概率矩阵分解模型中的参数进行优化,以预测用户的个性化偏好。
进一步地,步骤一中的所述地理位置信息的重构是指利用用户已访问的兴趣点和未访问的兴趣点间的地理位置关系来估算用户在未访问兴趣点上的相关得分,根据每个用户已访问过的兴趣点估算地理坐标上的个性化签到分布;所述类别偏好信息的重构是指将用户对类别的偏好和兴趣点的流行度计算用户和兴趣点之间的关联评分;所述社交关系信息的重构是指通过用户间的相似性对用户的签到行为进行分析,在皮尔森相关系数法的基础上,利用用户活跃度重新定义用户的相似性。
进一步地,步骤二中的所述混合深度神经网络包括双向长短期记忆网络和卷积神经网络,所述双向长短期记忆网络用于构建用户和兴趣点评论文档中每个文本句子的表示,所述卷积神经网络用于将所有文本块的语义及其关系编码到文档表示中。
进一步地,所述混合深度神经网络包括嵌入层、双向长短期记忆网络层、卷积神经网络层、池化层和输出层,其中:
所述嵌入层用于提取文档的语义信息,利用Glove词嵌入方法,将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列;设令
Figure SMS_1
表示为包含/>
Figure SMS_2
个单词的文本块,每个单词都映射到一个全局向量,则有:
Figure SMS_3
(1)
其中,向量
Figure SMS_4
表示第/>
Figure SMS_5
个单词的向量,为保持单词在文本块/>
Figure SMS_6
中的顺序,将单词嵌入的向量连接在一起,并将文档按时间顺序排列成/>
Figure SMS_7
个文本块,得到一个序列:/>
Figure SMS_8
,其中,/>
Figure SMS_9
是第/>
Figure SMS_10
个文本块的子序列;
所述双向长短期记忆网络层用于挖掘文档中词序列间的隐藏信息;双向长短期记忆网络同时对文档中每个词的上下文信息进行语义编码并对其前后信息进行建模,将前向LSTM的输出序列
Figure SMS_11
和后向LSTM的输出序列/>
Figure SMS_12
连接起来作为下一层卷积层的输入;第/>
Figure SMS_13
时刻隐藏向量/>
Figure SMS_14
的更新公式如下:
Figure SMS_15
(2)
Figure SMS_16
(3)
Figure SMS_17
(4)
Figure SMS_18
(5)
Figure SMS_19
(6)
Figure SMS_20
(7)
Figure SMS_21
(8)
所述卷积神经网络层用于抽取文本句子间的结构特征;在卷积层,每个神经元
Figure SMS_22
使用一个滤波器/>
Figure SMS_23
,其中/>
Figure SMS_24
为卷积计算的滑动窗口,/>
Figure SMS_25
为LSTM层输出向量的大小;对/>
Figure SMS_26
运用卷积算子/>
Figure SMS_27
计算出新的特征/>
Figure SMS_28
,如式(9)表示:
Figure SMS_29
(9)
其中,
Figure SMS_30
是偏置项,/>
Figure SMS_31
是激活函数;在/>
Figure SMS_32
、/>
Figure SMS_33
、修正线性单元的激活函数中,使用ReLU激活函数,避免了梯度消失的问题;
所述池化层用于从卷积神经网络层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征;利用max-pooling操作,从每个上下文特征向量中提取最大上下文特征,将一个文档的表示缩减为一个定长向量,如式(10)和式(11)表示:
Figure SMS_34
(10)
Figure SMS_35
(11)
其中,
Figure SMS_36
表示卷积层的核数;引入非线性,在max-pooling的基础上添加激活函数双曲正切函数/>
Figure SMS_37
;在文本分析中,将不同单词窗口生成的所有特征向量串联起来,形成/>
Figure SMS_38
的最终表示形式:/>
Figure SMS_39
,其中,/>
Figure SMS_40
所述输出层用于将原始文档转换为密集的分布表示形式,使用dropout函数防止过拟合;利用常规非线性投影将卷积层提取的高阶特征投影到
Figure SMS_41
维空间上,如式(12)表示:
Figure SMS_42
(12)
其中,
Figure SMS_43
为/>
Figure SMS_44
投影矩阵,/>
Figure SMS_45
为/>
Figure SMS_46
的偏置向量,/>
Figure SMS_47
为池化层的输出。
进一步地,所述混合深度神经网络首先通过Embedding函数构建所述嵌入层,输出序列S;其次通过Bidirectional函数构建所述双向长短期记忆网络层;再将双向长短期记忆网络层的输出输入到卷积神经网络层的卷积操作中,并对卷积的结果进行降维,其中的激活函数为tanh函数;然后利用dropout函数防止结果过拟合;最后构建混合深度神经网络模型及设置其损失函数。
进一步地,步骤三中的所述基于乘法法则融合所述多源异构特征是指采用乘法法则融合地理、社交与分类偏好相关分数,并将这些分数融合到概率矩阵分解模型中;首先评估用户所在位置经纬度坐标的个性化签到分布,基于地理相关性,推导用户对未签到的兴趣点的地理相关分数;然后根据其他用户已签到的兴趣点,利用用户的社交关系,推导用户对未签到的兴趣点的社会相关分数;最后,根据用户已签到的兴趣点与未签到的兴趣点的分类与流行度,基于分类相关性,推导用户对未签到的兴趣点的分类相关分数。
进一步地,步骤三中的所述多特征融合的概率矩阵分解模型中集成了混合深度神经网络、地理位置信息、类别偏好信息和社交关系信息的重构的多源异构特征。
进一步地,步骤三中的所述对概率矩阵分解模型中的参数进行优化是指通过使用极大后验估计法,以实现优化混合深度神经网络的用户潜在模型、兴趣点潜在模型、权重和偏置变量。
以及,一种融合多特征的矩阵分解兴趣点推荐的实现系统,其用于实现如上所述的融合多特征的矩阵分解兴趣点推荐方法,该实现系统包括:
重构多源异构特征模块,利用用户和兴趣点的评论信息、地理信息、分类信息、用户的社交信息、用户属性信息以及兴趣点的签到信息和评论内容对地理位置信息、类别偏好信息和社交关系信息进行重构;
混合深度神经网络模块,用于利用文档信息挖掘用户和兴趣点的潜在模型,以自上而下的方式学习文档的潜在分布表示;
多特征融合的概率矩阵分解模型模块,用于形成融合混合深度神经网络、地理位置信息、类别偏好信息和社交关系信息的重构的多源异构特征的概率矩阵分解模型。
进一步地,所述混合深度神经网络模块包括嵌入层模块、双向长短期记忆网络层模块、卷积神经网络层模块、池化层模块和输出层模块,其中:
所述嵌入层模块用于提取文档的语义信息,并将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列;
所述双向长短期记忆网络层模块用于挖掘文档中词序列间的隐藏信息;
所述卷积神经网络层模块用于抽取文本句子间的结构特征;
所述池化层模块用于从卷积神经网络层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征;
所述输出层模块用于将原始文档转换为密集的分布表示形式,防止结果过拟合。
本发明主要有以下几个方面的贡献:
1) 本软件提出一种融合评分的自适应带宽核密度评估法,构建兴趣点之间的地理位置相关性;通过信息熵计算用户的活跃度,结合用户活跃度和皮尔森相关系数法计算用户相似性,并和用户的社交朋友关系相结合计算用户社交相关性;结合用户分类偏好和兴趣点流行度构建分类相关性。提出融合评论信息、地理位置、分类偏好和社交关系的概率矩阵分解模型。实验结果表明,与其他前沿方法比较,本方法在评分预测精度和top-k推荐的召回率中表现更好。
2) 本软件利用叠加的双向长短期记忆网络(Bi-directional Long-Short TermMemory, Bi-LSTM)和卷积神经网络(Convolutional Neural Networks, CNN)的混合深度神经网络(HDNN)获取评论信息中用户和POIs的潜在特征,并且同时考虑词序和上下文对用户和POIs的潜在特征的影响,生成比LDA模型更好的潜在特征表示。特别是在用户-POIs签到矩阵比较稀疏时,叠加的混合深度神经网络有助于深入的了解评论信息,产生更好的潜在模型。实验结果表明,本软件的HDNN模型有更好的潜在特征学习能力。
上述基于融合多特征的矩阵分解兴趣点推荐方法及其实现系统中,根据社交关系中好友与非好友对用户决策的影响;结合用户评分利用自适应带宽核密度方法,计算用户签到的个性化分布,并得出POI间的相关性;由于Bi-LSTM输出的序列具有词语语义和词序列前后间语法等隐藏信息的特征,而CNN擅长从一系列特征中捕捉显著特征,故而将Bi-LSTM和CNN叠加组成新的深层神经网络,从而学习用户和POIs的潜在特征。最后,通过概率矩阵方法将社交、地理位置、分类偏好以及潜在特征相融合,预测用户的个性化偏好,从而达到个性化推荐的目的。
附图说明
图1是本发明实施例的融合多特征的矩阵分解兴趣点推荐方法的混合深度神经网络结构图。
图2是本发明实施例的融合多特征的矩阵分解兴趣点推荐方法的双向长短期记忆网络结构图。
图3是本发明实施例的融合多特征的矩阵分解兴趣点推荐方法的多特征融合的概率矩阵分解模型结构图。
具体实施方式
本实施例以融合多特征的矩阵分解兴趣点推荐方法为例,以下将结合具体实施例和附图对本发明进行详细说明。
请参阅图1、图2和图3,示出本发明实施例提供的一种融合多特征的矩阵分解兴趣点推荐方法。
从多源异构特征重构、上下文感知的混合网络模型、多特征融合的矩阵分解兴趣点推荐这三个方面详细阐述该软件的具体实施细节。
1.多源异构特征重构
首先给出涉及到的相关定义,然后详细讨论地理位置、类别偏好、社交关系信息的重构方法。涉及到的主要符号有:U={u 1,u 2,…,u L}为用户的集合,L表示用户的数量;V={v 1,v 2,…,v J}为LBSNs中所有兴趣点的集合,J表示兴趣点的数量;C={c 1,c 2,…,c K}为兴趣点类别的集合,
Figure SMS_48
为类别的数量且一个兴趣点可以同时属于多个分类。下面给出研究过程中需要用到的相关定义。
定义1.用户评分矩阵。给定一个LBSN上的兴趣点的用户评分数据,构建一个二维矩阵
Figure SMS_49
,矩阵中每个元素/>
Figure SMS_50
代表用户/>
Figure SMS_51
在位置/>
Figure SMS_52
上的评分。
定义2.分类偏好矩阵。给定一个LBSN上的兴趣点的用户历史评分数据和兴趣点的分类信息,构建一个二维矩阵
Figure SMS_53
,矩阵中的每个元素/>
Figure SMS_54
表示用户/>
Figure SMS_55
访问属于类/>
Figure SMS_56
的兴趣点的频率。
定义3.流行度矩阵。给定一个LBSNs上的兴趣点的签到人数和签到时间,构建一个二维矩阵
Figure SMS_57
。矩阵中的每个元素/>
Figure SMS_58
代表在/>
Figure SMS_59
时刻在兴趣点/>
Figure SMS_60
的签到频率,即在/>
Figure SMS_61
时刻兴趣点/>
Figure SMS_62
的流行度。
定义4.用户活跃度。用户已评论兴趣点的类别数和用户互动量称为用户活跃度,用
Figure SMS_63
表示。
Figure SMS_64
(1)
其中,
Figure SMS_65
表示用户/>
Figure SMS_66
已评论的第c类兴趣点占所有已评论兴趣点的数量比例,c是兴趣点的类别数量,/>
Figure SMS_67
表示用户/>
Figure SMS_68
的互动量,即用户的点赞数和粉丝数所占比例。
1.1地理位置信息重构
根据地理学第一定律(Tobler's First Law of Geography):所有事物间都是存在联系的,但距离越近的事物关联性更强;用户的签到行为具有聚集效应(ClusteringPhenomenon),即用户在一个兴趣点签到的概率和距该兴趣点的远近呈反比。本软件利用用户已访问的POIs和未访问的POIs间的地理位置关系来估计用户在未访问POIs上的相关得分。根据每个用户已访问过的POIs估计地理坐标上的个性化签到分布。
目前的工作基于非参数估计方法从用户的签到信息中学习分布形式,即,用固定带宽估计核密度。然而,固定带宽并没有反映用户签到数据中的事实:人口密集的城市地区签到密度高,人口稀少的农村地区签到密度低。每个用户的签到分布是不同的。为此,针对每个用户的签到数据调整内核带宽,并从签到数据中学习自适应带宽。通常,自适应核密度估计方法包括三个步骤:试点估计、局部带宽确定和自适应核估计。
首先,基于固定带宽核密度估计法找到一个试点估计。令集合
Figure SMS_70
为用户已访问POI的集合。/>
Figure SMS_74
中的每一个POI/>
Figure SMS_76
都有一对经纬度坐标/>
Figure SMS_71
。通常情况下,用户对某个POI感兴趣会表现为评分高或访问频率高。故而,将用户/>
Figure SMS_73
在兴趣点/>
Figure SMS_75
上的评分(即
Figure SMS_77
)作为POI/>
Figure SMS_69
的权重。用户u在未访问的POIv上的签到分布的试点估计为/>
Figure SMS_72
,如式(2)表示。
Figure SMS_78
(2)
Figure SMS_79
(3)
其中,
Figure SMS_80
为用户u访问的所有兴趣点两两之间的距离集合。/>
Figure SMS_81
是包含两个全局带宽/>
Figure SMS_82
的固定带宽/>
Figure SMS_83
的标准高斯核函数,两个全局带宽表示为式(6)与式(7)。由在地理位置信息中,两点的距离处在非欧式空间中,故而兴趣点之间的距离通过/>
Figure SMS_84
来计算,如式(4)表示。
Figure SMS_85
(4)
其中,
Figure SMS_86
是地球半径,/>
Figure SMS_87
的计算如式(5)表示。
Figure SMS_88
(5)
Figure SMS_89
(6)
Figure SMS_90
(7)
其中,
Figure SMS_91
,而H1和H2分别计算用户/>
Figure SMS_92
已访问POIs的经度值与纬度值的标准偏差。/>
然后,利用试点估计来估计用户u访问POI
Figure SMS_95
的自适应当地带宽/>
Figure SMS_96
,如式(8)所示,其中/>
Figure SMS_98
是敏感参数/>
Figure SMS_94
,参数/>
Figure SMS_97
越大自适应当地带宽/>
Figure SMS_99
对试点估计/>
Figure SMS_100
越敏感,/>
Figure SMS_93
是几何平均值,如式(9)表示。
Figure SMS_101
(8)
Figure SMS_102
(9)
最后,根据全局带宽
Figure SMS_103
和自适应带宽/>
Figure SMS_104
得到用户/>
Figure SMS_105
在一个未签到的兴趣点/>
Figure SMS_106
上的签到分布的自适应核密度评估为/>
Figure SMS_107
,如式(10)表示。
Figure SMS_108
(10)
Figure SMS_109
(11)
根据上述公式可得到一个结论:当POI
Figure SMS_110
在一个高签到密度区域时,试点估计值会较大,自适应当地带宽会较小,而生成的自适应核密度评估趋近峰值;相反,当POI/>
Figure SMS_111
在一个低签到密度区域时,试点估计值会较小,自适应当地带宽较大,而生成的自适应核密度评估结果较平滑。
因此,使用自适应核密度评估
Figure SMS_112
可以提高用户/>
Figure SMS_113
在未访问的POI/>
Figure SMS_114
上的地理位置上签到分布的预测能力。
1.2类别偏好信息重构
在LBSN中,每一个兴趣点都可能属于多个类别,且兴趣点的类别往往给人们提示该兴趣点内的活动以及可能提供的产品和服务。例如,一个人在餐馆签到意味着他可能在那里吃饭,一家日料店则表示可以为顾客提供传统日本料理。在现实中,人们对兴趣点的类别具有明显的偏见,例如,一个爱好美食的人喜欢去餐馆品尝各种各样的食物。因此,可以通过挖掘用户已访问的兴趣点和未访问的兴趣点之间的类别相关性,从而得出用户对未访问过的兴趣点的评分。
此外,兴趣点的流行度反映了兴趣点所提供的产品和服务的质量,例如,一家受欢迎的餐厅通常表明它提供的食物和服务令人满意。因此,利用兴趣点的流行度对兴趣点的推荐是有效的。
本软件将用户对类别的偏好和兴趣点的流行度计算用户和兴趣点之间的关联评分。该方法分为三个步骤:通过类别偏好计算流行度、计算类别流行度的分布估计、计算类别相关分数。
首先,定义
Figure SMS_117
为用户/>
Figure SMS_118
对类别/>
Figure SMS_121
的偏好,即用户/>
Figure SMS_116
已签到的属于类别/>
Figure SMS_120
的兴趣点的频率。然后,叠加兴趣点/>
Figure SMS_123
各时间段的流行度定义为兴趣点/>
Figure SMS_125
的流行度/>
Figure SMS_115
。故,用户/>
Figure SMS_119
在未访问POI/>
Figure SMS_122
上的类别流行度/>
Figure SMS_124
为:
Figure SMS_126
(12)/>
其中,
Figure SMS_127
为POI/>
Figure SMS_128
所属的类别。
根据分类流行度的分布,对所有用户历史签到数据进行学习,将用户对未访问POIs的流行度映射成正则化的相关分数。类别流行度随机变量
Figure SMS_129
遵循幂律分布,概率密度函数/>
Figure SMS_130
为:
Figure SMS_131
(13)
其中,
Figure SMS_132
的值由类别偏好矩阵/>
Figure SMS_133
和流行度矩阵/>
Figure SMS_134
决定,如式(14)表示。其中,
Figure SMS_135
是兴趣点/>
Figure SMS_136
上用户/>
Figure SMS_137
的分类流行度。
Figure SMS_138
(14)
概率密度函数相对于类别流行度是单调递减的,由于用户偏好的流行兴趣点也应该满足用户的类别偏好,故而,类别相关分数相对于类别流行度应该是单调递增的。定义
Figure SMS_139
的类别相关分数为/>
Figure SMS_140
。由于/>
Figure SMS_141
,/>
Figure SMS_142
相对于类别流行度/>
Figure SMS_143
是一个递增函数,如式(15)表示。
Figure SMS_144
(15)
1.3社交关系信息重构
在真实的LBSN中,用户间的相互作用会对用户的签到行为产生影响,且这种影响不仅仅体现在朋友之间,也体现在用户的属性和相似度上。我们通过用户间的相似性对用户的签到行为进行分析。由于皮尔森相关系数法是通过用户的评分来计算用户的相似度,而用户的评分通常是稀疏的,故而在皮尔森相关系数的基础上,利用用户活跃度重新定义用户的相似性。
此处将用户间的相似度通过皮尔森相关系数和用户活跃度定义,活跃度相近的用户更相似,以
Figure SMS_146
函数定义活跃度与相似度间的关系,最终用户相似度的计算如式(16)表示。
Figure SMS_147
(16)
其中,
Figure SMS_148
表示用户/>
Figure SMS_149
对兴趣点/>
Figure SMS_150
的评分,/>
Figure SMS_151
表示用户/>
Figure SMS_152
对所有兴趣点评分的平均值,/>
Figure SMS_153
的取值范围为[-1, 1]。
通过用户间的相似度计算用户
Figure SMS_154
对未签到兴趣点/>
Figure SMS_155
的评分,如式(17)表示。其中,
Figure SMS_156
根据式(16)计算的相关性强度来决定是否利用好友评分属性。
Figure SMS_157
(17)/>
Figure SMS_158
(18)
在真实世界的数据集中,社会签到评分的随机变量
Figure SMS_159
遵循幂律分布,概率密度函数定义为/>
Figure SMS_160
,如式(19)表示。其中,/>
Figure SMS_161
由签到矩阵和社交关系矩阵决定,如式(20)表示。
Figure SMS_162
(19)
Figure SMS_163
(20)
由于朋友间会分享更多共同的兴趣,且相似用户的兴趣更相似,所以社交相关分数相对于社交签到评分应该是单调递增的,而概率密度函数
Figure SMS_166
相对于社交签到评分/>
Figure SMS_168
是单调递减的。基于概率密度函数/>
Figure SMS_170
定义/>
Figure SMS_165
的社交相关分数为/>
Figure SMS_167
,如式(21)表示。由于/>
Figure SMS_169
,则/>
Figure SMS_171
相对于社交签到评分/>
Figure SMS_164
是一个递增函数。
Figure SMS_172
(21)
2.上下文感知的混合网络模型
本软件利用文本信息挖掘用户和兴趣点的潜在模型,提出一个新的混合深度神经网络(Hybrid Deep Neural Network,简称HDNN)结构,以自上而下的方式(即,上下文感知)学习文档的潜在分布表示(把一个用户或兴趣点的评论作为一个文档)。这里详细阐述混合深度神经网络的层次结构,通过分析用户和兴趣点的评论文档,生成文档潜在模型。由于双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)可以挖掘词序列间的隐藏信息,但易忽略文本句子间的结构信息;而卷积神经网络(Convolutional NeuralNetwork,CNN)具有位移不变性的优势,可以有效抽取文本句子间的结构特征,但很难察觉词序列间的隐藏信息。因此,本软件首先利用Bi-LSTM构建用户和兴趣点评论文档中每个文本句子的表示;然后,利用CNN将所有文本块的语义及其关系编码到文档表示中。混合深度神经网络结构如图1所示,主要由嵌入层、Bi-LSTM层、卷积层、池化层和输出层组成。
2.1嵌入层
为了提取文档的语义信息,利用Glove词嵌入方法,将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列。令
Figure SMS_173
表示为包含/>
Figure SMS_174
个单词的文本块,每个单词都映射到一个全局向量,则有:
Figure SMS_175
(22)
其中,向量
Figure SMS_176
表示第/>
Figure SMS_177
个单词的向量。为保持单词在文本块/>
Figure SMS_178
中的顺序,将单词嵌入的向量连接在一起,可以克服词袋技术的缺陷。将文档按时间顺序排列成/>
Figure SMS_179
个文本块,得到一个序列:/>
Figure SMS_180
,其中,/>
Figure SMS_181
是第/>
Figure SMS_182
个文本块的子序列。
2.2Bi-LSTM层
传统的递归神经网络模型即使能在词与词之间传递语义信息,也不能捕获远距离的语义连接。且在参数训练过程中,梯度逐渐减小直至消失。长短期记忆网络(Long Short-Term Memory, LSTM)通过引入输入门、输出门、遗忘门和存储器单元,克服了梯度消失和长距离依赖的问题。但LSTM只能向前学习文本信息,即只能学习当前词的上文信息,无法获得下文信息。通常词的语义与上下文都相关,并且评论句往往有两种表达顺序,例如,“spotisperfect”和“theperfectspot”。考虑到词序的影响和词与词之间的依赖关系,这里利用双向长短期记忆网络(Bi-LSTM)代替LSTM,既解决了梯度消失和长距离依赖的问题,又能充分考虑上下文的语义信息。
我们将嵌入层得到的序列
Figure SMS_183
输入到Bi-LSTM网络中,学习文本中的隐藏语义。Bi-LSTM层由前向(forward)和后向(backward)LSTM共同组成,如图2所示。
Bi-LSTM网络可以同时对文档中每个词的上下文信息进行语义编码并对其前后信息进行建模,将前向LSTM的输出序列
Figure SMS_184
和后向LSTM的输出序列/>
Figure SMS_185
连接起来作为下一层卷积层的输入。第/>
Figure SMS_186
时刻隐藏向量/>
Figure SMS_187
的更新公式如下:
Figure SMS_188
2.3卷积层
在卷积层,每个神经元
Figure SMS_189
使用一个滤波器(也称为卷积核)/>
Figure SMS_190
,其中/>
Figure SMS_191
为卷积计算的滑动窗口,/>
Figure SMS_192
为LSTM层输出向量的大小。对/>
Figure SMS_193
运用卷积算子/>
Figure SMS_194
计算出新的特征/>
Figure SMS_195
,如式(23)表示。
Figure SMS_196
(23)
其中,
Figure SMS_197
是偏置项,/>
Figure SMS_198
是激活函数。在/>
Figure SMS_199
、/>
Figure SMS_200
、修正线性单元(RectifiedLinear Unit, ReLU)等激活函数中,这里使用ReLU激活函数,避免了梯度消失的问题。
2.4池化层
池化层会从卷积层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征。在卷积层后,每个滤波器生成一个可变长度(即,大小为
Figure SMS_201
)的特征映射。然而,这种表示方式存在两个问题:1)上下文特征太多,其中大部分上下文特征可能无助于提高性能;2)上下文特征向量的长度不同,使得构建下层变得困难。因此,这里利用max-pooling操作,仅从每个上下文特征向量中提取最大上下文特征,将一个文档的表示缩减为一个定长向量。如式(24)和式(25)表示。
Figure SMS_202
(24)/>
Figure SMS_203
(25)
其中,
Figure SMS_204
表示卷积层的核数。
为了引入非线性,在max-pooling的基础上进一步添加一个激活函数——双曲正切函数(
Figure SMS_205
)。在文本分析中,通常会考虑多个窗口大小,因此最终将不同单词窗口生成的所有特征向量串联起来,形成/>
Figure SMS_206
的最终表示形式。例如,当/>
Figure SMS_207
时,得到的最终表示形式为/>
Figure SMS_208
。这里使用连接而不是平均来合并所有的特征向量。这种处理有助于为后续处理保留足够的特性,并实现更好的建模性能。
2.5输出层
在该层,利用常规非线性投影将卷积层提取的高阶特征投影到
Figure SMS_209
维空间上,如式(26)表示。
Figure SMS_210
(26)
其中,
Figure SMS_212
为/>
Figure SMS_215
投影矩阵,/>
Figure SMS_218
为/>
Figure SMS_213
的偏置向量,/>
Figure SMS_216
为池化层的输出。此外,使用dropout防止过拟合,dropout是一项用于神经网络的正则化技术,目的是防止过拟合。在训练的过程中随机丢弃神经元及其连接,如果dropout的概率是/>
Figure SMS_219
,那么神经元被保留的概率为/>
Figure SMS_220
。在参数更新过程中,只有模型的一部分参数更新,即/>
Figure SMS_211
和/>
Figure SMS_214
被更新,从而更新投影/>
Figure SMS_217
。通过这种方法在训练过程中减少神经元之间复杂的共适应关系。
通过上述过程,可以将原始文档转换为密集的分布表示形式。假设
Figure SMS_224
和/>
Figure SMS_227
是兴趣点和用户的评论输入文档,使用函数/>
Figure SMS_231
将/>
Figure SMS_223
表示为/>
Figure SMS_228
,而使用函数/>
Figure SMS_232
将用户评论文档/>
Figure SMS_235
表示为投影/>
Figure SMS_221
。/>
Figure SMS_225
表示混合深度神经网络(HDNN)中所有权值和偏置变量的参数,/>
Figure SMS_229
和/>
Figure SMS_233
是兴趣点和用户的分布表示。将POI/>
Figure SMS_222
的评论文档表示为/>
Figure SMS_226
;将用户/>
Figure SMS_230
的评论文档表示为/>
Figure SMS_234
利用Keras,通过指定的输入、输出和损失函数,为所提出的混合深度神经网络构建一个抽象模型。算法1给出了基于Keras函数API的HDNN模型的实现。
Figure SMS_236
在算法1中,将HDNN模型分为四层,通过Embedding函数构建HDNN的嵌入层,输出序列S;Bidirectional函数构建Bi-LSTM层,其中“concat”的作用是将前后向LSTM的输入连接在一起;将Bi-LSTM层的输出输入到CNN层的卷积操作中,并对卷积的结果进行降维,且激活函数为“tanh”;利用dropout函数对结果进行处理,以防止过拟合;最后构建HDNN模型及设置其损失函数。
3.多特征融合的矩阵分解兴趣点推荐
3.1基于乘法法则的属性特征融合
关于兴趣点推荐,在之前的研究工作中,乘法法则被广泛应用于融合不同的因素,并显示了高鲁棒性。因此,本软件采用乘法法则融合地理、社交与分类偏好相关分数,并将这些分数融合到概率矩阵分解模型中。
首先评估用户所在位置经纬度坐标的个性化签到分布,基于地理相关性,推导用户对未签到的兴趣点的地理相关分数;然后根据其他用户已签到的兴趣点,利用用户的社交关系,推导用户对未签到的兴趣点的社会相关分数;最后,根据用户已签到的兴趣点与未签到的兴趣点的分类与流行度,基于分类相关性,推导用户对未签到的兴趣点的分类相关分数。用户
Figure SMS_237
在兴趣点/>
Figure SMS_238
上的签到评分由用户和兴趣点这两种因素所决定。评价/>
Figure SMS_239
反映用户与兴趣点之间的地理、社会与分类相关性。地理、社会与分类相关分数越高,则评价/>
Figure SMS_240
越高。这里融合地理、社会与分类相关分数,由式(10)、式(15)和式(21)给定的相关分数,关于用户/>
Figure SMS_241
对兴趣点/>
Figure SMS_242
的偏好,基于乘法法则,把这些相关分数整合到一个统一的偏好分数/>
Figure SMS_243
中,如式(27)表示。
Figure SMS_244
(27)
3.2多特征融合的概率矩阵分解模型
多特征融合的概率矩阵分解模型(Probabilistic Matrix Factorization ofMulti-Feature, 简称Multi-F_PMF)的结构如图3所示,该模型将混合深度神经网络(HDNN)、社交、地理位置和类别集成到此概率矩阵分解模型中。
当把PMF预测用户对兴趣点的评分时,使用特征向量
Figure SMS_245
表示用户/>
Figure SMS_246
,兴趣点/>
Figure SMS_247
用特征向量/>
Figure SMS_248
表示,其中/>
Figure SMS_249
和/>
Figure SMS_250
分别表示用户潜在偏移量(用于捕获特定兴趣点的用户偏置),以及兴趣点潜在偏移量(用于捕获特定用户的兴趣点首选项),如式(28)表示。
Figure SMS_251
,/>
Figure SMS_252
(28)
在现实系统中,有很多因素可以决定用户对某个兴趣点的评分,例如,社会影响、个人兴趣和地理位置等。完全依赖评论内容来表示用户或兴趣点是不合理的。因此,我们将地理位置、社交关系和类别偏好融入到PMF中,且
Figure SMS_253
//>
Figure SMS_254
在考虑评分时,可以捕捉到用户和兴趣点的评论内容与其潜在模型之间的差异,从而使评分矩阵的因子分解更加合理和可解释性。
根据贝叶斯规则,观测数据(
Figure SMS_257
,/>
Figure SMS_260
,/>
Figure SMS_263
)、潜在因素(/>
Figure SMS_256
,/>
Figure SMS_259
,/>
Figure SMS_262
,/>
Figure SMS_264
,/>
Figure SMS_255
)、参数(/>
Figure SMS_258
,
Figure SMS_261
)的联合似然性可表示为式(29)。
Figure SMS_265
(29)
其中,
Figure SMS_266
是兴趣点潜在因子的/>
Figure SMS_267
高斯先验,/>
Figure SMS_268
是用户潜在因子的/>
Figure SMS_269
高斯先验;/>
Figure SMS_270
和/>
Figure SMS_271
是相应的高斯分布的精度;且/>
Figure SMS_272
3.3Multi-F_PMF模型的优化
为了优化HDNN的用户潜在模型、兴趣点潜在模型、权重和偏置等变量,这里使用了极大后验(Maximum A Posteriori, 简称MAP)估计法。
给定一个训练数据集,通过计算
Figure SMS_273
,/>
Figure SMS_274
,/>
Figure SMS_275
的MAP估计值,使用/>
Figure SMS_276
和/>
Figure SMS_277
以及/>
Figure SMS_278
来预测/>
Figure SMS_279
中缺失的项,并使用预测结果来推荐Top-k兴趣点。
后验函数的极大化等价于式(29)的完全对数似然的极大化,可以得到目标函数如式(30)表示。
Figure SMS_280
(30)
先固定
Figure SMS_283
和/>
Figure SMS_286
的值(即,固定变换/>
Figure SMS_289
、/>
Figure SMS_284
中的参数/>
Figure SMS_287
,/>
Figure SMS_290
),从而求解/>
Figure SMS_292
和/>
Figure SMS_281
。对于/>
Figure SMS_285
和/>
Figure SMS_288
,最大化遵循矩阵分解方法。/>
Figure SMS_291
和/>
Figure SMS_282
的更新方式如式(31)表示。
Figure SMS_293
(31)
其中,
Figure SMS_294
是对角矩阵,/>
Figure SMS_295
是其对角元素,对于用户/>
Figure SMS_296
的/>
Figure SMS_297
。对于兴趣点/>
Figure SMS_298
,类似地定义/>
Figure SMS_299
和/>
Figure SMS_300
在更新
Figure SMS_302
和/>
Figure SMS_305
时采用矩阵运算策略来减少计算成本。更新/>
Figure SMS_308
时,将/>
Figure SMS_303
改写为
Figure SMS_306
,并预先计算每个兴趣点的/>
Figure SMS_309
;同样地,更新/>
Figure SMS_310
时,将/>
Figure SMS_301
改写为/>
Figure SMS_304
,并为每个用户预先计算/>
Figure SMS_307
然而,
Figure SMS_312
和/>
Figure SMS_314
不能像/>
Figure SMS_316
和/>
Figure SMS_313
那样通过解析进行优化,因为/>
Figure SMS_315
和/>
Figure SMS_317
与混合神经神经网络架构中的最大池层和非线性激活函数等特性密切相关。但当/>
Figure SMS_318
和/>
Figure SMS_311
固定时,损失函数L就为一个带L2正则项的平方误差函数,如式(32)表示。
Figure SMS_319
(32)
根据式(32),使用反向传播分别用给定的目标值
Figure SMS_321
和/>
Figure SMS_324
对/>
Figure SMS_328
和/>
Figure SMS_323
进行优化。此处利用dropout来处理过拟合问题,使得/>
Figure SMS_327
始终为0。在此情况下,参数/>
Figure SMS_330
和/>
Figure SMS_332
的方差是无穷多个的(即,可以取任何值)。这里保留/>
Figure SMS_320
以保证概率模型的完整性。在实现过程中,实例化两个HDNN模块,然后利用fit函数来训练参数/>
Figure SMS_325
、/>
Figure SMS_329
、/>
Figure SMS_331
、/>
Figure SMS_322
。在拟合过程中,均方误差/>
Figure SMS_326
,即最小化式(32)的结果。
为了进一步阐述Multi-F_PMF方法,在算法2中展示了其参数学习的具体过程。随机将Word2Vec或GloVe预训练的结果生成
Figure SMS_333
和/>
Figure SMS_334
的词嵌入。/>
Figure SMS_335
在算法2中,首先分别对每个兴趣点和用户的评论信息序列化,然后分别构建用户和兴趣点的HDNN模型。在预先设置的迭代次数内循环训练HDNN模型,直至误差小于预设值。循环语句中的具体操作为:将序列化后的评论信息输入到相应的HDNN模型中,修正
Figure SMS_337
和/>
Figure SMS_340
,更新两个HDNN模块的参数W1和W2。根据式(31)更新/>
Figure SMS_342
和/>
Figure SMS_338
,并根据均方误差mse更新权重/>
Figure SMS_341
和/>
Figure SMS_343
及误差值/>
Figure SMS_344
和/>
Figure SMS_336
,最后将式(27)计算的结果加入到预测的评分/>
Figure SMS_339
中计算,当损失值小于预先设定的值时,结束循环;否则继续循环。最后返回目标函数值对应的参数值。
整个优化过程不断重复,直至收敛。通过优化
Figure SMS_345
、/>
Figure SMS_346
、/>
Figure SMS_347
、/>
Figure SMS_348
,最终可以预测用户对未访问兴趣点的评分/>
Figure SMS_349
,如式(33)所示。
Figure SMS_350
(33)
对于非冷启动项预测,使用点估计
Figure SMS_351
和/>
Figure SMS_352
,/>
Figure SMS_353
和/>
Figure SMS_354
来近似地求其期望,此时预测的评分/>
Figure SMS_355
如式(34)所示。
Figure SMS_356
(34)
对于冷启动预测,兴趣点或用户是全新的,即没有评分信息等。这里使用
Figure SMS_357
或/>
Figure SMS_358
对其进行预测;根据给定项目/用户的文字描述进行转换,从而获得新兴趣点或新用户的投影/>
Figure SMS_359
或/>
Figure SMS_360
以及,一种融合多特征的矩阵分解兴趣点推荐的实现系统,其用于实现如上所述的融合多特征的矩阵分解兴趣点推荐方法,该实现系统包括:
重构多源异构特征模块,利用用户和兴趣点的评论信息、地理信息、分类信息、用户的社交信息、用户属性信息以及兴趣点的签到信息和评论内容对地理位置信息、类别偏好信息和社交关系信息进行重构;
混合深度神经网络模块,用于利用文档信息挖掘用户和兴趣点的潜在模型,以自上而下的方式学习文档的潜在分布表示;
多特征融合的概率矩阵分解模型模块,用于形成融合混合深度神经网络、地理位置信息、类别偏好信息和社交关系信息的重构的多源异构特征的概率矩阵分解模型。
进一步地,所述混合深度神经网络模块包括嵌入层模块、双向长短期记忆网络层模块、卷积神经网络层模块、池化层模块和输出层模块,其中:
嵌入层模块用于提取文档的语义信息,并将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列;
双向长短期记忆网络层模块用于挖掘文档中词序列间的隐藏信息;
卷积神经网络层模块用于抽取文本句子间的结构特征;
池化层模块用于从卷积神经网络层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征;
输出层模块用于将原始文档转换为密集的分布表示形式,防止结果过拟合。
本发明主要有以下几个方面的贡献:
1) 本软件提出一种融合评分的自适应带宽核密度评估法,构建兴趣点之间的地理位置相关性;通过信息熵计算用户的活跃度,结合用户活跃度和皮尔森相关系数法计算用户相似性,并和用户的社交朋友关系相结合计算用户社交相关性;结合用户分类偏好和兴趣点流行度构建分类相关性。提出融合评论信息、地理位置、分类偏好和社交关系的概率矩阵分解模型。实验结果表明,与其他前沿方法比较,本方法在评分预测精度和top-k推荐的召回率中表现更好。
2) 本软件利用叠加的双向长短期记忆网络(Bi-directional Long-Short TermMemory, Bi-LSTM)和卷积神经网络(Convolutional Neural Networks, CNN)的混合深度神经网络(HDNN)获取评论信息中用户和POIs的潜在特征,并且同时考虑词序和上下文对用户和POIs的潜在特征的影响,生成比LDA模型更好的潜在特征表示。特别是在用户-POIs签到矩阵比较稀疏时,叠加的混合深度神经网络有助于深入的了解评论信息,产生更好的潜在模型。实验结果表明,本软件的HDNN模型有更好的潜在特征学习能力。
上述基于融合多特征的矩阵分解兴趣点推荐方法及其实现系统中,根据社交关系中好友与非好友对用户决策的影响;结合用户评分利用自适应带宽核密度方法,计算用户签到的个性化分布,并得出POI间的相关性;由于Bi-LSTM输出的序列具有词语语义和词序列前后间语法等隐藏信息的特征,而CNN擅长从一系列特征中捕捉显著特征,故而将Bi-LSTM和CNN叠加组成新的深层神经网络,从而学习用户和POIs的潜在特征。最后,通过概率矩阵方法将社交、地理位置、分类偏好以及潜在特征相融合,预测用户的个性化偏好,从而达到个性化推荐的目的。
需要说明的是,以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种融合多特征的矩阵分解兴趣点推荐方法,其特征在于,包括以下步骤:
步骤一,重构多源异构特征,所述多源异构特征包括对地理位置信息、类别偏好信息和社交关系信息,由位置社交网络LBSN中的用户评分矩阵、分类偏好矩阵、流行度矩阵和用户活跃度,对所述多源异构特征进行重构;
步骤二,利用文本信息挖掘用户和兴趣点的潜在模型,生成一个混合深度神经网络HDNN结构,以自上而下的方式学习文档的潜在分布表示,通过分析用户和兴趣点的评论文档,生成文档潜在模型;
步骤三,多特征融合的矩阵分解兴趣点推荐,基于乘法法则融合所述多源异构特征,生成融合地理位置、类别偏好、社交关系及混合深度神经网络的多特征融合的概率矩阵分解模型,并对概率矩阵分解模型中的参数进行优化,以预测用户的个性化偏好,并使用预测结果来推荐Top-k兴趣点;
其中,步骤一中的所述地理位置信息的重构是指利用用户已访问的兴趣点和未访问的兴趣点间的地理位置关系来估算用户在未访问兴趣点上的相关得分,根据每个用户已访问过的兴趣点估算地理坐标上的个性化签到分布;所述类别偏好信息的重构是指将用户对类别的偏好和兴趣点的流行度计算用户和兴趣点之间的关联评分;所述社交关系信息的重构是指通过用户间的相似性对用户的签到行为进行分析,在皮尔森相关系数法的基础上,利用用户活跃度重新定义用户的相似性;
步骤二中的所述混合深度神经网络包括双向长短期记忆网络和卷积神经网络,所述双向长短期记忆网络用于构建用户和兴趣点评论文档中每个文本句子的表示,所述卷积神经网络用于将所有文本块的语义及其关系编码到文档表示中;
所述混合深度神经网络包括嵌入层、双向长短期记忆网络层、卷积神经网络层、池化层和输出层;
所述混合深度神经网络首先通过Embedding函数构建所述嵌入层,输出序列S;其次通过Bidirectional函数构建所述双向长短期记忆网络层;再将双向长短期记忆网络层的输出输入到卷积神经网络层的卷积操作中,并对卷积的结果进行降维,其中的激活函数为tanh函数;然后利用dropout函数防止结果过拟合;最后构建混合深度神经网络模型及设置其损失函数;
步骤三中的所述基于乘法法则融合所述多源异构特征是指采用乘法法则融合地理、社交与分类偏好相关分数,并将这些分数融合到概率矩阵分解模型中;首先评估用户所在位置经纬度坐标的个性化签到分布,基于地理相关性,推导用户对未签到的兴趣点的地理相关分数;然后根据其他用户已签到的兴趣点,利用用户的社交关系,推导用户对未签到的兴趣点的社会相关分数;最后,根据用户已签到的兴趣点与未签到的兴趣点的分类与流行度,基于分类相关性,推导用户对未签到的兴趣点的分类相关分数;
所述多特征融合的概率矩阵分解模型中集成了混合深度神经网络、地理位置信息、类别偏好信息和社交关系信息的重构的多源异构特征;
所述对概率矩阵分解模型中的参数进行优化是指通过使用极大后验估计法MAP,以实现优化混合深度神经网络的用户潜在模型、兴趣点潜在模型、权重和偏置变量。
2.如权利要求1所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤一中的LBSN中的用户评分矩阵、分类偏好矩阵、流行度矩阵和用户活跃度的定义如下:
U={u 1,u 2,…,u L}为用户的集合,L表示用户的数量;V={v 1,v 2,…,v J}为LBSNs中所有兴趣点的集合,J表示兴趣点的数量;C={c 1,c 2,…,c K}为兴趣点类别的集合,
Figure QLYQS_1
为类别的数量且一个兴趣点可以同时属于多个分类:
所述用户评分矩阵定义为给定一个LBSN上的兴趣点的用户评分数据,构建一个二维矩阵
Figure QLYQS_2
,矩阵中每个元素/>
Figure QLYQS_3
代表用户/>
Figure QLYQS_4
在位置/>
Figure QLYQS_5
上的评分;
所述分类偏好矩阵定义为给定一个LBSN上的兴趣点的用户历史评分数据和兴趣点的分类信息,构建一个二维矩阵
Figure QLYQS_6
,矩阵中的每个元素/>
Figure QLYQS_7
表示用户/>
Figure QLYQS_8
访问属于类/>
Figure QLYQS_9
的兴趣点的频率;
所述流行度矩阵定义为给定一个LBSNs上的兴趣点的签到人数和签到时间,构建一个二维矩阵
Figure QLYQS_10
,矩阵中的每个元素/>
Figure QLYQS_11
代表在/>
Figure QLYQS_12
时刻在兴趣点/>
Figure QLYQS_13
的签到频率,即在/>
Figure QLYQS_14
时刻兴趣点/>
Figure QLYQS_15
的流行度;
所述用户活跃度定义为用户已评论兴趣点的类别数和用户互动量称为用户活跃度,用
Figure QLYQS_16
表示:
Figure QLYQS_17
(1);
其中,
Figure QLYQS_18
表示用户/>
Figure QLYQS_19
已评论的第c类兴趣点占所有已评论兴趣点的数量比例,c是兴趣点的类别数量,/>
Figure QLYQS_20
表示用户/>
Figure QLYQS_21
的互动量,即用户的点赞数和粉丝数所占比例。
3.如权利要求2所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤一中的所述地理位置信息重构的步骤如下:
首先,基于固定带宽核密度估计法找到一个试点估计,令集合
Figure QLYQS_24
为用户已访问POI的集合,/>
Figure QLYQS_26
中的每一个POI/>
Figure QLYQS_28
都有一对经纬度坐标/>
Figure QLYQS_23
;将用户/>
Figure QLYQS_27
在兴趣点/>
Figure QLYQS_29
上的评分/>
Figure QLYQS_30
作为POI/>
Figure QLYQS_22
的权重,用户u在未访问的POIv上的签到分布的试点估计为/>
Figure QLYQS_25
,如式(2)表示:
Figure QLYQS_31
(2);
Figure QLYQS_32
(3);
其中,
Figure QLYQS_33
为用户u访问的所有兴趣点两两之间的距离集合;/>
Figure QLYQS_34
是包含两个全局带宽/>
Figure QLYQS_35
的固定带宽/>
Figure QLYQS_36
的标准高斯核函数,两个全局带宽表示为式(6)与式(7);兴趣点之间的距离通过/>
Figure QLYQS_37
来计算,如式(4)表示:/>
Figure QLYQS_38
(4);
其中,
Figure QLYQS_39
是地球半径,/>
Figure QLYQS_40
的计算如式(5)表示:
Figure QLYQS_41
(5);
Figure QLYQS_42
(6);
Figure QLYQS_43
(7);
其中,
Figure QLYQS_44
,而H1和H2分别计算用户/>
Figure QLYQS_45
已访问POIs的经度值与纬度值的标准偏差;
然后,利用试点估计来估计用户u访问POI
Figure QLYQS_47
的自适应当地带宽/>
Figure QLYQS_49
,如式(8)所示,其中/>
Figure QLYQS_52
是敏感参数/>
Figure QLYQS_48
,参数/>
Figure QLYQS_50
越大自适应当地带宽/>
Figure QLYQS_51
对试点估计/>
Figure QLYQS_53
越敏感,/>
Figure QLYQS_46
是几何平均值,如式(9)表示:
Figure QLYQS_54
(8);
Figure QLYQS_55
(9);
最后,根据全局带宽
Figure QLYQS_56
和自适应带宽/>
Figure QLYQS_57
得到用户/>
Figure QLYQS_58
在一个未签到的兴趣点/>
Figure QLYQS_59
上的签到分布的自适应核密度评估为/>
Figure QLYQS_60
,如式(10)表示:
Figure QLYQS_61
(10);
Figure QLYQS_62
(11);
步骤一中的所述类别偏好信息重构包括三个步骤:通过类别偏好计算流行度、计算类别流行度的分布估计、计算类别相关分数;
首先,定义
Figure QLYQS_65
为用户/>
Figure QLYQS_67
对类别/>
Figure QLYQS_70
的偏好,即用户/>
Figure QLYQS_64
已签到的属于类别/>
Figure QLYQS_68
的兴趣点的频率;然后,叠加兴趣点/>
Figure QLYQS_71
各时间段的流行度定义为兴趣点/>
Figure QLYQS_73
的流行度/>
Figure QLYQS_63
;故,用户/>
Figure QLYQS_66
在未访问POI/>
Figure QLYQS_69
上的类别流行度/>
Figure QLYQS_72
为:
Figure QLYQS_74
(12);
其中,
Figure QLYQS_75
为POI/>
Figure QLYQS_76
所属的类别;
根据分类流行度的分布,对所有用户历史签到数据进行学习,将用户对未访问POIs的流行度映射成正则化的相关分数,类别流行度随机变量
Figure QLYQS_77
遵循幂律分布,概率密度函数/>
Figure QLYQS_78
为:
Figure QLYQS_79
(13);/>
其中,
Figure QLYQS_80
的值由类别偏好矩阵/>
Figure QLYQS_81
和流行度矩阵/>
Figure QLYQS_82
决定,如式(14)表示;其中,
Figure QLYQS_83
是兴趣点/>
Figure QLYQS_84
上用户/>
Figure QLYQS_85
的分类流行度:
Figure QLYQS_86
(14);
定义
Figure QLYQS_87
的类别相关分数为/>
Figure QLYQS_88
;由于/>
Figure QLYQS_89
,/>
Figure QLYQS_90
相对于类别流行度/>
Figure QLYQS_91
是一个递增函数,如式(15)表示:
Figure QLYQS_92
(15);
步骤一中的所述社交关系信息重构的步骤如下:
将用户间的相似度通过皮尔森相关系数和用户活跃度定义,活跃度相近的用户更相似,以
Figure QLYQS_94
函数定义活跃度与相似度间的关系,最终用户相似度的计算如式(16)表示:
Figure QLYQS_95
(16);
其中,
Figure QLYQS_96
表示用户/>
Figure QLYQS_97
对兴趣点/>
Figure QLYQS_98
的评分,/>
Figure QLYQS_99
表示用户/>
Figure QLYQS_100
对所有兴趣点评分的平均值,
Figure QLYQS_101
的取值范围为[-1, 1];
通过用户间的相似度计算用户
Figure QLYQS_102
对未签到兴趣点/>
Figure QLYQS_103
的评分,如式(17)表示;其中,/>
Figure QLYQS_104
根据式(16)计算的相关性强度来决定是否利用好友评分属性:
Figure QLYQS_105
(17);
Figure QLYQS_106
(18);
社会签到评分的随机变量
Figure QLYQS_107
遵循幂律分布,概率密度函数定义为/>
Figure QLYQS_108
,如式(19)表示;其中,/>
Figure QLYQS_109
由签到矩阵和社交关系矩阵决定,如式(20)表示:
Figure QLYQS_110
(19);
Figure QLYQS_111
(20);
基于概率密度函数
Figure QLYQS_112
定义/>
Figure QLYQS_113
的社交相关分数为/>
Figure QLYQS_114
,如式(21)表示;由于/>
Figure QLYQS_115
,则/>
Figure QLYQS_116
相对于社交签到评分/>
Figure QLYQS_117
是一个递增函数:
Figure QLYQS_118
(21)。
4.如权利要求3所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
所述嵌入层用于提取文档的语义信息,利用Glove词嵌入方法,将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列;设令
Figure QLYQS_119
表示为包含/>
Figure QLYQS_120
个单词的文本块,每个单词都映射到一个全局向量,则有:
Figure QLYQS_121
(22);
其中,向量
Figure QLYQS_122
表示第/>
Figure QLYQS_123
个单词的向量,为保持单词在文本块/>
Figure QLYQS_124
中的顺序,将单词嵌入的向量连接在一起,并将文档按时间顺序排列成/>
Figure QLYQS_125
个文本块,得到一个序列:/>
Figure QLYQS_126
,其中,/>
Figure QLYQS_127
是第/>
Figure QLYQS_128
个文本块的子序列;
所述双向长短期记忆网络层用于挖掘文档中词序列间的隐藏信息;双向长短期记忆网络同时对文档中每个词的上下文信息进行语义编码并对其前后信息进行建模,将前向LSTM的输出序列
Figure QLYQS_129
和后向LSTM的输出序列/>
Figure QLYQS_130
连接起来作为下一层卷积层的输入;第/>
Figure QLYQS_131
时刻隐藏向量h t的更新公式如下:
Figure QLYQS_132
(23);
Figure QLYQS_133
(24);
Figure QLYQS_134
(25);
Figure QLYQS_135
(26);
Figure QLYQS_136
(27);
Figure QLYQS_137
(28);
Figure QLYQS_138
(29);
所述卷积神经网络层用于抽取文本句子间的结构特征;在卷积层,每个神经元
Figure QLYQS_139
使用一个滤波器/>
Figure QLYQS_140
,其中/>
Figure QLYQS_141
为卷积计算的滑动窗口,/>
Figure QLYQS_142
为LSTM层输出向量的大小;对/>
Figure QLYQS_143
运用卷积算子/>
Figure QLYQS_144
计算出新的特征/>
Figure QLYQS_145
,如式(30)表示:
Figure QLYQS_146
(30);
其中,
Figure QLYQS_147
是偏置项,/>
Figure QLYQS_148
是激活函数;在/>
Figure QLYQS_149
、/>
Figure QLYQS_150
、修正线性单元的激活函数中,使用ReLU激活函数,避免了梯度消失的问题;
所述池化层用于从卷积神经网络层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征;利用max-pooling操作,从每个上下文特征向量中提取最大上下文特征,将一个文档的表示缩减为一个定长向量,如式(31)和式(32)表示:
Figure QLYQS_151
(31);
Figure QLYQS_152
(32);
其中,
Figure QLYQS_153
表示卷积层的核数;引入非线性,在max-pooling的基础上添加激活函数双曲正切函数/>
Figure QLYQS_154
;在文本分析中,将不同单词窗口生成的所有特征向量串联起来,形成/>
Figure QLYQS_155
的最终表示形式:/>
Figure QLYQS_156
,其中,/>
Figure QLYQS_157
;/>
所述输出层用于将原始文档转换为密集的分布表示形式,使用dropout函数防止过拟合;利用常规非线性投影将卷积层提取的高阶特征投影到
Figure QLYQS_158
维空间上,如式(33)表示:
Figure QLYQS_159
(33);
其中,
Figure QLYQS_160
为/>
Figure QLYQS_161
投影矩阵,/>
Figure QLYQS_162
为/>
Figure QLYQS_163
的偏置向量,/>
Figure QLYQS_164
为池化层的输出。
5.如权利要求4所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤三中的所述多特征融合的矩阵分解兴趣点推荐的具体步骤如下:
步骤3.1,基于乘法法则的属性特征融合;
步骤3.2,建立多特征融合的概率矩阵分解模型;
步骤3.3,多特征融合的概率矩阵分解模型的优化。
6.如权利要求5所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤3.1中的基于乘法法则的属性特征融合的具体步骤如下:
用户
Figure QLYQS_165
在兴趣点/>
Figure QLYQS_166
上的签到评分由用户和兴趣点这两种因素所决定,评价/>
Figure QLYQS_167
反映用户与兴趣点之间的地理、社会与分类相关性;地理、社会与分类相关分数越高,则评价/>
Figure QLYQS_168
越高,这里融合地理、社会与分类相关分数,由式(10)、式(15)和式(21)给定的相关分数,关于用户/>
Figure QLYQS_169
对兴趣点/>
Figure QLYQS_170
的偏好,基于乘法法则,把这些相关分数整合到一个统一的偏好分数/>
Figure QLYQS_171
中,如式(34)表示:
Figure QLYQS_172
(34)。
7.如权利要求6所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤3.2中的建立多特征融合的概率矩阵分解模型的具体步骤如下:
使用概率矩阵分解模型预测用户对兴趣点的评分时,特征向量
Figure QLYQS_173
表示用户/>
Figure QLYQS_174
,兴趣点/>
Figure QLYQS_175
用特征向量/>
Figure QLYQS_176
表示,其中/>
Figure QLYQS_177
和/>
Figure QLYQS_178
分别表示用户潜在偏移量和兴趣点潜在偏移量,所述用户潜在偏移量用于捕获特定兴趣点的用户偏置,所述兴趣点潜在偏移量用于捕获特定用户的兴趣点首选项,如式(35)表示:
Figure QLYQS_179
,/>
Figure QLYQS_180
(35);
根据贝叶斯规则,观测数据(
Figure QLYQS_183
, />
Figure QLYQS_186
, />
Figure QLYQS_189
)、潜在因素(/>
Figure QLYQS_182
, />
Figure QLYQS_185
, />
Figure QLYQS_187
, />
Figure QLYQS_190
, />
Figure QLYQS_181
)、参数(/>
Figure QLYQS_184
,
Figure QLYQS_188
)的联合似然性可表示为式(36):
Figure QLYQS_191
(36);
其中,观测参数R为用户评分矩阵;X为用户对未签到兴趣点的评分;Y为用户对未访问兴趣点的类别流行度;潜在因素U为用户的集合;V为兴趣点的集合;GSC为用户对兴趣点的偏好分数;
Figure QLYQS_194
和/>
Figure QLYQS_197
是兴趣点和用户的分布表示;参数/>
Figure QLYQS_200
表示混合深度神经网络(HDNN)中所有权值和偏置变量;/>
Figure QLYQS_193
是兴趣点潜在因子的/>
Figure QLYQS_196
高斯先验,/>
Figure QLYQS_199
是用户潜在因子的/>
Figure QLYQS_201
高斯先验;/>
Figure QLYQS_192
和/>
Figure QLYQS_195
是相应的高斯分布的精度;且/>
Figure QLYQS_198
8.如权利要求7所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,
步骤3.3中的多特征融合的概率矩阵分解模型的优化的具体步骤如下:
后验函数的极大化等价于式(36)的完全对数似然的极大化,得到目标函数如式(37)表示:
Figure QLYQS_202
(37);
先固定
Figure QLYQS_204
和/>
Figure QLYQS_209
的值,固定变换/>
Figure QLYQS_212
、/>
Figure QLYQS_205
中的参数/>
Figure QLYQS_208
,/>
Figure QLYQS_211
,从而求解/>
Figure QLYQS_214
和/>
Figure QLYQS_203
;对于/>
Figure QLYQS_207
和/>
Figure QLYQS_210
,最大化遵循矩阵分解方法;/>
Figure QLYQS_213
和/>
Figure QLYQS_206
的更新方式如式(38)表示:
Figure QLYQS_215
(38);
其中,
Figure QLYQS_216
是对角矩阵,/>
Figure QLYQS_217
是其对角元素,对于用户/>
Figure QLYQS_218
的/>
Figure QLYQS_219
;对于兴趣点/>
Figure QLYQS_220
,类似地定义/>
Figure QLYQS_221
和/>
Figure QLYQS_222
在更新
Figure QLYQS_225
和/>
Figure QLYQS_228
时采用矩阵运算策略来减少计算成本;更新/>
Figure QLYQS_231
时,将/>
Figure QLYQS_224
改写为
Figure QLYQS_227
,并预先计算每个兴趣点的/>
Figure QLYQS_230
;同样地,更新/>
Figure QLYQS_232
时,将/>
Figure QLYQS_223
改写为/>
Figure QLYQS_226
,并为每个用户预先计算/>
Figure QLYQS_229
Figure QLYQS_233
和/>
Figure QLYQS_234
固定时,损失函数L为一个带L2正则项的平方误差函数,如式(39)表示:
Figure QLYQS_235
(39);
根据式(39),使用反向传播分别用给定的目标值
Figure QLYQS_236
和/>
Figure QLYQS_237
对/>
Figure QLYQS_238
和/>
Figure QLYQS_239
进行优化。
9.一种融合多特征的矩阵分解兴趣点推荐的实现系统,其用于实现如权利要求1-8任一项所述的融合多特征的矩阵分解兴趣点推荐方法,其特征在于,该实现系统包括:
重构多源异构特征模块,利用用户和兴趣点的评论信息、地理信息、分类信息、用户的社交信息、用户属性信息以及兴趣点的签到信息和评论内容对地理位置信息、类别偏好信息和社交关系信息进行重构;
混合深度神经网络模块,用于利用文档信息挖掘用户和兴趣点的潜在模型,以自上而下的方式学习文档的潜在分布表示;
多特征融合的概率矩阵分解模型模块,用于形成融合混合深度神经网络、地理位置信息、类别偏好信息和社交关系信息的重构的多源异构特征的概率矩阵分解模型。
10.如权利要求9所述的融合多特征的矩阵分解兴趣点推荐的实现系统,其特征在于,所述混合深度神经网络模块包括嵌入层模块、双向长短期记忆网络层模块、卷积神经网络层模块、池化层模块和输出层模块,其中:
所述嵌入层模块用于提取文档的语义信息,并将每个词转换为实值向量,把每个文本片段表示为单词嵌入序列;
所述双向长短期记忆网络层模块用于挖掘文档中词序列间的隐藏信息;
所述卷积神经网络层模块用于抽取文本句子间的结构特征;
所述池化层模块用于从卷积神经网络层提取具有代表性的特征,并通过池化操作将可变长度的文档构造成固定长度的向量特征;
所述输出层模块用于将原始文档转换为密集的分布表示形式,防止结果过拟合。
CN201911137480.5A 2019-11-19 2019-11-19 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 Active CN111061961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911137480.5A CN111061961B (zh) 2019-11-19 2019-11-19 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911137480.5A CN111061961B (zh) 2019-11-19 2019-11-19 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统

Publications (2)

Publication Number Publication Date
CN111061961A CN111061961A (zh) 2020-04-24
CN111061961B true CN111061961B (zh) 2023-05-26

Family

ID=70297919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911137480.5A Active CN111061961B (zh) 2019-11-19 2019-11-19 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统

Country Status (1)

Country Link
CN (1) CN111061961B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666462B (zh) * 2020-04-28 2021-09-21 百度在线网络技术(北京)有限公司 地理位置的推荐方法、装置、设备和计算机存储介质
CN111680228B (zh) * 2020-06-11 2022-03-18 浙江工商大学 基于地理位置融合和类别流行度的兴趣点推荐方法
CN111523044B (zh) * 2020-07-06 2020-10-23 南京梦饷网络科技有限公司 用于推荐目标对象的方法、计算设备和计算机存储介质
CN111950871B (zh) * 2020-07-30 2023-08-29 中国科学技术大学 一种基于空气质量推断的监测站点位置推荐方法及系统
CN112069415B (zh) * 2020-08-13 2023-11-24 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法
CN112084416A (zh) * 2020-09-21 2020-12-15 哈尔滨理工大学 基于CNN和LSTM的Web服务推荐方法
CN112364238B (zh) * 2020-10-12 2023-04-07 山东大学 一种基于深度学习的用户兴趣点推荐方法与系统
CN112085127A (zh) * 2020-10-26 2020-12-15 安徽大学 一种混合高低阶邻居信息的半监督分类方法
CN113704598B (zh) * 2020-10-29 2024-03-15 南京广电猫猫网络科技有限公司 基于主题多样性的旅游景点动态推荐算法及装置
CN112347254B (zh) * 2020-11-05 2024-02-13 中国平安人寿保险股份有限公司 新闻文本的分类方法、装置、计算机设备和存储介质
CN112417322B (zh) * 2020-12-10 2024-03-22 长春理工大学 一种面向兴趣点名称文本的类型判别方法及系统
CN112905656A (zh) * 2021-01-29 2021-06-04 重庆理工大学 一种融合时序网络的动态社区发现系统
CN112784163B (zh) * 2021-01-29 2023-08-11 东北财经大学 基于RS24的个性化POIs推荐方法
CN112800344B (zh) * 2021-01-29 2022-03-22 重庆邮电大学 一种基于深度神经网络的电影推荐方法
CN112990430B (zh) * 2021-02-08 2021-12-03 辽宁工业大学 基于长短时记忆网络的群组划分方法及系统
CN113536109B (zh) * 2021-06-01 2022-10-21 重庆大学 一种基于神经网络和移动上下文的兴趣点推荐方法
CN113343121B (zh) * 2021-06-02 2022-08-09 合肥工业大学 基于多粒度流行度特征的轻量级图卷积协同过滤推荐方法
CN113722608B (zh) * 2021-07-21 2024-03-22 中国科学院信息工程研究所 迭代副信息指导下基于关联关系学习的协同过滤方法及装置
CN113742597A (zh) * 2021-09-18 2021-12-03 辽宁工程技术大学 一种基于lbsn和多图融合的兴趣点推荐方法
CN113918823A (zh) * 2021-11-02 2022-01-11 中电万维信息技术有限责任公司 一种融合信任关系的排序学习poi推荐算法
CN114564652B (zh) * 2022-04-29 2022-09-27 江西财经大学 基于用户意图与双向偏好的个性化礼物推荐方法与系统
CN114581161B (zh) * 2022-05-06 2022-08-16 深圳市明珞锋科技有限责任公司 一种基于深度学习的信息推送方法和系统
CN115408621B (zh) * 2022-08-12 2023-04-18 中国测绘科学研究院 顾及辅助信息特征线性及非线性交互的兴趣点推荐方法
CN116070034B (zh) * 2023-03-03 2023-11-03 江西财经大学 结合自适应周期与兴趣量因子的图卷积网络推荐方法
CN116089732B (zh) * 2023-04-11 2023-07-04 江西时刻互动科技股份有限公司 基于广告点击数据的用户偏好识别方法及系统
CN117093783A (zh) * 2023-04-12 2023-11-21 浙江卡赢信息科技有限公司 结合用户社交数据的积分兑换智能推荐系统及其方法
CN116915781B (zh) * 2023-09-14 2023-12-12 南京邮电大学 一种基于区块链的边缘协作缓存系统及方法
CN118034844B (zh) * 2024-04-12 2024-06-25 深圳市众悦科技有限公司 一种平板电脑多用户共享界面管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014070293A1 (en) * 2012-11-05 2014-05-08 Nara Logics, Inc. Systems and methods for providing enhanced neural network genesis and recommendations to one or more users
CN105653637A (zh) * 2015-12-28 2016-06-08 苏州大学 一种基于层次结构的兴趣点推荐方法
CN108829761A (zh) * 2018-05-28 2018-11-16 苏州大学 一种兴趣点推荐方法、系统、介质及设备
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN110134885A (zh) * 2019-05-22 2019-08-16 广东工业大学 一种兴趣点推荐方法、装置、设备以及计算机存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646025B2 (en) * 2008-05-27 2017-05-09 Qualcomm Incorporated Method and apparatus for aggregating and presenting data associated with geographic locations
US10235470B2 (en) * 2013-12-06 2019-03-19 Here Global B.V. User retrieval enhancement
US10015629B2 (en) * 2016-07-22 2018-07-03 Anantha Pradeep System and method for facilitating social dining experiences using location information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014070293A1 (en) * 2012-11-05 2014-05-08 Nara Logics, Inc. Systems and methods for providing enhanced neural network genesis and recommendations to one or more users
CN105653637A (zh) * 2015-12-28 2016-06-08 苏州大学 一种基于层次结构的兴趣点推荐方法
CN108829761A (zh) * 2018-05-28 2018-11-16 苏州大学 一种兴趣点推荐方法、系统、介质及设备
CN109241454A (zh) * 2018-07-18 2019-01-18 广东工业大学 一种将社交网络和图像内容融合的兴趣点推荐方法
CN110134885A (zh) * 2019-05-22 2019-08-16 广东工业大学 一种兴趣点推荐方法、装置、设备以及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"GeoTeCS: Exploiting Geographical, Temporal, Categorical and Social Aspects for Personalized POI Recommendation (Invited Paper)";Ramesh Baral等;《2016 IEEE 17th International Conference on Information Reuse and Integration (IRI)》;全文 *
"融合多因素的兴趣点协同推荐方法研究";陈炯等;《计算机科学》;全文 *

Also Published As

Publication number Publication date
CN111061961A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
CN111061961B (zh) 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统
CN109145939B (zh) 一种小目标敏感的双通道卷积神经网络语义分割方法
Lian et al. GeoMF++ scalable location recommendation via joint geographical modeling and matrix factorization
CN109389151B (zh) 一种基于半监督嵌入表示模型的知识图谱处理方法和装置
CN111914622A (zh) 一种基于深度学习的人物交互检测方法
CN113838109B (zh) 一种低重合度点云配准方法
CN107943897B (zh) 一种用户推荐方法
CN111695046B (zh) 基于时空移动数据表征学习的用户画像推断方法及装置
Yang et al. POI neural-rec model via graph embedding representation
Choe et al. Urban structure classification using the 3D normal distribution transform for practical robot applications
Wang et al. Collective geographical embedding for geolocating social network users
CN111738447B (zh) 基于时空关系学习的移动社交网络用户关系推断方法
CN114662015A (zh) 一种基于深度强化学习的兴趣点推荐方法及系统
He et al. Next point-of-interest recommendation via a category-aware Listwise Bayesian Personalized Ranking
Sun et al. Two-stage deep regression enhanced depth estimation from a single RGB image
Fang et al. A top-k POI recommendation approach based on LBSN and multi-graph fusion
CN114254738A (zh) 双层演化的动态图卷积神经网络模型构建方法及应用
Chen et al. Feature extraction method of 3D art creation based on deep learning
Botzheim et al. Extraction of daily life log measured by smart phone sensors using neural computing
CN116229073A (zh) 一种基于改进型ERFNet网络的遥感图像分割方法及装置
Ding et al. Modeling personalized out-of-town distances in location recommendation
CN113536109A (zh) 一种基于神经网络和移动上下文的兴趣点推荐方法
Yan et al. A personalized location recommendation based on convolutional neural network
CN114417166B (zh) 基于行为序列和动态社交影响的连续兴趣点推荐方法
Doan et al. Pacela: A neural framework for user visitation in location-based social networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant