CN113032688A - 针对社交网络用户在未来给定时间的访问位置预测方法 - Google Patents
针对社交网络用户在未来给定时间的访问位置预测方法 Download PDFInfo
- Publication number
- CN113032688A CN113032688A CN202110575135.0A CN202110575135A CN113032688A CN 113032688 A CN113032688 A CN 113032688A CN 202110575135 A CN202110575135 A CN 202110575135A CN 113032688 A CN113032688 A CN 113032688A
- Authority
- CN
- China
- Prior art keywords
- user
- interest
- time
- representation
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 238000003062 neural network model Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 38
- 239000011159 matrix material Substances 0.000 claims description 33
- 230000004927 fusion Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000006855 networking Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 101100001677 Emericella variicolor andL gene Proteins 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000010923 batch production Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000008447 perception Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000020411 cell activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种针对社交网络用户在未来给定时间的访问位置预测方法,其包括如下步骤:获得基于时间窗口敏感的用户隐含偏好表示;获得兴趣点隐含表示;获得地理影响力隐含表示;将用户隐含偏好表示、兴趣点隐含表示、地理影响力隐含表示进行拼接操作,输入多层神经网络计算用户在特定时间窗口针对兴趣点的访问概率;构建目标函数,利用贝叶斯个性化排序对目标函数优化,利用梯度下降算法获得模型参数;利用训练好的多层神经网络模型对目标用户的访问位置进行预测,选取top‑K概率值对应的候选位置形成有序列表,作为最终访问位置预测结果。本发明能够对未来给定时间目标用户的访问位置进行有效预测。
Description
技术领域
本发明涉及一种针对社交网络用户在未来给定时间的访问位置预测方法。
背景技术
移动社交网络是位置与社交的结合,它支持用户随时随地记录并分享自己的地理位置信息,在线上虚拟世界与线下物理空间之间架起了一座桥梁。移动社交网络具有社会化、本地化和移动性等信息服务特征,其产生的海量位置轨迹数据记录了人们在真实物理世界的移动过程,反映了人们的生活与出行习惯,蕴含了极为丰富的时空语义信息。
通过深入分析挖掘移动社交网络中用户位置轨迹,能够发现位置轨迹背后隐藏的各种用户移动行为模式和个人访问偏好,进而预测用户在未来访问的位置,这不仅能为活动推荐与商品精准化营销带来价值,还利于构筑智慧交通与智慧城市,具有重要的现实与社会意义。
在移动社交网络中,用户对于不同位置的访问偏好随自身所处的综合环境发生变化,因而,如何挖掘用户移动行为与语义时空环境之间的深度关联至关重要。
诸多技术借助循环神经网络融合用户短期位置轨迹中的时间、空间特征以洞悉用户即时的访问需求,据此预测用户下一个访问位置,其难点在于捕捉轨迹中各位置的相关性以及用户行为偏好的时序演变规律。部分技术将时间间隔和地理距离通过“门控”的形式融入循环神经网络结构使其具备时空情境感知能力,从而隐式地赋予时间间隔较短、地理距离较近的轨迹更大的权重以刻画用户即时的访问偏好,进而预测用户下一个访问位置。
另外一些技术是将用户轨迹按照时间间隔划分为不同子轨迹,随后将子轨迹逐一输入循环神经网络,通过注意力机制捕捉与当前时间节点用户隐含状态相似的历史轨迹,以感知用户对于时间上下文的偏好,随后基于注意力权重进行轨迹聚合以获悉用户即时的访问需求。
然而,现有技术中基于情境感知的位置预测技术,主要是针对用户下一次移动行为进行访问位置的预测,且多通过间接、隐式地方式刻画用户所处时间上下文,并未对时间因素进行直接、显式地处理,因此,对于给定时间下用户移动偏好的情境感知尚不充分。
可见,现有关于移动社交网络用户在未来指定时间的访问位置预测技术较为匮乏。
用户所处的时空上下文是其选择访问目的地的重要因素,在真实场景下,用户在不同时间、不同地域对访问目的地会产生迥异的选择和需求。由于现有的位置预测技术忽略了用户在特定时间窗口的移动模式与访问偏好,因此难以预测用户在未来指定时间的访问位置。
发明内容
本发明的目的在于提出一种针对社交网络用户在未来给定时间的访问位置预测方法,该方法能够对未来给定时间目标用户的访问位置进行有效预测。
本发明为了实现上述目的,采用如下技术方案:
一种针对社交网络用户在未来给定时间的访问位置预测方法,包括如下步骤:
步骤1. 获得时间窗口敏感的用户隐含偏好表示;
定义用户在移动社交网络中的历史位置轨迹集合为L,集合L中的每一个元素表示用户的一次签到记录,集合L已知,且L={L u |u∈U};
其中,L u 表示用户u的历史位置轨迹;
针对用户u的历史位置轨迹中第i个签到,提取该次签到的时间特征、空间特征以及兴趣点属性特征,依据特征融合的方式获得该次签到的整体语义;
利用注意力机制获得该次签到的注意力权重;
基于注意力权重聚合用户u所有签到记录,获得时间窗口敏感的用户隐含偏好表示;
步骤2. 获得兴趣点隐含表示;
通过特征融合的方式将兴趣点嵌入表示与兴趣点属性向量融合,获得兴趣点隐含表示;
步骤3. 获得地理影响力隐含表示;
利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理影响力隐含表示;
步骤4. 计算用户u在时间窗口t针对兴趣点v的访问概率;
在步骤1至步骤3的基础上,将用户隐含偏好表示、兴趣点隐含表示、地理影响力隐含表示进行拼接操作,输入多层神经网络以计算用户u在时间窗口t针对兴趣点v的访问概率;
步骤5. 对多层神经网络模型进行训练;
在步骤4的基础上构建目标函数,通过贝叶斯个性化排序对目标函数进行优化,利用梯度下降算法获得步骤1至步骤4中涉及的模型参数,从而获得训练好的多层神经网络模型;
步骤6. 利用训练好的多层神经网络模型对目标用户的访问位置进行预测;
在步骤5的基础上,针对目标用户u’以及给定的时间窗口t’,计算该目标用户u’针对不同候选位置v’的访问概率值,然后将得到的访问概率值降序排序;
选取top-K概率值对应的候选位置形成有序列表,作为最终的访问位置预测结果。
优选地,定义移动社交网络用户集合表示为U ={u 1, u 2, …, u M },位置集合表示为V={v 1, v 2, …, v N },时间窗口集合表示为T={t 1, t 2, …, t T };
其中,M表示用户数量,N表示兴趣点数量,T表示时间窗口的数量;
在上述符号定义的基础上,用户u的历史位置轨迹L u 表示为时间有序的四元组集合,L u ={(u,v i ,t i ,r i )| u∈U, v i ∈V, t i ∈T },1≤i≤n,n表示签到的数量;
其中,用户u、兴趣点v i 、签到时间t i 以及数值评分r i 均为离散变量;
上述四元组(u,v i ,t i ,r i )表示用户u在签到时间t i 访问了兴趣点v i ,并给予数值评分r i 。
优选地,所述步骤1具体为:
步骤1.1. 对于用户u历史位置轨迹L u 中第i个签到,依据特征嵌入的方式将用户u、兴趣点v i 、签到时间t i 与数值评分r i 分别嵌入d维连续向量空间,得到离散变量的嵌入表示;
其中,e u ,e vi ,e ti ,e ri 分别表示用户u、兴趣点v i 、时间t i 与数值评分r i 的嵌入表示;
e u ,e vi ,e ti ,e ri ∈R d ,R d 表示d维连续向量空间;
步骤1.2. 为刻画第i个签到的整体语义,依据特征融合的方式将兴趣点v i 、签到时间t i 以及数值评分r i 的嵌入表示利用非线性函数进行融合,公式如下:
x i =g([e vi ⊕e ti ⊕e ri ]);
其中,x i 表示该次签到的整体嵌入表示,⊕表示拼接操作,函数g(·)为非线性融合函数;
步骤1.3. 为刻画用户u对于签到时间t i 的偏好,同样依据特征融合的方式将用户u与签到时间t i 的嵌入表示进行非线性融合,公式如下:
q i = g([e u ⊕e ti ]),其中,q i 表示时间敏感的用户嵌入表示;
步骤1.4.在获得每一次签到的嵌入表示x i 和时间敏感的用户嵌入表示q i 之后,引入注意力机制,通过两层注意力网络计算第i个签到的权重a i ’,权重计算公式如下:
a i ’ =w2 T ·relu(W1·[x i ⊕q i ]+b1)+ b2;
其中,W1与b1分别表示第一层注意力网络的权重矩阵与偏置向量,w2与 b2表示第二层注意力网络的权重向量与偏置值;relu(·)表示线性修正单元激活函数,即relu(x)=max(0,x);
在此基础上,对权重a i ’进行归一化处理,归一化计算公式如下:
a i =exp(a i ’) / (∑1≤j≤n exp(a j ’)),其中,a i 表示归一化处理之后的权重值;
步骤1.5. 将用户u历史签到信息进行非线性聚合,获得用户隐含偏好表示h u ,即:
h u =σ(W u ·{∑1≤i≤n a i x i }+b u );
其中,W u 与b u 分别表示非线性聚合层的权重矩阵与偏置向量,σ(·)为非线性激活函数。
优选地,步骤2具体为:
定义兴趣点属性向量为f vi ;
依据特征融合的方式将兴趣点嵌入表示e vi 与兴趣点属性向量f vi 非线性融合,公式如下:
h v = g([e vi ⊕f vi ]),其中,h v 为兴趣点隐含表示。
优选地,步骤3具体为:
步骤3.1. 利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理因子矩阵K,K∈R N×N ,R N×N 表示N×N维的矩阵;
其中,z i 表示兴趣点v i 的地理坐标,z j 表示兴趣点v j 的地理坐标,γ为平滑因子;
步骤3.2. 根据用户u访问过的兴趣点集合,对地理因子矩阵K进行切片操作,以获得用户u的地理因子矩阵K[L u ]∈R |Lu|×|Lu| ;
其中,R |Lu|×|Lu| 表示|L u |×|L u |维的矩阵,L u 为用户u访问过的兴趣点集合;
在此基础上,获得兴趣点集合L u 针对当前兴趣点v的地理因子向量K[L u ] v ∈R |Lu| ;
步骤3.3. 对地理因子向量K[L u ] v 进行非线性映射,求得地理影响力隐含表示h g ,即:
h g =σ([Wg·K[L u ] v ]+bg);
其中,Wg与bg分别表示非线性映射层的权重矩阵与偏置向量。
优选地,步骤4具体为:
将用户隐含偏好表示h u 、兴趣点隐含表示h v 、地理影响力隐含表示h g 进行拼接操作,输入多层神经网络以计算用户u在时间窗口t针对兴趣点v的访问概率,计算过程如下:
l 1=[ h u ⊕h v ⊕h g ];
l 2=ψ(l 1);
…
l m =ψ(l m-1);
s uvt =w m T ·l m + b m ;
其中,m表示神经网络层数,ψ(·)表示非线性激活函数,w m 与b m 分别表示最后一层线性网络的权重向量与偏置值,s uvt 表示用户u在时间t针对兴趣点v的访问概率值。
优选地,步骤5具体为:
通过贝叶斯个性化排序对目标函数进行优化,优化后的目标函数L bpr 表示为:
其中, R u 表示用户u的训练样本集合,根据移动社交网中用户u的历史签到记录获得;
(u,v +,t)为正例样本,(u,v +,t)的含义为用户u在时间t访问了位置v +;
s(u,v + ,t)表示用户u在时间t针对位置v + 的访问概率;
(u,v -,t)为负例样本,(u,v -,t)的含义为用户u在时间t未访问位置v -;
s(u,v - ,t)表示用户u在时间t针对位置v - 的访问概率;
δ(·)表示sigmoid函数,θ为模型参数集合,ε表示正则化项系数;
模型训练过程中最小化目标函数L bpr ,采用自适应矩估计算法完成梯度下降的自主步长学习,获得步骤1至步骤4中涉及的模型参数,从而得到训练好的多层神经网络模型。
本发明具有如下优点:
如上所述,本发明述及了一种针对社交网络用户在未来给定时间的访问位置预测方法,该方法将情境视作语义与时空上下文进行复合,基于用户历史位置轨迹中的时间、地点与评分信息,依据深度特征提取与融合思想自底向上逐步刻画用户-位置交互过程;特别地,为学习用户在不同时间窗口的交互偏好,本发明通过注意力机制捕捉用户历史交互记录中的相似情境,利于提高用户对于不同时间窗口的感知能力,本发明提出的方法强化了针对时间窗口的语义时空情境感知能力,因而能够对未来给定时间目标用户的访问位置进行有效预测。
附图说明
图1为本发明针对社交网络用户在未来给定时间的访问位置预测方法的流程示意图;
图2为本发明要解决的目标用户在未来给定时间的访问位置预测问题示意图;
图3为本发明针对社交网络用户在未来给定时间的访问位置预测方法的总体框图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
本发明述及了一种针对社交网络用户在未来给定时间的访问位置预测方法,该方法能够有效地预测移动社交网络用户u在未来给定时间t的访问位置,如图2所示。
需要说明的是,本发明可以实现兴趣点级别的访问位置预测,例如餐厅、影院或酒店等细粒度地理区域,如无特殊说明,下文所述“位置”均指细粒度的兴趣点。
在对本发明方法进行说明之前,首先给出如下定义:
定义用户在移动社交网络中的历史位置轨迹集合为L,集合L中的每一个元素表示用户的一次签到记录。集合L已知,且L={L u |u∈U}。
用户在移动社交网络中的历史位置轨迹L可以通过公开的接口程序(API)进行抓取。
其中,L u 表示用户u的历史位置轨迹,即历史签到记录集合。
下面对本发明提出的针对社交网络用户在未来给定时间的访问位置预测方法进行详细说明,如图1所示,该访问位置预测方法包括如下步骤:
步骤1. 用户-兴趣点交互建模,获得时间窗口敏感的用户隐含偏好表示。
针对用户u的历史位置轨迹中第i个签到,提取该次签到的时间特征、空间特征以及兴趣点属性特征,依据特征融合的方式获得该次签到的整体语义。
其中,时间特征是与该次签到的时间窗口相关的特征,空间特征是与用户位置轨迹的地域范围相关的特征,兴趣点属性特征是与位置的文字描述或评分信息相关的特征。
为强化针对特定时间窗口的情境感知能力,本发明还采用注意力机制捕获用户历史轨迹中的重要签到行为,得到该次签到的注意力权重,以使用户对历史签到行为具有感知能力。
本发明融合时空上下文、评分信息等多维特征,有效缓解了移动社交网络数据的稀疏性。为了方便描述,首先给出各个参量的物理表示。
定义移动社交网络用户集合表示为U ={u 1, u 2, …, u M },位置集合表示为V={v 1,v 2, …, v N },时间窗口集合表示为T={t 1, t 2, …, t T };
其中,M表示用户数量,N表示兴趣点数量,T表示时间窗口的数量。
在上述符号定义的基础上,用户u的历史位置轨迹L u 表示为时间有序的四元组集合,L u ={(u,v i ,t i ,r i )| u∈U, v i ∈V, t i ∈T },1≤i≤n,n表示签到的数量。
其中,用户u、兴趣点v i 、签到时间t i 均为离散变量。另外,由于移动社交平台常采用1-5分的评分体系,此时,r i ∈{1,2,3,4,5},因此,r i 同样为离散变量。
上述四元组(u,v i ,t i ,r i )的含义为用户u在签到时间t i 访问了兴趣点v i 并给予数值评分r i 。
该步骤1的具体实施方式为:
步骤1.1. 对于用户u历史位置轨迹L u 中第i个签到,依据特征嵌入的方式将用户u、兴趣点v i 、签到时间t i 与数值评分r i 分别嵌入d维连续向量空间,得到离散变量的嵌入表示。
其中,e u ,e vi ,e ti ,e ri 分别表示用户u、兴趣点v i 、时间t i 与数值评分r i 的嵌入表示。
e u ,e vi ,e ti ,e ri ∈R d ,R d 表示d维连续向量空间。
步骤1.2. 为刻画第i个签到的整体语义,依据特征融合的方式将兴趣点v i 、签到时间t i 以及数值评分r i 的嵌入表示利用非线性函数进行融合,公式如下:
x i =g([e vi ⊕e ti ⊕e ri ]);
其中,x i 表示该次签到的整体嵌入表示,不仅包含时间与位置信息,还蕴含了用户对于兴趣点的情感或评价,⊕表示拼接操作,函数g(·)为非线性融合函数。
步骤1.3. 为刻画用户u对于签到时间t i 的偏好,同样依据特征融合的方式,将用户u与签到时间t i 的嵌入表示进行非线性融合,公式如下:
q i = g([e u ⊕e ti ]),其中,q i 表示时间敏感的用户嵌入表示。
步骤1.4. 在获得每一次签到的整嵌入表示x i 和用户嵌入表示q i 后,为使用户对历史访问行为具有感知能力,引入注意力机制刻画每一次签到行为的重要性。
具体地,通过两层注意力网络计算第i个签到的权重a i ’,权重计算公式如下:
a i ’ =w2 T ·relu(W1·[x i ⊕q i ]+b1)+b 2。
其中,W1与b1分别表示第一层注意力网络的权重矩阵与偏置向量,w2与 b2表示第二层注意力网络的权重向量与偏置值;relu(·)表示线性修正单元激活函数,即relu(x)=max(0,x)。
在此基础上,对权重a i ’进行归一化处理,归一化计算公式如下:
a i =exp(a i ’) / (∑1≤j≤n exp(a j ’));
其中,a i 表示归一化处理之后的权重值。
步骤1.5. 将用户u历史签到信息进行非线性聚合,获得用户隐含偏好表示h u ,即:
h u =σ(W u ·{∑1≤i≤n a i x i }+b u );
其中,W u 与b u 分别表示非线性聚合层的权重矩阵与偏置向量;
σ(·)为非线性激活函数,例如线性修正单元激活函数。
步骤1通过捕捉用户历史签到记录中特定时间窗口的移动模式与访问偏好,使得用户对历史访问行为具有感知能力,进而能够推测目标用户在未来给定时间窗口内的行为意图。
步骤2. 兴趣点属性建模,获得兴趣点隐含表示。
通过特征融合的方式将兴趣点嵌入表示与兴趣点属性向量融合,获得兴趣点隐含表示。
移动社交网络中,兴趣点除位置类别属性之外,一般还拥有其他属性信息,比如用户在此处发表的评分、评论以及图片等内容,本实施例以数值化评分作为兴趣点属性。
假设兴趣点v i 共拥有m条评分,第j条评分的向量表示为r j vi ,选取兴趣点v i 所有评分向量的平均值作为兴趣点属性向量f vi ,即兴趣点属性向量f vi= ∑1≤j≤m r j vi / m。
在此基础上,依据特征融合的方式将兴趣点嵌入表示e vi 与兴趣点属性向量f vi 进行非线性融合,公式如下:h v = g([e vi ⊕ f vi ])。其中,h v 为兴趣点隐含表示。
步骤3. 地理影响力建模,获得地理影响力隐含表示。
以核密度估计的方式衡量任意两个兴趣点之间的地理影响力。具体地,本发明利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理影响力隐含表示。
步骤3具体为:
步骤3.1. 利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理因子矩阵K,K∈R N×N ,R N×N 表示N×N维矩阵。
其中,z i 表示兴趣点v i 的地理坐标,z j 表示兴趣点v j 的地理坐标,γ为平滑因子。
步骤3.2. 根据用户u访问过的兴趣点集合,对地理因子矩阵K进行切片操作,以获得用户u的地理因子矩阵K[L u ]∈R |Lu|×|Lu| 。
其中,R |Lu|×|Lu| 表示 | L u |×|L u |维矩阵,L u 为用户u访问过的兴趣点集合。
在此基础上,获得兴趣点集合L u 针对当前兴趣点v的地理因子向量K[L u ] v ∈R |Lu| 。
步骤3.3. 对地理因子向量K[L u ] v 进行非线性映射,求得地理影响力隐含表示h g ,即:
h g =σ([Wg·K[L u ] v ]+bg);
其中,Wg与bg分别表示非线性映射层的权重矩阵与偏置向量。
在上述过程中,本发明针对用户的每一次签到行为,从语义时空情境感知的角度出发,融合时间、地理、情感因素,自底向上逐步刻画用户-位置交互过程。
步骤4. 计算用户u在时间窗口t针对兴趣点v的访问概率。
在步骤1至步骤3的基础上,将用户隐含偏好表示、兴趣点隐含表示、地理影响力隐含表示进行拼接操作,输入多层神经网络以计算用户u在时间窗口t针对兴趣点v的访问概率。
其计算过程如下:
l 1=[ h u ⊕h v ⊕h g ];
l 2=ψ(l 1);
…
l m =ψ(l m-1);
s uvt =w m T ·l m + b m ;
其中,m表示神经网络层数,ψ(·)表示非线性激活函数,w m 与b m 分别表示最后一层线性网络的权重向量与偏置值,s uvt 表示用户u在时间t针对兴趣点v的访问概率值。
步骤5. 对多层神经网络模型进行训练。
本发明将情境感知的用户访问位置预测问题视作排序问题。
在步骤4的基础上构建目标函数,通过贝叶斯个性化排序对目标函数进行优化,利用梯度下降算法获得步骤1至步骤4中涉及的模型参数,获得训练好的多层神经网络模型。
其中,上述涉及的模型参数包括注意力网络的权值、神经网络的权值与偏置值等等。
通过贝叶斯个性化排序对目标函数进行优化,优化后的目标函数L bpr 表示为:
其中, R u 表示用户u的训练样本集合,根据移动社交网中用户u的历史签到记录获得。
(u,v +,t)为正例样本,(u,v +,t)的含义为用户u在时间t访问了位置v +;s(u,v + ,t)表示时间敏感的评分函数,其含义是用户u在时间t针对位置v + 的访问概率;
(u,v -,t)为负例样本,(u,v -,t)的含义为用户u在时间t未访问位置v -;s(u,v - ,t)表示时间敏感的评分函数,其含义是用户u在时间t针对位置v - 的访问概率;
δ(·)表示sigmoid函数,其作用是将输入值映射到[0,1]区间。
θ为模型参数集合,其包括步骤1至步骤4中所有的模型参数,例如W1与b1、w2与b 2 、W u 与b u 、Wg与bg、w m 与b m 等,ε表示正则化项系数,用于防止过拟合(Over-fitting)。
模型训练过程中最小化目标函数L bpr ,采用自适应矩估计算法(Adam)完成梯度下降的自主步长学习,获得步骤1至步骤4中涉及的模型参数,从而得到训练好的多层神经网络模型。
针对每个正例样本(u,v +,t),需要采样多个负例样本(u,v -,t),并且训练过程的每一次循环均重新进行负样本采样。在该采样方式下,虽然负例样本的规模是正例样本的若干倍,但每个负例样本给出的“负信号”较为微弱,可保证训练的高效率和有效性。
本发明方法基于贝叶斯个性化排序思想学习时间敏感的评分函数s(u,v,t),计算用户针对不同位置的访问概率,从而能够预测用户在未来给定时间的访问位置。
步骤6. 利用训练好的多层神经网络模型对目标用户的访问位置进行预测。
在步骤5的基础上,针对目标用户u’以及给定的时间窗口t’,代入图3所示的训练好的多层神经网络模型,自底向上计算该目标用户u’针对不同候选位置v’的访问概率值。
然后,将得到的访问概率值降序排序。
最后,选取top-K概率值对应的候选位置形成有序列表,作为最终的访问位置预测结果。
本发明自底向上逐步刻画用户-位置交互过程,通过评分函数量化用户在未来给定时间针对不同候选位置的访问概率,从而实现用户在未来给定时间条件下的访问位置预测。
当然,以上说明仅仅为本发明的较佳实施例,本发明并不限于列举上述实施例,应当说明的是,任何熟悉本领域的技术人员在本说明书的教导下,所做出的所有等同替代、明显变形形式,均落在本说明书的实质范围之内,理应受到本发明的保护。
Claims (7)
1.一种针对社交网络用户在未来给定时间的访问位置预测方法,其特征在于,
包括如下步骤:
步骤1. 获得时间窗口敏感的用户隐含偏好表示;
定义用户在移动社交网络中的历史位置轨迹集合为L,集合L中的每一个元素表示用户的一次签到记录,集合L已知,且L={L u |u∈U};
其中,L u 表示用户u的历史位置轨迹;
针对用户u的历史位置轨迹L u 中第i个签到,提取该次签到的时间特征、空间特征以及兴趣点属性特征,依据特征融合的方式获得该次签到的整体语义;
利用注意力机制获得该次签到的注意力权重;
基于注意力权重聚合用户u的所有签到记录,获得时间窗口敏感的用户隐含偏好表示;
步骤2. 获得兴趣点隐含表示;
通过特征融合的方式将兴趣点嵌入表示与兴趣点属性向量融合,获得兴趣点隐含表示;
步骤3. 获得地理影响力隐含表示;
利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理影响力隐含表示;
步骤4. 计算用户u在时间窗口t针对兴趣点v的访问概率;
在步骤1至步骤3的基础上,将用户隐含偏好表示、兴趣点隐含表示、地理影响力隐含表示进行拼接操作,输入多层神经网络以计算用户u在时间窗口t针对兴趣点v的访问概率;
步骤5. 对多层神经网络模型进行训练;
在步骤4的基础上构建目标函数,通过贝叶斯个性化排序对目标函数进行优化,利用梯度下降算法获得步骤1至步骤4中涉及的模型参数,从而获得训练好的多层神经网络模型;
步骤6. 利用训练好的多层神经网络模型对目标用户的访问位置进行预测;
在步骤5的基础上,针对目标用户u’以及给定的时间窗口t’,计算该目标用户u’针对不同候选位置v’的访问概率值,然后将得到的访问概率值进行降序排序;
选取top-K概率值对应的候选位置形成有序列表,作为最终的访问位置预测结果。
2.根据权利要求1所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,定义移动社交网络用户集合表示为U ={u 1, u 2, …, u M },位置集合表示为V={v 1, v 2, …, v N },时间窗口集合表示为T={t 1, t 2, …, t T };
其中,M表示用户数量,N表示兴趣点数量,T表示时间窗口的数量;
在上述符号定义的基础上,用户u的历史位置轨迹L u 表示为时间有序的四元组集合,即L u ={(u,v i ,t i ,r i )| u∈U, v i ∈V, t i ∈T },1≤i≤n,n表示签到的数量;
其中,用户u、兴趣点v i 、签到时间t i 以及数值评分r i 均为离散变量;
上述四元组(u,v i ,t i ,r i )的含义为用户u在签到时间t i 访问了兴趣点v i 并给予数值评分r i 。
3.根据权利要求2所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,所述步骤1具体为:
步骤1.1. 对于用户u历史位置轨迹L u 中第i个签到,依据特征嵌入的方式将用户u、兴趣点v i 、签到时间t i 与数值评分r i 分别嵌入d维连续向量空间,得到离散变量的嵌入表示;
其中,e u ,e vi ,e ti ,e ri 分别表示用户u、兴趣点v i 、时间t i 与数值评分r i 的嵌入表示;
e u ,e vi ,e ti ,e ri ∈R d ,R d 表示d维连续向量空间;
步骤1.2. 为刻画第i个签到的整体语义,依据特征融合的方式将兴趣点v i 、签到时间t i 以及数值评分r i 的嵌入表示利用非线性函数进行融合,公式如下:
x i =g([e vi ⊕e ti ⊕e ri ]);
其中,x i 表示该次签到的整体嵌入表示,⊕表示拼接操作,函数g(·)为非线性融合函数;
步骤1.3. 为刻画用户u对于签到时间t i 的偏好,同样依据特征融合的方式将用户u与签到时间t i 的嵌入表示进行非线性融合,公式如下:
q i = g([e u ⊕e ti ]),其中,q i 表示时间敏感的用户嵌入表示;
步骤1.4.在获得每一次签到的整体嵌入表示x i 和时间敏感的用户嵌入表示q i 之后,引入注意力机制,通过两层注意力网络计算第i个签到的权重a i ’,权重计算公式如下:
a i ’ =w2 T ·relu(W1·[x i ⊕q i ]+b1)+ b2;
其中,W1与b1分别表示第一层注意力网络的权重矩阵与偏置向量,w2与 b2表示第二层注意力网络的权重向量与偏置值;relu(·)表示线性修正单元激活函数,即relu(x)=max(0,x);
在此基础上,对权重a i ’进行归一化处理,归一化计算公式如下:
a i =exp(a i ’) / (∑1≤j≤n exp(a j ’)),其中,a i 表示归一化处理之后的权重值;
步骤1.5. 将用户u历史签到记录进行非线性聚合,获得用户隐含偏好表示h u ,即:
h u =σ(W u ·{∑1≤i≤n a i x i }+b u );
其中,W u 与b u 分别表示非线性聚合层的权重矩阵与偏置向量,σ(·)为非线性激活函数。
4.根据权利要求3所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,所述步骤2具体为:
定义兴趣点属性向量为f vi ;
依据特征融合的方式将兴趣点嵌入表示e vi 与兴趣点属性向量f vi 非线性融合,公式如下:
h v = g([e vi ⊕f vi ]),其中,h v 为兴趣点隐含表示。
5.根据权利要求4所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,所述步骤3具体为:
步骤3.1. 利用高斯核函数计算任意两个兴趣点之间的地理因子,获得地理因子矩阵K,K∈R N×N ,其中,R N×N 表示N×N维的矩阵;
其中,z i 表示兴趣点v i 的地理坐标,z j 表示兴趣点v j 的地理坐标,γ为平滑因子;
步骤3.2. 根据用户u访问过的兴趣点集合,对地理因子矩阵K进行切片操作,以获得用户u的地理因子矩阵K[L u ]∈R |Lu|×|Lu| ;
其中,R |Lu|×|Lu| 表示|L u |×|L u |维的矩阵,L u 为用户u访问过的兴趣点集合;
在此基础上,获得兴趣点集合L u 针对当前兴趣点v的地理因子向量K[L u ] v ∈R |Lu| ;
步骤3.3. 对地理因子向量K[L u ] v 进行非线性映射,求得地理影响力隐含表示h g ,即:
h g =σ([Wg·K[L u ] v ]+bg);
其中,Wg与bg分别表示非线性映射层的权重矩阵与偏置向量。
6.根据权利要求5所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,所述步骤4具体为:
将用户隐含偏好表示h u 、兴趣点隐含表示h v 、地理影响力隐含表示h g 进行拼接操作,输入多层神经网络以计算用户u在时间窗口t针对兴趣点v的访问概率,计算过程如下:
l 1=[ h u ⊕h v ⊕h g ];
l 2=ψ(l 1);
…
l m =ψ(l m-1);
s uvt =w m T ·l m + b m ;
其中,m表示神经网络层数,ψ(·)表示非线性激活函数,w m 与b m 分别表示最后一层线性网络的权重向量与偏置值,s uvt 表示用户u在时间t针对兴趣点v的访问概率值。
7.根据权利要求6所述的针对社交网络用户在未来给定时间的访问位置预测方法,
其特征在于,所述步骤5具体为:
通过贝叶斯个性化排序对目标函数进行优化,优化后的目标函数L bpr 表示为:
其中,R u 表示用户u的训练样本集合,根据移动社交网中用户u的历史签到记录获得;
(u,v +,t)为正例样本,(u,v +,t)的含义为用户u在时间t访问了位置v +;
s(u,v + ,t)表示用户u在时间t针对位置v + 的访问概率;
(u,v -,t)为负例样本,(u,v -,t)的含义为用户u在时间t未访问位置v -;
s(u,v - ,t)表示用户u在时间t针对位置v - 的访问概率;
δ(·)表示sigmoid函数,θ为模型参数集合,ε表示正则化项系数;
模型训练过程中最小化目标函数L bpr ,采用自适应矩估计算法完成梯度下降的自主步长学习,获得步骤1至步骤4中涉及的模型参数,从而得到训练好的多层神经网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575135.0A CN113032688B (zh) | 2021-05-26 | 2021-05-26 | 针对社交网络用户在未来给定时间的访问位置预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575135.0A CN113032688B (zh) | 2021-05-26 | 2021-05-26 | 针对社交网络用户在未来给定时间的访问位置预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113032688A true CN113032688A (zh) | 2021-06-25 |
CN113032688B CN113032688B (zh) | 2021-08-24 |
Family
ID=76455833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110575135.0A Active CN113032688B (zh) | 2021-05-26 | 2021-05-26 | 针对社交网络用户在未来给定时间的访问位置预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032688B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444794A (zh) * | 2022-01-22 | 2022-05-06 | 重庆大学 | 基于双注意力图嵌入网络的出行意图预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928993A (zh) * | 2019-11-26 | 2020-03-27 | 重庆邮电大学 | 基于深度循环神经网络的用户位置预测方法及系统 |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
-
2021
- 2021-05-26 CN CN202110575135.0A patent/CN113032688B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110928993A (zh) * | 2019-11-26 | 2020-03-27 | 重庆邮电大学 | 基于深度循环神经网络的用户位置预测方法及系统 |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
Non-Patent Citations (2)
Title |
---|
SHUAI XU 等: "Survey on user location prediction based on geo-social networking data", 《SPRINGER》 * |
SHUAI XU 等: "Venue2Vec: An Efficient Embedding Model for Fine-Grained User Location Prediction in Geo-Social Networks", 《EEE SYSTEMS JOURNAL》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114444794A (zh) * | 2022-01-22 | 2022-05-06 | 重庆大学 | 基于双注意力图嵌入网络的出行意图预测方法 |
CN114444794B (zh) * | 2022-01-22 | 2024-05-14 | 重庆大学 | 基于双注意力图嵌入网络的出行意图预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113032688B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241419B (zh) | 一种基于用户关系嵌入模型的下一个兴趣点推荐方法 | |
CN114897444B (zh) | 一种城市分区域内服务设施需求识别方法及系统 | |
CN110334293B (zh) | 面向位置社交网络的基于模糊聚类的具有时间感知的位置推荐方法 | |
CN109062962B (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN112365708B (zh) | 基于多图卷积网络的景区交通量预测模型建立和预测方法 | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
CN111209475A (zh) | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 | |
CN107689052A (zh) | 基于多模型融合和结构化深度特征的视觉目标跟踪方法 | |
CN111915104A (zh) | 一种预测出行位置的方法及装置 | |
CN111680228B (zh) | 基于地理位置融合和类别流行度的兴趣点推荐方法 | |
CN114444794B (zh) | 基于双注意力图嵌入网络的出行意图预测方法 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN111695737A (zh) | 一种基于lstm神经网络的群目标行进趋势预测方法 | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
CN115982468A (zh) | 一种结合用户周期性偏好和短期兴趣的兴趣点推荐方法 | |
CN116244513A (zh) | 随机群组poi推荐方法、系统、设备及存储介质 | |
CN108364098B (zh) | 一种天气特征对用户签到影响的度量方法 | |
CN114662015A (zh) | 一种基于深度强化学习的兴趣点推荐方法及系统 | |
CN117271899A (zh) | 一种基于时空感知的兴趣点推荐方法 | |
WO2023178608A1 (zh) | 一种基于多源异构信息网络的目的地推荐方法及系统 | |
CN113032688B (zh) | 针对社交网络用户在未来给定时间的访问位置预测方法 | |
CN115774819A (zh) | 一种基于层次循环神经网络的兴趣点推荐方法及系统 | |
CN115952355A (zh) | 基于时空幂律注意力的下一兴趣点推荐系统 | |
Liao et al. | A bi-direction LSTM attention fusion model for the missing POI identification | |
Zhong | A convolutional neural network based online teaching method using edge-cloud computing platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |