CN110222278B

CN110222278B - 综合因素下用户位置的获取方法

Info

Publication number: CN110222278B
Application number: CN201910528742.4A
Authority: CN
Inventors: 赵相国; 袁野; 孙永佼; 吴希颖; 景国香; 程高云
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2019-06-18
Filing date: 2019-06-18
Publication date: 2022-05-17
Anticipated expiration: 2039-06-18
Also published as: CN110222278A

Abstract

本发明公开了综合因素下用户位置的获取方法，包括如下步骤：S1、对数据集整理分析的结果，拟合出用户移动距离与概率间的函数分布式，并通过出行距离的调和平均数体现用户特性；S2、计算用户位置访问概率函数，并且使用采样的邻居节点法拟合泊松分布；S3、拟合用户地点访问概率函数，并且输出结果，本发明结构科学合理，使用安全方便，通过对数据的观察分析，我们得到了泊松分布能很好的反应用户移动模式的结论，并在分析现实情况后，在泊松分布的基础上，加入调和因子，得到了用户位置访问概率函数，由于用户位置访问概率函数综合的考虑了个人与全局因素，故能良好的反应真实的出行意向，从而便于了用户位置的获取，便于其出行位置的了解。

Description

综合因素下用户位置的获取方法

技术领域

本发明涉及用户位置的获取技术领域，具体为综合因素下用户位置的获取方法。

背景技术

社交网络中基于位置的影响最大化问题的研究，偏向于人类行为学，研究需要立足于大量且真实有效的用户信息数据，研究最终得到的结果，才能真实有效符合现实。

需要发掘用户地理位置签到数据中隐藏的行为规律，需要研究社交网络中，如何表述单一用户的影响力大小，从而便于获取用户的位置信息。

发明内容

本发明提供综合因素下用户位置的获取方法，可以有效解决上述背景技术中提出需要发掘用户地理位置签到数据中隐藏的行为规律，需要研究社交网络中，如何表述单一用户的影响力大小，从而便于获取用户的位置信息的问题。

为实现上述目的，本发明提供如下技术方案：综合因素下用户位置的获取方法，包括如下步骤：

S1、对数据集整理分析的结果，拟合出用户移动距离与概率间的函数分布式，并通过出行距离的调和平均数体现用户特性；

S2、计算用户位置访问概率函数，并且使用采样的邻居节点法拟合泊松分布；

S3、拟合用户地点访问概率函数，并且输出结果。

根据上述技术方案，所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式，并且进行如下操作步骤：

A1、给定一用户u₁，其签到集合为

对

中的签到数据按签到时间进行排序，得到用户的顺序签到序列

根据公式

(单位为km，保留2位有效数字)，计算出

中用户顺序时间间隔内，签到点间的间距，得到用户u₁的出行间距集

A2、分别为用户计算完出行距离集后，我们得到了所有用户的出行间距集

然后把用户的出行间距进行合并，算出每个具体数值出现的数目，得到出行间距数目表DN＝(dn₁,dn₂,...dn_n)，其中每一项dn_i＝(d_i,num)，其中d_i为距离，num为数目。

根据上述技术方案，所述步骤A2中根据如下公式进行计算:

计算出每个距离对应的出现概率

根据上述技术方案，所述步骤S1中计算出用户出行距离的调和平均数C：

式子中的n表示用户出行距离数据集中的元素个数。

根据上述技术方案，所述步骤S2中拥有调和平均数后，通过公式：

给出的调和因子fa，来描述用户自身与全局数据之间的关系；

使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。

根据上述技术方案，所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr)：

式中的Δr表示最新一条用户签到点与新地点间的欧式距离。

根据上述技术方案，所述步骤S2中使用采样的邻居节点法拟合泊松分布，保证样本数量为n采样事件中，所得结果e的近似误差大于ε的概率小于δ；n、ε、δ需要满足如下公式：

根据上述技术方案，令

我们有：

根据上述技术方案，所述步骤S3中拟合用户访问概率步骤如下：

B1、从U个用户的N个邻居节点中采集移动距离数据DN；

B2、计算Pd期望λ，用户移动距离调和平均数C得到Pr；

B3、计算地点L与用户U之间最新签到点间的距离r；

B4、将r带入p(Δr)中，得到用户位置访问地点的概率P。

根据上述技术方案，所述步骤S4中输出结果记录后制表进行比较。

与现有技术相比，本发明的有益效果：本发明结构科学合理，使用安全方便，通过对数据的观察分析，我们得到了泊松分布能很好的反应用户移动模式的结论，并在分析现实情况后，在泊松分布的基础上，加入调和因子，得到了用户位置访问概率函数，由于用户位置访问概率函数综合的考虑了个人与全局因素，故能良好的反应真实的出行意向，从而便于了用户位置的获取，便于其出行位置的了解。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

在附图中：

图1是本发明的步骤流程示意图；

图2是本发明的泊松分布步骤示意图；

图3是本发明的拟合用户访问概率步骤示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例：如图1-3所示，本发明提供技术方案，综合因素下用户位置的获取方法，包括如下步骤：

S3、拟合用户地点访问概率函数，并且输出结果。

根据上述技术方案，步骤S1中对数据集整理分析使用泊松分布描述用户出行模式，并且进行如下操作步骤：

A1、给定一用户u₁，其签到集合为

对

根据公式

(单位为km，保留2位有效数字)，计算出

根据上述技术方案，步骤A2中根据如下公式进行计算:

计算出每个距离对应的出现概率

根据上述技术方案，步骤S1中计算出用户出行距离的调和平均数C：

式子中的n表示用户出行距离数据集中的元素个数。

根据上述技术方案，步骤S2中拥有调和平均数后，通过公式：

根据上述技术方案，fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr)：

式中的Δr表示最新一条用户签到点与新地点间的欧式距离。

根据上述技术方案，步骤S2中使用采样的邻居节点法拟合泊松分布，保证样本数量为n采样事件中，所得结果e的近似误差大于ε的概率小于δ；n、ε、δ需要满足如下公式：

根据上述技术方案，令

我们有：

根据上述技术方案，步骤S3中拟合用户访问概率步骤如下：

B1、从U个用户的N个邻居节点中采集移动距离数据DN；

B2、计算Pd期望λ，用户移动距离调和平均数C得到Pr；

B3、计算地点L与用户U之间最新签到点间的距离r；

B4、将r带入p(Δr)中，得到用户位置访问地点的概率P。

根据上述技术方案，步骤S4中输出结果记录后制表进行比较。

最后应说明的是：以上所述仅为本发明的优选实例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。