CN110222278B - 综合因素下用户位置的获取方法 - Google Patents

综合因素下用户位置的获取方法 Download PDF

Info

Publication number
CN110222278B
CN110222278B CN201910528742.4A CN201910528742A CN110222278B CN 110222278 B CN110222278 B CN 110222278B CN 201910528742 A CN201910528742 A CN 201910528742A CN 110222278 B CN110222278 B CN 110222278B
Authority
CN
China
Prior art keywords
user
distance
check
fitting
poisson distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910528742.4A
Other languages
English (en)
Other versions
CN110222278A (zh
Inventor
赵相国
袁野
孙永佼
吴希颖
景国香
程高云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910528742.4A priority Critical patent/CN110222278B/zh
Publication of CN110222278A publication Critical patent/CN110222278A/zh
Application granted granted Critical
Publication of CN110222278B publication Critical patent/CN110222278B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了综合因素下用户位置的获取方法,包括如下步骤:S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;S3、拟合用户地点访问概率函数,并且输出结果,本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。

Description

综合因素下用户位置的获取方法
技术领域
本发明涉及用户位置的获取技术领域,具体为综合因素下用户位置的获取方法。
背景技术
社交网络中基于位置的影响最大化问题的研究,偏向于人类行为学,研究需要立足于大量且真实有效的用户信息数据,研究最终得到的结果,才能真实有效符合现实。
需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息。
发明内容
本发明提供综合因素下用户位置的获取方法,可以有效解决上述背景技术中提出需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息的问题。
为实现上述目的,本发明提供如下技术方案:综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为
Figure GDA0003053401000000021
Figure GDA0003053401000000022
中的签到数据按签到时间进行排序,得到用户的顺序签到序列
Figure GDA0003053401000000023
根据公式
Figure GDA0003053401000000024
(单位为km,保留2位有效数字),计算出
Figure GDA0003053401000000025
中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
Figure GDA0003053401000000026
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集
Figure GDA0003053401000000027
然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),其中di为距离,num为数目。
根据上述技术方案,所述步骤A2中根据如下公式进行计算:
Figure GDA0003053401000000028
计算出每个距离对应的出现概率
Figure GDA0003053401000000029
根据上述技术方案,所述步骤S1中计算出用户出行距离的调和平均数C:
Figure GDA00030534010000000210
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,所述步骤S2中拥有调和平均数后,通过公式:
Figure GDA0003053401000000031
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
Figure GDA0003053401000000032
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
Figure GDA0003053401000000033
根据上述技术方案,令
Figure GDA0003053401000000034
我们有:
Figure GDA0003053401000000035
根据上述技术方案,所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入p(Δr)中,得到用户位置访问地点的概率P。
根据上述技术方案,所述步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明的步骤流程示意图;
图2是本发明的泊松分布步骤示意图;
图3是本发明的拟合用户访问概率步骤示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1-3所示,本发明提供技术方案,综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为
Figure GDA0003053401000000051
Figure GDA0003053401000000052
中的签到数据按签到时间进行排序,得到用户的顺序签到序列
Figure GDA0003053401000000053
根据公式
Figure GDA0003053401000000054
(单位为km,保留2位有效数字),计算出
Figure GDA0003053401000000055
中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
Figure GDA0003053401000000056
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集
Figure GDA0003053401000000057
然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),其中di为距离,num为数目。
根据上述技术方案,步骤A2中根据如下公式进行计算:
Figure GDA0003053401000000058
计算出每个距离对应的出现概率
Figure GDA0003053401000000059
根据上述技术方案,步骤S1中计算出用户出行距离的调和平均数C:
Figure GDA00030534010000000510
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,步骤S2中拥有调和平均数后,通过公式:
Figure GDA0003053401000000061
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
Figure GDA0003053401000000062
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
Figure GDA0003053401000000063
根据上述技术方案,令
Figure GDA0003053401000000064
我们有:
Figure GDA0003053401000000065
根据上述技术方案,步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入p(Δr)中,得到用户位置访问地点的概率P。
根据上述技术方案,步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.综合因素下用户位置的获取方法,其特征在于:包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果;
所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为
Figure FDA0003586239040000011
Figure FDA0003586239040000012
中的签到数据按签到时间进行排序,得到用户的顺序签到序列
Figure FDA0003586239040000013
根据公式
Figure FDA0003586239040000014
计算出
Figure FDA0003586239040000015
中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
Figure FDA0003586239040000016
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集
Figure FDA0003586239040000017
然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),其中di为距离,num为数目;
所述步骤S1中计算出用户出行距离的调和平均数C:
Figure FDA0003586239040000018
式子中的n表示用户出行距离数据集中的元素个数;
所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到p(Δr);
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入p(Δr)中,得到用户位置访问地点的概率P;
所述步骤S2中拥有调和平均数后,通过公式:
Figure FDA0003586239040000021
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子;
所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
Figure FDA0003586239040000022
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
2.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤A2中根据如下公式进行计算:
Figure FDA0003586239040000023
计算出每个距离对应的出现概率
Figure FDA0003586239040000024
3.根据权利要求2所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
Figure FDA0003586239040000025
4.根据权利要求3所述的综合因素下用户位置的获取方法,其特征在于,令
Figure FDA0003586239040000026
我们有:
Figure FDA0003586239040000027
5.根据权利要求4所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S4中输出结果记录后制表进行比较。
CN201910528742.4A 2019-06-18 2019-06-18 综合因素下用户位置的获取方法 Expired - Fee Related CN110222278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910528742.4A CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910528742.4A CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Publications (2)

Publication Number Publication Date
CN110222278A CN110222278A (zh) 2019-09-10
CN110222278B true CN110222278B (zh) 2022-05-17

Family

ID=67817633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910528742.4A Expired - Fee Related CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Country Status (1)

Country Link
CN (1) CN110222278B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN106934783A (zh) * 2017-03-02 2017-07-07 宁波大学 一种高频次遥感时间序列数据的时域重建方法
CN107123056A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于位置的社交大数据信息最大化方法
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN108345662A (zh) * 2018-02-01 2018-07-31 福建师范大学 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN108804551A (zh) * 2018-05-21 2018-11-13 辽宁工程技术大学 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN108829744A (zh) * 2018-05-24 2018-11-16 湖北文理学院 一种基于情境要素和用户偏好的旅行方式推荐方法
CN109190053A (zh) * 2018-07-04 2019-01-11 南京邮电大学 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法
CN109492166A (zh) * 2018-08-06 2019-03-19 北京理工大学 基于签到时间间隔模式的连续兴趣点推荐方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN106934783A (zh) * 2017-03-02 2017-07-07 宁波大学 一种高频次遥感时间序列数据的时域重建方法
CN107123056A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于位置的社交大数据信息最大化方法
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
CN108345662A (zh) * 2018-02-01 2018-07-31 福建师范大学 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN108804551A (zh) * 2018-05-21 2018-11-13 辽宁工程技术大学 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN108829744A (zh) * 2018-05-24 2018-11-16 湖北文理学院 一种基于情境要素和用户偏好的旅行方式推荐方法
CN109190053A (zh) * 2018-07-04 2019-01-11 南京邮电大学 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法
CN109492166A (zh) * 2018-08-06 2019-03-19 北京理工大学 基于签到时间间隔模式的连续兴趣点推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Estimating the Integrated Likelihood via Posterior Simulation Using the Harmonic Mean Identity;Jaya M. Satagopan 等;《University of Washington》;20060401;1-45 *
LDPart: Effective Location-Record Data Publication via Local Differential Privacy;XIANGGUO ZHAO 等;《IEEE ACCESS》;20190227;第7卷;31435-31445 *
利用移动网络数据的人类时空行为分析及建模研究;陈夏明;《万方数据知识服务平台》;20171129;1-199 *
融合多维签到信息的LBSN链接预测研究;江洁;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170615(第06期);I139-105 *

Also Published As

Publication number Publication date
CN110222278A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
Jiang et al. Activity-based human mobility patterns inferred from mobile phone data: A case study of Singapore
Xiao et al. Reconstructing gravitational attractions of major cities in China from air passenger flow data, 2001–2008: A particle swarm optimization approach
CN109784636A (zh) 欺诈用户识别方法、装置、计算机设备及存储介质
Liu et al. Building a validation measure for activity-based transportation models based on mobile phone data
CN103729478B (zh) 基于MapReduce的LBS兴趣点发现方法
Bao et al. Covid-gan: Estimating human mobility responses to covid-19 pandemic through spatio-temporal conditional generative adversarial networks
CN106162544B (zh) 一种地理围栏的生成方法和设备
CN102332210A (zh) 基于手机定位数据的实时城市道路交通流数据提取方法
CN106156528A (zh) 一种轨迹数据停留识别方法及系统
Guan et al. A comprehensive method of evaluation for wireless network operation stability
CN115015486A (zh) 一种基于回归树模型的碳排放量测算方法
CN110222278B (zh) 综合因素下用户位置的获取方法
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Kim et al. A daily tourism demand prediction framework based on multi-head attention CNN: The case of the foreign entrant in South Korea
US20230056370A1 (en) Construction method of fine-grained infectious disease simulation model
Jin et al. Frequency-based randomization for guaranteeing differential privacy in spatial trajectories
CN114881430A (zh) 一种基于网络地图服务的社区生活便利度评价方法
Jiang et al. Discovering periodic frequent travel patterns of individual metro passengers considering different time granularities and station attributes
Wang et al. Evolution, accessibility and dynamics of road networks in China from 1600 BC to 1900 AD
Wang et al. Complex network-based analysis of air temperature data in China
Aljeri Big data-driven approach to analyzing spatio-temporal mobility pattern
CN103020244B (zh) 区域影响分析系统及其分析方法
Jiang et al. Trade network dataset development in 227 countries and regions (1985–2015)
Liu et al. Integration of museum user behavior information based on wireless network
Farina et al. A compact representation of indoor trajectories

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220517