CN110222278A - 综合因素下用户位置的获取方法 - Google Patents

综合因素下用户位置的获取方法 Download PDF

Info

Publication number
CN110222278A
CN110222278A CN201910528742.4A CN201910528742A CN110222278A CN 110222278 A CN110222278 A CN 110222278A CN 201910528742 A CN201910528742 A CN 201910528742A CN 110222278 A CN110222278 A CN 110222278A
Authority
CN
China
Prior art keywords
user
acquisition methods
user location
location under
under composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910528742.4A
Other languages
English (en)
Other versions
CN110222278B (zh
Inventor
赵相国
袁野
孙永佼
吴希颖
景国香
程高云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910528742.4A priority Critical patent/CN110222278B/zh
Publication of CN110222278A publication Critical patent/CN110222278A/zh
Application granted granted Critical
Publication of CN110222278B publication Critical patent/CN110222278B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了综合因素下用户位置的获取方法,包括如下步骤:S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;S3、拟合用户地点访问概率函数,并且输出结果,本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。

Description

综合因素下用户位置的获取方法
技术领域
本发明涉及用户位置的获取技术领域,具体为综合因素下用户位置的获取方法。
背景技术
社交网络中基于位置的影响最大化问题的研究,偏向于人类行为学,研究需要立足于大量且真实有效的用户信息数据,研究最终得到的结果,才能真实有效符合现实。
需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息。
发明内容
本发明提供综合因素下用户位置的获取方法,可以有效解决上述背景技术中提出需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息的问题。
为实现上述目的,本发明提供如下技术方案:综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
根据上述技术方案,所述步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
根据上述技术方案,所述步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,所述步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
根据上述技术方案,令我们有:
根据上述技术方案,所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
根据上述技术方案,所述步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明的步骤流程示意图;
图2是本发明的泊松分布步骤示意图;
图3是本发明的拟合用户访问概率步骤示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1-3所示,本发明提供技术方案,综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
根据上述技术方案,步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
根据上述技术方案,步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
根据上述技术方案,令我们有:
根据上述技术方案,步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
根据上述技术方案,步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.综合因素下用户位置的获取方法,其特征在于:包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
2.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
3.根据权利要求2所述的综合因素下用户位置的获取方法,其特征在于,所述步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
4.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
5.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
6.根据权利要求5所述的综合因素下用户位置的获取方法,其特征在于,所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
7.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
8.根据权利要求7所述的综合因素下用户位置的获取方法,其特征在于,令我们有:
9.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
10.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S4中输出结果记录后制表进行比较。
CN201910528742.4A 2019-06-18 2019-06-18 综合因素下用户位置的获取方法 Expired - Fee Related CN110222278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910528742.4A CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910528742.4A CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Publications (2)

Publication Number Publication Date
CN110222278A true CN110222278A (zh) 2019-09-10
CN110222278B CN110222278B (zh) 2022-05-17

Family

ID=67817633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910528742.4A Expired - Fee Related CN110222278B (zh) 2019-06-18 2019-06-18 综合因素下用户位置的获取方法

Country Status (1)

Country Link
CN (1) CN110222278B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN106934783A (zh) * 2017-03-02 2017-07-07 宁波大学 一种高频次遥感时间序列数据的时域重建方法
CN107123056A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于位置的社交大数据信息最大化方法
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN108345662A (zh) * 2018-02-01 2018-07-31 福建师范大学 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN108804551A (zh) * 2018-05-21 2018-11-13 辽宁工程技术大学 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN108829744A (zh) * 2018-05-24 2018-11-16 湖北文理学院 一种基于情境要素和用户偏好的旅行方式推荐方法
CN109190053A (zh) * 2018-07-04 2019-01-11 南京邮电大学 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法
CN109492166A (zh) * 2018-08-06 2019-03-19 北京理工大学 基于签到时间间隔模式的连续兴趣点推荐方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942310A (zh) * 2014-04-18 2014-07-23 厦门雅迅网络股份有限公司 基于时空模式的用户行为相似性挖掘方法
CN108320171A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 热销商品预测方法、系统及装置
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN106934783A (zh) * 2017-03-02 2017-07-07 宁波大学 一种高频次遥感时间序列数据的时域重建方法
CN107123056A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于位置的社交大数据信息最大化方法
CN107515949A (zh) * 2017-09-14 2017-12-26 云南大学 兴趣点预测和推荐中的用户时空相似性度量方法
CN108345662A (zh) * 2018-02-01 2018-07-31 福建师范大学 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN108804551A (zh) * 2018-05-21 2018-11-13 辽宁工程技术大学 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN108829744A (zh) * 2018-05-24 2018-11-16 湖北文理学院 一种基于情境要素和用户偏好的旅行方式推荐方法
CN109190053A (zh) * 2018-07-04 2019-01-11 南京邮电大学 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法
CN109492166A (zh) * 2018-08-06 2019-03-19 北京理工大学 基于签到时间间隔模式的连续兴趣点推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JAYA M. SATAGOPAN 等: "Estimating the Integrated Likelihood via Posterior Simulation Using the Harmonic Mean Identity", 《UNIVERSITY OF WASHINGTON》 *
XIANGGUO ZHAO 等: "LDPart: Effective Location-Record Data Publication via Local Differential Privacy", 《IEEE ACCESS》 *
江洁: "融合多维签到信息的LBSN链接预测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈夏明: "利用移动网络数据的人类时空行为分析及建模研究", 《万方数据知识服务平台》 *

Also Published As

Publication number Publication date
CN110222278B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN106156528B (zh) 一种轨迹数据停留识别方法及系统
CN112182410B (zh) 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN103729478B (zh) 基于MapReduce的LBS兴趣点发现方法
Yuan et al. Measuring similarity of mobile phone user trajectories–a Spatio-temporal Edit Distance method
Jiang et al. Identifying shrinking cities with NPP-VIIRS nightlight data in China
CN106878939A (zh) 基于联系人信息来标注被访问的位置的方法和系统
Xu et al. Mobile cellular big data: Linking cyberspace and the physical world with social ecology
CN105630884B (zh) 一种微博热点事件的地理位置发现方法
CN106257948A (zh) 一种流域降水监测无线传感器网络节点优化布局方法
CN109004997A (zh) 一种频谱感知方法、装置和计算机可读存储介质
CN109451428A (zh) 一种基于WiFi聚类的室内高度定位方法
CN108268969A (zh) 基于遥感数据的区域经济发展形式分析与预测方法及装置
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Delaygue et al. Reconstruction of Lamb weather type series back to the eighteenth century
CN108513262A (zh) 基于合成似真路径的位置隐私保护方法
CN111461197A (zh) 一种基于特征提取的空间负荷分布规律研究方法
CN110222278A (zh) 综合因素下用户位置的获取方法
Li et al. Delineation of the Shanghai megacity region of China from a commuting perspective: Study based on cell phone network data in the Yangtze River Delta
CN105493050B (zh) 数据处理装置及数据处理方法
CN117291000A (zh) 一种国土空间规划大数据分析辅助模型
Ma et al. Projecting high resolution population distribution using Local Climate Zones and multi-source big data
Wei et al. Methods for cropland reconstruction based on gazetteers in the Qing Dynasty (1644–1911): A case study in Zhili province, China
Wang et al. Study on the Response of Ecological Capacity to Land‐Use/Cover Change in Wuhan City: A Remote Sensing and GIS Based Approach
Wang et al. Complex network-based analysis of air temperature data in China
CN114493953A (zh) 一种异地患者就医的影响因素的分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220517