CN110222278A - 综合因素下用户位置的获取方法 - Google Patents
综合因素下用户位置的获取方法 Download PDFInfo
- Publication number
- CN110222278A CN110222278A CN201910528742.4A CN201910528742A CN110222278A CN 110222278 A CN110222278 A CN 110222278A CN 201910528742 A CN201910528742 A CN 201910528742A CN 110222278 A CN110222278 A CN 110222278A
- Authority
- CN
- China
- Prior art keywords
- user
- acquisition methods
- user location
- location under
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 239000002131 composite material Substances 0.000 title claims 11
- 238000005070 sampling Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了综合因素下用户位置的获取方法,包括如下步骤:S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;S3、拟合用户地点访问概率函数,并且输出结果,本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
Description
技术领域
本发明涉及用户位置的获取技术领域,具体为综合因素下用户位置的获取方法。
背景技术
社交网络中基于位置的影响最大化问题的研究,偏向于人类行为学,研究需要立足于大量且真实有效的用户信息数据,研究最终得到的结果,才能真实有效符合现实。
需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息。
发明内容
本发明提供综合因素下用户位置的获取方法,可以有效解决上述背景技术中提出需要发掘用户地理位置签到数据中隐藏的行为规律,需要研究社交网络中,如何表述单一用户的影响力大小,从而便于获取用户的位置信息的问题。
为实现上述目的,本发明提供如下技术方案:综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为对中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
根据上述技术方案,所述步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
根据上述技术方案,所述步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,所述步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
根据上述技术方案,令我们有:
根据上述技术方案,所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
根据上述技术方案,所述步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1是本发明的步骤流程示意图;
图2是本发明的泊松分布步骤示意图;
图3是本发明的拟合用户访问概率步骤示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例:如图1-3所示,本发明提供技术方案,综合因素下用户位置的获取方法,包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
根据上述技术方案,步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为对中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
根据上述技术方案,步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
根据上述技术方案,步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
根据上述技术方案,步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
根据上述技术方案,fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
根据上述技术方案,步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
根据上述技术方案,令我们有:
根据上述技术方案,步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
根据上述技术方案,步骤S4中输出结果记录后制表进行比较。
与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,通过对数据的观察分析,我们得到了泊松分布能很好的反应用户移动模式的结论,并在分析现实情况后,在泊松分布的基础上,加入调和因子,得到了用户位置访问概率函数,由于用户位置访问概率函数综合的考虑了个人与全局因素,故能良好的反应真实的出行意向,从而便于了用户位置的获取,便于其出行位置的了解。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.综合因素下用户位置的获取方法,其特征在于:包括如下步骤:
S1、对数据集整理分析的结果,拟合出用户移动距离与概率间的函数分布式,并通过出行距离的调和平均数体现用户特性;
S2、计算用户位置访问概率函数,并且使用采样的邻居节点法拟合泊松分布;
S3、拟合用户地点访问概率函数,并且输出结果。
2.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S1中对数据集整理分析使用泊松分布描述用户出行模式,并且进行如下操作步骤:
A1、给定一用户u1,其签到集合为对中的签到数据按签到时间进行排序,得到用户的顺序签到序列根据公式(单位为km,保留2位有效数字),计算出中用户顺序时间间隔内,签到点间的间距,得到用户u1的出行间距集
A2、分别为用户计算完出行距离集后,我们得到了所有用户的出行间距集然后把用户的出行间距进行合并,算出每个具体数值出现的数目,得到出行间距数目表DN=(dn1,dn2,...dnn),其中每一项dni=(di,num),(其中di为距离,num为数目)。
3.根据权利要求2所述的综合因素下用户位置的获取方法,其特征在于,所述步骤A2中根据如下公式进行计算:
计算出每个距离对应的出现概率
4.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S1中计算出用户出行距离的调和平均数C:
式子中的n表示用户出行距离数据集中的元素个数。
5.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S2中拥有调和平均数后,通过公式:
给出的调和因子fa,来描述用户自身与全局数据之间的关系;
使用当前用户出行距离的调和平均数除以泊松分布的期望值作为调和因子。
6.根据权利要求5所述的综合因素下用户位置的获取方法,其特征在于,所述fa加入到泊松分布式中得到用户的位置访问概率函数p(Δr):
式中的Δr表示最新一条用户签到点与新地点间的欧式距离。
7.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S2中使用采样的邻居节点法拟合泊松分布,保证样本数量为n采样事件中,所得结果e的近似误差大于ε的概率小于δ;n、ε、δ需要满足如下公式:
8.根据权利要求7所述的综合因素下用户位置的获取方法,其特征在于,令我们有:
9.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S3中拟合用户访问概率步骤如下:
B1、从U个用户的N个邻居节点中采集移动距离数据DN;
B2、计算Pd期望λ,用户移动距离调和平均数C得到Pr;
B3、计算地点L与用户U之间最新签到点间的距离r;
B4、将r带入Pr中,得到用户位置访问地点的概率P。
10.根据权利要求1所述的综合因素下用户位置的获取方法,其特征在于,所述步骤S4中输出结果记录后制表进行比较。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910528742.4A CN110222278B (zh) | 2019-06-18 | 2019-06-18 | 综合因素下用户位置的获取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910528742.4A CN110222278B (zh) | 2019-06-18 | 2019-06-18 | 综合因素下用户位置的获取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222278A true CN110222278A (zh) | 2019-09-10 |
CN110222278B CN110222278B (zh) | 2022-05-17 |
Family
ID=67817633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910528742.4A Expired - Fee Related CN110222278B (zh) | 2019-06-18 | 2019-06-18 | 综合因素下用户位置的获取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222278B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942310A (zh) * | 2014-04-18 | 2014-07-23 | 厦门雅迅网络股份有限公司 | 基于时空模式的用户行为相似性挖掘方法 |
CN106934783A (zh) * | 2017-03-02 | 2017-07-07 | 宁波大学 | 一种高频次遥感时间序列数据的时域重建方法 |
CN107123056A (zh) * | 2017-03-03 | 2017-09-01 | 华南理工大学 | 一种基于位置的社交大数据信息最大化方法 |
CN107515949A (zh) * | 2017-09-14 | 2017-12-26 | 云南大学 | 兴趣点预测和推荐中的用户时空相似性度量方法 |
CN108320171A (zh) * | 2017-01-17 | 2018-07-24 | 北京京东尚科信息技术有限公司 | 热销商品预测方法、系统及装置 |
CN108345662A (zh) * | 2018-02-01 | 2018-07-31 | 福建师范大学 | 一种考虑用户分布区域差异的签到微博数据加权统计方法 |
CN108509434A (zh) * | 2017-02-23 | 2018-09-07 | 中国移动通信有限公司研究院 | 一种群体用户的挖掘方法及装置 |
CN108804551A (zh) * | 2018-05-21 | 2018-11-13 | 辽宁工程技术大学 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
CN108829744A (zh) * | 2018-05-24 | 2018-11-16 | 湖北文理学院 | 一种基于情境要素和用户偏好的旅行方式推荐方法 |
CN109190053A (zh) * | 2018-07-04 | 2019-01-11 | 南京邮电大学 | 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法 |
CN109492166A (zh) * | 2018-08-06 | 2019-03-19 | 北京理工大学 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
-
2019
- 2019-06-18 CN CN201910528742.4A patent/CN110222278B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942310A (zh) * | 2014-04-18 | 2014-07-23 | 厦门雅迅网络股份有限公司 | 基于时空模式的用户行为相似性挖掘方法 |
CN108320171A (zh) * | 2017-01-17 | 2018-07-24 | 北京京东尚科信息技术有限公司 | 热销商品预测方法、系统及装置 |
CN108509434A (zh) * | 2017-02-23 | 2018-09-07 | 中国移动通信有限公司研究院 | 一种群体用户的挖掘方法及装置 |
CN106934783A (zh) * | 2017-03-02 | 2017-07-07 | 宁波大学 | 一种高频次遥感时间序列数据的时域重建方法 |
CN107123056A (zh) * | 2017-03-03 | 2017-09-01 | 华南理工大学 | 一种基于位置的社交大数据信息最大化方法 |
CN107515949A (zh) * | 2017-09-14 | 2017-12-26 | 云南大学 | 兴趣点预测和推荐中的用户时空相似性度量方法 |
CN108345662A (zh) * | 2018-02-01 | 2018-07-31 | 福建师范大学 | 一种考虑用户分布区域差异的签到微博数据加权统计方法 |
CN108804551A (zh) * | 2018-05-21 | 2018-11-13 | 辽宁工程技术大学 | 一种兼顾多样性与个性化的空间兴趣点推荐方法 |
CN108829744A (zh) * | 2018-05-24 | 2018-11-16 | 湖北文理学院 | 一种基于情境要素和用户偏好的旅行方式推荐方法 |
CN109190053A (zh) * | 2018-07-04 | 2019-01-11 | 南京邮电大学 | 一种基于兴趣点重要性和用户权威性的兴趣点推荐方法 |
CN109492166A (zh) * | 2018-08-06 | 2019-03-19 | 北京理工大学 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
Non-Patent Citations (4)
Title |
---|
JAYA M. SATAGOPAN 等: "Estimating the Integrated Likelihood via Posterior Simulation Using the Harmonic Mean Identity", 《UNIVERSITY OF WASHINGTON》 * |
XIANGGUO ZHAO 等: "LDPart: Effective Location-Record Data Publication via Local Differential Privacy", 《IEEE ACCESS》 * |
江洁: "融合多维签到信息的LBSN链接预测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈夏明: "利用移动网络数据的人类时空行为分析及建模研究", 《万方数据知识服务平台》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110222278B (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xiao et al. | Reconstructing gravitational attractions of major cities in China from air passenger flow data, 2001–2008: A particle swarm optimization approach | |
Pei et al. | A new insight into land use classification based on aggregated mobile phone data | |
CN109784636A (zh) | 欺诈用户识别方法、装置、计算机设备及存储介质 | |
CN105630884B (zh) | 一种微博热点事件的地理位置发现方法 | |
CN106790468A (zh) | 一种分析用户WiFi活动轨迹规律的分布式实现方法 | |
CN106878939A (zh) | 基于联系人信息来标注被访问的位置的方法和系统 | |
Yang et al. | Explaining regional economic multipliers of tourism: does cross-regional heterogeneity exist? | |
CN109977324B (zh) | 一种兴趣点挖掘方法及系统 | |
CN110728305A (zh) | 基于网格信息熵聚类算法的出租车载客热点区域挖掘方法 | |
CN106651027A (zh) | 一种基于社交网络的互联网班车线路优化方法 | |
CN111651529A (zh) | 基于手机信令数据的机场航空旅客分类识别方法 | |
CN110032939A (zh) | 一种基于高斯混合模型的遥感时序数据拟合方法 | |
CN109491994B (zh) | Landsat-8卫星精选遥感数据集最简化筛选方法 | |
CN107705145A (zh) | 一种房价评估系统 | |
CN107357858B (zh) | 一种基于地理位置的网络重构方法 | |
Pujol et al. | Subhaloes gone Notts: the clustering properties of subhaloes | |
CN112566030A (zh) | 一种基于手机信令数据的居住地双时段识别方法及应用 | |
TWI757638B (zh) | 使用者位置確定方法、裝置、設備及電腦可讀儲存媒體 | |
Maur | Statistical tools for drop size distributions: Moments and generalized gamma | |
CN108647739B (zh) | 一种基于改进的密度峰值聚类的社交网络社区发现方法 | |
CN109902129A (zh) | 基于大数据分析的保险代理人归类方法及相关设备 | |
CN110222278A (zh) | 综合因素下用户位置的获取方法 | |
CN107066572B (zh) | 基于众源地理数据空间聚类的地表覆盖分类方法及系统 | |
Jin et al. | Using user-generated content data to analyze tourist mobility between hotels and attractions in cities | |
CN107480222B (zh) | 基于微博数据的城市群空间联系强度测度系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220517 |