CN106339417B - 基于移动轨迹中停留点的用户群体行为规律检测方法 - Google Patents

基于移动轨迹中停留点的用户群体行为规律检测方法 Download PDF

Info

Publication number
CN106339417B
CN106339417B CN201610668942.6A CN201610668942A CN106339417B CN 106339417 B CN106339417 B CN 106339417B CN 201610668942 A CN201610668942 A CN 201610668942A CN 106339417 B CN106339417 B CN 106339417B
Authority
CN
China
Prior art keywords
user
behavior
vector
schedule
stop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610668942.6A
Other languages
English (en)
Other versions
CN106339417A (zh
Inventor
贾晓霞
程鹏
陈积明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201610668942.6A priority Critical patent/CN106339417B/zh
Publication of CN106339417A publication Critical patent/CN106339417A/zh
Application granted granted Critical
Publication of CN106339417B publication Critical patent/CN106339417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法首先接收来自数据采集器的多用户轨迹数据;其次从轨迹数据中提取停留地点序列,并将其变换为代表用户日程行为的地点偏好向量;然后提取日程行为向量,并利用加权平均法计算日程行为模式向量;最后基于日程行为模式计算用户间相似度,采用Kmeans聚类算法检测用户群体的行为规律模式。本发明采用基于停留点的日程行为模式计算用户间相似度,解决了用户停留区域不重叠的问题,可有效检测到用户群体的行为规律模式。

Description

基于移动轨迹中停留点的用户群体行为规律检测方法
技术领域
本发明涉及一种用户群体行为规律检测方法,更具体地说,涉及一种基于移动轨迹中停留点的用户群体行为规律检测方法。
背景技术
近年来,利用轨迹数据挖掘用户行为规律受到了越来越多的关注。长期的行为规律反映了用户的生活习惯,是一种高层次的上下文信息,可帮助位置感知应用更好地适应其用户的需求。例如,推荐系统可根据用户行为规律向其推荐朋友、地点或其它位置相关信息。信息推送系统可向具有相似生活规律的用户推送和分享相关信息。
基于加速度传感器等检测的用户短期行为(如吃饭、散步等),无法反映其长期的行为规律和生活习惯;基于相似访问地点序列计算用户行为相似度的方法,由于依赖于不同用户停留区域的交叠,无法对无访问交叠的用户(如生活在不同城市的用户)相似度进行度量;基于反向地理编码技术将用户的物理轨迹转化为语义轨迹,然后从语义轨迹中提取出序列模式,基于最长语义轨迹模式度量用户行为相似度的方法,虽然解除了对用户访问区域交叠的限制,但其局限于对用户短期运动行为的分析,并且用户访问地点的个性化语义(如家、工作地点等)无法通过反向地理编码得到;而且用户行为具有多样性和复杂性,单靠数据很难把握其趋势和规律性。因此,关于利用轨迹数据有效挖掘及展示用户行为,计算用户行为相似度进而检测用户群体行为规律的技术有待深入研究与探讨。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明能够有效地度量用户行为相似度,检测用户行为规律。
本发明的目的是通过以下技术方案来实现的:一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法包括以下内容:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过一定阈值,则该区域视为一个停留地点;
步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;
步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i表示用户平均每天各个停留时间段的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。
本发明所述的基于移动轨迹中停留点的用户群体行为规律检测方法,可挖掘用户的长期行为规律,度量无区域交叠的用户行为相似度。与现有技术相比,本发明具有如下技术效果:
1、由于用户每天大部分时间在某些地点停留,所以本发明从停留地点的角度表示用户行为,可以挖掘用户长期行为规律和生活习惯,具有更强的实际应用价值;
2、本发明不基于停留地点的地理空间特征度量用户相似度,因此可以度量无停留区域交叠的用户间行为的相似度,进而检测用户群体行为规律,适用范围广;
3、本发明不涉及反向地理编码技术将用户的地理轨迹转化为语义轨迹,可以解决停留地点的个性化语义(如家、工作地点等)无法得到的问题,检测的准确率更高;
附图说明
图1是停留地点检测流程图;
图2是用户群体行为规律检测流程图;
图3是表示用户群体行为规律的折线图。
图4是表示用户群体行为规律的折线图。
图5是表示用户群体行为规律的折线图。
图6是表示用户群体行为规律的折线图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
如图2所示,本发明给出了一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明所述的检测方法,包括以下步骤:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,如图1所示,其中Ts为时间阈值,Ds为距离阈值,i,j为定位点编号,N为轨迹点个数。当用户在某个区域内停留时间超过一定阈值时,则该区域视为一个停留地点。首先给定时间阈值为Ts,空间阈值为Ds,i从第一个定位点开始,计算下一个定位点j与i之间的距离,若小于空间阈值Ds,则j转移到下一个定位点,否则计算j与i之间的时间间隔,若小于时间阈值Ts,则i转移到第i+1个定位点开始新一轮的检测,否则检测到一个停留点,该停留点的位置为i~j之间的点的中心位置,并且i转移到定位点j开始新一轮的检测,直到i为最后一个定位点。这样就将轨迹数据转化为停留点序列;
步骤3,由于一般用户每天大部分时间在某些地点停留,其某一天的行为可被看作是不同时间段在不同地点的停留,因此将一天划分为24个小时,将用户每天的停留地点序列转换为地点偏好向量该向量代表用户k一天的日程行为,向量中的元素v1t表示用户k在t时刻的停留地点标号;
步骤4,由于用户一天的行为可抽象化为在多少个地点停留以及各个地点的停留时间长短,因此对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间,并计算得到日程行为向量向量中的元素a1i分别表示用户k一天内停留时间超过5小时、3小时、1小时、0小时的停留地点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量。由于用户长期的行为规律可看作用户每天行为的平均,因此对得到的日程行为向量采用加权平均法计算日程行为模式向量向量中元素r1×i表示用户k平均每天各个停留时间段的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,以日程行为模式向量表示每个用户的长期行为规律;
步骤7,以得到的日程行为模式向量为特征,利用欧式距离计算两两用户间行为相似性,向量Rm、Rn分别表示用户m、n的日程行为模式向量,并采用Kmeans算法对用户进行聚类,得到用户的行为规律模式。
本发明所述检测方法采取的技术方案是:对接收到的多个用户的轨迹数据进行停留点检测,然后针对每个用户,将停留点序列变换为地点偏好向量,并提取日程行为向量,采用加权平均的方法得到日程行为模式向量,最后使用Kmeans聚类算法检测用户群体的行为规律。
本发明中停留点检测方法的时间阈值和空间阈值可根据轨迹数据类型与实际应用需求进行设置,因此可适应不同的应用场景。
本发明的效果可以通过以下实际的实验来验证:
本发明收集了某市区211辆电动自行车5个星期的轨迹数据,数据包含电动车编号ID、时间timestamp、经度longitude、纬度latitude。
图3-6展示了表示用户群体行为规律模式的折线图。图中横坐标表示停留时间长短,纵坐标表示停留点个数。从图中可看出,实验中的211个用户的行为规律可分为四类,各类间差异性大而同一类内差异性小。图3表示的用户群体,其行为规律为一天中停留点个数较多,而且停留时间差异较大;图4表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为2个,其余停留时间范围内的停留点个数很少,该类用户可推断为有固定工作地的上班族;图5表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且其余停留时间范围内的停留点个数很少,该类用户可推断为绝大部分时间停留在居住地且很少出行的用户;图6表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且停留时间低于3小时的停留点个数也大约为1,该类用户可推断为除居住地外,每天会去某个地方,但停留时间较短。

Claims (1)

1.一种基于移动轨迹中停留点的用户群体行为规律检测方法,其特征在于,该方法可以包括以下步骤:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过阈值,则该区域视为一个停留地点;
步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;
步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i,i=1,2,3,4,分别表示停留时间超过5小时、3~5小时、1~3小时、0~1小时的停留点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i,i=1,2,3,4,表示用户平均每天停留时间超过5小时、3~5小时、1~3小时、0~1小时的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。
CN201610668942.6A 2016-08-15 2016-08-15 基于移动轨迹中停留点的用户群体行为规律检测方法 Active CN106339417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610668942.6A CN106339417B (zh) 2016-08-15 2016-08-15 基于移动轨迹中停留点的用户群体行为规律检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610668942.6A CN106339417B (zh) 2016-08-15 2016-08-15 基于移动轨迹中停留点的用户群体行为规律检测方法

Publications (2)

Publication Number Publication Date
CN106339417A CN106339417A (zh) 2017-01-18
CN106339417B true CN106339417B (zh) 2019-10-01

Family

ID=57824192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610668942.6A Active CN106339417B (zh) 2016-08-15 2016-08-15 基于移动轨迹中停留点的用户群体行为规律检测方法

Country Status (1)

Country Link
CN (1) CN106339417B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509434B (zh) * 2017-02-23 2020-12-25 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN107395562A (zh) * 2017-06-14 2017-11-24 广东网金控股股份有限公司 一种基于聚类算法的金融终端安全保护方法及系统
CN107562798A (zh) * 2017-08-02 2018-01-09 北京大学(天津滨海)新代信息技术研究院 一种基于用户的时间地理数据的实时信息推荐方法
CN109947874B (zh) * 2017-11-16 2023-02-24 腾讯科技(深圳)有限公司 移动轨迹的聚合方法、装置及设备
CN112055867B (zh) 2018-05-18 2024-05-07 北京嘀嘀无限科技发展有限公司 用于推荐个性化上车位置的系统和方法
CN111289001B (zh) * 2018-12-10 2023-10-20 阿里巴巴集团控股有限公司 导航方法和装置以及电子设备
CN110119762B (zh) * 2019-04-15 2023-09-26 华东师范大学 基于聚类的人类行为依赖分析方法
CN110349372B (zh) * 2019-06-10 2021-11-19 智慧华川养老(北京)有限公司 居家养老人员活动异常预警方法和装置
CN110503032B (zh) * 2019-08-21 2021-08-31 中南大学 基于监控摄像头轨迹数据的个体重要场所探测方法
CN111563190B (zh) * 2020-04-07 2023-03-14 中国电子科技集团公司第二十九研究所 一种区域网络用户行为的多维度分析与监管方法及系统
CN112444833A (zh) * 2020-11-05 2021-03-05 浙江宝聚通信息科技有限公司 根据配置有定位器的电动车挂失记录识别被盗电动车存放点的方法及装置
CN112905792A (zh) * 2021-02-20 2021-06-04 深圳前海微众银行股份有限公司 基于非文本场景的文本聚类方法、装置、设备及存储介质
CN113470079A (zh) * 2021-07-15 2021-10-01 浙江大华技术股份有限公司 一种落脚区域的输出方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731795A (zh) * 2013-12-19 2015-06-24 日本电气株式会社 用于挖掘个体活动模式的设备和方法
CN104965913A (zh) * 2015-07-03 2015-10-07 重庆邮电大学 一种基于gps地理位置数据挖掘的用户分类方法
CN105117424A (zh) * 2015-07-31 2015-12-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731795A (zh) * 2013-12-19 2015-06-24 日本电气株式会社 用于挖掘个体活动模式的设备和方法
CN104965913A (zh) * 2015-07-03 2015-10-07 重庆邮电大学 一种基于gps地理位置数据挖掘的用户分类方法
CN105117424A (zh) * 2015-07-31 2015-12-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Extractiong patterns from location history;PabloBellver A K;《Proceedings of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems》;20111104;397-400 *
基于时空轨迹数据的出行特征挖掘方法;张健钦;《交通运输系统工程与信息》;20141231;第14卷(第6期);72-78 *

Also Published As

Publication number Publication date
CN106339417A (zh) 2017-01-18

Similar Documents

Publication Publication Date Title
CN106339417B (zh) 基于移动轨迹中停留点的用户群体行为规律检测方法
CN108875007B (zh) 兴趣点的确定方法和装置、存储介质、电子装置
CN102905368B (zh) 基于智能手机平台的移动辅助室内定位方法和系统
Xu et al. A survey for mobility big data analytics for geolocation prediction
Ye et al. FTrack: Infrastructure-free floor localization via mobile phone sensing
Sohn et al. Mobility detection using everyday gsm traces
Al-Qaness et al. Channel state information from pure communication to sense and track human motion: A survey
Calabrese et al. Human mobility prediction based on individual and collective geographical preferences
CN105409306B (zh) 移动终端位置预测方法及装置
CN103218442A (zh) 一种基于移动设备传感器数据的生活模式分析方法及系统
Kloch et al. Collaborative PDR localisation with mobile phones
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
Chen et al. Predicting next locations with object clustering and trajectory clustering
EP2529184A1 (en) Systems, methods, and apparatuses for providing context-based navigation services
Lee et al. Non-obstructive room-level locating system in home environments using activity fingerprints from smartwatch
Du et al. Group mobility classification and structure recognition using mobile devices
CN107133689B (zh) 一种位置标记方法
Kobayashi et al. Shaka: User movement estimation considering reliability, power saving, and latency using mobile phone
Cheng et al. An unsupervised approach for semantic place annotation of trajectories based on the prior probability
CN106776776A (zh) 一种运动场所信息的推荐方法及装置
Papliatseyeu et al. Mobile habits: Inferring and predicting user activities with a location-aware smartphone
De Paola et al. Detection of points of interest in a smart campus
Hang et al. Platys: User-centric place recognition
Mazilu et al. Low-power ambient sensing in smartphones for continuous semantic localization
Lee et al. QRLoc: User-involved calibration using quick response codes for Wi-Fi based indoor localization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant