CN106339417A - 基于移动轨迹中停留点的用户群体行为规律检测方法 - Google Patents
基于移动轨迹中停留点的用户群体行为规律检测方法 Download PDFInfo
- Publication number
- CN106339417A CN106339417A CN201610668942.6A CN201610668942A CN106339417A CN 106339417 A CN106339417 A CN 106339417A CN 201610668942 A CN201610668942 A CN 201610668942A CN 106339417 A CN106339417 A CN 106339417A
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- vector
- schedule
- stop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法首先接收来自数据采集器的多用户轨迹数据;其次从轨迹数据中提取停留地点序列,并将其变换为代表用户日程行为的地点偏好向量;然后提取日程行为向量,并利用加权平均法计算日程行为模式向量;最后基于日程行为模式计算用户间相似度,采用Kmeans聚类算法检测用户群体的行为规律模式。本发明采用基于停留点的日程行为模式计算用户间相似度,解决了用户停留区域不重叠的问题,可有效检测到用户群体的行为规律模式。
Description
技术领域
本发明涉及一种用户群体行为规律检测方法,更具体地说,涉及一种基于移动轨迹中停留点的用户群体行为规律检测方法。
背景技术
近年来,利用轨迹数据挖掘用户行为规律受到了越来越多的关注。长期的行为规律反映了用户的生活习惯,是一种高层次的上下文信息,可帮助位置感知应用更好地适应其用户的需求。例如,推荐系统可根据用户行为规律向其推荐朋友、地点或其它位置相关信息。信息推送系统可向具有相似生活规律的用户推送和分享相关信息。
基于加速度传感器等检测的用户短期行为(如吃饭、散步等),无法反映其长期的行为规律和生活习惯;基于相似访问地点序列计算用户行为相似度的方法,由于依赖于不同用户停留区域的交叠,无法对无访问交叠的用户(如生活在不同城市的用户)相似度进行度量;基于反向地理编码技术将用户的物理轨迹转化为语义轨迹,然后从语义轨迹中提取出序列模式,基于最长语义轨迹模式度量用户行为相似度的方法,虽然解除了对用户访问区域交叠的限制,但其局限于对用户短期运动行为的分析,并且用户访问地点的个性化语义(如家、工作地点等)无法通过反向地理编码得到;而且用户行为具有多样性和复杂性,单靠数据很难把握其趋势和规律性。因此,关于利用轨迹数据有效挖掘及展示用户行为,计算用户行为相似度进而检测用户群体行为规律的技术有待深入研究与探讨。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明能够有效地度量用户行为相似度,检测用户行为规律。
本发明的目的是通过以下技术方案来实现的:一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法包括以下内容:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过一定阈值,则该区域视为一个停留地点;
步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;
步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i表示用户平均每天各个停留时间段的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。
本发明所述的基于移动轨迹中停留点的用户群体行为规律检测方法,可挖掘用户的长期行为规律,度量无区域交叠的用户行为相似度。与现有技术相比,本发明具有如下技术效果:
1、由于用户每天大部分时间在某些地点停留,所以本发明从停留地点的角度表示用户行为,可以挖掘用户长期行为规律和生活习惯,具有更强的实际应用价值;
2、本发明不基于停留地点的地理空间特征度量用户相似度,因此可以度量无停留区域交叠的用户间行为的相似度,进而检测用户群体行为规律,适用范围广;
3、本发明不涉及反向地理编码技术将用户的地理轨迹转化为语义轨迹,可以解决停留地点的个性化语义(如家、工作地点等)无法得到的问题,检测的准确率更高;
附图说明
图1是停留地点检测流程图;
图2是用户群体行为规律检测流程图;
图3是表示用户群体行为规律的折线图。
图4是表示用户群体行为规律的折线图。
图5是表示用户群体行为规律的折线图。
图6是表示用户群体行为规律的折线图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
如图2所示,本发明给出了一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明所述的检测方法,包括以下步骤:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,如图1所示,其中Ts为时间阈值,Ds为距离阈值,i,j为定位点编号,N为轨迹点个数。当用户在某个区域内停留时间超过一定阈值时,则该区域视为一个停留地点。首先给定时间阈值为Ts,空间阈值为Ds,i从第一个定位点开始,计算下一个定位点j与i之间的距离,若小于空间阈值Ds,则j转移到下一个定位点,否则计算j与i之间的时间间隔,若小于时间阈值Ts,则i转移到第i+1个定位点开始新一轮的检测,否则检测到一个停留点,该停留点的位置为i~j之间的点的中心位置,并且i转移到定位点j开始新一轮的检测,直到i为最后一个定位点。这样就将轨迹数据转化为停留点序列;
步骤3,由于一般用户每天大部分时间在某些地点停留,其某一天的行为可被看作是不同时间段在不同地点的停留,因此将一天划分为24个小时,将用户每天的停留地点序列转换为地点偏好向量该向量代表用户k一天的日程行为,向量中的元素v1t表示用户k在t时刻的停留地点标号;
步骤4,由于用户一天的行为可抽象化为在多少个地点停留以及各个地点的停留时间长短,因此对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间,并计算得到日程行为向量向量中的元素a1i分别表示用户k一天内停留时间超过5小时、3小时、1小时、0小时的停留地点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量。由于用户长期的行为规律可看作用户每天行为的平均,因此对得到的日程行为向量采用加权平均法计算日程行为模式向量向量中元素r1×i表示用户k平均每天各个停留时间段的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,以日程行为模式向量表示每个用户的长期行为规律;
步骤7,以得到的日程行为模式向量为特征,利用欧式距离计算两两用户间行为相似性,向量Rm、Rn分别表示用户m、n的日程行为模式向量,并采用Kmeans算法对用户进行聚类,得到用户的行为规律模式。
本发明所述检测方法采取的技术方案是:对接收到的多个用户的轨迹数据进行停留点检测,然后针对每个用户,将停留点序列变换为地点偏好向量,并提取日程行为向量,采用加权平均的方法得到日程行为模式向量,最后使用Kmeans聚类算法检测用户群体的行为规律。
本发明中停留点检测方法的时间阈值和空间阈值可根据轨迹数据类型与实际应用需求进行设置,因此可适应不同的应用场景。
本发明的效果可以通过以下实际的实验来验证:
本发明收集了某市区211辆电动自行车5个星期的轨迹数据,数据包含电动车编号ID、时间timestamp、经度longitude、纬度latitude。
图3-6展示了表示用户群体行为规律模式的折线图。图中横坐标表示停留时间长短,纵坐标表示停留点个数。从图中可看出,实验中的211个用户的行为规律可分为四类,各类间差异性大而同一类内差异性小。图3表示的用户群体,其行为规律为一天中停留点个数较多,而且停留时间差异较大;图4表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为2个,其余停留时间范围内的停留点个数很少,该类用户可推断为有固定工作地的上班族;图5表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且其余停留时间范围内的停留点个数很少,该类用户可推断为绝大部分时间停留在居住地且很少出行的用户;图6表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且停留时间低于3小时的停留点个数也大约为1,该类用户可推断为除居住地外,每天会去某个地方,但停留时间较短。
Claims (1)
1.一种基于移动轨迹中停留点的用户群体行为规律检测方法,其特征在于,该方法可以包括以下步骤:
步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;
步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过阈值,则该区域视为一个停留地点;
步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;
步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i(i=1,2,3,4)分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;
步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i(i=1,2,3,4)表示用户平均每天停留时间超过5小时、3小时、1小时、0小时的停留点的个数;
步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610668942.6A CN106339417B (zh) | 2016-08-15 | 2016-08-15 | 基于移动轨迹中停留点的用户群体行为规律检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610668942.6A CN106339417B (zh) | 2016-08-15 | 2016-08-15 | 基于移动轨迹中停留点的用户群体行为规律检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106339417A true CN106339417A (zh) | 2017-01-18 |
CN106339417B CN106339417B (zh) | 2019-10-01 |
Family
ID=57824192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610668942.6A Active CN106339417B (zh) | 2016-08-15 | 2016-08-15 | 基于移动轨迹中停留点的用户群体行为规律检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339417B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107395562A (zh) * | 2017-06-14 | 2017-11-24 | 广东网金控股股份有限公司 | 一种基于聚类算法的金融终端安全保护方法及系统 |
CN107562798A (zh) * | 2017-08-02 | 2018-01-09 | 北京大学(天津滨海)新代信息技术研究院 | 一种基于用户的时间地理数据的实时信息推荐方法 |
CN108509434A (zh) * | 2017-02-23 | 2018-09-07 | 中国移动通信有限公司研究院 | 一种群体用户的挖掘方法及装置 |
CN109947874A (zh) * | 2017-11-16 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 移动轨迹的聚合方法、装置及设备 |
CN110119762A (zh) * | 2019-04-15 | 2019-08-13 | 华东师范大学 | 基于聚类的人类行为依赖分析方法 |
CN110349372A (zh) * | 2019-06-10 | 2019-10-18 | 智慧华川养老(北京)有限公司 | 居家养老人员活动异常预警方法和装置 |
CN110503032A (zh) * | 2019-08-21 | 2019-11-26 | 中南大学 | 基于监控摄像头轨迹数据的个体重要场所探测方法 |
CN111289001A (zh) * | 2018-12-10 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 导航方法和装置以及电子设备 |
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN112444833A (zh) * | 2020-11-05 | 2021-03-05 | 浙江宝聚通信息科技有限公司 | 根据配置有定位器的电动车挂失记录识别被盗电动车存放点的方法及装置 |
CN112905792A (zh) * | 2021-02-20 | 2021-06-04 | 深圳前海微众银行股份有限公司 | 基于非文本场景的文本聚类方法、装置、设备及存储介质 |
CN113470079A (zh) * | 2021-07-15 | 2021-10-01 | 浙江大华技术股份有限公司 | 一种落脚区域的输出方法、装置及电子设备 |
US11468536B2 (en) | 2018-05-18 | 2022-10-11 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending a personalized pick-up location |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731795A (zh) * | 2013-12-19 | 2015-06-24 | 日本电气株式会社 | 用于挖掘个体活动模式的设备和方法 |
CN104965913A (zh) * | 2015-07-03 | 2015-10-07 | 重庆邮电大学 | 一种基于gps地理位置数据挖掘的用户分类方法 |
CN105117424A (zh) * | 2015-07-31 | 2015-12-02 | 中国科学院软件研究所 | 一种基于停留时间的移动对象语义行为模式挖掘方法 |
-
2016
- 2016-08-15 CN CN201610668942.6A patent/CN106339417B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731795A (zh) * | 2013-12-19 | 2015-06-24 | 日本电气株式会社 | 用于挖掘个体活动模式的设备和方法 |
CN104965913A (zh) * | 2015-07-03 | 2015-10-07 | 重庆邮电大学 | 一种基于gps地理位置数据挖掘的用户分类方法 |
CN105117424A (zh) * | 2015-07-31 | 2015-12-02 | 中国科学院软件研究所 | 一种基于停留时间的移动对象语义行为模式挖掘方法 |
Non-Patent Citations (2)
Title |
---|
PABLOBELLVER A K: "Extractiong patterns from location history", 《PROCEEDINGS OF THE 19TH ACM SIGSPATIAL INTERNATIONAL CONFERENCE ON ADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS》 * |
张健钦: "基于时空轨迹数据的出行特征挖掘方法", 《交通运输系统工程与信息》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509434A (zh) * | 2017-02-23 | 2018-09-07 | 中国移动通信有限公司研究院 | 一种群体用户的挖掘方法及装置 |
CN108509434B (zh) * | 2017-02-23 | 2020-12-25 | 中国移动通信有限公司研究院 | 一种群体用户的挖掘方法及装置 |
CN107395562A (zh) * | 2017-06-14 | 2017-11-24 | 广东网金控股股份有限公司 | 一种基于聚类算法的金融终端安全保护方法及系统 |
CN107562798A (zh) * | 2017-08-02 | 2018-01-09 | 北京大学(天津滨海)新代信息技术研究院 | 一种基于用户的时间地理数据的实时信息推荐方法 |
CN109947874A (zh) * | 2017-11-16 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 移动轨迹的聚合方法、装置及设备 |
US11468536B2 (en) | 2018-05-18 | 2022-10-11 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending a personalized pick-up location |
CN111289001B (zh) * | 2018-12-10 | 2023-10-20 | 阿里巴巴集团控股有限公司 | 导航方法和装置以及电子设备 |
CN111289001A (zh) * | 2018-12-10 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 导航方法和装置以及电子设备 |
CN110119762A (zh) * | 2019-04-15 | 2019-08-13 | 华东师范大学 | 基于聚类的人类行为依赖分析方法 |
CN110119762B (zh) * | 2019-04-15 | 2023-09-26 | 华东师范大学 | 基于聚类的人类行为依赖分析方法 |
CN110349372A (zh) * | 2019-06-10 | 2019-10-18 | 智慧华川养老(北京)有限公司 | 居家养老人员活动异常预警方法和装置 |
CN110349372B (zh) * | 2019-06-10 | 2021-11-19 | 智慧华川养老(北京)有限公司 | 居家养老人员活动异常预警方法和装置 |
CN110503032B (zh) * | 2019-08-21 | 2021-08-31 | 中南大学 | 基于监控摄像头轨迹数据的个体重要场所探测方法 |
CN110503032A (zh) * | 2019-08-21 | 2019-11-26 | 中南大学 | 基于监控摄像头轨迹数据的个体重要场所探测方法 |
CN111563190A (zh) * | 2020-04-07 | 2020-08-21 | 中国电子科技集团公司第二十九研究所 | 一种区域网络用户行为的多维度分析与监管方法及系统 |
CN112444833A (zh) * | 2020-11-05 | 2021-03-05 | 浙江宝聚通信息科技有限公司 | 根据配置有定位器的电动车挂失记录识别被盗电动车存放点的方法及装置 |
CN112905792A (zh) * | 2021-02-20 | 2021-06-04 | 深圳前海微众银行股份有限公司 | 基于非文本场景的文本聚类方法、装置、设备及存储介质 |
CN113470079A (zh) * | 2021-07-15 | 2021-10-01 | 浙江大华技术股份有限公司 | 一种落脚区域的输出方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN106339417B (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106339417A (zh) | 基于移动轨迹中停留点的用户群体行为规律检测方法 | |
CN105409306B (zh) | 移动终端位置预测方法及装置 | |
CN102905368B (zh) | 基于智能手机平台的移动辅助室内定位方法和系统 | |
Gambs et al. | Next place prediction using mobility markov chains | |
CN103747523B (zh) | 一种基于无线网络的用户位置预测系统和方法 | |
CN107018493B (zh) | 一种基于连续时序马尔科夫模型的地理位置预测方法 | |
Lian et al. | Collaborative filtering meets next check-in location prediction | |
CN110414732B (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
CN109005515A (zh) | 一种基于移动轨迹信息的用户行为模式画像的方法 | |
CN103218442A (zh) | 一种基于移动设备传感器数据的生活模式分析方法及系统 | |
Welbourne et al. | Mobile context inference using low-cost sensors | |
CN109587350A (zh) | 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法 | |
CN111582948A (zh) | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 | |
Chen et al. | Predicting next locations with object clustering and trajectory clustering | |
CN105760780A (zh) | 基于路网的轨迹数据隐私保护方法 | |
CN109034187A (zh) | 一种用户家庭工作地址挖掘流程 | |
Qin et al. | Spatio-temporal routine mining on mobile phone data | |
Du et al. | Group mobility classification and structure recognition using mobile devices | |
Li et al. | A personal location prediction method based on individual trajectory and group trajectory | |
Chen | Mining individual behavior pattern based on significant locations and spatial trajectories | |
CN107133689B (zh) | 一种位置标记方法 | |
CN111126718A (zh) | 一种台风路径预测方法 | |
Cheng et al. | An unsupervised approach for semantic place annotation of trajectories based on the prior probability | |
CN110958558A (zh) | 一种基于移动大数据的手机用户时空轨迹刻画方法 | |
De Paola et al. | Detection of points of interest in a smart campus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |