CN106203505B - 一种利用手机定位数据判断用户移动与停留状态的方法 - Google Patents
一种利用手机定位数据判断用户移动与停留状态的方法 Download PDFInfo
- Publication number
- CN106203505B CN106203505B CN201610539286.XA CN201610539286A CN106203505B CN 106203505 B CN106203505 B CN 106203505B CN 201610539286 A CN201610539286 A CN 201610539286A CN 106203505 B CN106203505 B CN 106203505B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- state
- probability
- stay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Mobile Radio Communication Systems (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种利用手机定位数据判断用户移动与停留状态的方法,属于交通运输技术领域。以用户手机定位产生的连续轨迹数据,建立基于朴素贝叶斯分类器的移动或停留状态识别方法,具体包括:一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。
Description
技术领域
本发明属于交通运输技术领域。可根据手机用户在城市空间内移动的轨迹数据准确地判断用户处于移动或者停留状态,用于获取城市居民出行信息。
背景技术
居民日常出行活动是城市交通需求的直接反映,通常采用出行OD、出行时间、时行耗时、出行结构等指标表征,目前这些表征指标的获取主要利用人工调查手段,费时、费力且精度低,北京市于2014的开展的第5次居民出行调查,花费约3000万,耗时近一年时间,抽样率不足1%,能够调查到的信息非常有限。随着移动通信技术的发展,利用手机定位数据对居民出行过程进行追踪成为可能,通过对轨迹数据的分析,得到出行表征指标,轨迹数据分析的核心内容就是判别用户的移动或停留状态,只有判断出用户的移动停留状态后,才能精准计算出行表征指标。因此,移动或停留状态的识别,是利用手机定位数据进行交通需求分析的关键。但手机定位数据具有定位精度低、时间间隔不均匀、离散性大等特征,对判别移动或停留状态的方法提出了较高的要求。
发明内容
本发明提供一种判断手机定位轨迹数据移动或停留状态方法,为手机定位数据的应用奠定了基础,方法分为两部分,过程如下:
一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。
一种利用手机定位数据判断用户移动状态的方法,本方法包括以下步骤,
步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为其中UserIDn表示第n个用户的唯一标识码,表示n个用户第i条记录所处的位置横坐标,Yi n表示n个用户第i条记录所处的位置纵坐标,Ti n表示n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点与前后时间相邻点的速度Vi n大于阈值VT,且距离大于阈值DT时,去掉该记录点;
步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值由数据的稀疏程度决定,参考取值范围在5-30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm},c1,c2...cm表示集合CI的各元素,cm表示从0点开始,以时间间隔TI均匀递增,处于第m个时间间隔的时间戳;把用户的任意记录手机数据的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,即cm中对应多条或没有一条对应;建立标准间隔用户记录用于表示用户n在第m个时间间隔处的记录,其中m、n意义同前,计算过程如下:
(2)当不存在一条手机数据对应cm时,进行数据填补,根据cm前后邻近的记录,由线性插值计算得到和仍由第m个时间间隔处的时间戳cm表示,当前后邻近的时间大于阈值TE时,TE取值大于24小时,认为用户数据缺失严重,不宜填补;
步骤3:用户分类,受手机定位数据采集原理的影响,不同用户根据空间活动范围的大小,产生的手机定位数据呈现出的位置精度误差存在一定差异,根据用户的活动范围大小进行分类,针对不同类别的用户,分别建立对应的移动停留状态分类器,活动范围是指用户在白天工作时段和夜晚休息时段,所处位置的平均加权中心点之间的空间距离,白天工作时段和夜晚休息时段的时间范围根据城市上下班时间定,各时段能按以下进行选定:白天工作时段从上午9时至11:30,以及下午13:30至15:00,夜晚休息时段从22:00至次日早上5时,根据距离值的大小划分为若干类别,下表中的类别划分可供参考:
类别 | 活动范围(单位:米) |
A | [0,600) |
B | [600,1500) |
C | [1500,3000) |
D | [3000,+∞) |
步骤4:利用步骤2聚合填补后的数据,计算用于描述用户移动停留状态的特征参数:方向夹角和周围点最小覆盖圆直径,过程如下,
步骤5:建立面向不同类别的朴素贝叶斯分类器,分类器的关键指标计算过程如下:
(2)根据步骤3,把中的数据按用户进行分类,针对同一类别的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove表示移动状态的记录数量,Q表示训练样本的总数量;处于停留状态的概率Pstay=Qstay/Q,Qstay表示停留状态的记录数量;
(3)计算移动状态下不同方向夹角值A发生的离散概率表示训练样本中,处于移动状态下方向夹角值为Ai的样本量;计算移动状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于移动状态下周围点最小覆盖圆直径为Φi的样本量;
(4)计算停留状态下不同方向夹角值A发生的离散概率表示训练样本中,处于停留状态下方向夹角值为Ai的样本量;计算停留状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于停留状态下周围点最小覆盖圆直径为Φi的样本量;
其中:表示在移动状态下,周围点最小覆盖圆直径为时发生的概率,通过从步骤5建立的朴素贝叶斯分类器中的P(Φ|move)寻找与相同的概率值表示, 的计算过程与此类似,Pmove、Pstay意义同前,PM对于所有类别为常数;
本发明具有以下有益效果:
该发明的基础数据来源于无线通信网络,通过建立朴素贝叶斯分类器,可快速、准确地分析用户所处的状态,进而判断出行起终位置、出行时间、出行距离、出行模式等信息。
附图说明
图1.本方法的实施流程。
具体实施方式
下面结合附图1对本发明详细描述其具体实施过程。
整体过程如图1:本方法计算流程所示。分为两部分内容,一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。
以一个用户产生的手机定位数据为例进行说明,
步骤1、用户的手机定位数据按时间先后顺序排序,如表1所示,根据Yi n、Ti n,计算相邻点的速度(示例数据Yi n为经度和纬度,计算距离为平面投影距离,本说明中未加说明的“距离”,均与此含义一致),过滤噪声数据,VT阈值取160千米/小时,距离阈值取1.5千米,没有同时满足这两条件的记录,无须给予剔除;
表1
步骤2:在上一步的基础上,以时间间隔TI进行聚合与填补,本例中TI取10分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={2015/6/1 0:0:0,2015/6/1 0:10:0…2015/6/1 12:50:0},表2中的字段,把用户的任意记录(表1)的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,结果在表1与表2对应的记录序号中,如表1中第1条记录的Ti n值“2015/6/2 8:25:48”与CI中就近的时间是“2015/6/2 8:30:00”,对应表2的第1条记录,因此,表2中和取值与表1中第1条记录相同;
表2
步骤3:根据用户的活动范围大小进行分类,用前面的用户数据(即表1)进行活动范围说明,取白天工作时段(取上午9时至11:30,以及下午13:30至15:00)的平均位置中心(118.1128,24.4733),和夜晚休息时段(取22:00至次日早上5时)的位置中心(118.13923,24.49652),距离为3717.5米,按表3中的类别划分依据可知,用户属于“D”类:
表3
其它记录方法类似;计算周围点最小覆盖圆直径,以为中心,时间范围内的记录所构成的空间点集,这里λ取2,以表2中第3条记录为例进行说明,取范围内的记录,即第1-5条,形成空间点集计算点集的最小覆盖圆的直径以同样方法计算其它点集的最小覆盖圆的直径;
步骤5:以建立D类朴素贝叶斯分类器为例,说明分类器建立的过程:
(2)根据步骤3,把中的数据按用户进行分类,针对同属于D类的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove有1636条数量,因此Pmove=1636/10000=0.1636;处于停留状态的概率Pstay=Qstay/Q,Qstay有8364条记录,因此,Pstay=8364/10000=0.8364;
(3)计算移动状态下不同方向夹角值A发生的离散概率表示训练样本中,处于移动状态下方向夹角值为Ai的样本量,Qmove同前;计算移动状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于移动状态下周围点最小覆盖圆直径为Φi的样本量,Qmove同前,计算结果见表4和表5;
(4)计算停留状态下不同方向夹角值A发生的离散概率表示训练样本中,处于停留状态下方向夹角值为Ai的样本量,Qstay同前;计算停留状态下周围点最小覆盖圆直径Φ发生的离散概率表示训练样本中,处于停留状态下周围点最小覆盖圆直径为Φi的样本量,Qstay同前,计算结果见表4和表5;
表4:移动和停留状态下不同方向夹角值A发生的离散概率
表5:移动和停留状态下最小覆盖圆直径Φ发生的离散概率
步骤6:计算归属于移动或停留状态的概率,其中移动状态概率和停留状态概率用以表2中第3条记录为例进行说明,Ai值为87.54,Φi值为3833.045,Ai值四舍五入取整数88,Φi值四舍五入取整百为3800,比较表4和表5,得到 Pmove=0.1636,Pstay=0.8364
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
Claims (1)
1.一种利用手机定位数据判断用户移动状态的方法,其特征在于:
本方法包括以下步骤,
步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为其中UserIDn表示第n个用户的唯一标识码,表示第n个用户第i条记录所处的位置横坐标,Yi n表示第n个用户第i条记录所处的位置纵坐标,Ti n表示第n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点Vi n与前一时间相邻点的速度和后一时间相邻点的速度均大于阈值VT,且距离均大于阈值DT时,去掉该记录点;
步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值范围在5-30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm},c1,c2...cm表示集合CI的各元素,cm表示从0点开始,以时间间隔TI均匀递增,处于第m个时间间隔的时间戳,把用户的任意记录手机数据的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,即cm中对应多条或没有一条对应;建立标准间隔用户记录用于表示用户n在第m个时间间隔处的记录,其中m、n意义同前,计算过程如下:
(2)当不存在一条手机数据对应cm时,进行数据填补,根据cm前后邻近的记录,由线性插值计算得到和仍由第m个时间间隔处的时间戳cm表示,当前后邻近的时间间隔大于阈值TE时,TE取值大于24小时,认为用户数据缺失严重,不填补;
步骤3:用户分类,受手机定位数据采集原理的影响,不同用户根据空间活动范围的大小,产生的手机定位数据呈现出的位置精度误差存在一定差异,根据用户的活动范围大小进行分类,针对不同类别的用户,分别建立对应的移动停留状态分类器,活动范围是指用户在白天工作时段和夜晚休息时段,所处位置的平均加权中心点之间的空间距离,白天工作时段和夜晚休息时段的时间范围根据城市上下班时间定,各时段的选定如下:白天工作时段从上午9时至11:30,以及下午13:30至15:00,夜晚休息时段从22:00至次日早上5时,根据距离值的大小划分为若干类别:类别1:用户活动范围在[0,600)米,类别2用户活动范围在[600,1500)米,类别3用户活动范围在[1500,3000)米,类别4用户活动范围在[3000,+∞)米;
步骤5:建立面向不同类别的朴素贝叶斯分类器,分类器的关键指标计算过程如下:
(2)根据步骤3,把中的数据按用户进行分类,针对同一类别的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove表示移动状态的记录数量,Q表示训练样本的总数量;处于停留状态的概率Pstay=Qstay/Q,Qstay表示停留状态的记录数量;
(3)计算移动状态下不同方向夹角值发生的离散概率 表示训练样本中,处于移动状态下方向夹角值为的样本量;计算移动状态下周围点最小覆盖圆直径发生的离散概率 表示训练样本中,处于移动状态下周围点最小覆盖圆直径为的样本量;
(4)计算停留状态下不同方向夹角值发生的离散概率 表示训练样本中,处于停留状态下方向夹角值为的样本量;计算停留状态下周围点最小覆盖圆直径发生的离散概率 表示训练样本中,处于停留状态下周围点最小覆盖圆直径为的样本量;
其中:表示在移动状态下,周围点最小覆盖圆直径为时发生的概率,通过从步骤5建立的朴素贝叶斯分类器中的P(Φ|move)寻找与相同的概率值表示, 的计算过程与此类似,Pmove、Pstay意义同前,PM对于所有类别为常数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610539286.XA CN106203505B (zh) | 2016-07-10 | 2016-07-10 | 一种利用手机定位数据判断用户移动与停留状态的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610539286.XA CN106203505B (zh) | 2016-07-10 | 2016-07-10 | 一种利用手机定位数据判断用户移动与停留状态的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106203505A CN106203505A (zh) | 2016-12-07 |
CN106203505B true CN106203505B (zh) | 2020-01-10 |
Family
ID=57473804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610539286.XA Active CN106203505B (zh) | 2016-07-10 | 2016-07-10 | 一种利用手机定位数据判断用户移动与停留状态的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106203505B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108882168B (zh) * | 2017-05-10 | 2020-09-08 | 腾讯科技(深圳)有限公司 | 出行轨迹获取方法、装置及服务器 |
CN108646267A (zh) * | 2018-05-15 | 2018-10-12 | 广州极飞科技有限公司 | 一种识别采样点的方法及装置 |
CN109302683B (zh) * | 2018-10-26 | 2021-01-29 | 福州大学 | 一种基于重复跳转模式的手机位置数据中异常记录检测方法 |
CN109561385B (zh) * | 2019-01-11 | 2021-09-24 | 福州大学 | 基于频繁大幅转向模式的手机位置数据异常记录检测方法 |
CN110647675B (zh) | 2019-08-07 | 2022-05-27 | 北京百度网讯科技有限公司 | 停留点识别及预测模型训练方法、装置及存储介质 |
CN110677815A (zh) | 2019-08-07 | 2020-01-10 | 北京百度网讯科技有限公司 | 停留点识别方法、装置、计算机设备及存储介质 |
CN111340331B (zh) * | 2020-02-10 | 2023-11-14 | 泰华智慧产业集团股份有限公司 | 城市管理工作中监督员停留行为的分析方法及系统 |
CN113469600A (zh) * | 2020-03-31 | 2021-10-01 | 北京三快在线科技有限公司 | 行程轨迹分段方法、装置、存储介质和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314179A (zh) * | 2011-05-04 | 2012-01-11 | 杭州电子科技大学 | 基于手机及内置重力感应器的云台控制方法 |
CN103179509A (zh) * | 2013-03-11 | 2013-06-26 | 北京工业大学 | 基于手机定位信息的地铁乘客出行路径辨识方法 |
CN103813446A (zh) * | 2014-02-17 | 2014-05-21 | 百度在线网络技术(北京)有限公司 | 一种估算停留区域范围的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013003860A1 (en) * | 2011-06-30 | 2013-01-03 | Yale University | Subject sensing in an environment |
-
2016
- 2016-07-10 CN CN201610539286.XA patent/CN106203505B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102314179A (zh) * | 2011-05-04 | 2012-01-11 | 杭州电子科技大学 | 基于手机及内置重力感应器的云台控制方法 |
CN103179509A (zh) * | 2013-03-11 | 2013-06-26 | 北京工业大学 | 基于手机定位信息的地铁乘客出行路径辨识方法 |
CN103813446A (zh) * | 2014-02-17 | 2014-05-21 | 百度在线网络技术(北京)有限公司 | 一种估算停留区域范围的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106203505A (zh) | 2016-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106203505B (zh) | 一种利用手机定位数据判断用户移动与停留状态的方法 | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
Bachir et al. | Inferring dynamic origin-destination flows by transport mode using mobile phone data | |
CN110324787B (zh) | 一种手机信令数据的职住地获取方法 | |
CN106912015B (zh) | 一种基于移动网络数据的人员出行链识别方法 | |
Cartwright et al. | SONYC-UST-V2: An urban sound tagging dataset with spatiotemporal context | |
CN102253426B (zh) | 采用空间密度聚类进行雷电运动预测的方法 | |
CN105307121B (zh) | 一种信息处理方法及装置 | |
CN111178611B (zh) | 一种日电量预测的方法 | |
CN107679558A (zh) | 一种基于度量学习的用户轨迹相似性度量方法 | |
CN105740904B (zh) | 一种基于dbscan聚类算法的出行与活动模式识别方法 | |
CN108629000A (zh) | 一种手机轨迹数据聚类的群体行为特征提取方法及系统 | |
CN109635010B (zh) | 一种用户特征及特征因子抽取、查询方法和系统 | |
CN112653991A (zh) | 一种基于深度学习的TebNet神经网络模型的WLAN室内定位方法 | |
CN106935038B (zh) | 一种停车检测系统及检测方法 | |
CN111242352A (zh) | 基于车辆轨迹的停等聚集效应预测方法 | |
CN116010838A (zh) | 一种融合密度值和K-means算法的车辆轨迹聚类方法 | |
Brščić et al. | Changes in usage of an indoor public space: Analysis of one year of person tracking | |
CN115032693A (zh) | 一种强震的前震自动识别方法及装置 | |
CN116132923A (zh) | 一种基于手机信令数据的高精度时空轨迹复原方法 | |
CN110443311A (zh) | 一种基于形状因素调整的交通轨迹聚类相似性计算方法 | |
CN112801181B (zh) | 城市信令交通流用户分类、预测方法、存储介质及系统 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN110399919A (zh) | 一种人类出行稀疏轨迹数据插值重构方法 | |
CN110213711A (zh) | 一种常驻点的估计方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |