CN106203505B - 一种利用手机定位数据判断用户移动与停留状态的方法 - Google Patents

一种利用手机定位数据判断用户移动与停留状态的方法 Download PDF

Info

Publication number
CN106203505B
CN106203505B CN201610539286.XA CN201610539286A CN106203505B CN 106203505 B CN106203505 B CN 106203505B CN 201610539286 A CN201610539286 A CN 201610539286A CN 106203505 B CN106203505 B CN 106203505B
Authority
CN
China
Prior art keywords
user
data
state
probability
stay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610539286.XA
Other languages
English (en)
Other versions
CN106203505A (zh
Inventor
赖见辉
陈艳艳
张政
张文
池洪潮
陈晓峰
方珊珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BOCO INTER-TELECOM TECHNOLOGY Co Ltd
Beijing University of Technology
Original Assignee
BEIJING BOCO INTER-TELECOM TECHNOLOGY Co Ltd
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BOCO INTER-TELECOM TECHNOLOGY Co Ltd, Beijing University of Technology filed Critical BEIJING BOCO INTER-TELECOM TECHNOLOGY Co Ltd
Priority to CN201610539286.XA priority Critical patent/CN106203505B/zh
Publication of CN106203505A publication Critical patent/CN106203505A/zh
Application granted granted Critical
Publication of CN106203505B publication Critical patent/CN106203505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种利用手机定位数据判断用户移动与停留状态的方法,属于交通运输技术领域。以用户手机定位产生的连续轨迹数据,建立基于朴素贝叶斯分类器的移动或停留状态识别方法,具体包括:一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。

Description

一种利用手机定位数据判断用户移动与停留状态的方法
技术领域
本发明属于交通运输技术领域。可根据手机用户在城市空间内移动的轨迹数据准确地判断用户处于移动或者停留状态,用于获取城市居民出行信息。
背景技术
居民日常出行活动是城市交通需求的直接反映,通常采用出行OD、出行时间、时行耗时、出行结构等指标表征,目前这些表征指标的获取主要利用人工调查手段,费时、费力且精度低,北京市于2014的开展的第5次居民出行调查,花费约3000万,耗时近一年时间,抽样率不足1%,能够调查到的信息非常有限。随着移动通信技术的发展,利用手机定位数据对居民出行过程进行追踪成为可能,通过对轨迹数据的分析,得到出行表征指标,轨迹数据分析的核心内容就是判别用户的移动或停留状态,只有判断出用户的移动停留状态后,才能精准计算出行表征指标。因此,移动或停留状态的识别,是利用手机定位数据进行交通需求分析的关键。但手机定位数据具有定位精度低、时间间隔不均匀、离散性大等特征,对判别移动或停留状态的方法提出了较高的要求。
发明内容
本发明提供一种判断手机定位轨迹数据移动或停留状态方法,为手机定位数据的应用奠定了基础,方法分为两部分,过程如下:
一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。
一种利用手机定位数据判断用户移动状态的方法,本方法包括以下步骤,
步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为
Figure GDA0002145952970000021
其中UserIDn表示第n个用户的唯一标识码,表示n个用户第i条记录所处的位置横坐标,Yi n表示n个用户第i条记录所处的位置纵坐标,Ti n表示n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点与前后时间相邻点的速度Vi n大于阈值VT,且距离
Figure GDA0002145952970000023
大于阈值DT时,去掉该记录点;
步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值由数据的稀疏程度决定,参考取值范围在5-30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm},c1,c2...cm表示集合CI的各元素,cm表示从0点开始,以时间间隔TI均匀递增,处于第m个时间间隔的时间戳;把用户的任意记录手机数据
Figure GDA0002145952970000031
的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,即cm中对应多条
Figure GDA0002145952970000032
或没有一条对应;建立标准间隔用户记录
Figure GDA0002145952970000033
用于表示用户n在第m个时间间隔处的记录,其中m、n意义同前,
Figure GDA0002145952970000034
计算过程如下:
(1)当存在多条手机数据
Figure GDA0002145952970000035
对应cm时,进行数据聚合,
Figure GDA0002145952970000036
Figure GDA0002145952970000037
取对应的多个Yi n的平均值,
Figure GDA0002145952970000039
表示第m个时间间隔处的时间戳cm
(2)当不存在一条手机数据
Figure GDA00021459529700000310
对应cm时,进行数据填补,根据cm前后邻近的
Figure GDA00021459529700000311
记录,由线性插值计算得到
Figure GDA00021459529700000312
Figure GDA00021459529700000313
仍由第m个时间间隔处的时间戳cm表示,当前后邻近的
Figure GDA00021459529700000314
时间大于阈值TE时,TE取值大于24小时,认为用户数据缺失严重,不宜填补;
步骤3:用户分类,受手机定位数据采集原理的影响,不同用户根据空间活动范围的大小,产生的手机定位数据呈现出的位置精度误差存在一定差异,根据用户的活动范围大小进行分类,针对不同类别的用户,分别建立对应的移动停留状态分类器,活动范围是指用户在白天工作时段和夜晚休息时段,所处位置的平均加权中心点之间的空间距离,白天工作时段和夜晚休息时段的时间范围根据城市上下班时间定,各时段能按以下进行选定:白天工作时段从上午9时至11:30,以及下午13:30至15:00,夜晚休息时段从22:00至次日早上5时,根据距离值的大小划分为若干类别,下表中的类别划分可供参考:
类别 活动范围(单位:米)
A [0,600)
B [600,1500)
C [1500,3000)
D [3000,+∞)
步骤4:利用步骤2聚合填补后的数据,计算用于描述用户移动停留状态的特征参数:方向夹角和周围点最小覆盖圆直径,过程如下,
(1)构建方向向量
Figure GDA0002145952970000042
m,n意义同前,
Figure GDA0002145952970000043
Figure GDA0002145952970000045
中的三个变量X,Y,T的差值构成,其中 计算方向向量
Figure GDA0002145952970000048
与标准向量
Figure GDA0002145952970000049
形成的方向夹角
Figure GDA00021459529700000410
PI为圆周率常数;
(2)计算周围点最小覆盖圆直径,用于表征用户的运动速度,它是指
Figure GDA00021459529700000411
为中心,时间范围内的记录所构成的空间点集
Figure GDA00021459529700000413
的最小覆盖圆的直径
Figure GDA00021459529700000414
λ取整数,其范围为2-4;
步骤5:建立面向不同类别的朴素贝叶斯分类器,分类器的关键指标计算过程如下:
(1)假定有一定样本量的数据,用于训练分类器,已先验掌握其处于移动或停留状态,记为
Figure GDA00021459529700000416
该数据能够通过人工跟踪调查或者判断得到,定义特征属性集合M,它包括方向夹角A和周围点最小覆盖圆直径Φ两个变量;
(2)根据步骤3,把
Figure GDA0002145952970000051
中的数据按用户进行分类,针对同一类别的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove表示移动状态的记录数量,Q表示训练样本的总数量;处于停留状态的概率Pstay=Qstay/Q,Qstay表示停留状态的记录数量;
(3)计算移动状态下不同方向夹角值A发生的离散概率
Figure GDA0002145952970000052
表示训练样本中,处于移动状态下方向夹角值为Ai的样本量;计算移动状态下周围点最小覆盖圆直径Φ发生的离散概率
Figure GDA0002145952970000053
表示训练样本中,处于移动状态下周围点最小覆盖圆直径为Φi的样本量;
(4)计算停留状态下不同方向夹角值A发生的离散概率
Figure GDA0002145952970000054
表示训练样本中,处于停留状态下方向夹角值为Ai的样本量;计算停留状态下周围点最小覆盖圆直径Φ发生的离散概率
Figure GDA0002145952970000055
表示训练样本中,处于停留状态下周围点最小覆盖圆直径为Φi的样本量;
步骤6:计算
Figure GDA0002145952970000056
归属于移动或停留状态的概率,其中移动状态概率
Figure GDA0002145952970000057
表示用户n的第m条记录,在方向夹角为
Figure GDA0002145952970000058
最小覆盖圆的直径
Figure GDA0002145952970000059
的条件下,用户处于移动状态的概率,同理,处于停留状态概率用
Figure GDA00021459529700000510
表示,计算过程如下:
Figure GDA00021459529700000512
其中:
Figure GDA00021459529700000513
表示在移动状态下,周围点最小覆盖圆直径为
Figure GDA00021459529700000514
时发生的概率,通过从步骤5建立的朴素贝叶斯分类器中的P(Φ|move)寻找与
Figure GDA0002145952970000061
相同的概率值表示,
Figure GDA0002145952970000062
Figure GDA0002145952970000063
的计算过程与此类似,Pmove、Pstay意义同前,PM对于所有类别为常数;
步骤7:比较
Figure GDA0002145952970000064
Figure GDA0002145952970000065
值大小,若
Figure GDA0002145952970000066
大于则判断用户处于移动状态,反之处于停留状态。
本发明具有以下有益效果:
该发明的基础数据来源于无线通信网络,通过建立朴素贝叶斯分类器,可快速、准确地分析用户所处的状态,进而判断出行起终位置、出行时间、出行距离、出行模式等信息。
附图说明
图1.本方法的实施流程。
具体实施方式
下面结合附图1对本发明详细描述其具体实施过程。
整体过程如图1:本方法计算流程所示。分为两部分内容,一是建立朴素贝叶斯分类器,利用一定量的训练样本,进行用户分类,计算移动和停留状态的概率以及发生停留或移动状态时特征参数值(方向夹角和最小覆盖圆直径)发生的概率;二是利用朴素贝叶斯分类器对手机定位数据进行移动或停留状态判别,首先进行异常数据过滤,根据数据的稀疏程度进行聚合与填补,然后进行用户分类,计算特征参数方向夹角和最小覆盖圆直径的值,最后利用建立好的朴素贝叶斯分类器,计算类别的条件概率,判断用户状态的类别归属。
以一个用户产生的手机定位数据为例进行说明,
步骤1、用户的手机定位数据按时间先后顺序排序,如表1所示,根据
Figure GDA0002145952970000071
Yi n、Ti n,计算相邻点的速度(示例数据
Figure GDA0002145952970000072
Yi n为经度和纬度,计算距离为平面投影距离,本说明中未加说明的“距离”,均与此含义一致),过滤噪声数据,VT阈值取160千米/小时,距离
Figure GDA0002145952970000073
阈值取1.5千米,没有同时满足这两条件的记录,无须给予剔除;
表1
Figure GDA0002145952970000074
步骤2:在上一步的基础上,以时间间隔TI进行聚合与填补,本例中TI取10分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={2015/6/1 0:0:0,2015/6/1 0:10:0…2015/6/1 12:50:0},表2中的
Figure GDA0002145952970000075
字段,把用户的任意记录
Figure GDA0002145952970000076
(表1)的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,结果在表1与表2对应的记录序号中,如表1中第1条记录的Ti n值“2015/6/2 8:25:48”与CI中就近的时间是“2015/6/2 8:30:00”,对应表2的第1条记录,因此,表2中
Figure GDA0002145952970000082
Figure GDA0002145952970000083
取值与表1中第1条记录相同;
第2-4条记录,与CI中就近的时间是“2015/6/2 8:40:00”,因此,表2中第2条记录的
Figure GDA0002145952970000085
取值为这3条记录的平均值;
第5条记录,与CI中就近的时间
Figure GDA0002145952970000087
是“2015/6/2 9:00:00”,因此,表2中
Figure GDA0002145952970000088
Figure GDA0002145952970000089
取值(第4条记录)与表1中第5条记录相同;存在对应关系的记录,以类似方法对
Figure GDA00021459529700000810
Figure GDA00021459529700000811
进行赋值;
表2中灰色单元格中的记录,在表1中无法找到对应的记录,以10分钟为等间隔,利用邻近数据进行线性插值填补,如表2中第3条记录,
Figure GDA00021459529700000812
Figure GDA00021459529700000813
的值为第2条和第4条记录的平均值,同理,计算其它灰色单元格中的记录;
表2
Figure GDA00021459529700000814
Figure GDA0002145952970000091
Figure GDA0002145952970000101
步骤3:根据用户的活动范围大小进行分类,用前面的用户数据
Figure GDA0002145952970000102
(即表1)进行活动范围说明,取白天工作时段(取上午9时至11:30,以及下午13:30至15:00)的平均位置中心(118.1128,24.4733),和夜晚休息时段(取22:00至次日早上5时)的位置中心(118.13923,24.49652),距离为3717.5米,按表3中的类别划分依据可知,用户属于“D”类:
表3
步骤4:利用步骤2聚合填补后的
Figure GDA0002145952970000112
数据,计算用于描述用户移动停留状态的特征参数:方向夹角和周围点最小覆盖圆直径,如表2中第1条记录,与第2条记录形成的方向向量
Figure GDA0002145952970000113
Figure GDA0002145952970000114
时间单位是微秒,与标准向量
Figure GDA0002145952970000115
形成的方向夹角
Figure GDA0002145952970000116
其它记录方法类似;计算周围点最小覆盖圆直径,以为中心,时间范围内的记录所构成的空间点集,这里λ取2,以表2中第3条记录为例进行说明,取
Figure GDA0002145952970000119
范围内的记录,即第1-5条,形成空间点集
Figure GDA00021459529700001110
计算点集的最小覆盖圆的直径以同样方法计算其它点集的最小覆盖圆的直径;
步骤5:以建立D类朴素贝叶斯分类器为例,说明分类器建立的过程:
(1)假定利用人工跟踪调查方式,得到训练的样本量数据
Figure GDA00021459529700001112
10000条,已先验掌握其处于移动或停留状态,采用步骤4的方法计算特征属性集合M,包括方向夹角A和周围点最小覆盖圆直径Φ两个变量的值;
(2)根据步骤3,把
Figure GDA00021459529700001113
中的数据按用户进行分类,针对同属于D类的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove有1636条数量,因此Pmove=1636/10000=0.1636;处于停留状态的概率Pstay=Qstay/Q,Qstay有8364条记录,因此,Pstay=8364/10000=0.8364;
(3)计算移动状态下不同方向夹角值A发生的离散概率
Figure GDA0002145952970000121
表示训练样本中,处于移动状态下方向夹角值为Ai的样本量,Qmove同前;计算移动状态下周围点最小覆盖圆直径Φ发生的离散概率
Figure GDA0002145952970000122
表示训练样本中,处于移动状态下周围点最小覆盖圆直径为Φi的样本量,Qmove同前,计算结果见表4和表5;
(4)计算停留状态下不同方向夹角值A发生的离散概率
Figure GDA0002145952970000123
表示训练样本中,处于停留状态下方向夹角值为Ai的样本量,Qstay同前;计算停留状态下周围点最小覆盖圆直径Φ发生的离散概率
Figure GDA0002145952970000124
表示训练样本中,处于停留状态下周围点最小覆盖圆直径为Φi的样本量,Qstay同前,计算结果见表4和表5;
表4:移动和停留状态下不同方向夹角值A发生的离散概率
Figure GDA0002145952970000125
Figure GDA0002145952970000131
表5:移动和停留状态下最小覆盖圆直径Φ发生的离散概率
Figure GDA0002145952970000132
Figure GDA0002145952970000141
Figure GDA0002145952970000151
步骤6:计算
Figure GDA0002145952970000152
归属于移动或停留状态的概率,其中移动状态概率
Figure GDA0002145952970000153
和停留状态概率用
Figure GDA0002145952970000154
以表2中第3条记录为例进行说明,Ai值为87.54,Φi值为3833.045,Ai值四舍五入取整数88,Φi值四舍五入取整百为3800,比较表4和表5,得到
Figure GDA0002145952970000156
Pmove=0.1636,Pstay=0.8364
Figure GDA0002145952970000157
Figure GDA0002145952970000158
步骤7:比较
Figure GDA00021459529700001510
值大小,
Figure GDA00021459529700001511
大于
Figure GDA00021459529700001512
说明用户处于移动状态,同理计算其它点的移动停留状态。
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种利用手机定位数据判断用户移动状态的方法,其特征在于:
本方法包括以下步骤,
步骤1:异常数据过滤,对同一用户的手机定位数据按时间先后顺序排序,第n个用户的第i条手机数据记为
Figure FDA0002157848190000011
其中UserIDn表示第n个用户的唯一标识码,
Figure FDA0002157848190000012
表示第n个用户第i条记录所处的位置横坐标,Yi n表示第n个用户第i条记录所处的位置纵坐标,Ti n表示第n个用户第i条记录发生的时间点,对排序数据进行降噪处理,任意记录点Vi n与前一时间相邻点的速度
Figure FDA0002157848190000013
和后一时间相邻点的速度
Figure FDA0002157848190000014
均大于阈值VT,且距离
Figure FDA0002157848190000015
均大于阈值DT时,去掉该记录点;
步骤2:在上一步异常数据过滤后的基础上,把用户记录按一定的时间间隔TI进行聚合与填补,TI的取值范围在5-30分钟,将一天24小时按等时间间隔TI均匀划分,形成集合CI={c1,c2...cm},c1,c2...cm表示集合CI的各元素,cm表示从0点开始,以时间间隔TI均匀递增,处于第m个时间间隔的时间戳,把用户的任意记录手机数据的时间值Ti n与集合CI进行比较,按时间距离就近原则建立对应关系,即cm中对应多条
Figure FDA0002157848190000017
或没有一条对应;建立标准间隔用户记录
Figure FDA0002157848190000018
用于表示用户n在第m个时间间隔处的记录,其中m、n意义同前,计算过程如下:
(1)当存在多条手机数据
Figure FDA00021578481900000110
对应cm时,进行数据聚合,
Figure FDA00021578481900000111
取对应的多个
Figure FDA00021578481900000113
Yi n的平均值,
Figure FDA00021578481900000114
表示第m个时间间隔处的时间戳cm
(2)当不存在一条手机数据
Figure FDA0002157848190000021
对应cm时,进行数据填补,根据cm前后邻近的记录,由线性插值计算得到
Figure FDA0002157848190000023
Figure FDA0002157848190000024
仍由第m个时间间隔处的时间戳cm表示,当前后邻近的
Figure FDA0002157848190000025
时间间隔大于阈值TE时,TE取值大于24小时,认为用户数据缺失严重,不填补;
步骤3:用户分类,受手机定位数据采集原理的影响,不同用户根据空间活动范围的大小,产生的手机定位数据呈现出的位置精度误差存在一定差异,根据用户的活动范围大小进行分类,针对不同类别的用户,分别建立对应的移动停留状态分类器,活动范围是指用户在白天工作时段和夜晚休息时段,所处位置的平均加权中心点之间的空间距离,白天工作时段和夜晚休息时段的时间范围根据城市上下班时间定,各时段的选定如下:白天工作时段从上午9时至11:30,以及下午13:30至15:00,夜晚休息时段从22:00至次日早上5时,根据距离值的大小划分为若干类别:类别1:用户活动范围在[0,600)米,类别2用户活动范围在[600,1500)米,类别3用户活动范围在[1500,3000)米,类别4用户活动范围在[3000,+∞)米;
步骤4:利用步骤2聚合填补后的
Figure FDA0002157848190000026
数据,计算用于描述用户移动停留状态的特征参数:方向夹角和周围点最小覆盖圆直径,过程如下,
(1)构建方向向量
Figure FDA0002157848190000027
m,n意义同前,
Figure FDA0002157848190000028
Figure FDA0002157848190000029
Figure FDA00021578481900000210
中的三个变量X,Y,T的差值构成,其中
Figure FDA00021578481900000211
计算方向向量与标准向量
Figure FDA00021578481900000214
形成的方向夹角
Figure FDA00021578481900000320
Figure FDA0002157848190000031
PI为圆周率常数;
(2)计算周围点最小覆盖圆直径,用于表征用户的运动速度,它是指
Figure FDA0002157848190000032
为中心,
Figure FDA0002157848190000033
时间范围内的记录所构成的空间点集
Figure FDA0002157848190000034
的最小覆盖圆的直径
Figure FDA0002157848190000035
λ取整数,其范围为2-4,TI意义同前;
步骤5:建立面向不同类别的朴素贝叶斯分类器,分类器的关键指标计算过程如下:
(1)用
Figure FDA0002157848190000036
数据训练分类器,已先验掌握其处于移动或停留状态,记为
Figure FDA0002157848190000037
Figure FDA0002157848190000038
能够通过人工跟踪调查或者判断得到,定义特征属性集合M,它包括方向夹角
Figure FDA0002157848190000039
和周围点最小覆盖圆直径
Figure FDA00021578481900000310
两个变量;
(2)根据步骤3,把
Figure FDA00021578481900000311
中的数据按用户进行分类,针对同一类别的数据,分别计算处于移动状态的概率Pmove=Qmove/Q,Qmove表示移动状态的记录数量,Q表示训练样本的总数量;处于停留状态的概率Pstay=Qstay/Q,Qstay表示停留状态的记录数量;
(3)计算移动状态下不同方向夹角值
Figure FDA00021578481900000312
发生的离散概率
Figure FDA00021578481900000313
Figure FDA00021578481900000314
表示训练样本中,处于移动状态下方向夹角值为的样本量;计算移动状态下周围点最小覆盖圆直径
Figure FDA00021578481900000316
发生的离散概率
Figure FDA00021578481900000317
Figure FDA00021578481900000318
表示训练样本中,处于移动状态下周围点最小覆盖圆直径为
Figure FDA00021578481900000319
的样本量;
(4)计算停留状态下不同方向夹角值
Figure FDA0002157848190000041
发生的离散概率
Figure FDA0002157848190000042
表示训练样本中,处于停留状态下方向夹角值为
Figure FDA0002157848190000044
的样本量;计算停留状态下周围点最小覆盖圆直径
Figure FDA0002157848190000045
发生的离散概率
Figure FDA0002157848190000046
Figure FDA0002157848190000047
表示训练样本中,处于停留状态下周围点最小覆盖圆直径为
Figure FDA0002157848190000048
的样本量;
步骤6:计算
Figure FDA0002157848190000049
归属于移动或停留状态的概率,其中移动状态概率
Figure FDA00021578481900000410
表示用户n的第m条记录,在方向夹角为
Figure FDA00021578481900000411
最小覆盖圆的直径
Figure FDA00021578481900000412
的条件下,用户处于移动状态的概率,同理,处于停留状态概率用
Figure FDA00021578481900000413
表示,计算过程如下:
Figure FDA00021578481900000414
Figure FDA00021578481900000415
其中:
Figure FDA00021578481900000416
表示在移动状态下,周围点最小覆盖圆直径为
Figure FDA00021578481900000417
时发生的概率,通过从步骤5建立的朴素贝叶斯分类器中的P(Φ|move)寻找与
Figure FDA00021578481900000418
相同的概率值表示,
Figure FDA00021578481900000419
Figure FDA00021578481900000420
的计算过程与此类似,Pmove、Pstay意义同前,PM对于所有类别为常数;
步骤7:比较
Figure FDA00021578481900000421
Figure FDA00021578481900000422
值大小,若
Figure FDA00021578481900000423
大于
Figure FDA00021578481900000424
则判断用户处于移动状态,反之处于停留状态。
CN201610539286.XA 2016-07-10 2016-07-10 一种利用手机定位数据判断用户移动与停留状态的方法 Active CN106203505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610539286.XA CN106203505B (zh) 2016-07-10 2016-07-10 一种利用手机定位数据判断用户移动与停留状态的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610539286.XA CN106203505B (zh) 2016-07-10 2016-07-10 一种利用手机定位数据判断用户移动与停留状态的方法

Publications (2)

Publication Number Publication Date
CN106203505A CN106203505A (zh) 2016-12-07
CN106203505B true CN106203505B (zh) 2020-01-10

Family

ID=57473804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610539286.XA Active CN106203505B (zh) 2016-07-10 2016-07-10 一种利用手机定位数据判断用户移动与停留状态的方法

Country Status (1)

Country Link
CN (1) CN106203505B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108882168B (zh) * 2017-05-10 2020-09-08 腾讯科技(深圳)有限公司 出行轨迹获取方法、装置及服务器
CN108646267A (zh) * 2018-05-15 2018-10-12 广州极飞科技有限公司 一种识别采样点的方法及装置
CN109302683B (zh) * 2018-10-26 2021-01-29 福州大学 一种基于重复跳转模式的手机位置数据中异常记录检测方法
CN109561385B (zh) * 2019-01-11 2021-09-24 福州大学 基于频繁大幅转向模式的手机位置数据异常记录检测方法
CN110647675B (zh) 2019-08-07 2022-05-27 北京百度网讯科技有限公司 停留点识别及预测模型训练方法、装置及存储介质
CN110677815A (zh) 2019-08-07 2020-01-10 北京百度网讯科技有限公司 停留点识别方法、装置、计算机设备及存储介质
CN111340331B (zh) * 2020-02-10 2023-11-14 泰华智慧产业集团股份有限公司 城市管理工作中监督员停留行为的分析方法及系统
CN113469600A (zh) * 2020-03-31 2021-10-01 北京三快在线科技有限公司 行程轨迹分段方法、装置、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314179A (zh) * 2011-05-04 2012-01-11 杭州电子科技大学 基于手机及内置重力感应器的云台控制方法
CN103179509A (zh) * 2013-03-11 2013-06-26 北京工业大学 基于手机定位信息的地铁乘客出行路径辨识方法
CN103813446A (zh) * 2014-02-17 2014-05-21 百度在线网络技术(北京)有限公司 一种估算停留区域范围的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013003860A1 (en) * 2011-06-30 2013-01-03 Yale University Subject sensing in an environment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314179A (zh) * 2011-05-04 2012-01-11 杭州电子科技大学 基于手机及内置重力感应器的云台控制方法
CN103179509A (zh) * 2013-03-11 2013-06-26 北京工业大学 基于手机定位信息的地铁乘客出行路径辨识方法
CN103813446A (zh) * 2014-02-17 2014-05-21 百度在线网络技术(北京)有限公司 一种估算停留区域范围的方法及装置

Also Published As

Publication number Publication date
CN106203505A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN106203505B (zh) 一种利用手机定位数据判断用户移动与停留状态的方法
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
Bachir et al. Inferring dynamic origin-destination flows by transport mode using mobile phone data
CN110324787B (zh) 一种手机信令数据的职住地获取方法
CN106912015B (zh) 一种基于移动网络数据的人员出行链识别方法
Cartwright et al. SONYC-UST-V2: An urban sound tagging dataset with spatiotemporal context
CN102253426B (zh) 采用空间密度聚类进行雷电运动预测的方法
CN105307121B (zh) 一种信息处理方法及装置
CN111178611B (zh) 一种日电量预测的方法
CN107679558A (zh) 一种基于度量学习的用户轨迹相似性度量方法
CN105740904B (zh) 一种基于dbscan聚类算法的出行与活动模式识别方法
CN108629000A (zh) 一种手机轨迹数据聚类的群体行为特征提取方法及系统
CN109635010B (zh) 一种用户特征及特征因子抽取、查询方法和系统
CN112653991A (zh) 一种基于深度学习的TebNet神经网络模型的WLAN室内定位方法
CN106935038B (zh) 一种停车检测系统及检测方法
CN111242352A (zh) 基于车辆轨迹的停等聚集效应预测方法
CN116010838A (zh) 一种融合密度值和K-means算法的车辆轨迹聚类方法
Brščić et al. Changes in usage of an indoor public space: Analysis of one year of person tracking
CN115032693A (zh) 一种强震的前震自动识别方法及装置
CN116132923A (zh) 一种基于手机信令数据的高精度时空轨迹复原方法
CN110443311A (zh) 一种基于形状因素调整的交通轨迹聚类相似性计算方法
CN112801181B (zh) 城市信令交通流用户分类、预测方法、存储介质及系统
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN110399919A (zh) 一种人类出行稀疏轨迹数据插值重构方法
CN110213711A (zh) 一种常驻点的估计方法、装置、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant