CN111954160A - 一种二维手机信令数据转化三维空间轨迹数据的方法 - Google Patents

一种二维手机信令数据转化三维空间轨迹数据的方法 Download PDF

Info

Publication number
CN111954160A
CN111954160A CN202010843813.2A CN202010843813A CN111954160A CN 111954160 A CN111954160 A CN 111954160A CN 202010843813 A CN202010843813 A CN 202010843813A CN 111954160 A CN111954160 A CN 111954160A
Authority
CN
China
Prior art keywords
data
mobile phone
base station
signaling data
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010843813.2A
Other languages
English (en)
Inventor
陈润桓
戴华
史可为
杨茂虎
周倩
杨庚
黄海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010843813.2A priority Critical patent/CN111954160A/zh
Publication of CN111954160A publication Critical patent/CN111954160A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开一种二维手机信令数据转化三维空间轨迹数据的方法,包括以下步骤:将原始信令数据表和基站‑扇区经纬度静态数据表进行连接、筛选研究选定城市区域经纬度范围内的所有原始手机信令数据、进行缺失数据处理、进行错误异常数据处理、进行重复数据处理、进行乒乓数据处理、进行漂移数据处理、进行伪漂移数据处理和进行数据清洗后的基站坐标修正。通过对异常数据进行预清洗,在此基础上有效准确地识别并修正伪漂移数据来避免原始数据集的过度损失,最后基于城市路网数据对清洗后的手机信令数据进行坐标修正,从而减少信令数据在空间上的定位偏差,提高交通时空大数据分析挖掘的准确性。

Description

一种二维手机信令数据转化三维空间轨迹数据的方法
技术领域
本发明属于城市交通大数据挖掘领域,涉及一种二维手机信令数据的预处理方法,具体的说是一种二维手机信令数据转化为三维空间轨迹数据的方法。
背景技术
城市居民在使用手机进行通信或切换基站时,都会出发基站从而产生信令数据,由此得到居民所被辐射的基站的经纬度坐标。
相比传统的城市交通出行调查和GPS定位数据,手机信令数据具有低成本(不需要发射卫星)、大样本且覆盖范围广(通过搭建基站即可生成并记录信令数据)、安全性高(数据为脱敏数据,不含有任何个人属性信息,不侵犯用户隐私)、跟随性强(定位数据由基站位置决定,不受居民的出行方式影响)等优点。根据截至2019年6月的调查数据显示,我国手机网民规模达8.47亿,比例高达99.1%。因此只要携带手机出行的居民都会产生一定量的手机信令数据,所以该种数据的用户持有率较高。
然而手机信令数据仍存两个明显缺陷:
(1)在原始手机信令数据中仍存在较多脏数据,主要有缺失数据、错误数据、重复数据、乒乓数据、漂移数据、伪漂移数据、静止冗余数据等误差数据。其中缺失数据指的是某条信令数据的关键字段缺失(如基站经纬度、时间信息等);错误数据指的是不在规定城区范围内或不在规定时间内的数据;重复数据指的是一段时间内被重复记录多次的数据;乒乓数据指的是当居民出于两个以上基站小区的交界处时信号在多个基站之间来回切换产生的数据;漂移数据指的是手机信号突然从临近的基站切换到较远的基站并在一定时间后切换回临近基站小区从而产生的不规律漂移数据;伪漂移数据是指对于时间序列上的连续三个信令数据点,其定位坐标看似具有漂移数据的特征,实为存在一定记录误差的正常信令数据,经过修正后可作为正常信令数据进行数据分析;静止冗余数据指的是某手机的定位数据在长时间内没有发生变化,则为静止无效数据,若不筛除或后期被标记为驻留数据则会增加信令数据的稀疏性。
(2)由于信令数据基于基站定位的特性导致用户位置的定位精度较低,在城市城区路网较密集的地带,基站覆盖半径为200-500米,和3-10米定位精度的卫星定位有较大的精度差别,因此手机信令数据并不能直接拿来做数据挖掘和研究,需要针对信令数据的特点使用特定的方法进行一系列的数据清洗和坐标修正,以减少其空间上的定位偏差。
因此本发明提供了一种二维手机信令数据转化三维空间轨迹数据的方法,可以在有效筛出原始信令数据集中异常数据的同时,提高信令数据的定位精度,减少空定位偏差,从源头减少实验误差从而提高交通大数据分析挖掘的准确性。
发明内容
本发明提供一系列的原始手机信令数据的预处理方法,该方法一方面可以高效地处理大规模的城市交通大数据,另一方面可以较为精准地将具有空间偏差缺陷的二维手机信令数据转化为尽可能接近GPS定位数据精度的三维空间轨迹数据,为分析和挖掘城市居民的出行特征、进行城市交通规划提供方便。
本发明是一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于,包括以下步骤:
S1:将原始手机信令数据表和基站-扇区经纬度静态数据表进行连接;
S2:筛选研究选定城市区域经纬度范围内的所有原始手机信令数据;
S3:进行缺失数据处理;
S4:进行错误异常数据处理;
S5:进行重复数据处理;
S6:进行乒乓数据处理;
S7:进行漂移数据处理;
S8:进行伪漂移数据处理;
S9:进行数据清洗后的基站坐标修正;
其中,的原始手机信令数据包括的字段名称和含义包括如下:
1)timestamp:信息记录开始时间;
2)imsi:用户唯一id;
3)lac_id:基站位置区编码;
4)cell-id:扇区编号;
的基站-扇区经纬度静态数据包括的字段名称和含义如下所示:
1)longitude:经度;
2)latitude:纬度;
3)laci:基站信息;其中原始手机信令数据中的lac_id、cell_id与基站-扇区经纬度静态数据中的laci关联可获取信令数据中出行者触发的基站经纬度信息。
本发明的进一步改进在于:步骤S1的具体过程是:
a)将基站-扇区经纬度静态数据表中的laci字段拆分成如下所示的四种字段:
(基站编号base_num,扇区编号section_num,扇区经度sec_long,扇区纬度sec_lat);
b)其中,使(基站编号base_num,扇区编号section_num)与原始手机信令数据表中的lac_id与cell_id字段进行连接;
c)最终得到原始信令数据中每条数据所触发基站的经纬度。
本发明的进一步改进在于:步骤S2中研究城市区域被假定为矩形区域,其经纬度的最大值与最小值分别为:longmax、longmin、latimax、latimin,则在S2步骤中筛选有效数据的依据为每条信令数据记录的基站经纬度(longsignal,latisignal)必须满足:
longmin≤longsignal≤longmax
latimin≤latisignal≤latimax
本发明的进一步改进在于:步骤S3中,缺失数据所缺失的关键字段主要包括用户id(imsi)、记录时间(timestamp)、基站和扇区的编号(lac_id和cell_id),将原始数据中含有缺失字段的数据进行删除操作。
本发明的进一步改进在于:步骤S4中,错误异常数据处理为对不在研究时间范围内的数据和因基站小区记录出错导致时间异常的数据进行删除操作。
本发明的进一步改进在于:步骤S5中,重复数据处理为对同一段时间内被重复记录多次的数据进行删除操作。
本发明的进一步改进在于:步骤S6中,对于乒乓数据的处理,首先判断是否为乒乓数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure BDA0002642355890000031
若点
Figure BDA0002642355890000032
处的平均速度大于城市最大速度阈值
Figure BDA00026423558900000421
则进一步判断点
Figure BDA0002642355890000041
和点
Figure BDA0002642355890000042
的定位坐标是否相同,若相同则被判断为乒乓数据,并将该数据执行删除操作,对于连续的乒乓数据则全部删除,只保留正常的信令数据。
本发明的进一步改进在于:步骤S7中,首先判定原始信令数据是否为漂移数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure BDA0002642355890000043
若点
Figure BDA0002642355890000044
和点
Figure BDA0002642355890000045
之间的距离小于规定的距离阈值
Figure BDA0002642355890000046
则点
Figure BDA0002642355890000047
不是漂移数据;反之则继续判断点
Figure BDA0002642355890000048
前后出行段的平均速度Vi是否满足条件:
Figure BDA0002642355890000049
若满足则该条数据被直接认定为漂移数据,若不满足则进入进一步的判断:若
Figure BDA00026423558900000410
其中m为既定的比例阈值,则判定点
Figure BDA00026423558900000411
是漂移数据点,进行删除操作。
本发明的进一步改进在于:步骤S8中,首先判定是否为伪漂移数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure BDA00026423558900000412
若点
Figure BDA00026423558900000413
和点
Figure BDA00026423558900000414
之间的距离大于规定的距离阈值
Figure BDA00026423558900000415
且点
Figure BDA00026423558900000416
前后出行段的平均速度不满足漂移数据的条件,则判断为漂移数据;然后针对伪漂移数据的特点进行处理,处理方法为按照如下的时间比例公式修正中间点的坐标:
Figure BDA00026423558900000417
Figure BDA00026423558900000418
其中,上式中
Figure BDA00026423558900000419
需满足公式:
Figure BDA00026423558900000420
Re为地球半径。
本发明的进一步改进在于:步骤S9的具体过程是:a)首先将城市路网坐标数据地图以正方形为最小单元进行分割,其中,单元长度为unit;
b)遍历每一组出行者的信令数据,在每一步遍历内先判断在该条信令数据中出行者所属的划分区域;
c)针对该区域内所有的道路进行信令数据与路网数据的匹配,具体为:循环遍历每条路网中的相邻结点,并分别计算与当前信令数据基站坐标的欧氏距离,找出距离最小的路网结点作为该信令数据中基站坐标修正后的点。
与现有的技术方法相比,本发明技术方案的有益效果是:
本方法简洁高效,和现有的技术方法相比考虑到了更多可能存在于原始信令数据中的异常数据,可以准确高效地清洗原始手机信令数据中的缺失数据、错误数据、重复数据、乒乓数据、漂移数据等不符合研究要求的数据,并且较为精确地剔除或修正伪漂移数据、校正清洗后的基站坐标,使其更贴近出行者的实际出行定位数据,降低了在后续数据挖掘和分析过程中产生的误差,提高了分析结果的准确率,同时也可以在保持交通城市大数据挖掘领域研究低成本、大样本等优势的基础上提高数据的准确率和分析价值。
附图说明
图1是本发明的流程图。
图2是修正前的伪漂移数据示意图。
图3是伪漂移数据修正后的示意图。
图4为基于路网坐标的信令定位数据的修正方法流程图。
具体实施方式
为了加强对本发明的理解,下面将结合附图和实施例对本发明作进一步的详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
如图1-4所示,本发明是一种二维手机信令数据转化三维空间轨迹数据的方法,包括以下步骤:
步骤S1:将原始信令数据表和基站-扇区经纬度静态数据表进行连接,基站-扇区经纬度静态数据表中的laci字段拆分的四种字段(基站编号base_num,扇区编号section_num,扇区经度sec_long,扇区纬度sec_lat)中的(基站编号base_num,扇区编号section_num)与原始手机信令数据表中的lac_id与cell_id字段进行连接。其中,的原始手机信令数据包括的字段名称和含义分别为:(1)timestamp:信息记录开始时间;(2)imsi:用户唯一id;(3)lac_id:基站位置区编码;(4)cell-id:扇区编号。的基站-扇区经纬度静态数据包括的字段名称和含义分别为:(1)longitude:经度;(2)latitude:纬度;(3)laci:基站信息(包括基站编号和扇区编号)。连接结果如表1所示:
表1原始信令数据表和基站-扇区经纬度静态数据表连接结果
ID imsi longitude latitude lac-id cell_id timestamp
1 460000095060523000 123.5021606 41.8132515 16789 67677963 20181003193808
2 460000095060523000 123.3980179 41.8083801 16789 67693323 20181003230737
3 460000095060523000 123.3785324 41.8057404 16887 67671091 20181003231452
4 460000095060523000 123.3704987 41.8051796 16794 67634995 20181003231532
5 460000095060523000 123.34655 41.8454988 16888 249686079 20181003233201
步骤S2:筛选研究选定城市区域经纬度范围内的所有原始手机信令数据:假设研究区域在沈阳市城区,经度范围为东经123°22'13.80"(122.3705)至123°29′54.34″(123.4984278),纬度范围为41°50′15.32″(41.8375889)至41°42.′51.58″(41.7143278)。如表1所示,则应剔除编号1和编号5的记录。筛选研究区域(沈阳市城区)规定经纬度范围内数据示意表如表2所示。
表2筛选研究区域内数据示意表
ID imsi longitude latitude lac-id cell_id timestamp
1 460000095060523000 123.3980179 41.8083801 16789 67693323 20181003230737
2 460000095060523000 123.3785324 41.8057404 16887 67671091 20181003231452
3 460000095060523000 123.3704987 41.8051796 16794 67634995 20181003231532
步骤S3:进行缺失数据处理:剔除关键字段(如:基站经纬度、时间信息等字段)缺失的数据,如表3所示,编号为2、3、4的数据分别有基站经纬度、用户编号、记录时间缺失的情况,应进行剔除;
表3筛选关键字段缺失数据处理示意表
ID imsi longitude latitude lac-id cell_id timestamp
1 460000095060523000 123.5021606 41.8132515 16789 67677963 20181003193808
2 460000095060523000 null 41.8083801 16789 67693323 20181003230737
3 null 123.3785324 41.8057404 16887 67671091 20181003231452
4 460000095060523000 123.3704987 41.8051796 16794 67634995 null
5 460000095060523000 123.34655 41.8454988 16888 249686079 20181003233201
步骤S4:进行错误异常数据处理:主要对时间异常的数据进行删除操作。若要求调查分析2018年10月3日当天的出行情况。如表4所示,编号为3和5的数据对应的时间戳不在调查要求的时间范围内,应予以剔除。
表4处理异常数据示意表
Figure BDA0002642355890000061
Figure BDA0002642355890000071
步骤S5:进行重复数据处理:主要对同一段时间内被重复记录多次的数据进行删除操作,如表5所示,编号为3、4、5的数据出现重复现象,在此应只保留一条数据;
表5重复数据处理示意表
ID imsi longitude latitude lac-id cell_id timestamp
1 460000095007329000 123.4344 41.81196 16789 67314198 20181003192456
2 460000095007329000 123.4344 41.81196 16789 67314199 20181003202249
3 460000095007329000 123.429 41.81131 16789 61397123 20181003203201
4 460000095007329000 123.429 41.81131 16789 61397123 20181003203201
5 460000095007329000 123.429 41.81131 16789 61397123 20181003203201
步骤S6:进行乒乓数据处理:在判断是否为乒乓数据后将连续的乒乓数据做删除操作。如表6所示,经过计算发现编号为3的数据处的而平均速度大于城市交通最大速度阈值
Figure BDA0002642355890000072
(结合城市路网密集地带和稀疏地带的交通流量,城市最大速度阈值
Figure BDA0002642355890000073
取22.7m/s),且点2和点4的基站定位坐标相同,因此可以判断为乒乓数据,对编号为3的数据实施删除操作。
表6处理乒乓数据示意表
ID imsi longitude latitude speed timestamp
1 460000095005565000 123.4073486 41.7718506 0.467245072093886 20181003192456
2 460000095005565000 123.4168015 41.7773285 12.09327478797396 20181003192453
3 460000095005565000 123.4134979 41.7846718 34.14641401904011 20181003192801
4 460000095005565000 123.4168015 41.7773285 21.791218692995344 20181003203201
5 460000095005565000 123.4087067 41.8063812 1.1725066448574202 20181003213201
步骤S7:进行漂移数据处理:在判定原始信令数据是否为漂移数据后对漂移数据进行删除操作,如表7所示,编号为3和编号为4的数据点之间的距离大于规定的非漂移距离阈值
Figure BDA0002642355890000074
(综合考虑普遍研究对出行的定义,漂移数据的最小距离阈值
Figure BDA0002642355890000075
取500m)并且点4前后出行段的平均速度Vi大于
Figure BDA0002642355890000076
(取22.7m/s),则该条数据被认定为漂移数据;编号为3的数据点满足
Figure BDA0002642355890000081
(漂移距离比例阈值m取3),说明点2和点3之间的距离比点3和点4之间的距离大得多,则可以判定编号为3的数据为漂移数据。对上述漂移数据实施删除操作。
表7漂移数据处理示意表
ID imsi longitude latitude speed timestamp
1 460000095005571000 123.4181671 41.816349 8.638881556995045 20181003031852
2 460000095005571000 123.4181671 41.816349 0.0 20181003031914
3 460000095005571000 123.4143829 41.8116989 61.08326747837328 20181003032321
4 460000095005571000 123.4143829 41.8116989 0.0 20181003032503
5 460000095005571000 123.417511 41.8200111 23.19628688473075 20181003032803
步骤S8:进行伪漂移数据处理:在判定是否为伪漂移数据后对不符合要求的数据进行修正操作,将其转化为正常数据。如表8-1所示,经过计算各点的平均速度发现均小于城市交通最大速度阈值22.7m/s,并且点2和4的基站定位坐标相同,则判断编号为3的数据为伪漂移数据,应按照公式
Figure BDA0002642355890000082
Figure BDA0002642355890000083
进行坐标修正,将伪漂移数据转化为正常数据,转化后数据如表8-2所示。
表8-1伪漂移数据处理示意表
ID imsi longitude latitude speed timestamp
1 460000095005571000 123.4073486 41.7718506 0.0 20181003031852
2 460000095005571000 123.4168015 41.7773285 0.0 20181003031914
3 460000095005571000 123.4134979 41.7846718 7.816395897585563 20181003032321
4 460000095005571000 123.4168015 41.7773285 18.71297751775618 20181003032503
5 460000095005571000 123.4087067 41.8063812 0.0 20181003032803
表8-2伪漂移数据处理示意表
Figure BDA0002642355890000084
Figure BDA0002642355890000091
步骤S9:进行数据清洗后的基站坐标修正操作:以沈阳市城区路网数据为例,首先将城市路网坐标数据以单位长度unit(路网坐标数据分割最小单元unit取0.03)进行分割;接着遍历经预清洗后的信令数据,在每一步遍历内先判断在该条信令数据中出行者所属的划分区域;最后针对该区域内所有的道路进行信令数据与路网数据的匹配:循环遍历每条路网中的相邻结点,计算当前信令数据基站坐标的欧式距离,找出距离最小的路网结点作为该信令数据中基站坐标修正后的点,修正后的数据如表9所示。
表9修正基站定位数据示
Figure BDA0002642355890000092

Claims (10)

1.一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于,包括以下步骤:
S1:将原始手机信令数据表和基站-扇区经纬度静态数据表进行连接;
S2:筛选研究选定城市区域经纬度范围内的所有原始手机信令数据;
S3:进行缺失数据处理;
S4:进行错误异常数据处理;
S5:进行重复数据处理;
S6:进行乒乓数据处理;
S7:进行漂移数据处理;
S8:进行伪漂移数据处理;
S9:进行数据清洗后的基站坐标修正;
其中,所述的原始手机信令数据包括的字段名称和含义包括如下:
1)timestamp:信息记录开始时间;
2)imsi:用户唯一id;
3)lac_id:基站位置区编码;
4)cell-id:扇区编号;
所述的基站-扇区经纬度静态数据包括的字段名称和含义如下所示:
1)longitude:经度;
2)latitude:纬度;
3)laci:基站信息;其中原始手机信令数据中的lac_id、cell_id与基站-扇区经纬度静态数据中的laci关联可获取信令数据中出行者触发的基站经纬度信息。
2.根据权利要求1所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S1的具体过程是:
a)将基站-扇区经纬度静态数据表中的laci字段拆分成如下所示的四种字段:
(基站编号base_num,扇区编号section_num,扇区经度sec_long,扇区纬度sec_lat);
b)其中,使(基站编号base_num,扇区编号section_num)与原始手机信令数据表中的lac_id与cell_id字段进行连接;
c)最终得到原始信令数据中每条数据所触发基站的经纬度。
3.根据权利要求2所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S2中研究城市区域被假定为矩形区域,其经纬度的最大值与最小值分别为:longmax、longmin、latimax、latimin,则在S2步骤中筛选有效数据的依据为每条信令数据记录的基站经纬度(longsignal,latisignal)必须满足:
longmin≤longsignal≤longmax
latimin≤latisignal≤latimax
4.根据权利要求3所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S3中,缺失数据所缺失的关键字段主要包括用户id(imsi)、记录时间(timestamp)、基站和扇区的编号(lac_id和cell_id),将原始数据中含有缺失字段的数据进行删除操作。
5.根据权利要求4所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S4中,错误异常数据处理为对不在研究时间范围内的数据和因基站小区记录出错导致时间异常的数据进行删除操作。
6.根据权利要求5所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S5中,重复数据处理为对同一段时间内被重复记录多次的数据进行删除操作。
7.根据权利要求6所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S6中,对于乒乓数据的处理,首先判断是否为乒乓数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure FDA0002642355880000021
若点
Figure FDA0002642355880000022
处的平均速度大于城市最大速度阈值
Figure FDA0002642355880000023
则进一步判断点
Figure FDA0002642355880000024
和点
Figure FDA0002642355880000025
的定位坐标是否相同,若相同则被判断为乒乓数据,并将该数据执行删除操作,对于连续的乒乓数据则全部删除,只保留正常的信令数据。
8.根据权利要求7所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S7中,首先判定原始信令数据是否为漂移数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure FDA0002642355880000026
若点
Figure FDA0002642355880000027
和点
Figure FDA0002642355880000028
之间的距离小于规定的距离阈值
Figure FDA0002642355880000031
则点
Figure FDA0002642355880000032
不是漂移数据;反之则继续判断点
Figure FDA0002642355880000033
前后出行段的平均速度Vi是否满足条件:
Figure FDA0002642355880000034
若满足则该条数据被直接认定为漂移数据,若不满足则进入进一步的判断:若
Figure FDA0002642355880000035
其中m为既定的比例阈值,则判定点
Figure FDA0002642355880000036
是漂移数据点,进行删除操作。
9.根据权利要求1所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S8中,首先判定是否为伪漂移数据:对于同一出行者j在时间序列上相邻时刻、不同位置的记录为
Figure FDA0002642355880000037
若点
Figure FDA0002642355880000038
和点
Figure FDA0002642355880000039
之间的距离大于规定的距离阈值
Figure FDA00026423558800000310
且点
Figure FDA00026423558800000311
前后出行段的平均速度不满足漂移数据的条件,则判断为漂移数据;然后针对伪漂移数据的特点进行处理,处理方法为按照如下的时间比例公式修正中间点的坐标:
Figure FDA00026423558800000312
Figure FDA00026423558800000313
其中,上式中
Figure FDA00026423558800000314
需满足公式:
Figure FDA00026423558800000315
为地球半径。
10.根据权利要求1所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S9的具体过程是:
a)首先将城市路网坐标数据地图以正方形为最小单元进行分割,其中,单元长度为unit;
b)遍历每一组出行者的信令数据,在每一步遍历内先判断在该条信令数据中出行者所属的划分区域;
c)针对该区域内所有的道路进行信令数据与路网数据的匹配,具体为:循环遍历每条路网中的相邻结点,并分别计算与当前信令数据基站坐标的欧氏距离,找出距离最小的路网结点作为该信令数据中基站坐标修正后的点。
CN202010843813.2A 2020-08-20 2020-08-20 一种二维手机信令数据转化三维空间轨迹数据的方法 Pending CN111954160A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010843813.2A CN111954160A (zh) 2020-08-20 2020-08-20 一种二维手机信令数据转化三维空间轨迹数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010843813.2A CN111954160A (zh) 2020-08-20 2020-08-20 一种二维手机信令数据转化三维空间轨迹数据的方法

Publications (1)

Publication Number Publication Date
CN111954160A true CN111954160A (zh) 2020-11-17

Family

ID=73358675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010843813.2A Pending CN111954160A (zh) 2020-08-20 2020-08-20 一种二维手机信令数据转化三维空间轨迹数据的方法

Country Status (1)

Country Link
CN (1) CN111954160A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112738727A (zh) * 2020-12-25 2021-04-30 厦门市美亚柏科信息股份有限公司 一种基于通信记录的活动轨迹分析方法和系统
CN113271557A (zh) * 2021-04-20 2021-08-17 中山大学 一种手机信令数据处理方法、装置及存储介质
CN113963536A (zh) * 2021-10-19 2022-01-21 海南波罗密信息科技有限公司 通过手机信令数据识别居民惯常环境和出行目的的方法
CN114245314A (zh) * 2021-12-17 2022-03-25 高创安邦(北京)技术有限公司 一种人员轨迹修正方法、装置、存储介质及电子设备
CN115484549A (zh) * 2021-06-16 2022-12-16 中国移动通信集团江西有限公司 一种用户出行轨迹确定方法、装置和电子设备
CN118338252A (zh) * 2024-04-28 2024-07-12 北京九栖科技有限责任公司 一种基于信令轨迹的用户运动与静止态的判断方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484993A (zh) * 2014-11-27 2015-04-01 北京交通大学 用于交通小区划分的手机信令信息的处理方法
CN109040989A (zh) * 2018-07-19 2018-12-18 中山大学 一种手机信令数据清洗方法
CN110766211A (zh) * 2019-10-14 2020-02-07 中国地质大学(武汉) 一种实时路况下的车辆路径规划问题模型创建方法
CN110972062A (zh) * 2019-12-24 2020-04-07 邑客得(上海)信息技术有限公司 一种基于手机信令数据的基站位置参数校准方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484993A (zh) * 2014-11-27 2015-04-01 北京交通大学 用于交通小区划分的手机信令信息的处理方法
CN109040989A (zh) * 2018-07-19 2018-12-18 中山大学 一种手机信令数据清洗方法
CN110766211A (zh) * 2019-10-14 2020-02-07 中国地质大学(武汉) 一种实时路况下的车辆路径规划问题模型创建方法
CN110972062A (zh) * 2019-12-24 2020-04-07 邑客得(上海)信息技术有限公司 一种基于手机信令数据的基站位置参数校准方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张维: "基于手机定位数据的城市居民出行特征提取方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112738727A (zh) * 2020-12-25 2021-04-30 厦门市美亚柏科信息股份有限公司 一种基于通信记录的活动轨迹分析方法和系统
CN113271557A (zh) * 2021-04-20 2021-08-17 中山大学 一种手机信令数据处理方法、装置及存储介质
CN115484549A (zh) * 2021-06-16 2022-12-16 中国移动通信集团江西有限公司 一种用户出行轨迹确定方法、装置和电子设备
CN113963536A (zh) * 2021-10-19 2022-01-21 海南波罗密信息科技有限公司 通过手机信令数据识别居民惯常环境和出行目的的方法
CN114245314A (zh) * 2021-12-17 2022-03-25 高创安邦(北京)技术有限公司 一种人员轨迹修正方法、装置、存储介质及电子设备
CN114245314B (zh) * 2021-12-17 2024-01-05 高创安邦(北京)技术有限公司 一种人员轨迹修正方法、装置、存储介质及电子设备
CN118338252A (zh) * 2024-04-28 2024-07-12 北京九栖科技有限责任公司 一种基于信令轨迹的用户运动与静止态的判断方法及系统

Similar Documents

Publication Publication Date Title
CN111954160A (zh) 一种二维手机信令数据转化三维空间轨迹数据的方法
CN108320501B (zh) 基于用户手机信令的公交线路识别方法
CN106997666B (zh) 一种利用手机信令数据位置切换获取交通流速度的方法
CN108802776B (zh) 基于异常点剔除及轨迹压缩算法的公交gps纠偏方法
CN103149576B (zh) 一种浮动车数据的地图匹配方法
CN106323301B (zh) 一种道路情报的获取方法及装置
CN107818412B (zh) 一种基于MapReduce的大规模公交乘客OD并行计算方法
CN109583640A (zh) 一种基于多源定位数据的城市出行客流属性识别方法
CN106488405B (zh) 一种融合个体与近邻移动规律的位置预测方法
CN110012120A (zh) 一种基于PoP网络拓扑的IP城市级定位算法
CN106294458A (zh) 一种地图兴趣点更新方法及装置
CN110753307B (zh) 一种基于居民调查数据获取带有标签的手机信令轨迹数据方法
CN109190685A (zh) 融合空间聚类和基站序列规则的轨道出行特征提取方法
CN107529135A (zh) 基于智能设备数据的用户活动类型判别方法
CN109816982B (zh) 基于共享单车轨迹的虚拟路网非机动车道属性修正方法
CN111651529A (zh) 基于手机信令数据的机场航空旅客分类识别方法
CN112000755B (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN105844031B (zh) 一种基于手机定位数据的城市交通廊道识别方法
CN109348404B (zh) 一种大数据环境下个体出行道路轨迹提取的方法
CN112381906B (zh) 一种公交模型基础线网自动绘制方法
CN103744861A (zh) 一种轨迹数据中的频繁子轨迹查找方法及装置
CN111024098A (zh) 一种基于低采样数据的机动车路径拟合算法
CN110160538A (zh) 一种基于手机信令数据的地图匹配方法
CN115100012A (zh) 一种轨道交通站点步行可达性计算方法
CN113077089B (zh) 一种多因素对空气质量影响的评价方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201117