CN111653096A - 一种基于手机信令数据的城市出行方式识别方法 - Google Patents

一种基于手机信令数据的城市出行方式识别方法 Download PDF

Info

Publication number
CN111653096A
CN111653096A CN202010478118.0A CN202010478118A CN111653096A CN 111653096 A CN111653096 A CN 111653096A CN 202010478118 A CN202010478118 A CN 202010478118A CN 111653096 A CN111653096 A CN 111653096A
Authority
CN
China
Prior art keywords
travel
time
distance
mode
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010478118.0A
Other languages
English (en)
Other versions
CN111653096B (zh
Inventor
万紫吟
陆振波
张改
夏井新
余启航
刘娟
张念启
张静芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd
Original Assignee
Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd filed Critical Nanjing Ruiqi Intelligent Transportation Technology Industry Research Institute Co ltd
Priority to CN202010478118.0A priority Critical patent/CN111653096B/zh
Publication of CN111653096A publication Critical patent/CN111653096A/zh
Application granted granted Critical
Publication of CN111653096B publication Critical patent/CN111653096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/024Guidance services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • H04W4/42Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for mass transport vehicles, e.g. buses, trains or aircraft

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于手机信令数据的城市出行方式识别方法,针对目标城市全天产生的手机信令数据,识别出每个人的停驻点及全天出行OD,首先通过地铁专用基站精准识别出所有地下轨道交通出行方式,然后在提取手机数据特征参数的基础上与高德GPS真实导航数据相比较,利用无监督的机器学习算法识别居民出行的交通方式。本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K‑means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。

Description

一种基于手机信令数据的城市出行方式识别方法
技术领域
本发明涉及交通规划领域,具体是交通需求预测领域。
背景技术
交通需求预测是城市交通规划的基础,能够准确地预测城市交通需求对合理管理和控制城市交通系统具有重要意义。在现有的交通需求预测方法(例如交通分配模型)中都高度依赖于不同出行方式下的出行需求估计。然而,鉴于其高度复杂的性质,准确预测不同方式的需求具有一定的难度。这是由于运输系统的运行和交通流的时间/空间波动是不可检测的,因此,有效识别交通方式是当前技术的关键。
以往通过传统调查手段获取出行方式等交通信息的方法存在许多缺陷,如调查成本高,抽样率低等,近年来移动智能设备迅速发展,如何从包含有居民移动位置信息的轨迹数据比如GPS数据、手机信令数据中获取出行方式成为了交通领域关注的热点。
目前现有技术中,张锦等人公开了一种基于手机信令数据的居民出行方式综合判别的方法(CN201510452430.1),采用了出行方式子链与GIS线网匹配结合构建先验概率的方法,将属于机动车出行方式的子链分别与GIS的轨道交通线网、公交线网进行匹配来判别轨道交通出行与常规公交出行,后通过平均速度、最大速度与出行时长三个属性,对剩下可能的出行方式构建先验概率进行判别。该方法采用的GIS线网匹配判断轨道交通出行和公交出行的方法忽略了与轨道线网和公交线网相重叠的小汽车出行的情况,容易造成误判;以及后续构建先验概率的过程中,仅考虑了平均速度、最大速度与出行时长三个属性,由于手机信令数据的位置更新是以基站为单位,得到的出行特征与实际情况都存在一定误差,所以仅考虑这三个属性容易造成误判。
张锦等人还公开了一种基于手机信令数据的半监督SVM的交通方式判别方法(CN201910076104.3),通过人工识别流程对部分出行进行方式识别后,将已标记的样本和未标记的样本一起训练半监督SVM分类器。该方法由于采用了部分人工判别流程,在实际操作中专家的选取与工人标记的组织都有一定困难,耗时长且结果受主观因素影响。
杨继伟等人公开了一种基于大数据机器学习的出行方式辨识方法(CN201710693960.4),通过采集训练样本调查对象的手机信令数据和加速度检测设备数据,分析数据波动特征,获取速度加速度波动特征数据作为预测输入值,出行方式作为输出值,训练机器学习算法,最终选取精度高的算法进行出行方式划分。该方法需要调查对象配合采集加速度检测设备数据,此过程受人力物力等多重因素影响实施难度大,不仅样本数量受到限制,而且数据质量受加速度检测设备质量以及调查对象使用程度影响,且将一次调查采集的数据训练得到的算法模型运用于此后所有出行数据的方式识别并不合理。
发明内容
针对背景技术中存在的问题,本发明提出了一种基于手机信令数据的城市出行方式识别方法。
技术方案:
一种基于手机信令数据的城市出行方式识别方法,结合图1,具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。
优选的,步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。实施中,radius_range可取800m~1500m,min_stay_time取40min。
优选的,步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。实施中,min_dis选取1km,min_time选取5min,max_speed选取120km/h。
优选的,步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。实施中,long_dis可取30km~100km,walk_speed选取8km/h,walk_dis选取3km。
优选的,步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。实施中,α可取0.6~0.9,walk_dis选取3km,max_diff可取0.05~0.15。
优选的,步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
实施中,
Figure BDA0002516482200000041
m可取1.2~3.5,K可取2~5。
本发明的有益效果
本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K-means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。
附图说明
图1为本发明的城市出行方式综合识别方法的流程图
图2为实施例中出行OD识别示例的图表对照图
图3为实施例中出行特征提取及无效数据删除示例图
图4为实施例中步骤S4划分示例图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
本发明公开的一种基于手机信令数据的城市出行方式识别方法,具体方案结合图1和发明内容描述,此处不再赘述。
以江苏省昆山市2019年5月22日手机信令数据为例,手机信令数据是指移动通信网络主动或被动、定期或不定期的为与手机用户的移动终端保持联系所产生的一系列控制指令,包括了手机识别码、时间戳、事件类型、基站编号、基站经纬度、号码归属地等字段,包含了每个用户全天运行轨迹的时空信息,如下表所示:
dt msid start_time start_ci start_lng start_lat end_time end_ci end_lng end_lat
20190522 1 20190522000000 85132041 120.9892 31.4025 20190522000001 85132057 120.9892 31.4025
20190522 1 20190522000001 85132057 120.9892 31.4025 20190522000037 85132032 120.9892 31.4025
20190522 1 20190522000037 85132032 120.9892 31.4025 20190522000055 2.33E+08 120.9892 31.4025
20190522 1 20190522000055 85132032 120.9892 31.4025 20190522000143 85132057 120.9892 31.4025
20190522 1 20190522000143 85132057 120.9892 31.4025 20190522000244 85132032 120.9892 31.4025
20190522 1 20190522000244 85132032 120.9892 31.4025 20190522000246 85221124 120.9844 31.40311
表1手机信令数据示例
一种基于手机信令数据的城市出行方式识别方法,结合图1,具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。
优选的,步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。实施中,radius_range可取800m~1500m,min_stay_time取40min。
本案例选取基站服务半径阈值radius_range=800m,停驻时间阈值min_stay_time=40min,针对每个用户的出行轨迹进行时空聚类,得到当天的停驻点集合S={S1,…,Sn},按照时间顺序排列,相邻停驻点分别构成一次出行的起点O点与终点D点,并与原轨迹中两点中间的轨迹数据一起构成一次出行的OD数据,如图2所示。
优选的,步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。实施中,min_dis选取1km,min_time选取5min,max_speed选取120km/h。如图3所示。
优选的,步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。实施中,long_dis可取30km~100km,walk_speed选取8km/h,walk_dis选取3km。如图4所示。
优选的,步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time如下表所示:
id GDwalk_dis GDwwalk_time GDbike_di_s GDbike_time GDbus_dis GDbus_time GDcar_di_s GDcar_time
1 16.407 218.7667 16.904 67.6167 21.784 73.05 17.8 25.2167
2 8.663 115.5 8.675 34.7 12.293 84.2667 17.318 30.3167
3 2.967 39.5667 3.832 15.3333 4.583 35.5333 4.246 10.0667
4 8.645 115.2667 8.617 34.4667 9.238 74.3167 8.805 12.7167
5 2.306 30.75 2.35 9.4 2.583 30.4 2.275 8.5833
6 18.749 249.9833 19.086 76.35 28.537 121.0833 19.869 33.1833
7 1.071 14.2833 1.071 4.2833 1.067 17.7833 2.413 10.1383
8 18.976 253.0167 18.801 75.2 21.835 137.8167 18.774 30.2333
9 28.94 385.8667 29.263 117.05 33.209 123.4667 29.421 49.15
10 7.103 94.7 7.513 30.05 10.091 49.5667 7.456 18.0833
表2高德爬取数据示例
S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time-高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance-高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1-α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。实施中,α可取0.6~0.9,walk_dis选取3km,max_diff可取0.05~0.15。如下表所示:
Figure BDA0002516482200000061
表3基于高德偏移度的划分结果示例
优选的,步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,...,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,...,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
实施中,
Figure BDA0002516482200000062
m可取1.2~3.5,K可取2~5,通过拉格朗日乘子法可推导出
Figure BDA0002516482200000071
根据上述步骤,最终当前城市当天的每条出行OD的出行方式都得到了识别,结果如下表所示:
id o-lng o_lat d_lng d_lat start_time distance nove_time speed 85_v sv type
1 120.9753 31.4095 121.0109 31.31549 20190522062800 15.473 28.3167 32.78556 144 1.0856 小汽车
2 121.0227 31.30474 121.037 31.31561 20190522141700 2.684 6.5333 24.64884 75.6 0.5736 公交车
3 120.9568 31.26589 120.9472 31.23722 20190522102800 0.4 14.0833 1.70424 14.4 0.3857 删除
4 121.0227 31.30474 121.0304 31.31822 20190522110300 1.824 11.4167 9.58608 21.6 0.0463 电动车
5 121.0304 31.31822 121.0227 31.30474 20190522114600 1.824 9.2333 11.85264 28.8 1.1735 电动车
表4最终划分结果示例
本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的预划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K-means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (6)

1.一种基于手机信令数据的城市出行方式识别方法,其特征在于具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。
2.根据权利要求1所述的方法,其特征在于步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。
3.根据权利要求1所述的方法,其特征在于步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。
4.根据权利要求1所述的方法,其特征在于步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。
5.根据权利要求1所述的方法,其特征在于步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。
6.根据权利要求1所述的方法,其特征在于步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
CN202010478118.0A 2020-05-29 2020-05-29 一种基于手机信令数据的城市出行方式识别方法 Active CN111653096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010478118.0A CN111653096B (zh) 2020-05-29 2020-05-29 一种基于手机信令数据的城市出行方式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010478118.0A CN111653096B (zh) 2020-05-29 2020-05-29 一种基于手机信令数据的城市出行方式识别方法

Publications (2)

Publication Number Publication Date
CN111653096A true CN111653096A (zh) 2020-09-11
CN111653096B CN111653096B (zh) 2022-10-04

Family

ID=72350891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010478118.0A Active CN111653096B (zh) 2020-05-29 2020-05-29 一种基于手机信令数据的城市出行方式识别方法

Country Status (1)

Country Link
CN (1) CN111653096B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112511971A (zh) * 2020-11-26 2021-03-16 西安建筑科技大学 一种基于手机信令数据的出行方式识别方法
CN112542043A (zh) * 2020-12-01 2021-03-23 江苏欣网视讯软件技术有限公司 基于手机信令以及大数据分析识别公交线网覆盖盲区的方法与系统
CN112686466A (zh) * 2021-01-12 2021-04-20 北京交通发展研究院 地铁乘客的路径确认方法及装置
CN112801181A (zh) * 2021-01-27 2021-05-14 南京邮电大学 城市信令交通流用户分类、预测方法、存储介质及系统
CN113709660A (zh) * 2021-07-30 2021-11-26 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN114466313A (zh) * 2022-01-28 2022-05-10 同济大学 一种基于手机信令数据的城际出行扩样方法
CN115206104A (zh) * 2022-07-25 2022-10-18 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法
CN116052436A (zh) * 2023-04-03 2023-05-02 深圳市城市交通规划设计研究中心股份有限公司 一种跨城出行方式识别方法、电子设备及存储介质
CN116434529A (zh) * 2022-12-12 2023-07-14 交通运输部规划研究院 城际公路货运特征分析方法、装置和电子设备
CN117292546A (zh) * 2023-10-23 2023-12-26 重庆交通大学 一种基于手机gps数据的交通出行方式od计算方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046456A1 (en) * 2011-08-16 2013-02-21 Christopher L. Scofield Assessing inter-modal passenger travel options
CN104837116A (zh) * 2015-05-11 2015-08-12 广州杰赛科技股份有限公司 用户出行数据检测方法和系统
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
JP2016224594A (ja) * 2015-05-28 2016-12-28 アイシン・エィ・ダブリュ株式会社 走行態様検出システム、走行態様検出方法及びコンピュータプログラム
CN107040894A (zh) * 2017-04-21 2017-08-11 杭州市综合交通研究中心 一种基于手机信令数据的居民出行od获取方法
CN108171974A (zh) * 2017-12-27 2018-06-15 东南大学 一种基于手机三角定位数据的交通出行模式判别方法
CN109272032A (zh) * 2018-09-05 2019-01-25 广州视源电子科技股份有限公司 出行方式识别方法、装置、计算机设备和存储介质
WO2019056680A1 (zh) * 2017-09-19 2019-03-28 平安科技(深圳)有限公司 出行方式识别方法、装置、终端设备及存储介质
CN109727452A (zh) * 2019-01-08 2019-05-07 江苏交科能源科技发展有限公司 基于手机信令数据的出行比例核算方法
US20190182624A1 (en) * 2017-06-30 2019-06-13 Shandong Provincial Communications Planning And Design Institute Method and device for judging intercity transportation mode based on mobile phone data
CN111143769A (zh) * 2019-12-09 2020-05-12 深圳市市政设计研究院有限公司 一种基于大数据的出行方式分担率的预测方法和预测装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046456A1 (en) * 2011-08-16 2013-02-21 Christopher L. Scofield Assessing inter-modal passenger travel options
CN104837116A (zh) * 2015-05-11 2015-08-12 广州杰赛科技股份有限公司 用户出行数据检测方法和系统
JP2016224594A (ja) * 2015-05-28 2016-12-28 アイシン・エィ・ダブリュ株式会社 走行態様検出システム、走行態様検出方法及びコンピュータプログラム
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
CN107040894A (zh) * 2017-04-21 2017-08-11 杭州市综合交通研究中心 一种基于手机信令数据的居民出行od获取方法
US20190182624A1 (en) * 2017-06-30 2019-06-13 Shandong Provincial Communications Planning And Design Institute Method and device for judging intercity transportation mode based on mobile phone data
WO2019056680A1 (zh) * 2017-09-19 2019-03-28 平安科技(深圳)有限公司 出行方式识别方法、装置、终端设备及存储介质
CN108171974A (zh) * 2017-12-27 2018-06-15 东南大学 一种基于手机三角定位数据的交通出行模式判别方法
CN109272032A (zh) * 2018-09-05 2019-01-25 广州视源电子科技股份有限公司 出行方式识别方法、装置、计算机设备和存储介质
CN109727452A (zh) * 2019-01-08 2019-05-07 江苏交科能源科技发展有限公司 基于手机信令数据的出行比例核算方法
CN111143769A (zh) * 2019-12-09 2020-05-12 深圳市市政设计研究院有限公司 一种基于大数据的出行方式分担率的预测方法和预测装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜亚朋: "基于手机信令和导航数据的出行方式识别方法", 《计算机应用研究》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112511971A (zh) * 2020-11-26 2021-03-16 西安建筑科技大学 一种基于手机信令数据的出行方式识别方法
CN112511971B (zh) * 2020-11-26 2022-08-16 西安建筑科技大学 一种基于手机信令数据的出行方式识别方法
CN112542043A (zh) * 2020-12-01 2021-03-23 江苏欣网视讯软件技术有限公司 基于手机信令以及大数据分析识别公交线网覆盖盲区的方法与系统
CN112542043B (zh) * 2020-12-01 2021-10-26 江苏欣网视讯软件技术有限公司 基于手机信令以及大数据分析识别公交线网覆盖盲区的方法与系统
CN112686466A (zh) * 2021-01-12 2021-04-20 北京交通发展研究院 地铁乘客的路径确认方法及装置
CN112686466B (zh) * 2021-01-12 2024-01-05 北京交通发展研究院 地铁乘客的路径确认方法及装置
CN112801181B (zh) * 2021-01-27 2022-08-05 南京邮电大学 城市信令交通流用户分类、预测方法、存储介质及系统
CN112801181A (zh) * 2021-01-27 2021-05-14 南京邮电大学 城市信令交通流用户分类、预测方法、存储介质及系统
CN113709660B (zh) * 2021-07-30 2022-06-24 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN113709660A (zh) * 2021-07-30 2021-11-26 东南大学 一种运用手机信令数据的出行路径精确提取方法
CN114466313A (zh) * 2022-01-28 2022-05-10 同济大学 一种基于手机信令数据的城际出行扩样方法
CN115206104A (zh) * 2022-07-25 2022-10-18 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法
CN115206104B (zh) * 2022-07-25 2024-04-23 南京师范大学 一种基于手机信令数据的城市居民交通出行方式识别方法
CN116434529A (zh) * 2022-12-12 2023-07-14 交通运输部规划研究院 城际公路货运特征分析方法、装置和电子设备
CN116434529B (zh) * 2022-12-12 2023-10-24 交通运输部规划研究院 城际公路货运特征分析方法、装置和电子设备
CN116052436A (zh) * 2023-04-03 2023-05-02 深圳市城市交通规划设计研究中心股份有限公司 一种跨城出行方式识别方法、电子设备及存储介质
CN117292546A (zh) * 2023-10-23 2023-12-26 重庆交通大学 一种基于手机gps数据的交通出行方式od计算方法
CN117292546B (zh) * 2023-10-23 2024-05-07 重庆交通大学 一种基于手机gps数据的交通出行方式od计算方法

Also Published As

Publication number Publication date
CN111653096B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN111653097B (zh) 一种基于手机信令数据且含个人属性修正的城市出行方式综合识别方法
CN111653096B (zh) 一种基于手机信令数据的城市出行方式识别方法
CN111653094B (zh) 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法
CN111653093B (zh) 一种基于手机信令数据的城市出行方式综合识别方法
CN107463940B (zh) 基于手机数据的车辆类型识别方法和设备
CN109308546B (zh) 乘客公交出行下车站点预测方法及系统
CN109145954B (zh) 一种基于多源时空数据的网约车出行安全评价方法及系统
CN112530166B (zh) 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统
CN108761509B (zh) 一种基于历史数据的汽车行驶轨迹及里程预测方法
CN112133090A (zh) 一种基于手机信令数据的多方式交通分布模型构建方法
CN114416710B (zh) 一种快速路车辆od位置提取方法及系统
CN109903553B (zh) 多源数据挖掘的公交车上下车站点识别和检验方法
CN112036757B (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN112511982B (zh) 一种出行语义自动标注的地铁乘客轨迹实时追溯还原方法
CN110836675A (zh) 一种基于决策树的自动驾驶搜索决策方法
CN113079463A (zh) 一种基于手机信令数据的旅游景点游客出行活动识别方法
CN112784000A (zh) 基于出租车轨迹数据的寻客方法
CN115862331A (zh) 考虑卡口网络拓扑结构的车辆出行轨迹重构方法
CN113408833A (zh) 一种公共交通重点区域识别方法、装置及电子设备
CN115795332A (zh) 一种用户出行模式识别的方法
CN111931968B (zh) 一种应用手机gps数据来优化公共自行车站点布局的方法
CN111275241A (zh) 基于机器学习决策树的公交车乘客下车站点推断方法
CN114882693B (zh) 一种基于刷卡数据深度挖掘的公交乘客下车站点预测方法
He et al. Study on Vehicle Travel Trajectory Completion based on AHP-Entropy-TOPSIS Method
CN113064931B (zh) 一种基于Skip-Gram模型的城际高速路网重点通道识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant