CN108171973B - 一种基于手机网格数据的交通出行模式识别方法 - Google Patents

一种基于手机网格数据的交通出行模式识别方法 Download PDF

Info

Publication number
CN108171973B
CN108171973B CN201711446450.3A CN201711446450A CN108171973B CN 108171973 B CN108171973 B CN 108171973B CN 201711446450 A CN201711446450 A CN 201711446450A CN 108171973 B CN108171973 B CN 108171973B
Authority
CN
China
Prior art keywords
mobile phone
mode
travel
traffic
trip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711446450.3A
Other languages
English (en)
Other versions
CN108171973A (zh
Inventor
刘志远
刘少韦华
程龙
俞俊
贾若
袁钰
冷军强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201711446450.3A priority Critical patent/CN108171973B/zh
Publication of CN108171973A publication Critical patent/CN108171973A/zh
Application granted granted Critical
Publication of CN108171973B publication Critical patent/CN108171973B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/012Measuring and analyzing of parameters relative to traffic conditions based on the source of data from other sources than vehicle or roadside beacons, e.g. mobile networks

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于手机网格数据的交通出行模式识别方法,通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征;基于惩罚因子清洗所获取的手机用户出行序列数据,去除“噪声”数据;根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列;根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征;识别手机用户各出行链多模式交通出行模式;基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式。本发明能够基于非集计层面获取用户个体的交通出行模式,用于降低模型复杂度与提升预测准确性。

Description

一种基于手机网格数据的交通出行模式识别方法
技术领域
本发明涉及交通大数据领域,尤其是一种基于手机网格数据的交通出行模式识别方法。
背景技术
城市综合交通规划的主要任务是将多模式交通子系统与城市用地布局、交通出行需求的发展相互协调,取得城市建设与运转的最佳效益。多模式组合出行需求与供给已经成为中国城市综合交通发展的主要趋势。多模式组合出行环境下,客观掌握不同出行模式的交通结构与需求,是科学评估城市交通系统建设水平和运行效果的关键,为城市多模式交通网络协同的资源配置提供数据基础。
长期以来,居民出行家访调查是进行出行模式研究的主要方法,受限于低抽样率与高实施成本,调查年限较长,无法实时监测城市交通网络的出行模式结构。近年来,随着存储与处理技术的不断突破,基于海量交通大数据的城市交通网络分析使出行模式的实时获取成为可能。手机定位数据作为一类新兴的数据源,具有低获取成本与高时空覆盖率的特点,成为弥补传统出行模式调查方法的最佳数据源。手机定位数据是由手机用户通过手机与基站进行交互产生的手机基站数据通过一定算法衍生的数据,主要包含手机三角定位数据与手机网格数据等。其中,手机网格数据是指通过一定算法,将获取的手机基站数据映射到划分好网格的地理网络中,是一类具有时空特征的数据源,主要包含手机用户唯一识别码、记录基站号、记录时刻、记录网格中心点经度编号、记录网格中心点纬度编号等参数。通过提取手机用户的全日网格出行链,挖掘手机用户出行交通特征,进一步识别手机用户出行模式。
目前,国内外在应用手机数据进行城市交通出行模式的研究主要数据源为手机三角定位,尚未有基于手机网格数据的城市交通出行模式识别的相关研究。同时,受限于基站自身与用户环境的影响,手机网格数据存在大量“噪声”数据,增加了研究难度。在出行模式识别方面,大部分研究采用集计模式,获取用户总体中各类出行模式所占比重,识别准确性不高、模型迁移能力差;少量研究着眼于非集计层面,通过大量参数标定来提升用户个体交通模式的识别准确率,模型复杂,不易推广。综上,在城市交通模式的获取上,需要建立简洁的、基于非集计的交通出行模式识别方法。
发明内容
本发明所要解决的技术问题在于,提供一种基于手机网格数据的交通出行模式识别方法,能够基于非集计层面获取用户个体的交通出行模式,用于降低模型复杂度与提升预测准确性。
为解决上述技术问题,本发明提供一种基于手机网格数据的交通出行模式识别方法,包括如下步骤:
(1)通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征;
(2)基于惩罚因子清洗所获取的手机用户出行序列数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据;
(3)根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列;
(4)根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征;
(5)识别手机用户各出行链多模式交通出行模式,所述多模式交通出行模式包含地铁模式、公交模式、机动车模式与慢行交通模式;
(6)基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式。
优选的,步骤(1)中,通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征具体为:
选取特定研究区域,获取研究区域覆盖范围所有基站记录的手机网格数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,提取手机用户全天出行序列;
手机用户出行序列的时间特征包含出行时刻与行程时间;距离特征为相邻两条手机网格数据的网格中心点距离;速度特征为相邻两条手机网格数据的网格中心点速度,具体特征获取方式如下:
若手机用户出行序列中,相邻的两条手机网格数据的时空坐标为(lngi,lati,ti)和(lngi+1,lati+1,ti+1),则可根据下式计算两条手机网格数据之间的出行时刻Ti、行程时间Δti、网格中心点距离Di与网格中心点速度vi
Figure BDA0001527656400000021
Δti=ti+1-ti
Di=(|lngi+1-lngi|+|lati+1-lati|)·d
Figure BDA0001527656400000031
其中,lngi为出行序列中第i个记录网格中心点经度编号,lati为出行序列中第i个记录网格中心点纬度编号,ti为出行序列中第i个记录时刻,u为时间粒度系数,d为地理网格长度。
优选的,步骤(2)中,基于惩罚因子清洗所获取的手机用户出行序列数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据具体为:
通过设置速度识别变量v′i,并求取对应速度识别阈值v′T,去除v′i>v′T的手机网格数据,以消除“乒乓效应”数据,具体计算公式如下:
Figure BDA0001527656400000032
Figure BDA0001527656400000033
Figure BDA0001527656400000034
其中,θv为速度惩罚因子,vmax为最大可接受速度,Δtmin为相邻手机网格数据最小时间间隔,r为权重比率;
通过设置时间识别变量Δt′i,并求取对应时间识别阈值Δt′T,去除Δt′i>Δt′T的手机网格数据,以消除“长时驻留”冗余数据,具体计算公式如下:
Figure BDA0001527656400000035
Figure BDA0001527656400000036
Figure BDA0001527656400000037
其中,θt为时间惩罚因子,Δtmax为相邻手机网格数据最大可接受时间跨度,vmin为最小可接受速度,r为权重比率。
优选的,步骤(3)中,根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列具体为:
(31)将每条输入的手机网格数据看作一类,计算两两之间的向量距离;
(32)对于每一类,获取与其距离最近的类,合并成一个新类;
(33)重新计算新类之间的向量距离;
(34)重复步骤(32)-(33),直到向量距离大于向量距离阈值,构成若干个子出行序列。
优选的,步骤(4)中,根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征具体为:
(41)获取两条相邻手机网格数据空间编号坐标(lngi,lati)和(lngi+1,lati+1);
(42)若lngi=lngi+1且lati=lati+1,转至步骤45)。否则,生成转折点空间编号坐标(lngi,lati+1);
(43)若lati<lati+1,生成新增点(lngi,lati+1),并令lati=lati+1,重复步骤43),否则转至步骤(44);
(44)若lngi<lngi+1,生成新增点(lngi+1,lati),并令loni=loni+1,重复步骤(44),否则转至步骤(45);
(45)得到手机用户出行链,按步骤(1)重新计算出行链的时间特征、距离特征与速度特征。
优选的,所述步骤(45)获得的速度特征误差与出行链覆盖的网格数量有关,当要求速度特征计算相对误差e较小时,应提高出行链覆盖的网格数量n,此时,出行链的总出行距离应满足如下公式:
Figure BDA0001527656400000041
优选的,步骤(5)中,识别手机用户各出行链多模式交通出行模式具体为:
(51)地铁模式
确定出行链中,手机网格数据记录基站号为地铁专用通信基站号的手机用户为地铁出行;
(52)公交模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合公交运行速度特征的手机用户为公交出行,具体确定条件如下:
Figure BDA0001527656400000042
其中,
Figure BDA0001527656400000043
为公交车运行平均速度,M为匹配常数;
(53)机动车模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合机动车运行速度特征的手机用户为机动车出行,具体确定条件如下:
Figure BDA0001527656400000051
其中,
Figure BDA0001527656400000052
为机动车运行平均速度;
(54)慢行交通模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合慢行交通运行速度特征的手机用户为慢行交通出行,具体确定条件如下:
Figure BDA0001527656400000053
其中,
Figure BDA0001527656400000054
为慢行交通平均速度。
优选的,步骤(6)中,基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式具体为:
(61)主出行模式为慢行交通模式
确定各出行链中,识别交通出行模式为慢行交通模式比例大于慢行比例阈值RT的手机用户的主出行模式为慢行交通模式,具体确定条件如下:
Figure BDA0001527656400000055
其中,CP为子出行模式识别为慢行交通模式的数量,CM为子出行模式识别为地铁模式的数量,CB为子出行模式识别为公交模式的数量,CC为子出行模式识别为机动车模式的数量,RT为比例阈值;
(62)主出行模式为地铁模式
确定各出行链中,识别交通出行模式为地铁模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为地铁模式,具体确定条件如下:
Figure BDA0001527656400000056
Figure BDA0001527656400000057
(63)主出行模式为公交模式
确定各出行链中,识别交通出行模式为公交模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为公交模式,具体确定条件如下:
Figure BDA0001527656400000061
Figure BDA0001527656400000062
(64)主出行模式为机动车模式
确定各出行链中,识别交通出行模式为机动车模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为机动车模式,具体确定条件如下:
Figure BDA0001527656400000063
Figure BDA0001527656400000064
本发明的有益效果为:本发明的基于手机网格数据的交通出行模式识别方法,以易获取、体量大的手机网格数据为数据源,解决了传统出行模式调查采用的居民出行家访调查方法低抽样率、高实施成本、调查年限长与无法实时监测城市交通网络出行模式结构的缺陷;基于手机网格数据的交通出行模式识别方法,在数据源层面拓展了手机定位数据研究城市交通出行模式的应用;基于非集计层面的用户个体的交通出行模式预测模型,解决了集计模型准确性不高、迁移能力差的缺陷;发明方法模型简洁,避免了大量的参数标定,预测结果准确、可靠。
附图说明
图1为本发明的方法流程示意图。
图2为本发明的连续定位的手机用户出行序列示意图。
图3为本发明的非连续定位的手机用户出行序列示意图。
具体实施方式
如图1所示,一种基于手机网格数据的交通出行模式识别方法,包括如下步骤:
(1)通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征;
基于非集计层面的用户个体出行模式识别,需要获取每个手机用户全天出行序列,以提取用户出行特征。本发明选取特定研究区域,获取研究区域覆盖范围所有基站记录的手机网格数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,提取手机用户全天出行序列。
手机用户出行序列的时间特征包含出行时刻与行程时间;距离特征为相邻两条手机网格数据的网格中心点距离;速度特征为相邻两条手机网格数据的网格中心点速度。具体特征获取方式如下:
若手机用户出行序列中,相邻的两条手机网格数据的时空坐标为(lngi,lati,ti)和(lngi+1,lati+1,ti+1),则可根据下式计算两条手机网格数据之间的出行时刻Ti、行程时间Δti、网格中心点距离Di与网格中心点速度vi
Figure BDA0001527656400000071
Δti=ti+1-ti
Di=(|lngi+1-lngi|+|lati+1-lati|)·d
Figure BDA0001527656400000072
其中,lngi为出行序列中第i个记录网格中心点经度编号,lati为出行序列中第i个记录网格中心点纬度编号,ti为出行序列中第i个记录时刻(单位:s),u为时间粒度系数(单位:min),d为地理网格长度(单位:km)。
(2)基于惩罚因子清洗所获取的手机用户出行序列数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据;
“乒乓效应”数据指的是手机用户在使用手机时,短时间内与多个基站同时发生交互产生的频繁切换数据,在进行手机定位数据移动距离与移动速度计算时,往往会得到过大的异常值。通过设置速度识别变量v′i,并求取对应速度识别阈值v′T,去除v′i>v′T的手机网格数据,以消除“乒乓效应”数据,具体计算公式如下:
Figure BDA0001527656400000073
Figure BDA0001527656400000074
Figure BDA0001527656400000075
其中,θv为速度惩罚因子,vmax为最大可接受速度(单位:km/h),Δtmin为相邻手机网格数据最小时间间隔(单位:s),r为权重比率。
“长时驻留”冗余数据指的是手机用户长时间在同一个基站覆盖范围内与该基站进行交互,在进行手机定位数据移动距离与移动速度计算时,往往会得到过小的异常值。通过设置时间识别变量Δt′i,并求取对应时间识别阈值Δt′T,去除Δt′i>Δt′T的手机网格数据,以消除“长时驻留”冗余数据,具体计算公式如下:
Figure BDA0001527656400000081
Figure BDA0001527656400000082
Figure BDA0001527656400000083
其中,θt为时间惩罚因子,Δtmax为相邻手机网格数据最大可接受时间跨度(单位:s),vmin为最小可接受速度(单位:km/h),r为权重比率。
(3)根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列;
多模式组合出行环境下,每个手机用户往往存在着一种以上的出行模式。在进行交通出行模式识别时,需要对不同出行模式的出行时段进行划分,构建手机用户子出行序列。通常情况下,同一出行模式对应的出行速度保持在相近的范围内,可通过速度聚类获取相应的手机用户子出行序列。具体聚类步骤为:
31)将每条输入的手机网格数据看作一类,计算两两之间的向量距离;
32)对于每一类,获取与其距离最近的类,合并成一个新类;
33)重新计算新类之间的向量距离;
34)重复步骤32)、33),直到向量距离大于向量距离阈值,构成若干个子出行序列。
(4)根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征;
基于速度聚类方法划分得到的手机用户子出行序列又可分为连续定位的手机用户出行序列(见附图2)与非连续定位的手机用户出行序列(见附图3)。其中,连续定位的手机用户出行序列即为手机用户出行链,非连续定位的手机用户出行序列需要通过补点形成手机用户出行链。具体步骤为:
41)获取两条相邻手机网格数据空间编号坐标(lngi,lati)和(lngi+1,lati+1);
42)若lngi=lngi+1且lati=lati+1,转至步骤45)。否则,生成转折点空间编号坐标(lngi,lati+1);
43)若lati<lati+1,生成新增点(lngi,lati+1),并令lati=lati+1,重复步骤43)。否则转至步骤44);
44)若lngi<lngi+1,生成新增点(lngi+1,lati),并令loni=loni+1,重复步骤44)。否则转至步骤45);
45)得到手机用户出行链,按步骤1重新计算出行链的时间特征、距离特征与速度特征。
所述步骤45)获得的速度特征误差与出行链覆盖的网格数量有关,具体误差判断可参照下表:
Figure BDA0001527656400000091
可以发现,当要求速度特征计算相对误差e较小时,应提高出行链覆盖的网格数量n,此时,出行链的总出行距离应满足如下公式:
Figure BDA0001527656400000092
例如,要获取速度特征计算相对误差低于20%的出行链,应要求其覆盖网格数量为20个,对于地理网格长度d=0.1km的网格,要求出行链的总出行距离应不小于2.1km。
(5)识别手机用户各出行链多模式交通出行模式,所述多模式交通出行模式包含地铁模式、公交模式、机动车模式与慢行交通模式;
具体模式识别如下:
51)地铁模式
确定出行链中,手机网格数据记录基站号为地铁专用通信基站号的手机用户为地铁出行。
52)公交模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合公交运行速度特征的手机用户为公交出行。具体确定条件如下:
Figure BDA0001527656400000101
其中,
Figure BDA0001527656400000102
为公交车运行平均速度,M为匹配常数。
53)机动车模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合机动车运行速度特征的手机用户为机动车出行。具体确定条件如下:
Figure BDA0001527656400000103
其中,
Figure BDA0001527656400000104
为机动车运行平均速度。
54)慢行交通模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合慢行交通运行速度特征的手机用户为慢行交通出行。具体确定条件如下:
Figure BDA0001527656400000105
其中,
Figure BDA0001527656400000106
为慢行交通平均速度。
(6)基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式。
通过分析手机网格数据产生特性,可以发现在移动速度较慢时使用手机与基站进行交互的频次较高,产生较多的手机网格数据,因此各出行链较多地识别为慢行交通出行模式,在进行用户全日出行时段主要交通出行模式时需要进行修正。具体步骤如下:
61)主出行模式为慢行交通模式
确定各出行链中,识别交通出行模式为慢行交通模式比例大于慢行比例阈值RT的手机用户的主出行模式为慢行交通模式。具体确定条件如下:
Figure BDA0001527656400000107
其中,CP为子出行模式识别为慢行交通模式的数量,CM为子出行模式识别为地铁模式的数量,CB为子出行模式识别为公交模式的数量,CC为子出行模式识别为机动车模式的数量,RT为比例阈值。
62)主出行模式为地铁模式
确定各出行链中,识别交通出行模式为地铁模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为地铁模式。具体确定条件如下:
Figure BDA0001527656400000111
Figure BDA0001527656400000112
63)主出行模式为公交模式
确定各出行链中,识别交通出行模式为公交模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为公交模式。具体确定条件如下:
Figure BDA0001527656400000113
Figure BDA0001527656400000114
64)主出行模式为机动车模式
确定各出行链中,识别交通出行模式为机动车模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为机动车模式。具体确定条件如下:
Figure BDA0001527656400000115
Figure BDA0001527656400000116

Claims (5)

1.一种基于手机网格数据的交通出行模式识别方法,其特征在于,包括如下步骤:
(1)通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征;
(2)基于惩罚因子清洗所获取的手机用户出行序列数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据;
(3)根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列;
(4)根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征;根据获得的子出行序列,生成手机用户出行链,获取出行链的时间特征、距离特征与速度特征具体为:
(41)获取两条相邻手机网格数据空间编号坐标(lngi,lati)和(lngi+1,lati+1);
(42)若lngi=lngi+1且lati=lati+1,转至步骤45),否则,生成转折点空间编号坐标(lngi,lati+1);
(43)若lati<lati+1,生成新增点(lngi,lati+1),并令lati=lati+1,重复步骤43),否则转至步骤(44);
(44)若lngi<lngi+1,生成新增点(lngi+1,lati),并令loni=loni+1,重复步骤(44),否则转至步骤(45);
(45)得到手机用户出行链,按步骤(1)重新计算出行链的时间特征、距离特征与速度特征;获得的速度特征误差与出行链覆盖的网格数量有关,当要求速度特征计算相对误差e较小时,应提高出行链覆盖的网格数量n,此时,出行链的总出行距离应满足如下公式:
Figure FDA0002591516440000011
(5)识别手机用户各出行链多模式交通出行模式,所述多模式交通出行模式包含地铁模式、公交模式、机动车模式与慢行交通模式;识别手机用户各出行链多模式交通出行模式具体为:
(51)地铁模式
确定出行链中,手机网格数据记录基站号为地铁专用通信基站号的手机用户为地铁出行;
(52)公交模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合公交运行速度特征的手机用户为公交出行,具体确定条件如下:
Figure FDA0002591516440000021
其中,
Figure FDA0002591516440000022
为公交车运行平均速度,M为匹配常数;
(53)机动车模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合机动车运行速度特征的手机用户为机动车出行,具体确定条件如下:
Figure FDA0002591516440000023
其中,
Figure FDA0002591516440000024
为机动车运行平均速度;
(54)慢行交通模式
确定出行链中,手机网格数据记录基站号不为地铁专用通信基站号、移动速度符合慢行交通运行速度特征的手机用户为慢行交通出行,具体确定条件如下:
Figure FDA0002591516440000025
其中,
Figure FDA0002591516440000026
为慢行交通平均速度;
(6)基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式。
2.如权利要求1所述的基于手机网格数据的交通出行模式识别方法,其特征在于,步骤(1)中,通过手机网格数据构建手机用户出行序列,获取序列的时间特征、距离特征与速度特征具体为:
选取特定研究区域,获取研究区域覆盖范围所有基站记录的手机网格数据,以手机用户唯一识别码进行分组,并按时间顺序进行排序,提取手机用户全天出行序列;
手机用户出行序列的时间特征包含出行时刻与行程时间;距离特征为相邻两条手机网格数据的网格中心点距离;速度特征为相邻两条手机网格数据的网格中心点速度,具体特征获取方式如下:
若手机用户出行序列中,相邻的两条手机网格数据的时空坐标为(lngi,lati,ti)和(lngi+1,lati+1,ti+1),则可根据下式计算两条手机网格数据之间的出行时刻Ti、行程时间Δti、网格中心点距离Di与网格中心点速度vo
Figure FDA0002591516440000031
Δti=ti+1-ti
Di=(|lngi+1-lngi|+|lati+1-lati|)·d
Figure FDA0002591516440000032
其中,lngi为出行序列中第i个记录网格中心点经度编号,lati为出行序列中第i个记录网格中心点纬度编号,ti为出行序列中第i个记录时刻,u为时间粒度系数,d为地理网格长度。
3.如权利要求1所述的基于手机网格数据的交通出行模式识别方法,其特征在于,步骤(2)中,基于惩罚因子清洗所获取的手机用户出行序列数据,去除包括“乒乓效应”数据和“长时驻留”冗余数据在内的“噪声”数据具体为:
通过设置速度识别变量v′i,并求取对应速度识别阈值v′T,去除v′i>v′T的手机网格数据,以消除“乒乓效应”数据,具体计算公式如下:
Figure FDA0002591516440000033
Figure FDA0002591516440000034
Figure FDA0002591516440000035
其中,θv为速度惩罚因子,vmax为最大可接受速度,Δtmin为相邻手机网格数据最小时间间隔,r为权重比率;
通过设置时间识别变量Δt′i,并求取对应时间识别阈值Δt′T,去除Δt′i>Δt′T的手机网格数据,以消除“长时驻留”冗余数据,具体计算公式如下:
Figure FDA0002591516440000036
Figure FDA0002591516440000037
Figure FDA0002591516440000038
其中,θt为时间惩罚因子,Δtmax为相邻手机网格数据最大可接受时间跨度,vmin为最小可接受速度,r为权重比率。
4.如权利要求1所述的基于手机网格数据的交通出行模式识别方法,其特征在于,步骤(3)中,根据获得的清洗后的手机用户出行序列,基于速度聚类方法划分手机用户子出行序列具体为:
(31)将每条输入的手机网格数据看作一类,计算两两之间的向量距离;
(32)对于每一类,获取与其距离最近的类,合并成一个新类;
(33)重新计算新类之间的向量距离;
(34)重复步骤(32)-(33),直到向量距离大于向量距离阈值,构成若干个子出行序列。
5.如权利要求1所述的基于手机网格数据的交通出行模式识别方法,其特征在于,步骤(6)中,基于已识别的手机用户出行链多模式交通出行模式比例,识别用户全日出行时段主要交通出行模式具体为:
(61)主出行模式为慢行交通模式
确定各出行链中,识别交通出行模式为慢行交通模式比例大于慢行比例阈值RT的手机用户的主出行模式为慢行交通模式,具体确定条件如下:
Figure FDA0002591516440000041
其中,CP为子出行模式识别为慢行交通模式的数量,CM为子出行模式识别为地铁模式的数量,CB为子出行模式识别为公交模式的数量,CC为子出行模式识别为机动车模式的数量,RT为比例阈值;
(62)主出行模式为地铁模式
确定各出行链中,识别交通出行模式为地铁模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为地铁模式,具体确定条件如下:
Figure FDA0002591516440000042
Figure FDA0002591516440000043
(63)主出行模式为公交模式
确定各出行链中,识别交通出行模式为公交模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为公交模式,具体确定条件如下:
Figure FDA0002591516440000044
Figure FDA0002591516440000051
(64)主出行模式为机动车模式
确定各出行链中,识别交通出行模式为机动车模式比例不大于慢行比例阈值RT,且在其余出行模式中占比最大的手机用户的主出行模式为机动车模式,具体确定条件如下:
Figure FDA0002591516440000052
Figure FDA0002591516440000053
CN201711446450.3A 2017-12-27 2017-12-27 一种基于手机网格数据的交通出行模式识别方法 Active CN108171973B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711446450.3A CN108171973B (zh) 2017-12-27 2017-12-27 一种基于手机网格数据的交通出行模式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711446450.3A CN108171973B (zh) 2017-12-27 2017-12-27 一种基于手机网格数据的交通出行模式识别方法

Publications (2)

Publication Number Publication Date
CN108171973A CN108171973A (zh) 2018-06-15
CN108171973B true CN108171973B (zh) 2020-09-18

Family

ID=62518060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711446450.3A Active CN108171973B (zh) 2017-12-27 2017-12-27 一种基于手机网格数据的交通出行模式识别方法

Country Status (1)

Country Link
CN (1) CN108171973B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109121094B (zh) * 2018-07-27 2021-04-06 北京交通发展研究院 伪码信令数据预处理与出行链识别方法
CN109035787B (zh) * 2018-09-10 2020-07-28 华南理工大学 一种利用移动通信数据识别交通工具类别的方法
CN109327854B (zh) * 2018-11-15 2022-05-31 中国联合网络通信集团有限公司 轨道用户识别方法及装置
CN110751831B (zh) * 2019-10-10 2021-01-22 珠海市岭南大数据研究院 出行方式识别方法、装置、计算机设备和存储介质
CN111508228B (zh) * 2020-04-01 2021-01-01 佛山市城市规划设计研究院 利用手机gps及电子地图数据的公共交通出行链的获取方法
CN112530166B (zh) * 2020-12-01 2021-11-05 江苏欣网视讯软件技术有限公司 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115557A (ja) * 2003-10-06 2005-04-28 Sumitomo Electric Ind Ltd 移動手段判別装置および方法、ならびにod交通量算出装置および方法
CN102136192A (zh) * 2011-01-31 2011-07-27 上海美慧软件有限公司 一种基于手机信号数据的出行方式识别方法
CN103810851A (zh) * 2014-01-23 2014-05-21 广州地理研究所 一种基于手机定位的交通出行模式识别方法
CN105809962A (zh) * 2016-06-13 2016-07-27 中南大学 一种基于手机数据的交通出行方式划分的方法
CN107480784A (zh) * 2017-06-28 2017-12-15 青岛科技大学 一种基于深度学习的手机信令数据行人交通轨迹预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115557A (ja) * 2003-10-06 2005-04-28 Sumitomo Electric Ind Ltd 移動手段判別装置および方法、ならびにod交通量算出装置および方法
CN102136192A (zh) * 2011-01-31 2011-07-27 上海美慧软件有限公司 一种基于手机信号数据的出行方式识别方法
CN103810851A (zh) * 2014-01-23 2014-05-21 广州地理研究所 一种基于手机定位的交通出行模式识别方法
CN105809962A (zh) * 2016-06-13 2016-07-27 中南大学 一种基于手机数据的交通出行方式划分的方法
CN107480784A (zh) * 2017-06-28 2017-12-15 青岛科技大学 一种基于深度学习的手机信令数据行人交通轨迹预测方法

Also Published As

Publication number Publication date
CN108171973A (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN108171973B (zh) 一种基于手机网格数据的交通出行模式识别方法
Soh et al. Adaptive deep learning-based air quality prediction model using the most relevant spatial-temporal relations
Xia et al. Exploring human mobility patterns in urban scenarios: A trajectory data perspective
CN104239556B (zh) 基于密度聚类的自适应轨迹预测方法
CN109005515B (zh) 一种基于移动轨迹信息的用户行为模式画像的方法
CN108537351B (zh) 一种推荐上车点的确定方法及装置
CN106708955B (zh) 一种热力图生成方法及设备
Lu et al. Pervasive location acquisition technologies: Opportunities and challenges for geospatial studies
CN102521973B (zh) 一种手机切换定位的道路匹配方法
CN109688532B (zh) 一种划分城市功能区域的方法及装置
Iovan et al. Moving and calling: Mobile phone data quality measurements and spatiotemporal uncertainty in human mobility studies
CN106792465B (zh) 一种基于众包指纹的室内指纹地图构建方法
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN108171974A (zh) 一种基于手机三角定位数据的交通出行模式判别方法
CN105809962A (zh) 一种基于手机数据的交通出行方式划分的方法
Zhang et al. Recommending pick-up points for taxi-drivers based on spatio-temporal clustering
CN110728305A (zh) 基于网格信息熵聚类算法的出租车载客热点区域挖掘方法
CN110414795B (zh) 基于改进两步移动搜索法的新增高铁枢纽可达性影响方法
CN112328728A (zh) 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质
Zuo et al. Detection and Analysis of Urban Area Hotspots Based on Cell Phone Traffic.
CN115988421A (zh) 一种基于时间权重聚类的职住地估计方法及装置
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN116233757A (zh) 一种基于手机信令数据的居民出行碳排放量计算方法
Li et al. Estimating crowd flow and crowd density from cellular data for mass rapid transit
CN111950798A (zh) 一种基于小波神经网络的区域短期人流量趋势预测方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant