CN111444286A - 一种基于轨迹数据的远距离交通节点关联性挖掘方法 - Google Patents

一种基于轨迹数据的远距离交通节点关联性挖掘方法 Download PDF

Info

Publication number
CN111444286A
CN111444286A CN202010154942.0A CN202010154942A CN111444286A CN 111444286 A CN111444286 A CN 111444286A CN 202010154942 A CN202010154942 A CN 202010154942A CN 111444286 A CN111444286 A CN 111444286A
Authority
CN
China
Prior art keywords
node
traffic
nodes
traffic node
trip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010154942.0A
Other languages
English (en)
Other versions
CN111444286B (zh
Inventor
于海洋
刘润坤
任毅龙
葛昱
邹迎
李倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Municipal Commission Of Transport
Beihang University
Original Assignee
Beijing Municipal Commission Of Transport
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Municipal Commission Of Transport, Beihang University filed Critical Beijing Municipal Commission Of Transport
Publication of CN111444286A publication Critical patent/CN111444286A/zh
Application granted granted Critical
Publication of CN111444286B publication Critical patent/CN111444286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本专利公开了一种基于轨迹数据的远距离交通节点关联性挖掘方法,所述方法包括:根据原始轨迹数据获取乘客每一次出行的起点和终点;获取交通节点中心的地理位置信息,并判定交通节点范围;轨迹数据匹配;计算每一次出行所有经过的交通节点序列;所述序列包括车辆在该次出行中经过每个交通节点的编号以及经过每个交通节点的时间;步骤五、建立关联度计算模型;步骤六、按照最短路径方法或依据实际出行距离,计算任意两个节点间的实际出行距离。通过上述方法能够有效的计算出轨迹数据的远距离交通节点关联性,有结果准确,计算速度快的特点。

Description

一种基于轨迹数据的远距离交通节点关联性挖掘方法
技术领域
本发明涉及大数据交通技术领域,更具体的说,是一种基于大规模轨迹数据挖掘城市远距离交通节点(交叉口)间的关联性分析方法。
背景技术
城市道路交通系统是一个复杂开放的巨系统,城市道路网络密度高,其中某些重要交通节点对城市路网运行效率有着重要影响。交叉口作为复杂交通网络的关键单元便扮演这样的角色。现存研究多关注城市道路路网的时空运行规律,却对交通节点间的内在关联性鲜有关注,特别是针对大城市中较远距离的交叉口间的关联性。近年来,车载终端设备的普及,实现了对车辆轨迹数据的采集,反映出人们的出行特征。
基于上述背景,本发明设计的基于大规模轨迹数据对远距离交通节点(交叉口)的关联性挖掘方法,该方法对城市交通管理、交通控制、交通拥堵机理解析具有参考价值。
发明内容
本发明就是基于现有技术的上述缺陷,而提出的发明要解决的技术问题在于提供一套基于轨迹数据探索远距离交通节点(交叉口)之间的关联性的方法,以通过轨迹数据探索远距离交通节点之间的关联性。
为了实现上述目的,本发明的技术方案如下:
一种基于轨迹数据的远距离交通节点关联性挖掘方法,所述方法包括:步骤一、根据原始轨迹数据获取乘客每一次出行的起点和终点;步骤二、获取交通节点中心的地理位置信息,并判定交通节点范围;其中,设车辆速度为speed,采样时间间隔为frequency,交叉口范围OE的最小值满足2π*OE/4=speed*frequency;步骤三、轨迹数据匹配;判断每一个轨迹点是否在判定的交通节点范围内,如果在,则标记该轨迹点所属交通节点编号;步骤四、计算每一次出行所有经过的交通节点序列;所述序列包括车辆在该次出行中经过每个交通节点的编号以及经过每个交通节点的时间,表示为TRA=(P1...Pn.,T1...Tn),其中P表示位置,T表示时间;步骤五、建立关联度计算模型;根步骤四中的获得的数据计算任意两个交通节点间的关联度,用0-1的数值进行量化;步骤五的具体步骤包括,首先提取含有任意节点P的所有交通节点序列,统计序列数量为N,并记录这些节点序列集合为U;之后统计这些含有P的节点序列中包含的所有其它节点编号定义其采用包括A,B,C的字母序列来表示;接下来分别统计U中同时含有PA节点、PB节点、PC节点的序列数量NA,NB,CC;最后计算得到关联度NA/N,NB/N,NC/N分别表示节点P与节点A,B,C的关联度;该关联度为0-1范围的数值;步骤六、按照最短路径方法或依据实际出行距离,计算任意两个节点间的实际出行距离;步骤七、选取某一个交通节点,作为中心节点,提取以该节点为中心的所有相关节点的关联度;根据其他相关节点与该中心节点的实际出行距离对所述其他相关节点进行分组;步骤八、对每一组相关节点的关联度进行分别的标准化处理;得到最终的关联度数值。
优选地,所述交通节点包括交叉口。
3.根据权利要求1所述的一种基于轨迹数据的远距离交通节点关联性挖掘方法,其特征在于:所述步骤一包括:删除重复值,填充缺失值,根据车辆行驶状态判断每次出行的起点和终点辆行驶状态判断每次出行的起点和终点。
经过上述8个步骤的计算,得到以某一个节点为中心的任意关联节点的关联度数值,需要注意的是这个关联度数值是对原始的关联度数值按照距离属性分组归一化后的数值。该方法利用到Apriori算法原理,但松弛了最小支持度和最小置信度的概念,使得所有节点间的关联均是可计算的。其反映的意义是,消除距离因素度对各节点与中心节点间关联度的影响,进而可以更加真实的反映乘客出行的联系强度,而不受距离因素的影响。与现有技术相比,本发明的有益效果是:以实际的乘客出行数据为基础,可以量化各交通节点间的关联程度,这种关联是一种跨空间的联系。通过将同一距离范围内的交通节点关联度进行比较,可以还原剔除距离因素影响后的交通节点关联度,较原有的仅仅考虑比邻节点的关联度来说,更能反映出远距离交通节点的联系强度。
附图说明
图1为本发明方法的流程示意图
图2为确定交叉口范围示意图
图3为经过计算的得到原始关联度热力图(以某一个交通节点为例)
图4为经过分组标准化后的关联度热力图(以某一个交通节点为例)
具体实施方式
下面结合实例对本发明所述的一种基于轨迹数据的远距离交通节点关联性挖掘方法作进一步说明。以成都市滴滴快车数据为例。
轨迹数据包含以下5个字段:
Figure BDA0002402240150000031
订单数据包含以下七个有效字段
Figure BDA0002402240150000032
S1:对原始轨迹数据进行预处理,删除重复值,填充缺失值,根据车辆行驶状态判断每次出行的起点和终点;在该步骤中若已有的轨迹数据有详细的起终点信息,可将轨迹数据拆分为每一次出行的情况,那么本步骤可以省略。如案例中订单数据包含该信息,可省略该步骤,仅做信息匹配即可;
S2:获取交通节点中心(交叉口)的位置信息(经纬度),可通过实际调查,或者网络地图爬取获得;得到的有效信息如下:
Figure BDA0002402240150000033
S3:轨迹数据匹配;首先应当划分交通节点范围,这是由于轨迹点仅仅是行程中的采样点,并不能真实完整的描述任意时刻的位置,每两个轨迹点间有一定的距离,这个间距与不同的车速以及采样频率有关,越高的速度与越低的采样频率意味着越远的间隔。当这个间距超出一定值时我们就无法保证准确地记录某一轨迹序列是否通过了某一交叉口。假设有轨迹序列TRA=(ABCD,T1T2T3T4)如图2所示,当交通节点范围设置为OE=distance1时,相邻两记录点C和D点均未被划分为交叉口范围内,因此该轨迹序列中没有经过该交叉口的记录,但实际上TRA中应当包含通过该交叉口的记录。而如果扩大交叉口的设置范围,当OE=distance2时,则可以保证至少会有一个轨迹点落入交叉口范围内,如图所示。
所以必然存在一个交叉口范围的最小值OE,可以保证理想情况下所有的轨迹序列中经过交叉口范围的点至少有一个被记录,该最小距离应大于distance1并且小于distance2。设车辆速度为speed,采样时间间隔为frequency。那么当2π*OE/4=speed*frequency时,表示W至N的圆弧弧长与两采样点间路径距离相等,该种情形表示C、D点刚好分别与交通节点边界W、N点重合,处于能否匹配轨迹数据的临界情形。因此W-N的弧长至少要大于speed*frequency才能保证任何情况下都能满足经过交叉口时一定会被记录。通过该方法能够结合实际情况确定交通节点的范围。
在本案例中,根据我们对轨迹数据的分析可以计算出连续两个轨迹点间的速度,其95%分位速度为15.75m/s,并且已知GPS采样频率为3s。因此当2π*OE/4>15.75*3时,即2π*OE/4>47.25,可得OE>30m。即交叉口范围应当设置为中心点O到边界E最小为30m。
根据所计算的交通节点范围,判断每一个GPS点是否落在某个交叉口范围内。并记录编号。
S4:通过步骤3可以得到每一个轨迹序列中的每一个轨迹点是否在交通节点范围内,以及对应的交通节点编号;这样一来便可以将一个轨迹序列简化为该轨迹序列经过的交通节点序列。如轨迹TRA=(ABCDE,T1T2T3T4T5)中B、E两个轨迹点分别经过Node1和Node2,那么该轨迹序列可以表示为TRA=(Node1Node2,T2T5)。
S5:根据S4步骤中的获得的数据,利用Apriori算法原理计算任意两个交通节点间的关联度,用0-1的数值进行量化。得到的数据格式如下表所示。以刃具立交交叉口为例,绘制关联度效果图(热力图)如图3所示。
Figure BDA0002402240150000051
S6:选取某一个交通节点,作为中心节点,计算该节点到各相关联节点的实际交通出行距离,可通过网络地图抓取。
S7:首先提取与中心节点相关联的各节点关联度;根据第6步计算得到的其中心节点与各节点的实际出行距离划分;具体分组依据可根据实际关联节点数量确定(如每1km范围内分为1组),合理的划分每一组的节点数量。
S8:对第7步中分组后的节点关联度进行分组标准化,公式如下:
Figure BDA0002402240150000052
其中x*表示标准化后的关联强度,x表示原关联度,
Figure BDA0002402240150000053
表示原关联度的均值,σ表示原关联度的标准差。
经过该方法标准化后每一组数据均符合标准正态分布,这样做的好处是可以将远距离交通节点间的需求凸显出来。同样以刃具立交交叉口为例,将最终的关联度结果绘制如图4(热力图)所示。
从图4中可以看出与第5步计算得到的原始关联度相比,经过分组标准化后的关联度体现出了远距离的交通需求联系,并且能够明显的看出联系具有方向性,相对应的说明了城市交通之间的需求具有方向性,并且不同方向的联系强度不一定相同。
本发明通过对轨迹数据的处理、分析、挖掘,探索了城市关远距离键交通节点间的联系。首先将交通节点数据与轨迹数据进行匹配;之后根据通过各节点的交通需求量,采用Apriori算法原理计算各节点间的关联强度,用0-1的数字表示;最后用分组标准化方法,将不同距离的交通节点关联度统一在标准正太分布下,减弱距离因素对关联度数值的影响。
通过本发明,可以有效的挖掘城市远距离交通节点之间的联系,可以为交通规划、交通信息控制、公共交通线路设计等领域提供决策支持。并且本发明的方法具有普适性,仅需要具有交通节点的数据即可或认为划分交通节点,如交通卡口数据、公交运行数据等,从中可以提取交通节点的需求联系,即可应用本发明的方法进行数据挖掘,得到远距离交通节点的关联强度。

Claims (3)

1.一种基于轨迹数据的远距离交通节点关联性挖掘方法,其特征在于,所述方法包括:
步骤一、根据原始轨迹数据获取乘客每一次出行的起点和终点;
步骤二、获取交通节点中心的地理位置信息,并判定交通节点范围;
其中,设车辆速度为speed,采样时间间隔为frequency,交叉口范围OE的最小值满足2π*OE/4=speed*frequency;
步骤三、轨迹数据匹配;判断每一个轨迹点是否在判定的交通节点范围内,如果在,则标记该轨迹点所属交通节点编号;
步骤四、计算每一次出行所有经过的交通节点序列;所述序列包括车辆在该次出行中经过每个交通节点的编号以及经过每个交通节点的时间,表示为TRA=(P1...Pn.,T1...Tn),其中P表示位置,T表示时间;
步骤五、建立关联度计算模型;根步骤四中的获得的数据计算任意两个交通节点间的关联度,用0-1的数值进行量化;
步骤五的具体步骤包括,首先提取含有任意节点P的所有交通节点序列,统计序列数量为N,并记录这些节点序列集合为U;之后统计这些含有P的节点序列中包含的所有其它节点编号定义其采用包括A,B,C的字母序列来表示;接下来分别统计U中同时含有PA节点、PB节点、PC节点的序列数量NA,NB,CC;最后计算得到关联度NA/N,NB/N,NC/N分别表示节点P与节点A,B,C的关联度;该关联度为0-1范围的数值;
步骤六、按照最短路径方法或依据实际出行距离,计算任意两个节点间的实际出行距离;
步骤七、选取某一个交通节点,作为中心节点,提取以该节点为中心的所有相关节点的关联度;根据其他相关节点与该中心节点的实际出行距离对所述其他相关节点进行分组;
步骤八、对每一组相关节点的关联度进行分别的标准化处理;得到最终的关联度数值。
2.根据权利要求1所述的一种基于轨迹数据的远距离交通节点关联性挖掘方法,其特征在于,所述交通节点包括交叉口。
3.根据权利要求1所述的一种基于轨迹数据的远距离交通节点关联性挖掘方法,其特征在于:所述步骤一包括:删除重复值,填充缺失值,根据车辆行驶状态判断每次出行的起点和终点辆行驶状态判断每次出行的起点和终点。
CN202010154942.0A 2019-09-19 2020-03-06 一种基于轨迹数据的远距离交通节点关联性挖掘方法 Active CN111444286B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019108896015 2019-09-19
CN201910889601.5A CN110674226A (zh) 2019-09-19 2019-09-19 一种基于轨迹数据的远距离交通节点关联性挖掘方法

Publications (2)

Publication Number Publication Date
CN111444286A true CN111444286A (zh) 2020-07-24
CN111444286B CN111444286B (zh) 2022-06-21

Family

ID=69076953

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910889601.5A Pending CN110674226A (zh) 2019-09-19 2019-09-19 一种基于轨迹数据的远距离交通节点关联性挖掘方法
CN202010154942.0A Active CN111444286B (zh) 2019-09-19 2020-03-06 一种基于轨迹数据的远距离交通节点关联性挖掘方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910889601.5A Pending CN110674226A (zh) 2019-09-19 2019-09-19 一种基于轨迹数据的远距离交通节点关联性挖掘方法

Country Status (1)

Country Link
CN (2) CN110674226A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112118535B (zh) * 2020-08-12 2021-08-17 深圳技术大学 车辆漫游区域预测方法及系统
CN111914955B (zh) * 2020-10-13 2021-01-15 上海世脉信息科技有限公司 一种基于gps轨迹数据的公共交通线路识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958302A (zh) * 2017-11-17 2018-04-24 中南大学 基于虚拟拓扑交通网络的经验路径规划方法
CN108648454A (zh) * 2018-05-18 2018-10-12 中山大学 一种基于出行数据的交通小区动态划分方法
US20190043359A1 (en) * 2017-08-03 2019-02-07 Laird Technologies, Inc. Sensor-equipped traffic safety message systems and related methods
CN109448370A (zh) * 2018-10-29 2019-03-08 东南大学 一种基于车辆轨迹数据的交通控制子区划分方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190043359A1 (en) * 2017-08-03 2019-02-07 Laird Technologies, Inc. Sensor-equipped traffic safety message systems and related methods
CN107958302A (zh) * 2017-11-17 2018-04-24 中南大学 基于虚拟拓扑交通网络的经验路径规划方法
CN108648454A (zh) * 2018-05-18 2018-10-12 中山大学 一种基于出行数据的交通小区动态划分方法
CN109448370A (zh) * 2018-10-29 2019-03-08 东南大学 一种基于车辆轨迹数据的交通控制子区划分方法

Also Published As

Publication number Publication date
CN110674226A (zh) 2020-01-10
CN111444286B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
Li et al. Transportation mode identification with GPS trajectory data and GIS information
CN110176139B (zh) 一种基于dbscan+的道路拥堵识别可视化方法
CN107195180B (zh) 一种基于电警数据的交通出行轨迹提取方法和装置
CN111612670B (zh) 一种构建机动车排放清单的方法、装置和计算机设备
CN111046049B (zh) 一种货车gps轨迹数据压缩方法
CN104331422A (zh) 一种路段类型推测方法
CN110555992B (zh) 一种基于gps轨迹数据的出租车行驶路径信息提取方法
CN110838232A (zh) 基于过车电警数据的单一车辆od获取方法
CN109886724B (zh) 一种鲁棒性的居民出行轨迹识别方法
CN112309118B (zh) 一种基于时空相似度的车辆轨迹推算方法
CN111444286B (zh) 一种基于轨迹数据的远距离交通节点关联性挖掘方法
CN106023592A (zh) 一种基于gps数据的交通拥堵检测方法
CN110889444A (zh) 一种基于卷积神经网络的驾驶轨迹特征分类方法
CN109979198B (zh) 基于大规模浮动车数据的城市快速道路车速离散辨识方法
Li et al. An automatic extraction method of coach operation information from historical trajectory data
CN115565376B (zh) 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统
CN104121917A (zh) 一种自动发现新建桥梁的方法和装置
CN112598896B (zh) 一种基于gps数据的工业园区物流关键路段识别方法
CN113870559A (zh) 一种基于大数据车联网的交通流量计算方法
Xu et al. An assistant decision-supporting method for urban transportation planning over big traffic data
Hu et al. Evaluating Bicycling Environments with Trajectory Data on Shared Bikes: A Case Study of Beijing
Zhang et al. Trajectory data compression algorithm based on motion state changing
Cheng et al. Prediction of the shortest travel time based on intersection delay
Li et al. A GPS Trajectory Segmentation Method for Transportation Mode Inference
Liu et al. Extracting campus’ road network from walking gps trajectories

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant