CN108961747A - 一种不完备卡口数据条件下的城市道路交通状态信息提取方法 - Google Patents

一种不完备卡口数据条件下的城市道路交通状态信息提取方法 Download PDF

Info

Publication number
CN108961747A
CN108961747A CN201810714830.9A CN201810714830A CN108961747A CN 108961747 A CN108961747 A CN 108961747A CN 201810714830 A CN201810714830 A CN 201810714830A CN 108961747 A CN108961747 A CN 108961747A
Authority
CN
China
Prior art keywords
data
section
time
period
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810714830.9A
Other languages
English (en)
Other versions
CN108961747B (zh
Inventor
任毅龙
刘帅
于海洋
刘晨阳
杨刚
张路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201810714830.9A priority Critical patent/CN108961747B/zh
Publication of CN108961747A publication Critical patent/CN108961747A/zh
Application granted granted Critical
Publication of CN108961747B publication Critical patent/CN108961747B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions

Abstract

本专利公开了一种在不完备卡口数据条件下的城市道路交通状态信息提取方法,具体包括以下几个步骤:步骤一,不完备数据的预处理;步骤二,补全缺失数据;步骤三,提取道路交通状态信息,本发明适用于对城市道路交通状态信息的提取,基于不完备的卡口数据,使用优化的深度优先遍历求出丢失轨迹点,然后使用拉格朗日型多项式插值法求出丢失轨迹点的时间信息,进而可以对道路交通状态信息进行提取。

Description

一种不完备卡口数据条件下的城市道路交通状态信息提取 方法
技术领域
本发明涉及交通信息领域,尤其涉及不完备卡口数据条件下城市交通状态信息提取方法。
背景技术
随着我国的综合国力和人民生活水平的提高,机动车的数量每年以10%~20%的速度增加,为了加强对机动车的监管和城市道路化建设,卡口设备布设数量也得到了大幅提升。道路卡口监控系统可以全天候的对卡口进行监测,并对所有类型的过往车辆进行记录,而且记录信息丰富,包含卡口编号,车牌号码,过车时间等信息。使用卡口数据可以对城市道路交通状态信息进行提取和分析,但是由于卡口监控系统设备技术水平以及卡口监控设备布设卡口数目等的限制,难免会出现记录信息丢失和记录点缺失等信息记录不完善的现象,导致不完备卡口数据条件下的城市交通状态信息提取困难。所以需要研究不完备卡口数据条件下的城市道路交通状态信息提取方法。
目前,关于道路交通状态信息提取的研究有很多,申请号为201510938922.1的专利——《一种基于大数据的交通运行状态特征参数提取方法》是基于GPS数据和手机信令数据对车辆速度和道路流量参数进行提取,其方法不适用于卡口数据。现有技术中还有大量基于卡口数据对交通信息进行提取的技术方案,但是对于卡口数据不完备的情况下通常的做法是将该数据舍弃,例如申请号为201510225291.9的专利——《基于大规模卡口过车数据的道路实时通行速度计算方法》虽然是基于卡口数据对路段速度信息的提取方法,但对于有缺失的卡口数据并不适用。
发明内容
本发明提出了一种在部分卡口数据丢失的情况下交通状态信息提取方法,通过对有效的卡口信息进行补充,使其所记录的位置信息,时间信息和车辆信息相对完整,完成对城市道路交通状态信息的提取。
为了解决上述技术问题,本专利提供的技术方案包括:
提供一种不完备卡口数据条件下的城市道路交通状态信息提取方法,所述方法包括如下步骤:步骤一,不完备数据的预处理
1.1车辆行程划分
数据的预处理包括,从数据库中选取路网内所有记录点的卡口数据,并剔除异常数据和重复数据;将此部分数据按照车牌号进行分类,并给每辆车分配编号;按时间顺序对每辆车的数据进行排列;最后,对车辆行程划分,划分方法如下:
(1)根据路网中各个路段正常行驶通过所需的平均时间设置路段通行时间集合T={T1,T2,…,TV},集合中的最大值Tu(u∈V)作为阈值。
(2)在上述已按时间排序的数据中,若每辆车的每两条相邻数据时间差大于阈值,则认为车辆在这两个记录点之间有停留,需要将数据从这两个记录点之间断开,所以将这两个记录点前者及其以前的数据视为行程A,后者及其以后的记录点视为行程B。如图2所示,某辆车在经过卡口编号为187和024的卡口之间所消耗的时间大于阈值,则认为此车辆在两个卡口之间有停留,故将其行驶轨迹从此处断开,划分为行程A和行程B。但若行程B中仍有相邻数据时间差大于阈值的情况,则可以对行程B继续进行行程划分。
(3)剔除只有一条记录的行程,并对剩余的行程分配编号以记录行程划分情况。
1.2计算部分评价指标
初步计算各路段流量和速度,作为后续熵权法计算所需的两项评价指标,具体计算方法如下:
(1)以t为周期(t可取5min,10min等)将一天的时间划分为n个时段,对每个周期的数据进行遍历,提取各条数据的卡口编号k,车牌号码m,过车时间s等信息,计算每个时间周期内经过各卡口的各方向的车辆数,即可得出各路段每个周期的流量信息qdj,其中d为路段编号,j为第j个时间周期。
(2)仍以t为周期计算路段速度vdj,按行程读取数据的卡口编号k,车牌号码m,过车时间s等信息,计算每相邻两条数据的时间差:Δs=si+1-si,然后用对应路段长度除以时间差可得速度,计算公式如下:
其中vdi为第i条数据的卡口编号k和第i+1条数据的卡口编号k+1所连接的路段d的一个速度值,Δs为第i+1条数据的时间和i条数据的时间的差值,dd为路段d的长度。
对每个周期的数据求其各路段的速度平均值即为此周期内的路段速度,公式如下:
其中,vdj为第j个时间周期内的路段d的速度平均值,∑vdj为第j个时间周期的路段d的所有速度值vdi的和,h为第j个时间周期内vdi的个数。将路段编号d,时间段j,路段平均速度vdj存入数据库中,即可得各路段在各个时段的速度。
(3)由于原始卡口数据有缺失,故所求路段的流量和速度均不完整。若某路段的流量或速度在某时段有缺失,则可使用此路段相邻时段的流量或速度近似替代。
步骤二,补全缺失数据
若某行程的数据所显示的位置信息如果能够依次出现在路网各个相邻卡口处,即其轨迹信息不存在断点,则此行程数据无缺失,可直接使用来提取道路交通状态信息。如图2所示的行程A,行程数据无缺失;若某行程的数据所显示的位置信息在路网中不能顺次连结,即其轨迹信息存在断点,则此行程数据有缺失,需要对其每个断点的数据补充完整后才可使用。如图2所示的行程B,在卡口编号为026的卡口处数据缺失,其行程数据所显示的轨迹位置为028到186。遍历各行程的数据,提取其位置信息,并判断其轨迹是否存在断点,提取存在数据缺失的行程数据进行补充。
2.1计算缺失点的位置
对于存在缺失的数据需使用优化的深度优先遍历计算其缺失部分的轨迹,具体步骤如下:
(1)使用深度优先遍历的方法找出数据缺失部分对应的起点和终点的所有可能路径,并对所有可能路径进行初次筛选,找出其中最短路径及与最短路径所经过的卡口数相差小于等于3的所有路径,设某行程缺失部分的可能路径的集合为R={r1,r2,…,rn},其中ri表示路径的集合中第i条路径。其中n是符合条件的可能路径的总数。
(2)选择路径长度,路径平均速度,路段数量,路径平均流量作为评价指标。路径长度为每条可能路径所经过的各路段的长度和,用集合表示为L={l1,l2,…,ln}T,其中li(i∈n)表示第i条可能路径所经过的各路段的长度和,即li=∑dd;路径平均速度为每条可能路径所经过的各路段在对应时间段内的速度平均值,用集合表示为V={v1,v2,…,vn}T,其中vi(i∈n)表示第i条可能路径所经过的各路段的平均速度vdj的平均值,即 路段数量为每条可能路径所经过的路段的数量,用集合表示为C={c1,c2,…,cn}T,其中ci(i∈n)表示第i条可能路径所经过的路段的数量;路径平均流量为每条可能路径所经过的各路段在对应时间段内的流量平均值,用集合表示为Q={q1,q2,…,qn}T,其中qi(i∈n)表示第i条可能路径所经过的各路段的流量qdj的平均值,即用熵权法对各评价指标的权值进行确定,首先获得初始矩阵:
(3)上述四个评价指标中路段平均速度和路段流量为高优指标,路段长度和路段数量为低优指标,不同指标之间应该具有同趋势性,故采用倒数法将低优指标转化为高优指标,转化后的矩阵为:
(4)对Y矩阵进行归一化处理,即用Y矩阵中每个列向量的元素yij与该向量所有元素的和的比值作为归一化得到的矩阵Z的对应元素,归一化后的矩阵为:
(5)确定各评价指标的熵权值H(xj),(j=1,2,3,4),具体公式为:
其中k为调节系数,zij为第i个评价单元的第j个评价指标的标准化值,即Z矩阵中第i行,第j列的元素。
(6)将评价指标的熵值转化为权重值,即可得到每个评价指标的权值,其具体公式为:
其中,dj为第j列的评价指标的权值,且0≤dj≤1,m为评价指标的个数,即m=4。
(7)确定各评价指标的熵权综合评价值,将各指标的权值分别与其对应的指标标准化值相乘后求和,其公式为:
其中,Ui为第i条可能路径的熵权综合评价值;选取熵权综合评价值最大的路径作为数据缺失部分的轨迹。
2.2计算缺失点的时间
使用拉格朗日型多项式插值法计算处数据缺失部分轨迹点的时间信息,而后即可得出路段流量,路段速度,路段平均车流密度,其具体步骤如下:
(1)设轨迹数据缺失部分的前一个卡口记录点为O点,轨迹数据缺失部分的后一个卡口记录点为D点,若O点之前有数据则令O点的前一个卡口记录点为A点,若O点之前无数据则A点等与O点。令O点到A点的距离为x0,D点到A点的距离为x1,数据缺失部分的各轨迹点到A点的距离的集合为X={x1,x2,…,xd},其中xu为第u个点到A点的距离。将O点和D点的时间点转化为时间戳,并分别记为y0,y1
(2)采用拉格朗日型插值多项式计算各数据缺失部分轨迹点的时间值,即可得到各轨迹点的时间值的集合P={p1,p2,…,pd},其中pu为第u个点的时间值,拉格朗日型插值多项式具体公式为:
其中1≤u≤d,且xu∈X。
(3)将集合P中的时间值转化为原始数据中的时间格式,并将对应的轨迹点的卡口编号,车牌号码,过车时间等信息加入此车辆行程数据中即可将此行程信息补充完整。将补充完整后的数据和无缺失数据整合,以便下一步使用。
步骤三,提取道路交通状态信息
(1)以t为时间周期(t可取5min,10min等)将一天的时间划分为n个时段,对每个周期的数据进行遍历,提取各条数据的卡口编号k,车牌号码m,过车时间s等信息,计算每个时间周期内经过各卡口的各方向的车辆数,即可得出各路段每个周期的流量qdj,其中d为路段编号,j为第j个时间周期。将路段编号d,时间段j,路段流量qdj存入数据库中,即可得各路段在各个时段的流量。
(2)仍以t为周期计算路段速度vdj,按行程读取数据的卡口编号k,车牌号码m,过车时间s等信息,计算每相邻两条数据的时间差:Δs=si+1-si,然后用对应路段长度除以时间差可得速度,计算公式如下:
其中vdi为第i条数据的卡口编号k和第i+1条数据的卡口编号k+1所连接的路段d的一个速度值,Δs为第i+1条数据的时间和i条数据的时间的差值,dd为路段d的长度。
对每个周期的数据求其各路段的速度平均值即为此周期内的路段速度,公式如下:
其中,vdj为第j个时间周期内的路段d的速度平均值,∑vdj为第j个时间周期的路段d的所有速度值vdi的和,h为第j个时间周期内vdi的个数。将路段编号d,时间段j,路段平均速度vdj存入数据库中,即可得各路段在各个时段的速度。
(3)以t为周期计算路段平均密度,依次使用各周期内的路段流量除以对应的路段平均速度即可得到此周期的路段平均密度,计算公式为:将路段编号d,时间段j,路段密度kdj存入数据库中,即可得各路段在各个时段的密度。
本发明适用于对城市道路交通状态信息的提取,基于不完备的卡口数据,使用优化的深度优先遍历求出丢失轨迹点,然后使用拉格朗日型多项式插值法求出丢失轨迹点的时间信息,进而可以对道路交通状态信息进行提取。
附图说明
图1为本发明提出的城市道路交通状态信息提取流程图;
图2为本发明提出的车辆行程划分示意图;
图3为本发明实例中的卡口位置示意图;
图4为本发明实例中的13条路段速度变化图。
具体实施方式
下面将结合附图和实例对本发明作进一步的详细说明。
本发明提出的不完备卡口数据条件下的城市道路交通状态信息提取方法,主要包括:数据的预处理,估算路段流量和速度,提取存在缺失的数据,计算缺失轨迹点位置,提取道路交通状态信息五个小步骤,流程如图1所示,具体为:
步骤一,缺失数据的预处理
1.1车辆行程划分
从数据库中根据卡口编号信息提取出路网内所有记录点的卡口数据,并剔除其中车牌号未能识别的记录等异常数据,然后删除卡口编号,车牌号码,过车时间都相同的数据;将剔除异常数据和重复数据后的数据按照车牌号进行排列,并给每辆车分配一个编号;再按时间顺序对每辆车的数据进行排列,即可得到所有符合要求的并按车辆编号和时间排列的数据;最后,按照如下步骤对车辆行程进行划分:
(1),根据路网中各个路段正常行驶通过所需的平均时间设置路段通行时间集合T={T1,T2,…,TV},其中V需根据路网中路段的数量确定,Tu(u∈V)为第u条路段的平均行驶时间。取集合中的最大值作为阈值来对判断是否需要对车辆行程进行划分。
(2),在已按车辆编号和时间排序的数据中,依次选取每辆车的两条相邻数据并求其时间差,若时间差大于阈值,则认为车辆在这两个记录点之间有停留,需要将数据从这两个记录点之间断开从而把其划分为两个行程,所以将这两个记录点的前者及其以前的数据视为行程A,后者及其以后的记录点视为行程B。但若行程B中仍有相邻数据时间差大于阈值的情况,则可以对行程B继续进行行程划分。
(3),经过行程划分的数据可能出现某个行程只有一条记录的情况,需将此类行程剔除,并对剩余的行程分配递增编号以记录行程划分情况。
本例截取一辆车牌号码为“皖CXXXXX”,时间信息为“2017-06-01”的车辆记录为例说明车辆行程划分之后的数据格式,其数据包含信息如下所示:
表1“皖CXXXXX”车辆行程划分表
卡口编号 车牌号码 过车时间 行程编号
035 皖CXXXXX 2017-06-0111:28:15 1
533 皖CXXXXX 2017-06-0111:30:47 1
054 皖CXXXXX 2017-06-0120:34:54 2
026 皖CXXXXX 2017-06-0120:39:54 2
343 皖CXXXXX 2017-06-0121:35:20 3
024 皖CXXXXX 2017-06-0121:39:27 3
187 皖CXXXXX 2017-06-0121:42:10 3
其中行程编号中的1,2,3分别表示此车辆的第一段行程,第二段行程,第三段行程。每段行程都包含了卡口监测设备的编号信息和信息记录时间。
1.2计算部分评价指标
因后续计算需用到路段的流量和速度信息,故初步对各路段流量和速度进行计算,由于卡口数据不完整,所以计算得出的流量和速度信息必定有缺失,需对缺失部分做近似处理。具体计算方法如下:
(1),以10分钟为周期将一天的时间划分为144个时段,由每条数据中的时间信息为判断依据,对每个10分钟周期的数据进行遍历,提取每条数据的卡口编号k,车牌号码m,过车时间s等信息,车辆每经过一个卡口就会产生一条过车记录,故计算流量时只需统计出各10分钟周期内的连续经过某两个相邻卡口数据的条数,即为这两个相邻卡口所在路段的流量qdj。若某车辆经过某路段的第一个卡口时,其记录时间在前一个10分钟周期,经过第二个卡口时,其记录时间在下一个10分钟周期,则归入前一个10分钟周期内的流量。按照此方法计算,即可得出各路段每个10分钟周期的流量信息,最后将其路段编号d,时间段j,流量qdj存入数据库中,为后续计算作准备。
(2),仍以10分钟为周期计算路段速度,按行程读取数据的卡口编号k,车牌号码m,过车时间s等信息,计算每相邻的两条数据的时间差Δs并以秒为单位存储,每个行程的最后一条数据的时间差记为0,然后用相邻两条数据对应路段的长度除以其时间差可得对应路段在其过车时间对应的10分钟周期内的一个速度值vdi,然后对每个路段的每个10分钟周期的速度数据求平均值vdj即为该10分钟周期内的路段速度。将速度信息vdj按照对应路段和对应时间段j存入数据库中,为后续计算做准备。
(3),由于原始卡口数据有缺失,故所求路段的流量和速度均不完整。可能出现某路段的流量或速度在某个10分钟周期内的数据有缺失的情况,则可使用此路段相邻时段的流量或速度近似替代。
本例截取路段编号为1的路段在时间信息为“2017-06-0103:40:00”到“2017-06-0104:10:00”的速度,来说明路段速度的数据格式及其计算过程,数据如下表所示:
表2路段速度表
路段编号 路段速度 时段起点 时段终点
1 9.750 2017-06-0103:40:00 2017-06-0103:50:00
1 9.243 2017-06-0103:50:00 2017-06-0104:00:00
1 9.180 2017-06-0104:00:00 2017-06-0104:10:00
其中,路段速度单位为“m/s”,路段1的上行方向卡口编号为175,下行方向卡口编号为442。为计算本例中的第一个时段的速度时,需先找出所有依次连续经过卡口编号为175和442的且经过卡口175使时间信息在“2017-06-0103:40:00”和“2017-06-0103:50:00”之间的数据,用路段1的长度除以各组数据的时间差,再求其平均值,即为路段1在“2017-06-0103:40:00”到“2017-06-0103:50:00”这个10分钟周期内的平均速度。
步骤二,补全缺失数据
遍历每个行程的数据,若某行程每相邻的两条数据的卡口编号依次等于某路段上行方向和下行方向的卡口编号,则此行程信息完整,将其卡口位置按照记录的时间顺序显示在地图中可沿道路连成一条完整的轨迹。此类数据无缺失信息,可直接用于道路状态信息的提取;若某行程存在相邻的两条数据的卡口编号不等于同一个路段所连接的两个卡口的卡口编号,则此类数据存在缺失,提取其缺失部分的起点卡口编号和终点卡口编号,为计算其缺失部分各轨迹点的卡口编号信息做准备。
2.1,计算缺失点的位置
对于存在缺失的数据需使用优化的深度优先遍历计算其缺失部分的轨迹,具体步骤如下:
(1),已知起点和终点的卡口编号,即可得到其对应的位置信息,利用路网连接关系使用深度优先遍历的方法找出起点和终点的所有可能路径,并对所有可能路径进行初次筛选,找出其中最短路径及与最短路径所经过的卡口数相差小于等于3的所有路径,由于本例所选的城市路网为方格式,故可以简化路径筛选过程选取其经过卡口数最少的路径及与卡口数最少路径的卡口数相差小于等于3的所有路径。本例以表1中行程3中的数据缺失部分为例说明其缺失点位置的计算。其中卡口编号为343到024之间的数据有缺失,使用深度优先遍历并对其可能路径初次筛选之后得其可能路径的集合为R={r1,r2,…,rn},其中ri表示路径的集合中第i条路径。其中n是符合条件的可能路径的总数,本例经筛选后得四条可能路径,故n=4。其中r1表示第1条可能路径,所经过卡口的编号依次为:343,344,345,024;r2表示第2条可能路径,所经过卡口的编号依次为:343,344,028,024;r3表示第3条可能路径,所经过卡口的编号依次为:343,026,028,024;r4表示第4条可能路径,所经过卡口的编号依次为:343,023,186,026,028,024,各卡口编号对应的位置如图3所示。
(2),选择路径长度,路径平均速度,路段数量,路径平均流量作为评价指标来判断上述可能路径集合中的最理想化的路段作为缺失部分的轨迹,其中路径长度为每条可能路径所经过的各路段的长度和,用集合表示为L={l1,l2,…,ln}T,本例经计算得其路径长度的集合为L={2147,2169,1950,2725}T;路径平均速度为每条可能路径所经过的各路段在对应时间段内的速度的平均值,用集合表示为V={v1,v2,…,vn}T。本例经计算各可能路径在“2017-06-0103:30:00”到“2017-06-0103:40:00”的时段内路径平均速度的集合为V={7.095,6.044,5.786,6.104}T;路段数量为每条可能路径所经过的路段的数量,用集合表示为C={c1,c2,…,cn}T,本例求得的可能路径路段数量集合为C={3,3,3,5}T;路径平均流量为每条可能路径所经过的各路段在对应时间段内的流量平均值,用集合表示为Q={q1,q2,…,qn}T。本例经计算每条可能路径在“2017-06-0103:30:00”到“2017-06-0103:40:00”的时段内路径平均流量集合为Q={104,60,51,50}T;用熵权法对各评价指标的权值进行确定,首先获得初始矩阵,将数据带入得:
(3),在路径长度,路径平均速度,路段数量,路径平均流量四个评价指标中路段平均速度和路段流量为高优指标,即其数值较高时有利于车辆通行。路段长度和路段数量为低优指标,即其数值较低时有利于车辆通行。不同指标之间应该具有同趋势性,故采用倒数法将低优指标转化为高优指标,即对低优指标求其倒数,高优指标值不变,按对应位置写入Y矩阵。转化后的矩阵为:
(4),对Y矩阵进行归一化处理,即用Y矩阵中每个列向量的元素yij与该向量所有元素的和的比值作为归一化得到的矩阵Z的对应元素,本例按公式求得的归一化后的矩阵为:
(5),确定各评价指标的熵权值H(xj),(j=1,2,3,4),具体公式为:
其中k为调节系数,zij为第i个评价单元的第j个评价指标的标准化值,即Z矩阵中第i行,第j列的元素。具体到本例,将(4)中求得的Z矩阵的对应元素带入上述公式求得:
H(x1)=0.3543,H(x2)=0.3554,H(x3)=0.3510,H(x4)=0.3530,
(6),将评价指标的熵值转化为权重值dj,(j=1,2,3,4),即求每个评价指标的权值,其具体公式为:
其中,dj为第j列的评价指标的权值,且0≤dj≤1,m为评价指标的个数,即m=4。具体到本例将(5)中求得的H(xj),(j=1,2,3,4)带入上述公式可求得:
d1=0.2487,d2=0.2482,d3=0.2510,d4=0.2530
(7),确定各评价指标的熵权综合评价值,将各指标的权值分别与其对应的指标标准化值相乘后求和,其公式为:
其中,Ui为第i条可能路径的熵权综合评价值;选取熵权综合评价值最大的路径作为数据缺失部分的轨迹。集体到本例,将(6)中的dj,(j=1,2,3,4),和Z矩阵中的对应元素带入上述公式得:
U1=0.3029,U2=0.2504,U3=0.2467,U4=0.2009
由于评价函数值U1最大,故选用可能路径集合中的第一条可能路径来作为缺失部分的轨迹,有第一条可能路径中各卡口编号信息可知各卡口的位置信息。
2.2,计算缺失点的时间
求得缺失点的位置信息后,数据仍然不完整,需要求出其时间信息才可使用。本例使用拉格朗日型多项式插值法计算处数据缺失部分轨迹点的时间信息,为后续求路段流量,路段速度,路段平均车流密度做准备,其具体步骤如下:
(1),设轨迹数据缺失部分的前一个卡口记录点为O点,本例中为可能路径的起点为O点,即编号为343的卡口为O点。轨迹数据缺失部分的后一个卡口记录点为D点,本例中为可能路径的终点为D点,即编号为024的卡口为D点。本行程O点的之前没有数据,故A点等于O点。令O点到A点的距离为x0,即x0=0,D点到A点的距离为x1,即x1=2147m,数据缺失部分的各轨迹点到A点的距离的集合为J={j1,j2,…,jd},其中ju(u∈[1,d])为第u个点到A点的距离。本例所得的J={653,1182},分别为所计算路径中每个卡口到A点的距离。将O点和D点的时间格式转化为秒,并分别记为y0,y1。本例将O点和D点的时间点转化为时间戳,得y0=1496324120s,y1=1496324367s。
(2),采用拉格朗日型插值多项式计算各数据缺失部分轨迹点的时间值,即可得到各轨迹点的时间戳的集合P={p1,p2,…,pd},其中pu(u∈[1,d])为第u个点的时间戳,拉格朗日型插值多项式具体公式为:
其中1≤u≤d,且xu∈X。将本例所求得的各数值按公式要求带入得:
P={1496324195,1496324255}
(3),将集合P中的时间戳转化为原始数据中的时间格式,经转换的得:p1为2017-06-0121:36:35,p2为2017-06-0121:37:35。并将对应的轨迹点的卡口编号,车牌号码,过车时间等信息加入此车辆行程数据中即可将此行程信息补充完整。本例将此行程数据补充完整后如表3所示。最后将补充完整后的行程数据和无缺失行程数据整合,以便下一步使用。
表3补充后的行程3信息表
卡口编号 车牌号码 过车时间 行程编号
343 皖CXXXXX 2017-06-0121:35:20 3
344 皖CXXXXX 2017-06-0121:36:35 3
345 皖CXXXXX 2017-06-0121:37:35 3
024 皖CXXXXX 2017-06-0121:39:27 3
187 皖CXXXXX 2017-06-0121:42:10 3
步骤三,提取道路交通状态信息
将有缺失的数据补充完整后和无缺失的数据整合在一起,即可对路段的流量,速度和密度进行计算。计算方法如下:
(1),以10分钟为周期将一天的时间划分为144个时段,由每条数据中的时间信息为判断依据,对每个10分钟周期的数据进行遍历,提取每条数据的卡口编号,车牌号码,过车时间等信息,车辆每经过一个卡口就会产生一条过车记录,故计算流量时只需统计出各10分钟周期内的连续经过某两个相邻卡口数据的条数,即为这两个相邻卡口所在路段的流量。若某车辆经过某路段的第一个卡口时,其记录时间在前一个10分钟周期,经过第二个卡口时,其记录时间在下一个10分钟周期,则归入前一个10分钟周期内的流量。按照此方法计算,即可得出各路段每个10分钟周期的流量信息,最后将其路段编号,时间段,流量存入数据库中,即可得到各路段在各个时段的流量。
(2),仍以10分钟为周期计算路段速度,按行程读取数据的卡口编号,车牌号码,过车时间等信息,计算每相邻的两条数据的时间差并以秒为单位存储,每个行程的最后一条数据的时间差记为0,然后用相邻两条数据对应路段长度除以其时间差可得对应路段在其过车时间对应的10分钟周期内的一个速度值,然后对每个路段的每个10分钟周期的速度数据求平均值即为该10分钟周期内的路段速度。将速度信息按照对应路段和对应时间段存入数据库中,即可得到各个路段在各个时段的速度。本例选取13条道路等级不尽相同的路段绘制其一天内的速度变化图,如图4所示。
(3),以10分钟为周期计算路段平均密度,依次使用各10分钟周期内的路段流量除以对应的路段平均速度即为此周期的路段平均密度。将路段编号,时间段,路段密度存入数据库中,即可得各路段在各个时段的密度。
以上所述乃是本发明的具体案例实施及其运用的原理,若在本发明的构想下对本发明进行改变,但其功能仍为超出说明书及附图涵盖的精神时,仍属于本发明的保护范围。

Claims (3)

1.一种不完备卡口数据条件下的城市道路交通状态信息提取方法,其特征在于包括如下步骤:
步骤一,不完备数据的预处理
1.1车辆行程划分
数据的预处理包括,从数据库中选取路网内所有记录点的卡口数据,并剔除异常数据和重复数据;将此部分数据按照车牌号进行分类,并给每辆车分配编号;按时间顺序对每辆车的数据进行排列;最后,对车辆行程划分,划分方法如下:
(1)根据路网中各个路段正常行驶通过所需的平均时间设置路段通行时间集合T={T1,T2,…,TV},集合中的最大值Tu(u∈V)作为阈值。
(2)在上述已按时间排序的数据中,若每辆车的每两条相邻数据时间差大于阈值,则认为车辆在这两个记录点之间有停留,需要将数据从这两个记录点之间断开,所以将这两个记录点前者及其以前的数据视为行程A,后者及其以后的记录点视为行程B,=若行程B中仍有相邻数据时间差大于阈值的情况,则可以对行程B继续进行行程划分;
(3)剔除只有一条记录的行程,并对剩余的行程分配编号以记录行程划分情况;
1.2计算部分评价指标
初步计算各路段流量和速度,作为后续熵权法计算所需的两项评价指标,具体计算方法如下:
(1)以t为周期将一天的时间划分为n个时段,对每个周期的数据进行遍历,提取各条数据的卡口编号k,车牌号码m,过车时间s等信息,计算每个时间周期内经过各卡口的各方向的车辆数,即可得出各路段每个周期的流量信息qdj,其中d为路段编号,j为第j个时间周期;
(2)仍以t为周期计算路段速度vdj,按行程读取数据的卡口编号k,车牌号码m,过车时间s等信息,计算每相邻两条数据的时间差:Δs=si+1-si,然后用对应路段长度除以时间差可得速度,计算公式如下:
其中vdi为第i条数据的卡口编号k和第i+1条数据的卡口编号k+1所连接的路段d的一个速度值,Δs为第i+1条数据的时间和i条数据的时间的差值,dd为路段d的长度;
对每个周期的数据求其各路段的速度平均值即为此周期内的路段速度,公式如下:
其中,vdj为第j个时间周期内的路段d的速度平均值,∑vdj为第j个时间周期的路段d的所有速度值vdi的和,h为第j个时间周期内vdi的个数。将路段编号d,时间段j,路段平均速度vdj存入数据库中,即可得各路段在各个时段的速度;
(3)当某路段的流量或速度在某时段有缺失,则使用此路段相邻时段的流量或速度近似替代。
步骤二,补全缺失数据
若某行程的数据所显示的位置信息如果能够依次出现在路网各个相邻卡口处,即其轨迹信息不存在断点,则此行程数据无缺失,直接使用来提取道路交通状态信息;若某行程的数据所显示的位置信息在路网中不能顺次连结,即其轨迹信息存在断点,则此行程数据有缺失,则对其每个断点的数据补充完整后才可使用;遍历各行程的数据,提取其位置信息,并判断其轨迹是否存在断点,提取存在数据缺失的行程数据进行补充;
2.1计算缺失点的位置
对于存在缺失的数据使用优化的深度优先遍历计算其缺失部分的轨迹,具体步骤如下:
(1)使用深度优先遍历的方法找出数据缺失部分对应的起点和终点的所有可能路径,并对所有可能路径进行初次筛选,找出其中最短路径及与最短路径所经过的卡口数相差小于等于3的所有路径,设某行程缺失部分的可能路径的集合为R={r1,r2,…,rn},其中ri表示路径的集合中第i条路径。其中n是符合条件的可能路径的总数;
(2)选择路径长度、,路径平均速度、路段数量以及路径平均流量作为评价指标;路径长度为每条可能路径所经过的各路段的长度和,用集合表示为L={l1,l2,…,ln}T,其中li(i∈n)表示第i条可能路径所经过的各路段的长度和,即li=∑dd;路径平均速度为每条可能路径所经过的各路段在对应时间段内的速度平均值,用集合表示为V={v1,v2,…,vn}T,其中vi(i∈n)表示第i条可能路径所经过的各路段的平均速度vdj的平均值,即 路段数量为每条可能路径所经过的路段的数量,用集合表示为C={c1,c2,…,cn}T,其中ci(i∈n)表示第i条可能路径所经过的路段的数量;路径平均流量为每条可能路径所经过的各路段在对应时间段内的流量平均值,用集合表示为Q={q1,q2,…,qn}T,其中qi(i∈n)表示第i条可能路径所经过的各路段的流量qdj的平均值,即用熵权法对各评价指标的权值进行确定,首先获得初始矩阵:
(3)上述四个评价指标中路段平均速度和路段流量为高优指标,路段长度和路段数量为低优指标,采用倒数法将低优指标转化为高优指标,转化后的矩阵为:
(4)对Y矩阵进行归一化处理,即用Y矩阵中每个列向量的元素yij与该向量所有元素的和的比值作为归一化得到的矩阵Z的对应元素,归一化后的矩阵为:
(5)确定各评价指标的熵权值H(xj),(j=1,2,3,4),具体公式为:
其中k为调节系数,zij为第i个评价单元的第j个评价指标的标准化值,即Z矩阵中第i行,第j列的元素;
(6)将评价指标的熵值转化为权重值,即可得到每个评价指标的权值,其具体公式为:
其中,dj为第j列的评价指标的权值,且0≤dj≤1,m为评价指标的个数,即m=4。
(7)确定各评价指标的熵权综合评价值,将各指标的权值分别与其对应的指标标准化值相乘后求和,其公式为:
其中,Ui为第i条可能路径的熵权综合评价值;选取熵权综合评价值最大的路径作为数据缺失部分的轨迹。
2.2计算缺失点的时间
使用拉格朗日型多项式插值法计算处数据缺失部分轨迹点的时间信息,而后即可得出路段流量,路段速度,路段平均车流密度,其具体步骤如下:
(1)设轨迹数据缺失部分的前一个卡口记录点为O点,轨迹数据缺失部分的后一个卡口记录点为D点,若O点之前有数据则令O点的前一个卡口记录点为A点,若O点之前无数据则A点等与O点;令O点到A点的距离为x0,D点到A点的距离为x1,数据缺失部分的各轨迹点到A点的距离的集合为X={x1,x2,…,xd},其中xu为第u个点到A点的距离;将O点和D点的时间点转化为时间戳,并分别记为y0,y1
(2)采用拉格朗日型插值多项式计算各数据缺失部分轨迹点的时间值,即可得到各轨迹点的时间值的集合P={p1,p2,…,pd},其中pu为第u个点的时间值,拉格朗日型插值多项式具体公式为:
其中1≤u≤d,且xu∈X;
(3)将集合P中的时间值转化为原始数据中的时间格式,并将对应的轨迹点的卡口编号,车牌号码,过车时间等信息加入此车辆行程数据中即可将此行程信息补充完整。将补充完整后的数据和无缺失数据整合,以便下一步使用。
步骤三,提取道路交通状态信息
(1)以t为时间周期将一天的时间划分为n个时段,对每个周期的数据进行遍历,提取各条数据的卡口编号k,车牌号码m,过车时间s等信息,计算每个时间周期内经过各卡口的各方向的车辆数,即可得出各路段每个周期的流量qdj,其中d为路段编号,j为第j个时间周期。将路段编号d,时间段j,路段流量qdj存入数据库中,即可得各路段在各个时段的流量。
(2)仍以t为周期计算路段速度vdj,按行程读取数据的卡口编号k,车牌号码m,过车时间s等信息,计算每相邻两条数据的时间差:Δs=si+1-si,然后用对应路段长度除以时间差可得速度,计算公式如下:
其中vdi为第i条数据的卡口编号k和第i+1条数据的卡口编号k+1所连接的路段d的一个速度值,Δs为第i+1条数据的时间和i条数据的时间的差值,dd为路段d的长度。
对每个周期的数据求其各路段的速度平均值即为此周期内的路段速度,公式如下:
其中,vdj为第j个时间周期内的路段d的速度平均值,∑vdj为第j个时间周期的路段d的所有速度值vdi的和,h为第j个时间周期内vdi的个数。将路段编号d,时间段j,路段平均速度vdj存入数据库中,即可得各路段在各个时段的速度;
(3)以t为周期计算路段平均密度,依次使用各周期内的路段流量除以对应的路段平均速度即可得到此周期的路段平均密度,计算公式为:将路段编号d,时间段j,路段密度kdj存入数据库中,即可得各路段在各个时段的密度。
2.根据权利要求1所述的一种不完备卡口数据条件下的城市道路交通状态信息提取方法,其特征在于,所述的步骤一的1.2(3)中,若求得的路段某时段的流量或速度有缺失,则可以用相邻时段的流量或速度近似替代,具体为若数值缺失时段的前后相邻时段都有数据,则用前后相邻时段的平均值来近似替代此缺失时段的值;若有多个连续时段存在数值缺失,则用前后相邻时段的平均值来替代中间所有存在数值缺失时段的值。
3.根据权利要求1所述的一种不完备卡口数据条件下的城市道路交通状态信息提取方法,其特征在于所述的步骤二的2.1中,优化的深度优先遍历是采用深度优先遍历和熵权法结合的优化方式,使用深度优先遍历寻找可能的缺失路径,然后用熵权法判断路径的优劣,从而得出最有可能为缺失部分的轨迹来作为优化的深度优先遍历的结果。
CN201810714830.9A 2018-07-03 2018-07-03 一种不完备卡口数据条件下的城市道路交通状态信息提取方法 Expired - Fee Related CN108961747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810714830.9A CN108961747B (zh) 2018-07-03 2018-07-03 一种不完备卡口数据条件下的城市道路交通状态信息提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810714830.9A CN108961747B (zh) 2018-07-03 2018-07-03 一种不完备卡口数据条件下的城市道路交通状态信息提取方法

Publications (2)

Publication Number Publication Date
CN108961747A true CN108961747A (zh) 2018-12-07
CN108961747B CN108961747B (zh) 2019-11-05

Family

ID=64485102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810714830.9A Expired - Fee Related CN108961747B (zh) 2018-07-03 2018-07-03 一种不完备卡口数据条件下的城市道路交通状态信息提取方法

Country Status (1)

Country Link
CN (1) CN108961747B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615865A (zh) * 2019-01-10 2019-04-12 北京工业大学 一种基于od数据增量迭代式估计路段交通流量的方法
CN110276950A (zh) * 2019-06-24 2019-09-24 华南理工大学 一种基于卡口视频数据的城市交通出行链重构方法
CN110599765A (zh) * 2019-08-16 2019-12-20 华南理工大学 一种基于多源数据融合的公路客货运输量指标统计方法
CN110634289A (zh) * 2019-09-04 2019-12-31 南京洛普股份有限公司 一种基于电警数据的城市道路交通最优路径在线规划方法
CN110851755A (zh) * 2019-09-29 2020-02-28 口碑(上海)信息技术有限公司 一种送达路径信息的获取方法、装置以及电子设备
CN111047860A (zh) * 2019-12-02 2020-04-21 安徽百诚慧通科技有限公司 一种车辆运行轨迹提取方法
CN111126687A (zh) * 2019-12-19 2020-05-08 银江股份有限公司 一种交通信号的单点离线优化系统及方法
CN111325993A (zh) * 2019-04-24 2020-06-23 北京嘀嘀无限科技发展有限公司 通行速度确定方法、装置、电子设备及计算机存储介质
CN111477015A (zh) * 2019-01-22 2020-07-31 上海宝康电子控制工程有限公司 实现交叉口车辆时空分布展示控制的方法、装置及其存储介质
CN112863174A (zh) * 2020-12-31 2021-05-28 华为技术有限公司 交通流信息获取的方法、装置和计算机设备
CN113140114A (zh) * 2021-03-09 2021-07-20 中山大学 一种基于行程时间估计的车辆出行路径重构方法
CN113255088A (zh) * 2021-05-21 2021-08-13 上海天壤智能科技有限公司 一种卡口过车记录的数据补全方法及系统
CN113763696A (zh) * 2020-06-01 2021-12-07 杭州海康威视数字技术股份有限公司 一种车辆路径重构方法、装置、电子设备及存储介质
CN114999162A (zh) * 2022-08-02 2022-09-02 北京交研智慧科技有限公司 一种道路交通流量获取方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096756A (zh) * 2016-05-31 2016-11-09 武汉大学 一种城市交通路网动态实时多路口路径选择方法
US9633560B1 (en) * 2016-03-30 2017-04-25 Jason Hao Gao Traffic prediction and control system for vehicle traffic flows at traffic intersections
CN106997669A (zh) * 2017-05-31 2017-08-01 青岛大学 一种基于特征重要性的判断交通拥堵成因的方法
CN107230350A (zh) * 2017-06-23 2017-10-03 东南大学 一种基于卡口与手机流量话单数据的城市交通量获取方法
CN107403551A (zh) * 2017-08-04 2017-11-28 广州市交通规划研究院 一种路口交通流检测数据的快速识别与数据重构方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9633560B1 (en) * 2016-03-30 2017-04-25 Jason Hao Gao Traffic prediction and control system for vehicle traffic flows at traffic intersections
CN106096756A (zh) * 2016-05-31 2016-11-09 武汉大学 一种城市交通路网动态实时多路口路径选择方法
CN106997669A (zh) * 2017-05-31 2017-08-01 青岛大学 一种基于特征重要性的判断交通拥堵成因的方法
CN107230350A (zh) * 2017-06-23 2017-10-03 东南大学 一种基于卡口与手机流量话单数据的城市交通量获取方法
CN107403551A (zh) * 2017-08-04 2017-11-28 广州市交通规划研究院 一种路口交通流检测数据的快速识别与数据重构方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615865A (zh) * 2019-01-10 2019-04-12 北京工业大学 一种基于od数据增量迭代式估计路段交通流量的方法
CN111477015A (zh) * 2019-01-22 2020-07-31 上海宝康电子控制工程有限公司 实现交叉口车辆时空分布展示控制的方法、装置及其存储介质
CN111325993A (zh) * 2019-04-24 2020-06-23 北京嘀嘀无限科技发展有限公司 通行速度确定方法、装置、电子设备及计算机存储介质
CN111325993B (zh) * 2019-04-24 2021-02-19 北京嘀嘀无限科技发展有限公司 通行速度确定方法、装置、电子设备及计算机存储介质
CN110276950A (zh) * 2019-06-24 2019-09-24 华南理工大学 一种基于卡口视频数据的城市交通出行链重构方法
CN110599765A (zh) * 2019-08-16 2019-12-20 华南理工大学 一种基于多源数据融合的公路客货运输量指标统计方法
CN110634289A (zh) * 2019-09-04 2019-12-31 南京洛普股份有限公司 一种基于电警数据的城市道路交通最优路径在线规划方法
CN110851755A (zh) * 2019-09-29 2020-02-28 口碑(上海)信息技术有限公司 一种送达路径信息的获取方法、装置以及电子设备
CN111047860A (zh) * 2019-12-02 2020-04-21 安徽百诚慧通科技有限公司 一种车辆运行轨迹提取方法
CN111126687A (zh) * 2019-12-19 2020-05-08 银江股份有限公司 一种交通信号的单点离线优化系统及方法
CN111126687B (zh) * 2019-12-19 2023-05-30 银江技术股份有限公司 一种交通信号的单点离线优化系统及方法
CN113763696A (zh) * 2020-06-01 2021-12-07 杭州海康威视数字技术股份有限公司 一种车辆路径重构方法、装置、电子设备及存储介质
CN112863174A (zh) * 2020-12-31 2021-05-28 华为技术有限公司 交通流信息获取的方法、装置和计算机设备
CN112863174B (zh) * 2020-12-31 2022-05-17 华为技术有限公司 交通流信息获取的方法、装置和计算机设备
CN113140114A (zh) * 2021-03-09 2021-07-20 中山大学 一种基于行程时间估计的车辆出行路径重构方法
CN113140114B (zh) * 2021-03-09 2022-07-29 中山大学 一种基于行程时间估计的车辆出行路径重构方法
CN113255088A (zh) * 2021-05-21 2021-08-13 上海天壤智能科技有限公司 一种卡口过车记录的数据补全方法及系统
CN114999162A (zh) * 2022-08-02 2022-09-02 北京交研智慧科技有限公司 一种道路交通流量获取方法和装置

Also Published As

Publication number Publication date
CN108961747B (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN108961747B (zh) 一种不完备卡口数据条件下的城市道路交通状态信息提取方法
CN108717790B (zh) 一种基于卡口车牌识别数据的车辆出行分析方法
CN108346292B (zh) 基于卡口数据的城市快速路实时交通指数计算方法
CN105869405B (zh) 基于卡口数据的城市道路交通拥堵指数计算方法
CN105719489B (zh) 一种基于卡口车辆流向概率的套牌车检测方法
CN102081846B (zh) 基于高速公路收费数据轨迹匹配的交通状态识别方法
CN104021671B (zh) 一种svm与模糊判断相结合的道路实时路况的判断方法
CN105355049B (zh) 一种基于宏观基本图的高速公路运行状态评价方法
CN107610469A (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
CN106022296B (zh) 一种基于车辆热点区域的概率聚合的套牌车检测方法
CN105740904B (zh) 一种基于dbscan聚类算法的出行与活动模式识别方法
CN110162588A (zh) 一种多维关联信息的轨迹融合方法
CN106446208A (zh) 一种考虑路网契合度的智能手机出行方式识别方法
CN102521965A (zh) 基于车牌识别数据的交通需求管理措施效果评价方法
CN112734219B (zh) 一种车辆运输行驶行为分析方法及系统
CN103760901A (zh) 一种基于关联规则分类器的轨道交通故障识别方法
CN105513362B (zh) 一种公交站台毗邻区公交车运行状态评价验证方法
CN110379169A (zh) 基于视频号牌设备的待转区车道饱和车头时距计算方法
CN106898142A (zh) 一种考虑路段相关性的路径行程时间可靠度计算方法
CN106327864A (zh) 一种基于高速公路联网收费数据的交通流估计方法
CN102700576A (zh) 城市轨道交通线网客流监测方法
CN109977108A (zh) 一种基于行为轨迹库的多种轨迹碰撞分析方法
CN106530704A (zh) 一种基于多元数据融合的浮动车聚集检测方法
CN109684373A (zh) 基于出行和话单数据分析的重点关系人发现方法
CN109360415A (zh) 一种道路交通流异常数据识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191105

Termination date: 20210703