CN106548444B - 面向道路实时速度估算的浮动车载客行为模式清洗方法 - Google Patents
面向道路实时速度估算的浮动车载客行为模式清洗方法 Download PDFInfo
- Publication number
- CN106548444B CN106548444B CN201610956851.2A CN201610956851A CN106548444B CN 106548444 B CN106548444 B CN 106548444B CN 201610956851 A CN201610956851 A CN 201610956851A CN 106548444 B CN106548444 B CN 106548444B
- Authority
- CN
- China
- Prior art keywords
- speed
- samples
- behavior
- passenger carrying
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000004140 cleaning Methods 0.000 title claims abstract description 6
- 230000006399 behavior Effects 0.000 claims abstract description 140
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 230000002159 abnormal effect Effects 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 27
- 230000001174 ascending effect Effects 0.000 claims description 7
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims description 3
- WDAIWFJRXVKXNS-UHFFFAOYSA-N 2-[(4-chlorophenyl)hydrazinylidene]propanedioic acid Chemical compound OC(=O)C(C(O)=O)=NNC1=CC=C(Cl)C=C1 WDAIWFJRXVKXNS-UHFFFAOYSA-N 0.000 claims 5
- 241000283070 Equus zebra Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0112—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
Landscapes
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Marketing (AREA)
- Analytical Chemistry (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种面向道路实时速度估算的浮动车载客行为模式清洗方法,包括如下步骤:步骤(1).读取浮动车历史数据,得到“类载客行为”速度变化阈值;步骤(2).读取路网数据,根据路段的连通性得到路口路段映射表,步骤(3).得到该时间片各个路段上各个车辆的速度列表;步骤(4).剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表;步骤(5).剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表;步骤(6).计算所有速度样本的平均速度作为该路段的实时速度并存于数据库实时速度表中。本发明在保证数据的实时性的同时,极大的增加了实时速度的准确性。
Description
技术领域
本发明属于数据挖据技术领域,具体涉及到一种面向道路实时速度估算的浮动车载客行为模式清洗方法。
背景技术
交通拥堵问题伴随着社会、经济的飞速发展而日益严重。缓解交通问题迫在眉睫。随着“互联网+”的提出,各类智慧交通系统如雨后春笋般出现。各类智慧交通系统服务通过合理的管理、诱导道路上的车流可以快速和有效的缓解道路拥堵问题。以上各类智能交通服务的质量严重依赖于准确的、实时的路段速度,路段速度是以上各类服务的基础性参数。因此,本专利即是针对此参数的准确性开展的进一步深入讨论,通过过滤浮动车载客行为,进一步提高路段速度的准确性。
由于浮动车数据具有低沉本、易获得性、覆盖广等特点,被广泛应用于各类智能交通服务。对现有海量的浮动车数据进行分析研究时可以发现,浮动车的载客行为产生的速度样本如果不进行剔除会严重影响路段速度的准确性。由于浮动车数据巨大,实时性非常强,人工很难及时发现并剔除载客行为产生的速度样本。本专利将要讨论的载客行为较出租车停车载客具有更加广泛的含义,主要包括导致浮动车数据梯度下降,然后再梯度上升的行为过程,如图1所示,发生此类行为时,有可能是真实的载客行为,有可能是避让行为,也有可能是寻客等待行为、路口红灯等待、斑马线礼让行人等等。在剔除此类行为过程中,还需要防止误剔除,如路口红灯等待,斑马线礼让行人等等代表了路段当前真实情况的行为。行业内的少数研究者关注了停车行为对路段速度估算的影响,对于本专利提出的更加广泛的类载客行为尚未涉及。
发明内容
本发明针对现有技术的不足,提出了一种面向道路实时速度估算的浮动车载客行为模式清洗方法。
本发明中所谓的浮动车数据是指安装在城市公共交通工具(多指出租车)上的GPS设备每隔一段时间(一般30秒一次)上传至数据中心的数据。浮动车数据字典包括:车牌号码、车辆位置信息、数据创建时间、车辆载客状态(0表示空载,1表示满载)等;“载客行为”是指如图1所示的车辆由正常行驶突然减速后恢复正常行驶的过程。“载客行为”包括:
“真载客行为”:是指从浮动车数据上表现出来的,即车辆载客状态由0变为1或者由1变为0的过程。该过程产生的速度样本需要剔除。
“类载客行为”:是从车辆速度上表现出来的,表现为车辆速度变化类似于真实的载客行为,但是它的车辆载客状态并没有发生0,1跳变。我们称之为“类载客行为”。如路口等待红绿灯、遇突发事件、真实发生了载客行为但设备故障没有发生0,1跳变等等。“类载客行为”还根据发生时的不同情景分为以下各种行为:
“路口行为”:指车辆的“类载客行为”发生在路口区域。多数情况下在路口等待红绿灯时发生,属于正常的交通行为无需剔除。
“集体行为”:指所有车辆在同一时空范围内且在非路口区域均发生了“类载客行为”。这种行为多发生在道路临时拥堵,或斑马线前的礼让行人,属于道路正常现象无需剔除。
“个体行为”:该行为是相对于“集体行为”而言的。该类行为产生的速度样本需要被剔除。
本发明技术方案的主要构思:离线阶段,根据大量浮动车历史数据学习得到“类载客行为”的速度变化阈值,对路网数据进行预处理。在线阶段,实时获取一定时间片的浮动车数据,计算出浮动车行驶速度并添加到路网相应的路段中,从路段中的各个车辆的速度列表中剔除“真载客行为”的速度样本,并且根据“类载客行为”速度变化阈值识别“类载客行为”并剔除需要剔除的速度样本。
本发明方法包括以下步骤:
步骤(1).读取浮动车历史数据,浮动车数据包括车牌号码、位置信息、创建时间、载客状态,计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速度得到历史数据中所有车辆的速度列表,统计载客状态发生跳变时的速度样本,并得到“类载客行为”速度变化阈值;
1-1.根据“车牌号码”、“创建时间”升序读取一段时间(大于1个小时)的浮动车历史数据,浮动车每个样本点数据包括车牌号码(CPHM)、位置信息(GPS_FDC)、创建时间(CJSJ)、载客状态(STATUS);
1-2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;
1-3.记录所有车辆发生“真载客行为”(STATUS由0变1或由1变0)时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;
1-4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x);
对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化。首先将5个样本的时间都用等距的数值5,10,15,20,25依次替代。其次,将所有曲线进行上下平移使得所有曲线都经过坐标原点。最终为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状。这里我们选取a,b,v1-v5三个参数作为每条曲线的参数向量V(a,b,v1-v5);
f(x)=ax2+bx..............(1)
1-5.对每一组数据计算得到它的参数向量V(a,b,v1-v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线,即载客行为过程前半部分、载客行为过程后半部分、载客行为全过程;
1-6.获取3个类的类簇中心的参数向量Vic(a,b,v1-v5)和最远边界的参数向量Vib(a,b,v1-v5)。根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;
1-7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值;
步骤(2).读取路网数据,路网数据包括路段编号、路段位置信息,将路网网格化得到“网格—路段编号”映射表,并根据路段的连通性得到路口路段映射表;
步骤(3).根据“车牌号”、“创建时间”升序读取当前时间前5分钟的浮动车数据,计算车辆连续两个样本点的相隔距离和时间差,然后通过距离和时间差计算速度,并根据“网格—路段编号”映射表将该速度添加到第二次记录的车辆位置信息所在的路段编号上,得到该时间片各个路段上各个车辆的速度列表;
步骤(4).根据车辆载客状态识别“真载客行为”并剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表,过程如下:
4-1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;
4-2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本;
4-3.重复步骤4-1,4-2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap;
步骤(5).根据步骤(1)得到的阈值识别“类载客行为”,并剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表,过程如下:
5-1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v2,v3,v4,v5>;
5-2.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x),f(x)=ax2+bx,a、b为系数,每一组速度样本建立参数向量Vis(a,b,v1-v5),并根据公式(3)计算Vis与步骤(1)中得到三个类簇中心的参数向量Vic(a,b,v1-v5)的欧式距离di(d1,d2,d3);
5-3.将di(d1,d2,d3)与步骤(1)中得到的对应的“类载客行为”速度变化阈值Di(D1,D2,D3)比较,如果d1<D1则认为该组速度样属于第一类“类载客行为”;d2<D2则认为该组速度样属于第二类“类载客行为”;d3类推。每个样本将唯一对应一个类,不会出现同时属于2个类的情况;
5-4.扫描speedList表,得到该“类载客行为”速度样本<v1,v2,v3,v4,v5>中最小速度对应的LDID和GPS_FDCi。遍历LkMap,若LkMap中存在该LDID则说明该行为出现的路段LDID为路口路段,若不存在进入5-5。从LkMap中获取该路段编号LDID对应的路口点(GPS_QD,GPS_ZD),GPS_QD表示起点经纬度,GPS_QD表示终点经纬度,通过公式(3)计算GPS_FDCi与路口的距离并取其最小值L,若L<L_min,则认为该“类载客行为”属于“路口行为”不进行剔除,否则进入5-5判断是否属于“集体载客行为”;
L=min(abs(GPS_FDCi-GPS_QD),abs(GPS_FDCi-GPS_ZD)………(4)
5-5.得到该载客行为的vi对应的CJSJi和GPS_FDCi,循环遍历该LDID下其他车辆的速度列表若均出现“载客行为”获取其对应载客点的GPS_FDCi'和CJSJi',根据公式(5)、公式(6)计算判断条件;
abs(GPS_FDCi-GPS_FDCi')<Δs_min,i≠i'………(5)
abs(CJSJi-CJSJi')<Δt_min,i≠i'…………………(6)
若该LDID下其他车辆都满足以上判断条件则认为该载客行为属于“集体行为”不进行剔除,否则属于“个体行为”进入步骤5-6进行速度样本剔除;
5-6.剔除上述步骤得到的“类载客行为”速度样本。根据该速度样本vi<v1,v2,v3,v4,v5>所属的“类载客行为”分类,若属于第一类即载客过程的前半部分,则剔除这组速度样本中的后3个样本;同理若d2<D2,则剔除中间3个样本;若d3<D3,则剔除前3个样本;
5-7.重复步骤5-2至5-6完成“类载客行为”识别和剔除后返回一个新的LDIDSpeedListMap;
步骤(6).经过以上步骤后得到LDID对应的所有速度样本,计算所有速度样本的平均速度作为该路段的实时速度并存于数据库实时速度表中;
6-1.完成该时间片Δt所有的速度样本剔除之后,根据新的LDID_SpeedMap获取LDID中的所有CPHM的速度列表根据CJSJ的先后顺序组成一新的速度列表<v1,v2,v3,…vn>;
6-2.我们把该时间片划分为更小的时间片段τ,将速度列表中所有速度根据其对应的CJSJ划分到每一个小的时间片段中,假设每个小的时间片段中有m个速度样本,则根据公式(7)估算路段速度vR;
步骤(7).根据时间无缝规则更新时间片,重复步骤(3)至步骤(6);
λk表示每一个小时间片段所对应的权值参数,k表示小时间片段的个数;mμ
表示每个小时间片段内速度样本的个数;
vR:路段平均速度,单位km/h;
Δt_min:判断是否为“集体行为”的时间阈值(设值30秒);
Δs_min:判断是否为“集体行为”的空间阈值(设置50米);
L_min:判断车辆是否发生“路口行为”的距离阈值(设置50米)。
本发明具有的有益效果:本发明在大数据量且无规律可循的浮动车数据中快速并且准确的识别数据中的两种载客行为并剔除,在保证数据的实时性的同时,极大的增加了实时速度的准确性。
附图说明:
图1浮动车类载客行为示意图
图2具体实施步骤流程图;
图3三类载客行为聚类曲线图;
图4LDIDSpeedListMap数据结构图;
图5时间无缝规则图。
具体实施方式
如图2所示具体实施方式如下:
为叙述方便,定义相关符号如下:
vR:路段平均速度,单位km/h。
Δt_min:判断是否为“集体行为”的时间阈值(设值30秒)。
Δs_min:判断是否为“集体行为”的空间阈值(设置50米)
L_min:判断车辆是否发生“路口行为”的距离阈值(设置50米)。
步骤(1).“类载客行为”速度变化阈值计算:
1-1.根据“车牌号码”、“创建时间”升序读取一段时间(大于1个小时)的浮动车历史数据,浮动车每个样本点数据包括车牌号码(CPHM)、位置信息(GPS_FDC)、创建时间(CJSJ)、载客状态(STATUS);
1-2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;
1-3.记录所有车辆发生“真载客行为”(STATUS由0变1或由1变0)时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;
1-4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x)。由于每组的5个速度样本的间隔时间都在30秒左右(设备上传写入时间),但是每组样本的时间段各不相同,为了便于试用最小二乘法拟合,我们需要对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化。首先我们将5个样本的时间都用等距的数值5,10,15,20,25依次替代。其次,我们将所有曲线进行上下平移使得所有曲线都经过坐标原点。最终我们可以为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状。这里我们选取a,b,v1-v5三个参数作为每条曲线的参数向量V(a,b,v1-v5);
f(x)=ax2+bx..............(1)
1-5.对每一组数据计算得到它的参数向量V(a,b,v1-v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线(载客行为过程前半部分、载客行为过程后半部分、载客行为全过程)如图3所示;
1-6.获取3个类的类簇中心的参数向量Vic(a,b,v1-v5)和最远边界的参数向量Vib(a,b,v1-v5)。根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;
1-7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值。
步骤(2).路网数据预处理:
2-1.读取路网数据,路网数据包括路段编号(LDID)、起点位置信息(GPS_QD)、终点位置信息(GPS_ZD)、中点位置信息(GPS_MD),将路网网格化(网格边长100米)得到“网格—路段编号”映射表(如表1所示)。
表1
2-2.因为路段相互连通,统计路网数据中所有路段的起点和终点,得到“点-路段编号”映射表(如表2所示);
表2
2-3.对“点-路段编号”映射表进行筛选,保留Value个数大于等于3(即为十字路口或三叉路口)的所有键值对,将新的“点-路段编号”映射表进行键值转换形成“路段-点”映射表如表3所示,记为LkMap。
表3
步骤(3).计算车辆速度样本:
3-1.根据“车牌号码”、“创建时间”升序实时读取一个时间片(5分钟)的浮动车数据,浮动车数据包括车牌号码(CPHM)、位置信息(GPS_FDC)、创建时间(CJSJ)、载客状态(STATUS),记为{CPHM}_{GPS_FDCi,CJSJi,STATIUSi};
3-2.通过计算同一车辆的所有两个点的距离差和时间差,得到连续的速度样本列表speedList;
3-3.计算GPS_FDCi在地图中所对应的网,在根据“网格-路段编号”映射表得到一系列候选路段,分别计算GPS_FDCi与候选路段的垂直距离,取距离最小的路段作为该点的匹配路段,并将速度样本添加到该路段上,最终得到数据结构LDIDSpeedListMap(如图4所示)。
步骤(4).识别并剔除“真载客行为”:
4-1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;
4-2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本(一般剔除前后3个速度样本即可);
4-3.重复步骤4-1,4-2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap。
步骤(5).识别并剔除“类载客行为”:
5-1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v2,v3,v4,v5>;
5-2.根据步骤(1)中步骤1-4的方法为每一组速度样本建立参数向量Vis(a,b,v1-v5),并根据公式(3)计算Vis与步骤(1)中步骤1-5中行成的三个类簇中心的参数向量的欧式距离di(d1,d2,d3);
5-3.将di(d1,d2,d3)与步骤(1)中得到的对应的“类载客行为”速度变化阈值Di(D1,D2,D3)比较,如果d1<D1则认为该组速度样属于第一类“类载客行为”;d2<D2则认为该组速度样属于第二类“类载客行为”;d3类推。每个样本将唯一对应一个类,不会出现同时属于2个类的情况;
5-4.扫描speedList表,得到该“类载客行为”速度样本<v1,v2,v3,v4,v5>中最小速度对应的LDID和GPS_FDCi。遍历LkMap,若LkMap中存在该LDID则说明该行为出现的路段LDID为路口路段,若不存在进入5-5。从LkMap中获取该路段编号LDID对应的路口点(GPS_QD,GPS_ZD),通过公式(3)计算GPS_FDCi与路口的距离并取其最小值L,若L<L_min,则认为该“类载客行为”属于“路口行为”不进行剔除,否则进入5-5判断是否属于“集体载客行为”;
L=min(abs(GPS_FDCi-GPS_QD),abs(GPS_FDCi-GPS_ZD)………(4)
5-5.扫描speedList表,获取该载客行为速度样本vi<v1,v2,v3,v4,v5>对应的CJSJi和GPS_FDCi,循环遍历该LDID中同一路段,同一时间段内,其他车辆的速度列表若均出现“载客行为”获取其对应载客点的GPS_FDCi和CJSJi',根据公式(5)、公式(6)计算判断条件,
abs(GPS_FDCi-GPS_FDCi')<Δs_min,i≠i'………(5)
abs(CJSJi-CJSJi')<Δt_min,i≠i'…………………(6)
若该LDID下其他车辆都满足以上判断条件则认为该载客行为属于“集体行为”不进行剔除,否则属于“个体行为”进入步骤5-6进行速度样本剔除;
举例:“集体行为”如表4所示,在同一路段中同一时间范围内均发生了“类载客行为”
表4
举例:“个体行为”如表5所示,在同一个路段中只有一辆车发生的“类载客行为”。
5-6.剔除上述步骤得到的“类载客行为”速度样本。根据该速度样本vi<v1,v2,v3,v4,v5>所属的“类载客行为”分类,若属于第一类即载客过程的前半部分,则剔除这组速度样本中的后3个样本;同理若d2<D2,则剔除中间3个样本;若d3<D3,则剔除前3个样本;
5-7.重复步骤5-2至5-6完成“类载客行为”识别和剔除后返回一个新的LDIDSpeedListMap。
步骤(6).估计路段速度:
6-1.完成该时间片Δt所有的速度样本剔除之后,根据新的LDID_SpeedMap获取LDID中的所有CPHM的速度列表根据CJSJ的先后顺序组成一新的速度列表<v1,v2,v3,…vn>;
6-2.我们把该时间片划分为更小的时间片段τ,将速度列表中所有速度根据其对应的CJSJ划分到每一个小的时间片段中,假设每个小的时间片段中有m个速度样本,则根据公式(7)估算路段速度vR。使得距离当前时间越近的样本所占权值越大。
步骤(7).根据时间无缝规则(每次保留4分钟历史数据并向前更新1分钟数据组成一个时间片的数据如图5所示)更新时间片,重复步骤(3)至步骤(6)。
Claims (1)
1.面向道路实时速度估算的浮动车载客行为模式清洗方法,其特征在于该方法的具体步骤是:
步骤(1).读取浮动车历史数据,浮动车数据包括车牌号码、位置信息、创建时间、载客状态,计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速度得到历史数据中所有车辆的速度列表,统计载客状态发生跳变时的速度样本,并得到“类载客行为”速度变化阈值;
1-1.根据“车牌号码”、“创建时间”升序读取一段时间的浮动车历史数据,浮动车每个样本点数据包括车牌号码CPHM、位置信息GPS_FDC、创建时间CJSJ、载客状态STATUS;
1-2.计算每辆车连续两个样本点相隔的距离和时间差,并计算出每辆车连续一个小时的所有速度样本列表;
1-3.记录所有车辆发生“真载客行为”,即STATUS由0变1或由1变0时速度变化前后的连续5个速度样本<v1,v2,v3,v4,v5>,并选取500组这样的速度样本;
1-4.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x);
对速度样本的时间进行无量纲化、坐标原点设定、坐标统一化;首先将5个样本的时间都用等距的数值5,10,15,20,25依次替代;其次,将所有曲线进行上下平移使得所有曲线都经过坐标原点;最终为每组样本得到在统一坐标下的唯一的一条曲线,公式(1)中的a和b可以唯一确定曲线的形状;这里选取a,b,v1-v5三个参数作为每条曲线的参数向量V(a,b,v1-v5);
f(x)=ax2+bx (1)
1-5.对每一组数据计算得到它的参数向量V(a,b,v1-v5),将这500个参数向量进行基于密度的聚类算法DBSCAN进行聚类,可以得到三类曲线,即载客行为过程前半部分、载客行为过程后半部分、载客行为全过程;
1-6.获取3个类的类簇中心的参数向量Vic(a,b,v1-v5)和最远边界的参数向量Vib(a,b,v1-v5);根据公式(2)计算聚类中心参数向量和最远边界参数向量的欧式距离;
1-7.根据以上步骤得到的三个类的距离D1,D2,D3作为“类载客行为”的速度变化阈值;
步骤(2).读取路网数据,路网数据包括路段编号、路段位置信息,将路网网格化得到“网格—路段编号”映射表,并根据路段的连通性得到路口路段映射表LkMap;
步骤(3).根据“车牌号”、“创建时间”升序读取当前时间前5分钟的浮动车数据,计算车辆连续两个样本点的相隔距离和时间差,然后通过距离和时间差计算速度,并根据“网格—路段编号”映射表将该速度添加到第二次记录的车辆位置信息所在的路段编号上,得到该时间片各个路段上各个车辆的速度列表,将记录这些信息的数据结构称为:路段编号对应的速度列表图LDIDSpeedListMap;
步骤(4).根据车辆载客状态识别“真载客行为”并剔除速度列表中由于该行为形成的异常速度样本,并返回新的速度列表,过程如下:
4-1.循环读取LDIDSpeedListMap中下一个LDID中所有车牌号码CPHM对应的速度列表speedList;
4-2.识别每一个speedList中,是否存在STATUS由0变1或者由1变0的过程,若存在则剔除跳变时产生的速度样本;
4-3.重复步骤4-1,4-2直至LDIDSpeedListMap中所有LDID中的所有车牌号码CPHM对应的速度列表speedList都剔除完毕,并返回一个新的LDIDSpeedListMap;
步骤(5).根据步骤(1)得到的阈值识别“类载客行为”,并剔除速度列表中由于“类载客行为”造成的异常速度样本,并返回新的速度列表,过程如下:
5-1.经过步骤(4)后从新的LDIDSpeedListMap中循环遍历获取LDID中CPHM的速度样本列表speedList,以5个连续的速度样本为一组<v1,v2,v3,v4,v5>;
5-2.将每组速度样本根据最小二乘法拟合成2次曲线,则每组速度样本都有一条唯一的二次曲线f(x),f(x)=ax2+bx,a、b为系数,每一组速度样本建立参数向量Vis(a,b,v1-v5),并根据公式(3)计算Vis与步骤(1)中得到三个类簇中心的参数向量Vic(a,b,v1-v5)的欧式距离di(d1,d2,d3);
5-3.将di(d1,d2,d3)与步骤(1)中得到的对应的“类载客行为”速度变化阈值Di(D1,D2,D3)比较,如果d1<D1则认为该组速度样本属于第一类“类载客行为”;d2<D2则认为该组速度样本属于第二类“类载客行为”;如果d3<D2则认为该组速度样本属于第三类“类载客行为”;每个样本将唯一对应一个类,不会出现同时属于2个类的情况;
5-4.扫描speedList表,得到该“类载客行为”速度样本
<v1,v2,v3,v4,v5>中最小速度对应的LDID和GPS_FDCi;遍历LkMap,若LkMap中存在该LDID则说明该行为出现的路段LDID为路口路段,若不存在进入5-5;从LkMap中获取该路段编号LDID对应的路口点(GPS_QD,GPS_ZD),GPS_QD表示起点经纬度,GPS_ZD表示终点经纬度,通过公式(3)计算GPS_FDCi与路口的距离并取其最小值L,若L<L_min,则认为该“类载客行为”属于“路口行为”不进行剔除,否则进入5-5判断是否属于“集体载客行为”;
L=min(abs(GPS_FDCi-GPS_QD),abs(GPS_FDCi-GPS_ZD)) (4)
5-5.得到该载客行为的vi对应的CJSJi和GPS_FDCi,循环遍历该LDID下其他车辆的速度列表若均出现“载客行为”获取其对应载客点的GPS_FDCi'和CJSJi',根据公式(5)、公式(6)计算判断条件;
abs(GPS_FDCi-GPS_FDCi')<△s_min,i≠i' (5)
abs(CJSJi-CJSJi')<△t_min,i≠i' (6)
若该LDID下其他车辆都满足以上判断条件则认为该载客行为属于“集体行为”不进行剔除,否则属于“个体行为”进入步骤5-6进行速度样本剔除;
5-6.剔除上述步骤得到的“类载客行为”速度样本;根据该速度样本vi<v1,v2,v3,v4,v5>所属的“类载客行为”分类,若属于第一类即载客过程的前半部分,则剔除这组速度样本中的后3个样本;同理若d2<D2,则剔除中间3个样本;若d3<D3,则剔除前3个样本;
5-7.重复步骤5-2至5-6完成“类载客行为”识别和剔除后返回一个新的LDIDSpeedListMap;
步骤(6).经过以上步骤后得到LDID对应的所有速度样本,计算所有速度样本的平均速度作为该路段的实时速度并存于数据库实时速度表中;
6-1.完成该时间片△t所有的速度样本剔除之后,根据新的LDIDSpeedListMap获取LDID中的所有CPHM的速度列表根据CJSJ的先后顺序组成一新的速度列表<v1,v2,v3,…vn>;
6-2.把该时间片划分为更小的时间片段τ,将速度列表中所有速度根据其对应的CJSJ划分到每一个小的时间片段中,假设每个小的时间片段中有m个速度样本,则根据公式(7)估算路段速度vR;
步骤(7).根据时间无缝规则更新时间片,重复步骤(3)至步骤(6);
λk表示每一个小时间片段所对应的权值参数,k表示小时间片段的个数;
mμ表示每个小时间片段内速度样本的个数;
vR:路段平均速度,单位km/h;
△t_min:判断是否为“集体行为”的时间阈值;
△s_min:判断是否为“集体行为”的空间阈值;
L_min:判断车辆是否发生“路口行为”的距离阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610956851.2A CN106548444B (zh) | 2016-11-03 | 2016-11-03 | 面向道路实时速度估算的浮动车载客行为模式清洗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610956851.2A CN106548444B (zh) | 2016-11-03 | 2016-11-03 | 面向道路实时速度估算的浮动车载客行为模式清洗方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106548444A CN106548444A (zh) | 2017-03-29 |
CN106548444B true CN106548444B (zh) | 2020-08-25 |
Family
ID=58393275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610956851.2A Active CN106548444B (zh) | 2016-11-03 | 2016-11-03 | 面向道路实时速度估算的浮动车载客行为模式清洗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106548444B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544921B (zh) * | 2018-11-26 | 2019-12-13 | 中南大学 | 一种基于交通特性的城市路段分类方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004258884A (ja) * | 2003-02-25 | 2004-09-16 | Matsushita Electric Ind Co Ltd | Fcd情報収集方法とプローブカーシステム |
DE50310628D1 (de) * | 2003-12-19 | 2008-11-20 | Bayerische Motoren Werke Ag | Erfahren |
CN102956105B (zh) * | 2012-11-01 | 2014-12-10 | 福建工程学院 | 一种浮动车样本点数据插值的方法 |
CN103903436A (zh) * | 2012-12-28 | 2014-07-02 | 上海优途信息科技有限公司 | 一种基于浮动车的高速公路交通拥堵检测方法和系统 |
CN105575120B (zh) * | 2015-12-31 | 2017-11-07 | 银江股份有限公司 | 面向道路实时速度计算的浮动车数据停车行为模式清洗方法 |
-
2016
- 2016-11-03 CN CN201610956851.2A patent/CN106548444B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN106548444A (zh) | 2017-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110176139B (zh) | 一种基于dbscan+的道路拥堵识别可视化方法 | |
WO2018064931A1 (zh) | 考虑出租车运营状态下的城市道路行程时间分布估算方法 | |
CN110197588A (zh) | 一种基于gps轨迹数据的大货车驾驶行为评估方法及装置 | |
CN111340427B (zh) | 一种基于轨迹数据的货车运行状态识别方法 | |
CN106781468B (zh) | 基于建成环境和低频浮动车数据的路段行程时间估计方法 | |
CN109191849B (zh) | 一种基于多源数据特征提取的交通拥堵持续时间预测方法 | |
CN110363985B (zh) | 一种交通数据分析方法、装置、存储介质及设备 | |
CN103839409A (zh) | 基于多断面视觉传感聚类分析的交通流状态判别方法 | |
CN110379163A (zh) | 一种基于轨迹数据的车辆异常减速区域检测方法及系统 | |
CN103065469A (zh) | 行程时间的确定方法和装置 | |
CN114999181B (zh) | 一种基于etc系统数据的高速公路车辆速度异常识别方法 | |
CN106297304A (zh) | 一种基于MapReduce面向大规模卡口数据的套牌车识别方法 | |
CN115691120A (zh) | 一种基于高速公路流水数据的拥堵识别方法及系统 | |
CN115311858B (zh) | 基于交通流韧性的城市路段分级管制方法 | |
CN110766940A (zh) | 道路信号交叉口运行状况评估方法 | |
CN105575120B (zh) | 面向道路实时速度计算的浮动车数据停车行为模式清洗方法 | |
CN109489679A (zh) | 一种导航路径中的到达时间计算方法 | |
CN112926768A (zh) | 基于时空注意力机制的地面道路车道级交通流预测方法 | |
CN109493449A (zh) | 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法 | |
Deng et al. | Heterogenous trip distance-based route choice behavior analysis using real-world large-scale taxi trajectory data | |
CN114005275B (zh) | 一种基于多数据源融合的高速公路车辆拥堵判别方法 | |
CN106548444B (zh) | 面向道路实时速度估算的浮动车载客行为模式清洗方法 | |
CN114023065A (zh) | 一种利用视频解析数据智能诊断路口服务等级的算法 | |
CN113724497A (zh) | 一种目标道路实时交通流量预测方法和装置 | |
CN110211380B (zh) | 一种多源交通数据融合的高速公路拥堵区间探测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |