CN117472893A - 一种系统化提升交通流数据质量方法 - Google Patents
一种系统化提升交通流数据质量方法 Download PDFInfo
- Publication number
- CN117472893A CN117472893A CN202311552814.1A CN202311552814A CN117472893A CN 117472893 A CN117472893 A CN 117472893A CN 202311552814 A CN202311552814 A CN 202311552814A CN 117472893 A CN117472893 A CN 117472893A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- repairing
- traffic flow
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 153
- 230000008439 repair process Effects 0.000 claims abstract description 79
- 230000002159 abnormal effect Effects 0.000 claims abstract description 50
- 238000007689 inspection Methods 0.000 claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 15
- 230000009897 systematic effect Effects 0.000 claims abstract description 6
- 230000008859 change Effects 0.000 claims description 38
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000001514 detection method Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000003137 locomotive effect Effects 0.000 claims description 14
- 238000011835 investigation Methods 0.000 claims description 13
- 230000002123 temporal effect Effects 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 9
- 238000013441 quality evaluation Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 6
- 230000005856 abnormality Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 7
- 230000002354 daily effect Effects 0.000 description 40
- 230000000694 effects Effects 0.000 description 12
- 238000005067 remediation Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013496 data integrity verification Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种系统化提升交通流数据质量方法,属于交通流数据处理技术领域,用于解决现有交通流数据修补精度较低的技术问题。本方法是针对交通流数据不同应用情况设计的一套提升数据的质量方法,包括异常数据的识别和修复方法的选择;通过交通数据在线和离线相结合,依靠数据完整性检验、方差检验、组合检验、阈值检验和零值检验,筛选出异常数据,然后通过数据的时间和空间相关性,对数据进行修复;本发明通过多种方法对异常数据进行筛选,克服了单一的阈值检验中数据筛选不完全的问题,同时运用组合检验,考虑交通流参数之间的关系,并根据异常数据的特点选择合适的数据修复方法,提高了数据修复的精准度,从而提高交通流数据的整体质量。
Description
技术领域
本发明属于交通流数据处理技术领域,涉及一种系统化提升交通流数据质量方法。
背景技术
随着道路上监视控制系统的应用,大量的交通数据得以采集,尤其是交通流数据,对研究人员进行道路运行情况的分析有较大的帮助,通过对交通流数据进行分析,可以对道路的运行情况进行探究,发现道路运行问题,可以说交通流数据是交通控制、管理、及评价应用与研究的基础。
然而,现有的一些检测器所获取的交通流数据中往往夹杂着许多被噪声污染或是缺失的数据,若直接对采集到的交通流数据进行应用,会导致出现分析结果与道路实际运行情况不匹配的问题。由于检测设备、检测手段、及检测方法的多样性,而且交通流是大量微观个体决策的群体涌现,因此其具有高度的复杂性和非线性。此外,数据在通过有线或无线网络传输的过程中,也会因电磁干扰或信道失稳等众多原因造成数据污染或丢失。显然,在数据获取过程中,造成数据质量低下的原因和环节众多且复杂,采集到的交通流数据中存在的问题可以概括为数据缺失,数据失真和数据异常三类,引起定点检测数据出错的原因主要有两方面:一方面是由于定点检测器在设备的安装、维护、数据传输过程中操作不当或者设备工作外场环境恶劣导致设备失灵而造成数据损失;另一方面是由于交通流异常,如车流异常密集,车流在检测器检测范围内频繁变换车道,导致设备不能正确识别从而出现失真数据和异常数据。
现有的数据质量提升方法有对所述待处理的交通数据进行识别,得到异常数据,然后采用K折交叉验证法对所述缺失数据进行补偿以及对错误数据进行修正;根据数据的相似性,去除冗余数据。
也有判断数据在时间上是否具有连续性,若具有连续性,即为时间连续数据,若不具有连续性,即为时间随机数据;判断时间连续数据是否有规律,若有规律,即为周期性数据,则利用时间相关性对异常数据进行修正,若无规律,即为非周期性数据,则利用异常数据同组的正常数据对异常数据进行修正;判断时间随机数据的异常数据规模是否超过预设阈值,若超过预设阈值,则直接舍弃该组数据,若不超过预设阈值,则将异常数据置零处理。
现有的解决方法几乎都是采用某一算法对所述缺失数据进行补偿;对错误的数据进行修正;根据数据的相似性,去除冗余数据。或者通过数据在时间上的连续性找到规律进而对数据进行补充,也有通过阈值来对数据的质量进行控制的方法;综合而言,目前针对交通数据的质量提升方法还面临如下的问题:
(1)对于交通数据的特点没有进行考虑,交通流数据包含流量、速度、及时间占有率三种参数,这三个参数的组合形式应符合交通流规律,若对此类关系考虑不足,会导致预测结果不符合实际运行规律的情况。
(2)因为流量、车速等交通参数并不是独立存在的个体,它们彼此之间存在一定的联系,故采用单参数阈值法独立评价各交通参数会导致数据质量评价不全面的问题。
(3)数据处理存在滞后的问题,部分针对交通数据的质量提升方法是通过对收集到的数据进行问题分类,然后利用各类算法或时间、空间等信息进行修复,但是无法在收集时便对数据进行区分,导致出现后续时间耗费较多的情况。
(4)数据修补的方法比较单一,仅通过一类方法进行修补,没有深入考虑某一方法是否适用于所有异常数据,导致出现数据修补精度不高的问题。
基于此,针对交通调查的数据在传输过程中可能会出现的数据异常情况,从而导致数据的质量存在问题,难以进行后续的数据分析;提出一种系统化提升交通流数据质量方法,对交通流数据的质量进行提升,提高数据修复精度,以便于后续的数据分析。
发明内容
本发明的目的是针对现有的技术存在上述问题,提出了一种系统化提升交通流数据质量方法,本发明要解决的技术问题是:如何提升交通流数据的质量。
本发明的目的可通过下列技术方案来实现:
一种系统化提升交通流数据质量方法,通过对采集到的交通流数据进行在线评价,筛选出缺失数据、异常数据和正确数据,然后通过离线评价计算数据的缺失率、错误率和日平均交通量变化率,最终对交通流数据进行修复从而提高数据的质量,具体步骤如下:
步骤一、数据完整性检验:在线检查原始数据的完整性,因为数据采集设备每5分钟上传一次数据包,所以每个站点每天应有的数据包数量是固定的,应为288个;通过统计每个站点每天的数据包数量,与每个站点每天应有的数据包数量对比,计算两者数量之差即可得到缺失的数据包数量。
步骤二、对完整的数据进行方差检验:检验速度、流量、时间占有率三个参数的方差是否为0,若为O,标记为异常数据。在实际工作中,会因为某些原因导致某个字段的数值一直为固定值;样本容量相同的情况下,方差越大,说明数据的波动性越大,越不稳定。因此,从数据的二阶特性出发,利用数据的二阶特性,通过方差计算评估出各字段数据的波动性。
步骤三、组合检验:对通过方差检验得到结果不为0的数据进行组合检验,根据交通流理论对异常组合的定义,对流量、速度、时间占有率进行组合判断,错误的组合形式为以下五种:V>0,Q=0,O=0;V=0,Q=0,O>0;V=0,Q>0,O=0;V=0,Q>0,O>0;V>0,Q=0,O>0;其中V为速度,Q为流量,O为时间占有率;之后将出现错误组合的数据标记为异常数据。
步骤四、阈值检验:组合判断之后进行阈值检验,阈值检验分为流量阈值检验、速度阈值检验、时间占有率阈值检验、跟车百分比阈值检验和车头间距阈值检验。异常高值的检验可通过设定阈值的方法进行识别,当数据超出设定阈值时,标记为异常数据。
4.1、流量阈值检验:定义流量检测值Qd的合理范围:
其中,T为交通参数采集的时间间隔,fc为修正系数,一般取1.3~1.5,Cmax为车道最大通行能力。由于车辆的计数是在一个相当短的时间内完成的(几十秒或几分钟),因此,Qd的范围为道路的最大通行能力Cmax与一定时间段的乘积,最小为0。
4.2、速度阈值检验:定义地点车速检测值Vd的合理范围为:0≤Vd≤fv×Vmax;
其中,Vmax为检测道路的限制车速,不同道路等级限制车速不同,fv为修正系数,一般取1.3~1.5。
4.3、时间占有率阈值检验:
时间占有率是指一定时间段内,检测器被车辆占用的时间与检测时间的比值。在交通量较小的情况下,相应的车速就高,单位时间内通过检测器的车辆较少,检测器的占有率低。随着交通量的增加,车速降低,单位时间内检测器被占有的时间较长,检测器的占有率就明显变高。一般情况下,占有率不会超过95%。因此,时间占有率筛选的阈值一般确定为95%。但是由于交通信号的存在,当车辆出现排队时容易出现高占有率,因此这种检测方法并不适用于信号控制交叉口道路。考虑到实际中的检测器大多设置在交叉口附近,基于对实际数据的分析,最终将时间占有率的阈值设置为100%。
4.4、跟车百分比阈值检验:
为研究跟车百分比的阈值,分别对平原、山区及山岭的国道、省道、县道每5分钟流量的跟车百分比进行统计分析,设定跟车百分比的阈值。通过对结果分析可以得出县道、省道以及国道的跟车百分比都在0到100%之间的结论;山区的结果同样如此,所以首先将在线检验的跟车百分比阈值设置为[0,100%],随后可根据跟车百分比的分布特性对异常数据进行识别。
4.5、车头间距阈值检验;
为研究车头间距的阈值,分别对平原、山区及山岭地区的国道、省道、县道每5分钟流量的跟车头间距进行统计分析,通过对采集的数据进行分析,设定车头间距的阈值。通过对不同地形的道路采集的车头间距进行比较,发现地形越不利于行驶,车流量很小时,车头间距的值分布越离散。
步骤五、零值检验:阈值检验之后进行零值检验,交通流数据会出现全部为零的情况,产生这种情况的原因有两类:
第一类、自由流情况下,在采用间隔内无车到达。
第二类、数据传输中断或设备故障等因素,导致数据被错误地储存为零值。
对自由流的交通流特性进行分析,提出一种可区分数据中的零值是否为真实的第一类情况的方法,在自由流时,车辆到达服从泊松分布,其概率密度函数表达式为:
其中,p(x)为采样间隔内到达x辆车的概率密度函数,λ为采样间隔内平均到达车辆数,e为自然对数的底;在5Min的采样间隔内,有车到达的概率为f(x>0),即f(x>0)=1-p(0)=1-e-λ,解得,λ=-ln(f(x>0)),当历史数据中,该断面在某检测间隔内车辆的平均到达率小于λ,则认为该时刻采集到的零值为真零,反之,为假零,将假零的交通流数据标记为异常数据。
步骤六、数据分析:根据在线评价的结果,运用离线评价方法对数据的整体情况进行分析,根据筛选的结果,计算数据的缺失率,错误率和平均日交通流量变化率。
6.1、缺失率:某段时间范围内某交通调查设备未采集到数据的数量占该时段内该交通调查设备理论上应该采集到的数据量的百分比,计算公式为:
其中,Im为缺失率;Dm为某段时间范围内某交通调查设备未采集到数据的数量;Dt为该时段内该交通调查设备理论上应该采集到的数据量。
6.2、异常率:某时段内在线质量评价方法筛选出的问题数据量占该时段内实际采集到的数据数量的百分比,计算公式为:
其中,If为异常率;Df为某时段内在线质量评价方法筛选出的问题数据量;D为该时段内实际采集到的数据数量。
6.3、平均日交通流量变化率:针对不同评价周期,平均日交通流量变化率可采用不同的周期进行计算,本发明提出了以年、月、日为评价周期的计算方法。
6.31、年平均日交通流量变化率;
该方法用同一监测点前一年和当年的原始数据分别计算年平均日当量交通量,最后计算当年比上一年的变化率。
其中,Py为年平均日交通流量变化率;AADT为当年的年平均日交通流量;AADTa为上一年年年平均日交通流量。
6.32、月平均日交通流量变化率:该部分用上一月和当月原始数据计算某断面某月的日平均当量交通量,最后计算当月比上一月的变化率。
其中,Pm为月平均日交通流量变化率;MADT为当月的月平均日交通流量;MADTa为上一月的月平均日交通流量。
6.33、日交通流量变化率:该部分用前一天和当天原始数据计算某断面某月的日当量交通量,最后计算当天比前一天的变化率。
其中,Pd为日交通流量变化率;ADT为当天的日交通流量;ADTa为前一天的日交通流量。
步骤七、数据修复:对流量、速度、跟车百分比、时间占有率和车头间距等问题数据进行修复。
因流量和速度数据为直接采集到的数据,且对交通状态判别的重要程度最高,而跟车百分比与其他数据间无理论关系,所以先对流量、速度和跟车百分比进行修复。其次,因为时间占有率与流量、速度具有密切关系,在修复方法中利用这一特性对时间占有率数据进行修复。同理,有以上数据之后,最后可对车头间距进行推算修复。
7.1、流量问题数据修复
流量问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的站点;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对站点和工作日信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:判断是否为孤立站点,不是孤立点,判断是否有相邻车道,若有,则收集相邻车道的流量数据进行修复;是孤立站点,是否有上下游关系,若有,则收集上下游的流量数据进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的流量数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的流量数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear);基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
基于空间相关性的修复方法,计算公式如下:
qi(t)=a+bqj(t)
其中,qi(t)在t时刻的修复数据结果,qj(t)为相邻车道或上下游关系在t时刻的数据,a,b为参数,根据同一时段的历史数据估计模型获得参数a,b;得到参数a,b后,即可算出数据修复结果qi(t)。
基于时间相关性的修复方法,计算公式如下::
其中,xi-k为之前k个时间间隔的数据,k为共采集k个时间间隔的数据用于问题数据的修复,βi-k为待定系数,βi-k的值可根据同一时段的历史数据估计模型获得,为修复数据结果。
7.2、速度问题数据修复
速度问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对车道和工作日信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车辆速度数据进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的速度数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的速度数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear),基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
7.3、时间占有率问题数据修复
时间占有率问题数据的修复首先要对出现该问题的时间进行分析,分析分为两个部分,分别是:问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对工作日信息进行分析,通过时间相关性进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的时间占有率数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的时间占有率数据进行修复,否则收集前一周同时间间隔的时间占有率数据进行修复。
最终通过基于时间相关性的修复方法进行修复,修复方法为线性插值法(linear)。
7.4、车头间距问题数据修复
车头间距问题数据的修复首先要对出现该问题的站点进行分析,分析分为两个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常。
之后对车道和时间信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车头间距数据进行修复。
时间相关性的修复依据为:收集之前时间间隔的车头间距数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear),基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
7.5、跟车百分比问题数据修复
跟车百分比问题数据的修复首先要对出现该问题的时间进行分析,分析针对问题数据之前采集的数据是否正常来进行。
之后对时间信息进行分析,基于时间相关性的修复依据为:收集之前时间间隔的跟车百分比数据进行修复。
最终通过基于空间相关性的修复方法进行修复,修复方法为线性插值法(linear)。
通过对流量、速度、跟车百分比、时间占有率进行修复以及车头间距等问题数据进行修复,修复后的数据即为正确数据。
与现有技术相比,本系统化提升交通流数据质量方法具有以下优点:
1、本发明是针对交通流数据不同应用情况,设计一套的交通流数据质量提升方法,包括异常数据的识别,数据的修复方法的选择,通过交通数据在线和离线相结合的理念,依靠数据完整性检验、方差检验、组合检验、阈值检验和零值检验,筛选出异常数据,然后通过数据的时间和空间相关性,对数据进行修复。本发明通过多种方法对异常数据进行筛选,克服了单一的阈值检验中数据筛选不完全的问题,同时运用组合检验,考虑了交通流参数之间的关系,并根据异常数据的特点选择合适的数据修复方法,提高数据修复精准度,从而有效提高了交通流数据的整体质量。
2、本发明通过对采集到的交通流数据进行在线评价,筛选出缺失数据、异常数据和正确数据,然后通过离线评价计算数据的缺失率、错误率和日平均交通量变化率,最终对交通流数据的质量进行提升。
3、本发明可以对数据进行实时的检测,在数据收集的过程就可以进行数据的筛选,然后对问题数据进行归类,节省了数据处理的时间,提高了工作效率。
4、本发明克服了通过单一阈值进行问题数据判断的弊端,通过方差检验、组合检验、零值检验和阈值检验相结合的方式对问题数据进行筛选,筛选结果更加准确,便于进行精准修复。
5、交通流各个参数并不是独立存在的,本发明考虑了交通流参数之间的关系,通过交通流量、车辆行驶速度和时间占有率三者的一致性对数据的合理性进行判断,提高了数据修复质量。
附图说明
图1是本发明方法的流程结构示意图;
图2是本发明中流量问题数据修复的流程结构示意图;
图3是本发明中速度问题修复的流程结构示意图;
图4是本发明中时间占有率问题数据修复的流程结构示意图;
图5是本发明中车头间距问题数据修复的流程结构示意图;
图6是本发明中跟车百分比问题数据修复的流程结构示意图;
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
下面详细描述本专利的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利,而不能理解为对本专利的限制。
请参阅图1,本实施例提供了一种系统化提升交通流数据质量方法,通过对采集到的交通流数据进行在线评价,筛选出缺失数据、异常数据和正确数据,然后通过离线评价计算数据的缺失率、错误率和日平均交通量变化率,最终对交通流数据进行修复从而提高数据的质量,具体步骤如下:
步骤一、数据完整性检验:在线检查原始数据的完整性,数据采集设备每5分钟上传一次数据包,每个站点每天应有的数据包数量是288个,统计每个站点每天的数据包数量,与每个站点每天应有的数据包数量对比,计算两者数量之差即可得到缺失的数据包数量。
步骤二、对完整的数据进行方差检验:检验速度、流量、时间占有率三个参数的方差是否为0,若为O,标记为异常数据。在实际工作中,会因为某些原因导致某个字段的数值一直为固定值;样本容量相同的情况下,方差越大,说明数据的波动性越大,越不稳定,因此,从数据的二阶特性出发,利用数据的二阶特性,通过方差计算评估出各字段数据的波动性。
步骤三、组合检验:对通过方差检验得到结果不为0的数据进行组合检验,根据交通流理论对异常组合的定义,对流量、速度、时间占有率进行组合判断,错误的组合形式为以下五种:V>0,Q=0,O=0;V=0,Q=0,O>0;V=0,Q>0,O=0;V=0,Q>0,O>0;V>0,Q=0,O>0;如下表1所示,其中V为速度,Q为流量,O为时间占有率;之后将出现错误组合的数据标记为异常数据。
表1错误的组合形式
组合编号 | 错误组合形式 |
1 | V>0,Q=0,O=0 |
2 | V=0,Q=0,O>0 |
3 | V=0,Q>0,O=0 |
4 | V=0,Q>0,O>0 |
5 | V>0,Q=0,O>0 |
步骤四、阈值检验:组合判断之后进行阈值检验,阈值检验分为流量阈值检验、速度阈值检验、时间占有率阈值检验、跟车百分比阈值检验和车头间距阈值检验。异常高值的检验通过设定阈值的方法进行识别,当数据超出设定阈值时,标记为异常数据。
4.1、流量阈值检验:定义流量检测值Qd的合理范围为:
其中,T为交通参数采集的时间间隔,fc为修正系数,fc取值范围为1.3~1.5,Cmax为车道最大通行能力。由于车辆的计数是在一个相当短的时间内完成的(几十秒或几分钟),因此,Qd的范围为道路的最大通行能力Cmax与一定时间段的乘积,最小为0。
4.2、速度阈值检验:定义地点车速检测值Vd的合理范围为:0≤Vd≤fv×Vmax;
其中,Vmax为检测道路的限制车速,不同道路等级限制车速不同,fv为修正系数,fv取值范围为1.3~1.5。
4.3、时间占有率阈值检验:
时间占有率是指一定时间段内,检测器被车辆占用的时间与检测时间的比值。本实施例中,时间占有率的阈值设置为100%。
在交通量较小的情况下,相应的车速就高,单位时间内通过检测器的车辆较少,检测器的占有率低。随着交通量的增加,车速降低,单位时间内检测器被占有的时间较长,检测器的占有率就明显变高。一般情况下,占有率不会超过95%。因此,时间占有率筛选的阈值一般确定为95%。但是由于交通信号的存在,当车辆出现排队时容易出现高占有率,因此这种检测方法并不适用于信号控制交叉口道路。考虑到实际中的检测器大多设置在交叉口附近,基于对实际数据的分析,最终将时间占有率的阈值设置为100%。
4.4、跟车百分比阈值检验:
为研究跟车百分比的阈值,分别对平原、山区及山岭的国道、省道、县道每5分钟流量的跟车百分比进行统计分析,设定跟车百分比的阈值。
通过对结果分析可以得出县道、省道以及国道的跟车百分比都在0到100%之间的结论;山区的结果同样如此,所以首先将在线检验的跟车百分比阈值设置为[0,100%],随后根据跟车百分比的分布特性对异常数据进行识别。
4.5、车头间距阈值检验;
为研究车头间距的阈值,分别对平原、山区及山岭地区的国道、省道、县道每5分钟流量的跟车头间距进行统计分析,通过对采集的数据进行分析,设定车头间距的阈值。通过对不同地形的道路采集的车头间距进行比较,发现地形越不利于行驶,车流量很小时,车头间距的值分布越离散。
例如,采集到的车头间距的最大值为65535m,但出现该最大值的时段并不连续。取当量流量小于3所对应的车头间距进行统计,绝大部分车头间距小于25000m,由于地形越不利于行驶,车流量很小时,车头间距的值分布越离散,从数据分布情况观察来看,车头间距阈值建议取值如下表2所示:
表2车头间距阈值
平原 | 山岭 | 山区 | |
国道 | 2000m | 25000m | 25000m |
省道 | 2000m | 25000m | 25000m |
县道 | 2000m | 25000m | 25000m |
步骤五、零值检验:阈值检验之后进行零值检验,交通流数据会出现全部为零的情况,产生这种情况的原因有两类:
第一类、自由流情况下,在采用间隔内无车到达。
第二类、数据传输中断或设备故障等因素,导致数据被错误地储存为零值。
对自由流的交通流特性进行分析,提出一种可区分数据中的零值是否为真实的第一类情况的方法,在自由流时,车辆到达服从泊松分布,其概率密度函数表达式为:
其中,p(x)为采样间隔内到达x辆车的概率密度函数,λ为采样间隔内平均到达车辆数,e为自然对数的底;在5Min的采样间隔内,有车到达的概率为f(x>0),即f(x>0)=1-p(0)=1-e-λ,解得,λ=-ln(f(x>0)),当历史数据中,该断面在某检测间隔内车辆的平均到达率小于λ,则认为该时刻采集到的零值为真零,反之,为假零,将假零的交通流数据标记为异常数据。
步骤六、数据分析:根据在线评价的结果,运用离线评价方法对数据的整体情况进行分析,根据筛选的结果,计算数据的缺失率,错误率和平均日交通流量变化率。
6.1、缺失率:某段时间范围内某交通调查设备未采集到数据的数量占该时段内该交通调查设备理论上应该采集到的数据量的百分比,计算公式为:
其中,Im为缺失率;Dm为某段时间范围内某交通调查设备未采集到数据的数量;Dt为该时段内该交通调查设备理论上应该采集到的数据量。
6.2、异常率:某时段内在线质量评价方法筛选出的问题数据量占该时段内实际采集到的数据数量的百分比,计算公式为:
其中,If为异常率;Df为某时段内在线质量评价方法筛选出的问题数据量;D为该时段内实际采集到的数据数量。
6.3、平均日交通流量变化率:针对不同评价周期,平均日交通流量变化率可采用不同的周期进行计算,本发明提出了以年、月、日为评价周期的计算方法。
6.31、年平均日交通流量变化率;
该方法用同一监测点前一年和当年的原始数据分别计算年平均日当量交通量,最后计算当年比上一年的变化率。
其中,Py为年平均日交通流量变化率;AADT为当年的年平均日交通流量;AADTa为上一年年年平均日交通流量。
6.32、月平均日交通流量变化率:该部分用上一月和当月原始数据计算某断面某月的日平均当量交通量,最后计算当月比上一月的变化率。
其中,Pm为月平均日交通流量变化率;MADT为当月的月平均日交通流量;MADTa为上一月的月平均日交通流量。
6.33、日交通流量变化率:该部分用前一天和当天原始数据计算某断面某月的日当量交通量,最后计算当天比前一天的变化率。
其中,Pd为日交通流量变化率;ADT为当天的日交通流量;ADTa为前一天的日交通流量。
步骤七、数据修复:依次对流量、速度、跟车百分比、时间占有率和车头间距等问题数据进行修复。
因流量和速度数据为直接采集到的数据,且对交通状态判别的重要程度最高,而跟车百分比与其他数据间无理论关系,所以先对流量、速度和跟车百分比进行修复。其次,因为时间占有率与流量、速度具有关系密切,在修复方法中也利用这一特性再对时间占有率数据进行修复。同理,有以上数据之后,最后可对车头间距进行推算修复。
7.1、流量问题数据修复
流量问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的站点;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对站点和工作日信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:判断是否为孤立站点,不是孤立点,判断是否有相邻车道,若有,则收集相邻车道的流量数据进行修复;是孤立站点,是否有上下游关系,若有,则收集上下游的流量数据进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的流量数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的流量数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear);基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
7.2、速度问题数据修复
速度问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对车道和工作日信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车辆速度数据进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的速度数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的速度数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear),基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
7.3、时间占有率问题数据修复
时间占有率问题数据的修复首先要对出现该问题的时间进行分析,分析分为两个部分,分别是:问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对工作日信息进行分析,通过时间相关性进行修复。
时间相关性的修复依据为:一、收集之前时间间隔的时间占有率数据进行修复(优先考虑);二、根据是否为工作日,是则收集前一天同时间间隔的时间占有率数据进行修复,否则收集前一周同时间间隔的时间占有率数据进行修复。
最终通过基于时间相关性的修复方法进行修复,修复方法为线性插值法(linear)。
7.4、车头间距问题数据修复
车头间距问题数据的修复首先要对出现该问题的站点进行分析,分析分为两个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常。
之后对车道和时间信息进行分析,前者为基于空间相关性进行修复(优先考虑),后者为基于时间相关性进行修复。
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车头间距数据进行修复。
时间相关性的修复依据为:收集之前时间间隔的车头间距数据进行修复。
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法(linear),基于空间相关性修复方法的优先级要优于基于时间相关性修复方法,即优先考虑采用空间相关修复方法进行数据修复。
7.5、跟车百分比问题数据修复
跟车百分比问题数据的修复首先要对出现该问题的时间进行分析,分析针对问题数据之前采集的数据是否正常来进行。
之后对时间信息进行分析,基于时间相关性的修复依据为:收集之前时间间隔的跟车百分比数据进行修复。
最终通过基于空间相关性的修复方法进行修复,修复方法为线性插值法(linear)。
以上基于空间相关性的修复方法和基于时间相关性的修复方法如下:
基于空间相关性的修复方法,计算公式如下:
qi(t)=a+bqj(t)
其中,qi(t)在t时刻的修复数据结果,qj(t)为相邻车道或上下游关系在t时刻的数据,a,b为参数,根据同一时段的历史数据估计模型获得参数a,b;得到参数a,b后,即可算出数据修复结果qi(t)。
基于时间相关性的修复方法,计算公式如下::
其中,xi-k为之前k个时间间隔的数据,k为共采集k个时间间隔的数据用于问题数据的修复,βi-k为待定系数,βi-k的值可根据同一时段的历史数据估计模型获得,为修复数据结果。
通过对流量、速度、跟车百分比、时间占有率进行修复以及车头间距等问题数据进行修复,修复后的数据即为正确数据。
以下通过具体案例验证本实施例所公开的系统化提升交通流数据质量方法对交通流数据进行处理的效果。
从北京市某一年份的数据中选择86个站点的一周数据进行分析,86个站点共有248条车道。其中,站点位于国道的站点15个,位于省道的站点34个,位于县道的站点37个。
数据完整性检验:日上传量为288,一周理想数据量应为7*248*288=499968条,原始数据共有424142条;缺少的数据量为75826条,占比15.17%,即缺失率为15.17%。
对完整的数据进行方差检验:通过方差检验,筛选出异常数据12307条,占比2.9%。
组合检验:通过各车型流量、车速组合是否合理,筛选出异常数据量为6条,占比0.0012%。
通过所有车型流量和、平均速度、时间占有率组合是否合理,筛选出异常数据量为30171条,占比6.03%。
阈值检验:通过流量、速度、时间占有率、车头间距、跟车百分比阈值检验,筛选出异常数据量为2160条,占比0.43%。
零值检验:通过真假零值检验,通过流量、速度、时间占有率是否全为0,筛选出异常数据量为2806条,占比0.70%。
具体筛选结果如下表3所示:
表3筛选结果
综上,有效数据为424142条,正确数据为376692条,占有效数据比为88.81%,在异常识别中可针对各种错误类型对错误数据进行不同的标记。该实验说明目前的异常数据识别方法能有效的识别出异常数据。
数据修复:对上述识别出的异常数据和缺失数据采用插值法进行修复,本次采用的插值法分为三种,分别是线性插值法(linear)、三次样条插值法(spline)和三阶埃尔米特插值法(pchip)。
修复结果统计指标见下表4所示。
表4修复结果统计指标
表4中的RMSE表示均方根误差,MAPE表示平均绝对百分比误差,VAPE表示平均绝对百分比误差的方差。从表4中可以看出在均方根误差这一统计指标中,三种插值方法修复时间占有率的效果最好,linear和pchip的表现接近,车头间距的修复效果最差。平均绝对误差这一指标中,速度的修复效果最好,VAPE指标也反映出速度的修复效果最好。其中,
(1)流量:三种插值修复方法中,linear和pchip的修复效果要优于Spline;
(2)速度:三种插值修复方法的差异不大,但linear的修复效果最好;
(3)时间占有率:三种插值修复方法中,linear和pchip的修复效果要优于Spline;
(4)跟车百分比:三种插值修复方法中,linear和pchip的修复效果要优于Spline;linear的修复效果最好;
(5)车头间距:三种插值修复方法中,linear的修复效果最好;
综和对比下,三种修复方法中,本发明对数据进行处理后采用线性插值法(linear)修复的效果最好,能有效提高交通流数据处理的质量。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下做出各种变化。
Claims (7)
1.一种系统化提升交通流数据质量方法,其特征在于,本方法发的具体步骤如下:
步骤一、数据完整性检验:在线检查原始数据的完整性,数据采集设备每5分钟上传一次数据包,每个站点每天应有的数据包数量是288个,统计每个站点每天的数据包数量,与每个站点每天应有的数据包数量对比,计算两者数量之差即可得到缺失的数据包数量;
步骤二、对完整的数据进行方差检验:检验速度、流量、时间占有率三个参数的方差是否为0,若为O,标记为异常数据;
步骤三、组合检验:对通过方差检验得到结果不为0的数据进行组合检验,根据交通流理论对异常组合的定义,对流量、速度、时间占有率进行组合判断,错误的组合形式为以下五种:V>0,Q=0,O=0;V=0,Q=0,O>0;V=0,Q>0,O=0;V=0,Q>0,O>0;V>0,Q=0,O>0;其中,V为速度,Q为流量,O为时间占有率;之后将出现错误组合的数据标记为异常数据;
步骤四、阈值检验:阈值检验分为流量阈值检验、速度阈值检验、时间占有率阈值检验、跟车百分比阈值检验和车头间距阈值检验;异常高值的检验通过设定阈值的方法进行识别,当数据超出设定阈值时,标记为异常数据;
步骤五、零值检验:阈值检验之后进行零值检验,交通流数据会出现全部为零的情况,产生这种情况的原因有两类:
第一类、自由流情况下,在采用间隔内无车到达;
第二类、数据传输中断或设备故障等因素,导致数据被错误地储存为零值;
对自由流的交通流特性进行分析,提出一种可区分数据中的零值是否为真实的第一类情况的方法,在自由流时,车辆到达服从泊松分布,其概率密度函数表达式为:
其中,p(x)为采样间隔内到达x辆车的概率密度函数,λ为采样间隔内平均到达车辆数,e为自然对数的底;在5Min的采样间隔内,有车到达的概率为f(x>0),即f(x>0)=1-p(0)=1-e-λ,解得,λ=-ln(f(x>0)),当历史数据中,该断面在某检测间隔内车辆的平均到达率小于λ,则认为该时刻采集到的零值为真零,反之,为假零,将假零的交通流数据标记为异常数据;
步骤六、数据分析:根据在线评价的结果,运用离线评价方法对数据的整体情况进行分析,根据筛选的结果,计算数据的缺失率,错误率和日平均交通流量变化率;
步骤七、数据修复:依次对流量、速度、跟车百分比、时间占有率和车头间距等问题数据进行修复;
S7.1、流量问题数据修复;
流量问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的站点;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日;
之后对站点和工作日信息进行分析,前者为基于空间相关性进行修复,后者为基于时间相关性进行修复;
空间相关性的修复依据为:判断是否为孤立站点,不是孤立点,判断是否有相邻车道,若有,则收集相邻车道的流量数据进行修复;是孤立站点,是否有上下游关系,若有,则收集上下游的流量数据进行修复;
时间相关性的修复依据为:一、收集之前时间间隔的流量数据进行修复;二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的流量数据进行修复;
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法;
S7.2、速度问题数据修复;
速度问题数据的修复首先要对出现该问题的站点进行分析,分析分为三个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常;问题数据采集的时间是否为工作日。
之后对车道和工作日信息进行分析,前者为基于空间相关性进行修复,后者为基于时间相关性进行修复;
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车辆速度数据进行修复;
时间相关性的修复依据为:一、收集之前时间间隔的速度数据进行修复;二、根据是否为工作日,是则收集前一天同时间间隔的流量数据进行修复,否则收集前一周同时间间隔的速度数据进行修复;
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法。
S7.3、时间占有率问题数据修复;
时间占有率问题数据的修复首先要对出现该问题的时间进行分析,分析分为两个部分,分别是:问题数据之前的数据是否正常;问题数据采集的时间是否为工作日;
之后对工作日信息进行分析,通过时间相关性进行修复;
时间相关性的修复依据为:一、收集之前时间间隔的时间占有率数据进行修复;二、根据是否为工作日,是则收集前一天同时间间隔的时间占有率数据进行修复,否则收集前一周同时间间隔的时间占有率数据进行修复;
最终通过基于时间相关性的修复方法进行修复,修复方法为线性插值法;
S7.4、车头间距问题数据修复;
车头间距问题数据的修复首先要对出现该问题的站点进行分析,分析分为两个部分,分别是:该站点是否有相邻的车道;问题数据之前的数据是否正常;
之后对车道和时间信息进行分析,前者为基于空间相关性进行修复,后者为基于时间相关性进行修复;
空间相关性的修复依据为:是否有相邻车道,若有,则收集相邻车道的车头间距数据进行修复;
时间相关性的修复依据为:收集之前时间间隔的车头间距数据进行修复;
最终通过基于空间相关性的修复方法和基于时间相关性的修复方法进行修复,修复方法均采用线性插值法;
S7.5、跟车百分比问题数据修复;
跟车百分比问题数据的修复首先要对出现该问题的时间进行分析,分析针对问题数据之前采集的数据是否正常来进行;
之后对时间信息进行分析,基于时间相关性的修复依据为:收集之前时间间隔的跟车百分比数据进行修复;
最终通过基于空间相关性的修复方法进行修复,修复方法为线性插值法;
通过对流量、速度、跟车百分比、时间占有率进行修复以及车头间距的问题数据进行修复,修复后的数据即为正确数据。
2.根据权利要求1所述的一种系统化提升交通流数据质量方法,其特征在于,所述步骤四中,阈值检验的方法如下:
S4.1、流量阈值检验:定义流量检测值Qd的合理范围为:
其中,T为交通参数采集的时间间隔,fc为修正系数,Cmax为车道最大通行能力;
S4.2、速度阈值检验:定义地点车速检测值Vd的合理范围为:0≤Vd≤fv×Vmax;
其中,Vmax为检测道路的限制车速,不同道路等级限制车速不同,fv为修正系数;
S4.3、时间占有率阈值检验:
时间占有率是指一定时间段内,检测器被车辆占用的时间与检测时间的比值,时间占有率的阈值设置为100%;
S4.4、跟车百分比阈值检验:
分别对平原、山区及山岭的国道、省道、县道每5分钟流量的跟车百分比进行统计分析,设定跟车百分比的阈值,首先将在线检验的跟车百分比阈值设置为[0,100%],随后根据跟车百分比的分布特性对异常数据进行识别;
S4.5、车头间距阈值检验;
分别对平原、山区及山岭地区的国道、省道、县道每5分钟流量的跟车头间距进行统计分析,通过对采集的数据进行分析,设定车头间距的阈值。
3.根据权利要求2所述的一种系统化提升交通流数据质量方法,其特征在于,所述平原地区的国道、省道、县道车头间距阈值均设置为2000m,山区及山岭地区的国道、省道、县道的国道、省道、县道车头间距阈值均设置为25000m。
4.根据权利要求2所述的一种系统化提升交通流数据质量方法,其特征在于,所述流量阈值检验过程中,fc取值范围为1.3~1.5;速度阈值检验过程中,fv取值范围为1.3~1.5。
5.根据权利要求1所述的一种系统化提升交通流数据质量方法,其特征在于,所述步骤六中,缺失率和异常率的计算方法如下:
缺失率:某段时间范围内某交通调查设备未采集到数据的数量占该时段内该交通调查设备理论上应该采集到的数据量的百分比,计算公式为:
其中,Im为缺失率;Dm为某段时间范围内某交通调查设备未采集到数据的数量;Dt为该时段内该交通调查设备理论上应该采集到的数据量;
异常率:某时段内在线质量评价方法筛选出的问题数据量占该时段内实际采集到的数据数量的百分比,计算公式为:
其中,If为异常率;Df为某时段内在线质量评价方法筛选出的问题数据量;D为该时段内实际采集到的数据数量。
6.根据权利要求1所述的一种系统化提升交通流数据质量方法,其特征在于,所述步骤六中,平均日交通流量变化率计算时,针对不同评价周期,平均日交通流量变化率可采用不同的周期进行计算,提出了以年、月、日为评价周期的计算方法:
年平均日交通流量变化率计算:该方法用同一监测点前一年和当年的原始数据分别计算年平均日当量交通量,最后计算当年比上一年的变化率;
其中,Py为年平均日交通流量变化率;AADT为当年的年平均日交通流量;AADTa为上一年年年平均日交通流量;
月平均日交通流量变化率计算:该部分用上一月和当月原始数据计算某断面某月的日平均当量交通量,最后计算当月比上一月的变化率;
其中,Pm为月平均日交通流量变化率;MADT为当月的月平均日交通流量;MADTa为上一月的月平均日交通流量;
日交通流量变化率计算:该部分用前一天和当天原始数据计算某断面某月的日当量交通量,最后计算当天比前一天的变化率;
其中,Pd为日交通流量变化率;ADT为当天的日交通流量;ADTa为前一天的日交通流量。
7.根据权利要求1所述的一种系统化提升交通流数据质量方法,其特征在于,所述步骤七中,基于空间相关性的修复方法和基于时间相关性的修复方法如下:
基于空间相关性的修复方法,计算公式如下:
qi(t)=a+bqj(t)
其中,qi(t)在t时刻的修复数据结果,qj(t)为相邻车道或上下游关系在t时刻的数据,a,b为参数,根据同一时段的历史数据估计模型获得参数a,b;得到参数a,b后,即可算出数据修复结果qi(t);
基于时间相关性的修复方法,计算公式如下::
其中,xi-k为之前k个时间间隔的数据,k为共采集k个时间间隔的数据用于问题数据的修复,βi-k为待定系数,βi-k的值可根据同一时段的历史数据估计模型获得,为修复数据结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311552814.1A CN117472893A (zh) | 2023-11-21 | 2023-11-21 | 一种系统化提升交通流数据质量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311552814.1A CN117472893A (zh) | 2023-11-21 | 2023-11-21 | 一种系统化提升交通流数据质量方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117472893A true CN117472893A (zh) | 2024-01-30 |
Family
ID=89625519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311552814.1A Pending CN117472893A (zh) | 2023-11-21 | 2023-11-21 | 一种系统化提升交通流数据质量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117472893A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117912255A (zh) * | 2024-03-19 | 2024-04-19 | 河北鹏鹄信息科技有限公司 | 一种实时智能驱动全域数据采集公路监控系统和监控方法 |
-
2023
- 2023-11-21 CN CN202311552814.1A patent/CN117472893A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117912255A (zh) * | 2024-03-19 | 2024-04-19 | 河北鹏鹄信息科技有限公司 | 一种实时智能驱动全域数据采集公路监控系统和监控方法 |
CN117912255B (zh) * | 2024-03-19 | 2024-05-10 | 河北鹏鹄信息科技有限公司 | 一种实时智能驱动全域数据采集公路监控系统和监控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110197588B (zh) | 一种基于gps轨迹数据的大货车驾驶行为评估方法及装置 | |
CN110322048B (zh) | 一种生产物流输送装备故障预警方法 | |
CN111114519B (zh) | 一种铁路车辆制动故障预测方法及健康管理系统 | |
CN108345666B (zh) | 一种基于时间-空间孤立点的车辆异常轨迹检测方法 | |
CN117472893A (zh) | 一种系统化提升交通流数据质量方法 | |
CN109360415B (zh) | 一种道路交通流异常数据识别方法 | |
CN111950627B (zh) | 一种多源信息融合方法及其应用 | |
CN113344134B (zh) | 一种低压配电监控终端数据采集异常检测方法及系统 | |
CN112284440B (zh) | 一种传感器数据偏差自适应修正方法 | |
CN111179592B (zh) | 基于时空数据流融合分析的城市交通预测方法和系统 | |
CN103631681A (zh) | 一种在线修复风电场异常数据的方法 | |
CN113159374B (zh) | 一种数据驱动的城市交通流速模式识别与实时预测预警方法 | |
CN112990544B (zh) | 一种高速公路交织区交通事故预测方法 | |
CN114004137A (zh) | 一种多源气象数据融合与预处理方法 | |
CN116523508B (zh) | 一种基于AIoT资产的智慧运维管理系统 | |
CN104281779A (zh) | 一种异常数据判定与处理方法及装置 | |
CN114023073B (zh) | 一种基于车辆行为分析的高速公路拥堵预测方法 | |
CN115691120A (zh) | 一种基于高速公路流水数据的拥堵识别方法及系统 | |
CN113496314A (zh) | 一种神经网络模型预测道路交通流量的方法 | |
CN115277464A (zh) | 基于多维时间序列分析的云网络变更流量异常检测方法 | |
CN112364910B (zh) | 基于峰值聚类高速公路收费数据异常事件检测方法及装置 | |
CN113593242A (zh) | 一种基于路口车辆检测器组的在途量估算方法 | |
CN111680888B (zh) | 基于rfid数据确定路网容量的方法 | |
CN112232553A (zh) | 一种基于贝叶斯网络的高铁列车晚点影响因素诊断方法 | |
CN115809805A (zh) | 基于边缘计算的电网多源数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |