CN116469251A - 一种面向轨迹数据的车辆异常数据筛选方法 - Google Patents
一种面向轨迹数据的车辆异常数据筛选方法 Download PDFInfo
- Publication number
- CN116469251A CN116469251A CN202310331776.0A CN202310331776A CN116469251A CN 116469251 A CN116469251 A CN 116469251A CN 202310331776 A CN202310331776 A CN 202310331776A CN 116469251 A CN116469251 A CN 116469251A
- Authority
- CN
- China
- Prior art keywords
- data
- vehicle
- data set
- track data
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012216 screening Methods 0.000 title claims abstract description 25
- 230000001133 acceleration Effects 0.000 claims abstract description 14
- 238000012952 Resampling Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 230000005856 abnormality Effects 0.000 claims description 7
- 230000003137 locomotive effect Effects 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开一种面向轨迹数据的车辆异常数据筛选方法,包括:S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值,则进入步骤S30,否则进入步骤S40;S30,对车辆轨迹数据集进行重采样;S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;S50,分析每一个子数据集中车辆的数据特征,根据数据特征的分析结果,将异常指标数据标记为异常数据。本发明将轨迹数据通过时间、空间特征划分出子数据集,在子数据集中对车辆速度、加速度以及车头时距这三个指标进行特征分析,将时空特性干扰降低,筛选出车辆行驶过程中出现的异常数据。
Description
技术领域
本发明涉及数据筛选技术,特别涉及一种面向轨迹数据的车辆异常数据筛选方法。
背景技术
智能化的交通信息采集系统为车辆运行数据获取提供了便利,根据异常交通数据的特征对道路上车辆的行为进行分析,针对异常数据指向的车辆异常行为进行反馈,通过发布合理的主动交通管控措施、诱导车辆选择合理的路线以及构建交通事件的预警与响应系统,是道路通行能力提升的关键,并且有效减少交通事故的发生,从而缓解交通拥堵问题。
目前,车辆异常数据的研究尚不全面,较多研究通过车辆的异常行为特点对轨迹数据中的异常数据进行筛选,属于后验筛选方法。常见的车辆异常数据筛选方法是根据车辆的超速违章、违规低速、甚至逆行等行为,给出一定的车速阈值、或者判断车辆行驶方向是否与车流方向相同等方式筛选异常数据,这样的筛选方法看似符合异常数据的筛选逻辑,实则无法适应所有的数据集,同时没有从数据集本身的数据特征出发,筛选出的异常数据是经过人为定义的异常,并不适合用于挖掘轨迹数据本身的异常。
发明内容
发明目的:针对以上问题,本发明目的是提供一种面向轨迹数据的车辆异常数据筛选方法,基于车辆轨迹数据本身的数据特征实现对异常数据的筛选。
技术方案:本发明的一种面向轨迹数据的车辆异常数据筛选方法,包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40;
S30,对车辆轨迹数据集进行重采样;
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
进一步,在步骤S10中获取的高速公路车辆轨迹数据集,包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
进一步,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,将删除后的车辆轨迹数据集进行数据平滑降噪。
进一步,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
进一步,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij。
有益效果:本发明与现有技术相比,其显著优点是:本发明的面向轨迹数据的车辆异常数据筛选方法,在提出的异常数据筛选方法中考虑到了时空特性,将轨迹数据通过时间、空间特征划分出子数据集,在子数据集中对车辆速度、加速度以及车头时距这三个指标进行特征分析,将时空特性干扰降低,筛选出车辆行驶过程中出现的异常数据;本发明着眼于车辆轨迹数据集本身的数据特征,针对异常行车轨迹数据的筛选提供了方法,为研究异常数据所指向的车辆异常行为创建基础,有助于未来完善智能交通系统、发布主动交通管控措施、诱导车辆选择合理的路线以及构建交通事件的预警与响应系统。
附图说明
图1为面向轨迹数据的车辆异常数据筛选方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
图1为本实施例所述的一种面向轨迹数据的车辆异常数据筛选方法流程图,本实施例目的是基于轨迹数据集的数据特征,从中筛选出异常轨迹数据,对未来构建智能交通系统、研究车辆异常行为具有重要意义,使得应用不同的车辆轨迹数据集都可以实现对异常数据的筛选,该方法包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理。
具体地,获取的高速公路车辆轨迹数据集包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
上述的高速公路车辆轨迹数据集可以通过在某一段高速公路路段,用无人机拍摄车辆行驶视频,通过视频识别的方法得到车辆的行驶轨迹数据,或者选择开源的车辆轨迹数据集,获取到的车辆行驶轨迹数据应包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数和全局坐标,其中全局坐标是指车辆的经纬度位置坐标。
具体地,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,如车头时距显示为9999则表示异常,将删除后的车辆轨迹数据集进行数据平滑降噪。
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40。
在一个具体的示例中,可将预设阈值设置为1秒,若采样时间间隔低于1秒时,则需要进行数据重采样,因为过量的数据组会影响异常数据的分类显著性,且大量的数据会降低有效数据密度。
S30,对车辆轨迹数据集进行重采样。
具体地,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样,不足一组的部分自成一组;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集。
具体地,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,i=1,2,3,…,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij,j=1,2,3,…。
在具体实施过程中一般车辆轨迹数据集时间跨度设置为一小时左右,最后分成5分钟的子数据集即可。
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
在针对每一个子数据集Nij,分析行驶速度、加速度以及车头时距的数据特征,绘制箱式图与直方图对行驶速度、加速度以及车头时距这三个指标进行描述,根据特征描述结果,依据工程实践中的八二准则进行选取,其中80%即为大部分数据所展现出的数据特征,而区别于这部分数据的剩余的20%数据则呈现出离群的特征,选取出20%区别于其他数据的数据,将包含这些异常指标数据的数据条标记为异常数据,则异常数据的筛选过程完成。
Claims (5)
1.一种面向轨迹数据的车辆异常数据筛选方法,其特征在于,包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40;
S30,对车辆轨迹数据集进行重采样;
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
2.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,在步骤S10中获取的高速公路车辆轨迹数据集,包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
3.根据权利要求2所述的车辆异常数据筛选方法,其特征在于,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,将删除后的车辆轨迹数据集进行数据平滑降噪。
4.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
5.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310331776.0A CN116469251A (zh) | 2023-03-31 | 2023-03-31 | 一种面向轨迹数据的车辆异常数据筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310331776.0A CN116469251A (zh) | 2023-03-31 | 2023-03-31 | 一种面向轨迹数据的车辆异常数据筛选方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116469251A true CN116469251A (zh) | 2023-07-21 |
Family
ID=87183513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310331776.0A Pending CN116469251A (zh) | 2023-03-31 | 2023-03-31 | 一种面向轨迹数据的车辆异常数据筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116469251A (zh) |
-
2023
- 2023-03-31 CN CN202310331776.0A patent/CN116469251A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Analysis of road traffic fatal accidents using data mining techniques | |
CN108550262B (zh) | 基于毫米波雷达的城市交通感知系统 | |
CN106485927A (zh) | 一种智能交通违章信息采集装置及采集方法 | |
CN111598069B (zh) | 一种基于深度学习的高速公路车辆换道区域分析方法 | |
CN108734008B (zh) | 基于停车记录对车辆匿名的移动轨迹数据去匿名的方法 | |
CN114999181B (zh) | 一种基于etc系统数据的高速公路车辆速度异常识别方法 | |
CN106297304A (zh) | 一种基于MapReduce面向大规模卡口数据的套牌车识别方法 | |
CN114267173B (zh) | 高速公路时空特征的多源数据融合方法、装置及设备 | |
CN114879160B (zh) | 基于三维点云数据的铁轨异物入侵实时监测方法及系统 | |
CN111210163A (zh) | 一种基于多源数据的公交车辆风险评价系统与方法 | |
CN112116810A (zh) | 基于城市道路卡口数据的全路网路段行程时间估计方法 | |
CN114091581A (zh) | 一种基于稀疏轨迹的车辆运营行为类型识别方法 | |
CN114997777A (zh) | 一种基于轨迹信息的车辆移动特征识别方法 | |
CN109633716B (zh) | 基于gps的城市配送车辆出行链及其特征识别方法与设备 | |
CN116469251A (zh) | 一种面向轨迹数据的车辆异常数据筛选方法 | |
CN110853350B (zh) | 一种基于浮动车轨迹数据的干道相位差优化方法 | |
CN112185120A (zh) | 一种基于电子车牌数据的通勤私家车识别方法 | |
CN113284338A (zh) | 机动车紧急避让无灯控人行横道对交通流影响的计算方法 | |
Sun et al. | Vehicle activity analysis based on ANPR system | |
Sun et al. | Vapa: Vehicle activity patterns analysis based on automatic number plate recognition system data | |
CN111968365B (zh) | 一种非信号交叉口车辆行为分析方法、系统及存储介质 | |
CN113345220B (zh) | 一种高速公路稽查车辆跟踪与预测分析系统 | |
CN114664080B (zh) | 一种交叉口公交车辆信号优先效果评价方法 | |
CN116991963A (zh) | 基于轨迹的货运车辆出行意图识别及属性提取方法 | |
CN114446045A (zh) | 一种疫情期间高速公路车辆违法运输行为的研判方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |