CN116469251A - 一种面向轨迹数据的车辆异常数据筛选方法 - Google Patents

一种面向轨迹数据的车辆异常数据筛选方法 Download PDF

Info

Publication number
CN116469251A
CN116469251A CN202310331776.0A CN202310331776A CN116469251A CN 116469251 A CN116469251 A CN 116469251A CN 202310331776 A CN202310331776 A CN 202310331776A CN 116469251 A CN116469251 A CN 116469251A
Authority
CN
China
Prior art keywords
data
vehicle
data set
track data
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310331776.0A
Other languages
English (en)
Inventor
张莹
曲栩
李林恒
冒培培
龚龑
王灿
冉斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202310331776.0A priority Critical patent/CN116469251A/zh
Publication of CN116469251A publication Critical patent/CN116469251A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开一种面向轨迹数据的车辆异常数据筛选方法,包括:S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值,则进入步骤S30,否则进入步骤S40;S30,对车辆轨迹数据集进行重采样;S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;S50,分析每一个子数据集中车辆的数据特征,根据数据特征的分析结果,将异常指标数据标记为异常数据。本发明将轨迹数据通过时间、空间特征划分出子数据集,在子数据集中对车辆速度、加速度以及车头时距这三个指标进行特征分析,将时空特性干扰降低,筛选出车辆行驶过程中出现的异常数据。

Description

一种面向轨迹数据的车辆异常数据筛选方法
技术领域
本发明涉及数据筛选技术,特别涉及一种面向轨迹数据的车辆异常数据筛选方法。
背景技术
智能化的交通信息采集系统为车辆运行数据获取提供了便利,根据异常交通数据的特征对道路上车辆的行为进行分析,针对异常数据指向的车辆异常行为进行反馈,通过发布合理的主动交通管控措施、诱导车辆选择合理的路线以及构建交通事件的预警与响应系统,是道路通行能力提升的关键,并且有效减少交通事故的发生,从而缓解交通拥堵问题。
目前,车辆异常数据的研究尚不全面,较多研究通过车辆的异常行为特点对轨迹数据中的异常数据进行筛选,属于后验筛选方法。常见的车辆异常数据筛选方法是根据车辆的超速违章、违规低速、甚至逆行等行为,给出一定的车速阈值、或者判断车辆行驶方向是否与车流方向相同等方式筛选异常数据,这样的筛选方法看似符合异常数据的筛选逻辑,实则无法适应所有的数据集,同时没有从数据集本身的数据特征出发,筛选出的异常数据是经过人为定义的异常,并不适合用于挖掘轨迹数据本身的异常。
发明内容
发明目的:针对以上问题,本发明目的是提供一种面向轨迹数据的车辆异常数据筛选方法,基于车辆轨迹数据本身的数据特征实现对异常数据的筛选。
技术方案:本发明的一种面向轨迹数据的车辆异常数据筛选方法,包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40;
S30,对车辆轨迹数据集进行重采样;
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
进一步,在步骤S10中获取的高速公路车辆轨迹数据集,包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
进一步,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,将删除后的车辆轨迹数据集进行数据平滑降噪。
进一步,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
进一步,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij
有益效果:本发明与现有技术相比,其显著优点是:本发明的面向轨迹数据的车辆异常数据筛选方法,在提出的异常数据筛选方法中考虑到了时空特性,将轨迹数据通过时间、空间特征划分出子数据集,在子数据集中对车辆速度、加速度以及车头时距这三个指标进行特征分析,将时空特性干扰降低,筛选出车辆行驶过程中出现的异常数据;本发明着眼于车辆轨迹数据集本身的数据特征,针对异常行车轨迹数据的筛选提供了方法,为研究异常数据所指向的车辆异常行为创建基础,有助于未来完善智能交通系统、发布主动交通管控措施、诱导车辆选择合理的路线以及构建交通事件的预警与响应系统。
附图说明
图1为面向轨迹数据的车辆异常数据筛选方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
图1为本实施例所述的一种面向轨迹数据的车辆异常数据筛选方法流程图,本实施例目的是基于轨迹数据集的数据特征,从中筛选出异常轨迹数据,对未来构建智能交通系统、研究车辆异常行为具有重要意义,使得应用不同的车辆轨迹数据集都可以实现对异常数据的筛选,该方法包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理。
具体地,获取的高速公路车辆轨迹数据集包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
上述的高速公路车辆轨迹数据集可以通过在某一段高速公路路段,用无人机拍摄车辆行驶视频,通过视频识别的方法得到车辆的行驶轨迹数据,或者选择开源的车辆轨迹数据集,获取到的车辆行驶轨迹数据应包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数和全局坐标,其中全局坐标是指车辆的经纬度位置坐标。
具体地,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,如车头时距显示为9999则表示异常,将删除后的车辆轨迹数据集进行数据平滑降噪。
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40。
在一个具体的示例中,可将预设阈值设置为1秒,若采样时间间隔低于1秒时,则需要进行数据重采样,因为过量的数据组会影响异常数据的分类显著性,且大量的数据会降低有效数据密度。
S30,对车辆轨迹数据集进行重采样。
具体地,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样,不足一组的部分自成一组;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集。
具体地,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,i=1,2,3,…,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij,j=1,2,3,…。
在具体实施过程中一般车辆轨迹数据集时间跨度设置为一小时左右,最后分成5分钟的子数据集即可。
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
在针对每一个子数据集Nij,分析行驶速度、加速度以及车头时距的数据特征,绘制箱式图与直方图对行驶速度、加速度以及车头时距这三个指标进行描述,根据特征描述结果,依据工程实践中的八二准则进行选取,其中80%即为大部分数据所展现出的数据特征,而区别于这部分数据的剩余的20%数据则呈现出离群的特征,选取出20%区别于其他数据的数据,将包含这些异常指标数据的数据条标记为异常数据,则异常数据的筛选过程完成。

Claims (5)

1.一种面向轨迹数据的车辆异常数据筛选方法,其特征在于,包括以下步骤:
S10,获取高速公路车辆轨迹数据集,对车辆轨迹数据集进行预处理;
S20,对预处理后的车辆轨迹数据集进行判断,若采样时间间隔低于预设阈值T,则进入步骤S30,否则进入步骤S40;
S30,对车辆轨迹数据集进行重采样;
S40,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集;
S50,分析每一个子数据集中车辆的数据特征,包括行驶速度、加速度以及车头时距,根据数据特征的分析结果,将异常指标数据标记为异常数据。
2.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,在步骤S10中获取的高速公路车辆轨迹数据集,包括车辆编号、行驶速度、加速度、车头时距、车头间距、所在车道编号、时间帧数以及全局坐标。
3.根据权利要求2所述的车辆异常数据筛选方法,其特征在于,对车辆轨迹数据集进行预处理包括:删除数据缺失及数据记录异常的数据信息,将删除后的车辆轨迹数据集进行数据平滑降噪。
4.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,对车辆轨迹数据集进行重采样包括以下步骤:
S301,依据车辆编号进行分组重采样;
S302,按照每组第一条数据采集车辆所在车道、时间帧数和全局坐标;
S303,分别计算每一组行驶速度平均值、加速度平均值、车头间距平均值以及车头时距平均值。
5.根据权利要求1所述的车辆异常数据筛选方法,其特征在于,按照时间特征和空间特征,将车辆轨迹数据集分成子数据集包括:
根据时间特征将车辆轨迹数据集分为时间跨度为ΔS的i个小数据集Mi,再根据匝道合流区、高速公路主路部分以及匝道分流区将数据集Mi分成j个子数据集,记为子数据集Nij
CN202310331776.0A 2023-03-31 2023-03-31 一种面向轨迹数据的车辆异常数据筛选方法 Pending CN116469251A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310331776.0A CN116469251A (zh) 2023-03-31 2023-03-31 一种面向轨迹数据的车辆异常数据筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310331776.0A CN116469251A (zh) 2023-03-31 2023-03-31 一种面向轨迹数据的车辆异常数据筛选方法

Publications (1)

Publication Number Publication Date
CN116469251A true CN116469251A (zh) 2023-07-21

Family

ID=87183513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310331776.0A Pending CN116469251A (zh) 2023-03-31 2023-03-31 一种面向轨迹数据的车辆异常数据筛选方法

Country Status (1)

Country Link
CN (1) CN116469251A (zh)

Similar Documents

Publication Publication Date Title
Li et al. Analysis of road traffic fatal accidents using data mining techniques
CN108550262B (zh) 基于毫米波雷达的城市交通感知系统
CN106485927A (zh) 一种智能交通违章信息采集装置及采集方法
CN111598069B (zh) 一种基于深度学习的高速公路车辆换道区域分析方法
CN108734008B (zh) 基于停车记录对车辆匿名的移动轨迹数据去匿名的方法
CN114999181B (zh) 一种基于etc系统数据的高速公路车辆速度异常识别方法
CN106297304A (zh) 一种基于MapReduce面向大规模卡口数据的套牌车识别方法
CN114267173B (zh) 高速公路时空特征的多源数据融合方法、装置及设备
CN114879160B (zh) 基于三维点云数据的铁轨异物入侵实时监测方法及系统
CN111210163A (zh) 一种基于多源数据的公交车辆风险评价系统与方法
CN112116810A (zh) 基于城市道路卡口数据的全路网路段行程时间估计方法
CN114091581A (zh) 一种基于稀疏轨迹的车辆运营行为类型识别方法
CN114997777A (zh) 一种基于轨迹信息的车辆移动特征识别方法
CN109633716B (zh) 基于gps的城市配送车辆出行链及其特征识别方法与设备
CN116469251A (zh) 一种面向轨迹数据的车辆异常数据筛选方法
CN110853350B (zh) 一种基于浮动车轨迹数据的干道相位差优化方法
CN112185120A (zh) 一种基于电子车牌数据的通勤私家车识别方法
CN113284338A (zh) 机动车紧急避让无灯控人行横道对交通流影响的计算方法
Sun et al. Vehicle activity analysis based on ANPR system
Sun et al. Vapa: Vehicle activity patterns analysis based on automatic number plate recognition system data
CN111968365B (zh) 一种非信号交叉口车辆行为分析方法、系统及存储介质
CN113345220B (zh) 一种高速公路稽查车辆跟踪与预测分析系统
CN114664080B (zh) 一种交叉口公交车辆信号优先效果评价方法
CN116991963A (zh) 基于轨迹的货运车辆出行意图识别及属性提取方法
CN114446045A (zh) 一种疫情期间高速公路车辆违法运输行为的研判方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination