CN106650801A - 一种基于gps数据的多类型车辆分类方法 - Google Patents

一种基于gps数据的多类型车辆分类方法 Download PDF

Info

Publication number
CN106650801A
CN106650801A CN201611129308.1A CN201611129308A CN106650801A CN 106650801 A CN106650801 A CN 106650801A CN 201611129308 A CN201611129308 A CN 201611129308A CN 106650801 A CN106650801 A CN 106650801A
Authority
CN
China
Prior art keywords
vehicle
sample
data
feature
acceleration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611129308.1A
Other languages
English (en)
Other versions
CN106650801B (zh
Inventor
孙湛博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201611129308.1A priority Critical patent/CN106650801B/zh
Publication of CN106650801A publication Critical patent/CN106650801A/zh
Application granted granted Critical
Publication of CN106650801B publication Critical patent/CN106650801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于GPS数据的多类型车辆分类方法,采用车载位置的GPS数据,基于三类车辆:小汽车、小型货车和大型货车加减速特征,用机器学习支持向量机建立车辆分类器,运用支持向量机模型对三类车辆进行自动分类。本发明方法对三种车辆进行分类准确率达到75%。通过对不同GPS数据的采样频率的计算结果进行对比,发现采样频率越高对三种车辆的分类越准确。

Description

一种基于GPS数据的多类型车辆分类方法
技术领域
本发明属于交通工程领域,适用于城市道路中的车辆分类。车辆分类信息对于交通规划、道路设施的设计与使用起到非常重要的作用。
背景技术
现在已经有许多技术应用于车辆分类。除了人工分类外,最近的车辆分类方法主要依靠固定传感器例如气动导管传感器、感应线圈传感器、压电式传感器等。这些方法被称为是侵入式分类方法,不仅需要在现场操作,还会干扰交通流。另外一种非侵入式分类方法所依靠的传感器有雷达传感器、红外线传感器、声波传感器、视觉成像等,这种方法不会干扰交通但是运行和维护费用较高。
但是这些分类方法并不是在所有的情况下都适用。要么是传感器运用的成本太贵,或是在一些特定情况下,它们的检测数据会出现错误。例如在流量大,车速较快的路段,气动导管传感器的检测效果不理想;在拥堵的情况下,感应线去传感器的检测效果也不理想;视觉成像的效果会受天气的影响。
所以,现有的车辆分类方法主要存在两个问题(i)严重依赖固定传感器和检测技术,侵入式设备影响交通,且成本较高(ii)现有的方法只能在固定地点采集交通检测数据,对大范围的地区的数据采集比较昂贵。
发明内容
鉴于以上陈述的已有方案的不足,本发明旨在提供高效、简单的方法,并使之克服现有技术上的缺点。
为了实现上述目的,本发明提出的方法是:
一种基于GPS数据的多类型车辆分类方法,采用车载位置的G PS数据,基于三类车辆:小汽车、小型货车和大型货车加减速特征,用机器学习支持向量机建立车辆分类器,运用支持向量机模型对三类车辆进行自动分类;其具体处理包含如下的手段:
(1)首先对采集的GPS数据进行清洗,剔除奇异点;
(2)对清洗后的数据进行数据挖掘,对整理后的GPS数据进行特征提取,提取的特征包括车辆的最大加速度、加速度的标准差、加减速累积频率;在特征提取过程中获得多组数据样本;
(3)基于以上车辆的加减速特征,运用支持向量机模型建立针对三种车型的分类器,其中支持向量机模型表达式为:
ξi≥0
其中:
xi∈Rd(i=1,2,...,N)是训练样本i的提取特征;
N是总的训练样本;
ti{1,-1}是样本i的实际车辆种类(1表示小汽车,-1表示货车);
w和b是将样本分为两种类型的分隔线的参数;
表示一个固定的特征空间,该空间可以将矢量xi从初始的d-维度空间转换到更高的维度空间;
ξi是一个松弛变量用来处理错误分类的样本;
C是一个控制变量用来平衡最大的效益和错误分类的误差;
确定分类器的方法如下式:
其中:
xt是实验样本t的特征,该样本的车辆种类是确定的;
αi是拉格朗日乘子,它是通过求解二元支持向量机模型的对偶问题得到的;
k(xt,xi)是Kernel方程,它是的点积;
(4)将车辆加减速变化情况作为有效的特征,通过交叉验证的数据挖掘方法和forward-selection选择方法得到车型分类的最有效特征,对车辆进行自动分类。
本发明采用GPS数据,运用支持向量机模型对三类车辆进行分类,对三种车辆进行分类准确率达到75%。通过对不同GPS数据的采样频率的计算结果进行对比,发现采样频率越高对三种车辆的分类越准确。
附图说明
图1:GPS数据图。
图2:为采样频率为5秒的提取特征图。其中:
图A以最大加/减速度为特征的提取特征图;
图B以加/减速度标准差为特征的提取特征图;
图C以最大加速度超过1mpss的车辆比例为特征的提取特征图;
图D以最大加速度超过0.5mpss的车辆比例为特征的提取特征图。
图3:提取特征的箱线图。其中:
图A为小汽车的提取特征箱线图;
图B为小型货车的提取特征箱线图;
图C为大型货车的提取特征箱线图。
图4:交叉验证的计算过程。
图5:Forward-selection方法提取最有效特征。
图6:、模型1与模型4对比图。
图7:不同采样频率对应的分类精度对照。
为了更好的建立车辆分类模型,首先需要对采集来的数据进行清洗,剔除奇异点。剔除的规则1)GPS数据中两个连续点之间的时间大于数据采集时间间隔;2)GPS数据中两个连续点之间的加/减速度大于6m/s2。然后将清洗后的数据以20分钟为间隔获得车辆的时间-速度记录。最后通过数据挖掘技术,对整理后的GPS数据进行车辆特征提取,提取的特征包括车辆的最大加减速度、加减速的标准差、加减速累积频率。在车辆特征提取过程中可获得多组数据样本。
将清洗后的GPS数据,通过数据挖掘技术,提取出车辆的特征如图2所示。图A表明小汽车的最大加速度比小型货车的大,而小型货车的最大加速度比大型货车的大。图B、C、D表明小汽车的加减速变化比小型货车和大型货车的大,同时也表明货车出现大幅度加减速频率的次数较少。
本发明方法共提取了车辆的30个特征。三个箱线图呈现出来的规律和图2是类似的,即货车较于小汽车的加速度更小,并且出现大幅度加减速的频率更少。图3中小汽车的箱线图中,特征1即最大加速度的箱线图表明提取特征的样本数据中25%的小汽车最大加速度小于1.8m/s2,75%的车辆最大加速度大于1.4m/s2,最大的加速度为2.5m/s2,最小的加速度为1.1m/s2,箱体以外的数据为异常值,其余箱线图的含义类似。
基于以上车辆加减速特征,运用支持向量机模型建立针对三种车型的分类器,其中支持向量机模型表达式为:
ξi≥0
其中:
xi∈Rd(i=1,2,...,N)是训练样本i的提取特征;
N是总的训练样本;
ti{1,-1}是样本i的实际车辆种类(1表示小汽车,-1表示货车);
w和b是将样本分为两种类型的分隔线的参数;
表示一个固定的特征空间,该空间可以将矢量xi从初始的d-维度空间转换到更高的维度空间;
ξi是一个松弛变量用来处理错误分类的样本;
C是一个控制变量用来平衡最大的效益和错误分类的误差;
确定分类器的方法如下式:
其中:
xt是实验样本t的特征,该样本的车辆种类是确定的;
αi是拉格朗日乘子,它是通过求解二元支持向量机模型的对偶问题得到的;
k(xt,xi)是Kernel方程,它是的点积。
如果y(xt)≥0即样本t所得的指标为1,则表示该样本为小汽车;如果y(xt)≤0即样本t所得的指标为-1,则表示该样本为货车。
将车辆加减速变化情况作为有效的特征,通过交叉验证的数据挖掘办法和forward-selection选择方法得到车型分类的最有效特征,计算过程如图4所示:
通过交叉验证的数据挖掘的办法得到车型分类的最有效特征。图5中模型四表明,在使用减速度超过0.8m/s2的数据比例,减速度超过0.6m/s2的数据比例,加速度超过0.5m/s2的数据比例以及加速度超过1.4m/s2的数据比例时,对三类车辆的分类精度最高。
如图6所示,通过forward-selection方法的选择,得出最有效的特征为特征23、21、7、16,即减速度超过0.8m/s2的数据比例,减速度超过0.6m/s2的数据比例,加速度超过0.5m/s2的数据比例以及加速度超过1.4m/s2的数据比例。
由于本发明方法是对三种类型的车辆进行分类,所以建立三个分类器,分类器采用一对一相比较的形式来确定样本的类型。然后,将样本数据导入分类器中进行训练。
在实验阶段,将同一个样本数据导入3个分类器中,3个分类器会得到3种标签,样本数据获得的某个标签数量越多,这个样本数据就是相应标签所指代的车辆类型,如三个分类器得出的分类结果是小汽车、小汽车、小型货车,那么这个数据样本所对应的车辆类型就是小汽车。如果两种或多种类型车辆得到的标签数量一样多,就会采用K-最邻近算法来确定样本的车辆类型。即当实验样本与训练样本之前距离最近时,那么训练样本的车辆类型就是实验样本的分类结果。实验样本与每个训练样本的欧式距离用下式计算,本文设定的K值为7。
针对GPS数据的不同采样频率得到的分类精确度。发现采样频率在低于5秒一次时分类精度明显降低,如图7所示。
通过该种方法建立多类型车辆分类器,对车辆进行自动分类。实例分析,其数据结果显示该分类器对三种车辆的分类准确度达75%,并且数据采样频率越高,分类精度越准确。

Claims (2)

1.一种基于GPS数据的多类型车辆分类方法,采用车载位置的GPS数据,基于三类车辆:小汽车、小型货车和大型货车加减速特征,用机器学习支持向量机建立车辆分类器,运用支持向量机模型对三类车辆进行自动分类;其具体处理包含如下的手段:
(1)首先对采集的GPS数据进行清洗,剔除奇异点;
(2)对清洗后的数据进行数据挖掘,对整理后的GPS数据进行特征提取,提取的特征包括车辆的最大加速度、加速度的标准差、加减速累积频率;在特征提取过程中获得多组数据样本;
(3)基于以上车辆的加减速特征,运用支持向量机模型建立针对三种车型的分类器,其中支持向量机模型表达式为:
Min w , b , ξ w T w 2 + C Σ i = 1 N ξ i
ξi≥0
其中:
xi∈Rd(i=1,2,...,N)是训练样本i的提取特征;
N是总的训练样本;
ti{1,-1}是样本i的实际车辆种类,1表示小汽车,-1表示货车;
w和b是将样本分为两种类型的分隔线的参数;
表示一个固定的特征空间,该空间可以将矢量xi从初始的d-维度空间转换到更高的维度空间;
ξi是一个松弛变量用来处理错误分类的样本;
C是一个控制变量用来平衡最大的效益和错误分类的误差;
确定分类器的方法如下式:
y ( x t ) = S i g n ( Σ α i > 0 α i t i k ( x t , x i ) + b )
其中:
xt是实验样本t的特征,该样本的车辆种类是确定的;
αi是拉格朗日乘子,它是通过求解二元支持向量机模型的对偶问题得到的;
k(xt,xi)是Kernel方程,它是的点积;
(4)将车辆加减速变化情况作为有效的特征,通过交叉验证的数据挖掘方法和forward-selection选择方法得到车型分类的最有效特征,对车辆进行自动分类。
2.根据权利要求1所述的基于GPS数据的多类型车辆分类方法,其特征在于,所述剔除奇异点剔除的规则为:
1)GPS数据中两个连续点之间的时间大于数据采集时间间隔;
2)GPS数据中两个连续点之间的加/减速度大于6m/s2
将清洗后的数据以20分钟为间隔获得车辆的时间-速度记录。
CN201611129308.1A 2016-12-09 2016-12-09 一种基于gps数据的多类型车辆分类方法 Active CN106650801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611129308.1A CN106650801B (zh) 2016-12-09 2016-12-09 一种基于gps数据的多类型车辆分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611129308.1A CN106650801B (zh) 2016-12-09 2016-12-09 一种基于gps数据的多类型车辆分类方法

Publications (2)

Publication Number Publication Date
CN106650801A true CN106650801A (zh) 2017-05-10
CN106650801B CN106650801B (zh) 2019-05-03

Family

ID=58824164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611129308.1A Active CN106650801B (zh) 2016-12-09 2016-12-09 一种基于gps数据的多类型车辆分类方法

Country Status (1)

Country Link
CN (1) CN106650801B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232823A (zh) * 2019-06-14 2019-09-13 重庆大学 一种基于rfid电子车牌数据的慢行车判定分析方法
WO2019199561A1 (en) * 2018-04-09 2019-10-17 Cambridge Mobile Telematics Inc. Vehicle classification based on telematics data
CN112634489A (zh) * 2020-12-09 2021-04-09 众安在线财产保险股份有限公司 一种基于移动终端的车辆状态确定方法、装置及系统
CN112668172A (zh) * 2020-12-24 2021-04-16 西南交通大学 考虑车型和驾驶风格异质性的跟驰行为建模方法及其模型

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070122040A1 (en) * 2005-11-30 2007-05-31 Honeywell International Inc. Method and apparatus for identifying physical features in video
US20120106800A1 (en) * 2009-10-29 2012-05-03 Saad Masood Khan 3-d model based method for detecting and classifying vehicles in aerial imagery
CN104299008A (zh) * 2014-09-23 2015-01-21 同济大学 基于多特征融合的车型分类方法
CN104501930A (zh) * 2014-12-24 2015-04-08 北京万集科技股份有限公司 一种联体式的防作弊动态称重方法及系统
CN105320966A (zh) * 2015-10-30 2016-02-10 东软集团股份有限公司 一种车辆行驶状态识别方法及装置
CN106203330A (zh) * 2016-07-08 2016-12-07 西安理工大学 一种基于卷积神经网络的车辆分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070122040A1 (en) * 2005-11-30 2007-05-31 Honeywell International Inc. Method and apparatus for identifying physical features in video
US20120106800A1 (en) * 2009-10-29 2012-05-03 Saad Masood Khan 3-d model based method for detecting and classifying vehicles in aerial imagery
CN104299008A (zh) * 2014-09-23 2015-01-21 同济大学 基于多特征融合的车型分类方法
CN104501930A (zh) * 2014-12-24 2015-04-08 北京万集科技股份有限公司 一种联体式的防作弊动态称重方法及系统
CN105320966A (zh) * 2015-10-30 2016-02-10 东软集团股份有限公司 一种车辆行驶状态识别方法及装置
CN106203330A (zh) * 2016-07-08 2016-12-07 西安理工大学 一种基于卷积神经网络的车辆分类方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019199561A1 (en) * 2018-04-09 2019-10-17 Cambridge Mobile Telematics Inc. Vehicle classification based on telematics data
JP2021519980A (ja) * 2018-04-09 2021-08-12 ケンブリッジ モバイル テレマティクス,インク.Cambridge Mobile Telematics, Inc. テレマティクスデータに基づく車両分類
EP3759717A4 (en) * 2018-04-09 2021-12-15 Cambridge Mobile Telematics, Inc. VEHICLE CLASSIFICATION BASED ON TELEMATIC DATA
JP7398383B2 (ja) 2018-04-09 2023-12-14 ケンブリッジ モバイル テレマティクス,インク. テレマティクスデータに基づく車両分類
CN110232823A (zh) * 2019-06-14 2019-09-13 重庆大学 一种基于rfid电子车牌数据的慢行车判定分析方法
CN112634489A (zh) * 2020-12-09 2021-04-09 众安在线财产保险股份有限公司 一种基于移动终端的车辆状态确定方法、装置及系统
CN112668172A (zh) * 2020-12-24 2021-04-16 西南交通大学 考虑车型和驾驶风格异质性的跟驰行为建模方法及其模型
CN112668172B (zh) * 2020-12-24 2023-02-28 西南交通大学 考虑车型和驾驶风格异质性的跟驰行为建模方法及其模型

Also Published As

Publication number Publication date
CN106650801B (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
CN102855638B (zh) 基于谱聚类的车辆异常行为检测方法
CN107256635B (zh) 一种智能交通中基于分布式光纤传感的车辆识别方法
CN106650801A (zh) 一种基于gps数据的多类型车辆分类方法
CN100507509C (zh) 基于主成分分析和支持向量机的油气水多相流流型识别方法
CN116644373B (zh) 基于人工智能的汽车流量数据分析管理系统
CN103578227B (zh) 基于gps定位信息的疲劳驾驶检测方法
CN105320966A (zh) 一种车辆行驶状态识别方法及装置
CN103345842B (zh) 一种道路车辆分型系统及方法
CN103743980A (zh) 基于pso优化的svm的电能质量扰动识别与分类方法
CN103552560A (zh) 基于司机驾驶状态识别的车道偏离报警方法
CN104036289A (zh) 一种基于空间-光谱特征和稀疏表达的高光谱图像分类方法
CN106066907B (zh) 基于多零件多模型判断的定损分等级方法
CN103489010A (zh) 基于驾驶行为的疲劳驾驶检测方法
CN104182985A (zh) 遥感图像变化检测方法
CN106845444A (zh) 一种基于弧‑点结合的车载井盖检测方法
CN104688252A (zh) 采用方向盘转角信息的驾驶人疲劳状态检测方法
CN109082984A (zh) 一种基于窗口划分以及动态时间规整的道路异常检测模型
CN104807640A (zh) 基于振动敏感时频特征的空间滚动轴承寿命状态检测方法
CN107274668A (zh) 一种基于车辆检测的道路拥堵建模方法
CN105223561A (zh) 基于空间分布的雷达地面目标鉴别器设计方法
CN109164450A (zh) 一种基于多普勒雷达数据的下击暴流预测方法
CN101251896A (zh) 一种基于多分类器的物体检测系统及方法
CN102519577B (zh) 道路中路面的识别方法及系统
Koh et al. Autonomous road potholes detection on video
CN101320520A (zh) 一种车辆检测方法及其设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant