CN108681740A - 基于多分类支持向量机的车型分类方法 - Google Patents
基于多分类支持向量机的车型分类方法 Download PDFInfo
- Publication number
- CN108681740A CN108681740A CN201810293372.6A CN201810293372A CN108681740A CN 108681740 A CN108681740 A CN 108681740A CN 201810293372 A CN201810293372 A CN 201810293372A CN 108681740 A CN108681740 A CN 108681740A
- Authority
- CN
- China
- Prior art keywords
- audio
- training
- stage
- short
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 38
- 239000012634 fragment Substances 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 2
- 230000004907 flux Effects 0.000 claims description 2
- 238000012512 characterization method Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 8
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241000533950 Leucojum Species 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于多分类支持向量机的车型分类方法,其特征是,包括以下阶段:(1)在所述线下训练阶段,在实际场景中收集有标注的音频数据构成训练数据集;在训练数据集上对原始音频数据进行预处理,划分得到音频片段;在每个音频片段内划分得到音频帧信号;对音频帧信号计算短时特征;对每一个音频片段内所有音频帧的短时特征计算统计量作为音频片段特征;短时特征和音频片段特征构成了原始音频的特征向量集;(2)训练分类器阶段;(3)在线检测阶段,计算音频数据的短时特征和音频片段特征,将特征向量集送入SVM分类器得到分类结果,采取投票形式得到最终的分类结果。本发明具有分类准确度高、实时性强、集成度高、部署维护方便等优势。
Description
技术领域
本发明涉及一种基于多分类支持向量机的车型分类方法,属于数字信号处理技术领域。
背景技术
车型分类是目前不停车收费系统(Electronic Toll Collection System,ETC)收费的重要依据。目前,全国各省市公路收费中的车辆分类、收费标准和对持卡缴费用户的优惠政策不尽相同。通行联网省市高速公路的机动车辆,需按照所到省市的车型分类、费率标准和相关政策缴纳车辆通行费。依据已有的国家标准对各种车辆进行区分划价,保证高速公路的收费系统准确性,对不同类型的车辆收取不同费用,保证了高速公路收费的合理性与公平性,同时高速公路所收费用也直接反映到高速公路的服务等级、安全性和通达度。根据上述因素,自动车型分类的准确度至关重要。
目前ETC使用的自动车型分类方法主要有三种:环形线圈检测、红外光栅检测和普通视频检测。
(1)环形线圈检测,是一种应用时间最长、技术成熟度高的电磁感应检测技术。其车辆计数、速度测量、车长测量精度都非常高,可应对一般性跨线车辆所造成的检测影响,且不受天气、光线、车速等条件的干扰。其缺点是代价较高,安装时必须按照技术要求切割路面,容易造成路面结构性破损降低道路本身使用寿命,且一旦损坏不容易修复且维修成本较高。
(2)红外光栅检测,是指利用红外线对射原理在车道两侧分别安装红外线发射、接收排柱。当有车辆通过时,部分光栅被车体遮挡而接收不到,则可断定有车辆通过。然而,由于太阳光中含有大量红外线,在特定时间会使特定方向、特定角度的红外线光栅检测器出错或失灵;同时,由于红外线光栅具有散射特性,本车道车体挡住的光栅可能由于相邻车道光束的散射而被照射,可能出现诸如将一辆拖挂车当成两辆车计数的错误,同时红外光栅检测会受雪花、雨水或人员走动等干扰,因而其可靠性较差。
(3)普通视频检测,即普通可见光视频检测系统,该系统以专用的架设在车道上方的一台摄像机视频流为信息输入源,并采用计算机视觉技术进行处理,从而实现对视域内通过车辆的实时检测测量。其缺点是单一检测的准确性极容易受到摄像机架设高度、角度的影响,同时在车速低、车间距小时容易产生车辆前后粘连,不能对多辆车进行有效分割而将多辆车误判为一辆车,从而影响系统检最终的检测精度。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种基于多分类支持向量机的车型分类方法,具有分类准确度高、实时性强、集成度高、部署维护方便等优势。
按照本发明提供的技术方案,所述基于多分类支持向量机的车型分类方法,其特征是,包括以下阶段:
在所述线下训练阶段,先在实际场景中收集大量的有标注的音频数据构成训练数据集;在训练数据集上,对原始音频数据进行预处理,划分得到多个音频片段;在每个音频片段内,划分得到音频帧信号;然后对每一个音频帧信号计算多个短时特征,每一个音频帧对应得到多维特征向量;然后对每一个音频片段内所有音频帧的短时特征计算统计量作为音频片段特征;短时特征和音频片段特征构成了原始音频的特征向量集;
训练分类器阶段,在任意两类样本之间训练一个SVM分类器;
在线检测阶段,计算音频数据的短时特征和音频片段特征,将得到的特征向量集送入上述个SVM分类器得到每个分类器的分类结果;然后对个分类结果,采取投票形式得到最终的分类结果。
进一步地,所述线下训练阶段中采样频率为44.1kHZ。
进一步地,所述线下训练阶段中以1s作为窗口时间划分得到多个音频片段。
进一步地,所述线下训练阶段中在每个音频片段内以50ms作为帧长,划分得到音频帧信号。
进一步地,所述线下训练阶段中对每一个音频帧信号计算34个短时特征,每一个音频帧对应得到34维特征向量。
进一步地,所述短时特征包括过零率、能量、能量熵、频谱质心、频谱延展度、谱熵、频谱通量、频谱滚降点、梅尔频率倒谱系数、色度向量和色度向量标准差。
进一步地,所述训练分类器阶段,采用10折交叉验证,将训练车型样本随机分成10份,随机取其中9份用于训练,1份用于验证,计算分类结果的精确率和召回率,根据F1-Measure来选择最优化的SVM参数;最后,在N个车型类别中两两训练得到个SVM分类器。
本发明所述基于多分类支持向量机的车型分类方法,基于音频信号处理和多分类支持向量机(Multi-Class Support Vector Machine),与传统的车型分类方法相比,该方法具有分类准确度高、实时性强、集成度高、部署维护方便等优势。
附图说明
图1为音频分类器的系统结构图。
具体实施方式
下面结合具体附图对本发明作进一步说明。
本发明所述基于多分类支持向量机的车型分类方法,包括线下训练阶段和在线检测阶段。
在所述线下训练阶段,先在实际场景中以44.1kHZ为采样频率收集大量的有标注的音频数据构成训练数据集;在训练数据集上,对原始音频数据进行预处理,以1s作为窗口时间划分得到多个音频片段;在每个音频片段内,以50ms作为帧长,划分得到音频帧信号;然后对每一个音频帧信号计算34个短时特征(short-term feature),每一个音频帧对应得到34维特征向量,如表1所示详细展示了34个短时特征;然后对每一个音频片段内所有音频帧的短时特征计算统计量(如短时过零率的均值和标准差)作为音频片段特征;短时特征和音频片段特征构成了原始音频的特征向量集。
表1短时特征表
训练分类器阶段,在任意两类样本之间训练一个SVM分类器。训练过程采用10折交叉验证,将训练样本随机分成10份,随机取其中9份用于训练,1份用于验证,计算分类结果的精确率(Precision)和召回率(Recall),根据F1-Measure来选择最优化的SVM参数。最后,在N个车型类别中两两训练得到个SVM分类器。
在线检测阶段,计算音频数据的短时特征和音频片段特征,将得到的特征向量集送入上述个SVM分类器得到每个分类器的分类结果。然后对个分类结果,采取投票形式得到最终的分类结果。
实施例:
实地采集数据:在闸机口处安装麦克风以44.1kHz采样率采集音频,当有车辆通过时记录音频并人工标注车型类别,每种车型采集100份音频数据,构成训练数据集。
音频信号经预处理后提取音频帧的短时特征和音频片段的中期特征构成特征向量集。SVM分类器训练采用一对一法(one-versus-one,OVO SVMs),在任意两类样本之间训练一个SVM。具体做法是,假设有四种车型A、B、C、D四类。在训练时选择A,B;A,C;A,D;B,C;B,D;C,D所对应的样本作为训练集,分别训练得到六个SVM分类器。在测试时,把测试音频分别送入上诉六个SVM分类器,得到六个分类结果。最后采取投票形式,最后得到一组结果。投票过程如下:
A=B=C=D=0;
(A,B)-classifier:如果A win,则A=A+1;否则B=B+1;
(A,C)-classifier:如果A win,则A=A+1;否则C=C+1;
(A,D)-classifier:如果A win,则A=A+1;否则D=D+1;
(B,C)-classifier:如果B win,则B=B+1;否则C=C+1;
(B,D)-classifier:如果B win,则B=B+1;否则D=D+1;
(C,D)-classifier:如果C win,则C=C+1;否则D=D+1;
最终分类结果为Max(A,B,C,D)。
Claims (7)
1.一种基于多分类支持向量机的车型分类方法,其特征是,包括以下阶段:
在所述线下训练阶段,先在实际场景中收集大量的有标注的音频数据构成训练数据集;在训练数据集上,对原始音频数据进行预处理,划分得到多个音频片段;在每个音频片段内,划分得到音频帧信号;然后对每一个音频帧信号计算多个短时特征,每一个音频帧对应得到多维特征向量;然后对每一个音频片段内所有音频帧的短时特征计算统计量作为音频片段特征;短时特征和音频片段特征构成了原始音频的特征向量集;
训练分类器阶段,在任意两类样本之间训练一个SVM分类器;
在线检测阶段,计算音频数据的短时特征和音频片段特征,将得到的特征向量集送入上述个SVM分类器得到每个分类器的分类结果;然后对个分类结果,采取投票形式得到最终的分类结果。
2.如权利要求1所述的基于多分类支持向量机的车型分类方法,其特征是:所述线下训练阶段中采样频率为44.1kHZ。
3.如权利要求1所述的基于多分类支持向量机的车型分类方法,其特征是:所述线下训练阶段中以1s作为窗口时间划分得到多个音频片段。
4.如权利要求1所述的基于多分类支持向量机的车型分类方法,其特征是:所述线下训练阶段中在每个音频片段内以50ms作为帧长,划分得到音频帧信号。
5.如权利要求1所述的基于多分类支持向量机的车型分类方法,其特征是:所述线下训练阶段中对每一个音频帧信号计算34个短时特征,每一个音频帧对应得到34维特征向量。
6.如权利要求5所述的基于多分类支持向量机的车型分类方法,其特征是:所述短时特征包括过零率、能量、能量熵、频谱质心、频谱延展度、谱熵、频谱通量、频谱滚降点、梅尔频率倒谱系数、色度向量和色度向量标准差。
7.如权利要求1所述的基于多分类支持向量机的车型分类方法,其特征是:所述训练分类器阶段,采用10折交叉验证,将训练车型样本随机分成10份,随机取其中9份用于训练,1份用于验证,计算分类结果的精确率和召回率,根据F1-Measure来选择最优化的SVM参数;最后,在N个车型类别中两两训练得到个SVM分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810293372.6A CN108681740A (zh) | 2018-04-04 | 2018-04-04 | 基于多分类支持向量机的车型分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810293372.6A CN108681740A (zh) | 2018-04-04 | 2018-04-04 | 基于多分类支持向量机的车型分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108681740A true CN108681740A (zh) | 2018-10-19 |
Family
ID=63800212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810293372.6A Pending CN108681740A (zh) | 2018-04-04 | 2018-04-04 | 基于多分类支持向量机的车型分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108681740A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1787075A (zh) * | 2005-12-13 | 2006-06-14 | 浙江大学 | 基于内嵌gmm核的支持向量机模型的说话人识别方法 |
CN102426835A (zh) * | 2011-08-30 | 2012-04-25 | 华南理工大学 | 一种基于支持向量机模型的开关柜局部放电信号识别方法 |
CN102682302A (zh) * | 2012-03-12 | 2012-09-19 | 浙江工业大学 | 一种基于关键帧的多特征融合的人体姿态识别方法 |
-
2018
- 2018-04-04 CN CN201810293372.6A patent/CN108681740A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1787075A (zh) * | 2005-12-13 | 2006-06-14 | 浙江大学 | 基于内嵌gmm核的支持向量机模型的说话人识别方法 |
CN102426835A (zh) * | 2011-08-30 | 2012-04-25 | 华南理工大学 | 一种基于支持向量机模型的开关柜局部放电信号识别方法 |
CN102682302A (zh) * | 2012-03-12 | 2012-09-19 | 浙江工业大学 | 一种基于关键帧的多特征融合的人体姿态识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105678852B (zh) | 多车道自由流电子不停车收费车道系统及其车牌识别方法 | |
CN110264734A (zh) | 一种高速公路车辆稽查系统及其工作方法 | |
CN107705564B (zh) | 基于手机定位的高速公路车辆行驶轨迹识别系统及方法 | |
CN105427614A (zh) | 一种车型分类系统及其方法 | |
CN105608431A (zh) | 一种基于车辆数目与车流速度的高速公路拥堵检测方法 | |
CN109830117A (zh) | 道路规划优化方法、装置、计算机设备及存储介质 | |
CN204614213U (zh) | 一种用于可变限速控制系统的交通违法行为证据采集装置 | |
CN105118305A (zh) | 室外停车场出口车辆管理平台 | |
CN108805998A (zh) | 一种高速公路不停车收费系统用etc货车车道 | |
CN103871077A (zh) | 一种道路车辆监控视频中的关键帧提取方法 | |
KR20190106566A (ko) | 자유주행 통행요금징수시스템 및 그 처리 방법 | |
CN110188636A (zh) | 一种etc车辆高速行驶过程中信息自动比对系统及方法 | |
KR101297326B1 (ko) | 하이패스 통합차로 제어 시스템 | |
KR20220051991A (ko) | 듀얼밴드 적외선 카메라를 이용한 승차인원 검지 시스템 및 그 방법 | |
US2646215A (en) | Automatic toll collector device | |
CN109166191A (zh) | 一种通过车牌识别缴费的高速收费系统 | |
CN106023599A (zh) | 一种超高超宽违法抓拍电子警察系统及其控制方法 | |
US6525673B1 (en) | Expressway control system | |
CN107170244A (zh) | 一种智能交通控制方法和设备 | |
CN108681740A (zh) | 基于多分类支持向量机的车型分类方法 | |
CN113256828B (zh) | 一种路侧单元同步系统及同步方法 | |
KR102163504B1 (ko) | 고속도로 제한 차량 단속 시스템에서 면탈 차량 검출을 위한 통행료 면탈 방지 시스템 | |
CN111005647B (zh) | 一种地铁屏蔽门 | |
CN112037350A (zh) | 一种基于分体式rsu的车牌识别方法 | |
KR101262348B1 (ko) | 다차로 기반의 통행료 부과 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 201800 room j1958, building 6, 1288 Yecheng Road, Jiading District, Shanghai Applicant after: Ruan Internet of things Technology Group Co.,Ltd. Address before: No. 501, area a, Liye building, Qingyuan Road, Science Park, taikeyuan University, Xinwu District, Wuxi City, Jiangsu Province, 214135 Applicant before: RUN TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181019 |