CN109614887A - 一种基于支持向量机的汽车鸣笛分类方法 - Google Patents
一种基于支持向量机的汽车鸣笛分类方法 Download PDFInfo
- Publication number
- CN109614887A CN109614887A CN201811405638.8A CN201811405638A CN109614887A CN 109614887 A CN109614887 A CN 109614887A CN 201811405638 A CN201811405638 A CN 201811405638A CN 109614887 A CN109614887 A CN 109614887A
- Authority
- CN
- China
- Prior art keywords
- signal
- whistle
- kurtosis
- ambient noise
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明提供了一种基于支持向量机的汽车鸣笛分类方法,用空气声呐传感器接收声信号,对接收信号进行分帧加窗处理,提取包括子带能量、子带能量方差、频带总峰度、子带峰度均值、短时平均过零率的五类声信号特征,然后构造决策函数,利用训练样本重复,通过超平面将训练样本分为有鸣笛声和环境噪声,训练出最优超平面分类器;最终接收实测信号,使用最优超平面分类器对汽车鸣笛声与环境噪声分类。本发明能够对马路上汽车鸣笛的声音信号进行准确分类识别。
Description
技术领域
本发明属于信号处理领域,涉及机器学习、声呐波束形成、声信号检测等理论。
背景技术
噪声是现代城市的主要污染之一,也是评价汽车环保性能的重要指标。随着中国经济社会持续快速发展,机动车保有量继续保持快速增长态势。截至2017年底,全国机动车保有量达3.10亿辆,其中汽车2.17亿辆。车辆噪声已对城市人民的身体健康和生活构成危害,控制车辆噪声水平是势在必行。各地交警部门投入了大量精力来整治汽车违法鸣笛问题,但治理效果差强人意。究其原因是由于交警部门查处违法鸣笛的方式主要是人工辨别,在嘈杂的马路上人工辨别的难度较大,采样取证更为困难,加剧了交警的执法难度,很难取得理想的效果,利用现代化的智能手段对违法鸣笛车辆进行分类识别具有重大意义。
支持向量机是模式识别与人工智能领域中用于解决分类与回归问题的方法与技术,其自20世纪末期发展至今,已具备一套完整的知识理论体系与结构框架,而且随着近些年人工智能技术飞速的发展与计算机硬件运算能力的升级,关于支持向量机的相关研究仍在不断进步。
支持向量机目前被广泛应用于解决在数据挖掘领域中的一些分类与回归问题,它是一种监督式的机器学习方式,在许多实际分类问题上的表现体现了许多其他分类方法所不具备的优势,能够最小化经验误差与最大化几何边缘区域,尤其在处理小样本高维度数据的分类问题时,支持向量机往往具备更高的判决速率与准确概率。
发明内容
为了克服现有技术的不足,本发明提供一种基于支持向量机的汽车鸣笛分类方法,通过空气声呐传感器接收马路上的声音信号,提取采集到的声音信号的特征信息,实现对马路上汽车鸣笛的声音信号进行准确分类识别,录取鸣笛车辆的喇叭声音作为证据,并根据采集的车辆鸣笛声实时定位,配合高清摄像机可以准确捕捉到违法鸣笛车辆。
本发明解决其技术问题所采用的技术方案包括以下步骤:
第一步,用空气声呐传感器阵列接收声信号,第i个声传感器接收到的信号xi(t)=hi(t)*s(t)+ni(t),i=1,2,…,N,其中,hi(t)是声源与第i个声传感器之间的环境冲激响应,s(t)代表原始信号,ni(t)代表环境噪声;
第二步,对接收信号进行分帧加窗处理;
第三步,提取接收信号的以下五类声信号特征;
(1)子带能量其中Y(ω)表示接收信号的傅里叶变换,n、m分别表示关注频带的起始频率与截止频率;
(2)子带能量方差其中Si表示恒定带宽的第i个子带的频域归一化能量;
(3)频带总峰度其中δ是样本数据的标准差,表示Y(ω)的均值;
(4)子带峰度均值其中Ki表示第i个子带的峰度;
(5)短时平均过零率其中w(n)是窗函数;
第四步,将汽车鸣笛声信号记为ui=1,环境噪声信号记为ui=-1,则有其中xi为第三步中接收信号所对应的五个声信号特征组成的特征向量,w为最优分类线的斜率矩阵,b为最优分类线的偏置项;构造决策函数w使得ui(wxi+b)>1成立;
第五步,计算训练样本xi与超平面之间的欧式距离|uiyi|/||w||,所有的训练数据均满足|uiyi|/||w||≥δ,其中δ为间隔,同时令δ||w||=1;则求解最优超平面就是找到满足上式的w的最小欧式范数,则转化为以下优化问题:
式中,ξi表示一个具有弹性伸缩的松弛因子,C表示惩罚系数;
第六步,取若干训练样本重复执行第二步至第六步,通过超平面将训练样本分为有鸣笛声和环境噪声,以此训练出最优超平面分类器;
第七步,接收实测信号,执行第二步至第三步,然后使用最优超平面分类器对汽车鸣笛声与环境噪声分类。
所述的松弛因子ξi在0到1范围内取值;惩罚系数C的取值为100或200。
所述的训练样本共取5000个。
本发明的有益效果是:能够对马路上的声音信号进行实时监控,准确识别鸣笛声音,并记录采集的车辆鸣笛声音信号,通过后续的定位及抓拍,辅助交警部门执法取证,解决交警治理违法鸣笛事件执法难、取证更难的痛点。可以有效降低违法鸣笛频率,治理汽车鸣笛噪声污染,对于建设绿色、文明、和谐社会具有深远意义。本发明采用了最新的机器学习及人工智能技术,成功的将人工智能技术应用在了智能交通领域,推动了该技术在安防、监控等领域的应用与发展。
附图说明
图1是本发明的方法流程图;
图2是最优化分类线示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
针对汽车违法鸣笛取识别率低的问题,本发明提出的基于支持向量机的汽车鸣笛分类方法,步骤如下:
第一步:空气声呐传感器接收信号
用空气声呐传感器接收声信号,第i个声传感器接收到的信号Xi(t)可以表示为:
Xi(t)=hi(t)*s(t)+ni(t),i=1,2,…,N (1)
式中*表示卷积运算,hi(t)是声源与第i个声传感器之间的环境冲激响应。ni(t)代表环境噪声,不同声传感器间的环境噪声可以是相关的。环境冲激响应hi(t)包含了声源多径传播的所有信息,接收信号Xi(t)不仅包含原始信号s(t),还叠加了经过多种途径传播、衰减之后若干反射波与环境噪声。
第二步:信号分帧加窗
对接收信号进行分帧加窗处理,每一帧信号时长0.1s,信号采样率为20480Hz,添加窗长度为128的矩形窗,窗的重叠率为50%。信号预处理时的主要参数如表1所示。
表1信号预处理参数
信号时长(s) | 0.1 | 采样频率(Hz) | 20480 |
频带范围(Hz) | 400~4000 | 频率分辨率(Hz) | 10 |
子带带宽(Hz) | 600 | 加窗类型 | 矩形窗 |
窗长度 | 128 | 重叠率 | 50% |
第三步:特征选取
提取以下五类声信号特征:
(1)子带能量
子带能量是用来描述信号频率分量在指定频段上的能量大小的参数,日常生活中的环境噪声的频率大多集中在较低的频带,其在较高频带的能量较小。以高频带能量作为特征可以滤除绝大部分低频噪声。我们给出子带能量的定义如下:
式中Y(ω)表示接收信号的傅里叶变换,n、m分别表示我们关注频带的起始频率与截止频率。
(2)子带能量方差
子带能量方差用来描述信号在不同频带间频率能量分布的均匀程度。假设把一段信号的整个频段分为m个子带,对于白噪声来说其频率能量在各个子带上应该是分布均匀的,子带能量方差较小,但是对于线谱类信号,由于其频谱是由基频与多个谐波组成,且谐波能量呈递减趋势,因此该类信号在各个子带的频率能量分布差异较大,子带能量方差较大。我们可以定义子带能量方差为:
式中Si表示恒定带宽的第i个子带的频域归一化能量。
(3)频带总峰度
峰度也称之为峰态系数,用来表征概率密度分布曲线在平均值点峰值高低的特征数,直观来说,峰度可用于描述一组样本数据分布形态的陡缓程度。声信号、发动机噪声的频率分量在整个频带内分布较为平缓,单频信号由于只有单根谱线,分布最为陡峭,而作为目标的线谱类信号的数据分布的平缓程度则介于噪声与单频信号之间,以整个频带的峰度为特征参量,对于单频信号噪声则有很高的区分度。频带峰度的定义为:
式中,δ是样本数据的标准差,因此峰度可以视为样本数据的四阶中心矩与方差平方的比值。
(4)子带峰度均值
子带峰度均值用来描述信号频率分量在不同频带间分布陡峭程度的参量。对于一组信号我们只关注不包含信号主频的频带,将其分为m个子带,对于常见的拍掌声、发动机噪声、环境白噪声,单频信号,我们在去除其频谱上的主频分量后,其子带上的各个频率分量分布都是较为平缓的,此时他们的子带峰度均值较低,但对于包含谐波的线谱类信号,由于各个子带上谐波的存在,这类信号在各个子带上的频率分量的分布仍较为陡峭,他的子带峰度均值则会较高。我们定义子带峰度均值如下:
式中,Ki表示第i个子带的峰度。
(5)短时平均过零率
短时过零率则是信号在时域的特征参量,主要描述了单位时间内信号幅值通过零值得次数。而短时平均过零率则是对一段信号分帧加窗后计算所得每一帧信号短时过零率的平均,可以看作对信号频率规律性的简单度量。短时平均过零率的定义如下:
式中w(n)是窗函数,一般取矩形窗。
第四步:构造决策函数
假设最优分类曲线可用公式7表示。
yi=wxi+b,i=1...n (7)
其中xi为第三步中接收信号Xi所对应的五个特征组成的特征向量,w为最优分类线的斜率矩阵,b为最优分类线的偏置项。将有汽车鸣笛声信号记为ui=1,环境噪声信号记为ui=-1,则有
取合适的w使得ui(wxi+b)>1成立。
第五步:求解最优超平面
为求取最优超平面,计算训练数据的特征向量xi与超平面之间的欧式距离|uiyi|/||w||,则所有的训练数据均满足:
|uiyi|/||w||≥δ (9)
式中:δ为间隔,同时令δ||w||=1。
则求解最优超平面就是找到满足上式的w的最小欧式范数,则转化为以下优化问题:
式中,ξi表示一个具有弹性伸缩的松弛因子,其在0到1范围内取值;C表示惩罚系数。他们一起用来调节错误分类点的数量与偏差。常数C的经验取值一般为100或200。
第六步训练分类器
将5000个训练样本执行步骤二到步骤五,通过超平面将训练样本分为有鸣笛声和环境噪声,以此来训练出最优超平面分类器。
第七步:实测信号分类
实际检测中分别执行步骤一到步骤三,再执行步骤六中训练好的分类器,实现对汽车鸣笛声与环境噪声的分类。
Claims (3)
1.一种基于支持向量机的汽车鸣笛分类方法,其特征在于包括以下步骤:
第一步,用空气声呐传感器阵列接收声信号,第i个声传感器接收到的信号xi(t)=hi(t)*s(t)+ni(t),i=1,2,…,N,其中,hi(t)是声源与第i个声传感器之间的环境冲激响应,s(t)代表原始信号,ni(t)代表环境噪声;
第二步,对接收信号进行分帧加窗处理;
第三步,提取接收信号的以下五类声信号特征;
(1)子带能量其中Y(ω)表示接收信号的傅里叶变换,n、m分别表示关注频带的起始频率与截止频率;
(2)子带能量方差其中Si表示恒定带宽的第i个子带的频域归一化能量;
(3)频带总峰度其中δ是样本数据的标准差,表示Y(ω)的均值;
(4)子带峰度均值其中Ki表示第i个子带的峰度;
(5)短时平均过零率其中w(n)是窗函数;
第四步,将汽车鸣笛声信号记为ui=1,环境噪声信号记为ui=-1,则有其中xi为第三步中接收信号所对应的五个声信号特征组成的特征向量,w为最优分类线的斜率矩阵,b为最优分类线的偏置项;构造决策函数w使得ui(wxi+b)>1成立;
第五步,计算训练样本xi与超平面之间的欧式距离|uiyi|/||w||,所有的训练数据均满足|uiyi|/||w||≥δ,其中δ为间隔,同时令δ||w||=1;则求解最优超平面就是找到满足上式的w的最小欧式范数,则转化为以下优化问题:
式中,ξi表示一个具有弹性伸缩的松弛因子,C表示惩罚系数;
第六步,取若干训练样本重复执行第二步至第六步,通过超平面将训练样本分为有鸣笛声和环境噪声,以此训练出最优超平面分类器;
第七步,接收实测信号,执行第二步至第三步,然后使用最优超平面分类器对汽车鸣笛声与环境噪声分类。
2.根据权利要求1所述的基于支持向量机的汽车鸣笛分类方法,其特征在于:所述的松弛因子ξi在0到1范围内取值;惩罚系数C的取值为100或200。
3.根据权利要求1所述的基于支持向量机的汽车鸣笛分类方法,其特征在于:所述的训练样本共取5000个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811405638.8A CN109614887B (zh) | 2018-11-23 | 2018-11-23 | 一种基于支持向量机的汽车鸣笛分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811405638.8A CN109614887B (zh) | 2018-11-23 | 2018-11-23 | 一种基于支持向量机的汽车鸣笛分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109614887A true CN109614887A (zh) | 2019-04-12 |
CN109614887B CN109614887B (zh) | 2022-09-23 |
Family
ID=66004935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811405638.8A Active CN109614887B (zh) | 2018-11-23 | 2018-11-23 | 一种基于支持向量机的汽车鸣笛分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614887B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110136745A (zh) * | 2019-05-08 | 2019-08-16 | 西北工业大学 | 一种基于卷积神经网络的汽车鸣笛识别方法 |
CN111161754A (zh) * | 2019-11-19 | 2020-05-15 | 南京理工大学 | 基于深度聚类的车辆鸣笛声分类方法及系统 |
CN113205830A (zh) * | 2021-05-08 | 2021-08-03 | 南京师范大学 | 一种基于子带谱熵法和pso-ga-svm的汽车鸣笛识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065627A (zh) * | 2012-12-17 | 2013-04-24 | 中南大学 | 基于dtw与hmm证据融合的特种车鸣笛声识别方法 |
US9008329B1 (en) * | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
CN104916289A (zh) * | 2015-06-12 | 2015-09-16 | 哈尔滨工业大学 | 行车噪声环境下快速声学事件的检测方法 |
CN105810212A (zh) * | 2016-03-07 | 2016-07-27 | 合肥工业大学 | 一种复杂噪声环境下的列车鸣笛识别方法 |
-
2018
- 2018-11-23 CN CN201811405638.8A patent/CN109614887B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9008329B1 (en) * | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
CN103065627A (zh) * | 2012-12-17 | 2013-04-24 | 中南大学 | 基于dtw与hmm证据融合的特种车鸣笛声识别方法 |
CN104916289A (zh) * | 2015-06-12 | 2015-09-16 | 哈尔滨工业大学 | 行车噪声环境下快速声学事件的检测方法 |
CN105810212A (zh) * | 2016-03-07 | 2016-07-27 | 合肥工业大学 | 一种复杂噪声环境下的列车鸣笛识别方法 |
Non-Patent Citations (1)
Title |
---|
张小梅等: "基于支持向量机模型的环境音分类研究", 《电子测量技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110136745A (zh) * | 2019-05-08 | 2019-08-16 | 西北工业大学 | 一种基于卷积神经网络的汽车鸣笛识别方法 |
CN111161754A (zh) * | 2019-11-19 | 2020-05-15 | 南京理工大学 | 基于深度聚类的车辆鸣笛声分类方法及系统 |
CN113205830A (zh) * | 2021-05-08 | 2021-08-03 | 南京师范大学 | 一种基于子带谱熵法和pso-ga-svm的汽车鸣笛识别方法 |
CN113205830B (zh) * | 2021-05-08 | 2024-05-07 | 南京师范大学 | 一种基于子带谱熵法和pso-ga-svm的汽车鸣笛识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109614887B (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105513605B (zh) | 手机麦克风的语音增强系统和语音增强方法 | |
Alonso et al. | Automatic anuran identification using noise removal and audio activity detection | |
CN103280220B (zh) | 一种实时的婴儿啼哭声识别方法 | |
CN103646649B (zh) | 一种高效的语音检测方法 | |
CN106653032B (zh) | 低信噪比环境下基于多频带能量分布的动物声音检测方法 | |
CN109614887A (zh) | 一种基于支持向量机的汽车鸣笛分类方法 | |
CN107393555B (zh) | 一种低信噪比异常声音信号的检测系统及检测方法 | |
CN109949823A (zh) | 一种基于dwpt-mfcc与gmm的车内异响识别方法 | |
CN106297770A (zh) | 基于时频域统计特征提取的自然环境声音识别方法 | |
CN103632677B (zh) | 带噪语音信号处理方法、装置及服务器 | |
CN104916289A (zh) | 行车噪声环境下快速声学事件的检测方法 | |
CN110136745A (zh) | 一种基于卷积神经网络的汽车鸣笛识别方法 | |
Wang et al. | ia-PNCC: Noise Processing Method for Underwater Target Recognition Convolutional Neural Network. | |
Huang et al. | Intelligent feature extraction and classification of anuran vocalizations | |
CN110444230A (zh) | 一种基于音频技术的肉鸡呼吸道疾病自动识别装置 | |
CN105448291A (zh) | 基于语音的帕金森症检测方法及检测系统 | |
CN106558308A (zh) | 一种互联网音频数据质量自动打分系统及方法 | |
CN105845149A (zh) | 声音信号中主音高的获取方法及系统 | |
CN110807585A (zh) | 一种学员课堂学习状态在线评估方法及系统 | |
CN112634882B (zh) | 端到端实时语音端点检测神经网络模型、训练方法 | |
CN106872171A (zh) | 一种多普勒声学信号的自适应学习校正方法 | |
Duan et al. | Acoustic component detection for automatic species recognition in environmental monitoring | |
Au et al. | Neural network modeling of a dolphin’s sonar discrimination capabilities | |
Manikanta et al. | Deep learning based effective baby crying recognition method under indoor background sound environments | |
Permana et al. | Implementation of constant-q transform (CQT) and mel spectrogram to converting bird’s sound |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |