CN109614887A

CN109614887A - 一种基于支持向量机的汽车鸣笛分类方法

Info

Publication number: CN109614887A
Application number: CN201811405638.8A
Authority: CN
Inventors: 项彬; 马石磊; 陈建峰; 蔺贝; 李晓强; 吴茹
Original assignee: Xi'an Lianfeng Xunsheng Information Technology Co Ltd
Current assignee: Xi'an Lianfeng Xunsheng Information Technology Co Ltd
Priority date: 2018-11-23
Filing date: 2018-11-23
Publication date: 2019-04-12
Anticipated expiration: 2038-11-23
Also published as: CN109614887B

Abstract

本发明提供了一种基于支持向量机的汽车鸣笛分类方法，用空气声呐传感器接收声信号，对接收信号进行分帧加窗处理，提取包括子带能量、子带能量方差、频带总峰度、子带峰度均值、短时平均过零率的五类声信号特征，然后构造决策函数，利用训练样本重复，通过超平面将训练样本分为有鸣笛声和环境噪声，训练出最优超平面分类器；最终接收实测信号，使用最优超平面分类器对汽车鸣笛声与环境噪声分类。本发明能够对马路上汽车鸣笛的声音信号进行准确分类识别。

Description

一种基于支持向量机的汽车鸣笛分类方法

技术领域

本发明属于信号处理领域，涉及机器学习、声呐波束形成、声信号检测等理论。

背景技术

噪声是现代城市的主要污染之一，也是评价汽车环保性能的重要指标。随着中国经济社会持续快速发展，机动车保有量继续保持快速增长态势。截至2017年底，全国机动车保有量达3.10亿辆，其中汽车2.17亿辆。车辆噪声已对城市人民的身体健康和生活构成危害，控制车辆噪声水平是势在必行。各地交警部门投入了大量精力来整治汽车违法鸣笛问题，但治理效果差强人意。究其原因是由于交警部门查处违法鸣笛的方式主要是人工辨别，在嘈杂的马路上人工辨别的难度较大，采样取证更为困难，加剧了交警的执法难度，很难取得理想的效果，利用现代化的智能手段对违法鸣笛车辆进行分类识别具有重大意义。

支持向量机是模式识别与人工智能领域中用于解决分类与回归问题的方法与技术，其自20世纪末期发展至今，已具备一套完整的知识理论体系与结构框架，而且随着近些年人工智能技术飞速的发展与计算机硬件运算能力的升级，关于支持向量机的相关研究仍在不断进步。

支持向量机目前被广泛应用于解决在数据挖掘领域中的一些分类与回归问题，它是一种监督式的机器学习方式，在许多实际分类问题上的表现体现了许多其他分类方法所不具备的优势，能够最小化经验误差与最大化几何边缘区域，尤其在处理小样本高维度数据的分类问题时，支持向量机往往具备更高的判决速率与准确概率。

发明内容

为了克服现有技术的不足，本发明提供一种基于支持向量机的汽车鸣笛分类方法，通过空气声呐传感器接收马路上的声音信号，提取采集到的声音信号的特征信息，实现对马路上汽车鸣笛的声音信号进行准确分类识别，录取鸣笛车辆的喇叭声音作为证据，并根据采集的车辆鸣笛声实时定位，配合高清摄像机可以准确捕捉到违法鸣笛车辆。

本发明解决其技术问题所采用的技术方案包括以下步骤：

第一步，用空气声呐传感器阵列接收声信号，第i个声传感器接收到的信号x_i(t)＝h_i(t)*s(t)+n_i(t)，i＝1，2，…，N，其中，h_i(t)是声源与第i个声传感器之间的环境冲激响应，s(t)代表原始信号，n_i(t)代表环境噪声；

第二步，对接收信号进行分帧加窗处理；

第三步，提取接收信号的以下五类声信号特征；

(1)子带能量其中Y(ω)表示接收信号的傅里叶变换，n、m分别表示关注频带的起始频率与截止频率；

(2)子带能量方差其中S_i表示恒定带宽的第i个子带的频域归一化能量；

(3)频带总峰度其中δ是样本数据的标准差，表示Y(ω)的均值；

(4)子带峰度均值其中K_i表示第i个子带的峰度；

(5)短时平均过零率其中w(n)是窗函数；

第四步，将汽车鸣笛声信号记为u_i＝1，环境噪声信号记为u_i＝-1，则有其中x_i为第三步中接收信号所对应的五个声信号特征组成的特征向量，w为最优分类线的斜率矩阵，b为最优分类线的偏置项；构造决策函数w使得u_i(wx_i+b)＞1成立；

第五步，计算训练样本x_i与超平面之间的欧式距离|u_iy_i|/||w||，所有的训练数据均满足|u_iy_i|/||w||≥δ，其中δ为间隔，同时令δ||w||＝1；则求解最优超平面就是找到满足上式的w的最小欧式范数，则转化为以下优化问题：

式中，ξ_i表示一个具有弹性伸缩的松弛因子，C表示惩罚系数；

第六步，取若干训练样本重复执行第二步至第六步，通过超平面将训练样本分为有鸣笛声和环境噪声，以此训练出最优超平面分类器；

第七步，接收实测信号，执行第二步至第三步，然后使用最优超平面分类器对汽车鸣笛声与环境噪声分类。

所述的松弛因子ξ_i在0到1范围内取值；惩罚系数C的取值为100或200。

所述的训练样本共取5000个。

本发明的有益效果是：能够对马路上的声音信号进行实时监控，准确识别鸣笛声音，并记录采集的车辆鸣笛声音信号，通过后续的定位及抓拍，辅助交警部门执法取证，解决交警治理违法鸣笛事件执法难、取证更难的痛点。可以有效降低违法鸣笛频率，治理汽车鸣笛噪声污染，对于建设绿色、文明、和谐社会具有深远意义。本发明采用了最新的机器学习及人工智能技术，成功的将人工智能技术应用在了智能交通领域，推动了该技术在安防、监控等领域的应用与发展。

附图说明

图1是本发明的方法流程图；

图2是最优化分类线示意图。

具体实施方式

下面结合附图和实施例对本发明进一步说明，本发明包括但不仅限于下述实施例。

针对汽车违法鸣笛取识别率低的问题，本发明提出的基于支持向量机的汽车鸣笛分类方法，步骤如下：

第一步：空气声呐传感器接收信号

用空气声呐传感器接收声信号，第i个声传感器接收到的信号X_i(t)可以表示为：

X_i(t)＝h_i(t)*s(t)+n_i(t)，i＝1，2，…，N (1)

式中*表示卷积运算，h_i(t)是声源与第i个声传感器之间的环境冲激响应。n_i(t)代表环境噪声，不同声传感器间的环境噪声可以是相关的。环境冲激响应h_i(t)包含了声源多径传播的所有信息，接收信号X_i(t)不仅包含原始信号s(t)，还叠加了经过多种途径传播、衰减之后若干反射波与环境噪声。

第二步：信号分帧加窗

对接收信号进行分帧加窗处理，每一帧信号时长0.1s，信号采样率为20480Hz，添加窗长度为128的矩形窗，窗的重叠率为50％。信号预处理时的主要参数如表1所示。

表1信号预处理参数

信号时长(s)	0.1	采样频率(Hz)	20480
				频带范围(Hz)	400～4000	频率分辨率(Hz)	10
子带带宽(Hz)	600	加窗类型	矩形窗
				窗长度	128	重叠率	50％

第三步：特征选取

提取以下五类声信号特征：

(1)子带能量

子带能量是用来描述信号频率分量在指定频段上的能量大小的参数，日常生活中的环境噪声的频率大多集中在较低的频带，其在较高频带的能量较小。以高频带能量作为特征可以滤除绝大部分低频噪声。我们给出子带能量的定义如下：

式中Y(ω)表示接收信号的傅里叶变换，n、m分别表示我们关注频带的起始频率与截止频率。

(2)子带能量方差

子带能量方差用来描述信号在不同频带间频率能量分布的均匀程度。假设把一段信号的整个频段分为m个子带，对于白噪声来说其频率能量在各个子带上应该是分布均匀的，子带能量方差较小，但是对于线谱类信号，由于其频谱是由基频与多个谐波组成，且谐波能量呈递减趋势，因此该类信号在各个子带的频率能量分布差异较大，子带能量方差较大。我们可以定义子带能量方差为：

式中S_i表示恒定带宽的第i个子带的频域归一化能量。

(3)频带总峰度

峰度也称之为峰态系数，用来表征概率密度分布曲线在平均值点峰值高低的特征数，直观来说，峰度可用于描述一组样本数据分布形态的陡缓程度。声信号、发动机噪声的频率分量在整个频带内分布较为平缓，单频信号由于只有单根谱线，分布最为陡峭，而作为目标的线谱类信号的数据分布的平缓程度则介于噪声与单频信号之间，以整个频带的峰度为特征参量，对于单频信号噪声则有很高的区分度。频带峰度的定义为：

式中，δ是样本数据的标准差，因此峰度可以视为样本数据的四阶中心矩与方差平方的比值。

(4)子带峰度均值

子带峰度均值用来描述信号频率分量在不同频带间分布陡峭程度的参量。对于一组信号我们只关注不包含信号主频的频带，将其分为m个子带，对于常见的拍掌声、发动机噪声、环境白噪声，单频信号，我们在去除其频谱上的主频分量后，其子带上的各个频率分量分布都是较为平缓的，此时他们的子带峰度均值较低，但对于包含谐波的线谱类信号，由于各个子带上谐波的存在，这类信号在各个子带上的频率分量的分布仍较为陡峭，他的子带峰度均值则会较高。我们定义子带峰度均值如下：

式中，K_i表示第i个子带的峰度。

(5)短时平均过零率

短时过零率则是信号在时域的特征参量，主要描述了单位时间内信号幅值通过零值得次数。而短时平均过零率则是对一段信号分帧加窗后计算所得每一帧信号短时过零率的平均，可以看作对信号频率规律性的简单度量。短时平均过零率的定义如下：

式中w(n)是窗函数，一般取矩形窗。

第四步：构造决策函数

假设最优分类曲线可用公式7表示。

y_i＝wx_i+b，i＝1...n (7)

其中x_i为第三步中接收信号X_i所对应的五个特征组成的特征向量，w为最优分类线的斜率矩阵，b为最优分类线的偏置项。将有汽车鸣笛声信号记为u_i＝1，环境噪声信号记为u_i＝-1，则有

取合适的w使得u_i(wx_i+b)＞1成立。

第五步：求解最优超平面

为求取最优超平面，计算训练数据的特征向量x_i与超平面之间的欧式距离|u_iy_i|/||w||，则所有的训练数据均满足：

|u_iy_i|/||w||≥δ (9)

式中：δ为间隔，同时令δ||w||＝1。

则求解最优超平面就是找到满足上式的w的最小欧式范数，则转化为以下优化问题：

式中，ξ_i表示一个具有弹性伸缩的松弛因子，其在0到1范围内取值；C表示惩罚系数。他们一起用来调节错误分类点的数量与偏差。常数C的经验取值一般为100或200。

第六步训练分类器

将5000个训练样本执行步骤二到步骤五，通过超平面将训练样本分为有鸣笛声和环境噪声，以此来训练出最优超平面分类器。

第七步：实测信号分类

实际检测中分别执行步骤一到步骤三，再执行步骤六中训练好的分类器，实现对汽车鸣笛声与环境噪声的分类。

Claims

1.一种基于支持向量机的汽车鸣笛分类方法，其特征在于包括以下步骤：

第二步，对接收信号进行分帧加窗处理；

第三步，提取接收信号的以下五类声信号特征；

(3)频带总峰度其中δ是样本数据的标准差，表示Y(ω)的均值；

(4)子带峰度均值其中K_i表示第i个子带的峰度；

(5)短时平均过零率其中w(n)是窗函数；

2.根据权利要求1所述的基于支持向量机的汽车鸣笛分类方法，其特征在于：所述的松弛因子ξ_i在0到1范围内取值；惩罚系数C的取值为100或200。

3.根据权利要求1所述的基于支持向量机的汽车鸣笛分类方法，其特征在于：所述的训练样本共取5000个。