CN100507971C

CN100507971C - 基于独立分量分析的车辆声音识别方法

Info

Publication number: CN100507971C
Application number: CNB2007101766376A
Authority: CN
Inventors: 吴威; 曹靖; 耿云霄; 周忠; 赵沁平
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2007-10-31
Filing date: 2007-10-31
Publication date: 2009-07-01
Anticipated expiration: 2027-10-31
Also published as: CN101145280A

Abstract

本发明涉及一种基于独立分量分析的车辆声音识别方法，属于音频处理和模式识别技术领域。其步骤是：对各类车辆声音进行预处理，得到各类车辆声音的频谱，并根据车辆声音的特点对频谱进行了裁减，并将频域的系数变换到对数域，提高了车辆声音识别的鲁棒性；利用独立分量分析来提取车辆声音的特征，能够适应车辆识别的小样本训练特征；将待识别样本在独立分量构成的特征空间上重建，并得到待识别样本与车辆类中心欧几里德距离，并根据这一欧几里德距离对待识别样本归类。本发明可快速、高效的识别车辆声音，特别适用于实时计算环境。可应用于：军事中的通过车辆侦查；民用中的智能交通系统等应用场景。

Description

基于独立分量分析的车辆声音识别方法

技术领域

本发明涉及一种基于独立分量分析的车辆声音识别方法，属于音频处理和模式识别技术领域。

背景技术

独立分量分析(Independent Component Analysis，ICA)和主分量分析(PrincipalComponent Analysis，PCA)在模式识别领域中，处理的方法和思路有很多相似之处，这两种方法都可以实现观测数据的线性表示，都可以将数据从高维空间投影到更有意义的低维空间，以达到降维和减少冗余的目的，并进行相应的处理，如数据结构分析、数据特征提取等。按PCA原理做出的分解只能保证分解出来的各分量不相关，不能保证这些分量互相独立(除非它们都是高斯型过程，因为对高斯型不相关便意味着独立)。这就使得这种分解缺少实际意义，因而降低了所提取特征的典型性。在这种情况下，采用ICA来分解独立分量，再从各独立分量中提取有关特征，更有实际意义，也有助于进一步的模式识别。

实验表明，在小样本情况下，ICA比PCA特征抽取的能力要强得多，这证明了ICA特征抽取具有良好的快速性，能够从有限的样本中迅速抽取有效的特征。这主要是由于PCA只利用了样本基于协方差矩阵的二阶统计规律，而ICA则是利用样本的高阶统计规律.从统计的观点，大部分重要的模式信息往往包含在高阶统计特性中：PCA分解出的主分量只是去相关(彼此正交)，而ICA不仅实现了PCA的去相关，而且得到的高阶统计量是相互独立的，在统计理论中，独立是比不相关要强得多的条件，统计独立性包含着相关性；PCA建立在高斯性假设的基础上，而ICA建立在非高斯性假设的基础上，在小样本情况下，样本分布的高斯性假设一般是不成立的，这时ICA的特征提取能力明显比PCA好，在大样本情况下，样本分布接近于高斯分布，这时PCA的特征提取能力将得到显著提高.

而在车辆声音的识别中，由于环境对提取声音的影响、车速的快慢、同种类车辆仍存在个体的差异，这使得建立车辆声音的特征库是一个从小样本训练集中提取有效特征的问题。基于车辆声音识别的这一特点，ICA比PCA更加适合车辆声音的识别。

发明内容

本发明的目的是提出一种基于独立分量分析的车辆声音识别方法，它通过声音对车辆进行识别分类，将输出检测到的车辆属于何种车辆类型，或者输出无法进行分类的结果。可用于进行车辆识别分类以及特定车辆的数量统计。

本发明是这样实现的：

基于独立分量分析的车辆声音识别方法利用车辆声音的频域信息来进行车辆的识别分类，包括车辆声音特征库的训练和车辆声音特征识别分类两个过程。其中：

车辆声音特征库的训练过程是监督式训练，对每一个特定种类的车辆都需要预先学习特定车辆的声音。对每种特定车辆声音都进行如下的特征学习过程。

步骤1：利用音频采集装置采集车辆声音信号。音频采集装置的采样频率R可以根据需要的识别精度和计算处理速度决定，但要比人耳的敏感度高(人类能听到的音频大约在20Hz~20KHz)。

步骤2：频谱化前的预处理。首先将声音波形的平均振幅归零化(所谓平均振幅归零化就是将所有采样点的采样值相加等于0，可以通过将所有采样值与一个合适的常量相加来实现波形的平均振幅归零化)；将获得的音频数据分成N帧(F_n；n＝1，2，...，N)，每帧包含M个声音采样点(S_ni；n＝1，2，...，N；i＝1，2，...，M)，并且为保证结果的平滑可使每帧与相邻帧之间有L个采样点的重合。再利用预处理海明窗平滑滤波器滤波来减弱吉布斯效应对后面的傅立叶变换的影响。海明窗平滑滤波器具体如下：

w_{i} = 0.54 - 0.46 \cos (2 π \frac{i}{M - 1}), i = 0,1, . . ., M - 1 - - - (1)

x_{ni}^{'} = x_{ni} w_{i},

n＝1，2，...，N；i＝1，2，...，M

步骤3：建立频谱。首先利用快速傅立叶变换将每帧的车辆声音信号变换到频域，本方法仅对信号的功率谱进行处理，为了减小计算量及特征库的大小可以选择前T个功率谱系数(

Φ_{n}^{''} = {φ_{n 1}^{''}, φ_{n 2}^{''}, . . ., φ_{nT}^{''}};

n＝1，2，...，N)。最后为了进一步处理的方便对前T个功率谱系数按照式(3)进行归一化处理，即使

Σ_{i = 0}^{T} φ_{ni}^{'} = 1 .

Φ_{n}^{'} = {φ_{n 1}^{'}, φ_{n 2}^{'}, . . ., φ_{nT}^{'}} = {\frac{φ_{n 1}^{''}}{Σ_{i = 0}^{T} φ_{ni}^{''}}, \frac{φ_{n 2}^{''}}{Σ_{i = 0}^{T} φ_{ni}^{''}}, . . ., \frac{φ_{nT}^{''}}{Σ_{i = 0}^{T} φ_{ni}^{''}}}; n = 1,2, . . ., N, i = 1,2, . . ., T - - - (3)

步骤4：频谱调整。对频谱进行如下对数化处理：

φ_{ni} = F_{2} \lg (F_{1} φ_{ni}^{'} + 1); n = 1,2, . . ., N, i = 1,2, . . ., T - - - (4)

其中，式(4)中的F₁和F₂的确定使用以下规则：下面步骤6中PCA降维处理时随着声音特征训练集的增大，声音特征训练集的协方差矩阵的特征值将会变化，F₁和F₂的选取要使声音特征训练集的协方差矩阵的特征值变化较小。

第二，叙述利用独立分量分析提取车辆声音特征。经过以上的预处理后Φ_n＝{φ_n1，φ_n2，...，φ_nT}；n＝1，2，...，N。以下的车辆声音特征提取和识别过程均基于该功率谱。

步骤5：将Φ_n；n＝1，2，...，N连接为一个N×T维的行向量{φ₁₁，φ₁₂，...，φ_1T，φ₂₁，φ₂₂，...，φ_2T，......φ_N1，φ_N2，...，φ_NT}，对于K个同类车辆声音的训练样本，组成K×N*T矩阵X，样本均值X＝E(X)。

步骤6：为了提高识别率可以采取较多的训练样本，这样可以用PCA对其降维，取其前d个主分量，降维后的X为d×N*T矩阵.将X看作是由d个N*T维观测信号向量组成的矩阵，设这组观测信号是由d个独立分量线性混合而成。

步骤7：对X进行独立分量分析，分离出d个独立分量，由这些独立分量u1，u2…ud构成特征空间的一组基，这d个基向量张成的子空间就形成了描述一类车辆声音的特征空间。

步骤8：建立环境噪音类及各种车辆声音的特征库。将环境噪音作为一个类别，为提高识别率可以建立不同的环境噪音类：阴雨天的路边噪音类，阴雨天的野外噪音类，晴朗天的路边噪音类，强风环境噪音类等等。对各种车辆的特征提取也应该在各种典型的环境下采集声音并提取特征来组成一类车辆的特征库。

第三，叙述利用独立分量分析识别车辆声音。

步骤9：对于一个待识别的车辆声音x，按照下面三个公式在所有的声音类别的特征空间中重建其模型。

[a₁，a₂，…，a_d]＝(x-X)×(p⁺)^-1，(5)

\tilde{x} = Σ_{i = 1}^{d} a_{i} u_{i} + \overset{&OverBar;}{X}, - - - (6)

E (x) = {| | x - \tilde{x} | |}^{2}, - - - (7)

式(5)为求在某一特征空间去均值后的投影系数，式(6)表示在该特征空间对车辆声音的重建模型，式(7)表示在该特征空间的重建模型和待识别的车辆声音之间的重建误差。其中，(p⁺)^-1为独立分量组成矩阵的伪逆，

为在特征空间对待识别的车辆声音x的重建模型，E(x)为重建模型和实际原输入的误差。

对于待识别的车辆声音，如果相对于某个特征空间的重建误差最小，表明这个车辆声音最符合相应特征空间的描述，则对应类即为识别结果。

对于待识别的车辆声音，给定待识别样本x，如果r满足

E^{r} (x) = \min_{r} {E^{i} (x)} - - - (8)

则待识别的车辆声音样本属于第r类车辆声音模式。

本发明的方法步骤可小结为：

一种基于独立分量分析的车辆声音识别方法，包括以下步骤：

1)对各类车辆声音进行预处理，得到各类车辆声音的频谱；

2)利用独立分量分析方法分别提取各类车辆声音的特征；

3)将待识别样本分别在以独立分量构成的各类车辆的特征空间上重建其模型，分别求取待识别样本与各类车辆的欧几里德距离，将其中距离最小者所对应的模型对应的车辆类别作为识别结果，

其中，预处理步骤1)进一步包括以下子步骤：

1.1)利用音频采集装置采集各类车辆声音信号；

1.2)首先将平均振幅归零化；将获得的音频数据分成N帧并使每帧与相邻帧之间有L个采样点的重合；再对每一帧使用海明窗滤波；

1.3)将每帧的车辆声音信号变换到频域，并得出其功率谱，为了减小计算量及特征库的大小，选择前T个功率谱系数，并对功率谱系数进行归一化处理；

1.4)为了使车辆声音的识别更加鲁棒，将频谱对数化。

所述提取各类车辆声音的特征步骤2)进一步包括以下子步骤：

2.1)将每类车辆声音经过预处理后得到的各帧的功率谱系数连接为行向量，将同类车辆声音的样本组成矩阵X，并记录其样本均值X；

2.2)利用主分量分析方法对矩阵X降维；

2.3)对降维后的矩阵进行独立分量分析，由这些独立分量构成特征空间的一组基，这些基向量张成的子空间就形成了描述一类车辆声音的特征空间；

2.4)将样本均值X和独立分量保存为一类车辆的特征库。

本发明的有益效果是：基于独立分量分析的车辆声音识别方法可以根据车型统计车辆数目，可以用于智能交通或者军事侦察等领域。

附图说明

图1为本发明基于独立分量分析的车辆声音识别方法的原理框图。

具体实施方式：

以下结合附图对本发明作进一步的详细说明。

演示系统的目标是路边车辆分类识别区分轻型车和重型车。

基于独立分量分析的车辆声音识别方法利用车辆声音的频域信息来进行车辆的识别分类，包括车辆声音特征库的训练和车辆声音特征识别分类两个过程，获得经过调整的频谱向量是这两个所共有的处理过程，下文将这一部分的处理过程统一称为预处理过程。

1，预处理过程

步骤1：利用音频采集装置采集车辆声音信号。由于车辆声音90％的能量集中在4000HZ以下，根据采样定理采样频率应不低于8000HZ，这样音频采集装置的采样频率选为22050HZ。

步骤2：频谱化前的预处理。首先将声音波形的平均振幅归零化；将获得的音频数据分成N帧(F_n；n＝1，2，...，N)，每帧包含4096个声音采样点(S_ni；n＝1，2，...，N；i＝1，2，...，4096)，并且为保证结果的平滑可使每帧与相邻帧之间有512个采样点的重合。再利用预处理海明窗平滑滤波器滤波来减弱吉布斯效应对后面的傅立叶变换的影响。海明窗平滑滤波器具体如下：

w_{i} = 0.54 - 0.46 \cos (2 π \frac{i}{4095}), i = 0,1, . . ., 4095 - - - (9)

x_{ni}^{'} = x_{ni} w_{i},

n＝1，2，...，N；i＝1，2，...，4096 (10)

步骤3：建立频谱。首先利用快速傅立叶变换将每帧的车辆声音信号变换到频域。由于相位信息对于声音识别并不重要，本方法仅对信号的功率谱进行处理，实验表明大多数车辆约80％的能量集中在频率低于2000Hz的范围，约90％的能量集中在频率低于4000Hz的范围。为了减小计算量及特征库的大小可以选择前1200个功率谱系数(

Φ_{n}^{''} = {φ_{n 1}^{''}, φ_{n 2}^{''}, . . ., φ_{n 1200}^{''}};

n＝1，2，...，N)来覆盖5.4HZ-6460Hz的频率范围。最后为了进一步处理的方便对前1200个功率谱系数按照式(11)进行归一化处理。

Φ_{n}^{'} = {φ_{n 1}^{'}, φ_{n 2}^{'}, . . ., φ_{n 1200}^{'}} = {\frac{φ_{n 1}^{''}}{Σ_{i = 0}^{1200} φ_{ni}^{''}}, \frac{φ_{n 2}^{''}}{Σ_{i = 0}^{1200} φ_{ni}^{''}}, . . ., \frac{φ_{n 1200}^{''}}{Σ_{i = 0}^{1200} φ_{ni}^{''}}}; n = 1,2, . . ., N, i = 1,2, . . ., 1200 - - - (11)

步骤4：频谱调整。为了使车辆声音的识别更加鲁棒，避免特定的频谱细节左右车辆声音识别的结果，车辆声音特征提取和识别过程需要考虑整个频谱分布。为了达到这一目的对频谱进行如下对数化处理：

φ_{ni} = F_{2} \lg (F_{1} φ_{ni}^{'} + 1); n = 1,2, . . ., N, i = 1,2, . . ., 1200 - - - (12)

其中，F₁＝10000，F₂＝100。

2，车辆声音特征库的建立

Φ_n＝{φ_n1，φ_n2，...，φ_n1200}；n＝1，2，...，N，为一个车辆声音样本的一帧(4096个采样点)经过预处理后的功率谱系数，以下的车辆声音特征库的建立基于该功率谱。

步骤1：采集不同车型的声音及噪音。采集环境：阴雨天的路边，晴朗天的路边，强风环境路边；采集车辆的速度：20km/h，80km/h，120km/h，每类车型采集该种类的三部车。这样每一类将有9个训练样本。噪声类采集环境：阴雨天的路边，晴朗天的路边，强风环境路边，将有3个样本。特征库的建立以轻型车的特征库建立为例。

步骤2：将Φ_n；n＝1，2，...，N连接为一个N×1200维的行向量{φ₁₁，φ₁₂，...，φ_1，1200，φ₂₁，φ₂₂，...，φ_2，1200，......φ_N1，φ_N2，...，φ_N，1200}，对于9个同类车辆声音的训练样本，组成9×N*1200矩阵X，样本均值X＝E(X)。

步骤3：为了提高识别率可以采取较多的训练样本，这样可以用PCA对其降维，取其前100个主分量，降维后的X为100×N*1200矩阵.将X看作是由100个N*T维观测信号向量组成的矩阵，设这组观测信号是由100个独立分量线性混合而成.

步骤4：对X采用FastICA算法进行独立分量分析，分离出100个独立分量，由这些独立分量u₁，u₂…u₁₀₀构成特征空间的一组基，这100个基向量张成的子空间就形成了描述一类车辆声音的特征空间.

步骤5：将X和u₁，u₂…u₁₀₀保存作为一类车辆的特征库。

3，识别车辆声音

步骤1：对于一个待识别的车辆声音x，按照下面三个公式分别在轻型车声音类别，重型车声音类别，和噪音类别的特征空间中重建其模型。

[a₁，a₂，…，a₁₀₀]＝(x-X)×(p⁺)^-1， (13)

\tilde{x} = Σ_{i = 1}^{100} a_{i} u_{i} + \overset{&OverBar;}{X}, - - - (14)

E (x) = {| | x - \tilde{x} | |}^{2}, - - - (15)

式(13)为求在某一特征空间去均值后的投影系数，式(14)表示在该特征空间对车辆声音的重建模型，式(15)表示在该特征空间的重建模型和待识别的车辆声音之间的重建误差。其中，(p⁺)^-1为独立分量组成矩阵的伪逆，x为在特征空间对待识别的车辆声音x的重建模型，E(x)为重建模型和实际原输入的误差。

步骤2：对于待识别的车辆声音，给定待识别样本x，如果r满足

E^{r} (x) = \min_{r} {E^{i} (x)} - - - (16)

则待识别的车辆声音样本属于第r类车辆声音模式。

总结以上说明可知，本发明包括以下步骤：

1)对各类车辆声音进行预处理，得到各类车辆声音的频谱；

2)利用独立分量分析方法分别提取各类车辆声音的特征；

3)将待识别样本分别在以独立分量构成的各类车辆的特征空间上重建其模型，分别求取待识别样本与各类车辆的欧几里德距离，将其中距离最小者所对应的模型对应的车辆类别作为识别结果。

以上实施例仅用以说明而非限制本发明所涉及的技术方案，尽管参照以上较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，本发明的技术方案可以进行修改、变形或者等同替换；而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的权利要求范围之中。

Claims

1.一种基于独立分量分析的车辆声音识别方法，其特征在于包括以下步骤：

1)对各类车辆声音进行预处理，得到各类车辆声音的频谱；

2)利用独立分量分析方法分别提取各类车辆声音的特征；

其中，预处理步骤1)进一步包括以下子步骤：

1.1)利用音频采集装置采集各类车辆声音信号；

1.4)为了使车辆声音的识别更加鲁棒，将频谱对数化。

2.根据权利要求1所述的基于独立分量分析的车辆声音识别方法，其特征在于：

2.2)利用主分量分析方法对矩阵X降维；

2.4)将样本均值X和独立分量保存为一类车辆的特征库。