CN100507971C - 基于独立分量分析的车辆声音识别方法 - Google Patents
基于独立分量分析的车辆声音识别方法 Download PDFInfo
- Publication number
- CN100507971C CN100507971C CNB2007101766376A CN200710176637A CN100507971C CN 100507971 C CN100507971 C CN 100507971C CN B2007101766376 A CNB2007101766376 A CN B2007101766376A CN 200710176637 A CN200710176637 A CN 200710176637A CN 100507971 C CN100507971 C CN 100507971C
- Authority
- CN
- China
- Prior art keywords
- vehicle
- vehicles
- vehicle sounds
- component analysis
- various types
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
本发明涉及一种基于独立分量分析的车辆声音识别方法,属于音频处理和模式识别技术领域。其步骤是:对各类车辆声音进行预处理,得到各类车辆声音的频谱,并根据车辆声音的特点对频谱进行了裁减,并将频域的系数变换到对数域,提高了车辆声音识别的鲁棒性;利用独立分量分析来提取车辆声音的特征,能够适应车辆识别的小样本训练特征;将待识别样本在独立分量构成的特征空间上重建,并得到待识别样本与车辆类中心欧几里德距离,并根据这一欧几里德距离对待识别样本归类。本发明可快速、高效的识别车辆声音,特别适用于实时计算环境。可应用于:军事中的通过车辆侦查;民用中的智能交通系统等应用场景。
Description
技术领域
本发明涉及一种基于独立分量分析的车辆声音识别方法,属于音频处理和模式识别技术领域。
背景技术
独立分量分析(Independent Component Analysis,ICA)和主分量分析(PrincipalComponent Analysis,PCA)在模式识别领域中,处理的方法和思路有很多相似之处,这两种方法都可以实现观测数据的线性表示,都可以将数据从高维空间投影到更有意义的低维空间,以达到降维和减少冗余的目的,并进行相应的处理,如数据结构分析、数据特征提取等。按PCA原理做出的分解只能保证分解出来的各分量不相关,不能保证这些分量互相独立(除非它们都是高斯型过程,因为对高斯型不相关便意味着独立)。这就使得这种分解缺少实际意义,因而降低了所提取特征的典型性。在这种情况下,采用ICA来分解独立分量,再从各独立分量中提取有关特征,更有实际意义,也有助于进一步的模式识别。
实验表明,在小样本情况下,ICA比PCA特征抽取的能力要强得多,这证明了ICA特征抽取具有良好的快速性,能够从有限的样本中迅速抽取有效的特征。这主要是由于PCA只利用了样本基于协方差矩阵的二阶统计规律,而ICA则是利用样本的高阶统计规律.从统计的观点,大部分重要的模式信息往往包含在高阶统计特性中:PCA分解出的主分量只是去相关(彼此正交),而ICA不仅实现了PCA的去相关,而且得到的高阶统计量是相互独立的,在统计理论中,独立是比不相关要强得多的条件,统计独立性包含着相关性;PCA建立在高斯性假设的基础上,而ICA建立在非高斯性假设的基础上,在小样本情况下,样本分布的高斯性假设一般是不成立的,这时ICA的特征提取能力明显比PCA好,在大样本情况下,样本分布接近于高斯分布,这时PCA的特征提取能力将得到显著提高.
而在车辆声音的识别中,由于环境对提取声音的影响、车速的快慢、同种类车辆仍存在个体的差异,这使得建立车辆声音的特征库是一个从小样本训练集中提取有效特征的问题。基于车辆声音识别的这一特点,ICA比PCA更加适合车辆声音的识别。
发明内容
本发明的目的是提出一种基于独立分量分析的车辆声音识别方法,它通过声音对车辆进行识别分类,将输出检测到的车辆属于何种车辆类型,或者输出无法进行分类的结果。可用于进行车辆识别分类以及特定车辆的数量统计。
本发明是这样实现的:
基于独立分量分析的车辆声音识别方法利用车辆声音的频域信息来进行车辆的识别分类,包括车辆声音特征库的训练和车辆声音特征识别分类两个过程。其中:
车辆声音特征库的训练过程是监督式训练,对每一个特定种类的车辆都需要预先学习特定车辆的声音。对每种特定车辆声音都进行如下的特征学习过程。
步骤1:利用音频采集装置采集车辆声音信号。音频采集装置的采样频率R可以根据需要的识别精度和计算处理速度决定,但要比人耳的敏感度高(人类能听到的音频大约在20Hz~20KHz)。
步骤2:频谱化前的预处理。首先将声音波形的平均振幅归零化(所谓平均振幅归零化就是将所有采样点的采样值相加等于0,可以通过将所有采样值与一个合适的常量相加来实现波形的平均振幅归零化);将获得的音频数据分成N帧(Fn;n=1,2,...,N),每帧包含M个声音采样点(Sni;n=1,2,...,N;i=1,2,...,M),并且为保证结果的平滑可使每帧与相邻帧之间有L个采样点的重合。再利用预处理海明窗平滑滤波器滤波来减弱吉布斯效应对后面的傅立叶变换的影响。海明窗平滑滤波器具体如下:
步骤3:建立频谱。首先利用快速傅立叶变换将每帧的车辆声音信号变换到频域,本方法仅对信号的功率谱进行处理,为了减小计算量及特征库的大小可以选择前T个功率谱系数( n=1,2,...,N)。最后为了进一步处理的方便对前T个功率谱系数按照式(3)进行归一化处理,即使
步骤4:频谱调整。对频谱进行如下对数化处理:
其中,式(4)中的F1和F2的确定使用以下规则:下面步骤6中PCA降维处理时随着声音特征训练集的增大,声音特征训练集的协方差矩阵的特征值将会变化,F1和F2的选取要使声音特征训练集的协方差矩阵的特征值变化较小。
第二,叙述利用独立分量分析提取车辆声音特征。经过以上的预处理后Φn={φn1,φn2,...,φnT};n=1,2,...,N。以下的车辆声音特征提取和识别过程均基于该功率谱。
步骤5:将Φn;n=1,2,...,N连接为一个N×T维的行向量{φ11,φ12,...,φ1T,φ21,φ22,...,φ2T,......φN1,φN2,...,φNT},对于K个同类车辆声音的训练样本,组成K×N*T矩阵X,样本均值X=E(X)。
步骤6:为了提高识别率可以采取较多的训练样本,这样可以用PCA对其降维,取其前d个主分量,降维后的X为d×N*T矩阵.将X看作是由d个N*T维观测信号向量组成的矩阵,设这组观测信号是由d个独立分量线性混合而成。
步骤7:对X进行独立分量分析,分离出d个独立分量,由这些独立分量u1,u2…ud构成特征空间的一组基,这d个基向量张成的子空间就形成了描述一类车辆声音的特征空间。
步骤8:建立环境噪音类及各种车辆声音的特征库。将环境噪音作为一个类别,为提高识别率可以建立不同的环境噪音类:阴雨天的路边噪音类,阴雨天的野外噪音类,晴朗天的路边噪音类,强风环境噪音类等等。对各种车辆的特征提取也应该在各种典型的环境下采集声音并提取特征来组成一类车辆的特征库。
第三,叙述利用独立分量分析识别车辆声音。
步骤9:对于一个待识别的车辆声音x,按照下面三个公式在所有的声音类别的特征空间中重建其模型。
[a1,a2,…,ad]=(x-X)×(p+)-1,(5)
式(5)为求在某一特征空间去均值后的投影系数,式(6)表示在该特征空间对车辆声音的重建模型,式(7)表示在该特征空间的重建模型和待识别的车辆声音之间的重建误差。其中,(p+)-1为独立分量组成矩阵的伪逆,为在特征空间对待识别的车辆声音x的重建模型,E(x)为重建模型和实际原输入的误差。
对于待识别的车辆声音,如果相对于某个特征空间的重建误差最小,表明这个车辆声音最符合相应特征空间的描述,则对应类即为识别结果。
对于待识别的车辆声音,给定待识别样本x,如果r满足
则待识别的车辆声音样本属于第r类车辆声音模式。
本发明的方法步骤可小结为:
一种基于独立分量分析的车辆声音识别方法,包括以下步骤:
1)对各类车辆声音进行预处理,得到各类车辆声音的频谱;
2)利用独立分量分析方法分别提取各类车辆声音的特征;
3)将待识别样本分别在以独立分量构成的各类车辆的特征空间上重建其模型,分别求取待识别样本与各类车辆的欧几里德距离,将其中距离最小者所对应的模型对应的车辆类别作为识别结果,
其中,预处理步骤1)进一步包括以下子步骤:
1.1)利用音频采集装置采集各类车辆声音信号;
1.2)首先将平均振幅归零化;将获得的音频数据分成N帧并使每帧与相邻帧之间有L个采样点的重合;再对每一帧使用海明窗滤波;
1.3)将每帧的车辆声音信号变换到频域,并得出其功率谱,为了减小计算量及特征库的大小,选择前T个功率谱系数,并对功率谱系数进行归一化处理;
1.4)为了使车辆声音的识别更加鲁棒,将频谱对数化。
所述提取各类车辆声音的特征步骤2)进一步包括以下子步骤:
2.1)将每类车辆声音经过预处理后得到的各帧的功率谱系数连接为行向量,将同类车辆声音的样本组成矩阵X,并记录其样本均值X;
2.2)利用主分量分析方法对矩阵X降维;
2.3)对降维后的矩阵进行独立分量分析,由这些独立分量构成特征空间的一组基,这些基向量张成的子空间就形成了描述一类车辆声音的特征空间;
2.4)将样本均值X和独立分量保存为一类车辆的特征库。
本发明的有益效果是:基于独立分量分析的车辆声音识别方法可以根据车型统计车辆数目,可以用于智能交通或者军事侦察等领域。
附图说明
图1为本发明基于独立分量分析的车辆声音识别方法的原理框图。
具体实施方式:
以下结合附图对本发明作进一步的详细说明。
演示系统的目标是路边车辆分类识别区分轻型车和重型车。
基于独立分量分析的车辆声音识别方法利用车辆声音的频域信息来进行车辆的识别分类,包括车辆声音特征库的训练和车辆声音特征识别分类两个过程,获得经过调整的频谱向量是这两个所共有的处理过程,下文将这一部分的处理过程统一称为预处理过程。
1,预处理过程
步骤1:利用音频采集装置采集车辆声音信号。由于车辆声音90%的能量集中在4000HZ以下,根据采样定理采样频率应不低于8000HZ,这样音频采集装置的采样频率选为22050HZ。
步骤2:频谱化前的预处理。首先将声音波形的平均振幅归零化;将获得的音频数据分成N帧(Fn;n=1,2,...,N),每帧包含4096个声音采样点(Sni;n=1,2,...,N;i=1,2,...,4096),并且为保证结果的平滑可使每帧与相邻帧之间有512个采样点的重合。再利用预处理海明窗平滑滤波器滤波来减弱吉布斯效应对后面的傅立叶变换的影响。海明窗平滑滤波器具体如下:
步骤3:建立频谱。首先利用快速傅立叶变换将每帧的车辆声音信号变换到频域。由于相位信息对于声音识别并不重要,本方法仅对信号的功率谱进行处理,实验表明大多数车辆约80%的能量集中在频率低于2000Hz的范围,约90%的能量集中在频率低于4000Hz的范围。为了减小计算量及特征库的大小可以选择前1200个功率谱系数( n=1,2,...,N)来覆盖5.4HZ-6460Hz的频率范围。最后为了进一步处理的方便对前1200个功率谱系数按照式(11)进行归一化处理。
步骤4:频谱调整。为了使车辆声音的识别更加鲁棒,避免特定的频谱细节左右车辆声音识别的结果,车辆声音特征提取和识别过程需要考虑整个频谱分布。为了达到这一目的对频谱进行如下对数化处理:
其中,F1=10000,F2=100。
2,车辆声音特征库的建立
Φn={φn1,φn2,...,φn1200};n=1,2,...,N,为一个车辆声音样本的一帧(4096个采样点)经过预处理后的功率谱系数,以下的车辆声音特征库的建立基于该功率谱。
步骤1:采集不同车型的声音及噪音。采集环境:阴雨天的路边,晴朗天的路边,强风环境路边;采集车辆的速度:20km/h,80km/h,120km/h,每类车型采集该种类的三部车。这样每一类将有9个训练样本。噪声类采集环境:阴雨天的路边,晴朗天的路边,强风环境路边,将有3个样本。特征库的建立以轻型车的特征库建立为例。
步骤2:将Φn;n=1,2,...,N连接为一个N×1200维的行向量{φ11,φ12,...,φ1,1200,φ21,φ22,...,φ2,1200,......φN1,φN2,...,φN,1200},对于9个同类车辆声音的训练样本,组成9×N*1200矩阵X,样本均值X=E(X)。
步骤3:为了提高识别率可以采取较多的训练样本,这样可以用PCA对其降维,取其前100个主分量,降维后的X为100×N*1200矩阵.将X看作是由100个N*T维观测信号向量组成的矩阵,设这组观测信号是由100个独立分量线性混合而成.
步骤4:对X采用FastICA算法进行独立分量分析,分离出100个独立分量,由这些独立分量u1,u2…u100构成特征空间的一组基,这100个基向量张成的子空间就形成了描述一类车辆声音的特征空间.
步骤5:将X和u1,u2…u100保存作为一类车辆的特征库。
3,识别车辆声音
步骤1:对于一个待识别的车辆声音x,按照下面三个公式分别在轻型车声音类别,重型车声音类别,和噪音类别的特征空间中重建其模型。
[a1,a2,…,a100]=(x-X)×(p+)-1, (13)
式(13)为求在某一特征空间去均值后的投影系数,式(14)表示在该特征空间对车辆声音的重建模型,式(15)表示在该特征空间的重建模型和待识别的车辆声音之间的重建误差。其中,(p+)-1为独立分量组成矩阵的伪逆,x为在特征空间对待识别的车辆声音x的重建模型,E(x)为重建模型和实际原输入的误差。
对于待识别的车辆声音,如果相对于某个特征空间的重建误差最小,表明这个车辆声音最符合相应特征空间的描述,则对应类即为识别结果。
步骤2:对于待识别的车辆声音,给定待识别样本x,如果r满足
则待识别的车辆声音样本属于第r类车辆声音模式。
总结以上说明可知,本发明包括以下步骤:
1)对各类车辆声音进行预处理,得到各类车辆声音的频谱;
2)利用独立分量分析方法分别提取各类车辆声音的特征;
3)将待识别样本分别在以独立分量构成的各类车辆的特征空间上重建其模型,分别求取待识别样本与各类车辆的欧几里德距离,将其中距离最小者所对应的模型对应的车辆类别作为识别结果。
以上实施例仅用以说明而非限制本发明所涉及的技术方案,尽管参照以上较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,本发明的技术方案可以进行修改、变形或者等同替换;而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围之中。
Claims (2)
1.一种基于独立分量分析的车辆声音识别方法,其特征在于包括以下步骤:
1)对各类车辆声音进行预处理,得到各类车辆声音的频谱;
2)利用独立分量分析方法分别提取各类车辆声音的特征;
3)将待识别样本分别在以独立分量构成的各类车辆的特征空间上重建其模型,分别求取待识别样本与各类车辆的欧几里德距离,将其中距离最小者所对应的模型对应的车辆类别作为识别结果,
其中,预处理步骤1)进一步包括以下子步骤:
1.1)利用音频采集装置采集各类车辆声音信号;
1.2)首先将平均振幅归零化;将获得的音频数据分成N帧并使每帧与相邻帧之间有L个采样点的重合;再对每一帧使用海明窗滤波;
1.3)将每帧的车辆声音信号变换到频域,并得出其功率谱,为了减小计算量及特征库的大小,选择前T个功率谱系数,并对功率谱系数进行归一化处理;
1.4)为了使车辆声音的识别更加鲁棒,将频谱对数化。
2.根据权利要求1所述的基于独立分量分析的车辆声音识别方法,其特征在于:
所述提取各类车辆声音的特征步骤2)进一步包括以下子步骤:
2.1)将每类车辆声音经过预处理后得到的各帧的功率谱系数连接为行向量,将同类车辆声音的样本组成矩阵X,并记录其样本均值X;
2.2)利用主分量分析方法对矩阵X降维;
2.3)对降维后的矩阵进行独立分量分析,由这些独立分量构成特征空间的一组基,这些基向量张成的子空间就形成了描述一类车辆声音的特征空间;
2.4)将样本均值X和独立分量保存为一类车辆的特征库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101766376A CN100507971C (zh) | 2007-10-31 | 2007-10-31 | 基于独立分量分析的车辆声音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101766376A CN100507971C (zh) | 2007-10-31 | 2007-10-31 | 基于独立分量分析的车辆声音识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101145280A CN101145280A (zh) | 2008-03-19 |
CN100507971C true CN100507971C (zh) | 2009-07-01 |
Family
ID=39207791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007101766376A Expired - Fee Related CN100507971C (zh) | 2007-10-31 | 2007-10-31 | 基于独立分量分析的车辆声音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100507971C (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102157148A (zh) * | 2010-12-31 | 2011-08-17 | 东莞电子科技大学电子信息工程研究院 | 一种基于dtw语音识别的货车车辆检查方法 |
CN102737514B (zh) * | 2011-11-16 | 2015-11-25 | 刘伟南 | 能发布信息的车辆检测器、堵车检测器、车辆属性检测器 |
CN103456301B (zh) * | 2012-05-28 | 2019-02-12 | 中兴通讯股份有限公司 | 一种基于环境声音的场景识别方法及装置及移动终端 |
CN102982802A (zh) * | 2012-12-06 | 2013-03-20 | 四川大学 | 一种基于实时编码的车辆特征识别算法 |
CN103065627B (zh) * | 2012-12-17 | 2015-07-29 | 中南大学 | 基于dtw与hmm证据融合的特种车鸣笛声识别方法 |
CN103473932B (zh) * | 2013-09-06 | 2016-01-20 | 中山大学 | 一种结合振荡标线的音频信号车型识别系统 |
CN104332162B (zh) * | 2014-11-25 | 2018-05-15 | 武汉大学 | 一种音频信号车辆识别系统 |
CN104637481B (zh) * | 2015-01-22 | 2016-08-24 | 沈阳大学 | 基于lmd及能量投影法的车型音频特征提取方法 |
CN104851301B (zh) * | 2015-05-22 | 2017-01-25 | 重庆交通大学 | 一种基于减速带声音分析的车辆参数识别方法 |
CN107643084B (zh) * | 2016-07-21 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 提供数据对象信息、实景导航方法及装置 |
CN107633684B (zh) * | 2017-11-22 | 2020-11-24 | 河南大学 | 一种用于无人驾驶车的特种车辆识别方法 |
CN109033983A (zh) * | 2018-06-29 | 2018-12-18 | 中国地质大学(北京) | 一种基于独立向量分析和支持向量机的地质灾害次声信号分类识别方法及装置 |
CN109816987B (zh) * | 2019-01-24 | 2022-02-18 | 苏州清听声学科技有限公司 | 一种汽车鸣笛电子警察执法抓拍系统及其抓拍方法 |
CN110176248B (zh) * | 2019-05-23 | 2020-12-22 | 广西交科集团有限公司 | 道路声音识别方法、系统、计算机设备及可读存储介质 |
CN112532941A (zh) * | 2020-11-30 | 2021-03-19 | 南京中科声势智能科技有限公司 | 车辆源强监测方法、装置、电子设备及存储介质 |
CN113538735B (zh) * | 2021-09-13 | 2021-12-07 | 蜂巢能源科技有限公司 | 一种车辆用途识别方法及装置 |
-
2007
- 2007-10-31 CN CNB2007101766376A patent/CN100507971C/zh not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
基于车辆声频信号的车型识别算法研究. 陆伟.长沙硕士学位论文. 2006 |
基于车辆声频信号的车型识别算法研究. 陆伟.长沙硕士学位论文. 2006 * |
车辆声频信号盲分离及遗传算法研究. 谢朋朋.长沙大学硕士学位论文. 2005 |
车辆声频信号盲分离及遗传算法研究. 谢朋朋.长沙大学硕士学位论文. 2005 * |
Also Published As
Publication number | Publication date |
---|---|
CN101145280A (zh) | 2008-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100507971C (zh) | 基于独立分量分析的车辆声音识别方法 | |
CN103971124B (zh) | 一种基于相位同步的多类别运动想象脑电信号分类方法 | |
CN107830996B (zh) | 一种飞行器舵面系统故障诊断方法 | |
CN101587546B (zh) | 基于支持向量多元分类的下肢动作模式的识别方法 | |
CN107301381A (zh) | 基于深度学习和多任务学习策略的雷达辐射源识别方法 | |
CN103150579A (zh) | 一种基于视频序列的人体异常行为检测方法 | |
CN113962259B (zh) | 一种燃料电池系统多模式双层故障诊断方法 | |
CN105841961A (zh) | 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法 | |
CN101763514B (zh) | 基于特征重要度排序谱聚类的图像分割方法 | |
CN103743980A (zh) | 基于pso优化的svm的电能质量扰动识别与分类方法 | |
CN104239900A (zh) | 基于k均值和深度svm的极化sar图像分类方法 | |
CN104036289A (zh) | 一种基于空间-光谱特征和稀疏表达的高光谱图像分类方法 | |
CN111476339B (zh) | 滚动轴承故障特征提取方法、智能诊断方法及系统 | |
CN111488801A (zh) | 基于振动噪声识别的船舶分类方法 | |
CN102915453A (zh) | 一种实时反馈更新的车辆检测方法 | |
CN107478418A (zh) | 一种旋转机械故障特征自动提取方法 | |
CN102509120A (zh) | 基于迁移字典学习的高光谱图像的有监督分割方法 | |
CN102982347A (zh) | 一种基于kl距离的电能质量扰动分类方法 | |
CN105069291A (zh) | 一种基于emd和bp神经网络的电机轴承故障辨识方法 | |
Li et al. | Automatic modulation classification based on bispectrum and CNN | |
CN106548136A (zh) | 一种无线信道场景分类方法 | |
CN105354170A (zh) | 基于ceemd和奇异值分解的识别方法 | |
CN104408472A (zh) | 基于Wishart和SVM的极化SAR图像分类方法 | |
CN114255487A (zh) | 一种半监督射频指纹提取的物联网设备身份认证方法 | |
CN103903017A (zh) | 一种基于自适应软直方图局部二值模式的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090701 Termination date: 20131031 |