CN104361887A - 行车噪声环境下的快速声学事件检测系统 - Google Patents
行车噪声环境下的快速声学事件检测系统 Download PDFInfo
- Publication number
- CN104361887A CN104361887A CN201410668501.7A CN201410668501A CN104361887A CN 104361887 A CN104361887 A CN 104361887A CN 201410668501 A CN201410668501 A CN 201410668501A CN 104361887 A CN104361887 A CN 104361887A
- Authority
- CN
- China
- Prior art keywords
- submodule
- acoustic events
- wind
- uproar
- detection system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
行车噪声环境下的快速声学事件检测系统,涉及快速声学事件检测系统。本发明为了解决现有的声学事件检测系统在行车环境下系统识别率较低的问题。行车噪声环境下的快速声学事件检测系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;该系统对于行车环境下不可避免的风噪具有较好的抗噪能力,在各种风噪条件下检测性能具有鲁棒性;在相同的风噪条件下,本发明比现有的声学事件检测系统的识别率提高20%-30%。本发明适用于快速声学事件的检测。
Description
技术领域
本发明涉及快速声学事件检测系统,属于多媒体信息处理技术领域。
背景技术
无人车研究的核心内容之一即是智能行为决策,而智能行为决策的前提则是其行驶过程中对周边环境的自动感知。感知环境信息的手段可以有多种,其中视听觉信息的自动感知在无人车的行驶中起着重要的作用,但是外部世界与无人车间的很多交互信息还有很多是基于声音的,而这些及行车环境下的声学事件,具体如警车和救护车的警笛声、铁路道口的警笛声、各种车辆提示避让的鸣笛声等,感知周围这些基于声音的交互信息,并做出正确的智能决策对无人车而言至关重要。
无人车在投入实际应用之前,存在两个无可避免的问题:风噪和实时性。首先,行车环境属于开放噪声环境,车辆行驶中与气流摩擦形成较风噪,并且车速越快风噪越强;风噪变化无规律,经常覆盖目标声学事件,导致信号信噪比降低。过滤信号中的风噪,提高目标声学事件的强度,是声学事件检测至关重要的一步。其次在行车环境下,无人车高速行驶,如果无人车处理紧急声学事件有较大延时,反映迟钝,或者处理错误,没有正确相应,就会酿造交通事故,造成重大损失。所以,无人车需要对发生的特定声学事件做出正确、实时的响应,同时兼顾性能和速度两方面需求。此行车噪声环境下的快速声学事件检测系统,应用过滤风噪和快速识别声学事件的算法,很好的解决了这两个问题,为无人车实验平台的控制和管理提供有益的帮助信息,推动无人车投入实用。
发明内容
本发明为了解决现有的声学事件检测系统在行车环境下系统识别率较低的问题。进而提出了一种行车噪声环境下的快速声学事件检测系统。
行车噪声环境下的快速声学事件检测系统,包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;
所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;
该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;
所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;
所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;
所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐帧传送到AWeighting加权子模块;
所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用AWeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;
所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;
所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
本发明提出了一种目标声学事件检测系统,该系统对于行车环境下不可避免的风噪具有较好的抗噪能力,在各种风噪条件下检测性能具有鲁棒性;在相同的风噪条件下,本发明比现有的声学事件检测系统的识别率提高20%-30%。
附图说明
图1为本发明中行车噪声环境下的快速声学事件检测系统的组成结构图。
具体实施方式
具体实施方式一:结合图1说明本实施方式,行车噪声环境下的快速声学事件检测系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;
所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;
该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;
所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;
所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;
所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐帧传送到AWeighting加权子模块;
所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用AWeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;
所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;
所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
针对本发明行车噪声环境下的快速声学事件检测系统的各个功能模块的运行进一步阐述如下:
在声音采集和预处理子模块中,采用梅尔子带能量来刻画声音的频谱轮廓;去噪子模块利用信号频谱的低频部分主要与风噪有关的特性,以及高频部分中的噪声成分随着低频能量的增强而增强的这种相关性,采用径向基函数神经网络做为风噪的预测模型,用高斯函数作为隐藏层节点的映射函数,用声音信号的低频子带向量作为输入,风噪的高频子带向量作为输出,即用信号的低频子带能量去预测噪声的高频子带能量;然后采用谱减的方法,在信号的高频子带能量中减除预测得到的风噪的对应子带能量;而风噪预测所采用的径向基函数神经网络模型由风噪模型训练模块训练给出,依据用户给出的风噪数据通过梯度训练算法训练得到;AWeighting加权子模块采用一种基于人耳等响度曲线A加权滤波器对去噪处理后的声音的频谱轮廓进行加权,即用事先存储的人耳等响度曲线A加权滤波器曲线去修正各子带能量,使识别器的输入尽量与人类听觉系统的输入相一致,从而使识别器的识别结果与人类判别结果更加一致;
声学事件模型训练模块依据用户提交的声音语料,同时生成了声学事件模板和声学事件SVM模型两套识别模型,声学事件模板是通过一个自动聚类分析算法得到,该算法的聚类准则是在保证聚类结果中的每个聚类对其它聚类具有较好的可区分性的条件下,保证其对背景数据也具有最好可区分性;然后每个聚类产生一个声学事件模板;声学事件SVM模型则利用用户提交的声学事件的声音语料作为正例,用提交的背景数据作为反例,采用高斯径向基核函数,通过SVM训练算法训练得到;在特征提取子模块中,首先利用声学事件模板限定特征提取时的分析窗尺寸和子带范围,然后通过显著性分析手段提取待识别声音频谱和声学事件模板频谱上的主要变化轨迹,并计算两者的相似性,并依据变化轨迹信息和相似性信息来构造识别特征;在SVM模型识别子模块中,将特征提取子模块中得到的声学统计特征输入到声学事件SVM模型进行识别判决,最后得到识别结果作为检测结果输出。
具体实施方式二:所述声音语料包括声学事件语料、反例语料和背景语料。
其它步骤及参数与具体实施方式一相同。
Claims (2)
1.行车噪声环境下的快速声学事件检测系统,其特征在于该系统包括:声学事件模型训练模块、风噪模型训练模块和识别检测模块;所述的识别检测模块包括声音采集和预处理子模块、去噪子模块、AWeighting加权子模块、特征提取子模块及SVM模型识别子模块;
所述的声学事件模型训练模块,用于支持在识别检测模块实现声学事件的检测;
该模块用于读取用户提交的声音语料训练该声学事件的SVM模型,输出为该事件的声学事件模板文件和声学事件SVM模型文件;声学事件模板文件用于与特征提取子模块的对比,声学事件SVM模型文件用做SVM模型识别子模块的识别依据;
所述的风噪模型训练模块,用于依据用户提交的风噪语料训练得到风噪RBF模型,该模块的输出为特定格式的风噪模型文件,在指定路径下用此模型文件替换去噪子模块中的历史风噪模型文件,使去噪子模块支持新的风噪模型;
所述的声音采集和预处理子模块,用于控制声卡和麦克风实现声音采集,得到和缓冲音频数据,对数据分帧、加窗,再进行频谱变换和梅尔子带划分,最后对数据进行规格化,并以帧为单位将各帧的梅尔子带能量传送给去噪子模块;
所述的去噪子模块,根据待识别音频数据中的低频子带能量,用风噪RBF模型估计高频子带中的噪声能量,然后用谱减法去除梅尔子带能量中的风噪成分,并将去噪后梅尔子带能量逐帧传送到AWeighting加权子模块;
所述的AWeighting加权子模块,根据人耳在感知声音响度方面的听觉机理,用AWeighting加权方法对梅尔子带能量进行加权,达到把音频信号映射到真实的人耳听觉领域,加权后的梅尔子带能量被传送到特征提取子模块;
所述的特征提取子模块,用于对分析窗内的音频进行分析和特征提取,分析窗由若干帧数据组成,对不同的声学事件,用相应的声学事件模板定位其主要活动频带和时长,然后提取其上升/下降单元,并计算此段信号与声学事件模板的相似度,把这特征拼接起来作为特征向量;分析窗不断向前滑动,每一窗提取一个特征向量并送SVM模型识别子模块进行识别判决;
所述的SVM模型识别子模块,用于根据相应的声学事件SVM模型,基于特征向量判定是否为目标声学事件,并在一定时间尺度上对识别结果进行平滑和整合,然后作为检测结果输出。
2.根据权利要求1所述行车噪声环境下的快速声学事件检测系统,其特征在于:所述声音语料包括声学事件语料、反例语料和背景语料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410668501.7A CN104361887A (zh) | 2014-11-20 | 2014-11-20 | 行车噪声环境下的快速声学事件检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410668501.7A CN104361887A (zh) | 2014-11-20 | 2014-11-20 | 行车噪声环境下的快速声学事件检测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104361887A true CN104361887A (zh) | 2015-02-18 |
Family
ID=52529143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410668501.7A Pending CN104361887A (zh) | 2014-11-20 | 2014-11-20 | 行车噪声环境下的快速声学事件检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104361887A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104916289A (zh) * | 2015-06-12 | 2015-09-16 | 哈尔滨工业大学 | 行车噪声环境下快速声学事件的检测方法 |
CN106992002A (zh) * | 2016-01-21 | 2017-07-28 | 福特全球技术公司 | 用于改进含噪语音识别的动态声学模型切换 |
CN107738622A (zh) * | 2017-08-29 | 2018-02-27 | 科大讯飞股份有限公司 | 车辆智能响应方法及装置、存储介质、电子设备 |
CN110718093A (zh) * | 2019-10-16 | 2020-01-21 | 联想(北京)有限公司 | 针对车辆鸣笛的处理方法和第一车辆 |
CN111742365A (zh) * | 2018-02-28 | 2020-10-02 | 罗伯特·博世有限公司 | 用于监控系统中的音频事件检测的系统和方法 |
CN112992182A (zh) * | 2021-02-10 | 2021-06-18 | 东风汽车集团股份有限公司 | 车辆风噪水平测试系统及其测试方法 |
CN114697786A (zh) * | 2020-12-28 | 2022-07-01 | Oppo广东移动通信有限公司 | 风噪抑制方式确定方法、装置、终端及存储介质 |
CN117690303A (zh) * | 2024-02-04 | 2024-03-12 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020013702A1 (en) * | 2000-06-26 | 2002-01-31 | Lee Soo Young | Efficient voice recognition system based on auditory model |
CN1764947A (zh) * | 2003-03-27 | 2006-04-26 | 摩托罗拉公司 | 用于增大音频感觉音警报的方法与系统 |
CN102033927A (zh) * | 2010-12-15 | 2011-04-27 | 哈尔滨工业大学 | 一种基于gpu实现的快速音频检索方法 |
CN102509545A (zh) * | 2011-09-21 | 2012-06-20 | 哈尔滨工业大学 | 一种实时声学事件检测系统及检测方法 |
-
2014
- 2014-11-20 CN CN201410668501.7A patent/CN104361887A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020013702A1 (en) * | 2000-06-26 | 2002-01-31 | Lee Soo Young | Efficient voice recognition system based on auditory model |
CN1764947A (zh) * | 2003-03-27 | 2006-04-26 | 摩托罗拉公司 | 用于增大音频感觉音警报的方法与系统 |
CN102033927A (zh) * | 2010-12-15 | 2011-04-27 | 哈尔滨工业大学 | 一种基于gpu实现的快速音频检索方法 |
CN102509545A (zh) * | 2011-09-21 | 2012-06-20 | 哈尔滨工业大学 | 一种实时声学事件检测系统及检测方法 |
Non-Patent Citations (3)
Title |
---|
刘智勇,赵晓芳: "基于改进的RBF神经网络的高速公路交通事件检测", 《公路交通科技》 * |
朱华强,郑铁然,韩纪庆: "行车环境下基于二值语谱图的声学事件检测", 《第十二届全国人机语音通信学术会议》 * |
李驰新: "《硕士学位论文》", 30 September 2014 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104916289A (zh) * | 2015-06-12 | 2015-09-16 | 哈尔滨工业大学 | 行车噪声环境下快速声学事件的检测方法 |
CN106992002A (zh) * | 2016-01-21 | 2017-07-28 | 福特全球技术公司 | 用于改进含噪语音识别的动态声学模型切换 |
CN107738622A (zh) * | 2017-08-29 | 2018-02-27 | 科大讯飞股份有限公司 | 车辆智能响应方法及装置、存储介质、电子设备 |
CN111742365A (zh) * | 2018-02-28 | 2020-10-02 | 罗伯特·博世有限公司 | 用于监控系统中的音频事件检测的系统和方法 |
CN111742365B (zh) * | 2018-02-28 | 2023-04-18 | 罗伯特·博世有限公司 | 用于监控系统中的音频事件检测的系统和方法 |
US11810435B2 (en) | 2018-02-28 | 2023-11-07 | Robert Bosch Gmbh | System and method for audio event detection in surveillance systems |
CN110718093A (zh) * | 2019-10-16 | 2020-01-21 | 联想(北京)有限公司 | 针对车辆鸣笛的处理方法和第一车辆 |
CN114697786A (zh) * | 2020-12-28 | 2022-07-01 | Oppo广东移动通信有限公司 | 风噪抑制方式确定方法、装置、终端及存储介质 |
CN112992182A (zh) * | 2021-02-10 | 2021-06-18 | 东风汽车集团股份有限公司 | 车辆风噪水平测试系统及其测试方法 |
CN117690303A (zh) * | 2024-02-04 | 2024-03-12 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
CN117690303B (zh) * | 2024-02-04 | 2024-04-26 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104361887A (zh) | 行车噪声环境下的快速声学事件检测系统 | |
CN104916289A (zh) | 行车噪声环境下快速声学事件的检测方法 | |
CN104332159B (zh) | 一种车载语音操作系统人机互动方法及装置 | |
CN102163427B (zh) | 一种基于环境模型的音频异常事件检测方法 | |
CN102999161B (zh) | 一种语音唤醒模块的实现方法及应用 | |
CN111354371B (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
CN105662797B (zh) | 一种智能物联网导盲杖 | |
WO2021159987A1 (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
CN108735203A (zh) | 语音交互方法、终端及计算机可读介质 | |
CN106340309A (zh) | 一种基于深度学习的狗叫情感识别方法及装置 | |
Xu et al. | ER: Early recognition of inattentive driving leveraging audio devices on smartphones | |
US9733346B1 (en) | Method for providing sound detection information, apparatus detecting sound around vehicle, and vehicle including the same | |
CN111667818A (zh) | 一种训练唤醒模型的方法及装置 | |
CN110880328B (zh) | 到站提醒方法、装置、终端及存储介质 | |
WO2021115232A1 (zh) | 到站提醒方法、装置、终端及存储介质 | |
CN107945793A (zh) | 一种语音激活检测方法及装置 | |
CN108492819A (zh) | 语言练习方法、装置、智能车载终端及存储介质 | |
CN115081473A (zh) | 一种多特征融合的制动噪声分类识别方法 | |
CN110970020A (zh) | 一种利用声纹提取有效语音信号的方法 | |
CN112951271A (zh) | 一种基于声学辅助的隧道交通安全警示方法、系统 | |
CN118173094B (zh) | 结合动态时间规整的唤醒词识别方法、装置、设备及介质 | |
Taherifard et al. | Attention-based event characterization for scarce vehicular sensing data | |
CN113793624B (zh) | 一种声学场景分类方法 | |
CN112015261A (zh) | 一种智能终端驾驶模式识别方法 | |
CN114360204A (zh) | 一种基于区块链的网联汽车信息安全通信系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150218 |