CN106548781A - 一种用于语音识别系统消除背景噪音的方法 - Google Patents
一种用于语音识别系统消除背景噪音的方法 Download PDFInfo
- Publication number
- CN106548781A CN106548781A CN201510603809.8A CN201510603809A CN106548781A CN 106548781 A CN106548781 A CN 106548781A CN 201510603809 A CN201510603809 A CN 201510603809A CN 106548781 A CN106548781 A CN 106548781A
- Authority
- CN
- China
- Prior art keywords
- noise
- sound
- background noise
- speech recognition
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种用于语音识别系统消除背景噪音的方法,包括如下步骤:步骤一:捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;步骤二:捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2;步骤三:计算(x1+y1):(x2+y2);步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。本发明的方法大大提高语音识别系统对于人声指令的正确识别效率。
Description
技术领域
本发明涉及一种用于语音识别系统消除背景噪音的方法,属于音频处理领域。
背景技术
当前背景噪音降噪技术分为主动降噪和被动降噪技术。
首先介绍一下被动降噪的原理:
被动式降噪,就是通过加装隔音、吸音材料,阻断声波传递、吸收声波能量,实现人耳听觉系统只能接收到合法传递声音信息,这种降噪技术也可以称作物理技术降噪。被动式降噪耳麦通常是通过加装耳机的外罩,如海绵体或橡胶体等,以达到吸收声波和阻断声波传递的效果,让人耳可以听到纯净的音乐等耳机播报的声音。
这种被动降噪技术的缺陷是,对于采集声音的系统来说,是无法实行被动降噪的,也就是说,对于听众是人耳可以采用被动降噪,对于听众是一套电子系统,则无法采用被动降噪技术。另外,被动降噪技术对于外界高频噪音隔阻吸收效果较好,但对于低频噪音的阻隔效果就比较差。
由于被动降噪的这些不足,为了获得更好的听觉效果,主动降噪技术应运而生。
主动降噪技术包括两部分技术和工作。第一部分,识别噪音;第二部分,消除噪音。
第一部分:识别噪音。在识别噪音的技术上,当前通常的做法是通过其降噪系统进行“噪音采样”,采样的噪音一般是持续的、相对稳定的、规律性的、信号特征不明显的声音信息,这种噪音一般称作背景噪音,例如一个配送中心的叉车声、说话声、自动分拣机械声、喇叭声、手推车声、风扇声等等集合混合成的嗡嗡噪音。经过采样后,系统将后期采集的声音信号与样本进行比较,与样本相同的波形音频信息被识别为噪音。并采用“样本减法”的方式消除噪音。
第二部分:消除噪音。在消除噪音的技术上,当前通常的做法是采用“样本减法”的方式。“样本减法”的方式,就是将采集到的声音信息总和减去噪音信息,余下的就是我们需要的合法声音信息。具体做法是利用听筒采集外界的声波信息,然后将该信息传递给算法芯片,算法芯片运算后发出用以抵消噪声信息的电信号,该电信号通过一个声波发声器发出与噪音相对应的声音,即相位相反、振幅相同的声波,该声波与噪音声波相遇后发生湮灭,从而在人耳听觉器官的附近形成一道噪音防御屏障,人耳就听不到噪音了。
这种技术通常的做法是在系统上加装一块降噪电路芯片,并在系统上安装一块电池提供电源。因此主动降噪技术也可以称作有源消声降噪。一般降噪的范围是:100至1000HZ。降噪深度一般在12至18分贝。
这种技术的缺陷和不足:在实际应用中,该技术降噪是采用的声波抵消,这样的情况下,常常因为运算问题或工艺问题,导致环境噪声没有抵消而是产生了加强。原因之一是由于延时引起相位的改变,随着频率的升高而增大,形成对噪音的加强,甚至引起啸叫。其次,高频部份相位快速翻转,电子系统对快速翻转的信号无法进行同步补偿。再次,这种降噪技术也很难对较低频的噪音进行消除,因为一般应用场景的小型喇叭很难产生足够的低频能量,用以抵消低频背景噪声。
另一方面,由于主动降噪系统发出的声波不可能完全与噪音抵消,对于采集声音的电子系统来说,会获得不间断更多的主动反噪音信息,也就是说,对于听众是人耳可以智能区分有效声音信息,对于听众是一套电子系统,会将过滤后接收到的所有音频信息视为合法有效的信息进行识别,因此必然造成错误识别。例如,一个作业人员对系统说:5,而附近有叉车喇叭等噪音,在反相消音系统发出的声波抵消了大部分背景噪音,但却未能完全抵消叉车喇叭的声音,此时语音识别系统捕捉到这个未能过滤掉的音频信息,并混合作业人员发出的5的声音,此时系统对音频信息识别为8,因此发生错误。
发明内容
本发明的目的在于提供一种用于语音识别系统消除背景噪音的方法,以解决上述问题。
本发明采用了如下技术方案:
一种用于语音识别系统消除背景噪音的方法,其特征在于:
步骤一:近嘴端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;
步骤二:近耳端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2,x1=x2,y1:y2>1;
步骤三:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);
步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;
步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。
进一步,本发明的用于语音识别系统消除背景噪音的方法,还可以具有这样的特征:其中,步骤四中,噪音消除的方法直接通过电路生成反相声波电信号将滤出的噪音信号进行湮灭。
进一步,本发明的用于语音识别系统消除背景噪音的方法,还可以具有这样的特征:步骤四中,提取的分母音频特征为:声强、音频、相位、波幅。
发明的有益效果
根据本发明的用于语音识别系统消除背景噪音的方法,本发明提供一种用于语音识别系统消除背景噪音的方法,该方法大大提高语音识别系统对于人声指令的正确识别效率。
本发明克服了现有降噪技术的不足,能够实现更为理想的降噪效果,尤其是向以电子语音识别系统为听众的对象,提供降噪后的音频信息,能够实现电子系统高效识别合法的人声命令,减少错误识别。
本发明可以广泛应用于物流分拣、专业设备维护、安检巡查等行业领域,上述行业作业中,具有相对固定的操作流程,采用语音交互系统完成作业的,本发明方法均可应用于该语音识别系统中,以帮助提高识别合法身份人向语音系统传达的声音指令。保证在工业环境下,满足生产的实际需要,以提高劳动生产的效率。对于提高工业信息化、提高工业作业效率具有广泛的实用价值。
附图说明
图1是双通道降噪语音识别耳麦的主视图;
图2是双通道降噪语音识别耳麦的内侧结构示意图;
图3是双通道降噪语音识别耳麦的内部结构示意图;
图4是用于语音识别系统消除背景噪音的方法的流程图。
具体实施方式
以下结合附图和具体实施例对本发明做进一步的描述。
本发明的消除背景噪音的方法,可以使用以下的硬件来进行实施。如图1、图2和图3所示,双通道降噪语音识别耳麦的主要组件包括:
近嘴端听筒组件10,近耳端听筒组件21,运算芯片组件22,电池组件23。近耳端听筒组件21,负责收集背景噪音。
近嘴端听筒组件10,负责收集合法人声命令和非法人声命令或突发噪音。
运算芯片组件22上具有一个背景噪音音频过滤电路,用于运算识别背景噪音,并发出与背景噪音相位相反、振幅相同的反相声波电信号,以湮灭噪音。
运算芯片组件22上还集成有一个突发噪音音频过滤电路,用于运算识别靠近人的嘴巴附近听筒收集到的非法人声和突发噪音,并发出与突发噪音相位相反、振幅相同的反相声波电信号,以湮灭噪音。
电池组件23,为两个音频运算电路提供电源。
利用上述结构的双通道降噪耳麦,再按照如下流程进行噪音识别、消除,和还原主音。
如图4所示,用于语音识别系统消除背景噪音的方法的工作过程:
步骤S201:近嘴端听筒捕捉噪音声源,即图中的声源一,发出的背景噪音,设背景噪音的声强为x1。
步骤S202:听嘴端听筒捕捉主音源,即图中的声源二,发出的指令声音,设指令声音的声强为y1;步骤S201和步骤S202的采集音频的动作同时进行。
步骤S203:近耳端听筒捕捉噪音声源发出的背景噪音,背景噪音的声强设为x2;
步骤S204:主音源发出的指令声音,指令声音的声强设为y2,则:x1=x2,y1:y2>1;步骤S203和步骤S204的采集音频的动作也同时进行。
步骤S205:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);
步骤S206:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;
步骤S207:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。
Claims (3)
1.一种用于语音识别系统消除背景噪音的方法,其特征在于,包括以下步骤:
步骤一:近嘴端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;
步骤二:近耳端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2,x1=x2,y1:y2>1;
步骤三:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);
步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;
步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。
2.如权利要求1所述的用于语音识别系统消除背景噪音的方法,其特征在于:
其中,步骤四中,噪音消除的方法直接通过电路生成反相声波电信号将滤出的噪音信号进行湮灭。
3.如权利要求1所述的用于语音识别系统消除背景噪音的方法,其特征在于:
步骤四中,提取的分母音频特征为:声强、音频、相位、波幅。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603809.8A CN106548781A (zh) | 2015-09-21 | 2015-09-21 | 一种用于语音识别系统消除背景噪音的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603809.8A CN106548781A (zh) | 2015-09-21 | 2015-09-21 | 一种用于语音识别系统消除背景噪音的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106548781A true CN106548781A (zh) | 2017-03-29 |
Family
ID=58364339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510603809.8A Pending CN106548781A (zh) | 2015-09-21 | 2015-09-21 | 一种用于语音识别系统消除背景噪音的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106548781A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218882A (zh) * | 2018-08-16 | 2019-01-15 | 歌尔科技有限公司 | 耳机的环境声音监听方法及耳机 |
CN109346066A (zh) * | 2018-09-26 | 2019-02-15 | 珠海格力电器股份有限公司 | 一种语音降噪的方法及装置 |
CN109389970A (zh) * | 2018-12-28 | 2019-02-26 | 合肥凯捷技术有限公司 | 一种语音分析识别方法 |
CN111161719A (zh) * | 2018-11-08 | 2020-05-15 | 联想新视界(北京)科技有限公司 | 一种通过语音操作的ar眼镜及通过语音操作ar眼镜的方法 |
CN112992144A (zh) * | 2021-04-21 | 2021-06-18 | 国网浙江省电力有限公司金华供电公司 | 应用于电力领域的智能语音调控方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1391688A (zh) * | 1999-09-27 | 2003-01-15 | 杰贝尔合作有限责任公司 | 采用双话筒回声抵销的噪声抑制系统 |
US20050177364A1 (en) * | 2002-10-11 | 2005-08-11 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
CN1737905A (zh) * | 2004-08-18 | 2006-02-22 | 华为技术有限公司 | 一种语音通信终端背景噪声的消除装置及方法 |
CN202584716U (zh) * | 2012-01-06 | 2012-12-05 | 苏州辰戈电子有限公司 | 多变量空气振动消降噪设备 |
CN103873625A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市中兴移动通信有限公司 | 一种增强接收语音响度的方法、装置和移动终端 |
-
2015
- 2015-09-21 CN CN201510603809.8A patent/CN106548781A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1391688A (zh) * | 1999-09-27 | 2003-01-15 | 杰贝尔合作有限责任公司 | 采用双话筒回声抵销的噪声抑制系统 |
US20050177364A1 (en) * | 2002-10-11 | 2005-08-11 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
CN1737905A (zh) * | 2004-08-18 | 2006-02-22 | 华为技术有限公司 | 一种语音通信终端背景噪声的消除装置及方法 |
CN202584716U (zh) * | 2012-01-06 | 2012-12-05 | 苏州辰戈电子有限公司 | 多变量空气振动消降噪设备 |
CN103873625A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市中兴移动通信有限公司 | 一种增强接收语音响度的方法、装置和移动终端 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218882A (zh) * | 2018-08-16 | 2019-01-15 | 歌尔科技有限公司 | 耳机的环境声音监听方法及耳机 |
CN109346066A (zh) * | 2018-09-26 | 2019-02-15 | 珠海格力电器股份有限公司 | 一种语音降噪的方法及装置 |
CN109346066B (zh) * | 2018-09-26 | 2021-04-16 | 珠海格力电器股份有限公司 | 一种语音降噪的方法及装置 |
CN111161719A (zh) * | 2018-11-08 | 2020-05-15 | 联想新视界(北京)科技有限公司 | 一种通过语音操作的ar眼镜及通过语音操作ar眼镜的方法 |
CN109389970A (zh) * | 2018-12-28 | 2019-02-26 | 合肥凯捷技术有限公司 | 一种语音分析识别方法 |
CN112992144A (zh) * | 2021-04-21 | 2021-06-18 | 国网浙江省电力有限公司金华供电公司 | 应用于电力领域的智能语音调控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106548781A (zh) | 一种用于语音识别系统消除背景噪音的方法 | |
KR101465379B1 (ko) | 개선된 오디오 재생 방법 및 보청기 | |
CN101430882B (zh) | 一种抑制风噪声的方法及装置 | |
CN103259898B (zh) | 自适应调节频响的方法及终端 | |
US20140126728A1 (en) | System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure | |
CN205408099U (zh) | 一种具有降噪功能的移动终端 | |
TW200710824A (en) | Systems, methods, and apparatus for gain factor attenuation | |
DK1453194T3 (da) | Fremgangsmåde til automatisk forstærkningsindstilling i et höreapparat samt et höreapparat | |
CN105959842A (zh) | 一种耳机降噪处理的方法、装置及耳机 | |
CN101621730A (zh) | 用于检测声反馈的装置和方法 | |
MY157196A (en) | Methods and systems for active sound attenuation in an air handling unit | |
CN103578468A (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
CN103959813A (zh) | 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法 | |
CN105719644A (zh) | 一种自适应调整语音识别率的方法及装置 | |
CN1838838A (zh) | 抑制风噪声的助听器和方法 | |
CN110875045A (zh) | 一种语音识别方法、智能设备和智能电视 | |
CN103886861A (zh) | 一种控制电子设备的方法及电子设备 | |
CN113490115A (zh) | 一种基于声纹识别技术的声反馈抑制方法及系统 | |
CN106548771A (zh) | 用于语音识别系统消除突发噪音的方法 | |
CN110401902A (zh) | 一种主动降噪系统和方法 | |
CN108235211A (zh) | 包括动态压缩放大系统的听力装置及其运行方法 | |
Lezzoum et al. | Voice activity detection system for smart earphones | |
JP5115818B2 (ja) | 音声信号強調装置 | |
CN102860047B (zh) | 助听器以及助听器的控制方法 | |
CN113329305A (zh) | 一种舞台智能音响的控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170329 |
|
RJ01 | Rejection of invention patent application after publication |