CN106782591B - 一种在背景噪音下提高语音识别率的装置及其方法 - Google Patents

一种在背景噪音下提高语音识别率的装置及其方法 Download PDF

Info

Publication number
CN106782591B
CN106782591B CN201611217273.7A CN201611217273A CN106782591B CN 106782591 B CN106782591 B CN 106782591B CN 201611217273 A CN201611217273 A CN 201611217273A CN 106782591 B CN106782591 B CN 106782591B
Authority
CN
China
Prior art keywords
music
noise
sound
signal
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611217273.7A
Other languages
English (en)
Other versions
CN106782591A (zh
Inventor
陈琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou TCL Mobile Communication Co Ltd
Original Assignee
Huizhou TCL Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou TCL Mobile Communication Co Ltd filed Critical Huizhou TCL Mobile Communication Co Ltd
Priority to CN201611217273.7A priority Critical patent/CN106782591B/zh
Publication of CN106782591A publication Critical patent/CN106782591A/zh
Application granted granted Critical
Publication of CN106782591B publication Critical patent/CN106782591B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明公开了一种在背景噪音下提高语音识别率的装置及其方法,所述装置包括喇叭功放、麦克风、噪音音乐消除模块、音频解码器、主控模块、感应转换模块和语音识别模块;麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对外部声音信号进行环境噪音和音乐声音信号的消除处理;噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。通过对音乐声音信号消除处理能获得干净的语音信号,有利于提高语音识别率。

Description

一种在背景噪音下提高语音识别率的装置及其方法
技术领域
本发明涉及语音识别技术领域,尤其涉及的是一种在背景噪音下提高语音识别率的装置及其方法。
背景技术
随着消费电子的快速发展,更加智能化设备的快速普及,各种新型技术也随应产生。语音作为基本的、主要的、关键的交互方式,越来越多的应用于智能设备的交互应用中。由于现阶段消费电子作为整个系统的设计短板,各个系统设计厂家、平台以及关键器件厂家都想在功耗上面做出更多的贡献。即尽最大可能将自己的产品以及系统,在不牺牲性能的基础上进行低功耗设计,最大程度上延长电子产品的待机时间。最终让用户能够从中更加频繁的正常使用该产品的功能,并且不用担心功耗的原因导致需要使用时而不能正常工作。
由于支持语音识别功能的消费电子设备很多,但是识别率跟设备所处的环境有很大的关联。当手机或者智能音响设备在播放音乐时,由于喇叭跟设备的麦克风位置很近,人在一定距离进行语音识别命令时,喇叭外放声压比人声语音大很多,会大大影响麦克风采集信号的效率。这是因为很大一部分语音信号都被实时播放音乐信号所盖住导致人声很弱。所以在语音识别过程中,正在播放的音乐声音强度大过纯人声信号时,可以理解为当前音乐声音此时为影响语音识别率的背景噪音,会会大大降低语音识别率,大大影响用户的语音使用效果。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供一种在背景噪音下提高语音识别率的装置及其方法,旨在解决现有播放的音乐声音强度大过纯人声信号时降低语音识别率的问题。
本发明解决技术问题所采用的技术方案如下:
一种在背景噪音下提高语音识别率的装置,包括喇叭功放,其还包括麦克风、噪音音乐消除模块、音频解码器、主控模块、感应转换模块和语音识别模块;
所述麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;
在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对所述外部声音信号进行环境噪音和音乐声音信号的消除处理;噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。
所述的在背景噪音下提高语音识别率的装置中,所述感应转换模块检测无音乐声音信号输出时,还控制噪音音乐消除模块对所述外部声音信号中的环境噪音进行消除处理。
所述的在背景噪音下提高语音识别率的装置中,所述噪音音乐消除模块包括环境噪音消除单元和音乐声音消除单元;
环境噪音消除单元对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元;
感应转换模块检测有音乐声音信号输出时,控制音乐声音消除单元对声音信号中的音乐声音信号进行消除处理;
感应转换模块检测无音乐声音信号输出时,控制音乐声音消除单元打开声音通路,将声音信号作为语音信号输出给音频解码器。
所述的在背景噪音下提高语音识别率的装置中,所述环境噪音消除单元通过语音降噪、回声消噪、以及波速聚集算法对所述外部声音信号中的环境噪音进行降噪解析,过滤掉外部环境噪音。
所述的在背景噪音下提高语音识别率的装置中,所述音乐声音消除单元进行消除处理时,将喇叭功放传输过来的音乐声音信号和去噪后的声音信号进行音乐声音信号消除算法解析,获取语音信号。
所述的在背景噪音下提高语音识别率的装置中,所述音乐声音信号消除算法包括:
将喇叭功放当前输出的音乐声音信号作为原始的参考信号并获取参考信号的相位时域以及频率频点信息,进行反相处理获得内部信号;
对去噪后的声音信号中的音乐声音信号进行时间同步,并将振幅修改成参考信号的大小;
将内部信号和修改了振幅的音乐声音信号进行复合处理,正反相抵消获得语音信号。
一种采用所述的在背景噪音下提高语音识别率的装置的提高语音识别率的方法,其特征在于,包括:
A、麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;
B、在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对所述外部声音信号中的环境噪音和音乐声音信号进行消除处理;
C、噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。
所述的提高语音识别率的方法中,所述步骤B具体包括:
步骤B1、环境噪音消除单元对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元;
步骤B2、感应转换模块检测有音乐声音信号输出时,控制音乐声音消除单元对声音信号中的音乐声音信号进行消除处理;
步骤B3、感应转换模块检测无音乐声音信号输出时,控制音乐声音消除单元打开声音通路,将声音信号作为语音信号输出给音频解码器。
所述的提高语音识别率的方法中,在所述步骤B1中,环境噪音消除单元通过语音降噪、回声消噪、以及波速聚集算法对所述外部声音信号中的环境噪音进行降噪解析,过滤掉外部环境噪音。
所述的提高语音识别率的方法中,在所述步骤B2中,音乐声音消除单元进行消除处理时,将喇叭功放传输过来的音乐声音信号和去噪后的声音信号进行音乐声音信号消除算法解析,获取语音信号。
相较于现有技术,本发明提供的在背景噪音下提高语音识别率的装置及其方法,麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对外部声音信号进行环境噪音和音乐声音信号的消除处理;噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。通过对音乐声音信号消除处理能获得干净的语音信号,有利于提高语音识别率。
附图说明
图1是声波聚集效果图的示意图。
图2是本发明提供的在背景噪音下提高语音识别率的装置的结构框图。
图3是原始的参考信号的波形示意图。
图4是混合的模拟信号的波形示意图。
图5是本发明提供的语音信号的波形示意图。
图6是本发明提供的在背景噪音下提高语音识别率的方法流程图。
具体实施方式
本发明提供一种在背景噪音下提高语音识别率的装置及其方法,适用于使用语音识别的手机、非手机的智能器件、智能家居系统和音频技术领域,如自定义语音指令辅助寻找物件的智能器件。通过利用第三方可编程的DSP(数字信号处理器)、结合相应的低功耗硬件设计、并配合音频信号的软件算法,在通过喇叭播放音乐时能够辅助语音识别功能,以提高当语音识别的麦克风离喇叭很近且正在大音量播放音乐时(此时的音乐为影响语音识别率的背景噪音)的语音识别率。为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明主要采用了语音识别技术和远距离语音跟踪技术。
所述语音识别技术是让机器通过识别和理解过程,把语音信号转变为相应的文本或命令的高科技技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolatedword recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。
其中,孤立词识别的任务是识别事先已知的孤立的词,如“开机”、“关机”等。连续语音识别的任务是识别任意的连续语音,如一个句子或一段话。连续语音流中的关键词检测针对的是连续语音,但其并不识别全部文字,只是检测已知的若干关键词在何处出现。如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。
另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。
本发明主要使用目前成熟语音供应商的语音识别方案,达到实现智能设备系统的功能。该功能能够通过训练提高语音识别功能, 并且支持云端语音库支持,对系统处理速度以及要求很低,MCU主频超过100Mhz,RAM (随机存储器)大于64KB,离线库存储库可以按照MCUROM进行自行裁减,但相应对语音库信息有影响。
远距离语音跟踪技术主要用来提供进行麦克风实时语音的捕捉。基于本发明用的是非指向性麦克风,所以通过此技术可以设置特定采集声音角度,过滤掉角度之外的噪音信号(此处主要是稳态的低频噪音和角度之外的音乐声音信号)。因为声音传播为非指向性的,从而在设置的角度之内的声音也是有音乐声音覆盖的。相比而言由于音乐声音的泛音信号输出功率最高可以达到70W,而人声部分远远低于此泛音信号,在MIC(麦克风)采集到的所有信号通过此远距离语音跟踪技术将角度之外的噪音信号进行初步的过滤,作用是为了减少系统软件算法解析的负荷,以及提高解析效率。最主要的目的是过滤低频稳态噪音,此时MIC获取到的声音信号,可以理解为角度内放大的人声音和大响度音乐声音信号(低频噪音已经通过此算法过滤掉了,提高了信号的信噪比)。因此,在远距离语音跟踪技术的基础上采用本发明的降噪算法可将大响度音乐声音信号过滤掉。
具体实现原理为:将语音降噪、回声消噪、以及波速聚集(beam forming)这三种算法综合。语音降噪即消除环境噪音,通过一个或者多个麦克风将有用人声和环境噪音进行区分或数字模版剥离,达到实现清晰人声的目的。回声消除即消除因在室内以及外界环境物体进行的反射、通过不同的时间段送进输入声音通道中,从而会重复多次听到人声。由于是短时间连续的人声,从而也需要通过三种算法进行消除。由于麦克风器件本来是360°全方位获取语音信号的,从而不可避免的会将人声信号和环境噪音一并送入系统。声波聚集(beam forming) 技术即是将麦克风的全指向性在声音信号改变成指向性信号,从而过滤掉不需要环境噪音,只捕获有用的人声信号。
声波聚集效果图如图1所示,方框10(需要录取的声音,位置为0°)和方框10/(需要录取的声音,位置为0°)表示被录音的对象一个或者多个录音对象,方框20(干扰者的声音,位置为50°)和方框20/(干扰者的声音,位置为90°)表示不想被录入的对象。左边的圆形图以及花瓣形形状,表示可以支持的强化语音的角度以及实时声音的升压强度,从-30°到30°,以及60°到120°,-150°到150°以及-60°到-120°;这个区域内的对象声音会进行放大,除此之外的角度声音会进行过滤删除。因此可以实现某个或者多个方向的特定区域的选择性录音。右边的圆形图以及花瓣形状,表示强化录音所支持的角度从-60°到60°以及-120°到120°;同理这个角度的声音会通过对相位和幅值的处理从而放大录音,其它区域需要过滤或者屏蔽掉干扰音。所支持的角度得到了有效的放大,其它的角度声压值比较小。
基于上述的语音识别技术和远距离语音跟踪技术,请参阅图2,本发明提供的在背景噪音下提高语音识别率的装置包括现有的喇叭功放,本实施例改进后的两个数字接口的麦克风(此处为MEMS麦克风)(MIC1、MIC2)、噪音音乐消除模块10、音频解码器20、主控模块30、感应转换模块40和、语音识别模块50。
需要播放音乐时,主控模块输出的音乐声音信号通过音频解码器解析,再通过喇叭功放进行功放驱动后传输至喇叭播放。感应转换模块40根据音乐声音信号的有无检测是否有音乐声音信号在播放。喇叭功放是驱动喇叭的器件,放大模拟的音乐声音信号。在具体实施时,主控模采用MCU,噪音音乐消除模块10采用DSP(双核)两种IC支持。另外也可使用纽扣电池作为供电。使用外部时钟晶振满足不同IC的时钟要求。通过这样消除处理后再进行语音识别,可获得更加纯净的人声信号(即语音信号),提高语音识别的准确性。
需要理解的是,该装置还包括对主控模块供电的电源模块60。基于主控的电源模块可以有效的控制功耗,而DSP的工作状态不同,功耗上也是不同的。因此所述电源模块60能针对DSP不同的工作状态来控制电流和电压,达到省电的目的。
所述两个数字接口的MEMS麦克风(可采用基于MEMS技术制造的MEMS麦克风)为高灵敏的外围器件,用于采集外部声音信号并判断外部声音信号是否超过预设阀值(如80dB声压级),是则表示用户对准麦克风说话,需要进行语音控制,可唤醒整个装置进入语音识别模式并将外部声音信号传输给噪音音乐消除模块10。此时两个麦克风同时工作采集外部声音信号。另外一个麦克风辅助降噪、回声消除、声波集束。匹配时主控模块通过DSP信号进行判断,如果关键字匹配,MCU控制LED亮和蜂鸣器出生。不匹配DSP进入低功耗状态,不唤醒外部时钟以及总线和MUC。所述关键字由用户录制进去或者DSP供应商一次性写入进去。因为声音是有基音和谐音组成,并且用户说关键字时抑扬顿挫(即声音的响度,声音的相位都是类似的)。当用MIC采集关键字时会将语音信号送至DSP中进行比对。基于人声大致平均声压在65DB左右,语音的频率范围大致在200HZ-3KHZ左右。判断是否为关键字可以先判断噪音的频段是否满足语音,如果不满足就进入低电状态。另外判断关键字的语音是否匹配,可以按照时间域及信号的相位来判断两者是否相互匹配。超过预设阀值(80dB声压级)时不启动DSP麦克风进入低电待机。
小于预设阀值(即没有超过80DB)时,除了噪音消除模块和麦克风,其他模块都不进行唤醒,即不启动装置中的其他模块,使其他模块进入低耗电的待机模式以进行低功耗处理,继续检测。这样可节省电能消耗。外部声音信号通常包括环境噪音、语音信号(由用户需要进行语音控制时产生,携带了控制命令)和音乐信号(用户播放音乐时产生)。
在语音识别模式下,感应转换模块40检测有音乐声音信号播放时,控制噪音音乐消除模块10工作。噪音音乐消除模块10对所述外部声音信号中的环境噪音和音乐声音信号进行消除处理,并输出干净的语音信号通过音频解码器20解码后传输至语音识别模块50中进行语音识别解析,语音识别模块50将解析结果反馈给主控模块30进行相应的功能控制。
若感应转换模块40检测无音乐声音信号播放时,控制噪音音乐消除模块10对所述外部声音信号中的环境噪音进行消除处理,噪音音乐消除模块10输出干净的语音信号通过音频解码器20解码后传输至语音识别模块50中进行语音识别解析,语音识别模块50将解析结果反馈给主控模块30进行相应的功能控制。
本实施例中,所述噪音音乐消除模块10包括环境噪音消除单元110和音乐声音消除单元120。环境噪音消除单元110根据远距离语音跟踪技术对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元120。环境噪音消除单元110对高频信号有高灵敏度和高采样率的特性,其加载了上述的远距离语音跟踪技术,通过语音降噪、回声消噪、以及波速聚集算法对外部声音信号进行降噪解析,过滤掉外部环境噪音。
感应转换模块40检测有音乐声音信号输出时,控制音乐声音消除单元120对声音信号中的音乐声音信号进行消除处理,音乐声音消除单元120输出干净的语音信号给音频解码器20。若感应转换模块40检测无音乐声音信号输出时,控制音乐声音消除单元120打开声音通路(相当于直接将音乐声音消除单元120作为通路),将声音信号作为(此时的声音信号即为干净的语音信号,无需做任何信号处理)干净的语音信号输出给音频解码器20。这样可降低功耗,提高系统的效率,由于感应转换模块40采集到的音乐声音信号为模拟信号,所以感应转换模块40还要进行模拟转数字的操作,即将模拟的音乐声音信号转换为数字的音乐声音信号。
本实施例中,音乐声音消除单元120进行消除处理时,是将内部闭环通路传输过来的音乐声音信号以及去噪后的声音信号进行音乐声音信号消除算法解析,进一步获取更加干净的人声信号(即语音信号)。音乐声音信号消除算法解析的过程具体如下:
原始的参考信号如图3所示。麦克风采集的语音信号和音乐声音信号是混合的模拟信号,其波形如图4所示。通过音乐声音消除单元120内置的ADC电路转换成数字信号。在装置内部,将立体声的喇叭功放设计成一个闭环通路,实时将当前内部播放的音乐声音信号和去噪后的声音信号相结合,由音乐声音消除单元120的降噪解析功能进行相位时域的比较,将内部闭环送至的音乐声音信号作为原始的参考信号并获取参考信号的相位时域以及频率频点信息,进行反相处理获得内部信号。由于声音信号的数据经过麦克风采集和去噪处理,与内部闭环传输过来的音乐声音信号的数据有一定的延时性,需要将参考信号的特征码信息用与声音信号进行分析获取混合的模拟信号中的音乐信号的时域,相位,振幅信息,得出延时的起始点,对麦克风采集到的音乐声音信号进行时间同步,并将振幅修改成参考信号大小,最后将反相处理后的内部信号和修改了音乐声音振幅的麦克风所采集到混合信号进行复合处理,正反相抵消,从而剩下更加纯净、干净的人声信号(即语音信号),波形如图5所示。相比现有技术只通过麦克风采集到的混合信号只通过声音降噪算法,是没法将非稳态的高响度的音乐声音信号处理撤离的。
干净的语音信号传输至音频解码器20解码后,再传输至语音识别模块50中进行人声命令识别。其中,音频解码器模块(CODEC)20提供音频数字和模拟输入和输出接口,另外提供与音频信号协处理器连接的专用音频接口,便于连接外围器件(如喇叭和麦克风),内部有高精度模拟转数字信号转换器从而支持模拟麦克风。提供多个I2S接口便于连接外部DSP模块,支持I2C接口用来传输控制命令,即从主控模块(具体可采用MCU)到噪音音乐消除模块10(具体可采用DSP)、或者DSP到MCU的指令。内支持64K存储单元,并且可以实时擦写核心的内存单元,用来支持更新DSP内消除处理相关的算法,从而协助MCU进行大量数据运算和不同算法的运行。
在具体实施时,MCU(核心控制模块)还能接收音频信号协处理器发送过来的中断指令控制上层应用。
基于上述的在背景噪音下提高语音识别率的装置,本发明还提供一种在背景噪音下提高语音识别率的方法,请参阅图6,所述方法包括:
S100、麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;
S200、在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对所述外部声音信号中的环境噪音和音乐声音信号进行消除处理;
S300、噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。
本实施例中,所述步骤S100具体包括:
步骤110、麦克风采集外部声音信号;
步骤120、判断外部声音信号是否超过预设阀值:是则进入语音识别模式,将外部声音信号传输给噪音音乐消除模块;否则进入待机模式,麦克风继续检测外部声音信号。之后即可进行消除处理。
本实施例中,所述步骤S200具体包括:
步骤B21、环境噪音消除单元对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元;
本步骤中,环境噪音消除单元通过语音降噪、回声消噪、以及波速聚集算法对所述外部声音信号中的环境噪音进行降噪解析,过滤掉外部环境噪音。
步骤B22、感应转换模块检测有音乐声音信号输出时,控制音乐声音消除单元对声音信号中的音乐声音信号进行消除处理;
本步骤中,音乐声音消除单元进行消除处理时,将喇叭功放传输过来的音乐声音信号和去噪后的声音信号进行音乐声音信号消除算法解析,获取语音信号。
所述音乐声音信号消除算法包括:
步骤1、将喇叭功放当前输出的音乐声音信号作为原始的参考信号并获取参考信号的相位时域以及频率频点信息,进行反相处理获得内部信号;
步骤2、对去噪后的声音信号中的音乐声音信号进行时间同步,并将振幅修改成参考信号的大小;
步骤3、将内部信号和修改了振幅的音乐声音信号进行复合处理,正反相抵消获得语音信号。
步骤B23、感应转换模块检测无音乐声音信号输出时,控制音乐声音消除单元打开声音通路,将声音信号作为语音信号输出给音频解码器。
通过步骤S200获得的语音信号滤除了正在播放的音乐声音信号(其强度大过纯人声信号),因此,有利于提高步骤S300进行的语音识别的准确率。
综上所述,本发明通过MEMS麦克风实时采集外部声音信号,应用了远距离语音跟踪技术保证用户在较远距离进行识音,不至于因为声音响度小而未能正常采集到声音数据。由于MEMS 是PDM接口可以直接将语音信号送入DSP运算模块(即噪音音乐消除模块)进行处理,判断输入信号是否涉及语音命令,通过不同阶段判断以及启动不同的运算算法对语音信号处理采集声音信号的阶段DSP运行远距离语音跟踪算法。另外闭环通路送至的音乐声音信号通过感应转换模块的判断和转换获取到的数字信号和麦克风采集到声音信号两路送至音乐声音消除单元中进行算法解析,然后将最终干净的声音通过音频解码器直接送至语音识别模块进行语音识别,最后得出运算解析结果自动判断是否要发起中断信号给MCU控制模块给出相关功能操作。通过改善降噪算法的效率,针对语音识别的麦克风离喇叭很近,且正在大音量播放音乐的情况,能获得更加干净的人声信号(即语音信号),有利于提高语音识别率,提高产品的识别效果,能够支持语音识别的消费电子设备,更加贴近实用,具有长待机、便捷性、适用于多个形态的电子设备中,如智能器件、手环、智能家居等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种在背景噪音下提高语音识别率的装置,包括喇叭功放,其特征在于,还包括两个麦克风、噪音音乐消除模块、音频解码器、主控模块、感应转换模块和语音识别模块;
所述麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对所述外部声音信号进行环境噪音和音乐声音信号的消除处理;噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制;
进入语音识别模式时,两个麦克风同时工作采集外部声音信号,一个麦克风辅助降噪、回声消除、声波集束;在麦克风采集到的所有信号通过远距离语音跟踪技术进行麦克风实时语音的捕捉;设置采集声音角度,包括从-30°到30°,以及60°到120°,-150°到150°以及-60°到-120°;或从-60°到60°以及-120°到120°;将角度之外的噪音信号进行初步的过滤。
2.根据权利要求1所述的在背景噪音下提高语音识别率的装置,其特征在于,所述感应转换模块检测无音乐声音信号输出时,还控制噪音音乐消除模块对所述外部声音信号中的环境噪音进行消除处理。
3.根据权利要求2所述的在背景噪音下提高语音识别率的装置,其特征在于,所述噪音音乐消除模块包括环境噪音消除单元和音乐声音消除单元;
环境噪音消除单元对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元;
感应转换模块检测有音乐声音信号输出时,控制音乐声音消除单元对声音信号中的音乐声音信号进行消除处理;
感应转换模块检测无音乐声音信号输出时,控制音乐声音消除单元打开声音通路,将声音信号作为语音信号输出给音频解码器。
4.根据权利要求3所述的在背景噪音下提高语音识别率的装置,其特征在于,所述环境噪音消除单元通过语音降噪、回声消噪、以及波速聚集算法对所述外部声音信号中的环境噪音进行降噪解析,过滤掉外部环境噪音。
5.根据权利要求3所述的在背景噪音下提高语音识别率的装置,其特征在于,所述音乐声音消除单元进行消除处理时,将喇叭功放传输过来的音乐声音信号和去噪后的声音信号进行音乐声音信号消除算法解析,获取语音信号。
6.根据权利要求5所述的在背景噪音下提高语音识别率的装置,其特征在于,所述音乐声音信号消除算法包括:
将喇叭功放当前输出的音乐声音信号作为原始的参考信号并获取参考信号的相位时域以及频率频点信息,进行反相处理获得内部信号;
对去噪后的声音信号中的音乐声音信号进行时间同步,并将振幅修改成参考信号的大小;
将内部信号和修改了振幅的音乐声音信号进行复合处理,正反相抵消获得语音信号。
7.一种采用权利要求1所述的在背景噪音下提高语音识别率的装置的提高语音识别率的方法,其特征在于,包括:
A、麦克风根据采集的外部声音信号是否超过预设阀值选择进入语音识别模式或待机模式;
B、在语音识别模式下,感应转换模块检测喇叭功放输出音乐声音信号时,控制噪音音乐消除模块对所述外部声音信号中的环境噪音和音乐声音信号进行消除处理;
C、噪音音乐消除模块输出的语音信号通过音频解码器解码后传输至语音识别模块中进行语音识别解析,主控模块根据解析结果进行相应的功能控制。
8.根据权利要求7所述的提高语音识别率的方法,其特征在于,所述步骤B具体包括:
步骤B1、环境噪音消除单元对输入的外部声音信号进行环境噪音消除处理,输出声音信号给音乐声音消除单元;
步骤B2、感应转换模块检测有音乐声音信号输出时,控制音乐声音消除单元对声音信号中的音乐声音信号进行消除处理;
步骤B3、感应转换模块检测无音乐声音信号输出时,控制音乐声音消除单元打开声音通路,将声音信号作为语音信号输出给音频解码器。
9.根据权利要求8所述的提高语音识别率的方法,其特征在于,在所述步骤B1中,环境噪音消除单元通过语音降噪、回声消噪、以及波速聚集算法对所述外部声音信号中的环境噪音进行降噪解析,过滤掉外部环境噪音。
10.根据权利要求8所述的提高语音识别率的方法,其特征在于,在所述步骤B2中,音乐声音消除单元进行消除处理时,将喇叭功放传输过来的音乐声音信号和去噪后的声音信号进行音乐声音信号消除算法解析,获取语音信号。
CN201611217273.7A 2016-12-26 2016-12-26 一种在背景噪音下提高语音识别率的装置及其方法 Active CN106782591B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611217273.7A CN106782591B (zh) 2016-12-26 2016-12-26 一种在背景噪音下提高语音识别率的装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611217273.7A CN106782591B (zh) 2016-12-26 2016-12-26 一种在背景噪音下提高语音识别率的装置及其方法

Publications (2)

Publication Number Publication Date
CN106782591A CN106782591A (zh) 2017-05-31
CN106782591B true CN106782591B (zh) 2021-02-19

Family

ID=58926783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611217273.7A Active CN106782591B (zh) 2016-12-26 2016-12-26 一种在背景噪音下提高语音识别率的装置及其方法

Country Status (1)

Country Link
CN (1) CN106782591B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566874A (zh) * 2017-09-22 2018-01-09 百度在线网络技术(北京)有限公司 基于电视设备的远场语音控制系统
JP7143327B2 (ja) * 2017-10-03 2022-09-28 グーグル エルエルシー コンピューティング装置によって実施される方法、コンピュータシステム、コンピューティングシステム、およびプログラム
CN108064007A (zh) * 2017-11-07 2018-05-22 苏宁云商集团股份有限公司 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN108532670B (zh) * 2018-04-23 2019-09-10 胡海明 挖掘机语音控制系统
CN110534110B (zh) * 2018-05-25 2022-04-15 深圳市优必选科技有限公司 一种机器人及提高其语音交互识别率的方法、装置和电路
CN110556096A (zh) * 2018-05-31 2019-12-10 技嘉科技股份有限公司 声控显示装置及获取语音信号的方法
CN109379676A (zh) * 2018-11-23 2019-02-22 珠海格力电器股份有限公司 音频数据的处理方法及装置、存储介质、电子装置
CN109859758A (zh) * 2019-03-26 2019-06-07 成都启英泰伦科技有限公司 一种语音识别控制电路
CN110324759A (zh) * 2019-06-12 2019-10-11 深圳市金锐显数码科技有限公司 语音音响拾音电路及装置
CN110223707A (zh) * 2019-07-10 2019-09-10 青岛海信电器股份有限公司 显示装置
WO2021004067A1 (zh) * 2019-07-10 2021-01-14 海信视像科技股份有限公司 一种显示装置
CN110349582B (zh) * 2019-07-10 2021-11-19 海信视像科技股份有限公司 显示装置与远场语音处理电路
CN112056763A (zh) * 2020-09-08 2020-12-11 深圳创维-Rgb电子有限公司 智能茶几、语音指令识别方法以及存储介质
CN113362845B (zh) 2021-05-28 2022-12-23 阿波罗智联(北京)科技有限公司 声音数据降噪方法、装置、设备、存储介质及程序产品
CN114173258B (zh) * 2022-02-07 2022-05-10 深圳市朗琴音响技术有限公司 智能音箱控制方法及智能音箱

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996015541A1 (en) * 1994-11-14 1996-05-23 Andrea Electronics Corporation Noise cancellation apparatus
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
WO2011129421A1 (ja) * 2010-04-13 2011-10-20 日本電気株式会社 背景雑音キャンセリング装置および方法
CN103348408A (zh) * 2011-02-10 2013-10-09 杜比实验室特许公司 噪声和位置外信号的组合抑制
CN103413547A (zh) * 2013-07-23 2013-11-27 大连理工大学 一种室内混响消除的方法
CN104246877A (zh) * 2012-04-23 2014-12-24 高通股份有限公司 用于音频信号处理的系统和方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3105863B2 (ja) * 1998-04-02 2000-11-06 日本電気ロボットエンジニアリング株式会社 音声認識雑音除去方式
JP4195267B2 (ja) * 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
KR20080035754A (ko) * 2006-10-20 2008-04-24 현대자동차주식회사 운전자의 능동적 음성인식률 향상을 위한 음성인식가능상태표시장치 및 방법
US8326636B2 (en) * 2008-01-16 2012-12-04 Canyon Ip Holdings Llc Using a physical phenomenon detector to control operation of a speech recognition engine
US20090248411A1 (en) * 2008-03-28 2009-10-01 Alon Konchitsky Front-End Noise Reduction for Speech Recognition Engine
JP5457293B2 (ja) * 2010-07-14 2014-04-02 アルパイン株式会社 音声認識装置
CN102915732A (zh) * 2012-10-31 2013-02-06 黑龙江省电力有限公司信息通信分公司 抑制背景广播的语音指令识别方法与装置
CN103139688A (zh) * 2013-02-27 2013-06-05 广州市天艺电子有限公司 一种消除环境噪音的方法、装置和助听器
CN105719644A (zh) * 2014-12-04 2016-06-29 中兴通讯股份有限公司 一种自适应调整语音识别率的方法及装置
CN204836533U (zh) * 2015-08-18 2015-12-02 聚熵信息技术(上海)有限公司 一种具有回声消除功能的声控智能音箱
CN205354646U (zh) * 2015-12-09 2016-06-29 江苏天安智联科技股份有限公司 一种应用于车载设备的智能语音识别系统
CN106098054A (zh) * 2016-06-13 2016-11-09 惠州Tcl移动通信有限公司 一种语音识别中扬声器噪音的过滤装置及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996015541A1 (en) * 1994-11-14 1996-05-23 Andrea Electronics Corporation Noise cancellation apparatus
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
WO2011129421A1 (ja) * 2010-04-13 2011-10-20 日本電気株式会社 背景雑音キャンセリング装置および方法
CN103348408A (zh) * 2011-02-10 2013-10-09 杜比实验室特许公司 噪声和位置外信号的组合抑制
CN104246877A (zh) * 2012-04-23 2014-12-24 高通股份有限公司 用于音频信号处理的系统和方法
CN103413547A (zh) * 2013-07-23 2013-11-27 大连理工大学 一种室内混响消除的方法

Also Published As

Publication number Publication date
CN106782591A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106782591B (zh) 一种在背景噪音下提高语音识别率的装置及其方法
WO2020143652A1 (zh) 一种关键词的检测方法以及相关装置
US9549273B2 (en) Selective enabling of a component by a microphone circuit
WO2018137704A1 (zh) 一种基于麦克风阵列的拾音方法及系统
US9775113B2 (en) Voice wakeup detecting device with digital microphone and associated method
JP6076994B2 (ja) オーディオ特徴データの抽出と分析
CN204390737U (zh) 一种家庭语音处理系统
CN109346075A (zh) 通过人体振动识别用户语音以控制电子设备的方法和系统
CN204836533U (zh) 一种具有回声消除功能的声控智能音箱
CN105448294A (zh) 一种应用于车载设备的智能语音识别系统
CN108681440A (zh) 一种智能设备音量控制方法及系统
CN205354646U (zh) 一种应用于车载设备的智能语音识别系统
WO2019233228A1 (zh) 电子设备及设备控制方法
CN108447483B (zh) 语音识别系统
CN111028838A (zh) 一种语音唤醒方法、设备及计算机可读存储介质
US11290802B1 (en) Voice detection using hearable devices
CN206181355U (zh) 一种语音降噪系统
GB2526980A (en) Sensor input recognition
CN102693721A (zh) 简易语音性别检测装置及方法
CN205408096U (zh) 数字麦克风和电子设备
CN208538474U (zh) 语音识别系统
CN207039811U (zh) 一种多媒体麦克风智能检测音箱
CN106653060B (zh) 吹气声识别系统及采用该系统的吹气识别方法
CN108337620A (zh) 一种语音控制的扩音器及其控制方法
CN205003507U (zh) 远程唤醒式语音点播电路

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant