发明内容
本发明实施例提供一种噪声抑制方法、音频处理芯片、音频信号处理模组及蓝牙设备,能够解决现有的语音降噪效果不稳定,消耗系统资源多的问题。
为解决上述技术问题,本发明实施例提供了一种噪声抑制方法。该方法包括:
采集至少一段语音信号;
将所述语音信号从时域表示转换为频域表示;
在频域中,对所述语音信号执行预设的回声消除处理和预设的噪声消除处理后,获得目标信号;
将所述目标信号从频域表示转换为时域表示。
可选地,所述噪声消除处理具体包括:估算用以表示噪声的噪声参数;根据所述噪声参数,对输入信号执行对应的噪声滤波。
可选地,所述回声消除处理具体包括:使用根据参考信号和语音信号确定的自适应滤波器,计算回声信号的估计;对输入信号和回声信号的估计反向求和,获得回声消除信号;对所述回声消除信号进行非线性处理。
可选地,所述在频域中,对所述语音信号执行预设的回声消除处理和预设的噪声消除处理后,获得目标信号,具体包括:
在频域中,将所述语音信号作为输入信号,执行预设的回声消除处理;
对执行预设的回声消除处理后的语音信号执行预设的噪声消除处理,获得目标信号。
为解决上述技术问题,本发明实施例还提供了一种音频处理芯片。该芯片包括:信号输入端、运算器以及信号输出端;
所述信号输入端,用于接收至少一段采集的语音信号;
所述运算器包括:域转换模块以及噪声处理模块,
所述域处理模块,用于将所述语音信号从时域表示转换为频域表示;
所述噪声处理模块,用于在频域中,对所述语音信号执行预设的回声消除处理和预设的噪声消除处理后,获得目标信号;
所述域转换模块还用于:将所述目标信号从频域表示转换为时域表示;
所述信号输出端,用于输出以时域表示的所述目标信号。
可选地,所述噪声处理模块在执行噪声消除处理时,具体用于:在估算用以表示噪声的噪声参数;根据所述噪声参数,对输入信号执行对应的噪声滤波。
可选地,所述噪声处理模块在执行回声消除处理时,具体用于:使用根据参考信号和语音信号确定的自适应滤波器,计算回声信号的估计;对输入信号和回声信号的估计反向求和,获得回声消除信号;对所述回声消除信号进行非线性处理。
可选地,所述噪声处理模块具体用于:在频域中,将所述语音信号作为输入信号,执行预设的回声消除处理;对执行预设的回声消除处理后的语音信号执行预设的噪声消除处理,获得目标信号。
为解决上述技术问题,本发明实施例还提供了一种音频信号处理模组。其包括:用于接收语音信号的信号输入端、用于输出目标信号的信号输出端、至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令程序,所述指令程序被所述至少一个处理器执行,以使所述至少一个处理器执行:将信号输入端输入的语音信号从时域表示转换为频域表示;在频域中,对所述语音信号执行预设的回声消除处理和预设的噪声消除处理后,获得目标信号;将所述目标信号从频域表示转换为时域表示,从信号输出端输出。
为解决上述技术问题,本发明实施例还提供了一种蓝牙设备。该蓝牙设备包括:麦克风、扬声器、蓝牙通信模组以及处理单元,所述麦克风、扬声器以及蓝牙通信模组与所述处理单元耦合;所述扬声器用于播放来自所述处理单元的音频信号;所述蓝牙通信模组用于与至少一个蓝牙设备建立蓝牙连接;
所述处理单元至少包括一个如上所述的音频处理芯片,用以处理所述麦克风采集的语音信号。
本发明实施例中提供的噪声抑制方法、音频处理芯片、音频信号处理模组及蓝牙设备。其通过将噪声消除和回音消除两个不同的模块中相同的,可以合并的部分进行整合,从而在一个通路上进行滤波、消除,更好的实现对于对于麦克风采集信号的噪声消除,提高通话质量。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,将麦克风采集信号的噪声分为回声以及环境噪声两大部分。在操作过程中,需要分别对这两部分噪声进行处理,消除抑制该噪声从而达到良好的通话质量或者实现较好的语音识别效果。
通常,如图1所示,回声是由通话设备的扬声器与麦克风之间的声学耦合所导致的。在无线电话、有线电话或者免提设备等设备中,均会因扬声器的声信号反射后被麦克风拾取而发生。
环境噪声,又称“背景噪声”。如图1所示,其是由通话设备使用的环境或者场合中的背景音源所导致的,例如是车站、机场、嘈杂的市区道路等场合中较为明显的背景音源。环境噪声通常可以理解为是长时间平稳存在的噪声。
图2为本发明实施例提供的应用环境示意图。如图2所示,该应用环境包括:扬声器10、麦克风20、音频信号处理模组30以及使用环境40。
扬声器10在通话过程中发出声音11,经过使用环境40中,例如墙壁、用户的面部等实体反射后,被麦克风20所采集。所述扬声器10具体可以采用任何合适的,播放音频的设备,例如立体声耳机、蓝牙耳机、免提电话,移动电话等。
使用环境40中也存在有自身的背景噪声41,这样的背景噪声41也会被麦克风20所采集。背景噪声41具体由使用环境所决定,例如是机场、市区道路或者车站等的背景声。
用户在通话过程中,也会发出声音。这样的声音也由麦克风20所采集。在此,使用“人声”这样的术语表示用户发出的声音(即麦克风期待获取的声音)。
亦即,在使用过程中,麦克风20采集到的声信号是由回声、背景噪声以及用户通话过程中发出的声音合成的。
经由麦克风20采集获得的声信号输入到音频信号处理模组30中进行处理。所述音频信号处理模组30中包括了用于进行回声消除的回声消除模块以及用于进行背景噪声抑制的降噪模块。通过这两个模块,可以尽可能的减少上述两种噪声的影响。从麦克风采集的声信号中提取用户通话中,用户发出的声音,以保证通话的质量。
所述音频信号处理模组30具体可以是任何合适类型的逻辑运算器件或者电子计算平台,例如DSP或者其它类型的处理器。
在本发明实施例中,所述扬声器10、麦克风20、音频信号处理模组30可以是同一个设备中各个分立的模块,例如手机、电话机或者其它的通信设备。在另一些实施例中,所述扬声器10、麦克风20、音频信号处理模组30还可以是分别设置在分立的电子设备中的各个部分。
当然,还可以根据实际情况的需要,在所述应用环境中增加或者减省一些功能模块,例如,增加用于无线音频传输的蓝牙模块或者WiFi模块。
该应用环境具体可以是多种不同的,需要获得干净纯净的语音信号的应用场合。例如,需要进行语音识别或者需要进行远程通话的应用场合,应用该噪声抑制方法来提供清晰的语音信号(即目标的人声)。
图3为本发明实施例提供的一种噪声抑制方法。该方法可以在所述音频信号处理模组30中执行,用以消除回声和环境噪声。如图3所示,该方法可以包括如下步骤:
301、采集至少一段语音信号。该语音信号可以是由图2中所示的麦克风20所采集。该语音信号是整合了回声、背景以及人声的混合信号。在本实施例中,目标是从语音信号中,滤除回声以及背景信号。
302、将所述语音信号从时域表示转换为频域表示。时域和频域表示是对同一信号的两种不同描述方式。频域是一种用于描述信号在频率方面的特性时所使用的坐标系。在频域中,可以广泛的应用于某些非线性系统以及可以方便的设计出能够有效抑制噪声的系统。时域信号可以通过傅里叶变换的方式转换为频域信号,从而进行频域分析。
303、在频域中,对所述语音信号执行预设的回声消除处理和预设的噪声消除处理后,获得目标信号。
回声消除处理和噪声消除处理具体可以采用现有技术中任何合适的方法完成。一般的,噪声消除需要根据噪声的估计进行滤波。而回声消除处理主要通过一个自适应滤波器来模拟扬声器输出的信号的反射函数,来确定回声的估计,并进一步的反向求和以完成回声消除处理。
304、将所述目标信号从频域表示转换为时域表示。语音信号完成回声消除处理和噪声消除处理后,既可以重新从频域转换为时域,输出至后端进行进一步的处理,例如,输出至蓝牙模块中,通过蓝牙无线传输的方式,传输处理后的语音信号,或者输出至处理器中,执行与语音信息相关的计算。
本发明实施例中,整合了回声消除以及噪声消除中相同的部分,同时在频域上对回声消除和噪声消除进行处理,可以有效的抑制噪声的同时提升回声消除的效果。
以下通过图4和图5所示的方法流程图,具体的阐述在本发明实施例中,可以应用的噪声消除以及回声消除的方法。
图4为本本发明实施例提供的,具体执行噪声消除的方法流程图。如图4所示,该噪声消除主要包括如下的两个步骤:
首先,需要对输入信号进行噪声的分析估算,估算用以表示噪声的噪声参数(步骤401)。分析估算的目标在于确定长时间平稳存在的环境噪声的一些表示参数的估计,通过这些估计来确定或者定义环境噪声。
然后,根据所述噪声参数,对输入信号执行对应的噪声滤波(步骤402)。噪声分析估计后,具体可以根据实际情况,选择使用合适的滤波器实现对于环境噪声消除。
图5为本发明实施例提供的,具体执行回声消除的方法流程图。如图5所示,所述回声消除方法包括:
首先,使用根据参考信号和语音信号确定的自适应滤波器,计算回声信号的估计(步骤501)。自适应滤波器是一种使用自适应算法改变滤波器参数和结构的滤波器。
自适应滤波器具体可以使用任何合适的自适应算法,来实现滤波器参数或者系数的更新,例如最小均方算法(LMS)或者是归一化最小均方算法(NLMS)。
在回声消除过程中,使用自适应滤波器来确定(或者模拟)回声路径对应的函数。通常回声路径是一个不可知的,复杂的环境(例如会随着人的移动而变化、声音的传播路径改变等)。因此,使用自适应滤波器具有根据输入数据的时变特性可以满足这样的未知环境中的使用要求。
参考信号是源自于扬声器的播放信号,其输入到一个可以使用的自适应滤波器后,便会产生与回声相接近的,回声的估计。其基于这样的假设来执行回声消除:
播放信号一方面通过扬声器播放,播放后的声信号在经过反射后,作为回声信号,被麦克风拾取。播放信号另一方面输入到自适应滤波器中,经过自适应滤波器,模拟出回声信号的估计。然后,通过对麦克风的输入信号和所述回声信号的估计进行反向求和,即可获得回声消除信号(步骤502)。
显然的,自适应滤波器模拟获得的回声信号的估计与真实的回声信号之间仍然会存在一定的残差。因此,最后还可以对所述回声消除信号进行非线性处理(步骤503)。
非线性处理(NLP)主要目的在于去除非线性部分以实现对上述残差的处理,其主要原理是通过去除所有低于某个电平阈值的信号,并且使用舒适的仿真噪声背景来替代。
可选地,在进入自适应滤波前,还可以对信号进行其它的信号处理,例如如图5所示的,可以首先对信号进行能量估算(步骤504),然后进行特定频率的滤波以及差值估算等(步骤505)。
图6为本发明实施例提供的,应用图4和图5所示的噪声消除以及回声消除的方法的完整的方法流程图。
如图6所示,在本实施例中,麦克风采集获得的语音信号首先通过傅里叶变换等方式,从时域表示转换为频域表示(步骤601)。
然后,对该信号进行诸如能量估算(步骤602)以及滤波、差值估算(步骤603)的处理后,结合参考信号,通过使用NLMS的自适应算法更新系数的自适应滤波器(步骤604)实现对于回声的估计并通过反向求和消除回声。最后,对信号执行非线性处理(步骤605),消除残余的非线性回声。
在完成回声消除后,进一步进行噪声消除。首先,对平稳长时间存在的环境噪声进行分析估算,确定环境噪声的表示(步骤606)。然后,根据这些获得环境噪声的估计,进行对应的噪声消除操作(步骤607)。
最后,将消除了回声和噪声后的信号,重新从频域转变为时域表示(步骤608),得到清晰的,可以使用的人声信号。当然,该人声信号可以应用于进行通话或者语音识别,语音控制等。
在本实施例中,均在频域上连续的对语音信号进行回声消除和噪声消除的处理,优先进行回声消除后再进行噪声消除可以避免噪声消除中因噪音附着而导致的信号失真,从而减少回声消除过程中,回声信号的误判的可能性。这样的,可以有效的抑制噪声,同时提升回音消除的性能。
本发明实施例还进一步提供一种可用于执行上述噪声抑制方法的音频处理芯片。该音频处理芯片可以在任何合适类型的电子设备中运行,用以输出由特定目标发出的,清晰音频信号。
图7为本发明实施例提供的音频处理芯片的结构框图。如图7所示,该音频处理芯片包括:信号输入端701、运算器702以及信号输出端703。
其中,所述信号输入端701用于接收至少一端采集的语音信号。该语音信号可以来自于应用环境中的麦克风或者其它类型的电声换能设备。
所述运算器702包括:域转换模块7021以及噪声处理模块7022。所述域转换模块7022用于将所述语音信号从时域表示转换为频域表示;并且将所述目标信号从频域表示转换为时域表示。
所述噪声处理模块7021包括可以包括两个功能单元,分别用于在频域中,执行预设的回声消除处理以及执行预设的噪声消除处理。,形成目标信号,从所述信号输出端703输出。
在本实施例中,音频处理芯片由所述噪声处理模块7022,合并了回声消除处理和噪声消除处理之间的部分步骤。这样的,在频域分析过程中,依次完成回声和噪声的消除而不是独立处理,从而在单麦克风的方案中,提供更清晰、准确的目标人声。
在一些实施例中,所述噪声处理模块7022首先执行所述回声消除处理,然后再执行噪声消除处理。这样的方式,可以有效的抑制噪声的同时提升回音消除的性能。
需要说明的是,由于上述实施例提供的音频处理芯片可用以执行上述方法实施例及其任意的组合,因此,方法实施例中的相应内容同样适用于本音频处理芯片,可以由音频处理芯片对应的功能模块所执行,此处不再详述,例如,上述方法实施例中揭露的噪声消除和回声消除的具体的方法也可以被所述噪声处理模块所执行。
当然,上述噪声处理模块7022以及域转换模块7021既可以是由单纯的硬件电路实现,例如实现傅里叶变换的硬件电路。在另一些实施例中,其也可以通过处理器调用存储器中相应的可执行程序这样的软硬件结合的方式实现。
图8为本发明实施例提供的蓝牙设备的硬件结构示意图,如图8所示,该蓝牙设备包括:麦克风801、扬声器802、一个或多个处理单元803、存储器804以及蓝牙通信模组805。图8中以一个处理器803为例。在一些实施例中,其还可以包括:输入装置和输出装置。
麦克风801、扬声器802、一个或多个处理单元803、存储器804、蓝牙通信模组805、输入装置和输出装置可以通过总线或者其他方式连接,图8中以通过总线连接为例。
麦克风801和扬声器802均可以为任何合适的类型或者型号的电声换能器件,分别用以拾取音频信号,转换为对应电信号。所述扬声器802根据输入的音频信号,播放相应的声信号。
存储器804作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的噪声抑制方法对应的程序指令/模块。处理单元803包括以上实施例揭露的音频处理芯片,可以通过运行存储在存储器804中的非易失性软件程序、指令以及模块,从而执行相应的功能应用以及数据处理,通过蓝牙通信模组805将所述噪声抑制方法获得的人声信号传输至其它设备。
存储器804可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序,存储数据区可存储根据音频处理芯片的使用所创建的数据等。此外,存储器804可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
在一些实施例中,存储器804可选包括相对于处理器803远程设置的存储器,这些远程存储器可以通过网络连接至所述蓝牙设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置可接收输入的数字或字符信息,以及产生与数据转发装置的用户设置以及功能控制有关的键信号输入。输出装置可包括显示屏等显示设备。所述一个或者多个模块存储在所述存储器804中,当被所述一个或者多个处理器803执行时,执行上述任意方法实施例中的噪声抑制方法。
本领域技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的示例性的噪声抑制步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。所述的计算机软件可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。