CN204117590U

CN204117590U - 语音采集降噪装置以及语音质量评价系统

Info

Publication number: CN204117590U
Application number: CN201420554288.2U
Authority: CN
Inventors: 李心广; 王桂珍; 徐集优; 陈嘉华; 张胜斌; 林帆; 陈君宇; 朱小凡
Original assignee: Guangdong University of Foreign Studies
Current assignee: Guangdong University of Foreign Studies
Priority date: 2014-09-24
Filing date: 2014-09-24
Publication date: 2015-01-21
Anticipated expiration: 2024-09-24

Abstract

本实用新型公开了一种语音采集降噪装置，包括：语音采集降噪装置，其特征在于，包括：近端麦克风、远端麦克风、模数转换器、语音预处理电路和语音降噪电路；所述近端麦克风通过第一语音通道与所述模数转换器连接；所述远端麦克风通过第二语音通道与所述模数转换器连接；所述模数转换器的输出端与所述语音预处理电路的输入端连接；所述语音预处理电路的输出端与所述语音降噪电路的输入端连接；所述语音降噪电路的输出端作为所述语音采集降噪装置的输出端。本实用新型还提供了一种语音质量评价系统，包括语音采集降噪装置，智能手机系统控制电路和网络服务器。实施本实用新型提供的技术方案，可有效提高录入语音的质量。

Description

语音采集降噪装置以及语音质量评价系统

技术领域

本实用新型涉及音频处理技术领域，尤其涉及一种语音采集降噪装置以及语音质量评价系统。

背景技术

随着移动互联网的发展，智能移动终端的应用越来越广泛，而目前的移动终端(如智能手机)的硬件配置仍然不足以支持质量要求更高的语音应用系统的功能需要。语音信号在编码、传输等过程往往会受到周围环境各种噪声的污染，现有语音处理设备难以严格识别接入的语音信号中的背景噪声或对多参量的语音信号进行区分处理。例如，现有的智能手机所安装的语言学习系统难以就其麦克风接入的语音信号提供客观、准确度高的检测结果。

语音降噪是针对噪声问题的一种有效的处理技术，它的目的是为了消除噪声的影响，提高语音清晰度、改善语音的质量。语音降噪技术被广泛应用在不同类型的语音交互系统中，包括语音通话、语音识别系统和多媒体设备等。针对不同的应用场景和噪声来源，所采用的语音降噪技术策略不一。现有的语音降噪方案主要体现在对算法上的改进，而未能突破系统硬件对语音处理的限制。

实用新型内容

本实用新型所要解决的技术问题是，提供一种适用于移动终端的语音采集降噪装置和语音质量评价系统，针对硬件构成的改进，提高接入的移动终端的音频清晰度与语音质量。

为解决以上技术问题，一方面，本实用新型实施例提供一种语音采集降噪装置，包括：近端麦克风、远端麦克风、模数转换器、语音预处理电路和语音降噪电路；

所述近端麦克风通过第一语音通道与所述模数转换器连接；所述远端麦克风通过第二语音通道与所述模数转换器连接；

所述模数转换器的输出端与所述语音预处理电路的输入端连接；所述语音预处理电路的输出端与所述语音降噪电路的输入端连接；

所述语音降噪电路的输出端作为所述语音采集降噪装置的输出端。

进一步地，所述语音降噪电路包括：第一傅里叶变换电路、第二傅里叶变换电路、自适应滤波器、谱减电路、相位恢复电路和傅里叶逆变换电路；

所述第一傅里叶变换电路的输入端和所述第二傅里叶变换电路的输入端分别与所述语音预处理电路连接；

所述第一傅里叶变换电路的输出端与所述自适应滤波器的输入端连接；所述自适应滤波器的输出端与所述谱减电路的输入端连接；所述谱减电路的输出端与所述相位恢复电路的输入端连接；

所述第二傅里叶变换电路的输出端与所述谱减电路的输入端、所述相位恢复电路的输入端分别连接；

所述相位恢复电路与所述傅里叶逆变换电路的输入端连接；所述傅里叶逆变换电路的输出端为所述语音降噪电路的输出端。

进一步地，所述傅里叶逆变换电路还集成有语音帧组合电路和去加重电路。

优选地，所述语音降噪电路集成在移动终端的基带芯片中。

另一方面，本实用新型还提供了一种语音质量评价系统，包括：如权利要求以上任一项所述的语音采集降噪装置，智能手机系统控制电路和网络服务器；

所述语音采集降噪装置的输出端通过数据线与所述智能手机系统控制电路的输入端连接；所述智能手机系统控制电路的输出端通过移动通信网络与所述网络服务器连接。

进一步地，所述智能手机系统控制电路包括音频存储电路、数据收发电路和显示电路；

所述音频存储电路的输入端与所述语音采集降噪装置的输出端连接；所述音频存储电路的输出端与所述数据收发电路的输入端连接；所述数据收发电路的输出端与所述显示电路连接；所述数据收发电路的数据端通过所述移动通信网络与所述网络服务器连接。

进一步地，所述网络服务器包括音频接收电路、音频特征提取电路，以及音频识别与评价电路；

所述音频接收电路的输入端与通过所述移动通信网络与所述数据收发电路的数据端连接；所述音频接收电路的输出端与所述音频特征提取电路的输入端连接；所述音频特征提取电路的输出端与所述音频识别与评价电路的输入端连接；所述音频识别与评价电路的输出端通过所述移动通信网络与所述数据收发电路的数据端连接。

本实用新型实施例提供的语音采集降噪装置，通过双麦克风对周围环境的语音信息进行采集，由于近端麦克风相对于远端麦克风靠近用户，因此近端麦克风通过独立的声道采集目标音源，如用户发出的语音，而远端麦克风远离声源并可通过独立的声道采集背景噪声，用户在使用本实用新型实施例提供的语音采集降噪装置进行录音时，可有效分辨用户的语音和背景噪声；而语音降噪电路可以为夹杂着噪声的目标音源和背景噪声分别通过设置FFT(Fast FourierTransformation，快速傅里叶变换)电路和IFFT(Inverse Fast Fourier Transform，FFT逆变换)电路的转换，并通过相关的电路处理，进行滤波、谱减、相位恢复等电路处理，获得纯净的目标语音。同时，将改进后的语音采集降噪装置应用在语音质量评价系统中，结合智能手机系统控制电路和网络服务器，组建一种语音质量评价系统，实现对录入移动终端的语音的质量评价，满足对语音质量的更为严格的需求，可以查看语音采集结果和提供发音质量的反馈指导意见，使得语音质量评价系统更加智能化。

附图说明

图1是本实用新型提供的语音采集降噪装置的一个实施例的结构示意图；

图2是本实用新型提供的语音降噪电路的一个实施例的结构示意图；

图3是本实用新型提供的语音质量评价系统的一个实施例的结构示意图。

具体实施方式

下面将结合本实用新型实施例中的附图，对本实用新型实施例中的技术方案进行清楚、完整地描述。

参见图1，是本实用新型提供的语音采集降噪装置的一个实施例的结构示意图。

本实施例提供的语音采集降噪装置，包括：近端麦克风100、远端麦克风200、模数转换器300、语音预处理电路400和语音降噪电路500。

其中，所述近端麦克风100通过第一语音通道A与所述模数转换器300连接；所述远端麦克风200通过第二语音通道B与所述模数转换器300连接。具体实施时，本实施例提供的语音采集降噪装置可以消除用户在录音时的背景噪音，近端麦克风100位于装置与用户之间，主要录制由用户发出的目标音频，远端麦克风200与近端麦克风100相比远离声源(目标音频)，主要录制背景噪声。所述模数转换器300的输出端与所述语音预处理电路400的输入端连接；所述语音预处理电路400的输出端与所述语音降噪电路500的输入端连接；所述语音降噪电路500的输出端作为所述语音采集降噪装置的输出端。两路音频信号通过装置中的模数转换(模拟-数字信号转换)器300后形成波形文件，并通过语音预处理电路400进行预处理，包括预加重、分帧和加汉明窗处理，并将完成处理后的语音数据1(带噪目标音频)和语音数据2(背景噪声)传入语音降噪电路500中进行语音增强处理。

由于本实施例提供的语音采集降噪装置设置有两个麦克风，因此可以利用近端麦克风100和远端麦克风200来实现噪声对消，从而从带噪音频中直接消去背景噪声。由于语音信号和噪音混合在一起，因此噪声对消的关键技术是要得到噪声的准确复制。如果采集到的噪声足够逼真的话，甚至可以在时域上直接相减。在强背景噪声中，这种解决方案可以得到较好的消除噪声的效果。双麦克风噪声对消方案可以用于平稳噪声的消除，也可以用于非平稳噪声的消除。由于采用噪声对消法的时候，麦克风之间必须有一定的间隔距离，因此采集到的信号之间会有时间差，即实时采集的信号中包含的噪声段是不同的，同时回声和其他不可避免的衰变特性也会影响所采集噪声的特性。因此采集到的噪声必须使用自适应数字滤波器进行滤波，以得到尽可能接近带噪声语音中的噪声。

参见图2，是本实用新型提供的语音降噪电路的一种实施例的结构示意图。

所述语音降噪电路包括：第一FFT(Fast Fourier Transformation，快速傅里叶变换)电路501、第二FFT电路502、自适应滤波器503、谱减电路504、相位恢复电路505和IFFT(Inverse Fast Fourier Transform，FFT逆变换)电路506。

所述第一FFT电路501的输入端和所述第二FFT电路502的输入端分别与所述语音预处理电路400连接。其中，语音预处理电路400将完成处理后的语音数据1(带噪目标音频)输送至第一FFT电路501，将语音数据2(背景噪声)输送至第二FFT电路502分别进行傅里叶变换，对各帧语音信号求功率谱，采集到的背景噪声使用自适应数字滤波器503进行滤波，以得到尽可能接近带噪声语音中的噪声。

所述第一FFT电路501的输出端与所述自适应滤波器503的输入端连接；所述自适应滤波器503的输出端与所述谱减电路504的输入端连接；所述谱减电路504的输出端与所述相位恢复电路505的输入端连接；

所述第二FFT电路502的输出端与所述谱减电路504的输入端、所述相位恢复电路505的输入端分别连接；所述相位恢复电路505与所述IFFT电路506的输入端连接；所述IFFT电路506的输出端为所述语音降噪电路500的输出端。

优选地，所述IFFT电路506还集成有语音帧组合电路和去加重电路。

具体实施时，谱减电路504用于根据两个FFT电路计算得出的语音信号功率谱，在频域将噪声的频谱分量从各帧带噪语音帧的频谱中过滤掉，从而获得目标音频的频谱估计值；再通过相位恢复电路505插入相位谱，以获得语音谱。IFFT电路506对语音谱进行傅里叶逆变换，其集成的语音帧组合电路将频谱还原为语音时域信号。进一步地，IFFT电路506集成的去加重电路可以实现对语音去加重处理，得到最终的纯净的语音数据。

优选地，本实施例提供的所述语音降噪电路500可集成在移动终端(如智能手机、便携式计算机等)的基带芯片中。可以通过移动终端上的音频输入插孔分别与所述近端麦克风100、所述远端麦克风200一一对应连接，将两路麦克风接入的音频数据接入至移动终端的声卡中，然后经历模数转换器300、语音预处理电路400和语音降噪电路500的处理后，获得所需的目标语音数据。

本实施例充分考虑了用户的应用场景、操作习惯，通过外置的双麦克风分别收集目标带噪语音和背景噪声，通过噪声对消和谱减电路过滤掉目标语音中夹杂的噪声和背景噪声。本实施例使用的技术方案已通过实验证明有效，满足用户对语音质量要求越来越高的应用需要。

参看图3，是本实用新型提供的语音质量评价系统的一种实施例的结构示意图。

本实施例利用前文所述的语音采集降噪装置，结合智能手机系统控制电路和网络服务器组建一种语音质量评价系统。

如图3所示，语音采集降噪装置31可为前述任意一项语音采集降噪装置，并且，所述语音采集降噪装置31的输出端通过数据线与所述智能手机系统控制电路32的输入端连接；所述智能手机系统控制电路32的输出端通过移动通信网络与所述网络服务器33连接。

具体实施时，语音采集降噪装置31和智能手机系统控制电路32均可优选安装在智能手机上，因此，本实施例提供的语音质量评价系统可以利用与智能手机录入目标音频与背景噪声，经由智能手机的处理与移动通信网络的传输后送至网络服务器33进行质量评价。譬如，系统用户面对手机屏幕朗读语料，并录音，通过移动通信网络将测试录音发送到服务器，服务器通过一系列运算，将测试结果和发音指导意见返回到手机，供用户参考。

通常情况下，用户会选择相对安静的场景进行录音，如英语口语练习，此应用场景下的背景噪音主要是由所属环境的背景噪音组成，该噪音在用户录音期间保持稳定。本实施例提供的语音采集降噪装置31主要用于消除用户使用手机进行英语口语练习录音时的背景噪音；而智能手机系统控制电路32作为转发语音数据的承载，可以对语音采集降噪装置31的语音数据进行存储，与网络服务器33进行语音数据交互，还可以将从语音采集降噪装置31和网络服务器33所接收到的数据进行显示。

如图3所示，优选地，所述智能手机系统控制电路32包括音频存储电路321、数据收发电路322和显示电路323。

所述音频存储电路321的输入端与所述语音采集降噪装置31的输出端连接；所述音频存储电路321的输出端与所述数据收发电路322的输入端连接；所述数据收发电路322的输出端与所述显示电路323连接；所述数据收发电路322的数据端通过所述移动通信网络与所述网络服务器33连接。具体实施时，所述数据收发电路322为无线网卡。而音频存储电路321可以包括有Flash(闪存)存储器或RAM存储器(Random Access Memory，易挥发性随机存取存储器)。具体地，智能手机上还可以进一步集成有显示器、声音播放设备、控制器/计算器、触控键盘等设备。

进一步地，所述网络服务器33包括音频接收电路331、音频特征提取电路332，以及音频识别与评价电路333。

所述音频接收电路331的输入端与通过所述移动通信网络与所述数据收发电路322的数据端连接；所述音频接收电路331的输出端与所述音频特征提取电路332的输入端连接；所述音频特征提取电路332的输出端与所述音频识别与评价电路333的输入端连接；所述音频识别与评价电路333的输出端通过所述移动通信网络与所述数据收发电路322的数据端连接。

本实用新型提供的语音质量评价系统将包含双麦克风的语音采集降噪装置通过数据线和用户智能手机进行连接，使用降噪装置指定的近端麦克风录制发音语料，用户通过安装在智能手机的系统控制电路与语音采集降噪装置进行交互。语音质量评价系统依靠语音采集降噪装置进行语音增强，并将降噪之后的纯净语音数据存放在智能手机系统控制电路中的音频存储电路，用户可以使用智能手机进行语音回放。通过智能手机系统控制电路的触发按钮，将待识别与评价的语音数据经由智能手机的数据发送/接收电路(即无线网卡)，通过移动通信网络发送到远端的网络服务器。网络服务器已经搭载了相应的电路，依次对语音数据进行接收预处理、特征提取和识别评价，并将最终的语音识别与发音质量评价结果返回到智能手机，用户通过智能手机的显示电路，可以查看结果和发音质量的反馈指导意见。

本实施例提供的语音质量评价系统，有效地消除声源夹杂的噪声，实现对录入移动终端的语音的质量评价，满足对语音质量的更为严格的需求，可以查看语音采集结果和提供发音质量的反馈指导意见，使得语音质量评价系统更加智能化。

以上所述是本实用新型的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本实用新型原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本实用新型的保护范围。

Claims

1.一种语音采集降噪装置，其特征在于，包括：近端麦克风、远端麦克风、模数转换器、语音预处理电路和语音降噪电路；

2.如权利要求1所述的语音采集降噪装置，其特征在于，所述语音降噪电路包括：第一傅里叶变换电路、第二傅里叶变换电路、自适应滤波器、谱减电路、相位恢复电路和傅里叶逆变换电路；

3.如权利要求2所述的语音采集降噪装置，其特征在于，所述傅里叶逆变换电路还集成有语音帧组合电路和去加重电路。

4.如权利要求3所述的语音采集降噪装置，其特征在于，所述语音降噪电路集成在移动终端的基带芯片中。

5.一种语音质量评价系统，其特征在于，包括：如权利要求1～4任一项所述的语音采集降噪装置，智能手机系统控制电路和网络服务器；

6.如权利要求5所述的语音质量评价系统，其特征在于，所述智能手机系统控制电路包括音频存储电路、数据收发电路和显示电路；

7.如权利要求6所述的语音质量评价系统，其特征在于，所述数据收发电路为无线网卡。

8.如权利要求6所述的语音质量评价系统，其特征在于，所述网络服务器包括音频接收电路、音频特征提取电路，以及音频识别与评价电路；