CN203311843U

CN203311843U - 高噪声环境下正确识别语音的装置

Info

Publication number: CN203311843U
Application number: CN2013204033611U
Authority: CN
Inventors: 杨军; 孙健; 夏俊伟; 曾庆庆; 叶建性; 夏永明
Original assignee: BEIJING DINGLIANG TECHNOLOGY Co Ltd
Current assignee: BEIJING DINGLIANG TECHNOLOGY Co Ltd
Priority date: 2013-07-08
Filing date: 2013-07-08
Publication date: 2013-11-27
Anticipated expiration: 2023-07-08

Abstract

本实用新型提供一种高噪声环境下正确识别语音的装置，包括：DSP数字信号处理器、语音接收单元、语音回放单元和显示器；其中，所述DSP数字信号处理器内置有中央处理器、存储器、通信接口、逻辑开关量I/O控制接口和A/D转换器；所述中央处理器分别与所述存储器、所述通信接口、所述逻辑开关量I/O控制接口、所述显示器和所述语音回放单元连接；所述中央处理器还通过所述A/D转换器与所述语音接收单元连接。本实用新型提供的高噪声环境下正确识别语音的装置，无需任何模拟滤波器，装置完全集成化，采用DSP数字信号处理器进行语音识别，为一种数字语音识别装置，具有体积小、结构简单、通用性强以及识别准确度高的优点。

Description

高噪声环境下正确识别语音的装置

技术领域

本实用新型涉及一种语音识别装置，具体涉及一种高噪声环境下正确识别语音的装置。

背景技术

现有技术中，语音识别装置通常采用模拟滤波和MCU进行语音处理。采用模拟滤波装置具有以下不足：(1)模拟滤波装置通常体积较大，结构复杂；(2)过滤噪声范围受元件参数制约，调整不方便；(3)过滤噪声范围易受环境温度影响，易造成识别出错，进而导致操作或控制失误。

实用新型内容

针对现有技术存在的缺陷，本实用新型提供一种高噪声环境下正确识别语音的装置，具有体积小、结构简单、通用性强以及识别准确度高的优点。

本实用新型采用的技术方案如下：

本实用新型提供一种高噪声环境下正确识别语音的装置，包括：DSP数字信号处理器、语音接收单元、语音回放单元和显示器；其中，所述DSP数字信号处理器内置有中央处理器、存储器、通信接口、逻辑开关量I/O控制接口和A/D转换器；所述中央处理器分别与所述存储器、所述通信接口、所述逻辑开关量I/O控制接口、所述显示器和所述语音回放单元连接；所述中央处理器还通过所述A/D转换器与所述语音接收单元连接。

优选的，所述语音接收单元包括拾音器和信号调理电路；所述拾音器通过所述信号调理电路连接到所述A/D转换器。

优选的，所述拾音器为话筒或麦克风。

优选的，所述语音回放单元包括音频放大器和扬声器；所述中央处理器的输出端与所述音频放大器的输入端连接；所述音频放大器的输出端与所述扬声器的输入端连接。

本实用新型的有益效果如下：

本实用新型提供的高噪声环境下正确识别语音的装置，采用DSP数字信号处理器进行语音识别，为一种数字语音识别装置，具有体积小、结构简单、通用性强以及识别准确度高的优点。

附图说明

图1为本实用新型提供的高噪声环境下正确识别语音的装置的结构示意图；

图2为本实用新型提供的高噪声环境下正确识别语音的装置的控制原理图。

具体实施方式

以下结合附图对本实用新型进行详细说明：

如图1所示，本实用新型提供一种高噪声环境下正确识别语音的装置，包括：DSP数字信号处理器、语音接收单元、语音回放单元和显示器；其中，所述DSP数字信号处理器内置有中央处理器、存储器、通信接口、逻辑开关量I/O控制接口和A/D转换器；所述中央处理器分别与所述存储器、所述通信接口、所述逻辑开关量I/O控制接口、所述显示器和所述语音回放单元连接；所述中央处理器还通过所述A/D转换器与所述语音接收单元连接。

以下对上述各部件详细说明：

(一)语音接收单元

语音接收单元包括拾音器、信号调整电路和DSP内置A/D转换器；其中，拾音器为话筒或麦克风。所述拾音器的输出端与所述信号调理电路的输入端连接；所述信号调理电路的输出端与内置A/D转换器的输入端连接；内置A/D转换器的输出端与中央处理器的输入端连接。

语音接收单元主要用于接收训练语音或辨识语音：接收训练语音，储存使用者的语音命令；接收辨识语音，与多个训练语音比较辨识，并按功能设置，通过逻辑开关量I/O控制接口输出不同的操作逻辑信号。

(二)语音回放单元

语音回放单元包括音频放大器和扬声器；所述中央处理器的输出端与所述音频放大器的输入端连接；所述音频放大器的输出端与所述扬声器的输入端连接。

其作用为：当实现清晰的语音通信或在对操作命令识别后，按功能设置进行相应操作时，为进一步提高操作正确率，在每一个指令收到后，本装置会通过语音回放回馈给使用者，便于及时确认，使控制正确率达到100％。

(三)逻辑开关量I/O控制接口

逻辑开关量I/O控制接口用于执行不同的操作，控制电路实现对多种设备的控制。

(四)DSP数字信号处理器

DSP数字信号处理器的作用主要包括：(1)DSP接收训练语音或辨识语音；(2)DSP对环境噪声进行过滤、消噪和语音信号的闭环音量自动调节，使语音不受环境噪声和音量的影响，实现清晰的通信或正确的语音训练储存和语音识别。(3)语音训练：从语音信号中提取出语音特征信息，建立一个特征模型，语音信号使用数据压缩技术，存储于存储器，可储存多个训练语音。(4)语音识别：DSP对采集到的语音样本进行类似的分析处理，提取出语音的特征信息，然后将这个特征信息模型与已有的特征模型信号进行对比，如果二者达到了一定的匹配度，则输入的语音被识别。(5)经过语音识别后，可实现多种操作功能，针对不同语音命令进行操作或控制。例如：包括各种开关控制和运动控制。(6)为进一步提高正确率，在每一个指令收到后，DSP会通过语音回放回馈给使用者，便于及时确认，使控制正确率达到100％。并由DSP给控制接口以逻辑指令以执行下一步操作。(7)整个装置工作状况由显示器指示。(8)整个装置还可以过通信接口应用于多平台的控制，可以走向工业机器人控制应用领域。

由于数字信号处理具有可程控性、可重复性，抗干扰性能好，可以实现自适应算法、数据压缩，它具有模拟信号的不可替代的特性。

控制原理如图2所示，接收语音通过话筒或麦克风传输给DSP，DSP采用低价、应用广泛的TI公司TMS320LF2407A(内嵌有内置A/D转换器、存储器、逻辑开关量I/O控制接口和通信接口)，与通用的CPU和微处理器MCU相比，TMS320LF2407A具有很强的数字信息处理功能，集C2xx内核增强型TMS320设计结构及低功耗、高性能、优化外围电路于一体，16位数字信号处理，带有硬件乘法器和乘加指令，几乎每条指令可在25ns(40MIPS)完成，语音经10位高速(S/H+Conversion＝500ns)A/D转换器语音转换等数字信息处理能力为本实用新型提供合适的硬件基础。语音识别对象是语音，决定音源质量的关键参数是“采样率”，只要选择采样率＞48KHz就可达到CD音质，实现对语音的高音质精确采集，确保整体数据处理分析的精度。一般的MCU是难以达到的，并由DSP进一步作数字信号处理，完成噪声抑制，数值PID控制、数据压缩技术等。把语音信号处理要求和DSP数字信息处理技术结合起来实现高质量语音通信和正确的语音识别。

在DSP提供高速数字信号处理硬件基础上，进行有效数字信号处理技术开发，通过研究人类语音特色，进行细微的频谱分析，同时对各种环境噪声和各种装备工作时产生的噪声开展频谱研究和统计分析，鉴别出环境噪声与人类语音的差别，在此基础上，得出数字滤波传递函数，进行滤波，抑制环境噪声，开发出语音识别软件进行语音识别。

借助TMS320F2407DSP的高速数据处理能力，采用改进的FFT算法，分析频谱，再通过采样滤波的设计达到实时语音信号滤波。

另外，通用以下方式数学运算处理达到对音源信号进行频域滤波，同时使其具有较好的频率选择性和灵活性：

将信号从时域变换到频域形式通常采用傅立叶变换，对于离散化的周期信号而言，快速傅立叶变换(FFT)无疑是分析语音波形的最好的算法之一，利用FFT可以直接得到波形所含的各频谱分量。FFT是离散傅立叶变换(DFT)的一种快速算法。由于在计算DFT时，一次复数乘法需用四次实数乘法和二次实数加法；一次复数加法则需二次实数加法。每运算一个X(k)需要4N次复数乘法及2N+2(N-1)＝2(2N-1)次实数加法。所以整个DFT运算总共需要4N2次实数乘法和N*2(2N-1)＝2N(2N-1)次实数加法。如此一来，计算时乘法次数和加法次数都是和N2成正比的，当N很大时，运算量是可观的，因而需要改进对DFT的算法减少运算速度。根据傅立叶变换的对称性和周期性，可以将DFT运算中有些项合并和有限项简化。

设序列长度为N＝2L，L为整数。将N＝2L的序列x(n)(n＝0，1，…，N-1)，按N的奇偶分成两组，也就是说我们将一个N点的DFT分解成两个N/2点的DFT，他们又重新组合成一个如下式所表达的N点DFT：

X (k) = Σ_{n = 0}^{\frac{N}{2} - 1} x_{1} (n) W_{\frac{N}{2}}^{nk} + W_{N}^{k} Σ_{n = 0}^{\frac{N}{2} - 1} x_{2} (n) W_{\frac{N}{2}}^{nk} = X_{1} (n) + W_{N}^{k} X_{2} (n)

上式FFT运算序列是混乱的，但经分析，信号流程有一定规律-即位码倒置，本实用新型使用了位倒序的减接寻址方式和乘累加、移位累加指令实现

利用快速傅立叶变换(FFT)对输入信号进行离散傅立叶变换分析其频谱，然后利用FIR数字滤波器，滤波器设计方法是利用滤波理论设计满足要求的传递函数H(s)，依据H(s)求出相应的数字滤波器传递函数H(z)，根据所希望的频率特性进行滤波，这种办法具有较好的频率选择性和灵活性。

离散量闭环音量自动调节，采用离散量PID调节，使语音不受环境噪声和音量的影响。

语音识别主要分为“训练”和“识别”两个阶

在训练阶段，DSP对采集到的语音样本进行分析处理，从中提取出语音特征信息，建立一个特征模型，存储于存储器中；在识别阶段，DSP对采集到的语音样本进行类似的分析处理，提取出语音的特征信息，然后将这个特征信息模型与已有的特征模型信号进行对比，如果二者达到了一定的匹配度，则输入的语音被识别，做出相应动作。

通过DSP数字信号处理器的数字信号处理能力，采用数学运算处理方法，对环境噪声进行过滤、抑制、同时对语音信号幅值进行离散量的闭环音量自动调节，使语音不受环境噪声和音量的影响，实现高标准语音通信。当使用者通过语音训练储存使用者的语音后，使用者的语音传给DSP系统时，即可实现正确识别，并按需要进行相应操作。

综上所述，本实用新型提供的高噪声环境下正确识别语音的装置，无需任何模拟滤波器，装置完全集成化，采用DSP数字信号处理器进行语音识别，为一种数字语音识别装置，具有体积小、结构简单、成本低廉、通用性强以及识别准确度高的优点。

以上所述仅是本实用新型的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本实用新型原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本实用新型的保护范围。

Claims

1.一种高噪声环境下正确识别语音的装置，其特征在于，包括：DSP数字信号处理器、语音接收单元、语音回放单元和显示器；其中，所述DSP数字信号处理器内置有中央处理器、存储器、通信接口、逻辑开关量I/O控制接口和A/D转换器；所述中央处理器分别与所述存储器、所述通信接口、所述逻辑开关量I/O控制接口、所述显示器和所述语音回放单元连接；所述中央处理器还通过所述A/D转换器与所述语音接收单元连接。

2.根据权利要求1所述的高噪声环境下正确识别语音的装置，其特征在于，所述语音接收单元包括拾音器和信号调理电路；所述拾音器通过所述信号调理电路连接到所述A/D转换器。

3.根据权利要求2所述的高噪声环境下正确识别语音的装置，其特征在于，所述拾音器为话筒或麦克风。

4.根据权利要求1所述的高噪声环境下正确识别语音的装置，其特征在于，所述语音回放单元包括音频放大器和扬声器；所述中央处理器的输出端与所述音频放大器的输入端连接；所述音频放大器的输出端与所述扬声器的输入端连接。