CN201765819U

CN201765819U - 一种低功耗话音端点检测模块

Info

Publication number: CN201765819U
Application number: CN2010201012145U
Authority: CN
Inventors: 梁峰; 杨勇; 张凡; 曹军勤; 杨森; 张勋勋
Original assignee: Shaanxi Fenghuo Communication Group Co Ltd
Current assignee: Shaanxi Fenghuo Communication Group Co Ltd
Priority date: 2010-01-22
Filing date: 2010-01-22
Publication date: 2011-03-16
Anticipated expiration: 2020-01-22

Abstract

本实用新型公开了一种低功耗话音端点检测模块，包括话音信号检测单元、采用短时能量与短时平均过零率相结合的特征量统计方法对话音信号检测单元所检测的话音信号进行话音端点检测的处理器单元以及分别与话音信号检测单元和处理器单元相接的电源管理模块；所述处理器单元包括由主处理器和与主处理器相接的协处理器组成的双核信号处理单元以及与主处理器相接的FPGA现场可编程门阵列模块，所述话音信号检测单元接主处理器。本实用新型设计新颖合理、接线方便且使用操作简便，采用短时能量和短时过零率相结合的方法进行判决，减少了话音检测过程出现的误判漏判，并且运算量少，功耗低，适用于各种低速处理平台。

Description

一种低功耗话音端点检测模块

技术领域

本实用新型属于话音端点检测技术领域，尤其是涉及一种低功耗话音端点检测模块。

背景技术

各种话音端点检测(VAD)技术的根本出发点都在于寻找能够有效区分话音段与无话音噪声背景的统计判断量，最终归结为门限设置。目前，主要使用的传统的统计特征量方法包括：短时能量、短时过零率、短时自相关函数、信息熵、倒谱及MEL系数等方法，不同VAD检测方法大多基于这几种方法的不同组合。

一般来说，单一的统计判断量的检测效果并不理想，往往仅适合某些场合，不同VAD方法的适用范围有所不同。由于不同环境下的背景噪声变化较大，且话音随者说话人的性别、年龄、语种、声调、声强、语速等变化而变化，因此，基于多统计量与多判决门限的联合判决准则成为VAD检测研究的方向，但多门限的判决往往要求处理器的处理能力比较高，功耗比较大，对于一些处理能力较低的平台如单片机、ARM7处理器等则无法正常运行。

实用新型内容

本实用新型所要解决的技术问题在于针对上述现有技术中的不足，提供一种低功耗话音端点检测模块，其设计新颖合理、接线方便且使用操作简便，采用短时能量和短时过零率相结合的方法进行判决，减少了话音检测过程出现的误判漏判，并且运算量少，功耗低，适用于各种低速处理平台。

为解决上述技术问题，本实用新型采用的技术方案是：一种低功耗话音端点检测模块，其特征在于：包括话音信号检测单元、采用短时能量与短时平均过零率相结合的特征量统计方法对话音信号检测单元所检测的话音信号进行话音端点检测的处理器单元以及分别与话音信号检测单元和处理器单元相接的电源管理模块；所述处理器单元包括由主处理器和与主处理器相接的协处理器组成的双核信号处理单元以及与主处理器相接的FPGA现场可编程门阵列模块，所述话音信号检测单元接主处理器。

所述话音信号检测单元包括语音传感器和与语音传感器相接的A/D采样电路，所述A/D采样电路接主处理器。

还包括分别与主处理器相接的A/D转换模块和D/A转换模块。

所述主处理器和协处理器为ARM处理器或DSP数字信号处理器。

本实用新型与现有技术相比具有以下优点：

1、设计新颖合理、接线方便且使用操作简便，智能化程度高。

2、过零率算法采用双重过零门限，减少在高噪声背景下出现的虚假过零率，从而减少话音误判。

3、运算量少，功耗低，适用于各种低速处理平台，例如单片机、ARM7等处理平台。

4、采用短时能量和短时过零率相结合的方法进行判决，具体是采用短时能量的统计特征，分清浊音段；采用短时过零率统计量，分清清音段，减少了话音检测过程出现的误判漏判。

5、采用实时统计方法，减少话音句与句之间的误判，较少话音之间的间断。

综上所述，本实用新型设计新颖合理、接线方便且使用操作简便，采用短时能量和短时过零率相结合的方法进行判决，减少了话音检测过程出现的误判漏判，并且运算量少，功耗低，适用于各种低速处理平台。

下面通过附图和实施例，对本实用新型的技术方案做进一步的详细描述。

附图说明

图1为本实用新型的电路原理框图。

图2为利用本实用新型进行话音端点检测的方法流程图。

附图标记说明：

1-话音信号检测单元； 1-1-语音传感器； 1-2-A/D采样电路；

2-处理器单元； 2-1-主处理器； 2-2-协处理器；

2-3-FPGA现场可编程门阵列模块； 2-4-A/D转换模块； 2-5-D/A转换模块；

3-电源管理模块。

具体实施方式

如图1所示，本实用新型包括话音信号检测单元1、采用短时能量与短时平均过零率相结合的特征量统计方法对话音信号检测单元1所检测的话音信号进行话音端点检测的处理器单元2以及分别与话音信号检测单元1和处理器单元2相接的电源管理模块3。所述处理器单元2包括由主处理器2-1和与主处理器2-1相接的协处理器2-2组成的双核信号处理单元以及与主处理器2-1相接的FPGA现场可编程门阵列模块2-3，所述话音信号检测单元1接主处理器2-1。

本实施例中，所述话音信号检测单元1包括语音传感器1-1和与语音传感器1-1相接的A/D采样电路1-2，所述A/D采样电路1-2接主处理器2-1。同时，本实用新型还包括分别与主处理器2-1相接的A/D转换模块2-4和D/A转换模块2-5。实际使用过程中，所述主处理器2-1和协处理器2-2为ARM处理器或DSP数字信号处理器，也就是说，可以选择相应型号的ARM处理器或DSP数字信号处理器作为主处理器2-1和协处理器2-2，只要主处理器2-1和协处理器2-2相结合能实现话音端点检测功能即可。

本实用新型的工作原理是：由于短时平均过零率是语音信号时域分析中最简单的一种特征，它是指每帧内信号通过零值的次数，定义为

Z_{n} = \frac{1}{2} Σ_{m = n}^{n + N - 1} | sgn [(x_{w})] - sgn [x_{w} (m - 1)] | :

在浊音段，一般具有较低的过零率；而在清音段具有较高的过零率，这样可以通过短时平均过零率来初步判断并区分清音和浊音。另外，语音信号的短时能量定义为：

E_{n} = Σ_{m = 0}^{N - 1} x_{n}^{2} (m),

而语音和噪声的区别则体现在各自的能量上，语音段的能量比噪声段的能量大，如果环境噪声和系统输入的噪声比较小，只要计算输入信号的短时能量就能够把语音段和噪声背景区分开，除此之外，用基于能量的检测方法来检测浊音通常效果也是比较理想的，因为浊音的能量值比清音大得多，可以判断浊音和清音之间过渡的时刻；但基于能量的检测方法对清音来说，检测效果不是很好。综上，将上述短时平均过零率和短时能量两种检测方法结合起来，通过短时能量分析去除高频环境噪声的干扰，用短时平均过零率分析再相应去除低频信号的干扰，则能够取得较好的检测效果。

结合图2，本实用新型进行话音端点检测的过程如下：首先通过处理器单元2分别设定短时平均过零率和短时能量检测方法中所需设定的门限值。实际检测时，话音信号检测单元1实时将其所检测语音(或话音)信号传送至处理器单元2；处理器单元2首先对所接收的语音信号进行加窗和分帧，之后计算得出分帧后语音信号前20帧的平均过零率(即采用短时平均过零率分析法)和平均能量(即采用短时能量分析法)并将计算结果即实际数值与预先设定的门限值(即初始门限)进行比较：当比较得出实际数值小于预先设定的门限值时则说明初始无话音，否则对预先设定的门限值进行修改；预先设定的门限值修改后，处理器单元2计算得出每帧语音信号的过零率和能量即实际值并与修改后的门限值进行比较：当比较得出实际值小于修改后的门限值时说明初步无话音且连续四帧信号均保持无话音时，说明此时无语音；反之，当比较得出实际值大于修改后的门限值时说明初步有话音且连续四帧信号均保持有语音时，说明此时有话音。

以上所述，仅是本实用新型的较佳实施例，并非对本实用新型作任何限制，凡是根据本实用新型技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本实用新型技术方案的保护范围内。

Claims

1.一种低功耗话音端点检测模块，其特征在于：包括话音信号检测单元(1)、对话音信号检测单元(1)所检测的话音信号进行话音端点检测的处理器单元(2)以及分别与话音信号检测单元(1)和处理器单元(2)相接的电源管理模块(3)；所述处理器单元(2)包括由主处理器(2-1)和与主处理器(2-1)相接的协处理器(2-2)组成的双核信号处理单元以及与主处理器(2-1)相接的FPGA现场可编程门阵列模块(2-3)，所述话音信号检测单元(1)接主处理器(2-1)。

2.按照权利要求1所述的一种低功耗话音端点检测模块，其特征在于：所述话音信号检测单元(1)包括语音传感器(1-1)和与语音传感器(1-1)相接的A/D采样电路(1-2)，所述A/D采样电路(1-2)接主处理器(2-1)。

3.按照权利要求1或2所述的一种低功耗话音端点检测模块，其特征在于：还包括分别与主处理器(2-1)相接的A/D转换模块(2-4)和D/A转换模块(2-5)。

4.按照权利要求1或2所述的一种低功耗话音端点检测模块，其特征在于：所述主处理器(2-1)和协处理器(2-2)为ARM处理器或DSP数字信号处理器。