CN1979639A

CN1979639A - 静音处理装置及方法

Info

Publication number: CN1979639A
Application number: CNA2005101021006A
Authority: CN
Inventors: 连文钏; 蔡文升; 李海生; 谢冠宏; 刘夺; 王成
Original assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Current assignee: Hongfujin Precision Industry Shenzhen Co Ltd; Hon Hai Precision Industry Co Ltd
Priority date: 2005-12-03
Filing date: 2005-12-03
Publication date: 2007-06-13
Anticipated expiration: 2025-12-03
Also published as: CN1979639B; US20070133589A1

Abstract

一种静音处理装置及方法，该方法包括步骤取样来自麦克风的信号；计算一时间间隔内取样信号的能量；获取该时间间隔内取样信号的最大振幅值；如果该时间间隔内取样信号的能量小于一预定能量值且该时间间隔内取样信号的最大振幅值小于一预定振幅值，发送静音帧标识该时间间隔内取样信号，否则，编码该时间间隔内取样信号；输出静音帧或编码信号。利用该装置及方法可在网络交谈过程中对交谈者语音进行正常编码，而对交谈者静音部分只标记为静音帧，从而减少网络数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

Description

静音处理装置及方法

【技术领域】

本发明是关于一种静音处理装置及方法，尤指一种用于网络交谈中的静音处理装置及方法。

【背景技术】

随着通信网络及业务的蓬勃发展，多方通话业务已成为公共交换电信网/综合业务数字网、分组语音网和移动网必备的补充业务，同时在上述网络中会议电话和会议电视业务应用也越来越广泛。基本的语音业务仅涉及两个通话方，通话双方可互相听到对方的声音，而在多方通话业务和会议业务中，同时通话方可能不止两方，其中任意一方的语音信号都应可以被传送至所有其他通话方，而每一通话方都应同时可听到多个其他通话方的声音。因此在多方通话中，语音质量是通话者所关注的一个重点。

而在通信服务中，语音对带宽十分敏感，为了保障语音的质量，必须尽量减少数据的传输。通常在通话交谈过程中，语音信号只占整个音频数据流的50％，而在视频会议或者视频聊天等VOIP(Voice OverIP，以IP网络为载体的语音传输技术)业务中，甚至会更低。

【发明内容】

因此把语音信号从音频数据流中提取出来，对于节约系统资源是十分必要的。将语音信号从音频数据流中提取出来后，则只需保存、处理所述语音信号，而其他部分的数据(例如，静音)则可以忽略掉，从而降低了存储空间，同时减少了数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

基于上述内容，有必要提供一种静音处理装置，该静音处理装置可以在多人网络交谈过程中对交谈者发言的语音进行正常编码，而对交谈者的静音部分只标记为静音帧，从而减少网络上的数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

还有必要提供一种静音处理方法，该静音处理方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码，而对交谈者的静音部分只标记为静音帧，从而减少网络上的数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

所述静音处理装置，包括一取样单元，用于取样来自麦克风的信号；一能量计算单元，用于计算一时间间隔内取样信号的能量；一振幅值获取单元，用于获取该时间间隔内取样信号的最大振幅值；一编码单元，用于编码取样的信号；一处理单元，当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时，发送静音帧标识该时间间隔内取样信号，否则，控制编码单元编码该时间间隔内取样信号；及一输出单元，用于输出静音帧或编码单元产生的编码信号。

该静音处理装置还包括一易失性存储单元用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量；一非易失性存储单元用于存储预定振幅值及预定能量值。

所述静音处理方法，其包括以下步骤：(a)取样来自麦克风的信号；(b)计算一时间间隔内取样信号的能量；(c)获取该时间间隔内取样信号的最大振幅值；(d)如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值，发送静音帧标识该时间间隔内取样信号，否则编码该时间间隔内取样信号；及(e)输出静音帧或编码信号。

该静音处理方法还包括步骤：提供一易失性存储单元及一非易失性存储单元，其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量，非易失性存储单元存储预定振幅值及预定能量值。

相较于现有技术，该静音处理装置及方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码，而对交谈者的静音部分只标记为静音帧，从而减少网络上的数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

【附图说明】

图1是一实施方式中静音处理装置的硬件架构图。

图2是一实施方式中静音处理方法的流程图。

【具体实施方式】

如图1所示，是一实施方式中静音处理装置的硬件架构图。该静音处理装置包括一取样单元10、一能量计算单元11、一振幅值获取单元12、一编码单元13、一输出单元14、一处理单元15、一易失性存储单元16及一非易失性存储单元17。其中取样单元10，用于按一预定的频率，取样来在自麦克风的信号。能量计算单元11，用于计算一时间间隔内取样信号的能量，其中该时间间隔的长度可根据具体的应用情况而采用不同的时长。振幅值获取单元12，用于获取该时间间隔内取样信号的最大振幅值。编码单元13，用于编码时间间隔内取样信号。输出单元14，用于输出静音帧或编码单元13产生的编码信号。处理单元15，用于控制各单元的操作：当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时，发送静音帧标识该时间间隔内取样信号，否则，控制编码单元13编码该时间间隔内取样信号。易失性存储单元16，用于存储取样的信号、时间间隔内取样的信号的最大振幅值及时间间隔内取样信号的能量。非易失性存储单元17，用于存储上述预定振幅值及预定能量值。

在本实施方式中，当一时间间隔内取样信号的最大振幅值大于等于预定振幅值且该时间间隔内取样信号的能量大于等于预定能量值时，表明该时间间隔内交谈者正处于发言阶段，编码单元13对该时间间隔内取样信号进行语音编码；当一时间间隔内取样信号的最大振幅值小于预定振幅值但该时间间隔内取样信号的能量大于等于预定能量值时或当一时间间隔内取样信号的最大振幅值大于等于预定振幅值但该时间间隔内取样信号的能量小于预定能量值时，表明该时间间隔内交谈者处于停顿但并未停止发言，编码单元13对该取样信号进行语音编码；当一时间间隔内取样信号的最大帧幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值时，表明该时间间隔内交谈者停止发言开始处于静音阶段，对该取样信号不进行语音编码，而只发送该静音帧，从而减少网络上数据传输量，节约网络带宽，减少网络堵塞，提高语音质量。

如图2所示，是一实施方式中静音处理方法的流程图。首先，取样单元10实时取样来自麦克风的信号(步骤S20)。能量计算单元11计算一时间间隔内取样信号的能量(步骤S21)。振幅值获取单元12获取该时间间隔内取样信号的最大振幅值(步骤S22)。处理单元15判断该时间间隔内取样信号的最大振幅值是否小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值(步骤S23)。

如果该时间间隔内取样信号的最大振幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值，发送静音帧标识该时间间隔内取样信号(步骤S24)。能量计算单元11计算下一个时间间隔内取样信号的能量，并返回执行步骤S22(步骤S25)。

否则，编码单元13编码该时间间隔内取样信号并通过输出单元14输出该编码信号(步骤S26)。能量计算单元11计算下一个时间间隔内取样信号的能量，并返回执行步骤S22(步骤S27)。

在上述流程中，当交谈者停止网络交谈时，整个流程终止。

Claims

1.一种静音处理装置，用于处理网络上多人交谈过程中产生的静音，其特征在于该装置包括：

一取样单元，用于取样来自麦克风的信号；

一能量计算单元，用于计算一时间间隔内取样信号的能量；

一振幅值获取单元，用于获取一时间间隔内取样信号的最大振幅值；

一编码单元，用于编码取样的信号；

一处理单元，当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量时，发送静音帧标识该时间间隔内的取样信号，否则，该处理单元控制编码单元编码该时间间隔内取样信号；及

一输出单元，用于输出静音帧或编码单元产生的编码信号。

2.如权利要求1所述的静音处理装置，其特征在于，还包括一易失性存储单元，用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量。

3.如权利要求2所述的静音处理装置，其特征在于，还包括一非易失性存储单元，用于存储所述预定振幅值及预定能量值。

4.一种静音处理方法，用于处理网路上多人交谈过程中产生的静音，其特征在于该方法包括以下步骤：

取样来自麦克风的信号；

计算一时间间隔内取样信号的能量；

获取该时间间隔内取样信号的最大振幅值；

如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值，发送静音帧标识该时间间隔内取样信号，否则，编码该时间间隔内取样信号；及

输出静音帧或编码信号。

5.如权利要求4所述的静音处理方法，其特在于，还包括步骤：

提供一易失性存储单元及一非易失性存储单元，其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量，非易失性存储单元存储预定振幅值及预定能量值。