CN1979639A - 静音处理装置及方法 - Google Patents

静音处理装置及方法 Download PDF

Info

Publication number
CN1979639A
CN1979639A CNA2005101021006A CN200510102100A CN1979639A CN 1979639 A CN1979639 A CN 1979639A CN A2005101021006 A CNA2005101021006 A CN A2005101021006A CN 200510102100 A CN200510102100 A CN 200510102100A CN 1979639 A CN1979639 A CN 1979639A
Authority
CN
China
Prior art keywords
sampled signal
time interval
signal
energy
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101021006A
Other languages
English (en)
Other versions
CN1979639B (zh
Inventor
连文钏
蔡文升
李海生
谢冠宏
刘夺
王成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2005101021006A priority Critical patent/CN1979639B/zh
Priority to US11/309,521 priority patent/US20070133589A1/en
Publication of CN1979639A publication Critical patent/CN1979639A/zh
Application granted granted Critical
Publication of CN1979639B publication Critical patent/CN1979639B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种静音处理装置及方法,该方法包括步骤取样来自麦克风的信号;计算一时间间隔内取样信号的能量;获取该时间间隔内取样信号的最大振幅值;如果该时间间隔内取样信号的能量小于一预定能量值且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则,编码该时间间隔内取样信号;输出静音帧或编码信号。利用该装置及方法可在网络交谈过程中对交谈者语音进行正常编码,而对交谈者静音部分只标记为静音帧,从而减少网络数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。

Description

静音处理装置及方法
【技术领域】
本发明是关于一种静音处理装置及方法,尤指一种用于网络交谈中的静音处理装置及方法。
【背景技术】
随着通信网络及业务的蓬勃发展,多方通话业务已成为公共交换电信网/综合业务数字网、分组语音网和移动网必备的补充业务,同时在上述网络中会议电话和会议电视业务应用也越来越广泛。基本的语音业务仅涉及两个通话方,通话双方可互相听到对方的声音,而在多方通话业务和会议业务中,同时通话方可能不止两方,其中任意一方的语音信号都应可以被传送至所有其他通话方,而每一通话方都应同时可听到多个其他通话方的声音。因此在多方通话中,语音质量是通话者所关注的一个重点。
而在通信服务中,语音对带宽十分敏感,为了保障语音的质量,必须尽量减少数据的传输。通常在通话交谈过程中,语音信号只占整个音频数据流的50%,而在视频会议或者视频聊天等VOIP(Voice OverIP,以IP网络为载体的语音传输技术)业务中,甚至会更低。
【发明内容】
因此把语音信号从音频数据流中提取出来,对于节约系统资源是十分必要的。将语音信号从音频数据流中提取出来后,则只需保存、处理所述语音信号,而其他部分的数据(例如,静音)则可以忽略掉,从而降低了存储空间,同时减少了数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
基于上述内容,有必要提供一种静音处理装置,该静音处理装置可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
还有必要提供一种静音处理方法,该静音处理方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
所述静音处理装置,包括一取样单元,用于取样来自麦克风的信号;一能量计算单元,用于计算一时间间隔内取样信号的能量;一振幅值获取单元,用于获取该时间间隔内取样信号的最大振幅值;一编码单元,用于编码取样的信号;一处理单元,当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时,发送静音帧标识该时间间隔内取样信号,否则,控制编码单元编码该时间间隔内取样信号;及一输出单元,用于输出静音帧或编码单元产生的编码信号。
该静音处理装置还包括一易失性存储单元用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量;一非易失性存储单元用于存储预定振幅值及预定能量值。
所述静音处理方法,其包括以下步骤:(a)取样来自麦克风的信号;(b)计算一时间间隔内取样信号的能量;(c)获取该时间间隔内取样信号的最大振幅值;(d)如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则编码该时间间隔内取样信号;及(e)输出静音帧或编码信号。
该静音处理方法还包括步骤:提供一易失性存储单元及一非易失性存储单元,其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量,非易失性存储单元存储预定振幅值及预定能量值。
相较于现有技术,该静音处理装置及方法可以在多人网络交谈过程中对交谈者发言的语音进行正常编码,而对交谈者的静音部分只标记为静音帧,从而减少网络上的数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
【附图说明】
图1是一实施方式中静音处理装置的硬件架构图。
图2是一实施方式中静音处理方法的流程图。
【具体实施方式】
如图1所示,是一实施方式中静音处理装置的硬件架构图。该静音处理装置包括一取样单元10、一能量计算单元11、一振幅值获取单元12、一编码单元13、一输出单元14、一处理单元15、一易失性存储单元16及一非易失性存储单元17。其中取样单元10,用于按一预定的频率,取样来在自麦克风的信号。能量计算单元11,用于计算一时间间隔内取样信号的能量,其中该时间间隔的长度可根据具体的应用情况而采用不同的时长。振幅值获取单元12,用于获取该时间间隔内取样信号的最大振幅值。编码单元13,用于编码时间间隔内取样信号。输出单元14,用于输出静音帧或编码单元13产生的编码信号。处理单元15,用于控制各单元的操作:当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值时,发送静音帧标识该时间间隔内取样信号,否则,控制编码单元13编码该时间间隔内取样信号。易失性存储单元16,用于存储取样的信号、时间间隔内取样的信号的最大振幅值及时间间隔内取样信号的能量。非易失性存储单元17,用于存储上述预定振幅值及预定能量值。
在本实施方式中,当一时间间隔内取样信号的最大振幅值大于等于预定振幅值且该时间间隔内取样信号的能量大于等于预定能量值时,表明该时间间隔内交谈者正处于发言阶段,编码单元13对该时间间隔内取样信号进行语音编码;当一时间间隔内取样信号的最大振幅值小于预定振幅值但该时间间隔内取样信号的能量大于等于预定能量值时或当一时间间隔内取样信号的最大振幅值大于等于预定振幅值但该时间间隔内取样信号的能量小于预定能量值时,表明该时间间隔内交谈者处于停顿但并未停止发言,编码单元13对该取样信号进行语音编码;当一时间间隔内取样信号的最大帧幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值时,表明该时间间隔内交谈者停止发言开始处于静音阶段,对该取样信号不进行语音编码,而只发送该静音帧,从而减少网络上数据传输量,节约网络带宽,减少网络堵塞,提高语音质量。
如图2所示,是一实施方式中静音处理方法的流程图。首先,取样单元10实时取样来自麦克风的信号(步骤S20)。能量计算单元11计算一时间间隔内取样信号的能量(步骤S21)。振幅值获取单元12获取该时间间隔内取样信号的最大振幅值(步骤S22)。处理单元15判断该时间间隔内取样信号的最大振幅值是否小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量值(步骤S23)。
如果该时间间隔内取样信号的最大振幅值小于预定振幅值且该时间间隔内取样信号的能量小于预定能量值,发送静音帧标识该时间间隔内取样信号(步骤S24)。能量计算单元11计算下一个时间间隔内取样信号的能量,并返回执行步骤S22(步骤S25)。
否则,编码单元13编码该时间间隔内取样信号并通过输出单元14输出该编码信号(步骤S26)。能量计算单元11计算下一个时间间隔内取样信号的能量,并返回执行步骤S22(步骤S27)。
在上述流程中,当交谈者停止网络交谈时,整个流程终止。

Claims (5)

1.一种静音处理装置,用于处理网络上多人交谈过程中产生的静音,其特征在于该装置包括:
一取样单元,用于取样来自麦克风的信号;
一能量计算单元,用于计算一时间间隔内取样信号的能量;
一振幅值获取单元,用于获取一时间间隔内取样信号的最大振幅值;
一编码单元,用于编码取样的信号;
一处理单元,当一时间间隔内取样信号的最大振幅值小于一预定振幅值且该时间间隔内取样信号的能量小于一预定能量时,发送静音帧标识该时间间隔内的取样信号,否则,该处理单元控制编码单元编码该时间间隔内取样信号;及
一输出单元,用于输出静音帧或编码单元产生的编码信号。
2.如权利要求1所述的静音处理装置,其特征在于,还包括一易失性存储单元,用于存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量。
3.如权利要求2所述的静音处理装置,其特征在于,还包括一非易失性存储单元,用于存储所述预定振幅值及预定能量值。
4.一种静音处理方法,用于处理网路上多人交谈过程中产生的静音,其特征在于该方法包括以下步骤:
取样来自麦克风的信号;
计算一时间间隔内取样信号的能量;
获取该时间间隔内取样信号的最大振幅值;
如果该时间间隔内取样信号的能量小于一预定能量且该时间间隔内取样信号的最大振幅值小于一预定振幅值,发送静音帧标识该时间间隔内取样信号,否则,编码该时间间隔内取样信号;及
输出静音帧或编码信号。
5.如权利要求4所述的静音处理方法,其特在于,还包括步骤:
提供一易失性存储单元及一非易失性存储单元,其中易失性存储单元存储取样信号、时间间隔内取样信号的最大振幅值及时间间隔内取样信号的能量,非易失性存储单元存储预定振幅值及预定能量值。
CN2005101021006A 2005-12-03 2005-12-03 静音处理装置及方法 Expired - Fee Related CN1979639B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2005101021006A CN1979639B (zh) 2005-12-03 2005-12-03 静音处理装置及方法
US11/309,521 US20070133589A1 (en) 2005-12-03 2006-08-17 Mute processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2005101021006A CN1979639B (zh) 2005-12-03 2005-12-03 静音处理装置及方法

Publications (2)

Publication Number Publication Date
CN1979639A true CN1979639A (zh) 2007-06-13
CN1979639B CN1979639B (zh) 2011-07-27

Family

ID=38130775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101021006A Expired - Fee Related CN1979639B (zh) 2005-12-03 2005-12-03 静音处理装置及方法

Country Status (2)

Country Link
US (1) US20070133589A1 (zh)
CN (1) CN1979639B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106356068A (zh) * 2016-11-02 2017-01-25 北京中星微电子有限公司 音频播放方法和装置
CN111295864A (zh) * 2018-08-31 2020-06-16 华为技术有限公司 一种提高语音通话质量的方法、终端和系统
CN113852893A (zh) * 2020-06-28 2021-12-28 北京小米移动软件有限公司 数据处理方法及装置、终端和存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1964408A (zh) * 2005-11-12 2007-05-16 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法
CN1980293A (zh) * 2005-12-03 2007-06-13 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978756A (en) * 1996-03-28 1999-11-02 Intel Corporation Encoding audio signals using precomputed silence
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
FR2758676A1 (fr) * 1997-01-21 1998-07-24 Philips Electronics Nv Methode de reduction des clics dans un systeme de transmission de donnees
US6172973B1 (en) * 1997-09-17 2001-01-09 Nortel Networks Limited Apparatus and method for reducing delay for voice over ATM using co-located switches
CN1094280C (zh) * 1998-08-17 2002-11-13 英业达股份有限公司 网络电话中的静音检测方法
US6708023B1 (en) * 2000-02-25 2004-03-16 Motorola Inc. Method and apparatus for noise suppression of received audio signal in a cellular telephone
DE10101034A1 (de) * 2001-01-11 2002-08-01 Jumptec Ind Computertechnik Ag Datenkommunikationssystem und Datenumwandlungsvorrichtung
JP4280901B2 (ja) * 2002-02-05 2009-06-17 株式会社セガ 音声チャットシステム
CN1964408A (zh) * 2005-11-12 2007-05-16 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法
CN1980293A (zh) * 2005-12-03 2007-06-13 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106356068A (zh) * 2016-11-02 2017-01-25 北京中星微电子有限公司 音频播放方法和装置
CN111295864A (zh) * 2018-08-31 2020-06-16 华为技术有限公司 一种提高语音通话质量的方法、终端和系统
CN111295864B (zh) * 2018-08-31 2022-04-05 华为技术有限公司 一种提高语音通话质量的方法、终端和系统
CN113852893A (zh) * 2020-06-28 2021-12-28 北京小米移动软件有限公司 数据处理方法及装置、终端和存储介质

Also Published As

Publication number Publication date
CN1979639B (zh) 2011-07-27
US20070133589A1 (en) 2007-06-14

Similar Documents

Publication Publication Date Title
CN1964408A (zh) 静音处理装置及方法
US7599834B2 (en) Method and apparatus of voice mixing for conferencing amongst diverse networks
CN105304079B (zh) 一种多方通话的多模式语音合成方法与系统以及服务器
CN101188525B (zh) 一种语音流的处理方法及装置
US6697342B1 (en) Conference circuit for encoded digital audio
US7986644B2 (en) Multi-fidelity conferencing bridge
CN1979639B (zh) 静音处理装置及方法
US8675849B2 (en) Ubiquitous transfer of a phone number to another phone
CN101193381A (zh) 一种带有声音预处理的移动终端及其方法
CN100454937C (zh) 移动通信终端的通话录音方法
EP2572499B1 (en) Encoder adaption in teleconferencing system
CN1980293A (zh) 静音处理装置及方法
US20090290698A1 (en) Method and device for transmitting voice data in a communication network
CN100442810C (zh) 一种混音处理方法
CN105245537A (zh) 通过开关量控制的电话系统与广播系统对接的方法及系统
CN106550109A (zh) 一种通过固话接听移动终端电话的装置和方法
CN1917039B (zh) 一种语音质量增强方法和系统
US20040252813A1 (en) Tone clamping and replacement
KR20070015532A (ko) 정보 제공 시스템, 방법 및 정보 제공용 프로그램을 기록한 기록 매체
CN101111035A (zh) 在ptt终端中实现语音缓冲的装置和方法
CN103166837A (zh) 一种媒体网关以及改善会议电话语音质量的方法
CN1926894A (zh) 减少按讲业务的等待时间
CN206117800U (zh) 一种通过固话接听移动终端电话的装置
CN103905675B (zh) 调节VoIP电话系统电话回声的方法及装置
US20030091162A1 (en) Telephone data switching method and system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

Termination date: 20141203

EXPY Termination of patent right or utility model