CN1780326A - 通话音量自适应调节方法 - Google Patents

通话音量自适应调节方法 Download PDF

Info

Publication number
CN1780326A
CN1780326A CN200510023110.0A CN200510023110A CN1780326A CN 1780326 A CN1780326 A CN 1780326A CN 200510023110 A CN200510023110 A CN 200510023110A CN 1780326 A CN1780326 A CN 1780326A
Authority
CN
China
Prior art keywords
factor
bfi
adaptive
adjuting
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200510023110.0A
Other languages
English (en)
Inventor
张治�
刘守华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN200510023110.0A priority Critical patent/CN1780326A/zh
Priority to US11/321,106 priority patent/US20060150049A1/en
Publication of CN1780326A publication Critical patent/CN1780326A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • H04L1/201Frame classification, e.g. bad, good or erased

Abstract

本发明公开了一种通话音量自适应调节方法,包括初始化音量放缩因子为1;判断音量放缩因子值;若BFI_factor≠1,继续以下步骤,若BFI_factor=1,转向第8步;判断BFI_factor是否<1,BFI_factor<1,继续下步,否则转向第6步;将BFI_factor值加1/16;用最新BFI_factor值乘以当前数据包;播放声音,返回第2步;若BFI_factor>1/4,继续下一步,否则转第10步;将BFI_factor值降低1/16;重放前一包数据,返回步骤2。有益效果是使得噪音减小,避免啸叫和杂音,提高了听者的舒适感。

Description

通话音量自适应调节方法
技术领域
本发明属于通信领域,尤其涉及GSM信道传输,FR、EFR解码,噪声抑制中的通话音量调节方法。
背景技术
目前在GSM无线通信过程中,语音编解码(包括全速率语音(Full ratespeech,FR)和增强型全速率语音(Enhanced full rate speech,EFR))和数据接收是两个相对独立的过程,互不影响。对于语音编解码来说,当前空中信道的数据传输是否存在干扰,信号强度如何等信息都是不可知的,只能使用循环码校验(CRC)以及计算在解码过程中遇到的错误个数,判断其是否大于某个最大值的方法来分辩正确的数据包与错误的数据包。这两种方法都不是100%可靠的,存在一定的错判几率,这样,就可能把错误数据当成正确数据播放出来,从而出现变音。另外,由于在语音解码过程中,前面收到数据的值,会影响到后续数据解码时使用的参数,这样,当出现误判时,后来的解码过程也会由于当前的错误数据而受到影响。这样就可能导致错误累加,使得声音质量降低,严重时甚至形成正反馈,使得噪音被无限放大,也就是我们常说的话筒啸叫。
发明内容
本发明需要解决的技术问题在于提供一种通话音量自适应调节方法,可通过将当前音量与信道质量联系起来,在信道参数不变的情况下,减低啸叫和怪音的出现几率,使用户感觉舒适。
本发明的基本原理为:由于信道质量下降时,语音数据出错的概率也会随之增加,而GSM标准中使用三位CRC码进行校验,也就是说只有8个有效的CRC结果。这样,就有1/8的可能把错误数据误判为正确数据并播放出来,从而产生不正常的噪声。而且由于解码器是有记忆的,这些错误数据会改变相关的参数,使后续数据的播放也受到影响。通过使用一个称为音量放缩因子BFI_factor的变量,对其进行调整,可以在信道质量差,数据出错概率高的时候,让输出的声音变小,降低用户的不舒适感,同时也减小错误数据对解码参数的影响,防止后续的声音播放出现问题。
本发明的技术方案包括以下步骤:
步骤1、初始化音量放缩因子BFI_factor为1;
步骤2、接受数据包并判断当前包是否错误,也即判断音量放缩因子BFI_factor的值;
步骤3、如果BFI_factor≠1,表示数据包正确,继续以下步骤,如果BFI_factor=1,表示数据包错误,则转向第8步骤;
步骤4、判断BFI_factor是否小于1,如果BFI_factor<1,继续以下步骤,否则转向第6步;
步骤5、将BFI_factor值加1/16;
步骤6、用最新BFI_factor值乘以当前数据包的所有数据,以对音量进行放缩;
步骤7、播放声音,并返回第2步;
步骤8、判断BFI_factor是否大于1/4如果BFI_factor大于1/4,则继续下一步,否则跳转第10步;
步骤9、将BFI_factor值降低1/16;
步骤10、重放前一包数据,然后返回步骤2。
上述方法可以在FR和EFR解码过程中添加。
本发明的有益效果是,由于音量放缩因子BFI_factor的引入,使得音量可以根据当前的信道质量进行适应性缩放,在信道质量差时,可以使得噪音减小,避免啸叫和杂音,提高了听者的舒适感。
附图说明
图1为本发明的方法流程图;
图2为本发明在FR解码中的应用示意图;
图3为本发明在EFR解码中的应用示意图。
具体实施方式
以下结合附图和具体实施例对本发明作详细说明。
图1中的方法可以添加到图2所示的最常见的FR和EFR解码过程中,根据收到的数据包计算BFI_factor,再用得到的值在图中所示位置与语音数据相乘,实现放缩。之所以将这一操作放在这里进行,是由于通过短程滤波之后,声音的频率特性将被强化,错误数据被增强的话,会更严重的影响语音质量。如果收到一个错误的数据包,其值降低1/16,为了防止语音完全消失,导致正确的话音数据也无法听到,其值在任何状况下都不会降到0。在我们这里,最低值设为0.25,根据软硬件情况,该值可以作相应的调整。同样的,每收到一个正确的数据包,该值增加1/16,直至达到1为止。这样在信号较差,错误数据出现频繁的时候,BFI_factor会保持在一个较低的水平,即使有错误数据被误判为正确的情况,产生的杂音也会被大幅度减小,可以有效的防止信号差地区的杂音和啸叫声频繁出现。
和普通的FR解码过程一样,图1所示的解码过程也包括如下步骤:
1、RPE(Regular Pulse Excitation规则脉冲激励)解码
收到的语音信号通过APCM(自适应脉码调制)反转生成RPE采样数据,对这些数据做解码和反归一化,并在其中插入适当数目的0值(RPE栅格定位),将采样率变为原来的3倍。由此所得的数据将作为下一步长程预测的输入值。
2、长程预测(LTP:Long Term prediction)由上面步骤重建的长程余留信号(long term residual signal,图中的er′)通过长程合成滤波(由延迟器z^-n和LTP参数解码过程组成,前面收到的数据在这里会对新收到的数据产生影响)生成下一步骤的输入dr′。
本发明所述BFI_FACTOR值加在这一过程之后,短程合成滤波之前。
3、短程合成滤波
短程合成滤波器所用的系数是通过与编码器对应的过程而得到的,由收到的LAR(Log.-Area Ratios)得到反射系数,再将其引入短程合成滤波器中得到输出。
4、后端处理
前一步的输入送到后端处理进行去强化滤波,得到最后的输出。
和普通的EFR解码过程一样,图2所示的解码过程也包括如下步骤:
首先对线性预测(LP)滤波器参数解码,通过所得到的LSP(Line SpectralPair)量化索引取得相应的两个LSP向量,随后通过插值得到4个LSP向量(对应于一个EFR帧中所包含的4个子帧),并将每个LSP向量转化为相应子帧的LP滤波器参数,用于后面的解码过程。
使用插值方法,对每个子帧解码其自适应码本向量。
对每个子帧的自适应码本增益进行解码,由所得到的索引值在量化表中查找对应的量化增益。
对每个子帧解码其更新过的码本向量,使用所得到的代数码本索引值解出相应的冲击脉冲的位置和振幅。
对每个子帧解码其固定码本增益。
由以上得到的信息构造激励信号,本发明所述的BFI_FACTOR值加在这一过程之后,合成滤波之前。
合成滤波,得到基本的输出信号。
后端处理:对最终输出进行处理,包含两个部分,自适应后端滤波与信号缩放,前者又包括构形滤波与斜度补偿两个滤波器。
另外,当手机在通话中发生小区切换(handover)时,由于接收有效数据的最小单位是由4帧组成的一个数据块(block),而handover是以帧为单位的,这样因为切换的时候不一定在block边界上,就可能出现一个block中的几帧在前一个cell接收,剩下几帧在另一个cell接收的情况,从而出现数据错误,产生杂音。这种情况下,可以在handover时人为将BFI_factor设为一个较低的值,同样可以达到降低杂音的效果。在我们的应用中,一旦发生handover,会把BFI_factor设为5,同样,根据软硬件不同,这个值可以作相应的调整。

Claims (4)

1.一种通话音量自适应调节方法,其特征在于包括如下步骤:
步骤1、初始化音量放缩因子BFI_factor为1;
步骤2、接受数据包并判断当前包是否错误,也即判断音量放缩因子BFI_factor的值;
步骤3、如果BFI_factor≠1,表示数据包正确,继续以下步骤,如果BFI_factor=1,表示数据包错误,则转向第8步骤;
步骤4、判断BFI_factor是否小于1,如果BFI_factor<1,继续以下步骤,否则转向第6步;
步骤5、将BFI_factor值加1/16;
步骤6、用最新BFI_factor值乘以当前数据包的所有数据,以对音量进行放缩;
步骤7、播放声音,并返回第2步;
步骤8、判断BFI_factor是否大于1/4如果BFI_factor大于1/4,则继续下一步,否则跳转第10步;
步骤9、将BFI_factor值降低1/16;
步骤10、重放前一包数据,然后返回步骤2。
2.如权利要求1所述的一种通话音量自适应调节方法,其特征在于:所述通话音量自适应调节方法可用于手机通话中,当手机在通话中发生小区切换时,可将BFI_factor值设为5。
3.如权利要求1所述的一种通话音量自适应调节方法,其特征在于:所述通话音量自适应调节方法可添加到全速率语音解码过程中,添加位置为全速率语音解码过程的长程预测和短程合成滤波之间。
4.如权利要求1所述的一种通话音量自适应调节方法,其特征在于:所述通话音量自适应调节方法可添加到增强型全速率语音解码过程中,添加位置为增强型全速率语音解码过程的构造激励信号和合成滤波之间。
CN200510023110.0A 2005-01-05 2005-01-05 通话音量自适应调节方法 Pending CN1780326A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200510023110.0A CN1780326A (zh) 2005-01-05 2005-01-05 通话音量自适应调节方法
US11/321,106 US20060150049A1 (en) 2005-01-05 2005-12-28 Method for adjusting speech volume in a telecommunications device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200510023110.0A CN1780326A (zh) 2005-01-05 2005-01-05 通话音量自适应调节方法

Publications (1)

Publication Number Publication Date
CN1780326A true CN1780326A (zh) 2006-05-31

Family

ID=36642097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200510023110.0A Pending CN1780326A (zh) 2005-01-05 2005-01-05 通话音量自适应调节方法

Country Status (2)

Country Link
US (1) US20060150049A1 (zh)
CN (1) CN1780326A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102164203A (zh) * 2010-02-17 2011-08-24 索尼公司 信息处理设备、方法以及程序

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7396441B2 (en) * 2002-02-22 2008-07-08 Aqua Innovations, Inc. Flow-through oxygenator
CN100578618C (zh) * 2006-12-04 2010-01-06 华为技术有限公司 一种解码方法及装置
US8165224B2 (en) 2007-03-22 2012-04-24 Research In Motion Limited Device and method for improved lost frame concealment
GB0800366D0 (en) * 2008-01-09 2008-02-20 Icera Inc System and method of wireless communication
WO2012026092A1 (ja) * 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6832195B2 (en) * 2002-07-03 2004-12-14 Sony Ericsson Mobile Communications Ab System and method for robustly detecting voice and DTX modes

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102164203A (zh) * 2010-02-17 2011-08-24 索尼公司 信息处理设备、方法以及程序
CN102164203B (zh) * 2010-02-17 2015-06-17 索尼公司 信息处理设备和方法

Also Published As

Publication number Publication date
US20060150049A1 (en) 2006-07-06

Similar Documents

Publication Publication Date Title
US8102872B2 (en) Method for discontinuous transmission and accurate reproduction of background noise information
CN1075692C (zh) 通信系统中噪声抑制方法及装置
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
CN1128512C (zh) 在便携式通信设备中提供免提电话操作的方法
JP2003514473A (ja) ノイズ抑制
KR20020093940A (ko) 가변율 음성 코더에서 프레임 삭제를 보상하는 방법
WO2009088431A1 (en) Method and apparatus for detecting and suppressing echo in packet networks
WO2000075919A1 (en) Methods and apparatus for generating comfort noise using parametric noise model statistics
WO2023197809A1 (zh) 一种高频音频信号的编解码方法和相关装置
WO2005091273A2 (en) Method of comfort noise generation for speech communication
CA2378035A1 (en) Coded domain noise control
CN1780326A (zh) 通话音量自适应调节方法
CN1244090C (zh) 具备背景噪声再现的语音编码
AU6533799A (en) Method for transmitting data in wireless speech channels
Vicente-Peña et al. Band-pass filtering of the time sequences of spectral parameters for robust wireless speech recognition
Tan et al. Network, distributed and embedded speech recognition: An overview
Pearce Robustness to transmission channel-the DSR approach
JP2003522981A (ja) ピッチ変化検出を伴なう誤り訂正方法
WO2004015690A1 (en) Speech communication unit and method for error mitigation of speech frames
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
AU2002210799B8 (en) Improved spectral parameter substitution for the frame error concealment in a speech decoder
CN117437925A (zh) 优化音频编解码的方法、系统、介质及设备
JPH0756600A (ja) 音声符号化復号化誤り制御方法及びその装置
JPH07143075A (ja) 音声符号化通信方式及びその装置
KR20000074996A (ko) 음성 부호화기의 오류 제어 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication