CN101199004B - 用于增益因数平滑的系统、方法及设备 - Google Patents
用于增益因数平滑的系统、方法及设备 Download PDFInfo
- Publication number
- CN101199004B CN101199004B CN2006800216673A CN200680021667A CN101199004B CN 101199004 B CN101199004 B CN 101199004B CN 2006800216673 A CN2006800216673 A CN 2006800216673A CN 200680021667 A CN200680021667 A CN 200680021667A CN 101199004 B CN101199004 B CN 101199004B
- Authority
- CN
- China
- Prior art keywords
- gain factor
- signal
- factor value
- envelope
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000009499 grossing Methods 0.000 title description 5
- 238000003672 processing method Methods 0.000 claims abstract description 25
- 238000001228 spectrum Methods 0.000 claims description 118
- 238000005086 pumping Methods 0.000 claims description 109
- 238000013139 quantization Methods 0.000 claims description 105
- 230000005284 excitation Effects 0.000 claims description 101
- 230000003595 spectral effect Effects 0.000 claims description 72
- 238000004458 analytical method Methods 0.000 claims description 27
- 230000002123 temporal effect Effects 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 19
- 230000008859 change Effects 0.000 abstract description 31
- 230000005236 sound signal Effects 0.000 abstract description 8
- 230000003313 weakening effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 63
- 238000001914 filtration Methods 0.000 description 50
- 239000013598 vector Substances 0.000 description 49
- 238000005070 sampling Methods 0.000 description 47
- 238000010586 diagram Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 25
- 230000004044 response Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 15
- 230000007774 longterm Effects 0.000 description 13
- 238000011002 quantification Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000007704 transition Effects 0.000 description 10
- 238000013507 mapping Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000000737 periodic effect Effects 0.000 description 8
- 230000008447 perception Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 230000003760 hair shine Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 206010019133 Hangover Diseases 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 2
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 101100230233 Arabidopsis thaliana GT20 gene Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000005621 ferroelectricity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Amplification And Gain Control (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
在一个实施例中,一种信号处理方法包含:计算基于语音信号的低频部分的第一信号的包络,计算基于所述语音信号的高频部分的第二信号的包络,及根据所述第一信号与第二信号的所述包络之间的时变关系来计算第一多个增益因数值。所述方法包含基于所述第一多个增益因数值来计算多个经平滑的增益因数值。在一个实例中,所述多个经平滑的增益因数值的每一者均基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值的加权和。在另一实例中,基于所述多个增益因数值中的至少一个距离来对所述和进行自适应性加权。
Description
相关申请交叉参考案
本申请案要求2005年4月22日提出申请且名称为“高频带语音编码器中的参数编码(PARAMETER CODING IN A HIGH-BAND SPEECH CODER)”的第60/673,965号美国临时专利申请案的权利。
技术领域
本发明涉及信号处理。
背景技术
公共交换电话网络(PSTN)上的话音通信的带宽传统上已被限制到300-3400kHz的频率范围内。新的话音通信网络,例如蜂窝式电话及IP话音通信(因特网协议,VoIP),可能不具有相同的带宽限制,且其可能想要在这种网络上发射及接收包含宽带频率范围的话音通信。例如,其可能想要支持向下延伸到50Hz及/或向上延伸到7或8 kHz的音频频率范围。其还可能想要支持其他应用,例如高质量的音频或音频/视频会议-其可能在传统PSTN限值以外的范围内具有音频语音内容。
将语音编码器所支持的范围扩展到更高频率可改进可懂度。例如,区分例如“s”及“f”等摩擦音的信息大多处于高频率中。高频带扩展还可以改进其他语音(例如演讲)的质量。例如,甚至浊音元音也可能具有远高于PSTN限值的频谱能量。
一种宽带语音编码方法涉及将窄带语音编码技术(例如一种经配置以对0-4kHz范围实施编码的技术)按比例缩放以覆盖宽带频谱。例如,可按更高的速率对语音信号取样以包含高频分量,且可重新配置窄带编码技术以使用更多的滤波器系数来代表这一宽带信号。然而,例如CELP(代码簿激励的线性预测)等窄带编码技术在计算上很繁琐,且宽带CELP编码器可能会消耗过多的处理循环以至于对许多移动应用及其他嵌入式应用来说不切实际。使用这种技术将宽带信号的整个频谱编码为所需质量还可能会导致令人无法接受的带宽增大量。此外,甚至在可将这种已编码信号的窄带部分传输到仅支持窄带编码的系统内及/或由所述系统解码之前,就要求对这种已编码的信号进行转码。
另一种宽带语音编码方法涉及从已编码窄带频谱包络推断高频带频谱包络。尽管这种方法的实施可能不会带来任何带宽增加且无需转码,然而通常无法根据窄带部分的频谱包络来精确地预测语音信号高频带部分的粗略频谱包络或共振峰结构。
可能期望实施宽带语音编码以便无需转码或其他明显修改即可通过窄带信道(例如PSTN信道)发送已编码信号的至少窄带部分。还可能期望宽带编码扩展的高效率,以(例如)避免在例如无线蜂窝式电话及在有线及无线信道上进行广播等应用中可得到服务的用户数量明显减少。
发明内容
在一个实施例中,一种信号处理的方法包含:计算基于语音信号的低频部分的第一信号的包络;计算基于所述语音信号的高频部分的第二信号的包络;及根据所述第一信号与第二信号的包络之间的时变关系计算第一多个增益因数值。所述方法还包含基于所述第一多个增益因数值来计算多个经平滑的增益因数值。
在另一实施例中,一种设备包含:第一包络计算器,其经配置以计算基于语音信号的低频部分的第一信号的包络;及第二包络计算器,其经配置以计算基于所述语音信号的高频部分的第二信号的包络。所述设备包含系数计算器,其经配置以根据所述第一信号与第二信号的包络之间的时变关系计算第一多个增益因数值;及平滑器,其经配置以基于所述第一多个增益因数值计算多个经平滑的增益因数值。
在另一实施例中,一种设备包含:用于计算基于语音信号的低频部分的第一信号的包络的装置;用于计算基于语音信号的高频部分的第二信号的包络的装置;及用于根据所述第一信号与第二信号的包络之间的时变关系计算第一多个增益因数值的装置。所述设备还包含用于基于所述第一多个增益因数值计算多个经平滑的增益因数值的装置。
在另一实施例中,一种信号处理的方法包含基于从语音信号的低频部分导出的激励信号产生高频带激励信号。所述方法包含根据高频带激励信号和从所述语音信号的高频部分导出的多个滤波器参数合成高频带语音信号。所述方法包含基于所述合成的高频带语音信号的时域包络计算第一多个增益因数值,及基于所述第一多个增益因数值计算多个经平滑的增益因数值。
在另一实施例中,一种设备包含高频带激励信号产生器,其经配置以基于从语音信号的低频部分导出的已编码激励信号产生高频带激励信号。所述设备包含:合成滤波器,其经配置以根据所述高频带激励信号及从所述语音信号的高频部分导出的多个滤波器参数合成高频带语音信号;及系数计算器,其经配置以基于所述合成的高频带语音信号的时域包络计算第一多个增益因数值。所述设备包括平滑器,其经配置以基于所述第一多个增益因数值计算多个经平滑的增益因数值。
附图说明
图1a显示根据实施例的宽带语音编码器A100的方块图。
图1b显示宽带语音编码器A100的实施方案A102的方块图。
图2a显示根据实施例的宽带语音编码器B100的方块图。
图2b显示宽带语音编码器B100的实施方案B102的方块图。
图3a显示滤波器组A110的实施方案A112的方块图。
图3b显示滤波器组B120的实施方案B122的方块图。
图4a显示滤波器组A110的一个实例的低频段及高频带带宽覆盖。
图4b显示滤波器组A110的另一实例的低频段及高频带带宽覆盖。
图4c显示滤波器组A112的实施方案A114的方块图。
图4d显示滤波器组B122的实施方案B124的方块图。
图5a显示语音信号的频率-对数幅值曲线图的实例。
图5b显示基本线性预测编码系统的方块图。
图6显示窄带编码器A120的实施方案A122的方块图。
图7显示窄带解码器B110的实施方案B112的方块图。
图8a显示浊音语音的残余信号的频率-对数幅值曲线图的实例。
图8b显示一浊音语音的残余信号的时间-对数幅值曲线图的实例;
图9显示也执行长期预测的基本线性预测编码系统的方块图。
图10显示高频带编码器A200的实施方案A202的方块图。
图11显示高频带激励产生器A300的实施方案A302的方块图。
图12显示频谱扩展器A400的实施方案A402的方块图。
图12a显示在频谱扩展操作的一个实例中在不同点处的信号频谱曲线图。
图12b显示在频谱扩展操作的另一实例中在不同点处的信号频谱曲线图。
图13显示高频带激励产生器A302的实施方案A304的方块图。
图14显示高频带激励产生器A302的实施方案A306的方块图。
图15显示包络计算任务T100的流程图。
图16显示组合器490的实施方案492的方块图。
图17显示一种计算高频带信号S30的周期性量度的方法。
图18显示高频带激励产生器A302的实施方案A312的方块图。
图19显示高频带激励产生器A302的实施方案A314的方块图。
图20显示高频带激励产生器A302的实施方案A316的方块图。
图21显示增益计算任务T200的流程图。
图22显示增益计算任务T200的实施方案T210的流程图。
图23a显示开窗功能的图式。
图23b显示如图23a中所示开窗功能对语音信号的子帧的应用;
图24显示高频带解码器B200的实施方案B202的方块图。
图25显示宽带语音编码器A100的实施方案AD10的方块图。
图26a显示延迟线D120的实施方案D122的示意图。
图26b显示延迟线D120的实施方案D124的示意图。
图27显示延迟线D120的实施方案D130的示意图。
图28显示宽带语音编码器AD10的实施方案AD12的方块图。
图29显示根据实施例的一种信号处理方法MD100的流程图。
图30显示根据实施例的一种方法M100的流程图。
图31a显示根据实施例的一种方法M200的流程图。
图31b显示方法M200的实施方案M210的流程图。
图32显示根据实施例的一种方法M300的流程图。
图33a显示高频带增益因数计算器A230的实施方案A232的方块图。
图33b显示一种包含高频带增益因数计算器A232的安排的方块图。
图34显示高频带编码器A202的实施方案A203的方块图。
图35显示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G32的安排的方块图。
图36a和36b显示从已计算的变量值到衰减系数值的映射实例的曲线图。
图37显示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G34的安排的方块图。
图38显示高频带解码器B202的实施方案B204的方块图。
图39显示根据实施例的方法GM10的流程图。
图40显示高频带编码器A202的实施方案A205的方块图。
图41显示增益因数平滑器G80的实施方案G82的方块图。
图42显示增益因数平滑器G80的实施方案G84的方块图。
图43a和43b显示从已计算的变量值到平滑系数值的映射实例的曲线图。
图44显示高频带编码器A202的实施方案A206的方块图。
图45显示高频带编码器A200的实施方案A207的方块图。
图46显示高频带增益因数计算器A235的方块图。
图47显示根据实施例的方法FM10的流程图。
图48显示通常由标量量化器执行的一维映射的实例。
图49显示如向量量化器执行的多维映射的一个简单实例。
图50a显示一维信号的一个实例,及图50b显示这一信号在量化之后的版本的实例。
图50c显示图50a的信号在由如图52中所示的量化器435量化之后的实例。
图50d显示图50a的信号在由如图53中所示的量化器435b量化之后的实例。
图51显示高频带编码器A202的实施方案A208的方块图。
图52显示量化器435的实施方案435a的方块图。
图53显示量化器435的实施方案435b的方块图。
图54显示包含于量化器435a和量化器435b的进一步实施方案中的标度系数计算逻辑实例的方块图。
图55a显示根据实施例的方法QM10的流程图。
图55b显示根据实施例的方法QM20的流程图。
在各图式及随附说明中,相同的参考编号是指相同或类似的元件或信号。
具体实施方式
本文所述实施例包含可经配置以提供窄带语音编码器的扩展从而支持以仅约800到1000bps(位/秒)的带宽增加来传输及/或存储宽带语音信号的系统、方法及设备。这种实施方案的潜在优点包含:实施嵌入式编码来支持与窄带系统的兼容性,相对易于在窄带编码信道与高频带编码信道之间分配及重新分配位,避免在计算上繁琐的宽带合成操作,及维持由计算繁琐的波形编码例程处理的信号的低取样速率。
除非由术语“计算”的上下文明确限定,否则术语“计算”在本文中指示其通常含意中的任一种含意,例如计算、产生、及从一列表的值中进行选择。当在本说明书和权利要求书中使用术语“包括”时,其并不排除其他元件或操作。术语“A基于B”用于指示其通常含意中的任一种含意,包含如下情形:(i)“A等于B”及(ii)“A基于至少B”。术语“因特网协议”包含如IETF(因特网工程任务组)RFC(请求注解)791中所述的版本4以及后续版本,例如版本6。
图1a显示根据实施例的宽带语音编码器A100的方块图。滤波器组A110经配置以对宽带语音信号S10进行滤波,以产生窄带信号S20及高频带信号S30。窄带编码器A120经配置以对窄带信号S20进行编码,以产生窄带(NB)滤波器参数S40及窄带残余信号S50。如在本文中进一步说明,窄带编码器A120通常经配置以按代码簿索引形式或另一量化形式产生窄带滤波器参数S40及已编码的窄带激励信号S50。高频带编码器A200经配置以根据已编码窄带激励信号S50中的信息对高频带信号S30进行编码,以产生高频带编码参数S60。如在本文中所进一步详细说明,高频带编码器A200通常经配置以按代码簿索引形式或另一量化形式产生高频带编码参数S60。宽带语音编码器A100的一个特定实例经配置以按约8.55kbps(千位/秒)的速率对宽带语音信号S10进行编码,其中约7.55kbps用于窄带滤波器参数S40及已编码的窄带激励信号S50,及约1kbps用于高频带编码参数S60。
可能期望将已编码的窄带信号与高频带信号组合成单个位流。例如,可能期望将所述已编码信号一起多路复用以供作为已编码的宽带语音信号进行传输(例如在有线传输信道、光学传输信道或无线传输信道上)或存储。图1b显示包含多路复用器A130的宽带语音编码器A100的实施方案A102的方块图,所述多路复用器A130经配置以将窄带滤波器参数S40、已编码的窄带激励信号S50和高频带滤波器参数S60组合成多路复用信号S70。
一种包含编码器A102的设备还可以包含经配置以将多路复用信号S70传输到例如有线信道、光学信道或无线信道等传输信道内的电路。这种设备还可以经配置以对信号执行一种或多种信道编码操作,例如误差校正编码(例如速率相容的卷积编码)及/或误差检测编码(例如循环冗余编码)、及/或一层或多层网络协议编码(例如以太网、TCP/IP、cdma2000)。
可能期望多路复用器A130经配置以将已编码的窄带信号(包含窄带滤波器参数S40及已编码的窄带激励信号S50)作为多路复用信号S70的可分离子流来嵌入,以便可将所述已编码的窄带信号独立于多路复用信号S70的另一部分(例如高频带及/或低频段信号)来恢复及解码。例如,多路复用信号S70可经安排以便可通过剥离高频带滤波器参数S60来恢复已编码的窄带信号。这种特征的一个潜在优点是避免了在将已编码的宽带信号传送到支持对窄带信号进行解码但不支持对高频带部分进行解码的系统之前对所述已编码的宽带信号进行转码的期望。
图2a是根据实施例的宽带语音解码器B100的方块图。窄带解码器B110经配置以对窄带滤波器参数S40及已编码的窄带激励信号S50进行解码以产生窄带信号S90。高频带解码器B200经配置以基于已编码的窄带激励信号S50、根据窄带激励信号S80对高频带编码参数S60进行解码,以产生高频带信号S100。在这个实例中,窄带解码器B110经配置以向高频带解码器B200提供窄带激励信号S80。滤波器组B120经配置以将窄带信号S90与高频带信号S100相组合,以产生宽带语音信号S110。
图2b是包含多路分用器B130的宽带语音解码器B100的实施方案B102的方块图,多路分用器B130经配置以从多路复用信号S70产生已编码的信号S40、S50及S60。一种包含解码器B102的设备可包含经配置以从例如有线信道、光学信道或无线信道等传输信道接收多路复用信号S70的电路。这种装置还可以经配置以对信号执行一种或多种信道解码操作,例如误差校正解码(例如速率兼容的卷积解码)、及/或误差检测解码(例如循环冗余解码)、及/或一层或多层网络协议解码(例如以太网、TCP/IP、cdma2000)。
滤波器组A110经配置以根据分割频带方案对输入信号进行滤波,以产生低频分波段及高频分波段。依据特定应用的设计准则,所述输出分波段可具有相等或不相等的带宽,且可重叠或不重叠。能产生多于两个分波段的滤波器组A110配置也是可能的。例如,这种滤波器组可经配置以产生一个或多个在低于窄带信号S20(例如50-300Hz的范围)的频率范围内包含分量的低频段信号。这种滤波器组还可能经配置以产生一个或多个在高于高频带信号S30(例如14-20、16-20、或16-32kHz的范围)的频率范围内包含分量的其他高频带信号。在这种情形中,宽带语音编码器A100可经实施以分别将这一个或多个信号编码,且多路复用器A130可经配置以在多路复用信号S70中包含其他的一个或多个已编码信号(例如,作为可分离部分)。
图3a显示经配置以产生两个具有降低的取样速率的分波段信号的滤波器组A110的实施方案A112的方块图。滤波器组A110经安排以接收具有高频(或高频带)部分及低频(或低频段)部分的宽带语音信号S10。滤波器组A112包含:低频段处理路径,其经配置以接收宽带语音信号S10及产生窄带语音信号S20;及高频带处理路径,其经配置以接收宽带语音信号S10及产生高频带语音信号S30。低通滤波器110对宽带语音信号S10进行滤波以通过所选的低频分波段,且高通滤波器130对宽带语音信号S10进行滤波以通过所选的高频分波段。由于所述两个分波段信号均具有比宽带语音信号S10更窄的带宽,因而可在不丢失信息的情况下将其取样速率降低某一程度。下取样器120根据所需的十中抽一取样系数降低低通信号的取样速率(例如通过移除所述信号的样本及/或以平均值来替换样本),且下取样器140同样根据另一所需的十中抽一取样系数降低高通信号的取样速率。
图3b显示滤波器组B120的对应实施方案B122的方块图。上取样器150提高窄带信号S90的取样速率(例如通过零填充及/或通过复制样本),且低通滤波器160对经上取样的信号进行滤波以便仅通过低频段部分(例如以防止混叠)。同样地,上取样器170提高高频带信号S100的取样速率且高通滤波器180对经上取样的信号进行滤波以便仅通过高频带部分。然后对所述两个通带信号求和以形成宽带语音信号S1110。在解码器B100的某些实施方案中,滤波器组B120经配置以根据由高频带解码器B200接收及/或计算的一个或多个权数来产生所述两个通带信号的加权和。还可以设想组合多于两个通带信号的滤波器组B120的配置。
每个滤波器110、130、160、180均可实施为有限脉冲响应(FIR)滤波器或无限脉冲响应(IIR)滤波器。编码器滤波器110及130的频率响应可在止带与通带之间具有对称形状或不同形状的过渡区域。同样地,解码器滤波器160及180的频率响应可在止带与通带之间具有对称形状或不同形状的过渡区域。可能期望但并非严格地必须使低通滤波器110具有与低通滤波器160相同的响应,及使高通滤波器130具有与高通滤波器180具有相同的响应。在一个实例中,两个滤波器对110、130和160、180是正交镜像滤波器(QMF)组,其中滤波器对110、130具有与滤波器对160、180相同的系数。
在典型实例中,低通滤波器110具有包含300-340Hz的有限PSTN范围的通带(例如从0到4kHz的波段)。图4a及4b显示在两个不同实施方案实例中,宽带语音信号S10、窄带信号S20及高频带信号S30的相对带宽。在这两个特定实例中,宽带语音信号S10具有16kHz(代表处于0到8kHz范围内的频率分量)的取样速率,且窄带信号S20具有8kHz(代表处于0到4kHz范围内的频率分量)的取样速率。
在图4a所示实例中,在所述两个分波段之间不存在明显的重叠。可使用具有4-8kHz通带的高通滤波器130获得如此个实例中所示的高频带信号S30。在这种情形中,可能期望通过对经滤波信号进行2倍下取样来将取样速率降低到8kHz。这种操作-其预计可能会明显降低对信号的进一步处理操作的计算复杂度-将使通带能量向下移动到0到4kHz范围内而不丢失信息。
在图4b所示的替代实例中,上部及下部分波段具有适合的重叠,以便由两个分波段信号一起描述3.5到4kHz的区域。可使用通带为3.5-7kHz的高通滤波器130来获得如此一实例中的高频带信号S30。在这种情形中,可能期望通过对经滤波信号进行16/7倍下取样而将取样速率降低到7kHz。这种操作-其预计可能会明显降低对信号的进一步处理操作的计算复杂度-将使通带能量向下移动到0到3.5kHz范围内而不丢失信息。
在用于电话通信的典型手机中,一个或多个换能器(也就是麦克风及耳机或扬声器)不具有在7-8kHz频率范围上的可感知响应。在图4b所示实例中,宽带语音信号S10中位于7到8kHz之间的部分不包含于已编码信号中。高通滤波器130的其他特定实例则具有3.5-7.5kHz及3.5-8kHz的通带。
在某些实施方案中,如在图4b所示实例中提供各分波段之间的重叠允许使用在重叠区域内具有平滑的下滑速率的低通滤波器及/或高通滤波器。这种滤波器通常比具有更尖锐或“砖墙”响应的滤波器更易于设计、计算更不复杂及/或会引入更少延迟。具有尖锐过渡区域的滤波器趋于比具有平滑下滑速率的类似等级的滤波器具有更高的旁瓣(其可能会引起混叠)。具有尖锐过渡区域的滤波器还可能具有长的脉冲响应,这可能引起振铃伪像。对于具有一个或多个IIR滤波器的滤波器组实施方案来说,允许在重叠区域内具有平滑的下滑速率可使得能够使用其极点远离单位圆的滤波器,这对于确保稳定的固定点实施方案可能很重要。
分波段的重叠允许低频段与高频带的平滑混合,这可能导致更少的可听伪像、更少的混叠、及/或更不引人注意的逐波段过渡。此外,窄带编码器A120(例如波形编码器)的编码效率可随频率增大而降低。例如,窄带编码器的编码质量可以低位速率降低,在存在背景噪音时尤其如此。在这种情形中,提供各分波段的重叠可提高在重叠区域中再现的频率分量的质量。
此外,分波段的重叠允许低频段与高频带的平滑混合,这可能导致更少的可听伪像、更少的混叠、及/或更不引人注意的逐波段过渡。这种特征尤其有利于其中窄带编码器A120与高频带编码器A200根据不同的编码方法操作的实施方案。例如,不同的编码技术可产生听起来截然不同的信号。对以代码簿索引形式的频谱包络进行编码的编码器可产生与对幅值频谱进行编码的编码器相比具有不同声音的信号。时域编码器(例如脉冲编码调制或PCM编码器)可产生与频域编码器相比具有不同声音的信号。对具有频谱包络及对应的残余信号的表示形式的信号进行编码的编码器可产生与仅具有频谱包络表示形式的信号进行编码的编码器相比具有不同声音的信号。将信号编码成其波形的表示形式的编码器可产生与正弦编码器相比具有不同声音的输出。在这种情形中,使用具有尖锐过渡区域的滤波器来界定不重叠的分波段可能会在合成的宽带信号中的各分波段之间导致突然且可感知到的明显过渡。
尽管在分波段技术中常常使用具有互补的重叠频率响应的QMF滤波器组,但这种滤波器并不适用于本文所述的至少某些宽带编码实施方案。编码器处的QMF滤波器组经配置以创建明显程度的混叠,所述混叠在解码器处的对应QMF滤波器组中得以消除。这种安排可能不适用于其中信号会在各滤波器组之间引起明显失真量的应用,因为失真可降低混叠消除性质的有效性。例如,本文所述的应用包含经配置以按极低位速率操作的编码实施方案。作为极低位速率的结果,与原始信号相比,经解码的信号可能会明显失真,因而使用QMF滤波器组可能导致未消除的混叠。使用QMF滤波器组的应用程序通常具有较高的位速率(例如,对AMR来说是大于2kbps,及对G.722来说是64kbps)。
另外,编码器可经配置以产生在感知上类似于原始信号但实际上明显不同于原始信号的合成信号。例如,如本文所述从窄带残余导出高频带激励信号的编码器即可产生这种信号,因为经解码信号中可能完全不存在实际的高频带残余。在这种应用中使用QMF滤波器组可能会导致由未消除的混叠引起的明显程度的失真。
如果受影响的分波段较窄,则可降低由QMF混叠引起的失真量,因为混叠的影响仅限于等于分波段宽度的带宽。然而,对于本文所述的其中每个分波段均包含宽带带宽的大约一半的实例来说,由未消除的混叠引起的失真可能会影响信号的相当大部分。信号的质量还可受到上面出现未消除的混叠的频带的位置影响。例如,在宽带语音信号的中心附近(例如,3与4kHz之间)所形成的失真可能比出现于信号边缘附近(例如高于6kHz)的失真讨厌得多。
尽管QMF滤波器组中各滤波器的响应彼此严格相关,然而滤波器组A110和B120的低频段路径与高频带路径可经配置以具有除所述两个分波段重叠之外完全不相关的频谱。我们将所述两个分波段的重叠定义为从其中高频带滤波器的频率响应降到-20dB的点到其中低频段滤波器的频率响应降到-20dB的点的距离。在滤波器组A110及/或B120的各种实例中,这一重叠量从约200Hz变化到约1kHz不等。约400到约600Hz的范围可代表编码效率与所感知平滑度之间的所期望的折中。在如上文所述的一个特定实例中,重叠量约为500Hz。
可能期望实施滤波器组A112及/或B122以按数个级执行如图4a及4b所示的操作。例如,图4c显示滤波器组A112的实施方案A114的方块图,所述滤波器组A112使用一系列内插、重新取样、十中抽一取样、及其他操作来执行与高通滤波及下取样操作等效的功能。这种实施方案可能更易于设计及/或可允许重新使用逻辑及/或代码的功能块。例如,可使用同一功能块来执行如图4c中所示的十中抽一取样到14kHz及十中抽一取样到7kHz的操作。可通过将信号乘以函数ejnπ或序列(-1)n(其值在+1与-1之间交替)来实施频谱反转操作。频谱成形操作可被实施为低通滤波器,所述低通滤波器经配置以对信号实施成形来获得所需的总滤波器响应。
应注意,作为频谱反转操作的结果,高频带信号S30的频谱被反转。可相应地配置编码器及对应解码器中的后续操作。例如,本文所述的高频带激励产生器A300可经配置以产生也具有频谱反转形式的高频带激励信号S120。
图4d显示滤波器组B122的实施方案B124的方块图,所述滤波器组B122使用一系列内插、重新取样及其他操作来执行与上取样及高通滤波操作等效的功能。滤波器组B124包含在高频带中的频谱反转操作,所述频谱反转操作将在例如编码器的滤波器组(例如滤波器组A114)中所执行的类似操作反转。在所述特定实例中,滤波器组B124还在低频段及高频带中包含会衰减所述信号的7100Hz分量的陷波滤波器,尽管这种滤波器是可选的而非必需包含的。2006年4月3日提出申请的专利申请案“用于语音信号滤波的系统、方法及设备(SYSTEMS,METHODS,AND APPARATUS FORSPEECH SIGNAL FILTERING)”(代理档案号第050551号)包含关于滤波器组A110和B120的特定实施方案的元件响应的其他描述及图式,且这个材料以引用的方式并入本文中。
窄带编码器A120根据源滤波器模型来实施,所述源滤波器模型将输入语音信号编码为(A)一组描述滤波器的参数及(B)用于驱动所述滤波器以产生所述输入语音信号的合成再现形式的激励信号。图5a显示语音信号的频谱包络的实例。表征这一频谱包络的峰值表示元音区的共振且称作共振峰。多数语音编码器将至少这一粗略频谱结构编码为一组参数,例如滤波器系数。
图5b显示适用于对窄带信号S20的频谱包络进行编码的基本源滤波器结构的实例。分析模块对应于一时间周期(通常为20毫秒)内的语音声音来计算一组表征滤波器的参数。根据所述滤波器参数配置的白化滤波器(还称为分析或预测误差滤波器)移除频谱包络以使信号的频谱平坦。所得到的白化信号(还称作残余)比原始语音信号具有更少能量,且因此具有更少变化且更易于编码。因对所述残余信号进行编码而引起的误差还可以更均匀地分布于频谱上。所述滤波器参数及残余通常经量化以在信道上有效传输。在解码器处,根据所述滤波器参数配置的合成滤波器由信号基于所述残余来激励,以产生原始语音声音的合成版本。所述合成滤波器通常经配置以具有是白化滤波器的转移函数的逆的转移函数。
图6显示窄带编码器A120的基本实施方案A122的方块图。在这一实例中,线性预测编码(LPC)分析模块210将窄带信号S20的频谱包络编码成一组线性预测(LP)系数(例如,全极点滤波器1/A(z)的系数)。所述分析模块通常将输入信号作为一系列非重叠帧来处理,其中针对每个帧计算一组新的系数。帧周期通常是其中预计所述信号可本地静止不变的周期,一个常见的实例是20毫秒(在取样速率为8kHz时等价于160个样本)。在一个实例中,LPC分析模块210经配置以计算一组十个LP滤波器系数来表征每个20毫秒帧的共振峰结构。实施所述分析模块以将输入信号作为一系列重叠帧来处理也是可能的。
所述分析模块可经配置以直接分析每个帧的各样本,或者可首先根据开窗函数(例如Hamming窗口)对所述样本加权。还可以在比所述帧长的窗口(例如30毫秒的窗口)内执行所述分析。这个窗口既可以是对称的(例如5-20-5,以使其在紧接着20毫秒帧之前及之后均包含5毫秒),也可以是不对称的(例如10-20,以使其包含前一帧的最后10毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递推或Leroux-Gueguen算法来计算LP滤波器系数。在另一实施方案中,所述分析模块可经配置以为每个帧计算一组倒谱(cepstral)系数而非一组LP滤波器系数。
通过将所述滤波器参数量化,可使编码器A120的输出速率显著降低,而对再现质量相对几乎无影响。线性预测滤波器系数难以有效地量化且通常映射成另一种表示形式,例如线性频谱对(LSP)或线性频谱频率(LSF),以用于量化及/或熵编码。在图6所示实例中,LP滤波器系数到LSF变换器220将所述LP滤波器系数组变换成一组对应的LSF。LP滤波器系数的其他一对一表示形式包含部分相关(parcor)系数、对数面积比率值、导抗频谱对(ISP)、及导抗频谱频率(ISF)-其用于GSM(全球行动通信系统)AMR-WB(自适应性多速率宽带)编译码器中。通常,一组LP滤波器系数与一组对应的LSF之间的变换是可逆的,但各实施例还包含其中所述变换不会无误差地可逆的编码器A120的实施方案。
量化器230经配置以将所述窄带LSF组(或其他系数表示形式)量化,且窄带编码器A122经配置以将这一量化结果作为窄带滤波器参数S40输出。这种量化器通常包含向量量化器,所述向量量化器将输入向量编码成表或代码簿中对应向量条目的索引。
如在图6中所示,窄带编码器A122还通过使窄带信号S20穿过根据所述滤波器系数组来配置的白化滤波器260(还称作分析或预测误差滤波器)而产生残余信号。在这一特定实例中,白化滤波器260被实施为FIR滤波器,尽管还可以使用IIR实施方案。这一残余信号通常将包含语音帧中在窄带滤波器参数S40中未表示的在感知上重要的信息,例如与音调有关的长期结构。量化器270经配置以计算这一残余信号的量化表示形式,以供作为已编码的窄带激励信号S50输出。这一量化器通常包含向量量化器,所述向量量化器将输入向量编码成表或代码簿中对应向量条目的索引。另一选择为,这一量化器可经配置以发送一个或多个可据以在解码器处动态地产生向量的参数,而非如在稀疏代码簿方法中从存储器检索。这种方法用于例如代数CELP(代码簿激励线性预测)等编码方案中及例如3GPP2(第三代伙伴工程2)EVRC(增强可变速率编译码器)等编译码器中。
期望使窄带编码器A120根据将可用于对应窄带解码器的相同滤波器参数值来产生已编码的窄带激励信号。通过这种方式,所得到的已编码窄带激励信号可能已经在某种程度上补偿了彼等参数值中的非理想化情形,例如量化误差。相应地,期望使用将可用于解码器处的相同系数值来配置白化滤波器。在如图6所示的编码器A122的基本实例中,逆量化器240将窄带编码参数S40解量化,LSF到LP滤波器系数变换器250将所得到的值映射回一组对应的LP滤波器系数,且这组系数用于配置白化滤波器260以产生由量化器270所量化的残余信号。
窄带编码器A120的某些实施方案经配置以通过在一组代码簿向量中识别出一个与所述残余信号最佳匹配的代码簿向量来计算已编码的窄带激励信号S50。然而,应注意,窄带编码器A120还可经实施以计算所述残余信号的量化表示形式而并不实际产生所述残余信号。例如,窄带编码器A120可经配置以使用大量代码簿向量产生对应的合成信号(例如根据一组当前的滤波器参数),及在按感知加权的域中选择与和原始窄带信号S20最佳匹配的所产生信号相关联的代码簿向量。
图7显示窄带解码器B110的实施方案B112的方块图。逆量化器310将窄带滤波器参数S40解量化(在本实例中是解量化成一组LSF),且LSF到LP滤波器系数变换器320将所述LSF变换成一组滤波器系数(例如,如上文参照窄带编码器A122的逆量化器240及变换器250所述)。逆量化器340将窄带残余信号S40解量化以产生窄带激励信号S80。基于所述滤波器系数及窄带激励信号S80,窄带合成滤波器330合成窄带信号S90。换句话说,窄带合成滤波器330经配置以根据所述经解量化的滤波器系数对窄带激励信号S80进行频谱成形,以产生窄带信号S90。窄带解码器B112还将窄带激励信号S80提供给高频带编码器A200,高频带编码器A200使用窄带激励信号S80以如本文所述导出高频带激励信号S120。在如下文所述的某些实施方案中,窄带解码器B110可经配置以向高频带解码器B200提供关于窄带信号的其他信息,例如频谱倾斜、音调增益及滞后、及语音模式。
由窄带编码器A122及窄带解码器B112构成的系统是通过合成来分析的语音编译码器的基本实例。代码簿激励线性预测(CELP)编码是一族流行的通过合成来分析的编码,且这种编码器的实施方案可对残余信号执行波形编码,包含例如以下操作:从固定及自适应性代码簿中选择条目、误差最小化操作、及/或感知加权操作。通过合成来分析的编码的其他实施方案包含混合的激励线性预测(MELP)、代数CELP(ACELP)、弛豫CELP(RCELP)、规则脉冲激励(RPE)、多脉冲CELP(MPE)、及向量和激励线性预测(VSELP)编码。相关的编码方法包含多波段激励(MBE)及原型波形内推(PWI)编码。标准化的通过合成来分析的语音编译码器的实例包含:ETSI(欧洲电信标准协会)-GSM满速率编译码器(GSM 06.10),其使用残余激励线性预测(RELP);GSM增强满速率编译码器(ETSI-GSM 06.60);ITU(国际电信联盟)标准11.8kb/s G.729 Annex E编码器;用于IS-136(时分多址方案)的IS(临时标准)-641编译码器;GSM自适应性多速率(GSM-AMR)编译码器;及4GVTM(第四代声码器TM)编译码器(QUALCOMM公司,圣地亚哥,加州)。窄带编码器A120及对应解码器B110可根据这些技术中的任一种、或任何其他将语音信号表示为如下的语音编码技术(已知的或即将开发的)来实施:(A)一组描述滤波器的参数及(B)用于驱动所述滤波器以再现语音信号的激励信号。
即使在白化滤波器已从窄带信号S20中移除粗略频谱包络之后,仍可存在相当大程度的精细谐波结构,尤其是对于浊音语音来说。图8a显示针对有声信号(例如浊音)的可由白化滤波器产生的残余信号的实例的频谱曲线图。在这一实例中可看到的周期性结构与音调有关,且同一讲话者所发出的不同浊音可具有不同的共振峰结构但类似的音调结构。图8b显示这一残余信号的实例的时域曲线图,其显示音调脉冲随时间的序列。
可通过使用一个或多个参数值对音调结构的特性进行编码来提高编码效率及/或语音质量。音调结构的一个重要特性是第一谐波的频率(还称作基本频率),其通常处于60到400Hz的范围内。这种特性通常被编码成基本频率的逆,还称作音调滞后。音调滞后指示一个音调周期中的样本数量,且可编码成一个或多个代码簿索引。男性讲话者的语音信号往往比女性讲话者的语音信号具有更大的音调滞后。
与音调结构相关的另一信号特性是周期性,其指示谐波结构的强度或者,换句话说,信号是谐波或非谐波的程度。两个典型的周期性指示符是零交叉点及规范化自相关函数(NACF)。周期性还可以由音调增益来指示,音调增益通常被编码为代码簿增益(例如经量化的自适应性代码簿增益)。
窄带编码器A120可包含一个或多个经配置以对窄带信号S20的长期谐波结构进行编码的模块。如图9中所示,一个可使用的典型CELP范例包含对短期特性或粗略频谱包络进行编码的开环LPC分析模块,后随对精细音调或谐波结构进行编码的闭环长期预测分析级。短期特性被编码为滤波器系数,而长期特性被编码为例如音调滞后及音调增益等参数的值。例如,窄带编码器A120可经配置以按包含一个或多个代码簿索引(例如,固定代码簿索引及自适应性代码簿索引)及对应增益值的形式输出已编码的窄带激励信号S50。计算窄带残余信号的这种量化表示形式(例如由量化器270)可包含选择这种索引并计算这些值。对音调结构的编码还可包含音调原型波形的内插,所述操作可包含计算各连续音调脉冲之间的差。对于对应于清音语音的帧(其通常类似于噪音且未结构化),可禁用对长期结构的建模。
根据图9所示范例的窄带解码器B110的实施方案可经配置以在长期结构(音调或谐波结构)已得到恢复之后向高频带解码器B200输出窄带激励信号S80。例如,这一解码器可经配置以输出窄带激励信号S80作为已编码的窄带激励信号S50的解量化版本。当然,还可能实施窄带解码器B110以使高频带解码器B200执行对已编码的窄带激励信号S50的解量化以获得窄带激励信号S80。
在根据图9所示范例的宽带语音编码器A100的实施方案中,高频带编码器A200可经配置以接收通过短期分析或白化滤波器而产生的窄带激励信号。换句话说,窄带编码器A120可经配置以在对长期结构进行编码之前向高频带编码器A200输出窄带激励信号。然而,期望使高频带编码器A200从窄带信道接收与将由高频带解码器B200接收到的编码信息相同的编码信息,因而由高频带编码器A200产生的编码参数可能已经在某种程度上考虑到所述信息中的非理想化情形。因而,较佳的情形可能是使高频带编码器A200根据相同的已参数化及/或量化的已编码窄带激励信号S50来重构窄带激励信号S80,以供由宽带语音编码器A100输出。这种方法的一个潜在优点是如下文所述更准确地计算高频带增益因数S60b。
除了表征窄带信号S20的短期及/或长期结构的参数之外,窄带编码器A120还可以产生与窄带信号S20的其他特性相关的参数值。这些值(其可经适当量化以供宽带语音编码器A100输出)可包含于窄带滤波器参数S40之中或者可单独输出。高频带编码器A200还可经配置以根据这些额外参数中的一者或多者来计算高频带编码参数S60(例如在解量化之后)。在宽带语音解码器B100处,高频带解码器B200可经配置以经由窄带解码器B110接收参数值(例如在解量化之后)。另一选择为,高频带解码器B200可经配置以直接接收(及可能解量化)所述参数值。
在其他窄带编码参数的一个实例中,窄带编码器A120产生频谱倾斜值及每个帧的语音模式参数。频谱倾斜与通带上的频谱包络的形状有关,且通常由经量化的第一反射系数表示。对于多数浊音来说,频谱能量均会随频率增大而降低,因此第一反射系数为负数且可能接近-1。多数清音或者具有平坦的频谱以使第一反射系数接近0,或者在高频处具有更多能量以使第一反射系数为正且可能接近+1。
语音模式(还称作发音模式)指示当前帧是表示浊音语音还是清音语音。所述参数可具有二进制值,所述二进制值是基于所述帧的一个或多个周期性量度(例如零交叉、NACF、音调增益)及/或话音活动,例如这一量度与阈值之间的关系。在其他实施方案中,语音模式参数具有一种或多种其他状态以指示例如静默或背景噪音、或静默与浊音语音之间的过渡等模式。
高频带编码器A200经配置以根据源滤波器模型对高频带信号S30进行编码,其中对这一滤波器的激励是基于已编码的窄带激励信号。图10显示高频带编码器A200的实施方案A202的方块图,所述高频带编码器A200经配置以产生包含高频带滤波器参数S60a及高频带增益因数S60b的高频带编码参数S60流。高频带激励产生器A300从已编码的窄带激励信号S50导出高频带激励信号S120。分析模块A210产生一组表征高频带信号S30的频谱包络的参数值。在这一特定实例中,分析模块A210经配置以执行LPC分析来为高频带信号S30的每个帧产生一组LP滤波器系数。线性预测滤波器系数到LSF变换器410将所述LP滤波器系数组变换成一组对应的LSF。如上文参照分析模块210及变换器220所述,分析模块A210及/或变换器410可经配置以使用其他系数组(例如倒谱系数)及/或系数表示形式(例如ISP)。
量化器420经配置以将所述高频带LSF(或其他系数表示形式,例如ISP)组量化,且高频带编码器A202经配置以输出这种量化结果作为高频带滤波器参数S60a。这种量化器通常包含向量量化器,所述向量量化器将输入向量编码成表或代码簿中的对应向量条目的索引。
高频带编码器A202还包含合成滤波器A220,所述合成滤波器A220经配置以根据高频带激励信号S120及由分析模块A210产生的已编码频谱包络(例如所述LP滤波器系数组)来产生合成高频带信号S130。合成滤波器A220通常被实施为IIR滤波器,尽管也可使用FIR实施方案。在特定实例中,合成滤波器A220被实施为第六等级线性自回归滤波器。
高频带增益因数计算器A230计算原始高频带信号S30与合成高频带信号S130的各能级之间的一个或多个差别,以为所述帧指定增益包络。量化器430-其可实施为将输入向量编码为表或代码簿中对应向量条目的索引的向量量化器-将指定增益包络的一个或多个值量化,且高频带编码器A202经配置以输出这一量化结果作为高频带增益因数S60b。
在图10所示的实施方案中,合成滤波器A220经安排以从分析模块A210接收滤波器系数。高频带编码器A202的替代实施方案包含逆量化器及逆变换器,所述逆量化器及逆变换器经配置以根据高频带滤波器参数S60a将滤波器系数解码,且在这一情形中合成滤波器A220转而经安排以接收经解码的滤波器系数。这种替代安排可支持高频带增益计算器A230对增益包络的更精确计算。
在一个特定实例中,分析模块A210及高频带增益计算器A230每帧分别输出一组6个LSF及一组5个增益值,以便可通过每帧仅11个额外值来实现对窄带信号S20的宽带扩展。人耳往往对高频处的频率误差更不敏感,因此在低LPC等级处进行高频带编码可能产生具有可与以较高LPC等级进行窄带编码相当的感知质量的信号。高频带编码器A200的典型实施方案可经配置以每帧输出8到12个位来进行频谱包络的高质量重构,及每帧输出另外8到12个位来进行时间包络的高质量重构。在另一特定实例中,分析模块A210每帧输出一组8个LSF。
高频带编码器A200的某些实施方案经配置以通过产生具有高频带频率分量的随机噪音信号及根据窄带信号S20、窄带激励信号S80或高频带信号S30的时域包络对所述噪音信号进行幅值调制来产生高频带激励信号S120。尽管这种基于噪音的方法可为清音声音产生满足要求的结果,然而,其对于浊音声音(其残余信号通常是谐波且因而具有某种周期性结构)来说却不合意。
高频带激励产生器A300经配置以通过将窄带激励信号S80的频谱延伸到高频带频率范围内来产生高频带激励信号S120。图11显示高频带激励产生器A300的实施方案A302的方块图。逆量化器450经配置以将已编码的窄带激励信号S50解量化,以产生窄带激励信号S80。频谱扩展器A400经配置以基于窄带激励信号S80来产生经谐波扩展的信号S160。组合器470经配置以将噪音产生器480所产生的随机噪音信号与包络计算器460所计算的时域包络相组合,以产生经调制的噪音信号S170。组合器490经配置以将经谐波扩展的信号S60与经调制的噪音信号S170相混合,以产生高频带激励信号S120。
在一个实例中,频谱扩展器A400经配置以对窄带激励信号S80执行频谱折叠操作(还称作镜像),以产生经谐波扩展的信号S160。可通过对激励信号S80进行零填充并随后应用高通滤波器以保留混叠来执行频谱折叠。在另一实例中,频谱扩展器A400经配置以通过将窄带激励信号S80在频谱上转译到高频带内(例如经由上取样、随后乘以恒定频率的余弦信号)来产生经谐波扩展的信号S160。
频谱折叠及转译方法可产生其谐波结构与窄带激励信号S80的原始谐波结构在相位及/或频率上不连贯的经频谱扩展信号。例如,这种方法可产生具有通常不位于基本频率倍数处的峰值的信号,这可能引起已重构的语音信号中声音低小的伪像。所述方法往往还会产生具有异常强的声调特性的高频谐波。此外,由于PSTN信号可按8kHz来取样但带宽限制不大于3400Hz,因而窄带激励信号S80的上部频谱可几乎不含有或根本不含有能量,从而使根据频谱折叠或频谱转译操作产生的扩展信号可具有高于3400Hz的频谱孔。
其他产生经谐波扩展的信号S160的方法包含识别窄带激励信号S80的一个或多个基本频率并根据所述信息产生谐波声调。例如,激励信号的谐波结构可由基本频率连同幅值及相位信息一起来表征。高频带激励产生器A300的另一实施方案基于基本频率及幅值(例如由音调滞后及音调增益指示)来产生经谐波扩展的信号S160。然而,除非所述经谐波扩展的信号与窄带激励信号S80在相位上同调,否则所得到的经解码语音的质量可能无法令人接受。
可使用非线性函数来形成与窄带激励在相位上同调并保持谐波结构而无相位不连贯性的高频带激励信号。非线性函数还可以在各高频谐波之间提供增大的噪音能级,这往往听起来比通过例如频谱折叠及频谱转译等方法所产生的声调高频谐波更自然。可供频谱扩展器A400的各种实施方案应用的典型无记忆非线性函数包含绝对值函数(还称作全波整流)、半波整流、求平方、取立方、及剪辑。频谱扩展器A400的其他实施方案可经配置以应用有记忆的非线性函数。
图12是频谱扩展器A400的实施方案A402的方块图,所述频谱扩展器A400经配置以应用非线性函数来扩展窄带激励信号S80的频谱。上取样器510经配置以对窄带激励信号S80进行上取样。可能期望对所述信号充分地上取样以便在应用所述非线性函数时使失真最小化。在一个特定实例中,上取样器510对所述信号进行8倍上取样。上取样器510可经配置以通过对输入信号进行零填充及对结果进行低通滤波来执行上取样操作。非线性函数计算器520经配置以对经上取样的信号应用非线性函数。绝对值函数与其他用于频谱扩展的非线性函数(例如求平方)相比的一个潜在优点是无需能量规范化。在某些实施方案中,可通过剥离或清除每个样本的符号位来有效地应用绝对值函数。非线性函数计算器520还可经配置以对经上取样或经频谱扩展的信号执行幅值卷曲。
下取样器530经配置以对应用非线性函数的经频谱扩展结果进行下取样。可能期望在降低取样速率(例如,以降低或避免因意外影像引起混叠或讹误)之前使下取样器530执行带通滤波操作,以选择经频谱扩展信号的所需频带。还可能期望使下取样器530将取样速率降低多于一个级。
图12a是显示在一个频谱扩展操作实例中的不同点处的信号频谱的图式,其中各曲线中的频率刻度相同。曲线(a)显示窄带激励信号S80的一个实例的频谱。曲线(b)显示在已对信号S80进行8倍上取样之后的频谱。曲线(c)显示在应用非线性函数之后的扩展频谱的实例。曲线(d)显示在低通滤波之后的频谱。在这一实例中,通带扩展到高频带信号S30的频率上限(例如7kHz或8kHz)。
曲线(e)显示在第一级下取样之后的频谱,其中将取样速率降低到四分之一以获得宽带信号。曲线(f)显示在进行高通滤波操作以选择经扩展信号的高频带部分之后的频谱,且曲线(g)显示在第二级下取样之后的频谱,其中取样速率降低到二分之一。在一个特定实例中,下取样器530通过将宽带信号传送通过滤波器组A112的高通滤波器130及下取样器140(或其他具有相同响应的结构或例程)来执行高通滤波及第二级下取样,以产生具有高频带信号S30的频率范围及取样速率的经频谱扩展信号。
如在曲线(g)中可见,曲线(f)中所示高通信号的下取样会引起其频谱反转。在这一实例中,下取样器530还经配置以对所述信号执行频谱翻转操作。曲线(h)显示应用所述频谱翻转操作的结果,其中频谱翻转操作可通过将信号乘以函数ejnπ或序列(-1)n(其值在+1与-1之间交替)来实施。这一操作等价于将信号在频域中的数字频谱移动距离π。应注意,通过以不同次序应用下取样及频谱翻转操作,还可获得相同的结果。上取样及/或下取样操作还可经配置以包含重新取样,以获得具有高频带信号S30的取样速率(例如7kHz)的经频谱扩展信号。
如上文所述,滤波器组A110及B120可经实施以使窄带信号S20及高频带信号S30的一者或二者均在滤波器组A110的输出端处具有频谱反转形式、以所述频谱反转形式得到编码及解码、并于在宽带语音信号S110中输出之前在滤波器组B120处再次得到频谱反转。当然,在这种情形中,将不必进行图12a所示的频谱翻转操作,因为使高频带激励信号S120也具有频谱反转形式将是合意的。
可按许多不同方式来配置及安排如频谱扩展器A402所执行的频谱扩展操作中上取样及下取样的各种任务。例如,图12b是显示在另一频谱扩展操作实例中在不同点处的信号频谱的图式,其中各曲线中的频率刻度相同。曲线(a)显示窄带激励信号S80的一个实例的频谱。曲线(b)显示在已对信号S80进行2倍上取样之后的频谱。曲线(c)显示在应用非线性函数之后的扩展频谱实例,在这一情形中,接受可能出现于较高频率中的混叠。
曲线(d)显示在频谱反转操作之后的频谱。曲线(e)显示在第一级下取样之后的频谱,其中将取样速率降低到二分之一以获得所需的频谱扩展信号。在所述实例中,信号是频谱反转形式,且可用于曾以这种形式处理高频带信号S30的高频带编码器A200的实施方案中。
由非线性函数计算器520所产生的频谱扩展信号的幅值可能会随频率增大而明显降低。频谱扩展器A402包含经配置以对经下取样的信号执行白化操作的频谱平整器540。频谱平整器540可经配置以执行固定白化操作或执行自适应性白化操作。在自适应性白化的特定实例中,频谱平整器540包含经配置以根据经下取样的信号计算一组四个滤波器系数的LPC分析模块,及经配置以根据所述系数对所述信号进行白化的第四等级分析滤波器。频谱扩展器A400的其他实施方案包含其中频谱平整器540在下取样器530之前对经频谱扩展信号进行操作的配置。
高频带激励产生器A300可经实施以将经谐波扩展的信号S160作为高频带激励信号S120输出。然而,在某些情形中,仅使用经谐波扩展的信号作为高频带激励可能会造成可听伪像。语音的谐波结构通常在高频带中不如在低频段中明显,且在高频带激励信号中使用过多的谐波结构可能会造成嗡嗡的声音。在来自女性讲话者的语音信号中,这种伪像可能尤其明显。
各实施例包含经配置以将经谐波扩展的信号S160与噪音信号相混合的高频带激励产生器A300的实施方案。如在图11中所示,高频带激励产生器A302包含经配置以产生随机噪音信号的噪音产生器480。在一个实例中,噪音产生器480经配置以产生单位方差白色伪随机噪音信号,尽管在其他实施方案中,所述噪音信号无需为白色且可具有随频率变化的功率密度。可能期望使噪音产生器480经配置以将所述噪音信号作为确定性函数来输出,以使其状态可在解码器处得到复制。例如,噪音产生器480可经配置以输出所述噪音信号作为先前在同一帧内得到编码的信息(例如窄带滤波器参数S40及/或已编码的窄带激励信号S50)的确定性函数。
在与经谐波扩展的信号S160相混合之前,可对噪音产生器480所产生的随机噪音信号进行幅值调制,以使其时域包络近似于窄带信号S20、高频带信号S30、窄带激励信号S80或经谐波扩展的信号S160随时间的能量分布。如图11中所示,高频带激励产生器A302包含组合器470,所述组合器470经配置以根据由包络计算器460所计算的时域包络对由噪音产生器480所产生的噪音信号进行幅值调制。例如,组合器470可被实施为乘法器,所述乘法器经安排以根据由包络计算器460所计算的时域包络来按比例缩放噪音产生器480的输出以产生经调制的噪音信号S170。
在如图13的方块图中所示的高频带激励产生器A302的实施方案A304中,包络计算器460经安排以计算经谐波扩展的信号S160的包络。在如图14的方块图中所示的高频带激励产生器A302的实施方案A306中,包络计算器460经安排以计算窄带激励信号S80的包络。高频带激励产生器A302的进一步实施方案还可另外经配置以根据窄带音调脉冲的时间位置向经谐波扩展的信号S160添加噪音。
包络计算器460可经配置以将包络计算执行为包含一系列子任务的任务。图15显示这一任务的实例T100的流程图。子任务T110计算将要对其包络建模的信号(例如,窄带激励信号S80或经谐波扩展的信号S160)的帧中每个样本的平方,以产生平方值序列。子任务T120对所述平方值序列执行平滑操作。在一个实例中,子任务T120根据下列表达式对所述序列应用第一等级的IIR低通滤波器:
y(n)=ax(n)+(1-a)y(n-1), (1)
其中x是滤波器输入,y是滤波器输出,n是时域索引,且a是值介于0.5与1之间的平滑系数。平滑系数a的值可以是固定的,或者在替代实施方案中可根据输入信号中噪音的指示而是自适应性的,以便a在不存在噪音时更接近于1而在存在噪音时更接近于0.5。子任务T130对经平滑的序列中的每个样本应用平方根函数以产生时域包络。
这种包络计算器460的实施方案可经配置以按串行及/或并行方式执行任务T100的各子任务。在任务T100的进一步实施方案中,可在子任务T110之前执行带通操作,所述带通操作经配置以选择将对其包络进行建模的信号的所需频率部分,例如3-4kHz的范围。
组合器490经配置以将经谐波扩展的信号S60与经调制的噪音信号S170相混合,以产生高频带激励信号S120。例如,组合器490的实施方案可经配置以将高频带激励信号S120计算为经谐波扩展的信号S160与经调制噪音信号S170的和。组合器490的这种实施方案可经配置以通过在求和之前对经谐波扩展的信号S160及/或对经调制噪音信号S170应用加权因数而将高频带激励信号S120计算为加权和。每个这种加权因数均可根据一个或多个准则来计算且可以是固定值,或者另一选择为,可以是逐帧或逐子帧计算的自适应值。
图16显示组合器490的实施方案492的方块图,组合器490经配置以将高频带激励信号S120计算为经谐波扩展的信号S160与经调制噪音信号S170的加权和。组合器492经配置以根据谐波加权因数S180对经谐波扩展的信号S160加权、根据噪音加权因数S190对经调制噪音信号S170加权、并将高频带激励信号S120作为所述经加权信号的和来输出。在所述实例中,组合器492包含经配置以计算谐波加权因数S180及噪音加权因数S190的加权因数计算器550。
加权因数计算器550可经配置以根据高频带激励信号S120中谐波含量对噪音含量的所需比率来计算加权因数S180及S190。例如,可能期望使组合器492产生的高频带激励信号S120具有与高频带信号S30相类似的谐波能量对噪音能量的比率。在加权因数计算器550的某些实施方案中,根据一个或多个与窄带信号S20的周期性或窄带残余信号的周期性相关的参数(例如音调增益及/或语音模式)来计算加权因数S180、S190。加权因数计算器550的这种实施方案可经配置以将与(例如)音调增益成正比的值赋予谐波加权因数S180,及/或针对清音语音信号将比针对浊音语音信号更高的值赋予噪音加权因数S190。
在其他实施方案中,加权因数计算器550经配置以根据高频带信号S30的周期性量度来计算谐波加权因数S180及/或噪音加权因数S190的值。在一个这种实例中,加权因数计算器550针对当前帧或子帧将谐波加权因数S180计算为高频带信号S30的自相关系数的最大值,其中在包含一个音调滞后的延迟且不包含零样本延迟的搜索范围上执行自相关。图17显示长度为n个样本的这种搜索范围的实例,所述搜索范围居中于一个音调滞后的延迟周围且宽度不大于一个音调滞后。
图17还显示另一方法的实例,其中加权因数计算器550在数个级中计算高频带信号S30的周期性量度。在第一级中,将当前帧划分为多个子帧,且针对每个子帧分别识别使自相关系数最大的延迟。如上文所述,在包含一个音调滞后的延迟且不包含零样本延迟的搜索范围内执行自相关。
在第二级中,通过如下方式来构造经延迟的帧:对每个子帧应用对应的已识别延迟,并置所得到的子帧以构造经最佳延迟的帧,并将谐波加权因数S180计算为原始帧与经最佳延迟的帧之间的相关系数。在另一替代形式中,加权因数计算器550将谐波加权因数S180计算为在第一级中针对每个子帧所获得的最大自相关系数的平均值。加权因数计算器550的实施方案还可以经配置以按比例缩放相关系数,及/或将其与另一值相组合,以计算谐波加权因数S180的值。
可能期望仅在其中以其他方式指示在帧中存在周期性的情形中使加权因数计算器550计算高频带信号S30的周期性量度。例如,加权因数计算器550可经配置以根据当前帧的另一周期性指示符(例如音调增益)与阈值之间的关系来计算高频带信号S30的周期性量度。在一个实例中,加权因数计算器550经配置以仅在帧的音调增益(例如窄带残余的自适应性代码簿增益)值大于0.5(另一选择为,至少为0.5)时才对高频带信号S30执行自相关操作。在另一实例中,加权因数计算器550经配置以仅针对具有特定语音模式状态的帧(例如仅针对浊音信号)对高频带信号S30执行自相关操作。在这种情形中,加权因数计算器550可经配置以向具有其他语音模式状态及/或更小的音调增益值的帧赋予缺省加权因数。
各实施例包含加权因数计算器550的进一步实施方案,所述实施方案经配置以根据不同于周期性的特性或除周期性以外的其他特性来计算加权因数。例如,这一实施方案可经配置以针对具有较大音调滞后的语音信号比具有较小音调滞后的语音信号将更高的值赋予噪音增益因数S190。加权因数计算器550的另一这种实施方案经配置以根据信号在基本频率的倍数处的能量相对于信号在其他频率分量处的能量的量度来确定宽带语音信号S10或高频带信号S30的谐波量度。
宽带语音编码器A100的某些实施方案经配置以基于音调增益及/或本文所述的另一周期或谐波量度而输出周期或谐波指示(例如指示所述帧是谐波或非谐波的1位旗标)。在一个实例中,对应的宽带语音解码器B100使用这一指示来配置例如加权因数计算等操作。在另一实例中,这一指示用于在编码器及/或解码器处计算语音模式参数的值。
可能期望使高频带激励产生器A302产生高频带激励信号S120,以使所述激励信号的能量基本上不受加权因数S180及S190的特定值的影响。在这种情形中,加权因数计算器550可经配置以计算谐波加权因数S180或噪音加权因数S190的值(或从存储器或高频带编码器A200的另一元件接收这种值)并根据例如以下的表达式来导出另一加权因数的值:
(Wbarmmic)2+(Wnoise)2=1,(2)
其中Wbarmmic标识谐波加权因数S180,且Wnoise标识噪音加权因数SI90。另一选择为,加权因数计算器550可经配置以根据当前帧或子帧的周期性量度值在多对加权因数S180、S190中间选择对应的一对,其中所述对经预先计算以满足恒定能量比率(例如表达式(2))。对于其中遵守表达式(2)的加权因数计算器550的实施方案来说,谐波加权因数S180的典型值介于约0.7到约1.0的范围内,且噪音加权因数S190的典型值介于约0.1到约0.7的范围内。加权因数计算器550的其他实施方案可经配置以根据表达式(2)的一版本来操作,所述版本是根据经谐波扩展的信号S160与经调制噪音信号S170之间的所需基线加权来修改的。
当已使用稀疏代码簿(一个其条目大多为零值的代码簿)来计算残余的量化表示形式时,在合成语音信号中可能会出现伪像。在以低的位速率对窄带信号进行编码时,尤其会出现代码簿稀疏性。由代码簿稀疏性引起的伪像通常在时间上是准周期性,且多数发生于3kHz以上。因为人耳在较高频率下具有更好的时间解析度,因而这些伪像在高频带中可能更明显。
各实施例包含经配置以执行抗稀疏滤波的高频带激励产生器A300的实施方案。图18显示包含抗稀疏滤波器600的高频带激励产生器A302的实施方案A312的方块图,抗稀疏滤波器600经安排以对由逆量化器450所产生的经解量化窄带激励信号进行滤波。图19显示包含抗稀疏滤波器600的高频带激励产生器A302的实施方案A314的方块图,抗稀疏滤波器600经安排以对由频谱扩展器A400所产生的经频谱扩展信号进行滤波。图20显示包含抗稀疏滤波器600的高频带激励产生器A302的实施方案A316的方块图,抗稀疏滤波器600经安排以对组合器490的输出进行滤波以产生高频带激励信号S120。当然,本发明还涵盖并在本文明确地揭示将任一实施方案A304及A306的特征与任一实施方案A312、A314及A316的特征相组合的高频带激励产生器A300的实施方案。抗稀疏滤波器600还可被安排在频谱扩展器A400内:例如,在频谱扩展器A402中任一元件510、520、530及540之后。应明确指出,抗稀疏滤波器600还可与频谱扩展器A400的执行频谱折叠、频谱转译或谐波扩展的实施方案一起使用。
抗稀疏滤波器600可经配置以改变其输入信号的相位。例如,可能期望使抗稀疏滤波器600经配置及安排以使高频带激励信号S120的相位随机化,或者以其他方式更均匀地随时间分布。还可能期望使抗稀疏滤波器600的响应在频谱上平整,以使经滤波信号的量值频谱不会显著变化。在一个实例中,抗稀疏滤波器600被实施为具有根据如下表达式的转移函数的全通滤波器:
这种滤波器的一个效用可以是使输入信号的能量扩展使其不再集中于仅几个样本中。
对于其中残余包含更少音调信息的噪音类信号、还有背景噪音中的语音来说,因代码簿稀疏性引起的伪像通常更为明显。在其中激励具有长期结构的情形中,稀疏性通常会引起更少的伪像,且实际上相位修改可在浊音信号中引起杂音。因而,可能期望配置抗稀疏滤波器600以滤除清音信号,并不加修改地通过至少某些浊音信号。清音信号是由低音调增益(例如,量化的窄带自适应性代码簿增益)及频谱倾斜(例如量化的第一反射系数)来表征,所述频谱倾斜接近于0或为正数,这指示平整或随频率增大而向上倾斜的频谱包络。抗稀疏滤波器600的典型实施方案经配置以滤除清音声音(例如,如频谱倾斜的值所指示)、当音调增益低于阈值(另一选择为,不大于阈值)时滤除浊音声音,及以其他方式不加修改地通过所述信号。
抗稀疏滤波器600的其他实施方案包含两个或更多个经配置以具有不同的最大相位修改角(例如高达180度)的滤波器。在这种情形中,抗稀疏滤波器600可经配置以根据音调增益(例如,量化的自适应性代码簿或LTP增益)的值在这些分量滤波器中间进行选择,以便对具有更低音调增益值的帧使用更大的最大相位修改角。抗稀疏滤波器600的实施方案还可以包含经配置以在更大或更小频谱内修改相位的不同分组滤波器,以便对具有更低音调增益值的帧使用经配置以在输入信号的更宽频率范围内修改相位的滤波器。
为精确地再现已编码的语音信号,可能期望使合成宽带语音信号S100的高频带部分的能级与窄带部分的能级之间的比率类似于原始宽带语音信号S10中的所述比率。除了由高频带编码参数S60a所表示的频谱包络之外,高频带编码器A200还可经配置以通过指定时间包络或增益包络来表征高频带信号S30。如图10中所示,高频带编码器A202包含高频带增益因数计算器A230,所述高频带增益因数计算器A230经配置及安排以根据高频带信号S30与合成高频带信号S130之间的关系(例如在帧或其某一部分内所述两个信号的能量之间的差或比率)计算一个或多个增益因数。在高频带编码器A202的其他实施方案中,高频带增益计算器A230可同样地经配置但转而经安排以根据高频带信号S30与窄带激励信号S80或高频带激励信号S120之间的这种时变关系来计算增益包络。
窄带激励信号S80与高频带信号S30的时间包络有可能相似。因此,对基于高频带信号S30与窄带激励信号S80(或自其导出的信号,例如高频带激励信号S120或合成高频带信号S130)之间关系的增益包络进行编码将一般比对仅基于高频带信号S30的增益包络进行编码更为高效。在典型实施方案中,高频带编码器A202经配置以输出8-12个位的经量化索引,所述索引为每个帧指定五个增益因数。
高频带增益因数计算器A230可经配置以将增益因数计算作为包含一个或多个子任务系列的任务来执行。图21显示这一任务的实例T200的流程图,所述任务根据高频带信号S30与合成高频带信号S130的相对能量来计算对应子帧的增益值。任务220a及220b计算各自信号的对应子帧的能量。例如,任务220a及220b可经配置以将能量计算为各自子帧的样本的平方和。任务T230将子帧的增益因数计算为所述能量的比率的平分根。在这一实例中,任务T230将增益因数计算为在所述子帧内高频带信号S30的能量对合成高频带信号S130的能量的比率的平方根。
可能期望使高频带增益因数计算器A230经配置以根据开窗函数来计算子帧能量。图22显示增益因数计算任务T200的这种实施方案T210的流程图。任务T215a对高频带信号S30应用开窗函数,且任务T215b对合成高频带信号S130应用同一开窗函数。任务220a及220b的实施方案222a及222b计算各个窗口的能量,且任务T230将子帧的增益因数计算为所述能量的比率的平方根。
可能期望应用使邻近子帧重叠的开窗函数。例如,产生可按重叠-相加方式加以应用的增益因数的开窗函数可有助于降低或避免各子帧之间的不连贯性。在一个实例中,高频带增益因数计算器A230经配置以如图23a所示应用梯形开窗函数,其中所述窗口与两个邻近子帧中的每一者均重叠1毫秒。图23b显示对20毫秒的帧的五个子帧中的每一者应用这一开窗函数。高频带增益因数计算器A230的其他实施方案可经配置以应用具有不同重叠周期及/或可以是对称或不对称的不同窗口形状(例如矩形,Hamming形状)的开窗函数。还可能配置高频带增益因数计算器A230的实施方案以对一帧内的不同子帧应用不同的开窗函数及/或为包含不同长度的子帧的帧应用不同的开窗函数。
无限定地提供以下值作为特定实施方案的实例。针对这些情形假设20毫秒的帧,尽管也可使用任一其他持续时间。对于以7kHz来取样的高频带信号来说,每个帧均具有140个样本。如果将这一帧划分成五个具有相等长度的子帧,则每个子帧将具有28个样本,且如图23a所示的窗口将是42个样本宽。对于以8kHz来取样的高频带信号来说,每个帧均具有160个样本。如果将这种帧划分成五个具有相等长度的子帧,则每个子帧将具有32个样本,且如图23a所示的窗口将是48个样本宽。在其他实施方案中,可使用任一宽度的子帧,且甚至可能使高频带增益计算器A230的实施方案经配置以针对一帧的每个样本均产生不同的增益因数。
图24显示高频带解码器B200的实施方案B202的方块图。高频带解码器B202包含经配置以基于窄带激励信号S80产生高频带激励信号S120的高频带激励产生器B300。依据特定的系统设计选项,高频带激励产生器B300可根据本文所述高频带激励产生器A300的任一实施方案来实施。通常期望实施高频带激励产生器B300以使其与特定编码系统的高频带编码器的高频带激励产生器具有相同的响应。然而,由于窄带解码器B110通常将对已编码的窄带激励信号S50进行解量化,因而在大多数情形中,高频带激励产生器B300可经实施以从窄带解码器B110接收窄带激励信号S80而无需包含经配置以将已编码的窄带激励信号S50解量化的逆量化器。还可能使窄带解码器B110经实施以包含抗稀疏滤波器600的实例,抗稀疏滤波器600的所述实例经安排以在将经量化的窄带激励信号输入到例如滤波器330等窄带合成滤波器之前对其进行滤波。
逆量化器560经配置以将高频带滤波器参数S60a解量化(在所述实例中是解量化成一组LSF),且LSF到LP滤波器系数变换器570经配置以将所述LSF变换成一组滤波器系数(例如,如上文参照窄带编码器A122的逆量化器240及变换器250所述)。在其他实施方案中,如上文所述,可使用不同的系数组(例如倒谱系数)及/或系数表示形式(例如ISP)。高频带分析滤波器B200经配置以根据高频带激励信号S120及所述滤波器系数组来产生合成高频带信号。对于其中高频带编码器包含合成滤波器的系统(例如,如在上文所述编码器A202的实例中)来说,可能期望实施高频带合成滤波器B200以使其具有与所述合成滤波器相同的响应(例如,相同的转移函数)。
高频带解码器B202还包含经配置以将高频带增益因数S60b解量化的逆量化器580及增益控制元件590(例如,乘法器或放大器),所述增益控制元件590经配置及安排以对合成高频带信号应用所述经解量化的增益因数以产生高频带信号S100。对于其中由多于一个增益因数指定帧的增益包络的情形,增益控制元件590可包含经配置以可能根据开窗函数对各个子帧应用增益因数的逻辑,所述开窗函数可以是与由对应高频带编码器的增益计算器(例如高频带增益计算器A230)所应用的开窗函数相同或不同的开窗函数。在高频带编码器B202的其他实施方案中,增益控制元件590类似地经配置但转而经安排以对窄带激励信号S80或对高频带激励信号S120应用经解量化的增益因数。
如上文所述,可能期望在高频带编码器与高频带解码器中获得相同的状态(例如,通过在编码期间使用经解量化的值)。因此,在根据这种实施方案的编码系统中,可能期望确保高频带激励产生器A300与B300中的对应噪音产生器具有相同的状态。例如,这种实施方案的高频带激励产生器A300与B300可经配置以使噪音产生器的状态是已在同一帧内得到编码的信息(例如,窄带滤波器参数S40或其一部分,及/或已编码的窄带激励信号S50或其一部分)的确定性函数。
本文所述元件的一个或多个量化器(例如量化器230、420或430)可经配置以执行分类向量量化。例如,这种量化器可经配置以基于已在窄带信道及/或在高频带信道中在同一帧内得到编码的信息来选择一组代码簿中的一者。这种技术通常提供不断提高的编码效率,但代价是需要额外的代码簿存储装置。
如上文参照(例如)图8及9所述,在从窄带语音信号S20中移除粗略频谱包络之后,残余信号中可能会存在可观数量的周期性结构。例如,所述残余信号可能包含随时间大体呈周期性的脉冲或尖峰的序列。这种通常与音调相关的结构尤其可能出现于浊音语音信号中。计算窄带残余信号的量化表示形式可能包括根据由(例如)一个或多个代码簿所表示的长期周期性模型来对这一音调结构进行编码。
实际残余信号的音调结构与所述周期性模型可能并不完全匹配。例如,所述残余信号可在音调脉冲的位置规律性中包含小的抖动,从而使帧中各连续音调脉冲之间的距离并不精确地相等且结构并不完全规则。这些不规律性往往会降低编码效率。
窄带编码器A120的某些实施方案经配置以通过在量化之前或量化期间对残余信号应用自适应性时间卷曲、或通过以其他方式在已编码的激励信号中包含自适应性时间卷曲来对音调结构执行规则化。例如,这种编码器可经配置以选择或以其他方式计算时间的卷曲程度(例如根据一个或多个感知加权准则及/或误差最小化准则),以使所得到的激励信号最佳地符合长期周期性模型。音调结构的规则化是由称作弛豫代码激励线性预测(RCELP)编码器的CELP编码器子组执行的。
RCELP编码器通常经配置以将时间卷曲作为自适应性时间偏移来执行。这种时间偏移可以是从负的数毫秒到正的数毫秒范围内的延迟,且其通常平滑地变化以避免出现可听到的不连贯性。在某些实施方案中,这种编码器经配置以按分段方式应用规则化,其中每个帧或子帧均卷曲一对应的固定时间偏移量。在其他实施方案中,所述编码器经配置以将规则化应用为连续卷曲函数,以使帧或子帧根据音调轮廓(还称作音调轨线)来卷曲。在某些情形中(例如,如第2004/0098255号美国专利申请案中所述),所述编码器经配置以通过对用于计算已编码的激励信号的经感知加权的输入信号应用偏移量而在已编码的激励信号中包含时间卷曲。
所述编码器计算经规则化及量化的已编码激励信号,且所述解码器将所述已编码激励信号解量化以获得用于合成已解码语音信号的激励信号。所述已解码输出信号因此呈现出与通过规则化而包含于已编码的激励信号中的相同变化延迟。通常,不向解码器传输任何用于指定规则化量的信息。
规则化往往会使残余信号更易于编码,这会改进来自长期预测器的编码增益并由此提高总体编码效率且一般不会产生伪像。可能期望仅对浊音帧执行规则化。例如,窄带编码器A124可经配置以仅使所述具有长期结构的帧或子帧(例如浊音信号)偏移。甚至可能期望仅对包含音调脉冲能量的子帧执行规则化。RCELP编码的各种实施方案描述于第5,704,003号(Kleijn等人)及第6,879,955号(Rao)美国专利以及第2004/0098255号(Kovesi等人)美国专利申请公开案中。现有的RCELP编码器实施方案包含如在电信行业协会(TIA)IS-127及第三代伙伴工程2(3GPP2)可选模式声码器(SMV)中所述的增强可变速率编译码器(EVRC)。
不幸地,对于其中从已编码的窄带激励信号导出高频带激励的宽带语音编码器(例如,包含宽带语音编码器A100及宽带语音解码器B100的系统)来说,规则化可能会引起问题。由于高频带激励信号是从经时间卷曲的信号导出,则其将通常具有不同于原始高频带语音信号的时间轮廓。换句话说,高频带激励信号将不再与原始高频带语音信号同步。
经卷曲的高频带激励信号与原始高频带语音信号之间在时间上的不对齐可能会引起数种问题。例如,经卷曲的高频带激励信号可能不再为根据从原始高频带语音信号提取的滤波器参数加以配置的合成滤波器提供合适的源激励。因此,合成高频带信号可能包含会降低已解码宽带语音信号的所感知质量的可听到伪像。
在时间上的不对齐还可能引起增益包络编码的效率低下。如上文所述,在窄带激励信号S80与高频带信号S30的时间包络之间可能存在相关性。通过根据这两个时间包络之间的关系对高频带信号的增益包络进行编码,可实现与直接对增益包络进行编码相比的编码效率提高。然而,在已编码的窄带激励信号被规则化后,这种相关性可能被弱化。窄带激励信号S80与高频带信号S30之间在时间上的不对齐可能会引起在高频带增益因数S60b中出现波动,且编码效率可能会降低。
各实施例包含根据包含于对应的已编码窄带激励信号中的时间卷曲来对高频带语音信号执行时间卷曲的宽带语音编码方法。这种方法的潜在优点包含改进已解码宽带语音信号的质量及/或改进对高频带增益包络进行编码的效率。
图25显示宽带语音编码器A100的实施方案AD10的方块图。编码器AD10包含窄带编码器A120的实施方案A124,所述实施方案经配置以在已编码的窄带激励信号S50的计算期间执行规则化。例如,窄带编码器A124可根据上文所述的一种或多种RCELP实施方案来配置。
窄带编码器A124还经配置以输出指定所应用的时间卷曲程度的规则化数据信号SD10。对于其中窄带编码器A124经配置以对每个帧或子帧应用一固定时间偏移量的各种情形来说,规则化数据信号SD10可包含一系列值,所述值将每个时间偏移量指示为以样本、毫秒或某一其他时间增量为单位的整数或非整数值。对于其中窄带编码器A124经配置以另外修改帧或其他样本序列的时间标量(例如通过压缩一部分并扩张另一部分)的情形来说,规则化信息信号SD10可包括对所述修改的对应说明,例如一组功能参数。在一个特定实例中,窄带编码器A124经配置以将帧划分为三个子帧,并为每个子帧计算一固定时间偏移量,以使规则化数据信号SD10为已编码的窄带信号的每个规则化帧指示三个时间偏移量。
宽带语音编码器AD10包含延迟线D120,延迟线D120经配置以根据由输入信号所指示的延迟量使高频带语音信号S30前移或滞后,以产生经时间卷曲的高频带语音信号S30a。在图25所示实例中,延迟线D120经配置以根据由规则化数据信号SD10指示的卷曲使高频带语音信号S30出现时间卷曲。通过这种方式,在分析之前就将包含于已编码的窄带激励信号S50中的相同时间卷曲量应用到高频带语音信号S30的对应部分。尽管这一实例将延迟线D120显示为与高频带编码器A200分离的元件,然而在其他实施方案中,延迟线D120被安排为高频带编码器的一部分。
高频带编码器A200的进一步实施方案可经配置以对未经卷曲的高频带语音信号S30执行频谱分析(例如LPC分析),并在计算高频带增益参数S60b之前对高频带语音信号S30执行时间卷曲。这一编码器可包含(例如)经安排以执行时间卷曲的延迟线D120的实施方案。然而,在这种情形中,基于分析未卷曲信号S30的高频带滤波器参数S60a可描述与高频带激励信号S120在时间上不对齐的频谱包络。
延迟线D120可根据适合用于对高频带语音信号S30应用所需时间卷曲操作的逻辑元件及存储元件的任一组合来配置。例如,延迟线D120可经配置以根据所需时间偏移量从缓冲器读取高频带语音信号S30。图26a显示包含移位寄存器SR1的延迟线D120的实施方案D122的示意图。移位寄存器SR1是具有某一长度m的缓冲器,其经配置以接收并存储高频带语音信号S30的m个最新样本。值m等于至少将要支持的最大正(或“前移”)时间偏移量与负(或“滞后”)时间偏移量的和。使值m等于高频带信号S30的帧或子帧的长度可能颇为方便。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出经时间卷曲的高频带信号S30a。偏移位置OL的位置根据由(例如)规则化数据信号SD10所指示的当前时间偏移量以参考位置(零时间偏移量)为中心变化。延迟线D122可经配置以支持相等的前移及滞后限值,或者另一选择为,其中一个限值大于另一限值以便可在一个方向上比在另一方向上执行更大的偏移。图26a显示支持正时间偏移量大于负时间偏移量的特定实例。延迟线D122可经配置以每次输出一个或多个样本(例如,依据输出总线宽度)。
具有大于数毫秒的量值的规则化时间偏移量可能会在已解码信号中引起可听到的伪像。通常,如窄带编码器A124所执行的规则化时间偏移量的量值将不超过数毫秒,因而由规则化数据信号SD10所指示的时间偏移量将受到限制。然而,在这种情形中可能期望配置延迟线D122以在正方向及/或负方向上对时间偏移量施加最大限值(例如,以遵守比窄带编码器所施加限值更为严格的限值)。
图26b显示包含偏移窗口SW的延迟线D11的实施方案D124的示意图。在这一实例中,偏移位置OL的位置受到偏移窗口SW的限制。尽管图26b显示其中缓冲器长度m大于偏移窗口SW宽度的情形,然而延迟线D124还可以经实施以使偏移窗口SW的宽度等于m。
在其他实施方案中,延迟线D120经配置以根据所需时间偏移量向缓冲器写入高频带语音信号S30。图27显示包含两个移位寄存器SR2及SR3的延迟线D120的这种实施方案D130的示意图,所述两个寄存器SR2及SR3经配置以接收及存储高频带语音信号S30。延迟线D130经配置以根据如(例如)规则化数据信号SD10所指示的时间偏移量从移位寄存器SR2向移位寄存器SR3写入帧或子帧。移位寄存器SR3被配置为经安排以输出经时间卷曲的高频带信号S30的FIFO缓冲器。
在图27所示的特定实例中,移位寄存器SR2包含帧缓冲器部分FB1及延迟缓冲器部分DB,且移位寄存器SR3包含帧缓冲器部分FB2、前移缓冲器部分AB及滞后缓冲器部分RB。前移缓冲器AB及滞后缓冲器RB的长度可相等,或者一个可大于另一个,以便支持使一个方向上的偏移量大于另一方向上的偏移量。延迟缓冲器DB与滞后缓冲器部分RB可经配置以具有相同的长度。另一选择为,延迟缓冲器DB可能比滞后缓冲器RB短,以补偿为将样本从帧缓冲器FB1转移到移位寄存器SR3(这可包含其他处理操作,例如使样本在存储到移位寄存器SR3之前发生卷曲)所需的时间间隔。
在图27所示实例中,帧缓冲器FB1经配置以具有等于高频带信号S30的一个帧的长度。在另一实例中,帧缓冲器FB1经配置以具有等于高频带信号S30的一个子帧的长度。在这种情形中,延迟线D130可经配置以包含用于对将要移位的帧中所有子帧应用相同(例如,平均值)延迟的逻辑。延迟线D130还可包含用于对来自具有将要覆写到滞后缓冲器RB或前移缓冲器AB中的值的帧缓冲器FB1的值进行平均的逻辑。在又一实例中,移位寄存器SR3可经配置以仅经由帧缓冲器FB1接收高频带信号S30的值,且在这种情形中,延迟线D130可包含用于在写入移位寄存器SR3的各连续帧或子帧之间的间隙中间进行内插的逻辑。在其他实施方案中,延迟线D130可经配置以在将来自帧缓冲器FB1的样本写入移位寄存器SR3之前对所述样本执行卷曲操作(例如根据由规则化数据信号SD10所描述的函数)。
可能期望使延迟线D120应用基于但不相同于由规则化数据信号SD10所指定卷曲的时间卷曲。图28显示包含延迟值映射器D110的宽带语音编码器AD10的实施方案AD12的方块图。延迟值映射器D110经配置以将由规则化数据信号SD10所指示的卷曲映射成所映射延迟值SD10a。延迟线D120经安排以根据由所映射延迟值SD10a所指示的卷曲来产生经时间卷曲的高频带语音信号S30a。
由窄带编码器应用的时间偏移量可能预计会随时间平滑地演进。因此,计算在语音帧期间应用到各子帧的平均窄带时间偏移量、并根据这一平均值使高频带语音信号S30的对应帧进行偏移通常已足够。在一个这种实例中,延迟值映射器D110经配置以为每个帧计算子帧延迟值的平均值,且延迟线D120经配置以向高频带信号S30的对应帧应用所计算平均值。在其他实例中,可计算及应用在更短周期(例如两个子帧,或半个帧)或更长周期(例如两个帧)内的平均值。在其中所述平均值是非整数样本值的情形中,延迟值映射器D110可经配置以在将所述值输出到延迟线D120之前将所述值四舍五入成整数样本数。
窄带编码器A124可经配置以在已编码的窄带激励信号中包含非整数样本数的规则化时间偏移量。在这种情形中,可能期望使延迟值映射器D110经配置以将窄带时间偏移量四舍五入成整数样本数,并使延迟线D120对高频带语音信号S30应用所述经四舍五入的时间偏移量。
在宽带语音编码器AD10的某些实施方案中,窄带语音信号S20与高频带语音信号S30的取样速率可不相同。在这种情形中,延迟值映射器D110可经配置以调整在规则化数据信号SD10中所指示的时间偏移量,以补偿窄带语音信号S20(或窄带激励信号S80)与高频带语音信号S30之间的差别。例如,延迟值映射器D110可经配置以根据取样速率的比率将时间偏移量按比例缩放。在如上文所述的一个特定实例中,以8kHz对窄带语音信号S20进行取样,且以7kHz对高频带语音信号S30进行取样。在这一实例中,延迟值映射器D110经配置以将每个偏移量乘以7/8。延迟值映射器D110的实施方案还可经配置以执行这种按比例缩放操作连同本文所述的整数四舍五入及/或时间偏移平均操作。
在其他实施方案中,延迟线D120经配置以另外修改帧或其他样本序列的时间标量(例如通过压缩其中一部分并扩张另一部分)。例如,窄带编码器A124可经配置以根据例如音调轮廓或轨线等函数来执行规则化。在这种情形中,规则化数据信号SD10可包含函数的对应说明(例如一组参数),且延迟线D120可包含经配置以根据所述函数使高频带语音信号S30的帧或子帧发生卷曲的逻辑。在其他实施方案中,延迟值映射器D110经配置以在延迟线D120将所述函数应用到高频带语音信号S30之前对所述函数进行平均、按比例缩放及/或四舍五入。例如,延迟值映射器D110可经配置以根据所述函数来计算一个或多个延迟值,每个延迟值均指示多个样本,然后由延迟线D120应用所述样本以对高频带语音信号S30的一个或多个对应帧或子帧进行时间卷曲。
图29显示一种根据包含于对应的已编码窄带激励信号中的时间卷曲来对高频带语音信号进行时间卷曲的方法MD100的流程图。任务TD100处理宽带语音信号以获得窄带语音信号及高频带语音信号。例如,任务TD100可经配置以使用具有低通滤波器及高通滤波器的滤波器组(例如滤波器组A110的实施方案)对所述宽带语音信号进行滤波。任务TD200将所述窄带语音信号编码为至少一已编码的窄带激励信号及多个窄带滤波器参数。可将所述已编码的窄带激励信号及/或滤波器参数量化,且所述已编码的窄带语音信号还可包含其他参数,例如语音模式参数。任务TD200还在已编码的窄带激励信号中包含时间卷曲。
任务TD300基于窄带激励信号产生高频带激励信号。在这种情形中,窄带激励信号是基于已编码的窄带激励信号的。根据至少所述高频带激励信号,任务TD400将高频带语音信号编码为至少多个个高频带滤波器参数。例如,任务TD400可经配置以将高频带语音信号编码为多个经量化的LSF。任务TD500对高频带语音信号应用基于与包含于已编码的窄带激励信号中的时间卷曲相关的信息的时间偏移量。
任务TD400可经配置以对高频带语音信号执行频谱分析(例如LPC分析),及/或计算高频带语音信号的增益包络。在这种情形中,任务TD500可经配置以在所述分析及/或增益包络计算之前对高频带语音信号应用所述时间偏移量。
宽带语音编码器A100的其他实施方案经配置以反转由包含于已编码的窄带激励信号中的时间卷曲所引起的高频带激励信号S120的时间卷曲。例如,高频带激励产生器A300可经实施以包含延迟线D120的实施方案,所述实施方案经配置以接收规则化数据信号SD10或所映射的延迟值SD10a,并对窄带激励信号S80及/或对基于所述实施方案的后续信号(例如经谐波扩展的信号S160或高频带激励信号S120)应用对应的反转时间偏移。
其他宽带语音编码器实施方案可经配置以对窄带语音信号S20与高频带语音信号S30相互独立地进行编码,以便将高频带语音信号S30编码为高频带频谱包络与高频带激励信号的表示形式。这种实施方案可经配置以根据与包含于已编码的窄带激励信号中的时间卷曲相关的信息对高频带残余信号执行时间卷曲,或者以其他方式在已编码的高频带激励信号中包含时间卷曲。例如,高频带编码器可包含如本文所述的经配置以对高频带残余信号应用时间卷曲的延迟线D120及/或延迟值映射器D110的实施方案。这一操作的潜在优点包含对高频带残余信号的更有效编码,及合成窄带与高频带语音信号之间的更好匹配。
如上文所述,高频带编码器A202可包含高频带增益因数计算器A230,高频带增益因数计算器A230经配置以根据高频带信号S30与基于窄带信号S20的信号(例如窄带激励信号S80、高频带激励信号S120或合成的高频带信号S130)之间的时变关系计算一系列增益因数。
图33a显示高频带增益因数计算器A230的实施方案A232的方块图。高频带增益因数计算器A232包含包络计算器G10的经安排以计算第一信号的包络的实施方案G10a,及包络计算器G10的经安排以计算第二信号的包络的实施方案G10b。包络计算器G10a与G10b可以是一致的,也可以是包络计算器G10的不同实施方案的示例。在某些情形中,包络计算器G10a和G10b可被实施为经配置以在不同时间处理不同信号的相同结构。
包络计算器G10a和G10b可分别经配置以计算幅值包络(例如,根据绝对值函数)或能量包络(例如,根据求平方函数)。通常,每个包络计算器G10a、G10b经配置以计算参照输入信号进行子取样的包络(例如,针对输入信号的每个帧或子帧具有一个值的包络)。如上文参照(例如)图21-23b所述,包络计算器G10a及/或G10b可经配置以根据开窗函数(其可经安排以使邻近子帧重叠)计算包络。
因数计算器G20经配置以根据两个包络在时间上的时变关系来计算一系列增益因数。在如上述的一个实例中,因数计算器G20将每个增益因数计算为为包络在对应子帧上的比率的平方根。另一选择为,因数计算器G20可经配置以基于包络之间的距离来计算每个增益因数,例如在对应子帧期间各包络之间的差或正负平方差。可能期望配置因数计算器G20以便以分贝或其他对数缩放形式输出增益因数的计算值。
图33b显示包含高频带增益因数计算器A232的一般化安排的方块图,其中包络计算器G10a经安排以基于窄带信号S20计算信号的包络,包络计算器G10b经安排以计算高频带信号S30的包络,及因数计算器G20经配置以输出高频带增益因数S60b(例如,到量化器)。在这一实例中,包络计算器G10a经安排一计算从中间处理P1接收的信号的包络,所述中间处理可包含如本文所述的经配置以执行窄带激励信号S80的计算、高频带激励信号S120的产生、及/或高频带信号S130的合成的结构。为便利起见,下文说明假设包络计算器G10a经安排以计算合成高频带信号S130的包络,尽管本文还明确地涵盖及在此处揭示其中包络计算器G10a经安排以计算窄带激励信号S80或替代计算高频带激励信号S120的包络的实施方案。
信号S30和合成高频带信号S130之间的相似程度可指示已解码的高频带信号S100将与高频带信号S30相似的程度。具体来说,高频带信号S30的时间包络与合成高频带信号S130之间的相似程度可指示预计已编码的高频带信号S100具有高的声音质量且可在感知上类似于高频带信号S30。
可预计窄带激励信号S80与高频带信号S30的包络形状可在时间上相似,且因此在高频增益因数S60b之间将出现相对小的变化。实际上,可出现在包络之间的关系随时间的大变化(例如,包络之间的比率或距离的大变化)、或基于包络而在增益因数中间随时间的大变化,以指示合成高频带信号S130与高频带信号S30极为不同。例如,这种变化可指示高频带激励信号S120在所述时间周期上与实际的高频带残余信号匹配较差。在任一情形中,在包络之间或增益因数中间的关系随时间的大变化可指示已解码的高频带信号S100将听起来不可接受地不同于高频带信号S30。
可能期望检测合成高频带信号S130的时间包络与高频带信号S30的时间包络之间的关系(例如所述包络之间的比率或距离)随时间的明显变化,并相应地降低高频带增益因数S60b对应于所述周期的能级。高频带编码器A202的进一步实施方案经配置以根据在所述包络之间的关系随时间的变化及/或在增益因数中间随时间的变化来衰减高频带增益因数S60b。图34显示高频带编码器A202的实施方案A203的方块图,其中所述实施方案包含经配置以在量化之前自适应地衰减高频带增益因数S60b的增益因数衰减器G30。
图35显示包含高频带增益因数计算器A232及增益因数衰减器G30的实施方案G32的安排的方块图。增益因数衰减器G32经配置以根据在高频带信号S30的包络与合成高频带信号S130的包络之间的关系随时间的变化(例如在包络之间的比率或距离随时间的变化)来衰减高频带增益因数S60-1。增益因数衰减器G32包含经配置以评估所述关系在所需时间间隔内(例如在连续增益因数之间,或在当前帧内)的变化的变化计算器G40。例如,变化计算器G40可经配置以计算在当前帧内各包络之间的连续距离的平方差和。
增益因数衰减器G32包含经配置以根据所计算的变化选择或以其他方式计算衰减因数值的因数计算器G50。增益因数衰减器G32还包含组合器(例如乘法器或加法器),其经配置以将衰减因数应用到高频带增益因数S60-1以获得高频带增益因数S60-2,随后可将高频带增益因数S60-2量化以供存储或传输。对于其中变化计算器G40经配置以分别产生每对包络值的经计算变化的值(例如,如包络之间的当前距离与先前或接续距离之间的平方差),增益控制元件可经配置以向每个增益因数分别应用一衰减因数。对于其中变化计算器G40经配置以针对每组包络值对产生一个经计算变化的值(例如,针对当前帧的包络值对的一个经计算变化),增益控制原价可经配置以向多于一个对应增益因数(例如向对应帧的每个增益因数)应用同一衰减因数。在典型实例中,衰减因数的值可在从0dB的最小量值到6dB的最大量值之间(或者,另一选择为,从因数1到因数0.25)的范围内变化,尽管也可使用任何其他所需范围。应注意,以dB形式表达的衰减因数值可具有正值,以便衰减操作可包含从相应增益因数减去衰减因数值,或具有负值,以便衰减操作可包含将衰减因数值添加到相应的增益因数。
因数计算器G50可经配置以从一组离散的衰减因数值中选择一个。例如,因数计算器G50可经配置以根据所计算变化与一个或多个阈值之间的关系选择对应的衰减因数值。图36a显示这种实例的曲线图,其中根据阈值T1-T3将所计算变化值的域映射到一组离散衰减因数值V0-V3。
另一选择为,因数计算器G50可经配置以将衰减因数值计算为所计算变化的函数。图36b显示从所计算变化映射到衰减因数值的这种实例的曲线图,其中衰减因数值在域L1-L2上是线性的,其中L0是所计算变化的最小值,L3是所计算变化的最大值,且L0<=LI<=L2<=L3。在这一实例中,将小于(另一选择为,不大于)L1的所计算变化值映射到最小衰减因数值V0(例如,0dB),且将大于(另一选择为,不小于)L3的所计算变化值映射到最大衰减因数值V1(例如6dB)。所计算变化值在L1与L2之间的域以线性方式映射到衰减因数值在V0与V1之间的范围。在其他实施方案中,因数计算器G50经配置以在域L1-L2的至少一部分内应用非线性映射(例如,S形、多项式或指数函数)。
可能期望以限制所产生的增益包络的不连贯的方式实施增益因数衰减。在某些实施方案中,因数计算器G50经配置以限制衰减因数值一次(例如从一个帧或子帧到下一个)可以改变的程度。对于如图36a中所示的增量映射来说,例如,因数计算器G50可经配置以使衰减因数值从一个衰减因数值到下一个的改变不超过最大增量数(例如,一个或两个)。对于如图36b所示的非增量映射来说,因数计算器G50可经配置以使衰减因数值从一个衰减因数值到下一个的变化不超过最大量(例如,3dB)。在另一实例中,因数计算器G50可经配置以允许比衰减因数值的减少更快速的增加。这种特征可允许高频带增益因数的快速衰减以遮掩包络不匹配及较慢恢复,从而减少不连贯。
高频带信号S30的包络与合成高频带信号S130之间的关系随时间的变化程度还可以由高频带增益因数S60b的值中间的波动来指示。在增益因数中随时间的变化缺乏可指示信号具有类似包络,其中随时间具有类似的能级波动。在增益因数中随时间的大变化可指示所述两个信号的包络之间的明显区别,且相应地,对应的已解码高频带信号S100的较差预计质量。高频带编码器A202的进一步实施方案经配置以根据在增益因数中的波动程度来衰减高频带增益因数S60b。
图37显示包含高频带增益因数计算器A232和增益因数衰减器G30的实施方案G34的安排的方块图。增益因数衰减器G34经配置以根据高频带增益因数中随时间的变化来衰减高频带增益因数S60-1。增益因数衰减器G34包含经配置以评估在当前子帧或帧内在增益因数中的波动的变化计算器G60。例如,变化计算器G60可经配置以计算在当前帧内在连续高频带增益因数60b-1之间的平方差和。
在如图23a及23b所示的一个特定实例中,计算每帧5个子帧的每个子帧的高频带增益因数S60b。在这一情形中,变化计算器G60可经配置以将增益因数中的变化计算为所述帧的连续增益因数之间的四个差的平方和。另一选择为,所述和还可以包含帧的第一增益因数与前一帧的最后一个增益因数之间的差平方,及/或所述帧的最后一个增益因数与下一帧的第一增益因数之间的差平方。在另一实施方案(例如,其中增益因数未按对数方式进行按比例缩放的实施方案)中,变化G60可经配置以基于连续增益因数的比例而非差来计算变化。
增益因数衰减器G34包含如上文所述经配置以根据所计算的变化选择或另外计算衰减因数的因数计算器G50的示例。在一个实例中,因数计算器G50经配置以根据例如下述表达式来计算衰减因数值fa:
fa=0.8+0.5v,
其中v是由变化计算器G60产生的经计算变化。在这一实例中,可能期望按比例缩放或另外限制v的值以使其不大于0.4,以便使fa的值将不超出整体。还可能期望以对数方式将fa的值按比例缩放(例如,以获得以dB为单位表达的值)。
增益因数衰减器G34还包含经配置以将衰减因数应用到高频带增益因数S60-1以获得高频带增益因数S60-2的组合器(例如乘法器或加法器),高频带增益因数S60-2随后可经量化以供存储或传输。对于其中变化计算器G60经配置以针对每个增益因数产生相应的经计算变化值(例如,基于增益因数与先前或接续增益因数之间的平方差),增益控制元件可经配置以对每个增益因数应用相应的衰减因数。对于其中变化计算器G60经配置以针对每一组增益因数产生所计算变化的一个值的情形(例如,当前帧的一个所计算变化),增益控制元件可经配置以对多于一个对应增益因数(例如对对应帧的每个增益因数)应用同一衰减因数。在典型实例中,衰减因数的值可在从0dB的最小量值到6dB的最大量值(或者,另一选择为,从因数1到因数0.25,或从因数1到因数0)的范围内,尽管也可使用任一其他所期望的范围。应注意,以dB为单位表达的衰减因数值可具有正值,以便衰减操作可包含从相应的增益因数减去衰减因数值,或复制,以便衰减操作可包含将衰减因数值添加到相应的增益因数。
还应注意,尽管上述说明假设包络计算器G10a经配置以计算合成高频带信号G130的包络,但本文还明确涵盖及揭示其中包络计算器G10a经配置以计算窄带激励信号S80或替代计算高频带激励信号S120的安排。
在其他实施方案中,高频带增益因数S60b的衰减(例如在解量化之后)是根据如解码器处所计算的增益因数中的变化由高频带解码器B200的实施方案执行的。例如,图38显示包含如上述增益因数衰减器G34的示例的高频带解码器B202的实施方案B204的方块图。在进一步的实施方案中,可对窄带激励信号S80或高频带激励信号S120替代应用经解量化及衰减的增益因数。
图39显示一种根据实施例的信号处理方法GM10的流程图。任务GT10计算在(A)基于语音信号的低频部分的包络和(B)基于所述语音信号的高频部分的包络之间的关系随时间的变化。任务GT20根据所述保罗线之间的时变关系计算多个增益因数。任务GT30根据所计算的变化衰减至少一个所述增益因数。在一个实例中,所计算的变化是所述多个增益因数的连续增益因数之间的平方差和。
如上文论述,增益因数中的相对大变化可指示窄带与高频带残余信号之间的不匹配。然而,变化可能还因为其他原因而出现在增益因数中。例如,增益因数值的计算可逐子帧地执行,而非逐样本地执行。即使在其中使用重叠开窗函数的情形中,增益包络的取样速率降低可导致邻近子帧之间的能级产生可感知的明显波动。评估增益因数的其他误差还可能影响已解码高频带信号S100的额外能级波动。尽管这种增益因数变化的量值可能比触发如上述的增益因数衰减的变化小,但其可能在已解码信号中引起令人反感的噪音及失真的质量。
可能期望对高频带增益因数S60b执行平滑。图40显示高频带编码器A202的实施方案A205的方块图,高频带编码器A202包含经安排以在量化之前对高频带增益因数S60b执行平滑的增益因数平滑器G80。通过减少增益因数之间随时间的波动,增益因数平滑操作可有益于提高已解码信号的察觉质量及/或增益因数的更有效量化。
图41显示包含一延迟元件F20、两个添加器及一乘法器的增益因数平滑器G80的实施方案G82的方块图。增益因数平滑器G82经配置以根据例如下述的最小延迟表达式来对高频带增益因数进行滤波:
y(n)=βy(n-1)+(1-β)x(n),(4)
其中x指示输入值,y指示输出值,n指示时间索引,及β指示平滑因数F10。如果平滑因数β的值是0,则不发生任何平滑。如果平滑因数β的值是最大值,则发生最大程度的平滑。增益因数平滑器G82可经配置以使用0与1之间的平滑因数F10的任一期望值,尽管替代地使用0与0.5之间的值以使经最大平滑的值包含来自当前平滑值与先前平滑值的等价受益可能更好。
应注意,表达式(4)可等价地表达及实施为
y(n)=(1-λ)y(n-1)+λx(n),(4b)
其中如果平滑因数λ的值是1,则不发生任何平滑,而如果平滑因数λ的值是最小值,则发生最大程度的平滑。本文还涵盖及揭示本原理适用于如本文所述的增益因数平滑器G82的其他实施方案,以及增益因数平滑器G80的其他HR及/或FIR实施方案。
增益因数平滑器G82可经配置以应用具有固定值的平滑因数F10。另一选择为,可能期望执行增益因数的自适应平滑而非固定式平滑。例如,可能期望保留各增益因数中的较大变化,这可以指示增益包络的可感知显著特征。这种变化的平滑本身可导致已编码信号中的伪像,例如增益包络的拖尾。
在进一步的实施方案中,增益因数平滑器G80经配置以执行平滑操作,所述平滑操作根据各增益因数中的所计算变化的量值而是自适应的。例如,增益因数平滑器G80的这种实施方案可经配置以在当前与先前评估的增益因数之间的距离相对大时执行较小程度的平滑(例如,使用较低的平滑因数值)。
图42显示增益因数平滑器G82的实施方案G84的方块图,其中所述实施方案包含延迟元件F30及经配置以根据所述增益因数中的变化量值来计算平滑因数F10的可变实施方案F12的因数计算器F40。在这一实例中,因数计算器F40经配置以根据当前及先前增益因数之间的差的量值来选择或另外计算平滑因数F12。在增益因数平滑器G82的其他实施方案中,因数计算器F40可经配置以根据当前与先前增益因数之间的不同距离或比率来选择或另外计算平滑因数F12。
因数计算器F40可经配置以从一组离散的平滑因数值中选择一个。例如,因数计算器F40可经配置以根据所计算变化的量值与一个或多个阈值之间的关系来选择对应的平滑因数值。图43a显示这种实例的曲线图,其中根据阈值T1-T3将所计算变化值的域映射到一组离散的衰减因数值V0-V3。
另一选择为,因数计算器F40可经配置以将平滑因数值计算为所计算变化的量值的函数。图43b显示从所计算变化映射到平滑因数值的这种实例的曲线图,其中所述映射在域L1-L2内是线性的,且其中L0是所计算变化的量值的最小值,L3是所计算变化的量值的最大值,且L0<=LI<=L2<=L3。在这一实例中,将小于(另一选择为,不大于)L1的所计算变化量值映射到最小的平滑因数值V0(例如,0dB),且将大于(另一选择为,不小于)L3的所计算变化量值映射到最大的平滑因数值V1(例如,6dB)。所计算变化量值的域以线性方式映射到平滑因数值在V0与V1之间的范围。在其他实施方案中,因数计算器F40经配置以在域L1-L2的至少一部分内应用非线性映射(例如,S形、对数或指数函数)。在一个实例中,平滑因数的值介于最小值0到最大值0.5的范围,尽管也可使用介于0与0.5之间或0与1之间的任一其他期望范围。
在一个实例中,因数计算器F40经配置以根据例如下列的表达式来计算平滑因数F12的值vs:
其中da的值基于当前与先前增益因数值之间的差的量值。例如,da的值可被计算为当前及先前增益因数值的绝对值或平方。
在进一步的实施方案中,如上文所述根据增益因数值在将其输入衰减器G30之前计算da的值,且在从衰减器G30输出之后将所产生的平滑因数应用到增益因数值。在这一情形中,例如,可使用基于vs的值的平均值或和的值作为对增益因数衰减器G34中的因数计算器G50的输入,且可省略变化计算器G60。在进一步的安排中,将da的值计算为在输入增益因数衰减器G34之前帧的相邻增益因数值之间的差的平均值或绝对值的和或平方(可能包含前述及/或接续的增益因数值),以便每一帧一次地更新vs的值并还提供为对因数计算器G50的输入。应注意,在至少后者的实例中,对因数计算器G50的输入值被限制为不大于0.4。
增益因数平滑器G80的其他实施方案可经配置以执行基于额外的先前经平滑增益因数值的平滑操作。这种实施方案可具有多于一个平滑因数(例如,滤波器系数),所述平滑因数可一起及/或单独地以自适应方式变化。增益因数平滑器G80甚至可经实施以执行还基于将来的增益因数值的平滑操作,尽管这些实施方案可引入额外延迟。
对于包含增益因数衰减及增益因数平滑操作二者的实施方案来说,可能期望首先执行衰减,以便平滑操作不会干扰衰减准则的确定。图44显示高频带编码器A202的这种实施方案A206的方块图,其包含根据本文所述任一实施方案的增益因数衰减器G30与增益因数平滑器G80的示例。
如本文所述的自适应性平滑操作还可应用于其他级的增益因数计算。例如,高频带编码器A200的进一步实施方案包含一个或多个包络的自适应性平滑,及/或每个子帧或每个帧地计算的衰减因数的自适应性平滑。
增益平滑还可以在其他安排方面具有优势。例如,图45显示高频带编码器A200的实施方案A207的方块图,其包含经配置以基于合成高频带信号S130而非高频带信号S30与基于窄带激励信号S80的信号之间的关系来计算增益因数的高频带增益因数计算器A235。图46显示高频带增益因数计算器A235的方块图,其包含如本文所述包络计算器G10及因数计算器G20的示例。高频带编码器A207还包含增益因数平滑器G80的示例,其经配置以根据如本文所述的任一实施方案对增益因数执行平滑操作。
图47显示一种根据实施例的信号处理方法FM10的流程图。任务FT10计算在多个增益因数中随时间的变化。任务FT20基于所计算变化来计算平滑因数。任务FT30根据所述平滑因数来平滑至少一个增益因数在一个实例中,所计算的变化是所述多个增益因数的邻近者之间的差。
增益因数的量化会引入一般在帧与帧之间无相关性的随机误差。这一误差可引起量化增益因数不如未经量化的增益因数平滑,且可降低经解码信号的感知质量。增益因数(或增益因数向量)的独立量化与未经量化的增益因数(或增益因数向量)相比一般会逐帧增加频谱波动量,且这些增益波动可引起经解码信号听起来不自然。
量化器通常经配置以将输入值映射到一组离散输出值的一者。可获得受限数量的输出值,以便将一定范围的输入值映射到单个输出值。量化会提高编码效率,因为可在比原始输入值更少的位中传输指示对应输出值的索引。图48显示通常由标量量化器执行的一维映射的实例。
所述量化器也可等效地是向量量化器,且通常使用向量量化器对增益因数进行量化。图49显示由向量量化器执行的多维映射的一个简单实例。在这一实例中,输入空间被划分为多个Voronoi区域(例如根据最近相邻准则)。量化过程将每个输入值映射到表示对应Voronoi区域(通常是质心)的在本文中显示为点的值。在这一实例中,将输入空间划分为6个区域,以便任一输入值可由具有仅6个不同状态的索引来表示。
根据量化的输出空间中各值之间的最小步长,如果输入信号非常平滑,则有时能发生经量化的输出极不平滑的情况。图50a显示仅在一个量化能级(本文仅显示一个这种能级)内变化的平滑一维信号的一个实例,且图50b显示这种信号在量化之后的实例。即使图50a中的输入仅在小范围内变化,但图50b中所产生的输出包含更突然的过渡且不平滑得多。这种影响可导致可听到的伪像,且可能期望减少增益因数的这种影响。例如,可通过并入时间噪音成形来改进增益因数量化性能。
在根据一个实施例的方法中,针对编码器中语音的每个帧(或其他块)来计算一系列增益因数,且将所述系列进行向量量化以有效传输到解码器。在量化之后,存储量化误差(定义为经量化的与未经量化的参数向量之间的差)。在将帧N的参数向量量化之前,将帧N-1的量化误差降低一加权因数并加到帧N的参数向量。可能期望在当前所评估的增益包络与先前所评估的增益包络之间的差相对大时,使加权因数的值更小。
在根据一个实施例的方法中,计算每个帧的增益因数量化误差向量,并将其乘以加权因数b(其值小于1.0)。在量化之前,将前一帧的经比例缩放的量化误差添加到增益因数向量(输入值V10)。这种方法的量化操作可由例如下述的表达式描述:
y(n)=Q(s(n)+b[y(n-1)-s(n-1)]),
其中s(n)是帧n的经平滑增益因数向量,y(n)是帧n的经量化增益因数向量,Q(·)是最近相邻量化操作,且b是加权因数。
量化器430的实施方案435经配置以产生输入值V10(例如增益因数向量)的平滑值V20的量化输出值V30,其中平滑值V20是基于加权因数bV40及先前输出值V30a的量化误差。这种量化器可用于减少增益波动而无额外延迟。图51显示包含量化器435的高频带编码器A202的实施方案A208的方块图。应注意,这种编码器还可以在不包含增益因数衰减器G30和增益因数平滑器G80的一者或二者的情况下来实施。还应注意,量化器435的实施方案可用于高频带编码器A204(图38)或高频带编码器A207(图47)中的量化器430,其可借助或不借助增益因数衰减器G30和增益因数平滑器G80的一者或二者来实施。
图52显示量化器430的一个实施方案435a的方块图,其中可由索引a指示这一实施方案特定的值。在这一实例中,通过在由逆量化器Q20进行解量化时从当前输出值V30a减去平滑值V20a的当前值来计算量化误差。将误差存储到延迟元件DE10。平滑值V20a本身是当前输入值V10和前一帧在由比例因数加权(例如,相乘)时的量化误差的和。量化器435a还可以经实施以便在替代地将量化误差存储到延迟元件DE10之前应用加权因数V40。
图50c显示由量化器435a响应于图50a的输入信号而产生的输出值V30a的(经解量化)序列的实例。在这一实例中,b的值固定为0.5。可看出,图50c的信号比图50a的波动信号更平滑。
可能期望使用递归函数来计算反馈量。例如,量化误差可参照当前输入值而非产找当前平滑值来计算。这一方法可由例如下述的表达式来描述:
y(n)=Q[s(n)],s(n)=x(n)+b[y(n-1)-s(n-1)],
其中x(n)是帧n的输入增益因数向量。
图53显示量化器430的实施方案435b的方块图,其中由索引b指示这一实施方案特定的值。在这一实例中,通过在由逆量化器Q20进行解量化时从当前的输出值V30b减去当前输入值V10来计算量化误差。将误差存储到延迟元件DE10。平滑值V20b是当前输入值和前一帧在由比例因数V40加权(例如,相乘)时的量化误差的和。量化器230b还可经实施以在替代地将量化误差存储到延迟元件DE10之前应用加权因数V40。还可能在与实施方案435b相反的实施方案435a中使用加权因数V40的不同值。
图50d显示由量化器435b响应于图50a的输入信号产生的输出值V30b的(解量化)序列的实例。在这一实例中,加权因数b的值被固定为0.5。可看出,图50d的信号比图50a的波动信号更平滑。
应注意,本文所示实施例可通过根据如图52或53所示的安排来取代或增大现有量化器Q10而实施。例如,量化器Q10可被实施为预测性向量量化器、多级量化器、分裂向量量化器、或根据任一其他针对增益因数量化的方案。
在一个实例中,加权因数b的值被固定为0与1之间的期望值。另一选择为,可能期望配置量化器435以动态调整加权因数b的值。例如,可能期望配置量化器435以依据已出现于未经量化的增益因数或增益因数向量中的波动程度来调整加权因数b的值。在当前与先前增益因数或增益因数向量之间的差较大时,加权因数b的值接近于0且几乎不产生噪音成形。在当前增益因数或向量与先前增益因数或向量差别极小时,加权因数b的值接近于1.0。以此方式,可保留增益包络中随时间的过渡(例如,增益因数衰减器G30的实施所施加的衰减),从而将增益包络发生变化时的拖尾最小化,同时可在增益包络从一个帧或子帧到下一个帧或子帧相对恒定时减少波动。
如图54中显示,量化器435a和量化器435b的进一步实施方案包含如上文所述的延迟元件F30和因数计算器F40的示例,其经安排以计算比例因数V40的可变实施方案V42。例如,因数计算器F40的这种示例可经配置以基于邻近输入值V10之间的差的量值并根据如图45a或45b所示的映射来计算比例因数V42。
可使得加权因数b的值与连续增益因数或增益因数向量之间的距离成比例,且可使用各种距离的任一者。通常使用Euclidean范数,但其他也可使用的量包含Manhattan距离(1-范数)、Chebyshev距离(无穷大范数)、Mahalanobis距离、及Hamming距离。
从图50a-d可了解,如本文所述的时间噪音成形方法可逐帧增加量化误差。然而,尽管量化操作的绝对平方误差可增加,但潜在的优势是量化误差可被移到频谱的不同部分。例如,量化误差可被移到较低频率处,因而变得更平滑。由于输入信号也很平滑,则可获得更平滑的输出信号作为输入信号与经平滑的量化误差的和。
图55a显示根据实施例的信号处理方法QM10的流程图。任务QT10计算第一及第二增益因数向量,其可对应于语音信号的邻近帧。任务QT20通过将基于第一向量的至少一部分的第三向量量化来产生第一量化向量。任务QT30计算第一量化向量的量化误差。例如,任务QT30可经配置以计算第一量化向量与第三向量之间的差。任务QT40基于所述量化误差来计算第四向量。例如,任务QT40可经配置以将第四向量计算为量化误差的经比例缩放版本与第二向量的至少一部分的和。任务QT50将第四向量量化。
图55b显示一种根据实施例的信号处理方法QM20的流程图。任务QT10计算第一及第二增益因数,其可对应于语音信号的邻近帧或子帧。任务QT20通过基于所述第一增益向量将第三值量化来产生第一量化增益因数。任务QT30计算第一量化增益因数的量化误差。例如,任务QT30可经配置以计算第一量化增益因数与第三值之间的差。任务QT40基于所述量化误差来计算经滤波的增益因数。例如,任务QT40可经配置以将经滤波的增益因数计算为量化误差的经比例缩放版本与第二增益因数的和。任务QT50对经滤波的增益因数进行量化。
如上文所述,本文所述实施例包含可用于执行嵌入式编码、支持与窄带系统的兼容性且避免对转码的需要的实施方案。对高频带编码的支持还可用于基于成本来区分支持宽带且具有后向兼容性的芯片、芯片组、装置、及/或网络与仅支持窄带的芯片、芯片组、装置、及/或网络。如本文所述对高频带编码的支持还可结合用于支持低频段编码的技术来使用,且根据这种实施例的系统、方法或设备可支持对从(例如)约50或100Hz直到约7或8kHz的频率分量进行编码。
如上文所述,对语音编码器添加高频带支持可改进可懂度,尤其是关于摩擦音的区分。尽管通常可由收听者根据特定上下文来导出这种区分,然而高频带支持可在语音识别及其他机器解译应用(例如用于自动话音菜单导航及/或自动呼叫处理的系统)中充当启用特征。
一种根据实施例的设备可嵌入到便携式无线通信装置中,例如蜂窝式电话或个人数字助理(PDA)。另一选择为,这种设备可包含于另一通信装置中,例如VoIP手机、经配置以支持VoIP通信的个人计算机、或经配置以投送电话或VoIP通信的网络装置。例如,一种根据实施例的设备可实施于通信装置的芯片或芯片组中。依据特定应用,这种装置还可包含例如以下特征:语音信号的模拟-数字及/或数字-模拟转换、用于对语音信号执行放大及/或其他信号处理操作的电路、及/或用于发射及/或接收已编码的语音信号的射频电路。
本文中明确涵盖及揭示:实施例可包含及/或与本申请案要求其权利的第60/673,965号美国临时专利申请案及/或第11/XXX,XXX号美国专利申请案(代理档案号050551)中揭示的任何一个或多个其他特征一起使用。本发明还明确地涵盖及揭示:各实施例可包含及/或与第60/667,901号美国临时专利申请案及/或上文识别的任一相关专利申请案中所揭示的其他特征中的任一种或多种一起使用。这些特征包含移除出现于高频带中且基本上不存在于窄带中的短持续时间的高能量突发。这些特征包含对例如低频段及/或高频带LSF等系数表示形式的固定式或自适应平滑(例如,通过使用如图43或44中所示及本文所述结构以在时间上对一系列LSF向量的一个或多个(可能所有)元件的每一者进行平滑)。这种特征包括对与例如LSF等系数表示形式的量化相关联的噪音的固定或自适应性成形。
提供对所述实施例的上述说明意欲使所属技术领域的技术人员均能够制作或利用本发明。所述实施例还可能具有各种修改形式,且本文所提供的一般原理还可应用于其他实施例。例如,可将实施例部分地或整个地实施为硬接线电路、制造成应用专用集成电路的电路配置、或载入到非挥发性存储装置中的固件程序或作为机器可读代码从数据存储媒体载入或载入到所述数据存储媒体内的软件程序,所述码是可由例如微处理器或其他数字信号处理单元等逻辑元件阵列执行的指令。所述数据存储媒体可以是存储元件阵列,例如半导体存储器(其可包含但不限于动态或静态RAM(随机存取存储器)、ROM(只读存储器)、及/或快闪RAM)、或铁电性存储器、磁阻性存储器、双向性存储器、聚合物存储器、或相变存储器;或例如磁盘或光盘等盘式媒体。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的任何一个或多个指令集合或序列、及这些实例的任一组合。
高频带激励产生器A300及B300、高频带编码器A100、高频带解码器B200、宽带语音编码器A100、及宽带语音解码器B100的实施方案的各个元件可被实施为例如常驻于同一芯片上或芯片组中两个或更多个芯片上的电子器件装置及/或光学装置,尽管本发明还涵盖其他结构而不限于此。这种设备的一个或多个元件可整个地或部分地实施为一个或多个指令组,所述一个或多个指令组经安排以在一个或多个例如下列的固定式或可编程逻辑元件(例如晶体管、门)阵列上执行:微处理器,嵌入式处理器,IP核心,数字信号处理器,FPGA(场可编程门阵列),ASSP(应用专用标准产品),及ASIC(应用专用集成电路)。还可能使一个或多个这种元件具有共用结构(例如用于在不同时间执行对应于不同元件的代码部分的处理器,在不同时间执行时执行对应于不同元件的任务的指令组,或者在不同时间执行不同元件的操作的电子装置及/或光学装置安排)。此外,可能使一个或多个这种元件用于执行不与所述设备的操作直接相关的任务或其他指令组,例如与所述设备嵌入其中的装置或系统的另一操作相关的任务。
图30显示一种根据实施例用于对具有窄带部分及高频带部分的语音信号的高频带部分进行编码的方法M100的流程图。任务X100计算一组表征所述高频带部分的频谱包络的滤波器参数。任务X200通过向从窄带部分导出的信号应用非线性函数来计算经频谱扩展的信号。任务X300根据(A)所述滤波器参数组及(B)基于所述经频谱扩展信号的高频带激励信号而产生合成高频带信号。任务X400基于(C)高频带部分的能量与(D)从窄带部分导出的信号的能量之间的关系来计算增益包络。
图31a显示一种根据实施例产生高频带激励信号的方法M200的流程图。任务Y100通过向从语音信号的窄带部分导出的窄带激励信号应用非线性函数来计算经谐波扩展的信号。任务Y200将所述经谐波扩展的信号与经调制噪音信号相混合来产生高频带激励信号。图31b显示一种根据另一实施例产生高频带激励信号的方法M210的流程图,所述方法M210包括任务Y300及Y400。任务Y300根据所述窄带激励信号与所述经谐波扩展的信号中的一者随时间的能量来计算时域包络。任务Y400根据所述时域包络来调制噪音信号以产生经调制噪音信号。
图32显示一种根据实施例对具有窄带部分及高频带部分的语音信号的高频带部分进行解码的方法M300的流程图。任务Z100接收一组表征高频带部分的频谱包络的滤波器参数及一组表征高频带部分的时间包络的增益因数。任务Z200通过向从窄带部分导出的信号应用非线性函数来计算经频谱扩展的信号。任务Z300根据(A)所述滤波器参数组及(B)基于所述经频谱扩展信号的高频带激励信号来产生合成高频带信号。任务Z400基于所述增益因数组来调制所述合成高频带信号的增益包络。例如,任务Z400可经配置以通过向从窄带部分导出的激励信号、向所述经频谱扩展的信号、向所述高频带激励信号、或者向所述合成高频带信号应用所述增益因数组来调制所述合成高频带信号的增益包络。
各实施例还包含如本文所明确揭示的其他语音编码及解码方法,例如通过描述经配置以执行这种方法的结构实施例而明确揭示的方法。这些方法中的每一种方法还可以有形方式实施(例如,在上文所列的一个或多个数据存储媒体中)为一个或多个可由包含逻辑元件阵列(例如处理器、微处理器、微控制器或其他有限状态机)的机器读取及/或执行的指令组。因此,本发明并非要仅限于上文所示的实施例,而是要被赋予与在本文中、包含于构成原始揭示内容的一部分的所提交的随附权利要求书中以任一方式所揭示的原理及新颖特征相一致的最宽广范围。
Claims (38)
1.一种信号处理方法,所述方法包括:
计算基于语音信号的低频部分的第一信号的包络;
计算基于所述语音信号的高频部分的第二信号的包络;
根据所述第一信号与第二信号的所述包络之间的时变关系来计算第一多个增益因数值;
基于所述第一多个增益因数值,计算多个经平滑的增益因数值。
2.如权利要求1所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于所述第一多个增益因数值的至少一者及至少一个经平滑的增益因数值。
3.如权利要求1所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值的加权和。
4.如权利要求1所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于(A)所述第一多个增益因数的由第一权数加权的与第一时间间隔相关联的增益因数与(B)由第二权数加权的与比所述第一时间间隔更早开始的时间间隔相关联的经平滑增益因数值的和。
5.如权利要求4所述的信号处理方法,其中所述第一与第二权数中的至少一者是基于所述第一多个增益因数值中与连续时间间隔相关联的增益因数值之间的距离。
6.如权利要求4所述的信号处理方法,其中所述第一与第二权数中的至少一者是基于(C)所述第一多个增益因数值的所述增益因数值与(D)所述第一多个增益因数值中与比所述第一时间间隔更早开始的时间间隔相关联的增益因数值之间的差的量值。
7.如权利要求4所述的信号处理方法,其中所述第一权数与第二权数的和等于1。
8.如权利要求1所述的信号处理方法,其中所述计算基于语音信号的低频部分的第一信号的包络包括计算基于从所述低频部分导出的激励信号的信号的包络。
9.如权利要求8所述的信号处理方法,其中所述计算基于语音信号的低频部分的第一信号的包络包括计算基于所述激励信号的频谱扩展的信号的包络。
10.如权利要求8所述的信号处理方法,所述方法包括根据所述高频部分计算多个滤波器参数,
其中所述计算基于语音信号的低频部分的第一信号的包络包括计算基于所述激励信号及基于所述多个滤波器参数的信号的包络。
11.如权利要求1所述的信号处理方法,其中所述根据时变关系计算第一多个增益因数值包括根据所述第一与第二包络之间的比率来计算所述多个增益因数值。
12.如权利要求1所述的信号处理方法,所述方法包括基于所述第一信号与第二信号的所述包络之间的关系随时间的变化来衰减所述第一多个增益因数值的至少一者,
其中所述多个经平滑的增益因数值的至少一者基于所述第一多个增益因数值的所述至少一个经衰减的增益因数值。
13.一种设备,其包括:
第一包络计算器,其经配置以计算基于语音信号的低频部分的第一信号的包络;
第二包络计算器,其经配置以计算基于所述语音信号的高频部分的第二信号的包络;
因数计算器,其经配置以根据所述第一信号与第二信号的所述包络之间的时变关系来计算第一多个增益因数值;及
平滑器,其经配置以基于所述第一多个增益因数值来计算多个经平滑的增益因数值。
14.如权利要求13所述的设备,其中所述平滑器经配置以基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值来计算所述多个经平滑的增益因数值的每一者。
15.如权利要求13所述的设备,其中所述平滑器经配置以基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值的加权和来计算所述多个经平滑的增益因数值的每一者。
16.如权利要求13所述的设备,其中所述平滑器经配置以基于(A)所述第一多个增益因数中由第一权数加权的与第一时间间隔相关联的增益因数与(B)由第二权数加权的与比所述第一时间间隔更早开始的时间间隔相关联的经平滑增益因数值的和来计算所述第二多个增益因数值的每一者。
17.如权利要求16所述的设备,其中所述第一权数与第二权数中的至少一者是基于所述第一多个增益因数值中与连续时间间隔相关联的增益因数值之间的距离。
18.如权利要求16所述的设备,其中所述第一权数与第二权数中的至少一者是基于(C)所述第一多个增益因数值的所述增益因数值与(D)所述第一多个增益因数值中与比所述第一时间间隔更早开始的时间间隔相关联的增益因数值之间的差的量值。
19.如权利要求16所述的设备,其中所述第一权数与第二权数的和等于1。
20.如权利要求13所述的设备,其中所述第一包络计算器经配置以计算基于从所述低频部分导出的激励信号的信号的包络。
21.如权利要求20所述的设备,其中所述第一包络计算器经配置以计算基于所述激励信号的频谱扩展的信号的包络。
22.如权利要求20所述的设备,所述设备包括经配置以根据所述高频部分计算多个滤波器参数的分析模块,
其中所述第一包络计算器经配置以计算基于所述激励信号及基于所述多个滤波器参数的信号的包络。
23.如权利要求13所述的设备,其中所述因数计算器经配置以根据所述第一包络与第二包络之间的比率来计算所述第一多个增益因数值。
24.如权利要求13所述的设备,所述设备包括经配置以基于所述第一信号与第二信号的所述包络之间的关系随时间的变化来衰减所述第一多个增益因数值的至少一者的增益因数衰减器,
其中所述平滑器经配置以基于所述第一多个增益因数值的所述至少一个经衰减的增益因数值来计算所述多个经平滑的增益因数值的至少一者。
25.一种信号处理方法,所述方法包括:
基于从语音信号的低频部分导出的激励信号产生高频带激励信号;
根据所述高频带激励信号及从所述语音信号的高频部分导出的多个滤波器参数合成高频带语音信号;
基于所述合成的高频带语音信号的时域包络计算第一多个增益因数值;及
基于所述第一多个增益因数值计算多个经平滑的增益因数值。
26.如权利要求25所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值。
27.如权利要求25所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值的加权和。
28.如权利要求25所述的信号处理方法,其中所述多个经平滑的增益因数值的每一者均基于(A)所述第一多个增益因数中由第一权数加权的与第一时间间隔相关联的增益因数与(B)由第二权数加权的与比所述第一实践间隔更早开始的时间间隔相关联的经平滑增益因数值的和。
29.如权利要求28所述的信号处理方法,其中所述第一权数与第二权数中的至少一者是基于所述第一多个增益因数值中与连续时间间隔相关联的增益因数值之间的距离。
30.如权利要求28所述的信号处理方法,其中所述第一权数与第二权数中的至少一者是基于(C)所述第一多个增益因数值的所述增益因数值与(D)所述第一多个增益因数值中与比所述第一时间间隔更早开始的时间间隔相关联的增益因数值之间的差的量值。
31.如权利要求28所述的信号处理方法,其中所述第一权数与第二权数的和等于1。
32.一种设备,其包括:
高频带激励信号产生器,其经配置以基于从语音信号的低频部分导出的已编码激励信号来产生高频带激励信号;
合成滤波器,其经配置以根据所述高频带激励信号及从所述语音信号的高频部分导出的多个滤波器参数来合成高频带语音信号;
因数计算器,其经配置以基于所述合成的高频带语音信号的时域包络来计算第一多个增益因数值;及
平滑器,其经配置以基于所述第一多个增益因数值来计算多个经平滑的增益因数值。
33.如权利要求32所述的设备,其中所述平滑器经配置以基于所述第一多个增益因数值的至少一者及至少一个经平滑的增益因数值来计算所述多个经平滑的增益因数值的每一者。
34.如权利要求32所述的设备,其中所述平滑器经配置以基于所述第一多个增益因数值的至少一者与至少一个经平滑的增益因数值的加权和来计算所述多个经平滑的增益因数值的每一者。
35.如权利要求32所述的设备,其中所述平滑器经配置以基于(A)所述第一多个增益因数中由第一权数加权的与第一时间间隔相关联的增益因数与(B)由第二权数加权的与比所述第一时间间隔更早开始的时间间隔相关联的经平滑的增益因数值来计算所述第二多个增益因数值的每一者。
36.如权利要求35所述的设备,其中所述第一权数与第二权数中的至少一者基于所述第一多个增益因数值中与连续时间间隔相关联的增益因数值之间的距离。
37.如权利要求35所述的设备,其中所述第一权数与第二权数中的至少一者基于(C)所述第一多个增益因数值的所述增益因数值与(D)所述第一多个增益因数值中与比所述第一时间间隔更早开始的时间间隔相关联的增益因数值之间的差的量值。
38.如权利要求35所述的设备,其中所述第一权数与第二权数的和等于1。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67396505P | 2005-04-22 | 2005-04-22 | |
US60/673,965 | 2005-04-22 | ||
PCT/US2006/014993 WO2006116025A1 (en) | 2005-04-22 | 2006-04-21 | Systems, methods, and apparatus for gain factor smoothing |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101199004A CN101199004A (zh) | 2008-06-11 |
CN101199004B true CN101199004B (zh) | 2011-11-09 |
Family
ID=36741298
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800215134A Active CN101199003B (zh) | 2005-04-22 | 2006-04-21 | 用于增益因数衰减的系统、方法和设备 |
CN2006800216673A Active CN101199004B (zh) | 2005-04-22 | 2006-04-21 | 用于增益因数平滑的系统、方法及设备 |
CN2010105744132A Active CN102110440B (zh) | 2005-04-22 | 2006-04-21 | 用于增益因数衰减的系统、方法和设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800215134A Active CN101199003B (zh) | 2005-04-22 | 2006-04-21 | 用于增益因数衰减的系统、方法和设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105744132A Active CN102110440B (zh) | 2005-04-22 | 2006-04-21 | 用于增益因数衰减的系统、方法和设备 |
Country Status (14)
Country | Link |
---|---|
US (2) | US9043214B2 (zh) |
EP (2) | EP1875464B9 (zh) |
KR (2) | KR100956878B1 (zh) |
CN (3) | CN101199003B (zh) |
DK (1) | DK1875463T3 (zh) |
ES (1) | ES2705589T3 (zh) |
HU (1) | HUE040628T2 (zh) |
NO (1) | NO20075509L (zh) |
PL (1) | PL1875463T3 (zh) |
PT (1) | PT1875463T (zh) |
SI (1) | SI1875463T1 (zh) |
TR (1) | TR201821299T4 (zh) |
TW (2) | TWI317933B (zh) |
WO (2) | WO2006116025A1 (zh) |
Families Citing this family (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006062202A1 (ja) * | 2004-12-10 | 2006-06-15 | Matsushita Electric Industrial Co., Ltd. | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
WO2006116025A1 (en) * | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
US20070050441A1 (en) * | 2005-08-26 | 2007-03-01 | Step Communications Corporation,A Nevada Corporati | Method and apparatus for improving noise discrimination using attenuation factor |
US7619563B2 (en) | 2005-08-26 | 2009-11-17 | Step Communications Corporation | Beam former using phase difference enhancement |
US7472041B2 (en) * | 2005-08-26 | 2008-12-30 | Step Communications Corporation | Method and apparatus for accommodating device and/or signal mismatch in a sensor array |
US7436188B2 (en) * | 2005-08-26 | 2008-10-14 | Step Communications Corporation | System and method for improving time domain processed sensor signals |
US7415372B2 (en) * | 2005-08-26 | 2008-08-19 | Step Communications Corporation | Method and apparatus for improving noise discrimination in multiple sensor pairs |
US20070047742A1 (en) * | 2005-08-26 | 2007-03-01 | Step Communications Corporation, A Nevada Corporation | Method and system for enhancing regional sensitivity noise discrimination |
US20070047743A1 (en) * | 2005-08-26 | 2007-03-01 | Step Communications Corporation, A Nevada Corporation | Method and apparatus for improving noise discrimination using enhanced phase difference value |
RU2474972C2 (ru) * | 2006-01-17 | 2013-02-10 | Конинклейке Филипс Электроникс Н.В. | Обнаружение присутствия телевизионных сигналов, погруженных в шум, с использованием набора инструментальных средств циклостационарности |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
DE602008001787D1 (de) * | 2007-02-12 | 2010-08-26 | Dolby Lab Licensing Corp | Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
WO2009001874A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
CN101896967A (zh) | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 编码器 |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8326641B2 (en) * | 2008-03-20 | 2012-12-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding using bandwidth extension in portable terminal |
KR101228165B1 (ko) * | 2008-06-13 | 2013-01-30 | 노키아 코포레이션 | 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102257567B (zh) | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
US20110096942A1 (en) * | 2009-10-23 | 2011-04-28 | Broadcom Corporation | Noise suppression system and method |
US10115386B2 (en) * | 2009-11-18 | 2018-10-30 | Qualcomm Incorporated | Delay techniques in active noise cancellation circuits or other circuits that perform filtering of decimated coefficients |
EP2502231B1 (en) * | 2009-11-19 | 2014-06-04 | Telefonaktiebolaget L M Ericsson (PUBL) | Bandwidth extension of a low band audio signal |
GB2476043B (en) * | 2009-12-08 | 2016-10-26 | Skype | Decoding speech signals |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
US9525569B2 (en) * | 2010-03-03 | 2016-12-20 | Skype | Enhanced circuit-switched calls |
CN102844810B (zh) * | 2010-04-14 | 2017-05-03 | 沃伊斯亚吉公司 | 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本 |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
JP4923161B1 (ja) * | 2010-09-29 | 2012-04-25 | シャープ株式会社 | 移動通信システム、移動局装置、基地局装置、通信方法および集積回路 |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
US9059786B2 (en) * | 2011-07-07 | 2015-06-16 | Vecima Networks Inc. | Ingress suppression for communication systems |
ITTO20110890A1 (it) * | 2011-10-05 | 2013-04-06 | Inst Rundfunktechnik Gmbh | Interpolationsschaltung zum interpolieren eines ersten und zweiten mikrofonsignals. |
CN103035248B (zh) | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
US9444452B2 (en) | 2012-02-24 | 2016-09-13 | Parade Technologies, Ltd. | Frequency hopping algorithm for capacitance sensing devices |
US10448161B2 (en) | 2012-04-02 | 2019-10-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field |
JP5998603B2 (ja) * | 2012-04-18 | 2016-09-28 | ソニー株式会社 | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
US20140006017A1 (en) * | 2012-06-29 | 2014-01-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
WO2014118156A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program |
EP2951822B1 (en) | 2013-01-29 | 2019-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
WO2014136629A1 (ja) | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9570087B2 (en) | 2013-03-15 | 2017-02-14 | Broadcom Corporation | Single channel suppression of interfering sources |
JP6153661B2 (ja) | 2013-06-21 | 2017-06-28 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 改善されたパルス再同期化を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法 |
BR112015031181A2 (pt) * | 2013-06-21 | 2017-07-25 | Fraunhofer Ges Forschung | aparelho e método que realizam conceitos aperfeiçoados para tcx ltp |
CN104282312B (zh) | 2013-07-01 | 2018-02-23 | 华为技术有限公司 | 信号编码和解码方法以及设备 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
CN105493182B (zh) * | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
CN104517610B (zh) | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN104517611B (zh) | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106409304B (zh) | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | 一种音频信号的时域包络处理方法及装置、编码器 |
CN105336338B (zh) | 2014-06-24 | 2017-04-12 | 华为技术有限公司 | 音频编码方法和装置 |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9583115B2 (en) * | 2014-06-26 | 2017-02-28 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
CN106486129B (zh) * | 2014-06-27 | 2019-10-25 | 华为技术有限公司 | 一种音频编码方法和装置 |
KR101591597B1 (ko) * | 2014-07-02 | 2016-02-19 | 한양대학교 산학협력단 | G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법 |
JP6668372B2 (ja) * | 2015-02-26 | 2020-03-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9613628B2 (en) | 2015-07-01 | 2017-04-04 | Gopro, Inc. | Audio decoder for wind and microphone noise reduction in a microphone array system |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
EP3242295B1 (en) * | 2016-05-06 | 2019-10-23 | Nxp B.V. | A signal processor |
TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
CN106856623B (zh) * | 2017-02-20 | 2020-02-11 | 鲁睿 | 基带语音信号通讯噪声抑制方法及系统 |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US10200727B2 (en) | 2017-03-29 | 2019-02-05 | International Business Machines Corporation | Video encoding and transcoding for multiple simultaneous qualities of service |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
CN115334444A (zh) * | 2018-04-11 | 2022-11-11 | 杜比国际公司 | 用于音频渲染的预渲染信号的方法、设备和系统 |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
BR112023006291A2 (pt) * | 2020-10-09 | 2023-05-09 | Fraunhofer Ges Forschung | Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro |
AU2021357364B2 (en) * | 2020-10-09 | 2024-06-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978759A (en) * | 1995-03-13 | 1999-11-02 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding narrowband speech to wideband speech by codebook correspondence of linear mapping functions |
CN1420634A (zh) * | 2001-11-15 | 2003-05-28 | 松下电器产业株式会社 | 解码器、解码方法及其程序发布介质 |
Family Cites Families (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3158693A (en) * | 1962-08-07 | 1964-11-24 | Bell Telephone Labor Inc | Speech interpolation communication system |
US3855416A (en) | 1972-12-01 | 1974-12-17 | F Fuller | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment |
US3855414A (en) | 1973-04-24 | 1974-12-17 | Anaconda Co | Cable armor clamp |
JPS59139099A (ja) | 1983-01-31 | 1984-08-09 | 株式会社東芝 | 音声区間検出装置 |
US4616659A (en) | 1985-05-06 | 1986-10-14 | At&T Bell Laboratories | Heart rate detection utilizing autoregressive analysis |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4747143A (en) | 1985-07-12 | 1988-05-24 | Westinghouse Electric Corp. | Speech enhancement system having dynamic gain control |
US4862168A (en) | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4805193A (en) | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4852179A (en) | 1987-10-05 | 1989-07-25 | Motorola, Inc. | Variable frame rate, fixed bit rate vocoding method |
JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5285520A (en) | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
JPH0639229B2 (ja) * | 1988-08-29 | 1994-05-25 | 株式会社大井製作所 | パワーシートスライド装置 |
US5077798A (en) | 1988-09-28 | 1991-12-31 | Hitachi, Ltd. | Method and system for voice coding based on vector quantization |
US5086475A (en) | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3191457B2 (ja) | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
RU2131169C1 (ru) | 1993-06-30 | 1999-05-27 | Сони Корпорейшн | Устройство кодирования сигнала, устройство декодирования сигнала, носитель записи и способ кодирования и декодирования |
AU7960994A (en) | 1993-10-08 | 1995-05-04 | Comsat Corporation | Improved low bit rate vocoders and methods of operation therefor |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5487087A (en) | 1994-05-17 | 1996-01-23 | Texas Instruments Incorporated | Signal quantizer with reduced output fluctuation |
US5797118A (en) | 1994-08-09 | 1998-08-18 | Yamaha Corporation | Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns |
JP2770137B2 (ja) | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5699477A (en) | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
FI97182C (fi) | 1994-12-05 | 1996-10-25 | Nokia Telecommunications Oy | Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin |
JP3365113B2 (ja) | 1994-12-22 | 2003-01-08 | ソニー株式会社 | 音声レベル制御装置 |
US5706395A (en) | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
JP3334419B2 (ja) | 1995-04-20 | 2002-10-15 | ソニー株式会社 | ノイズ低減方法及びノイズ低減装置 |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US6097824A (en) | 1997-06-06 | 2000-08-01 | Audiologic, Incorporated | Continuous frequency dynamic range audio compressor |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5737716A (en) | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
TW307960B (en) | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
EP0814458B1 (en) * | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
EP1071081B1 (en) | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
US6009395A (en) * | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
US6041297A (en) | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5890126A (en) | 1997-03-10 | 1999-03-30 | Euphonics, Incorporated | Audio data decompression and interpolation apparatus and method |
US6385235B1 (en) | 1997-04-22 | 2002-05-07 | Silicon Laboratories, Inc. | Direct digital access arrangement circuitry and method for connecting to phone lines |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889185B1 (en) | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US6122384A (en) | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6029125A (en) | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
AU4661497A (en) | 1997-09-30 | 1999-03-22 | Qualcomm Incorporated | Channel gain modification system and method for noise reduction in voice communication |
JPH11205166A (ja) | 1998-01-19 | 1999-07-30 | Mitsubishi Electric Corp | ノイズ検出装置 |
US6301556B1 (en) | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
WO1999065017A1 (en) * | 1998-06-09 | 1999-12-16 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus and speech decoding apparatus |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6385573B1 (en) | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
JP4170458B2 (ja) | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6353808B1 (en) | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
KR20000047944A (ko) | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
JP4354561B2 (ja) | 1999-01-08 | 2009-10-28 | パナソニック株式会社 | オーディオ信号符号化装置及び復号化装置 |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
JP3696091B2 (ja) | 1999-05-14 | 2005-09-14 | 松下電器産業株式会社 | オーディオ信号の帯域を拡張するための方法及び装置 |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6715125B1 (en) | 1999-10-18 | 2004-03-30 | Agere Systems Inc. | Source coding and transmission with time diversity |
DE60019268T2 (de) | 1999-11-16 | 2006-02-02 | Koninklijke Philips Electronics N.V. | Breitbandiges audio-übertragungssystem |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US7260523B2 (en) | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
AU2547201A (en) * | 2000-01-11 | 2001-07-24 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
US6757395B1 (en) | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US6704711B2 (en) | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6732070B1 (en) * | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
JP3681105B2 (ja) | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
DE60118627T2 (de) | 2000-05-22 | 2007-01-11 | Texas Instruments Inc., Dallas | Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen |
US7330814B2 (en) | 2000-05-22 | 2008-02-12 | Texas Instruments Incorporated | Wideband speech coding with modulated noise highband excitation system and method |
JP2002055699A (ja) | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
JP2004507191A (ja) | 2000-08-25 | 2004-03-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | デジタル入力信号のワード長を低減する方法及び装置並びにデジタル入力信号を回復させる方法及び装置 |
US7386444B2 (en) | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
CN1216368C (zh) * | 2000-11-09 | 2005-08-24 | 皇家菲利浦电子有限公司 | 用于扩展语音信号的频率范围的方法和系统 |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
US7230931B2 (en) | 2001-01-19 | 2007-06-12 | Raze Technologies, Inc. | Wireless access system using selectively adaptable beam forming in TDD frames and method of operation |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
CA2429832C (en) | 2000-11-30 | 2011-05-17 | Matsushita Electric Industrial Co., Ltd. | Lpc vector quantization apparatus |
GB0031461D0 (en) | 2000-12-22 | 2001-02-07 | Thales Defence Ltd | Communication sets |
US20040204935A1 (en) * | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
DE50104998D1 (de) | 2001-05-11 | 2005-02-03 | Siemens Ag | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals |
CN1235192C (zh) | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP2003036097A (ja) | 2001-07-25 | 2003-02-07 | Sony Corp | 情報検出装置及び方法、並びに情報検索装置及び方法 |
TW525147B (en) | 2001-09-28 | 2003-03-21 | Inventec Besta Co Ltd | Method of obtaining and decoding basic cycle of voice |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
TW526468B (en) | 2001-10-19 | 2003-04-01 | Chunghwa Telecom Co Ltd | System and method for eliminating background noise of voice signal |
JP4245288B2 (ja) | 2001-11-13 | 2009-03-25 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
AU2002348961A1 (en) | 2001-11-23 | 2003-06-10 | Koninklijke Philips Electronics N.V. | Audio signal bandwidth extension |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP4290917B2 (ja) | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
JP3826813B2 (ja) | 2002-02-18 | 2006-09-27 | ソニー株式会社 | ディジタル信号処理装置及びディジタル信号処理方法 |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
JP3756864B2 (ja) | 2002-09-30 | 2006-03-15 | 株式会社東芝 | 音声合成方法と装置及び音声合成プログラム |
KR100841096B1 (ko) | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7242763B2 (en) * | 2002-11-26 | 2007-07-10 | Lucent Technologies Inc. | Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100480341B1 (ko) * | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
RU2316059C2 (ru) | 2003-05-01 | 2008-01-27 | Нокиа Корпорейшн | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
FI118550B (fi) | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
US7428490B2 (en) | 2003-09-30 | 2008-09-23 | Intel Corporation | Method for spectral subtraction in speech enhancement |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4259401B2 (ja) | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
WO2006116025A1 (en) | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
-
2006
- 2006-04-21 WO PCT/US2006/014993 patent/WO2006116025A1/en active Application Filing
- 2006-04-21 US US11/408,511 patent/US9043214B2/en active Active
- 2006-04-21 KR KR1020077027098A patent/KR100956878B1/ko active IP Right Grant
- 2006-04-21 HU HUE06750901A patent/HUE040628T2/hu unknown
- 2006-04-21 TW TW095114440A patent/TWI317933B/zh active
- 2006-04-21 EP EP06758453.2A patent/EP1875464B9/en active Active
- 2006-04-21 CN CN2006800215134A patent/CN101199003B/zh active Active
- 2006-04-21 DK DK06750901.8T patent/DK1875463T3/en active
- 2006-04-21 EP EP06750901.8A patent/EP1875463B1/en active Active
- 2006-04-21 CN CN2006800216673A patent/CN101199004B/zh active Active
- 2006-04-21 PT PT06750901T patent/PT1875463T/pt unknown
- 2006-04-21 PL PL06750901T patent/PL1875463T3/pl unknown
- 2006-04-21 SI SI200632309T patent/SI1875463T1/sl unknown
- 2006-04-21 CN CN2010105744132A patent/CN102110440B/zh active Active
- 2006-04-21 TR TR2018/21299T patent/TR201821299T4/tr unknown
- 2006-04-21 WO PCT/US2006/014992 patent/WO2006116024A2/en active Application Filing
- 2006-04-21 TW TW095114443A patent/TWI324336B/zh active
- 2006-04-21 US US11/408,390 patent/US8892448B2/en active Active
- 2006-04-21 KR KR1020077027097A patent/KR100947421B1/ko active IP Right Grant
- 2006-04-21 ES ES06750901T patent/ES2705589T3/es active Active
-
2007
- 2007-10-31 NO NO20075509A patent/NO20075509L/no not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978759A (en) * | 1995-03-13 | 1999-11-02 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding narrowband speech to wideband speech by codebook correspondence of linear mapping functions |
CN1420634A (zh) * | 2001-11-15 | 2003-05-28 | 松下电器产业株式会社 | 解码器、解码方法及其程序发布介质 |
Non-Patent Citations (10)
Title |
---|
Audio codec processing functions |
ETSI ES 201 980.《ETSI STANDARDS》.2003,54页第5行-61页第7行. |
ETSI TS 126 290.《ETSI STANDARDS》.2005,第39页倒数1-3段、40-41、60-62页及图9. |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Digital Radio Mondiale (DRM) |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Digital Radio Mondiale (DRM) System Specification;ETSI ES 201 980.《ETSI STANDARDS》.2003,54页第5行-61页第7行. * |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Universal Mobile Telecommunications System (UMTS) |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Universal Mobile Telecommunications System (UMTS) Audio codec processing functions Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec Transcoding functions (3GPP TS 26.290 version 6.2.0 Release 6) ETSI TS 126 290.《ETSI STANDARDS》.2005,第39页倒数1-3段、40-41、60-62页及图9. * |
Extended Adaptive Multi-Rate -Wideband (AMR-WB+) codec |
System Specification |
Transcoding functions (3GPP TS 26.290 version 6.2.0 Release 6) |
Also Published As
Publication number | Publication date |
---|---|
EP1875464B9 (en) | 2020-10-28 |
KR100956878B1 (ko) | 2010-05-11 |
TW200710824A (en) | 2007-03-16 |
PL1875463T3 (pl) | 2019-03-29 |
DK1875463T3 (en) | 2019-01-28 |
CN101199004A (zh) | 2008-06-11 |
WO2006116025A1 (en) | 2006-11-02 |
US20060282262A1 (en) | 2006-12-14 |
KR20080003912A (ko) | 2008-01-08 |
SI1875463T1 (sl) | 2019-02-28 |
KR20080002996A (ko) | 2008-01-04 |
NO20075509L (no) | 2007-12-27 |
TWI324336B (en) | 2010-05-01 |
KR100947421B1 (ko) | 2010-03-12 |
WO2006116024A2 (en) | 2006-11-02 |
PT1875463T (pt) | 2019-01-24 |
EP1875464B1 (en) | 2012-12-05 |
CN101199003B (zh) | 2012-01-11 |
EP1875464A2 (en) | 2008-01-09 |
ES2705589T3 (es) | 2019-03-26 |
US9043214B2 (en) | 2015-05-26 |
CN101199003A (zh) | 2008-06-11 |
TWI317933B (en) | 2009-12-01 |
HUE040628T2 (hu) | 2019-03-28 |
EP1875463A1 (en) | 2008-01-09 |
WO2006116024A3 (en) | 2007-03-22 |
CN102110440B (zh) | 2012-09-26 |
EP1875463B1 (en) | 2018-10-17 |
TW200707410A (en) | 2007-02-16 |
TR201821299T4 (tr) | 2019-01-21 |
US20060277039A1 (en) | 2006-12-07 |
CN102110440A (zh) | 2011-06-29 |
US8892448B2 (en) | 2014-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101199004B (zh) | 用于增益因数平滑的系统、方法及设备 | |
CN101185127B (zh) | 用于编码和解码语音信号的高频带部分的方法和设备 | |
JP5203930B2 (ja) | 高帯域時間軸伸縮を行うシステム、方法、および装置 | |
CN102934163B (zh) | 用于宽带语音编码的系统、方法、设备 | |
CN101496101B (zh) | 用于增益因子限制的系统、方法及设备 | |
CN101496097A (zh) | 用于在与语音信号相关联的包中包含识别符的系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |