CN101010730B - 可扩展解码装置以及信号丢失补偿方法 - Google Patents
可扩展解码装置以及信号丢失补偿方法 Download PDFInfo
- Publication number
- CN101010730B CN101010730B CN2005800294184A CN200580029418A CN101010730B CN 101010730 B CN101010730 B CN 101010730B CN 2005800294184 A CN2005800294184 A CN 2005800294184A CN 200580029418 A CN200580029418 A CN 200580029418A CN 101010730 B CN101010730 B CN 101010730B
- Authority
- CN
- China
- Prior art keywords
- line spectrum
- spectrum pair
- lsp
- frequency band
- weighting coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 19
- 239000010410 layer Substances 0.000 claims abstract description 10
- 239000012792 core layer Substances 0.000 claims abstract description 9
- 238000001228 spectrum Methods 0.000 claims description 71
- 230000009466 transformation Effects 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 8
- 238000006243 chemical reaction Methods 0.000 abstract description 7
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- ORQBXQOJMQIAOY-UHFFFAOYSA-N nobelium Chemical compound [No] ORQBXQOJMQIAOY-UHFFFAOYSA-N 0.000 description 13
- 230000007547 defect Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000011002 quantification Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
能够提高对传输差错的容错性的可扩展解码装置。在该装置中,窄带LSP解码单元(108)对与当前的编码信息的核心层对应的窄带LSP编码信息进行解码。存储单元(126)存储与以前的编码信息的扩展层对应的宽带量化LSP作为存储宽带LSP。在丢失当前的编码信息的宽带LSP编码信息时,由帧丢失补偿单元(124)和切换单元(128)的组合构成的补偿单元,通过将窄带量化LSP的频带变换LSP与存储宽带LSP加权相加而生成补偿宽带LSP,并以补偿宽带LSP来补偿丢失的宽带LSP编码信息的解码信号。
Description
技术领域
本发明涉及可扩展解码装置以及其丢失信号补偿方法,该可扩展解码装置对在带宽(即频率轴方向)具有可扩展性的编码信息进行解码。
背景技术
一般来说,在语音信号的编码中,广泛使用LSP(线谱对)参数作为有效地表现频谱包络信息的参数。另外,LSP也被称为LSF(线谱频率)。
LSP参数(以下简称为“LSP”)的编码,是在高效地编码语音信号的语音编码技术中的必需基础技术之一,在对语音信号分层地进行编码,并分别与核心层和扩展层相对应地生成窄带信号和宽带信号的频带可扩展语音编码中,也是重要的基础技术。
作为对以频带可扩展语音编码而获得的编码LSP进行解码的以往的方法,例如有专利文献1所记载的方法。这里公开的可扩展解码方法为:将核心层的窄带解码LSP乘0.5倍,并与在扩展层解码的分量相加,由此获得宽带解码LSP。
另一方面,上述的编码LSP被传输时,有可能在传输路经上丢失其一部分。在LSP的一部分没有到达解码端时,在解码端需要进行处理以补偿丢失的信息。这样,在信息传输中有可能出错的系统环境下进行语音通信时,在改善语音编码/解码方式的容错能力的意义上,丢失补偿处理的使用可以说是很重要的必须基础技术。例如,专利文献2所记载的丢失补偿处理为:分为低次的3次和高次的7次而被传输的10次LSP中,在高次的7次LSP未到达解码端时,重复使用最后正常解码的高次的7次LSP作为解码值。
[专利文献1]特开平11-30997号公报
[专利文献2]特开平9-172413号公报
发明内容
本发明需要解决的问题
然而,在上述以往的可扩展解码方法中有如下问题,即,因为不对所传输的编码LSP中的所丢失的一部分编码LSP进行补偿处理,所以无法提高对于系统环境而可能出现的传输差错的容错性。
本发明的目的为提供能够提高对传输差错的容错性的可扩展解码装置和信号丢失补偿方法。
解决问题的方案
本发明的可扩展解码装置所采用的结构包括:第一解码单元,对窄带线谱对编码信息进行解码,所述窄带线谱对编码信息是与具有第一频带的核心层相对应而生成的;第二解码单元,对宽带线谱对编码信息进行解码,所述宽带线谱对编码信息是与具有比所述第一频带宽的第二频带的扩展层相对应而生成的;存储单元,在正常接收所述窄带线谱对编码信息和所述宽带线谱对编码信息时,存储解码所得的宽带量化线谱对;变换单元,将解码所得的窄带量化线谱对从所述第一频带变换到所述第二频带,从而生成频带变换线谱对;以及补偿单元,在正常接收所述窄带线谱对编码信息而丢失所述宽带线谱对编码信息时,通过将所述频带变换线谱对和所存储的宽带量化线谱对分别与不同的加权系数相乘并相加而生成丢失补偿信号,并以丢失补偿信号来补偿丢失的宽带线谱对编码信息的解码信号。
本发明的信号丢失补偿方法包括:第一解码步骤,对窄带线谱对编码信息进行解码,所述窄带线谱对编码信息是与具有第一频带的核心层相对应而生成的;第二解码步骤,对宽带线谱对编码信息进行解码,所述宽带线谱对编码信息是与具有比所述第一频带宽的第二频带的扩展层相对应而生成的;存储步骤,在正常接收所述窄带线谱对编码信息和所述宽带线谱对编码信息时,存储解码所得的宽带量化线谱对;变换步骤,将解码所得的窄带量化线谱对从所述第一频带变换到所述第二频带,从而生成频带变换线谱对;以及补偿步骤,在正常接收所述窄带线谱对编码信息而丢失所述宽带线谱对编码信息时,通过将所述频带变换线谱对和所存储的宽带量化线谱对分别与不同的加权系数相乘并相加而生成丢失补偿信号,并以丢失补偿信号来补偿丢失的宽带线谱对编码信息的解码信号。
本发明的效果
根据本发明,能够提高对传输差错的容错性。
附图说明
图1是表示本发明实施方式1的可扩展解码装置的结构的方框图。
图2是表示本发明实施方式1的宽带LSP解码单元的结构的方框图。
图3是表示本发明实施方式1的帧丢失补偿单元的结构的方框图。
图4A是表示本发明实施方式1的量化LSP的图。
图4B是表示本发明实施方式1的频带变换LSP的图。
图4C是表示本发明实施方式1的宽带LSP的图。
图4D是表示本发明实施方式1的补偿宽带LSP的图。
图5是表示本发明实施方式2的可扩展解码装置的结构的方框图。
图6是表示本发明实施方式2的宽带LSP解码单元的结构的方框图。
图7是表示本发明实施方式2的帧丢失补偿单元的结构的方框图。
具体实施方式
以下,使用附图详细地说明本发明的实施方式。
(实施方式1)
图1是表示本发明实施方式1的可扩展解码装置的结构的主要部分的方框图。图1的可扩展解码装置100包括:复用分离单元102、声源解码单元104、106、窄带LSP解码单元108、宽带LSP解码单元110、语音合成单元112、114、上采样单元116以及加法单元118。图2是表示宽带LSP解码单元110的内部结构的方框图,宽带LSP解码单元110包括:变换单元120、解码进行单元122、帧丢失补偿单元124、存储单元126以及切换单元128。存储单元126包括缓存器129。图3是表示帧丢失补偿单元124的内部结构的方框图,帧丢失补偿单元124包括加权单元130、132以及加法单元134。
复用分离单元102接受编码信息。其中,由复用分离单元102接受的编码信息是,通过在未图示的可扩展编码装置对语音信号分层地进行解码而生成的信号。在可扩展编码装置的语音编码中,生成由窄带声源编码信息、宽带声源编码信息、窄带LSP编码信息以及宽带LSP编码信息构成的编码信息。窄带声源编码信息和窄带LSP编码信息是与核心层相对应而生成的信号,宽带声源编码信息以及宽带LSP编码信息是与扩展层相对应而生成的信号。
复用分离单元102将所接受的编码信息分离为各个参数的编码信息。然后分别将分离后的窄带声源编码信息输出到声源解码单元106,将分离后的窄带LSP编码信息输出到窄带LSP解码单元108,将分离后的宽带声源编码信息输出到声源解码单元104,将分离后的宽带LSP编码信息输出到宽带LSP解码单元110。
声源解码单元106对从复用分离单元102输入的窄带声源编码信息进行解码,从而获得窄带量化声源信号。窄带量化声源信号被输出到语音合成单元112。
窄带LSP解码单元108对从复用分离单元102输入的窄带LSP编码信息进行解码,从而获得窄带量化LSP。窄带量化LSP被输出到语音合成单元112和宽带LSP解码单元110。
语音合成单元112将从窄带LSP解码单元108输入的窄带量化LSP变换为线性预测系数,并使用所获得的线性预测系数构筑线性预测合成滤波器。此外,以从声源解码单元106输入的窄带量化声源信号驱动该线性预测合成滤波器,从而合成解码语音信号。该解码语音信号作为窄带解码语音信号而被输出。再者,窄带解码语音信号被输出到上采样单元116以获得宽带解码语音信号。另外,还可直接使用该窄带解码语音信号作为最终输出。在将窄带解码语音信号直接为最终输出时,一般来说,输出之前进行后置滤波处理等后处理以改善主观质量。
上采样单元116进行从语音合成单元112输入的窄带解码语音信号的上采样处理。进行了上采样处理的窄带解码语音信号被输出到加法单元118。
声源解码单元104对从复用分离单元102输入的宽带声源编码信息进行解码,获得宽带量化声源信号。所获得的宽带量化声源信号被输出到语音合成单元114。
宽带LSP解码单元110基于从未图示的帧丢失信息生成单元输入的后述的帧丢失信息,由从窄带LSP解码单元108输入的窄带量化LSP和从复用分离单元102输入的宽带LSP编码信息,获得宽带量化LSP。所获得的宽带量化LSP被输出到语音合成单元114。
这里,参照图2更具体地说明宽带LSP解码单元110的内部结构。
变换单元120将从窄带LSP解码单元108输入的窄带量化LSP乘以可变或固定的变换系数。通过该乘法运算,将窄带量化LSP从窄带的频域变换到宽带的频域,获得频带变换LSP。所获得的频带变换LSP被输出到解码进行单元122和帧丢失补偿单元124。
另外,变换单元120还可采用乘以变换系数的处理以外的处理方法来进行变换处理。例如,可以进行利用映射表的非线性变换,也可以包括将LSP变换为自相关系数,在自相关系数的区域内进行上采样处理。
解码进行单元122将从复用分离单元102输入的宽带LSP编码信息解码成宽带LSP残差向量,然后,将从变换单元120输入的频带变换LSP与宽带LSP残差向量相加。由此解码成宽带量化LSP。所获得的宽带量化LSP被输出到切换单元128。
另外,解码进行单元122的结构不限于上述结构。例如,解码进行单元122在其内部可以具备代码本。此时,解码进行单元122将从复用分离单元 102输入的宽带LSP编码信息解码成索引信息,并使用以该索引信息来确定的LSP向量来获得宽带LSP。另外还可以是如下结构,即,使用以前所解码的宽带量化LSP、以前所输入的宽带LSP编码信息或以前从变换单元120输入的频带变换LSP等,将宽带量化LSP解码的结构。
帧丢失补偿单元124将从变换单元120输入的频带变换LSP与存储于缓存器129的存储宽带LSP加权相加。由此生成补偿宽带LSP。有关加权相加将后述。在从与所输入的频带变换LSP对应的编码信息中,在传输路径上丢失了宽带LSP编码信息的一部分的帧时,使用补偿宽带LSP来补偿作为该宽带LSP编码信息的解码信号的宽带量化LSP。所生成的补偿宽带LSP被输出到切换单元128。
存储单元126将由帧丢失补偿单元124生成补偿宽带LSP时所使用的存储宽带LSP,预先存储于设置在其内部的缓存器129,并将该存储宽带LSP输出到帧丢失补偿单元124和切换单元128。另外,以从切换单元128输入的宽带量化LSP来更新缓存器129中所存储的存储宽带LSP。
由此,以从切换单元128输入的宽带量化LSP来更新存储宽带LSP。因此,在丢失后续的编码信息时,尤其在丢失当前的编码信息的下一个编码信息的宽带LSP编码信息时,能够将对应当前的编码信息的宽带LSP编码信息而生成的宽带量化LSP作为存储宽带LSP使用,从而生成对应于后续的编码信息的宽带LSP编码信息的补偿宽带LSP。
切换单元128基于所输入的帧丢失信息,切换作为宽带量化LSP而被输出到语音合成单元114的信息。
更具体地说,在所输入的帧丢失信息表示“正常接收了编码信息所包含的所有的窄带LSP编码信息和宽带LSP编码信息”时,切换单元128将从解码进行单元122输入的宽带量化LSP直接输出到语音合成单元114和存储单元126。另外,在输入的帧丢失信息表示“编码信息所包含的窄带LSP编码信息和宽带LSP编码信息中,正常接收了窄带LSP编码信息,丢失了宽带LSP编码信息中的至少一部分”时,切换单元128将从帧丢失补偿单元124输入的补偿宽带LSP作为宽带量化LSP输出到语音合成单元114和存储单元126。再有,在输入的帧丢失信息表示“丢失了编码信息所包含的窄带LSP编码信息和宽带LSP编码信息双方的至少一部分”时,切换单元128将从存储单元126输入的存储宽带LSP作为宽带量化LSP输出到语音合成单元114 和存储单元126。
也就是说,帧丢失补偿单元124和切换单元128的组合构成补偿单元,该补偿单元在输入到复用分离单元102的编码信息中的宽带LSP编码信息丢失时,通过将从所解码的窄带量化LSP获得的频带变换LSP与事先存储于缓存器129的存储宽带LSP加权相加,从而生成丢失补偿信号,并以丢失补偿信号补偿所丢失的宽带信号的宽带量化LSP。
这里,参照图3更具体地说明帧丢失补偿单元124的内部结构。加权单元130将从变换单元120输入的频带变换LSP乘以加权系数w1。通过该乘法运算所获得的LSP向量被输出到加法单元134。加权单元132将从存储单元126输入的存储宽带LSP乘以加权系数w2。通过该乘法运算所获得的LSP向量被输出到加法单元134。加法单元134将分别从加权单元130和132输入的LSP向量相加。通过该加法生成补偿宽带LSP。
再次参照图1。语音合成单元114将从宽带LSP解码单元110输入的量化宽带LSP变换为线性预测系数,并使用所获得的线性预测系数构筑线性预测合成滤波器。并且,以从声源解码单元104输入的宽带量化声源信号驱动该线性预测合成滤波器,从而合成解码语音信号。该解码语音信号被输出到加法单元118。
加法单元118将从上采样单元116输入的上采样后的窄带解码语音信号与从语音合成单元114输入的解码语音信号相加。然后,输出通过该加法而获得的宽带解码语音信号。
接着,对包括上述结构的可扩展解码装置100的动作,特别对加权相加处理加以说明。
这里,假设与核心层对应的窄带频域为0~4kHz,与扩展层对应的宽带频域为0~8kHz,在变换单元120所使用的变换系数为“0.5”的情况作为例子,并使用图4A~图4D进行说明。在图4A中,采样频率为8kHz,奈奎斯特频率为4kHz,而在图4B~图4D中,采样频率为16kHz,奈奎斯特频率为8kHz。
在变换单元120,通过将所输入的当前的窄带量化LSP的各次LSP乘0.5倍,例如将图4A所示的4kHz频带的量化LSP变换到8kHz频带的量化LSP,从而生成例如图4B所示的频带变换LSP。另外,在变换单元120,可以使用与上述不同的方法来变换带宽(采样频率)。另外,这里假设宽带量化LSP的次数为16次,并分别将1~8次定义为低频域,将9~16次定义为高频域。
频带变换LSP被输入到加权单元130。在加权单元130将以下述的式(1)和(2)设定的加权系数w1(i)与从变换单元120输入的频带变换LSP相乘。另外,所输入的频带变换LSP是从由复用分离单元120获得的当前的编码信息导出的。另外,i表示次数。
w1(i)=(9-i)/8(i=1~8) ...式(1)
w1(i)=0 (i=9~16) ...式(2)
另一方面,例如图4C所示的存储宽带LSP被输入到加权单元132。在加权单元132,将以下述的式(3)和(4)来设定的加权系数w2(i)与从存储单元126输入的存储宽带LSP相乘。另外,所输入的存储宽带LSP是从编码信息导出的,该编码信息是由复用分离单元102在当前的编码信息(例如在现在的编码信息的前一个帧)之前获得的。
w2(i)=(i-1)/8 (i=1~8) ...式(3)
w2(i)=1 (i=9~16) ...式(4)
也就是说,加权系数w1(i)和加权系数w2(i)被设定为使w1(i)+w2(i)=1.0。另外,将加权系数w1(i)设定为在0~1之间的越接近高域时越小的值,在高域设定为0。另一方面,将加权系数w2(i)设定为在0~1之间的越接近高频域时越大的值,在高频域被设定为1。
然后在加法单元134,求由加权单元130的乘法运算所获得的LSP向量与由加权单元132的乘法运算所获得的LSP向量的和向量。这样,通过求所述LSP向量的和向量,能够获得例如图4D所示的补偿宽带LSP。
理想的是,根据“变换窄带量化LSP而获得的频带变换LSP”和“作为以前解码的宽带量化LSP的存储宽带LSP”的哪一个更近于无差错时解码的宽带量化LSP,自适应地设定加权系数w1(i)和w2(i)。也就是,最好设定为:在频带变换LSP更近于无差错时的宽带量化LSP时使加权系数w1(i)较大,在存储宽带LSP更近于无差错时的宽带量化LSP时,使加权系数w2(i)较大。但实际上,发生帧丢失时无法得知无差错时的宽带量化LSP,因此难以进行理想的加权系数的设定。然而,在进行如上述的4kHz频带信号和8kHz频带信号的可扩展编码时,有如下倾向:在4kHz以上的频带,存储宽带LSP更近于无差错时的宽带量化LSP(与无差错时的宽带量化LSP误差小)的情况较多,在4kHz以下的频带,越接近0Hz,频带变换LSP更近于无差错时的宽带量化LSP(与无差错时的宽带量化LSP误差小)的情况较多。因此,所述 式(1)~(4)是近似于包含所述误差倾向的特性的函数。所以,通过使用以式(1)~(4)来定义的加权系数w1(i)和w2(i),能够考虑由窄带的频带和宽带的频带的组合而确定的误差特性,即,在频带变换LSP和无差错的宽带量化LSP之间的误差倾向,而进行加权相加处理。而且,能够以如式(1)~(4)那样的简单的算式来决定加权系数w1(i)和w2(i),因此不需将加权系数w1(i)和w2(i)存储于ROM(Read Only Memory)等,能够以简单的结构实现有效的加权相加。
另外,在本实施方式,以存在误差变动倾向,即频率或次数越高时误差变得越大的倾向的情况作为例子进行说明,但误差变动倾向因各个层的频域的设定条件等而有所不同。例如,在窄带的频域为300Hz~3.4kHz、宽带的频域为50Hz~7kHz时,因为下限频率不同,有可能与在300Hz以下的区域发生的误差相比,在300Hz以上的区域发生的误差更小或为同样程度。在这种情况下,例如可以使加权系数w2(1)为与加权系数w2(2)相同的值,或为大于加权系数w2(2)的值。
也就是说,在设定加权系数w1(i)和w2(i)时要求的条件如下。将与重叠频带对应的系数定义为第一系数,所述重叠频带为窄带的频域和宽带的频域相互重叠的区域。另外,将与非重叠频带对应的系数定义为第二系数,所述非重叠频带为窄带的频域和宽带的频域相互不重叠的区域。第一系数为变数,基于重叠频带内的频率或对应于该频率的次数与重叠频带和非重叠频带的边界频率或对应于该边界频率的次数之差而决定。第二系数在非重叠频带内为常数。
再者,对于第一系数,与频带变换LSP个别对应地设定所述差越小时越小的值,与存储宽带LSP个别对应地设定所述差越小时越大的值。具体地说,可以以如式(1)和(3)所表示的线性的算式来表示第一系数,也可以将使用语音数据库等通过学习获得的值作为第一系数使用。通过学习获得第一系数时,以如下方式决定加权系数,即,对数据库所有的语音数据,计算作为加权相加的结果而获得的补偿宽带LSP与无差错时的宽带量化LSP的误差,并决定加权系数以使其总和为最小。
这样,根据本实施方式,在丢失了当前的编码信息的宽带LSP编码信息时,通过将该编码信号的窄带量化LSP的频带变换LSP与以前的编码信息的宽带量化LSP加权相加来生成补偿宽带LSP,并以补偿宽带LSP来补偿所丢 失的宽带编码信息的宽带量化LSP。也就是,通过将当前的编码信息的频带变换LSP与以前的编码信息的宽带量化LSP加权相加,来生成补偿宽带LSP,它用于补偿所丢失的宽带编码信息的宽带量化LSP。因此,与仅使用以前的编码信息的宽带量化LSP或当前的编码信息的窄带量化LSP以补偿所丢失的宽带LSP编码信息的宽带量化LSP的情况相比,能够使补偿后的宽带LSP编码信息的宽带量化LSP接近于无差错的状态,由此能够提高对传输差错的容错性。而且,能够将当前的编码信息的频带变换LSP与以前的编码信息的宽带量化LSP顺利地连接,从而能够保持所生成的补偿宽带LSP的帧之间的连续性。
(实施方式2)
图5是表示本发明实施方式2的可扩展解码装置的结构的主要部分的方框图。另外,图5的可扩展解码装置200包括与在实施方式1说明的可扩展解码装置100相同的基本结构。因此,对与在实施方式1说明的相同的结构元素赋予相同的参照标号,并省略其详细说明。
可扩展解码装置200包括宽带LSP解码单元202以取代由实施方式1说明的宽带LSP解码单元110。图6是表示宽带LSP解码单元202的内部结构的方框图。宽带LSP解码单元202包括帧丢失补偿单元204以代替由实施方式1说明的帧丢失补偿单元124。再有,在宽带LSP解码单元202中设置变动量计算单元206。图7是表示帧丢失补偿单元204的内部结构的方框图。帧丢失补偿单元204具有在帧丢失补偿单元124的内部结构中添加了加权系数控制单元208的结构。
宽带LSP解码单元202与宽带LSP解码单元110同样地,基于帧丢失信息,由从窄带LSP解码单元108输入的窄带量化LSP和从复用分离单元102输入的宽带LSP编码信息,获得宽带量化LSP。
在宽带LSP解码单元202中,变动量计算单元206接受由变换单元120获得的频带变换LSP。然后计算频带变换LSP的帧间变动量。变动量计算单元206将根据计算出的帧间变动量的控制信号输出到帧丢失补偿单元204的加权系数控制单元208。
帧丢失补偿单元204以与帧丢失补偿单元124相同的方法,将从变换单元120输入的频带变换LSP与存储于缓存器129的存储宽带LSP加权相加。由此生成补偿宽带LSP。
另外,在实施方式1的加权相加,直接使用基于次数i或相对应的频率以唯一的方式决定的加权系数w1和w2,但相对于此,在本实施方式的加权相加是自适应地控制并使用加权系数w1和w2。
在帧丢失补偿单元204中,加权系数控制单元208根据从变动量计算单元206输入的控制信号,使整个频带的加权系数w1(i)和w2(i)中与重叠频带对应的(即在实施方式1定义为“第一系数”的)加权系数w1(i)和w2(i)自适应地变化。
更具体地说,在算出的帧间变动量越大时,进行使加权系数w1(i)越大并相应地使加权系数w2(i)越小的设定。而在算出的帧间变动量越小时,进行使加权系数w2(i)越大并相应地使加权系数w1(i)越小的设定。
作为所述控制方法的一个例子,可以举如下的控制方法:将计算出的帧间变动量与特定的阈值比较,根据该比较结果,切换包括加权系数w1(i)和加权系数w2(i)的加权系数组。在采用这种控制方法时,加权系数控制单元208事先存储与阈值以上的帧间变动量对应的加权系数组WS1和与低于阈值的帧间变动量对应的加权系数组WS2。将加权系数组WS1中所包含的加权系数w1(i)设定为大于加权系数组WS2中所包含的加权系数w1(i)的值,将加权系数组WS1中所包含的加权系数w2(i)设定为小于加权系数组WS2中所包含的加权系数w2(i)的值。
然后,比较的结果,在算出的帧间变动量为阈值以上时,加权系数控制单元208对加权单元130进行控制,以使加权单元130使用加权系数组WS1的加权系数w1(i),同时对加权单元132进行控制,以使加权单元132使用加权系数组WS1的加权系数w2(i)。另一方面,比较的结果,算出的帧间变动量低于阈值时,加权系数控制单元208对加权单元130进行控制,以使加权单元130使用加权系数组WS2的加权系数w1(i),同时对加权单元132进行控制,以使加权单元132使用加权系数组WS2的加权系数w2(i)。
这样,根据本实施方式,因为在帧间变动量越大时,进行使加权系数w1(i)越大并相应地使加权系数w2(i)越小的设定,另一方面,在算出的帧间变动量越小时,进行使加权系数w2(i)越大并相应地使加权系数w1(i)越小的设定,也就是说,因为使在加权相加使用的加权系数w1(i)和w2(i)基于帧间变动量自适应地变化,所以能够根据正常接收的信息的经时变动而自适应地控制加权系数w1(i)和w2(i),能够进一步提高宽带量化LSP的补偿精度。
另外,本实施方式的变动量计算单元206设置在变换单元120的后级,计算频带变换LSP的帧间变动量。但是,变换计算单元206的配置和结构不限于上述配置和结构。例如,也可以在变换单元120的前级设置变动量计算单元206。此时,变动量计算单元206计算由窄带LSP解码单元108获得的窄带量化LSP的帧间变动量。此时也能够实现与上述相同的作用效果。
另外,在变动量计算单元206,也可对频带变换LSP(或窄带量化LSP)的各个次数个别地进行帧间变动量的计算。此时,由加权系数控制单元208对每个次数进行加权系数w1(i)和w2(i)的控制。由此能够进一步提高宽带量化LSP的补偿的精度。
另外,用于上述实施方式的说明中的各功能块通常可实现为LSI,它是一种集成电路。这些块既可是每个块分别集成到一个芯片,或者可以是一部分或所有块集成到一个芯片。
虽然此处称为LSI,但根据集成程度,也可以被称为IC、系统LSI、超级LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器实现之。在LSI制造后可利用可编程的FPGA(Field Programmable GateArray),或者可以使用可重构LSI内部的电路单元的连接和设定的可重构处理器。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI集成电路化的新技术,当然可利用新技术进行功能块的集成化。存在着适用生物技术等的可能性。
本说明书是根据2004年9月6日申请的日本专利申请第2004-258925。其内容全部包含于此。
工业实用性
本发明的可扩展解码装置和信号丢失补偿方法,可适用于移动通信系统和使用互联网协议的分组通信系统等中的通信装置。
Claims (6)
1.一种用于语音信号的可扩展解码装置,包括:
第一解码单元,对窄带线谱对编码信息进行解码,所述窄带线谱对编码信息是与具有第一频带的核心层相对应而生成的;
第二解码单元,对宽带线谱对编码信息进行解码,所述宽带线谱对编码信息是与具有比所述第一频带宽的第二频带的扩展层相对应而生成的;
存储单元,在正常接收所述窄带线谱对编码信息和所述宽带线谱对编码信息时,存储解码所得的宽带量化线谱对;
变换单元,将解码所得的窄带量化线谱对从所述第一频带变换到所述第二频带,从而生成频带变换线谱对;以及
补偿单元,在正常接收所述窄带线谱对编码信息而丢失所述宽带线谱对编码信息时,通过将所述频带变换线谱对和所存储的宽带量化线谱对分别与不同的加权系数相乘并相加而生成丢失补偿信号,并以丢失补偿信号来补偿丢失的宽带线谱对编码信息的解码信号。
2.如权利要求1所述的用于语音信号的可扩展解码装置,其中,
与所述频带变换线谱对相乘的第一加权系数和与所存储的宽带量化线谱对相乘的第二加权系数设定为,它们的合计值为1,所述第一加权系数和所述第二加权系数分别取0~1的值,并且所述第一加权系数越靠近高频域就取越小的值且在高频域为0,而所述第二加权系数越靠近高频域就取越大的值且在高频域为1。
3.如权利要求1所述的用于语音信号的可扩展解码装置,其中,
所述补偿单元使用第三加权系数和第四加权系数进行加权相加,该第三加权系数与所述第一频带和所述第二频带的重叠频带对应,该第四加权系数与所述第一频带和第二频带的非重叠频带对应;
所述第三加权系数与所述频带变换线谱对个别对应地设定为次数差越小则越小的值,与所存储的宽带量化线谱对个别对应地设定为所述次数差越小则越大的值,所述次数差是重叠频带内的频率或对应于该频率的次数、与重叠频带和非重叠频带的边界频率或者对应于该边界频率的次数之差,所述第四加权系数在所述非重叠频带内为常数。
4.如权利要求1所述的用于语音信号的可扩展解码装置,其中,
所述补偿单元使用加权系数进行加权相加,该加权系数是对所述频带变换线谱对和所存储的宽带量化线谱对个别设定的,并且是根据所述第一频带和所述第二频带重叠的重叠频带中的频率与重叠频带的边界频率之差而决定的;
对所述频带变换线谱对所设定的加权系数,设定为在所述差越小时取越小的值,对所存储的宽带量化线谱对所设定的加权系数,设定为在所述差越小时取越大的值。
5.如权利要求1所述的用于语音信号的可扩展解码装置,其中,
所述第二解码单元还包括:变动量计算单元,计算所述频带变换线谱对的帧间变动量,
所述补偿单元在算出的帧间变动量越大时,使对所述频带变换线谱对设定的加权系数越大并使对所存储的宽带量化线谱对设定的加权系数越小,在算出的帧间变动量越小时,使对所述频带变换线谱对设定的加权系数越小并使对所存储的宽带量化线谱对设定的加权系数越大。
6.一种语音信号丢失补偿方法,包括:
第一解码步骤,对窄带线谱对编码信息进行解码,所述窄带线谱对编码信息是与具有第一频带的核心层相对应而生成的;
第二解码步骤,对宽带线谱对编码信息进行解码,所述宽带线谱对编码信息是与具有比所述第一频带宽的第二频带的扩展层相对应而生成的;
存储步骤,在正常接收所述窄带线谱对编码信息和所述宽带线谱对编码信息时,存储解码所得的宽带量化线谱对;
变换步骤,将解码所得的窄带量化线谱对从所述第一频带变换到所述第二频带,从而生成频带变换线谱对;以及
补偿步骤,在正常接收所述窄带线谱对编码信息而丢失所述宽带线谱对编码信息时,通过将所述频带变换线谱对和所存储的宽带量化线谱对分别与不同的加权系数相乘并相加而生成丢失补偿信号,并以丢失补偿信号来补偿丢失的宽带线谱对编码信息的解码信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP258925/2004 | 2004-09-06 | ||
JP2004258925 | 2004-09-06 | ||
PCT/JP2005/016098 WO2006028009A1 (ja) | 2004-09-06 | 2005-09-02 | スケーラブル復号化装置および信号消失補償方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101010730A CN101010730A (zh) | 2007-08-01 |
CN101010730B true CN101010730B (zh) | 2011-07-27 |
Family
ID=36036294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800294184A Expired - Fee Related CN101010730B (zh) | 2004-09-06 | 2005-09-02 | 可扩展解码装置以及信号丢失补偿方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7895035B2 (zh) |
EP (1) | EP1788556B1 (zh) |
JP (1) | JP4989971B2 (zh) |
CN (1) | CN101010730B (zh) |
WO (1) | WO2006028009A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006098274A1 (ja) * | 2005-03-14 | 2006-09-21 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル復号化方法 |
WO2007043642A1 (ja) * | 2005-10-14 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法 |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
JP5255575B2 (ja) * | 2007-03-02 | 2013-08-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | レイヤード・コーデックのためのポストフィルタ |
CN101308660B (zh) * | 2008-07-07 | 2011-07-20 | 浙江大学 | 一种音频压缩流的解码端错误恢复方法 |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
JP2012032713A (ja) * | 2010-08-02 | 2012-02-16 | Sony Corp | 復号装置、復号方法、およびプログラム |
CN103295578B (zh) | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN108831501B (zh) | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN103117062B (zh) * | 2013-01-22 | 2014-09-17 | 武汉大学 | 语音解码器中帧差错隐藏的谱参数代替方法及系统 |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922055A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
EP2922054A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
CN111200485B (zh) * | 2018-11-16 | 2022-08-02 | 中兴通讯股份有限公司 | 宽带误差校准参数提取方法、装置及计算机可读存储介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP3071388B2 (ja) | 1995-12-19 | 2000-07-31 | 国際電気株式会社 | 可変レート音声符号化方式 |
JPH10233692A (ja) * | 1997-01-16 | 1998-09-02 | Sony Corp | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
JP3134817B2 (ja) | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6445696B1 (en) * | 2000-02-25 | 2002-09-03 | Network Equipment Technologies, Inc. | Efficient variable rate coding of voice over asynchronous transfer mode |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US7031926B2 (en) | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
JP3467469B2 (ja) | 2000-10-31 | 2003-11-17 | Necエレクトロニクス株式会社 | 音声復号装置および音声復号プログラムを記録した記録媒体 |
JP4063670B2 (ja) | 2001-01-19 | 2008-03-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域信号伝送システム |
WO2002062023A1 (en) * | 2001-01-31 | 2002-08-08 | Teldix Gmbh | Modular and scalable switch and method for the distribution of fast ethernet data frames |
US7647223B2 (en) * | 2001-08-16 | 2010-01-12 | Broadcom Corporation | Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space |
US7610198B2 (en) * | 2001-08-16 | 2009-10-27 | Broadcom Corporation | Robust quantization with efficient WMSE search of a sign-shape codebook using illegal space |
US7617096B2 (en) * | 2001-08-16 | 2009-11-10 | Broadcom Corporation | Robust quantization and inverse quantization using illegal space |
CA2430923C (en) | 2001-11-14 | 2012-01-03 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device, and system thereof |
JP2003241799A (ja) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム |
JP2003323199A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
JP3881946B2 (ja) * | 2002-09-12 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
-
2005
- 2005-09-02 EP EP05777024.0A patent/EP1788556B1/en not_active Not-in-force
- 2005-09-02 JP JP2006535718A patent/JP4989971B2/ja not_active Expired - Fee Related
- 2005-09-02 WO PCT/JP2005/016098 patent/WO2006028009A1/ja active Application Filing
- 2005-09-02 US US11/574,631 patent/US7895035B2/en not_active Expired - Fee Related
- 2005-09-02 CN CN2005800294184A patent/CN101010730B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1788556A1 (en) | 2007-05-23 |
US7895035B2 (en) | 2011-02-22 |
EP1788556B1 (en) | 2014-06-04 |
EP1788556A4 (en) | 2008-09-17 |
WO2006028009A1 (ja) | 2006-03-16 |
US20070265837A1 (en) | 2007-11-15 |
JPWO2006028009A1 (ja) | 2008-05-08 |
JP4989971B2 (ja) | 2012-08-01 |
CN101010730A (zh) | 2007-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101010730B (zh) | 可扩展解码装置以及信号丢失补偿方法 | |
EP1755109B1 (en) | Scalable encoding and decoding apparatuses and methods | |
CN102122511B (zh) | 一种信号处理方法、处理装置以及语音解码器 | |
CN102385866B (zh) | 语音编码装置、解码装置和语音编码方法、解码方法 | |
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP4963963B2 (ja) | スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法 | |
CN1989548B (zh) | 语音解码装置及补偿帧生成方法 | |
KR102222838B1 (ko) | 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더 | |
CN107256709B (zh) | 音频编码装置 | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
GB2235354A (en) | Speech coding/encoding using celp | |
WO2006120931A1 (ja) | 符号化装置、復号化装置及びこれらの方法 | |
WO1999066497A1 (fr) | Codeur et decodeur de signaux musicaux/vocaux | |
JPH09127987A (ja) | 信号符号化方法及び装置 | |
JPH09127998A (ja) | 信号量子化方法及び信号符号化装置 | |
JP3808270B2 (ja) | 音声符号化装置、音声復号化装置及び符号語配列方法 | |
KR960015861B1 (ko) | 선 스펙트럼 주파수 벡터의 양자화 방법 및 양자화기 | |
JPH04301900A (ja) | 音声符号化装置 | |
JPH09134198A (ja) | 音声復号化装置 | |
JP2775533B2 (ja) | 音声の長期予測装置 | |
KR100221186B1 (ko) | 음성 부호화 및 복호화 장치와 그 방법 | |
KR19980036961A (ko) | 음성 부호화 및 복호화 장치와 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170526 Address after: Delaware Patentee after: III Holding 12 limited liability company Address before: Osaka Japan Patentee before: Matsushita Electric Industrial Co., Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110727 Termination date: 20180902 |