CN1629936A - 解码方法、解码装置、程序及记录介质 - Google Patents
解码方法、解码装置、程序及记录介质 Download PDFInfo
- Publication number
- CN1629936A CN1629936A CNA2004101000522A CN200410100052A CN1629936A CN 1629936 A CN1629936 A CN 1629936A CN A2004101000522 A CNA2004101000522 A CN A2004101000522A CN 200410100052 A CN200410100052 A CN 200410100052A CN 1629936 A CN1629936 A CN 1629936A
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- power
- decoding
- power back
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 86
- 238000001228 spectrum Methods 0.000 claims abstract description 363
- 238000010606 normalization Methods 0.000 claims abstract description 82
- 238000011002 quantification Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 15
- 238000013139 quantization Methods 0.000 abstract description 30
- 230000005236 sound signal Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 16
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 6
- 230000000873 masking effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008034 disappearance Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在解码装置(30)中,功率校正频谱产生/合成单元(371到374)根据量化准确度信息、归一化系数、增益控制信息、和功率调整信息调整功率校正频谱PCSP的功率。通过将低于阈值的频谱替代为功率调整之后的功率补偿频谱PCSP,或通过将功率调整之后的功率补偿频谱PCSP加入到频谱SP,来调整频谱SP的功率。
Description
本申请是申请日为2003年4月30日、申请号为03800620.0、发明名称为“编码方法、编码装置、解码方法、和解码装置”的发明专利申请的分案申请。
技术领域
本发明涉及一种编码方法和装置,一种解码方法和装置,一种程序,和一种记录介质,特别涉及一种用于高效率地编码声学信号(acoustic signal)和声音信号(sound signal)的数字数据以便发送如此编码的数据或记录如此编码的数据到一种记录介质的方法和装置,特别涉及一种用于接收或重现编码的数据以便解码如此接收或重现的编码的数据的方法和装置,特别涉及一种具有记录在其中能够被计算机读出的程序的记录介质。
本申请要求于2002年5月7日申请的日本专利申请No.2002-132188的优先权,其全部引用于此作为参考。
背景技术
传统上,作为高效率地编码声音信号的音频信号等的方法,所知的有不分块频带划分系统(non-blocking frequency band division system),比如频带划分编码(子带编码,subband encoding),分块频带划分系统,比如转换编码。
在不分块频带划分系统中,时基(time base)音频信号被划分到多个频带而不阻塞信号,并编码如此划分的信号。另一方面,在分块频带划分系统中,时基信号被转换为频基(frequency base)信号(频谱转换),并且如此转换的信号被划分到多个频带。然后,通过频谱转换获得的系数根据预定的相应频带被加在一起(put together),并在相应频带对如此划分的信号进行编码。
此外,作为提高编码效率的方法,这里建议了一种高效率的编码方法连带地介绍了不分块频带划分系统和分块频带划分系统。使用这种方法,在使用频带划分编码执行了频带划分之后,通过频谱转换划分到相应频带的信号被转换为频基信号,并在相应的频带对如此转换的信号进行编码。
在执行频带划分中,由于能够简单地处理信号和去除混淆失真,QMF(正交镜象滤波器)可以在很多情况下被使用。由QMF进行频带划分的详细内容被写在“1976R.E.Crochiere,Digital coding of speech in subbands(在子带中语音的数字编码),Bell Syst.Tech.J.Vol.55,No.8 1976”。
此外,作为执行频带划分的方法,所知的PQF(多相正交滤波器)是相等频宽的滤波器划分方法。PQF的详细内容被写在“ICASSP 83 BOSTON,Polyphase Quadrature Filters-A new subband coding technique(多相正交滤波器一一种新的子带编码技术),Joseph H.Rothweiler”。
另一方面,如上所述的频谱转换,例如用预定单元时间的帧分块输入的音频信号,而且通过在各自的块经受DFT(离散傅里叶变换)、DCT(离散余弦变换)、MDCT(改进的离散余弦变换)使时基信号转换为频基信号。
MDCT的详细内容被写在“ICASSP 1987,Subband/Transform CodingUsing Filter Bank Designs Based on Time Domain Aliasing Cancellation(使用滤波器组设计基于时域混淆的消除的子带/变换编码),J.P.Prince,A.B.Bradley,Univ.of Surrey Royal Melbourne Inst.of Tech.”。
通过量化(quantizing)使信号划分到通过滤波器和频谱转换获得的相应的频带中,引起量化噪声的频带能够被控制,这使得能够利用掩蔽效应(maskingeffect)的性质等在听觉范围(auditory sense)内进行高效率的编码。此外,在量化之前,相应频带的信号分量由每个频带的信号分量的绝对值的最大值进行归一化(normalize),这使得能够更高效率地进行编码。
在执行频带划分中,相应的频带带宽是考虑到人类的听觉特性而被确定的。即,一般来讲,音频信号被划分到在临界频带下的多个频带(例如,32个频带),其中更高的频带具有更宽的带宽。
在相应频带的数据编码中,执行位分配(bit allocation)以便将预定位或自适应位(adaptable bit)分配到相应的频带。即,在通过使用位分配对通过MDCT处理所获得的系数数据进行编码中,位数被自适应地分配到通过对分块(block)到相应块中的信号执行MDCT处理所获得的相应频带的系数数据中。
作为位分配方法,已知的一种执行位分配的方法基于相应频带的信号数量(在下文中适当地将其称为第一种位分配方法),和一种固定地(fixedly)执行位分配的方法,其中对相应频带的信噪比是通过利用听觉掩蔽(auditorymasking)(在下文中适当地将其称为第二种位分配方法)而获得的。
第一种位分配方法的详细内容被写在“Adaptive Transform Coding ofSpeech Signals(语音信号的自适应变换编码),R.Zelinski和P.Noll,IEEE声学会报,语音和信号处理,vol.ASSP-25,No.4,1977年8月”。
第二位分配的详细内容被写在“ICASSP 1980,The critical band coderdigital encoding of the perceptual requirements of the auditory system(听觉系统的感性要求的临界频带编码器编码),M.A.Kransner Mit”。
使用第一位分配方法,量化噪声频谱是平面化的、最小化的噪声能量。然而,由于掩蔽效应并没有利用到听觉范围内,实际的听觉噪声水平并不是最优化的。另一方面,使用第二位分配方法,例如在能量集中在一个特定频率的情况下,即使输入正弦波,由于位分配是固定地执行的,而不能获得想要性质的数值。
所以,建议高效率的编码装置把将要在位分配中使用的全部位划分到为相应小块预先确定的位分配模式的位中,和取决于相应块的信号数量的位分配的位中,而且所述装置使得划分率(division ration)取决于与输入信号相关的一个信号。即,例如,当信号的频谱平滑时,便提高了固定的位分配的划分比例。
使用这种方法,在能量集中在一个特定频谱的情况下,当输入正弦波时许多位被分配到包括所述频谱的块中,这样能大大提高总的信噪比。一般来讲,由于人类听觉对具有陡谱(steep spectrum)分量的信号极其敏感,上述信噪比的改善不但改善了测量数据值,还有效地改善了在听觉范围内声音的质量。
作为位分配的方法,除了上述方法还建议了许多其它方法,并且涉及听觉的模型变得精炼了。编码装置在操作性能上的改善使得从听觉角度的高效率编码成为可能。
在使用DFT或DCT作为转换波形信号为频谱信号的方法的情况下,当使用由M组样值组成的时间块转换信号时,能够获得M组独立的实数数据。一般来讲,为了减少时间块(帧)之间的连接失真,每个块都与两个相邻块分别交迭了预定的M1组样值。因此,当使用利用DFT或DCT的编码方法时,M组实数数据被量化以便平均为(M-M1)组样值编码。
在使用MDCT作为将时基信号转换为频谱信号的方法的情况下,M组独立的实数数据能够从每个块都与相邻块分别交迭了M组样值的2M组样值中获得。因此,在这种情况下,M组实数数据被量化以便平均为M组样值编码。然后,解码装置通过将从经过反向转换而相应块获得的波形分量和相互干扰的相应波形分量相加,从利用MDCT的上述方法中获得的代码中重建波形信号。
一般来讲,通过使用于转换的时间块(帧)更长,改善了频谱的频率分辩率,并且能量集中在一个特定的频谱分量上。在使用MDCT的情况下,其中信号使用每个块都与两个相邻的块交迭了一半的长块进行转换,并且获得的频谱的数量与原始时间样值的数量比没有增加,则与使用DFT或DCT的情况比,能够实现高效率的编码。此外,通过使邻近的块具有适当长的交迭,能够减少波形信号的块之间的失真。
在产生实际的代码序列中,首先,量化准确度信息表示用于执行量化的量化步骤,而归一化系数信息表示用于归一化相应信号分量的系数,这些信息被编码为其中将要执行归一化和量化的相应频带的预定数量的位。对归一化的和量化的频谱进行编码。
在“IDO/IEC 11172-3:1933(E),1993”中写了一种高效率编码方法,其中位的数量表示不同频带设置了不同的量化准确度信息。根据所述方法,规定较高频带的具有较少数量的位表示量化准确度信息。
图1表示通过频带划分对音频信号等进行编码的传统编码装置100的框图。频带划分单元101接收要编码的音频信号,并且将如此接收的音频信号使用滤波器QMF、PQF等划分到例如四个频带。当使用频带划分单元101将音频信号划分到频带时,相应频带(在下文中将其适当地称为编码单元)的宽度根据临界频带可以是互相相等或不相等。在这个例子中,音频信号被划分到四个编码单元,虽然编码单元的数量并不限定于这个数字。然后,频带划分单元101将所述划分到四个编码单元(在下面全指第一到第四编码单元)的音频信号,发送到相应于相应预定时间块(帧)的增益控制单元1021到1024。
增益控制单元1021到1024根据在相应块中的相应信号的幅值产生增益控制信息,并基于增益控制信息控制在相应块中的信号的增益。然后,增益控制单元1021到1024将通过增益控制获得的第一到第四编码单元的信号发送到频谱转换单元1031到1034,同时发送所述增益控制信息到多路复用器107。
频谱转换单元1031到1034对相应编码单元的经过增益控制的时基信号执行例如MDCT的频谱转换以产生频基信号,并将如此产生的频基信号分别发送到归一化单元1041到1044,同样发送到量化准确度确定单元105。
归一化单元1041到1044从构成第一到第四编码单元的相应信号的相应信号分量中提取最大绝对值的信号分量,并将相应于如此提取的信号分量的系数设置为第一到第四编码单元的归一化系数。然后,归一化单元1041到1044使用相应于第一到第四编码单元的归一化系数的值,对构成第一到第四编码单元的相应信号的相应信号分量进行归一化或划分。因此,在这种情况下,通过归一化所获得的归一化的数据范围从-1.0到1.0。归一化单元1041到1044将第一到第四编码单元的归一化的数据分别发送到量化单元1061到1064,同时将第一到第四编码单元的归一化系数发送到多路复用器107。
量化准确度确定单元105基于从增益控制单元1021到1024发送的第一到第四编码单元的信号,确定将在量化第一到第四编码单元的归一化的数据中使用的量化步骤。然后,量化准确度确定单元105相应于量化步骤将第一到第四编码单元的量化准确度信息发送到量化单元1061到1064,以及到多路复用器107。
量化单元1061到1064,通过使用相应于第一到第四编码单元的量化准确度信息的量化步骤对数据进行量化,以对第一到第四编码单元的归一化的数据进行编码,并将如次获得的第一到第四编码单元的量化系数发送到多路复用器107。
多路复用器107对量化系数、量化准确度信息、归一化系数和第一到第四编码单元的增益控制信息进行编码,如果需要,对那些数据进行多路复用。然后,多路复用器107经由传输线路发送通过多路复用处理获得的编码的数据,或将编码的数据记录到未示出的记录介质。
量化准确度确定单元105能基于归一化数据确定量化步骤,或能够考虑到例如掩蔽效应的听觉现象来确定量化步骤,而不是基于通过频带划分所获得的信号来确定量化步骤。
图2表示对从编码装置100输出的编码的数据进行解码的传统解码装置120的框图。在图2中所示解码装置120中,多路分配器121将输入的编码数据解码和多路分解为量化系数、量化准确度信息、归一化系数和第一到第四编码单元的增益控制信息。然后,多路分配器121将量化系数、量化准确度信息、和第一到第四编码单元的归一化系数发送到相应于相应编码单元的信号分量构成单元1221到1224,同时将第一到第四编码单元的增益控制信息发送到相应于相应编码单元的增益控制单元1241到1244。
信号分量构成单元1221使用相应于第一编码单元的量化准确度信息的量化步骤,对第一编码单元的量化系数进行解量化(dequantize),以产生第一编码单元的归一化的数据。此外,分量构成单元1221通过将数据乘以一个相应于第一编码单元的归一化系数的值来对第一编码单元的归一化数据进行解码,并将如次获得的第一编码单元的信号发送到频谱反转换单元1231。
信号分量构成单元1222到1224执行类似的解码处理以产生第二到第四编码单元的信号,并将如次获得的第二到第四编码单元的信号分别发送到频谱反转换单元1232到1234。
频谱反转换单元1231到1234对解码的频基信号执行例如IMDCT的频谱反转换以产生时基信号,并将如次产生的时基信号发送到增益控制单元1241到1244。
增益控制单元1241到1244基于从多路分配器121发送的增益控制信息执行增益控制补偿处理,并将如此获得的第一到第四编码单元的信号发送到频带合成单元125。
频带合成单元125执行频带合成以合成从增益控制单元1241到1244发送第一到第四编码单元的信号,以恢复原始的音频信号。
由于从图1中所示的编码装置100提供或传输到图2中所示的解码装置120的编码的信号包括量化准确度信息,在解码装置120中使用的听觉模型能够被任意地设立。即,对相应编码单元的量化步骤能够在编码装置100中被自由地设立,这能够在改善编码装置100的操作性能和听觉模型的精致的同时,在不替换或升级解码装置120的情况下改善声音质量和加强压缩比。
另一方面,在这种情况下,编码量化准确度信息的位的数量本身变得不期望地大,这使得在一定程度上(from a level)很难改善整体的编码效率。
有一种方法,例如操作解码装置从归一化信息确定量化准确度信息,而不是直接编码量化准确度信息。然而,使用这种方法,归一化系数和量化准确度信息之间的关系便在确定标准的同时确定了,这使得很难引入基于未来高级的听觉模型的量化准确度的控制。而且,如果实际压缩比率具有一定的宽度,归一化系数和量化准确度信息之间的关系就必须对压缩比率的相应值来确定。
因此,为了在一定程度上改善压缩比率,不但需要改善主要信息或例如在图1中所示的音频信号的用于编码的直接对象的编码效率,而且需要改善例如量化准确度信息和归一化系数的不是编码的直接对象的次要信息的编码效率。
本发明的发明人在日本专利申请No.2000-390598和日本专利申请No.2001-182383的说明书和附图中建议了一种改善次要信息的编码效率的方法。此外,本发明的发明人在日本专利申请No.2001-182093的说明书和附图中建议了一种改善在编码系统中控制增益的增益信息的编码效率。根据那些技术,次要信息的编码效率能够通过使用利用各种相互关系等的可变代码字长度编码来改善。
然而,利用编码装置的给定位数,如果需要非常高的压缩比率,有可能不能维持可以避免量化噪声被察觉到的量化准确度。在这种情况下,编码装置常常减少分配给主要信息的位。特别的,归一化的数据(频谱)被“0”或一个很小的值取代,或者执行量化的带宽被缩窄。
结果,这就产生了一个问题,即解码的和恢复的声音由于临时的频带变化(variation)而包括了反常的声音和噪声,以及由于频谱替代为“0”或一个很小的值而功率匮乏。特别是当极大地提高了压缩比率时,那些现象就非常显著的、不期望地被觉察到,而导致听觉问题。
发明内容
相应地,本发明的一个目的是克服上述已有技术的缺点,通过提供:一种编码方法和装置、一种解码方法和装置,用于接收或重放编码的数据以对如次接收或重放的编码的数据进行解码;一种程序,用于使计算机运行编码处理和解码处理;以及一种记录介质,其中记录了能够被计算机所读出的程序。本发明能够减少由于临时的频带变化产生的反常声音和噪声,以及当提高压缩比率时引起的功率匮乏。
通过提供一种用于对经过频谱转换而从输入的数字信号中产生的频谱进行编码的编码方法能够达到以上目的,所述方法包括:功率调整信息产生步骤,产生功率调整信息以调整功率补偿频谱的功率,所述功率补偿频谱将在解码侧与所述频谱合成在一起;以及编码步骤,将功率调整信息和所述频谱一起进行编码。
在功率调整信息产生步骤中,基于输入数字信号的音调产生功率调整信息。
在编码方法中,产生功率调整信息以调整功率补偿频谱的调整功率,所述功率补偿频谱在解码侧与所述频谱合成在一起,并且功率调整信息与所述频谱一起进行编码。
通过提供一种用于对经过频谱转换而从输入的数字信号产生的频谱进行编码的编码装置也能够达到以上目的,所述装置包括:功率调整信息产生装置,用于产生功率调整信息以调整功率补偿频谱的功率,所述功率补偿频谱将在解码侧与所述频谱合成在一起;以及编码装置,用于将功率调整信息和所述频谱一起进行编码。
功率调整信息产生装置基于输入数字信号的音调产生功率调整信息。
在编码装置中,产生功率调整信息以调整功率补偿频谱的调整功率,所述功率补偿频谱在解码侧与所述频谱合成在一起,并且功率调整信息与所述频谱一起进行编码。
通过提供一种用于对经过频谱转换而和编码而从数字信号中产生的频谱进行解码的解码方法也能够达到以上目的,所述方法包括:解码步骤,对所述频谱进行解码;功率补偿频谱产生步骤,产生功率补偿频谱;以及合成步骤,将解码的频谱和功率补偿频谱合成在一起。
在功率补偿频谱产生步骤中,通过参考从预定频谱模式产生的一个表中的值,产生功率补偿频谱。在参考表中的值中,可以使用例如高斯分布(Gaussian distribution)的随机数序列,或者可以使用在编码频谱中使用的归一化信息、量化准确度信息等。
在解码方法中,可以包括调整功率补偿频谱功率的功率补偿步骤。在功率调整步骤中,基于在解码所述频谱中使用的归一化系数或量化准确度信息,或者在编码所述频谱中已经被编码了的功率调整信息,来调整功率补偿频谱的功率。在这种情况下,在合成步骤中,解码的频谱和功率调整的功率补偿频谱(power-adjusted power compensation spectrum)被合成在一起。
在合成步骤中,频谱和功率补偿频谱被加在一起,或将至少所述频谱的一部分替代为功率补偿频谱。
在解码方法中,基于量化准确度信息、归一化系数、和功率调整信息,调整功率补偿频谱的功率;并且通过将所述频谱和功率补偿频谱相加,或通过将至少所述频谱的一部分替代为功率补偿频谱,而将功率调整的功率补偿频谱和解码的频谱合成在一起。
通过提供一种用于对经过频谱转换和编码而从数字信号中产生的频谱进行解码的解码装置也能够达到以上目的,所述装置包括:解码装置,用于对所述频谱进行解码;功率补偿频谱产生装置,用于产生功率补偿频谱;以及合成装置,用于将解码的频谱和功率补偿频谱合成在一起。
功率补偿频谱产生装置通过参考从预定频谱模式产生的一个表中的值,产生功率补偿频谱。在参考表中的值中,可以使用例如高斯分布的随机数序列,或者可以使用在编码频谱中使用的归一化信息、量化准确度信息等。
在解码装置中,可以包括调整功率补偿频谱功率的功率补偿步骤。功率调整装置,基于在解码所述频谱中使用的归一化系数或量化准确度信息,或者在编码所述频谱中已经被编码了的功率调整信息,来调整功率补偿频谱的功率。在这种情况下,合成装置将解码的频谱和功率调整的功率补偿频谱合成在一起。
合成装置将频谱和功率补偿频谱加在一起,或将至少所述频谱的一部分替代为功率补偿频谱。
解码装置基于量化准确度信息、归一化系数、和功率调整信息,调整功率补偿频谱的功率;并且通过将所述频谱和功率补偿频谱相加,或通过将至少所述频谱的一部分替代为功率补偿频谱,而将功率调整的功率补偿频谱和解码的频谱合成在一起。
通过提供一种用于使计算机运行上述编码处理和解码处理的程序,以及一种具有记录在其中能够被计算机读出的程序的记录介质也能够达到以上目的。
本发明的这些目的和其它目的、特性和优点,通过下面对本发明的优选实施例的详细描述将变得更加清楚。
附图说明
图1表示传统编码装置的框图。
图2表示传统解码装置的框图。
图3表示用于解释本发明的基本概念的流程图。
图4表示根据本发明的编码装置的框图。
图5表示根据本发明的解码装置的框图。
图6表示用于解释使用解码装置产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理的例子的流程图。
图7表示用于解释频谱SP和功率补偿频谱PCSP的合成处理的例子的流程图。
图8表示用于解释合成频谱SP和功率补偿频谱PCSP的处理的另一个例子的流程图。
图9表示用于解释产生功率补偿频谱PCSP和对所述功率补偿频谱PCSP的功率调整的处理,以及频谱SP和功率补偿频谱PCSP的合成处理的一个特定例子的图像。
图10A表示原始声音的频谱,图10B表示在经过传统编码之后的频谱,图10C表示在采用本发明使用功率补偿频谱PCSP经过合成处理之后的频谱。
具体实施方式
本发明将结合附图在下面对实现本发明的最佳模式进行进一步的描述。本发明适合下面用于高效率地编码音频信号的数字数据,以便发送如此编码的数据或将如此编码的数据记录到记录介质的编码方法和装置的实施例,以及用于接收或重放编码的数据以便对如此接收或重放的编码的数据进行解码的解码方法和装置的实施例。
图3表示用于解释本发明的基本概念的流程图。首先,在步骤S1中,对频谱SP进行解码。频谱SP可以包括由于当提高压缩比率时由于频谱的损失引起的临时的频带变化所产生的反常声音和噪声,以及功率匮乏。
然后,在步骤S2,产生了功率补偿频谱PCSP。然后,在步骤S3,将频谱SP和功率补偿频谱PCSP合成在一起以产生合成的频谱信号。
即,根据本发明的编码方法和装置、解码方法和装置,产生功率补偿频谱PCSP以便和频谱SP合成在一起。结果,如果提高压缩比率,也能够令人满意地去除由于临时的频带变化产生的反常声音和噪声,以及功率匮乏。
图4表示根据本发明的编码装置10的框图。如图4所示,频带划分单元11接收将要编码的音频信号,并使用QMF(正交镜象滤波器)、PQF(多相正交滤波器)等,将如此接收的音频信号划分为例如四个频带。当使用频带划分单元11将音频信号划分为多个频带时,相应频带(在下面全指编码单元)的宽度根据临界频带可以是互相相等或不相等。在本实施例中,音频信号被划分为四个编码单元,而编码单元的数量并不限定于这个数字。然后,频带划分单元11将划分为四个编码单元(在下面全指第一到第四编码单元)的音频信号发送到相应于相应预定时间块(帧)增益控制单元121到124。
增益控制单元121到124根据在相应块中的相应信号的振幅产生增益控制信息,并基于所述增益控制信息控制在相应块中的增益。然后,增益控制单元121到124将通过增益控制获得的第一到第四编码单元的信号发送到频谱转换单元141到144,同时将增益控制信息发送到增益控制信息编码单元13。
增益控制信息编码单元13对从增益控制单元121到124发送的增益控制信息进行编码,并将如此编码的数据发送到多路复用器22。在编码增益控制信息中,能够使用本发明的发明者建议的在日本专利申请No.2001-182093的说明书和附图中的技术。即,增益控制信息的编码效率能够通过使用利用相邻编码单元之间的各种相互关系的可变代码字长度编码来改善。
频谱转换单元141到144对从增益控制单元121到124发送的时基信号执行例如MDCT(改进的离散余弦变换)的频谱转换以产生频基频谱SP,并且将如此产生的频谱SP分别发送到归一化单元151到154和量化准确度确定单元19。
归一化单元151到154从构成第一到第四编码单元的相应谱SP的相应信号分量中提取最大绝对值的信号分量,并将相应于如此提取的信号分量的系数设置为第一到第四编码单元的归一化系数。然后,归一化单元151到154使用相应于第一到第四编码单元的归一化系数的值,对构成第一到第四编码单元的相应频谱SP的相应信号分量进行归一化或划分。因此,在这种情况下,通过归一化所获得的归一化的数据范围从-1.0到1.0。归一化单元151到154将第一到第四编码单元的归一化的数据分别发送到功率调整信息确定单元171到174和量化单元201到204,同时将第一到第四编码单元的归一化系数发送到归一化系数编码单元16。
归一化系数编码单元16对从归一化单元151到154发送的归一化系数进行编码,并将如此编码的数据发送到多路复用器22。在编码归一化系数中,能够使用本发明的发明者建议的在日本专利申请No.2000-390598和日本专利申请No.2001-182093的说明书和附图中的技术。即,归一化系数的编码效率能够通过使用利用相邻编码单元之间、相邻信道之间、相邻时间期间之间等的各种相互关系的可变代码字长度编码来改善,或通过量化草图(roughsketch)信息并对作为结果的量化误差执行可变代码字长度编码来改善。
功率调整信息确定单元171到174确定将在稍后描述的功率调整信息,以调整在解码侧的功率补偿频谱PCSP的功率。如果在频谱中存在缺失的部分或在原始声音状态中存在被设置为“0”值的部分,当频谱SP在解码侧与功率补偿频谱PCSP合成在一起时,频谱不期望地出现在原本不存在频谱的部分。特别是音调类型的信号时,希望功率补偿频谱PCSP的补偿量很小。
如果在频谱中存在缺失的部分或在例如其音调高于预定值的音调类型的信号的原始声音状态中存在被设置为“0”值的部分,功率补偿频谱PCSP压缩到一个很小的值或设置为“0”。另一方面,如果原始声音的频谱是噪声类型,例如其音调低于一个预定值的噪声类型的信号,功率补偿频谱PCSP被扩大为一个很大的值。因此,基于输入信号的音调来确定功率调整信息,并且在编码侧控制功率补偿频谱PCSP的功率。
有多种使用功率调整信息对功率补偿频谱PCSP的控制方法和控制宽度。如果功率补偿频谱PCSP用“1”位来表示,功率补偿频谱PCSP的功率能够以这样的方式来控制,即如果是音调类型的信号则不控制功率,如果是噪声类型的信号则控制功率。另一方面,如果功率调整信息用4个位来表示,功率补偿频谱PCSP的功率能够以这样的方式来控制,即如果功率调整是“0”则功率补偿频谱PCSP的功率被设置为“0”,如果功率调整不是“0”则功率补偿频谱PCSP的功率用“1”dB步距调整15dB宽度。
功率调整信息编码单元18对从功率调整信息确定单元171到174发送的功率调整信息进行编码,并将如此编码的数据发送到多路复用器22。由于功率补偿频谱PCSP的产生和合成是在相应的编码单元中执行的,功率调整信息可以在相应编码单元中编码。编码单元将在稍后描述。另一方面,功率调整信息可以在多个编码单元被加在一起(put together)的分组的(grouped)频带中进行编码。这是基于这样的事实:一般来说,信号音调在狭窄频带中的变化不大,以及在很多情况下在集合的频带中能够共享相同值的音调。
由于人类听觉对低频信号敏感,希望功率补偿频谱PCSP对频谱SP的功率补偿量最小化,或者在低频带(例如,350Hz或更低)根本不要执行功率补偿。如果在低于预定频率的频带中不执行功率补偿频谱PCSP对频谱SP的功率补偿,则不需要对相应于所述频带的功率调整信息进行编码。
量化准确度确定单元19基于从频谱转换单元141到144发送的第一到第四编码单元的频谱SP,确定将在对第一到第四编码单元的归一化的数据进行量化中使用的量化步骤。然后,量化准确度确定单元19相应于量化步骤将第一到第四编码单元的量化准确度信息发送到量化单元201到204和重化准确度信息编码单元21。
量化单元201到204通过使用相应于第一到第四编码单元的量化准确度信息的量化步骤来量化所述信息,以便对第一到第四编码单元的归一化的数据进行编码,并将如此获得的第一到第四编码单元的量化系数发送到多路复用器22。
量化准确度信息编码单元21对从量化准确度确定单元19发送的量化准确度信息进行编码,并将如此编码的数据发送到多路复用器22。而且,在编码量化准确度信息中,能够使用在日本专利申请No.2000-390598和日本专利申请No.2001-182093的说明书和附图中建议的技术。
多路复用器22对第一到第四编码单元的量化系数和增益控制信息、量化准确度信息、归一化信息、和功率调整信息一起进行多路复用。然后,多路复用器22经由传输线路发送通过多路复用处理获得的编码的数据,或将编码的数据记录到未示出的记录介质。
如以上所述,编码装置10根据本发明产生功率调整信息,以调整将要在解码侧与频谱SP合成在一起的功率补偿频谱PCSP的功率,并对功率调整信息和频谱SP一起进行编码,然后经由传输线路发送如此编码的数据,或将编码的数据记录到未示出的记录介质出。
图5表示根据本发明的用于对从编码装置10输出的编码的数据进行解码的解码装置30的框图。在图5中所示的解码装置30中,多路分配器31将输入的编码的数据多路分解为量化系数、编码的量化准确度信息数据、编码的归一化信息数据、编码的增益控制信息数据、和第一到第四编码单元的编码的功率调整信息数据。然后,多路分配器31相应于相应的编码单元将第一到第四编码单元的量化系数发送到信号分量构成单元342到344。而且,多路分配器31将编码的量化准确度信息数据、编码的归一化信息数据、编码的增益控制信息数据、和编码的第一到第四编码单元的功率调整信息数据,分别发送到量化准确度信息解码单元32、归一化信息解码单元33、增益控制信息解码单元35、和功率调整信息解码单元36。
量化准确度信息解码单元32对编码的量化准确度信息数据进行解码,并相应于相应的编码单元将如此解码的量化准确度信息发送到信号分量构成单元341到344以及功率补偿频谱产生/合成单元371到374。
归一化信息解码单元33对编码的归一化信息数据进行解码,并相应于相应的编码单元将如此解码的归一化系数发送到信号分量构成单元341到344以及功率补偿频谱产生/合成单元371到374。
信号分量构成单元341使用相应于第一编码单元的量化准确度信息的量化步骤对第一编码单元的量化系数进行解量化(dequantize)。此外,信号分量构成单元341通过将第一编码单元的归一化的数据乘以一个相应于第一编码单元的归一化信息的值来对所述数据进行解码,并将如此获得的第一编码单元的频谱SP发送到功率补偿频谱产生/合成单元371。
信号分量构成单元342到344执行类似的解码处理以产生第二到第四编码单元的频谱SP,并将如此获得的第二到第四编码单元的频谱SP分别发送到功率补偿频谱产生/合成单元372到374。
增益控制信息解码单元35对编码的增益控制信息数据进行解码,并相应于相应的编码单元将如此解码的增益控制信息发送到功率补偿频谱产生/合成单元371到374以及增益控制单元391到394。
功率调整信息解码单元36对编码的功率调整信息数据进行解码,并相应于相应的编码单元将如此解码的功率调整信息发送到功率补偿频谱产生/合成单元371到374。
功率补偿频谱产生/合成单元371到374产生功率补偿频谱PCSP,并基于量化准确度信息、增益控制信息、和功率调整信息调整功率补偿频谱PCSP的功率。然后,功率补偿频谱产生/合成单元371到374将功率调整的功率补偿频谱PCSP和频谱SP合成在一起以补偿频谱SP的功率。将在稍后解释产生功率补偿频谱PCSP和将功率补偿频谱PCSP与频谱SP合成在一起的方法。
频谱反转换单元381到384对从功率补偿频谱产生/合成单元371到374发送的补偿了的频谱SP执行例如IMDCT(反向MDCT)的频谱反转换,以产生时基信号,并将如此产生的时基信号发送到增益控制单元391到394。
增益控制单元391到394基于从增益控制信息解码单元35发送的增益控制信息对第一到第四编码单元的信号执行增益控制补偿处理,并将如此获得的第一到第四编码单元的信号发送到频带合成单元40。
频带合成单元40执行频带合成,将从增益控制单元391到394发送的第一到第四编码单元的信号合成在一起,以恢复原始的音频信号。
如上面所述,根据本发明的解码装置30基于包括在编码的数据中的量化准确度信息、归一化系数、增益控制信息、和功率调整信息,调整功率补偿频谱PCSP的功率,然后将功率调整的功率补偿频谱PCSP和频谱SP合成在一起。因此,即使提高了压缩比率,也能够极大地减少由于临时的频带变化产生的反常声音和噪声,以及功率匮乏。
图6表示用于解释使用解码装置产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理的例子的流程图。首先,在步骤S10,从功率补偿频谱表产生功率补偿频谱PCSP。
功率补偿频谱表可以是例如高斯分布的随机数序列,或通过学习使用实际的各种噪声类型的频谱而准备的一序列数,等等。功率补偿频谱表并不局限于一个,并且可以是从提前准备的复数个功率补偿频谱表中选择的。
当产生功率补偿频谱PCSP时,相应于在编码单元中的频谱的数量的值是从功率补偿频谱表中参考的。在这种情况下,由于在时间上连续地参考表的同一个点会引起听觉上的反作用,所以是在时间上随机地对表进行选择。特别的,可以使用一个随机函数来随机地选择数值。另一方面,使得防止每次都产生同一个功率补偿频谱PCSP,希望使用例如归一化系数、量化准确度信息等使得能够在时间上是随机状态的其它参数来随机地选择数值。因此,同样的功率补偿频谱PCSP能够从同一个代码序列中获得而不管解码装置为何。
在下面解释中,作为这样参数的例子,使用将归一化系数的全部索引值(index value)相加的一个值。当功率补偿频谱表的大小是1024并且如果归一化系数的相加的值超过了1024时,使用它的低10位值。
而且,如果在编码单元中的频谱的数量是16,则在接下来的编码单元中不参考在相应编码单元中的同一个点,应所述参考从最初的参考点移动16的点,以防止同一个点被连续地参考。
然后,在步骤S11,基于归一化系数调整功率补偿频谱PCSP的功率。特别地,功率补偿频谱PCSP的最大功率值被调整为归一化系数。
然后,在步骤S12,基于量化准确度信息的值调整功率补偿频谱PCSP的功率。在这个处理中,调整功率补偿频谱PCSP的功率以便在量化准确度高时几乎不执行功率补偿频谱PCSP的补偿,而在量化准确度低时主动地执行功率补偿频谱PCSP的补偿。特别地,功率补偿频谱PCSP可以除以(dividedby)量化准确度信息的值,或者除以量化准确度信息的值的2次方。
然后,在步骤S13,基于功率调整信息的值调整功率补偿频谱PCSP的功率。这个过程是为了防止频谱出现在最初不存在频谱的部分,其中所述频谱是在频谱中存在缺失部分以及没有执行编码或在原始声音状态中被设置为“0”值的部分,通过合成功率补偿频谱PCSP而产生的。
然后,在步骤S14,判断是否存在增益控制信息。在步骤S14,如果存在增益控制信息(是),处理转到步骤S15,而如果不存在增益控制信息(否),结束产生功率补偿频谱PCSP的处理和对功率补偿频谱PCSP的功率调整。
然后,在步骤S15,基于增益控制信息的值调整功率补偿频谱PCSP的功率。这个处理是为了防止功率补偿频谱PCSP的功率补偿量过多,这是在如果在增益控制下频谱的增益被提升(lift),当功率补偿频谱PCSP的增益同时被提升时所引起的。特别地,例如,功率补偿频谱PCSP被除以增益控制信息的最大值。
因此,执行了产生功率补偿频谱PCSP的处理和对功率补偿频谱PCSP的功率调整。在这个处理中,为频谱SP编码的值被用于归一化系数、量化准确度信息、和增益控制信息,并且不需要特别为功率补偿频谱PCSP编码其它的归一化系数,等。
然后,如此功率调整的功率补偿频谱PCSP与频谱SP合成在一起。图7表示用于解释频谱SP和功率补偿频谱PCSP的合成处理的例子的流程图。首先,在步骤S20,计数器的值“i”表示频谱的数量被复位为“0”。
然后,在步骤S21,判断第i个频谱SP[i]等于或小于阈值“Th”。在步骤S21,如果频谱SP[i]等于或小于阈值“Th”(是),处理转到步骤S22,而如果SP[i]大于阈值“Th”(否),处理转到步骤S23。
在步骤S22,频谱SP[i]被替代为第i个功率补偿频谱PCSP[i],并且处理转到步骤S23。
在步骤S23,计数器的值“i”增加“1”以前进到下一个频谱。
然后,在步骤24,判断是否计数器的值“i”达到了在编码单元中频谱的数量。在步骤S24,如果计数器的值“i”达到了在编码单元中频谱的数量(是),则结束合成处理。另一方面,如果计数器的值“i”没达到在编码单元中频谱的数量(否),处理回到步骤S21,继续合成处理。
因此,通过将等于或小于阈值“Th”的频谱SP替代为功率补偿频谱PCSP来将频谱SP与功率补偿频谱PCSP合成在一起。
将频谱SP与功率补偿频谱PCSP合成的处理并不局限于这个例子。还可以有另一个例子,在其处理中,阈值“Th”被设置为“0”,只有在频谱SP为“0”时将频谱SP替代为功率补偿频谱PCSP。
此外,还可以有另一个例子,在其处理中,没有固定的阈值“Th”,整个频谱信号SP加入了功率补偿频谱PCSP。图8表示用于解释将功率补偿频谱PCSP加入到整个频谱信号SP中的例子的流程图。首先,在步骤S30,计数器的值“i”表示频谱的数量被复位为“0”。
然后,在步骤S31,功率补偿频谱PCSP[i]被加入到频谱SP[i]。然后,在步骤S32,计数器的值“i”增加“1”。
然后,在步骤S33,判断是否计数器的值“i”达到了在编码单元中频谱的数量。在步骤S33,如果计数器的值“i”达到了在编码单元中频谱的数量(是),则结束合成处理。另一方面,如果计数器的值“i”没达到在编码单元中频谱的数量(否),处理回到步骤S31,继续合成处理。
图9表示用于解释产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理,以及频谱SP和功率补偿频谱PCSP的合成处理的一个特定例子的图像。在这个特定例子中,假设在功率补偿频谱表中的项目数量是1024,而在编码单元中的频谱数量是8。在图9中,使用图8中所述的将功率补偿频谱PCSP加入到整个频谱信号SP中的处理。
从归一化系数的索引值的相加值中检测参考功率补偿频谱表的点。即使在这个例子中归一化系数的索引值的和是1026,由于功率补偿频谱表的项目数量是1024,所以使用其低10位的值。即,参考点的值是2。因此,选择功率补偿频谱表的第三到第十个值的八个值,功率补偿频谱PCSP的值变为{-0.223,0.647,0.115,0.925,-0.254,0.247,-0.872,-0.242}。
接下来,基于归一化系数调整功率补偿频谱PCSP的功率。特别地,通过将功率补偿频谱PCSP的值乘以归一化系数来调整功率。由于归一化系数是12000,功率补偿频谱PCSP的值变为{-2676,7764,1380,11100,-3048,2964,-10464,-2904}。
接下来,基于量化准确度信息的值调整功率补偿频谱PCSP的功率。特别地,通过将功率补偿频谱PCSP的值除以量化准确度信息的值来调整功率。由于量化准确度信息的值是6,功率补偿频谱PCSP的值变为{-446,1294,230,1850,-508,494,-1744,-484}。
接下来,基于功率调整信息的值调整功率补偿频谱PCSP的功率。特别地,通过将功率补偿频谱PCSP的值提升((功率调整信息值-9)×2)dB来调整功率。如果功率调整信息值是“0”,提升值是-∞dB,由于功率调整信息的值是3,执行提升-12dB的操作,而功率补偿频谱PCSP的值变为{-112,324,58,463,-127,124,-436,-121}。
接下来,基于增益控制信息的值调整功率补偿频谱PCSP的功率。特别地,通过将功率补偿频谱PCSP的值除以增益控制信息的值的2次方来调整功率。由于增益控制信息的值是3,执行除以2的操作,而功率补偿频谱PCSP的值变为{-56,162,29,232,-64,62,-218,-61}。
然后,通过将如此产生的功率补偿频谱PCSP加入到频谱SP来获得最后合成的频谱。由于频谱SP的值是{12000,0,-800,0,9600,0,0,-3200},通过将产生的功率补偿频谱PCSP的值加入到频谱SP的值,能够获得值为{11944,162,-771,232,9536,62,-218,-3261}的合成的频谱。
图10A到图10C表示实际频谱的图像。图10A表示原始声音的频谱,图10B表示在经过传统编码之后的频谱,图10C表示在采用本发明使用功率补偿频谱PCSP经过合成处理之后的频谱。从这些图像,如图10B所示在频谱中相应于箭头存在缺失的部分,而如图10C所示这些部分与功率补偿频谱PCSP合成以抑制功率的匮乏。
如上所述的,根据本发明的编码方法和装置、解码方法和装置,功率补偿频谱PCSP与频谱SP合成在一起。因此,即使提高了压缩比率,也能够极大地减少由于临时的频带变化产生的反常声音和噪声以及功率匮乏,因而改善了听觉质量。
本发明并不局限于上述实施例,在不脱离本发明的范围和精神的情况下能够实行各种修改、变化组织或等同物。
例如,使用硬件配置解释上述实施例。另一方面,本发明并不局限于所述配置,使用计算机程序任意处理都可以由CPU(中央处理器)运行。在这种情况下,计算机程序可以由一个记录介质提供,或可以通过互联网或其它传输媒介来提供。
尽管本发明依照其在附图中展示的和在以上描述中具体讲述的特定优选实施例进行了描述,本领域的技术人员应当理解本发明并不限制于所述实施例,在不脱离权利要求所阐述和定义的本发明的范围和精神的情况下能够实行各种修改、变化组织或等同物。
本发明的工业应用性说明如下:
如上所述,根据本发明,编码侧产生功率调整信息以调整将在解码侧与频谱合成在一起的功率补偿频谱的功率,并对功率调整信息和所述频谱一起进行编码。解码侧使用功率调整信息调整功率补偿频谱的功率,并将功率调整后的功率补偿频谱与所述频谱合成在一起。因此,即使提高了压缩比率,也能够极大地减少由于临时的频带变化产生的反常声音和噪声以及功率匮乏,因而改善了听觉质量。
Claims (26)
1.一种解码方法,用于对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码,包括:
频谱解码步骤,基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码;
功率补偿频谱产生步骤,产生功率补偿频谱;
功率调整步骤,基于解码的量化准确度信息调整所述功率补偿频谱的功率;以及
合成步骤,将解码的频谱和在功率调整步骤中调整的功率补偿频谱组合在一起。
2.权利要求1所述的解码方法,其中,在功率补偿频谱产生步骤,通过参考从预定频谱模式产生的一个表中的值,产生功率补偿频谱。
3.权利要求2所述的解码方法,其中,在功率补偿频谱产生步骤,基于在编码所述频谱中使用的数据来确定参考所述表的值的点。
4.权利要求3所述的解码方法,其中在编码所述频谱中使用的数据是归一化系数。
5.权利要求3所述的解码方法,其中在编码所述频谱中使用的数据是量化准确度信息。
6.权利要求1所述的解码方法,其中,在功率补偿频谱产生步骤,使用随机数序列产生功率补偿频谱。
7.权利要求6所述的解码方法,其中所述随机数序列是高斯分布。
8.权利要求1所述的解码方法,其中,在功率调整步骤,还基于在解码所述频谱中使用的归一化系数调整功率补偿频谱的功率。
9.权利要求1所述的解码方法,其中,在功率调整步骤,还基于已经在编码所述频谱过程中被编码的功率调整信息调整功率补偿频谱的功率。
10.权利要求1所述的解码方法,其中,在合成步骤,将所述频谱和功率补偿频谱相加。
11.权利要求1所述的解码方法,其中,在合成步骤,至少所述频谱的一部分被替代为功率补偿频谱。
12.权利要求1所述的解码方法,其中,在合成步骤,将等于或小于预定值的频谱和功率补偿频谱组合在一起。
13.一种解码装置,用于对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码,包括:
解码装置,用于基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码;
功率补偿频谱产生装置,用于产生功率补偿频谱;
功率调整装置,用于基于解码的量化准确度信息调整所述功率补偿频谱的功率;以及
合成装置,用于将解码的频谱在功率调整装置中调整的功率补偿频谱组合在一起。
14.权利要求13所述的解码装置,其中功率补偿频谱产生装置通过参考从预定频谱模式产生的一个表中的值,产生功率补偿频谱。
15.权利要求14所述的解码装置,其中功率补偿频谱产生装置基于在编码所述频谱中使用的数据来确定参考所述表的值的点。
16.权利要求15所述的解码装置,其中在编码所述频谱中使用的数据是归一化系数。
17.权利要求16所述的解码装置,其中在编码所述频谱中使用的数据是量化准确度信息。
18.权利要求13所述的解码装置,其中功率补偿频谱产生装置使用随机数序列产生功率补偿频谱。
19.权利要求18所述的解码装置,其中所述随机数序列是高斯分布。
20.权利要求13所述的解码装置,其中功率调整装置还基于在解码所述频谱中使用的归一化系数调整功率补偿频谱的功率。
21.权利要求13所述的解码装置,其中功率调整装置还基于在编码所述频谱中已经被编码的功率调整信息调整功率补偿频谱的功率。
22.权利要求13所述的解码装置,其中合成装置将所述频谱和功率补偿频谱相加。
23.权利要求13所述的解码装置,其中合成装置将至少所述频谱的一部分替代为功率补偿频谱。
24.权利要求13所述的解码装置,其中合成装置将等于或小于预定值的频谱和功率补偿频谱合成在一起。
25.一种程序,用于使计算机运行对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码的解码处理,包括:
频谱解码步骤,基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码;
功率补偿频谱产生步骤,产生功率补偿频谱;
功率调整步骤,基于解码的量化准确度信息调整所述功率补偿频谱的功率;以及
合成步骤,将解码的频谱和在功率调整步骤中调整的功率补偿频谱组合在一起。
26.一种记录介质,其中记录有能够被计算机读出的程序,该程序使计算机运行对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码的解码处理,包括:
频谱解码步骤,基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码;
功率补偿频谱产生步骤,产生功率补偿频谱;
功率调整步骤,基于解码的量化准确度信息调整所述功率补偿频谱的功率;以及
合成步骤,将解码的频谱和在功率调整步骤中调整的功率补偿频谱组合在一起。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002132188A JP4296752B2 (ja) | 2002-05-07 | 2002-05-07 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
JP132188/2002 | 2002-05-07 | ||
JP132188/02 | 2002-05-07 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038006200A Division CN1256715C (zh) | 2002-05-07 | 2003-04-30 | 编码方法、编码装置、解码方法、和解码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1629936A true CN1629936A (zh) | 2005-06-22 |
CN1302458C CN1302458C (zh) | 2007-02-28 |
Family
ID=29416630
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004101000522A Expired - Fee Related CN1302458C (zh) | 2002-05-07 | 2003-04-30 | 解码方法和解码装置 |
CNB038006200A Expired - Fee Related CN1256715C (zh) | 2002-05-07 | 2003-04-30 | 编码方法、编码装置、解码方法、和解码装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038006200A Expired - Fee Related CN1256715C (zh) | 2002-05-07 | 2003-04-30 | 编码方法、编码装置、解码方法、和解码装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7428489B2 (zh) |
EP (1) | EP1503370B1 (zh) |
JP (1) | JP4296752B2 (zh) |
KR (1) | KR100941011B1 (zh) |
CN (2) | CN1302458C (zh) |
DE (1) | DE60331729D1 (zh) |
WO (1) | WO2003096325A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101149926B (zh) * | 2006-09-20 | 2011-06-15 | 富士通株式会社 | 音频信号插补方法及装置 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4734859B2 (ja) * | 2004-06-28 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8577686B2 (en) * | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1946297B1 (en) * | 2005-09-14 | 2017-03-08 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR100785471B1 (ko) * | 2006-01-06 | 2007-12-13 | 와이더댄 주식회사 | 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 |
WO2007083959A1 (en) * | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
KR101366291B1 (ko) * | 2006-01-19 | 2014-02-21 | 엘지전자 주식회사 | 신호 디코딩 방법 및 장치 |
CN104681030B (zh) | 2006-02-07 | 2018-02-27 | Lg电子株式会社 | 用于编码/解码信号的装置和方法 |
KR20080093422A (ko) * | 2006-02-09 | 2008-10-21 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치 |
TWI336599B (en) * | 2006-02-23 | 2011-01-21 | Lg Electronics Inc | Method and apparatus for processing a audio signal |
WO2007114594A1 (en) * | 2006-03-30 | 2007-10-11 | Lg Electronics, Inc. | Apparatus for processing media signal and method thereof |
EP1870880B1 (en) | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
JP4993992B2 (ja) * | 2006-10-04 | 2012-08-08 | シャープ株式会社 | 信号処理方法、信号処理装置及びプログラム |
JP5189760B2 (ja) * | 2006-12-15 | 2013-04-24 | シャープ株式会社 | 信号処理方法、信号処理装置及びプログラム |
JP5045295B2 (ja) * | 2007-07-30 | 2012-10-10 | ソニー株式会社 | 信号処理装置及び方法、並びにプログラム |
JP5098492B2 (ja) * | 2007-07-30 | 2012-12-12 | ソニー株式会社 | 信号処理装置及び信号処理方法、並びにプログラム |
US8386266B2 (en) | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP2012103395A (ja) * | 2010-11-09 | 2012-05-31 | Sony Corp | 符号化装置、符号化方法、およびプログラム |
KR102023138B1 (ko) * | 2013-12-02 | 2019-09-19 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
EP3288031A1 (en) * | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
JP2841797B2 (ja) * | 1990-09-07 | 1998-12-24 | 三菱電機株式会社 | 音声分析・合成装置 |
JP3153933B2 (ja) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
JPH06202695A (ja) * | 1993-01-07 | 1994-07-22 | Sony Corp | 音声信号処理装置 |
US5731767A (en) * | 1994-02-04 | 1998-03-24 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method |
JP3341440B2 (ja) * | 1994-02-04 | 2002-11-05 | ソニー株式会社 | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
PL311812A1 (en) * | 1994-04-01 | 1996-03-18 | Sony Corp | Method of and apparatus for encoding information, method of and apparatus fro decoding information, method of transmitting information and information recording medium |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JPH08223049A (ja) * | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
JPH0946233A (ja) * | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | 音声符号化方法とその装置、音声復号方法とその装置 |
US5822360A (en) * | 1995-09-06 | 1998-10-13 | Solana Technology Development Corporation | Method and apparatus for transporting auxiliary data in audio signals |
JP3519859B2 (ja) * | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
US5848155A (en) * | 1996-09-04 | 1998-12-08 | Nec Research Institute, Inc. | Spread spectrum watermark for embedded signalling |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
JPH1185195A (ja) * | 1997-09-11 | 1999-03-30 | Sharp Corp | ディジタルデータの符号化方法 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP4274614B2 (ja) | 1999-03-09 | 2009-06-10 | パナソニック株式会社 | オーディオ信号復号方法 |
JP3404350B2 (ja) * | 2000-03-06 | 2003-05-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ取得方法、音声復号方法及び装置 |
EP1503371B1 (en) | 2000-06-14 | 2006-08-16 | Kabushiki Kaisha Kenwood | Frequency interpolating device and frequency interpolating method |
FR2815492B1 (fr) * | 2000-10-13 | 2003-02-14 | Thomson Csf | Systeme et procede de radiodiffusion assurant une continuite de service |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
US7016502B2 (en) * | 2000-12-22 | 2006-03-21 | Sony Corporation | Encoder and decoder |
WO2002103683A1 (fr) * | 2001-06-15 | 2002-12-27 | Sony Corporation | Appareil et procede de codage |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
-
2002
- 2002-05-07 JP JP2002132188A patent/JP4296752B2/ja not_active Expired - Fee Related
-
2003
- 2003-04-30 CN CNB2004101000522A patent/CN1302458C/zh not_active Expired - Fee Related
- 2003-04-30 EP EP03725718A patent/EP1503370B1/en not_active Expired - Lifetime
- 2003-04-30 WO PCT/JP2003/005545 patent/WO2003096325A1/ja active Application Filing
- 2003-04-30 CN CNB038006200A patent/CN1256715C/zh not_active Expired - Fee Related
- 2003-04-30 US US10/483,088 patent/US7428489B2/en active Active
- 2003-04-30 DE DE60331729T patent/DE60331729D1/de not_active Expired - Lifetime
- 2003-04-30 KR KR1020047000175A patent/KR100941011B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101149926B (zh) * | 2006-09-20 | 2011-06-15 | 富士通株式会社 | 音频信号插补方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
KR100941011B1 (ko) | 2010-02-05 |
KR20040101180A (ko) | 2004-12-02 |
EP1503370B1 (en) | 2010-03-17 |
US7428489B2 (en) | 2008-09-23 |
DE60331729D1 (de) | 2010-04-29 |
EP1503370A4 (en) | 2007-08-22 |
US20040196770A1 (en) | 2004-10-07 |
CN1256715C (zh) | 2006-05-17 |
JP4296752B2 (ja) | 2009-07-15 |
JP2003323198A (ja) | 2003-11-14 |
CN1302458C (zh) | 2007-02-28 |
WO2003096325A1 (en) | 2003-11-20 |
EP1503370A1 (en) | 2005-02-02 |
CN1524261A (zh) | 2004-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1302458C (zh) | 解码方法和解码装置 | |
CN1065381C (zh) | 数字音频信号编码和/或译码方法 | |
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
CN1281006C (zh) | 信息编码/译码方法和装置和信息传输方法 | |
CN1030129C (zh) | 高效数字数据编码和译码装置 | |
CN1183685C (zh) | 用于熵编码信号量化变换系数的系统和方法 | |
CN1662958A (zh) | 使用频谱孔填充的音频编码系统 | |
CN1217502C (zh) | 音频信号的编码装置、解码装置及编码方法和解码方法 | |
CN1101087C (zh) | 信号编码方法及装置、信号解码方法及装置和信号传送方法 | |
CN1144179C (zh) | 声音信号解码方法和装置、声音信号编码方法和装置 | |
CN1103141C (zh) | 信息编码方法和设备、信息解码方法和设备、信息传输方法 | |
CN1910655A (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
CN1675683A (zh) | 用于可扩缩编码的设备及方法和用于可扩缩解码的设备及方法 | |
CN1237506C (zh) | 音响信号编码方法及设备、音响信号解码方法及设备 | |
JP2003216190A (ja) | 符号化装置および復号化装置 | |
CN1816847A (zh) | 保真度优化的可变帧长编码 | |
JP2005338637A (ja) | オーディオ信号符号化装置及び方法 | |
CN1106967A (zh) | 数字声频信号低比特率编译码器、和编译码方法及其编码记录媒体 | |
CN1787383A (zh) | 变换、编码、逆变换和解码音频信号的方法和设备 | |
CN101031961A (zh) | 对编码信号进行处理 | |
CN1524348A (zh) | 编码方法和装置以及解码方法和装置 | |
CN1849648A (zh) | 编码装置和译码装置 | |
CN1677491A (zh) | 一种增强音频编解码装置及方法 | |
CN1476673A (zh) | 编码方法和设备以及解码方法和设备 | |
JP4297078B2 (ja) | 復号方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070228 Termination date: 20150430 |
|
EXPY | Termination of patent right or utility model |