CN1209744C - 编码装置和解码装置 - Google Patents

编码装置和解码装置 Download PDF

Info

Publication number
CN1209744C
CN1209744C CN02803419.8A CN02803419A CN1209744C CN 1209744 C CN1209744 C CN 1209744C CN 02803419 A CN02803419 A CN 02803419A CN 1209744 C CN1209744 C CN 1209744C
Authority
CN
China
Prior art keywords
frequency spectrum
window
unit
data
hfs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN02803419.8A
Other languages
English (en)
Other versions
CN1484822A (zh
Inventor
西尾孝祐
则松武志
津岛峰生
田中直也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2001337869A external-priority patent/JP3923783B2/ja
Priority claimed from JP2001381807A external-priority patent/JP3984468B2/ja
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1484822A publication Critical patent/CN1484822A/zh
Application granted granted Critical
Publication of CN1209744C publication Critical patent/CN1209744C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种编码装置(100),包括:变换单元(120),用于以预定的时间间隔提取一部分输入的音频信号,并变换所提取的每个部分以产生由短块组成的多个窗口;判断单元(137)用于将窗口频谱相互比较以判断是否存在预定程度的相似性,当存在相似性时将所产生的窗口中的一第一窗口的高频部分替换为值“0”;其中该第一窗口和同样是所产生的窗口之一的一第二窗口共用第二窗口的高频部分;第一量化单元(131)用于在替换操作之后量化所产生的窗口,第一编码单元(132)用于编码量化的窗口以产生编码数据;和流输出单元(140),用于输出所产生的编码数据。

Description

编码装置和解码装置
技术领域
本发明涉及用于编码和解码数字音频数据的技术。
背景技术
近年来,已开发出许多种音频压缩方法。MPEG-2的高级音频编码(MPEG-2 AAC)就是这些编码方法中的一种,MPEG-2 AAC在“ISO/IEC 13818-7(MPEG-2 Advanced Audio Coding,AAC)”中进行了详细的定义。
下面参照图1说明常规的编码和解码过程。图1是表示遵照MPEG-2 AAC的常规编码装置300和常规解码装置400的方框图。编码装置300根据MPEG-2 AAC接收并编码一音频信号,编码装置300包括一个音频信号输入单元310,一个变换单元320,一个量化单元331,一个编码单元332,和一个流输出单元340。
音频信号输入单元310接收以44.1kHz的取样频率取样而产生的数字音频数据。音频信号输入单元310从这个数字音频数据中提取连续的1024个取样。该1024个取样是一个编码单元并被称为一个帧。
变换单元320根据修正的离散余弦变换(MDCT)将提取的时域内的取样(以下称为“取样数据”)变换为频域内的包含1024个取样的频谱数据。然后这个频谱数据被分为许多个组,每个组都包含至少一个取样并模拟人类听觉的一个临界频带。每个这样的组被称为一个“比例因子频带”。
量化单元331接收来自变换单元320的频谱数据,并以对应于每个比例因子频带的一个归一化因子将其量化。该归一化因子被称为一个“比例因子”,通过该比例因子量化的每组频谱数据以下称为“量化数据”。
根据霍夫曼编码,编码单元332将量化数据和用于量化数据的每个比例因子进行编码。在编码比例因子之前,编码单元332为每个比例因子规定在两个连续的比例因子频带中的两个比例因子值的一个差值。然后编码单元332对每个规定的差值和在帧起始的比例因子频带中使用的一个比例因子进行编码。
流输出单元340接收来自编码单元332的编码信号,将其变换为MPEG-2 AAC比特流并输出。该比特流可以通过传输介质被传输至解码装置400,也可以记录在记录介质上,例如压缩光盘(CD)和数字通用光盘(DVD)这样的光盘,或半导体,硬盘等。
解码装置400用于将编码装置300编码的比特流进行解码,其包括一个流输入单元410,一个解码单元421,一个解量化单元422,一个逆变换单元430,和一个音频信号输出单元440。
流输入单元410通过一传输介质来接收编码装置300所编码的MPEG-2 AAC比特流,或从一记录介质重建比特流。然后流输入单元410从该比特流中提取编码信号。
解码单元421对提取的编码信号进行解码,该编码信号具有用于流的格式,以便产生量化数据。
解量化单元422对量化数据(当使用MPEG-2 AAC时为霍夫曼编码)解量化以产生频域内的频谱数据。
逆变换单元430将频谱数据变换为时域内的取样数据。对于MPEG-2 AAC,这种变换是根据反向的修正离散余弦变换(IMDCT)进行的。
音频信号输出单元440将逆变换单元430输出的取样数据组结合起来,并作为数字音频数据输出。
在MPEG-2 AAC中,由MDCT变换决定的取样数据的长度可根据输入的音频信号而改变。当将被执行MDCT的取样数据由256个取样构成时,该取样数据是基于短块块的。当将被执行MDCT的取样数据由2048个取样构成时,该取样数据是基于长块块的。该短块块和长块块表示一个音频块的大小。
当数字音频数据以44.1kHz的取样频率被取样且施加的是短块块块时,编码装置300从该取样音频数据中提取128个取样和两组64个取样,这两组64个取样是在紧接着该128个取样之前和之后获得的,也就是总计256个取样。这两组64个取样与另外两组紧接着当前128取样之前和之后提取的128个取样相重叠。所提取的音频数据根据MDCT变换为由256个取样构成的频谱数据,而其中只有一半,即128个取样被量化和编码。8个连续的窗口,其中每个都包含由128个取样构成的频谱数据,被当作由1024个取样构成的一个帧,这个帧是受随后处理支配的一个单元,所述处理包括量化和编码。
这样,基于一个短块的窗口包括128个取样而基于一个长块的窗口包括1024个取样。当由短块表示的22.05kHz再生频带的音频数据与由长块表示的相同音频数据相比较时,虽然由长块表示的音频数据由于使用了更多的取样来表示相同的音频数据,从而可以实现更好的声音品质,但由短块表示的音频数据即使对基于短周期的音频信号也具有较好的时间分辨率。也就是说,若一个窗口内的提取音频信号包含一个冲击脉冲(高幅值的尖脉冲),则其在长块中的破坏性远比在短块中更大,这是由于冲击脉冲可以影响基于长块的窗口内的多达1024个取样。而对于短块,冲击脉冲的破坏性被限制在由128个取样构成的一个窗口内,而其他窗口的频谱不会受冲击脉冲的影响,从而可实现原始声音的更准确的再现。
由编码装置300编码并被发送至解码装置400的音频数据的质量可以通过例如编码音频数据的一个再生频带被测量。当输入信号以例如44.1kHz的取样频率被取样时,该信号的一个再生频带为22.05kHz。当具有22.05kHz的再生频带或22.05kHz附近更宽的再生频带的音频信号被编码为无劣化的编码音频数据,且所有的编码音频数据都被传输至解码装置时,该音频数据可以被再现为高品质的声音。然而再生频带的宽度会影响频谱数据值的数目,进而影响用于传输的数据量。例如,当输入音频信号在44.1kHz的取样频率被取样时,由该信号产生的频谱数据由1024个取样构成,其具有22.05kHz的再生频带。为了保证22.05kHz的再生频带,该频谱数据的所有1024个取样都需要被传输。这就要求对音频信号的有效编码,从而将编码音频信号的比特量限制在传输信道的传输率范围内。
通过低速率的传输信道,例如手机,来传输多达1024个取样的频谱数据是不现实的。也就是说,当具有一个宽再生频带的所有频谱数据都以这样低的传输速率来传输,同时整个频谱数据的比特量都根据低传输速率而调整时,则分配给每个频带的数据的比特量将变得非常少。这将会加剧量化噪声效应,以致解码后声音品质下降。
为了避免这样的劣化,有许多种音频信号编码方法来实现有效的音频信号传输,其中包括MPEG-2 AAC,根据这些编码方法,每组频谱数据被分配以适当的权重,低权重的数值就不进行传输。通过这种方法,在对人类听觉很重要的低频带中的频谱数据被分配以足够的比特量,从而增强了其编码的精确度,同时高频带中的频谱数据被认为不太重要,往往不进行传送。
虽然在MPEG-2 AAC中使用了这样的技术,但是现在仍然需要实现高品质再现和更高压缩效率的音频编码技术。换句话说,对实现以低传输速率传送高频带和低频带的音频信号的技术的需求是不断增长的。
发明内容
考虑到上述问题,本发明的编码装置接收和编码音频信号,并包括:变换单元,用于以预定的时间间隔提取一部分接收的音频信号,并变换所提取的每个部分以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;判断单元用于将窗口频谱相互比较以判断在所比较的窗口频谱中是否存在预定程度的相似性;替换单元,用于当判断单元判断存在相似性时,将所产生的窗口频谱中的一第一窗口频谱的高频部分替换为一个预定值;其中该第一窗口频谱和同样是所产生的窗口频谱之一的一第二窗口频谱共用第二窗口频谱的高频部分;第一量化单元用于量化多个窗口频谱以在替换单元的操作之后产生多个量化的窗口频谱;第一编码单元用于编码量化的窗口频谱以产生第一编码数据;和输出单元用于输出所产生的第一编码数据。
由于上述在每个帧周期内由变换单元产生的由短块组成的多个窗口频谱,相邻的窗口频谱很可能彼此相似。当判断单元判断在第一和第二窗口频谱之间存在相似性时,第一窗口频谱的高频部分不进行量化和编码。而是将此高频部分由第二窗口频谱的高频部分来代表。更详细地,第一窗口频谱的高频部分被替换为预定值。当预定值使用的值例如为“0”时,此高频部分的量化和编码操作可被简化。并且,该高频部分的比特量可以被显著减少。
可与上述编码装置一起使用的解码装置,可接收和解码表示音频信号的编码数据。该编码数据包括一第一区域内的第一编码数据。该解码装置包括:第一解码单元,用于解码第一区域内的第一编码数据以产生第一解码数据;第一解量化单元,用于解量化第一解码数据以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;判断单元,用于(a)监视所产生的窗口频谱,从而找到其高频部分由预定值组成的一第一窗口频谱,(b)判断该第一窗口频谱的高频部分将由包含在多个窗口频谱中的一第二窗口频谱的高频部分来重建;第二解量化单元,用于(a)从第一解量化单元获得第二窗口频谱的高频部分,(b)复制所获得的高频部分,(c)将复制的高频部分与第一窗口频谱关联,(d)输出所复制的高频部分;和音频信号输出单元,用于(a)从第二解量化单元获得所复制的高频部分,并从第一解量化单元获得第一窗口频谱,(b)将第一窗口频谱的高频部分替换为复制的高频部分,(c)将包含替换高频部分的第一窗口频谱变换为时域内的音频信号,(d)输出该音频信号。
上述解码装置在每个帧周期内接收一个窗口频谱的至少一个高频部分,根据判断单元的判断而复制该高频部分,并使用复制的高频部分作为其他窗口频谱的一个高频部分。结果,本解码装置就能够以相对于常规解码装置更高的品质而再现高频带的声音。
这里,当编码装置的判断单元判断存在相似性时,替换单元还可将第一窗口频谱的一个低频部分替换为一个预定值。
当不同的窗口频谱彼此具有预定程度的相似性时,上述编码装置不仅将高频部分,还将其中一个窗口频谱的低频部分替换为一个预定值。当该预定值例如为“0”时,该替换部分的量化和编码操作被简化。并且,通过被替换为值“0”的低频部分和高频部分的比特量的减少,所得到的编码数据的比特量可被大大减少。
以下将说明与上述编码装置一起使用的解码装置。当找到由具有预定值的多个数据组构成的一个窗口频谱时,判断单元可判断所找到的窗口频谱的高频部分将由第二窗口频谱的高频部分来重建。根据判断单元的判断结果,第二解量化单元可从第一解量化单元获得包括高频和低频部分的整个第二窗口频谱,复制所获得的第二窗口频谱,将复制的第二窗口频谱与找到的窗口频谱关联,并输出复制的第二窗口频谱。音频信号输出单元可将找到的整个窗口频谱替换为复制的第二窗口频谱,将替换的窗口频谱变换为时域内的音频信号,并输出该音频信号。
在每个帧周期内,上述解码装置可接收至少一个包括高频和低频部分的窗口频谱,并根据判断单元的判断结果而复制接收的窗口频谱,以重建其他窗口频谱。由接收的高频部分,本解码装置就能够以相对于常规解码装置更高的品质而再现高频带的声音,虽然由于判断单元的判断所使用的预定标准,低频部分中可能会引入一定误差。
对于上述编码装置,多个窗口频谱中的每一个可能都由数据组构成。编码装置还可包括:第二量化单元,用于以一预定的归一化因子来量化输入到第一量化单元的每个窗口频谱内的一峰值附近的一定组的数据;其中在第二量化单元的量化之前,第一量化单元量化一定组的数据以产生具有一个预定值的多组量化数据;第二编码单元,用于编码多组量化数据以产生第二编码数据。输出单元可输出第二编码数据和第一编码数据。
当上述第一量化单元由一个窗口频谱内一峰值附近的一定组的数据产生具有相同预定值的多组量化数据时,第二量化单元使用一个预定的归一化因子来量化该一定组的数据。结果,第二量化单元产生了多组量化数据,这些量化数据的值是不连续的相同预定值。也就是说,第二量化单元的量化可校正由一个窗口频谱内一峰值附近的多组频谱数据所导致的误差。
这里,与上述编码装置一起使用的解码装置可以是这样。由解码装置接收的编码数据也包括第二编码数据,该数据是通过一预定的归一化因子量化一窗口频谱的一部分而产生的,该预定的归一化因子不同于第一编码数据中量化相同的窗口频谱所使用的归一化因子。解码装置还可包括:第二分离单元,用于从接收的编码数据的第二区域中分离出第二编码数据;第二解码单元,用于解码分离的第二编码数据以获得第二解码数据。第二解量化单元还可以(a)监视由第一解量化单元产生的多个窗口频谱,从而找到一个窗口频谱中连续包含预定值的一部分,(b)确定对应于找到部分并包含在第二解码数据中的一个部分,(c)使用该预定的归一化因子来解量化该确定的部分,以获得由多组数据构成的解量化部分。音频信号输出单元还可以(a)将第二解量化单元找到的部分替换为多组数据,(b)将包含多组频谱数据的窗口频谱变换为时域内的音频信号,(c)输出该音频信号。
当编码装置的第一量化单元由一个窗口频谱内一峰值附近的一定组的数据而产生具有相同预定值的量化数据组时,解码装置的第二解量化单元可粗略地重建该一定组的数据。也就是说,第二解量化单元校正了在窗口频谱的一峰值附近的多组频谱数据中导致的误差。从而,本解码装置能够比常规解码装置更准确地再现整个再生频带内窗口频谱的峰值附近的声音。
附图说明
图1是表示遵照常规MPEG-2 AAC的常规编码和解码装置的结构的方框图。
图2是表示本发明的编码装置和解码装置的结构的方框图。
图3A和3B表示图2中所示编码装置对音频信号进行变换的处理。
图4表示图2中所示判断单元如何判断较高频率频谱数据由其他频谱数据来代表的例子。
图5A,5B,5C表示由图3所示的流输出单元在在其中插入第二编码信号(共用信息)的一个比特流的数据结构。
图6A,6B,6C表示由流输出单元在其中插入第二编码信号的一个比特流的另一种数据结构。
图7是表示图2中所示第一量化单元为确定比例因子而执行的操作的流程图。
图8是表示判断单元在一帧内对共用频谱数据做出判断而执行的示例操作的流程图。
图9是表示图2中所示第二解量化单元为复制较高频率频谱数据而执行的示例操作的流程图。
图10表示作为判断单元为每个基于短块的窗口所产生的子信息(比例因子)的特定例子的频谱数据的波形图。
图11是表示判断单元为产生该子信息而执行的操作的流程图。
图12是表示本发明第二实施例的编码装置和解码装置的结构的方框图。
图13表示图12所示的判断单元如何判断频谱数据由其他频谱数据来代表的例子。
图14是表示本发明第三实施例的编码装置和解码装置的结构的方框图。
图15是表示第三实施例的编码装置和解码装置的其他结构的方框图。
图16是表示在本发明的编码装置和常规编码装置之间使用特定值的量化结果的差异的一个表格。
图17A,17B,17C表示编码装置如何校正峰值附近的量化数据中的误差的一个例子。
具体实施方式
第一实施例
以下具体说明了作为本发明实施例的编码装置100和解码装置200。图2是表示编码装置100和解码装置200的结构的方框图。
编码装置100
此编码装置100在传输之前有效地减少了编码的音频比特流的比特量。当本编码装置100和常规编码装置产生相同比特量的编码音频比特流时,本编码装置100产生的音频比特流可由解码装置200重建为比常规编码装置产生的音频比特流更高品质的音频信号。更具体的,编码装置100通过以下操作减少了编码音频比特流的比特量。对于短块,编码装置100共同传输8个块(即窗口),每个窗口由128个取样构成。当较高频带中不同组的频谱数据有两个或更多窗口相似时,编码装置100用其中一组频谱数据代表其他相似组的频谱数据以减少其比特量。以下,较高频带中的频谱数据被称为“较高频率频谱数据”。编码装置100包括音频信号输入单元110,变换单元120,第一量化单元131,第一编码单元132,第二编码单元134,判断单元137,和流输出单元140。
音频信号输入单元110接收数字音频数据,例如MPEG-2 AAC的数字音频数据。该数字音频数据以44.1kHz的取样频率被取样。音频信号输入单元110从该数字音频数据中,在大约2.9毫秒(msec)的周期内提取128个取样,并另外获得两组64个取样,其中一组紧接着所提取的128取样之前,另一组紧接在该128取样之后。这两组64个取样与另外两组128个取样相重合,该另外两组128取样是紧接在当前的128取样之前和之后提取的。从而,在一次提取中总共获得256个取样。(以下,由音频信号输入单元112这样获得的数字音频数据被称为“取样数据”。)
和常规技术一样,变换单元120将时域内的取样数据变换到频域内的频谱数据。根据MPEG-2 AAC,对由256个取样构成的取样数据执行MDCT,从而产生基于短块的由256个取样构成的频谱数据。作为MDCT变换结果而产生的频谱数据值的分布是对称的,从而256个取样中只有一半(即128个取样)被用作随后的操作。由128个取样组成的这种单元以下被称为一个窗口。8个窗口,即,1024个取样构成一个帧。
然后变换单元113将每个窗口内的频谱数据分为多个组,每个组都包括至少一个取样(或者,实际情况是,总数目为四的倍数的取样)。每个这样的组被称为一个比例因子频带。对于MPEG-2 AAC,一个帧中包含的比例因子频带的总数是基于块的尺寸和取样频率而定义的,包含在每个比例因子频带中的频谱数据的取样的数目也是基于该频率而定义的。在较低频带中的取样被更精细地分为多个包含更少取样的比例因子频带的组,而较高频带中的取样被更粗略地分为多个包含更多取样的比例因子频带的组。当使用短块和44.1kHz的取样频率时,每个窗口都包含14个比例因子频带,每个窗口中的128个取样代表一个22.05kHz的再生频带。
图3A和3B表示图2所示的编码装置100进行的音频信号变换的处理。图3A表示以短块为单位的由音频信号输入单元110提取的时域内取样数据的波形图。图3B表示对应于由变换单元120执行MDCT后的一个帧的频谱数据的波形图。该图的垂直和水平轴线分别表示频谱值和频率。虽然图3A和3B中是由模拟波形来表示取样数据和频谱数据的,实际上它们都是数字信号。这也适用于在随后的图中表示的波形。还应注意已经执行了MDCT的频谱数据,例如图3B所示,可以是负值,虽然为了便于说明图3B只表示出由正值构成的波形图。
如图3A所示,音频信号输入单元110接收数字音频信号,从该数字音频信号提取128个取样,并另外获得两组64个取样,其中一组紧接着所提取的128取样之前,另一组紧接在该128取样之后。这两组64取样与另外两组128取样相重合,该另外两组128取样是紧接在当前提取的128取样之前和之后提取的。从而音频信号输入单元110总共获得256个取样,并将它们作为取样数据输出到变换单元120。变换单元120根据MDCT对这些取样数据进行变换以产生由256个取样构成的频谱数据。由于根据MDCT进行变换的频谱数据形成了对称的频谱,因此只有256个取样的一半,即,128个取样在随后的操作中被处理。图3B表示以这种方式产生的频谱数据,其由对应于一个帧的8个窗口构成。每个窗口包括大约每2.9毫秒产生的128个取样。也就是说,图3B中每个窗口中的128个取样表示图3A中以电压表示的由128个取样构成的音频信号的频率成分的比特量(即大小)。
以下说明判断单元137对变换单元120输出的8个窗口的每一个中的频谱数据进行的判断。判断单元137判断一个窗口中较高频带中的频谱数据是否可以由另一个窗口中的另一个较高频率频谱数据来代表。当判断为是时,判断单元137将这两个窗口其中一个的较高频率频谱数据值变为“0”。该判断可以通过例如规定两个相邻窗口中的两组频谱数据之间的能量差异来进行。若规定的能量差异小于一个预定阈值,判断单元137就判断两个窗口其中一个的频谱数据可以由前述另一个窗口的另一组频谱数据来代表。之后,判断单元137为每个窗口产生一个标志,指示当前判断的窗口中的频谱数据是否可以由前述其他窗口的其他频谱数据来代表。然后判断单元137产生共用信息,该信息包括所产生的标志以表示哪个窗口可以与其它窗口共用频谱数据。
第一量化单元131接收来自判断单元137的频谱数据,并为每个比例因子频带确定一个比例因子。第一量化单元131然后通过使用一个确定的比例因子对每个比例因子频带中的频谱数据进行归一化和量化以产生量化数据,并将量化数据和使用的比例因子输出到第一编码单元132。更详细的,第一量化单元131为每个比例因子频带都确定一个适当的比例因子,从而使得到的编码帧具有在传输信道的传送速率范围内的比特量。
第一编码单元132接收量化数据的1024个取样和量化使用的比例因子,并根据霍夫曼编码对它们进行编码,以产生一预定流格式的第一编码信号。为了编码比例因子,第一编码单元132计算比例因子的值之间的差值,并对所计算的差值和一帧内第一比例因子频带中使用的一比例因子进行编码。
第二编码单元134接收来自判断单元137的共用信息,并对其进行霍夫曼编码以产生一预定流格式的第二编码信号。
流输出单元140接收来自第一编码单元132的第一编码信号,将报头(header)报头信息和其他必要的次级信息插入到第一编码信号中,并将其变换为MPEG-2 AAC的比特流。流输出单元140还接收来自第二编码单元134的第二编码信号,并将其放置在上述MPEG-2 AAC的比特流的一个区域,该区域或者可以被常规的解码装置忽略,或者对该区域不定义任何操作。特别的,该区域可以是填充部分(Fill Element)或数据流单元(DSE)。从编码装置100输出的比特流通过用于便携电话和因特网的通信网络和传输介质,例如有线电视和数字电视的广播波被送至解码装置200。该比特流还可以被记录在记录介质上,例如包括CD和DVD的光盘,半导体和硬盘。
在实际的MPEG-2 AAC中,可能还要另外使用一些其它的技术,包括例如增益控制、瞬时噪音定形(TNS,Temporal NoiseControl)、心理声学模型、M/S(Mid/Side)立体声、声强立体声(intensitystereo)、预测等工具,以及其它的如保留比特(bit reservoir)和用于改变块大小的方法等。
解码装置200
解码装置200接收编码比特流,并根据共用信息由比特流重建宽频带内的数字音频数据。解码装置200包括流输入单元210,第一解码单元221,第一解量化单元222,第二解码单元223,第二解量化单元224,集成(integrate)单元225,逆变换单元230,和音频信号输出单元240。
流输入单元210通过记录介质或传输介质接收来自编码装置100的编码比特流,该传输介质和传输介质包括用于手机的通信网络,因特网,有线电视的传输信道,和广播波。然后,流输入单元210从编码比特流中由常规解码装置400解码的一个区域提取第一编码信号。流输入单元210还从该相同比特流的另一个区域提取第二编码信号(共用信息),该另一个区域或者被常规解码装置400所忽略或者对其未定义任何操作。流输入单元210分别向第一和第二解码单元221和223输出第一和第二编码信号。
第一解码单元221接收第一编码信号,即,流格式为霍夫曼编码的数据,将其解码为量化数据,并输出该量化数据。
第二解码单元223接收第二编码信号,将其解码为共用信息,并输出该共用信息。
当涉及由第二解码单元223输出的共用信息时,第二解量化单元224对由第一解量化单元222输出的、由两个窗口共用的一部分频谱数据进行复制并输出。
集成单元225对从第一和第二解量化单元223和224输出的两组频谱数据一起进行集成。更具体的,集成单元225接收来自第一解量化单元222的频谱数据,还从第二解量化单元224接收频谱数据和频率的指定。集成单元225然后将从第一解量化单元222接收的、并由上述指定的频率所规定的频谱数据的值改变为从第二解量化单元224输出的频谱数据的值。类似的,当接收来自第二解量化单元224的较高频率频谱数据和窗口的指定时,集成单元225将从第一解量化单元222输出的、并由指定窗口所规定的较高频率频谱数据的值,改变为从第二量化单元224接收的较高频率频谱数据的值。
逆变换单元230接收来自集成单元225的集成的频谱数据,并对频域内的频谱数据执行IMDCT,将其变为由时域内1024个取样构成的取样数据。
音频信号输出单元240将从逆变换单元230输出的取样数据组顺序的放在一起以产生并输出数字音频数据。
在本实施例中,一个窗口内的较高频率频谱数据代表上述8个窗口中另一个窗口内另外的较高频率频谱数据。这样,通过不同窗口间的共用频谱数据的比特量,减少了传输数据的比特量,同时使重建频谱数据中的劣化最小。
图4示出了根据判断单元137的判断,较高频率频谱数据在不同窗口间如何共用的一个例子。该图中示出的频谱数据对应于一个帧,并由图3B中所示的短块产生。图4中示出的每个窗口被垂直虚线分为两半,左半边表示从0kHz到11.025kHz的较低频率再生频带,右半边表示从11.025kHz到22.05kHz的较高频率再生频带。
包含在两个相邻窗口中的两个频谱很可能具有相似的波形图,如图4所示,因为每个窗口都是在短周期内提取的。在这种情况下,判断单元137就判断这两个窗口其中一个的较高频率频谱数据代表另一个窗口的较高频率频谱数据。例如,假设第一和第二窗口中的频谱是相似的,且从第三到第八窗口中的频谱是相似的。则判断单元137判断在第一和第二窗口间较高频率频谱数据被共用,且在第三和随后的窗口间另外的较高频率频谱数据被共用。在这种情况下,在图中由箭头表示的范围内的频谱数据组被传输(以及量化和编码)。在第二窗口和第四到第八窗口中的其他较高频率频谱数据组不进行传输,并且这些频谱数据组被判断单元137改变为“0”。
图5A-5C表示包含共用信息的第二编码信号被流输出单元140插入到其中的编码比特流的数据结构。图5A表示这种编码比特流的区域,图5B和5C表示MPEG-2 AAC的比特流的示例性数据结构。图5B中的阴影部分为填充部分区域,其中被填充为“0”以调整比特流的数据长度。图5C所示的阴影部分为DSE区域,其中只有物理结构,例如比特长度,根据MPEG-2 AAC被定义,用于其未来的扩充。如图5A所示,由第二编码单元134编码的共用信息被指定ID(识别)信息并被放入比特流中的一个区域内,例如填充部分和DSE。
当常规解码装置400接收在填充部分区域中包含第二编码信号的比特流时,解码装置400并不监视将第二编码信号检测出作为被解码信号,而是忽略它。当接收在DSE区域中包含第二编码信号的比特流时,常规解码装置400可以读出该第二编码信号,但不执行响应于此读出的任何操作,因为对解码装置400未定义响应于第二编码信号的任何操作。通过将第二编码信号插入到比特流的上述其中一个区域,接收由编码装置100编码的比特流的常规解码装置400并不将第二编码信号作为编码音频信号来进行解码。从而使常规解码装置400避免了由于第二编码信号的解码失败而产生的噪声。结果,即使常规解码装置400也可以常规方式顺利地从第一编码信号单独再现声音。
可插入第二编码信号的填充部分区域最初被提供报头信息,如图5A所示。该报头信息包括以下信息,例如识别该填充部分的填充部分ID,和规定整个填充部分的比特长度的数据。类似的,可插入第二编码信号的DSE区域最初也被提供报头信息,如图5A所示。该报头信息包括以下信息,例如指示随后数据为DSE的DSE ID,和规定整个DSE的比特长度的数据。流输出单元140将包括ID信息和共用信息的第二编码信号插入到存储该报头信息的区域之后的一个区域。
该ID信息表示随后的编码信息是否由本发明的编码装置100所产生。例如,“0001”的ID信息指示随后的信息是由编码装置100编码的共用信息。另一方面,“1000”的ID信息指示随后的信息不是由编码装置100所编码的。当ID信息为“0001”时,本发明的解码装置200使第二解码单元223解码随后的编码信息以获得共用信息,并根据获得的共用信息来重建每个窗口中的较高频率频谱数据。但是,当ID信息为“1000”时,解码装置200则忽略随后的编码信息。这种ID信息被插入到第二编码信号中,从而使本发明的第二编码信号清楚地区别于基于其他标准的其他编码信息,该其他编码信息可以被插入到不会被常规解码装置400检测出作为存储将被解码的编码音频信号的例如填充部分和DSE的区域中填充部分。
上述ID信息还可以被用来通知解码装置200第二编码信号还包括基于本发明但不是共用信息的其他附加信息(例如子信息),如果此附加信息以随后实施例所述的方式被提供的话。该ID信息不需要被置于第二编码信号的开始,并可以被置于编码共用信息之后或者是共用信息一部分的区域中。
图6A-6C表示第一和第二编码信号被流输出单元140插入到其中的编码音频比特流的其他示例性的数据结构。这些图中所示的编码音频比特流不一定必须符合MPEG-2 AAC。图6A示出了存储有各对应于一个不同帧的多个第一编码信号的流1。图6B示出了以对应于流1的帧的、以帧为单位只连续存储第二编码信号的流2。该流2对每个帧存储如图5A所示增加有报头信息和ID信息的共用信息。如图6A和6B所示,流输出单元140可将第一和第二编码信号置入到可通过不同信道传输的分离的流1和2中。
当第一和第二编码信号通过不同的比特流传输时,就有可能首先传输或累积包含有关于较低频带中音频数据的信息的比特流,其是一种基本信息,然后根据需要传输或增加关于较高频率频谱数据的信息。
当包含第二编码信号的编码音频比特流仅为提供给本发明的解码装置200而产生时,第二编码信号可以被插入到报头信息的不同于上述区域的某个确定区域中,该区域是由编码装置100和解码装置200预先确定的。或者,可将第二编码信号插入到第一编码信号的预定部分,或者插入到报头信息的预定部分和所述的某个确定区域中。当第二编码信号被插入到规定部分和/或区域中时,该规定部分/区域不一定必须是一个单独的连续区域,而可以是分散的区域。图6C示出了在音频比特流的报头信息和第一编码信号的分散的区域中都存储有第二编码信号的编码音频比特流的这种例子的数据结构。在这种情况下,ID信息和报头信息被添加至将被存储为音频比特流中的第二编码信息的共用信息中。
以下参照图7,8,11的流程图和图10的波形图说明编码装置100和解码装置200的操作。
图7表示第一量化单元131所执行的为每个比例因子频带确定比例因子的操作的流程图。第一量化单元131确定对应一个帧的所有比例因子频带共用的一个比例因子的初始值(步骤S91)。使用该确定初始值的比例因子,第一量化单元131量化从判断单元137输出的一个帧的频谱数据以产生量化数据,计算每两个相邻比例因子频带所使用的比例因子的差值,并对量化数据、所计算的差值,和该帧的第一比例因子频带所使用的比例因子进行霍夫曼编码(步骤S92),以产生霍夫曼编码数据。上述量化和编码只是为了计数该帧的比特总数而执行的,因此例如报头这样的信息不会被添加至量化和编码的结果中。之后,第一量化单元131判断该霍夫曼编码数据的比特数量是否超过了一预定的比特数量(步骤S93)。如果是,则第一量化单元131降低该比例因子的初始值(步骤S101),并用该降低初始值的比例因子执行量化和霍夫曼编码。然后第一量化单元131判断霍夫曼编码数据的比特数量是否超过了该预定的比特数量(步骤S93)。第一量化单元131重复这些步骤,直到判断霍夫曼编码数据的比特数量没有超过预定的比特数量。
基于霍夫曼编码数据的比特数量没有超过预定比特数量的判断,第一量化单元131重复循环A(步骤S94~S98和S100)以为每个比例因子频带确定一个比例因子。也就是说,第一量化单元131对步骤S92所产生的每组量化数据在比例因子频带内进行解量化以产生一组解量化的频谱数据(步骤S95),并计算在产生的解量化的频谱数据组和对应于该解量化频谱数据的原始频谱数据组之间的绝对差值。第一量化单元131然后对该比例因子频带内所有的解量化频谱数据组计算出的这些差值进行合计(步骤S96)。然后,第一量化单元131判断差值的合计值是否小于一个预定值(步骤S97)。如果是,则第一量化单元131对下一个比例因子频带执行循环A(步骤S94~S98)。如果不是,则第一量化单元131增加该比例因子的值并使用增加的比例因子对同一比例因子频带内的每组原始频谱数据进行量化(步骤S100)。第一量化单元131然后对每组量化数据进行解量化(步骤S95),计算在每组解量化频谱数据和对应该解量化频谱数据组的一组原始频谱数据之间的绝对差值,并对计算的差值进行合计(步骤S96)。然后,第一量化单元131再次判断该差值的合计值是否小于一个预定值(步骤S97)。如果不是,则第一量化单元131增加该比例因子的值(步骤S100),并重复循环A(步骤S94~S98和S100)。
在确定比例因子之后,对于该帧内使上述差值的合计值小于预定值(步骤S98)的所有比例因子频带,第一量化单元131使用所规定的比例因子来量化对应于该帧的所有频谱数据组以产生量化的数据组。第一量化单元131然后对所有量化数据组、在两个相邻比例因子频带中使用的每对比例因子间的差值,和第一比例因子频带中使用的一个比例因子进行霍夫曼编码,以产生编码数据。第一量化单元131然后判断编码数据的比特数量是否超过预定的比特数量(步骤S99)。如果是,则第一量化单元131降低比例因子的初始值(步骤S101)直到该比特数量等于或小于预定比特数量,然后执行循环A(步骤S94~S98和S100)以确定每个比例因子频带的比例因子。当判断编码数据的比特数量没有超过预定比特数量时(步骤S99),第一量化单元131指定循环A中规定的每个比例因子作为该帧内每个比例因子频带的实际比例因子。
应注意第一量化单元131根据例如与心理声学模型相关的数据来进行上述步骤S97的判断(关于差值的合计值是否小于预定值)。
在图7所示的上述操作中,第一量化单元131先设定相对大的值作为比例因子的初始值,如果霍夫曼编码数据的比特数量小于预定的比特数量,则降低该初始值,但这不是必须的。也就是说,第一量化单元131实际上可以设定一个相对低的值作为比例因子的初始值,并逐渐增加该初始值,直到它判断霍夫曼编码数据的比特数量超出了预定的比特数量。当判断为是时,第一量化单元131确定在当前设定的初始值之前的那个初始值为该比例因子的初始值。
还是在图7所示的上述操作中,每个比例因子频带的比例因子是这样确定的,就是使一个帧的全部霍夫曼编码数据的比特数量小于该预定比特数量,虽然这并不是必需的。也就是说,每个比例因子都可以这样确定,即,使每个比例因子频带中的每个量化数据组的比特数量小于一个预定的比特数量。
图8是表示判断单元137所执行的、进行关于一个帧内将被共用的频谱数据的判断并产生判断结果作为共用信息的操作的流程图。这里,判断单元137产生8个窗口的判断结果作为由8个标志(即8个比特)构成的共用信息,其中表示为“0”的标志指示一个窗口内具有此标志的较高频率频谱数据将被传输到解码装置200,表示为“1”的标志指示一个窗口内具有此标志的较高频率频谱数据由其他窗口的其他较高频率频谱数据来代表。
判断单元137从变换单元120接收8个窗口中的第一窗口内的频谱数据,将接收的频谱数据输出到第一量化单元131,并将共用信息的第一标志(即比特)设为“0”(步骤S1)。之后,判断单元137重复执行循环B(步骤S2到S9)以对随后从第二到第八的剩下七个窗口的每一个进行判断。
判断单元137聚焦在一个窗口上,并计算此窗口内的频谱数据与距离本聚焦窗口最近且标志为“0”的之前的窗口内的频谱数据之间的能量差异(步骤S3)。判断单元137然后判断所计算的能量差异是否小于预定的阈值(步骤S4)。
如果是,则判断单元137确定所聚焦的窗口和之前的窗口包括相似的频谱,因此聚焦窗口内的较高频率频谱数据可以由之前窗口内的较高频率频谱数据来代表。判断单元137然后将聚焦窗口内的较高频率频谱数据的值改变为“0”(步骤S5),并将对应于该窗口的共用信息的一个比特设为“1”(步骤S6)。另一方面,当判断该能量差异不小于预定阈值时,判断单元137确定聚焦窗口内的较高频率频谱数据不能被之前窗口内的较高频率频谱数据来代表。在这种情况下,判断单元137将聚焦窗口内的所有频谱数据原样输出到第一量化单元131(步骤S7),并将对应于聚焦窗口的共用信息比特设为“0”(步骤S8)。
例如,假定判断单元137当前聚焦在第二窗口。则判断单元137计算各由128个取样构成的第二窗口和第一窗口之间相同频率的频谱值的差值。然后判断单元137合计对两个窗口所计算的所有差值,从而规定第一窗口和第二窗口之间频谱数据的能量差异(步骤S3),并判断该能量差异是否小于预定的阈值(步骤S4)。
当判断该能量差异小于该预定阈值时,判断单元137确定第一和第二窗口包括相似的频谱,且第二窗口内的较高频率频谱数据可以被第一窗口内的较高频率频谱数据代表。因此判断单元137将第二窗口内的较高频率频谱数据值改变为“0”(步骤S5),并将对应于第二窗口的共用信息的一个比特设为“1”。
这样第二窗口的判断就结束了(步骤S9),然后判断单元137对第三窗口执行循环B(步骤S2)。也就是说,判断单元137计算第一和第三窗口之间频谱数据的能量差异(步骤S3)。更详细的,判断单元137计算第一窗口和第三窗口之间相同频率的频谱值的差值。然后判断单元137合计所有计算的差值,以确定第一窗口和第三窗口之间频谱数据的能量差异,并判断该确定的能量差异是否小于预定的阈值(步骤S4)。
基于能量差异不小于预定阈值的判断,判断单元137确定在第一和第三窗口中的两个频谱彼此不相似,且第三窗口中的频谱数据不能被第一窗口中的频谱数据代表。这样,判断单元137就将第三窗口中的所有频谱数据都原样输出到第一量化单元131(步骤S7),并将对应第三窗口的共用信息比特设为“0”(步骤S8)。
这样第三窗口的判断就结束了(步骤S9),然后判断单元137对第四窗口执行循环B(步骤S2)。判断单元137计算在第四窗口与距离第四窗口最近且标志为“0”的之前的一个窗口(即,其频谱数据被原样输出而没有被置换为“0”)之间的频谱数据之间的能量差异。之前的窗口就是第三窗口。这样,判断单元137重复执行基于循环B的判断,直到其结束第八个窗口的判断,从而结束整个帧的操作。因此,该帧内的频谱数据被输出到第一量化单元131,并为该帧产生8比特的共用信息“01011111”。该共用信息指示第一窗口内的较高频率频谱数据代表第二窗口内的较高频率频谱数据,且第三窗口内的较高频率频谱数据代表第四窗口到第八窗口的连续窗口内的较高频率频谱数据。该共用信息也可以用其他方式表示。例如,当预定包括较高频率频谱数据的第一窗口的全部频谱数据都被传输时,共用信息的第一比特可以被省略,从而共用信息可以被表示为7个比特“101111”。判断单元137然后将所产生的共用信息输出到第二编码单元134,并对下一帧执行上述操作。
在上述操作中,判断单元137使用构成每个窗口的全部128取样通过计算可确定两个窗口中频谱的能量差异,但这并不是必要的。还有可能只用两个窗口中较高频率的64个取样确定能量差异。判断单元137然后将此确定的能量差异与预定阈值相比较。
在上述操作中,判断单元137总是原样输出第一窗口中的较高频率频谱数据而没有将它们的值替换为“0”,但这也不是必要的。例如,判断单元137可以在一帧内的8个窗口中找到相对于其他7个窗口中的任一个具有最小能量差异的一个窗口。判断单元137然后传输(以及量化和编码)找到的窗口或是以能量差异值顺序而排列(先从最小值开始)的预定数目的窗口中的全部频谱数据。这样,第一窗口中的较高频率频谱数据并不总是被传送。
在上述实施例中,关于一个窗口中的较高频率谱数据是否可以被之前窗口中的其他较高频率频谱数据所表示的判断是基于两个窗口间能量差异的计算而进行的。然而,该判断并不是必须基于能量差异的计算而进行,并可能进行以下的变型。在一个变型实施例中,在频率轴上规定了一个窗口内的所有频谱数据组中具有最高绝对值的一组频谱数据的一个位置(即,一个频率)。在两个窗口内规定该频率轴上的位置,并找到这两个规定位置之间的差值。当找到的差值小于一预定阈值时,判断单元137判断一个窗口中的较高频率频谱数据可以被其他窗口中的其他较高频率频谱数据所代表。在另一个变型实施例中,当两个窗口所包含的频谱具有相同数目的峰值和/或频率轴上峰值的位置彼此相似时,判断单元137可以判断一个窗口中的较高频率频谱数据可以被其他窗口中的其他较高频率频谱数据所代表。可以比较两个窗口的比例因子频带之间的这种峰值的数目和位置,并根据频谱的相似性给出每个窗口的计分,从而依据每个窗口中频谱的主要特性作出判断。作为另一个变型例子,可以对两个窗口确定窗口中具有最高绝对值的频谱数据的一个位置。当对两个窗口所确定的位置彼此相似时,也可以判断一个窗口中的较高频率频谱数据可以被标志为“0”的之前的另一个窗口中的较高频率频谱数据所代表。在另一个变型实施例中,可以通过以下步骤进行判断(a)对每个窗口中的一个频谱执行预定的函数,(b)比较两个窗口中执行的结果,和(c)根据此比较结果进行上述判断。作为另一个变型例子,还可以使单独的一组较高频率频谱数据在预定的窗口之间共用而不用参考两组较高频率频谱数据间的相似性。例如,在偶数窗口,如第二,第四,或第六个窗口中的频谱数据可以代表奇数窗口中的频谱数据,反之亦然。还可以预先决定较高频率频谱数据的值不会被替换为“0”的窗口。例如,可以确定一个窗口,该窗口中的较高频率频谱数据代表其他7个窗口中的较高频率频谱数据。
在另一个变型实施例中,当每个窗口在较高频带或整个频带包括多个峰值时,多个峰值的频率被指定。然后在两个不同窗口中被规定的频率被相互比较以找到差异。当每个找到的差异是在预定阈值的范围内时,判断单元137就判断一个窗口中的较高频率频谱数据可以被其他窗口中的较高频率频谱数据所代表。还可以合计所规定的每个差值,如果合计的差值小于阈值,则判断单元137判断较高频率谱数据被两个窗口所共用。
解码装置200接收编码装置100所产生的编码音频比特流,并使第一解码单元221根据常规步骤解码第一编码信号以产生由1024个取样构成的量化数据。当对应于该量化数据的频谱数据基于图8中的示例步骤而产生的时候,第二窗口和第四到第八窗口中的较高频率频谱数据的所有值都为“0”。第二解量化单元224包括能够存储从第一解量化单元222输出的至少一个窗口的较高频率频谱数据的存储器。第二解量化单元224在对窗口的解量化期间查阅每个窗口的一个标志。当该标志表示为“0”时,第二解量化单元224将从第一解量化单元222输出的较高频率频谱数据放置到上述存储器中。随后,第二解量化单元224查阅下一个窗口的一个标志。当该标志表示为“1”时,第二解量化单元224复制并输出存储在存储器中的较高频率频谱数据,然后继续该复制直到识别出一个标志为“0”的窗口。作为上述存储器,可以使用常规解码装置400中的常规的存储器,以便存储对应于一个帧的频谱数据。因此并不需要对常规解码装置400提供新的存储器。如果提供了新的存储器来实现本发明,则可以在此存储器中提供新的存储区域,以存储指示将被复制的窗口的开始和该窗口内较高频率频谱数据的开始的指针。然而,当解码装置中预先设定一个步骤从而解码装置可以根据上述两个位置的频率在存储器中搜索这两个位置的时候,并不需要这种新的存储区域。当频谱数据的上述两个位置的搜索时间应当被减少时,设置该新的存储器是必要的。以下将参照图9的流程图说明第二解量化单元224的具体操作。
图9是表示第二解量化单元224为复制较高频率频谱数据而执行的操作的流程图。这里假定第二解量化单元224具有能够存储至少由64个取样构成的较高频率频谱数据的存储器。第二解量化单元224对一个帧内的每个窗口执行循环C(步骤S71)。也就是说,第二解量化单元224查阅该窗口的标志。当标志为“0”时(步骤S72),第二解量化单元224将第一解量化单元222输出的较高频率频谱数据存储在上述存储器中(步骤S73)。当标志不为“0”时(步骤S72),第二解量化单元224将存储在存储器中的较高频率频谱数据输出到集成单元225(步骤S74)。对该帧内的每个窗口重复执行循环C的上述步骤(步骤S75)。
更详细的,第二解量化单元224接收第二解码单元223所解码的共用信息,并查阅共用信息的对应于当前聚焦窗口的一个比特,以判断该比特,即,该标志是否为“0”(步骤S72)。如果是,表示当前窗口的较高频率频谱数据的值没有被替换为“0”,则第二解量化单元224将第一解量化单元222输出的较高频率频谱数据存储在上述存储器中(步骤S73)。如果存储器在这个点存储有其他数据,则第二解量化单元224更新该存储器。另一方面,当第二解量化单元224判断该标志不为“0”时(步骤S72),就表示第一解量化单元222输出的较高频率频谱数据是由“0”值构成的。则第二解量化单元222从存储器读出频谱数据并向集成单元225输出所读出的频谱数据作为对应于当前窗口的数据(步骤S74)。结果在集成单元225中,所读出的较高频率频谱数据替换了从第一解量化单元222输出的当前窗口的较高频率频谱数据。
例如,假定当前聚焦的是第一窗口且共用信息对应于第一窗口的第一比特(即标志)为“0”。则第二解量化单元224将从第一解量化单元222传送的第一窗口中的较高频率频谱数据写入到存储器中,从而存储器被更新(步骤S73)。在这种情况下,第二解量化单元224没有将此频谱数据输出到集成单元225,从而第一解量化单元222输出的频谱数据被输出到集成单元225然后输出到逆变换单元230。
在第一窗口的操作之后,聚焦第二窗口。这里假定共用信息的第二比特(即标志)为“1”。则第二解量化单元224从存储器读出第一窗口的较高频率频谱数据,并将读出的频谱数据作为对应于第二窗口的较高频率频谱数据输出到集成单元225(步骤S74)。另一方面,第一解量化单元222已将第二窗口的频谱数据输出到集成单元225。此频谱数据在其较高频带内包含有“0”值。此“0”值的较高频率频谱数据被集成单元225改变为最初包含在第一窗口中并被第二解量化单元224从存储器读出的上述频谱数据。
根据来自编码装置100的共用信息,解码装置200复制标志为“0”的一个窗口内的较高频率频谱数据,并使用复制的频谱数据作为标志为“1”的一个窗口的较高频率频谱数据。
在此复制之后,如果需要还可以调整所复制的频谱数据的幅值,虽然在上述例子中并未执行该调整。此调整可通过将每个复制的频谱值乘以一个预定的系数,例如0.5,来实现。该系数可以是一个固定值,也可以根据频带或第一解量化单元222输出的频谱数据而改变。
上述系数可通过解码装置100预先计算,并添加至包含共用信息的第二编码信号。作为上述系数,一个比例因子或是量化数据的一个值都可以被添加到第二编码信号。用于调整幅值的方法并不局限于上述的例子,其他调整方法也可以使用。
在上述例子中,标志为“0”的窗口中的较高频率频谱数据以常规方法被量化,编码,和传输,但是其他的例子也是可行的。例如,对应于标志为“0”的较高频率频谱数据可能不进行传输,也就是说,所有较高频率频谱数据的值都被替换为“0”。相反的,对标志为“0”的窗口中的较高频率频谱数据产生子信息,对子信息编码,并与编码的共用信息一起插入到第二编码信号中。该子信息表示较高频带中的音频信号,并可能包含该音频信号的代表值。例如,该子信息可指示以下信息中的一种。
(1)较高频带中比例因子频带的比例因子,每个比例因子由较高频带中的每个比例因子频带中具有最大绝对值的频谱数据而产生值为“1”的量化数据。
(2)量化数据的值,该值根据对所有的比例因子频带共用的一个预定比例因子,通过量化在每个比例因子频带中具有最大绝对值的较高频率频谱数据而产生。
(3)以下其中一个位置:(a)在每个比例因子频带中具有最大绝对值的频谱数据;(b)在每个较高频带中具有最大绝对值的频谱数据。
(4)较高频带中预定位置的频谱数据值的正/负符号。
(5)用来复制较低频带中的频谱数据以代表较高频率频谱数据(当这两组频谱彼此相似时)的复制方法。
上述信息(1)~(5)中的两个或更多可以相互结合以产生子信息。解码装置200根据该子信息而重建较高频率频谱数据。
以下将说明上述(1)中描述的比例因子被作为子信息的情况。
图10表示频谱数据的波形图的一个具体例子,从该频谱数据可产生对应于一个基于短块的窗口的子信息(即比例因子)。在该图中,比例因子频带间的边界在较低频带中以频率轴上的短划标记来表示,在较高频带中以垂直的虚线来表示。但为了便于说明,这些边界被简化了,它们的实际位置与图中所示的位置不同。
变换单元120输出的频谱数据中,由实线波形表示的较低频率频谱数据被输出到第一量化单元131,以常规方式进行量化。另一方面,由虚线波形表示的较高频率频谱数据被表示为判断单元137计算出的子信息(即比例因子)。以下将参照图11的流程图说明判断单元137产生该子信息的过程。
判断单元137对11.025kHz到22.05kHz的较高频带内的所有比例因子频带计算比例因子(步骤S11)。每个比例因子由在每个比例因子频带中具有最大绝对值的频谱数据而产生值为“1”的量化数据。
判断单元137确定在以高于11.025kHz的频率开始的较高频带开始处的一个比例因子频带中具有最大绝对值的频谱数据(即峰值)(步骤S12)。这里假定该规定的峰值的位置由图10中的①表示,且该峰值为“256”。
判断单元137然后将峰值“256”和原始的比例因子值以图7所示步骤相似的方式代入预定公式中,以计算产生值为“1”的量化数据的一个比例因子(步骤S13)。结果,判断单元137计算出一个比例因子,例如“24”。
之后,判断单元137规定下一个比例因子频带中频谱数据的一个峰值(步骤S12)。这里假定判断单元137规定了图中表示为②的位置上的一个峰值,该峰值为“312”。判断单元137然后计算出一个比例因子,例如“32”,以量化峰值“312”从而产生值为“1”的量化数据(步骤S13)。
类似的,对于第三比例因子频带,判断单元137计算出一个比例因子,例如“26”,以量化表示为③的峰值“288”,从而产生值为“1”的量化数据。对于第四比例因子频带,判断单元137计算出一个比例因子,例如“18”,以量化表示为④的峰值“203”,从而产生值为“1”的量化数据。
当较高频带中所有比例因子频带的比例因子以这种方式都被计算完后(步骤S14),判断单元137将所计算的比例因子作为较高频率频谱数据的子信息输出到第二编码单元134,并结束操作。
在该子信息中,每个比例因子频带中的较高频率频谱数据由一个单独的比例因子来表示。当较高频带中的每个比例因子值由从“0”到“255”中的一个值来表示的时候,该比例因子(在图示的例子中总数为4)可以由8个比特来表示。如果这些比例因子间的差值被霍夫曼编码,则它们的比特量可以显著减少。虽然这种子信息只表示较高频带中每个比例因子频带的一个比例因子,这种子信息的使用与常规方法相比显著减少了频谱数据的量,在常规方法中大量的较高频率频谱数据组被量化从而产生了相同大量的量化数据组。
以下说明解码装置200重建这种较高频率频谱数据的过程。解码装置200或者产生具有固定值的较高频率频谱数据组或者产生较低频带中每组频谱数据的复制。解码装置200然后将产生的频谱数据组或是复制乘以上述比例因子以重建较高频率频谱数据。由于上述比例因子值(如图10所示)基本上与比例因子频带中的峰值成正比,因此由解码装置200重建的频谱数据与由输入到编码装置100的音频信号而直接产生的频谱数据基本相似。
作为另一种方法,可以规定以下(a)和(b)之间的一个比率:(a)由上述固定值或者较低频带中频谱数据的复制构成的较高频率频谱数据的最大绝对值;(b)通过使用比例因子频带的一个比例因子,对值为“1”的量化数据解量化而产生的每个比例因子频带中,较高频率频谱数据的最大绝对值。解码装置200然后使用该规定的比率作为与每个比例因子频带中的较高频率频谱数据相乘的系数,从而该频谱数据以更高的准确性被重建。
以上述相同的方式,较高频率频谱数据可以由(2)的子信息,即通过对在每个比例因子频带中具有最大绝对值的频谱数据进行量化而产生的量化数据,来重建。
以下说明由解码装置200执行的操作,当该子信息是上述信息(3)和(4)其中一个,即以下的其中一个的时侯:(a)或者是在每个比例因子频带中具有最大绝对值的频谱数据的一个位置,或者是在较高频带中具有最大绝对值的频谱数据的一个位置;和(b)较高频带中在预定位置上的一组频谱数据值的正/负符号。解码装置200可产生一个具有预定波形的频谱或复制较低频带中的一个频谱。解码装置200然后调整所产生/复制的频谱从而得到由子信息(3)或(4)所表示的一个波形。
当子信息是上述信息(5)时,即用来复制较低频带中的频谱数据以代表较高频率频谱数据(在上述两组频谱数据彼此相似的时候)的复制方法,判断单元137进行下述操作。以与规定不同窗口内相似频谱类似的方式,判断单元137规定了包括与较高频带中的一个频谱相类似的一个频谱的较低频带中的一个比例因子频带。所规定的比例因子频带被指定一个数字,该数字被用作子信息的一部分。
当较低频率的频谱以上述方式被复制,用于产生较高频率的频谱时,该复制可以在两个方向,即从低频部分向高频部分的方向或相反方向,的其中一个方向上执行。该复制方向还可以被添加至子信息(5)中。并且,在有或没有原始较低频率频谱反转的符号的情况下都可以执行该复制。这种复制频谱的符号也可以被添加至子信息(5)中,从而解码装置200通过复制子信息(5)所指示的较低频率频谱来重建每个比例因子频带中的较高频率频谱。由于重建的较高频率频谱和其原始频谱之间的差异与较低频带中的差异相比表现为声音差异的可能性较小,因此子信息(5)可以充分表示较高频率频谱的波形。
在上述例子中,判断单元137计算量化较高频率频谱数据的一个比例因子以产生值为“1”的量化数据。然而该量化数据的值也可以不是“1”,而可以是其它预定的值。
在上述实施例中,只有比例因子被编码作为子信息。然而还可以编码其它的信息作为子信息,该其他信息为,例如量化数据,特性频谱位置的信息,频谱的正/负符号的信息,和产生噪音的方法。这种不同类型的信息可以被结合在一起作为将被编码的子信息。如果将,例如表示幅值比率的系数和具有最大绝对值的频谱数据位置,与上述由频谱数据的最大绝对值可产生具有预定值的量化数据的比例因子结合起来,并将该结合信息作为将被编码的子信息,将更为有效。
上述实施例表明判断单元137可产生共用信息,虽然这并不是必要的。当本解码装置100不产生共用信息时,第二编码单元134就不是必需的,但需要解码装置200来规定共用相同较高频率频谱数据的窗口。为此,第二解量化单元224包括用于存储至少对应于一个窗口的较高频率频谱数据的存储器。例如,一旦第一解量化单元222结束每个窗口内频谱数据的解量化,第二解量化单元224就将值不为“0”的较高频率的解量化频谱数据的64个取样放入存储器。同时,第二解量化单元224从第一解量化单元222输出的窗口中检测包含值都为“0”的较高频率频谱数据的一个窗口,将检测出的窗口与存储器中存储的较高频率频谱数据关联,并输出存储的频谱数据。例如,当向集成单元225输出存储的频谱数据时,第二解量化单元224通过向集成单元225发送规定所检测窗口的一个数字,将存储器中存储的较高频率频谱数据与检测的窗口关联。在集成单元225中,该发送数字所规定的窗口内的较高频率频谱数据被存储器中存储的较高频率频谱数据的复制所替换。
当执行上述操作时,编码装置100不必发送一个帧的第一窗口内的较高频率频谱数据。这时,编码装置100在该帧的前一半内插入其较高频率频谱数据将被传输到解码装置200的这些窗口。然后,一直监视着第一解量化单元222的解量化结果的第二解量化单元224规定该第一窗口内的较高频率频谱数据的值都为“0”。第二解量化单元224然后在随后的窗口中搜索包含较高频率频谱数据的值都为“0”的一个窗口。找到该窗口后,第二解量化单元224将该找到窗口内的较高频率频谱数据输出到集成单元225。这时,第二解量化单元224还复制该较高频率频谱数据,并将复制的频谱数据存入存储器中。之后第二解量化单元224将此复制的频谱数据与随后检测的较高频率频谱数据的值都为“0”的一个窗口关联,并将复制输出到集成单元225,从而值为“0”的频谱数据被替换为复制的值。
当使用低传输速率的传输信道时,常规的技术通常会省略较高频率频谱数据的传输。然而上述实施例的编码装置100可传输对应于基于短块的8个窗口中的至少一个窗口的较高频率频谱数据。这就使解码装置200在较高频带中也能够以高品质来再现音频信号。并且,对于本编码装置100,具有相似频谱的不同窗口可共用较高频率频谱数据。结果,对于较高频率频谱数据没有被传输到解码装置200的那些窗口,也可以再现与原始声音类似的声音。
上述实施例描述了44.1kHz的取样频率,但本发明并不局限于44.1kHz,也可以是其它的频率。上述实施例说明了以11.025kHz开始的较高频带,但高频带和低频带之间的边界也可以不是11.025kHz,而可以是其它的频率。
在上述实施例中,ID信息被附加到共用信息等包含在音频比特流中第二编码信号的信息中。但是当比特流中的一个区域,例如填充部分或DSE,只存储由本编码装置100所编码的信息,或是当包含第二编码信号的音频比特流只能被本发明的解码装置200解码时,此ID信息并不是必须被加入到共用信息中。在这种情况下,解码装置200总是从为编码装置100和解码装置200所确定的一个区域(例如填充部分)中提取第二编码信号,并解码共用信息。
上述实施例仅说明了使用短块作为MDCT变换单位的情况。然而,当使用长块作为MDCT的块长度时,可以将本发明的编码装置100和解码装置200的功能相应地如常规的编码装置300和解码装置400一样相交换。更具体的,编码装置100和解码装置200中的单元被交换并进行以下操作。音频信号输入单元110提取1024个取样,并额外提取两组512个取样,其中一组512取样覆盖之前提取的1024个取样的一部分,而另一组512取样覆盖下一次提取的1024个取样的一部分。变换单元120同时对2048个取样执行MDCT变换以产生由2048个取样构成的频谱数据,其中的一半(即1024个取样)被分为预定的49个比例因子频带。判断单元137从变换单元120接收所产生的频谱数据,并将其原样输出到第一量化单元131。第二编码单元134暂时停止其操作。解码装置200的流输入单元210并不从编码的音频比特流中提取第二编码信号,第二解码单元223和第二解量化单元224也暂时停止它们的操作。集成单元225从第一解量化单元222接收频谱数据,并将接收的数据原样输出到逆变换单元230。
通过编码装置100和解码装置200交换功能,例如一个慢拍旋律(slow tempo),就可以基于长块被传输和解码,以提供高声音品质,而频繁产生冲击脉冲的快拍旋律(quick tempo),就可以基于短块被传输和解码以提供更好的时间分辨率。
第二实施例
以下将参照图12和13说明第二实施例的编码装置101和解码装置201,这里将重点说明与第一实施例不同的特征。图12是表示编码装置101和解码装置201的结构的方框图。
编码装置101
当使用短块作为MDCT的块长度时,编码装置101确定包含的频谱数据组彼此相似的两个或更多窗口。编码装置101然后使其中一个确定窗口内的一组频谱数据代表其它确定窗口内的其他组频谱数据。在本实施例中,一组频谱数据代表整个频率范围内的其他频谱数据组。从而编码装置101减少了编码的音频比特流的比特量。编码装置101包括音频信号输入单元110,变换单元120,第一量化单元131,第一编码单元132,第二编码单元134,判断单元138,和流输出单元140。
判断单元138与第一实施例的判断单元137的不同之处在于,本判断单元138用于判断一个窗口内的频谱数据是否代表整个频带内,包括较低频带和较高频带内其他窗口的不同频谱数据。也就是说,本实施例减少了较低频带内音频信号的数据量,其中较低频带要求比较高频带更高的准确性来再现原始声音。更详细的,判断单元138聚焦包含从变换单元120输出的频谱数据的8个窗口中的每一个,并判断该聚焦窗口内的频谱数据是否可以被8个窗口中的其他窗口内的其他频谱数据来代表。基于该频谱数据可以被其他频谱数据所代表的判断,判断单元138将该聚焦窗口内所有频谱数据的值都改变为“0”,并产生上述共用信息。
例如,假定判断单元138判断第二窗口内的频谱数据可以被第一窗口内的频谱数据所代表,且从第四到第八窗口内的频谱数据可以被第三窗口内的频谱数据所代表。则判断单元138将第二窗口和第四到第八窗口内的所有频谱数据的值都改变为“0”,并输出共用信息为“01011111”。结果,第一量化单元131量化的频谱数据的比特量远远小于常规的频谱数据,这是因为第二窗口和第四到第八窗口内的所有频谱数据的值都为“0”。
解码装置201
解码装置201对编码装置101编码的音频比特流进行解码,并包括流输入单元210,第一解码单元221,第一解量化单元222,第二解码单元223,第二解量化单元226,集成单元227,逆变换单元230,和音频信号输出单元240。
第二解量化单元226查阅第二解码单元223解码的共用信息。对于共用信息(即标志)为“0”的一个窗口,第二解量化单元226复制已被第一解量化单元222解量化的频谱数据,并将复制的频谱数据存入存储器。之后,第二解量化单元226将该复制与随后的标志为“1”的一个窗口关联,并将复制输出到集成单元227。
集成单元227对从第一解量化单元222输出的频谱数据和从第二解量化单元226输出的频谱数据进行集成。该集成是以窗口为单位进行的。
图13表示判断单元138如何判断一组频谱数据可代表不同组的频谱数据的一个例子。该图示出了通过图3B所示的基于短块进行MDCT变换而产生的频谱数据。例如,当输入音频信号的取样频率为44.1kHz时,每个窗口中再生频带的范围是从0kHz到22.05kHz,如图所示。
正如前面所述,当窗口是基于短块而产生的时候,包含在相邻两个窗口中的两组频谱很可能具有相似的波形,因为这些窗口是以短周期被提取的。当判断第一和第二窗口中的频谱彼此相似且第三窗口到第八窗口中的频谱也彼此相似时,判断单元138就判断第二窗口中的频谱数据可以被第一窗口中的频谱数据所代表,且第四到第八窗口中的频谱数据可以被第三窗口中的频谱数据所代表。这样,图中实线波形所表示的频谱数据被量化和编码,以便传输到解码装置201,而其他窗口,即第二窗口和第三到第八窗口中频谱数据的值被替换为“0”。当解码装置201接收值都为“0”的频谱数据时,解码装置201就复制标志为“0”的之前窗口中的频谱数据,并使用该复制作为接收的频谱数据的一个重建形式。
当较低频带和较高频带中的频谱数据被包含相似频谱的不同窗口所共用时,编码音频比特流的数据量被大大减少了。然而人类的听觉对较低频带的音频信号非常敏感,因此判断单元138就需要比第一实施例更精确地判断频谱的相似性。更具体的,判断单元138使用与第一实施例的判断单元137基本相同的判断方法,但本判断单元138使用一个更低的阈值来判断和/或使用多种判断方法,从而进行高度准确的判断。还应注意本编码装置101不允许在未经判断单元137的相似性判断的情况下向解码装置201单独传输预定窗口内的频谱数据,因为本实施例中由于前述原因相似性判断不能被省略。
判断单元138不像判断单元137那样必须产生共用信息。这种情况下,第二编码单元134就是不必要的。这可以通过,例如以下方式来实现。判断单元138规定了包含相似频谱的窗口,并将它们归为相同的组。然后判断单元138产生关于该分组的信息,并将产生的信息输出到第一量化单元131。这个组内至少一个窗口中的频谱数据像常规技术那样被量化,编码,并传输到解码装置201。另一方面,在同一组下除了该至少一个窗口的其他窗口内的其他频谱数据的值被替换为“0”。注意每个组开始的一个窗口内的频谱数据不是必须代表同一组内其他窗口的其他频谱数据。同样,一个单独窗口内的频谱数据也不是必须代表同一组内其他窗口中的其他频谱数据。
上述分组通常是使用常规手段对短块进行的,因此仅作简单说明。通过该分组,包含相似频谱的窗口被分在同一组,在同一组下的这些窗口使用相同的比例因子。对于分组执行与上述对窗口间共用的频谱数据的相似性判断类似的相似性判断。当取样频率为44.1kHz且使用短块时,每个窗口通常被定义为包含14个比例因子频带,从而每个窗口内存在14个比例因子。相应的,当更多的窗口被分在同一组时,将被传输的比例因子的比特量就变得更少。
判断单元138也可以计算同一组内不同窗口内相同频率的频谱值的平均值,如果这些窗口的频谱彼此间足够相似的话。判断单元138对每个频谱计算这种平均频谱值,产生由整个频率中的128个平均频谱值构成的一个新窗口,并将该产生的新窗口作为一个帧开始处的一个代表窗口。(并非必需将此代表窗口置于帧的开始处。)判断单元138然后将同一组下其他窗口内的频谱值改变为“0”,并将这些窗口输出到第一量化单元131。
当编码装置101不产生共用信息时,也可进行以下操作。对于编码装置101和解码装置201,预先确定编码装置101只量化,编码,和传输每个组开始的一个窗口内的频谱数据。对于同一组下其他窗口内的频谱数据,编码装置101将它们的频谱值改变为“0”以便将它们传输到解码装置201。解码装置201的第二解量化单元226复制每个组开始处的一个窗口内的频谱数据,同时查阅关于分组的解码信息,将复制的频谱数据与同一组下第一窗口之后的每个窗口结合,并将其输出到解量化单元227,然后执行集成。
当编码装置101不产生共用信息且第一窗口可以由替换为“0”的值构成时,可以执行以下操作。根据关于分组的共用信息,解码装置201的第二解量化单元226监视从第一解量化单元222输出的解量化频谱数据。若检测到第一解量化单元222输出的频谱数据的值为“0”,则第二解量化单元226在同一组下的其他窗口中搜索与检测到的频谱数据具有相同频率的频谱数据,从而找到值不为“0”的频谱数据。第二解量化单元226然后复制找到的频谱数据的值,并将其输出到集成单元227,然后执行集成。
也可以进行以下的操作。当第一解量化单元222解量化的一个窗口内的频谱数据的值都为“0”时,第二解量化单元226搜索同一组内的其他窗口,以找到包含的频谱数据值不为“0”的窗口。找到这样的窗口后,第二解量化单元226复制找到的窗口中的频谱数据,将复制的频谱数据与上述值为“0”的频谱数据结合,并将复制的频谱数据输出到集成单元227。
被判断单元138分组到一起的许多窗口可以包括频谱数据值没被替换为“0”的多个窗口,这样的窗口组可以被输出到第一量化单元131。这时,解码装置201的第二解量化单元226检测值为“0”的频谱数据作为第一解量化单元222解量化的结果,搜索同一组下的其他窗口以找到具有与检测到的频谱数据相同频率且值不为“0”的某个特定频谱数据。上述“某个特定频谱数据”是下列其中一种:(a)通过上述搜索第一次找到的频谱数据;(b)在搜索到的窗口中具有最大值的频谱数据;和(c)在搜索到的窗口中具有最小值的频谱数据。第二解量化单元226然后复制该找到的某个特定频谱数据。
当被判断单元138分组到一起的许多窗口中包括频谱数据值没被替换为“0”的上述多个窗口时,可以进行以下操作。在解码装置201的第二解量化单元226检测出值为“0”的频谱数据作为第一解量化单元222的解量化结果之后,第二解量化单元226在同一组中搜索不包括“0”值的频谱数据的其他窗口,以便找到以下的其中一种窗口:(a)在搜索到的窗口中包含频谱数据的最大峰值的一个窗口;(b)在搜索到的窗口中能量最大的窗口。第二解量化单元226然后复制所找到的窗口中的所有频谱数据。
对于本实施例,当8个窗口中的不同窗口包含彼此相似的频谱时,这些不同的窗口共用相同的频谱数据。这样可以使编码音频比特流的数据量最小,同时使重建的频谱数据的质量劣化最小。
当然如果需要也可以调整第二解量化单元226所复制的频谱数据的幅值。这种调整可以通过将每个频谱值乘以一个预定的系数,例如“0.5”来实现。该系数可以是一个固定值,也可以根据频带或第一解量化单元222输出的频谱数据而改变。该系数可以不是预定的值。例如,该系数可以被作为子信息被添加至第二编码信号。一个比例因子值或者量化数据的一个量化值都可以被用作该系数并添加到第二编码信号中。
本实施例还可以将标志为“0”的窗口内的较高频率频谱数据的值替换为“0”,并产生该较高频率频谱数据的子信息,如第一实施例所述。这样,第二编码信号就包括子信息和共用信息。也就是说,对于标志为“0”的窗口内的频谱数据,编码装置102按常规操作只量化和编码较低频率的频谱数据。编码装置101将上述窗口中的较高频率频谱数据看作“0”,将其量化和编码,并像第一实施例那样产生关于较高频率频谱数据的子信息。编码装置101然后编码该子信息和共用信息。当接收到标志为“0”的窗口时,解码装置201通过以上述相同的方式解量化第一编码信号来重建较低频率频谱数据,并根据子信息重建较高频率频谱数据。对于标志为“1”的窗口内频谱数据的重建,解码装置201可复制标志为“0”的窗口内全部频率范围的上述重建的频谱数据。
第三实施例
以下将参照图14~17来说明第三实施例的编码装置102和解码装置202,重点说明本实施例不同于第一实施例的特征。图14是表示编码装置102和解码装置202的结构的方框图。
编码装置102
本编码装置102可重建产生“0”值的量化数据的频谱数据,因为这种频谱数据与具有最大绝对值的频谱数据相邻。编码装置102所处理的频谱数据是基于长块的。所重建的频谱数据随后由将被传输到解码装置202的具有较小比特量的数据来代表。编码装置102包括音频信号输入单元111,变换单元121,第一量化单元151,第一编码单元152,第二量化单元153,第二编码单元154,和流输出单元160。
音频信号输入单元111接收数字音频数据,例如基于MPEG-2AAC的音频数据,并以44.1kHz的取样频率取样。由此数字音频数据,音频信号输入单元110在23.2毫秒的一个周期内提取连续的1024个取样。音频信号输入单元110额外获取两组512个取样,其中一组512个取样覆盖之前提取的1024个取样的一部分,而另一组512个取样覆盖下一次提取的1024个取样的一部分。因此音频信号输入单元110共获得2048个取样。
变换单元121从音频信号输入单元110接收2048个取样,并将时域内的2048个取样根据MDCT变换转换为频域内的频谱数据。该频谱数据由2048个取样构成并具有对称的波形图。因此,2048个取样中只有一半(即1024个取样)被用作随后的操作。变换单元121然后将这些取样分为对应于比例因子频带的多个组,每个组都包括至少一个取样(或者,实际情况是总数为四的倍数个取样)。当取样频率为44.1kHz时,各基于长块的帧都包括49个比例因子频带。
第一量化单元151接收来自变换单元121的频谱数据,并为该频谱数据的每个比例因子频带确定一个比例因子。第一量化单元151然后通过使用预定的比例因子来量化每个比例因子频带中的频谱数据以产生量化数据,并将量化数据输出到第一编码单元152。
第一编码单元152接收该量化数据和用于该量化数据的比例因子,并对量化数据、比例因子的差值等进行霍夫曼编码,作为用于预定流的格式的第一编码信号。
第二量化单元153监视从第一量化单元151输出的量化数据,以便检测每个比例因子频带中值为“0”的10个量化数据取样,因为这些值是由比例因子频带中与具有最大绝对值的频谱数据相邻的频谱数据而产生的。这10个取样包括紧邻着由最大绝对值的频谱数据而产生的量化数据之前的5个取样,和紧接在此量化数据之后的5个取样。第二量化单元153然后从变换单元121获得对应于检测到的10个频谱数据的取样的频谱值,并使用在编码装置102和解码装置202之间预先确定的一个比例因子来量化所获得的频谱数据,从而产生量化数据。第二量化单元153然后用较小比特量的数据表示此量化数据,并向第二编码单元154输出该量化数据。
第二编码单元154接收该量化数据,对其进行霍夫曼编码,成为用于流的格式的第二编码信号。之后,第二编码单元154向流输出单元160输出该第二编码信号。注意第二量化单元154量化使用的比例因子没有被编码。
流输出单元160接收来自第一编码单元152的第一编码信号,加入报头信息和其他必要的次级信息至该第一编码信号,并将其变换为MPEG-2 AAC的比特流。流输出单元160还接收来自第二编码单元154的第二编码信号,并将其放入上述MPEG-2 AAC比特流中的一个区域,该区域被常规解码装置忽略,或者对其未定义操作。
解码装置202
根据解码的第二编码信号,解码装置202重建频谱数据,并由此产生值为“0”的量化数据,因为该频谱数据与具有最大绝对值的频谱数据相邻。解码装置202包括流输入单元260,第一解码单元251,第一解量化单元252,第二解码单元253,第二解量化单元254,集成单元255,逆变换单元231,和音频信号输出单元241。
流输入单元260接收来自编码装置102的编码音频比特流,从该编码比特流中提取第一和第二编码信号,并输出第一和第二编码信号分别到第一解码单元251和第二解码单元253。
第一解码单元251接收第一编码信号,即流格式的霍夫曼编码数据,并将其解码为量化数据。
第一解量化单元252接收来自第一解码单元251的量化数据,将其解量化以产生22.05kHz再生频带的1024取样构成的频谱数据。
第二解码单元253接收来自流输入单元260的第二编码信号,将其解码为由10个取样构成的量化数据,该10个取样是由紧邻最大绝对值的频谱数据之前和之后的10个频谱数据的取样而产生的。第二解码单元253然后将该量化数据输出到第二解量化单元254。
第二解量化单元254使用预定的比例因子对量化数据解量化,以产生频谱数据的10个取样。第二解量化单元254查阅第一解量化单元252输出的频谱数据,以便检测出值为“0”的10个取样,因为这些取样紧邻着具有最大绝对值的频谱值。随后,第二解量化单元254确定所检测的10个取样的频率,将产生的10个取样与规定的频率关联,并将产生的10个取样输出到集成单元225。
集成单元225对第一和第二解量化单元252和254输出的频谱数据一起进行集成,并将集成后的频谱数据输出到逆变换单元231。更详细的,集成单元255中,从第一解量化单元252中输出并被上述频率所的频谱值被第二解量化单元254输出的频谱值(产生的10个取样)所替换。
逆变换单元231接收来自集成单元225的由1024个取样构成的集成频谱数据,并对频域内的频谱数据执行IMDCT变换,使其成为时域内的音频信号。
音频信号输出单元241将逆变换单元231输出的取样数据组顺序地结合以产生并输出数字音频数据。
如上所述,编码装置102使用与第一量化单元151所用的不同的另一个比例因子,对每个比例因子频带中紧邻着具有最大绝对值的频谱数据之前和之后的频谱数据进行编码,从而得到的量化数据的值不为“0”,这不同于常规技术,在常规技术中由最大绝对值附近的频谱数据产生的量化数据的值为“0”。这样产生的编码信号可实现更高的声音品质并增加了整个再生频带内峰值附近的再生信号的准确性。
在上述实施例中,第二量化单元153将变换单元121输出的频谱数据量化,虽然第二量化单元153量化的频谱数据并不局限于变换单元121输出的量化数据。例如,第二量化单元153可量化第一解量化单元151输出的量化数据解量化而产生的频谱数据。执行这种操作的编码装置102如图15所示。
图15是表示这种编码装置102和相应解码装置202的结构的方框图。编码装置102包括音频信号输入单元111,变换单元121,第一量化单元151,第一编码单元152,第二量化单元156,第二编码单元154,解量化单元155,和流输出单元160。
第二量化单元156通过解量化单元155监视第一量化单元151的量化结果,以便确定产生“0”值频谱数据的10个频谱数据取样,因为这些取样与最大绝对值的频谱数据相邻。第二量化单元156然后从解量化单元155获得确定的10个频谱数据的取样,并使用一个预定的比例因子对它们进行量化。
解量化单元155对从第一量化单元151输出的量化数据进行解量化以产生频谱数据,并向第二量化单元156输出所产生的频谱数据和原始的频谱数据。
以下将参照图16和17说明上述编码装置102和解码装置202的处理过程。
当编码装置102的第一量化单元151使用所确定的一个比例因子以常规技术执行量化从而使每个编码帧的比特量限制在传输信道的传输速率范围内时,与具有最大绝对值的频谱数据相邻的频谱数据往往会变为“0”值的量化数据。当解码装置202解码此量化数据时,得到的频谱数据在最大绝对值的频谱数据附近的值也为“0”,该最大绝对值的频谱数据是被单独地准确重建的。这种值为“0”的频谱数据会引起量化误差,这将降低再现音频信号的质量。
当比例因子被调整以避免与最大绝对值的频谱数据相邻的频谱数据的值变为“0”,然后用调整后的比例因子执行量化的时候,得到的量化数据会具有非常大的值。这是不希望出现的,特别是当编码音频比特流通过传输信道传输的时候,因为编码音频比特流的比特量很可能会根据量化数据的最大值而增加。
图16是表示常规编码装置300和本发明的编码装置102关于具体值的量化结果的差异的表500。对于常规编码装置300,量化单元331从变换单元320接收,例如包括值{10,40,100,30}的频谱数据501,并使用根据编码音频比特流的一个帧的比特量而确定的一个比例因子来量化此频谱数据501。结果,产生了例如包括值{0,0,1,0}的量化数据502。与频谱数据的最大值“100”相邻的频谱数据的值被变换为“0”值的量化数据。常规的编码装置300编码此量化数据502,该量化数据502被编码并传输至解码装置400。当解码装置400的解量化单元422对该量化数据502解量化时,得到的频谱数据505的值为{0,0,100,0}。
另一方面,对于本发明的编码装置102,当第一量化单元151接收来自变换单元121的包括值{10,40,100,30}的上述频谱数据501,并量化频谱数据501时,得到的量化数据与上述包括值{0,0,1,0}的量化数据502相同。此量化数据502然后被原样输出到第一编码单元152。为了补充量化数据502,本编码装置102还包括第二量化单元153/156,该第二量化单元使用一个预定的比例因子量化上述频谱数据501。第二量化单元153/156产生例如包括值{1,4,10,3}的量化数据。在量化数据503的这些值中,最小值为“1”,因此降低当前比例因子从而使该最小值为“0”。相应地,该量化数据503由不包括最大值附近“0”值的可能的最小值构成,虽然量化数据503的最大值为“10”,这是不够低的。
相应的,第二量化单元153/156使用一个指数函数或类似的函数来表示量化数据503以减少量化数据503的比特量。因此第二量化单元153/156产生例如包括值{1,2,0,2}的量化数据504。
更详细的,该量化数据504的第一个值“1”表示“2”,作为“2”的“1”次方,第二个值“2”表示“4”,作为“2”的“2”次方,第三个值“0”表示最大绝对值的频谱数据是由此量化值而产生的。最大绝对值的频谱数据可以由第一编码信号而准确地重建,该第一编码信号包括第一量化单元151所使用的一个比例因子和值为“1”的量化数据。因为第二编码单元154不编码每个比例因子频带中最大绝对值的频谱数据,所以得到的第二编码信号的比特量被进一步减少。量化数据504的第四个值“2”表示“4”,作为“2”的“2”次方。虽然包括值{1,2,0,2}的此量化数据504与包括值{1,4,10,3}的量化数据503不匹配,量化数据504仍可以只使用两个比特来代表所有的值。解码装置202由从第一编码信号获得的量化数据502和从第二编码信号获得的量化数据504来重建频谱数据。结果,得到了包括值{20,40,100,40}的频谱数据505。
对于上述编码装置102,从第二量化单元153/156输出的量化数据由较小比特量的数据来代表,从而使第二编码信号的比特量最小化。并且,由解码装置202重建的频谱数据与原始频谱数据即使在峰值附近也大致相同,虽然这种峰值附近的频谱数据为了减少编码数据的比特量,通常只被重建为“0”值。因此本编码装置102实现了原始声音更准确的再现。
在上述实施例中,由第二量化单元153产生的量化数据由基数“2”的指数来表示。然而该基数并不局限于“2”,也可以是其他值,包括不是整数的其他值。使用指数函数来表示第二量化单元153的量化数据也并非必需,其他函数也可以被使用。
图17A~17C表示编码装置102校正量化中的误差的一个例子。图17A表示从图14和15所示的变换单元121输出的频谱的一部分的波形图。在图17A中,最外侧的两个垂直虚线表示一个比例因子频带(表示为“sfb”),在该比例因子频带内的中央的垂直虚线表示该比例因子频带内具有最大绝对值的频谱数据的一个频率。该中线两侧是两个虚线,表示与最大绝对值的频谱数据相邻的10个频谱数据取样的范围。图17B表示作为图17A所示的频谱数据的量化结果的、由图14和15所示的第一量化单元151产生的量化数据的例子。图17C表示作为图17A所示的频谱数据的量化结果的、由图14和15所示的第二量化单元153/156产生的量化数据的例子。在图17A~17C中,水平轴表示频率。图17A中的垂直轴表示频谱值,图17B和17C中的垂直轴表示量化数据的量化值。
比例因子频带中的多组频谱数据被归一化并使用对整个比例因子频带共用的一个比例因子来量化。当此比例因子是根据整个帧的比特量来确定且该频谱数据的最大绝对值如图17A所示相对很大的时候,很可能最大绝对值的频谱数据变成值不为“0”的量化数据如图17B所示,但同一频带中的其他频谱数据的值一般都为“0”。这种量化数据从第一量化单元151输出到第一编码单元152。对于本编码装置102,图17C所示的量化数据也是由第二量化单元153/156产生的,并作为第二编码信号被传输到解码装置202。也就是说,第二量化单元153/156由最大绝对值的频谱数据而产生具有“0”值的量化数据,同时第二量化单元153/156还量化与此频谱数据相邻的10个取样。
第二量化单元153/156使用一个预定的比例因子进行量化。当此预定的比例因子恰好与第一量化单元151使用的一个比例因子相近时,如果第一量化单元151产生的量化数据值为“0”的话,得到的量化数据很可能值为“0”。因此适用于每个比例因子频带的一个比例因子被预先确定以提供给第二量化单元153/156,以便当第一量化单元151产生的量化数据值为“0”时,在更多的比例因子频带中得到如图17C所示非零值的量化数据。
也就是说,第二量化单元153/156由变换单元121或解量化单元155得到如图17B所示被第一量化单元151量化的频谱数据。第二量化单元153/156然后使用一个预定的比例因子量化得到的频谱数据以产生量化数据,使量化数据由较小比特量的数据来表示,并将其输出到第二编码单元154。从而第二量化单元153/156通过以下三个措施使第二编码信号的比特量最小化:(1)对编码装置102和解码装置202使用预先确定的比例因子和函数,从而比例因子和函数不需要被编码;(2)不量化最大绝对值的频谱数据;和(3)使用一个函数来表示由与最大绝对值的频谱数据相邻的10个频谱数据取样而产生的量化数据。
在上述实施例中,第二量化单元153/156量化两组连续的5个频谱数据取样。然而第二量化单元153/156量化的频谱数据取样并非必须是连续排列的,如果它们得到的量化值“0”出现在由最大绝对值的频谱数据而产生的量化值的附近的话。更具体的,第二量化单元153/156查阅第一量化单元151的量化结果,以便确定存在于具有最大绝对值并由此产生“0”值的量化数据组的频谱数据两侧的5个频谱数据取样。第二量化单元153/156然后使用所述的预定比例因子来量化所确定的频谱数据取样,以产生量化数据,用较少量的比特代表该量化数据,并将这些比特输出到第二编码单元154。解码装置202的第二解量化单元254监视第一解量化单元252产生的解量化的频谱数据,并确定位于最大绝对值的解量化频谱数据两侧的上述“0”值的5个频谱数据取样。第二解量化单元254还解量化第二编码信号中的量化数据以产生频谱数据,将此频谱数据与规定的10个取样结合,并将其输出到集成单元255。
第二量化单元153量化的频谱数据的取样数目并不局限于包括两组5个取样的数目10,该两组5个取样位于最大绝对值的频谱数据两侧。这些取样的数目可以更少也可以大于5个。第二量化单元153还可以根据每个帧的编码比特流的比特量而确定这些取样的数目。在这种情况下,该取样的数目和这些取样的量化数据可以被包含在第二编码信号中。
在本实施例中,第二量化单元153/156使用一个预定的比例因子进行量化。然而也可以对每个比例因子频带计算一个适当的比例因子,并使每个计算的比例因子包含在第二编码信号中。例如,通过计算可以产生最大值“7”的量化数据的一个比例因子,传输量化数据所要求的数据的比特量可以被减少。
在本实施例中,第二编码信号只包括第二量化单元153/156产生的量化数据或者这种量化数据和比例因子。然而第二编码信号还可能包括其他信息。也就是说,编码装置102也可以产生表示较高频率频谱数据的子信息,如第一实施例所述,以及使用一个预定的比例因子来量化10个频谱数据取样,以产生量化数据。该量化数据和该子信息包含在第二编码信号中。在这种情况下,编码装置102就不传输较高频率频谱数据及其比例因子,并且解码装置202根据子信息来重建较高频率频谱数据。在图10和11中以及第一实施例的末尾已描述了用于短块的子信息。用于长块的子信息也可以通过与用于短块的子信息相同的方式来产生,除了用于长块的子信息对应于较高频带中的512个取样,而用于短块的子信息对应于较高频带中的64个取样。基于长块的取样被放置到基于长块的比例因子频带中。当第三实施例中子信息以这种方式被添加时,编码音频比特流的比特量可以通过较高频率量化数据的比特量和比例因子被减少。
上面描述的子信息是为每个比例因子频带而产生的。然而也可以为两个或更多的比例因子频带产生单独一组子信息。也可以为单独一个比例因子频带产生两组子信息。
本实施例的子信息可对每个信道或者对两个或更多信道编码。
在上述情况下,根据子信息来复制较低频带中的频谱数据以重建较高频率频谱数据并不是必需的。相反,较高频率频谱数据可以只由第二编码信号来产生。
本发明的编码装置102和解码装置202,可以简单地通过为常规的编码装置增加第二量化单元153/156和第二编码单元154,以及为常规的解码装置增加第二解码单元253和第二解量化单元254而实现。从而不需要过多的改变常规编码和解码装置的结构就可以实现编码装置102和解码装置202。
通过使用常规MPEG-2 AAC作为一个例子已经描述了第三实施例,然而其它的音频编码方法,包括最新研究的编码方法,都可以被用于本发明。
第三实施例的第二编码信号可以被附加在第一编码信号的尾端,如第一实施例的图5B所示,或者被附加在报头信息的尾部,如图5C所示。然而应注意,本发明的第一编码信号是基于长块的,因此一个帧的第一编码信号对应于1024个取样构成的音频信号。当常规解码装置400以这种方式接收包含在编码音频比特流中的第二编码信号时,解码装置400可无误差的再现编码音频比特流。第二编码信号可以被插入第一编码信号或报头信息中。编码比特流中第二编码信号被插入的区域可以不连续的排列,也可以是分散的,如图6C所示,其中第二编码信号被插入到报头信息和第一编码信号中的不连续区域。还可以将第二编码信号和第一编码信号包含在分离的比特流中,如图6A,6B所示。从而有可能预先传输或累积音频信号的基本部分,如果需要再随后传输较高频带中音频信号的信息。
第三实施例已描述了包含两个量化单元和两个编码单元的编码装置102。然而编码装置102也可以包含三个或更多个量化单元和编码单元。
类似的,解码装置202可以包括三个或更多个解量化单元和解码单元,虽然第三实施例描述了包括两个解量化单元和两个解码单元的解码装置102。
本发明描述的操作不仅可以通过硬件实现也可以用软件实现。或者部分操作用硬件实现而剩余部分用软件实现。
本发明的编码装置100,101,102可以被安装在内容分配系统内的广播站中,并可以将本发明的编码音频特流传输到包括解码装置200,201或202的内容分配系统的一个接收装置。
工业实用性
本发明的编码装置可以用于作为卫星广播,包括BS(广播卫星)和CS(通信卫星)的广播站使用的音频编码装置,或者作为通过通信网络例如因特网,来分配内容的内容分配服务器使用的音频编码装置。本编码装置作为通用计算机进行音频信号编码所执行的程序也是非常有用的。
本发明的解码装置不仅可以用于作为家用STB中提供的音频解码装置,而且可以作为通用计算机进行音频信号解码所执行的程序,STB或通用计算机中的电路板和LSI,以及STB或通用计算机中插入的IC卡。

Claims (37)

1.一种接收和编码音频信号的编码装置,包括:
变换单元,用于以预定的时间间隔提取一部分接收的音频信号,并变换所提取的每个部分以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;
判断单元,用于将窗口频谱相互比较,以判断在所比较的窗口频谱中是否存在预定程度的相似性;
替换单元,用于在判断单元判断存在相似性时,将所产生的窗口频谱中的一第一窗口频谱的高频部分替换为一个预定值,其中该第一窗口频谱和同样是所产生的窗口频谱之一的一第二窗口频谱共用第二窗口频谱的高频部分;
第一量化单元,用于量化多个窗口频谱,以在替换单元的操作之后产生多个量化的窗口频谱;
第一编码单元,用于编码量化的窗口频谱以产生第一编码数据;和
输出单元,用于输出所产生的第一编码数据。
2.如权利要求1的编码装置,还包括:
平均单元,用于(a)为每个频率确定第一和第二窗口频谱的高频部分的一个平均值,以产生由多个所确定的平均值构成的新的高频部分,(b)将第二窗口频谱的高频部分替换为新的高频部分,
其中第一量化单元在平均单元和替换单元的操作之后量化每个窗口频谱。
3.如权利要求1的编码装置,还包括:
共用信息产生单元,用于产生表示判断单元对多个窗口频谱的每一个的判断结果的共用信息;和
第二编码单元,用于编码所产生的共用信息以产生第二编码数据,
其中输出单元还输出该第二编码数据。
4.如权利要求3的编码装置,
其中判断单元确定多个窗口频谱间一个能量差异,并在所确定的能量差异小于一个预定阈值时判断存在相似性。
5.如权利要求3的编码装置,
其中判断单元确定频率轴上多个窗口频谱的每一个的一个峰值的位置,将窗口频谱的所确定位置相互比较,并根据比较结果做出判断。
6.如权利要求3的编码装置,
其中判断单元使用一个预定的函数变换多个窗口频谱,将变换的窗口频谱相互比较,并根据比较结果做出判断。
7.如权利要求3的编码装置,还包括,
子信息产生单元,用于产生表示第二窗口频谱的高频部分特性的子信息,
其中第二编码单元将所产生的子信息和共用信息编码,以产生第二编码数据,和
替换单元也将第二窗口频谱的高频部分替换为一个预定的值。
8.如权利要求7的编码装置,
其中多个窗口频谱的每一个被分为多个频带,和
子信息产生单元对第二窗口频谱的高频部分的每个频带计算一个归一化因子,并使用每个计算的归一化因子作为子信息,其中每个计算的归一化因子被用于量化每个频带中的一个峰值,从而产生在高频部分的所有频带中都相同的一个量化值。
9.如权利要求7的编码装置,
其中多个窗口频谱的每一个被分为多个频带,和
子信息产生单元使用所有频带共用的一个归一化因子来量化第二窗口频谱的高频部分中每个频带的一个峰值,并将该量化结果用作为子信息。
10.如权利要求7的编码装置,
其中多个窗口频谱的每一个被分为多个频带,和
子信息产生单元确定频率轴上的一个位置,在该位置存在第二窗口频谱的高频部分的每个频带中的一个峰值,并将每个所确定的位置用作为子信息。
11.如权利要求7的编码装置,
其中多个窗口频谱的每一个都是一个修正的离散余弦变换(MDCT)的系数,并被分为多个频带,和
子信息产生单元确定第二窗口频谱的高频部分中频率轴上的预定位置上存在的一个值的正/负符号,并将该确定的正/负符号用作为子信息。
12.如权利要求7的编码装置,
其中多个窗口频谱的每一个被分为多个频带,和
子信息产生单元(a)对高频部分的每个频带的频谱产生确定了第二窗口频谱的低频部分中的一个频谱的信息,其中每个确定的频谱都最相似于第二窗口频谱的高频部分的一个频带内的一个频谱,和(b)将所产生的信息用作为子信息。
13.如权利要求12的编码装置,
其中子信息产生单元所产生的信息被表示为识别该确定频谱的一个数字。
14.如权利要求3的编码装置,其中输出单元包括
流输出单元,用于(a)将第一编码数据变换为具有预定格式的编码音频流,(b)将第二编码数据放置到编码音频流中允许预定格式的自由使用的一个区域中,和(c)输出该编码音频流。
15.如权利要求14的编码装置,还包括
信息添加单元,用于将识别信息添加至第二编码数据,该识别信息表示第二编码数据是由第二编码单元产生的,
其中流输出单元将已添加了识别信息的第二编码数据放置到编码音频流的区域中。
16.如权利要求3的编码装置,
其中输出单元还包括
第二流输出单元,用于(a)将第一编码数据变换为具有预定格式的编码音频流,(b)将第二编码数据放置到不同于存有第一编码数据的编码音频流的第二流中,和(c)输出该第二流和音频流。
17.如权利要求1的编码装置,
其中当判断单元判断存在相似性时,替换单元还将第一窗口频谱的一个低频部分替换为一个预定的值。
18.如权利要求1的编码装置,
其中多个窗口频谱中的每一个由多组数据构成,和
编码装置还包括:
第二量化单元,用于以一预定的归一化因子来量化输入给第一量化单元的每个窗口频谱中峰值附近的特定组数据,其中在第二量化单元的量化之前,第一量化单元量化该特定组数据以产生具有预定值的多组量化数据;和
第二编码单元,用于编码第二量化单元所量化的多组数据,从而产生第二编码数据,
其中输出单元输出该第二编码数据和第一编码数据。
19.如权利要求18的编码装置,
其中在产生多组量化数据之后,第二量化单元使用一个预定的函数来变换该多组量化数据,从而该多组量化数据在被编码后比特量减少。
20.如权利要求19的编码装置,
其中多个窗口频谱的每一个被分为多个频带,
第一量化单元对每个频带执行量化,和
第二量化单元不量化每个频带中的一个峰值并用一个预定的值来表示该峰值。
21.如权利要求20的编码装置,
其中第二量化单元还包括
因子确定单元,用于确定第二量化单元所使用的归一化因子,以产生具有预定比特量的多组量化数据,和
第二量化单元使用该确定的归一化因子来量化该特定组数据以产生预定比特量的多组量化数据,并输出该多组量化数据和所确定的归一化因子。
22.一种接收和解码表示音频信号的编码数据的解码装置,
其中该编码数据包括第一区域内的第一编码数据,该解码装置包括:
第一解码单元,用于解码第一区域内的第一编码数据以产生第一解码数据;
第一解量化单元,用于解量化第一解码数据以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;
判断单元,用于(a)监视所产生的窗口频谱,从而找到其高频部分由预定值组成的一第一窗口频谱,(b)判断该第一窗口频谱的高频部分将由包含在多个窗口频谱中的一第二窗口频谱的高频部分来重建;
第二解量化单元,用于(a)从第一解量化单元获得第二窗口频谱的高频部分,(b)复制所获得的高频部分,(c)将复制的高频部分与第一窗口频谱相关联,(d)输出所复制的高频部分;和
音频信号输出单元,用于(a)从第二解量化单元获得所复制的高频部分,并从第一解量化单元获得第一窗口频谱,(b)将第一窗口频谱的高频部分替换为复制的高频部分,(c)将包含替换的高频部分的第一窗口频谱变换为时域内的音频信号,(d)输出该音频信号。
23.如权利要求22的解码装置,
其中解码装置所接收的编码数据还包括,在第二区域中的关于第一窗口频谱和第二窗口频谱的编码共用信息,和
该解码装置还包括:
分离单元,用于从接收的编码数据的第二区域中分离出编码的共用信息;
第二解码单元,用于解码所分离的共用信息以获得解码的共用信息,
其中第二解量化单元根据该解码的共用信息进行操作。
24.如权利要求23的解码装置,
其中解码装置所接收的编码数据还包括,第二区域中的表示第二窗口频谱的高频部分特性的编码子信息,
分离单元还从接收的编码数据的第二区域中分离出编码子信息,
第二解码单元还解码该分离的编码子信息以获得解码的子信息,
第二解量化单元根据解码子信息和共用信息而产生第二窗口频谱的高频部分,将所产生的高频部分与第一窗口频谱相关联,并输出该产生的高频部分,和
音频信号输出单元将第一窗口频谱的高频部分替换为所产生的高频部分,并将包含所产生的高频部分的第一窗口频谱变换为时域内的音频信号,并输出该音频信号。
25.如权利要求24的解码装置,
其中多个窗口频谱的每一个被分为多个频带,
子信息是第二窗口频谱的高频部分的每个频带的一个归一化因子,其中每个归一化因子被用于量化高频部分的每个频带中的一个峰值,从而产生该高频部分的所有频带中都相同的一个量化值,和
第二解量化单元使用解码子信息中所示的每个归一化因子来解量化每个频带中的量化值以得到每个峰值,并产生第二窗口频谱的包括将每个获得峰值作为每个频带中峰值的高频部分。
26.如权利要求24的解码装置,
其中多个窗口频谱的每一个被分为多个频带,
该子信息是第二窗口频谱的高频部分中每个频带内的一个量化峰值,每个量化峰值使用高频部分中所有频带共用的一个归一化因子被量化,
第二解量化单元使用该单独的归一化因子来解量化显示为子信息的每个量化峰值以得到每个峰值,并产生第二窗口频谱的包括将每个获得峰值作为每个频带中峰值的高频部分。
27.如权利要求24的解码装置,
其中多个窗口频谱的每一个被分为多个频带,
子信息表示在频率轴上第二窗口频谱的高频部分的每个频带中的峰值存在的一个位置,和
第二解量化单元产生高频部分,在该高频部分中每个频带中的一个峰值出现在该子信息所示位置上。
28.如权利要求24的解码装置,
其中多个窗口频谱的每一个都是一个修正离散余弦变换(MDCT)的系数,并被分为多个频带,
子信息是存在于第二窗口频谱的高频部分中频率轴的预定位置上的一个值的正/负符号,和
第二解量化单元产生预定位置上包含具有解码子信息所示正/负符号的值的高频部分。
29.如权利要求24的解码装置,
其中多个窗口频谱的每一个被分为多个频带,
子信息对高频部分每个频带的一个频谱确定了第二窗口频谱低频部分中的一个频谱,其中每个所确定的频谱与第二窗口频谱高频部分的频带中的一个频谱最相似,和
第二量化单元(a)从第一解量化单元产生的低频部分的频谱中找到由子信息所确定的每个频谱,(b)复制每个找到的频谱以产生多个复制频谱,和(c)产生第二窗口频谱中由产生的复制频谱构成的高频部分。
30.如权利要求23的解码装置,
其中由解码装置接收的编码数据是具有预定格式的编码音频流,
第二区域是允许预定格式的自由使用的一个区域,
分离单元从第二区域中分离出包括编码共用信息的数据,和
第二解码单元分析该分离的数据,并只对编码共用信息进行解码,即使在被分析的分离数据包括识别编码共用信息的识别信息时。
31.如权利要求23的解码装置,
其中根据解码的共用信息,第二解量化单元复制整个第二窗口频谱并将复制的第二窗口频谱与第一窗口频谱相关联,和
音频信号输出单元将第一窗口频谱替换为复制的第二窗口频谱,并将该替换的第一窗口频谱变换为时域内的音频信号。
32.如权利要求22的解码装置,
其中第二解量化单元用一预定的系数,放大第二窗口频谱的复制高频部分的幅值,并将具有放大幅值的复制高频部分与第一窗口频谱相关联,并输出该复制的高频部分。
33.如权利要求22的解码装置,
其中当找到由都具有一个预定值的多组数据构成的一个窗口频谱时,判断单元判断该找到的窗口频谱的高频部分将由第二窗口频谱的高频部分来重建,
根据判断单元的判断结果,第二解量化单元从第一解量化单元获得包括高频和低频部分的整个第二窗口频谱,复制所获得的第二窗口频谱,将复制的第二窗口频谱与找到的窗口频谱相关联,并输出该复制的第二窗口频谱,和
音频信号输出单元将整个找到的窗口频谱替换为复制的第二窗口频谱,将替换的窗口频谱变换为时域内的音频信号,并输出该音频信号。
34.如权利要求22的解码装置,
其中解码装置所接收的编码数据还包括第二编码数据,该数据是通过用一预定的归一化因子量化一部分窗口频谱而产生的,该预定的归一化因子不同于第一编码数据中量化相同的窗口频谱所使用的归一化因子,和
解码装置还可包括:
第二分离单元,用于从接收的编码数据的第二区域中分离出第二编码数据;
第二解码单元,用于解码分离的第二编码数据以获得第二解码数据,
其中第二解量化单元还可以(a)监视由第一解量化单元产生的多个窗口频谱,从而找到一个窗口频谱中连续地包含预定值的一部分,(b)确定对应于找到部分并包含在第二解码数据中的一个部分,(c)使用该预定的归一化因子来解量化该确定部分,以获得由多组数据构成的解量化部分,
音频信号输出单元还可以(a)将第二解量化单元找到的部分替换为多组数据,(b)将包含多组数据的窗口频谱变换为时域内的音频信号,(c)输出该音频信号。
35.如权利要求34的解码装置,
其中第二解量化单元使用一个预定的函数来变换第二解码数据的所确定部分,然后解量化该变换部分以获得解量化部分。
36.如权利要求35的解码装置,
其中自第二解码数据,第二解量化单元可以(a)提取预定的归一化因子和用该预定归一化因子量化的确定部分,(b)使用该预定函数来变换所提取的部分以产生一个变换部分,(c)使用该提取的归一化因子来解量化该变换部分,以获得解量化部分。
37.一种包括一编码装置和一解码装置的音频数据分配系统,其中该编码装置通过记录介质和传输信道中的一种以低比特率将包含编码音频数据的比特流传输到该解码装置,
其中该编码装置包括:
变换单元,用于以预定的时间间隔提取一部分接收的音频信号,并变换所提取的每个部分以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;
判断单元,用于将窗口频谱相互比较,以判断在所比较的窗口频谱中是否存在预定程度的相似性;
替换单元,用于在判断单元判断存在相似性时,将所产生的窗口频谱中的一第一窗口频谱的高频部分替换为一个预定值;其中该第一窗口频谱和同样是所产生的窗口频谱之一的一第二窗口频谱共用第二窗口频谱的高频部分;
第一量化单元,用于量化多个窗口频谱以在替换单元的操作之后产生多个量化的窗口频谱;
第一编码单元,用于编码量化的窗口频谱以产生编码数据;和
输出单元,用于输出所产生的编码数据,
其中该解码装置,包括:
第一解码单元,用于解码包括在从编码装置输出的编码数据的一第一区域内的第一编码数据以产生第一解码数据;
第一解量化单元,用于解量化第一解码数据以在每个帧周期内产生多个窗口频谱,其中所产生的窗口频谱由短块组成,并表示出频率频谱随着时间是如何变化的;
判断单元,用于(a)监视所产生的窗口频谱,从而找到其高频部分具有预定值的一第一窗口频谱,(b)判断该第一窗口频谱的高频部分将由第二窗口频谱的高频部分来重建;
第二解量化单元,用于(a)由第一解量化单元获得第二窗口频谱的高频部分,(b)复制所获得的高频部分,(c)将复制的高频部分与第一窗口频谱相关联,(d)输出所复制的高频部分;和
音频信号输出单元,用于(a)从第二解量化单元获得复制的高频部分,和从第一解量化单元获得第一窗口频谱,(b)将第一窗口频谱的高频部分替换为复制的高频部分,(c)将包含替换的高频部分的第一窗口频谱变换为时域内的音频信号,(d)输出该音频信号。
CN02803419.8A 2001-11-02 2002-10-30 编码装置和解码装置 Expired - Fee Related CN1209744C (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2001337869A JP3923783B2 (ja) 2001-11-02 2001-11-02 符号化装置及び復号化装置
JP337869/2001 2001-11-02
JP2001367008 2001-11-30
JP367008/2001 2001-11-30
JP2001381807A JP3984468B2 (ja) 2001-12-14 2001-12-14 符号化装置、復号化装置及び符号化方法
JP381807/2001 2001-12-14

Publications (2)

Publication Number Publication Date
CN1484822A CN1484822A (zh) 2004-03-24
CN1209744C true CN1209744C (zh) 2005-07-06

Family

ID=27347778

Family Applications (3)

Application Number Title Priority Date Filing Date
CNB02803421XA Expired - Fee Related CN1324558C (zh) 2001-11-02 2002-10-30 编码设备,解码设备以及音频数据分配系统
CN02809440.9A Expired - Fee Related CN1288622C (zh) 2001-11-02 2002-10-30 编码设备和解码设备
CN02803419.8A Expired - Fee Related CN1209744C (zh) 2001-11-02 2002-10-30 编码装置和解码装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CNB02803421XA Expired - Fee Related CN1324558C (zh) 2001-11-02 2002-10-30 编码设备,解码设备以及音频数据分配系统
CN02809440.9A Expired - Fee Related CN1288622C (zh) 2001-11-02 2002-10-30 编码设备和解码设备

Country Status (5)

Country Link
US (3) US7283967B2 (zh)
EP (3) EP1440433B1 (zh)
CN (3) CN1324558C (zh)
DE (3) DE60204039T2 (zh)
WO (3) WO2003038389A1 (zh)

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6946587B1 (en) 1990-01-22 2005-09-20 Dekalb Genetics Corporation Method for preparing fertile transgenic corn plants
US6025545A (en) 1990-01-22 2000-02-15 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
DE60214027T2 (de) 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
CA2430923C (en) * 2001-11-14 2012-01-03 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and system thereof
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
AU2003216686A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
AU2003302486A1 (en) 2003-09-15 2005-04-06 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
KR100530377B1 (ko) * 2003-12-30 2005-11-22 삼성전자주식회사 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법
PL1706866T3 (pl) * 2004-01-20 2008-10-31 Dolby Laboratories Licensing Corp Kodowanie dźwięku w oparciu o grupowanie bloków
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
AU2005270105B2 (en) 2004-07-02 2011-03-31 Nielsen Media Research, Inc. Methods and apparatus for mixing compressed digital bit streams
JP4533386B2 (ja) * 2004-07-22 2010-09-01 富士通株式会社 オーディオ符号化装置及びオーディオ符号化方法
CN101124626B (zh) * 2004-09-17 2011-07-06 皇家飞利浦电子股份有限公司 用于最小化感知失真的组合音频编码
CN101027718A (zh) * 2004-09-28 2007-08-29 松下电器产业株式会社 可扩展性编码装置以及可扩展性编码方法
KR100750115B1 (ko) * 2004-10-26 2007-08-21 삼성전자주식회사 오디오 신호 부호화 및 복호화 방법 및 그 장치
US8769135B2 (en) * 2004-11-04 2014-07-01 Hewlett-Packard Development Company, L.P. Data set integrity assurance with reduced traffic
RU2500043C2 (ru) * 2004-11-05 2013-11-27 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
UA91853C2 (ru) * 2005-04-01 2010-09-10 Квелкомм Инкорпорейтед Способ и устройство для векторного квантования спектрального представления огибающей
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
DE502006004136D1 (de) 2005-04-28 2009-08-13 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
DE102005032079A1 (de) * 2005-07-08 2007-01-11 Siemens Ag Verfahren und Vorrichtung zur Geräuschunterdrückung
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US20070036228A1 (en) * 2005-08-12 2007-02-15 Via Technologies Inc. Method and apparatus for audio encoding and decoding
CN1937032B (zh) * 2005-09-22 2011-06-15 财团法人工业技术研究院 切割语音数据序列的方法
EP1946302A4 (en) * 2005-10-05 2009-08-19 Lg Electronics Inc SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS
KR100857115B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
KR20070077652A (ko) * 2006-01-24 2007-07-27 삼성전자주식회사 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법
US7624417B2 (en) 2006-01-27 2009-11-24 Robin Dua Method and system for accessing media content via the internet
US8064608B2 (en) * 2006-03-02 2011-11-22 Qualcomm Incorporated Audio decoding techniques for mid-side stereo
KR100738109B1 (ko) * 2006-04-03 2007-07-12 삼성전자주식회사 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
JP2007293118A (ja) * 2006-04-26 2007-11-08 Sony Corp 符号化方法および符号化装置
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
US7974848B2 (en) * 2006-06-21 2011-07-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding audio data
KR101393299B1 (ko) * 2006-06-21 2014-05-09 삼성전자주식회사 오디오 데이터 부호화 방법 및 장치
US8010370B2 (en) * 2006-07-28 2011-08-30 Apple Inc. Bitrate control for perceptual coding
US8032371B2 (en) * 2006-07-28 2011-10-04 Apple Inc. Determining scale factor values in encoding audio data with AAC
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
WO2008045950A2 (en) 2006-10-11 2008-04-17 Nielsen Media Research, Inc. Methods and apparatus for embedding codes in compressed audio data streams
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
JP4984178B2 (ja) * 2006-12-25 2012-07-25 国立大学法人九州工業大学 高域信号補間装置及び高域信号補間方法
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
WO2008088772A2 (en) 2007-01-12 2008-07-24 Ictv, Inc. Mpeg objects and systems and methods for using mpeg objects
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
JP2008261978A (ja) * 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
US20090132238A1 (en) * 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
JP5328804B2 (ja) * 2007-12-21 2013-10-30 フランス・テレコム 適応型ウィンドウを有する変換ベースの符号化/復号化
RU2483367C2 (ru) * 2008-03-14 2013-05-27 Панасоник Корпорэйшн Устройство кодирования, устройство декодирования и способ для их работы
US7782195B2 (en) * 2008-03-19 2010-08-24 Wildlife Acoustics, Inc. Apparatus for scheduled low power autonomous data recording
WO2009116582A1 (ja) * 2008-03-19 2009-09-24 国立大学法人 北海道大学 動画検索装置および動画検索プログラム
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101381513B1 (ko) * 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CN101751928B (zh) * 2008-12-08 2012-06-13 扬智科技股份有限公司 应用音频帧频谱平坦度简化声学模型分析的方法及其装置
RU2538334C2 (ru) * 2009-02-26 2015-01-10 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Кодер, декодер и способ для них
WO2010108332A1 (zh) * 2009-03-27 2010-09-30 华为技术有限公司 编码和解码方法及装置
EP2425426B1 (en) * 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
CA3008502C (en) 2009-05-01 2020-11-10 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US9245148B2 (en) 2009-05-29 2016-01-26 Bitspray Corporation Secure storage and accelerated transmission of information over communication networks
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8311843B2 (en) * 2009-08-24 2012-11-13 Sling Media Pvt. Ltd. Frequency band scale factor determination in audio encoding based upon frequency band signal energy
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5345737B2 (ja) * 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
GB2481185A (en) * 2010-05-28 2011-12-21 British Broadcasting Corp Processing audio-video data to produce multi-dimensional complex metadata
BR112012032746A2 (pt) * 2010-06-21 2016-11-08 Panasonic Corp dispositivo de descodificação, dispositivo de codificação, e métodos para os mesmos.
ES2536902T3 (es) * 2010-07-05 2015-05-29 Nippon Telegraph And Telephone Corporation Método codificador, método decodificador, dispositivo codificador, dispositivo decodificador, programa y medio de grabación
CN102959872A (zh) * 2010-07-05 2013-03-06 日本电信电话株式会社 编码方法、解码方法、装置、程序及记录介质
US9112535B2 (en) * 2010-10-06 2015-08-18 Cleversafe, Inc. Data transmission utilizing partitioning and dispersed storage error encoding
WO2012051528A2 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
CN103329199B (zh) * 2011-01-25 2015-04-08 日本电信电话株式会社 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
EP2695388B1 (en) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR20130034566A (ko) * 2011-09-28 2013-04-05 한국전자통신연구원 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치
US9390722B2 (en) 2011-10-24 2016-07-12 Lg Electronics Inc. Method and device for quantizing voice signals in a band-selective manner
US11665482B2 (en) 2011-12-23 2023-05-30 Shenzhen Shokz Co., Ltd. Bone conduction speaker and compound vibration device thereof
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9380320B2 (en) * 2012-02-10 2016-06-28 Broadcom Corporation Frequency domain sample adaptive offset (SAO)
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
CN102594701A (zh) * 2012-03-14 2012-07-18 中兴通讯股份有限公司 一种频谱重构的确定方法及系统
CN103325373A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于传送和接收音频信号的方法和设备
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9357215B2 (en) * 2013-02-12 2016-05-31 Michael Boden Audio output distribution
JP6073456B2 (ja) * 2013-02-22 2017-02-01 三菱電機株式会社 音声強調装置
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CN105103452B (zh) * 2013-05-30 2018-03-13 日本电气株式会社 数据压缩系统
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
EP3040987B1 (en) * 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
CN104811584B (zh) * 2014-01-29 2018-03-27 晨星半导体股份有限公司 影像处理电路与方法
US9594580B2 (en) 2014-04-09 2017-03-14 Bitspray Corporation Secure storage and accelerated transmission of information over communication networks
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
CN104021792B (zh) * 2014-06-10 2016-10-26 中国电子科技集团公司第三十研究所 一种语音丢包隐藏方法及其系统
KR102474541B1 (ko) * 2014-10-24 2022-12-06 돌비 인터네셔널 에이비 오디오 신호들의 인코딩 및 디코딩
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
CN106033982B (zh) * 2015-03-13 2018-10-12 中国移动通信集团公司 一种实现超宽带语音互通的方法、装置和终端
GB2545434B (en) * 2015-12-15 2020-01-08 Sonic Data Ltd Improved method, apparatus and system for embedding data within a data stream
EP3427178B1 (en) 2016-03-09 2020-12-02 Bitspray Corporation Secure file sharing over multiple security domains and dispersed communication networks
CN108089782B (zh) * 2016-11-21 2021-02-26 佳能株式会社 用于对相关用户界面对象的改变进行建议的方法和装置
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
BR112021004719A2 (pt) 2018-09-12 2021-06-22 Shenzhen Voxtech Co., Ltd. dispositivo de processamento de sinal com múltiplos transdutores elétrico acústicos
CN110111800B (zh) * 2019-04-04 2021-05-07 深圳信息职业技术学院 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备
JP7311319B2 (ja) * 2019-06-19 2023-07-19 ファナック株式会社 時系列データ表示装置
TWI762908B (zh) * 2020-04-17 2022-05-01 新唐科技股份有限公司 串接式擴增裝置及包含其之串接式系統

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3967067A (en) * 1941-09-24 1976-06-29 Bell Telephone Laboratories, Incorporated Secret telephony
CH497089A (de) * 1968-07-26 1970-09-30 Autophon Ag Anlage zur Übermittlung von kontinuierlichen Signalen
US3566035A (en) * 1969-07-17 1971-02-23 Bell Telephone Labor Inc Real time cepstrum analyzer
US3659051A (en) * 1971-01-29 1972-04-25 Meguer V Kalfaian Complex wave analyzing system
US3919481A (en) * 1975-01-03 1975-11-11 Meguer V Kalfaian Phonetic sound recognizer
US4039754A (en) * 1975-04-09 1977-08-02 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Speech analyzer
US4058676A (en) * 1975-07-07 1977-11-15 International Communication Sciences Speech analysis and synthesis system
US4158751A (en) * 1978-02-06 1979-06-19 Bode Harald E W Analog speech encoder and decoder
US4424415A (en) * 1981-08-03 1984-01-03 Texas Instruments Incorporated Formant tracker
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
JPH0761044B2 (ja) 1986-07-28 1995-06-28 日本電信電話株式会社 音声符号化法
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
FR2690551B1 (fr) 1991-10-15 1994-06-03 Thomson Csf Procede de quantification d'un filtre predicteur pour vocodeur a tres faible debit.
CA2090052C (en) 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5546477A (en) * 1993-03-30 1996-08-13 Klics, Inc. Data compression and decompression
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JP3277692B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
US5890110A (en) * 1995-03-27 1999-03-30 The Regents Of The University Of California Variable dimension vector quantization
US5867819A (en) * 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
KR19990082402A (ko) * 1996-02-08 1999-11-25 모리시타 요이찌 광대역 오디오신호 부호장치, 광대역 오디오신호 복호장치, 광대역 오디오신호 부호 복호장치 및 광대역 오디오신호 기록매체
JP3344944B2 (ja) 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JP3318825B2 (ja) 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH10340099A (ja) 1997-04-11 1998-12-22 Matsushita Electric Ind Co Ltd オーディオデコーダ装置及び信号処理装置
TW405328B (en) 1997-04-11 2000-09-11 Matsushita Electric Ind Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
JP3813025B2 (ja) 1998-10-29 2006-08-23 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP4409733B2 (ja) 1999-09-07 2010-02-03 パナソニック株式会社 符号化装置、符号化方法、及びその記録媒体
US6678653B1 (en) 1999-09-07 2004-01-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for coding audio data at high speed using precision information
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP2001154698A (ja) 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法
JP3510168B2 (ja) 1999-12-09 2004-03-22 日本電信電話株式会社 音声符号化方法及び音声復号化方法
JP2001188563A (ja) 2000-01-05 2001-07-10 Matsushita Electric Ind Co Ltd オーディオ符号化のための効果的なセクション化法
JP3597750B2 (ja) 2000-04-11 2004-12-08 松下電器産業株式会社 グループ化方法及びグループ化装置

Also Published As

Publication number Publication date
US7328160B2 (en) 2008-02-05
EP1440432B1 (en) 2005-05-04
EP1440300A1 (en) 2004-07-28
CN1324558C (zh) 2007-07-04
EP1440432A1 (en) 2004-07-28
US20030088328A1 (en) 2003-05-08
DE60204038D1 (de) 2005-06-09
US20030088400A1 (en) 2003-05-08
CN1484822A (zh) 2004-03-24
WO2003038389A1 (en) 2003-05-08
DE60204039T2 (de) 2006-03-02
CN1507618A (zh) 2004-06-23
EP1440433B1 (en) 2005-05-04
US7283967B2 (en) 2007-10-16
DE60208426T2 (de) 2006-08-24
DE60204038T2 (de) 2006-01-19
DE60208426D1 (de) 2006-02-02
CN1288622C (zh) 2006-12-06
EP1440433A1 (en) 2004-07-28
WO2003038813A1 (en) 2003-05-08
EP1440300B1 (en) 2005-12-28
WO2003038812A1 (en) 2003-05-08
CN1484756A (zh) 2004-03-24
DE60204039D1 (de) 2005-06-09
US7392176B2 (en) 2008-06-24
US20030088423A1 (en) 2003-05-08

Similar Documents

Publication Publication Date Title
CN1209744C (zh) 编码装置和解码装置
CN1126265C (zh) 可伸缩的立体声音频编码/解码方法和装置
CN1288625C (zh) 音频编码与解码设备及其方法
CN1096148C (zh) 信号编码方法和装置
CN1161751C (zh) 语音分析方法和语音编码方法及其装置
CN1233163C (zh) 多声道数字音频信号的压缩编码和解码设备及其方法
CN1101087C (zh) 信号编码方法及装置、信号解码方法及装置和信号传送方法
CN1765072A (zh) 多声道音频扩展支持
CN101036183A (zh) 立体声兼容的多声道音频编码
CN1702974A (zh) 用于对数字信号编码/解码的方法和设备
CN1202514C (zh) 编码和解码语音及其参数的方法、编码器、解码器
CN1281006C (zh) 信息编码/译码方法和装置和信息传输方法
CN1748443A (zh) 多声道音频扩展支持
CN1910655A (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN1890711A (zh) 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法
CN1097396C (zh) 声音编码装置和方法
CN1595985A (zh) 内容提供装置和方法以及记录介质
CN1747608A (zh) 音频信号处理装置和方法
CN1961486A (zh) 多信道信号编码方法、解码方法、装置、程序及其存储介质
CN1977311A (zh) 语音编码装置、语音解码装置及其方法
CN1257639A (zh) 音频信道混合
CN1942931A (zh) 通过树型分层数据结构的有序横向结构描述比特流语法的音频比特流格式
CN1465044A (zh) 声信号编码方法和设备、解码方法和设备及记录介质
CN1437169A (zh) 对于语音代码进行数据嵌入/抽取方法、装置以及系统
CN1144178C (zh) 音频信号编码装置和译码装置以及音频信号编码和译码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050706

Termination date: 20121030