CN1288622C - 编码设备和解码设备 - Google Patents
编码设备和解码设备 Download PDFInfo
- Publication number
- CN1288622C CN1288622C CN02809440.9A CN02809440A CN1288622C CN 1288622 C CN1288622 C CN 1288622C CN 02809440 A CN02809440 A CN 02809440A CN 1288622 C CN1288622 C CN 1288622C
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- spectrum data
- data
- information
- high frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 46
- 238000001228 spectrum Methods 0.000 claims description 393
- 238000013139 quantization Methods 0.000 claims description 87
- 241001269238 Data Species 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000013459 approach Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 230000001915 proofreading effect Effects 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 abstract description 7
- 230000003595 spectral effect Effects 0.000 abstract description 6
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 70
- 238000005070 sampling Methods 0.000 description 59
- 230000008569 process Effects 0.000 description 44
- 238000010586 diagram Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 24
- 230000005540 biological transmission Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000011002 quantification Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种编码设备(100),包括:(i)第一编码单元(132),编码由多个参数表示的在较低频带中的频谱数据,该数据来自通过变换在一固定时间长度内输入的音频信号而获得的频谱数据,(ii)第二量化单元(133),产生由比用于较低频带更少的参数表示较高频带中的频谱数据的特征的子信息,该频谱数据出自通过变换获得的频谱数据,(iii)第二编码单元(134),编码所产生的子信息,以及(iv)一个流输出单元(140),输出由第一编码单元(132)编码的数据和由第二编码单元(134)编码的数据。
Description
技术领域
本发明涉及用于编码和解码数字音频数据以再现高质量声音的技术。
背景技术
近年来,已经发展了多种的音频压缩方法。MPEG-2高级音频编码(Advanced Audio Coding,AAC)是其中的一种压缩方法,并且在“ISO/IEC 13818-7(MPEG-2 Advanced Audio Coding,AAC)”中被详细地定义了。
首先,传统的编码和解码过程将使用图1描述如下。图1是一个方框图,显示了依据传统的MPEG-2AAC方法的编码设备300和解码设备400的配置。编码设备300是一个基于MPEG-2AAC压缩和编码一个输入的音频信号的设备,并且包含一个音频信号输入单元310、一个变换单元320、一个量化单元331、一个编码单元332和一个流输出单元340。
音频信号输入单元310在例如44.1kHz采样频率把作为输入信号的数字音频数据分成连续的1,024个采样。这个1,024个采样的编码单元被称作一“帧”。
变换单元320在由音频信号输入单元310划分的时间域中的采样数据上执行修正的离散余弦变换(Modified Discrete Cosine Transform,MDCT)以得到频率域中的频谱数据。此时转换的1,024个采样的这个频谱数据然后被分成多组,并且每一组被设置为包含一个或多个采样的频谱数据。此外,每一组都模拟人类听觉的临界频带,并且被称作“比例因子频带(scale factor band)”。
量化单元331把由变换单元320生成的频谱数据量化成为预定数目的位。依据MPEG-2AAC,量化单元331在比例因子频带中使用一个用于每个比例因子频带的归一化因子量化频谱数据。这个归一化因子被称作比例因子。此外,用每个比例因子量化每个频谱数据的结果被称作一个“量化值”。编码单元332依据霍夫曼(Huffman)编码技术编码由量化单元331量化的数据和使用比例因子量化的频谱数据。由量化单元331量化的数据是一个比例因子。在这样做之前,编码单元332计算在一帧中每两个连续的比例因子频带的两个比例因子的值中的差别,并且依据霍夫曼编码技术编码第一比例因子频带中的差别和比例因子。
流输出单元340把从编码单元332生成的编码信号转换成为一个MPEG-2AAC位流并且输出它。从编码设备300输出的位流经由传输介质被传输到解码设备400,或者被记录在一个记录介质、诸如包含小型光盘(CD)和数字通用光盘(DVD)的光盘、半导体、和硬盘上。
解码设备400是一个解码由编码设备300编码的位流的设备,并且包含一个流输入单元410、一个解码单元421、一个解量化单元422、一个逆变换单元430和一个音频信号输出单元440。
流输入单元410经由传输介质或者记录介质接收由编码设备300编码的位流,并且从接收的位流中读出编码的信号。解码单元421然后解码读出的编码信号以生成量化值。
解量化单元422解量化由解码单元421解码的量化值。在MPEG-2AAC中,解码单元421解码依据霍夫曼编码技术编码的数据。逆变换单元320把由解量化单元422生成的频率域内的频谱数据变换成为在时间域中的采样数据。在MPEG-2AAC中,执行逆的修正离散余弦变换(Inverse Modified Discrete Cosine Transform,IMDCT)。音频信号输出单元440按照次序组合由逆变换单元430生成的时间域中的采样数据,并且输出采样数据组作为数字音频数据。
在实际的MPEG-2AAC编码中,另外使用了其它技术,包括增益控制、瞬时噪声定形(TNS)、音质模型、M/S(Mid/Side)立体声、强度立体声、预测、和位储存器。
依据上述方法编码的音频数据的质量能够由例如在编码之后音频数据的再现频带进行测定。例如,当以44.1-kHz采样频率采样一个输入信号时,这个信号的再现频带是22.05kHz。当具有22.05-kHz再现频带或者接近于22.05kHz的更宽再现频带的音频信号被编码成为编码的音频数据而没有降级、而且数据量适于可利用的传输率时,这个音频数据能够被再现为高质量的声音。然而,再现频带的宽度影响了频谱数据值的数目,其接下来影响用于传输的数据量。例如,当以44.1kHz采样频率采样一个输入信号时,从这个信号中生成的频谱数据包含1,024个采样,其具有22.05-kHz的再现频带。为了保证22.05-kHz再现频带,需要传输频谱数据的所有1,024个采样。
然而,经由例如蜂窝电话的低速传输通道传输频谱数据的多至1,024个采样是不现实的。这就是说,当具有宽的再现频带的所有频谱数据以这样一个低传输速率传输时,虽然整个频谱数据量被调整用于该低传输速率,但是分配给每个频带的数据量就变得极其小了。这增强了量化噪声的影响,所以声音质量通过编码变坏了。
为了防止这种质量降级,在许多音频信号编码方法、包括MPEG-AAC中通过向频谱数据的值分配加权和不传输低加权的值实现了有效的音频信号传输。就再现频带而论,用这种方法,向对人类听觉很重要的在较低频带的频谱数据分配足够的数据量以提高它的编码精确度,而在较高频带的频谱数据被认为是次要的并且不可能被传输。
尽管在MPEG-2AAC中使用了这种技术,但是现在需要实现较高质量再现和更有效压缩的音频编码技术。换句话说,对于以低传输速率传输在较高频带以及较低频率中的音频信号的技术有不断增加的需要。
本发明的目的是提供一种编码设备和解码设备,能够实现音频信号的编码和解码以再现高质量声音,而基本上没有增加编码数据量。
发明概述
为了实现以上目的,依据本发明的编码设备是一个编码一输入音频信号的编码设备,并且包括:第一编码单元,用于编码在较低频带中的频谱数据,其中该频谱数据来自通过变换在一固定时间长度内输入的音频信号获得的、并且被分成多组的频谱数据,在较低频带的频谱数据由四种参数表示:(1)用于归一化在每一组中的频谱数据的归一化因子,(2)通过使用归一化因子量化在所述每一组中的每一个频谱数据而获得的量化值,(3)指示所述每一个频谱数据的相位的正或者负号,和(4)在频率域中所述每个频谱数据的位置;一个子信息产生单元,用于产生子信息,该子信息包括:(1)用于指定近似于在较高频带中所述每一组中的频谱数据的在较低频带的频谱数据的指定信息,和(2)指示由来自这四个参数中的三个或者更少种类参数表示的在较高频带中的频谱数据的特性的校正信息,作为用于校正在较低频带中指定频谱数据的信息;第二编码单元,用于编码所产生的子信息;以及一个输出单元,用于输出由第一编码单元编码的数据和由第二编码单元编码的数据。
在依据本发明的编码设备中,子信息产生单元从通过变换在一固定时间长度内输入的音频信号而获得的频谱数据中产生通过比较低频带频谱数据更少的参数表示在较高频带中频谱数据的特性的子信息,并且第二编码单元编码所产生的子信息。
依据本发明的编码设备,在较高频带中的频谱数据其实没有被量化和编码,但是编码通过比该较低频带频谱数据更少的参数表示在较高频带中频谱数据的特性的子信息。因此,有一个效果是:和在较低频带的频谱数据相比,在较高频带中的频谱数据能够用极少的数据量编码。此外,依据传统的MPEG-2AAC,在整个带宽上的音频信号通过相同的方法编码,所以难以以低传输速率传输在较高频带中的信息。然而,依据本发明中的编码设备,在较高频带中的信息在编码之后能够被传输而基本上没有增加信息量,所以有一个效果是,本发明中的解码设备与传统的解码设备相比,能够解码音频信号以再现在较高频带中较高质量的声音。
此外,在本发明的解码设备中,子信息产生单元可以产生归一化因子作为校正信息,其中该归一化因子被计算以使通过量化在较高频带中所述每一组中的波峰频谱数据而获得的值变为固定值。
此外,子信息产生单元可以使用为所述每一组所共用的归一化因子量化在较高频带中所述每一组中的波峰频谱数据的值,并且产生量化值作为校正信息。
依据本发明中的编码设备,频谱数据的量化值是归一化因子或者波峰,该频谱数据的量化值被产生作为子信息,所以即使一定数量的位(例如8位)被分配用于表示一个归一化因子或者量化值,子信息的数据量也是极少的,其中归一化因子或者波峰之每个是用于较高频带中每一组的一个参数(比例因子频带)。因此,用于在较高频带每一组的频谱数据的最大振幅能够粗略地用极少的数据量表示。因此,依据本发明中的编码设备,用于产生在较高频带的音频信号以再现原声的信息能够以比传统信息多很少的传输量被传输,甚至以低传输速率经由传输通道传输。即,有一个效果是,本发明中的解码设备能够重构音频信号以更加保真地再现原声。
此外,在本发明的编码设备中,子信息产生单元可以产生在较高频带中所述每一组中的波峰频谱数据的频率位置作为校正信息。
此外,频谱数据是MDCT系数,而且子信息产生单元可以产生一个指示在较高频带中在一预定频率位置处频谱数据的正或者负的符号作为校正信息。
依据本发明中的编码设备,在较高频带中在每一组(比例因子频带)中的粗略的频谱形状能够利用小量的数据、由在较高频带中波峰频谱数据的频率位置、或者在一预定频率位置处频谱数据的正或者负号来表示。因此,有一个效果是,复制的频谱数据能够被校正以便准确地近似于在较高频带中的频谱数据。
此外,在本发明的编码设备中,子信息产生单元可以产生指定在较低频带中的一个频谱的信息作为指定信息,其中该频谱最接近于在较高频带中在所述每一组中的频谱数据的频谱。
依据本发明中的编码设备,当在较低频带中有非常类似于在较高频带中的频谱形状的一个形状的频谱时,在较低频带中的频谱可以被指定并且复制到较高频带。因此,有一个效果是:在较高频带中的频谱能够用极少的数据量更加保真地表示。
本发明能够被实现为一个广播系统,其包含一个具有本发明中的编码设备的发送设备和一个具有本发明中的解码设备的接收设备,或者被实现为一种编码方法和解码方法,包括作为该编码设备和解码设备的特性组分的处理步骤,或者被实现为一种用于使计算机执行这些步骤的程序。此外,当然可以通过计算机可读记录介质(如CD-ROM)或者传输介质(如通信信道)分布该程序。
附图简要说明
通过本发明的下列描述并结合说明了本发明的具体实施例的附图,本发明的这些及其它目的、优点和方面将会是显然的。在附图中:
图1是一个方框图,显示了依据传统的MPEG-2AAC方法的编码设备和解码设备的配置。
图2是一个显示了依据当前实施例的编码设备和解码设备的配置的方框图。
图3是一个显示了依据当前实施例的编码设备和解码设备的另一个配置的方框图。
图4A和图4B是显示了在如图2所示的编码设备中被处理的音频数据的状态改变的示意图。
图5A、5B和5C是显示了位流中的区域的图,其中由如图2所示的流输出单元存储子信息。
图6A和6B是显示了由如图2所示的流输出单元在其中存储子信息的位流中区域的其它例子的图。
图7是一个流程图,显示了由如图2所示的第一量化单元执行的比例因子确定处理中的一个操作。
图8是一个流程图,显示了由如图2所示的第一量化单元执行的比例因子确定处理中的另一个操作。
图9显示了一个频谱波形,其显示了由如图2所示的第二量化单元产生的子信息(比例因子)的一个具体例子。
图10是一个流程图,显示了在由如图2所示的第二量化单元执行的子信息(比例因子)计算处理中的一个操作。
图11显示了一个频谱波形,其显示了由如图2所示的第二量化单元产生的子信息(量化值)的一个具体例子。
图12是一个流程图,显示了在由如图2所示的第二量化单元执行的子信息(量化值)计算处理中的一个操作。
图13显示了一个频谱波形,其显示了由如图2所示的第二量化单元产生的子信息(位置信息)的一个具体例子。
图14是一个流程图,显示了在由如图2所示的第二量化单元执行的子信息(位置信息)计算处理中的一个操作。
图15显示了一个频谱波形,其显示了由如图2所示的第二量化单元产生的子信息(符号信息)的一个具体例子。
图16是一个流程图,显示了在由如图2所示的第二量化单元执行的子信息(符号信息)计算处理中的一个操作。
图17A和17B显示了频谱波形,其显示了如何创建由如图2所示的第二量化单元产生的子信息(复制信息)的例子。
图18是一个流程图,显示了在由如图2所示的第二量化单元执行的子信息(复制信息)计算处理中的一个操作。
图19显示了一个频谱波形,其显示了如何创建由如图2所示的第二量化单元产生的子信息(复制信息)的第二个例子。
图20是一个流程图,显示了在由如图2所示的第二量化单元执行的第二子信息(复制信息)计算处理中的一个操作。
图21是一个流程图,显示了如图2中所示的第二解量化单元沿正向把在较低频带中的512个频谱复制到较高频带的过程。
图22是一个流程图,显示了如图2中所示的第二解量化单元沿频率轴的反方向把在较低频带中的512个频谱复制到较高频带的过程。
实现本发明的最佳方式
以下将参考附图详细说明依据本发明实施例的编码设备100和解码设备200。此外,将通过采取MPEG-2AAC作为一个例子来说明当前实施例。图2是一个显示了依据本发明实施例的编码设备100和解码设备200的结构的方框图。
(编码设备100)
在接收音频信号时,编码设备100依据MPEG-2AAC压缩和编码在较低频带中的音频信号。此外,它产生指示在较高频带中音频信号的特性的子信息,并且对其进行压缩和编码,把它结合为在较低频带中的编码位流,并输出它。编码设备100包括一个音频信号输入单元110、一个变换单元120、一个第一量化单元131、一个第一编码单元132、一个第二量化单元133、一个第二编码单元134和一个流输出单元140。
音频信号输入单元110接收以44.1kHz采样频率采样的数字音频数据,如利用MEG-2AAC的情况那样。音频信号输入单元110把这个数字音频数据在每大约22.7毫秒(msec)分成邻近的1,024个采样,其中在1,024个采样前后获得的两组512个采样重叠。
变换单元120把由音频信号输入单元110划分的时间域中的这个采样数据变换成为频率域中的频谱数据。更详细地说,在MPEG-2AAC中,变换单元120在时间域中对由2,048个采样组成的采样数据执行MDCT(Modified Discrete Cosine Transform,修正的离散余弦变换),以产生也包括2,048个采样的频谱数据,其中该时间域中的采样数据是通过重叠在1,024个采样前后的两组512个采样获得的。依据MDCT生成的这个频谱数据的采样是对称布置的,因此只有它们的一半(即1,024个采样)被编码。
变换单元120然后把由1,024个采样组成的变换的频谱数据分成多个比例因子频带,每个比例因子频带包含由至少一个采样(或者,实际上来说,其总数是4的倍数的采样)组成的频谱数据。在MPEG-2AAC中,包含在每个比例因子频带中的频谱数据的采样数目依据它的频率来定义。较低频带的比例因子频带由较少的频谱数据狭窄地定界,而较高频带的比例因子频带由更多频谱数据广泛地定界。在MPEG-2AAC中,对应于一帧中的频谱数据的比例因子频带的数目也依据采样频率来定义。当采样频率是例如44.1kHz时,每一帧包含49个比例因子频带,而且49个比例因子频带包含1,024个采样的频谱数据。另一方面,没有特别地定义在这些比例因子频带当中哪个比例因子频带将被传输,而且依据传输通道的传输速率选择的最合乎需要的比例因子频带可以被传输。当传输速率是例如96kbps时,在一帧中只有在较低频带中的40个比例因子频带(640个采样)可以被有选择地传输。
将在假定变换单元120把变换的频谱数据分成其界限和数目被唯一定义的比例因子频带的情况下说明当前实施例。
第一量化单元131接收从变换单元120输出的频谱数据,并且为那个频谱数据的较低频带中的每一比例因子频带确定一个比例因子,用确定的比例因子量化在该比例因子频带中的频谱,并且向第一编码单元132输出量化的频谱数据(在下文中被称作“量化值”)。在这种情况下,例如,接收的音频信号的采样频率是44.1kHz,所以再现频带是22.05kHz。例如,就较低频带、或者11.025kHz或更低的频带来说,第一量化单元131计算一个比例因子,以使从在每一比例因子中的频谱数据中获得的量化值被表示为一个4位或者更少位的数值,使用所计算的比例因子归一化在比例因子频带中的每个频谱,然后量化它。
依据霍夫曼编码技术,第一编码单元132编码由第一量化单元131量化的数据,即在每个比例因子频带中对应于在所有频谱数据当中在较低频带中的512个采样的频谱数据的量化值和用来量化的比例因子,并且变换编码值,以一种预定流格式产生第一编码信号。
第二量化单元133接收从变换单元120输出的频谱数据,仅仅计算没有由第一量化单元131量化的频带、即在大于11.025kHz的较高频带中的子信息,并且输出它。
子信息是简化信息,指示了基于在较高频带中的频谱数据而计算的在较高频带中的音频信号,并且没有在传统的方法中被传输。换句话说,它是指示了在通过变换在一固定时间长度内接收的音频信号而获得的那些频谱数据当中在较高频带中的频谱数据的特性的信息。更具体地说,子信息是:(1)用于在较高频带中的每个比例因子频带的一个比例因子,以及它的量化值,其导出绝对的最大频谱数据(其绝对值最大的频谱数据)的量化值“1”,(2)在每个比例因子频带中绝对最大频谱数据的位置,(3)较高频带中的量化值,如果确定了一个为这些比例因子频带所共用的比例因子,(4)一符号,指示了在较高频带中在一预定位置处频谱为负或者正,(5)指示了如何复制类似于在较高频带中频谱的在较低频带中的频谱、以便表示在较高频带中的频谱的信息,等等。噪声信息指示了干扰从较低到较高频率的整个频带的白噪声或类似噪声的振幅,其可以被加到上述子信息中。
第二编码单元134依据霍夫曼编码技术编码从第二量化单元133输出的子信息,并且以一种预定流格式输出第二编码信号。
流输出单元140把标题信息及其它必需的子信息添加到以上从第一编码单元132中输出的第一编码信号上,并且把它变换成为一个MPEG-2ACC位流。流输出单元140还记录从第二编码单元134输出的第二编码信号到以上位流的区域中,这些区域被传统的解码设备忽略或者没有为它们定义操作。
更具体地说,在MPEG-2ACC位流的Fill Element(填充单元)或者Data Stream Element(数据流单元)中,流输出单元140存储从第二编码单元134输出的编码信号。
从编码设备100输出的位流经由传输介质被传输到解码设备200,或者被记录在一个记录介质,诸如包含CD和DVD的光盘、半导体、和硬盘。
在MPEG-2AAC中,能够取决于输入的音频信号改变MDCT执行数据的长度。具有2,048个采样之长度的变换数据被称作LONG(长)块,而具有256个采样之长度的数据被称作SHORT(短)块。这些长度被称作块大小。如果没有其它特殊说明,则将在当前实施例中说明LONG块,但是对SHORT块可以执行相同的处理。
此外,在MPEG-2AAC的附加的编码处理中,可以采用一些工具,诸如增益控制、TNS(Temporal Noise Shaping,瞬时噪声定形)、音质模型、M/S(Mid/Side)立体声、强度立体声以及预测、改变块大小、位储存器等。
(解码设备200)
解码设备200是一个基于来自所接收的编码位流的子信息重构增加了在较高频带中的频带的宽带音频数据的设备,并且包括一个流输入单元210、一个第一解码单元221、一个第一解量化单元222、一个第二解码单元223、一个第二解量化单元224、一个解量化数据结合单元225、一个逆变换单元230和一个音频信号输出单元240。
在经由传输介质或者通过从记录介质中再现而接收在编码设备100中产生的编码位流时,流输入单元210读出保存在应当由传统解码设备解码的一区域中的第一编码信号、和保存在由传统解码设备忽略或是没有为其定义操作的一区域中的第二编码信号,并且分别把它们输出到第一解码单元221和第二解码单元223。
第一解码单元221接收从流输入单元210输出的第一编码信号,然后解码将被重构为量化数据的以流格式的霍夫曼编码数据。第一解量化单元222解量化由第一解码单元221解码的量化数据,并且输出在较低频带中的频谱数据。此时,从第一解量化单元222输出的频谱数据的采样数目是512(采样的最大数目是1024),并且它们表示了11.025kHz的再现带宽(最大的再现带宽是22.05kHz)。
第二解码单元223接收从流输入单元210输出的第二编码信号,并且解码所接收的第二编码信号,然后输出子信息。第二解量化单元224依据基于从第一解量化单元222输出的频谱数据预定的过程,产生噪声,诸如在较低频带中的部分或者所有频谱数据的复制、或者白噪声或者粉红噪声,基于从第二解码单元223输出的子信息定形噪声,并且输出在较高频带中的频谱数据。
更具体地说,第二解量化单元224预先复制由第一解量化单元222输出的在较低频带中的频谱数据到较高频带,然后通过把在比例因子频带内每个频谱数据的量化值乘以一个作为系数的比值而重构在较高频带中的频谱,其中该比值介于在较高频带的每个频带中复制的频谱数据的绝对最大值和通过使用对应于在子信息中描述的频带的比例因子值解量化量化值“1”而获得的值之间。此外,第二解量化单元224预先产生具有一预定振幅的白噪声,依据在子信息中的噪声信息调整振幅,把它添加到重构的频谱,并且输出在较高频带中的频谱数据。
解量化数据结合单元225结合由第一解量化单元222输出的频谱数据和由第二解量化单元224输出的频谱数据。依据MPEG-2AAC,逆变换单元230对从解量化数据结合单元225输出的频率域中的频谱数据执行IMDCT,以得到由时间域中1,024个采样组成的采样数据。音频信号输出单元240把由逆变换单元230变换的时间域中的多组采样数据彼此组合,并且输出它作为数字音频数据。
依据当前实施例,以传统的方式编码在较低频带中的数据,并且用极其少的信息编码在较高频带中的数据,因此与传统的方法相比,在信息总量仅多一点点的范围内,可编码高质量的音频信号。
此外,只是通过向传统的编码设备300增加第二量化单元133和第二编码单元134以及向传统的解码设备400增加第二解码单元223和第二解量化单元224,而构造依据当前实施例的编码设备100和解码设备200。因此,有一个效果是,不对传统的编码设备300和解码设备400进行大的改变也能够实现编码设备100和解码设备200。
此外,有一个效果是:也能够由传统的解码设备400解码由当前实施例中的编码设备100产生的位流。
已经通过采取MPEG-2AAC作为一个例子阐明了当前实施例,但是显然,当前实施例可以适用于其它音频编码方法,包括将来将会发展的新的音频编码方法。
在当前实施例中,输入到第二量化单元133中的数据仅仅是从变换单元120输出的频谱数据,但是本发明不局限于这种情况,而且通过解量化来自第一量化单元131的输出而获得的值可以被分别地输入。
图3是一个显示了依据当前实施例的编码设备101和解码设备200的另一个配置的方框图。因为与图2中相同的那些组件已经描述过了,所以它们被指定与图2中组件相同的代码,并且它们的说明将会省略。
编码设备101不同于编码设备100,是因为前者另外包括一个解量化单元152。在这个编码设备101中,第一量化单元151量化由从变换单元120输出的1,024个采样组成的所有频谱数据,并且输出量化的结果到解量化单元152,而且还输出在较低频带中512个采样的量化结果到第一编码单元132。
解量化单元152解量化由第一量化单元151量化的值,并且输出解量化的结果、即频谱数据到第二量化单元153。
第二量化单元153不接收来自变换单元120的频谱数据,但是接收作为解量化单元152解量化的结果的频谱数据,并且基于所接收的频谱数据为较高频带产生子信息。
在当前实施例中,第二量化单元153不接受来自变换单元120的频谱数据,但是基于从解量化单元152接收的频谱数据为较高频带产生子信息,但是本发明不局限于这种情况。第二量化单元153可以接收来自变换单元120的频谱数据为某一部分,以及接收来自解量化单元152的频谱数据为另一部分。
图4A和图4B是显示了在如图2所示的编码设备100中被处理的音频数据的状态改变的图。图4A显示了一个由如图2所示的音频信号输入单元110划分的时间域中的1,024个采样数据的波形的例子。图4B显示了在由如图2所示的变换单元120对时间域中的采样数据执行MDCT之后产生的频率域中的频谱数据的一个例子。注意到,尽管采样数据和频谱数据实际上是数字信号,但是在图4A和4B中它们被显示为模拟波形。在以下显示波形的图中同样如此。
音频信号输入单元110接收以44.1kHz采样频率采样的数字音频信号。音频信号输入单元110把这个数字音频信号分成邻接的1,024个采样,并且把它们输出到变换单元120,其中在1,024个采样前后获得的两组512个采样相重叠。变换单元120对全部2,048个采样数据执行MDCT。依据MDCT生成的频谱数据的波形是对称布置的,因此只有对应于1,024个采样的一半的频谱数据被编码,如图4B所示。
在图4B中,垂直轴指示频率频谱数据的值,即在对应于采样数目的1,024个点处以图4A中的1,024个采样的电压值表示的音频信号的频率分量的数量(大小)。由于输入到编码设备100中的数字音频信号的采样频率是44.1kHz,所以频谱数据的再现带宽是22.05kHz。此外,由于依据MDCT产生的频谱可以如图4B所示具有负值,所以在编码频谱时还需要编码依据MDCT产生的频谱的正负符号。在下面的说明中,指示频谱数据的正负符号的信息被称作“符号信息”。
图5A~5C是显示了由如图2所示的流输出单元140在其中存储了子信息的位流中的区域的图。在这些图中,编码指示了在较高频带中的频谱的子信息,然后将其作为第二编码信号存储在一个区域中,在该区域中它没有被认为是位流中的音频编码信号。
在图5A中,阴影部分是一个被称作Fill Element的区域,其用“0”填充以便统一位流中的数据长度。即使指示了在较高频带中的频谱的子信息、即第二编码信号被保存在这个区域中,它也没有被认为是一个在传统的解码设备400中将被解码和忽略的编码信号。
在图5B中,阴影部分是一个被称作例如Data Stream Element(DSE)的区域。这个区域被提供用于MPEG-2AAC将来的扩展,而且在MPEG-2AAC中仅仅定义了它的物理结构。象在Fill Element中那样,即使指示了在较高频带中的频谱的子信息被保存在这个区域中,传统的解码设备400也忽略它,或者是不响应于读取信息执行任何操作,是因为应当由传统解码设备400执行的操作没有定义。
在以上的说明中,第二编码信号被保存在一个区域中,且被包含在一个MPEG-2AAC位流中,其中该区域被传统的解码设备400忽略。然而,第二编码信号可以被结合到在标题信息内的一个预定区域、或者第一编码信号的一个预定区域、或者是标题和第一编码信号中。没有必要保证在标题和第一编码信号中的邻近区域用于存储在位流中的第二编码信号。例如,第二编码信号可以离散地在标题信息和第一编码信息之间被结合,如图5C所示。
图6A和6B是显示了由如图2所示的流输出单元140在其中存储了子信息的位流中区域的其它例子的图。图6A显示了其中在每一帧中仅仅邻接地存储了第一编码信号的流1。图6B显示了其中在对应于流1的每一帧中仅仅邻接地存储了第二编码信号、即编码子信息的流2。
流输出单元140可以在完全不同于流1的流2中存储第二编码信号,其中在流1中存储了第一编码信号。例如,流1和流2是经由不同通道传输的位流。
如上所述,由于指示了输入音频信号的基本信息的较低频带预先通过在完全不同的位流中传输第一和第二编码信号而被传输或者保存,所以有一个效果是,如果必要的话则能够增加用于较高频带的信息。
如上所述的编码设备100和解码设备200的操作将结合图7、8、10、12、14、16、18、和20~22中的流程图进行说明。
图7是一个流程图,显示了由如图2所示的第一量化单元执行的比例因子确定处理中的一个操作。第一量化单元131首先确定一个为每一比例因子频带所共用的比例因子作为比例因子的初始值(S91),使用所确定的比例因子量化将被传输作为一帧的音频数据的在较低频带中的所有频谱数据,计算在邻接的两个比例因子之间的差值,并且对这些差值、第一比例因子和频谱数据的量化值进行霍夫曼编码(S92)。注意到,此时量化和编码仅仅被执行用于计算位数。因此,只有数据被量化和编码,而且没有增加诸如标题之类的信息,以便简化处理。接下来,第一量化单元131判断霍夫曼编码的数据的位数是否超出一个预定位数(S93),而且如果超出则递减比例因子的初始值(S101)。然后,第一量化单元131再次使用递减的比例因子值量化和霍夫曼编码在较低频带中的相同频谱数据(S92),判断一帧在较低频带中的霍夫曼编码数据的位数是否超出了预定位数(S93),并且重复这个处理直到它变成该预定位数或者更少为止。
当在较低频带中的编码数据的位数没有超过预定位数时,第一量化单元131为每一比例因子频带重复下列处理,并且确定每一比例因子频带的比例因子(S94)。
首先,它解量化在比例因子频带中的每一量化值(S95),计算在解量化值和相应的初始频谱数据值之间的绝对值差值,并且将它们求和(S96)。此外,它判断所计算差值的总和是否为在可接受极限值内的一个值(S97),并且如果它在可接受极限值的范围之内,则为下一比例因子频带重复以上处理(S94~S98)。另一方面,它超过了可接受的极限值,第一量化单元131递增比例因子值,并且量化那个比例因子频带的频谱数据(S100),而且解量化量化值(S95),并且把解量化值和相应频谱数据值的绝对值差值求和(S96)。此外,第一量化单元131判断差值的总和是否在可接受极限值的范围之内(S97),并且如果它超出了极限值,则递增比例因子直到它变成在极限值范围内的一个值为止,并且重复以上处理(S95~S97和S100)。
当第一量化单元131为所有比例因子频带确定比例因子、且通过这些比例因子使在比例因子中的解量化的量化值和相应初始频谱数据值之间的绝对值差值之总和是在可接受极限值范围之内时(S98),它再次使用所确定的比例因子量化一帧中在较低频带中的频谱数据,霍夫曼编码相应比例因子的差值、第一比例因子和此频谱数据的量化值,并且判断在较低频带中的编码数据的位数是否超过了一个预定位数(S99)。如果在较低频带中的编码数据的位数超过了预定位数,则第一量化单元131递减比例因子的初始值直到它变成该预定数或者更少为止(S101),然后重复确定在每一比例因子频带中的比例因子的处理(S94~S98)。如果在较低频带中的编码数据的位数没有超过预定位数(S99),则确定在此时的每一个比例因子的值将会是每一个比例因子频带的比例因子。
注意到,在该比例因子频带中解量化的量化值和初始频谱数据值之间的绝对值差值的总和是否在可接受极限值范围之内是基于音质模型等数据判断的。
此外,在以上情况下,一个较大的值被设置为比例因子的初始值,而且当在较低频带中的霍夫曼编码数据的位数超过一预定位数时,递减比例因子的初始值以便确定比例因子,但是比例因子不需要总是用这样的方式进行确定。例如,预先把一个较小的值设置为比例因子的初始值,而且初始值可以逐渐地递增。而且使用刚好在较低频带中的编码数据的总位数首先超过一预定位数之前已经设置的比例因子的初始值,可以确定每一比例因子频带的比例因子。
此外,在当前实施例中,确定每一比例因子频带的比例因子,以便使一帧的较低频带中的编码数据的位数不超过预定数目,但是比例因子不需要总是用这样的方式来确定。例如,可以这样确定比例因子、以便使在该比例因子频带中的每一量化值不超过在每一比例因子频带中的预定位数。以下将参考图8说明第一量化单元131在这个处理中的操作。
图8是一个流程图,显示了由如图2所示的第一量化单元131执行的另一个比例因子确定处理中的一个操作。第一量化单元131依据下列过程为将被编码的较低频带中的所有比例因子频带计算比例因子(S1)。此外,第一量化单元131依据下列过程为在每一比例因子频带中的所有频谱数据计算比例因子(S2)。
首先,第一量化单元131根据一个公式用一个预定的比例因子值量化频谱数据(S3),并且判断量化值是否超过一个用于指示量化值给定的预定位数,例如4比特(S4)。
当作为判断的结果量化值超过4比特时,第一量化单元调整比例因子值(S8),并且用调整了的比例因子值量化相同的频谱数据(S3)。第一量化单元131判断所获得的量化值是否超过4比特(S4),并且重复比例因子的调整(S8)和被调整的比例因子的量化(S3),直到频谱数据的量化值变成4比特或者更少为止。
当作为判断的结果量化值是4比特或者更少时,它用预定的比例因子值量化下一个频谱数据(S3)。
当在一个比例因子频带中的所有频谱数据的量化值都变成4比特或者更少时(S5),第一量化单元131确定此时的比例因子值将会是用于该比例因子频带的比例因子(S6)。
在确定所有比例因子频带的比例因子之后(S7),第一量化单元131结束该处理。
依据以上的处理,为将被编码的较低频带中的所有比例因子频带确定相应的比例因子。第一量化单元131使用如以上所述那样确定的比例因子量化在较低频带中的频谱数据,并且输出作为量化结果的4比特的量化值和8比特的比例因子到第一编码单元132。
图9显示了一个频谱波形,其显示了由如图2所示的第二量化单元133产生的子信息(比例因子)的一个具体例子。在图9中,在较低频带中的频率轴上指示的定界符显示了在当前实施例中确定的比例因子频带的定界。此外,在较高频带中的频率轴上由虚线指示的定界符显示了在当前实施例中确定的在较高频带中的比例因子频带的定界。在下列波形上同样如此。
在从变换单元120输出的频谱数据当中,如图9中的实线波形指示的、在11.025kHz或者更少的较低频带中的再现带宽被输出到第一量化单元131,并且照常进行量化。另一方面,如在图9中的虚线波形指示的、在11.025kHz到22.05kHz的范围上较高频带中的再现带宽通过由第二量化单元133计算的子信息(比例因子)来表示。以下将依据图10中的流程图、使用图9中的一个具体例子来说明由第二量化单元133进行的子信息(比例因子)的计算过程。
图10是一个流程图,显示了在由如图2所示的第二量化单元133执行的子信息(比例因子)计算处理中的一个操作。
依据下列过程,第二量化单元133计算在具有11.025kHz以上直至22.05kHz的再现带宽的较高频带中每个比例因子频带中的、用于导出在每一比例因子频带中的绝对最大值频谱数据的量化值“1”的最佳比例因子(S11)。
第二量化单元133指定在具有11.025kHz以上再现带宽的较高频带中的第一比例因子频带中的绝对最大值频谱数据(波峰)(S12)。在图9的例子中,①指示在第一比例因子频带中指定的波峰,而且峰值是“256”。
根据与如图8的流程图所示相同的过程,第二量化单元133通过在量化公式中指定峰值“256”和比例因子的初始值,计算用于导出从量化公式中获得量化值“1”的比例因子值“sf”(S13)。在这种情况下,例如,计算sf=24(“sf”是用于导出峰值“256”的量化值“1”的比例因子值)。
当计算用于导出第一比例因子频带的量化峰值“1”的比例因子值sf=24(S14)时,第二量化单元133指定下一个比例因子频带的频谱数据的波峰(S12),并且如果指定的波峰位置是②而且值为“312”,则它计算用于导出峰值“312”的量化值“1”的比例因子值,例如sf=32(S13)。
以同样的方式,例如,第二量化单元133分别计算用于导出波峰③值“288”的量化值“1”的、在较高频带中的第三比例因子频带的比例因子值,sf=26,以及用于导出波峰④值“203”的量化值“1”的第四比例因子频带的比例因子值,sf=18。
当以这种方式为在较高频带中的每个比例因子频带计算用于导出峰值的量化值“1”的比例因子时,第二量化单元133把通过该计算获得的每一个比例因子频带的比例因子作为用于较高频带的子信息输出到第二编码单元134,并且结束该处理。
如上所述,由第二量化单元133产生子信息(比例因子)。如果以512个采样的频谱数据表示的这个子信息(每个比例因子)值被表示为用于在较高频带中的每个比例因子频带(在这种情况下是4个频带)的从0到255的数值,它能够以8位来表示。此外,如果在相应的比例因子之间的差值被霍夫曼编码,则很有可能能够进一步减少数据量。另一方面,如果在传统方法中象对较低频带那样把在较高频带中的512个采样的频谱数据进行量化和霍夫曼编码,则可以预料到数据量最少变成150比特。因此,这个子信息刚好为在较高频带中的每个比例因子频带指示了一个比例因子,但是很明显的是,和在传统方法中在较高频带中的量化相比,相当多地减少了数据量。
此外,这个比例因子指示了一个与在每个比例因子频带中的峰值(绝对值)近似成正比的值,因此可以说,采用固定值或者通过把在较低频带中的部分或者所有频谱数据的复制乘以比例因子而获得的频谱数据,在较高频带中的512个采样的频谱数据粗略地重构了根据输入音频信号获得的频谱数据。此外,通过把在频带中的每个频谱数据乘以作为一个系数、在该频带中复制的频谱数据的绝对最大值和通过使用对应于此频带的比例因子值解量化量化值“1”而获得的值之间的比值,可以为每个比例因子频带更准确地重构频谱数据。此外,在较高频带中的波形的差值没有如在较低频带中那样看上去如此清楚地标识,所以如以上所述获得的子信息足以作为指示在较高频带中的波形的信息。
在当前实施例中,计算比例因子以便使在较高频带中每个比例因子频带中的频谱数据的量化值变成“1”,但是并总是不需要为“1”,而且可以是另一个值。
此外,在当前实施例中,只有一个比例因子被编码为子信息,但是本发明不局限于此,而且特征频谱的量化值、位置信息、指示了频谱的正号或负号的符号信息、噪音产生方法等可以一起被编码。或者它们中的两个或多个可以被组合编码。在这种情况下,如果在子信息中指示了振幅比值、绝对最大值频谱数据的位置等的系数的组合被编码,则是特别有效的。
图11显示了一个频谱波形,其显示了由如图2所示的第二量化单元133产生的子信息(量化值)的一个具体例子。图12是一个流程图,显示了在由如图2所示的第二量化单元133执行的子信息(量化值)计算处理中的操作。
第二量化单元133预先确定一个为在具有11.025kHz以上直至22.05kHz再现带宽的较高频带中的所有比例因子频带所共用的比例因子值、例如“18”,并且使用这个比例因子值“18”来计算在每个比例因子频带中的绝对最大值频谱数据(波峰)的量化值(S21)。
第二量化单元133指定在具有11.025kHz以上再现带宽的较高频带中的第一比例因子频带中的绝对最大值频谱数据(波峰)(S22)。在图11的例子中,①指示在第一比例因子频带中的波峰,而且在那时峰值为“256”。
第二量化单元133通过将预定的共用比例因子值“18”和峰值“256”应用到一个用于计算量化值的公式,计算量化值(S23)。例如,如果用比例因子值“18”量化峰值“256”,则计算量化值“6”。
当为第一比例因子频带计算出峰值“256”的量化值“6”(S24)时,第二量化单元133指定在下一个比例因子频带中的频谱数据的波峰(S22)。如果指定的波峰位置是②而且峰值为例如“312”,则它用比例因子值“18”计算出峰值“312”的量化值为例如“10”(S23)。
以同样的方式,第二量化单元133用比例因子值“18”为在较高频带中的第三比例因子频带计算出波峰③值“288”的量化值为“9”,并且用比例因子值“18”为第四比例因子频带计算出波峰④值“203”的量化值“5”。
当用固定的比例因子“18”为在较高频带中的所有比例因子频带计算峰值的量化值(S24)时,第二量化单元133把通过该计算获得的每一个比例因子频带的量化值作为用于较高频带的子信息输出到第二编码单元134,并且结束该处理。
如上所述,第二量化单元133产生子信息(量化值)。这个子信息分别以4比特的量化值表示在以512个采样的频谱数据表示的较高频带中的4个比例因子频带,而以上所述的子信息(比例因子)分别以8比特的频谱数据表示在较高频带中的4个比例因子频带。因此,在量化值的情况下,在较高频带中的数据量被减少更多了。此外,这个量化值粗略地表示了每个比例因子频带的峰值(绝对值)的振幅,并且可以说,采用固定值或者通过刚好把在较低频带中的部分或者所有频谱数据的复制乘以量化值而获得的频谱数据、在较高频带中的512个采样的频谱数据粗略地重构了根据输入音频信号获得的频谱数据。此外,通过把在该频带中的每个频谱数据乘以作为一个系数、介于在该频带中复制的频谱数据的绝对最大值和通过解量化对应于那个频带的量化值而获得的值之间的比值,可以为每个比例因子频带更准确地重构频谱数据。
在当前实施例中,预先确定对应于作为第二编码信息将被传输的量化值的比例因子值,但是可以计算和传输最佳的比例因子值以添加到第二编码信息中。例如,如果选择了一个用于导出量化值的最大值“7”的比例因子,则指示量化值的位数仅仅是3,所以用于传输量化值所需要的信息量被减少得更多。
在当前实施例中,只有量化值、或者只有量化值和比例因子被编码为子信息,但是本发明不局限于此,而且比例因子、特征频谱的位置信息、频谱数据的符号信息、噪音产生方法等可以被编码。或者它们中的两个或多个的组合可以被编码。
图13显示了一个频谱波形,其显示了由如图2所示的第二量化单元133产生的子信息(位置信息)的一个具体例子。图14是一个流程图,显示了在由如图2所示的第二量化单元133执行的子信息(位置信息)计算处理中的操作。
依据下列过程,第二量化单元133指定在具有11.025kHz以上直至22.05kHz再现带宽的较高频带中的每个比例因子频带中的绝对最大值频谱数据的位置(S31)。
第二量化单元133指定在具有11.025kHz以上再现带宽的较高频带中的第一比例因子频带中的绝对最大值频谱数据(波峰)(S32)。在图13的例子中,①指示在第一比例因子频带中指定的波峰和从这个比例因子频带中第一个频谱数据起的第22个频谱数据。第二量化单元133保持指定的波峰位置“从该比例因子频带中第一个频谱数据起的第22个频谱数据”(S33)。
当为第一比例因子频带指定和保持波峰位置(S34)时,第二量化单元133指定在下一个比例因子频带中的频谱数据的波峰(S32)。例如,指定的波峰位于②处,并且是从该比例因子频带中第一个频谱数据起的第60个频谱数据。第二量化单元133保持指定的波峰位置“从该比例因子频带中第一个频谱数据起的第60个频谱数据”(S33)。
以同样方式,第二量化单元133指定和保持在较高频带中在第三比例因子频带中的波峰③位置“该比例因子频带的第一个频谱数据”,并且指定和保持在第四比例因子频带中的波峰④位置“从该比例因子频带的第一个起的第25个频谱数据”。
当指定和保持了在较高频带中的所有比例因子频带的波峰位置(S34)时,第二量化单元133把保持的比例因子频带的波峰位置作为用于较高频带的子信息输出到第二编码单元134,并且结束该处理。
如上所述,第二量化单元133产生子信息(位置信息)。这个子信息(位置信息)分别以6比特的位置信息表示以512个采样的频谱数据表示的、在较高频带中的4个比例因子频带。
在这种情况下,依据从第二解码单元223输入的子信息(位置信息),在解码设备200中的第二解量化单元224复制在较低频带中的部分或者所有512个采样的频谱数据,作为在较高频带中的512个采样的采样数据。
通过根据在一个或多个比例因子频带中的频谱数据的波峰信息、从第一解量化单元222输出的频谱数据中提取类似的数据、并且复制它的部分或者全部,复制在较低频带中的频谱数据。
此外,如果必要的话,第二解量化单元224调整所复制的频谱数据的振幅。通过把每个频谱数据乘以一个预定系数、例如“0.5”来调整该振幅。这个系数可以是一个固定值,或者可以对每个带宽或者比例因子频带而改变,或者是取决于从第一解量化单元222输出的频谱数据而改变。
在当前实施例中,使用了一个预定系数,但是这个系数值可以作为子信息被添加到第二编码信息。或者比例因子值可以作为一个系数被加到第二编码信息上,或者是在比例因子频带中的波峰的量化值可以作为一个系数被加到第二编码信息上。该振幅调整方法不局限于以上所述的那种情况,并且可以使用另一种方法。
在当前实施例中,只有位置信息、或者只有位置信息和系数信息被编码,但是本发明不局限于此。比例因子、量化值、频谱的符号信息、噪音产生方法等都可以被编码。或者,它们中的两个或多个的组合可以被编码。
此外,在当前实施例中,在较低频带中的频谱数据被复制作为较高频率数据的频谱数据。然而,本发明不局限于此,而且可以仅仅从第二编码信息中产生在较高频带中的频谱数据。
图15显示了一个频谱波形,其显示了由如图2所示的第二量化单元133产生的子信息(符号信息)的一个具体例子。图16是一个流程图,显示了在由如图2所示的第二量化单元133执行的子信息(符号信息)计算处理中的操作。
第二量化单元133依据下列过程指定在具有11.025kHz以上直至22.05kHz再现带宽的较高频带中的每个比例因子频带中的一预定位置处(例如在中心处)的频谱数据的符号信息(S41)。
第二量化单元133检查在具有11.025kHz以上再现带宽的较高频带中的第一比例因子频带的中心位置处的频谱数据的符号信息(S42),并且保持该值。例如,在第一比例因子频带的中心位置处的频谱数据的符号是“+”。第二量化单元133以1比特的值“1”表示这个符号“+”并且保持它。当符号为“-”时,第二量化单元133以“0”表示它并且保持它。
当保持在第一比例因子频带的中心位置的频谱数据的符号信息时(S43),第二量化单元133检查在下一个比例因子频带的中心位置的频谱数据的符号(S42)。例如,符号为“+”,第二量化单元133保持“1”作为在第二比例因子频带的中心位置的频谱数据的符号信息。
以同样的方式,第二量化单元133检查在较高频带中第三比例因子频带的中心位置的频谱数据的符号“+”,并且保持符号信息“1”。第二量化单元133进一步检查在第四比例因子频带的中心位置的频谱数据的符号“+”,并且保持符号信息“1”。
当在较高频带中所有比例因子频带的中心位置的频谱数据的符号信息被保持(S43)时,第二量化单元133把保持的比例因子频带的符号信息作为用于较高频带的子信息输出到第二编码单元134,并且结束该处理。
如上所述,第二量化单元133产生子信息(符号信息)。这个子信息(符号信息)分别以1比特的符号信息表示在较高频带中以512个采样的频谱数据表示的4个比例因子频带,并且因此能够用非常短的数据长度表示在较高频带中的频谱。
在这种情况下,在解码设备200中的第二解量化单元224复制在较低频带中的部分或者全部512个采样的频谱数据作为在较高频带中的频谱,并且根据从第二解码单元223输入的符号信息,确定在一预定位置中的频谱数据的符号。
在此,指示了在较高频带中每个比例因子频带的中心位置中的符号的符号信息被用作子信息(符号信息)。然而,本发明不局限于比例因子频带的中心位置,并且可以使用每个波峰位置、每个比例因子频带的第一个频谱数据、或者其它预定位置。
在本实施例中,将被传输的对应于符号(符号信息)的频谱数据的位置被预先确定下来,但是它可以取决于第一解量化单元222的输出而改变,或者,指示了每个比例因子频带的符号信息之位置的位置信息可以被添加到第二编码信息上并且被传输。
此外,如果必要的话,第二解量化单元224调整所复制的频谱数据的振幅。通过把每个频谱数据乘以一个预定系数、例如“0.5”来调整振幅。
这个系数可以是一个固定值,或者可以为每个带宽或者比例因子频带而改变,或者是取决于从第一解量化单元222输出的频谱数据而改变。振幅调整方法不局限于这一种,而且可以使用其它任何方法。
在当前实施例中,使用了一个预定系数,但是这个系数值可以作为子信息被添加到第二编码信息。或者比例因子值可以作为一个系数被加到第二编码信息上,或者是一个量化值可以作为一个系数被加到第二编码信息上。
在当前实施例中,只有符号信息、只有符号信息和系数信息、或者只有符号信息和位置信息被编码,但是本发明不局限于此。量化值、比例因子、特征频谱的位置信息、噪音产生方法等可以被编码。或者它们中的两个或多个的组合可以被编码。
此外,在当前实施例中,在较低频带中的频谱数据被复制作为较高频率数据中的频谱数据。然而,本发明不局限于此,而且可以仅仅从第二编码信息中产生在较高频带中的频谱数据。
在当前实施例中,符号“+”以1比特的值“1”表示,而符号“-”以“0”表示。然而,本发明不局限于在子信息(符号信息)中的符号的这个表示,并且可以使用其它任何值。
图17A和17B显示了频谱波形,其显示了如何创建由如图2所示的第二量化单元133产生的子信息(复制信息)的例子。图17A显示了在较高频带中第一个比例因子频带中的一个频谱波形。图17B显示了用子信息(复制信息)指定的在较低频带中的频谱波形的例子。图18是一个流程图,显示了在由如图2所示的第二量化单元133执行的子信息(复制信息)计算处理中的操作。
就具有11.025kHz以上直至22.05kHz再现带宽的较高频带中的每个比例因子频带来说,第二量化单元133依据下列过程指定在较低频带中的比例因子频带的编号N(S51)。在较低频带中的比例因子频带编号N被指定,这是因为那个频带的波峰位置的值最接近于在较高频带中该比例因子频带的波峰位置“n”(从该比例因子频带的第一个数据起的第“n”个数据)。
第二量化单元133指定在具有11.025kHz以上再现带宽的较高频带中的第一比例因子频带中的绝对最大值频谱数据(波峰)位置“n”(S52)。如图17A所示,①指示指定波峰“n”,并且在那个位置处的频谱数据编号为n=22。
第二量化单元133指定在具有11.025kHz或者更少再现带宽的较低频带中的所有频谱(包括正的和负的频谱)的波峰位置(S53)。
接下来,对在较低频带中的每个指定波峰,第二量化单元133搜索从第一个起其波峰位置最接近于“n”的比例因子频带,并且指定那个比例因子频带的编号N、搜索方向和波峰的符号信息(S54)。
特别地,对在较低频带中的每个指定波峰(包括正的和负的),第二量化单元133搜索顺序地从较低频率方起其波峰位置最接近于“n”的比例因子频带中的第一个。有两个搜索方向:(1)沿较低频率方向从波峰起搜索,以及(2)沿较高频率方向从波峰起搜索。此外,就在较低频带中其正负符号与在较高频带中的波峰符号相反的波峰来说,也有两个搜索方向:(3)沿较低频率方向从波峰起搜索,以及(4)沿较高频率方向从波峰起搜索。
在搜索方向(2)和(4)的情况下,当根据波峰信息复制在较低频带中的频谱波形时,在较高频带中的波峰位置和在较低频带中的波峰位置从一端到一端(沿频率轴线方向)是相反的,如图17B所示。因此,例如在(1)和(3)是正向搜索方向而(2)和(4)是相反搜索方向时,有必要附加指示搜索方向(正向及反向)的信息。此外,在搜索方向(3)和(4)的情况下,在较高频带中的波峰位置和在较低频带中的波峰位置是上下(沿垂直轴方向)相反的,如图17B所示。因此,有必要附加指示较高和较低频带的峰值的正号和负号是否是反向的信息。
第二量化单元133沿4个方向进行搜索,即如果在较低频带中指定的峰值为正则沿搜索方向(1)和(2)进行,而且如果峰值为负则沿搜索方向(3)和(4)进行,然后指定在搜索结果当中其波峰位置最接近于“n”的比例因子频带的编号。在这种情况下,某个值(例如“5”)被预先确定为在“n”和实际波峰位置之间的容限,第二量化单元133在4种搜索结果当中选择其波峰位置最接近于“n”的比例因子频带,并且指定那个比例因子频带的编号N。此外,它指定指示了在较高频带和较低频带中的峰值的符号是否相反的符号信息、以及指示了搜索方向(正向或者反向)的信息。
例如,在搜索方向(1)中,如图17B(1)所示,为在较低频带中的频谱指定比例因子频带的编号N=3,且具有从波峰位置起“1”的容限。类似地,在搜索方向(2)、(3)和(4)中,如图17B(2)、(3)和(4)所示,指定比例因子频带的编号N=18、N=12和N=10,且分别具有从波峰位置起“5”、“4”和“2”的容限。第二量化单元133在这些指定的4个比例因子频带编号当中选择其波峰位置最接近于“n”、且具有从波峰位置起“1”之容限的比例因子频带的编号N=3。此外,它产生指示了在较低频带中波峰的符号“+”的符号信息“1”、以及指示了沿较低频率方向搜索的搜索方向信息“1”。在这种情况下,如果波峰的符号为“-”,则符号信息为“0”,而且如果搜索是沿较高频率方向执行的,则搜索方向信息为“0”。
当为在较高频带中的第一个比例因子频带指定比例因子频带编号N=3、符号信息“1”和搜索方向信息“1”(S55)时,第二量化单元133用和以上相同的方式指定下一个比例因子频带的编号N、符号符号和搜索方向信息。
用这样的方式,指定在较低频带中从第一个起其波峰位置最接近于在较高频带中从该比例因子频带的第一个起的波峰位置“n”的每个比例因子频带的编号N、符号信息和搜索方向信息(S55)。然后,第二量化单元133把在较低频带中对应于在较高频带中每个比例因子频带的比例因子频带的指定编号N、符号信息和搜索方向信息作为用于较高频带的子信息(复制信息)输出到第二编码单元134,并且结束该处理。
在这种情况下,如果在解码设备200中依据常规过程解码了第一编码信号,则能够获得较低频率方的512个采样的频谱数据。第二解量化单元224把对应于从第二解码单元223输出的比例因子频带编号的部分或者全部的频谱数据复制作为在较高频带中的频谱。如果必要的话,第二解量化单元224调整所复制的频谱数据的振幅。通过把每个频谱乘以一个预定系数(例如0.5)来调整振幅。
这个系数可以是一个固定值,或者可以为每个比例因子频带而改变,或者是取决于从第一解量化单元222输出的频谱数据而改变。
在当前实施例中,使用了一个预定系数,但是这个系数值可以作为子信息被添加到第二编码信息上。或者比例因子值可以作为一个系数被加到第二编码信息上,或者是量化值可以作为一个系数被加到第二编码信息上。此外,振幅调整方法不局限于以上所述,而且可以使用其它任何方法。
在当前实施例中,比例因子频带的符号信息和搜索方向信息以及编号N被提取作为用于较高频带的子信息(复制信息)。然而,取决于在较高频带中可传输的信息量,可以忽略符号信息和搜索方向信息。此外,当在较低频带中的波峰的符号为“+”时,符号信息被表示为“1”,而当符号为“-”时它被表示为“0”。当在较低频率方向上从波峰起进行搜索时,搜索方向信息被表示为“1”,而当在较高频率方向上从波峰起进行搜索时它被表示为“0”。然而,在符号信息中在较低频带中波峰的符号和在搜索方向信息中的搜索方向不局限于上述那些,而且它们可以以其它值表示。
此外,在当前实施例中,搜索在较低频带中从第一个起其指定波峰位置最接近于“n”的比例因子频带中的第一个。然而,本发明不局限于此,可以搜索在较低频带中从每个比例因子频带中第一个起其位置最接近于“n”的波峰。
图19显示了一个频谱波形,其显示了如何创建由如图2所示的第二量化单元133产生的子信息(复制信息)的第二个例子。图20是一个流程图,显示了在由如图2所示的第二量化单元133执行的第二子信息(复制信息)计算处理中的操作。
对于具有11.025kHz以上直至22.05kHz之再现带宽的较高频带中的每个比例因子频带,依据下列过程,第二量化单元133指定在较低频带中的比例因子频带的编号N,其与较高频带中的比例因子频带中每个频谱的差值最小(S61)。在这种情况下,在较低频带中的频谱数据的数目等于在较高频带中的频谱数据的数目,而且指定的比例因子频带的编号N指示了那个比例因子频带中第一个的编号。
对于较低频带中的每个比例因子频带(S62),第二量化单元133在包含与较高频带中的比例因子频带的频谱数据相同数目的频谱数据的频率带宽中,从较低频带中的比例因子频带的第一个数据起,计算较高频带中的频谱和在较低频带中的频谱之间的差值(S63)。例如,在如图19所示的波形中,如果较高频带中的第一比例因子频带包含48个采样的频谱数据,则第二量化单元133按顺序从在较低频带中编号N=1的比例因子频带的第一个数据起,计算在较高频带和较低频带之间的48个频谱数据的差值。
当第二量化单元133计算在较高频带和较低频带之间的频谱的差值(S65)时,它保持该值,然后对下一个比例因子频带,在包含与在较高频带中比例因子频带中频谱数据相同数目的频谱数据的频率带宽中,从在较低频带中下一个比例因子频带的第一个起,计算在较高频带和较低频带之间的频谱的差值(S64)。例如,当在48个采样的频谱数据的宽度中计算在较低频带中从编号N=1的比例因子频带中的第一个起频谱的差值时,第二量化单元133保持所计算的差值,并且进一步在48个采样的频谱数据的宽度中计算在较低频带中从编号N=2的比例因子频带中的第一个起频谱的差值。以同样的方式,第二量化单元133对于在较低频带中从编号N=3、4、……、28(在较低频带中的最后一个比例因子频带)的所有比例因子频带,通过顺序地把较高频带与较低频带之间的48个频谱数据的差值求和,计算频谱的差值。
对于较低频带中的所有比例因子频带,第二量化单元133在与较高频带中相同数目的频谱数据的宽度中,从在较低频带中的比例因子频带中的第一个起,计算在较高频带和较低频带之间频谱的差值(S64)。然后,第二量化单元133指定在其中所计算的差值最小的比例因子频带的编号N(S65)。例如,在如图19所示的频谱波形中,指定在较低频带中编号N=8的比例因子频带。在这个图中示出,在阴影部分中较低频带中的频谱数据和在阴影部分中较高频带中的频谱数据之间的差值是最小的,而且在两个频谱之间的能量差值是最小的。换句话说,如果从编号N=8的比例因子频带中的第一个起的48个采样的频谱数据被复制到在11.025kHz以上的较高频带中的第一个比例因子频带,则它们变成由在图19中较高频带中的点划线(交替的长短虚线)指示的波形,并且因此,较高频带中在相应比例因子频带中的能量能够被表示近似于初始频谱。
当第二量化单元133指定在较低频带中其与在较高频带中的比例因子频带中的频谱的差值为最小的比例因子频带的编号N时,它保持所指定的比例因子频带的编号N,然后指定在较低频带中对应于较高频带中下一个比例因子频带的比例因子频带的编号N(S66)。第二量化单元133按顺序重复这个处理,并且当它指定在较低频带中其与较高频带中频谱的差值为最小的比例因子频带的所有编号N时,它把所保持的较低频带中的比例因子频带的编号N输出到第二编码单元134,作为用于较高频带的子信息(复制信息),并且结束该处理。
在当前实施例中,由解码设备200复制在较低频带中的频谱和调整其振幅的方法与结合图17和图18所描述的子信息(复制信息)的情况相同。
在图20的流程图中,在频率轴上相同的方向上,计算在较高频带和较低频带之间的相同符号频谱数据的能量差值。然而,本发明的编码设备不局限于此,如使用图17和图18所示,它们可以使用以下三种方法中的任何一种来计算:①就在较高频带中具有相同符号并且在从较低频带到较高频带的方向上被顺序选择的频谱数据而言,在从较高频带到较低频带的方向上(沿频率轴上的相反方向)从较低频带中的比例因子频带中的第一个起连续地选择在较低频带中相同编号的频谱数据,并且计算频谱的差值,②沿频率轴上同一方向,使在较低频带中的频谱的符号相反(乘以负号)并且进行计算,以及③沿频率轴上的相反方向,使在较低频带中的频谱的符号相反(乘以负号)并且进行计算。或者,在依据所有四种方法计算能量差值之后,在较低频带中包括其能量差值最小的频谱的比例因子频带的编号N可以是子信息。在那种情况下,为了精确地复制在较低频带中其能量差值最小的频谱到较高频带中,把指示了在较高和较低频带的频谱的符号之间的关系的信息、以及指示了在频率轴上的复制方向的信息插入到用于每个比例因子频带的子信息中。指示了在较高和较低频带的频谱符号之间关系的信息由1比特表示,例如,“1”用于用相同符号计算的频谱的差值,而“0”用于用相反符号计算的频谱的差值。此外,指示了复制在较低频带中的频谱到较高频带的频率轴上之方向的信息由1比特表示,例如,“1”用于正向复制方向、即在较高和较低频带中选择频谱数据的正方向,而“0”用于相反复制方向、即在较高和较低频带中选择频谱数据的反方向。
图21是一个流程图,显示了如图2中所示的第二解量化单元224沿正向把在较低频带中的512个采样的频谱复制到较高频带的过程。在图21中,inv_spec1[i]表示在来自第一解量化单元222的输出数据当中第i个频谱的值,而inv_spec2[i]表示在输入到第二解量化单元224中的数据当中第j个频谱的值。
首先,第二解量化单元224分别设置计数器i和计数器j的初始值为“0”,以便在同一个方向输入第0个到第511个频谱数据(S71),其中两个计数器i和j统计频谱数据的数目。接下来,第二解量化单元224检查计数器i的值是否小于“512”(S72)。当计数器i的值小于“512”时,第二解量化单元224输入第一解量化单元222的较低频带中的第i个(在这种情况下为第0个)频谱数据的值,作为第二解量化单元224的较高频带中的第j个(在这种情况下为第0个)频谱数据的值(S73)。然后,第二解量化单元224分别把计数器i和j的值加1(S74),并且检查计数器i的值是否小于“512”(S72)。
当计数器i的值小于“512”时,第二解量化单元224重复上述处理,并且在该值变为“512”或更多时结束该处理。
结果,作为第一解量化单元222的解量化结果,在较低频带中的所有第0个到第511个频谱数据被照原样复制,作为第二解量化单元224的较高频带中的频谱数据。
图22是一个流程图,显示了如图2中所示的第二解量化单元224沿在频率轴上的反方向把在较低频带中的512个采样的频谱复制到较高频带的过程。在图22中,inv_spec1[i]表示在从第一解量化单元222输出的数据当中第i个频谱数据的值,而inv_spec2[i]表示在输入到第二解量化单元224中的数据当中第j个频谱数据的值。
首先,第二解量化单元224分别设置计数器i的初始值为“0”和计数器j的值为“511”,以便沿反方向输入第0个到第511个频谱数据(S81),其中两个计数器i和j统计频谱数据的数目。接下来,第二解量化单元224检查计数器i的值是否小于“512”(S82)。当计数器i的值小于“512”时,第二解量化单元224输入第一解量化单元222的较低频带中的第i个(在这种情况下为第0个)频谱数据的值,作为第二解量化单元224的较高频带中的第j个(在这种情况下为第511个)频谱数据的值(S83)。然后,第二解量化单元224把计数器i的值加1和把计数器j的值减1(S84),并且检查计数器i的值是否小于“512”(S82)。
当计数器i的值小于“512”时,第二解量化单元224重复上述处理,并且在该值变为“512”或更多时结束该处理。
因此,作为第一解量化单元222的解量化结果,在较低频带中的所有第0个~第511个频谱数据沿反方向被复制作为第二解量化单元224的较高频带中的第511个~第0个频谱数据。
在当前实施例中,第二解量化单元224复制在较低频带中的所有频谱数据到较高频带中,但是它可以仅仅复制较低频带中的一部分频谱数据。参照图21和图22描述了同时复制较高频带和较低频带的过程的例子。然而,可以依据如图21所示的过程复制它们的一部分,而且可以依据如图22所示的过程复制它们的另一部分。此外,通过使其正号和负号变为相反,可以复制它们的一部分或者全部。
这些复制过程可以是预先确定的,或者可以取决于在较低频带中的数据而改变,或者可以被传输作为子信息。
在当前实施例中,在较低频带中的频谱数据被复制作为在较高频带中的频谱数据,但是本发明不局限于此,较高频带中的频谱数据可以仅仅从第二编码信息中产生。
在当前实施例中,来自所有频谱数据中的较低频带中的512个采样被编码为第一编码信号,而其它采样被编码为第二编码信号,但是本发明不局限于那种配置。
在当前实施例中,就在第二解量化单元224中的噪音产生而论,描述了其中复制主要从第一解量化单元222获得的频谱数据的情况。然而,本发明不局限于此,而且可以在第二解量化单元224中以它自己的方式产生在较高频带中每个比例因子频带中具有某一值的频谱数据、白噪声、粉红噪声等,或者它们可以依据子信息产生。
在当前实施例中,为每个比例因子频带编码一个子信息作为第二编码信号,但是可以为两个或更多的比例因子频带编码一个子信息,或者可以为一个比例因子频带编码两个或更多的子信息。
在当前实施例中,可以为每个通道编码子信息,或者可以为两个或更多通道编码一个子信息。
在当前实施例中,编码设备100包含两个量化单元和两个编码单元。然而,本发明不局限于此,它可以分别包含三个或更多的量化单元和编码单元。
在当前实施例中,解码设备200包含两个解码单元和两个解量化单元。然而,本发明不局限于此,并且它可以分别包含三个或更多的解码单元和解量化单元。
在当前实施例中,描述了其中变换单元120把变换的频谱数据分成由它自己确定的数目的比例因子频带和其定界的情况。然而,本发明不局限于此,并且变换单元可以依据AAC标准把变换的频谱数据分成若干个比例因子频带。通过依据AAC标准把它们分成比例因子频带,传统的解码设备400还可以解码由本发明的编码设备100编码的位流而没有任何问题,并且照常获得数字音频输出数据。
以上所述的处理能够由软件以及硬件来实现,并且本发明可以被配置得使一部分的处理由硬件实现而其它处理由软件实现。
在假定取样频率为44.1kHz和用于一帧的数字音频数据包含1,024个采样的情况下描述了当前实施例。然而,本发明中的编码设备和解码设备不局限于此,并且可以使用任何赫兹的取样频率。
工业实用性
依据本发明的编码设备可用作一种音频编码设备,其被设置在包括广播卫星(BS)和通信卫星(CS)的卫星广播站中;可用作一个内容分配服务器的音频编码设备,其经由一通信网络(如因特网)分配内容;以及可用作一个由一通用计算机执行的、用于编码音频信号的程序。
依据本发明的解码设备不仅可用作一个被包括在用于家用的机顶盒中的音频解码设备,而且可用作为一个由一通用计算机执行的、用于解码音频信号的程序,可用作一个被包括在STB或者通用计算机中并且专门被用来解码一音频信号的电路板、LSI等,以及可用作为一个被插入到STB或者通用计算机中的IC卡。
Claims (22)
1、一种对输入的音频信号进行编码的编码设备,包含:
第一编码单元,用于编码在较低频带中的频谱数据,其中该频谱数据出自通过变换在一固定时间长度内输入的音频信号而获得的、并且被分成多组的频谱数据,该在较低频带中的频谱数据由四种参数表示:(1)用于归一化每一组中的频谱数据的归一化因子,(2)通过使用该归一化因子量化所述每一组中的每一个频谱数据而获得的量化值,(3)指示所述每一个频谱数据的相位的正号或负号,以及(4)在频率域中所述每个频谱数据的位置:
子信息产生单元,用于产生子信息,包括:(1)指定信息,用于指定较低频带中的频谱数据,其接近于较高频带中所述每一组中的频谱数据;以及(2)校正信息,用于指示在较高频带中的频谱数据的特征,其由来自所述四种参数的三种或更少种参数表示,作为用于校正在较低频带中的指定频谱数据的信息;
第二编码单元,用于编码所产生的子信息;以及
输出单元,用于输出由第一编码单元编码的数据和由第二编码单元编码的数据。
2、如权利要求1所述的编码设备,
其中,该子信息产生单元产生归一化因子作为校正信息,其中该归一化因子被计算,以使得通过量化较高频带中所述每一组中的波峰频谱数据而获得的值变为一固定值。
3、如权利要求1所述的编码设备,
其中,子信息产生单元使用为所述每一组所共用的归一化因子,量化较高频带中所述每一组中的波峰频谱数据的值,并且产生量化值作为校正信息。
4、如权利要求1所述的编码设备,
其中,该子信息产生单元产生较高频带中所述每一组中的波峰频谱数据的频率位置作为校正信息。
5、如权利要求1所述的编码设备,
其中,该频谱数据是一个MDCT系数,并且
该子信息产生单元产生一个符号作为校正信息,该符号指示在较高频带中一预定频率位置处频谱数据的正或负。
6、如权利要求1所述的编码设备,
其中,该子信息产生单元产生指定信息,该指定信息用于在较低频带的频谱当中指定一个频谱,其中该频谱在形状上类似于在较高频带中所述每一组中的频谱数据的每个频谱。
7、如权利要求1所述的编码设备,
其中,该子信息产生单元产生指定信息,用于指定在较低频带中的一个频谱,其中,以下两个距离之间的差值是最小的:(1)在频率域内属于较高频带的所述每一组的边界到该组中一个频谱的波峰的距离、以及(2)在频率域内属于较低频带的所述每一组的边界到该组中一个频谱的波峰的距离。
8、如权利要求1所述的编码设备,
其中,该子信息产生单元产生指定信息,用于指定在较低频带中的一频谱,在相同的频率带宽中,该较低频带中的该频谱与在较高频带的组中的频谱所获得的能量差值最小。
9、如权利要求8所述的编码设备,
其中,该指定信息由指定在较低频带中的指定频谱所属的组的编号来表示。
10、如权利要求1所述的编码设备,
其中,该输出单元进一步包括一个流输出单元,其用于把由第一编码单元编码的数据变换成为以一种预定格式定义的编码音频流,在该编码音频流中的一个区域中存储由第二编码单元编码的数据,并且输出该编码音频流,该区域的使用在该预定格式下不受限制。
11、如权利要求1所述的编码设备,
其中,该输出单元进一步包括一个第二流输出单元,用于把由第一编码单元编码的数据变换成为以一种预定格式定义的编码音频流,在一个不同于该编码音频流的流中存储由第二编码单元编码的数据,并且输出该不同的流。
12、一种解码设备,用于接收编码数据并且解码所接收的编码数据,其中该编码数据包括第一编码数据和第二编码数据,
其中,第一编码数据是通过编码在较低频带中的频谱数据获得的,其中该频谱数据来自通过变换在一固定时间长度内输入的音频信号而获得的、并且被分成多组的频谱数据,在较低频带中的该频谱数据由四种参数表示:(1)用于归一化在每一组中的频谱数据的归一化因子,
(2)通过使用归一化因子量化所述每一组中的每一个频谱数据而获得的量化值,(3)指示所述每一个频谱数据的相位的正号或者负号,和(4)在频率域中所述每个频谱数据的位置,
第二编码数据是通过编码包括以下信息的子信息获得的:(1)指定信息,用于指定在较低频带中的频谱数据,其接近于在较高频带中所述每一组中的频谱数据,以及(2)校正信息,指示由来自所述四种参数的三种或更少种参数表示的在较高频带中的频谱数据的特征,作为用于校正在较低频带中的指定频谱数据的信息,以及
该解码设备包含:
编码数据分离单元,用于从所接收的编码数据中分离出第二编码数据;
第一解码单元,用于解码来自所接收编码数据的第一编码数据,以及输出指示该较低频带的频谱数据;
第二解码单元,用于解码从所接收的编码数据中分离出的第二编码数据;从由第一解码单元输出的频谱数据中,将在较低频带中基于在子信息中的指定信息而指定的频谱数据复制到较高频带中的所述每一组中;根据在子信息中的校正信息来校正所复制的频谱数据,以及由此产生和输出指示该较高频带的频谱数据;以及
音频信号输出单元,用于结合由第一解码单元输出的频谱数据和由第二解码单元输出的频谱数据;变换所结合的数据;和输出所变换的数据作为在时间域中的音频信号。
13、如权利要求12所述的解码设备,
其中,该校正信息是归一化因子,其中该归一化因子被计算以使通过量化在较高频带中所述每一组中的波峰频谱数据而获得的值变为固定值,以及
第二解码单元使用在子信息中用于所述每一组的归一化因子,校正被复制到在较高频带中所述每一组中的频谱数据,并且产生在较高频带中的频谱数据。
14、如权利要求12所述的解码设备,
其中,该校正信息是归一化因子,其中该归一化因子被计算以使通过量化在较高频带中所述每一组中的波峰频谱数据而获得的值变为固定值,以及
第二解码单元使用在子信息中的归一化因子,解量化一个预定的量化值,并且产生在较高频带中的频谱数据,其中该量化值被产生以使在较高频带中所述每一组共有一个绝对最大值。
15、如权利要求12所述的解码设备,
其中,该校正信息是归一化因子,其中该归一化因子被计算以使通过量化在较高频带中所述每一组中的波峰频谱数据而获得的值变为固定值,以及
第二解码单元产生一个在较高频带中所述每一组中的预定噪音,使用该归一化因子作为校正信息,定形在所述每一组中产生的噪音,并且产生在较高频带中的频谱数据。
16、如权利要求12所述的解码设备,
其中,该校正信息是一个量化值,其中该量化值是通过使用为所述每一组所共用的归一化因子、来量化在较高频带中所述每一组中的频谱数据的峰值而获得的,以及
第二解码单元使用在该校正信息中的量化值、校正被复制到较高频带中所述每一组中的频谱数据,并且产生在较高频带中的频谱数据。
17、如权利要求12所述的解码设备,
其中,该校正信息是一个量化值,其中该量化值是通过使用为所述每一组所共用的归一化因子来量化在较高频带中所述每一组中的频谱数据的峰值而获得的,以及
第二解码单元使用为所述每一组所共用的归一化因子来解量化在该校正信息中的量化值,并且产生在较高频带中的频谱数据,其中该频谱数据是通过解量化所述每一组的波峰而获得的。
18、如权利要求12所述的解码设备,
其中,该校正信息是一个量化值,其中该量化值是通过使用为所述每一组所共用的归一化因子来量化在较高频带中所述每一组中的频谱数据的峰值而获得的,以及
第二解码单元产生一个在较高频带中所述每一组中的预定噪音;使用该量化值作为校正信息来定形在所述每一组中产生的噪音;并且产生在较高频带中的频谱数据。
19、如权利要求12所述的解码设备,
其中,该校正信息是指示了在较高频带中所述每一组中的波峰频谱数据的频率位置的信息,以及
第二解码单元产生在较高频带中所述每一组中的频谱数据,其中该频谱数据在该校正信息中的频率位置是在较高频带中所述每一组中的波峰。
20、如权利要求12所述的解码设备,
其中,该频谱数据是一个MDCT系数,
校正信息是一个符号,指示在较高频带中在一预定频率位置处频谱数据的正或者负,以及
第二解码单元产生在较高频带中在预定频率位置处的频谱数据,该频谱数据具有该校正信息中的符号。
21、如权利要求12所述的解码设备,
其中,第二解码单元产生一个在较高频带中在所述每一组中的预定噪音;把所产生的噪音添加到被校正的频谱数据上;并且产生在较高频带中的频谱数据。
22、如权利要求12所述的解码设备,
其中,第二解码单元进一步保持振幅的一个预定增益,并且通过用所保持的振幅增益放大所产生的频谱数据,校正在较高频带中产生的频谱数据。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001337869A JP3923783B2 (ja) | 2001-11-02 | 2001-11-02 | 符号化装置及び復号化装置 |
JP337869/2001 | 2001-11-02 | ||
JP367008/2001 | 2001-11-30 | ||
JP2001367008 | 2001-11-30 | ||
JP2001381807A JP3984468B2 (ja) | 2001-12-14 | 2001-12-14 | 符号化装置、復号化装置及び符号化方法 |
JP381807/2001 | 2001-12-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1507618A CN1507618A (zh) | 2004-06-23 |
CN1288622C true CN1288622C (zh) | 2006-12-06 |
Family
ID=27347778
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02809440.9A Expired - Fee Related CN1288622C (zh) | 2001-11-02 | 2002-10-30 | 编码设备和解码设备 |
CNB02803421XA Expired - Fee Related CN1324558C (zh) | 2001-11-02 | 2002-10-30 | 编码设备,解码设备以及音频数据分配系统 |
CN02803419.8A Expired - Fee Related CN1209744C (zh) | 2001-11-02 | 2002-10-30 | 编码装置和解码装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB02803421XA Expired - Fee Related CN1324558C (zh) | 2001-11-02 | 2002-10-30 | 编码设备,解码设备以及音频数据分配系统 |
CN02803419.8A Expired - Fee Related CN1209744C (zh) | 2001-11-02 | 2002-10-30 | 编码装置和解码装置 |
Country Status (5)
Country | Link |
---|---|
US (3) | US7328160B2 (zh) |
EP (3) | EP1440433B1 (zh) |
CN (3) | CN1288622C (zh) |
DE (3) | DE60208426T2 (zh) |
WO (3) | WO2003038813A1 (zh) |
Families Citing this family (146)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6025545A (en) | 1990-01-22 | 2000-02-15 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US6946587B1 (en) | 1990-01-22 | 2005-09-20 | Dekalb Genetics Corporation | Method for preparing fertile transgenic corn plants |
DE10102154C2 (de) * | 2001-01-18 | 2003-02-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
DE60214027T2 (de) | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
MXPA03005133A (es) * | 2001-11-14 | 2004-04-02 | Matsushita Electric Ind Co Ltd | Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos. |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
ES2268340T3 (es) * | 2002-04-22 | 2007-03-16 | Koninklijke Philips Electronics N.V. | Representacion de audio parametrico de multiples canales. |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
US7460684B2 (en) * | 2003-06-13 | 2008-12-02 | Nielsen Media Research, Inc. | Method and apparatus for embedding watermarks |
DE602004004950T2 (de) * | 2003-07-09 | 2007-10-31 | Samsung Electronics Co., Ltd., Suwon | Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren |
WO2005027096A1 (en) * | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
KR100530377B1 (ko) * | 2003-12-30 | 2005-11-22 | 삼성전자주식회사 | 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법 |
JP5069909B2 (ja) * | 2004-01-20 | 2012-11-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ブロック系列化に基づくオーディオコーディング |
BRPI0510014B1 (pt) * | 2004-05-14 | 2019-03-26 | Panasonic Intellectual Property Corporation Of America | Dispositivo de codificação, dispositivo de decodificação e método do mesmo |
MX2007000076A (es) | 2004-07-02 | 2007-03-28 | Nielsen Media Res Inc | Metodos y aparatos para mezclar corrientes comprimidas de bits digitales. |
EP1775718A4 (en) * | 2004-07-22 | 2008-05-07 | Fujitsu Ltd | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
CN101124626B (zh) * | 2004-09-17 | 2011-07-06 | 皇家飞利浦电子股份有限公司 | 用于最小化感知失真的组合音频编码 |
US20080255832A1 (en) * | 2004-09-28 | 2008-10-16 | Matsushita Electric Industrial Co., Ltd. | Scalable Encoding Apparatus and Scalable Encoding Method |
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
US8769135B2 (en) * | 2004-11-04 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | Data set integrity assurance with reduced traffic |
JP4977471B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | 符号化装置及び符号化方法 |
JP4977472B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | スケーラブル復号化装置 |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
JP2006301134A (ja) * | 2005-04-19 | 2006-11-02 | Hitachi Ltd | 音楽検出装置、音楽検出方法及び録音再生装置 |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8086451B2 (en) | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
DE102005032079A1 (de) * | 2005-07-08 | 2007-01-11 | Siemens Ag | Verfahren und Vorrichtung zur Geräuschunterdrückung |
DE502006004136D1 (de) | 2005-04-28 | 2009-08-13 | Siemens Ag | Verfahren und vorrichtung zur geräuschunterdrückung |
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
JP4899359B2 (ja) * | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
US20070036228A1 (en) * | 2005-08-12 | 2007-02-15 | Via Technologies Inc. | Method and apparatus for audio encoding and decoding |
CN1937032B (zh) * | 2005-09-22 | 2011-06-15 | 财团法人工业技术研究院 | 切割语音数据序列的方法 |
KR100857111B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
ES2478004T3 (es) * | 2005-10-05 | 2014-07-18 | Lg Electronics Inc. | Método y aparato para decodificar una señal de audio |
US7752053B2 (en) * | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
US7624417B2 (en) * | 2006-01-27 | 2009-11-24 | Robin Dua | Method and system for accessing media content via the internet |
US8064608B2 (en) * | 2006-03-02 | 2011-11-22 | Qualcomm Incorporated | Audio decoding techniques for mid-side stereo |
KR100738109B1 (ko) * | 2006-04-03 | 2007-07-12 | 삼성전자주식회사 | 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치 |
JP2007293118A (ja) * | 2006-04-26 | 2007-11-08 | Sony Corp | 符号化方法および符号化装置 |
EP2200026B1 (en) * | 2006-05-10 | 2011-10-12 | Panasonic Corporation | Encoding apparatus and encoding method |
KR101393299B1 (ko) * | 2006-06-21 | 2014-05-09 | 삼성전자주식회사 | 오디오 데이터 부호화 방법 및 장치 |
US7974848B2 (en) * | 2006-06-21 | 2011-07-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding audio data |
US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
JP4396683B2 (ja) * | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
WO2008045950A2 (en) | 2006-10-11 | 2008-04-17 | Nielsen Media Research, Inc. | Methods and apparatus for embedding codes in compressed audio data streams |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
JP4984178B2 (ja) * | 2006-12-25 | 2012-07-25 | 国立大学法人九州工業大学 | 高域信号補間装置及び高域信号補間方法 |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
EP3145200A1 (en) | 2007-01-12 | 2017-03-22 | ActiveVideo Networks, Inc. | Mpeg objects and systems and methods for using mpeg objects |
KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
US7991622B2 (en) * | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
US8086465B2 (en) * | 2007-03-20 | 2011-12-27 | Microsoft Corporation | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms |
JP2008261978A (ja) * | 2007-04-11 | 2008-10-30 | Toshiba Microelectronics Corp | 再生音量自動調整方法 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
EP2112653A4 (en) * | 2007-05-24 | 2013-09-11 | Panasonic Corp | AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT |
US20090132238A1 (en) * | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
BRPI0821091B1 (pt) * | 2007-12-21 | 2020-11-10 | France Telecom | processo e dispositivo de codificação/decodificação por transformada com janelas adaptativas, e memória legível por computador |
EP3288034B1 (en) * | 2008-03-14 | 2019-02-20 | Panasonic Intellectual Property Corporation of America | Decoding device, and method thereof |
WO2009116582A1 (ja) * | 2008-03-19 | 2009-09-24 | 国立大学法人 北海道大学 | 動画検索装置および動画検索プログラム |
US7782195B2 (en) * | 2008-03-19 | 2010-08-24 | Wildlife Acoustics, Inc. | Apparatus for scheduled low power autonomous data recording |
KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US8508357B2 (en) * | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
CN101751928B (zh) * | 2008-12-08 | 2012-06-13 | 扬智科技股份有限公司 | 应用音频帧频谱平坦度简化声学模型分析的方法及其装置 |
KR101661374B1 (ko) * | 2009-02-26 | 2016-09-29 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치 및 이들 방법 |
CN102239518B (zh) * | 2009-03-27 | 2012-11-21 | 华为技术有限公司 | 编码和解码方法及装置 |
WO2010126709A1 (en) * | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
WO2010127268A1 (en) | 2009-05-01 | 2010-11-04 | The Nielsen Company (Us), Llc | Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content |
US9245148B2 (en) | 2009-05-29 | 2016-01-26 | Bitspray Corporation | Secure storage and accelerated transmission of information over communication networks |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8311843B2 (en) * | 2009-08-24 | 2012-11-13 | Sling Media Pvt. Ltd. | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
ES2805349T3 (es) | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
GB2481185A (en) * | 2010-05-28 | 2011-12-21 | British Broadcasting Corp | Processing audio-video data to produce multi-dimensional complex metadata |
WO2011161886A1 (ja) * | 2010-06-21 | 2011-12-29 | パナソニック株式会社 | 復号装置、符号化装置およびこれらの方法 |
EP2573766B1 (en) * | 2010-07-05 | 2015-03-18 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoding device, decoding device, program, and recording medium |
CN102959872A (zh) * | 2010-07-05 | 2013-03-06 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
US9112535B2 (en) * | 2010-10-06 | 2015-08-18 | Cleversafe, Inc. | Data transmission utilizing partitioning and dispersed storage error encoding |
CA2814070A1 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
WO2012102149A1 (ja) * | 2011-01-25 | 2012-08-02 | 日本電信電話株式会社 | 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体 |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
KR20130034566A (ko) * | 2011-09-28 | 2013-04-05 | 한국전자통신연구원 | 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치 |
EP2772911B1 (en) | 2011-10-24 | 2017-12-20 | LG Electronics Inc. | Method and device for quantizing voice signals in a band-selective manner |
US11665482B2 (en) | 2011-12-23 | 2023-05-30 | Shenzhen Shokz Co., Ltd. | Bone conduction speaker and compound vibration device thereof |
WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9380320B2 (en) * | 2012-02-10 | 2016-06-28 | Broadcom Corporation | Frequency domain sample adaptive offset (SAO) |
JP5942463B2 (ja) * | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
CN102594701A (zh) * | 2012-03-14 | 2012-07-18 | 中兴通讯股份有限公司 | 一种频谱重构的确定方法及系统 |
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US9357215B2 (en) * | 2013-02-12 | 2016-05-31 | Michael Boden | Audio output distribution |
US9530430B2 (en) * | 2013-02-22 | 2016-12-27 | Mitsubishi Electric Corporation | Voice emphasis device |
US10275128B2 (en) | 2013-03-15 | 2019-04-30 | Activevideo Networks, Inc. | Multiple-mode system and method for providing user selectable video content |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
US10078669B2 (en) | 2013-05-30 | 2018-09-18 | Nec Corporation | Data compression system |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
EP3005712A1 (en) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Overlay rendering of user interface onto source video |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
EP4407609A3 (en) * | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
US9293143B2 (en) * | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
CN104811584B (zh) * | 2014-01-29 | 2018-03-27 | 晨星半导体股份有限公司 | 影像处理电路与方法 |
US9594580B2 (en) | 2014-04-09 | 2017-03-14 | Bitspray Corporation | Secure storage and accelerated transmission of information over communication networks |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
CN104021792B (zh) * | 2014-06-10 | 2016-10-26 | 中国电子科技集团公司第三十研究所 | 一种语音丢包隐藏方法及其系统 |
CN107112024B (zh) * | 2014-10-24 | 2020-07-14 | 杜比国际公司 | 音频信号的编码和解码 |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN106033982B (zh) * | 2015-03-13 | 2018-10-12 | 中国移动通信集团公司 | 一种实现超宽带语音互通的方法、装置和终端 |
EP3107096A1 (en) * | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
GB2545434B (en) * | 2015-12-15 | 2020-01-08 | Sonic Data Ltd | Improved method, apparatus and system for embedding data within a data stream |
US11048823B2 (en) | 2016-03-09 | 2021-06-29 | Bitspray Corporation | Secure file sharing over multiple security domains and dispersed communication networks |
CN108089782B (zh) * | 2016-11-21 | 2021-02-26 | 佳能株式会社 | 用于对相关用户界面对象的改变进行建议的方法和装置 |
CN107135443B (zh) * | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
JP7137694B2 (ja) | 2018-09-12 | 2022-09-14 | シェンチェン ショックス カンパニー リミテッド | 複数の音響電気変換器を有する信号処理装置 |
CN110111800B (zh) * | 2019-04-04 | 2021-05-07 | 深圳信息职业技术学院 | 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备 |
JP7311319B2 (ja) * | 2019-06-19 | 2023-07-19 | ファナック株式会社 | 時系列データ表示装置 |
TWI762908B (zh) * | 2020-04-17 | 2022-05-01 | 新唐科技股份有限公司 | 串接式擴增裝置及包含其之串接式系統 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3967067A (en) * | 1941-09-24 | 1976-06-29 | Bell Telephone Laboratories, Incorporated | Secret telephony |
CH497089A (de) * | 1968-07-26 | 1970-09-30 | Autophon Ag | Anlage zur Übermittlung von kontinuierlichen Signalen |
US3566035A (en) * | 1969-07-17 | 1971-02-23 | Bell Telephone Labor Inc | Real time cepstrum analyzer |
US3659051A (en) * | 1971-01-29 | 1972-04-25 | Meguer V Kalfaian | Complex wave analyzing system |
US3919481A (en) * | 1975-01-03 | 1975-11-11 | Meguer V Kalfaian | Phonetic sound recognizer |
US4039754A (en) * | 1975-04-09 | 1977-08-02 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Speech analyzer |
US4058676A (en) * | 1975-07-07 | 1977-11-15 | International Communication Sciences | Speech analysis and synthesis system |
US4158751A (en) * | 1978-02-06 | 1979-06-19 | Bode Harald E W | Analog speech encoder and decoder |
US4424415A (en) * | 1981-08-03 | 1984-01-03 | Texas Instruments Incorporated | Formant tracker |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
JPH0761044B2 (ja) | 1986-07-28 | 1995-06-28 | 日本電信電話株式会社 | 音声符号化法 |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5479562A (en) * | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
FR2690551B1 (fr) * | 1991-10-15 | 1994-06-03 | Thomson Csf | Procede de quantification d'un filtre predicteur pour vocodeur a tres faible debit. |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
US5546477A (en) * | 1993-03-30 | 1996-08-13 | Klics, Inc. | Data compression and decompression |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
US5890110A (en) * | 1995-03-27 | 1999-03-30 | The Regents Of The University Of California | Variable dimension vector quantization |
US5867819A (en) * | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
EP0880235A1 (en) * | 1996-02-08 | 1998-11-25 | Matsushita Electric Industrial Co., Ltd. | Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3344944B2 (ja) | 1997-05-15 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
JP3318825B2 (ja) * | 1996-08-20 | 2002-08-26 | ソニー株式会社 | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 |
US6356639B1 (en) * | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
JPH10340099A (ja) | 1997-04-11 | 1998-12-22 | Matsushita Electric Ind Co Ltd | オーディオデコーダ装置及び信号処理装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
JP3813025B2 (ja) | 1998-10-29 | 2006-08-23 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP4409733B2 (ja) | 1999-09-07 | 2010-02-03 | パナソニック株式会社 | 符号化装置、符号化方法、及びその記録媒体 |
US6678653B1 (en) * | 1999-09-07 | 2004-01-13 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for coding audio data at high speed using precision information |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
JP2001154698A (ja) | 1999-11-29 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
JP3510168B2 (ja) | 1999-12-09 | 2004-03-22 | 日本電信電話株式会社 | 音声符号化方法及び音声復号化方法 |
JP2001188563A (ja) | 2000-01-05 | 2001-07-10 | Matsushita Electric Ind Co Ltd | オーディオ符号化のための効果的なセクション化法 |
JP3597750B2 (ja) | 2000-04-11 | 2004-12-08 | 松下電器産業株式会社 | グループ化方法及びグループ化装置 |
-
2002
- 2002-10-30 DE DE60208426T patent/DE60208426T2/de not_active Expired - Lifetime
- 2002-10-30 WO PCT/JP2002/011256 patent/WO2003038813A1/en active IP Right Grant
- 2002-10-30 WO PCT/JP2002/011254 patent/WO2003038812A1/en active IP Right Grant
- 2002-10-30 EP EP02775413A patent/EP1440433B1/en not_active Expired - Lifetime
- 2002-10-30 CN CN02809440.9A patent/CN1288622C/zh not_active Expired - Fee Related
- 2002-10-30 WO PCT/JP2002/011255 patent/WO2003038389A1/en active IP Right Grant
- 2002-10-30 EP EP02775411A patent/EP1440432B1/en not_active Expired - Lifetime
- 2002-10-30 CN CNB02803421XA patent/CN1324558C/zh not_active Expired - Fee Related
- 2002-10-30 CN CN02803419.8A patent/CN1209744C/zh not_active Expired - Fee Related
- 2002-10-30 DE DE60204039T patent/DE60204039T2/de not_active Expired - Lifetime
- 2002-10-30 DE DE60204038T patent/DE60204038T2/de not_active Expired - Lifetime
- 2002-10-30 EP EP02775412A patent/EP1440300B1/en not_active Expired - Lifetime
- 2002-11-01 US US10/285,633 patent/US7328160B2/en active Active
- 2002-11-01 US US10/285,609 patent/US7283967B2/en active Active
- 2002-11-01 US US10/285,627 patent/US7392176B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2003038813A1 (en) | 2003-05-08 |
WO2003038389A1 (en) | 2003-05-08 |
CN1507618A (zh) | 2004-06-23 |
EP1440433B1 (en) | 2005-05-04 |
DE60204038D1 (de) | 2005-06-09 |
US7392176B2 (en) | 2008-06-24 |
EP1440300B1 (en) | 2005-12-28 |
CN1484822A (zh) | 2004-03-24 |
EP1440433A1 (en) | 2004-07-28 |
DE60204039D1 (de) | 2005-06-09 |
CN1324558C (zh) | 2007-07-04 |
DE60204038T2 (de) | 2006-01-19 |
US20030088328A1 (en) | 2003-05-08 |
EP1440432A1 (en) | 2004-07-28 |
US7283967B2 (en) | 2007-10-16 |
DE60208426T2 (de) | 2006-08-24 |
US7328160B2 (en) | 2008-02-05 |
WO2003038812A1 (en) | 2003-05-08 |
US20030088400A1 (en) | 2003-05-08 |
EP1440300A1 (en) | 2004-07-28 |
CN1209744C (zh) | 2005-07-06 |
EP1440432B1 (en) | 2005-05-04 |
CN1484756A (zh) | 2004-03-24 |
DE60208426D1 (de) | 2006-02-02 |
US20030088423A1 (en) | 2003-05-08 |
DE60204039T2 (de) | 2006-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1288622C (zh) | 编码设备和解码设备 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1288625C (zh) | 音频编码与解码设备及其方法 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1126265C (zh) | 可伸缩的立体声音频编码/解码方法和装置 | |
CN1146203C (zh) | 用于音频编码的动态位分配装置和方法 | |
CN1200403C (zh) | 线性预测编码参数的矢量量化装置 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1969317A (zh) | 基于多个参数化的多声道重构 | |
CN1748443A (zh) | 多声道音频扩展支持 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1185620C (zh) | 声音合成装置和方法以及电话装置 | |
CN1702974A (zh) | 用于对数字信号编码/解码的方法和设备 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1910655A (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
CN1151491C (zh) | 音频编码装置和音频编码译码装置 | |
CN1496007A (zh) | 音频译码装置 | |
CN1750406A (zh) | 用于从音频数据码流中解码重建多声道音频信号的解码器 | |
CN1291375C (zh) | 声信号编码方法和设备、解码方法和设备 | |
CN1435817A (zh) | 语音编码转换方法和装置 | |
CN1122256C (zh) | 用前向和反向线性预测编码分析编码音频信号的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20061206 Termination date: 20121030 |