CN1878001B - 对音频数据编码及解码的设备及方法 - Google Patents
对音频数据编码及解码的设备及方法 Download PDFInfo
- Publication number
- CN1878001B CN1878001B CN2006100721782A CN200610072178A CN1878001B CN 1878001 B CN1878001 B CN 1878001B CN 2006100721782 A CN2006100721782 A CN 2006100721782A CN 200610072178 A CN200610072178 A CN 200610072178A CN 1878001 B CN1878001 B CN 1878001B
- Authority
- CN
- China
- Prior art keywords
- voice data
- coding
- data
- decoding
- sbr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Abstract
本发明提供一种对音频数据编码和解码的设备及方法。根据本发明的一方面,提供一种音频数据解码设备,包括:比特流分析单元,从给定的比特流中提取编码的SBR数据和对应于至少一个层的编码的音频数据,所述层以预定数量的比特表示;可分级解码单元,通过早于较高层对较低层解码和早于每一层的低位比特对高位比特解码来对音频数据解码;SBR解码单元,对编码的SBR数据解码,推断第一和第二频率之间的频带中的音频数据;以及数据合成单元,产生并输出合成数据作为零频率和第二频率之间的频带中的音频数据;其中第二预定频率等于或大于至少一个层的最大频率,所述SBR数据包括关于第一及第二频率之间的频带中的音频数据的信息。
Description
技术领域
本发明涉及音频数据的处理,更具体的说,涉及到一种编码音频数据的设备及方法以及一种解码编码的音频数据的设备及方法,其中编码的音频数据的比特率能够被调整,以及即使当包括在将被解码的比特流中的音频数据是编码的音频数据的某些层的编码的音频数据时,所有这些层的音频数据都能够被恢复。
背景技术
由本发明的申请人提出的比特分片算术编码(BSAC),是一种提供FGS(精细度可分级)的编码技术。此外,BSAC是被移动图像专家组(MPEG)-4采用作为标准的音频压缩技术。在第261253号韩国专利申请中详细描述了BSAC。和BSAC不同,高级音频编码(AAC)技术没有提供FGS。
当使用AAC的编码器对音频数据编码时,它只能对该音频数据的某些频带中的音频数据编码,并将编码的音频数据发送到解码器。
在这种情况下,可以考虑使用频带复制(SBR)技术从只有某些频带被使用AAC编码的音频数据来恢复所有频带中的音频数据。换句话说,使用AAC的编码器产生及编码SBR数据并将该SBR数据与所述某些频带中的编码的音频数据一起发送到解码器,所述SBR数据具有关于所述某些频带之外的频带中的音频数据的信息。解码器通过推断所述某些编码的频带之外的频带中的音频数据,能够恢复原始音频数据。结果,AAC和SBR能够被组合到一起。
同时,当使用BSAC的编码器编码音频数据时,和使用AAC的编码器相比,使用BSAC的编码器通过根据频带划分音频数据产生一个基层和至少一个增强层,编码该音频数据的所有层,以及只将包括基层的某些编码的层的音频数据发送到解码器。这里,因为所述某些层是可变化的,所以能够调整使用BSAC编码的音频数据的比特率。
与AAC技术容易和SBR技术组合到一起相反,BSAC和SBR不能很好 的组合。即,将被发送到解码器的某些编码的的音频数据层可能根据情况变化,所以应该为所有可能的情况产生不同的SBR数据。
这样就需要如下一种方案:无论将被发送到解码器的音频数据的某些层是那些层,都能够使用相同的SBR数据恢复具有多个层的编码的音频数据。
发明内容
本发明提供一种音频数据编码设备,用于产生由编码的频带复制(SBR)数据和编码的音频数据组成的比特流,其中,因为该音频数据被划分为多个层,所以能够调整所述编码的音频数据的比特率。
本发明还提供一种音频数据解码设备,对包括在将被解码的比特流中的音频数据解码以恢复与包括在该比特流中的音频数据的频带相同的频带中的音频数据,并对包括在该比特流中的SBR数据解码以恢复频率大于包括在该比特流中的音频数据的最大频率的频带中的音频数据,其中的SBR数据无论包括在该比特流中的多个音频数据层为何,都是相同的。
本发明提供一种音频数据编码方法,用于产生由编码的频带复制(SBR)数据和编码的音频数据组成的比特流,其中,因为该音频数据被划分成多个层,所以能够调整所述编码的音频数据的比特率。
本发明还提供一种音频数据解码方法,用于对包括在将被解码的比特流中的音频数据解码以恢复与包括在该比特流中的音频数据的频带相同的频带中的音频数据,并对包括在该比特流中的SBR数据解码以恢复频率大于包括在该比特流中的音频数据的最大频率的频带中的音频数据,其中的SBR数据无论包括在该比特流中的音频数据的层为何,都是相同的。
本发明还提供一种计算机可读的记录介质,该记录介质能够存储用于产生由编码的频带复制(SBR)数据和编码的音频数据组成的比特流的计算机程序,其中,因为该音频数据被划分成多个层,所以能够调整所述编码的音频数据的比特率。
本发明还提供一种计算机可读的记录介质,该记录介质能够存储计算机程序,该计算机程序用于解码包括在将被解码的比特流中的音频数据以便恢复和包括在该比特流中的音频数据的频带相同的频带中的音频数据,并解码包括在该比特流中的SBR数据以便恢复频率大于包括在该比特流中的音频数据的最大频率的频带中的音频数据,其中的SBR数据无论包括在该比特流中 的音频数据的层为何,都是相同的。
根据本发明的一方面,提供一种音频数据编码设备,包括:可分级编码单元,用于将音频数据划分成多个层,以每一层预定数量的比特表示该音频数据,以及早于较高层对较低层编码并早于每一层的低位对高位比特编码;SBR编码单元,用于产生具有关于将被编码的音频数据中频率等于或大于预定频率的频带中的音频数据的信息的SBR(编码频带复制)数据,以及对该SBR数据编码;以及比特流产生单元,用于利用编码的SBR数据和对应于预定比特率的编码的音频数据产生比特流,其中,所述编码的音频数据是由可分级编码单元编码的,所述预定比特率表示包括在所有编码的层中的音频数据之中发送的至少一个编码的层的音频数据的比特率。
所述预定频率可为所述音频数据的所述多个层的最低层的最大频率。
所述SBR编码单元可使用关于具有等于或大于预定频率的频率的频带的音频数据的包络的信息产生SBR数据,并对所产生的SBR数据执行无损编码。
所述无损编码可是熵编码或Huffman编码。
所述可分级编码单元可对所述音频数据下采样并划分下采样的音频数据以产生多个层。
所述预定比特率可等于或大于所述最低层的比特率。
所述SBR编码单元还可包括第一开始代码编码单元,所述第一开始代码编码单元对指示所述SBR数据的开始的第一开始代码编码。
所述第一开始代码可包括:以32比特0表示的零代码;以“1111 0000”表示的扩展代码。
所述SBR编码单元还可包括第二开始代码编码单元,其对指示用于检测来自SBR数据的误码的检错数据及SBR数据的开始的第二开始代码编码。
所述第二开始代码可包括:以32比特0表示的零代码;以及以“11110001”表示的扩展代码。
可经第一信道到第M信道的每一信道发送音频数据,其中,M表示等于或大于3的整数;所述可分级编码单元还可包括单声/立体声编码单元以用于对第一和第二信道中的一个信道的音频数据编码和多信道扩展数据编码单元以用于对第三到第M信道中的一个信道的音频数据编码。
所述多信道扩展数据编码单元还可包括第三开始代码编码单元,所述第 三开始代码编码单元对指示第三到第M信道的音频数据的开始的第三开始代码编码。
所述第三开始代码可包括以32比特0表示的零代码;以及以8比特1表示的扩展代码。
根据本发明的另一方面,提供一种音频数据解码设备,包括:比特流分析单元,用于从给定的比特流中提取对应于至少一个层的编码的SBR数据及编码的音频数据,该层用预定数量的比特表示;可分级解码单元,通过早于较高层对较低层解码并早于每一层的低位比特对高位比特解码来对编码的音频数据解码;SBR解码单元,用于对编码的SBR数据解码,并基于编码的音频数据和编码的SBR数据来推断第一频率和第二频率之间的频带中的音频数据;以及数据合成单元,用于通过使用编码的音频数据及推断的音频数据产生合成数据,并将该合成数据输出作为0频率和第二频率之间的频带中的音频数据,其中,第二预定频率等于或大于至少一个层的最大频率,SBR数据包含关于第一和第二频率之间的频带中的音频数据的信息。
解码的音频数据存在的频带中的合成数据可以是解码的音频数据,解码的音频数据不存在的频带中的合成数据可以是推断的音频数据。
所述关于音频数据的信息可包括关于音频数据的包络的信息;所述SBR解码单元还可包括:无损解码单元,可用于对编码的SBR数据执行无损解码并获得关于所述包络的信息;高频产生单元,可用于在等于或大于解码的音频数据的最大频率的频率的频带中使解码的音频数据产生;和包络调整单元,可用于基于获得的信息来调整产生的音频数据的包络。所述数据合成单元可输出解码的音频数据作为解码的音频数据所在的频带的合成数据,并可输出包络调整的音频数据作为仅存在于包络调整的音频数据的频带的合成数据。
所述无损解码可以是熵解码或Huffman解码。
对编码的音频数据的解码可按照预定比特率被执行或者可按照比所述预定比特率低的比特率被执行,所述预定比特率可等于或大于最低层的比特率。
第一频率可以是最低层的最大频率。
所述比特流分析单元可检查在比特流中是否存在编码的第一开始代码;所述音频数据解码设备还可包括第一开始代码解码单元,用于对编码的第一开始代码解码;如果在比特流中存在编码的第一开始代码,则比特流分析单元可从所述比特流提取编码的第一开始代码,并且响应于检查的结果运行 SBR解码单元;以及所述第一开始代码可指示SBR数据的开始。
所述比特流分析单元可检查在比特流中是否存在编码的第二开始代码;所述音频数据解码设备还可包括第二开始代码解码单元,用于对编码的第二开始代码解码;如果在比特流中存在编码的第二开始代码,则比特流分析单元可从所述比特流提取编码的第二开始代码,并且响应于检查的结果运行SBR解码单元;以及所述第二开始代码可指示从SBR数据中检测误码时使用的检错数据和SBR数据的开始。
可经第一信道到第M(其中,M表示等于或大于3的整数)信道的每一信道发送编码的音频数据;所述可分级解码单元还可包括:单声/立体声解码单元用于对第一信道和第二信道之一的编码的音频数据解码和多信道扩展数据解码单元用于对第三至第M信道之一的编码的音频数据解码。
所述比特流分析单元可检查在比特流中是否存在编码的第三开始代码;所述可分级解码单元还可包括第三开始代码解码单元,用于对编码的第三开始代码解码;如果在比特流中存在编码的第三开始代码,则比特流分析单元可从该比特流提取编码的第三开始代码,并且响应于检查的结果来运行多信道扩展数据解码单元;以及所述第三开始代码可指示从第三至第M信道的音频数据的开始。
根据本发明的一个方面,提供一种音频数据编码方法,包括:(a)将音频数据划分成多个层,以预定数量的比特表示该音频数据的多个层,以及早于较高层对较低层编码并早于每一层的低位比特对高位比特编码;(b)产生并编码SBR数据,该SBR数据具有关于将被编码的音频数据中的等于或大于预定频率的频率的频带中的音频数据的信息;以及(c)使用编码的SBR数据和对应于预定比特率的编码的音频数据产生比特流,其中,所述编码的音频数据是在(a)中编码的,所述预定比特率表示包括在所有编码的层中的音频数据之中发送的至少一个层的音频数据的比特率。
所述的音频数据编码方法的步骤(b)还可包括:使用关于具有频率等于或大于预定频率的频带中的音频数据的包络的信息来产生SBR数据,并可对产生的SBR数据执行无损编码。
所述的音频数据编码方法的步骤(a)还可包括对音频数据下采样并划分下采样的音频数据以产生多个层。
可经第一到第M(M表示等于或大于3的整数)信道的每一个发送音频 数据;以及所述的音频数据编码方法的步骤(a)还可包括:对第一和第二信道中的一个的音频数据编码;以及对第三到第M信道中的一个的音频数据编码。
根据本发明的另一方面,提供一种音频数据解码方法,包括;(a)从给定的比特流中提取对应于至少一个层的编码的SBR数据和编码的音频数据,其中的层用预定数量的比特来表示;(b)通过早于较高层对较低层解码并早于每一层的低位比特对高位比特解码来对编码的音频数据解码;(c)对编码的SBR数据解码,并基于解码的音频数据和解码的SBR数据来推断第一频率和第二频率之间的频带中的音频数据;以及(d)通过使用编码的音频数据及推断的音频数据产生合成数据,并确认该合成数据为0频率和第二频率之间的频带中的音频数据,其中,第二预定频率等于或大于至少一个层的最大频率,SBR数据包含关于第一和第二频率之间的频带中的音频数据的信息。
所述关于音频数据的信息可包括关于音频数据的包络的信息;所述的音频数据解码码方法的步骤(c)还可包括:无损解码单元对编码的SBR数据执行无损解码并获得关于包络的信息;高频产生单元在等于或大于解码的音频数据的最大频率的频率的频带中使解码的音频数据产生;和包络调整单元基于获得的信息调整产生的音频数据的包络;所述的音频数据解码码方法的步骤(d)还可包括:确定解码的音频数据为用于解码的音频数据存在的频带的合成数据,并确定包络被调整的音频数据为用于包络被调整的音频数据存在的频带的合成数据。
所述音频数据解码方法可以预定的比特率或低于预定的比特率的比特率执行对编码的音频数据的解码,所述预定的比特率可等于或大于最低层的比特率。
所述音频数据解码方法中可经第一到第M(M表示等于或大于3的整数)信道的每一个发送编码的音频数据;以及所述音频数据解码方法的步骤(b)还可包括:对第一和第二信道中的一个的编码的音频数据解码;以及对第三到第M信道中的一个的编码的音频数据解码。
根据本发明一个方面,提供一种计算机可读的记录介质,该记录介质能够存储执行如下方法的计算机程序,该方法包括:(a)将音频数据划分成多个层,以预定的比特数表示该音频数据的多个层,以及编码早于较高层的较低层和每一层的早于低位的高位;(b)产生并编码SBR数据,该SBR数据具有 关于将被编码的音频数据中的等于或大于预定频率的频率的频带中的音频数据的信息;以及(c)使用编码的SBR数据和对应于预定比特率的编码的音频数据产生比特流。
根据本发明另一方面,提供一种计算机可读的记录介质,该记录介质能够存储执行如下方法的计算机程序,该方法包括:(a)从给定的比特流中提取对应于至少一个层的编码的SBR数据和编码的音频数据,其中的层用预定的比特数来表示;(b)通过解码早于较高层的较低层以及每一层的早于低位的高位来解码编码的音频数据;(c)解码编码的SBR数据,并基于编码的音频数据和编码的SBR数据来推断第一频率和第二频率之间的频带中的音频数据;以及(d)通过使用编码的音频数据及所推断的音频数据产生合成数据,并将该合成数据确认位0频率和第二频率之间的频带中的音频数据,其中的第二预定频率等于或大于至少一个层的最大频率,以及SBR数据包含关于第一和第二频率之间的频带中的音频数据的信息。
附图说明
通过下面结合附图对示例性实施例进行的描述,本发明的以上和其他特征和优点将会变得更加清楚,其中:
图1是根据本发明实施例的音频数据编码设备的框图;
图2是用于解释作为图1中音频数据的实施例的音频数据200的曲线图,该音频数据200包括基层和至少一个增强层;
图3是根据本发明实施例的用以比较频带复制数据和发送到音频数据解码设备的某些层的频带的参考示图;
图4示出了由图1中的音频数据编码设备产生的比特流的实施例的结构;
图5是可分级编码单元110A的框图,该可分级编码单元110为图1中所示出的可分级编码单元110的实施例;
图6示出了由图1中的音频数据编码设备所编码的数据的句法;
图7示出了由图1中的音频数据编码设备所产生的SBR数据的句法;
图8是根据本发明实施例的音频数据解码设备的框图;
图9A到9D是用于参考以解释由图1中的音频数据解码设备产生合成数据的原理的曲线图;
图10是作为图8中所示可分级解码单元820的实施例的可分级解码单元 820A的框图;
图11是作为图8中所示SBR解码单元830的实施例的SBR解码单元830A;
图12作为是图8中所示数据合成单元840的实施例的数据合成单元840A的框图;
图13是示出了根据本发明实施例的音频数据编码方法的流程图;
图14是示出了根据本发明实施例的音频数据解码方法的流程图;
图15是示出了作为图14中示出的操作1430的实施例的操作1430A的流程图。
具体实施方式
参照用于示出本发明优选实施例的附图是为了充分的理解本发明、本发明的优点、以及通过实施本发明而达到的目的。
以下,将参照附图对本发明的优选实施例进行描述。在附图中,相同的标号表示相同的部件。
图1是根据本发明实施例的音频数据编码设备的框图,该设备包括:可分级编码单元110,频带复制(SBR)编码单元120,以及比特流产生单元130。下面将参照图2到图4描述图1中的音频数据编码设备的操作。
可分级编码单元110通过将通过输入端口INI接收到的音频数据划分成多个层来对所接收到的音频数据编码,以预定数量的比特数来表示这些层,早于较高层对较低层编码。当一个层被编码时,早于其高位对低位编码。
更具体的说,可分级编码单元110将时域内的音频数据转换位频域内的音频数据。例如,该可分级编码单元110可以使用改良离散余弦变换(MDCT)来执行所述转换。
然后,可分级编码单元110将该频域音频数据划分成多个层。根据频带来划分这些层。图2是用于参照以解释作为图1中的音频数据的实施例的音频数据200的曲线图。该音频数据200包括基层210-0以及多个增强层210-1,210-2,...,以及210-N-1。如图2中所示,这些层210-0,210-1,210-2,...,以及210-N-1是N(其中的N表示等于或大于2的整数)层。增强层210-1,210-2,...,以及210-N-1分别被称作第一,第二,...,以及第(N-1)增强层。该音频数据200的频带为0到fN[kHz]。附图标记205表示由音频数据200表 示的包络。因此,最低层是基层210-0,最高层是第(N-1)增强层210-N-1。
该可分级编码单元110将所划分的音频数据量化。在图2的实施例中,可分级编码单元110将由多个点所表示的所划分的音频数据200量化。
可分级编码单元110以预定数量的比特表示量化的划分的音频数据。根据层的类型,可分配不同数量的比特。
可分级编码单元110以分级方式对量化的音频数据编码。例如,可分级编码单元110可使用比特分片算术编码(BSAC)来对量化的音频数据编码。
发送给根据本发明实施例的音频数据解码设备的音频数据可以是全部音频数据,即所有层的音频数据,或者可以是部分音频数据,即某些层的音频数据。这里,发送给音频数据解码设备的所述某些层表示包括基层210-0的至少一个层。这样,当音频数据的某些层被发送给音频数据解码设备时,希望与所述某些层对应的音频数据早于与其他剩余层对应的音频数据被编码。
为了实现这一点,可分级编码单元110以这样的方式对量化的音频数据编码,即较低层早于较高层被编码,并且每一层的高位比特早于其低位比特被编码。因此,可分级编码单元110最先对最低层210-0的音频数据编码,最后对最高层210-N-1的音频数据编码。另外,当可分级编码单元110对每一层的音频数据编码时,其最先对音频数据之中的至少一个最高有效位(MSB)编码,并且最后对至少一个最低有效位(LSB)编码。这种编码顺序是基于这样的事实,即:包括在音频数据中的重要信息通常更多地分布于较低层而非较高层中,并且更多地分布于每一层的高位比特而非其低位比特中。
以这种方式,可分级编码单元110对音频数据的所有层编码。
SBR编码单元120产生SBR数据并对其编码。根据本发明的SBR数据表示包括关于第一频率和第二频率之间的频带中的音频数据的信息的数据。所述第一频率可以是等于或大于基层210-0的最大频率f1的频率。所述第一频率最好是最大频率f1。优选地,所述第二频率可以是等于或大于发送给音频数据解码设备的某些层之中的最高层的最大频率fk的频率,更优选地,所述第二频率可以是编码的所有层的音频数据的最大频率fN。图3是将SBR数据的频带f1-fN与发送给根据本发明实施例的音频数据解码设备的某些层的频带0-fk进行比较的参考示图。在图3中,k表示2和N之间的整数。然而,当仅仅基层210-0被发送给音频数据解码设备时,k是1。
关于音频数据的信息可表示关于音频数据的噪声的信息或者关于音频数 据的包络205的信息。
更具体地讲,SBR编码单元120可使用关于第一频率和第二频率之间的频带中的音频数据的包络205的信息来产生SBR数据,并对产生的SBR数据执行无损编码。这里,无损编码是熵编码或Huffman编码。
比特流产生单元130使用Huffman编码的SBR数据和编码的所有层的音频数据之中与预定比特率对应的音频数据来产生比特流,并经输出端口OUT1输出该比特流。图4表示比特流410的结构,所述比特流410是由图1的音频数据编码设备产生的比特流的实施例。如图4中所示,比特流410包括:头420、关于表示基层210-0的编码的音频数据的比特的数量的信息430-0、关于基层210-0的编码的音频数据和对基层210-0的量化的步长的信息440-0、信息430-n、信息440-n和SBR数据450。信息430-n指示表示第n增强层210-n(其中,n是满足1≤n≤N-1的整数)的音频数据的比特的数量。信息440-n指示第n增强层210-n的编码的音频数据和对第n增强层210-n的量化的步长。如图4中所示,比特流410的编码的音频数据430-0、430-1、...和430-N-1被分配给各个层210-0、210-1、...210-N-1。然而,包括在比特流410中的编码的SBR数据450未被分配给任一层。
所述预定比特率表示包括在所有编码的层中的音频数据之中发送给音频数据解码设备的某些层的音频数据的比特率。换句话说,所述预定比特率等于或大于基层210-0的比特率。
图5是可分级编码单元110A的方框图,所述可分级编码单元110A是图1中示出的可分级编码单元110的实施例。可分级编码单元110A包括:时间/频率映射单元510、心理声学单元520、量化单元530和下采样单元540。
时间/频率映射单元510将经输入端口IN2接收的时域中的音频数据转换成频域中的音频数据。输入端口IN2可以与输入端口IN1相同。所述时域中的音频数据的频率是预定采样频率Fs。另外,所述时域中的音频数据是离散音频数据。
心理声学单元520根据频带将由时间/频率映射单元510输出的音频数据分组,以便产生多个层。
量化单元530将每一层的音频数据量化,并以这样的方式对量化的所有层的音频数据编码,即较低层先于较高层被编码,并且每一层的高位比特先于其低位比特被编码。量化单元530经输出端口OUT2将编码结果输出给比 特流产生单元130。
下采样单元540是可选的。下采样单元540以低于预定采样频率Fs的采样频率即Fs/2对时域中的音频数据采样,并将采样结果输出给时间/频率映射单元510和心理声学单元520。
图6表示由图1的音频数据编码设备编码的音频数据的句法。标号610表示根据BSAC方法编码的音频数据,标号620表示能够与音频数据610组合的数据。数据620包括:多信道扩展数据EXT_BSAC_CHANNEL 650、频带复制数据EXT_BSAC_SBR_DATA_660和‘检错数据和SBR数据’EXT_BSAC_SBR_DATA_CRE 670。
多信道扩展数据EXT_BSAC_CHANNEL 650表示第三至第M(其中,M表示等于或大于3的整数)信道的音频数据。当发送给图1的音频数据编码设备的音频数据是经3个或更多信道发送的音频数据时,则所述第三至第M信道表示除单声信道(即第一信道)和立体声信道(即第一信道和第二信道)之外的信道。这样,如果经三个或更多信道发送音频数据,则可分级编码单元110可包括单声/立体声编码单元(未显示)和多信道扩展数据编码单元(未显示)。所述单声/立体声编码单元对第一信道或第二信道的音频数据编码。所述多信道扩展数据编码单元对第三至第M信道中的每个信道的音频数据编码。所述检错数据表示当从频带复制数据EXT_BSAC_SBR_DATA 660中检测错误时使用的数据。而且,EXT_BSAC_SBR_DATA_CRE 670表示检错数据和SBR数据。
由音频数据编码设备编码的音频数据除音频数据610和可组合的数据620之外还可包括:开始代码630和640,用于指示可组合的数据620的开始。开始代码630和640可以是第一开始代码、第二开始代码和第三开始代码之一。
所述第一开始代码指示SBR数据EXT_BSAC_SBR_DATA 660的开始。更具体地讲,第一开始代码可包括以32比特的0表示的零代码zero_code 630和以‘1111 0000’表示的扩展代码extension_type 640。SBR编码单元可包括:第一开始代码编码单元(未显示),用于对第一开始代码编码。
所述第二开始代码指示检错数据和SBR数据EXT_BSAC_SBR_DATA_CRE 670的开始。更具体地讲,第二开始代码可包括以32比特的0表示的零代码zero_code 630和以‘1111 0001’表示的扩展 代码extension_type 640。SBR编码单元可包括:第二开始代码编码单元(未显示),用于对第二开始代码编码。
所述第三开始代码指示第三至第M信道的音频数据的开始。更具体地讲,第三开始代码可包括以32比特的0表示的零代码zero_code 630和以‘11111111’表示的扩展代码extension_type 640。多信道扩展数据编码单元可包括:第三开始代码编码单元(未显示),用于对第三开始代码编码。
图7表示由图1的音频数据编码设备产生的SBR数据的句法。将要由图1的音频数据编码设备编码的音频数据可通过第一信道或第二信道发送。数据bsac_sbr_data(nch,bs_amp_res)710指示:SBR编码单元120对每个信道的SBR数据编码。
图8是根据本发明实施例的音频数据解码设备的方框图,该设备包括:比特流分析单元810、可分级解码单元820、SBR解码单元830和数据合成单元840。
比特流分析单元810从经输入端口IN3接收的比特流提取‘编码的SBR数据’和‘编码的具有至少一个层的音频数据’,所述每一个层以预定数量的比特来表示。所述比特流可以是经输出端口OUT1输出的比特流。换句话说,比特流分析单元810从经输入端口IN3接收的比特流提取‘由SBR编码单元120产生的SBR数据’和‘由可分级编码单元110产生的所有层的全部音频数据之中与至少一个层对应的音频数据’。
可分级解码单元820通过早于较高层音频数据对较低层音频数据进行解码并且早于每一个层的低位比特对其高位比特进行解码来对提取的音频数据解码。可分级解码单元820对提取的音频数据的解码可以按照所述预定比特率来执行或者按照比所述预定比特率低的比特率来执行。例如,当由可分级编码单元110编码的音频数据之中包括在由比特流产生单元130产生的比特流中的音频数据是基层210-0以及第一增强层210-1和第二增强层210-2的音频数据时,可分级解码单元820可对基层210-0以及第一增强层210-1和第二增强层210-2的所有音频数据解码,或者仅对基层210-0和第一增强层210-1的音频数据解码,或者仅对基层210-0的音频数据解码。所述预定比特率可以等于或大于基层210-0的比特率。
在对于第一至第M信道的每一个信道的编码的数据被包括在接收的比特流中的情况下,可分级解码单元820可包括单声/立体声解码单元(未显示)、 多信道扩展数据解码单元(未显示)和第三开始代码解码单元(未显示)。所述单声/立体声解码单元对编码的第一信道或第二信道的音频数据解码。多信道扩展数据解码单元对第三到第M信道的每一个信道的编码的音频数据解码。第三开始代码解码单元对编码的第三开始代码解码。这样,当可分级解码单元820包括多信道扩展数据解码单元时,比特流分析单元810检查编码的第三开始代码是否被包括在接收的比特流中。当检查到编码的第三开始代码被包括在接收的比特流中时,比特流分析单元810从接收的比特流中提取编码的第三开始代码,第三开始代码解码单元对提取的第三开始代码解码,并指示多信道扩展数据解码单元运行。
SBR解码单元830对提取的SBR数据解码。SBR解码单元830基于从可分级解码单元820接收的音频数据和解码的SBR数据推断在第一和第二频率之间的频带中的音频数据。
音频数据解码设备可包括第一开始代码解码单元(未示出)和第二开始代码解码单元(未示出)。在此情况下,比特流分析单元820检查编码的第一和第二开始代码是否被包括在接收的比特流中。当检查编码的第一和第二开始代码被包括在接收的比特流中时,比特流分析单元810从接收的比特流提取编码的第一和第二开始代码,第一和第二开始代码解码单元分别对提取的第一和第二开始代码解码。其后,第一和第二开始代码解码单元指示SBR解码单元830运行。
数据合成单元840根据从可分级解码单元820接收的音频数据和由SBR解码单元830推断的音频数据来产生合成数据。数据合成单元840还将作为频域中的数据的合成数据转换为时域中的合成数据,并通过输出端口OUT3输出时域中的合成数据作为从0到第二频率范围的频带中的音频数据。换句话说,当由音频数据编码设备编码的整个音频数据的最大频率是第二频率时,虽然包括在比特流中的音频数据仅仅是某些层的音频数据,但数据合成单元840恢复所有层的音频数据。
图9A到9D是参照较详细地解释数据合成单元840的运行的示图。图9A示出输入可分级编码单元110的音频数据910,图9B示出由可分级解码单元820解码的音频数据920,图9C示出由SBR解码单元830推断的音频数据930,图9D示出由数据合成单元840产生的合成数据940,即在零和第二频率之间的频带中的音频数据的重构的结果。
为了便于解释,在图9A到9D中示出音频数据910、920、930和940是连续的数据。然而,实际上,音频数据910、920、930和940是离散数据。
如图9A所示,输入可分级编码单元110的音频数据910存在于从0到f10kHz的频带中。由可分级解码单元820解码的音频数据920存在于从0到f3kHz的频带中。比特流可包括所有层的编码的音频数据或某些层的音频数据。在图9B中,比特流仅包括某些层的音频数据,即仅在从0到f3kHz频带中的音频数据。期望某些层总是包括在从0到f1kHz的频带中的基层。
由SBR解码单元830推断的音频数据930存在于从f1到f10kHz的频带中。由数据合成单元840产生的合成数据940存在于从0到f10kHz的频带中。换句话说,合成数据940是音频数据910的解码的结果。音频数据940和910可在某种程度上不同,但期望彼此相同。
数据合成单元840输出解码的音频数据920作为用于解码的音频数据920存在的频带(即从0到f3kHz)的合成数据。
数据合成单元840输出推断的音频数据930作为用于解码的音频数据920不存在的频带(即从f3到f10kHz)的合成数据。
结果,数据合成单元840确定解码的音频数据920为用于解码的音频数据920和推断的音频数据930两者都存在的频带(即从f1到f3kHz)的合成数据。
图10是作为图8所示的可分级解码单元820的实施例的可分级解码单元820A的框图。可分级解码单元820A包括逆量化单元1010和频率/时间映射单元1020。
逆量化单元1010通过输入端口IN4接收“提取的音频数据”,对接收的音频数据解码,并对解码的音频数据逆量化。频率/时间映射单元1020将在频域中逆量化的音频数据转换为时域中的音频数据,并通过输出端口OUT4输出时域中的音频数据。
图11是作为图8所示的SBR解码单元830的实施例的SBR解码单元830A的框图。SBR解码单元830A包括无损解码单元1110、高频产生单元1120、分析QMF组1130和包络调整单元1140。
无损解码单元1110通过输入端口IN5接收“提取的SBR数据”,并对接收的SBR数据执行无损解码。这里,无损解码是熵解码或Huffman解码。因此,无损解码单元1110从提取的SBR数据中获得关于第一和第二频率之间 的频带中的音频数据的信息。例如,无损解码单元1110获得关于第一和第二频率之间的频带中的音频数据的包络的信息。
高频产生单元1120使解码的音频数据920在等于或大于音频数据920的最大频率f3(见图9B)的频带中(在图9中,f3-f6,f6-f9,以及f9-f10)产生。为了实现在上述频带中产生音频数据920,由于解码的音频数据920是时域中的音频数据,所以高频产生单元1120可将编码的音频数据转换为频域中的音频数据。为了实现这种转换,SBR解码单元830可包括分析QMF组1130作为SBR解码单元830A的分析QMF组1130。
分析QMF组1130将通过输入端口IN6接收的“解码的音频数据”转换为频域中的音频数据,并通过输出端口OUT6输出频域中的音频数据。
包络调整单元1140使用由无损解码单元1110获得的信息调整由高频产生单元1120产生的音频数据的包络。也就是说,包络调整单元1140调整由高频产生单元1120产生的音频数据,从而音频数据的包络与由可分级解码单元110编码的音频数据的包络相同。通过输出端口OUT5输出调整的音频数据。存在于第一和第二频率之间的频带中的输入可分级编码单元110的音频数据被推断作为调整的音频数据。
图12是作为图8所示的数据合成单元840的实施例的数据合成单元840A的框图。数据合成单元840A包括交迭单元1210和合成QMF组1220。
交迭单元1210通过输入端口IN7接收“由可分级解码单元820解码的音频数据920”,通过输入端口IN8接收“由SBR解码单元830推断的音频数据930”,并使用解码的音频数据920和推断的音频数据930产生合成数据。
更具体地说,交迭单元1210输出解码的音频数据920作为用于解码的音频数据920存在的频带(即图9B中的从0到f3kHz)的合成数据。交迭单元1210输出推断的音频数据930作为用于仅推断的音频数据930存在的频带(图9C中的f3到f10kHz)的合成数据。
通过输入端口IN7接收的解码的音频数据920和通过输入端口IN8接收的推断的音频数据930都是频域中的音频数据。因此,如果解码的音频数据是时域中的音频数据,则期望其通过分析QMF组1130被输入到输入端口IN7。
合成QMF组1220将频域中的合成数据转换为时域中的合成数据,并通过输出端口OUT7输出时域中的合成数据。
图13是示出由图1的音频数据编码设备执行的根据本发明实施例的音频数据编码方法的流程图。音频数据编码方法包括操作1310到1330:使用BASC技术对音频数据编码,对SBR数据编码以及使用编码的音频数据和编码的SBR数据产生比特流。
在操作1310,可分级编码单元110将接收的音频数据划分为多个层,以预定数量的比特表示所述多个层,并早于较高层对较低层编码,早于每一层的低位比特对前述每一层的高位比特编码。
在操作1320,SBR编码单元120产生具有关于从第一频率到第二频率范围的频带中的音频数据的信息的SBR数据,并对SBR数据执行Huffman编码。
操作1320可如图13所示在操作1310之后被执行。此外,对比图13,操作1320可先于操作1310或与操作1310同时被执行。
在操作1310和1320之后,在操作1330,比特流产生单元130使用在操作1310编码的音频数据和在操作1320编码的SBR数据来产生比特流。
图14是示出由图8的音频数据解码设备执行的根据本发明实施例的音频数据解码方法的流程图。音频数据解码方法包括操作1410到1440:对包括在将被解码的比特流中的音频数据解码,从而恢复与包括在比特流中的音频数据的频带相同的频带中的音频数据,并对包括在比特流中的SBR数据解码,无论包括在比特流中的音频数据的层如何,SBR数据是相同的,从而恢复等于或大于包括在前述比特流中的音频数据的最大频率的频率的频带中的音频数据。
在操作1410,比特流分析单元810从将被解码的比特流提取在操作1310编码的音频数据和在操作1320编码的SBR数据。
在操作1420,可分级解码单元820通过早于较高层对较低层解码并早于每一层的低位比特对其高位比特解码来对在操作1310编码的音频数据解码。
在操作1430,SBR解码单元830对在操作1320编码的SBR数据解码,并基于在操作1420解码的音频数据和解码的SBR数据推断在第一和第二频率之间的频带中的音频数据。
在操作1440,数据合成单元840从在操作1420解码的音频数据和在操作1430推断的音频数据产生合成数据,并确定合成数据作为0和第二频率之间的频带中的音频信号。
图15是示出作为操作1430的实施例的操作1430A的操作的流程图。操作1430A包括操作1510到1530:基于在操作1420解码的音频数据和在操作1320编码的SBR数据推断第一和第二频率之间的频带中的音频数据。
在操作1510,无损解码单元1110对包括在将被解码的比特流中的编码的SBR数据解码以获得关于从第一频率到第二频率的频带中的音频数据的包络的信息。
在操作1520,高频产生单元1120在等于或大于解码的音频数据的最大频率的频带中使在操作1420解码的音频数据产生。
在操作1530,包络调整单元1140使用在操作1510获得的信息调整在操作1520产生的音频数据的包络。操作1530后面跟随操作1440。
如上所述,在根据本发明的对音频数据编码的设备和方法以及对编码的音频数据解码的设备和方法中,包括在将被解码的比特流中的音频数据被解码,从而恢复与包括在比特流中的频带相同的频带中的音频数据,包括在比特流中的SBR数据被解码,从而恢复等于或大于包括在比特流中的音频数据的最大频率的频率的频带中的音频数据。因此,即使当包括在比特流中音频数据是某些层的编码的音频数据,也能恢复所有层的音频数据。此外,无论包括在比特流中的音频数据的层如何,包括在比特流中的SBR数据都被固定,从而可将BASC和SBR技术容易地结合在一起。
本发明的实施例也可实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后由计算机系统读取的数据的任意数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存储器(RAM)、CD-ROM、磁带、软盘、光数据存储装置以及载波(诸如通过互联网的数据传输)。计算机可读记录介质也可以分布在与计算机系统连接的网络上,从而以分布式的方式存储和执行计算机可读代码。
虽然参照本发明示例性实施例详细示出和描述了本发明,但本领域普通技术人员应理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可对其在形式和细节上作出各种改变。
Claims (40)
1.一种音频数据编码设备,包括:
可分级编码单元,用于将音频数据划分成多个层,以每一层预定数量的比特表示该音频数据,以及早于较高层对较低层编码和早于每一层的低位比特对高位比特编码;
SBR编码单元,用于产生SBR数据,所述SBR数据具有关于将被编码的音频数据间的等于或大于预定频率的频带中的音频数据的信息,并对所述SBR数据编码;
比特流产生单元,用于使用编码的SBR数据及对应于预定比特率的编码的音频数据产生比特流,其中,所述编码的音频数据是由可分级编码单元编码的,所述预定比特率表示包括在所有编码的层中的音频数据之中发送的至少一个编码的层的音频数据的比特率。
2.如权利要求1所述的音频数据编码设备,其中,所述预定频率为所述音频数据的所述多个层的最低层的最大频率。
3.如权利要求1所述的音频数据编码设备,其中,所述SBR编码单元使用关于具有等于或大于预定频率的频率的频带的音频数据的包络的信息产生SBR数据,并对所产生的SBR数据执行无损编码。
4.如权利要求3所述的音频数据编码设备,其中,所述无损编码是熵编码或Huffman编码。
5.如权利要求1所述的音频数据编码设备,其中,所述可分级编码单元对所述音频数据下采样并划分下采样的音频数据以产生多个层。
6.如权利要求1所述的音频数据编码设备,其中,所述预定比特率等于或大于所述最低层的比特率。
7.如权利要求1所述的音频数据编码设备,其中,所述SBR编码单元还包括第一开始代码编码单元,所述第一开始代码编码单元对指示所述SBR数据的开始的第一开始代码编码。
8.如权利要求7所述的音频数据编码设备,其中,所述第一开始代码包括:
以32比特0表示的零代码;以及
以“1111 0000”表示的扩展代码。
9.如权利要求1所述的音频数据编码设备,其中,所述SBR编码单元还包括第二开始代码编码单元,其对指示用于检测来自SBR数据的误码的检错数据及SBR数据的开始的第二开始代码编码。
10.如权利要求9所述的音频数据编码设备,其中,所述第二开始代码包括:
以32比特0表示的零代码;以及
以“1111 0001”表示的扩展代码。
11.如权利要求1所述的音频数据编码设备,其中:
经第一信道到第M信道的每一信道发送音频数据,其中,M表示等于或大于3的整数;以及
所述可分级编码单元包括:
单声/立体声编码单元,用于对第一和第二信道中的一个信道的音频数据编码;
多信道扩展数据编码单元,用于对第三到第M信道中的一个信道的音频数据编码。
12.如权利要求11所述的音频数据编码设备,其中,所述多信道扩展数据编码单元还包括第三开始代码编码单元,所述第三开始代码指示第三到第M信道的音频数据的开始。
13.如权利要求12所述的音频数据编码设备,其中,所述第三开始代码包括:
以32比特0表示的零代码;以及
以8比特1表示的扩展代码。
14.一种音频数据解码设备,包括:
比特流分析单元,用于从给定的比特流提取编码的SBR数据和对应于至少一个层的编码的音频数据,所述层以预定数量的比特表示;
可分级解码单元,通过早于较高层对较低层解码和早于每一层的低位比特对高位比特解码来对编码的音频数据解码;
SBR解码单元,用于对编码的SBR数据解码,并基于解码的音频数据及解码的SBR数据推断第一频率和第二频率之间的频带中的音频数据;以及
数据合成单元,用于通过解码的音频数据和推断的音频数据来产生合成数据并将所述合成数据作为0频率和第二频率之间的频带中的音频数据而输 出;
其中所述第二频率等于或大于所述至少一个层的最大频率,所述SBR数据包括关于第一及第二频率之间的频带中的音频数据的信息。
15.如权利要求14所述的音频数据解码设备,其中,存在于所述解码的音频数据的频带中的合成数据是所述解码的音频数据,不存在于所述解码的音频数据的频带中的合成数据是所述推断的音频数据。
16.如权利要求14所述的音频数据解码设备,其中:
所述关于音频数据的信息包括关于音频数据的包络的信息;
所述SBR解码单元包括:
无损解码单元,用于对编码的SBR数据执行无损解码并获得关于所述包络的信息;
高频产生单元,用于在等于或大于解码的音频数据的最大频率的频率的频带中使解码的音频数据产生;和
包络调整单元,用于基于获得的信息来调整产生的音频数据的包络;和
数据合成单元输出解码的音频数据作为解码的音频数据所在的频带的合成数据,并输出包络调整的音频数据作为仅存在于包络调整的音频数据的频带的合成数据。
17.如权利要求16所述的音频数据解码设备,其中,所述无损解码是熵解码或Huffman解码。
18.如权利要求14所述的音频数据解码设备,其中,对编码的音频数据的解码按照预定比特率被执行或者按照比所述预定比特率低的比特率被执行,所述预定比特率等于或大于最低层的比特率。
19.如权利要求14所述的音频数据解码设备,其中,第一频率是最低层的最大频率。
20.如权利要求14所述的音频数据解码设备,其中:
比特流分析单元检查在比特流中是否存在编码的第一开始代码;
所述音频数据解码设备还包括第一开始代码解码单元,用于对编码的第一开始代码解码;
如果在比特流中存在编码的第一开始代码,则比特流分析单元从所述比特流提取编码的第一开始代码,并且响应于检查的结果运行SBR解码单元; 和
所述第一开始代码指示SBR数据的开始。
21.如权利要求20所述的音频数据解码设备,其中,所述第一开始代码包括:
零代码,以32比特的0来表示;和
扩展代码,以“1111 0000”来表示。
22.如权利要求14所述的音频数据解码设备,其中:
比特流分析单元检查在比特流中是否存在编码的第二开始代码;
所述音频数据解码设备还包括第二开始代码解码单元,用于对编码的第二开始代码解码;
如果在比特流中存在编码的第二开始代码,则比特流分析单元从所述比特流提取编码的第二开始代码,并且响应于检查的结果运行SBR解码单元;和
所述第二开始代码指示从SBR数据中检测误码时使用的检错数据和SBR数据的开始。
23.如权利要求22所述的音频数据解码设备,其中,所述第二开始代码包括:
零代码,以32比特的0来表示;和
扩展代码,以“1111 0001”来表示。
24.如权利要求14所述的音频数据解码设备,其中:
经第一信道到第M信道的每一信道发送编码的音频数据,其中,M表示等于或大于3的整数;和
可分级解码单元包括:
单声/立体声解码单元,用于对第一信道和第二信道之一的编码的音频数据解码;和
多信道扩展数据解码单元,用于对第三至第M信道之一的编码的音频数据解码。
25.如权利要求24所述的音频数据解码设备,其中:
比特流分析单元检查在比特流中是否存在编码的第三开始代码;
所述可分级解码单元还包括第三开始代码解码单元,用于对编码的第三开始代码解码;
如果在比特流中存在编码的第三开始代码,则比特流分析单元从该比特流提取编码的第三开始代码,并且响应于检查的结果来运行多信道扩展数据解码单元;和
所述第三开始代码指示从第三至第M信道的音频数据的开始。
26.如权利要求25所述的音频数据解码设备,其中,所述第三开始代码包括:
零代码,以32比特的0来表示;和
扩展代码,以8比特的1来表示。
27.一种音频数据编码方法,包括:
(a)将音频数据分成多个层,以预定数量的比特表示音频数据的层,并且早于较高层对较低层编码并早于每一层的低位比特对其高位比特编码;
(b)产生具有关于将被编码的音频数据之中位于等于或大于预定频率的频率的频带中的音频数据的信息的SBR数据,并对SBR数据编码;和
(c)使用编码的SBR数据和与预定比特率对应的编码的音频数据来产生比特流,其中,所述编码的音频数据是在(a)中编码的,所述预定比特率表示包括在所有编码的层中的音频数据之中发送的至少一个层的音频数据的比特率。
28.如权利要求27所述的音频数据编码方法,其中,所述预定频率是音频数据的层中的最低层的最大频率。
29.如权利要求27所述的音频数据编码方法,其中,(b)包括:使用关于具有频率等于或大于预定频率的频带中的音频数据的包络的信息来产生SBR数据,并对产生的SBR数据执行无损编码。
30.如权利要求29所述的音频数据编码方法,其中,所述无损编码是熵编码或Huffman编码。
31.如权利要求27所述的音频数据编码方法,其中,(a)包括对音频数据下采样并划分下采样的音频数据以产生多个层。
32.如权利要求27所述的音频数据编码方法,其中,所述预定比特率等于或大于最低层的比特率。
33.如权利要求27所述的音频数据编码方法,其中:
经第一信道到第M信道的每一个发送音频数据,其中,M表示等于或大于3的整数;以及
(a)包括:
对第一和第二信道中的一个的音频数据编码;和
对第三到第M信道中的一个的音频数据编码。
34.一种音频数据解码方法,包括:
(a)从给定的比特流提取编码的SBR数据和与至少一个层相应的编码的音频数据,所述层以预定数量的比特表示;
(b)通过早于较高层对较低层解码并早于每一层的低位比特对每一层的高位比特解码来对编码的音频数据解码;
(c)对编码的SBR数据解码,并基于解码的音频数据和解码的SBR数据推断第一频率和第二频率之间的频带中的音频数据;和
(d)通过使用解码的音频数据和推断的音频数据产生合成数据,并确定合成数据为0频率与第二频率之间的频带中的音频数据,
其中,第二频率等于或大于所述至少一个层的最大频率,SBR数据包括关于第一和第二频率之间的频带中的音频数据的信息。
35.如权利要求34所述的音频数据解码方法,其中,解码的音频数据存在的频带中的合成数据是解码的音频数据,解码的音频数据不存在的频带中的合成数据是推断的音频数据。
36.如权利要求34所述的音频数据解码方法,其中:
关于音频数据的信息包括关于音频数据的包络的信息;
(c)包括:
无损解码单元对编码的SBR数据执行无损解码并获得关于包络的信息;
高频产生单元在等于或大于解码的音频数据的最大频率的频率的频带中使解码的音频数据产生;和
包络调整单元基于获得的信息调整产生的音频数据的包络;以及
(d)包括:确定解码的音频数据为用于解码的音频数据存在的频带的合成数据,并确定包络被调整的音频数据为用于包络被调整的音频数据存在的频带的合成数据。
37.如权利要求36所述的音频数据解码方法,其中,无损解码是熵解码或Huffman解码。
38.如权利要求34所述的音频数据解码方法,其中,以预定的比特率或 低于预定的比特率的比特率执行对编码的音频数据的解码,所述预定的比特率等于或大于最低层的比特率。
39.如权利要求34所述的音频数据解码方法,其中,第一频率是最低层的最大频率。
40.如权利要求34所述的音频数据解码方法,其中,
经第一信道到第M信道的每一个发送编码的音频数据,其中,M表示等于或大于3的整数;以及
(b)包括:
对第一和第二信道中的一个的编码的音频数据解码;和
对第三到第M信道中的一个的编码的音频数据解码。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67111105P | 2005-04-14 | 2005-04-14 | |
US60/671,111 | 2005-04-14 | ||
US70644105P | 2005-08-09 | 2005-08-09 | |
US60/706,441 | 2005-08-09 | ||
US70754605P | 2005-08-12 | 2005-08-12 | |
US60/707,546 | 2005-08-12 | ||
KR1020050135837 | 2005-12-30 | ||
KR20050135837 | 2005-12-30 | ||
KR10-2005-0135837 | 2005-12-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1878001A CN1878001A (zh) | 2006-12-13 |
CN1878001B true CN1878001B (zh) | 2012-07-18 |
Family
ID=36754313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006100721782A Expired - Fee Related CN1878001B (zh) | 2005-04-14 | 2006-04-14 | 对音频数据编码及解码的设备及方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US7813932B2 (zh) |
EP (1) | EP1713061B1 (zh) |
JP (2) | JP4781153B2 (zh) |
KR (3) | KR100818268B1 (zh) |
CN (1) | CN1878001B (zh) |
AT (1) | ATE407423T1 (zh) |
DE (1) | DE602006002538D1 (zh) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7835904B2 (en) * | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
KR100923156B1 (ko) * | 2006-05-02 | 2009-10-23 | 한국전자통신연구원 | 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US9159333B2 (en) * | 2006-06-21 | 2015-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
KR101438387B1 (ko) * | 2006-07-12 | 2014-09-05 | 삼성전자주식회사 | 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치 |
US8571875B2 (en) | 2006-10-18 | 2013-10-29 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus encoding and/or decoding multichannel audio signals |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
GB2443911A (en) * | 2006-11-06 | 2008-05-21 | Matsushita Electric Ind Co Ltd | Reducing power consumption in digital broadcast receivers |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
US20100076755A1 (en) * | 2006-11-29 | 2010-03-25 | Panasonic Corporation | Decoding apparatus and audio decoding method |
CN101512909B (zh) * | 2006-11-30 | 2012-12-19 | 松下电器产业株式会社 | 信号处理装置 |
US8560328B2 (en) * | 2006-12-15 | 2013-10-15 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
AU2009221444B2 (en) * | 2008-03-04 | 2012-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Mixing of input data streams and generation of an output data stream therefrom |
US8452587B2 (en) * | 2008-05-30 | 2013-05-28 | Panasonic Corporation | Encoder, decoder, and the methods therefor |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
ES2906085T3 (es) | 2009-10-21 | 2022-04-13 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
AU2010332925B2 (en) | 2009-12-16 | 2013-07-11 | Dolby International Ab | SBR bitstream parameter downmix |
RU2571561C2 (ru) | 2011-04-05 | 2015-12-20 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
WO2012158333A1 (en) | 2011-05-19 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
WO2014005327A1 (zh) * | 2012-07-06 | 2014-01-09 | 深圳广晟信源技术有限公司 | 对多声道数字音频编码的方法 |
EP2888882A4 (en) | 2012-08-21 | 2016-07-27 | Emc Corp | LOSS-FREE COMPRESSION OF FRAGMENTED IMAGE DATA |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3408851B1 (en) | 2016-01-26 | 2019-09-11 | Dolby Laboratories Licensing Corporation | Adaptive quantization |
US10741196B2 (en) * | 2016-03-24 | 2020-08-11 | Harman International Industries, Incorporated | Signal quality-based enhancement and compensation of compressed audio signals |
TWI752166B (zh) | 2017-03-23 | 2022-01-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
JP6888172B2 (ja) * | 2018-01-18 | 2021-06-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 音場表現信号を符号化する方法及びデバイス |
KR101921083B1 (ko) * | 2018-02-20 | 2018-11-22 | 주식회사 인터엠 | 네트워크 기반의 선택적 품질의 음원 방송을 위한 기법 |
KR102049348B1 (ko) * | 2018-11-13 | 2019-11-27 | 주식회사 인터엠 | VoIP를 활용한 네트워크 기반의 선택적 품질의 음원 방송을 위한 기법 |
CN113113032A (zh) | 2020-01-10 | 2021-07-13 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN111865952B (zh) * | 2020-07-10 | 2023-04-18 | 腾讯音乐娱乐科技(深圳)有限公司 | 数据处理方法、装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1218339A (zh) * | 1997-11-20 | 1999-06-02 | 三星电子株式会社 | 可缩放的音频编码/解码方法和装置 |
CN1272022A (zh) * | 1999-04-28 | 2000-11-01 | 嚴相燮 | 多功能移动通信终端 |
US6529604B1 (en) * | 1997-11-20 | 2003-03-04 | Samsung Electronics Co., Ltd. | Scalable stereo audio encoding/decoding method and apparatus |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2156889C (en) * | 1994-09-30 | 1999-11-02 | Edward L. Schwartz | Method and apparatus for encoding and decoding data |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
IL122714A (en) * | 1997-04-02 | 2011-06-30 | Samsung Electronics Co Ltd | Digital data coding/decoding method and apparatus |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JPH11136225A (ja) * | 1997-10-30 | 1999-05-21 | Matsushita Electric Ind Co Ltd | ビットストリームにおけるスタートコードを検出する方法および装置 |
JP2001034299A (ja) * | 1999-07-21 | 2001-02-09 | Yamaha Corp | 音声合成装置 |
US6504496B1 (en) * | 2001-04-10 | 2003-01-07 | Cirrus Logic, Inc. | Systems and methods for decoding compressed data |
EP1292036B1 (en) * | 2001-08-23 | 2012-08-01 | Nippon Telegraph And Telephone Corporation | Digital signal decoding methods and apparatuses |
JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
KR100433984B1 (ko) * | 2002-03-05 | 2004-06-04 | 한국전자통신연구원 | 디지털 오디오 부호화/복호화 장치 및 방법 |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
EP1573922B9 (en) * | 2002-10-24 | 2009-03-18 | Agency for Science, Technology and Research | A method and a device for processing bit symbols generated by a data source; a computer readable medium; a computer program element |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
KR100923301B1 (ko) * | 2003-03-22 | 2009-10-23 | 삼성전자주식회사 | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
JP2005024756A (ja) * | 2003-06-30 | 2005-01-27 | Toshiba Corp | 復号処理回路および移動端末装置 |
WO2005081229A1 (ja) * | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
JP4618634B2 (ja) * | 2004-10-07 | 2011-01-26 | Kddi株式会社 | 圧縮オーディオデータ処理方法 |
-
2006
- 2006-04-12 KR KR1020060033208A patent/KR100818268B1/ko not_active IP Right Cessation
- 2006-04-13 AT AT06252067T patent/ATE407423T1/de not_active IP Right Cessation
- 2006-04-13 DE DE602006002538T patent/DE602006002538D1/de active Active
- 2006-04-13 EP EP06252067A patent/EP1713061B1/en not_active Not-in-force
- 2006-04-14 JP JP2006112402A patent/JP4781153B2/ja not_active Expired - Fee Related
- 2006-04-14 US US11/403,827 patent/US7813932B2/en not_active Expired - Fee Related
- 2006-04-14 CN CN2006100721782A patent/CN1878001B/zh not_active Expired - Fee Related
-
2007
- 2007-06-01 KR KR1020070054024A patent/KR101162572B1/ko not_active IP Right Cessation
- 2007-06-01 KR KR1020070054025A patent/KR101029076B1/ko not_active IP Right Cessation
-
2009
- 2009-11-11 JP JP2009258400A patent/JP5254933B2/ja not_active Expired - Fee Related
-
2010
- 2010-09-07 US US12/923,171 patent/US8046235B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1218339A (zh) * | 1997-11-20 | 1999-06-02 | 三星电子株式会社 | 可缩放的音频编码/解码方法和装置 |
US6529604B1 (en) * | 1997-11-20 | 2003-03-04 | Samsung Electronics Co., Ltd. | Scalable stereo audio encoding/decoding method and apparatus |
CN1272022A (zh) * | 1999-04-28 | 2000-11-01 | 嚴相燮 | 多功能移动通信终端 |
Non-Patent Citations (2)
Title |
---|
党辰等.高频重建技术SBR的研究与实现.电子学报32 12A.2004,32(12A),189-191. |
党辰等.高频重建技术SBR的研究与实现.电子学报32 12A.2004,32(12A),189-191. * |
Also Published As
Publication number | Publication date |
---|---|
DE602006002538D1 (de) | 2008-10-16 |
KR20070063493A (ko) | 2007-06-19 |
US20060235678A1 (en) | 2006-10-19 |
JP5254933B2 (ja) | 2013-08-07 |
KR20060108520A (ko) | 2006-10-18 |
EP1713061A3 (en) | 2006-12-27 |
US7813932B2 (en) | 2010-10-12 |
JP4781153B2 (ja) | 2011-09-28 |
JP2006293375A (ja) | 2006-10-26 |
KR100818268B1 (ko) | 2008-04-02 |
EP1713061B1 (en) | 2008-09-03 |
KR101162572B1 (ko) | 2012-07-05 |
EP1713061A2 (en) | 2006-10-18 |
US8046235B2 (en) | 2011-10-25 |
KR20070070137A (ko) | 2007-07-03 |
US20100332239A1 (en) | 2010-12-30 |
KR101029076B1 (ko) | 2011-04-18 |
JP2010033084A (ja) | 2010-02-12 |
CN1878001A (zh) | 2006-12-13 |
ATE407423T1 (de) | 2008-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1878001B (zh) | 对音频数据编码及解码的设备及方法 | |
KR101238239B1 (ko) | 인코더 | |
CN101223577B (zh) | 对低比特率音频信号进行编码/解码的方法和设备 | |
CN105702258B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
CN1809872B (zh) | 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 | |
US7333929B1 (en) | Modular scalable compressed audio data stream | |
US7974840B2 (en) | Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information | |
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
KR100707177B1 (ko) | 디지털 신호 부호화/복호화 방법 및 장치 | |
US20100274555A1 (en) | Audio Coding Apparatus and Method Thereof | |
KR20050087956A (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
KR20070037945A (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
KR20100089772A (ko) | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 | |
US20170316786A1 (en) | Audio encoding apparatus and method, and audio decoding apparatus and method | |
JP2004094223A (ja) | 多数のサブバンド及び重なり合うウィンドウ関数を用いて処理される音声信号を符号化及び復号化する方法及び装置 | |
KR100765747B1 (ko) | 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치 | |
KR100947065B1 (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
KR20090043352A (ko) | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120718 Termination date: 20170414 |
|
CF01 | Termination of patent right due to non-payment of annual fee |