CN101288309B - 处理/发送以及接收/处理比特流的方法和设备 - Google Patents
处理/发送以及接收/处理比特流的方法和设备 Download PDFInfo
- Publication number
- CN101288309B CN101288309B CN2006800382156A CN200680038215A CN101288309B CN 101288309 B CN101288309 B CN 101288309B CN 2006800382156 A CN2006800382156 A CN 2006800382156A CN 200680038215 A CN200680038215 A CN 200680038215A CN 101288309 B CN101288309 B CN 101288309B
- Authority
- CN
- China
- Prior art keywords
- data
- payload
- voice data
- coding
- subframe
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000012545 processing Methods 0.000 title claims description 74
- 230000005540 biological transmission Effects 0.000 claims description 59
- 125000004122 cyclic group Chemical group 0.000 claims description 15
- 238000011084 recovery Methods 0.000 claims description 15
- 206010000234 Abortion spontaneous Diseases 0.000 claims description 5
- 208000015994 miscarriage Diseases 0.000 claims description 5
- 208000000995 spontaneous abortion Diseases 0.000 claims description 5
- 238000011282 treatment Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 238000003672 processing method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 241001269238 Data Species 0.000 description 5
- 238000013500 data storage Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 210000001901 basal epithelial cell of bronchioalveolar duct junction Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229940004975 interceptor Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234327—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
提供一种对音频数据进行分级编码/解码(诸如,比特时间片算术编码(BSAC))的方法和设备。因此,音频数据和扩展数据的净荷可根据优先级被分组并交织,从而去除一些净荷组,并发送剩余组。因此,可根据优先级发送在再现原始声音的情况下比音频数据的顶层更重要的扩展数据。
Description
本申请要求于2005年10月12日提交的第60/725,317号美国临时专利的权益、于2005年10月14日提交的第60/726,159号美国临时专利的权益、于2006年5月30日在韩国知识产权局提交的第10-2006-0049081号韩国专利申请的优先权、于2006年5月30日在韩国知识产权局提交的第10-2006-0049082号韩国专利申请的优先权、于2006年7月19日在韩国知识产权局提交的第10-2006-0067705号韩国专利申请的优先权、于2006年9月28日在韩国知识产权局提交的第10-2006-0095040号韩国专利申请的优先权,这些公开完整地包含于此,以资参考。
技术领域
本发明涉及一种编码/解码音频数据的方法和设备,更具体地说,涉及一种对音频数据分级编码/解码(诸如比特时间片算术编码(BSAC))的方法和设备。
背景技术
存在发送比特时间片算术编码(BSAC)净荷以支持精细可伸缩性(FGS)的功能的两种方法。一种方法是去除BSAC访问单位的基本流。在这种情况下,所述访问单位被定义为基本流中可被独立访问的部分。所述访问单位是可包含定时信息的最小数据单位。另一种方法是在提供音频数据的服务器侧(即,编码器侧)截取BSAC净荷。前一种方法在同步层和传送层发生,后一种方法在压缩层发生。这两种方法可被同时使用。
发明内容
技术问题
当使用上述发送方法通过在编码器中对音频数据分级编码来将比特流发送到解码器时,通常会发生这样的问题,即,没有能够有效地将分级编码的音频数据和可形成音频数据的扩展数据一起发送的解决方案,所述可形成音频数据的扩展数据诸如用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的循环冗余代码(CRC)的数据。
技术方案
本发明提供一种增强音频数据可伸缩性并且提供反向兼容性以支持传统分级编码方法的设备和方法。
本发明还提供一种用于提供一种解决方案的设备和方法,在所述解决方案中除了考虑音频数据带的可伸缩传输的重要性之外,还考虑扩展数据的重要性。
本发明还提供一种其上实现有执行前述方法的计算机程序的计算机可读介质。
然而,本发明不限于上述方面,还可存在其他方面。本领域技术人员将从以下的描述中清楚地理解。
根据本发明的一方面,提供一种处理/发送比特流的方法,所述方法包括:对音频数据以及音频数据的一个或者多个扩展数据编码;通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和去除分组并交织的一组净荷,并发送剩余净荷组。
根据本发明的另一方面,提供一种其上实现有用于执行所述处理/发送比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种处理/发送比特流的设备,所述设备包括:编码器,对音频数据以及一个或者多个音频数据的扩展数据编码;处理器,通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和发送器,去除分组并交织的一组净荷,并发送剩余净荷组。
根据本发明的另一方面,提供一种处理/发送比特流的方法,所述方法包括:对音频数据以及一个或者多个音频数据的扩展数据编码;截取由编码获得的一些净荷;和发送截取的净荷。
根据本发明的另一方面,提供一种其上实现有用于所述执行处理/发送比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种处理/发送比特流的设备,所述设备包括:编码器,对音频数据以及音频数据的一个或者多个扩展数据编码;截取器,截取由编码器的编码获得的一些净荷;和发送器,发送截取的净荷。
根据本发明的另一方面,提供一种接收/处理比特流的方法,所述方法包括:接收分组并交织的一些净荷;将所述分组并交织的净荷恢复为原始形式;和对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种其上实现有用于执行接收/处理比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种接收/处理比特流的设备,所述设备包括:接收器,接收分组并交织的一些净荷;恢复器,将所述分组并交织的净荷恢复为原始形式;和解码器,对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种接收/处理比特流的方法,所述方法包括:接收具有截取部分的净荷;将具有截取部分的所述净荷恢复为原始形式;和对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种其上实现有用于执行所述接收/处理比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种接收/处理比特流的设备,所述设备包括:接收器,接收具有截取部分的净荷;恢复器,将具有截取部分的所述净荷恢复为原始形式;和解码器,对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
有益效果
根据本发明,音频数据及其扩展数据的净荷可根据优先级被分组和交织,从而去除一些净荷组,并将剩余组发送。因此,可根据优先级发送在再现原始声音的情况下比音频数据的顶层更重要的扩展数据。
此外,对音频数据以及音频数据的扩展数据编码,并截取音频数据的一些净荷。因为将截取的音频数据的净荷与扩展数据的净荷一起发送,所以在很大程度上减少音频数据的总比特率的同时可以适度地降低声音质量。总之,本发明提供了一种这样的解决方案,即,除了考虑音频数据的可伸缩传输的重要性之外,还要考虑扩展数据的重要性。
附图说明
通过以下结合附图对本发明示例性实施例的详细描述,本发明的以上和其他特点和优点将变得更加清楚,其中:
图1是根据本发明实施例的比特流处理/发送设备的框图;
图2示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的示例;
图3示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例;
图4示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例;
图5是根据本发明另一实施例的比特流处理/发送设备的框图;
图6示出了根据本发明实施例的在比特流处理/发送设备中截取净荷的示例;
图7是根据本发明实施例的比特流接收/处理设备的框图;
图8是根据本发明另一实施例的比特流接收/处理设备的框图;
图9是根据本发明实施例的比特流处理/发送方法的流程图;
图10是根据本发明另一实施例的比特流处理/发送方法的流程图;
图11是根据本发明另一实施例的比特流接收/处理方法的流程图;和
图12是根据本发明另一实施例的比特流接收/处理方法的流程图;
具体实施方式
以下,将参照附图描述本发明的示例性实施例。
图1是根据本发明实施例的比特流处理/发送设备的框图。所述比特流处理/发送设备包括:编码器100、净荷处理器110、基本流(ES)产生器120、ES优先级分配单元130、同步层(SL)包产生器140、SL优先级分配单元150和发送器160。
编码器100对音频数据和音频数据的扩展数据分级编码。在这种情况下,可通过使用比特时间片算术编码(BSAC)方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的循环冗余代码(CRC)的数据。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素(fill element)。当音频数据的扩展数据被编码时,编码器100可对音频数据的扩展数据的前述示例中的至少一个编码。
当对于净荷发送方法中的使用访问单位的方法去除基本流时,净荷处理器110对净荷分组并交织,从而包括在由编码器100的编码而获得的一个子帧中的一些净荷和包括在另一个子帧中的一些净荷属于一组。在MPEG标准中,所述访问单位被定义为基本流中可被独立访问的部分,并且是可包含定时信息的最小数据单位。
ES产生器120从由净荷处理器110分组并交织的净荷产生与压缩层上的净荷组相应的基本流。所述压缩层被定义为接收编码器100的编码结果并因此产生基本流的层。
ES优先级分配单元130为ES产生器120产生的基本流分配优先级。更具体地说,ES优先级分配单元130根据解码器侧的发送优先级为各个基本流分配优先级。因此,ES产生器120产生的各个基本流具有在ES描述符中指定的优先级。
SL包产生器140从ES产生器120产生的基本流产生与同步层上的净荷组相应的SL包。同步层被定义为产生通过调节基本流提供音频数据编码器和音频数据解码器之间的同步信息的SL包的层。
SL优先级分配单元150为SL包产生器140产生的各个SL包分配优先级。更具体地说,SL优先级分配单元150根据解码器侧的发送优先级为各个SL包分配优先级。由ES优先级分配单元130分配给各个基本流的优先级和由SL优先级分配单元150分配给各个SL包的优先级可以实现在同步层和传送层上为可伸缩传输去除一些基本流。
发送器160根据由ES优先级分配单元130分配给各个基本流的优先级和由SL优先级分配单元150分配给各个SL包的优先级去除一些SL包并发送剩余的SL包。更具体地说,发送器160通过考虑编码器侧和解码器侧之间的传输环境确定发送SL包的总比特率。此外,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除SL包,并发送剩余的SL包。
图2示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的示例。
图2的示例示出了音频数据的扩展数据是用于将音频数据的声道扩展为多声道的数据时的BSAC音频数据及其扩展数据的可伸缩传输。即,这个示例显示了与“BSAC声道扩展”相应的BSAC净荷的可伸缩传输。
在图2所示的示例中,子帧的数量被设置为2,并且去除具有低优先级的4个SL包。然而,在本发明中子帧的数量不限于2,因此,可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。去除的包对应于包括在与音频数据的扩展数据对应的中央(C)声道和左环绕(SL)声道/右环绕(SR)声道中的音频数据的BSAC净荷的顶层。因此,可通过允许根据每个声道的音频数据的优先级发送与低频带对应的基本层来均匀地再现每个声道的音频数据。
在图2中,净荷处理器110对通过编码器100的编码而获得的BSAC净荷进行分组并交织,从而音频数据的一些净荷与用于扩展音频数据的声道的数据的一些净荷属于一组。
例如,如果在本实施例中使用5.1声道音频数据,则净荷处理器110对净荷进行分组和交织,从而基本层LL0_0和基本层LL1_0属于一组,其中,基本层LL0_0包括在通过编码器100针对左前(FL)声道和右前(FR)声道的编码而获得的FL声道和FR声道的音频数据的每层的净荷中,而基本层LL1_0包括在通过编码器100针对SL声道和SR声道的编码而获得的SL声道和SR声道的音频数据的每层的BSAC净荷中。
此外,净荷处理器110对净荷进行分组和交织,从而顶层LL0_1和顶层LL1_1属于一组,其中,顶层LL0_1包括在通过编码器100针对FL声道和FR声道的编码而获得的FL声道和FR声道的音频数据的每层的BSAC净荷中,而顶层LL1_1包括在通过编码器100针对SL声道和SR声道的编码而获得的SL声道和SR声道的音频数据的每层的BSAC净荷中。
ES产生器120根据已由净荷处理器110分组并交织为一组的净荷LL0_0和净荷LL1_0产生第0基本流。随后,ES优先级分配单元130为ES产生器120产生的第0基本流分配优先级9。SL包产生器140根据ES产生器120产生的第0基本流产生两个SL包。其后,SL优先级分配单元150为SL包产生器140产生的各个SL包分配优先级0。同样地,对图2所示的剩余净荷进行相同处理。
根据SL包的发送的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除4个SL包,并发送剩余的SL包。
图3示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例。
图3的示例示出当立体声音频数据的扩展数据是用于扩展音频数据的带宽的数据时音频数据及其扩展数据的可伸缩传输。即,这个示例示出了从使用“BSAC频带复制(SBR)增强”执行的编码获得的BSAC净荷的可伸缩传输。
在图3所示的示例中,子帧的数量被设置为2,并且去除具有低优先级的2个SL包。然而,在本发明中子帧的数量不限于2,因此,可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。去除的包对应于包括在第一子帧中的立体声音频数据的每层的BSAC净荷的顶层和包括在第二子帧中的立体声音频数据的每层的BSAC净荷的顶层。因此,通过增加去除的SL包可降低将被发送的总比特率。待发送的总比特率被减少并导致使用SBR工具重构与顶层相关的高频信号的声音质量适当地降低。
在图3中,净荷处理器110对从编码器100的编码获得的BSAC净荷进行分组和交织,从而包括在第一子帧中的音频数据的一些BSAC净荷和包括在第二子帧中的音频数据的一些BSAC净荷属于一组,而包括在第一子帧中的用于扩展音频数据的带宽的数据的净荷和包括在第二子帧中的用于扩展音频数据的带宽的数据的净荷属于一组。
例如,如果在本实施例中使用立体声音频数据,则净荷处理器110对净荷进行分组和交织,从而基本层LL0_0和基本层LL1_0属于一组,其中,基本层LL0_0包括在编码器100针对FL声道和FR声道进行编码而获得的第一子帧中包括的FL声道和FR声道的音频数据的每层的BSAC净荷中,而基本层LL1_0包括在第二子帧中包括的FL声道和FR声道的音频数据的每层的BSAC净荷中。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。
此外,净荷处理器110对净荷分组并交织,从而BSAC净荷LL0_3和BSAC净荷LL1_3属于一组,其中,BSAC净荷LL0_3包括在从编码器100的编码获得的第一子帧中包括的用于扩展FL声道和FR声道的音频数据的带宽的数据中,而BSAC净荷LL1_3包括在第二子帧中包括的用于扩展FL声道和FR声道的音频数据的带宽的数据中。
ES产生器120根据已由净荷处理器110分组并交织的为一组的净荷LL0_0和净荷LL1_0产生第0基本流。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。
此外,ES产生器120根据已由净荷处理器110分组并交织的为一组的净荷LL0_3和净荷LL1_3产生第3基本流。随后,ES优先级分配单元130为由ES产生器120产生的第0基本流分配优先级9。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。此外,ES优先级分配单元130为由ES产生器120产生的第3基本流分配优先级3。
其后,SL包产生器140根据由ES产生器120产生的各个基本流来产生2个SL包。随后,SL优先级分配单元150为由SL包产生器140产生的各个SL包分配优先级。根据SL包传输的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除2个SL包,并发送剩余的SL包。
图4示出了根据本发明实施例的比特流处理/发送设备中去除基本流的另一示例。
图4的示例示出了当音频数据的扩展数据是用于扩展音频数据的声道的数据时BSAC音频数据及其扩展数据的可伸缩传输。即,这个示例示出了使用“SBR的BSAC声道扩展”的可伸缩传输。
在图4所示的示例中,具有低优先级的4个SL包被去除。然而,在本发明中子帧的数量不限于1,因此可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。
在图4中,净荷处理器110对经编码器100的编码获得的净荷进行分组和交织,从而音频数据的一些BSAC净荷、用于将音频数据的声道扩展为多声道的数据的一些净荷、以及用于扩展音频数据的带宽的净荷属于一组。
ES产生器120根据已由净荷处理器110分组并交织为一组的净荷LL0_0产生第0基本流。随后,ES优先级分配单元130为由ES产生器120产生的第0基本流分配优先级9。SL包产生器140根据ES产生器120产生的第0基本流包产生两个SL包。其后,SL优先级分配单元150为由SL包产生器140产生的各个SL包分配优先级0和1。同样地,对图4所示的剩余净荷进行相同的处理。
根据SL包的传输的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除4个SL包,并发送剩余的SL包。
图5是根据本发明另一实施例的比特流处理/发送设备的框图。所述比特流处理/发送设备包括:编码器500、净荷处理器510、ES产生器520、ES优先级分配单元530、SL包产生器540、SL优先级分配单元550和发送器560。
编码器500对音频数据和音频数据的扩展数据进行分级编码。在这种情况下,可根据BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当音频数据的扩展数据被编码时,编码器500可对音频数据的扩展数据的前述示例中的至少一个进行编码。
净荷处理器510通过考虑编码器侧和解码器侧之间的传输环境(例如,通过考虑可根据后声道的净荷确定的层数)截取包括在经编码器500编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷。
净荷处理器510使用“轻量服务器处理”截取一些净荷。在本实施例中,轻量服务器处理被定义为截取一些净荷所需的附加处理,例如,解析比特流。因为在BSAC净荷发送方法中,与为访问单位去除基本流的方法相比,对净荷的处理和传输相对简单,所以使用术语“轻量”。
此外,净荷处理器510仅截取音频数据的一些净荷,并不截取音频数据的扩展数据的净荷。因此,净荷处理器510通过解析比特流将音频数据的净荷与扩展数据的净荷分离,并且根据分离的结果仅截取不属于扩展数据的一些净荷。
在BASC中可以为这种分离使用“zero_code”和“sync_word”。即,净荷处理器510通过使用“zero_code”和“sync_word”识别扩展数据的净荷,并且仅截取不属于扩展数据的净荷的一些净荷。净荷处理器510将“zero_code”和“sync_word”连接到截取的净荷的末尾,从而当音频数据解码器检查到“zero_code”和“sync_word”时可从发送的基本流(ES)中提取访问单位。如果不存在扩展数据的净荷,则因为不需要前述分离所以处理相当简单。
此外,净荷处理器510通过考虑编码器侧和解码器侧之间的传输环境确定目标比特率,根据目标比特率计算目标层的数量,并根据目标层的数量截取一些净荷。
ES产生器520根据由净荷处理器510截取的净荷产生与压缩层上的净荷组相应的一个基本流,并且还根据扩展数据的净荷产生另一基本流。ES优先级分配单元530为由ES产生器520产生的基本流分配优先级。随后,SL包产生器540根据由ES产生器520产生的基本流产生与同步层上的净荷组相应的SL包。SL优先级分配单元550为由SL包产生器540产生的各个SL包分配优先级。发送器560发送由SL包产生器540产生的SL包。如上所述,根据本实施例不对ES产生器520、SL包产生器540和发送器560进行用于可伸缩传输的特殊处理。
图6示出了根据本发明实施例的在比特流处理/发送设备中截取净荷的示例。
图6的示例示出了当立体声音频数据的扩展数据是用于扩展音频数据的带宽的数据时音频数据及其扩展数据的可伸缩传输。即,这个示例示出了从使用“BSAC SBR增强”执行的编码获得的净荷的可伸缩传输。
参照图6,子帧的数量被设置为2。在这种情况下,净荷处理器510截取包括在第一子帧中的立体声音频数据的每层的净荷LL0_0的一部分和包括在第二子帧中的立体声音频数据的每层的净荷LL1_0的一部分。ES产生器520根据由净荷处理器510截取的净荷LL0_0和LL1_0产生第0基本流,并根据用于扩展音频数据的带宽的数据LL0_0和LL1_0产生第一基本流。
图7是根据本发明实施例的比特流接收/处理设备的框图。所述比特流接收/处理设备包括:接收器700、ES恢复器710、净荷恢复器720和解码器730。根据图7所示的配置,可以实现去除基本流的方法。
接收器700经输入端IN接收特定包格式的比特流,因此接收SL包,所述SL包包括由图1的比特流处理/发送设备分组和交织的一些净荷。根据本实施例,接收器700接收作为一组的包括在一个子帧中的一些净荷和包括在另一个子帧中的一些净荷。
在图2中所示的示例性情况下,接收器700接收作为一组的音频数据的每层的BSAC的净荷的基本层和用于扩展该音频数据的声道的数据的每层的净荷的基本层。此外,接收器700接收音频数据的每层的净荷的顶层和用于扩展该音频数据的声道的数据的每层的净荷的顶层。
在图3中所示的示例性情况下,接收器700接收作为一组的包括在一个子帧中的音频数据的一些BSAC净荷和包括在另一子帧中的音频数据的一些BSAC净荷。此外,接收器700接收作为一组的包括在一个子帧中的用于扩展音频数据的带宽的数据的净荷和包括在另一子帧中的用于扩展音频数据的带宽的数据的净荷。
ES恢复器710在SL层对由接收器700接收的SL包进行解析,因此恢复包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流。SL层被定义为用于执行将音频数据编码器和音频数据解码器进行同步所需的操作(例如,从SL包中提取音频数据编码器和音频数据解码器之间的同步信息的操作)的层。
净荷恢复器720通过对由ES恢复器710恢复的基本流进行解析来将净荷恢复为原始形式。即,净荷恢复器720通过使用包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流来将所述净荷恢复为原始形式。压缩层被定义为用于执行从基本流解码净荷所需的操作的层。
具体来说,净荷恢复器720通过使用关于包括在由ES恢复器710恢复的基本流中的净荷的头信息,根据层的数量、长度和顺序获得关于净荷的信息,其中,所述头信息包括关于由图1的比特流处理/发送设备分组并交织的净荷的信息。此后,通过使用获得的信息,净荷恢复器720将如上所述作为一组接收的净荷解交织,从而恢复一个子帧,并随后恢复另一子帧。
在图2所示的示例性情况中,净荷恢复器720通过将如上所述作为一组接收的净荷解交织来恢复音频数据的每层的BSAC净荷,并且还恢复用于扩展音频数据的声道的数据的每层的BSAC净荷。
在图3所示的示例性情况中,净荷恢复器720通过将如上所述作为一组接收的净荷解交织来恢复音频数据的每层的BSAC净荷,并且还恢复用于扩展音频数据的带宽的数据的净荷。
解码器730对包括在由净荷恢复器720恢复的每层的净荷中的音频数据进行分级解码。此外,解码器730对音频数据的扩展数据解码,所述音频数据的扩展数据包括用于将由净荷恢复器720恢复的音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
图8是根据本发明另一实施例的比特流接收/处理设备的框图。所述比特流接收/处理设备包括:接收器800、ES恢复器810、净荷恢复器820和解码器830。根据图8所示的配置,可以实现截取净荷的方法。
接收器800经输入端IN接收特定包格式的比特流,因此接收具有由图1的编码器截取的一部分的净荷和包括音频数据的扩展数据的净荷的SL包。根据本实施例,接收器800接收作为一组的包括在一个子帧中的一些净荷和包括在另一个子帧中的一些净荷。
ES恢复器810在SL层对由接收器800接收的SL包进行解析,因此恢复包括具有由图1的编码器截取的一部分的净荷的基本流,并且还恢复包括音频数据的扩展数据的净荷的基本流。
净荷恢复器820通过对由ES恢复器810恢复的基本流进行解析来将净荷恢复为原始形式。即,净荷恢复器820通过使用净荷来将所述净荷恢复为原始形式,其中,音频数据的一些净荷由图1的比特流处理/发送设备截取,并且不截取扩展数据的净荷。
具体来说,净荷恢复器820从包括在由ES恢复器810恢复的一个基本流中的具有截取的音频部分的净荷和包括在另一个基本流中的扩展数据的净荷来恢复包括具有截取的部分的净荷和扩展数据的净荷的一个子帧。
解码器830对包括在由净荷恢复器820恢复的每层的净荷中的音频数据分级解码。此外,解码器830对音频数据的扩展数据解码,所述音频数据的扩展数据包括用于将由净荷恢复器820恢复的音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的CRC代码的数据中的至少一个。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
在图3所示的示例性情况中,净荷恢复器820使用音频数据的净荷,其中截取一些净荷,而不截取用于扩展音频数据的带宽的数据的净荷,从而将所述净荷恢复为原始形式。更具体地说,净荷恢复器820从包括在一个基本流中的具有截取的音频部分的净荷和包括在另一个基本流中的用于扩展音频数据的带宽的数据的净荷来恢复包括具有截取的部分的净荷和用于扩展音频数据的带宽的数据的净荷的一个子帧。
图9是根据本发明实施例的比特流处理/发送方法的流程图。
参照图9,所述比特流处理/发送方法包括在图1的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图1的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,音频数据和音频数据的扩展数据被分级编码(操作900)。在这个操作中,可使用BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当在操作900中音频数据的扩展数据被编码时,音频数据的扩展数据的前述示例中的至少一个可被编码。
对净荷进行分组和交织,从而包括在从操作900的编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷属于一组(操作910)。根据在操作910中分组并交织的净荷产生与压缩层上的净荷组相应的基本流(操作920)。
为在操作920产生的基本流分配优先级(操作930)。
根据在操作930产生的基本流产生与同步层上的净荷组相应的SL包(操作940)。
为在操作940中产生的各个SL包分配优先级(操作950)。
根据在操作930和950分配的优先级,去除一些SL包,并且发送剩余的SL包(操作960)。
图10是根据本发明另一实施例的比特流处理/发送方法的流程图。
参照图10,所述比特流处理/发送方法包括在图5的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图5的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,音频数据和音频数据的扩展数据被分级编码(操作1000)。在这个操作中,可使用BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当在操作1000中音频数据的扩展数据被编码时,音频数据的扩展数据的前述示例中的至少一个可被编码。
在操作1000之后,通过考虑编码器侧和解码器侧之间的传输环境(例如,通过考虑根据后声道的净荷可被确定的层的数量),来一起截取包括在从操作1000中的编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷(操作1010)。
根据在操作1010截取的净荷产生与压缩层上的净荷组相应的一个基本流,并且还根据扩展数据的净荷产生另一基本流(操作1020)。
根据在操作1020产生的基本流来产生与SL层上的净荷组相应的SL包(操作1030)。
发送在操作1030产生的SL包(操作1040)。
图11是根据本发明实施例的比特流接收/处理方法的流程图。
参照图11,所述比特流接收/处理方法包括在图7的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图7的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,接收到包括图1和图5的比特流处理/发送设备分组并交织的一些净荷的SL包(操作1100)。
通过对在操作1100接收到的SL包进行解析来恢复包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流(操作1110)。
通过使用关于在操作1110中恢复的基本流中包括的净荷的头信息,根据层的数量、长度和顺序获得关于净荷的信息,其中,所述头信息包括关于由图1和图5的比特流处理/发送设备分组并交织的净荷的信息(操作1120)。
通过使用在操作1120中获得的信息对包括在基本流中的净荷进行解交织来将净荷恢复为原始形式(操作1130)。
在操作1130中恢复的每层的净荷中包括的音频数据和所述音频数据的扩展数据被分级解码(操作1140)。此外,在这个操作中,音频数据的扩展数据被解码,所述音频数据的扩展数据包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
图12是根据本发明另一实施例的比特流接收/处理方法的流程图。
参照图12,所述比特流接收/处理方法包括在图8的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图8的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,接收到包括图1和图5的比特流处理/发送设备分组并交织的一些净荷的SL包(操作1200)。
通过在SL层对在操作1200接收到的SL包进行解析来恢复包括具有由图1和图5的比特流处理/发送设备截取的一部分的净荷的基本流,并且还恢复包括音频数据的扩展数据的净荷的基本流。
通过对在操作1210中恢复的基本流进行解析将净荷恢复为原始形式(操作1220)。具体来说,在本实施例的比特流接收/处理方法中,从包括在一个基本流中的具有截取的音频数据部分的净荷和包括在另一个基本流中的用于扩展音频数据的带宽的数据的净荷,恢复包括具有截取的部分的净荷和用于扩展音频数据的带宽的数据的净荷的一个子帧。
在操作1220中恢复的每层的净荷中包括的音频数据和音频数据的扩展数据被分级解码(操作1230)。此外,在这个操作中,音频数据的扩展数据被解码,所述音频数据的扩展数据包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
本发明的实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。本发明还可被实施为计算机可读记录介质上的计算机可读代码。
所述计算机可读记录介质是任何可存储其后能由计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置和载波(诸如通过互联网的数据传输)。
尽管已经参照本发明示例性实施例具体显示和描述了本发明,但是本领域技术人员应当理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在形式和细节上做出各种改变。所述示例性实施例应被理解为仅用于描述性意义,而非限定的目的。因此本发明的范围不由本发明的详细描述限定,而是由权利要求限定,并且所述范围内的所有不同将被认为包括在本发明中。
Claims (13)
1.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在编码步骤中,音频数据被分级编码,并且用于扩展音频数据的声道的数据被分级编码,
其中,在交织步骤中,所述净荷被分组和交织,从而音频数据的每层的净荷的基本层和用于扩展音频数据的声道的数据的每层的净荷的基本层属于一组,
其中,为分组并交织的各个净荷元素分配优先级,其中,在发送步骤中,根据分配的优先级去除一些组。
2.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在编码步骤中,音频数据被分级编码,并且用于扩展音频数据的声道的数据被分级编码,
其中,在交织步骤中,所述净荷被分组和交织,从而音频数据的每层的净荷的顶层和用于扩展音频数据的声道的数据的每层的净荷的顶层属于一组,
其中,为分组并交织的各个净荷元素分配优先级,其中,在发送步骤中,根据分配的优先级去除一些组。
3.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在编码步骤中,音频数据被分级编码,并且用于扩展音频数据的带宽的数据被分级编码,
其中,在交织步骤中,所述净荷被分组和交织,从而包括在一个子帧中的音频数据的一些净荷和包括在另一子帧中的音频数据的一些净荷属于一组,
其中,为分组并交织的各个净荷元素分配优先级,其中,在发送步骤中,根据分配的优先级去除一些组。
4.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在编码步骤中,音频数据被分级编码,并且用于扩展音频数据的带宽的数据被分级编码,
其中,在交织步骤中,所述净荷被分组和交织,从而包括在一个子帧中的用于扩展音频数据的带宽的数据的净荷和包括在另一子帧中的用于扩展音频数据的带宽的数据的净荷属于一组,
其中,为分组并交织的各个净荷元素分配优先级,其中,在发送步骤中,根据分配的优先级去除一些组。
5.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在编码步骤中,通过使用一种编码方法对音频数据编码,通过使用一种或者多种编码方法对音频数据的一个或者多个扩展数据编码,
其中,在交织步骤中,将包括在一个子帧中的一些净荷和包括在另一子帧中的一些净荷进行分组和交织,以使所述包括在一个子帧中的一些净荷和所述包括在另一子帧中的一些净荷属于一组,
其中,根据分组并交织的净荷产生基本流,根据产生的基本流产生同步层包,其中,在发送步骤中,去除一些产生的同步层包,并发送剩余的同步层包。
6.一种处理/发送比特流的设备,所述设备包括:
编码器,对音频数据和音频数据的一个或者多个扩展数据编码;
处理器,通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和
发送器,去除分组并交织的一组净荷,并发送剩余的净荷组,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,编码器将音频数据分级编码,并且将用于扩展音频数据的带宽的数据分级编码,
其中,处理器将所述净荷分组和交织,从而包括在一个子帧中的音频数据的一些净荷和包括在另一子帧中的音频数据的一些净荷属于一组,
其中,处理器为分组并交织的各个净荷元素分配优先级,其中,发送器根据分配的优先级去除一些组。
7.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在接收步骤中,将包括在第一子帧中的一些净荷和包括在第二子帧中的一些净荷作为一组来接收,
其中,在恢复步骤中,通过对作为一组被接收的净荷解交织来恢复第一子帧和恢复第二子帧,
其中,在解码步骤中,对包括在恢复的第一子帧中的音频数据解码,对包括在第二子帧中的用于扩展音频数据的声道的数据解码。
8.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在接收步骤中,将包括在第一子帧中的一些净荷和包括在第二子帧中的一些净荷作为一组来接收,
其中,在恢复步骤中,通过对作为一组被接收的净荷解交织来恢复第一子帧和恢复第二子帧,
其中,在解码步骤中,对包括在恢复的第一子帧中的音频数据解码,对包括在第二子帧中的用于扩展音频数据的带宽的数据解码。
9.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在接收步骤中,将音频数据的每层的净荷的基本层和用于扩展音频数据的声道的数据的每层的净荷的基本层作为一组来接收,
其中,在恢复步骤中,通过对所述作为一组被接收的净荷解交织来恢复音频数据的每层的净荷,并且恢复用于扩展音频数据的声道的数据的每层的净荷,
其中,在解码步骤中,使用一种解码方法对音频数据解码,并且使用一种或者多种解码方法对音频数据的一个或者多个扩展数据解码。
10.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在接收步骤中,将音频数据的每层的净荷的顶层和用于扩展音频数据的声道的数据的每层的净荷的顶层作为一组来接收,
其中,在恢复步骤中,通过对所述作为一组被接收的净荷解交织,来恢复音频数据的每层的净荷,并且恢复用于扩展音频数据的声道的数据的每层的净荷,
其中,在解码步骤中,使用一种解码方法对音频数据解码,并且使用一种或者多种解码方法对音频数据的一个或者多个扩展数据解码。
11.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,在接收步骤中,将包括在第一子帧中的音频数据的一些净荷和包括在第二子帧中的音频数据的一些净荷作为一组来接收,并且将包括在第一子帧中的用于扩展音频数据的带宽的数据的净荷和包括在第二子帧中的用于扩展音频数据的带宽的数据的净荷作为一组来接收,
其中,在恢复步骤中,通过对所述作为一组被接收的净荷解交织,来恢复音频数据的每层的净荷,并且恢复用于扩展音频数据的带宽的数据的净荷,
其中,在解码步骤中,使用一种解码方法对音频数据解码,并且使用一种或者多种解码方法对音频数据的一个或者多个扩展数据解码。
12.一种接收/处理比特流的方法,所述方法包括:
接收分组并交织的一些净荷;
将所述分组并交织的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,接收步骤包括:通过接收包括分组并交织的一些净荷的同步层包并对接收的同步层包进行解析来恢复基本流,
其中,在恢复步骤中,通过对恢复的基本流进行解析将所述净荷恢复为原始形式,
其中,在解码步骤中,使用一种解码方法对音频数据解码,并且使用一种或者多种解码方法对音频数据的一个或者多个扩展数据解码。
13.一种接收/处理比特流的设备,所述设备包括:
接收器,接收分组并交织的一些净荷;
恢复器,将所述分组并交织的净荷恢复为原始形式;和
解码器,对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码,
其中,所述扩展数据是下列中的至少一个:用于将音频数据的声道扩展为多声道的数据;用于扩展音频数据的带宽的数据;用于产生检查音频数据传输错误的循环冗余代码的数据,
其中,接收器将包括在第一子帧中的一些净荷和包括在第二子帧中的一些净荷作为一组来接收,
其中,恢复器通过对作为一组被接收的净荷解交织来恢复第一子帧和恢复第二子帧,
其中,解码器对包括在恢复的第一子帧中的音频数据解码,对包括在第二子帧中的用于扩展音频数据的声道的数据解码。
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72531705P | 2005-10-12 | 2005-10-12 | |
US60/725,317 | 2005-10-12 | ||
US72615905P | 2005-10-14 | 2005-10-14 | |
US60/726,159 | 2005-10-14 | ||
KR10-2006-0049082 | 2006-05-30 | ||
KR20060049081 | 2006-05-30 | ||
KR20060049082 | 2006-05-30 | ||
KR10-2006-0049081 | 2006-05-30 | ||
KR10-2006-0067705 | 2006-07-19 | ||
KR1020060067705A KR20070108302A (ko) | 2005-10-14 | 2006-07-19 | 오디오 데이터의 확장에 대한 스케러빌러티를 지원하는부호화 방법 및 장치, 그 복호화 방법 및 장치 |
KR10-2006-0095040 | 2006-09-28 | ||
KR1020060095040A KR100813269B1 (ko) | 2005-10-12 | 2006-09-28 | 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치 |
PCT/KR2006/004098 WO2007043808A1 (en) | 2005-10-12 | 2006-10-12 | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102209802A Division CN102237094B (zh) | 2005-10-12 | 2006-10-12 | 处理/发送比特流以及接收/处理比特流的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101288309A CN101288309A (zh) | 2008-10-15 |
CN101288309B true CN101288309B (zh) | 2011-09-21 |
Family
ID=44887680
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102209802A Expired - Fee Related CN102237094B (zh) | 2005-10-12 | 2006-10-12 | 处理/发送比特流以及接收/处理比特流的方法和设备 |
CN2006800382156A Expired - Fee Related CN101288309B (zh) | 2005-10-12 | 2006-10-12 | 处理/发送以及接收/处理比特流的方法和设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102209802A Expired - Fee Related CN102237094B (zh) | 2005-10-12 | 2006-10-12 | 处理/发送比特流以及接收/处理比特流的方法和设备 |
Country Status (4)
Country | Link |
---|---|
US (2) | US8212693B2 (zh) |
EP (2) | EP2477189A1 (zh) |
CN (2) | CN102237094B (zh) |
WO (1) | WO2007043808A1 (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
WO2007043808A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2011132937A2 (en) * | 2010-04-20 | 2011-10-27 | Samsung Electronics Co., Ltd. | Interface apparatus and method for transmitting and receiving media data |
JP6588899B2 (ja) * | 2013-10-22 | 2019-10-09 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 |
CN106131562A (zh) * | 2016-07-27 | 2016-11-16 | 深圳信息职业技术学院 | 一种码流重要性计算方法和装置 |
US10574561B2 (en) * | 2017-10-04 | 2020-02-25 | Cisco Technology, Inc. | Centralized error telemetry using segment routing header tunneling |
DE112020006942T5 (de) | 2020-03-20 | 2023-01-19 | Lg Electronics Inc. | Vorrichtung zur bereitstellung eines audio-streaming-dienstes und verfahren dafür |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1675683A (zh) * | 2002-08-09 | 2005-09-28 | 弗兰霍菲尔运输应用研究公司 | 用于可扩缩编码的设备及方法和用于可扩缩解码的设备及方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6785261B1 (en) * | 1999-05-28 | 2004-08-31 | 3Com Corporation | Method and system for forward error correction with different frame sizes |
US6934756B2 (en) * | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US7403828B2 (en) * | 2002-01-16 | 2008-07-22 | Aviom, Inc. | System and method for transmitting and distributing audio or video data over a network system having multiple receivers |
CN1275467C (zh) * | 2002-04-29 | 2006-09-13 | 中兴通讯股份有限公司 | 运动图像专家组-2传送流的传输方法 |
CN1324851C (zh) * | 2002-06-11 | 2007-07-04 | 汤姆森许可贸易公司 | 适用于动态网络丢失条件的数据通信方法 |
WO2004008806A1 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
KR100528325B1 (ko) | 2002-12-18 | 2005-11-15 | 삼성전자주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 |
KR101141247B1 (ko) * | 2003-10-10 | 2012-05-04 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 디지털 신호를 확장성 비트스트림으로 인코딩하는 방법;확장성 비트스트림을 디코딩하는 방법 |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
KR20070009644A (ko) * | 2004-04-27 | 2007-01-18 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법 |
WO2007043808A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
US8010692B1 (en) * | 2009-11-05 | 2011-08-30 | Adobe Systems Incorporated | Adapting audio and video content for hardware platform |
US8306029B2 (en) * | 2010-03-01 | 2012-11-06 | Avaya Inc. | System and method for detecting sources of rogue non-audio traffic marked as audio traffic |
-
2006
- 2006-10-12 WO PCT/KR2006/004098 patent/WO2007043808A1/en active Application Filing
- 2006-10-12 US US11/546,435 patent/US8212693B2/en active Active
- 2006-10-12 CN CN2011102209802A patent/CN102237094B/zh not_active Expired - Fee Related
- 2006-10-12 EP EP20120164102 patent/EP2477189A1/en not_active Ceased
- 2006-10-12 EP EP06799178A patent/EP1949693B1/en not_active Expired - Fee Related
- 2006-10-12 CN CN2006800382156A patent/CN101288309B/zh not_active Expired - Fee Related
-
2012
- 2012-06-04 US US13/487,600 patent/US20120239409A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1675683A (zh) * | 2002-08-09 | 2005-09-28 | 弗兰霍菲尔运输应用研究公司 | 用于可扩缩编码的设备及方法和用于可扩缩解码的设备及方法 |
Non-Patent Citations (1)
Title |
---|
Juergen Herre and Bernhard Grill."Overview of MPEG-4 Audio and Its Applications in MobileCommunications".Proceedings of ICCT20001.2000,1604-613. * |
Also Published As
Publication number | Publication date |
---|---|
CN101288309A (zh) | 2008-10-15 |
EP2477189A1 (en) | 2012-07-18 |
WO2007043808A1 (en) | 2007-04-19 |
EP1949693A1 (en) | 2008-07-30 |
CN102237094B (zh) | 2013-02-20 |
EP1949693A4 (en) | 2010-05-19 |
CN102237094A (zh) | 2011-11-09 |
US20120239409A1 (en) | 2012-09-20 |
US8212693B2 (en) | 2012-07-03 |
EP1949693B1 (en) | 2012-04-18 |
US20070081536A1 (en) | 2007-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101288309B (zh) | 处理/发送以及接收/处理比特流的方法和设备 | |
JP4004707B2 (ja) | 情報を含む信号のマルチレート符号化のための技法 | |
CN1973320B (zh) | 立体声编码和解码的方法及其设备 | |
CN102123297B (zh) | 用于数字多媒体广播的系统和方法 | |
AU2012270417B2 (en) | Method and apparatus for transmitting/receiving media contents in multimedia system | |
CN101283351B (zh) | 用于媒体数据传输的方法和设备 | |
KR101129387B1 (ko) | Dab 시스템에서 ip 데이터캐스팅 서비스를 제공하는방법 및 장치 | |
TWI333771B (en) | Apparatus for generating and interpreting a data stream modified in accordance with the importance of the data | |
CN1551588B (zh) | 处理音频信号的装置和方法 | |
CN101558643B (zh) | 用于有效地访问广播服务的广播服务发送设备及方法、广播服务接收设备及方法 | |
CN105993180B (zh) | 数据处理装置和数据处理方法 | |
CN106233380A (zh) | 多对象音频的编码后位速率减少 | |
CN104270215B (zh) | 发送/接收系统以及在发送/接收系统中处理数据的方法 | |
US8055500B2 (en) | Method, medium, and apparatus encoding/decoding audio data with extension data | |
EP1608093A1 (en) | Method and apparatus for decoding MOT data | |
KR20090037278A (ko) | 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치 | |
CN116206615A (zh) | 用于压缩声音或声场表示的分层编解码 | |
CA2909801C (en) | Apparatus and method for transmitting and receiving forward error correction packet | |
CN106375778B (zh) | 一种符合数字电影规范的三维音频节目码流传输的方法 | |
MX2010009155A (es) | Transporte de señales vibrocineticas en un entorno de cine digital. | |
KR20030005297A (ko) | Mpeg-4 비디오 데이터를 인코딩하기 위한 방법 및 장치 | |
KR100500196B1 (ko) | 멀티미디어 메타데이터의 오류 내성 부호화/복호화 장치및 방법 | |
Chou et al. | High capacity audio data hiding for noisy channels | |
JPH11220498A (ja) | 信号伝送方法 | |
KR20080099094A (ko) | 계층적 부호화 장치 및 방법, 계층적 복호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110921 Termination date: 20191012 |