CN102237094A - 处理/发送比特流以及接收/处理比特流的方法和设备 - Google Patents

处理/发送比特流以及接收/处理比特流的方法和设备 Download PDF

Info

Publication number
CN102237094A
CN102237094A CN2011102209802A CN201110220980A CN102237094A CN 102237094 A CN102237094 A CN 102237094A CN 2011102209802 A CN2011102209802 A CN 2011102209802A CN 201110220980 A CN201110220980 A CN 201110220980A CN 102237094 A CN102237094 A CN 102237094A
Authority
CN
China
Prior art keywords
payload
data
voice data
intercepting
growth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102209802A
Other languages
English (en)
Other versions
CN102237094B (zh
Inventor
金重会
吴殷美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060067705A external-priority patent/KR20070108302A/ko
Priority claimed from KR1020060095040A external-priority patent/KR100813269B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN102237094A publication Critical patent/CN102237094A/zh
Application granted granted Critical
Publication of CN102237094B publication Critical patent/CN102237094B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Abstract

提供一种处理/发送比特流的方法和设备以及接收/处理比特流的方法和设备。因此,音频数据和扩展数据的净荷可根据优先级被分组并交织,从而去除一些净荷组,并发送剩余组。因此,可根据优先级发送在再现原始声音的情况下比音频数据的顶层更重要的扩展数据。

Description

处理/发送比特流以及接收/处理比特流的方法和设备
本申请是申请日为2006年10月12日、申请号为200680038215.6、发明名称为“处理/发送比特流的方法和设备以及接收/处理比特流的方法和设备”的发明专利申请的分案申请。
本申请要求于2005年10月12日提交的第60/725,317号美国临时专利的权益、于2005年10月14日提交的第60/726,159号美国临时专利的权益、于2006年5月30日在韩国知识产权局提交的第10-2006-0049081号韩国专利申请的优先权、于2006年5月30日在韩国知识产权局提交的第10-2006-0049082号韩国专利申请的优先权、于2006年7月19日在韩国知识产权局提交的第10-2006-0067705号韩国专利申请的优先权、于2006年9月28日在韩国知识产权局提交的第10-2006-0095040号韩国专利申请的优先权,这些公开完整地包含于此,以资参考。
技术领域
本发明涉及一种编码/解码音频数据的方法和设备,更具体地说,涉及一种对音频数据分级编码/解码(诸如比特时间片算术编码(BSAC))的方法和设备。
背景技术
存在发送比特时间片算术编码(BSAC)净荷以支持精细可伸缩性(FGS)的功能的两种方法。一种方法是去除BSAC访问单位的基本流。在这种情况下,所述访问单位被定义为基本流中可被独立访问的部分。所述访问单位是可包含定时信息的最小数据单位。另一种方法是在提供音频数据的服务器侧(即,编码器侧)截取BSAC净荷。前一种方法在同步层和传送层发生,后一种方法在压缩层发生。这两种方法可被同时使用。
发明内容
技术问题
当使用上述发送方法通过在编码器中对音频数据分级编码来将比特流发送到解码器时,通常会发生这样的问题,即,没有能够有效地将分级编码的音频数据和可形成音频数据的扩展数据一起发送的解决方案,所述可形成音频数据的扩展数据诸如用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的循环冗余代码(CRC)的数据。
技术方案
本发明提供一种增强音频数据可伸缩性并且提供反向兼容性以支持传统分级编码方法的设备和方法。
本发明还提供一种用于提供一种解决方案的设备和方法,在所述解决方案中除了考虑音频数据带的可伸缩传输的重要性之外,还考虑扩展数据的重要性。
本发明还提供一种其上实现有执行前述方法的计算机程序的计算机可读介质。
然而,本发明不限于上述方面,还可存在其他方面。本领域技术人员将从以下的描述中清楚地理解。
根据本发明的一方面,提供一种处理/发送比特流的方法,所述方法包括:对音频数据以及音频数据的一个或者多个扩展数据编码;通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和去除分组并交织的一组净荷,并发送剩余净荷组。
根据本发明的另一方面,提供一种其上实现有用于执行所述处理/发送比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种处理/发送比特流的设备,所述设备包括:编码器,对音频数据以及一个或者多个音频数据的扩展数据编码;处理器,通过对从所述编码获得的净荷进行分组,来对所述净荷进行交织;和发送器,去除分组并交织的一组净荷,并发送剩余净荷组。
根据本发明的另一方面,提供一种处理/发送比特流的方法,所述方法包括:对音频数据以及一个或者多个音频数据的扩展数据编码;截取由编码获得的一些净荷;和发送截取的净荷。
根据本发明的另一方面,提供一种其上实现有用于所述执行处理/发送比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种处理/发送比特流的设备,所述设备包括:编码器,对音频数据以及音频数据的一个或者多个扩展数据编码;截取器,截取由编码器的编码获得的一些净荷;和发送器,发送截取的净荷。
根据本发明的另一方面,提供一种接收/处理比特流的方法,所述方法包括:接收分组并交织的一些净荷;将所述分组并交织的净荷恢复为原始形式;和对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种其上实现有用于执行接收/处理比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种接收/处理比特流的设备,所述设备包括:接收器,接收分组并交织的一些净荷;恢复器,将所述分组并交织的净荷恢复为原始形式;和解码器,对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种接收/处理比特流的方法,所述方法包括:接收具有截取部分的净荷;将具有截取部分的所述净荷恢复为原始形式;和对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
根据本发明的另一方面,提供一种其上实现有用于执行所述接收/处理比特流的方法的计算机程序的计算机可读介质。
根据本发明的另一方面,提供一种接收/处理比特流的设备,所述设备包括:接收器,接收具有截取部分的净荷;恢复器,将具有截取部分的所述净荷恢复为原始形式;和解码器,对包括在恢复的净荷中的音频数据以及音频数据的一个或者多个扩展数据解码。
有益效果
根据本发明,音频数据及其扩展数据的净荷可根据优先级被分组和交织,从而去除一些净荷组,并将剩余组发送。因此,可根据优先级发送在再现原始声音的情况下比音频数据的顶层更重要的扩展数据。
此外,对音频数据以及音频数据的扩展数据编码,并截取音频数据的一些净荷。因为将截取的音频数据的净荷与扩展数据的净荷一起发送,所以在很大程度上减少音频数据的总比特率的同时可以适度地降低声音质量。总之,本发明提供了一种这样的解决方案,即,除了考虑音频数据的可伸缩传输的重要性之外,还要考虑扩展数据的重要性。
附图说明
通过以下结合附图对本发明示例性实施例的详细描述,本发明的以上和其他特点和优点将变得更加清楚,其中:
图1是根据本发明实施例的比特流处理/发送设备的框图;
图2示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的示例;
图3示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例;
图4示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例;
图5是根据本发明另一实施例的比特流处理/发送设备的框图;
图6示出了根据本发明实施例的在比特流处理/发送设备中截取净荷的示例;
图7是根据本发明实施例的比特流接收/处理设备的框图;
图8是根据本发明另一实施例的比特流接收/处理设备的框图;
图9是根据本发明实施例的比特流处理/发送方法的流程图;
图10是根据本发明另一实施例的比特流处理/发送方法的流程图;
图11是根据本发明另一实施例的比特流接收/处理方法的流程图;和
图12是根据本发明另一实施例的比特流接收/处理方法的流程图。
具体实施方式
以下,将参照附图描述本发明的示例性实施例。
图1是根据本发明实施例的比特流处理/发送设备的框图。所述比特流处理/发送设备包括:编码器100、净荷处理器110、基本流(ES)产生器120、ES优先级分配单元130、同步层(SL)包产生器140、SL优先级分配单元150和发送器160。
编码器100对音频数据和音频数据的扩展数据分级编码。在这种情况下,可通过使用比特时间片算术编码(BSAC)方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的循环冗余代码(CRC)的数据。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素(fill element)。当音频数据的扩展数据被编码时,编码器100可对音频数据的扩展数据的前述示例中的至少一个编码。
当对于净荷发送方法中的使用访问单位的方法去除基本流时,净荷处理器110对净荷分组并交织,从而包括在由编码器100的编码而获得的一个子帧中的一些净荷和包括在另一个子帧中的一些净荷属于一组。在MPEG标准中,所述访问单位被定义为基本流中可被独立访问的部分,并且是可包含定时信息的最小数据单位。
ES产生器120从由净荷处理器110分组并交织的净荷产生与压缩层上的净荷组相应的基本流。所述压缩层被定义为接收编码器100的编码结果并因此产生基本流的层。
ES优先级分配单元130为ES产生器120产生的基本流分配优先级。更具体地说,ES优先级分配单元130根据解码器侧的发送优先级为各个基本流分配优先级。因此,ES产生器120产生的各个基本流具有在ES描述符中指定的优先级。
SL包产生器140从ES产生器120产生的基本流产生与同步层上的净荷组相应的SL包。同步层被定义为产生通过调节基本流提供音频数据编码器和音频数据解码器之间的同步信息的SL包的层。
SL优先级分配单元150为SL包产生器140产生的各个SL包分配优先级。更具体地说,SL优先级分配单元150根据解码器侧的发送优先级为各个SL包分配优先级。由ES优先级分配单元130分配给各个基本流的优先级和由SL优先级分配单元150分配给各个SL包的优先级可以实现在同步层和传送层上为可伸缩传输去除一些基本流。
发送器160根据由ES优先级分配单元130分配给各个基本流的优先级和由SL优先级分配单元150分配给各个SL包的优先级去除一些SL包并发送剩余的SL包。更具体地说,发送器160通过考虑编码器侧和解码器侧之间的传输环境确定发送SL包的总比特率。此外,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除SL包,并发送剩余的SL包。
图2示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的示例。
图2的示例示出了音频数据的扩展数据是用于将音频数据的声道扩展为多声道的数据时的BSAC音频数据及其扩展数据的可伸缩传输。即,这个示例显示了与“BSAC声道扩展”相应的BSAC净荷的可伸缩传输。
在图2所示的示例中,子帧的数量被设置为2,并且去除具有低优先级的4个SL包。然而,在本发明中子帧的数量不限于2,因此,可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。去除的包对应于包括在与音频数据的扩展数据对应的中央(C)声道和左环绕(SL)声道/右环绕(SR)声道中的音频数据的BSAC净荷的顶层。因此,可通过允许根据每个声道的音频数据的优先级发送与低频带对应的基本层来均匀地再现每个声道的音频数据。
在图2中,净荷处理器110对通过编码器100的编码而获得的BSAC净荷进行分组并交织,从而音频数据的一些净荷与用于扩展音频数据的声道的数据的一些净荷属于一组。
例如,如果在本实施例中使用5.1声道音频数据,则净荷处理器110对净荷进行分组和交织,从而基本层LL0_0和基本层LL1_0属于一组,其中,基本层LL0_0包括在通过编码器100针对左前(FL)声道和右前(FR)声道的编码而获得的FL声道和FR声道的音频数据的每层的净荷中,而基本层LL1_0包括在通过编码器100针对SL声道和SR声道的编码而获得的SL声道和SR声道的音频数据的每层的BSAC净荷中。
此外,净荷处理器110对净荷进行分组和交织,从而顶层LL0_1和顶层LL1_1属于一组,其中,顶层LL0_1包括在通过编码器100针对FL声道和FR声道的编码而获得的FL声道和FR声道的音频数据的每层的BSAC净荷中,而顶层LL1_1包括在通过编码器100针对SL声道和SR声道的编码而获得的SL声道和SR声道的音频数据的每层的BSAC净荷中。
ES产生器120根据已由净荷处理器110分组并交织为一组的净荷LL0_0和净荷LL1_0产生第0基本流。随后,ES优先级分配单元130为ES产生器120产生的第0基本流分配优先级9。SL包产生器140根据ES产生器120产生的第0基本流产生两个SL包。其后,SL优先级分配单元150为SL包产生器140产生的各个SL包分配优先级0。同样地,对图2所示的剩余净荷进行相同处理。
根据SL包的发送的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除4个SL包,并发送剩余的SL包。
图3示出了根据本发明实施例的在比特流处理/发送设备中去除基本流的另一示例。
图3的示例示出当立体声音频数据的扩展数据是用于扩展音频数据的带宽的数据时音频数据及其扩展数据的可伸缩传输。即,这个示例示出了从使用“BSAC频带复制(SBR)增强”执行的编码获得的BSAC净荷的可伸缩传输。
在图3所示的示例中,子帧的数量被设置为2,并且去除具有低优先级的2个SL包。然而,在本发明中子帧的数量不限于2,因此,可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。去除的包对应于包括在第一子帧中的立体声音频数据的每层的BSAC净荷的顶层和包括在第二子帧中的立体声音频数据的每层的BSAC净荷的顶层。因此,通过增加去除的SL包可降低将被发送的总比特率。待发送的总比特率被减少并导致使用SBR工具重构与顶层相关的高频信号的声音质量适当地降低。
在图3中,净荷处理器110对从编码器100的编码获得的BSAC净荷进行分组和交织,从而包括在第一子帧中的音频数据的一些BSAC净荷和包括在第二子帧中的音频数据的一些BSAC净荷属于一组,而包括在第一子帧中的用于扩展音频数据的带宽的数据的净荷和包括在第二子帧中的用于扩展音频数据的带宽的数据的净荷属于一组。
例如,如果在本实施例中使用立体声音频数据,则净荷处理器110对净荷进行分组和交织,从而基本层LL0_0和基本层LL1_0属于一组,其中,基本层LL0_0包括在编码器100针对FL声道和FR声道进行编码而获得的第一子帧中包括的FL声道和FR声道的音频数据的每层的BSAC净荷中,而基本层LL1_0包括在第二子帧中包括的FL声道和FR声道的音频数据的每层的BSAC净荷中。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。
此外,净荷处理器110对净荷分组并交织,从而BSAC净荷LL0_3和BSAC净荷LL1_3属于一组,其中,BSAC净荷LL0_3包括在从编码器100的编码获得的第一子帧中包括的用于扩展FL声道和FR声道的音频数据的带宽的数据中,而BSAC净荷LL1_3包括在第二子帧中包括的用于扩展FL声道和FR声道的音频数据的带宽的数据中。
ES产生器120根据已由净荷处理器110分组并交织的为一组的净荷LL0_0和净荷LL1_0产生第0基本流。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。
此外,ES产生器120根据已由净荷处理器110分组并交织的为一组的净荷LL0_3和净荷LL1_3产生第3基本流。随后,ES优先级分配单元130为由ES产生器120产生的第0基本流分配优先级9。同样地,对FL声道和FR声道的音频数据的剩余层进行相同处理。此外,ES优先级分配单元130为由ES产生器120产生的第3基本流分配优先级3。
其后,SL包产生器140根据由ES产生器120产生的各个基本流来产生2个SL包。随后,SL优先级分配单元150为由SL包产生器140产生的各个SL包分配优先级。根据SL包传输的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除2个SL包,并发送剩余的SL包。
图4示出了根据本发明实施例的比特流处理/发送设备中去除基本流的另一示例。
图4的示例示出了当音频数据的扩展数据是用于扩展音频数据的声道的数据时BSAC音频数据及其扩展数据的可伸缩传输。即,这个示例示出了使用“SBR的BSAC声道扩展”的可伸缩传输。
在图4所示的示例中,具有低优先级的4个SL包被去除。然而,在本发明中子帧的数量不限于1,因此可以使用一个或者多个子帧。此外,去除的SL包的数量可根据情况而改变。
在图4中,净荷处理器110对经编码器100的编码获得的净荷进行分组和交织,从而音频数据的一些BSAC净荷、用于将音频数据的声道扩展为多声道的数据的一些净荷、以及用于扩展音频数据的带宽的净荷属于一组。
ES产生器120根据已由净荷处理器110分组并交织为一组的净荷LL0_0产生第0基本流。随后,ES优先级分配单元130为由ES产生器120产生的第0基本流分配优先级9。SL包产生器140根据ES产生器120产生的第0基本流包产生两个SL包。其后,SL优先级分配单元150为由SL包产生器140产生的各个SL包分配优先级0和1。同样地,对图4所示的剩余净荷进行相同的处理。
根据SL包的传输的总比特率,发送器160按照通过从基本流的优先级减去SL包的优先级获得的值的降序去除4个SL包,并发送剩余的SL包。
图5是根据本发明另一实施例的比特流处理/发送设备的框图。所述比特流处理/发送设备包括:编码器500、净荷处理器510、ES产生器520、ES优先级分配单元530、SL包产生器540、SL优先级分配单元550和发送器560。
编码器500对音频数据和音频数据的扩展数据进行分级编码。在这种情况下,可根据BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当音频数据的扩展数据被编码时,编码器500可对音频数据的扩展数据的前述示例中的至少一个进行编码。
净荷处理器510通过考虑编码器侧和解码器侧之间的传输环境(例如,通过考虑可根据后声道的净荷确定的层数)截取包括在经编码器500编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷。
净荷处理器510使用“轻量服务器处理”截取一些净荷。在本实施例中,轻量服务器处理被定义为截取一些净荷所需的附加处理,例如,解析比特流。因为在BSAC净荷发送方法中,与为访问单位去除基本流的方法相比,对净荷的处理和传输相对简单,所以使用术语“轻量”。
此外,净荷处理器510仅截取音频数据的一些净荷,并不截取音频数据的扩展数据的净荷。因此,净荷处理器510通过解析比特流将音频数据的净荷与扩展数据的净荷分离,并且根据分离的结果仅截取不属于扩展数据的一些净荷。
在BASC中可以为这种分离使用“zero_code”和“sync_word”。即,净荷处理器510通过使用“zero_code”和“sync_word”识别扩展数据的净荷,并且仅截取不属于扩展数据的净荷的一些净荷。净荷处理器510将“zero_code”和“sync_word”连接到截取的净荷的末尾,从而当音频数据解码器检查到“zero_code”和“sync_word”时可从发送的基本流(ES)中提取访问单位。如果不存在扩展数据的净荷,则因为不需要前述分离所以处理相当简单。
此外,净荷处理器510通过考虑编码器侧和解码器侧之间的传输环境确定目标比特率,根据目标比特率计算目标层的数量,并根据目标层的数量截取一些净荷。
ES产生器520根据由净荷处理器510截取的净荷产生与压缩层上的净荷组相应的一个基本流,并且还根据扩展数据的净荷产生另一基本流。ES优先级分配单元530为由ES产生器520产生的基本流分配优先级。随后,SL包产生器540根据由ES产生器520产生的基本流产生与同步层上的净荷组相应的SL包。SL优先级分配单元550为由SL包产生器540产生的各个SL包分配优先级。发送器560发送由SL包产生器540产生的SL包。如上所述,根据本实施例不对ES产生器520、SL包产生器540和发送器560进行用于可伸缩传输的特殊处理。
图6示出了根据本发明实施例的在比特流处理/发送设备中截取净荷的示例。
图6的示例示出了当立体声音频数据的扩展数据是用于扩展音频数据的带宽的数据时音频数据及其扩展数据的可伸缩传输。即,这个示例示出了从使用“BSAC SBR增强”执行的编码获得的净荷的可伸缩传输。
参照图6,子帧的数量被设置为2。在这种情况下,净荷处理器510截取包括在第一子帧中的立体声音频数据的每层的净荷LL0_0的一部分和包括在第二子帧中的立体声音频数据的每层的净荷LL1_0的一部分。ES产生器520根据由净荷处理器510截取的净荷LL0_0和LL1_0产生第0基本流,并根据用于扩展音频数据的带宽的数据LL0_0和LL1_0产生第一基本流。
图7是根据本发明实施例的比特流接收/处理设备的框图。所述比特流接收/处理设备包括:接收器700、ES恢复器710、净荷恢复器720和解码器730。根据图7所示的配置,可以实现去除基本流的方法。
接收器700经输入端IN接收特定包格式的比特流,因此接收SL包,所述SL包包括由图1的比特流处理/发送设备分组和交织的一些净荷。根据本实施例,接收器700接收作为一组的包括在一个子帧中的一些净荷和包括在另一个子帧中的一些净荷。
在图2中所示的示例性情况下,接收器700接收作为一组的音频数据的每层的BSAC的净荷的基本层和用于扩展该音频数据的声道的数据的每层的净荷的基本层。此外,接收器700接收音频数据的每层的净荷的顶层和用于扩展该音频数据的声道的数据的每层的净荷的顶层。
在图3中所示的示例性情况下,接收器700接收作为一组的包括在一个子帧中的音频数据的一些BSAC净荷和包括在另一子帧中的音频数据的一些BSAC净荷。此外,接收器700接收作为一组的包括在一个子帧中的用于扩展音频数据的带宽的数据的净荷和包括在另一子帧中的用于扩展音频数据的带宽的数据的净荷。
ES恢复器710在SL层对由接收器700接收的SL包进行解析,因此恢复包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流。SL层被定义为用于执行将音频数据编码器和音频数据解码器进行同步所需的操作(例如,从SL包中提取音频数据编码器和音频数据解码器之间的同步信息的操作)的层。
净荷恢复器720通过对由ES恢复器710恢复的基本流进行解析来将净荷恢复为原始形式。即,净荷恢复器720通过使用包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流来将所述净荷恢复为原始形式。压缩层被定义为用于执行从基本流解码净荷所需的操作的层。
具体来说,净荷恢复器720通过使用关于包括在由ES恢复器710恢复的基本流中的净荷的头信息,根据层的数量、长度和顺序获得关于净荷的信息,其中,所述头信息包括关于由图1的比特流处理/发送设备分组并交织的净荷的信息。此后,通过使用获得的信息,净荷恢复器720将如上所述作为一组接收的净荷解交织,从而恢复一个子帧,并随后恢复另一子帧。
在图2所示的示例性情况中,净荷恢复器720通过将如上所述作为一组接收的净荷解交织来恢复音频数据的每层的BSAC净荷,并且还恢复用于扩展音频数据的声道的数据的每层的BSAC净荷。
在图3所示的示例性情况中,净荷恢复器720通过将如上所述作为一组接收的净荷解交织来恢复音频数据的每层的BSAC净荷,并且还恢复用于扩展音频数据的带宽的数据的净荷。
解码器730对包括在由净荷恢复器720恢复的每层的净荷中的音频数据进行分级解码。此外,解码器730对音频数据的扩展数据解码,所述音频数据的扩展数据包括用于将由净荷恢复器720恢复的音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
图8是根据本发明另一实施例的比特流接收/处理设备的框图。所述比特流接收/处理设备包括:接收器800、ES恢复器810、净荷恢复器820和解码器830。根据图8所示的配置,可以实现截取净荷的方法。
接收器800经输入端IN接收特定包格式的比特流,因此接收具有由图1的编码器截取的一部分的净荷和包括音频数据的扩展数据的净荷的SL包。根据本实施例,接收器800接收作为一组的包括在一个子帧中的一些净荷和包括在另一个子帧中的一些净荷。
ES恢复器810在SL层对由接收器800接收的SL包进行解析,因此恢复包括具有由图1的编码器截取的一部分的净荷的基本流,并且还恢复包括音频数据的扩展数据的净荷的基本流。
净荷恢复器820通过对由ES恢复器810恢复的基本流进行解析来将净荷恢复为原始形式。即,净荷恢复器820通过使用净荷来将所述净荷恢复为原始形式,其中,音频数据的一些净荷由图1的比特流处理/发送设备截取,并且不截取扩展数据的净荷。
具体来说,净荷恢复器820从包括在由ES恢复器810恢复的一个基本流中的具有截取的音频部分的净荷和包括在另一个基本流中的扩展数据的净荷来恢复包括具有截取的部分的净荷和扩展数据的净荷的一个子帧。
解码器830对包括在由净荷恢复器820恢复的每层的净荷中的音频数据分级解码。此外,解码器830对音频数据的扩展数据解码,所述音频数据的扩展数据包括用于将由净荷恢复器820恢复的音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据传输错误的CRC代码的数据中的至少一个。除了前述扩展数据,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
在图3所示的示例性情况中,净荷恢复器820使用音频数据的净荷,其中截取一些净荷,而不截取用于扩展音频数据的带宽的数据的净荷,从而将所述净荷恢复为原始形式。更具体地说,净荷恢复器820从包括在一个基本流中的具有截取的音频部分的净荷和包括在另一个基本流中的用于扩展音频数据的带宽的数据的净荷来恢复包括具有截取的部分的净荷和用于扩展音频数据的带宽的数据的净荷的一个子帧。
图9是根据本发明实施例的比特流处理/发送方法的流程图。
参照图9,所述比特流处理/发送方法包括在图1的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图1的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,音频数据和音频数据的扩展数据被分级编码(操作900)。在这个操作中,可使用BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当在操作900中音频数据的扩展数据被编码时,音频数据的扩展数据的前述示例中的至少一个可被编码。
对净荷进行分组和交织,从而包括在从操作900的编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷属于一组(操作910)。根据在操作910中分组并交织的净荷产生与压缩层上的净荷组相应的基本流(操作920)。
为在操作920产生的基本流分配优先级(操作930)。
根据在操作930产生的基本流产生与同步层上的净荷组相应的SL包(操作940)。
为在操作940中产生的各个SL包分配优先级(操作950)。
根据在操作930和950分配的优先级,去除一些SL包,并且发送剩余的SL包(操作960)。
图10是根据本发明另一实施例的比特流处理/发送方法的流程图。
参照图10,所述比特流处理/发送方法包括在图5的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图5的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,音频数据和音频数据的扩展数据被分级编码(操作1000)。在这个操作中,可使用BSAC方法对音频数据编码。音频数据的扩展数据的示例包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。当在操作1000中音频数据的扩展数据被编码时,音频数据的扩展数据的前述示例中的至少一个可被编码。
在操作1000之后,通过考虑编码器侧和解码器侧之间的传输环境(例如,通过考虑根据后声道的净荷可被确定的层的数量),来一起截取包括在从操作1000中的编码获得的一个子帧中的一些净荷和包括在另一子帧中的一些净荷(操作1010)。
根据在操作1010截取的净荷产生与压缩层上的净荷组相应的一个基本流,并且还根据扩展数据的净荷产生另一基本流(操作1020)。
根据在操作1020产生的基本流来产生与SL层上的净荷组相应的SL包(操作1030)。
发送在操作1030产生的SL包(操作1040)。
图11是根据本发明实施例的比特流接收/处理方法的流程图。
参照图11,所述比特流接收/处理方法包括在图7的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图7的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,接收到包括图1和图5的比特流处理/发送设备分组并交织的一些净荷的SL包(操作1100)。
通过对在操作1100接收到的SL包进行解析来恢复包括由图1的比特流处理/发送设备分组并交织的一些净荷的基本流(操作1110)。
通过使用关于在操作1110中恢复的基本流中包括的净荷的头信息,根据层的数量、长度和顺序获得关于净荷的信息,其中,所述头信息包括关于由图1和图5的比特流处理/发送设备分组并交织的净荷的信息(操作1120)。
通过使用在操作1120中获得的信息对包括在基本流中的净荷进行解交织来将净荷恢复为原始形式(操作1130)。
在操作1130中恢复的每层的净荷中包括的音频数据和所述音频数据的扩展数据被分级解码(操作1140)。此外,在这个操作中,音频数据的扩展数据被解码,所述音频数据的扩展数据包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
图12是根据本发明另一实施例的比特流接收/处理方法的流程图。
参照图12,所述比特流接收/处理方法包括在图8的比特流处理/发送设备中顺序执行的多个操作。因此,尽管省略,还是将对图8的比特流处理/发送设备的上述描述应用到根据本实施例的比特流处理/发送方法。
首先,接收到包括图1和图5的比特流处理/发送设备分组并交织的一些净荷的SL包(操作1200)。
通过在SL层对在操作1200接收到的SL包进行解析来恢复包括具有由图1和图5的比特流处理/发送设备截取的一部分的净荷的基本流,并且还恢复包括音频数据的扩展数据的净荷的基本流。
通过对在操作1210中恢复的基本流进行解析将净荷恢复为原始形式(操作1220)。具体来说,在本实施例的比特流接收/处理方法中,从包括在一个基本流中的具有截取的音频数据部分的净荷和包括在另一个基本流中的用于扩展音频数据的带宽的数据的净荷,恢复包括具有截取的部分的净荷和用于扩展音频数据的带宽的数据的净荷的一个子帧。
在操作1220中恢复的每层的净荷中包括的音频数据和音频数据的扩展数据被分级解码(操作1230)。此外,在这个操作中,音频数据的扩展数据被解码,所述音频数据的扩展数据包括:用于将音频数据的声道扩展为多声道的数据、用于扩展音频数据的带宽的数据和用于产生检查音频数据的传输错误的CRC代码的数据中的至少一个。除了前述扩展数据之外,音频数据的扩展数据还可以是音频数据的元数据或者可包括音频数据的填充元素。
本发明的实施例可被编写为计算机程序,并可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。本发明还可被实施为计算机可读记录介质上的计算机可读代码。
所述计算机可读记录介质是任何可存储其后能由计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置和载波(诸如通过互联网的数据传输)。
尽管已经参照本发明示例性实施例具体显示和描述了本发明,但是本领域技术人员应当理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在形式和细节上做出各种改变。所述示例性实施例应被理解为仅用于描述性意义,而非限定的目的。因此本发明的范围不由本发明的详细描述限定,而是由权利要求限定,并且所述范围内的所有不同将被认为包括在本发明中。

Claims (22)

1.一种处理/发送比特流的方法,所述方法包括:
对音频数据和音频数据的一个或者多个扩展数据编码;
截取通过编码获得的一些净荷;和
发送截取的净荷。
2.如权利要求1所述的方法,其中,在截取步骤中,截取音频数据的一些净荷,而不截取扩展数据的净荷。
3.如权利要求1所述的方法,其中:
在编码步骤中,音频数据被分级编码,并且用于扩展音频数据的带宽的数据被编码;和
在截取步骤中,截取音频数据的一些净荷,并且不截取用于扩展音频数据的带宽的数据的净荷。
4.如权利要求1所述的方法,截取步骤还包括:
截取包括在一个子帧中的音频数据的一些净荷和包括在另一子帧中的音频数据的一些净荷,并且根据截取的净荷产生基本流。
5.如权利要求1所述的方法,还包括:
根据包括在一个子帧中的用于扩展音频数据的带宽的数据的净荷和包括在另一子帧中的用于扩展音频数据的带宽的数据的净荷产生基本流。
6.如权利要求1所述的方法,还包括:
根据截取的净荷产生基本流;和
根据产生的基本流产生同步层包,
其中,在发送的步骤中,发送产生的同步层包。
7.如权利要求1所述的方法,还包括:
根据扩展数据的净荷产生基本流;和
根据产生的基本流产生同步层包,
其中,在发送步骤中,发送产生的同步层包。
8.如权利要求1所述的方法,其中,在截取步骤中,通过使用指示音频数据的编码部分的末尾的代码和指示音频数据的扩展数据的编码部分的开始的代码来识别扩展数据的编码部分,并且根据识别结果截取所述扩展数据的编码部分。
9.如权利要求1所述的方法,其中,在截取步骤中,通过考虑传输环境来截取一些净荷。
10.一种处理/发送比特流的设备,所述设备包括:
编码器,对音频数据和音频数据的一个或者多个扩展数据编码;
截取器,截取通过由编码器器进行编码获得的一些净荷;和
发送器,发送截取的净荷。
11.一种接收/处理比特流的方法,所述方法包括:
接收具有截取部分的净荷;
将具有截取部分的净荷恢复为原始形式;和
对包括在恢复的净荷中的音频数据和音频数据的扩展数据解码。
12.如权利要求11所述的方法,其中,在恢复步骤中,通过使用截取的多个净荷来将所述净荷恢复为原始形式,在所述净荷中,音频数据的一些净荷被截取,并且扩展数据的净荷没有被截取。
13.如权利要求11所述的方法,其中,在恢复的步骤中,通过使用净荷来将所述净荷恢复为原始形式,在所述净荷中,音频数据的一些净荷被截取,并且用于扩展音频数据的带宽的数据的净荷没有被截取。
14.如权利要求11所述的方法,其中,在恢复的步骤中,通过对用于扩展音频数据的带宽的数据解码来恢复所述一些净荷。
15.如权利要求11所述的方法,还包括:
通过将关于具有截取部分的净荷的头信息中包括的音频数据的长度信息与音频数据的实际大小进行比较,来确定是否截取了一些净荷,
其中,在解码步骤中,基于确定的结果恢复所述一些净荷。
16.如权利要求11所述的方法,其中,在解码步骤中,包括在恢复的净荷中的音频数据被分级解码,并且对用于扩展音频数据的带宽的数据解码。
17.如权利要求11所述的方法,其中,在恢复步骤中,从包括在一个基本流中的具有截取的音频数据部分的净荷和包括在另一基本流中的扩展数据的净荷恢复包括具有截取部分的净荷和扩展数据的净荷的一个子帧。
18.如权利要求11所述的方法,其中,在恢复步骤中,从包括在一个基本流中的具有截取的音频数据部分的净荷和用于扩展音频数据的带宽的数据的净荷恢复包括具有截取部分的净荷和用于扩展音频数据的带宽的数据的净荷的一个子帧。
19.如权利要求11所述的方法,接收步骤还包括:
接收包括具有截取部分的净荷的同步层包和包括扩展数据的净荷的同步层包,并且通过对接收的同步层包进行解析来恢复包括具有截取部分的净荷的基本流和包括扩展数据的净荷的基本流,
其中,在恢复步骤中,通过对恢复的基本流进行解析来恢复包括具有截取部分的净荷和扩展数据的净荷的一个子帧。
20.如权利要求11所述的方法,其中,在恢复步骤中,检测指示音频数据的编码部分的末尾的代码和指示音频数据的扩展数据的编码部分的开始的代码,从而识别扩展数据的编码部分的开始点,并且基于识别结果对所述扩展数据解码。
21.如权利要求11所述的方法,其中,在解码步骤中,基于关于扩展数据的长度信息来识别扩展数据的编码部分的末尾点,并基于识别结果对扩展数据解码。
22.一种接收/处理比特流的设备,所述设备包括:
接收器,接收具有截取部分的净荷;
恢复器,将具有截取部分的净荷恢复为原始形式;和
解码器,对包括在恢复的净荷中的音频数据和音频数据的一个或者多个扩展数据解码。
CN2011102209802A 2005-10-12 2006-10-12 处理/发送比特流以及接收/处理比特流的方法和设备 Expired - Fee Related CN102237094B (zh)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US72531705P 2005-10-12 2005-10-12
US60/725,317 2005-10-12
US72615905P 2005-10-14 2005-10-14
US60/726,159 2005-10-14
KR20060049081 2006-05-30
KR10-2006-0049081 2006-05-30
KR10-2006-0049082 2006-05-30
KR20060049082 2006-05-30
KR1020060067705A KR20070108302A (ko) 2005-10-14 2006-07-19 오디오 데이터의 확장에 대한 스케러빌러티를 지원하는부호화 방법 및 장치, 그 복호화 방법 및 장치
KR10-2006-0067705 2006-07-19
KR10-2006-0095040 2006-09-28
KR1020060095040A KR100813269B1 (ko) 2005-10-12 2006-09-28 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2006800382156A Division CN101288309B (zh) 2005-10-12 2006-10-12 处理/发送以及接收/处理比特流的方法和设备

Publications (2)

Publication Number Publication Date
CN102237094A true CN102237094A (zh) 2011-11-09
CN102237094B CN102237094B (zh) 2013-02-20

Family

ID=44887680

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2006800382156A Expired - Fee Related CN101288309B (zh) 2005-10-12 2006-10-12 处理/发送以及接收/处理比特流的方法和设备
CN2011102209802A Expired - Fee Related CN102237094B (zh) 2005-10-12 2006-10-12 处理/发送比特流以及接收/处理比特流的方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2006800382156A Expired - Fee Related CN101288309B (zh) 2005-10-12 2006-10-12 处理/发送以及接收/处理比特流的方法和设备

Country Status (4)

Country Link
US (2) US8212693B2 (zh)
EP (2) EP2477189A1 (zh)
CN (2) CN101288309B (zh)
WO (1) WO2007043808A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105814630A (zh) * 2013-10-22 2016-07-27 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN101288309B (zh) * 2005-10-12 2011-09-21 三星电子株式会社 处理/发送以及接收/处理比特流的方法和设备
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN102860021B (zh) * 2010-04-20 2017-06-20 三星电子株式会社 用于传送和接收媒体数据的接口装置和方法
CN106131562A (zh) * 2016-07-27 2016-11-16 深圳信息职业技术学院 一种码流重要性计算方法和装置
US10574561B2 (en) * 2017-10-04 2020-02-25 Cisco Technology, Inc. Centralized error telemetry using segment routing header tunneling
DE112020006942T5 (de) 2020-03-20 2023-01-19 Lg Electronics Inc. Vorrichtung zur bereitstellung eines audio-streaming-dienstes und verfahren dafür

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785261B1 (en) * 1999-05-28 2004-08-31 3Com Corporation Method and system for forward error correction with different frame sizes
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
JP2005516485A (ja) * 2002-01-16 2005-06-02 アビオム,インコーポレイティド 複数レベルの保護を使用するオーディオ又はビデオデータを送信するシステム及び方法
CN1275467C (zh) * 2002-04-29 2006-09-13 中兴通讯股份有限公司 运动图像专家组-2传送流的传输方法
US20050249240A1 (en) * 2002-06-11 2005-11-10 Boyce Jill M Multimedia server with simple adaptation to dynamic network loss conditions
KR20050021484A (ko) 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US8446947B2 (en) * 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
WO2005112005A1 (ja) 2004-04-27 2005-11-24 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
CN101288309B (zh) * 2005-10-12 2011-09-21 三星电子株式会社 处理/发送以及接收/处理比特流的方法和设备
US8010692B1 (en) * 2009-11-05 2011-08-30 Adobe Systems Incorporated Adapting audio and video content for hardware platform
US8306029B2 (en) * 2010-03-01 2012-11-06 Avaya Inc. System and method for detecting sources of rogue non-audio traffic marked as audio traffic

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105814630A (zh) * 2013-10-22 2016-07-27 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思

Also Published As

Publication number Publication date
EP1949693A4 (en) 2010-05-19
WO2007043808A1 (en) 2007-04-19
US8212693B2 (en) 2012-07-03
EP2477189A1 (en) 2012-07-18
EP1949693B1 (en) 2012-04-18
US20120239409A1 (en) 2012-09-20
US20070081536A1 (en) 2007-04-12
CN101288309B (zh) 2011-09-21
EP1949693A1 (en) 2008-07-30
CN102237094B (zh) 2013-02-20
CN101288309A (zh) 2008-10-15

Similar Documents

Publication Publication Date Title
CN102237094B (zh) 处理/发送比特流以及接收/处理比特流的方法和设备
CN1973320B (zh) 立体声编码和解码的方法及其设备
CN101218799B (zh) 在数字音频广播系统提供ip数据广播服务的方法和设备
US7260722B2 (en) Digital multimedia watermarking for source identification
CN101675435B (zh) 将媒体流记录到多媒体容器文件的接收索引轨道中
JP4004707B2 (ja) 情報を含む信号のマルチレート符号化のための技法
CN101283351B (zh) 用于媒体数据传输的方法和设备
TWI333771B (en) Apparatus for generating and interpreting a data stream modified in accordance with the importance of the data
CN1551588B (zh) 处理音频信号的装置和方法
CN101288117B (zh) 对音频数据和扩展数据进行编码/解码的方法和设备
CN105993180B (zh) 数据处理装置和数据处理方法
CN106233380A (zh) 多对象音频的编码后位速率减少
CN103299366A (zh) 用于编码及检测带水印信号的装置
CN1592126A (zh) 数字多媒体广播接收机和用于再现数字多媒体数据的方法
CN105765943B (zh) 发送广播信号的装置、接收广播信号的装置、发送广播信号的方法和接收广播信号的方法
EP1608093A1 (en) Method and apparatus for decoding MOT data
CN102760440A (zh) 语音信号的发送、接收装置及方法
CN106375778B (zh) 一种符合数字电影规范的三维音频节目码流传输的方法
KR100500196B1 (ko) 멀티미디어 메타데이터의 오류 내성 부호화/복호화 장치및 방법
KR20030005297A (ko) Mpeg-4 비디오 데이터를 인코딩하기 위한 방법 및 장치
JPH11220498A (ja) 信号伝送方法
KR100813269B1 (ko) 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
KR100682910B1 (ko) Mpeg-4 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130220

Termination date: 20191012