CN101160726A - 对参数进行自适应分组以获得提高的编码效率 - Google Patents

对参数进行自适应分组以获得提高的编码效率 Download PDF

Info

Publication number
CN101160726A
CN101160726A CNA2006800120933A CN200680012093A CN101160726A CN 101160726 A CN101160726 A CN 101160726A CN A2006800120933 A CNA2006800120933 A CN A2006800120933A CN 200680012093 A CN200680012093 A CN 200680012093A CN 101160726 A CN101160726 A CN 101160726A
Authority
CN
China
Prior art keywords
tuple
parameter
sequence
parameter set
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800120933A
Other languages
English (en)
Other versions
CN101160726B (zh
Inventor
拉尔夫·施佩尔施奈德
于尔根·赫勒
卡斯滕·林茨迈尔
约翰内斯·希尔珀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN101160726A publication Critical patent/CN101160726A/zh
Application granted granted Critical
Publication of CN101160726B publication Critical patent/CN101160726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Discrete Mathematics (AREA)
  • Computing Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明基于如下发现:当包括具有原始信号第一部分的表示的第一参数集和具有原始信号第二部分的表示的第二参数集的参数被布置在第一元组序列和第二元组序列中时,可进行有效的编码,其中,所述第一元组序列包括具有来自所述原始信号的单一部分的两个参数的参数元组,而所述第二元组序列包括具有来自所述原始信号第一部分的一个参数以及来自所述原始信号第二部分的一个参数的参数元组。使用比特估测器来估测对所述第一和第二元组序列进行编码所需的比特数,从而能够实现有效的编码,其中,仅对导致较少比特数的元组序列进行编码。

Description

对参数进行自适应分组以获得提高的编码效率
技术领域
本发明涉及参数的无损编码,具体涉及针对有效参数压缩的编码规则的产生和使用。
背景技术
最近以来,多通道音频再现技术越来越显重要,这或许是因为如下事实:例如目前已为人熟知之mp3技术的音频压缩/编码技术,使得利用网络或者其它具有有限带宽的传输通道来分发音频记录成为可能。该mp3编码技术之所以会变的这么有名,系因为如下事实:它可以以立体声格式,亦即以包含第一或者左立体声通道以及第二或者右立体声通道的音频记录的数字表示,来分发记录。
然而,传统的二声道系统有其基本的缺点,因此,开发出环绕声技术。一种推荐的多通道环绕声表示除了包括两个立体声通道L以及R以外,还包括额外的中央通道C以及两个环绕声道Ls、Rs。该参考声音格式也称为三/二立体声,意谓其具有三个前端通道以及两个环绕声道。一般说来,五个传输通道是必须的。在重放环境中,至少需要把五个扬声器放在五个适当的位置,以获得距离该五个已经适当放置的扬声器特定距离的最佳甜美音点。
已经有许多为人熟知的技术,可以用来降低传输多通道音频信号所需要的数据量,这些技术称为联合立体声技术。为此目的,请参考第9图,其中显示了一联合立体声设备60。该设备可以是一个用来实行强度立体声(intensity stereo简写为IS)或者立体声提示编码(binauralcue coding简写为BCC)的设备。这样的一个设备通常会接收至少两个通道(CH1、CH2、…CHn)作为输入,并输出至少是单一载波通道以及参数数据。对该参数数据进行定义,使得在解码器中能够计算原始通道(CH1、CH2、…CHn)的逼近(approximation)。
一般说来,该载波通道会包含子波段采样、频谱系数、时域采样等,如此一来可以提供基础(underlying)信号的比较良好的表示,而参数数据不包含该频谱系数的采样,但包括控制参数,以控制特定的重建算法,例如乘法加权、时间平移、频率平移、相位平移等。该参数数据因此仅包含该信号或者与其关连的通道的比较粗糙的表示。若以数字来表示,载波通道所需的数据量大约在60kbit/s至70kbit/s的范围内。而一个通道的参数辅助信息所需要的数据量典型地在1.5kbit/s至2.5kbit/s的范围内。几种为人熟知的参数数据包括:缩放因子、强度立体声信息或者立体声提示参数,如同下文所述。
举例而言,BCC技术在下列文章中有所叙述:AES convention paper5574,“Binaural Cue Coding applied to Stereo and Multi-ChannelAudio Compression”,C.Faller,F.Baumgarte,May 2002,Munich;IEEEWASPAA Paper“Efficient representation of spatial audio usingperceptual parametrization”,0ctober 2001,Mohonk,NY;“Binauralcue coding applied to audio compression with flexible rendering”,C.Faller and F.Baumgarte,AES 113th Convention,LosAngeles,Preprint 5686,October 2002;以及“Binaural cuecoding-Part II:Schemes and applications”,C.Faller和F.Baumgarte,IEEE Trans.on Speech and Audio Proc.,volumelevel.11,no.6,Nov.2003。
在BCC编码方式中,首先利用具有重迭窗口的基于离散傅立叶变换(Discrete Fourier Transform,简写为DFT)的变换将多个音频输入通道转换为频谱表示。由上述方法得到的均匀频谱被分为不重迭的部分,每一部分的频宽与等效矩形带宽(Equivalent Rectangular Bandwidth,简写为ERB)近似成正比。然后针对每一部分,在两个通道之间进行BCC参数的估测。一般说来,每个通道的BCC参数都相对于参考通道而给出,并且进一步被量化。该传输参数最后再根据指定的方程式(已编码的)进行计算,其也可能依赖于待处理的信号的特定部分。
多个BCC参数确实存在。举例而言,ICLD参数用来描述两个相比较的通道所包含能量的差(比值)。通道间相干性/相关性(inter-channel coherence/correlation,简写为ICC)参数用来描述两个通道之间的相关性,其可以理解为两个通道波形的相似性。通道间时间差(inter-channel time difference,简写为ICTD)参数用来描述两个通道之间的全局时移,而通道间相位差(inter-channel phasedifference,简写为IPD)参数则是用来描述信号之间相位的差。
应当注意的是,在音频信号的框架式处理(frame-wiseprocessing)中,BCC分析也以框架式执行,也就是时变的,而且还以频率式(frequency-wise)而执行。这意味着,对于每一个频谱波段,分别获得BCC参数。这还意味着,如果用声音滤波器组(bank)将输入信号分解为例如32个带通信号,则BCC分析块获得针对此32个波段中每一个的BCC参数组。
一种相关的技术,也就是所谓的参数立体声,在下列文章中有所描述:J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers“High-Quality Parametric Spatial Audio Coding at Low Bitrates”,AES 116thConvention,Berlin,Preprint 6072,May 2004;以及E.Schuijers,J.Breebaart,H.Purnhagen,J.Engdegard,“LowComplexity Parametric Stereo Coding”,AES116thConvention,Berlin,Preprint 6073,May 2004。
总括来说,多通道音频信号参数编码的新近方法(空间音频编码以及立体声提示编码等),是借助下混合(downmix)信号(可以是单通道的,或者包括若干通道)以及参数辅助信息(空间提示)来表示多通道音频信号,所述参数辅助信息描述了感知的空间声基宽(sound stage)的特征。通常希望将辅助信息的数据率维持的尽可能低,以便将额外开销信息降至最低,并且为下混合信号的编码留出尽可能多的可用传输容量。
一种使辅助信息的比特率保持为低的方法是,例如通过向辅助信息应用熵编码算法,对空间音频方案的辅助信息进行无损编码。
无损编码已经广泛用于一般的音频编码中,以确保量化的频谱系数和辅助信息的最佳紧密表示。适当的编码方案与方法的例子可以在ISO/IEC标准MPEG1第3部分、MPEG2第7部分以及MPEG4第3部分中找到。
这些标准以及,例如IEEE paper“Noiseless Coding of QuantizedSpectral Coefficients in MPEG-2 Advanced Audio Coding”S.R.Quackenbush,J.D.Johnston,IEEE WASPAA,Mohonk,NY,October 1997描述了现有技术状态中的技术,包含以如下手段对量化的参数进行无损编码:
●量化频谱系数的多维霍夫曼(Huffman)编码
●针对系数组,使用公共(多维)霍夫曼码本
●将值编码为一个孔(hole),或者将符号信息以及数量信息分别进行编码(即针对给定的绝对值仅具有霍夫曼码本条目,这减小了所需码本的大小,“带符号的”与“无符号的”码本的比较)
●使用具有不同的最大绝对值的替代码本,亦即在待编码的参数中具有不同的最大绝对值
●针对每一个LAV,使用具有不同统计分布的替代码本
●以辅助信息的方式把霍夫曼码本的选择发送至解码器
●使用“分区”(sections)来定义每一个所选霍夫曼码本的应用范围
●频率缩放因子的差分编码,以及随后对结果进行霍夫曼编码
在MPEG1音频标准中,提出另一种将粗略量化值以无损的方式编码为单一PCM码的技术(在该标准内被称作分组(grouping),并且用于第2层),这在ISO/IEC标准11172-3:93中有更详细的解释。
出版物“Binaural cue coding-Part II:Schemes andapplications”,C.Faller与F.Baumgarte,IEEE Trans.on Speechand Audio Proc.,volume level.11,no.6,Nov.2003提到一些有关BCC参数编码的信息.其提出以如下方式对量化的ICLD参数进行差分编码:
●在频率上进行差分编码,而且随后对结果进行霍夫曼编码(使用一维霍夫曼码)
●在时间上进行差分编码,而且随后对结果进行霍夫曼编码(使用一维霍夫曼码)
最后,选择更有效率的变体(variant)作为原始音频信号的表示。
如同前面所提到的,已经提出通过在频率上(以及可选地在时间上)进行差分编码、然后选择更有效率的变体而对压缩性能进行优化。然后,通过一些辅助信息将所选变体发信号通知(signal)给解码器。
已经做出大量努力以减小下混合音频信号及相应辅助信息的大小。然而,可实现的比特率仍旧过高,以致不能实现每种可能的应用。例如,针对移动电话的音频和视频内容的流需要最小可能的比特率,因而需要更有效率的内容编码。
发明内容
本发明的目的是提供一种改进的编码概念,能够以更高的效率对参数值进行无损压缩。
根据本发明的第一方面,该目的通过一种用于参数压缩的压缩单元而实现,所述参数包括具有原始信号第一部分的表示(representation)的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述压缩单元包括:供给器,用于供给第一元组和第二元组,每个元组具有至少两个参数,第一元组具有来自第一参数集的两个参数,而第二元组具有来自第一参数集的一个参数以及来自第二参数集的一个参数;比特估测器,基于编码规则来估测使用包括第一元组的第一元组序列对参数集进行编码所需的比特数,以及使用包括第二元组的第二元组序列对参数集进行编码所需的比特数;以及提供器,用于提供编码块,所述提供器可以使用导致较少比特数的元组序列来提供所述编码块,并提供指示从中导出所述编码块的元组序列的序列指示。
根据本发明的第二方面,该目的通过一种用于对编码参数块进行解码并用于处理序列指示的解码器而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述解码器包括:解压缩器,所述解压缩器可使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,每一个元组具有至少两个参数;以及帧建构器,用于接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列,而且所述帧建构器还用于使用所用元组序列的信息来建构所述参数集。
根据本发明的第三方面,该目的通过一种用于参数压缩的方法而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻。
根据本发明的第四方面,该目的通过一种当在计算机上运行时执行如上方法的计算机程序而实现。
根据本发明的第五方面,该目的通过一种用于对编码参数块进行解码并用于处理序列指示的方法而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻。
根据本发明的第六方面,该目的通过一种当在计算机上运行时执行如上方法的计算机程序而实现。
根据本发明的第七方面,该目的通过一种参数的压缩表示而实现,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述参数的压缩表示包括:表示所用元组序列的编码参数块;以及序列指示,所述序列指示指示所述编码参数块所基于的第一或第二序列中的所用元组序列,其中第一序列包括具有来自第一参数集的两个参数的第一元组,而第二序列包括具有来自第一参数集的一个参数和来自第二参数集的一个参数的第二元组。
本发明基于如下发现:当包括具有原始信号第一部分的表示的第一参数集和具有原始信号第二部分的表示的第二参数集的参数被布置在第一元组序列和第二元组序列中时,可进行有效的编码,其中,所述第一元组序列包括具有来自所述原始信号的单一部分的两个参数的参数元组,而所述第二元组序列包括具有来自所述原始信号第一部分的一个参数以及来自所述原始信号第二部分的一个参数的参数元组。使用比特估测器来估测对所述第一和第二元组序列进行编码所需的比特数,从而能够实现有效的编码,其中,仅对导致较少比特数的元组序列进行编码。
因此,基本原理是,例如在时间和频率上对待编码的参数进行重新排列,并最终使用一种参数排列(元组序列)进行压缩,该排列导致压缩参数具有较少比特数。
在本发明的一个实施例中,以具有两个参数的对的形式,把描述原始信号两个连续时间部分的频谱表示的两个频谱参数集进行自适应分组,以提高编码效率。因此,一方面使用包括来自相同时间部分的两个相邻频率参数的参数元组而产生元组序列。另一方面,使用利用来自原始信号第一时间部分的第一参数和来自原始信号第二时间部分的相应参数而建构的元组而产生第二元组序列。然后,使用二维霍夫曼码对两个元组序列进行编码。比较两个编码后的元组序列的大小,并最终选择导致较少比特数的元组进行传送。与使用哪种元组建构编码数据有关的信息作为附加的辅助信息被传送至解码器。
先前描述的本发明的解码器的一个优点是,由于把参数分组为包括两个参数的元组,因而可以把二维霍夫曼码用于压缩,这通常会导致较低的比特率。
第二个优点是,自适应分组(即在编码过程中动态地在两种可能的分组策略中进行抉择的概念)进一步减小了辅助信息的比特率。
针对具有两个连续帧的集合,在两种分组策略之间仅做出一次抉择,这会额外地减小所需的辅助信息量,因为针对具有两个完整连续时帧的集合仅需传送一次指示,该指示指示出编码期间所使用的分组策略。
在本发明的其他实施例中,一种本发明的压缩单元额外包括差分编码器,所述差分编码器在自适应分组前在时间或频率上对参数进行差分编码。该差分编码和自适应分组以及适当的霍夫曼码本进一步减小了待传送的辅助信息的大小。两种差分编码的可能与两种分组策略导致了总共4种可能的组合,进一步增大了查找编码规则的概率,其导致低辅助信息比特率。
在本发明的其他实施例中,本发明的概念用于解压缩单元,允许对编码参数块进行解码,并基于辅助信息而重建原始帧,所述辅助信息表明了编码参数块所基于的分组方案。在有利修改中,本发明的解码器还允许对没有进行自适应分组的数据进行解码,因而能够实现本发明的解码器与现有装置的兼容性。
附图说明
下文参考附图来描述本发明的优选实施例,其中:
图1示出了本发明的压缩单元;
图2示出了对参数进行自适应分组的两种可能;
图3示出了对参数进行自适应分组的一些额外的可能;
图4示出了不同的编码方案;
图5示出了本发明的解码器;
图6示出了现有技术的多通道编码器。
具体实施方式
图1示出了本发明的压缩单元90,包括供给器100、比特估测器102和提供器104。
供给器100在两个数据输出端供给具有元组106a的第一序列和具有元组106b的第二序列。提供器104在其两个数据输入端108a和108b上接收元组106a和106b。比特估测器在其数据输入端110a和110b上接收两个元组。
比特估测器102估测通过向两元组106a和106b施加编码规则而导致的比特数。比特估测器102选择导致较少比特数的元组,并通过信令输出112a发信号(signal)表明是元组106a还是106b将导致较少的比特数。
基于比特估测器102的决定,最终把导致较少比特数的元组编码为编码块118,经提供器104的输出端120a而提供,其中,该提供器还在其信令线路120b上发出序列指示的信号,其指示对哪个元组(106a或106b)的原始序列进行编码而导出编码块118。
在备选实施例中,当省略供给器100和提供器104之间的虚线连接122a和122b时,可实现相同的功能。在该备选方案中,比特估测器102会把元组106a和106b的序列进行编码,且会把两个不同的编码块124a和124b传送至提供器104,其中,提供器额外地发出信号,以表明编码块124a和124b从元组106a和106b的原始序列中的哪个序列导出。对此,可以使用比特估测器102的信令输出端112a,或该信令可由提供器104隐式地导出。
在该备选实施例中,提供器104仅把具有较少比特数的编码块转送至其输出端120a,并附带地提供序列指示。
图2示出了用于导出待编码元组序列的两种自适应分组方案的示例。为了解释本发明的自适应分组的原理,示出了原始信号中的4个后续(subsequent)时帧130a至130d,其中每一个帧具有包括5个频谱参数132a至132e的集合。
根据本发明,两个连续帧的频谱参数要么在频率上进行分组(如元组134a和134b所示),要么在时间上进行分组(如元组136a和136b所示),从而建构元组序列。时间上的分组导致第一元组序列138,而频率上的分组导致第二元组序列140。
例如,使用霍夫曼码本对元组序列138和140进行编码,形成两个不同的码字序列142和144。根据本发明,最终把需要较少比特数的码字序列传输至解码器,该解码器必须额外地接收序列指示,该指示表明码字序列的基础是时间分组还是频率分组。从图2中可以看出,对于所示出的参数对(二维)自适应分组的示例,该序列指示可以仅包含1个单一比特。
图3示出了可用于实现本发明的自适应分组的一些备选的分组策略,其允许大于二维的霍夫曼码。
图3示出了二维霍夫曼码146a、三维霍夫曼码146b和四维霍夫曼码146c的分组策略。对于每一种策略,示出了两个连续的时帧,其中,相同的大写字母代表属于相同元组的参数。
图2已经示出了二维霍夫曼码情况下的分组,在频率和时间上建构二维元组148a和148b。在建构包括3个参数的元组的情况下,频率元组158a是这样的元组:一帧内的三个相邻频率参数被分组到一起以形成元组。以如下方式建构时间元组150b:来自一帧的两个相邻参数与来自另一帧的一个参数进行组合,如图3所示。
通过把一个帧的四个相邻参数分组为一个元组,与其他时间元组相对应地建构四维时间分组元组152a。以如下方式建构时间分组元组152b:把一帧的两个相邻参数与另一帧的两个相邻参数进行组合,其中单一帧的参数对描述两个连续时帧的相同频谱特性。
如图3中所示,允许不同的分组方案可明显降低辅助信息的比特率,例如,如果使用具有不同维度的多个预定霍夫曼码本,可在编码过程中改变分组的维度,使得在编码过程中的任意时间都可使用导致最低比特率的表示(representation)。
图4示出了如何通过在霍夫曼编码过程前应用一些差分编码,从而使用本发明的压缩单元(额外地包括差分编码器)进一步减少辅助信息。
为了说明时间和频率上的差分编码,使用已经在图2中示出的参数的相同的绝对表示160作为各种差分编码步骤的基础。第一种可能是,在频率上对参数的绝对表示160进行差分编码,形成差分编码参数162。从图4中可以看到,为了对绝对表示160进行差分编码,使每个时帧的第一参数不变,而第二参数则被绝对表示160的第二参数与第一参数的差而取代。依照相同规则建构差分编码表示内的其它参数。
另一种可能是时间上的差分编码,产生表示164。从图4中可以看出,该表示以如下方式建构:使整个第一帧不变,而随后的帧的参数被绝对表示的参数与先前帧的相同参数之差而取代。
第三种可能是,先在频率上进行差分编码,然后在时间上进行差分编码,或者相反,两种情况下均形成在时间和频率上进行差分编码的相同的编码表示166。
要注意的是,有机会使用原始信号的这4种不同的表示作为自适应分组的输入。看一看给定参数示例的不同表示160至166,能清楚地看出差分编码怎样对辅助信息的传输率产生影响。看一看绝对表示160,可以看出时间上的分组和频率上的分组均不会形成具有相同内容的元组。因此,无法建构向最频繁出现的元组分配最短码字的合适的霍夫曼码本。
情况不同的是,看一看频率上的差分编码表示162,可以建构只需具有4个条目以覆盖全部表示的霍夫曼码本,而且会向元组(1,1)或元组(2,2)分配最小长度的码字,从而实现紧密的辅助信息。
该优点在时间上的差分编码表示164中较不明显。然而,此处亦能得到频率上的分组并利用多个元组(5,5)和(10,10)。
对于时间和频率上的差分编码表示166来说,甚至可能实现比表示162中更小的辅助信息比特率,这是因为时间上的分组会形成高重复性(multiplicity)的元组(1,0),如图中所示,而这允许建构向先前元组分配最短码字的霍夫曼码本。
从图4中可以清楚地看到,利用自适应分组和差分编码的本发明概念的高灵活性允许选择最为适合原始音频信号的策略,因而允许保持辅助信息比特率为低。
总之,在一个优选实施例中,对量化参数值首先在时间上进行差分编码(变体1),并在频率上进行差分编码(变体2)。然后,把形成的参数在时间上(变体a)和频率上(变体b)进行自适应分组。结果,产生四种可能的组合(1a、1b、2a、2b),从中选取最佳者并发信号通知解码器。这可以由仅为2比特的信息来完成,例如比特组合00、01、10、11表示变体1a、1b、2a、2b。
图5示出了根据本发明的解码器,用于对编码参数块进行解码,其中,该参数块包括具有第一频谱参数集的第一帧以及具有第二频谱参数集的第二帧。
解码器200包括解压缩器202与帧建构器204。解压缩器在输入端上接收编码参数块206。解压缩器使用解码规则从编码参数块206中导出参数元组序列208。该参数元组序列208被输入帧建构器204。
帧建构器额外地接收序列指示210,其指示编码器使用哪个元组序列来建构编码参数块。
然后,帧建构器204对序列指示210所指引的元组序列208进行重新排列,从参数元组序列208中重建第一帧112a和第二帧112b。
上文所述的本发明的优选实施例通过向待使用多维霍夫曼码进行编码的数值引入自适应分组,进一步提高了编码效率。做为示例,可进行频率上的二维数值分组以及时间上的二维数值分组。然后,编码方案会进行两种类型的编码,并选择更有利的一种(即需要较少比特的变体)。该决策通过辅助信息而发信号通知给解码器。
如图3中所示,在其他示例中,还可以建构更高维度的霍夫曼码,应用不同的分组策略以建构元组。假定的示例示出了通过仅把来自两个连续帧的参数分组到一起以建构元组的分组策略。还可能使用来自三个或更多个连续帧的参数而进行分组,以直接方式(straightforward way)进行分组。
在本发明的编码器的修改中,还可能使用不同的霍夫曼码本,把差分分组和差分编码策略进行组合,以导出辅助信息的最短可能表示。这可以进一步减小编码音频信号的辅助信息比特率,其代价是需要额外的辅助信息参数,发信号通知用于编码的霍夫曼码本。
所述的本发明优选实施例以示例的方式示出了本发明的概念,其中分组策略在两个连续时帧内不发生变化。在本发明的修改中,当然还可能使两个帧的集合内的时间和频率上的分组之间存在多个变化,这意味着帧内还提供序列指示,以发信号通知分组策略的变化。
在给定的示例中,在霍夫曼编码前对该参数进行差分编码。当然,在参数的霍夫曼编码前还可以使用每种其它的无损编码规则,该编码的目标是导出尽可能多的相同内容的元组。
图4中给出了4种不同的可能的参数表示,即绝对表示、频率上的差分表示、时间上的差分表示以及时间和频率上的差分表示。为了在4个表示中进行选择,如图4所示,发信号通知使用哪个表示的辅助信息在大小上必须至少为2个比特。为了平衡可能获得的编码效率与附加的频谱表示指示的关系,在原理上当然还可以决定仅允许两种可能的表示,把频谱表示指示的长度减小至单一比特。
作为本发明解码器的示例,图5示出了除接收编码参数块206之外还接收某些辅助信息的解码器200。在给定的示例中,指引帧建构器204的辅助信息仅包括序列指示210。根据本发明的解码器当然可以处理所需的任意其它辅助信息,特别是频谱表示指示,其指示已被用于对原始帧进行编码的频谱表示。
取决于本发明的方法的特定实现要求,本发明的方法可以以硬件或者软件实现。该实现可以使用数字储存媒介来执行,特别是其上存储有电可读控制信号的盘、DVD或CD,其与可编程计算机系统一同操作,从而执行本发明的方法。因此大体上说,本发明是在机器可读载体上存储有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可以用于执行本发明的方法。换句话说,本发明的方法是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,该程序代码可用于执行本发明的方法中至少一种方法。
虽然在上文中参考特定实施例进行了特定的示出与描述,本领域的技术人员可以理解,在不背离本发明的精神和范围的前提下,可以在形式和细节上做出各种其他的改变。应当理解的是,在不背离这里所公开的以及由所附权利要求所包括的更宽的概念的前提下,可做出各种改变以适应不同的实施例。

Claims (34)

1.一种用于参数压缩的压缩单元,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述压缩单元包括:
供给器,用于供给第一元组和第二元组,每个元组具有至少两个参数,第一元组具有来自第一参数集的两个参数,而第二元组具有来自第一参数集的一个参数以及来自第二参数集的一个参数;
比特估测器,基于编码规则来估测使用包括第一元组的第一元组序列对参数集进行编码以及使用包括第二元组的第二元组序列对参数集进行编码所需的比特数;以及
提供器,用于提供编码块,所述提供器可以使用导致较少比特数的元组序列来提供所述编码块,并提供指示从中导出所述编码块的元组序列的序列指示。
2.如权利要求1所述的压缩单元,其中,第一和第二参数集包括原始信号的第一和第二部分的频谱表示。
3.如权利要求1所述的压缩单元,其中,原始信号的第一部分和第二部分在时间或空间上相邻。
4.如权利要求1所述的压缩单元,其中,第一参数集包括原始音频或视频信号的第一帧的表示,而第二参数集包括原始音频或视频信号的第二帧的表示。
5.如权利要求1所述的压缩单元,
其中,所述供给器可以仅使用具有来自一个单一参数集的元组而供给第一元组序列中的第一元组和所有余下的元组,而且可以仅使用具有来自第一参数集的至少一个参数以及来自第二参数集的至少一个参数的元组而供给第二元组序列中的第一元组以及所有余下的元组;以及
所述提供器可以提供针对一个编码块的单一序列指示。
6.如权利要求1所述的压缩单元,其中,所述供给器可以供给:
由来自单一参数集的两个参数所组成的第一元组,所述两个参数是原始信号的表示内的相邻参数;以及
由来自第一参数集的第一参数和来自第二参数集的第二参数所组成的第二元组,所述第一和第二参数描述了所述表示中的原始信号的相同特性。
7.如权利要求1所述的压缩单元,其中,所述供给器可以供给:
第一元组,由整数倍个数的来自单一参数集的两个参数组成,所述参数是原始信号的表示内的相邻参数;以及
第二元组,由来自第一参数集的两个或更多个参数以及来自第二参数集的相同个数的参数组成,所述参数在原始信号的表示内相邻,来自第一和第二参数集的参数描述了所述表示内的原始信号的相同特性。
8.如权利要求1所述的压缩单元,其中,所述供给器可以供给:
第一元组,由来自一个参数集的原始信号的表示的奇数个相邻参数组成;以及
第二元组,由大部分来自一个参数集的原始信号表示的相邻参数以及小部分来自另一参数集的原始信号的表示的相邻参数组成,其中,对于第二元组序列的连续元组,所述大部分参数从第一和第二参数集中交替获取。
9.如权利要求1所述的压缩单元,
其中,所述比特估测器可使用编码规则,对第一元组序列进行编码以导出第一编码块,对第二元组序列进行编码以导出第二编码块,并通过对第一和第二编码块的比特进行计数来估测所需比特数;以及
所述提供器可以转送第一或第二编码块,其选择具有较少比特数的块。
10.如权利要求1所述的压缩单元,
其中,所述比特估测器可以根据编码规则,估测对元组序列进行编码所需的比特;以及
所述提供器可以对元组序列进行编码,提供具有较少比特数的编码块。
11.如权利要求1所述的压缩单元,其中,所述参数集包括视频信号或音频信号的参数表示。
12.如权利要求1所述的压缩单元,其中,所述编码规则为:对长度相同但参数不同的元组进行编码会导致具有不同长度的码字。
13.如权利要求1所述的压缩单元,其中,所述参数包括描述第一和第二原始音频通道之间的空间相互关系的BCC参数,而且该BCC参数从如下BCC参数列表中选择:
通道间相干性/相关性(ICC)
通道间电平差(ICLD)
通道间时间差(ICTD)
通道间相位差(IPD)。
14.如权利要求1所述的压缩单元,还包括差分编码器,所述差分编码器用于处理原始信号,使得第一参数集和第二参数集包括差别表示,所述差别是时间、频率或时间和频率上的差别。
15.如权利要求14所述的压缩单元,
其中,所述供给器可以供给第一元组分组和第二元组分组,所述元组分组内的元组具有来自如下表示中的一种表示的参数:
时间上的差分表示、频率上的差分表示、时间和频率上的差分表示以及绝对表示,
第一元组分组的元组具有来自第一参数集的两个参数,而第二元组分组具有来自第一参数集的一个参数和来自第二参数集的一个参数;以及
所述比特估测器可以估测对至少八个元组序列的元组序列进行编码所需的比特数,每一个序列具有元组分组中的一个元组;以及
除了所述序列指示以外,所述提供器可发信号表明表示指示,该表示指示指示了导致较低比特数的表示。
16.如权利要求15所述的压缩单元,其中,所述提供器可操作用于:使用具有至少三个比特的二进制数据字来发信号表明序列指示和表示指示。
17.如权利要求1所述的压缩单元,其中,所述编码规则为:每个元组具有与其相关联的不同码字分组中的单一码字。
18.如权利要求1所述的压缩单元,其中,所述编码规则包含霍夫曼码本。
19.一种用于对编码参数块进行解码并用于处理序列指示的解码器,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述解码器包括:
解压缩器,所述解压缩器可使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,每一个元组具有至少两个参数;以及
帧建构器,用于接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列,而且所述帧建构器还用于使用所用元组序列的信息来建构所述参数集。
20.如权利要求19所述的解码器,其中,第一和第二参数集包括原始信号的第一和第二部分的频谱表示。
21.如权利要求19所述的解码器,其中,原始信号的第一部分和第二部分在时间或空间上相邻。
22.如权利要求19所述的解码器,其中,第一参数集包括原始音频或视频信号的第一帧的表示,而第二参数集包括原始音频或视频信号的第二帧的表示。
23.如权利要求19所述的解码器,其中,所述帧建构器可以接收针对一个编码参数块的单一序列指示,并使用仅包括由所述序列指示所指示类型的元组的元组序列来建构参数集。
24.如权利要求19所述的解码器,其中,所述帧建构器可以建构包括视频信号或音频信号的参数表示的参数集。
25.如权利要求19所述的解码器,其中,所述帧建构器可以建构包括BCC参数的参数集,该BCC参数描述了第一和第二音频通道之间的空间相互关系,而且该BCC参数从如下BCC参数列表中选择:
通道间相干性/相关性(ICC)
通道间电平差(ICLD)
通道间时间差(ICTD)
通道间相位差(IPD)。
26.如权利要求19所述的解码器,还包括差分解码器,所述差分解码器用于接收表示指示并对参数集进行处理,使得从差别频谱表示中导出参数,所述差别是时间、频率或时间和频率上的差别,其中,所述差分解码器可以取决于所述表示指示而处理第一和第二参数集。
27.如权利要求26所述的解码器,其中,所述帧建构器和所述差分解码器可以接收序列指示和表示指示,所述序列指示和表示指示包括具有至少三个比特的二进制数据字的形式。
28.如权利要求19所述的解码器,其中,所述解码规则为:编码参数块内的每一个码字具有与其相关联的不同元组分组中的单一元组。
29.一种用于参数压缩的方法,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述方法包括:
供给第一元组和第二元组,每一个元组具有至少两个参数,第一元组具有来自第一参数集的两个参数,而第二元组具有来自第一参数集的一个参数以及来自第二参数集的一个参数;
基于编码规则来估测使用包括第一元组的第一元组序列对参数集进行编码所需的比特数,以及使用包括第二元组的第二元组序列对帧进行编码所需的比特数;
使用导致较少比特数的元组序列来提供编码块;以及
提供指示从中导出所述编码块的元组序列的序列指示。
30.一种用于对编码参数块进行解码并用于处理序列指示的方法,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述方法包括:
使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,每一个元组具有至少两个参数;
接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列;以及
使用所用元组序列的信息来建构所述参数集。
31.一种具有程序代码的计算机程序,当在计算机上运行时,所述程序代码用于执行一种用于参数压缩的方法,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述方法包括:
供给第一元组和第二元组,每一个元组具有至少两个参数,第一元组具有来自第一参数集的两个参数,而第二元组具有来自第一参数集的一个参数以及来自第二参数集的一个参数;
基于编码规则来估测使用包括第一元组的第一元组序列对参数集进行编码所需的比特数,以及使用包括第二元组的第二元组序列对帧进行编码所需的比特数;
使用导致较少比特数的元组序列来提供编码块;以及
提供指示从中导出所述编码块的元组序列的序列指示。
32.一种具有程序代码的计算机程序,当在计算机上运行时,所述程序代码用于执行一种用于对编码参数块进行解码并用于处理序列指示的方法,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述方法包括:
使用取决于用于对元组序列进行编码的编码规则的解码规则,对编码参数块进行解压缩以导出参数的元组序列,每一个元组具有至少两个参数;
接收序列指示,所述序列指示指示所述编码块所基于的多个不同序列中所使用的元组序列;以及
使用所用元组序列的信息来建构所述参数集。
33.一种参数的压缩表示,所述参数包括具有原始信号第一部分的表示的第一参数集,所述参数还包括具有原始信号第二部分的表示的第二参数集,所述第二部分与所述第一部分相邻,所述参数的压缩表示包括:
表示所用元组序列的编码参数块;以及
序列指示,所述序列指示指示所述编码参数块所基于的第一或第二序列中的所用元组序列,其中第一序列包括具有来自第一参数集的两个参数的第一元组,而第二序列包括具有来自第一参数集的一个参数和来自第二参数集的一个参数的第二元组。
34.如权利要求33所述的参数的压缩表示,其中所述参数的压缩表示储存在计算机可读介质上。
CN2006800120933A 2005-04-13 2006-02-13 参数压缩单元和解码器以及相应的方法 Active CN101160726B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US67099305P 2005-04-13 2005-04-13
US60/670,993 2005-04-13
US11/243,915 US7991610B2 (en) 2005-04-13 2005-10-05 Adaptive grouping of parameters for enhanced coding efficiency
US11/243,915 2005-10-05
PCT/EP2006/001295 WO2006108464A1 (en) 2005-04-13 2006-02-13 Adaptive grouping of parameters for enhanced coding efficiency

Publications (2)

Publication Number Publication Date
CN101160726A true CN101160726A (zh) 2008-04-09
CN101160726B CN101160726B (zh) 2013-05-22

Family

ID=36581385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800120933A Active CN101160726B (zh) 2005-04-13 2006-02-13 参数压缩单元和解码器以及相应的方法

Country Status (18)

Country Link
US (2) US7991610B2 (zh)
EP (2) EP3503409A1 (zh)
JP (1) JP5027799B2 (zh)
KR (1) KR100954181B1 (zh)
CN (1) CN101160726B (zh)
AU (1) AU2006233512C1 (zh)
BR (3) BRPI0612356B1 (zh)
CA (1) CA2607460C (zh)
ES (1) ES2739531T3 (zh)
IL (1) IL186315A (zh)
MX (1) MX2007012663A (zh)
MY (1) MY141958A (zh)
NO (1) NO343207B1 (zh)
PL (1) PL1869774T3 (zh)
PT (1) PT1869774T (zh)
RU (1) RU2368074C2 (zh)
TW (1) TWI321316B (zh)
WO (1) WO2006108464A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102656628A (zh) * 2009-10-15 2012-09-05 法国电信公司 优化的低吞吐量参数编码/解码
CN102833534A (zh) * 2011-06-16 2012-12-19 索尼公司 视频发送设备、视频接收设备及视频发送方法
CN115865099A (zh) * 2022-12-01 2023-03-28 河南大学 基于霍夫曼编码的多类型数据分段压缩方法及系统

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090586B2 (en) 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
AU2006266655B2 (en) 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8185403B2 (en) 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP5173811B2 (ja) 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
KR100878828B1 (ko) 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR20070038439A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US9171344B2 (en) 2007-10-30 2015-10-27 Onemednet Corporation Methods, systems, and devices for managing medical images and records
US8065166B2 (en) 2007-10-30 2011-11-22 Onemednet Corporation Methods, systems, and devices for managing medical images and records
US9760677B2 (en) 2009-04-29 2017-09-12 Onemednet Corporation Methods, systems, and devices for managing medical images and records
EP2250821A1 (en) * 2008-03-03 2010-11-17 Nokia Corporation Apparatus for capturing and rendering a plurality of audio channels
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
AU2009267543B2 (en) * 2008-07-11 2013-01-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and audio decoder
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
BR122021008581B1 (pt) * 2010-01-12 2022-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
US8400335B2 (en) 2011-07-21 2013-03-19 International Business Machines Corporation Using variable length code tables to compress an input data stream to a compressed output data stream
US8669889B2 (en) 2011-07-21 2014-03-11 International Business Machines Corporation Using variable length code tables to compress an input data stream to a compressed output data stream
US8692696B2 (en) 2012-01-03 2014-04-08 International Business Machines Corporation Generating a code alphabet of symbols to generate codewords for words used with a program
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US8581753B2 (en) 2012-01-19 2013-11-12 Sharp Laboratories Of America, Inc. Lossless coding technique for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US8552890B2 (en) * 2012-01-19 2013-10-08 Sharp Laboratories Of America, Inc. Lossless coding with different parameter selection technique for CABAC in HEVC
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
CN110460851B (zh) 2012-08-21 2022-03-08 Emc 公司 分段图像数据的无损压缩系统、方法及存储介质
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
WO2014191793A1 (en) * 2013-05-28 2014-12-04 Nokia Corporation Audio signal encoder
CN105659320B (zh) * 2013-10-21 2019-07-12 杜比国际公司 音频编码器和解码器
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
MY186155A (en) * 2014-03-25 2021-06-28 Fraunhofer Ges Forschung Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
GB2567427B (en) 2017-10-06 2020-10-07 Imagination Tech Ltd Data compression
GB2576769A (en) 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
GB2585187A (en) * 2019-06-25 2021-01-06 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US20240046939A1 (en) * 2020-12-15 2024-02-08 Nokia Technologies Oy Quantizing spatial audio parameters
GB2624874A (en) * 2022-11-29 2024-06-05 Nokia Technologies Oy Parametric spatial audio encoding

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63284974A (ja) 1987-05-15 1988-11-22 Matsushita Electric Works Ltd 画像圧縮方式
SU1711331A1 (ru) 1987-05-28 1992-02-07 Всесоюзный научно-исследовательский институт радиовещательного приема и акустики им.А.С.Попова Устройство кодировани и декодировани сигналов звукового вещани
US5225904A (en) * 1987-10-05 1993-07-06 Intel Corporation Adaptive digital video compression system
US5532694A (en) 1989-01-13 1996-07-02 Stac Electronics, Inc. Data compression apparatus and method using matching string searching and Huffman encoding
JPH0773249B2 (ja) 1989-06-29 1995-08-02 富士通株式会社 音声符号化・復号化伝送方式
US5325091A (en) 1992-08-13 1994-06-28 Xerox Corporation Text-compression technique using frequency-ordered array of word-number mappers
US5550540A (en) 1992-11-12 1996-08-27 Internatioal Business Machines Corporation Distributed coding and prediction by use of contexts
US5717394A (en) 1993-02-10 1998-02-10 Ricoh Company Ltd. Method and apparatus for encoding and decoding data
JPH07203441A (ja) 1993-12-28 1995-08-04 Matsushita Graphic Commun Syst Inc 符号化装置及び復号化装置
US5550541A (en) 1994-04-01 1996-08-27 Dolby Laboratories Licensing Corporation Compact source coding tables for encoder/decoder system
CA2156889C (en) 1994-09-30 1999-11-02 Edward L. Schwartz Method and apparatus for encoding and decoding data
KR100209877B1 (ko) 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JPH08179794A (ja) * 1994-12-21 1996-07-12 Sony Corp サブバンド符号化方法及び装置
US5721720A (en) 1994-12-28 1998-02-24 Kabushiki Kaisha Toshiba Optical recording medium recording pixel data as a compressed unit data block
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
CN1158050A (zh) 1995-12-27 1997-08-27 汤姆森消费电子有限公司 图像数据压缩系统和方法
US5870436A (en) 1997-01-02 1999-02-09 Raytheon Company Uniform discrete fourier transform filter parameter encoder
US6237496B1 (en) 1997-02-26 2001-05-29 Northrop Grumman Corporation GPS guided munition
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
RU2214047C2 (ru) 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6862278B1 (en) 1998-06-18 2005-03-01 Microsoft Corporation System and method using a packetized encoded bitstream for parallel compression and decompression
US6166664A (en) 1998-08-26 2000-12-26 Intel Corporation Efficient data structure for entropy encoding used in a DWT-based high performance image compression
US6546049B1 (en) 1998-10-05 2003-04-08 Sarnoff Corporation Parameterized quantization matrix adaptation for video encoding
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6624761B2 (en) 1998-12-11 2003-09-23 Realtime Data, Llc Content independent data compression method and system
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
JP3323175B2 (ja) 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE9903191D0 (sv) 1999-09-08 1999-09-08 Pacesetter Ab Compression and decompression coding scheme and apparatus
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
RU2159507C1 (ru) 1999-10-29 2000-11-20 Аликов Сергей Владимирович Узел кодирования и/или декодирования информации, система передачи информации с уплотнением каналов, система передачи информации в телекоммуникационной сети
JP2001151413A (ja) 1999-11-29 2001-06-05 Shinkawa Ltd ワイヤボンダにおけるスプールホルダ構造
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
JP2001339311A (ja) 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6813438B1 (en) 2000-09-06 2004-11-02 International Business Machines Corporation Method to customize the playback of compact and digital versatile disks
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP4125565B2 (ja) 2001-08-31 2008-07-30 松下電器産業株式会社 画像符号化方法、画像復号化方法及びその装置
US20030081685A1 (en) * 2001-10-31 2003-05-01 Montgomery Dennis L. Method and apparatus for determining patterns within adjacent blocks of data
BR0206783A (pt) * 2001-11-30 2004-02-25 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal, corrente de bits que representa um sinal codificado, meio de armazenagem, método e decodificador para decodificar uma corrente de bits que representa um sinal codificado, transmissor, receptor, e, sistema
JP4610195B2 (ja) 2001-12-17 2011-01-12 マイクロソフト コーポレーション スキップマクロブロックコード化
CN1647156B (zh) * 2002-04-22 2010-05-26 皇家飞利浦电子股份有限公司 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
US7426462B2 (en) 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7617166B2 (en) * 2004-04-14 2009-11-10 The Boeing Company Neural network for aeroelastic analysis
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
ATE474310T1 (de) * 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
DE102004063950B4 (de) * 2004-08-07 2009-02-19 Tropf, Hermann Kanalcodiervorrichtung
US7161507B2 (en) * 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
AU2009267543B2 (en) * 2008-07-11 2013-01-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and audio decoder

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102656628A (zh) * 2009-10-15 2012-09-05 法国电信公司 优化的低吞吐量参数编码/解码
CN102656628B (zh) * 2009-10-15 2014-08-13 法国电信公司 优化的低吞吐量参数编码/解码
CN102833534A (zh) * 2011-06-16 2012-12-19 索尼公司 视频发送设备、视频接收设备及视频发送方法
CN102833534B (zh) * 2011-06-16 2017-07-28 索尼公司 视频发送设备、视频接收设备及视频发送方法
CN115865099A (zh) * 2022-12-01 2023-03-28 河南大学 基于霍夫曼编码的多类型数据分段压缩方法及系统
CN115865099B (zh) * 2022-12-01 2024-04-16 河南大学 基于霍夫曼编码的多类型数据分段压缩方法及系统

Also Published As

Publication number Publication date
AU2006233512B8 (en) 2010-12-23
BRPI0612356A2 (pt) 2010-11-03
IL186315A (en) 2013-06-27
RU2368074C2 (ru) 2009-09-20
KR20070112834A (ko) 2007-11-27
US9043200B2 (en) 2015-05-26
BRPI0612356A8 (pt) 2019-01-08
AU2006233512C1 (en) 2012-01-12
WO2006108464A1 (en) 2006-10-19
BRPI0612356B1 (pt) 2019-11-12
NO343207B1 (no) 2018-12-03
JP5027799B2 (ja) 2012-09-19
BR122019014628B1 (pt) 2021-05-11
ES2739531T3 (es) 2020-01-31
CA2607460A1 (en) 2006-10-19
CN101160726B (zh) 2013-05-22
PT1869774T (pt) 2019-09-12
RU2007141934A (ru) 2009-05-20
AU2006233512B2 (en) 2010-04-22
US7991610B2 (en) 2011-08-02
EP1869774A1 (en) 2007-12-26
TWI321316B (en) 2010-03-01
JP2008536182A (ja) 2008-09-04
US20110060598A1 (en) 2011-03-10
MX2007012663A (es) 2007-12-13
KR100954181B1 (ko) 2010-04-21
TW200710826A (en) 2007-03-16
BR122019014976B1 (pt) 2020-12-29
AU2006233512A1 (en) 2006-10-19
EP1869774B1 (en) 2019-06-05
IL186315A0 (en) 2008-01-20
NO20075796L (no) 2008-01-03
PL1869774T3 (pl) 2019-11-29
MY141958A (en) 2010-07-30
EP3503409A1 (en) 2019-06-26
CA2607460C (en) 2017-07-25
US20060235679A1 (en) 2006-10-19

Similar Documents

Publication Publication Date Title
CN101160726B (zh) 参数压缩单元和解码器以及相应的方法
RU2197776C2 (ru) Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты)
CN101156320B (zh) 具有紧密码簿的熵编码设备和方法
CA2604521C (en) Lossless encoding of information with guaranteed maximum bitrate
CA2601821A1 (en) Planar multiband antenna
CN101160725A (zh) 确保最大比特率的无损信息编码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant