CN103119649B - 用于基于上下文进行无损编码和解码的方法和设备 - Google Patents

用于基于上下文进行无损编码和解码的方法和设备 Download PDF

Info

Publication number
CN103119649B
CN103119649B CN201180045512.4A CN201180045512A CN103119649B CN 103119649 B CN103119649 B CN 103119649B CN 201180045512 A CN201180045512 A CN 201180045512A CN 103119649 B CN103119649 B CN 103119649B
Authority
CN
China
Prior art keywords
msb
symbol
lsb
information
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180045512.4A
Other languages
English (en)
Other versions
CN103119649A (zh
Inventor
朱基岘
吴殷美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103119649A publication Critical patent/CN103119649A/zh
Application granted granted Critical
Publication of CN103119649B publication Critical patent/CN103119649B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供一种基于上下文进行无损编码和解码的方法和设备。根据实施例,通过调整MSB的符号并对MSB的符号进行编码,编码效率可被提高。根据实施例,通过使用位于与所述MSB的符号紧邻的符号来估计初始缩放信息,编码效率可被提高。

Description

用于基于上下文进行无损编码和解码的方法和设备
技术领域
下面的描述涉及一种基于上下文对量化的频谱系数进行编码和解码的方法和设备。
背景技术
音频信号通常在频域被编码和解码。高级音频编码(AAC)可被用作代表性示例。AAC编解码器可被用作示例。AAC编解码器可执行用于将时域转换为频域的改进离散余弦变换(MDCT),并可从心理声学角度使用信号的掩蔽程度来执行频谱量化。为了进一步压缩执行的量化结果,无损压缩方案可被应用。AAC可使用霍夫曼编码方案作为无损压缩方案。应用算术编码方案代替霍夫曼编码方案来作为无损压缩方案的位片算数编码(BSAC)编解码器可被使用。
当无损编码的对象被进一步检查时,量化的频谱系数的量化值可被视为符号,并且可针对所述符号执行无损编码。可通过将位平面上的量化的谱系数的值映射到压缩位(pack bits)来执行编码。在基于上下文执行无损编码的情况下,可基于先前帧的信息来执行无损编码。因此,期望有效地执行无损编码。
发明内容
在一个总体方面,提供一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码。所述编码设备包括:处理器,用于控制一个或多个处理器可执行单元;重新排列单元,用于重新排列MSB的符号;顺序信息编码器,用于对MSB的符号之间的顺序信息进行编码。
在另一总体方面,提供一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。所述解码设备包括:处理器,用于控制一个或多个处理器可执行单元;MSB解码器,用于对编码的MSB的符号进行解码;顺序信息解码器,用于基于解码的MSB的符号来对所述符号之间的顺序信息进行解码;调整单元,用于基于所述顺序信息来调整MSB的符号。
在另一总体方面,提供一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。所述编码设备包括:处理器,用于控制一个或多个处理器可执行单元;缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。所述解码设备包括:处理器,用于控制一个或多个处理器可执行单元;缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码的编码方法。所述编码方法包括:按照值的升序来重新排列MSB的符号;当MSB的符号的值彼此不同时,由处理器对所述MSB的符号之间的顺序信息进行编码。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码的解码方法。所述解码方法包括:对编码的MSB的符号进行解码;基于解码的MSB的符号,由处理器对所述符号之间的顺序信息进行解码;基于所述顺序信息来调整所述MSB的符号。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码的编码方法。所述编码方法包括:由处理器估计与MSB的符号相关的初始缩放信息。
在另一总体方面,提供一种将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码的解码方法。所述解码方法包括:由处理器估计与MSB的符号相关的初始缩放信息。
根据实施例,通过重新排列MSB的符号的顺序并对顺序信息进行编码,将被编码的MSB的符号的数量可被减少,以提高编码效率。
根据实施例,通过估计初始缩放信息,用于对转义码进行编码而消耗的比特的数量可被减少,以提高编码效率。
通过下面的详细描述、附图和权利要求,其他特征和方面将是清楚的。
附图说明
图1是示出编码设备的配置的示例的示图;
图2是示出解码设备的配置的示例的示图;
图3是示出编码设备的配置的另一示例的示图;
图4是示出解码设备的配置的另一示例的示图;
图5是示出包括频谱系数的矢量的示例的示图;
图6是示出与上下文模式相关的紧邻位置处的符号的示例的示图;
图7是示出重新排列最高有效位(MSB)的符号的处理的示例的示图;
图8是示出编码方法的配置的示例的流程图;
图9是示出解码方法的配置的示例的流程图;
图10是示出编码方法的配置的另一示例的流程图;
图11是示出解码方法的配置的另一示例的流程图;
在整个附图和详细描述中,除非有其它描述,否则,相同的附图参考标号将被理解为指示相同的元件、特征和结构。为了清楚性、说明性和便利性,这些元件的相对尺寸和描述可被夸大。
具体实施方式
提供下面的详细描述以帮助读者对这里描述的方法、设备和/或系统获得全面的理解。因此,这里描述的方法、设备和/或系统的各种改变、修改以及等同物将被建议给本领域的普通技术人员。描述的处理步骤和/或操作的进行是示例;然而,步骤和/或操作的顺序不限于在此阐明的顺序,除了必须按照特定的顺序发生的步骤和/或操作以外,所述步骤和/或操作的顺序可如本领域中公知的被改变。此外,为了提高清楚性和简明性,对公知功能和结构的描述可被省略。
图1包括编码设备100的示例。
参照图1,编码设备100可包括,例如,转义码编码器101、重新排列单元102、最高有效位(MSB)编码器103、顺序信息编码器104和最低有效位(LSB)编码器105。编码设备100可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。
转义码编码器101可对转义码进行编码。当量化的频谱系数的值偏离预定范围时,编码设备100可考虑到存储空间的限制而缩放量化的频谱系数,使得量化的频谱系数的值可包括在所述预定范围中。这里,转义码可与指示是否针对量化的频谱系数执行缩放的信息相应。
转义码可包括与MSB的符号具有相似级别(level)的概率模型。转义码可在MSB被编码的同时被编码,或者可被单独编码。转义码编码器101可基于缩放被执行的次数来对转义码进行编码。当缩放不再被执行时,可在量化的频谱系数中构成MSB的符号来对MSB的符号进行编码。
重新排列单元102可重新排列MSB的符号。具体地,重新排列单元102可按照升序来重新排列MSB的符号。由于期望被编码的MSB的符号可减少,所以编码效率可被提高。将参照图8对重新排列单元102的操作进行描述。
MSB编码器103可针对重新排列的MSB的符号执行算术编码。例如,MSB编码器103可基于期望被编码的MSB的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的编码。MSB编码器103可选择与上下文相应的多个概率模型中的一个来对MSB的符号进行编码。将参照图5到图7对MSB编码器103进行进一步的描述。
顺序信息编码器104可对MSB的符号之间的顺序信息进行编码。例如,当MSB的符号的值彼此不同时,顺序信息编码器104可对所述符号之间的顺序信息进行编码。当MSB的符号的值按照升序被排列时,顺序信息可被设置为例如“0”。当MSB的符号的值按照降序被排列时,顺序信息可被设置为例如“1”。当MSB的符号的值相同时,所述符号之间的顺序信息不需要被编码。顺序信息可按照与MSB的符号被编码的相同方式被编码。
在通过转义码执行缩放之后,残差比特可被产生。LSB编码器105可对与所述残差比特相应的LSB的符号进行编码。
图2包括解码设备200的配置的示例。
图2示出与图1的编码设备100相应的解码设备200。解码设备200可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。参照图2,解码设备200可包括,例如,MSB解码器201、顺序信息解码器202、调整单元203和LSB解码器204。
MSB解码器201可通过算术解码来执行确定符号是对应于转义码还是对应于MSB的符号的解码。
当转义码和MSB的符号包括相同级别的符号时,MSB解码器201可基于期望被解码的MSB的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的解码。
相反,当转义码和MSB的符号包括不同级别的符号时,解码设备200可对转义码进行解码,并可按照与转义码的解码被执行的次数相同的次数缩放MSB的符号。MSB解码器201可对缩放的MSB的符号进行解码。
顺序信息解码器202可基于MSB的符号对符号之间的顺序信息进行解码。在这种情况下,当MSB的符号彼此不同时,顺序信息解码器202可对符号之间的顺序信息进行解码。相反,当MSB的符号相同时,对符号之间的顺序信息进行解码的操作可被省略。
例如,顺序信息解码器202可按照与对MSB的符号进行解码的相同方案进行解码。顺序信息解码器202可基于紧邻位置处的量化的频谱系数来构成上下文,并可基于所述上下文来选择多个概率模型中的一个以对顺序信息进行解码。
调整单元203可基于解码的顺序信息来调整MSB的符号。当所述MSB的符号被缩放的次数与转义码的解码已经被执行的次数相同时,LSB解码器204可对LSB的符号进行解码,并且随后将解码的LSB的符号与缩放的MSB的符号相加。最终的频谱系数可被恢复。
图3包括编码设备300的另一示例。
参照图3,编码设备300可包括,例如,缩放信息估计单元301、转义码编码器302、MSB编码器303和LSB编码器304。在这种情况下,编码设备300可将量化的频谱系数构成为至少一个元组,并可将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行编码。
缩放信息估计单元301可估计与MSB的符号相关的初始缩放信息。
例如,缩放信息估计单元301可基于上下文模式来估计初始缩放信息。所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前编码的MSB的符号之间的相对位置信息。在这种情况下,紧邻位置处的符号可基于与期望被当前编码的MSB的符号相应的当前帧,与对应于先前帧或当前帧的先前频域的符号相应。
上下文模式可指示将被用于估计初始缩放信息的紧邻位置处的符号与期望被当前编码的符号之间的相对位置信息。上下文模式可每帧被发送一次。上下文模式可被分配到低频域和高频域中的每一个,并且可通过打包分配的上下文模式一次一个地被发送。
例如,缩放信息估计单元301可基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。具体地,缩放信息估计单元301可基于上下文模式来确定用于估计初始缩放信息的谱系数,并可基于确定的谱系数来估计所述初始缩放信息。例如,当矢量包括单个频谱系数时,两个上下文模式可被使用。当上下文模式与“0”相应时,缩放信息估计单元301可使用与先前帧的相同频域相应的量化的频谱系数。当上下文模式与“1”相应时,缩放信息估计单元301可使用与当前帧的先前频域相应的量化的频谱系数。
例如,缩放信息单元301可基于下面示出的伪码来估计初始缩放信息。
这里,“ctx”可指示基于上下文模式确定的量化的频谱系数的值,“lev_ctx”可与指示用于将“ctx”改变为MSB的符号而执行的缩放的次数的信息相应。在这种情况下,当“lev_ctx”的值大于或等于“2”时,初始缩放信息可被估计为“1”。
根据实施例,通过估计初始缩放信息,用于对转义码进行编码而消耗的比特数可被减少,以提高编码效率。
转义码编码器302可针对MSB的符号确定基于初始缩放信息缩放的量化的频谱系数是否偏离预定范围,以对转义码进行编码。频谱系数可被缩放与转义码的编码被执行的次数相同的次数。
当缩放不再执行时,MSB编码器303可对缩放的MSB的符号进行编码。LSB编码器304的操作可与参照图1描述的LSB编码器105相同。
可通过LSB编码器304对与在缩放处理中产生的残差比特相应的LSB进行。LSB编码器304的操作可与参照图1描述的LSB编码器105相同。
图4包括解码设备400的另一示例。
参照图4,解码设备400可包括,例如,缩放信息估计单元401、MSB解码器402和LSB解码器403。图4的解码设备400可将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为MSB和LSB来对所述MSB和所述LSB进行解码。
缩放信息估计单元401可估计与MSB的符号相关的初始缩放信息。缩放信息估计单元401的操作可与图3的缩放信息估计单元301相同。估计的初始缩放信息可被用于缩放MSB的符号。
例如,当初始缩放信息被估计为“1”时,解码的MSB的符号可按照“1”被缩放。初始缩放信息可与由图3的编码设备300和解码设备400之间的协议确定的值相应。
MSB解码器402可对MSB的符号进行解码。MSB解码器402的操作可与图2的MSB解码器201相同。解码的MSB的符号可被缩放与转义码的解码被执行的次数相同的次数。
LSB解码器403可对LSB的符号进行解码。LSB解码器403的操作可与图2的LSB解码器204相同。可将LSB的符号与缩放的MSB的符号相加来恢复最终解码的频谱系数。
图5包括矢量的示例,其中,所述矢量包括频谱系数。
参照图5,基于频率索引和比特深度示出MSB和LSB。在这种情况下,MSB可指示包括标志(sign)信息的比特。
参照图5,MSB和LSB可通过根据频率索引将量化的频谱系数分组为至少一个单元来构成矢量。每个单元可构成符号,并且MSB和LSB可按照符号单元被编码。在图5中,与LSB的深度相应的“N”可指示级别,并且可基于MSB的缩放被执行的次数来控制。
图6包括与上下文模式相关的紧邻位置处的符号的示例。
根据实施例,位于与MSB的符号604紧邻处的紧邻位置处的符号601、602、603和605可被用于对MSB的符号604进行编码。在这种情况下,所述紧邻位置处的符号601、603和605可与对应于MSB的符号604的先前帧的符号相应,并可指示先前编码的符号。紧邻位置处的符号602可与对应于MSB的符号604的当前帧的先前频域的符号相应,并可指示先前编码的符号。
紧邻位置处的符号601、602、603和605可构成将被用于对MSB的符号604进行编码的上下文。具体地,紧邻位置处的符号601、602、603和605可根据相对位置被设置为上下文模式。可基于与所述上下文模式相应的紧邻位置处的符号来确定将被用于初始缩放信息的符号。
图7包括重新排列MSB的符号的处理的示例。
参照图7,量化的频谱系数可包括两个符号。也就是说,矢量可包括两个量化的频谱系数的符号。符号的数量可不限于两个,两个或更多个符号可被类似地应用。
假定第一符号被设置为x,第二符号被设置为y,并且x和y的绝对值小于或等于4。因此,26(即,5*5+1)种类型的包括转义码的矢量可被表示。根据实施例的图1的重新排列单元102可重新排列MSB的符号。具体地,重新排列单元102可按照值的升序来重新排列MSB的符号。
参照图7,当MSB的符号与(3,1)相应时,也就是说,所述MSB的符号按照降序被排列时,重新排列单元102可将所述MSB的符号重新排列为(1,3)。当MSB的符号按照升序被排列或所述符号的值相同时,重新排列单元102可不重新排列MSB的符号。
在这种情况下,在MSB的符号按照升序被排列的情况下,顺序信息可被设置为“0”,在MSB的符号按照降序被排列的情况下,顺序信息可被设置为“1”。顺序信息可被编码为MSB的符号。在重新排列处理中将被编码的MSB的符号可包括(0,0)、(0,1)、(0,2)、(0,3)、(0,4)、(1,1)、(1,2)、(1,3)、(1,4)、(2,2)、(2,3)、(2,4)、(3,3)、(3,4)、(4,4)。即使不对所有的25个类型的MSB的符号进行编码,通过对顺序信息和15个被列出的类型的MSB的符号进行编码可得到相同的结果。通过改变MSB的符号的构成方案,用于存储编码的结果的存储空间可被减少。
图8包括编码方法的示例。
量化的频谱系数可被分为MSB和LSB来对所述MSB和所述LSB进行编码,例如,由根据实施例的图1的编码设备100对所述MSB和所述LSB进行编码。
在操作801,转义码可被编码,例如,可由编码设备100对转义码进行编码。当量化的频谱系数的值偏离预定范围时,编码设备100可考虑到存储空间的限制缩放量化的频谱系数,使得量化的频谱系数的值可包括在所述预定范围中。在这种情况下,转义码可与指示是否针对量化的频谱系数执行缩放的信息相应。具体地,将被缩放的目标可与量化的频谱系数中的MSB相应。
在操作802,MSB的符号可被重新排列,例如,可由编码设备100重新排列MSB的符号。具体地。编码设备100可按照所述符号的值的升序来重新排列所述MSB的符号。由于将被编码的MSB的符号被减少,因此编码效率可被提高。
在操作803,可针对重新排列的MSB的符号执行算术编码,例如,可由编码设备100针对重新排列的MSB的符号执行算术编码。例如,编码设备100可基于期望被编码的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的编码。编码设备100可选择与所述上下文相应的多个概率模型中的一个来对所述MSB的符号进行编码。
在操作804,可对MSB的符号之间的顺序信息进行编码,例如,可由编码设备100对MSB的符号之间的顺序信息进行编码。例如,当MSB的符号的值彼此不同时,编码设备100可对所述符号之间的顺序信息进行编码。当MSB的符号的值相同时,符号之间的顺序信息不需要被编码。所述顺序信息可按照与对MSB的符号进行编码的相同方式被编码。
在通过转义码执行缩放之后,残差比特可被产生。在操作805,与所述残差比特相应的LSB的符号可被编码,例如,可由编码设备100对与所述残差比特相应的LSB的符号进行编码。
图9包括解码方法的示例。
在操作901,可通过算术解码执行确定符号是与转义码相应还是与MSB的符号相应的解码,例如,可由图2的解码设备200执行所述解码。
当转义码和MSB的符号包括相同级别的符号时,解码设备200可基于期望被解码的当前符号,使用与先前帧或当前帧的先前频域相应的紧邻位置处的符号作为上下文来针对当前符号执行基于上下文的解码。
相反,当转义码和MSB的符号包括不同级别的符号时,所述转义码可被解码,例如,可由解码设备200对转义码进行解码,并且可将所述MSB的符号缩放与所述转义码的解码被执行的次数相同的次数。解码设备200可对缩放的MSB的符号进行解码。
在操作902,可基于MSB的符号对符号之间的顺序信息进行解码,例如,可由解码设备200基于MSB的符号对所述符号之间的顺序信息进行解码。在这种情况下,当MSB的符号彼此不同时,解码设备200可对符号之间的顺序信息进行解码。
在操作903,可基于已解码的顺序信息来调整MSB的符号,例如,可由解码设备200基于已解码的顺序信息来调整所述MSB的符号。当MSB的符号被缩放的次数与转义码的解码被执行的次数相同时,在操作904,解码设备200可对LSB的符号进行解码,并随后将解码的LSB的符号与缩放的MSB的符号相加。因此,可恢复最终的频谱系数。
图10包括编码方法的另一示例。
在操作1001,与MSB的符号相关的初始缩放信息可被估计,例如,可由图3的编码设备300估计所述初始缩放信息。
例如,可由例如图3的编码设备300基于上下文模式估计初始缩放信息,其中,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前编码的MSB的符号之间的相对位置信息。在这种情况下,紧邻位置处的符号可基于与期望被当前编码的MSB的符号相应的当前帧,对应于与先前帧或当前帧的先前频域相应的符号。
例如,可基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息,例如,可由编码设备300基于通过上下文模式确定的紧邻位置处的符号的大小来估计所述初始缩放信息。具体地,编码设备300可基于上下文模式确定用于估计初始缩放信息的谱系数,并且可基于确定的谱系数来估计初始缩放信息。
在操作1002,可针对MSB的符号确定基于初始缩放信息缩放的量化的频谱系数是否偏离预定的范围来对转义码进行编码,例如,由编码设备300对转义码进行编码。频谱系数可被缩放与所述转义码的编码被执行的次数相同的次数。
在操作1003,缩放的MSB的符号可被编码,例如,可由图3的编码设备300对缩放的MSB的符号进行编码。在操作1004,与在缩放处理中产生的残差比特相应的LSB可被编码,例如,可由编码设备300对与在缩放处理中产生的残差比特相应的LSB进行编码。
图11包括解码方法的另一示例。
在操作1101,与MSB的符号相关的初始缩放信息可被估计,例如,可由图4的解码设备400估计与MSB的符号相关的初始缩放信息。估计的初始缩放信息可被用于缩放MSB的符号。例如,解码设备400可基于上下文模式来估计初始缩放信息,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前编码的MSB的符号之间的相对位置信息。
在操作1102,MSB的符号可被解码,例如,可由图4的解码设备400对MSB的符号进行解码。解码的MSB的符号可被缩放与转义码的解码被执行的次数相同的次数。
在操作1103,解码设备400可对LSB的符号进行解码,例如,由解码设备400执行所述解码。可将LSB的符号与缩放的MSB的符号相加来恢复最终解码的频谱系数。
上述包括对量化的频谱系数进行编码和解码的方法的处理、功能、方法和/或软件可被记录、存储或固定在一个或多个非瞬时性计算机可读存储介质或处理器可读存储介质中,其中,所述非瞬时性计算机可读存储介质或处理器可读存储介质包括将由计算机实施的程序指令以促使处理器运行或执行所述程序指令。所述介质还可单独包括数据文件和数据结构等,或者可包括与程序指令结合的数据文件和数据结构等。所述介质和程序指令可以是特别设计和构造的程序指令,或者它们可以是对计算机软件领域的技术人员而言公知的且可用的种类的程序指令。这里描述的包括对量化的频谱系数进行编码和解码的方法的方法可在通用计算机或处理器上被执行,或者可在诸如这里描述的编码设备和解码设备的特定机器上被执行。
计算机可读介质或处理器可读介质的示例包括:磁介质(诸如硬盘、软盘和磁带)、光介质(诸如CD-ROM盘和DVD)、磁光介质(诸如光盘)以及专门配置为存储和执行程序指令的硬件装置(诸如只读存储器(ROM),随机存取存储器(RAM)、闪存等)。程序指令的示例包括机器代码(诸如由编译器产生的代码)和包含可由计算机或处理器使用解释器执行的更高级代码的文件两者。
描述的硬件单元可被配置为充当一个或多个软件模块,以便执行上述实施例的操作。这里描述的软件模块中的任何一个或多个可由对于所述单元唯一的专用处理器执行,或者可由对于一个或多个模块共有的处理器执行。
上面已经描述了多个示例。然而,应该理解,可进行各种修改。例如,如果以不同的顺序执行描述的技术和/或如果描述的系统、架构、装置或电路中的部件以不同的方式组合和/或由其它的部件或其等同物代替或补充,可实现合适的结果。因此,其它实施方式在权利要求的范围内。

Claims (20)

1.一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码,所述编码设备包括:
转义码编码器,用于对与指示是否针对量化的频谱系数执行缩放的信息相应的转义码进行编码;
重新排列单元,用于重新排列MSB的符号;
MSB编码器,用于针对重新排列的MSB的符号执行算术编码;
顺序信息编码单元,用于对MSB的符号之间的顺序信息进行编码;
LSB编码器,用于对通过转义码执行缩放之后产生的残差比特相应的LSB的符号进行编码。
2.如权利要求1所述的编码设备,其中,所述重新排列单元按照值的升序来重新排列MSB的符号。
3.如权利要求1所述的编码设备,其中,当MSB的符号的值彼此不同时,所述顺序信息编码单元对所述MSB的符号之间的顺序信息进行编码。
4.一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码,所述解码设备包括:
MSB解码器,用于对编码的MSB的符号进行解码;
顺序信息解码器,用于基于解码的MSB的符号来对所述符号之间的顺序信息进行解码;
调整单元,用于基于顺序信息来调整MSB的符号;
LSB解码器,用于对LSB的符号进行解码。
5.如权利要求4所述的解码设备,其中,当解码的MSB的符号彼此不同时,所述顺序信息解码器对解码的MSB的符号之间的顺序信息进行解码。
6.一种编码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码,所述编码设备包括:
缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息;
转义码编码器,用于对与指示是否针对基于初始缩放信息缩放的量化的频谱系数执行缩放的信息相应的转义码进行编码;
MSB编码器,用于对缩放的MSB的符号进行编码;
LSB编码器,用于对与通过转义码执行缩放之后产生的残差比特相应LSB的符号进行编码。
7.如权利要求6所述的编码设备,其中,所述缩放信息估计单元基于上下文模式来估计初始缩放信息,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前编码的MSB的符号之间的相对位置信息。
8.如权利要求7所述的编码设备,其中,所述缩放信息估计单元基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
9.一种解码设备,用于将量化的频谱系数构成为至少一个元组,并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码,所述解码设备包括:
缩放信息估计单元,用于估计与MSB的符号相关的初始缩放信息;
MSB解码器,用于对MSB的符号进行解码;
LSB解码器,用于对LSB的符号进行解码。
10.如权利要求9所述的解码设备,其中,所述缩放信息估计单元基于上下文模式来估计初始缩放信息,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前解码的MSB的符号之间的相对位置信息。
11.如权利要求10所述的解码设备,其中,所述缩放信息估计单元基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
12.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码的编码方法,所述编码方法包括:
对与指示是否针对量化的频谱系数执行缩放的信息相应的转义码进行编码;
按照值的升序重新排列MSB的符号;
针对重新排列的MSB的符号执行算术编码;
当MSB的符号的值彼此不同时,对MSB的符号之间的顺序信息进行编码;
对通过转义码执行缩放之后产生的残差比特相应的LSB的符号进行编码。
13.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码的解码方法,所述解码方法包括:
对编码的MSB的符号进行解码;
基于解码的MSB的符号,对所述符号之间的顺序信息进行解码;
基于解码的顺序信息来调整MSB的符号;
对LSB的符号进行解码。
14.如权利要求13所述的解码方法,其中,对所述符号之间的顺序信息进行解码的步骤包括:当所述符号彼此不同时,对解码的MSB的符号之间的顺序信息进行解码。
15.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行编码的编码方法,所述编码方法包括:
估计与MSB的符号相关的初始缩放信息;
对与指示是否针对基于初始缩放信息缩放的量化的频谱系数执行缩放的信息相应的转义码进行编码;
对缩放的MSB的符号进行编码;
对与通过转义码执行缩放之后产生的残差比特相应LSB的符号进行编码。
16.如权利要求15所述的编码方法,其中,估计的步骤包括:基于上下文模式来估计初始缩放信息,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前编码的MSB的符号之间的相对位置信息。
17.如权利要求16所述的编码方法,其中,估计的步骤包括:基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
18.一种将量化的频谱系数构成为至少一个元组并将所述至少一个元组分为最高有效位(MSB)和最低有效位(LSB)来对所述MSB和所述LSB进行解码的解码方法,所述解码方法包括:
估计与MSB的符号相关的初始缩放信息;
对MSB的符号进行解码;
对LSB的符号进行解码。
19.如权利要求18所述的解码方法,其中,估计的步骤包括:基于上下文模式来估计初始缩放信息,所述上下文模式指示MSB的符号的紧邻位置处的符号与期望被当前解码的MSB的符号之间的相对位置信息。
20.如权利要求19所述的编码方法,其中,估计的步骤包括:基于通过上下文模式确定的紧邻位置处的符号的大小来估计初始缩放信息。
CN201180045512.4A 2010-07-21 2011-07-21 用于基于上下文进行无损编码和解码的方法和设备 Expired - Fee Related CN103119649B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020100070611A KR101676477B1 (ko) 2010-07-21 2010-07-21 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
KR10-2010-0070611 2010-07-21
PCT/KR2011/005367 WO2012011748A2 (en) 2010-07-21 2011-07-21 Method and apparatus for lossless encoding and decoding based on context

Publications (2)

Publication Number Publication Date
CN103119649A CN103119649A (zh) 2013-05-22
CN103119649B true CN103119649B (zh) 2015-05-20

Family

ID=45493598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180045512.4A Expired - Fee Related CN103119649B (zh) 2010-07-21 2011-07-21 用于基于上下文进行无损编码和解码的方法和设备

Country Status (5)

Country Link
US (1) US8487789B2 (zh)
EP (1) EP2596495A4 (zh)
KR (1) KR101676477B1 (zh)
CN (1) CN103119649B (zh)
WO (1) WO2012011748A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101766457B1 (ko) * 2015-02-12 2017-08-08 두산중공업 주식회사 막오염 지수 측정 장치
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133512A (zh) * 1994-09-30 1996-10-16 株式会社理光 编码与解码数据的方法和装置
CN1681213A (zh) * 2004-03-10 2005-10-12 三星电子株式会社 无损音频编码/解码方法和装置
CN1684371A (zh) * 2004-02-27 2005-10-19 三星电子株式会社 无损音频解码/编码方法和装置
CN1945695A (zh) * 2005-10-04 2007-04-11 三星电子株式会社 对音频信号编码/解码的方法和设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5878273A (en) * 1993-06-24 1999-03-02 Discovision Associates System for microprogrammable state machine in video parser disabling portion of processing stages responsive to sequence-- end token generating by token generator responsive to received data
GB9509831D0 (en) * 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
ATE510279T1 (de) 2004-03-25 2011-06-15 Dts Inc Verlustloser mehrkanaliger audio-codec
WO2006006936A1 (en) 2004-07-14 2006-01-19 Agency For Science, Technology And Research Context-based encoding and decoding of signals
US7788106B2 (en) * 2005-04-13 2010-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Entropy coding with compact codebooks
KR101237413B1 (ko) 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
US7623047B2 (en) * 2007-10-30 2009-11-24 Hewlett-Packard Development Company, L.P. Data sequence compression
KR101539256B1 (ko) 2008-07-15 2015-07-30 삼성전자주식회사 오디오 신호의 중요 주파수 성분들에 대한 위치 정보를부호화/복호화하는 인코더 및 디코더
KR101456495B1 (ko) 2008-08-28 2014-10-31 삼성전자주식회사 무손실 부호화/복호화 장치 및 방법
KR101485339B1 (ko) 2008-09-29 2015-01-26 삼성전자주식회사 무손실 부호화/복호화 장치 및 방법
WO2010106631A1 (ja) * 2009-03-17 2010-09-23 キーパー=スミス エル・エル・ピー 画像表示システム、画像表示装置、画像提供装置およびその方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133512A (zh) * 1994-09-30 1996-10-16 株式会社理光 编码与解码数据的方法和装置
CN1684371A (zh) * 2004-02-27 2005-10-19 三星电子株式会社 无损音频解码/编码方法和装置
CN1681213A (zh) * 2004-03-10 2005-10-12 三星电子株式会社 无损音频编码/解码方法和装置
CN1945695A (zh) * 2005-10-04 2007-04-11 三星电子株式会社 对音频信号编码/解码的方法和设备

Also Published As

Publication number Publication date
EP2596495A4 (en) 2016-02-17
US20120020406A1 (en) 2012-01-26
KR20120009837A (ko) 2012-02-02
CN103119649A (zh) 2013-05-22
KR101676477B1 (ko) 2016-11-15
WO2012011748A2 (en) 2012-01-26
EP2596495A2 (en) 2013-05-29
WO2012011748A3 (en) 2012-04-19
US8487789B2 (en) 2013-07-16

Similar Documents

Publication Publication Date Title
CN102859583B (zh) 利用对数值先前脉络值的数字表示之修改的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
ES2388942T3 (es) Codificación entrópica adaptando la codifidación entre modos de nivel y de longitud de serie/nivel
JP4963498B2 (ja) 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化
MX2011003815A (es) Decodificador de audio, codificador de audio, metodo para decodificar una señal de audio, metodo para codificar una señal de audio, programa de computadora y señal de audio.
KR20120043160A (ko) 다단계 양자화 방법 및 장치
JP2011522291A (ja) オーバーラッピング変換の2つのブロック変換への因数分解
CN111933160B (zh) 调适最低有效比特的编码与解码的音频编码器、音频解码器、方法及计算机程序
JP7257965B2 (ja) デジタルオーディオ信号における差分データ
JP7389651B2 (ja) デジタルオーディオ信号における可変アルファベットサイズ
JP2004258603A (ja) レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
CN103119649B (zh) 用于基于上下文进行无损编码和解码的方法和设备
US20110135007A1 (en) Entropy-Coded Lattice Vector Quantization
WO2008021185A2 (en) A method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns
JP2016527546A (ja) 信号の符号化および復号化の方法および装置
CN105103226A (zh) 低复杂度音调自适应音频信号量化
US8924202B2 (en) Audio signal coding system and method using speech signal rotation prior to lattice vector quantization
US11508386B2 (en) Audio coding method based on spectral recovery scheme
Vasilache New directions in lattice based lossy compression
CN105632505B (zh) 主成分分析pca映射模型的编解码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Zhu Jixian

Inventor after: Wu Yinmei

Inventor before: Zhu Jixian

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: ZHU JIXIAN TO: ZHU JIXIAN WU YINMEI

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150520

Termination date: 20200721

CF01 Termination of patent right due to non-payment of annual fee