CN111179946A - 无损编码方法和无损解码方法 - Google Patents
无损编码方法和无损解码方法 Download PDFInfo
- Publication number
- CN111179946A CN111179946A CN202010005273.0A CN202010005273A CN111179946A CN 111179946 A CN111179946 A CN 111179946A CN 202010005273 A CN202010005273 A CN 202010005273A CN 111179946 A CN111179946 A CN 111179946A
- Authority
- CN
- China
- Prior art keywords
- encoding
- decoding
- mode
- quantization index
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 211
- 238000013139 quantization Methods 0.000 claims abstract description 159
- 230000004044 response Effects 0.000 claims abstract description 5
- 238000012856 packing Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 30
- 230000003595 spectral effect Effects 0.000 description 27
- 230000005236 sound signal Effects 0.000 description 22
- 238000001228 spectrum Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000009826 distribution Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000005070 sampling Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- MOXZPMYMMBOUJY-UHFFFAOYSA-N n-[2-(2-aminoethylsulfanyl)ethyl]-5-(dimethylamino)naphthalene-1-sulfonamide Chemical compound C1=CC=C2C(N(C)C)=CC=CC2=C1S(=O)(=O)NCCSCCN MOXZPMYMMBOUJY-UHFFFAOYSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种无损编码方法和无损解码方法。所述无损编码方法包括:基于能量的量化索引被表示的范围来选择第一编码方法和第二编码方法中的一个,通过使用选择的编码方法对量化索引进行编码。无损解码方法包括:确定比特流中所包括的能量的差分量化索引的编码方法,响应于确定的编码方法,通过基于能量的量化索引被表示的范围使用第一解码方法和第二解码方法中的一个来对差分量化索引进行解码。
Description
本申请是申请日为2014年09月15日,申请号为“201480062275.6”,标题为“能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备”的发明专利申请的分案申请。
技术领域
一个或更多个示例性实施例涉及对音频信号或语音信号的编码和解码,更具体而言,涉及一种能量无损编码方法和设备、一种信号编码方法和设备、一种能量无损解码方法和设备、一种信号解码方法和设备以及采用上述方法和设备的多媒体装置,其中,在不增加复杂度或降低重构声音的质量的情况下,减少用于在有限的比特范围内对频谱的能量信息进行编码的比特的数量,因此用于对频谱的实际频率分量进行编码的比特的数量增加。
背景技术
在对音频信号或语音信号进行编码时,除了频谱的实际频率分量之外,边信息(诸如,能量或包络)可被添加到比特流中。在这种情况下,通过在损失被最小化的情况下减少为了对边信息进行编码而分配的比特的数量来增加为了对频谱的频率分量进行编码而分配的比特的数量。
也就是说,在对音频信号或语音信号进行编码或解码的情况下,尤其是在低比特率下需要通过有效地使用有限的比特来在相应比特范围内重构具有最佳声音质量的音频信号或语音信号。
发明内容
技术问题
一个或更多个示例性实施例包括一种能量无损编码方法、一种信号编码方法、一种能量无损解码方法以及一种信号解码方法,在上述方法中,在不增加复杂度或降低重构声音的质量的情况下,减少用于在有限的比特范围内对频谱的包络或能量进行编码的比特的数量,并且用于对频谱的实际频率分量进行编码的比特的数量增加。
一个或更多个示例性实施例包括一种能量无损编码设备、一种信号编码设备、一种能量无损解码设备以及一种信号解码设备,其中,在不增加复杂度或降低重构声音的质量的情况下,减少用于在有限的比特范围内对频谱的能量进行编码的比特的数量,并且用于对频谱的实际频率分量进行编码的比特的数量增加。
一个或更多个示例性实施例包括一种计算机中的存储用于执行以下方法的程序的非暂时性计算机可读存储介质:能量无损编码方法、信号编码方法、能量无损解码方法或信号解码方法。
一个或更多个示例性实施例包括一种使用以下设备的多媒体装置:能量无损编码设备、信号编码设备、能量无损解码设备或信号解码设备。
技术方案
根据一个或更多个示例性实施例,一种无损编码方法包括:基于能量的量化索引被表示的范围来选择第一编码方法和第二编码方法中的一个;通过使用选择的编码方法对量化索引进行编码。
根据一个或更多个示例性实施例,信号编码方法包括:对以频带为单位从频谱系数获得的能量进行量化,其中,频谱系数是从时域的音频信号产生的;考虑到表示能量的量化索引的比特的数量以及通过分别基于大符号编码方法和小符号编码方法对能量的量化索引进行编码而获得的比特的数量,选择用于对能量的量化索引进行无损编码的编码方法;基于恢复的能量为以频带为单位的编码分配比特;基于分配的比特对频谱系数进行量化和无损编码。
根据一个或更多个示例性实施例,无损解码方法包括:确定对比特流中所包括的能量的差分量化索引的编码方法;响应于确定的编码方法,通过使用第一解码方法和第二解码方法中的一个对差分量化索引进行解码,其中,第一解码方法和第二解码方法基于能量的量化索引被表示的范围。
根据一个或更多个示例性实施例,一种无损解码方法包括:确定对从比特流获得的编码的能量的差分量化索引的编码方法,并且响应于确定的编码方法,通过使用大符号解码方法和小符号解码方法中的一个对编码的差分量化索引进行解码;对解码的差分量化索引进行反量化,并基于恢复的能量,为以频带为单位的解码分配比特;对从比特流获得的频谱系数进行无损解码;基于分配的比特对无损解码的频谱系数进行反量化。
技术效果
根据一个或更多个示例性实施例,通过使用脉冲模式和缩放模式中的一个来对在指示能量的量化索引中的表示范围大的符号进行编码。因此,用于对能量进行编码的比特的数量被减少,并且因此可为对频谱进行的编码分配更多的比特。
附图说明
图1是示出根据示例性实施例的音频编码设备的配置的框图。
图2是示出根据示例性实施例的音频解码设备的配置的框图。
图3是示出根据示例性实施例的能量无损编码设备的配置的框图。
图4是示出图3的第一无损编码器的详细配置的框图。
图5是示出根据示例性实施例的编码方法和编码模式的表格。
图6是示出在大符号编码方法中使用的哈夫曼编码表的示例的示图。
图7是示出在脉冲模式下的比特分配的示例的示图。
图8是示出图3的第二无损编码器的详细配置的框图。
图9是示出图8的高位比特编码器的详细配置的框图。
图10示出在图9的第一哈夫曼模式编码器中使用的分组上下文的示例。
图11是描述根据示例性实施例的用于确定编码方法的比特计算操作的流程图。
图12是示出根据示例性实施例的能量无损解码设备的配置的框图。
图13是示出图12的第一无损解码器的详细配置的框图。
图14是示出图12的第二无损解码器的详细配置的框图。
图15是示出图13的高位比特解码器的详细配置的框图。
图16是用于描述小符号编码方法的示图。
图17是根据示例性实施例的多媒体装置的框图。
图18是根据另一示例性实施例的多媒体装置的框图。
图19是根据另一示例性实施例的多媒体装置的框图。
具体实施方式
由于发明构思可具有各种各样的修改的实施例,因此在附图中示出并且在对发明构思的详细描述中描述优选的实施例。然而,这不将发明构思限制在特定实施例内,应理解的是,发明构思覆盖发明构思的思想和技术范围内的所有修改、等同物和替代物。另外,涉及公知功能或配置的详细描述将被排除以便不会不必要地使发明构思的主题模糊。
将理解的是,虽然在这里使用第一和第二的术语来描述各种元件,但是这些元件不应该被这些术语所限制。术语仅用于将一个组件与其它组件区分开。
在下面的描述中,技术术语仅用于解释特定的示例性实施例,但不限制发明构思。考虑到发明构思的功能,在发明构思中使用的术语作为目前广泛使用的一般术语已经被选择,但是在发明构思中使用的术语可根据本领域的普通技术操作者的意图、传统实践或新技术的引入而被改变。此外,如果存在在特定情况下被申请人任意地选择的术语,则在这种情况下,术语的含义将在发明构思的相应描述部分中被详细地描述。因此,术语应在本说明书的整个内容而不是每个术语的简单名称的基础上被限定。
除非进行相反的指示,否则单数形式的术语可包括复数形式。“包括”、“包含”或“具有”的含义指定属性、区域、固定数字、步骤、处理、元件和/或组件,但不排除其它属性、区域、固定数字、步骤、处理、元件和/或组件。
在下文中,将参照附图详细地描述示例性实施例。贯穿对附图的描述,同样的标号指示同样的元件,并且不提供对相同元件的重复描述。
图1是示出根据示例性实施例的音频编码设备的配置的框图。
图1的信号编码设备可包括:变换器110、能量量化器120、能量无损编码器130、比特分配器140、频谱量化器150、频谱无损编码器160和复用器170。可以可选择地提供复用器170,并且复用器170可被执行比特打包(packing)功能的另一元件所替代。可选地,被无损编码的能量数据和被无损编码的频谱数据可构成单独的比特流并且可被存储或被发送。信号编码设备100还可包括在频谱量化操作之后或之前通过使用能量值来执行归一化的归一化器(未示出)。元件中的每个元件可被集成到一个或更多个模块中,并且可用一个或更多个处理器(未示出)来实现。这里,信号可指示多媒体信号(诸如,指示音频的声音、音乐、语音或它们的混合信号),但是在下文中,为了解释的方便,信号被称为音频信号。输入到信号编码设备100的时域的音频信号可具有各种采样率,并且针对每个采样率的用于对频谱进行量化的能量的频带配置可被改变。因此,执行无损编码的量化后的能量的数量可被改变。采样率的示例可包括7.2kHz,8kHz,13.2kHz,16.4kHz,32kHZ和48kHz,但是不限于此。采样率和目标比特率被确定的时域的音频信号可被提供给变换器110。
在图1中,变换器110可将时域的音频信号(例如,脉冲编码调制(PCM)信号)变换到频域以产生音频频谱。在这种情况下,时域到频域的变换可通过使用已知的各种方法(诸如,改进型离散余弦变换(MDCT))来执行。从变换器110获得的音频频谱的变换系数(例如,MDTC系数)可被提供给能量量化器120和频谱量化器150。
能量量化器120可以以频带为单位从提供自变换器110的变换系数获得能量。频带是对音频频谱的样点进行分组的单位并且在反映临界频带时可具有统一或不统一的长度。当不统一时,频带可被设置为使得一个频带中所包括的样点的数量针对一个帧沿从起始样点到最后样点的方向逐渐增加。此外,在支持多个比特率的情况下,频带可被设置为使得在不同比特率下彼此相应的各个频带中所包括的样点的数量相同。在一个帧中所包括的频带的数量或在频带中所包括的样点的数量可被预先确定。能量值可指示频带中所包括的变换系数的包络,并且表示平均幅度、平均能量、功率或范数值。这里,频带可表示参数频带或缩放因子频带。
例如,频带b的能量EM(b)可被计算为如下面的等式1中所示。
等式1
其中,XM(k)表示频谱系数,kstart(b)表示起始样点,kend(b)表示频带的最后样点。
能量量化器120可对获得的能量进行量化以产生索引。根据示例性实施例,在瞬态模式的情况下,在量化之前通过对将被量化的能量进行重新排序(例如通过执行重新排序操作)使得与偶数子帧(索引m=0,2)相应的能量处于频率升高的顺序并且与奇数子帧(索引m=1,3)相应的能量处于频率降低的顺序,可实现有效能量差分编码。在每个帧中,可用量化步长大小(例如,统一标量量化器值qint)对能量进行标量量化。统一标量量化器值qint可以是可变的,并且例如可基于带宽和模式而被选择。
例如,能量的量化索引IM(b)可被计算为如下面的等式2中所示。
等式2
根据示例性实施例,多个子向量能量的量化索引可以以差分方式被编码。为此,可针对当前频带获得当前频带的量化索引和前一频带的量化索引之间的差(即,差分索引)。在这种情况下,由于在帧中不存在第一频带之前的频带,因此第一频带的差分索引可通过将第一频带的量化索引减去特定值来获得。例如,第一频带的差分索引△IM(0)和其它频带的差分索引△IM(b)可被计算为如下面的等式3中所示。
等式3
ΔIM(b)=IM(b)-IM(b-1),b=1,...,Nbands-1
其中,Iref表示参考频带能量并且可被设置为24。
根据示例性实施例,差分索引△IM(b)可被限制为特定范围(例如,范围[-256,256])。如下面的等式4中所示,这可通过首先调整负差分索引然后调整正差分索引来实现。
等式4
ifΔIM(b)<-256
ΔIM(b)=-256
end
ifΔIM(b)>255
ΔIM(b)=255
end b=0,...,Nbands-1
能量无损编码器130可对从能量量化器120提供的索引、差分索引或限制后的差分索引执行无损编码。根据示例性实施例,能量无损编码器130可基于表示差分索引和比特消耗所需要的范围或能力以帧为单位通过使用第一编码方法或第二编码方法来执行无损编码。这里,第一编码方法是大符号编码方法,并且可在表示索引所需的符号的数量相对地大于第二编码方法时被应用。第二编码方法是小符号编码方法,并且可在表示索引所需的符号的数量相对地小于第一编码方法时被应用。当大符号编码方法被选作编码方法时,频带能量可在脉冲模式或缩放模式下被编码。当小符号编码方法被选作编码方法时,高位比特和低位比特可被分别编码。具体而言,高位比特可在基于上下文的哈夫曼编码模式或改变大小的哈夫曼编码模式下被编码,低位比特可通过比特打包被处理。指示编码方法的编码方法索引(即,标记比特DENG_CMODE)和指示每个编码方法中的编码模式的编码模式索引(即,标记比特LC_MODE)可作为边信息被添加到比特流中,并且可被发送到解码器。这样的能量或包络编码模式可被表示为如图5中所示。
根据示例性实施例,在小符号编码方法中,能量无损编码器130可基于估计的由基于上下文的哈夫曼编码模式和改变大小的哈夫曼编码模式所消耗的比特的数量来选择编码模式。
比特分配器140可对从能量量化器120提供的量化索引进行反量化以恢复能量。比特分配器140可基于目标比特率针对比特的总数通过使用以频带为单位恢复的能量来计算掩蔽阈值,并基于掩蔽阈值以整数为单位或以分数为单位来确定对每个频带的感知编码所必需的分配比特的数量。具体而言,比特分配器140可通过使用以频带为单位恢复的能量来估计允许的比特的数量以分配比特,并限制分配比特的数量以便不超过允许比特的数量。在这种情况下,可从能量大的频带起顺序地分配比特。此外,可通过根据每个频带的感知重要性将权重值分配给每个频带的能量来向在感知上重要的频带分配更多比特。例如,可通过ITU-T G.719中的心理声学加权来确定感知重要性。
频谱量化器150可通过使用以频带为单位确定的分配比特的数量对从变换器110提供的变换系数进行量化以产生频谱的量化索引。
频谱无损编码器160可对从频谱量化器150提供的频谱的量化索引执行无损编码。作为无损编码算法的示例,可使用已知算法,诸如,哈夫曼编码或阶乘脉冲编码(FPC)。作为无损编码的结果而获得的数据可被添加到比特流中并可被存储或被发送。
复用器170可从提供自能量无损编码器130的能量数据和提供自频谱无损编码器160的频谱数据产生比特流。
图2是示出根据示例性实施例的音频解码设备200的配置的框图。
图2的音频解码设备200可包括:解复用器210、能量无损解码器220、能量反量化器230、比特分配器240、频谱无损解码器250、频谱反量化器260和逆变换器270。元件中的每个元件可被集成到一个或更多个模块中,并且可用一个或更多个处理器(未示出)来实现。类似于音频编码设备100,可以可选择地提供解复用器210,并且解复用器210可被执行比特解包功能的另一元件所替代。信号解码设备200还可包括在频谱反量化操作之后或之前通过使用能量值来执行逆归一化的逆归一化器(未示出)。
在图2中,解复用器210可通过解析比特流来向能量无损解码器220提供编码的能量数据,并且向频谱无损解码器250提供编码的频谱数据。
能量无损解码器220可对编码的能量数据进行无损解码以获得能量的量化索引。根据示例性实施例,当通过编码端执行了差分编码时,差分量化索引可被获得。当差分量化索引被获得时,可如下面的等式5中所示对每个频带的量化索引进行重构。
等式5
I′M(0)=ΔIM(O)+Iref
I′M(b)=ΔIM(b)+I′M(b-1),b=l,...,Nbands-1
能量反量化器230可对从能量无损解码器220提供的能量的量化索引进行反量化以重构能量。具体而言,能量反量化器230可将能量的量化索引乘以量化步长大小(例如,统一标量量化器值qint)以重构能量。
比特分配器240可通过使用从能量反量化器230提供的重构的能量以频带为单位执行整数或分数单位的比特分配。具体而言,依据样点的比特可从能量大的频带起被顺序地分配。也就是说,用于每个样点的比特可被首先分配给具有最大能量的频带,并且通过将相应频带的能量减去特定单位,优先级可被改变为使得比特可被分配给另一频带。这样的操作被重复地执行直到可用于给定帧的全部比特都被消耗为止。比特分配器240的操作与音频编码设备100的比特分配器140实质上相同。
频谱无损解码器250可对编码的频谱数据执行无损解码以获得频谱量化索引。
频谱反量化器260可通过使用以频带为单位而确定的分配比特的数量对从频谱无损解码器250提供的频谱量化索引进行反量化,从而对频谱变换系数进行重构。
逆变换器250可对从频谱反量化器260提供的频谱变换系数进行逆变换以重构时域的音频信号。
图3是根据示例性实施例的能量无损编码设备300的配置的框图。
图3的能量无损编码设备300可包括:编码方法确定器310、第一无损编码器330和第二无损编码器350。多个元件中的每个元件可被集成到一个或更多个模块中,并且可用一个或更多个处理器(未示出)来实现。无损编码的输入可以是量化索引或差分量化索引。这里,作为示例,差分量化索引将被描述。
在图3中,编码方法确定器310可将第一编码方法和第二编码方法中的一个编码方法确定为针对差分量化索引的编码方法。当第一编码方法被选择时,编码方法确定器310可向第一无损编码器330提供差分量化索引,当第二编码方法被选择时,编码方法确定器310可向第二无损编码器350提供差分量化索引。当帧的所有频带中的量化索引中的至少一个量化索引不能被表示在[-32,31](针对第一索引为[-46,17])中时,编码方法确定器310可将第一编码方法确定为针对量化索引的编码方法。具体而言,第一编码方法可对能够用超过64个符号的256个符号或512个符号表示的数据进行编码,第二编码方法可对被限制为64个符号的数据进行编码。当不要求第一编码方法时,可从第一编码方法和第二编码方法中选择消耗较少的比特数量的编码方法。具体而言,可通过使用第二编码方法的多个模式来对针对当前帧中的所有频带的量化索引进行编码,并且可基于通过以下比较而获得的比较结果来确定第一编码方法和第二编码方法中的一个编码方法:将作为经由多个模式进行编码的结果的最少使用比特与作为经由第一编码方法进行编码的结果的使用比特进行比较。响应于编码方法确定结果,用于指示差分量化索引的编码方法的1比特的边信息可被产生并被添加到比特流中。当第二编码方法被选作编码方法时,编码方法确定器310可将N比特的差分量化索引划分为高位比特(N0比特)和低位比特(N1比特)以便之后被提供给第二无损编码器350。这里,N0可被表示为N-N1,N1可被表示为N-N0。根据示例性实施例,N可被设置为6,N0可被设置为5,N1可被设置为1。
当第一编码方法(即,大符号编码方法)被编码方法确定器310确定时,第一无损编码器330可从脉冲模式和缩放模式之中选择一个模式以对量化索引进行量化。脉冲模式可适合于不存在超出[-4,3]的范围的量化索引的情况。例如,当量化索引超出[-4,3]的范围时,脉冲模式可不被使用,而缩放模式可一直被使用。此外,当第一索引超出[-64,63]的范围时,缩放模式可一直被使用。在大符号编码方法中,可使用基于图6中示出的具有8个符号的哈夫曼编码表的哈夫曼编码模式。
在脉冲模式下可存在两个指示符。所述两个指示符中的一个指示符是指示第一索引是否被单独发送的第一指示符“indIo”,另一指示符是指示是否存在超出[-4,3]的范围的量化索引(即,脉冲)的第二指示符“indpls”。当第一索引在[-4,3]的范围内时,第一指示符可被设置为0,并且第一索引可通过使用图6中示出的哈夫曼编码表与另一索引一起被哈夫曼编码。当第一索引不在[-4,3]的范围内时,第一指示符可被设置为1,并且可在将64增加到第一索引之后通过使用7个比特来被打包。
当在当前帧中存在脉冲时,第二指示符可被设置为1,并且可通过分别使用5比特和7比特来发送脉冲位置“plspos”和脉冲幅度“plsamp”。随后,可通过使用图6的哈夫曼编码表对所有的其它索引进行编码。在脉冲模式下的比特分配的示例如图7中所示。在图7中,cmd0指示编码方法,cmd1指示脉冲模式或缩放模式,△IM(0)指示第一索引。
在缩放模式下,索引可根据所有索引的最大值和最小值而被划分为三个高位比特和一些低位比特。所述三个高位比特可通过使用图6的哈夫曼编码表被编码,低位比特可被打包。低位比特的数量可被限定为bitshift。bitshift可被计算以通过将量化索引缩小来使所有量化索引适合于[-4,3]的范围内。作为缩放结果,所有量化索引可用3比特来表示。
第二无损编码器350可将差分量化索引划分为高位比特和低位比特,对高位比特应用哈夫曼编码模式,对低位比特执行比特打包。
图4是示出图3的第一无损编码器的详细配置的框图。
图4的第一无损编码器400可包括脉冲模式编码器410和缩放模式编码器430。
参照图4,当输入的差分量化索引的一些数据不在限定的表示范围内时,脉冲模式编码器410可被有效地使用。也就是说,脉冲模式编码器410可对所述一些数据(即,脉冲)单独编码,并可通过使用哈夫曼编码模式对其它数据进行编码。
具体而言,在脉冲模式下,与第一量化索引是否被单独发送有关的信息、当第一量化索引被单独发送时的第一量化索引△IM(0)、与脉冲的存在性有关的信息、以及当脉冲存在时与脉冲的位置和幅度有关的信息可作为边信息被发送。未以这种方式被发送的其它量化索引可基于哈夫曼编码方法被发送。
当差分量化索引向量具有多个大的值时,缩放模式编码器430可被有效地使用。也就是说,缩放模式编码器430可将所有向量的值缩减到所有向量能够被哈夫曼编码模式表示的范围,以被分配给高位比特,并基于被缩减操作移除的至少一个比特来配置低位比特。具体而言,在缩放模式下,输入的差分量化索引向量中的所有值可被缩小以将值缩减到可被哈夫曼编码方法发送的范围,并且向右移位的比特的数量可作为缩放信息被发送。此外,在缩放操作中被移除的至少一个低位比特(例如,重要性最低的比特)可通过比特打包而被发送,并且通过缩放操作缩减后的值可基于哈夫曼编码被发送。
图8是示出图3的第二无损编码器的详细配置的框图。
图8的第二无损编码器800可包括高位比特编码器810和低位比特编码器830。
参照图8,高位比特编码器810可对差分量化索引的高位比特进行编码,低位比特编码器830可对差分量化索引的低位比特进行打包。
这里,可在差分量化索引被划分为高位比特和低位比特之前通过将46增加到第一频带并将32增加到其它频带来将差分量化索引调整为具有正值。具体而言,可通过将第一频带增加46的偏移并将其它频带增加32的偏移来将通过等式4获得的差分量化索引限制到[0,63]的范围。当在当前帧不是瞬态帧的情况下,约束的差分量化索引超出[0,63]的范围,以及在当前帧是瞬态帧的情况下,约束的差分量化索引超出[0,31]的范围时,大符号编码方法可被使用。
具体而言,高位比特编码器810可针对由N0比特所表示的高位比特配置2N0个符号,并且可通过使用多种哈夫曼编码模式之中的消耗较少数量的比特的模式来执行编码。高位比特编码器810可具有例如两种哈夫曼编码模式。在这种情况下,指示高位比特的编码模式的1比特的边信息D1可与指示编码方法的1比特的边信息D0一起被添加到比特流中。
低位比特编码器830可通过将比特打包方法应用到由N1比特表示的低位比特来执行编码。当一个帧用数量为Nb的频带来配置时,可通过使用总计N1×Nb个比特来对低位比特进行编码。
图9是示出图8的高位比特编码器的详细配置的框图。
图9的高位比特编码器900可包括第一哈夫曼模式编码器910和第二哈夫曼模式编码器930。
参照图9,第一哈夫曼模式编码器910可根据基于上下文的哈夫曼编码模式来对差分量化索引的高位比特进行编码。第二哈夫曼模式编码器930可基于改变大小的哈夫曼编码模式来对差分量化索引的高位比特进行编码。
第一哈夫曼模式编码器910可将用作上下文的前一频带的差分量化索引的范围划分为多个组,并基于针对所述多个组中的每个组预先确定的哈夫曼编码表来对当前频带的差分量化索引执行哈夫曼编码。这里,可使用大型数据库通过例如训练处理来产生哈夫曼编码表。具体而言,可基于特定基准来采集数据,并且可基于采集的数据来产生哈夫曼编码表。根据示例性实施例,可基于前一频带的差分量化索引的范围来采集与当前频带的差分量化索引的频率数量有关的数据,并且可针对每个组来产生哈夫曼编码表。
可通过使用当前频带的差分量化索引的概率分布的分析结果来选择各种分布模型,因此,具有相似分布模型的量化等级可被分组,其中,当前频带的差分量化索引是通过将前一频带的差分量化索引用作上下文而获得的。在图10中示出了群组索引“0”至“2”中的每一个的参数。
参照每个组的概率分布,可看到,群组索引“0”和群组索引“2”的概率分布相似并且基本上关于X轴反转。这表示在编码效率没有损失的情况下可将相同的概率模型应用到两个群组索引“0”和“2”。也就是说,群组索引“0”可使用与针对群组索引“2”的哈夫曼编码表相同的哈夫曼编码表。可使用针对群组索引“1”的哈夫曼编码表“1”(即,概率模型“1”)以及由群组索引“0”和群组索引“2”所共享的哈夫曼编码表“0”(即,概率模型“0”)。在这种情况下,与群组索引“2”相反地表示针对群组索引“0”的码的索引。也就是说,当针对当前频带的差分量化索引的哈夫曼编码表通过作为上下文的前一频带的差分量化索引而被确定为群组索引“0”时,在编码端中,可将当前频带的差分量化索引“d(i)”改变为反向操作的值(即,d'(i)=A-d(i)),并且可参考群组索引“2”的哈夫曼编码表来执行哈夫曼编码。在解码端,参考群组索引“2”的哈夫曼解码表来执行哈夫曼解码,然后,通过转换操作d(i)=A-d'(i)来最终提取出d(i)值。这里,A值可被设置为能够使群组索引“0”和群组索引“2”的概率分布对称的值。所述A值可不通过编码和解码操作被提取,而是可被预先设置为最佳值。可使用群组索引“0”的哈夫曼编码表而不是群组索引“2”的哈夫曼编码表,并且在群组索引“2”中可改变差分量化索引。根据示例性实施例,当d(i)具有[0,31]范围的值时,所述A值可使用31。
为了提供对基于上下文的哈夫曼编码模式进行更加详细的描述,可使用由三个组的差分量化索引的概率分布所确定的两种哈夫曼编码表。这里,在对当前频带的差分量化索引“d(i)”的哈夫曼编码中,前一频带的差分量化索引“d(i-1)”被用作上下文并且针对群组索引“1”的哈夫曼编码表“1”和针对群组索引“2”的哈夫曼编码表“0”被使用的情况将作为示例被描述。
首先,确定前一频带的差分量化索引“d(i-1)”是否包括在群组索引“1”中。当前一频带的差分量化索引“d(i-1)”包括在群组索引“1”中时,从哈夫曼编码表“1”中选择针对当前频带的差分量化索引“d(i)”的码。当前一频带的差分量化索引“d(i-1)”未包括在群组索引“1”中时,确定前一频带的差分量化索引“d(i-1)”是否包括在群组索引“0”中。
当前一频带的差分量化索引“d(i-1)”未包括在群组索引“0”中时,即,当前一频带的差分量化索引“d(i-1)”包括在群组索引“2”中时,从哈夫曼编码表“0”中选择针对当前频带的差分量化索引“d(i)”的码。当前一频带的差分量化索引“d(i-1)”包括在群组索引“0”中时,针对当前频带的差分量化索引“d(i)”执行反向处理,并且从哈夫曼编码表“0”中选择针对当前频带的反向处理后的差分量化索引“d(i)”的码。
通过使用选择的码中的每一个码针对当前频带的差分量化索引“d(i)”执行哈夫曼编码。
第二哈夫曼模式编码器930可在不需要上下文的情况下执行哈夫曼编码,并且配置符号的数量少于一般哈夫曼编码表的哈夫曼编码表。第二哈夫曼模式编码器930可通过减小差分量化索引的跨度来获得新的差分量化索引“△I'M(b)”,同时优选地使该差分量化索引能够被重构。当前频带的差分量化索引的跨度可基于前一频带的差分量化索引和阈值而被修改。用于哈夫曼编码的新的差分量化索引“△I'M(b)”的范围可被获得为Range=[RangeMin,RangeMax]=[Min(△I'M(b)),Max(△I'M(b))],(其中,b是1,...,Nbands-1)。
基于以这种方式获得的范围,可如下面的等式6中所示来计算范围差“RangeDiff”
等式6
RangeDiff=Max(l5-RangeMin,RangeMax-15)
当范围差“RangeDiff”等于或小于特定值(例如,11)时,由第二哈夫曼模式编码器930执行的改变大小的哈夫曼编码可被用于新的差分量化索引。当范围差“RangeDiff”大于特定值时,改变大小的哈夫曼编码可不被使用。
图11是用于描述计算比特以便确定用于无损编码的编码方法和编码模式的处理的流程图,并且操作可以以帧为单位来执行。总之,编码方法“0”(即,大符号编码方法)和编码方法“1”(即,小符号编码方法)的最佳比特被计算,并且具有较小值的编码方法被确定。
在图11中,将首先描述编码方法“0”(即,大符号编码方法)。
在操作1511,无损能量编码设备300确定脉冲模式是否可被执行。当脉冲模式可被执行时,在操作1153,无损能量编码设备300执行脉冲模式以计算使用的比特“ebit0”。当脉冲模式不能被执行时,在操作1155,无损能量编码设备300执行缩放模式以计算使用的比特“ebit1”。在操作1157,使用的比特“ebit0”和使用的比特“ebit1”之中的较小值可被分配为ebit,并且与较小值相应的编码模式被确定为编码方法“0”的编码模式。
接下来,将描述编码方法“1”(即,小符号编码方法)。
在操作1110,无损能量编码设备300确定编码方法“1”是否可被执行,当差分量化索引被配置为可被编码方法“1”执行的输入时,无损能量编码设备300计算必要的比特。例如,无损能量编码设备300确定差分量化索引是否可用N=6(N0=5,N1=1)个比特所表示,并且当差分量化索引不能用6个比特所表示时,在操作1171,无损能量编码设备300将编码方法确定为大符号编码方法并计算使用的比特。无损能量编码设备300将编码方法位设置为0,然后将与ebit相应的信息嵌入到比特流中。当差分量化索引可用6个比特所表示时,无损能量编码设备300在操作1131执行哈夫曼编码模式“0”以计算使用的比特“hbit0”,并且在操作1133执行哈夫曼编码模式“1”以计算使用的比特“hbit1”。在操作1135,使用的比特“hbit0”和使用的比特“hbit1”之中的较小值被分配为hbit,并且与所述较小值相应的编码模式被确定为编码方法“1”的编码模式。这里,当1比特指示在计算hbit时的编码模式并且用于对低位比特进行编码的比特“Nb”是20时,20比特可被进一步考虑。
在操作1173,确定使用在操作1135计算出的hbit和在操作1157计算出的ebit之中的较小比特的编码方法,并设置与确定的编码方法相应的编码方法位。
图12是示出根据示例性实施例的能量无损解码设备1200的配置的框图。
图12的能量无损解码设备1200可包括:解码方法确定器1210、第一无损解码器1230和第二无损解码器1250。所述元件中每个元件可被集成到一个或更多个模块中,并且可用一个或更多个处理器(未示出)来实现。
在图12中,解码方法确定器1210可解析比特流以从边信息获得与编码方法和编码模式有关的信息。也就是说,解码方法确定器120可通过使用与编码方法相关联的标记比特来确定大符号解码方法和小符号解码方法中的一个。例如,当大符号解码方法被确定时,发送的差分量化索引可被提供给第一无损解码器1230,并且当小符号解码方法被确定时,发送的差分量化索引可被提供给第二无损解码器1250。
第一无损解码器1230可基于大符号解码方法对从解码方法确定器1210提供的差分量化索引进行解码。在无损解码中对脉冲模式或缩放模式的反向处理可被用于基于大符号方法的无损解码。
第二无损解码器1250可基于小符号解码方法对从解码方法确定器1210提供的差分量化索引进行解码。为此,可针对差分量化索引的高位比特和低位比特中的每一个单独地执行无损解码。
图13是示出图12的第一无损解码器的详细配置的框图。
图13的第一无损解码器1300可包括脉冲模式解码器1310和缩放模式解码器1330。
参照图13,当从比特流中所包括的与编码模式相关联的标记比特确定出脉冲模式时,脉冲模式解码器1310可对差分量化索引进行解码,并执行图4的脉冲模式编码器410的逆操作。
当从比特流中所包括的与编码模式相关的标记比特确定出缩放模式时,缩放模式解码器1330可对差分量化索引进行解码,并执行图4的缩放模式编码器430的逆操作。
图14是示出图12的第二无损解码器的详细配置的框图。
图14的第二无损解码器1400可包括高位比特解码器1410和低位比特解码器1430。
参照图14,高位比特解码器1410可对差分量化索引的高位比特进行解码,并且低位比特解码器1430可对差分量化索引的低位比特进行解包以获得重构的低位比特。
图15是示出图13的高位比特解码器的详细配置的框图。
图15的高位比特编码器1500可包括第一哈夫曼模式解码器1510和第二哈夫曼模式解码器1530。
参照图15,第一哈夫曼模式解码器1510可根据基于上下文的哈夫曼解码来对差分量化索引的高位比特进行解码。第二哈夫曼模式解码器1530可基于改变大小的哈夫曼编码来对差分量化索引的高位比特进行解码。
具体而言,当与比特流中所包括的编码方法相关联的标记比特指示小编码方法时,与编码模式相关联的标记比特可被提取出。编码模式可以是基于上下文的哈夫曼编码模式和改变大小的哈夫曼编码模式中的一个。
类似于图9的第一哈夫曼模式编码器910,第一哈夫曼模式解码器1510可使用通过三个组的差分量化索引的概率分布而确定的两种哈夫曼解码表。这里,在对当前频带的差分量化索引“d(i)”的哈夫曼解码中,前一频带的差分量化索引“d(i-1)”被用做上下文并且针对群组索引“1”的哈夫曼解码表“1”和针对群组索引“2”的哈夫曼解码表“0”被使用的情况将作为示例而被描述。
首先,确定前一频带的差分量化索引“d(i-1)”是否被包括在群组索引“1”中。当前一频带的差分量化索引“d(i-1)”被包括在群组索引“1”中时,从哈夫曼解码表“1”中选择针对当前频带的差分量化索引“d(i)”的码。当前一频带的差分量化索引“d(i-1)”未被包括在群组索引“1”中时,确定前一频带的差分量化索引“d(i-1)”是否被包括在群组索引“0”中。
当前一频带的差分量化索引“d(i-1)”未被包括在群组索引“0”中时,即,当前一频带的差分量化索引“d(i-1)”被包括在群组索引“2”中时,从哈夫曼解码表“0”中选择针对当前频带的差分量化索引“d(i)”的码。当前一频带的差分量化索引“d(i-1)”被包括在群组索引“0”中时,针对当前频带的差分量化索引“d(i)”执行反向处理,并且从哈夫曼解码表“0”中选择针对当前频带的反向处理的差分量化索引“d'(i)”的码。
通过使用选择的码中的每个码针对当前频带的差分量化索引“d(i)”执行哈夫曼解码。
类似于图9的第二哈夫曼模式编码器930,第二哈夫曼模式解码器1530可根据当前帧是否是瞬态帧以不同方法对差分量化索引执行哈夫曼解码。
图16是用于描述由第一编码方法(即,小符号编码方法)编码的能量量化索引的示图。N是6并且N1是1的情况作为示例被示出。参照图16,5个高位比特可使用哈夫曼编码模式,1个低位比特可被用于简单地对比特进行打包。
图17是根据示例性实施例的包括编码模块的多媒体装置的框图。
参照图17,多媒体装置1700可包括通信单元1710和编码模块1730。此外,根据音频比特流的使用,多媒体装置1700还可包括用于存储作为编码的结果而获得的音频比特流的存储单元1750。此外,多媒体装置1700还可包括麦克风1770。也就是说,可以可选择地包括存储单元1750可麦克风1770。多媒体装置1700还可包括任意解码模块(未示出),例如,用于执行一般解码功能的解码模块或根据示例性实施例的解码模块。编码模块1730可通过与多媒体装置1700中所包括的其它组件(未示出)集成为一体而用至少一个处理器(未示出)来实现。
通信单元1710可接收从外部提供的音频信号或编码的数据流中的至少一项或者可发送重构的音频信号或作为在编码模块1730中的编码结果而获得的编码的视频流中的至少一项。
通信单元1710被配置为通过无线网络(诸如,无线互联网、无线内联网、无线电话网络、无线局域网(LAN)、Wi-Fi、Wi-Fi直连(WFD)、第三代(3G)、第四代(4G)、蓝牙、红外数据协会(IrDA)、射频识别(RFID)、超宽带(UWB)、Zigbee或近场通信(NFC))或有线网络(诸如,有线电话网络或有线互联网)向外部多媒体装置发送数据或从外部多媒体装置接收数据。
根据示例性实施例,编码模块1730可将从通信单元1710或麦克风1770提供的时域的音频信号变换为频域的音频频谱。编码模块1730可将大符号编码方法和小符号编码方法中的一个编码方法确定为能量量化索引的编码方法,并基于确定的编码方法对能量量化索引进行编码。具体而言,在确定编码方法时,当差分编码被应用时,编码模块1730可根据当前帧中所包括的所有频带的差分量化索引是否用预定个比特所表示来确定大符号编码方法和小符号编码方法中的一个。虽然当前帧中所包括的所有频带的差分量化索引可用预定个比特所表示,但是可将通过大符号编码方法对差分量化索引进行编码的结果和通过小符号编码方法对差分量化索引进行编码的结果进行比较,然后可选择与较低比特消耗相应的编码方法。大符号编码方法可包括脉冲模式和缩放模式。在小符号编码方法中,差分量化索引可被拆分为被分别编码的高位比特和低位比特。可通过多种哈夫曼编码模式对高位比特进行编码,可通过比特打包对低位比特进行编码。针对差分量化索引确定的编码方法和编码模式可被产生为边信息。
存储单元1750可存储由编码模块1730产生的编码的比特流。此外,存储单元1750可存储对于操作多媒体装置1700所需要的各种程序。
麦克风1770可将来自用户或外部的音频信号提供给编码模块1730。
图18是根据示例性实施例的包括解码模块的多媒体装置的框图。
参照图18,多媒体装置1800可包括通信单元1810和解码模块1830。此外,根据作为解码结果而获得的重构的音频信号的使用,多媒体装置1800还可包括用于存储重构的音频信号的存储单元1850。此外,多媒体装置1800还可包括扬声器1870。也就是说,可以可选择地包括存储单元1850和扬声器1870。多媒体装置1800还可包括编码模块(未示出),例如,用于执行一般编码功能的编码模块或根据示例性实施例的编码模块。解码模块1830可通过与多媒体装置1800中所包括的其它组件(未示出)集成为一体而用至少一个处理器(未示出)来实现。
通信单元1810可接收从外部提供的音频信号或编码的比特流中的至少一项,或者可发送作为在解码模块1830中的解码结果而获得的重构的音频信号或作为编码结果而获得的音频比特流中的至少一项。可基本上类似于图17的通信单元1710来实现通信单元1810。
根据示例性实施例,解码模块1980可接收通过通信单元1810提供的比特流,并基于比特流中所包括的边信息来确定差分量化索引的编码方法和编码模式。解码模块1980可基于确定的编码方法和编码模式对差分量化索引进行解码。大符号解码方法可包括脉冲模式和缩放模式。在小符号解码方法中,差分量化索引可被拆分为高位比特和低位比特以被分别解码。可通过多种哈夫曼解码方法对高位比特进行解码,可通过比特解包对低位比特进行解码。
存储单元1850可存储通过解码模块1830产生的重构的音频信号。此外,存储单元1850可存储对于操作多媒体装置1800所需要的各种程序。
扬声器1870可将由解码模块1840产生的重构的音频信号输出到外部。
图19是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。
参照图19,多媒体装置1900可包括:通信单元1910、编码模块1920和解码模块1930。此外,根据音频比特流或重构的音频信号的使用,多媒体装置1900还可包括用于存储作为编码结果而获得的音频比特流或作为解码结果而获得的重构的音频信号。此外,多媒体装置1900还可包括麦克风1950和/或扬声器1960。编码模块1920和解码模块1930可通过与多媒体装置1900中所包括的其它组件(未示出)集成为一体而用至少一个处理器(未示出)来实现。
由于图19中示出的多媒体装置1900的组件与图17中示出的多媒体装置1700的组件或图18中示出的多媒体装置1800的组件相应,因此省略对多媒体装置1900的组件的详细描述。
图17、图18和图19中示出的多媒体装置1700、多媒体装置1800和多媒体装置1900中的每一个可包括语音通信专用终端(诸如,电话或移动电话)、广播或音乐专用装置(诸如,TV或MP3播放器),或者语音通信专用终端和广播或音乐专用装置的混合终端装置,但是不限于此。此外,多媒体装置1700、多媒体装置1800和多媒体装置1900中的每一个可被用作客户端、服务器或者布置在客户端和服务器之间的换能器。
当多媒体装置1700、多媒体装置1800或多媒体装置1900是例如移动电话时,虽然未示出,但是多媒体装置1700、多媒体装置1800或多媒体装置1900还可包括:用户输入单元(诸如,键区)、用于显示通过用户界面或移动电话处理的信息的显示单元以及用于控制移动电话的功能的处理器。此外,移动电话还可包括具有图像拾取功能的相机单元以及用于执行移动电话所需要的功能的至少一个元件。
当多媒体装置1700、多媒体装置1800或多媒体装置1900是例如TV时,虽然未示出,但是多媒体装置1700、多媒体装置1800或多媒体装置1900还可包括:用户输入单元(诸如,键区)、用于显示接收的广播信息的显示单元以及用于控制TV的所有功能的处理器。此外,TV还可包括用于执行TV的功能的至少一个组件。
上述示例性实施例可被编写为计算机可执行程序,并且可被实现为通过使用非暂时性计算机可读记录介质执行所述程序的通用数字计算机。此外,可在实施例中被使用的数据结构、程序指令或数据文件可以以各种方式被记录在非暂时性计算机可读记录介质上。非暂时性计算机可读记录介质是可存储此后可被计算机系统读取的数据的任何数据存储装置。非暂时性计算机可读记录介质的示例包括被专门配置为存储并执行程序指令的磁存储介质(诸如,硬盘、软盘和磁带)、光学记录介质(诸如,CD-ROM和DVD)、磁光介质(诸如,光盘)以及硬件装置(诸如,ROM、RAM和闪速存储器)。此外,非暂时性计算机可读记录介质可以是用于传输指示程序指令、数据结构等的信号的传输介质。程序指令的示例可不仅包括由编译器创建的机器语言代码,还包括可由使用解释器等的计算机执行的高级语言代码。
虽然已经具体地示出并描述了示例性实施例,但是本领域普通技术人员将理解的是,在不脱离由权利要求所限定的发明构思的精神和范围的情况下,可在示例性实施例中做出形式和细节上的各种改变。应理解的是,这里描述的示例性实施例应被认为仅仅是描述性意义,而不是为了限制的目的。对每个示例性实施例内的特征或方面的描述应通常被认为是可用于其它示例性实施例中的类似特征或方面。
Claims (14)
1.一种无损编码方法,包括:
基于能量的差分量化索引被表示的预定范围来选择第一编码方法和第二编码方法中的一个编码方法用于所述能量的所述差分量化索引;
当第一编码方法被选择时,选择脉冲模式和缩放模式中的一模式;以及
通过使用选择的模式对所述差分量化索引进行编码,
其中,如果缩放模式被选择,则在表示所述差分量化索引的比特之中,第一组比特通过哈夫曼编码被编码,并且第二组比特被打包。
2.如权利要求1所述的方法,其中,所述无损编码方法以帧为单位被执行。
3.如权利要求1所述的方法,其中,选择第一编码方法和第二编码方法中的一个编码方法的步骤包括:
当在帧中所包括的所有频带的至少一个差分量化索引未用所述预定范围表示时,选择第一编码方法;
当在所述帧中所包括的所有频带的所有差分量化索引用所述预定范围表示时,通过对第一编码方法的比特消耗和第二编码方法的比特消耗进行比较来选择第一编码方法和第二编码方法中的一个编码方法;以及
产生指示选择的编码方法的边信息。
4.如权利要求1所述的方法,其中,第二编码方法将所述差分量化索引划分为将被分别编码的高位比特和低位比特。
5.如权利要求4所述的方法,其中,所述高位比特通过使用多种哈夫曼编码模式中的一种哈夫曼编码模式被编码。
6.如权利要求5所述的方法,其中,所述多种哈夫曼编码模式包括使用上下文的模式和不使用上下文的模式。
7.如权利要求4所述的方法,其中,所述低位比特通过比特打包被编码。
8.一种无损解码方法,包括:
确定比特流中所包括的能量的差分量化索引的解码方法;
响应于确定的解码方法,通过使用第一解码方法和第二解码方法中的一个解码方法来对所述差分量化索引进行解码,其中,第一解码方法和第二解码方法中的所述一个解码方法是基于所述能量的所述差分量化索引被表示的预定范围而被选择的,
其中,第一解码方法包括使用哈夫曼解码的脉冲模式和缩放模式,
其中,如果缩放模式被选择,则在表示所述差分量化索引的比特之中,第一比特组通过哈夫曼编码被解码,并且第二比特组被解包。
9.如权利要求8所述的方法,其中,所述无损解码方法以帧为单位被执行。
10.如权利要求8所述的方法,其中,当第一解码方法被选择时,脉冲模式和缩放模式中的一模式基于比特流中所包括的解码模式被选择。
11.如权利要求8所述的方法,其中,在第二解码方法中,所述差分量化索引被划分为将被分别解码的高位比特和低位比特。
12.如权利要求11所述的方法,其中,所述高位比特基于比特流中所包括的解码模式通过使用多种哈夫曼解码模式中的一种哈夫曼解码模式被解码。
13.如权利要求12所述的方法,其中,所述多种哈夫曼解码模式包括使用上下文的模式和不使用上下文的模式。
14.如权利要求11所述的方法,其中,所述低位比特通过比特解包被解码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010005273.0A CN111179946B (zh) | 2013-09-13 | 2014-09-15 | 无损编码方法和无损解码方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877540P | 2013-09-13 | 2013-09-13 | |
US61/877,540 | 2013-09-13 | ||
PCT/KR2014/008586 WO2015037961A1 (ko) | 2013-09-13 | 2014-09-15 | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
CN202010005273.0A CN111179946B (zh) | 2013-09-13 | 2014-09-15 | 无损编码方法和无损解码方法 |
CN201480062275.6A CN105723454B (zh) | 2013-09-13 | 2014-09-15 | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480062275.6A Division CN105723454B (zh) | 2013-09-13 | 2014-09-15 | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111179946A true CN111179946A (zh) | 2020-05-19 |
CN111179946B CN111179946B (zh) | 2023-10-13 |
Family
ID=56116151
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480062275.6A Active CN105723454B (zh) | 2013-09-13 | 2014-09-15 | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 |
CN202010005273.0A Active CN111179946B (zh) | 2013-09-13 | 2014-09-15 | 无损编码方法和无损解码方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480062275.6A Active CN105723454B (zh) | 2013-09-13 | 2014-09-15 | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (2) | US10699720B2 (zh) |
EP (3) | EP3046105B1 (zh) |
JP (2) | JP6302071B2 (zh) |
CN (2) | CN105723454B (zh) |
ES (1) | ES2934591T3 (zh) |
PL (1) | PL3660843T3 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3660843T3 (pl) | 2013-09-13 | 2023-01-16 | Samsung Electronics Co., Ltd. | Sposób kodowania bezstratnego |
WO2015037961A1 (ko) | 2013-09-13 | 2015-03-19 | 삼성전자 주식회사 | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
CN111083484B (zh) | 2018-10-22 | 2024-06-28 | 北京字节跳动网络技术有限公司 | 基于子块的预测 |
CN111083492B (zh) | 2018-10-22 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 双向光流中的梯度计算 |
KR20240007302A (ko) | 2018-11-12 | 2024-01-16 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 인터 및 인트라 통합 예측의 단순화 |
CN113170171B (zh) | 2018-11-20 | 2024-04-12 | 北京字节跳动网络技术有限公司 | 组合帧间帧内预测模式的预测细化 |
JP7241870B2 (ja) | 2018-11-20 | 2023-03-17 | 北京字節跳動網絡技術有限公司 | 部分的な位置に基づく差分計算 |
CN113545065B (zh) | 2019-03-06 | 2023-12-12 | 北京字节跳动网络技术有限公司 | 转换后的单向预测候选的使用 |
EP3922014A4 (en) | 2019-04-02 | 2022-04-06 | Beijing Bytedance Network Technology Co., Ltd. | DECODER SIDE MOTION VECTOR BYPASS |
US11509897B2 (en) * | 2020-08-07 | 2022-11-22 | Samsung Display Co., Ltd. | Compression with positive reconstruction error |
WO2022201632A1 (ja) * | 2021-03-23 | 2022-09-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、及び、復号方法 |
CN118314908A (zh) * | 2023-01-06 | 2024-07-09 | 华为技术有限公司 | 场景音频解码方法及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1195160A (zh) * | 1997-04-02 | 1998-10-07 | 三星电子株式会社 | 可变规模语音编码/解码的方法和装置 |
KR20040051369A (ko) * | 2002-12-12 | 2004-06-18 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
CN1841938A (zh) * | 2005-03-31 | 2006-10-04 | Lg电子株式会社 | 对音频信号进行编码的方法和设备 |
CN1922656A (zh) * | 2004-03-01 | 2007-02-28 | 弗劳恩霍夫应用研究促进协会 | 用于确定量化器步长的设备和方法 |
WO2007046027A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
JP2007133323A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | オーディオ信号符号化装置および方法 |
CN101223577A (zh) * | 2005-07-15 | 2008-07-16 | 三星电子株式会社 | 对低比特率音频信号进行编码/解码的方法和设备 |
CN101390158A (zh) * | 2006-02-24 | 2009-03-18 | 法国电信公司 | 信号包络的量化索引的二进制编码方法、解码信号包络的方法、及相应的编码和解码模块 |
US20090177478A1 (en) * | 2006-05-05 | 2009-07-09 | Thomson Licensing | Method and Apparatus for Lossless Encoding of a Source Signal, Using a Lossy Encoded Data Steam and a Lossless Extension Data Stream |
CN101615911A (zh) * | 2009-05-12 | 2009-12-30 | 华为技术有限公司 | 一种编解码方法和装置 |
CN101821953A (zh) * | 2007-10-11 | 2010-09-01 | 摩托罗拉公司 | 用于信号的低复杂度组合编码的设备和方法 |
CN101849258A (zh) * | 2007-11-04 | 2010-09-29 | 高通股份有限公司 | 在可缩放语音和音频编解码器中的用于经量化的mdct频谱的码簿索引的编码/解码的技术 |
US20130110522A1 (en) * | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9509831D0 (en) * | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
KR100354531B1 (ko) | 1998-05-06 | 2005-12-21 | 삼성전자 주식회사 | 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템 |
HU228543B1 (en) | 1999-01-07 | 2013-03-28 | Koninkl Philips Electronics Nv | Device for efficient coding and decoding of digital information signal |
KR100561869B1 (ko) | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
US7756350B2 (en) * | 2006-11-13 | 2010-07-13 | Global Ip Solutions, Inc. | Lossless encoding and decoding of digital data |
KR100903109B1 (ko) | 2006-12-13 | 2009-06-16 | 한국전자통신연구원 | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 |
CN101188878B (zh) * | 2007-12-05 | 2010-06-02 | 武汉大学 | 立体声音频信号的空间参数量化及熵编码方法和所用系统 |
KR101671005B1 (ko) | 2007-12-27 | 2016-11-01 | 삼성전자주식회사 | 트렐리스를 이용한 양자화 부호화 및 역양자화 복호화 방법및 장치 |
CA2711539C (en) | 2008-01-24 | 2013-10-08 | Nippon Telegraph And Telephone Corporation | Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium |
CN101826326B (zh) | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
CN101615910B (zh) * | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
CN101937680B (zh) * | 2010-08-27 | 2011-12-21 | 太原理工大学 | 码书分类重排矢量量化方法及其矢量量化器 |
CA3051552C (en) * | 2011-04-20 | 2021-09-21 | Panasonic Intellectual Property Corporation Of America | Device and method for execution of huffman coding |
RU2464649C1 (ru) | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
PL3660843T3 (pl) * | 2013-09-13 | 2023-01-16 | Samsung Electronics Co., Ltd. | Sposób kodowania bezstratnego |
WO2015037961A1 (ko) | 2013-09-13 | 2015-03-19 | 삼성전자 주식회사 | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
EP3046104B1 (en) | 2013-09-16 | 2019-11-20 | Samsung Electronics Co., Ltd. | Signal encoding method and signal decoding method |
WO2016018058A1 (ko) | 2014-07-28 | 2016-02-04 | 삼성전자 주식회사 | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 |
-
2014
- 2014-09-15 PL PL19212262.0T patent/PL3660843T3/pl unknown
- 2014-09-15 EP EP14844584.4A patent/EP3046105B1/en active Active
- 2014-09-15 EP EP19212262.0A patent/EP3660843B1/en active Active
- 2014-09-15 JP JP2016542648A patent/JP6302071B2/ja active Active
- 2014-09-15 ES ES19212262T patent/ES2934591T3/es active Active
- 2014-09-15 CN CN201480062275.6A patent/CN105723454B/zh active Active
- 2014-09-15 EP EP22197860.4A patent/EP4134951B1/en active Active
- 2014-09-15 CN CN202010005273.0A patent/CN111179946B/zh active Active
-
2018
- 2018-03-01 JP JP2018036831A patent/JP6585753B2/ja active Active
-
2019
- 2019-11-04 US US16/673,237 patent/US10699720B2/en active Active
-
2020
- 2020-05-29 US US16/887,021 patent/US10909992B2/en active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1195160A (zh) * | 1997-04-02 | 1998-10-07 | 三星电子株式会社 | 可变规模语音编码/解码的方法和装置 |
KR20040051369A (ko) * | 2002-12-12 | 2004-06-18 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
CN1922656A (zh) * | 2004-03-01 | 2007-02-28 | 弗劳恩霍夫应用研究促进协会 | 用于确定量化器步长的设备和方法 |
CN1841938A (zh) * | 2005-03-31 | 2006-10-04 | Lg电子株式会社 | 对音频信号进行编码的方法和设备 |
CN101223577A (zh) * | 2005-07-15 | 2008-07-16 | 三星电子株式会社 | 对低比特率音频信号进行编码/解码的方法和设备 |
WO2007046027A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
JP2007133323A (ja) * | 2005-11-14 | 2007-05-31 | Canon Inc | オーディオ信号符号化装置および方法 |
CN101390158A (zh) * | 2006-02-24 | 2009-03-18 | 法国电信公司 | 信号包络的量化索引的二进制编码方法、解码信号包络的方法、及相应的编码和解码模块 |
US20090177478A1 (en) * | 2006-05-05 | 2009-07-09 | Thomson Licensing | Method and Apparatus for Lossless Encoding of a Source Signal, Using a Lossy Encoded Data Steam and a Lossless Extension Data Stream |
CN101821953A (zh) * | 2007-10-11 | 2010-09-01 | 摩托罗拉公司 | 用于信号的低复杂度组合编码的设备和方法 |
CN101849258A (zh) * | 2007-11-04 | 2010-09-29 | 高通股份有限公司 | 在可缩放语音和音频编解码器中的用于经量化的mdct频谱的码簿索引的编码/解码的技术 |
CN101615911A (zh) * | 2009-05-12 | 2009-12-30 | 华为技术有限公司 | 一种编解码方法和装置 |
US20130110522A1 (en) * | 2011-10-21 | 2013-05-02 | Samsung Electronics Co., Ltd. | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus |
CN104025190A (zh) * | 2011-10-21 | 2014-09-03 | 三星电子株式会社 | 能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6302071B2 (ja) | 2018-03-28 |
EP3046105A4 (en) | 2017-04-05 |
US20200066285A1 (en) | 2020-02-27 |
PL3660843T3 (pl) | 2023-01-16 |
US20200294514A1 (en) | 2020-09-17 |
CN105723454B (zh) | 2020-01-24 |
US10699720B2 (en) | 2020-06-30 |
EP3046105B1 (en) | 2020-01-15 |
JP2016535317A (ja) | 2016-11-10 |
CN111179946B (zh) | 2023-10-13 |
JP6585753B2 (ja) | 2019-10-02 |
US10909992B2 (en) | 2021-02-02 |
ES2934591T3 (es) | 2023-02-23 |
EP3046105A1 (en) | 2016-07-20 |
EP3660843B1 (en) | 2022-11-09 |
JP2018128684A (ja) | 2018-08-16 |
CN105723454A (zh) | 2016-06-29 |
EP4134951A1 (en) | 2023-02-15 |
EP4134951B1 (en) | 2024-07-24 |
EP3660843A1 (en) | 2020-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102248253B1 (ko) | 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치 | |
CN105723454B (zh) | 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备 | |
TW201738881A (zh) | 音訊解碼方法、裝置及電腦可讀取記錄媒體 | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |