CN102664020B - 编码器和解码器 - Google Patents
编码器和解码器 Download PDFInfo
- Publication number
- CN102664020B CN102664020B CN201210132209.4A CN201210132209A CN102664020B CN 102664020 B CN102664020 B CN 102664020B CN 201210132209 A CN201210132209 A CN 201210132209A CN 102664020 B CN102664020 B CN 102664020B
- Authority
- CN
- China
- Prior art keywords
- sample
- index
- bit
- enhancement layer
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Abstract
提供了一种编码器和解码器。该编码器包括:G.711编码单元,用于对输入帧进行编码;增强层编码单元,用于按照基于从该G.711编码单元获得的每一样本的指数信息向该输入帧中的每一样本动态分配用于附加尾数信息的比特数目的方式,来对该输入帧进行编码;和多路复用单元,用于对该G.711编码单元的比特流和该增强层编码单元的比特流进行多路复用。
Description
本专利申请是下列发明专利申请的分案申请:
申请号:200880112105.9
申请日:2008年8月18日
发明名称:用于编码和解码增强层的设备和方法
技术领域
本发明涉及G.711编码器和解码器,并更具体地,涉及为了降低G.711编解码器中的量化误差的一种编码和解码增强层的方法。
背景技术
由于相对高比特率,所以难以向具有有限带宽的应用直接应用采样模拟语音信号并将采样的模拟语音信号变换为数字信号的技术。例如,按照8KHz采样并量化为16比特每样本的话音信号将导致128,000比特每秒(bps)的比特率。为了在大多数通信网络中按照低比特率传输话音信号,使用用于对话音信号进行压缩和解压缩的编解码器设备。
用于对话音信号进行压缩和解压缩的方法的示例包括脉冲编码调制(PCM)和码激励线性预测(CELP)。PCM是用于将相应语音样本压缩为预定数目比特的方法,而CELP是用于将话音信号组帧为块并基于话音产生模型来压缩话音信号的方法。在大范围领域中,各种编解码器已被开发和标准化。最广泛使用的编解码器之一是在公共交换电话网(PSTN)、因特网电话等上采用的对数PCM编解码器。对数PCM编解码器取决于输入信号的大小而改变量化步长。即,当输入信号的电平低时,对数PCM编解码器使用小量化步长,而当输入信号的电平高时,对数PCM编解码器使用大量化步长。对数PCM编解码器可将具有16比特每样本的数字样本压缩为具有8比特每样本的码字。因此,如果以8KHz来采样信号,则使用对数PCM编解码器来获得64,000bps的比特率。存在两种主要编码律,A律和μ律。相应的律被表达为
其中x是输入样本,μ和A是用于相应编码律的常数,C()是由每一编码律压缩的样本值,而||是绝对值运算。
自从1972年以来,A律和μ律已被标准化为ITU-T(国际电信联盟-电信部门)推荐标准G.711。G.711中的μ和A的值分别是255(μ)和87.56(A)。G.711编解码器实际上使用浮点量化方法,而不是直接计算等式1。在每样本的可用比特(例如,对于G.711的8比特)中,使用一些比特来确定量化步长,并使用剩余比特来表达量化步长中的位置。前面的比特是指数比特,而后面的比特是尾数比特。在G.711的A律中,使用3比特用于指数,使用4比特用于尾数,并使用剩余1比特用于表达样本的符号。
G.711提供了用于窄带话音的大约4MOS(平均意见得分)的高质量,而具有较小计算复杂性和存储需求。然而,与原始话音信号相比,仍存在由量化误差引起的质量降级。
附图说明
图1是G.711编解码器中用于话音质量改善的编码器和解码器的框图;
图2是图示了传统G.711编解码器的对数脉冲编码调制(PCM)编解码器所应用到的编码器的输入样本和输出比特流的示意图;
图3是图示了根据本发明的增强层编码所应用到的编码器的输入样本和输出比特流的示意图;
图4A和4B图示了根据本发明实施例的用于取决于输入信号的大小来动态计算帧中每一样本的附加尾数信息的比特数目的指数图;
图5是图示了根据本发明实施例的用于生成比特分配表的方法的流程图;
图6是根据本发明实施例的增强层编码器的框图;
图7是根据本发明实施例的增强层解码器的框图;
图8是根据本发明另一实施例的增强层编码器的框图;
图9是图示了根据本发明实施例的用于编码增强层的方法的流程图;
图10是根据本发明另一实施例的增强层解码器的框图;和
图11是图示了根据本发明实施例的用于解码增强层的方法的流程图。
发明内容
技术问题
本发明提供了一种可通过向每一G.711编码的样本添加额外比特而降低G.711编解码器中的量化误差的用于编码和解码增强层的设备和方法。
本发明还提供了一种可降低G.711编解码器中的量化误差的增强层编码器和解码器。
技术方案
根据本发明的一个方面,提供了一种用于编码增强层的方法,该方法包括:基于帧中每一样本的指数信息,来计算每一样本的附加尾数信息的指数索引;重复向具有当前指数索引的所有样本分配1比特的处理,所述当前指数索引在每一重复中从最大值开始递减1,直到向这些样本分配的比特总数等于该帧中的可用比特总数为止;和从帧中的每一样本的附加尾数信息中提取和向每一样本分配的(多个)比特数目一样多的(多个)最高有效位。
根据本发明的另一方面,提供了一种增强层编码器,包括:指数图生成单元,用于生成作为矩阵的指数图,该指数图包括:从每一样本的指数值导出的附加尾数信息的指数索引、和帧中每一样本的样本索引;比特分配表生成单元,用于按照以下方式来生成包括通过参考指数图向每一样本分配的比特数目的比特分配表,即,重复向具有相应指数索引的每一样本分配1比特的处理,所述相应指数索引在每一重复中从最大值开始递减1,直到向所述样本分配的比特总数等于该帧中的可用比特总数为止;和比特输出单元,用于通过参考该比特分配表而从每一样本的附加尾数信息输出和向每一样本分配的(多个)比特数目一样多的(多个)最高有效位。
根据本发明的另一方面,提供了一种编码器,包括:G.711编码单元,用于对输入帧进行编码;增强层编码单元,用于按照基于从该G.711编码单元获得的每一样本的指数信息向该输入帧中的每一样本动态分配用于附加尾数信息的比特数目的方式,来对该输入帧进行编码;和多路复用单元,用于对该G.711编码单元的比特流和该增强层编码单元的比特流进行多路复用。
根据本发明的另一方面,提供了一种用于解码增强层的方法,该方法包括:基于每一样本的指数信息来计算帧中每一样本的附加尾数信息的指数索引;重复向具有当前指数索引的每一样本分配1比特的处理,所述当前指数索引在每一重复中从最大值开始递减1,直到向样本分配的比特总数等于该帧中的可用比特总数为止;和从增强比特流中提取和向每一样本分配的比特数目一样多的(多个)附加尾数比特,并对所提取的(多个)附加尾数比特进行解码。
根据本发明的另一方面,提供了一种增强层解码器,包括:指数图生成单元,用于生成作为矩阵的指数图,该指数图包括:从每一样本的指数值导出的附加尾数信息的指数索引、和帧中每一样本的样本索引;比特分配表生成单元,用于按照以下方式生成包括通过参考指数图向每一样本分配的比特数目的比特分配表,即,重复向具有相应指数索引的每一样本分配1比特的处理,所述相应指数索引在每一重复中从最大值开始递减1,直到向所述样本分配的比特总数等于该帧中的可用比特总数为止;和附加尾数解码单元,用于通过参考该比特分配表从增强比特流中提取与向每一样本分配的(多个)比特数目一样多的(多个)附加尾数比特,并对所述附加尾数比特进行解码。
根据本发明的另一方面,提供了一种解码器,包括:解多路复用单元,用于将接收的帧解多路复用为G.711比特流和增强比特流;G.711解码单元,用于对该G.711比特流进行解码;增强层解码单元,用于使用从该G.711解码单元获得的每一样本的指数值,来计算向每一样本分配的附加尾数信息的比特数目,从增强比特流中提取和向每一样本分配的比特数目一样多的(多个)附加尾数比特,并对提取的(多个)附加尾数比特进行解码;和信号合成单元,用于组合该G.711解码单元的输出信号和该增强层解码单元的输出信号,以输出合成后的信号。
根据本发明的另一方面,提供了一种在与包括样本的指数信息和尾数信息的基础层组合的分级编码中编码增强层的方法,该方法包括:计算对于附加尾数信息分配的比特的数目,以扩展该尾数信息;和根据所分配的比特的数目,来对该附加尾数信息进行编码,其中通过参考在预定长度间隔中存在的样本的指数信息,来适应性地执行所述计算分配的比特的数目的步骤。
根据本发明的另一方面,提供了一种用于对分级编码的比特流中的增强层信号进行解码的方法,该分级编码的比特流包括含有样本的指数信息和尾数信息的基础层比特流以及含有样本的附加尾数信息的增强层比特流,该方法包括:基于从该基础层比特流提取的指数信息,来计算向每一样本分配的用于附加尾数信息的比特数目;和从增强层比特流中提取所计算的向每一样本分配的比特数目的附加尾数信息。
有利效果
如上所述,根据本发明,由于通过使用从例如传统G.711编解码器的传统对数PCM编解码器获得的指数信息来向每一样本动态分配用于尾数信息的附加比特,所以可降低由对数PCM编解码器引起的量化误差,并可改善话音质量。而且,由于本发明不改变传统对数PCM编解码器,所以可实现与采用现有对数PCM编解码器的网络的兼容性。
最佳模式
根据本发明的一个方面,提供了一种用于编码增强层的方法,该方法包括:基于帧中每一样本的指数信息,来计算每一样本的附加尾数信息的指数索引;重复向具有当前指数索引的每一样本分配1比特的处理,所述当前指数索引在每一重复中从最大值开始递减1,直到向样本分配的比特总数等于该帧中的可用比特总数为止;和从该帧中的每一样本的附加尾数信息提取和向每一样本分配的(多个)比特数目一样多的(多个)最高有效位。
根据本发明的另一方面,提供了一种增强层编码器,包括:指数图生成单元,用于生成作为矩阵的指数图,该指数图包括:从每一样本的指数值导出的附加尾数信息的指数索引、和帧中每一样本的样本索引;比特分配表生成单元,用于按照以下方式来生成包括通过参考指数图向每一样本分配的比特数目的比特分配表,即,重复向具有相应指数索引的每一样本分配1比特的处理,所述相应指数索引在每一重复中从最大值开始递减1,直到向所述样本分配的比特总数等于该帧中的可用比特总数为止;和比特输出单元,用于通过参考该比特分配表从每一样本的附加尾数信息输出和向每一样本分配的(多个)比特数目一样多的(多个)最高有效位。
根据本发明的另一方面,提供了一种编码器,包括:G.711编码单元,用于对输入帧进行编码;增强层编码单元,用于按照基于从该G.711编码单元获得的每一样本的指数信息而向该输入帧中的每一样本动态分配用于附加尾数信息的比特数目的方式,来对该输入帧进行编码;和多路复用单元,用于对该G.711编码单元的比特流和该增强层编码单元的比特流进行多路复用。
根据本发明的另一方面,提供了一种用于解码增强层的方法,该方法包括:基于每一样本的指数信息来计算帧中每一样本的附加尾数信息的指数索引;重复向具有当前指数索引的每一样本分配1比特的处理,所述当前指数索引在每一重复中从最大值开始递减1,直到向所述样本分配的比特总数等于帧中的可用比特总数为止;和从增强比特流中提取和向每一样本分配的比特数目一样多的(多个)附加尾数比特,并对所提取的(多个)附加尾数比特进行解码。
根据本发明的另一方面,提供了一种增强层解码器,包括:指数图生成单元,用于生成作为矩阵的指数图,该指数图包括:从每一样本的指数值导出的附加尾数信息的指数索引、和帧中每一样本的样本索引;比特分配表生成单元,用于按照以下方式生成包括通过参考指数图向每一样本分配的比特数目的比特分配表,即,重复向具有相应指数索引的每一样本分配1比特的处理,所述相应指数索引在每一重复中从最大值开始递减1,直到向所述样本分配的比特总数等于该帧中的可用比特总数为止;和附加尾数解码单元,用于通过参考该比特分配表从增强比特流中提取与向每一样本分配的(多个)比特数目一样多的(多个)附加尾数比特,并对所述附加尾数比特进行解码。
根据本发明的另一方面,提供了一种解码器,包括:解多路复用单元,用于将接收的帧解多路复用为G.711比特流和增强比特流;G.711解码单元,用于对该G.711比特流进行解码;增强层解码单元,用于使用从该G.711解码单元获得的每一样本的指数值,来计算向每一样本分配的附加尾数信息的比特数目,从增强比特流中提取与向每一样本分配的比特数目一样多的(多个)附加尾数比特,并对提取的(多个)附加尾数比特进行解码;和信号合成单元,用于组合该G.711解码单元的输出信号和该增强层解码单元的输出信号,以输出合成后的信号。
根据本发明的另一方面,提供了一种在与包括样本的指数信息和尾数信息的基础层组合的分级编码中编码增强层的方法,该方法包括:计算对于附加尾数信息分配的比特的数目,以扩展该尾数信息;和根据所分配的比特的数目,来对该附加尾数信息进行编码,其中通过参考在预定长度间隔中存在的样本的指数信息,来适应性地执行所述计算分配的比特的数目的步骤。
根据本发明的另一方面,提供了一种用于对分级编码的比特流中的增强层信号进行解码的方法,该分级编码的比特流包括含有样本的指数信息和尾数信息的基础层比特流以及含有样本的附加尾数信息的增强层比特流,该方法包括:基于从该基础层比特流提取的指数信息,来计算向每一样本分配的用于附加尾数信息的比特数目;和从增强层比特流中提取所计算的向每一样本分配的比特数目的附加尾数信息。
具体实施方式
现在将参考其中示出了本发明的示范实施例的附图,来更全面地描述根据本发明的用于编码和解码增强层的方法和设备以及增强层编码器和解码器。
图1是G.711编解码器中用于改善话音质量的编码器100和解码器150的框图。
参考图1,编码器100包括输入缓冲器105、G.711编码单元110、增强层编码单元115、和多路复用单元120。解码器150包括解多路复用单元155、G.711解码单元160、增强层解码单元165、信号合成单元170、和输出缓冲器175。编码器100通过通信信道140与解码器150相连。
首先将解释编码器100。
输入缓冲器105存储具有预定尺寸的输出样本块,以便逐块地对输入信号进行处理。例如,当输入信号按照8KHz采样并每隔5ms帧来处理时,输入缓冲器105存储40个样本(=8KHz*5ms)。G.711编码单元110使用传统G.711编解码器对输入缓冲器105中存储的帧进行编码,并输出G.711比特流。由于G.711是ITU-T标准化的公知编解码器,所以这里将不给出其详细解释。增强层编码单元115使用附加比特对该G.711编码单元110没有表现的量化误差进行编码,并输出增强比特流。多路复用单元120对G.711编码单元110的G.711比特流和增强层编码单元115的增强比特流进行多路复用。将多路复用后的比特流通过通信信道140传送到解码器150。
现在将解释解码器150。
解多路复用单元155将通过通信信道140从编码器100接收的多路复用后的比特流解多路复用为G.711比特流和增强比特流。G.711解码单元160通过使用G.711编解码器来解码G.711比特流并输出G.711解码后的信号。增强层解码单元165对增强比特流进行解码,并输出增强层解码后的信号。信号合成单元170组合来自G.711解码单元160的G.711解码后的信号和来自增强层解码单元165的增强层解码后的信号,并输出合成后的信号。输出缓冲器175存储来自信号合成单元170的合成后的信号,并逐帧输出所存储的信号。
图2是图示了传统G.711编解码器的对数PCM编解码器所应用到的编码器的输入样本和输出比特流的示意图。图3是图示了根据本发明的增强层编码所应用到的编码器的输入样本和输出比特流的示意图。
参考图2,传统G.711编码器将16比特输入样本200压缩为8比特样本250。8比特样本250包括1比特符号信息260、3比特指数信息270、和4比特尾数信息280。指数信息270指示压缩扩展器段,而尾数信息280指示该指数信息270所指示的段中的位置。
参考图3,当使用根据本发明的增强层编码时,编码后的样本包括附加尾数信息390以及8比特的G.711编码后的样本。附加尾数信息390在指数信息370所指示的段中对尾数信息380所指示的特定位置进行细分,由此降低由G.711编解码器导致的量化误差。
当增强层的比特率是16K比特/秒并且增强层在5ms帧上工作时,每帧的增强层可用比特的总数是80比特。即,当帧中的样本数目是40样本时,可平均分配每样本附加2比特。由于G.711编解码器中的量化误差取决于输入信号的大小,所以优选的是,根据每一样本的大小来动态分配用于每一样本的附加尾数信息的比特数目,而不是分配用于每一样本的附加尾数信息的相同比特数目。
在向附加尾数信息分配每样本3比特以便进一步降低量化误差的情况下,帧中所有样本的比特总数(即,120比特(40样本*3比特))超出可用80比特。在这方面,基于每一样本的指数值来向附加尾数信息分配从0到3范围内的比特。当然,取决于本发明的实施例,用于附加尾数信息的每样本的最大比特数目可被设置为3或更多或更少。
图4A和4B图示了根据本发明实施例的用于取决于输入样本的大小向帧中的每一样本动态分配附加尾数信息的比特数目的指数图。
参考图4A,指数图是这样的矩阵,其中行索引是从每一样本的指数值导出的附加尾数信息的指数索引,而列索引是代表每一样本的样本索引。例如,当向40个样本的帧中的每一样本分配用于附加尾数信息的0到3比特时,指数图是10×40矩阵。
详细来说,每一样本的指数索引与每一样本的指数值成比例、是连续的,并且指数索引的数目与附加尾数信息的比特数目相同。即,通过递增每一样本的指数值来获得指数索引。例如,当样本的指数值为二进制的“000”时,与该样本对应的指数索引为0(指数值+0)、1(指数值+1)、和2(指数值+2)。作为另一示例,当指数值是7(二进制“111”)时,指数索引是7(指数值+0)、8(指数值+1)、和9(指数值+2)。因此,用于附加尾数信息的每一样本的指数索引可在从0到9的范围内。
指数图中的所有元素被初始化为-1,而与样本的指数索引对应的元素存储样本索引。即,(指数索引,样本索引)=样本索引。例如,当帧中的第二样本的指数值是“011”时,样本的可能指数索引是3、4和5。据此,与指数索引3、4、5对应的元素(即,(3,2)、(4,2)、(5,2))被分别设置为2。并且样本索引的列中的剩余元素保持原封不动。
通过对于帧中的所有样本重复将样本索引设置为对应元素的过程,建立该指数图。基于该指数图来创建指示向每一样本分配的附加比特数目的比特分配表。即,1比特被分配给与从最大值(即9)开始递减1的当前指数索引对应的每一样本。执行比特分配,直到向这些样本分配的比特总数等于帧中的可用比特为止。稍后将参考图5来详细解释该比特分配表的生成。
参考图4B,指数图是这样的矩阵,其中行索引是从每一样本的指数值导出的附加尾数信息的指数索引,而列索引是指示具有相同指数索引的样本数目的次序索引。指数图的每一元素代表具有指数索引的样本索引。
例如,在附加尾数信息的最大比特数目为3并且在帧中存在40个样本的情况下,指数图将为10×40矩阵,因为帧中的所有样本可具有共同指数索引。
现在将解释对于第n样本生成指数图的方法。
首先,基于其指数值获得第n样本的附加尾数信息的指数索引。即,第n样本的指数索引是(其指数值+j),其中j=0、1和2。
一旦获得第n样本的三个指数索引,就将第n样本的索引存储在与指数索引和代表具有指数索引的样本的当前数目的次序索引分别对应的元素中。即,(指数索引,具有指数索引的样本的当前数目)=第n样本的索引。具有指数索引的样本的当前数目分别增加1。
例如,当帧中第0样本的指数值为二进制“110”时,对应指数索引是6、7和8。与指数索引6、7和8对应的元素(即,(6,0)、(7,0)、(8,0))被设置为样本索引0,而具有指数索引6、7和8的样本的当前数目被分别设置为1。接下来,当第1样本的指数值为二进制“100”时,对应指数索引是4、5和6。与指数索引4、5和6对应的元素(即,(4,0)、(5,0)、(6,1))被设置为样本索引1。第(6,1)元素被设置为1的原因在于具有指数索引6的样本数目在前一样本中已是1。因此,与指数索引4、5、6、7和8对应的样本数目分别是1、1、2、1和1。当对于所有样本以这种方式完全生成指数图时,可获得与每一指数索引对应的样本数目和样本索引。
图5是图示了根据本发明实施例的用于生成比特分配表的方法的流程图。
参考图5,当假设每样本附加比特的最大数目是3而每帧可用比特的总数是80时,增强层编码器基于每一样本的指数值向每一样本输出附加尾数信息。
详细来说,在操作S500中,增强层编码器将比特分配表的所有元素初始化为0,将当前可用比特设置为当前帧中的可用比特总数,并将指数索引的最大值设置为当前指数索引。在操作S510中,增强层编码器通过参考图4A和4B中图示的指数图来计算与每一指数索引对应的样本数目。例如,在图4A中图示的指数图中存在与指数索引8对应的其样本索引为0和39的两个样本。
在操作S520中,增强层编码器比较与当前指数索引对应的样本数目和当前可用比特,并然后将这两个数中的较小数设置为有用(usable)比特的数目。在操作S530中,向与当前指数索引对应的每一样本分配1比特,直到耗尽有用比特的数目为止。在操作S540中,增强层编码器将从当前可用比特中减去有用比特的数目所得的值设置为当前可用比特的新数目。
在操作S550中,检查当前可用比特是否是0。如果当前可用比特是0,则对于该帧的比特分配表的生成结束。如果当前可用比特不是0,则增强层前进到操作S560。在操作S560中,增强层编码器通过将当前指数索引递减1来更新当前指数索引,并返回到操作S520。然后,增强层编码器重复从S520到S550的操作。
图6是根据本发明实施例的增强层编码器的框图。
参考图6,增强层编码器包括指数图生成单元600、比特分配表生成单元610、和比特输出单元620。增强层编码器对应于图1中图示的增强层编码单元115。
指数图生成单元600基于每一样本的指数值来计算每样本附加尾数信息的指数索引,并然后生成包括每一样本的指数索引的指数图。可从图1中图示的G.711编码单元110中提取每一样本的指数值。由于图4A和4B中图示了该指数图,所以这里将不给出其详细描述。
参考指数图,比特分配表生成单元610恢复与每一指数索引对应的样本,并通过将指数索引从最大值依次递减1而向恢复的样本分配1比特。当对于所有指数索引完成该比特分配过程时,比特分配表生成单元610生成包括向每一样本分配的比特数目的比特分配表。图5中图示了生成比特分配表的方法。
比特输出单元620输出与通过使用比特分配表向输入帧中的每一样本分配的比特数目一样多的附加尾数信息的最高有效位。即,比特输出单元620输出[附加尾数信息]/(2^[附加尾数信息的比特数目-分配的比特数目])。
图7是根据本发明实施例的增强层解码器的框图。
参考图7,增强层解码器包括指数图生成单元700、比特分配表生成单元710、和附加尾数解码单元720。指数图生成单元700和比特分配表生成单元710与图6中图示的指数图生成单元600和比特分配表生成单元610相同,并由此这里将不给出其详细解释。
附加尾数解码单元720基于向每一样本分配的附加尾数信息的比特数目来从增强比特流中提取每一样本的附加尾数信息并进行解码。
图8是根据本发明另一实施例的增强层编码器的框图。
参考图8,增强层编码器包括附加尾数提取单元800、比特分配单元810、和比特输出单元820。
附加尾数提取单元800基于从对于输入帧执行的G.711编码所获得的指数值,来从输入帧中提取附加尾数信息。即,附加尾数提取单元800基于从对于输入帧执行的G.711编码所获得的指数值,来提取由尾数信息(即,4比特的G.711尾数信息)跟随的一些比特作为附加尾数信息。尽管尾数信息所跟随的所有比特可以是附加尾数信息,但是在图8中假设附加尾数信息的最大比特数目在当前实施例中是3。在该情况下,附加尾数提取单元800的伪代码如下。
其中L是帧中的样本数目,exp[i]是第i样本的指数值,ext_bits[i]是第i样本的附加尾数信息的比特数目,ext_mantissa[i]是第i样本的附加尾数信息,x[i]是第i样本,而“&”是逐比特的与运算。
例如,假设输入样本是二进制“0000000110101001”。输入样本按照G.711A律来编码,其是符号位“1”、指数位“001”、和尾数位“1010”的组合。而且,在假设附加尾数信息的最大比特数目是3的情况下,得到的附加尾数信息是“100”。
比特分配单元810通过使用每一样本的可用比特的总数和指数值来计算向每一样本分配的比特数目。例如,如果增强层的比特率是16K比特/秒并且帧尺寸是5ms,则每帧可用比特的总数是80比特。比特分配单元810利用使得每一帧中的量化误差最小化的标准,基于每一样本的附加尾数信息的优先级,来动态计算每一样本的附加尾数信息的比特数目。例如,可从意味着G.711编解码器中的量化步长的每一样本的指数值来确定该优先级。换言之,由于具有相对较大指数值的样本导致更多量化误差,所以其优先级更高,使得向该样本分配更多附加比特。具有相对较小指数值的样本具有较低优先级,使得向该样本分配较少附加比特,因为其量化误差较小。
比特输出单元820输出与该比特分配单元810所计算的向每一样本分配的比特数目一样多的附加尾数信息。比特输出单元820的伪代码如下。
其中bit_alloc[i]是向第i样本分配的比特数目,tx_bit_enh[i]是第i样本的编码后的增强比特流,而x>>a是其中“x”向右移位“a”比特的操作。
例如,在其中样本的附加尾数信息是“100”而分配的比特数目是2比特的情况下,比特输出单元820输出“10”作为其编码后的增强比特流。
在该实施例中,例示了从该样本中提取用于附加尾数信息的每样本的最大比特数目,并然后所述最大比特数目被截短为对于该样本所分配的比特数目。然而,在另一实施例中,可能在建立比特分配表之后,从样本中提取所分配的比特数目。
图9是图示了根据本发明实施例的增强层编码方法的流程图。
参考图9,在操作S900中,增强层编码器基于从对于输入帧执行的G.711编码所获得的指数值,来提取附加尾数信息。尽管附加尾数信息可以是输入帧中由尾数信息跟随的全部剩余比特,但是图9中假设用于附加尾数信息的最大比特数目在当前实施例中是3。因此,增强层编码器仅提取3比特附加尾数信息。
在操作S910中,增强层编码器通过使用从G.711编码获得的指数值来计算用于每样本的尾数信息的附加比特数目。详细来说,增强层编码器将用于每一样本的附加尾数信息的3个相应比特的优先级设置为与每一样本的指数值成比例。例如,指数索引可用作图4A和4B中示出的优先级。增强层编码器向具有从最高优先级到最低优先级的样本顺序分配1比特,直到所分配比特的总数超出该帧中的可用比特的总数为止。
在操作S920中,在按照该方式获得向每一样本分配的比特数目之后,增强层编码器输出与向输入帧中的每一样本分配的比特数目一样多的附加尾数信息的最高有效位。
图10是根据本发明另一实施例的增强层解码器的框图。
参考图10,增强层解码器包括解码器比特分配单元1000、附加尾数解码单元1010、和增强信号合成单元1020。
解码器比特分配单元1000通过使用帧中的可用比特的总数与通过G.711解码获得的指数值,来获得每样本的用于附加尾数信息的比特数目。解码器比特分配单元1000的操作与图7中图示的比特分配单元的操作相同,并由此这里将不给出其详细解释。
附加尾数解码单元1010使用指数值和由解码器比特分配单元1000获得的用于附加尾数信息的比特数目,来从增强比特流恢复附加尾数信息。即,附加尾数解码单元1010通过从增强比特流中提取与向每一样本分配的附加尾数信息的比特数目相同数目的比特,来恢复附加尾数信息。当用于附加尾数信息的最大比特数目是3时,用于操作附加尾数解码单元1010的伪代码被如下示出。即,附加尾数解码单元1010向解码后的附加尾数信息插入比特串“0”,该比特串“0”的数目等于用于附加尾数信息的最大比特数目与用于附加尾数信息的分配比特数目之间的差。
其中rx_bit_enh[i]是第i增强比特流。
增强信号合成单元1020通过使用恢复的附加尾数信息、由G.711解码获得的指数值和符号信息,来恢复增强信号。用于操作增强信号合成单元1020的伪代码如下。首先,将恢复的附加尾数信息向左比特移位该指数值的量,并然后按照以下方式来添加符号信息,即,如果该符号信息指示负值,则将比特移位后的附加尾数信息与(-1)相乘,否则,比特移位后的附加尾数信息自己是增强样本。
其中sign[i]是通过G.711解码获得的第i样本的符号信息。
图11是图示了根据本发明实施例的用于解码增强层的方法的流程图。
参考图11,在操作S1100中,增强层解码器通过使用可用比特的最大数目和由G.711解码单元获得的帧中的指数值,来获得向每一样本分配的附加比特的数目。在操作S1110中,增强层解码器从增强比特流中提取和向每一样本分配的附加比特数目一样多的附加尾数信息。在操作S1120中,增强层解码器恢复附加尾数信息。
本发明可实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后可由计算机系统读取的数据的任何数据储存装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、和光学数据储存装置。计算机可读记录介质可分散安装在与网络相连的计算机系统中,并在分布计算环境中作为计算机可读代码存储和运行。
尽管已使用特定术语参考其示范实施例而具体示出和描述了本发明,但是这些实施例和术语已被用于解释本发明而不应被解释为限制权利要求所限定的本发明的范围。因此,本领域技术人员将理解的是,可在这里进行形式和细节的各种改变,而不脱离以下权利要求限定的本发明的精神和范围。
Claims (2)
1.一种编码器,包括:
G.711编码单元,用于对输入帧进行编码;
增强层编码单元,用于按照基于从该G.711编码单元获得的每一样本的指数信息向该输入帧中的每一样本动态分配用于附加尾数信息的比特数目的方式,来对该输入帧进行编码;和
多路复用单元,用于对该G.711编码单元的比特流和该增强层编码单元的比特流进行多路复用,
其中该增强层编码单元使用每一样本的指数值来计算每一样本的附加尾数信息的指数索引,重复向具有当前指数索引的每一样本分配1比特的处理,所述当前指数索引在每一重复中从最大值开始递减1,直到向样本分配的比特总数等于帧中的可用比特总数为止,并从帧中的每一样本的附加尾数信息输出和向每一样本分配的比特数目一样多的最高有效位。
2.一种解码器,包括:
解多路复用单元,用于将接收的帧解多路复用为G.711比特流和增强比特流;
G.711解码单元,用于对该G.711比特流进行解码;
增强层解码单元,用于使用从该G.711解码单元获得的每一样本的指数值,来计算向每一样本分配的附加尾数信息的比特数目,从增强比特流中提取向样本分配的比特数目的附加尾数比特,并对提取的附加尾数比特进行解码;和
信号合成单元,用于组合该G.711解码单元的输出信号和该增强层解码单元的输出信号,以输出合成后的信号,
其中使用每一样本的指数值来计算每一样本的附加尾数信息的指数索引,并向具有当前指数索引的每一样本分别分配1比特,所述当前指数索引在每一重复中从指数索引的最大值开始递减1,直到向这些样本分配的比特总数等于该帧中的可用比特总数为止,并随后从增强比特流中提取向每一样本分配的比特数目的附加尾数信息。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20070082346 | 2007-08-16 | ||
KR10-2007-0082346 | 2007-08-16 | ||
KR1020080024919A KR100912826B1 (ko) | 2007-08-16 | 2008-03-18 | G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법 |
KR10-2008-0024919 | 2008-03-18 | ||
KR10-2008-0079929 | 2008-08-14 | ||
KR1020080079929A KR100912827B1 (ko) | 2007-08-16 | 2008-08-14 | G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및 복호화 장치와 그 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801121059A Division CN101828221B (zh) | 2007-08-16 | 2008-08-18 | 用于编码和解码增强层的设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102664020A CN102664020A (zh) | 2012-09-12 |
CN102664020B true CN102664020B (zh) | 2015-03-04 |
Family
ID=40686494
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210132209.4A Active CN102664020B (zh) | 2007-08-16 | 2008-08-18 | 编码器和解码器 |
CN2008801121059A Active CN101828221B (zh) | 2007-08-16 | 2008-08-18 | 用于编码和解码增强层的设备和方法 |
CN201210132186.7A Active CN102646417B (zh) | 2007-08-16 | 2008-08-18 | 用于编码和解码增强层的方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801121059A Active CN101828221B (zh) | 2007-08-16 | 2008-08-18 | 用于编码和解码增强层的设备和方法 |
CN201210132186.7A Active CN102646417B (zh) | 2007-08-16 | 2008-08-18 | 用于编码和解码增强层的方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8498875B2 (zh) |
JP (3) | JP4929401B2 (zh) |
KR (3) | KR100912826B1 (zh) |
CN (3) | CN102664020B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
KR101336891B1 (ko) * | 2008-12-19 | 2013-12-04 | 한국전자통신연구원 | G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치 |
CN102438356B (zh) * | 2011-09-20 | 2013-11-27 | 株洲时代电子技术有限公司 | 光源调节装置及方法 |
FR2981781A1 (fr) * | 2011-10-19 | 2013-04-26 | France Telecom | Codage hierarchique perfectionne |
JP6174889B2 (ja) * | 2013-04-02 | 2017-08-02 | パイオニア株式会社 | 発光装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6650762B2 (en) * | 2001-05-31 | 2003-11-18 | Southern Methodist University | Types-based, lossy data embedding |
US6724814B1 (en) * | 1999-06-24 | 2004-04-20 | Intel Corporation | Pad and CODEC detection |
US6785261B1 (en) * | 1999-05-28 | 2004-08-31 | 3Com Corporation | Method and system for forward error correction with different frame sizes |
CN1898723A (zh) * | 2004-01-08 | 2007-01-17 | 松下电器产业株式会社 | 信号解码装置以及信号解码方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK0520068T3 (da) | 1991-01-08 | 1996-07-15 | Dolby Ray Milton | Koder/dekoder for flerdimensionale lydfelter |
KR0152054B1 (ko) * | 1995-09-27 | 1998-12-15 | 김광호 | 가변비트레이트에 대응하는 디지탈 오디오신호의 복호화장치 |
JP3279228B2 (ja) | 1997-08-09 | 2002-04-30 | 日本電気株式会社 | 符号化音声復号装置 |
TW501099B (en) * | 1999-08-13 | 2002-09-01 | Koninkl Philips Electronics Nv | Transmission of a digital information signal having M bit PCM samples |
JP3913664B2 (ja) | 2001-11-14 | 2007-05-09 | 松下電器産業株式会社 | 符号化装置、復号化装置およびこれらを用いたシステム |
KR100467326B1 (ko) | 2002-12-09 | 2005-01-24 | 학교법인연세대학교 | 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기 |
KR100528327B1 (ko) * | 2003-01-02 | 2005-11-15 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
JP2005208320A (ja) | 2004-01-22 | 2005-08-04 | Sony Corp | 音声符号化方法と音声符号化装置および音声記録装置 |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
US20050259729A1 (en) | 2004-05-21 | 2005-11-24 | Shijun Sun | Video coding with quality scalability |
RU2377735C2 (ru) | 2005-04-13 | 2009-12-27 | Нокиа Корпорейшн | Способ, устройство и система для эффективного кодирования и декодирования видеоданных |
WO2007102782A2 (en) * | 2006-03-07 | 2007-09-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for audio coding and decoding |
CN101796579B (zh) * | 2007-07-06 | 2014-12-10 | 法国电信公司 | 数字音频信号的分级编码 |
-
2008
- 2008-03-18 KR KR1020080024919A patent/KR100912826B1/ko active IP Right Grant
- 2008-08-14 KR KR1020080079929A patent/KR100912827B1/ko active IP Right Grant
- 2008-08-18 CN CN201210132209.4A patent/CN102664020B/zh active Active
- 2008-08-18 JP JP2010520947A patent/JP4929401B2/ja active Active
- 2008-08-18 CN CN2008801121059A patent/CN101828221B/zh active Active
- 2008-08-18 CN CN201210132186.7A patent/CN102646417B/zh active Active
- 2008-08-18 US US12/673,536 patent/US8498875B2/en active Active
-
2009
- 2009-04-06 KR KR1020090029494A patent/KR100912828B1/ko active IP Right Grant
-
2011
- 2011-12-05 JP JP2011266175A patent/JP5226852B2/ja active Active
- 2011-12-05 JP JP2011266174A patent/JP5226851B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6785261B1 (en) * | 1999-05-28 | 2004-08-31 | 3Com Corporation | Method and system for forward error correction with different frame sizes |
US6724814B1 (en) * | 1999-06-24 | 2004-04-20 | Intel Corporation | Pad and CODEC detection |
US6650762B2 (en) * | 2001-05-31 | 2003-11-18 | Southern Methodist University | Types-based, lossy data embedding |
CN1898723A (zh) * | 2004-01-08 | 2007-01-17 | 松下电器产业株式会社 | 信号解码装置以及信号解码方法 |
Also Published As
Publication number | Publication date |
---|---|
KR100912826B1 (ko) | 2009-08-18 |
CN102646417A (zh) | 2012-08-22 |
US8498875B2 (en) | 2013-07-30 |
JP2012103707A (ja) | 2012-05-31 |
JP2010537473A (ja) | 2010-12-02 |
KR100912827B1 (ko) | 2009-08-18 |
KR20090017996A (ko) | 2009-02-19 |
JP4929401B2 (ja) | 2012-05-09 |
CN101828221A (zh) | 2010-09-08 |
US20110106532A1 (en) | 2011-05-05 |
JP2012103706A (ja) | 2012-05-31 |
CN102664020A (zh) | 2012-09-12 |
KR20090017967A (ko) | 2009-02-19 |
JP5226852B2 (ja) | 2013-07-03 |
KR100912828B1 (ko) | 2009-08-18 |
JP5226851B2 (ja) | 2013-07-03 |
KR20090039703A (ko) | 2009-04-22 |
CN101828221B (zh) | 2012-11-07 |
CN102646417B (zh) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7660720B2 (en) | Lossless audio coding/decoding method and apparatus | |
RU2522020C1 (ru) | Способ и система иерархического кодирования и декодирования звуковой частоты, способ иерархического кодирования и декодирования частоты для переходного сигнала | |
EP1576585B1 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
CN102664020B (zh) | 编码器和解码器 | |
CN101577605B (zh) | 基于滤波器相似度的语音lpc隐藏和提取算法 | |
CN101484937B (zh) | 使用缓冲器调节对已预测编码的数据进行解码 | |
JP5047263B2 (ja) | 符号化装置及び復号化装置 | |
US8981970B2 (en) | Hierarchical coding | |
CN100440758C (zh) | 语音编码装置、语音解码装置以及语音编码/解码方法 | |
EP2447943A1 (en) | Coding method, decoding method, and device and program using the methods | |
CN102449691B (zh) | Parcor系数量化方法、parcor系数量化装置、程序以及记录介质 | |
EP2187387A2 (en) | Apparatus and method for encoding and decoding enhancement layer | |
KR20040050811A (ko) | 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기 | |
CN101681626A (zh) | 解码装置、解码方法及程序 | |
Chang et al. | Dither-like data hiding in multistage vector quantization of MELP and G. 729 speech coding | |
CN109215670B (zh) | 音频数据的传输方法、装置、计算机设备和存储介质 | |
KR0175248B1 (ko) | Lsp 보코더 | |
CA2511516C (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
KR950024455A (ko) | 적응적으로 각 채널에 비트 할당하여 부호화 및 복호화하는 엠 에스 스테레오 디지탈 오디오 부호화 및 복호화 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |