CN102282611B - 数字音频信号的分级编码方法和分级编码器 - Google Patents

数字音频信号的分级编码方法和分级编码器 Download PDF

Info

Publication number
CN102282611B
CN102282611B CN2009801546871A CN200980154687A CN102282611B CN 102282611 B CN102282611 B CN 102282611B CN 2009801546871 A CN2009801546871 A CN 2009801546871A CN 200980154687 A CN200980154687 A CN 200980154687A CN 102282611 B CN102282611 B CN 102282611B
Authority
CN
China
Prior art keywords
signal
coding
noise
bit
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009801546871A
Other languages
English (en)
Other versions
CN102282611A (zh
Inventor
巴拉兹.科维西
斯蒂芬.拉戈特
阿兰.勒古亚德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN102282611A publication Critical patent/CN102282611A/zh
Application granted granted Critical
Publication of CN102282611B publication Critical patent/CN102282611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于对音频数字信号进行可伸缩编码的方法,该方法针对输入信号的公共部分包括:核心编码步骤,其产生用于公共部分的每个采样n的标量量化的索引(IB(n));以及至少一个增强编码步骤,其产生用于增强信号的每个编码后采样的标量量化
Figure DDA0000076407290000011
的索引(Jk(n))。该方法使得,该增强编码步骤包括以下步骤:获得用于确定目标信号的用于对编码噪声进行变换的滤波器(W(z)),并且使得,通过使可能标量量化值的集合与所述目标信号之间的误差最小化,来确定用于所述增强信号的标量量化
Figure DDA0000076407290000012
的索引(Jk(n))。根据本发明的编码方法还可以包括用于对核心流进行编码的编码噪声的变换。本发明还涉及一种用于实现诸如所描述的编码方法的编码器。

Description

数字音频信号的分级编码方法和分级编码器
技术领域
本发明涉及数字信号的编码领域。
根据本发明的编码特别适于诸如音频信号(语音、音乐或其他)之类的数字信号的传送和/或存储。
本发明更具体地有关于ADPCM(代表“自适应差分脉冲编码调制”)编码类型的波形编码,且特别有关于使得可能利用可伸缩二进制串来传递量化索引的、利用嵌入码的ADPCM类型的编码。
背景技术
诸如,参考图1和2来描述协议ITU-T G.722或ITU-T G.727所规定的嵌入码ADPCM编码/解码的一般原理。
因而,图1表现了ADPCM类型的嵌入码编码器。
它包括:
-预测模块110,用于使得可能基于量化误差信号
Figure GDA00002119529900011
(其中v(n′)是比例因子(scale factor))的先前采样并且基于重构信号rB(n′)n′=n-1,...,n-NP(其中n是当前时刻)来给出信号的预测
-减法模块120,用于从输入信号x(n)中减去其预测
Figure GDA00002119529900013
以获得表示为e(n)的预测误差信号。
-用于误差信号的量化模块130QB+K,用于接收误差信号e(n)作为输入,从而给出由B+K个比特组成的量化索引IB+K(n)。量化模块QB+K是嵌入码类型的,即,它包括具有B个比特的核心量化器、和嵌入在该核心量化器上的具有B+k k=1,...,K个比特的量化器。
在ITU-T G.722标准的情况下,通过X.Maitre.编著的用于描述G.722标准的概述文章"7kHz audio coding within 64 kbit/s".IEEE Journal on SelectedAreas in Communication,Vol.6-2,February 1988的表格IV和VI来定义量化器QB、QB+1、QB+2(令B=4)的判决等级和重构等级。
量化模块QB+K的输出端的B+K个比特的量化索引IB+K(n)经由传送信道140而传送到诸如参考图2所描述的解码器。
该编码器同样包括:
-模块150,用于删除索引IB+K(n)的K个低阶比特,从而给出低比特率索引IB(n);
-逆量化模块120(QB)-1,用于给出B个比特上的量化误差信号 e Q B ( n ) = y I B B ( n ) v ( n ) 作为输出;
-用于量化器和逆量化器的适配模块170QAdapt,用于针对接下来的时刻而给出也称为比例因子的等级控制参数v(n);
-加法模块180,用于将预测与量化误差信号相加,以给出低比特率重构信号rB(n);
-用于预测模块的适配模块190PAdapt,基于B个比特上的量化误差信号
Figure GDA00002119529900023
并且基于通过1+Pz(z)所滤波的信号
Figure GDA00002119529900024
可以观察出,在图1中,附图标记为155的虚线部分表现了包含预测器165和175以及逆量化器120的低比特率本地解码器。因而,此本地解码器使得可能基于低比特率索引IB(n)来在170处对逆量化器进行适配,并且基于所重构的低比特率数据来对预测器165和175进行适配。
此部分一致地存在于诸如参考图2所描述的嵌入码ADPCM解码器中。
图2的嵌入码ADPCM解码器接收源自于传送信道140的索引IB+K(IB+K的可能被二进制误差干扰的版本)作为输入,并且通过比特率为每个采样B比特的逆量化模块210(QB)-1来进行逆量化,以获得信号符号“′”指示在解码器处接收到的、由于传送误差而导致可能与编码器所传送的值不同的值。
B个比特的输出信号r′B(n)将等于该信号的预测与具有B个比特的逆量化器的输出之和。解码器的此部分255与图1的低比特率本地解码器155一致。
采用比特率指示符“模式(mode)”和选择器220,解码器可以增强所恢复的信号。
确实,如果“模式”指示出已经传送了B+l个比特,则该输出将等于预测
Figure GDA00002119529900031
和具有B+l个比特的逆量化器230的输出
Figure GDA00002119529900032
之和。
如果“模式”指示出已经传送了B+2个比特,则该输出将等于预测
Figure GDA00002119529900033
和具有B+2个比特的逆量化器240的输出
Figure GDA00002119529900034
之和。
通过使用z变换表示法,针对此循环结构可以写出以下表达式:
RB+k(z)=X(Z)+QB+k(z)
其中,通过使用下式来定义具有B+k个比特的量化噪声QB+k(z):
Q B + k ( z ) = E Q B + k ( z ) - E ( z )
ITU-T G.722标准(在下文中,命名为G.722)的嵌入码ADPCM编码进行宽带中的信号编码,其被定义有[50-7000Hz]的最小带宽,并且以16kHz来进行采样。G.722编码是通过使用正交镜像滤波器来对信号进行分解所获得的信号的两个子波段[50-4000Hz]和[4000-7000Hz]中每一个的ADPCM编码。通过6个、5个和4个比特上的嵌入码ADPCM编码来对低波段进行编码,而通过每个采样2比特的ADPCM编码器来对高波段进行编码。根据用于对低波段进行解码所使用的比特的数目,总比特率将为64、56或48比特/秒(bit/s)。
此编码首先使用在ISDN(综合服务数字网)中,并然后使用在IP网络上的音频编码的应用中。
作为示例,在G.722标准中,诸如图3所表现的,按照以下方式来对所述8个比特进行分派(apportion):
2个比特Ih1和Ih2,用于高波段;
6个比特IL1 IL2 IL3 IL4 IL5 IL6,用于低波段。
比特IL5和IL6可以被“窃用(stolen)”或者利用数据来取代,并且它们构成低波段增强比特。比特IL1 IL2 IL3 IL4构成低波段核心比特。
因而,根据G.722标准所量化的信号的帧由在8个、7个或6个比特上编码的量化索引组成。在该索引的传送频率为8kHz的情况下,该比特率将为64、56或48kbit/s。
对于具有许多等级的量化器,量化噪声的谱将是相对平坦的,如图4所示。还在图4中表现了该信号的谱(这里,话音信号块)。此谱具有大的动态振幅(swing)(~40dB)。可以看出,在低能量地带中,噪声非常接近于信号,并因此,不再必须被屏蔽(mask)。于是,在图4中,在这些区域中(尤其是在频率[2000-2500Hz]的地带中),它可能变为可听得见的。
因此,编码噪声的整形是必须的。而且,适于嵌入码编码的编码噪声整形将也是期望的。
在协议ITU-T G.711.1″Wideband embedded extension for G.711 pulse codemodulation"或"G.711.1:A wideband extension to ITU-T G.711″.Y.Hiwasaki,S.Sasaki,H.Ohmuro,T.Mori,J.Seong,M.S.Lee,B.S.Ragot,J.-L.Garcia,C.Marro,L.M.,J.Xu,V.Malenovsky,J.Lapierre,R.Lefebvre.EUSIPCO,Lausanne,2008中描述了用于利用嵌入码的PCM(代表“脉冲编码调制”)类型编码的噪声整形技术。
因而,此协议描述了具有用于核心比特率编码的编码噪声的整形的编码。基于源自于逆核心量化器的过去的解码信号来计算用于对编码噪声进行整形的感知滤波器。因此,核心比特率本地解码器使得可能计算噪声整形滤波器。因而,在解码器处,可能基于核心比特率解码信号来计算此噪声整形滤波器。
在编码器处使用用于传递增强比特的量化器。
用于接收核心二进制流和增强比特的解码器基于核心比特率解码信号、按照与编码器处相同的方式、来计算用于对编码噪声进行整形的滤波器,并且将此滤波器应用于来自增强比特的逆量化器的输出信号,所整形的高比特率信号是通过将所滤波的信号与所解码的核心信号进行相加而获得的。
因而,噪声的整形增强了核心比特率信号的感知质量。它在增强比特方面供应了质量的有限增强。确实,在增强比特的编码方面不执行编码噪声的整形,量化器的输入对于核心量化与对于增强量化是相同的。
然后,当除了核心比特之外、还对增强比特进行解码时,解码器必须通过合适适配的滤波来删除所得到的乱真分量(spurious component)。
在解码器处的滤波器的附加计算增加了解码器的复杂性。
在已经现有的G.722或G.727解码器类型的标准可伸缩解码器中没有使用此技术。因此,存在一种对于无论比特率是多少都增强信号质量、同时维持与现有标准可伸缩解码器的兼容性的需求。
发明内容
本发明旨在增强此情形。
为此目的,本发明提出了一种对数字音频信号进行分级编码的方法,该方法针对输入信号的当前帧包括:
-核心编码,用于传递用于当前帧的每个采样的标量量化索引;以及
-至少一个增强编码,传递用于增强信号的每个编码采样的标量量化的索引。该方法使得,该增强编码包括以下步骤:获得用于确定目标信号的用于对编码噪声进行整形的滤波器,并且通过使标量量化的可能值的集合与所述目标信号之间的误差最小化,来确定所述增强信号的标量量化的索引。
因而,执行更高比特率的增强信号的编码噪声的整形。形成本发明主题的基于合成的分析方案使得不必如可能作为现有技术的编码噪声整形解决方案的情况一样地、在解码器处执行任何补足(complementary)信号处理。
因此,在解码器处接收到的信号将可能通过标准解码器来解码,该标准解码器能够对核心比特率的和嵌入比特率的信号进行解码,而不需要任何噪声整形计算或者任何校正项。
因此,无论在解码器处可用的比特率是多少,都增强了解码信号的质量。
可以独立地或者彼此组合地将在下文中提及的各种具体实施例添加到在上文中定义的方法的步骤中。
因而,该目标信号的确定的实现模式使得,针对当前增强编码级,该方法针对当前采样包括以下步骤:
-通过组合分级编码的输入信号、与部分地基于前一编码级的编码并且基于当前增强编码级的重构信号的过去采样所重构的信号,来获得增强编码误差信号;
-通过所获得的噪声整形滤波器来对增强编码误差信号进行滤波,从而获得该目标信号;
-通过将源自于前一级的编码的重构信号与源自于量化步骤的信号相加,来计算用于当前采样的重构信号;
-基于源自于该量化步骤的信号来对该噪声整形滤波器的存储器进行适配。
这里所描述的操作的安排导致了通过复杂性被显著减少的操作进行的编码噪声的整形。
在具体的实施例中,可能标量量化值的集合和用于当前采样的误差信号的量化值是用于表示通过相对于核心比特率量化索引所计算的等级控制参数来标称的量化重构等级的值。
因而,所述值适于核心编码的输出等级。
在具体的实施例中,通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值(B表示了核心编码的比特的数目)与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之差,来定义表示出用于增强级k的量化重构等级的值,具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。
而且,将表示出用于增强级k的量化重构等级的值存储在存储器空间中,并且作为核心比特率量化和增强索引的函数来对其添加索引。
通过从具有B+k-1个比特的量化器的输出值中减去具有B+k个比特的量化器的输出值,不必针对每个采样时刻来重新计算直接存储在ROM中的增强量化器的输出值。而且,例如将它们两个两个地安排在通过前一级的索引可容易地检索到(indexable)的表格中。
在具体的实施例中,标量量化的可能值的数目针对每个采样而变化。
因而,可能作为要编码的采样的函数来对增强比特的数目进行适配。
在另一变化实施例中,给出标量量化索引的所述增强信号的编码采样的数目小于该输入信号的采样的数目。
例如,当针对某些采样而将所分配的增强比特的数目设置为零时,情况可能如此。
例如,该核心编码的可能实现模式是使用标量量化和预测滤波器的ADPCM编码。
例如,该核心编码的另一可能实现模式是PCM编码。
该核心编码还可以包括编码噪声的整形,例如针对当前采样具有以下步骤:
-基于过去量化噪声采样并且基于预定噪声整形滤波器所滤波的量化噪声的过去采样,来获得用于编码噪声的预测信号;
-组合核心编码的输入信号与编码噪声预测信号,从而获得要量化的修改后的输入信号。
因而,针对核心编码进行具有较小复杂性的编码噪声的整形。
在具体实施例中,通过ARMA滤波器或者一连串ARMA滤波器来定义该噪声整形滤波器。
因而,包括分子中的值和分母中的值的这种类型的加权函数具有这样的优点,其通过考虑信号峰值的分母中的值并且通过衰减这些峰值的分子中的值,因而提供了量化噪声的最优整形。ARMA滤波器的级联序列允许通过用于对信号的谱的包络进行建模的分量以及周期性或者准周期性分量,来对屏蔽滤波器进行更好地建模。
在具体的实施例中,将该噪声整形滤波器分解为解耦的谱斜率和共振峰(formantic)形状的两个级联的ARMA滤波单元。
因而,作为输入信号的谱特性的函数来对每个滤波器进行适配,并因此,每个滤波器适于呈现出各种类型的谱斜率的信号。
有利地,增强编码所使用的所述噪声整形滤波器(W(z))还被核心编码所使用,因而减少了实现的复杂性。
在具体的实施例中,作为所述输入信号的函数来计算该噪声整形滤波器,从而最佳地适于不同的输入信号。
在变型实施例中,基于由核心编码所本地解码的信号来计算该噪声整形滤波器。
本发明还有关于一种数字音频信号的分级编码器,该分级编码器针对输入信号的当前帧包括:
-核心编码级,传递用于当前帧的每个采样的标量量化索引;以及
-至少一个增强编码级,传递用于增强信号的每个编码后采样的标量量化的索引。
该编码器使得,该增强编码级包括:用于获得用于确定目标信号的用于对编码噪声进行整形的滤波器的模块;以及量化模块,用于通过使标量量化的可能值的集合与所述目标信号之间的误差最小化,来传递所述增强信号的标量量化的索引。
本发明还有关于一种计算机程序,包括代码指令,用于当由处理器来执行这些指令时,实现根据本发明的编码方法的步骤。
本发明最终有关于一种处理器可读的存储部件,用于存储诸如所描述的计算机程序。
附图说明
一旦阅读了单独借助于非限制性示例并参考附图而给出的以下描述,本发明的其他特性和优点就将更加清楚明显,在所述附图中:
-图1图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的编码器;
-图2图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的解码器;
-图3图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的编码器的量化索引的示范帧;
-图4表现了相对于在没有实现本发明的编码器中存在的量化噪声的谱的信号块的谱;
-图5表现了根据本发明一般实施例的嵌入码编码器和编码方法的框图;
-图6a和6b表现了根据本发明的增强编码级和增强编码方法的框图;
-图7图示了适于对源自于根据本发明的编码的信号进行解码的解码器的各种配置;
-图8表现了根据本发明的编码器和根据本发明的编码方法的第一详细实施例的框图;
-图9图示了用于根据本发明的编码器的核心编码级的编码噪声的示范计算;
-图10图示了用于计算图9的编码噪声的详细功能;
-图11图示了根据本发明的编码方法的获得量化重构等级的集合的示例;
-图12图示了根据本发明的编码方法的增强信号的表现;
-图13图示了用于表现计算用于根据本发明的编码的屏蔽滤波器的第一实施例的步骤的流程图;
-图14图示了用于表现计算用于根据本发明的编码的屏蔽滤波器的第二实施例的步骤的流程图;
-图15表现了根据本发明的编码器和根据本发明的编码方法的第二详细实施例的框图;
-图16表现了根据本发明的编码器和根据本发明的编码方法的第三详细实施例的框图;和
-图17表现了根据本发明的编码器的可能实施例。
具体实施方式
在本文档的下文中,系统地采用术语“预测”来描述仅仅使用过去采样的计算。
参考图5,现在描述根据本发明的嵌入码编码器。重要的是,要注意到,利用用于提供每个附加采样一比特的增强级来执行编码。这里,此约束仅仅用于简化本发明的表现。然而,清楚的是,容易地将在下文中描述的本发明归纳为其中增强级提供每个采样多于一比特的情况。
此编码器包括具有B个比特上的量化的核心比特率编码级500,该核心比特率编码级500例如是诸如标准化的G.722或G.727编码器之类的ADPCM编码类型的,或者是诸如G.711标准化编码器之类的PCM(“脉冲编码调制”)编码器,其作为块520的输出的函数而修改。
附图标记为510的块表现了此核心编码级,该核心编码级具有随后参考图8、15或16而更加详细描述的编码噪声的整形,即核心编码的噪声的屏蔽。
诸如所表现的本发明还有关于其中不执行核心部分中的编码噪声的屏蔽的情况。而且,在此文档中广义地使用术语“核心编码器”。因而,可以将诸如具有56或64kbit/s的ITU-T G.722之类的现有多比特率编码认为是“核心编码器”。极端地,还可能考虑具有0kbit/s的核心编码器,即从编码的第一步骤开始就应用用于形成本发明的主题的增强编码技术。在后者情况下,增强编码成为核心编码。
这里参考图5所描述的、具有噪声整形的核心编码级包括滤波模块520,该滤波模块520基于量化噪声qB(n)和滤波后的量化噪声
Figure GDA00002119529900091
来执行预测Pr(z),以提供预测信号
Figure GDA00002119529900092
例如,通过将滤波后噪声的KM个部分预测与量化噪声相加,来获得滤波后的量化噪声
Figure GDA00002119529900093
诸如随后参考图9所描述的。
如参考图1所描述的,在例如ADPCM编码的情况下,核心编码级接收信号x(n)作为输入,并且提供量化索引IB(n)、基于IB(n)所重构的信号rB(n)和量化器的比例因子v(n)作为输出。
诸如图5所表现的编码器还包括几个增强编码级。这里,表现了级EA1(530)、级EAk(540)和级EAk2(550)。
随后,将参考图6a和6b来详述如此表现的增强编码级。
一般地,每个增强编码级k具有作为输入的信号x(n)、最优索引IB+k-1(n)、核心编码的索引IB(n)和先前增强级的索引J1(n),...,Jk-1(n)或等效地这些索引的集合的级联、在前一步骤中重构的信号rB+k-1(n)、屏蔽滤波器的参数、以及当必要时的自适应编码情况下的比例因子v(n)。
此增强级提供用于此编码级的增强比特的量化索引Jk(n)作为输出,该量化索引Jk(n)将在级联模块560中与索引IB+k-1(n)进行级联。增强级k还提供重构信号rB+k(n)作为输出。应该注意到,这里,索引Jk(n)表现了用于索引n的每个采样的一个比特;然而,在一般的情况下,如果可能的量化值的数目大于2,则Jk(n)可以表现每个采样几比特。
所述各级中的一些级对应于要传送的比特J1(n),...,Jk1(n),所述要传送的比特J1(n),...,Jk1(n)将与索引IB(n)进行级联,使得可以通过诸如随后图7所表现和描述的标准解码器来对所得到的索引进行解码。因此,不必改变远程解码器;而且,不需要附加的信息以用于向远程解码器“通知”在编码器处执行的处理。
其他比特Jk1+1(n),..,Jk2(n)通过增加比特率和屏蔽而对应于增强比特,并且它们需要参考图7所描述的附加的解码模块。
图5的编码器还包括模块580,该模块580用于基于输入信号或基于编码器的合成滤波器的系数来计算噪声整形滤波器或屏蔽滤波器,如稍后参考图13和14所描述的。要注意,模块580可以具有本地解码的信号、而不是原始信号,作为输入。
诸如这里所表现的增强编码级使得可能提供增强比特,用于供应解码器处信号的增加质量,而无论解码信号的比特率是多少,且无需修改解码器,并因此无需解码器处的任何额外复杂性。
因而,现在参考图6a来描述表现了根据本发明一个实施例的增强编码级k的图5的模块Eak。
此编码级所执行的增强编码包括量化步骤该量化步骤
Figure GDA00002119529900102
传递索引和量化值作为输出,该量化值使得可能量化值的集合与通过使用编码噪声整形滤波器所确定的目标信号之间的误差最小化。
在这里考虑包括嵌入码量化器的编码器。
第k级使得可能获得增强比特Jk或者比特组Jk k=1,...,GK
它包括模块EAk-1,该模块EAk-1用于从输入信号x(n)中减去用于当前帧的每个前一采样n′=n-1,...,n-ND的在第k级处合成的信号rB+k(n)、以及用于采样n的前一级的信号rB+k-1(n),从而给出编码误差信号eB+k(n)。
替代利用如参考图4所表现的平坦谱来使将引起量化噪声的二次误差准则最小化,将在量化步骤中使加权二次误差准则最小化,使得谱整形的噪声不太听得见。
因而,第k级包括滤波模块EAk-2,该滤波模块EAk-2用于通过加权函数W(z)来对误差信号eB+k(n)进行滤波。还可以将此加权函数用于核心编码级中噪声的整形。
这里,噪声整形滤波器等于谱加权的反转,即:
H M ( z ) = 1 - P N M ( z ) 1 - P D M ( z ) = 1 W ( z ) - - - ( 1 )
此整形滤波器为ARMA类型(“自回归移动平均数”)。其转移函数包括阶NN的分子和阶ND的分母。因而,块EAk-1实质上用来定义与HM(z)的分母对应的、滤波器W(z)的非递归部分的存储器。虽然为了简洁的缘故而没有示出W(z)的递归部分的存储器的定义,但是可以根据
Figure GDA00002119529900112
并且根据
Figure GDA00002119529900113
来推导它。
此滤波模块给出与目标信号对应的滤波后的信号
Figure GDA00002119529900114
作为输出。
谱加权的作用在于对编码误差的谱进行整形,这是通过使加权误差的能量最小化来进行的。
量化模块EAk-3执行量化步骤,该量化步骤基于量化输出的可能值来寻求根据以下等式来使加权误差准则最小化:
E j B + k = [ e w B + k ( n ) - enh VCj B + k ( n ) ] 2 j = 0,1 - - - ( 2 )
此等式表现了以下情况,其中针对每个采样n来计算增强比特。于是,量化器的两个输出值是可能的。随后,我们将看到如何来定义量化步骤的可能输出值。
因而,此模块EAk-3进行增强量化
Figure GDA00002119529900116
该增强量化
Figure GDA00002119529900117
具有要与前一级的索引IB+k-1进行级联的最优比特Jk的值作为第一输出,并且具有用于最优索引Jk的量化器的输出信号作为第二输出
Figure GDA00002119529900118
其中v(n)表现了核心编码所定义的比例因子,从而对量化器的输出等级进行适配。
最终地,增强编码级包括模块EAk-4,该模块EAk-4用于将量化误差信号与在前一级处合成的信号rB+k-1(n)相加,从而给出第k级处的合成信号rB+k(n)。
按照等效的方式,可以通过优选地按照有限精度对索引IB+k(n)进行解码(即,通过计算
Figure GDA00002119529900121
)、并且通过添加预测
Figure GDA00002119529900122
而取代EAk-4来获得rB+k(n)。在此情况下,适当的是,在存储器中存储具有B个比特、B+l、...的量化器的量化值
Figure GDA00002119529900123
并且通过 [ enh 2 I B + k - 1 B + k v ( n ) ] F = [ y 2 I B + k - 1 + j B + k v ( n ) ] F - [ y I B + k - 1 B + k - 1 v ( n ) ] F 来计算增强量化器的值。
根据用于以下采样时刻的以下关系,来对具有等于x(n′)-rB+k-1(n′)(令n′=n)的值的信号eB+k(n)进行补充:
e B + k ( n ) ← e B + k ( n ) - enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) - - - ( 3 )
其中eB+k(n)也是滤波器的存储器MA(代表“移动平均数”)。因此,要在存储器中保存的采样的数目等于噪声整形滤波器的分母的系数的数目。
然后,根据以下等式来对滤波的AR(代表“自回归”)部分的存储器进行更新:
e w B + k ( n ) ← e w B + k ( n ) - enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) - - - ( 5 )
在通过串联地安排几个ARMA单元(cell)来进行滤波的情况下,按照相同的方式来适配参考图10的滤波器的内部变量:
q f k ( n ) ← q f k ( n ) - enh 2 I B + k - 1 + J k B + k ( n ) v ( n )
索引n递增一个单位。一旦已经针对最初ND个采样执行了初始化步骤,就将通过对用于eB+k(n)的储存存储器进行移位(其涉及了对最旧的采样进行改写)并且通过将值eB+k(n)=x(n)-rB+k-1(n)插入到保留空闲的时隙中,来进行eB+k(n)的计算。
可以注意到,图6a所示的本发明可以通过等效的变型来进行。确实,可以将所重构的信号分解为单单通过已经可用的采样(过去采样n=n-1,...,n-ND、先前级的目前采样、滤波器的存储器)而确定的部分sdet(n)、和单单取决于要优化的目前采样的要确定的另一部分sopt(n)。因而,为了对计算的负荷进行优化,还可以将要最小化的误差
Figure GDA00002119529900128
(其是输入信号x(n)与重构信号rB+k(n)之间的加权误差)的计算分解为两个部分。在第一步骤中,对输入采样x(n)与sdet(n)之间的W(z)的加权差进行计算(图6a的模块EAK-1和EAK-2)。如此获得的值
Figure GDA00002119529900131
是减少为单一目标值的时刻n的目标信号,针对每个可能的量化值
Figure GDA00002119529900132
仅仅需要计算该目标信号一次。接下来,在优化循环中,必须简单地从所有可能的标量量化值之中找到在欧氏(Euclidian)距离方面与此目标值最接近的一个标量量化值。
用于对目标值进行计算的另一变型在于进行两次加权滤波W(z)。第一滤波对输入信号与前一级的重构信号rB+k-1(n)之差进行加权。虽然第二滤波器具有零输入,但是借助于
Figure GDA00002119529900133
来对这些存储器进行更新。这两次滤波的输出之间的差给出了相同的目标信号。
在图6b中对图6a中描述的本发明的原理进行了归纳。块601给出前一级的编码误差εB+k-1(n)。块602逐一地推导出所有可能的标量量化值
Figure GDA00002119529900134
块603从εB+k-1(n)中减去所述标量量化值,以获得当前级的编码误差εB+k(n)。通过噪声整形滤波器W(z)(块604)来对此误差进行加权并且使之最小化(块605),从而对块602进行控制。最后,增强编码级所本地编码的值是 r B + k ( n ) = r B + k - 1 ( n ) + enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) (块606)。
重要的是,这里要注意,符号B+k假设了每个采样的比特率是B+k个比特。因此,图6应对以下情况,其中通过增强编码级来添加每个采样的单一比特,因而涉及块602中的2个可能的量化值。显然,图6b中描述的增强编码可以生成每个采样任何数目个比特k;在此情况下,块602中的可能标量量化值的数目是2k
参考图7,现在我们应该描述能够对作为来自根据本发明的诸如参考图5所描述的编码器的输出所获得的信号进行解码的嵌入码解码器的各种配置。
所实现的解码装置取决于信号传送比特率,并且例如取决于信号的信源,该信源取决于该信号是从例如ISDN网络710、还是从IP网络720发起的。
针对具有低比特率(48、56或64kbit/s)的传送信道,将可能使用例如G.722标准化ADPCM解码器类型的标准解码器700,来对B+k1比特的二进制串进行解码,其中k1=0、1、2,并且B是核心比特率的比特数目。源自于此解码的恢复信号rB+k1(n)将受益于由于在编码器中实现的增强编码级而带来的增强质量。
针对具有更高比特率(80、96kbit/s)的传送信道,如果二进制串IB+k1+k2(n)具有比标准解码器700的比特率更大的并且由模式指示符740指示的比特率,则除了参考图2所描述的具有B+1和B+2个比特的逆量化之外,额外的解码器730还执行
Figure GDA00002119529900141
的逆量化,从而提供量化后的误差,该量化后的误差当与预测信号
Figure GDA00002119529900142
相加时,将给出高比特率的增强信号rB+k1+k2(n)。
现在,参考图8来描述根据本发明的编码器的第一实施例。在此实施例中,核心比特率编码级800执行具有编码噪声整形的ADPCM类型的编码。
核心编码级包括模块810,该模块810用于对基于经由核心层的低比特率索引IB(n)的量化误差信号的先前采样、并且基于重构信号rB(n′)n′=n-1,...,n-NP(像参考图1所描述的重构信号)所进行的信号预测
Figure GDA00002119529900144
进行计算。
提供用于从输入信号x(n)中减去预测
Figure GDA00002119529900145
的减法模块801,从而获得预测误差信号
Figure GDA00002119529900146
核心编码器还包括模块802,该模块802用于预测Pr(z)噪声
Figure GDA00002119529900147
该预测基于量化噪声qB(n′)n′=n-1,...,n-NNH的先前采样并且基于滤波后的噪声 q f B K M ( n ′ ) n ′ = n - 1 , . . . , n - N DH 来进行。
还提供用于将噪声预测
Figure GDA00002119529900149
与预测误差信号相加的加法模块803,从而获得表示为eB(n)的误差信号。
核心量化QB模块820接收误差信号eB(n)作为输入,从而给出量化索引IB(n)。最优量化索引IB(n)和量化值
Figure GDA000021195299001411
使误差准则最小化,其中值
Figure GDA000021195299001413
是重构等级,而v(n)是源自于量化器适配模块804的比例因子。
作为G.722编码器的示例,通过X.Maitre.编著的文章"7kHz audio codingwithin 64 kbit/s",IEEE Journal on Selected Areas in Communication,Vol.6-2,February 1988的表格VI来定义核心量化器QB的重构等级。
在经由传送信道840而传送到诸如参考图7所描述的解码器之前,量化模块QB所输出的B个比特的量化索引IB(n)将在多路复用模块830中与增强比特J1,...,JK多路复用。
核心编码级还包括:模块805,用于对量化噪声进行计算,这是量化器的输入与其输出之差
Figure GDA00002119529900151
模块806,用于对通过将量化噪声与量化噪声的预测相加
Figure GDA00002119529900152
所滤波的量化噪声进行计算;和模块807,用于通过将信号的预测与量化噪声相加
Figure GDA00002119529900153
来对重构信号进行计算。
量化器QB适配
Figure GDA00002119529900154
模块804给出了用于接下来的时刻n+1的等级控制参数v(n),其也称为比例因子。
预测模块810包括适配PAdapt模块811,该模块811用于基于所重构的量化误差信号
Figure GDA00002119529900155
的采样并且可选地基于通过1+Pz(z)所滤波的重构量化误差信号
Figure GDA00002119529900156
来进行适配。
将随后详述的模块850 Calc Mask设计为提供以下滤波器,该滤波器用于基于输入信号、或者基于核心编码(按照核心比特率)所本地解码的信号、或者基于通过简化梯度算法在ADPCM编码中计算的预测滤波器系数,来对可能由核心编码级和增强编码级两者所使用的编码噪声进行整形。在后者情况下,可以通过添加阻尼常数并且添加去加重(de-emphasis)滤波器,基于用于核心比特率编码的预测滤波器的系数,来获得该噪声整形滤波器。
还可能将屏蔽模块单独地使用在增强级中;此替换方案在核心编码使用每个采样少数比特的情况下有利,在该情况下,编码误差不是白噪声,并且信噪比非常低——此情形可以在G.722标准中高波段(4000-8000Hz)的每个采样2比特的ADPCM编码中发现,在此情况下,反馈所进行的噪声整形是无效的。
要注意,与图8中的块802、803、805、806对应的核心编码的噪声整形是可选的。诸如图16中表现的本发明甚至在被缩减为块801、804、807、810、811、820的ADPCM核心编码方面应用。
图9更加详细地描述了模块802,该模块802用于通过具有以下一般表达式的ARMA(代表“自回归移动平均数”)滤波器来执行量化噪声的预测
Figure GDA00002119529900157
的计算:
H M ( z ) = 1 - P N M ( z ) 1 - P D M ( z ) - - - ( 6 )
为了简化的缘故,这里使用了z变换符号。
为了获得可以同时考虑音频信号的短期和长期特性的噪声的整形,通过串联的ARMA滤波单元900、901、902来表现滤波器HM(z):
H M ( z ) = Π j = 1 K M F j ( z ) = Π j = 1 K M 1 - P N j ( z ) 1 - P D j ( z ) - - - ( 7 )
源自于此滤波器串联的图9的滤波后的量化噪声将通过下式、作为量化噪声QB(z)的函数来给出:
Q f B K M ( z ) = Π j = 1 K M 1 - P N j ( z ) 1 - P D j ( z ) Q B ( z ) - - - ( 8 )
图10更加详细地示出了模块Fk(z)901。通过下式来给出此单元k的输出端的量化噪声:
Q f k ( z ) = Q f k - 1 ( z ) - P N k ( z ) Q f k - 1 ( z ) + P D k ( z ) Q f k ( z ) - - - ( 9 )
利用k=1,...,KM进行迭代产生了:
Q f B K M ( z ) = Q B ( z ) + Σ k = 1 K M P D k ( z ) Q f k ( z ) - P N k ( z ) Q f k - 1 ( z ) - - - ( 10 )
即:
Q f BK M ( z ) = Q B ( z ) + P R B K M ( z ) - - - ( 11 )
其中噪声预测
Figure GDA00002119529900166
通过下式来给出:
P R BK M ( z ) = Σ k = 1 K M P D k ( z ) Q f k ( z ) - P N k ( z ) Q f k - 1 ( z ) - - - ( 12 )
因而,通过以下等式而容易地验证了图8的核心编码噪声的整形是有效的:
E B ( z ) = X ( z ) - X P B ( z ) + P R BK M ( z ) - - - ( 13 )
QB(z)=EQ(z)-EB(z)    (14)
R B ( z ) = E Q ( z ) + X P B ( z ) - - - ( 15 )
据此:
R B ( z ) = X ( z ) + Q f BK M ( z ) - - - ( 16 )
R B ( z ) = X ( z ) + Π j = 1 K M 1 - P N j ( z ) 1 - P D j ( z ) Q B ( z ) - - - ( 17 )
由于量化噪声几乎是白噪声,所以所感知的编码噪声的谱被滤波器
Figure GDA00002119529900171
整形,并因此不太听得见。
如随后所描述的,可以通过按照以下方式来对系数g1和g2进行赋值,根据用于输入信号的线性预测的逆滤波器来推导ARMA滤波单元:
1 - P N j ( z ) 1 - P D j ( z ) = A g 1 ( z ) A g 2 ( z ) = 1 - Σ k = 1 N j a g ( k ) g 1 k z - k 1 - Σ k = 1 D j a g ( k ) g 2 k z - k - - - ( 18 )
包括分子中的值和分母中的值的这种类型的加权函数具有以下优点,通过考虑信号峰值的分母中的值并且通过衰减这些峰值的分子中的值,因而提供了量化噪声的最优整形。g1和g2的值使得:
1>g2>g1>0
特定值g1=0给出了纯自回归屏蔽滤波器,而g2=0的特定值给出了MA移动平均数滤波器。
而且,在话音信号的情况和高保真度的数字音频信号的情况下,基于展现出信号周期性的信号的精细结构的轻微整形减少了在信号谐波之间感知的量化噪声。该增强在信号具有相对高的基频或者音调(pitch)(例如,大于200Hz)的情况下特别显著。
通过下式来给出长期噪声整形ARMA单元:
1 - P N j ( z ) 1 - P D j ( z ) = 1 - Σ k = - M P M P p 2 M P ( k ) z - ( Pitch + k ) 1 - Σ k = - M P M P p 1 M P ( k ) z - ( Pitch + k ) - - - ( 19 )
返回到图8的描述,该编码器还包括几个增强编码级。这里,表现了两级EAl和EAk。
增强编码级Eak使得可能获得增强比特Jk或比特组Jk k=1,GK,并且它诸如参考图6a和6b来进行描述。
此编码级包括模块EAk-1,该模块EAk-1用于从输入信号x(n)中减去由用于采样时刻n-1,...,n-ND的级k处的合成信号rB+k(n)和用于时刻n的级k-1处所合成的信号rB+k-1(n)形成的信号rB+k(n),从而给出编码误差信号eB+k(n)。
还在编码级k中包括模块EAk-2,该模块EAk-2用于通过加权函数W(z)来对eB+k(n)进行滤波。此加权函数等于通过诸如先前所描述的核心编码给出的屏蔽滤波器HM(z)的反转。在模块EAk-2的输出端,获得滤波后的信号
Figure GDA00002119529900181
增强编码级k包括模块EAk-3,该模块EAk-3用于使误差准则(令j=0,1)最小化,该模块EAk-3进行增强量化
Figure GDA00002119529900183
该增强量化
Figure GDA00002119529900184
具有要与前一级的索引IB+k-1进行级联的最优比特Jk的值作为第一输出,并且具有用于最优索引Jk的量化器的输出信号作为第二输出
级k还包括加法模块EAk-4,该加法模块EAk-4用于将量化误差信号
Figure GDA00002119529900186
与前一级处的合成信号rB+k-1(n)相加,从而给出级k处的合成信号rB+k(n)。
在单一整形ARMA滤波器的情况下,于是通过下式、按照z变换符号来给出滤波后的误差信号:
E W ( z ) = W 1 ( z ) E ( z ) = 1 - P D ( z ) 1 - P N ( z ) E ( z ) - - - ( 20 )
因而,针对每个采样时刻n,基于在前一级处合成的信号rB+k-1(n)并且基于信号rB+k(n)的过去采样,来计算部分重构的信号rB+k(n)。
从信号x(n)中减去此信号,以给出误差信号eB+k(n)。
通过具有滤波ARMA单元W1的滤波器来对误差信号进行滤波,以给出:
e w B + k ( n ) = e B + k ( n ) - Σ k = 1 N D p D ( k ) e B + k ( n - k ) + Σ k = 1 N N p N ( k ) e w B + k ( n - k ) - - - ( 21 )
加权误差准则相当于使量化器的可能输出的两个值(或者如果是几个比特的话,则NG个值)的二次误差最小化:
E j B + k = [ e w B + k ( n ) - enh VCj B + k ] 2 j = 0,1 - - - ( 22 )
此最小化步骤给出了最优索引Jk和用于最优索引的量化值 enh VCJ k B + k ( n ) = enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) , 其也表示为
Figure GDA000021195299001811
在屏蔽滤波器由几个串联的ARMA单元组成的情况下,执行串联的滤波。
例如,针对串联的短期滤波和音调单元,我们将具有:
E w B + k ( z ) = 1 - Σ k = 1 N D p D ( k ) z - k 1 - Σ k = 1 N N p N ( k ) z - k 1 - Σ k = - M P M P p 2 M P ( k ) z - ( Pitch + k ) 1 - Σ k = - M P M P p 1 M P ( k ) z - ( Pitch + k ) E B + k ( z ) - - - ( 23 )
第一滤波单元的输出将等于:
e 1 w B + k ( n ) = e B + k ( n ) - Σ k = 1 N D p D ( k ) e B + k ( n - k ) + Σ k = 1 N N p N ( k ) e 1 w B + k ( n - k ) - - - ( 24 )
并且第二单元的输出:
e 2 w B + k ( n ) = e 1 w B + k ( n ) - Σ k = - M P k = M P p 2 M P ( k ) e 1 w B + k ( n - Pitch + k ) + Σ k = - M P k = M P p 1 M P ( k ) e 2 w B + k ( n - Pitch + k )
( 25 )
一旦通过使该准则最小化而获得了
Figure GDA00002119529900195
就通过根据eB+k(n)推导
Figure GDA00002119529900196
来对eB+k(n)进行适配,并然后将储存存储器向左移位,并且值rB+k+1(n+1)在接下来的时刻n+1加入到最新位置中。
其后,通过下式来对滤波器的存储器进行适配:
e 1 w B + k ( n ) = e 1 w B + k ( n ) - enh v J k B + k ( n ) v ( n ) - - - ( 28 )
e 2 w B + k ( n ) = e 2 w B + k ( n ) - enh v J k B + k ( n ) v ( n ) - - - ( 29 )
在一般情况下,对前一过程进行迭代,其中:
E w B + k ( z ) = Π j = 1 K M 1 - P N j ( z ) 1 - P D j ( z ) E B + k - - - ( 30 )
因而,在串联的增强级中逐比特地或逐比特组地获得增强比特。
与其中如图1所表现的、通过对误差信号e(n)进行量化来直接获得编码器的核心比特和增强比特的现有技术相对比,按照利用量化噪声的整形对标准解码器输出处的增强信号进行重构的这种方式,来计算根据本发明的增强比特。
在知道核心量化器输出处所获得的索引IB(n)的情况下,因为具有B+l个比特的ADPCM类型的量化器是嵌入码量化器,所以对于具有B+l个比特的量化器,仅仅两个输出值是可能的。
相同的推理在作为具有B+k-1个比特的增强级的函数的具有B+k个比特的增强级的输出方面适用。
图11表现了G.722编码器的低波段编码的具有B个比特(令B=4个比特)的核心量化器的最初4个等级和具有B+l和B+2个比特的量化器的等级、以及用于B+2个比特的增强量化器的输出值。
如此图中所图示的,通过将具有B=4个比特的量化器的等级一分为二来获得具有B+l=5个比特的嵌入式量化器。通过将具有B+l=5个比特的量化器的等级一分为二来获得具有B+2=6个比特的嵌入式量化器。
在本发明的实施例中,通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值(B表示核心编码的比特的数目)与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之间的差,来定义用于表示增强级k的量化重构等级的值,具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。
因此,我们具有以下关系:
y 2 I B + k - 1 + j B + k = y I B + k - 1 B + k - 1 + enh 2 I B + k - 1 + j B + k k = 1 , . . . , K ; j = 0,1 - - - ( 31 )
Figure GDA00002119529900202
表现了具有B+k个比特的嵌入式量化器的可能重构等级,
Figure GDA00002119529900203
表现了具有B+k-1个比特的嵌入式量化器的重构等级,而表现了用于级k的增强项或者重构等级。作为示例,作为用于B+k=5个比特的嵌入式编码器的函数,在图11中给出了级k=2(即,令B+k=6)的输出处的等级。
通过下式来给出具有B+k个比特的量化器的可能输出:
e Q 2 I B + k - 1 + j B + k = y I B + k - 1 B + k - 1 v ( n ) + enh 2 I B + k - 1 + j B + k v ( n ) k = 1 , . . . , K ; j = 0,1 - - - ( 32 )
v(n)表现了比例因子,该比例因子由核心编码所定义,从而对固定量化器的输出等级进行适配。
利用现有技术方案,通过对其中存在要量化的值e(n)的具有B+k个比特的量化器的判决跨度(span)进行标记,仅仅执行一次用于具有B、B+l、...、B+K个比特的量化器的量化。
本发明提出了不同的方案。在知道源自于具有B+k-1个比特的量化器的量化值的情况下,通过使量化误差最小化并且无需访问(call upon)判决阈值,来进行量化器输入处的信号
Figure GDA00002119529900206
的量化,由此有利地使得可能减少用于乘积
Figure GDA00002119529900207
的固定点实现的计算噪声,使得:
E j B + k = [ ( e w B + k ( n ) - y I B + k - 1 B + k - 1 v ( n ) - enh 2 I B + k - 1 + j B + k v ( n ) ] 2 j = 0,1 - - - ( 33 )
替代利用如参考图4所表现的平坦谱来使将引起量化噪声的二次误差准则最小化,将使加权二次误差准则最小化,使得谱整形的噪声不太听得见。
所使用的谱加权函数是W(z),其也可以用于核心编码级中的噪声整形。
返回到图8的描述,可以看出,所恢复的核心信号等于预测与逆量化器的输出之和,即:
r B ( n ) = x p B ( n ) + y I B B v ( n ) - - - ( 34 )
因为基于核心ADPCM编码器来执行信号预测,所以通过以下等式,作为在级k-1处实际重构的信号的函数,来给出在级k处可能的两个重构信号:
r j B + k = x P B ( n ) + y I B + k - 1 B + k - 1 v ( n ) + enh 2 I B + k - 1 + j B + k v ( n ) - - - ( 35 )
据此推导出要在级k处最小化的误差准则:
E j B + k = [ x ( n ) - x P B ( n ) - y I B + k - 1 B + k - 1 v ( n ) - enh 2 I B + k - 1 + j B + k v ( n ) ] 2 j = 0,1 - - - ( 36 )
即:
E j B + k = [ ( x ( n ) - r B + k - 1 ( n ) ) - enh 2 I B + k - 1 + j B + k v ( n ) ] 2 j = 0,1 - - - ( 37 )
替代利用如先前所描述的平坦谱来使将引起量化噪声的二次误差准则最小化,将仅仅对于核心编码来使加权二次误差准则最小化,使得谱整形的噪声不太听得见。所使用的谱加权函数是W(z),其已用于所给出示例中的核心编码——然而,可能单单在增强级中使用此加权函数。
根据图12,将信号
Figure GDA00002119529900215
定义为等于以下两个信号之和:
Figure GDA00002119529900216
表现所有值
Figure GDA00002119529900217
的级联(令n′<n)并且等于0(令n′=n);
以及
Figure GDA00002119529900218
等于
Figure GDA00002119529900219
(令n′=n)并且等于零(令n′<n)。
然后,通过以下表达式来给出在z变换域中更易于阐释的误差准则:
Figure GDA000021195299002110
其中,
Figure GDA000021195299002111
Figure GDA000021195299002112
的z变换。
通过对
Figure GDA000021195299002113
进行分解,我们获得:
例如,为了使此准则最小化,我们通过对以下信号进行计算来开始:
R P B + k ( z ) = R B + k - 1 ( z ) + Enh VP B + k ( z ) - - - ( 40 )
其中这是由于我们尚不知道量化后的值。前一级的信号与
Figure GDA00002119529900223
之和等于第k级的重构信号。
因此,是等于rB+k(n′)(令n′<n)并且等于rB+k-1(n′)(令n′=n)的信号的z变换,使得:
r P B + k ( n &prime; ) = r B + k ( n &prime; ) n &prime; = n - 1 , . . . , n - N D
= r B + k - 1 ( n &prime; ) n &prime; = n
针对处理器上的实现,一般将不明确地计算信号rB+k(n),但是将有利地计算误差信号eB+k(n),此误差信号eB+k(n)是x(n)与rB+k(n)之间的差:
eB+k(n′)=x(n′)-rB+k(n′)n′=n-1,...,n-ND
=x(n′)-rB+k-1(n′)n′=n                    (41)
eB+k(n)是基于rB+k-1(n)和rB+k(n)而形成的,并且用于随后的滤波的要在存储器中保存的采样的数目是ND个采样,即屏蔽滤波器的分母的系数的数目。
滤波后的误差信号
Figure GDA00002119529900227
将等于:
E w B + k ( z ) = E B + k ( z ) W ( z ) - - - ( 42 )
据此推导出加权二次误差准则:
E j B + k = [ e w B + k ( n ) - enh VCj B + k ] 2 - - - ( 43 )
最优索引Jk是以下索引,其使准则
Figure GDA000021195299002210
(令j=0,1)最小化,因而基于两个增强等级
Figure GDA000021195299002211
来进行标量量化
Figure GDA000021195299002212
所述两个增强等级是基于具有B+k个比特的标量量化器的重构等级、并且在知道最优核心的一个索引和多个索引Ji i=1,...,k-1(或等效地,IB+k-1)的情况下计算的。
用于最优索引的量化器的输出值等于:
enh VC J k B + k ( n ) = enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) - - - ( 44 )
并且,将通过下式来给出时刻n处的重构信号的值:
r B + k ( n ) = r B + k - 1 ( n ) + enh 2 I B + k - 1 + J k B + k ( n ) v ( n ) - - - ( 45 )
在知道量化后的输出的情况下,针对采样时刻n来对差信号eB+k(n)进行更新:
e B + k ( n ) &LeftArrow; e B + k ( n ) - enh 2 I B + k - 1 + J k B + k ( n ) v ( n )
并且对滤波器的存储器进行适配。
n的值递增一个单位。然后认识到,eB+k(n)的计算是极其简单的:在尚不知道量化值的情况下,通过将用于eB+k(n)的储存存储器向左移位一个时隙来丢弃最旧采样、并且插入rB+k-1(n+1)作为最新采样就足够了。可以明智地(judiciously)通过使用指针来避免存储器的移位。
图13和14图示了通过屏蔽滤波器计算模块850实现的屏蔽滤波器计算的两种实现模式。
在图13所图示的第一实现模式中,考虑了信号当前块,该信号当前块对应于利用前一帧的采样片段S(n),n=-Ns,....,-1,0,...,NT来补充的当前帧块。
为了强调(accentuate)屏蔽滤波器的谱的峰值,在E60处通过滤波器A1(z)来计算相关系数之前,对该信号进行预处理(预加重处理),该滤波器A1(z)的一个或多个系数是固定的或者是通过如专利FR2742568所描述的线性预测来适配的。
在使用预加重的情况下,通过逆滤波来计算要分析的信号Sp(n):
SP(z)=A1(z)S(z)。
其后,在E 61处通过如根据现有技术已知的、汉宁(Hanning)窗或者由子窗的级联形成的窗来对信号块进行加权。
其后,在E62处通过下式来计算Kc2+1个相关系数:
Cor ( k ) = &Sigma; n = 0 N - 1 s p ( n ) s p ( n - k ) k = 0 , . . . , K c 2 - - - ( 46 )
在E63处通过Levinson-Durbin算法来给出用于对预加重信号的包络进行建模的AR滤波器(代表自回归)A2(z)的系数。
因此,在E64处获得了滤波器A(z),所述滤波器具有转移函数
Figure GDA00002119529900234
用于对输入信号的包络进行建模。
当针对根据本发明的编码器的两个滤波器1-A1(z)和1-A2(z)来实现此计算时,因而在E65处获得整形滤波器,其通过下式来给出:
H M ( z ) = 1 - P N 1 ( z ) 1 - P D 1 ( z ) 1 - P N 2 ( z ) 1 - P D 2 ( z ) = 1 - &Sigma; k = 1 K c 1 a 1 ( k ) g N 1 k z - k 1 - &Sigma; k = 1 K c 1 a 1 ( k ) g D 1 k z - k 1 - &Sigma; k = 1 K c 2 a 2 ( k ) g N 2 k z - k 1 - &Sigma; k = 1 K c 2 a 2 ( k ) g D 2 k z - k - - - ( 47 )
系数gN1、gD1、gN2和gD2使得可能对屏蔽滤波器的谱进行拟合,特别地是用于对该滤波器的谱的斜率进行调整的前两个系数。
如此获得了通过对两个滤波器进行串联所形成的屏蔽滤波器,其中已经对斜率滤波器和共振峰滤波器进行了解耦。此建模特别适于呈现出任何类型的谱斜率的信号,在此建模中,作为输入信号的谱特性的函数来对每个滤波器进行适配。在gN1和gN2是零的情况下,获得足以作为第一近似的两个自回归滤波器的串联屏蔽滤波。
参考图14来图示低复杂性的屏蔽滤波器的第二示范实现。
这里的原理在于,在取决于输入信号斜率由补偿滤波器施加去强调(deaccentuation)的情况下,直接使用对解码信号进行重构的ARMA滤波器的合成滤波器。
通过下式来给出屏蔽滤波器的表达式:
H M ( z ) = 1 - P z ( z / g z 1 ) 1 - P P ( z / g z 2 ) [ 1 - P Com ( z ) ] - - - ( 48 )
在G.722、G.726和G.727标准中,ADPCM ARMA预测器拥有分母中的2个系数。在此情况下,在E71处计算的补偿滤波器将具有以下形式:
1 - P Com ( z ) = 1 - &Sigma; i = 1 2 p P ( i ) g Com i z - i - - - ( 49 )
并且,在E70处给出的滤波器Pz(z)和PP(z)将由在E72处给出的阻尼常数gZ1和gP1所约束的所述滤波器的版本来取代,以给出以下形式的噪声整形滤波器:
H M ( z ) = 1 + &Sigma; i = 1 N Z p Z ( i ) g Z 1 i z - i 1 - &Sigma; i = 1 N P p P ( i ) g P 1 i z - i ) [ 1 - &Sigma; i = 1 2 p Com ( i ) g Com i z - i ] - - - ( 50 )
其中,通过进行如下取值:
pCom(i)=0 i=1,2
获得了由ARMA单元组成的屏蔽滤波器的简化形式。
屏蔽滤波器的另一非常简化的形式是通过仅仅取出具有轻微阻尼的ARMA预测器的分母所获得的屏蔽滤波器:
H M ( z ) = 1 1 - P P ( z / g P ) - - - ( 51 )
其中例如gP=0.92。
用于信号的部分重构的此AR滤波器导致了减少的复杂性。
在具体的实施例中并且为了避免在每个采样时刻对滤波器进行适配,将可能把滤波器的系数固定(freeze)为在信号帧上或者每个帧几次地进行阻尼,从而保持平滑的效果。
执行此平滑的一种方式在于检测量化器输入处信号上的动态振幅的突变,或者按照等效的但是具有最小复杂性的方式,直接检测量化器输出处的索引。在索引的两个突变之间,获得了以下地带,其中谱特性波动较小,并因此,具有为了进行屏蔽而较好适配的ADPCM系数。
用于量化噪声的长期整形的单元的系数的计算
F j ( z ) = 1 - &Sigma; k = - M P M P p 2 M P ( k ) z - ( Pitch + k ) 1 - &Sigma; k = - M P M P p 1 M P ( k ) z - ( Pitch + k ) - - - ( 52 )
是基于包括(contain)浊音(voiced sound)的周期分量的量化器的输入信号来进行的。可以注意到,如果我们期望获得用于周期信号的(具体地,用于浊语言声信号的)质量上的有价值的增强,则长期噪声整形是重要的。事实上,这是考虑用于编码器的周期信号的周期性的唯一方式,所述编码器的合成模型不包括任何长期预测器。
例如,通过使相关系数最大化,通过使图8的量化器QB输入处的长期二次预测误差eB(n)最小化,来计算音调周期:
Cor ( i ) 2 = ( &Sigma; n = - 1 - N P e B ( n ) e B ( n - i ) ) 2 &Sigma; n = - 1 - N P e B ( n ) 2 &Sigma; n = - 1 - N P e B ( n - i ) 2 i = P Min , . . . , P Max - - - ( 53 )
音调使得:
Cor(Pitch)=Max{Cor(i)}i=PMin,...,PMax
通过下式来给出用于生成屏蔽滤波器的音调预测增益Corf(i):
Cor f ( Pitch + i ) = &Sigma; n = - 1 - N P e B ( n ) e B ( n - Pitch + i ) &Sigma; n = - 1 - N P e B ( n ) 2 &Sigma; n = - 1 - N P e B ( n - Pitch + i ) 2
将通过下式来给出长期屏蔽滤波器的系数:
p 2 M P ( i ) = g 2 Pitch Cor f ( Pitch + i ) i = - M P , . . . , M P
以及
p 1 M P ( i ) = g 1 Pitch Cor f ( Pitch + i ) i = - M P , . . . , M P
通过ITU-T G.711.1标准"Wideband embedded extension for G.711 pulsecode modulation"的图8-4来描述用于减少音调的值的计算复杂性的方案。
图15提出了根据本发明的编码器的第二实施例。
针对核心编码级并且针对增强编码级两者,此实施例使用预测模块来取代参考图8所描述的滤波模块。
在此实施例中,具有核心量化噪声整形的ADPCM类型的编码器包括:预测模块1505,用于对重构噪声PD(z)[X(z)-RB(z)]进行预测,此重构噪声是输入信号x(n)与低比特率合成信号rB(n)之间的差;以及加法模块1510,用于将该预测与输入信号x(n)相加。
它还包括用于信号
Figure GDA00002119529900264
的预测模块810,其与参考图8所描述的预测模块一致,其基于经由低比特率量化索引IB(n)所量化的误差信号
Figure GDA00002119529900265
的先前采样并且基于重构的信号rB(n′)n′=n-1,...,n-NP来进行预测。用于从修改后的输入信号x(n)中减去预测的减法模块1520提供了预测误差信号。
核心编码器还包括:模块PN(z)1530,用于计算基于量化噪声qB(n′)n′=n-1,...,n-NNH的先前采样来进行的噪声预测;以及减法模块1540,用于从该预测误差信号中减去如此获得的预测,以获得表示为eB(n)的误差信号。
1550处的核心量化模块QB执行二次误差准则 E j B [ e B ( n ) - y j B ( n ) v ( n ) ] 2 j = 0 , . . . , N Q - 1 的最小化,其中值
Figure GDA00002119529900268
是重构的等级,并且v(n)是源自于量化器适配模块1560的比例因子。量化模块接收误差信号eB(n)作为输入,从而给出量化索引IB(n)和量化后的信号
Figure GDA00002119529900271
作为输出。作为G.722的示例,通过X.Maitre.编著的文章"7 kHz audio coding within64 kbit/s".IEEE Journal on Selected Areas in Communication,Vol.6-2,February1988的表格VI来定义核心量化器QB的重构等级。
在经由传送信道840而传送到诸如参考图7所描述的解码器之前,在量化模块QB输出处的B个比特的量化索引IB(n)将在830处与增强比特J1、...、Jk多路复用。
用于计算量化噪声的模块1570计算量化器的输入与量化器的输出之间的差
Figure GDA00002119529900272
模块1580通过将信号的预测与量化后误差相加
Figure GDA00002119529900273
来计算重构的信号。
量化器的适配模块QAdapt1560给出了用于接下来的时刻的等级控制参数v(n),其也称为比例因子。
预测模块的适配模块PAdapt 811基于重构信号rB(n)的过去采样并且基于重构的量化误差信号
Figure GDA00002119529900274
来执行适配。
增强级EAk包括模块EAk-10,该模块EAk-10用于从输入信号x(n)中减去在在先级处重构的信号rB+k-1(n),以给出信号
Figure GDA00002119529900275
滤波模块EAk-11通过滤波器
Figure GDA00002119529900276
来执行信号
Figure GDA00002119529900277
的滤波,以给出滤波后的信号
Figure GDA00002119529900278
还提供了用于计算预测信号的模块EAk-12,该计算是基于量化误差信号
Figure GDA000021195299002710
的量化后先前采样并且基于通过所滤波的此信号的采样来执行的。增强级EA-k还包括减法模块EA-k13,用于从信号
Figure GDA000021195299002712
中减去预测
Figure GDA000021195299002713
以给出目标信号
Figure GDA000021195299002714
增强量化模块EAk-14
Figure GDA000021195299002715
执行使二次误差准则最小化的步骤:
E j B + k = [ e w B + k ( n ) - enh vj B + k ( n ) v ( n ) ] 2 j = 0,1
此模块接收信号
Figure GDA000021195299002717
作为输入,并且提供量化后信号
Figure GDA00002119529900281
作为第一输出,并且提供索引Jk作为第二输出。
通过将具有B+k-1个比特的量化器的嵌入式输出等级一分为二来计算具有B+k个比特的嵌入式量化器的重构等级。对具有B+k个比特的嵌入式量化器的这些重构等级与具有B+k-1个比特的量化器的重构等级之间的差值进行计算。其后,将差值只此一次地存储在处理器存储器中,并且通过组合核心量化索引和先前级的增强量化器的索引来对其添加索引。
因而,这些差值构成了字典,级k的量化模块使用该字典来获得可能的量化值。
还将加法模块EAk-15以及模块EAk-16集成到增强级k中,该加法模块EAk-15用于将量化器输出处的信号
Figure GDA00002119529900283
与预测相加,并且模块EAk-16用于将在先信号与在前一级处重构的信号rB+k-1(n)相加,以给出级k处的重构信号rB+k(n)。
正如参考图8所描述的编码器一样,先前所详述的模块Calc Mask 850基于输入信号(图13)或者基于如参考图14所解释的ADPCM合成滤波器的系数,来提供屏蔽滤波器。
因而,增强级k针对当前采样实现以下步骤:
-通过计算分级编码的输入信号x(n)与源自于前一增强编码级的增强编码的重构信号rB+k-1(n)之间的差,来获得差信号
Figure GDA00002119529900285
-通过预定的屏蔽滤波器W(z),来对该差信号进行滤波;
-从滤波后的差信号
Figure GDA00002119529900286
中减去预测信号以获得目标信号
Figure GDA00002119529900288
-通过将信号
Figure GDA00002119529900289
与源自于量化步骤的信号
Figure GDA000021195299002810
相加,来计算通过
Figure GDA000021195299002811
所滤波的量化器输出处的信号;
-通过将源自于前一增强编码级的增强编码的重构信号与先前滤波后的信号相加,来计算用于当前采样的重构信号rB+k(n)。
为了简单解释的目的而给出了图15,以用于由单一ARMA单元组成的屏蔽滤波器。要理解,将根据等式7到17所描述的、图9和10中的方案来做出到几个串联的ARMA单元的归纳。
在屏蔽滤波器仅包括1-PD(z)类型的一个单元(即,PN(z)=0)的情况下,将根据
Figure GDA00002119529900291
来推导出基值(contribution)
Figure GDA00002119529900292
或更佳地,将通过使用下式取代EAk-11和EAk-13,来给出量化器的输入信号:
E B + k ( z ) = D P B + k ( z ) - P D ( z ) [ D P B + k ( z ) - E Q B + k ( z ) ]
要理解,到几个串联的单元AR的归纳将根据等式7到17所描述的、图9和10中的方案来做出。
图16表现了本发明的第三实施例,这次其具有PCM类型的核心编码级。核心编码级1600包括借助于预测模块Pr(z)1610的编码噪声的整形,该预测模块Pr(z)1610基于G.711标准化PCM量化噪声
Figure GDA00002119529900294
的先前采样并且基于滤波后的噪声
Figure GDA00002119529900295
来计算噪声的预测
Figure GDA00002119529900296
要注意,与图16中的块1610、1620、1640和1650对应的核心编码的噪声整形是可选的。诸如图16所表现的本发明甚至应用于被缩减为块1630的PCM核心编码。
模块1620进行预测
Figure GDA00002119529900297
与输入信号x(n)的相加,以获得表示为e(n)的误差信号。
核心量化模块
Figure GDA00002119529900298
1630接收误差信号e(n)作为输入,以给出量化索引IB(n)。最优量化索引IB(n)和量化后的值
Figure GDA00002119529900299
使误差准则最小化,其中值
Figure GDA000021195299002911
是G.711 PCM量化器的重构等级。
作为示例,通过ITU-T协议G.711,"Pulse Code Modulation(PCM)ofvoice frequencies"的用于A律的表格1a和用于μ律的表格2a来定义用于B=8的G.711标准的核心量化器
Figure GDA000021195299002912
的重构等级。
在经由传送信道840而传送到G.711类型的标准解码器之前,在量化模块输出处的B个比特的量化索引IB(n)将在830处与增强比特J1,...,JK进行级联。
用于计算量化噪声的模块1640计算PCM量化器的输入与量化后的输出之间的差 q QMIC B ( n ) = e QMIC B ( n ) - e B ( n ) .
用于计算滤波后的量化噪声的模块1650执行量化噪声与量化噪声的预测的相加 q MICf BK M ( n ) = q B ( n ) + p R BK M ( n ) .
增强编码在于,通过连续地对量化比特进行相加、同时保持用于中间比特率的重构噪声的最优整形,来增强解码信号的质量。
通过块EAk来描述级k,其使得可能获得增强PCM比特Jk或比特组Jk k=1,GK
此增强编码级与参考图8所描述的增强编码级相似。
它包括减法模块EAk-1,该减法模块EAk-1用于从由用于采样n-ND,...,n-1的级k处合成的信号rB+k(n)以及用于时刻n的级k-1处合成的信号rB+k-1(n)形成的信号rB+k(n)中减去输入信号x(n),以给出编码误差信号eB+k(n)。
它还包括滤波模块EAk-2,该滤波模块EAk-2用于通过与屏蔽滤波器HM(z)的逆相等的加权函数W(z)来对eB+k(n)进行滤波,以给出滤波后的信号
Figure GDA00002119529900302
量化模块EAk-3执行误差准则
Figure GDA00002119529900303
(令j=0、1)的最小化,其进行增强量化
Figure GDA00002119529900304
该增强量化
Figure GDA00002119529900305
具有要与前一步骤的PCM索引IB+k-1级联的最优PCM比特Jk的值作为第一输出,并且具有用于最优PCM比特Jk的增强量化器的输出信号作为第二输出
用于将量化误差信号
Figure GDA00002119529900307
与在前一步骤处合成的信号rB+k-1(n)相加的加法模块EAk-4给出了步骤k处的合成信号rB+k(n)。如先前针对图6和8所描述地,对信号eB+k(n)和滤波器的存储器进行适配。
按照参考图8所描述的和参考图15所描述的相同方式,模块850计算用于核心编码并且用于增强编码两者的屏蔽滤波器。
可能设想图8、15或16所表现的分级编码器的其他版本。在变型(variant)中,增强编码中可能量化值的数目针对每个编码采样而变化。增强编码作为要编码的采样的函数来使用可变的比特数目。可以根据固定的或者可变的分配规则来对分配的增强比特的数目进行适配。例如,通过ITU-T G.711.1标准中的低波段的增强PCM编码来给出示范的可变分配。优选地,如果分配算法是可变的,则它必须使用远程解码器可用的信息,使得不需要传送附加的信息,这是例如ITU-T G.711.1标准中的情况。
相似地,并且在另一变型中,给出增强编码中的标量量化索引(Jk(n))的增强信号的编码采样的数目可以小于输入信号的采样的数目。当针对某些采样而将分配的增强比特的数目设置为零时,根据前一变型来推导出此变型。
现在,参考图17来描述根据本发明的编码器的示范实施例。
在硬件项目中,诸如根据处于本发明意图内的第一、第二或第三实施例所描述的编码器典型地包括处理器μP,该处理器μP用于与存储器块BM进行协作,该存储器块BM包括储存器和/或工作存储器、以及前述缓冲存储器MEM,以作为用于存储例如在先编码级的量化值、亦或量化重构的等级的字典、或者用于实现诸如参考图6、8、15和16所描述的编码方法所需的任何其他数据的部件。此编码器接收数字信号x(n)的连续帧作为输入,并且传递级联的量化索引IB+K
存储器块BM可以包括计算机程序,该计算机程序包括以下代码指令,当编码器的处理器μP执行这些指令时,所述代码指令用于实现根据本发明的方法的步骤,且具体地为:具有称作核心比特率的预定比特率的编码,其传递用于当前帧的每个采样的标量量化索引;以及至少一个增强编码,其传递用于增强信号的每个编码后采样的标量量化索引。此增强编码包括以下步骤:获得用于确定目标信号的用于对编码噪声进行整形的滤波器。通过使标量量化的可能值集合与所述目标信号之间的误差最小化,来确定所述增强信号的标量量化的索引。
更一般地,计算机或处理器可读的、可以或者可以不与该编码器集成到一起的、可选地为可移动的存储部件存储用于实现根据本发明的编码方法的计算机程序。
例如,图8、15或16可以图示这样的计算机程序的算法。

Claims (14)

1.一种对数字音频信号进行分级编码的方法,该方法针对输入信号的当前帧包括:
-核心编码,其传递用于当前帧的每个采样(x(n))的标量量化索引(IB(n));以及
-至少一个增强编码,其传递用于增强信号的每个编码后采样
Figure FDA00002119529800011
的标量量化的索引(Jk(n)),
其特征在于,该增强编码包括以下步骤:获得用于确定目标信号的用于对编码噪声进行整形的滤波器(W(z)),并且其特征在于,通过使标量量化的可能值的集合与所述目标信号之间的误差最小化,来确定所述增强信号的标量量化
Figure FDA00002119529800013
的索引(Jk(n))。
2.根据权利要求1的方法,其特征在于,该方法进一步包括确定用于当前增强编码级的目标信号的步骤,该步骤针对当前采样包括以下步骤:
-通过组合分级编码的输入信号(x(n))、与部分地基于前一编码级并且基于当前增强编码级的重构信号的过去采样所重构的信号,来获得增强编码误差信号(eB+k(n));
-通过所获得的噪声整形滤波器(W(z))来对增强编码误差信号进行滤波,从而获得该目标信号
Figure FDA00002119529800014
-通过将源自于前一编码级的编码的重构信号(rB+k-1(n))与源自于量化步骤的信号
Figure FDA00002119529800015
相加来计算用于当前采样的重构信号(rB+k(n));
-基于源自于该量化步骤的信号来对该噪声整形滤波器的存储器进行适配。
3.根据权利要求1的方法,其特征在于,可能标量量化值的集合和用于当前采样的误差信号的量化值是用于表示通过相对于核心比特率量化索引所计算的等级控制参数来标称的量化重构等级的值。
4.根据权利要求3的方法,其特征在于,通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之间的差来定义表示出用于增强级k的量化重构等级的值,其中B表示了核心编码的比特的数目,具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。
5.根据权利要求4的方法,其特征在于,表示用于增强级k的量化重构等级的值被存储在存储空间中,并且作为核心比特率量化和增强索引的函数来对其添加索引。
6.根据权利要求1的方法,其特征在于,可能标量量化值的数目针对每个采样而变化。
7.根据权利要求1的方法,其特征在于,给出标量量化索引(Jk(n))的所述增强信号的编码后采样的数目小于该输入信号的采样的数目。
8.根据权利要求1的方法,其特征在于,该核心编码是使用标量量化和预测滤波器的ADPCM编码。
9.根据权利要求1的方法,其特征在于,该核心编码是PCM编码。
10.根据权利要求8和9之一的方法,其特征在于,该核心编码针对当前采样还包括以下步骤:
-基于过去量化噪声采样并且基于预定噪声整形滤波器所滤波的量化噪声的过去采样,来获得用于编码噪声的预测信号
Figure FDA00002119529800021
-组合核心编码的输入信号与编码噪声预测信号,从而获得要量化的修改后的输入信号。
11.根据权利要求10的方法,其特征在于,增强编码所使用的所述噪声整形滤波器(W(z))还被核心编码所使用。
12.根据权利要求1的方法,其特征在于,作为所述输入信号的函数来计算该噪声整形滤波器。
13.根据权利要求1的方法,其特征在于,基于由核心编码所本地解码的信号,来计算该噪声整形滤波器。
14.一种数字音频信号的分级编码器,该分级编码器针对输入信号的当前帧包括:
-核心编码级(800、1500、1600),其传递用于当前帧的每个采样的标量量化索引(IB(n));以及
-至少一个增强编码级(EA-k),其传递用于增强信号的每个编码后采样的标量量化
Figure FDA00002119529800022
的索引(Jk(n)),
其特征在于,该增强编码级包括:模块(850),用于获得用于确定目标信号的用于对编码噪声进行整形的滤波器(W(z));以及量化模块(EAk-3、EAk-4),用于通过使标量量化的可能值的集合与所述目标信号之间的误差最小化,来传递所述增强信号的标量量化的索引(Jk(n))。
CN2009801546871A 2008-11-18 2009-11-17 数字音频信号的分级编码方法和分级编码器 Active CN102282611B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0857839A FR2938688A1 (fr) 2008-11-18 2008-11-18 Codage avec mise en forme du bruit dans un codeur hierarchique
FR0857839 2008-11-18
PCT/FR2009/052194 WO2010058117A1 (fr) 2008-11-18 2009-11-17 Codage de signal audionumerique avec mise en forme du bruit dans un codeur hierarchique

Publications (2)

Publication Number Publication Date
CN102282611A CN102282611A (zh) 2011-12-14
CN102282611B true CN102282611B (zh) 2013-05-08

Family

ID=40661226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801546871A Active CN102282611B (zh) 2008-11-18 2009-11-17 数字音频信号的分级编码方法和分级编码器

Country Status (7)

Country Link
US (1) US8965773B2 (zh)
EP (1) EP2366177B1 (zh)
JP (1) JP5474088B2 (zh)
KR (1) KR101339857B1 (zh)
CN (1) CN102282611B (zh)
FR (1) FR2938688A1 (zh)
WO (1) WO2010058117A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
FR2972875A1 (fr) * 2011-03-17 2012-09-21 France Telecom Procede et dispositif de filtrage lors d'un changement de filtre arma
JP6079230B2 (ja) * 2012-12-28 2017-02-15 株式会社Jvcケンウッド 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム
RU2608447C1 (ru) 2013-01-29 2017-01-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов
US9723305B2 (en) 2013-03-29 2017-08-01 Qualcomm Incorporated RTP payload format designs
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
EP3155617B1 (en) * 2014-06-10 2022-01-05 MQA Limited Digital encapsulation of audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10756755B2 (en) 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10699725B2 (en) 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10770088B2 (en) 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
CN109416913B (zh) * 2016-05-10 2024-03-15 易默森服务有限责任公司 自适应音频编解码系统、方法、装置及介质
WO2019136365A1 (en) 2018-01-08 2019-07-11 Immersion Networks, Inc. Methods and apparatuses for producing smooth representations of input motion in time and space
US10763885B2 (en) * 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
KR102491948B1 (ko) * 2021-06-04 2023-01-27 한국 천문 연구원 단일 gnss 수신기를 이용한 고위도 전리권 플라즈마 불균질 수평방향 속력 결정 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1623185A (zh) * 2002-03-12 2005-06-01 诺基亚有限公司 可伸缩音频编码的有效改进
CN101006496A (zh) * 2004-08-17 2007-07-25 皇家飞利浦电子股份有限公司 可分级音频编码
CN101263553A (zh) * 2005-07-13 2008-09-10 法国电信公司 分级编码/解码设备

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3688097A (en) * 1970-05-20 1972-08-29 Bell Telephone Labor Inc Digital attenuator for non-linear pulse code modulation signals
US4386237A (en) * 1980-12-22 1983-05-31 Intelsat NIC Processor using variable precision block quantization
DE3411962A1 (de) * 1983-03-31 1984-10-31 Sansui Electric Co., Ltd., Tokio/Tokyo Datenuebertragungseinrichtung
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
TW321810B (zh) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
FR2742568B1 (fr) 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
JP3587920B2 (ja) * 1995-12-21 2004-11-10 株式会社日立国際電気 送信方法及び受信方法
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6931058B1 (en) * 2000-05-19 2005-08-16 Scientific-Atlanta, Inc. Method and apparatus for the compression and/or transport and/or decompression of a digital signal
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
EP1238489B1 (en) * 1999-12-13 2008-03-05 Broadcom Corporation Voice gateway with downstream voice synchronization
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
KR100566163B1 (ko) * 2000-11-30 2006-03-29 마츠시타 덴끼 산교 가부시키가이샤 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체
US6614370B2 (en) * 2001-01-26 2003-09-02 Oded Gottesman Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding
SE521600C2 (sv) * 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7408918B1 (en) * 2002-10-07 2008-08-05 Cisco Technology, Inc. Methods and apparatus for lossless compression of delay sensitive signals
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
EP1496500B1 (en) * 2003-07-09 2007-02-28 Samsung Electronics Co., Ltd. Bitrate scalable speech coding and decoding apparatus and method
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
EP1939863A3 (en) * 2003-10-10 2008-07-16 Agency for Science, Technology and Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
WO2006082790A1 (ja) * 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
KR100707184B1 (ko) * 2005-03-10 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
JPWO2007043643A1 (ja) * 2005-10-14 2009-04-16 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法
US7490036B2 (en) * 2005-10-20 2009-02-10 Motorola, Inc. Adaptive equalizer for a coded speech signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8260620B2 (en) * 2006-02-14 2012-09-04 France Telecom Device for perceptual weighting in audio encoding/decoding
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
WO2007102782A2 (en) * 2006-03-07 2007-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for audio coding and decoding
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
KR101542069B1 (ko) * 2006-05-25 2015-08-06 삼성전자주식회사 고정 코드북 검색 방법 및 장치와 그를 이용한 음성 신호의부호화/복호화 방법 및 장치
US7933770B2 (en) * 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
ATE496365T1 (de) * 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
JP2008170488A (ja) * 2007-01-06 2008-07-24 Yamaha Corp 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法
US8199835B2 (en) * 2007-05-30 2012-06-12 International Business Machines Corporation Systems and methods for adaptive signal sampling and sample quantization for resource-constrained stream processing
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
ES2363190T3 (es) * 2007-06-15 2011-07-26 France Telecom Codificación de señales audio-digitales.
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2176861B1 (fr) * 2007-07-06 2013-03-27 France Telecom Codage hierarchique de signaux audionumeriques
KR100912826B1 (ko) * 2007-08-16 2009-08-18 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법
US8271273B2 (en) * 2007-10-04 2012-09-18 Huawei Technologies Co., Ltd. Adaptive approach to improve G.711 perceptual quality
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
GB2465047B (en) * 2009-09-03 2010-09-22 Peter Graham Craven Prediction of signals
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
FR2961980A1 (fr) * 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
US9263049B2 (en) * 2010-10-25 2016-02-16 Polycom, Inc. Artifact reduction in packet loss concealment
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1623185A (zh) * 2002-03-12 2005-06-01 诺基亚有限公司 可伸缩音频编码的有效改进
CN101006496A (zh) * 2004-08-17 2007-07-25 皇家飞利浦电子股份有限公司 可分级音频编码
CN101263553A (zh) * 2005-07-13 2008-09-10 法国电信公司 分级编码/解码设备

Also Published As

Publication number Publication date
JP5474088B2 (ja) 2014-04-16
KR20110095387A (ko) 2011-08-24
US20110224995A1 (en) 2011-09-15
EP2366177A1 (fr) 2011-09-21
EP2366177B1 (fr) 2015-10-21
KR101339857B1 (ko) 2013-12-10
FR2938688A1 (fr) 2010-05-21
WO2010058117A1 (fr) 2010-05-27
CN102282611A (zh) 2011-12-14
US8965773B2 (en) 2015-02-24
JP2012509515A (ja) 2012-04-19

Similar Documents

Publication Publication Date Title
CN102282611B (zh) 数字音频信号的分级编码方法和分级编码器
EP1423847B1 (en) Reconstruction of high frequency components
CN103065637B (zh) 音频编码器和解码器
CA2778240C (en) Multi-mode audio codec and celp coding adapted therefore
CN101981615B (zh) 分级解码结构中数字信号中的传输误差掩盖
CN1735928B (zh) 用于可变速率音频编解码的方法
RU2752127C2 (ru) Усовершенствованный квантователь
CN101395661A (zh) 音频编码和解码的方法和设备
CN102511062A (zh) 用于改进数字音频信号的分级编码/解码的增强编码/解码中的比特分配
CN100527225C (zh) 基于celp的语音代码之间的代码转换方案
US8914280B2 (en) Method and apparatus for encoding/decoding speech signal
CN103370740B (zh) 分级编码器中的改善阶段的改善编码
US6240385B1 (en) Methods and apparatus for efficient quantization of gain parameters in GLPAS speech coders
KR100467326B1 (ko) 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
US20100145712A1 (en) Coding of digital audio signals
Gournay et al. A 1200 bits/s HSX speech coder for very-low-bit-rate communications
Serafat A CELP-Based Speech-Model Process
BRPI0317954B1 (pt) Variable rate audio coding and decoding process

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant