CN101842988B - 基于概率表动态计算的符号平面编码/解码 - Google Patents

基于概率表动态计算的符号平面编码/解码 Download PDF

Info

Publication number
CN101842988B
CN101842988B CN2008801135935A CN200880113593A CN101842988B CN 101842988 B CN101842988 B CN 101842988B CN 2008801135935 A CN2008801135935 A CN 2008801135935A CN 200880113593 A CN200880113593 A CN 200880113593A CN 101842988 B CN101842988 B CN 101842988B
Authority
CN
China
Prior art keywords
plane
probability
numerical value
sign
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008801135935A
Other languages
English (en)
Other versions
CN101842988A (zh
Inventor
玛丽·奥格
西明赫恩久伊特·霍安格
斯泰凡·雷高特
马克·安东尼尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN101842988A publication Critical patent/CN101842988A/zh
Application granted granted Critical
Publication of CN101842988B publication Critical patent/CN101842988B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种根据位平面(MSB,...,LSB)的算术编码,其包括使用具有0或1的概率表对各个位平面进行编码。根据本发明,基于对应于各个帧中信号(X)分布(H)的概率密度模型(Mod)动态计算各个信号帧的概率表。

Description

基于概率表动态计算的符号平面编码/解码
技术领域
本发明涉及用于诸如语音信号、图像信号、或具体是音频和/或视频信号或甚至是多媒体信号之类的数字信号存储和/或传输的数字信号编码/解码。
背景技术
在数字信号的基本压缩方法中,可将其分为无损压缩方法(霍夫曼编码、Golomb-Rice编码、算术编码),也可称为“熵编码”,和基于标量或矢量量化的有损压缩方法。
参考图1,一般的压缩编码器通常包括:
-用于分析待编码的源S的分析模块100,
-量化模块101(标量或矢量),以及
-编码模块102;
而相对应的解码器包括:
-解码模块103,
-逆量化模块104,以及
-合成模块105。
在下面的描述中,并不讨论分析和合成。仅考虑后面跟随着相关编码/或解码的量化。这里,我们更关注于后面跟随着使用符号平面的量化索引编码的数据块的标量量化。该编码技术如图2所示,已经用于多项信号压缩标准(在“位片算术编码”(BSAC)编码器中的编码MPEG-4音频,在图像位平面中的编码JBIG图像,尤其是使用JPEG2000标准的编码,编码MPEG-4视频)。
参考图2,在后面跟随着符号平面编码的标量量化中,该编码通常涉及:
-用于以矢量方式传送源信号S的模块200,其中,矢量记为X=[x1…xN],其维度N≥1,
-用于传送定义为整数值序列Y=[y1…yN]的量化矢量的标量量化模块201,
-符号平面分解模块202,其中符号可为0或1的位,并且使用该模块202传送数值矢量Pk=[a1,k…aN,k](式中k=0,…,K-1)和符号矢量S=[s1…sN],
-用于编码位平面和复用编码数值的模块203,以及
-用于根据传输的比特数量Nb来调节位速率的模块204;
而相对应的解码涉及:
-解复用和解码模块206,以及
-用于转换为整数的模块207,以便传送矢量
Figure GPA00001115460200021
并在没有位错误和截断比特流的情况下
Figure GPA00001115460200022
因此,待编码信号X=[x1…xN]适合于通过标量量化(由模块201执行)来生成整数数值的序列Y=[y1…yN]。分解为位平面(由模块202执行)首先涉及分离符号和绝对值,如下所述:
Figure GPA00001115460200023
其中ai=|yi|&
然后将绝对值分解为位的形式,使用公式:
ai=BK-1(ai)2K-1+…Bk(ai)2k+…+B1(ai)21+B0(ai)20,其中
-Bk(ai)是量化分量Yi的绝对值ai的二进制分解的第k位,并且
-K是用于数值ai集合的分解的位平面的总数,该K数值由下面的公式定义:
Figure GPA00001115460200025
式中:[·]表示取较大的整数,以及log2(0)=-∞。
注意:当未定义零数值符号时,上述约定(yi=0时si=0)可以改变(yi=0时变为si=1)。
平面的熵编码(模块203)可在所谓“基于上下文的算术”编码器之类的编码器中得到良好的应用。
Witten等人所撰写的“Arithmetic encodinng for DataCompression”文献解释了算术编码器的原理(详见I.H.Witten,R.M.Neal,J.G.Cleary,Communications of the ACM-ComputingPractices,Vol 30,No.6(June 1987),pp.520-540)。
参考Witten等人的这篇文献中的表I(第521页),可以看到:为了进行编码,就必须预先定义概率表。在“基于上下文”算术编码器中,由符号0和1的概率表所产生的数据并不总是相同的,并且有可能演变成依赖上下文的函数,该上下文可取决于诸如已解码的相邻位的数值(例如,在较高有效位平面中和在相邻元素中的数值)。Howard等人撰写的文献具体描述了基于上下文的算术编码器的原理(详见“Arithmetic encoding for DataCompression”,P.G.Howard,J.S.Vitter,Proc.IEEE vol.82,no.6(June 1994))。
一般来说,模块203逐一对位平面进行编码,从最高有效位平面开始并持续到最低有效的位平面。这一或高或低位平面的概念将在下文中参考图3进行说明。符号位si(其中i=1,…,n)仅当相应的绝对值ai非零时才可被发送。为了允许位平面的部分解码,只要当其中一个解码位{ai,k}k=0,...,n-1等于1时,就发送符号位si
编码器所输出的位速率通常是可变的。以下说明未描述管理可变位速率的方法(图2中模块200和104)。由模块203所生成的比特流可通过通道205发送,该通道有可能(通过使用比特流的分级特性)截短比特流或引入位错误。
在解码时,解复用器-解码器(模块206)逐一重构位平面
Figure GPA00001115460200041
并解码所发送的符号位
Figure GPA00001115460200042
该解码信息允许重构(模块207)信号Y。如果没有位错误和没有截短比特流,则当然可以获得:
Figure GPA00001115460200043
Figure GPA00001115460200044
并因此
为了便于讨论,假定在本文的其它部分中没有任何位错误。
位平面编码的主要好处是其自然导致信号的分级(或渐进)编码。一旦接收到由编码器所发送的比特流,就能重构序列信号并获得逐渐精确的近似值。
图3给出了一例N=8的位平面分解实例。在所展示的实例中,矢量Y为Y=[-2,+7,+3,0,+1,-3,-6,+5]。非零数值{yi}i=1,...,N都可认为是“有效的”(在图3中标记为VS)。在图3中,符号位可由sgn所标记的矢量来表示。在这种情况下,可得到K=3,P0=[0,1,1,0,1,1,0,1],P1=[1,1,1,0,0,1,1,0],P2=[0,1,0,0,0,0,1,1]以及S=[1,0,0,0,0,1,1,0]。
矢量Pk还表示加权k的位平面。最高位平面PK-1表示最高有效位平面(由MSB标记“最高有效位(Most Significant Bits)”),而最低位平面P0表示最低有效位平面(由LSB标记“最低有效位(Least Significant Bits)”)。
现在,将参考对应于位平面算术编码(跟随在标量量化之后)流程图的图4来详细讨论图2所示模块203的操作。正如业内所熟知的那样,这涉及到采用N维复用的编码。在启动步骤400后,获得位平面的总数K(步骤401)。当前循环索引k可逐一减少并因此将当前索引值初始设置为k=K-1(步骤402),从而当k=0时结束该过程。校验403验证k=0的值还未达到。只要这个k=0值还未达到(Y箭头),则对当前索引为k的平面Pk进行编码(步骤404)。因此,在k=K-1的第一次循环中处理对应于MSB平面的平面PK-1,而在k=0的最后一次循环中处理对应于LSB平面的平面P0。在步骤405中,发送与平面Pk相关的新的有效系数的符号。下一步骤406对当前索引k的值减一。如果已经处理了k=0数值的平面P0(检测403输出N箭头),则结束该过程(结束步骤407)或对该信号(或帧)中新的数据块重新执行此过程。从而,以从MSB平面至LSB平面的方式对系列位平面Pk进行编码。另外,还可对平面Pk再细分为子矢量,以允许执行更为渐进的解码,该再细分可能一直执行以获得尺寸上(等于1)的单位子矢量。
因此,可采用自适应算术编码的方法对绝对值位平面进行编码。实际上,平面Pk可采用自适应算术编码逐一编码(彼此间独立,以连续的方式从MSB平面至LSB平面)进行编码。在适用平面Pk编码的符号(0和1)概率中仅使用了在同一平面Pk中已经被编码的位。因此,当开始新平面Pk的编码时,对自适应算术编码器进行重新初始化,具体是将0和1的概率初始化为1/2(=0.5),并且当对同一平面进行编码时,通过更新0和1的频率使这些概率演变和适用。文献“An introduction to arithmetic coding”详细描述了这类编码(详见G.C.Langdon,“An introduction toarithmetic coding”,IBM J.Res.Dev.28,2,p.135-149(March1984))。
更为复杂的编码器并不将0和1的初始频率设置为1/2,而是将其概率数值存储在预先保存的表中,并由该表提供适合某些操作(例如,适于位速率或者适于待编码源的类型)的0和1的初始频率。因此,在最好的情况下,现有技术所熟知的编码器需要使用符号概率表(包括预定义的频率数值)的存储器。更具体地说,为了应用诸如霍夫曼或算术编码之类的熵编码,通常都需要预先保存的概率表。因此,业内所熟知的现有技术就显得不是非常灵活,因为它们都需要预先计算并存储能够适应于特定操作条件(位速率,源的类型)的信息。结果,为了生成这些表,在设计编码器/解码器的时候就需要预测所有可能的状况。
本发明旨在改善这种状况。
发明内容
为此目的,提出一种用于处理信号以对信号进行符号平面压缩编码/解码的方法,其中对至少一个平面确定符号数值的概率。
在本发明的意义中,这些概率可根据信号分布的估算进行动态计算。
优选地,由于在编码之前需对信号进行量化,所以可在量化之前对待编码的信号作信号分布的估算,从而获得最为准确的信号分布的估算(而不是对量化后的处理信号分布的估算)。
在第一实施例中,由于该信号包括序列数值,所以各个数值都可分解为在多个各自对应符号平面中的多个符号数值。为至少一个平面计算概率,且各个平面都与该平面所具有符号数值等于给定符号的概率有关。优选地,至少为标记为最高有效符号数值的平面计算概率。
在第二实施例中,另外还考虑由从表示最高有效符号数值的平面所获取的符号数值所定义的上下文,为其它平面计算概率。
更具体地说,对于所述序列数值中的同一信号数值位置来说,由表示比当前平面的符号数值更高的有效符号数值的平面所获取的各个符号数值来定义当前平面和当前位的上下文数值。因而,根据当前平面的多个可能上下文数值来计算当前平面的上述概率。
在第三实施例中,选择有限数量的可能上下文数值,优选为两个,分别为:
-第一上下文数值,表示在标记为较高有效符号数值的平面中至少一个有效符号数值的出现,
-第二上下文数值,表示在标记为较高符号数值的平面中没能发现一个有效符号数值。
因此,与现有技术不同,本发明提出无需任何概率表存储的方法,可使用“在线”(作为信号的函数)计算方式取代存储并使用待编码/解码的源的概率密度的估算(例如,由广义高斯模型来表示),来动态计算该平面的符号概率(例如,位平面的0和1的概率)。因此,本发明能够使用待编码(或解码)的源的概率模型的相关知识,并初步估算各个平面Pk中的符号概率。
实际上,可以“使用”待编码的源的模型,因为某些编码器/解码器已经实现了这些建模,特别是为计算待编码信号的形状因数来说(通常记为α)。然后,可依靠先前存在的信号分布模型,例如使用堆栈运行(stack-run)编码来计算在变换编码器中的形状因数α,所述堆栈运行编码如在Oger等人撰写的文献中作了介绍(详见:M.Oger,S.Ragot and M.Antonini,“Transform audiocoding with arithmetic-coded scalar quantization and model-basedbit allocation”,ICASSP,April 2007)。
然而,应当注意的是:上述文献并没有揭示任何形式的符号平面编码。
附图说明
本发明的其它特征和优点将通过下述的详细说明以及附图变得更为清晰,其中除了上述图1至图4外:
-图5示出了编码器的一个实例,在本发明的意义中,该编码器使用了适用于位平面编码的待编码信号的分布模型,
-图6示出了对应于图5所示编码器的解码器,
-图7示出了广义高斯分布的概率密度,并示出了计算概率p(ai)的不同间隔,
-图8示出了根据上述第一实施例实现具有初始概率表的各个平面Pk的位平面编码的流程图,
-图9示出了对应于图8所示编码的解码流程图,
-图10示出了一例分解为三个位平面以及对LSB平面进行基于上下文编码的实例,
-图11示出了与高次谐波信号相关的位平面和该信号的柱状图H,用于与可分配给它的分布模型MOD(虚曲线)进行比较,
-图12示出了位平面算术编码的原理(在所示实例中基于上下文编码平面PK-2),位平面的概率表可采用本发明所述方法进行动态计算,
-图13示出了根据上述第二实施例实现具有上下文初始概率表的位平面的位平面编码的流程图,以及
-图14示出了根据上述第三实施例在仅指定两个可能上下文的情况下实现具有上下文初始概率表的位平面的位平面编码的流程图。
具体实施方式
本发明提出一种符号平面的编码/解码方法,该方法使用了待编码源的概率分布来估算各个平面的符号(例如0和1)的初始概率。该处理旨在运用概率表所提供动态信息来优化熵编码。
现在,讨论诸如熵编码之类基于上下文算术编码的情况。下文描述了一实例,该实例在没有丢失频域编码器的变换系数的量化操作所产生的索引的情况下,实现了本发明意义的编码,尤其是语音信号和/或音频信号的编码。然而,本发明同样适用于有损编码,尤其是诸如图像或视频信号的编码。
图5示出了在本发明意义中,使用待编码信号分布模型,通过位平面来确定符号0或1的初始概率的编码器的实例。如图5实例所示,编码器的构造非常接近于Oger等人撰写的文献中所描述的现有技术编码器(详见:M.Oger,S.Ragot and M.Antonini,“Transform audio coding with arithmetic-coded scalar quantizationand model-based bit allocation”,ICASSP,April 2007)。
具体来说,该文献所述的编码器为了估算形状因数α须确定信号的分布模型,在引用的文献中,这仅是用于控制位速率。这类编码器使用堆栈运行编码技术,并且与本发明意义中的位平面编码没有任何联系。
即使是这样,本发明可有利地从先前存在的包括形状因数计算模块505(图5)的结构中获益,并且还能够使用该模块505进行以下所讨论的位平面编码。
参考图5,该例所描述的编码器包括:
-高通滤波器501,
-基于感知的过滤模块502,
-模块503,用于LPC(用于“线性预测编码”)分析和量化以便获取短期预测参数,
-模块504,用于MDCT(用于“修正离散余弦变换”)和频率整形,
-模块505,用于计算形状因数α,在所描述的实例中,采用了广义高斯模型,
-位速率控制模块506,是一种特别用于将该控制作为所使用比特数量Nb的函数来实现的控制模块,
-模块507,通过使用模块505来实现第一实施例以及其它后面实施例的上下文计算中至少用于初始化位平面编码模块509的概率表的计算,
-统一标量量化模块508,
-位平面编码模块509,
-模块510,用于估算噪声级别和量化,
-复用器511,用于对模块503、505、509和510的输出进行复用,用于存储编码数据或为了之后的解码作传输。
输入信号x(n)通过高通滤波器(501)滤波,以便滤去低于50Hz的频率。然后,将基于感知的滤波应用于信号(502),并且将LPC分析并行应用于模块501滤波后的信号(503)。在基于感知的滤波后,将MDCT分析(504)应用于该信号。所使用的分析可以相同于诸如3GPP标准中的AMR-WB+编码器的分析。根据MDCT变换(505)系数来估算形状因数α。具体地说,一旦估算出形状因数,就可以计算出适于接近所期望位速率(506)的量化步长q。然后,可使用该量化步长,例如使用图5中的模块512除以该步长,来进行信号的统一标量量化(507)。这样,就采集出一个随后被模块509编码的整数序列Y(k)。优选的,还可对注入解码器的噪声进行估算(模块510)。
在图5所示实例中,编码是通过对具有实时初始化的概率表的位平面编码的变换来实现的,在本发明的意义中,还伴随着作为待编码信号函数的动态估算分布模型。在MDCT变换(模块501至504)前,编码的第一部分等价于上述Oger等人的文献中所提出的用于变换编码的基于堆栈运行的方法。形状因数估算(模块505)和位速率控制也可能是相同的。然而,这里来自于模块的信息还将用于估算符号0和1的概率表(模块507),该概率表将在编码模块509的初始化中使用。然后,使用由附图标记512表示的除法模块,来应用统一标量量化(模块508)。该量化还可与Oger等人的文献中所描述的方法相同,但是在这里它后面跟随着位平面编码(模块509),在该模块中,根据模型(由模块505定义)实现如上所述的概率表的初始化。进行噪声等级的估算(模块510),这也可采用与Oger等人的文献中所述相同的方法。然后,编码器的参数通过复用器511发送至解码器。
参考图6,其对应的解码器可包括:
-模块601,用于对接收图5所示编码器的比特流进行解复用,
-模块602,用于解码LPC系数,
-模块603,用于基于图5中模块505所定义的模型进行估算概率,
-模块606,用于解码量化步长
Figure GPA00001115460200112
-模块605,用于使用量化步长的解码值来解码噪声电平
Figure GPA00001115460200113
-位平面解码模块604,用于接收估算的概率(模块603),以便使用量化步长的解码数值来传送整数
Figure GPA00001115460200114
的解码矢量,
-噪声注入模块607,
-模块608,用于去加重(de-emphasis)低频的,以便确定在变换域中所表示的解码矢量
Figure GPA00001115460200115
-逆MDCT变换模块609,以及
-逆基于感知的过滤模块610,它基于解码LPC系数(模块602),用于获得在传输中没有丢失或截短的信号
Figure GPA00001115460200116
其对应于图5中的原始信号x(n)。
再次参考图5,将编码所使用的位数量Nb发送至位分配模块,用于修改(或适合于)量化步长值,使得该位数量保持小于或等于有效的位预算。因此,MDCT频谱的编码在位速率控制迭代循环中完成,其典型的迭代为10至20次,以便达到最佳量化步长qopt。更为明显的是,初始量化步长可根据由用于确定广义高斯模型的模块505所传送的形状因数α来估算出,该初始量化步长的第一次迭代的数值基于最佳量化步长qopt来确定的。
下文将更加详细地描述该模块505的操作。
不同于传统的编码,该“基于模型”(概率式)的编码包括基于概率模型实现源的量化和编码,但这并不是直接进行的。
参考图11,示出了待量化和编码的信号(表示为X并因此对应于系列xi的集合)的振幅(A(MDCT))的变化。该信号可由例如图5的模块504进行传送,使之成为对应于以频率(freq)为函数的MDCT信号。值得注意的是,信号X可采用量化步长q进行量化,用于获取(例如图5中模块508的输出)由Y表示的信号,并成为对应于系列yi的序列。这些系列yi的符号和绝对值ai被都可确定,并且这些绝对值ai可分解成图11所示的MSB……LSB位平面。
更具体地说,为了获取对应于信号X分布的柱状图H(图11右侧的图):
-“计算”所有信号X系列xi等于0的情况,并且将所获取的数量标记在图中的y轴(Hist)上,这时x轴的值为0,
-然后,计算所有这些系列等于1的情况,并且将所获取的数量标记在y轴上,这时x轴的值为1,
对随后的数值2,3以及-1,-2,-3等等继续执行上述操作。其结果是,图11中的标记Val(xi)(图中x轴的右侧)表示信号X的所有可能数值。
然后,该柱状图H运用诸如高斯形式的模型Mod(虚线)进行建模。现在参考图7,信号X的分布H最终可由概率密度模型来表示(用pdf表示“概率密度函数”),在x轴值范围的简单改变后(从Val(xi)变为Val(ai),标记Val(ai)表示系列ai中的每个绝对值可采用的各种可能取值)。
图7示出了一例示范性的广义高斯概率密度,这是一种可有利选取的特定模型。我们下面给出它的数学表达式(由fα表示)。
具有零均值和σ标准差的广义高斯源z的概率密度定义如下:
f α ( z ) = A ( α ) σ c - | B ( α ) z σ | α
式中:α是描述指数函数形式的形状因数(图7),其参数A(α)和B(α)由定义如下:
A ( α ) = αB ( α ) 2 Γ ( 1 / α ) andB ( α ) = Γ ( 3 / α ) Γ ( 1 / α ) 并且
其中Γ是伽马函数,其定义如下:
Γ ( α ) = ∫ 0 ∞ e - 1 t α + 1 dt
因此,源(待编码的信号)作为广义高斯变量随机选取的结果进行建模。该广义高斯模型还可有利地用于对在改进的离散余弦变换(MDCT)域中待编码的频谱的建模。可从该模型中获得描述该模型特性的形状因数α的数值。请记住,有利的是,已经基于待编码的频谱估算出每个信号块(或帧)的形状因数α,在某些现存的编码器中集成了例如图5所示模块505那样的模块,用于计算量化步长q。
在本发明的意义中,分布模型的估算(可具体导致形状因数α),还允许通过平面来计算符号值的概率。该技术将在下文中进行说明。
再次参考图7,具有N个可能取值的系列数值ai(在图7中表示为Val(ai))的概率p(ai)的估算基于下面的计算:
p ( a i ) = ∫ q a i - q / 2 q a i + q / 2 f α ( y ) dy
图7还示出了用于计算概率p(ai)的不同间隔。已经可以看出,由于广义高斯分布是对称的,我们可以得出p(ai)=p(-ai)。还可注意到该间隔是规则的,这是因为使用了步长为q的统一标量量化(以根据系列xi获得系列yi(或ai))。还注意到系列ai的最大数值越高,则相关概率p(ai)越低。
可由常规积分法完成对概率p(ai)的计算。在优选实施例中使用了“梯形(trapezoidal)”方法,其易于实施。优选的是,标准偏差值α可归一化为1,使得用于计算上面方程式中的积分的量化步长变为q/σ。该操作使得积分的计算更有效率,因为信号动态改变的问题因此被消除,并且无论形状因数如何取值我们都将返回到单位方差的中心源。
下文将介绍基于概率p(ai)的计算来通过位平面估算符号0和1的概率的三个实施例。
在第一实施例中,估算每个位平面Pk所具有位0或1的概率,从而将其定义为初始概率表。下文将参考图12来描述这些表。
在第二实施例中,估算作为已编码位的函数的并且位于在前平面相同位置的0或1的条件概率(从而这些位定义了一上下文)。
在第三实施例中,估算具有作为限制两个可能上下文数值的数量函数的条件概率(上下文:“有效的(significant)或无限的(not significant)”)。
应该记住:在对本技术的说明中,平面Pk中0和1的初始概率被设置1/2=0.5,或者,最好预先保存在表中。然而,每个平面中实际上0和1的概率可取与1/2差别很大的数值,并且通常从一个信号帧到下一个信号帧都是非常不同的,例如其取决于信号中的语音音阶,将在下文中看到。
图8中的流程图示出了位平面编码的原理,根据第一实施例,其基于模型实现各个平面Pk概率表的初始化。首先估算出该模型的参数,即形状因数α和标准偏差σ(启动步骤800后的步骤801)。然后,确定标量量化步长q(步骤802),例如根据图5所示的因数α的数值。根据参数σ,α,和q,估算出如上所述系列ai的概率(步骤802)。使用与参考图4所描述的相似的原理,通过检验805循环索引k的当前值验证是否还存在待编码的位平面,循环索引k的当前值从K-1减至0(步骤808)。然后,估算出在每个平面中具有位0或1的概率(步骤806),并且然后使用该概率的信息完成对该平面的编码(步骤807)。只要索引k为正值或等于0时(只要存在待编码的平面),则一直重复执行该循环。否则,结束该过程(终止步骤809)或对下一待编码的信号块(或帧)重新执行改循环。
现在参考图9,在解码中,启动步骤900后,解码描述编码所使用的分布模型的参数
Figure GPA00001115460200151
Figure GPA00001115460200152
(步骤901)。然后,使用该模型(步骤902),估算与系列ai相关的概率。然后,应用循环(907),减小当前循环索引k的值,使k的初始值设置为K-1(步骤903)。只要索引k是正值(检验904输出的Y箭头),则估算在每个平面Pk中的0和1的概率(步骤906),使得更有效地解码每个平面Pk(步骤907)。否则,(对应于检验904输出的N的k小于或等于0时),则没有待编码的其它平面,可结束该过程(终止步骤908)或为下一待编码的块(或帧)重新执行该过程。
我们从上面可以看出与系列ai的值相关的概率是如何进行计算。现在,我们将描述与指定符号相关的概率计算如何可以从这里得出每个平面Pk的(在图8中的步骤806,以及在图9中的步骤905)。为了简化起见,在下述等式中与系列ai相关的概率p(ai)在下文中用p(a)表示。
获取在平面Pk中数值为0的概率可再次根据对应于在已示例中描述的广义高斯模型的概率模型算出。系列ai的二进制分解(因此在平面Pk中)的第k位等于0的概率,由下式给出:
Figure GPA00001115460200161
其中
为了方便该等式的撰写,可简写为:
p(Bk(ai)=0)
从而给出了平面Pk中具有符号0的概率的关系式为:
p ( b k = 0 | a ≤ M ) = p ( b k = 0 , a ≤ M ) p ( a ≤ M ) ,
式中:bk和M分别为:
-表示平面Pk中任一位的随机变量,以及
-具有在K个平面中的最大绝对值的整数,即M=2K-1。
从上面的描述中,我们可看出概率的表达式取决于平面的总数K并因此取决于可被编码的整数数量。实际上,这里假设编码平面的数量可记录于比特流中,并因此与编码相同,该数据在解码中也是可用的,特别是在平面Pk的算术编码之前。我们因此可获得“条件”概率:已知a≤M。
概率p(a≤M)定义为:
p ( a ≤ M ) = Σ a = - M M p ( a ) .
概率p(bk=0,a≤M)定义为:
p ( b k = 0 , a ≤ M ) = Σ a = - M M p ( B k ( a ) = 0 ) .
为了简化该等式的书写,数值p(bk=0|ai≤M)(或p(bk=0|a≤M))可记为:“pM(bk=0)”。
然后,得到适用于在平面Pk中具有数值0概率(步骤806)的下述表达式:
p M ( b k = 0 ) = 1 Σ a = - M M p ( a ) × Σ a i = - M M p ( B k ( a ) = 0 ) = 1 Σ a = - M M p ( a ) × Σ a i = - M M p ( a ) × δ B k ( a ) , 0
我们可从中看到:概率p(ai)(或p(a))包含在这最后一个等式中,该等式证明了图8和图9的步骤803和902中的其在前计算是正确的。
相对于现有技术来说,位平面编码其技术本身实际上是没有变化的。然而,本质上的差别在于将0的概率初始化为上文给出的值p(Bk(a)=0),而不是选择默认初始值1/2或取决于位速率或源所预先保存的初始值。
为了获取具有数值1的概率,即pM(bk=1),可简单地使用此类互补关系:pM(bk=1)+pM(bk=0)=1。
图10示出了可从K=3的平面中获取的不同数值(ai=0,1,2,3,...,7)的实例。因此,对于平面P2(MSB)来说,具有0值的位对应于整数0、1、2和3(实线)并因此在MSB平面中具有0数值的概率由下式给出,使用上面所给出的最后一个等式:
pM(b2=0)=p(ai=0)+p(ai=1)+p(ai=2)+p(ai=3)
同样,对于平面P1来说,具有0值的位对应于整数0、1、4和5并且:
pM(b1=0)=p(ai=0)+p(ai=1)+p(ai=4)+p(ai=5),等等。
回到图11,我们现在来解释这些概率计算的结果意味着什么。在此图中,为了纯粹说明目的,我们已经示出了具有高次谐波(或音阶)特性的光谱信号X。因此,MDCT信号仅在少数连续频率(对这些频率来说有效位的数值为1)中的振幅较大(其绝对值),而与其他频率相关的振幅相对较低(有效位保持数值为0)。其结果是,MSB平面和紧跟着的平面具有很少的1位。根据该信号的一般形状,可获得形状因数α的较小数值(小于0.5),并且对于MSB平面和紧跟着的平面来说,获取0位数值的概率较高(接近于1)。但是,在高度简化的说明中,最低有效位的LSB平面和紧接在其前面的平面可能包括一样多的0和1,这取决于噪声波动,并且所获得具有0数值的位的概率是平均的(接近于0.5)。
应当注意的是,如果信号谐波较少并具有较多噪声(例如无声的语音信号),则在MSB平面中获得数值为0的位的概率会较低(接近于0.5)。在Oger等人的参考文件(图1和其评论)中描述了该观点。于是,正如该Oger等人的参考文件中所述的那样,如果图11的信号以柱状图的形式进行描述,可获取一个窄峰(在图11中由H表示),在其一半高度的宽度具有较低的数值(给出形状因数α)。然而,对于噪声非常多的信号或无声的语音信号来说,该柱状图可具有一个较宽峰以及一个较大的形状因数α。在这里可以理解至少在第一MSB平面中待编码源的分布模型Mod(近似图11中的柱状图H)是如何与位数值概率相关的。
这些计算概率值还可用于算术编码器(或算术解码器),例如前述引用Witten等人所著的参考文献中所描述的编码器(详见:I.H.Witten,R.M.Neal,J.G.Cleary,“Arithmetic Coding for DataCompression”,Communications of the ACM-ComputingPractices,Vol.30,No.6(June 1987),pp.520-540)。
在这种情况下,参考图12(可与Witten等人的上述文献中图1b(第522页)对比),赋值pM(bK-1=0)=A和pM(bK-1=1)=B定义了平面PK-1(MSB)的概率表(可与所述Witten等人的文件中的表I(第521页)对比)。
通过应用本发明,因此至少能够为MSB平面逐帧地计算出概率表pM(bK-1=0),pM(bK-1=1),可直接根据信号的形式而无需现有技术中的预先存储概率表,预先存储功率表需要编码器和解码器的额外存储资源且还限制了实施的灵活性。在本发明的意义中,概率计算直接实时对信号进行的,优选为采用如上所述的信号分布模型的初始估算(图5中的模块507和图6中的603)来进行。
数值A=pM(bK-1=0)和B=pM(bK-1=1)的计算对应于已在上文中所提到的“概率表初始化”。优选为每个平面执行该操作。在上述第一实施例中,为一当前平面Pk计算这些概率,且不用考虑除Pk外的其它平面的位数值。在第二实施例中,通过定义“上下文”来考虑这些数值。
实际上,再次参考图11,可看到在紧跟着MSB平面的平面中,如果平面中的某一位为1,紧跟的平面中位于同列位置上的位通常也为1。当然,图11只是一个例证,但是在实际案例中也可得出该观点。典型的是,如果在平面中某列i的位为1,“最可能”下一平面中位于同列位置上的位也为1。相反地,与在某信号频谱中的多个频率相关的振幅常常接近于0(特别是在语音信号情况下)。因此,如果较高平面Pk中的位为0,“最可能”下一平面Pk-1中位于同列位置的位也为0。其结果是,为了估算与平面中的某位相关的概率,可有利地考虑在前平面中位于同列位置上的位的数值。可利用这一观点,基于平面Pk中第i列的位的观测数值(例如图11中MSB平面中的唯一的1位),通过为相同列i并位于后面的平面Pk-1中的位定义为上下文(在此平面中位依然为1)。
该原理的使用具体通过算术编码器实现,该算术解码器被称为“基于上下文”的编码器,将在下文所描述的实施例中进行说明。
它们应用基于模型的位平面编码,该模型允许为每个平面Pk作条件概率计算,其中k<K-1。上述位平面编码并不使用平面Pk之间共同的信息,因为平面Pk可逐个编码,并且相互独立。我们现在提出一种利用已编码信息的方法。
如上面的例子,对所述MSB位平面进行编码,并独立于其它位平面,基于广义高斯模型初始化0和1的概率。然而,平面Pk(其中k<K-1)的编码在这里使用关于在前平面PK-1,...,Pk+2,Pk+1的“上下文”信息的知识。
通常,为不同可能的上下文计算概率表,因此为取自先前平面的不同可能的位数值计算概率表。
例如,再次参考图12,为平面Pk-2计算两个概率表(每个表使得平面Pk-2的位等于0或1),并作为在前平面Pk-1中可能位值的函数(一个表对应于0值而另一个表对应于1值),因此作为图12中C所表示的上下文的函数。在所描述的实例中,平面Pk-1中位于列i=0的位的数值是0,因此上下文为C=0并且相关概率表由值A′和B′给出。对于列i=1来说,平面Pk-1中相应位的数值是1,因此上下文为C=1,并且这时相关概率表由值C′和D′给出。对于列i=2来说,平面Pk-1中相应位的数值是0,因此上下文为C=0并且重新使用由值A′和B′给出的概率表。应该记住的是,列i指定系列ai或yi的索引i。应该注意的是,在图12中MSB平面的上下文C并未被定义(当然,这是因为没有比它更有效的位平面)。为了在计算机中实现该实施例,MSB平面的上下文被设置为几乎所有都等于0。
这里我们不会详述平面如何被编码,也不会详述概率间隔被依次划分的方法(虽然间隔的范围在图12中示出)。可参见Witten等人的文献对这些元素的描述。
图13所示的流程图示出了在本发明的第二实施例中具有为平面Pk的每个位确定上下文的位平面编码的原理。与图8所示的流程图中相似的元素使用相同的标记来表示,并且这里不再赘述。
如果至少一个平面将被编码(检验805输出Y箭头),为每个平面估算出与不同可能的上下文数值相关的概率(步骤1306)。在第二实施例中,术语“上下文”可理解为是指,对于第k平面的第i位来说,在平面Pk之前的平面中位于第i列的位的集合。因此,参考图10,对于平面P1的第7列来说,上下文为“1”(平面P2(MSB)中位于第7列的位的数值),而在平面P0中,上下文为“11”(一个1是平面P2(MSB)中第7列的位的数值而另一个1是平面P1中位于第7列的位的数值)。
然后,可根据以这种方式为当前位定义的上下文,来估算概率,作为为该位的列而得到的上下文的函数(步骤1307)。然后,根据以该方式计算的概率,对平面中的每个位进行编码(图13中步骤1308)直到所有的列都被使用。对下一平面重复执行此过程,再次为每个位考虑上下文。只要还存在要待编码的平面,则该循环就重复执行(检验805输出Y箭头)。否则(检验805输出N箭头),终止该编码过程或进行下一信号块(或帧)的编码。
因此,首先为各种可能的上下文计算概率表,然后,获知该上下文,为每个位估算出具有0数值或1数值的概率。为不同可能上下文计算概率表的方法将在下文中详述(在图12示例中的数值A′,B′,C′,D′)。
上下文它们自身的概率Ck(a)(步骤1306)的计算如下所述。对于等级低于K-1的位平面(不同于MSB平面)来说,在平面Pk中上下文Ck(a)可定义为ai被2K-k除的商,即:
Figure GPA00001115460200221
式中-M≤a<M并且所有都满足k<K。
对于平面Pk来说,可能上下文数为2K-k。平面Pk的不同可能的上下文数值ck,n可定义为:
Figure GPA00001115460200222
式中0≤n<2K-k并且所有都满足k<K。
于是,在第二实施例中,参考图10所示实例,其中K=3个平面,在平面k=1中,我们算出4个不同的上下文{00,01,10,11},并且平面Pk中a的第k个上下文等于ck,n的概率由下式给出(在图13的步骤1306中):
p ( C k ( a ) = c k , n ) = p ( B k + 1 ( a ) = B k + 1 ( n ) ) × p ( C k + 1 ( a ) = c k , n ) = Π j = k + 1 K - 1 p ( B j ( a ) = B j ( n ) )
= p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) . B j ( n )
现在,已知上下文Ck(a),为k<K-1计算出具有0数值的条件概率,在图13的步骤1307中,如下所述。
在对平面Pk的编码过程中,尝试利用上下文的最初知识(等级从k+1至K-1的平面)。具有数值0的条件概率,已知上下文ck,n(式中k<K-1),由下式定义:
p M ( b k = 0 | c k = c k , n ) = p M ( b k = 0 , c k = c k , n ) p M ( c k = c k , n )
下面的关系式允许为2K-k个不同可能上下文数值(0,1,00,01,10,11,000等)确定产生的所有概率:
p M ( b k = 0 | c k = c k , n ) + p M ( b k = 1 | c k = c k , n ) = 1 Σ n = 0 2 K - k p M ( c k = c k , n ) = 1
概率pM(ck=ck,n)(式中k<K-1),由下述关系式定义:
p M ( c k = c k , n ) = 1 Σ a = - M M p ( a ) × [ Σ a = - M M p ( C k ( a ) = c k , n ) ] = 1 Σ a = - M M p ( a ) × Σ a = - M M [ p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) , B j ( n ) ]
同样,对于概率pM(bk=0,ck=ck,n)(式中k<K-1),可由下述关系式定义:
p M ( b k = 0 , c k = c k , n ) = 1 Σ a = - M M p ( a ) × Σ a i = - M M [ p ( B k ( a ) = 0 ) × p ( C k ( a ) = c k , n ) ]
= 1 Σ a = - M M p ( a ) × Σ a = - M M [ p ( a ) × δ B k ( a ) , 0 × Π j = k + 1 K - 1 δ B j ( a ) , B j ( n ) ]
因此,获知上下文ck,n(步骤1307)的具有数值0的条件概率,由pM(bk=0|ck=ck,n)表示(式中k<K-1),最终由下述关系式来定义:
p M ( b k = 0 | c k = c k , n ) = Σ a = - M M [ p ( a ) × δ B k ( a ) , 0 × Π j = k + 1 K - 1 δ B j ( a ) , B j ( n ) ] Σ a = - M M [ p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) , B j ( n ) ]
为k<K-1计算条件概率的一个例子再次在图10中示出,其中已经确定平面P2(MSB)的所有上下文都为0。对于平面P1来说,可计算出两个可能的0或1上下文,而对于平面P0(LSB)来说,可计算出四个可能的上下文{00,01,10,11},并且对于平面P0来说,上下文为“00”的整数是0和1。于是,具有该“00”上下文(图10中虚线)的概率可由下式给出:
pM(c0=00)=p(ai=0)+p(ai=1)
在上下文为“00”的情况下,平面P0中的位具有二进制数值0的唯一整数是整数0。因此,平面P0存在着点等于0的概率,在已知上下文为“00”的条件下,可以由下式给出:
p M ( b 0 = 0 | c 0 = 00 ) = p ( a i = 0 ) p ( a i = 0 ) + p ( a i = 1 )
相反地,平面P0中存在点等于1的概率,在已知上下文为“00”的条件下,可由下式给出:
p M ( b 0 = 1 | c 0 = 00 ) = 1 - p M ( b 0 = 0 | c 0 = 00 ) = 1 - p ( a i = 0 ) p ( a i = 0 ) + p ( a i = 1 )
可看出,为最后的平面(包括具有2K个可能上下文的LSB平面)的概率表的计算是冗长的,这是因为要考虑的上下文数量呈指数增长。现在我们将描述第三实施例,对应于使用基于模型的位平面基于上下文的算术编码,并采用k<K-1的条件概率计算,特别是在使用数量有限的可能上下文的情况下(这里是指两个可能上下文)。这是对应于条件概率并利用上下文的上述示例的变体,其中,从MSB平面至LSB平面每遇到一个新平面上下文的数量并没有增加2倍,反而与单个位(0或1)关联的上下文的最大数量是固定的。
在描述的实例中,最大数量为2并且其解释如下:
-以0表示的上下文是指在较高平面且位于相同列中所编码的位都等于0,并且因此该列的MDCT量化系数这时已不再是有效的,以及
-以1表示的上下文是指在较高平面且位于相同列中的至少一个已编码位等于1,这意味着该列的当前系数是有效的。
图14所示的流程图示出了包括为平面Pk的每个位确定上下文的位平面编码的原理,这里将可能上下文的数量限制为2(“0”或“1”在步骤1406中)。与图8和图13相同的元素使用相同的标记来表示,并且在这里不再赘述。仅仅修改了步骤1406、1407和1408,因此这时上下文仅有的可能数值为0或1,这同样也会影响编码的实施(步骤1408)。
下面是计算k<K-1条件概率的实例,在图14中的步骤1406中通过两个可能的上下文数值来实施。参考图10,再次使用两个可能上下文为0和1的这一实例。在平面P1中,上下文为“0”的位(对应于具有数值0的位于当前平面之前的所有平面,因此对应MSP平面的P2)是整数ai=0,1,2,3的这些位。因此,具有等于0的上下文的概率由下式给出:
pM(c1=0)=p(ai=0)+p(ai=1)+p(ai=2)+p(ai=3).
在平面P0(LSB)中,上下文为“0”的位(是指平面P1和P2)是整数ai=0和1的这些位。因此,具有等于0的上下文的概率是:
pM(c0=0)=p(ai=0)+p(ai=1)。
具有等于0的上下文的概率的计算如下(图14中步骤1406)。
为平面Pk定义上下文(式中k<K-1且MSB平面除外):
于是,平面Pk中a的第k个上下文等于0的概率由下述形式的递推关系给出(步骤1406):
p ( C k ( a ) = 0 ) = p ( B k + 1 ( a ) = 0 ) × p ( C k + 1 ( a ) = 0 ) =
Π j = k + 1 K - 1 p ( B j ( a ) = 0 ) = p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) , 0
为k<K-1计算具有0值的条件概率,包括可能上下文(图14中步骤1407)的两种选择在等级为Pk的平面的编码过程中通过利用上下文的知识(在平面的第k+1列至第K-1列中等于1的某位的出现)来实施。于是,k<K-1时的条件概率(步骤1407)的定义如下:
p M ( b k = 0 | c k = 0 ) = p M ( b k = 0 , c k = 0 ) p M ( c k = 0 )
式中ck是代表与平面Pk中任一位bk相关的上下文的随机变量。
概率pM(ck=0),对于k<K-1,由下述关系式给出:
p M ( c k = 0 ) = 1 Σ a i = - M M p ( a ) × Σ a i = - M M p ( C k ( a ) = 0 )
= 1 Σ a = - M M p ( a ) × Σ a = - M M [ Π j = k + 1 K - 1 p ( B j ( a ) = 0 ) ] = 1 Σ a = - M M p ( a ) × Σ a = - M M [ p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) , 0 ]
至于概率p(bk=0,ck=0),对于k<K-1,由下述关系式定义:
p M ( b k = 0 , c k = 0 ) = 1 Σ a = - M M p ( a ) × Σ a i = - M M [ p ( B k ( a ) = 0 ) × p ( C k ( a ) = 0 ) ]
= 1 Σ a = - M M p ( a ) × Σ a = - M M [ p ( a ) × Π j = k K - 1 δ B j ( a ) , 0 ]
因此,对于k<K-1时的条件概率由下式定义:
p M ( b k = 0 | c k = 0 ) = Σ a = - M M [ p ( a ) × Π j = k K - 1 δ B j ( a ) , 0 ] Σ a = - M M [ p ( a ) × Π j = k + 1 K - 1 δ B j ( a ) , 0 ]
还能够以相似方式计算出pM(bk=0|ck=1)。
本发明根据上述三个实施例中的任一实施例,因此形成了一种位平面编码的有效技术并使得此类编码相对于现有技术更加灵活。实际上,这使得不再存储预先计算的概率表(上下文)成为可能。因此,仅简单基于待编码/解码信号的动态计算就已足够。
本发明还涉及用于执行本发明方法的编码器,例如图5所示的示例性编码器并在上文进行了描述,并且还包括用于估算待编码的信号分布的模块505,其为模块507提供数据以计算符号数值的概率。它还涉及执行本发明方法的解码器,例如图6所示的示例性解码器并在上文进行了描述,并且还包括用于基于信号分布的估算来计算符号数值的概率的模块603。具体地说,为模块603提供至少一个参数(例如,形状因数α),该参数描述了编码前信号的概率密度模型,由解码器接收这种编码形式的参数α,并随后进行解码(图6中用表示)。
本发明还涉及旨在存储于这类编码器或解码器的存储器中的计算机程序。当编码器或解码器中的处理器执行该程序时,该程序包括用于执行本发明方法的指令。例如,图8、9、13或14中的流程图可代表该计算机程序不同版本各自的算法。
当然,本发明并不限制于本文所述的实施例,它可扩展至其它的变体。
例如,在实践中,算术编码器并不直接使用符号概率来工作,而是使用符号的整体频率。上面描述的本发明可方便地应用于频率的使用,因为频率对应于乘以一些观测事件的概率。可再次参见Witten等人的文献以获取关于此观点的更多细节。因此,足以将上述估算的概率转变为频率。
更一般地说,上文描述了其数值为位数值“0”或“1”的符号平面。然而,本发明可扩展至对于符号平面编码/解码的应用(具有多于2个的符号,例如三个符号“0”、“+1”、“-1”)。Witten等人的参考文献(表I和图1b)描述了如何管理与多于两个符号相关的概率。因此,本发明允许基于源(待编码/解码的信号)模型对至少一个符号平面中的符号概率进行估算(优选为最有效的符号平面)。
本发明的原理还可应用于堆栈运行编码的这种情况,其中堆栈和运行的四个符号(0,1,+,-)的概率根据待编码信号的分布模型进行计算(如上面给出的Oger等人的参考文献中所述),例如根据广义高斯模型。在这种情况下,可基于与该模型关联的参数α的值来初始化符号0,1,+和一的概率。
同样,正如上文所讨论的那样,本发明允许对基于上下文的算术编码的上下文进行优化。除了本发明意义中的编码可为基于上下文的算术编码这一事实外,也可对其进行改变(例如是位速率、源、或同一平面中位所采用的值的函数),例如上文引用的Langdon等人的参考文献中所述。
更一般地说,本发明应用于基于符号平面编码中符号概率的任意类型的编码(霍夫曼或其他编码)。因此,本发明可更普遍地应用于除算术编码外的其它类型的熵编码。
上述广义高斯模型和传输形状参数的情况仅为实施方式的一个实例。也可采用除广义高斯模型外的其它模型。例如,概率固定的(具体为拉普拉斯模型)或参数的(Alpha-stable、混合高斯、或其他模型)的模型也可考虑用于为源建模。
更一般地说,可以不为信号分布建模,而仅基于原始信号分布(未建模)来计算编码中的概率表。还可编码这些概率表并将其发送至解码器使得解码器不必重新计算这些概率表(可省略图6中的模块603并接收概率表而不是形状因数α)。既便如此,还是优选为信号分布建模并仅为解码器发送少量描述此模型的参数(特别是形状因数α),如上文所述,以便限制编码比特流中的数据量。

Claims (10)

1.一种用于处理信号的方法,用于对该信号进行符号平面压缩编码/解码,其中为至少一个符号平面确定符号数值的概率,根据对该信号分布的估算动态计算所述概率;
其中,在所述编码之前对所述信号进行量化,在量化之前对待编码的信号进行信号分布的估算。
2.根据权利要求1所述方法,其特征在于,所述信号分布的估算包括对信号分布(H)建模,用于推导表示该信号概率密度(pdf)的模型(Mod)的至少一个参数(α)。
3.根据权利要求2所述方法,其特征在于,所述建模在编码中进行,并传输所述参数(α)用以解码,以及在编码和解码(603)中,所述概率作为所述参数(α)的函数来计算。
4.根据权利要求2或3所述方法,其特征在于,所述模型为广义高斯模型,所述参数为形状因数(α)。
5.根据权利要求1所述方法,其特征在于,所述信号包括序列数值,各个数值(ai)在各自的多个符号平面(Pk)中可分解为多个符号数值,以及为至少一个符号平面计算所述概率且各自表明所述符号平面具有等于给定符号的符号数值的概率,至少为表示最有效符号数值的符号平面计算所述概率。
6.根据权利要求5所述方法,其特征在于,另外还为其它符号平面计算所述概率,并考虑从表示较高有效符号数值的符号平面Pk+1,Pk+2,…,PK-1所获取的符号数值来定义上下文(C)。
7.根据权利要求6所述方法,其特征在于,对所述序列数值中的数值(ai)的相同位置(i),从符号平面Pk+1,Pk+2,…,PK-1中获取的各个符号数值为当前符号平面以及位置(i)定义上下文数值(C),从平面Pk+1,Pk+2,…,PK-1中获取的各个符号数值表示比当前符号平面中的符号数值更加重要的数值,以及,
在考虑当前符号平面所述上下文(C)的多个可能数值的同时,为当前符号平面计算所述概率。
8.根据权利要求7所述方法,其特征在于,选择有限数量的所述上下文(C)的可能数值。
9.根据权利要求8所述方法,其特征在于,每个符号平面的可能上下文的数值限制为下述两个上下文数值:
-第一上下文数值,表示在标记为较高有效符号数值的符号平面Pk+1,Pk+2,…,PK-1中出现至少一个有效符号数值,
-第二上下文数值,表示在标记为较高有效符号数值的符号平面Pk+1,Pk+2,…,PK-1中未出现任何有效符号数值。
10.一种用于处理信号的装置,用于对该信号进行符号平面压缩编码/解码,该装置包括:
-为至少一个符号平面确定符号数值的概率的装置,
-根据对该信号分布的估算动态计算所述概率的装置;
其中,在所述编码之前对所述信号进行量化,在量化之前对待编码的信号进行信号分布的估算。
CN2008801135935A 2007-08-24 2008-07-25 基于概率表动态计算的符号平面编码/解码 Expired - Fee Related CN101842988B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0706001 2007-08-24
FR0706001 2007-08-24
PCT/FR2008/051412 WO2009027606A1 (fr) 2007-08-24 2008-07-25 Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites

Publications (2)

Publication Number Publication Date
CN101842988A CN101842988A (zh) 2010-09-22
CN101842988B true CN101842988B (zh) 2013-08-14

Family

ID=38920619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801135935A Expired - Fee Related CN101842988B (zh) 2007-08-24 2008-07-25 基于概率表动态计算的符号平面编码/解码

Country Status (5)

Country Link
US (1) US20110116542A1 (zh)
EP (1) EP2183851A1 (zh)
JP (1) JP4981174B2 (zh)
CN (1) CN101842988B (zh)
WO (1) WO2009027606A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245529B2 (en) * 2009-06-18 2016-01-26 Texas Instruments Incorporated Adaptive encoding of a digital signal with one or more missing values
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
US7978101B2 (en) * 2009-10-28 2011-07-12 Motorola Mobility, Inc. Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
BR122021008583B1 (pt) * 2010-01-12 2022-03-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
EP2734942A4 (en) * 2011-08-23 2014-06-04 Huawei Tech Co Ltd ESTIMATOR FOR ESTIMATING PROBABILITY DISTRIBUTION OF A QUANTIFICATION INDEX
DK3481068T3 (da) 2012-04-13 2020-11-16 Ge Video Compression Llc Billedkodning med lav forsinkelse
KR102162119B1 (ko) 2012-06-29 2020-10-06 지이 비디오 컴프레션, 엘엘씨 비디오 데이터 스트림 개념
FR3005816B1 (fr) * 2013-05-17 2019-11-29 Jean-Claude Colin Procede pour encoder, notamment des images compressees, notamment par "range coder" ou compression arithmetique.
EP3252758B1 (en) * 2015-01-30 2020-03-18 Nippon Telegraph and Telephone Corporation Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
CN106157960A (zh) * 2015-04-14 2016-11-23 杜比实验室特许公司 音频内容的自适应算术编解码
GB2559200A (en) 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
KR20210018254A (ko) * 2018-06-06 2021-02-17 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치, 및 삼차원 데이터 복호 장치
CN112398484B (zh) * 2019-08-15 2024-04-23 华为技术有限公司 一种编码方法及相关设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1681213A (zh) * 2004-03-10 2005-10-12 三星电子株式会社 无损音频编码/解码方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3684128B2 (ja) * 2000-02-18 2005-08-17 キヤノン株式会社 算術符号化/復号化方法ならびに算術符号化/復号化装置
JP4254017B2 (ja) * 2000-03-10 2009-04-15 ソニー株式会社 画像符号化装置及び方法
JP4039609B2 (ja) * 2002-03-18 2008-01-30 株式会社Kddi研究所 画像符号化装置およびこれを利用した動画像符号化装置
WO2004042933A1 (en) * 2002-10-24 2004-05-21 Agency For Science, Technology And Research A method and a device for processing bit symbols generated by a data source; a computer readable medium; a computer program element
JP4195978B2 (ja) * 2003-02-10 2008-12-17 パナソニック株式会社 映像信号符号化装置及び方法及び記録媒体
EP1836858A1 (en) * 2005-01-14 2007-09-26 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1681213A (zh) * 2004-03-10 2005-10-12 三星电子株式会社 无损音频编码/解码方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Marie Oger等.TRANSFORM AUDIO CODING WITH ARITHMETIC-CODED SCALAR QUANTIZATION AND MODEL-BASED BIT ALLOCATION.《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2007.》.2007,第545至548页. *
R.Yu等.IMPROVING CODING EFFICIENCY FOR MPEG-4 AUDIO SCALABLE LOSSLESS CODING.《ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2005.》.2005,第169至172页. *

Also Published As

Publication number Publication date
US20110116542A1 (en) 2011-05-19
JP4981174B2 (ja) 2012-07-18
WO2009027606A1 (fr) 2009-03-05
CN101842988A (zh) 2010-09-22
JP2010537533A (ja) 2010-12-02
EP2183851A1 (fr) 2010-05-12

Similar Documents

Publication Publication Date Title
CN101842988B (zh) 基于概率表动态计算的符号平面编码/解码
JP4963498B2 (ja) 非典型的な部分系列に関する部分情報を用いた音声及びオーディオ符号化パラメータの量子化
CN101779377B (zh) 编码源信号/解码数据分组序列的设备和方法
US7889103B2 (en) Method and apparatus for low complexity combinatorial coding of signals
CN103119646B (zh) 音频编码器、音频解码器、编码音频信息的方法以及解码音频信息的方法
CN102119414B (zh) 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法
US7978101B2 (en) Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
US8149144B2 (en) Hybrid arithmetic-combinatorial encoder
US20100088090A1 (en) Arithmetic encoding for celp speech encoders
US11848021B2 (en) Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
CN102341844B (zh) 编码方法、解码方法、编码装置、解码装置
CN103067022A (zh) 一种整型数据无损压缩方法、解压缩方法及装置
Shirazinia et al. Analysis-by-synthesis quantization for compressed sensing measurements
CN102158692B (zh) 编码方法、解码方法、编码器和解码器
CN107004422A (zh) 编码装置、解码装置、它们的方法及程序
CN101406064A (zh) 量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备
CN102084594A (zh) 用于处理数字数据的方法
US8593321B2 (en) Computation apparatus and method, quantization apparatus and method, and program
WO2005027096A1 (en) Method and apparatus for encoding audio
US20080040107A1 (en) Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns
CN100414606C (zh) 用于从pcm信号中减去量化噪声的方法和单元
Amin et al. Vector quantization based lossy image compression using wavelets–a review
CN101073272A (zh) 减小量化噪音的方法
CN110771045A (zh) 编码装置、解码装置、编码方法、解码方法、以及程序
CN114913863B (zh) 数字音信数据编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130814

Termination date: 20170725

CF01 Termination of patent right due to non-payment of annual fee