CN103503320B - 用于重构源信号的方法和解码器 - Google Patents

用于重构源信号的方法和解码器 Download PDF

Info

Publication number
CN103503320B
CN103503320B CN201180003043.XA CN201180003043A CN103503320B CN 103503320 B CN103503320 B CN 103503320B CN 201180003043 A CN201180003043 A CN 201180003043A CN 103503320 B CN103503320 B CN 103503320B
Authority
CN
China
Prior art keywords
probability density
statistical moment
signal
reconstructed signal
statistical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180003043.XA
Other languages
English (en)
Other versions
CN103503320A (zh
Inventor
亚努什·克雷萨
张国强
李旻岳
W·巴斯蒂安·柯雷金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103503320A publication Critical patent/CN103503320A/zh
Application granted granted Critical
Publication of CN103503320B publication Critical patent/CN103503320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/29Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes combining two or more codes or code structures, e.g. product codes, generalised product codes, concatenated codes, inner and outer codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/02Transmitters
    • H04B1/04Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于重构通过一组至少两个描述编码(101)的源信号的方法,所述源信号具有第一概率密度,其中所述第一概率密度包含第一统计矩和第二统计矩,所述方法包含:接收(103)所述组描述的子集;基于所述描述子集以一组操作比特率中的某一操作比特率重构(105)经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及处理(107)所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩。

Description

用于重构源信号的方法和解码器
技术领域
本发明涉及数字信号处理的领域,尤其是涉及多描述编码(MDC)。
背景技术
对于现代数据通信,可部署多种实现无线网络或固话网络的网络技术。此类网络可能在一些情况下为不可靠的,以至于在传输期间丢失数据或信息。对于多媒体内容,在传输期间发生此类信息丢失的情况时适度的质量降级尚可接受。为此,多描述编码(MDC)旨在通过产生对单个信号源的多个可相互完善的描述来实现可接受的质量降级。这些描述通常彼此独立地从编码器传输到解码器。所述描述具有基本上所述描述的任何子集均可实现重构源信号的特性。具体地说,解码器可得到的描述越多,重构就能越好。因而,MDC依据不可靠的通信网络的传输信道的状态来促进形成多个质量级别。
在常规的MDC解码器中,可基于任何可能的描述子集来重构源信号。对源信号进行估计可基于对均方误差(MSE)的最小化。然而,重构质量取决于传输描述的比特率,其中重构质量随比特率增加而增加。只有在低失真下或等效地在高比特率下才可基于感知激发MSE的使用。因此,对于较低比特率,使用MSE所获得的经重构信号的感知质量可能是不足的。
此外,信号源的统计属性可能在使用基于均方误差的方案来重构之后发生丢失或改变。这将对重构信号的质量产生进一步的负面影响。
发明内容
本发明的目的是提供一种改进的用于重构通过多个描述编码的源信号的方案。
此目的通过独立权利要求项的特征来实现。可从附属权利要求项、描述内容和图式中容易了解另外的实施方案。
本发明是基于以下发现:源信号可用一组描述来编码,所述组描述是例如经由通信网络来传输的。所述描述可用编码源信号的MDC编码器来产生,所述源信号包含第一概率密度,所述第一概率密度部分或者全部为解码器侧所知,或者为部分或全部在解码侧进行估计的。所述组描述的子集可在解码器处用以重构经重构信号,所述经重构信号包含第二概率密度。通过处理所述经重构信号,获得经处理的经重构信号,其包含第三概率密度。通过在统计上处理所述经重构信号,可修正所述第三概率密度以使得所述第三概率密度等于或类似于源信号的第一概率密度。选择所述处理以使得不管所述重构期间的操作比特率如何,均分别维持或实现第三概率密度与第一概率密度之间的最小相似性。因此,所述经处理的经重构信号的统计属性(尤其是第三概率密度与第一概率密度的相似性)能在所有操作比特率(尤其低操作比特率)下改善处理后的经过重构的信号的质量。
根据第一方面,本发明涉及一种用于重构经过一组至少两个描述编码的源信号的方法,所述源信号具有第一概率密度,其中所述第一概率密度包含第一统计矩和第二统计矩,所述方法包含:接收所述组描述的子集;基于所述描述子集以一组操作比特率中的某一操作比特率重构出经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及处理所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩,其中处理所述经重构信号以使得至少所述第三概率密度的所述第一统计矩和所述第二统计矩比所述第二概率密度的所述第一统计矩和所述第二统计矩更类似于所述源信号的所述第一统计矩和所述第二统计矩,且其中进一步处理所述经重构信号以使得不管所述操作比特率如何,均维持所述第三概率密度的所述第一统计矩与所述第一概率密度的所述第一统计矩之间以及所述第三概率密度的所述第二统计矩与所述第一概率密度的所述第二统计矩之间的预定最小相似性。
操作比特率可为分布在所述描述间的总比特率,例如编码或解码过程中所使用的量化器可获得的比特率。比特率可在描述之间任意地分布。根据第一方面的一些实施方案,所述描述间的比特率分派为对称的,使得所有描述经分派有相同比特率。然而,每一描述可与不同比特率相关联,使得总可用比特率分布在所述描述间。
术语“量化器”表示从待量化的信号值(例如,样本)(其可从连续集合中推测地获取)到量化指数(其从离散指数集合中获取)的映射。相应地,术语“解量化器”表示从自离散指数集合获取的量化指数或从自离散指数集合获取的指数子集到重构值的映射。
各种概率密度的第一统计矩为与所述概率密度相关的均值。各种概率密度的第二统计矩可为与所述概率密度的方差。统计矩之间的相似性可定义为相应统计矩之间的绝对差值,例如概率密度的均值之间或概率密度的方差之间的绝对差值。根据第一方面的一些实施方案,所述相似性可定义为标准化绝对差值,其可为相对于第一概率密度的相应矩来进行标准化的统计矩的绝对差值。
关于预定的最小相似性值可定义为百分比值或dB值。根据一些实施方案,50%或3dB的偏离是可接受的,并可作为预定的最小相似性。此外,针对第一统计矩和第二统计矩的预定的最小相似性可以不同。明确地说,第一统计矩的相似性的重要性可认为是比第二统计矩的的重要性高。因此,针对第一统计矩比针对第二统计矩可能需要较小的差值。因此,可针对第一统计矩的预定最小相似性设置甚至等于零的差值。
根据第一方面的一些实施方案,当与基于均方误差方案的常规MDC解码器相比时,针对所有操作比特率的源信号的重构得以改进。因此,所述实施方案产生服从经重构信号的分布类似于源分布的约束条件理想的MSE性能。这促使重构的感知质量的提高。针对较低操作比特率也维持经改进的质量,这在仅使用均方误差的常规MDC解码方法中是不可能的。
根据第一方面的第一实施方案,本发明涉及一种用于重构源信号的方法,其中处理第二概率密度的第一统计矩和第二统计矩以将第一概率密度的第一统计矩和第二统计矩保留在预定矩范围内。因此,执行所述处理以使得第一概率密度的第一统计矩和第二统计矩至少部分保留在已知的预定范围内的所述经处理的经重构信号中。根据一些实施方案,借助于近似变换函数来执行所述处理,所述近似变换函数可用较少计算工作量来完成。然而,根据一些实施方案,可选择矩范围以使得第一概率密度的统计矩在经处理的经重构信号的第三概率密度内获得。
根据第一方面的第二实施方案,本发明涉及一种用于重构源信号的方法,其中第一概率密度与第三概率密度的第一统计矩为相等的,且其中第一概率密度与第三概率密度的第二统计矩为相等的。
根据第一方面的第三实施方案,本发明涉及一种用于重构源信号的方法,其中使用取决于描述子集中的描述成分的重构函数来重构出所述经重构信号。因此,如果接收到所述组描述中的所有描述,使得所述描述子集等于所述(整个)组描述,那么可基于所述整组描述来执行重构。举例来说,所述描述为指数或指针,其清楚地指向待在重构信号中使用的重构值。然而,如果未接收到所述组描述中的至少一个描述,那么将使用不同的重构函数。特别之处在于所述描述为可相互精化的。
根据第一方面的第四实施方案,本发明涉及一种用于重构源信号的方法,其中所述源信号包含附加抖动信号,尤其是伪随机抖动信号,且其中所述重构包含从所述经重构信号减去所述抖动信号。此类抖动信号可以在编码期间被相加到源信号,以帮助获取分布保留变换。在重构出所述经重构信号之后,可接着减去所述抖动信号以便获得所述经重构信号。相加和相减操作可根据各种实施方案来替换。
根据第五实施方案,本发明涉及一种用于重构源信号的方法,其中所述重构包含使用指数分配方案,其通过所述组描述中的所述描述寻址,所述指数分配方案用于获取编码所述源信号的所述组描述。举例来说,所述指数分配方案可借助于二维或二维以上的指数分配矩阵来表示,其中所述指数分配矩阵由含有唯一的称作的中心指数的非空条目和空条目构成。在编码期间,确定指向唯一值的指数并将该指数选作源信号的编码值的描述。因此,在重构期间,所接收的描述可分别指向指数分配方案或矩阵内的一个值(如果接收到所有描述的话)或一组值(如果丢失一个或一个以上描述)。如果丢失一个或一个以上描述,那么可选择与所述组值相关联的重构值,例如用于所述组值的最可能值。
根据第一方面的第六实施方案,本发明涉及一种用于重构源信号的方法,其中处理所述经重构信号包含根据统计变换函数来变换所述经重构信号,所述变换函数取决于所述描述子集中的描述成分。因此,根据对接收到所述组描述中的哪些描述以及哪些描述可能丢失的认知来确定所述变换函数。
根据一些实施方案,根据以下公式定义变换函数T(x):
T ( x ) = F X - 1 { 1 Δ ∫ - Δ 2 Δ 2 F X ( x - τ ) d τ } ,
其中Δ为量化器步长,FX(x)为与所述第一概率密度的概率密度函数fX(·)相关的变量X的累积分布函数,为
F X ( x ) = ∫ - ∞ x f X ( τ ) d τ ,
表示逆累积分布函数。
可在解码过程中事先知道所述概率密度函数。如果接收到所有(例如,两个)描述且应完全或几乎完全保留第一概率分布,那么可使用以上变换函数T(x)。
根据一些实施方案,可根据以下公式定义统计变换函数T(x):
T ( x ) = σ X 2 σ X 2 + Δ 2 12 x ,
其中Δ为量化器步长,为与所述第一概率密度的概率密度函数fX(·)相关的变量X的方差。
如果接收到所有(例如,两个)描述且第一概率分布应近似保留在第三概率分布内,那么可使用此变换函数T(x)。确切地,第三概率分布的第一和第二统计矩经保留为等于或近似等于第一概率密度的第一和第二统计矩。
根据一些实施方案,可根据以下公式定义所述变换函数T(x):
T ( x ) = F X - 1 { 1 2 M Δ Σ i ∈ P ( M ) ∫ Δ l ( i ) Δ r ( i ) F X ( x - τ ) d τ } ,
其中Δ为量化器步长,M为指数分配参数,FX(x)为与所述第一概率密度的概率密度函数fX(·)相关的变量X的累积分布函数,为
F X ( x ) = ∫ - ∞ x f X ( τ ) d τ ,
表示逆累积分布函数,P(M)为表示用于导出编码所述源信号的所述组描述的指数分配方案的指数分配图案的一组指数,
Δ l ( i ) = - ( i - P ‾ ) Δ - Δ 2 Δ r ( i ) = - ( i - P ‾ ) Δ + Δ 2 , 其中 P ‾ = 1 2 M Σ i ∈ P ( M ) i .
如果接收到一个描述,那么可使用以上变换函数T(x)来变换所述经重构信号,使得经处理的经重构信号具有第三概率密度,所述第三概率密度等于或近似等于所述第一概率密度。
根据一些实施方案,可根据以下公式定义所述变换函数T(x):
T ( x ) = σ X 2 σ X 2 + Δ 2 M 4 3 x ,
其中Δ为量化器步长,M为指数分配参数,且为与所述第一概率密度的概率密度函数fX(·)相关的变量X的方差。
如果仅接收到一些(例如,一个)描述,且第一概率分布应借助较少计算工作量来近似,那么可使用以上变换函数T(x)。明确地说,第一概率密度的第一和第二统计矩可通过此公式来保留。
可组合上述变换函数的使用,其中相应的使用取决于所接收到的描述子集的成分以及针对经处理的经重构信号的第三概率密度保留或近似第一概率密度的所要等级。
根据第二方面,本发明涉及一种用于重构经过一组至少两个描述编码的源信号的解码器,所述源信号具有第一概率密度,其中所述第一概率密度包含第一统计矩和第二统计矩。所述解码器包含:入口,其用于接收所述组描述的子集;重构器,其用于基于所述描述子集以一组操作比特率中的某一操作比特率重构经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及变换器,其用于处理所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩,其中所述变换器经配置以处理所述经重构信号以使得至少所述第三概率密度的所述第一统计矩和所述第二统计矩比所述第二概率密度的所述第一统计矩和所述第二统计矩更类似于所述源信号的所述第一统计矩和所述第二统计矩,且其中所述变换器进一步经配置以处理所述经重构信号以使得不管所述操作比特率如何,所述第三概率密度的所述第一统计矩与所述第一概率密度的所述第一统计矩之间以及所述第三概率密度的所述第二统计矩与所述第一概率密度的所述第二统计矩之间的预定最小相似性均得以维持。
根据第二方面的第一实施方案,本发明涉及一种解码器,其中所述变换器经配置以处理第二概率密度的第一统计矩和第二统计矩以将第一概率密度的第一统计矩和第二统计矩保留在预定矩范围内。因此,所述变换器可经配置以使得可获得所述预定矩范围。
根据第二方面的第二实施方案,本发明涉及一种解码器,其中所述重构器包含中心重构路径,其经配置以基于指数信息尤其是唯一指数信息来重构所述经重构信号,所述中心重构路径包含经配置以基于所述组描述来确定所述指数信息的索引器。
所述组描述中的描述可例如用以产生一个或一个以上指数值,其形成指数信息。所述指数信息可指向如上所述的指数分配方案中的唯一值。确切地,如果接收到所有描述以使得描述子集等于所述组描述,那么中心重构路径可为有效的。
根据第二方面的第三实施方案,本发明涉及一种解码器,其中所述重构器包含至少一个侧重构路径,其经配置后以基于映射信息来重构所述经重构信号,所述至少一个侧重构路径包含经配置以基于所述子集的所述描述和所述子集中的描述成分来确定所述映射信息的映射器。
确切地,如果丢失一个或一个以上描述,以至于无法直接确定唯一值,那么针对已知的描述子集激活或使用一个侧重构路径。然而,剩余的所接收描述用以确定映射信息,所述映射信息为用于重构所述经重构信号的基础。举例来说,所述描述子集的成分可确定如何从映射信息导出经重构信号。
根据第二方面的第四实施方案,本发明涉及一种解码器,其中所述变换器经配置以基于所述描述子集中的描述成分来执行所述处理。因此,可针对接收到整组描述或描述子集来执行不同处理。可在变换器中使用各种变换函数,其取决于子集的成分和分布保留的等级。所述变换器的各种实施例相对于关于统计变换函数的对第一方面的第六实施方案的解释而变得显而易见。
附图说明
将参看以下图式来描述本发明的另外实施例,其中:
图1展示根据一个实施方案的方法的流程图;
图2展示根据一个实施方案的MDC系统的框图;
图3展示根据一个实施方案的MDC系统的框图;
图4展示根据一个实施方案的指数分配方案;
图5a展示根据一个实施方案的针对丢失一个描述的情况的侧重构的实例;
图5b展示将侧量化单元分割为中心量化单元;以及
图6展示根据一个实施方案的音频编码器。
具体实施方式
图1展示根据一个实施方案的用于重构源信号的方法的流程图。作为前提,在步骤101中,例如由MDC编码器通过一组至少两个描述来对源信号进行编码。源信号具有第一概率密度,其包含第一统计矩和第二统计矩。经由通信网络来传输所述组描述,所述通信网络可能是不可靠的,因为可能在传输期间丢失所有或某些描述,从而导致解码器仅可得到所述描述的子集的情形。
在步骤103中,接收所述组描述的子集。所述子集可等于所述组描述,使得接收到用于对源信号进行编码的所有描述。然而,因为通信网络可能为不可靠的,所以子集可包含比整组描述少的描述。
在步骤105中,基于已在步骤103中接收到的描述子集,以一组操作比特率中的某一操作比特率来对经重构信号进行重构。所述经重构信号具有第二概率密度,其包含第一统计矩和第二统计矩。重构质量可取决于所接收的描述子集中的描述成分。一般来说,可以假设,接收到的描述越多,经重构信号的质量就越好。
在步骤107中,处理经重构信号以便维持经处理的经重构信号具有第三概率密度,所述第三概率密度包含第一统计矩和第二统计矩。处理经重构信号以使得至少第三概率密度的第一统计矩和第二统计矩比第二概率密度的第一统计矩和第二统计矩更类似于源信号的第一统计矩和第二统计矩。此外,处理经重构信号以使得不管操作比特率如何,均维持第三概率密度的第一统计矩与第一概率密度的第一统计矩之间以及第三概率密度的第二统计矩与第一概率密度的第二统计矩之间的预定最小相似性。
将使用示范性MDC编码和解码方案来更详细地解释以上方法步骤,所述MDC编码和解码方案尤其使用双描述编码/解码。
然而,应注意,可通过一组两个以上描述来对源信号进行编码。在此情况下,对于每一描述子集,使用位于解码器处的侧解量化器。解码器可进一步包含中心量化器。
所述方案对根据某个已知概率密度函数(p.d.f.)分布的标量随机变量进行操作。在一般情况下,经量化信号具有非零均值μ。在不影响所述方案的通用性的情况下,可在编码之前减去所述均值μ。在减去均值之后,获得由根据某个已知概率密度函数分布的随机变量X表示的零均值信号,编码器和解码器可知道p.d.f.fX。确切地,可将关于fX的信息传输到解码器或解码器可使用fX的近似值。
将通过多描述量化来对变量X进行量化。根据某个情形,由随机变量X表示的信号的样本为独立的。在所考虑的实例中,对每个样本执行编码。
第一运算包含将伪随机抖动Z的样本相加到输入样本X,接着借助于具有步长Δ的均匀标量量化器对此运算的结果进行量化。所述量化产生量化指数IC。所述量化可方便地借助于舍入来实施。设[.]表示舍入运算。因此,
IC=[(X+Z)/Δ]。 (1)
编码器和解码器可用相同方式进行配置,例如,其均以中心量化器的相同步长Δ进行操作,且其使用完全相同的指数分配配置。确切地,可在预先定义Δ和M或将其传输到解码器时实现此条件。
抖动信号Z的随机性可在编码器与解码器之间共享,例如,抖动信号Z为伪随机的。确切地,抖动Z可通过随机数产生来产生,所述随机数产生便于产生均匀分布在预定义支持区内的随机信号。确切地,抖动信号Z可均匀地分布在区间(0,2MΔ)内。如果使用伪随机抖动,那么必须维持编码器与解码器之间的同步性,例如,基于固定时间而复位随机数产生的状态时实现编码器与解码器之间的同步。
指数IC为所谓的中心指数。可借助于所谓的指数分配算法IA将中心指数IC映射到一对称作侧指数I0和I1上。可进一步借助于熵编码器(例如,算术编码器)对所述指数I0和I1进行编码以产生可变长度二进制码。
独立地通过不可靠的网络传输指数I0和I1。此时,将其称为描述。可通过将与第一描述相关联的比特流嵌入到一个包中且将与第二描述相关联的比特流嵌入到另一包中来实现独立传输。可能在传输期间丢失一些或所有描述。解码器的操作取决于所接收的描述的数目和/或成分。一般观念是,使用所有所接收的描述来执行信号重构。接收到的描述越多,重构的质量就越好。描述丢失的可能情况如下:
情况1:假设接收到两个描述I0和I1
在此情况下,由于解码器知道指数分配(IA),所以其能够唯一地确定对应于所述特定对I0和I1的中心量化器IC的量化指数。由于知道中心量化器指数IC,所以中心量化器Q-1的解码器可用以执行重构。根据以下公式来实施此操作。
XC=IC·Δ。 (2)
在下一步骤中,根据以下公式从XC减去伪随机抖动Z
X ~ C = X C - Z . - - - ( 3 )
假设解码器能够使用可能的Z,因为Z为伪随机的。
可精确地或至少近似精确地知道的统计分布p.d.f.。举例来说,根据一些实施方案,可分布为其中*表示卷积运算符。因此,可导出对进行操作且将变换为根据与X相同的p.d.f.精确地分布的新变量的解析变换。所述变换可具有以下形式:
T ( x ) = F X - 1 { 1 Δ ∫ - Δ 2 Δ 2 F X ( x - τ ) d τ } , - - - ( 4 )
其中FX(x)为与p.d.f.fX(·)相关的变量X的累积分布函数(c.d.f.),作为
F X ( x ) = ∫ - ∞ x f X ( τ ) d τ , - - - ( 5 )
表示逆c.d.f.。假设因此,根据以下公式计算新变量
X ^ C = T ( X ~ C ) . - - - ( 6 )
最后一个解码级可包含加回均值μ,从而产生最终重构。
在一些实施方案中,将分布保留约束条件放松到一近似地保留分布的情形具有实用意义。这可看作对主要算法的低复杂性替代方案。在近似地保留分布的情况下,变换可具有以下形式:
T ( x ) = σ X 2 σ X 2 + Δ 2 12 x , - - - ( 7 )
其中 σ X 2 = ∫ - ∞ ∞ x 2 f X ( x ) d x 为X的方差。
情况2:假设接收到一个描述。
如果接收到一个描述,那么使用与成功接收到的描述相关联的侧解量化器。假定一个描述已丢失且只有指数Ij可供一个解码器得到(j=0或1)。指数Ij与由表示的第j个侧量化器的某重构点唯一地相关联,例如借助于一对一映射。可预先计算侧量化器的重构点,且Ij的映射可借助于查找表来实施。稍后将结合图4和图5a来解释关于重构点是什么且其如何与指数分配相关。
所述的中间重构可以通过选择第j个侧解量化器的重构点并减去伪随机抖动Z的实现结果来获得,所述的第j个侧解量化器的重构点与所接收到得指数Ij相关联。
X ~ j = X ~ ′ j - Z . - - - ( 8 )
上述方案的一个特性是的统计分布本质上以解析形式获知。举例来说,可分布为fX*fN,其中*表示卷积运算符且fN为第j个侧量化器的量化噪声的概率密度函数。根据一些实施方案,量化噪声fN的概率密度函数可在由P(M)和Δ指定的侧量化单元内为均匀的,所述侧量化单元位于原点附近,即
f N = 1 2 M Δ Σ i ∈ P ( M ) U ( Δ l ( i ) , Δ r ( i ) ) ,
其中Δl(i)、Δr(i)和P将用以下等式(9)定义。
统计分布的形式为解析式的,且因此其促使获取解析分布保留变换。在此情况下,分布保留变换可计算为:
T j ( x ) = F X - 1 { 1 2 M Δ Σ i ∈ P ( M ) ∫ Δ l ( i ) Δ r ( i ) F X ( x - τ ) d τ } , - - - ( 9 )
其中积分边界Δl(i)和Δr(i)可如下计算。为了计算Δl(i)和Δr(i),需要定义即由某集合P(M)指定的指数模式的均值。FX(x)为与p.d.f.相关的变量X的累积分布函数c.d.f.,表示逆c.d.f.。
示范性指数分配方案可具有其始终在每一侧单元内产生与中心单元的模式相同的模式的特性。此特性有利于抖动且获得在任何比特率和任何指数分配的配置(由参数M指定)下准确的侧量化器的解析附加噪音模型。举例来说,假设任何侧量化单元内的中心指数的模式由以下集合指定:
P ( M ) = { 0 } ∪ { i ( M - 1 ) } i = 1 M - 1 ∪ { ( M - 1 ) 2 + M } ∪ { ( M - 1 ) 2 + M + i ( M + 1 ) } i = 1 M - 1 . - - - ( 10 )
可以看到,集合P(M)含有恰好2M个元素,因此每个侧量化单元含有恰好2M个中心单元。表达式(10)可用于任何M,然而M的较低值可更具有实际针对性。参数M促进在中心量化器的失真与侧量化器的失真之间做出折衷。
举例来说,假设解码器知道在编码期间所使用的指数分配的配置(由M指定),因此其能够计算P(M)。举例来说,设M=2。对应的指数模式为P(2)={0,1,3,6}。
可计算为
P ‾ = 1 2 M Σ i ∈ P ( M ) i . - - - ( 11 )
积分边界Δl(i)可接着计算为
Δ l ( i ) = - ( i - P ‾ ) Δ - Δ 2 , - - - ( 12 )
Δ r ( i ) = - ( i - P ‾ ) Δ + Δ 2 . - - - ( 13 )
请注意,可针对任何已知M和Δ预先计算积分边界以实现有效实施方案。将变换Tj应用于从而产生新变量所述新变量根据输入信号X的p.d.f.来分布。作为最终解码步骤,可将均值μ加回到经重构信号,从而产生最终重构。
在一些情况下,可能需要使用分布保留变换的低复杂性替代方案。可仅通过分别保留fX的第一和第二统计矩、均值和方差来近似地对其进行保留以代替完全保留原始源p.d.f.。侧量化单元内的中心量化指数的周期性模式便于获取矩保留变换。所述变换具有形式
T j - L C ( x ) = σ X 2 σ X 2 + σ j 2 x , - - - ( 14 )
其中为用于侧第j个量化器的量化噪声误差方差,其为Δ与M的函数。的值可根据以下公式来计算:
σ j 2 = Δ 2 M 4 3 . - - - ( 15 )
情况3:假设未接收到任何描述。
如果未接收到任何描述,那么解码器仍执行信号重构。在此情况下,重构可借助于利用关于信号p.d.f.fX的可用信息或其近似值的信号合成来获得。现有技术中已经有多种可用以执行合成方法。确切地,逆取样方法会使解码器在所有描述均丢失的情况进行理想的重构。假设编码器与解码器之间保持同步,那么解码器能够获取抖动信号Z~U{0,2MΔ}。在此情况下,可通过将以下变换直接应用于抖动信号来接收重构
T Z ( z ) = F X - 1 ( z 2 M Δ ) , - - - ( 16 )
其中表示逆c.d.f.。假设 F X - 1 ( α ) = inf β { F X ( β ) ≥ α } . 接着通过采用 X ^ Z = T Z ( Z ) 来获得重构作为最终解码步骤,可将均值μ相加到从而产生最终重构。
在一些情况下,使用的低复杂性方案替代TZ(·)可能具有实用意义。如果放松分布保留约束条件且所述分布近似地保留,那么可通过使用以下保留原始密度fX的第二矩的变换来获得重构:
T Z - L C ( z ) = 12 σ x 2 Δ 2 · ( z - M Δ ) . - - - ( 17 )
关于重构期间的操作比特率,其可指代在描述间分布的总比特率,例如量化器可用的比特率。一般来说,比特率可在描述之间任意地分布。根据一些实施例,描述间的比特率分派是对称的,这意味着所有描述经分派有相同比特率。
比特率可取决于Δ、M的选择和第一概率密度函数fX
总比特率可频繁变化,因为fX可随时间改变。另外,通信信道的一些属性由于一些原因例如包丢失率、可用传输比特率可在传输期间变化。这些改变影响Δ和M的值,从而影响操作比特率。
关于第三与第一概率密度之间的相似性,在各种实施方案中,其旨在保留第一p.d.f.,这意味着所述经重构信号可根据第一p.d.f.分布。此方案具有理论根据,且还实验证明在具有显著效果的。然而,如果通过允许较小偏离第一p.d.f.的方式来近似地保留第一p.d.f.,也可获得所述益处。此外,还可考虑采用其它的多种相似度量度方式。
最简单的量度方式可以是统计矩之间的绝对差值。考虑两个概率分布函数fX和fY。两个p.d.f.均包含其第一和第二统计矩。第一统计矩为均值。在此情况下,具有:
μ X = ∫ - ∞ ∞ xf X ( x ) d x - - - ( 18 )
以及
μ Y = ∫ - ∞ ∞ xf Y ( x ) d x . - - - ( 19 )
第二统计矩为方差。定义
σ X 2 = ∫ - ∞ ∞ ( x - μ X ) 2 f X ( x ) d x - - - ( 20 )
以及
σ Y 2 = ∫ - ∞ ∞ ( x - μ Y ) 2 f Y ( x ) d x . - - - ( 21 )
绝对差值相似性量度可针对第一矩定义为
ημ=|μXY|, (22)
且针对第二矩定义为
η σ 2 = | σ X 2 - σ Y 2 | . - - - ( 23 )
根据一些实施方案,定义标准化绝对差值相似性量度方式可为更方便的。在此情况下,第一矩之间的相似性可定义为
γ μ = | μ X - μ Y | | μ X | , - - - ( 24 )
且针对第二矩定义为
γ σ 2 = | σ X 2 - σ Y 2 | σ X 2 . - - - ( 25 )
如果使用标准化绝对差值相似性量度方式,那么可用公式表示定义相似性范围的区间。举例来说,可设置以下阈值:
γ σ 2 ≤ 1 2 , γ μ ≤ 1 2 . - - - ( 26 )
一般来说,不允许与原始矩的任何偏离,但也可选择3dB差值为可接受的,其将导致信号的50%能量损耗/增加。举例来说,假设至多3dB差值为可接受的,那么对于第二矩,可使用以下测试公式:
&Gamma; &sigma; 2 = 10 log 10 &beta; , &beta; &GreaterEqual; 1 10 log 10 ( &beta; - 1 + 1 2 ) , &beta; < 1 , 其中 &beta; = &sigma; X 2 &sigma; Y 2 , - - - ( 27 )
可定义因此,以上等式提供关于是否满足3dB条件的测试。
根据一些实施方案,预定的最小相似性可对于第一和第二统计矩为相同的。然而,可选择预定的最小相似性以使得所述第一统计矩的允许误差比所述第二统计矩的允许差值小。确切地,第一统计矩无差值,或仅允许第一统计矩具有微小的差值,而第二统计矩则允许有一定差值,例如3dB。
举例来说,假设至多3dB差值为可接受的,那么对于第一矩,可使用以下测试公式:
&Gamma; &mu; = 10 log 10 &beta; , &beta; &GreaterEqual; 1 10 log 10 ( &beta; - 1 + 1 2 ) , &beta; < 1 , 其中 &beta; = | &mu; X &mu; Y | - - - ( 28 )
所允许的偏离可因此由以下约束条件Γμ≤3来表达,但确切地,Γμ=0最好。
由于此处所考虑的概率密度函数始终包含第一和第二统计矩,所以所提出的相似性量度在完全保留分布的情况(即,全复杂性情况)下也将起作用。或者,在完全保留p.d.f.的情况下,可使用库尔贝克-莱伯勒发散(Kullback–Leibler divergence)。
fX与fY之间的库尔贝克-莱伯勒发散定义为
D K L ( f X | | f Y ) = &Integral; - &infin; &infin; f X ( x ) log 2 f X ( x ) f Y ( x ) d x , - - - ( 29 )
其以位为单位来测量。此量度尤在评价第三分布在本质上完全与第一分布相同的情况。
图2展示根据一个实施方案的MDC系统的框图。虽然描述主要集中于MDC系统的解码部分,但为了全面理解也描述编码部分。
在块201中,提供源信号,其中待量化的源信号的统计信号模型是已知的。举例来说,此统计信号模型可表示为或等效于p.d.f.,其可称为第一p.d.f.。所述源信号被输入到块203,所述块203,例如,包括一个多描述量化器MDQ。所述量化器可使用如上所述的抖动和周期性指数分配,以便产生编码源信号的指数或描述集合205。将描述集合205传输到解码器侧,所述解码器侧包括重构器207、变换器209和输出缓冲器211。在传输期间,可能不丢失任何描述、丢失一些描述或丢失全部描述,因此,在解码器侧处接收到描述子集可等于描述集合或为所接收的描述子集或为空集。
根据所接收的描述子集的成分,可在重构器207处呈现各种失真级别1,…,N,…,L。举例来说,在失真级别1中,所有描述都能被接收到。举例来说,在失真级别N中,M个描述当中的N个描述能被接收到,而在失真级别L中,所有描述都丢失。重构器207包含若干重构器块213、215、217,其分别适用于基于由所接收的描述子集的成分定义的特定失真级别来重构经重构信号。
重构后,将相应的经重构信号提供到变换器209,相应的经重构信号具有差不多类似于第一p.d.f.的第二p.d.f.,所述相似性取决于子集的成分。然而,依据相应的失真级别可提前知道经重构信号的统计属性。因此,在变换器209的处理块219、221、223中,可借助于变换函数在统计上处理具有第二p.d.f.的经重构信号以获取处理后的经重构信号的第三p.d.f.,这个过程可为对第一p.d.f.的重建。关于变换函数的各种实施方案,可参考等式(4)到(17)。将变换器209的相应输出提供到缓冲器211,所述缓冲器211包括块225、227、229,所述块225、227、229分别与经统计处理后的相应失真级别的经重构信号相对应,每一经统计处理后的相应失真级别的经重构信号各自具有如上所述的等于或近似等于第一p.d.f.的概率密度。
图3展示MDC系统的另一实施方案,其中输入源信号301在编码器303中编码且在解码器305中解码。在编码器303(为了全面理解解码器305而对其进行简要解释)中,用加法器307将抖动Z相加到源信号。将加法器307的输出提供到量化器309,且进一步提供到指数分配块311,其产生两个描述I0、I1,所述两个描述可接着被传输到解码器305。编码器的功能可由等式(1)表达。
解码器305可接收两个描述I0、I1、一个描述I0或I1或者接收不到描述。如果接收到两个描述I0、I1,那么所接收到的两个描述I0、I1将别提供给逆指数分配块313,所述逆指数分配块313将所接收的指数映射到一个值或一组值,所述值被提供到解量化器315。解量化器315的运算可由等式(2)实施。将解量化器315的结果提供到加法器317,其中例如根据等式(3)减去抖动Z。将所得值提供到中心变换器319,所述中心变换器319可根据等式(4)或(7)进行运算。因此,在块321中,可得到经处理的经重构信号,其具有与信号源的第一p.d.f.相同或相似的p.d.f.。块313、315、317、319、321形成中心重构路径。
如果仅接收到描述I0、I1中的一者,那么将其分别提供给相应的解量化器和重构器323或325。在这些块323、325中,根据所接收的描述确定重构点,这个过程将结合图4和图5a做更详细解释。类似于加法器317,分别在加法器327或329处例如根据等式(8)从重构点减去抖动信号Z。将所得信号分别提供到变换块331或333,其例如根据等式(9)或(14)执行信号的统计处理或变换。
接着将所得的经处理的经重构信号分别提供到块335或337,使得经重构的输出信号具有等于或近似等于源信号的第一p.d.f.的第三p.d.f.。
块323、327、331和335形成第一侧重构路径,且块325、329、333、337形成第二侧重构路径。
如图3所示,侧量化器0包含块309、311和出口I0。侧量化器1包含块309、311和出口I1。
根据等式(18)到(29),可预先定义块321、335、337中的信号的概率密度与源信号的第一概率密度之间的相似性。
如果丢失全部描述,即未接收到任何描述,那么可在合成器块339中合成经重构信号,所述合成器块339例如根据等式(16)或(17)进行运算。明确地说,可基于抖动信号Z进行合成。在合成的情况下,所述经合成的重构信号可被提供给块341中提供,所述经重构信号具有等于或近似等于源信号的第一p.d.f.的概率密度。
为更好地说明解码器305的运算,可采用指数分配算法的特定配置。根据上述实施例,将参数M选择为M=2,因此指数分配矩阵可具有四条对角线。图4中展示示范性指数分配方案或指数分配矩阵。请注意,指数分配在每一侧单元内产生相同的中心单元模式。所述模式由集合P(M)描述,所述集合P(M)在此情况下为P(2)={0,1,3,6}。所述模式可通过选择特定侧量化单元且从属于所述单元的其它所有中心指数减去所述侧单元内的最小中心单元指数来获得。举例来说,如果考虑侧量化器0的侧单元2(402),那么属于所述侧单元的中心单元为{4,5,7,10},模式P(2)可计算为P(2)={4-4,5-4,7-4,10-4}={0,1,3,6}。举例来说,如果考虑侧量化器1的侧单元3(413),那么属于所述侧单元的中心单元由集合{6,7,9,12}指定。因此,对应的模式为P(2)={6-6,7-6,9-6,12-6}={0,1,3,6}。
图4所示的指数分配矩阵的列由侧量化器0的指数索引,且行由侧量化器1的指数索引。侧量化情况的索引可用任意方式实施。然而,每一侧量化器的每一侧量化单元可由唯一指数索引。在图4所示的实例中,假设传输了中心指数7。将所述指数映射到一对指数。在此情况下:侧量化器0的指数2,其由列402定义;以及侧量化器1的指数3,其由行413定义。将此对中的指数称为侧指数。如果两个侧指数均可用,那么可反转指数分配且可根据指数分配矩阵唯一地确定对应的中心指数。如所述,可能在传输期间丢失一些侧指数。在此情况下,只有解码器可得到的这些侧指数可用于重构。
出于说明的目的,假设已丢失侧量化0的侧指数。这暗示着解码器仅可得到侧量化器1的侧指数。在此情况下,其为指数3。已知,侧指数3与行413的特定侧量化单元相关联,所述特定侧量化单元为中心单元的不相交并集。侧量化单元由以下中心单元{6,7,9,12}构成。在此情况下,描述指数分配的对应配置的模式P(M)为{0,1,3,6}。所述模式可通过从属于侧单元的中心单元的所有指数减去属于侧量化单元的最小中心指数来获得。举例来说,P(M)={6-6,7-6,9-6,12-6}={0,1,3,6}。
图5a中展示此侧量化单元413。侧量化单元413由四个中心单元构成,每一所述中心单元中具有等于量化器步长Δ的宽度。每一侧量化单元与单个重构点相关联。用于侧量化单元的重构点是通过对属于此特定侧量化单元的中心指数求平均值且对所获得的结果根据中心量化器步长Δ进行缩放算出的。在此特定情况下,模式的均值等于8.5=(6+7+9+12)/4。因此,重构点的确切位置为8.5·Δ。明显地,此用以计算重构点的位置的方法相对于用于所考虑的量化器的MSE来说为最佳的。重构点的位置有利于对待量化的信号样本进行尽可能接近的重构,尤其是按照MSE。
参看图5a,侧解量化器执行侧指数或指数集合到单个重构值之间的映射。图5a描绘其中接收到如图4所描绘的侧量化器1的侧量化指数3的情况。指数指示与单个重构值相关联的特定侧量化单元(413)。解量化器映射将重构值分配给侧量化器的指数或指数集合。
图5b展示将侧量化单元分割为中心量化单元,其中具有中心量化指数501、第一量化器侧的侧量化单元指数503(其仅部分展示)、侧量化器1的单元0(505)、侧量化器1的侧单元1(507)、侧量化器1的侧单元2(509)、侧量化器1的侧单元3(511)、侧量化器1的侧单元4(513)(其仅部分展示)。
参看图3到5a、5b,侧量化器使用中心量化器的分割。中心量化器的分割的使用由指数分配算法描述。中心量化器的所有量化单元均由图4所示的指数分配矩阵的为非空元素(即,具有条目的元素)的中心指数来索引。所有中心量化单元还由所使用的每一侧量化器的侧量化指数来索引。
例如,由图4中的参考符号413表示的侧量化器1的量化单元{6,7,9,12}可与侧量化器1的侧指数3相关联。这意味着所述量化单元属于侧量化器1的单个量化单元。此单元在图5a中展示。
例如,图4中所展示的与指数{6,7,9,12}相关联的中心单元属于侧量化器0的不同单元。举例来说,中心单元6属于侧量化器0的侧量化单元1,中心单元7属于侧量化器0的侧量化单元2,等等。
经量化以便分配给此特定量化单元的样本必须已具有位于区间 中的一者内的值。
如果其它描述为不可用,那么解码器无法唯一地确定正确区间。然而,其可基于所述的区间而使用引起尽可能小的性能损耗的重构点。由于在所述的侧量化单元的左侧处存在较多中心单元,所以待量化的信号的真值也最可能位于所述侧量化单元的左侧。举例来说,重构点位于等于相应侧量化单元中的指数模式的均值的位置中便符合上述的情况。事实证明,在此情况下,重构点的理想的位置可为8.5·Δ。
可针对其它量化单元和其它侧量化器以类似方式找出重构点的确切位置。从侧量化器指数到侧量化器重构点的映射可在设计多描述量化器期间预先计算。其可方便地使用查找表来实施,或在此实例中所使用的特定指数分配的情况下通过舍入来实施。
可从以上实例注意到,在指数分配矩阵中使用较大数目的对角线导致侧量化单元较宽,因此以侧量化器所作的重构较粗糙。通过调整指数分配矩阵中的对角线数目,可在中心失真与侧失真之间进行折衷。通常,这样做是为了相对于描述丢失概率来优化量化器的MSE性能。
根据解码方法和解码器的上述实施方案,信号分布的保留或近似保留带来例如采用MDC的多媒体通信的感知性能的提升。上文所描述的分布保留多描述量化在低比特率编码情形中尤其有效,这可具有较高的实际意义。尤其是对于那些低比特率,所描述的实施方案相比常规的基于MSE的解码器的性能好。此外,在可用比特率函数中,参数描述与率失真最佳描述之间的连续转变是可能的。可维持编码灵活性,尤其能基于解析准则来重新设计并优化用于多描述编码的编码器,而不需要在编码器和解码器侧处进行迭代或训练。
举例来说,上述编码和解码方案可用于不可靠网络中多媒体通信系统中的量化,尤其是用于进行语音、音频、图像或视频传输的多媒体通信系统。此外,所述实施方案可在应用于语音信号或音频信号的多描述编码的情况下用以扩展带宽。得益于解码方案的适应性,可实现对语音信号的灵活多描述量化,其中编码器可在低操作比特率下具有类似声码器的性能,且针对较高操作比特率执行率失真最佳编码。
所述的MD-DPQ提供用于在经由具有包丢失的通信网络的多媒体通信中进行包丢失隐蔽(PLC)的手段。明确地说,其在编码受到阻止使用涉及前向误差校正(FEC)的途径的延迟约束条件所约束的情形中是有用的。除了这点以外,所提议的MD-DPQ尤其适用于其中确切的包丢失概率未知(这妨碍设计有效的FEC编码策略)的情形。MD-DPQ在包丢失速率不同于设计中所假设的包丢失速率的情形中也仍为有效用的。
所提议的MD-DPQ优于现有技术多描述量化的主要优点与以下事实相关:其使用与分布保留约束条件组合的均方误差准则,这比在现有技术系统的情况下单独依赖于均方误差在感知上更有效。所提议的方法的另一优点是其可在运行中被优化,因为其不采用任何反复过程。得益于于此属性,其可在率失真灵活编码的情形中使用,其中重要的是能够重新设计所述量化器以匹配任何比特率约束条件。举例来说,如果通信信道的属性为可变的(例如,可用带宽、比特率、包丢失速率),那么灵活编码为有用的。
所提议的多描述分布保留量化(MD-DPQ)的示范性应用是经由具有包丢失的网络的实时音频通信。提议将MD-DPQ应用于对单宽带信号进行操作的前向适应性灵活编码器中。图6中展示此类音频编码器600的高级框图。
音频编码器600包含信号建模块601、感知加权块603、卡亨南-赖佛变换器(Karhunen-Loeve transformer,KLT)605、标准化器607、MD-DPQ 609、熵编码器611、解标准化器613、逆KLT 615、感知去权块617和预测器619。
以前向适应性方式执行编码。在块601中通过多元高斯对每一信号块进行建模。借助于自回归(AR)模型对协方差矩阵进行参数化。将每一20ms的信号块细分为四个子块,且针对每一子块对AR模型进行内插。使用AR模型来获得感知加权和去权滤波器。
在块605中基于子块来计算卡亨南-赖佛变换。将KLT应用于由块603提供的在感知上经加权的信号,其具有由预测器619提供的相减预测。在块607中对KLT系数进行标准化,且在块609中使用MD-DPQ对其进行量化,从而产生中心量化器的经重构值的块(展示为“cd”)以及用于两个描述的两个指数集合(展示为“sd0”和“sd1”)。使用算术熵编码器611的两个单独例项对指数进行编码,且将其嵌入到两个包中。每一包均含有关于AR模型的全部信息和用于信号标准化的增益。
在编码器处仅使用从中心量化器获得的重构来闭合由预测器619所提供的预测环路。在块613、615和617中执行局部重构,所述块大体上提供块603、605、607的逆操作。
解码器包含MD-DPQ解码器,其依据所接收到的描述的数目提供信号重构,如上所述。因此,如果接收到两个描述,那么执行中心重构。如果丢失一个描述,那么选择恰当的侧解码器且执行重构。如果丢失所有描述,那么使用用于先前所接收的块的统计信号模型来执行信号合成。
可针对增益选择试探式衰减因数(例如,0.95),其在传输被中断的情况下造成信号渐隐。以例如20ms的长度对信号帧执行编码。每隔20ms,产生两个侧描述。所述侧描述为双级的。一个级含有全部模型信息,例如线性预测系数(LPC,用以表示AR模型)和四个信号增益。另一级含有从MD-DPQ获得的信号描述。从熵编码器611获得侧描述的比特流。
针对所有变换系数使用恒定的步长Δ,其可由高速率自变量促成为最佳的。使用单个包来发射每一双级侧描述,且针对单个信号帧,产生两个包。包的建构导致模型信息的复制。可在两个包之间对称地分布总可用比特率。
具有MD-DPQ的音频编码器600为灵活的且可在任何比特率下进行操作。这意味着,针对任何总比特率约束条件,可在描述的模型与信号部分之间分布可用比特率。可使用恒定的模型比特率,其为用于灵活的多描述量化的合意策略。

Claims (13)

1.一种用于重构经一组至少两个描述编码(101)的源信号的方法,所述源信号具有第一概率密度,其中所述第一概率密度包含第一统计矩和第二统计矩,其特征在于:所述方法包含:
接收(103)组描述的子集;
基于所述子集以一组操作比特率中的某一操作比特率重构(105)经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及
处理(107)所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩,其中,所述对经重构信号的处理使得至少所述第三概率密度的所述第一统计矩和所述第二统计矩比所述第二概率密度的所述第一统计矩和所述第二统计矩类似于所述源信号的所述第一统计矩和所述第二统计矩,且其中,对所述经重构信号的进一步处理使得不管所述操作比特率如何,均维持所述第三概率密度的所述第一统计矩与所述第一概率密度的所述第一统计矩之间的预定最小相似性以及所述第三概率密度的所述第二统计矩与所述第一概率密度的所述第二统计矩之间的预定最小相似性;
其中所述处理(107)所述经重构信号包含根据统计变换函数T(x)来变换所述经重构信号,所述变换函数T(x)根据以下公式来确定:
T ( x ) = &sigma; X 2 &sigma; X 2 + &Delta; 2 12 x ,
其中Δ为量化器步长,为与所述第一概率密度的所述概率密度函数fX(·)相关的变量X的方差。
2.根据权利要求1所述的方法,其特征在于,处理(107)所述第二概率密度的所述第一统计矩和所述第二统计矩以将所述第一概率密度的所述第一统计矩和所述第二统计矩保留在预定矩范围内。
3.根据权利要求1所述的方法,其特征在于,所述第一概率密度的所述第一统计矩与所述第三概率密度的所述第一统计矩相等,且所述第一概率密度的所述第二统计矩与所述第三概率密度的所述第二统计矩相等。
4.根据前述权利要求1-3中任一权利要求所述的方法,其特征在于,使用取决于所述子集中的描述成分的重构函数来重构出(105)所述经重构信号。
5.根据前述权利要求1-3中任一权利要求所述的方法,其特征在于,所述源信号包含伪随机抖动信号,且其中所述重构(105)包含从所述经重构信号减去所述伪随机抖动信号。
6.根据前述权利要求1所述的方法,其特征在于,所述重构(105)包含使用指数分配方案,所述指数分配方案由所述组描述中的所述描述寻址,所述指数分配方案用于获取编码所述源信号的所述组描述。
7.根据前述权利要求1所述的方法,其特征在于,所述处理(107)所述经重构信号包含根据统计变换函数来变换所述经重构信号,所述变换函数取决于所述子集中的描述成分。
8.一种用于重构经一组至少两个描述编码(101)的源信号的方法,所述源信号具有第一概率密度,其中所述第一概率密度包含第一统计矩和第二统计矩,其特征在于:所述方法包含:
接收(103)组描述的子集;
基于所述子集以一组操作比特率中的某一操作比特率重构(105)经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及
处理(107)所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩,其中,所述对经重构信号的处理使得至少所述第三概率密度的所述第一统计矩和所述第二统计矩比所述第二概率密度的所述第一统计矩和所述第二统计矩更相似于所述源信号的所述第一统计矩和所述第二统计矩,且其中,对所述经重构信号的进一步处理使得不管所述操作比特率如何,均维持所述第三概率密度的所述第一统计矩与所述第一概率密度的所述第一统计矩之间的预定最小相似性以及所述第三概率密度的所述第二统计矩与所述第一概率密度的所述第二统计矩之间的预定最小相似性;所述处理(107)所述经重构信号包含根据统计变换函数T(x)来变换所述经重构信号,所述变换函数T(x)是根据以下公式来定义的:
T ( x ) = &sigma; X 2 &sigma; X 2 + &Delta; 2 M 4 3 x ,
其中Δ为量化器步长,M为指数分配参数,且为与所述第一概率密度的所述概率密度函数fX(·)相关的变量X的方差。
9.一种用于重构源信号的解码器(305),所述源信号是通过一组至少两个描述来编码的,所述源信号具有第一概率密度,所述第一概率密度包含第一统计矩和第二统计矩,其特征在于,所述解码器包含:
入口,其用于接收组描述的子集;
重构器(313、315、323、325),其用于基于所述子集以一组操作比特率中的某一操作比特率重构经重构信号,所述经重构信号具有第二概率密度,其中所述第二概率密度包含第一统计矩和第二统计矩;以及
变换器(319、331、333),其用于处理所述经重构信号以便获得经处理的经重构信号,所述经处理的经重构信号具有第三概率密度,其中所述第三概率密度包含第一统计矩和第二统计矩,具体地,所述变换器用于处理所述经重构信号以使得至少所述第三概率密度的所述第一统计矩和所述第二统计矩比所述第二概率密度的所述第一统计矩和所述第二统计矩类似于所述源信号的所述第一统计矩和所述第二统计矩,且其中所述变换器进一步用于处理所述经重构信号以使得不管所述操作比特率如何,所述第三概率密度的所述第一统计矩与所述第一概率密度的所述第一统计矩之间的预定最小相似性以及所述第三概率密度的所述第二统计矩与所述第一概率密度的所述第二统计矩之间的预定最小相似性均得以维持;
其中所述处理所述经重构信号包含根据统计变换函数T(x)来变换所述经重构信号,所述变换函数T(x)根据以下公式来确定:
T ( x ) = &sigma; X 2 &sigma; X 2 + &Delta; 2 12 x ,
其中Δ为量化器步长,为与所述第一概率密度的所述概率密度函数fX(·)相关的变量X的方差。
10.根据权利要求9所述的解码器,其特征在于,所述变换器用于处理所述第二概率密度的所述第一统计矩和所述第二统计矩以便将所述第一概率密度的所述第一统计矩和所述第二统计矩保留在预定矩范围内。
11.根据权利要求9或10所述的解码器,其特征在于,所述重构器包含中心重构路径,所述中心重构路径用于基于指数信息来重构所述经重构信号,所述中心重构路径包含经用于基于所述组描述来确定所述指数信息的索引器。
12.根据权利要求9或10所述的解码器,其特征在于,所述重构器包含至少一个侧重构路径,所述侧重构路径用于基于映射信息来重构所述经重构信号,所述至少一个侧重构路径包含经用于基于所述子集的所述描述和所述子集中的描述成分来确定所述映射信息的映射器。
13.根据权利要求9或10所述的解码器,其特征在于,所述变换器用于基于所述子集中的描述成分来执行所述处理。
CN201180003043.XA 2011-05-23 2011-05-23 用于重构源信号的方法和解码器 Active CN103503320B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/074508 WO2012159257A1 (en) 2011-05-23 2011-05-23 Method and decoder for reconstructing a source signal

Publications (2)

Publication Number Publication Date
CN103503320A CN103503320A (zh) 2014-01-08
CN103503320B true CN103503320B (zh) 2016-10-05

Family

ID=47216515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180003043.XA Active CN103503320B (zh) 2011-05-23 2011-05-23 用于重构源信号的方法和解码器

Country Status (4)

Country Link
US (2) US9100053B2 (zh)
EP (1) EP2695301B1 (zh)
CN (1) CN103503320B (zh)
WO (1) WO2012159257A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015010309A1 (zh) * 2013-07-25 2015-01-29 华为技术有限公司 信号重建方法和装置
US10503158B2 (en) 2016-12-14 2019-12-10 General Electric Company System and method for reconstructing and augmenting high frequency data
US10469877B1 (en) * 2017-04-28 2019-11-05 Mozilla Corporation Systems and methods for reduced complexity entropy coding
US10630747B2 (en) * 2017-12-14 2020-04-21 Agora Lab, Inc. Integer multiple description coding system
US11398830B2 (en) * 2018-04-27 2022-07-26 University Of Cyprus Methods for compression of multivariate correlated data for multi-channel communication

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753271A (zh) * 2009-12-29 2010-06-23 中兴通讯股份有限公司 多描述编码的分布式媒体流分发系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6516297B1 (en) * 1998-12-23 2003-02-04 At&T Corp. Multiple description lattice vector quantization
GB2394389B (en) 2002-10-15 2005-05-18 Toshiba Res Europ Ltd Equalisation apparatus and methods
ATE413020T1 (de) 2003-12-17 2008-11-15 Mitsubishi Electric Corp Demodulationsverfahren von mit einem on-off- keying modulationsverfahren kodierter ultrabreitbandpulssequenzen
WO2009045148A1 (en) * 2007-10-05 2009-04-09 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for multiple description coding
US9318145B2 (en) * 2009-03-30 2016-04-19 General Electric Company Method for decoding under optical and electronic noise
CN102263558B (zh) 2010-05-28 2014-02-19 华为技术有限公司 信号处理方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753271A (zh) * 2009-12-29 2010-06-23 中兴通讯股份有限公司 多描述编码的分布式媒体流分发系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Distribution Preserving Quantization With Dithering and Transformation;MINYUE LI et al;《IEEE SIGNAL PROCESSING LETTERS》;20101201;第17卷(第12期);参见第1015页左栏第一段,第II部分第2段第1-4行,左栏第9-12行,左栏第2-3行、附图1、公式2 *
Flexcode-flexble audio coding;JANUSZ KLEJSA ET AL;《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING》;20100314;参见第362页右栏3.4节、附图1 *

Also Published As

Publication number Publication date
CN103503320A (zh) 2014-01-08
WO2012159257A1 (en) 2012-11-29
EP2695301A1 (en) 2014-02-12
US20140077977A1 (en) 2014-03-20
US9287895B2 (en) 2016-03-15
EP2695301A4 (en) 2014-05-21
EP2695301B1 (en) 2016-09-14
US9100053B2 (en) 2015-08-04
US20150295590A1 (en) 2015-10-15

Similar Documents

Publication Publication Date Title
US10546592B2 (en) Audio signal coding and decoding method and device
CN102577132B (zh) 用于阶乘脉冲编码器的算术编码
Gibson Adaptive prediction in speech differential encoding systems
CN101779377B (zh) 编码源信号/解码数据分组序列的设备和方法
CN103503320B (zh) 用于重构源信号的方法和解码器
KR101343267B1 (ko) 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치
CN101223582B (zh) 一种音频编码方法、音频解码方法及音频编码器
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
CN103065637B (zh) 音频编码器和解码器
CN104681028B (zh) 一种编码方法及装置
JPS6027459B2 (ja) 信号を量子化する方法
RU2012119783A (ru) Способ и устройство иерархического кодирования/декодирования аудио
CN102934428B (zh) 一种图像压缩中利用人眼视觉模型的小波系数量化方法
CN105144288A (zh) 高级量化器
CN101917614A (zh) 一种基于h.264分层b帧编码结构的码率控制方法
CN101281748B (zh) 用编码索引实现的空缺子带填充方法及编码索引生成方法
JP2017062477A (ja) 方法、符号化器、復号化器、及び移動体機器
CN107666472A (zh) 混合的数字‑模拟编解码
CN102055974B (zh) 数据压缩、解压缩方法、装置及系统
WO2011021238A1 (ja) レート制御装置、レート制御方法及びレート制御プログラム
KR20100091958A (ko) 다중 디스크립션 코딩을 위한 방법 및 장치
WO2022078960A1 (en) Signal coding using a generative model and latent domain quantization
JP3203609B2 (ja) ベクトル量子化器の設計方法およびベクトル量子化器
Lervik et al. Robust subband image coding for waveform channels with optimum power-and bandwidth-allocation
CN110428847A (zh) 一种线谱频率参数量化比特分配方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant