CN107079152B - 编码器、解码器、用于编码及解码的系统及方法 - Google Patents

编码器、解码器、用于编码及解码的系统及方法 Download PDF

Info

Publication number
CN107079152B
CN107079152B CN201580050928.3A CN201580050928A CN107079152B CN 107079152 B CN107079152 B CN 107079152B CN 201580050928 A CN201580050928 A CN 201580050928A CN 107079152 B CN107079152 B CN 107079152B
Authority
CN
China
Prior art keywords
quantized
residual
value
inverse quantization
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580050928.3A
Other languages
English (en)
Other versions
CN107079152A (zh
Inventor
吉约姆·福克斯
本杰明·舒伯特
格莱泽格尔兹·皮耶奇克
马库斯·缪特拉斯
伯恩哈特·格里尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to CN202110277333.9A priority Critical patent/CN112954323A/zh
Publication of CN107079152A publication Critical patent/CN107079152A/zh
Application granted granted Critical
Publication of CN107079152B publication Critical patent/CN107079152B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明的实施例提供一种编码器,其包括量化阶段、熵编码器、残余量化阶段以及编码信号形成器。量化阶段用于使用死区对输入信号进行量化,以得到多个量化值。熵编码器用于使用熵编码方案编码多个量化值,以得到多个熵编码值。残余量化阶段用于对由量化阶段造成的残余信号进行量化,其中残余量化阶段用于根据量化阶段的死区确定至少一个量化残余值。编码信号形成器用于从多个熵编码值和至少一个量化残余值形成编码信号。

Description

编码器、解码器、用于编码及解码的系统及方法
技术领域
实施例涉及一种编码器、一种解码器、一种包括编码器及解码器的系统、一种用于编码的方法以及一种用于解码的方法。一些实施例涉及一种用于源编码中的优化残余量化的装置及方法。一些实施例涉及一种源编码方案,其使用熵编码在确定数量的比特上对量化信号进行编码。
背景技术
熵编码是一种用于利用符号冗余度进行传输的有效工具。其通常用在谱线的量化之后的基于变换的编码中。通过利用先验概率分布,可使用减少数量的比特无耗损地对量化值进行编码。此原理在于生成长度是符号概率的函数的码字。
比特消耗通常只有在将熵编码的符号写入比特流之后才知道。在对需要知道用于对率失真函数进行优化的比特消耗的量化阶段进行优化时这通常是有问题的。在作为多数通信网络协议的必要条件的比特流必须有每帧固定大小(也被称为固定的比特率)时这更是有问题的。
在变换编码器中,缩放因子的集合通常通过在频域中对量化噪声进行成形来定义量化。噪声成形是通常由心理声学模型给定的感知到的失真以及所引起的比特消耗作用的结果。然而,最后的因子通常仅在固定量化噪声成形之后才知道。优化循环能够用于使优化收敛。尽管如此,在实际应用中,此优化相对复杂且必须严格限制迭代次数。此外,为了更多地降低复杂度,通常不完全计算而仅是估计比特消耗。如果最终比特消耗被低估,比特流将必须被截短,其在大多数情况下要被避免。的确,低估将导致比特流的不利的截短,其等同于使量化饱和。因此,量化优化通常被设计为高估比特消耗。因此,在最终的比特流中,少量比特通常未被利用。
为了克服此问题,残余(或第二)量化阶段可添加在第一量化阶段之后用于利用最后未使用的比特。然后,这些剩余比特可用来对量化噪声进行改善。下面解释此原理。
图10显示变换编码器10的框图。变换编码器10包括第一量化阶段12、残余量化阶段14、熵编码器16、熵编码比特估计单元18、多工器20以及变换单元22。
变换单元22用于将输入信号从时域变换至频域。第一量化阶段12用于将频域中的输入信号量化为多个量化谱值q。将多个量化谱值q、频域中的输入信号X以及一定数量的剩余比特输入至残余(或第二)量化阶段14,该残余量化阶段用于改善第一量化阶段12的输出并提供多个量化残余值qr。熵编码器16用于熵编码多个量化谱值q,以得到多个熵编码值e。多工器20用于多路传输多个熵编码值e、取决于由第一量化阶段14提供的信息的缩放因子以及由第二量化16传递的多个量化残余值,以得到比特流。
图10所示的变换编码器10被设计用于传递每帧特定目标数量的比特。调整量化以达到此目标,但由于复杂度原因,当调整量化步骤时仅进行熵编码器比特消耗的估计。此外,即使比特估计非常准确,仍或许不可能发现导致预期目标比特的缩放因子的集合。在第一量化阶段12之后,对量化值q进行熵编码。剩余的未利用比特然后被分配至残余量化,该残余量化将改善第一量化阶段12的输出。残余量化阶段14将量化谱值q、原始谱值X与一定数量的剩余比特作为输入。剩余比特的数量可以是估计的或是剩余比特的真实数量。当在编码器侧需要本地合成时通常使用估计,用于(例如)以闭环决定方式(如在AMR-WB+(Adaptive Multi-Rate Wide Band Extended,自适应多率宽带扩展)中进行的)作出切换决定。在此情况下,残余编码必须在熵编码器16的最后调用之前调用。
在常用的变换编码器10中,残余量化阶段14对通过对量化谱值进行反量化得到的反量化输入信号与原始输入信号的差值进行简单均匀标量量化。然而,通过率失真性能分析,可知均匀量化仅对于无内存以及均匀分布的源是较佳的。
发明内容
因此,本发明的目的是提供用于非无内存以及非均匀分布的源的改进残余量化。
此目的可通过独立权利要求达到。
本发明的实施例提供一种编码器,其包括量化阶段、熵编码器、残余量化阶段以及编码信号形成器。量化阶段用于使用死区对输入信号进行量化,以得到多个量化值。熵编码器用于使用熵编码方案编码多个量化值,以得到多个熵编码值。残余量化阶段用于对由量化阶段造成的残余信号进行量化,其中残余量化阶段用于根据量化阶段的死区确定至少一个量化残余值。编码信号形成器用于从多个熵编码值以及至少一个量化残余值形成编码信号。
另外,本发明的实施例提供一种解码器,其包括编码信号解析器、熵解码器以及反量化阶段。编码信号解析器用于对编码信号进行解析,以得到多个熵编码值以及至少一个量化残余值。熵解码器用于使用熵解码方案解码多个熵编码值,以得到多个量化值。反量化阶段用于对多个量化值进行反量化以得到输出信号。另外,反量化阶段用于根据量化残余值及死区改善用于得到输出信号的反量化电平。
根据本发明的构想,当改善用于得到反量化信号(被称为输出信号)的反量化电平时,通过考虑了用于对输入信号进行量化的死区的编码器侧的残余量化阶段以及也考虑了此死区的解码器侧的反量化阶段,可降低甚至优化(原始)输入信号与通过对多个量化值进行反量化而得到的反量化信号之间的误差。
此外,本发明的实施例提供一种用于编码的方法。该方法包括:使用死区对输入信号进行量化,以得到多个量化值;使用熵编码方案编码多个量化值,以得到多个熵编码值;根据量化阶段的死区,对由量化阶段的量化造成的残余信号进行量化并确定多个量化残余值;以及从多个熵编码值以及多个量化残余值形成比特流。
此外,本发明的实施例提供一种用于解码的方法,该方法包括:对编码信号进行解析以得到多个熵编码值以及量化残余值;使用熵解码方案解码多个熵编码值以得到多个量化值;使用死区对多个量化值进行反量化以得到输出信号;以及根据死区及量化残余值改善用于得到输出信号的反量化电平。
附图说明
参照附图在此论述本发明的实施例。
图1显示根据本发明实施例的编码器的框图。
图2显示根据本发明实施例的解码器的框图。
图3显示根据本发明实施例的系统的框图。
图4显示根据本发明实施例的残余量化阶段的框图。
图5在图中显示在死区均匀阈值标量量化方案中使用的反量化电平与量化阈值。
图6在图中显示用于非零量化值的两个改善的反量化电平。
图7在图中显示用于零量化值的三个改善的反量化电平。
图8显示根据本发明实施例的用于编码的方法的流程图。
图9显示根据本发明实施例的用于解码的方法的流程图。
图10显示使用残余量化的现有变换编码器的框图。
具体实施方式
在以下描述中,以相同或等效的附图标记表示相同或等效的元件或具有相同或等效功能的元件。
在以下描述中,提出多个细节以提供本发明实施例的更加深入的解释。然而,对于本领域技术人员显而易见的是,可实践本发明的实施例而无需这些特定细节。在其他例子中,以框图形式而非详细地显示已知的结构及装置,从而避免混淆本发明实施例。此外,除非特别说明,下文中描述的不同实施例的特征可彼此结合。
由于熵编码传递可变长度的码字,难以在写入比特流之前预测准确的比特消耗。然而,比特消耗是对量化进行优化所需的。大多数情况下,以及出于复杂度的原因,量化是次佳的且一些少数比特仍未被利用。残余量化是为了改善量化误差而利用这些未使用的比特的第二层的量化。
以下所述的本发明的实施例提供一种编码器、一种解码器以及一种对此残余量化进行优化的方法。
图1显示根据本发明实施例的编码器100的框图。编码器100包括量化阶段102(例如第一量化阶段)、熵编码器104、残余量化阶段106(例如第二量化阶段)以及编码信号形成器108。量化阶段102用于使用死区对输入信号140进行量化,以得到多个量化值142(q)。熵编码器104用于使用熵编码方案编码多个量化值142(q),以得到多个熵编码值144(e)。残余量化阶段106用于对由在量化阶段102中的量化所造成的残余信号进行量化,其中残余量化阶段106用于根据量化阶段102的死区确定至少一个量化残余值146(qr)。编码信号形成器108用于从多个熵编码值144(e)与至少一个量化残余值146(qr)形成编码信号148。
本发明的构思在于,当改善用于得到反量化信号的反量化电平时,通过考虑了用于对输入信号进行量化的死区的编码器侧的残余量化阶段以及也考虑了此死区的解码器侧的反量化阶段,降低或甚至优化(原始)输入信号与输入信号的量化版本的反量化版本之间的误差。
在实施例中,量化阶段102可用于执行死区均匀阈值标量量化(DZ-UTSQ)。
在实施例中,编码信号形成器108可用于通过将至少一个量化残余值146或多个量化残余值146附加至多个熵编码值144形成编码信号148,直到编码信号148包括为了传输至解码器而可用的最大长度。不限制比特流含有其他信息,如定义第一量化阶段噪声成形的缩放因子、用于对量化噪声进行成形以及用于时域中的输出信号的后置滤波的预测系数。
例如,编码信号形成器108可用于提供比特流作为编码信号148。因此,编码信号形成器108例如多工器可用于在比特流的尾端加上至少一个量化残余值146或多个量化残余值146。可将编码器100生成的比特流传输(例如传送或广播)至解码器或存储于例如非易失性存储介质,用于由解码器进行的随后解码。因此,可使用数据帧或数据封包传送或存储比特流,其中比特流可需要具有每数据帧或数据封包的固定大小(此处也指目标比特)。
为了得到具有固定大小或预定数量的目标比特的比特流,编码信号形成器108可用于将量化残余值146附加至熵编码值144,直到比特流达到预定数量的目标比特。当比特流包括预定长度或数量的目标比特时,残余量化阶段106可停止确定量化残余值146。
在实施例中,输入信号140可以是频域输入信号140。编码器100可包括变换单元,其用于将时域输入信号变换为频域输入信号140。
图2显示根据本发明实施例的解码器120的框图。解码器120包括编码信号解析器122、熵解码器124以及反量化阶段126。编码信号解析器122用于对编码信号148进行解析,以得到多个熵编码值144(e)以及至少一个量化残余值146(qr)。熵解码器124用于使用熵解码方案解码多个熵编码值144(e),以得到多个量化值142(q)。反量化阶段126用于对多个量化值142(q)进行反量化,以得到输出信号150。因此,反量化阶段126用于根据量化残余值146(qr)与在量化阶段106中在编码器100中使用的用于得到多个量化值142(q)的死区来改善用于得到输出信号150反量化电平。
在实施例中,反量化阶段126可用于通过根据死区确定改善的反量化电平来改善反量化电平。
例如,反量化阶段126可用于根据死区或更精确地根据死区的宽度确定反量化电平需被改善(即被增加或被减少)的电平,以得到改善的反量化电平。另外,反量化阶段126可用于根据死区确定至少两个新的反量化电平,以及用于通过使用由量化残余值146表示的至少两个改善的反量化电平中的一个来得到输出信号150。换言之,量化残余值146表示至少两个改善的反量化电平中的哪个被用来得到输出信号150。
图3显示根据本发明实施例的系统130的框图。系统130包括图1中所示的编码器100以及图2中所示的解码器120。
下面,将更加详细地描述编码器100及解码器120的特征、以及编码器100及解码器120的特征的相互作用或交互作用。
图4显示根据实施例的残余量化阶段106的框图。残余量化阶段106可包括残余量化器106’、反量化器160以及比较器162。反量化器160可用于对由量化阶段102提供的多个量化值142(q)进行反量化,以得到反量化输入信号152(x_q)。比较阶段162可用于比较输入信号140(X)与反量化输入信号152(x_q),以得到残余信号154。残余量化器106’可用于对由量化阶段102造成的残余信号进行量化。
换言之,在图4中示出残余量化框图。谱142(q)被反量化并与原始谱140(X)比较。然后,根据可用的剩余比特执行第二层的量化。由残余量化阶段106执行的第二量化步骤通常是贪心法(greedy)量化,即逐线执行量化并且从随后传送的信息独立地算出每个再量化值。以此方式,每当编码信号形成器108提供的比特流148达到期望大小,可截短残余量化比特流146(qr)。
如图4所示,残余量化阶段106可进一步包括控制单元164,例如调节器。控制单元164可用于控制或优化残余量化器106’。
例如,控制单元164可用于控制残余量化器106’,以使得残余量化器106’根据死区或更精确地根据在量化阶段102中用于得到多个量化值142(q)的死区的宽度来对残余信号154进行量化。另外,控制单元164可用于根据一定数量的目标比特以及一定数量的消耗比特(例如,被熵编码器所提供的熵编码值144所消耗,或被熵编码值144以及残余量化器106’已经提供的量化残余值所消耗)来控制残余量化器106’。另外,控制单元164可用于根据反量化器160所提供的信息控制残余量化器106’。反量化器160所提供的信息可包含死区的宽度,其可以是固定的或适应性修改的,其也可包含在第一量化阶段中被应用来对谱进行标准化并定义量化步长的缩放因子,其也可包含量化值是否被归零的指示。
在现有的残余量化中,由残余量化阶段执行的Qr是差值x[i]-x_q[i]的简单均匀标量量化:
ifx[i]>x_q[i]
Qr[i]=(int)(0.5+(x[i]-x_q[i])/delta_r)
Else
Qr[i]=(int)(-0.5+(x[i]-x_q[i])/delta_r)
其中x[i]是输入信号140,其中x_Q[i]是反量化输入信号152,其中(int)是取整函数,以及其中delta_r是残余量化器Qr的量化步长,其通常比在第一量化器Q中使用的量化步长delta小。通常:
deltar=0.5*delta
本发明的实施例解决关于残余量化的两个问题。第一个主要问题是知道第一量化阶段102如何得到较佳Qr(残余量化阶段106的功能)。第二个问题是在剩余比特的数量需被估计时如何最小化编码器本地合成与解码器合成之间的不匹配。
通过率失真性能分析,可知均匀量化(如用在现有残余量化中)仅对于无内存以及均匀分布的源是较佳的。如果之后使用熵编码,均匀量化对于高斯源(Gaussian source)并且在非常高的比特率下是拟较佳的。在较低的比特率下,近似较佳解是具有死区与均匀阈值标量量化(DZ-UTSQ)。此量化器族对于大范围分布(例如高斯(Gaussian)、拉普拉斯(Laplacian)以及广义的拉普拉斯(generalized Laplacian))是拟较佳的。可通过不同方法优化死区因子。其可根据分布的估计而被实时地优化。更简单地,其可固定为被创建用于预期输入信号的默认最佳值或根据一些测量(如也反映了分布的谱的音调)而改变。
下面,将呈现由取决于第一阶段DZ-UTSQ 102的残余量化阶段106执行的对残余量化Qr进行优化的解决方案。死区参数被称为dz,以及DZ-UTSQ 102被定义为:
ifx[i]>0
Q[i]=(int)(rounding_dz+(x[i])/delta)
Else
Q[i]=(int)(-rounding_dz+(x[i])/delta)
and
x_q[i]=delta*Q[i]
其中x[i]是输入信号140,其中x_Q[i]是反量化输入信号152,其中(int)是取整函数,以及其中delta是在DZ-UTSQ102中使用的量化步长,以及其中rounding_dz=1-dz/2。
图5示出DZ-UTSQ 102方案,其中以delta对缩放进行标准化。死区通常大于步长为1的标准化单元(cell)大小。1.25的死区对大部分频率变换音频样本是良好估计。在信号较吵的情况下其可被降低,而当为更高的音调时其可被增大。
本发明的实施例定义了误差x[i]-x_q[i]的较佳量化改善。因为残余编码没有被熵限制,在残余量化Qr中没有采用额外的死区。此外,假设第一量化阶段102的量化误差的分布在由重构电平(reconstruction level)限定的量化单元170的左部分及右部分中是均匀的。此为高比率假设,即新的量化单元的大小被视为足够小以舍弃单元中的非均匀分布的误差。此假设对大部分目标比特率有效。
存在两种主要情况:使用非零值对样本进行量化以及使用零值对样本进行量化。
对于非零量化值,对每个样本的残余量化Qr可分配1个比特,并定义两个相对重构电平fac_m与fac_p:
fac_p=0.5-rounding_dz*0.5=0.25*(dz)
fac_m=0.5*rounding_dz=0.5*(1-0.5*dz)
因此,fac_p可表示为了得到两个改善的反量化电平174、176的第一个改善的反量化电平174而反量化电平(或重构电平)172的标准化绝对值待被增加的标准化绝对值。其中fac_m表示为了得到两个改善的反量化电平174、176的第二个改善的反量化电平176而反量化电平172的标准化绝对值待被减少的标准化绝对值,其中dz是死区的标准化宽度,如将从图6变得清楚。
图6示出用于1的重构电平172的两个相对(或改善的)重构电平174、176。使用1比特的额外比特,可以使用1-fac-m(导致第二个改善的反量化电平176)或使用1+fac_p(导致第一个改善的反量化电平174)对重构电平172进行改善。原始单元被分割为两个非均匀的单元。由于Q(第一量化阶段102的量化功能)的量化误差被假设为在新的单元中是均匀分布的,残余量化Qr关于R-D性能是较佳的。请注意,量化Q以及残余量化Qr形成嵌入的量化,即分配至残余量化Qr的比特可以被舍弃且仍可执行Q-1。
残余量化阶段106执行的残余量化Qr可以被概括为:
Figure BDA0001250805030000081
其中prm是残余量化阶段106使用量化残余值生成的比特流,其中x[i]是输入信号,其中x_Q[i]是反量化输入信号,其中n为对于由Qr改善的每个非零量化值以1步增的索引,以及其中i为对于每个得到的量化值以1步增的索引。
然后,反Qr可表示为:
if(x_Q[i]>0&n<Nbits)then
Figure BDA0001250805030000082
else if(n<Nfhits)then
Figure BDA0001250805030000083
可看到仅对于前Nbits个比特执行反Qr。即编码器可生成比编码器或解码器将实际解码的更多比特。当比特的剩余数量被估计且当编码器侧的本地合成需被生成时使用此机制。尽管解码器可能根据比特流中实际剩余的可用比特来解码更多或更少的比特,在编码器处生成预期的重构信号。
可选地,对于每个样本可将多于1个比特分配至Qr。利用相同原则,可以针对2次幂比特的Qr重构电平定义较佳重构电平。
对于零量化值,残余量化Qr可被分配以多于1个比特。原因是,出于感知原因,其要求以零作为重构电平。其避免了例如在静默期间创造人为的有噪信号。可使用特别的3个电平可变长度编码:
0:编码零
10:负的重构电平
11:正的重构电平
计算新的相对重构电平,fac_z:
fac_z=dz/3
因此,fac_z可表示为了得到两个改善的反量化电平174、176的第一个改善的反量化电平174而反量化电平172的标准化绝对值待被增加的标准化绝对值,以及为了得到两个改善的反量化电平174、176的第二个改善的反量化电平176而反量化电平的标准化绝对值待被减少的标准化绝对值,其中dz是死区的标准化宽度,如从图7将更变得清楚。
图7显示对于零量化值142由残余量化阶段106执行的残余量化Qr。零附近的单元被分在三个均匀的新的单元中。
对于零量化值由残余量化阶段106执行的残余量化Qr可概括为:
Figure BDA0001250805030000091
tf prm[n]==1then
Figure BDA0001250805030000092
其中C取决于量化阶段的死区并可被计算为C=delta*(fac_z/2),其中prm是由残余量化阶段106使用量化残余值生成的比特流,其中x[i]是输入信号,其中x_Q[i]是反量化输入信号。索引n对于被再量化至零的每个零量化值以1步增,其中n对于被再量化为非零值的每个零量化值以2步增。
反Qr可然后表示为:
if(n<Nfnits)then
Figure BDA0001250805030000093
利用如下假设可容易地扩展本发明的实施例:原始量化单元中的分布不是均匀的。在此情况下,可根据量化误差的分布得出相对重构电平。实现此的方法是将原始量化单元分割为非均匀的新的较小单元。也可以使用第二死区参数。
以下将简要地描述编码器100以及解码器120的其他实施例。
首先,描述编码器100。
残余量化是改善第一SQ阶段(或量化阶段102)的改善量化层。其利用最后未使用的比特,即未使用的比特=target_bits-nbbits,其中nbbits是由熵编码器104所消耗的比特的数量。残余量化采用贪心法策略和无熵,以在每当比特流达到期望大小时停止编码。
改善包含每线地对量化谱线进行再量化。首先,非零量化线使用1比特残余量化器来处理:
Figure BDA0001250805030000101
write_bit(0)
else then
write_bit(1)
因此,X[k]是输入信号140的缩放样本,
Figure BDA0001250805030000102
是反量化输入信号152的对应的缩放样本。
最后,如果剩余比特允许,零量化线被考虑并使用3个电平来量化,如下:
fac_z=(1-rounding_dz)·0.66
Figure BDA0001250805030000103
write_bit(0)
else then
write_bit(1)
write_bit((1+sgn(X[k]))/2)
因此,X[k]是输入信号140的缩放样本
Figure BDA0001250805030000104
是反量化输入信号152的对应的缩放样本,fac_z可表示为了得到两个改善的反量化电平174、176的第一个改善的反量化电平174而反量化电平172的标准化绝对值待被增加的标准化绝对值,以及为了得到两个改善的反量化电平174、176的第二个改善的反量化电平176而反量化电平的标准化绝对值待被减少的标准化绝对值,其中rounding_dz=1-dz/2。
然后,描述解码器120。
剩余比特改善非零解码线。对于每非零谱值读取1比特:
fac_p=(1-rounding_dz)/2
fac_m=rounding_dz/2
if(read_bit()==0)then
Figure BDA0001250805030000105
else then
Figure BDA0001250805030000106
因此,X[k]是输入信号140,
Figure BDA0001250805030000107
是反量化输入信号152,fac_p可表示为了得到两个改善的反量化电平174、176的第一个改善的反量化电平174而反量化电平(或重构电平)172的标准化绝对值待被增加的标准化绝对值,以及fac_m可表示为了得到两个改善的反量化电平174、176的第二个改善的反量化电平176而反量化电平172的标准化绝对值待被减少的标准化绝对值,其中rounding_dz=1-dz/2。
如果至少2个比特被留下以读取,将零值改善为:
fac_z=(1-rounding_dz)·0.66
if(read_bit()==0)then
Figure BDA0001250805030000111
else then
if(read_bit()==0)then
Figure BDA0001250805030000112
else then
Figure BDA0001250805030000113
因此,X[k]是输入信号140的缩放样本
Figure BDA0001250805030000114
是反量化输入信号152的对应的缩放样本,fac_z可表示为了得到两个改善的反量化电平174、176的第一个改善的反量化电平174而反量化电平172的标准化绝对值待被增加的标准化绝对值,以及为了得到两个改善的反量化电平174、176的第二个改善的反量化电平176而反量化电平的标准化绝对值待被减少的标准化绝对值,其中rounding_dz=1-dz/2。
图8显示根据实施例的用于编码的方法200的流程图。该方法200包括:步骤202,使用死区对输入信号进行量化,以得到多个量化值;步骤204,使用熵编码方案编码多个量化值,以得到多个熵编码值;步骤206,根据量化阶段的死区,对由量化阶段的量化所造成的残余信号进行量化并确定多个量化残余值;以及步骤208,从多个熵编码值与多个量化残余值形成比特流。
图9显示根据实施例的用于解码的方法220的流程图。该方法220包括:步骤222,对编码信号进行解析,以得到多个熵编码值与量化残余值;步骤224,使用熵解码方案解码多个熵编码值,以得到多个量化值;步骤226,使用死区对多个量化值进行反量化,以得到输出信号;以及步骤228,根据死区及量化残余值改善用于得到输出信号的反量化电平。
虽然在装置的上下文中已经描述一些方面,显然,这些方面也表示对应方法的描述,其中模块或装置对应方法步骤或方法步骤的特征。类似的,在方法步骤的上下文中描述的方面也表示对应模块或项目或对应装置的特征的描述。一些或全部的方法步骤也可通过(或使用)硬件装置执行,例例如微处理器、可编程计算机或电子电路。在一些实施例中,可通过此装置执行一些或大多数最重要的方法步骤。
根据特定的实施需求,本发明的实施例可在硬件或软件中实施。可使用其上存储有电子可读取控制信号的数字存储介质,例如软盘、DVD、蓝光光盘、CD、ROM、PROM、EPROM、EEPROM或闪存,执行此实施,这些电子可读控制信号可以与可编程计算机系统协同操作(或能够协同操作),以使得执行各个方法。因此,数字存储介质可以是计算机可读取的。
根据本发明的一些实施例包括具有电子可读取控制信号的数据载体,电子可读取控制信号能够与可编程计算机系统协同运作,以执行所述方法的一个。
通常,本发明实施例可被实施为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,可运作程序代码以执行方法的一个。程序代码可例如存储在机器可读取载体上。
其他实施例包括用于执行所述方法的一个的计算机程序,其被存储在机器可读取载体上。
换言之,因此,本发明方法的实施例为具有程序代码的计算机程序,当计算机程序在计算机上运行时,该程序代码用于执行本文中所描述的方法中的一个。
因此,本发明方法的另一实施例为数据载体(或数字存储介质,或计算机可读介质),该数据载体包括记录于其上的用于执行本文中所描述的方法中的一个的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非易失性的。
因此,本发明方法的另一实施例是表示用于执行本文中所描述的方法中的一个的计算机程序的数据流或信号序列。数据流或信号序列可(例如)被配置为经由数据通信连接(例如,经由因特网)被传送。
另一实施例包括处理构件,例如,用于或适于执行本文中所描述的方法中的一个的计算机或可编程逻辑设备。
另一实施例包括计算机,其上安装有用于执行本文中所描述的方法中的一个的计算机程序。
根据本发明的另一个实施例包括被配置为向接收器发送用于执行本文所述的方法中的至少一个的计算机程序的设备或系统。例如,传输可以是电子的或光学的。接收器可(例如)为计算机、移动设备、内存设备或类似。装置或系统可(例如)包括用于将计算机程序传送至接收器的文件服务器。
在一些实施例中,可编程逻辑设备(例如,现场可编程门阵列,FPGA)可用以执行本文中所描述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可与微处理器协作,以便执行本文中所描述方法中的一个。通常,优选地由任何硬件装置执行方法。
上文所描述的实施例仅说明本发明的原理。应理解的是,本文中所描述的配置及细节的变形及变化对本领域技术人员是显而易见的。因此,其意图在于仅由待决权利要求的范围限制,而非由通过本文中实施例的描述及解释所呈现的特定细节限制。

Claims (13)

1.一种编码器(100),包括:
量化阶段(102),用于使用死区对输入信号(140)进行量化以得到多个量化值(142);
熵编码器(104),用于使用熵编码方案对所述多个量化值(142)进行编码以得到多个熵编码值(144);
残余量化阶段(106),用于对由所述量化阶段(102)造成的残余信号进行量化,其中所述残余量化阶段(106)用于根据所述量化阶段(102)的死区为非零量化值确定至少一个量化残余值(146)和残余量化单元的宽度;以及
编码信号形成器(108),用于从所述多个熵编码值(144)及所述至少一个量化残余值(146)形成编码信号(148);
其中所述编码信号形成器(108)用于通过将所述至少一个量化残余值(146)或多个量化残余值(146)附加至所述多个熵编码值(144)形成所述编码信号(148),直到所述编码信号(148)包括可用于传输至解码器的最大可用长度;
其中所述至少一个量化残余值(146)未被熵编码,以在每当所述编码信号(148)包括所述可用于传输至解码器的最大可用长度时停止编码;
其中所述残余量化阶段(106)用于通过以下方式每线地对量化谱线进行再量化:
首先,确定所述至少一个量化残余值(146),使得所述量化残余值(146)包括用于非零量化值的1个比特,其中所述残余量化阶段(106)用于基于以下语法确定所述量化残余值(146)
Figure FDA0002793575000000011
其中prm为所述残余量化阶段(106)使用所述量化残余值(146)生成的比特流,其中x[i]为所述输入信号(140),其中x_Q[i]为反量化输入信号(152),其中n为对于每个非零量化值以1步增的索引,其中i为对于每个得到的量化值(142)以1步增的索引;以及
其次,如果剩余比特允许,确定所述量化残余值(146),使得所述量化残余值(146)包括用于零量化值的2个比特,其中所述残余量化阶段(106)用于基于以下语法确定所述量化残余值(146)
Figure FDA0002793575000000021
if prm[n]==1 then
Figure FDA0002793575000000022
其中C取决于所述量化阶段(102)的死区,其中prm为所述残余量化阶段(106)使用所述量化残余值(146)生成的比特流,其中x[i]为所述输入信号(140),其中x_Q[i]为反量化输入信号(152),其中n为对于被再量化为零量化值的每个零量化值以1步增而对于被再量化为非零量化值的每个零量化值以2步增的索引,其中i为对于每个得到的量化值(142)以1步增的索引。
2.根据权利要求1所述的编码器(100),其中所述残余量化阶段(106)包括:
反量化器(160),用于根据所述量化阶段(102)的死区对多个量化值(112)进行反量化以得到反量化输入信号(152);
其中所述残余量化阶段(106)用于确定所述至少一个量化残余值(146),以使得量化残余值(146)包括用于非零量化值的1个比特;以及
其中所述残余量化阶段(106)用于在对于所述非零量化值所述输入信号(140)小于所述反量化输入信号(152)时,为所述非零量化值确定所述量化残余值(146)包括逻辑0,否则,为所述非零量化值确定所述量化残余值(146)包括逻辑1。
3.根据权利要求1或权利要求2所述的编码器(100),其中所述残余量化阶段(106)包括:
反量化器(160),用于根据所述死区对所述多个量化值(142)进行反量化以得到反量化输入信号(152);以及
比较器(162),用于比较所述输入信号(140)与所述反量化输入信号(152)。
4.根据权利要求3所述的编码器(100),其中所述比较器(162)用于比较所述输入信号(140)与所述反量化输入信号(152),以得到残余信号(154);
其中所述残余量化阶段(106)用于根据所述死区对所述残余信号(154)进行量化。
5.根据权利要求4所述的编码器(100),其中所述残余量化阶段(106)用于确定所述至少一个量化残余值(146),使得所述量化残余值(146)包括用于所述非零量化值的1个比特;以及
其中所述残余量化阶段用于在对于所述非零量化值所述残余信号(154)为负时,为所述非零量化值确定所述量化残余值(146)包括逻辑0,否则,为所述非零量化值确定所述量化残余值(146)包括逻辑1。
6.根据权利要求1或权利要求2所述的编码器(100),其中所述编码信号形成器(108)用于提供比特流作为所述编码信号(148),所述编码信号形成器(108)用于从所述多个熵编码值(144)以及所述多个量化残余值(146)形成所述比特流,其中所述编码信号形成器(108)用于将量化残余值(146)附加至熵编码值(144),其中所述残余量化阶段(106)包括:
残余量化器(106’);以及
调节器(164),用于控制所述残余量化器(106’)根据在所述量化阶段(102)中被用来得到所述多个量化值(142)的死区的宽度对残余信号进行量化;
其中所述调节器(164)用于得到一定数量的目标比特与一定数量的消耗比特;以及
其中所述调节器(164)用于当所述比特流包括所述一定数量的目标比特时控制所述残余量化阶段停止确定量化残余值。
7.一种解码器(120),包括:
编码信号解析器(122),用于对编码信号(148)进行解析以得到多个熵编码值(144)及至少一个量化残余值(146);
熵解码器(124),用于使用熵解码方案对所述多个熵编码值(144)进行解码以得到多个量化值(142);以及
反量化阶段(126),用于对所述多个量化值(142)进行反量化以得到输出信号(150);
其中所述反量化阶段(126)用于根据量化残余值(146)改善用于得到所述输出信号(150)的反量化电平(172);
其中所述反量化阶段(126)用于根据量化残余值(146)及死区的宽度,为非零量化值改善所述反量化电平(172);
其中所述反量化阶段(126)用于通过根据所述死区确定改善的反量化电平(174、176)来改善所述反量化电平(172);
其中所述反量化阶段(126)用于为非零量化值确定两个改善的反量化电平(174,176),其中所述反量化阶段(126)用于通过使用通过量化残余值指示的两个改善的反量化电平(174,176)中的一个来得到输出信号(150);
其中所述反量化阶段(126)用于基于以下两个因子,为非零量化值确定所述两个改善的反量化电平(174、176):
fac_p=0,25*dz
fac_m=0,5*(1-0,5*dz)
其中fac_p指示为了得到所述两个改善的反量化电平中的第一个(174)而所述反量化电平(172)的标准化绝对值待被增加的标准化绝对值,其中fac_m指示为了得到所述两个改善的反量化电平中的第二个(176)而所述反量化电平(172)的标准化绝对值待被减少的标准化绝对值,其中dz为所述死区的标准化宽度;
其中所述反量化阶段(126)用于为零量化值确定两个改善的反量化电平(174、176),其中所述反量化阶段(126)用于通过使用由量化残余值指示的两个改善的反量化电平(174、176)以及所述反量化电平(172)中的一个而得到所述输出信号(150);
所述反量化阶段(126)用于基于以下因子为零量化值确定所述两个改善的反量化电平(174、176):
fac_z=dz/3
其中fac_z指示为了得到所述两个改善的反量化电平中的第一个(174)而所述反量化电平(172)的标准化绝对值待被增加的标准化绝对值,以及为了得到所述两个改善的反量化电平中的第二个(176)而所述反量化电平(172)的标准化绝对值待被减少的标准化绝对值,其中dz为所述死区的标准化宽度。
8.根据权利要求7所述的解码器(120),其中所述反量化阶段(126)用于通过将所述反量化电平(172)的标准化绝对值增加增值,以得到所述两个改善的反量化电平中的第一个(174);
其中所述反量化阶段(126)用于通过将所述反量化电平(172)的标准化绝对值减少减值,以得到所述两个改善的反量化电平中的第二个(174);以及
其中所述增值与所述减值彼此不同。
9.根据权利要求7-8中任一项所述的解码器(120),其中所述反量化阶段(126)用于通过将所述反量化电平(172)的标准化绝对值增加增值,以得到所述两个改善的反量化电平中的第一个(174);
其中所述反量化阶段(126)用于通过将所述反量化电平(172)的标准化绝对值减少减值,以得到所述两个改善的反量化电平中的第二个(174)。
10.一种系统,包括:
根据权利要求1-6中任一项所述的编码器(100);以及
根据权利要求7-9中所述的解码器(120)。
11.一种用于编码的方法(200),所述方法包括:
使用死区,对输入信号进行量化(202),以得到多个量化值;
使用熵编码方案,对所述多个量化值进行编码(204),以得到多个熵编码值;
对由对所述输入信号进行量化(202)造成的残余信号进行量化(206),其中对所述残余信号进行量化(206)包括根据所述死区,为非零量化值确定至少一个量化残余值和残余量化单元的宽度;以及
从所述多个熵编码值及所述至少一个量化残余值形成(208)比特流;
其中形成(208)所述比特流包括将所述至少一个量化残余值(146)或多个量化残余值(146)附加至所述多个熵编码值(144)直到所述比特流包括可用于传输至解码器的最大可用长度;
其中所述至少一个量化残余值(146)未被熵编码,以在每当所述比特流包括所述可用于传输至解码器的最大可用长度时停止编码;
其中对所述残余信号进行量化(206)是通过以下方式每线地对量化谱线进行再量化:
首先,确定所述至少一个量化残余值(146),使得所述量化残余值(146)包括用于非零量化值的1个比特,其中对所述残余信号进行量化(206)是基于以下语法确定所述量化残余值(146)
Figure FDA0002793575000000051
其中prm为在对所述残余信号进行量化(206)时使用所述量化残余值(146)生成的比特流,其中x[i]为所述输入信号(140),其中x_Q[i]为反量化输入信号(152),其中n为对于每个非零量化值以1步增的索引,其中i为对于每个得到的量化值(142)以1步增的索引;以及
其次,如果剩余比特允许,确定所述量化残余值(146),使得所述量化残余值(146)包括用于零量化值的2个比特,其中对所述残余信号进行量化(206)是基于以下语法确定所述量化残余值(146)
Figure FDA0002793575000000052
if prm[n]==1 then
Figure FDA0002793575000000053
其中C取决于所述死区,其中prm为在对所述残余信号进行量化(206)时使用所述量化残余值(146)生成的比特流,其中x[i]为所述输入信号(140),其中x_Q[i]为反量化输入信号(152),其中n为对于被再量化为零量化值的每个零量化值以1步增而对于被再量化为非零量化值的每个零量化值以2步增的索引,其中i为对于每个得到的量化值(142)以1步增的索引。
12.一种用于解码的方法(220),所述方法包括:
对编码信号进行解析(222),以得到多个熵编码值与量化残余值;
使用熵解码方案,对所述多个熵编码值进行解码(224),以得到多个量化值;
对所述多个量化值进行反量化(226),以得到输出信号;以及
根据死区的宽度与量化残余值,改善(228)用于得到所述输出信号的反量化电平;
其中改善(228)所述反量化电平包括根据所述量化残余值(146)和所述死区的宽度,为非零量化值改善反量化电平(172);
其中改善(228)所述反量化电平包括通过根据所述死区确定改善的反量化电平(174、176)来改善所述反量化电平(172);
其中改善(228)所述反量化电平包括为非零量化值确定两个改善的反量化电平(174,176),其中对所述多个量化值进行反量化(226)是通过使用通过量化残余值指示的两个改善的反量化电平(174,176)中的一个来得到输出信号(150);
其中改善(228)所述反量化电平包括基于以下两个因子,为非零量化值确定所述两个改善的反量化电平(174、176):
fac_p=0,25*dz
fac_m=0,5*(1-0,5*dz)
其中fac_p指示为了得到所述两个改善的反量化电平中的第一个(174)而所述反量化电平(172)的标准化绝对值待被增加的标准化绝对值,其中fac_m指示为了得到所述两个改善的反量化电平中的第二个(176)而所述反量化电平(172)的标准化绝对值待被减少的标准化绝对值,其中dz为所述死区的标准化宽度;
其中改善(228)所述反量化电平包括为零量化值确定所述两个改善的反量化电平(174、176),其中对所述多个量化值进行反量化(226)是通过使用由量化残余值指示的两个改善的反量化电平(174、176)以及所述反量化电平(172)中的一个而得到所述输出信号(150);
其中改善(228)所述反量化电平包括基于以下因子为零量化值确定所述两个改善的反量化电平(174、176):
fac_z=dz/3
其中fac_z指示为了得到所述两个改善的反量化电平中的第一个(174)而所述反量化电平(172)的标准化绝对值待被增加的标准化绝对值,以及为了得到所述两个改善的反量化电平中的第二个(176)而所述反量化电平(172)的标准化绝对值待被减少的标准化绝对值,其中dz为所述死区的标准化宽度。
13.一种计算机可读介质,包括当被计算机或信号处理器执行时实现根据权利要求11或12所述的方法的计算机可读指令。
CN201580050928.3A 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法 Active CN107079152B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110277333.9A CN112954323A (zh) 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14178780.4 2014-07-28
EP14178780.4A EP2980793A1 (en) 2014-07-28 2014-07-28 Encoder, decoder, system and methods for encoding and decoding
PCT/EP2015/067001 WO2016016122A1 (en) 2014-07-28 2015-07-24 Encoder, decoder, system and methods for encoding and decoding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110277333.9A Division CN112954323A (zh) 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法

Publications (2)

Publication Number Publication Date
CN107079152A CN107079152A (zh) 2017-08-18
CN107079152B true CN107079152B (zh) 2021-04-02

Family

ID=51224867

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110277333.9A Pending CN112954323A (zh) 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法
CN201580050928.3A Active CN107079152B (zh) 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202110277333.9A Pending CN112954323A (zh) 2014-07-28 2015-07-24 编码器、解码器、用于编码及解码的系统及方法

Country Status (19)

Country Link
US (3) US10375394B2 (zh)
EP (2) EP2980793A1 (zh)
JP (4) JP6494741B2 (zh)
KR (3) KR102014295B1 (zh)
CN (2) CN112954323A (zh)
AR (1) AR101547A1 (zh)
AU (2) AU2015295604B2 (zh)
CA (1) CA2956011C (zh)
ES (1) ES2688103T3 (zh)
MX (1) MX366803B (zh)
MY (1) MY178527A (zh)
PL (1) PL3175450T3 (zh)
PT (1) PT3175450T (zh)
RU (1) RU2678168C2 (zh)
SG (1) SG11201700695TA (zh)
TR (1) TR201815373T4 (zh)
TW (1) TWI582757B (zh)
WO (1) WO2016016122A1 (zh)
ZA (1) ZA201700513B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980793A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding
KR20230085229A (ko) * 2018-03-29 2023-06-13 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 종속 양자화
KR20230058546A (ko) * 2018-04-05 2023-05-03 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 컴포트 노이즈 생성 지원
MX2021003343A (es) 2018-09-24 2021-07-02 Fraunhofer Ges Forschung Codificación eficiente de coeficientes de transformacion usando o adecuada para una combinación con cuantización escalar dependiente.
CN113302688A (zh) * 2019-01-13 2021-08-24 华为技术有限公司 高分辨率音频编解码
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN114521327A (zh) * 2019-07-05 2022-05-20 威诺瓦国际有限公司 视频译码中的残差的量化
US10984808B2 (en) * 2019-07-09 2021-04-20 Blackberry Limited Method for multi-stage compression in sub-band processing
US11095311B2 (en) * 2019-11-27 2021-08-17 Qualcomm Incorporated Quantization codeword selection for low cost parity checking

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007011160A1 (en) * 2005-07-19 2007-01-25 Electronics And Telecommunications Research Institute Apparatus and method of embedded quantizaton for the improved snr scalbilty
WO2008151410A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for noise shaping in a multilayer embedded codec interoperable with the itu-t g.711 standard

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501521B2 (ja) * 1994-11-07 2004-03-02 三菱電機株式会社 ディジタル映像信号再生装置および再生方法
JPH09324397A (ja) 1996-06-03 1997-12-16 Mitsubishi Paper Mills Ltd たばこ用巻紙およびその製造方法
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
JP4300800B2 (ja) * 2000-12-22 2009-07-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
WO2003073741A2 (en) * 2002-02-21 2003-09-04 The Regents Of The University Of California Scalable compression of audio and other signals
EP1465349A1 (en) * 2003-03-31 2004-10-06 Interuniversitair Microelektronica Centrum Vzw Embedded multiple description scalar quantizers for progressive image transmission
JP4014098B2 (ja) * 2003-06-26 2007-11-28 株式会社Kddi研究所 画像の階層的符号化装置および復号装置
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7738554B2 (en) * 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
KR101320260B1 (ko) 2004-06-18 2013-10-23 톰슨 라이센싱 비디오 신호 데이터를 인코딩 및 디코딩하기 위한 방법 및 장치
US7836506B2 (en) 2004-09-22 2010-11-16 Cyberdefender Corporation Threat protection network
WO2006047795A1 (en) * 2004-10-27 2006-05-04 Geoffrey Charles Wolf Sealable container for drinking and temporarily sealing bottles
WO2006108736A1 (fr) * 2005-04-11 2006-10-19 France Telecom Procédé et dispositif de quantification progressive, procédé et dispositif de quantification inverse, programmes informatiques, signal et support de données correspondants
KR100785855B1 (ko) * 2005-07-19 2007-12-14 한국전자통신연구원 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법
US20070147497A1 (en) * 2005-07-21 2007-06-28 Nokia Corporation System and method for progressive quantization for scalable image and video coding
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
JPWO2008047795A1 (ja) * 2006-10-17 2010-02-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
WO2008046492A1 (en) * 2006-10-20 2008-04-24 Dolby Sweden Ab Apparatus and method for encoding an information signal
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8902972B2 (en) * 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
ATE539433T1 (de) * 2008-07-11 2012-01-15 Fraunhofer Ges Forschung Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
US8326075B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
EP2396969A4 (en) * 2009-02-13 2012-12-12 Research In Motion Ltd MODIFIED ENTROPIC CODING FOR IMAGES AND VIDEOS
CN101710990A (zh) 2009-11-10 2010-05-19 华为技术有限公司 视频图像编码处理、解码处理方法和装置及编解码系统
FR2960335A1 (fr) * 2010-05-18 2011-11-25 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US9118918B2 (en) * 2012-03-06 2015-08-25 National Taiwan University Method for rate-distortion optimized transform and quantization through a closed-form operation
EP2867892B1 (en) * 2012-06-28 2017-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based audio coding using improved probability distribution estimation
US20140010277A1 (en) * 2012-07-09 2014-01-09 Qualcomm, Incorporated Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id
US9549182B2 (en) * 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US9264713B2 (en) * 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
US9648318B2 (en) * 2012-09-30 2017-05-09 Qualcomm Incorporated Performing residual prediction in video coding
US9661340B2 (en) * 2012-10-22 2017-05-23 Microsoft Technology Licensing, Llc Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats
US10390034B2 (en) * 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US9877035B2 (en) * 2014-03-17 2018-01-23 Qualcomm Incorporated Quantization processes for residue differential pulse code modulation
EP2980793A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007011160A1 (en) * 2005-07-19 2007-01-25 Electronics And Telecommunications Research Institute Apparatus and method of embedded quantizaton for the improved snr scalbilty
WO2008151410A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for noise shaping in a multilayer embedded codec interoperable with the itu-t g.711 standard

Also Published As

Publication number Publication date
CA2956011C (en) 2019-06-18
AU2015295604A1 (en) 2017-02-16
US20190313100A1 (en) 2019-10-10
RU2017104514A3 (zh) 2018-08-30
JP2023169294A (ja) 2023-11-29
KR102014295B1 (ko) 2019-08-26
US20170142412A1 (en) 2017-05-18
RU2678168C2 (ru) 2019-01-23
JP2017530585A (ja) 2017-10-12
EP3175450A1 (en) 2017-06-07
CA2956011A1 (en) 2016-02-04
TWI582757B (zh) 2017-05-11
US20200344476A1 (en) 2020-10-29
WO2016016122A1 (en) 2016-02-04
EP2980793A1 (en) 2016-02-03
ES2688103T3 (es) 2018-10-30
RU2017104514A (ru) 2018-08-30
JP6892467B2 (ja) 2021-06-23
KR20170041778A (ko) 2017-04-17
CN107079152A (zh) 2017-08-18
JP2021153305A (ja) 2021-09-30
JP6494741B2 (ja) 2019-04-03
PL3175450T3 (pl) 2019-01-31
KR102512937B1 (ko) 2023-03-22
AR101547A1 (es) 2016-12-28
AU2015295604B2 (en) 2018-09-20
TR201815373T4 (tr) 2018-11-21
KR20210144939A (ko) 2021-11-30
EP3175450B1 (en) 2018-07-18
TW201618084A (zh) 2016-05-16
KR20190101483A (ko) 2019-08-30
JP2019165439A (ja) 2019-09-26
MX2017001238A (es) 2017-03-14
MX366803B (es) 2019-07-25
PT3175450T (pt) 2018-10-22
US10735734B2 (en) 2020-08-04
AU2018260836B2 (en) 2020-11-05
ZA201700513B (en) 2019-05-29
AU2018260836A1 (en) 2018-11-22
CN112954323A (zh) 2021-06-11
MY178527A (en) 2020-10-15
SG11201700695TA (en) 2017-02-27
BR112017001518A2 (pt) 2018-01-30
US10375394B2 (en) 2019-08-06

Similar Documents

Publication Publication Date Title
CN107079152B (zh) 编码器、解码器、用于编码及解码的系统及方法
AU2014295314B2 (en) Context-based entropy coding of sample values of a spectral envelope
JP6734394B2 (ja) 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム
KR102069493B1 (ko) 고급 양자화기
US11315583B2 (en) Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant