CN103329522A - 用于使用字典编码视频的方法 - Google Patents

用于使用字典编码视频的方法 Download PDF

Info

Publication number
CN103329522A
CN103329522A CN2011800627883A CN201180062788A CN103329522A CN 103329522 A CN103329522 A CN 103329522A CN 2011800627883 A CN2011800627883 A CN 2011800627883A CN 201180062788 A CN201180062788 A CN 201180062788A CN 103329522 A CN103329522 A CN 103329522A
Authority
CN
China
Prior art keywords
dictionary
video
group
signal
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800627883A
Other languages
English (en)
Other versions
CN103329522B (zh
Inventor
R·A·科恩
J·康
安东尼·韦特罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN103329522A publication Critical patent/CN103329522A/zh
Application granted granted Critical
Publication of CN103329522B publication Critical patent/CN103329522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

通过保持从解码的预测残差信号生成的字典的组来解码被编码为比特流的视频,其中,所述字典的组的元素具有关联的索引。当前的宏块被熵解码并且被逆量化以产生解码系数。对于当前宏块,根据比特流中信令的复制模式选择字典的组的特定字典,并且根据比特流中的复制模式信号和关联的索引来选择特定字典的特定元素。使用解码的系数对特定元素进行缩放和组合,以重构当前解码的宏块预测残差信号。然后,当前解码的宏块预测残差信号被与之前解码的宏块组合以生成重构的视频的输出宏块,其中,在解码器中执行上述步骤。

Description

用于使用字典编码视频的方法
技术领域
本发明一般地涉及视频编码和解码,并且更具体地涉及用于使用字典编码视频的方法。
背景技术
视频编码联合协作组(JCT-VC)已经开始了视频编码标准项目(即,高效视频编码(HEVC))。该标准的一个目的在于在更广泛的应用和更宽的比特范围内相对于较旧的H.264/AVC标准改进编码性能。HEVC视频编码标准的初始框架并没有显著不同于之前的视频编码标准(例如,在基于块的预测技术、2D离散余弦变换(DCT)变换和基于上下文的熵编码中)。新的编码工具更先进并且更灵活,但是增加了计算复杂性。与传统的编码技术相同的是,编码器和解码器对于视频的帧的序列进行操作。视频中的帧被划分到像素的宏块中。宏块能够在帧内空间地相邻(帧内模式编码的情况),并且在连续地帧中在时间上相邻(帧间模式编码的情况)。
正交和双正交完备字典(例如,DCT或小波)已经用于图像和视频编码中的主要变换域表示。超完备字典上的信号的稀疏和冗余表示已经成功地应用于各种应用(例如,图像降噪)。
与传统的视频编码标准相比,超完备视频编码技术能够以非常低的比特率实现有竞争力的编码增益。基本来说,基于块的2-D DCT变换被超完备视频编码中的更大和更适合的基函数的扩展所替代。在较低的比特率视频编码的情况下,由于较大的量化参数(QP),使得利用较少的非零DCT系数表示残差信号,并且因此在宏块中仅出现了低频分量。在该情况下,超完备字典的组能够提供比字典的完备组更多种且更可靠的残差信号的表示。因此,能够利用更少的系数来更好地近似残差信号。
传统的超完备视频编码利用调制伽柏函数来构造字典组。匹配追踪(MP)用于选择表示中的最适合的字典元素。MP确定用于稀疏信号表示的次优解决方案。能够通过将由诸如小波、曲线波和离散傅立叶变换(DFT)的多种分析函数生成的字典连接在一起来改变字典的组。曲线波是小波概念的扩展。曲线波使用非适应性技术用于多尺度对象表示。小波通过使用表示位置和空间频率两者的基底来一般化傅立叶变换。对于2D或3D信号来说,方向性小波变换使用也在取向上局域化的基函数。曲线波变换与其它方向性小波变换的不同之处在于取向上的局域化的程度随着尺度变化。
然而,除了其简单性之外,这些模型具有缺点。自然图像或视频常常包含没有很好地由这些模型表示的特征。在这些情况下,较差的重构或诸如振铃的缺陷会引入到解码图像或视频中。
由于残差信号趋于在预测之后具有方向性取向,因此能够使用字典训练。因此,能够通过反映残差信号的特性而很好地设计字典的组。依赖于模式的方向性变换能够用于帧内编码。完备字典能够使用对应于方向性预测的帧内预测残差来构造。字典训练也能够适合图像编码应用中的帧内预测。
发明内容
本发明的实施方式提供了一种用于使用字典的组编码和解码视频的方法。使用采样来训练该字典组,其中,采样是帧间或帧内预测残差信号。字典元素的组也能够用于相邻宏块。使用率失真优化来确定字典元素的最优数目。
本发明的效果
本发明提供了基于上下文适应性超完备字典的基于字典的视频编码技术。我们使用帧间和/或帧内预测残差采样来训练字典的组,并且将字典应用于稀疏信号表示。字典元素可以再次用于编码后续采样。
附图说明
图1是现有技术的编码器的框图;
图2是根据本发明的实施方式的编码器的框图;以及
图3是根据本发明的实施方式的构造超完备字典的处理的示意图;以及
图4是现有技术的解码器的框图;
图5是根据本发明的实施方式的解码器的框图;以及
图6是根据本发明的实施方式的复制模式评估器的框图。
具体实施方式
信号
Figure BDA00003408879900033
能够表示为超完备字典
Figure BDA00003408879900034
中的m个元素的稀疏线性组合,其中,m充分大于n并且D是满秩矩阵。
当非零元素的数目大于基底中的非零元素的数目时,我们将字典定义为是超完备的。超完备实现了更稳定的且紧凑的表示。
我们利用最少数量的字典元素来近似信号y。根据下式来确定稀疏表示
min x | | x | | 0 s . t . | | y - Dx | | 2 ≤ δ , - - - ( 1 )
其中,
Figure BDA00003408879900035
是表示信号y的系数的矢量,|.|表示信号的lp规范,并且δ是小的预定阈值。
对字典进行训练以更好地适合采样数据。因此,等式(1)中的最小化问题能够被转换为获得针对用于信号y的表示的给定稀疏约束C的最佳字典,如
min x , D | | y - Dx | | 2 s . t . | | x | | 0 ≤ C , - - - ( 2 )
对字典进行训练以当非零系数的数目少于或等于C时提供实际信号的更好的表示。
如图3中所示,与传统的图像编码不同地,我们执行帧内或帧间预测,并且然后,对视频信号的残差数据采样451进行编码。分类器210生成针对上下文I和K的对应的训练221-222的上下文I211和上下文K212。如图3中所示,上下文K的字典231包含比用于上下文I的字典232的更随机元素更多的对角元素。对角元素对于帧间编码中的边缘表示来说是有用的。
因此,在本发明的一个实施方式中,在编码当前视频序列之前使用预测残差信号451训练字典。这样的训练通常使用单独的训练视频的组离线地完成。编码器和解码器都具有相同的字典的组,其通常对于视频序列的编码来说是固定的。
在本发明的另一实施方式中,在当前视频序列的编码和解码过程中使用预测残差信号451对字典进行训练。利用该实施方式,用于训练的数据包括与当前视频的之前解码的采样关联的预测残差信号,其在编码器和解码器处都是可用的。编码器和解码器都保持同样的字典组,但是字典是动态的,并且在视频序列的编码和解码处理期间周期性地更新。
字典训练能够忽略残差信号特性的局部变化,从训练数据的非常大的组产生字典元素的相对较小的组。因此,残差采样的一些显著特征会被从字典组中删除。为了解决该问题,我们在训练221-222字典时应用残差采样的上下文211-212。
分类器210能够随着残差采样的类型而变化。例如,在帧内编码残差中,我们假设残差采样具有特定特性,其在根据H.264/AVC标准的编码器/解码器中具有方向性帧内预测。因此,分别从对应于预测方向的采样451构造多个字典组。
在决定了针对给定宏块的帧内预测模式之后,分类器210用于指示使用哪个上下文211-212,并且然后,在编码过程中应用对应的字典。因此,在解码器中不要求任何额外方信息。在帧间编码残差信号中,分类器检查采样的能量并且将能量转发给对应的训练模块以生成我们的上下文适应字典。因此,通过在解码器中已经可用的数据来确定上下文。
基于字典的元素的视频编码
在从通用数据采样训练字典组之后,字典用于编码过程中的输入残差信号的稀疏表示。
图1示出了传统的编码器。输入为宏块301并且输出为比特流309。宏块被变换310、量化320为量化信号。量化信号被熵编码330以产生比特流309。熵编码器的输出在与输入宏块301组合时还被逆量化340、逆变换350并且用于帧内预测360。
传统的解码器
图4示出了传统的解码器。输入为比特流1451并且输出为宏块1457。比特流被熵解码1452并且被逆量化1453。解码后的变换系数被逆变换1454。帧内或帧间预测残差1455被组合1456以产生解码宏块。该宏块被输出并存储在缓冲器1456中以用于重构将来的解码宏块。
基于字典的编码器
图2示出了根据本发明的实施方式的编码器。能够在本领域中已知的连接到存储器和输入/输出接口的处理器中执行编码器的步骤。
编码器的输入是当前宏块301。用于视频的特定片段的字典被在进行视频的特定片段的编码之前使用预测残差信号451进行训练401。在量化320之前选择402字典元素(原子)中的最佳匹配基底。诸如匹配追踪(MP)的处理能够用于元素选择402。
复制模式评估器450输入有用于之前的块452的字典索引、预测残差信号451、字典指示器、字典元素索引和当使用其自己的字典元素(即,在没有使用复制模式评估器的情况下选择的元素)编码时的当前块的失真。评估器生成复制模式信号453,其依赖于评估是否使用之前计算的字典索引组的执行比使用新计算的字典索引的执行更好的率失真优化决定处理的结果。在图6中示出了复制模式评估器(CME)。
简要参考图6,CME的输入是用于之前编码块452的字典索引和用于当前块301的预测残差。特定字典(A-D)用于当前块以确定缩放系数402,并且然后确定重构的解码预测残差451,其被输入到R-D成本优化处理600以产生复制模式信号453。
继续图2,所选择的字典元素被逆量化340以产生逆量化信号,其被熵编码330以产生比特流309。从逆量化340信号重构403视频。重构的视频然后用于帧内预测360。
MP被已知为稀疏信号表示中的次优的易处理的方案。在本发明的优选实施方式中,我们使用MP来选择402字典中的适合的元素。在每个循环过程中,MP通过使得重构的视频的残差信号最小化来形成字典元素的线性组合。因此,要求包括系数值和指示哪些字典元素用于在解码器中重构信号的一个或更多索引的组。循环不超过等式2的稀疏约束C,并且当率失真(R-D)成本最小时终止,从而能够利用少于或等于稀疏约束的数目的非零系数来最优地表示信号。
在字典元素的选择402之后,系数被进行量化320和熵编码330。能够拟合拉普拉斯分布以绘制我们的方法所使用的字典的组的系数分布。因此,统一的量化器在效率方面对于本发明来说是适合的。
在熵编码器330中,基于缩放系数的统计经由霍夫曼表对缩放系数值进行二值化。字典索引的出现对于索引来说是基本上均匀的,因此,任何适应性或固定的扫描顺序不能够高效地收集非零系数。因此,利用其大小为
Figure BDA00003408879900051
的固定长度码来对索引进行编码,其中,m是字典元素的数目。
在也由解码器执行的重构403过程中,量化的缩放系数被用于字典元素的线性组合中的权重。所使用的字典元素的组由索引的组来表示。
除了上述处理之外,编码器还集成有复制模式评估器(CME)450。CME的输入是将进行编码的当前预测残差信号和用于编码之前编码块的字典指示器和元素索引的组。字典指示器指示哪个字典用于编码之前编码块,并且元素索引指示该字典内的哪些元素用于编码之前编码块。
然后,CME使用用于编码之前编码块的相同元素来对当前预测残差进行再编码。对于若干其它之前编码的块重复该处理。通常,检查与当前块相邻的块,例如,左侧的块、上面的块、左上的块以及右上的块。
比较针对所有情况生成的失真值与使用上述字典元素选择生成的失真。如果字典元素产生了最少的失真,则将字典元素索引和对应的缩放系数包括在输出的比特流中。
如果复制模式中的一个产生了最少的失真,则将复制模式信号和信令哪个复制模式最佳的指示符包括在比特流中。在使用复制模式的情况下,不需要在该时间点信令字典元素索引,这是因为当编码之前的块时已经发送了该索引。
基于字典的解码器
图5示出了根据本发明的实施方式的解码器。输入为编码视频比特流501并且输出为解码宏块509。比特流中的每个当前宏块被熵解码510,并且被逆量化520以生成解码系数521。系数被输入到缩放器和组合器530。系数用于缩放一个或多个字典元素。缩放后的元素通常被线性组合以重构解码宏块预测残差信号。该残差与缓冲器540中存储的之前解码的宏块组合以产生输出宏块509。
从比特流501解码的索引502被存储在索引缓冲器505中。索引用于选择550用于重构当前预测残差的字典元素551。在经由比特流没有接收到索引的情况下,使用复制模式信号503来指示使用之前使用的字典元素的哪组来解码当前块。例如,复制模式值能够指示使用用于产生当前块的左侧块的元素来重构当前块。在另一示例中,能够使用用于产生当前块的上面的块的元素。具有该复制模式信号的主要目的在于,与索引相比,这要求少得多的比特。
由于能够根据在编码器处所使用的预测模式使用各存储的字典570,因此,使用预测模式信号504来选择560在解码器中将使用哪个存储的字典。预测模式504也由解码器中的帧内/帧间预测模块580使用,与在传统的解码器中使用预测模式的方式类似。
R-D最优字典元素选择
通过MP选择550字典元素,并且在循环过程中确定系数。大多数视频编码标准的重要特征是R-D优化,其用于多个决定处理,例如,当终止在550中执行的在下面的等式(3)中描述的循环MP处理时的决定处理以及在图6的复制模式评估器的模块600中的决定处理。替代固定数目的系数,编码器能够通过最小化由D(N)+λR(N)定义的R-D成本来提供最佳稀疏近似,其中,R(N)是估计的比特数,D(N)是原始和重构信号之间的均方差(MSE),并且λ是拉格朗日乘数。
R-D失真还表示何时编码器终止MP中的循环。通过丢弃N,能够通过下式来确定非零系数的最优数目
N * = arg min N ∈ { 0,1 , . . . , C } { D ( N ) + λR ( N ) } arg min N ∈ { 0,1 , . . . , C } { D + λ ( R H + R C + R I ) } , - - - ( 3 )
其中,C是给定的稀疏约束,并且RH、RC和RI分别表示所要求的用于头的比特,MP缩放系数和索引表示。
头信息包括非零系数的数目(即,循环的数目),从而解码器确定重构过程中的元素的正确数目。编码器提供了利用最优值的特定比特预算的约束中的最佳稀疏近似。该处理还可以在解码器中使用,例如,在图5的字典元素选择器550中使用。
利用字典索引复制方法的先进编码技术
除了使用MP的字典索引选择处理之外,我们还提供了索引复制方法。一般来说,能够假设相邻块在空间域中具有类似的上下文。并且,字典元素在重构过程中表现为基函数。因此,能够在相邻的残差信号中出现类似图案时在相邻块中重新使用字典元素的相同组。通过应用之前的字典元素来确定当前信号的系数。因此,解码器能够减少索引编码所要求的比特的量。标志被信令以指示候选中通过检查R-D成本而选择600的索引组的来源。
当信号特性在相邻块中基本上稳定时,该索引复制方法能够是高效的。因此,该方法能够适用于视频的同种区域中的相邻块。
工业实用性
本发明的方法可应用于很多领域中的很多视频编码和解码。

Claims (18)

1.一种视频解码器中对编码为比特流的视频进行解码的方法,所述方法包括下述步骤:
保持从解码预测残差信号生成的字典的组,其中,所述字典的组的元素具有关联的索引;
对所述比特流的当前宏块进行熵解码和逆量化以产生解码系数;
对于当前宏块,根据在比特流中传送的预测模式选择所述字典的组中的特定字典,并且根据所述比特流中的复制模式信号及关联的索引选择所述特定字典的特定元素;
使用所述解码系数,对所述特定元素进行缩放和组合以重构当前解码宏块预测残差信号;以及
将所述当前解码宏块预测残差信号与之前解码的宏块进行组合以生成重构视频的输出宏块,
其中,在解码器中执行上述的步骤。
2.根据权利要求1所述的方法,其中,所述字典的组是超完备的。
3.根据权利要求1所述的方法,其中,所述预测模式选择将用于解码所述当前宏块的字典。
4.根据权利要求1所述的方法,其中,使用匹配追踪(MP)处理来选择所述元素。
5.根据权利要求3所述的方法,其中,所述MP处理通过使重构视频的残差最小来形成字典元素的线性组合。
6.根据权利要求3所述的方法,其中,反复进行所述MP处理,直到率失真成本最小。
7.根据权利要求1所述的方法,其中,基于所述系数的统计,通过霍夫曼表对所述系数进行二值化。
8.根据权利要求1所述的方法,其中,所述解码预测残差信号是从视频的之前解码的宏块获得的。
9.根据权利要求1所述的方法,其中,所述解码预测残差信号是从训练视频集的解码宏块获得的。
10.根据权利要求1所述的方法,所述方法进一步包括:
在编码器中保持所述字典的组以生成编码视频。
11.根据权利要求1所述的方法,其中,使用用于重构解码宏块的相同的字典元素来重构所述当前宏块。
12.根据权利要求10所述的方法,其中,使用成本函数来选择已经用于解码之前的宏块的字典元素集。
13.根据权利要求10所述的方法,其中,在重构所述当前块时,使用复制模式信号来指示何时应用之前使用的字典元素。
14.根据权利要求1所述的方法,其中,率失真成本指标中并入了索引所要求的码率、缩放系数和在所述解码器处重构所述宏块所需要的任何辅助数据。
15.根据权利要求1所述的方法,其中,所述索引被存储在缓冲器中以便于以后使用。
16.根据权利要求10所述的方法,其中,对于在所述解码之前训练的特定字典应用复制模式评估器和复制模式信号。
17.根据权利要求10所述的方法,其中,对于在编码和解码处理过程中计算的字典应用复制模式评估器和复制模式信号。
18.根据权利要求1所述的方法,其中,通过从视频的采样构造编码字典的组来对所述视频进行编码,其中,所述采样是预测残差,所述方法进一步包括:
将所述编码字典的组应用于视频以利用从所述字典的组中选择的元素生成所述视频的稀疏表示;
对所述稀疏表示进行量化以生成量化信号;以及
对所述量化信号进行熵编码以产生比特流。
CN201180062788.3A 2010-12-28 2011-12-20 用于使用字典编码视频的方法 Active CN103329522B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/979,414 2010-12-28
US12/979,414 US8767835B2 (en) 2010-12-28 2010-12-28 Method for coding videos using dictionaries
PCT/JP2011/080144 WO2012090975A1 (en) 2010-12-28 2011-12-20 Method for coding videos using dictionaries

Publications (2)

Publication Number Publication Date
CN103329522A true CN103329522A (zh) 2013-09-25
CN103329522B CN103329522B (zh) 2016-08-10

Family

ID=45524910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180062788.3A Active CN103329522B (zh) 2010-12-28 2011-12-20 用于使用字典编码视频的方法

Country Status (6)

Country Link
US (1) US8767835B2 (zh)
JP (1) JP5566529B2 (zh)
CN (1) CN103329522B (zh)
DE (1) DE112011104625T5 (zh)
TW (1) TWI469644B (zh)
WO (1) WO2012090975A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103561276A (zh) * 2013-11-07 2014-02-05 北京大学 一种图像视频编解码方法
CN104053012A (zh) * 2014-05-28 2014-09-17 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
WO2015180052A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN105872549A (zh) * 2016-05-16 2016-08-17 中国科学技术大学 基于块搜索和正交匹配追踪的视频变换编码方法
CN106576166A (zh) * 2014-08-12 2017-04-19 奥兰治 图像编码和解码方法、图像编码和解码设备以及相应的计算机程序
WO2022088631A1 (zh) * 2020-10-28 2022-05-05 Oppo广东移动通信有限公司 图像编码方法、图像解码方法及相关装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8767835B2 (en) * 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries
US9167274B1 (en) * 2012-03-21 2015-10-20 Google Inc. Generating synchronized dictionaries for sparse coding
US9137528B1 (en) 2012-09-28 2015-09-15 Google Inc. Synchronizing sparse coding dictionaries for use in communication sessions
CN103176946A (zh) * 2013-04-02 2013-06-26 哈尔滨工业大学 一种面向块稀疏信号的稀疏分解去噪方法
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
CN105659606B (zh) 2013-10-14 2019-06-18 微软技术许可有限责任公司 用于视频和图像编码和解码的方法、系统和介质
AU2013403224B2 (en) 2013-10-14 2018-10-18 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
CN103559718B (zh) * 2013-11-19 2016-08-17 福建师范大学 基于稀疏表示的过完备字典训练的视频篡改检测方法
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
KR102353787B1 (ko) 2014-01-03 2022-01-19 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩/디코딩에서의 블록 벡터 예측
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
KR102311815B1 (ko) 2014-06-19 2021-10-13 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 통합된 인트라 블록 카피 및 인터 예측 모드
JP2017535145A (ja) 2014-09-30 2017-11-24 マイクロソフト テクノロジー ライセンシング,エルエルシー 波面並列処理が可能にされた場合のピクチャ内予測モードに関する規則
KR101627069B1 (ko) * 2015-04-01 2016-06-02 이화여자대학교 산학협력단 동영상 인코딩에서 잔차 신호에 대한 희소 변환 방법, 희소 변환을 이용한 동영상 인코딩 방법 및 희소 변환을 이용하여 부호화된 신호에 대한 디코딩 방법
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US11172221B2 (en) * 2017-06-26 2021-11-09 Interdigital Madison Patent Holdings, Sas Method and apparatus for intra prediction with multiple weighted references
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
CN115088192A (zh) * 2019-11-30 2022-09-20 字节跳动有限公司 视频数据的基于字典的编解码

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1802667A (zh) * 2003-03-28 2006-07-12 数字加速器公司 用于视频压缩的基于超完备基变换的运动残余帧编码方法和装置
WO2010087807A1 (en) * 2009-01-27 2010-08-05 Thomson Licensing Methods and apparatus for transform selection in video encoding and decoding

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6883035B2 (en) * 2000-11-16 2005-04-19 Telefonaktiebolaget Lm Ericsson (Publ) System and method for communicating with temporary compression tables
US6925126B2 (en) * 2001-04-18 2005-08-02 Koninklijke Philips Electronics N.V. Dynamic complexity prediction and regulation of MPEG2 decoding in a media processor
US7003039B2 (en) * 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression
US7769088B2 (en) * 2003-05-28 2010-08-03 Broadcom Corporation Context adaptive binary arithmetic code decoding engine
US8059715B2 (en) * 2003-08-12 2011-11-15 Trident Microsystems (Far East) Ltd. Video encoding and decoding methods and corresponding devices
BRPI0907242A2 (pt) * 2008-01-07 2015-07-14 Thomson Licensing Métodos e aparelho para codificação e decodificação utilizando-se filtragem paramétrica
US8391370B1 (en) * 2009-03-11 2013-03-05 Hewlett-Packard Development Company, L.P. Decoding video data
US8767835B2 (en) * 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1802667A (zh) * 2003-03-28 2006-07-12 数字加速器公司 用于视频压缩的基于超完备基变换的运动残余帧编码方法和装置
WO2010087807A1 (en) * 2009-01-27 2010-08-05 Thomson Licensing Methods and apparatus for transform selection in video encoding and decoding
CN102301708A (zh) * 2009-01-27 2011-12-28 汤姆森特许公司 视频编码和解码中用于变换选择的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
V.K.GOYAL: "Quantized Overcomplete Expansions in RN:Analysis,Synthesis,and Algorithms", 《INFORMATION THEORY》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103561276A (zh) * 2013-11-07 2014-02-05 北京大学 一种图像视频编解码方法
CN103561276B (zh) * 2013-11-07 2017-01-04 北京大学 一种图像视频编解码方法
CN104053012A (zh) * 2014-05-28 2014-09-17 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
WO2015180052A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN104053012B (zh) * 2014-05-28 2017-08-29 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN106576166A (zh) * 2014-08-12 2017-04-19 奥兰治 图像编码和解码方法、图像编码和解码设备以及相应的计算机程序
CN105872549A (zh) * 2016-05-16 2016-08-17 中国科学技术大学 基于块搜索和正交匹配追踪的视频变换编码方法
WO2022088631A1 (zh) * 2020-10-28 2022-05-05 Oppo广东移动通信有限公司 图像编码方法、图像解码方法及相关装置

Also Published As

Publication number Publication date
DE112011104625T5 (de) 2013-10-02
TWI469644B (zh) 2015-01-11
CN103329522B (zh) 2016-08-10
US20120163451A1 (en) 2012-06-28
TW201234864A (en) 2012-08-16
US8767835B2 (en) 2014-07-01
JP2013538471A (ja) 2013-10-10
WO2012090975A1 (en) 2012-07-05
JP5566529B2 (ja) 2014-08-06

Similar Documents

Publication Publication Date Title
CN103329522A (zh) 用于使用字典编码视频的方法
KR101351714B1 (ko) 비트 스트림 복호 방법
JP3659353B2 (ja) ビデオ画像符号化方法
CN102598663A (zh) 通过使用旋转变换对图像编码和解码的方法和设备
US20100310184A1 (en) Dual prediction video encoding and decoding method and device
CN105791830A (zh) 使用压缩感测的视频编解码
MX2012000614A (es) Metodo y aparato de codificacion y decodificacion de imagen que utilizan gran unidad de transformacion.
CN104067622A (zh) 图像编码方法、图像解码方法、图像编码器及图像解码器
CN101653003A (zh) 用于混合视频编码的量化
KR20110014839A (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
CN102474611A (zh) 通过控制运动矢量的精度对图像编码/解码的方法和设备
US9014499B2 (en) Distributed source coding using prediction modes obtained from side information
US20150189283A1 (en) Coding using a redundant dictionary, such as video coding using a self-adaptive redundant dictionary including spatial and/or temporal prediction candidte atoms
TW201301900A (zh) 視訊解碼器之編碼成位元串之解碼方法
KR20120084168A (ko) 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
CN101938654B (zh) 一种变换系数的优化量化方法及装置
CN104320657A (zh) Hevc无损视频编码的预测模式选择方法及相应的编码方法
CN102625102A (zh) 一种面向h.264/svc mgs编码的率失真模式选择方法
US20160337646A1 (en) Method and apparatus for predicting video signal using predicted signal and transform-coded signal
Zhou et al. Distributed video coding using interval overlapped arithmetic coding
CN105611301A (zh) 基于小波域残差的分布式视频编解码方法
CN102484702A (zh) 用于通过使用旋转变换对图像编码和解码的方法和设备
US9307257B2 (en) Method for improving compression efficiency of distributed source coding using intra-band information
Chiou et al. Performance improvement of distributed video coding by using block mode selection
CN102763414A (zh) 编码和重构图像序列的块的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant