CN102726045B - 编码和解码图像块的方法 - Google Patents

编码和解码图像块的方法 Download PDF

Info

Publication number
CN102726045B
CN102726045B CN201180007027.8A CN201180007027A CN102726045B CN 102726045 B CN102726045 B CN 102726045B CN 201180007027 A CN201180007027 A CN 201180007027A CN 102726045 B CN102726045 B CN 102726045B
Authority
CN
China
Prior art keywords
pixel
current block
threshold value
threshold
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180007027.8A
Other languages
English (en)
Other versions
CN102726045A (zh
Inventor
D.索罗
A.马丁
E.弗朗索瓦
J.维尔隆
P.波蒂斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN102726045A publication Critical patent/CN102726045A/zh
Application granted granted Critical
Publication of CN102726045B publication Critical patent/CN102726045B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及编码像素块的方法,其包含如下步骤:-通过利用当前阈值对应用在至少覆盖当前块的像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的每个像素确定(10)预测像素;-从当前块中提取(12)由预测像素形成的预测块以生成残差块;以及-编码(14)所述残差块。按照本发明,从当前块的邻近重构像素中确定或编码该当前阈值。

Description

编码和解码图像块的方法
技术领域
本发明涉及图像编码的一般领域。
本发明更具体地涉及编码图像块的方法和解码图像块的方法。
背景技术
在现有技术中众所周知,编码图像序列的一个图像是将这个图像划分成像素块,然后通过空间预测(INTRA模式)或时间预测(INTER模式)编码每个块。编码当前块一般包含通过,例如,当前块的像素与预测块的像素之间的差值(difference)的DCT(离散余弦变换)变换成系数块。该编码进一步包含量化系数,然后熵编码量化的系数。
在现有技术中众所周知,以INTRA模式,即,通过空间预测编码当前块是从以前编码的空间邻近(neighbouring)块的图像数据中预测当前块。例如,在H.264视频编码标准中众所周知,从处在当前块上面或当前块左边的像素中预测当前块。更具体地说,当前块的像素通过线性组合按照优选预测方向(例如,水平、垂直等)与当前块邻近的像素来预测。预测像素,即,线性组合当前块的邻近像素所得的预测像素形成预测块。当待预测的当前块包含轮廓时,这种预测方法尤其有效。事实上,如果一个对象的边缘对应于按H.264标准定义的预测方向之一时,该轮廓事实上以单向方式在待预测的当前块中扩展。但是,当存在二维结构时,这种预测方法丧失了其效率。
发明内容
本发明的目的是克服现有技术的至少一个缺点。为此,本发明涉及通过空间预测编码叫做当前块的像素块的方法。按照本发明的编码方法包含如下步骤:
-通过利用当前阈值对应用在至少覆盖当前块的像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的每个像素确定预测像素;
-从当前块中提取由预测像素形成的预测块以生成残差块;以及
-编码残差块。
有利的是,从当前块的邻近重构像素中确定或编码该当前阈值。在从当前块的邻近重构像素中确定或编码该当前阈值中,提高了编码效率。
按照一个特定实施例,利用多个阈值的每个阈值重复为当前块的每个像素确定预测像素的步骤。该方法还包含从多个阈值当中选择在当前块与预测块之间计算的预测误差最小的阈值作为当前阈值。
按照本发明的一个特定方面,通过与预测阈值的差值编码当前阈值,该预测值取决于当前块的邻近重构像素。
按照特定特性,该预测阈值等于用在当前块的邻近块中的阈值的平均值。
按照第一变型,该预测阈值等于用在当前块的邻近块中的阈值的中值。
按照第二变型,该预测阈值按照如下步骤确定:
-通过利用阈值对应用在至少覆盖重构像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的邻近区域中的每个重构像素确定预测像素;
-利用多个阈值的每个阈值重复为邻近区域的每个像素确定预测像素的步骤;以及
-从多个阈值当中选择在当前块的邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值作为预测阈值。
按照另一实施例,该当前阈值按照如下步骤确定:
-通过利用阈值对应用在至少覆盖重构像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的邻近区域中的每个重构像素确定预测像素;
-利用多个阈值的每个阈值重复为邻近区域的每个像素确定预测像素的步骤;以及
-从多个阈值当中选择在当前块的邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值作为当前阈值。
有利的是,对于当前块的邻近区域的每个重构像素,在当前块的邻近区域的重构像素与相应预测像素之间计算的预测误差考虑它们相对于当前块的边缘的距离。
按照本发明的另一个方面,当为尺寸8×8的当前块选择了当前阈值时,通过将选择的当前阈值乘以严格小于1的系数α,为当前块的尺寸4×4的每个块计算当前阈值。
有利的是,窗口的尺寸取决于待预测的像素在当前块中的位置。
本发明还涉及通过空间预测解码像素的当前块的方法,其包含如下步骤:
-解码残差块;
-通过利用当前阈值对应用在至少覆盖当前块的像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的每个像素确定预测像素;以及
-通过合并解码的残差块和由预测像素形成的预测块重构所述当前块。
有利的是,从当前块的邻近重构像素中确定该当前阈值。
按照一个特定实施例,该当前阈值按照如下步骤确定:
-通过利用阈值对应用在至少覆盖重构像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的邻近区域中的每个重构像素确定预测像素;
-利用多个阈值的每个阈值重复为邻近区域的每个像素确定预测像素的步骤;以及
-从多个阈值当中选择在当前块的邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值作为当前阈值。
按照另一个特定实施例,按照本发明的解码方法还包含如下步骤:
-解码阈值的差值;
-从当前块的邻近重构像素中确定预测阈值;以及
-计算该差值与该预测阈值之和,该和值是当前阈值。
有利的是,该预测阈值按照如下步骤确定:
-通过利用阈值对应用在至少覆盖重构像素的窗口上的变换所得的系数加阈,和通过应用于加阈系数的逆变换,为当前块的邻近区域中的每个重构像素确定预测像素;
-利用多个阈值的每个阈值重复为邻近区域的每个像素确定预测像素的步骤;以及
-从多个阈值当中选择在当前块的邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值作为预测阈值。
附图说明
通过参考附图借助决不是限制性的实施例和有利实现方式,可以更好地理解和例示本发明,在附图中:
-图1示出了按照本发明的编码方法;
-图2示出了包含待预测块和用于预测这个块的窗口的图像部分;
-图3和4详细示出了按照本发明的编码方法的步骤;
-图5和6示出了包含待预测块和用于预测这个块的不同窗口的图像部分;
-图7示出了包含待预测块、与这个块邻近的因果带Zc和用于预测这个因果带的像素的窗口的图像部分;
-图8示出按照本发明的解码方法;
-图9例示了按照本发明的编码设备;以及
-图10示出了按照本发明的解码设备。
具体实施方式
图像包含每一个与至少一项图像数据相关联的像素或图像点。一项图像数据是,例如,一项亮度数据或一项色度数据。
术语“残差”表示提取了其它数据之后获得的数据。该提取一般是从源像素中减去预测像素。但是,该提取更一般,尤其包含加权相减。
术语“重构”表示将残差与预测数据合并之后获得的数据(例如,像素、块)。该合并一般是残差预测像素之和。但是,该合并更一般,并且尤其包含加权相加。重构块是重构像素的块。
关于图像解码,术语“重构”和“解码”经常用作同义。因此,“重构块”也表示在“解码块”的术语下。
本发明涉及通过空间预测编码叫做当前块的像素块的方法。它应用于图像或图像序列的编码。按照本发明的编码方法基于描述在如下文献中的外推信号的方法:Guleryuz,O.G.,标题为"Nonlinearapproximationbasedimagerecoveryusingadaptivesparsereconstructionsanditerateddenoising",ImageProcessing,IEEETransactions卷15,3期,2006年3月页:539-571。这种外推方法最初用于掩蔽(masking)错误的目的。
下面参考图1描述按照本发明编码图像的当前块的方法。
在步骤10期间,为当前块的每个像素确定预测像素。预测像素形成当前块的预测块。预测像素是通过利用当前阈值对应用在至少覆盖待预测的当前块的像素的窗口上的变换所得的系数加阈(thresholding)获得的。该窗口对应于变换的支持。使用的变换是,例如,DCT。但是,本发明不局限于后者。也可以应用像离散傅立叶变换那样的其它变换。按照本发明,从当前块的邻近重构像素中确定或编码当前阈值。在从当前块的邻近重构像素中确定或编码当前阈值时,提高了编码效率。
在步骤12期间,从当前块中提取由预测像素形成的预测块以生成残差块。
在步骤14期间,将残差块编码在流S中。例如,通过,例如,DCT或小波变换将残差块变换成系数块,其被量化然后通过熵编码被编码。按照一种变型,只量化然后通过熵编码编码残差块。
下面参考图2和3更精确地描述确定预测像素的步骤10。在图2中,预测像素p0,0对应于待预测的当前块B的左上方上的像素。在图2中用叉号标识的像素是已知像素,即,重构像素。预测像素p0,0以便将代表其环境的值赋予它。窗口F在其初始位置F0,0上至少覆盖待预测的像素p0,0。在步骤10中就是在这个窗口上应用变换。
在步骤100期间,对像素p0,0指定初始值。作为一个简单例子,将来自邻近像素的平均值指定给像素p0,0。将这个值表示成pav0,0:pav0,0=(a+b+c)/3。按照一种变型,将像素a、b和c的中值指定给像素p0,0。按照另一变型,将值a、b或c之一指定给像素p0,0。按照其它变型,考虑处在像素p0,0的因果邻近区域中的其它像素,以为像素p0,0确定初始值。当前像素的因果邻近区域包含在编码(相应地解码)当前像素期间已经重构的当前图像的像素组。
在步骤110期间,将变换应用于窗口F的像素。然后将这些像素变换成系数。
在步骤120期间,使用阈值thopt在变换域中对系数加阈。这种加阈具有消除噪声以便只保留有意义系数的作用。
在步骤130期间,应用在步骤110中应用的变换的逆变换以返回到像素域,以便恢复表示成的新预测像素值,零值的大于的索引对应于窗口F的行和列相对于该窗口的初始位置的零偏移。
参考图4和5,利用窗口F偏移应用与参考图3所描述的方法相同的方法,以为当前块B的其它像素确定预测像素。重复地(iteratively)预测像素p0,0到pn-1,m-1。相对于图3中的窗口F的位置F0,0,将窗口向右偏移1个像素,以便确定与当前块正好在像素p0,0右边的像素相对应的预测像素p0,1。在图5中,a、b和c是分别处在待预测的像素p0,1的左边、上面和对角上的像素p0,1的邻近重构像素,其中,更具体地说,在当前情况下,a等于以前内插的像素的值。
按照一种变型,将位置F0,0上的窗口向右偏移2个像素,即,偏移到位置F0,2。在该情形中,在第二重复中,预测像素p0,1和p0,2。更一般地说,可以以m个像素将窗口F偏移m个像素。为了不使预测过于降级,m的值保持较小是有利的。
在步骤100期间,将来自邻近像素的平均值指定给p0,1,例如,该值是将这个值表示成也可以应用在步骤100中参考像素p0,0所描述的变型。
在步骤110期间,将变换应用于窗口F0,1的像素。然后将这些像素变换成系数。
在步骤120期间,利用阈值thopt在变换域中对系数加阈。这种加阈具有消除噪声以便只保留有意义系数的作用。
在步骤130期间,应用在步骤110中应用的变换的逆变换返回到像素域,以便恢复表示成的新预测像素值,大于的索引对应于窗口F偏移了0行和1列。如图5所示,像素p0,0包含在位置F0,1上的窗口F中。因此,在计算预测像素p0,1期间,也为像素p0,0计算新值。事实上,在逆变换期间,将值指定给像素p0,0。这个值可以不同于在窗口F没有偏移时的在前重复(窗口在F0,0位置上)中计算的那个为了考虑为像素p0,0计算的两个值,即,在窗口F零偏移的在前重复中获得的那个和在偏移0行和1列的当前重复中获得的将新值指定给预测像素p0,0。表示成的这个新值等于,例如,两个值的平均值,即,
重复该方法直到块B的所有像素都得到预测。为此,在步骤140期间,验证当前像素是否是待预测块的最后像素。如果是这种情形,则终止确定预测块的步骤。在相反的情形下,如果在当前行中仍然存在待预测的像素,则将窗口F向右偏移一列,或将窗口F向下偏移一行,以便再次将窗口放置在行的开始。但是,在每次重复时偏移窗口F的方式不是固定的。它取决于为待预测块定义的扫描次序。参考前图,像素的扫描从左到右逐个像素然后逐行地进行。这种扫描不是排他的,锯齿型扫描以及像,例如,先第1行然后第1列,接着第2行然后第2列等等的扫描那样的其它类型也是可能的。
对窗口的新位置再次应用步骤100到140。为待预测的新像素psk,sl确定值也为在以前重复期间已经计算了预测值或多个预测值的当前块包含在窗口F中的像素计算新预测值。对于这些像素,如上面参考像素p0,0所描述,以如下方式确定新预测值:
p Int . k , l sk , sl = Σ p = k sk Σ q = l sl ( p tr . k , l p , q ) / ( ( sk - k + 1 ) ( sl - l + 1 ) ) ,
其中,
-是在与窗口F的位置Fsk,sl相对应的重复期间在待预测块的第k行和第l列中预测的像素;
-sk和sl:分别是窗口F的行和列的偏移;
-是通过将窗口F相继偏移到位置Fsk,sl递归预测的位置(k,l)中的预测像素的值。
按照一种变型,用中值函数或直方图峰型函数取代加权和。
按照第一实施例,从因果带Zc,即,包含当前块B的邻近区域中的重构像素,但未必与这个块相邻,确定阈值thopt。这个实施例参考图7来描述。在这个图7中,叉号表示重构像素。灰色背景上的叉号表示属于因果带Zc的像素。这个带Zc用于为待预测的当前块确定阈值。为此,将参考图4和5所描述的方法应用于这个带Zc的像素,以便为它们当中的每一个确定预测像素以及针对几个阈值thi确定这个预测像素。因此,针对每个阈值thi,在带Zc上计算能量级(energylevel)。作为一种简单例示,这个能量将按照如下公式计算:
SSE i = Σ p ∈ ZC ( Y ( p ) - p Int . ( p ) ) 2 ,
其中,
-p代表包含在块中的像素的位置;
-Y是待预测的当前块中的像素的一项图像数据(例如,亮度和/或色度)的值;
-pInt是针对阈值thi确定的预测值。
对于带Zc,将阈值thzc确定为生成最小预测能量SSEi的那个。
按照一种变型,按如下计算能量:
SAD i = Σ p ∈ Bloc _ NxM | Y ( p ) - p Int . ( p ) |
按照另一变型,按如下计算能量:
E i = Max p ∈ Bloc _ NxM | Y ( p ) - p Int . ( p ) |
按照另一变型,引入使Zc的像素的预测误差能够按照Zc的像素相对于待预测块的前沿的距离相对化的加权函数。这个加权函数的值因此根据,例如,像素相对于待预测块的中心的距离而变,使得:
w 8 x 8 ( i , j ) = c × ρ ( i - 11.5 ) 2 + ( j - 11.5 ) 2 ,
w 4 x 4 ( i , j ) = c × ρ 2 × ( i - 5.5 ) 2 + ( j - 5.5 ) 2 ,
其中:
-c是标准化系数;
-ρ=0.8;
-i和j对应于加权窗的框架中加权系数的坐标,其中待预测块的中心对于4×4和8×8尺度(dimension)的块分别在(5.5,5.5)和(11.5,11.5)中;
-原点(0,0)在左上方。
待预测的当前块的阈值thopt等于thzc。带Zc可以具有尤其根据邻近像素的可用性的不同形式。同样,带的厚度可以超过1个像素。
按照第二实施例,通过利用不同阈值thi重复参考图4和5所描述的方法以及通过确定在预测块与当前块之间计算的预测误差最小的阈值为当前块确定阈值thopt
因此,对于每个阈值thi,计算能量级。作为一个简单例子,这个能量将按照如下公式计算:
SSE i = Σ p ∈ Bloc _ NxM ( Y ( p ) - p Int . ( p ) ) 2 ,
其中,
-p代表包含在块中的像素的位置;
-Y是待预测的当前块中的像素的一项图像数据(例如,亮度和/或色度)的值;
-pInt是针对阈值thi确定的预测值。
阈值thopt是生成最小预测能量SSEi的那个。
按照变型,按如下计算能量:
SAD i = Σ p ∈ Bloc _ NxM | Y ( p ) - p Int . ( p ) | .
按照另一变型,按如下计算能量:
E i = Max p ∈ Bloc _ NxM | Y ( p ) - p Int . ( p ) |
按照这个第二实施例确定的当前阈值thopt的值被直接编码在流S中或有利地通过与预测阈值thpred的差编码在流S中以便降低其编码成本。
例如,预测阈值thpred等于为与当前块邻近和已经编码的块确定的阈值thopt的平均值。考虑左边的块、上面的块和左上方的块。按照变型,还考虑右上方的块。
按照另一变型,预测阈值thpred等于为与当前块邻近和已经编码的块确定的阈值thopt的中值。
按照又一变型,预测阈值thpred等于thzc。应该注意到,如果按照第一实施例确定thopt,则thopt=thzc,在该情况下,不编码阈值,因为在解码器侧可以以与编码器侧相同的方式从Zc的像素中确定它。
按照一个特定实施例,尺寸8×8的当前块可以通过如下步骤来预测:为8×8块确定当前阈值,以及利用表示成th8×8的当前阈值应用参考图4和5所描述的方法,或者将这个8×8块划分成四个4×4块,以及利用表示成th4×4的对每个块都相同的当前阈值将参考图4和5所描述的方法独立地应用在每个4×4块上,th4×4是按照如下方程从th8×8中导出的:th4×4=α*th8×8,其中α严格小于1。
本发明还涉及参考图8所描述的解码方法。
在步骤20期间,为当前块解码残差块。例如,将流S的一部分解码成系数。将系数去量化,然后,如果有必要,通过用在编码器侧的变换的逆变换加以变换。因此获得残差块。
在步骤22期间,为当前块的每个像素确定预测像素。预测像素形成当前块的预测块。预测像素是通过利用当前阈值对来自应用在至少覆盖待预测的当前块的像素的窗口上的变换的系数加阈获得的。该窗口对应于变换的支持。使用的变换是,例如,DCT。但是,本发明不局限于后者。也可以应用像离散傅立叶变换那样的其它变换。
在步骤24期间,通过将预测块与解码的残差块合并重构当前块。
确定预测像素的步骤22与编码方法的步骤10相同。但是,在解码器侧,阈值thopt在在编码器侧被编码在流S中的情况下,是从这个相同流中解码的,或者是从当前块的邻近区域中的重构像素中直接确定的。
按照第一实施例,thopt是直接或在编码预测值thpred的差分(differential)的情况下通过将解码值加入这个值中从该流中解码的。例如,预测阈值thpred等于为与当前块邻近和已经编码的块确定的阈值thopt的平均值。例如,考虑左边的块、上面的块和左上方的块。按照变型,还考虑右上方的块。
按照另一变型,预测阈值thpred等于为与当前块邻近和已经编码的块确定的阈值thopt的中值。
按照另一变型,预测阈值thpred等于thzc,其中thzc如在编码器侧参考图7所描述确定。
按照第二实施例,阈值thopt是以与在编码器侧参考图7所描述相同的方式从带Zc中的重构像素中确定的。在这种情况下,thopt等于thzc
按照可以应用于编码和解码方法的一个特定实施例,窗口F的尺寸如图6所示取决于待预测像素在当前块中的位置。在这个图中,在位置F0,0上的窗口具有小于在位置Fn-1,m-1上的窗口的尺寸。这具有提高预测块的相关性的优点。例如,当当前块具有4×4尺寸时,对于处在当前块上面和左侧边缘,即,第1行和第1列上的像素,窗口的尺寸是4×4,而对于当前块的其它像素,窗口具有8×8的尺寸。使用的窗口或多个窗口的尺度不局限于2的幂(powersof2)。事实上,本发明不局限于称为“快速”变换的应用于2N的许多倍样本的变换的使用。另外,使用的变换未必是离散的。
本发明还涉及参考图9描述的编码设备12和参考图10描述的解码设备13。在图9和10中,所示的模块是可以对应于或可以不对应于物理上可区分单元的功能单元。例如,这些模块或它们的一些可以一起分组在单个组件中,或构成同一软件的功能。相反,一些模块可以由分立物理实体组成。
参考图9,编码设备12在输入端上接收一个或多个图像。编码设备12能够实现参考图1所描述的按照本发明的编码方法。每个图像被划分成每一个与至少一项图像数据相关联的像素的块。编码设备12尤其实现利用空间预测的编码。在图9中只示出了编码设备12与通过空间预测的编码或INTRA编码有关的模块。未示出的和视频编码器领域的技术人员熟知的其它模块实现编码时间预测(例如,运动估计、运动补偿)。编码设备12尤其包含了能够,例如,通过逐个像素相减,从当前块B中提取预测块Pr以生成残差块Bres的计算模块1200。计算模块1200能够实现按照本发明的编码方法的步骤12。它进一步包含能够变换残差块Bres然后将其量化成量化数据的模块1202。变换T是,例如,离散余弦变换(或DCT)。编码设备12进一步包含能够将量化数据编码成编码数据流S的熵编码模块1204。它还包含进行模块1202的逆操作的模块1206。模块1206进行逆量化Q-1之后进行逆变换T-1。模块1206与计算模块1208连接,计算模块1208能够,例如,通过逐个像素相加,合并来自模块1206的数据块和预测块Pr,以生成存储在存储器1210中的重构块。
预测模块1216确定预测块Pr。预测模块1216能够实现按照本发明的编码方法的步骤10。该编码方法的步骤14在模块1202和1204中实现。
参考图10,解码模块13在输入端上接收代表图像的编码数据流S。流S是,例如,编码设备12经由信道发送的。解码设备13能够实现参考图8所描述的按照本发明的解码方法。解码设备13包含能够生成解码数据的熵解码模块1300。然后将解码数据发送给能够进行逆量化然后进行逆变换的模块1302。模块1302与生成流S的编码设备12的模块1206相同。模块1302与计算模块1304连接,计算模块1304能够,例如,通过逐个像素相加,合并来自模块1302的块和预测块Pr,以生成存储在存储器1306中的重构当前块Bc。计算模块1304能够实现解码方法的步骤24。解码设备13还包含预测模块1308。预测模块1308确定预测块Pr。预测模块1308能够实现按照本发明的解码方法的步骤22。该解码方法的步骤20在模块1300和1302中实现。
显然,本发明不局限于上述的实施例子。尤其,本领域的普通技术人员可以将任何变型应用于所述实施例,并组合它们以便从它们的各种优点中获益。因此,本发明不局限于所使用的变换类型(例如,DCT、小波变换、离散傅立叶变换等)。同样,可以改变像素的扫描次序(例如,光栅扫描(rasterscan)、锯齿形(zigzag)等)。此外,本发明决不会受计算能量级的方式(例如,SSE、SAD、Max等)限制。
本发明应用于固定图像或图像序列的编码。

Claims (7)

1.一种在视频编码器中通过空间预测编码当前像素块的方法,其包含:
-为所述当前块的每个像素确定(10)预测像素;
-从所述当前块中提取(12)由所述预测像素形成的预测块以生成残差块;以及
-编码(14)所述残差块,
所述编码方法的特征在于,为所述当前块的每个像素确定预测像素,包括:
-在至少覆盖所述当前块的所述像素的窗口上应用(110)第一变换以获得系数;
-使用当前阈值对所述系数加阈(120);
-在所述加阈系数上应用(130)所述第一变换的逆变换以获得所述预测像素,以及
其中所述方法还包括:
-通过利用多个阈值中的阈值对应用在至少覆盖当前块的因果邻近区域中的每个重构像素的窗口上的变换所得的系数加阈,和通过应用于所述加阈系数的逆变换,为所述重构像素确定预测像素;
-利用所述多个阈值的每个阈值重复为所述因果邻近区域的每个像素确定预测像素的所述步骤;
-从多个阈值当中选择在当前块的因果邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值;以及
-利用根据所选择的阈值的预测来编码所述当前阈值。
2.按照权利要求1所述的方法,其中对于当前块的因果邻近区域的每个重构像素,在当前块的因果邻近区域的重构像素与相应预测像素之间计算的预测误差考虑它们相对于当前块的边缘的距离。
3.一种在视频解码器中通过空间预测解码像素的当前块的方法,其包含如下步骤:
-解码(20)残差块;
-为所述当前块的每个像素确定(22)预测像素;以及
-通过对所述解码残差块和由所述预测像素形成的预测块求和重构(24)所述当前块,
所述方法的特征在于,为所述当前块的每个像素确定预测像素,包括:
-在至少覆盖所述当前块的所述像素的窗口上应用(110)第一变换以获得系数;
-使用当前阈值对所述系数加阈(120);
-在所述加阈系数上应用(130)所述第一变换的逆变换以获得所述预测像素,
其中所述解码方法还包括:
-通过利用多个阈值中的阈值对应用在至少覆盖当前块的因果邻近区域的每个重构像素的窗口上的变换所得的系数加阈,和通过应用于所述加阈系数的逆变换,为所述重构像素确定预测像素;
-利用所述多个阈值的每个阈值重复为所述因果邻近区域的每个像素确定预测像素的所述步骤;
-从多个阈值当中选择在当前块的因果邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值;以及
-利用根据所选择的阈值的预测来解码所述当前阈值。
4.一种在视频编码器中通过空间预测编码当前像素块的设备,其包含:
-为所述当前块的每个像素确定预测像素的部件;
-从所述当前块中提取由所述预测像素形成的预测块以生成残差块的部件;以及
-编码所述残差块的部件,
其特征在于,为所述当前块的每个像素确定预测像素的所述部件被配置为:
-在至少覆盖所述当前块的所述像素的窗口上应用第一变换以获得系数;
-使用当前阈值对所述系数加阈;
-在所述加阈系数上应用所述第一变换的逆变换以获得所述预测像素,以及
其中所述编码设备进一步被配置为:
-通过利用多个阈值中的阈值对应用在至少覆盖当前块的因果邻近区域中的每个重构像素的窗口上的变换所得的系数加阈,和通过应用于所述加阈系数的逆变换,为所述重构像素确定预测像素;
-利用所述多个阈值的每个阈值重复为所述因果邻近区域的每个像素确定预测像素的所述步骤;
-从多个阈值当中选择在当前块的因果邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值;以及
-利用根据所选择的阈值的预测来编码所述当前阈值。
5.按照权利要求4所述的编码当前像素块的设备,其中所述设备适用于执行按照权利要求1到2的任何一项所述的编码方法的步骤。
6.一种在视频解码器中通过空间预测解码像素的当前块的设备,其包含:
-解码残差块的部件;
-为所述当前块的每个像素确定预测像素的部件;以及
-通过对所述解码残差块和由所述预测像素形成的预测块求和重构所述当前块的部件,
其特征在于,为所述当前块的每个像素确定预测像素的所述部件被配置为:
-在至少覆盖所述当前块的所述像素的窗口上应用第一变换以获得系数;
-使用当前阈值对所述系数加阈;
-在所述加阈系数上应用所述第一变换的逆变换以获得所述预测像素,以及
其中所述解码设备进一步被配置为:
-通过利用多个阈值中的阈值对应用在至少覆盖当前块的因果邻近区域的每个重构像素的窗口上的变换所得的系数加阈,和通过应用于所述加阈系数的逆变换,为所述重构像素确定预测像素;
-利用所述多个阈值的每个阈值重复为所述因果邻近区域的每个像素确定预测像素的所述步骤;
-从多个阈值当中选择在当前块的因果邻近区域的重构像素与相应预测像素之间计算的预测误差最小的阈值;以及
-利用根据所选择的阈值的预测来解码所述当前阈值。
7.按照权利要求6所述的解码像素的当前块的设备,其中所述设备适用于执行按照权利要求3所述的解码方法的步骤。
CN201180007027.8A 2010-01-25 2011-01-19 编码和解码图像块的方法 Expired - Fee Related CN102726045B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1050466A FR2955730A1 (fr) 2010-01-25 2010-01-25 Procedes de codage et de decodage
FR1050466 2010-01-25
PCT/EP2011/050693 WO2011089158A1 (en) 2010-01-25 2011-01-19 Spatial prediction technique for video coding

Publications (2)

Publication Number Publication Date
CN102726045A CN102726045A (zh) 2012-10-10
CN102726045B true CN102726045B (zh) 2016-05-04

Family

ID=43415367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180007027.8A Expired - Fee Related CN102726045B (zh) 2010-01-25 2011-01-19 编码和解码图像块的方法

Country Status (8)

Country Link
US (1) US9363514B2 (zh)
EP (1) EP2529552A1 (zh)
JP (1) JP5715647B2 (zh)
KR (1) KR101819762B1 (zh)
CN (1) CN102726045B (zh)
BR (1) BR112012017865A2 (zh)
FR (1) FR2955730A1 (zh)
WO (1) WO2011089158A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2955730A1 (fr) * 2010-01-25 2011-07-29 Thomson Licensing Procedes de codage et de decodage
KR101806216B1 (ko) 2013-01-04 2017-12-08 지이 비디오 컴프레션, 엘엘씨 효율적인 확장가능한 코딩 개념
EP2984839B1 (en) 2013-04-08 2020-05-27 GE Video Compression, LLC Coding concept allowing efficient multi-view/layer coding
US11172215B2 (en) * 2018-10-08 2021-11-09 Qualcomm Incorporated Quantization artifact suppression and signal recovery by the transform domain filtering
JP7125330B2 (ja) 2018-11-08 2022-08-24 松本システムエンジニアリング株式会社 自走式木材伐倒搬出機

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW366669B (en) 1996-10-30 1999-08-11 Matsushita Electric Ind Co Ltd Picture encoding device and picture encoding method, picture decoding device and picture decoding method, and data recording media
US6680974B1 (en) * 1999-12-02 2004-01-20 Lucent Technologies Inc. Methods and apparatus for context selection of block transform coefficients
EP2056606A1 (en) 2006-07-28 2009-05-06 Kabushiki Kaisha Toshiba Image encoding and decoding method and apparatus
WO2008048489A2 (en) * 2006-10-18 2008-04-24 Thomson Licensing Method and apparatus for video coding using prediction data refinement
JP4786623B2 (ja) 2007-09-25 2011-10-05 Kddi株式会社 動画像符号化装置および動画像復号装置
US8670488B2 (en) * 2007-12-21 2014-03-11 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive intra mode selection
EP2924994B1 (en) * 2008-05-07 2016-09-21 LG Electronics, Inc. Method and apparatus for decoding video signal
US8446949B2 (en) * 2008-06-23 2013-05-21 Sungkyunkwan University Foundation For Corporate Collaboration Distributed coded video decoding apparatus and method capable of successively improving side information on the basis of reliability of reconstructed data
KR101458471B1 (ko) * 2008-10-01 2014-11-10 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
US8699562B2 (en) * 2008-10-06 2014-04-15 Lg Electronics Inc. Method and an apparatus for processing a video signal with blocks in direct or skip mode
TWI566586B (zh) * 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
FR2955730A1 (fr) * 2010-01-25 2011-07-29 Thomson Licensing Procedes de codage et de decodage

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Atomic decomposition dedicated to AVC and spatial SVC prediction;MARTIN A ET AL;《PROCEEDINGS OF THE 15TH INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2008), 12 October 2008 (2008-10-12), pages 2492-2495, XP031374546, IEEE, Piscataway, NJ, US》;20081012;第2492-2495页 *
Nonlinear Approximation Based Image Recovery Using Adaptive Sparse Reconstructions and Iterated Denoising-Part I: Theory;GULERYUZ O G;《IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 15, no. 3, March 2006 (2006-03), pages 539-554, XP002525251, IEEE, Piscataway, NJ, US》;20060331;第539-554页 *
Nonlinear Approximation Based Image Recovery Using Adaptive Sparse Reconstructions and Iterated Denoising-Part II: Adaptive Algorithms;GULERYUZ O G;《IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 15, no. 3, March 2006 (2006-03), pages 555-571, XP002525252, IEEE, Piscataway, NJ, US 》;20060331;第555-571页 *
Phase refinement for image prediction based on sparse representation;MARTIN A ET AL;《PROCEEDINGS OF THE SPIE, vol. 7543, 19 January 2010 (2010-01-19), pages 1-8, XP002596730, SPIE, Bellingham, VA, US》;20100119;第1-8页 *

Also Published As

Publication number Publication date
KR20120118466A (ko) 2012-10-26
FR2955730A1 (fr) 2011-07-29
US20130195181A1 (en) 2013-08-01
BR112012017865A2 (pt) 2016-04-19
US9363514B2 (en) 2016-06-07
KR101819762B1 (ko) 2018-01-17
CN102726045A (zh) 2012-10-10
JP5715647B2 (ja) 2015-05-13
JP2013518456A (ja) 2013-05-20
EP2529552A1 (en) 2012-12-05
WO2011089158A1 (en) 2011-07-28

Similar Documents

Publication Publication Date Title
KR101354151B1 (ko) 영상 변환 방법 및 장치, 역변환 방법 및 장치
CN102668562B (zh) 运动矢量预测和细化
CN102474608B (zh) 解码代表图像序列的编码数据流的方法和编码图像序列的方法
CN102714721A (zh) 编码图像块的方法和重构图像块的方法
CN105284111A (zh) 运动图像编码装置、运动图像解码装置、运动图像编码方法、运动图像解码方法、及程序
CN102726045B (zh) 编码和解码图像块的方法
CN104980742A (zh) 用于视频解码的设备
CN103329522A (zh) 用于使用字典编码视频的方法
KR20110027480A (ko) 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR20090058954A (ko) 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치
US9491480B2 (en) Motion vector encoding/decoding method and apparatus using a motion vector resolution combination, and image encoding/decoding method and apparatus using same
KR20090087767A (ko) 영상의 인트라 예측 부호화 방법
CN102752596A (zh) 一种率失真优化方法
CN101268477B (zh) 视频压缩中自适应运动向量采样的多阶段连接过程
KR101845622B1 (ko) 영상에 대한 적응적 rdpcm 방법, 적응적 rdpcm에 기반한 인코딩 방법 및 적응적 rdpcm에 기반한 디코딩 방법
CN102918838B (zh) 图像序列的一个块的编码方法和重构方法
JP6093546B2 (ja) ブロックの再構成方法、符号化方法、復号化装置及び符号化装置
JP2013098984A5 (ja) ブロックの再構成方法、符号化方法、復号化装置及び符号化装置
CN103139563A (zh) 编码和重构像素块的方法以及相应设备
CN103430543A (zh) 重构和编码图像块的方法
CN102763414B (zh) 编码和重构图像序列的块的方法
JP5358485B2 (ja) 画像符号化装置
CN102804770B (zh) 使用代表性图块细化纹理的图像编码
CN102024255B (zh) 基于签名的配准方法以及用于签名计算的方法
JP2013017128A (ja) イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190131

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190131

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160504

Termination date: 20200119

CF01 Termination of patent right due to non-payment of annual fee