JP2014195324A - 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 - Google Patents
動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 Download PDFInfo
- Publication number
- JP2014195324A JP2014195324A JP2014116865A JP2014116865A JP2014195324A JP 2014195324 A JP2014195324 A JP 2014195324A JP 2014116865 A JP2014116865 A JP 2014116865A JP 2014116865 A JP2014116865 A JP 2014116865A JP 2014195324 A JP2014195324 A JP 2014195324A
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- unit
- moving image
- transform
- partition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Abstract
【解決手段】動画像符号化装置10において、周波数変換決定部105が、パーティション境界を挟んで隣接する変換対象領域を統合するか否かを判断する。変換係数生成部107は、周波数変換決定部105が統合すると判断した変換対象領域に対して1つの周波数変換を適用して変換係数を生成する。
【選択図】図2
Description
本願は、2009年10月20日に日本に出願された特願2009−241904号、および、2009年11月13日に日本に出願された特願2009−259856号に基づき優先権を主張し、その内容をここに援用する。
H.264/AVCに規定される動画像符号化方式では、動画像符号化装置は、マクロブロック単位に分割された入力動画像を近似する予測画像を生成し、入力動画像と予測画像の差分である予測残差を算出する。さらに、動画像符号化装置は、算出された予測残差に、離散コサイン変換(Discrete Cosign Transform;DCT)に代表される周波数変換を適用して変換係数を生成する。動画像符号化装置は、生成された変換係数を、CABAC(Context-based Adaptive Binary Arithmetic Coding)やCAVLC(Context-based Adaptive Variable Length Coding)と呼ばれる方法で可変長符号化する。
ここで、予測画像は、動画像の空間的な相関を利用するイントラ予測や、動画像の時間的な相関を利用するインター予測(動き補償予測)により生成される。
H.264/AVCでは、横16画素×縦16画素、横16画素×縦8画素、横8画素×縦16画素、横8画素×縦8画素、横8画素×縦4画素、横4画素×縦8画素、横4画素×縦4画素のパーティションサイズが規定されている。小さいパーティションサイズを利用すれば細かい単位で動きベクトルを指定して予測画像を生成できる。このため、動きの空間的な相関が小さい場合であっても入力動画像に近い予測画像を生成できる。一方、大きいパーティションサイズを利用すれば、動きの空間的な相関が大きい場合に、動きベクトルの符号化に要する符号量を低減できる。
この離散コサイン変換を行う際、H.264/AVCでは、複数種の変換サイズの離散コサイン変換から動画像の局所的性質に適合した離散コサイン変換を選択する方式(ブロック適応変換選択)が採用されている。例えば、インター予測により予測画像を生成する場合は、8×8DCTと4×4DCTの二種類の離散コサイン変換から、予測残差の変換に適用する離散コサイン変換を選択する。8×8DCTは、横8画素×縦8画素の領域に離散コサイン変換を行う変換であり、4×4DCTは、横4画素×縦4画素の領域に離散コサイン変換を行う変換である。8×8DCTは、広い範囲で画素値の空間相関を利用できるため、高周波成分が比較的少ない平坦な領域に対して有効である。一方、4×4DCTは、物体の輪郭を含むような高周波成分の多い領域で有効である。なお、H.264/AVCでは、パーティションの面積が8×8画素以上の場合に8×8DCTと4×4DCTとのいずれかを選択できる。パーティションの大きさが横8画素×縦8画素未満の場合には4×4DCTを選択する。
このように、H.264/AVCでは、動画像の局所的性質である画素値の空間相関や動きベクトルの空間相関の高低に応じて好適なパーティションサイズや変換サイズを選択することにより、符号化データの符号量を削減できる。
さらに、8×8DCTと4×4DCTのどちらのサイズの周波数変換を適用するかについては、実際に周波数変換を実行した結果のレート歪コストを評価して決定しており、符号化の計算処理量が増大してしまうという課題があった。
この動画像符号化装置は、パーティションをまたぐ変換対象領域に周波数変換を適用するので、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像符号化装置は、互いに異なるパーティションに含まれる変換対象領域を統合した領域を、上述のパーティションをまたぐ変換対象領域の1つとするので、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像符号化装置は、変換統合情報を出力するので、動画像復号装置は、出力された変換統合情報に基づいて復号動画像を生成することができる。
この動画像符号化装置は、予測画像上で変換対象領域に対応する領域画像の特徴量に基づいて、パーティションをまたぐ変換対象領域における予測残差の空間相関が高いか否かを判断するので、空間相関が高いと判断した変換対象領域に1つの周波数変換を適用することによって、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像符号化装置は、予測画像の画素値に基づいて、パーティションをまたぐ変換対象領域における予測残差の空間相関が高いか否かを判断するので、空間相関が高いと判断した変換対象領域に1つの周波数変換を適用することによって、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
また、空間相関が高いか否かを、予測画像を用いて判断するので、動画像復号装置においても同一の判断を行うことができ、動画像符号化装置が動画像復号装置に対して統合した変換対象領域のデータ送信を省略できる。したがって、送信データの符号量を低減させることができる。
この動画像符号化装置は、予測モードが等しいか否かと、該予測モードが特定の予測モードに等しいか否かと、該予測モードが示す予測方向の類似性と、一方の変換対象領域に対応する領域における参照画素が他方の変換対象領域に対応する領域に含まれるか否かの、いずれかまたは複数に基づいて、パーティションをまたぐ変換対象領域における予測残差の空間相関が高いか否かを判断するので、空間相関が高いと判断した変換対象領域に1つの周波数変換を適用することによって、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
また、空間相関が高いか否かを、予測モードを用いて判断するので、動画像復号装置においても同一の判断を行うことができ、動画像符号化装置が動画像復号装置に対して統合した変換対象領域のデータ送信を省略できる。したがって、送信データの符号量を低減させることができる。
この動画像符号化装置は、参照画像の同一性や動きベクトルを用いて、互いに異なるパーティションに含まれる変換対象領域を統合した領域における予測残差の空間相関が高いか否かを判断するので、空間相関が高いと判断した変換対象領域に1つの周波数変換を適用することによって、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
また、空間相関が高いか否かを、参照画像の同一性や動きベクトルを用いて判断するので、参照画像の情報や動きベクトルの出力を受けた動画像復号装置においても同一の判断を行うことができ、動画像符号化装置が動画像復号装置に対して統合した変換対象領域のデータ送信を省略できる。したがって、送信データの符号量を低減させることができる。
この動画像符号化装置は、統合するか否かを判断する領域の変換係数、あるいは、統合した場合と統合しない場合とにおける符号量またはレート歪コストのいずれかまたは両方を比較した結果に基づいて、互いに異なるパーティションに含まれる変換対象領域を統合した領域における予測残差の空間相関が高いか否かを判断するので、空間相関が高いと判断した変換対象領域に1つの周波数変換を適用することによって、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像符号化装置は、統合済み変換選択情報を生成する。この動画像符号化装置が統合済み変換選択情報を出力することにより、動画像復号装置は、出力された統合済み変換選択情報に基づいて復号動画像を生成することができる。
この動画像符号化装置は、分割パターンを用いることによって、マクロブロックをパーティションをまたぐ領域を含む領域に分割するので、分割された領域に周波数変換を適用する際に、パーティションをまたぐ領域に1つの周波数変換を適用することができ、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像符号化装置は分割パターンを示す情報を出力するので、動画像復号装置は、出力された分割パターンに基づいて復号動画像を生成することができる。
この動画像符号化装置は、空間相関を示す指標に基づいて互いに隣接する変換対象領域を統合した領域を変換対象領域の1つとするので、符号化効率を高めることができる。
この動画像符号化装置は、予測画像上で、前記互いに隣接する変換対象領域に対応する領域内の画素のうち、互いに隣接する画素の画素値の差分に基づいて、前記互いに隣接する変換対象領域を統合するので、空間相関が高いと判断した領域を統合し、統合した領域に1つの周波数変換を適用することにより、符号化効率を高めることができる。
この動画像符号化装置は、予測画像上で当該互いに隣接する変換対象領域に対応する領域における予測モードが等しいか否かと、該予測モードが特定の予測モードに等しいか否かと、予測モードが示す予測方向の類似性と、一方の変換対象領域に対応する領域における参照画素が他方の変換対象領域に対応する領域に含まれるか否かの、いずれかまたは複数に基づいて、当該変換対象領域を統合するので、空間相関が高いと判断した領域を統合し、統合した領域に1つの周波数変換を適用することにより、符号化効率を高めることができる。
この動画像符号化装置は、変換統合情報を出力するので、動画像復号装置は、この変換統合情報に基づいて逆周波数変換を行うことができる。
この動画像復号装置は、パーティションをまたぐ変換対象領域に逆周波数変換を適用して局所復号画像を生成するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、符号化データに含まれる変換統合情報に基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、パーティションをまたぐ変換対象領域を、当該領域の空間相関を示す指標に基づいて決定するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、対象領域中の互いに隣接し、かつ、異なるパーティションに属する画素各々に対応する予測画像上の画素値の差分を、この対象領域の空間相関を示す指標とする。この指標に基づいてパーティションをまたぐ変換対象領域を決定することにより、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、対象領域中の互いに隣接し、かつ、異なるパーティションに属する画素各々に対応する予測画像上で、当該変換対象領域における予測モードが等しいか否かと、該予測モードが特定の予測モードに等しいか否かと、予測モードが示す予測方向の類似性と、一方の変換対象領域に対応する領域における参照画素が他方の変換対象領域に対応する領域に含まれるか否かの、いずれかまたは複数を、この対象領域の空間相関を示す指標とする。この指標に基づいてパーティションをまたぐ変換対象領域を決定することにより、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、対象領域が含まれる2つのパーティションの各々に対して、選択されている参照画像が同一か否かと、この対象領域が含まれる2つのパーティションの動きベクトルの大きさの差と、前記動きベクトルの大きさの比率との、いずれかを、この対象領域の空間相関を示す指標とする。この指標に基づいてパーティションをまたぐ変換対象領域を決定することにより、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、統合済み変換選択情報に基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、分割パターンに基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、入力データに含まれる分割パターンに基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、予測画像再構築部が選択する分割パターンに基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、統合された変換対象領域に逆周波数変換を適用して局所復号画像を生成するので、動画像符号化装置が領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、変換統合情報に基づいて変換対象領域を決定することにより、動画像符号化装置が領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号装置は、変換対象領域決定部が、空間相関を示す指標に基づいて変換対象領域を決定するので、動画像符号化装置が領域を統合し、かつ、変換統合情報を出力しない場合にも、復号動画像を生成することができる。
この動画像復号装置は、互いに隣接する変換対象領域中の互いに隣接する画素各々に対応する予測画像上の画素値の差分を、空間相関を示す指標とすることにより、動画像符号化装置が領域を統合し、かつ、変換統合情報を出力しない場合にも、復号動画像を生成することができる。
この動画像復号装置は、対象領域中の互いに隣接する変換対象領域に対応する予測画像上で、当該変換対象領域における予測モードが等しいか否かと、該予測モードが特定の予測モードに等しいか否かと、予測モードが示す予測方向の類似性と、一方の変換対象領域に対応する領域における参照画素が他方の変換対象領域に対応する領域に含まれるか否かの、いずれかまたは複数を、空間相関を示す指標とすることにより、動画像符号化装置が領域を統合し、かつ、変換統合情報を出力しない場合にも、復号動画像を生成することができる。
この動画像符号化・復号システムでは、動画像符号化装置は、パーティションをまたぐ領域に周波数変換を適用するので、パーティション境界を挟んで隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。また、動画像復号装置は、動画像符号化装置が周波数変換を適用したパーティションをまたぐ領域を示す情報に基づいて逆周波数変換を適用するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像符号化・復号システムでは、動画像符号化装置は、互いに隣接する領域に周波数変換を適用するので、互いに隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。また、動画像復号装置は、動画像符号化装置が周波数変換を適用した互いに隣接する領域を示す情報に基づいて逆周波数変換を適用するので、動画像符号化装置が互いに隣接する領域を統合した場合にも、復号動画像を生成することができる。
この動画像符号化方法では、動画像符号化装置が、互いに隣接する変換対象領域を統合して周波数変換を適用するので、互いに隣接する複数領域が高い空間相関を有する場合に符号化効率を向上させることができる。
この動画像復号方法では、動画像復号装置が、パーティションをまたぐ変換対象領域に逆周波数変換を適用して局所復号画像を生成するので、動画像符号化装置が互いに異なるパーティションに含まれる領域を統合した場合にも、復号動画像を生成することができる。
この動画像復号方法では、動画像復号装置が、互いに隣接する変換対象領域に逆周波数変換を適用して局所復号画像を生成するので、動画像符号化装置が互いに隣接する領域を統合した場合にも、復号動画像を生成することができる。
以下、図面を参照して、本発明の実施の形態について説明する。
以下では、本発明の実施形態における動画像符号化装置および動画像復号装置が行う処理とH.264/AVCで規定される処理との異同を適宜示すが、本発明はH.264/AVCに限らず、VC−1やMPEG−2(Moving Picture Experts Group phase 2)やAVS(Audio Video Coding Standard)等、マクロブロック単位で画像を処理し動き補償予測および周波数変換を行う様々な動画像符号化・復号方式を用いた動画像符号化装置及び動画像復号装置に適用できる。ここでいう周波数変換とは、二次元行列をサンプリングデータとして離散コサイン変換などにより同形の二次元行列のデータに変換する変換であり、画素値を周波数領域のデータに変換することによって、画素値の空間相関性によるデータの冗長性を排除して符号量を減少されるために行われる。
図1は、本発明の第1の実施形態における動画像符号化・復号システム1の概略構成を示す構成図である。
同図において、動画像符号化・復号システム1は、動画像符号化装置10と動画像復号装置20とを含んで構成される。動画像符号化装置10は、画像入力部61と中央処理装置(Central Processing Unit;CPU)62と、メモリ63と符号化データ出力部64とバス65とを含んで構成される。動画像復号装置20は、符号化データ入力部71と中央処理装置72とメモリ73と画像出力部74とバス75とを含んで構成される。
同図において、動画像符号化装置10は、画像入力部61と、符号化部32と、局所復号画像記憶部33と、符号化データ出力部64とを含んで構成される。符号化部32は、予測パラメータ決定部(パーティション構造決定部)102と予測画像生成部103と予測残差生成部106と周波数変換決定部(周波数変換領域分割部)105と変換係数生成部107と可変長符号化部108と予測残差再構築部109と局所復号画像生成部110とを含んで構成される。
同図において、図1の各部と対応する部分には同一の符号(61、64)を付す。
画像入力部61は、図1で説明したように、動画像が入力されると、入力された動画像をマクロブロック単位に分割する。画像入力部61は、分割した画像をマクロブロック毎に、符号化部32の予測パラメータ決定部102と予測残差生成部106とに出力する。
符号化部32において、予測パラメータ決定部102と予測画像生成部103と予測残差生成部106とは、H.264/AVCと同様のフレーム間予測を行う。
予測パラメータ決定部102は、画像入力部61から出力されるマクロブロック単位の画像の画素値に基づいて、局所復号画像記憶部33が記憶する局所復号画像の中から参照画像を選択し、参照画像から予測画像を生成するためのパラメータである予測パラメータを生成する。予測パラメータについては後述する。動画像符号化装置10は、動画像復号装置20と同一の局所復号画像を記憶するために、処理対象のマクロブロックの画像と予測画像との差分である予測残差に対して、周波数変換を行った後、逆周波数変換を行って予測残差を再構築し、再構築した予測残差に予測画像を足し合わせて局所復号画像を生成し、局所復号画像記憶部33に記憶する。予測パラメータ決定部102は、生成した予測パラメータを周波数変換決定部105と予測画像生成部103と可変長符号化部108とに出力する。
予測画像生成部103は、生成した予測画像を予測残差生成部106と局所復号画像生成部110とに出力する。
予測残差生成部106は、画像入力部61から出力されるマクロブロック単位の画像と、予測画像生成部103から出力される予測画像との画素毎の値の差を取って、予測残差を生成し、生成した予測残差を周波数変換決定部105と変換係数生成部107とに出力する。
変換係数生成部107は、周波数変換決定部105が出力する周波数変換方法に基づいて、予測残差生成部106が出力する予測残差を周波数変換して変換係数を生成する。変換係数生成部107は、生成した変換係数を可変長符号化部108と予測残差再構築部109とに出力する。
可変長符号化部108は、生成した符号化データを符号化データ出力部64に出力する。
予測残差再構築部109は、周波数変換決定部105から入力される変換選択情報及び変換統合情報に基づいて、変換係数生成部107から出力される変換係数を逆周波数変換して予測残差を再構築する。予測残差再構築部109は、再構築した予測残差を局所復号画像生成部110に出力する。
局所復号画像生成部110は、予測画像生成部103から出力される予測画像と予測残差再構築部109が出力する再構築した予測残差との画素毎の値の和を取って局所復号画像を生成する。局所復号画像生成部110は、生成した局所復号画像を局所復号画像記憶部33に書き込む。
符号化データ出力部64は、図1で説明したように、可変長符号化部108から出力される符号化データを動画像符号化装置10の外部に出力する。
図3は、動画像符号化装置10が符号化データを生成する処理手順を示すフローチャートである。動画像符号化装置10は、画像入力部61に動画像が入力されると、符号化データを生成する処理を開始する。
ステップS101において画像入力部61は、入力される動画像をマクロブロック単位に分割する。動画像符号化装置10は、入力される動画像のフレームをマクロブロック単位に分割し、マクロブロック毎に符号化データを作成する。そのために、画像入力部61は、入力される動画像のフレームを横16画素×縦16画素のマクロブロックに分割する。
画像入力部61は、分割したデータを予測パラメータ決定部102と予測残差生成部106とに出力する。
なお、画像入力部61が、横16画素×縦16画素以外の大きさのマクロブロック単位に画像データを分割するようにしてもよい。例えば、横12画素×縦12画素でもよいし、横16画素×縦12画素など、縦と横の画素数が異なっていてもよい。また、画像入力部61が、図4に示す以外の順序で、マクロブロック単位の画像データを出力するようにしてもよい。例えば、画像入力部61が、同一列内で上から下へ順に画像データを出力し、これを左から右へ1列毎に行うようにしてもよい。
ステップS103〜S105において、予測パラメータ決定部102と予測画像生成部103と予測残差生成部106とは、H.264/AVCで規定されるフレーム間予測(動き補償予測、インター予測)と同様のフレーム間予測を行う。
ステップS103において、予測パラメータ決定部102は、画像入力部61から出力される画像データの画素値に基づいて、画像データをさらに分割するパーティション構造を決定し、パーティション毎に参照画像を選択し、参照画像から予測画像を生成するための予測パラメータを生成する。ここでいうパーティションは、予測画像を生成する際の単位領域であり、後述するように、予測画像生成部103はパーティション毎に予測画像を生成し、生成した予測画像を結合してマクロブロックの予測画像を生成する。また、参照画像は予測画像を生成する元となる画像であり、予測パラメータ決定部102は、局所復号画像記憶部33が記憶する局所復号画像の中から参照画像を選択する。上述したように、局所復号画像は、処理済みのマクロブロックの復号画像である。
同図のパーティション構成MB1は、マクロブロックを分割しない一分割の場合のパーティション構成を示す。この場合、マクロブロックは、横16画素×縦16画素の1個のパーティションで構成され、このパーティションにはパーティションインデックス「p0」が付される。ここで、パーティションインデックスは、マクロブロック内のパーティションを識別するインデックスである。
また、パーティション構成MB2は、マクロブロックを水平方向に二等分する水平二分割の場合のパーティション構成を示す。このパーティション構造では、マクロブロックは横16画素×縦8画素の2個のパーティションで構成される。上のパーティションにはパーティションインデックス「p0」が付され、下のパーティションにはパーティションインデックス「p1」が付される。
パーティション構造MB4は、マクロブロックを水平方向及び垂直方向に各々二等分する四分割の場合のパーティション構造を示す。このパーティション構造では、マクロブロックは横8画素×縦8画素の4個のパーティションで構成される。左上のパーティションにはパーティションインデックス「p0」が付され、右上のパーティションにはパーティションインデックス「p1」が付され、左下のパーティションにはパーティションインデックス「p2」が付され、右下のパーティションにはパーティションインデックス「p3」が付される。
パーティション構造SBM1は、サブマクロブロックを分割しない一分割の場合のパーティション構造を示す。このパーティション構造では、サブマクロブロックは横8画素×縦8画素の1個のサブパーティションで構成され、このサブパーティションにはサブパーティションインデックス「p0」が付される。ここで、サブパーティション番号は、パーティション内のサブパーティションを識別するインデックスである。
また、パーティション構造SMB2は、サブマクロブロックを水平方向に二等分する水平二分割の場合のパーティション構造を示す。このパーティション構造では、サブマクロブロックは横8画素×縦4画素の2個のパーティションで構成される。上のサブパーティションにはサブパーティションインデックス「p0」が付され、下のサブパーティションにはサブパーティションインデックス「p1」が付される。
パーティション構造SMB4は、サブマクロブロックを水平方向及び垂直方向に各々二等分する四分割の場合のパーティション構造を示す。このパーティション構造では、サブマクロブロックは横4画素×縦4画素の4個のサブパーティションで構成される。左上のサブパーティションにはサブパーティションインデックス「p0」が付され、右上のサブパーティションにはサブパーティションインデックス「p1」が付され、左下のサブパーティションにはサブパーティションインデックス「p2」が付され、右下のサブパーティションにはサブパーティションインデックス「p3」が付される。
同図に示すように、予測パラメータは、パーティション構造情報と、各パーティションの動き情報として参照画像インデックスと動きベクトルの情報とを含んで構成される。
パーティション構造情報は、予測パラメータ決定部が選択したパーティション構造を示す情報である。例えば、同図の「P_L0_L0_16×8」の、「16×8」は、当該マクロブロックが、横16画素×縦8画素大きさの2個のパーティションに分割されることを示す。すなわち、当該マクロブロックは、図5のパーティション構造MB2が示す各パーティションに分割される。「L0_L0」は2個のパーティションが、いずれも参照画像リスト0を用いることを示す。なお、「P」は、前方向予測のみを用いて符号化されるブロックであることを示す。
動きベクトルは、動き補償において、参照画像の画素をずらす量を示す。例えば、同図の「(0.25,−1.25),(0.0,0.75)」の、「(0.25,−1.25)」は、予測画像のうち1番目のパーティションの部分は、参照画像を右に0.25画素分ずらし、下に1.25画素分ずらして生成することを示す。また、「(0.0,0.75)」は、予測画像のうち2番目のパーティションの部分は、参照画像を左右には動かさず、上に0.75画素分ずらして生成することを示す。
なお、予測パラメータ決定部102は、イントラ予測を行うことを決定した場合は、イントラ予測における予測画像生成方法を示す予測パラメータを生成するが、ここでは説明を省略する。ここでいう、イントラ予測とは、フレーム間予測を用いないマクロブロックに対して、入力動画像の同一フレーム内で当該マクロブロックに隣接し、符号化および復号済みの画素からの補間によって予測画像を生成する方法である。
予測パラメータ決定部102は、レート歪判定を用いて予測パラメータを生成する。具体的には、予測パラメータ決定部102は、パーティション構造と参照画像と動きベクトルとの、可能なあらゆる組み合わせで得られる予測パラメータ候補を生成する。予測パラメータ決定部102は、生成した予測パラメータ候補の各々に対して、式(1)に基づいてレート歪コストCを算出し、レート歪コストCが最小となる予測パラメータの候補を予測パラメータとして選択する。
なお、予測パラメータ決定部102がレート歪コストCを算出する際に、適用可能な周波数変換が複数存在する場合は、適用可能な全ての周波数変換についてレート歪コストを算出し、最小のレート歪コストを、当該予測パラメータ候補のレート歪コストとする。あるいは、予め定められた特定の周波数変換を適用して得られるレート歪コストを当該予測パラメータ候補のレート歪コストとするようにしてもよい。
予測パラメータ決定部102は、生成した予測パラメータを周波数変換決定部105と予測画像生成部103と可変長符号化部108とに出力する。
ステップS121において、予測画像生成部103は、予測パラメータからパーティション構造情報を読み出す。
ステップS122において、予測画像生成部103は、ステップS123、124からなるパーティション毎の処理のループを開始する。予測画像生成部103は、各パーティションを図6で説明した順に処理する(以下のフローチャートにおいても同様である)。
ステップS123において、予測画像生成部103は、予測パラメータから処理対象のパーティションの参照画像インデックスを読み出し、読み出した参照画像インデックスに基づいて、局所復号画像記憶部33から参照画像を読み出す。
ステップS124において、予測画像生成部103は、予測パラメータから処理対象のパーティションの動きベクトルを読み出し、読み出した動きベクトルに基づいて参照画像に対する動き補償を行う。具体的には、予測画像生成部103は、動きベクトルが示す画素分だけ参照画像をずらす。
ステップS125において、未処理のパーティションがあればステップS122からのループを繰り返し、無ければステップS126に進む。
ステップS126において、予測画像生成部103は、動き補償を行った各参照画像の当該パーティション部分をつなぎ合わせて予測画像を生成し、生成した予測画像を、予測残差生成部106と局所復号画像生成部110とに出力する。
その後、当該マクロブロックに用いる予測画像を生成する処理を終了する。
予測残差生成部106は、生成した予測残差を、周波数変換決定部105と変換係数生成部107とに出力する。
図8は、周波数変換決定部105が選択した周波数変換によって決定される変換対象領域の構成例を示す図である。ここでいう変換対象領域とは、1回の周波数変換により変換係数に変換されるマクロブロック内の領域である。同図は、周波数変換決定部105が、マクロブロックを横8画素×縦8画素の4個のパーティションp0〜p3のうち、パーティションp0及びp1に対しては4×4DCTを適用し、パーティションp2及びp3に対しては8×8DCTを適用することを決定した場合の例を示す。
同図のパーティションp0やp1のように、パーティションの大きさよりも周波数変換の大きさが小さい場合は、周波数変換決定部105は、予測残差のパーティションを周波数変換の大きさの各領域に分割し、分割された各領域が変換対象領域となる。例えば、同図のパーティションp0は、4つの変換対象領域r0〜r3に分割される。一方、同図のパーティションp2やp3のように、パーティションの大きさと周波数変換の大きさが同じ場合は、パーティションによって分割された領域全体が1個の変換対象領域となる。動画像符号化装置10及び動画像復号装置20の各部は、同一パーティション内の変換対象領域を、左の変換対象領域から右の変換対象領域へ順に処理し、これを上から下に順に繰り返す。さらに、複数のパーティションにわたって変換対象領域を処理する場合は、左のパーティションから右のパーティションへ順に上記の処理を行い、これを上のパーティションから下のパーティションに順に繰り返す。
以下で説明する動画像符号化装置及び動画像復号装置も同様である。
同図に示すように、変換選択情報は、各パーティションに適用する周波数変換を示す情報がパーティションの順番に従って並べられて構成される。同図では、周波数変換決定部105が、各パーティションに適用する周波数変換として、図8で説明した周波数変換を選択した場合の変換選択情報の例が示されている。パーティションp0及びp1の欄の「4×4」は、パーティションp0及びp1に4×4DCTを適用することを示し、パーティションp2及びp3の欄の「8×8」は、パーティションp2及びp3に8×8DCTを適用することを示している。
ステップS141において、周波数変換決定部105は、パーティション毎の処理のループを開始する。
すなわち、まず、ステップS142〜ステップS145において、周波数変換決定部105は、パーティションに適用する周波数変換の候補を選択する。
ステップS142において、周波数変換決定部105は、変換プリセットの各要素に対する処理のループを開始する。ここでいう、変換プリセットとは、動画像符号化装置10がマクロブロックに適用可能な全ての周波数変換の集合である。動画像符号化装置10は、変換プリセットの要素として、H.264/AVCと同じ4×4DCTと8×8DCTとに加えて4×8DCTと8×4DCTと16×16DCTと16×8DCTと8×16DCTとの7種類の周波数変換を具備する。ここで、m×nDCTは、横m画素×縦n画素を周波数変換のサイズ(周波数変換の対象領域の縦横の画素数。以下、「変換サイズ」ともいう)とする離散コサイン変換を示す。
なお、動画像符号化装置10の変換プリセットは上記の集合に限らず、上記の集合の部分集合であってもよい。あるいは、別の変換サイズの離散コサイン変換、例えば4×16DCTや16×4DCTを含む周波数変換を変換プリセットに含めてもよいし、離散コサイン変換以外の周波数変換、例えばアダマール変換やサイン変換やウェーブレット変換、またはそれらの変換を近似する変換を含む周波数変換を変換プリセットに含めてもよい。
ステップS144において、周波数変換決定部105は、ステップS142からのループにおいて処理対象となっている周波数変換を、パーティションに適用する周波数変換の候補(以下では、「変換候補」ともいう)に加える。例えば、横16画素×縦8画素のパーティションに対して、周波数変換決定部105は、変換プリセットの中から横16画素×縦8画素以下の、4×4DCTと8×8DCTと4×8DCTと8×4DCTと16×8DCTとを変換候補とする。
なお、周波数変換決定部105が選択する変換候補の数を減らすようにしてもよい。例えば、横16画素×縦8画素のパーティションに対し、4×4DCTと8×8DCTのみを変換候補とするようにしてもよい。例えば、変換プリセットの要素数を減らすことにより、変換候補の数を減らすことができる。変換候補の数を減らすことにより、以後の処理量を削減することができる。また、変換プリセットの要素数を減らすことにより、周波数変換を示すインデックスの符号長を短くして符号量の増加を抑制できる。
ステップS146〜ステップS149において、周波数変換決定部105は、変換候補の各々のレート歪コストを算出し、レート歪コストが最小の周波数変換をパーティションに適用する周波数変換として選択する。
すなわち、まず、ステップS146において、周波数変換決定部105は、ステップS142〜ステップS145のループで選択した各変換候補に対する処理のループを開始する。
ステップS147において、周波数変換決定部105は、ステップS146からのループにおいて処理対象となっている周波数変換のレート歪コストを、前述の式(1)に基づいて算出する。
ステップS149において、周波数変換決定部105は、レート歪コストが最小となる周波数変換を当該パーティションに適用する周波数変換として選択する。
ステップS150において、未処理のパーティションがあればステップS141からのループを繰り返し、無ければマクロブロック内の各パーティションについて周波数変換を選択する処理を終了する。
周波数変換決定部105が、パーティション境界を挟んで隣接する複数の領域を統合することを決定し、変換係数生成部107が、周波数変換決定部105の決定に従って予測残差を周波数変換することにより、動画像符号化装置10は、パーティション境界を挟んで隣接する複数の領域を統合した領域に対して周波数変換を行って符号化効率を向上させることができる。
同図(b)は、周波数変換決定部105が、同図(a)に示される変換対象領域のうち、パーティションp0の変換対象領域r1とパーティションp1の変換対象領域r0とを統合することを決定した例を示している。
同図に示すように、変換統合情報は、パーティションインデックスと統合対象領域インデックスと、統合方向インデックスと周波数変換の情報とを含んで構成される。周波数変換決定部105は、変換対象領域の統合毎に変換統合情報を生成する。
パーティションインデックスは、統合される領域のうち処理される順序が早い方が含まれるパーティションを示すインデックスである。統合対象領域インデックスは、統合される領域のうち処理される順序が早い方の、パーティション内での位置を示すインデックスである。パーティションインデックスと統合対象領域インデックスとによって、統合される領域のうち処理される順序が早い方の、マクロブロック内における位置が示される。統合方向インデックスは、統合される領域のうち処理される順序が早い方から見た、統合される領域のうち処理される順序が遅い方の方向を示すインデックスである。
周波数変換の情報は、統合される領域に適用する周波数変換を示す情報である。図12の例では、統合される領域に対して8×4DCTを適用することが示されている。
なお、周波数変換決定部105が生成する変換統合情報は、図12の構造のものに限らず、統合される領域を示すものであればよい。例えば、変換統合情報が、統合される領域全てのパーティションインデックスと統合対象領域インデックスとの組と、統合される領域に適用する周波数変換の情報とを含んで構成されるようにしてもよい。
ステップS161において、周波数変換決定部105は、変換対象領域i(iは0〜(N−2)の整数、Nはマクロブロック内の変換対象領域の個数)に対する処理を行うループを開始する。ここで変換対象領域に付されている番号は、図8で説明した変換対象領域の処理順序に応じた番号である。
ステップS162において、周波数変換決定部105は、変換対象領域j(jは(i+1)〜Nの整数)に対する処理を行うループを開始する。
条件C131:変換対象領域iおよび変換対象領域jは互いに隣接する。かつ、変換対象領域iと変換対象領域jとは、互いに異なるパーティションに含まれる。かつ、変換対象領域iと変換対象領域jとを合わせた領域が、矩形を成す。
この判断により、周波数変換決定部105は、パーティションをまたぐ領域のみを以下のステップS165およびステップS167の処理対象とする。
条件C131が成立すると判断した場合(ステップS163:YES)はステップS164に進み、成立しないと判断した場合(ステップS163:NO)はステップS167に進む。
同図は、パーティションp0の変換対象領域r3とパーティションp1の変換対象領域r2とが、統合に適した特性を有するか否かを判断する場合の例を示している。また、両変換対象領域間の境界が境界bであり、境界bの画素単位の長さは4画素分である。パーティションp0の変換対象領域r3は、境界bに接する画素br1[1]〜br1[4]を含み、パーティションp1の変換対象領域r2は、境界bに接する画素br2[1]〜br2[4]を含む。周波数変換決定部105は、式(2)に従って、互いに接する画素br1[k](kは0〜3の整数)とbr2[k]との画素値の差の絶対値|brv1[k]−brv2[k]|の合計値を算出し、算出した合計値が閾値Thより小さいか否かを判断する。
ステップS165において、周波数変換決定部105は、予測残差の変換対象領域iと変換対象領域jとに適用する新たな周波数変換t’を選択する。周波数変換決定部105は、統合後の変換対象領域の大きさと同じ変換サイズの離散コサイン変換を新たな周波数変換t’として選択する。例えば、元の2個の変換対象領域が横W画素×縦H画素であり、これらの変換対象領域が上下に並んでいる場合は、横W画素×縦2H画素の周波数変換を選択する。一方、これらの変換対象領域が左右に並んでいる場合は、横2W画素×縦H画素の周波数変換を選択する。これにより、新たに選択される周波数変換t’は、元の2個の変換対象領域を合わせた領域を変換対象領域とする。
なお、周波数変換t’が変換プリセットに含まれない場合でも、周波数変換決定部105が統合を行うようにしてもよい。この場合は、例えば、周波数変換決定部105が変換プリセットに新たな周波数変換を加え、動画像符号化装置10は、動画像復号装置20に新たな周波数変換を加えた周波数プリセットを出力する。このように、周波数変換t’が変換プリセットに含まれない場合でも、統合を行うことにより、隣接する変換対象領域間の空間相関を利用して変換係数の符号長を短くすることができる。
ステップS167において、変換対象領域(i+1)〜Nのうち、未処理の変換対象領域があれば、ステップS162からのループを繰り返し、無ければステップS168に進む。
ステップS168において、変換対象領域0〜(N−2)のうち、未処理の変換対象領域があれば、ステップS161からのループを繰り返し、無ければパーティション内の変換対象領域を統合するか否かを判定する処理を終了する。
周波数変換決定部105は、生成した変換選択情報と変換統合情報とを、変換係数生成部107と可変長符号化部108と予測残差再構築部109とに出力する。
以上のように、周波数変換決定部105は、処理対象のマクロブロックを変換対象領域に分割し、さらに変換対象領域を統合することにより、処理対象のマクロブロックをパーティションをまたぐ領域(ステップS165で統合される変換対象領域)を含む変換対象領域に分割する。
なお、図13のフローチャートでは、変換対象領域の全ての組み合わせに対してステップS163の判定を行っているが、このステップS163において、まず、明らかに条件C131を満たさない組み合わせか否かを判断した後に、条件C131を満たすか否かを判断するようにしてもよい。例えば、図11(b)のパーティションp0の変換対象領域r0のように、マクロブロック内の他のパーティションと接しない変換対象領域が判断対象となっている場合は、明らかに条件C131を満たさない。そこで、周波数領域105が、マクロブロック内の他のパーティションと接しない変換対象領域を予め記憶しておき、この変換対象領域が判断対象となっている場合は、ステップS163において、条件C131を満たすか否かを判断せずにステップS167に進む。これにより、処理量を抑制することができる。
なお、周波数変換決定部105が、統合が決定された後の変換対象領域を再度選択してさらに統合するようにしてもよい。この統合によって、より大きい領域を変換対象領域とし、動画像符号化装置10が出力する符号化データの符号化率を向上させることができる。例えば、図11の領域(f)において、パーティションp0の領域r3とパーティションp1の領域r2とを統合し、また、パーティションp2の領域r1とパーティションp3の領域r0とを統合することを決定している場合に、周波数変換決定部105は、パーティションp0の領域r3とパーティションp1の領域r2とを統合した領域と、パーティションp2の領域r1とパーティションp3の領域r0とを統合した領域をさらに統合して横8画素×縦8画素の変換対象領域を生成する。
一方、周波数変換決定部105が、統合を1段階のみとすれば、統合を表すために必要な符号量や統合判定の処理量の増加を抑制することができる。
さらには、周波数変換決定部105が、変換対象領域r1とr2との各々に対して周波数変換を適用し、この周波数変換の結果として得られる変換係数に基づいて、r1およびr2の統合適否を判定するようにしてもよい。例えば、r1から得られる変換係数とr2から得られる変換係数とが全て、予め設定された閾値以下である場合は、両者の空間相関が高く、統合に適していると判断する。あるいは、変換対象領域r1とr2とを統合した場合と統合しない場合との符号量またはレート歪コストを比較して、r1およびr2の統合適否を判定するようにしてもよい。
なお、処理対象のマクロブロック内のパーティションpがサブパーティションを有する場合、サブパーティションにおける変換対象領域については統合を行わないようにしてもよい。あるいは、マクロブロックをサブマクロブロックと読み替え、パーティションをサブパーティションと読み替えて、周波数変換決定部105が、図13の処理を再帰的に適用するようにしてもよい。さらには、パーティションpがサブパーティションを有する場合に限らず、処理単位が16画素×16画素と異なるブロックである場合、たとえば32画素×32画素のブロックである場合などについても、周波数変換決定部105が、図13の処理を行うことにより統合適否を判定することができる。
具体的には、変換係数生成部107は、変換選択情報および変換統合情報に基づいて各変換対象領域に適用する周波数変換を選択して、選択した周波数変換を予測残差の各変換対象領域に適用する。変換選択情報によって示される周波数変換は、変換プリセットに含まれる周波数変換のいずれかである。
図15は、変換係数生成部107がパーティション内の変換対象領域に周波数変換を適用する処理を示す擬似コードである。ここで、領域R(x,y,W,H)は、パーティション内の左上隅を起点として右方向にx画素、下方向にy画素移動した位置を左上隅とする横W画素×縦H画素の変換対象領域を示す。
変換係数生成部107は、パーティション内に含まれる横M個×縦N個の変換対象領域に対して、同図の擬似コードで示されるように、左の変換対象領域から右の変換対象領域へと順に、変換対象領域毎に横W画素×縦H画素の変換サイズを有する周波数変換を適用する。これを上から下へ順次繰り返す。
なお、変換係数生成部107が予測残差から変換係数を生成する処理に量子化を行う過程が含まれていてもよい。例えば、変換係数生成部107が、生成した変換係数を量子化するようにしてもよい。
予測残差再構築部109は、再構築した予測残差を局所復号画像生成部110へ出力する。
なお、局所復号画像生成部110が、生成した局所復号画像に対してフィルタを適用することによって、ブロック境界に発生するブロック歪や量子化誤差を低減させるようにしてもよい。この場合は、動画像復号装置20も、生成した局所復号画像に対して同一のフィルタを適用し、動画像符号化装置10と動画像復号装置20とが同一の局所復号画像を生成するようにする。
局所復号画像生成部110は、生成した局所復号画像を局所復号画像記憶部33に書き込む。
可変長符号化部108は、まず、変換係数と予測パラメータとを、H.264/AVCに定められた方法で可変長符号化する。その際、可変長符号化部108は、パーティションをまたぐ領域の周波数変換によって生成された変換係数をパーティション境界に基づいて分割することにより、H.264/AVCに定められた方法と同様にパーティション毎に可変長符号化する。
まず、可変長符号化部108は、変換選択情報に含まれる、各パーティションに適用する周波数変換を示すインデックスを、例えばハフマン符号を用いて可変長符号化する。なお、可変長符号化部108が行う符号化は、可変長符号化に限らず、動画像復号装置20が情報の損失無しに復号可能な符号化、すなわち可逆符号化であれば任意のものでよい。例えば、可変長符号化部108は、変換プリセットの要素数をsとした場合に2のt乗がs以上となる最小の正整数tを用いて、インデックスをtビットで2進化して得られるビット列を符号化データとする。変換係数や予測パラメータ等、変換選択情報以外のデータについても同様に、可変長符号化部108が行う符号化は、可逆符号化であれば任意のものでよい。
次に、可変長符号化部108は、変換統合情報の各々について、統合された領域の位置を示すパーティションインデックスと統合対象領域インデックスと統合方向インデックスと、統合された領域に適用された周波数変換を示すインデックスとを符号化する。例えば、パーティションインデックスは、p0〜p3の何れかの値をとっており、可変長符号化部108は、このパーティションインデックスを、例えばハフマン符号を用いて可変長符号化データにする。また、統合対象領域インデックスはr0〜r7のいずれかの値をとり、可変長符号化部108は、この統合対象領域インデックスを、例えばハフマン符号を用いて可変長符号化データにする。また、統合方向インデックスは、rightまたはdownのいすれかの値をとり、可変長符号化部108は、この統合方向インデックスを、例えば1ビットの符号化データにする。
一方、動画像符号化装置10が変換統合情報を出力するようにすれば、動画像復号装置20は、統合された領域の推定を行う必要がなく、演算量を削減できる。
まず、パーティション内に統合の対象となり得る変換対象領域が1つしかない場合は、統合対象領域インデックスを省略できる。例えば、図11(e)のパーティションp1には変換対象領域が1つしかないので、統合対象領域インデックスを省略できる。
また、統合可能な方向が1方向のみの場合は、統合方向インデックスを省略できる。例えば、図11(b)のパーティションp0の領域r1は、右方向のみマクロブロック内の他のパーティションと接するので、統合方向インデックスを省略できる。
また、上述のように、統合された領域の大きさから周波数変換を決定できるので、周波数変換の情報を省略できる。逆に、周波数変換の情報から変換対象領域が決定可能な場合には、変換対象領域に関する情報、例えば、パーティションインデックスや統合対象領域インデックス、統合方向インデックスのいずれかあるいは全てを省略してもよい。
ステップS201において、可変長符号化部108は、周波数変換決定部105が処理対象のマクロブロックに対して決定したパーティション構造が四分割か否かを判断する。四分割であると判断した場合(ステップS201:YES)はステップS203に進み、四分割以外であると判断した場合(ステップS201:NO)はステップS202に進む。
ステップS202において、可変長符号化部108は、処理対象のマクロブロック内の各パーティションに適用する変換選択情報および変換統合情報を符号化する。その後、変換選択情報及び変換統合情報を符号化する処理を終了する。
ステップS204において、可変長符号化部108は、処理対象のサブマクロブロック内の各サブパーティションに適用する変換選択情報を符号化する。
ステップS205において、未処理のサブマクロブロックが残っていればステップS203からのループを繰り返し、残っていなければステップS206へ進む。
ステップS206において、可変長符号化部108は、マクロブロックを四分割した横8画素×縦8画素のサブマクロブロック0〜3の各々に対する処理のループを開始する。
ステップS207において、可変長符号化部108は、処理対象のサブマクロブロック内の各サブパーティションに適用する変換統合情報を符号化する。
ステップS208において、未処理のサブマクロブロックが残っていればステップS206からのループを繰り返し、残っていなければ変換選択情報及び変換統合情報を符号化する処理を終了する。
以上により、動画像符号化装置10は、パーティション境界を挟んで隣接する変換対象領域を統合して、1つの周波数変換を適用する。
図17は、動画像復号装置20の機能ブロック構成の概略を示す機能ブロック構成図である。
同図において、動画像復号装置20は、符号化データ入力部71と復号部42と局所復号画像記憶部43と画像出力部74とを含んで構成される。復号部42は、可変長符号復号部(可逆符号復号部)201と予測画像生成部103と周波数変換導出部(変換対象領域決定部)111と予測残差再構築部109と局所復号画像生成部110とを含んで構成される。
同図において、図1の各部に対応する部分および図2の各部に対応する部分には同一の符号(71、74、103、109、110)を付し、説明を省略する。
符号化データ入力部71は、動画像符号化装置10の符号化データ出力部64(図2)が出力するマクロブロック毎の符号化データが入力されると、入力された符号化データを、復号部42の可変長符号復号部201に出力する。
復号部42において、可変長符号復号部201は、符号化データ入力部71から出力される符号化データから、予測パラメータと変換選択情報と変換統合情報とを復号する。可変長符号復号部201は、復号した予測パラメータを予測画像生成部103と周波数変換導出部111とに出力し、復号した変換選択情報と変換統合情報とを周波数変換導出部111に出力する。また、可変長符号復号部201は、符号化データ入力部71から出力される符号化データから変換係数を復号する。可変長符号復号部201は、復号した変換係数を予測残差再構築部109に出力する。
局所復号画像記憶部43は、図1のメモリ73を用いて実現される。局所復号画像記憶部43は、局所復号画像生成部110が生成する局所復号画像、すなわち、動画像符号化装置10が動画像を分割したマクロブロックを、符号化データから複合した画像である局所復号画像を記憶する。
画像出力部74は、局所復号画像生成部110から出力される局所復号画像を結合してフレーム単位の復号画像を生成し、動画像復号装置20の外部に出力する。
同図に示すように、統合済み変換選択情報には、マクロブロック内の各変換対象領域の大きさが示される。統合済み変換選択情報には、各変換対象領域の左上端の画素の位置を基準として、上に位置する変換対象領域から順に変換対象領域の大きさが示され、上下関係が同じ場合は、左に位置する変換対象領域から順に変換対象領域の大きさが示される。
周波数変換導出部111は、予測パラメータからパーティション構造を読み出し、変換選択情報から各パーティションに適用する周波数変換を読み出して、統合前の変換対象領域の構成を取得する。そして、周波数変換導出部111は、変換統合情報に基づいて、統合後の変換対象領域の構成を取得し、統合済み変換選択情報を生成する。
図19は、動画像復号装置20が復号動画像を生成する処理手順を示すフローチャートである。動画像復号装置20は、マクロブロック単位の符号化データが外部から順次入力されると、入力された符号化データをマクロブロック毎に処理する同図の処理を開始する。
ステップS221において、動画像復号装置20は、符号化データをマクロブロック毎に処理するループを開始する。
ステップS222において、符号化データ入力部71は、外部から1マクロブロック分の符号化データの入力を受けて、可変長符号復号部201に出力する。可変長符号復号部201は、符号化データ入力部71から出力された符号化データから、処理対象のマクロブロックの予測パラメータを復号する。可変長符号復号部201は、復号した予測パラメータを予測画像生成部103と周波数変換導出部111とに出力する。
ステップS224において、周波数変換導出部111は、可変長符号復号部201から出力された予測パラメータと変換選択情報と変換統合情報とに基づいて、統合済み変換選択情報を生成する。周波数変換導出部111は、生成した統合済み変換選択情報を予測残差再構築部109に出力する。
ステップS225において、可変長符号復号部201は、符号化データ入力部71から出力された符号化データから変換係数を復号する。可変長符号復号部201は、復号した変換係数を予測残差再構築部109に出力する。
ステップS227において、予測残差再構築部109は、周波数変換導出部111から出力された統合済み変換選択情報により規定される周波数変換に対応する逆周波数変換を、可変長符号復号部201から出力された変換係数に適用して、処理対象のマクロブロックに対応する予測残差を生成する。したがって、可変長符号復号部201から出力される変換係数に、動画像符号化装置10が、互いに異なるパーティションに含まれる領域を統合した領域を対象として予測残差を周波数変換して生成した変換係数が含まれる場合には、予測残差再構築部109は、互いに異なるパーティションに含まれる領域を統合した領域を示す情報である変換統合情報に基づいて、周波数変換導出部111は統合済み変換対象領域を決定し、統合済み変換選択情報にて示す変換対象領域毎に逆周波数変換を適用して予測残差を生成する。
予測残差再構築部109は、生成した予測残差を局所復号画像生成部110に出力する。
ステップS229において、入力される符号化データの全てを処理した場合は復号動画像を生成する処理を終了し、残りの符号化データがある場合はステップS221からのループを繰り返す。入力される符号化データの全てを処理したか否かは、例えば、動画像符号化装置10が、符号化データの終わりを示す信号を出力し、符号化データ入力部71がこのデータを検出することにより判定する。
なお、周波数変換決定部105の説明で述べたように、動画像符号化装置10が変換統合情報を出力しない場合も、動画像復号装置20が復号動画像を生成することができる。この場合は、周波数変換導出部111は、可変長符号復号部201が復号する予測パラメータや、局所復号画像記憶部43が記憶する局所復号画像を用いて変換統合情報を生成し、生成した変換統合情報と可変長符号復号部201が復号する変換選択情報とに基づいて統合済み変換選択情報を生成する。
ステップS241において、可変長符号復号部201は、変換選択情報を復号する。可変長符号復号部201は、復号した変換選択情報を周波数変換導出部111に出力する。ステップS242において、周波数変換導出部111は、図13で説明した周波数変換決定部105が変換統合情報を生成する処理と同じ処理を行って変換統合情報を生成する。ステップS243において、周波数変換導出部111は、生成した変換統合情報と可変長符号復号部201から出力される変換選択情報とに基づき、統合済み変換選択情報を生成する。その後、統合済み変換選択情報を生成する処理を終了する。
なお、周波数変換決定部105が、図13で説明した処理以外の処理によって統合の適否を判定する場合も、ステップS242において、周波数変換導出部111は、周波数変換決定部105と同じ処理を行う。例えば、周波数変換決定部105が、変換対象領域r1の参照画像と変換対象領域r2の参照画像とが同一であり、変換対象領域r1の動きベクトルmv1と換対象領域r2の動きベクトルmv2との大きさの差が閾値以下であることを条件とする場合は、周波数変換導出部111も同一の条件を用いて変換統合情報を生成する。
なお、動画像符号化装置10が統合済み変換選択情報を生成して符号化して出力するようにしてもよい。動画像復号装置20は、動画像符号化装置10が生成する統合済み変換選択情報を用いて符号化データを復号することができる。
この場合、動画像符号化装置10の周波数変換決定部105は、変換選択情報と変換統合情報を可変長符号化部に出力する代わりに、周波数変換導出部111が統合済み変換選択情報を生成するのと同じ手順で統合済み変換選択情報を生成して可変長符号化部108に出力する。可変長符号化部108は、周波数変換決定部105から出力された統合済み変換選択情報を符号化して符号化データとして出力する。このようにすれば、動画像復号装置20は、統合済み変換選択情報を生成する必要がなくなるので、周波数変換導出部111を具備する必要がなく、装置の構成を簡単化できる。
また、動画像復号装置20は、動画像符号化装置10が統合した変換対象領域に基づいて周波数逆変換を行うので、動画像符号化装置10が生成した符号化データを復号して復号動画像を生成することができる。
具体的には、図13のステップS163で、条件C131から、互いに異なるパーティション領域に含まれる変換対象領域とする条件を除いた条件「変換対象領域iおよび変換対象領域jは互いに隣接する。かつ、変換対象領域iと変換対象領域jとを合わせた領域が、矩形を成す。」を適用することにより、同一のパーティションに含まれるか、異なるパーティションに含まれるかに関わらず、互いに隣接する変換対象領域を対象とすることができる。同一パーティション内に含まれる変換対象領域に対する上記判定および統合を行うことで、符号化効率をさらに高めることができる。
動画像符号化装置10は、パーティション境界を挟んで隣接する変換対象領域を統合するか否かに関わらず、同一パーティション内に含まれ、互いに隣接する変換対象領域の空間相関が高いか否かを判断し、空間相関が高いと判断した変換対象領域を統合する。あるいは、動画像符号化装置10が、パーティション境界を挟んで隣接する変換対象領域を統合した場合に、さらに同一パーティション内に含まれ、互いに隣接する変換対象領域の空間相関が高いか否かを判断し、空間相関が高いと判断した変換対象領域を統合するようにしてもよい。パーティション境界を挟んで隣接する変換対象領域を統合するか否かに関わらず、同一パーティション内に含まれる変換対象領域に対する上記判定および統合を行うことで、符号化効率をより高めることができる。一方パーティション境界を挟んで隣接する変換対象領域を統合する場合に、同一パーティション内に含まれる変換対象領域に対する上記判定および統合を行うことで、動画像符号化装置10が行う処理量の増大を抑えることができる。
図21は、本発明の第2の実施形態における動画像符号化装置11の機能ブロック構成の概略を示す機能ブロック構成図である。
同図において、動画像符号化装置11は、画像入力部61と、符号化部52と、局所復号画像記憶部33と、符号化データ出力部64とを含んで構成される。符号化部52は、予測パラメータ決定部(パラメータ構造決定部)102と予測画像生成部103と予測残差生成部106と周波数変換決定部(周波数変換領域分割部)112と変換係数生成部107と可変長符号化部113と予測残差再構築部109と局所復号画像生成部110とを含んで構成される。
同図において、図2の動画像符号化装置10の各部に対応する部分には同一の符号(33、61、64、102、103、106、107、109、110)を付し、説明を省略する。
動画像符号化装置11は、周波数変換決定部112が、予測画像の各パーティションに対する周波数変換選択後の統合処理を行わずに、予測画像のパーティション境界にわたる分割パターンを用いて周波数変換の決定を行う点で図2の動画像符号化装置10と異なる。
同図に示すように、分割パターンは、マクロブロックを横または縦に分割してできる領域のパターンである。分割パターンは、マクロブロック内の同一の周波数変換を適用する領域を表す。周波数変換決定部112は、動き補償のためにマクロブロックを分割するパーティションとは独立に分割パターンを選択する。
周波数変換決定部112は、図22(a)〜(g)に示す分割パターンを使用する。
同図(a)は、マクロブロックを分割しない一分割の場合の分割パターンを示す。同図(b)は、マクロブロックを横16画素×縦8画素の2つの領域に分割する二分割の場合の分割パターンを示す。同図(c)は、マクロブロックを横8画素×縦16画素の2つの領域に分割する二分割の場合の分割パターンを示す。同図(d)は、マクロブロックを横8画素×縦8画素の4つの領域に分割する四分割の場合の分割パターンを示す。同図(e)は、マクロブロックを上下には8画素毎に二分割し、左右には4画素、8画素、4画素の順に三分割することにより、マクロブロックを6つの領域に分割する場合の分割パターンを示す。同図(f)は、マクロブロックを上下には4画素、8画素、4画素の順に三分割し、左右には8画素毎に二分割することにより、マクロブロックを6つの領域に分割する場合の分割パターンを示す。同図(g)は、マクロブロックを上下、左右共に4画素、8画素、4画素の順に三分割することにより、マクロブロックを9つの領域に分割する場合の分割パターンを示す。
さらに、周波数変換決定部112が、図22(h)〜(j)に示す分割パターンや、これらの分割パターンを左または右に90度回転した分割パターンや180度回転した分割パターンも用いるようにしてもよい。
同図(h)は、マクロブロックを上下に8画素毎に分割し、下の領域をさらに左右に8画素毎に分割することにより、マクロブロックを3つの領域に分割する場合の分割パターンを示す。同図(i)は、マクロブロックを上下に8画素毎に分割し、下の領域をさらに左右に4画素、8画素、4画素の順に三分割することにより、マクロブロックを4つの領域に分割する場合の分割パターンを示す。同図(j)は、マクロブロックを上下に8画素毎に分割し、上の領域をさらに左右に8画素毎に分割し、下の領域をさらに左右に4画素、8画素、4画素の順に三分割することにより、マクロブロックを5つの領域に分割する場合の分割パターンを示す。
H.264/AVCでは、マクロブロックを4分割したパーティションにおいては4×4DCTと8×8DCTのいずれかを選択する。図22に示した分割パターンでは、同図(d)の分割パターンにて上記のパーティション選択および周波数変換の適用に対応できる。
なお、分割パターンは図22に例示したものに限らないが、分割してできる各領域の画素数が縦横共に、変換プリセットに含まれるいずれかの周波数変換のサイズの倍数(以下では「充填可能」ともいう)であることが望ましい。また、周波数変換決定部112が、パーティション構造や予測パラメータや画素値に基づいて分割パターンの集合を動的に生成あるいは変更するようにしてもよい。この場合、動画像符号化装置10は、動画像復号装置20に分割パターンの集合の情報を出力する。
ステップS261において、周波数変換決定部112は、予め定められた分割パターンの集合の各分割パターンについて処理を行うループを開始する。
ステップS262において、周波数変換決定部112は、ステップS261からのループで処理対象となっている分割パターンP内の領域毎に処理を行うループを開始する。
ステップS263において、周波数変換決定部112は、ループにおいて処理対象となっている領域uに適用する周波数変換を、変換プリセットから選択する。具体的には、充填可能な各周波数変換を適用した場合のレート歪コストを前述式(1)に基づいて計算して、レート歪コストを最小とする周波数変換を、領域uに適用する周波数変換とする。
ステップS264において、分割パターンP内に未処理の領域があれば、ステップS262からの処理のループを繰り返す。分割パターンP内の領域すべてについて処理済みであれば、ステップS265に進む。
ステップS265において、未処理の分割パターンがあれば、ステップS261からの処理のループを繰り返す。未処理の分割パターンが無い場合は、ステップS266に進む。
ステップS266において、周波数変換決定部112は、処理中のマクロブロックに最適な分割パターンを選択する。具体的には、ステップS261〜ステップS265において得られたレート歪コストを分割パターン毎に合計し、マクロブロック内でのレート歪コストの合計が最小となる分割パターンを選択する。
ステップS267において、周波数変換決定部112は、ステップS266において選択した分割パターンおよび、分割パターン内の領域において選択された周波数変換の情報を、変換選択情報として変換係数生成部107と予測残差再構築部109と可変長符号化部113とに出力する。その後、処理対象のマクロブロックに適用する周波数変換を決定する処理を終了する。
以上のようにして、周波数変換決定部112は、各マクロブロックにおいて適用する、分割パターンおよび各領域の周波数変換を決定する。多くの分割パターンを選択可能な場合、計算量が膨大になるが、例えば、ステップS263で行った周波数変換の結果を記憶し、後に同一の領域に同一の周波数変換を行う際に参照することにより計算量を削減できる。
可変長符号化部113は、生成した符号化データを符号化データ出力部64に出力する。
図24は、動画像符号化装置が符号化データを生成する処理手順を示すフローチャートである。
ステップS281〜ステップS285は、図3のステップS101〜ステップS105と同様である。
ステップS286において、周波数変換決定部112は、予測パラメータ決定部102から出力される予測パラメータと予測残差生成部106から出力される予測残差とに基づいて、処理対象のマクロブロックに適用する分割パターンと分割パターン内の各領域に適用する周波数変換とを決定し、分割パターンと各領域に適用する周波数変換とを示す変換選択情報を生成して、変換係数生成部107と可変長符号化部113と予測残差再構築部109とに出力する。
ステップS288において、予測残差再構築部109は、周波数変換決定部112が決定した分割パターンと周波数変換とに基づいて、変換係数生成部107が行った周波数変換の逆周波数変換を、変換係数生成部107から出力される変換係数に適用して、処理対象のマクロブロックの予測残差を再構築する。予測残差再構築部109は再構築した予測残差を局所復号画像生成部110に出力する。ステップS289は、図3のステップS110と同様である。
ステップS290において、可変長符号化部113は、変換係数と予測パラメータと分割パターンと変換選択情報とを符号化して符号化データを生成する。可変長符号化部113は、図2の可変長符号化部108と同様に、変換係数をパーティション毎に符号化する。可変長符号化部113は、生成した符号化データを符号化データ出力部64に出力する。符号化データ出力部64は、可変長符号化部113から出力された符号化データを動画像符号化装置11の外部に出力する。ステップS291は、図3のステップS112と同様である。
上記の手順により、動画像符号化装置11は、入力された動画像を符号化して符号化データを生成し、外部に出力する。
図25は、動画像復号装置21の機能ブロック構成の概略を示す機能ブロック構成図である。
同図において、動画像復号装置21は、符号化データ入力部71と復号部82と局所復号画像記憶部43と画像出力部74とを含んで構成される。復号部82は、可変長符号復号部202と予測画像生成部103と予測残差再構築部109と局所復号画像生成部110とを含んで構成される。
同図において、図17の各部に対応する部分には同一の符号(43、71、74、103、109、110)を付し、説明を省略する。
可変長符号復号部202は、符号化データ入力部71から出力される符号化データを復号して、予測パラメータと分割パターンと変換選択情報と変換係数とを生成する。具体的には、可変長符号復号部202は、まず、符号化データから予測パラメータおよび分割パターンを復号する。次に、可変長符号復号部202は、復号した分割パターンを利用して、符号化データから変換選択情報を復号する。そして、可変長符号復号部202は、復号した予測パラメータからパーティションの構造を読み出して、符号化データから変換係数を復号する。
可変長符号復号部202は、生成した予測パラメータと分割パターンと変換選択情報と変換係数とを、予測残差再構築部109と予測画像生成部103とに出力する。
ステップS301〜ステップS302は、図19のステップS221〜ステップS222と同様である。
ステップS303において、可変長符号復号部202は、入力された符号化データから、処理対象のマクロブロックに対応する分割パターンおよび変換選択情報を復号する。可変長符号復号部202は、復号した分割パターンおよび変換選択情報を、予測残差再構築部109へ出力する。
ステップS304〜ステップS305は図19のステップS225〜ステップS226と同様である。
ステップS306において、予測残差再構築部109は、可変長符号復号部202から出力される分割パターンおよび変換選択情報により規定される周波数変換に対応する逆周波数変換を、可変長符号復号部202から出力される変換係数に適用して、処理対象のマクロブロックの予測残差を再構築する。予測残差再構築部109は、再構築した予測残差を局所復号画像生成部110に出力する。
ステップS307〜ステップS308は、図19のステップS228〜ステップS229と同様である。
以上により、動画像復号装置21によれば、動画像符号化装置11が生成した符号化データから復号動画像を生成することができる。
図27は、分割パターンを選択する動画像復号装置22の構成を示す構成図である。
同図において、動画像復号装置22は、符号化データ入力部71と復号部92と局所復号画像記憶部43と画像出力部74とを含んで構成される。復号部92は、可変長符号復号部202と予測画像生成部103と予測残差再構築部209と局所復号画像生成部110とを含んで構成される。予測残差再構築部209は、分割パターン導出部203を含んで構成される。
同図において、図17の各部に対応する部分には同一の符号(43、71、74、103、110、202)を付し、説明を省略する。
分割パターン導出部203は、局所復号画像や予測パラメータに基づいて、動画像符号化装置11の周波数変換決定部112と同一の処理を行って分割パターンを選択する。
予測残差再構築部209は、分割パターン導出部203が選択した分割パターンを用いて、動画像復号装置21の予測残差再構築部109と同様に、処理対象のマクロブロックの予測残差を再構築する。予測残差再構築部209は、再構築した予測残差を局所復号画像生成部110に出力する。
これにより、動画像符号化装置11が分割パターンを示す情報を出力しない場合でも、動画像復号装置22は復号動画像を生成することができる。
また動画像復号装置21や動画像復号装置22は、動画像符号化装置11が生成した符号化データから復号動画像を生成することができる。
図28は、本発明の第3の実施形態における動画像符号化装置16の構成を示す構成図である。
同図において、動画像符号化装置16は、画像入力部61と、符号化部36と、局所復号画像記憶部33と、符号化データ出力部64とを含んで構成される。符号化部36は、予測パラメータ決定部(パーティション構造決定部、予測モード決定部)152と予測画像生成部153と予測残差生成部106と周波数変換決定部(周波数変換領域分割部)155と変換係数生成部107と可変長符号化部108と予測残差再構築部109と局所復号画像生成部110とを含んで構成される。
動画像符号化装置16は、マクロブロック毎にインター予測を行うかイントラ予測を行うかを決定し、決定に従って処理を行う。インター予測(動き補償予測)は、上記で説明したように、処理対象のマクロブロックと異なるフレームに含まれるマクロブロックの局所復号画像を用いて、処理対象のマクロブロックに類似する予測画像を生成することにより、符号化効率を高める方法である。一方、イントラ予測は、処理対象のマクロブロックと同一フレームに含まれる画素(処理対象のマクロブロック内で生成済みの予測画像の画素、または、処理対象のマクロブロックに隣接するマクロブロックの局所復号画像内の画素)を用いて、処理対象のマクロブロックに類似する予測画像を生成することにより、符号化効率を高める方法である。インター予測を行うと決定した場合に動画像符号化装置16が行う処理は、動画像符号化装置10と同様であり、予測パラメータ決定部152と予測画像生成部153と周波数変換決定部155とは、それぞれ図2の予測パラメータ決定部102と予測画像生成部153と周波数変換決定部155と同様に動作する。動画像符号化装置16が、イントラ予測を行うと決定した場合の処理については、以下で説明する。
予測パラメータ決定部152は、画像入力部61からマクロブロック単位の画像が入力されると、インター予測を行うかイントラ予測を行うかをマクロブロック毎に決定する。インター予測を行うかイントラ予測を行うかの決定は、公知の方法を用いることができる。例えば、予測パラメータ決定部152は、インター予測を行った場合のレート歪コストとイントラ予測を行った場合のレート歪コストとを式(1)に基づいて算出し、レート歪コストが小さいほうを選択する。なお、インター予測を行うかイントラ予測を行うかを動的に決定せず、予め決められたフレームまたは位置でのみイントラ予測を選択するようにしてもよい。また、イントラ予測を用いるかどうかをフレーム単位で決定するようにしてもよい。
周波数変換決定部155は、予測パラメータ決定部152から出力される予測パラメータに基づいて、予測残差生成部106から出力される予測残差に適用する周波数変換の変換対象領域を決定し、また、変換対象領域を統合するか否かを決定する。周波数変換決定部155は、決定した変換対象領域(周波数変換のサイズ)を示す変換選択情報と、統合する変換対象領域を示す変換統合情報とを生成し、変換係数生成部107と、予測残差再構築部109と、可変長符号化部108とに出力する。
同図は、パーティションのサイズが横4画素×縦4画素の場合の予測モードを示す。同図(a)に示すモード0では、パーティションの上に隣接する画素に基づいて縦方向に補間を行い、パーティションの予測画像を生成する。同図(b)に示すモード1では、パーティションの左に隣接する画素に基づいて横方向に補間を行い、パーティションの予測画像を生成する。同図(c)に示すモード2では、パーティションの左および上に隣接する画素値の平均を用いて補間を行い、パーティションの予測画像を生成する。同図(d)に示すモード3では、パーティションの上に隣接する画素に基づいて右上から左下方向に補間を行い、パーティションの予測画像を生成する。以下同様に、同図(e)に示すモード4と、同図(f)に示すモード5と、同図(g)に示すモード6と、同図(h)に示すモード7と、同図(i)に示すモード8とでは、図に矢印で示すように斜め方向に補間を行い、パーティションの予測画像を生成する。
予測パラメータ決定部152は、予測モードの各々について、パーティションに適用した場合のレート歪コストを式(1)に基づいて算出し、レート歪コストが最小となる予測モードを選択する。
ステップS321〜S322は、図3のステップS101〜S102と同様である。
ステップS323において、予測パラメータ決定部152は、イントラ予測を行うかインター予測を行うかを決定する。イントラ予測を行うと決定した場合(ステップS323:YES)はステップS324に進み、インター予測を行うと決定した場合(ステップS323:NO)はステップS341に進む。
さらに、予測パラメータ決定部152は、パーティション毎に予測モードを決定し、イントラ予測を選択したことと、決定したパーティションのサイズと、予測モードとを示す予測パラメータを生成する。予測パラメータ決定部152は生成した予測パラメータを周波数変換決定部155と、予測画像生成部153と、可変長符号化部108とに出力する。
ステップS327において、周波数変換決定部155は、図3のステップS106と同様に、パーティション毎に周波数変換を選択する。具体的には、周波数変換決定部155は、パーティションのサイズ以下の領域を変換対象領域とする周波数変換を、第1の実施形態の場合と同様の変換プリセットの中から選択する。
なお、H.264/AVCでは、パーティションが横4画素×縦4画素、横8画素×縦8画素、横16画素×縦16画素の場合に、それぞれ4×4DCT、8×8DCT、4×4DCTを適用するというように、パーティションのサイズに応じて周波数変換が一意に決定される。周波数変換決定部155が、このH.264/AVCと同様に周波数変換を決定するようにしてもよい。この場合は、ステップS324において予測パラメータ決定部152が横16画素×縦16画素のパーティションを選択した場合に、周波数変換決定部155は、ステップS327において周波数変換として4×4DCTを選択し、次に述べるステップ変換S328において対象領域の統合を行う。
さらには、パーティションのサイズも、上述した横4画素×縦4画素、横8画素×縦8画素、横16画素×縦16画素以外のサイズを用いるようにしてもよい。
ここで、周波数変換決定部155は、互いに隣接する変換対象領域が、同一のパーティションに含まれるか異なるパーティションに含まれるかにかかわらず、互いに隣接する変換対象領域を統合するか否かを決定する。具体的には、第1の実施形態のなお書きで説明したのと同様に、周波数変換決定部155は、前述の条件C131から、互いに異なるパーティション領域に含まれる変換対象領域とする条件を除いた条件「変換対象領域iおよび変換対象領域jは互いに隣接する。かつ、変換対象領域iと変換対象領域jとを合わせた領域が、矩形を成す。」を適用する。
なお、周波数変換決定部155が、上記以外の方法で変換対象領域を統合するか否かを決定するようにしてもよい。例えば、周波数変換決定部155が、互いに隣接する変換対象領域の予測モードが等しいか否か、あるいは、予測モードが特定の予測モードと等しいか否か、すなわち、図29に示されるような予測モードの種類のうちのいずれか特定の予測モードと等しいか否か、あるいは、予測モードの示す補間方向が互いに同一または類似するか否か、あるいは、一方の変換対象領域が他方の変換対象領域の画素を参照しているか否か、あるいは、これらを組み合わせた基準を、空間相関を示す指標とし、この空間相関を示す指標に基づいて統合する領域を決定するようにしてもよい。
ステップS341〜S349は、動画像符号化装置16がインター予測を行う場合の処理である。ステップS341にて、予測パラメータ決定部152は、インター予測を選択したことを示す情報を含む予測パラメータを生成する。それ以外は、ステップS341〜S349は図3のステップS103〜S111と同様である。ステップS349の後は、ステップS333に進む。
一方、周波数変換決定部155が、予測モードに基づいて変換対象領域を統合するか否かを決定する場合は、動画像復号装置も、動画像符号化装置16から出力される予測モードを示す情報を用いて動画像符号化装置16と同様の判定を行い、統合された変換対象領域を推定できるので、動画像符号化装置16が、変換統合情報を出力しないようにしてもよい。
なお、H.264/AVCに規定されるイントラ予測では、予測残差を周波数変換した後に、変換係数の直流(DC)成分の冗長性を取り除くために、さらにアダマール変換を行う場合がある。これに対して、動画像符号化装置16では、変換係数生成部107が、統合された変換対象領域に対して周波数変換を行うことにより、互いに隣接する領域の空間相関が変換係数に反映されているので、変換係数に、さらにアダマール変換を行う必要は無く、アダマール変換を行うことによる処理量の増大は無い。
図31は、動画像復号装置26の機能ブロック構成の概略を示す機能ブロック構成図である。
同図において、動画像復号装置26は、符号化データ入力部71と復号部46と局所復号画像記憶部43と画像出力部74とを含んで構成される。復号部46は、可変長符号復号部(可逆符号復号部)201と予測画像生成部163と周波数変換導出部(変換対象領域決定部)111と予測残差再構築部109と局所復号画像生成部170とを含んで構成される。
同図において、図17の各部に対応する部分には同一の符号(43、71、74、201、111、109)を付し、説明を省略する。
局所復号画像生成部170は、予測画像生成部163から出力されるパーティションの予測画像と、予測残差再構築部109から出力される予測残差とに基づいて、パーティションの局所復号画像を生成する。具体的には、局所復号画像生成部170は、パーティションの予測画像の各画素に、予測残差のうち対応する画素を足し合わせてパーティションの局所復号画像を生成する。局所復号画像生成部170は、生成したパーティションの局所復号画像を予測画像生成部163に出力する。これにより、予測画像生成部163は、同一マクロブロック内の他のパーティションの予測画像を生成する際に、局所復号画像生成部170から出力された画像を参照することができる。
また、局所復号画像生成部170は、パーティションの局所復号画像を結合して(マクロブロック単位の)局所復号画像を生成し、生成した局所復号画像を局所復号画像記憶部43と画像出力部74とに出力する。
ステップS381〜S385は、図19のステップS221〜S225と同様である。ステップS386は図19のステップS227と同様である。イントラ予測では、ステップS386で予測残差再構築部109が生成する予測残差を用いて、局所復号画像生成部170がパーティション毎に局所復号画像を生成し、生成したパーティション毎の局所復号画像を用いて、予測画像生成部163がパーティション毎に予測画像を生成するため、図19の場合と異なり、動画像復号装置26は、予測画像を生成する前に変換係数を逆周波数変換する。
ステップS388において、予測画像生成部163は予測画像を生成する。具体的には、上述したように、パーティション毎に予測画像を生成して局所復号画像生成部170に出力する。局所復号画像生成部170は、予測画像生成部163から出力されるパーティション毎の予測画像と予測残差生成部109から出力される予測残差とに基づいて、パーティションの局所復号画像を生成して予測画像生成部163に出力する。
ステップS389において、局所復号画像生成部170は、上述したように、パーティションの局所復号画像を結合して(マクロブロック単位の)局所復号画像を生成し、局所復号画像記憶部43と画像出力部74とに出力する。その後、ステップS392に進む。
ステップS390は、図19のステップS226と同様である。ステップS391〜S392は、図19のステップS228〜S229と同様である。
また、動画像復号装置26は、動画像符号化装置16が統合した変換対象領域に基づいて周波数逆変換を行うので、動画像符号化装置16が生成した符号化データを復号して復号動画像を生成することができる。
この場合も第2の実施形態の場合と同様に、動画像符号化装置16は、分割パターンに従って決定される各変換対象領域の空間相関が高い場合に、パーティション毎に周波数変換を行うよりも符号化効率を向上させることができる。また動画像復号装置21や動画像復号装置22は、動画像符号化装置11が生成した符号化データから復号動画像を生成することができる。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
10、11、16 動画像符号化装置
20、21、22、26 動画像復号装置
61 画像入力部
32、36、52 符号化部
33、43 局所復号画像記憶部
64 符号化データ出力部
71 符号化データ入力部
42、46、82、92 復号部
74 画像出力部
102、152 予測パラメータ決定部
103、153、163 予測画像生成部
105、112、155 周波数変換決定部
106 予測残差生成部
107 変換係数生成部
108、113 可変長符号化部
109 予測残差再構築部
110、170 局所復号画像生成部
111 周波数変換導出部
201、202 可変長符号復号部
203 分割パターン導出部
Claims (4)
- 入力動画像のフレームを符号化対象ブロック単位に分割する画像入力部と、
前記符号化対象ブロックをさらに予測単位に分割する予測単位構造決定部と、
前記符号化対象ブロックを、少なくとも一つの変換対象領域が前記予測単位をまたぐ領域を含む変換対象領域に分割する周波数変換領域分割部と、
前記周波数変換領域分割部が分割した変換対象領域の各々に周波数変換を適用して変換係数を生成する変換係数生成部と、
前記変換係数を可逆符号化した符号化データを出力する符号化データ出力部とを具備する動画像符号化装置であって、
前記周波数変換領域分割部は、前記予測単位構造決定部により分割された一つの予測単位の一部のみと一つの変換対象領域の一部のみが重なり、前記一つの予測単位に隣接した予測単位の一部と前記一つの変換対象領域の他の部分が重なるように前記一つの変換対象領域を分割することを特徴とする動画像符号化装置。 - 動画像を符号化した符号化データについて、可逆符号の復号と、復号対象ブロック単位への分割とを行う可逆符号復号部と、
前記復号対象ブロックを分割した変換対象領域であって、少なくとも一つの変換対象領域が予測単位をまたぐ変換対象領域を含む変換対象領域毎に、当該変換対象領域に応じた逆周波数変換を適用した局所復号画像を生成する局所復号画像生成部と、
前記局所復号画像を結合して動画像を生成し、出力する動画像出力部と、を具備する動画像復号装置であって、
前記局所復号画像生成部は、一つの予測単位の一部のみと一つの変換対象領域の一部のみが重なり、前記一つの予測単位に隣接した予測単位の一部と前記一つの変換対象領域の他の部分が重なるように前記一つの変換対象領域を分割することを特徴とする動画像復号装置。 - 動画像符号化装置が、入力動画像のフレームを符号化対象ブロック単位に分割する画像入力ステップと、
前記動画像符号化装置が、前記符号化対象ブロックをさらに予測単位に分割する予測単位構造決定ステップと、
前記動画像符号化装置が、前記符号化対象ブロックを、少なくとも一つの変換対象領域が前記予測単位をまたぐ領域を含む変換対象領域に分割する周波数変換領域分割ステップと、
前記動画像符号化装置が、前記周波数変換領域分割ステップにて分割した変換対象領域の各々に周波数変換を適用して変換係数を生成する変換係数生成ステップと、
前記動画像符号化装置が、前記変換係数を可逆符号化した符号化データを出力する符号化データ出力ステップと、を有する動画像符号化方法であって、
前記周波数変換領域分割ステップで、前記予測単位構造決定ステップで分割された一つの予測単位の一部のみと一つの変換対象領域の一部のみが重なり、前記一つの予測単位に隣接した予測単位の一部と前記一つの変換対象領域の他の部分が重なるように前記一つの変換対象領域を分割することを特徴とする動画像符号化方法。 - 動画像復号装置が、動画像を符号化した符号化データについて、可変長符号の復号と、復号対象ブロック単位への分割とを行う可変長復号ステップと、
前記動画像復号装置が、前記復号対象ブロックを分割した変換対象領域であって、少なくとも一つの変換対象領域が予測単位をまたぐ変換対象領域を含む変換対象領域毎に、当該変換対象領域に応じた逆周波数変換を適用した局所復号画像を生成する局所復号画像生成ステップと、
前記動画像復号装置が、前記局所復号画像を結合して動画像を生成し、出力する動画像出力ステップと、を有する動画像復号方法であって、
前記局所復号画像生成ステップで、一つの予測単位の一部のみと一つの変換対象領域の一部のみが重なり、前記一つの予測単位に隣接した予測単位の一部と前記一つの変換対象領域の他の部分が重なるように前記一つの変換対象領域を分割することを特徴とする動画像復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014116865A JP5873528B2 (ja) | 2009-10-20 | 2014-06-05 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009241904 | 2009-10-20 | ||
JP2009241904 | 2009-10-20 | ||
JP2009259856 | 2009-11-13 | ||
JP2009259856 | 2009-11-13 | ||
JP2014116865A JP5873528B2 (ja) | 2009-10-20 | 2014-06-05 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011537276A Division JP5562346B2 (ja) | 2009-10-20 | 2010-10-20 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016004964A Division JP6097415B2 (ja) | 2009-10-20 | 2016-01-14 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014195324A true JP2014195324A (ja) | 2014-10-09 |
JP5873528B2 JP5873528B2 (ja) | 2016-03-01 |
Family
ID=43900343
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011537276A Active JP5562346B2 (ja) | 2009-10-20 | 2010-10-20 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
JP2014116865A Active JP5873528B2 (ja) | 2009-10-20 | 2014-06-05 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
JP2016004964A Active JP6097415B2 (ja) | 2009-10-20 | 2016-01-14 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
JP2017028397A Ceased JP2017112639A (ja) | 2009-10-20 | 2017-02-17 | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、プログラム、および記録媒体 |
JP2018020415A Active JP6454801B2 (ja) | 2009-10-20 | 2018-02-07 | 動画像復号装置、動画像復号方法、動画像符号化装置、および動画像符号化方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011537276A Active JP5562346B2 (ja) | 2009-10-20 | 2010-10-20 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016004964A Active JP6097415B2 (ja) | 2009-10-20 | 2016-01-14 | 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法 |
JP2017028397A Ceased JP2017112639A (ja) | 2009-10-20 | 2017-02-17 | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、プログラム、および記録媒体 |
JP2018020415A Active JP6454801B2 (ja) | 2009-10-20 | 2018-02-07 | 動画像復号装置、動画像復号方法、動画像符号化装置、および動画像符号化方法 |
Country Status (10)
Country | Link |
---|---|
US (3) | US20120213278A1 (ja) |
EP (1) | EP2493198B1 (ja) |
JP (5) | JP5562346B2 (ja) |
CN (5) | CN104601996B (ja) |
BR (1) | BR112012009142B1 (ja) |
EA (5) | EA201691820A1 (ja) |
HK (4) | HK1210340A1 (ja) |
MX (1) | MX2012004501A (ja) |
MY (2) | MY157320A (ja) |
WO (1) | WO2011049119A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016129872A1 (ko) * | 2015-02-12 | 2016-08-18 | 엘지전자(주) | 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치 |
WO2017057923A1 (ko) * | 2015-09-29 | 2017-04-06 | 엘지전자(주) | 단일 최적화된 그래프를 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 |
WO2017057922A1 (ko) * | 2015-09-29 | 2017-04-06 | 엘지전자 주식회사 | 그래프 기반 리프팅 변환을 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치 |
KR20190044629A (ko) * | 2016-09-07 | 2019-04-30 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104601996B (zh) * | 2009-10-20 | 2018-04-10 | 夏普株式会社 | 运动图像编码装置、运动图像解码装置、运动图像编码方法及运动图像解码方法 |
EP2533539A2 (en) * | 2010-02-02 | 2012-12-12 | Humax Co., Ltd. | Image encoding/decoding method for rate-distortion optimization and apparatus for performing same |
US8494290B2 (en) * | 2011-05-05 | 2013-07-23 | Mitsubishi Electric Research Laboratories, Inc. | Method for coding pictures using hierarchical transform units |
SG10201902297VA (en) | 2011-06-24 | 2019-04-29 | Mitsubishi Electric Corp | Moving image encoding device, moving image decoding device, moving image encoding method, and moving image decoding method |
US9787982B2 (en) * | 2011-09-12 | 2017-10-10 | Qualcomm Incorporated | Non-square transform units and prediction units in video coding |
CN102710938A (zh) * | 2012-05-08 | 2012-10-03 | 东莞中山大学研究院 | 一种基于非均匀dct的视频处理方法及其装置 |
JP5969408B2 (ja) * | 2013-01-31 | 2016-08-17 | Kddi株式会社 | 映像圧縮フォーマット変換装置、映像圧縮フォーマット変換方法、およびプログラム |
JP2016106444A (ja) * | 2013-03-26 | 2016-06-16 | パナソニック株式会社 | 動画像符号化装置および動画像符号化方法 |
EP3107296B1 (en) * | 2014-02-10 | 2021-08-18 | Nec Corporation | Video encoding apparatus, video encoding method, and video encoding program |
US10382792B2 (en) * | 2015-02-13 | 2019-08-13 | Lg Electronics Inc. | Method and apparatus for encoding and decoding video signal by means of transform-domain prediction |
US10212444B2 (en) * | 2016-01-15 | 2019-02-19 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
US11223852B2 (en) | 2016-03-21 | 2022-01-11 | Qualcomm Incorporated | Coding video data using a two-level multi-type-tree framework |
CN114222139A (zh) * | 2016-05-28 | 2022-03-22 | 世宗大学校产学协力团 | 视频信号的解码方法 |
WO2018008678A1 (ja) * | 2016-07-08 | 2018-01-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 復号装置、符号化装置、復号方法及び符号化方法 |
EP3800891A1 (en) | 2016-10-04 | 2021-04-07 | Ki Baek Kim | Image data encoding/decoding method and apparatus |
KR102416804B1 (ko) * | 2016-10-14 | 2022-07-05 | 세종대학교산학협력단 | 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체 |
US10848788B2 (en) | 2017-01-06 | 2020-11-24 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
CA3173525A1 (en) * | 2017-04-21 | 2018-10-25 | Zenimax Media Inc. | Systems and methods for game-generated motion vectors |
JP7224280B2 (ja) * | 2017-07-17 | 2023-02-17 | ビー1、インスティテュート、オブ、イメージ、テクノロジー、インコーポレイテッド | 画像データ符号化/復号化方法及び装置 |
CN110490213B (zh) * | 2017-09-11 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置及存储介质 |
US10504462B2 (en) * | 2018-01-25 | 2019-12-10 | Qualcomm Incorporated | Non-linear processing of two-dimensional data |
EP3788783A1 (en) * | 2018-04-30 | 2021-03-10 | InterDigital VC Holdings, Inc. | Flexible implementations of multiple transforms |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5562346B2 (ja) * | 2009-10-20 | 2014-07-30 | シャープ株式会社 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09505188A (ja) * | 1993-11-15 | 1997-05-20 | ナショナル・セミコンダクター・コーポレイション | 4分木構造walsh変換符号化 |
US6633611B2 (en) * | 1997-04-24 | 2003-10-14 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for region-based moving image encoding and decoding |
US5920359A (en) * | 1997-05-19 | 1999-07-06 | International Business Machines Corporation | Video encoding method, system and computer program product for optimizing center of picture quality |
US5887084A (en) * | 1997-11-07 | 1999-03-23 | Polaroid Corporation | Structuring a digital image into a DCT pyramid image representation |
US6489995B1 (en) * | 1998-10-22 | 2002-12-03 | Sony Corporation | Method and apparatus for motion vector concealment |
US6222883B1 (en) * | 1999-01-28 | 2001-04-24 | International Business Machines Corporation | Video encoding motion estimation employing partitioned and reassembled search window |
JP2000270329A (ja) * | 1999-03-17 | 2000-09-29 | Sanyo Electric Co Ltd | オブジェクト指向符号化における領域分割方法および領域分割装置 |
EP2458865A3 (en) * | 2001-06-29 | 2014-10-01 | NTT DoCoMo, Inc. | Apparatuses for image coding and decoding |
US6842484B2 (en) * | 2001-07-10 | 2005-01-11 | Motorola, Inc. | Method and apparatus for random forced intra-refresh in digital image and video coding |
EP2099228B1 (en) * | 2001-09-14 | 2014-11-12 | NTT DoCoMo, Inc. | Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program |
JP2003250161A (ja) * | 2001-12-19 | 2003-09-05 | Matsushita Electric Ind Co Ltd | 符号化装置及び復号化装置 |
EP1322121A3 (en) * | 2001-12-19 | 2003-07-16 | Matsushita Electric Industrial Co., Ltd. | Video encoder and decoder with improved motion detection precision |
JP2003319394A (ja) * | 2002-04-26 | 2003-11-07 | Sony Corp | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム |
US7027515B2 (en) * | 2002-10-15 | 2006-04-11 | Red Rock Semiconductor Ltd. | Sum-of-absolute-difference checking of macroblock borders for error detection in a corrupted MPEG-4 bitstream |
DE10310023A1 (de) * | 2003-02-28 | 2004-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Anordnung zur Videocodierung, wobei die Videocodierung Texturanalyse und Textursynthese umfasst, sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium |
US7379608B2 (en) * | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
JP4213646B2 (ja) * | 2003-12-26 | 2009-01-21 | 株式会社エヌ・ティ・ティ・ドコモ | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。 |
US8731054B2 (en) * | 2004-05-04 | 2014-05-20 | Qualcomm Incorporated | Method and apparatus for weighted prediction in predictive frames |
US20050259734A1 (en) * | 2004-05-21 | 2005-11-24 | Timothy Hellman | Motion vector generator for macroblock adaptive field/frame coded video data |
JP2006140758A (ja) * | 2004-11-12 | 2006-06-01 | Toshiba Corp | 動画像符号化方法、動画像符号化装置および動画像符号化プログラム |
JP2006148615A (ja) * | 2004-11-22 | 2006-06-08 | Hitachi Ltd | 復号化装置および符号化方法をコンピュータに実行させるためのプログラム |
JP2006246351A (ja) * | 2005-03-07 | 2006-09-14 | Matsushita Electric Ind Co Ltd | 画像符号化装置および画像復号化装置 |
KR100896279B1 (ko) * | 2005-04-15 | 2009-05-07 | 엘지전자 주식회사 | 영상 신호의 스케일러블 인코딩 및 디코딩 방법 |
US7961783B2 (en) * | 2005-07-07 | 2011-06-14 | Mediatek Incorporation | Methods and systems for rate control in video encoder |
KR100678958B1 (ko) * | 2005-07-29 | 2007-02-06 | 삼성전자주식회사 | 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더 |
KR100718135B1 (ko) * | 2005-08-24 | 2007-05-14 | 삼성전자주식회사 | 멀티 포맷 코덱을 위한 영상 예측 장치 및 방법과 이를이용한 영상 부호화/복호화 장치 및 방법 |
KR100647192B1 (ko) * | 2005-09-01 | 2006-11-23 | 삼성전자주식회사 | 데이터의 복원 시간을 단축하는 데이터 압축 장치 및 그방법 |
CN103118252B (zh) * | 2005-09-26 | 2016-12-07 | 三菱电机株式会社 | 运动图像编码装置以及运动图像译码装置 |
US7916796B2 (en) * | 2005-10-19 | 2011-03-29 | Freescale Semiconductor, Inc. | Region clustering based error concealment for video data |
US7843995B2 (en) * | 2005-12-19 | 2010-11-30 | Seiko Epson Corporation | Temporal and spatial analysis of a video macroblock |
US7949054B2 (en) * | 2006-06-01 | 2011-05-24 | Microsoft Corporation | Flexible data organization for images |
JP2007325027A (ja) * | 2006-06-01 | 2007-12-13 | Oki Electric Ind Co Ltd | 画像分割方法、画像分割装置、および画像分割プログラム |
JPWO2008012918A1 (ja) * | 2006-07-28 | 2009-12-17 | 株式会社東芝 | 画像符号化と復号の方法及び装置 |
JP4712643B2 (ja) * | 2006-08-17 | 2011-06-29 | 富士通セミコンダクター株式会社 | フレーム間予測処理装置、フレーム間予測方法、画像符号化装置及び画像復号装置 |
JP4592656B2 (ja) * | 2006-08-17 | 2010-12-01 | 富士通セミコンダクター株式会社 | 動き予測処理装置、画像符号化装置および画像復号化装置 |
CA2674164A1 (en) * | 2006-12-28 | 2008-07-17 | Thomson Licensing | Detecting block artifacts in coded images and video |
US8548056B2 (en) * | 2007-01-08 | 2013-10-01 | Qualcomm Incorporated | Extended inter-layer coding for spatial scability |
US8295633B2 (en) * | 2007-04-04 | 2012-10-23 | Samsung Electronics Co., Ltd. | System and method for an adaptive de-blocking filter after decoding of compressed digital video |
US8571104B2 (en) * | 2007-06-15 | 2013-10-29 | Qualcomm, Incorporated | Adaptive coefficient scanning in video coding |
US8139875B2 (en) * | 2007-06-28 | 2012-03-20 | Mitsubishi Electric Corporation | Image encoding device, image decoding device, image encoding method and image decoding method |
JP4325708B2 (ja) * | 2007-07-05 | 2009-09-02 | ソニー株式会社 | データ処理装置、データ処理方法およびデータ処理プログラム、符号化装置、符号化方法および符号化プログラム、ならびに、復号装置、復号方法および復号プログラム |
JP2009055236A (ja) * | 2007-08-24 | 2009-03-12 | Canon Inc | 映像符号化装置及び方法 |
JP5286805B2 (ja) * | 2008-01-31 | 2013-09-11 | 沖電気工業株式会社 | 動きベクトル検出装置及び方法、動画像符号化装置及び方法、並びに、動画像復号化装置及び方法 |
JP5130983B2 (ja) | 2008-03-25 | 2013-01-30 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
JP2009241904A (ja) | 2008-03-31 | 2009-10-22 | Mitsubishi Fuso Truck & Bus Corp | 2階建てバス |
JP2009259856A (ja) | 2008-04-11 | 2009-11-05 | Sumitomo Metal Mining Co Ltd | フィルムキャリアテープの製造方法および無電解スズめっき装置 |
WO2010017837A1 (en) * | 2008-08-12 | 2010-02-18 | Nokia Corporation | Video coding using spatially varying transform |
US8619856B2 (en) * | 2008-10-03 | 2013-12-31 | Qualcomm Incorporated | Video coding with large macroblocks |
US8411754B2 (en) * | 2008-11-10 | 2013-04-02 | Activevideo Networks, Inc. | System, method, and computer program product for translating an element of a static encoded image in the encoded domain |
WO2010090629A1 (en) * | 2009-02-05 | 2010-08-12 | Thomson Licensing | Methods and apparatus for adaptive mode video encoding and decoding |
US20100232511A1 (en) * | 2009-03-12 | 2010-09-16 | Himax Media Soltuions, Inc. | Motion compensator, motion compensating method, and motion-compensated video decoder implementing the same |
KR101474756B1 (ko) * | 2009-08-13 | 2014-12-19 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
-
2010
- 2010-10-20 CN CN201510087325.2A patent/CN104601996B/zh active Active
- 2010-10-20 BR BR112012009142-5A patent/BR112012009142B1/pt active IP Right Grant
- 2010-10-20 EA EA201691820A patent/EA201691820A1/ru unknown
- 2010-10-20 CN CN201080046815.3A patent/CN102577393B/zh active Active
- 2010-10-20 CN CN201510087064.4A patent/CN104618719B/zh active Active
- 2010-10-20 US US13/502,685 patent/US20120213278A1/en not_active Abandoned
- 2010-10-20 MX MX2012004501A patent/MX2012004501A/es active IP Right Grant
- 2010-10-20 EA EA201691821A patent/EA201691821A1/ru unknown
- 2010-10-20 WO PCT/JP2010/068461 patent/WO2011049119A1/ja active Application Filing
- 2010-10-20 MY MYPI2012001748A patent/MY157320A/en unknown
- 2010-10-20 CN CN201510087499.9A patent/CN104601997B/zh active Active
- 2010-10-20 EP EP10824968.1A patent/EP2493198B1/en active Active
- 2010-10-20 MY MYPI2016000181A patent/MY189368A/en unknown
- 2010-10-20 EA EA201691819A patent/EA037919B1/ru unknown
- 2010-10-20 JP JP2011537276A patent/JP5562346B2/ja active Active
- 2010-10-20 CN CN201510087579.4A patent/CN104618720B/zh active Active
- 2010-10-20 EA EA201270474A patent/EA027182B1/ru not_active IP Right Cessation
- 2010-10-20 EA EA201691822A patent/EA201691822A1/ru unknown
-
2014
- 2014-06-05 JP JP2014116865A patent/JP5873528B2/ja active Active
-
2015
- 2015-11-03 HK HK15110851.0A patent/HK1210340A1/xx unknown
- 2015-11-03 HK HK15110852.9A patent/HK1210341A1/xx unknown
- 2015-11-10 HK HK15111065.0A patent/HK1210349A1/xx unknown
- 2015-11-10 HK HK15111064.1A patent/HK1210348A1/xx unknown
-
2016
- 2016-01-14 JP JP2016004964A patent/JP6097415B2/ja active Active
-
2017
- 2017-02-17 JP JP2017028397A patent/JP2017112639A/ja not_active Ceased
-
2018
- 2018-02-07 JP JP2018020415A patent/JP6454801B2/ja active Active
-
2019
- 2019-11-27 US US16/698,522 patent/US11070802B2/en active Active
-
2021
- 2021-06-15 US US17/348,548 patent/US20210314568A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5562346B2 (ja) * | 2009-10-20 | 2014-07-30 | シャープ株式会社 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016129872A1 (ko) * | 2015-02-12 | 2016-08-18 | 엘지전자(주) | 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치 |
US10742988B2 (en) | 2015-02-12 | 2020-08-11 | Lg Electronics Inc. | Method and apparatus for processing video signal using graph-based transform |
WO2017057923A1 (ko) * | 2015-09-29 | 2017-04-06 | 엘지전자(주) | 단일 최적화된 그래프를 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 |
WO2017057922A1 (ko) * | 2015-09-29 | 2017-04-06 | 엘지전자 주식회사 | 그래프 기반 리프팅 변환을 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치 |
US10715802B2 (en) | 2015-09-29 | 2020-07-14 | Lg Electronics Inc. | Method for encoding/decoding video signal by using single optimized graph |
US10771815B2 (en) | 2015-09-29 | 2020-09-08 | Lg Electronics Inc. | Method and apparatus for processing video signals using coefficient induced prediction |
KR20190044629A (ko) * | 2016-09-07 | 2019-04-30 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
KR102515487B1 (ko) | 2016-09-07 | 2023-03-28 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
US11743508B2 (en) | 2016-09-07 | 2023-08-29 | Qualcomm Incorporated | Tree-type coding for video coding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6454801B2 (ja) | 動画像復号装置、動画像復号方法、動画像符号化装置、および動画像符号化方法 | |
CN110024392B (zh) | 用于视频译码的低复杂度符号预测 | |
US11159789B2 (en) | Generative adversarial network based intra prediction for video coding | |
JP5686499B2 (ja) | 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法 | |
RU2565248C2 (ru) | Устройство кодирования изображения с предсказанием, устройство декодирования изображения с предсказанием, способ кодирования изображения с предсказанием, способ декодирования изображения с предсказанием, программа кодирования изображения с предсказанием и программа декодирования изображения с предсказанием | |
MX2014008778A (es) | Decodificador de video, codificador de video, metodo de decodificacion de video, y metodo de codificacion de video. | |
KR20110027480A (ko) | 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
CN104427335A (zh) | 视频编码的变换方法及装置 | |
KR20140124443A (ko) | 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치 | |
CN108111856A (zh) | 图像的压缩 | |
KR100856392B1 (ko) | 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법 | |
KR102231969B1 (ko) | 증가된 수의 가능한 코딩 모드를 이용한 공간 예측 | |
JP2007110568A (ja) | 画像符号化装置 | |
US8792549B2 (en) | Decoder-derived geometric transformations for motion compensated inter prediction | |
KR20180024702A (ko) | 영상에 대한 적응적 rdpcm 방법, 적응적 rdpcm에 기반한 인코딩 방법 및 적응적 rdpcm에 기반한 디코딩 방법 | |
JP2015043524A (ja) | レート歪コスト推定装置及びプログラム | |
JP5358485B2 (ja) | 画像符号化装置 | |
JP5202558B2 (ja) | イントラ予測装置、符号化器、復号器及びプログラム | |
JP5298082B2 (ja) | 適応的に直交変換係数の走査順序を決定する符号化装置及び復号装置 | |
JP2016032182A (ja) | 動画像符号化装置及び動画像復号装置並びに動画像符号化・復号方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140630 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20150324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20150623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151117 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20151215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5873528 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |