JP5974899B2 - 映像復号装置、映像復号方法及びプログラム - Google Patents

映像復号装置、映像復号方法及びプログラム Download PDF

Info

Publication number
JP5974899B2
JP5974899B2 JP2012552666A JP2012552666A JP5974899B2 JP 5974899 B2 JP5974899 B2 JP 5974899B2 JP 2012552666 A JP2012552666 A JP 2012552666A JP 2012552666 A JP2012552666 A JP 2012552666A JP 5974899 B2 JP5974899 B2 JP 5974899B2
Authority
JP
Japan
Prior art keywords
prediction
inter
predetermined area
motion vectors
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012552666A
Other languages
English (en)
Other versions
JPWO2012096146A1 (ja
Inventor
健太 先崎
健太 先崎
裕三 仙田
裕三 仙田
慶一 蝶野
慶一 蝶野
啓史 青木
啓史 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2012096146A1 publication Critical patent/JPWO2012096146A1/ja
Application granted granted Critical
Publication of JP5974899B2 publication Critical patent/JP5974899B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、階層構造の符号化ユニットを用いる像復号装置、像復号方法及びプログラムに関する。
非特許文献1は、一般的な映像符号化方式及び映像復号方式を開示している。
非特許文献1に記載されている映像符号化装置は、図17に示すように構成される。以下、図17に示される映像符号化装置を一般的な映像符号化装置と呼ぶ。
図17参照して、ディジタル化された映像の各フレームを入力としてビットストリームを出力する、一般的な映像符号化装置の構成と動作を説明する。
図17に示された映像符号化装置は、変換/量子化器101、エントロピー符号化器102、逆変換/逆量子化器103、バッファ104、予測器105、多重化器106、及び符号化制御器108を備える。
図17に示す映像符号化装置は、フレームをマクロブロック(MB:Macro Block )と呼ばれる16×16画素サイズのブロックに分割し、フレームの左上から順に各MBを符号化する。
図18は、フレームの空間解像度がQCIF(Quarter Common Intermediate Format)の場合のブロック分割の例を示す説明図である。以下、説明の簡略化のために、輝度の画素値のみに着目して各装置の動作を説明する。
ブロックに分割された入力映像は、予測器105から供給される予測信号が減じられて予測誤差画像となり、変換/量子化器101に入力される。予測信号には、イントラ予測信号とインター予測信号の2種類がある。なお、インター予測信号を、フレーム間予測信号とも呼ぶ。
それぞれの予測信号を説明する。イントラ予測信号は、バッファ104に格納された現在のピクチャと表示時刻が同一である再構築ピクチャの画像に基づいて生成される予測信号である。
非特許文献1の8.3.1 Intra_4×4 prediction process for luma samples、8.3.2 Intra_8×8 prediction process for luma samples、及び8.3.3 Intra_16×16 prediction process for luma samplesを引用すると、3種類のブロックサイズのイントラ予測Intra_4×4、Intra_8×8、Intra_16×16がある。
Intra_4×4とIntra_8×8は、図19の(a)と(c)を参照すると、それぞれ4×4ブロックサイズと8×8ブロックサイズのイントラ予測であることが分かる。ただし、図面の丸(○)はイントラ予測に用いる参照画素、つまり、現在のピクチャと表示時刻が同一である再構築ピクチャの画素である。
Intra_4×4のイントラ予測では、再構築した周辺画素をそのまま参照画素として、図19の(b)に示す9種類の方向に参照画素をパディング(外挿)して予測信号が形成される。Intra_8×8のイントラ予測では、図19の(c)の右矢印の下に記載のローパスフィルタ(1/2,1/4,1/2)によって再構築ピクチャの画像の周辺画素を平滑化した画素を参照画素として、図19の(b)に示す9種類の方向に参照画素を外挿して予測信号が形成される。
一方、Intra_16×16は、図20の(a)を参照すると、16×16ブロックサイズのイントラ予測であることが分かる。図19の場合と同様に図面の丸(○)はイントラ予測に用いる参照画素、つまり、現在のピクチャと表示時刻が同一である再構築ピクチャの画素である。Intra_16×16のイントラ予測では、再構築ピクチャの画像の周辺画素をそのまま参照画素として、図20の(b)に示す4種類の方向に参照画素を外挿して予測信号が形成される。
以下、イントラ予測信号を用いて符号化されるMB及びブロックをそれぞれイントラMB及びイントラブロックと呼ぶ。イントラ予測のブロックサイズをイントラ予測ブロックサイズと呼ぶ。また、外挿の方向をイントラ予測方向と呼ぶ。なお、イントラ予測ブロックサイズ及びイントラ予測方向は、イントラ予測に関する予測パラメータである。
インター予測信号は、バッファ104に格納された現在のピクチャと表示時刻が異なる再構築ピクチャの画像から生成される予測信号である。以下、インター予測信号を用いて符号化されるMB及びブロックをそれぞれインターMB及びインターブロックと呼ぶ。インター予測のブロックサイズ(インター予測ブロックサイズ)として、例えば、16×16,16×8,8×16,8×8,8×4,4×8,4×4を選択することができる。
図21は、16×16のブロックサイズを例にしたインター予測の例を示す説明図である。図21に示す動きベクトルMV=(mvx,mvy)は、符号化対象ブロックに対する参照ピクチャのインター予測ブロック(インター予測信号)の平行移動量を示す、インター予測の予測パラメータである。AVCでは、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向を表すインター予測の方向に加えて、符号化対象ブロックのインター予測に用いる参照ピクチャを同定するための参照ピクチャインデックスもインター予測の予測パラメータである。AVCでは、バッファ104に格納された複数枚の参照ピクチャをインター予測に利用できるからである。
AVCのインター予測では、1/4画素精度で動きベクトルを求めることができる。図22は、動き補償予測における輝度信号の補間処理を示す説明図である。図22において、Aは整数画素位置の画素信号、b、c、dは1/2画素精度の小数画素位置の画素信号、e、e、eは1/4画素精度の小数画素位置の画素信号を表わす。画素信号bは、水平方向の整数画素位置の画素に対して6タップのフィルタを適用して生成される。同様に、画素信号cは、垂直方向の整数画素位置の画素に対して6タップのフィルタを適用して生成される。画素信号dは、水平又は垂直方向の1/2画素精度の小数画素位置の画素に対して6タップのフィルタを適用して生成される。6タップのフィルタ係数は[1, -5, 20, 20, -5, 1]/32 で表される。画素信号e、e、及びeは、それぞれ、近傍の整数画素位置又は小数画素画素位置の画素に対して2タップフィルタ[1, 1]/2を適用して生成される。
イントラMBのみで符号化されたピクチャはIピクチャと呼ばれる。イントラMBだけでなくインターMBも含めて符号化されたピクチャはPピクチャと呼ばれる。インター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターMBを含めて符号化されたピクチャはBピクチャと呼ばれる。また、Bピクチャにおいて、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向が過去のインター予測を前方向予測、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向が未来のインター予測を後方向予測、過去と未来を含む参照ピクチャを同時に2枚用いるインター予測を双方向予測とそれぞれ呼ぶ。なお、インター予測の方向(インター予測方向)は、インター予測の予測パラメータである。
予測器105は、符号化制御器108の指示に応じて、入力映像の信号と予測信号とを比較して、予測誤差画像ブロックのエネルギーが最小となる予測パラメータを決定する。符号化制御器108は、決定した予測パラメータをエントロピー符号化器102に供給する。
変換/量子化器101は、予測誤差画像を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、所定の量子化ステップ幅Qs で、周波数変換係数を量子化する。以下、量子化された周波数変換係数を変換量子化値と呼ぶ。
エントロピー符号化器102は、予測パラメータと変換量子化値をエントロピー符号化する。予測パラメータは、上述した予測モード(イントラ予測、インター予測)、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、及び動きベクトルなど、MB及びブロックの予測に関連した情報である。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
バッファ104は、供給される再構築画像を格納する。1フレーム分の再構築画像を再構築ピクチャと呼ぶ。
多重化器106は、エントロピー符号化器102の出力データ、及び符号化パラメータを多重化して出力する。
上述した動作に基づいて、映像符号化装置における多重化器106は、ビットストリームを生成する。
非特許文献1に記載されている映像復号装置は、図23に示すように構成される。以下、図23に示される映像復号装置を一般的な映像復号装置と呼ぶ。
図23を参照して、ビットストリームを入力として復号された映像フレームを出力する、一般的な映像復号装置の構成と動作を説明する。
図23に示された映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、及びバッファ205を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、エントロピー符号化された映像ビットストリームを抽出する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、MB及びブロックの予測パラメータ及び変換量子化値をエントロピー復号し、逆変換/逆量子化器203及び予測器204に供給する。
逆変換/逆量子化器203は、量子化ステップ幅で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、エントロピー復号したMB及びブロックの予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
予測信号生成後、逆変換/逆量子化器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築画像としてバッファ205に供給される。
そして、バッファ205に格納された再構築ピクチャがデコード画像(デコード映像)として出力される。
上述した動作に基づいて、一般的な映像復号装置はデコード画像を生成する。
ISO/IEC 14496-10 Advanced Video Coding "Test Model under Consideration", Document: JCTVC-B205, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd Meeting: Geneva, CH, 21-28 July, 2010
ところで、非特許文献2はTest Model under Consideration方式(TMuC方式)を開示している。TMuC方式は、非特許文献1に開示された方式とは異なり、図24に示す階層構造の符号化ユニット(Coding Tree Block (CTB))を用いる。本明細書において、CTBのブロックをCoding Unit (CU:符号化ユニット)と呼ぶ。
なお、最大のCUをLargest Coding Unit (LCU)、最小のCUをSmallest Coding Unit(SCU)と呼ぶ。また、TMuC方式においては、CUに対する予測ユニットとしてPrediction Unit (PU)という概念(図25参照)が導入されている。PUは予測の基本単位であり、図25に示される{2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N}の8種類のPUパーティションタイプが定義されている。インター予測が用いられるPUをインターPU、イントラ予測が用いられるPUをイントラPUと呼ぶ。インター予測が用いられるPUパーティションをインターPUパーティション、イントラ予測が用いられるPUパーティションをイントラPUパーティションと呼ぶ。イントラPUパーティションは図25に示された形状のうち2N×2N、及びN×Nの正方形のみがサポートされている。以下、CU及びPUの1辺の長さをそれぞれCUサイズ及びPUサイズと呼ぶ。
また、TMuC方式では小数精度の予測画像を求めるために最大で12タップのフィルタを用いることができる。画素位置とフィルタの係数の関係は以下のとおりである。
Figure 0005974899
画素位置について、図26を用いて説明する。図26において、A、Eが整数画素位置の画素であるとする。このとき、bが1/4画素位置の画素、cが1/2画素位置の画素、dが3/4画素位置の画素である。垂直方向も同様となる。
図22に示す画素b又は画素cは、水平又は垂直方向の1/2画素位置用フィルタを1回適用することによって生成される。画素eは1/4画素位置用のフィルタを1回適用することによって生成される。
図27を参照して、画素eや画素eのように、その画素位置が水平垂直両方とも小数精度位置であり、そのうち少なくともどちらかが1/4画素位置である場合の小数画素生成の例を説明する。図27において、画素Aが整数画素位置の画素、画素cが求めたい小数画素位置の画素であるとする。このとき、まず、画素bが垂直方向の1/4画素位置用フィルタを適用することによって生成される。続いて、画素cが、小数画素bに対して、水平方向の3/4画素位置用フィルタを適用することによって生成される。なお、非特許文献2の8.3 Interpolation Methods には、小数画素生成のより詳細な説明が記載されている。
TMuC方式ではすべての階層のCUのPUヘッダでPUパーティションタイプを示すシンタクス(非特許文献2の4.1.10 Prediction unit syntax の表記に従えば、イントラ予測の場合はintra_split_flag、インター予測の場合はinter_partitioning_idc)を出力ビットストリームに埋め込む。以後、intra_split_flagシンタクスをイントラPUパーティションタイプシンタクス、inter_partitioning_idcシンタクスをインターPUパーティションタイプシンタクスと呼ぶ。
それぞれのLCU内に小さいサイズのCUが多く存在するとき、ビットストリームに含まれるインターPUパーティションタイプシンタクスのビット数の率が高くなり、圧縮映像の品質が低下する課題がある。
また、TMuC方式ではインターPUパーティションのサイズが小さいほど、参照ピクチャに対するメモリアクセスが増加し、メモリ帯域を圧迫する課題がある。特に、TMuC方式では12タップのフィルタを用いて小数画素を生成するため、メモリ帯域をより圧迫する。
図28は、12タップフィルタを用いるときのメモリアクセス領域を説明するための説明図である。図28(A)はN×NのPUパーティションタイプが選択されたときの、1つのインターPUパーティションのメモリアクセス領域、図28(B)は2N×2NのインターPUパーティションタイプが選択されたときのメモリアクセス領域を表わす。
N×Nが選択されたとき、図28(A)における破線で囲まれたサイズのメモリアクセスを0,1,2,3のインターPUパーティションごとに計4回行うため、メモリアクセス量は、4(N+11)=4N+88N+484に参照ピクチャのビット量を乗算した値になる。2N×2NのインターPUパーティションのメモリアクセス量が(2N+11)=4N+44N+121に参照ピクチャのビット量を乗算した値であることから、N×NのインターPUパーティションのメモリアクセス量は2N×2Nのメモリアクセス量よりも大きくなる。
例えば、N=4、片方向予測、画素値のビット精度が8bitのときの8×8 CUにおけるインターPUのメモリアクセス量を考える。2N×2NのインターPUパーティションにおけるメモリアクセス量は19×19×1×8bit = 2888bitであるのに対し、N×NのインターPUパーティションにおけるメモリアクセス量は15×15×4×8bit =7200bitとなり、約2.5倍のメモリアクセス量となる。
さらに、LCU単位では、LCUのブロックサイズが128×128のとき、LCUを1個のインターPUパーティションで予測するときのメモリアクセス量は139×139×1×8bit=154568bitであるのに対して、LCUを全て4×4インターPUパーティションで予測するとき(すなわち、LCUを1024個のインターPUパーティションで予測するとき)のメモリアクセス量は15×15×1024×8bit=1843200bitとなり、約12倍のメモリアクセス量となる。
本発明は、所定面積当たりのメモリ帯域を削減することを目的とする。
本発明による映像復号装置は、インター予測を用いて映像復号を行う映像復号装置であって、所定面積の画像ブロックに許容する動きベクトルの最大本数と、所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限する復号制御手段を備えることを特徴とする。
本発明による映像復号方法は、インター予測を用いて映像復号を行う映像復号方法であって、所定面積の画像ブロックに許容する動きベクトルの最大本数と、所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限することを特徴とする。
本発明による映像復号プログラムは、インター予測を用いて映像復号を行うコンピュータに、所定面積の画像ブロックに許容する動きベクトルの最大本数と、所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限する処理を実行させることを特徴とする。
本発明によれば、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて、使用可能なインターPUパーティションを制限することによって、所定面積当たりのメモリ帯域を削減できる。
また、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて、インター予測方向を制限することによって、所定面積当たりのメモリ帯域を削減できる。
第1の実施形態の映像符号化装置のブロック図である。 第1の実施形態の符号化制御器における予測パラメータ決定の動作を示すフローチャートである。 PUパーティションタイプの候補決定の動作を示すフローチャートである。 PUのパーティションごとのインター予測方向の候補決定の動作を示すフローチャートである。 シーケンスパラメータセットにおける、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報を示すリストの説明図である。 PUヘッダ書き込みの動作を示すフローチャートである。 PUシンタクスにおけるinter_partitioning_idcシンタクスに関する情報を示すリストの説明図である。 第3の実施形態の映像復号装置のブロック図である。 PUヘッダ読み込みの動作を示すフローチャートである。 ピクチャパラメータセットにおける、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報を示すリストの説明図である。 スライスヘッダにおける、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの本数に関する情報を示すリストの説明図である。 第4の実施形態の映像復号装置のブロック図である。 エラー検出の動作を示すフローチャートである。 本発明による映像符号化装置及び映像復号装置の機能を実現可能な情報処理システムの構成例を示すブロック図である。 本発明による映像符号化装置の主要部を示すブロック図である。 本発明による映像復号装置の主要部を示すブロック図である。 一般的な映像符号化装置のブロック図である。 ブロック分割の例を示す説明図である。 Intra_4×4とIntra_8×8のイントラ予測を説明するための説明図である。 Intra_16×16のイントラ予測を説明するための説明図である。 インター予測の例を示す説明図である。 動き補償予測における輝度信号の補間処理を示す説明図である。 一般的な映像復号装置のブロック図である。 CTBを説明するための説明図である。 PUを説明するための説明図である。 小数画素位置を説明するための説明図である。 TMuC方式の12タップフィルタを用いた小数画素生成方法を説明するための説明図である。 TMuC方式の12タップフィルタを用いて小数画素を生成するときのメモリアクセス範囲を説明するための説明図である。
上述した一般的技術の課題を解決するために、本発明では、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて、符号化対象CUのインターPUパーティション、及び、インター予測方向を制限することで課題を解決する。本発明の一例では、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて、インターPUパーティションタイプの候補、及び、インター予測方向の候補をそれぞれ制限することで課題を解決する。本発明の別の一例では、PUヘッダのインターPUパーティションタイプシンタクス伝送を制限することによって課題を解決する。本発明の上記の例によって、ビットストリームに含まれるインターPUパーティションタイプシンタクスのビット数の率を低く抑えて圧縮映像の品質を向上させつつ、メモリ帯域を抑制できる。
なお、本明細書では、所定面積は、例えば1つのLCU、又は連続する複数個のLCUを意味する。
実施形態1.
第1の実施形態では、所定面積(画像における所定領域)の画像ブロックに許容する動きベクトルの最大本数と上記の所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数とに基づいて、インターPUパーティションタイプとインター予測方向を制御する符号化制御手段、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報を映像復号装置にシグナリングするための、所定面積に関する情報と所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報をビットストリームに埋め込む手段を備える映像符号化装置を示す。
本実施形態では、所定面積を連続するnumSucLcu 個のLCU(1個以上のLCU)、所定面積あたりに許容する動きベクトルの最大本数をmaxNumMV、所定面積内の符号化済みCUに含まれる動きベクトルの本数をcurrNumMV とする。
図1に示すように、本実施形態の映像符号化装置は、図17に示された一般的な映像符号化装置と同様に、変換/量子化器101、エントロピー符号化器102、逆変換/逆量子化器103、バッファ104、予測器105、多重化器106、及び符号化制御器107を備える。
図1に示す本実施形態の映像符号化装置では、図17に示す映像符号化装置とは異なり、numSucLcu 、及び、maxNumMVに基づいて、インターPUパーティションタイプ、及び、インター予測方向を制御するために、numSucLcu とmaxNumMVが符号化制御器107に供給されている。さらに、numSucLcu 及びmaxNumMVを映像復号装置にシグナリングするために、numSucLcu 及びmaxNumMVが多重化器106にも供給されている。
符号化制御器107は、符号化歪み(入力信号と再構築ピクチャの誤差画像のエネルギー)と発生ビット量から計算されるコスト(Rate-Distortion コスト:R-D コスト)を予測器105に計算させる。符号化制御器107は、R-D コストが最小となる、CU分割形状(図24に示したように、split_coding_unit_flagによって決定する分割形状)、及び、各CUの予測パラメータを決定する。符号化制御器107は、決定したsplit_coding_unit_flag及び各CUの予測パラメータを予測器105及びエントロピー符号化器102に供給する。予測パラメータは、予測モード(pred_mode )、イントラPUパーティションタイプ(intra_split_flag)、イントラ予測方向、インターPUパーティションタイプ(inter_partitioning_idc)、及び動きベクトルなど、符号化対象CUの予測に関連した情報である。
ただし、本実施形態の符号化制御器107は、一例として、numSucLcu 及びmaxNumMVに基づいて、PUパーティションタイプを制御する。4<=maxNumMV - currNumMVのとき、本実施形態の符号化制御器107は、予測パラメータとして最適なPUパーティションタイプを、イントラ予測{2N×2N、N×N}、インター予測全セットの計10種類から選択する。2<= maxNumMV - currNumMV < 4のとき、符号化制御器107は、予測パラメータとして最適なPUパーティションタイプを、イントラ予測{2N×2N、N×N}、インター予測{2N×2N、2N×N、N×2N、2N×nU、2N×nD、nL×2N、nR×2N}の9種類から選択する。1<= maxNumMV - currNumMV < 2のとき、符号化制御器107は、予測パラメータとして最適なPUパーティションタイプを、イントラ予測{2N×2N、N×N}、インター予測{2N×2N}の3種類から選択する。maxNumMV - currNumMV <1のとき、符号化制御器107は、予測パラメータとして最適なPUパーティションタイプを、イントラ予測{2N×2N、N×N}の2種類から選択する。
さらに、本実施形態の符号化制御器107は、maxNumMV及びcurrNumMV に基づいて、インター予測方向の候補を制御する。例えば、符号化制御器107は、選択対象となる2N×2N インターPUパーティションに対して、2 <= maxNumMV - currNumMVのとき、予測パラメータであるインター予測方向を{前、後、双}から選択する。1<= maxNumMV - currNumMV < 2のとき、符号化制御器107は、予測パラメータであるインター予測方向を{前、後}から選択する。なお、maxNumMV - currNumMV <1のとき、選択対象となるPUパーティションタイプはイントラである。
図2は、各CUの予測パラメータ決定に関する本実施形態の符号化制御器107の動作を示すフローチャートである。
図2に示すように、符号化制御器107は、ステップS101で、PUパーティションの候補を決定する。ステップS102で、符号化制御器107は、インター予測方向の候補を決定する。ステップS103で、ステップS101とステップS102で決定したPUパーティションタイプ及びインター予測方向の候補を用いて、R-D コストに基づき予測パラメータを決定する。ステップS104で、符号化制御器107は、ステップS102及びS103の処理で決定されたPUパーティションタイプ及びインター予測方向からcurrNumMV を更新する。
符号化制御器107は、ステップS104の処理で、PUパーティションタイプのインター予測方向が双方向予測である場合にはcurrNumMV=currNumMV+2とし、それ以外である場合にはcurrNumMV=currNumMV+1とcurrNumMV を更新する。
図3は、図2におけるステップS101でPUパーティションタイプの候補を決定する動作を示すフローチャートである。
符号化制御器107は、ステップS201で4 <= maxNumMV - currNumMVと判定したとき、ステップS202でPUパーティションタイプの候補をイントラ予測{2N×2N、N×N}、インター予測全セットの10種類に設定する。
それ以外のとき、すなわちステップS201でmaxNumMV - currNumMV <4と判定したとき、符号化制御器107は、ステップS203で2<= maxNumMV - currNumMV < 4と判定したとき、ステップS204でPUパーティションタイプの候補をイントラ予測{2N×2N、N×N}、インター予測{2N×2N、2N×N、N×2N、2N×nU、2N×nD、nL×2N、nR×2N}の9種類に設定する。
それ以外の場合、すなわちステップS203でmaxNumMV - currNumMV < 2と判定した場合、符号化制御器107は、ステップS205で1 <= maxNumMV - currNumMV < 2と判定したとき、ステップS206でPUパーティションタイプの候補をイントラ予測{2N×2N、N×N}、インター予測{2N×2N}の3種類に設定する。
それ以外のとき、すなわちステップS205でmaxNumMV - currNumMV <1と判定したとき、符号化制御器107は、PUパーティションタイプの候補をイントラ予測{2N×2N、N×N}の2種類に設定する。
図4は、図2のステップS102でインター予測方向の候補を決定する動作を示すフローチャートである。以下、説明のため、PUの各パーティションのインデックスをi、パーティション数をmと表す。例えば、PUパーティションタイプがN×Nのとき、m=4、インデックスiは1, 2, 3, 4の値をとる。
ステップS301で、符号化制御器107は、k=currNumMV 、mをPUのパーティション数とする。
ステップS302で、符号化制御器107は、PUパーティションのインデックスを表わす変数iを1に設定する。
ステップS303で、maxNumMV - k - (m−i) >= 2と判定したとき、符号化制御器107は、ステップS304で、パーティションiのインター予測方向の候補を{前、後、双}に設定し、ステップS305でk=k+2とする。
それ以外の場合、すなわちステップS303で、maxNumMV - k -(m−i)≦1と判定した場合、符号化制御器107は、ステップS306で、パーティションiのインター予測方向の候補を{前、後}に設定し。ステップS307でk=k+1とする。
ステップS308でiがmと等しい場合には処理を終了する。
それ以外の場合は、符号化制御器107は、ステップS309でi=i+1と設定し、ステップS303に戻る。
予測器105は、符号化制御器107が決定した各CUの予測パラメータに対応する予測信号を選定する。
符号化制御器107が決定した形状の各CUの入力映像は、予測器105から供給される予測信号が減じられて予測誤差画像となり、変換/量子化器101に入力される。
変換/量子化器101は、予測誤差画像を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、量子化ステップ幅Qs で、周波数変換係数を量子化し、変換量子化値を得る。
エントロピー符号化器102は、符号化制御器107から供給されるsplit_coding_unit_flag(図24参照)、予測パラメータ、及び変換/量子化器101から供給される変換量子化値をエントロピー符号化する。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
多重化器106は、所定面積に関する情報、所定面積あたりに許容する動きベクトルの本数に関する情報、及びエントロピー符号化器103の出力データを多重化して出力する。非特許文献2の4.1.2 Sequence parameter set RBSP syntaxの表記に従えば、多重化器106は、図5に示すリストに表されるように、num_successive_largest_coding_unit(本実施形態においては、numSucLcu の値)、及び、max_num_motion_vector シンタクス(本実施形態においては、maxNumMVの値)を多重化する。
上述した動作に基づいて、発明の映像符号化装置はビットストリームを生成する。
本実施形態の映像符号化装置は、所定面積内で所定面積の画像ブロックに許容する動きベクトルの最大本数より多くの動きベクトルが使用されないように、所定面積の画像ブロックに許容する動きベクトルの最大本数、及び、上記の所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて符号化対象CUのインターPUパーティションタイプ、及びインター予測方向を制御する符号化制御手段を備える。
すなわち、映像符号化装置は、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数が動きベクトルの最大本数未満のときに、符号化対象CUのPUヘッダレイヤのインターPUパーティションタイプシンタクスを所定のインターPUパーティションタイプに設定してエントロピー符号化する。
所定面積内で動きベクトルの最大本数より多くの動きベクトルが使用されないようにすることによってメモリ帯域が削減される。また、所定面積内で動きベクトルの最大本数より多くの動きベクトルが使用されないようにすることによって、シグナリングされるインターPUパーティションタイプシンタクスの個数が削減されるので、ビットストリームに占めるPUヘッダの符号量の割合が小さくなり映像の品質が改善する。
各インターPUパーティションタイプの発生確率に偏りが生じ、エントロピーが減少するため、エントロピー符号化の効率が上がる。よって、メモリ帯域を削減しつつ圧縮映像の品質を保持できる。
また、本実施形態の映像符号化装置は、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報をビットストリームに埋め込む。よって、映像復号装置に所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数がシグナリングされるようになり、映像符号化装置と映像復号装置の相互運用性を高めることができる。
実施形態2.
第2の実施形態の映像符号化装置は、外部設定される所定面積と所定面積の画像ブロックに許容する動きベクトルの最大本数に基づいて、インターPUパーティションタイプとインター予測方向を制御し、上記の所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいてインターPUパーティションタイプシンタクスのエントロピー符号化を制御する符号化制御手段、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数と所定面積に許容する動きベクトルの本数とに関する情報を映像復号装置にシグナリングするための、所定面積に関する情報と所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報と所定面積あたりに許容する動きベクトルの本数に関する情報とをビットストリームに埋め込む手段を備える。
本実施形態では、所定面積を連続するnumSucLcu 個のLCU、所定面積の画像ブロックに許容する動きベクトルの最大本数をmaxNumMV、所定面積内の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数をcurrNumMV とする。
本実施形態の映像符号化装置の構成は、図1に示された第1の実施形態の映像符号化装置の構成と同様である。
図1に示す本実施形態の映像符号化装置では、図17に示す映像符号化装置とは異なり、numSucLcu 及びmaxNumMVに基づいて、インターPUパーティション、及び、インター予測方向を制御するために、numSucLcu とmaxNumMVが符号化制御器107に供給されている。さらに、numSucLcu 及びmaxNumMVを映像復号装置にシグナリングするために、numSucLcu 及びmaxNumMVが多重化器106にも供給されている。
符号化制御器107は、符号化歪み(入力信号と再構築ピクチャの誤差画像のエネルギー)と発生ビット量から計算されるR-D コストを予測器105に計算させる。符号化制御器107は、R-D コストが最小となる、CU分割形状(図24に示したように、split_coding_unit_flagによって決定する分割形状)、及び、各CUの予測パラメータを決定する。符号化制御器107は、決定したsplit_coding_unit_flag及び各CUの予測パラメータを予測器105及びエントロピー符号化器102に供給する。予測パラメータは、予測モード(pred_mode )、イントラPUパーティションタイプ(intra_split_flag)、イントラ予測方向、インターPUパーティションタイプ(inter_partitioning_idc)、及び動きベクトルなど、符号化対象CUの予測に関連した情報である。
本実施形態の符号化制御器107は、第1実施形態と同様に、PUパーティションタイプ及びインター予測方向の候補を決定する。符号化制御器107は、決定したPUパーティション及びインター予測方向の候補を用いて、R-D コストに基づき予測パラメータを決定する。
ただし、本実施形態の符号化制御器107は、符号化対象CUの予測モードがインター予測であり、かつ、maxNumMV - currNumMV≦1である場合は、inter_partitioning_idcをエントロピー符号化しないようにエントロピー符号化器102を制御する。
予測器105は、符号化制御器107が決定した各CUの予測パラメータに対応する予測信号を選定する。
符号化制御器107が決定した形状の各CUの入力映像は、予測器105から供給される予測信号が減じられて予測誤差画像となり、変換/量子化器101に入力される。
変換/量子化器101は、予測誤差画像を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、量子化ステップ幅Qs で、周波数変換係数を量子化し、変換量子化値を得る。
エントロピー符号化器102は、符号化制御器107から供給されるsplit_coding_unit_flag(図24参照)、予測パラメータ、及び変換/量子化器101から供給される変換量子化値をエントロピー符号化する。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
多重化器106は、所定面積に関する情報、所定面積あたりに許容する動きベクトルの本数に関する情報、及びエントロピー符号化器103の出力データを多重化して出力する。非特許文献2の4.1.2 Sequence parameter set RBSP syntaxの表記に従えば、多重化器106は、図5に示すリストに表されるように、num_successive_largest_coding_unit(本実施形態においては、numSucLcu の値)、及び、max_num_motion_vector シンタクス(本実施形態においては、maxNumMVの値)を多重化する。
上述した動作に基づいて、発明の映像符号化装置はビットストリームを生成する。
次に、本実施形態の特徴であるインターPUパーティションタイプシンタクス書き込みの動作を図6のフローチャートを参照して説明する。
図6に示すように、エントロピー符号化器102は、ステップS401で、split_coding_unit_flagをエントロピー符号化する。
また、ステップS402で、エントロピー符号化器102は、予測モードをエントロピー符号化する。すなわち、pred_mode シンタクスをエントロピー符号化する。
ステップS403で、符号化対象CUの予測モードがインター予測であると判定し、かつ、ステップS404でmaxNumMV - currNumMV≦1であると判定した場合には、符号化制御器107は、エントロピー符号化器102におけるinter_partitioning_idcシンタクスのエントロピー符号化をスキップするように制御する。
なお、ステップS403で符号化対象CUがイントラ予測であると判定した場合、又は、ステップS404でmaxNumMV - currNumMV≧2であると判定した場合には、ステップS405で符号化制御器107は、エントロピー符号化器102が該符号化対象CUのPUパーティションタイプ情報をエントロピー符号化するように制御する。
なお、上述したpred_mode シンタクス、及びinter_partitioning_idcシンタクスは、非特許文献2の4.1.10 Prediction unit syntax の表記に従えば、図7に示すリストに表されるようにシグナリングされる。"if(maxNumMV - currNumMV >= 2)" の条件によって、所定面積の画像ブロックに許容する動きベクトルの最大本数から所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数を減じた本数が2本以上であれば、inter_partitioning_idcシンタクスがシグナリングされることが、本実施形態の特徴である。
本実施形態の映像符号化装置は、所定面積の画像ブロックに許容する動きベクトルの最大本数に基づく所定面積に許容する動きベクトルの本数(本実施形態では、動きベクトルの最大本数−1)に基づいて、インターPUパーティションタイプ、及びインター予測方向を制御する符号化制御手段を備える。映像符号化装置は、不必要なインターPUパーティションタイプ情報を伝送しないことによって、ビットストリームに含まれるインターPUパーティションタイプのビット数の率を低く抑えて、メモリ帯域を削減しつつ圧縮映像の品質を保持できる。
また、本実施形態の映像符号化装置は、映像復号についても同様にインターPUパーティションタイプシンタクスをビットストリームから読み出せるように、外部設定される所定面積に関する情報、所定面積の画像ブロックに許容する動きベクトルの最大本数及び所定面積に許容する動きベクトルの本数に関する情報をビットストリームに埋め込む手段を備える。よって、映像符号化装置と映像復号装置の相互運用性を高めることができる。
また、本実施形態の映像符号化装置は、さらに、シグナリングされるインターPUパーティションタイプシンタクスの個数を削減するように、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数が、動きベクトルの最大本数から1減じた本数以上のときに、該符号化対象CUのPUヘッダレイヤのインターPUパーティションタイプシンタクスをエントロピー符号化させず、動きベクトルの最大本数から1減じた本数未満のときにのみインターPUパーティションタイプシンタクスをシグナリングするように制御する。シグナリングされるインターPUパーティションタイプシンタクスの個数を削減することによって、ビットストリームに占めるPUヘッダの符号量の割合が小さくなって映像の品質がさらに改善する。
実施形態3.
第3の実施形態の映像復号装置は、第2の実施形態の映像符号化装置が生成したビットストリームを復号する。
本実施形態の映像復号装置は、ビットストリームに多重化された所定面積に関する情報及び所定面積の画像ブロックに許容する動きベクトルの本数に関する情報を多重化解除する手段、及び、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいてインターPUパーティションタイプをビットストリームから読み出す読み出し手段を備えることを特徴とする。
図8に示すように、本実施形態の映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、バッファ205、及び復号制御器206を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、所定面積に関する情報、所定面積の画像ブロックに許容する動きベクトルの本数に関する情報及びエントロピー符号化された映像ビットストリームを抽出する。多重化解除器201は、図5に示すリストに示されるように、シーケンスパラメータにおいて、num_successive_largest_coding_unitシンタクス及びmax_num_motion_vector シンタクスを多重化解除する。
さらに、多重化解除器201は所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数を復号制御器206に供給する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆変換/逆量子化器203に供給する。エントロピー復号器202は、エントロピー復号したsplit_coding_unit_flag及び予測パラメータを復号制御器206に供給する。
ただし、所定面積の画像ブロックに含まれる復号済み画像ブロックの動きベクトルの本数をcurrNumMV とすると、本実施形態の復号制御器206は、復号対象CUの予測モードがインター予測であり、かつ、maxNumMV - currNumMV≦1であるとき、エントロピー復号器202に該復号対象CUのインターPUパーティションタイプシンタクスのエントロピー復号をスキップさせる。さらに、多重化解除器201は、該復号対象CUのインターPUパーティションタイプを2N×2Nに設定する。なお、復号対象CUの予測モードがインター予測であるとき、currNumMVは、インターPUパーティションタイプに続いて復号される各パーティションのインター予測方向に基づき更新される。すなわち、復号制御器206は、各パーティションについて、パーティションのインター予測方向が双方向予測である場合にはcurrNumMV=currNumMV+2とし、それ以外である場合にはcurrNumMV=currNumMV+1とcurrNumMV を更新する。
逆変換/逆量子化器203は、量子化ステップ幅で、輝度及び色差の変換量子化値を逆量子化する。さらに、逆変換/逆量子化器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、復号制御器206から供給される予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
逆変換/逆量子化器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築ピクチャとしてバッファ205に供給させる。
そして、バッファ205に格納された再構築ピクチャがデコード画像として出力される。
上述した動作に基づいて、本実施形態の映像復号装置はデコード画像を生成する。
次に、本実施形態の特徴であるインターPUパーティションタイプシンタクス読み込みの動作を図9のフローチャートを参照して説明する。
図9に示すように、エントロピー復号器202は、ステップS501で、split_coding_unit_flagをエントロピー復号してCUのサイズを確定する。
続いて、ステップS502で、エントロピー復号器202は、予測モードをエントロピー復号する。すなわち、pred_mode シンタクスをエントロピー復号する。
続いて、ステップS503で、予測モードがインター予測であり、かつ、ステップS504にて、maxNumMV - currNumMV≦1であると判定したとき、ステップS505にて、復号制御器206は、エントロピー復号器204におけるインターPUパーティションタイプのエントロピー復号をスキップさせる。さらに、該CUのPUパーティションタイプを2N×2Nと設定する(inter_partitioning_idc=0とする)。
なお、ステップS503で、予測モードがイントラ予測であると判定したとき、又は、ステップS504で、maxNumMV - currNumMV≧2であると判定したとき、復号制御器206は、ステップS506で、エントロピー復号器204における該復号対象CUのPUパーティションタイプをエントロピー復号し、該CUのPUパーティションタイプをエントロピー復号結果のPUパーティションタイプに設定する。
また、第2の実施形態の映像符号化装置は、第1の実施形態で利用された所定面積に関する情報(num_successive_largest_coding_unit)、及び、所定面積あたりに許容する動きベクトルの本数に関する情報(max_num_motion_vector )を、図10に示すリストや図11に示すリストに表されているように、ピクチャパラメータセットやスライスヘッダにおいて多重化できる。なお、図10は、ピクチャパラメータセットにおける、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報を示すリストの説明図である。図11は、スライスヘッダにおける、所定面積に関する情報、及び、所定面積の画像ブロックに許容する動きベクトルの本数に関する情報を示すリストの説明図である。
同様に、上述した発明の映像復号装置は、ピクチャパラメータセットやスライスヘッダからnum_successive_largest_coding_unitシンタクス、及び、max_num_motion_vector シンタクスを多重化解除できる。
本実施形態の映像復号装置は、所定面積内で所定面積の画像ブロックに許容する動きベクトルの最大本数より多くの動きベクトルが使用されないように、所定面積の画像ブロックに許容する動きベクトルの最大本数、及び、上記の所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて復号対象CUのインターPUパーティションタイプ、及びインター予測方向を制御する復号制御手段を備える。
所定面積内で動きベクトルの最大本数より多くの動きベクトルが使用されないようにすることによってメモリ帯域が削減される。
実施形態4.
第4の実施形態の映像復号装置は、第1の実施形態の映像符号化装置が生成したビットストリームを復号する。
本実施形態の映像復号装置は、ビットストリームに多重化された所定面積に関する情報及び所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報を多重化解除する手段、及び、上記の所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数に基づいて復号対象CUを含むビットストリームのアクセスユニットにおけるエラーを検出するエラー検出手段を備えることを特徴とする。アクセスユニットは、非特許文献1の3.1 access unit において定義されているように、1ピクチャ分の符号化データを格納する単位である。エラーは、所定面積あたりに許容する動きベクトルの本数に基づく制約に対する違反を意味する。
図12に示すように、本実施形態の映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、バッファ205、及びエラー検出器207を備える。
多重化解除器201は、第3の実施形態における多重化解除器201と同様に動作し、入力されるビットストリームを多重化解除して、所定面積に関する情報、所定面積の画像ブロックに許容する動きベクトルの最大本数に関する情報及びエントロピー符号化された映像ビットストリームを抽出する。多重化解除器201は、図5に示すリストに示されるように、シーケンスパラメータにおいて、num_successive_largest_coding_unitシンタクス及びmax_num_motion_vector シンタクスを多重化解除する。
さらに、多重化解除器201は、所定面積に関する情報、所定面積の画像ブロックに許容する動きベクトルの最大本数をエラー検出器207に供給する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆変換/逆量子化器203に供給する。エントロピー復号器202は、エントロピー復号したsplit_coding_unit_flag及び予測パラメータをエラー検出器207に供給する。
エラー検出器207は、多重化解除器201から供給される所定面積に関する情報と所定面積の画像ブロックに許容する動きベクトルの最大本数に基づいて、エントロピー復号器201から供給される予測パラメータのエラー検出を行い、予測パラメータを予測器204に供給する。エラー検出の動作は後述される。なお、エラー検出器207は、第3の実施形態における復号制御器206の役割も果たす。
逆変換/逆量子化器203は、第3の実施形態における逆変換/逆量子化器203と同様に動作する。
予測器204は、エラー検出器207から供給される予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
バッファ205は、第3の実施形態におけるバッファ205と同様に動作する。
上述した動作に基づいて、本実施形態の映像復号装置はデコード画像を生成する。
図13に示すフローチャートを参照して、復号対象CUを含むビットストリームのアクセスユニットのエラーを検出する、本実施形態の映像復号装置のエラー検出動作を説明する。
ステップS601で、エラー検出器207は、復号対象CUのPUの予測モードがイントラであると判定した場合には処理を終了する。
予測モードがインター予測ならば、ステップS602で、エラー検出器207は、mを復号対象CUのPUのパーティション数とする。
ステップS603で、エラー検出器207は、i=1と設定する。
ステップS604で、エラー検出器207は、パーティションiのインター予測方向を読み込み、双方向予測ならばcurrNumMV=currNumMV+2 、それ以外ならばcurrNumMV=currNumMV+1 とcurrNumMV を更新する。
ステップS605で、エラー検出器207は、残りのインターPUで使用可能な動きベクトルの本数(maxNumMV - currNumMV)が、残りのパーティション数(m−i)より少ない場合には、ステップS606でエラーがあると判断し、エラーを外部に通知する。例えば、エラーが発生したCUのアドレスを出力する。
maxNumMV - currNumMVが、残りのパーティション数(m−i)以上である場合には、ステップS607でiがmと等しいときには処理を終了する。
ステップS607でiがmと異なるときには、ステップS608で、エラー検出器207は、i=i+1と設定し、ステップS604に戻る。
以上の動作により、エラー検出器207は、復号対象CUを含むビットストリームのアクセスユニットのエラーを検出する。
なお、上述した発明の映像符号化装置、及び、映像復号装置は、所定面積の画像ブロックに許容する動きベクトルの最大本数に基づいて、符号化対象CUのインターPUパーティションを制御したが、同様の制御を、所定面積の画像ブロックに許容するインターPUパーティション数の最大数、又は、所定面積の画像ブロックに許容するメモリアクセスの最大量を用いて行うことも可能である。
また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図14に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003及びビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図14に示された情報処理システムにおいて、プログラムメモリ1002には、図1、図8、図12のそれぞれに示された各ブロック(バッファのブロックを除く)の機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1、図8、図12のそれぞれに示された映像符号化装置又は映像復号装置の機能を実現する。
図15は、本発明による映像符号化装置の主要部を示すブロック図である。図15に示すように、本発明による映像符号化装置は、インター予測を用いて映像符号化を行う映像符号化装置であって、所定面積の画像ブロックに許容する動きベクトルの最大本数(PA)と、所定面積の画像ブロックに含まれる符号化済み画像ブロックの動きベクトルの本数(PB)とに基づいて、符号化対象CUのインターPUパーティションタイプを制御する符号化制御手段11(一例として、図1に示す符号化制御器107)を備える。
図16は、本発明による映像復号装置の主要部を示すブロック図である。図16に示すように、本発明による映像復号装置は、インター予測を用いて映像復号を行う映像復号装置であって、所定面積の画像ブロックに許容する動きベクトルの最大本数(PA)と、所定面積の画像ブロックに含まれる復号済み画像ブロックの動きベクトルの本数(PB)とに基づいて、復号対象CUのインターPUパーティションタイプを制御する復号制御手段21(一例として、図8及び図12に示す復号制御器207)を備える。
以上、実施形態および実施例を参照して本発明を説明したが、本発明は上記実施形態および実施例に限定されない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年1月13日に出願された日本特許出願2011−4963を基礎とする優先権を主張し、その開示の全てをここに取り込む。
11 符号化制御手段
21 復号制御手段
101 変換/量子化器
102 エントロピー符号化器
103 逆変換/逆量子化器
104 バッファ
105 予測器
106 多重化器
107,108 符号化制御器
201 多重化解除器
202 エントロピー復号器
203 逆変換/逆量子化器
204 予測器
205 バッファ
206 復号制御器
207 エラー検出器
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体

Claims (3)

  1. インター予測を用いて映像復号を行う映像復号装置であって、
    所定面積の画像ブロックに許容する動きベクトルの最大本数と、前記所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限する復号制御手段を備えることを特徴とする映像復号装置。
  2. インター予測を用いて映像復号を行う映像復号方法であって、
    所定面積の画像ブロックに許容する動きベクトルの最大本数と、前記所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限することを特徴とする映像復号方法。
  3. インター予測を用いて映像復号を行うコンピュータに、
    所定面積の画像ブロックに許容する動きベクトルの最大本数と、前記所定面積の画像ブロックに含まれる復号済みCUの動きベクトルの本数との関係に基づいて、復号対象CUのインターPUパーティションタイプのインター予測方向の候補制限する処理を実行させるための映像復号プログラム。
JP2012552666A 2011-01-13 2012-01-05 映像復号装置、映像復号方法及びプログラム Active JP5974899B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011004963 2011-01-13
JP2011004963 2011-01-13
PCT/JP2012/000045 WO2012096146A1 (ja) 2011-01-13 2012-01-05 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016140172A Division JP6233465B2 (ja) 2011-01-13 2016-07-15 映像復号装置、映像復号方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2012096146A1 JPWO2012096146A1 (ja) 2014-06-09
JP5974899B2 true JP5974899B2 (ja) 2016-08-23

Family

ID=46507055

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2012552666A Active JP5974899B2 (ja) 2011-01-13 2012-01-05 映像復号装置、映像復号方法及びプログラム
JP2016140172A Active JP6233465B2 (ja) 2011-01-13 2016-07-15 映像復号装置、映像復号方法及びプログラム
JP2017204300A Active JP6432662B2 (ja) 2011-01-13 2017-10-23 映像符号化装置、映像符号化方法及びプログラム
JP2017204299A Active JP6432661B2 (ja) 2011-01-13 2017-10-23 映像符号化装置、映像符号化方法及びプログラム

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2016140172A Active JP6233465B2 (ja) 2011-01-13 2016-07-15 映像復号装置、映像復号方法及びプログラム
JP2017204300A Active JP6432662B2 (ja) 2011-01-13 2017-10-23 映像符号化装置、映像符号化方法及びプログラム
JP2017204299A Active JP6432661B2 (ja) 2011-01-13 2017-10-23 映像符号化装置、映像符号化方法及びプログラム

Country Status (9)

Country Link
US (4) US10841588B2 (ja)
EP (2) EP2665273B1 (ja)
JP (4) JP5974899B2 (ja)
KR (4) KR101840579B1 (ja)
CN (4) CN108093255B (ja)
BR (3) BR112013017802B1 (ja)
ES (1) ES2900775T3 (ja)
PL (1) PL2665273T3 (ja)
WO (1) WO2012096146A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016201826A (ja) * 2011-01-13 2016-12-01 日本電気株式会社 映像復号装置、映像復号方法及びプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9762899B2 (en) * 2011-10-04 2017-09-12 Texas Instruments Incorporated Virtual memory access bandwidth verification (VMBV) in video coding
JP6731574B2 (ja) * 2014-03-06 2020-07-29 パナソニックIpマネジメント株式会社 動画像符号化装置および動画像符号化方法
JP2015173404A (ja) * 2014-03-12 2015-10-01 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2015163167A1 (ja) * 2014-04-23 2015-10-29 ソニー株式会社 画像処理装置及び画像処理方法
US9794626B2 (en) 2014-05-01 2017-10-17 Qualcomm Incorporated Partitioning schemes in multi-layer video coding
CN104125469B (zh) * 2014-07-10 2017-06-06 中山大学 一种用于hevc的快速编码方法
WO2016153251A1 (ko) * 2015-03-23 2016-09-29 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치
WO2017183751A1 (ko) * 2016-04-22 2017-10-26 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
KR20230122188A (ko) * 2016-05-10 2023-08-22 삼성전자주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
CN108924551B (zh) * 2018-08-29 2022-01-07 腾讯科技(深圳)有限公司 视频图像编码模式的预测方法及相关设备

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002101416A (ja) * 2000-09-25 2002-04-05 Fujitsu Ltd 画像制御装置
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
US7894530B2 (en) * 2004-05-07 2011-02-22 Broadcom Corporation Method and system for dynamic selection of transform size in a video decoder based on signal content
JP4246722B2 (ja) * 2005-08-26 2009-04-02 日本電信電話株式会社 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4666255B2 (ja) 2005-12-27 2011-04-06 日本電気株式会社 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
KR101366093B1 (ko) * 2007-03-28 2014-02-21 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
KR20080107965A (ko) * 2007-06-08 2008-12-11 삼성전자주식회사 객체 경계 기반 파티션을 이용한 영상의 부호화, 복호화방법 및 장치
US8644382B2 (en) * 2007-06-29 2014-02-04 Sharp Kabushiki Kaisha Image encoding device, image encoding method, image decoding device, image decoding method, program, and storage medium
EP2034742A3 (en) * 2007-07-25 2009-10-14 Hitachi Ltd. Video coding method and device
CN101394580B (zh) 2007-09-21 2012-01-25 电信科学技术研究院 Eps承载管理的方法、装置、mme及通信系统
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
EP2250813B1 (en) * 2008-03-10 2018-12-05 InterDigital Madison Patent Holdings Method and apparatus for predictive frame selection supporting enhanced efficiency and subjective quality
CN101394560B (zh) * 2008-06-30 2010-09-01 浙江大学 一种用于视频编码的混合流水线装置
US9479786B2 (en) * 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
JP2011004963A (ja) 2009-06-25 2011-01-13 Universal Entertainment Corp 不正を防止すると共にゲームの進行をディーラにナビゲートするゲーミングシステム
KR101487686B1 (ko) 2009-08-14 2015-01-30 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
EP2603002A4 (en) * 2010-08-03 2014-12-31 Sony Corp IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
US9137544B2 (en) * 2010-11-29 2015-09-15 Mediatek Inc. Method and apparatus for derivation of mv/mvp candidate for inter/skip/merge modes
US20120147961A1 (en) * 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
PL2665273T3 (pl) * 2011-01-13 2022-02-28 Nec Corporation Urządzenie do dekodowania wideo, sposób dekodowania wideo i program
US9313494B2 (en) * 2011-06-20 2016-04-12 Qualcomm Incorporated Parallelization friendly merge candidates for video coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015049944; 鈴木芳典: '適応的動きベクトル符号化方式を用いたメモリアクセス低減' 電子情報通信学会技術研究報告 Vol.103,No.513, 20031211, pp.35〜40, 社団法人電子情報通信学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016201826A (ja) * 2011-01-13 2016-12-01 日本電気株式会社 映像復号装置、映像復号方法及びプログラム
JP2018029384A (ja) * 2011-01-13 2018-02-22 日本電気株式会社 インター予測を用いる装置、方法及びプログラム、並びに、映像符号化装置、映像符号化方法及びプログラム

Also Published As

Publication number Publication date
EP2665273B1 (en) 2021-11-03
EP2665273A4 (en) 2014-07-09
JP2018029384A (ja) 2018-02-22
US20210021835A1 (en) 2021-01-21
BR112013017802A2 (pt) 2016-10-11
US20130322542A1 (en) 2013-12-05
BR122020018553B1 (pt) 2023-03-14
PL2665273T3 (pl) 2022-02-28
CN108111847B (zh) 2021-11-23
KR101841334B1 (ko) 2018-03-22
KR20160104087A (ko) 2016-09-02
JPWO2012096146A1 (ja) 2014-06-09
EP3965418A1 (en) 2022-03-09
JP2018029385A (ja) 2018-02-22
KR20130101116A (ko) 2013-09-12
US20220191506A1 (en) 2022-06-16
KR20180043395A (ko) 2018-04-27
CN103314590B (zh) 2018-02-27
US11665352B2 (en) 2023-05-30
US11323720B2 (en) 2022-05-03
CN103314590A (zh) 2013-09-18
CN108055538B (zh) 2021-10-29
CN108055538A (zh) 2018-05-18
JP6432662B2 (ja) 2018-12-05
KR101840579B1 (ko) 2018-03-20
CN108093255B (zh) 2021-12-03
BR122020018552B1 (pt) 2022-12-06
JP2016201826A (ja) 2016-12-01
WO2012096146A1 (ja) 2012-07-19
CN108111847A (zh) 2018-06-01
JP6233465B2 (ja) 2017-11-22
KR101935217B1 (ko) 2019-01-03
US20220191505A1 (en) 2022-06-16
US11647205B2 (en) 2023-05-09
KR101851326B1 (ko) 2018-04-24
ES2900775T3 (es) 2022-03-18
KR20150103301A (ko) 2015-09-09
EP2665273A1 (en) 2013-11-20
CN108093255A (zh) 2018-05-29
US10841588B2 (en) 2020-11-17
BR112013017802B1 (pt) 2022-04-05
JP6432661B2 (ja) 2018-12-05

Similar Documents

Publication Publication Date Title
JP6432661B2 (ja) 映像符号化装置、映像符号化方法及びプログラム
JP6497423B2 (ja) 映像復号装置、映像復号方法及びプログラム
KR20160002786A (ko) 비디오 신호 처리 방법 및 장치
KR20230117614A (ko) 움직임 벡터 차이 제한 방법 및 디바이스
KR20240068697A (ko) 서브블록 모션 벡터에 기초한 모션 벡터 예측을 위한 방법 및 장치
KR20240046574A (ko) 모션 벡터 예측자 정밀도를 암시적으로 지시하기 위한 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160704

R150 Certificate of patent or registration of utility model

Ref document number: 5974899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150