JP2014187701A - 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム - Google Patents

映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム Download PDF

Info

Publication number
JP2014187701A
JP2014187701A JP2014102438A JP2014102438A JP2014187701A JP 2014187701 A JP2014187701 A JP 2014187701A JP 2014102438 A JP2014102438 A JP 2014102438A JP 2014102438 A JP2014102438 A JP 2014102438A JP 2014187701 A JP2014187701 A JP 2014187701A
Authority
JP
Japan
Prior art keywords
inter
size
prediction
video
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014102438A
Other languages
English (en)
Other versions
JP5787002B2 (ja
Inventor
Kenta Senzaki
健太 先崎
Yuzo Senda
裕三 仙田
Keiichi Chono
慶一 蝶野
Hirofumi Aoki
啓史 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014102438A priority Critical patent/JP5787002B2/ja
Publication of JP2014187701A publication Critical patent/JP2014187701A/ja
Application granted granted Critical
Publication of JP5787002B2 publication Critical patent/JP5787002B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S348/00Television
    • Y10S348/91Flicker reduction

Abstract

【課題】所定面積当たりのメモリ帯域を削減する。
【解決手段】映像復号装置は、復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定する復号制御手段を備える。
【選択図】図13

Description

本発明は、階層構造の符号化ユニットを用いる映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラムに関する。
非特許文献1は、一般的な映像符号化方式及び映像復号方式を開示している。
非特許文献1に記載されている映像符号化装置は、図15に示すように構成される。以下、図15に示される映像符号化装置を一般的な映像符号化装置と呼ぶ。
図15を参照して、ディジタル化された映像の各フレームを入力としてビットストリームを出力する、一般的な映像符号化装置の構成と動作を説明する。
図15に示された映像符号化装置は、変換/量子化器101、エントロピー符号化器102、逆変換/逆量子化器103、バッファ104、予測器105、多重化器106、及び符号化制御器108を備える。
図15に示す映像符号化装置は、フレームをマクロブロック(MB:Macro Block )と呼ばれる16×16画素サイズのブロックに分割し、フレームの左上から順に各MBを符号化する。
図16は、フレームの空間解像度がQCIF(Quarter Common Intermediate Format)の場合のブロック分割の例を示す説明図である。以下、説明の簡略化のために、輝度の画素値のみに着目して各装置の動作を説明する。
ブロックに分割された入力映像は、予測器105から供給される予測信号が減じられて、予測誤差画像となり、変換/量子化器101に入力される。予測信号には、イントラ予測信号とインター予測信号の2種類がある。なお、インター予測信号を、フレーム間予測信号とも呼ぶ。
それぞれの予測信号を説明する。イントラ予測信号は、バッファ104に格納された現在のピクチャと表示時刻が同一である再構築ピクチャの画像に基づいて生成される予測信号である。
非特許文献1の8.3.1 Intra_4×4 prediction process for luma samples、8.3.2 Intra_8×8 prediction process for luma samples、及び8.3.3 Intra_16×16 prediction process for luma samplesを引用すると、3種類のブロックサイズのイントラ予測Intra_4×4、Intra_8×8、Intra_16×16がある。
Intra_4×4とIntra_8×8は、図17の(a)と(c)を参照すると、それぞれ4×4ブロックサイズと8×8ブロックサイズのイントラ予測であることが分かる。ただし、図面の丸(○)はイントラ予測に用いる参照画素、つまり、現在のピクチャと表示時刻が同一である再構築ピクチャの画素である。
Intra_4×4のイントラ予測では、再構築した周辺画素をそのまま参照画素として、図17の(b)に示す9種類の方向に参照画素をパディング(外挿)して予測信号が形成される。Intra_8×8のイントラ予測では、図17の(c)の右矢印の下に記載のローパスフィルタ(1/2,1/4,1/2)によって再構築ピクチャの画像の周辺画素を平滑化した画素を参照画素として、図17の(b)に示す9種類の方向に参照画素を外挿して予測信号が形成される。
一方、Intra_16×16は、図18の(a)を参照すると、16×16ブロックサイズのイントラ予測であることが分かる。図17の場合と同様に図面の丸(○)はイントラ予測に用いる参照画素、つまり、現在のピクチャと表示時刻が同一である再構築ピクチャの画素である。Intra_16×16のイントラ予測では、再構築ピクチャの画像の周辺画素をそのまま参照画素として、図18の(b)に示す4種類の方向に参照画素を外挿して予測信号が形成される。
以下、イントラ予測信号を用いて符号化されるMB及びブロックをそれぞれイントラMB及びイントラブロックと呼ぶ。イントラ予測のブロックサイズをイントラ予測ブロックサイズと呼ぶ。また、外挿の方向をイントラ予測方向と呼ぶ。なお、イントラ予測ブロックサイズ及びイントラ予測方向は、イントラ予測に関する予測パラメータである。
インター予測信号は、バッファ104に格納された現在のピクチャと表示時刻が異なる再構築ピクチャの画像から生成される予測信号である。以下、インター予測信号を用いて符号化されるMB及びブロックをそれぞれインターMB及びインターブロックと呼ぶ。インター予測のブロックサイズ(インター予測ブロックサイズ)として、例えば、16×16,16×8,8×16,8×8,8×4,4×8,4×4を選択することができる。
図19は、16×16のブロックサイズを例にしたインター予測の例を示す説明図である。図19に示す動きベクトルMV=(mvx,mvy)は、符号化対象ブロックに対する参照ピクチャのインター予測ブロック(インター予測信号)の平行移動量を示す、インター予測の予測パラメータである。AVCでは、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向を表すインター予測の方向に加えて、符号化対象ブロックのインター予測に用いる参照ピクチャを同定するための参照ピクチャインデックスもインター予測の予測パラメータである。AVCでは、バッファ104に格納された複数枚の参照ピクチャをインター予測に利用できるからである。
AVCのインター予測では、1/4画素精度で動きベクトルを求めることができる。図20は、動き補償予測における輝度信号の補間処理を示す説明図である。図20において、Aは整数画素位置の画素信号、b、c、dは1/2画素精度の小数画素位置の画素信号、e、e、eは1/4画素精度の小数画素位置の画素信号を表わす。画素信号bは、水平方向の整数画素位置の画素に対して6タップのフィルタを適用して生成される。同様に、画素信号cは、垂直方向の整数画素位置の画素に対して6タップのフィルタを適用して生成される。画素信号dは、水平または垂直方向の1/2画素精度の小数画素位置の画素に対して6タップのフィルタを適用して生成される。6タップのフィルタ係数は[1, -5, 20, 20, -5, 1]/32 で表される。画素信号e、e、及び、eは、それぞれ、近傍の整数画素位置または小数画素画素位置の画素に対して2タップフィルタ[1, 1]/2を適用して生成される。
イントラMBのみで符号化されたピクチャはIピクチャと呼ばれる。イントラMBだけでなくインターMBも含めて符号化されたピクチャはPピクチャと呼ばれる。インター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターMBを含めて符号化されたピクチャはBピクチャと呼ばれる。また、Bピクチャにおいて、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向が過去のインター予測を前方向予測、符号化対象ブロックの符号化対象ピクチャに対するインター予測信号の参照ピクチャの方向が未来のインター予測を後方向予測、過去と未来を含む参照ピクチャを同時に2枚用いるインター予測を双方向予測とそれぞれ呼ぶ。なお、インター予測の方向(インター予測方向)は、インター予測の予測パラメータである。
予測器105は、符号化制御器108の指示に応じて、入力映像の信号と予測信号とを比較して、予測誤差画像ブロックのエネルギーが最小となる予測パラメータを決定する。符号化制御器108は、決定した予測パラメータをエントロピー符号化器102に供給する。
変換/量子化器101は、予測信号が減じられた画像(予測誤差画像)を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、所定の量子化ステップ幅Qs で、周波数変換係数を量子化する。以下、量子化された周波数変換係数を変換量子化値と呼ぶ。
エントロピー符号化器102は、予測パラメータと変換量子化値をエントロピー符号化する。予測パラメータは、上述した予測モード(イントラ予測、インター予測)、イントラ予測ブロックサイズ、イントラ予測方向、インター予測ブロックサイズ、及び動きベクトルなど、MB及びブロックの予測に関連した情報である。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
バッファ104は、供給される再構築画像を格納する。1フレーム分の再構築画像を再構築ピクチャと呼ぶ。
多重化器106は、エントロピー符号化器102の出力データ、及び符号化パラメータを多重化して出力する。
上述した動作に基づいて、映像符号化装置における多重化器106は、ビットストリームを生成する。
非特許文献1に記載されている映像復号装置は、図21に示すように構成される。以下、図21に示される映像復号装置を一般的な映像復号装置と呼ぶ。
図21を参照して、ビットストリームを入力として復号された映像フレームを出力する、一般的な映像復号装置の構成と動作を説明する。
図21に示された映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、及びバッファ205を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、エントロピー符号化された映像ビットストリームを抽出する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、MB及びブロックの予測パラメータ及び変換量子化値をエントロピー復号し、逆変換/逆量子化器203及び予測器204に供給する。
逆変換/逆量子化器203は、量子化ステップ幅で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、エントロピー復号したMB及びブロックの予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
予測信号生成後、逆変換/逆量子化器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築画像としてバッファ205に供給される。
そして、バッファ205に格納された再構築ピクチャがデコード画像(デコード映像)として出力される。
上述した動作に基づいて、一般的な映像復号装置はデコード画像を生成する。
ISO/IEC 14496-10 Advanced Video Coding "Test Model under Consideration", Document: JCTVC-B205, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd Meeting: Geneva, CH, 21-28 July, 2010
ところで、非特許文献2はTest Model under Consideration方式(TMuC方式)を開示している。TMuC方式は、非特許文献1に開示された方式とは異なり、図22に示す階層構造の符号化ユニット(Coding Tree Block (CTB))を用いる。本明細書において、CTBのブロックをCoding Unit (CU:符号化ユニット)と呼ぶ。
なお、最大のCUをLargest Coding Unit (LCU)、最小のCUをSmallest Coding Unit(SCU)と呼ぶ。また、TMuC方式においては、CUに対する予測ユニットとしてPrediction Unit (PU)という概念(図23参照)が導入されている。PUは予測の基本単位であり、図23に示される{2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N}の8種類のPUパーティションタイプが定義されている。インター予測が用いられるPUをインターPU、イントラ予測が用いられるPUをイントラPUと呼ぶ。インター予測が用いられるPUパーティションをインターPUパーティション、イントラ予測が用いられるPUパーティションをイントラPUパーティションと呼ぶ。イントラPUパーティションは図23に示された形状のうち2N×2N、及びN×Nの正方形のみがサポートされている。以下、CU及びPUの1辺の長さをそれぞれCUサイズ及びPUサイズと呼ぶ。
また、TMuC方式では小数精度の予測画像を求めるために最大で12タップのフィルタを用いることができる。画素位置とフィルタの係数の関係は以下のとおりである。
Figure 2014187701
画素位置について、図24を用いて説明する。図24において、A、Eが整数画素位置の画素であるとする。このとき、bが1/4画素位置の画素、cが1/2画素位置の画素、dが3/4画素位置の画素である。垂直方向も同様となる。
図20に示す画素bまたは画素cは、水平または垂直方向の1/2画素位置用フィルタを1回適用することによって生成される。画素eは1/4画素位置用のフィルタを1回適用することによって生成される。
図25を参照して、画素eや画素eのように、その画素位置が水平垂直両方とも小数精度位置であり、そのうち少なくともどちらかが1/4画素位置である場合の小数画素生成の例を説明する。図25において、画素Aが整数画素位置の画素、画素cが求めたい小数画素位置の画素であるとする。このとき、まず、画素bが垂直方向の1/4画素位置用フィルタを適用することによって生成される。続いて、画素cが、小数画素bに対して、水平方向の3/4画素位置用フィルタを適用することによって生成される。なお、非特許文献2の8.3 Interpolation Methods には、小数画素生成のより詳細な説明が記載されている。
TMuC方式ではすべての階層のCUのPUヘッダでPUパーティションタイプを示すシンタクス(非特許文献2の4.1.10 Prediction unit syntax の表記に従えば、イントラ予測の場合はintra_split_flag、インター予測の場合はinter_partitioning_idc)を出力ビットストリームに埋め込む。以後、intra_split_flagシンタクスをイントラPUパーティションタイプシンタクス、inter_partitioning_idcシンタクスをインターPUパーティションタイプシンタクスと呼ぶ。
それぞれのLCU内に小さいサイズのCUが多く存在するとき、ビットストリームに含まれるインターPUパーティションタイプシンタクスのビット数の率が高くなり、圧縮映像の品質が低下する課題がある。
また、TMuC方式ではインターPUパーティションのサイズが小さいほど、参照ピクチャに対するメモリアクセスが増加し、メモリ帯域を圧迫する課題がある。特に、TMuC方式では12タップのフィルタを用いて小数画素を生成するため、メモリ帯域をより圧迫する。
図26は、12タップフィルタを用いるときのメモリアクセス領域を説明するための説明図である。図26(A)はN×NのPUパーティションタイプが選択されたときの、1つのインターPUパーティションのメモリアクセス領域、図26(B)は2N×2NのインターPUパーティションタイプが選択されたときのメモリアクセス領域を表わす。
N×Nが選択されたとき、図26(A)における破線で囲まれたサイズのメモリアクセスを0,1,2,3のインターPUパーティションごとに計4回行うため、メモリアクセス量は、4(N+11)=4N+88N+484に参照ピクチャのビット量を乗算した値になる。2N×2NのインターPUパーティションのメモリアクセス量が(2N+11)=4N+44N+121に参照ピクチャのビット量を乗算した値であることから、N×NのインターPUパーティションのメモリアクセス量は2N×2Nのメモリアクセス量よりも大きくなる。
例えば、N=4、片方向予測、画素値のビット精度が8bitのときの8×8 CUにおけるインターPUのメモリアクセス量を考える。2N×2NのインターPUパーティションにおけるメモリアクセス量は19×19×1×8bit = 2888bitであるのに対し、N×NのインターPUパーティションにおけるメモリアクセス量は15×15×4×8bit =7200bitとなり、約2.5倍のメモリアクセス量となる。
さらに、LCU単位では、LCUのブロックサイズが128×128のとき、LCUを1個のインターPUパーティションで予測するときのメモリアクセス量は139×139×1×8bit=154568bitであるのに対して、LCUを全て4×4インターPUパーティションで予測するとき(すなわち、LCUを1024個のインターPUパーティションで予測するとき)のメモリアクセス量は15×15×1024×8bit=1843200bitとなり、約12倍のメモリアクセス量となる。
本発明は、所定面積当たりのメモリ帯域を削減することを目的とする。
本発明による映像復号装置は、インター予測を用いて映像復号を行う映像復号装置であって、復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定する復号制御手段を備えることを特徴とする。
本発明による映像復号方法は、インター予測を用いて映像復号を行う映像復号方法であって、復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定することを特徴とする。
本発明による映像復号プログラムは、インター予測を用いて映像復号を行うコンピュータに、復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定する処理を実行させることを特徴とする。
本発明によれば、小さなインターPUパーティションの使用を制限してメモリ帯域を削減できる。
第1の実施形態の映像符号化装置のブロック図である。 PUパーティションタイプの候補の決定処理を示すフローチャートである。 シーケンスパラメータセットにおける最小インターPUサイズに関する情報を示すリストの説明図である。 PUヘッダ書き込みの動作を示すフローチャートである。 PUシンタクスにおけるinter_partitioning_idcシンタクスに関する情報を示すリストの説明図である。 第2の実施形態の映像復号装置のブロック図である。 PUヘッダ読み込みの動作を示すフローチャートである。 ピクチャパラメータセットにおける最小インターPUサイズに関する情報を示すリストの説明図である。 スライスヘッダにおける最小インターPUサイズに関する情報を示すリストの説明図である。 第4の実施形態の映像復号装置のブロック図である。 エラー検出の動作を示すフローチャートである。 本発明による映像符号化装置及び映像復号装置の機能を実現可能な情報処理システムの構成例を示すブロック図である。 本発明による映像符号化装置の主要部を示すブロック図である。 本発明による映像復号装置の主要部を示すブロック図である。 一般的な映像符号化装置のブロック図である。 ブロック分割の例を示す説明図である。 Intra_4×4とIntra_8×8のイントラ予測を説明するための説明図である。 Intra_16×16のイントラ予測を説明するための説明図である。 インター予測の例を示す説明図である。 動き補償予測における輝度信号の補間処理を示す説明図である。 一般的な映像復号装置のブロック図である。 CTBを説明するための説明図である。 PUを説明するための説明図である。 小数画素位置を説明するための説明図である。 TMuC方式の12タップフィルタを用いた小数画素生成方法を説明するための説明図である。 12タップフィルタを用いて小数画素を生成するときのメモリアクセス範囲を説明するための説明図である。
上述した一般的技術の課題を解決するために、本発明では、階層構造の符号化ユニットを用いることを特徴とする映像符号化において、CUのdepth (すなわち、CUサイズ)に基づいてインターPUパーティションを制限することで課題を解決する。本発明の一例では、2N×2N以外のインターPUパーティションが使用可能なCUサイズを制限することによって課題を解決する。本発明の別の一例では、PUヘッダのインターPUパーティションタイプシンタクス伝送を制限することによって課題を解決する。本発明の上記の例によって、ビットストリームに含まれるインターPUパーティションタイプシンタクスのビット数の率が低く抑えて圧縮映像の品質を向上させつつ、メモリ帯域を抑制できる。
実施形態1.
第1の実施形態では、外部設定される所定の最小インターPUサイズに基づいてインターPUパーティションタイプを制御する符号化制御手段、及び、最小インターPUサイズに関する情報を映像復号装置にシグナリングするための、最小インターPUサイズに関する情報をビットストリームに埋め込む手段を備える映像符号化装置を示す。
本実施形態では、利用可能なCUサイズを128,64,32,16,8(つまり、LCUサイズが128、SCUサイズが8である)、最小インターPUサイズ(minInterPredUnitSize)を8とする。
さらに、本実施形態では、最小インターPUサイズに関する情報(min_inter_pred_unit_hierarchy_depth )として、最小インターPUサイズ(8)をSCUサイズ(8)で割った値の”2”を底とするlog (対数)とする。よって、本実施形態では、ビットストリームに多重化されるmin_inter_pred_unit_hierarchy_depthの値は、0(=log (8/8))となる。
図1に示すように、本実施形態の映像符号化装置は、図15に示された一般的な映像符号化装置と同様に、変換/量子化器101、エントロピー符号化器102、逆変換/逆量子化器103、バッファ104、予測器105、多重化器106、及び符号化制御器107を備える。
図1に示す本実施形態の映像符号化装置では、図15に示す映像符号化装置とは異なり、minInterPredUnitSizeより大きいCUサイズでインターPUパーティションタイプシンタクスを伝送するために、minInterPredUnitSizeが符号化制御器107に供給されている。さらに、minInterPredUnitSizeを映像復号装置にシグナリングするために、minInterPredUnitSizeが多重化器106にも供給されている。
符号化制御器107は、符号化歪み(入力信号と再構築ピクチャの誤差画像のエネルギー)と発生ビット量から計算されるコスト(Rate-Distortion コスト:R-D コスト)を予測器105に計算させる。符号化制御器107は、R-D コストが最小となる、CU分割形状(図22に示したように、split_coding_unit_flagによって決定する分割形状)、及び、各CUの予測パラメータを決定する。符号化制御器107は、決定したsplit_coding_unit_flag及び各CUの予測パラメータを予測器105及びエントロピー符号化器102に供給する。予測パラメータは、予測モード(pred_mode )、イントラPUパーティションタイプ(intra_split_flag)、イントラ予測方向、インターPUパーティションタイプ(inter_partitioning_idc)、及び動きベクトルなど、符号化対象CUの予測に関連した情報である。
ただし、本実施形態の符号化制御器107は、一例として、minInterPredUnitSizeより大きいCUサイズのCUに対して、予測パラメータとして最適なPUパーティションタイプを、イントラ予測の{2N×2N、N×N}、インター予測の{2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N}の計10種類から選択する。符号化制御器107は、minInterPredUnitSizeと等しいCUサイズのCUに対して、予測パラメータとして最適なPUパーティションタイプを、イントラ予測の{2N×2N、N×N}、インター予測の{2N×2N}の計3種類から選択する。符号化制御器107は、minInterPredUnitSize未満のCUサイズのCUに対して、予測パラメータとして最適なPUパーティションタイプをイントラ予測の{2N×2N、N×N}の計2種類から選択する。
図2は、PUパーティションタイプの候補の決定に関する本実施形態の符号化制御器107の動作を示すフローチャートである。
図2に示すように、符号化制御器107は、ステップS101で、符号化対象CUのCUサイズがminInterPredUnitSizeより大きいと判定したとき、ステップS102で、PUパーティションタイプの候補をイントラ予測{2N×2N、N×N}とインター予測{2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N}の計10種類に設定し、ステップS106でR-D コストに基づいて予測パラメータを決定する。
ステップS101で符号化制御器107が符号化対象CUのCUサイズがminInterPredUnitSize以下であると判定したとき、ステップS103に進む。
符号化制御器107は、ステップS103で符号化対象CUのCUサイズがminInterPredUnitSizeと等しいと判定したとき、ステップS104で、PUパーティションタイプの候補をイントラ予測{2N×2N、N×N}とインター予測で{2N×2N}の計3種類に設定し、ステップS106でR-D コストに基づいて予測パラメータを決定する。
符号化制御器107は、ステップS103で符号化対象CUのCUサイズがminInterPredUnitSize未満であると判定したとき、ステップS105で、PUパーティションタイプの候補をイントラ予測の{2N×2N、N×N}の計2種類と設定し、ステップS106でR-D コストに基づいて予測パラメータとして最適なPUパーティションタイプを決定する。
予測器105は、符号化制御器107が決定した各CUの予測パラメータに対応する予測信号を選定する。
符号化制御器107が決定した形状の各CUの入力映像は、予測器105から供給される予測信号が減じられて予測誤差画像となり、変換/量子化器101に入力される。
変換/量子化器101は、予測誤差画像を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、量子化ステップ幅Qs で、周波数変換係数を量子化し、変換量子化値を得る。
エントロピー符号化器102は、符号化制御器107から供給されるsplit_coding_unit_flag(図22参照)、予測パラメータ、及び変換/量子化器101から供給される変換量子化値をエントロピー符号化する。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
多重化器106は、最小インターPUサイズに関する情報(min_inter_pred_unit_hierarchy_depth )、及びエントロピー符号化器102の出力データを多重化して出力する。非特許文献2の4.1.2 Sequence parameter set RBSP syntaxの表記に従えば、多重化器106は、図3に示すリストに表されるように、シーケンスパラメータセットのlog2_min_coding_unit_size_minus3シンタクスとmax_coding_unit_hierarchy_depth シンタクスに後続させて、min_inter_pred_unit_hierarchy_depth シンタクス(minInterPredUnitSizeをSCUサイズで割った値の”2”を底とするlog (対数)、本実施形態では0)を多重化する。ただし、log2_min_coding_unit_size_minus3シンタクス及びmax_coding_unit_hierarchy_depth シンタクスは、それぞれ、SCUサイズ(minCodingUnitSize )及びLCUサイズ(maxCodingUnitSize )を決定するための情報である。minCodingUnitSize とmaxCodingUnitSize は、それぞれ、以下のように計算される。
minCodingUnitSize =1<<(log2_min_coding_unit_size_minus3+3)
maxCodingUnitSize =1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth )
また、min_inter_pred_unit_hierarchy_depth シンタクスとminCodingUnitSize には以下の関係がある。
min_inter_pred_unit_hierarchy_depth =log (minInterPredUnitSize /minCodingUnitSize )
上述した動作に基づいて、発明の映像符号化装置はビットストリームを生成する。
本実施形態の映像符号化装置は、最小インターPUサイズ未満のインターPUが出現しないように、所定の最小インターPUサイズ、及び、符号化対象CUのCUサイズに基づいて符号化対象CUのインターPUパーティションを制御する。
最小インターPUサイズ未満のインターPUが出現しないようにすることによって、メモリ帯域が削減される。また、最小インターPUサイズ未満のインターPUが出現しないようにすることによって、シグナリングされるインターPUパーティションタイプシンタクスの個数が削減されるので、ビットストリームに占めるPUヘッダの符号量の割合が小さくなり映像の品質が改善する。
本実施形態の映像符号化装置における符号化制御手段は、外部設定される所定の最小インターPUサイズに基づいてインターPUパーティションを制御する。一例として、2N×2N以外のインターPUパーティションタイプを、所定のサイズより大きなCUサイズのCUでのみ使用するように制御する。よって、2N×2NのインターPUパーティションの発生確率が増加し、エントロピーが減少するため、エントロピー符号化の効率が上がる。よって、メモリ帯域を削減しつつ圧縮映像の品質を保持できる。
また、本実施形態の映像符号化装置は、映像復号についても同様にインターPUパーティションタイプシンタクスをビットストリームから読み出せるように、外部設定される所定の最小インターPUサイズに関する情報をビットストリームに埋め込む手段を備える。よって、映像復号装置に所定のサイズがシグナリングされるようになり、映像符号化装置と映像復号装置の相互運用性を高めることができる。
実施形態2.
第2の実施形態の映像符号化装置は、外部設定される所定の最小インターPUサイズに基づいてインターPUパーティションタイプを制御し、かつ、上記の所定の最小インターPUサイズに基づいて、インターPUパーティションタイプシンタクスのエントロピー符号化を制御する符号化制御手段、及び、上記の最小インターPUサイズに関する情報を映像復号装置にシグナリングするための、最小インターPUサイズに関する情報をビットストリームに埋め込む手段を備える。
本実施形態では、インターPUパーティションタイプシンタクスを伝送するCUのCUサイズは、上記の最小インターPUサイズ(minInterPredUnitSize)より大きいとする。また、本実施形態では、利用可能なCUサイズを128,64,32,16,8(つまり、LCUサイズが128、SCUサイズが8である)、minInterPredUnitSizeを8とする。よって、本実施形態では、インターPUパーティションタイプシンタクスをビットストリームに埋め込むCUサイズは128,64,32,16になる。
さらに、本実施形態では、最小インターPUサイズに関する情報(min_inter_pred_unit_hierarchy_depth )として、最小インターPUサイズ(8)をSCUサイズ(8)で割った値の”2”を底とするlog (対数)とする。よって、本実施形態では、ビットストリームに多重化されるmin_inter_pred_unit_hierarchy_depth の値は、0(=log (8/8))となる。
本実施形態の映像符号化装置の構成は、図1に示された第1の実施形態の映像符号化装置の構成と同様である。
図1に示すように、本実施形態の映像符号化装置では、図15に示す映像符号化装置とは異なり、minInterPredUnitSizeより大きいCUサイズでインターPUパーティションタイプシンタクスを伝送するためにminInterPredUnitSizeが符号化制御器107に供給されている。さらに、minInterPredUnitSizeを映像復号装置にシグナリングするために、minInterPredUnitSizeが多重化器106にも供給されている。
符号化制御器107は、符号化歪み(入力信号と再構築ピクチャの誤差画像のエネルギー)と発生ビット量から計算されるR-D コストを予測器105に計算させる。符号化制御器107は、R-D コストが最小となる、CU分割形状(図22に示したように、split_coding_unit_flagによって決定する分割形状)、及び、各CUの予測パラメータを決定する。符号化制御器107は、決定したsplit_coding_unit_flag及び各CUの予測パラメータを予測器105及びエントロピー符号化器102に供給する。予測パラメータは、予測モード(pred_mode )、イントラPUパーティションタイプ(intra_split_flag)、イントラ予測方向、インターPUパーティションタイプ(inter_partitioning_idc)、及び動きベクトルなど、符号化対象CUの予測に関連した情報である。
本実施形態の符号化制御器107は、第1実施形態と同様に、minInterPredUnitSizeより大きいCUサイズのCUに対しては、予測パラメータとして最適なPUパーティションタイプを、イントラ予測の{2N×2N、N×N}、インター予測の{2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N}の計10種類から選択する。符号化制御器107は、minInterPredUnitSizeと等しいCUサイズのCUに対して、予測パラメータとして最適なPUパーティションタイプを、イントラ予測の{2N×2N、N×N}、インター予測の{2N×2N}の計3種類から選択する。符号化制御器107は、minInterPredUnitSize未満のCUサイズのCUに対して、予測パラメータとして最適なPUパーティションタイプを、イントラ予測の{2N×2N、N×N}から選択する。
ただし、本実施形態の符号化制御器107は、エントロピー符号化対象CUの予測モードがインター予測であり、かつ、そのCUサイズがminInterPredUnitSize以下である場合は、inter_partitioning_idcをエントロピー符号化しないようにエントロピー符号化器102を制御する。
予測器105は、符号化制御器107が決定した各CUの予測パラメータに対応する予測信号を選定する。
符号化制御器107が決定した形状の各CUの入力映像は、予測器105から供給される予測信号が減じられて予測誤差画像となり、変換/量子化器101に入力される。
変換/量子化器101は、予測誤差画像を周波数変換し、周波数変換係数を得る。
さらに、変換/量子化器101は、量子化ステップ幅Qs で、周波数変換係数を量子化し、変換量子化値を得る。
エントロピー符号化器102は、符号化制御器107から供給されるsplit_coding_unit_flag(図22参照)、予測パラメータ、及び変換/量子化器101から供給される変換量子化値をエントロピー符号化する。ただし、上述したように、本実施形態のエントロピー符号化器102は、エントロピー符号化対象CUの予測モードがインター予測であり、かつ、そのCUサイズがminInterPredUnitSize以下である場合は、inter_partitioning_idcをエントロピー符号化しない。
逆変換/逆量子化器103は、量子化ステップ幅Qs で、変換量子化値を逆量子化する。さらに、逆変換/逆量子化器103は、逆量子化した周波数変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ104に供給される。
多重化器106は、最小インターPUサイズに関する情報(min_inter_pred_unit_hierarchy_depth )、及びエントロピー符号化器102の出力データを多重化して出力する。非特許文献2の4.1.2 Sequence parameter set RBSP syntaxの表記に従えば、多重化器106は、図3に示すリストに表されるように、シーケンスパラメータセットのlog2_min_coding_unit_size_minus3シンタクスとmax_coding_unit_hierarchy_depth シンタクスに後続させて、min_inter_pred_unit_hierarchy_depth シンタクス(minInterPredUnitSizeをSCUサイズで割った値の”2”を底とするlog (対数)、本実施形態においては0)を多重化する。ただし、log2_min_coding_unit_size_minus3シンタクス及びmax_coding_unit_hierarchy_depth シンタクスは、それぞれ、SCUサイズ(minCodingUnitSize )及びLCUサイズ(maxCodingUnitSize )を決定するための情報である。minCodingUnitSize とmaxCodingUnitSize は、それぞれ、以下のように計算される。
minCodingUnitSize =1<<(log2_min_coding_unit_size_minus3+3)
maxCodingUnitSize =1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth )
また、min_inter_pred_unit_hierarchy_depth シンタクスとminCodingUnitSize には以下の関係がある。
min_inter_pred_unit_hierarchy_depth =log (minInterPredUnitSize /minCodingUnitSize )
上述した動作に基づいて、本実施形態の映像符号化装置はビットストリームを生成する。
次に、本実施形態の特徴であるインターPUパーティションタイプシンタクス書き込みの動作を図4のフローチャートを参照して説明する。
図4に示すように、エントロピー符号化器102は、ステップS201で、split_coding_unit_flagをエントロピー符号化する。また、ステップS202で、エントロピー符号化器102は、予測モードをエントロピー符号化する。すなわち、pred_mode シンタクスをエントロピー符号化する。ステップS203で符号化対象CUの予測モードがインター予測であると判定し、かつ、ステップS204でCUサイズがminInterPredUnitSize以下のサイズであると判定した場合には、符号化制御器107は、エントロピー符号化器102におけるinter_partitioning_idcシンタクスのエントロピー符号化をスキップするように制御する。なお、ステップS203で符号化対象CUがイントラ予測であると判定した場合、又は、ステップS204でCUサイズがminInterPredUnitSizeより大きいと判定した場合には、ステップS205で、符号化制御器107は、エントロピー符号化器102が該符号化対象CUのPUパーティションタイプ情報をエントロピー符号化するように制御する。
なお、上述したpred_mode シンタクス、及びinter_partitioning_idcシンタクスは、非特許文献2の4.1.10 Prediction unit syntax の表記に従えば、図5に示すリストに表されるようにシグナリングされる。" if(currPredUnitSize > minInterPredUnitSize )" の条件によって、minInterPredUnitSizeより大きなサイズのCUのPUヘッダのみにおいて、inter_partitioning_idcシンタクスがシグナリングされることが、本実施形態の特徴である。
本実施形態の映像符号化装置は、シグナリングされるインターPUパーティションタイプシンタクスの個数を削減するように、符号化対象CUのCUサイズが所定の最小インターPUサイズ以下のときに、該符号化対象CUのPUヘッダレイヤのインターPUパーティションタイプシンタクスをエントロピー符号化させない。シグナリングされるインターPUパーティションタイプシンタクスの個数を削減することによって、ビットストリームを占めるPUヘッダの符号量の割合が小さくなるので、映像の品質がさらに改善する。
また、本実施形態の映像符号化装置は、最小インターPUサイズ未満のインターPUが出現しないように、符号化対象CUのCUサイズが所定の最小インターPUサイズを越えるときに、該符号化対象CUのPUヘッダレイヤのインターPUパーティションタイプシンタクスを所定のインターPUパーティションタイプに設定してエントロピー符号化させる。最小インターPUサイズ未満のインターPUが出現しないことによって、メモリ帯域が削減される。
実施形態3.
第3の実施形態の映像復号装置は、第2の実施形態の映像符号化装置が生成したビットストリームを復号する。
本実施形態の映像復号装置は、ビットストリームに多重化された最小インターPUサイズ情報を多重化解除する手段、多重化解除した最小インターPUサイズ情報に基づいてインターPUパーティションタイプを読み出す所定のCUサイズを決定するCUサイズ決定手段、及び、CUサイズ決定手段が決定したCUサイズでインターPUパーティションタイプをビットストリームから読み出す読み出し手段を備えることを特徴とする。
図6に示すように、本実施形態の映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、バッファ205、及び復号制御器206を備える。
多重化解除器201は、入力されるビットストリームを多重化解除して、最小インターPUサイズ情報、及びエントロピー符号化された映像ビットストリームを抽出する。多重化解除器201は、図3に示すリストに示されるように、シーケンスパラメータにおいて、log2_min_coding_unit_size_minus3シンタクスとmax_coding_unit_hierarchy_depth シンタクスに後続するmin_inter_pred_unit_hierarchy_depth シンタクスを多重化解除する。さらに、多重化解除器201は、多重化解除したシンタクスの値を用いて、インターPUパーティションタイプシンタクス(inter_partitioning_idcシンタクス)が伝送される最小インターPUサイズ(minInterPredUnitSize)を以下のように決定する。
minInterPredUnitSize=1<<(log2_min_coding_unit_size_minus3+3+min_inter_pred_unit_hierarchy_depth )
すなわち、本実施形態の多重化解除器201は、多重化解除した最小インターPUサイズ情報に基づいてインターPUパーティションタイプシンタクスを読み出すCUサイズを決定する役割も担っている。
さらに、多重化解除器201は、最小インターPUサイズを復号制御器206に供給する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆変換/逆量子化器203に供給する。エントロピー復号器202は、エントロピー復号したsplit_coding_unit_flag及び予測パラメータを復号制御器206に供給する。
ただし、本実施形態の復号制御器206は、復号対象CUの予測モードがインター予測であり、かつ、そのCUサイズがminInterPredUnitSizeであるときには、エントロピー復号器202に該復号対象CUのインターPUパーティションタイプシンタクスのエントロピー復号をスキップさせる。さらに、該復号対象CUのインターPUパーティションタイプを2N×2Nに設定する。なお、復号対象CUのCUサイズがminInterPredUnitSize未満であるとき、そのCUの予測モードはイントラ予測としかならない。
逆変換/逆量子化器203は、量子化ステップ幅で、輝度及び色差の変換量子化値を逆量子化する。さらに、逆変換/逆量子化器203は、逆量子化した周波数変換係数を逆周波数変換する。
逆周波数変換後、予測器204は、復号制御器206から供給される予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
逆変換/逆量子化器203で逆周波数変換された再構築予測誤差画像は、予測器204から供給される予測信号が加えられて、再構築ピクチャとしてバッファ205に供給される。
そして、バッファ205に格納された再構築ピクチャがデコード画像として出力される。
上述した動作に基づいて、本実施形態の映像復号装置はデコード画像を生成する。
次に、本実施形態の特徴であるインターPUパーティションタイプシンタクス読み込みの動作を図7のフローチャートを参照して説明する。
図7に示すように、エントロピー復号器202は、ステップS301で、split_coding_unit_flagをエントロピー復号してCUのサイズを確定する。 また、ステップS302で、エントロピー復号器202は、予測モードをエントロピー復号する。すなわち、エントロピー復号器202は、pred_mode シンタクスをエントロピー復号する。また、ステップS303で、予測モードがインター予測であると判定し、かつ、ステップS304で、確定したCUサイズがminInterPredUnitSize以下であると判定したとき、ステップS305で、復号制御器206は、エントロピー復号器202におけるインターPUパーティションタイプのエントロピー復号をスキップするように制御し、該CUのPUパーティションタイプを2N×2Nと設定するように制御する(inter_partitioning_idc=0とする)。
なお、ステップS303で、予測モードがイントラ予測であると判定した場合、又は、ステップS304で、確定したCUサイズがminInterPredUnitSizeより大きいと判定した場合、復号制御器206は、ステップS306で、エントロピー復号器202における該復号対象CUのPUパーティションタイプのエントロピー復号をスキップしないように制御し、該CUのPUパーティションタイプをエントロピー復号結果のPUパーティションタイプに設定する。
また、第1の実施形態及び第2の実施形態の映像符号化装置は、第1の実施形態で利用された最小インターPUサイズ情報(min_inter_pred_unit_hierarchy_depth )を、図8に示すリストや図9に示すリストに表されているように、ピクチャパラメータセットやスライスヘッダにおいて多重化できる。同様に、本実施形態の映像復号装置は、ピクチャパラメータセットやスライスヘッダからmin_inter_pred_unit_hierarchy_depth シンタクスを多重化解除できる。
また、第1の実施形態及び第2の実施形態の映像符号化装置は、min_inter_pred_unit_hierarchy_depth シンタクスを、LCUサイズ(maxCodingUnitSize )を最小インターPUサイズ(minInterPredUnitSize)で割った値の”2”を底とするlog (対数)としてもよい。すなわち、下式を用いてもよい。
min_inter_pred_unit_hierarchy_depth =log 2(maxCodingUnitSize /minInterPredUnitSize )
この場合、本実施形態の映像復号装置は、最小インターPUサイズを、min_inter_pred_unit_hierarchy_depth シンタクスに基づいて以下のように計算できる。
minInterPredUnitSize =1<<(log2_min_coding_unit_size_minus3+3+max_coding_unit_hierarchy_depth - min_inter_pred_unit_hierarchy_depth )
本実施形態の映像復号装置では、最小インターPUサイズ未満のインターPUが出現しないので、メモリ帯域が削減される。
実施形態4.
第4の実施形態の映像復号装置は、第1の実施形態の映像符号化装置が生成したビットストリームを復号する。
本実施形態の映像復号装置は、ビットストリームに多重化された最小インターPUサイズ情報を多重化解除する手段、及び、多重化解除した最小インターPUサイズ情報に基づいて復号対象CUを含むビットストリームのアクセスユニットにおけるエラーを検出するエラー検出手段を備えることを特徴とする。アクセスユニットは、非特許文献1の3.1 access unit において定義されているように、1ピクチャ分の符号化データを格納する単位である。エラーは、所定面積あたりに許容する動きベクトルの本数に基づく制約に対する違反を意味する。
図10に示すように、本実施形態の映像復号装置は、多重化解除器201、エントロピー復号器202、逆変換/逆量子化器203、予測器204、バッファ205、及びエラー検出器207を備える。
多重化解除器201は第3の実施形態における多重化解除器201と同様に動作し、入力されるビットストリームを多重化解除して、最小インターPUサイズ情報、及びエントロピー符号化された映像ビットストリームを抽出する。さらに最小インターPUサイズを求めて、最小インターPUサイズをエラー検出器207に供給する。
エントロピー復号器202は、映像ビットストリームをエントロピー復号する。エントロピー復号器202は、エントロピー復号した変換量子化値を逆変換/逆量子化器203に供給する。エントロピー復号器202は、エントロピー復号したsplit_coding_unit_flag及び予測パラメータをエラー検出器207に供給する。
エラー検出器207は、多重化解除器201から供給される最小インターPUサイズに基づいて、エントロピー復号器202から供給される予測パラメータのエラー検出を行い、予測パラメータを予測器204に供給する。エラー検出の動作は後述される。なお、エラー検出器207は、第3の実施形態における復号制御器206の役割も果たす。
逆変換/逆量子化器203は、第3の実施形態における逆変換/逆量子化器203と同様に動作する。
予測器204は、エラー検出器207から供給される予測パラメータに基づいて、バッファ205に格納された再構築ピクチャの画像を用いて予測信号を生成する。
バッファ205は、第3の実施形態におけるバッファ205と同様に動作する。
上述した動作に基づいて、本実施形態の映像復号装置はデコード画像を生成する。
図11のフローチャートを参照して、復号対象CUを含むビットストリームのアクセスユニットのエラーを検出する、本実施形態の映像復号装置のエラー検出動作を説明する。
ステップS401で、エラー検出器207は、CUサイズ、予測モード、PUパーティションタイプを確定する。
ステップS402で、エラー検出器207は、復号対象CUのPUの予測モードを判定する。予測モードがイントラ予測である場合には、処理を終了する。予測モードがインター予測である場合、ステップS403に進む。
ステップS403で、エラー検出器207は、復号対象CUのPUサイズと最小インターPUサイズとを比較する。該復号対象CUのPUサイズが最小インターPUサイズ以上の場合には、処理を終了する。該復号対象CUのPUサイズが最小インターPUサイズ未満である場合には、ステップS404に進む。
ステップS404で、エラー検出器207は、エラーがあると判断し、エラーを外部に通知する。例えば、エラーが発生した該復号対象CUのアドレスを出力する。
以上の動作により、エラー検出器207は、復号対象CUを含むビットストリームのアクセスユニットのエラーを検出する。
なお、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図12に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003及びビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図12に示された情報処理システムにおいて、プログラムメモリ1002には、図1、図6、図10のそれぞれに示された各ブロック(バッファのブロックを除く)の機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1、図6、図10のそれぞれに示された映像符号化装置または映像復号装置の機能を実現する。
図13は、本発明による映像符号化装置の主要部を示すブロック図である。図13に示すように、本発明による映像符号化装置は、インター予測を用いて映像符号化を行う映像符号化装置であって、所定の最小インターPUサイズ(PA)と、符号化対象CUのCUサイズ(PB)とに基づいて符号化対象CUのインターPUパーティションタイプを制御する符号化制御手段11(一例として、図1に示す符号化制御器107)を備える。
図14は、本発明による映像復号装置の主要部を示すブロック図である。図14に示すように、本発明による映像復号装置は、インター予測を用いて映像復号を行う映像復号装置であって、所定の最小インターPUサイズ(PA)と、復号対象CUのサイズ(PB)とに基づいて復号対象CUのインターPUパーティションを制御する復号制御手段21(一例として、図6及び図10に示す復号制御器207)を備える。
以上、実施形態および実施例を参照して本発明を説明したが、本発明は上記実施形態および実施例に限定されない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年1月13日に出願された日本特許出願2011−4964を基礎とする優先権を主張し、その開示の全てをここに取り込む。
11 符号化制御手段
21 復号制御手段
101 変換/量子化器
102 エントロピー符号化器
103 逆変換/逆量子化器
104 バッファ
105 予測器
106 多重化器
107,108 符号化制御器
201 多重化解除器
202 エントロピー復号器
203 逆変換/逆量子化器
204 予測器
205 バッファ
206 復号制御部
207 エラー検出器
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体

Claims (3)

  1. インター予測を用いて映像復号を行う映像復号装置であって、
    復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定する復号制御手段を備えることを特徴とする映像復号装置。
  2. インター予測を用いて映像復号を行う映像復号方法であって、
    復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定することを特徴とする映像復号方法。
  3. インター予測を用いて映像復号を行うコンピュータに、
    復号対象CUの予測モードがインター予測であり、当該復号対象のCUサイズがCUサイズの最小値と等しい場合に、当該復号対象CUのインターパーティションタイプを、当該復号対象CUが分割されるPUが最小サイズであることを示すN×N以外のタイプに設定する処理を実行させるための映像復号プログラム。
JP2014102438A 2011-01-13 2014-05-16 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム Active JP5787002B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014102438A JP5787002B2 (ja) 2011-01-13 2014-05-16 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011004964 2011-01-13
JP2011004964 2011-01-13
JP2014102438A JP5787002B2 (ja) 2011-01-13 2014-05-16 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012552667A Division JP5673693B2 (ja) 2011-01-13 2012-01-05 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015144087A Division JP5994911B2 (ja) 2011-01-13 2015-07-21 映像復号装置、映像復号方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014187701A true JP2014187701A (ja) 2014-10-02
JP5787002B2 JP5787002B2 (ja) 2015-09-30

Family

ID=46507056

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2012552667A Active JP5673693B2 (ja) 2011-01-13 2012-01-05 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP2014102438A Active JP5787002B2 (ja) 2011-01-13 2014-05-16 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP2015144087A Active JP5994911B2 (ja) 2011-01-13 2015-07-21 映像復号装置、映像復号方法及びプログラム
JP2016158609A Active JP6213636B2 (ja) 2011-01-13 2016-08-12 映像復号装置、映像復号方法及びプログラム
JP2017172889A Active JP6497423B2 (ja) 2011-01-13 2017-09-08 映像復号装置、映像復号方法及びプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012552667A Active JP5673693B2 (ja) 2011-01-13 2012-01-05 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2015144087A Active JP5994911B2 (ja) 2011-01-13 2015-07-21 映像復号装置、映像復号方法及びプログラム
JP2016158609A Active JP6213636B2 (ja) 2011-01-13 2016-08-12 映像復号装置、映像復号方法及びプログラム
JP2017172889A Active JP6497423B2 (ja) 2011-01-13 2017-09-08 映像復号装置、映像復号方法及びプログラム

Country Status (10)

Country Link
US (4) US10841590B2 (ja)
EP (4) EP2899976B1 (ja)
JP (5) JP5673693B2 (ja)
KR (5) KR20150020622A (ja)
CN (5) CN105208393B (ja)
BR (5) BR122020018528B1 (ja)
ES (3) ES2928097T3 (ja)
HK (3) HK1208978A1 (ja)
PL (3) PL2899976T3 (ja)
WO (1) WO2012096147A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9762899B2 (en) * 2011-10-04 2017-09-12 Texas Instruments Incorporated Virtual memory access bandwidth verification (VMBV) in video coding
US9538239B2 (en) * 2012-08-13 2017-01-03 Gurulogic Microsystems Oy Decoder and method for decoding encoded input data containing a plurality of blocks or packets
US9712871B2 (en) 2014-05-01 2017-07-18 Qualcomm Incorporated Determination bitstream decoding capability in video coding
US20180091810A1 (en) * 2015-03-23 2018-03-29 Lg Electronics Inc. Method for processing video signal and device therefor
US10798403B2 (en) 2016-01-29 2020-10-06 Sharp Kabushiki Kaisha Prediction image generation device, video decoding device, and video coding device
US10939099B2 (en) * 2016-04-22 2021-03-02 Lg Electronics Inc. Inter prediction mode-based image processing method and device therefor
US20200236385A1 (en) * 2017-10-03 2020-07-23 Nec Corporation Video coding device, video decoding device, video coding method, video decoding method and program
CN110213591B (zh) * 2018-03-07 2023-02-28 腾讯科技(深圳)有限公司 一种视频运动估计方法、装置及存储介质
US10382772B1 (en) * 2018-07-02 2019-08-13 Tencent America LLC Method and apparatus for video coding
CN116405686A (zh) * 2018-12-15 2023-07-07 华为技术有限公司 图像重建方法和装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUP0301368A3 (en) 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
JP4617644B2 (ja) * 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
KR100587698B1 (ko) * 2004-10-22 2006-06-08 주식회사 휴맥스 선택적 예측 부호화/복호화 방법 및 장치
KR100703748B1 (ko) 2005-01-25 2007-04-05 삼성전자주식회사 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치
KR20070024211A (ko) 2005-08-26 2007-03-02 삼성전자주식회사 영상압축장치 및 방법
KR100727969B1 (ko) 2005-08-27 2007-06-14 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
JP4666255B2 (ja) * 2005-12-27 2011-04-06 日本電気株式会社 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
JP2009081781A (ja) * 2007-09-27 2009-04-16 Panasonic Corp 動き補償装置及び動き補償方法
KR101460608B1 (ko) * 2008-03-04 2014-11-14 삼성전자주식회사 필터링된 예측 블록을 이용한 영상 부호화, 복호화 방법 및장치
US8488678B2 (en) 2008-04-01 2013-07-16 Canon Kabushiki Kaisha Moving image encoding apparatus and moving image encoding method
JP5390794B2 (ja) 2008-06-05 2014-01-15 キヤノン株式会社 動きベクトル探索装置および動きベクトル探索方法
KR101517768B1 (ko) * 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
JP5548397B2 (ja) 2009-06-25 2014-07-16 京楽産業.株式会社 遊技機
JP5489557B2 (ja) 2009-07-01 2014-05-14 パナソニック株式会社 画像符号化装置及び画像符号化方法
KR20110017719A (ko) 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN101648086B (zh) 2009-09-02 2012-08-29 朱宁 快速沉淀方法及快速沉淀分离装置
KR101484280B1 (ko) * 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
CN104661033B (zh) * 2009-12-10 2018-02-06 Sk电信有限公司 使用树形结构的解码装置
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
KR20130102527A (ko) * 2010-08-03 2013-09-17 소니 주식회사 화상 처리 장치와 화상 처리 방법
JP5577183B2 (ja) 2010-08-05 2014-08-20 ヤンマー株式会社 ガスエンジンの掃気運転方法
US8344917B2 (en) * 2010-09-30 2013-01-01 Sharp Laboratories Of America, Inc. Methods and systems for context initialization in video coding and decoding
US8885704B2 (en) 2010-10-01 2014-11-11 Qualcomm Incorporated Coding prediction modes in video coding
US8526495B2 (en) * 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
CN103698386B (zh) 2010-12-31 2016-03-09 同方威视技术股份有限公司 用于痕量探测仪的进样装置以及具有该进样装置的痕量探测仪
US9049452B2 (en) * 2011-01-25 2015-06-02 Mediatek Singapore Pte. Ltd. Method and apparatus for compressing coding unit in high efficiency video coding
EP2763414B1 (en) * 2011-09-29 2020-09-23 Sharp Kabushiki Kaisha Image decoding device and image decoding method for performing bi-prediction to uni-prediction conversion

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6014034533; Keiichi Chono(外4名): 'Description of video coding technology proposal by NEC (JCTVC-A104)' Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 JCTVC , 20100423, p.1-29, ITU-T *
JPN6015025793; Shun-ichi Sekiguchi et al.: 'On motion block size and partition for 4:4:4 video coding' ITU -Telecommunications Standardization Sector STUDY GROUP 16 Question 6 Video Coding Experts Group , 20080712, p.1-9 *

Also Published As

Publication number Publication date
ES2928097T3 (es) 2022-11-15
JP5994911B2 (ja) 2016-09-21
KR20150083134A (ko) 2015-07-16
BR122015017257B1 (pt) 2022-08-02
US11582461B2 (en) 2023-02-14
JP5673693B2 (ja) 2015-02-18
US20160029025A1 (en) 2016-01-28
JP2016226019A (ja) 2016-12-28
JP5787002B2 (ja) 2015-09-30
JP2015222976A (ja) 2015-12-10
EP3833026A1 (en) 2021-06-09
KR20150020622A (ko) 2015-02-26
BR122015024083A2 (pt) 2020-05-26
BR122015017257A2 (pt) 2019-08-27
KR20160070161A (ko) 2016-06-17
HK1208978A1 (en) 2016-03-18
CN103329535A (zh) 2013-09-25
EP2665272A1 (en) 2013-11-20
US11943449B2 (en) 2024-03-26
BR112013017799B1 (pt) 2022-05-24
US20230156198A1 (en) 2023-05-18
EP3860125A1 (en) 2021-08-04
EP2665272A4 (en) 2014-07-09
US20210029363A1 (en) 2021-01-28
CN106878730B (zh) 2020-06-26
PL2899976T3 (pl) 2021-11-22
BR122015024083B1 (pt) 2022-08-02
HK1219191A1 (zh) 2017-03-24
EP2665272B1 (en) 2021-03-24
BR122020018528B1 (pt) 2022-05-24
ES2864874T3 (es) 2021-10-14
PL2665272T3 (pl) 2021-10-18
JP2018007268A (ja) 2018-01-11
EP2899976A1 (en) 2015-07-29
CN107105260A (zh) 2017-08-29
EP3833026B1 (en) 2022-07-13
US9712826B2 (en) 2017-07-18
BR122020018527B1 (pt) 2022-05-24
CN105208393A (zh) 2015-12-30
CN107105260B (zh) 2021-05-07
BR112013017799A2 (pt) 2016-10-11
KR20130098420A (ko) 2013-09-04
KR20150063582A (ko) 2015-06-09
ES2882882T3 (es) 2021-12-03
WO2012096147A1 (ja) 2012-07-19
KR101738322B1 (ko) 2017-05-19
JP6213636B2 (ja) 2017-10-18
JP6497423B2 (ja) 2019-04-10
EP2899976B1 (en) 2021-05-19
CN103329535B (zh) 2017-04-05
KR101843624B1 (ko) 2018-03-29
CN105208393B (zh) 2017-10-27
KR101829515B1 (ko) 2018-02-14
PL3833026T3 (pl) 2022-11-07
CN105187825B (zh) 2018-03-09
CN106878730A (zh) 2017-06-20
CN105187825A (zh) 2015-12-23
JPWO2012096147A1 (ja) 2014-06-09
US10841590B2 (en) 2020-11-17
US20130336397A1 (en) 2013-12-19
HK1219190A1 (zh) 2017-03-24

Similar Documents

Publication Publication Date Title
JP6497423B2 (ja) 映像復号装置、映像復号方法及びプログラム
JP6432662B2 (ja) 映像符号化装置、映像符号化方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150713

R150 Certificate of patent or registration of utility model

Ref document number: 5787002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150