JP6473078B2 - 画像復号装置 - Google Patents

画像復号装置 Download PDF

Info

Publication number
JP6473078B2
JP6473078B2 JP2015510167A JP2015510167A JP6473078B2 JP 6473078 B2 JP6473078 B2 JP 6473078B2 JP 2015510167 A JP2015510167 A JP 2015510167A JP 2015510167 A JP2015510167 A JP 2015510167A JP 6473078 B2 JP6473078 B2 JP 6473078B2
Authority
JP
Japan
Prior art keywords
unit
prediction
image
ctb
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015510167A
Other languages
English (en)
Other versions
JPWO2014163209A1 (ja
Inventor
貴也 山本
貴也 山本
知宏 猪飼
知宏 猪飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2014163209A1 publication Critical patent/JPWO2014163209A1/ja
Application granted granted Critical
Publication of JP6473078B2 publication Critical patent/JP6473078B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像復号装置、画像符号化装置および、データ構造に関する。
複数のレイヤから構成される動画像の符号化方法は、一般に、スケーラブル符号化又は階層符号化と呼ばれる。スケーラブル符号化では、レイヤ間で予測を行うことで、高い符号化効率を実現する。レイヤ間で予測を行わずに基準となるレイヤは、ベースレイヤ、それ以外のレイヤは拡張レイヤと呼ばれる。レイヤが視点画像から構成される場合のスケーラブル符号化を、ビュースケーラブル符号化と呼ぶ。このとき、ベースレイヤはベースビュー、拡張レイヤは非ベースビューとも呼ばれる。さらに、ビュースケーラブルに加え、レイヤがテクスチャレイヤ(画像レイヤ)とデプスレイヤ(距離画像レイヤ)から構成される場合のスケーラブル符号化を、3次元スケーラブル符号化と呼ばれる。
ある対象レイヤ(対象ビュー)の復号と、ある対象レイヤから参照される参照レイヤ(参照ビュー)の復号を並列で行う場合、対象レイヤから参照される参照レイヤ画像の参照範囲が制限されている必要がある。従来、並列符号化用の制限の存在および制限範囲(参照不可範囲)を符号化データの一部(並列デコード情報)として伝送する技術(非特許文献1)が知られている。
Y. Chen, V. Seregin, A.-K. Ramasubramonian, L. Zhang, Y.-K. Wang, "AHG7: Parallel decoding SEI message for MV-HEVC", JCT3V-C0062r1, JCT3V 3rd Meeting: Geneva, CH, 17-23 Jan. 2013
しかしながら、非特許文献1においては、参照不可範囲が符号化ブロック単位であるCTB単位で決定されているために、CTBサイズが変化する場合に参照不可範囲が変化という課題があった。参照不可範囲の実現には、符号化装置において、視差ベクトルの範囲を、参照不可範囲を参照しない範囲に限定する必要があるが、この視差ベクトルの範囲が不明確であるという課題が有った。また、参照不可範囲の垂直方向の制限と、水平方向の制限を同時に行う場合のみを定義するため、垂直方向のみによる参照不可範囲の定義が不可能であった。また、対象ビューにおいてループフィルタがかからない場合には、対象ビューのデコードをより早く行う超低遅延デコードが可能であるが、対象ビューにループフィルタをかけることを前提に参照範囲の制限が行われているため、このような超低遅延デコードが不可能であるという課題が有った。
本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、複数のレイヤ画像を復号する画像復号装置において、第1のレイヤ画像の復号時に前記第1のレイヤ画像とは異なる第2のレイヤ画像を参照する場合に、前記第2のレイヤ画像の参照不可範囲を定義するエントロピー復号部を備えており、前記エントロピー復号部において復号される前記参照不可範囲は、垂直方向のオフセットのみに基づくものとして定義されていることを特徴とする画像復号装置。
本発明のその他の態様は、複数のレイヤ画像を復号する画像復号装置において、第1のレイヤ画像の復号時に前記第1のレイヤ画像とは異なる第2のレイヤ画像を参照する場合には、前記第2のレイヤ画像の参照不可範囲を定義するエントロピー復号部を備えており、前記エントロピー復号部は、垂直方向のみに基づいて定義される前記参照不可範囲か、垂直方向及び水平方向のオフセットに基づいて定義される前記参照不可範囲かを選択することを特徴とする画像復号装置。
本発明によれば、並列デコード情報で伝送される参照不可範囲が、対象ビューの符号化パラメータのみに依存するため、参照不可範囲の導出が容易であるという効果を奏する。また、対象ビューにおいてループフィルタの有無に対応するオフセットを並列デコード情報のオフセット情報として符号化することにより、超低遅延デコードを可能とする効果を奏する。
本発明の実施形態に係る画像伝送システムの構成を示す概略図である。 本実施形態に係る符号化ストリームのデータの階層構造を示す図である。 本実施形態に係るSEI復号部で復号される並列デコード情報の符号化データの構成を示す概略図である。 本実施形態に係る第1の参照不可範囲、第2の参照不可範囲、及び参照不可範囲を示す概念図である。 参照ピクチャの例を示す概念図である。 本実施形態に係る画像復号装置の構成を示す概略図である。 本実施形態における並列デコード動作の概念図である。 本実施形態に係る画像符号化装置の構成を示すブロック図である。
(第1の実施形態)
以下、図面を参照しながら本発明の実施形態について説明する。
図1は、本実施形態に係る画像伝送システム1の構成を示す概略図である。
画像伝送システム1は、複数のレイヤ画像を符号化した符号を伝送し、伝送された符号を復号した画像を表示するシステムである。画像伝送システム1は、画像符号化装置11、ネットワーク21、画像復号装置31及び画像表示装置41を含んで構成される。
画像符号化装置11には、複数のレイヤ画像(テクスチャ画像ともいう)を示す信号Tが入力される。レイヤ画像とは、ある解像度及びある視点で視認もしくは撮影される画像である。複数のレイヤ画像を用いて3次元画像を符号化するビュースケーラブル符号化を行う場合、複数のレイヤ画像のそれぞれは、視点画像と呼ばれる。ここで、視点は撮影装置の位置又は観測点に相当する。例えば、複数の視点画像は、被写体に向かって左右の撮影装置のそれぞれが撮影した画像である。画像符号化装置11は、この信号のそれぞれを符号化して符号化ストリームTe(符号化データ)を生成する。符号化ストリームTeの詳細については、後述する。視点画像とは、ある視点において観測される2次元画像(平面画像)である。視点画像は、例えば2次元平面内に配置された画素毎の輝度値、又は色信号値で示される。以下では、1枚の視点画像又は、その視点画像を示す信号をピクチャ(picture)と呼ぶ。また、複数のレイヤ画像を用いて空間スケーラブル符号化を行う場合、その複数のレイヤ画像は、解像度の低いベースレイヤ画像と、解像度の高い拡張レイヤ画像からなる。複数のレイヤ画像を用いてSNRスケーラブル符号化を行う場合、その複数のレイヤ画像は、画質の低いベースレイヤ画像と、画質の高い拡張レイヤ画像からなる。なお、ビュースケーラブル符号化、空間スケーラブル符号化、SNRスケーラブル符号化を任意に組み合わせて行っても良い。本実施形態では、複数のレイヤ画像として、少なくともベースレイヤ画像と、ベースレイヤ画像以外の画像(拡張レイヤ画像)を含む画像の符号化および復号を扱う。複数のレイヤのうち、画像もしくは符号化パラメータにおいて参照関係(依存関係)にある2つのレイヤについて、参照される側の画像を、第1レイヤ画像、参照する側の画像を第2レイヤ画像と呼ぶ。例えば、ベースレイヤを参照して符号化される(ベースレイヤ以外の)エンハンスレイヤ画像がある場合、ベースレイヤ画像を第1レイヤ画像、エンハンスレイヤ画像を第2レイヤ画像として扱う。なお、エンハンスメントレイヤ画像の例としては、ベースビュー以外の視点の画像、デプスの画像などがある。
ネットワーク21は、画像符号化装置11が生成した符号化ストリームTeを画像復号装置31に伝送する。ネットワーク21は、インターネット(internet)、広域ネットワーク(WAN:Wide Area Network)、小規模ネットワーク(LAN:Local Area Network)又はこれらの組み合わせである。ネットワーク21は、必ずしも双方向の通信網に限らず、地上波ディジタル放送、衛星放送等の放送波を伝送する一方向又は双方向の通信網であっても良い。また、ネットワーク21は、DVD(Digital Versatile Disc)、BD(Blue−ray Disc)等の符号化ストリームTeを記録した記憶媒体で代替されても良い。
画像復号装置31は、ネットワーク21が伝送した符号化ストリームTeのそれぞれを復号し、それぞれ復号した複数の復号レイヤ画像Td(復号視点画像Td)を生成する。
画像表示装置41は、画像復号装置31が生成した複数の復号レイヤ画像Tdの全部又は一部を表示する。例えば、ビュースケーラブル符号化においては、全部の場合、3次元画像(立体画像)や自由視点画像が表示され、一部の場合、2次元画像が表示される。画像表示装置41は、例えば、液晶ディスプレイ、有機EL(Electro−luminescence)ディスプレイ等の表示デバイスを備える。また、空間スケーラブル符号化、SNRスケーラブル符号化では、画像復号装置31、画像表示装置41が高い処理能力を有する場合には、画質の高い拡張レイヤ画像を表示し、より低い処理能力しか有しない場合には、拡張レイヤほど高い処理能力、表示能力を必要としないベースレイヤ画像を表示する。
<符号化ストリームTeの構造>
本実施形態に係る画像符号化装置11および画像復号装置31の詳細な説明に先立って、画像符号化装置11によって生成され、画像復号装置31によって復号される符号化ストリームTeのデータ構造について説明する。
図2は、符号化ストリームTeにおけるデータの階層構造を示す図である。符号化ストリームTeは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。図2の(a)〜(f)は、それぞれ、シーケンスSEQを既定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、スライスデータを規定するスライスデータレイヤ、スライスデータに含まれる符号化ツリーユニットを規定する符号化ツリーレイヤ、符号化ツリーに含まれる符号化単位(Coding Unit;CU)を規定する符号化ユニットレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために画像復号装置31が参照するデータの集合が規定されている。シーケンスSEQは、図2の(a)に示すように、ビデオパラメータセット(Video Parameter Set)シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、付加拡張情報SEI(Supplemental Enhancement Information)及び、ピクチャPICTを含んでいる。ここで#の後に示される値はレイヤIDを示す。図2では、#0と#1すなわちレイヤ0とレイヤ1の符号化データが存在する例を示すが、レイヤの種類およびレイヤの数はこれによらない。
ビデオパラメータセットVPSは、複数のレイヤから構成されている動画像において、複数の動画像に共通する符号化パラメータの集合および動画像に含まれる複数のレイヤおよび個々のレイヤに関連する符号化パラメータの集合が規定されている。
シーケンスパラメータセットSPSでは、対象シーケンスを復号するために画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの幅や高さが規定される。
ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために画像復号装置31が参照する符号化パラメータの集合が規定されている。例えば、ピクチャの復号に用いられる量子化幅の基準値(pic_init_qp_minus26)や重み付き予測の適用を示すフラグ(weighted_pred_flag)が含まれる。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。
付加拡張情報SEIでは、対象シーケンスの復号を制御するための情報の集合が規定されている。並列デコードを可能とする並列デコード情報は、SEIの一つである。
(並列デコード情報)
図3は、並列デコード情報の符号化データの構成を示す図である。
ここで、pdi_unreferenced_region_ctu_horizontal[i][j]とpdi_unreferenced_region_ctu_vertical[i][j]は、参照不可範囲を示すためのシンタックス要素である。pdi_unreferenced_region_ctu_horizontal[i][j]は、対象ビューi(第1のレイヤ)が参照ビューj(第2のレイヤ)を参照する場合において、参照不可範囲を示す水平方向のオフセットであり、pdi_unreferenced_region_ctu_vertical[i][j]は対象ビューiが参照ビューjを参照する場合において参照不可範囲を示す垂直方向のオフセットである。水平方向のオフセットおよび垂直方向のオフセットは、各々、対象ビューiの対象CTBを復号する際に、参照ビューjの参照不可範囲の左上参照CTBとのオフセットを示す。オフセットの単位は、CTB単位である。また、参照ビューjの参照CTBを復号してから、対象ビューiが復号可能となるまでの遅延を、対象ビューの対象CTBと、参照CTBとのオフセットで示したものと示すと定義しても同等である。また、pdi_offset_flagは、参照不可範囲を調整するためのシンタックス要素(調整フラグ)であり、対象ビューにおいて、ループフィルタ(デブロッキングフィルタ、SAO及びインターポレーションフィルタ)をかける場合には1、かけない場合には0が設定される。なお、後述するようにPdiOffsetValを0固定トする場合には、調整フラグを符号化データに含めない構成も可能である。この場合、ループフィルタの有無に対応する参照不可範囲の調整は不可能になる。
(参照不可範囲)
参照不可範囲unreferenced region[i][j]とは、ある対象ビューiが、別の参照ビューjを参照する際に、参照範囲としてはならない範囲である。
図4の(a)〜(c)は、それぞれ、第1の参照不可範囲、第2の参照不可範囲、及び参照不可範囲unreferenced region[i][j]を示す図である。参照不可範囲は、第1の参照不可範囲のみ、もしくは、第1の参照不可範囲と第2の参照不可範囲から構成される。第1の参照不可範囲と第2の参照不可範囲の両方が定義される場合には、第1の参照不可範囲と第2の参照不可範囲の和の部分が参照不可範囲となる。第1の参照不可範囲と第2の参照不可範囲には重なりが有っても良い。なお、第1の参照不可範囲と第2の参照不可範囲の両方が定義されない場合には、参照不可範囲はない。すなわち、どの領域も参照可能である。
第1の参照不可範囲は、並列デコード情報の垂直方向のオフセットであるシンタックス要素pdi_unreferenced_region_ctu_verticalが0より大きい場合に定義される。pdi_unreferenced_region_ctu_verticalが0の場合には定義されない。垂直方向のオフセットpdi_unreferenced_region_ctu_verticalは、第1の参照不可範囲の垂直方向の制限範囲を示す。第1の参照不可範囲は、
xUnref = 0..pic_width_in_luma_samples - 1,
yUnref = yCtb + (pdi_unreferenced_region_ctu_vertical[i][j]*CtbSizeY) - PdiOffsetVal..pic_height_in_luma_samples - 1,
で定義される矩形の範囲である。すなわち、第1の参照不可範囲は、垂直方向のオフセットpdi_unreferenced_region_ctu_vertical[i][j]で定義される矩形領域となる。第1の参照不可範囲の左上座標のY座標は、対象ブロックのCTB座標のY座標yCtbと垂直方向のオフセットの和にCTBサイズCtbSizeYを乗じた値であり、前記左上座標のX座標は0であり、参照不可範囲の右下座標は、画面の右下である。
なお、xUnref = x_min...x_maxはx座標がx_min以上、x_max以下を示し、yUnref = y_min...y_maxは、y座標がy_min以上、y_max以下を示す。X座標とY座標の範囲を示すことで、矩形範囲を示している(以下同様)。
なお、pic_width_in_luma_samples は、ピクチャの輝度成分の横幅を示す。pic_height_in_luma_samples は、ピクチャの輝度成分の高さを示す。CtbAddrInRsは、ピクチャ内で対象CTBがラスタースキャン順で何個目のCTBにあたるかを示す。PicWidthInCtbsYは、対象ビューの高さをCTBサイズで割った値である。CtbSizeYは、対象ビューのCTBサイズである。PdiOffsetValは、並列デコード情報のループフィルタによる調整を行うか否かを示すシンタックス要素pdi_offset_flagの値により次の式で定まるオフセットである。
PdiOffsetVal = pdi_offset_flag * 8
PdiOffsetValは、参照ビュー上で、ループフィルタを適用するかに応じて必要な参照不可範囲が変化することに対応する。ループフィルタとして、デブロッキングフィルタと適応オフセットフィルタ(SAO)を想定する場合、通常デブロッキングフィルタの適用範囲は3画素、適応オフセットフィルタの適用範囲は1画素であるからその合計の4画素分、参照ビューで適応オフセットフィルタが係る場合には、参照不可範囲を増やす必要がある。そのため、pdi_offset_flagが1の場合には、PdiOffsetValが4、pdi_offset_flagが0の場合には、PdiOffsetValが0となるようにしている。参照ビューでループフィルタが係る場合には、CTBの一番下に位置する水平境界及び一番右に位置する垂直境界のループフィルタ処理には、各々下に位置する次のCTBラインのCTBおよび右の位置する次のCTBの復号を待つ必要がある。つまり、境界付近の画素を参照する場合、復号待ちによる遅延が増大する。参照ビューにループフィルタが係る場合にはこの範囲を除外することにより遅延が増えることを防ぐ効果がある。
第2の参照不可範囲は、並列デコード情報の水平方向のオフセットであるシンタックス要素pdi_unreferenced_region_ctu_horizontalが0より大きい場合に定義される。pdi_unreferenced_region_ctu_horizontalが0の場合には定義されない。水平方向のオフセットpdi_unreferenced_region_ctu_horizontalは、第2の参照不可範囲の水平方向の制限範囲を示す。第2の参照不可範囲は、
xUnref = xCtb + (pdi_unreferenced_region_ctu_horizontal[i][j]*CtbSizeY) - PdiOffsetVal..pic_width_in_luma_samples - 1
yUnref = yCtb + ((pdi_unreferenced_region_ctu_vertical[i][j]-1)*CtbSizeY) - PdiOffsetVal..pic_height_in_luma_samples - 1
で定義される矩形の範囲である。すなわち、第2の参照不可範囲は、垂直方向のオフセットpdi_unreferenced_region_ctu_vertical[i][j]と水平方向のオフセットpdi_unreferenced_region_ctu_horizontal[i][j]で定義される矩形領域となる。第2の参照不可範囲の左上座標のY座標は、対象ブロックのCTB座標のY座標yCtbと垂直方向のオフセットの和から1を引いた値にCTBサイズCtbSizeYを乗じた値であり、前記左上座標のX座標は対象ブロックのCTB座標のX座標xCtbと垂直方向のオフセットの和にCTBサイズCtbSizeYを乗じた値である。
なお、xCtb、 yCtbは、対象ビュー上の対象ブロックを含むCTBのX座標、Y座標を示し、対象ブロックのCTBアドレスCtbAddrInRsと、対象ビューのCTBサイズによる画面サイズPicWidthInCtbsYと、CTBサイズCtbSizeYを用いて以下の式による導出される。
xCtb = ( CtbAddrInRs % PicWidthInCtbsY )*CtbSizeY,
yCtb = ( CtbAddrInRs / PicWidthInCtbsY )*CtbSizeY
(参照不可範囲の変形例)
並列デコード情報としてループフィルタ用の調整フラグを送らない場合(すなわちPdiOffsetValを固定的に0とする場合)には、参照不可範囲をピクセル単位ではなく対象ビューのCTBサイズCtbSizeY単位で定義することが可能である。変形例(参照不可範囲の定義2)においては、第1の参照不可範囲は、pdi_unreferenced_region_ctu_verticalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnrefCtb = 0..PicWidthInCtbsY - 1
yUnrefCtb = CtbAddrY + pdi_unreferenced_region_ctu_vertical[i][j].. PicHeightInCtbsY - 1
なお、xUnrefCtb = x_min...x_maxは参照ピクチャ上のCTB座標のx座標がx_min以上、x_max以下を示し、yUnrefCtb = y_min...y_maxは、参照ピクチャ上のCTB座標のy座標がy_min以上、y_max以下を示す。X座標とY座標の範囲を示すことで、矩形範囲を示している(以下同様)。
なお、PicHeightInCtbsYは、対象ビューの画面高さをCTBサイズで割った値である。
第2の参照不可範囲は、pdi_unreferenced_region_ctu_horizontalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnrefCtb = CtbAddrX + pdi_unreferenced_region_ctu_horizontal[i][j]..PicWidthInCtbsY - 1
yUnrefCtb = CtbAddrY + (pdi_unreferenced_region_ctu_vertical[i][j]-1)..PicHeightInCtbsY - 1
なお、CtbAddrX、 CtbAddrYは、対象ビュー上の対象ブロックを含むCTBのX方向のCTB座標、Y方向のCTB座標を示し、対象ブロックのCTBアドレスCtbAddrInRsと、対象ビューのCTBサイズによる画面サイズPicWidthInCtbsYを用いて以下の式による導出される。
CtbAddrX = CtbAddrInRs % PicWidthInCtbsY
CtbAddrY = CtbAddrInRs / PicWidthInCtbsY
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために画像復号装置31が参照するデータの集合が規定されている。ピクチャPICTは、図2の(b)に示すように、スライスS0〜SNS−1を含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスS0〜SNS−1のそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化ストリームTeに含まれるデータであって、添え字を付している他のデータについても同様である。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために画像復号装置31が参照するデータの集合が規定されている。スライスSは、図2の(c)に示すように、スライスヘッダSH、および、スライスデータSDATAを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために画像復号装置31が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、または、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。
なお、スライスヘッダSHには、上記シーケンスレイヤに含まれる、ピクチャパラメータセットPPSへの参照(pic_parameter_set_id)を含んでいても良い。
(スライスデータレイヤ)
スライスデータレイヤでは、処理対象のスライスデータSDATAを復号するために画像復号装置31が参照するデータの集合が規定されている。スライスデータSDATAは、図2の(d)に示すように、符号化ツリーブロック(CTB:Coded Tree Block)を含んでいる。CTBは、スライスを構成する固定サイズ(例えば64×64)のブロックであり、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
(符号化ツリーレイヤ)
符号化ツリーレイヤは、図2の(e)に示すように、処理対象の符号化ツリーブロックを復号するために画像復号装置31が参照するデータの集合が規定されている。符号化ツリーユニットは、再帰的な4分木分割により分割される。再帰的な4分木分割により得られる木構造のノードのことを符号化ツリー(coding tree)と称する。4分木の中間ノードは、符号化ツリーユニット(CTU:Coded Tree Unit)であり、符号化ツリーブロック自身も最上位のCTUとして規定される。CTUは、分割フラグ(split_flag)を含み、split_flagが1の場合には、4つの符号化ツリーユニットCTUに分割される。split_flagが0の場合には、符号化ツリーユニットCTUは4つの符号化ユニット(CU:Coded Unit)に分割される。符号化ユニットCUは符号化ツリーレイヤの末端ノードであり、このレイヤではこれ以上分割されない。符号化ユニットCUは、符号化処理の基本的な単位となる。
また、符号化ツリーブロックCTBのサイズ64×64画素の場合には、符号化ユニットのサイズは、64×64画素、32×32画素、16×16画素、および、8×8画素の何れかをとり得る。
(符号化ユニットレイヤ)
符号化ユニットレイヤは、図2の(f)に示すように、処理対象の符号化ユニットを復号するために画像復号装置31が参照するデータの集合が規定されている。具体的には、符号化ユニットは、CUヘッダCUH、予測ツリー、変換ツリー、CUヘッダCUFから構成される。CUヘッダCUHでは、符号化ユニットが、イントラ予測を用いるユニットであるか、インター予測を用いるユニットであるかなどが規定される。符号化ユニットは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートとなる。CUヘッダCUFは、予測ツリーと変換ツリーの間、もしくは、変換ツリーの後に含まれる。
予測ツリーは、符号化ユニットが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ユニットを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。イントラ予測とは、同一ピクチャ内の予測であり、インター予測とは、互いに異なるピクチャ間(例えば、表示時刻間、レイヤ画像間)で行われる予測処理を指す。
イントラ予測の場合、分割方法は、2N×2N(符号化ユニットと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、符号化データのpart_modeにより符号化され、2N×2N(符号化ユニットと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、および、N×Nなどがある。なお、2N×nUは、2N×2Nの符号化ユニットを上から順に2N×0.5Nと2N×1.5Nの2領域に分割することを示す。2N×nDは、2N×2Nの符号化ユニットを上から順に2N×1.5Nと2N×0.5Nの2領域に分割することを示す。nL×2Nは、2N×2Nの符号化ユニットを左から順に0.5N×2Nと1.5N×2Nの2領域に分割することを示す。nR×2Nは、2N×2Nの符号化ユニットを左から順に1.5N×2Nと0.5N×1.5Nの2領域に分割することを示す。分割数は1、2、4のいずれかであるため、CUに含まれるPUは1個から4個である。これらのPUを順にPU0、PU1、PU2、PU3と表現する。
また、変換ツリーにおいては、符号化ユニットが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ユニットを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換ツリーにおける分割には、符号化ユニットと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(予測パラメータ)
予測ユニットの予測画像は、予測ユニットに付随する予測パラメータによって導出される。予測パラメータには、イントラ予測の予測パラメータもしくはインター予測の予測パラメータがある。以下、インター予測の予測パラメータ(インター予測パラメータ)について説明する。インター予測パラメータは、予測リスト利用フラグpredFlagL0、predFlagL1と、参照ピクチャインデックスrefIdxL0、refIdxL1と、ベクトルmvL0、mvL1から構成される。予測リスト利用フラグpredFlagL0、predFlagL1は、各々L0リスト、L1リストと呼ばれる参照ピクチャリストが用いられるか否かを示すフラグであり、値が1の場合に対応する参照ピクチャリストが用いられる。なお、本明細書中「XXであるか否かを示すフラグ」と記す場合、1をXXである場合、0をXXではない場合とし、論理否定、論理積などでは1を真、0を偽と扱う(以下同様)。但し、実際の装置や方法では真値、偽値として他の値を用いることもできる。2つの参照ピクチャリストが用いられる場合、つまり、predFlagL0=1, predFlagL1=1の場合が、双予測に対応し、1つの参照ピクチャリストを用いる場合、すなわち(predFlagL0, predFlagL1) = (1, 0)もしくは(predFlagL0, predFlagL1) = (0, 1)の場合が単予測に対応する。なお、予測リスト利用フラグの情報は、後述のインター予測フラグinter_pred_idxで表現することもできる。通常、後述の予測画像生成部、予測パラメータメモリでは、予測リスト利用フラグが用いれ、符号化データから、どの参照ピクチャリストが用いられるか否かの情報を復号する場合にはインター予測フラグinter_pred_idxが用いられる。
符号化データに含まれるインター予測パラメータを導出するためのシンタックス要素には、例えば、分割モードpart_mode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測フラグinter_pred_idx、参照ピクチャインデックスrefIdxLX、予測ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLXがある。
(参照ピクチャリストの一例)
次に、参照ピクチャリストの一例について説明する。参照ピクチャリストとは、参照ピクチャメモリ306(図6)に記憶された参照ピクチャからなる列である。図5は、参照ピクチャリストの一例を示す概念図である。参照ピクチャリスト601において、左右に一列に配列された5個の長方形は、それぞれ参照ピクチャを示す。左端から右へ順に示されている符号、P1、P2、Q0、P3、P4は、それぞれの参照ピクチャを示す符号である。P1等のPとは、視点Pを示し、そしてQ0のQとは、視点Pとは異なる視点Qを示す。P及びQの添字は、ピクチャ順序番号POCを示す。refIdxLXの真下の下向きの矢印は、参照ピクチャインデックスrefIdxLXが、参照ピクチャメモリ306において参照ピクチャQ0を参照するインデックスであることを示す。
(参照ピクチャの例)
次に、ベクトルを導出する際に用いる参照ピクチャの例について説明する。図4は、参照ピクチャの例を示す概念図である。図4において、横軸は表示時刻を示し、縦軸は視点を示す。図4に示されている、縦2行、横3列(計6個)の長方形は、それぞれピクチャを示す。6個の長方形のうち、下行の左から2列目の長方形は復号対象のピクチャ(対象ピクチャ)を示し、残りの5個の長方形がそれぞれ参照ピクチャを示す。対象ピクチャから上向きの矢印で示される参照ピクチャQ0は対象ピクチャと同表示時刻であって視点が異なるピクチャである。対象ピクチャを基準とする変位予測においては、参照ピクチャQ0が用いられる。対象ピクチャから左向きの矢印で示される参照ピクチャP1は、対象ピクチャと同じ視点であって、過去のピクチャである。対象ピクチャから右向きの矢印で示される参照ピクチャP2は、対象ピクチャと同じ視点であって、未来のピクチャである。対象ピクチャを基準とする動き予測においては、参照ピクチャP1又はP2が用いられる。
(画像復号装置の構成)
次に、本実施形態に係る画像復号装置31の構成について説明する。図6は、本実施形態に係る画像復号装置31の構成を示す概略図である。画像復号装置31は、エントロピー復号部301、予測パラメータ復号部302、参照ピクチャメモリ(参照画像記憶部、フレームメモリ)306、予測パラメータメモリ(予測パラメータ記憶部、フレームメモリ)307、予測画像生成部308、逆量子化・逆DCT部311、及び加算部312、残差格納部313(残差記録部)を含んで構成される。
また、予測パラメータ復号部302は、インター予測パラメータ復号部303及びイントラ予測パラメータ復号部304を含んで構成される。予測画像生成部308は、インター予測画像生成部309及びイントラ予測画像生成部310を含んで構成される。
エントロピー復号部301は、外部から入力された符号化ストリームTeに対してエントロピー復号を行って、個々の符号(シンタックス要素)を分離し復号する。分離された符号には、予測画像を生成するための予測情報および、差分画像を生成するための残差情報などがある。
エントロピー復号部301は、分離した符号の一部を予測パラメータ復号部302に出力する。分離した符号の一部とは、例えば、予測モードPredMode、分割モードpart_mode、マージフラグmerge_flag、マージインデックスmerge_idx、インター予測フラグinter_pred_idx、参照ピクチャインデックスrefIdxLX、予測ベクトルインデックmvp_LX_idx、差分ベクトルmvdLXである。どの符号を復号するか否かの制御は、予測パラメータ復号部302の指示に基づいて行われる。エントロピー復号部301は、量子化係数を逆量子化・逆DCT部311に出力する。この量子化係数は、符号化処理において、残差信号に対してDCT(Discrete Cosine Transform、離散コサイン変換)を行い量子化して得られる係数である。
エントロピー復号部301は、SEI復号部を備える。SEI復号部は、図3で定義される並列デコード情報を含むSEIを復号し、インター予測画像生成部309に伝送する。
インター予測パラメータ復号部303は、エントロピー復号部301から入力された符号に基づいて、予測パラメータメモリ307に記憶された予測パラメータを参照してインター予測パラメータを復号する。
インター予測パラメータ復号部303は、復号したインター予測パラメータを予測画像生成部308に出力し、また予測パラメータメモリ307に記憶する。インター予測パラメータ復号部303の詳細については後述する。
イントラ予測パラメータ復号部304は、エントロピー復号部301から入力された符号に基づいて、予測パラメータメモリ307に記憶された予測パラメータを参照してイントラ予測パラメータを復号する。イントラ予測パラメータとは、ピクチャブロックを1つのピクチャ内で予測する処理で用いるパラメータ、例えば、イントラ予測モードIntraPredModeである。イントラ予測パラメータ復号部304は、復号したイントラ予測パラメータを予測画像生成部308に出力し、また予測パラメータメモリ307に記憶する。
参照ピクチャメモリ306は、加算部312が生成した参照ピクチャのブロック(参照ピクチャブロック)を、復号対象のピクチャ及びブロック毎に予め定めた位置に記憶する。
予測パラメータメモリ307は、予測パラメータを、復号対象のピクチャ及びブロック毎に予め定めた位置に記憶する。具体的には、予測パラメータメモリ307は、インター予測パラメータ復号部303が復号したインター予測パラメータ、イントラ予測パラメータ復号部304が復号したイントラ予測パラメータ及びエントロピー復号部301が分離した予測モードpredModeを記憶する。記憶されるインター予測パラメータには、例えば、予測リスト利用フラグpredFlagLX(インター予測フラグinter_pred_idx)、参照ピクチャインデックスrefIdxLX、ベクトルmvLXがある。
予測画像生成部308には、エントロピー復号部301から入力された予測モードpredModeが入力され、また予測パラメータ復号部302から予測パラメータが入力される。また、予測画像生成部308は、参照ピクチャメモリ306から参照ピクチャを読み出す。予測画像生成部308は、予測モードpredModeが示す予測モードで、入力された予測パラメータと読み出した参照ピクチャを用いて予測ピクチャブロックP(予測画像)を生成する。
ここで、予測モードpredModeがインター予測モードを示す場合、インター予測画像生成部309は、インター予測パラメータ復号部303から入力されたインター予測パラメータと読み出した参照ピクチャを用いてインター予測により予測ピクチャブロックPを生成する。予測ピクチャブロックPはPUに対応する。PUは、上述したように予測処理を行う単位となる複数の画素からなるピクチャの一部分、つまり1度に予測処理が行われる復号対象ブロックに相当する。
インター予測画像生成部309は、予測リスト利用フラグpredFlagLXが1である参照ピクチャリスト(L0リスト、もしくはL1リスト)に対し、参照ピクチャインデックスrefIdxLXで示される参照ピクチャから、復号対象ブロックを基準としてベクトルmvLXが示す位置にある参照ピクチャブロックを参照ピクチャメモリ306から読み出す。インター予測画像生成部309は、読み出した参照ピクチャブロックについて予測を行って予測ピクチャブロックPを生成する。インター予測画像生成部309は、生成した予測ピクチャブロックPを加算部312に出力する。
インター予測画像生成部309は、予測ピクチャブロック復号待機部を備える。
(予測ピクチャブロック復号待機部)
予測ピクチャブロック復号待機部は、並列デコード情報に従い、参照ピクチャの特定CTBが復号されたか否かを判定する。参照ピクチャの特定CTBが復号されていない場合には、上記、予測ピクチャブロックPの生成を行わずに待機し、参照ピクチャの特定CTBが復号されてから、予測ピクチャブロックPの生成を行う。対象ビューiに属する予測ピクチャブロックPが参照ビューjの参照ピクチャを参照する場合、参照ピクチャの特定CTBの座標(xRefCtb, yRefCtb)は以下の式により導出する。
xRefCtb = min( ((xCtb + pdi_unreferenced_region_ctu_horizontal[i][j] * CtbSizeY + refCtbSizeY - 1) / refCtbSizeY - 1) * refCtbSizeY,
(refPicWidthInCtbsY * refCtbSizeY)
yRefCtb = min( ((yCtb + -(pdi_unreferenced_region_ctu_vertical[i][j] - 1) * CtbSizeY + refCtbSizeY - 1) / refCtbSizeY - 1) * refCtbSizeY,
(refPicHeightInCtbsY * refCtbSizeY)
ただし、第2の参照不可範囲が定義されない場合(pdi_unreferenced_region_ctu_horizontalが0の場合)には、第1の参照不可範囲の左上座標の直前のCTBとなるように、xRefCtbは画面右端のCTBとなるように以下のように設定する。
xRefCtb = (refPicWidthInCtbsY - 1) * refCtbSizeY
(予測ピクチャブロック復号待機部の変形例)
特定CTBの座標はピクセル単位ではなく参照ビューのCTBサイズrefCtbSizeY単位で定義することが可能である(参照不可範囲の定義2に対応)。その場合、対象ビューiに属する予測ピクチャブロックPが参照ビューjの参照ピクチャを参照する場合、参照ピクチャの特定CTBの座標(xRefCtb, yRefCtb)は、以下の式により導出する。
xRefCtb = min( ((xCtb + pdi_unreferenced_region_ctu_horizontal[i][j] * CtbSizeY + refCtbSizeY - 1) / refCtbSizeY - 1), (refPicWidthInCtbsY - 1))
yRefCtb = min( ((yCtb + (pdi_unreferenced_region_ctu_vertical[i][j] - 1) * CtbSizeY + refCtbSizeY - 1) / refCtbSizeY - 1), (refPicHeightInCtbsY - 1))
ただし、pdi_unreferenced_region_ctu_horizontalが0の場合には、xRefCtbは以下のように設定する。
xRefCtb = refPicWidthInCtbsY - 1
予測モードpredModeがイントラ予測モードを示す場合、イントラ予測画像生成部310は、イントラ予測パラメータ復号部304から入力されたイントラ予測パラメータと読み出した参照ピクチャを用いてイントラ予測を行う。具体的には、イントラ予測画像生成部310は、復号対象のピクチャであって、既に復号されたブロックのうち復号対象ブロックから予め定めた範囲にある参照ピクチャブロックを参照ピクチャメモリ306から読み出す。予め定めた範囲とは、復号対象ブロックがいわゆるラスタースキャンの順序で順次移動する場合、例えば、左、左上、上、右上の隣接ブロックのうちのいずれかであり、イントラ予測モードによって異なる。ラスタースキャンの順序とは、各ピクチャにおいて、上端から下端まで各行について、順次左端から右端まで移動させる順序である。
イントラ予測画像生成部310は、読み出した参照ピクチャブロックについてイントラ予測モードIntraPredModeが示す予測モードで予測を行って予測ピクチャブロックを生成する。イントラ予測画像生成部310は、生成した予測ピクチャブロックPを加算部312に出力する。
逆量子化・逆DCT部311は、エントロピー復号部301から入力された量子化係数を逆量子化してDCT係数を求める。逆量子化・逆DCT部311は、求めたDCT係数について逆DCT(Inverse Discrete Cosine Transform、逆離散コサイン変換)を行い、復号残差信号を算出する。逆量子化・逆DCT部311は、算出した復号残差信号を加算部312および残差格納部313に出力する。
加算部312は、インター予測画像生成部309及びイントラ予測画像生成部310から入力された予測ピクチャブロックPと逆量子化・逆DCT部311から入力された復号残差信号の信号値を画素毎に加算して、参照ピクチャブロックを生成する。加算部312は、生成した参照ピクチャブロックを参照ピクチャメモリ306に記憶し、生成した参照ピクチャブロックをピクチャ毎に統合した復号レイヤ画像Tdを外部に出力する。
(並列デコード動作)
図7は、並列デコード動作を説明するための図である。
図7(a)に示す通り、複数のレイヤ画像から構成される動画像を復号する際、限られた復号速度の装置を用いて、所定の時間(この例では16ms)内に復号を完了させるためには、複数のレイヤ画像(ここではレイヤ0とレイヤ1)を並列で復号することがある。スケーラブル符号化では、レイヤ0に依存してレイヤ1が符号化されているため、完全には並列に復号することができないが、本実施形態で示すように、ブロック単位で復号する場合に、レイヤ1がレイヤ0を参照する際の参照範囲を限定することによって、レイヤ0より所定のCTBだけ遅れてレイヤ1を復号することが可能となる。
図7(b)は、レイヤ1をレイヤ0から並列デコード情報で示される遅延分だけ遅れて復号する例を示す。図7(b)において矢印は、それぞれのレイヤ画像が復号された領域を示す。矢印の先端は、現在復号処理が行われているブロックの右端を示しており、レイヤ1においては対象CTBが復号対象になる。レイヤ1の対象CTBの復号処理において、網掛けの部分は、レイヤ0の画像内の復号処理が行われた領域のうち、参照可能な領域である参照可能範囲を示し、縦縞の部分は参照不可範囲を示す。
対象CTBを復号する際、予測ピクチャブロック復号待機部がレイヤ0の画像の座標(xRefCtb, yRefCtb)で示される特定CTBの復号が完了したか否かを判定し、特定CTBが復号されていない場合には、対象CTBの復号を待機し、特定CTBの復号が完了してから、対象CTBの復号を開始する。
以上の構成の画像復号装置によれば、pdi_offset_flagを用いることで、対象ビューにループフィルタが係るか否かに応じて参照範囲を制限できるようになったため、ループフィルタが係らない場合には、CTB1個分の遅延での並列デコード(超低遅延デコード)が可能となる。これにより、デコード処理の並列度が向上し、処理時間が短縮されるという効果を奏する。
(画像符号化装置の構成)
次に、本実施形態に係る画像符号化装置11の構成について説明する。図8は、本実施形態に係る画像符号化装置11の構成を示すブロック図である。画像符号化装置11は、予測画像生成部101、減算部102、DCT・量子化部103、エントロピー符号化部104、逆量子化・逆DCT部105、加算部106、予測パラメータメモリ(予測パラメータ記憶部、フレームメモリ)108、参照ピクチャメモリ(参照画像記憶部、フレームメモリ)109、符号化パラメータ決定部110、予測パラメータ符号化部111、残差格納部313(残差記録部)を含んで構成される。予測パラメータ符号化部111は、インター予測パラメータ符号化部112及びイントラ予測パラメータ符号化部113を含んで構成される。
予測画像生成部101は、外部から入力されたレイヤ画像Tの視点毎の各ピクチャについて、そのピクチャを分割した領域であるブロック毎に予測ピクチャブロックPを生成する。ここで、予測画像生成部101は、予測パラメータ符号化部111から入力された予測パラメータに基づいて参照ピクチャメモリ109から参照ピクチャブロックを読み出す。予測パラメータ符号化部111から入力された予測パラメータとは、例えば、動きベクトル又は変位ベクトルである。予測画像生成部101は、符号化対象ブロックを起点として予測された動きベクトル又は変位ベクトルが示す位置にあるブロックの参照ピクチャブロックを読み出す。予測画像生成部101は、読み出した参照ピクチャブロックについて複数の予測方式のうちの1つの予測方式を用いて予測ピクチャブロックPを生成する。予測画像生成部101は、生成した予測ピクチャブロックPを減算部102に出力する。なお、予測画像生成部101は、既に説明した予測画像生成部308と同じ動作であるため予測ピクチャブロックPの生成の詳細は省略する。
予測画像生成部101は、予測方式を選択するために、例えば、レイヤ画像に含まれるブロックの画素毎の信号値と予測ピクチャブロックPの対応する画素毎の信号値との差分に基づく誤差値を最小にする予測方式を選択する。予測方式を選択する方法は、これには限られない。
符号化対象のピクチャがベースビューピクチャである場合には、複数の予測方式とは、イントラ予測、動き予測及びマージ予測である。動き予測とは、上述のインター予測のうち、表示時刻間の予測である。マージ予測とは、既に符号化されたブロックであって、符号化対象ブロックから予め定めた範囲内にあるブロックと同一の参照ピクチャブロック及び予測パラメータを用いる予測である。符号化対象のピクチャがノンベースビューピクチャである場合には、複数の予測方式とは、イントラ予測、動き予測、マージ予測、及び変位予測である。変位予測(視差予測)とは、上述のインター予測のうち、別レイヤ画像(別視点画像)間の予測である。
予測画像生成部101は、イントラ予測を選択した場合、予測ピクチャブロックPを生成する際に用いたイントラ予測モードを示す予測モードpredModeを予測パラメータ符号化部111に出力する。
予測画像生成部101は、動き予測を選択した場合、予測ピクチャブロックPを生成する際に用いた動きベクトルmvLXを予測パラメータメモリ108に記憶し、インター予測パラメータ符号化部112に出力する。動きベクトルmvLXは、符号化対象ブロックの位置から予測ピクチャブロックPを生成する際の参照ピクチャブロックの位置までのベクトルを示す。動きベクトルmvLXを示す情報には、参照ピクチャを示す情報(例えば、参照ピクチャインデックスrefIdxLX、ピクチャ順序番号POC)を含み、予測パラメータを表すものであっても良い。また、予測画像生成部101は、インター予測モードを示す予測モードpredModeを予測パラメータ符号化部111に出力する。
予測画像生成部101は、変位予測を選択した場合、予測ピクチャブロックPを生成する際に用いた変位ベクトルを予測パラメータメモリ108に記憶し、インター予測パラメータ符号化部112に出力する。変位ベクトルdvLXは、符号化対象ブロックの位置から予測ピクチャブロックPを生成する際の参照ピクチャブロックの位置までのベクトルを示す。変位ベクトルdvLXを示す情報には、参照ピクチャを示す情報(例えば、参照ピクチャインデックスrefIdxLX、ビューIDview_id)を含み、予測パラメータを表すものであっても良い。また、予測画像生成部101は、インター予測モードを示す予測モードpredModeを予測パラメータ符号化部111に出力する。
予測画像生成部101は、マージ予測を選択した場合、選択した参照ピクチャブロックを示すマージインデックスmerge_idxをインター予測パラメータ符号化部112に出力する。また、予測画像生成部101は、マージ予測モードを示す予測モードpredModeを予測パラメータ符号化部111に出力する。
減算部102は、予測画像生成部101から入力された予測ピクチャブロックPの信号値を、外部から入力されたレイヤ画像Tの対応するブロックの信号値から画素毎に減算して、残差信号を生成する。減算部102は、生成した残差信号をDCT・量子化部103と符号化パラメータ決定部110に出力する。
DCT・量子化部103は、減算部102から入力された残差信号についてDCTを行い、DCT係数を算出する。DCT・量子化部103は、算出したDCT係数を量子化して量子化係数を求める。DCT・量子化部103は、求めた量子化係数をエントロピー符号化部104及び逆量子化・逆DCT部105に出力する。
エントロピー符号化部104には、DCT・量子化部103から量子化係数が入力され、符号化パラメータ決定部110から符号化パラメータが入力される。入力される符号化パラメータには、例えば、参照ピクチャインデックスrefIdxLX、ベクトルインデックスmvp_LX_idx、差分ベクトルmvdLX、予測モードpredMode、及びマージインデックスmerge_idx等の符号がある。
エントロピー符号化部104は、入力された量子化係数と符号化パラメータをエントロピー符号化して符号化ストリームTeを生成し、生成した符号化ストリームTeを外部に出力する。エントロピー符号化部104はSEI符号化部を備える。SEI符号化部は並列デコード情報を符号化する。符号化された並列デコード情報は符号化ストリームTeに含まれる。
逆量子化・逆DCT部105は、DCT・量子化部103から入力された量子化係数を逆量子化してDCT係数を求める。逆量子化・逆DCT部105は、求めたDCT係数について逆DCTを行い、復号残差信号を算出する。逆量子化・逆DCT部105は、算出した復号残差信号を加算部106に出力する。
加算部106は、予測画像生成部101から入力された予測ピクチャブロックPの信号値と逆量子化・逆DCT部105から入力された復号残差信号の信号値を画素毎に加算して、参照ピクチャブロックを生成する。加算部106は、生成した参照ピクチャブロックを参照ピクチャメモリ109に記憶する。
予測パラメータメモリ108は、予測パラメータ符号化部111が生成した予測パラメータを、符号化対象のピクチャ及びブロック毎に予め定めた位置に記憶する。
参照ピクチャメモリ109は、加算部106が生成した参照ピクチャブロックを、符号化対象のピクチャ及びブロック毎に予め定めた位置に記憶する。
符号化パラメータ決定部110は、符号化パラメータの複数のセットのうち、1つのセットを選択する。符号化パラメータとは、上述した予測パラメータやこの予測パラメータに関連して生成される符号化の対象となるパラメータである。予測画像生成部101は、これらの符号化パラメータのセットの各々を用いて予測ピクチャブロックPを生成する。符号化パラメータ決定部110は、予測パラメータ制限部を備える。
符号化パラメータ決定部110は、複数のセットの各々について情報量の大きさと符号化誤差を示すコスト値を算出する。コスト値は、例えば、符号量と二乗誤差に係数λを乗じた値との和である。符号量は、量子化誤差と符号化パラメータをエントロピー符号化して得られる符号化ストリームTeの情報量である。二乗誤差は、減算部102において算出された残差信号の残差値の二乗値についての画素間の総和である。係数λは、予め設定されたゼロよりも大きい実数である。符号化パラメータ決定部110は、算出したコスト値が最小となる符号化パラメータのセットを選択する。これにより、エントロピー符号化部104は、選択した符号化パラメータのセットを符号化ストリームTeとして外部に出力し、選択されなかった符号化パラメータのセットを出力しない。予測パラメータ制限部は、選択候補となる符号化パラメータ中の予測パラメータが制限範囲を超えないか否かを判定する。具体的には、予測パラメータ制限部は、SEI符号化部で符号化される並列デコード情報に従い、予測パラメータが対象ビューiの参照先として参照ビューjを指定している場合には、参照不可範囲unreferenced region[i][j]で示される参照範囲を参照しないように、予測パラメータに含まれるベクトルmvLXが所定の範囲を超えないか否かを判定する。
予測パラメータ制限部は、第1の参照不可範囲を含むか否かを、以下の判定により判定する。
mvLX[1] > pdi_unreferenced_region_ctu_vertical*CtbizeY - PdiOffsetVal - 4
ここで4は、動き補償フィルタが8タップフィルタである場合に、動き補償用に4画素だけ対象画素より離れた画素を参照することを考慮して、範囲を4画素分小さくしたものである。
上記、式が真の場合には、第1の参照不可範囲を参照している、すなわち、予測パラメータが制限範囲を超えていると判定する。
なお、動き補償フィルタにより動き補償が行われるか否かすなわち、動きベクトルが整数位置を指すベクトルであるか否かにより制限を変更しても良い。具体的には、動きベクトルが1/4pel精度の場合、mvLX[1]が4の倍数の場合には、判定式として、以下の式を用いる。
mvLX[1] > pdi_unreferenced_region_ctu_vertical*CtbizeY - PdiOffsetVal
それ以外の場合には、判定式として以下の式を用いる。
mvLX[1] > pdi_unreferenced_region_ctu_vertical*CtbizeY - PdiOffsetVal - 4
同様に、予測パラメータ制限部は、第2の参照不可範囲を含むか否かを、以下の判定により判定する。
mvLX[0] > pdi_unreferenced_region_ctu_horizontal*CtbSizeY - PdiOffsetVal - 4
上記、式が真の場合には、第2の参照不可範囲を参照している、すなわち、予測パラメータが制限範囲を超えていると判定する。ただし、pdi_unreferenced_region_ctu_horizontalが0の場合には、第2の参照不可範囲を含むか否かの判定は行わない。
なお、第1の参照不可範囲と同様に、動きベクトルが動きベクトルが整数位置を指すベクトルであるか否かにより制限を変更しても良い。この場合、動きベクトルが1/4pel精度の場合、mvLX[1]が4の倍数の場合には、判定式として、以下の式を用いる。
mvLX[0] > pdi_unreferenced_region_ctu_horizontal*CtbizeY - PdiOffsetVal
それ以外の場合には、判定式として以下の式を用いる。
mvLX[0] > pdi_unreferenced_region_ctu_horizontal*CtbizeY - PdiOffsetVal - 4
符号化パラメータ決定部110は、制限範囲を超える予測パラメータについては、選択候補から外し、最終的には符号化パラメータとしては出力しない。逆に、符号化パラメータ決定部110は、制限範囲を超えない予測パラメータから符号化パラメータを選択する。
予測パラメータ符号化部111は、予測画像生成部101から入力されたパラメータに基づいて予測ピクチャを生成する際に用いる予測パラメータを導出し、導出した予測パラメータを符号化して符号化パラメータのセットを生成する。予測パラメータ符号化部111は、生成した符号化パラメータのセットをエントロピー符号化部104に出力する。
予測パラメータ符号化部111は、生成した符号化パラメータのセットのうち符号化パラメータ決定部110が選択したものに対応する予測パラメータを予測パラメータメモリ108に記憶する。
予測パラメータ符号化部111は、予測画像生成部101から入力された予測モードpredModeがインター予測モードを示す場合、インター予測パラメータ符号化部112を動作させる。予測パラメータ符号化部111は、予測モードpredModeがイントラ予測モードを示す場合、イントラ予測パラメータ符号化部113を動作させる。
インター予測パラメータ符号化部112は、符号化パラメータ決定部110から入力された予測パラメータに基づいてインター予測パラメータを導出する。インター予測パラメータ符号化部112は、インター予測パラメータを導出する構成として、インター予測パラメータ復号部303(図6等、参照)がインター予測パラメータを導出する構成と同一の構成を含む。インター予測パラメータ符号化部112の構成については、後述する。
イントラ予測パラメータ符号化部113は、符号化パラメータ決定部110から入力された予測モードpredModeが示すイントラ予測モードIntraPredModeをインター予測パラメータのセットとして定める。
以上の構成の画像符号化装置によれば、非特許文献1では、参照不可範囲を参照しているか否かの判定をする際に、対象ビューと参照ビューのCTBサイズの違いを考慮する必要があったのに対して、本実施形態では、判定式で対象ビューのCTBサイズしか参照しないため、参照ビューのパラメータに依存しない。これにより、判定処理が簡略化されるという効果を奏する。
また、pdi_unreferenced_region_ctu_horizontalが0の場合には、制限範囲が垂直方向のみで定義されるため、予測パラメータが第1の参照不可範囲を参照しているか否かの判定が不要となる。これにより、判定処理が簡略化されるという効果を奏する。
(第2の実施形態)
以下、第2の実施形態について説明する。
本実施形態における並列デコード情報の符号化データの構成は図3と同様である。ただし、参照不可範囲を示すオフセットであるシンタックス要素pdi_unreferenced_region_ctu_verticalとpdi_unreferenced_region_ctu_horizontalが参照ビューのCTBサイズrefCtbSizeYを基準に設定されている点が異なっており、それに伴い参照不可範囲の設定方法も異なる。
(参照不可範囲の定義3)
さらに、参照不可範囲を示すオフセットを参照画像のCTBサイズrefCtbSizeY単位で指定することも可能である。以下、オフセットを参照画像のCTBサイズrefCtbSizeY単位で指定する変形例Cを説明する。
参照ビュー上のCTB座標refCtbAddrX、refCtbAddrYが以下の式で定義される。
refCtbAddrX = (CtbAddrInRS % PicWidthInCtbsY) * CtbSizeY / refCtbSizeY)
refCtbAddrY = (CtbAddrInRS / PicWidthInCtbsY) * CtbSizeY / refCtbSizeY)
上記では、対象ブロックのCTBアドレスCtbAddrInRsと、対象ビューのCTBサイズによる画面サイズPicWidthInCtbsYから導出される対象ビューのCTB座標(CtbAddrInRS % PicWidthInCtbsY、CtbAddrInRS / PicWidthInCtbsY)を導出し、そのCTB座標を対象ビューのCTBサイズCtbSizeYで乗じてから、参照ビューのCTBサイズrefCtbSizeYで割ることにより導出される。例えば、対象ビューのCTBサイズCtbSizeYが参照ビューのCTBサイズrefCtbSizeYよりも大きい場合には、CtbSizeY / refCtbSizeYが1より大きくなり、結果、参照ビュー上のCTB座標refCtbAddrX、refCtbAddrYが、対象ビューのCTB座標よりも大きくなる。
第1の参照不可範囲は、pdi_unreferenced_region_ctu_verticalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnref = 0..pic_width_in_luma_samples - 1,
yUnref = yCtb + (pdi_unreferenced_region_ctu_vertical[i][j]*refCtbSizeY) - PdiOffsetVal..pic_height_in_luma_samples - 1,
yCtb = refCtbAddrY*refCtbSizeY
第2の参照不可範囲は、pdi_unreferenced_region_ctu_horizontalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnref = xCtb + (pdi_unreferenced_region_ctu_horizontal[i][j]*refCtbSizeY) - PdiOffsetVal..pic_width_in_luma_samples - 1,
yUnref = yCtb + ((pdi_unreferenced_region_ctu_vertical[i][j]-1)*refCtbSizeY) -PdiOffsetVal..pic_height_in_luma_samples - 1,
xCtb = refCtbAddrX*refCtbSizeY,
yCtb = refCtbAddrY*refCtbSizeY
(参照不可範囲の定義4)
PdiOffsetValが0の場合には、参照不可範囲をピクセル単位ではなく参照ビューのCTBサイズrefCtbSizeY単位で定義することが可能である。
参照ビュー上のCTB座標refCtbAddrX、refCtbAddrYが以下の式で定義される。
refCtbAddrX = (CtbAddrInRS % PicWidthInCtbsY) * CtbSizeY / refCtbSizeY)
refCtbAddrY = (CtbAddrInRS / PicWidthInCtbsY) * CtbSizeY / refCtbSizeY)
第1の参照不可範囲は、pdi_unreferenced_region_ctu_verticalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnrefCtb = 0..PicWidthInCtbsY - 1
yUnrefCtb = refCtbAddrY + (pdi_unreferenced_region_ctu_vertical[i][j])..PicHeightInCtbsY - 1
また、第1の参照不可範囲を、画像をCTB単位でラスタースキャン順で走査したときに、第1の参照不可範囲内で最初にアクセスされるCTBである開始CTBのCTBアドレスrefCtbAddrで表現することも可能である。この場合、画像内のCTBのうち、CTBアドレスが、開始CTBのCTBアドレスrefCtbAddr以降のCTBは全て第1の参照不可範囲に含まれることとなる。開始CTBのCTBアドレスrefCtbAddrは以下のように定義される。
refCtbAddr = (refCtbAddrY + pdi_unreferenced_region_ctu_vertical[i][j]) * refPicWidthInCtbsY
第1の参照不可範囲は、垂直方向のオフセットpdi_unreferenced_region_ctu_vertical[i][j]で定義される矩形領域となる。第1の参照不可範囲の開始CTBアドレスは、参照CTBアドレスのY座標refCtbAddrYと垂直方向のオフセットの和に参照ピクチャのCTB幅refPicWidthInCtbsを乗じた値から定義され、参照CTBアドレスのY座標refCtbAddrYは、対象ブロックのCTB座標のY座標yCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義される。
第2の参照不可範囲は、pdi_unreferenced_region_ctu_horizontalが0の場合には定義されず、0より大きい場合には以下のように定義される。
xUnrefCtb = refCtbAddrX + (pdi_unreferenced_region_ctu_horizontal[i][j])..PicWidthInCtbsY - 1
yUnrefCtb = refCtbAddrY + ((pdi_unreferenced_region_ctu_vertical[i][j]-1))..PicHeightInCtbsY - 1
また、参照不可範囲を、画像をCTB単位でラスタースキャン順で走査したときに、第2の参照不可範囲内で最初にアクセスされるCTBである開始CTBのCTBアドレスrefCtbAddrで定義することも可能である。この場合、画像内のCTBのうち、CTBアドレスのが、開始CTBのCTBアドレスrefCtbAddr以降であるCTBは全て参照不可範囲に含まれることとなる。開始CTBのCTBアドレスrefCtbAddrは以下のように定義される。
refCtbAddr = (refCtbAddrY + pdi_unreferenced_region_ctu_vertical[i][j] - 1) * refPicWidthInCtbsY + min(refCtbAddrX + pdi_unreferenced_region_ctu_horizontal[i][j], refPicWidthInCtbsY - 1)
第2の参照不可範囲は、垂直方向のオフセットpdi_unreferenced_region_ctu_vertical[i][j]と水平方向のオフセットpdi_unreferenced_region_ctu_horizontal[i][j]定義される領域となる。第2の参照不可範囲の開始CTBアドレスは、参照CTBアドレスのY座標refCtbAddrYと垂直方向のオフセットの和から1を引いた値に参照ピクチャのCTB幅refPicWidthInCtbsを乗じた値に、参照CTBアドレスのX座標refCtbAddrXと水平方向のオフセットの和と、参照ピクチャのCTB幅refPicWidthInCtbから1を引いた値の最小値を加えた値から定義され、参照CTBアドレスのY座標refCtbAddrYは、対象ブロックのCTB座標のY座標yCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義され、参照CTBアドレスのX座標refCtbAddrXは、対象ブロックのCTB座標のX座標xCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義される。
本実施形態における画像復号装置31Bは、画像復号装置31に対して、インター予測画像生成部309が予測ピクチャブロック復号待機部に替えて予測ピクチャブロック復号待機部Bを備える点のみが異なる。
(予測ピクチャブロック復号待機部B)
予測ピクチャブロック復号待機部Bは、予測ピクチャブロック復号待機部に対して、特定CTBの座標(xRefCtb, yRefCtb)の導出方法が異なる。対象ビューiに属する予測ピクチャブロックPが参照ビューjの参照ピクチャを参照する場合、参照ピクチャの特定CTBの座標(xRefCtb, yRefCtb)は以下の式により導出する。
xRefCtb = min( ((xCtb + pdi_unreferenced_region_ctu_horizontal[i][j] * refCtbSizeY, (pic_width_in_luma_samples - 1) / refCtbSizeY * refCtbSizeY)
yRefCtb = min( ((yCtb + (pdi_unreferenced_region_ctu_vertical[i][j] - 1) * refCtbSizeY, (pic_height_in_luma_samples - 1) / refCtbSizeY * refCtbSizeY)
ただし、pdi_unreferenced_region_ctu_horizontalが0の場合には、xRefCtbは以下のように設定する。
xRefCtb = (refPicWidthInCtbsY - 1) * refCtbSizeY)
(予測ピクチャブロック復号待機部Bの変形例)
特定CTBの座標はピクセル単位ではなく参照ビューのCTBサイズrefCtbSizeY単位で定義することが可能である。その場合、対象ビューiに属する予測ピクチャブロックPが参照ビューjの参照ピクチャを参照する場合、参照ピクチャの特定CTBの座標(xRefCtb, yRefCtb)は以下の式により導出する。
xRefCtb = min( ((xCtb + pdi_unreferenced_region_ctu_horizontal[i][j], (refPicWidthInCtbsY - 1))
yRefCtb = min( ((yCtb + (pdi_unreferenced_region_ctu_vertical[i][j] - 1), (refPicHeightInCtbsY - 1))
ただし、pdi_unreferenced_region_ctu_horizontalが0の場合には、xRefCtbは以下のように設定する。
xRefCtb = refPicWidthInCtbsY - 1
以上の構成の画像復号装置31Bによれば、pdi_unreferenced_region_ctu_horizontal[i][j]及びpdi_unreferenced_region_ctu_vertical[i][j]の単位を参照ビューのCTBサイズとすることにより、特定CTBの座標を導出する処理が簡略化されるという効果を奏する。
(画像符号化装置の構成)
本実施形態における画像符号化装置11Bは、画像符号化装置11に対して、符号化パラメータ決定部110が予測パラメータ制限部に替えて予測パラメータ制限部Bを備える点のみが異なる。
(予測パラメータ制限部B)
予測パラメータ制限部Bは、予測パラメータ制限部に対し、予測パラメータが参照不可範囲を参照しているか否かの判定方法が異なる。
予測パラメータ制限部Bは、第1の参照不可範囲を含むか否かを、以下の判定により判定する。
mvLX[1] > pdi_unreferenced_region_ctu_vertical*refCtbizeY - PdiOffsetVal - dy
dy = (( CtbAddrInRs / PicWidthInCtbsY ) * CtbSizeY ) % refCtbSizeY
上記、式が真の場合には、第1の参照不可範囲を参照している、すなわち、予測パラメータが制限範囲を超えていると判定する。
同様に、予測パラメータ制限部は、第2の参照不可範囲を含むか否かを、以下の判定により判定する。
mvLX[0] > pdi_unreferenced_region_ctu_horizontal*refCtbSizeY - PdiOffsetVal - dx
dx = (( CtbAddrInRs % PicWidthInCtbsY ) * CtbSizeY ) % refCtbSizeY
上記、式が真の場合には、第2の参照不可範囲を参照している、すなわち、予測パラメータが制限範囲を超えていると判定する。ただし、pdi_unreferenced_region_ctu_horizontalが0の場合には、第2の参照不可範囲を含むか否かの判定は行わない。
なお、上述した実施形態における画像符号化装置11、画像復号装置31の一部、例えば、エントロピー復号部301、予測パラメータ復号部302、予測画像生成部101、DCT・量子化部103、エントロピー符号化部104、逆量子化・逆DCT部105、符号化パラメータ決定部110、予測パラメータ符号化部111、エントロピー復号部301、予測パラメータ復号部302、予測画像生成部308、逆量子化・逆DCT部311をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、画像符号化装置11−11B、画像復号装置31−31Bのいずれかに内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における画像符号化装置11、画像復号装置31の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。画像符号化装置11、画像復号装置31の各機能ブロックは個別にプロセッサ化しても良いし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
(まとめ)
本明細書には、少なくとも以下の発明についても記載されている。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、垂直方向のオフセットと、水平方向のオフセットを含む符号化データ構造であって、前記垂直方向のオフセットによって、矩形である第1の参照不可範囲が定義され、前記水平方向のオフセットによって、第2の参照不可範囲が定義されることを特徴とする符号化データ構造。
(2)本発明のその他の態様は、上述の符号化データ構造であって、前記第1の参照不可範囲の左上座標のY座標は、対象ブロックのCTB座標のY座標yCtbと垂直方向のオフセットの和にCTBサイズCtbSizeYを乗じた値であり、前記左上座標のX座標は0であり、
参照不可範囲の右下座標は、画面の右下であることを特徴とする。
(3)本発明のその他の態様は、上述の符号化データ構造であって、前記第2の参照不可範囲の左上座標のY座標は、対象ブロックのCTB座標のY座標yCtbと垂直方向のオフセットの和から1を引いた値にCTBサイズCtbSizeYを乗じた値であり、前記左上座標のX座標は対象ブロックのCTB座標のX座標xCtbと垂直方向のオフセットの和にCTBサイズCtbSizeYを乗じた値であることを特徴とする。
(4)本発明のその他の態様は、上述の符号化データ構造であって、前記符号化データは、ループフィルタ用の調整を示す調整フラグを含み、前記調整フラグに応じて、前記第1の参照不可範囲と、前記第2の参照不可の座標が所定の値だけ変化することを特徴とする。
(5)本発明のその他の態様は、上述の符号化データ構造であって、前記第1の参照不可範囲の開始CTBアドレスは、参照CTBアドレスのY座標refCtbAddrYと垂直方向のオフセットの和に参照ピクチャのCTB幅refPicWidthInCtbsを乗じた値から定義され、参照CTBアドレスのY座標refCtbAddrYは、対象ブロックのCTB座標のY座標yCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義されることを特徴とする。
(6)本発明のその他の態様は、上述の符号化データ構造であって、前記第2の参照不可範囲の開始CTBアドレスは、参照CTBアドレスのY座標refCtbAddrYと垂直方向のオフセットの和から1を引いた値に参照ピクチャのCTB幅refPicWidthInCtbsを乗じた値に、参照CTBアドレスのX座標refCtbAddrXと水平方向のオフセットの和と、参照ピクチャのCTB幅refPicWidthInCtbから1を引いた値の最小値を加えた値から定義され、前記参照CTBアドレスのY座標refCtbAddrYは、対象ブロックのCTB座標のY座標yCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義され、前記参照CTBアドレスのX座標refCtbAddrXは、対象ブロックのCTB座標のX座標xCtbに対象ピクチャのCTBサイズCtbSizeYを乗じて参照ピクチャのCTBサイズrefCtbSizeYで割った値で定義されることを特徴とする。
(7)複数のレイヤ画像を復号する画像復号装置において、第1のレイヤとは異なる第2のレイヤ画像を参照する場合に、第2のレイヤ画像の参照不可範囲を示す並列デコード情報を復号するSEI復号部を備え、前記参照不可範囲は、第1の参照不可範囲と第2の参照不可範囲から構成されることを特徴とする画像復号装置。
(8)本発明のその他の態様は、上述の画像復号装置であって、前記並列デコード情報から、前記第2レイヤ画像のブロックを特定し、該ブロックの復号が完了するまで、前記第1レイヤ画像の復号処理を待機させる予測ピクチャブロック復号待機部と、を備えることを特徴とする画像復号装置。
(9)本発明のその他の態様は、上述の画像復号装置であって、前記並列デコード情報として第1の参照不可範囲が定義されていなかった場合には、前記ブロックのX座標として既定の値を設定する予測ピクチャブロック復号待機部と、を備えることを特徴とする。
(10)本発明のその他の態様は、上述の画像復号装置であって、ループフィルタ用の調整を示す調整フラグを含む前記並列デコード情報を復号するSEI復号部と、前記調整フラグを用いて、前記第1レイヤ画像のブロックを特定する予測ピクチャブロック復号待機部と、を備えることを特徴とする。
(11)第1レイヤ画像と、前記第1レイヤ画像とは異なる第2レイヤ画像の間で参照不可能な領域を、第1の参照不可範囲と第2の参照不可範囲に分けて定義した並列デコード情報を符号化するSEI符号化部と、予測パラメータが参照不可範囲を参照しているか否かを判定する予測パラメータ制限部と、参照不可範囲を参照していると判定された予測パラメータを候補から除外する予測パラメータ決定部と、を備えることを特徴とする画像符号化装置。
本発明は、画像データが符号化された符号化データを復号する画像復号装置、および、画像データが符号化された符号化データを生成する画像符号化装置に好適に適用することができる。また、画像符号化装置によって生成され、画像復号装置によって参照される符号化データのデータ構造に好適に適用することができる。
1…画像伝送システム
11…画像符号化装置
11B…画像符号化装置
101…予測画像生成部
102…減算部
103…DCT・量子化部
104…エントロピー符号化部
105…逆量子化・逆DCT部
106…加算部
108…予測パラメータメモリ(フレームメモリ)
109…参照ピクチャメモリ(フレームメモリ)
110…符号化パラメータ決定部
111…予測パラメータ符号化部
112…インター予測パラメータ符号化部
113…イントラ予測パラメータ符号化部
21…ネットワーク
31…画像復号装置
31B…画像復号装置
301…エントロピー復号部
302…予測パラメータ復号部
303…インター予測パラメータ復号部
304…イントラ予測パラメータ復号部
306…参照ピクチャメモリ(フレームメモリ)
307…予測パラメータメモリ(フレームメモリ)
308…予測画像生成部
309…インター予測画像生成部
310…イントラ予測画像生成部
311…逆量子化・逆DCT部
312…加算部
41…画像表示装置

Claims (1)

  1. 複数のレイヤ画像を復号する画像復号装置において、
    対象レイヤが参照レイヤを参照する場合における参照不可範囲を示す水平方向のオフセットと垂直方向のオフセットを復号するエントロピー復号部と、
    参照ピクチャから予測ピクチャブロックを生成するインター予測画像生成部を備え、
    インター予測画像生成部が参照レイヤの参照ピクチャを参照する場合の前記参照不可範囲は、前記水平方向のオフセットが0の場合、前記垂直方向のオフセットのみに基づいて定義されていることを特徴とする画像復号装置。
JP2015510167A 2013-04-05 2014-04-07 画像復号装置 Expired - Fee Related JP6473078B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013079646 2013-04-05
JP2013079646 2013-04-05
PCT/JP2014/060121 WO2014163209A1 (ja) 2013-04-05 2014-04-07 画像復号装置

Publications (2)

Publication Number Publication Date
JPWO2014163209A1 JPWO2014163209A1 (ja) 2017-02-16
JP6473078B2 true JP6473078B2 (ja) 2019-02-20

Family

ID=51658494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015510167A Expired - Fee Related JP6473078B2 (ja) 2013-04-05 2014-04-07 画像復号装置

Country Status (3)

Country Link
US (2) US9497476B2 (ja)
JP (1) JP6473078B2 (ja)
WO (1) WO2014163209A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015025151B1 (pt) * 2013-04-09 2022-11-29 Siemens Aktiengesellschaft Método de codificação, método de decodificação, método de codificação e decodificação, aparelho para codificação, aparelho para decodificação e codec para codificar e decodificar uma sequência de imagens digitais
US20160373744A1 (en) * 2014-04-23 2016-12-22 Sony Corporation Image processing apparatus and image processing method
EP3185553A1 (en) * 2015-12-21 2017-06-28 Thomson Licensing Apparatus, system and method of video compression using smart coding tree unit scanning and corresponding computer program and medium
CN109983771A (zh) * 2016-11-21 2019-07-05 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法及解码方法
CN116347077A (zh) 2016-11-21 2023-06-27 松下电器(美国)知识产权公司 计算机可读介质
WO2021071186A1 (ko) * 2019-10-07 2021-04-15 에스케이텔레콤 주식회사 픽처 분할 방법 및 복호화 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06217346A (ja) * 1993-01-13 1994-08-05 Sony Corp 信号伝送装置およびビデオシステム
JP3495800B2 (ja) * 1994-12-28 2004-02-09 キヤノン株式会社 符号化装置及び方法
US5844140A (en) * 1996-08-27 1998-12-01 Seale; Joseph B. Ultrasound beam alignment servo
JP3844844B2 (ja) * 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
FR2769453B1 (fr) * 1997-10-06 2000-01-07 Telediffusion Fse Procede d'evaluation de la degradation d'une image video introduite par un systeme de codage et/ou de stockage et/ou de transmission numerique
EP1069779B1 (en) * 1999-02-09 2016-04-13 Sony Corporation Coding system and its method
JP4724351B2 (ja) * 2002-07-15 2011-07-13 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
KR101631270B1 (ko) * 2009-06-19 2016-06-16 삼성전자주식회사 의사 난수 필터를 이용한 영상 필터링 방법 및 장치
US9185439B2 (en) * 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
JP5982734B2 (ja) * 2011-03-11 2016-08-31 ソニー株式会社 画像処理装置および方法
KR20120140181A (ko) * 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
BR122021004576B1 (pt) * 2011-06-28 2022-07-26 Samsung Electronics Co., Ltd Aparelho de decodificação de vídeo

Also Published As

Publication number Publication date
JPWO2014163209A1 (ja) 2017-02-16
WO2014163209A1 (ja) 2014-10-09
US20160057438A1 (en) 2016-02-25
US20170026660A1 (en) 2017-01-26
US9497476B2 (en) 2016-11-15
US10034017B2 (en) 2018-07-24

Similar Documents

Publication Publication Date Title
JP6469588B2 (ja) 残差予測装置、画像復号装置、画像符号化装置、残差予測方法、画像復号方法、および画像符号化方法
US10200712B2 (en) Merge candidate derivation device, image decoding device, and image coding device
TWI538489B (zh) 在高效率視訊寫碼及其擴充中之運動向量寫碼及雙向預測
KR102099494B1 (ko) 비대칭 모션 파티셔닝을 이용한 비디오 코딩 기법들
JP6360053B2 (ja) 照度補償装置、画像復号装置、画像符号化装置
JP6225241B2 (ja) 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
WO2016125685A1 (ja) 画像復号装置、画像符号化装置および予測ベクトル導出装置
WO2015056719A1 (ja) 画像復号装置、画像符号化装置
JP6473078B2 (ja) 画像復号装置
WO2015194669A1 (ja) 画像復号装置、画像符号化装置および予測画像生成装置
WO2015056620A1 (ja) 画像復号装置、画像符号化装置
JP6118199B2 (ja) 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法及びコンピュータ読み取り可能な記録媒体。
WO2015141696A1 (ja) 画像復号装置、画像符号化装置および予測装置
JP2016066864A (ja) 画像復号装置、画像符号化装置およびマージモードパラメータ導出装置
WO2016056587A1 (ja) 変位配列導出装置、変位ベクトル導出装置、デフォルト参照ビューインデックス導出装置及びデプスルックアップテーブル導出装置
JP6401707B2 (ja) 画像復号装置、画像復号方法、および記録媒体
JP2015080053A (ja) 画像復号装置、及び画像符号化装置
JP2014204327A (ja) 画像復号装置および画像符号化装置
JP2015015626A (ja) 画像復号装置および画像符号化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190124

R150 Certificate of patent or registration of utility model

Ref document number: 6473078

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees