JP2019071653A - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP2019071653A
JP2019071653A JP2018245383A JP2018245383A JP2019071653A JP 2019071653 A JP2019071653 A JP 2019071653A JP 2018245383 A JP2018245383 A JP 2018245383A JP 2018245383 A JP2018245383 A JP 2018245383A JP 2019071653 A JP2019071653 A JP 2019071653A
Authority
JP
Japan
Prior art keywords
coefficient
unit
difference
data
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018245383A
Other languages
English (en)
Other versions
JP6635184B2 (ja
Inventor
田中 潤一
Junichi Tanaka
潤一 田中
義崇 森上
Yoshitaka Morigami
義崇 森上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2019071653A publication Critical patent/JP2019071653A/ja
Application granted granted Critical
Publication of JP6635184B2 publication Critical patent/JP6635184B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

【課題】スケーリングリストの符号量の増大を抑制することができるようにする。【解決手段】本開示の画像処理装置は、量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列の先頭に位置する係数との差分である置換差分係数を、量子化行列の先頭に位置する係数に加算することにより、量子化行列の先頭に位置する係数を設定し、設定された量子化行列をアップコンバートし、そのアップコンバート量子化行列の先頭に位置する係数を置換係数に置き換えたアップコンバート量子化行列を用いて、量子化データを逆量子化する。本開示は画像処理装置に適用することができる。【選択図】図7

Description

本開示は、画像処理装置および方法に関する。
映像符号化方式の標準仕様の1つであるH.264/AVC(Advanced Video Coding)では、High Profile以上のプロファイルにおいて、画像データの量子化の際に、直交変換係数の成分ごとに異なる量子化ステップを用いることができる。直交変換係数の成分ごとの量子化ステップは、直交変換の単位と同等のサイズで定義される量子化行列(スケーリングリストともいう)及び基準のステップ値に基づいて設定され得る。
量子化行列の規定値は、予測モード(イントラ予測モード、インター予測モード)と変換単位のサイズ(4x4、8x8)毎に用意される。また、ユーザは、シーケンスパラメータセット又はピクチャパラメータセットにおいて、既定値とは異なる独自の量子化行列を指定することができる。量子化行列が使用されない場合には、量子化の際に使用される量子化ステップは、全ての成分について等しい値となる。
H.264/AVCに続く次世代の映像符号化方式として標準化が進められているHEVC(High Efficiency Video Coding)では、従来のマクロブロックに相当する符号化単位(CU(Coding Unit))という概念が導入されている(例えば、非特許文献1参照)。符号化単位のサイズの範囲は、シーケンスパラメータセットにおいて、LCU(LargestCoding Unit)及びSCU(Smallest Coding Unit)という2のべき乗の値の組で指定される。そして、split_flagを用いて、LCU及びSCUで指定された範囲内の具体的な符号化単位のサイズが特定される。
HEVCでは、1つの符号化単位は、1つ以上の直交変換の単位、即ち1つ以上の変換単位(TU(Transform Unit))に分割され得る。変換単位のサイズとしては、4x4、8x8、16x16及び32x32のいずれかが利用可能である。
ところで、量子化行列(スケーリングリスト(Scaling List))は、伝送の際の符号量の低減等を目的として、そのDC成分(直流成分とも称する)が、AC成分(交流成分とも称する)とは別のデータとして伝送される。つまり、スケーリングリストのDC成分は、スケーリングリストのAC成分である各AC係数(交流係数とも称する)とは別の、DC係数(直流係数とも称する)として伝送される。
このDC係数について、伝送の際の符号量を低減させるために、DC係数の値から定数(例えば8)が差し引かれ、その値(scaling_list_dc_coef_minus8)が、符号つきの指数ゴロム符号化(signed exponential golomb coding)されるようにすることが提案されている(例えば、非特許文献1参照)。
Benjamin Bross, Fraunhofer HHI, Woo-Jin Han, Gachon University, Jens-Rainer Ohm, RWTH Aachen, Gary J. Sullivan, Microsoft, Thomas Wiegand, Fraunhofer HHI / TU Berlin, JCTVC-H1003, " High Efficiency Video Coding (HEVC) text specification draft 6", Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG117th Meeting: Geneva, CH, 21-30 November, 2011
しかしながら、この方法の場合、処理は容易であるものの、圧縮効率が十分でない恐れがあった。
本開示は、このような状況に鑑みて提案されたものであり、スケーリングリストの符号量の増加を抑制することができるようにすることを目的とする。
本技術の一側面の画像処理装置は、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数とを含む符号化データを復号して量子化データを生成する復号部と、前記初期差分係数に対して前記初期値を加算することにより得られる前記置換係数を、前記置換差分係数に加算することにより、前記第1サイズの第1量子化行列の先頭に位置する係数を設定し、前記第1サイズの第1量子化行列の先頭に位置する係数と前記差分係数とを用いて、前記第1サイズの第1量子化行列を設定する設定部と、前記設定部により設定された前記第1サイズの第1量子化行列に対してアップコンバートされた前記第2サイズの第2量子化行列の先頭に位置する係数を、前記置換係数に置き換える置き換え部と、前記置き換え部により先頭に位置する係数が前記置換係数に置き換えられた前記第2サイズの第2量子化行列を用いて、前記復号部により生成された量子化データを逆量子化して変換係数データを生成する逆量子化部と、前記逆量子化部により生成された変換係数データを逆直交変換して画像データを生成する逆直交変換部とを備える画像処理装置である。
本技術の一側面の画像処理方法は、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数とを含む符号化データを復号して量子化データを生成し、前記初期差分係数に対して前記初期値を加算することにより得られる前記置換係数を、前記置換差分係数に加算することにより、前記第1サイズの第1量子化行列の先頭に位置する係数を設定し、前記第1サイズの第1量子化行列の先頭に位置する係数と前記差分係数とを用いて、前記第1サイズの第1量子化行列を設定し、設定された前記第1サイズの第1量子化行列に対してアップコンバートされた前記第2サイズの第2量子化行列の先頭に位置する係数を、前記置換係数に置き換え、先頭に位置する係数が前記置換係数に置き換えられた前記第2サイズの第2量子化行列を用いて、生成された量子化データを逆量子化して変換係数データを生成し、生成された変換係数データを逆直交変換して画像データを生成する画像処理方法である。
本技術の他の側面の画像処理装置は、画像を直交変換した変換係数データを量子化して、量子化データを生成する量子化部と、前記量子化部により生成された量子化データを符号化して、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数と、を含む符号化データを生成する符号化部とを備える画像処理装置である。
本技術の他の側面の画像処理方法は、画像を直交変換した変換係数データを量子化して、量子化データを生成し、生成された量子化データを符号化して、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数と、を含む符号化データを生成する画像処理方法である。
本技術の一側面の画像処理装置および方法においては、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、その置換係数と第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、その第1サイズの第1量子化行列の係数同士の差分である差分係数とを含む符号化データが復号されて量子化データが生成され、その初期差分係数に対して初期値を加算することにより得られる置換係数が、その置換差分係数に加算されることにより、その第1サイズの第1量子化行列の先頭に位置する係数が設定され、その第1サイズの第1量子化行列の先頭に位置する係数とその差分係数とが用いられて、その第1サイズの第1量子化行列が設定され、その設定された第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数が、置換係数に置き換えられ、その先頭に位置する係数が置換係数に置き換えられた第2サイズの第2量子化行列が用いられて、その生成された量子化データが逆量子化されて変換係数データが生成され、その生成された変換係数データが逆直交変換されて画像データが生成される。
本技術の他の側面の画像処理装置および方法においては、画像を直交変換した変換係数データが量子化されて、量子化データが生成され、その生成された量子化データが符号化されて、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、その置換係数と第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、その第1サイズの第1量子化行列の係数同士の差分である差分係数と、を含む符号化データが生成される。
本開示によれば、画像を処理することが出来る。特に、量子化行列の符号量の増加を抑制することができる。
スケーリングリストの例を示す図である。 アップコンバートの例を説明する図である。 デコーダにおけるスケーリングリストの使用例を説明する図である。 スケーリングリストの符号化例を説明する図である。 本技術を適用したスケーリングリストの符号化例を説明する図である。 指数ゴロム符号の例を示す図である。 スケーリングリストに関するシンタクスの例を示す図である。 デフォルトマトリクスに関するシンタクスの例を示す図である。 デフォルトマトリクスに関するセマンティクスの例を示す図である。 スケーリングリストに関するシンタクスの例を示す図である。 本技術を適用したスケーリングリストに関するシンタクスの例を示す図である。 従来のスケーリングリストのシンタクスの例を示す図である。 スケーリングリストのシンタクスの例を示す図である。 画像符号化装置の主な構成例を示すブロック図である。 直交変換・量子化部の主な構成例を示すブロック図である。 行列処理部の主な構成例を示すブロック図である。 ダウンサンプルの例を説明する図である。 重複部分を削除する様子の例を説明する図である。 DPCM部の主な構成例を示すブロック図である。 量子化行列符号化処理の流れの例を説明するフローチャートである。 DPCM処理の流れの例を示すフローチャートである。 画像復号装置の主な構成例を示すブロック図である。 逆量子化・逆直交変換部の主な構成例を示すブロック図である。 行列生成部の主な構成例を示すブロック図である。 最近傍補間処理の例を説明する図である。 逆DPCM部の主な構成例を示すブロック図である。 行列生成処理の流れの例を説明するフローチャートである。 残差信号復号処理の流れの例を説明するフローチャートである。 逆DPCM処理の流れの例を説明するフローチャートである。 スケーリングリストのシンタクスの、他の例を示す図である。 DPCM部の他の構成例を示すブロック図である。 DPCM処理の流れの、他の例を示すフローチャートである。 逆DPCM部の他の構成例を示すブロック図である。 逆DPCM処理の流れの、他の例を説明するフローチャートである。 スケーリングリストのシンタクスの、さらに他の例を示す図である。 逆DPCM処理の流れの、さらに他の例を説明するフローチャートである。 スケーリングリストのシンタクスの、さらに他の例を示す図である。 DPCM部のさらに他の構成例を示すブロック図である。 DPCM処理の流れの、さらに他の例を示すフローチャートである。 逆DPCM部のさらに他の構成例を示すブロック図である。 逆DPCM処理の流れの、さらに他の例を説明するフローチャートである。 逆DPCM処理の流れの、さらに他の例を説明する、図41に続くフローチャートである。 スケーリングリストのシンタクスの、さらに他の例を示す図である。 スケーリングリストのシンタクスの、さらに他の例を示す図である。 スケーリングリストのシンタクスの、さらに他の例を示す図である。 多視点画像符号化方式の例を示す図である。 本技術を適用した多視点画像符号化装置の主な構成例を示す図である。 本技術を適用した多視点画像復号装置の主な構成例を示す図である。 階層画像符号化方式の例を示す図である。 本技術を適用した階層画像符号化装置の主な構成例を示す図である。 本技術を適用した階層画像復号装置の主な構成例を示す図である。 コンピュータの主な構成例を示すブロック図である。 テレビジョン装置の主な構成例を示すブロック図である。 モバイル端末器の主な構成例を示すブロック図である。 記録再生機の主な構成例を示すブロック図である。 撮像装置の主な構成例を示すブロック図である。 スケーラブル符号化利用の一例を示すブロック図である。 スケーラブル符号化利用の他の例を示すブロック図である。 スケーラブル符号化利用のさらに他の例を示すブロック図である。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(本技術の代表的な適用例)
2.第2の実施の形態(画像符号化装置、画像復号装置:方法1)
3.第3の実施の形態(画像符号化装置、画像復号装置:方法2)
4.第4の実施の形態(画像符号化装置、画像復号装置:方法3)
5.第5の実施の形態(画像符号化装置、画像復号装置:方法4)
6.第6の実施の形態(画像符号化装置、画像復号装置:その他の方法)
7.第7の実施の形態(多視点画像符号化装置、多視点画像復号装置)
8.第8の実施の形態(階層画像符号化装置、階層画像復号装置)
9.第9の実施の形態(コンピュータ)
10.応用例
11.スケーラブル符号化の応用例
<1.第1の実施の形態>
本実施の形態においては、第2以降の各実施の形態において詳細を説明する本技術の、代表的な適用例について説明する。
<1−1.本技術を適用するケースの代表的な一例>
最初に、本技術を適用するケースについて、代表的な一例を説明する。本技術は、画像データの符号化・復号において行われる量子化・逆量子化の処理に用いられるスケーリングリストの符号化・復号に関する技術である。
画像データの符号化や復号においては、係数データの量子化や逆量子化が行われることがある。このような量子化・逆量子化は、所定の大きさのブロック毎に行われ、そのブロックサイズに応じたサイズのスケーリングリスト(量子化マトリクス)が用いられる。例えば、HEVC(High Efficiency Video Coding)の場合、4x4、8x8、16x16、32x32等のサイズで量子化(逆量子化)が行われる。HEVCの場合、4x4と8x8のサイズの量子化マトリクスが用意される。
図1に8x8のスケーリングリストの例を示す。図1に示されるように、スケーリングリストは、DC係数(DC coefficient)とAC係数(AC coefficient)よりなる。1つの値よりなるDC係数は、量子化マトリクスの(0,0)係数であり、離散コサイン変換(DCT(Discrete Cosine Transform))のDC係数に相当する。AC係数は、量子化マトリクスの(0,0)係数以外の係数であり、DCTのDC係数以外の係数に相当する。ただし、図1に示されるように、AC係数はマトリクス(行列)として表現される。すなわち、AC係数には(0,0)係数も含まれる(以下、AC係数(0,0)とも称する)が、量子化・逆量子化に使用される際には、この量子化マトリクスの先頭に位置する係数である(0,0)係数は、DC係数に置き換えられる。したがって、DC係数は、置換係数とも称する。図1の例の場合、AC係数は8x8のマトリクス(行列)を形成している。
また、HEVCの場合、16x16や32x32の量子化(逆量子化)には、8x8の量子化マトリクスをアップコンバート(拡大変換)したものが利用される。
図2に、8x8のスケーリングリストを16x16にアップコンバートする様子の例を示す。図2に示されるように、スケーリングリストのアップコンバートには、例えば、最近傍補間処理が適用される。最近傍補間処理の詳細については、例えば図25等を参照して後述する。図2に示されるように、アップコンバートは、スケーリングリストのAC係数に対して行われる。そして、このアップコンバートされたAC係数の(0,0)係数がDC係数に置き換えられる。
8x8のスケーリングリストは、16x16にアップコンバートするためのもの(8x8 for 16x16)と、32x32にアップコンバートするためのもの(8x8 for 32x32)との2種類用意される。
符号化(エンコーダ)における量子化に使用されたスケーリングリストは、復号(デコーダ)における逆量子化にも使用される。つまり、スケーリングリストは、符号化側(エンコーダ)から復号側(デコーダ)側に伝送される。図3にその様子の例を示す。
図3に示される例のように、上述した、16x16サイズへのアップコンバート用と、32x32サイズへのアップコンバート用の、2種類の8x8のスケーリングリストが、伝送される。なお、図示は省略するが、その他に、4x4のスケーリングリストも伝送される。
このように伝送された16x16サイズへのアップコンバート用の8x8のスケーリングリストのAC係数は、復号側(デコーダ)において、上述したように最近傍補間処理により16x16サイズにアップコンバートされ、(0,0)係数がDC係数に置き換えられて、16x16サイズのブロックの逆量子化に使用される。
同様に、このように伝送された32x32サイズへのアップコンバート用の8x8のスケーリングリストのAC係数は、復号側(デコーダ)において、上述したように最近傍補間処理により32x32サイズにアップコンバートされ、(0,0)係数がDC係数に置き換えられて、32x32サイズのブロックの逆量子化に使用される。
<1−2.スケーリングリストの符号化>
以上のようにスケーリングリストを伝送することにより、その分、符号量が増大することになる。そこで、符号化効率低減を抑制するために、スケーリングリストは所定の方法で符号化され、その符号量の低減が図られる。図4にその例を示す。すなわち、8x8のスケーリングリストは、以下のように伝送される。
8x8マトリクスを16x16マトリクスにアップコンバートする場合:
(1)8x8マトリクスの(0,0)係数(すなわち、AC係数(0,0))と、予め定められた初期値「8」との差分をとる。
(2)8x8マトリクスの係数(すなわち、AC係数)同士(スキャン順に1次元に並べられた係数列において隣同士)の差分をとる。
(3)16x16マトリクスの(0,0)係数(すなわち、DC係数)と、予め定められた初期値「8」との差分をとる。
(4)(1)の差分および(2)の差分と、(3)の差分とを別々に伝送する。
8x8マトリクスを32x32マトリクスにアップコンバートする場合:
(1)8x8マトリクスの(0,0)係数(すなわち、AC係数(0,0))と、予め定められた初期値「8」との差分をとる。
(2)8x8マトリクスの係数(すなわち、AC係数)同士(スキャン順に1次元に並べられた係数列において隣同士)の差分をとる。
(3)32x32マトリクスの(0,0)係数(すなわち、DC係数)と、予め定められた初期値「8」との差分をとる。
(4)(1)の差分および(2)の差分と、(3)の差分とを別々に伝送する。
しかしながら、この方法の場合、(4)において、各差分は、指数ゴロム符号化(signed exponential golomb coding)されて伝送される。上述したように(1)の差分は、AC係数(0,0)と初期値「8」との差分であるので、このAC係数(0,0)の値が、初期値「8」に近い値でない場合、符号量が増大する恐れがあった。
例えば、図4の場合、AC係数(0,0)の値は「12」であり、(1)の差分として値「4」が指数ゴロム符号化されて伝送されることになる。つまり、(1)の差分の伝送のために7ビット(bit)を必要とし、その分、符号化効率を低減させる恐れがある。この(1)の差分の値がさらに大きければ、さらに符号化効率を低減させる恐れがある。これは、16x16サイズへのアップコンバート用の8x8のスケーリングリストの場合も、32x32サイズへのアップコンバート用の8x8のスケーリングリストの場合も同様である。
ところで、一般的に、DCT係数は、DC係数とその周辺の低次の係数にパワーが集中する。したがって、一般的に、量子化マトリクスもDC係数とその周辺の係数に対して小さな値が用いられる。また、周波数毎に極端に異なる値を使用した場合、量子化誤差が主観的に目につくことがある。そのような視覚的な画質の劣化を抑制するために、DC係数とその周辺の係数に対して連続的な値が適用される。
アップコンバート後の(0,1)係数、(1.0)係数、および(1.1)係数は、アップコンバートする前のAC係数(0,0)に対応する。また、アップコンバート後の(0,0)係数は、DC係数に対応する。
したがって、一般的に、スケーリングリストにおいて、AC係数(0,0)の値とDC係数の値は、互いに近い値をとる。例えば、MPEG2、AVC、およびHEVCのデフォルトマトリクスはそういう値になっている。図4の例においても、DC係数の値は、AC係数(0,0)と同じ「12」である。したがって、(3)の差分、すなわち、DC係数と初期値「8」との差分の値も「4」である。
つまり、互いに近い値を持つDC係数とAC係数(0,0)を、それぞれ、初期値と差分をとることは、その差分値が大きくなる恐れがあるだけでなく、冗長である可能性が高く、符号化効率をさらに低減させる恐れがあるとも言える。
そこで、スケーリングリストの伝送を、図4の方法に代えて、以下のような方法で行うようにする。図5にその例を示す。
8x8マトリクスを16x16マトリクスにアップコンバートする場合:
(1)8x8マトリクスの(0,0)係数(すなわち、AC係数(0,0))と16x16マトリクスの(0,0)係数(すなわち、DC係数)との差分をとる。
(2)8x8マトリクスの係数(すなわち、AC係数)同士(スキャン順に1次元に並べられた係数列において隣同士)の差分をとる。
(3)16x16マトリクスの(0,0)係数(すなわち、DC係数)と、予め定められた初期値「8」との差分をとる。
(4)(1)乃至(3)の差分をまとめて伝送する。
8x8マトリクスを32x32マトリクスにアップコンバートする場合:
(1)8x8マトリクスの(0,0)係数(すなわち、AC係数(0,0))と32x32マトリクスの(0,0)係数(すなわち、DC係数)との差分をとる。
(2)8x8マトリクスの係数(すなわち、AC係数)同士(スキャン順に1次元に並べられた係数列において隣同士)の差分をとる。
(3)32x32マトリクスの(0,0)係数(すなわち、DC係数)と、予め定められた初期値「8」との差分をとる。
(4)(1)乃至(3)の差分をまとめて伝送する。
図4の場合と同様に、(4)において、各差分は、指数ゴロム符号化されて指数ゴロム符号として伝送される。
指数ゴロム符号として伝送される各差分の伝送先は、その指数ゴロム符号を受け取ると、受け取った指数ゴロム符号を復号し、得られた各差分を、上述した(1)乃至(3)の逆処理を行うことにより、各係数(DC係数およびAC係数)を求める。
<1−3.本技術の代表的な特徴>
以上のような伝送方法に関する本技術の代表的な特徴について、以下に説明する。
<1−3−1.AC係数(0,0)とDC係数とのDPCM>
スケーリングリストは、差分パルス符号変調(DPCM(Differential Pulse-Code Modulation))されて伝送される。図4の例の場合、AC係数とDC係数は、それぞれ独立してDPCMされるのに対して、本技術の特徴の1つは、図5の例のように、AC係数(0,0)とDC係数との差分(置換差分係数とも称する)を求めて伝送することである。
上述したように、一般的に、AC係数(0,0)とDC係数は、近い値をとる。したがって、AC係数(0,0)とDC係数との差分の方が、AC係数(0,0)と初期値「8」との差分よりも小さい値となる可能性が高い。つまり、本技術を適用して、AC係数(0,0)とDC係数との差分である置換差分係数を伝送するようにする方が、符号量が低減される可能性が高い。
例えば、図5の例の場合、(1)の差分の値は「0」である。
図6は、指数ゴロム符号化(signed exponential golomb coding)の例を示す図である。図6の表に示されるように、値「4」の指数ゴロム符号の符号長は7ビットであるのに対して、値「0」の指数ゴロム符号の符号長は1ビットである。つまり、図5の場合の方が、図4の場合に比べて、符号量を6ビット削減することができる。
一般的に、8x8サイズの量子化マトリクスを伝送するのに、100ビット乃至200ビット程度の符号量が必要になる。したがって6ビットは、全体の6%程度に相当する。ハイレベルシンタクス(High Level Syntax)において、6%の符号量低減は、非常に大きな効果であると言える。
<1−3−2.DC係数とAC係数とをまとめて伝送>
図7にスケーリングリストのシンタクスの例を示す。図4の例の場合、シンタクスは、図7のAの例のようになる。つまり、AC係数(0,0)と初期値「8」との差分、並びに、AC係数同士の差分(scaling_list_delta_coef)が伝送され、その後、それとは別に、DC係数と初期値「8」との差分(scaling_list_dc_coef_minus8)が伝送される。
これに対して本技術の特徴の1つは、DC係数とAC係数(0,0)との差分、並びに、AC係数同士の差分をこの順に並べ、まとめて伝送することである。つまり、図5に示されるように、DC係数、並びに、所定のスキャン順の各AC係数が1次元に並べられ、DC係数と初期値「8」との差分が求められた後、その係数列の隣り合う係数同士の差分が求められる。そして、得られた各差分(係数同士の差分)が、その得られた順に1次元に並べられた状態でまとめて伝送される。
この場合のシンタクスは、図7のBの例のようになる。つまり、最初にDC係数と初期値「8」との差分(scaling_list_dc_coef_minus8)が伝送され、続いて、DC係数とAC係数(0,0)との差分、並びに、AC係数同士の差分(scaling_list_delta_coef)が伝送される。つまり、DC係数とAC係数がまとめて符号化されて伝送される。
このように、各差分を得られた順に並べてまとめて伝送することにより、伝送先の復号側(デコーダ)は、伝送される順に復号し、各係数を得ることができる。つまり、DPCMされたスケーリングリストを容易に復号することができる。より具体的には、処理の負荷を低減させることができる。また、差分の並べ替え等が不要になるのでバッファの容量を低減させることができる。さらに、各差分の供給順に復号を行うことができるので、処理時間の増大を抑制することができる。
<1−3−3.デフォルトマトリクスの伝送>
図8は、デフォルトマトリクスの伝送に関するシンタクスの例を示す図である。従来、デフォルトマトリクスを使用することを示す情報を伝送するために、図8に示されるように、最初の係数(DC係数)を「0」として伝送していた。つまり、DC係数と初期値「8」との差分(scaling_list_dc_coef_minus8))の値は「−8」とされた。しかしながら、図6に示されるように、値「−8」の指数ゴロム符号の符号長は9ビットである。つまり、符号化効率を大幅に低減させる恐れがあった。一般的に、ハイレベルシンタクス(High Level Syntax)は、1ビットでも少ない方が望ましい。さらに、図8に示されるようにシンタクスも複雑になり、処理の負荷を増大させる恐れがあった。
そこで、最初の係数を「0」にするのではなくて、scaling_list_pred_matrix_id_deltaのセマンティクス(semantics)を変更するようにする。より具体的には、scaling_list_pred_matrix_id_deltaのセマンティクスを図9のAから図9のBのように変更する。つまり、従来、図9のAに示されるように、この値が「0」である場合、1つ前のマトリクス(MatrixID−1)を参照することを示していた。これを、図9のBに示されるように、このscaling_list_pred_matrix_id_deltaの値が「0」である場合、デフォルトマトリクスを意味するものとするようにする。
このようにすることにより、デフォルトマトリクスを使用することを示す情報を伝送するための指数ゴロム符号の符号長を1ビットにすることができ、符号化効率の低減を抑制することができる。また、スケーリングリストについて、従来、図10のAおよび図10のBに示されるようなシンタクスが必要であったが、これを図11に示される例のように、簡略化することができる。つまり、スケーリングリストの符号化・復号に関する処理の負荷を低減させることができる。
<1−4.本技術を適用することによるシンタクスの特徴>
シンタクスについて、より具体的に説明する。
図10のAおよび図10のBに示される従来の例の場合、scaling_list_dc_coef_minus8とscaling_list_delta_coefの2箇所でデフォルトを判定しないといけなかった。また、scaling_list_delta_coefに関しては、forループの途中で判定を行い、useDefaultScalingMatrixFlag=1になると、ループを抜ける処理になっていた。また、stopNowという中間フラグを必要とし、この条件によりnextCoefをscalingListの値に代入するなどの分岐も存在する。このように、従来のシンタクスでは、複雑な処理が必要であった。
そこで、本技術では、図11に示される例のように、scaling_list_dc_coef_minus8から計算されるDC係数をnextCoefに代入することで、scaling_list_delta_coefの初期値をDC係数とする。
また、セマンティクスとして、scaling_list_pred_matrix_id_deltaの値を従来「+1」で表現したものをそのままの値とし、値「0」を特別扱いすることにした。
つまり、従来、ScalingList[0][2]を復号する際(matrixId=2)、scaling_list_pred_matrix_id_delta=0とすれば、refMatrixId = matrixId − (1 + scaling_list_pred_matrix_id_delta)でmatrixId=2なので、refMatrixId = 1となりScalingList[0][1]の値をコピーすることになっていた。
これに対して本技術では、refMatrixId = matrixId − scaling_list_pred_matrix_id_deltaとし、ScalingList[0][2]を復号する際(matrixId=2)、ScalingList[0][1]をコピーしたい場合(refMatrixId = 1としたい場合)、scaling_list_pred_matrix_id_delta=1とすればよいようにした。
このようにすることにより、図11に示されるように、スケーリングリストに関するシンタクスの行数を大幅に低減させることができる。また、中間データとして持たないといけない、UseDefaultScalingMatrixおよびstopNowの2つの変数を省略することができる。さらに、図10に示されるようなforループ内の分岐が不要にすることができる。したがって、スケーリングリストの符号化・復号に関する処理の負荷を低減させることができる。
<1−5.本技術を実現する処理部>
スケーリングリストの伝送において本技術を適用する場合、以上のようなスケーリングリストの符号化・復号が行われる。つまり、図14を参照して後述する画像符号化装置10がスケーリングリストを符号化して伝送し、図22を参照して後述する画像復号装置300が、その符号化されたスケーリングリストを受け取り、復号する。
スケーリングリストの符号化は、画像符号化装置10の直交変換・量子化部14(図14)の、行列処理部150(図15)の、エントロピ符号化部164(図16)の、DPCM部192およびexpG部193(ともに図16)において行われる。つまり、DPCM部192において、スケーリングリストの各係数(DC係数やAC係数)同士の差分が求められ、expG部193において、各差分が指数ゴロム符号化される。
上述したような本技術を適用したスケーリングリストの符号化を行うためには、DPCM部192が、例えば、図19に示されるような構成例を有し、図21に示される例のようなDPCM処理を行えばよい。また、セマンティクスは、図44のCや図45のCの例のようにすればよい。
換言するに、本技術を適用したスケーリングリストの符号化を実現するためには、このDPCM部192およびexpG部193のみがあればよく、その他は、どのような構成であってもよい。例えば、スケーリングリストのアップコンバートを行う処理部や、スケーリングリストを用いた量子化を行う処理部等、実施の態様に応じて必要な構成を設けるようにすればよい。
また、スケーリングリストの復号は、画像復号装置300の逆量子化・逆直交変換部313(図22)の、行列生成部410(図23)の、エントロピ復号部533(図24)の、expG部551および逆DPCM部552(ともに図24)において行われる。つまり、expG部551において、指数ゴロム符号が復号されて差分が得られ、逆DPCM部552において、各差分からスケーリングリストの各係数(DC係数やAC係数)が求められる。
上述したような本技術を適用した、符号化されたスケーリングリストの復号を行うためには、逆DPCM部552が、例えば、図26に示されるような構成例を有し、図29に示される例のような逆DPCM処理を行えばよい。また、セマンティクスは、図44のCや図45のCの例のようにすればよい。
換言するに、本技術を適用したスケーリングリストの復号を実現するためには、このexpG部551および逆DPCM部552のみがあればよく、その他は、どのような構成であってもよい。例えば、スケーリングリストのアップコンバートを行う処理部や、スケーリングリストを用いた逆量子化を行う処理部等、実施の態様に応じて必要な構成を設けるようにすればよい。
以下に、本技術についてのより詳細な説明をするために、本技術を適用した各実施の形態について説明する。
<2.第2の実施の形態>
<2−1.シンタクス:方法1>
(1)従来シンタクス
まず、量子化行列(スケーリングリスト(Scaling List))の従来のシンタクスの例を図12に示す。なお、実際には、スケーリングリストの代わりに、スケーリングリストとその予測行列との差分行列が伝送されることが多い。したがって、以下のシンタクス等の説明において、スケーリングリストの説明は、差分行列にも適用することができるものとする。
図12のAは、スケーリングリストデータに関するシンタクス(Scaling list data syntax)であり、図12のBは、スケーリングリストのシンタクス(Scaling list syntax)である。
(1―1)Scaling list data syntax
図12のAに示されるように、スケーリングリストデータに関するシンタクスにおいては、スケーリングリストが提供されるか否かを示すフラグ(scaling_list_present_flag)、コピーモードであるか否かを示すフラグ(scaling_list_pred_mode_flag)、コピーモードの場合、どのスケーリングリストを参照するかを示す情報(scaling_list_pred_matrix_id_delta)等が読みこまれることが決められている。
(1―2)Scaling list syntax
図12のBに示されるように、スケーリングリストのシンタクスにおいては、定数(例えば8)が値から減算されたDC係数(scaling_list_dc_coef_minus8)や、AC係数の差分値(scaling_list_delta_coef)等が読みこまれ、DC係数やAC係数が復元されることが決められている。
しかしながら、このようなシンタクスでは、処理は容易であるものの、DC係数の圧縮効率が十分でない恐れがあった。
そこで、DC成分(直流成分)の係数であるDC係数(直流係数とも称する)の圧縮効率を十分なものとするために、DC係数とその他の係数との差分を求め、その差分値をDC係数の代わりに伝送するようにする。つまり、この差分値は、DC係数を算出するための情報であり、すなわち、実質的にDC係数と等価である。ただし、一般的に、DC係数そのものよりも、この差分の方が値が小さくなる。つまり、DC係数の代わりにこの差分値を伝送することにより符号量が低減される。
なお、以下においては、説明の便宜上、スケーリングリスト(量子化行列)のサイズは、8x8とする。上述した、DC係数の代わりに、DC係数とその他の係数との差分を伝送する方法の具体例を以下に説明する。
(2)方法1シンタクス
例えば、DC係数を8x8マトリクス(AC係数)の先頭の要素と考えて、65係数のDPCM(Differential Pulse Code Modulation:差分パルス符号変調)で伝送するようにしてもよい(方法1)。
つまり、最初に、所定の定数とDC係数との差分が算出され、それがDPCMデータの最初の係数とされる。次に、DC係数と最初のAC係数との差分が算出され、それがDPCMデータの2番目の係数とされる。次に、最初のAC係数と2番目のAC係数との差分が算出され、それがDPCMデータの3番目の係数とされる。以降、同様に1つ手前のAC係数との差分が算出され、DPCMデータの4番目以降の係数とされる。このように生成されたDPCMデータが、最初の係数から順に伝送される。
このようにすることにより、8x8マトリクスの(0,0)係数(AC係数)とDC係数が近い値の場合に圧縮率をより向上させることができる。この方法1を実現することにより、画像符号化装置は、DC係数を、AC成分(交流成分)の係数であるAC係数(交流係数とも称する)と同様に処理することができる。ただし、この方法1を実現するためには、この係数群が伝送される画像復号装置は、最初の係数のみ特別扱いする必要がある。つまり、画像復号装置は、AC係数群の中からDC係数を抽出する必要がある。
その場合の、スケーリングリストのシンタクスを、図13に示す。図13の例の場合、係数同士の差分値(scaling_list_delta_coef)が65個読み込まれ、それらの差分値から求められた各係数(nextcoef)の内、先頭の係数(nextcoef)がDC係数(scaling_list_dc_coef)とされ、それ以外の係数が、AC係数(ScalingList[i])とされる。
このような方法1のシンタクスを実現する画像符号化装置について以下に説明する。
<2−2.画像符号化装置>
図14は、本開示の一実施形態に係る画像符号化装置10の構成の一例を示すブロック図である。図14に示される画像符号化装置10は、入力された画像データを符号化し、得られた符号化データを出力する、本技術を適用した画像処理装置である。図14を参照すると、画像符号化装置10は、A/D(Analogue to Digital)変換部11(A/D)、並べ替えバッファ12、減算部13、直交変換・量子化部14、可逆符号化部16、蓄積バッファ17、レート制御部18、逆量子化部21、逆直交変換部22、加算部23、デブロックフィルタ24、フレームメモリ25、セレクタ26、イントラ予測部30、動き探索部40、及びモード選択部50を備える。
A/D変換部11は、アナログ形式で入力される画像信号をデジタル形式の画像データに変換し、一連のデジタル画像データを並べ替えバッファ12へ出力する。
並べ替えバッファ12は、A/D変換部11から入力される一連の画像データに含まれる画像を並べ替える。並べ替えバッファ12は、符号化処理に係るGOP(Group of Pictures)構造に応じて画像を並べ替えた後、並べ替え後の画像データを減算部13、イントラ予測部30、および動き探索部40へ出力する。
減算部13には、並べ替えバッファ12から入力される画像データ、および、後に説明するモード選択部50により選択される予測画像データが供給される。減算部13は、並べ替えバッファ12から入力される画像データとモード選択部50から入力される予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換・量子化部14へ出力する。
直交変換・量子化部14は、減算部13から入力される予測誤差データについて直交変換および量子化を行い、量子化された変換係数データ(以下、量子化データという)を可逆符号化部16および逆量子化部21へ出力する。直交変換・量子化部14から出力される量子化データのビットレートは、レート制御部18からのレート制御信号に基づいて制御される。直交変換・量子化部14の詳細な構成について、後にさらに説明する。
可逆符号化部16には、直交変換・量子化部14から入力される量子化データ、復号側でスケーリングリスト(量子化行列)を生成するための情報、並びに、モード選択部50により選択されるイントラ予測またはインター予測に関する情報が供給される。イントラ予測に関する情報は、例えば、ブロック毎の最適なイントラ予測モードを示す予測モード情報を含み得る。また、インター予測に関する情報は、例えば、ブロック毎の動きベクトルの予測のための予測モード情報、差分動きベクトル情報、および参照画像情報等を含み得る。さらに、復号側でスケーリングリストを生成するための情報には、伝送するスケーリングリスト(若しくは、スケーリングリスト(量子化行列)とその予測行列との差分行列)の最大サイズを示す識別情報を含み得る。
可逆符号化部16は、量子化データについて可逆符号化処理を行うことにより、符号化ストリームを生成する。可逆符号化部16による可逆符号化は、例えば、可変長符号化または算術符号化等であってよい。また、可逆符号化部16は、スケーリングリストを生成するための情報を、符号化ストリームのヘッダ(例えばシーケンスパラメータセットおよびピクチャパラメータセット)内に多重化する。さらに、可逆符号化部16は、上述したイントラ予測またはインター予測に関する情報を、符号化ストリームのヘッダ内に多重化する。そして、可逆符号化部16は、生成した符号化ストリームを蓄積バッファ17へ出力する。
蓄積バッファ17は、可逆符号化部16から入力される符号化ストリームを半導体メモリ等の記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ17は、蓄積した符号化ストリームを、伝送路(または画像符号化装置10からの出力線)の帯域に応じたレートで出力する。
レート制御部18は、蓄積バッファ17の空き容量を監視する。そして、レート制御部18は、蓄積バッファ17の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を直交変換・量子化部14へ出力する。例えば、レート制御部18は、蓄積バッファ17の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部18は、蓄積バッファ17の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。
逆量子化部21は、直交変換・量子化部14から入力される量子化データについて逆量子化処理を行う。そして、逆量子化部21は、逆量子化処理により取得される変換係数データを、逆直交変換部22へ出力する。
逆直交変換部22は、逆量子化部21から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部22は、復元した予測誤差データを加算部23へ出力する。
加算部23は、逆直交変換部22から入力される復元された予測誤差データとモード選択部50から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部23は、生成した復号画像データをデブロックフィルタ24およびフレームメモリ25へ出力する。
デブロックフィルタ24は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ24は、加算部23から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し(または少なくとも減少し)、フィルタリング後の復号画像データをフレームメモリ25へ出力する。
フレームメモリ25は、加算部23から入力される復号画像データ、および、デブロックフィルタ24から入力されるフィルタリング後の復号画像データを、記憶媒体を用いて記憶する。
セレクタ26は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部30に供給する。また、セレクタ26は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとして動き探索部40に供給する。
イントラ予測部30は、並べ替えバッファ12から入力される符号化対象の画像データ、および、セレクタ26を介して供給される復号画像データに基づいて、各イントラ予測モードのイントラ予測処理を行う。例えば、イントラ予測部30は、各イントラ予測モードによる予測結果を所定のコスト関数を用いて評価する。そして、イントラ予測部30は、コスト関数値が最小となるイントラ予測モード、即ち圧縮率が最も高くなるイントラ予測モードを、最適なイントラ予測モードとして選択する。さらに、イントラ予測部30は、当該最適なイントラ予測モードを示す予測モード情報、予測画像データ、およびコスト関数値などのイントラ予測に関する情報を、モード選択部50へ出力する。
動き探索部40は、並べ替えバッファ12から入力される符号化対象の画像データ、および、セレクタ26を介して供給される復号画像データに基づいて、インター予測処理(フレーム間予測処理)を行う。例えば、動き探索部40は、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、動き探索部40は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、動き探索部40は、当該最適な予測モードに従って予測画像データを生成する。そして、動き探索部40は、選択した最適な予測モードを表す予測モード情報を含むインター予測に関する情報、予測画像データ、および、コスト関数値等のインター予測に関する情報を、モード選択部50へ出力する。
モード選択部50は、イントラ予測部30から入力されるイントラ予測に関するコスト関数値と動き探索部40から入力されるインター予測に関するコスト関数値とを比較する。そして、モード選択部50は、イントラ予測およびインター予測のうちコスト関数値がより少ない予測手法を選択する。モード選択部50は、イントラ予測を選択した場合、イントラ予測に関する情報を可逆符号化部16へ出力するとともに、予測画像データを減算部13および加算部23へ出力する。また、モード選択部50は、インター予測を選択した場合、インター予測に関する上述した情報を可逆符号化部16へ出力するとともに、予測画像データを減算部13および加算部23へ出力する。
<2−3.直交変換・量子化部の構成例>
図15は、図14に示した画像符号化装置10の直交変換・量子化部14の詳細な構成の一例を示すブロック図である。図15を参照すると、直交変換・量子化部14は、選択部110、直交変換部120、量子化部130、スケーリングリストバッファ140、および行列処理部150を有する。
(1)選択部
選択部110は、サイズの異なる複数の変換単位から、符号化される画像データの直交変換のために使用される変換単位(TU)を選択する。選択部110により選択され得る変換単位のサイズの候補は、例えば、H.264/AVC(Advanced Video Coding)では4x4および8x8を含み、HEVC(High Efficiency Video Coding)では4x4、8x8、16x16及び32x32を含む。選択部110は、例えば、符号化される画像のサイズ若しくは画質、または、画像符号化装置10の性能等に応じていずれかの変換単位を選択してよい。選択部110による変換単位の選択は、画像符号化装置10を開発するユーザによってハンドチューニングされてもよい。そして、選択部110は、選択した変換単位のサイズを指定する情報を、直交変換部120、量子化部130、可逆符号化部16、および逆量子化部21へ出力する。
(2)直交変換部
直交変換部120は、選択部110により選択された変換単位で、減算部13から供給される画像データ(即ち、予測誤差データ)を直交変換する。直交変換部120により実行される直交変換は、例えば、離散コサイン変換(DCT(Discrete Cosine Transform))またはカルーネン・レーベ変換などであってよい。そして、直交変換部120は、直交変換処理により取得される変換係数データを量子化部130へ出力する。
(3)量子化部
量子化部130は、選択部110により選択された変換単位に対応するスケーリングリストを用いて、直交変換部120により生成された変換係数データを量子化する。また、量子化部130は、レート制御部18からのレート制御信号に基づいて量子化ステップサイズを切り替えることにより、出力される量子化データのビットレートを変化させる。
また、量子化部130は、選択部110により選択され得る複数の変換単位にそれぞれ対応するスケーリングリストのセットを、スケーリングリストバッファ140に記憶させる。例えば、HEVCのように4x4、8x8、16x16及び32x32という4種類のサイズの変換単位の候補が存在する場合、これら4種類のサイズにそれぞれ対応する4種類のスケーリングリストのセットが、スケーリングリストバッファ140により記憶され得る。なお、あるサイズについて既定のスケーリングリストが使用される場合、既定のスケーリングリストが使用されること(ユーザにより定義されたスケーリングリストを使用しないこと)を示すフラグのみが、当該サイズと関連付けてスケーリングリストバッファ140により記憶されるようにしてもよい。
量子化部130により使用される可能性のあるスケーリングリストのセットは、典型的には、符号化ストリームのシーケンス毎に設定され得る。また、量子化部130は、シーケンス毎に設定したスケーリングリストのセットを、ピクチャ毎に更新してもよい。このようなスケーリングリストのセットの設定および更新を制御するための情報は、例えば、シーケンスパラメータセットおよびピクチャパラメータセットに挿入され得る。
(4)スケーリングリストバッファ
スケーリングリストバッファ140は、半導体メモリなどの記憶媒体を用いて、選択部110により選択され得る複数の変換単位にそれぞれ対応するスケーリングリストのセットを一時的に記憶する。スケーリングリストバッファ140により記憶されるスケーリングリストのセットは、次に説明する行列処理部150による処理に際して参照される。
(5)行列処理部
行列処理部150は、符号化(量子化)に用いられるスケーリングリストの符号化を行う。そして、行列処理部150により生成されたスケーリングリストの符号化データ(以下において、スケーリングリスト符号化データと称する)は、可逆符号化部16へ出力され、符号化ストリームのヘッダ内に挿入され得る。
<2−4.行列処理部の詳細な構成例>
図16は、行列処理部150のさらに詳細な構成の一例を示すブロック図である。図16を参照すると、行列処理部150は、予測部161、差分行列生成部162、差分行列サイズ変換部163、エントロピ符号化部164、復号部165、および出力部166を有する。
(1)予測部
予測部161は、予測行列を生成する。図16に示されるように、予測部161は、コピー部171および予測行列生成部172を有する。
コピーモードの場合、コピー部171は、過去に伝送したスケーリングリストを複製し、それを予測行列とする(処理対象の直交変換単位のスケーリングリストを予測する)。より具体的には、コピー部171は、過去に伝送したスケーリングリストのサイズとリストID(ListID)を復号部165の記憶部202から取得する。サイズは、スケーリングリストの大きさ(例えば4x4乃至32x32等)を示す情報である。リストIDは、量子化の対象となる予測誤差データの種類を示す情報である。
例えば、リストIDは、その量子化対象が、イントラ予測された予測画像を用いて生成される輝度成分の予測誤差データ(IntraLuma)であるか、イントラ予測された予測画像を用いて生成される色差成分(Cr)の予測誤差データ(IntraCr)であるか、イントラ予測された予測画像を用いて生成される色差成分(Cb)の予測誤差データ(IntraCb)であるか、若しくは、インター予測された予測画像を用いて生成される輝度成分の予測誤差データ(InterLuma)であるかを示す識別情報を含む。
コピー部171は、行列処理部150に入力されたスケーリングリスト(処理対象の直交変換単位のスケーリングリスト)と同じサイズの過去に伝送したスケーリングリストを複製対象として選択し、その複製対象とするスケーリングリストのリストIDを出力部166に供給し、行列処理部150の外部(可逆符号化部16や逆量子化部21)に出力させる。つまり、この場合、過去に伝送したスケーリングリストを複製して生成した予測行列を示す情報として、ListIDのみが復号側に伝送される(符号化データに含められる)ので、画像符号化装置10は、スケーリングリストの符号量の増大を抑制することができる。
また通常の場合、予測行列生成部172は、過去に伝送したスケーリングリストを復号部165の記憶部202から取得し、そのスケーリングリストを用いて予測行列を生成する(処理対象の直交変換単位のスケーリングリストを予測する)。予測行列生成部172は、生成した予測行列を差分行列生成部162に供給する。
(2)差分行列生成部
差分行列生成部162は、予測部161(予測行列生成部172)から供給された予測行列と、行列処理部150に入力されるスケーリングリストとの差分である差分行列(残差行列)を生成する。図16に示されるように、差分行列生成部162は、予測行列サイズ変換部181、演算部182、および量子化部183を有する。
予測行列サイズ変換部181は、予測行列生成部172から供給される予測行列のサイズを、行列処理部150に入力されるスケーリングリストのサイズに合わせるように変換(以下、コンバートとも称する)する。
例えば、予測行列のサイズがスケーリングリストのサイズより大きい場合、予測行列サイズ変換部181は、予測行列を縮小変換(以下、ダウンコンバートとも称する)する。より具体的には、例えば、予測行列が16x16であり、スケーリングリストが8x8の場合、予測行列サイズ変換部181は、予測行列を8x8にダウンコンバートする。なお、このダウンコンバートの方法は、任意である。例えば、予測行列サイズ変換部181が、フィルタを用いて(演算により)予測行列の要素の数を減らすようにしてもよい(以下、ダウンサンプルとも称する)。また、例えば図17に示されるように、予測行列サイズ変換部181が、フィルタを用いずに、一部の要素(例えば、2次元の要素の偶数部分(図17の黒部分)のみ)を間引くことにより、予測行列の要素の数を減らすようにしてもよい(以下、サブサンプルとも称する)。
また、例えば、予測行列のサイズがスケーリングリストのサイズより小さい場合、予測行列サイズ変換部181は、予測行列を拡大変換(以下、アップコンバートとも称する)する。より具体的には、例えば、予測行列が8x8であり、スケーリングリストが16x16の場合、予測行列サイズ変換部181は、予測行列を16x16にアップコンバートする。なお、このアップコンバートの方法は、任意である。例えば、予測行列サイズ変換部181が、フィルタを用いて(演算により)予測行列の要素の数を増やすようにしてもよい(以下、アップサンプルとも称する)。また、例えば、予測行列サイズ変換部181が、フィルタを用いずに、予測行列の各要素を複製することにより、予測行列の要素の数を増やすようにしてもよい(以下、逆サブサンプルとも称する)。
予測行列サイズ変換部181は、サイズをスケーリングリストに合わせた予測行列を演算部182に供給する。
演算部182は、予測行列サイズ変換部181から供給される予測行列から、行列処理部150に入力されたスケーリングリストを減算し、差分行列(残差行列)を生成する。演算部182は、算出した差分行列を量子化部183に供給する。
量子化部183は、演算部182から供給された差分行列を量子化する。量子化部183は、その差分行列の量子化結果を、差分行列サイズ変換部163に供給する。また、量子化部183は、この量子化に用いた量子化パラメータ等の情報を、出力部166に供給し、行列処理部150の外部(可逆符号化部16や逆量子化部21)に出力させる。なお、この量子化部183を省略する(つまり、差分行列の量子化を行わない)ようにしてもよい。
(3)差分行列サイズ変換部
差分行列サイズ変換部163は、差分行列生成部162(量子化部183)から供給される差分行列(量子化データ)のサイズを、必要に応じて、伝送の際に許容される最大サイズ(以下、伝送サイズとも称する)以下にコンバートする。この最大サイズは、任意であるが、例えば、8x8である。
画像符号化装置10から出力される符号化データは、例えば、伝送路や記憶媒体を介して、画像符号化装置10に対応する画像復号装置に伝送され、その画像復号装置により復号される。画像符号化装置10においては、このような伝送における、すなわち、画像符号化装置10から出力される符号化データにおける、差分行列(量子化データ)のサイズの上限(最大サイズ)が設定されている。
差分行列サイズ変換部163は、差分行列のサイズが、この最大サイズより大きい場合、最大サイズ以下となるように、差分行列をダウンコンバートする。
なお、このダウンコンバートの方法は、上述した予測行列のダウンコンバートの場合と同様に任意である。例えば、フィルタ等を用いるダウンサンプルであってもよいし、要素を間引くサブサンプルであってもよい。
また、ダウンコンバート後の差分行列のサイズは、最大サイズより小さければどのサイズであってもよい。ただし、一般的には、コンバート前後のサイズ差が大きいほど誤差が大きくなるので、最大サイズにダウンコンバートするのが望ましい。
差分行列サイズ変換部163は、ダウンコンバートした差分行列を、エントロピ符号化部164に供給する。なお、差分行列のサイズが最大サイズより小さい場合、このダウンコンバートは不要であるので、差分行列サイズ変換部163は、入力された差分行列をそのままエントロピ符号化部164に供給する(つまり、ダウンコンバートが省略される)。
(4)エントロピ符号化部
エントロピ符号化部164は、差分行列サイズ変換部163から供給された差分行列(量子化データ)を所定の方法で符号化する。図16に示されるようにエントロピ符号化部164は、重複判定部(135degree部)191、DPCM(Differential Pulse Code Modulation)部192、およびexpG部193を有する。
重複判定部191は、差分行列サイズ変換部163から供給された差分行列の対称性を判定し、その残差(差分行列)が135度の対称行列である場合、例えば図18に示されるように、重複しているデータである対称部分のデータ(行列要素)を削除する。残差が135度の対称行列でない場合、重複判定部191は、このデータ(行列要素)の削除を省略する。重複判定部191は、必要に応じて対称部分が削除された差分行列のデータを、DPCM部192に供給する。
DPCM部192は、重複判定部191から供給された、必要に応じて対称部分が削除された差分行列のデータをDPCM符号化し、DPCMデータを生成する。DPCM部192は、生成したDPCMデータを、expG部193に供給する。
expG部193は、DPCM部192から供給されるDPCMデータに対して、符号つき・符号なしのexponential golomb符号(以下、指数ゴロム符号とも称する)を行う。expG部193は、その符号化結果を復号部165および出力部166に供給する。
(5)復号部
復号部165は、expG部193から供給されるデータから、スケーリングリストを復元する。復号部165は、復元したスケーリングリストに関する情報を、過去に伝送したスケーリングリストとして、予測部161に供給する。
図16に示されるように、復号部165は、スケーリングリスト復元部201および記憶部202を有する。
スケーリングリスト復元部201は、エントロピ符号化部164(expG部193)から供給される指数ゴロム符号を復号し、行列処理部150に入力されるスケーリングリストを復元する。例えば、スケーリングリスト復元部201は、指数ゴロム符号をエントロピ符号化部164の符号化方法に対応する方法で復号し、差分行列サイズ変換部163によるサイズ変換の逆変換を行い、量子化部183による量子化に対応する逆量子化を行い、得られた差分行列を、予測行列から減算することにより、スケーリングリストを復元する。
スケーリングリスト復元部201は、復元したスケーリングリストを記憶部202に供給し、そのサイズやリストIDと関連付けて記憶させる。
記憶部202は、スケーリングリスト復元部201から供給されるスケーリングリストに関する情報を記憶する。この記憶部202に記憶されるスケーリングリストに関する情報は、時間的に後に処理される他の直交変換単位の予測行列生成に利用される。つまり、記憶部202は、記憶しているスケーリングリストに関する情報を、過去に伝送したスケーリングリストに関する情報として、予測部161に供給する。
なお、記憶部202は、このように復元されたスケーリングリストに関する情報を記憶する代わりに、行列処理部150に入力されるスケーリングリストを、そのサイズやリストIDと関連付けて記憶するようにしてもよい。その場合、スケーリングリスト復元部201を省略することができる。
(6)出力部
出力部166は、供給される各種情報を行列処理部150の外部に出力する。例えば、コピーモードの場合、出力部166は、コピー部171から供給される予測行列のリストIDを、可逆符号化部16および逆量子化部21に供給する。また、例えば、通常の場合、出力部166は、expG部193から供給される指数ゴロム符号、および、量子化部183から供給される量子化パラメータを、可逆符号化部16および逆量子化部21に供給する。
また、出力部166は、スケーリングリスト(若しくは、スケーリングリストとその予測行列との差分行列)の伝送の際に許容される最大サイズ(伝送サイズ)を示す識別情報を、復号側でスケーリングリストを生成するための情報として可逆符号化部16に供給する。可逆符号化部16は、上述したように、そのスケーリングリストを生成するための情報を符号化ストリームに含め、復号側に提供する。なお、この伝送サイズを示す識別情報をレベルやプロファイル等によって予め規定するようにしてもよい。その場合、その伝送サイズに関する情報が、符号化側の装置と復号側の装置とで予め共有されるので、上述した識別情報の伝送を省略することができる。
<2−5.DPCM部の詳細な構成例>
図19は、DPCM部192のさらに詳細な構成の一例を示すブロック図である。図19を参照すると、DPCM部192は、DC係数符号化部211およびAC係数DPCM部212を有する。
DC係数符号化部211は、重複判定部191から供給される係数群の中からDC係数を取得し、所定の初期値(例えば8)から、そのDC係数の値を減算し、その差分値を最初(i=0)の差分値(scaling_list_delta_coef)とする。DC係数符号化部211は、算出した差分値(scaling_list_delta_coef(i=0))を、処理中である当該領域に対応するスケーリングリストの最初の係数としてexpG部193に供給する。
AC係数DPCM部212は、重複判定部191から供給される係数群の中からAC係数を取得し、1つ前に処理された係数から、そのAC係数の値を減算し、その差分値(scaling_list_delta_coef(i>0))とする。AC係数DPCM部212は、算出した差分値(scaling_list_delta_coef(i>0))を、処理中である当該領域に対応するスケーリングリストの係数としてexpG部193に供給する。なお、i=1の場合、1つ前の係数はi=0であるので、「DC係数」が1つ前に処理された係数となる。
このようにして、DPCM部192は、DC係数をスケーリングリスト(AC係数)の先頭の要素として伝送することができる。これにより、スケーリングリストの符号化効率を向上させることができる。
<2−6.量子化行列符号化処理の流れ>
次に、図20のフローチャートを参照して、図16の行列処理部150により実行される量子化行列符号化処理の流れの例を説明する。
量子化行列符号化処理が開始されると、ステップS101において、予測部161は、処理対象の直交変換単位であるカレント領域(注目領域とも称する)のスケーリングリスト(量子化行列)を取得する。
ステップS102において、予測部161は、コピーモードであるか否かを判定する。コピーモードでないと判定した場合、予測部161は、処理をステップS103に進める。
ステップS103において、予測行列生成部172は、過去に伝送されたスケーリングリストを、記憶部202から取得し、そのスケーリングリストを用いて、予測行列を生成する。
ステップS104において、予測行列サイズ変換部181は、ステップS103において生成された予測行列のサイズが、ステップS101において取得されたカレント領域(注目領域)のスケーリングリストと異なるか否かを判定する。サイズが異なると判定した場合、予測行列サイズ変換部181は、処理をステップS105に進める。
ステップS105において、予測行列サイズ変換部181は、ステップS103において生成された予測行列のサイズを、ステップS101において取得されたカレント領域のスケーリングリストのサイズにコンバートする。
ステップS105の処理が終了すると、予測行列サイズ変換部181は、処理をステップS106に進める。また、ステップS104において、予測行列のサイズとスケーリングリストのサイズが同一であると判定した場合、予測行列サイズ変換部181は、ステップS105の処理を省略し(ステップS105の処理を行わずに)、処理をステップS106に進める。
ステップS106において、演算部182は、予測行列からスケーリングリストを減算し、予測行列とスケーリングリストの差分行列を算出する。
ステップS107において、量子化部183は、ステップS106において生成された差分行列を量子化する。なお、この処理は省略するようにしてもよい。
ステップS108において、差分行列サイズ変換部163は、量子化された差分行列のサイズが伝送サイズ(伝送の際に許容される最大サイズ)より大きいか否かを判定する。伝送サイズより大きいと判定した場合、差分行列サイズ変換部163は、処理をステップS109に進め、差分行列を伝送サイズ以下にダウンコンバートする。
ステップS109の処理を終了すると、差分行列サイズ変換部163は、処理をステップS110に進める。また、ステップS108において、量子化された差分行列のサイズが伝送サイズ以下であると判定した場合、差分行列サイズ変換部163は、ステップS109の処理を省略し(ステップS109の処理を行わずに)、処理をステップS110に進める。
ステップS110において、重複判定部191は、量子化された差分行列が、135度の対称性を有するか否かを判定する。135度の対称性を有すると判定した場合、重複判定部191は、処理をステップS111に進める。
ステップS111において、重複判定部191は、量子化された差分行列の重複部分(重複データ)を削除する。重複データを削除すると、重複判定部191は、処理をステップS112に進める。
また、ステップS110において、量子化された差分行列が135度の対称性を有さないと判定した場合、重複判定部191は、ステップS111の処理を省略し(ステップS111の処理を行わずに)、処理をステップS112に進める。
ステップS112において、DPCM部192は、適宜重複部分が削除された差分行列をDPCM符号化する。
ステップS113において、expG部193は、ステップS112において生成されたDPCMデータに、正負を表す符号が存在するか否かを判定する。符号が存在すると判定した場合、expG部193は、処理をステップS114に進める。
ステップS114において、expG部193は、DPCMデータに対して、符号付きの指数ゴロム符号化を行う。出力部166は、生成された指数ゴロム符号を、可逆符号化部16および逆量子化部21に出力する。ステップS114の処理が終了すると、expG部193は、処理をステップS116に進める。
また、ステップS113において、符号が存在しないと判定した場合、expG部193は、処理をステップS115に進める。
ステップS115において、expG部193は、DPCMデータに対して、符号無しの指数ゴロム符号化を行う。出力部166は、生成された指数ゴロム符号を、可逆符号化部16および逆量子化部21に出力する。ステップS115の処理が終了すると、expG部193は、処理をステップS116に進める。
また、ステップS102において、コピーモードであると判定した場合、コピー部171は、過去に伝送されたスケーリングリストを複製してそれを予測行列とする。出力部166は、その予測行列に対応するリストIDを、予測行列を示す情報として、可逆符号化部16および逆量子化部21に出力する。そして、コピー部171は、処理をステップS116に進める。
ステップS116において、スケーリングリスト復元部201は、スケーリングリストを復元する。ステップS117において、記憶部202は、ステップS116において復元されたスケーリングリストを記憶する。
ステップS117の処理が終了すると、行列処理部150は、量子化行列符号化処理を終了する。
<2−7.DPCM処理の流れ>
次に、図21のフローチャートを参照して、図20のステップS112において実行されるDPCM処理の流れの例を説明する。
DPCM処理が開始されると、DC係数符号化部211は、ステップS131において、DC係数と定数の差分を求める。ステップS132において、AC係数DPCM部212は、DC係数と最初のAC係数との差分を求める。
ステップS133において、AC係数DPCM部212は、全てのAC係数を処理したか否かを判定する。未処理のAC係数が存在すると判定した場合、AC係数DPCM部212は、処理をステップS134に進める。
ステップS134において、AC係数DPCM部212は、次のAC係数を処理対象とする。ステップS135において、AC係数DPCM部212は、前回処理したAC係数と処理対象のAC係数との差分を求める。ステップS135の処理が終了すると、AC係数DPCM部212は、処理をステップS133に戻す。
このように、ステップS133において、未処理のAC係数が存在すると判定される間、AC係数DPCM部212は、ステップS133乃至ステップS135の処理を繰り返し実行する。ステップS133において、未処理のAC係数が存在しないと判定された場合、AC係数DPCM部212は、DPCM処理を終了し、処理を図20に戻す。
以上のように、DC係数と、AC係数群の先頭のAC係数との差分を求め、その差分をDC係数の代わりに、画像復号装置に伝送することにより、画像符号化装置10は、スケーリングリストの符号量の増加を抑制することができる。
次に、本開示の一実施形態に係る画像復号装置の構成例について説明する。
<2−8.画像復号装置>
図22は、本開示の一実施形態に係る画像復号装置300の構成の一例を示すブロック図である。図22に示される画像復号装置300は、画像符号化装置10により生成された符号化データを復号する、本技術を適用した画像処理装置である。図22を参照すると、画像復号装置300は、蓄積バッファ311、可逆復号部312、逆量子化・逆直交変換部313、加算部315、デブロックフィルタ316、並べ替えバッファ317、D/A(Digital to Analogue)変換部318、フレームメモリ319、セレクタ320及び321、イントラ予測部330、並びに動き補償部340を有する。
蓄積バッファ311は、伝送路を介して入力される符号化ストリームを、記憶媒体を用いて一時的に蓄積する。
可逆復号部312は、蓄積バッファ311から入力される符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。また、可逆復号部312は、符号化ストリームのヘッダ領域に多重化されている情報を復号する。符号化ストリームのヘッダ領域に多重化されている情報とは、例えば、上述したスケーリングリストを生成するための情報、並びに、ブロックヘッダ内のイントラ予測に関する情報およびインター予測に関する情報を含み得る。可逆復号部312は、復号後の量子化データおよびスケーリングリストを生成するための情報を、逆量子化・逆直交変換部313へ出力する。また、可逆復号部312は、イントラ予測に関する情報をイントラ予測部330へ出力する。また、可逆復号部312は、インター予測に関する情報を動き補償部340へ出力する。
逆量子化・逆直交変換部313は、可逆復号部312から入力される量子化データについて逆量子化および逆直交変換を行うことにより、予測誤差データを生成する。そして、逆量子化・逆直交変換部313は、生成した予測誤差データを加算部315へ出力する。
加算部315は、逆量子化・逆直交変換部313から入力される予測誤差データと、セレクタ321から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部315は、生成した復号画像データをデブロックフィルタ316およびフレームメモリ319へ出力する。
デブロックフィルタ316は、加算部315から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並べ替えバッファ317およびフレームメモリ319へ出力する。
並べ替えバッファ317は、デブロックフィルタ316から入力される画像を並べ替えることにより、時系列の一連の画像データを生成する。そして、並べ替えバッファ317は、生成した画像データをD/A変換部318へ出力する。
D/A変換部318は、並べ替えバッファ317から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、D/A変換部318は、例えば、画像復号装置300と接続されるディスプレイ(図示せず)にアナログ画像信号を出力することにより、画像を表示させる。
フレームメモリ319は、加算部315から入力されるフィルタリング前の復号画像データ、および、デブロックフィルタ316から入力されるフィルタリング後の復号画像データを、記憶媒体を用いて記憶する。
セレクタ320は、可逆復号部312により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ319からの画像データの出力先をイントラ予測部330と動き補償部340との間で切り替える。例えば、セレクタ320は、イントラ予測モードが指定された場合、フレームメモリ319から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部330へ出力する。また、セレクタ320は、インター予測モードが指定された場合、フレームメモリ319から供給されるフィルタリング後の復号画像データを参照画像データとして動き補償部340へ出力する。
セレクタ321は、可逆復号部312により取得されるモード情報に応じて、画像内のブロックごとに、加算部315へ供給すべき予測画像データの出力元をイントラ予測部330と動き補償部340との間で切り替える。例えば、セレクタ321は、イントラ予測モードが指定された場合、イントラ予測部330から出力される予測画像データを加算部315へ供給する。セレクタ321は、インター予測モードが指定された場合、動き補償部340から出力される予測画像データを加算部315へ供給する。
イントラ予測部330は、可逆復号部312から入力されるイントラ予測に関する情報とフレームメモリ319からの参照画像データとに基づいて画素値の画面内予測を行い、予測画像データを生成する。そして、イントラ予測部330は、生成した予測画像データをセレクタ321へ出力する。
動き補償部340は、可逆復号部312から入力されるインター予測に関する情報とフレームメモリ319からの参照画像データとに基づいて動き補償処理を行い、予測画像データを生成する。そして、動き補償部340は、生成した予測画像データをセレクタ321へ出力する。
<2−9.逆量子化・逆直交変換部の構成例>
図23は、図22に示した画像復号装置300の逆量子化・逆直交変換部313の主な構成の一例を示すブロック図である。図23を参照すると、逆量子化・逆直交変換部313は、行列生成部410、選択部430、逆量子化部440、および逆直交変換部450を有する。
(1)行列生成部
行列生成部410は、可逆復号部312においてビットストリームから抽出され、供給されたスケーリングリスト符号化データを復号し、スケーリングリストを生成する。行列生成部410は、生成したスケーリングリストを逆量子化部440に供給する。
(2)選択部
選択部430は、サイズの異なる複数の変換単位から、復号される画像データの逆直交変換のために使用される変換単位(TU)を選択する。選択部430により選択され得る変換単位のサイズの候補は、例えば、H.264/AVCでは4x4および8x8を含み、HEVCでは4x4、8x8、16x16、および32x32を含む。選択部430は、例えば、符号化ストリームのヘッダ内に含まれるLCU、SCU、およびsplit_flagに基づいて、変換単位を選択してもよい。そして、選択部430は、選択した変換単位のサイズを指定する情報を、逆量子化部440および逆直交変換部450へ出力する。
(3)逆量子化部
逆量子化部440は、選択部430により選択された変換単位に対応するスケーリングリストを用いて、画像の符号化の際に量子化された変換係数データを逆量子化する。そして、逆量子化部440は、逆量子化した変換係数データを逆直交変換部450へ出力する。
(4)逆直交変換部
逆直交変換部450は、符号化の際に使用された直交変換方式に従い、逆量子化部440により逆量子化された変換係数データを上記選択された変換単位で逆直交変換することにより、予測誤差データを生成する。そして、逆直交変換部450は、生成した予測誤差データを加算部315へ出力する。
<2−10.行列生成部の詳細な構成例>
図24は、図23に示した行列生成部410の詳細な構成の一例を示すブロック図である。図24を参照すると、行列生成部410は、パラメータ解析部531、予測部532、エントロピ復号部533、スケーリングリスト復元部534、出力部535、および記憶部536を有する。
(1)パラメータ解析部
パラメータ解析部531は、可逆復号部312から供給される、スケーリングリストに関する各種フラグやパラメータを解析する。また、パラメータ解析部531は、その解析結果に従って、可逆復号部312から供給される、差分行列の符号化データ等、各種情報を予測部532またはエントロピ復号部533に供給する。
例えば、パラメータ解析部531は、pred_modeが0なら、コピーモードと判断し、pred_matrix_id_deltaをコピー部541に供給する。また、例えば、パラメータ解析部531は、pred_modeが1なら、全スキャンモード(通常の場合)と判断し、pred_matrix_id_deltaおよびpred_size_id_deltaを予測行列生成部542に供給する。
また、パラメータ解析部531は、例えばresidual_flagがtrueである場合、可逆復号部312から供給されるスケーリングリストの符号化データ(指数ゴロム符号)をエントロピ復号部533のexpG部551に供給する。さらに、パラメータ解析部531は、residual_symmetry_flagをexpG部551に供給する。
さらに、パラメータ解析部531は、residual_down_sampling_flagをスケーリングリスト復元部534の差分行列サイズ変換部562に供給する。
(2)予測部
予測部532は、パラメータ解析部531の制御に従って、予測行列を生成する。図24に示されるように、予測部532は、コピー部541および予測行列生成部542を有する。
コピー部541は、コピーモードの場合、過去に伝送されたスケーリングリストを複製し、それを予測行列とする。より具体的には、コピー部541は、pred_matrix_id_deltaに対応する、カレント領域のスケーリングリストと同一サイズの、過去に伝送されたスケーリングリストを記憶部536から読み出し、そのスケーリングリストを予測画像とし、その予測画像を出力部535に供給する。
予測行列生成部542は、通常の場合、過去に伝送されたスケーリングリストを用いて予測行列を生成する(予測する)。より具体的には、予測行列生成部542は、pred_matrix_id_deltaおよびpred_size_id_deltaに対応する過去に伝送されたスケーリングリストを記憶部536から読み出し、それを用いて予測行列を生成する。つまり、予測行列生成部542は、画像符号化装置10の予測行列生成部172(図16)が生成する予測行列と同様の予測行列を生成する。予測行列生成部542は、生成した予測行列をスケーリングリスト復元部534の予測行列サイズ変換部561に供給する。
(3)エントロピ復号部
エントロピ復号部533は、パラメータ解析部531から供給される指数ゴロム符号から差分行列を復元する。図24に示されるように、エントロピ復号部533は、expG部551、逆DPCM部552、および逆重複判定部553を有する。
expG部551は、符号つき若しくは符号なしのexponential golomb復号(以下、指数ゴロム復号とも称する)を行い、DPCMデータを復元する。expG部551は、復元したDPCMデータを、residual_symmetry_flagとともに、逆DPCM部552に供給する。
逆DPCM部552は、重複部分が削除されたデータに対してDPCM復号して、DPCMデータから残差データを生成する。逆DPCM部552は、生成した残差データを、residual_symmetry_flagとともに、逆重複判定部553に供給する。
逆重複判定部553は、residual_symmetry_flagがtrueである場合、すなわち、残差データが135度の対称行列の、重複する対称部分のデータ(行列要素)が削除されたものである場合、その対称部分のデータを復元する。つまり、135度の対称行列の差分行列が復元される。なお、residual_symmetry_flagがtrueで無い場合、すなわち、残差データが135度の対称行列でない行列である場合、逆重複判定部553は、対称部分のデータの復元を行わずに、その残差データを差分行列とする。逆重複判定部553は、このようにして復元した差分行列をスケーリングリスト復元部534(差分行列サイズ変換部562)に供給する。
(4)スケーリングリスト復元部
スケーリングリスト復元部534は、スケーリングリストを復元する。図24に示されるように、スケーリングリスト復元部534は、予測行列サイズ変換部561、差分行列サイズ変換部562、逆量子化部563、および演算部564を有する。
予測行列サイズ変換部561は、予測部532(予測行列生成部542)から供給される予測行列のサイズが、復元されるカレント領域のスケーリングリストのサイズと異なる場合、その予測行列のサイズをコンバートする。
例えば、予測行列のサイズがスケーリングリストのサイズより大きい場合、予測行列サイズ変換部561は、予測行列をダウンコンバートする。また、例えば、予測行列のサイズがスケーリングリストのサイズより小さい場合、予測行列サイズ変換部561は、予測行列をアップコンバートする。コンバートの方法は、画像符号化装置10の予測行列サイズ変換部181(図16)と同一の方法が選択される。
予測行列サイズ変換部561は、サイズをスケーリングリストに合わせた予測行列を演算部564に供給する。
差分行列サイズ変換部562は、residual_down_sampling_flagがtrueの場合、すなわち、伝送された差分行列のサイズが逆量子化するカレント領域のサイズより小さい場合、その差分行列のサイズを逆量子化するカレント領域に応じたサイズにアップコンバートする。アップコンバートの方法は、任意である。例えば、画像符号化装置10の差分行列サイズ変換部163(図16)が行ったダウンコンバートの方法に対応するようにしてもよい。
例えば、差分行列サイズ変換部163が、差分行列をダウンサンプルした場合、差分行列サイズ変換部562は、その差分行列をアップサンプルするようにしてもよい。また、差分行列サイズ変換部163が、差分行列をサブサンプルした場合、差分行列サイズ変換部562は、その差分行列を逆サブサンプルするようにしてもよい。
例えば、差分行列サイズ変換部562は、一般的な線形補間ではなく、図25に示されるように、最近傍補間処理(nearest neighbor)で補間するようにしてもよい。この最近傍補間処理を用いることにより、保持するメモリを低減させることができる。
これにより、サイズの大きなスケーリングリストを伝送しない場合でも、サイズの小さなスケーリングリストからアップサンプリングする際に、アップサンプリング後のデータを保持する必要がなくなり、アップサンプリングする際の演算に伴うデータを格納する際にも、中間バッファ等も不要となる。
なお、residual_down_sampling_flagがtrueでない場合、すなわち、差分行列が量子化処理に用いられたときのサイズで伝送される場合、差分行列サイズ変換部562は、差分行列のアップコンバートを省略する(若しくは、1倍のアップコンバートを行うようにしてもよい)。
差分行列サイズ変換部562は、このように必要に応じてアップコンバートした差分行列を、逆量子化部563に供給する。
逆量子化部563は、画像符号化装置10の量子化部183(図16)の量子化に対応する方法で、供給された差分行列(量子化データ)を逆量子化し、逆量子化された差分行列を演算部564に供給する。なお、量子化部183が省略される場合、すなわち、差分行列サイズ変換部562から供給される差分行列が量子化データでない場合、この逆量子化部563を省略することができる。
演算部564は、予測行列サイズ変換部561から供給される予測行列と、逆量子化部563から供給される差分行列とを加算し、カレント領域のスケーリングリストを復元する。演算部564は、復元したスケーリングリストを出力部535および記憶部536に供給する。
(5)出力部
出力部535は、供給される情報を行列生成部410の外部に出力する。例えば、コピーモードの場合、出力部535は、コピー部541から供給される予測行列をカレント領域のスケーリングリストとして、逆量子化部440に供給する。また、例えば、通常の場合、出力部535は、スケーリングリスト復元部534(演算部564)から供給されるカレント領域のスケーリングリストを、逆量子化部440に供給する。
(6)記憶部
記憶部536は、スケーリングリスト復元部534(演算部564)から供給されるスケーリングリストを、そのサイズやリストIDとともに記憶する。この記憶部536に記憶されるスケーリングリストに関する情報は、時間的に後に処理される他の直交変換単位の予測行列生成に利用される。つまり、記憶部536は、記憶しているスケーリングリストに関する情報を、過去に伝送されたスケーリングリストに関する情報として、予測部532に供給する。
<2−11.逆DPCM部の詳細な構成例>
図26は、図24に示した逆DPCM部552の詳細な構成の一例を示すブロック図である。図26を参照すると、逆DPCM部552は、初期設定部571、DPCM復号部572、およびDC係数抽出部573を有する。
初期設定部571は、sizeIDやMatrixIDを取得したり、各種変数に初期値を設定したりする。初期設定部571は、取得したり、設定したりした情報をDPCM復号部572に供給する。
DPCM復号部572は、初期設定部571から供給された初期設定等を用いて、DC係数やAC係数の差分値(scaling_list_delta_coef)から、各係数(DC係数および各AC係数)を求める。DPCM復号部572は、求めた各係数をDC係数抽出部573に供給する(ScalingList[i])。
DC係数抽出部573は、DPCM復号部572から供給された係数群(ScalingList[i])の中からDC係数を抽出する。DC係数は、AC係数群の先頭に配置されている。つまり、DPCM復号部572から供給された係数群の最初の係数(ScalingList[0])がDC係数である。DC係数抽出部573は、先頭の係数をDC係数として抽出し、逆重複判定部553に出力する(DC_coef)。DC係数抽出部573は、その他の係数(ScalingList[i](i>0))をAC係数として逆重複判定部553に出力する。
このようにすることにより、逆DPCM部552は、正しくDPCM復号することができ、DC係数やAC係数を得ることができる。つまり、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<2−12.量子化行列復号処理の流れ>
図27のフローチャートを参照して、以上のような行列生成部410により実行される量子化行列復号処理の流れの例を説明する。
量子化行列復号処理が開始されると、ステップS301において、パラメータ解析部531は、領域0乃至領域3の量子化値(Qscale0乃至Qscale3)を読み込む。
パラメータ解析部531は、ステップS302において、pred_modeを読み込み、ステップS303において、pred_modeが0であるか否かを判定する。pred_modeが0であると判定した場合、パラメータ解析部531は、コピーモードと判定し、処理をステップS304に進める。
ステップS304において、パラメータ解析部531は、pred_matrix_id_deltaを読み込む。ステップS305において、コピー部541は、伝送済みのスケーリングリストを複製し、予測行列とする。コピーモードの場合、その予測行列がカレント領域のスケーリングリストとして出力される。ステップS305の処理が終了すると、コピー部541は、量子化行列復号処理を終了する。
また、ステップS303において、pred_modeが0でないと判定した場合、パラメータ解析部531は、全スキャンモード(通常の場合)と判定し、処理をステップS306に進める。
ステップS306において、パラメータ解析部531は、pred_matrix_id_delta、pred_size_id_delta、およびresidual_flagを読み込む。ステップS307において、予測行列生成部542は、伝送済みのスケーリングリストから予測行列を生成する。
ステップS308において、パラメータ解析部531は、residual_flagがtrueであるか否かを判定する。residual_flagがtrueでないと判定された場合、残差行列が存在しないので、ステップS307において生成された予測行列が、カレント領域のスケーリングリストとして出力される。したがって、この場合、パラメータ解析部531は、量子化行列復号処理を終了する。
また、ステップS308において、residual_flagがtrueであると判定した場合、パラメータ解析部531は、処理をステップS309に進める。
ステップS309において、パラメータ解析部531は、residual_down_sampling_flagおよびresidual_symmetry_flagを読み込む。
ステップS310において、expG部551および逆DPCM部552は、残差行列の指数ゴロム符号を復号し、残差データを生成する。
ステップS311において、逆重複判定部553は、residual_symmetry_flagがtrueであるか否かを判定する。residual_symmetry_flagがtrueであると判定した場合、逆重複判定部553は、処理をステップS312に進め、その残差データの、削除された重複部分を復元する(inverse symmetry処理を行う)。このようにして135度に対称行列な差分行列が生成されると、逆重複判定部553は、処理をステップS313に進める。
また、ステップS311において、residual_symmetry_flagがtrueでないと判定した場合(残差データが、135度に対称行列でない差分行列である場合)、逆重複判定部553は、ステップS312の処理を省略し(inverse symmetry処理を行わずに)、処理をステップS313に進める。
ステップS313において、差分行列サイズ変換部562は、residual_down_sampling_flagがtrueであるか否かを判定する。residual_down_sampling_flagがtrueであると判定した場合、差分行列サイズ変換部562は、処理をステップS314に進め、差分行列を、逆量子化するカレント領域に応じたサイズにアップコンバートする。差分行列をアップコンバートすると差分行列サイズ変換部562は、処理をステップS315に進める。
また、ステップS313において、residual_down_sampling_flagがtrueでないと判定した場合、差分行列サイズ変換部562は、ステップS314の処理を省略し(差分行列をアップコンバートせずに)、処理をステップS315に進める。
ステップS315において、演算部564は、予測行列に差分行列を加算し、カレント領域のスケーリングリストを生成する。ステップS315の処理が終了すると、量子化行列復号処理が終了される。
<2−13.残差信号復号処理の流れ>
次に、図27のステップS310において実行される残差信号復号処理の流れの例を、図28のフローチャートを参照して説明する。
残差信号復号処理が開始されると、expG部551は、ステップS331において、供給される指数ゴロム符号を復号する。
ステップS332において、逆DPCM部552は、expG部551において復号されて得られたDPCMデータに対して逆DPCM処理を行う。
逆DPCM処理が終了すると、逆DPCM部552は、残差信号復号処理を終了し、処理を図27に戻す。
<2−14.逆DPCM処理の流れ>
次に、図28のステップS332において実行される逆DPCM処理の流れの例を、図29のフローチャートを参照して説明する。
逆DPCM処理が開始されると、初期設定部571は、ステップS351において、sizeIDおよびMatrixIDを取得する。
ステップS352において、初期設定部571は、coefNumを以下のように設定する。
coefNum = min((1<<(4+(sizeID<<1))),65)
ステップS353において、初期設定部571は、変数iと変数nextcoefを以下のように設定する。
i = 0
nextcoef = 8
ステップS354において、DPCM復号部572は、変数i<coefNumであるか否かを判定する。変数iがcoefNumより小さい場合、初期設定部571は、処理をステップS355に進める。
ステップS355において、DPCM復号部572は、係数のDPCMデータ(scaling_list_delta_coef)を読み込む。
ステップS356において、DPCM復号部572は、読み込んだDPCMデータを用いて以下のようにnextcoefを求め、さらに、scalingList[i]を求める。
nextcoef = (nextcoef + scaling_list_delta_coef+256) % 256
scalingList[i] = nextcoef
ステップS357において、DC係数抽出部573は、sizeIDが1より大きく、かつ、変数iが0(すなわち、先頭の係数)であるか否かを判定する。sizeIDが1より大きく、かつ、先頭の係数であると判定した場合、DC係数抽出部573は、処理をステップS358に進め、その係数をDC係数とする(DC_coef = nextcoef)。ステップS358の処理を終了すると、DC係数抽出部573は、処理をステップS360に進める。
また、ステップS357において、DC係数抽出部573は、sizeIDが1以下である、若しくは、先頭の係数でないと判定した場合、処理をステップS359に進め、DC係数を抽出した分、各係数の変数iを1つずらす。(ScalingList[(i-(sizeID)>1)?1;0] = nextcoef)ステップS359の処理が終了すると、DC係数抽出部573は、処理をステップS360に進める。
ステップS360において、DPCM復号部572は、変数iをインクリメントし、処理の対象を次の係数に替え、処理をステップS354に戻す。
ステップS354において、変数iがcoefNum以上であると判定されるまで、ステップS354乃至ステップS360の処理が繰り返される。ステップS354において、変数iがcoefNum以上であると判定された場合、DPCM復号部572は、逆DPCM処理を終了し、処理を図28に戻す。
以上のようにすることにより、DC係数と、AC係数群の先頭のAC係数との差分を正しく復号することができるので、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<3.第3の実施の形態>
<3−1.シンタクス:方法2>
DC係数の代わりに、DC係数とその他の係数との差分を伝送する方法として、例えば、DC係数と8x8マトリクスの(0,0)成分の差分を、8x8マトリクスのDPCMデータとは別のDPCMデータとして伝送するようにしてもよい(方法2)。例えば、8x8マトリクスのDPCM伝送後、DC係数と8x8マトリクスの(0,0)成分の差分を伝送するようにしてもよい。
このようにすることにより、方法1の場合と同様に、8x8マトリクスの(0,0)係数(AC係数)とDC係数が近い値の場合に圧縮率をより向上させることができる。
方法2の場合の、スケーリングリストのシンタクスを、図30に示す。図30の例の場合、係数同士の差分値(scaling_list_delta_coef)が64個読み込まれ、最後にDC係数と(0,0)係数(AC係数)との差分(scaling_list_dc_coef_delta)が読み込まれ、その差分からDC係数が求められる。
したがって、方法2の場合、AC係数の復号についてのシンタクスを、図12に示される従来の場合と同様にすることができる。つまり、方法2のシンタクスは、従来の例からの変更を少なくすることができ、方法1の場合よりも実現が容易である。
ただし、画像復号装置は、方法2の場合、係数を全て受け取り、DPCMを全て解くまで、DC係数を得ることが出来ないのに対し、方法1の場合、最初の係数を受け取った時点でDC係数を復元する事が可能である。
このような方法2のシンタクスを実現する画像符号化装置について以下に説明する。
<3−2.DPCM部の詳細な構成例>
方法2の場合、画像符号化装置10の構成は、基本的に、上述した方法1の場合と同様である。すなわち、画像符号化装置10は、図14に示される例のように構成される。また、直交変換・量子化部14は、図15に示される例のように構成される。さらに、行列処理部150は、図16に示される例のように構成される。
この場合のDPCM部192の構成例を図31に示す。図31に示されるように、この場合、DPCM部192は、AC係数バッファ611、AC係数符号化部612、AC係数DPCM部613、およびDC係数DPCM部614を有する。
AC係数バッファ611は、重複判定部191から供給される最初のAC係数(つまり、(0,0)係数)を記憶する。AC係数バッファ611は、全てのAC係数をDPCM処理した後の所定のタイミングにおいて、若しくは要求に応じて、記憶している最初のAC係数(AC係数(0,0))を、DC係数DPCM部614に供給する。
AC係数符号化部612は、重複判定部191から供給される最初のAC係数(AC係数(0,0))を取得し、定数(例えば8)からその値を減算する。AC係数符号化部612は、その減算結果(差分)をAC係数のDPCMデータの最初の係数(scaling_list_delta_coef(i=0))として、expG部193に供給する。
AC係数DPCM部613は、重複判定部191から供給される各AC係数を取得し、2番目以降の各AC係数について、1つ前のAC係数との差分(DPCM)を求め、DPCMデータ(scaling_list_delta_coef(i=1〜63))として、expG部193に供給する。
DC係数DPCM部614は、重複判定部191から供給されるDC係数を取得する。また、DC係数DPCM部614は、AC係数バッファ611により保持されている最初のAC係数(AC係数(0,0))を取得する。DC係数DPCM部614は、DC係数から最初のAC係数(AC係数(0,0))を減算することによりそれらの差分を求め、その差分をDC係数のDPCMデータ(scaling_list_dc_coef_delta)として、expG部193に供給する。
以上のように、方法2においては、DC係数とその他の係数(最初のAC係数)との差分が求められる。そして、その差分が、AC係数のDPCMデータと異なる、DC係数のDPCMデータ(scaling_list_dc_coef_delta)として、AC係数同士の差分であるAC係数のDPCMデータ(scaling_list_delta_coef)伝送後に伝送される。このようにすることにより、画像符号化装置10は、方法1の場合と同様に、スケーリングリストの符号化効率を向上させることができる。
<3−3.DPCM処理の流れ>
方法2の場合も、画像符号化装置10は、量子化行列符号化処理を、図20のフローチャートを参照して説明した方法1の場合と同様に実行する。
図32のフローチャートを参照して、図20のステップS112において実行される、方法2の場合のDPCM処理の流れの例を説明する。
DPCM処理が開始されると、AC係数バッファ611は、ステップS401において、最初のAC係数を保持する。
ステップS402において、AC係数符号化部612は、所定の定数(例えば8)から最初のAC係数を減算し、その差分(最初のDPCMデータ)を求める。
ステップS403乃至ステップS405の各処理は、AC係数DPCM部613により、図21のステップS133乃至ステップS135の各処理と同様に実行される。すなわち、ステップS403乃至ステップS405の処理が繰り返し実行されることにより、全てのAC係数のDPCMデータ(1つ前のAC係数との差分)が生成される。
ステップS403において、全てのAC係数が処理された(つまり、未処理のAC係数が存在しない)と判定した場合、AC係数DPCM部613は、処理をステップS406に進める。
ステップS406において、DC係数DPCM部614は、DC係数から、ステップS401において保持された最初のAC係数を減算し、それらの差分(DC係数のDPCMデータ)を求める。
ステップS406の処理が終了すると、DC係数DPCM部614は、DPCM処理を終了し、処理を図20に戻す。
以上のように、DC係数についても、他の係数との差分を求め、それをDPCMデータとして画像復号装置に伝送することにより、画像符号化装置10は、スケーリングリストの符号量の増加を抑制することができる。
<3−4.逆DPCM部の詳細な構成例>
方法2の場合の画像復号装置300の構成は、基本的に、方法1の場合と同様である。つまり、方法2の場合も画像復号装置300は、図22に示される例のように構成される。また、逆量子化・逆直交変換部313は、図23に示される例のように構成される。さらに、行列生成部410は、図24に示される例のように構成される。
図33は、方法2の場合の、図24に示した逆DPCM部552の詳細な構成の一例を示すブロック図である。図33を参照すると、逆DPCM部552は、初期設定部621、AC係数DPCM復号部622、AC係数バッファ623、およびDC係数DPCM復号部624を有する。
初期設定部621は、sizeIDやMatrixIDを取得したり、各種変数に初期値を設定したりする。初期設定部621は、取得したり、設定したりした情報をAC係数DPCM復号部622に供給する。
AC係数DPCM復号部622は、expG部551から供給されるAC係数のDPCMデータ(scaling_list_delta_coef)を取得する。AC係数DPCM復号部622は、初期設定部621から供給された初期設定等を用いて、取得したAC係数のDPCMデータを復号し、AC係数を求める。AC係数DPCM復号部622は、求めた各AC係数(ScalingList[i])を逆重複判定部553に供給する。また、AC係数DPCM復号部622は、求めた、最初のAC係数(ScalingList[0]、すなわちAC係数(0,0))をAC係数バッファ623に供給し、保持させる。
AC係数バッファ623は、AC係数DPCM復号部622から供給される最初のAC係数(ScalingList[0]、すなわちAC係数(0,0))を記憶する。AC係数バッファ623は、その最初のAC係数(ScalingList[0]、すなわちAC係数(0,0))を、所定のタイミングにおいて、若しくは要求に応じて、DC係数DPCM復号部624に供給する。
DC係数DPCM復号部624は、expG部551から供給されるDC係数のDPCMデータ(scaling_list_dc_coef_delta)を取得する。また、DC係数DPCM復号部624は、AC係数バッファ623に記憶されている最初のAC係数(ScalingList[0]、すなわちAC係数(0,0))を取得する。DC係数DPCM復号部624は、その最初のAC係数を用いてDC係数のDPCMデータを復号し、DC係数を求める。DC係数DPCM復号部624は、求めたDC係数(DC_coef)を逆重複判定部553に供給する。
このようにすることにより、逆DPCM部552は、正しくDPCM復号することができ、DC係数やAC係数を得ることができる。つまり、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<3−5.逆DPCM処理の流れ>
方法2の場合も、画像復号装置300は、量子化行列復号処理を、図27のフローチャートを参照して説明した方法1の場合と同様に実行する。同様に、画像復号装置300は、残差信号復号処理を、図28のフローチャートを参照して説明した方法1の場合と同様に実行する。
図34のフローチャートを参照して、逆DPCM部552により実行される逆DPCM処理の流れの例を説明する。
逆DPCM処理が開始されると、初期設定部621は、ステップS421において、sizeIDおよびMatrixIDを取得する。
ステップS422において、初期設定部621は、coefNumを以下のように設定する。
coefNum = min((1<<(4+(sizeID<<1))),64)
ステップS423において、初期設定部621は、変数iと変数nextcoefを以下のように設定する。
i = 0
nextcoef = 8
ステップS424において、DPCM復号部572は、変数i<coefNumであるか否かを判定する。変数iがcoefNumより小さい場合、初期設定部621は、処理をステップS425に進める。
ステップS425において、AC係数DPCM復号部622は、AC係数のDPCMデータ(scaling_list_delta_coef)を読み込む。
ステップS426において、AC係数DPCM復号部622は、読み込んだDPCMデータを用いて以下のようにnextcoefを求め、さらに、scalingList[i]を求める。
nextcoef = (nextcoef + scaling_list_delta_coef+256) % 256
scalingList[i] = nextcoef
なお、算出された最初のAC係数(ScalingList[0]、すなわち、AC係数(0,0))は、AC係数バッファ623に保持される。
ステップS427において、AC係数DPCM復号部622は、変数iをインクリメントし、処理の対象を次の係数に替え、処理をステップS424に戻す。
ステップS424において、変数iがcoefNum以上であると判定されるまで、ステップS424乃至ステップS427の処理が繰り返される。ステップS424において、変数iがcoefNum以上であると判定された場合、AC係数DPCM復号部622は、処理をステップS428に進める。
ステップS428において、DC係数DPCM復号部624は、sizeIDが1より大きいか否かを判定する。sizeIDが1より大きいと判定した場合、DC係数DPCM復号部624は、処理をステップS429に進め、DC係数のDPCMデータ(scaling_list_dc_coef_delta)を読み込む。
ステップS430において、DC係数DPCM復号部624は、AC係数バッファ623により保持されている最初のAC係数(ScalingList[0]、すなわち、AC係数(0,0))を取得し、その最初のAC係数を用いて、DC係数(DC_coef)のDPCMデータを、以下のように復号する。
DC_coef = scaling_list_dc_coef_delta + ScalingList[0]
DC係数(DC_coef)が得られると、DC係数DPCM復号部624は、逆DPCM処理を終了し、処理を図28に戻す。
また、ステップS428において、sizeIDが1以下であると判定した場合、DC係数DPCM復号部624は、逆DPCM処理を終了し、処理を図28に戻す。
以上のようにすることにより、DC係数と、AC係数群の先頭のAC係数との差分を正しく復号することができるので、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<4.第4の実施の形態>
<4−1.シンタクス:方法3>
上述した方法2において、さらに、DC係数を、最初のAC係数(AC係数(0,0))より小さい値に限定するようにしてもよい(方法3)。
このようにすることにより、DC係数のDPCMデータ、すなわち、DC係数から最初のAC係数を減算して得られる差分値を、必ず正の値にすることができる。したがって、このDPCMデータは、符号なしの指数ゴロム符号により符号化することができる。したがって、方法3の場合、DC係数が最初のAC係数より大きな値とすることができなくなるものの、方法1や方法2の場合よりも符号量を低減させることができる。
方法3の場合の、スケーリングリストのシンタクスを、図35に示す。図35に示されるように、この場合、DC係数のDPCMデータ(scaling_list_dc_coef_delta)が正の値に制限される。
このような方法3のシンタクスは、方法2の場合と同様の画像符号化装置10により実現することができる。ただし、方法3の場合、expG部193は、DC係数のDPCMデータを、符号なしの指数ゴロム符号により符号化することができる。なお、画像符号化装置10は、量子化行列符号化処理やDPCM処理等の各処理を、方法2の場合と同様に実行することができる。
また、このような方法3のシンタクスは、方法2の場合と同様の画像復号装置300により実現することができる。また、画像復号装置300は、量子化行列復号処理を、方法2の場合と同様に実行することができる。
<4−2.逆DPCM処理の流れ>
図36のフローチャートを参照して、逆DPCM部552により実行される逆DPCM処理の流れの例を説明する。
ステップS451乃至ステップS459の各処理は、図34のステップS421乃至ステップS429の各処理と同様に行われる。
ステップS460において、DC係数DPCM復号部624は、AC係数バッファ623により保持されている最初のAC係数(ScalingList[0]、すなわち、AC係数(0,0))を取得し、その最初のAC係数を用いて、DC係数(DC_coef)のDPCMデータを、以下のように復号する。
DC_coef = ScalingList[0] - scaling_list_dc_coef_delta
DC係数(DC_coef)が得られると、DC係数DPCM復号部624は、逆DPCM処理を終了し、処理を図28に戻す。
また、ステップS458において、sizeIDが1以下であると判定した場合、DC係数DPCM復号部624は、逆DPCM処理を終了し、処理を図28に戻す。
以上のようにすることにより、DC係数と、AC係数群の先頭のAC係数との差分を正しく復号することができるので、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<5.第5の実施の形態>
<5−1.シンタクス:方法4>
DC係数の代わりに、DC係数とその他の係数との差分を伝送する方法として、例えば、複数のスケーリングリストのDC係数のみを集めて、各スケーリングリストのAC係数とは別に、DC係数同士で差分をとるDPCMを行うようにしてもよい(方法4)。この場合、DC係数のDPCMデータは、複数のスケーリングリスト分のデータがまとめられ、各スケーリングリストのAC係数のDPCMデータとは別のデータとして伝送される。
このようにすることにより、例えば、各スケーリングリスト(各MatrixID)の間でDC係数同士に相関がある場合に、圧縮率をより向上させることができる。
方法4の場合の、スケーリングリストのDC係数に関するシンタクスを、図37に示す。この場合、DC係数の処理を各スケーリングリストのAC係数の処理とは異なるサイクルで行う必要があるため、図37の例に示されるように、AC係数とDC係数の処理を互いに独立させる必要がある。
したがって、DPCM処理や逆DPCM処理が煩雑になる恐れがあるものの、より多様なスケーリングリストの符号化・復号処理方法を実現することができる。例えば、コピーモードの際に、AC係数のみをコピーしてDC係数を異なる値にするといった処理も容易に実現することができる。
なお、このようにDC係数をまとめて処理するスケーリングリストの数は任意である。
<5−2.DPCM部の詳細な構成例>
方法4の場合、画像符号化装置10の構成は、基本的に、上述した方法1の場合と同様である。すなわち、画像符号化装置10は、図14に示される例のように構成される。また、直交変換・量子化部14は、図15に示される例のように構成される。さらに、行列処理部150は、図16に示される例のように構成される。
この場合のDPCM部192の構成例を図38に示す。図38に示されるように、この場合、DPCM部192は、AC係数DPCM部631、DC係数バッファ632、およびDC係数DPCM部633を有する。
AC係数DPCM部631は、各スケーリングリストについて、重複判定部191から供給される各AC係数のDPCM処理を行う。つまり、AC係数DPCM部631は、各スケーリングリストについて、所定の定数(例えば8)から最初のAC係数を減算したり、1つ前のAC係数から処理対象のAC係数(カレントAC係数)を減算したりする。AC係数DPCM部631は、各スケーリングリストについて、生成したDPCMデータ(scaling_list_delta_coef)をexpG部193に供給する。
DC係数バッファ632は、重複判定部191から供給される各スケーリングリストのDC係数を記憶する。DC係数バッファ632は、所定のタイミングにおいて、若しくは要求に基づいて、記憶している複数のDC係数を、DC係数DPCM部633に供給する。
DC係数DPCM部633は、DC係数バッファ632に蓄積されたDC係数を取得する。DC係数DPCM部633は、取得した各DC係数のDPCMデータを求める。つまり、DC係数DPCM部633は、所定の定数(例えば8)から最初のDC係数を減算したり、1つ前のDC係数から処理対象のDC係数(カレントDC係数)を減算したりする。DC係数DPCM部633は、生成したDPCMデータ(scaling_list_delta_coef)をexpG部193に供給する。
このようにすることにより、画像符号化装置10は、スケーリングリストの符号化効率を向上させることができる。
<5−3.DPCM処理の流れ>
方法4の場合も、画像符号化装置10は、量子化行列符号化処理を、図20のフローチャートを参照して説明した方法1の場合と同様に実行する。
図39のフローチャートを参照して、図20のステップS112において実行される、方法4の場合のDPCM処理の流れの例を説明する。
ステップS481乃至ステップS485の各処理は、AC係数DPCM部631により、図32のステップS401乃至ステップS405の各処理(方法2の場合の処理)と同様に実行される。
ステップS483において、全てのAC係数を処理したと判定した場合、AC係数DPCM部631は、処理をステップS486に進める。
ステップS486において、AC係数DPCM部631は、DC係数をまとめてDPCM符号化するスケーリングリスト(若しくは差分行列)を全て処理したか否かを判定する。未処理のスケーリングリスト(若しくは差分行列)が存在すると判定した場合、AC係数DPCM部631は、処理をステップS481に戻す。
ステップS486において、全てのスケーリングリスト(若しくは差分行列)を処理したと判定した場合、AC係数DPCM部631は、処理をステップS487に進める。
DC係数DPCM部633は、DC係数バッファ632に記憶されているDC係数について、ステップS487乃至ステップS491の各処理を、ステップS481乃至ステップS485の各処理と同様に実行する。
ステップS489において、DC係数バッファ632に記憶されている全てのDC係数を処理したと判定した場合、DC係数DPCM部633は、DPCM処理を終了し、処理を図20に戻す。
このようにDPCM処理を実行することにより、画像符号化装置10は、スケーリングリストの符号化効率を向上させることができる。
<5−4.逆DPCM部の詳細な構成例>
方法4の場合の画像復号装置300の構成は、基本的に、方法1の場合と同様である。つまり、方法4の場合も画像復号装置300は、図22に示される例のように構成される。また、逆量子化・逆直交変換部313は、図23に示される例のように構成される。さらに、行列生成部410は、図24に示される例のように構成される。
図40は、方法4の場合の、図24に示した逆DPCM部552の詳細な構成の一例を示すブロック図である。図40を参照すると、逆DPCM部552は、初期設定部641、AC係数DPCM復号部642、およびDC係数DPCM復号部643を有する。
初期設定部641は、sizeIDやMatrixIDを取得したり、各種変数に初期値を設定したりする。初期設定部641は、取得したり、設定したりした情報をAC係数DPCM復号部642およびDC係数DPCM復号部643に供給する。
AC係数DPCM復号部642は、expG部551から供給されるAC係数のDPCMデータ(scaling_list_delta_coef(ac))を取得する。AC係数DPCM復号部642は、初期設定部641から供給された初期設定等を用いて、取得したAC係数のDPCMデータを復号し、AC係数を求める。AC係数DPCM復号部642は、求めた各AC係数(ScalingList[i])を逆重複判定部553に供給する。AC係数DPCM復号部642は、このような処理を、複数のスケーリングリストについて実行する。
DC係数DPCM復号部643は、expG部551から供給されるDC係数のDPCMデータ(scaling_list_delta_coef(dc))を取得する。DC係数DPCM復号部643は、初期設定部641から供給された初期設定等を用いて、取得したDC係数のDPCMデータを復号し、各スケーリングリストのDC係数を求める。DC係数DPCM復号部643は、求めた各DC係数(scaling_list_dc_coef)を逆重複判定部553に供給する。
このようにすることにより、逆DPCM部552は、正しくDPCM復号することができ、DC係数やAC係数を得ることができる。つまり、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<5−5.逆DPCM処理の流れ>
方法4の場合も、画像復号装置300は、量子化行列復号処理を、図27のフローチャートを参照して説明した方法1の場合と同様に実行する。同様に、画像復号装置300は、残差信号復号処理を、図28のフローチャートを参照して説明した方法1の場合と同様に実行する。
図41および図42のフローチャートを参照して、逆DPCM部552により実行される逆DPCM処理の流れの例を説明する。
逆DPCM処理が開始されると、初期設定部641およびAC係数DPCM復号部642は、ステップS511乃至ステップS517の各処理を、図34のステップS421乃至ステップS427の各処理と同様に実行する。
ステップS514において、変数iがcoefNum以上であると判定された場合、AC係数DPCM復号部642は、処理をステップS518に進める。
ステップS518において、AC係数DPCM復号部642は、DC係数をまとめてDPCM処理する全てのスケーリングリスト(差分行列)を処理したか否かを判定する。未処理のスケーリングリスト(差分行列)が存在すると判定された場合、AC係数DPCM復号部642は、処理をステップS511に戻し、それ以降の処理を繰り返す。
また、未処理のスケーリングリスト(差分行列)が存在しないと判定された場合、AC係数DPCM復号部642は、処理を図42に進める。
図42のステップS521において、初期設定部641は、sizeIDと変数nextcoefを以下のように設定する。
sizeID = 2
nextcoef = 8
また、ステップS522において、初期設定部641は、MatrixIDを以下のように設定する。
MatrixID = 0
ステップS523において、DC係数DPCM復号部643は、sizeID<4であるか否かを判定する。sizeIDが4より小さいと判定した場合、DC係数DPCM復号部643は、処理をステップS524に進める。
ステップS524において、DC係数DPCM復号部643は、MatrixID<(sizeID == 3)?2:6であるか否かを判定する。MatrixID<(sizeID == 3)?2:6であると判定した場合、DC係数DPCM復号部643は、処理をステップS525に進める。
ステップS525において、DC係数DPCM復号部643は、DC係数のDPCMデータ(scaling_list_delta_coef)を読み込む。
ステップS526において、DC係数DPCM復号部643は、読み込んだDPCMデータを用いて以下のようにnextcoefを求め、さらに、scaling_dc_coefを求める。
nextcoef = (nextcoef + scaling_list_delta_coef+256) % 256
scaling_dc_coef[sizeID - 2][MatrixID] = nextcoef
ステップS527において、DC係数DPCM復号部643は、MatrixIDをインクリメントし、処理の対象を次のDC係数(次のスケーリングリスト若しくは残差行列)に替え、処理をステップS524に戻す。
ステップS524において、MatrixID<(sizeID == 3)?2:6でないと判定した場合、DC係数DPCM復号部643は、処理をステップS528に進める。
ステップS528において、DC係数DPCM復号部643は、sizeIDをインクリメントし、処理の対象を次のDC係数(次のスケーリングリスト若しくは残差行列)に替え、処理をステップS523に戻す。
ステップS523において、sizeIDが4以上であると判定した場合、DC係数DPCM復号部643は、逆DPCM処理を終了し、処理を図28に戻す。
以上のようにすることにより、DC係数同士の差分を正しく復号することができるので、画像復号装置300は、スケーリングリストの符号量の増加を抑制することができる。
<6.第6の実施の形態>
<6−1.シンタクス他の例1>
図43に、スケーリングリストに関するシンタクスの他の例を示す。この図は、図12に対応するものである。図12の例においては、nextcoefの初期値が所定の定数(例えば8)に設定されるが、その代わりに、図43に示されるように、nextcoefの初期値をDC係数のDPCMデータ(scaling_list_dc_coef_minus8)で上書きするようにしてもよい。
このようにすることにより、16x16のスケーリングリスト、および、32x32のスケーリングリストの、最初のAC係数((0,0)のAC係数)の符号量を低減させることができる。
<6−2.シンタクス他の例2>
図44に、スケーリングリストに関するシンタクスの他の例を示す。この図は、図12に対応するものである。
図12の例においては、コピーモードにおける参照先を指定する情報であるscaling_list_pred_matrix_id_deltaの値が「0」の場合、1つ前のスケーリングリストが参照され、「1」の場合、2つ前のスケーリングリストが参照される。
これに対して、図44の例においては、図44のCに示されるように、コピーモードにおける参照先を指定する情報であるscaling_list_pred_matrix_id_deltaの値が「0」の場合、デフォルトのスケーリングリストが参照されるようになされ、「1」の場合、1つ前のスケーリングリストが参照されるようになされている。
このように、scaling_list_pred_matrix_id_deltaのセマンティクスを変更することにより、図44のBに示されるように、シンタクスを簡略化することができ、DPCM処理や逆DPCM処理の負荷を低減させることができる。
<6−3.シンタクス他の例3>
図45に、スケーリングリストに関するシンタクスの他の例を示す。この図は、図12に対応するものである。
図45の例においては、上述した、図43に示される例と、図44に示される例の両方が適用されている。
したがって、図45の例の場合、16x16のスケーリングリスト、および、32x32のスケーリングリストの、最初のAC係数((0,0)のAC係数)の符号量を低減させることができるとともに、シンタクスを簡略化することができ、DPCM処理や逆DPCM処理の負荷を低減させることができる。
以上の各実施の形態において、所定の定数の値は、任意である。また、スケーリングリストのサイズも任意である。
また、以上においては、スケーリングリスト、予測行列、または、それらの差分行列のサイズ変換処理について説明したが、このサイズ変換処理は、実際に、サイズを変換した行列を生成する処理であってもよいが、実際には行列のデータを生成せずに、メモリからの行列の各要素の読み出し方を設定する処理(行列データの読み出し制御)であってもよい。
上述したサイズ変換処理の場合、サイズ変換後の行列の各要素は、サイズ変換前の行列のいずれかの要素により構成される。つまり、例えば、一部の要素のみを読み出したり、1つの要素を複数回読み出したりする等の所定の方法で、メモリに格納されているサイズ変換前の行列の要素を読み出せば、サイズ変換後の行列を生成することができる。換言するに、その各要素の読み出し方法を定義する(行列データの読み出し制御を行う)ことにより、上述したサイズ変換が実質的に実現される。このような方法を用いることにより、サイズ変換後の行列データをメモリに書き込む等の処理が不要になる。また、サイズ変換後の行列データの読み出し方は、基本的に最近傍補間の仕方等で決まるので、予め用意されている複数の選択肢の中から適切なものを選択する程度の、比較的低負荷の処理で実現可能である。したがって、このような方法を用いることにより、サイズ変換の負荷が低減される。
つまり、以上において説明したサイズ変換処理は、実際にサイズ変換後の行列のデータを生成処理も含むが、このような行列データの読み出し制御も含む。
なお、以上においては差分行列が符号化されて伝送されるように説明したが、これに限らず、スケーリングリストが符号化されて伝送されるようにしてもよい。換言するに、以上において、処理される係数として説明したスケーリングリストのAC係数やDC係数は、スケーリングリストと予測行列との差分行列のAC係数やDC係数であってもよい。
また、例えば、スケーリングリストのサイズやリストID等の、スケーリングリストに関するパラメータやフラグ等の情報も、例えば前回伝送した情報との差分をとり、その差分を伝送する等して、その符号量を低減させるようにしてもよい。
また、以上においては、大きなサイズの量子化行列または差分行列をダウンコンバートして伝送するように説明したが、これに限らず、量子化行列または差分行列を、ダウンコンバートせずに、量子化に用いられた量子化行列のサイズのまま伝送するようにしても良い。
本技術の適用範囲は、量子化・逆量子化を用いるあらゆる画像の符号化・復号に適用することができる。
また、本技術は、例えば、MPEG、H.26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれる量子化装置・逆量子化装置にも適用することができる。
<7.第7の実施の形態>
<多視点画像符号化・多視点画像復号への適用>
上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図46は、多視点画像符号化方式の一例を示す。
図46に示されるように、多視点画像は、複数の視点(ビュー(view))の画像を含む。この多視点画像の複数のビューは、他のビューの画像を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの画像を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューは、ベースビューの画像を利用するようにしても良いし、他のノンベースビューの画像を利用するようにしてもよい。
図46のような多視点画像を符号化・復号する場合、各ビューの画像を符号化・復号するが、この各ビューの符号化・復号に対して、以上の各実施の形態において説明した方法を適用するようにしてもよい。このようにすることにより、各ビューの画質の低減を抑制することができる。
さらに、各ビューの符号化・復号において、以上の各実施の形態において説明した方法において使用されるフラグやパラメータを共有するようにしてもよい。このようにすることにより、符号化効率の低減を抑制することができる。
より具体的には、例えば、スケーリングリストに関する情報(例えばパラメータやフラグ等)を、各ビューの符号化・復号において共有するようにしてもよい。
もちろん、これら以外の必要な情報も、各ビューの符号化・復号において共有するようにしてもよい。
例えば、スケーリングリストやスケーリングリストに関する情報をシーケンスパラメータセット(SPS(Sequence Parameter Set))やピクチャパラメータセット(PPS(Picture Parameter Set))において伝送する場合、それら(SPSやPPS)がビュー間で共有されるのであれば、スケーリングリストやスケーリングリストに関する情報も自ずと共有されることになる。このようにすることにより、符号化効率の低減を抑制することができる。
また、ベースビューのスケーリングリスト(量子化マトリクス)の行列要素をビュー間の視差値に応じて変更するようにしても良い。さらに、ベースビューのスケーリングリスト(量子化マトリクス)の行列要素に関してノンベースビュー用の行列要素を調整するためのオフセット値を伝送するようにしてもよい。これらのようにすることにより、符号量の増大を抑制することができる。
例えば、ビュー毎のスケーリングリストを予め別途伝送するようにしてもよい。ビュー毎にスケーリングリストを変更する場合、その予め伝送したスケーリングリストとの差分を示す情報のみを伝送すればよい。この差分を示す情報は、任意である。例えば、4x4や8x8を単位とする情報であってもよいし、行列同士の差分であってもよい。
なお、ビュー間で、SPSやPPSを共有しないが、スケーリングリストやスケーリングリストに関する情報を共有するときは、他のビューのSPSやPPSを参照することができる(つまり、他のビューの、スケーリングリストやスケーリングリストに関する情報を利用することができる)ようにしてもよい。
また、このような多視点画像を、YUVの各画像と、ビュー間の視差量に対応する奥行き画像(Depth)とをそれぞれコンポーネントとする画像として表す場合、各コンポーネント(Y,U,V,Depth)の画像に対して互いに独立したスケーリングリストやスケーリングリストに関する情報を用いるようにしてもよい。
例えば、奥行き画像(Depth)は、エッジの画像であるので、スケーリングリストは不要である。したがって、SPSやPPSにおいてスケーリングリストの利用が指定されている場合であっても、奥行き画像(Depth)に対しては、スケーリングリストを適用しない(若しくは行列要素が全て同一(FLAT)なスケーリングリストを適用する)ようにしてもよい。
<多視点画像符号化装置>
図47は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図47に示されるように、多視点画像符号化装置700は、符号化部701、符号化部702、および多重化部703を有する。
符号化部701は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部702は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部703は、符号化部701において生成されたベースビュー画像符号化ストリームと、符号化部702において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。
この多視点画像符号化装置700の符号化部701および符号化部702に対して、画像符号化装置10(図14)を適用することができる。つまり、各ビューに対する符号化において、スケーリングリストに関する符号量の増大を抑制することができ、各ビューの画質の低減を抑制することができる。また、符号化部701および符号化部702は、互いに同一のフラグやパラメータを用いて、量子化や逆量子化等の処理を行うことができる(すなわち、フラグやパラメータを共有することができる)ので、符号化効率の低減を抑制することができる。
<多視点画像復号装置>
図48は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図48に示されるように、多視点画像復号装置710は、逆多重化部711、復号部712、および復号部713を有する。
逆多重化部711は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部712は、逆多重化部711により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部713は、逆多重化部711により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。
この多視点画像復号装置710の復号部712および復号部713に対して、画像復号装置300(図22)を適用することができる。つまり、各ビューに対する復号において、スケーリングリストに関する符号量の増大を抑制することができ、各ビューの画質の低減を抑制することができる。また、復号部712および復号部713は、互いに同一のフラグやパラメータを用いて、量子化や逆量子化等の処理を行うことができる(すなわち、フラグやパラメータを共有することができる)ので、符号化効率の低減を抑制することができる。
<8.第8の実施の形態>
<階層画像符号化・階層画像復号への適用>
上述した一連の処理は、階層画像符号化・階層画像復号(スケーラブル符号化・スケーラブル復号)に適用することができる。図49は、階層画像符号化方式の一例を示す。
階層画像符号化(スケーラブル符号化)は、画像データを、所定のパラメータについてスケーラビリティ(scalability)機能を有するように、画像を複数レイヤ化(階層化)し、レイヤ毎に符号化するものである。階層画像復号(スケーラブル復号)は、その階層画像符号化に対応する復号である。
図49に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として1の画像が複数の画像(レイヤ)に分割される。つまり、階層化された画像(階層画像)は、その所定のパラメータの値が互いに異なる複数の階層(レイヤ)の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ(エンハンスメントレイヤとも称する)とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。
一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ(差分データ)により構成される。例えば、1の画像をベースレイヤとノンベースレイヤ(エンハンスメントレイヤとも称する)に2階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像(すなわち高品質な画像)が得られる。
このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ(base layer)のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ(base layer)に加えて、エンハンスメントレイヤ(enhancement layer)の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。
図49の例のような階層画像を符号化・復号する場合、各レイヤの画像を符号化・復号するが、この各レイヤの符号化・復号に対して、以上の各実施の形態において説明した方法を適用するようにしてもよい。このようにすることにより、各レイヤの画質の低減を抑制することができる。
さらに、各レイヤの符号化・復号において、以上の各実施の形態において説明した方法において使用されるフラグやパラメータを共有するようにしてもよい。このようにすることにより、符号化効率の低減を抑制することができる。
より具体的には、例えば、スケーリングリストに関する情報(例えば、パラメータやフラグ等)を、各レイヤの符号化・復号において共有するようにしてもよい。
もちろん、これら以外の必要な情報も、各レイヤの符号化・復号において共有するようにしてもよい。
このような階層画像の例として、空間解像度によって階層化したもの(空間解像度スケーラビリティとも称する)がある(spatial scalability)。空間解像度スケーラビリティを有する階層画像の場合、階層毎に画像の解像度が異なる。例えば、空間的に最も低解像度の画像の階層をベースレイヤとされ、ベースレイヤよりも高解像度の画像の階層をノンベースレイヤ(エンハンスメントレイヤ)とされる。
ノンベースレイヤ(エンハンスメントレイヤ)の画像データは、他の階層から独立したデータとし、ベースレイヤの場合と同様に、その画像データのみによりその階層の解像度の画像を得ることができるようにしてもよいが、その階層の画像と他の階層(例えば1つ下の階層)の画像との差分画像に対応するデータとするのが一般的である。この場合、ベースレイヤの階層の解像度の画像は、そのベースレイヤの画像データのみにより得られるが、ノンベースレイヤ(エンハンスメントレイヤ)の階層の解像度の画像は、その階層の画像データと、他の階層(例えば1つ下の階層)の画像データを合成することにより得られる。このようにすることにより、階層間の画像データの冗長性を抑制することができる。
このような空間解像度スケーラビリティを有する階層画像は、階層毎に画像の解像度が異なるので、各階層の符号化・復号の処理単位の解像度も互いに異なる。したがって、各階層の符号化・復号においてスケーリングリスト(量子化マトリクス)を共有する場合、スケーリングリスト(量子化マトリクス)を各階層の解像度比に応じてアップコンバートするようにしてもよい。
例えば、ベースレイヤの画像の解像度が2K(例えば1920x1080)とし、ノンベースレイヤ(エンハンスメントレイヤ)の画像の解像度が4K(例えば、3840x2160)とする。この場合、例えば、ベースレイヤの画像(2K画像)の16x16は、ノンベースレイヤの画像(4K画像)の32x32に相当する。スケーリングリスト(量子化マトリクス)もこのような解像度比に応じて適宜アップコンバートする。
例えば、ベースレイヤの量子化・逆量子化に用いられる4x4のスケーリングリストは、ノンベースレイヤの量子化・逆量子化において8x8にアップコンバートされて使用される。同様に、ベースレイヤの8x8のスケーリングリストは、ノンベースレイヤにおいて16x16にアップコンバートされる。同様に、ベースレイヤにおいて16x16にアップコンバートされて使用されるスケーリングリストは、ノンベースレイヤにおいて32x32にアップコンバートされる。
なお、スケーラビリティ性を持たせるパラメータは、空間解像度に限らず、例えば、時間解像度がある(temporal scalability)。時間解像度スケーラビリティを有する階層画像の場合、階層毎に画像のフレームレートが異なる。また、その他にも、例えば、階層毎に画像データのビット深度が異なるビット深度スケーラビリティ(bit-depth scalability)や、階層毎にコンポーネントのフォーマットが異なるクロマスケーラビリティ(chroma scalability)等がある。
また、その他にも、例えば、階層毎に画像の信号雑音比(SNR(Signal to Noise ratio))が異なるSNRスケーラビリティ(SNR scalability)がある。
画質向上のためには、信号雑音比が低い画像程、量子化誤差をより小さくするのが望ましい。そのため、SNRスケーラビリティの場合、各階層の量子化・逆量子化には、信号雑音比に応じた、互いに異なるスケーリングリスト(共通でないスケーリングリスト)が用いられるようにするのが望ましい。そのため、上述したようにスケーリングリストを階層間で共有する場合、ベースレイヤのスケーリングリストの行列要素に関して、エンハンスメントレイヤの行列要素を調整するためのオフセット値を伝送するようにしてもよい。より具体的には、その共通のスケーリングリストと、実際に用いられるスケーリングリストとの差分を示す情報を、階層毎に伝送するようにしてもよい。例えば、各階層のシーケンスパラメータセット(SPS(Sequence Parameter Set))やピクチャパラメータセット(PPS(Picture Parameter Set))において、その差分を示す情報を伝送するようにしてもよい。この差分を示す情報は、任意である。例えば、両スケーリングリストの要素毎の差分値を要素とする行列であってもよいし、差分を示す関数であってもよい。
<階層画像符号化装置>
図50は、上述した階層画像符号化を行う階層画像符号化装置を示す図である。図50に示されるように、階層画像符号化装置720は、符号化部721、符号化部722、および多重化部723を有する。
符号化部721は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部722は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部723は、符号化部721において生成されたベースレイヤ画像符号化ストリームと、符号化部722において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。
この階層画像符号化装置720の符号化部721および符号化部722に対して、画像符号化装置10(図14)を適用することができる。つまり、各レイヤに対する符号化において、スケーリングリストに関する符号量の増大を抑制することができ、各レイヤの画質の低減を抑制することができる。また、符号化部721および符号化部722は、互いに同一のフラグやパラメータを用いて、量子化や逆量子化等の処理を行うことができる(すなわち、フラグやパラメータを共有することができる)ので、符号化効率の低減を抑制することができる。
<階層画像復号装置>
図51は、上述した階層画像復号を行う階層画像復号装置を示す図である。図51に示されるように、階層画像復号装置730は、逆多重化部731、復号部732、および復号部733を有する。
逆多重化部731は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部732は、逆多重化部731により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部733は、逆多重化部731により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。
この階層画像復号装置730の復号部732および復号部733に対して、画像復号装置300(図22)を適用することができる。つまり、各レイヤに対する復号において、スケーリングリストに関する符号量の増大を抑制することができ、各レイヤの画質の低減を抑制することができる。また、復号部712および復号部713は、互いに同一のフラグやパラメータを用いて、量子化や逆量子化等の処理を行うことができる(すなわち、フラグやパラメータを共有することができる)ので、符号化効率の低減を抑制することができる。
<9.第9の実施の形態>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図52に示されるようなコンピュータとして構成されるようにしてもよい。
図52において、コンピュータ800のCPU(Central Processing Unit)801は、ROM(Read Only Memory)802に記憶されているプログラム、または記憶部813からRAM(Random Access Memory)803にロードされたプログラムに従って各種の処理を実行する。RAM803にはまた、CPU801が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU801、ROM802、およびRAM803は、バス804を介して相互に接続されている。このバス804にはまた、入出力インタフェース810も接続されている。
入出力インタフェース810には、キーボード、マウス、タッチパネル、および入力端子などよりなる入力部811、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、およびOELD(Organic ElectroLuminescence Display)などよりなるディスプレイ、並びにスピーカ等の任意の出力デバイスや出力端子等よりなる出力部812、ハードディスクやフラッシュメモリ等の任意の記憶媒体やその記憶媒体の入出力を制御する制御部等により構成される記憶部813、モデム、LANインタフェース、USB(Universal Serial Bus)、並びにBluetooth(登録商標)等、有線や無線の任意の通信デバイスよりなる通信部814が接続されている。通信部814は、例えばインターネットを含むネットワークを介して他の通信デバイスとの通信処理を行う。
入出力インタフェース810にはまた、必要に応じてドライブ815が接続される。そのドライブ815には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア821が適宜装着される。ドライブ815は、例えばCPU801の制御に従って、自身に装着されたリムーバブルメディア821からコンピュータプログラムやデータ等を読み出す。その読み出されたデータやコンピュータプログラムは、例えば、RAM803に供給される。また、リムーバブルメディア821から読み出されたコンピュータプログラムは、必要に応じて記憶部813にインストールされる。
上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
この記録媒体は、例えば、図52に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc - Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、若しくは半導体メモリなどよりなるリムーバブルメディア821により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM802や、記憶部813に含まれるハードディスクなどで構成される。
なお、コンピュータ800が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。つまり、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
上述した実施形態に係る画像符号化装置10(図14)および画像復号装置300(図22)は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
<10.応用例>
<第1の応用例:テレビジョン受像機>
図53は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース909、制御部910、ユーザインタフェース911、及びバス912を備える。
チューナ902は、アンテナ901を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ902は、復調により得られた符号化ビットストリームをデマルチプレクサ903へ出力する。即ち、チューナ902は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送部としての役割を有する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、デマルチプレクサ903は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に映像を表示させる。また、映像信号処理部905は、ネットワークを介して供給されるアプリケーション画面を表示部906に表示させてもよい。また、映像信号処理部905は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、生成した画像を出力画像に重畳してもよい。
表示部906は、映像信号処理部905から供給される駆動信号により駆動され、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD(Organic ElectroLuminescence Display)(有機ELディスプレイ)など)の映像面上に映像又は画像を表示する。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、音声データについてノイズ除去などの追加的な処理を行ってもよい。
外部インタフェース909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース909を介して受信される映像ストリーム又は音声ストリームが、デコーダ904により復号されてもよい。即ち、外部インタフェース909もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送部としての役割を有する。
制御部910は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置900の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース911から入力される操作信号に応じて、テレビジョン装置900の動作を制御する。
ユーザインタフェース911は、制御部910と接続される。ユーザインタフェース911は、例えば、ユーザがテレビジョン装置900を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース911は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部910へ出力する。
バス912は、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、音声信号処理部907、外部インタフェース909及び制御部910を相互に接続する。
このように構成されたテレビジョン装置900において、デコーダ904は、上述した実施形態に係る画像復号装置300(図22)の機能を有する。したがって、テレビジョン装置900は、スケーリングリストの符号量の増大を抑制することができる。
<第2の応用例:携帯電話機>
図54は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
アンテナ921は、通信部922に接続される。スピーカ924及びマイクロホン925は、音声コーデック923に接続される。操作部932は、制御部931に接続される。バス933は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、及び制御部931を相互に接続する。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。
音声通話モードにおいて、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック923は、圧縮後の音声データを通信部922へ出力する。通信部922は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック923へ出力する。音声コーデック923は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
また、データ通信モードにおいて、例えば、制御部931は、操作部932を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部931は、文字を表示部930に表示させる。また、制御部931は、操作部932を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部922へ出力する。通信部922は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部931へ出力する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929の記憶媒体に記憶させる。
記録再生部929は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。
また、撮影モードにおいて、例えば、カメラ部926は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部927へ出力する。画像処理部927は、カメラ部926から入力される画像データを符号化し、符号化ストリームを記録再生部929の記憶媒体に記憶させる。
また、テレビ電話モードにおいて、例えば、多重分離部928は、画像処理部927により符号化された映像ストリームと、音声コーデック923から入力される音声ストリームとを多重化し、多重化したストリームを通信部922へ出力する。通信部922は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部922は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部928へ出力する。多重分離部928は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部927、音声ストリームを音声コーデック923へ出力する。画像処理部927は、映像ストリームを復号し、映像データを生成する。映像データは、表示部930に供給され、表示部930により一連の画像が表示される。音声コーデック923は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
このように構成された携帯電話機920において、画像処理部927は、上述した実施形態に係る画像符号化装置10(図14)の機能、および、画像復号装置300(図22)の機能を有する。従って、携帯電話機920は、スケーリングリストの符号量の増大を抑制することができる。
また、以上においては携帯電話機920として説明したが、例えば、PDA(Personal Digital Assistants)、スマートフォン、UMPC(Ultra Mobile Personal Computer)、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機920と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機920の場合と同様に、本技術を適用した画像符号化装置および画像復号装置を適用することができる。
<第3の応用例:記録再生装置>
図55は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データ及び映像データを復号する。
記録再生装置940は、チューナ941、外部インタフェース942、エンコーダ943、HDD(Hard Disk Drive)944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)948、制御部949、及びユーザインタフェース950を備える。
チューナ941は、アンテナ(図示せず)を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ941は、復調により得られた符号化ビットストリームをセレクタ946へ出力する。即ち、チューナ941は、記録再生装置940における伝送部としての役割を有する。
外部インタフェース942は、記録再生装置940と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース942は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース942を介して受信される映像データ及び音声データは、エンコーダ943へ入力される。即ち、外部インタフェース942は、記録再生装置940における伝送部としての役割を有する。
エンコーダ943は、外部インタフェース942から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ943は、符号化ビットストリームをセレクタ946へ出力する。
HDD944は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD944は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。
ディスクドライブ945は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ945に装着される記録媒体は、例えばDVDディスク(DVD-Video、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等)又はBlu-ray(登録商標)ディスクなどであってよい。
セレクタ946は、映像及び音声の記録時には、チューナ941又はエンコーダ943から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD944またはディスクドライブ945へ出力する。また、セレクタ946は、映像及び音声の再生時には、HDD944またはディスクドライブ945から入力される符号化ビットストリームをデコーダ947へ出力する。
デコーダ947は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ947は、生成した映像データをOSD948へ出力する。また、デコーダ904は、生成した音声データを外部のスピーカへ出力する。
OSD948は、デコーダ947から入力される映像データを再生し、映像を表示する。また、OSD948は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。
制御部949は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置940の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース950から入力される操作信号に応じて、記録再生装置940の動作を制御する。
ユーザインタフェース950は、制御部949と接続される。ユーザインタフェース950は、例えば、ユーザが記録再生装置940を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース950は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部949へ出力する。
このように構成された記録再生装置940において、エンコーダ943は、上述した実施形態に係る画像符号化装置10(図14)の機能を有する。また、デコーダ947は、上述した実施形態に係る画像復号装置300(図22)の機能を有する。従って、記録再生装置940は、スケーリングリストの符号量の増大を抑制することができる。
<第4の応用例:撮像装置>
図56は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像データを生成し、画像データを符号化して記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、信号処理部963、画像処理部964、表示部965、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、制御部970、ユーザインタフェース971、及びバス972を備える。
光学ブロック961は、撮像部962に接続される。撮像部962は、信号処理部963に接続される。表示部965は、画像処理部964に接続される。ユーザインタフェース971は、制御部970に接続される。バス972は、画像処理部964、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、及び制御部970を相互に接続する。
光学ブロック961は、フォーカスレンズ及び絞り機構などを有する。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCD又はCMOSなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部962は、画像信号を信号処理部963へ出力する。
信号処理部963は、撮像部962から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部963は、カメラ信号処理後の画像データを画像処理部964へ出力する。
画像処理部964は、信号処理部963から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部964は、生成した符号化データを外部インタフェース966又はメディアドライブ968へ出力する。また、画像処理部964は、外部インタフェース966又はメディアドライブ968から入力される符号化データを復号し、画像データを生成する。そして、画像処理部964は、生成した画像データを表示部965へ出力する。また、画像処理部964は、信号処理部963から入力される画像データを表示部965へ出力して画像を表示させてもよい。また、画像処理部964は、OSD969から取得される表示用データを、表示部965へ出力する画像に重畳してもよい。
OSD969は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部964へ出力する。
外部インタフェース966は、例えばUSB入出力端子として構成される。外部インタフェース966は、例えば、画像の印刷時に、撮像装置960とプリンタとを接続する。また、外部インタフェース966には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置960にインストールされ得る。さらに、外部インタフェース966は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース966は、撮像装置960における伝送部としての役割を有する。
メディアドライブ968に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ968に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD(Solid State Drive)のような非可搬性の記憶部が構成されてもよい。
制御部970は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置960の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース971から入力される操作信号に応じて、撮像装置960の動作を制御する。
ユーザインタフェース971は、制御部970と接続される。ユーザインタフェース971は、例えば、ユーザが撮像装置960を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース971は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部970へ出力する。
このように構成された撮像装置960において、画像処理部964は、上述した実施形態に係る画像符号化装置10(図14)の機能、および、画像復号装置300(図22)の機能を有する。従って、撮像装置960は、スケーリングリストの符号量の増大を抑制することができる。
<11.スケーラブル符号化の応用例>
<第1のシステム>
次に、スケーラブル符号化(階層(画像)符号化)されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図57に示される例のように、伝送するデータの選択のために利用される。
図57に示されるデータ伝送システム1000において、配信サーバ1002は、スケーラブル符号化データ記憶部1001に記憶されているスケーラブル符号化データを読み出し、ネットワーク1003を介して、パーソナルコンピュータ1004、AV機器1005、タブレットデバイス1006、および携帯電話機1007等の端末装置に配信する。
その際、配信サーバ1002は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ1002が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ1002が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ1002は、スケーラブル符号化データ記憶部1001に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。
例えば、スケーラブル符号化データ記憶部1001は、スケーラブルに符号化されたスケーラブル符号化データ(BL+EL)1011を記憶するとする。このスケーラブル符号化データ(BL+EL)1011は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。
配信サーバ1002は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ1002は、処理能力の高いパーソナルコンピュータ1004やタブレットデバイス1006に対しては、高品質なスケーラブル符号化データ(BL+EL)1011をスケーラブル符号化データ記憶部1001から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ1002は、処理能力の低いAV機器1005や携帯電話機1007に対しては、スケーラブル符号化データ(BL+EL)1011からベースレイヤのデータを抽出し、スケーラブル符号化データ(BL+EL)1011と同じコンテンツのデータであるが、スケーラブル符号化データ(BL+EL)1011よりも低品質なスケーラブル符号化データ(BL)1012として伝送する。
このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ(BL+EL)1011は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部1001の記憶領域をより効率よく使用することができる。
なお、パーソナルコンピュータ1004乃至携帯電話機1007のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク1003も、例えばインターネットやLAN(Local Area Network)等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。
そこで、配信サーバ1002は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション(ソフトウエア)の性能等といった端末装置の能力に関する情報、並びに、ネットワーク1003の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ1002が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。
なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ1004が、伝送されたスケーラブル符号化データ(BL+EL)1011を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ1004が、伝送されたスケーラブル符号化データ(BL+EL)1011から、ベースレイヤのスケーラブル符号化データ(BL)1012を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。
もちろん、スケーラブル符号化データ記憶部1001、配信サーバ1002、ネットワーク1003、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ1002がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム1000は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。
そして、以上のような図57のようなデータ伝送システム1000においても、図49乃至図51を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図49乃至図51を参照して上述した効果と同様の効果を得ることができる。
<第2のシステム>
また、スケーラブル符号化は、例えば、図58に示される例のように、複数の通信媒体を介する伝送のために利用される。
図58に示されるデータ伝送システム1100において、放送局1101は、地上波放送1111により、ベースレイヤのスケーラブル符号化データ(BL)1121を伝送する。また、放送局1101は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク1112を介して、エンハンスメントレイヤのスケーラブル符号化データ(EL)1122を伝送する(例えばパケット化して伝送する)。
端末装置1102は、放送局1101が放送する地上波放送1111の受信機能を有し、この地上波放送1111を介して伝送されるベースレイヤのスケーラブル符号化データ(BL)1121を受け取る。また、端末装置1102は、ネットワーク1112を介した通信を行う通信機能をさらに有し、このネットワーク1112を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ(EL)1122を受け取る。
端末装置1102は、例えばユーザ指示等に応じて、地上波放送1111を介して取得したベースレイヤのスケーラブル符号化データ(BL)1121を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。
また、端末装置1102は、例えばユーザ指示等に応じて、地上波放送1111を介して取得したベースレイヤのスケーラブル符号化データ(BL)1121と、ネットワーク1112を介して取得したエンハンスメントレイヤのスケーラブル符号化データ(EL)1122とを合成して、スケーラブル符号化データ(BL+EL)を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。
以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバフローの発生を抑制することができる。
また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ(BL)1121を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ(EL)1122を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ(EL)1122を伝送する通信媒体を、ネットワーク1112とするか、地上波放送1111とするかを、ネットワーク1112の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。
このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。
もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置1102の数も任意である。さらに、以上においては、放送局1101からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム1100は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。
そして、以上のような図58のようなデータ伝送システム1100においても、図49乃至図51を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図49乃至図51を参照して上述した効果と同様の効果を得ることができる。
<第3のシステム>
また、スケーラブル符号化は、例えば、図59に示される例のように、符号化データの記憶に利用される。
図59に示される撮像システム1200において、撮像装置1201は、被写体1211を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ(BL+EL)1221として、スケーラブル符号化データ記憶装置1202に供給する。
スケーラブル符号化データ記憶装置1202は、撮像装置1201から供給されるスケーラブル符号化データ(BL+EL)1221を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置1202は、スケーラブル符号化データ(BL+EL)1221からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ(BL)1222として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置1202は、高品質でデータ量の多いスケーラブル符号化データ(BL+EL)1221のまま記憶する。
このようにすることにより、スケーラブル符号化データ記憶装置1202は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。
例えば、撮像装置1201が監視カメラであるとする。撮像画像に監視対象(例えば侵入者)が写っていない場合(通常時の場合)、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ(スケーラブル符号化データ)は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体1211として写っている場合(注目時の場合)、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ(スケーラブル符号化データ)は、高品質に記憶される。
なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置1202が、画像を解析することにより判定しても良い。また、撮像装置1201が判定し、その判定結果をスケーラブル符号化データ記憶装置1202に伝送するようにしてもよい。
なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。
また、以上においては、通常時と注目時の2つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、3つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。
また、撮像装置1201が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置1201が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ(BL)1222を生成し、スケーラブル符号化データ記憶装置1202に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置1201が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ(BL+EL)1221を生成し、スケーラブル符号化データ記憶装置1202に供給するようにしてもよい。
以上においては、監視カメラを例に説明したが、この撮像システム1200の用途は任意であり、監視カメラに限定されない。
そして、以上のような図59のような撮像システム1200においても、図49乃至図51を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図49乃至図51を参照して上述した効果と同様の効果を得ることができる。
なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。
もちろん、本技術を適用した画像符号化装置および画像復号装置は、上述した装置以外の装置やシステムにも適用可能である。
なお、本明細書では、量子化行列(又は量子化行列を構成する際に用いる係数)が、符号化側から復号側へ伝送される例について説明した。量子化行列を伝送する手法は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
なお、本技術は以下のような構成も取ることができる。
(1) 伝送の際に許容される最大サイズである伝送サイズ以下に制限された量子化行列を逆量子化する際の処理単位であるブロックサイズと同じサイズにアップコンバートしたアップコンバート量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と前記量子化行列の先頭に位置する係数との差分である置換差分係数を、前記量子化行列の先頭に位置する係数に加算することにより、前記量子化行列の先頭に位置する係数を設定する設定部と、
前記設定部により設定された量子化行列をアップコンバートして、前記アップコンバート量子化行列を設定するアップコンバート部と、
前記アップコンバート部により設定されたアップコンバート量子化行列の先頭に位置する係数を前記置換係数に置き換えたアップコンバート量子化行列を用いて、符号化データを復号した量子化データを逆量子化する逆量子化部と
を備える画像処理装置。
(2) 前記設定部は、前記置換係数と前記量子化行列に設定された初期値との差分を、前記初期値に加算することにより、前記置換係数を設定する
(1)、(3)乃至(9)のいずれかに記載の画像処装置。
(3) 前記設定部は、前記置換差分係数と前記量子化行列の係数同士の差分である差分係数とを用いて、前記量子化行列の係数を設定する
(1)、(2)、(4)乃至(9)のいずれかに記載の画像処理装置。
(4) 前記置換差分係数と前記量子化行列の係数同士の差分である差分係数とは、まとめて伝送され、
前記設定部は、まとめて伝送された置換差分係数と差分係数とを用いて、前記量子化行列の係数を設定する
(1)乃至(3)、(5)乃至(9)のいずれかに記載の画像処理装置。
(5) 前記置換差分係数と前記量子化行列の係数同士の差分である差分係数とは、符号化されており、
前記設定部は、符号化された置換差分係数と差分係数とを復号する
(1)乃至(4)、(6)乃至(9)のいずれかに記載の画像処理装置。
(6) 前記アップコンバート部は、前記量子化行列の行列要素に対して最近傍補間処理を行うことにより、前記伝送サイズ以下に制限された量子化行列をアップコンバートする
(1)乃至(5)、(7)乃至(9)のいずれかに記載の画像処理装置。
(7) 前記伝送サイズは、8x8であり、
前記アップコンバート部は、8x8サイズの量子化行列の行列要素に対して前記最近傍補間処理を行うことにより、16x16サイズの量子化行列にアップコンバートする
(1)乃至(6)、(8)、(9)のいずれかに記載の画像処理装置。
(8) 前記アップコンバート部は、8x8サイズの量子化行列の行列要素に対して前記最近傍補間処理を行うことにより、32x32サイズの量子化行列にアップコンバートする
(1)乃至(7)、(9)のいずれかに記載の画像処理装置。
(9) 復号処理する際の処理単位であるコーディングユニットと変換処理をする際の処理単位であるトランスフォームユニットとが階層構造を有し、
前記符号化データを、階層構造を有する単位で復号処理して前記量子化データを生成する復号部を更に備え、
前記アップコンバート部は、前記量子化行列を、前記伝送サイズから逆量子化を行う処理単位であるトランスフォームユニットのサイズにアップコンバートする
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 伝送の際に許容される最大サイズである伝送サイズ以下に制限された量子化行列を逆量子化する際の処理単位であるブロックサイズと同じサイズにアップコンバートしたアップコンバート量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と前記量子化行列の先頭に位置する係数との差分である置換差分係数を、前記量子化行列の先頭に位置する係数に加算することにより、前記量子化行列の先頭に位置する係数を設定し、
設定された量子化行列をアップコンバートして、前記アップコンバート量子化行列を設定し、
設定されたアップコンバート量子化行列の先頭に位置する係数を前記置換係数に置き換えたアップコンバート量子化行列を用いて、符号化データを復号した量子化データを逆量子化する
画像処理方法。
(11) 伝送の際に許容される最大サイズである伝送サイズ以下に制限された量子化行列を逆量子化する際の処理単位であるブロックサイズと同じサイズにアップコンバートしたアップコンバート量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と前記量子化行列の先頭に位置する係数との差分である置換差分係数を設定する設定部と、
画像を量子化して、量子化データを生成する量子化部と、
前記量子化部により生成された量子化データを符号化した符号化データと、前記置換係数を符号化した置換係数データと、前記設定部により設定された置換差分係数を符号化した置換差分係数化データとを伝送する伝送部と
を備える画像処理装置。
(12) 前記設定部は、前記置換係数と前記量子化行列に設定された初期値との差分を設定する
(11)、(13)乃至(17)のいずれかに記載の画像処装置。
(13) 前記設定部は、前記量子化行列の係数同士の差分である差分係数を設定し、
前記伝送部は、前記設定部により設定された差分係数を符号化した差分係数データを伝送する
(11)、(12)、(14)乃至(17)のいずれかに記載の画像処理装置。
(14) 前記伝送部は、前記置換係数データと前記置換差分係数化データとをまとめて伝送する
(11)乃至(13)、(15)乃至(17)のいずれかに記載の画像処理装置。
(15) 前記伝送部は、前記置換係数データから前記置換差分係数化データの順に伝送する
(11)乃至(14)、(16)、(17)のいずれかに記載の画像処理装置。
(16) 前記量子化部は、前記量子化行列又は前記アップコンバート量子化行列を用いて、前記画像を量子化する
(11)乃至(15)、(17)のいずれかに記載の画像処理装置。
(17) 符号化処理する際の処理単位であるコーディングユニットと変換処理をする際の処理単位であるトランスフォームユニットとが階層構造を有し、
前記量子化部により生成された量子化データを符号化する符号化部を更に備える
(11)乃至(16)のいずれかに記載の画像処理装置。
(18) 伝送の際に許容される最大サイズである伝送サイズ以下に制限された量子化行列を逆量子化する際の処理単位であるブロックサイズと同じサイズにアップコンバートしたアップコンバート量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と前記量子化行列の先頭に位置する係数との差分である置換差分係数を設定し、
画像を量子化して、量子化データを生成し、
生成された量子化データを符号化した符号化データと、前記置換係数を符号化した置換係数データと、設定された置換差分係数を符号化した置換差分係数化データとを伝送する
画像処理方法。
(19) 符号化データを復号して量子化データを生成する復号部と、
量子化マトリクスをコピーするコピーモードを用いる際に量子化マトリクスの参照先を識別する量子化マトリクス参照データと量子化マトリクスを識別する量子化マトリクス識別データとが一致する場合に、逆量子化する際の処理単位であるブロックサイズと同じサイズに対応するデフォルト量子化マトリクスを用いて、前記復号部により生成された量子化データを逆量子化する逆量子化部と
を備える画像処理装置。
(20) 前記逆量子化部は、前記量子化マトリクス参照データと前記量子化マトリクス識別データとが一致する場合に前記デフォルト量子化マトリクスを参照するようにセマンティクスが設定されたシンタクスをパースして、前記量子化データを逆量子化する
(19)、(21)のいずれかに記載の画像処理装置。
(21) 前記逆量子化部は、前記量子化マトリクス参照データと前記量子化マトリクス識別データとの差分が0の場合に、デフォルト量子化マトリクスを参照するようにセマンティクスが設定されたシンタクスをパースして、前記量子化データを逆量子化する
(19)、(20)のいずれかに記載の画像処理装置。
(22) 符号化データを復号して量子化データを生成し、
量子化マトリクスをコピーするコピーモードを用いる際に量子化マトリクスの参照先を識別する量子化マトリクス参照データと量子化マトリクスを識別する量子化マトリクス識別データとが一致する場合に、逆量子化する際の処理単位であるブロックサイズと同じサイズに対応するデフォルト量子化マトリクスを用いて、前記復号により生成された量子化データを逆量子化する
画像処理方法。
(23) 画像を符号化して符号化データを生成する符号化部と、
量子化マトリクスをコピーするコピーモードを用いる際に量子化マトリクスの参照先を識別する量子化マトリクス参照データと量子化マトリクスを識別する量子化マトリクス識別データとが一致する場合に、量子化する際の処理単位であるブロックサイズと同じサイズに対応するデフォルト量子化マトリクスを参照するようにセマンティクスが設定されたシンタクスを、前記符号化部により生成された符号化データのシンタクスとして設定する設定部と
を備える画像処理装置。
(24) 画像を符号化して符号化データを生成し、
量子化マトリクスをコピーするコピーモードを用いる際に量子化マトリクスの参照先を識別する量子化マトリクス参照データと量子化マトリクスを識別する量子化マトリクス識別データとが一致する場合に、量子化する際の処理単位であるブロックサイズと同じサイズに対応するデフォルト量子化マトリクスを参照するようにセマンティクスが設定されたシンタクスを、生成された符号化データのシンタクスとして設定する
画像処理方法。
10 画像符号化装置, 14 直交変換・量子化部, 16 可逆符号化部, 150 行列処理部, 192 DPCM部, 211 DC係数符号化部, 212 AC係数DPCM部, 300 画像復号装置, 312 可逆復号部, 313 逆量子化・逆直交変換部, 410 行列生成部, 552 逆DPCM部, 571 初期設定部, 572 DPCM復号部, 573 DC係数抽出部, 611 AC係数バッファ, 612 AC係数符号化部, 613 AC係数DPCM部, 614 DC係数DPCM部, 621 初期設定部, 622 AC係数DPCM復号部, 623 AC係数バッファ, 624 DC係数DPCM復号部, 631 AC係数DPCM部, 632 DC係数バッファ, 633 DC係数DPCM部, 641 初期設定部, 642 AC係数DPCM復号部, 643 DC係数DPCM復号部

Claims (6)

  1. 第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数とを含む符号化データを復号して量子化データを生成する復号部と、
    前記初期差分係数に対して前記初期値を加算することにより得られる前記置換係数を、前記置換差分係数に加算することにより、前記第1サイズの第1量子化行列の先頭に位置する係数を設定し、前記第1サイズの第1量子化行列の先頭に位置する係数と前記差分係数とを用いて、前記第1サイズの第1量子化行列を設定する設定部と、
    前記設定部により設定された前記第1サイズの第1量子化行列に対してアップコンバートされた前記第2サイズの第2量子化行列の先頭に位置する係数を、前記置換係数に置き換える置き換え部と、
    前記置き換え部により先頭に位置する係数が前記置換係数に置き換えられた前記第2サイズの第2量子化行列を用いて、前記復号部により生成された量子化データを逆量子化して変換係数データを生成する逆量子化部と、
    前記逆量子化部により生成された変換係数データを逆直交変換して画像データを生成する逆直交変換部と
    を備える画像処理装置。
  2. 前記初期差分係数と、前記置換係数と、前記差分係数とは、前記符号化データのピクチャパラメータセットに含まれるシンタクスとして設定される
    請求項1に記載の画像処理装置。
  3. 第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数とを含む符号化データを復号して量子化データを生成し、
    前記初期差分係数に対して前記初期値を加算することにより得られる前記置換係数を、前記置換差分係数に加算することにより、前記第1サイズの第1量子化行列の先頭に位置する係数を設定し、前記第1サイズの第1量子化行列の先頭に位置する係数と前記差分係数とを用いて、前記第1サイズの第1量子化行列を設定し、
    設定された前記第1サイズの第1量子化行列に対してアップコンバートされた前記第2サイズの第2量子化行列の先頭に位置する係数を、前記置換係数に置き換え、
    先頭に位置する係数が前記置換係数に置き換えられた前記第2サイズの第2量子化行列を用いて、生成された量子化データを逆量子化して変換係数データを生成し、
    生成された変換係数データを逆直交変換して画像データを生成する
    画像処理方法。
  4. 画像を直交変換した変換係数データを量子化して、量子化データを生成する量子化部と、
    前記量子化部により生成された量子化データを符号化して、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数と、を含む符号化データを生成する符号化部と
    を備える画像処理装置。
  5. 前記初期差分係数と、前記置換係数と、前記差分係数とは、前記符号化データのピクチャパラメータセットに含まれるシンタクスとして設定される
    請求項4に記載の画像処理装置。
  6. 画像を直交変換した変換係数データを量子化して、量子化データを生成し、
    生成された量子化データを符号化して、第1サイズの第1量子化行列に対してアップコンバートされた第2サイズの第2量子化行列の先頭に位置する係数を置き換える際に用いる置換係数と量子化行列に設定された係数の初期値との差分である初期差分係数と、前記置換係数と前記第1サイズの第1量子化行列の先頭に位置する係数との差分である置換差分係数と、前記第1サイズの第1量子化行列の係数同士の差分である差分係数と、を含む符号化データを生成する
    画像処理方法。
JP2018245383A 2012-02-29 2018-12-27 画像処理装置および方法 Active JP6635184B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012044009 2012-02-29
JP2012044009 2012-02-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018024728A Division JP6465226B2 (ja) 2012-02-29 2018-02-15 画像処理装置および方法、記録媒体、並びに、プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019218053A Division JP2020036372A (ja) 2012-02-29 2019-12-02 画像処理装置および方法、並びに、プログラム

Publications (2)

Publication Number Publication Date
JP2019071653A true JP2019071653A (ja) 2019-05-09
JP6635184B2 JP6635184B2 (ja) 2020-01-22

Family

ID=49082403

Family Applications (14)

Application Number Title Priority Date Filing Date
JP2014502152A Active JP5904266B2 (ja) 2012-02-29 2013-02-20 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502388A Active JP5904267B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502390A Active JP5904269B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502389A Active JP5904268B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045174A Active JP6075486B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045172A Active JP6075484B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045175A Active JP6075487B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045173A Active JP6075485B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2017001072A Active JP6299889B2 (ja) 2012-02-29 2017-01-06 画像処理装置および方法、記録媒体、並びに、プログラム
JP2017001073A Active JP6299890B2 (ja) 2012-02-29 2017-01-06 画像処理装置および方法、記録媒体、並びに、プログラム
JP2018024728A Active JP6465226B2 (ja) 2012-02-29 2018-02-15 画像処理装置および方法、記録媒体、並びに、プログラム
JP2018024729A Active JP6465227B2 (ja) 2012-02-29 2018-02-15 画像処理装置および方法、記録媒体、並びに、プログラム
JP2018245383A Active JP6635184B2 (ja) 2012-02-29 2018-12-27 画像処理装置および方法
JP2019218053A Pending JP2020036372A (ja) 2012-02-29 2019-12-02 画像処理装置および方法、並びに、プログラム

Family Applications Before (12)

Application Number Title Priority Date Filing Date
JP2014502152A Active JP5904266B2 (ja) 2012-02-29 2013-02-20 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502388A Active JP5904267B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502390A Active JP5904269B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2014502389A Active JP5904268B2 (ja) 2012-02-29 2013-02-28 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045174A Active JP6075486B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045172A Active JP6075484B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045175A Active JP6075487B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2016045173A Active JP6075485B2 (ja) 2012-02-29 2016-03-09 画像処理装置および方法、記録媒体、並びに、プログラム
JP2017001072A Active JP6299889B2 (ja) 2012-02-29 2017-01-06 画像処理装置および方法、記録媒体、並びに、プログラム
JP2017001073A Active JP6299890B2 (ja) 2012-02-29 2017-01-06 画像処理装置および方法、記録媒体、並びに、プログラム
JP2018024728A Active JP6465226B2 (ja) 2012-02-29 2018-02-15 画像処理装置および方法、記録媒体、並びに、プログラム
JP2018024729A Active JP6465227B2 (ja) 2012-02-29 2018-02-15 画像処理装置および方法、記録媒体、並びに、プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019218053A Pending JP2020036372A (ja) 2012-02-29 2019-12-02 画像処理装置および方法、並びに、プログラム

Country Status (21)

Country Link
US (13) US9838682B2 (ja)
EP (9) EP3432582B1 (ja)
JP (14) JP5904266B2 (ja)
KR (13) KR102074600B1 (ja)
CN (12) CN107277516B (ja)
AR (4) AR090124A1 (ja)
AU (1) AU2013227608B2 (ja)
BR (1) BR112014020801B1 (ja)
CA (2) CA2862282C (ja)
DK (4) DK3694214T3 (ja)
ES (1) ES2725674T3 (ja)
HK (1) HK1243572A1 (ja)
HU (3) HUE049148T2 (ja)
IN (1) IN2015DN00926A (ja)
MX (4) MX339576B (ja)
MY (6) MY190756A (ja)
PL (2) PL3300370T3 (ja)
RU (4) RU2597509C2 (ja)
TW (4) TWI612798B (ja)
WO (4) WO2013129203A1 (ja)
ZA (1) ZA201405569B (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122014031521B1 (pt) 2011-02-10 2022-08-23 Velos Media International Limited Dispositivo e método de processamento de imagem
CN107580230B (zh) 2012-01-20 2021-08-20 韩国电子通信研究院 视频解码方法和视频编码方法
EP3432582B1 (en) 2012-02-29 2020-04-01 Sony Corporation Image processing device and method
JP6287035B2 (ja) * 2013-10-11 2018-03-07 ソニー株式会社 復号装置および復号方法
GB2520002B (en) * 2013-11-04 2018-04-25 British Broadcasting Corp An improved compression algorithm for video compression codecs
US10863188B2 (en) * 2014-09-19 2020-12-08 Futurewei Technologies, Inc. Method and apparatus for non-uniform mapping for quantization matrix coefficients between different sizes of quantization matrices in image/video coding
US10302463B2 (en) * 2015-11-19 2019-05-28 Corning Incorporated Distributed fiber sensors and systems employing multicore optical fibers
FR3047379A1 (fr) * 2016-01-29 2017-08-04 Orange Procede de codage et decodage de donnees, dispositif de codage et decodage de donnees et programmes d'ordinateur correspondants
GB2547442B (en) * 2016-02-17 2022-01-12 V Nova Int Ltd Physical adapter, signal processing equipment, methods and computer programs
WO2018008387A1 (ja) * 2016-07-04 2018-01-11 ソニー株式会社 画像処理装置および方法
CN109661820A (zh) * 2016-09-13 2019-04-19 联发科技股份有限公司 用于视频编解码的多个量化矩阵集合的方法
US10567768B2 (en) * 2017-04-14 2020-02-18 Apple Inc. Techniques for calculation of quantization matrices in video coding
EP3782365A1 (en) * 2018-04-16 2021-02-24 InterDigital VC Holdings, Inc. Quantization parameter prediction for video encoding and decoding
CN109031440B (zh) * 2018-06-04 2020-02-21 南京航空航天大学 一种基于深度学习的伽马放射性成像方法
JP2020098984A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
JP2020098986A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
CN109714132B (zh) * 2019-01-23 2021-04-20 中国电子科技集团公司第二十八研究所 一种用于复杂电磁环境下的多链路抗干扰实时传输方法
EP3918797A4 (en) * 2019-03-10 2023-01-25 HFI Innovation Inc. METHOD AND DEVICE FOR CALCULATION AND REPRESENTATION OF QUANTIZATION MATRICES FOR VIDEO CODING
US20220159250A1 (en) * 2019-03-20 2022-05-19 V-Nova International Limited Residual filtering in signal enhancement coding
SG11202110936PA (en) 2019-04-12 2021-11-29 Beijing Bytedance Network Technology Co Ltd Chroma coding mode determination based on matrix-based intra prediction
JP7403555B2 (ja) 2019-04-16 2023-12-22 北京字節跳動網絡技術有限公司 イントラコーディングモードにおけるマトリクスの導出
CN113728640A (zh) * 2019-04-23 2021-11-30 北京字节跳动网络技术有限公司 帧内预测和残差编解码
CN113812150B (zh) 2019-05-01 2023-11-28 北京字节跳动网络技术有限公司 使用滤波的基于矩阵的帧内预测
CN117097912A (zh) 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
WO2020231228A1 (ko) * 2019-05-15 2020-11-19 현대자동차주식회사 영상 복호화 장치에서 이용하는 역양자화장치 및 방법
BR112021022868A2 (pt) 2019-05-22 2022-01-04 Beijing Bytedance Network Tech Co Ltd Método de processamento de vídeos, aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador
CN113924775B (zh) 2019-05-31 2023-11-14 北京字节跳动网络技术有限公司 基于矩阵的帧内预测中的限制的上采样
WO2020244610A1 (en) 2019-06-05 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Context determination for matrix-based intra prediction
WO2020251279A1 (ko) * 2019-06-11 2020-12-17 엘지전자 주식회사 스케일링 리스트 데이터의 시그널링 기반 비디오 또는 영상 코딩
WO2020251275A1 (ko) * 2019-06-11 2020-12-17 엘지전자 주식회사 스케일링 리스트 기반 비디오 또는 영상 코딩
US20220337849A1 (en) * 2019-06-11 2022-10-20 Lg Electronics Inc. Scaling list parameter-based video or image coding
CN114521327A (zh) * 2019-07-05 2022-05-20 威诺瓦国际有限公司 视频译码中的残差的量化
CN110334316A (zh) * 2019-07-08 2019-10-15 张军 一种多路数据分块浮点量化处理器原型
CN114270838B (zh) 2019-08-20 2024-04-12 北京字节跳动网络技术有限公司 变换跳过模式的信令通知
WO2021060846A1 (ko) * 2019-09-23 2021-04-01 엘지전자 주식회사 양자화 매트릭스를 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
US11206395B2 (en) * 2019-09-24 2021-12-21 Mediatek Inc. Signaling quantization matrix
EP4042689A4 (en) 2019-10-28 2023-06-07 Beijing Bytedance Network Technology Co., Ltd. SIGNALING AND SYNTAX ANALYSIS BASED ON A COLOR COMPONENT
US11954821B1 (en) 2022-10-27 2024-04-09 Xerox Corporation Altering pixels to scale images

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015504289A (ja) * 2012-01-20 2015-02-05 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 量子化行列の符号化方法及び復号化方法、並びにそれを利用する装置

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2753091B2 (ja) 1990-01-09 1998-05-18 株式会社リコー 画像データ伸張回路
KR100287624B1 (ko) * 1992-09-28 2001-04-16 야스카와 히데아키 화상데이타의압축,해제방법및그장치
US6865291B1 (en) * 1996-06-24 2005-03-08 Andrew Michael Zador Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer
US8625665B2 (en) * 1996-09-20 2014-01-07 At&T Intellectual Property Ii, L.P. Video coder providing implicit coefficient prediction and scan adaptation for image coding and intra coding of video
US6125201A (en) * 1997-06-25 2000-09-26 Andrew Michael Zador Method, apparatus and system for compressing data
JP2900927B2 (ja) * 1997-10-30 1999-06-02 日本ビクター株式会社 符号化方法及び符号化装置
FI974244A (fi) * 1997-11-14 1999-05-15 Nokia Mobile Phones Ltd Kuvan kompressointimenetelmä
KR100281967B1 (ko) * 1998-08-31 2001-02-15 전주범 공간 상관성을 이용한 영상 부호화 장치 및 그 방법
US6993076B1 (en) * 1999-05-11 2006-01-31 Thomson Licensing S.A. Apparatus and method for deriving an enhanced decoded reduced-resolution video signal from a coded high-definition video signal
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
JP2004147095A (ja) * 2002-10-24 2004-05-20 Canon Inc 復号方法
US7206355B2 (en) * 2002-12-02 2007-04-17 Nortel Networks Limited Digitally convertible radio
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
KR100999221B1 (ko) * 2003-02-21 2010-12-07 파나소닉 주식회사 픽처 코딩 방법 및 디코딩 방법
US7233703B2 (en) * 2003-03-25 2007-06-19 Sharp Laboratories Of America, Inc. Computation-reduced IDCT method for video coding
US20050002337A1 (en) * 2003-07-01 2005-01-06 Nokia Corporation Reducing effects caused by transmission channel errors during a streaming session
US7426308B2 (en) * 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
JP2007535191A (ja) * 2004-01-30 2007-11-29 松下電器産業株式会社 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置およびプログラム
US7933327B2 (en) * 2004-01-30 2011-04-26 Panasonic Corporation Moving picture coding method and moving picture decoding method
US7460596B2 (en) * 2004-04-29 2008-12-02 Mediatek Incorporation Adaptive de-blocking filtering apparatus and method for MPEG video decoder
CN100571389C (zh) * 2004-06-29 2009-12-16 奥林巴斯株式会社 用于图像编码/解码和扩展图像压缩解压缩的方法和设备
DE102004059978B4 (de) * 2004-10-15 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium
EP1675402A1 (en) * 2004-12-22 2006-06-28 Thomson Licensing Optimisation of a quantisation matrix for image and video coding
JP2007140200A (ja) * 2005-11-18 2007-06-07 Yamaha Corp 語学学習装置およびプログラム
RU2369038C1 (ru) * 2005-11-30 2009-09-27 Кабусики Кайся Тосиба Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
KR100763205B1 (ko) * 2006-01-12 2007-10-04 삼성전자주식회사 모션 역변환을 사용하여 모션 예측을 수행하는 방법 및장치
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
RU2419855C2 (ru) * 2006-06-26 2011-05-27 Квэлкомм Инкорпорейтед Снижение ошибок в ходе вычисления обратного дискретного косинусного преобразования
US8463061B2 (en) 2006-07-13 2013-06-11 Nec Corporation Encoding and decoding two-dimensional signal using a wavelet transform
JP4274234B2 (ja) * 2006-12-04 2009-06-03 ソニー株式会社 圧縮データ量制御方法及び画像データ圧縮装置
CN100520732C (zh) * 2006-12-26 2009-07-29 中国电信股份有限公司 性能测试脚本生成方法
JPWO2008120577A1 (ja) * 2007-03-29 2010-07-15 株式会社東芝 画像符号化及び復号化の方法及び装置
WO2008132890A1 (ja) * 2007-04-16 2008-11-06 Kabushiki Kaisha Toshiba 画像符号化と画像復号化の方法及び装置
US8213498B2 (en) * 2007-05-31 2012-07-03 Qualcomm Incorporated Bitrate reduction techniques for image transcoding
KR101365441B1 (ko) * 2007-10-11 2014-02-19 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
AU2008229753A1 (en) 2007-10-11 2009-04-30 Aristocrat Technologies Australia Pty Limited A gaming system and a method of gaming
DE102007053038A1 (de) * 2007-11-07 2009-05-14 Robert Bosch Gmbh Ansteuerschaltung
KR101375663B1 (ko) * 2007-12-06 2014-04-03 삼성전자주식회사 영상을 계층적으로 부호화/복호화하는 방법 및 장치
KR101426272B1 (ko) * 2008-03-10 2014-08-07 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
US8238675B2 (en) * 2008-03-24 2012-08-07 Microsoft Corporation Spectral information recovery for compressed image restoration with nonlinear partial differential equation regularization
BRPI0904325A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo e método de processamento de imagem.
WO2009157577A1 (ja) * 2008-06-27 2009-12-30 ソニー株式会社 画像処理装置及び画像処理方法
US8325796B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
CN101771868B (zh) * 2008-12-31 2016-03-02 华为技术有限公司 对图像的量化处理方法及装置
TW201028018A (en) 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
WO2010085125A2 (ko) * 2009-01-22 2010-07-29 삼성전자 주식회사 영상의 변환 방법 및 장치, 역변환 방법 및 장치
FR2944936A1 (fr) * 2009-04-23 2010-10-29 Thomson Licensing Procedes de codage et de decodage d'un bloc de donnees images, dispositifs de codage et de decodage implementant lesdits procedes
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
JP2011029956A (ja) * 2009-07-27 2011-02-10 Sony Corp 画像符号化装置および画像符号化方法
JP5233897B2 (ja) * 2009-07-31 2013-07-10 ソニー株式会社 画像処理装置および方法
KR101675116B1 (ko) * 2009-08-06 2016-11-10 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20110069740A (ko) * 2009-12-17 2011-06-23 에스케이 텔레콤주식회사 영상 부호화/복호화 방법 및 장치
US8588536B2 (en) * 2010-02-22 2013-11-19 Texas Instruments Incorporated Guaranteed-rate tiled image data compression
JP5213896B2 (ja) * 2010-03-03 2013-06-19 日本電信電話株式会社 画像処理方法及び画像処理装置及びプログラム
EP2375745A1 (en) * 2010-04-12 2011-10-12 Panasonic Corporation Efficient storing of picture representation using adaptive non-uniform quantizer
CN102933678B (zh) * 2010-06-08 2014-12-31 Dic株式会社 封装材料、太阳能电池组件及发光二极管
JP2011259205A (ja) * 2010-06-09 2011-12-22 Sony Corp 画像復号化装置と画像符号化装置およびその方法とプログラム
CN105512093A (zh) * 2010-09-28 2016-04-20 三星电子株式会社 视频编码方法和装置以及解码方法和装置
US9167252B2 (en) * 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
CN101984669A (zh) * 2010-12-10 2011-03-09 河海大学 一种帧层次自适应维纳插值滤波器的迭代方法
BR122014031521B1 (pt) 2011-02-10 2022-08-23 Velos Media International Limited Dispositivo e método de processamento de imagem
US20140010284A1 (en) * 2011-02-25 2014-01-09 Samsung Electronics Co., Ltd. Image transform and inverse transform method, and image encoding and decoding device using same
CN102281075B (zh) * 2011-03-21 2013-03-06 中国人民解放军信息工程大学 孔径为4的六边形格网层次编码、运算与索引方法
US9641840B2 (en) * 2011-05-20 2017-05-02 Sony Corporation Processing device and image processing method for encoding and decoding image
US9143802B2 (en) * 2011-10-31 2015-09-22 Qualcomm Incorporated Fragmented parameter set for video coding
US10277915B2 (en) * 2011-11-07 2019-04-30 Qualcomm Incorporated Signaling quantization matrices for video coding
JP2013129616A (ja) 2011-12-21 2013-07-04 Shikoku Chem Corp 臭素化剤及びその利用
EP3432582B1 (en) 2012-02-29 2020-04-01 Sony Corporation Image processing device and method
JPWO2013154028A1 (ja) * 2012-04-13 2015-12-17 ソニー株式会社 画像処理装置および方法
JP5559372B2 (ja) 2013-02-01 2014-07-23 キヤノン株式会社 画像形成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015504289A (ja) * 2012-01-20 2015-02-05 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 量子化行列の符号化方法及び復号化方法、並びにそれを利用する装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JUNICHI TANAKA, ET.AL.: "Quantization Matrix for HEVC", JCTVC-E073[ONLINE], JPN6019044702, 10 March 2011 (2011-03-10), ISSN: 0004156590 *

Also Published As

Publication number Publication date
US20180176566A1 (en) 2018-06-21
DK3300370T3 (da) 2019-05-20
KR20140143138A (ko) 2014-12-15
US10264258B2 (en) 2019-04-16
US9686541B2 (en) 2017-06-20
RU2016120989A (ru) 2017-11-28
JP2016131383A (ja) 2016-07-21
AR112716A2 (es) 2019-12-04
CN109379589B (zh) 2021-06-15
MX2014010113A (es) 2014-10-14
US20200045314A1 (en) 2020-02-06
KR102090344B1 (ko) 2020-03-17
CN104170391B (zh) 2018-06-29
CN107743240B (zh) 2020-03-17
CN110913224A (zh) 2020-03-24
US20150010075A1 (en) 2015-01-08
KR20180017210A (ko) 2018-02-20
EP3432582A1 (en) 2019-01-23
CN107743240A (zh) 2018-02-27
JP2016105658A (ja) 2016-06-09
JP6075487B2 (ja) 2017-02-08
KR102153271B1 (ko) 2020-09-07
WO2013129203A1 (ja) 2013-09-06
JPWO2013129616A1 (ja) 2015-07-30
AR112641A2 (es) 2019-11-20
AR112588A2 (es) 2019-11-13
CN104126304A (zh) 2014-10-29
JP2016131384A (ja) 2016-07-21
JP6635184B2 (ja) 2020-01-22
TWI568246B (zh) 2017-01-21
AU2013227608B2 (en) 2016-07-21
EP3694214B1 (en) 2021-08-25
MY172126A (en) 2019-11-14
KR102153269B1 (ko) 2020-09-07
KR20200009125A (ko) 2020-01-29
CN107592536A (zh) 2018-01-16
HUE043260T2 (hu) 2019-08-28
CN107257491B (zh) 2019-10-18
KR102154965B1 (ko) 2020-09-10
BR112014020801B1 (pt) 2018-09-25
CA3041408C (en) 2021-06-08
CN104170391A (zh) 2014-11-26
JP2016131382A (ja) 2016-07-21
EP3709652B1 (en) 2021-09-22
US10574990B2 (en) 2020-02-25
CN107592536B (zh) 2020-02-11
MX2021015792A (es) 2022-06-14
KR20200008018A (ko) 2020-01-22
KR20200013789A (ko) 2020-02-07
CA2862282C (en) 2021-03-30
CN104137552A (zh) 2014-11-05
US20190174129A1 (en) 2019-06-06
MX352223B (es) 2017-11-15
KR102074601B1 (ko) 2020-02-06
JP5904269B2 (ja) 2016-04-13
PL3300370T3 (pl) 2019-07-31
EP3930334A1 (en) 2021-12-29
DK3432584T3 (da) 2020-06-15
JP5904268B2 (ja) 2016-04-13
US20180020219A1 (en) 2018-01-18
US20170214919A1 (en) 2017-07-27
US10404985B2 (en) 2019-09-03
RU2016120989A3 (ja) 2019-10-23
KR102074600B1 (ko) 2020-02-06
US10225553B2 (en) 2019-03-05
RU2020107177A (ru) 2021-08-17
AU2013227608A1 (en) 2014-08-21
ZA201405569B (en) 2014-11-26
CN104137552B (zh) 2019-01-11
ES2725674T3 (es) 2019-09-26
CN104126306B (zh) 2017-09-19
KR20200014435A (ko) 2020-02-10
KR102154968B1 (ko) 2020-09-10
CN109803149A (zh) 2019-05-24
KR20200008662A (ko) 2020-01-28
EP3694214A1 (en) 2020-08-12
JP2018110431A (ja) 2018-07-12
EP3432584A1 (en) 2019-01-23
EP3432583A1 (en) 2019-01-23
TW201519638A (zh) 2015-05-16
CN104126304B (zh) 2017-11-21
RU2014134533A (ru) 2016-03-20
WO2013129617A1 (ja) 2013-09-06
EP3282708B1 (en) 2019-04-03
US20170142413A1 (en) 2017-05-18
JP6075486B2 (ja) 2017-02-08
US20140369407A1 (en) 2014-12-18
MY190756A (en) 2022-05-12
EP3300370B1 (en) 2019-04-03
BR112014020801A8 (pt) 2018-02-14
TWI612797B (zh) 2018-01-21
KR20180015756A (ko) 2018-02-13
JP2018110430A (ja) 2018-07-12
CN107277516A (zh) 2017-10-20
DK3694214T3 (da) 2021-09-27
RU2597509C2 (ru) 2016-09-10
JP6299889B2 (ja) 2018-03-28
RU2718415C2 (ru) 2020-04-02
CN107277516B (zh) 2020-02-18
RU2015103531A (ru) 2015-06-20
US11539954B2 (en) 2022-12-27
EP2822275B1 (en) 2018-09-12
AR090124A1 (es) 2014-10-22
JP2017085640A (ja) 2017-05-18
MY190758A (en) 2022-05-12
KR102248057B1 (ko) 2021-05-04
CN109379589A (zh) 2019-02-22
EP2822275A4 (en) 2015-12-02
US9838682B2 (en) 2017-12-05
HK1243572A1 (zh) 2018-07-13
CA3041408A1 (en) 2013-09-06
KR20180017209A (ko) 2018-02-20
US20180098071A1 (en) 2018-04-05
RU2582057C2 (ru) 2016-04-20
CN107257491A (zh) 2017-10-17
EP3709652A1 (en) 2020-09-16
KR102154967B1 (ko) 2020-09-10
MY195141A (en) 2023-01-11
EP3432584B1 (en) 2020-05-13
KR102154964B1 (ko) 2020-09-10
HUE049148T2 (hu) 2020-09-28
WO2013129616A1 (ja) 2013-09-06
MY195140A (en) 2023-01-11
EP3432582B1 (en) 2020-04-01
TW201336315A (zh) 2013-09-01
KR20200008015A (ko) 2020-01-22
JPWO2013129617A1 (ja) 2015-07-30
KR102154966B1 (ko) 2020-09-10
US9955164B2 (en) 2018-04-24
WO2013129618A1 (ja) 2013-09-06
JP6075485B2 (ja) 2017-02-08
CA2862282A1 (en) 2013-09-06
US10277898B2 (en) 2019-04-30
KR20200103875A (ko) 2020-09-02
US20150023412A1 (en) 2015-01-22
CN113286155A (zh) 2021-08-20
JPWO2013129203A1 (ja) 2015-07-30
JP6075484B2 (ja) 2017-02-08
US10349053B2 (en) 2019-07-09
KR102074602B1 (ko) 2020-02-06
MY176387A (en) 2020-08-05
IN2015DN00926A (ja) 2015-07-10
JP6465226B2 (ja) 2019-02-06
HUE056281T2 (hu) 2022-02-28
CN113286155B (zh) 2022-12-13
MX339576B (es) 2016-05-31
JP6299890B2 (ja) 2018-03-28
JPWO2013129618A1 (ja) 2015-07-30
US9813714B2 (en) 2017-11-07
EP2822275A1 (en) 2015-01-07
EP3300370A1 (en) 2018-03-28
CN109803149B (zh) 2021-10-01
JP5904267B2 (ja) 2016-04-13
US20180103254A1 (en) 2018-04-12
CN110913224B (zh) 2022-05-03
EP3432583B1 (en) 2020-04-01
PL3432584T3 (pl) 2020-09-07
DK3282708T3 (da) 2019-05-20
MX2021015794A (es) 2022-06-14
BR112014020801A2 (ja) 2017-06-20
US9648316B2 (en) 2017-05-09
US20190260993A1 (en) 2019-08-22
KR20200008013A (ko) 2020-01-22
JP5904266B2 (ja) 2016-04-13
EP3282708A1 (en) 2018-02-14
JP2017085639A (ja) 2017-05-18
US20140369408A1 (en) 2014-12-18
US9967566B2 (en) 2018-05-08
TW201715885A (zh) 2017-05-01
JP6465227B2 (ja) 2019-02-06
TW201715884A (zh) 2017-05-01
CN104126306A (zh) 2014-10-29
TWI519133B (zh) 2016-01-21
KR102153270B1 (ko) 2020-09-07
TWI612798B (zh) 2018-01-21
JP2020036372A (ja) 2020-03-05
KR20200010571A (ko) 2020-01-30

Similar Documents

Publication Publication Date Title
JP6635184B2 (ja) 画像処理装置および方法
AU2020205233A1 (en) Image processing device and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R151 Written notification of patent or utility model registration

Ref document number: 6635184

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151