JP6070870B2 - 画像処理装置、画像処理方法、プログラム及び記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP6070870B2
JP6070870B2 JP2016007191A JP2016007191A JP6070870B2 JP 6070870 B2 JP6070870 B2 JP 6070870B2 JP 2016007191 A JP2016007191 A JP 2016007191A JP 2016007191 A JP2016007191 A JP 2016007191A JP 6070870 B2 JP6070870 B2 JP 6070870B2
Authority
JP
Japan
Prior art keywords
unit
quantization matrix
square
image
transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016007191A
Other languages
English (en)
Other versions
JP2016103850A (ja
Inventor
裕音 櫻井
裕音 櫻井
田中 潤一
潤一 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2016103850A publication Critical patent/JP2016103850A/ja
Application granted granted Critical
Publication of JP6070870B2 publication Critical patent/JP6070870B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本開示は、画像処理装置、画像処理方法、プログラム及び記録媒体に関する。
画像符号化方式の標準仕様の1つであるH.264/AVCでは、High Profile以上のプロファイルにおいて、画像データの量子化の際に、直交変換係数の成分ごとに異なる量子化ステップを用いることができる。直交変換係数の成分ごとの量子化ステップは、直交変換の単位と同等のサイズで定義される量子化行列(スケーリングリストともいう)及び基準のステップ値に基づいて設定され得る。
図28は、H.264/AVCにおいて予め定義されている4種類の既定の量子化行列を示している。行列SL1は、イントラ予測モードの4×4の既定の量子化行列である。行列SL2は、インター予測モードの4×4の既定の量子化行列である。行列SL3は、イントラ予測モードの8×8の既定の量子化行列である。行列SL4は、インター予測モードの8×8の既定の量子化行列である。また、ユーザは、シーケンスパラメータセット又はピクチャパラメータセットにおいて、図28に示した既定の行列とは異なる独自の量子化行列を定義することができる。なお、量子化行列の指定が無い場合には、全ての成分について等しい量子化ステップを有するフラットな量子化行列が使用され得る。
H.264/AVCに続く次世代の画像符号化方式として標準化が進められているHEVC(High Efficiency Video Coding)では、従来のマクロブロックに相当する符号化単位(CU:Coding Unit)という概念が導入されている(下記非特許文献1参照)。さらに、1つの符号化単位は、予測処理の単位を意味する1つ以上の予測単位(Prediction Unit:PU)に分割され得る。そして、各予測単位について、イントラ予測又はインター予測が行われる。また、1つの符号化単位は、直交変換の単位を意味する1つ以上の変換単位(Transform Unit:TU)に分割され得る。そして、各変換単位について、画像データから変換係数データへの直交変換、及び変換係数データの量子化が行われる。下記非特許文献2は、比較的サイズの小さい非正方形の予測単位(例えば、ライン状の又は矩形の予測単位)をイントラ予測モードにおいて選択可能とする、短距離(Short Distance)イントラ予測法と呼ばれる手法を提案している。この場合、変換単位の形状もまた、予測単位の形状に合わせて非正方形となり得る。
JCTVC-B205, "Test Model under Consideration", ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2nd Meeting: Geneva, 21-28 July, 2010 JCTVC-E278, "CE6.b1 Report on Short Distance Intra Prediction Method", ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, 16-23 March, 2011
しかしながら、選択可能な変換単位の形状及びサイズの種類が多くなれば、対応する量子化行列の数も増加し、量子化行列のための符号量の増加が却って符号化効率の低下を招き得る。従って、使用される量子化行列の候補が増加しても符号化効率を著しく低下させない仕組みが提供されることが望ましい。
本開示によれば、画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化する量子化部と、前記量子化部により量子化された変換係数データを符号化する符号化部と、を備える画像処理装置が提供される。
また、本開示によれば、画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化することと、量子化された変換係数データを符号化することと、を含む画像処理方法が提供される。
また、本開示によれば、画像処理装置を制御するプロセッサを、画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化する量子化部と、前記量子化部により量子化された変換係数データを符号化する符号化部と、として機能させるためのプログラムが提供される。本開示によれば、上述したプログラムを記録したコンピュータ読取可能な記録媒体もまた提供される。
以上説明したように、本開示によれば、選択可能な変換単位の種類の増加に伴って使用される量子化行列の候補が増加しても、符号化効率を著しく低下させない仕組みが提供される。
一実施形態に係る画像符号化装置の構成の一例を示すブロック図である。 図1に示したシンタックス処理部の詳細な構成の一例を示すブロック図である。 図1に示した直交変換部の詳細な構成の一例を示すブロック図である。 図1に示した量子化部の詳細な構成の一例を示すブロック図である。 量子化行列の生成のためのパラメータの一例を示す説明図である。 コピーモードでの非正方形の量子化行列の生成について説明するための第1の説明図である。 コピーモードでの非正方形の量子化行列の生成について説明するための第2の説明図である。 コピーモードでの非正方形の量子化行列の生成について説明するための第3の説明図である。 転置モードでの量子化行列の生成について説明するための説明図である。 非正方形の量子化行列を生成するための簡略化された手法について説明するための第1の説明図である。 非正方形の量子化行列を生成するための簡略化された手法について説明するための第2の説明図である。 既定の正方形の量子化行列が用いられる場合に非正方形の量子化行列を生成するための手法について説明するための説明図である。 非正方形の量子化行列のためのスキャンパターンの例について説明するための説明図である。 一実施形態に係る符号化時の処理の流れの一例を示すフローチャートである。 一実施形態に係る画像復号装置の構成の一例を示すブロック図である。 図12に示したシンタックス処理部の詳細な構成の一例を示すブロック図である。 図12に示した逆量子化部の詳細な構成の一例を示すブロック図である。 図12に示した逆直交変換部の詳細な構成の一例を示すブロック図である。 一実施形態に係る復号時の処理の流れの一例を示すフローチャートである。 図16に示した量子化行列生成処理の流れの一例を示すフローチャートである。 マルチビューコーデックについて説明するための説明図である。 一実施形態に係る画像符号化処理のマルチビューコーデックへの適用について説明するための説明図である。 一実施形態に係る画像復号処理のマルチビューコーデックへの適用について説明するための説明図である。 スケーラブルコーデックについて説明するための説明図である。 一実施形態に係る画像符号化処理のスケーラブルコーデックへの適用について説明するための説明図である。 一実施形態に係る画像復号処理のスケーラブルコーデックへの適用について説明するための説明図である。 テレビジョン装置の概略的な構成の一例を示すブロック図である。 携帯電話機の概略的な構成の一例を示すブロック図である。 記録再生装置の概略的な構成の一例を示すブロック図である。 撮像装置の概略的な構成の一例を示すブロック図である。 H.264/AVCにおいて予め定義されている既定の量子化行列を示す説明図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下の順序で説明を行う。
1.一実施形態に係る画像符号化装置の構成例
1−1.全体的な構成例
1−2.シンタックス処理部の構成例
1−3.直交変換部の構成例
1−4.量子化部の構成例
1−5.パラメータ構成例
1−6.非正方形の量子化行列の生成の例
1−7.スキャンパターンの例
2.一実施形態に係る符号化時の処理の流れ
3.一実施形態に係る画像復号装置の構成例
3−1.全体的な構成例
3−2.シンタックス処理部の構成例
3−3.逆量子化部の構成例
3−4.逆直交変換部の構成例
4.一実施形態に係る復号時の処理の流れ
5.様々なコーデックへの適用
5−1.マルチビューコーデック
5−2.スケーラブルコーデック
6.応用例
7.まとめ
<1.一実施形態に係る画像符号化装置の構成例>
本節では、一実施形態に係る画像符号化装置の構成例について説明する。
[1−1.全体的な構成例]
図1は、一実施形態に係る画像符号化装置10の構成の一例を示すブロック図である。図1を参照すると、画像符号化装置10は、A/D(Analogue to Digital)変換部11、並べ替えバッファ12、シンタックス処理部13、減算部14、直交変換部15、量子化部16、可逆符号化部17、蓄積バッファ18、レート制御部19、逆量子化部21、逆直交変換部22、加算部23、デブロックフィルタ24、フレームメモリ25、セレクタ26、イントラ予測部30、動き探索部40、及びモード選択部50を備える。
A/D変換部11は、アナログ形式で入力される画像信号をデジタル形式の画像データに変換し、一連のデジタル画像データを並べ替えバッファ12へ出力する。
並べ替えバッファ12は、A/D変換部11から入力される一連の画像データに含まれる画像を並べ替える。並べ替えバッファ12は、符号化処理に係るGOP(Group of Pictures)構造に応じて画像を並べ替えた後、並べ替え後の画像データをシンタックス処理部13へ出力する。
並べ替えバッファ12からシンタックス処理部13へ出力される画像データは、NAL(Network Abstraction Layer:ネットワーク抽象レイヤ)ユニットという単位でビットストリームへマッピングされる。画像データのストリームは、1つ以上のシーケンスを含む。シーケンスの先頭のピクチャは、IDR(Instantaneous Decoding Refresh)ピクチャと呼ばれる。各シーケンスは1つ以上のピクチャを含み、さらに各ピクチャは1つ以上のスライスを含む。H.264/AVC及びHEVCでは、これらスライスが画像の符号化及び復号の基本的な単位である。各スライスのデータは、VCL(Video Coding Layer:ビデオ符号化レイヤ) NALユニットとして認識される。
シンタックス処理部13は、並べ替えバッファ12から入力される画像データのストリーム内のNALユニットを順次認識し、ヘッダ情報を格納する非VCL NALユニットをストリームに挿入する。シンタックス処理部13がストリームに挿入する非VCL NALユニットは、シーケンスパラメータセット(SPS:Sequence Parameter Set)及びピクチャパラメータセット(PPS:Picture Parameter Set)を含む。SPS及びPPSに格納されるヘッダ情報は、例えば、後に説明する量子化行列に関連するパラメータ(以下、量子化行列パラメータという)を含む。なお、SPS及びPPSとは異なる新たなパラメータセットが定義されてもよい。例えば、シンタックス処理部13は、量子化行列パラメータのみを格納する量子化行列パラメータセット(QMPS:Quantization Matrix Parameter Set)をストリームに挿入してもよい。また、シンタックス処理部13は、スライスの先頭にスライスヘッダ(SH:Slice Header)を付加する。そして、シンタックス処理部13は、VCL NALユニット及び非VCL NALユニットを含む画像データのストリームを、減算部14、イントラ予測部30及び動き探索部40へ出力する。シンタックス処理部13の詳細な構成について、後にさらに説明する。
減算部14には、シンタックス処理部13から入力される画像データ、及び後に説明するモード選択部50により選択される予測画像データが供給される。減算部14は、シンタックス処理部13から入力される画像データとモード選択部50から入力される予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部15へ出力する。
直交変換部15は、符号化される画像に変換単位を設定し、各変換単位について画像データを直交変換することにより変換係数データを生成する。本実施形態において、直交変換部15により設定される変換単位の形状は、正方形又は非正方形であってよい。正方形の変換単位の一辺のサイズは、4画素、8画素、16画素又は32画素などであってよい。非正方形の変換単位の長辺のサイズもまた、4画素、8画素、16画素又は32画素などであってよく、長辺のサイズと短辺のサイズとの比率は、2:1、4:1又は8:1などであってよい。直交変換部15による直交変換の対象となる画像データは、減算部14から入力される予測誤差データである。直交変換部15による直交変換は、例えば、離散コサイン変換(DCT)方式、離散サイン変換(DST)方式、アダマール変換方式又はカルーネン・レーベ変換方式などの任意の直交変換方式に従って行われてよい。直交変換部15は、直交変換処理を通じて予測誤差データから変換された変換係数データを量子化部16へ出力する。直交変換部15の詳細な構成について、後にさらに説明する。
量子化部16は、直交変換部15から入力される各変換単位の変換係数データを、各変換単位に対応する量子化行列を用いて量子化し、量子化後の変換係数データ(以下、量子化データという)を可逆符号化部17及び逆量子化部21へ出力する。量子化データのビットレートは、レート制御部19からのレート制御信号に基づいて制御される。量子化部16により使用される量子化行列は、SPS若しくはPPS、又はその他のパラメータセット内で定義され、スライスごとにスライスヘッダ内で指定され得る。量子化行列をパラメータセット内で定義する代わりに、図28に例示したような既定の量子化行列を使用することも可能であり、その場合、量子化行列の定義のためのパラメータは不要となる。量子化部16の詳細な構成について、後にさらに説明する。
可逆符号化部17は、量子化部16から入力される量子化データを符号化することにより、符号化ストリームを生成する。また、可逆符号化部17は、シンタックス処理部13によりストリームに挿入される量子化行列パラメータを符号化し、符号化したパラメータを符号化ストリームに多重化する。また、可逆符号化部17は、モード選択部50から入力されるイントラ予測に関する情報又はインター予測に関する情報を符号化し、符号化した情報を符号化ストリームに多重化する。可逆符号化部17による符号化は、典型的には、算術符号、ゴロム符号又はハフマン符号などに基づく可逆的な可変長符号化であってよい。そして、可逆符号化部17は、生成した符号化ストリームを蓄積バッファ18へ出力する。
蓄積バッファ18は、可逆符号化部17から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ18は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部(例えば、通信インタフェース又は周辺機器との接続インタフェースなど)へ出力する。
レート制御部19は、蓄積バッファ18の空き容量を監視する。そして、レート制御部19は、蓄積バッファ18の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部16へ出力する。例えば、レート制御部19は、蓄積バッファ18の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部19は、蓄積バッファ18の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。
逆量子化部21は、量子化部16から入力される量子化データについて、量子化部16による量子化処理の際に設定されたものと同じ量子化行列を用いて、逆量子化処理を行う。そして、逆量子化部21は、逆量子化処理により取得される変換係数データを、逆直交変換部22へ出力する。
逆直交変換部22は、逆量子化部21から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。逆直交変換部22により使用される直交変換方式は、直交変換部15による直交変換処理の際に選択された方式と等しい。そして、逆直交変換部22は、復元した予測誤差データを加算部23へ出力する。
加算部23は、逆直交変換部22から入力される復元された予測誤差データとモード選択部50から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部23は、生成した復号画像データをデブロックフィルタ24及びフレームメモリ25へ出力する。
デブロックフィルタ24は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ24は、加算部23から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ25へ出力する。
フレームメモリ25は、加算部23から入力される復号画像データ、及びデブロックフィルタ24から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。
セレクタ26は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部30に供給する。また、セレクタ26は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとして動き探索部40に供給する。
イントラ予測部30は、シンタックス処理部13から入力される符号化対象の画像データ、及びセレクタ26を介して供給される復号画像データに基づいて、各イントラ予測モードのイントラ予測処理を行う。例えば、イントラ予測部30は、各イントラ予測モードによる予測結果を所定のコスト関数を用いて評価する。そして、イントラ予測部30は、コスト関数値が最小となるイントラ予測モード、即ち圧縮率が最も高くなるイントラ予測モードを、最適なイントラ予測モードとして選択する。そして、イントラ予測部30は、予測画像データ、選択した最適なイントラ予測モードなどを含むイントラ予測に関する情報、及びコスト関数値を、モード選択部50へ出力する。
動き探索部40は、シンタックス処理部13から入力される符号化対象の画像データ、及びセレクタ26を介して供給される復号画像データに基づいて、インター予測処理(フレーム間予測処理)を行う。例えば、動き探索部40は、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、動き探索部40は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、動き探索部40は、当該最適な予測モードに従って予測画像データを生成する。そして、動き探索部40は、予測画像データ、選択した最適な予測モードなどを含むインター予測に関する情報、及びコスト関数値を、モード選択部50へ出力する。
モード選択部50は、イントラ予測部30から入力されるイントラ予測に関するコスト関数値と動き探索部40から入力されるインター予測に関するコスト関数値とを比較する。そして、モード選択部50は、イントラ予測及びインター予測のうちコスト関数値がより少ない予測手法を選択する。モード選択部50は、イントラ予測を選択した場合には、イントラ予測に関する情報を可逆符号化部17へ出力すると共に、予測画像データを減算部14及び加算部23へ出力する。また、モード選択部50は、インター予測を選択した場合には、インター予測に関する上述した情報を可逆符号化部17へ出力すると共に、予測画像データを減算部14及び加算部23へ出力する。
[1−2.シンタックス処理部の構成例]
図2は、図1に示した画像符号化装置10のシンタックス処理部13の詳細な構成の一例を示すブロック図である。図2を参照すると、シンタックス処理部13は、設定保持部132、パラメータ生成部134及び挿入部136を有する。
(1)設定保持部
設定保持部132は、画像符号化装置10による符号化処理のために使用される様々な設定を保持する。例えば、設定保持部132は、画像データの各シーケンスのプロファイル、各ピクチャの符号化モード、GOP構造に関するデータ、並びに符号化単位、予測単位及び変換単位の設定などを保持する。また、本実施形態において、設定保持部132は、量子化部16(及び逆量子化部21)により使用される量子化行列についての設定を保持する。これら設定は、典型的には、オフラインでの画像の解析に基づいて予め決定され得る。
(2)パラメータ生成部
パラメータ生成部134は、設定保持部132により保持されている設定を定義するパラメータを生成し、生成したパラメータを挿入部136へ出力する。
例えば、本実施形態において、パラメータ生成部134は、量子化部16により使用される候補となる量子化行列を生成するための量子化行列パラメータを生成する。量子化部16により使用される量子化行列の候補は、画像内に設定され得る変換単位の種類の各々に対応する量子化行列を含む。本実施形態において、変換単位の種類は、少なくとも変換単位の形状及びサイズの組合せによって区別される。パラメータ生成部134により生成される量子化行列パラメータの一例について、後にさらに説明する。
(3)挿入部
挿入部136は、パラメータ生成部134により生成されるパラメータ群をそれぞれ含むSPS、PPS及びスライスヘッダなどのヘッダ情報を、並べ替えバッファ12から入力される画像データのストリームに挿入する。挿入部136により画像データのストリームに挿入されるヘッダ情報には、パラメータ生成部134により生成される量子化行列パラメータが含まれる。そして、挿入部136は、ヘッダ情報の挿入された画像データのストリームを、減算部14、イントラ予測部30及び動き探索部40へ出力する。
[1−3.直交変換部の構成例]
図3は、図1に示した画像符号化装置10の直交変換部15の詳細な構成の一例を示すブロック図である。図3を参照すると、直交変換部15は、変換単位設定部152及び直交変換演算部154を有する。
(1)変換単位設定部
変換単位設定部152は、符号化される画像データを直交変換する際に使用される変換単位を画像内に設定する。変換単位設定部152により設定される変換単位の形状は、正方形又は非正方形である。例えば、変換単位設定部152は、イントラ予測部30により上述した短距離イントラ予測法が利用される場合において、予測単位として非正方形の予測単位が選択されたときに、当該予測単位と同じサイズの非正方形の変換単位を画像内に設定してもよい。
(2)直交変換演算部
直交変換演算部154は、変換単位設定部152により画像内に設定される変換単位の各々について、減算部14から入力される予測誤差データを直交変換することにより、変換係数データを生成する。そして、直交変換演算部154は、生成した変換係数データを量子化部16へ出力する。また、変換単位設定部152は、設定した変換単位を特定する変換単位情報を量子化部16へ出力する。
[1−4.量子化部の構成例]
図4は、図1に示した画像符号化装置10の量子化部16の詳細な構成の一例を示すブロック図である。図4を参照すると、量子化部16は、量子化行列設定部162及び量子化演算部164を有する。
(1)量子化行列設定部
量子化行列設定部162は、直交変換部15により設定された変換単位の各々について、直交変換により生成された変換係数データを量子化するための量子化行列を設定する。例えば、量子化行列設定部162は、まず、直交変換部15から変換単位情報を取得する。変換単位情報は、例えば、各符号化単位を1つ以上の変換単位に区切るパーティションの位置を特定する情報であってもよい。また、予測単位と変換単位とが等しい場合には、変換単位情報は、変換単位の代わりに予測単位を特定する情報であってもよい。
量子化行列設定部162は、取得した変換単位情報から各変換単位の形状及びサイズを認識し、認識した形状及びサイズに対応する量子化行列を各変換単位に設定する。一例として、8×8画素の変換単位には8行8列の量子化行列が設定され、2×8画素の変換単位には2行8列の量子化行列が設定され、8×2画素の変換単位には8行2列の量子化行列が設定される。量子化行列設定部162は、例えば、予測モード(イントラ予測/インター予測)及び信号成分(Y/Cb/Cr)の組合せごとに異なる量子化行列を各変換単位に設定してもよい。設定される量子化行列の量子化ステップは、レート制御部19からのレート制御信号に応じて調整されてもよい。
(2)量子化演算部
量子化演算部164は、各変換単位について、量子化行列設定部162により設定される量子化行列を用いて、直交変換部15から入力される変換係数データを量子化する。そして、量子化演算部164は、量子化後の変換係数データ(量子化データ)を可逆符号化部17及び逆量子化部21へ出力する。なお、量子化行列設定部162により設定される量子化行列は、逆量子化部21における逆量子化の際にも使用され得る。
[1−5.パラメータ構成例]
図5は、シンタックス処理部13のパラメータ生成部134により生成される量子化行列パラメータのうち、非正方形の量子化行列に関するパラメータの一例を示している。なお、正方形の量子化行列に関するパラメータは、H.264/AVCなどの既存の画像符号化方式と同様のパラメータであってよい。
図5を参照すると、量子化行列パラメータは、「非正方形行列フラグ」及び非正方形の各量子化行列を生成するためのパラメータ群を含む。
「非正方形行列フラグ」は、非正方形の量子化行列が使用されるか否かを表すフラグである。非正方形行列フラグが「0:No」を示す場合には、非正方形の量子化行列は使用されないため、非正方形の量子化行列を生成するための図5に示したその他のパラメータは省略される。一方、非正方形行列フラグが「1:Yes」を示す場合には、非正方形の量子化行列が使用され得ることから、以下に説明するパラメータに基づき、復号側でこれら量子化行列の生成が行われる。
非正方形の量子化行列を生成するためのパラメータの1つは、「生成モード」である。当該「生成モード」は、非正方形の量子化行列をどのように生成すべきかを表す区分である。一例として、生成モードの区分は、次のいずれかの値をとり得る。
0:全スキャンモード
1:コピーモード
2:転置モード
(1)全スキャンモード
生成モードが「0:全スキャンモード」であれば、量子化行列パラメータは、さらに「差分データ」を含む。「差分データ」は、非正方形の量子化行列を定義するデータである。「差分データ」は、例えば、非正方形の量子化行列の全ての要素を所定のスキャンパターンで1次元配列化し、その1次元配列をDPCM(Differential Pulse Code Modulation)方式で符号化したデータであってよい。
(2)コピーモード
生成モードが「1:コピーモード」であれば、非正方形の量子化行列は、対応する正方形の量子化行列のいずれかの行又は列を非正方形の量子化行列の各行又は各列にコピーすることにより生成される。ある非正方形の量子化行列に対応する正方形の量子化行列とは、当該非正方形の量子化行列の長辺のサイズと等しい一辺のサイズを有する正方形の量子化行列であってよい。この場合、量子化行列パラメータは、さらに「指定モード」を含む。当該「指定モード」は、正方形の量子化行列の行又列のうちコピー元となる行又は列がどのように指定されるかを表す区分である。一例として、当該区分は、次のいずれかの値をとり得る。
0:デフォルト
1:コピー元ID
2:方向+コピー元ID
指定モードが「0:デフォルト」であれば、予め定義される既定の位置の行又は列がコピー元の行又は列として扱われる。例えば、対象の非正方形の量子化行列のサイズが2行8列(2×8)であれば、対応する正方形の量子化行列のサイズは8行8列(8×8)である。この場合、8×8の量子化行列の第0行及び第4行、又は第0行及び第1行が既定のコピー元であってよい。また、例えば、対象の非正方形の量子化行列のサイズが8×2である場合も、対応する正方形の量子化行列のサイズは8×8である。この場合、8×8の量子化行列の第0列及び第4列、又は第0列及び第1列が既定のコピー元であってよい。なお、ここでは行列の上端の行及び左端の列をそれぞれ0番目の行及び0番目の列とする。
指定モードが「1:コピー元ID」であれば、量子化行列パラメータは、さらに「コピー元ID」を含む。「コピー元ID」は、対応する正方形の量子化行列の行又は列のうちコピー元の行又は列の位置を特定するための1つ以上の行ID又は列IDを表す。例えば、対象の非正方形の量子化行列のサイズが2×8であって、「コピー元ID」が「0」及び「3」を示しているものとする。この場合、8×8の正方形の量子化行列の第0行及び第3行がコピー元となる。なお、本指定方式では、対象の非正方形の量子化行列の長辺が水平方向の辺であれば、対応する正方形の量子化行列のいずれかの行がコピー元となる。また、対象の非正方形の量子化行列の長辺が垂直方向の辺であれば、対応する正方形の量子化行列のいずれかの列がコピー元となる。
指定モードが「2:方向+コピー元ID」であれば、対象の非正方形の量子化行列の長辺の方向に関わらず、対応する正方形の量子化行列の行をコピー元として指定することも、列をコピー元として指定することもできる。この場合、量子化行列パラメータは、さらに「コピー元ID」及び「コピー元方向」を含む。「コピー元方向」は、対応する正方形の量子化行列の行をコピー元とするか列をコピー元とするかを特定するための区分である。一例として、コピー元方向の区分は、次のいずれかの値をとり得る。
0:同方向
1:別方向
例えば、対象の非正方形の量子化行列のサイズが2×8であって、「コピー元ID」が「0」及び「3」を示し、「コピー元方向」が「0:同方向」を示しているものとする。この場合、8×8の正方形の量子化行列の第0行及び第3行がコピー元となる。一方、同様の条件において「コピー元方向」が「1:別方向」を示している場合には、8×8の正方形の量子化行列の第0列及び第3列が、それぞれ2×8の非正方形の量子化行列の第0行及び第1行のコピー元となる。
(3)転置モード
生成モードが「2:転置モード」であれば、対象の非正方形の量子化行列は、長辺のサイズと短辺のサイズとが入れ替わった別の非正方形の量子化行列の転置行列として計算される。例えば、8×2の量子化行列は、2×8の量子化行列の転置行列として計算されてよい。
「残差データ」は、生成モードが「1:コピーモード」又は「2:転置モード」である場合に量子化行列パラメータに含まれ得る。残差データは、コピー又は転置により生成される量子化行列の、実際に使用される量子化行列に対する全ての要素についての残差を、所定のスキャンパターンで1次元配列化したデータであってよい。
図5に例示した量子化行列パラメータは、上述したように、SPS若しくはPPS、又はこれらパラメータセットとは異なるパラメータセット内に挿入されてよい。なお、これら量子化行列パラメータは、一例に過ぎない。即ち、上述した量子化行列パラメータのうち一部のパラメータが省略されてもよく、又は他のパラメータが追加されてもよい。また、図5に例示した「非正方形行列フラグ」及び「残差データ」以外のパラメータは、非正方形の量子化行列の種類ごとにそれぞれ定義されてもよく、非正方形の量子化行列の複数の種類にわたって共通的に定義されてもよい。
例えば、非正方形の量子化行列がコピーモードで生成されること、及びいずれの行又は列がコピーされるかが、エンコーダ及びデコーダに共通の仕様として予め定義されてもよい。その場合には、「生成モード」、「指定モード」、「コピー元ID」及び「コピー元方向」などのパラメータをパラメータセット内に挿入しなくてよいため、オーバヘッドが削減され、符号化効率が向上し得る。
また、「非正方形行列フラグ」が「1:Yes」を示す場合であっても、対応する正方形の量子化行列として既定の量子化行列が使用されるケースでは、「非正方形行列フラグ」以外の図5に例示した量子化行列パラメータは省略されてよい。そのようなケースでは、非正方形の量子化行列についても、予め定義される既定の量子化行列が使用され得る。
[1−6.非正方形の量子化行列の生成の例]
図6A〜図6Cは、コピーモードでの非正方形の量子化行列の生成の例を示している。
図6Aの右には、生成の対象の量子化行列である2×8の非正方形の量子化行列MNS28が示されている。一方、図6Aの左には、量子化行列MNS28に対応する8×8の正方形の量子化行列MS8が示されている。また、指定モードとして「0:デフォルト」が指定されている。予め定義される既定のコピー元は、第0行及び第4行であるものとする。この場合、量子化行列MNS28は、その第0行に量子化行列MS8の第0行、第1行に量子化行列MS8の第4行をコピーすることにより生成され得る。また、コピー後の量子化行列MNS28の各要素に、必要に応じて残差が加算されてもよい。
このように、正方形の量子化行列からの行又は列のコピーにより非正方形の量子化行列を生成することを可能とすることで、非正方形の量子化行列が使用されることに起因する符号量の増加を抑制することができる。また、コピー元の行又は列の位置を既定の位置とすることで、コピー元の行又は列の位置の指定に伴う符号量の増加が回避される。
図6Bの右には、生成の対象の量子化行列である8×2の非正方形の量子化行列MNS82が示されている。一方、図6Bの左には、量子化行列MNS82に対応する8×8の正方形の量子化行列MS8が示されている。また、指定モードとして「1:コピー元ID」、コピー元IDとして(0,6)が指定されている。この場合、量子化行列MNS82は、その第0列に量子化行列MS8の第0列、第1列に量子化行列MS8の第6列をコピーすることにより生成され得る。また、コピー後の量子化行列MNS82の各要素に、必要に応じて残差が加算されてもよい。
このように、正方形の量子化行列からの非正方形の量子化行列の生成に際して、コピー元の行又は列の位置を指定することで、コピー後の行列の実際に使用される行列に対する残差をより小さくし、残差データのための符号量を抑制することが可能となる。それにより、非正方形の量子化行列が使用されることに起因する符号量の増加を一層効果的に抑制することができる。
図6Cの右には、生成の対象の量子化行列である2×4の非正方形の量子化行列MNS24が示されている。一方、図6Cの左には、量子化行列MNS24に対応する4×4の正方形の量子化行列MS4が示されている。また、指定モードとして「2:コピー元方向+コピー元ID」、コピー元IDとして(0,3)、コピー元方向として「1:別方向」が指定されている。この場合、量子化行列MNS24は、その第0行に量子化行列MS4の第0列、第1行に量子化行列MS4の第3列をコピーすることにより生成され得る。また、コピー後の量子化行列MNS24の各要素に、必要に応じて残差が加算されてもよい。
このように、非正方形の量子化行列の形状に関わらずコピー元として正方形の量子化行列の行及び列の双方を指定可能とすることで、特に非対称的な要素値を有する量子化行列が用いられる場合に、コピー元の選択の幅を広げることができる。それにより、コピー後の行列の実際に使用される行列に対する残差を極小化することができる。
図7は、転置モードでの非正方形の量子化行列の生成の例を示している。
図7の右には、生成の対象の量子化行列である2×8の非正方形の量子化行列MNS28が示されている。一方、図7の左には、8×2の非正方形の量子化行列MNS82が示されている。この場合、量子化行列MNS28は、量子化行列MNS82の転置行列(MNS82 )として生成され得る。また、転置後の量子化行列MNS28の各要素に、必要に応じて残差が加算されてもよい。
このように、転置モードにおいては、指定モード、コピー元ID及びコピー元方向などのパラメータを要することなく、コピーモードが使用される場合と同様の非正方形の量子化行列を対称的な別の非正方形の量子化行列から生成することができる。従って、非正方形の量子化行列のための符号量をさらに削減することができる。
図8A及び図8Bは、非正方形の量子化行列を生成するための簡略化された手法について説明するための説明図である。
図8Aの右には、生成の対象の量子化行列である2つの非正方形の量子化行列MNS416及びMNS164が示されている。一方、図8Aの左には、対応する8×8の正方形の量子化行列MS16が示されている。ここでは、非正方形の量子化行列がコピーモードで生成されること、及びいずれの行/列がコピーされるかが、エンコーダ及びデコーダの双方にとって既知である(例えば、仕様として予め定義される)ものとする。従って、「生成モード」、「指定モード」、「コピー元ID」及び「コピー元方向」は、量子化パラメータとして符号化されない。予め定義される既定のコピー元の行/列の位置は、いかなる位置であってもよい。図8Aの例では、予め定義される既定のコピー元の行及び列の位置は、それぞれ第0行から4行おき及び第0列から4列おきの位置であるものとする(図中斜線部)。この場合、量子化行列MNS416は、その4つの行に量子化行列MS16の第0、第4、第8及び第12行をコピーすることにより生成され得る。量子化行列MNS164は、その4つの列に量子化行列MS16の第0、第4、第8及び第12列をコピーすることにより生成され得る。
図8Bの右には、生成の対象の量子化行列である2つの非正方形の量子化行列MNS832及びMNS328が示されている。一方、図8Bの左には、対応する32×32の正方形の量子化行列MS32が示されている。図8Aの例と同様、「生成モード」、「指定モード」、「コピー元ID」及び「コピー元方向」は、量子化パラメータとして符号化されない。予め定義される既定のコピー元の行及び列の位置は、図8Aの例と同様、それぞれ第0行から4行おき及び第0列から4列おきの位置であるものとする(図中斜線部)。この場合、量子化行列MNS832は、その8つの行に量子化行列MS32の第0、第4、第8、第12、第16、第20、第24及び第28行をコピーすることにより生成され得る。量子化行列MNS328は、その8つの列に量子化行列MS32の第0、第4、第8、第12、第16、第20、第24及び第28列をコピーすることにより生成され得る。
なお、既定のコピー元の行/列の位置は、図8A及び図8Bの例のように、行列の辺のサイズの比に応じて等間隔に割当てられる位置であってもよい。その代わりに、例えば上端又は左端から連続するN個の行/列であってもよい。また、既定の位置の行/列がコピーされる代わりに、正方形の量子化行列の既定の位置の4つの要素が非正方形の量子化行列の4つの頂点位置の要素にコピーされ、残りの要素が(例えば線型補間などの手法で)補間されてもよい。また、正方形の量子化行列の既定の位置のN個の要素(Nは非正方形の量子化行列の全要素数に等しい)が非正方形の量子化行列の対応する位置の要素にそれぞれコピーされてもよい。
このように、正方形の量子化行列から非正方形の量子化行列をコピーモードで生成すること、及びどのように行列をコピーするか、を予め定義しておくことで、非正方形の量子化行列について量子化行列パラメータの多くの符号化を省略することができる。それにより、伝送のオーバヘッドが削減されると共に、エンコーダ及びデコーダの構成の複雑さを低減することができる。
図9は、既定の正方形の量子化行列が用いられる場合に非正方形の量子化行列を生成するための手法について説明するための説明図である。
図9の左には、8×8の既定の正方形の量子化行列MS8defが示されている。このような既定の正方形の量子化行列MS8defが使用される場合、対応する非正方形の量子化行列もまた、既定の行列であってよい。図9の右には、2つの既定の非正方形の量子化行列MNS28def及びMNS82defが示されている。非正方形の量子化行列MNS28def及びMNS82defは、正方形の量子化行列MS8defから(行又は列のコピーなどの手法で)生成される代わりに、例えば共通的な仕様として予め定義され、エンコーダ及びデコーダの双方のメモリ内に記憶され得る。
このように、既定の正方形の量子化行列が用いられる場合に、非正方形の量子化行列をも既定の量子化行列とすることによって、符号化される量子化行列パラメータを少なくして伝送のオーバヘッドを削減することができる。また、エンコーダ及びデコーダの構成の複雑さを低減することができる。
[1−7.スキャンパターンの例]
図5に例示した量子化行列パラメータにおいて、全スキャンモードにおける差分データ、並びにコピーモード及び転置モードにおける残差データは、何らかのスキャンパターンに従って2次元の行列を1次元化することにより生成される。正方形の量子化行列の要素を1次元化する際に一般的に利用されるスキャンパターンは、いわゆるジグザグスキャンである。これに対し、非正方形の量子化行列の要素を1次元化する際には、ジグザグスキャンに類似するスキャンパターンとは異なるスキャンパターンが利用されてもよい。
図10は、非正方形の量子化行列のために利用され得るスキャンパターンの3つの例を示している。
図10の左の第1の例は、ジグザグスキャンに類似するスキャンパターンであり、ここではこのスキャンパターンをもジグザグスキャンという。ジグザグスキャンにおいては、量子化行列の中で右上から左下にかけての斜めの線上に位置する要素の間の相関が高いことを前提として、互いに相関が高い要素群の要素が連続的にスキャンされるようにスキャン順が決定される。
図10の中央の第2の例は、非正方形の量子化行列の長辺方向に沿って並ぶ要素群を連続的にスキャンするスキャンパターンであり、このスキャンパターンを長辺優先スキャンという。長辺優先スキャンは、量子化行列の中で長辺方向に沿って並ぶ要素の間の相関が高い場合に、連続的にスキャンされる要素間の差分を小さくし、DPCM後の1次元配列を最適化する。
図10の右の第3の例は、非正方形の量子化行列の短辺方向に沿って並ぶ要素群を連続的にスキャンするスキャンパターンであり、このスキャンパターンを短辺優先スキャンという。短辺優先スキャンは、量子化行列の中で短辺方向に沿って並ぶ要素の間の相関が高い場合に、連続的にスキャンされる要素間の差分を小さくし、DPCM後の1次元配列を最適化する。
非正方形の量子化行列のために利用されるスキャンパターンは、図10に例示したスキャンパターンのうち固定的に定義されるいずれかのスキャンパターンであってもよい。その代わりに、複数のスキャンパターンの候補から、符号化効率を最適化するスキャンパターンが、シーケンスごと、ピクチャごと、又はスライスごとに適応的に選択されてもよい。その場合には、SPS、PPS又はスライスヘッダなどに、使用すべきスキャンパターンを識別するための識別子(図10に例示したスキャンID(scan_id)など)が含められ得る。
<2.一実施形態に係る符号化時の処理の流れ>
図11は、本実施形態に係る画像符号化装置10による符号化時の処理の流れの一例を示すフローチャートである。なお、ここでは、説明の簡明さの観点から、画像データの直交変換及び量子化に関連する処理ステップのみを示している。
図11を参照すると、まず、直交変換部15の変換単位設定部152は、符号化される画像データに設定すべき各変換単位の形状及びサイズを認識し、画像内に変換単位を設定する(ステップS110)。
次に、直交変換演算部154は、変換単位設定部152により設定される変換単位の各々について、画像データ(減算部14から入力される予測誤差データ)を直交変換することにより、変換係数データを生成する(ステップS120)。
次に、量子化部16の量子化行列設定部162は、設定された変換単位の形状及びサイズに応じた量子化行列を、各変換単位に設定する(ステップS130)。
次に、量子化演算部164は、各変換単位について、量子化行列設定部162により設定された量子化行列を用いて、直交変換演算部154から入力される変換係数データを量子化する(ステップS140)。
そして、可逆符号化部17は、量子化演算部164から入力される量子化データを符号化することにより符号化ストリームを生成すると共に、量子化行列パラメータを符号化して符号化ストリームに多重化する(ステップS150)。
これら処理ステップは、典型的には、符号化される画像内の全ての変換単位について繰り返され得る。
<3.一実施形態に係る画像復号装置の構成例>
本節では、一実施形態に係る画像復号装置の構成例について説明する。
[3−1.全体的な構成例]
図12は、一実施形態に係る画像復号装置60の構成の一例を示すブロック図である。図12を参照すると、画像復号装置60は、シンタックス処理部61、可逆復号部62、逆量子化部63、逆直交変換部64、加算部65、デブロックフィルタ66、並べ替えバッファ67、D/A(Digital to Analogue)変換部68、フレームメモリ69、セレクタ70及び71、イントラ予測部80、並びに動き補償部90を備える。
シンタックス処理部61は、伝送路を介して入力される符号化ストリームからSPS、PPS及びスライスヘッダなどのヘッダ情報を取得し、取得したヘッダ情報に基づいて画像復号装置60による復号処理のための様々な設定を認識する。例えば、本実施形態において、シンタックス処理部61は、各パラメータセットに含まれる量子化行列パラメータに基づいて、逆量子化部63による逆量子化処理の際に使用され得る量子化行列の候補を生成する。シンタックス処理部61の詳細な構成について、後にさらに説明する。
可逆復号部62は、シンタックス処理部61から入力される符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。そして、可逆復号部62は、復号後の量子化データを逆量子化部63へ出力する。また、可逆復号部62は、ヘッダ情報に含まれるイントラ予測に関する情報をイントラ予測部80へ出力し、インター予測に関する情報を動き補償部90へ出力する。
逆量子化部63は、シンタックス処理部61により生成される量子化行列の候補のうち各変換単位の形状及びサイズに対応する量子化行列を用いて、可逆復号部62による復号後の量子化データ(即ち、量子化された変換係数データ)を逆量子化する。逆量子化部63の詳細な構成について、後にさらに説明する。
逆直交変換部64は、復号される画像内に設定される各変換単位について、逆量子化後の変換係数データを逆直交変換することにより、予測誤差データを生成する。本実施形態において設定され得る変換単位の形状は、上述したように、正方形又は非正方形である。そして、逆直交変換部64は、生成した予測誤差データを加算部65へ出力する。
加算部65は、逆直交変換部64から入力される予測誤差データと、セレクタ71から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部65は、生成した復号画像データをデブロックフィルタ66及びフレームメモリ69へ出力する。
デブロックフィルタ66は、加算部65から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並べ替えバッファ67及びフレームメモリ69へ出力する。
並べ替えバッファ67は、デブロックフィルタ66から入力される画像を並べ替えることにより、時系列の一連の画像データを生成する。そして、並べ替えバッファ67は、生成した画像データをD/A変換部68へ出力する。
D/A変換部68は、並べ替えバッファ67から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、D/A変換部68は、例えば、画像復号装置60と接続されるディスプレイ(図示せず)にアナログ画像信号を出力することにより、画像を表示させる。
フレームメモリ69は、加算部65から入力されるフィルタリング前の復号画像データ、及びデブロックフィルタ66から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。
セレクタ70は、可逆復号部62により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ69からの画像データの出力先をイントラ予測部80と動き補償部90との間で切り替える。例えば、セレクタ70は、イントラ予測モードが指定された場合には、フレームメモリ69から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部80へ出力する。また、セレクタ70は、インター予測モードが指定された場合には、フレームメモリ69から供給されるフィルタリング後の復号画像データを参照画像データとして動き補償部90へ出力する。
セレクタ71は、可逆復号部62により取得されるモード情報に応じて、画像内のブロックごとに、加算部65へ供給すべき予測画像データの出力元をイントラ予測部80と動き補償部90との間で切り替える。例えば、セレクタ71は、イントラ予測モードが指定された場合には、イントラ予測部80から出力される予測画像データを加算部65へ供給する。セレクタ71は、インター予測モードが指定された場合には、動き補償部90から出力される予測画像データを加算部65へ供給する。
イントラ予測部80は、可逆復号部62から入力されるイントラ予測に関する情報とフレームメモリ69からの参照画像データとに基づいて画素値の画面内予測を行い、予測画像データを生成する。そして、イントラ予測部80は、生成した予測画像データをセレクタ71へ出力する。
動き補償部90は、可逆復号部62から入力されるインター予測に関する情報とフレームメモリ69からの参照画像データとに基づいて動き補償処理を行い、予測画像データを生成する。そして、動き補償部90は、生成した予測画像データをセレクタ71へ出力する。
[3−2.シンタックス処理部の構成例]
図13は、図12に示した画像復号装置60のシンタックス処理部61の詳細な構成の一例を示すブロック図である。図13を参照すると、シンタックス処理部61は、パラメータ取得部212及び生成部214を有する。
(1)パラメータ取得部
パラメータ取得部212は、画像データのストリームからSPS、PPS及びスライスヘッダなどのヘッダ情報を認識し、ヘッダ情報に含まれるパラメータを取得する。例えば、本実施形態において、パラメータ取得部212は、量子化行列を定義する量子化行列パラメータを各パラメータセットから取得する。そして、パラメータ取得部212は、取得したパラメータを生成部214へ出力する。また、パラメータ取得部212は、画像データのストリームを可逆復号部62へ出力する。
(2)生成部
生成部214は、パラメータ取得部212により取得される量子化行列パラメータに基づいて、逆量子化部63により使用され得る量子化行列の候補を生成する。本実施形態において、生成部214により生成される量子化行列は、逆直交変換部64による逆直交変換の単位である変換単位の種類(即ち、形状及びサイズの組合せ)の各々に対応する量子化行列を含む。
より具体的には、生成部214は、例えば、既定の量子化行列が使用されない場合に、符号化ストリームのパラメータセット又はヘッダ内での定義に基づいて、様々なサイズの正方形の量子化行列を生成する。また、生成部214は、非正方形の量子化行列が使用されることを示すフラグ(例えば、上述した非正方形行列フラグ)が符号化ストリームのパラメータセット又はヘッダに含まれる場合に、非正方形の量子化行列を生成する。非正方形の量子化行列は、上述した全スキャンモード、コピーモード及び転置モードのいずれかに従って生成されてよい。
例えば、コピーモードにおいて、生成部214は、非正方形の量子化行列を、対応する正方形の量子化行列の行又は列をコピーすることにより生成する。正方形の量子化行列のいずれの行又は列をコピーすべきかは、量子化行列パラメータ内のコピー元ID及びコピー元方向により指定され得る。また、コピーすべき行又は列が指定されない場合には、予め定義される既定の位置の行又は列がコピー元として扱われ得る。
また、全スキャンモードにおいて、生成部214は、正方形の量子化行列から非正方形の量子化行列を生成する代わりに、DPCM方式の差分データを用いた定義に基づいて、非正方形の量子化行列を生成する。
また、転置モードにおいて、生成部214は、非正方形の量子化行列を、当該非正方形の量子化行列と対称的な形状を有する別の非正方形の量子化行列の転置行列として生成する。コピーモード及び転置モードの場合には、生成部214は、コピー後の量子化行列又は転置後の量子化行列の各要素に、量子化行列パラメータ内で定義される残差をさらに加算してもよい。
なお、生成部214は、ある非正方形の量子化行列に対応する正方形の量子化行列が既定の量子化行列である場合には、当該非正方形の量子化行列として、予め定義される既定の非正方形の量子化行列を使用する。
生成部214は、このように生成される量子化行列の候補を逆量子化部63へ出力する。
[3−3.逆量子化部の構成例]
図14は、図12に示した画像復号装置60の逆量子化部63の詳細な構成の一例を示すブロック図である。図14を参照すると、逆量子化部63は、量子化行列設定部232及び逆量子化演算部234を有する。
(1)量子化行列設定部
量子化行列設定部232は、逆直交変換部64による逆直交変換の際に使用される変換単位の形状及びサイズを認識し、認識した形状及びサイズに対応する量子化行列を各変換単位に設定する。例えば、量子化行列設定部232は、符号化ストリームのヘッダ情報に含まれる変換単位情報を取得する。そして、量子化行列設定部232は、変換単位情報から各変換単位の形状及びサイズを認識し、シンタックス処理部61の生成部214により生成される量子化行列のうち認識した形状及びサイズに対応する量子化行列を各変換単位に設定する。なお、量子化行列設定部232は、予測モード(イントラ予測/インター予測)及び信号成分(Y/Cb/Cr)の組合せごとに異なる量子化行列を各変換単位に設定してもよい。
(2)逆量子化演算部
逆量子化演算部234は、各変換単位について、量子化行列設定部232により設定される量子化行列を用いて、可逆復号部62から入力される変換係数データ(量子化データ)を逆量子化する。そして、逆量子化演算部234は、逆量子化後の変換係数データを逆直交変換部64へ出力する。
[3−4.逆直交変換部の構成例]
図15は、図12に示した画像復号装置60の逆直交変換部64の詳細な構成の一例を示すブロック図である。図15を参照すると、逆直交変換部64は、変換単位設定部242及び逆直交変換演算部244を有する。
(1)変換単位設定部
変換単位設定部242は、復号される画像データを逆直交変換する際に使用される変換単位として、正方形又は非正方形の変換単位を設定する。変換単位設定部242により設定される変換単位の形状は、正方形又は非正方形である。例えば、変換単位設定部242は、イントラ予測部80により上述した短距離イントラ予測法が利用される場合において、予測単位として非正方形の予測単位が選択されたときに、当該予測単位と同じサイズの非正方形の変換単位を画像内に設定してもよい。
(2)直交変換演算部
逆直交変換演算部244は、変換単位設定部242により設定される各変換単位について、逆量子化部63から入力される変換係数データを逆直交変換することにより、予測誤差データを生成する。そして、逆直交変換演算部244は、生成した予測誤差データを加算部65へ出力する。
<4.一実施形態に係る復号時の処理の流れ>
(1)処理の流れの概要
図16は、本実施形態に係る画像復号装置60による復号時の処理の流れの一例を示すフローチャートである。なお、ここでは、説明の簡明さの観点から、画像データの逆量子化及び逆直交変換に関連する処理ステップのみを示している。
図16を参照すると、まず、シンタックス処理部61のパラメータ取得部212は、画像データのストリームからSPS、PPS及びスライスヘッダなどのヘッダ情報を認識し、ヘッダ情報に含まれる量子化行列パラメータを取得する(ステップS210)。
次に、シンタックス処理部61の生成部214は、パラメータ取得部212により取得された量子化行列パラメータに基づいて、逆量子化部63により使用され得る量子化行列の候補のうち正方形の量子化行列を生成する(ステップS220)。
次に、生成部214は、上記量子化行列パラメータに基づいて、逆量子化部63により使用され得る量子化行列の候補のうち非正方形の量子化行列を生成する(ステップS230)。ここでの詳細な処理の流れについて、後に図17を用いてさらに説明する。
次に、逆量子化部63の量子化行列設定部232は、各変換単位に、当該変換単位の形状及びサイズの組合せに対応する量子化行列を設定する(ステップS260)。
次に、逆量子化部63の逆量子化演算部234は、各変換単位について、量子化行列設定部232により設定された量子化行列を用いて、可逆復号部62から入力される量子化データを逆量子化する(ステップS270)。
次に、逆直交変換部64は、各変換単位について、逆量子化部63から入力される変換係数データを逆直交変換することにより、予測誤差データを生成する(ステップS280)。ここで生成される予測誤差データが加算部65により予測画像データに加算されることで、符号化前の画像データが復元される。
なお、ステップS260〜ステップS280の処理は、典型的には、復号される画像内の全ての変換単位について繰り返され得る。
(2)非正方形の量子化行列生成処理
図17は、図16のステップS230における非正方形の量子化行列生成処理の流れの一例を示すフローチャートである。図17に示した処理は、量子化行列パラメータを含むパラメータセットごとに行われ得る。なお、各パラメータセットは、図5に例示したような量子化行列パラメータを有するものとする。
図17を参照すると、まず、生成部214は、非正方形行列フラグを取得する(ステップS231)。そして、生成部214は、非正方形行列フラグの値に基づいて、非正方形の量子化行列を生成するか否かを決定する(ステップS232)。ここで、生成部214は、非正方形の量子化行列を生成しないと決定した場合には、その後の処理をスキップする。一方、生成部214が非正方形の量子化行列を生成すると決定した場合には、処理はステップS234に進む。
ステップS236〜ステップS252の処理は、非正方形の量子化行列の種類ごとに繰り返され得る(ステップS234)。非正方形の量子化行列の種類は、例えば量子化行列のサイズ、予測モード及び信号成分の組合せにより区別され得る。
ステップS238では、生成部214は、対応する正方形の量子化行列が既定の量子化行列であるか否かを判定する(ステップS236)。ここで、対応する正方形の量子化行列が既定の量子化行列である場合には、処理はステップS237へ進む。一方、対応する正方形の量子化行列が既定の量子化行列ではない場合には、処理はステップS238へ進む。
ステップS237では、生成部214は、生成対象の非正方形の量子化行列として、予め定義されメモリ内に記憶されている既定の量子化行列を取得する(ステップS237)。
ステップS238では、生成部214は、生成モードを取得する(ステップS238)。そして、生成部214は、取得した生成モードの値に基づいて、その後の処理を切り替える。
例えば、生成部214は、生成モードが全スキャンモードを示している場合には(ステップS240)、さらに差分データを取得し、全スキャンモードで非正方形の量子化行列を生成する(ステップS242)。
また、例えば、生成部214は、生成モードがコピーモードを示している場合には(ステップS244)、指定モード、並びに、必要に応じてコピー元ID及びコピー元方向をさらに取得する(ステップS246)。そして、生成部214は、コピーモードで、即ち対応する正方形の量子化行列から指定された行又は列をコピーすることにより、非正方形の量子化行列を生成する(ステップS248)。
また、例えば、生成部214は、生成モードが転置モードを示している場合には、非正方形の量子化行列を、当該非正方形の量子化行列と対称的な形状を有する別の非正方形の量子化行列から転置モードで生成する(ステップS250)。
なお、非正方形の量子化行列が正方形の量子化行列からのコピーによって生成されることが予め定義されている場合には、生成モードの値に基づく処理の切り替えが行われることなく、原則としてコピーモードで非正方形の量子化行列が生成されてよい。
さらに、生成部214は、コピーモード又は転置モードにおいて、残差データが存在する場合には、コピー後の量子化行列又は転置後の量子化行列の各要素に残差を加算する(ステップS252)。
<5.様々なコーデックへの適用>
本開示に係る技術は、画像の符号化及び復号に関連する様々なコーデックに適用可能である。本節では、本開示に係る技術がマルチビューコーデック及びスケーラブルコーデックにそれぞれ適用される例について説明する。
[5−1.マルチビューコーデック]
マルチビューコーデックは、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図18は、マルチビューコーデックについて説明するための説明図である。図18を参照すると、3つの視点においてそれぞれ撮影される3つのビューのフレームのシーケンスが示されている。各ビューには、ビューID(view_id)が付与される。これら複数のビューのうちいずれか1つのビューが、ベースビュー(base view)に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図18の例では、ビューIDが“0”であるビューがベースビューであり、ビューIDが“1”又は“2”である2つのビューがノンベースビューである。これらマルチビューの画像データを符号化する際、ベースビューのフレームについての符号化情報に基づいてノンベースビューのフレームを符号化することにより、全体としての符号化ストリームのデータサイズが圧縮され得る。
上述したマルチビューコーデックに従った符号化処理及び復号処理において、非正方形の変換単位に対応する量子化行列が、正方形の変換単位に対応する量子化行列から生成され得る。各ビューで利用される量子化行列の生成にあたり、何らかの制御パラメータ(例えば、図5に例示したパラメータ)が、ビューごとに設定されてもよい。また、ベースビューにおいて設定された制御パラメータが、ノンベースビューにおいて再利用されてもよい。また、ビュー間で制御パラメータが再利用されるか否かを示すフラグが、追加的に指定されてもよい。
図19は、上述した画像符号化処理のマルチビューコーデックへの適用について説明するための説明図である。図19を参照すると、一例としてのマルチビュー符号化装置710の構成が示されている。マルチビュー符号化装置710は、第1符号化部720、第2符号化部730及び多重化部740を備える。
第1符号化部720は、ベースビュー画像を符号化し、ベースビューの符号化ストリームを生成する。第2符号化部730は、ノンベースビュー画像を符号化し、ノンベースビューの符号化ストリームを生成する。多重化部740は、第1符号化部720により生成されるベースビューの符号化ストリームと、第2符号化部730により生成される1つ以上のノンベースビューの符号化ストリームとを多重化し、マルチビューの多重化ストリームを生成する。
図19に例示した第1符号化部720及び第2符号化部730は、上述した実施形態に係る画像符号化装置10と同等の構成を有する。それにより、各ビューで利用される非正方形の変換単位に対応する量子化行列を、正方形の変換単位に対応する量子化行列から生成することが可能となる。これら処理を制御するパラメータは、各ビューの符号化ストリームのヘッダ領域に挿入されてもよく、又は多重化ストリーム内の共通的なヘッダ領域に挿入されてもよい。
図20は、上述した画像復号処理のマルチビューコーデックへの適用について説明するための説明図である。図20を参照すると、一例としてのマルチビュー復号装置760の構成が示されている。マルチビュー復号装置760は、逆多重化部770、第1復号部780及び第2復号部790を備える。
逆多重化部770は、マルチビューの多重化ストリームをベースビューの符号化ストリーム及び1つ以上のノンベースビューの符号化ストリームに逆多重化する。第1復号部780は、ベースビューの符号化ストリームからベースビュー画像を復号する。第2復号部790は、ノンベースビューの符号化ストリームからノンベースビュー画像を復号する。
図20に例示した第1復号部780及び第2復号部790は、上述した実施形態に係る画像復号装置60と同等の構成を有する。それにより、各ビューで利用される非正方形の変換単位に対応する量子化行列を、正方形の変換単位に対応する量子化行列から生成することが可能となる。これら処理を制御するパラメータは、各ビューの符号化ストリームのヘッダ領域から取得されてもよく、又は多重化ストリーム内の共通的なヘッダ領域から取得されてもよい。
[5−2.スケーラブルコーデック]
スケーラブルコーデックは、いわゆる階層符号化を実現するための画像符号化方式である。図21は、スケーラブルコーデックについて説明するための説明図である。図21を参照すると、空間解像度、時間解像度又は画質の異なる3つのレイヤのフレームのシーケンスが示されている。各レイヤには、レイヤID(layer_id)が付与される。これら複数のレイヤのうち、最も解像度(又は画質)の低いレイヤが、ベースレイヤ(base layer)である。ベースレイヤ以外のレイヤは、エンハンスメントレイヤと呼ばれる。図21の例では、レイヤIDが“0”であるレイヤがベースレイヤであり、レイヤIDが“1”又は“2”である2つのレイヤがエンハンスメントレイヤである。これらマルチレイヤの画像データを符号化する際、ベースレイヤのフレームについての符号化情報に基づいてエンハンスメントレイヤのフレームを符号化することにより、全体としての符号化ストリームのデータサイズが圧縮され得る。
上述したスケーラブルコーデックに従った符号化処理及び復号処理において、非正方形の変換単位に対応する量子化行列が、正方形の変換単位に対応する量子化行列から生成され得る。各レイヤで利用される量子化行列の生成にあたり、何らかの制御パラメータ(例えば、図5に例示したパラメータ)が、レイヤごとに設定されてもよい。また、ベースレイヤにおいて設定された制御パラメータが、エンハンスメントレイヤにおいて再利用されてもよい。また、レイヤ間で制御パラメータが再利用されるか否かを示すフラグが、追加的に指定されてもよい。
図22は、上述した画像符号化処理のスケーラブルコーデックへの適用について説明するための説明図である。図22を参照すると、一例としてのスケーラブル符号化装置810の構成が示されている。スケーラブル符号化装置810は、第1符号化部820、第2符号化部830及び多重化部840を備える。
第1符号化部820は、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。第2符号化部830は、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。多重化部840は、第1符号化部820により生成されるベースレイヤの符号化ストリームと、第2符号化部830により生成される1つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。
図22に例示した第1符号化部820及び第2符号化部830は、上述した実施形態に係る画像符号化装置10と同等の構成を有する。それにより、各レイヤで利用される非正方形の変換単位に対応する量子化行列を、正方形の変換単位に対応する量子化行列から生成することが可能となる。これら処理を制御するパラメータは、各レイヤの符号化ストリームのヘッダ領域に挿入されてもよく、又は多重化ストリーム内の共通的なヘッダ領域に挿入されてもよい。
図23は、上述した画像復号処理のスケーラブルコーデックへの適用について説明するための説明図である。図23を参照すると、一例としてのスケーラブル復号装置860の構成が示されている。スケーラブル復号装置860は、逆多重化部870、第1復号部880及び第2復号部890を備える。
逆多重化部870は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び1つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。第1復号部880は、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。第2復号部890は、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。
図23に例示した第1復号部880及び第2復号部890は、上述した実施形態に係る画像復号装置60と同等の構成を有する。それにより、各レイヤで利用される非正方形の変換単位に対応する量子化行列を、正方形の変換単位に対応する量子化行列から生成することが可能となる。これら処理を制御するパラメータは、各レイヤの符号化ストリームのヘッダ領域から取得されてもよく、又は多重化ストリーム内の共通的なヘッダ領域から取得されてもよい。
<6.応用例>
上述した実施形態に係る画像符号化装置10及び画像復号装置60は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
[6−1.第1の応用例]
図24は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース909、制御部910、ユーザインタフェース911、及びバス912を備える。
チューナ902は、アンテナ901を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ902は、復調により得られた符号化ビットストリームをデマルチプレクサ903へ出力する。即ち、チューナ902は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、デマルチプレクサ903は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に映像を表示させる。また、映像信号処理部905は、ネットワークを介して供給されるアプリケーション画面を表示部906に表示させてもよい。また、映像信号処理部905は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、生成した画像を出力画像に重畳してもよい。
表示部906は、映像信号処理部905から供給される駆動信号により駆動され、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOLEDなど)の映像面上に映像又は画像を表示する。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、音声データについてノイズ除去などの追加的な処理を行ってもよい。
外部インタフェース909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース909を介して受信される映像ストリーム又は音声ストリームが、デコーダ904により復号されてもよい。即ち、外部インタフェース909もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
制御部910は、CPU(Central Processing Unit)などのプロセッサ、並びにRAM(Random Access Memory)及びROM(Read Only Memory)などのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置900の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース911から入力される操作信号に応じて、テレビジョン装置900の動作を制御する。
ユーザインタフェース911は、制御部910と接続される。ユーザインタフェース911は、例えば、ユーザがテレビジョン装置900を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース911は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部910へ出力する。
バス912は、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、音声信号処理部907、外部インタフェース909及び制御部910を相互に接続する。
このように構成されたテレビジョン装置900において、デコーダ904は、上述した実施形態に係る画像復号装置60の機能を有する。従って、テレビジョン装置900で復号される映像について、非正方形の変換単位が使用され得る場合にも、量子化行列の定義に要する符号量の増大を抑制することができる。
[6−2.第2の応用例]
図25は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
アンテナ921は、通信部922に接続される。スピーカ924及びマイクロホン925は、音声コーデック923に接続される。操作部932は、制御部931に接続される。バス933は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、及び制御部931を相互に接続する。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。
音声通話モードにおいて、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック923は、圧縮後の音声データを通信部922へ出力する。通信部922は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック923へ出力する。音声コーデック923は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
また、データ通信モードにおいて、例えば、制御部931は、操作部932を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部931は、文字を表示部930に表示させる。また、制御部931は、操作部932を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部922へ出力する。通信部922は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部931へ出力する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929の記憶媒体に記憶させる。
記録再生部929は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。
また、撮影モードにおいて、例えば、カメラ部926は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部927へ出力する。画像処理部927は、カメラ部926から入力される画像データを符号化し、符号化ストリームを記録再生部929の記憶媒体に記憶させる。
また、テレビ電話モードにおいて、例えば、多重分離部928は、画像処理部927により符号化された映像ストリームと、音声コーデック923から入力される音声ストリームとを多重化し、多重化したストリームを通信部922へ出力する。通信部922は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部922は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部928へ出力する。多重分離部928は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部927、音声ストリームを音声コーデック923へ出力する。画像処理部927は、映像ストリームを復号し、映像データを生成する。映像データは、表示部930に供給され、表示部930により一連の画像が表示される。音声コーデック923は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
このように構成された携帯電話機920において、画像処理部927は、上述した実施形態に係る画像符号化装置10及び画像復号装置60の機能を有する。従って、携帯電話機920で符号化及び復号される映像について、非正方形の変換単位が使用され得る場合にも、量子化行列の定義に要する符号量の増大を抑制することができる。
[6−3.第3の応用例]
図26は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データ及び映像データを復号する。
記録再生装置940は、チューナ941、外部インタフェース942、エンコーダ943、HDD(Hard Disk Drive)944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)948、制御部949、及びユーザインタフェース950を備える。
チューナ941は、アンテナ(図示せず)を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ941は、復調により得られた符号化ビットストリームをセレクタ946へ出力する。即ち、チューナ941は、記録再生装置940における伝送手段としての役割を有する。
外部インタフェース942は、記録再生装置940と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース942は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース942を介して受信される映像データ及び音声データは、エンコーダ943へ入力される。即ち、外部インタフェース942は、記録再生装置940における伝送手段としての役割を有する。
エンコーダ943は、外部インタフェース942から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ943は、符号化ビットストリームをセレクタ946へ出力する。
HDD944は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD944は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。
ディスクドライブ945は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ945に装着される記録媒体は、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)又はBlu−ray(登録商標)ディスクなどであってよい。
セレクタ946は、映像及び音声の記録時には、チューナ941又はエンコーダ943から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD944又はディスクドライブ945へ出力する。また、セレクタ946は、映像及び音声の再生時には、HDD944又はディスクドライブ945から入力される符号化ビットストリームをデコーダ947へ出力する。
デコーダ947は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ947は、生成した映像データをOSD948へ出力する。また、デコーダ904は、生成した音声データを外部のスピーカへ出力する。
OSD948は、デコーダ947から入力される映像データを再生し、映像を表示する。また、OSD948は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。
制御部949は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置940の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース950から入力される操作信号に応じて、記録再生装置940の動作を制御する。
ユーザインタフェース950は、制御部949と接続される。ユーザインタフェース950は、例えば、ユーザが記録再生装置940を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース950は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部949へ出力する。
このように構成された記録再生装置940において、エンコーダ943は、上述した実施形態に係る画像符号化装置10の機能を有する。また、デコーダ947は、上述した実施形態に係る画像復号装置60の機能を有する。従って、記録再生装置940で符号化及び復号される映像について、非正方形の変換単位が使用され得る場合にも、量子化行列の定義に要する符号量の増大を抑制することができる。
[6−4.第4の応用例]
図27は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、信号処理部963、画像処理部964、表示部965、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、制御部970、ユーザインタフェース971、及びバス972を備える。
光学ブロック961は、撮像部962に接続される。撮像部962は、信号処理部963に接続される。表示部965は、画像処理部964に接続される。ユーザインタフェース971は、制御部970に接続される。バス972は、画像処理部964、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、及び制御部970を相互に接続する。
光学ブロック961は、フォーカスレンズ及び絞り機構などを有する。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCD又はCMOSなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部962は、画像信号を信号処理部963へ出力する。
信号処理部963は、撮像部962から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部963は、カメラ信号処理後の画像データを画像処理部964へ出力する。
画像処理部964は、信号処理部963から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部964は、生成した符号化データを外部インタフェース966又はメディアドライブ968へ出力する。また、画像処理部964は、外部インタフェース966又はメディアドライブ968から入力される符号化データを復号し、画像データを生成する。そして、画像処理部964は、生成した画像データを表示部965へ出力する。また、画像処理部964は、信号処理部963から入力される画像データを表示部965へ出力して画像を表示させてもよい。また、画像処理部964は、OSD969から取得される表示用データを、表示部965へ出力する画像に重畳してもよい。
OSD969は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部964へ出力する。
外部インタフェース966は、例えばUSB入出力端子として構成される。外部インタフェース966は、例えば、画像の印刷時に、撮像装置960とプリンタとを接続する。また、外部インタフェース966には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置960にインストールされ得る。さらに、外部インタフェース966は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース966は、撮像装置960における伝送手段としての役割を有する。
メディアドライブ968に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ968に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD(Solid State Drive)のような非可搬性の記憶部が構成されてもよい。
制御部970は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置960の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース971から入力される操作信号に応じて、撮像装置960の動作を制御する。
ユーザインタフェース971は、制御部970と接続される。ユーザインタフェース971は、例えば、ユーザが撮像装置960を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース971は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部970へ出力する。
このように構成された撮像装置960において、画像処理部964は、上述した実施形態に係る画像符号化装置10及び画像復号装置60の機能を有する。従って、撮像装置960で符号化及び復号される映像について、非正方形の変換単位が使用され得る場合にも、量子化行列の定義に要する符号量の増大を抑制することができる。
<7.まとめ>
ここまで、図1〜図27を用いて、一実施形態に係る画像符号化装置10及び画像復号装置60について説明した。上述した実施形態によれば、変換係数データの量子化及び逆量子化の際に、変換単位の形状に対応する量子化行列が各変換単位に設定される。変換単位の形状は正方形又は非正方形であり、非正方形の変換単位に対応する量子化行列は、正方形の変換単位に対応する量子化行列から生成され得る。従って、非正方形の変換単位に対応する量子化行列の定義を部分的に省略し、又は非正方形の変換単位に対応する量子化行列を効率的に(即ち、より少ない符号量で)定義することができる。そのため、非正方形の変換単位を選択可能な方式が採用される場合にも、選択可能な変換単位の種類の増加に伴って符号化効率が著しく低下することを回避することができる。
また、本実施形態によれば、ある正方形の量子化行列の一辺とサイズの等しい長辺を有する非正方形の量子化行列が、当該正方形の量子化行列のいずれかの行又は列をコピーすることにより生成され得る。従って、要素値のコピーという極めて処理コストの少ない操作を繰り返すのみで、非正方形の量子化行列を簡易に生成することができる。
また、本実施形態によれば、正方形の量子化行列からコピーすべき行又は列が、符号化ストリームのパラメータセット又はヘッダ内で柔軟に指定され得る。従って、非正方形の変換単位の変換係数データを量子化及び逆量子化するために適した量子化行列を上述したコピーを通じて生成することが可能である。一方、正方形の量子化行列からコピーすべき行及び列が予め定義される場合には、符号化される量子化行列パラメータを少なくして伝送のオーバヘッドを削減すると共に、装置の複雑さを低減することができる。
なお、本明細書では、量子化行列パラメータが、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、量子化行列パラメータを伝送する手法はかかる例に限定されない。例えば、ヘッダ情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
符号化ストリームを復号して、量子化された変換係数データを生成する復号部と、
変換係数データを逆直交変換する際に使用される変換単位として、非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記復号部により復号される前記量子化された変換係数データを逆量子化する逆量子化部と、
を備える画像処理装置。
(2)
前記非正方形の量子化行列は、前記正方形の量子化行列の行の要素又は列の要素をコピーすることにより生成される、前記(1)に記載の画像処理装置。
(3)
前記非正方形の量子化行列の長辺のサイズは、前記正方形の量子化行列の一辺のサイズに等しい、前記(2)に記載の画像処理装置。
(4)
コピーされる前記正方形の量子化行列の行の要素又は列の要素は、予め定義される、前記(2)又は前記(3)に記載の画像処理装置。
(5)
前記非正方形の量子化行列は、前記正方形の量子化行列の行の要素又は列の要素を等間隔でコピーすることにより生成される、前記(2)〜(4)のいずれか1項に記載の画像処理装置。
(6)
前記正方形の量子化行列のコピーされる行の要素又は列の要素の間隔は、前記非正方形の量子化行列の短辺のサイズに対する前記正方形の量子化行列の一辺のサイズの比に応じて決定される、前記(5)に記載の画像処理装置。
(7)
前記比は、1対4であり、前記間隔は、4行又は4列である、前記(6)に記載の画像処理装置。
(8)
前記正方形の量子化行列のサイズは、4×4であり、前記非正方形の量子化行列のサイズは、1×4又は4×1である、前記(7)に記載の画像処理装置。
(9)
前記正方形の量子化行列のサイズは、8×8であり、前記非正方形の量子化行列のサイズは、2×8又は8×2である、前記(7)に記載の画像処理装置。
(10)
前記正方形の量子化行列のサイズは、16×16であり、前記非正方形の量子化行列のサイズは、4×16又は16×4である、前記(7)に記載の画像処理装置。
(11)
前記正方形の量子化行列のサイズは、32×32であり、前記非正方形の量子化行列のサイズは、8×32又は32×8である、前記(7)に記載の画像処理装置。
(12)
前記正方形の量子化行列から前記非正方形の量子化行列を生成する生成部、
をさらに備える、前記(2)〜(11)のいずれか1項に記載の画像処理装置。
(13)
前記逆量子化部により逆量子化された前記変換係数データを、選択された前記非正方形の変換単位を用いて逆直交変換する逆直交変換部、
をさらに備える、前記(2)〜(12)のいずれか1項に記載の画像処理装置。
(14)
符号化ストリームを復号して、量子化された変換係数データを生成することと、
変換係数データを逆直交変換する際に使用される変換単位として、非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、復号される前記量子化された変換係数データを逆量子化することと、
を含む画像処理方法。
10 画像処理装置(画像符号化装置)
15 直交変換部
152 変換単位設定部
16 量子化部
17 可逆符号化部
60 画像処理装置(画像復号装置)
63 量子化部
214 生成部
242 変換単位設定部

Claims (16)

  1. 画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化する量子化部と、
    前記量子化部により量子化された変換係数データを符号化する符号化部と、
    を備える画像処理装置。
  2. 前記非正方形の量子化行列は、前記正方形の量子化行列の行の要素又は列の要素をコピーすることにより生成される、請求項1に記載の画像処理装置。
  3. 前記非正方形の量子化行列の長辺のサイズは、前記正方形の量子化行列の一辺のサイズに等しい、請求項2に記載の画像処理装置。
  4. コピーされる前記正方形の量子化行列の行の要素又は列の要素は、予め定義される、請求項2又は請求項3に記載の画像処理装置。
  5. 前記非正方形の量子化行列は、前記正方形の量子化行列の行の要素又は列の要素を等間隔でコピーすることにより生成される、請求項2〜4のいずれか1項に記載の画像処理装置。
  6. 前記正方形の量子化行列のコピーされる行の要素又は列の要素の間隔は、前記非正方形の量子化行列の短辺のサイズに対する前記正方形の量子化行列の一辺のサイズの比に応じて決定される、請求項5に記載の画像処理装置。
  7. 前記比は、1対4であり、前記間隔は、4行又は4列である、請求項6に記載の画像処理装置。
  8. 前記正方形の量子化行列のサイズは、4×4であり、前記非正方形の量子化行列のサイズは、1×4又は4×1である、請求項7に記載の画像処理装置。
  9. 前記正方形の量子化行列のサイズは、8×8であり、前記非正方形の量子化行列のサイズは、2×8又は8×2である、請求項7に記載の画像処理装置。
  10. 前記正方形の量子化行列のサイズは、16×16であり、前記非正方形の量子化行列のサイズは、4×16又は16×4である、請求項7に記載の画像処理装置。
  11. 前記正方形の量子化行列のサイズは、32×32であり、前記非正方形の量子化行列のサイズは、8×32又は32×8である、請求項7に記載の画像処理装置。
  12. 前記正方形の量子化行列から生成される前記非正方形の量子化行列を設定する設定部、
    をさらに備える、請求項2〜11のいずれか1項に記載の画像処理装置。
  13. 前記画像データを、選択された前記非正方形の変換単位を用いて直交変換する直交変換部、
    をさらに備える、請求項2〜12のいずれか1項に記載の画像処理装置。
  14. 画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化することと、
    量子化された変換係数データを符号化することと、
    を含む画像処理方法。
  15. 画像処理装置を制御するプロセッサを、
    画像データを直交変換する際に使用される変換単位として非正方形の変換単位が選択される場合に、正方形の変換単位に対応する正方形の量子化行列から生成される、非正方形の変換単位に対応する非正方形の量子化行列を用いて、前記画像データを直交変換することにより得られた変換係数データを量子化する量子化部と、
    前記量子化部により量子化された変換係数データを符号化する符号化部と、
    として機能させるためのプログラム。
  16. 請求項15に記載のプログラムを記録したコンピュータ読取可能な記録媒体。
JP2016007191A 2011-05-20 2016-01-18 画像処理装置、画像処理方法、プログラム及び記録媒体 Active JP6070870B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011113232 2011-05-20
JP2011113232 2011-05-20
JP2011235828 2011-10-27
JP2011235828 2011-10-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013516246A Division JP5874725B2 (ja) 2011-05-20 2012-04-10 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2016103850A JP2016103850A (ja) 2016-06-02
JP6070870B2 true JP6070870B2 (ja) 2017-02-01

Family

ID=47216976

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013516246A Active JP5874725B2 (ja) 2011-05-20 2012-04-10 画像処理装置及び画像処理方法
JP2016007191A Active JP6070870B2 (ja) 2011-05-20 2016-01-18 画像処理装置、画像処理方法、プログラム及び記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013516246A Active JP5874725B2 (ja) 2011-05-20 2012-04-10 画像処理装置及び画像処理方法

Country Status (5)

Country Link
US (4) US9641840B2 (ja)
JP (2) JP5874725B2 (ja)
CN (3) CN107018424B (ja)
TW (2) TWI556652B (ja)
WO (1) WO2012160890A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011259205A (ja) * 2010-06-09 2011-12-22 Sony Corp 画像復号化装置と画像符号化装置およびその方法とプログラム
CA2819401C (en) 2011-02-10 2020-02-11 Sony Corporation Image processing device and image processing method
CN107018424B (zh) 2011-05-20 2020-06-09 索尼公司 图像处理装置和图像处理方法
CN103765788B (zh) 2011-08-23 2015-08-05 联发科技(新加坡)私人有限公司 在视频编码中依据量化矩阵处理变换区块的方法与系统
MX2014002749A (es) * 2011-09-08 2014-04-16 Motorola Mobility Llc Metodos y aparato para cuantificacion y descuantificacion de un bloque rectangular de coeficientes.
WO2013065259A1 (ja) * 2011-11-01 2013-05-10 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム
MY172126A (en) 2012-02-29 2019-11-14 Sony Corp Image processing device and method
EP2842322A1 (en) * 2012-04-24 2015-03-04 Telefonaktiebolaget LM Ericsson (Publ) Encoding and deriving parameters for coded multi-layer video sequences
JP6406014B2 (ja) * 2012-12-18 2018-10-17 ソニー株式会社 画像処理装置及び画像処理方法
WO2015090219A1 (en) 2013-12-18 2015-06-25 Mediatek Inc. Method and apparatus for palette initialization and management
WO2015096647A1 (en) 2013-12-27 2015-07-02 Mediatek Inc. Method and apparatus for major color index map coding
WO2015096812A1 (en) 2013-12-27 2015-07-02 Mediatek Inc. Method and apparatus for palette coding with cross block prediction
EP3087742B1 (en) 2013-12-27 2020-09-23 HFI Innovation Inc. Method and apparatus for syntax redundancy removal in palette coding
US10484696B2 (en) 2014-01-07 2019-11-19 Mediatek Inc. Method and apparatus for color index prediction
US20170150156A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Illumination compensation with non-square predictive blocks in video coding
CN108366394A (zh) * 2018-01-24 2018-08-03 南京邮电大学 基于时空压缩网络编码的高能效无线传感网数据传输方法
MX2020009803A (es) 2018-03-28 2020-10-28 Sony Corp Dispositivo de procesamiento de imagen y metodo de procesamiento de imagen.
CN116233459A (zh) * 2018-03-30 2023-06-06 松下电器(美国)知识产权公司 编码装置、解码装置以及存储介质
WO2020003740A1 (ja) * 2018-06-29 2020-01-02 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
US11184446B2 (en) 2018-12-05 2021-11-23 Micron Technology, Inc. Methods and apparatus for incentivizing participation in fog networks
JP2020098983A (ja) 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法
JP2020098984A (ja) 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
US11327551B2 (en) 2019-02-14 2022-05-10 Micron Technology, Inc. Methods and apparatus for characterizing memory devices
US11256778B2 (en) 2019-02-14 2022-02-22 Micron Technology, Inc. Methods and apparatus for checking the results of characterized memory searches
JP2020150338A (ja) 2019-03-11 2020-09-17 キヤノン株式会社 画像復号装置、画像復号方法、及びプログラム
US20200349217A1 (en) * 2019-05-03 2020-11-05 Micron Technology, Inc. Methods and apparatus for performing matrix transformations within a memory array
US10867655B1 (en) 2019-07-08 2020-12-15 Micron Technology, Inc. Methods and apparatus for dynamically adjusting performance of partitioned memory
JP2021048532A (ja) * 2019-09-19 2021-03-25 キヤノン株式会社 画像符号化装置、画像復号装置及びそれらの制御方法及びプログラム
US11449577B2 (en) 2019-11-20 2022-09-20 Micron Technology, Inc. Methods and apparatus for performing video processing matrix operations within a memory array
US11853385B2 (en) 2019-12-05 2023-12-26 Micron Technology, Inc. Methods and apparatus for performing diversity matrix operations within a memory array
EP4017001A1 (en) * 2020-12-17 2022-06-22 Axis AB Method and digital video camera for forming a combined image frame of a combined video stream

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100287624B1 (ko) * 1992-09-28 2001-04-16 야스카와 히데아키 화상데이타의압축,해제방법및그장치
KR100238066B1 (ko) * 1996-06-26 2000-01-15 윤종용 양자화활동도를 이용한 비트 발생량 제어방법 및 그 영상 부호화장치
EP1078532B1 (en) * 1998-05-04 2006-07-19 General Instrument Corporation Method and apparatus for inverse quantization of mpeg-4 video
CN100387059C (zh) 2003-02-21 2008-05-07 松下电器产业株式会社 图像解码方法
JP4594688B2 (ja) * 2004-06-29 2010-12-08 オリンパス株式会社 画像符号化処理方法、画像復号化処理方法、動画圧縮処理方法、動画伸張処理方法、画像符号化処理プログラム、画像符号化装置、画像復号化装置、画像符号化/復号化システム、拡張画像圧縮伸張処理システム
JP4784281B2 (ja) * 2005-11-18 2011-10-05 富士ゼロックス株式会社 復号化装置、逆量子化方法及びこれらのプログラム
WO2007094100A1 (ja) * 2006-02-13 2007-08-23 Kabushiki Kaisha Toshiba 動画像符号化/復号化方法及び装置並びにプログラム
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
EP2136566A4 (en) * 2007-04-16 2012-07-18 Toshiba Kk METHOD AND DEVICE FOR IMAGE ENCODING AND IMAGE DECODING
US9100646B2 (en) * 2008-09-03 2015-08-04 Sk Telecom Co., Ltd. Device and method for image encoding/decoding using prediction direction conversion and selective encoding
KR101302660B1 (ko) * 2009-09-14 2013-09-03 에스케이텔레콤 주식회사 고해상도 동영상의 부호화/복호화 방법 및 장치
US9167252B2 (en) * 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
CN102625090B (zh) * 2011-01-26 2015-08-05 鸿富锦精密工业(深圳)有限公司 影像译码方法与使用该方法的图形处理设备
CA2819401C (en) 2011-02-10 2020-02-11 Sony Corporation Image processing device and image processing method
JP2012238927A (ja) 2011-05-09 2012-12-06 Sony Corp 画像処理装置及び画像処理方法
CN107018424B (zh) 2011-05-20 2020-06-09 索尼公司 图像处理装置和图像处理方法
CN103765788B (zh) * 2011-08-23 2015-08-05 联发科技(新加坡)私人有限公司 在视频编码中依据量化矩阵处理变换区块的方法与系统
CN103748884A (zh) 2011-08-30 2014-04-23 索尼公司 图像处理装置和图像处理方法

Also Published As

Publication number Publication date
US10070131B2 (en) 2018-09-04
CN106937126B (zh) 2019-11-15
JPWO2012160890A1 (ja) 2014-07-31
US20170188030A1 (en) 2017-06-29
CN103535037A (zh) 2014-01-22
US9641840B2 (en) 2017-05-02
TW201701676A (zh) 2017-01-01
TWI556652B (zh) 2016-11-01
WO2012160890A1 (ja) 2012-11-29
US20190356917A1 (en) 2019-11-21
JP5874725B2 (ja) 2016-03-02
US10448017B2 (en) 2019-10-15
JP2016103850A (ja) 2016-06-02
TW201301901A (zh) 2013-01-01
CN107018424B (zh) 2020-06-09
US20180359474A1 (en) 2018-12-13
CN106937126A (zh) 2017-07-07
TWI624173B (zh) 2018-05-11
CN107018424A (zh) 2017-08-04
US20140050267A1 (en) 2014-02-20
CN103535037B (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
JP6070870B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP6296180B2 (ja) 画像処理装置および方法、記録媒体、並びに、プログラム
JP5741076B2 (ja) 画像処理装置及び画像処理方法
WO2012153578A1 (ja) 画像処理装置及び画像処理方法
WO2012005099A1 (ja) 画像処理装置及び画像処理方法
JP6527263B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
WO2013164922A1 (ja) 画像処理装置及び画像処理方法
WO2013088833A1 (ja) 画像処理装置及び画像処理方法
WO2014148070A1 (ja) 画像処理装置及び画像処理方法
JP2012175615A (ja) 画像処理装置及び画像処理方法
WO2015098231A1 (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161219

R151 Written notification of patent or utility model registration

Ref document number: 6070870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250