JP6994868B2

JP6994868B2 - 符号化装置、復号装置、符号化方法、および復号方法

Info

Publication number: JP6994868B2
Application number: JP2017154776A
Authority: JP
Inventors: 達彦池田
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2017-08-09
Filing date: 2017-08-09
Publication date: 2022-01-14
Anticipated expiration: 2037-08-09
Also published as: US10652544B2; US20190052883A1; JP2019033456A; US20190158839A1; US10237558B2

Description

本開示は、画像を符号化する装置および方法と、符号化された画像を復号する装置および方法とに関する。

現在、画像符号化の規格としてＶＰ９が策定されている（例えば、非特許文献１参照）。この規格では、ＨＥＶＣ（High-Efficiency Video Coding）と同様に、イントラ予測およびインター予測などを用いて、動画像を圧縮符号化し、その圧縮符号化された動画像を復号する。

Vp9 Bitstream & Decoding Process Specification Version 0.6

しかしながら、従来の符号化装置および復号装置では、符号化効率に改善の余地がある。

そこで、本開示は、符号化効率の向上を図ることができる符号化装置および復号装置などを提供する。

本開示の一態様に係る符号化装置は、処理回路と、前記処理回路に接続されたメモリとを備え、前記処理回路は、前記メモリを用いて、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも１つのパラメータを定義付け、画像を複数のブロックに分割し、前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、前記複数のブロックのそれぞれを符号化し、前記少なくとも１つのパラメータの定義付けでは、前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して、前記少なくとも１つのパラメータを定義付け、前記複数のブロックの符号化では、前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記符号化対象ブロックを符号化し、前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む。

なお、この包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本開示の符号化装置および復号装置は、符号化効率の向上を図ることができる。

図１は、実施の形態１に係る符号化装置の機能構成を示すブロック図である。図２は、実施の形態１におけるブロック分割の一例を示す図である。図３は、各変換タイプに対応する変換基底関数を示す表である。図４Ａは、ＡＬＦで用いられるフィルタの形状の一例を示す図である。図４Ｂは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。図４Ｃは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。図５は、イントラ予測における６７個のイントラ予測モードを示す図である。図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）を説明するための図である。図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）を説明するための図である。図８は、等速直線運動を仮定したモデルを説明するための図である。図９は、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。図１０は、実施の形態１に係る復号装置の機能構成を示すブロック図である。図１１は、ピクチャの各ブロックに付与されるｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。図１２は、ｓｅｇｍｅｎｔ＿ｉｄによって示される各番号に対応付けられたパラメータのセットの一例を示す図である。図１３は、実施の形態２における、ピクチャの各ブロックに割り当てられるｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。図１４は、実施の形態２における、ピクチャパラメータセットにおいて定義付けを行うためのシンタックスの一例を示す図である。図１５は、実施の形態２における、ピクチャパラメータセットの中で定義される、ｄｅｐｔｈとｓｅｇｍｅｎｔ＿ｉｄとの組み合わせに対応する各パラメータの例を示す図である。図１６Ａは、実施の形態２における、ブロックの分割と、各ブロックに対するｓｅｇｍｅｎｔ＿ｉｄの割り当てとを行うためのシンタックスの一例を示す図である。図１６Ｂは、実施の形態２における、各ブロックのｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎとｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。図１７は、実施の形態２における、各ブロックに適用されるパラメータを取得するためシンタックスの一例を示す図である。図１８は、実施の形態２における、ピクチャの分割によって得られる各ブロックの符号化の順番の一例を示す図である。図１９は、実施の形態２における符号化装置の全体的な処理動作を示すフローチャートである。図２０は、実施の形態２における復号装置の全体的な処理動作を示すフローチャートである。図２１は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。図２２は、スケーラブル符号化時の符号化構造の一例を示す図である。図２３は、スケーラブル符号化時の符号化構造の一例を示す図である。図２４は、ｗｅｂページの表示画面例を示す図である。図２５は、ｗｅｂページの表示画面例を示す図である。図２６は、スマートフォンの一例を示す図である。図２７は、スマートフォンの構成例を示すブロック図である。

以下、実施の形態について図面を参照しながら具体的に説明する。

なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、請求の範囲を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態１）
［符号化装置の概要］
まず、実施の形態１に係る符号化装置の概要を説明する。図１は、実施の形態１に係る符号化装置１００の機能構成を示すブロック図である。符号化装置１００は、動画像／画像をブロック単位で符号化する動画像／画像符号化装置である。

図１に示すように、符号化装置１００は、画像をブロック単位で符号化する装置であって、分割部１０２と、減算部１０４と、変換部１０６と、量子化部１０８と、エントロピー符号化部１１０と、逆量子化部１１２と、逆変換部１１４と、加算部１１６と、ブロックメモリ１１８と、ループフィルタ部１２０と、フレームメモリ１２２と、イントラ予測部１２４と、インター予測部１２６と、予測制御部１２８と、を備える。

符号化装置１００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８として機能する。また、符号化装置１００は、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８に対応する専用の１以上の電子回路として実現されてもよい。

以下に、符号化装置１００に含まれる各構成要素について説明する。

［分割部］
分割部１０２は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部１０４に出力する。例えば、分割部１０２は、まず、ピクチャを固定サイズ（例えば１２８ｘ１２８）のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット（ＣＴＵ）と呼ばれることがある。そして、分割部１０２は、再帰的な四分木（ｑｕａｄｔｒｅｅ）及び／又は二分木（ｂｉｎａｒｙｔｒｅｅ）ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ（例えば６４ｘ６４以下）のブロックに分割する。この可変サイズのブロックは、符号化ユニット（ＣＵ）、予測ユニット（ＰＵ）あるいは変換ユニット（ＴＵ）と呼ばれることがある。なお、本実施の形態では、ＣＵ、ＰＵ及びＴＵは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがＣＵ、ＰＵ、ＴＵの処理単位となってもよい。

図２は、実施の形態１におけるブロック分割の一例を示す図である。図２において、実線は四分木ブロック分割によるブロック境界を表し、破線は二分木ブロック分割によるブロック境界を表す。

ここでは、ブロック１０は、１２８ｘ１２８画素の正方形ブロック（１２８ｘ１２８ブロック）である。この１２８ｘ１２８ブロック１０は、まず、４つの正方形の６４ｘ６４ブロックに分割される（四分木ブロック分割）。

左上の６４ｘ６４ブロックは、さらに２つの矩形の３２ｘ６４ブロックに垂直に分割され、左の３２ｘ６４ブロックはさらに２つの矩形の１６ｘ６４ブロックに垂直に分割される（二分木ブロック分割）。その結果、左上の６４ｘ６４ブロックは、２つの１６ｘ６４ブロック１１、１２と、３２ｘ６４ブロック１３とに分割される。

右上の６４ｘ６４ブロックは、２つの矩形の６４ｘ３２ブロック１４、１５に水平に分割される（二分木ブロック分割）。

左下の６４ｘ６４ブロックは、４つの正方形の３２ｘ３２ブロックに分割される（四分木ブロック分割）。４つの３２ｘ３２ブロックのうち左上のブロック及び右下のブロックはさらに分割される。左上の３２ｘ３２ブロックは、２つの矩形の１６ｘ３２ブロックに垂直に分割され、右の１６ｘ３２ブロックはさらに２つの１６ｘ１６ブロックに水平に分割される（二分木ブロック分割）。右下の３２ｘ３２ブロックは、２つの３２ｘ１６ブロックに水平に分割される（二分木ブロック分割）。その結果、左下の６４ｘ６４ブロックは、１６ｘ３２ブロック１６と、２つの１６ｘ１６ブロック１７、１８と、２つの３２ｘ３２ブロック１９、２０と、２つの３２ｘ１６ブロック２１、２２とに分割される。

右下の６４ｘ６４ブロック２３は分割されない。

以上のように、図２では、ブロック１０は、再帰的な四分木及び二分木ブロック分割に基づいて、１３個の可変サイズのブロック１１～２３に分割される。このような分割は、ＱＴＢＴ（ｑｕａｄ－ｔｒｅｅｐｌｕｓｂｉｎａｒｙｔｒｅｅ）分割と呼ばれることがある。

なお、図２では、１つのブロックが４つ又は２つのブロックに分割されていたが（四分木又は二分木ブロック分割）、分割はこれに限定されない。例えば、１つのブロックが３つのブロックに分割されてもよい（三分木ブロック分割）。このような三分木ブロック分割を含む分割は、ＭＢＴ（ｍｕｌｔｉｔｙｐｅｔｒｅｅ）分割と呼ばれることがある。

［減算部］
減算部１０４は、分割部１０２によって分割されたブロック単位で原信号（原サンプル）から予測信号（予測サンプル）を減算する。つまり、減算部１０４は、符号化対象ブロック（以下、カレントブロックという）の予測誤差（残差ともいう）を算出する。そして、減算部１０４は、算出された予測誤差を変換部１０６に出力する。

原信号は、符号化装置１００の入力信号であり、動画像を構成する各ピクチャの画像を表す信号（例えば輝度（ｌｕｍａ）信号及び２つの色差（ｃｈｒｏｍａ）信号）である。以下において、画像を表す信号をサンプルともいうこともある。

［変換部］
変換部１０６は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部１０８に出力する。具体的には、変換部１０６は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換（ＤＣＴ）又は離散サイン変換（ＤＳＴ）を行う。

なお、変換部１０６は、複数の変換タイプの中から適応的に変換タイプを選択し、選択された変換タイプに対応する変換基底関数（ｔｒａｎｓｆｏｒｍｂａｓｉｓｆｕｎｃｔｉｏｎ）を用いて、予測誤差を変換係数に変換してもよい。このような変換は、ＥＭＴ（ｅｘｐｌｉｃｉｔｍｕｌｔｉｐｌｅｃｏｒｅｔｒａｎｓｆｏｒｍ）又はＡＭＴ（ａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍ）と呼ばれることがある。

複数の変換タイプは、例えば、ＤＣＴ－ＩＩ、ＤＣＴ－Ｖ、ＤＣＴ－ＶＩＩＩ、ＤＳＴ－Ｉ及びＤＳＴ－ＶＩＩを含む。図３は、各変換タイプに対応する変換基底関数を示す表である。図３においてＮは入力画素の数を示す。これらの複数の変換タイプの中からの変換タイプの選択は、例えば、予測の種類（イントラ予測及びインター予測）に依存してもよいし、イントラ予測モードに依存してもよい。

このようなＥＭＴ又はＡＭＴを適用するか否かを示す情報（例えばＡＭＴフラグと呼ばれる）及び選択された変換タイプを示す情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

また、変換部１０６は、変換係数（変換結果）を再変換してもよい。このような再変換は、ＡＳＴ（ａｄａｐｔｉｖｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）又はＮＳＳＴ（ｎｏｎ－ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）と呼ばれることがある。例えば、変換部１０６は、イントラ予測誤差に対応する変換係数のブロックに含まれるサブブロック（例えば４ｘ４サブブロック）ごとに再変換を行う。ＮＳＳＴを適用するか否かを示す情報及びＮＳＳＴに用いられる変換行列に関する情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

［量子化部］
量子化部１０８は、変換部１０６から出力された変換係数を量子化する。具体的には、量子化部１０８は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ（ＱＰ）に基づいて当該変換係数を量子化する。そして、量子化部１０８は、カレントブロックの量子化された変換係数（以下、量子化係数という）をエントロピー符号化部１１０及び逆量子化部１１２に出力する。

所定の順序は、変換係数の量子化／逆量子化のための順序である。例えば、所定の走査順序は、周波数の昇順（低周波から高周波の順）又は降順（高周波から低周波の順）で定義される。

量子化パラメータとは、量子化ステップ（量子化幅）を定義するパラメータである。例えば、量子化パラメータの値が増加すれば量子化ステップも増加する。つまり、量子化パラメータの値が増加すれば量子化誤差が増大する。

［エントロピー符号化部］
エントロピー符号化部１１０は、量子化部１０８から入力である量子化係数を可変長符号化することにより符号化信号（符号化ビットストリーム）を生成する。具体的には、エントロピー符号化部１１０は、例えば、量子化係数を二値化し、二値信号を算術符号化する。

［逆量子化部］
逆量子化部１１２は、量子化部１０８からの入力である量子化係数を逆量子化する。具体的には、逆量子化部１１２は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部１１２は、カレントブロックの逆量子化された変換係数を逆変換部１１４に出力する。

［逆変換部］
逆変換部１１４は、逆量子化部１１２からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部１１４は、変換係数に対して、変換部１０６による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部１１４は、復元された予測誤差を加算部１１６に出力する。

なお、復元された予測誤差は、量子化により情報が失われているので、減算部１０４が算出した予測誤差と一致しない。すなわち、復元された予測誤差には、量子化誤差が含まれている。

［加算部］
加算部１１６は、逆変換部１１４からの入力である予測誤差と予測制御部１２８からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部１１６は、再構成されたブロックをブロックメモリ１１８及びループフィルタ部１２０に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。

［ブロックメモリ］
ブロックメモリ１１８は、イントラ予測で参照されるブロックであって符号化対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ１１８は、加算部１１６から出力された再構成ブロックを格納する。

［ループフィルタ部］
ループフィルタ部１２０は、加算部１１６によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ１２２に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ（インループフィルタ）であり、例えば、デブロッキング・フィルタ（ＤＦ）、サンプルアダプティブオフセット（ＳＡＯ）及びアダプティブループフィルタ（ＡＬＦ）などを含む。

ＡＬＦでは、符号化歪みを除去するための最小二乗誤差フィルタが適用され、例えばカレントブロック内の２ｘ２サブブロックごとに、局所的な勾配（ｇｒａｄｉｅｎｔ）の方向及び活性度（ａｃｔｉｖｉｔｙ）に基づいて複数のフィルタの中から選択された１つのフィルタが適用される。

具体的には、まず、サブブロック（例えば２ｘ２サブブロック）が複数のクラス（例えば１５又は２５クラス）に分類される。サブブロックの分類は、勾配の方向及び活性度に基づいて行われる。例えば、勾配の方向値Ｄ（例えば０～２又は０～４）と勾配の活性値Ａ（例えば０～４）とを用いて分類値Ｃ（例えばＣ＝５Ｄ＋Ａ）が算出される。そして、分類値Ｃに基づいて、サブブロックが複数のクラス（例えば１５又は２５クラス）に分類される。

勾配の方向値Ｄは、例えば、複数の方向（例えば水平、垂直及び２つの対角方向）の勾配を比較することにより導出される。また、勾配の活性値Ａは、例えば、複数の方向の勾配を加算し、加算結果を量子化することにより導出される。

このような分類の結果に基づいて、複数のフィルタの中からサブブロックのためのフィルタが決定される。

ＡＬＦで用いられるフィルタの形状としては例えば円対称形状が利用される。図４Ａ～図４Ｃは、ＡＬＦで用いられるフィルタの形状の複数の例を示す図である。図４Ａは、５ｘ５ダイヤモンド形状フィルタを示し、図４Ｂは、７ｘ７ダイヤモンド形状フィルタを示し、図４Ｃは、９ｘ９ダイヤモンド形状フィルタを示す。フィルタの形状を示す情報は、ピクチャレベルで信号化される。なお、フィルタの形状を示す情報の信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はＣＵレベル）であってもよい。

ＡＬＦのオン／オフは、例えば、ピクチャレベル又はＣＵレベルで決定される。例えば、輝度についてはＣＵレベルでＡＬＦを適用するか否かが決定され、色差についてはピクチャレベルでＡＬＦを適用するか否かが決定される。ＡＬＦのオン／オフを示す情報は、ピクチャレベル又はＣＵレベルで信号化される。なお、ＡＬＦのオン／オフを示す情報の信号化は、ピクチャレベル又はＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

選択可能な複数のフィルタ（例えば１５又は２５までのフィルタ）の係数セットは、ピクチャレベルで信号化される。なお、係数セットの信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル、ＣＵレベル又はサブブロックレベル）であってもよい。

［フレームメモリ］
フレームメモリ１２２は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ１２２は、ループフィルタ部１２０によってフィルタされた再構成ブロックを格納する。

［イントラ予測部］
イントラ予測部１２４は、ブロックメモリ１１８に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測（画面内予測ともいう）を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部１２４は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部１２８に出力する。

例えば、イントラ予測部１２４は、予め規定された複数のイントラ予測モードのうちの１つを用いてイントラ予測を行う。複数のイントラ予測モードは、１以上の非方向性予測モードと、複数の方向性予測モードと、を含む。

１以上の非方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ（Ｈｉｇｈ－ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）規格（非特許文献１）で規定されたＰｌａｎａｒ予測モード及びＤＣ予測モードを含む。

複数の方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ規格で規定された３３方向の予測モードを含む。なお、複数の方向性予測モードは、３３方向に加えてさらに３２方向の予測モード（合計で６５個の方向性予測モード）を含んでもよい。図５は、イントラ予測における６７個のイントラ予測モード（２個の非方向性予測モード及び６５個の方向性予測モード）を示す図である。実線矢印は、Ｈ．２６５／ＨＥＶＣ規格で規定された３３方向を表し、破線矢印は、追加された３２方向を表す。

なお、色差ブロックのイントラ予測において、輝度ブロックが参照されてもよい。つまり、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分が予測されてもよい。このようなイントラ予測は、ＣＣＬＭ（ｃｒｏｓｓ－ｃｏｍｐｏｎｅｎｔｌｉｎｅａｒｍｏｄｅｌ）予測と呼ばれることがある。このような輝度ブロックを参照する色差ブロックのイントラ予測モード（例えばＣＣＬＭモードと呼ばれる）は、色差ブロックのイントラ予測モードの１つとして加えられてもよい。

イントラ予測部１２４は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正してもよい。このような補正をともなうイントラ予測は、ＰＤＰＣ（ｐｏｓｉｔｉｏｎｄｅｐｅｎｄｅｎｔｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｃｏｍｂｉｎａｔｉｏｎ）と呼ばれることがある。ＰＤＰＣの適用の有無を示す情報（例えばＰＤＰＣフラグと呼ばれる）は、例えばＣＵレベルで信号化される。なお、この情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

［インター予測部］
インター予測部１２６は、フレームメモリ１２２に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測（画面間予測ともいう）を行うことで、予測信号（インター予測信号）を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部１２６は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索（ｍｏｔｉｏｎｅｓｔｉｍａｔｉｏｎ）を行う。そして、インター予測部１２６は、動き探索により得られた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部１２６は、生成されたインター予測信号を予測制御部１２８に出力する。

動き補償に用いられた動き情報は信号化される。動きベクトルの信号化には、予測動きベクトル（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）が用いられてもよい。つまり、動きベクトルと予測動きベクトルとの間の差分が信号化されてもよい。

なお、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号が生成されてもよい。具体的には、動き探索により得られた動き情報に基づく予測信号と、隣接ブロックの動き情報に基づく予測信号と、を重み付け加算することにより、カレントブロック内のサブブロック単位でインター予測信号が生成されてもよい。このようなインター予測（動き補償）は、ＯＢＭＣ（ｏｖｅｒｌａｐｐｅｄｂｌｏｃｋｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎ）と呼ばれることがある。

このようなＯＢＭＣモードでは、ＯＢＭＣのためのサブブロックのサイズを示す情報（例えばＯＢＭＣブロックサイズと呼ばれる）は、シーケンスレベルで信号化される。また、ＯＢＭＣモードを適用するか否かを示す情報（例えばＯＢＭＣフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、これらの情報の信号化のレベルは、シーケンスレベル及びＣＵレベルに限定される必要はなく、他のレベル（例えばピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

なお、動き情報は信号化されずに、復号装置側で導出されてもよい。例えば、Ｈ．２６５／ＨＥＶＣ規格で規定されたマージモードが用いられてもよい。また例えば、復号装置側で動き探索を行うことにより動き情報が導出されてもよい。この場合、カレントブロックの画素値を用いずに動き探索が行われる。

ここで、復号装置側で動き探索を行うモードについて説明する。この復号装置側で動き探索を行うモードは、ＰＭＭＶＤ（ｐａｔｔｅｒｎｍａｔｃｈｅｄｍｏｔｉｏｎｖｅｃｔｏｒｄｅｒｉｖａｔｉｏｎ）モード又はＦＲＵＣ（ｆｌａｍｅｒａｔｅｕｐ－ｃｏｎｖｅｒｓｉｏｎ）モードと呼ばれることがある。

まず、カレントブロックに空間的又は時間的に隣接する符号化済みブロックの動きベクトルを参照して、各々が予測動きベクトルを有する複数の候補のリスト（マージリストと共通であってもよい）が生成される。そして、候補リストに含まれる各候補の評価値が算出され、評価値に基づいて１つの候補が選択される。

そして、選択された候補の動きベクトルに基づいて、カレントブロックのための動きベクトルが導出される。具体的には、例えば、選択された候補の動きベクトルがそのままカレントブロックのための動きベクトルとして導出される。また例えば、選択された候補の動きベクトルに対応する参照ピクチャ内の位置の周辺領域において、パターンマッチングを行うことにより、カレントブロックのための動きベクトルが導出されてもよい。

なお、評価値は、動きベクトルに対応する参照ピクチャ内の領域と、所定の領域との間のパターンマッチングによって算出される。

パターンマッチングとしては、第１パターンマッチング又は第２パターンマッチングが用いられる。第１パターンマッチング及び第２パターンマッチングは、それぞれ、バイラテラルマッチング（ｂｉｌａｔｅｒａｌｍａｔｃｈｉｎｇ）及びテンプレートマッチング（ｔｅｍｐｌａｔｅｍａｔｃｈｉｎｇ）と呼ばれることがある。

第１パターンマッチングでは、異なる２つの参照ピクチャ内の２つのブロックであってカレントブロックの動き軌道（ｍｏｔｉｏｎｔｒａｊｅｃｔｏｒｙ）に沿う２つのブロックの間でパターンマッチングが行われる。したがって、第１パターンマッチングでは、上述した候補の評価値の算出のための所定の領域として、カレントブロックの動き軌道に沿う他の参照ピクチャ内の領域が用いられる。

図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）を説明するための図である。図６に示すように、第１パターンマッチングでは、カレントブロック（Ｃｕｒｂｌｏｃｋ）の動き軌道に沿う２つのブロックであって異なる２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）内の２つのブロックのペアの中で最もマッチするペアを探索することにより２つの動きベクトル（ＭＶ０、ＭＶ１）が導出される。

連続的な動き軌道の仮定の下では、２つの参照ブロックを指し示す動きベクトル（ＭＶ０、ＭＶ１）は、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）との間の時間的な距離（ＴＤ０、ＴＤ１）に対して比例する。例えば、カレントピクチャが時間的に２つの参照ピクチャの間に位置し、カレントピクチャから２つの参照ピクチャへの時間的な距離が等しい場合、第１パターンマッチングでは、鏡映対称な双方向の動きベクトルが導出される。

第２パターンマッチングでは、カレントピクチャ内のテンプレート（カレントピクチャ内でカレントブロックに隣接するブロック（例えば上及び／又は左隣接ブロック））と参照ピクチャ内のブロックとの間でパターンマッチングが行われる。したがって、第２パターンマッチングでは、上述した候補の評価値の算出のための所定の領域として、カレントピクチャ内のカレントブロックに隣接するブロックが用いられる。

図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）を説明するための図である。図７に示すように、第２パターンマッチングでは、カレントピクチャ（ＣｕｒＰｉｃ）内でカレントブロック（Ｃｕｒｂｌｏｃｋ）に隣接するブロックと最もマッチするブロックを参照ピクチャ（Ｒｅｆ０）内で探索することによりカレントブロックの動きベクトルが導出される。

このようなＦＲＵＣモードを適用するか否かを示す情報（例えばＦＲＵＣフラグと呼ばれる）は、ＣＵレベルで信号化される。また、ＦＲＵＣモードが適用される場合（例えばＦＲＵＣフラグが真の場合）、パターンマッチングの方法（第１パターンマッチング又は第２パターンマッチング）を示す情報（例えばＦＲＵＣモードフラグと呼ばれる）がＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

なお、動き探索とは異なる方法で、復号装置側で動き情報が導出されてもよい。例えば、等速直線運動を仮定したモデルに基づき、画素単位で周辺画素値を用いて動きベクトルの補正量が算出されてもよい。

ここで、等速直線運動を仮定したモデルに基づいて動きベクトルを導出するモードについて説明する。このモードは、ＢＩＯ（ｂｉ－ｄｉｒｅｃｔｉｏｎａｌｏｐｔｉｃａｌｆｌｏｗ）モードと呼ばれることがある。

図８は、等速直線運動を仮定したモデルを説明するための図である。図８において、（ｖ_ｘ，ｖ_ｙ）は、速度ベクトルを示し、τ_０、τ_１は、それぞれ、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ_０，Ｒｅｆ_１）との間の時間的な距離を示す。（ＭＶｘ_０，ＭＶｙ_０）は、参照ピクチャＲｅｆ_０に対応する動きベクトルを示し、（ＭＶｘ_１、ＭＶｙ_１）は、参照ピクチャＲｅｆ_１に対応する動きベクトルを示す。

このとき速度ベクトル（ｖ_ｘ，ｖ_ｙ）の等速直線運動の仮定の下では、（ＭＶｘ_０，ＭＶｙ_０）及び（ＭＶｘ_１，ＭＶｙ_１）は、それぞれ、（ｖ_ｘτ_０，ｖ_ｙτ_０）及び（－ｖ_ｘτ_１，－ｖ_ｙτ_１）と表され、以下のオプティカルフロー等式（１）が成り立つ。

ここで、Ｉ^（ｋ）は、動き補償後の参照画像ｋ（ｋ＝０，１）の輝度値を示す。このオプティカルフロー等式は、（i）輝度値の時間微分と、（ii）水平方向の速度及び参照画像の空間勾配の水平成分の積と、（iii）垂直方向の速度及び参照画像の空間勾配の垂直成分の積と、の和が、ゼロと等しいことを示す。このオプティカルフロー等式とエルミート補間（Ｈｅｒｍｉｔｅｉｎｔｅｒｐｏｌａｔｉｏｎ）との組み合わせに基づいて、マージリスト等から得られるブロック単位の動きベクトルが画素単位で補正される。

なお、等速直線運動を仮定したモデルに基づく動きベクトルの導出とは異なる方法で、復号装置側で動きベクトルが導出されてもよい。例えば、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルが導出されてもよい。

ここで、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出するモードについて説明する。このモードは、アフィン動き補償予測（ａｆｆｉｎｅｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードと呼ばれることがある。

図９は、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。図９において、カレントブロックは、１６の４ｘ４サブブロックを含む。ここでは、隣接ブロックの動きベクトルに基づいてカレントブロックの左上角制御ポイントの動きベクトルｖ_０が導出され、隣接サブブロックの動きベクトルに基づいてカレントブロックの右上角制御ポイントの動きベクトルｖ_１が導出される。そして、２つの動きベクトルｖ_０及びｖ_１を用いて、以下の式（２）により、カレントブロック内の各サブブロックの動きベクトル（ｖ_ｘ，ｖ_ｙ）が導出される。

ここで、ｘ及びｙは、それぞれ、サブブロックの水平位置及び垂直位置を示し、ｗは、予め定められた重み係数を示す。

このようなアフィン動き補償予測モードでは、左上及び右上角制御ポイントの動きベクトルの導出方法が異なるいくつかのモードを含んでもよい。このようなアフィン動き補償予測モードを示す情報（例えばアフィンフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、このアフィン動き補償予測モードを示す情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

［予測制御部］
予測制御部１２８は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部１０４及び加算部１１６に出力する。

［復号装置の概要］
次に、上記の符号化装置１００から出力された符号化信号（符号化ビットストリーム）を復号可能な復号装置の概要について説明する。図１０は、実施の形態１に係る復号装置２００の機能構成を示すブロック図である。復号装置２００は、動画像／画像をブロック単位で復号する動画像／画像復号装置である。

図１０に示すように、復号装置２００は、エントロピー復号部２０２と、逆量子化部２０４と、逆変換部２０６と、加算部２０８と、ブロックメモリ２１０と、ループフィルタ部２１２と、フレームメモリ２１４と、イントラ予測部２１６と、インター予測部２１８と、予測制御部２２０と、を備える。

復号装置２００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０として機能する。また、復号装置２００は、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０に対応する専用の１以上の電子回路として実現されてもよい。

以下に、復号装置２００に含まれる各構成要素について説明する。

［エントロピー復号部］
エントロピー復号部２０２は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部２０２は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部２０２は、二値信号を多値化（ｄｅｂｉｎａｒｉｚｅ）する。これにより、エントロピー復号部２０２は、ブロック単位で量子化係数を逆量子化部２０４に出力する。

［逆量子化部］
逆量子化部２０４は、エントロピー復号部２０２からの入力である復号対象ブロック（以下、カレントブロックという）の量子化係数を逆量子化する。具体的には、逆量子化部２０４は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部２０４は、カレントブロックの逆量子化された量子化係数（つまり変換係数）を逆変換部２０６に出力する。

［逆変換部］
逆変換部２０６は、逆量子化部２０４からの入力である変換係数を逆変換することにより予測誤差を復元する。

例えば符号化ビットストリームから読み解かれた情報がＥＭＴ又はＡＭＴを適用することを示す場合（例えばＡＭＴフラグが真）、逆変換部２０６は、読み解かれた変換タイプを示す情報に基づいてカレントブロックの変換係数を逆変換する。

また例えば、符号化ビットストリームから読み解かれた情報がＮＳＳＴを適用することを示す場合、逆変換部２０６は、変換係数に逆再変換を適用する。

［加算部］
加算部２０８は、逆変換部２０６からの入力である予測誤差と予測制御部２２０からの入力である予測サンプルとを加算することによりカレントブロックを再構成する。そして、加算部２０８は、再構成されたブロックをブロックメモリ２１０及びループフィルタ部２１２に出力する。

［ブロックメモリ］
ブロックメモリ２１０は、イントラ予測で参照されるブロックであって復号対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ２１０は、加算部２０８から出力された再構成ブロックを格納する。

［ループフィルタ部］
ループフィルタ部２１２は、加算部２０８によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ２１４及び表示装置等に出力する。

符号化ビットストリームから読み解かれたＡＬＦのオン／オフを示す情報がＡＬＦのオンを示す場合、局所的な勾配の方向及び活性度に基づいて複数のフィルタの中から１つのフィルタが選択され、選択されたフィルタが再構成ブロックに適用される。

［フレームメモリ］
フレームメモリ２１４は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ２１４は、ループフィルタ部２１２によってフィルタされた再構成ブロックを格納する。

［イントラ予測部］
イントラ予測部２１６は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ２１０に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部２１６は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部２２０に出力する。

なお、色差ブロックのイントラ予測において輝度ブロックを参照するイントラ予測モードが選択されている場合は、イントラ予測部２１６は、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分を予測してもよい。

また、符号化ビットストリームから読み解かれた情報がＰＤＰＣの適用を示す場合、イントラ予測部２１６は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正する。

［インター予測部］
インター予測部２１８は、フレームメモリ２１４に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部２１８は、符号化ビットストリームから読み解かれた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部２２０に出力する。

なお、符号化ビットストリームから読み解かれた情報がＯＢＭＣモードを適用することを示す場合、インター予測部２１８は、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号を生成する。

また、符号化ビットストリームから読み解かれた情報がＦＲＵＣモードを適用することを示す場合、インター予測部２１８は、符号化ストリームから読み解かれたパターンマッチングの方法（バイラテラルマッチング又はテンプレートマッチング）に従って動き探索を行うことにより動き情報を導出する。そして、インター予測部２１８は、導出された動き情報を用いて動き補償を行う。

また、インター予測部２１８は、ＢＩＯモードが適用される場合に、等速直線運動を仮定したモデルに基づいて動きベクトルを導出する。また、符号化ビットストリームから読み解かれた情報がアフィン動き補償予測モードを適用することを示す場合には、インター予測部２１８は、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出する。

［予測制御部］
予測制御部２２０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部２０８に出力する。

（実施の形態２）
次に、以上のように構成された符号化装置１００及び復号装置２００において行われる一部の処理について図面を参照しながら具体的に説明する。なお、本開示の利益をさらに拡大するために、後述の各実施の形態を組み合わせてもよいことは、当業者には明らかであろう。

［本実施の形態の基礎となった知見］
画像の圧縮符号化技術では、入力画像に含まれるピクチャ（フレームとも言う）を一旦矩形領域のブロックに分割し、ブロック毎にそのピクチャを符号化することが一般的に行われる。各ブロックは、イントラ予測またはインター予測によって符号化される。イントラ予測は、符号化または復号済みの周辺ブロックの画素値を利用してブロックを予測する予測方法であり、インター予測は、符号化または復号済みのピクチャを用いてブロックを予測する予測方法である。さらに、圧縮符号化技術では、量子化パラメータなどの様々なパラメータを使って各ピクチャをブロックごとに符号化する。これらのパラメータを適切に選択することによって、符号量を抑えることができる、あるいは、画質を改善するなどの効果を得ることができる。

一方、これらのパラメータも符号量を持つため、ブロック毎にパラメータを最適化することで逆にピクチャ全体では符号量が増加してしまうという問題が生じる。一方で、ピクチャ全体で共通のパラメータを使うと、ピクチャ内に含まれる様々なブロックの特性に対して同一パラメータを使うことになるので部分最適が難しい。そこで、ピクチャ内の各ブロックが全て異なる特性を持つとは限らないことに着目し、似た様な特性を持つ複数のブロックに対して一括してパラメータを定義する方法が提案できる。この方法では、それぞれ複数種のパラメータからなる複数のセットを予め定義しておき、各ブロックに対して、何れかのセットを特定するための番号のみを割り当てる。これにより、各ブロックにおいて多くのパラメータを定義しなくても済むため、符号量の増加を抑えることができる。

具体的には、符号化装置は、最初にピクチャを複数のブロックに分割する。例えば、ピクチャは、一旦、それぞれ１２８ｘ１２８画素サイズの複数のブロックに分割される。符号化装置は、１２８ｘ１２８画素サイズのブロックを、必要に応じてさらに分割する。そのブロックを分割する場合には、符号化装置は、分割することを示すフラグを符号化し、１２８ｘ１２８画素サイズのブロックを４個の６４ｘ６４画素サイズのブロックに分割する。符号化装置は、その４個の６４ｘ６４画素サイズのブロックの夫々に対して、更に分割するか否かを判断し、分割したか否を示すフラグを符号化する。このようにして、符号化装置は、必要に応じて、ブロックサイズが最小サイズに至るまで再帰的に分割を繰り返す。最小サイズは、例えば８ｘ８画素サイズのブロックである。これにより一つのピクチャには、１２８ｘ１２８画素サイズから８ｘ８画素サイズまでの各サイズを有する複数のブロックが混在する。

符号化装置は、以上のようなピクチャの分割によって得られる複数のブロックのそれぞれに対して後続する符号化処理を行う。その後続する符号化処理では、符号化装置は、そのブロックの予測画像をイントラ予測またはインター予測によって生成し、ブロックと予測画像との差分を導出し、その差分を、例えばＤＣＴ(離散コサイン変換)やＤＳＴ(離散サイン変換)などの直交変換などを用いて周波数ドメインの情報に変換する。そして、符号化装置は、その情報を、視覚の特性を考慮して量子化する。量子化された情報は、一般的に小さい値をとることが多い。したがって、符号化装置は、可変長符号化によりその情報を符号化する。これにより、符号量を削減することが可能となる。量子化することにより、入力画像と、符号化された情報を元に復元された画像との間には相違が生じる。つまり、量子化によって非可逆圧縮が行われる。しかし、一般的にシーンチェンジなどで直前の画像と大きく異なる画像、または、画像の中で動きの早い部分では、人の視覚の特性により、上述の相違が人に識別され難い。したがって、量子化幅を大きく（すなわち粗く符号化）することにより、符号量を大きく削減することが可能となる。各ブロックにおいては、イントラ予測を使うのかインター予測を使うのかを示すフラグ、イントラ予測を用いる際の予測方向、インター予測を用いる際の動き情報や参照画像、量子化する際に量子化のレベルを決めるための量子化パラメータ、および可変長符号（具体的にはＣＡＢＡＣ：Context-Based Adaptive Binary Arithmetic Coding）のときのコンテキスト情報などの各パラメータも符号化される。つまり、各ブロックに対して様々なパラメータが関係し、これらのパラメータも符号化される。

ここで、ピクチャ内の複数のブロックのそれぞれにおいて、最適なこれらのパラメータの値は異なる。しかし、例えば、ピクチャの中で複数のブロックに跨って映っているような、比較的大きな対象物がある場合、その対象物の範囲に含まれる複数のブロックは似た特性を持つ。このため、その対象物の範囲に含まれる複数のブロックに対して、同じまたは近い値を持つパラメータを適用することで、その複数のブロックを効率よく符号化することが期待できる。したがって、これらのブロックの符号化に関係する複数のパラメータを一括で定義することにより、ブロック毎に同じ符号を送る必要がなくなり、符号量を削減することが可能となる。一方で、複数のブロックのそれぞれにおいてパラメータの関連性が低いような場合には、それらのブロックのパラメータを一括で定義するのではなく、個々のブロック毎にパラメータを定義する。これにより、複数のブロックのそれぞれのパラメータの関連性が低い場合についても、適切に画像を符号化することが可能である。

最新の画像圧縮技術においては、コンテキスト適応型算術符号（ＣＡＢＡＣ）を使って画像が符号化される。このコンテキスト適応型算術符号は、符号化する信号を二値化したのち、画像の特性と、符号化または復号済みの周辺ブロックの情報とを使って最適な確率情報を選択することにより、算術符号を行うものである。この算術符号においては、高い確率が予想される信号（値）に対して、その予想される確率を適用し、連続する信号の列が有する確率に適した符号を割り当てる。そのため、算術符号にされる情報を、理論上の限界に近い符号量に圧縮することが可能となる。

ブロック毎に複数種のパラメータを一括で定義する方法として、ＧｏｏｇｌｅＩｎｃ．が提案しているＶＰ９圧縮技術（単にＶＰ９ともいう）がある。ＶＰ９圧縮技術では、最初にブロックの種類とパラメータとの関係を定義する。具体的には、ピクチャヘッダに相当する部分において、ブロックのタイプを識別するための情報であるｓｅｇｍｅｎｔ＿ｉｄによって示される各番号に対して、符号化に用いられる複数種のパラメータが定義される。符号化に用いられる複数種のパラメータは、量子化パラメータ、インループフィルタのフィルタリング強度、参照ピクチャを選択するためのインデックス番号、および残差データ（予測誤差ともいう）の符号を省略するかどうかを示すフラグである。符号化装置は、各ブロックに対してｓｅｇｍｅｎｔ＿ｉｄのみを符号化し、このｓｅｇｍｅｎｔ＿ｉｄによって特定される各パラメータを当該ブロックの符号化に使うことで、各ブロックにおける符号量を削減することができる。

図１１は、ピクチャの各ブロックに付与されるｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。図１１に示すように、ピクチャＰｉｃ１は、例えば６４ｘ６４画素のブロック（スーパーブロックという）単位で符号化される。６４ｘ６４画素のブロックは分割することが可能である。図１１に示すように、ピクチャＰｉｃ１の例えば中央から下にかけた部分は、３２ｘ３２画素のブロック単位で符号化される。符号化装置は、６４ｘ６４画素のブロックを再帰的に分割することにより、６４ｘ６４画素サイズから４ｘ４画素サイズまでの大きさの複数のブロックを一つのピクチャの中に混在させることができる。

ここで、各ブロックにはｓｅｇｍｅｎｔ＿ｉｄが付与される。ブロック毎に付与されるｓｅｇｍｅｎｔ＿ｉｄに対応する複数種のパラメータは、ピクチャヘッダにて定義される。ｓｅｇｍｅｎｔ＿ｉｄによって、最大８組のパラメータのセットを定義することが可能である。

図１２は、ｓｅｇｍｅｎｔ＿ｉｄによって示される各番号に対応付けられたパラメータのセットの一例を示す図である。

ｓｅｇｍｅｎｔ＿ｉｄによって示される各番号（つまり＃０～＃６の何れかの番号）に対して、ＱＰ（量子化パラメータ）と、ＬＦｌｅｖｅｌ（フィルターレベル）と、ＲＥＦｐｉｃｔｕｒｅ（参照ピクチャ）と、ＳＫＩＰ（スキップモード）とを含むパラメータのセットが定義される。符号化装置は、ｓｅｇｍｅｎｔ＿ｉｄを使う場合は、ｓｅｇｍｅｎｔ＿ｉｄの番号をブロックの中で定義する。これにより、ブロック内でＱＰと、ＬＦｌｅｖｅｌと、ＲＥＦｐｉｃｔｕｒｅと、ＳＫＩＰとを定義することを省略できる。

ＶＰ９圧縮技術では、上述のように、ＱＰと、ＬＦｌｅｖｅｌと、ＲＥＦｐｉｃｔｕｒｅと、ＳＫＩＰとを含む４つのパラメータを、ｓｅｇｍｅｎｔ＿ｉｄを使って一括で定義することが提案されている。しかし、これら４つのパラメータに限らず、圧縮効率の改善が見込まれるパラメータは他にも考えられる。例えば、イントラ予測とインター予測との切換を示すパラメータ、参照ピクチャの数を示すパラメータ、および、動きベクトルの精度を示すパラメータなどが考えられる。ｓｅｇｍｅｎｔ＿ｉｄによって一括で定義されるパラメータの数を少なくすれば、符号化効率の改善が小さくなる一方で、ｓｅｇｍｅｎｔ＿ｉｄによって定義されるパラメータの数を多くすれば、ブロック毎でパラメータの調整が難しくなる。また、ピクチャまたはシーケンスごとに、ｓｅｇｍｅｎｔ＿ｉｄで定義されるパラメータの種類および数などを調整することも考えられるが、最適化の面で複雑さが増してしまう。

ここで、最近の圧縮技術においては、ピクチャを構成するブロックの符号化には、符号化効率に優れるコンテキスト適応型算術符号（ＣＡＢＡＣ）が用いられる。ＣＡＢＡＣは、符号化される信号の確率情報を調整することで、統計的な限界に近い符号化効率を得ることができる可変長符号化技術である。確率情報は、Ｉピクチャ、Ｐピクチャ、およびＢピクチャのそれぞれで異なることが予想されるので、ＨＥＶＣ（Ｈｉｇｈ－ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）技術では、Ｉピクチャ、Ｐピクチャ、およびＢピクチャのそれぞれで大きく区別されている。さらに、近隣のブロック同士では、確率情報が同じような傾向になることが見込まれる。したがって、符号化装置は、周辺ブロックの符号化によって得られたパラメータも使って確率情報を切り替える。これにより、符号化対象ブロックは、そのブロックに対してより適した確率情報に基づき符号化されるので、高い符号化効率を得ることができる。確率情報の切り替えには、コンテキストインデックスが用いられる。つまり、符号化装置および復号装置のそれぞれは、コンテキストインデックスによって特定される確率情報テーブルに格納された確率情報を使って符号化および復号処理を行う。確率情報テーブルに格納された確率情報と、実際の符号化における発生頻度、即ち確率とが一致すれば、符号化効率が情報理論上の限界に一致する。すなわち、最も少ない符号量で画像を符号化することが可能となる。

発生頻度は、符号化において変化する。したがって、符号化装置は、ＣＡＢＡＣの符号化の処理においては、各パラメータを符号化する度に、そのパラメータに対応する確率情報を更新する。この確率情報の更新は、エンコーダおよびデコーダのそれぞれで同一の処理がなされるので、エンコーダおよびデコーダは共に同じ確率情報を使って符号化および復号を行う。このようにＣＡＢＡＣでは、確率情報を更新することで、その確率情報はブロックのパラメータの実際の確率により近づくので、符号化効率が改善する。

ＣＡＢＡＣで使用される確率情報は、例えばピクチャの最初の部分で初期化される。ＨＥＶＣの場合では、スライスまたはタイルの最初の部分で、デフォルトの初期値が確率情報に適用される。この初期値は、Ｉピクチャ、Ｐピクチャ、およびＢピクチャのそれぞれで区別されるが、画像の特徴そのものが反映されたものではない。確率情報がピクチャ単位で初期化されるＶＰ９の場合は、ＨＥＶＣと異なり確率情報の初期値自体を調整することは可能であるが、ブロック毎に初期値自体を変えることはできない。そのため、一つのピクチャの中で、ブロック毎に異なる、すなわちブロックにより適した確率情報を適用することで、より高い符号化効率を得ることが期待できる。

以上の課題を解決するため、本発明では、ｓｅｇｍｅｎｔ＿ｉｄに対する各パラメータを先に定義する。ｓｅｇｍｅｎｔ＿ｉｄに定義付けられる複数種のパラメータに、ブロックを符号化または復号するための確率情報を含め、ｓｅｇｍｅｎｔ＿ｉｄにより確率情報を切り替える。

これによりブロックの特性に適した確率情報が適用されるので、確率情報を使う全てのパラメータの符号（復号）化において符号量の削減が期待できる。

［本実施の形態の概要］
本実施の形態における符号化装置１００は、処理回路と、その処理回路に接続されたメモリとを備える。メモリは、例えば図１に示すブロックメモリ１１８およびフレームメモリ１２２である。また、処理回路は、図１に示す各構成要素のうちのメモリ以外の少なくとも１つの構成要素からなる。例えば、処理回路は、プロセッサ、ＣＰＵ（Central processing unit）、または集積回路などからなる。

このような処理回路は、メモリを用いて、以下の処理を実行する。つまり、処理回路は、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも１つのパラメータを定義付ける。セグメント識別情報は、上述のｓｅｇｍｅｎｔ＿ｉｄである。次に、処理回路は、画像を複数のブロックに分割する。そして、処理回路は、その複数のブロックのそれぞれに対して、複数種のｓｅｇｍｅｎｔ＿ｉｄのうちの、当該ブロックのタイプに応じたｓｅｇｍｅｎｔ＿ｉｄを割り当てる。

図１３は、ピクチャの各ブロックに割り当てられるｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。

図１３に示すように、ピクチャＰｉｃ２は、複数の正方形のブロックから構成される。そのブロックは例えば６４ｘ６４画素の輝度ブロックからなる。６４ｘ６４画素のブロックは、スーパーブロックと呼ばれる。一般的には、４：２：０色信号の場合では、スーパーブロックは、６４ｘ６４画素の輝度ブロックと、３２ｘ３２画素の青みの色差ブロックと、３２ｘ３２画素の赤みの色差ブロックとからなる。本実施の形態では、輝度ブロックに対応する色差ブロックに対しては、輝度ブロックと同様の処理が行われる。つまり、本実施の形態における符号化装置は、例えば、色差ブロックの画素数が輝度ブロックの半分であることを除いて、色差ブロックを輝度ブロックと同じように分割する。したがって、以下、輝度ブロックを用いて本実施の形態における符号化装置の処理などを説明し、色差ブロックに対する詳細な説明を省略する。また、以下の説明では、輝度ブロックを単にブロックという。

次に、処理回路は、その複数のブロックのそれぞれを順に符号化する。その複数のブロックの符号化では、処理回路は、まず、その複数のブロックのうちの符号化対象ブロックに割り当てられているｓｅｇｍｅｎｔ＿ｉｄを特定する。そして、処理回路は、特定されたｓｅｇｍｅｎｔ＿ｉｄに対して定義付けられている少なくとも１つのパラメータを用いて符号化対象ブロックを符号化する。ここで、本実施の形態では、その少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む。この確率情報を特定するためのパラメータは、後述のｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘである。

また、本実施の形態における復号装置２００は、処理回路と、その処理回路に接続されたメモリとを備える。メモリは、例えば図１０に示すブロックメモリ２１０およびフレームメモリ２１４である。また、処理回路は、図１０に示す各構成要素のうちのメモリ以外の少なくとも１つの構成要素からなる。例えば、処理回路は、プロセッサ、ＣＰＵ（Central processing unit）、または集積回路などからなる。

復号装置２００の処理回路は、そのメモリを用いて、以下の処理を実行する。つまり、処理回路は、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも１つのパラメータを復号する。セグメント識別情報は、上述のｓｅｇｍｅｎｔ＿ｉｄである。次に、処理回路は、画像に含まれている複数のブロックを特定する。そして、処理回路は、その複数のブロックのそれぞれに対して割り当てられているｓｅｇｍｅｎｔ＿ｉｄを復号し、その複数のブロックのそれぞれを順に復号する。その複数のブロックの復号では、処理回路は、まず、その複数のブロックのうちの復号対象ブロックに割り当てられているｓｅｇｍｅｎｔ＿ｉｄを特定する。そして、処理回路は、特定されたｓｅｇｍｅｎｔ＿ｉｄに対して定義付けられている少なくとも１つのパラメータを用いて復号対象ブロックを復号する。ここで、本実施の形態では、その少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む。この確率情報を特定するためのパラメータは、後述のｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘである。

このように、本実施の形態では、複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれにｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む各パラメータが定義付けられ、各ブロックには、そのブロックのタイプ（すなわち特性）に応じたｓｅｇｍｅｎｔ＿ｉｄが割り当てられている。したがって、ブロックごとに、そのブロックに適した確率情報を特定するための情報を符号化する必要がないため、符号化効率を向上することができる。

［パラメータの定義付け］
最初に、ｓｅｇｍｅｎｔ＿ｉｄと、そのｓｅｇｍｅｎｔ＿ｉｄに対応する各パラメータの定義について説明する。ｓｅｇｍｅｎｔ＿ｉｄに対応する各パラメータの定義において、ブロックの大きさとは無関係に各パラメータを定義してもよい。しかし、ブロックのサイズによって最適なパラメータが異なる場合が多い。したがって、本実施の形態では、分割された後のブロックのサイズを表すサイズ識別情報であるｄｅｐｔｈと、ｓｅｇｍｅｎｔ＿ｉｄとの組み合わせに対して、各パラメータを定義する。本実施の形態では、例えば、各組み合わせに対する各パラメータの定義付けは、符号化装置１００の分割部１０２によって行われる。また、このような定義付けは、例えばピクチャ、あるいはそれより大きい画像単位、例えばシーケンスまたはビデオレイヤごとに行われる。つまり、ピクチャ、シーケンスあるいはビデオレイヤにおける、ヘッダあるいはパラメータセットの中で、その組み合わせに対応する各パラメータが定義される。例えば、各パラメータは、ピクチャパラメータセットにおいて定義される。

図１４は、ピクチャパラメータセットにおいて定義付けを行うためのシンタックスの一例を示す図である。図１４に示すシンタックスにおいて、ｓｅｇｍｅｎｔ＿ｎｕｍは、各ｄｅｐｔｈに対応するブロックのタイプの数を示す。ＶＰ９の場合は、ブロックのタイプは、ｄｅｐｔｈごとに区別されず、ブロックのタイプの総数は８である。なお、ブロックのタイプは、ｓｅｇｍｅｎｔ＿ｉｄによって識別される。また、ブロックのタイプの数は、固定であっても構わないし、上位レイヤ、例えばビデオレイヤの中で定義されてもよい。また、その数は、任意の数であっても構わないが、４、８または１６などの２のべき乗の数であることが望ましい。

図１５は、ピクチャパラメータセットの中で定義される、ｄｅｐｔｈとｓｅｇｍｅｎｔ＿ｉｄとの組み合わせに対応する各パラメータの例を示す図である。ｄｅｐｔｈ＝０は、ブロックが分割されていないこと、すなわち、ブロックのサイズが６４ｘ６４画素サイズであることを示す。例えば、分割部１０２は、ｄｅｐｔｈ＝０と、ｓｅｇｍｅｎｔ＿ｉｄ＝＃０、＃１、＃２および＃３によって識別される４つのブロックのタイプのそれぞれとの組み合わせに対して、各パラメータを定義する。つまり、６４ｘ６４画素サイズのブロックに対して、例えば５つのパラメータからなる４つのセットが定義される。各パラメータは、例えば、ｉｎｔｅｒ＿ｉｎｔｒａ、ｓｅｇ＿ＱＰ、ｓｅｇ＿ＲＥＦＰＩＣ、ｓｅｇ＿ＳＫＩＰ、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘである。ｉｎｔｅｒ＿ｉｎｔｒａは、予測方法がインター予測かイントラ予測かを示すパラメータである。ｉｎｔｅｒ＿ｉｎｔｒａ＝０は、イントラ予測を示し、ｉｎｔｅｒ＿ｉｎｔｒａ＝１は、インター予測を示す。ｓｅｇ＿ＱＰは、量子化パラメータである。ｓｅｇ＿ＲＥＦＰＩＣは、参照ピクチャを示すパラメータ、すなわち参照ピクチャインデックスである。ｓｅｇ＿ＳＫＩＰは、符号化方法がスキップモードか否かを示すパラメータである。ｓｅｇ＿ＳＫＩＰ＝０は、スキップモードでないことを示し、ｓｅｇ＿ＳＫＩＰ＝１は、スキップモードであることを示す。ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘは、ＣＡＢＡＣで使われるコンテキストに対応する確率情報を特定するためのパラメータである。なお、ピクチャの符号化開始時には、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘは、その確率情報の初期値を特定するために用いられる。

例えば、分割部１０２は、図１４に示すシンタックスにしたがって、ｄｅｐｔｈ＝０であって、かつｓｅｇｍｅｎｔ＿ｉｄ＝＃０の組み合わせに対して、例えば、ｉｎｔｅｒ＿ｉｎｔｒａ＝１、ｓｅｇ＿ＱＰ＝１３、ｅｇ＿ＲＥＦＰＩＣ＝０、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘ＝＃０－０を定義付ける。

なお、図１５に示す例のように、ｄｅｐｔｈとｓｅｇｍｅｎｔ＿ｉｄとの複数の組み合わせのそれぞれに対して定義付けられた各パラメータを示す情報を、以下、定義付け情報という。この定義付け情報は、ピクチャパラメータセットに含められる。

エントロピー符号化部１１０は、上述の例のように、シンタックスに基づいて各パラメータが定義されると、ｉｎｔｅｒ＿ｉｎｔｒａ＝１、ｓｅｇ＿ＱＰ＝１３、ｅｇ＿ＲＥＦＰＩＣ＝０、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘ＝＃０－０を符号化する。つまり、エントロピー符号化部１１０は、上述の組み合わせに対して定義付けられた１，１３，０，０，＃０－０を符号化する。以下、同様に、符号化装置１００は、ｄｅｐｔｈとｓｅｇｍｅｎｔ＝ｉｄとの他の組み合わせに対して定義付けられた各パラメータを符号化することで、図１５に示す全てのパラメータ、つまり定義付け情報を符号化する。

なお、符号化装置１００は、各組に対応する全てのパラメータを符号化する必要はなく、一部のパラメータの定義および符号化を省略してもよい。例えば、符号化装置１００は、ｓｅｇ＿ＳＫＩＰ＝１の場合には、ｉｎｔｅｒ＿ｉｎｔｒａなどの他のパラメータの定義に必要な符号を省略することができる。符号を省略した場合は符号量を削減することができる。また、ｓｅｇ＿ＳＫＩＰ＝１の場合には、他のパラメータの値は更新されないので、ｓｅｇ＿ＳＫＩＰ＝１のブロックの復号には、他のパラメータの値として、直前の値またはデフォルトの値が維持されて用いられる。

また、符号化装置１００は、パラメータの値または符号として“ｅｘｐｌｉｃｉｔ”を用いてもよい。パラメータが“ｅｘｐｌｉｃｉｔ”を示す場合には、そのパラメータの実際の値または符号は、ブロック内で定義される。例えば、パラメータであるｉｎｔｅｒ＿ｉｎｔｒａは、０、１、および２の何れかを示す。ｉｎｔｅｒ＿ｉｎｔｒａ＝０は、上述のように、予測方法がイントラ予測であることを示し、ｉｎｔｅｒ＿ｉｎｔｒａ＝１は、予測方法がインター予測であることを示す。そして、ｉｎｔｅｒ＿ｉｎｔｒａ＝２は、予測方法が“ｅｘｐｌｉｃｉｔ”であることを示す。予測方法が“ｅｘｐｌｉｃｉｔ”の場合には、分割部１０２は、ｉｎｔｅｒ＿ｉｎｔｒａ＝２に対応するブロックの中で予測方法（イントラ予測かインター予測）を定義する。このように“ｅｘｐｌｉｃｉｔ”を使えば符号量は削減できないが、ブロックに応じて適応的にパラメータを調整することができる。

本実施の形態における符号化装置１００は、上述のような、複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれに対して定義付けられた少なくとも１つのパラメータを、例えばピクチャパラメータセットに含める。また、符号化装置１００は、画像の分割では、その画像であるピクチャを分割する。これにより、ピクチャごとに、そのピクチャに含まれる各ブロックに対して適切なパラメータを用いてそのピクチャを符号化することができる。

また、上述の少なくとも１つのパラメータの定義付けでは、符号化装置１００は、複数種のｓｅｇｍｅｎｔ＿ｉｄのうちの何れか１つと、ブロックのサイズを識別するための複数種のｄｅｐｔｈのうちの何れか１つとの組み合わせに対して、少なくとも１つのパラメータを定義付ける。そして、符号化装置１００は、符号化対象ブロックの符号化では、その符号化対象ブロックのサイズに応じたｄｅｐｔｈと、特定されたｓｅｇｍｅｎｔ＿ｉｄとの組み合わせに対して定義付けられている少なくとも１つのパラメータを用いて符号化対象ブロックを符号化する。これにより、ブロックのサイズとタイプとに応じた適切なパラメータを、そのブロックの符号化に用いることができ、符号化効率を向上することができる。

そして、本実施の形態における復号装置２００は、上述のような、複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれに対して定義付けられている少なくとも１つのパラメータを、例えばピクチャパラメータセットから抽出して復号する。また、復号装置２００は、複数のブロックの特定では、画像であるピクチャに含まれている複数のブロックを特定する。これにより、ピクチャごとに、そのピクチャに含まれる各ブロックに対して適切なパラメータを用いてそのピクチャを復号することができる。

また、復号装置２００は、複数種のｓｅｇｍｅｎｔ＿ｉｄのうちの何れか１つと、ブロックのサイズを識別するための複数種のｄｅｐｔｈのうちの何れか１つとの組み合わせに対して定義付けられている、少なくとも１つのパラメータを特定する。そして、復号装置２００は、復号対象ブロックの復号では、その復号対象ブロックのサイズに応じたｄｅｐｔｈと、特定されたｓｅｇｍｅｎｔ＿ｉｄとの組み合わせに対して定義付けられている、少なくとも１つのパラメータを用いてその復号対象ブロックを復号する。これにより、ブロックのサイズとタイプとに応じた適切なパラメータを、そのブロックの復号に用いることができ、符号化効率を向上することができる。

［ブロック分割とｓｅｇｍｅｎｔ＿ｉｄの割り当て］
次に、ピクチャ内の各ブロックの分割と、分割されたブロックにｓｅｇｍｅｎｔ＿ｉｄを割り当てる方法とについて説明する。

図１６Ａは、ブロックの分割と、各ブロックに対するｓｅｇｍｅｎｔ＿ｉｄの割り当てとを行うためのシンタックスの一例を示す図である。

まず、分割部１０２は、最初にピクチャを矩形領域に分割する。例えば、分割部１０２は、図１３に示す３８４ｘ２５６画素からなるピクチャＰｉｃ２を、それぞれ６４ｘ６４画素の矩形領域である複数のスーパーブロックに分割する。その結果、ピクチャＰｉｃ２は、横６列および縦４行に配列された合計２４個のスーパーブロックに分割される。分割部１０２は、ピクチャＰｉｃ２内における左上端のスーパーブロックから順番に右側の各スーパーブロックをスキャンする。そして、分割部１０２は、スキャンされるスーパーブロックの位置が右端に到達した場合は、一つ下の行の左端のスーパーブロックから順番に右側の各スーパーブロックをスキャンする。このように、順番に２４個のスーパーブロックがスキャンされる。

具体的には、図１３に示す例では、分割部１０２は、ピクチャＰｉｃ２内の上から一行目（すなわち最上段）の全てのスーパーブロックを分割しない。分割部１０２は、ピクチャＰｉｃ２内の上から２行目にあって、左から２番目と３番目の各スーパーブロックを分割する。同様に、分割部１０２は、３行目の各スーパーブロックをスキャンして、分割が必要とされるスーパーブロックを分割し、次に、４行目の各スーパーブロックをスキャンして、分割が必要とされるスーパーブロックを分割する。

次に、分割部１０２は、各ブロックに対してｓｅｇｍｅｎｔ＿ｉｄを割り当てる。例えば、分割部１０２は、ピクチャＰｉｃ２における最上段の全てのスーパーブロックに対して、ｓｅｇｍｅｎｔ＿ｉｄ＝＃０を割り当て、上から２行目の左端のスーパーブロックに対して、ｓｅｇｍｅｎｔ＿ｉｄ＝＃１を割り当てる。次に、分割部１０２は、上から２行目にあって左から２番目のスーパーブロックが分割されることによって得られた４つのサブブロックのそれぞれに対して、ｓｅｇｍｅｎｔ＿ｉｄを割り当てる。つまり、分割部１０２は、その４つのサブブロックのうち、左上のサブブロック、右上のサブブロック、左下のサブブロック、および右下のサブブロックのそれぞれに対して、ｓｅｇｍｅｎｔ＿ｉｄ＝＃０、＃０、＃０、および＃２を割り当てる。

より具体的には、上記ケースにおいて図１６Ａに示すシンタックスの手順を用いると、分割部１０２は、ピクチャＰｉｃ２の左上端のスーパーブロックは分割されないため、スーパーブロックを分割しないことを示すフラグであるｓｐｌｉｔ＿ｂｌｏｃｋ＝０を取得する。このとき、分割部１０２は、シンタックスにおけるｉｆ文の条件を満たさないため、そのスーパーブロックに対して、ｓｅｇｍｅｎｔ＿ｉｄ＝＃０を割り当てる。

図１６Ｂは、各ブロックのｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎとｓｅｇｍｅｎｔ＿ｉｄの一例を示す図である。

図１６Ａに示すシンタックスの処理を各スーパーブロックに対して順番に繰り返すことによって、図１３に示すように、ピクチャＰｉｃ２に含まれる複数のスーパーブロックのうちの何れかのスーパーブロックは複数のサブブロックに分割される。そして、スーパーブロックを含むこれらの各ブロックに対してｓｅｇｍｅｎｔ＿ｉｄが割り当てられる。つまり、上記シンタックスの処理を、ピクチャＰｉｃ２内の左上から右下までの各スーパーブロックに対して繰り返すことにより、ピクチャ全体のブロックの分割と、各ブロックに対応するｓｅｇｍｅｎｔ＿ｉｄの割り当てとが行われる。また、ピクチャ全体のブロックの分割によって、図１６Ｂに示すように、ピクチャにおける分割のパターンを示すブロック分割情報であるｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎが得られる。エントロピー符号化部１１０は、ｓｅｇｍｅｎｔ＿ｉｄおよびｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎなどの情報を、ハフマン符号などの一般的な可変長符号を用いて符号化してもよい。あるいは、エントロピー符号化部１１０は、周辺ブロックを考慮するコンテキスト適応型の符号であるＣＡＶＬＣ（Context-based Adaptive Variable Length Coding）またはＣＡＢＡＣなどを用いて、上述の各情報を符号化してもよい。隣接するブロック同士は似たような特性を示す傾向にあるのでコンテキスト適応型の符号を使うことが望ましい。このように、本実施の形態では、エントロピー符号化部１１０は、画像における分割のパターンを示すブロック分割情報（具体的にはｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎ）を符号化する。これにより、符号化装置１００によって行われた分割のパターンを、復号装置２００に適切に通知することができる。

ここでは、説明を簡素化するため、１階層のみの分割の例を説明したが、図１６Ａのシンタックスに示すように、ブロックの分割とｓｅｇｍｅｎｔ＿ｉｄの割り当てとは、階層的に行うことができる。したがって、６４ｘ６４画素のブロックおよび３２ｘ３２画素のブロックだけに限らず、１６ｘ１６画素または８ｘ８画素のブロックも、一つのピクチャに混在させることが可能となる。また、予め定められたサイズより小さいサイズのブロックに分割しないことがわかっている場合は、パラメータであるｍａｘ＿ｄｅｐｔｈによって、分割の階層の上限を定義しておいてもよい。この場合には、さらに分割するか否かを表すｓｐｌｉｔ＿ｂｌｏｃｋの符号を省略することもできる。例えば、ブロックを、１６ｘ１６画素のサイズと同じかより小さいサイズのブロックに分割しない場合には、分割部１０２は、ｍａｘ＿ｄｅｐｔｈ＝２を予め定義しておくことで、ｓｐｌｉｔ＿ｂｌｏｃｋの符号を少なくすることが可能となる。

復号装置２００は、上述のｓｅｇｍｅｎｔ＿ｉｄおよびｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎなどの符号を復号する。これにより、ブロックの分割のパターンを特定することができ、各ブロックに割り当てられたｓｅｇｍｅｎｔ＿ｉｄを取得することができる。つまり、本実施の形態では、復号装置２００のエントロピー復号部２０２は、画像における分割のパターンを示すブロック分割情報（具体的にはｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎ）を復号する。そして、エントロピー復号部２０２は、そのブロック分割情報に基づいて、画像に含まれている複数のブロックを特定する。例えば、図１３に示すピクチャＰｉｃ２における左上端のブロックに対するｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎ＝０が復号される。したがって、そのブロックは分割されていない。即ち、復号装置２００は、そのブロックのサイズが６４ｘ６４画素サイズであり、そのブロックに対応するｄｅｐｔｈが「０」であることを特定することができる。

図１７は、各ブロックに適用されるパラメータを取得するためシンタックスの一例を示す図である。

上述の例では、左上端のブロックのｄｅｐｔｈは「０」である。また、そのブロックにはｓｅｇｍｅｎｔ＿ｉｄ＝＃０が割り当てられている。ここで、図１５に示す定義付け情報では、ｄｅｐｔｈ＝０およびｓｅｇｍｅｎｔ＿ｉｄ＝＃０の組み合わせに対して各パラメータが定義付けられている。これらの各パラメータは、具体的には、ｉｎｔｅｒ＿ｉｎｔｒａ＝１、ｓｅｇ＿ＱＰ＝１３、ｓｅｇ＿ＲＥＦＰＩＣ＝０、ｓｅｇ＿ＳＫＩＰ＝０、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘ＝＃０－０である。これらのパラメータは、定義付け情報におけるｄｅｐｔｈ＝０およびｓｅｇｍｅｎｔ＿ｉｄ＝＃０の組み合わせに対応付けられている。したがって、符号化装置１００のエントロピー符号化部１１０は、例えば図１７に示すシンタックスにしたがって、図１５に示す定義付け情報から、その組み合わせに対して定義づけられている各パラメータを取得することができる。同様に、復号装置２００のエントロピー復号部２０２は、例えば図１７に示すシンタックスにしたがって、図１５に示す定義付け情報から、その組み合わせに対して定義づけられている各パラメータを取得することができる。これにより、そのブロックにおいてこれらのパラメータの符号を省略することができる。

［ブロックの符号化および復号］
次に、ｄｅｐｔｈおよびｓｅｇｍｅｎｔ＿ｉｄの組み合わせにより定義される各パラメータ以外の、各ブロックに関係するパラメータの符号化について説明する。符号化装置１００は、例えば、実施の形態１に示す符号化技術、または通常の画像圧縮技術に準じて各ブロックを符号化する。したがって、ここでは圧縮に使われる各技術の詳細説明については省略し、パラメータの符号化について詳細に説明する。

符号化装置１００は、ピクチャ全体におけるブロックの分割およびｓｅｇｍｅｎｔ＿ｉｄの符号化に続いて、ピクチャ全体にわたる分割によって得られる各ブロックのパラメータに関する情報を符号化する。

図１８は、ピクチャＰｉｃ２の分割によって得られる各ブロックの符号化の順番の一例を示す図である。

符号化装置１００は、ピクチャＰｉｃ２の各ブロックを、左上端のブロックから順番に符号化する。ブロックが４つのサブブロックに分割されている場合には、符号化装置１００は、そのブロックに含まれる４つのサブブロックを、左上のサブブロック、右上のサブブロック、左下のサブブロック、右下のサブブロックの順番でスキャンする。このように順番にスキャンすることで、ピクチャ内に大きさの異なる複数のブロックが混在していても、符号化装置１００は、それらのブロックを順番にスキャンして符号化することができる。

具体的には、符号化装置１００は、まず、ピクチャＰｉｃ２の左上端のブロックから符号化を開始する。左上端のブロックに対するｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎは「０」であるため、符号化装置１００は、そのブロック（つまりスーパーブロック）を分割しない。したがって、そのブロックのサイズは６４ｘ６４画素サイズであり、そのブロックに対応するｄｅｐｔｈは「０」である。また、そのブロックに対しては、ｓｅｇｍｅｎｔ＿ｉｄ＝０が割り当てられている。ここで、図１５に示す定義付け情報では、ｄｅｐｔｈ＝０およびｓｅｇｍｅｎｔ＿ｉｄ＝０の組み合わせに対して、ｉｎｔｅｒ＿ｉｎｔｒａ＝１、ｓｅｇ＿ＱＰ＝１３、ｓｅｇ＿ＲＥＦＰＩＣ＝０、ｓｅｇ＿ＳＫＩＰ＝０、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘ＝＃０－０が定義付けられている。これらのパラメータは、定義付け情報において、ｄｅｐｔｈ＝０およびｓｅｇｍｅｎｔ＿ｉｄ＝０の組み合わせに対応付けられるため、ブロックではそれらのパラメータの符号を省略することができる。その結果、符号化装置１００は、ピクチャＰｉｃ２の左上端の６４ｘ６４画素サイズのブロックを、６４ｘ６４画素サイズの状態で、参照ピクチャインデックス＝０番で特定される参照ピクチャを用いたインター予測によって符号化する。このとき、符号化装置１００は、スキップモードを用いずに、予測符号における残差データ（すなわち予測誤差）を量子化パラメータ＝１３で量子化する。なお、量子化パラメータ＝１３は、絶対値そのものであってもよく、任意の値からの差分によって示されてもよく、あるいはインデックス情報によって間接的に示されてもよい。

次に、エントロピー符号化部１１０は、例えば動きベクトルの候補を選択するためのインデックス番号、動きベクトルの差分情報、および、動き補償により得られた残差データの量子化値などのエントロピー符号化を行う。

ブロックに関係するパラメータとしては、動きベクトルの候補を選択するためのインデックス番号がある。このインデックス番号は、対象ブロックに空間的あるいは時間的に隣接する符号化または復号済みの周辺ブロックから導出された動きベクトルの中から、当該対象ブロックの動きベクトルの符号化または復号に使われる動きベクトルの候補を選択するための番号である。ブロックの特性が解っている場合、動きベクトルの候補が例えばゼロベクトルになる可能性が高いようなケースにおいては、ゼロベクトルを選択するような符号化パターンに対して、ＣＡＢＡＣで使う確率情報を高くしておく。これにより、少ない符号量でゼロベクトルを選択することができる。同様に、動きベクトルの差分情報に対しても、差分情報の値が小さい傾向にあれば、その差分情報の符号量が小さくなる符号化パターンに対して、確率情報を高く設定する。あるいは、差分情報の値が大きい傾向にあれば、その差分情報の符号量が小さくなる符号化パターンに対して、確率情報を高く設定する。これにより、符号量を小さくすることができる。その他の情報においても適切な確率情報を適用することにより符号量を少なくすることが期待できる。符号化装置１００は、これらの確率情報を、ｄｅｐｔｈ＝０およびｓｅｇｍｅｎｔ＿ｉｄ＝０の組み合わせに対応付けてコンテキストテーブルに格納しておく。これにより、ｄｅｐｔｈおよびｓｅｇｍｅｎｔ＿ｉｄによって確率情報を選択することで、符号化効率の向上が期待できる。

同様に、符号化装置１００は、ピクチャＰｉｃ２の上から２行目で左から２番目のスーパーブロックを符号化する。このとき、符号化装置１００は、そのスーパーブロックに含まれる４つのサブブロックを、左上のサブブロック、右上のサブブロック、左下のサブブロック、右下のサブブロックの順番でスキャンする。そして、符号化装置１００は、そのスキャンされるサブブロックに対して、上述のスーパーブロックに対する符号化と同様の符号化を行う。

復号装置２００は、上述のように符号化された各ブロックを復号する。ここでは、ピクチャＰｉｃ２の上から２行目で左から２番目のスーパーブロックに含まれる、左上のサブブロックの復号について説明する。この左上のサブブロックは、図１７に示すように、左上端のブロック（０番目のブロック）から数えて、７番目のブロックである。

エントロピー復号部２０２は、図１５に示す定義付け情報を復号し、さらに、ブロックのｂｌｏｃｋ＿ｐａｒｔｉｔｉｏｎおよびｓｅｇｍｅｎｔ＿ｉｄを復号する。その結果、エントロピー復号部２０２は、そのサブブロックが３２ｘ３２画素サイズ（すなわちｄｅｐｔｈ＝１）であり、かつ、そのサブブロックに対してｓｅｇｍｅｎｔ＿ｉｄ＝０が割り当てられていることを特定する。したがって、エントロピー復号部２０２は、これらの情報に基づいてサブブロックを復号する。

具体的には、エントロピー復号部２０２は、図１５に示す定義付け情報において、ｄｅｐｔｈ＝１およびｓｅｇｍｅｎｔ＿ｉｄ＝０に対応付けられた各パラメータをそのサブブロックに適応する。より具体的には、図１５に示す定義付け情報では、ｄｅｐｔｈ＝１およびｓｅｇｍｅｎｔ＿ｉｄ＝０の組に対して、ｉｎｔｅｒ＿ｉｎｔｒａ＝１、ｓｅｇ＿ＱＰ＝４０、ｓｅｇ＿ＲＥＦＰＩＣ＝１、ｓｅｇ＿ＳＫＩＰ＝１、および、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘ＝＃１－０が割り当てられている。したがって、エントロピー復号部２０２は、サブブロックに対してこれらのパラメータをその定義付け情報から導出する。その結果、復号装置２００は、量子化パラメータ＝４０を用い、参照ピクチャインデックス＝１で特定される参照ピクチャを用いたインター予測を行う。このとき、復号装置２００は、ｓｅｇ＿ＳＫＩＰ＝１であるため、残差データを復号しない。さらに、復号装置２００は、ブロックに関係する残りのパラメータを復号することによって、そのブロックを復号する。これらの残りのパラメータは、上述のように、動きベクトルの候補を選択するためのインデックス番号、および動きベクトルの差分情報などである。エントロピー復号部２０２は、図１５に示す定義付け情報において、ｄｅｐｔｈ＝１およびｓｅｇｍｅｎｔ＿ｉｄ＝０の組に対応付けられたｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘの確率情報を使って、それらの残りのパラメータを復号する。これにより、ブロックに適した確率情報を適用することで符号化効率の改善が期待できる。

［確率情報の定義および更新］
各ブロックの特性に適した確率情報を使うことで符号化効率の向上が期待できる。以下、どのようにして確率情報を定義するかについて説明する。第１の方法として、予め定められた確率情報の初期値を持つ方法がある。例えば、ＨＥＶＣ規格においては、Ｉ、Ｐ、およびＢピクチャの夫々に対して初期値が予め定義されている。第２の方法として、本実施の形態のように、ピクチャまたはピクチャよりも上位レイヤにおける、ヘッダまたはパラメータセットの中で、適当な値を定義する方法がある。この場合には適切な確率情報を定義することができる。

ＣＡＢＡＣでは、パラメータを符号化あるいは復号するたびに、確率情報は更新される。つまり、エントロピー符号化部１１０およびエントロピー復号部２０２は、確率情報を更新する。例えば、あるブロックがインター予測で符号化された場合、そのブロックに隣接するブロックもインター予測で符号化される可能性が高い。さらに、インター予測で符号化されるブロックが続く場合には、それらのブロックの後に続くブロックがインター予測で符号化される可能性は、更に高い。したがって、エントロピー符号化部１１０およびエントロピー復号部２０２は、インター予測とイントラ予測との切り替えを示すフラグであるｉｎｔｅｒ＿ｉｎｔｒａの確率情報をその可能性に応じて更新する。このように、符号化あるいは復号の状況に応じて確率情報を更新することで、よりブロックに適した確率情報が得られ、符号化効率が改善される。

そこで、本実施の形態における符号化装置１００の分割部１０２は、似たような特性を持つ複数のブロックに対して同じｓｅｇｍｅｎｔ＿ｉｄを割り当てる。そのため、エントロピー符号化部１１０およびエントロピー復号部２０２は、同じｓｅｇｍｅｎｔ＿ｉｄを持つブロックを符号化または復号する度に、より適した確率情報を得ることができる。例えば、エントロピー符号化部１１０およびエントロピー復号部２０２は、ある画像の符号化または復号が終わった時点の確率情報を保存しておき、次の画像の符号化または復号においてその確率情報を使う。例えば、上述のある画像と次の画像は、ブロックまたはピクチャである。この場合には、次のブロックまたはピクチャの最初から学習効果が適用された確率情報が適用されるので、ＣＡＢＡＣにおいて高い符号化効率が期待できる。また、この場合には、複数種のｓｅｇｍｅｎｔ＿ｉｄの夫々に対して確率情報が保存されるため、一つのピクチャの中に複数の性質が異なるブロックが存在したとしても、それぞれのブロックに対して適した確率情報を適用することができる。このような確率情報は、例えば、ｄｅｐｔｈおよびｓｅｇｍｅｎｔ＿ｉｄの組み合わせに対して定義付けられたｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘによって特定される。例えばピクチャの符号化または復号が開始されたときには、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘによって、確率情報の初期値が特定され、開始後には、そのｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘによって、更新後の確率情報が特定されてもよい。

また、エントロピー符号化部１１０およびエントロピー復号部２０２は、各ブロックの終わりで、確率情報の更新をするか否かを示すフラグなどを符号化または復号してもよい。これにより、確率情報を更新するか否かを明示的に定めることができる。例えば、符号化装置１００および復号装置２００は、大きな対象物が映っているピクチャをブロックごとに符号化または復号する。このとき、エントロピー符号化部１１０およびエントロピー復号部２０２は、対象物の範囲中に含まれる複数のブロックを連続して符号化または復号する場合には、確率情報を更新し続ける。一方、対象物の範囲内に含まれるブロックが符号化または復号され、次に、対象物の範囲外の背景が映っているブロックが符号化または復号される場合には、それぞれのブロック内に含まれる画像の性質が異なる。したがって、このような符号化または復号において、確率情報を更新すると、実際の画像と、その画像の性質を表す確率とがずれてしまう。したがって、このような場合には、エントロピー符号化部１１０およびエントロピー復号部２０２は、確率情報の更新を行わずに、前のブロックを符号化または復号した際の確率情報を維持することで、適切な確率情報を用いて次のブロックを符号化または復号することができる。

［全体的な処理動作］
図１９は、本実施の形態における符号化装置１００の全体的な処理動作を示すフローチャートである。

符号化装置１００は、ブロックのタイプを識別するための複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれに対して少なくとも１つのパラメータを定義付ける（ステップＳ１０１）。この少なくとも１つのパラメータは、ＣＡＢＡＣのコンテキストに対応する確率情報を特定するためのパラメータであるｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む。

次に、符号化装置１００は、画像を複数のブロックに分割し（ステップＳ１０２）、その複数のブロックのそれぞれに対して、複数種のｓｅｇｍｅｎｔ＿ｉｄのうちの、当該ブロックのタイプに応じたｓｅｇｍｅｎｔ＿ｉｄを割り当てる（ステップＳ１０３）。

次に、符号化装置１００は、その複数のブロックのそれぞれを順に符号化する。このとき、符号化装置１００は、その複数のブロックのうちの符号化対象ブロックに割り当てられているｓｅｇｍｅｎｔ＿ｉｄを特定する（ステップＳ１０４）。そして、符号化装置１００は、特定されたｓｅｇｍｅｎｔ＿ｉｄに対して定義付けられている、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む少なくとも１つのパラメータを用いて、符号化対象ブロックを符号化する（ステップＳ１０５）。

図２０は、本実施の形態における復号装置２００の全体的な処理動作を示すフローチャートである。

復号装置２００は、ブロックのタイプを識別するための複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれに対して定義付けられている少なくとも１つのパラメータを復号する（ステップＳ２０１）。この少なくとも１つのパラメータは、ＣＡＢＡＣのコンテキストに対応する確率情報を特定するためのパラメータであるｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む。

次に、復号装置２００は、画像に含まれている複数のブロックを特定し（ステップＳ２０２）、その複数のブロックのそれぞれに対して割り当てられているｓｅｇｍｅｎｔ＿ｉｄを復号する（ステップＳ２０３）。

次に、復号装置２００は、その複数のブロックのそれぞれを順に復号する。このとき、復号装置２００は、その複数のブロックのうちの復号対象ブロックに割り当てられているｓｅｇｍｅｎｔ＿ｉｄを特定する（ステップＳ２０４）。そして、復号装置２００は、特定されたｓｅｇｍｅｎｔ＿ｉｄに対して定義付けられている、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む少なくとも１つのパラメータを用いて、復号対象ブロックを復号する（ステップＳ２０５）。

［効果］
本発明の一態様に係る符号化装置は、処理回路と、前記処理回路に接続されたメモリとを備え、前記処理回路は、前記メモリを用いて、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも１つのパラメータを定義付け、
画像を複数のブロックに分割し、前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、前記複数のブロックのそれぞれを符号化し、前記複数のブロックの符号化では、前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、特定された前記セグメント識別情報に対して定義付けられている前記少なくとも１つのパラメータを用いて前記符号化対象ブロックを符号化し、前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む。セグメント識別情報は、例えば上述のｓｅｇｍｅｎｔ＿ｉｄであり、確率情報を特定するためのパラメータは、例えば上述のｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘである。

これにより、複数種のｓｅｇｍｅｎｔ＿ｉｄのそれぞれに、ｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを含む各パラメータが定義付けられる。さらに、各ブロックには、そのブロックのタイプ（すなわち特性）に応じたｓｅｇｍｅｎｔ＿ｉｄが割り当てられている。したがって、ブロックごとに、そのブロックに適した確率情報を特定するためのｓｅｇ＿ｃｏｎｔｅｘｔ＿ｉｄｘを符号化する必要がないため、符号化効率を向上することができる。つまり、画像を複数のブロックに分割し、その複数のブロックに対してｓｅｇｍｅｎｔ＿ｉｄを付与することで、各ブロックを符号化する際に必要は符号量を少なくすることができる。加えて、ｓｅｇｍｅｎｔ＿ｉｄを用いてコンテキスト適応型算術符号（ＣＡＢＡＣ）の確率情報を切り替えることにより、確率情報のパラメータに対する符号化効率の向上が望めるため、更なる符号化効率の改善が期待できる。

例えば、前記処理回路は、さらに、前記画像における分割のパターンを示すブロック分割情報を符号化してもよい。

これにより、符号化装置によって行われた分割のパターンを、復号装置に適切に通知することができる。

また、前記処理回路は、さらに、前記複数種のセグメント識別情報のそれぞれに対して定義付けられた前記少なくとも１つのパラメータを、ピクチャパラメータセットに含め、前記画像の分割では、前記画像であるピクチャを分割してもよい。

これにより、ピクチャごとに、そのピクチャに含まれる各ブロックに対して適切なパラメータを用いてそのピクチャを符号化することができる。

また、前記処理回路は、前記少なくとも１つのパラメータの定義付けでは、前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して、前記少なくとも１つのパラメータを定義付け、前記符号化対象ブロックの符号化では、前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記符号化対象ブロックを符号化してもよい。

これにより、ブロックのサイズとタイプとに応じた適切なパラメータを、そのブロックの符号化に用いることができ、符号化効率を向上することができる。

また、本発明の一態様に係る復号装置は、処理回路と、前記処理回路に接続されたメモリとを備え、前記処理回路は、前記メモリを用いて、ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも１つのパラメータを復号し、画像に含まれている複数のブロックを特定し、前記複数のブロックのそれぞれに対して割り当てられているセグメント識別情報を復号し、前記複数のブロックのそれぞれを復号し、前記複数のブロックの復号では、前記複数のブロックのうちの復号対象ブロックに割り当てられているセグメント識別情報を特定し、特定された前記セグメント識別情報に対して定義付けられている前記少なくとも１つのパラメータを用いて前記復号対象ブロックを復号し、前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む。

これにより、上述の符号化装置による符号化によって得られる情報を適切に復号することができる。つまり、符号化効率の向上を図ることができる。

例えば、前記処理回路は、前記複数のブロックの特定では、前記画像における分割のパターンを示すブロック分割情報を復号し、前記ブロック分割情報に基づいて、前記画像に含まれている複数のブロックを特定してもよい。

これにより、符号化装置によって行われた分割のパターンにしたがって、画像に含まれる複数のブロックを適切に特定することができる。

また、前記処理回路は、前記少なくとも１つのパラメータの復号では、前記複数種のセグメント識別情報のそれぞれに対して定義付けられている前記少なくとも１つのパラメータを、ピクチャパラメータセットから抽出して復号し、前記複数のブロックの特定では、前記画像であるピクチャに含まれている前記複数のブロックを特定してもよい。

これにより、ピクチャごとに、そのピクチャに含まれる各ブロックに対して適切なパラメータを用いてそのピクチャを復号することができる。

また、前記処理回路は、前記少なくとも１つのパラメータの復号では、前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して定義付けられている、前記少なくとも１つのパラメータを特定し、前記復号対象ブロックの復号では、前記復号対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている、前記少なくとも１つのパラメータを用いて前記復号対象ブロックを復号してもよい。

これにより、ブロックのサイズとタイプとに応じた適切なパラメータを、そのブロックの復号に用いることができ、符号化効率を向上することができる。

（その他の実施の形態）
以上の各実施の形態において、機能ブロックの各々は、通常、ＭＰＵ及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ＲＯＭ等の記録媒体に記録されたソフトウェア（プログラム）を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア（専用回路）によって実現することも、当然、可能である。

また、各実施の形態において説明した処理は、単一の装置（システム）を用いて集中処理することによって実現してもよく、又は、複数の装置を用いて分散処理することによって実現してもよい。また、上記プログラムを実行するプロセッサは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、又は分散処理を行ってもよい。

本発明は、以上の実施例に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含される。

さらにここで、上記各実施の形態で示した動画像符号化方法（画像符号化方法）又は動画像復号化方法（画像復号方法）の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、画像復号方法を用いた画像復号装置、及び両方を備える画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。

［使用例］
図２１は、コンテンツ配信サービスを実現するコンテンツ供給システムｅｘ１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ｅｘ１０６、ｅｘ１０７、ｅｘ１０８、ｅｘ１０９、ｅｘ１１０が設置されている。

このコンテンツ供給システムｅｘ１００では、インターネットｅｘ１０１に、インターネットサービスプロバイダｅｘ１０２又は通信網ｅｘ１０４、及び基地局ｅｘ１０６～ｅｘ１１０を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器が接続される。当該コンテンツ供給システムｅｘ１００は、上記のいずれかの要素を組合せて接続するようにしてもよい。固定無線局である基地局ｅｘ１０６～ｅｘ１１０を介さずに、各機器が電話網又は近距離無線等を介して直接的又は間接的に相互に接続されていてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１等を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器と接続される。また、ストリーミングサーバｅｘ１０３は、衛星ｅｘ１１６を介して、飛行機ｅｘ１１７内のホットスポット内の端末等と接続される。

なお、基地局ｅｘ１０６～ｅｘ１１０の代わりに、無線アクセスポイント又はホットスポット等が用いられてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１又はインターネットサービスプロバイダｅｘ１０２を介さずに直接通信網ｅｘ１０４と接続されてもよいし、衛星ｅｘ１１６を介さず直接飛行機ｅｘ１１７と接続されてもよい。

カメラｅｘ１１３はデジタルカメラ等の静止画撮影、及び動画撮影が可能な機器である。また、スマートフォンｅｘ１１５は、一般に２Ｇ、３Ｇ、３．９Ｇ、４Ｇ、そして今後は５Ｇと呼ばれる移動通信システムの方式に対応したスマートフォン機、携帯電話機、又はＰＨＳ（ＰｅｒｓｏｎａｌＨａｎｄｙｐｈｏｎｅＳｙｓｔｅｍ）等である。

家電ｅｘ１１８は、冷蔵庫、又は家庭用燃料電池コージェネレーションシステムに含まれる機器等である。

コンテンツ供給システムｅｘ１００では、撮影機能を有する端末が基地局ｅｘ１０６等を通じてストリーミングサーバｅｘ１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、端末（コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、及び飛行機ｅｘ１１７内の端末等）は、ユーザが当該端末を用いて撮影した静止画又は動画コンテンツに対して上記各実施の形態で説明した符号化処理を行い、符号化により得られた映像データと、映像に対応する音を符号化した音データと多重化し、得られたデータをストリーミングサーバｅｘ１０３に送信する。即ち、各端末は、本発明の一態様に係る画像符号化装置として機能する。

一方、ストリーミングサーバｅｘ１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントは、上記符号化処理されたデータを復号化することが可能な、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、又は飛行機ｅｘ１１７内の端末等である。配信されたデータを受信した各機器は、受信したデータを復号化処理して再生する。即ち、各機器は、本発明の一態様に係る画像復号装置として機能する。

［分散処理］
また、ストリーミングサーバｅｘ１０３は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバｅｘ１０３は、ＣＤＮ（ＣｏｎｔｅｎｔｓＤｅｌｉｖｅｒｙＮｅｔｗｏｒｋ）により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。ＣＤＮでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。

また、配信自体の分散処理にとどまらず、撮影したデータの符号化処理を各端末で行ってもよいし、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、一般に符号化処理では、処理ループが２度行われる。１度目のループでフレーム又はシーン単位での画像の複雑さ、又は、符号量が検出される。また、２度目のループでは画質を維持して符号化効率を向上させる処理が行われる。例えば、端末が１度目の符号化処理を行い、コンテンツを受け取ったサーバ側が２度目の符号化処理を行うことで、各端末での処理負荷を減らしつつもコンテンツの質と効率を向上させることができる。この場合、ほぼリアルタイムで受信して復号する要求があれば、端末が行った一度目の符号化済みデータを他の端末で受信して再生することもできるので、より柔軟なリアルタイム配信も可能になる。

他の例として、カメラｅｘ１１３等は、画像から特徴量抽出を行い、特徴量に関するデータをメタデータとして圧縮してサーバに送信する。サーバは、例えば特徴量からオブジェクトの重要性を判断して量子化精度を切り替えるなど、画像の意味に応じた圧縮を行う。特徴量データはサーバでの再度の圧縮時の動きベクトル予測の精度及び効率向上に特に有効である。また、端末でＶＬＣ（可変長符号化）などの簡易的な符号化を行い、サーバでＣＡＢＡＣ（コンテキスト適応型二値算術符号化方式）など処理負荷の大きな符号化を行ってもよい。

さらに他の例として、スタジアム、ショッピングモール、又は工場などにおいては、複数の端末によりほぼ同一のシーンが撮影された複数の映像データが存在する場合がある。この場合には、撮影を行った複数の端末と、必要に応じて撮影をしていない他の端末及びサーバを用いて、例えばＧＯＰ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅ）単位、ピクチャ単位、又はピクチャを分割したタイル単位などで符号化処理をそれぞれ割り当てて分散処理を行う。これにより、遅延を減らし、よりリアルタイム性を実現できる。

また、複数の映像データはほぼ同一シーンであるため、各端末で撮影された映像データを互いに参照し合えるように、サーバで管理及び／又は指示をしてもよい。または、各端末からの符号化済みデータを、サーバが受信し複数のデータ間で参照関係を変更、又はピクチャ自体を補正或いは差し替えて符号化しなおしてもよい。これにより、一つ一つのデータの質と効率を高めたストリームを生成できる。

また、サーバは、映像データの符号化方式を変更するトランスコードを行ったうえで映像データを配信してもよい。例えば、サーバは、ＭＰＥＧ系の符号化方式をＶＰ系に変換してもよいし、Ｈ．２６４をＨ．２６５に変換してもよい。

このように、符号化処理は、端末、又は１以上のサーバにより行うことが可能である。よって、以下では、処理を行う主体として「サーバ」又は「端末」等の記載を用いるが、サーバで行われる処理の一部又は全てが端末で行われてもよいし、端末で行われる処理の一部又は全てがサーバで行われてもよい。また、これらに関しては、復号処理についても同様である。

［３Ｄ、マルチアングル］
近年では、互いにほぼ同期した複数のカメラｅｘ１１３及び／又はスマートフォンｅｘ１１５などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。

サーバは、２次元の動画像を符号化するだけでなく、動画像のシーン解析などに基づいて自動的に、又は、ユーザが指定した時刻において、静止画を符号化し、受信端末に送信してもよい。サーバは、さらに、撮影端末間の相対的な位置関係を取得できる場合には、２次元の動画像だけでなく、同一シーンが異なるアングルから撮影された映像に基づき、当該シーンの３次元形状を生成できる。なお、サーバは、ポイントクラウドなどにより生成した３次元のデータを別途符号化してもよいし、３次元データを用いて人物又はオブジェクトを認識或いは追跡した結果に基づいて、受信端末に送信する映像を、複数の端末で撮影した映像から選択、又は、再構成して生成してもよい。

このようにして、ユーザは、各撮影端末に対応する各映像を任意に選択してシーンを楽しむこともできるし、複数画像又は映像を用いて再構成された３次元データから任意視点の映像を切り出したコンテンツを楽しむこともできる。さらに、映像と同様に音も複数の相異なるアングルから収音され、サーバは、映像に合わせて特定のアングル又は空間からの音を映像と多重化して送信してもよい。

また、近年ではＶｉｒｔｕａｌＲｅａｌｉｔｙ（ＶＲ）及びＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ（ＡＲ）など、現実世界と仮想世界とを対応付けたコンテンツも普及してきている。ＶＲの画像の場合、サーバは、右目用及び左目用の視点画像をそれぞれ作成し、Ｍｕｌｔｉ－ＶｉｅｗＣｏｄｉｎｇ（ＭＶＣ）などにより各視点映像間で参照を許容する符号化を行ってもよいし、互いに参照せずに別ストリームとして符号化してもよい。別ストリームの復号時には、ユーザの視点に応じて仮想的な３次元空間が再現されるように互いに同期させて再生するとよい。

ＡＲの画像の場合には、サーバは、現実空間のカメラ情報に、仮想空間上の仮想物体情報を、３次元的位置又はユーザの視点の動きに基づいて重畳する。復号装置は、仮想物体情報及び３次元データを取得又は保持し、ユーザの視点の動きに応じて２次元画像を生成し、スムーズにつなげることで重畳データを作成してもよい。または、復号装置は仮想物体情報の依頼に加えてユーザの視点の動きをサーバに送信し、サーバは、サーバに保持される３次元データから受信した視点の動きに合わせて重畳データを作成し、重畳データを符号化して復号装置に配信してもよい。なお、重畳データは、ＲＧＢ以外に透過度を示すα値を有し、サーバは、３次元データから作成されたオブジェクト以外の部分のα値が０などに設定し、当該部分が透過する状態で、符号化してもよい。もしくは、サーバは、クロマキーのように所定の値のＲＧＢ値を背景に設定し、オブジェクト以外の部分は背景色にしたデータを生成してもよい。

同様に配信されたデータの復号処理はクライアントである各端末で行っても、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、ある端末が、一旦サーバに受信リクエストを送り、そのリクエストに応じたコンテンツを他の端末で受信し復号処理を行い、ディスプレイを有する装置に復号済みの信号が送信されてもよい。通信可能な端末自体の性能によらず処理を分散して適切なコンテンツを選択することで画質のよいデータを再生することができる。また、他の例として大きなサイズの画像データをＴＶ等で受信しつつ、鑑賞者の個人端末にピクチャが分割されたタイルなど一部の領域が復号されて表示されてもよい。これにより、全体像を共有化しつつ、自身の担当分野又はより詳細に確認したい領域を手元で確認することができる。

また今後は、屋内外にかかわらず近距離、中距離、又は長距離の無線通信が複数使用可能な状況下で、ＭＰＥＧ－ＤＡＳＨなどの配信システム規格を利用して、接続中の通信に対して適切なデータを切り替えながらシームレスにコンテンツを受信することが予想される。これにより、ユーザは、自身の端末のみならず屋内外に設置されたディスプレイなどの復号装置又は表示装置を自由に選択しながらリアルタイムで切り替えられる。また、自身の位置情報などに基づいて、復号する端末及び表示する端末を切り替えながら復号を行うことができる。これにより、目的地への移動中に、表示可能なデバイスが埋め込まれた隣の建物の壁面又は地面の一部に地図情報を表示させながら移動することも可能になる。また、符号化データが受信端末から短時間でアクセスできるサーバにキャッシュされている、又は、コンテンツ・デリバリー・サービスにおけるエッジサーバにコピーされている、などの、ネットワーク上での符号化データへのアクセス容易性に基づいて、受信データのビットレートを切り替えることも可能である。

［スケーラブル符号化］
コンテンツの切り替えに関して、図２２に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的／空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンｅｘ１１５で視聴していた映像の続きを、帰宅後にインターネットＴＶ等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。

さらに、上記のように、レイヤ毎にピクチャが符号化されており、ベースレイヤの上位にエンハンスメントレイヤが存在するスケーラビリティを実現する構成以外に、エンハンスメントレイヤが画像の統計情報などに基づくメタ情報を含み、復号側が、メタ情報に基づきベースレイヤのピクチャを超解像することで高画質化したコンテンツを生成してもよい。超解像とは、同一解像度におけるＳＮ比の向上、及び、解像度の拡大のいずれであってもよい。メタ情報は、超解像処理に用いる線形或いは非線形のフィルタ係数を特定するため情報、又は、超解像処理に用いるフィルタ処理、機械学習或いは最小２乗演算におけるパラメータ値を特定する情報などを含む。

または、画像内のオブジェクトなどの意味合いに応じてピクチャがタイル等に分割されており、復号側が、復号するタイルを選択することで一部の領域だけを復号する構成であってもよい。また、オブジェクトの属性（人物、車、ボールなど）と映像内の位置（同一画像における座標位置など）とをメタ情報として格納することで、復号側は、メタ情報に基づいて所望のオブジェクトの位置を特定し、そのオブジェクトを含むタイルを決定できる。例えば、図２３に示すように、メタ情報は、ＨＥＶＣにおけるＳＥＩメッセージなど画素データとは異なるデータ格納構造を用いて格納される。このメタ情報は、例えば、メインオブジェクトの位置、サイズ、又は色彩などを示す。

また、ストリーム、シーケンス又はランダムアクセス単位など、複数のピクチャから構成される単位でメタ情報が格納されてもよい。これにより、復号側は、特定人物が映像内に出現する時刻などが取得でき、ピクチャ単位の情報と合わせることで、オブジェクトが存在するピクチャ、及び、ピクチャ内でのオブジェクトの位置を特定できる。

［Ｗｅｂページの最適化］
図２４は、コンピュータｅｘ１１１等におけるｗｅｂページの表示画面例を示す図である。図２５は、スマートフォンｅｘ１１５等におけるｗｅｂページの表示画面例を示す図である。図２４及び図２５に示すようにｗｅｂページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置（復号装置）は、リンク画像として各コンテンツが有する静止画又はＩピクチャを表示したり、複数の静止画又はＩピクチャ等でｇｉｆアニメのような映像を表示したり、ベースレイヤのみ受信して映像を復号及び表示したりする。

ユーザによりリンク画像が選択された場合、表示装置は、ベースレイヤを最優先にして復号する。なお、ｗｅｂページを構成するＨＴＭＬにスケーラブルなコンテンツであることを示す情報があれば、表示装置は、エンハンスメントレイヤまで復号してもよい。また、リアルタイム性を担保するために、選択される前又は通信帯域が非常に厳しい場合には、表示装置は、前方参照のピクチャ（Ｉピクチャ、Ｐピクチャ、前方参照のみのＢピクチャ）のみを復号及び表示することで、先頭ピクチャの復号時刻と表示時刻との間の遅延（コンテンツの復号開始から表示開始までの遅延）を低減できる。また、表示装置は、ピクチャの参照関係を敢えて無視して全てのＢピクチャ及びＰピクチャを前方参照にして粗く復号し、時間が経ち受信したピクチャが増えるにつれて正常の復号を行ってもよい。

［自動走行］
また、車の自動走行又は走行支援のため２次元又は３次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、１以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。

この場合、受信端末を含む車、ドローン又は飛行機などが移動するため、受信端末は、当該受信端末の位置情報を受信要求時に送信することで、基地局ｅｘ１０６～ｅｘ１１０を切り替えながらシームレスな受信及び復号を実現できる。また、受信端末は、ユーザの選択、ユーザの状況又は通信帯域の状態に応じて、メタ情報をどの程度受信するか、又は地図情報をどの程度更新していくかを動的に切り替えることが可能になる。

以上のようにして、コンテンツ供給システムｅｘ１００では、ユーザが送信した符号化された情報をリアルタイムでクライアントが受信して復号し、再生することができる。

［個人コンテンツの配信］
また、コンテンツ供給システムｅｘ１００では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。

撮影時にリアルタイム又は蓄積して撮影後に、サーバは、原画又は符号化済みデータから撮影エラー、シーン探索、意味の解析、及びオブジェクト検出などの認識処理を行う。そして、サーバは、認識結果に基いて手動又は自動で、ピントずれ又は手ブレなどを補正したり、明度が他のピクチャに比べて低い又は焦点が合っていないシーンなどの重要性の低いシーンを削除したり、オブジェクトのエッジを強調したり、色合いを変化させるなどの編集を行う。サーバは、編集結果に基いて編集後のデータを符号化する。また撮影時刻が長すぎると視聴率が下がることも知られており、サーバは、撮影時間に応じて特定の時間範囲内のコンテンツになるように上記のように重要性が低いシーンのみならず動きが少ないシーンなどを、画像処理結果に基き自動でクリップしてもよい。または、サーバは、シーンの意味解析の結果に基づいてダイジェストを生成して符号化してもよい。

なお、個人コンテンツには、そのままでは著作権、著作者人格権、又は肖像権等の侵害となるものが写り込んでいるケースもあり、共有する範囲が意図した範囲を超えてしまうなど個人にとって不都合な場合もある。よって、例えば、サーバは、画面の周辺部の人の顔、又は家の中などを敢えて焦点が合わない画像に変更して符号化してもよい。また、サーバは、符号化対象画像内に、予め登録した人物とは異なる人物の顔が映っているかどうかを認識し、映っている場合には、顔の部分にモザイクをかけるなどの処理を行ってもよい。または、符号化の前処理又は後処理として、著作権などの観点からユーザが画像を加工したい人物又は背景領域を指定し、サーバは、指定された領域を別の映像に置き換える、又は焦点をぼかすなどの処理を行うことも可能である。人物であれば、動画像において人物をトラッキングしながら、顔の部分の映像を置き換えることができる。

また、データ量の小さい個人コンテンツの視聴はリアルタイム性の要求が強いため、帯域幅にもよるが、復号装置は、まずベースレイヤを最優先で受信して復号及び再生を行う。復号装置は、この間にエンハンスメントレイヤを受信し、再生がループされる場合など２回以上再生される場合に、エンハンスメントレイヤも含めて高画質の映像を再生してもよい。このようにスケーラブルな符号化が行われているストリームであれば、未選択時又は見始めた段階では粗い動画だが、徐々にストリームがスマートになり画像がよくなるような体験を提供することができる。スケーラブル符号化以外にも、１回目に再生される粗いストリームと、１回目の動画を参照して符号化される２回目のストリームとが１つのストリームとして構成されていても同様の体験を提供できる。

［その他の使用例］
また、これらの符号化又は復号処理は、一般的に各端末が有するＬＳＩｅｘ５００において処理される。ＬＳＩｅｘ５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータｅｘ１１１等で読み取り可能な何らかの記録メディア（ＣＤ－ＲＯＭ、フレキシブルディスク、又はハードディスクなど）に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンｅｘ１１５がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンｅｘ１１５が有するＬＳＩｅｘ５００で符号化処理されたデータである。

なお、ＬＳＩｅｘ５００は、アプリケーションソフトをダウンロードしてアクティベートする構成であってもよい。この場合、端末は、まず、当該端末がコンテンツの符号化方式に対応しているか、又は、特定サービスの実行能力を有するかを判定する。端末がコンテンツの符号化方式に対応していない場合、又は、特定サービスの実行能力を有さない場合、端末は、コーデック又はアプリケーションソフトをダウンロードし、その後、コンテンツ取得及び再生する。

また、インターネットｅｘ１０１を介したコンテンツ供給システムｅｘ１００に限らず、デジタル放送用システムにも上記各実施の形態の少なくとも動画像符号化装置（画像符号化装置）又は動画像復号化装置（画像復号装置）のいずれかを組み込むことができる。衛星などを利用して放送用の電波に映像と音が多重化された多重化データを載せて送受信するため、コンテンツ供給システムｅｘ１００のユニキャストがし易い構成に対してマルチキャスト向きであるという違いがあるが符号化処理及び復号処理に関しては同様の応用が可能である。

［ハードウェア構成］
図２６は、スマートフォンｅｘ１１５を示す図である。また、図２７は、スマートフォンｅｘ１１５の構成例を示す図である。スマートフォンｅｘ１１５は、基地局ｅｘ１１０との間で電波を送受信するためのアンテナｅｘ４５０と、映像及び静止画を撮ることが可能なカメラ部ｅｘ４６５と、カメラ部ｅｘ４６５で撮像した映像、及びアンテナｅｘ４５０で受信した映像等が復号されたデータを表示する表示部ｅｘ４５８とを備える。スマートフォンｅｘ１１５は、さらに、タッチパネル等である操作部ｅｘ４６６と、音声又は音響を出力するためのスピーカ等である音声出力部ｅｘ４５７と、音声を入力するためのマイク等である音声入力部ｅｘ４５６と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ｅｘ４６７と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのＳＩＭｅｘ４６８とのインタフェース部であるスロット部ｅｘ４６４とを備える。なお、メモリ部ｅｘ４６７の代わりに外付けメモリが用いられてもよい。

また、表示部ｅｘ４５８及び操作部ｅｘ４６６等を統括的に制御する主制御部ｅｘ４６０と、電源回路部ｅｘ４６１、操作入力制御部ｅｘ４６２、映像信号処理部ｅｘ４５５、カメラインタフェース部ｅｘ４６３、ディスプレイ制御部ｅｘ４５９、変調／復調部ｅｘ４５２、多重／分離部ｅｘ４５３、音声信号処理部ｅｘ４５４、スロット部ｅｘ４６４、及びメモリ部ｅｘ４６７とがバスｅｘ４７０を介して接続されている。

電源回路部ｅｘ４６１は、ユーザの操作により電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりスマートフォンｅｘ１１５を動作可能な状態に起動する。

スマートフォンｅｘ１１５は、ＣＰＵ、ＲＯＭ及びＲＡＭ等を有する主制御部ｅｘ４６０の制御に基づいて、通話及データ通信等の処理を行う。通話時は、音声入力部ｅｘ４５６で収音した音声信号を音声信号処理部ｅｘ４５４でデジタル音声信号に変換し、これを変調／復調部ｅｘ４５２でスペクトラム拡散処理し、送信／受信部ｅｘ４５１でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナｅｘ４５０を介して送信する。また受信データを増幅して周波数変換処理及びアナログデジタル変換処理を施し、変調／復調部ｅｘ４５２でスペクトラム逆拡散処理し、音声信号処理部ｅｘ４５４でアナログ音声信号に変換した後、これを音声出力部ｅｘ４５７から出力する。データ通信モード時は、本体部の操作部ｅｘ４６６等の操作によってテキスト、静止画、又は映像データが操作入力制御部ｅｘ４６２を介して主制御部ｅｘ４６０に送出され、同様に送受信処理が行われる。データ通信モード時に映像、静止画、又は映像と音声を送信する場合、映像信号処理部ｅｘ４５５は、メモリ部ｅｘ４６７に保存されている映像信号又はカメラ部ｅｘ４６５から入力された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し、符号化された映像データを多重／分離部ｅｘ４５３に送出する。また、音声信号処理部ｅｘ４５４は、映像又は静止画等をカメラ部ｅｘ４６５で撮像中に音声入力部ｅｘ４５６で収音した音声信号を符号化し、符号化された音声データを多重／分離部ｅｘ４５３に送出する。多重／分離部ｅｘ４５３は、符号化済み映像データと符号化済み音声データを所定の方式で多重化し、変調／復調部（変調／復調回路部）ｅｘ４５２、及び送信／受信部ｅｘ４５１で変調処理及び変換処理を施してアンテナｅｘ４５０を介して送信する。

電子メール又はチャットに添付された映像、又はウェブページ等にリンクされた映像を受信した場合、アンテナｅｘ４５０を介して受信された多重化データを復号するために、多重／分離部ｅｘ４５３は、多重化データを分離することにより、多重化データを映像データのビットストリームと音声データのビットストリームとに分け、同期バスｅｘ４７０を介して符号化された映像データを映像信号処理部ｅｘ４５５に供給するとともに、符号化された音声データを音声信号処理部ｅｘ４５４に供給する。映像信号処理部ｅｘ４５５は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって映像信号を復号し、ディスプレイ制御部ｅｘ４５９を介して表示部ｅｘ４５８から、リンクされた動画像ファイルに含まれる映像又は静止画が表示される。また音声信号処理部ｅｘ４５４は、音声信号を復号し、音声出力部ｅｘ４５７から音声が出力される。なおリアルタイムストリーミングが普及しているため、ユーザの状況によっては音声の再生が社会的にふさわしくない場も起こりえる。そのため、初期値としては、音声信号は再生せず映像データのみを再生する構成の方が望ましい。ユーザが映像データをクリックするなど操作を行った場合にのみ音声を同期して再生してもよい。

またここではスマートフォンｅｘ１１５を例に説明したが、端末としては符号化器及び復号化器を両方持つ送受信型端末の他に、符号化器のみを有する送信端末、及び、復号化器のみを有する受信端末という３通りの実装形式が考えられる。さらに、デジタル放送用システムにおいて、映像データに音声データなどが多重化された多重化データを受信又は送信するとして説明したが、多重化データには、音声データ以外に映像に関連する文字データなどが多重化されてもよいし、多重化データではなく映像データ自体が受信又は送信されてもよい。

なお、ＣＰＵを含む主制御部ｅｘ４６０が符号化又は復号処理を制御するとして説明したが、端末はＧＰＵを備えることも多い。よって、ＣＰＵとＧＰＵで共通化されたメモリ、又は共通に使用できるようにアドレスが管理されているメモリにより、ＧＰＵの性能を活かして広い領域を一括して処理する構成でもよい。これにより符号化時間を短縮でき、リアルタイム性を確保し、低遅延を実現できる。特に動き探索、デブロックフィルタ、ＳＡＯ（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ）、及び変換・量子化の処理を、ＣＰＵではなく、ＧＰＵでピクチャなどの単位で一括して行うと効率的である。

本開示は、例えば、テレビ、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、またはデジタルビデオカメラ等の装置であって、画像を符号化する符号化装置、または符号化された画像を復号する復号装置などに適用することができる。

１００符号化装置
１０２分割部
１０４減算部
１０６変換部
１０８量子化部
１１０エントロピー符号化部
１１２逆量子化部
１１４逆変換部
１１６加算部
１１８ブロックメモリ
１２０ループフィルタ部
１２２フレームメモリ
１２４イントラ予測部
１２６インター予測部
１２８予測制御部
２００復号装置
２０２エントロピー復号部
２０４逆量子化部
２０６逆変換部
２０８加算部
２１０ブロックメモリ
２１２ループフィルタ部
２１４フレームメモリ
２１６イントラ予測部
２１８インター予測部
２２０予測制御部

Claims

処理回路と、前記処理回路に接続されたメモリとを備え、
前記処理回路は、前記メモリを用いて、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも１つのパラメータを定義付け、
画像を複数のブロックに分割し、
前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、
前記複数のブロックのそれぞれを符号化し、
前記少なくとも１つのパラメータの定義付けでは、
前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して、前記少なくとも１つのパラメータを定義付け、
前記複数のブロックの符号化では、
前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、
前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記符号化対象ブロックを符号化し、
前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む
符号化装置。
前記処理回路は、さらに、
前記画像における分割のパターンを示すブロック分割情報を符号化する
請求項１に記載の符号化装置。
前記処理回路は、さらに、
前記複数種のセグメント識別情報のそれぞれに対して定義付けられた前記少なくとも１つのパラメータを、ピクチャパラメータセットに含め、
前記画像の分割では、前記画像であるピクチャを分割する、
請求項１または２に記載の符号化装置。
処理回路と、前記処理回路に接続されたメモリとを備え、
前記処理回路は、前記メモリを用いて、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも１つのパラメータを復号し、
画像に含まれている複数のブロックを特定し、
前記複数のブロックのそれぞれに対して割り当てられているセグメント識別情報を復号し、
前記複数のブロックのそれぞれを復号し、
前記少なくとも１つのパラメータの復号では、
前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して定義付けられている、前記少なくとも１つのパラメータを特定し、
前記複数のブロックの復号では、
前記複数のブロックのうちの復号対象ブロックに割り当てられているセグメント識別情報を特定し、
前記復号対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記復号対象ブロックを復号し、
前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含む
復号装置。
前記処理回路は、前記複数のブロックの特定では、
前記画像における分割のパターンを示すブロック分割情報を復号し、
前記ブロック分割情報に基づいて、前記画像に含まれている複数のブロックを特定する
請求項４に記載の復号装置。
前記処理回路は、
前記少なくとも１つのパラメータの復号では、
前記複数種のセグメント識別情報のそれぞれに対して定義付けられている前記少なくとも１つのパラメータを、ピクチャパラメータセットから抽出して復号し、
前記複数のブロックの特定では、
前記画像であるピクチャに含まれている前記複数のブロックを特定する
請求項４または５に記載の復号装置。
画像を符号化する符号化方法であって、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して、少なくとも１つのパラメータを定義付け、
画像を複数のブロックに分割し、
前記複数のブロックのそれぞれに対して、前記複数種のセグメント識別情報のうちの、当該ブロックのタイプに応じたセグメント識別情報を割り当て、
前記複数のブロックのそれぞれを符号化し、
前記少なくとも１つのパラメータの定義付けでは、
前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して、前記少なくとも１つのパラメータを定義付け、
前記複数のブロックの符号化では、
前記複数のブロックのうちの符号化対象ブロックに割り当てられているセグメント識別情報を特定し、
前記符号化対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記符号化対象ブロックを符号化し、
前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含
む
符号化方法。
符号化された画像を復号する復号方法であって、
ブロックのタイプを識別するための複数種のセグメント識別情報のそれぞれに対して定義付けられている少なくとも１つのパラメータを復号し、
画像に含まれている複数のブロックを特定し、
前記複数のブロックのそれぞれに対して割り当てられているセグメント識別情報を復号し、
前記複数のブロックのそれぞれを復号し、
前記少なくとも１つのパラメータの復号では、
前記複数種のセグメント識別情報のうちの何れか１つと、ブロックのサイズを識別するための複数種のサイズ識別情報のうちの何れか１つとの組み合わせに対して定義付けられている、前記少なくとも１つのパラメータを特定し、
前記複数のブロックの復号では、
前記複数のブロックのうちの復号対象ブロックに割り当てられているセグメント識別情報を特定し、
前記復号対象ブロックのサイズに応じたサイズ識別情報と、特定された前記セグメント識別情報との組み合わせに対して定義付けられている前記少なくとも１つのパラメータを用いて前記復号対象ブロックを復号し、
前記少なくとも１つのパラメータは、ＣＡＢＡＣ（Context-Based Adaptive Binary Arithmetic Coding）のコンテキストに対応する確率情報を特定するためのパラメータを含
む
復号方法。