WO2014084109A1

WO2014084109A1 - 画像処理装置および方法

Info

Publication number: WO2014084109A1
Application number: PCT/JP2013/081345
Authority: WO
Inventors: 佐藤　数史
Original assignee: ソニー株式会社
Priority date: 2012-11-30
Filing date: 2013-11-21
Publication date: 2014-06-05
Also published as: MX2015006474A; EP2942966A4; KR20150092119A; BR112015011913A2; US10841618B2; MX357870B; US20160286239A1; WO2014084108A1; BR112015011914A2; US10834426B2; MX353544B; CN104813670A; KR20150092120A; RU2015119570A; RU2651201C2; US20160286238A1; EP2928195A1; RU2015119571A; MX2015006473A; JPWO2014084108A1

Abstract

本開示は、符号化効率の増大の低減を抑制することができるようにする画像処理装置および方法に関する。静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限する制限部と、前記制限部により値が制限された前記シンタクス要素を伝送する伝送部とを備える。また、前記制限部により制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成する符号化部をさらに備え、前記伝送部は、前記符号化部で生成された前記ビットストリームをさらに伝送するようにしてもよい。本開示は、例えば、画像処理装置に適用することができる。

Description

画像処理装置および方法

本開示は画像処理装置および方法に関し、特に、符号化効率の低減を抑制することができるようにした画像処理装置および方法に関する。

近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送や蓄積を目的とし、画像情報特有の冗長性を利用して離散コサイン変換等の直交変換と動き補償とにより圧縮する符号化方式を採用して画像を圧縮符号化する装置が普及しつつある。この符号化方式には、例えば、MPEG（Moving Picture Experts Group）などがある。

特に、MPEG2（ISO（International Organization for Standardization）/IEC（International Electrotechnical Commission） 13818-2）は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準規格である。現在、MPEG2は、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに広く用いられている。例えば、720x480画素を持つ標準解像度の飛び越し走査画像であれば、MPEG2圧縮方式を用いることにより、4Mbps乃至8Mbpsの符号量（ビットレート）が割り当てられる。また、例えば、1920x1088画素を持つ高解像度の飛び越し走査画像であれば、MPEG2圧縮方式を用いることにより、18Mbps乃至22 Mbpsの符号量（ビットレート）が割り当てられる。これにより、高い圧縮率と良好な画質を実現することができる。

MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量（ビットレート）、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及等により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496-2としてその規格が国際標準に承認された。

更に、近年、当初テレビ会議用の画像符号化を目的として、H.26L （ITU-T（International Telecommunication Union Telecommunication Standardization Sector） Q6/16 VCEG（Video Coding Expert Group））という標準の規格化が進められた。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26Lではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced-Compression Video Codingとして行われた。

標準化のスケジュールとしては、２００３年３月にはH.264及びMPEG-4 Part10 （AVC（Advanced Video Coding）とも称する）という名の元に国際標準となった。

さらに、このH．264/AVCの拡張として、RGBや4:2:2、4:4:4といった、業務用に必要な符号化ツールや、MPEG-2で規定されていた8x8DCTや量子化マトリクスをも含んだFRExt (Fidelity Range Extension) の標準化が２００５年２月に完了した。これにより、H．264/AVCを用いて、映画に含まれるフィルムノイズをも良好に表現することが可能な符号化方式となって、Blu-Ray Disc（商標）等の幅広いアプリケーションに用いられる運びとなった。

しかしながら、昨今、ハイビジョン画像の4倍の、4000x2000画素程度の画像（４Ｋ画像とも称する）を圧縮したい、あるいは、インターネットのような、限られた伝送容量の環境において、ハイビジョン画像を配信したいといった、更なる高圧縮率符号化に対するニーズが高まっている。このため、先述の、ITU-T傘下のVCEGにおいて、符号化効率の改善に関する検討が継続され行なわれている。

そこで、現在、AVCより更なる符号化効率の向上を目的として、ITU-Tと、ISO/IECの共同の標準化団体であるJCTVC（Joint Collaboration Team - Video Coding）により、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められている。HEVC規格については、2012年2月に最初のドラフト版仕様であるCommittee draftが発行されている（例えば、非特許文献１参照）。

HEVCの場合、一般的に、符号化側から復号側に伝送される情報には、Ｉスライスのためのシンタクス（syntax）だけでなく、ＰスライスやＢスライスのためのシンタクス（syntax）要素、すなわち、画面間の処理に関するシンタクス要素が含まれている。

ところで、このHEVCを、静止画像用のコーデックとして用いるためのプロファイル（profile）であるスティルピクチャプロファイル（Still Picture Profile）が提案されている（例えば、非特許文献２参照）。

このスティルピクチャプロファイル（Still Picture Profile）は、静止画像を符号化・復号するためのプロファイルであるので、このプロファイルを適用する場合、上述したような画面間の処理に関するシンタクス要素は不要である。

Benjamin Bross, Woo-Jin Han, Jens-Rainer Ohm, Gary J. Sullivan, Thomas Wiegand, "High efficiency video coding (HEVC) text specification draft 8", JCTVC-H1003_d7, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 10th Meeting: Stockholm, SE, 11-20 July 2012 Kemal Ugur, Jani Lainema, Miska Hannuksela, " On still picture profile ", JCTVC-J0037, Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 10th Meeting: Stockholm, SE, 11-20 July 2012

しかしながら、非特許文献２に記載の方法の場合、画面間の処理に関するシンタクス要素に対する制御は行われない。つまり、動画像用のプロファイルの場合と同様に、画面間の処理に関するシンタクス要素も符号化側から復号側に伝送される。そのため、不要な情報を伝送することになり、符号化効率を低減させる恐れがあった。

本開示は、このような状況に鑑みてなされたものであり、符号化効率の低減を抑制することができるようにするものである。

本技術の一側面の画像処理装置は、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限する制限部と、前記制限部により値が制限された前記シンタクス要素を伝送する伝送部とを備える画像処理装置である。

前記制限部により制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成する符号化部をさらに備え、前記伝送部は、前記符号化部で生成された前記ビットストリームをさらに伝送することができる。

前記シンタクス要素は、前記ビットストリームのシーケンスパラメータセットに格納されるようにすることができる。

前記シンタクス要素は、参照ピクチャに関するシンタクスであるようにすることができる。

前記シンタクス要素は、参照ピクチャの枚数に関するシンタクスであるようにすることができる。

前記制限部は、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とすることができる。

前記所定値とは０であるようにすることができる。

本技術の一側面の画像処理方法は、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限し、値が制限された前記シンタクス要素を伝送する画像処理方法である。

さらに、制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成し、伝送することができる。

静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とすることができる。

前記所定値とは０であるようにすることができる。

本技術の一側面においては、静止画像を符号化するためのプロファイルにより符号化処理が行われる場合、画像間の処理に関するシンタクス要素の値が制限され、値が制限された前記シンタクス要素が伝送される。

本開示によれば、画像を符号化・復号することができる。特に、符号化効率の低減を抑制することができる。

コーディングユニットの構成例を説明する図である。タイル（Tile）の例を説明する図である。プロファイルティアレベル（Profile_tier_level）の例を示す図である。ビデオパラメータセット（VPS（Video Parameter Set））の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の例を示す、図５に続く図である。プロファイルティアレベル（Profile_tier_level）の他の例を示す図である。ビデオパラメータセット（VPS（Video Parameter Set））の他の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の他の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の他の例を示す、図９に続く図である。ビデオパラメータセット（VPS（Video Parameter Set））の、さらに他の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の、さらに他の例を示す図である。シーケンスパラメータセット（SPS（Sequence Parameter Set））の、さらに他の例を示す、図１２に続く図である。ピクチャパラメータセット（PPS（Picture Parameter Set））の例を示す図である。ピクチャパラメータセット（PPS（Picture Parameter Set））の例を示す、図１４に続く図である。スケーリングリストデータ（scaling_list_data()）の例を示す図である。サイズID（SizeID）のセマンティクスの例を示す図である。サイズID（SizeID）およびマトリクスID（MatrixID）のセマンティクスの例を示す図である。スケーリングリストデータ（scaling_list_data()）の他の例を示す図である。スライスヘッダ（slice_header()）の例を示す図である。スライスヘッダ（slice_header()）の例を示す、図２０に続く図である。スライスヘッダ（slice_header()）の例を示す、図２１に続く図である。 nal_unit_typeの割り当て例を示す図である。 ROI（Region of Interest）領域の例を説明する図である。画像符号化装置の主な構成例を示すブロック図である。可逆符号化部の主な構成例を示すブロック図である。符号化処理の流れの例を説明するフローチャートである。符号化処理の流れの例を説明する、図２７に続くフローチャートである。可逆符号化処理の流れの例を説明するフローチャートである。シンタクス要素設定処理の流れの例を説明するフローチャートである。画像符号化装置の他の構成例を示すブロック図である。符号化処理の流れの、他の例を説明するフローチャートである。符号化処理の流れの、他の例を説明する、図３２に続くフローチャートである。画像復号装置の主な構成例を示すブロック図である。可逆復号部の主な構成例を示すブロック図である。復号処理の流れの例を説明するフローチャートである。復号処理の流れの例を説明する、図３６に続くフローチャートである。シンタクス要素解析処理の流れの例を説明するフローチャートである。画像復号装置の他の構成例を示すブロック図である。可逆復号部の他の構成例を示すブロック図である。復号処理の流れの、他の例を説明するフローチャートである。復号処理の流れの、他の例を説明する、図４１に続くフローチャートである。シンタクス要素検査処理の流れの例を説明するフローチャートである。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。スペーシャルなスケーラブル符号化の例を説明する図である。テンポラルなスケーラブル符号化の例を説明する図である。信号雑音比のスケーラブル符号化の例を説明する図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化利用の一例を示すブロック図である。スケーラブル符号化利用の他の例を示すブロック図である。スケーラブル符号化利用のさらに他の例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。コンテンツ再生システムの構成を示した説明図である。コンテンツ再生システムにおけるデータの流れを示した説明図である。 MPDの具体例を示した説明図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツ再生装置の構成を示した機能ブロック図である。コンテンツ再生システムのコンテンツサーバの構成を示した機能ブロック図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。無線通信システムの各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。無線通信システムの各装置による通信処理例を示すシーケンスチャートである。

  以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
  ０．概要
  １．第１の実施の形態（画像符号化装置）
  ２．第２の実施の形態（画像符号化装置）
  ３．第３の実施の形態（画像復号装置）
  ４．第４の実施の形態（画像復号装置）
  ５．第５の実施の形態（多視点画像符号化・多視点画像復号装置）
  ６．第６の実施の形態（階層画像符号化・階層画像復号装置）
  ７．第７の実施の形態（コンピュータ）
  ８．応用例
  ９．スケーラブル符号化の応用例
　１０．第８の実施の形態（セット・ユニット・モジュール・プロセッサ）
　１１．第９の実施の形態（MPEG-DASHのコンテンツ再生システムの応用例）
　１２．第１０の実施の形態（Wi-Fi規格の無線通信システムの応用例）

  ＜０．概要＞
    ＜符号化方式＞
  以下においては、HEVC（High Efficiency Video Coding）方式の画像符号化・復号に適用する場合を例に、本技術を説明する。

＜コーディングユニット＞
AVC（Advanced Video Coding）においては、マクロブロックとサブマクロブロックによる階層構造が規定されている。しかしながら、16x16画素のマクロブロックでは、次世代符号化方式の対象となるような、UHD（Ultra High Definition；4000x2000画素）といった大きな画枠に対して最適ではない。

これに対して、HEVCにおいては、図１に示されるように、コーディングユニット（CU（Coding Unit））が規定されている。

CUは、Coding Tree Block（CTB）とも呼ばれ、AVCにおけるマクロブロックと同様の役割を果たす、ピクチャ単位の画像の部分領域である。AVCのマクロブロックは、16x16画素の大きさに固定されているのに対し、HEVCのCUの大きさは固定されておらず、それぞれのシーケンスにおいて、画像圧縮情報中において指定されることになる。

例えば、出力となる符号化データに含まれるシーケンスパラメータセット（SPS（Sequence Parameter Set））において、CUの最大サイズ（LCU（Largest Coding Unit））と最小サイズ（SCU（Smallest Coding Unit））が規定される。

それぞれのLCU内においては、SCUのサイズを下回らない範囲で、split_flag=1とすることにより、より小さなサイズのCUに分割することができる。図１の例では、LCUの大きさが128x128であり、最大階層深度が５となる。2Nx2Nの大きさのCUは、split_flagの値が「１」である時、１つ下の階層となる、NxNの大きさのCUに分割される。

更に、CUは、イントラ若しくはインター予測の処理単位となる領域（ピクチャ単位の画像の部分領域）であるプレディクションユニット（Prediction Unit（PU））に分割され、また、直交変換の処理単位となる領域（ピクチャ単位の画像の部分領域）である、トランスフォームユニット（Transform Unit（TU））に分割される。HEVCにおいては、4x4、8x8、16x16、および32x32のいずれかのサイズを直交変換の処理単位とすることができる。

以上のHEVCのように、CUを定義し、そのCUを単位として各種処理を行うような符号化方式の場合、AVCにおけるマクロブロックはLCUに相当し、ブロック（サブブロック）はCUに相当すると考えることができる。また、AVCにおける動き補償ブロックは、PUに相当すると考えることができる。ただし、CUは、階層構造を有するので、その最上位階層のLCUのサイズは、例えば128x128画素のように、AVCのマクロブロックより大きく設定されることが一般的である。

よって、以下、LCUは、AVCにおけるマクロブロックをも含むものとし、CUは、AVCにおけるブロック（サブブロック）をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域（処理単位）が含まれる。もちろん、これら以外の部分領域（処理単位）も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。

＜モード選択＞
ところで、AVCやHEVCのような符号化方式において、より高い符号化効率を達成するには、適切な予測モードの選択が重要である。

かかる選択方式の例として、JM (Joint Model) と呼ばれるH.264/MPEG-4 AVCの参照ソフトウエア (http://iphome.hhi.de/suehring/tml/index.htm において公開されている) に実装されている方法を挙げることが出来る。

JMにおいては、以下に述べる、ハイコンプレクシティモード（High Complexity Mode）と、ローコンプレクシティモード（Low Complexity Mode）の2通りのモード判定方法を選択することが可能である。どちらも、それぞれの予測モードに関するコスト関数値を算出し、これを最小にする予測モードを処理対象であるカレントブロックに対する最適モードとして選択する。

ハイコンプレクシティモードにおけるコスト関数は、以下の式（１）のように示される。

ここで、Ωは、カレントブロックを符号化するための候補モードの全体集合、Dは、当該予測モードで符号化した場合の、復号画像と入力画像の差分エネルギーである。λは、量子化パラメータの関数として与えられるLagrange未定乗数である。Ｒは、直交変換係数を含んだ、当該予測モードで符号化した場合の総符号量である。

つまり、ハイコンプレクシティモードでの符号化を行うには、上記パラメータＤ及びＲを算出するため、全ての候補モードにより、一度、仮エンコード処理を行う必要があり、より高い演算量を要する。

ローコンプレクシティモードにおけるコスト関数は、以下の式（２）のように示される。

ここで、Dは、ハイコンプレクシティモードの場合と異なり、予測画像と入力画像の差分エネルギーとなる。QP2Quant(QP)は、量子化パラメータQPの関数として与えられ、HeaderBitは、直交変換係数を含まない、動きベクトルや、モードといった、ヘッダ（Header）に属する情報に関する符号量である。

すなわち、ローコンプレクシティモードにおいては、それぞれの候補モードに関して、予測処理を行う必要があるが、復号画像までは必要ないため、符号化処理まで行う必要はない。このため、ハイコンプレクシティモードより低い演算量での実現が可能である。

＜タイル＞
ところで、HEVCにおいては、並列処理の単位として、AVCにおいても規定されていたスライス（Slice）に加え、図２に示されるようなタイル（Tile）が規定されている。

それぞれのタイルは、幅と高さが、画像圧縮情報において指定され、独立して復号処理を行うことができる。

＜スティルピクチャプロファイル＞
また、非特許文献２において、このHEVCを、静止画像用のコーデックとして用いるためのプロファイル（profile）であるスティルピクチャプロファイル（Still Picture Profile）が提案された。

ところが、HEVCの場合、一般的に、符号化側から復号側に伝送される情報には、Ｉスライスのためのシンタクス（syntax）だけでなく、ＰスライスやＢスライスのためのシンタクス（syntax）要素、すなわち、画面間の処理に関するシンタクス要素が含まれている。

スティルピクチャプロファイル（Still Picture Profile）は、静止画像を符号化・復号するためのプロファイルであるので、このプロファイルを適用する場合、上述したような画面間の処理に関するシンタクス要素は不要である。しかしながら、非特許文献２に記載の方法の場合、画面間の処理に関するシンタクス要素に対する制御は行われない。つまり、動画像用のプロファイルの場合と同様に、画面間の処理に関するシンタクス要素も符号化側から復号側に伝送される。そのため、不要な情報を伝送することにより、符号化効率を低減させる恐れがあった。

そこで、本技術においては、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限して、不要な情報の伝送を抑制するようにする。このようにすることにより、符号化効率の低減を抑制することができる。

以下に、その制限について、具体的な例を説明する。

＜０－１：サブレイヤに関するシンタクス要素の制限＞
図３は、HEVCにおけるプロファイルティアレベル（profile_tier_level()）のシンタクスの例を示す図である。左端の数字は、説明の為に行番号を付したものであり、実際のシンタクスには含まれない。以下に説明する図４乃至図２３の各図の左端の数字も同様であり、各図の説明の為に付した行番号であって実際に含まれるものではない。

図３に示されるプロファイルティアレベル（profile_tier_level()）の、第５行目に示されるシンタクス要素general_profile_idcにより、処理対象のシーケンス（カレントシーケンス）のプロファイルがスティルピクチャプロファイル（Still Picture Profile）であることが規定される。

図３のプロファイルティアレベル（profile_tier_level()）は、ビデオパラメータセット（VPS（Video Parameter Set））やシーケンスパラメータセット（SPS（Sequence Parameter Set））により呼ばれる。

図４は、HEVCにおけるビデオパラメータセット（VPS（Video Parameter Set））の例を示す図である。また、図５および図６は、HEVCにおけるシーケンスパラメータセット（SPS（Sequence Parameter Set））の例を示す図である。

図４に示されるように、ビデオパラメータセット（VPS）においては、第７行目においてプロファイルティアレベル（profile_tier_level()）が呼ばれる。また、図５に示されるように、シーケンスパラメータセット（SPS）においては、第５行目において、プロファイルティアレベル（profile_tier_level()）が呼ばれる。

ここで、スティルピクチャプロファイル（Still Picture Profile）により符号化される場合、テンポラルレイヤデプス（temporal layer depth）（サブレイヤとも称する）は存在しない。つまり、サブレイヤに関するシンタクス要素は、不要である。

そこで、図３のプロファイルティアレベル（profile_tier_level()）において、シンタクス要素general_profile_idcによりスティルピクチャプロファイル（Still Picture Profile）であることを規定する前に、図４のビデオパラメータセット（VPS）において、サブレイヤに関するパラメータvps_max_sub_layers_minus1（６行目）の値が０に指定され、さらに、シーケンスパラメータセット（SPS）（図５および図６）において、サブレイヤに関するパラメータsps_max_sub_layers_minus1（３行目）の値が０に指定されるようにしてもよい。

換言するに、図３のプロファイルティアレベル（profile_tier_level()）において、シンタクス要素general_profile_idcによりスティルピクチャプロファイル（Still Picture Profile）であることを規定する場合、図４のビデオパラメータセット（VPS）において、サブレイヤに関するパラメータvps_max_sub_layers_minus1（６行目）の値が０に指定されていなければならず、さらに、シーケンスパラメータセット（SPS）（図５および図６）において、サブレイヤに関するパラメータsps_max_sub_layers_minus1（３行目）の値が０に指定されていなければならないようにしてもよい。

このようにすることにより、プロファイルティアレベル（profile_tier_level()）の不要な部分を読み出してしまうことを抑制することができる。つまり、読み出しによる負荷の増大を抑制するだけでなく、不要なパラメータを読み出して伝送することを抑制することができる。したがって、符号化効率の低減を抑制することができる。

また、このようにすることにより、プロファイルティアレベル（profile_tier_level()）、ビデオパラメータセット（VPS）、およびシーケンスパラメータセット（SPS）のシンタクスを変更する必要がなく、セマンティクスによる制御によって、符号化効率の低減を抑制することができる。シンタクスを変更すると、例えばスティルピクチャプロファイル（Still Picture Profile）に対応していないような従来のエンコーダ・デコーダとのシンタクスの互換性の維持が困難になる可能性がある。特に、ハードウエアにより実現されるエンコーダ・デコーダの場合、シンタクスの更新が困難である場合もある。シンタクスの互換性が低減すると、汎用性が低減する可能性もある。しかしながら、上述したように、セマンティクスによって、シンタクス要素の値を制限することにより、シンタクスの互換性を維持することができ、汎用性の低減を抑制することができる。

さらに、このようにシンタクスの互換性を維持することにより、静止画像の符号化も動画像の符号化も共通のシンタクスを適用することが容易に可能であるので、静止画像と動画像の両方を共通の回路で処理するエンコーダ・デコーダを容易に実現することができる。つまり、装置の小型化やコストの増大の抑制等にも寄与することができる。

＜０－２：プロファイルティアレベルの呼び出しに関するシンタクス要素の制限＞
ただし、このような制限を、シンタクスの変更によって実現することが不可能な訳ではない。

上述したようにビデオパラメータセット（VPS）やシーケンスパラメータセット（SPS）からプロファイルティアレベル（profile_tier_level()）を呼び出す場合、その呼び出しの際に指定される、プロファイルティアレベルの呼び出しに関するシンタクス要素ProfilePresentFlagの値は常に１である。

つまり、このシンタクス要素を伝送することは冗長である。また、プロファイルティアレベル（profile_tier_level()）の２行目（図３）のif文も不要である。

そこで、図３のプロファイルティアレベル（profile_tier_level()）のシンタクスを図７に示される例のようにし、図４のビデオパラメータセット（VPS）のシンタクスを図８に示される例のようにし、図５および図６のシーケンスパラメータセット（SPS）のシンタクスを、図９および図１０の例のようにしても良い。

つまり、シンタクス要素ProfilePresentFlagの指定は省略し、図７（第１行目）、図８（第７行目）、および図９（第５行目）の例のように、サブレイヤに関するシンタクス要素MaxNumSubLayersMinus1のみを指定することにより、プロファイルティアレベル（profile_tier_level()）を指定することができるようにしてもよい。

また、図７の第１行目乃至第７行目に示されるように、プロファイルティアレベル（profile_tier_level()）において、シンタクス要素ProfilePresentFlag を用いるif文を省略するようにしてもよい。

このようにすることにより、不要なパラメータの伝送を抑制し、符号化効率の低減を抑制することができる。また、不要なif文の読み込みによる、プロファイルティアレベル（profile_tier_level()）の読み込み処理の負荷の増大を抑制することができる。

換言するに、プロファイルティアレベルの呼び出しに関するシンタクス要素ProfilePresentFlagの値は１でなければならないようにしてもよい。

＜０－３：プロファイルティアレベルに関するシンタクス要素の制限＞
　なお、上述の方法では、サブレイヤに関するシンタクス要素max_sub_layers_minus1を符号化する際、後続のプロファイルティアレベル（profile_tier_level()）において、スティルピクチャプロファイル（Still Picture Profile）により符号化されるかどうかに関する情報を、前もって知った上で設定しなければならない。

そこで、図４のビデオパラメータセット（VPS）のシンタクスを図１１に示される例のようにし、図５および図６のシーケンスパラメータセット（SPS）のシンタクスを、図１２および図１３の例のようにしても良い。

つまり、ビデオパラメータセット（VPS）において、第６行目乃至第８行目（図１１）のように、プロファイルティアレベルに関するシンタクス要素profile_tier_level(1,0)を指定し、サブレイヤに関するシンタクス要素vps_max_sub_layers_minus1の値を指定し、プロファイルティアレベルに関するシンタクス要素profile_tier_level（0,vps_max_sub_layers_minus1）を指定するようにしてもよい。

同様に、シーケンスパラメータセット（SPS）において、第３行目乃至第６行目（図１２）のように、プロファイルティアレベルに関するシンタクス要素profile_tier_level(1,0)を指定し、サブレイヤに関するシンタクス要素sps_max_sub_layers_minus1の値を指定し、プロファイルティアレベルに関するシンタクス要素profile_tier_level（0,sps_max_sub_layers_minus1）を指定するようにしてもよい。

なお、vps_max_sub_layers_minus1やsps_max_sub_layers_minus1のように、シンタクス要素が属するパラメータセット等を識別しない場合、単にmax_sub_layers_minus1と称する。つまり、vps_max_sub_layers_minus1は、ビデオパラメータセット（VPS）におけるmax_sub_layers_minus1であり、sps_max_sub_layers_minus1は、シーケンスパラメータセット（SPS）におけるmax_sub_layers_minus1である。他のシンタクス要素においても同様の関係を有するものとする。

サブレイヤに関するシンタクス要素max_sub_layers_minus1を指定する前に、シンタクス要素profile_tier_level(1,0)を指定することにより、画像データの全てのテンポラルレイヤ（temporal_layer）を符号化・復号する場合に関する情報を伝送する。

ここで、スティルピクチャプロファイル（Still Picture Profile）が適用される場合、サブレイヤに関するシンタクス要素max_sub_layers_minus1の値は、０に指定される。

サブレイヤに関するシンタクス要素max_sub_layers_minus1を符号化した後、画像データの一部のテンポラルレイヤ（temporal_layer）を符号化・復号する場合に関する情報を、profile_tier_level(0, nax_sub_layers_minus1) により伝送する。

シンタクスをこのように変更することにより、スティルピクチャプロファイル（Still Picture Profile）であるかどうかを指定した後、サブレイヤに関するシンタクス要素max_sub_layers_minus1の値を指定することが可能である。

＜０－４：仮想参照デコーダに関するシンタクス要素の制限＞
また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、仮想参照デコーダの制御は不要である。そこで、図４に示されるように、ビデオパラメータセット（VPS）の、仮想参照デコーダに関するシンタクス要素vps_num_hrd_parameters（第１４行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、ビデオパラメータセット（VPS）の、仮想参照デコーダに関するシンタクス要素vps_num_hrd_parameters（第１４行目）の値が０でなければならないようにしてもよい。

仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersは、拡張ゴロム符号化されて伝送される正の値である。したがって、この値が０若しくは１の場合、符号量が最も少なくなる。つまり、仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値を０に指定することにより、符号化効率の低減を抑制することができる。

また、仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値を０にすることにより、第１５行目乃至第１９行目のループ処理（for文）を読み飛ばすことができる。したがって、このようにすることにより、負荷の増大を抑制することができる。また、ループ処理（for文）中の不要なシンタクス要素の伝送を抑制することができ、符号化効率の低減を抑制することができる。

さらに、このシンタクス要素の値の制限は、シンタクスを変更せずにセマンティクスによって行うことができ、シンタクスの汎用性の低減を抑制することができる。

なお、この制限は、ビデオパラメータセット（VPS）が、図８の場合や、図１１の場合にも適用することができる。

＜０－５：ＰスライスやＢスライスに関するシンタクス要素の制限＞
また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、ＰスライスやＢスライスは存在しない。そこで、図５に示されるように、シーケンスパラメータセット（SPS）の、ＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flag（第３２行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、シーケンスパラメータセット（SPS）の、ＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flag（第３２行目）の値が０でなければならないようにしてもよい。

また、ＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flagの値を０にすることにより、第３３行目乃至第４２行目を読み飛ばすことができる。したがって、このようにすることにより、負荷の増大を抑制することができる。また、第３３行目乃至第４２行目の不要なシンタクス要素の伝送を抑制することができ、符号化効率の低減を抑制することができる。

なお、この制限は、シーケンスパラメータセット（SPS）が、図９および図１０の場合や、図１２および図１３の場合にも適用することができる。

＜０－６：ショートタームに関するシンタクス要素の制限＞
また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図６に示されるように、シーケンスパラメータセット（SPS）の、ショートタームに関するシンタクス要素num_short_term_ref_pic_sets（第５６行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、シーケンスパラメータセット（SPS）の、ショートタームに関するシンタクス要素num_short_term_ref_pic_sets（第５６行目）の値が０でなければならないようにしてもよい。

このショートタームに関するシンタクス要素num_short_term_ref_pic_setsは、拡張ゴロム符号化されて伝送される正の値である。したがって、この値が０若しくは１の場合、符号量が最も少なくなる。つまり、ショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値を０に指定することにより、符号化効率の低減を抑制することができる。

また、このショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値を０にすることにより、第５７行目および第５８行目を読み飛ばすことができる。したがって、このようにすることにより、負荷の増大を抑制することができる。

＜０－７：ロングタームに関するシンタクス要素の制限＞
また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図６に示されるように、シーケンスパラメータセット（SPS）の、ロングタームに関するシンタクス要素long_term_ref_pics_present_flag（第５９行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、シーケンスパラメータセット（SPS）の、ロングタームに関するシンタクス要素long_term_ref_pics_present_flag（第５９行目）の値が０でなければならないようにしてもよい。

このロングタームに関するシンタクス要素long_term_ref_pics_present_flagの値を０にすることにより、第６０行目乃至第６６行目を読み飛ばすことができる。したがって、このようにすることにより、負荷の増大を抑制することができる。また、第６０行目乃至第６６行目の不要なシンタクス要素の伝送を抑制することができ、符号化効率の低減を抑制することができる。

＜０－８：動きベクトルに関するシンタクス要素の制限＞
また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図６に示されるように、シーケンスパラメータセット（SPS）の、動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flag（第６７行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、シーケンスパラメータセット（SPS）の、動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flag（第６７行目）の値が０でなければならないようにしてもよい。

この動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flagの値を０にすることにより、符号量を最少とすることができ、符号化効率の低減を抑制することができる。

＜０－９：ピクチャパラメータセットのシンタクス要素の制限＞
図１４および図１５は、HEVCにおけるピクチャパラメータセット（PPS（Picture Parameter Set））の例を示す図である。

スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図１４に示されるように、ピクチャパラメータセット（PPS）の、L0に関するシンタクス要素num_ref_idx_l0_default_active minus1（第６行目）、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1（第７行目）の値を、ともに０若しくは１に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、ピクチャパラメータセット（PPS）の、L0に関するシンタクス要素num_ref_idx_l0_default_active minus1（第６行目）、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1（第７行目）の値が、ともに０若しくは１でなければならないようにしてもよい。

これらのシンタクス要素は、拡張ゴロム符号化されて伝送される正の値である。したがって、これらの値が０若しくは１の場合、符号量が最も少なくなる。つまり、L0に関するシンタクス要素num_ref_idx_l0_default_active minus1、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1の値を０に指定することにより、符号化効率の低減を抑制することができる。

また、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図１５に示されるように、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素（フラグ）lists_modification_present_flag（第４９行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素（フラグ）lists_modification_present_flag（第４９行目）の値が０でなければならないようにしてもよい。

シンタクス要素lists_modification_present_flagの値が１である場合、図２１の第５３行目および第５４行目に示されるように、カレントスライスについて、参照画像リストに関するシンタクス要素ref_pic_list_modificationが伝送されるが、スティルピクチャプロファイル（Still Picture Profile）の場合、このシンタクス要素は不要である。つまり、シンタクス要素lists_modification_present_flagの値を０に指定することにより、カレントスライスについて、不要な情報である参照画像リストに関するシンタクス要素ref_pic_list_modificationの伝送を省略することができ、符号化効率の低減を抑制することができる。

さらに、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図１５に示されるように、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2（第５０行目）の値を０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2（第５０行目）の値が０でなければならないようにしてもよい。

このシンタクス要素は、拡張ゴロム符号化されて伝送される正の値である。したがって、この値が０の場合、符号量が最も少なくなる。つまり、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2の値を０に指定することにより、符号化効率の低減を抑制することができる。

なお、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、時間の概念が存在しない（他のピクチャは存在しない）。そこで、図１４に示されるように、ピクチャパラメータセット（PPS）の、Ｐスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_pred_flag（第１８行目）、および、Ｂスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_bipred_flag（第１９行目）の値を、ともに０に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、ピクチャパラメータセット（PPS）の、Ｐスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_pred_flag（第１８行目）、および、Ｂスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_bipred_flag（第１９行目）の値が、ともに０でなければならないようにしてもよい。

シンタクス要素weighted_pred_flagやweighted_bipred_flagの値が１である場合、図２１の第６５行目乃至第６８行目に示されるように、カレントスライスについて、重み予測テーブル等が伝送されるが、スティルピクチャプロファイル（Still Picture Profile）の場合、これらの情報は不要である。つまり、シンタクス要素weighted_pred_flagやweighted_bipred_flagの値を０に指定することにより、カレントスライスについて、不要な情報の伝送を省略することができ、符号化効率の低減を抑制することができる。

ただし、後述するようにスライスタイプをＩスライスに制限することによっても、これらの情報の伝送を省略することができるので、シンタクス要素weighted_pred_flagやweighted_bipred_flagに関する上述したような制限は、省略することもできる。

＜０－１０：スケーリングリストの予測モードに関するシンタクス要素の制限＞
ところで、図５および図６に示されるシーケンスパラメータセット（SPS）においては、スケーリングリスト（scaling_list_data()）が呼ばれる（第４９行目）。同様に、図１４および図１５に示されるピクチャパラメータセット（PPS）においても、スケーリングリスト（scaling_list_data()）が呼ばれる（第４８行目）。

図１６にそのスケーリングリスト（scaling_list_data()）の例を示す。図１６に示されるスケーリングリスト（scaling_list_data()）において、サイズID（sizeID）とマトリクスID（matrixID）のセマンティクスは、図１７および図１８に示されるとおりである。

ここで、サイズID（sizeID）の値が０、１、若しくは２であり、マトリクスID（matrixID）の値が３、４、若しくは５である場合、または、サイズID（sizeID）の値が３であり、マトリクスID（matrixID）の値が１である場合、スティルピクチャプロファイル（Still Picture Profile）において、スケーリングリスト（scaling list）を伝送することは冗長である。

そこで、これらの場合、スケーリングリストの予測モードに関するシンタクス要素scaling_list_pred_mode_flagの値を０に指定し、スケーリングリストの予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値を０若しくは１に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、スケーリングリストの予測モードに関するシンタクス要素scaling_list_pred_mode_flag（第４行目）の値が０でなければならず、かつ、スケーリングリストの予測行列に関するシンタクス要素scaling_list_pred_matrix_id_delta（第６行目）の値が０若しくは１でなければならないようにしてもよい。

なお、スケーリングリストの予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値を１とすることで、符号長を最小限に保ちながら、スタートコードエミュレーションプリベンション（start code emulation prevention）を挿入する必要性を減少させることができる。

＜０－１１：スケーリングリストの予測モードに関するシンタクスの変更＞
なお、上述したようにセマンティクスによりシンタクス要素の値を制限する代わりに、図１９に示されるようにシンタクスを変更するようにしても良い。

図１９のシンタクスにおいては、第４行目に示されるように、for文の条件を、サイズID（sizeID）およびマトリクスID（matrixID）を用いて、上述したのと同様に詳細に指定している。

このようにしても同等の結果をえることができる。

＜０－１２：スライスタイプに関するシンタクス要素の制限＞
図２０乃至図２２にスライスヘッダのシンタクスの例を示す。

スティルピクチャプロファイル（Still Picture Profile）を適用する場合、スライスタイプはIスライスのみとなる。そこで、図２０に示されるように、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_type（第１１行目）の値を、Ｉスライスを示す値に指定するようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_type（第１１行目）の値がＩスライスでなければならないようにしてもよい。

このようにすることにより、スライスヘッダ（slice_header()）の第４４行目乃至第６８行目を読み飛ばすことができる。したがって、このようにすることにより、負荷の増大を抑制することができる。また、第４４行目乃至第６８行目の不要なシンタクス要素の伝送を抑制することができ、符号化効率の低減を抑制することができる。

＜０－１３：ナルユニットタイプに関するシンタクス要素の制限＞
ところで、図２０乃至図２２において、IdrPicFlag及びRapPicFlagは、nal_unit_typeから以下の式（３）および式（４）のように算出される。

ここで、ナルユニットタイプに関するシンタクス要素nal_unit_typeは、図２３のように割り当てられている。

そこで、スティルピクチャプロファイル（Still Picture Profile）を適用する場合、VCLに対するナルユニットタイプ（nal_unit_type）は、IDR_W_LP若しくはIDR_N_LPとするようにしてもよい。

換言するに、スティルピクチャプロファイル（Still Picture Profile）が適用されている場合、VCLに対するナルユニットタイプ（nal_unit_type）が、IDR_W_LP若しくはIDR_N_LPでなければならないようにしてもよい。

以上のような処理を行うことにより、スティルピクチャプロファイル（Still Picture Profile）により符号化が行われる際の、冗長な情報を伝送することを排除し、出力となる画像圧縮情報における符号化効率を向上させることが可能である。

なお、静止画像を符号化するためのプロファイルにより符号化処理を行う場合に値を制限する、画像間の処理に関するシンタクス要素は、上述した例に限らない。上述したシンタクス要素以外のシンタクス要素の値を制限するようにしてもよい。また、その際、セマンティクスにより制限を行うようにしてもよいし、シンタクスを変更するようにしてもよい。

また、図２４に示されるように、静止画像の一部に、人の顔が写っているなどの、ROI (Region of Interest) が存在する場合、図２のタイル（Tile）に画像を分割し、どのタイル（Tile）がROI領域であるかを、SEI（Suplemental Enhancement Information）等のメタデータにより指定することで、復号画像で、ROI領域のみの復号処理を行うことも可能である。

次に、以上のような本技術について、具体的な装置への適用例について説明する。

  ＜１．第１の実施の形態＞
    ＜画像符号化装置＞
  図２５は、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図２５に示される画像符号化装置１００は、例えば、HEVCの予測処理、またはそれに準ずる方式の予測処理を用いて動画像の画像データを符号化する。

なお、この画像符号化装置１００は、動画像の画像データだけでなく、静止画像の画像データも符号化することができる。その場合、画像符号化装置１００には、静止画像用のプロファイル（例えば、スティルピクチャプロファイル（Still Picture Profile））が設定される。

図２５に示されるように画像符号化装置１００は、A/D変換部１０１、画面並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、蓄積バッファ１０７、逆量子化部１０８、および逆直交変換部１０９を有する。また、画像符号化装置１００は、演算部１１０、ループフィルタ１１１、フレームメモリ１１２、イントラ予測部１１３、インター予測部１１４、予測画像選択部１１５、およびレート制御部１１６を有する。

A/D変換部１０１は、画像符号化装置１００に入力された、入力画像の画像データ（アナログデータ）をA/D変換する。A/D変換部１０１は、変換後の画像データ（デジタルデータ）を、画面並べ替えバッファ１０２に供給する。

画面並べ替えバッファ１０２は、表示順に供給される入力画像の各フレーム画像データをその順に記憶する。画面並べ替えバッファ１０２は、その入力画像のフレームの順番を、GOP（Group Of Picture）に応じて、符号化順に並べ替える。つまり画面並べ替えバッファ１０２は、表示順に記憶した各フレームの画像データを、符号化順に読み出す。画面並べ替えバッファ１０２は、読み出した画像データを演算部１０３に供給する。また、画面並べ替えバッファ１０２は、読み出した画像データを、イントラ予測部１１３およびインター予測部１１４にも供給する。つまり、演算部１０３、イントラ予測部１１３、およびインター予測部１１４には、符号化順に各フレームの画像データが供給される。なお、入力画像が静止画像の場合は、時間の概念が存在しないので（フレーム数が１であるので）、この並べ替えは省略される。

演算部１０３は、画面並べ替えバッファ１０２から読み出された入力画像の画像データと、予測画像選択部１１５を介してイントラ予測部１１３若しくはインター予測部１１４から供給された予測画像の画像データとを用いて、入力画像から予測画像を減算した差分画像の画像データを生成する。例えば、イントラ符号化が行われる画像の場合、演算部１０３は、入力画像と、イントラ予測部１１３により生成された予測画像との差分画像を生成する。また、例えば、インター符号化が行われる画像の場合、演算部１０３は、入力画像と、インター予測部１１４により生成された予測画像との差分画像を生成する。演算部１０３は、生成した差分画像の画像データを直交変換部１０４に出力する。

直交変換部１０４は、演算部１０３から供給される差分画像の画像データに対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部１０４は、得られた変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１６から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部１０５は、このように量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を任意の符号化方式で符号化し、符号化データを生成する。係数データは、レート制御部１１６の制御の下で量子化されているので、この符号化データのデータ量（符号量）は、レート制御部１１６が設定した目標値となる（若しくは目標値に近似する）。

また、可逆符号化部１０６は、イントラ予測のモードを示す情報などをイントラ予測部１１３から取得し、インター予測のモードを示す情報や差分動きベクトル情報などをインター予測部１１４から取得する。可逆符号化部１０６は、これらの各種情報を任意の符号化方式で符号化し、符号化データのヘッダ情報の一部とする（多重化する）。可逆符号化部１０６は、得られた符号化データを蓄積バッファ１０７に供給して蓄積させる。

可逆符号化部１０６が行う符号化の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）などが挙げられる。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）などが挙げられる。

蓄積バッファ１０７は、可逆符号化部１０６から供給された符号化データを、一時的に保持する。蓄積バッファ１０７は、所定のタイミングにおいて、保持している符号化データを、画像符号化装置１００の外部に出力する。すなわち、蓄積バッファ１０７は、符号化データを伝送する伝送部でもある。

また、量子化部１０５において量子化された変換係数は、逆量子化部１０８にも供給される。逆量子化部１０８は、その量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。逆量子化部１０８は、得られた変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給された変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。この逆直交変換により差分画像の画像データが復元される。逆直交変換部１０９は、その復元された差分画像の画像データを、逆直交変換結果として、演算部１１０に供給する。

演算部１１０は、逆直交変換部１０９から供給された逆直交変換結果と、予測画像選択部１１５を介してイントラ予測部１１３若しくはインター予測部１１４から供給された予測画像の画像データとを用いて、復元された差分画像と予測画像とを加算した画像の画像データを生成する。つまり、この加算処理により、局所的に再構成された画像（以下、再構成画像と称する）が得られる。演算部１１０は、その再構成画像の画像データを、ループフィルタ１１１またはイントラ予測部１１３に供給される。

ループフィルタ１１１は、デブロックフィルタや適応ループフィルタ等を含み、演算部１１０から供給される再構成画像の画像データに対して適宜フィルタ処理を行う。例えば、ループフィルタ１１１は、再構成画像の画像データに対してデブロックフィルタ処理を行うことにより、再構成画像のブロック歪を除去する。また、例えば、ループフィルタ１１１は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像の画像データ）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより、再構成画像の画質改善を行う。

なお、ループフィルタ１１１が、再構成画像に対してさらに、他の任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ１１１は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部１０６に供給し、それを符号化させるようにすることもできる。

ループフィルタ１１１は、以上のようにフィルタ処理された再構成画像（以下、復号画像と称する）の画像データを、フレームメモリ１１２に供給する。

フレームメモリ１１２は、供給される復号画像の画像データを記憶する。また、フレームメモリ１１２は、所定のタイミングにおいて、記憶している復号画像の画像データを、参照画像としてインター予測部１１４に供給する。

イントラ予測部１１３は、処理対象のフレームの画像であるカレントピクチャについて、予測処理を行い、予測画像を生成する。イントラ予測部１１３は、この予測処理を、所定のブロック毎に（ブロックを処理単位として）行う。つまり、イントラ予測部１１３は、カレントピクチャの、処理対象であるカレントブロックの予測画像を生成する。その際、イントラ予測部１１３は、演算部１１０から参照画像として供給される再構成画像を用いて予測処理（画面内予測（イントラ予測とも称する））を行う。つまり、イントラ予測部１１３は、再構成画像に含まれる、カレントブロックの周辺の画素値を用いて予測画像を生成する。このイントラ予測に利用される周辺画素値は、カレントピクチャの、過去に処理された画素の画素値である。このイントラ予測には（すなわち、予測画像の生成の仕方には）、複数の方法（イントラ予測モードとも称する）が、候補として予め用意されている。イントラ予測部１１３は、この予め用意された複数のイントラ予測モードでこのイントラ予測を行う。

イントラ予測部１１３は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ１０２から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部１１３は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１５に供給する。

また、上述したように、イントラ予測部１１３は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部１０６に供給し、符号化させる。

インター予測部１１４は、カレントピクチャについて、予測処理を行い、予測画像を生成する。インター予測部１１４は、この予測処理を、所定のブロック毎に（ブロックを処理単位として）行う。つまり、インター予測部１１４は、カレントピクチャの、処理対象であるカレントブロックの予測画像を生成する。その際、インター予測部１１４は、画面並べ替えバッファ１０２から供給される入力画像の画像データと、フレームメモリ１１２から参照画像として供給される復号画像の画像データとを用いて、予測処理を行う。この復号画像は、カレントピクチャより前に処理されたフレームの画像（カレントピクチャでない他のピクチャ）である。つまり、インター予測部１１４は、他のピクチャの画像を用いて予測画像を生成する予測処理（画面間予測（インター予測とも称する））を行う。

このインター予測は、動き予測と動き補償よりなる。より具体的には、インター予測部１１４は、入力画像と参照画像を用いて、カレントブロックについて動き予測を行い、動きベクトルを検出する。そして、インター予測部１１４は、参照画像を用いて、検出された動きベクトルに応じて動き補償処理を行い、カレントブロックの予測画像（インター予測画像情報）を生成する。このインター予測には（すなわち、予測画像の生成の仕方には）、複数の方法（インター予測モードとも称する）が、候補として予め用意されている。インター予測部１１４は、この予め用意された複数のインター予測モードでこのようなインター予測を行う。

インター予測部１１４は、候補となる全てのインター予測モードで予測画像を生成する。インター予測部１１４は、画面並べ替えバッファ１０２から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。インター予測部１１４は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部１１５に供給する。

インター予測部１１４は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部１０６に供給し、符号化させる。必要な情報としては、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として、予測動きベクトルのインデックスを示すフラグなどがある。

予測画像選択部１１５は、演算部１０３や演算部１１０に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部１１５は、予測画像の供給元としてイントラ予測部１１３を選択し、そのイントラ予測部１１３から供給される予測画像を演算部１０３や演算部１１０に供給する。また、例えば、インター符号化の場合、予測画像選択部１１５は、予測画像の供給元としてインター予測部１１４を選択し、そのインター予測部１１４から供給される予測画像を演算部１０３や演算部１１０に供給する。

レート制御部１１６は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。

画像符号化装置１００は、さらに、プロファイル設定部１２１を有する。

プロファイル設定部１２１は、画像データの符号化に適用するプロファイルを設定する。例えば、静止画像を符号化する場合、プロファイル設定部１２１は、スティルピクチャプロファイル（Still Picture Profile）を設定する。例えば、プロファイル設定部１２１は、ユーザ等の外部の指示に従って、プロファイルを設定する。もちろん、この方法は任意であり、プロファイルがどのような情報に基づいて設定されるようにしても良い。プロファイルを設定すると、プロファイル設定部１２１は、その情報を可逆符号化部１０６に供給する。

可逆符号化部１０６は、プロファイル設定部１２１により設定されたプロファイルに従って符号化を行う。例えば、プロファイル設定部１２１によりスティルピクチャプロファイル（Still Picture Profile）が設定された場合、可逆符号化部１０６は、画像間の処理に関するシンタクス要素の値を制限する。その制限の具体的な例は、＜０．概要＞において上述した通りである。

＜可逆符号化部＞
図２６は、図２５の可逆符号化部１０６の、シンタクス要素設定に関する主な構成例を示すブロック図である。図２５に示されるように可逆符号化部１０６は、シンタクス要素設定部１３１および符号化部１３２を有する。

シンタクス要素設定部１３１は、シンタクス要素の設定に関する処理を行う。シンタクス要素設定部１３１は、例えばビデオパラメータセット（VPS）、シーケンスパラメータセット（SPS）、ピクチャパラメータセット（PPS）、スライスヘッダ等、各種ナルユニット（nal_unit）のシンタクス要素の設定を行う。シンタクス要素設定部１３１は、必要に応じて、イントラ予測部１１３、インター予測部１１４等、画像符号化装置１００の各処理部から必要な情報を取得し、その情報に基づいてシンタクス要素の値を設定する。

また、シンタクス要素設定部１３１は、プロファイル設定部１２１からプロファイルの指定を受け付ける。シンタクス要素設定部１３１は、そのプロファイル設定部１２１により指定されたプロファイルに従って、シンタクス要素の設定を行う。

例えば、プロファイル設定部１２１によりスティルピクチャプロファイル（Still Picture Profile）が設定された場合、シンタクス要素設定部１３１は、画像間の処理に関するシンタクス要素の値を制限する。その制限の具体的な例は、＜０．概要＞において上述した通りである。

シンタクス要素設定部１３１は、設定したシンタクス要素を符号化部１３２に供給する。

符号化部１３２は、例えば、量子化部１０５から画像データの量子化係数を取得し、算術符号化等によりそれを符号化し、符号化データを得る。符号化部１３２は、得られた符号化データを蓄積バッファ１０７に供給する。

また、符号化部１３２は、画像データ以外の情報も符号化し、蓄積バッファ１０７に供給する。例えば、符号化部１３２は、シンタクス要素設定部１３１において設定されたシンタクス要素を符号化し、蓄積バッファ１０７に供給する。

以上のように可逆符号化部１０６は、スティルピクチャプロファイル（Still Picture Profile）が設定された場合、画像間の処理に関するシンタクス要素の値を制限して、符号化データを生成する。したがって、画像符号化装置１００は、冗長な情報の伝送を抑制することができ、符号化効率の低減を抑制することができる。

付言するに、画像符号化装置１００は、符号化データの冗長な情報を低減させることにより、復号処理の不要な負荷の増大を抑制することもできる。

また、画像符号化装置１００は、プロファイルを切り替えるだけで容易に、１の回路で、静止画像と動画像の両方を符号化することができる。

＜符号化処理の流れ＞
次に、図２５に示される画像符号化装置１００により実行される符号化処理の流れの例を、図２７および図２８のフローチャートを参照して説明する。

符号化処理が開始されると、図２７のステップＳ１０１において、プロファイル設定部１２１は、例えばユーザ等の外部の指示に従って、符号化する画像データに応じたプロファイルを設定する。

ステップＳ１０２において、可逆符号化部１０６は、ステップＳ１０１において設定されたプロファイルが静止画像用のプロファイル（静止画像の画像データを符号化するのに適したプロファイル）であるか否かを判定する。設定されたプロファイルが動画像用のプロファイル（動画像の画像データを符号化するのに適したプロファイル）であると判定された場合、処理は、ステップＳ１０３に進む。

動画像の画像データを符号化する場合、ステップＳ１０３において、A/D変換部１０１は、入力された動画像の各フレーム（ピクチャ）の画像をA/D変換する。

ステップＳ１０４において、画面並べ替えバッファ１０２は、ステップＳ１０３においてA/D変換された画像を記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。

ステップＳ１０５において、イントラ予測部１１３は、イントラ予測モードのイントラ予測処理を行う。

ステップＳ１０６において、インター予測部１１４は、インター予測モードでの動き予測や動き補償を行うインター予測処理を行う。

ステップＳ１０７において、予測画像選択部１１５は、コスト関数値等に基づいて、予測画像を選択する。つまり、予測画像選択部１１５は、ステップＳ１０５のイントラ予測により生成された予測画像と、ステップＳ１０６のインター予測により生成された予測画像のいずれか一方を選択する。

ステップＳ１０８において、演算部１０３は、ステップＳ１０４の処理によりフレーム順を並び替えられた入力画像と、ステップＳ１０７の処理により選択された予測画像との差分を演算する。つまり、演算部１０３は、入力画像と予測画像との差分画像の画像データを生成する。このようにして求められた差分画像の画像データは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に較べて、データ量を圧縮することができる。

ステップＳ１０９において、直交変換部１０４は、ステップＳ１０８の処理により生成された差分画像の画像データを直交変換する。

ステップＳ１１０において、量子化部１０５は、レート制御部１１６により算出された量子化パラメータを用いて、ステップＳ１０９の処理により得られた直交変換係数を量子化する。

ステップＳ１１１において、逆量子化部１０８は、ステップＳ１１０の処理により生成された量子化された係数（量子化係数とも称する）を、量子化部１０５の特性に対応する特性で逆量子化する。

ステップＳ１１２において、逆直交変換部１０９は、ステップＳ１１１の処理により得られた直交変換係数を逆直交変換する。

ステップＳ１１３において、演算部１１０は、ステップＳ１１２の処理により復元された差分画像に、ステップＳ１０７の処理により選択された予測画像を加算することにより、再構成画像の画像データを生成する。

ステップＳ１１４においてループフィルタ１１１は、ステップＳ１１３の処理により生成された再構成画像の画像データにループフィルタ処理を行う。これにより、再構成画像のブロック歪み等が除去される。

ステップＳ１１５において、フレームメモリ１１２は、ステップＳ１１４の処理により得られた復号画像を記憶する。

ステップＳ１１６において、可逆符号化部１０６は、ステップＳ１１０の処理により得られた、量子化された係数を符号化する。すなわち、差分画像に対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。

また、このとき、可逆符号化部１０６は、ステップＳ１０７の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部１０６は、イントラ予測部１１３から供給される最適イントラ予測モード情報、または、インター予測部１１４から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。

さらに、可逆符号化部１０６は、各種ナルユニット等のシンタクス要素も設定し、符号化し、符号化データに付加する。

ステップＳ１１７において蓄積バッファ１０７は、ステップＳ１１５の処理により得られた符号化データを蓄積する。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。

ステップＳ１１８においてレート制御部１１６は、ステップＳ１１７の処理により蓄積バッファ１０７に蓄積された符号化データの符号量（発生符号量）に基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。また、レート制御部１１６は、量子化パラメータに関する情報を、量子化部１０５に供給する。ステップＳ１１８の処理が終了すると、符号化処理が終了する。

また、ステップＳ１０２において、ステップＳ１０１において設定されたプロファイルが静止画像用のプロファイル（静止画像の画像データを符号化するのに適したプロファイル）であると判定された場合、処理は、図２８のステップＳ１２１に進む。

この場合、ステップＳ１２１乃至ステップＳ１３４の各ステップにおいて、入力された静止画像の画像データに対して、図２７の各ステップにおいて行われた動画像に対する処理と同様の処理が実行される。

ただし、静止画像の画像データを符号化する場合、画像データに時間の概念が存在しない（ピクチャが複数存在しない）ので、ステップＳ１０６のインター予測処理は省略される。したがって、ステップＳ１０７の予測画像の選択処理も省略される。

つまり、図２８のステップＳ１２１乃至ステップＳ１２３の各処理は、図２７のステップＳ１０３乃至ステップＳ１０５の各処理に対応する。また、図２８のステップＳ１２４乃至ステップＳ１３４の各処理は、図２７のステップＳ１０８乃至ステップＳ１１８の各処理に対応する。

ただし、図２８のステップＳ１３２の処理においては、画像間の処理に関するシンタクス要素の値が制限される。この処理の詳細については後述する。図２８のステップＳ１３４の処理が終了すると、符号化処理が終了する。

＜可逆符号化処理の流れ＞
次に、図２９のフローチャートを参照して、図２８のステップＳ１３２において実行される可逆符号化処理の流れの例を説明する。

静止画像の符号化において可逆符号化処理が開始されると、ステップＳ１５１において、シンタクス要素設定部１３１は、静止画像用の制限に基づいてシンタクス要素を設定する。例えば＜０．概要＞において上述したように、冗長な情報の伝送を低減させるために、スティルピクチャプロファイル（Still Picture Profile）が適用される場合、シンタクス要素設定部１３１は、画像間の処理に関するシンタクス要素の値を制限する。

ステップＳ１５２において、符号化部１３２は、ステップＳ１５１において設定されたシンタクス要素を符号化する。

ステップＳ１５３において、符号化部１３２は、量子化部１０５により量子化された直交変換係数を符号化する。ステップＳ１５３の処理が終了すると、可逆符号化処理が終了し、処理は、図２８に戻る。

＜シンタクス要素設定処理の流れ＞
次に、図３０のフローチャートを参照して、図２９のステップＳ１５１において実行されるシンタクス要素設定処理の流れの例を説明する。

シンタクス要素設定処理が開始されると、シンタクス要素設定部１３１は、ステップＳ１７１において、ビデオパラメータセット（VPS）のサブレイヤに関するパラメータvps_max_sub_layers_minus1と、シーケンスパラメータセット（SPS）のサブレイヤに関するパラメータsps_max_sub_layers_minus1とを０に設定する。

ステップＳ１７２において、シンタクス要素設定部１３１は、プロファイルティアレベル（profile_tier_level()）のシンタクス要素general_profile_idcを、スティルピクチャプロファイル（Still Picture Profile）を示す値に設定する。

ステップＳ１７３において、シンタクス要素設定部１３１は、プロファイルティアレベル（profile_tier_level()）のその他のシンタクス要素を設定する。

ステップＳ１７４において、シンタクス要素設定部１３１は、ビデオパラメータセット（VPS）の仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値を０に設定する。

ステップＳ１７５において、シンタクス要素設定部１３１は、シーケンスパラメータセット（SPS）のＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flagの値を０に設定する。

ステップＳ１７６において、シンタクス要素設定部１３１は、シーケンスパラメータセット（SPS）のショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値を０に設定する。

ステップＳ１７７において、シンタクス要素設定部１３１は、シーケンスパラメータセット（SPS）のロングタームに関するシンタクス要素long_term_ref_pics_present_flagの値を０に設定する。

ステップＳ１７８において、シンタクス要素設定部１３１は、シーケンスパラメータセット（SPS）の動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flagの値を０に設定する。

ステップＳ１７９において、シンタクス要素設定部１３１は、ピクチャパラメータセット（PPS）のL0に関するシンタクス要素num_ref_idx_l0_default_active minus1、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1の値を、ともに０若しくは１に設定する。

ステップＳ１８０において、シンタクス要素設定部１３１は、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素lists_modification_present_flagの値を０に設定する。

ステップＳ１８１において、シンタクス要素設定部１３１は、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2の値を０に設定する。

ステップＳ１８２において、シンタクス要素設定部１３１は、スケーリングリスト（scaling_list_data()）の予測モードに関するシンタクス要素scaling_list_pred_mode_flagの値を０に設定し、スケーリングリスト（scaling_list_data()）の予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値を０若しくは１に設定する。

ステップＳ１８３において、シンタクス要素設定部１３１は、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_typeの値を、Ｉスライスを示す値に設定する。

ステップＳ１８４において、シンタクス要素設定部１３１は、VCLに対するナルユニットタイプ（nal_unit_type）を、IDR_W_LP若しくはIDR_N_LPに設定する。

ステップＳ１８５において、シンタクス要素設定部１３１は、その他のシンタクス要素を設定する。例えば、シンタクス要素設定部１３１は、ステップＳ１８５において、ピクチャパラメータセット（PPS）の、Ｐスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_pred_flagやＢスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_bipred_flagの値を０に設定してもよい。ステップＳ１８５の処理が終了すると、処理は、図２９に戻る。

もちろん、上述した各ステップの処理順は、任意であり、各ステップの処理順を入れ替えてもよいし、複数ステップの処理を並行して実行するようにしてもよい。特に、＜０－１＞乃至＜０－３＞において上述したように、ステップＳ１７１乃至ステップＳ１７３の処理順は任意である。

また、上述した各シンタクス要素の値の制限は互いに独立しているので、上述したシンタクス要素群の全ての値を制限しなければならないわけではなく、一部のシンタクス要素のみ値を制限するようにしてもよい。つまり、図３０のシンタクス要素設定処理において上述した各ステップのうち、一部のステップの処理のみを実行するようにしてもよい。

さらに、値を制限するシンタクス要素は、上述した例に限らないので、図３０のシンタクス要素設定処理においても、上述していないシンタクス要素の値を制限する処理を追加するようにしてもよい。

以上のように各処理を実行することにより、画像符号化装置１００は、静止画像を符号化するためのプロファイルにより符号化が行われる際の、冗長な情報の伝送を抑制し、出力となる画像圧縮情報における符号化効率を向上させることができる。

  ＜２．第２の実施の形態＞
    ＜画像符号化装置＞
  なお、プロファイルの選択は、入力画像に対応することが望ましい。そこで、入力画像が動画像であるか静止画像であるかを判定し、その判定結果に応じて適切なプロファイルを設定するようにしてもよい。

図３１は、その場合の、本技術を適用した画像処理装置の一態様である画像符号化装置の構成の一例を示すブロック図である。図３１に示される画像符号化装置２００は、例えば、HEVCの予測処理、またはそれに準ずる方式の予測処理を用いて動画像および静止画像の画像データを符号化する。

画像符号化装置２００は、画像符号化装置１００と基本的に同様の構成を有し、同様の処理を行う。ただし、画像符号化装置２００は、画像符号化装置１００の構成に加え、判定部２１１を有する。

判定部２１１は、画面並べ替えバッファ１０２から画像情報を取得し、その画像情報を解析することにより、符号化対象の画像データが動画像であるか静止画像であるかを判定する。判定部２１１は、その判定結果をプロファイル設定部１２１に供給する。

プロファイル設定部１２１は、判定部２１１から供給されるその判定結果に応じて、適切なプロファイルを設定する。つまり、例えば、判定部２１１により符号化対象の画像データが動画像であると判定された場合、プロファイル設定部１２１は、動画像用のプロファイルを設定する。また、例えば、判定部２１１により符号化対象の画像データが静止画像であると判定された場合、プロファイル設定部１２１は、静止画像用のプロファイル（例えば、スティルピクチャプロファイル（Still Picture Profile））を設定する。

プロファイルを設定すると、プロファイル設定部１２１は、その情報を可逆符号化部１０６に供給する。可逆符号化部１０６は、プロファイル設定部１２１により設定されたプロファイルに従って符号化を行う。

このようにすることにより、画像符号化装置２００は、例えばユーザ等の外部からの指定無しに、入力された画像データに応じたプロファイルを設定することができる。つまり、画像符号化装置２００は、例えばユーザ等の外部からの指定無しに、冗長な情報の伝送を抑制し、出力となる画像圧縮情報における符号化効率を向上させることができる。

付言するに、画像符号化装置２００は、符号化データの冗長な情報を低減させることにより、復号処理の不要な負荷の増大を抑制することもできる。

また、画像符号化装置２００は、１の回路で、静止画像と動画像の両方を符号化することができる。

＜符号化処理の流れ＞
次に、図３２および図３３のフローチャートを参照して、画像符号化装置２００により実行される、その場合の、符号化処理の流れの例を説明する。

符号化処理が開始されると、図３２のステップＳ２０１において、判定部２１１は、入力画像が静止画像であるか否かを判定する。

ステップＳ２０２において、プロファイル設定部１２１は、ステップＳ２０１において得られた判定結果に応じたプロファイルを設定する。

それ以降の、図３２のステップＳ２０３乃至ステップＳ２１９の各ステップにおいては、図２７のステップＳ１０２乃至ステップＳ１１８の各ステップと同様の処理が実行される。

また、図３２のステップＳ２０３において、静止画像用のプロファイルが設定されたと判定された場合、処理は、図３３のステップＳ２２１に進む。図３３のステップＳ２２１乃至ステップＳ２３４の各ステップにおいては、図２８のステップＳ１２１乃至ステップＳ１３４の各ステップと同様の処理が実行される。

以上のように各処理を実行することにより、画像符号化装置２００は、例えばユーザ等の外部からの指定無しに、入力された画像データに応じたプロファイルを設定することができ、冗長な情報の伝送を抑制し、出力となる画像圧縮情報における符号化効率を向上させることができる。

  ＜３．第３の実施の形態＞
    ＜画像復号装置＞
  次に、以上のように符号化された符号化データの復号について説明する。図３４は、本技術を適用した画像処理装置の一態様である、図２５の画像符号化装置１００や図３１の画像符号化装置２００に対応する画像復号装置の主な構成例を示すブロック図である。

図３４に示される画像復号装置３００は、画像符号化装置１００若しくは画像符号化装置２００が生成した符号化データを、その符号化方法に対応する復号方法で復号する。

図３４に示されるように画像復号装置３００は、蓄積バッファ３０１、可逆復号部３０２、逆量子化部３０３、逆直交変換部３０４、演算部３０５、ループフィルタ３０６、画面並べ替えバッファ３０７、およびD/A変換部３０８を有する。また、画像復号装置３００は、フレームメモリ３０９、イントラ予測部３１０、インター予測部３１１、および予測画像選択部３１２を有する。

蓄積バッファ３０１は、伝送されてきた符号化データを受け取る受け取り部でもある。蓄積バッファ３０１は、伝送されてきた符号化データを受け取って、蓄積し、所定のタイミングにおいてその符号化データを可逆復号部３０２に供給する。符号化データには、予測モード情報などの復号に必要な情報が付加されている。可逆復号部３０２は、蓄積バッファ３０１より供給された、可逆符号化部１０６により符号化された情報を、その符号化方式に対応する復号方式で復号する。可逆復号部３０２は、復号して得られた差分画像の量子化された係数データを、逆量子化部３０３に供給する。

また、可逆復号部３０２は、最適な予測モードにイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部３１０およびインター予測部３１１の内、選択されたと判定したモードの方に供給する。つまり、例えば、画像符号化装置において最適な予測モードとしてイントラ予測モードが選択された場合、その最適な予測モードに関する情報がイントラ予測部３１０に供給される。また、例えば、画像符号化装置において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報がインター予測部３１１に供給される。

さらに、可逆復号部３０２は、例えば、量子化行列や量子化パラメータ等の、逆量子化に必要な情報を逆量子化部３０３に供給する。

逆量子化部３０３は、可逆復号部３０２により復号されて得られた量子化された係数データを、量子化部１０５の量子化方式に対応する方式で逆量子化する。なお、この逆量子化部３０３は、逆量子化部１０８と同様の処理部である。つまり、逆量子化部３０３の説明は、逆量子化部１０８にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

逆量子化部３０３は、得られた係数データを逆直交変換部３０４に供給する。

逆直交変換部３０４は、逆量子化部３０３から供給される直交変換係数を、必要に応じて、直交変換部１０４の直交変換方式に対応する方式で逆直交変換する。なお、この逆直交変換部３０４は、逆直交変換部１０９と同様の処理部である。つまり、逆直交変換部３０４の説明は、逆直交変換部１０９にも準用することができる。ただし、データの入出力先等は、装置に応じて適宜、変えて読む必要がある。

この逆直交変換処理により差分画像の画像データが復元される。この復元された差分画像の画像データは、画像符号化装置において直交変換される前の差分画像の画像データに対応する。以下においては、この、逆直交変換部３０４の逆直交変換処理により得られた、復元された差分画像の画像データを、復号残差データとも称する。逆直交変換部３０４は、この復号残差データを、演算部３０５に供給する。また、演算部３０５には、予測画像選択部３１２を介して、イントラ予測部３１０若しくはインター予測部３１１から予測画像の画像データが供給される。

演算部３０５は、この復号残差データと予測画像の画像データとを用いて、差分画像と予測画像とを加算した再構成画像の画像データを得る。この再構成画像は、演算部１０３により予測画像が減算される前の入力画像に対応する。演算部３０５は、その再構成画像をループフィルタ３０６およびイントラ予測部３１０に供給する。

ループフィルタ３０６は、供給された再構成画像に対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜施して復号画像を生成する。例えば、ループフィルタ３０６は、再構成画像に対してデブロックフィルタ処理を行うことにより、ブロック歪を除去する。また、例えば、ループフィルタ３０６は、そのデブロックフィルタ処理結果（ブロック歪みの除去が行われた再構成画像）に対して、ウィナーフィルタ（Wiener Filter）を用いてループフィルタ処理を行うことにより画質改善を行う。

なお、ループフィルタ３０６が行うフィルタ処理の種類は任意であり、上述した以外のフィルタ処理を行ってもよい。また、ループフィルタ３０６が、画像符号化装置から供給されたフィルタ係数を用いてフィルタ処理を行うようにしてもよい。

ループフィルタ３０６は、フィルタ処理結果である復号画像を画面並べ替えバッファ３０７およびフレームメモリ３０９に供給する。

画面並べ替えバッファ３０７は、復号画像についてフレームの順番の並べ替えを行う。すなわち、画面並べ替えバッファ３０７は、画面並べ替えバッファ１０２により符号化順に並べ替えられた各フレームの画像を、元の表示順に並べ替える。つまり、画面並べ替えバッファ３０７は、符号化順に供給される各フレームの復号画像の画像データを、その順に記憶し、符号化順に記憶した各フレームの復号画像の画像データを、表示順に読み出してD/A変換部３０８に供給する。D/A変換部３０８は、画面並べ替えバッファ３０７から供給された各フレームの復号画像（デジタルデータ）をD/A変換し、アナログデータとして、図示せぬディスプレイに出力し、表示させる。

フレームメモリ３０９は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、インター予測部３１１等の外部の要求に基づいて、記憶している復号画像を参照画像として、インター予測部３１１に供給する。

イントラ予測部３１０には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部３０２から適宜供給される。イントラ予測部３１０は、イントラ予測部１１３において用いられたイントラ予測モード（最適イントラ予測モード）でイントラ予測を行い、予測画像を生成する。その際、イントラ予測部３１０は、演算部３０５から供給される再構成画像の画像データを用いてイントラ予測を行う。すなわち、イントラ予測部３１０は、この再構成画像を参照画像（周辺画素）として利用する。イントラ予測部３１０は、生成した予測画像を予測画像選択部３１２に供給する。

インター予測部３１１は、ヘッダ情報を復号して得られた情報（最適予測モード情報、参照画像情報等）を可逆復号部３０２から取得する。

インター予測部３１１は、可逆復号部３０２から取得された最適予測モード情報が示すインター予測モード（最適インター予測モード）で、フレームメモリ３０９から取得した参照画像を用いてインター予測を行い、予測画像を生成する。

予測画像選択部３１２は、イントラ予測部３１０からの予測画像またはインター予測部３１１からの予測画像を、演算部３０５に供給する。そして、演算部３０５においては、その予測画像と逆直交変換部３０４からの復号残差データ（差分画像情報）とが加算されて再構成画像が得られる。

画像復号装置３００は、さらに、プロファイル判定部３２１を有する。

プロファイル判定部３２１は、可逆復号部３０２から、符号化側（例えば画像符号化装置１００や画像符号化装置２００）から伝送された符号化データ（ビットストリーム）に含まれる、その符号化データのプロファイルに関する情報を取得し、その情報に基づいて、符号化側（例えば画像符号化装置１００や画像符号化装置２００）において設定されたプロファイルを判定する。

例えば、プロファイル判定部３２１は、静止画像用のプロファイル（例えば、スティルピクチャプロファイル（Still Picture Profile））が設定されているか否かを判定する。

プロファイル判定部３２１は、その判定結果を可逆復号部３０２に供給する。可逆復号部３０２は、プロファイル判定部３２１から供給されるプロファイルの判定結果に従って、符号化データの復号を行う。例えば、プロファイル判定部３２１により、静止画像用のプロファイル（例えば、スティルピクチャプロファイル（Still Picture Profile））が設定されていると判定された場合、可逆復号部３０２は、画像間の処理に関するシンタクス要素を、値が制限された状態で解析する。このシンタクス要素の値の制限の仕方の具体例は、＜０．概要＞において上述した通りである。

＜可逆復号部＞
図３５は、図３４の可逆復号部３０２の、シンタクス要素解析に関する主な構成例を示すブロック図である。図３５に示されるように可逆復号部３０２は、復号部３３１およびシンタクス要素解析部３３２を有する。

復号部３３１は、蓄積バッファ３０１から供給される符号化データを復号する。復号部３３１は、例えば、符号化データを復号して得られた、プロファイルに関する情報をプロファイル判定部３２１に供給する。

プロファイル判定部３２１は、上述したように、設定されたプロファイルを判定し、そのプロファイルを指定する情報をシンタクス要素解析部３３２に供給する。

また、復号部３３１は、例えば、符号化データを復号して得られた、量子化された直交変換係数を逆量子化部３０３に供給する。さらに、復号部３３１は、例えば、符号化データを復号して得られたシンタクス要素をシンタクス要素解析部３３２に供給する。

シンタクス要素解析部３３２は、復号部３３１から供給される各種シンタクスを解析し、その解析結果に従って、例えばイントラ予測部３１０やインター予測部３１１等、画像復号装置３００の各処理部の動作を制御する。

シンタクス要素解析部３３２は、プロファイル判定部３２１から供給される判定結果に従って、このシンタクス要素の解析を行う。例えば、静止画像用のプロファイル（例えば、スティルピクチャプロファイル（Still Picture Profile））が設定されていると判定された場合、シンタクス要素解析部３３２は、画像間の処理に関するシンタクス要素を、値が制限された状態で解析する。このシンタクス要素の値の制限の仕方の具体例は、＜０．概要＞において上述した通りである。

このようにすることにより、シンタクス要素解析部３３２は、設定されたプロファイルに応じて、不要なシンタクス要素の解析を省略することができる（シンタクス要素を読み飛ばすことができる）。つまり、画像復号装置３００は、復号対象の符号化データに不要な情報が含まれる場合であっても、設定されたプロファイルに応じて、その不要な情報を適宜読み飛ばすことができ、復号処理の不要な負荷の増大を抑制することができる。

また、画像復号装置３００は、１の回路で、静止画像の符号化データと動画像の符号化データの両方を復号することができる。

＜復号処理の流れ＞
次に、図３６および図３７のフローチャートを参照して、以上のような画像復号装置３００により実行される復号処理の流れの例を説明する。

復号処理が開始されると、ステップＳ３０１において、可逆復号部３０２は、プロファイルを復号する。

ステップＳ３０２において、プロファイル判定部３２１は、ステップＳ３０１において復号されたプロファイルに基づいて、符号化データに設定されているプロファイルが静止画像用のプロファイルであるか否かを判定する。動画像用のプロファイルが設定されていると判定された場合、処理は、ステップＳ３０３に進み、以下のように、動画像の符号化データを復号する各種処理（ステップＳ３０３乃至ステップＳ３１３の各ステップの処理）が行われる。

ステップＳ３０３において、可逆復号部３０２のシンタクス要素解析部３３２は、符号化データから得られたシンタクス要素を解析し、復号に使用される各種パラメータ等をセットする。

ステップＳ３０４において、蓄積バッファ３０１は、伝送されてきたビットストリーム（符号化データ）を蓄積する。ステップＳ３０５において、可逆復号部３０２は、蓄積バッファ３０１から供給されるビットストリーム（符号化データ）を復号する。すなわち、可逆符号化部１０６により符号化されたＩピクチャ、Ｐピクチャ、並びにＢピクチャ等の画像データが復号される。このとき、ヘッダ情報などのビットストリームに含められた画像データ以外の各種情報も復号される。

ステップＳ３０６において、逆量子化部３０３は、ステップＳ３０５の処理により得られた、量子化された係数を逆量子化する。

ステップＳ３０７において、逆直交変換部３０４は、ステップＳ３０６において逆量子化された係数を逆直交変換する。

ステップＳ３０８において、イントラ予測部３１０若しくはインター予測部３１１は、予測処理を行い、予測画像を生成する。つまり、可逆復号部３０２において判定された、符号化の際に適用された予測モードで予測処理が行われる。より具体的には、例えば、符号化の際にイントラ予測が適用された場合、イントラ予測部３１０が、符号化の際に最適とされたイントラ予測モードで予測画像を生成する。また、例えば、符号化の際にインター予測が適用された場合、インター予測部３１１が、符号化の際に最適とされたインター予測モードで予測画像を生成する。

ステップＳ３０９において、演算部３０５は、ステップＳ３０７において逆直交変換されて得られた差分画像に、ステップＳ３０８において生成された予測画像を加算する。これにより再構成画像の画像データが得られる。

ステップＳ３１０において、ループフィルタ３０６は、ステップＳ３０９の処理により得られた再構成画像の画像データに対して、デブロックフィルタ処理や適応ループフィルタ処理等を含むループフィルタ処理を適宜行う。

ステップＳ３１１において、画面並べ替えバッファ３０７は、ステップＳ３１０においてフィルタ処理された再構成画像の各フレームの並べ替えを行う。すなわち、符号化の際に並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。

ステップＳ３１２において、D/A変換部３０８は、ステップＳ３１１においてフレームの順序が並べ替えられた画像をD/A変換する。この画像が図示せぬディスプレイに出力され、画像が表示される。

ステップＳ３１３において、フレームメモリ３０９は、ステップＳ３１０においてフィルタ処理された画像を記憶する。

ステップＳ３１３の処理が終了すると、復号処理が終了する。

また、ステップＳ３０２において、静止画像用のプロファイル（静止画像の画像データを符号化するのに適したプロファイル）が設定されていると判定された場合、処理は、図３７のステップＳ３２１に進む。

この場合、ステップＳ３２１乃至ステップＳ３３１の各ステップにおいて、入力された静止画像の画像データに対して、図３６の各ステップにおいて行われた動画像に対する処理と同様の処理が実行される。

つまり、図３７のステップＳ３２１乃至ステップＳ３３１の各処理は、図３６のステップＳ３０３乃至ステップＳ３１３の各処理に対応する。

ただし、静止画像の画像データを符号化する場合、画像データに時間の概念が存在しない（ピクチャが複数存在しない）ので、ステップＳ３２６においては、イントラ予測によって予測画像が生成される。

また、ステップＳ３２１の処理においては、画像間の処理に関するシンタクス要素の値が制限された状態でシンタクス要素の解析が行われる。この処理の詳細については後述する。

ステップＳ３３１の処理が終了すると、復号処理が終了する。

＜シンタクス要素解析処理の流れ＞
次に、図３８のフローチャートを参照して、図３７のステップＳ３２１において実行されるシンタクス要素解析処理の流れの例を説明する。

シンタクス要素解析処理が開始されると、シンタクス要素解析部３３２は、ステップＳ３５１において、ビデオパラメータセット（VPS）のサブレイヤに関するパラメータvps_max_sub_layers_minus1と、シーケンスパラメータセット（SPS）のサブレイヤに関するパラメータsps_max_sub_layers_minus1とが０であると判定する。

ステップＳ３５２において、シンタクス要素解析部３３２は、プロファイルティアレベル（profile_tier_level()）のシンタクス要素general_profile_idcが、スティルピクチャプロファイル（Still Picture Profile）を示す値であると判定する。

ステップＳ３５３において、シンタクス要素解析部３３２は、プロファイルティアレベル（profile_tier_level()）のその他のシンタクス要素を判定する。

ステップＳ３５４において、シンタクス要素解析部３３２は、ビデオパラメータセット（VPS）の仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値が０であると判定する。

ステップＳ３５５において、シンタクス要素解析部３３２は、シーケンスパラメータセット（SPS）のＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flagの値が０であると判定する。

ステップＳ３５６において、シンタクス要素解析部３３２は、シーケンスパラメータセット（SPS）のショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値が０であると判定する。

ステップＳ３５７において、シンタクス要素解析部３３２は、シーケンスパラメータセット（SPS）のロングタームに関するシンタクス要素long_term_ref_pics_present_flagの値が０であると判定する。

ステップＳ３５８において、シンタクス要素解析部３３２は、シーケンスパラメータセット（SPS）の動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flagの値が０であると判定する。

ステップＳ３５９において、シンタクス要素解析部３３２は、ピクチャパラメータセット（PPS）のL0に関するシンタクス要素num_ref_idx_l0_default_active minus1、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1の値が、ともに０若しくは１であると判定する。

ステップＳ３６０において、シンタクス要素解析部３３２は、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素lists_modification_present_flagの値が０であると判定する。

ステップＳ３６１において、シンタクス要素解析部３３２は、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2の値が０であると判定する。

ステップＳ３６２において、シンタクス要素解析部３３２は、スケーリングリスト（scaling_list_data()）の予測モードに関するシンタクス要素scaling_list_pred_mode_flagの値が０であると判定し、スケーリングリスト（scaling_list_data()）の予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値が０若しくは１であると判定する。

ステップＳ３６３において、シンタクス要素解析部３３２は、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_typeの値がＩスライスを示す値であると判定する。

ステップＳ３６４において、シンタクス要素解析部３３２は、VCLに対するナルユニットタイプ（nal_unit_type）が、IDR_W_LP若しくはIDR_N_LPであると判定する。

ステップＳ３６５において、シンタクス要素解析部３３２は、その他のシンタクス要素を判定する。例えば、シンタクス要素解析部３３２は、ステップＳ３６５において、ピクチャパラメータセット（PPS）の、Ｐスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_pred_flagやＢスライスの重み付け予測に関するシンタクス要素（フラグ）weighted_bipred_flagの値が０であると判定してもよい。ステップＳ３６５の処理が終了すると、処理は、図３７に戻る。

もちろん、上述した各ステップの処理順は、任意であり、各ステップの処理順を入れ替えてもよいし、複数ステップの処理を並行して実行するようにしてもよい。特に、＜０－１＞乃至＜０－３＞において上述したように、ステップＳ３５１乃至ステップＳ３５３の処理順は任意である。

また、上述した各シンタクス要素の値の制限は互いに独立しているので、上述したシンタクス要素群の全ての値を制限した状態で解析しなければならないわけではなく、一部のシンタクス要素のみ値を制限した状態で解析するようにしてもよい。つまり、図３８のシンタクス要素解析処理において上述した各ステップのうち、一部のステップの処理のみを実行するようにしてもよい。

さらに、値を制限するシンタクス要素は、上述した例に限らないので、図３８のシンタクス要素解析処理においても、上述していないシンタクス要素の値を制限した状態で解析する処理を追加するようにしてもよい。

以上のように各処理を実行することにより、画像復号装置３００は、静止画像を符号化するためのプロファイルにより符号化された符号化データを復号する際の、不要な負荷の増大を抑制することができる。

  ＜４．第４の実施の形態＞
    ＜画像復号装置＞
  なお、画像復号装置が、符号化データを復号する際に、その符号化データにおいて、設定されたプロファイルに対してシンタクスの値の設定が正しく行われているか否かを検査するようにしてもよい。

図３９は、その場合の、本技術を適用した画像処理装置の一態様である画像復号装置の構成の一例を示すブロック図である。図３９に示される画像復号装置４００は、画像復号装置３００と同様に、画像符号化装置１００や画像符号化装置２００に対応する画像復号装置であり、例えば、HEVCの予測処理、またはそれに準ずる方式の予測処理を用いて動画像および静止画像の画像データが符号化された符号化データを復号する。

画像復号装置４００は、画像復号装置３００と基本的に同様の構成を有し、同様の処理を行う。ただし、画像復号装置４００は、画像復号装置３００の構成に加え、異常処理部４１１を有する。

可逆復号部３０２は、プロファイル判定部３２１により判定されたプロファイルに対して、シンタクス要素が正しく設定されているか否かを検査する。その検査において異常が検出された場合、すなわち、不要なシンタクス要素が設定される等、シンタクス要素の設定が正しく無い場合、その旨を異常処理部４１１に通知する。

異常処理部４１１は、可逆復号部３０２から異常の発生を通知された場合、予め定められた異常処理を行う。例えば、異常処理部４１１は、モニタに警告画像を表示したり、スピーカ等から警告音声を出力したりする。この異常処理の内容は任意である。例えば、異常処理部４１１が、安全の為、画像復号装置４００の各部を制御して、復号処理を停止させたり、強制終了させたりするようにしてもよい。

＜可逆復号部＞
図４０は、図３９の可逆復号部３０２の、シンタクス要素解析に関する主な構成例を示すブロック図である。図４０に示されるように、この場合の可逆復号部３０２は、図３５の構成に加え、シンタクス要素検査部４２１を有する。

プロファイル判定部３２１は、上述したように、復号部３３１から供給される情報に基づいて、設定されたプロファイルを判定し、そのプロファイルを指定する情報をシンタクス要素検査部４２１に供給する。

また、復号部３３１は、符号化データを復号して得られたシンタクス要素をシンタクス要素検査部４２１に供給する。

シンタクス要素検査部４２１は、プロファイル判定部３２１から供給される判定結果に従って、復号部３３１から供給される各種シンタクス要素の値を検査する。シンタクス要素が正常であれば、シンタクス要素検査部４２１は、その検査済みのシンタクス要素をシンタクス要素解析部３３２に供給する。

また、シンタクス要素の検査において異常が検知された場合、例えば、不正なシンタクス要素が設定されていたり、シンタクス要素に不正な値が設定されていたりした場合、シンタクス要素検査部４２１は、その旨を異常処理部４１１に通知する。

異常処理部４１１は、上述したように、その通知に従って異常処理を行う。

このようにすることにより、画像復号装置４００は、シンタクス要素の設定の不正を検出することができ、より安全に復号処理を行うことができる。また、画像復号装置４００は、符号化データの検査・解析に利用することができる。つまり、画像復号装置４００を符号化データのアナライザとして利用し、必要に応じて、符号化データの再作成等を促すこともできる。

また、画像復号装置４００は、１の回路で、静止画像の符号化データと動画像の符号化データの両方を復号することができる。

＜符号化処理の流れ＞
次に、図４１および図４２のフローチャートを参照して、画像復号装置４００により実行される、その場合の、復号処理の流れの例を説明する。

復号処理が開始されると、画像復号装置４００は、図４１のステップＳ４０１乃至ステップＳ４１３において、図３６のステップＳ３０１乃至ステップＳ３１３の各ステップと同様の処理を実行する。ステップＳ４１３の処理が終了すると、復号処理が終了する。

また、ステップＳ４０２において、静止画像用のプロファイルが設定されたと判定された場合、処理は、図４２のステップＳ４２１に進む。

図４２のステップＳ４２１において、可逆復号部３０２のシンタクス要素検査部４２１は、静止画像用のプロファイルによる制限に基づいて、シンタクス要素を検査する。

ステップＳ４２２において、シンタクス要素検査部４２１は、ステップＳ４２１の検査結果に基づいて、シンタクス要素に違反があるか否かを判定する。違反がないと判定された場合、処理は、ステップＳ４２３に進む。

図４２のステップＳ４２３乃至ステップＳ４３３の各ステップにおいては、図３７のステップＳ３２１乃至ステップＳ３３１の各ステップと同様の処理が実行される。ステップＳ４３３の処理が終了すると、復号処理が終了する。

また、図４２のステップＳ４２２において、違反があると判定された場合、処理は、ステップＳ４３４に進む。

ステップＳ４３４において、異常処理部４１１は、異常処理を行う。ステップＳ４３４の処理が終了すると、復号処理が終了する。

＜シンタクス要素解析処理の流れ＞
次に、図４３のフローチャートを参照して、図４２のステップＳ４２１において実行されるシンタクス要素検査処理の流れの例を説明する。

シンタクス要素検査処理が開始されると、シンタクス要素検査部４２１は、ステップＳ４５１において、ビデオパラメータセット（VPS）のサブレイヤに関するパラメータvps_max_sub_layers_minus1と、シーケンスパラメータセット（SPS）のサブレイヤに関するパラメータsps_max_sub_layers_minus1とが０であるか否かを判定する。判定結果が真の場合、すなわち、ビデオパラメータセット（VPS）のサブレイヤに関するパラメータvps_max_sub_layers_minus1と、シーケンスパラメータセット（SPS）のサブレイヤに関するパラメータsps_max_sub_layers_minus1とが０であると判定された場合、処理は、ステップＳ４５２に進む。

ステップＳ４５２において、シンタクス要素検査部４２１は、プロファイルティアレベル（profile_tier_level()）のシンタクス要素general_profile_idcが、スティルピクチャプロファイル（Still Picture Profile）を示す値であるか否かを判定する。判定結果が真の場合、すなわち、プロファイルティアレベル（profile_tier_level()）のシンタクス要素general_profile_idcが、スティルピクチャプロファイル（Still Picture Profile）を示す値であると判定された場合、処理はステップＳ４５３に進む。

ステップＳ４５３において、シンタクス要素検査部４２１は、ビデオパラメータセット（VPS）の仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値が０であるか否かを判定する。判定結果が真の場合、すなわち、ビデオパラメータセット（VPS）の仮想参照デコーダに関するシンタクス要素vps_num_hrd_parametersの値が０であると判定された場合、処理はステップＳ４５４に進む。

ステップＳ４５４において、シンタクス要素検査部４２１は、シーケンスパラメータセット（SPS）のＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flagの値が０であるか否かを判定する。判定結果が真の場合、すなわち、シーケンスパラメータセット（SPS）のＰスライスやＢスライスに関するシンタクス要素restricted_ref_pic_lists_flagの値が０であると判定された場合、処理はステップＳ４５５に進む。

ステップＳ４５５において、シンタクス要素検査部４２１は、シーケンスパラメータセット（SPS）のショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値が０であるか否かを判定する。判定結果が真の場合、すなわち、シーケンスパラメータセット（SPS）のショートタームに関するシンタクス要素num_short_term_ref_pic_setsの値が０であると判定された場合、処理はステップＳ４５６に進む。

ステップＳ４５６において、シンタクス要素検査部４２１は、シーケンスパラメータセット（SPS）のロングタームに関するシンタクス要素long_term_ref_pics_present_flagの値が０であるか否かを判定する。判定結果が真の場合、すなわち、シーケンスパラメータセット（SPS）のロングタームに関するシンタクス要素long_term_ref_pics_present_flagの値が０であると判定された場合、処理はステップＳ４５７に進む。

ステップＳ４５７において、シンタクス要素検査部４２１は、シーケンスパラメータセット（SPS）の動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flagの値が０であるか否かを判定する。判定結果が真の場合、すなわち、シーケンスパラメータセット（SPS）の動きベクトルに関するシンタクス要素sps_temporal_mvp_enable_flagの値が０であると判定された場合、処理はステップＳ４５８に進む。

ステップＳ４５８において、シンタクス要素検査部４２１は、ピクチャパラメータセット（PPS）のL0に関するシンタクス要素num_ref_idx_l0_default_active minus1、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1の値が、ともに０若しくは１であるか否かを判定する。判定結果が真の場合、すなわち、ピクチャパラメータセット（PPS）のL0に関するシンタクス要素num_ref_idx_l0_default_active minus1、および、L1に関するシンタクス要素num_ref_idx_l1_default_active minus1の値が、ともに０若しくは１であると判定された場合、処理はステップＳ４５９に進む。

ステップＳ４５９において、シンタクス要素検査部４２１は、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素lists_modification_present_flagの値が０であるか否かを判定する。判定結果が真の場合、すなわち、ピクチャパラメータセット（PPS）の、シンタクス要素ref_pic_list_modificationがカレントスライスヘッダに存在するか否かを示すシンタクス要素lists_modification_present_flagの値が０であると判定された場合、処理はステップＳ４６０に進む。

ステップＳ４６０において、シンタクス要素検査部４２１は、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2の値が０であるか否かを判定する。判定結果が真の場合、すなわち、ピクチャパラメータセット（PPS）の、予測処理におけるマージモードやスキップモードの並列処理レベルを指定するシンタクス要素log2_parallel_merge_level_minus2の値が０であると判定された場合、処理はステップＳ４６１に進む。

ステップＳ４６１において、シンタクス要素検査部４２１は、スケーリングリスト（scaling_list_data()）の予測モードに関するシンタクス要素scaling_list_pred_mode_flagの値が０であり、スケーリングリスト（scaling_list_data()）の予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値が０若しくは１であるか否かを判定する。判定結果が真の場合、すなわち、スケーリングリスト（scaling_list_data()）の予測モードに関するシンタクス要素scaling_list_pred_mode_flagの値が０であり、スケーリングリスト（scaling_list_data()）の予測行列に関するシンタクス要素scaling_list_pred_matrix_id_deltaの値が０若しくは１であると判定された場合、処理はステップＳ４６２に進む。

ステップＳ４６２において、シンタクス要素検査部４２１は、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_typeの値がＩスライスを示す値であるか否かを判定する。判定結果が真の場合、すなわち、スライスヘッダ（slice_header()）の、スライスタイプに関するシンタクス要素slice_typeの値がＩスライスを示す値であると判定された場合、処理はステップＳ４６３に進む。

ステップＳ４６３において、シンタクス要素検査部４２１は、VCLに対するナルユニットタイプ（nal_unit_type）が、IDR_W_LP若しくはIDR_N_LPであるか否かを判定する。判定結果が真の場合、すなわち、VCLに対するナルユニットタイプ（nal_unit_type）が、IDR_W_LP若しくはIDR_N_LPであると判定された場合、処理はステップＳ４６４に進む。

ステップＳ４６４において、シンタクス要素検査部４２１は、シンタクス要素が正常であると判定する。ステップＳ４６４の処理が終了すると、シンタクス要素検査処理が終了し、処理は、図４２に戻る。

また、図４３のステップＳ４５１乃至ステップＳ４６３のいずれかにおいて、判定結果が偽であると判定された場合、処理はステップＳ４６５に進む。

ステップＳ４６５において、シンタクス要素検査部４２１は、シンタクス要素が異常であると判定する。ステップＳ４６５の処理が終了すると、シンタクス要素検査処理が終了し、処理は、図４２に戻る。

もちろん、上述した各ステップの処理順は、任意であり、各ステップの処理順を入れ替えてもよいし、複数ステップの処理を並行して実行するようにしてもよい。

また、上述した各検査の条件（各シンタクス要素の値の制限）は互いに独立しているので、上述したシンタクス要素群を全て検査しなければならないわけではなく、一部のシンタクス要素のみ検査するようにしてもよい。つまり、図４３のシンタクス要素検査処理において上述した各ステップのうち、一部のステップの処理のみを実行するようにしてもよい。

さらに、上述した例に含まれていないシンタクス要素の検査を追加するようにしてもよい。

以上のように各処理を実行することにより、画像復号装置４００は、シンタクス要素の設定の不正を検出することができ、より安全に復号処理を行うことができる。

以上のように、本技術の適用範囲は、画像を符号化・復号するあらゆる画像符号化装置及び画像復号装置に適用することができる。

また、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれるイントラ予測装置にも適用することができる。

  ＜５．第５の実施の形態＞
    ＜多視点画像符号化・多視点画像復号への適用＞
  上述した一連の処理は、多視点画像符号化・多視点画像復号に適用することができる。図４４は、多視点画像符号化方式の一例を示す。

図４４に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの画像を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの画像を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューは、ベースビューの画像を利用するようにしても良いし、他のノンベースビューの画像を利用するようにしてもよい。

図４４のような多視点画像を符号化・復号する場合、各ビューの画像を符号化・復号するが、この各ビューの符号化・復号に対して、第１の実施の形態乃至第４の実施の形態において上述した方法を適用するようにしてもよい。このようにすることにより、各ビューの符号化効率の低減を抑制することができる。

さらに、各ビューの符号化・復号において、第１の実施の形態乃至第４の実施の形態において上述した方法において使用されるフラグやパラメータを共有するようにしてもよい。このようにすることにより、冗長な情報の伝送を抑制し、伝送する情報量（符号量）を低減することができる（つまり、符号化効率の低減を抑制することができる）。

より具体的には、例えば、シーケンスパラメータセット、プロファイルティアレベル、ピクチャパラメータセット、スライスヘッダのシンタクス要素等を、各ビューの符号化・復号において共有するようにしてもよい。

もちろん、これら以外の必要な情報も、各ビューの符号化・復号において共有するようにしてもよい。

＜多視点画像符号化装置＞
図４５は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図４５に示されるように、多視点画像符号化装置６００は、符号化部６０１、符号化部６０２、および多重化部６０３を有する。

符号化部６０１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部６０２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部６０３は、符号化部６０１において生成されたベースビュー画像符号化ストリームと、符号化部６０２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

この多視点画像符号化装置６００の符号化部６０１および符号化部６０２に対して、画像符号化装置１００（図２５）や画像符号化装置２００（図３１）を適用することができる。つまり、各ビューに対する符号化において、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限することができ、各ビューの符号化効率の低減を抑制することができる。また、符号化部６０１および符号化部６０２は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、符号化を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

＜多視点画像復号装置＞
図４６は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図４６に示されるように、多視点画像復号装置６１０は、逆多重化部６１１、復号部６１２、および復号部６１３を有する。

逆多重化部６１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部６１２は、逆多重化部６１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部６１３は、逆多重化部６１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

この多視点画像復号装置６１０の復号部６１２および復号部６１３に対して、画像復号装置３００（図３４）や画像復号装置４００（図３９）を適用することができる。つまり、各ビューに対する復号において、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、受け取られた画像間の処理に関するシンタクス要素を、値が制限された状態で解析することができる。また、復号部６１２および復号部６１３は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、復号を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

  ＜６．第６の実施の形態＞
    ＜階層画像符号化・階層画像復号への適用＞
  上述した一連の処理は、階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）に適用することができる。図４７は、階層画像符号化方式の一例を示す。

階層画像符号化（スケーラブル符号化）は、画像データを、所定のパラメータについてスケーラビリティ（scalability）機能を有するように、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化するものである。階層画像復号は、その階層画像符号化（スケーラブル復号）は、その階層画像符号化に対応する復号である。

図４７に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として１の画像が複数の画像（レイヤ）に分割される。つまり、階層化された画像（階層画像）は、その所定のパラメータの値が互いに異なる複数の階層（レイヤ）の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ（エンハンスメントレイヤとも称する）とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。

一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ（差分データ）により構成される。例えば、１の画像をベースレイヤとノンベースレイヤ（エンハンスメントレイヤとも称する）に２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

図４７の例のような階層画像を符号化・復号する場合、各レイヤの画像を符号化・復号するが、この各レイヤの符号化・復号に対して、第１の実施の形態乃至第４の実施の形態において上述した方法を適用するようにしてもよい。このようにすることにより、各レイヤの符号化効率の低減を抑制することができる。

さらに、各レイヤの符号化・復号において、第１の実施の形態乃至第４の実施の形態において上述した方法において使用されるフラグやパラメータを共有するようにしてもよい。このようにすることにより、冗長な情報の伝送を抑制し、伝送する情報量（符号量）を低減することができる（つまり、符号化効率の低減を抑制することができる）。

より具体的には、例えば、シーケンスパラメータセット、プロファイルティアレベル、ピクチャパラメータセット、スライスヘッダのシンタクス要素等を、各レイヤの符号化・復号において共有するようにしてもよい。

もちろん、これら以外の必要な情報も、各レイヤの符号化・復号において共有するようにしてもよい。

＜スケーラブルなパラメータ＞
このような階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）において、スケーラビリティ（scalability）機能を有するパラメータは、任意である。例えば、図４８に示されるような空間解像度をそのパラメータとしてもよい（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に画像の解像度が異なる。つまり、図４８に示されるように、各ピクチャが、元の画像より空間的に低解像度のベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元の空間解像度）が得られるエンハンスメントレイヤの２階層に階層化される。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、図４９に示されるような、時間解像度を適用しても良い（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。つまり、この場合、図４９に示されるように、互いに異なるフレームレートのレイヤに階層化されており、低フレームレートのレイヤに、高フレームレートのレイヤを加えることで、より高フレームレートの動画像を得ることができ、全てのレイヤを加えることで、元の動画像（元のフレームレート）を得ることができる。この階層数は一例であり、任意の階層数に階層化することができる。

さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比（SNR（Signal to Noise ratio））を適用しても良い（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。つまり、図５０に示されるように、各ピクチャが、元の画像よりSNRの低いベースレイヤと、ベースレイヤの画像と合成することにより元の画像（元のSNR）が得られるエンハンスメントレイヤの２階層に階層化される。すなわち、ベースレイヤ（base layer）画像圧縮情報においては、低PSNRの画像に関する情報が伝送されており、これに、エンハンスメントレイヤ（enhancement layer）画像圧縮情報を加えることで、高PSNR画像を再構築することが可能である。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が８ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜階層画像符号化装置＞
図５１は、上述した階層画像符号化を行う階層画像符号化装置を示す図である。図５１に示されるように、階層画像符号化装置６２０は、符号化部６２１、符号化部６２２、および多重化部６２３を有する。

符号化部６２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部６２２は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部６２３は、符号化部６２１において生成されたベースレイヤ画像符号化ストリームと、符号化部６２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

この階層画像符号化装置６２０の符号化部６２１および符号化部６２２に対して、画像符号化装置１００（図２５）や画像符号化装置２００（図３１）を適用することができる。つまり、各レイヤに対する符号化において、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限することができ、各レイヤの符号化効率の低減を抑制することができる。また、符号化部６２１および符号化部６２２は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、イントラ予測のフィルタ処理の制御等を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

＜階層画像復号装置＞
図５２は、上述した階層画像復号を行う階層画像復号装置を示す図である。図５２に示されるように、階層画像復号装置６３０は、逆多重化部６３１、復号部６３２、および復号部６３３を有する。

逆多重化部６３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部６３２は、逆多重化部６３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部６３３は、逆多重化部６３１により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。

この階層画像復号装置６３０の復号部６３２および復号部６３３に対して、画像復号装置３００（図３４）や画像復号装置４００（図３９）を適用することができる。つまり、各レイヤに対する復号において、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、受け取られた画像間の処理に関するシンタクス要素を、値が制限された状態で解析することができ、各レイヤの符号化効率の低減を抑制することができる。また、復号部６１２および復号部６１３は、互いに同一のフラグやパラメータ（例えば、画像間の処理に関するシンタクス要素等）を用いて、復号を行うことができる（すなわち、フラグやパラメータを共有することができる）ので、符号化効率の低減を抑制することができる。

また、本技術は、例えば、MPEG、H．26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報（ビットストリーム）を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して受信する際に用いられる画像符号化装置および画像復号装置に適用することができる。また、本技術は、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる画像符号化装置および画像復号装置に適用することができる。さらに、本技術は、それらの画像符号化装置および画像復号装置などに含まれる量子化装置若しくは逆量子化装置にも適用することができる。

  ＜７．第７の実施の形態＞
    ＜コンピュータ＞
  上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図５３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図５３に示されるコンピュータ８００において、CPU（Central Processing Unit）８０１、ROM（Read Only Memory）８０２、RAM（Random Access Memory）８０３は、バス８０４を介して相互に接続されている。

バス８０４にはまた、入出力インタフェース８１０も接続されている。入出力インタフェース８１０には、入力部８１１、出力部８１２、記憶部８１３、通信部８１４、およびドライブ８１５が接続されている。

入力部８１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部８１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部８１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部８１４は、例えば、ネットワークインタフェースよりなる。ドライブ８１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア８２１を駆動する。

以上のように構成されるコンピュータでは、CPU８０１が、例えば、記憶部８１３に記憶されているプログラムを、入出力インタフェース８１０およびバス８０４を介して、RAM８０３にロードして実行することにより、上述した一連の処理が行われる。RAM８０３にはまた、CPU８０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

コンピュータ（CPU８０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して適用することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア８２１をドライブ８１５に装着することにより、入出力インタフェース８１０を介して、記憶部８１３にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部８１４で受信し、記憶部８１３にインストールすることができる。その他、プログラムは、ROM８０２や記憶部８１３に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、以上において、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

上述した実施形態に係る画像符号化装置及び画像復号装置は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

  ＜８．応用例＞
    ＜第１の応用例：テレビジョン受像機＞
  図５４は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからEPG（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）など）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送部としての役割を有する。

制御部９１０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置３００（図３４）や画像復号装置４００（図３９）の機能を有する。それにより、テレビジョン装置９００での画像の復号に際して、符号化効率の低減を抑制することができる。

＜第２の応用例：携帯電話機＞
図５５は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号を、アンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１００（図２５）、画像符号化装置２００（図３１）、画像復号装置３００（図３４）、画像復号装置４００（図３９）等の機能を有する。それにより、携帯電話機９２０での画像の符号化及び復号に際して、符号化効率の低減を抑制することができる。

＜第３の応用例：記録再生装置＞
図５６は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、HDD（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、OSD（On-Screen Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送部としての役割を有する。

外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送部としての役割を有する。

エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

HDD９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラムおよびその他のデータを内部のハードディスクに記録する。また、HDD９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばDVDディスク（DVD-Video、DVD-RAM、DVD-R、DVD-RW、DVD+R、DVD+RW等）又はBlu-ray（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、HDD９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをOSD９４８へ出力する。また、デコーダ９４７は、生成した音声データを外部のスピーカへ出力する。

OSD９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、OSD９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。

制御部９４９は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１００（図２５）や画像符号化装置２００（図３１）等の機能を有する。また、デコーダ９４７は、上述した実施形態に係る、画像復号装置３００（図３４）や画像復号装置４００（図３９）等の機能を有する。それにより、記録再生装置９４０での画像の符号化及び復号に際して、符号化効率の低減を抑制することができる。

＜第４の応用例：撮像装置＞
図５７は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、OSD９６９、及び制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）などのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、OSD９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

OSD９６９は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース９６６は、例えばUSB入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送部としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る上述した実施形態に係る画像符号化装置１００（図２５）、画像符号化装置２００（図３１）、画像復号装置３００（図３４）、画像復号装置４００（図３９）等の機能を有する。それにより、撮像装置９６０での画像の符号化及び復号に際して、画質の低減を抑制することができる。

  ＜９．スケーラブル符号化の応用例＞
    ＜第１のシステム＞
  次に、スケーラブル符号化（階層（画像）符号化）されたスケーラブル符号化データの具体的な利用例について説明する。スケーラブル符号化は、例えば、図５８に示される例のように、伝送するデータの選択のために利用される。

図５８に示されるデータ伝送システム１０００において、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを読み出し、ネットワーク１００３を介して、パーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置に配信する。

その際、配信サーバ１００２は、端末装置の能力や通信環境等に応じて、適切な品質の符号化データを選択して伝送する。配信サーバ１００２が不要に高品質なデータを伝送しても、端末装置において高画質な画像を得られるとは限らず、遅延やオーバフローの発生要因となる恐れがある。また、不要に通信帯域を占有したり、端末装置の負荷を不要に増大させたりしてしまう恐れもある。逆に、配信サーバ１００２が不要に低品質なデータを伝送しても、端末装置において十分な画質の画像を得ることができない恐れがある。そのため、配信サーバ１００２は、スケーラブル符号化データ記憶部１００１に記憶されているスケーラブル符号化データを、適宜、端末装置の能力や通信環境等に対して適切な品質の符号化データとして読み出し、伝送する。

例えば、スケーラブル符号化データ記憶部１００１は、スケーラブルに符号化されたスケーラブル符号化データ（BL+EL）１０１１を記憶するとする。このスケーラブル符号化データ（BL+EL）１０１１は、ベースレイヤとエンハンスメントレイヤの両方を含む符号化データであり、復号することにより、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方を得ることができるデータである。

配信サーバ１００２は、データを伝送する端末装置の能力や通信環境等に応じて、適切なレイヤを選択し、そのレイヤのデータを読み出す。例えば、配信サーバ１００２は、処理能力の高いパーソナルコンピュータ１００４やタブレットデバイス１００６に対しては、高品質なスケーラブル符号化データ（BL+EL）１０１１をスケーラブル符号化データ記憶部１００１から読み出し、そのまま伝送する。これに対して、例えば、配信サーバ１００２は、処理能力の低いAV機器１００５や携帯電話機１００７に対しては、スケーラブル符号化データ（BL+EL）１０１１からベースレイヤのデータを抽出し、スケーラブル符号化データ（BL+EL）１０１１と同じコンテンツのデータであるが、スケーラブル符号化データ（BL+EL）１０１１よりも低品質なスケーラブル符号化データ（BL）１０１２として伝送する。

このようにスケーラブル符号化データを用いることにより、データ量を容易に調整することができるので、遅延やオーバフローの発生を抑制したり、端末装置や通信媒体の負荷の不要な増大を抑制したりすることができる。また、スケーラブル符号化データ（BL+EL）１０１１は、レイヤ間の冗長性が低減されているので、各レイヤの符号化データを個別のデータとする場合よりもそのデータ量を低減させることができる。したがって、スケーラブル符号化データ記憶部１００１の記憶領域をより効率よく使用することができる。

なお、パーソナルコンピュータ１００４乃至携帯電話機１００７のように、端末装置には様々な装置を適用することができるので、端末装置のハードウエアの性能は、装置によって異なる。また、端末装置が実行するアプリケーションも様々であるので、そのソフトウエアの能力も様々である。さらに、通信媒体となるネットワーク１００３も、例えばインターネットやLAN（Local Area Network）等、有線若しくは無線、またはその両方を含むあらゆる通信回線網を適用することができ、そのデータ伝送能力は様々である。さらに、他の通信等によっても変化する恐れがある。

そこで、配信サーバ１００２は、データ伝送を開始する前に、データの伝送先となる端末装置と通信を行い、端末装置のハードウエア性能や、端末装置が実行するアプリケーション（ソフトウエア）の性能等といった端末装置の能力に関する情報、並びに、ネットワーク１００３の利用可能帯域幅等の通信環境に関する情報を得るようにしてもよい。そして、配信サーバ１００２が、ここで得た情報を基に、適切なレイヤを選択するようにしてもよい。

なお、レイヤの抽出は、端末装置において行うようにしてもよい。例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１を復号し、ベースレイヤの画像を表示しても良いし、エンハンスメントレイヤの画像を表示しても良い。また、例えば、パーソナルコンピュータ１００４が、伝送されたスケーラブル符号化データ（BL+EL）１０１１から、ベースレイヤのスケーラブル符号化データ（BL）１０１２を抽出し、記憶したり、他の装置に転送したり、復号してベースレイヤの画像を表示したりするようにしてもよい。

もちろん、スケーラブル符号化データ記憶部１００１、配信サーバ１００２、ネットワーク１００３、および端末装置の数はいずれも任意である。また、以上においては、配信サーバ１００２がデータを端末装置に伝送する例について説明したが、利用例はこれに限定されない。データ伝送システム１０００は、スケーラブル符号化された符号化データを端末装置に伝送する際、端末装置の能力や通信環境等に応じて、適切なレイヤを選択して伝送するシステムであれば、任意のシステムに適用することができる。

そして、以上のような図５８のようなデータ伝送システム１０００においても、図４７乃至図５２を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図４７乃至図５２を参照して上述した効果と同様の効果を得ることができる。

＜第２のシステム＞
また、スケーラブル符号化は、例えば、図５９に示される例のように、複数の通信媒体を介する伝送のために利用される。

図５９に示されるデータ伝送システム１１００において、放送局１１０１は、地上波放送１１１１により、ベースレイヤのスケーラブル符号化データ（BL）１１２１を伝送する。また、放送局１１０１は、有線若しくは無線またはその両方の通信網よりなる任意のネットワーク１１１２を介して、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する（例えばパケット化して伝送する）。

端末装置１１０２は、放送局１１０１が放送する地上波放送１１１１の受信機能を有し、この地上波放送１１１１を介して伝送されるベースレイヤのスケーラブル符号化データ（BL）１１２１を受け取る。また、端末装置１１０２は、ネットワーク１１１２を介した通信を行う通信機能をさらに有し、このネットワーク１１１２を介して伝送されるエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を受け取る。

端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１を、復号してベースレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

また、端末装置１１０２は、例えばユーザ指示等に応じて、地上波放送１１１１を介して取得したベースレイヤのスケーラブル符号化データ（BL）１１２１と、ネットワーク１１１２を介して取得したエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２とを合成して、スケーラブル符号化データ（BL+EL）を得たり、それを復号してエンハンスメントレイヤの画像を得たり、記憶したり、他の装置に伝送したりする。

以上のように、スケーラブル符号化データは、例えばレイヤ毎に異なる通信媒体を介して伝送させることができる。したがって、負荷を分散させることができ、遅延やオーバフローの発生を抑制することができる。

また、状況に応じて、伝送に使用する通信媒体を、レイヤ毎に選択することができるようにしてもよい。例えば、データ量が比較的多いベースレイヤのスケーラブル符号化データ（BL）１１２１を帯域幅の広い通信媒体を介して伝送させ、データ量が比較的少ないエンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を帯域幅の狭い通信媒体を介して伝送させるようにしてもよい。また、例えば、エンハンスメントレイヤのスケーラブル符号化データ（EL）１１２２を伝送する通信媒体を、ネットワーク１１１２とするか、地上波放送１１１１とするかを、ネットワーク１１１２の利用可能帯域幅に応じて切り替えるようにしてもよい。もちろん、任意のレイヤのデータについて同様である。

このように制御することにより、データ伝送における負荷の増大を、より抑制することができる。

もちろん、レイヤ数は任意であり、伝送に利用する通信媒体の数も任意である。また、データ配信先となる端末装置１１０２の数も任意である。さらに、以上においては、放送局１１０１からの放送を例に説明したが、利用例はこれに限定されない。データ伝送システム１１００は、スケーラブル符号化された符号化データを、レイヤを単位として複数に分割し、複数の回線を介して伝送するシステムであれば、任意のシステムに適用することができる。

そして、以上のような図５９のようなデータ伝送システム１１００においても、図４７乃至図５２を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図４７乃至図５２を参照して上述した効果と同様の効果を得ることができる。

＜第３のシステム＞
また、スケーラブル符号化は、例えば、図６０に示される例のように、符号化データの記憶に利用される。

図６０に示される撮像システム１２００において、撮像装置１２０１は、被写体１２１１を撮像して得られた画像データをスケーラブル符号化し、スケーラブル符号化データ（BL+EL）１２２１として、スケーラブル符号化データ記憶装置１２０２に供給する。

スケーラブル符号化データ記憶装置１２０２は、撮像装置１２０１から供給されるスケーラブル符号化データ（BL+EL）１２２１を、状況に応じた品質で記憶する。例えば、通常時の場合、スケーラブル符号化データ記憶装置１２０２は、スケーラブル符号化データ（BL+EL）１２２１からベースレイヤのデータを抽出し、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２として記憶する。これに対して、例えば、注目時の場合、スケーラブル符号化データ記憶装置１２０２は、高品質でデータ量の多いスケーラブル符号化データ（BL+EL）１２２１のまま記憶する。

このようにすることにより、スケーラブル符号化データ記憶装置１２０２は、必要な場合のみ、画像を高画質に保存することができるので、画質劣化による画像の価値の低減を抑制しながら、データ量の増大を抑制することができ、記憶領域の利用効率を向上させることができる。

例えば、撮像装置１２０１が監視カメラであるとする。撮像画像に監視対象（例えば侵入者）が写っていない場合（通常時の場合）、撮像画像の内容は重要でない可能性が高いので、データ量の低減が優先され、その画像データ（スケーラブル符号化データ）は、低品質に記憶される。これに対して、撮像画像に監視対象が被写体１２１１として写っている場合（注目時の場合）、その撮像画像の内容は重要である可能性が高いので、画質が優先され、その画像データ（スケーラブル符号化データ）は、高品質に記憶される。

なお、通常時であるか注目時であるかは、例えば、スケーラブル符号化データ記憶装置１２０２が、画像を解析することにより判定しても良い。また、撮像装置１２０１が判定し、その判定結果をスケーラブル符号化データ記憶装置１２０２に伝送するようにしてもよい。

なお、通常時であるか注目時であるかの判定基準は任意であり、判定基準とする画像の内容は任意である。もちろん、画像の内容以外の条件を判定基準とすることもできる。例えば、収録した音声の大きさや波形等に応じて切り替えるようにしてもよいし、所定の時間毎に切り替えるようにしてもよいし、ユーザ指示等の外部からの指示によって切り替えるようにしてもよい。

また、以上においては、通常時と注目時の２つの状態を切り替える例を説明したが、状態の数は任意であり、例えば、通常時、やや注目時、注目時、非常に注目時等のように、３つ以上の状態を切り替えるようにしてもよい。ただし、この切り替える状態の上限数は、スケーラブル符号化データのレイヤ数に依存する。

また、撮像装置１２０１が、スケーラブル符号化のレイヤ数を、状態に応じて決定するようにしてもよい。例えば、通常時の場合、撮像装置１２０１が、低品質でデータ量の少ないベースレイヤのスケーラブル符号化データ（BL）１２２２を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。また、例えば、注目時の場合、撮像装置１２０１が、高品質でデータ量の多いベースレイヤのスケーラブル符号化データ（BL+EL）１２２１を生成し、スケーラブル符号化データ記憶装置１２０２に供給するようにしてもよい。

以上においては、監視カメラを例に説明したが、この撮像システム１２００の用途は任意であり、監視カメラに限定されない。

そして、以上の図６０のような撮像システム１２００においても、図４７乃至図５２を参照して上述した階層符号化・階層復号への適用と同様に本技術を適用することにより、図４７乃至図５２を参照して上述した効果と同様の効果を得ることができる。

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

  ＜１０．第８の実施の形態＞
    ＜実施のその他の例＞
  以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

＜ビデオセット＞
本技術をセットとして実施する場合の例について、図６１を参照して説明する。図６１は、本技術を適用したビデオセットの概略的な構成の一例を示している。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図６１に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図６１に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、およびセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図６１の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ１３３１、ビデオプロセッサ１３３２、ブロードバンドモデム１３３３、およびRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図６１のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（またはその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図６１において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図６１に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、および増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

＜ビデオプロセッサの構成例＞
図６２は、本技術を適用したビデオプロセッサ１３３２（図６１）の概略的な構成の一例を示している。

図６２の例の場合、ビデオプロセッサ１３３２は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。

図６２に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、およびメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａおよび１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａおよび１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、およびストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図６１）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１（図６１）等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、およびエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１（図６１）等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１（図６１）等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図６１）から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により（図６１）各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図６１）等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１（図６１）等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等（いずれも図６１）を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１（図６１）等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１（図６１）等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２または第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１（図６１）等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図６１）等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１（図６１）等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図６１）等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１（図６１）等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリームまたはファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した各実施形態に係る画像符号化装置や画像復号装置の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

＜ビデオプロセッサの他の構成例＞
図６３は、本技術を適用したビデオプロセッサ１３３２（図６１）の概略的な構成の他の例を示している。図６３の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能とを有する。

より具体的には、図６３に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、および内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、およびビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図６３に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、およびシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１およびサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１およびサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１（図６１）等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ１３２１（図６１）のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、およびコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、またはコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。

図６３に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、およびMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１（いずれも図６１）等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２（いずれも図６１）等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図６１）等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図６１）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１（図６１）等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１（図６１）等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１（図６１）等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３（いずれも図６１）等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した各実施形態に係る画像符号化装置や画像復号装置を実現する機能ブロックを有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

＜装置への適用例＞
ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置９００（図５４）、携帯電話機９２０（図５５）、記録再生装置９４０（図５６）、撮像装置９６０（図５７）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

また、ビデオセット１３００は、例えば、図５８のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図５９のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図６０の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等にも組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、およびフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、または、ビデオユニット１３６１を、テレビジョン装置９００（図５４）、携帯電話機９２０（図５５）、記録再生装置９４０（図５６）、撮像装置９６０（図５７）、図５８のデータ伝送システム１０００におけるパーソナルコンピュータ１００４、AV機器１００５、タブレットデバイス１００６、および携帯電話機１００７等の端末装置、図５９のデータ伝送システム１１００における放送局１１０１および端末装置１１０２、並びに、図６０の撮像システム１２００における撮像装置１２０１およびスケーラブル符号化データ記憶装置１２０２等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

  ＜１１．第９の実施の形態＞
    ＜MPEG-DASHの応用例＞
  なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えば、後述するMPEG DASH等のようなHTTPストリーミングのコンテンツ再生システムやWi-Fi規格の無線通信システムにも適用することができる。

＜コンテンツ再生システムの概要＞
まず、図６４乃至図６６を参照し、本技術を適用可能なコンテンツ再生システムについて概略的に説明する。

以下では、まず、このような各実施形態において共通する基本構成について図６４および図６５を参照して説明する。

図６４は、コンテンツ再生システムの構成を示した説明図である。図６４に示したように、コンテンツ再生システムは、コンテンツサーバ１６１０、１６１１と、ネットワーク１６１２と、コンテンツ再生装置１６２０（クライアント装置）とを備える。

コンテンツサーバ１６１０、１６１１とコンテンツ再生装置１６２０は、ネットワーク１６１２を介して接続されている。このネットワーク１６１２は、ネットワーク１６１２に接続されている装置から送信される情報の有線、または無線の伝送路である。

例えば、ネットワーク１６１２は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet（登録商標）を含む各種のLAN（Local Area Network）、WAN（Wide Area Network）などを含んでもよい。また、ネットワーク１６１２は、IP-VPN（Internet Protocol-Virtual Private Network）などの専用回線網を含んでもよい。

コンテンツサーバ１６１０は、コンテンツデータを符号化し、符号化データおよび符号化データのメタ情報を含むデータファイルを生成して記憶する。なお、コンテンツサーバ１６１０がMP4形式のデータファイルを生成する場合、符号化データは「mdat」に該当し、メタ情報は「moov」に該当する。

また、コンテンツデータは、音楽、講演およびラジオ番組などの音楽データや、映画、テレビジョン番組、ビデオプログラム、写真、文書、絵画および図表などの映像データや、ゲームおよびソフトウエアなどであってもよい。

ここで、コンテンツサーバ１６１０は、同一コンテンツに関し、異なるビットレートで複数のデータファイルを生成する。またコンテンツサーバ１６１１は、コンテンツ再生装置１６２０からのコンテンツの再生要求に対して、コンテンツサーバ１６１０のURLの情報に、コンテンツ再生装置１６２０で当該URLに付加させるパラメータの情報を含めてコンテンツ再生装置１６２０に送信する。以下、図６５を参照して当該事項について具体的に説明する。

図６５は、図６４のコンテンツ再生システムにおけるデータの流れを示した説明図である。コンテンツサーバ１６１０は、同一のコンテンツデータを異なるビットレートで符号化し、図６５に示したように例えば２MbpsのファイルＡ、１．５MbpsのファイルＢ、１MbpsのファイルＣを生成する。相対的に、ファイルＡはハイビットレートであり、ファイルＢは標準ビットレートであり、ファイルＣはロービットレートである。

また、図６５に示したように、各ファイルの符号化データは複数のセグメントに区分されている。例えば、ファイルＡの符号化データは「Ａ１」、「Ａ２」、「Ａ３」、・・・「Ａｎ」というセグメントに区分されており、ファイルＢの符号化データは「Ｂ１」、「Ｂ２」、「Ｂ３」、・・・「Ｂｎ」というセグメントに区分されており、ファイルＣの符号化データは「Ｃ１」、「Ｃ２」、「Ｃ３」、・・・「Ｃｎ」というセグメントに区分されている。

なお、各セグメントはMP4のシンクサンプル（たとえば、AVC/H．264の映像符号化ではIDR－ピクチャ）で始まる単独で再生可能な１または２以上の映像符号化データおよび音声符号化データより構成サンプルで構成されてもよい。例えば、一秒３０フレームのビデオデータが１５フレーム固定長のGOP（Group of Picture）にて符号化されていた場合、各セグメントは、４GOPに相当する２秒分の映像ならびに音声符号化データであっても、２０GOPに相当する１０秒分の映像ならびに音声符号化データであってもよい。

また、各ファイルにおける配置順番が同一のセグメントによる再生範囲（コンテンツの先頭からの時間位置の範囲）は同一である。例えば、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は同一であり、各セグメントが２秒分の符号化データである場合、セグメント「Ａ２」、セグメント「Ｂ２」、およびセグメント「Ｃ２」の再生範囲は、いずれもコンテンツの２秒乃至４秒である。

コンテンツサーバ１６１０は、このような複数のセグメントから構成されるファイルＡ乃至ファイルＣを生成すると、ファイルＡ乃至ファイルＣを記憶する。そして、コンテンツサーバ１６１０は、図６５に示したように、異なるファイルを構成するセグメントをコンテンツ再生装置１６２０に順次に送信し、コンテンツ再生装置１６２０は、受信したセグメントをストリーミング再生する。

ここで、本実施形態によるコンテンツサーバ１６１０は、各符号化データのビットレート情報およびアクセス情報を含むプレイリストファイル（以下、MPD：Media Presentation Description）をコンテンツ再生装置１６２０に送信し、コンテンツ再生装置１６２０は、MPDに基づき、複数のビットレートのうちのいずれかのビットレートを選択し、選択したビットレートに対応するセグメントの送信をコンテンツサーバ１６１０に要求する。

図６４では、１つのコンテンツサーバ１６１０のみが図示されているが、本開示は係る例に限定されないことは言うまでもない。

図６６は、MPDの具体例を示した説明図である。図６６に示したように、MPDには、異なるビットレート（BANDWIDTH）を有する複数の符号化データに関するアクセス情報が含まれる。例えば、図６６に示したMPDは、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化データが存在することを示す共に、各符号化データに関するアクセス情報を含む。コンテンツ再生装置１６２０は、かかるMPDに基づき、ストリーミング再生する符号化データのビットレートを動的に変更することが可能である。

なお、図６４にはコンテンツ再生装置１６２０の一例として携帯端末を示しているが、コンテンツ再生装置１６２０はかかる例に限定されない。例えば、コンテンツ再生装置１６２０は、PC（Personal Computer）、家庭用映像処理装置（DVDレコーダ、ビデオデッキなど）、PDA（Personal Digital Assistants）、家庭用ゲーム機器、家電機器などの情報処理装置であってもよい。また、コンテンツ再生装置１６２０は、携帯電話、PHS（Personal Handyphone System）、携帯用音楽再生装置、携帯用映像処理装置、携帯用ゲーム機器などの情報処理装置であってもよい。

＜コンテンツサーバ１６１０の構成＞
以上、図６４乃至図６６を参照し、コンテンツ再生システムの概要を説明した。続いて、図６７を参照し、コンテンツサーバ１６１０の構成を説明する。

図６７は、コンテンツサーバ１６１０の構成を示した機能ブロック図である。図６７に示したように、コンテンツサーバ１６１０は、ファイル生成部１６３１と、記憶部１６３２と、通信部１６３３とを備える。

ファイル生成部１６３１は、コンテンツデータを符号化するエンコーダ１６４１を備え、同一のコンテンツでビットレートが異なる複数の符号化データ、および上述したMPDを生成する。例えば、ファイル生成部１６３１は、２５６Kbps、１．０２４Mbps、１．３８４Mbps、１．５３６Mbps、２．０４８Mbpsの各々の符号化データを生成した場合、図６６に示したようなMPDを生成する。

記憶部１６３２は、ファイル生成部１６３１により生成されたビットレートが異なる複数の符号化データおよびMPDを記憶する。この記憶部１６３２は、不揮発性メモリ、磁気ディスク、光ディスク、およびMO（Magneto Optical）ディスクなどの記憶媒体であってもよい。不揮発性メモリとしては、例えば、EEPROM（Electrically Erasable Programmable Read-Only Memory）、EPROM（Erasable Programmable ROM）があげられる。また、磁気ディスクとしては、ハードディスクおよび円盤型磁性体ディスクなどがあげられる。また、光ディスクとしては、CD（Compact Disc）、DVD-R（Digital Versatile Disc Recordable）およびBD（Blu-Ray Disc（登録商標））などがあげられる。

通信部１６３３は、コンテンツ再生装置１６２０とのインタフェースであって、ネットワーク１６１２を介してコンテンツ再生装置１６２０と通信する。より詳細には、通信部１６３３は、HTTPに従ってコンテンツ再生装置１６２０と通信するHTTPサーバとしての機能を有する。例えば、通信部１６３３は、MPDをコンテンツ再生装置１６２０に送信し、HTTPに従ってコンテンツ再生装置１６２０からMPDに基づいて要求された符号化データを記憶部１６３２から抽出し、HTTPレスポンスとしてコンテンツ再生装置１６２０に符号化データを送信する。

＜コンテンツ再生装置１６２０の構成＞
以上、本実施形態によるコンテンツサーバ１６１０の構成を説明した。続いて、図６８を参照し、コンテンツ再生装置１６２０の構成を説明する。

図６８は、コンテンツ再生装置１６２０の構成を示した機能ブロック図である。図６８に示したように、コンテンツ再生装置１６２０は、通信部１６５１と、記憶部１６５２と、再生部１６５３と、選択部１６５４と、現在地取得部１６５６とを備える。

通信部１６５１は、コンテンツサーバ１６１０とのインタフェースであって、コンテンツサーバ１６１０に対してデータを要求し、コンテンツサーバ１６１０からデータを取得する。より詳細には、通信部１６５１は、HTTPに従ってコンテンツ再生装置１６２０と通信するHTTPクライアントとしての機能を有する。例えば、通信部１６５１は、HTTP Rangeを利用することにより、コンテンツサーバ１６１０からMPDや符号化データのセグメントを選択的に取得することができる。

記憶部１６５２は、コンテンツの再生に関する種々の情報を記憶する。例えば、通信部１６５１によりコンテンツサーバ１６１０から取得されるセグメントを順次にバッファリングする。記憶部１６５２にバッファリングされた符号化データのセグメントは、FIFO（First In First Out）で再生部１６５３へ順次に供給される。

また記憶部１６５２は、後述のコンテンツサーバ１６１１から要求された、MPDに記述されているコンテンツのURLへのパラメータの付加指示に基づき、通信部１６５１でURLにパラメータを付加して、そのURLへアクセスするための定義を記憶する。

再生部１６５３は、記憶部１６５２から供給されるセグメントを順次に再生する。具体的には、再生部１６５３は、セグメントのデコード、DA変換、およびレンダリングなどを行う。

選択部１６５４は、MPDに含まれるいずれのビットレートに対応する符号化データのセグメントを取得するかを同一コンテンツ内で順次に選択する。例えば、選択部１６５４がネットワーク１６１２の帯域に応じてセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に選択すると、図６５に示したように、通信部１６５１がコンテンツサーバ１６１０からセグメント「Ａ１」、「Ｂ２」、「Ａ３」を順次に取得する。

現在地取得部１６５６は、コンテンツ再生装置１６２０の現在の位置を取得するものであり、例えばGPS（Global Positioning System）受信機などの現在地を取得するモジュールで構成されていても良い。また現在地取得部１６５６は、無線ネットワークを使用してコンテンツ再生装置１６２０の現在の位置を取得するものであってもよい。

＜コンテンツサーバ１６１１の構成＞
図６９は、コンテンツサーバ１６１１の構成例を示す説明図である。図６９に示したように、コンテンツサーバ１６１１は、記憶部１６７１と、通信部１６７２とを備える。

記憶部１６７１は、MPDのURLの情報を記憶する。MPDのURLの情報は、コンテンツの再生を要求するコンテンツ再生装置１６２０からの求めに応じ、コンテンツサーバ１６１１からコンテンツ再生装置１６２０へ送信される。また記憶部１６７１は、コンテンツ再生装置１６２０へのMPDのURLの情報を提供する際に、当該MPDに記述されているURLにコンテンツ再生装置１６２０でパラメータを付加させる際の定義情報を記憶する。

通信部１６７２は、コンテンツ再生装置１６２０とのインタフェースであって、ネットワーク１６１２を介してコンテンツ再生装置１６２０と通信する。すなわち通信部１６７２は、コンテンツの再生を要求するコンテンツ再生装置１６２０から、MPDのURLの情報の要求を受信し、コンテンツ再生装置１６２０へMPDのURLの情報を送信する。通信部１６７２から送信されるMPDのURLには、コンテンツ再生装置１６２０でパラメータを付加させるための情報が含まれる。

コンテンツ再生装置１６２０でMPDのURLに付加させるパラメータについては、コンテンツサーバ１６１１およびコンテンツ再生装置１６２０で共有する定義情報で様々に設定することが出来る。一例を挙げれば、コンテンツ再生装置１６２０の現在位置、コンテンツ再生装置１６２０を使用するユーザのユーザID、コンテンツ再生装置１６２０のメモリサイズ、コンテンツ再生装置１６２０のストレージの容量などの情報を、コンテンツ再生装置１６２０でMPDのURLに付加させることが出来る。

以上のような構成のコンテンツ再生システムにおいて、図１乃至図４３を参照して上述したような本技術を適用することにより、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。

すなわち、コンテンツサーバ１６１０のエンコーダ１６４１は、上述した実施形態に係る画像符号化装置の機能を有する。また、コンテンツ再生装置１６２０の再生部１６５３は、上述した実施形態に係る画像復号装置の機能を有する。それにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

また、コンテンツ再生システムにおいて、本技術により符号化されたデータを送受信することにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

  ＜１２．第１０の実施の形態＞
    ＜Wi-Fi規格の無線通信システムの応用例＞
  本技術を適用可能な無線通信システムにおける無線通信装置の基本動作例について説明する。

＜無線通信装置の基本動作例＞
最初に、P2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。

次に、第２層で接続する前に、使用する特定のアプリケーションを指定してからP2P接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信がなされる。その後、第２層での接続後に、特定のアプリケーションを起動する場合の無線パケット送受信がなされる。

＜特定のアプリケーション動作開始時における通信例＞
図７０および図７１は、上述したP2P（Peer to Peer）接続を確立して特定のアプリケーションを動作させるまでの無線パケット送受信の例であり、無線通信の基礎となる各装置による通信処理例を示すシーケンスチャートである。具体的には、Wi-Fi Allianceにおいて標準化されているWi-Fiダイレクト（Direct）規格（Wi-Fi P2Pと呼ばれることもある）での接続に至るダイレクト接続の確立手順の一例を示す。

ここで、Wi-Fiダイレクトでは、複数の無線通信装置が互いの存在を検出する（Device Discovery、Service Discovery）。そして、接続機器選択を行うとその選択された機器間において、WPS（Wi-Fi Protected Setup）で機器認証を行うことによりダイレクト接続を確立する。また、Wi-Fiダイレクトでは、複数の無線通信装置が親機（Group Owner）または子機（Client）の何れとしての役割を担うかを決定して通信グループを形成する。

ただし、この通信処理例では、一部のパケット送受信については省略して示す。例えば、初回接続時には、上述したように、WPSを使うためのパケット交換が必要であり、AuthenticationRequest／Responseのやり取り等においてもパケット交換が必要となる。しかしながら、図７０および図７１では、これらのパケット交換についての図示を省略し、２回目以降の接続についてのみを示す。

なお、図７０および図７１では、第１無線通信装置１７０１および第２無線通信装置１７０２間における通信処理例を示すが、他の無線通信装置間における通信処理についても同様である。

最初に、第１無線通信装置１７０１および第２無線通信装置１７０２間においてDevice Discoveryが行われる（１７１１）。例えば、第１無線通信装置１７０１は、Probe request（応答要求信号）を送信し、このProbe requestに対するProbe response（応答信号）を第２無線通信装置１７０２から受信する。これにより、第１無線通信装置１７０１および第２無線通信装置１７０２は、互いの存在を発見することができる。また、Device Discoveryにより、相手のデバイス名や種類（TV、PC、スマートフォン等）を取得することができる。

続いて、第１無線通信装置１７０１および第２無線通信装置１７０２間においてService Discoveryが行われる（１７１２）。例えば、第１無線通信装置１７０１は、Device Discoveryで発見した第２無線通信装置１７０２が対応しているサービスを問い合わせるService Discovery Queryを送信する。そして、第１無線通信装置１７０１は、Service Discovery Responseを第２無線通信装置１７０２から受信することにより、第２無線通信装置１７０２が対応しているサービスを取得する。すなわち、Service Discoveryにより、相手が実行可能なサービス等を取得することができる。相手が実行可能なサービスは、例えば、service、protocol（DLNA（Digital Living Network Alliance） DMR（Digital Media Renderer）等）である。

続いて、ユーザにより接続相手の選択操作（接続相手選択操作）が行われる（１７１３）。この接続相手選択操作は、第１無線通信装置１７０１および第２無線通信装置１７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置１７０１の表示部に接続相手選択画面が表示され、この接続相手選択画面において接続相手として第２無線通信装置１７０２がユーザ操作により選択される。

ユーザにより接続相手選択操作が行われると（１７１３）、第１無線通信装置１７０１および第２無線通信装置１７０２間においてGroup Owner Negotiationが行われる（１７１４）。図７０および図７１では、Group Owner Negotiationの結果により、第１無線通信装置１７０１がグループオーナー（Group Owner）１７１５になり、第２無線通信装置１７０２がクライアント（Client）１７１６になる例を示す。

続いて、第１無線通信装置１７０１および第２無線通信装置１７０２間において、各処理（１７１７乃至１７２０）が行われることにより、ダイレクト接続が確立される。すなわち、Association（Ｌ２（第２層） link確立）（１７１７）、Secure link確立（１７１８）が順次行われる。また、IP Address Assignment（１７１９）、SSDP（Simple Service Discovery Protocol）等によるＬ３上でのＬ４ setup（１７２０）が順次行われる。なお、Ｌ２（layer2）は、第２層（データリンク層）を意味し、Ｌ３（layer3）は、第３層（ネットワーク層）を意味し、Ｌ４（layer4）は、第４層（トランスポート層）を意味する。

続いて、ユーザにより特定のアプリケーションの指定または起動操作（アプリ指定・起動操作）が行われる（１７２１）。このアプリ指定・起動操作は、第１無線通信装置１７０１および第２無線通信装置１７０２の何れか一方のみに発生することもある。例えば、第１無線通信装置１７０１の表示部にアプリ指定・起動操作画面が表示され、このアプリ指定・起動操作画面において特定のアプリケーションがユーザ操作により選択される。

ユーザによりアプリ指定・起動操作が行われると（１７２１）、このアプリ指定・起動操作に対応する特定のアプリケーションが第１無線通信装置１７０１および第２無線通信装置１７０２間において実行される（１７２２）。

ここで、Wi-Fi Direct規格以前の仕様（IEEE802.11で標準化された仕様）の範囲内で、AP（Access Point）－STA（Station）間の接続を行う場合を想定する。この場合には、第２層で接続する前（IEEE802.11用語ではassociation前）には、どのようなデバイスと繋ごうとしているのかを事前に知ることができなかった。

これに対して、図７０および図７１に示すように、Wi-Fi Directでは、Device discoveryやService Discovery（option）において、接続候補相手を探す際に、接続相手の情報を取得することができる。この接続相手の情報は、例えば、基本的なデバイスのタイプや、対応している特定のアプリケーション等である。そして、その取得された接続相手の情報に基づいて、ユーザに接続相手を選択させることができる。

この仕組みを拡張して、第２層で接続する前に特定のアプリケーションを指定して、接続相手を選択し、この選択後に、自動的に特定のアプリケーションを起動させる無線通信システムを実現することも可能である。このような場合の接続に至るシーケンスの一例を、図７３に示す。また、この通信処理において送受信されるフレームフォーマット（frame format）の構成例を図７２に示す。

＜フレームフォーマットの構成例＞
図７２は、本技術の基礎となる各装置による通信処理において送受信されるフレームフォーマット（frame format）の構成例を模式的に示す図である。すなわち、図７２には、第２層での接続を確立するためのMAC frameの構成例を示す。具体的には、図７３に示すシーケンスを実現するためのAssociation Request/Response（１７８７）のフレームフォーマットの一例である。

図７２に示されるように、MAC frameは、Frame Control（１７５１）乃至FCS（１７５８）よりなり、その内、Frame Control（１７５１）からSequence Control（１７５６）までは、MACヘッダである。また、Association Requestを送信する際には、Frame Control（１７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ００００"が設定される。また、Association Responseをencapsulateする際には、Frame Control（１７５１）において、Ｂ３Ｂ２＝"０ｂ００"、かつ、Ｂ７Ｂ６Ｂ５Ｂ４＝"０ｂ０００１"が設定される。なお、「０ｂ００」は、２進法で「００」であることを示し、「０ｂ００００」は、２進法で「００００」であることを示し、「０ｂ０００１」は、２進法で「０００１」であることを示す。

ここで、図７０に示すMAC frame（Frame body（１７５７））は、基本的には、IEEE802.11-2007仕様書section7.2．3.4節と7.2．3.5節に記載のAssociation Request/Responseframe formatである。ただし、IEEE802.11仕様書内で定義されているInformation Element（以下、IEと省略）（１７５９）だけでなく、独自に拡張したIEを含めている点が異なる。

また、Vendor Specific IE（１７６０）であることを示すため、IE Type（Information Element ID（１７６１））には、１０進数で１２７がセットされる。この場合、IEEE802.11－2007仕様7.3．2.26節により、Lengthフィールド（１７６２）と、OUIフィールド（１７６３）が続き、この後にvendor specific content（１７６４）が配置される。

Vendor specific content（１７６４）の内容としては、最初にvendor specific IEのtypeを示すフィールド（IE type（１７６５））を設ける。そして、この後に、複数のsubelement（１７６６）を格納することができる構成とすることが考えられる。

subelement（１７６６）の内容として、使われるべき特定のアプリケーションの名称（１７６７）や、その特定のアプリケーション動作時のデバイスの役割（１７６８）を含めることが考えられる。また、特定のアプリケーション、または、その制御のために使われるポート番号等の情報（Ｌ４セットアップのための情報）（１７６９）や、特定のアプリケーション内でのCapabilityに関する情報（Capability情報）（１７７０）を含めることが考えられる。ここで、Capability情報は、例えば、指定する特定のアプリケーションがDLNAの場合に、音声送出／再生に対応している、映像送出／再生に対応している等を特定するための情報である。

以上のような構成の無線通信システムにおいて、図１乃至図４３を参照して上述したような本技術を適用することにより、図１乃至図４３を参照して上述した効果と同様の効果を得ることができる。すなわち、符号化・復号に必要な記憶容量の増大を抑制することができる。また、上述した無線通信システムにおいて、本技術により符号化されたデータを送受信することにより、符号化・復号に必要な記憶容量の増大を抑制することができる。

また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

  なお、本技術は以下のような構成も取ることができる。
  （１）  静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限する制限部と、
  前記制限部により値が制限された前記シンタクス要素を伝送する伝送部と
  を備える画像処理装置。
  （２）  前記制限部により制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成する符号化部をさらに備え、
  前記伝送部は、前記符号化部で生成された前記ビットストリームをさらに伝送する
  （１）、（３）乃至（７）のいずれかに記載の画像処理装置。
  （３）  前記シンタクス要素は、前記ビットストリームのシーケンスパラメータセットに格納される
  （１）、（２）、（４）乃至（７）のいずれかに記載の画像処理装置。
  （４）  前記シンタクス要素は、参照ピクチャに関するシンタクスである
  （１）乃至（３）、（５）乃至（７）のいずれかに記載の画像処理装置。
  （５）  前記シンタクス要素は、参照ピクチャの枚数に関するシンタクスである
  （１）乃至（４）、（６）、（７）のいずれかに記載の画像処理装置。
  （６）  前記制限部は、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とする
  （１）乃至（５）、（７）のいずれかに記載の画像処理装置。
  （７）  前記所定値とは０である
  （１）乃至（６）のいずれかに記載の画像処理装置。
  （８）  静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限し、
  値が制限された前記シンタクス要素を伝送する
  画像処理方法。
  （９）  さらに、制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成し、伝送する
  を備える（８）、（１０）乃至（１４）のいずれかに記載の画像処理方法。
  （１０）  前記シンタクス要素は、前記ビットストリームのシーケンスパラメータセットに格納される
  （８）、（９）、（１１）乃至（１４）のいずれかに記載の画像処理方法。
  （１１）  前記シンタクス要素は、参照ピクチャに関するシンタクスである
  （８）乃至（１０）、（１２）乃至（１４）のいずれかに記載の画像処理方法。
  （１２）  前記シンタクス要素は、参照ピクチャの枚数に関するシンタクスである
  （８）乃至（１１）、（１３）、（１４）のいずれかに記載の画像処理方法。
  （１３）  静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とする
  （８）乃至（１２）、（１４）のいずれかに記載の画像処理方法。
  （１４）  前記所定値とは０である
  （８）乃至（１３）のいずれかに記載の画像処理方法。

１００画像符号化装置，１０６可逆符号化部，１２１プロファイル設定部，１３１シンタクス要素設定部，１３２符号化部，２００画像符号化装置，２１１判定部，３００画像復号装置，３０２可逆復号部，３２１プロファイル判定部，３３１復号部，３３２シンタクス要素解析部，４００画像復号装置，４１１異常処理部，４２１シンタクス要素検査部

Claims

  静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限する制限部と、
  前記制限部により値が制限された前記シンタクス要素を伝送する伝送部と
  を備える画像処理装置。
  前記制限部により制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成する符号化部をさらに備え、
  前記伝送部は、前記符号化部で生成された前記ビットストリームをさらに伝送する
  請求項１に記載の画像処理装置。
前記シンタクス要素は、前記ビットストリームのシーケンスパラメータセットに格納される
請求項２に記載の画像処理装置。
前記シンタクス要素は、参照ピクチャに関するシンタクスである
請求項３に記載の画像処理装置。
前記シンタクス要素は、参照ピクチャの枚数に関するシンタクスである
請求項３に記載の画像処理装置。
前記制限部は、静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とする
請求項１に記載の画像処理装置。
前記所定値とは０である
請求項６に記載の画像処理装置。
  静止画像を符号化するためのプロファイルにより符号化処理を行う場合、画像間の処理に関するシンタクス要素の値を制限し、
  値が制限された前記シンタクス要素を伝送する
  画像処理方法。
さらに、制限された前記シンタクス要素を用いて、画像データを符号化し、ビットストリームを生成し、伝送する
請求項８に記載の画像処理方法。
前記シンタクス要素は、前記ビットストリームのシーケンスパラメータセットに格納される
請求項９に記載の画像処理方法。
前記シンタクス要素は、参照ピクチャに関するシンタクスである
請求項１０に記載の画像処理方法。
前記シンタクス要素は、参照ピクチャの枚数に関するシンタクスである
請求項１０に記載の画像処理方法。
静止画像を符号化するためのプロファイルにより符号化処理を行う場合、前記シンタクス要素の値を所定の値とする
請求項８に記載の画像処理方法。
前記所定値とは０である
請求項１３に記載の画像処理方法。