JP2021145379A

JP2021145379A - 符号化装置

Info

Publication number: JP2021145379A
Application number: JP2021096226A
Authority: JP
Inventors: チョンスンリム; Chong Soon Lim; ハンブンテオ; Han Boon Teo; 孝啓西; Takahiro Nishi; 正真遠間; Tadamasa Toma; ルリンリャオ; Ru Ling Liao; スゴシュパバンシャシドア; Pavan Shashidhar Sughosh; ハイウェイスン; hai wei Sun
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2016-05-27
Filing date: 2021-06-08
Publication date: 2021-09-24
Also published as: CN114979646A; CN114866775A; US20210344957A1; JP2022033737A; CN115150617A; CN114979650A; US11985349B2; TWI772244B; CN115150619B; CN115037949A; US20210344956A1; CN115037939B; CN109155854A; US20230421809A1; US11985350B2; JP2023063398A; JPWO2017204185A1; TW201803354A; JP7340563B2; JP2021145378A

Abstract

【課題】符号化または復号される画像を適切に扱うことができる符号化装置を提供する。【解決手段】符号化装置１５００は、処理回路と、その処理回路に接続されたメモリ１５０５、１５０６とを備え、処理回路は、メモリ１５０５、１５０６を用いて、複数の画像のうちの１つである処理対象の画像について、画面間予測処理を行い、その画面間予測処理は、処理対象の画像を上述の複数の画像のうちの他の画像と繋ぎ合わせ、その複数の画像に含まれる複数の画素について、その複数の画像中のオブジェクトが連続するよう、配置または再配置を行うラッピング処理を含む。【選択図】図３７

Description

本開示は、画像を符号化する装置および方法と、符号化された画像を復号する装置および方法とに関する。

現在、画像符号化の規格としてＨＥＶＣが策定されている（例えば、非特許文献１参照）。しかし、次世代ビデオ（例えば３６０度動画）の送信および格納には、現在の符号化性能をも超える符号化効率を要する。また、ノンレクティリニア・レンズなどの広角レンズによって撮像された動画像の圧縮に関連する研究および実験は、これまでいくつか行なわれていた。これらの研究などでは、画像サンプルを操作して歪曲収差を排除することにより、処理対象の画像を符号化する前に直線的にする。このために、一般的には画像処理技術が使用されている。

H.265(ISO/IEC 23008-2 HEVC(High Efficiency Video Coding))

しかしながら、従来の符号化装置および復号装置では、符号化または復号される画像を適切に扱うことができないという問題がある。

そこで、本開示は、符号化または復号される画像を適切に扱うことができる符号化装置などを提供する。

本開示の一態様に係る符号化装置は、処理回路と、前記処理回路に接続されたメモリとを備え、前記処理回路は、前記メモリを用いて、複数の画像のうちの１つである処理対象の画像について、画面間予測処理を行い、前記画面間予測処理は、前記処理対象の画像を前記複数の画像のうちの他の画像と繋ぎ合わせ、前記複数の画像に含まれる複数の画素について、前記複数の画像中のオブジェクトが連続するよう、配置または再配置を行うラッピング処理を含む。

なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本開示の符号化装置は、符号化または復号される画像を適切に扱うことができる。

図１は、実施の形態１に係る符号化装置の機能構成を示すブロック図である。図２は、実施の形態１におけるブロック分割の一例を示す図である。図３は、各変換タイプに対応する変換基底関数を示す表である。図４Ａは、ＡＬＦで用いられるフィルタの形状の一例を示す図である。図４Ｂは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。図４Ｃは、ＡＬＦで用いられるフィルタの形状の他の一例を示す図である。図５は、イントラ予測における６７個のイントラ予測モードを示す図である。図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）を説明するための図である。図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）を説明するための図である。図８は、等速直線運動を仮定したモデルを説明するための図である。図９は、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。図１０は、実施の形態１に係る復号装置の機能構成を示すブロック図である。図１１は、実施の形態２における動画像符号化処理の一例を示すフローチャートである。図１２は、実施の形態２におけるビットストリーム中の、パラメータが書き込まれるヘッダの可能な位置を示す図である。図１３は、実施の形態２における撮像画像と、画像補正処理された処理済み画像とを示す図である。図１４は、実施の形態２における繋ぎ合わせ処理によって複数の画像が繋ぎ合わされて生成された繋ぎ合わせ画像を示す図である。図１５は、実施の形態２における、複数のカメラの配置と、それらのカメラによって撮像された画像が繋ぎ合わされて生成された空き領域を含む繋ぎ合わせ画像とを示す図である。図１６は、実施の形態２における画面間予測処理または動き補償を示すフローチャートである。図１７は、実施の形態２における、ノンレクティリニア・レンズまたは魚眼レンズによって生じるたる形歪曲の一例を示す図である。図１８は、実施の形態２における画面間予測処理または動き補償の変形例を示すフローチャートである。図１９は、実施の形態２における画像再構成処理を示すフローチャートである。図２０は、実施の形態２における画像再構成処理の変形例を示すフローチャートである。図２１は、実施の形態２における、繋ぎ合わせ画像に対する部分符号化処理または部分復号処理の一例を示す図である。図２２は、実施の形態２における、繋ぎ合わせ画像に対する部分符号化処理または部分復号処理の他の例を示す図である。図２３は、実施の形態２における符号化装置のブロック図である。図２４は、実施の形態２における動画像復号処理の一例を示すフローチャートである。図２５は、実施の形態２における復号装置のブロック図である。図２６は、実施の形態３における動画像符号化処理の一例を示すフローチャートである。図２７は、実施の形態３における繋ぎ合わせ処理の一例を示すフローチャートである。図２８は、実施の形態３における符号化装置のブロック図である。図２９は、実施の形態３における動画像復号処理の一例を示すフローチャートである。図３０は、実施の形態３における復号装置のブロック図である。図３１は、実施の形態４における動画像符号化処理の一例を示すフローチャートである。図３２は、実施の形態４における画面内予測処理を示すフローチャートである。図３３は、実施の形態４における動きベクトル予測処理を示すフローチャートである。図３４は、実施の形態４における符号化装置のブロック図である。図３５は、実施の形態４における動画像復号処理の一例を示すフローチャートである。図３６は、実施の形態４における復号装置のブロック図である。図３７は、本開示の一態様に係る符号化装置のブロック図である。図３８は、本開示の一態様に係る復号装置のブロック図である。図３９は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。図４０は、スケーラブル符号化時の符号化構造の一例を示す図である。図４１は、スケーラブル符号化時の符号化構造の一例を示す図である。図４２は、ｗｅｂページの表示画面例を示す図である。図４３は、ｗｅｂページの表示画面例を示す図である。図４４は、スマートフォンの一例を示す図である。図４５は、スマートフォンの構成例を示すブロック図である。

以下、実施の形態について図面を参照しながら具体的に説明する。

なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、請求の範囲を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態１）
［符号化装置の概要］
まず、実施の形態１に係る符号化装置の概要を説明する。図１は、実施の形態１に係る符号化装置１００の機能構成を示すブロック図である。符号化装置１００は、動画像／画像をブロック単位で符号化する動画像／画像符号化装置である。

図１に示すように、符号化装置１００は、画像をブロック単位で符号化する装置であって、分割部１０２と、減算部１０４と、変換部１０６と、量子化部１０８と、エントロピー符号化部１１０と、逆量子化部１１２と、逆変換部１１４と、加算部１１６と、ブロックメモリ１１８と、ループフィルタ部１２０と、フレームメモリ１２２と、イントラ予測部１２４と、インター予測部１２６と、予測制御部１２８と、を備える。

符号化装置１００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８として機能する。また、符号化装置１００は、分割部１０２、減算部１０４、変換部１０６、量子化部１０８、エントロピー符号化部１１０、逆量子化部１１２、逆変換部１１４、加算部１１６、ループフィルタ部１２０、イントラ予測部１２４、インター予測部１２６及び予測制御部１２８に対応する専用の１以上の電子回路として実現されてもよい。

以下に、符号化装置１００に含まれる各構成要素について説明する。

［分割部］
分割部１０２は、入力動画像に含まれる各ピクチャを複数のブロックに分割し、各ブロックを減算部１０４に出力する。例えば、分割部１０２は、まず、ピクチャを固定サイズ（例えば１２８ｘ１２８）のブロックに分割する。この固定サイズのブロックは、符号化ツリーユニット（ＣＴＵ）と呼ばれることがある。そして、分割部１０２は、再帰的な四分木（ｑｕａｄｔｒｅｅ）及び／又は二分木（ｂｉｎａｒｙｔｒｅｅ）ブロック分割に基づいて、固定サイズのブロックの各々を可変サイズ（例えば６４ｘ６４以下）のブロックに分割する。この可変サイズのブロックは、符号化ユニット（ＣＵ）、予測ユニット（ＰＵ）あるいは変換ユニット（ＴＵ）と呼ばれることがある。なお、本実施の形態では、ＣＵ、ＰＵ及びＴＵは区別される必要はなく、ピクチャ内の一部又はすべてのブロックがＣＵ、ＰＵ、ＴＵの処理単位となってもよい。

図２は、実施の形態１におけるブロック分割の一例を示す図である。図２において、実線は四分木ブロック分割によるブロック境界を表し、破線は二分木ブロック分割によるブロック境界を表す。

ここでは、ブロック１０は、１２８ｘ１２８画素の正方形ブロック（１２８ｘ１２８ブロック）である。この１２８ｘ１２８ブロック１０は、まず、４つの正方形の６４ｘ６４ブロックに分割される（四分木ブロック分割）。

左上の６４ｘ６４ブロックは、さらに２つの矩形の３２ｘ６４ブロックに垂直に分割され、左の３２ｘ６４ブロックはさらに２つの矩形の１６ｘ６４ブロックに垂直に分割される（二分木ブロック分割）。その結果、左上の６４ｘ６４ブロックは、２つの１６ｘ６４ブロック１１、１２と、３２ｘ６４ブロック１３とに分割される。

右上の６４ｘ６４ブロックは、２つの矩形の６４ｘ３２ブロック１４、１５に水平に分割される（二分木ブロック分割）。

左下の６４ｘ６４ブロックは、４つの正方形の３２ｘ３２ブロックに分割される（四分木ブロック分割）。４つの３２ｘ３２ブロックのうち左上のブロック及び右下のブロックはさらに分割される。左上の３２ｘ３２ブロックは、２つの矩形の１６ｘ３２ブロックに垂直に分割され、右の１６ｘ３２ブロックはさらに２つの１６ｘ１６ブロックに水平に分割される（二分木ブロック分割）。右下の３２ｘ３２ブロックは、２つの３２ｘ１６ブロックに水平に分割される（二分木ブロック分割）。その結果、左下の６４ｘ６４ブロックは、１６ｘ３２ブロック１６と、２つの１６ｘ１６ブロック１７、１８と、２つの３２ｘ３２ブロック１９、２０と、２つの３２ｘ１６ブロック２１、２２とに分割される。

右下の６４ｘ６４ブロック２３は分割されない。

以上のように、図２では、ブロック１０は、再帰的な四分木及び二分木ブロック分割に基づいて、１３個の可変サイズのブロック１１〜２３に分割される。このような分割は、ＱＴＢＴ（ｑｕａｄ−ｔｒｅｅｐｌｕｓｂｉｎａｒｙｔｒｅｅ）分割と呼ばれることがある。

なお、図２では、１つのブロックが４つ又は２つのブロックに分割されていたが（四分木又は二分木ブロック分割）、分割はこれに限定されない。例えば、１つのブロックが３つのブロックに分割されてもよい（三分木ブロック分割）。このような三分木ブロック分割を含む分割は、ＭＢＴ（ｍｕｌｔｉｔｙｐｅｔｒｅｅ）分割と呼ばれることがある。

［減算部］
減算部１０４は、分割部１０２によって分割されたブロック単位で原信号（原サンプル）から予測信号（予測サンプル）を減算する。つまり、減算部１０４は、符号化対象ブロック（以下、カレントブロックという）の予測誤差（残差ともいう）を算出する。そして、減算部１０４は、算出された予測誤差を変換部１０６に出力する。

原信号は、符号化装置１００の入力信号であり、動画像を構成する各ピクチャの画像を表す信号（例えば輝度（ｌｕｍａ）信号及び２つの色差（ｃｈｒｏｍａ）信号）である。以下において、画像を表す信号をサンプルともいうこともある。

［変換部］
変換部１０６は、空間領域の予測誤差を周波数領域の変換係数に変換し、変換係数を量子化部１０８に出力する。具体的には、変換部１０６は、例えば空間領域の予測誤差に対して予め定められた離散コサイン変換（ＤＣＴ）又は離散サイン変換（ＤＳＴ）を行う。

なお、変換部１０６は、複数の変換タイプの中から適応的に変換タイプを選択し、選択された変換タイプに対応する変換基底関数（ｔｒａｎｓｆｏｒｍｂａｓｉｓｆｕｎｃｔｉｏｎ）を用いて、予測誤差を変換係数に変換してもよい。このような変換は、ＥＭＴ（ｅｘｐｌｉｃｉｔｍｕｌｔｉｐｌｅｃｏｒｅｔｒａｎｓｆｏｒｍ）又はＡＭＴ（ａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｔｒａｎｓｆｏｒｍ）と呼ばれることがある。

複数の変換タイプは、例えば、ＤＣＴ−ＩＩ、ＤＣＴ−Ｖ、ＤＣＴ−ＶＩＩＩ、ＤＳＴ−Ｉ及びＤＳＴ−ＶＩＩを含む。図３は、各変換タイプに対応する変換基底関数を示す表である。図３においてＮは入力画素の数を示す。これらの複数の変換タイプの中からの変換タイプの選択は、例えば、予測の種類（イントラ予測及びインター予測）に依存してもよいし、イントラ予測モードに依存してもよい。

このようなＥＭＴ又はＡＭＴを適用するか否かを示す情報（例えばＡＭＴフラグと呼ばれる）及び選択された変換タイプを示す情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

また、変換部１０６は、変換係数（変換結果）を再変換してもよい。このような再変換は、ＡＳＴ（ａｄａｐｔｉｖｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）又はＮＳＳＴ（ｎｏｎ−ｓｅｐａｒａｂｌｅｓｅｃｏｎｄａｒｙｔｒａｎｓｆｏｒｍ）と呼ばれることがある。例えば、変換部１０６は、イントラ予測誤差に対応する変換係数のブロックに含まれるサブブロック（例えば４ｘ４サブブロック）ごとに再変換を行う。ＮＳＳＴを適用するか否かを示す情報及びＮＳＳＴに用いられる変換行列に関する情報は、ＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

［量子化部］
量子化部１０８は、変換部１０６から出力された変換係数を量子化する。具体的には、量子化部１０８は、カレントブロックの変換係数を所定の走査順序で走査し、走査された変換係数に対応する量子化パラメータ（ＱＰ）に基づいて当該変換係数を量子化する。そして、量子化部１０８は、カレントブロックの量子化された変換係数（以下、量子化係数という）をエントロピー符号化部１１０及び逆量子化部１１２に出力する。

所定の順序は、変換係数の量子化／逆量子化のための順序である。例えば、所定の走査順序は、周波数の昇順（低周波から高周波の順）又は降順（高周波から低周波の順）で定義される。

量子化パラメータとは、量子化ステップ（量子化幅）を定義するパラメータである。例えば、量子化パラメータの値が増加すれば量子化ステップも増加する。つまり、量子化パラメータの値が増加すれば量子化誤差が増大する。

［エントロピー符号化部］
エントロピー符号化部１１０は、量子化部１０８から入力である量子化係数を可変長符号化することにより符号化信号（符号化ビットストリーム）を生成する。具体的には、エントロピー符号化部１１０は、例えば、量子化係数を二値化し、二値信号を算術符号化する。

［逆量子化部］
逆量子化部１１２は、量子化部１０８からの入力である量子化係数を逆量子化する。具体的には、逆量子化部１１２は、カレントブロックの量子化係数を所定の走査順序で逆量子化する。そして、逆量子化部１１２は、カレントブロックの逆量子化された変換係数を逆変換部１１４に出力する。

［逆変換部］
逆変換部１１４は、逆量子化部１１２からの入力である変換係数を逆変換することにより予測誤差を復元する。具体的には、逆変換部１１４は、変換係数に対して、変換部１０６による変換に対応する逆変換を行うことにより、カレントブロックの予測誤差を復元する。そして、逆変換部１１４は、復元された予測誤差を加算部１１６に出力する。

なお、復元された予測誤差は、量子化により情報が失われているので、減算部１０４が算出した予測誤差と一致しない。すなわち、復元された予測誤差には、量子化誤差が含まれている。

［加算部］
加算部１１６は、逆変換部１１４からの入力である予測誤差と予測制御部１２８からの入力である予測信号とを加算することによりカレントブロックを再構成する。そして、加算部１１６は、再構成されたブロックをブロックメモリ１１８及びループフィルタ部１２０に出力する。再構成ブロックは、ローカル復号ブロックと呼ばれることもある。

［ブロックメモリ］
ブロックメモリ１１８は、イントラ予測で参照されるブロックであって符号化対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ１１８は、加算部１１６から出力された再構成ブロックを格納する。

［ループフィルタ部］
ループフィルタ部１２０は、加算部１１６によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ１２２に出力する。ループフィルタとは、符号化ループ内で用いられるフィルタ（インループフィルタ）であり、例えば、デブロッキング・フィルタ（ＤＦ）、サンプルアダプティブオフセット（ＳＡＯ）及びアダプティブループフィルタ（ＡＬＦ）などを含む。

ＡＬＦでは、符号化歪みを除去するための最小二乗誤差フィルタが適用され、例えばカレントブロック内の２ｘ２サブブロックごとに、局所的な勾配（ｇｒａｄｉｅｎｔ）の方向及び活性度（ａｃｔｉｖｉｔｙ）に基づいて複数のフィルタの中から選択された１つのフィルタが適用される。

具体的には、まず、サブブロック（例えば２ｘ２サブブロック）が複数のクラス（例えば１５又は２５クラス）に分類される。サブブロックの分類は、勾配の方向及び活性度に基づいて行われる。例えば、勾配の方向値Ｄ（例えば０〜２又は０〜４）と勾配の活性値Ａ（例えば０〜４）とを用いて分類値Ｃ（例えばＣ＝５Ｄ＋Ａ）が算出される。そして、分類値Ｃに基づいて、サブブロックが複数のクラス（例えば１５又は２５クラス）に分類される。

勾配の方向値Ｄは、例えば、複数の方向（例えば水平、垂直及び２つの対角方向）の勾配を比較することにより導出される。また、勾配の活性値Ａは、例えば、複数の方向の勾配を加算し、加算結果を量子化することにより導出される。

このような分類の結果に基づいて、複数のフィルタの中からサブブロックのためのフィルタが決定される。

ＡＬＦで用いられるフィルタの形状としては例えば円対称形状が利用される。図４Ａ〜図４Ｃは、ＡＬＦで用いられるフィルタの形状の複数の例を示す図である。図４Ａは、５ｘ５ダイヤモンド形状フィルタを示し、図４Ｂは、７ｘ７ダイヤモンド形状フィルタを示し、図４Ｃは、９ｘ９ダイヤモンド形状フィルタを示す。フィルタの形状を示す情報は、ピクチャレベルで信号化される。なお、フィルタの形状を示す情報の信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はＣＵレベル）であってもよい。

ＡＬＦのオン／オフは、例えば、ピクチャレベル又はＣＵレベルで決定される。例えば、輝度についてはＣＵレベルでＡＬＦを適用するか否かが決定され、色差についてはピクチャレベルでＡＬＦを適用するか否かが決定される。ＡＬＦのオン／オフを示す情報は、ピクチャレベル又はＣＵレベルで信号化される。なお、ＡＬＦのオン／オフを示す情報の信号化は、ピクチャレベル又はＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

選択可能な複数のフィルタ（例えば１５又は２５までのフィルタ）の係数セットは、ピクチャレベルで信号化される。なお、係数セットの信号化は、ピクチャレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、スライスレベル、タイルレベル、ＣＴＵレベル、ＣＵレベル又はサブブロックレベル）であってもよい。

［フレームメモリ］
フレームメモリ１２２は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ１２２は、ループフィルタ部１２０によってフィルタされた再構成ブロックを格納する。

［イントラ予測部］
イントラ予測部１２４は、ブロックメモリ１１８に格納されたカレントピクチャ内のブロックを参照してカレントブロックのイントラ予測（画面内予測ともいう）を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部１２４は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部１２８に出力する。

例えば、イントラ予測部１２４は、予め規定された複数のイントラ予測モードのうちの１つを用いてイントラ予測を行う。複数のイントラ予測モードは、１以上の非方向性予測モードと、複数の方向性予測モードと、を含む。

１以上の非方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ（Ｈｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）規格（非特許文献１）で規定されたＰｌａｎａｒ予測モード及びＤＣ予測モードを含む。

複数の方向性予測モードは、例えばＨ．２６５／ＨＥＶＣ規格で規定された３３方向の予測モードを含む。なお、複数の方向性予測モードは、３３方向に加えてさらに３２方向の予測モード（合計で６５個の方向性予測モード）を含んでもよい。図５は、イントラ予測における６７個のイントラ予測モード（２個の非方向性予測モード及び６５個の方向性予測モード）を示す図である。実線矢印は、Ｈ．２６５／ＨＥＶＣ規格で規定された３３方向を表し、破線矢印は、追加された３２方向を表す。

なお、色差ブロックのイントラ予測において、輝度ブロックが参照されてもよい。つまり、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分が予測されてもよい。このようなイントラ予測は、ＣＣＬＭ（ｃｒｏｓｓ−ｃｏｍｐｏｎｅｎｔｌｉｎｅａｒｍｏｄｅｌ）予測と呼ばれることがある。このような輝度ブロックを参照する色差ブロックのイントラ予測モード（例えばＣＣＬＭモードと呼ばれる）は、色差ブロックのイントラ予測モードの１つとして加えられてもよい。

イントラ予測部１２４は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正してもよい。このような補正をともなうイントラ予測は、ＰＤＰＣ（ｐｏｓｉｔｉｏｎｄｅｐｅｎｄｅｎｔｉｎｔｒａｐｒｅｄｉｃｔｉｏｎｃｏｍｂｉｎａｔｉｏｎ）と呼ばれることがある。ＰＤＰＣの適用の有無を示す情報（例えばＰＤＰＣフラグと呼ばれる）は、例えばＣＵレベルで信号化される。なお、この情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル又はＣＴＵレベル）であってもよい。

［インター予測部］
インター予測部１２６は、フレームメモリ１２２に格納された参照ピクチャであってカレントピクチャとは異なる参照ピクチャを参照してカレントブロックのインター予測（画面間予測ともいう）を行うことで、予測信号（インター予測信号）を生成する。インター予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部１２６は、カレントブロック又はサブブロックについて参照ピクチャ内で動き探索（ｍｏｔｉｏｎｅｓｔｉｍａｔｉｏｎ）を行う。そして、インター予測部１２６は、動き探索により得られた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成する。そして、インター予測部１２６は、生成されたインター予測信号を予測制御部１２８に出力する。

動き補償に用いられた動き情報は信号化される。動きベクトルの信号化には、予測動きベクトル（ｍｏｔｉｏｎｖｅｃｔｏｒｐｒｅｄｉｃｔｏｒ）が用いられてもよい。つまり、動きベクトルと予測動きベクトルとの間の差分が信号化されてもよい。

なお、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号が生成されてもよい。具体的には、動き探索により得られた動き情報に基づく予測信号と、隣接ブロックの動き情報に基づく予測信号と、を重み付け加算することにより、カレントブロック内のサブブロック単位でインター予測信号が生成されてもよい。このようなインター予測（動き補償）は、ＯＢＭＣ（ｏｖｅｒｌａｐｐｅｄｂｌｏｃｋｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎ）と呼ばれることがある。

このようなＯＢＭＣモードでは、ＯＢＭＣのためのサブブロックのサイズを示す情報（例えばＯＢＭＣブロックサイズと呼ばれる）は、シーケンスレベルで信号化される。また、ＯＢＭＣモードを適用するか否かを示す情報（例えばＯＢＭＣフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、これらの情報の信号化のレベルは、シーケンスレベル及びＣＵレベルに限定される必要はなく、他のレベル（例えばピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

なお、動き情報は信号化されずに、復号装置側で導出されてもよい。例えば、Ｈ．２６５／ＨＥＶＣ規格で規定されたマージモードが用いられてもよい。また例えば、復号装置側で動き探索を行うことにより動き情報が導出されてもよい。この場合、カレントブロックの画素値を用いずに動き探索が行われる。

ここで、復号装置側で動き探索を行うモードについて説明する。この復号装置側で動き探索を行うモードは、ＰＭＭＶＤ（ｐａｔｔｅｒｎｍａｔｃｈｅｄｍｏｔｉｏｎｖｅｃｔｏｒｄｅｒｉｖａｔｉｏｎ）モード又はＦＲＵＣ（ｆｌａｍｅｒａｔｅｕｐ−ｃｏｎｖｅｒｓｉｏｎ）モードと呼ばれることがある。

まず、マージリストに含まれる候補の１つがパターンマッチングによる探索の開始位置として選択される。パターンマッチングとしては、第１パターンマッチング又は第２パターンマッチングが用いられる。第１パターンマッチング及び第２パターンマッチングは、それぞれ、バイラテラルマッチング（ｂｉｌａｔｅｒａｌｍａｔｃｈｉｎｇ）及びテンプレートマッチング（ｔｅｍｐｌａｔｅｍａｔｃｈｉｎｇ）と呼ばれることがある。

第１パターンマッチングでは、異なる２つの参照ピクチャ内の２つのブロックであってカレントブロックの動き軌道（ｍｏｔｉｏｎｔｒａｊｅｃｔｏｒｙ）に沿う２つのブロックの間でパターンマッチングが行われる。

図６は、動き軌道に沿う２つのブロック間でのパターンマッチング（バイラテラルマッチング）を説明するための図である。図６に示すように、第１パターンマッチングでは、カレントブロック（Ｃｕｒｂｌｏｃｋ）の動き軌道に沿う２つのブロックであって異なる２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）内の２つのブロックのペアの中で最もマッチするペアを探索することにより２つの動きベクトル（ＭＶ０、ＭＶ１）が導出される。

連続的な動き軌道の仮定の下では、２つの参照ブロックを指し示す動きベクトル（ＭＶ０、ＭＶ１）は、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ０、Ｒｅｆ１）との間の時間的な距離（ＴＤ０、ＴＤ１）に対して比例する。例えば、カレントピクチャが時間的に２つの参照ピクチャの間に位置し、カレントピクチャから２つの参照ピクチャへの時間的な距離が等しい場合、第１パターンマッチングでは、鏡映対称な双方向の動きベクトルが導出される。

第２パターンマッチングでは、カレントピクチャ内のテンプレート（カレントピクチャ内でカレントブロックに隣接するブロック（例えば上及び／又は左隣接ブロック））と参照ピクチャ内のブロックとの間でパターンマッチングが行われる。

図７は、カレントピクチャ内のテンプレートと参照ピクチャ内のブロックとの間でのパターンマッチング（テンプレートマッチング）を説明するための図である。図７に示すように、第２パターンマッチングでは、カレントピクチャ（ＣｕｒＰｉｃ）内でカレントブロック（Ｃｕｒｂｌｏｃｋ）に隣接するブロックと最もマッチするブロックを参照ピクチャ（Ｒｅｆ０）内で探索することによりカレントブロックの動きベクトルが導出される。

このようなＦＲＵＣモードを適用するか否かを示す情報（例えばＦＲＵＣフラグと呼ばれる）は、ＣＵレベルで信号化される。また、ＦＲＵＣモードが適用される場合（例えばＦＲＵＣフラグが真の場合）、パターンマッチングの方法（第１パターンマッチング又は第２パターンマッチング）を示す情報（例えばＦＲＵＣモードフラグと呼ばれる）がＣＵレベルで信号化される。なお、これらの情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

なお、動き探索とは異なる方法で、復号装置側で動き情報が導出されてもよい。例えば、等速直線運動を仮定したモデルに基づき、画素単位で周辺画素値を用いて動きベクトルの補正量が算出されてもよい。

ここで、等速直線運動を仮定したモデルに基づいて動きベクトルを導出するモードについて説明する。このモードは、ＢＩＯ（ｂｉ−ｄｉｒｅｃｔｉｏｎａｌｏｐｔｉｃａｌｆｌｏｗ）モードと呼ばれることがある。

図８は、等速直線運動を仮定したモデルを説明するための図である。図８において、（ｖ_ｘ，ｖ_ｙ）は、速度ベクトルを示し、τ_０、τ_１は、それぞれ、カレントピクチャ（ＣｕｒＰｉｃ）と２つの参照ピクチャ（Ｒｅｆ_０，Ｒｅｆ_１）との間の時間的な距離を示す。（ＭＶｘ_０，ＭＶｙ_０）は、参照ピクチャＲｅｆ_０に対応する動きベクトルを示し、（ＭＶｘ_１、ＭＶｙ_１）は、参照ピクチャＲｅｆ_１に対応する動きベクトルを示す。

このとき速度ベクトル（ｖ_ｘ，ｖ_ｙ）の等速直線運動の仮定の下では、（ＭＶｘ_０，ＭＶｙ_０）及び（ＭＶｘ_１，ＭＶｙ_１）は、それぞれ、（ｖ_ｘτ_０，ｖ_ｙτ_０）及び（−ｖ_ｘτ_１，−ｖ_ｙτ_１）と表され、以下のオプティカルフロー等式（１）が成り立つ。

ここで、Ｉ^（ｋ）は、動き補償後の参照画像ｋ（ｋ＝０，１）の輝度値を示す。このオプティカルフロー等式は、（i）輝度値の時間微分と、（ii）水平方向の速度及び参照画像の空間勾配の水平成分の積と、（iii）垂直方向の速度及び参照画像の空間勾配の垂直成分の積と、の和が、ゼロと等しいことを示す。このオプティカルフロー等式とエルミート補間（Ｈｅｒｍｉｔｅｉｎｔｅｒｐｏｌａｔｉｏｎ）との組み合わせに基づいて、マージリスト等から得られるブロック単位の動きベクトルが画素単位で補正される。

なお、等速直線運動を仮定したモデルに基づく動きベクトルの導出とは異なる方法で、復号装置側で動きベクトルが導出されてもよい。例えば、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルが導出されてもよい。

ここで、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出するモードについて説明する。このモードは、アフィン動き補償予測（ａｆｆｉｎｅｍｏｔｉｏｎｃｏｍｐｅｎｓａｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）モードと呼ばれることがある。

図９は、複数の隣接ブロックの動きベクトルに基づくサブブロック単位の動きベクトルの導出を説明するための図である。図９において、カレントブロックは、１６の４ｘ４サブブロックを含む。ここでは、隣接ブロックの動きベクトルに基づいてカレントブロックの左上角制御ポイントの動きベクトルｖ_０が導出され、隣接サブブロックの動きベクトルに基づいてカレントブロックの右上角制御ポイントの動きベクトルｖ_１が導出される。そして、２つの動きベクトルｖ_０及びｖ_１を用いて、以下の式（２）により、カレントブロック内の各サブブロックの動きベクトル（ｖ_ｘ，ｖ_ｙ）が導出される。

ここで、ｘ及びｙは、それぞれ、サブブロックの水平位置及び垂直位置を示し、ｗは、予め定められた重み係数を示す。

このようなアフィン動き補償予測モードでは、左上及び右上角制御ポイントの動きベクトルの導出方法が異なるいくつかのモードを含んでもよい。このようなアフィン動き補償予測モードを示す情報（例えばアフィンフラグと呼ばれる）は、ＣＵレベルで信号化される。なお、このアフィン動き補償予測モードを示す情報の信号化は、ＣＵレベルに限定される必要はなく、他のレベル（例えば、シーケンスレベル、ピクチャレベル、スライスレベル、タイルレベル、ＣＴＵレベル又はサブブロックレベル）であってもよい。

［予測制御部］
予測制御部１２８は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として減算部１０４及び加算部１１６に出力する。

［復号装置の概要］
次に、上記の符号化装置１００から出力された符号化信号（符号化ビットストリーム）を復号可能な復号装置の概要について説明する。図１０は、実施の形態１に係る復号装置２００の機能構成を示すブロック図である。復号装置２００は、動画像／画像をブロック単位で復号する動画像／画像復号装置である。

図１０に示すように、復号装置２００は、エントロピー復号部２０２と、逆量子化部２０４と、逆変換部２０６と、加算部２０８と、ブロックメモリ２１０と、ループフィルタ部２１２と、フレームメモリ２１４と、イントラ予測部２１６と、インター予測部２１８と、予測制御部２２０と、を備える。

復号装置２００は、例えば、汎用プロセッサ及びメモリにより実現される。この場合、メモリに格納されたソフトウェアプログラムがプロセッサにより実行されたときに、プロセッサは、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０として機能する。また、復号装置２００は、エントロピー復号部２０２、逆量子化部２０４、逆変換部２０６、加算部２０８、ループフィルタ部２１２、イントラ予測部２１６、インター予測部２１８及び予測制御部２２０に対応する専用の１以上の電子回路として実現されてもよい。

以下に、復号装置２００に含まれる各構成要素について説明する。

［エントロピー復号部］
エントロピー復号部２０２は、符号化ビットストリームをエントロピー復号する。具体的には、エントロピー復号部２０２は、例えば、符号化ビットストリームから二値信号に算術復号する。そして、エントロピー復号部２０２は、二値信号を多値化（ｄｅｂｉｎａｒｉｚｅ）する。これにより、エントロピー復号部２０２は、ブロック単位で量子化係数を逆量子化部２０４に出力する。

［逆量子化部］
逆量子化部２０４は、エントロピー復号部２０２からの入力である復号対象ブロック（以下、カレントブロックという）の量子化係数を逆量子化する。具体的には、逆量子化部２０４は、カレントブロックの量子化係数の各々について、当該量子化係数に対応する量子化パラメータに基づいて当該量子化係数を逆量子化する。そして、逆量子化部２０４は、カレントブロックの逆量子化された量子化係数（つまり変換係数）を逆変換部２０６に出力する。

［逆変換部］
逆変換部２０６は、逆量子化部２０４からの入力である変換係数を逆変換することにより予測誤差を復元する。

例えば符号化ビットストリームから読み解かれた情報がＥＭＴ又はＡＭＴを適用することを示す場合（例えばＡＭＴフラグが真）、逆変換部２０６は、読み解かれた変換タイプを示す情報に基づいてカレントブロックの変換係数を逆変換する。

また例えば、符号化ビットストリームから読み解かれた情報がＮＳＳＴを適用することを示す場合、逆変換部２０６は、変換された変換係数（変換結果）を再変換する。

［加算部］
加算部２０８は、逆変換部２０６からの入力である予測誤差と予測制御部２２０からの入力である予測信号とを加算することによりカレントブロックを再構成する。そして、加算部２０８は、再構成されたブロックをブロックメモリ２１０及びループフィルタ部２１２に出力する。

［ブロックメモリ］
ブロックメモリ２１０は、イントラ予測で参照されるブロックであって復号対象ピクチャ（以下、カレントピクチャという）内のブロックを格納するための記憶部である。具体的には、ブロックメモリ２１０は、加算部２０８から出力された再構成ブロックを格納する。

［ループフィルタ部］
ループフィルタ部２１２は、加算部２０８によって再構成されたブロックにループフィルタを施し、フィルタされた再構成ブロックをフレームメモリ２１４及び表示装置等に出力する。

符号化ビットストリームから読み解かれたＡＬＦのオン／オフを示す情報がＡＬＦのオンを示す場合、局所的な勾配の方向及び活性度に基づいて複数のフィルタの中から１つのフィルタが選択され、選択されたフィルタが再構成ブロックに適用される。

［フレームメモリ］
フレームメモリ２１４は、インター予測に用いられる参照ピクチャを格納するための記憶部であり、フレームバッファと呼ばれることもある。具体的には、フレームメモリ２１４は、ループフィルタ部２１２によってフィルタされた再構成ブロックを格納する。

［イントラ予測部］
イントラ予測部２１６は、符号化ビットストリームから読み解かれたイントラ予測モードに基づいて、ブロックメモリ２１０に格納されたカレントピクチャ内のブロックを参照してイントラ予測を行うことで、予測信号（イントラ予測信号）を生成する。具体的には、イントラ予測部２１６は、カレントブロックに隣接するブロックのサンプル（例えば輝度値、色差値）を参照してイントラ予測を行うことでイントラ予測信号を生成し、イントラ予測信号を予測制御部２２０に出力する。

なお、色差ブロックのイントラ予測において輝度ブロックを参照するイントラ予測モードが選択されている場合は、イントラ予測部２１６は、カレントブロックの輝度成分に基づいて、カレントブロックの色差成分を予測してもよい。

また、符号化ビットストリームから読み解かれた情報がＰＤＰＣの適用を示す場合、イントラ予測部２１６は、水平／垂直方向の参照画素の勾配に基づいてイントラ予測後の画素値を補正する。

［インター予測部］
インター予測部２１８は、フレームメモリ２１４に格納された参照ピクチャを参照して、カレントブロックを予測する。予測は、カレントブロック又はカレントブロック内のサブブロック（例えば４ｘ４ブロック）の単位で行われる。例えば、インター予測部１２６は、符号化ビットストリームから読み解かれた動き情報（例えば動きベクトル）を用いて動き補償を行うことでカレントブロック又はサブブロックのインター予測信号を生成し、インター予測信号を予測制御部１２８に出力する。

なお、符号化ビットストリームから読み解かれた情報がＯＢＭＣモードを適用することを示す場合、インター予測部２１８は、動き探索により得られたカレントブロックの動き情報だけでなく、隣接ブロックの動き情報も用いて、インター予測信号を生成する。

また、符号化ビットストリームから読み解かれた情報がＦＲＵＣモードを適用することを示す場合、インター予測部２１８は、符号化ストリームから読み解かれたパターンマッチングの方法（バイラテラルマッチング又はテンプレートマッチング）に従って動き探索を行うことにより動き情報を導出する。そして、インター予測部２１８は、導出された動き情報を用いて動き補償を行う。

また、インター予測部２１８は、ＢＩＯモードが適用される場合に、等速直線運動を仮定したモデルに基づいて動きベクトルを導出する。また、符号化ビットストリームから読み解かれた情報がアフィン動き補償予測モードを適用することを示す場合には、インター予測部２１８は、複数の隣接ブロックの動きベクトルに基づいてサブブロック単位で動きベクトルを導出する。

［予測制御部］
予測制御部２２０は、イントラ予測信号及びインター予測信号のいずれかを選択し、選択した信号を予測信号として加算部２０８に出力する。

（実施の形態２）
次に、以上のように構成された符号化装置１００及び復号装置２００において行われる一部の処理について図面を参照しながら具体的に説明する。なお、本開示の利益をさらに拡大するために、後述の各実施の形態を組み合わせてもよいことは、当業者には明らかであろう。

本実施の形態における符号化装置および復号装置などは、任意のマルチメディアデータの符号化および復号に使用することができ、より具体的には、ノンレクティリニアの（例えばフィッシュアイ）カメラに撮像された画像の符号化および復号において使用することができる。

ここで、上述の先行技術では、処理された画像およびレクティリニア・レンズによって直接撮像された画像の圧縮には、これまでと同じ動画像符号化ツールが使用される。この種の処理画像を異なる方法で圧縮するために特別に、カスタマイズされた動画像符号化ツールは先行技術には存在しない。

一般的には、はじめに複数のカメラによって撮像され、複数のカメラによって撮像された画像が繋ぎ合わせられて大きな画像が、３６０度画像として作成される。平面状のディスプレイでより快適に画像を表示することができるように、または、機械学習技術を用いて画像中の対象物をより容易に検出可能にするために、画像の符号化を行う前に「魚眼レンズの歪みを補正（ｄｅｆｉｓｈ）する」こと、または直線的にするための画像補正を含む画像変換処理を行う場合がある。しかしながら、この画像変換処理では、通常、画像サンプルを補間するため、画像内に保持される情報に重複部分が生じる。また、繋ぎ合わせ処理および画像変換処理により、画像内に空き領域が形成される場合があり、これは通常はデフォルトの画素値（例えば黒色画素）で埋められる。繋ぎ合わせ処理と画像変換処理によって生じたこのような問題は、符号化処理の符号化効率を低減させる要因となる。

これらの問題を解決するために、本実施の形態では、カスタマイズされた動画像符号化ツールおよび動画像復号ツールとして適応的動画像符号化ツールおよび適応的動画像復号ツールを用いる。符号化効率を向上させるために、この適応的動画像符号化ツールは、エンコーダに先立って画像を処理するために用いられる画像変換処理または画像繋ぎ合わせ処理に適応できる。本開示は、符号化処理中に適応的動画像符号化ツールを上述のような処理に適応することによって、これらの処理で生じたあらゆる重複を低減することができる。適応的動画像復号ツールについても、適応的動画像符号化ツールと同様である。

本実施の形態では、画像変換処理または／および画像繋ぎ合わせ処理の情報を使用して動画像符号化ツールおよび動画像復号ツールを適応させる。そのため、動画像符号化ツールおよび動画像復号ツールは異なる種類の処理済み画像に適用可能である。したがって、本実施の形態では、圧縮効率を向上させることができる。

［符号化処理］
図１１に示す本開示の実施の形態２による、ノンレクティリニア・レンズを使用して撮像された画像に動画像符号化を行う方法について説明する。なお、ノンレクティリニア・レンズは、広角レンズまたはその一例である。

図１１は、本実施の形態における動画像符号化処理の一例を示すフローチャートである。

ステップＳ１０１では、符号化装置はパラメータ一式をヘッダに書き込む。図１２は、圧縮された動画像ビットストリームにおいて上記ヘッダの可能な位置を示す。書き込まれたパラメータ（すなわち図１２中のカメラ画像パラメータ）は、画像補正処理に関する１以上のパラメータを含む。例えば、このようなパラメータは、図１２に示すように、ビデオパラメータセット、シーケンスパラメータセット、ピクチャパラメータセット、スライスヘッダ、またはビデオシステムセットアップパラメータセットに書き込まれる。つまり、本実施の形態において書き込まれるパラメータは、ビットストリームの何れのヘッダに書き込まれてもよく、ＳＥＩ（Supplemental Enhancement Information）に書き込まれてもよい。なお、画像補正処理は、上述の画像変換処理に相当する。

＜画像補正処理のパラメータの例＞
図１３に示すように、撮像された画像は、画像の撮像中に使用されるレンズの特性により歪んでいてもよい。また、撮像された画像を直線的に補正するために画像補正処理を使用した。なお、撮像された画像を直線的に補正することによって、矩形の画像が生成される。書き込まれたパラメータは、使用された画像補正処理を特定するため、または記述するためのパラメータを含む。画像補正処理で使用されるパラメータは、一例として、入力画像の画素を、画像補正処理の意図した出力画素値にマッピングするためのマッピングテーブルを構成するパラメータを含む。これらのパラメータは、１以上の補間処理用の重みパラメータ、または／およびピクチャの入力画素および出力画素の位置を特定する位置パラメータを含んでもよい。画像補正処理の可能な実施例の一つとして、画像補正処理用のマッピングテーブルを、補正された画像内のすべての画素に使用してもよい。

画像補正処理を記述するために用いられるパラメータの他の例としては、複数の予め定義された補正アルゴリズムから一つを選択する選択パラメータと、補正アルゴリズムの複数の所定の方向から一つを選択する、方向パラメータと、または／および補正アルゴリズムを較正するか、微調整するキャリブレーションパラメータとが含まれる。例えば、複数の予め定義された補正アルゴリズムがある場合（例えば、異なるアルゴリズムが異なる種類のレンズに用いられる場合）、選択パラメータは、これらの予め定義されたアルゴリズムのうちから１つを選択するために用いられる。例えば、補正アルゴリズムを適用することができる２以上の方向がある場合（例えば、水平方向、垂直方向、またはどちらの方向でも画像補正処理を行うことができる場合）、方向パラメータは、これらの予め定義された方向のうちの１つを選択する。画像補正処理を較正することができる場合、キャリブレーションパラメータにより、異なる種類のレンズに適合するように画像補正処理を調整することができる。

＜繋ぎ合わせ処理のパラメータの例＞
書き込まれたパラメータは、さらに繋ぎ合わせ処理に関する１以上のパラメータを含んでもよい。図１４および図１５に示されるように、符号化装置に入力される画像は、異なるカメラからの複数の画像を組み合わせる繋ぎ合わせ処理の結果、得られたものでもよい。書き込まれたパラメータは、例えば、カメラの数、歪み中心または各カメラの主軸、および歪みレベルなどの繋ぎ合わせ処理に関する情報を提供するパラメータを含む。繋ぎ合わせ処理について記述するパラメータの別の例では、複数の画像からの重複する画素によって生成される、繋ぎ合わせられた画像の位置を特定するパラメータを含む。これらの画像の各々は、カメラの角度に重複する領域が存在することがあるため、他の画像に現れてもよい画素を含んでいてもよい。繋ぎ合わせ処理において、これらの重複する画素を処理して減らし、繋ぎ合わせられた画像を生成する。

繋ぎ合わせ処理について記述するパラメータの別の例としては、繋ぎ合わせられた画像のレイアウトを特定するパラメータを含む。例えば、正距円筒図法、立方体の３ｘ２レイアウトおよび立方体の４ｘ３レイアウトなどの３６０度画像の形式によって、繋ぎ合わせられた画像内の画像の配置は異なる。なお、３×２レイアウトは、３列２行に配置された６個の画像のレイアウトであり、４×３レイアウトは、４列３行に配置された１２個の画像のレイアウトである。上記パラメータである配置パラメータは、画像の配置に基づいて、ある方向での画像の連続性を特定するために使用される。動き補償処理中に、他の画像またはビューからの画素を画面間予測処理に使用することができ、これらの画像またはビューは配置パラメータによって特定される。いくつかの画像または画像中の画素も連続性を確保するために回転する必要がある場合がある。

パラメータの他の例としては、カメラおよびレンズのパラメータが挙げられる（例えば、カメラにおいて使用される焦点距離、主点、スケール係数、イメージセンサの形式など）。パラメータのさらに他の例としては、カメラの配置に関する物理的情報（例えば、カメラの位置、カメラの角度など）がある。

次に、ステップＳ１０２において、符号化装置は、書き込まれたこれらのパラメータに基づく適応的動画像符号化ツールによって画像を符号化する。適応的動画像符号化ツールには、画面間予測処理が含まれる。適応的動画像符号化ツールの一式には、さらに画像再構成処理が含まれてもよい。

＜画面間予測での歪み補正＞
図１６は、画像がノンレクティリニア・レンズを使用して撮像されると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が１以上の画像から繋ぎ合わせられたと特定される場合に、適応される画面間予測処理を示すフローチャートである。図１６に示すように、ステップＳ１９０１において、符号化装置は、ヘッダに書き込まれたパラメータに基づき、画像内のある位置が歪み中心または主点であると判定する。図１７は、魚眼レンズによって生じた歪曲収差の一例を示す。なお、魚眼レンズは広角レンズの一例である。歪み中心から遠くなるにつれて、拡大は焦点軸に沿って減少する。したがって、ステップＳ１９０２では、符号化装置は、歪み中心に基づいて、画像を直線的にするために、画像内の画素をラッピング処理して歪みを補正するか、または行われた補正を元に戻すことができる。つまり、符号化装置は、符号化の処理の対象とされる歪んだ画像のブロックに対して画像補正処理（すなわちラッピング処理）を行う。最後に、符号化装置は、ラッピング処理された画像の画素に基づいて、ステップＳ１９０３において、予測サンプルのブロックを導き出すブロック予測を行うことができる。なお、本実施の形態におけるラッピング処理またはラッピングは、画素、ブロックまたは画像を、配置または再配置する処理である。また、符号化装置は、予測されたブロックである予測ブロックを画像補正処理が行われる前の元の歪んだ状態に戻し、歪んだ状態の予想ブロックを歪んだ処理対象ブロックの予測画像として用いもよい。なお、予測画像および処理対象ブロックは、実施の形態１の予測信号およびカレントブロックに相当する。

適応された画面間予測処理の別の例には、適応された動きベクトル処理が含まれる。動きベクトルの解像度は、歪み中心から近い画像ブロックよりも、歪み中心から遠い画像ブロックの方が低い。例えば、歪み中心から遠い画像ブロックは、半画素精度までの動きベクトルの精度を有してもよい。一方、歪み中心に近い画像ブロックは、１／８画素精度までという高い動きベクトル精度を有してもよい。適応した動きベクトル精度には、画像ブロック位置に基づき差が生じるため、ビットストリームにおいて符号化された動きベクトルの精度は、動きベクトルの終了位置および／または開始位置に応じて、適応可能であってもよい。つまり、符号化装置は、パラメータを用いて、動きベクトルの精度をブロックの位置に応じて異ならせてもよい。

適応した画面間予測処理の別の例には、適応した動き補償処理が含まれ、この動き補償処理においては、ヘッダにおいて書き込まれた配置パラメータに基づいた対象のビューからの画像サンプルを予測するために、異なるビューからの画素を使用してもよい。例えば、正距円筒図法、立方体の３ｘ２のレイアウト、立方体の４ｘ３のレイアウトなどの３６０度の画像形式によって、繋ぎ合わせられた画像内の画像の配置は異なる。配置パラメータは、画像の配置に基づき、一定方向での画像の連続性を特定するために使用される。動き補償処理中に、他の画像または他のビューからの画素を画面間予測処理に使用することができ、これらの画像またはビューは配置パラメータによって特定される。いくつかの画像または画像中の画素も連続性を確保するために回転する必要がある場合がある。

つまり、符号化装置は、連続性を確保する処理を行ってもよい。例えば、符号化装置は、図１５に示す繋ぎ合わせ画像を符号化する場合、そのパラメータに基づいてラッピング処理を行ってもよい。具体的には、繋ぎ合わせ画像に含まれる５つの画像（すなわち画像Ａ〜Ｄとトップビュー）のうち、トップビューは、１８０度画像であり、画像Ａ〜Ｄは９０度画像である。したがって、トップビューに映し出されている空間は、画像Ａ〜Ｄのそれぞれに映し出されている空間と連続し、画像Ａに映し出されている空間と、画像Ｂに映し出されている空間とは連続している。しかし、繋ぎ合わせ画像では、トップビューは、画像Ａ，ＣおよびＤと連続しておらず、画像Ａは画像Ｂと連続していない。そこで、符号化装置は、符号化効率を向上するために、上述のラッピング処理を行う。つまり、符号化装置は、繋ぎ合わせ画像に含まれる各画像を再配置する。例えば、符号化装置は、画像Ａと画像Ｂとが連続するように各画像を再配置する。これにより、画像Ａおよび画像Ｂに分離されて映し出されているオブジェクトが連続し、符号化効率を向上することができる。なお、このような各画像を再配置または配置する処理であるラッピング処理は、フレームパッキングともいう。

＜画面間予測でのパディング＞
図１８は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または画像が直線的に処理されると特定される場合、または、画像が２つ以上の画像から繋ぎ合わせられたと特定される場合に、適応される画面間予測処理の変形例を示すフローチャートである。図１８に示すように、符号化装置は、ヘッダに書き込まれたパラメータに基づいて、画像の領域がステップＳ２００１において空き領域であると特定する。これらの空き領域は、撮像された画像の画素を含んでいない画像の領域であり、一般的には、所定の画素値（例えば、黒色画素）で置換される。図１３は、画像内のこれらの領域の一例を示す図である。図１５は、複数の画像を繋ぎ合わせる場合における、これらの領域の別の例を示す図である。次に、符号化装置は、図１８のステップＳ２００２において、特定されたこれらの領域内の画素を、動き補償処理を行っている間に、画像の空き領域ではない他の領域の値でパディング処理する。パディング処理された値は、物理的な３次元の空間に応じて、空き領域ではない領域における最も近い画素からの値、または最も近い画素からの値であってもよい。最後に、ステップＳ２００３において、符号化装置は、パディング処理された値に基づいて予測サンプルのブロックを生成するためにブロック予測を行う。

＜画像再構成での歪み補正＞
図１９は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が２以上の画像から繋ぎ合わせらされたと特定される場合に、適応される画像再構成処理を示すフローチャートである。図１９に示すように、符号化装置は、ヘッダに書き込まれたパラメータに基づいて、画像内の位置を、ステップＳ１８０１において歪み中心または主点として判定する。図１７は、魚眼レンズによって生じた歪曲収差の一例を示す。焦点の軸芯が歪み中心から離れるにつれて、拡大は焦点の軸芯に沿って減少する。したがって、ステップＳ１８０２では、符号化装置は、歪み中心に基づいて、画像内の再構成画素に対して、歪みを補正するか、または画像を直線的にするために行われた補正を元に戻すために、ラッピング処理を行ってもよい。例えば、符号化装置は、逆変換によって生成される予測誤差の画像と、予測画像とを加算することによって、再構成画像を生成する。このとき、符号化装置は、予測誤差の画像および予測画像のそれぞれを直線的にするためにラッピング処理を行う。

最後に、ステップＳ１８０３において、符号化装置は、ラッピング処理が行われた画像の画素に基づいて再構成された画像のブロックを、メモリに格納する。

＜画像再構成での画素値の置き換え＞
図２０は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が１以上の画像から繋ぎ合わせらされたと特定される場合に、適応される画像再構成処理の変形例を示す。図２０に示すように、ヘッダに書き込まれたパラメータに基づいて、ステップＳ２１０１において、符号化装置は、画像の領域を空き領域として特定する。これらの空き領域は、撮像された画像の画素を含んでおらず、一般的に所定の画素値（例えば黒色画素）と置換される画像の領域である。図１３は、画像においてこれらの領域の一例を示す図である。図１５は、複数の画像を繋ぎ合わせる場合における、これらの領域の別の例を示す図である。次に、ステップＳ２１０２において、符号化装置は、画像サンプルのブロックを再構成する。

また、ステップＳ２１０３において、符号化装置は、これらの特定された領域内の再構成された画素を、所定の画素値と置き換える。

＜符号化処理の省略＞
図１１のステップＳ１０２において、適応的動画像符号化ツールについて可能な別の変形例では、画像の符号化処理を省略してもよい。つまり、画像のレイアウト配置に関して書き込まれたパラメータ、およびユーザの目の視線または頭の方向に基づくアクティブなビュー領域についての情報に基づいて、符号化装置は、画像の符号化処理を省略してもよい。すなわち、符号化装置は部分符号化処理を行う。

図２１は、異なるカメラによって撮像された異なるビューに関する、ユーザの視線の視角または頭の向きの一例を示す。同図に示すように、ユーザの視角はビュー１のみからのカメラによって撮像された画像内にある。この例においては、他のビューからの画像は、ユーザの視角外にあるため符号化する必要はない。そのため、符号化の複雑さを低減させるため、または圧縮画像の送信ビットレートを低減させるために、これらの画像に対する符号化処理または送信処理を省略することができる。図示している別の可能な一例において、ビュー５およびビュー２はアクティブなビュー１に物理的に近接しているため、ビュー５からの画像、およびビュー２からの画像も、符号化されて送信される。これらの画像は、現時点ではビューアまたはユーザに表示されないが、ビューアが自身の頭の向きを変える時に、ビューアまたはユーザに表示される。これらの画像は、ビューアが自身の頭の方向を変える時に、ユーザの視聴体感を向上させるために使用される。

図２２は、ユーザの異なるカメラによって撮像された異なるビューに対する視線の角度または頭の向きの別の一例を示す。ここでは、アクティブな視線領域は、ビュー２からの画像内にある。したがって、ビュー２からの画像が符号化されてユーザに表示される。ここでは、符号化装置は、ビューアの頭が近々動くと推定される範囲を予測して、今後のフレームの視線領域になる可能性がある範囲として、より広い領域を定義する。符号化装置は、対象のアクティブな視線領域内ではなく、より広い今後の視線領域内にある（ビュー２以外の）ビューからの画像も符号化し、ビューアの方でビューをより速く描画できるように送信する。つまり、ビュー２からの画像だけでなく、図２２に示す可能視線領域に少なくとも一部が重複する、トップビューおよびビュー１からの画像も符号化されて送信される。残りのビュー（ビュー３、ビュー４、およびボトムビュー）からの画像は符号化されず、これらの画像の符号化処理は省略される。

［符号化装置］
図２３は、本実施の形態における動画像を符号化する符号化装置の構成を示すブロック図である。

符号化装置９００は、出力ビットストリームを生成するために、ブロックごとに入力動画像を符号化するための装置であって、実施の形態１の符号化装置１００に相当する。図２３に示すように、符号化装置９００は、変換部９０１、量子化部９０２、逆量子化部９０３、逆変換部９０４、ブロックメモリ９０５、フレームメモリ９０６、イントラ予測部９０７、インター予測部９０８、減算部９２１、加算部９２２、エントロピー符号化部９０９、およびパラメータ導出部９１０を備える。

入力動画像の画像（すなわち処理対象ブロック）は、減算部９２１へ入力され、減算された値は変換部９０１に出力される。つまり、減算部９２１は、処理対象ブロックから予測画像を減算することによって、予測誤差を算出する。変換部９０１は、減算された値（すなわち予測誤差）を周波数係数に変換し、得られた周波数係数を量子化部９０２に出力する。量子化部９０２は、入力された周波数係数を量子化し、逆量子化部９０３およびエントロピー符号化部９０９に、得られた量子化値を出力する。

逆量子化部９０３は、量子化部９０２から出力されたサンプル値（すなわち量子化値）を逆量子化し、逆変換部９０４に周波数係数を出力する。逆変換部９０４は、周波数係数を画像のサンプル値、すなわち画素値に変換するために逆周波数変換を行い、得られたサンプル値を加算部９２２に出力する。

パラメータ導出部９１０は、画像補正処理に関するパラメータ、またはカメラに関するパラメータ、または繋ぎ合わせ処理に関するパラメータを画像から導出し、インター予測部９０８と、加算部９２２と、エントロピー符号化部９０９とに出力する。例えば、入力動画像には、これらのパラメータが含まれていてもよく、この場合には、パラメータ導出部９１０は、動画像に含まれるパラメータを抽出して出力する。または、入力動画像には、これらのパラメータを導出するためのベースとなるパラメータが含まれていてもよい。この場合には、パラメータ導出部９１０は、動画像に含まれるベースのパラメータを抽出して、その抽出されたベースのパラメータを、上述の各パラメータに変換して出力する。

加算部９２２は、逆変換部９０４から出力されたサンプル値を、イントラ予測部９０７またはインター予測部９０８から出力された予測画像の画素値に加算する。つまり、加算部９２２は、再構成画像を生成する画像再構成処理を行う。加算部９２２は、さらなる予測を行うために、ブロックメモリ９０５またはフレームメモリ９０６に、得られた加算値を出力する。

イントラ予測部９０７は、画面内予測を行う。つまり、イントラ予測部９０７は、ブロックメモリ９０５に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。インター予測部９０８は、画面間予測を行う。つまり、インター予測部９０８は、フレームメモリ９０６に格納された、処理対象ブロックのピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。

ここで、本実施の形態では、インター予測部９０８および加算部９２２は、パラメータ導出部９１０によって導出されたパラメータに基づいて処理を適応させる。つまり、インター予測部９０８および加算部９２２は、上述の適応的動画像符号化ツールによる処理として、図１６、図１８、図１９および図２０に示すフローチャートにしたがった処理を行う。

エントロピー符号化部９０９は、量子化部９０２から出力された量子化値と、パラメータ導出部９１０によって導出されたパラメータとを符号化し、ビットストリームを出力する。つまり、エントロピー符号化部９０９は、そのパラメータをビットストリームのヘッダに書き込む。

［復号処理］
図２４は、本実施の形態における動画像復号処理の一例を示すフローチャートである。

ステップＳ２０１では、復号装置は、パラメータ一式をヘッダから読み解く。図１２は、圧縮された動画像ビットストリームにおいて上記ヘッダの可能な位置を示す。読み解かれたパラメータは、画像補正処理に関する１以上のパラメータを含む。

＜画像補正処理のパラメータの例＞
図１３に示すように、撮像された画像は、画像の撮像中に使用されるレンズの特性により歪んでいてもよい。また、撮像された画像を直線的に補正するために画像補正処理を使用した。読み解かれたパラメータは、使用された画像補正処理を特定する、または使用された画像補正処理を記載するためのパラメータを含む。画像補正処理において使用されるパラメータの例には、画像補正処理の意図した出力画素値に入力画像の画素をマッピングするためのマッピングテーブルを構成するパラメータを含む。これらのパラメータは、１以上の補間処理用の重みパラメータ、または／およびピクチャの入力画素および出力画素の位置を特定する位置パラメータを含んでもよい。画像補正処理の可能な一実施例において、画像補正処理用のマッピングテーブルは、補正された画像内のすべての画素に使用されてもよい。

画像補正処理を記載するために用いられるパラメータの他の例としては、予め定義された複数の補正アルゴリズムから一つを選択するための選択パラメータと、補正アルゴリズムの複数の所定の方向からの一つを選択するための方向パラメータと、または／および補正アルゴリズムを較正、または微調整するためのキャリブレーションパラメータとが含まれる。例えば、予め定義された複数の補正アルゴリズムがある場合（例えば、異なるアルゴリズムが異なる種類のレンズに使用される場合）、選択パラメータは、予め定義されたこれらのアルゴリズムのうちの１つを選択するために使用される。例えば、補正アルゴリズムを適用することができる方向が２つ以上ある場合（例えば、水平方向、垂直方向、またはどちらの方向でも画像補正処理を行うことが可能な場合）、方向パラメータは、予め定義されたこれらの方向のうちの１つを選択する。例えば、画像補正処理を較正することができる場合、キャリブレーションパラメータにより、異なる種類のレンズに適合するように画像補正処理を調整することができる。

＜繋ぎ合わせ処理のパラメータの例＞
読み解かれたパラメータは、さらに繋ぎ合わせ処理に関する１以上のパラメータを含んでもよい。図１４および図１５に示すように、復号装置に入力される符号化された画像は、異なるカメラからの複数の画像を組み合わせる繋ぎ合わせ処理の結果、得られたものでもよい。読み解かれたパラメータは、例えば、カメラの数、歪み中心、または各カメラの主軸、および歪みレベルなどの繋ぎ合わせ処理に関する情報を提供するパラメータを含む。繋ぎ合わせ処理について記載するパラメータの別の例としては、複数の画像からの重複する画素から生成される、繋ぎ合わせられた画像の位置を特定するパラメータがある。これらの画像の各々は、カメラの角度に重複する領域が存在することがあるため、他の画像に現れてもよい画素を含んでいてもよい。この繋ぎ合わせ処理において、これらの重複する画素を処理して減らし、繋ぎ合わせられた画像を生成する。

繋ぎ合わせ処理について記述するパラメータの別の例としては、繋ぎ合わせられた画像のレイアウトを特定するパラメータを含む。例えば、正距円筒図法、立方体の３ｘ２のレイアウトまたは立方体の４ｘ３のレイアウトなどの３６０度画像の形式によって、繋ぎ合わせられた画像内の画像の配置は異なる。上記パラメータである配置パラメータは、画像の配置に基づいて、ある方向での画像の連続性を特定するために使用される。動き補償処理中に、他の画像またはビューからの画素を画面間予測処理に使用することができ、これらの画像またはビューは配置パラメータによって特定される。いくつかの画像または画像中の画素も連続性を確保するために回転する必要がある場合がある。

次に、ステップＳ２０２において、復号装置は、読み解かれたこれらのパラメータに基づく適応的動画像復号ツールによって画像を復号する。適応的動画像復号ツールには、画面間予測処理が含まれる。適応的動画像復号ツールの一式には、画像再構成処理が含まれてもよい。なお、動画像復号ツールまたは適応的動画像復号ツールは、上述の動画像符号化ツールまたは適応的動画像符号化ツールと同一またはそれに対応するツールである。

＜画面間予測での歪み補正＞
図１６は、画像がノンレクティリニア・レンズを使用して撮像されると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が１以上の画像から繋ぎ合わせられたと特定される場合に、適応される画面間予測処理を示すフローチャートである。図１６に示すように、ステップＳ１９０１において、復号装置は、ヘッダに書き込まれたパラメータに基づき、画像内のある位置が歪み中心または主点であると判定する。図１７は、魚眼レンズによって生じた歪曲収差の一例を示す。焦点軸が歪み中心から離れるにつれて、拡大は焦点軸に沿って減少する。したがって、ステップＳ１９０２では、復号装置は、歪み中心に基づいて、歪みを補正するか、または画像を直線的にするために行われた補正を元に戻すために、画像内の画素に対してラッピング処理を行ってもよい。つまり、復号装置は、復号の処理の対象とされる歪んだ画像のブロックに対して画像補正処理（すなわちラッピング処理）を行う。最後に、復号装置は、ステップＳ１９０３において、ラッピング処理が行われた画像の画素に基づいて、予測サンプルのブロックを導き出すブロック予測を行うことができる。また、復号装置は、予測されたブロックである予測ブロックを画像補正処理が行われる前の元の歪んだ状態に戻し、歪んだ状態の予想ブロックを歪んだ処理対象ブロックの予測画像として用いもよい。

適応された画面間予測処理の別の例には、適応された動きベクトル処理が含まれる。動きベクトルの解像度は、歪み中心から近い画像ブロックよりも、歪み中心から遠い画像ブロックの方が低い。例えば、歪み中心から遠い画像ブロックは、半画素精度までの動きベクトル精度を有してもよい。一方、歪み中心に近い画像ブロックは、１／８画素精度までという高い動きベクトル精度を有してもよい。適応した動きベクトル精度には、画像ブロック位置に基づき差が生じるため、ビットストリームにおいて符号化された動きベクトル精度は、動きベクトルの終了位置および／または開始位置に応じて、適応的であってもよい。つまり、復号装置は、パラメータを用いて、動きベクトルの精度をブロックの位置に応じて異ならせてもよい。

適応した画面間予測処理の別の例には、適応した動き補償処理が含まれ、この動き補償処理においては、ヘッダにおいて書き込まれた配置パラメータに基づいた対象のビューからの画像サンプルを予測するために、異なるビューからの画素を使用してもよい。例えば、正距円筒図法、立方体の３ｘ２のレイアウト、立方体の４ｘ３のレイアウトなどの３６０度画像の形式によって、繋ぎ合わせられた画像内の画像の配置は異なる。配置パラメータは、画像の配置に基づき、一定方向での画像の連続性を特定するために使用される。動き補償処理中に、他の画像または他のビューからの画素を画面間予測処理に使用することができ、これらの画像またはビューは配置パラメータによって特定される。いくつかの画像または画像中の画素も連続性を確保するために回転する必要がある場合がある。

つまり、復号装置は、連続性を確保する処理を行ってもよい。例えば、復号装置は、図１５に示す繋ぎ合わせ画像を符号化する場合、そのパラメータに基づいてラッピング処理を行ってもよい。具体的には、復号装置は、上述の符号化装置と同様に、画像Ａと画像Ｂとが連続するように各画像を再配置する。これにより、画像Ａおよび画像Ｂに分離されて映し出されているオブジェクトが連続し、符号化効率を向上することができる。

＜画面間予測でのパディング＞
図１８は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または画像が直線的に処理されると特定される場合、または、画像が２つ以上の画像から繋ぎ合わせられたと特定される場合に、適応される画面間予測処理の変形例を示すフローチャートである。図１８に示されるように、復号装置は、ヘッダから読み解かれたパラメータに基づいて、画像の領域がステップＳ２００１において空き領域であると特定する。これらの空き領域は、撮像された画像の画素を含んでおらず、一般的に所定の画素値（例えば、黒色画素）と置き換えられる画像の領域である。図１３は、画像内におけるこれらの領域の例を示す。図１５は、複数の画像を繋ぎ合わせる場合における、これらの領域の別の例を示す図である。次に、復号装置は、図１８のステップＳ２００２において、これらの特定された領域内の画素を、動き補償処理中に、画像の他の空き領域ではない他の領域の値でパディング処理する。パディング処理された値は、物理的な３次元の空間に応じて、空き領域ではない領域における最も近い画素、または最も近い画素からの値であってもよい。最後に、ステップＳ２００３において、復号装置は、パディング処理された値に基づいて予測サンプルのブロックを生成するためにブロック予測を行う。

＜画像再構成での歪み補正＞
図１９は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が２以上の画像から繋ぎ合わせられたと特定される場合に、適応される画像再構成処理を示すフローチャートである。図１９に示すように、復号装置は、ヘッダから読み解かれたパラメータに基づいて、画像内の位置を、ステップＳ１８０１において歪み中心または主点として判定する。図１７は、魚眼レンズによって生じた歪曲収差の一例を示す。焦点の軸芯が歪み中心から離れるにつれて、拡大は焦点の軸芯に沿って減少する。したがって、ステップＳ１８０２では、復号装置は、歪み中心に基づいて、画像内の再構成画素に対して、歪みを補正するか、または画像を直線的にするために行われた補正を元に戻すために、ラッピング処理を行ってもよい。例えば、復号装置は、逆変換によって生成される予測誤差の画像と、予測画像とを加算することによって、再構成画像を生成する。このとき、復号装置は、予測誤差の画像および予測画像のそれぞれを直線的にするためにラッピング処理を行う。

最後に、ステップＳ１８０３において、復号装置は、ラッピング処理が行われた画像の画素に基づいて、再構成された画像のブロックを、メモリに格納する。

＜画像再構成での画素値の置き換え＞
図２０は、画像がノンレクティリニア・レンズを使用して撮像されていると特定される場合、または、画像が直線的に処理されると特定される場合、または、画像が１以上の画像から繋ぎ合わせらされたと特定される場合に、適応される画像再構成処理の変形例を示す。図２０に示すように、ヘッダから読み解かれたパラメータに基づいて、ステップＳ２００１において、復号装置は、画像の領域を空き領域として特定する。これらの空き領域は、撮像された画像の画素を含んでおらず、一般的に所定の画素値（例えば黒色画素）と置換される画像の領域である。図１３は、画像におけるこれらの領域の例を示す。図１５は、複数の画像を繋ぎ合わせる場合における、これらの領域の別の例を示す図である。次に、ステップＳ２１０２において、復号装置は、画像サンプルのブロックを再構成する。

また、ステップＳ２１０３において、復号装置は、これらの特定された領域内の再構成された画素を、所定の画素値と置き換える。

＜復号処理の省略＞
図２４のステップＳ２０２において、画像の適応的動画像復号ツールの別の可能な変形例では、画像の復号処理を省略してもよい。つまり、画像のレイアウト配置に関して読み解かれたパラメータ、およびユーザの目の視線または頭の方向に基づくアクティブなビュー領域についての情報に基づいて、復号装置は、画像の復号処理を省略してもよい。すなわち、復号装置は部分復号処理を行う。

図２１は、異なるカメラによって撮像された異なるビューに関する、ユーザの視線の視角または頭の向きの一例を示す。同図に示すように、ユーザの視角はビュー１のみからのカメラによって撮像された画像内にある。この例においては、他のビューからの画像は、ユーザの視角外にあるため復号する必要はない。そのため、復号の複雑さを低減させるため、または圧縮画像の送信ビットレートを低減させるために、これらの画像に対する復号処理または表示処理を省略することができる。図示している別の可能な一例において、ビュー５およびビュー２はアクティブなビュー１に物理的に近接しているため、ビュー５からの画像、およびビュー２からの画像も、復号される。これらの画像は、現時点ではビューアまたはユーザに表示されないが、ビューアが自身の頭の向きを変える時に、ビューアまたはユーザに表示される。ユーザの頭の動きに応じてビューを復号して表示する時間を低減させることにより、ユーザが頭の向きを変更する時に、ユーザの視聴体感を向上させるために、これらの画像が可能な限り早く表示される。

図２２は、ユーザの異なるカメラによって撮像された異なるビューに対する視線の角度または頭の向きの別の一例を示す。ここでは、アクティブな視線領域は、ビュー２からの画像内にある。したがって、ビュー２からの画像が復号されてユーザに表示される。ここでは、復号装置は、ビューアの頭が近々動くと推定される範囲を予測して、今後のフレームの視線領域になる可能性がある範囲として、より広い領域を定義する。復号装置は、対象のアクティブな視線領域内ではなく、より広い今後の視線領域内にある（ビュー２以外の）ビューからの画像も復号する。つまり、ビュー２からの画像だけでなく、図２２に示す可能視線領域に少なくとも一部が重複する、トップビューおよびビュー１からの画像も復号される。これにより、ビューアの方でビューをより速く描画できるように画像が表示される。残りのビュー（ビュー３、ビュー４、および下のビュー）からの画像は復号されず、これらの画像の復号処理は省略される。

［復号装置］
図２５は、本実施の形態における動画像を復号する復号装置の構成を示すブロック図である。

復号装置１０００は、復号動画像を生成するために、ブロックごとに、入力された符号化動画像（すなわち入力ビットストリーム）を復号するための装置であって、実施の形態１の復号装置２００に相当する。図２５に示すように、復号装置１０００は、エントロピー復号部１００１、逆量子化部１００２、逆変換部１００３、ブロックメモリ１００４、フレームメモリ１００５、加算部１０２２、イントラ予測部１００６、およびインター予測部１００７を備える。

入力ビットストリームは、エントロピー復号部１００１に入力される。その後、エントロピー復号部１００１は、入力ビットストリームに対してエントロピー復号を行い、そのエントロピー復号によって得られた値（すなわち量子化値）を、逆量子化部１００２に出力する。エントロピー復号部１００１は、さらに、入力ビットストリームからパラメータを読み解き、インター予測部１００７および加算部１０２２にそのパラメータを出力する。

逆量子化部１００２は、エントロピー復号によって得られた値を逆量子化し、逆変換部１００３に周波数係数を出力する。逆変換部１００３は、周波数係数に対して逆周波数変換を行って周波数係数をサンプル値（すなわち画素値）に変換し、得られた画素値を加算部１０２２に出力する。加算部１０２２は、得られた画素値を、イントラ予測部１００６またはインター予測部１００７から出力された予測画像の画素値に加算する。つまり、加算部１０２２は、再構成画像を生成する画像再構成処理を行う。加算部１０２２は、加算によって得られた値（すなわち復号画像）をディスプレイに出力し、さらなる予測を行うために、ブロックメモリ１００４またはフレームメモリ１００５に、その得られた値を出力する。

イントラ予測部１００６は、画面内予測を行う。つまり、イントラ予測部１００６は、ブロックメモリ１００４に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。インター予測部１００７は、画面間予測を行う。つまり、インター予測部１００７は、フレームメモリ１００５に格納された、処理対象ブロックのピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。

ここで、本実施の形態では、インター予測部１００７および加算部１０２２は、読み解かれたパラメータに基づいた処理を適応させる。つまり、インター予測部１００７および加算部１０２２は、上述の適応的動画像復号ツールによる処理として、図１６、図１８、図１９および図２０に示すフローチャートにしたがった処理を行う。

（実施の形態３）
［符号化処理］
図２６に示す本開示の実施の形態３による、ノンレクティリニア・レンズを使用して撮像された画像に対して動画像符号化処理を行う方法について説明する。

図２６は、本実施の形態における動画像符号化処理の一例を示すフローチャートである。

ステップＳ３０１では、符号化装置はパラメータ一式をヘッダに書き込む。図１２は、圧縮した動画像ビットストリームにおいて上記ヘッダの可能な位置を示す。書き込まれたパラメータには、カメラの位置に関する１以上のパラメータが含まれる。書き込まれたパラメータには、さらにカメラアングルに関するパラメータ、または複数の画像を繋ぎ合わせる方法についての指示に関するパラメータが１以上含まれてもよい。

パラメータの他の例としては、カメラおよびレンズのパラメータ（例えば、カメラにおいて使用される焦点距離、主点、スケール係数、イメージセンサの形式など）が含まれる。パラメータのさらなる例としては、カメラの配置に関する物理的情報（例えば、カメラの位置、カメラの角度など）が含まれる。

本実施の形態においてヘッダに書き込まれる上記各パラメータは、カメラパラメータまたは繋ぎ合わせパラメータともいう。

図１５は、２台以上のカメラからの画像を繋ぎ合わせる方法の一例を示す。図１４は、２台以上のカメラからの画像を繋ぎ合わせる方法の別の例を示す。

次に、ステップＳ３０２において、符号化装置は画像を符号化する。ステップＳ３０２において、繋ぎ合わせられた画像に基づいて符号化処理が適応されてもよい。例えば、符号化装置は、動き補償処理において、復号された画像と同じ大きさの画像（すなわち、繋ぎ合わされていない画像）の代わりに、より大きな繋ぎ合わせられた画像を、参照画像として参照してもよい。

最後に、ステップＳ３０３において、符号化装置は、ステップＳ３０２で符号化されて再構成された画像である第１の画像を、書き込まれたパラメータに基づき、第２の画像と繋ぎ合わせて、より大きな画像を作成する。繋ぎ合わせによって得られた画像は未来のフレームの予測（すなわち画面間予測または動き補償）に使用されてもよい。

図２７は、ヘッダに書き込まれたパラメータが使用される繋ぎ合わせ処理を示すフローチャートである。ステップＳ２４０１において、符号化装置は、カメラパラメータまたは繋ぎ合わせパラメータを、対象の画像に対して書き込まれたパラメータから決定する。同様に、ステップＳ２４０２において、符号化装置は、他の画像のカメラパラメータまたは繋ぎ合わせパラメータを、他の画像に対して書き込まれたパラメータから決定する。最後に、ステップＳ２４０３において、符号化装置は、これらの決定されたパラメータを使用して画像を繋ぎ合わせ、より大きな画像を作成する。これらの決定されたパラメータが、ヘッダに書き込まれる。なお、符号化装置は、符号化効率がより向上されるように複数の画像を配置または再配置するラッピング処理またはフレームパッキングを行ってもよい。

［符号化装置］
図２８は、本実施の形態における動画像を符号化する符号化装置の構成を示すブロック図である。

符号化装置１１００は、出力ビットストリームを生成するために、ブロックごとに入力動画像を符号化するための装置であって、実施の形態１の符号化装置１００に相当する。図２８に示すように、符号化装置１１００は、変換部１１０１、量子化部１１０２、逆量子化部１１０３、逆変換部１１０４、ブロックメモリ１１０５、フレームメモリ１１０６、イントラ予測部１１０７、インター予測部１１０８、減算部１１２１、加算部１１２２、エントロピー符号化部１１０９、パラメータ導出部１１１０、および画像繋ぎ合わせ部１１１１を備える。

入力動画像の画像（すなわち処理対象ブロック）は、減算部１１２１に入力され、減算された値は変換部１１０１に出力される。つまり、減算部１１２１は、処理対象ブロックから予測画像を減算することによって、予測誤差を算出する。変換部１１０１は、減算された値（すなわち予測誤差）を周波数係数に変換し、得られた周波数係数を量子化部１１０２に出力する。量子化部１１０２は入力された周波数係数を量子化し、逆量子化部１１０３およびエントロピー符号化部１１０９に、得られた量子化値を出力する。

逆量子化部１１０３は、量子化部１１０２から出力されたサンプル値（すなわち量子化地）を逆量子化し、逆変換部１１０４に周波数係数を出力する。逆変換部１１０４は、逆周波数変換を周波数係数に対して行うことによって、その周波数係数を画像のサンプル値、すなわち画素値に変換し、その結果得られたサンプル値を加算部１１２２に出力する。

加算部１１２２は、逆変換部１１０４から出力されたサンプル値を、イントラ予測部１１０７またはインター予測部１１０８から出力された予測画像の画素値に加算する。加算部１１２２は、さらなる予測を行うために、ブロックメモリ１１０５またはフレームメモリ１１０６に、得られた加算値を出力する。

パラメータ導出部１１１０は、実施の形態１と同様に、画像の繋ぎ合わせ処理に関するパラメータ、またはカメラに関するパラメータを画像から導出して、画像繋ぎ合わせ部１１１１およびエントロピー符号化部１１０９に出力する。つまり、このパラメータ導出部１１１０は、図２７に示すステップＳ２４０１およびＳ２４０２の処理を実行する。例えば、入力動画像には、これらのパラメータが含まれていてもよく、この場合には、パラメータ導出部１１１０は、動画像に含まれるパラメータを抽出して出力する。または、入力動画像には、これらのパラメータを導出するためのベースとなるパラメータが含まれていてもよい。この場合には、パラメータ導出部１１１０は、動画像に含まれるベースのパラメータを抽出して、その抽出されたベースのパラメータを、上述の各パラメータに変換して出力する。

画像繋ぎ合わせ部１１１１は、図２６のステップＳ３０３および図２７のステップＳ２４０３に示すように、パラメータを用いて、再構成された対象画像を他の画像に繋ぎ合わせる。その後、画像繋ぎ合わせ部１１１１は、繋ぎ合わせられた画像をフレームメモリ１１０６に出力する。

イントラ予測部１１０７は、画面内予測を行う。つまり、イントラ予測部１１０７は、ブロックメモリ１１０５に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。インター予測部１１０８は、画面間予測を行う。つまり、インター予測部１１０８は、フレームメモリ１１０６に格納された、処理対象ブロックの画像のピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。このとき、インター予測部１１０８は、フレームメモリ１１０６に格納されている、画像繋ぎ合わせ部１１１１によって複数の画像が繋ぎ合わされて得られた大きな画像を、参照画像として参照してもよい。

エントロピー符号化部１１０９は、量子化部１１０２から出力された量子化値を符号化し、パラメータ導出部１１１０からパラメータを取得し、ビットストリームを出力する。つまり、エントロピー符号化部１１０９は、量子化値およびパラメータに対してエントロピー符号化を行い、そのパラメータをビットストリームのヘッダに書き込む。

［復号処理］
図２９は、本実施の形態における動画像復号処理の一例を示すフローチャートである。

ステップＳ４０１では、復号装置は、ヘッダからパラメータ一式を読み解く。図１２は、圧縮したビデオビットストリームにおける上記ヘッダの可能な位置を示す。読み解かれたパラメータは、カメラの位置に関する１以上のパラメータを含む。読み解かれたパラメータは、さらにカメラアングルに関するパラメータ、または複数の画像を繋ぎ合わせる方法についての指示に関するパラメータが１以上含まれてもよい。パラメータの他の例としては、カメラとレンズのパラメータ（例えばカメラにおいて使用される焦点距離、主点、スケール係数、イメージセンサの形式など）が含まれる。パラメータのさらなる例としては、カメラの配置に関する物理的情報（例えば、カメラの位置、カメラの角度など）が含まれる。

図１５は、２台以上のカメラからの画像を繋ぎ合わせられる方法の一例を示す。図１４は、２台以上のカメラからの画像を繋ぎ合わせられる方法の別の例を示す。

次に、ステップＳ４０２において、復号装置は画像を復号する。ステップＳ４０２における復号処理も、繋ぎ合わせられた画像に基づいて適応させてもよい。例えば、復号装置は、動き補償処理において、復号画像と同じ大きさの画像（すなわち、繋ぎ合わされていない画像）の代わりに、繋ぎ合わせられたより大きな画像を、参照画像として参照することができる。

また、最後に、ステップＳ４０３において、復号装置は、ステップＳ４０２において再構成された画像である第１の画像を、読み解かれたパラメータに基づき、第２の画像と繋ぎ合わせて、より大きな画像を作成する。繋ぎ合わせによって得られた画像は、未来の画像の予測（すなわち画面間予測または動き補償）に使用されてもよい。

図２７は、読み解かれたパラメータを使用する繋ぎ合わせ処理を示すフローチャートである。ステップＳ２４０１において、復号装置は、カメラパラメータまたは繋ぎ合わせパラメータを、対象画像に対するヘッダを読み解くことによって決定する。同様に、復号装置は、ステップＳ２４０２において、カメラパラメータまたは繋ぎ合わせパラメータを、他の画像に対するヘッダを読み解くことによって決定される。最後に、ステップＳ２４０３において、復号装置は、これらの読み解かれたパラメータを使用して画像を繋ぎ合わせ、より大きな画像を作成する。

［復号装置］
図３０は、本実施の形態における動画像を復号する復号装置の構成を示すブロック図である。

復号装置１２００は、入力された符号化動画像（すなわち入力ビットストリーム）をブロックごとに復号して復号動画像を出力する装置であって、実施の形態１の復号装置２００に相当する。図３０に示されるように、復号装置１２００は、エントロピー復号部１２０１、逆量子化部１２０２、逆変換部１２０３、ブロックメモリ１２０４、フレームメモリ１２０５、加算部１２２２、イントラ予測部１２０６、インター予測部１２０７、および画像繋ぎ合わせ部１２０８を備える。

入力ビットストリームは、エントロピー復号部１２０１に入力される。その後、エントロピー復号部１２０１は、入力ビットストリームに対してエントロピー復号を行い、そのエントロピー復号によって得られた値（すなわち量子化値）を、逆量子化部１２０２に出力する。エントロピー復号部１２０１は、さらに、入力ビットストリームからパラメータを読み解き、そのパラメータを画像繋ぎ合わせ部１２０８に出力する。

画像繋ぎ合わせ部１２０８は、パラメータを用いて、再構成された対象画像を他の画像に繋ぎ合わせる。その後、画像繋ぎ合わせ部１２０８は、繋ぎ合わせによって得られた画像をフレームメモリ１２０５に出力する。

逆量子化部１２０２は、エントロピー復号によって得られた値を逆量子化し、逆変換部１２０３に周波数係数を出力する。逆変換部１２０３は、周波数係数に対して逆周波数変換を行い、周波数係数をサンプル値（すなわち画素値）に変換し、その結果得られた画素値を加算部１２２２に出力する。加算部１２２２は、その結果得られた画素値を、イントラ予測部１２０６またはインター予測部１２０７から出力された予測画像の画素値に加算する。加算部１２２２は、加算によって得られた値（すなわち復号画像）をディスプレイに出力し、さらなる予測のために、ブロックメモリ１２０４またはフレームメモリ１２０５に、その得られた値を出力する。

イントラ予測部１２０６は、画面内予測を行う。つまり、イントラ予測部１２０６は、ブロックメモリ１２０４に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。インター予測部１２０７は、画面間予測を行う。つまり、インター予測部１２０７は、フレームメモリ１２０５に格納された、処理対象ブロックのピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。

（実施の形態４）
［符号化処理］
図３１に示す本開示の実施の形態４による、ノンレクティリニア・レンズを使用して撮像された画像に対して、動画像符号化処理を行う方法について説明する。

図３１は、本実施の形態における動画像符号化処理の一例を示すフローチャートである。

ステップＳ５０１では、符号化装置はパラメータ一式をヘッダに書き込む。図１２は、圧縮された動画像ビットストリームにおける上記ヘッダの可能な位置を示す。書き込まれたパラメータには、画像がノンレクティリニア・レンズで撮像されているかどうかを示す識別子に関する１以上のパラメータが含まれる。図１３に示すように、撮像された画像は、画像の撮像中に使用されるレンズの特性により歪んでいてもよい。書き込まれたパラメータの一例としては、歪みの中心または主軸の位置を示すパラメータである。

次に、ステップＳ５０２において、符号化装置は、書き込まれたパラメータに基づく適応的動画像符号化ツールによって画像を符号化する。適応的動画像符号化ツールには、動きベクトル予測処理が含まれる。適応的動画像符号化ツールの一式には、画面内予測処理が含まれてもよい。

＜画面内予測処理＞
図３２は、書き込まれたパラメータに基づいて適応される画面内予測処理を示すフローチャートである。図３２に示すように、符号化装置は、ステップＳ２２０１において、書き込まれたパラメータに基づいて、画像内のある位置を歪み中心または主点として判定する。次に、ステップＳ２２０２において、符号化装置は、空間的に近隣の画素値を用いて一つのサンプルグループを予測する。サンプルグループは、例えば処理対象ブロックなどの画素群である。

最後に、ステップＳ２２０３において、符号化装置は、予測されたサンプルグループに対して、判定された歪み中心または主点を用いてラッピング処理を行い、予測サンプルのブロックを生成する。例えば、符号化装置は、その予測サンプルのブロックの画像を歪ませ、その歪んだ画像を予測画像として用いてもよい。

＜動きベクトル予測＞
図３３は、書き込まれたパラメータに基づいて適応される動きベクトル予測処理を示すフローチャートである。図３３に示すように、符号化装置は、ステップＳ２３０１において、書き込まれたパラメータに基づいて、画像内のある位置を歪み中心または主点として判定する。次に、ステップＳ２３０２において、符号化装置は、空間的か時間的に隣接する動きベクトルから動きベクトルを予測する。

最後に、ステップＳ２３０３において、符号化装置は、判定された歪み中心または主点を用いて、予測された動きベクトルの方向を補正する。

［符号化装置］
図３４は、本実施の形態において動画像を符号化する符号化装置の構成を示すブロック図である。

符号化装置１３００は、出力ビットストリームを生成するために、ブロックごとに入力動画像を符号化するための装置であって、実施の形態１の符号化装置１００に相当する。図３４に示すように、符号化装置１３００は、変換部１３０１、量子化部１３０２、逆量子化部１３０３、逆変換部１３０４、ブロックメモリ１３０５、フレームメモリ１３０６、イントラ予測部１３０７、インター予測部１３０８、減算部１３２１、加算部１３２２、エントロピー符号化部１３０９、およびパラメータ導出部１３１０を備える。

入力動画像の画像（すなわち処理対象ブロック）は、減算部１３２１へ入力され、減算された値は変換部１３０１に出力される。つまり、減算部１３２１は、処理対象ブロックから予測画像を減算することによって、予測誤差を算出する。変換部１３０１は、減算された値（すなわち予測誤差）を周波数係数に変換し、その結果得られた周波数係数を量子化部１３０２に出力する。量子化部１３０２は、入力された周波数係数を量子化し、逆量子化部１３０３およびエントロピー符号化部１３０９に、その結果得られた量子化値を出力する。

逆量子化部１３０３は、量子化部１３０２から出力されたサンプル値（すなわち量子化値）を逆量子化し、逆変換部１３０４に周波数係数を出力する。逆変換部１３０４は、周波数係数に対して逆周波数変換を行い、周波数係数を画像のサンプル値、すなわち画素値に変換し、その結果得られたサンプル値を加算部１３２２に出力する。

パラメータ導出部１３１０は、実施の形態１と同様に、画像から、その画像がノンレクティリニア・レンズで撮像されているかどうかを示す識別子に関する１以上のパラメータ（具体的には、歪み中心または主点を示すパラメータ）を導出する。そして、パラメータ導出部１３１０は、導出されたパラメータを、イントラ予測部１３０７、インター予測部１３０８、およびエントロピー符号化部１３０９に出力する。例えば、入力動画像には、これらのパラメータが含まれていてもよく、この場合には、パラメータ導出部１３１０は、動画像に含まれるパラメータを抽出して出力する。または、入力動画像には、これらのパラメータを導出するためのベースとなるパラメータが含まれていてもよい。この場合には、パラメータ導出部１３１０は、動画像に含まれるベースのパラメータを抽出して、その抽出されたベースのパラメータを、上述の各パラメータに変換して出力する。

加算部１３２２は、逆変換部１３０４から出力された画像のサンプル値を、イントラ予測部１３０７またはインター予測部１３０８から出力された予測画像の画素値に加算する。加算部９２２は、さらなる予測を行うために、得られた加算値をブロックメモリ１３０５またはフレームメモリ１３０６に出力する。

イントラ予測部１３０７は、画面内予測を行う。つまり、イントラ予測部１３０７は、ブロックメモリ１３０５に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。インター予測部１３０８は、画面間予測を行う。つまり、インター予測部１３０８は、フレームメモリ１３０６内の、処理対象ブロックのピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。

ここで、本実施の形態では、イントラ予測部１３０７およびインター予測部１３０８は、パラメータ導出部１３１０によって導出されたパラメータに基づいた処理を行う。つまり、イントラ予測部１３０７およびインター予測部１３０８はそれぞれ、図３２および図３３に示すフローチャートにしたがった処理を行う。

エントロピー符号化部１３０９は、量子化部１３０２から出力された量子化値と、パラメータ導出部１３１０によって導出されたパラメータとを符号化し、ビットストリームを出力する。つまり、エントロピー符号化部１３０９は、そのパラメータをビットストリームのヘッダに書き込む。

［復号処理］
図３５は、本実施の形態における動画像復号処理の一例を示すフローチャートである。

ステップＳ６０１では、復号装置は、パラメータ一式をヘッダから読み解く。図１２は、圧縮された動画像ビットストリームにおける上記ヘッダの可能な位置を示す。読み解かれたパラメータには、画像がノンレクティリニア・レンズで撮像されているかどうかを示す識別子に関する１以上のパラメータが含まれる。図１３に示すように、撮像された画像は、画像の撮像中に使用されるレンズの特性により歪んでいてもよい。読み解かれたパラメータの一例としては、歪みの中心または主軸の位置を示すパラメータである。

次に、ステップＳ６０２において、復号装置は、これらの読み解かれたパラメータに基づいて、適応的動画像復号化ツールによって画像を復号する。適応的動画像復号ツールは、動きベクトル予測処理を含む。適応的動画像復号ツールは、画面内予測処理も含んでもよい。なお、動画像復号ツールまたは適応的動画像復号ツールは、上述の動画像符号化ツールまたは適応的動画像符号化ツールと同一またはそれに対応するツールである。

＜画面内予測処理＞
図３２は、読み解かれたパラメータに基づいて適応される画面内予測処理を示すフローチャートである。図３２に示されるように、復号装置は、ステップＳ２２０１において、読み解かれたパラメータに基づいて、画像内のある位置を歪み中心または主点として判定する。次に、ステップＳ２２０２において、復号装置は、空間的に近隣の画素値を用いて、一つのサンプルグループを予測する。最後に、ステップＳ２２０３において、復号装置は、予測されたサンプルグループに対して、判定された歪み中心または主点を用いてラッピング処理を行い、予測サンプルのブロックを生成する。例えば、復号装置は、その予測サンプルのブロックの画像を歪ませ、その歪んだ画像を予測画像として用いてもよい。

＜動きベクトル予測＞
図３３は、読み解かれたパラメータに基づいて適応される動きベクトル予測処理を示すフローチャートである。図３３に示すように、復号装置は、ステップＳ２３０１において、読み解かれたパラメータに基づいて、画像内のある位置を歪み中心または主点として判定する。次に、ステップＳ２３０２において、復号装置は、空間的か時間的に隣接する動きベクトルから動きベクトルを予測する。最後に、ステップＳ２３０３において、復号装置は、判定された歪み中心または主点を用いて、動きベクトルの方向を補正する。

［復号装置］
図３６は、本実施の形態における、動画像を復号する復号装置の構成を示すブロック図である。

復号装置１４００は、入力された符号化動画像（すなわち入力ビットストリーム）をブロックごとに復号し、復号動画像を出力するための装置であって、実施の形態１の復号装置２００に相当する。図３６に示すように、復号装置１４００は、エントロピー復号部１４０１、逆量子化部１４０２、逆変換部１４０３、ブロックメモリ１４０４、フレームメモリ１４０５、加算部１４２２、イントラ予測部１４０６、およびインター予測部１４０７を備える。

入力ビットストリームは、エントロピー復号部１４０１に入力される。その後、エントロピー復号部１４０１は、入力ビットストリームに対してエントロピー復号を行い、そのエントロピー復号によって得られた値（すなわち量子化値）を、逆量子化部１４０２に出力する。エントロピー復号部１４０１は、さらに、入力ビットストリームからパラメータを読み解き、インター予測部１４０７およびイントラ予測部１４０６にそのパラメータを出力する。

逆量子化部１４０２は、エントロピー復号によって得られた値を逆量子化し、逆変換部１４０３に周波数係数を出力する。逆変換部１４０３は、周波数係数に対して逆周波数変換を行って、周波数係数をサンプル値（すなわち画素値）に変換し、その結果得られた画素値を加算部１４２２に出力する。加算部１４２２は、その結果得られた画素値を、イントラ予測部１４０６またはインター予測部１４０７から出力された予測画像の画素値に加算する。加算部１４２２は、加算によって得られた値（すなわち復号画像）をディスプレイに出力し、さらなる予測のために、ブロックメモリ１４０４またはフレームメモリ１４０５に、その得られた値を出力する。

イントラ予測部１４０６は、画面内予測を行う。つまり、イントラ予測部１４０６は、ブロックメモリ１４０４に格納された、処理対象ブロックのピクチャと同じピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を予測する。インター予測部１４０７は、画面間予測を行う。つまり、インター予測部１４０７は、フレームメモリ１４０５に格納された、処理対象ブロックのピクチャと異なるピクチャに含まれる再構成画像を用いて、処理対象ブロックの画像を推定する。

ここで、本実施の形態では、インター予測部１４０７およびイントラ予測部１４０６は、読み解かれたパラメータに基づいて処理を適応させる。つまり、インター予測部１４０７およびイントラ予測部１４０６は、適応的動画像復号ツールによる処理として、図３２および図３３に示すフローチャートにしたがった処理を行う。

（まとめ）
以上、本開示の符号化装置および復号装置の一例について各実施の形態を用いて説明したが、本開示の一態様に係る符号化装置および復号装置は、これらの実施の形態に限定されるものではない。

例えば、上記各実施の形態では、符号化装置は、画像の歪みに関するパラメータ、または画像の繋ぎ合わせに関するパラメータを用いて、動画像を符号化し、復号装置は、それらのパラメータを用いて、符号化された動画像を復号する。しかし、本開示の一態様に係る符号化装置および復号装置は、それらのパラメータを用いた符号化または復号を行わなくてもよい。つまり、上記実施の形態における適応的動画像符号化ツールおよび適応的動画像復号ツールを用いた処理を行わなくてもよい。

図３７は、本開示の一態様に係る符号化装置のブロック図である。

本開示の一態様に係る符号化装置１５００は、実施の形態１の符号化装置１００に相当する装置であって、図３７に示すように、変換部１５０１、量子化部１５０２、逆量子化部１５０３、逆変換部１５０４、ブロックメモリ１５０５、フレームメモリ１５０６、イントラ予測部１５０７、インター予測部１５０８、減算部１５２１、加算部１５２２、およびエントロピー符号化部１５０９を備える。なお、符号化装置１５００は、パラメータ導出部９１０、１１１０および１３１０を備えていない。

符号化装置１５００に含まれる上記各構成要素は、上記実施の形態１〜４と同様の処理を実行するが、適応的動画像符号化ツールを用いた処理を行わない。つまり、加算部１５２２、イントラ予測部１５０７およびインター予測部１５０８は、実施の形態２〜４のパラメータ導出部９１０、１１１０および１３１０のそれぞれによって導出されるパラメータを用いずに、符号化のための処理を行う。

また、符号化装置１５００は、動画像と、その動画像に関するパラメータとを取得し、そのパラメータを使わずに動画像を符号化することによってビットストリームを生成し、そのビットストリームに上述のパラメータを書き込む。具体的には、エントロピー符号化部１５０９が、パラメータをビットストリームに書き込む。なお、ビットストリームに書き込まれるパラメータの位置はどのような位置であってもよい。

また、符号化装置１５００に入力される上述の動画像に含まれる各画像（すなわちピクチャ）は、歪みが補正された画像であってもよく、または、複数のビューからの画像を繋ぎ合わせることによって得られる繋ぎ合わせ画像であってもよい。歪みが補正された画像は、ノンレクティリニア・レンズのような広角レンズによって撮像された画像の歪みを補正することによって得られる矩形の画像である。このような符号化装置１５００は、その歪みが補正された画像または繋ぎ合わせ画像を含む動画像を符号化する。

ここで、量子化部１５０２、逆量子化部１５０３、逆変換部１５０４、イントラ予測部１５０７、インター予測部１５０８、減算部１５２１、加算部１５２２、およびエントロピー符号化部１５０９は、例えば処理回路として構成される。さらに、ブロックメモリ１５０５およびフレームメモリ１５０６は、メモリとして構成される。

つまり、符号化装置１５００は、処理回路と、その処理回路に接続されたメモリとを備える。この処理回路は、メモリを用いて、広角レンズによって撮像された画像の歪みを補正する第１の処理と、複数の画像を繋ぎ合せる第２の処理とのうちの少なくとも１つの処理に関するパラメータを取得し、上記画像または上記複数の画像に基づく処理対象の画像を符号化することによって符号化画像を生成し、その符号化画像を含むビットストリームにパラメータを書き込む。

これにより、ビットストリームには上述のパラメータが書き込まれているため、そのパラメータを用いることによって、符号化または復号される画像を適切に扱うことができる。

ここで、そのパラメータの書き込みでは、パラメータをビットストリーム中のヘッダに書き込んでもよい。また、処理対象の画像の符号化では、その処理対象の画像に含まれるブロックごとに、パラメータに基づく符号化処理を当該ブロックに適応することによって、当該ブロックを符号化してもよい。ここで、その符号化処理は、画面間予測処理および画像再構成処理のうちの少なくとも１つを含んでもよい。

これにより、例えば、実施の形態２のように、画面間予測処理および画像再構成処理を適応的動画像符号化ツールとして用いることによって、例えば歪んだ画像、または、繋ぎ合わせ画像である処理対象の画像を適切に符号化することができる。その結果、その処理対象の画像に対する符号化効率を向上することができる。

また、パラメータの書き込みでは、上述の第２の処理に関するパラメータを、ビットストリーム中のヘッダに書き込み、処理対象の画像の符号化では、その第２の処理によって得られた処理対象の画像に含まれるブロックごとに、そのパラメータに基づいて、当該ブロックに対する符号化処理を省略してもよい。

これにより、例えば、実施の形態２における図２１および図２２に示すように、繋ぎ合わせ画像に含まれる複数の画像のうち、ユーザによって近い将来に注視されない画像に含まれる各ブロックの符号化を省略することができる。その結果、処理負担の軽減、および符号量の削減を図ることができる。

また、パラメータの書き込みでは、上述の第２の処理に関するパラメータとして、複数のカメラのそれぞれの、位置およびカメラアングルのうちの少なくとも１つをビットストリーム中のヘッダに書き込んでもよい。また、処理対象の画像の符号化では、上述の複数の画像のうちの１つである処理対象の画像を符号化し、処理対象の画像を、そのヘッダに書き込まれるパラメータを用いて、上述の複数の画像のうちの他の画像と繋ぎ合わせてもよい。

これにより、例えば、実施の形態３のように、繋ぎ合わせによって得られる大きな画像を画面間予測または動き補償に用いることができ、符号化効率を向上することができる。

また、パラメータの書き込みでは、上述の第１の処理に関するパラメータとして、画像が広角レンズで撮像されているか否かを示すパラメータ、および、広角レンズによって生じた歪曲収差に関するパラメータのうちの少なくとも１つを、ビットストリーム中のヘッダに書き込んでもよい。また、処理対象の画像の符号化では、広角レンズによって撮像された画像である処理対象の画像に含まれるブロックごとに、そのヘッダに書き込まれるパラメータに基づく符号化処理を当該ブロックに適応することによって、当該ブロックを符号化してもよい。ここで、その符号化処理は、動きベクトル予測処理および画面内予測処理のうちの少なくとも１つを含んでもよい。

これにより、例えば実施の形態４のように、動きベクトル予測処理および画面内予測処理を適応的動画像符号化ツールとして用いることによって、例えば歪んだ画像である処理対象の画像を適切に符号化することができる。その結果、歪んだ画像の符号化効率の向上を図ることができる。

また、符号化処理は、画面間予測処理および画面内予測処理のうちの一方の予測処理を含み、その予測処理は、画像に含まれる複数の画素の配置または再配置を行う処理であるラッピング処理を含んでもよい。

これにより、例えば実施の形態２のように、処理対象の画像の歪みを補正して、補正された画像に基づいて適切に画面間予測処理を行うことができる。また、例えば実施の形態４のように、歪んだ画像に対して画面内予測処理を行って、その処理によって得られる予測画像を、歪んだ処理対象の画像にあわせて適切に歪ませることができる。その結果、歪んだ画像の符号化効率の向上を図ることができる。

また、符号化処理は、画面間予測処理を含み、その画面間予測処理は、湾曲した、斜めの、または角のある画像境界に対する処理であって、上述のヘッダに書き込まれるパラメータを用いた画像のパディング処理を含んでもよい。

これにより、例えば実施の形態２のように、画面間予測処理を適切に行うことができ、符号化効率を向上することができる。

また、符号化処理は、画面間予測処理および画像再構成処理を含み、その画面間予測処理および画像再構成処理はそれぞれ、上述のヘッダに書き込まれるパラメータに基づいて画素値を所定の値に置き換えるための処理を含んでもよい。

これにより、例えば実施の形態２のように、画面間予測処理および画像再構成処理を適切に行うことができ、符号化効率を向上することができる。

また、処理対象の画像の符号化では、符号化された処理対象の画像を再構成し、再構成された処理対象の画像と上述の他の画像との繋ぎ合わせによって得られる画像を、画面間予測処理に使用される参照フレームとしてメモリに格納してもよい。

なお、上記実施の形態２〜４の符号化装置は、歪んだ画像を含む動画像、繋ぎ合わせ画像を含む動画像、または、複数のビューからの繋ぎ合わされていない画像を含む動画像を符号化する。しかし、本開示の符号化装置は、動画像の符号化のために、その動画像に含まれる画像の歪みを補正してもよく、歪みを補正しなくてもよい。歪みを補正しない場合には、符号化装置は、予め他の装置によってその歪みが補正された画像を含む動画像を取得して、その動画像を符号化する。同様に、本開示の符号化装置は、動画像の符号化のために、その動画像に含まれる複数のビューからの画像を繋ぎ合わせてもよく、繋ぎ合わせをしなくてもよい。繋ぎ合わせをしない場合には、符号化装置は、予め他の装置によって複数のビューからの画像が繋ぎ合わされた画像を含む動画像を取得して、その動画像を符号化する。また、本開示の符号化装置は、歪みの補正の全てを行ってもよく、一部のみを行ってもよい。さらに、本開示の符号化装置は、複数のビューからの画像の繋ぎ合わせの全てを行ってもよく、一部のみを行ってもよい。

図３８は、本開示の一態様に係る復号装置のブロック図である。

本開示の一態様に係る復号装置１６００は、実施の形態１の復号装置２００に相当する装置であって、図３８に示すように、エントロピー復号部１６０１、逆量子化部１６０２、逆変換部１６０３、ブロックメモリ１６０４、フレームメモリ１６０５、イントラ予測部１６０６、インター予測部１６０７、および加算部１６２２を備える。

復号装置１６００に含まれる上記各構成要素は、上記実施の形態１〜４と同様の処理を実行するが、適応的動画像復号ツールを用いた処理を行わない。つまり、加算部１６２２、イントラ予測部１６０６およびインター予測部１６０７は、ビットストリームに含まれる上述のパラメータを用いずに、復号のための処理を行う。

また、復号装置１６００は、ビットストリームを取得し、そのビットストリームから、符号化された動画像およびパラメータを抽出し、符号化された動画像をそのパラメータを使わずに復号する。具体的には、エントロピー復号部１６０１が、パラメータをビットストリームから読み解く。なお、ビットストリームに書き込まれているパラメータの位置はどのような位置であってもよい。

また、復号装置１６００に入力されるビットストリームに含まれる各画像（すなわち符号化されたピクチャ）は、歪みが補正された画像であってもよく、または、複数のビューからの画像を繋ぎ合わせることによって得られる繋ぎ合わせ画像であってもよい。歪みが補正された画像は、ノンレクティリニア・レンズのような広角レンズによって撮像された画像の歪みを補正することによって得られる矩形の画像である。このような復号装置１６００は、その歪みが補正された画像または繋ぎ合わせ画像を含む動画像を復号する。

ここで、エントロピー復号部１６０１、逆量子化部１６０２、逆変換部１６０３、イントラ予測部１６０６、インター予測部１６０７、および加算部１６２２は、例えば処理回路として構成される。さらに、ブロックメモリ１６０４およびフレームメモリ１６０５は、メモリとして構成される。

つまり、復号装置１６００は、処理回路と、その処理回路に接続されたメモリとを備える。この処理回路は、メモリを用いて、符号化画像を含むビットストリームを取得し、広角レンズによって撮像された画像の歪みを補正する第１の処理と、複数の画像を繋ぎ合せる第２の処理とのうちの少なくとも１つの処理に関するパラメータを、そのビットストリームから読み解き、その符号化画像を復号する。

これにより、ビットストリームから読み解かれた上述のパラメータを用いることによって、符号化または復号される画像を適切に扱うことができる。

ここで、そのパラメータの読み解きでは、パラメータをビットストリーム中のヘッダから読み解いてもよい。また、符号化画像の復号では、その符号化画像に含まれるブロックごとに、パラメータに基づく復号処理を当該ブロックに適応することによって、当該ブロックを復号してもよい。ここで、その復号処理は、画面間予測処理および画像再構成処理のうちの少なくとも１つを含んでもよい。

これにより、例えば、実施の形態２のように、画面間予測処理および画像再構成処理を適応的動画像復号ツールとして用いることによって、例えば歪んだ画像、または、繋ぎ合わせ画像である符号化画像を適切に復号することができる。

また、パラメータの読み解きでは、上述の第２の処理に関するパラメータを、ビットストリーム中のヘッダから読み解き、符号化画像の復号では、その第２の処理によって得られた画像の符号化によって生成された符号化画像に含まれるブロックごとに、そのパラメータに基づいて、当該ブロックに対する復号処理を省略してもよい。

これにより、例えば、実施の形態２における図２１および図２２に示すように、符号化画像である繋ぎ合わせ画像に含まれる複数の画像のうち、ユーザによって近い将来に注視されない画像に含まれる各ブロックの復号を省略することができる。その結果、処理負担の軽減を図ることができる。

また、パラメータの読み解きでは、上述の第２の処理に関するパラメータとして、複数のカメラのそれぞれの、位置およびカメラアングルのうちの少なくとも１つをビットストリーム中のヘッダから読み解いてもよい。また、符号化画像の復号では、上述の複数の画像のうちの１つの符号化によって生成された符号化画像を復号し、復号された符号化画像を、そのヘッダから読み解かれたパラメータを用いて、上述の複数の画像のうちの他の画像と繋ぎ合わせてもよい。

これにより、例えば、実施の形態３のように、繋ぎ合わせによって得られる大きな画像を画面間予測または動き補償に用いることができ、符号化効率が向上されたビットストリームを適切に復号することができる。

また、パラメータの読み解きでは、上述の第１の処理に関するパラメータとして、画像が広角レンズで撮像されているか否かを示すパラメータ、および、広角レンズによって生じた歪曲収差に関するパラメータのうちの少なくとも１つを、ビットストリーム中のヘッダから読み解いてもよい。また、符号化画像の復号では、広角レンズによって撮像された画像の符号化によって生成された符号化画像に含まれるブロックごとに、そのヘッダから読み解かれたパラメータに基づく復号処理を当該ブロックに適応することによって、当該ブロックを復号してもよい。ここで、その復号処理は、動きベクトル予測処理および画面内予測処理のうちの少なくとも１つを含んでもよい。

これにより、例えば実施の形態４のように、動きベクトル予測処理および画面内予測処理を適応的動画像復号ツールとして用いることによって、例えば歪んだ画像である符号化画像を適切に復号することができる。

また、復号処理は、画面間予測処理および画面内予測処理のうちの一方の予測処理を含み、その予測処理は、画像に含まれる複数の画素の配置または再配置を行う処理であるラッピング処理を含んでもよい。

これにより、例えば実施の形態２のように、符号化画像の歪みを補正して、補正された画像に基づいて適切に画面間予測処理を行うことができる。また、例えば実施の形態４のように、歪んだ符号化画像に対して画面内予測処理を行い、その結果得られる予測画像を、その歪んだ符号化画像にあわせて適切に歪ませることができる。その結果、歪んだ画像である符号化画像を適切に予測することができる。

また、復号処理は、画面間予測処理を含み、その画面間予測処理は、湾曲した、斜めの、または角のある画像境界に対する処理であって、上述のヘッダから読み解かれたパラメータを用いた画像のパディング処理を含んでもよい。

これにより、例えば実施の形態２のように、画面間予測処理を適切に行うことができる。

また、復号処理は、画面間予測処理および画像再構成処理を含み、その画面間予測処理および画像再構成処理はそれぞれ、上述のヘッダから読み解かれたパラメータに基づいて画素値を所定の値に置き換えるための処理を含んでもよい。

これにより、例えば実施の形態２のように、画面間予測処理および画像再構成処理を適切に行うことができる。

また、符号化画像の復号では、その符号化画像を復号し、復号された符号化画像と上述の他の画像との繋ぎ合わせによって得られる画像を、画面間予測処理に使用される参照フレームとしてメモリに格納してもよい。

これにより、例えば、実施の形態３のように、繋ぎ合わせによって得られる大きな画像を画面間予測または動き補償に用いることができる。

なお、上記実施の形態２〜４の復号装置は、歪んだ画像を含むビットストリーム、繋ぎ合わせ画像を含むビットストリーム、または、複数のビューからの繋ぎ合わされていない画像を含むビットストリームを復号する。しかし、本開示の復号装置は、ビットストリームの復号のために、そのビットストリームに含まれる画像の歪みを補正してもよく、歪みを補正しなくてもよい。歪みを補正しない場合には、復号装置は、予め他の装置によってその歪みが補正された画像を含むビットストリームを取得して、そのビットストリームを復号する。同様に、本開示の復号装置は、ビットストリームの復号のために、そのビットストリームに含まれる複数のビューからの画像を繋ぎ合わせてもよく、繋ぎ合わせをしなくてもよい。繋ぎ合わせをしない場合には、復号装置は、予め他の装置によって複数のビューからの画像が繋ぎ合わされて生成された大きな画像を含むビットストリームを取得して、そのビットストリームを復号する。また、本開示の復号装置は、歪みの補正の全てを行ってもよく、一部のみを行ってもよい。さらに、本開示の復号装置は、複数のビューからの画像の繋ぎ合わせの全てを行ってもよく、一部のみを行ってもよい。

（その他の実施の形態）
以上の各実施の形態において、機能ブロックの各々は、通常、ＭＰＵ及びメモリ等によって実現可能である。また、機能ブロックの各々による処理は、通常、プロセッサなどのプログラム実行部が、ＲＯＭ等の記録媒体に記録されたソフトウェア（プログラム）を読み出して実行することで実現される。当該ソフトウェアはダウンロード等により配布されてもよいし、半導体メモリなどの記録媒体に記録して配布されてもよい。なお、各機能ブロックをハードウェア（専用回路）によって実現することも、当然、可能である。

また、各実施の形態において説明した処理は、単一の装置（システム）を用いて集中処理することによって実現してもよく、又は、複数の装置を用いて分散処理することによって実現してもよい。また、上記プログラムを実行するプロセッサは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、又は分散処理を行ってもよい。

本発明は、以上の実施例に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含される。

さらにここで、上記各実施の形態で示した動画像符号化方法（画像符号化方法）又は動画像復号化方法（画像復号方法）の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、画像復号方法を用いた画像復号装置、及び両方を備える画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。

［使用例］
図３９は、コンテンツ配信サービスを実現するコンテンツ供給システムｅｘ１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ｅｘ１０６、ｅｘ１０７、ｅｘ１０８、ｅｘ１０９、ｅｘ１１０が設置されている。

このコンテンツ供給システムｅｘ１００では、インターネットｅｘ１０１に、インターネットサービスプロバイダｅｘ１０２又は通信網ｅｘ１０４、及び基地局ｅｘ１０６〜ｅｘ１１０を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器が接続される。当該コンテンツ供給システムｅｘ１００は、上記のいずれかの要素を組合せて接続するようにしてもよい。固定無線局である基地局ｅｘ１０６〜ｅｘ１１０を介さずに、各機器が電話網又は近距離無線等を介して直接的又は間接的に相互に接続されていてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１等を介して、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、及びスマートフォンｅｘ１１５などの各機器と接続される。また、ストリーミングサーバｅｘ１０３は、衛星ｅｘ１１６を介して、飛行機ｅｘ１１７内のホットスポット内の端末等と接続される。

なお、基地局ｅｘ１０６〜ｅｘ１１０の代わりに、無線アクセスポイント又はホットスポット等が用いられてもよい。また、ストリーミングサーバｅｘ１０３は、インターネットｅｘ１０１又はインターネットサービスプロバイダｅｘ１０２を介さずに直接通信網ｅｘ１０４と接続されてもよいし、衛星ｅｘ１１６を介さず直接飛行機ｅｘ１１７と接続されてもよい。

カメラｅｘ１１３はデジタルカメラ等の静止画撮影、及び動画撮影が可能な機器である。また、スマートフォンｅｘ１１５は、一般に２Ｇ、３Ｇ、３．９Ｇ、４Ｇ、そして今後は５Ｇと呼ばれる移動通信システムの方式に対応したスマートフォン機、携帯電話機、又はＰＨＳ（ＰｅｒｓｏｎａｌＨａｎｄｙｐｈｏｎｅＳｙｓｔｅｍ）等である。

家電ｅｘ１１８は、冷蔵庫、又は家庭用燃料電池コージェネレーションシステムに含まれる機器等である。

コンテンツ供給システムｅｘ１００では、撮影機能を有する端末が基地局ｅｘ１０６等を通じてストリーミングサーバｅｘ１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、端末（コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、及び飛行機ｅｘ１１７内の端末等）は、ユーザが当該端末を用いて撮影した静止画又は動画コンテンツに対して上記各実施の形態で説明した符号化処理を行い、符号化により得られた映像データと、映像に対応する音を符号化した音データと多重化し、得られたデータをストリーミングサーバｅｘ１０３に送信する。即ち、各端末は、本発明の一態様に係る画像符号化装置として機能する。

一方、ストリーミングサーバｅｘ１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントは、上記符号化処理されたデータを復号化することが可能な、コンピュータｅｘ１１１、ゲーム機ｅｘ１１２、カメラｅｘ１１３、家電ｅｘ１１４、スマートフォンｅｘ１１５、又は飛行機ｅｘ１１７内の端末等である。配信されたデータを受信した各機器は、受信したデータを復号化処理して再生する。即ち、各機器は、本発明の一態様に係る画像復号装置として機能する。

［分散処理］
また、ストリーミングサーバｅｘ１０３は複数のサーバ又は複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。例えば、ストリーミングサーバｅｘ１０３は、ＣＤＮ（ＣｏｎｔｅｎｔｓＤｅｌｉｖｅｒｙＮｅｔｗｏｒｋ）により実現され、世界中に分散された多数のエッジサーバとエッジサーバ間をつなぐネットワークによりコンテンツ配信が実現されていてもよい。ＣＤＮでは、クライアントに応じて物理的に近いエッジサーバが動的に割り当てられる。そして、当該エッジサーバにコンテンツがキャッシュ及び配信されることで遅延を減らすことができる。また、何らかのエラーが発生した場合又はトラフィックの増加などにより通信状態が変わる場合に複数のエッジサーバで処理を分散したり、他のエッジサーバに配信主体を切り替えたり、障害が生じたネットワークの部分を迂回して配信を続けることができるので、高速かつ安定した配信が実現できる。

また、配信自体の分散処理にとどまらず、撮影したデータの符号化処理を各端末で行ってもよいし、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、一般に符号化処理では、処理ループが２度行われる。１度目のループでフレーム又はシーン単位での画像の複雑さ、又は、符号量が検出される。また、２度目のループでは画質を維持して符号化効率を向上させる処理が行われる。例えば、端末が１度目の符号化処理を行い、コンテンツを受け取ったサーバ側が２度目の符号化処理を行うことで、各端末での処理負荷を減らしつつもコンテンツの質と効率を向上させることができる。この場合、ほぼリアルタイムで受信して復号する要求があれば、端末が行った一度目の符号化済みデータを他の端末で受信して再生することもできるので、より柔軟なリアルタイム配信も可能になる。

他の例として、カメラｅｘ１１３等は、画像から特徴量抽出を行い、特徴量に関するデータをメタデータとして圧縮してサーバに送信する。サーバは、例えば特徴量からオブジェクトの重要性を判断して量子化精度を切り替えるなど、画像の意味に応じた圧縮を行う。特徴量データはサーバでの再度の圧縮時の動きベクトル予測の精度及び効率向上に特に有効である。また、端末でＶＬＣ（可変長符号化）などの簡易的な符号化を行い、サーバでＣＡＢＡＣ（コンテキスト適応型二値算術符号化方式）など処理負荷の大きな符号化を行ってもよい。

さらに他の例として、スタジアム、ショッピングモール、又は工場などにおいては、複数の端末によりほぼ同一のシーンが撮影された複数の映像データが存在する場合がある。この場合には、撮影を行った複数の端末と、必要に応じて撮影をしていない他の端末及びサーバを用いて、例えばＧＯＰ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅ）単位、ピクチャ単位、又はピクチャを分割したタイル単位などで符号化処理をそれぞれ割り当てて分散処理を行う。これにより、遅延を減らし、よりリアルタイム性を実現できる。

また、複数の映像データはほぼ同一シーンであるため、各端末で撮影された映像データを互いに参照し合えるように、サーバで管理及び／又は指示をしてもよい。または、各端末からの符号化済みデータを、サーバが受信し複数のデータ間で参照関係を変更、又はピクチャ自体を補正或いは差し替えて符号化しなおしてもよい。これにより、一つ一つのデータの質と効率を高めたストリームを生成できる。

また、サーバは、映像データの符号化方式を変更するトランスコードを行ったうえで映像データを配信してもよい。例えば、サーバは、ＭＰＥＧ系の符号化方式をＶＰ系に変換してもよいし、Ｈ．２６４をＨ．２６５に変換してもよい。

このように、符号化処理は、端末、又は１以上のサーバにより行うことが可能である。よって、以下では、処理を行う主体として「サーバ」又は「端末」等の記載を用いるが、サーバで行われる処理の一部又は全てが端末で行われてもよいし、端末で行われる処理の一部又は全てがサーバで行われてもよい。また、これらに関しては、復号処理についても同様である。

［３Ｄ、マルチアングル］
近年では、互いにほぼ同期した複数のカメラｅｘ１１３及び／又はスマートフォンｅｘ１１５などの端末により撮影された異なるシーン、又は、同一シーンを異なるアングルから撮影した画像或いは映像を統合して利用することも増えてきている。各端末で撮影した映像は、別途取得した端末間の相対的な位置関係、又は、映像に含まれる特徴点が一致する領域などに基づいて統合される。

サーバは、２次元の動画像を符号化するだけでなく、動画像のシーン解析などに基づいて自動的に、又は、ユーザが指定した時刻において、静止画を符号化し、受信端末に送信してもよい。サーバは、さらに、撮影端末間の相対的な位置関係を取得できる場合には、２次元の動画像だけでなく、同一シーンが異なるアングルから撮影された映像に基づき、当該シーンの３次元形状を生成できる。なお、サーバは、ポイントクラウドなどにより生成した３次元のデータを別途符号化してもよいし、３次元データを用いて人物又はオブジェクトを認識或いは追跡した結果に基づいて、受信端末に送信する映像を、複数の端末で撮影した映像から選択、又は、再構成して生成してもよい。

このようにして、ユーザは、各撮影端末に対応する各映像を任意に選択してシーンを楽しむこともできるし、複数画像又は映像を用いて再構成された３次元データから任意視点の映像を切り出したコンテンツを楽しむこともできる。さらに、映像と同様に音も複数の相異なるアングルから収音され、サーバは、映像に合わせて特定のアングル又は空間からの音を映像と多重化して送信してもよい。

また、近年ではＶｉｒｔｕａｌＲｅａｌｉｔｙ（ＶＲ）及びＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ（ＡＲ）など、現実世界と仮想世界とを対応付けたコンテンツも普及してきている。ＶＲの画像の場合、サーバは、右目用及び左目用の視点画像をそれぞれ作成し、Ｍｕｌｔｉ−ＶｉｅｗＣｏｄｉｎｇ（ＭＶＣ）などにより各視点映像間で参照を許容する符号化を行ってもよいし、互いに参照せずに別ストリームとして符号化してもよい。別ストリームの復号時には、ユーザの視点に応じて仮想的な３次元空間が再現されるように互いに同期させて再生するとよい。

ＡＲの画像の場合には、サーバは、現実空間のカメラ情報に、仮想空間上の仮想物体情報を、３次元的位置又はユーザの視点の動きに基づいて重畳する。復号装置は、仮想物体情報及び３次元データを取得又は保持し、ユーザの視点の動きに応じて２次元画像を生成し、スムーズにつなげることで重畳データを作成してもよい。または、復号装置は仮想物体情報の依頼に加えてユーザの視点の動きをサーバに送信し、サーバは、サーバに保持される３次元データから受信した視点の動きに合わせて重畳データを作成し、重畳データを符号化して復号装置に配信してもよい。なお、重畳データは、ＲＧＢ以外に透過度を示すα値を有し、サーバは、３次元データから作成されたオブジェクト以外の部分のα値が０などに設定し、当該部分が透過する状態で、符号化してもよい。もしくは、サーバは、クロマキーのように所定の値のＲＧＢ値を背景に設定し、オブジェクト以外の部分は背景色にしたデータを生成してもよい。

同様に配信されたデータの復号処理はクライアントである各端末で行っても、サーバ側で行ってもよいし、互いに分担して行ってもよい。一例として、ある端末が、一旦サーバに受信リクエストを送り、そのリクエストに応じたコンテンツを他の端末で受信し復号処理を行い、ディスプレイを有する装置に復号済みの信号が送信されてもよい。通信可能な端末自体の性能によらず処理を分散して適切なコンテンツを選択することで画質のよいデータを再生ことができる。また、他の例として大きなサイズの画像データをＴＶ等で受信しつつ、鑑賞者の個人端末にピクチャが分割されたタイルなど一部の領域が復号されて表示されてもよい。これにより、全体像を共有化しつつ、自身の担当分野又はより詳細に確認したい領域を手元で確認することができる。

また今後は、屋内外にかかわらず近距離、中距離、又は長距離の無線通信が複数使用可能な状況下で、ＭＰＥＧ−ＤＡＳＨなどの配信システム規格を利用して、接続中の通信に対して適切なデータを切り替えながらシームレスにコンテンツを受信することが予想される。これにより、ユーザは、自身の端末のみならず屋内外に設置されたディスプレイなどの復号装置又は表示装置を自由に選択しながらリアルタイムで切り替えられる。また、自身の位置情報などに基づいて、復号する端末及び表示する端末を切り替えながら復号を行うことができる。これにより、目的地への移動中に、表示可能なデバイスが埋め込まれた隣の建物の壁面又は地面の一部に地図情報を表示させながら移動することも可能になる。また、符号化データが受信端末から短時間でアクセスできるサーバにキャッシュされている、又は、コンテンツ・デリバリー・サービスにおけるエッジサーバにコピーされている、などの、ネットワーク上での符号化データへのアクセス容易性に基づいて、受信データのビットレートを切り替えることも可能である。

［スケーラブル符号化］
コンテンツの切り替えに関して、図４０に示す、上記各実施の形態で示した動画像符号化方法を応用して圧縮符号化されたスケーラブルなストリームを用いて説明する。サーバは、個別のストリームとして内容は同じで質の異なるストリームを複数有していても構わないが、図示するようにレイヤに分けて符号化を行うことで実現される時間的／空間的スケーラブルなストリームの特徴を活かして、コンテンツを切り替える構成であってもよい。つまり、復号側が性能という内的要因と通信帯域の状態などの外的要因とに応じてどのレイヤまで復号するかを決定することで、復号側は、低解像度のコンテンツと高解像度のコンテンツとを自由に切り替えて復号できる。例えば移動中にスマートフォンｅｘ１１５で視聴していた映像の続きを、帰宅後にインターネットＴＶ等の機器で視聴したい場合には、当該機器は、同じストリームを異なるレイヤまで復号すればよいので、サーバ側の負担を軽減できる。

さらに、上記のように、レイヤ毎にピクチャが符号化されており、ベースレイヤの上位にエンハンスメントレイヤが存在するスケーラビリティを実現する構成以外に、エンハンスメントレイヤが画像の統計情報などに基づくメタ情報を含み、復号側が、メタ情報に基づきベースレイヤのピクチャを超解像することで高画質化したコンテンツを生成してもよい。超解像とは、同一解像度におけるＳＮ比の向上、及び、解像度の拡大のいずれであってもよい。メタ情報は、超解像処理に用いる線形或いは非線形のフィルタ係数を特定するため情報、又は、超解像処理に用いるフィルタ処理、機械学習或いは最小２乗演算におけるパラメータ値を特定する情報などを含む。

または、画像内のオブジェクトなどの意味合いに応じてピクチャがタイル等に分割されており、復号側が、復号するタイルを選択することで一部の領域だけを復号する構成であってもよい。また、オブジェクトの属性（人物、車、ボールなど）と映像内の位置（同一画像における座標位置など）とをメタ情報として格納することで、復号側は、メタ情報に基づいて所望のオブジェクトの位置を特定し、そのオブジェクトを含むタイルを決定できる。例えば、図４１に示すように、メタ情報は、ＨＥＶＣにおけるＳＥＩメッセージなど画素データとは異なるデータ格納構造を用いて格納される。このメタ情報は、例えば、メインオブジェクトの位置、サイズ、又は色彩などを示す。

また、ストリーム、シーケンス又はランダムアクセス単位など、複数のピクチャから構成される単位でメタ情報が格納されてもよい。これにより、復号側は、特定人物が映像内に出現する時刻などが取得でき、ピクチャ単位の情報と合わせることで、オブジェクトが存在するピクチャ、及び、ピクチャ内でのオブジェクトの位置を特定できる。

［Ｗｅｂページの最適化］
図４２は、コンピュータｅｘ１１１等におけるｗｅｂページの表示画面例を示す図である。図４３は、スマートフォンｅｘ１１５等おけるｗｅｂページの表示画面例を示す図である。図４２及び図４３に示すようにｗｅｂページが、画像コンテンツへのリンクであるリンク画像を複数含む場合があり、閲覧するデバイスによってその見え方は異なる。画面上に複数のリンク画像が見える場合には、ユーザが明示的にリンク画像を選択するまで、又は画面の中央付近にリンク画像が近付く或いはリンク画像の全体が画面内に入るまでは、表示装置（復号装置）は、リンク画像として各コンテンツが有する静止画又はＩピクチャを表示したり、複数の静止画又はＩピクチャ等でｇｉｆアニメのような映像を表示をしたり、ベースレイヤのみ受信して映像を復号及び表示したりする。

ユーザによりリンク画像が選択された場合、表示装置は、ベースレイヤを最優先にして復号する。なお、ｗｅｂページを構成するＨＴＭＬにスケーラブルなコンテンツであることを示す情報があれば、表示装置は、エンハンスメントレイヤまで復号してもよい。また、リアルタイム性を担保するために、選択される前又は通信帯域が非常に厳しい場合には、表示装置は、前方参照のピクチャ（Ｉピクチャ、Ｐピクチャ、前方参照のみのＢピクチャ）のみを復号及び表示することで、先頭ピクチャの復号時刻と表示時刻との間の遅延（コンテンツの復号開始から表示開始までの遅延）を低減できる。また、表示装置は、ピクチャの参照関係を敢えて無視して全てのＢピクチャ及びＰピクチャを前方参照にして粗く復号し、時間が経ち受信したピクチャが増えるにつれて正常の復号を行ってもよい。

［自動走行］
また、車の自動走行又は走行支援のため２次元又は３次元の地図情報などの静止画又は映像データを送受信する場合、受信端末は、１以上のレイヤに属する画像データに加えて、メタ情報として天候又は工事の情報なども受信し、これらを対応付けて復号してもよい。なお、メタ情報は、レイヤに属してもよいし、単に画像データと多重化されてもよい。

この場合、受信端末を含む車、ドローン又は飛行機などが移動するため、受信端末は、当該受信端末の位置情報を受信要求時に送信することで、基地局ｅｘ１０６〜ｅｘ１１０を切り替えながらシームレスな受信及び復号を実現できる。また、受信端末は、ユーザの選択、ユーザの状況又は通信帯域の状態に応じて、メタ情報をどの程度受信するか、又は地図情報をどの程度更新していくかを動的に切り替えることが可能になる。

以上のようにして、コンテンツ供給システムｅｘ１００では、ユーザが送信した符号化された情報をリアルタイムでクライアントが受信して復号し、再生することができる。

［個人コンテンツの配信］
また、コンテンツ供給システムｅｘ１００では、映像配信業者による高画質で長時間のコンテンツのみならず、個人による低画質で短時間のコンテンツのユニキャスト、又はマルチキャスト配信が可能である。また、このような個人のコンテンツは今後も増加していくと考えられる。個人コンテンツをより優れたコンテンツにするために、サーバは、編集処理を行ってから符号化処理を行ってもよい。これは例えば、以下のような構成で実現できる。

撮影時にリアルタイム又は蓄積して撮影後に、サーバは、原画又は符号化済みデータから撮影エラー、シーン探索、意味の解析、及びオブジェクト検出などの認識処理を行う。そして、サーバは、認識結果に基いて手動又は自動で、ピントずれ又は手ブレなどを補正したり、明度が他のピクチャに比べて低い又は焦点が合っていないシーンなどの重要性の低いシーンを削除したり、オブジェクトのエッジを強調したり、色合いを変化させるなどの編集を行う。サーバは、編集結果に基いて編集後のデータを符号化する。また撮影時刻が長すぎると視聴率が下がることも知られており、サーバは、撮影時間に応じて特定の時間範囲内のコンテンツになるように上記のように重要性が低いシーンのみならず動きが少ないシーンなどを、画像処理結果に基き自動でクリップしてもよい。または、サーバは、シーンの意味解析の結果に基づいてダイジェストを生成して符号化してもよい。

なお、個人コンテンツには、そのままでは著作権、著作者人格権、又は肖像権等の侵害となるものが写り込んでいるケースもあり、共有する範囲が意図した範囲を超えてしまうなど個人にとって不都合な場合もある。よって、例えば、サーバは、画面の周辺部の人の顔、又は家の中などを敢えて焦点が合わない画像に変更して符号化してもよい。また、サーバは、符号化対象画像内に、予め登録した人物とは異なる人物の顔が映っているかどうかを認識し、映っている場合には、顔の部分にモザイクをかけるなどの処理を行ってもよい。または、符号化の前処理又は後処理として、著作権などの観点からユーザが画像を加工したい人物又は背景領域を指定し、サーバは、指定された領域を別の映像に置き換える、又は焦点をぼかすなどの処理を行うことも可能である。人物であれば、動画像において人物をトラッキングしながら、顔の部分の映像を置き換えることができる。

また、データ量の小さい個人コンテンツの視聴はリアルタイム性の要求が強いため、帯域幅にもよるが、復号装置は、まずベースレイヤを最優先で受信して復号及び再生を行う。復号装置は、この間にエンハンスメントレイヤを受信し、再生がループされる場合など２回以上再生される場合に、エンハンスメントレイヤも含めて高画質の映像を再生してもよい。このようにスケーラブルな符号化が行われているストリームであれば、未選択時又は見始めた段階では粗い動画だが、徐々にストリームがスマートになり画像がよくなるような体験を提供することができる。スケーラブル符号化以外にも、１回目に再生される粗いストリームと、１回目の動画を参照して符号化される２回目のストリームとが１つのストリームとして構成されていても同様の体験を提供できる。

［その他の使用例］
また、これらの符号化又は復号処理は、一般的に各端末が有するＬＳＩｅｘ５００において処理される。ＬＳＩｅｘ５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化又は復号用のソフトウェアをコンピュータｅｘ１１１等で読み取り可能な何らかの記録メディア（ＣＤ−ＲＯＭ、フレキシブルディスク、又はハードディスクなど）に組み込み、そのソフトウェアを用いて符号化又は復号処理を行ってもよい。さらに、スマートフォンｅｘ１１５がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データはスマートフォンｅｘ１１５が有するＬＳＩｅｘ５００で符号化処理されたデータである。

なお、ＬＳＩｅｘ５００は、アプリケーションソフトをダウンロードしてアクティベートする構成であってもよい。この場合、端末は、まず、当該端末がコンテンツの符号化方式に対応しているか、又は、特定サービスの実行能力を有するかを判定する。端末がコンテンツの符号化方式に対応していない場合、又は、特定サービスの実行能力を有さない場合、端末は、コーデック又はアプリケーションソフトをダウンロードし、その後、コンテンツ取得及び再生する。

また、インターネットｅｘ１０１を介したコンテンツ供給システムｅｘ１００に限らず、デジタル放送用システムにも上記各実施の形態の少なくとも動画像符号化装置（画像符号化装置）又は動画像復号化装置（画像復号装置）のいずれかを組み込むことができる。衛星などを利用して放送用の電波に映像と音が多重化された多重化データを載せて送受信するため、コンテンツ供給システムｅｘ１００のユニキャストがし易い構成に対してマルチキャスト向きであるという違いがあるが符号化処理及び復号処理に関しては同様の応用が可能である。

［ハードウェア構成］
図４４は、スマートフォンｅｘ１１５を示す図である。また、図４５は、スマートフォンｅｘ１１５の構成例を示す図である。スマートフォンｅｘ１１５は、基地局ｅｘ１１０との間で電波を送受信するためのアンテナｅｘ４５０と、映像及び静止画を撮ることが可能なカメラ部ｅｘ４６５と、カメラ部ｅｘ４６５で撮像した映像、及びアンテナｅｘ４５０で受信した映像等が復号されたデータを表示する表示部ｅｘ４５８とを備える。スマートフォンｅｘ１１５は、さらに、タッチパネル等である操作部ｅｘ４６６と、音声又は音響を出力するためのスピーカ等である音声出力部ｅｘ４５７と、音声を入力するためのマイク等である音声入力部ｅｘ４５６と、撮影した映像或いは静止画、録音した音声、受信した映像或いは静止画、メール等の符号化されたデータ、又は、復号化されたデータを保存可能なメモリ部ｅｘ４６７と、ユーザを特定し、ネットワークをはじめ各種データへのアクセスの認証をするためのＳＩＭｅｘ４６８とのインタフェース部であるスロット部ｅｘ４６４とを備える。なお、メモリ部ｅｘ４６７の代わりに外付けメモリが用いられてもよい。

また、表示部ｅｘ４５８及び操作部ｅｘ４６６等を統括的に制御する主制御部ｅｘ４６０と、電源回路部ｅｘ４６１、操作入力制御部ｅｘ４６２、映像信号処理部ｅｘ４５５、カメラインタフェース部ｅｘ４６３、ディスプレイ制御部ｅｘ４５９、変調／復調部ｅｘ４５２、多重／分離部ｅｘ４５３、音声信号処理部ｅｘ４５４、スロット部ｅｘ４６４、及びメモリ部ｅｘ４６７とがバスｅｘ４７０を介して接続されている。

電源回路部ｅｘ４６１は、ユーザの操作により電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりスマートフォンｅｘ１１５を動作可能な状態に起動する。

スマートフォンｅｘ１１５は、ＣＰＵ、ＲＯＭ及びＲＡＭ等を有する主制御部ｅｘ４６０の制御に基づいて、通話及データ通信等の処理を行う。通話時は、音声入力部ｅｘ４５６で収音した音声信号を音声信号処理部ｅｘ４５４でデジタル音声信号に変換し、これを変調／復調部ｅｘ４５２でスペクトラム拡散処理し、送信／受信部ｅｘ４５１でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナｅｘ４５０を介して送信する。また受信データを増幅して周波数変換処理及びアナログデジタル変換処理を施し、変調／復調部ｅｘ４５２でスペクトラム逆拡散処理し、音声信号処理部ｅｘ４５４でアナログ音声信号に変換した後、これを音声出力部ｅｘ４５７から出力する。データ通信モード時は、本体部の操作部ｅｘ４６６等の操作によってテキスト、静止画、又は映像データが操作入力制御部ｅｘ４６２を介して主制御部ｅｘ４６０に送出され、同様に送受信処理が行われる。データ通信モード時に映像、静止画、又は映像と音声を送信する場合、映像信号処理部ｅｘ４５５は、メモリ部ｅｘ４６７に保存されている映像信号又はカメラ部ｅｘ４６５から入力された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し、符号化された映像データを多重／分離部ｅｘ４５３に送出する。また、音声信号処理部ｅｘ４５４は、映像又は静止画等をカメラ部ｅｘ４６５で撮像中に音声入力部ｅｘ４５６で収音した音声信号を符号化し、符号化された音声データを多重／分離部ｅｘ４５３に送出する。多重／分離部ｅｘ４５３は、符号化済み映像データと符号化済み音声データを所定の方式で多重化し、変調／復調部（変調／復調回路部）ｅｘ４５２、及び送信／受信部ｅｘ４５１で変調処理及び変換処理を施してアンテナｅｘ４５０を介して送信する。

電子メール又はチャットに添付された映像、又はウェブページ等にリンクされた映像を受信した場合、アンテナｅｘ４５０を介して受信された多重化データを復号するために、多重／分離部ｅｘ４５３は、多重化データを分離することにより、多重化データを映像データのビットストリームと音声データのビットストリームとに分け、同期バスｅｘ４７０を介して符号化された映像データを映像信号処理部ｅｘ４５５に供給するとともに、符号化された音声データを音声信号処理部ｅｘ４５４に供給する。映像信号処理部ｅｘ４５５は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって映像信号を復号し、ディスプレイ制御部ｅｘ４５９を介して表示部ｅｘ４５８から、リンクされた動画像ファイルに含まれる映像又は静止画が表示される。また音声信号処理部ｅｘ４５４は、音声信号を復号し、音声出力部ｅｘ４５７から音声が出力される。なおリアルタイムストリーミングが普及しているため、ユーザの状況によっては音声の再生が社会的にふさわしくない場も起こりえる。そのため、初期値としては、音声信号は再生せず映像データのみを再生する構成の方が望ましい。ユーザが映像データをクリックするなど操作を行った場合にのみ音声を同期して再生してもよい。

またここではスマートフォンｅｘ１１５を例に説明したが、端末としては符号化器及び復号化器を両方持つ送受信型端末の他に、符号化器のみを有する送信端末、及び、復号化器のみを有する受信端末という３通りの実装形式が考えられる。さらに、デジタル放送用システムにおいて、映像データに音楽データなどが多重化された多重化データを受信又は送信するとして説明したが、多重化データには、音声データ以外に映像に関連する文字データなどが多重化されてもよいし、多重化データではなく映像データ自体が受信又は送信されてもよい。

なお、ＣＰＵを含む主制御部ｅｘ４６０が符号化又は復号処理を制御するとして説明したが、端末はＧＰＵを備えることも多い。よって、ＣＰＵとＧＰＵで共通化されたメモリ、又は共通に使用できるようにアドレスが管理されているメモリにより、ＧＰＵの性能を活かして広い領域を一括して処理する構成でもよい。これにより符号化時間を短縮でき、リアルタイム性を確保し、低遅延を実現できる。特に動き探索、デブロックフィルタ、ＳＡＯ（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ）、及び変換・量子化の処理を、ＣＰＵではなく、ＧＰＵでピクチャなどの単位で一括して行うと効率的である。

本開示は、例えば、テレビ、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、またはデジタルビデオカメラ等の装置であって、画像を符号化する符号化装置、または符号化された画像を復号する復号装置などに適用することができる。

１５００符号化装置
１５０１変換部
１５０２量子化部
１５０３逆量子化部
１５０４逆変換部
１５０５ブロックメモリ
１５０６フレームメモリ
１５０７イントラ予測部
１５０８インター予測部
１５０９エントロピー符号化部
１５２１減算部
１５２２加算部
１６００復号装置
１６０１エントロピー復号部
１６０２逆量子化部
１６０３逆変換部
１６０４ブロックメモリ
１６０５フレームメモリ
１６０６イントラ予測部
１６０７インター予測部
１６２２加算部

Claims

処理回路と、前記処理回路に接続されたメモリとを備え、
前記処理回路は、前記メモリを用いて、
複数の画像のうちの１つである処理対象の画像について、画面間予測処理を行い、
前記画面間予測処理は、
前記処理対象の画像を前記複数の画像のうちの他の画像と繋ぎ合わせ、
前記複数の画像に含まれる複数の画素について、前記複数の画像中のオブジェクトが連続するよう、配置または再配置を行うラッピング処理を含む、
符号化装置。