WO2006025339A1

WO2006025339A1 - 復号化装置、符号化装置、復号化方法、符号化方法

Info

Publication number: WO2006025339A1
Application number: PCT/JP2005/015679
Authority: WO
Inventors: Hisao Sasai; Satoshi Kondo; Thomas Wedi; Steffen Wittmann; Martin Schlockermann
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-08-30
Filing date: 2005-08-29
Publication date: 2006-03-09
Also published as: EP1788817A1; US8208549B2; EP1788817A4; US20080117975A1; JP4949028B2; JPWO2006025339A1; EP1631089A1

Abstract

　本発明の復号化装置は、第１ビデオデータにおける画像の動きを示す動きベクトルを含む付加情報と、第１ビデオデータと同内容であって第１ビデオデータよりも解像度の低い第２ビデオデータの符号化データであるストリームデータとを取得する取得手段と、前記ストリームデータを第２ビデオデータの画像に復号化する復号化手段と、復号化された第２ビデオデータの画像に対して、付加情報を用いて補間することにより第１ビデオデータと同じ解像度の第３ビデオデータに変換する変換手段とを備える。

Description

明細書

復号化装置、符号化装置、復号化方法、符号化方法

技術分野

[0001] 本発明は、解像度の変換を伴うビデオデータの符号化装置および複号化装置に関する。

背景技術

[0002] 特許文献 1には、解像度の変換を伴う復号化装置として、インターレース画像をプログレツシブ画像に変換する技術が開示されている。この従来技術では、インターレース画像の符号ィ匕ビットストリームに含まれる動きベクトルを利用して、プログレッシブ画像を生成している。

[0003] 非特許文献 1では、インターレース画像からプログレッシブ画像の画素をフィルタ等により推定し、その画素と類似の画像領域を動き予測により高解像度化を実現している。

[0004] 特許文献 2では、ベースとなるベース動画と、ベース動画を拡張した拡張動画とを符号化するスケーラブル符号化にぉレ、て、ベース動画の画素値を符号化すると共に、拡張動画とベース動画の画素値の差分を符号化する技術を開示してレ、る。

特許文献 1：特開平 10— 126749号公報号公報

非特許文献 1：「動き補償を用いたインタレース走査画像の順次走査変換法の検討」 (栗田泰一郎,杉浦幸雄，信学論 (D-II), V01.J78-D-II, no.l, pp.40— 49, Jan. 1995) 特許文献 2 :国際公開 2004/73312A1号パンフレット

発明の開示

発明が解決しょうとする課題

[0005] し力、しながら、非特許文献 1によれば、高解像度推定のためのフィルタの精度が悪い場合には、誤った動きべ外ルを用いてしまう場合があり、高解像度画像の精度が悪いという問題がある。

[0006] 特許文献 1によれば、ビットストリームに含まれる動きベクトルが必ずしも画像の動きと等しくないため、動きベクトルが誤っている場合があり、高解像度画像の精度が悪いという問題がある。

[0007] さらに、非特許文献 1によれば復号装置において動きベクトルを検出するので、ビットストリームに含まれる動きベクトルよりも、画像の動きに近づけることができる反面、復号装置における処理負荷が著しく増加するという問題がある。

[0008] また、特許文献 2によれば、ベース動画の画素値だけでなぐ拡張動画の差分画素値を符号ィ匕することから低ビットレートイ匕が困難であるという問題がある。

課題を解決するための手段

[0009] 本発明の目的は、低解像度画像から高解像度画像の生成を、低ビットレート、低処理量かつ高画質に実現する復号化装置および符号ィヒ装置を提供することにある。

[0010] 上記目的を達成するために本発明の復号化装置は、第 1ビデオデータにおける画像の動きを示す動きベクトルを含む付加情報と、第 1ビデオデータと同内容であって第 1ビデオデータよりも解像度の低い第 2ビデオデータの符号ィ匕データであるストリームデータとを取得する取得手段と、前記ストリームデータを第 2ビデオデータの画像に復号化する復号化手段と、復号化された第 2ビデオデータの画像に対して、付カロ情報を用いて補間することにより第 1ビデオデータと同じ解像度の第 3ビデオデータに変換する変換手段とを備える。

[0011] この構成によれば、復号化装置は、画像の動きを示す付加情報をストリームデータと共に得られるので、高解像度画像生成のために画像の動きを検出する必要がなく、かつ復号時にリアルタイムに動きを検出する必要もないため、高解像度化のための処理量を低減することができる。しかも、付加情報は第 1ビデオデータの画素値を示す符号を含まないので、低ビットレートイ匕することができる。

[0012] ここで、前記変換手段は、前記付加情報から動きベクトルを抽出する抽出手段と、抽出された動きベクトルを用いて、第 2ビデオデータの画像に画素を補間する補間手段とを備えるようにしてもよい。

[0013] この構成によれば、第 2ビデオデータの画像に対して、動きベクトルに従って画素を補間することにより高解像度画像を得ることができるので、処理量を少なくすることができる。

[0014] ここで、前記変換手段は、前記付加情報から動きベクトルを抽出する抽出手段と、復号化手段によって復号化された第 2ビデオデータの画像に対して、当該画像の画素を用いて画素を補間する第 1補間手段と、復号化手段によって復号化された第 2ビデォデータの画像に対して、抽出された動きベクトルを用いて第 2ビデオデータの画像に画素を補間する第 2補間手段と、第 1補間手段および第 2補間手段を選択的に用いて、第 3ビデオデータの画像を生成する生成手段とを備えるようにしてもよい。

[0015] この構成によれば、第 1補間手段による画像内の補間と、第 2補間手段による画像間の補間とを選択的に用いることにより、第 3ビデオデータの画像を効率よく生成すること力 Sできる。

[0016] ここで、前記第 2補間手段は、第 3ビデオデータの変換済の画像と、変換対象の第 3ビデオデータの画像と保持するためのメモリ手段と、変換対象の第 3ビデオデータの画像における補間すべき画素位置を特定する第 1特定手段と、変換済の第 3ビデォデータの画像において、第 1特定手段に特定された画素位置に対応する画素を動きべタトノレに従って特定する第 2特定手段と、第 2特定手段によって特定された画素の値を読み出す読み出し手段と、読み出し手段によって読み出された画素の値に従つて、第 1特定手段によって特定された画素位置に補間画素の値を書き込む書き込み手段とを備えるようにしてもょレ、。

[0017] この構成によれば、変換対象の第 3ビデオデータの画像における補間すべき画素を、動きベクトルに従って第 3ビデオデータの変換済の画像から得るので、少ない処理量で効率よく画像間で補間することができる。

[0018] ここで、前記付加情報は、第 1ビデオデータを構成するブロック単位に動きベクトルを含み、前記第第 1特定手段は、ブロック内の補間すべき画素位置を特定し、前記第第 2特定手段は、ブロック単位の動きベクトルに従って、第 1特定手段に特定された画素位置に対応する画素を特定するようにしてよもレ、。

[0019] この構成によれば、変換対象の第 3ビデオデータのブロックにおける補間すべき画素を、動きベクトルに従って第 3ビデオデータの変換済の画像から得るという、画像間の補間を行うことができる。

[0020] ここで、前記付加情報は、第 1ビデオデータを構成するブロック単位に 2つの動きべタトルを含み、前記第 2特定手段と、変換済の第 3ビデオデータの 2つの画像において、第 1特定手段に特定された画素位置に対応する 2つの画素を 2つの動きべクトノレに従って特定し、前記読み出し手段は、第 2特定手段によって特定された 2つの画素の値を読み出し、前記書き込み手段は、読み出し手段によって読み出された 2つの画素の値に基づレ、て、前記補間画素の値を算出するようにしてもょレ、。

[0021] この構成によれば、変換済の第 3ビデオデータの 2つの画像を用いて、画像間の補間を行うので、第 3ビデオデータをより高画質にすることができる。

[0022] ここで、前記生成手段は、第 2ビデオデータの画像が画像内符号化されている場合には、当該画像を第 1補間手段を用いて、第 3ビデオデータの画像を生成し、第 2ビデォデータの画像が画像間予測符号化されている場合には、当該画像を第 2補間手段を用いて、第 3ビデオデータの画像を生成するようにしてもよい。

[0023] この構成によれば、第 2ビデオデータの画像の符号化方式と連動して第 3ビデオデータを生成する補間方法が定まるので、付加情報中に補間方法を示す情報がなくてもよぐ低ビットレートイ匕に適している。

[0024] また、本発明の符号化方法は、第 1ビデオデータを、第 1ビデオデータのよりも低い解像度の第 2ビデオデータに変換する変換手段と、第 2ビデオデータをストリームデータに符号化する符号化手段と、第 1ビデオデータの動きを示し、第 2ビデオデータの画像に画素を補間するための付加情報を生成する生成手段と、第 1ビデオデータの画素値を示す符号を出力することなぐ前記ストリームデータと前記付加情報とを出力する出力手段とを備える。

[0025] この構成によれば、画像の動きを示す付加情報を、低解像度の第 2ビデオデータからではなく高解像度の第 1ビデオデータから検出するので、復号化装置では高解像度画像を高画質に生成することができる。

[0026] また、本発明の複号化方法、符号化方法、それを実現するプログラムについても、上記と同様の構成を有する。

発明の効果

[0027] 以上のように本発明の復号化装置は、画像の動きを示す付加情報をストリームデータと共に得られるので、高解像度画像生成のために画像の動きを検出する必要がなぐかつ復号時にリアルタイムに動きを検出する必要もないため、高解像度化のための処理量を低減することができる。し力も、付加情報は第 1ビデオデータの画素値を示す符号を含まないので、低ビットレー H匕することができる。

図面の簡単な説明

[図 1]図 1は、本発明の符号化装置および復号化装置の概略構成を示すブロック図である。

[図 2]図 2は、符号ィ匕部 101および付加情報生成部 102の構成を示すブロック図である。

[図 3]図 3は、差分動きベクトルの説明図である。

[図 4A]図 4Aは、時空間画素補間による高解像度画像生成の説明図である。

[図 4B]図 4Bは、時空間画素補間による高解像度画像生成の説明図である。

[図 5]図 5は、低解像度画像と高解像度画像の関連を示す図である。

[図 6A]図 6Aは、補間画像生成モードの符号を示す説明図である。

[図 6B]図 6Bは、補間画像生成モードの符号を示す説明図である。

[図 7]図 7は、画像符号ィ匕処理を示すフローチャートである。

[図 8]図 8は、生成モード選択処理を示すフローチャートである。

[図 9A]図 9Aは、ストリームデータに関連付けられた付加情報のストリームフォーマットを示す説明図である。

[図 9B]図 9Bは、ストリームデータに関連付けられた付加情報のストリームフォーマットを示す説明図である。

[図 10]図 10は、複号化処理を示すフローチャートである。

[図 11A]図 11 Aは、図 10の S 103における高解像度画像生成処理を示すフローチヤートである。

[図 11B]図 11 Bは、図 11 Aのステップ S 113に示した高解像度化処理をより詳細に示すフローチャートである。

[図 11C]図 11Cは、 MC補間処理の説明図である。

[図 11D]図 11Dは、図 11Bのステップ S122に示した MC補間処理をより詳細に示すフローチャートである。

[図 11E]図 11Eは、図 11Bのステップ S123に示した MC— BID補間処理をより詳細に示すフローチャートである。

[図 11F]図 11Fは、図 11Bのステップ S124に示した INTRA— MC混合補間処理をより詳細に示すフローチャートである。

[図 12]図 12は、画像符号化処理の他の例を示すフローチャートである。

[図 13A]図 13Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。

[図 13B]図 13Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示す。

[図 13C]図 13Cは、フレキシブルディスク FDに上記プログラムの記録再生を行うための構成を示す。

[図 14]図 14は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成を示すブロック図である。

園 15]図 15は、画像符号化方法と画像復号化方法を用いた携帯電話 exl l5を示す図である。

[図 16]図 16は、携帯電話の外観を示す図である。

[図 17]図 17は、ディジタル放送用システムを示す図である。

符号の説明

1 符号化装置

2 複号化装置

100 低解像度化部

101 符号化部

102 付加情報生成部

103 復号化装置

201 複合化部

202 高解像度化部

HV1 高解像度画像

LV1 低解像度画像

LV2 低解像度画像 HV2 高解像度画像

LVS 低解像度画像ビットストリーム

AI 付加情報

DSI ダウンサンプリング情報

P1 ノラメータ

P2 ノラメータ

110 減算器

111 直交変換部

112 量子化部

113 可変長符号化部

114 逆量子化部

115 逆直交変換部

116 加算器

117 予測画像生成部

118 動きベクトル検出部

121 高解像度画像生成部

122 動きベクトル検出部

123 時空間補間画像生成部

124 生成モード選択部

125 可変長符号化部

発明を実施するための最良の形態

[0030] (実施の形態 1)

図 1は、本発明の実施の形態 1における符号化装置および復号化装置の概略構成を示すブロック図である。

[0031] 同図のように符号化装置 1は、低解像度化部 100、符号化部 101、付加情報生成部 102を備える。符号化装置 1のより具体的な装置は、例えばコンピュータ exl 11、インタネットサービスプロバイダ exl02、ストリーミングサーバ exl03等である。

[0032] 低解像度化部 100は、高解像度ビデオデータ HV1を低解像度ビデオデータ LV1 に変換する。低解像度ビデオデータ LV1の解像度は高解像度ビデオデータの解像度よりも低い。例えば、高解像度ビデオデータ HV1は VGA (640 * 480画素）、低解像度ビデオデータ LV1は QVGA(320 * 240)である。

[0033] 符号化部 101は、低解像度ビデオデータ LV1を圧縮符号化する。この圧縮符号化は、例えば、 MPEG1、 2、 4、 4AVC等である。符号化後の低解像度ビデオデータ L VIは、低解像度ビデオストリーム LVSとして出力される。

[0034] 付加情報生成部 102は、第 2ビデオデータを高解像度化するための付加情報 AIを生成する。付加情報 AIは、高解像度ビデオデータ HV1における画像の動きを示す動き情報と、低解像度ビデオデータから高解像度ビデオデータを生成するための変換モード情報とを含む。変換モード情報は、（A)時間的空間的に周囲に存在する画素を用いて画素を補間すべきことを示す第 1モード、（B)付加情報が前方向動きべクトルを含むことを示す第 2モード、（C)付加情報が後方向動きベクトルを含むことを示す第 3モード、（D)付加情報が複数の動きベクトルを含むことを示す第 4モードなどを示す。第 1モード以外は、動きベクトルに従って、既に高解像度化済みの画像から部分的な画像を取得することによって高解像度化すべきことを示す。変換モードは、復号化装置 2における低処理量かつ高画質を実現するために、マクロブロック等を単位に選択される。

[0035] また、図 1のように復号化装置 2は、復号化装置 200、高解像度化部 202を備える。

復号化装置 2の具体的な装置は、コンピュータ exl l l、テレビ ex401、 STBex407 などであり、高解像度画像を表示可能な機器である。

[0036] 復号化装置 200は、復号化部 201を備え、低解像度ビデオストリーム LVSを復号化する。復号化部 201は、符号化部 101に対応し、例えば MPEG1、 2、 4、 4AVC 等により復号化する。復号ィ匕後の低解像度ビデオストリーム LVSは、低解像度ビデォデータ LV2として出力される。複号化装置 200の具体的な装置は、例えば、コンビユータ exl l l、 PDAexl l2、携帯電話機 exl l4、携帯電話機 exl l 5、デジタノレカメラ exl l6、 DVDレコーダ ex420などであり、低解像度のディスプレイを備える装置、または選択的に低解像度画像を表示する装置である。

[0037] 高解像度化部 202は、低解像度ビデオデータ LV2を付加情報 AIに基づいて高解像度ビデオデータ HV2に高解像度化する。

[0038] 図 2は、符号ィ匕部 101および付加情報生成部 102の詳細な構成を示すブロック図である。同図のように符号化部 101は、減算器 110、直交変換部 111、量子化部 11 2、可変長符号化部 113、逆量子化部 114、逆直交変換部 115、加算器 116、予測画像生成部 117、動きベクトル検出部 118を備える。この符号化部 101の構成は、 M PEG1、 2、 4、 4AVC等の従来技術により構成すればよいので詳細については説明を省略する。

[0039] 付加情報生成部 102は、高解像度画像生成部 121、動きベクトル検出部 122、時空間補間画像生成部 123、生成モード選択部 124、可変長符号化 125を備える。

[0040] 高解像度画像生成部 121は、高解像度化済みの画像を保持する内部メモリを有し、動きベクトル検出部 122によって検出された動きベクトルに従って、内部メモリに保持された既に高解像度化済みの画像から部分的な画像を取得することによって、符号化部 101内で局所復号された低解像度ビデオデータを高解像度化する（上記第 2 〜第 4モード）。この高解像度化は、上記（B)〜（D)の第 2〜第 4モードで実行される。また、この高解像度化は、付加情報生成部 102内部で行われ、生成モード選択部 124によって、高解像度化の精度および発生符号化量を評価し、生成モードの選択するために用いられる。

[0041] 動きベクトル検出部 122は、高解像度ビデオデータ HV1から動きべクトノレを検出する。例えば、動きベクトル検出部 122は、生成モード選択部により選択された生成モ一ドが第 2モードの場合には、既に高解像度化済の画像のうち前方向の画像を探索対象として動きベクトルを検出する。同様に、第 3モードの場合には後方向の画像を探索対象として動きベクトルを検出し、第 4モードの場合には前方向の動きベクトルと後方向の動きベクトルとを検出し、または同じ方向の複数の動きベクトルを検出する。

[0042] 図 3は、差分動きベクトルの説明図である。同図において右側は、高解像度ビデオデータに含まれる現在の入力画像を表している。左側は、既に高解像度化済の画像を表してレ、る。右側のハッチング部分は入力画像における動きベクトル検出対象のブロックを表す。左側の破線部分は、既に高解像度化済の画像から探索された類似の (又は同じ)部分画像の領域を表す。つまり、同図の高解像度 MVは、動きベクトル検出部 122によって検出された動きベクトルを示す。

[0043] また、左側のハッチング部分は、対応する低解像度画像において動きベクトル検出部 118によって検出された部分画像の領域を表す。同図のストリーム MVは、動きべタトル検出部 118によって低解像度画像から検出された動きベクトルを示す。ただし、同図では高解像度 MVとストリーム MVとを同じサイズにスケーリングして図示してある。

[0044] 可変長符号化部 125は、高解像度 MVとストリーム MVとの差分動きベクトルを符号化する。これにより、動き情報の符号量を低減することができる。図 3のように、高解像度 MVとストリーム MVとはだいたい同じような値を取ると考えられる力高解像度 MV の方がより正確な動きを表現することができる。

[0045] 時空間補間画像生成部 123は、時間的空間的に周囲に存在する画素を用いて画素を補間によって高解像度化画像を生成する。この高解像度化は、上記 (A)の第 1 モードで実行される。

[0046] 図 4A、 4Bは、時空間画素補間による水平方向、垂直方向に 2倍ずつの解像度を実現する高解像度画像生成の説明図である。図 4Aにおいて、縦に並ぶ〇印は同じ 1枚の画像中の画素を表す。図 4Aでは時間の異なる 3枚の画像の画素を表している。ハッチングされた〇印は低解像度画像の画素を、白抜きの〇印は高解像度画像の補間すべき画素を示している。例えば、 aで示した画素を時空間画素補間で生成する場合、図で示すように周囲の画素の情報を用いて補間する。このとき、時間の異なる画像の既に高解像度化された画素を用いてもよい。なお、時間的、空間的に隣接する画素であればどの画素の情報を用いても良い。また、補間画素は、周辺の複数の画素それぞれに重みを付けて平均することにより生成される。同様に図 4Bでは、 2 枚の画像を表している。例えば、 bで示した画素を時空間画素補間で生成する場合も、同様に時間的、空間的に隣接する画素を用いて補間する。

[0047] 前記のように時空間補間画像生成部 123は、時間方向および空間方向に周囲に存在する複数の画素をフィルタリングすることによって画素を補間する。

[0048] 生成モード選択部 124は、高解像度画像の生成モード（上記変換モード）をブロック毎に選択する。選択基準としては、例えば、まず、符号ィ匕部 101における 4つの符号化モード（a)〜（d)に対応させて上記 (A)〜（D)を選択してもよレ、し、高解像度画像の精度や発生符号量を評価し、評価結果に応じて選択してもよい。符号化部 101 における 4つの符号化モードは、（a)イントラ符号ィ匕モード、（b)前方向予測符号化モード、（c)後方向予測符号化モード、（d)双予測符号化モードである。

[0049] 図 5は、低解像度画像と高解像度画像の関連を示す図である。同図上段の II、 B2 、 B3、 · · ·は、低解像度画像を表示順で示している。 Iは、上記（a)のイントラ符号化ピクチャを示す。 Pは、上記 (b)又は（c)の単方向予測符号ィ匕ピクチャを示す。 Bは、上記 (d)の双予測符号化ピクチャを示す。 I、 B、 Pの横の数字は表示順を示す。 ( ) 内の数字は符号化順を示す。

[0050] 同図下段の Hl、 H2、 H3、 · · ·は、各低解像度画像に対応する高解像度画像を示す。同図の例では、 Hl、 H5、 H6ピクチヤは、上記 (A)第 1モードの時間的空間的な画素補間により高解像度化されている。 H2、 H3、 H8、 H9ピクチヤは、上記 (A)のモードで時空間的な補間で高解像度化される力、（B)〜（D)のモードに従って、高解像度化済みの他のピクチヤから部分的な画像を取得することによって高解像度化されている。 H4、 H7、 H10ピクチャは、上記（A)のモードで時空間的な補間で高解像度されるか、（B)の動きベクトルに従って、前方向にある高解像度化済みのピクチャから部分的な画像を取得することによって高解像度化されている。ただし、ピクチャ内でブロック毎に異なるモードをとり得る。

[0051] 可変長符号化 125は、生成モード選択部 124に選択された生成モード（上記変換モード）が第 1モードである場合には、第 1モードを表す変換モード情報を付加情報として可変長符号化し、選択された生成モードが第 2〜第 4モードである場合変換モード情報と動き情報とを付加情報として可変長符号化する。その際可変長符号化部 12 5は、動き情報を差分動きベクトルとして可変長符号ィ匕する。

[0052] 図 6A、 6Bは、生成モードの符号を示す説明図である。

[0053] 図 6Aにおいて、符号化モード欄は、低解像度画像の符号化モードを示している。

すなわち、 "INTRA〃は上記（a)を、 "INTER— FWD〃は上記（b)を、 "INTER—B WD"は上記（c)を、 "INTER— BID〃は上記（d)を示す。

[0054] 補間生成モード欄は、対応する高解像度画像の生成モード (変換モード）を示す。すなわち、 " INTRA補間〃は上記（A)を、〃 MC FWD〃は上記（B)を、〃 MC BWD" は上記（C)を、〃 MC BID〃は上記（D)を示す。また、〃 MC Weigh は上記（D)の場合に複数枚の高解像度化済の画像を用いて重み付けを伴う線形予測により高解像度画像を生成することを示す。 "INTRA補間 Weight"は上記 (A)の場合に複数枚の高解像度化済の画像を用いて重み付けを伴うフィルタリングにより高解像度画像を生成することを示す。 "INTRA- MC 混合"は上記 (A)と上記（B)〜（D)の何れカ、とを混在させて高解像度画像を生成することを示す。

[0055] 図 6Aの例では、生成モードの符号は、高解像度画像のブロックに対応する低解像度画像のブロックの符号ィ匕モードと関連付けて割り当てられている。つまり、生成モードの符号は、符号ィ匕モードと生成モードとが同類である場合に短くなるように（0になるように）、割り当てられている。今、生成モード" MC BID"欄を注目する。高解像度画像のあるブロックの生成モード力 S"MC BID〃である場合、当該ブロックに対応する低解像度画像のブロックの符号化モードが" INTER— BID"、 "INTER- BWD'\ "I NTER-FWD", "INTRA〃であれば、高解像度画像の当該ブロックの符号はそれぞれ" 0〃、 "3"、 "3"、 "6"となっている。

[0056] 図 6Bは、より具体的は生成モードの可変長符号テーブルを示す図である。

[0057] 図 6Bにおいてテーブル T1は符号ィ匕モードが上記（a)の場合可変長符号テーブルを示す。同様に、テーブル T2、 Τ3、 Τ4は符号ィ匕モードが上記 (b) (c) (d)の場合可変長符号テーブルを示す。例えば、符号化モードが上記（a)のイントラ符号ィ匕である場合、生成モードが上記 (A)の時空間補間である場合には、生成モードの符号は" 0 〃となる。また、符号ィ匕モードが上記（a)のイントラ符号化である場合、生成モードが上記（B)の前方向動きベクトルの場合には、生成モードの符号は"： Tとなる。このテーブル T1〜T4では、符号ィ匕モードと生成モードとが同類である場合に符号が短くなるように割り当てられている。

[0058] なお、生成モードの符号化はこれに限らなレ、。例えば、生成モードの符号化は、発生符号量の確率を用いた符号化方式（レ、わゆる算術符号化 (arithmetic coding))であつてもよい。

[0059] 図 7は、符号化部 101および付加情報生成部 102における画像符号化処理および付加情報生成処理を示すフローチャートである。

[0060] 同図のように、符号化部 101は、ブロック単位（正確にはマクロブロック単位）で符号化を行い（S71)、生成モード選択部 124は、可変長符号化部 113から当該マクロブロックの符号ィ匕残差を取得する（S72)。このとき、低解像度画像の局所復号ピクチャがブロック単位に予測画像生成部 117内の参照メモリに格納される。

[0061] 一方、高解像度画像生成部 121および時空間補間画像生成部 123は、符号化された低解像度画像に対応する高解像度化画像を生成し (S73)、動きべ外ル検出部 122は、生成された高解像度化画像を探索対象として新たに入力された高解像度ビデォデータ HV1の画像の動きベクトルを検出し（S74)、動きベクトル検出部 118によつて検出された動きべタトノレと、高解像度画像の動きベクトルとの差分動きべクトノレを算出する (S75)。時空間補間画像生成部 123は、対応する低解像度画像を時空間補間による画素補間により高解像度画像を生成する（S76)。

[0062] さらに、生成モード選択部 124は、低解像度画像の符号化残差および動きベクトルに基づいて最適な生成モードを選択する（S77)。可変長符号化部 125は、付加情報を可変長符号化する（S78)。つまり、可変長符号化部 125は、選択された生成モードを符号化し、選択された生成モードが第 2〜第 4モードであれば差分動きべタトルも符号化する。

[0063] 図 8は、図 7の S77における生成モード選択処理を示すフローチャートである。

[0064] 生成モード選択部 124は、 S72において取得された符号化残差の情報量がしきい値 Thlより小さく、かつ、 S74において検出された動きベクトル又は動きベクトル検出部 118によって検出された動きベクトルがしきい値 Th2より小さい場合には、生成モードとして第 1〜第 4モード（上記（B)〜（D)の動きベクトルによる高解像度化）のうち符号化モードに対応するものを選択する（S83)。

[0065] また、生成モード選択部 124は、 S72において取得された符号ィ匕残差の情報量がしきい値 TH1より大きい場合、又は、 S74において検出された動きべクトノレ又は動きベクトル検出部 118によって検出された動きベクトルがしきい値 TH2より大きい場合には、生成モードとして第 1モード（上記 (A)の時空間画素補間による高解像度化）を選択する（S84)。 [0066] この生成モード選択処理では、高解像度画像および低解像画像における動きが激しい場合には、第 1モードを生成モードとすることにより、符号量の増加を抑えている。また、動きベクトルが周囲の動きベクトルと相関がない場合には、誤った動きが検出されている可能性があるため、生成モード選択部 124は、生成モードとして第 1モード (上記 (A)の時空間画素補間による高解像度化)を選択する。具体的には、生成モード選択部 124は、周囲の動きベクトルとの分散値を算出し（S82a)、その値がしきレ、値より大きレ、場合に（S82b)、第 1モードを選択する（S84)。

[0067] 図 9A、 9Bは、可変長符号化部 125によってストリームデータに関連付けられた付加情報のストリームフォーマット例を示す説明図である。

[0068] 図 9Aは、付加情報がピクチャ単位にユーザデータとして付加されるフォーマット例を示す。つまり、マクロブロック単位の付加情報は、ピクチャヘッダとピクチャデータと力なるストリームデータ部分に対して、ユーザデータとして付加されている。このュ一ザデータは、ストリーム中にユーザが任意に定めてもよいデータである。

[0069] 図 9Bは、前記出力手段は、前記ストリームデータ内に付加情報を埋め込むフォーマット例を示す。図 9Bでは、マクロブロックデータ内に、マクロブロック単位の付加情報が埋め込まれている。同図 Bは、図 9Aと比べてマクロブロックアドレスが不要である点でデータ量を少なくできる。

[0070] なお、付加情報を電子透力し技術等のような情報坦め込み技術により実質的にストリームデータ中に坦め込み、坦め込まれたストリームデータを伝送する構成としてもよレ、。例えば、符号化部 101は、付加情報生成部 102から付加情報を取得し、電子透かし技術等を用いて、復号画像の画質を損なわない範囲で、付加情報を符号化対象の画像データに坦め込む構成としてもよい。電子透かし技術には、時間軸差分坦め込み法、空間軸差分埋め込み法、レイヤ構造坦め込み法、ウェーブレット変換、スぺクトラム拡散等がある。

[0071] 図 10は、複号化装置 2における復号ィ匕処理を示すフローチャートである。

[0072] 複号化装置 2は、付加情報を取得すると（S101)、接続されているディスプレイに表示可能なサイズであるかどうかを判定し (S102)、表示可能サイズでない場合には、複号化部 201によって復号化された低解像度ビデオデータ LV2を表示のために出力する（S104)。また、表示可能サイズである場合には、復号化部 201によって復号化された低解像度ビデオデータ LV2から高解像度画像を生成してから（S103)、表示のために出力する（S104)。

[0073] 図 11Aは、図 10の S103における高解像度画像生成処理を示すフローチャートである。

[0074] 高解像度化部 202は、付加情報を可変長復号化し (S111)、付加情報中に生成モード情報（つまり変換モード情報）があるか否力、を判定し（S 112)、ある場合には生成モード情報に従って高解像度画像を生成し (S113)、ない場合には時空間画素補間により高解像度画像を生成し (S114)、生成した高解像度画像を出力する（S115

[0075] なお、この高解像度画像生成処理は、例えば、付加情報がマクロブロック単位に付与されている場合には、マクロブロック単位に処理され、付加情報がピクチャ単位に付与されている場合には、ピクチャ単位に処理される。

[0076] 図 11Bは、図 11Aのステップ S113に示した高解像度化処理の概略を示すフローチャートである。同図のように、高解像度化部 202は、付加情報中の生成モード情報 (つまり変換モード情報)を判定し (S120)、生成モード情報が上記 (A) INTRA補間を示す場合には INTRA補間処理を行い（S121)、生成モード情報が上記（B) MC FWDまたは（C) MC BWDを示す場合には MC補間処理を行い（SI 22)、生成モード情報が上記（D) MC BIDを示す場合には MC BID補間処理を行い（SI 23 )、生成モード情報力 NTRA— MC混合処理を示す場合には INTRA— MC混合処理を行う（S 124)。

[0077] なお、図 11Bでは、付加情報中に生成モード情報がある場合を説明したが、生成モード情報がない場合であっても、一定のルールに従って何れかの補間処理を選択するようにしてもよレ、。例えば、補間処理により高解像度化すべき処理対象の画像に対応する低解像度画像の符号化モード (上記の（a)イントラ符号化モード、 (b)前方向予測符号化モード、（c)後方向予測符号化モード、（d)双予測符号化モード）に対応させて、補間処理を選択してもよい。

[0078] 図 11Cは、図 11Bのステップ S122における MC補間処理の説明図である。同図の左側は高解像度化済の画像で参照用の画像の水平 1行または垂直 1列の画素を示してレ、る。白丸は低解像度画像に含まれる画素を、黒丸は補間された画素を示す。同図の右側は高解像度化の処理対象の画像における水平 1行または垂直 1列の画素を示している。白丸は低解像度画像に含まれる画素を、破線の丸は補間すべき画素を示している。処理対象の画像中のブロック B1の動きベクトルが、高解像度化済の画像中の領域 R1を指しているものとする。この場合、高解像度化部 202は、ブロック B1中の補間すべき画素位置 alには、領域 R1中の画素 piの画素値を用いて補間し、ブロック B1中の補間すべき画素位置 a2には、領域 R1中の画素 p2の画素値を用いて補間する。

[0079] また、処理対象の画像中のブロック B2の動きベクトル力 S、高解像度化済の画像中の領域 R2を指しているものとする。この場合、高解像度化部 202は、ブロック B2中の補間すべき画素位置 a3には、領域 R2中の画素 p3の画素値を用いて補間し、ブロック B2中の補間すべき画素位置 a4には、領域 R2中の画素 p4の画素値を用いて補間する。

[0080] 同図では、補間生成モードが（B) MC— FWDおよび（C) MC— BWDの場合を示している。補間生成モードが（D) MC— BIDの場合には、高解像度化部 202は、高解像度化済の 2つの画像から得られる 2つの画素値にっレ、て、重み付け平均をとることにより補間すべき画素の画素値を算出する。

[0081] 図 11Dは、図 11Bのステップ S122に示した MC補間処理をより詳細に示すフローチャートである。同図では、処理対象画像をブロック単位に高解像度化する場合の 1 ブロック分の処理を示している。また、復号化装置 2は、高解像度化が完了した画像と、処理対象の画像とを保持するためのメモリを有している。高解像度化が完了した画像は、動きベクトルによる補間に際して参照される。処理対象の画像は、低解像度画像を構成する画素と、補間すべき画素からなる。

[0082] まず、高解像度化部 202は、付加情報に含まれる差分動きベクトルを可変長復号し

(S130)、得られた差分を低解像度画像の対応する動きベクトルに加算することにより高解像度画像用の動きべ外ル H— MVを算出し (S131)、高解像度化済の参照画像中の矩形領域を特定する（S 132)。 [0083] 次に、高解像度化部 202は、ループ 1処理においてブロック内の全ての補間すべき画素を補間する（S133〜S137)。ループ 1処理において高解像度化部 202は、特定された矩形領域において、補間すべき画素に対応する画素を特定し (S134)、特定された画素の値をメモリから読み出し（S135)、読み出された画素値をブロック内の補間すべき画素の値として、メモリに書き込む（S136)。以上により、図 11Cに示したように、処理対象の画像中の全ての補間すべき画素は、動きベクトルに従って参照画像からから読み出された画素値を用いて補間される。

[0084] 図 11Eは、図 11Bのステップ S123に示した MC— BID補間処理をより詳細に示すフローチャートである。図 11Eは、図 11Dと匕ベて、ステップ S130〜S135、 S137の代わりにステップ S130a〜Sl 35a、 SI 37aを有してレヽる点と、 S 140カ追カロされた点とが異なる。同じ点は説明を省略し、以下異なる点を中心に説明する。

[0085] まず、高解像度化部 202は、付加情報に含まれる 2つの差分動きベクトルを可変長復号し (S 130a)、得られた 2つ差分を低解像度画像の対応する 2つ動きベクトルに加算することにより、高解像度画像用の 2つの動きベクトル H— MV1、 H— MV2を算出し (S131a)、高解像度化済の 2つの参照画像中の 2つの矩形領域を特定する（S 132a)。

[0086] 次に、高解像度化部 202は、ループ 1処理においてブロック内の全ての補間すべき画素を補間する（S133a〜S137a)。ループ 1処理において高解像度化部 202は、特定された 2つ矩形領域において、補間すべき画素に対応する 2つ画素を特定し (S 134a)、特定された 2つ画素の値をメモリから読み出す（S135a)。さらに、読み出された 2つの画素値の重み付け平均を算出する。各画素値の重みは、例えば、処理対象画像から各参照画像までの距離に応じて定めればよい。また、 2つの画素値に対応する動きベクトルの大きさに応じて重みを変更してもよい。例えば、 2つの動きべクトルのうち大きさが小さい方に対応する画素値の重みを、もうひとつの画素値の重みよりも大きくしてもよレ、。重み付け平均算出結果は、補間すべき画素の値として、メモリに書き込まれる（S136)。以上のように、 MC— BID補間処理では、処理対象の画像中の全ての補間すべき画素は、 2つの参照画像から 2つ動きベクトルに従って読み出された 2つ画素値に基づレ、て補間される。 [0087] なお、図 11Eの MC— BID補間処理では 2つの動きベクトル、 2つの参照画像を用いる力 3つ以上の動きベクトル、 3つ以上の参照画像を用いてもよい。

[0088] 図 11Fは、図 11Bのステップ S124に示した INTRA—MC混合補間処理をより詳細に示すフローチャートである。図 11Fは、図 11Eと比べて、 S150、 S151力 S追カロされた点と異なる。同じ点は説明を省略し、以下異なる点を中心に説明する。

[0089] S150において高解像度化部 202は、当該補間すべき画素を INTRA補間すべきか MC補間すべきかを判定する。この判定は、補間すべき画素のブロック中の位置や、補間すべき画素に隣接する画素が低解像度画像の画素であるか補間画素であるかを基準とすることができる。例えば、隣接画素が低解像度画像の画素であれば I NTRA補間、隣接画素が補間画素であれば MC補間と判定する。 INTRA補間と判定された場合には、 S151において高解像度化部 202は、当該補間すべき画素を IN TRA補間する。

[0090] なお、図 11Fでは、補間すべき画素毎に INTRA補間すべきか MC補間すべき力を判定している力ブロック毎やスライス毎に判定するようにしてもよい。

[0091] また、可変長符号化部 125は、可変長符号ィ匕部 113からの低解像度画像ビットストリーム LVSを一旦入力して、付加情報と関連付けて出力するようにしてもよい。

[0092] 以上説明してきたように、本実施の形態における画像符号化装置および画像復号化装置によれば、低解像度画像から高解像度画像の生成を、低処理量かつ高画質に実現することができる。

[0093] (実施の形態 1の変形例 1)

実施の形態 1は実用上の範囲内で次のような変形をおこなってもよい。図 2中の付加情報生成部 102は、高解像度画像生成部 121を取り除き、代わりに、復号高解像度化画像信号と同じ時刻の高解像度画像信号 HV1を探索対象として動きべクトノレ検出部 122に入力する構成としてもよい。動き検出部 122では、高解像度画像信号 HV1から高解像度画像の動きべ外ルを検出し、高解像度画像用の差分動きベクトルを生成する。このようにすることで、符号化装置 1の構成を簡略化することができ、低処理量を実現することができる。

[0094] また、図 2中の付加情報生成部 102は、高解像度画像生成部 121を取り除き、代わりに、復号高解像度化画像信号と同じ時刻の高解像度画像信号 HV2を高解像度化部 202から探索対象として動きベクトル検出部 122に入力する構成としてもよい。動き検出部 122では、高解像度画像信号 HV1と高解像度画像信号 HV2とから高解像度画像の動きべ外ルを検出し、高解像度画像用の差分動きべクトノレを生成する。

[0095] なお、高解像度画像生成部 121を取り除かず、生成モード選択のためだけに高解像度画像生成部 121を用いてもよい。このようにすることで、 1フレーム前の復号画像を高解像度化する処理を削減しつつ、高画質を実現することができる。

[0096] (実施の形態 2)

図 12は、実施の形態 2における画像符号化処理の他の一例を示すフローチャートである。同図は、実施の形態 1における図 7及び図 8の代わりに実行される。

[0097] 図 12において、動きベクトル検出部 122は、原画（高解像度画像 HV1)から、高解像度画像生成部 121内の既に高解像度化済の画像を参照して動きベクトルを検出し（S121)、検出された動きベクトルと動きベクトル検出部 118によって検出された動きべタトノレとの差分動きベクトルを算出する（S122)。生成モード選択部 124は、高解像度画像生成部 121によって差分動きベクトルに従って生成された高解像度化画像と、原画 (高解像度画像 HV1)との差分値 Dを算出し (S123)、差分動きベクトルを付加情報として符号化した場合の発生符号量を算出し (S 124)、次式に示す COSTを算出する（S125)。

[0098] COST=∑ I高解像度画像補間生成画像 I +発生符号量

[0099] 式中の∑ I高解像度画像補間生成画像 I は、 S123で算出された差分値 Dの和であり、原画 (高解像度画像 HV1)と、差分動きベクトルに従って生成された高解像度化画像とのブロック毎の画素値の差分の和を意味する。この値が 0であれば補間生成画像が原画とピッタリー致していること (補間生成画像の画質が最高であること）を意味し、この値が大きければ大きいほど、補間生成画像が原画からかけ離れてレ、ること（高解像度化の精度が悪ぐ画質が悪いこと）を意味する。発生符号量は、 S 124で算出されたものであり、発生符号量が小さければ低解像度画像ビットストリーム LVSの符号化効率をあまり悪化させてレ、なレ、ことを意味し、発生符号量が大きければ低解像度画像ビットストリーム LVSの符号ィ匕効率を悪化させていることを意味する。上記 COSTの値が大きければ、高解像度化画像の画質と符号化効率の少なくとも一方が悪いことを意味し、上記 COSTの値が小さければ小さいほど、高解像度化画像の画質の良さと符号化効率の良さとの両者を達成していることを意味する。

[0100] さらに、生成モード選択部 124は、算出された COSTと COST1とを比較し（S126) 、 COSTが小さければ COST1の値を COSTの値に更新する（S127)。

[0101] ここで COST1の初期値は、最低限確保すべき COSTのしきい値であり、 COST1 は、動きべタトノレの探索範囲を終了するまで（S128)のループ処理において、最小の COSTの値に更新されていく。なお、 S128において生成モード選択部 124は、探索範囲を終了したか否力、を判定しているが、符号化モードに類似の生成モード（第 2〜第 4モード）からいくつかの生成モードを試行したか否かを判定してもよい。

[0102] 上記により生成モード選択部 124は、差分動きベクトルに従って生成された高解像度化画像についての最小の COST1となる動きベクトル又は生成モードを得ることができる。

[0103] また、時空間補間画像生成部 123は、時空間補間による補間画像を生成し (S129 )、生成モード選択部 124は、生成された補間画像と、原画（高解像度画像 HV1)との差分値 Dを算出し (S130)、 COSTを算出する（S131)。さらに、生成モード選択部 124は、算出された COSTと COST2とを比較し（S132)、 COSTが小さければ C OST2の値を COSTの値に更新する（S133)。ここで COST2の初期値は、最低限確保すべき COSTのしきい値であり、 COST1の初期値と同じ値でもよい。 COST2 は、動きべタトノレの補間による生成方法を終了するまで（S 134)のループ処理において、最小の COSTの値に更新されていく。なお、 S 134において生成モード選択部 1 24は、補間による生成方法を終了したか否力、を判定しているが、この判定は、補間に用いるフィルタの種類や強度の選択を変更しながら試行し終えたか否力、を判定すればよい。補間に用いるフィルタの種類や強度は、ダウンサンプリング情報 DSIに従つて選択してもよレ、。

[0104] 上記により生成モード選択部 124は、時空間補間によって生成される高解像度化画像についての最小の COST2となる生成モードを得ることができる。

[0105] 次いで、生成モード選択部 124は、 COST1と COST2のうち最小の方に対応する生成モードを選択する（S135)。可変長符号化部 125は、選択された生成モードを示す生成モード情報を符号化する（S 136)。

[0106] このように、 COSTは高解像度化画像の画質悪さと付加情報を付加することによる低解像度画像の符号ィヒ効率の劣化と評価するものさしとなる。本実施の形態における生成モード選択部 124は、種々の生成モードにおけう COSTを算出し、 COSTが最小になる生成モードを選択するよう構成されている。その結果、高解像度化画像の画質を向上させると共に、付加情報を付加することによる符号化効率の劣化を最小限に留めることができる。

[0107] (実施の形態 3)

さらに、上記各実施の形態で示した符号化処理および復号化処理の構成を実現するための符号化および複号化プログラムや符号列（データストリーム）を、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。

[0108] 図 13 (a)〜（c)は、上記実施の形態 1から 2の符号ィ匕あるいは復号化処理を、上記符号化および復号化プログラムを格納したフレキシブルディスクを用いて、コンビユータシステムにより実施する場合を説明するための図である。

[0109] 図 13 (b)は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図 13 (a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスク FDはケース F内に内蔵され、該デイスクの表面には、同心円状に外周からは内周に向かって複数のトラック Trが形成され、各トラックは角度方向に 16のセクタ Seに分割されている。従って、上記プログラムれた領域に、上記プログラムとしてのデータが記録されている。

[0110] また、図 13 (c)は、フレキシブルディスク FDに上記プログラムの記録再生を行うための構成を示す。上記プログラムをフレキシブルディスク FDに記録する場合は、コンピュータシステム Csから上記プログラムとしてのデータをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより上記符号化および複号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。

[0111] なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行った、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、 I Cカード、 ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。

[0112] また、上記実施の形態に示した符号化方法 '複号化方法は、携帯電話やカーナビゲーシヨンシステム等の移動体通信機器やデジタルビデオカメラやデジタルスチールカメラ等の撮影機器に LSI等の半導体によって実装することが可能である。また、実装形式としては、符号化器'復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、複号化器のみの受信端末の 3通りが考えられる。具体的な応用例を図 14〜図 17を用いて説明する。

[0113] 図 14は、コンテンツ配信サービスを実現するコンテンツ供給システム exlOOの全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局 exl07 exl 10が設置されている。

[0114] このコンテンツ供給システム exlOOは、例えば、インターネット exlOlにインターネットサービスプロバイダ exl02および電話網 exl04、および基地局 exl07 exl 10を介して、コンピュータ exl 11 PDA (personal digital assistant) exl 12、カメラ exl l 3、携帯電話 exl 14、カメラ付きの携帯電話 exl 15などの各機器が接続される。

[0115] し力し、コンテンツ供給システム exlOOは図 14のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよレ、。また、固定無線局である基地局 exl 0 7 exl 10を介さずに、各機器が電話網 exl04に直接接続されてもよい。

[0116] カメラ exl 13はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電言舌は、 PDC (Personal Digital Communications)方式、 CDMA (Code Division M ultiple Access)方式、 W— CDMA (Wideband-Code Division Multiple Access)方式、若しくは GSM (Global System for Mobile Communications)方式の携帯電話機、または PHS (Personal Handyphone System)等であり、いずれでも構わない。

[0117] また、ストリーミングサーバ exl03は、カメラ 6 113から基地局6 109、電話網 exl04 を通じて接続されており、カメラ exl 13を用いてユーザが送信する符号化処理されたデータに基づレ、たライブ配信等が可能になる。撮影したデータの符号ィ匕処理はカメラ exl 13で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラ exl 16で撮影した動画データはコンピュータ exl 11を介してストリーミングサーバ exl 03に送信されてもよい。カメラ exl 16はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラ exl 16で行ってもコンピュータ exl 11で行ってもどちらでもよレ、。また、符号化処理はコンピュータ exl 11やカメラ ex 116が有する LSIexl l 7において処理することになる。なお、画像符号化'復号化用のソフトウェアをコンピュータ exl 11等で読み取り可能な記録媒体である何らかの蓄積メディア（CD— R〇M、フレキシブルディスク、ハードディスクなど）に組み込んでもよい。さらに、カメラ付きの携帯電話 exl 15で動画データを送信してもよい。このときの動画データは携帯電話 exl 15が有する LSIで符号化処理されたデータである。

[0118] このコンテンツ供給システム exlOOでは、ユーザがカメラ exl l 3、カメラ exl l6等で撮影しているコンテンツ（例えば、音楽ライブを撮影した映像等）を上記実施の形態同様に符号ィ匕処理してストリーミングサーバ exl03に送信する一方で、ストリーミングサーバ exl03は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータ exl l l、 PDAexl l 2、カメラ exl l 3、携帯電話 exl 14等がある。このようにすることでコンテンツ供給システム exlOOは、符号ィ匕されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである

[0119] このシステムを構成する各機器の符号化、復号化には上記各実施の形態で示した画像符号化装置あるいは画像復号化装置を用いるようにすればょレ、。

[0120] その一例として携帯電話について説明する。

[0121] 図 15は、上記実施の形態で説明した画像符号化方法と画像復号化方法を用いた携帯電話 exl 15を示す図である。携帯電話 exl l 5は、基地局 exl lOとの間で電波を送受信するためのアンテナ ex201、 CCDカメラ等の映像、静止画を撮ることが可能なカメラ部 ex203、カメラ部 ex203で撮影した映像、アンテナ ex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部 ex202、操作キー _ex 204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部 ex20 8、音声入力をするためのマイク等の音声入力部 ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディア ex207、携帯電話 exl l 5に記録メディア ex207を装着可能とするためのスロット部 ex206を有している。記録メディア ex207は SDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリである EEPROM (Electrically Erasable and Progra mmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである

[0122] さらに、携帯電話 exl l 5について図 16を用いて説明する。携帯電話 exl l 5は表示部 ex202及び操作キー ex204を備えた本体部の各部を統括的に制御するようになされた主制御部 ex311に対して、電源回路部 ex310、操作入力制御部 ex304、画像符号ィ匕部 ex312、カメラインターフェース部 ex303、 LCD (Liquid Crystal Display)制御部 ex302、画像復号化部 ex309、多重分離部 ex308、記録再生部 ex307、変復調回路部 ex306及び音声処理部 ex305が同期バス ex313を介して互レヽに接続されてレヽる。

[0123] 電源回路部 ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話 exl 15を動作可能な状態に起動する。

[0124] 携帯電話 exl l 5は、 CPU, ROM及び RAM等でなる主制御部 ex311の制御に基づいて、音声通話モード時に音声入力部 ex205で集音した音声信号を音声処理部 e x305によってディジタル音声データに変換し、これを変復調回路部 ex306でスぺタトラム拡散処理し、送受信回路部 ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナ ex201を介して送信する。また携帯電話機 ex 115は、音声通話モード時にアンテナ ex201で受信した受信データを増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部 ex306でスペクトラム逆拡散処理し、音声処理部 ex305によってアナログ音声データに変換した後、これを音声出力部 ex208を介して出力する。

[0125] さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キー ex2 04の操作によって入力された電子メールのテキストデータは操作入力制御部 ex304 を介して主制御部 ex311に送出される。主制御部 ex311は、テキストデータを変復調回路部 ex306でスペクトラム拡散処理し、送受信回路部 ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナ ex201を介して基地局 ex 110 へ送信する。

[0126] データ通信モード時に画像データを送信する場合、カメラ部 ex203で撮像された画像データをカメラインターフェース部 ex303を介して画像符号化部 ex312に供給する。また、画像データを送信しない場合には、カメラ部 ex203で撮像した画像データをカメラインターフェース部 ex303及び LCD制御部 ex302を介して表示部 ex202に直接表示することも可能である。

[0127] 画像符号化部 ex312は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部 ex203から供給された画像データを上記実施の形態で示した画像符号ィ匕装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部 ex308に送出する。また、このとき同時に携帯電話機 exl l 5 は、カメラ部 ex203で撮像中に音声入力部 ex205で集音した音声を音声処理部 ex3 05を介してディジタルの音声データとして多重分離部 ex308に送出する。

[0128] 多重分離部 ex308は、画像符号化部 ex312から供給された符号ィ匕画像データと音声処理部 ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部 ex306でスペクトラム拡散処理し、送受信回路部 ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナ ex201を介して送信する。

[0129] データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナ ex201を介して基地局 exl 10から受信した受信データを変復調回路部 ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部 ex308に送出する。 [0130] また、アンテナ ex201を介して受信された多重化データを復号化するには、多重分離部 ex308は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バス ex313を介して当該符号ィ匕画像データを画像復号ィ匕部 ex309に供給すると共に当該音声データを音声処理部 ex305に供給する。

[0131] 次に、画像復号ィ匕部 ex309は、本願発明で説明した画像復号化装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した複号化方法で復号することにより再生動画像データを生成し、これを LCD制御部 ex302を介して表示部 ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部 ex305は、音声データをアナログ音声データに変換した後、これを音声出力部 e x208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。

[0132] なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図 17に示すようにディジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号化装置のいずれかを組み込むことができる。具体的には、放送局 _ex409では映像情報のビットストリームが電波を介して通信または放送衛星 ex410に伝送される。これを受けた放送衛星 ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナ ex406で受信し、テレビ（受信機） ex401またはセットトップボックス（STB) ex407などの装置によりビットストリームを復号化してこれを再生する。また、記録媒体である CDや DVD等の蓄積メディア ex402に記録したビットストリームを読み取り、復号化する再生装置 ex403 にも上記実施の形態で示した画像複号化装置を実装することが可能である。この場合、再生された映像信号はモニタ ex404に表示される。また、ケーブルテレビ用のケ一ブル ex405または衛星/地上波放送のアンテナ ex406に接続されたセットトップボックス ex407内に画像復号化装置を実装し、これをテレビのモニタ ex408で再生する構成も考えられる。このときセットトップボックスではなぐテレビ内に画像復号化装置を組み込んでも良い。また、アンテナ ex411を有する車 ex412で衛星 ex410からまたは基地局 ex 107等から信号を受信し、車 ex412が有するカーナビゲーション ex413 等の表示装置に動画を再生することも可能である。

[0133] 更に、画像信号を上記実施の形態で示した画像符号化装置で符号化し、記録媒体に記録することもできる。具体例としては、 DVDディスク ex421に画像信号を記録する DVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダ ex42 0がある。更に SDカード ex422に記録することもできる。レコーダ ex420が上記実施の形態で示した画像復号ィ匕装置を備えていれば、 DVDディスク ex421や SDカード e x422に記録した画像信号を再生し、モニタ ex408で表示することができる。

[0134] なお、カーナビゲーシヨン ex413の構成は例えば図 15に示す構成のうち、カメラ部 e x203とカメラインターフェース部 ex303、画像符号ィ匕部 ex312を除いた構成が考えられ、同様なことがコンピュータ exl 11やテレビ（受信機） ex401等でも考えられる。

[0135] また、上記携帯電話 exl 14等の端末は、符号化器 ·複号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の 3通りの実装形式が考えられる。

[0136] なお、図 1、図 2に示したブロック図の各機能ブロックは典型的には集積回路装置である LSIとして実現される。この LSIは 1チップ化されても良いし、複数チップィ匕されても良い。（例えばメモリ以外の機能ブロックが 1チップ化されていても良レ、。）ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレトラ LS Iと呼称されることあある。

[0137] 集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセサで実現してもよレ、。 LSI製造後に、プログラムすることが可能な FPGA (Field Programmable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル ·プロセッサを利用しても良レ、。

[0138] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用レ、て機能ブロックの集積化を行ってもよレ、。バイオ技術の適応等が可能性としてありえる。

[0139] また、各機能ブロックのうち、データを格納するユニットだけ 1チップ化せずに、本実施形態の記録媒体 115のように別構成としても良い。 [0140] なお、図 1、 2に示したブロック図の各機能ブロックおよび図 7、 8、 10〜12に示したフローチャートにおいて、中心的な部分はプロセッサおよびプログラムによっても実現される。

[0141] このように、上記実施の形態で示した画像符号化方法あるいは画像復号化方法を上述したいずれの機器 'システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。

[0142] また、本発明は力、かる上記実施形態に限定されるものではなぐ本発明の範囲を逸脱することなく種々の変形または修正が可能である。

産業上の利用可能性

[0143] 本発明は、画像を符号化又は復号化するする符号化装置、復号化装置に適しており、動画配信するウェブサーバー、それを受信するネットワーク端末、動画の記録再生可能なデジタルカメラ、カメラ付き携帯電話機、 DVD録画/再生機、 PDA,パ一ソナルコンピュータ等に適してレ、る。

Claims

請求の範囲

[1] 第 1ビデオデータにおける画像の動きを示す動きベクトルを含む付加情報と、第 1ビデォデータと同内容であって第 1ビデオデータよりも解像度の低い第 2ビデオデータの符号化データであるストリームデータとを取得する取得手段と、

前記ストリームデータを第 2ビデオデータの画像に復号化する復号化手段と、復号化された第 2ビデオデータの画像に対して、付加情報を用いて補間することにより第 1ビデオデータと同じ解像度の第 3ビデオデータに変換する変換手段とを備えることを特徴とする復号化装置。

[2] 前記変換手段は、

前記付加情報から動きべ外ルを抽出する抽出手段と、

復号化手段によって復号化された第 2ビデオデータの画像に対して、当該画像の画素を用いて画素を補間する第 1補間手段と、

復号化手段によって復号化された第 2ビデオデータの画像に対して、抽出された動きべ外ルを用いて第 2ビデオデータの画像に画素を補間する第 2補間手段と、第 1補間手段および第 2補間手段を選択的に用いて、第 3ビデオデータの画像を生成する生成手段と

を備えることを特徴とする請求項 1記載の複号化装置。

[3] 前記第 2補間手段は、

第 3ビデオデータの変換済の画像と、変換対象の第 3ビデオデータの画像と保持するためのメモリ手段と、

変換対象の第 3ビデオデータの画像における補間すべき画素位置を特定する第 1 特定手段と、

変換済の第 3ビデオデータの画像において、第 1特定手段に特定された画素位置に対応する画素を動きベクトルに従って特定する第 2特定手段と、

第 2特定手段によって特定された画素の値を読み出す読み出し手段と、読み出し手段によって読み出された画素の値に従って、第 1特定手段によって特定された画素位置に補間画素の値を書き込む書き込み手段と

を備えることを特徴とする請求項 2記載の復号化装置。

[4] 前記付加情報は、第 1ビデオデータを構成するブロック単位に動きベクトルを含み、前記第第 1特定手段は、ブロック内の補間すべき画素位置を特定し、

前記第第 2特定手段は、ブロック単位の動きベクトルに従って、第 1特定手段に特定された画素位置に対応する画素を特定する

を備えることを特徴とする請求項 3記載の複号化装置。

[5] 前記付加情報は、第 1ビデオデータを構成するブロック単位に 2つの動きベクトルを含み、

前記第 2特定手段と、変換済の第 3ビデオデータの 2つの画像において、第 1特定手段に特定された画素位置に対応する 2つの画素を 2つの動きベクトルに従って特定し、

前記読み出し手段は、第 2特定手段によって特定された 2つの画素の値を読み出し

前記書き込み手段は、読み出し手段によって読み出された 2つの画素の値に基づいて、前記補間画素の値を算出する

を備えることを特徴とする請求項 3記載の復号化装置。

[6] 前記生成手段は、第 2ビデオデータの画像が画像内符号化されている場合には、当該画像を第 1補間手段を用いて、第 3ビデオデータの画像を生成し、

第 2ビデオデータの画像が画像間予測符号化されている場合には、当該画像を第 2補間手段を用いて、第 3ビデオデータの画像を生成する

を備えることを特徴とする請求項 3記載の復号化装置。

[7] 第 1ビデオデータにおける画像の動きを示す動きべ外ルを含む付加情報と、第 1ビデォデータと同内容であって第 1ビデオデータよりも解像度の低い第 2ビデオデータの符号ィ匕データであるストリームデータとを取得し、

前記ストリームデータを第 2ビデオデータの画像に複号化し、、

復号化された第 2ビデオデータの画像を、付加情報を用いて補間することにより第 1 ビデオデータと同じ解像度の第 3ビデオデータに変換する

ことを特徴とする復号ィ匕方法。

[8] 第 2ビデオデータから第 3ビデオデータへの前記変換にぉレ、て、前記付加情報から動きベクトルを抽出し、

第 1補間法および第 2補間法の何れかを選択し、

第 1補間法が選択された場合に、復号化された第 2ビデオデータの画像に対して、当該画像の画素を用いて画素を補間し、

第 2補間法が選択された場合に、復号化された第 2ビデオデータの画像に対して、抽出された動きベクトルを用いて第 2ビデオデータの画像に画素を補間する

ことを特徴とする請求項 8記載の複号化方法。

[9] 前記第 2補間法による補間において、

第 3ビデオデータの変換済の画像と変換対象の第 3ビデオデータの画像と保持するためのメモリを参照することにより、変換対象の第 3ビデオデータの画像における補間すべき画素位置を特定し、

変換済の第 3ビデオデータの画像にぉレ、て、特定された画素位置に対応する画素を動きベクトルに従って特定し、

特定された画素の値を読み出し、

読み出された画素の値に従って、特定された画素位置に補間画素の値を書き込むことを特徴とする請求項 8記載の復号化方法。

[10] 前記付加情報は、第 1ビデオデータを構成するブロック単位に動きベクトルを含み、前記画素位置は、ブロック毎に特定され、

特定された画素位置に対応する、変換済の第 3ビデオデータの画像における画素は、ブロック単位の動きベクトルに従って、特定される

ことを特徴とする請求項 9記載の復号化方法。

[11] 前記付加情報は、第 1ビデオデータを構成するブロック単位に 2つの動きベクトルを含み、

前記画素位置は、ブロック毎に特定され、

特定された画素位置に対応する、変換済の第 3ビデオデータの画像における 2つの画素は、 2つ動きべタトノレに従って、特定され、

2つの画素の値に基づいて、前記補間画素の値が算出される

ことを特徴とする請求項 9記載の複号化方法。

[12] 前記第 1補間法または第 2補間法の選択において、

第 2ビデオデータの画像が画像内符号化されている場合には、第 1補法を選択し、第 2ビデオデータの画像が画像間予測符号化されている場合には、第 2補間法を選択する

ことを特徴とする請求項 9記載の複号化方法。

[13] 第 1ビデオデータを、第 1ビデオデータのよりも低い解像度の第 2ビデオデータに変換する変換手段と、

第 2ビデオデータをストリームデータに符号化する符号化手段と、

第 1ビデオデータの動きを示し、第 2ビデオデータの画像に画素を補間するための付加情報を生成する生成手段と、

第 1ビデオデータの画素値を示す符号を出力することなぐ前記ストリームデータと前記付加情報とを出力する出力手段と

を備えることを特徴とする画像符号化装置。

[14] 第 1ビデオデータを、第 1ビデオデータのよりも低い解像度の第 2ビデオデータに変換し、

第 2ビデオデータをストリームデータに符号化し、

第 1ビデオデータの動きを示し、第 2ビデオデータの画像に画素を補間するための付加情報を生成し、

第 1ビデオデータの画素値を示す符号を出力することなぐ前記ストリームデータと前記付加情報とを出力する

ことを特徴とする画像符号化方法。

[15] コンピュータ読み取り可能なプログラムであって、

第 1ビデオデータにおける画像の動きを示す動きベクトルを含む付加情報と、第 1ビデォデータと同内容であって第 1ビデオデータよりも解像度の低い第 2ビデオデータの符号化データであるストリームデータとを取得する取得手段と、

前記ストリームデータを第 2ビデオデータの画像に復号化する復号化手段と、復号化された第 2ビデオデータの画像に対して、付加情報を用いて補間することにより第 1ビデオデータと同じ解像度の第 3ビデオデータに変換する変換手段とをコンピュータに発揮させることを特徴とするプログラム。

[16] コンピュータ読み取り可能なプログラムであって、

第 1ビデオデータを、第 1ビデオデータのよりも低い解像度の第 2ビデオデータに変換する変換手段と、

をコンピュータに発揮させることを特徴とするプログラム。

[17] 第 1ビデオデータにおける画像の動きを示す動きベクトルを含む付加情報と、第 1ビデォデータと同内容であって第 1ビデオデータよりも解像度の低い第 2ビデオデータの符号化データであるストリームデータとを取得する取得手段と、

前記ストリームデータを第 2ビデオデータの画像に復号化する復号化手段と、復号化された第 2ビデオデータの画像に対して、付加情報を用いて補間することにより第 1ビデオデータと同じ解像度の第 3ビデオデータに変換する変換手段とを備えることを特徴とする半導体装置。