JP2011199685A - 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム - Google Patents

動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム Download PDF

Info

Publication number
JP2011199685A
JP2011199685A JP2010065270A JP2010065270A JP2011199685A JP 2011199685 A JP2011199685 A JP 2011199685A JP 2010065270 A JP2010065270 A JP 2010065270A JP 2010065270 A JP2010065270 A JP 2010065270A JP 2011199685 A JP2011199685 A JP 2011199685A
Authority
JP
Japan
Prior art keywords
signal
image
motion compensation
prediction error
error signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010065270A
Other languages
English (en)
Other versions
JP5375697B2 (ja
Inventor
Junpei Koyama
純平 小山
Akira Nakagawa
章 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010065270A priority Critical patent/JP5375697B2/ja
Publication of JP2011199685A publication Critical patent/JP2011199685A/ja
Application granted granted Critical
Publication of JP5375697B2 publication Critical patent/JP5375697B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画像の符号化の効率を向上させる。
【解決手段】選択部106は、予測誤差信号55から符号化情報56を生成する生成規則として、予測誤差信号55が符号化されたときの情報量が最も小さくなることが複数の動き補償信号53から推定される生成規則を選択する。符号化情報生成部56は、選択された生成規則に従って、予測誤差信号55を符号化して符号化情報56を生成する。再生予測誤差信号生成部108は、選択された生成規則に従って符号化された信号を再生するための再生規則に従って符号化情報56から予測誤差信号55の再生を行い、得られた信号を再生予測誤差信号57として出力する。更新部111は、符号化情報生成部105が符号化情報56の生成において従っていた生成規則を、再生予測誤差信号57に基づき、符号化情報56の情報量が小さくなるように更新する。
【選択図】図6

Description

本明細書で議論される実施態様は、動画像の符号化及びその復号の技術に関する。
動画像データは、一般にデータ量が多いため、送信装置から受信装置への伝送を行う際や、記憶装置に記憶する際などには、高能率符号化が行われる。「高能率符号化」とは、あるデータ列を他のデータ列に変換して、そのデータ量を削減する符号化処理をいう。
動画像データの高能率符号化方法のひとつとして、ピクチャ内予測(イントラ予測)符号化方法が知られている。この符号化方法は、動画像を構成する各フレーム(1枚の画像情報)には空間方向に相関性が高いという特徴があることを利用する。この符号化方法を用いた場合における画像の復元では、自らのピクチャ(符号化される画像)の情報のみを利用して画像の復元が可能であり、他のピクチャの情報は不要である。
また、動画像データの高能率符号化方法の他のひとつとして、ピクチャ間予測(インター予測)符号化方法も知られている。この符号化方法は、動画像データには時間方向に相関性が高いという特徴があること、すなわち、動画像データは、一般に、あるタイミングのピクチャデータと次のタイミングのピクチャデータとの類似度が高いという性質があることを利用して画像を符号化する。
ピクチャ間予測符号化では、一般に、原画像を複数のブロックに分割した上で、各ブロックについて符号化を行う。符号化装置は、このブロック毎に、一旦符号化した後のフレームの復号画像から、原画像のブロックと類似している領域を選択し、この類似領域と原画像のブロックとの差分を計算することで、時間的な冗長性を取り除く。そして、類似領域を指し示す動きベクトル情報と、冗長性の取り除かれた差分情報とを符号化する。ピクチャ間予測符号化は、このようにして、高い圧縮率を実現している。
例えば、インター予測符号化を用いたデータ伝送システムでは、送信装置は、まず、前ピクチャから符号化対象ピクチャへの「動き」を表す動きベクトルデータ、及び、符号化対象ピクチャの予測画像と符号化対象ピクチャの実際の画像との差分データを生成する。そして、生成した、動きベクトルデータ及び差分データを受信装置に送出する。ここで、予測画像は、前ピクチャと動きベクトルデータとを用いて作成される。一方、受信装置は、受信した動きベクトルデータ及び差分データから符号化対象ピクチャを再生する。
広く知られている動画像符号化方式のうちの代表的なものとして、国際標準化機構(ISO)と国際電気標準会議(IEC)とが共同で策定したMPEG(Moving Picture Experts Group)規格を挙げることができる。
MPEG規格のひとつとして知られているMPEG−2では、Iピクチャ、Pピクチャ、及びBピクチャと称されている、3つのピクチャが規定されている。このうち、Iピクチャは、1フレーム内の情報のみを符号化して得られるピクチャである。また、Pピクチャは、過去のピクチャから順方向のピクチャ間予測を行ったときの予測誤差を符号化して得られるピクチャである。そして、Bピクチャは、過去及び未来のピクチャから双方向のピクチャ間予測を行ったときの予測誤差を符号化して得られるピクチャである。
動画像の符号化においては、効率の良い(すなわち、圧縮率が高い)方式が好ましい。この効率を高めるための技術が幾つか提案されている。このひとつに、符号化対象信号と相関のある信号を参照信号として取得し、変換規則の基礎となる変換基底を取得された参照信号の特性に基づいて導出し、導出された変換基底に基づいた変換規則に従って符号化対象信号を変換して符号化するという技術がある。
また、この他の背景技術として、双方向予測復号に用いる参照画像の劣化を検出して復号画像の劣化を抑制するという予測復号の技術が提案されている。
特開2002−314428号公報 特開2000−59785号公報
前述したように、動画像の符号化においては効率の良い方式が望まれているが、既存の技術には改善の余地がある。
本発明は、以上の事情に鑑みてなされたものであり、その解決しようとする課題は、動画像の符号化の効率を向上させることである。
本明細書で後述する動画像符号化装置に、動き補償信号生成部と、予測信号生成部と、予測誤差信号生成部と、選択部と、符号化情報生成部と、再生予測誤差信号生成部と、復号画像生成部と、復号画像蓄積部と、を有するというものがある。ここで、動き補償信号生成部は、符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する。なお、符号化対象信号とは、動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す信号である。予測信号生成部は、該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する。予測誤差信号生成部は、該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する。選択部は、該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う。符号化情報生成部は、該選択部により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する。再生予測誤差信号生成部は、再生規則に従って、該符号化情報生成部が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する。なお、この再生規則とは、該選択部により選択された生成規則に予め対応付けられている規則であって、該生成規則に従って符号化された信号を再生するための規則である。復号画像生成部は、該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する。復号画像蓄積部は、該復号画像生成部が出力した復号画像を蓄積する。なお、このうちの動き補償信号生成部は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる。
また、本明細書で後述する動画像復号装置に、上述した動画像符号化装置から送られてくる、該符号化情報と該画像の動きを表している動きベクトル情報とに基づいて該符号化対象画像の復号画像を復号するというものがある。この装置は、復号装置側復号画像蓄積部と、復号装置側動き補償信号生成部と、復号装置側予測信号生成部と、復号装置側選択部と、復号装置側再生予測誤差信号生成部と、復号装置側復号画像生成部と、を有する。ここで、復号装置側復号画像蓄積部は、該符号化対象画像の復号画像を蓄積する。復号装置側動き補償信号生成部は、該復号装置側復号画像蓄積部から読み出した複数の該復号画像を複数の参照画像として用い、該複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する。復号装置側予測信号生成部は、該予測信号を、該復号装置側動き補償信号生成部が生成した複数の動き補償信号から生成する。復号装置側選択部は、該符号化情報生成部が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則を選択する。復号装置側再生予測誤差信号生成部は、該選択部により選択された生成規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する。復号装置側復号画像生成部は、該復号装置側予測信号生成部が生成した予測信号と該復号装置側再生予測誤差信号生成部が出力した再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する。なお、このうちの該復号装置側復号画像蓄積部は、該復号装置側復号画像生成部が出力した該符号化対象画像の復号画像を蓄積する。
また、本明細書で後述する動画像符号化方法には、以下のようにして動画像の符号化を行うものがある。すなわち、この方法では、まず、符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する。なお、符号化対象信号とは、動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す信号である。そして、該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する。そして、該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する。そして、該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う。そして、該選択により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する。そして、該選択により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該生成した符号化情報から該予測誤差信号の再生を行う。そして、この再生により得られた信号を再生予測誤差信号として出力する。そして、該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する。そして、該出力された復号画像を復号画像蓄積部で蓄積する。なお、このうちの該動き補償信号の生成では、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる。
また、本明細書で後述する動画像符号化プログラムに、動画像の符号化をコンピュータに行わせるためのものがある。このプログラムは、動き補償信号生成処理と、予測信号生成処理と、予測誤差信号生成処理と、選択処理と、符号化情報生成処理と、再生予測誤差信号生成処理と、復号画像生成処理と、復号画像蓄積処理と、を該コンピュータに行わせるというものである。ここで、動き補償信号生成処理は、符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する処理である。なお、ここで、符号化対象信号は、動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す信号である。予測信号生成処理は、該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する処理である。
予測誤差信号生成処理は、該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する処理である。選択処理は、該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う処理である。符号化情報生成処理は、該選択処理により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する処理である。再生予測誤差信号生成処理は、再生規則に従って、該符号化情報生成処理が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する処理である。なお、この再生規則は、該選択処理により選択された生成規則に予め対応付けられている規則であって該生成規則に従って符号化された信号を再生するための規則である。復号画像生成処理は、該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する処理である。復号画像蓄積処理は、該復号画像生成処理が出力した復号画像を復号画像蓄積部に蓄積する処理である。なお、このうちの動き補償信号生成処理は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる。
本明細書で後述する動画像符号化装置は、高い効率で動画像の符号化を行うことができ、また、この符号化により得られるビットストリームを、本明細書で後述する動画像復号装置で復号して動画像を復元することができる。
動画像符号化装置の全体構成図である。 動画像復号装置の全体構成図である。 双方向予測の一般的な手法の説明図である。 予測誤差信号と動き補償信号間差分信号との相関についての説明図である。 ジグザグスキャンのスキャンパターンの一例の説明図である。 動画像符号化装置の詳細構成図である。 動画像符号化装置の動作の説明図である。 生成規則の選択手法の第一の例の説明図である。 生成規則の選択手法の第二の例の説明図(その1)である。 生成規則の選択手法の第二の例の説明図(その2)である。 生成規則の選択手法の第二の例の説明図(その3)である。 生成規則の選択手法の第二の例の説明図(その4)である。 直交変換基底及び逆直交変換基底の更新の手法の説明図である。 動画像復号装置の詳細構成図である。 動画像復号装置の動作の説明図である。 動画像符号化処理の処理内容を図解したフローチャートである。 動画像復号処理の処理内容を図解したフローチャートである。 コンピュータのハードウェア構成図である。
まず図1について説明する。図1には、本実施形態に係る動画像符号化装置の全体の構成が図解されている。
この動画像符号化装置1は、まず、予測誤差信号生成部11が、動画像符号化装置1に入力された原画の信号と、予測信号生成部21から出力される予測信号との差分を計算して予測誤差信号を生成する。そして、この予測誤差信号に対し、直交変換部12、量子化部13、ジグザグスキャン部14、及びエントロピー符号化部15が各種の処理を施すことでデータストリームを生成し、この動画像符号化装置1の出力とする。なお、予測信号は、量子化部13の出力信号に対し、逆量子化部16、逆直交変換部17、復号画像生成部18、復号画像記憶部19、動き補償信号生成部20、予測信号生成部21が各種の処理を施すことによって生成される。
なお、動画像符号化装置1は、動画像の各フレームを複数のブロックに分割し、各画像ブロックについて符号化を行う。このときの画像ブロックのサイズは、固定されていてもよいし、可変サイズであってもよい。
予測誤差信号生成部11には、現ピクチャ(符号化対象ピクチャ)を分割することによって得られる各画像ブロック(符号化対象ブロック)の画像を表しているブロックデータ(符号化対象ブロックデータ)が順番に入力される。画像ブロックのサイズは、例えば、16×16画素のブロック(マクロブロック)である。予測誤差信号生成部11は、符号化対象ブロックデータと、予測信号生成部21から供給される予測ピクチャのブロックデータ(予測信号)との差分を計算することにより、予測誤差信号を生成する。
直交変換部12は、予測誤差信号生成部11により生成された予測誤差信号に対して直交変換処理を行う。この直交変換処理によって、予測誤差信号を水平方向及び垂直方向の周波数成分に分離した周波数領域信号が生成される。本実施形態においては、直交変換の方式として、離散コサイン変換(DCT:Discrete Cosine Transform )を用いることとする。
量子化部13は、直交変換部12の出力信号を量子化する。この量子化によって動画像データの符号量が削減される。量子化部13の出力信号は、ジグザグスキャン部14および逆量子化部16に供給される。
ジグザグスキャン部14は、予め定められているスキャンパターンで量子化部13の出力信号(複数の係数)をスキャンして、ラン・レベル情報を生成する。ラン・レベル情報は、量子化部13の出力信号をスキャン順に並べた係数列から得られる、ゼロでない係数の値を表す情報(level)、及び、ゼロである係数が連続する長さを表す情報(run)などを含む情報である。
エントロピー符号化部15は、ジグザグスキャン部14から出力されるラン・レベル情報と、動き補償信号生成部20で算出される後述の動きベクトルを表す動きベクトル情報とをエントロピー符号化(可変長符号化)する。エントロピー符号化は、シンボルの出現頻度に応じて異なる長さの符号を割り当てる符号化であり、出現頻度の高いシンボルほど短い長さの符号を割り当てることで、量子化部13の出力信号の符号量を削減する。
逆量子化部16は、量子化部13の出力信号を逆量子化する。逆直交変換部17は、逆量子化部16の出力信号を逆直交変換する。逆量子化部16及び逆直交変換部17での処理は、それぞれ、量子化部13及び直交変換部12の処理と対の処理である。すなわち、逆量子化部16及び逆直交変換部17により予測誤差信号の復号処理が行われて、当該予測誤差信号と類似する信号(以下、「再生予測誤差信号」と称することとする)が得られる。
復号画像生成部18は、予測信号生成部21によって生成される予測画像のブロックデータと、逆直交変換部17から出力される再生予測誤差信号とを加算して、前述したブロック毎の復号画像(局部復号画像)を生成する。
復号画像記憶部19は、復号画像生成部18により生成された局部復号画像を表しているデータを、新たな参照画像のデータとして格納し記憶しておく。
動き補償信号生成部20は、まず、原ピクチャの符号化対象ブロックのブロックデータと、復号画像記憶部19に格納されている参照画像のブロックデータとを用いて、符号化対象ブロックの動きベクトルを計算により算出する。ここで、動きベクトルとは、原ピクチャと参照画像との間での空間的なずれを表す値である。動き補償信号生成部20は、例えば、参照画像において現ピクチャの符号化対象ブロックに最も類似しているブロックの位置を探索するブロックマッチング技術を用いる。そして、符号化対象ブロックと探索により見出した類似ブロックとの位置のずれを計算することで、動きベクトルを算出する。また、動き補償信号生成部20は、算出した動きベクトルで参照画像の動き補償を行って、動き補償された参照画像のブロックデータを生成する。
予測信号生成部21は、動き補償信号生成部20によって生成された、動き補償された参照画像のブロックデータに基づいて、符号化対象信号の予測信号を生成する。この予測信号は、前述したように、予測誤差信号生成部11に供給される。
次に図2について説明する。図2には動画像復号装置の全体の構成が図解されている。
この動画像復号装置2は、図1に図解した構成を備えている動画像符号化装置1で生成された符号化情報を復号して画像を再生するものである。この動画像復号装置2は、エントロピー復号部31、逆ジグザグスキャン部32、逆量子化部33、逆直交変換部34、動き補償信号生成部35、予測信号生成部36、復号画像生成部37、及び復号画像記憶部38を備えている。
エントロピー復号部31、逆ジグザグスキャン部32、逆量子化部33、及び、逆直交変換部34は、それぞれ、図1の動画像符号化装置1におけるエントロピー符号化部15、ジグザグスキャン部14、量子化部13、及び直交変換部12の逆の処理を実行する。これにより、動画像符号化装置1より送られてきたデータストリームから、再生予測誤差信号が得られる。
動き補償信号生成部35は、復号画像記憶部38に格納されている参照画像と、動画像符号化装置1から通知されてエントロピー復号部31から出力される動きベクトルとを利用して動き補償信号を生成する。そして、予測信号生成部36は、動き補償信号生成部35が生成した動き補償信号に基づいて、復号画像の予測値を表す予測信号を生成する。この、動き補償信号生成部35及び予測信号生成部36は、基本的に、図1の動画像符号化装置1における動き補償信号生成部20及び予測信号生成部21と同一の処理を行って、予測信号の生成を行う。
復号画像生成部37は、予測信号生成部36により生成される予測信号と、逆直交変換部34から出力される再生予測誤差信号とを加算することによって、復号画像を生成する。なお、生成された復号画像は、以降の復号処理において利用される参照画像として復号画像記憶部38に格納される。
動画像復号装置2は、以上のようにして、図1に図解した構成を備えている動画像符号化装置1で生成された符号化情報を復号し、復号画像を再生する。
次に、図1の動画像符号化装置1での符号化において行う双方向予測について説明する。
まず、双方向予測の一般的な手法について、図3を用いて説明する。
符号化対象画像40の符号化を、双方向予測(Bidirectional prediction / Bipredictive )を用いて行う場合には、前方向参照画像41及び後方向参照画像42が使用される。ここで、前方向参照画像41(前方向動き補償画像)は、一般的に符号化対象画像40よりも前の時刻に表示される複数の参照画像の中から選択される。また、後方向参照画像42(後方向動き補償画像)は、一般的に符号化対象画像40よりも後の時刻に表示される複数の参照画像の中から選択される。
前方向予測ブロック41−1は、前方向参照画像41において、符号化対象画像40を分割して得た画像ブロックのひとつである符号化対象ブロック40−1と最も類似している画像ブロックである。また、前方向動きベクトルは、符号化対象ブロック40−1と前方向予測ブロック41−1との間の「動き」を表す。そして、前方向予測ブロック41−1の画像を表す前方向動き補償信号41−3が生成される。
同様に、後方向予測ブロック42−1は、後方向参照画像42において、符号化対象ブロック40−1と最も類似している画像ブロックである。また、後方向動きベクトル42−2は、符号化対象ブロック40−1と後方向予測ブロック42−1との間の「動き」を表す。そして、後方向予測ブロック42−1の画像を表す後方向動き補償信号42−3が生成される。
符号化対象ブロック40−1の画像を表す符号化対象信号40−2についての予測信号40−3は、前方向動き補償信号41−3と後方向動き補償信号42−3との加算平均を加算器43が計算することで生成される。そして、減算器44により計算される符号化対象信号40−2と予測信号40−3との差分を表す予測誤差信号40−4と、前方向動きベクトル41−2の情報及び後方向動きベクトル42−2の情報とが符号化される。
なお、図3においては、前方向動き補償信号41−3と後方向動き補償信号42−3とを加算する加算器43が描かれているが、実際には、その加算値が「2」で除算される。また、前述したMPEG規格のひとつとしても知られている、国際電気通信連合電気通信標準化部門(ITU−T)勧告のH.264規格(MPEG−4 AVC)では、2枚の参照画像が任意の複数の参照画像から生成される。そして、それらを重み付けして加算した値が、Bピクチャ(双方向予測符号化画像)として使用される。
次に、予測誤差信号と動き補償信号間差分信号との相関について、図4を用いて説明する。
図4の画像例は、正方形の物体Xが時計方向に回転している動画像を想定している。ここでは、時刻tの符号化対象画像40が、時刻t−1の前方向参照画像41−1および時刻t+1の後方向参照画像42−1を用いて符号化されるものとする。なお、この例では、前方向動きベクトル41−2および後方向動きベクトル42−2は、どちらもゼロであるとする。また、物体Xが存在する領域の画素値は100であるとし、背景領域の画素値はゼロであるものとする。なお、画素値は、特に限定されるものではないが、例えば輝度レベルである。
前方向予測ブロック41−1としては、符号化対象ブロック40−1と最も差分の小さい領域が選択される。図4の画像例では、物体Xが回転しているので、前方向参照画像41から符号化対象ブロック40−1と全く同じ画像ブロックが検出されることはない。すなわち、前方向参照画像41において、符号化対象ブロック40−1と最も類似しているが、少しだけ差異のある画像ブロックが、前方向予測ブロック41−1として抽出される。同様に、後方向参照画像42においても、符号化対象ブロック40−1と最も類似しているが、少しだけ差異のある画像ブロックが、後方向予測ブロック42−1として抽出される。
図3を用いて前述したように、予測信号40−3は、加算器43により、前方向動き補償信号41−3と後方向動き補償信号42−3との加算平均を画素毎に計算することにより生成される。このようにして生成される予測信号40−3が示している、画像ブロックの各画素の画素値に注目する。
この画素値は、前方向動き補償信号41−3と後方向動き補償信号42−3とのどちらにも物体Xが存在する領域のものについては「100」である。これに対し、前方向動き補償信号41−3と後方向動き補償信号42−3とのうちの一方にのみ物体Xが存在する領域では、各画素の画素値が「50」となる。そして、前方向動き補償信号41−3と後方向動き補償信号42−3とのどちらもが背景である領域(すなわち物体Xが存在しない領域)では、各画素の画素値が「0」となる。
このような予測信号40−3に基づいて予測誤差信号40−4が算出される。図3を用いて説明したように、予測誤差信号40−4は、減算器44により、符号化対象信号40−2と予測信号40−3との差分を画素毎に計算することにより生成される。次に、このようにして生成される予測誤差信号40−4が示している、画像ブロックの各画素の画素値に注目する。
この予測誤差信号40−4についての画素値は、図4に図解されているように、符号化対象ブロック40−1上における物体Xと背景との境界の周辺に、「50」となる領域と「−50」となる領域とが現れる。
ここで、前方向動き補償信号41−3と後方向動き補償信号42−3との差分に注目する。
図4に描かれている、動き補償信号間差分信号46(または、予測間差分信号)は、動き補償信号間差分信号算出器45が、前方向動き補償信号41−3と後方向動き補償信号42−3との差分の絶対値を画素毎に算出して得るものである。従って、このようにして得られる動き補償信号間差分信号46が示している、画像ブロックの各画素の画素値は、図4に図解したように、符号化対象ブロック40−1上における物体Xと背景との境界の周辺に、「100」となる領域が現れる。
ここで、予測誤差信号40−4と動き補償信号間差分信号46とがそれぞれ示している、画像ブロックの各画素の画素値を対比する。すると、この両者において、画素値がゼロでない領域の形状がほぼ一致する。このことは図4の画像例からも分かる。以上のことから、予測誤差が発生する領域は、前方向動き補償信号41−3と後方向動き補償信号42−3との画素値が異なる領域であり、予測誤差信号40−1の画素値の分布と動き補償信号間差分信号46の画素値の分布とは、高い相関を示しているといえる。
ところで、図1の動画像符号化装置1において、予測誤差信号生成部11により生成された信号(すなわち予測誤差信号40−4)は、直交変換部12によって直交変換された後に、エントロピー符号化部15によってエントロピー符号化が行われる。このときの直交変換により得られる複数の係数は、ジグザグスキャン部14によって、図5に例示するようなスキャンパターンでジグザグスキャンされ、更にラン・レベル情報に変換されて、エントロピー符号化部15に送られる。
このとき、直交変換により得られる複数の係数が、例えば、低周波数成分側に集まっていれば、エントロピー符号化後の符号化データの情報量は小さくなる。他方、予測誤差信号生成部11により生成された信号を直交変換して得られる係数の周波数分布は、その信号(すなわち予測誤差信号40−4)の画素値の分布に依存する。従って、予測誤差信号40−4の画素値の分布を検出し、その分布に応じた直交変換方法を適切に選択すれば、符号化データの情報量を小さくすることができる。
そこで、本実施形態では、図4を用いて前述した、予測誤差信号40−4の画素値の分布と動き補償信号間差分信号46の画素値の分布とが呈する高い相関を利用して、符号化データの情報量の削減を図る。すなわち、本実施形態では、予測誤差信号40−4の画素値の分布の代わりに、動き補償信号間差分信号46の画素値の分布に基づいて、予測誤差信号40−4を直交変換する際の変換方法を適切に選択する。更に、本実施形態では、選択された直交変換に使用される変換基底を、動き補償信号間差分信号46と、逆量子化部16及び逆直交変換部17により生成される再生予測誤差信号とに基づいて更新することで、符号化データの情報量の更なる削減を図る。
次に図6について説明する。図6は、動画像符号化装置1の詳細構成図である。
前述したように、動画像符号化装置1は、動画像の各フレームを複数の画像ブロックに分割し、各画像ブロックについて符号化を行う。なお、図6において、動画像符号化装置1に入力されている符号化対象信号51は、符号化対象画像における符号化対象ブロックの画像を表している信号である。
動き推定部101は、動画像符号化装置1に入力されている符号化対象信号51と、後述の参照画像蓄積部110に蓄積されている複数の参照画像とに基づいて、1又は複数の動きベクトル52を生成する。また、動き補償信号生成部102は、動き推定部101が生成した動きベクトル52と、参照画像蓄積部110に蓄積されている複数の参照画像とに基づいて、1又は複数の動き補償信号53を生成する。例えば、双方向予測においては、動き推定部101は前方向と後方向との動きベクトル52を生成し、動き補償信号生成部102は前方向と後方向との動き補償信号53を生成する。なお、図1における動き補償信号生成部20は、この動き推定部101と動き補償信号生成部102とを含むものである。
予測信号生成部103は、動き補償信号生成部102が生成した動き補償信号53を用いて、動画像符号化装置1に入力されている符号化対象信号51についての予測値を表す予測信号54を生成する。予測信号生成部103が行う予測信号54の生成には、既知の手法が用いられる。例えば、MPEG−1、MPEG−2、H.264/MPEG−4 AVCなどの各種のMPEG規格等で用いられているインター予測や双方向予測(Bピクチャ)、又はH.264/MPEG−4 AVC等で採用されているイントラ予測等の手法が用いられる。なお、予測信号生成部103での予測信号54の生成に使用する手法を指示する予測モード(H.264/MPEG−4 AVCのイントラ予測モードや、インター予測のベクトル等)の決定手法についても、既知の予測モード決定アルゴリズムが使用される。この予測モードの決定手法としては、例えば、イントラ予測モード決定手法や、ベクトル推定手法などを挙げることができる。なお、図1における予測信号生成部21は、この予測信号生成部103に対応するものである。
予測誤差信号生成部104は、図3における減算器44が行っていた計算を行うものであり、動画像符号化装置1に入力されている符号化対象信号51と、予測信号生成部103が生成した予測信号54との差分を表す予測誤差信号55を生成する。なお、図1における予測誤差信号生成部11は、この予測誤差信号生成部104に対応するものである。
符号化情報生成部105は、予測誤差信号生成部104が生成した予測誤差信号55から符号化情報56を生成する。なお、符号化情報生成部105の各々に付されている「#1」〜「#N」の記号は、互いに異なる生成規則#1〜#Nを表しており、符号化情報生成部105は、それぞれの生成規則#1〜#Nに従って、予測誤差信号55から符号化情報56を生成する。なお、符号化情報生成部105は、図1における直交変換部12及び量子化部13に対応する。
なお、符号化情報生成部105による符号化情報56の生成では、例えば、MPEG−1、MPEG−2、H.264/MPEG−4 AVCなどのMPEG規格等で用いられる直交変換処理と量子化処理との組合せが用いられる。このようにする場合には、符号化情報56は、直交変換処理により得られた各係数を量子化した結果に相当する。また、符号化情報生成部105による符号化情報56の生成では、JPEG(Joint Photographic Experts Group)が規格化したJPEG 2000等で採用されているウェーブレット変換や、DPCM(差分パルス符号変調)、ベクトル量子化等を用いてもよい。
前述したように、双方向予測においては、画像ブロック内において、符号化対象信号51と予測信号54との差分を表す予測誤差が大きい位置では、その予測信号54の生成に使用される複数の動き補償信号53間の差分も大きい。すなわち、予測誤差信号55の画素値の分布と、動き補償信号53間の差分画素値の分布との間には高い相関がある。例えば、符号化対象ブロックの右上領域の予測誤差が大きい場合には、対応する領域の動き補償信号53間の差分も大きい。そこで、本実施形態では、この高い相関を利用し、予測信号54を生成するために使用される複数の動き補償信号53間の差分の分布に基づいて、符号化情報生成部105の選択、すなわち、符号化情報56を生成するための生成規則#1〜#Nの選択を行う。
選択部106は、上記の選択を行うものであり、予測誤差信号55から符号化情報56を生成するための生成規則(符号化情報生成部#1〜#N)を、動き補償信号53間の差分の分布に基づいて選択する。
すなわち、選択部106は、図4に図解したように、まず、前方向動き補償信号41−3と後方向動き補償信号42−3との差分を計算することにより、動き補償信号間差分信号46を生成する。そして、選択部106は、この動き補償信号間差分信号46に基づき、予測誤差信号40−4(図6では予測誤差信号55)を符号化したときの情報量が最も小さくなると推定される生成規則での符号化を行う符号化情報生成部105を選択する。そうすると、符号化情報生成部105は、予測誤差信号55からの符号化情報の生成を、選択部106により選択された生成規則で行う。
エントロピー符号化部107は、符号化情報生成部105により生成された符号化情報56に対してエントロピー符号化を施して、エントロピー符号化情報を生成する。このエントロピー符号化部107で行われるエントロピー符号化は、符号化情報56を符号化したときの情報量が最も小さくなると推定される符号化規則が用いられている。従って、本実施形態の動画像符号化装置1で生成されるビットストリーム59(符号化データストリーム)の情報量は小さくなる。なお、エントロピー符号化部107は、動き推定部101が生成した動きベクトル52を表す動きベクトル情報の符号化も併せて行う。なお、エントロピー符号化部107は、図1におけるエントロピー符号化部15に対応しており、図6では、図1におけるジグザグスキャン部14を省略している。
再生予測誤差信号生成部108は、符号化情報生成部105が生成した符号化情報56から再生予測誤差信号57を生成する。なお、再生予測誤差信号生成部108の各々に付されている「#1」〜「#N」の記号は、互いに異なる再生規則#1〜再生規則#Nを表しており、これらは、前述した生成規則#1〜生成規則#Nに対応している。再生予測誤差信号生成部108は、それぞれの再生規則#1〜再生規則#Nに従って、符号化情報56から再生予測誤差信号57を生成する。なお、符号化情報生成部105は、図1における逆量子化部16及び逆直交変換部17に対応する。
選択部106は、動き補償信号53間の差分の分布に基づいて、再生予測誤差信号57を生成するための再生規則(#1〜#N)を選択する。このとき、選択部106は、符号化情報56を生成する生成規則の選択内容に対応する再生規則を選択する。図6においては、例として、符号化情報生成部#2と再生予測誤差信号生成部#2とを選択部106が選択した場合を図解している。
局部復号画像生成部109は、符号化対象信号51が表していた符号化対象ブロックの画像の復号画像である局部復号画像58を、予測信号生成部103が生成した予測信号54と再生予測誤差信号生成部108が生成した再生予測誤差信号57とから生成する。つまり、局部復号画像は、符号化対象ブロックの画像を表している符号化対象信号51を一旦符号化した後に復号することで得られる。
参照画像蓄積部110は、局部復号画像生成部109が生成した局部復号画像を格納して記憶しておく。この局部復号画像は、後の符号化処理において参照画像として使用される。なお、参照画像蓄積部110は、図1における復号画像記憶部19に対応する。
更新部111は、選択部106により選択されて符号化情報生成部105及び再生予測誤差信号生成部108の各々においてそれぞれ用いられている符号化方式及び復号方式を更新する。この更新は、動き補償信号生成部102より生成される複数の動き補償信号53間の差分と再生予測誤差信号生成部108により生成される再生予測誤差信号57とに基づいて行われる。
このように、本実施形態では、符号化情報生成部105及び再生予測誤差信号生成部108は、それぞれ、画像ブロック内で局在している予測誤差の位置に応じ、予測誤差信号55から生成する符号化情報56の情報量が最も小さくなるように選択される。このとき、符号化情報生成部105及び再生予測誤差信号生成部108は、それぞれ、例えば、予測誤差が局在しているブロック内の位置に対応付けられている複数種類の直交変換基底及び逆直交変換基底を用意して構成しておく。そして、選択部106は、この複数種類の直交変換基底及び逆直交変換基底からそれぞれ1つずつの選択を行う。なお、直交変換は、本実施形態においては、カルーネン・レーベ変換を用いる。
なお、上述のようにする代わりに、例えば、画像ブロック内において予測誤差が大きい領域と小さい領域とを検出し、検出した2つの領域に対して互いに異なる直交変換/逆直交変換を行うようにしてもよい。あるいは、符号化情報の生成において、検出した2つの領域のうち、予測誤差が大きい領域に対してはDPCMによる符号化を行い、予測誤差が小さい領域に対しては直交変換による符号化を行うようにしてもよい。
また、本実施形態では、更新部111は、画像ブロック内で局在している予測誤差の位置と、再生予測誤差信号生成部108により生成される再生予測誤差信号とに応じて、選択部106により選択された符号化方式及び復号方式を更新する。この更新では、例えば、画像ブロック内で局在している予測誤差の位置に対応する複数種類の直交変換基底及び逆直交変換基底を、再生予測誤信号から計算し、その計算結果を基にして、選択部106により選択された直交変換基底及び逆直交変換基底の更新を行う。なお、更新部111を取り除いても、動画像符号化装置1による動画像の符号化は可能である。
次に、上述した構成を有する動画像符号化装置1の動作について、図7を用いて更に詳細に説明する。
なお、図7の例では、符号化情報生成部105には、生成規則#0〜#15の計16種類の生成規則が予め用意されており、再生予測誤差信号生成部108には、これに対応する再生規則#0〜#15の計16種類の再生規則が予め用意されている。なお、再生規則#0〜#15は、それぞれ生成規則#0〜#15による処理の逆処理を実行するものとする。
また、以下の説明では、符号化対象信号51により表されている符号化対象ブロックの右下領域に丸形状のテクスチャが存在するものとする。また、予測信号生成部103での予測信号の生成に使用する手法を指示する予測モードとしては、双方向予測が選択されているものとする。
図7において、動き補償信号生成部102は、まず、符号化対象信号51と参照画像蓄積部110に蓄積されている複数の参照画像123とに基づいて前方向と後方向との動きベクトルを生成する。そして、生成した動きベクトルに基づいて、前方向動き補償信号53−1と後方向動き補償信号53−2とを生成する。
なお、図7の例において、動き補償信号生成部102により生成される前方向動き補償信号53−1と後方向動き補償信号53−2とによって表される各画像ブロックには、それぞれ、符号化対象ブロックに類似した、丸形状のテクスチャが存在する。但し、この3枚の画像ブロックに存在するテクスチャの位置及び/又は形状は、互いに一致しているとは限らない。
なお、図6の説明においては、動きベクトルの生成は動き推定部101が行い、動き補償信号の生成は動き補償信号生成部102が行うとして説明した。これに対し、図7のように、動き推定部101を動き補償信号生成部102が備えるように構成し、動きベクトルの生成と動き補償信号の生成との両者を動き補償信号生成部102が行うようにしてもよい。
予測信号生成部103は、前方向動き補償信号53−1及び後方向動き補償信号53−2の加算平均を計算することによって予測信号54を生成する。そして、予測誤差信号生成部104は、符号化対象信号51と予測信号54との差分を計算することによって予測誤差信号55を生成する。そして、この予測誤差信号55は、符号化情報生成部105に送られる。
一方、差分計算部121は、前方向動き補償信号53−1と後方向動き補償信号53−2との差分を表す動き補償信号間差分信号122を生成する。
ここで、前方向動き補償信号53−1と後方向動き補償信号53−2とによってそれぞれ表される画像ブロックを比較すると、テクスチャが存在しない領域は互いにほぼ一致するが、テクスチャが存在する領域には差異が存在する。このため、動き補償信号間差分信号122により表される画像ブロックにおいて、テクスチャが存在する領域(ここでは、右下領域)では画素値の差分値は大きい。
なお、符号化対象信号51と予測信号生成部103が生成した予測信号54とによってそれぞれ表される画像ブロックを比較すると、テクスチャが存在しない領域は互いにほぼ一致するが、テクスチャが存在する領域には差異が存在することは明らかである。従って、予測誤差信号55により表されるブロックにおいても、テクスチャが存在する領域(ここでは、右下領域)では誤差が大きくなる。このように、予測誤差信号55と動き補償信号間差分信号122との間には高い相関を示す。
なお、図6の説明においては、差分計算部121が行う計算を選択部106が行うとして説明した。このように、差分計算部121を選択部106が備えるように構成してもよい。
選択部106は、符号化情報生成部105に用意されている生成規則#0〜#15の中から、動き補償信号間差分信号122により表される画像ブロックの特徴(差分の分布)に対応する生成規則(ここでは、#1)を選択する。図7の例では、画像ブロック内の右下領域の成分が大きい偏りパターンが検出され、この偏りパターンに対応する符号化情報生成部#1が選択されている。そして、符号化情報生成部105は、符号化情報生成部#1を利用して予測誤差信号55から符号化情報56を生成する。
更に、選択部106は、再生予測誤差信号生成部108に用意されている再生規則#0〜#15の中から、符号化情報生成部105において選択した生成規則に対応する再生規則を選択する。図7の例では、符号化情報生成部105において生成規則#1が選択されているので、再生予測誤差信号生成部108においては、生成規則#1に対応する再生規則#1が選択されている。
なお、再生規則#1は、生成規則#1が選択された符号化情報生成部105により行われる処理の逆処理を再生予測誤差信号生成部108に行わせるものである。例えば、生成規則#1が選択された符号化情報生成部105が直交変換処理を行う場合には、再生予測誤差信号生成部108は、再生規則#1が選択されることによって、その直交変換処理の逆処理である逆直交変換処理を行う。
再生予測誤差信号生成部108は、選択部106によってこのようにして選択された再生規則#1に従った処理を行って、符号化情報56から再生予測誤差信号57を生成する。その後の、局部復号画像生成部109による再生予測誤差信号57からの局部復号画像58の生成と、参照画像蓄積部110に対する局部復号画像58の格納及び参照画像123としての読み出しについては、図6についての説明と同様である。
更新部111は、まず、動き補償信号間差分信号122により表されている画像ブロックの特徴(差分の分布の偏り)に応じて、再生予測誤差信号57を、選択部106による前述した生成規則及び再生規則の選択結果に対応するグループに分類する。図7の例では、生成規則及び再生規則は計16種類用意されているので、再生予測誤差信号57が分類されるグループも、#0〜#15の計16グループ用意されている。そして、それぞれのグループにおいて、再生予測誤差信号57に基づき、その予測誤差が小さくなる直交変換基底と逆直交変換基底とを新たに計算する。そして、新たに求められた直交変換基底及び逆直交変換基底を、それぞれ符号化情報生成部105及び再生予測誤差信号生成部108に与えて、選択されている生成規則及び再生規則で使用される直交変換基底及び逆直交変換基底を更新する。なお、更新部111が直交変換基底及び逆直交変換基底の計算に用いる再生予測誤差信号57を前ピクチャについてのもののみとする代わりに、複数のピクチャの再生予測誤差信号57を蓄積して用いるようにしてもよい。
次に、選択部106による生成規則の選択手法について、更に詳しく説明する。
まず、この選択手法の第一の例について、図8を用いて説明する。
図8において、前方向動き補償ブロック61、後方向動き補償ブロック62、及び差分信号ブロック63は、それぞれ、前方向動き補償信号53−1、後方向動き補償信号53−2、及び動き補償信号間差分信号122の各々により表されている画像ブロックである。この図8の例では、これらの前方向動き補償ブロック61、後方向動き補償ブロック62、及び差分信号ブロック63は、いずれも4つの領域A〜Dに分割されるものとしている。例えば、画像ブロックのサイズが8×8画素である場合、領域A〜Dはそれぞれ4×4画素となる。
前述したように、動き補償信号間差分信号122は、前方向動き補償信号53−1の各画素の画素値(例えば、輝度レベル)と、後方向動き補償信号53−2の対応する画素の画素値との間の差分を表す信号である。この選択手法の第一の例では、選択部106は、まず、この動き補償信号間差分信号122により表される画像ブロックの左上の領域A、右上の領域B、左下の領域C、及び右下の領域Dの各領域について、差分値の絶対値和を算出する。すなわち、選択部106は、領域A〜Dについて、それぞれ差分値絶対値和SA 〜SD を計算する。
続いて、選択部106は、差分値絶対値和SA 〜SD をそれぞれ閾値Thと比較する。この閾値Thは、例えば、予め定めておいた固定値とする。但し、この閾値Thを、符号化処理を実行しながら適応的に変化する値としてもよい。すると、各差分値絶対値和SA 〜SD についての閾値判定の結果の組合せパターンが得られる。
選択部106には、この閾値判定の結果の組合せパターンに対し、それぞれ対応する基底#0〜#15を予め定めておく。「基底」は、この例では、直交変換のための変換規則に相当するものとしている。すなわち、選択部106には、互いに異なる16個の基底#0〜#15が予め定義されている。
なお、図8に表示されている表において、基底番号「0」〜「15」には、4つの閾値判定の結果に対応する4ビットデータを対応付けている。この場合、閾値判定の結果が「Yes」である場合は「1」を表し、閾値判定の結果が「No」である場合は「0」を表している。
例えば、基底#1(すなわちビットデータ「0001」)は、画像ブロック内の右下の領域Dのみの予測誤差が大きいときに、その予測誤差信号を基底#1で直交変換した後に符号化を行うと、符号化情報の情報量が小さくなるような基底である。また、基底#2(すなわちビットデータ「0010」)は、画像ブロック内の左下の領域Cのみの予測誤差が大きいときに、その予測誤差信号を基底#2で直交変換した後に符号化を行うと、符号化情報の情報量が小さくなるような基底である。以下同様に、基底#0〜#15は、それぞれ、画像ブロックにおいて誤差の大きい画素が分布する領域に応じて、符号化情報の情報量を小さくする基底である。なお、各基底#0〜#15の具体的な値は、それぞれ、例えば、予め実験又はシミュレーションにより最適なものが設定されている。
図8の例で差分信号ブロック63に注目すると、領域Dの差分が大きいことが分かる。この場合には、差分値絶対値和SD のみが閾値Thよりも大きくなる結果、選択部106は、基底#1を選択する。
図8の例では、各基底#0〜#15は、符号化対象ブロックのサイズに対応する行列により表される。例えば、符号化対象ブロックが8×8画素であるときは、各基底#0〜#15は、64の要素を有する8行×8列の行列で表される。
符号化情報生成部105には、基底#0〜#15が予め用意されている。ここで、基底#0〜#15は、図7における生成規則#0〜#15に相当する。そして、符号化情報生成部105は、選択部106により選択された基底を利用して、予測誤差信号55に対して直交変換を行う。上述の例では、符号化情報生成部105は、基底#1を利用して、予測誤差信号55に対して直交変換を行う。ここで、直交変換は、予測誤差信号55を表す行列に、基底を表す行列を乗算することにより実現される。そして、この直交変換によって得られた信号に対して、必要に応じて量子化が実行されて、符号化情報56として出力される。
このように、第一の例では、動き補償信号間差分信号122により表されている差分信号ブロック63における差分値の分布の偏りパターンに対してそれぞれ直交変換の基底が設けられている。そして、予測誤差信号55は、この偏りパターンに対応する基底で直交変換される。このときに用いられる基底は、直交変換によって得られる符号化情報56の情報量が小さくなるようなものが選択される。従って、本実施形態の符号化方法によれば、符号化情報56の情報量が小さくなる。
次に、選択部106による生成規則の選択手法の第二の例について、図9A、図9B、図10A、及び図10Bの各図を用いて説明する。
なお、この第二の例においては、前方向動き補償ブロック61、後方向動き補償ブロック62、及び差分信号ブロック63は、いずれも4行×4列の計16の領域に分割されるものとしている。
この第二の例においても、まず、前方向動き補償信号53−1の各画素の画素値と、後方向動き補償信号53−2の対応する画素の画素値との間の差分が計算されて、動き補償信号間差分信号122が生成される。次に、この第二の例では、動き補償信号間差分信号122により表される差分信号ブロック63の各行について、差分値の分布パターンが検出される。
例えば、図9Aに図解されている行0の各領域に含まれる各画素の差分値絶対値和SA 〜SD が計算される。そして、図9Bに図解されているように、「行0」の各領域の差分値絶対値和SA 〜SD がそれぞれ閾値Thと比較される。また、図9Aに図解されている「行1」、「行2」、及び「行3」の各行に含まれる領域についても同様の比較が行われる。
図9Aの例において、例えば、「行3」は、4つの領域のうちの右から2番目の領域についての画素の差分値絶対値和SC のみが閾値Thよりも大きく、他の3つの領域についての画素の差分値絶対値和SA 、SB 、及びSD は、いずれも閾値Thよりも小さい。この場合には、図9Bの表に基づき、「行3」に対して分布パターン#2が検出される。同様に、この図9Aの例では、「行0」、「行1」、及び「行2」の各行に対して、それぞれ、分布パターン#9、#4、及び#11が検出される。
図9Bの表における各分布パターン#0〜#15に対しては、それぞれ、基底#0〜#15が対応付けられている。この基底#0〜#15は、それぞれ、画像ブロックにおいて対応する分布パターンを持った行が存在する場合に、その予測誤差信号をその基底で変換を行うと、変換後の行においての第1主成分にエネルギーが集中するように決定されている基底である。
選択部106は、まず、以上のようにして、各行に対する基底を選択する。そして、符号化情報生成部105は、予測誤差信号55の各行を、選択部106が選択した各行に対する基底を用いて変換する。上述の例では、「行0」は基底#9で変換され、「行1」、「行2」、及び「行3」は、それぞれ基底#4、基底#11、基底#2で変換される。そして、予測誤差信号55の各行がそれぞれ上述のようにして選択された基底で変換されると、変換後の各行においては、第1主成分にエネルギーが集中するようになる。
この行方向の変換に用いることのできる基底#0〜#15の例を以下に示す。なお、この直交基底の各列は、それぞれ固有ベクトルを表しており、左側から順番に第1列、第2列、第3列、及び第4列の各列が、それぞれ固有ベクトルの第1主成分、第2主成分、第3主成分、及び第4主成分を表している。

直交基底#0(水平方向分布パターン#0に関連付けられた基底)
0.496, 0.654, 0.504, 0.268
0.504, 0.268, -0.496, -0.654
0.504, -0.268, -0.496, 0.654
0.496, -0.654, 0.504, -0.268
直交基底#1
0.397, 0.626, 0.518, 0.426
0.450, 0.412, -0.214, -0.763
0.526, -0.070, -0.705, 0.470
0.603, -0.658, 0.434, -0.122
直交基底#2
0.431, 0.634, 0.500, 0.403
0.498, 0.363, -0.304, -0.726
0.554, -0.228, -0.609, 0.520
0.509, -0.644, 0.536, -0.197
直交基底#3
0.400, 0.621, 0.502, 0.450
0.470, 0.408, -0.201, -0.756
0.553, -0.132, -0.686, 0.455
0.560, -0.657, 0.487, -0.135
直交基底#4
0.509, 0.644, 0.536, 0.197
0.554, 0.228, -0.609, -0.520
0.498, -0.363, -0.304, 0.726
0.431, -0.634, 0.500, -0.403
直交基底#5
0.445, 0.631, 0.526, 0.358
0.504, 0.349, -0.371, -0.697
0.529, -0.220, -0.579, 0.580
0.518, -0.657, 0.501, -0.221
直交基底#6
0.461, 0.633, 0.536, 0.315
0.536, 0.315, -0.461, -0.633
0.536, -0.315, -0.461, 0.633
0.461, -0.633, 0.536, -0.315
直交基底#7
0.429, 0.617, 0.534, 0.388
0.510, 0.374, -0.335, -0.698
0.536, -0.213, -0.593, 0.562
0.518, -0.659, 0.501, -0.215
直交基底#8
0.603, 0.658, 0.434, 0.122
0.526, 0.070, -0.705, -0.470
0.450, -0.412, -0.214, 0.763
0.397, -0.626, 0.518, -0.426
直交基底#9
0.500, 0.656, 0.500, 0.263
0.500, 0.263, -0.500, -0.656
0.500, -0.263, -0.500, 0.656
0.500, -0.656, 0.500, -0.263
直交基底#10
0.518, 0.657, 0.501, 0.221
0.529, 0.220, -0.579, -0.580
0.504, -0.349, -0.371, 0.697
0.445, -0.631, 0.526, -0.358
直交基底#11
0.494, 0.655, 0.502, 0.275
0.509, 0.268, -0.493, -0.653
0.513, -0.286, -0.485, 0.648
0.484, -0.646, 0.520, -0.280
直交基底#12
0.560, 0.657, 0.487, 0.135
0.553, 0.132, -0.686, -0.455
0.470, -0.408, -0.201, 0.756
0.400, -0.621, 0.502, -0.450
直交基底#13
0.484, 0.646, 0.520, 0.280
0.513, 0.286, -0.485, -0.648
0.509, -0.268, -0.493, 0.653
0.494, -0.655, 0.502, -0.275
直交基底#14
0.518, 0.659, 0.501, 0.215
0.536, 0.213, -0.593, -0.562
0.510, -0.374, -0.335, 0.698
0.429, -0.617, 0.534, -0.388
直交基底#15
0.486, 0.649, 0.514, 0.281
0.514, 0.281, -0.486, -0.649
0.514, -0.281, -0.486, 0.649
0.486, -0.649, 0.514, -0.281
次に、選択部106は、各列に対する基底を選択する。このために、まず、動き補償信号間差分信号122により表される差分信号ブロック63の各行の全ての領域に含まれる各画素の差分値絶対値和SE 〜SH が計算される。ここで、SE は、差分信号ブロック63の「行0」における各画素の差分値の絶対値の和である。同様に、SF 、SG 、及びSH は、それぞれ、差分信号ブロック63の「行1」、「行2」、及び「行3」の各行における各画素の差分値の絶対値の和である。そして、この差分値絶対値和SE 〜SH が、それぞれ閾値Thと比較される。
このとき、例えば、図10Aの例のように、SE とSF とはそれぞれ閾値Thよりも小さく、SG とSH とはそれぞれ閾値Thよりも大きかったとする。すると、この場合には、図10Bの表に基づき、基底パターン#3が選択される。
10Bの表における各基底パターン#0〜#15に対しては、それぞれ、基底セット#0〜#15が対応付けられている。この基底セット#0〜#15は、それぞれ、4つの基底(第1〜第4主成分用直交基底)を有する。この第1〜第4主成分用直交基底は、図9A及び図9Bを用いて説明した、予測誤差信号55の各行に対する行方向の基底変換を実行することにより得られる、4×4基底変換行列の第1〜第4成分にそれぞれ対応して作成される。
例えば、図10A及び図10Bの例では、前述したように基底セット#3が選択される。すると、この場合には、4×4基底変換行列の第1成分は、基底セット#3の第1主成分用直交基底を用いて変換される。同様に、4×4基底変換行列の第2〜第4成分は、それぞれ、基底セット#3の第2〜第4主成分用直交基底を用いて変換される。
各基底セット#0〜#15の各基底は、それぞれ、対応する基底パターンを持った列に対して使用されると、変換後の列においての第1要素にエネルギーが集中するよう決定されている。従って、予測誤差信号55の各行に対して前述した行方向の変換を施した後の各列が、更に、上述のようにして選択された基底セットでそれぞれ変換されると、変換後の各列においては、第1要素にエネルギーが集中するようになる。すなわち、以上のようにして、予測誤差信号55に対し行方向及び列方向についての直交変換を行うことで、得られる符号化情報56は、低周波数成分領域にエネルギーが集中するようになる。従って、この後にエントロピー符号化部107による符号化を行うことで、エントロピー符号化後の符号化データの情報量が小さくなる。
以上の列方向の変換に用いることのできる基底セット#0〜#15の例を以下に示す。なお、この直交基底の各列は、それぞれ固有ベクトルを表しており、左側から順番に第1列、第2列、第3列、及び第4列の各列が、それぞれ固有ベクトルの第1主成分、第2主成分、第3主成分、第4主成分を表している。
なお、直交変換を行うと、一般的に、変換後の行列は、第1主成分の値が最も大きく、第2〜第4主成分の値は順番に小さくなる傾向がある。このとき、実空間の符号化対象信号51の各行に対し水平方向に直交変換を行い、全ての行で主成分の並びを統一するようにしてもよい。なお、この基底セットは、この主成分毎に、垂直方向の基底を有している。

基底セット#0(垂直方向の基底パターン#0に関連付けられた基底セット)
第1主成分用直交基底
0.500, 0.656, 0.500, 0.263
0.500, 0.263, -0.500, -0.656
0.500, -0.263, -0.500, 0.656
0.500, -0.656, 0.500, -0.263
第2主成分用直交基底
0.500, 0.656, 0.500, 0.263
0.500, 0.263, -0.500, -0.656
0.500, -0.263, -0.500, 0.656
0.500, -0.656, 0.500, -0.263
第3主成分用直交基底
0.500, 0.656, 0.500, 0.263
0.500, 0.263, -0.500, -0.656
0.500, -0.263, -0.500, 0.656
0.500, -0.656, 0.500, -0.263
第4主成分用直交基底
0.500, 0.656, 0.500, 0.263
0.500, 0.263, -0.500, -0.656
0.500, -0.263, -0.500, 0.656
0.500, -0.656, 0.500, -0.263

基底セット#1
第1主成分用直交基底
0.375, 0.616, 0.522, 0.455
0.435, 0.438, -0.157, -0.771
0.525, -0.020, -0.732, 0.434
0.628, -0.655, 0.409, -0.101
第2主成分用直交基底
0.375, 0.616, 0.522, 0.455
0.435, 0.438, -0.157, -0.771
0.525, -0.020, -0.732, 0.434
0.628, -0.655, 0.409, -0.101
第3主成分用直交基底
0.375, 0.616, 0.522, 0.455
0.435, 0.438, -0.157, -0.771
0.525, -0.020, -0.732, 0.434
0.628, -0.655, 0.409, -0.101
第4主成分用直交基底
0.375, 0.616, 0.522, 0.455
0.435, 0.438, -0.157, -0.771
0.525, -0.020, -0.732, 0.434
0.628, -0.655, 0.409, -0.101

基底セット#2
第1主成分用直交基底
0.407, 0.625, 0.475, 0.467
0.494, 0.396, -0.213, -0.744
0.581, -0.226, -0.641, 0.448
0.503, -0.634, 0.564, -0.165
第2主成分用直交基底
0.407, 0.625, 0.475, 0.467
0.494, 0.396, -0.213, -0.744
0.581, -0.226, -0.641, 0.448
0.503, -0.634, 0.564, -0.165
第3主成分用直交基底
0.407, 0.625, 0.475, 0.467
0.494, 0.396, -0.213, -0.744
0.581, -0.226, -0.641, 0.448
0.503, -0.634, 0.564, -0.165
第4主成分用直交基底
0.407, 0.625, 0.475, 0.467
0.494, 0.396, -0.213, -0.744
0.581, -0.226, -0.641, 0.448
0.503, -0.634, 0.564, -0.165

基底セット#3
第1主成分用直交基底
0.391, 0.613, 0.504, 0.467
0.467, 0.422, -0.173, -0.757
0.554, -0.113, -0.699, 0.439
0.567, -0.659, 0.478, -0.126
第2主成分用直交基底
0.391, 0.613, 0.504, 0.467
0.467, 0.422, -0.173, -0.757
0.554, -0.113, -0.699, 0.439
0.567, -0.659, 0.478, -0.126
第3主成分用直交基底
0.391, 0.613, 0.504, 0.467
0.467, 0.422, -0.173, -0.757
0.554, -0.113, -0.699, 0.439
0.567, -0.659, 0.478, -0.126
第4主成分用直交基底
0.391, 0.613, 0.504, 0.467
0.467, 0.422, -0.173, -0.757
0.554, -0.113, -0.699, 0.439
0.567, -0.659, 0.478, -0.126

基底セット#4
第1主成分用直交基底
0.503, 0.634, 0.564, 0.165
0.581, 0.226, -0.641, -0.448
0.494, -0.396, -0.213, 0.744
0.407, -0.625, 0.475, -0.467
第2主成分用直交基底
0.503, 0.634, 0.564, 0.165
0.581, 0.226, -0.641, -0.448
0.494, -0.396, -0.213, 0.744
0.407, -0.625, 0.475, -0.467
第3主成分用直交基底
0.503, 0.634, 0.564, 0.165
0.581, 0.226, -0.641, -0.448
0.494, -0.396, -0.213, 0.744
0.407, -0.625, 0.475, -0.467
第4主成分用直交基底
0.503, 0.634, 0.564, 0.165
0.581, 0.226, -0.641, -0.448
0.494, -0.396, -0.213, 0.744
0.407, -0.625, 0.475, -0.467

基底セット#5
第1主成分用直交基底
0.434, 0.622, 0.536, 0.371
0.503, 0.368, -0.348, -0.700
0.526, -0.194, -0.598, 0.573
0.532, -0.664, 0.483, -0.208
第2主成分用直交基底
0.434, 0.622, 0.536, 0.371
0.503, 0.368, -0.348, -0.700
0.526, -0.194, -0.598, 0.573
0.532, -0.664, 0.483, -0.208
第3主成分用直交基底
0.434, 0.622, 0.536, 0.371
0.503, 0.368, -0.348, -0.700
0.526, -0.194, -0.598, 0.573
0.532, -0.664, 0.483, -0.208
第4主成分用直交基底
0.434, 0.622, 0.536, 0.371
0.503, 0.368, -0.348, -0.700
0.526, -0.194, -0.598, 0.573
0.532, -0.664, 0.483, -0.208

基底セット#6
第1主成分用直交基底
0.449, 0.624, 0.546, 0.332
0.546, 0.332, -0.449, -0.624
0.546, -0.332, -0.449, 0.624
0.449, -0.624, 0.546, -0.332
第2主成分用直交基底
0.449, 0.624, 0.546, 0.332
0.546, 0.332, -0.449, -0.624
0.546, -0.332, -0.449, 0.624
0.449, -0.624, 0.546, -0.332
第3主成分用直交基底
0.449, 0.624, 0.546, 0.332
0.546, 0.332, -0.449, -0.624
0.546, -0.332, -0.449, 0.624
0.449, -0.624, 0.546, -0.332
第4主成分用直交基底
0.449, 0.624, 0.546, 0.332
0.546, 0.332, -0.449, -0.624
0.546, -0.332, -0.449, 0.624
0.449, -0.624, 0.546, -0.332

基底セット#7
第1主成分用直交基底
0.425, 0.617, 0.527, 0.401
0.507, 0.379, -0.314, -0.708
0.541, -0.209, -0.606, 0.544
0.519, -0.657, 0.507, -0.205
第2主成分用直交基底
0.425, 0.617, 0.527, 0.401
0.507, 0.379, -0.314, -0.708
0.541, -0.209, -0.606, 0.544
0.519, -0.657, 0.507, -0.205
第3主成分用直交基底
0.425, 0.617, 0.527, 0.401
0.507, 0.379, -0.314, -0.708
0.541, -0.209, -0.606, 0.544
0.519, -0.657, 0.507, -0.205
第4主成分用直交基底
0.425, 0.617, 0.527, 0.401
0.507, 0.379, -0.314, -0.708
0.541, -0.209, -0.606, 0.544
0.519, -0.657, 0.507, -0.205

基底セット#8
第1主成分用直交基底
0.628, 0.655, 0.409, 0.101
0.525, 0.020, -0.732, -0.434
0.435, -0.438, -0.157, 0.771
0.375, -0.616, 0.522, -0.455
第2主成分用直交基底
0.628, 0.655, 0.409, 0.101
0.525, 0.020, -0.732, -0.434
0.435, -0.438, -0.157, 0.771
0.375, -0.616, 0.522, -0.455
第3主成分用直交基底
0.628, 0.655, 0.409, 0.101
0.525, 0.020, -0.732, -0.434
0.435, -0.438, -0.157, 0.771
0.375, -0.616, 0.522, -0.455
第4主成分用直交基底
0.628, 0.655, 0.409, 0.101
0.525, 0.020, -0.732, -0.434
0.435, -0.438, -0.157, 0.771
0.375, -0.616, 0.522, -0.455

基底セット#9
第1主成分用直交基底
0.501, 0.657, 0.499, 0.261
0.499, 0.261, -0.501, -0.657
0.499, -0.261, -0.501, 0.657
0.501, -0.657, 0.499, -0.261
第2主成分用直交基底
0.501, 0.657, 0.499, 0.261
0.499, 0.261, -0.501, -0.657
0.499, -0.261, -0.501, 0.657
0.501, -0.657, 0.499, -0.261
第3主成分用直交基底
0.501, 0.657, 0.499, 0.261
0.499, 0.261, -0.501, -0.657
0.499, -0.261, -0.501, 0.657
0.501, -0.657, 0.499, -0.261
第4主成分用直交基底
0.501, 0.657, 0.499, 0.261
0.499, 0.261, -0.501, -0.657
0.499, -0.261, -0.501, 0.657
0.501, -0.657, 0.499, -0.261

基底セット#10
第1主成分用直交基底
0.532, 0.664, 0.483, 0.208
0.526, 0.194, -0.598, -0.573
0.503, -0.368, -0.348, 0.700
0.434, -0.622, 0.536, -0.371
第2主成分用直交基底
0.532, 0.664, 0.483, 0.208
0.526, 0.194, -0.598, -0.573
0.503, -0.368, -0.348, 0.700
0.434, -0.622, 0.536, -0.371
第3主成分用直交基底
0.532, 0.664, 0.483, 0.208
0.526, 0.194, -0.598, -0.573
0.503, -0.368, -0.348, 0.700
0.434, -0.622, 0.536, -0.371
第4主成分用直交基底
0.532, 0.664, 0.483, 0.208
0.526, 0.194, -0.598, -0.573
0.503, -0.368, -0.348, 0.700
0.434, -0.622, 0.536, -0.371

基底セット11
第1主成分用直交基底
0.485, 0.655, 0.499, 0.295
0.502, 0.283, -0.459, -0.676
0.519, -0.270, -0.518, 0.624
0.494, -0.647, 0.522, -0.257
第2主成分用直交基底
0.485, 0.655, 0.499, 0.295
0.502, 0.283, -0.459, -0.676
0.519, -0.270, -0.518, 0.624
0.494, -0.647, 0.522, -0.257
第3主成分用直交基底
0.485, 0.655, 0.499, 0.295
0.502, 0.283, -0.459, -0.676
0.519, -0.270, -0.518, 0.624
0.494, -0.647, 0.522, -0.257
第4主成分用直交基底
0.485, 0.655, 0.499, 0.295
0.502, 0.283, -0.459, -0.676
0.519, -0.270, -0.518, 0.624
0.494, -0.647, 0.522, -0.257

基底セット#12
第1主成分用直交基底
0.567, 0.659, 0.478, 0.126
0.554, 0.113, -0.699, -0.439
0.467, -0.422, -0.173, 0.757
0.391, -0.613, 0.504, -0.467
第2主成分用直交基底
0.567, 0.659, 0.478, 0.126
0.554, 0.113, -0.699, -0.439
0.467, -0.422, -0.173, 0.757
0.391, -0.613, 0.504, -0.467
第3主成分用直交基底
0.567, 0.659, 0.478, 0.126
0.554, 0.113, -0.699, -0.439
0.467, -0.422, -0.173, 0.757
0.391, -0.613, 0.504, -0.467
第4主成分用直交基底
0.567, 0.659, 0.478, 0.126
0.554, 0.113, -0.699, -0.439
0.467, -0.422, -0.173, 0.757
0.391, -0.613, 0.504, -0.467

基底セット#13
第1主成分用直交基底
0.494, 0.647, 0.522, 0.257
0.519, 0.270, -0.518, -0.624
0.502, -0.283, -0.459, 0.676
0.485, -0.655, 0.499, -0.295
第2主成分用直交基底
0.494, 0.647, 0.522, 0.257
0.519, 0.270, -0.518, -0.624
0.502, -0.283, -0.459, 0.676
0.485, -0.655, 0.499, -0.295
第3主成分用直交基底
0.494, 0.647, 0.522, 0.257
0.519, 0.270, -0.518, -0.624
0.502, -0.283, -0.459, 0.676
0.485, -0.655, 0.499, -0.295
第4主成分用直交基底
0.494, 0.647, 0.522, 0.257
0.519, 0.270, -0.518, -0.624
0.502, -0.283, -0.459, 0.676
0.485, -0.655, 0.499, -0.295

基底セット#14
第1主成分用直交基底
0.519, 0.657, 0.507, 0.205
0.541, 0.209, -0.606, -0.544
0.507, -0.379, -0.314, 0.708
0.425, -0.617, 0.527, -0.401
第2主成分用直交基底
0.519, 0.657, 0.507, 0.205
0.541, 0.209, -0.606, -0.544
0.507, -0.379, -0.314, 0.708
0.425, -0.617, 0.527, -0.401
第3主成分用直交基底
0.519, 0.657, 0.507, 0.205
0.541, 0.209, -0.606, -0.544
0.507, -0.379, -0.314, 0.708
0.425, -0.617, 0.527, -0.401
第4主成分用直交基底
0.519, 0.657, 0.507, 0.205
0.541, 0.209, -0.606, -0.544
0.507, -0.379, -0.314, 0.708
0.425, -0.617, 0.527, -0.401

基底セット#15
第1主成分用直交基底
0.485, 0.648, 0.515, 0.282
0.515, 0.282, -0.485, -0.648
0.515, -0.282, -0.485, 0.648
0.485, -0.648, 0.515, -0.282
第2主成分用直交基底
0.485, 0.648, 0.515, 0.282
0.515, 0.282, -0.485, -0.648
0.515, -0.282, -0.485, 0.648
0.485, -0.648, 0.515, -0.282
第3主成分用直交基底
0.485, 0.648, 0.515, 0.282
0.515, 0.282, -0.485, -0.648
0.515, -0.282, -0.485, 0.648
0.485, -0.648, 0.515, -0.282
第4主成分用直交基底
0.485, 0.648, 0.515, 0.282
0.515, 0.282, -0.485, -0.648
0.515, -0.282, -0.485, 0.648
0.485, -0.648, 0.515, -0.282
なお、上述した生成規則の選択手法の第二の例の説明では、行方向の処理において分布パターンの選択と予測誤差信号55の変換とを行い、その後に、列方向の処理において分布パターンの選択と予測誤差信号55の変換とを行う旨を説明した。この代わりに、例えば、行方向のパターン選択処理および列方向のパターン選択処理をまとめて行い、その後に、行方向の変換処理および列方向の変換処理を一括して行うようにしてもよい。
以上のように、選択部106による生成規則の選択手法の第二の例によれば、行方向及び列方向それぞれについて変換を行うことで、離散コサイン変換と同様に低周波成分にエネルギーを集中させることができる。更に、動き補償信号間差分信号122の差分値の分布に応じて基底を適切に選択するので、H.264/MPEG−4 AVC等で使用されている離散コサイン変換を実施した場合と比較して、空間的冗長性をより小さくすることが可能である。
次に、更新部111による、動き補償信号間差分信号122と再生予測誤差信号57とに基づいた直交変換基底及び逆直交変換基底の更新の手法について、図11を用いて説明する。なお、ここではひとつのピクチャが符号化された後に更新を行う場合を考える。また、ここでは、選択部106は、前述した第二の例の選択手法に従って、生成規則の選択を行うものとする。
まず、更新部111は、1つのピクチャを符号化した後に、符号化対象ブロック単位に、その動き補償信号間差分信号122のパターンに応じて、再生予測誤差信号57を分類する。本実施形態において、この分類は、選択部106が生成規則を選択するために用いる差分値の分布パターンに従って行う。つまり、動き補償信号間差分信号122のパターンが、図9A、図9B、図10A、及び図10Bを用いて説明した分布パターンのいずれに該当するかによって分類されてグループ化される。
更新部111は、この後の処理をグループ毎に行う。
まず、更新部111は、所定の更新単位の分だけ、再生予測誤差信号57を蓄積する。なお、本実施形態では、この更新単位をピクチャ単位とする。
次に、更新部111は、蓄積された再生予測誤差信号57に対してカルーネン・レーベ変換を行って直交基底及び逆直交基底の計算を行う。そして、得られた直交基底及び逆直交基底を、それまで符号化情報生成部105及び再生予測誤差信号生成部108で用いられたものと置換する。このようにすることで、動画像のシーンに応じたより適切な直交基底を用いた符号化を符号化情報生成部105に行わせることができるので、符号化情報56の情報量の更なる削減が期待できる。また、予測誤差信号55の直交変換後の第1主成分の値がなるべく大きくなるように直交基底を更新すれば、エントロピー符号化による情報量の圧縮効果を高めることができる。
なお、上述した説明では、再生予測誤差信号57の蓄積をピクチャ単位で行うが、この代わりに、例えば、MPEG規格等で規定されている、1枚のピクチャを分割した単位であるスライスのような、より小さな符号化単位としてもよい。但し、有意な統計量を得るためには、できる限り多くの(例えば複数のピクチャの)動き補償信号間差分信号122と、それに対応する再生予測誤差信号57とを含むような単位とすることが望ましい。
次に図12について説明する。図12は、動画像復号装置2の詳細構成図である。
この動画像復号装置2は、図6に詳細な構成を図解した動画像符号化装置1から出力される符号化データ(ビットストリーム59)を復号して、画像の出力を行うものである。なお、このビットストリーム59は、動画像符号化装置1の符号化情報生成部105が生成した符号化情報56と、動き推定部101が生成した動きベクトル52の情報とを含んでおり、更に、参照画像のインデックスも含んでいる。なお、符号化情報56は、この動画像復号装置2においては、復号対象ブロックを表す復号対象信号70として処理される。
動画像復号装置2は、基本的には、動画像符号化装置1により行われる処理の逆処理を行う。また、動画像復号装置2は、前述した画像ブロック毎に復号処理を行う。
エントロピー復号部151は、ビットストリーム59に対してエントロピー復号を行い、符号化情報56や動きベクトル52の情報等を再生する。なお、エントロピー復号部151は、図2におけるエントロピー復号部31に対応しており、図12では、図2における逆ジグザグスキャン部32を省略している。
動き補償信号生成部152は、動画像符号化装置1から受信した動きベクトル52の情報と複数の参照画像とに基づいて複数の動き補償信号53を生成する。ここでは、図3及び図4を用いて前に説明したように、前方向動き補償信号41−3及び後方向動き補償信号42−3が生成される。ここで、参照画像は、先に復号されて参照画像蓄積部157に格納されている画像であり、動画像符号化装置1において参照画像蓄積部110から読み出される参照画像と同一のものである。よって、動画像符号化装置1と動画像復号装置2とにおいて、同一の動き補償信号53が生成される。なお、動き補償信号生成部152は、図2における動き補償信号生成部35に対応するものである。
予測信号生成部153は、動き補償信号生成部152が生成した複数の動き補償信号53を利用して復号画像71の予測値を表す予測信号54を生成する。すなわち、予測信号生成部153は、前方向動き補償信号41−3と後方向動き補償信号42−3との加算平均を計算して、予測信号54を生成する。なお、予測信号生成部153は、図2における予測信号生成部36に対応するものである。
選択部154は、復号対象信号70から再生予測誤差信号57を生成するため再生規則を、動き補償信号生成部152が生成した複数の動き補償信号53に基づいて選択する。この例では、前方向動き補償信号と後方向動き補償信号との差分に基づいて、再生規則が選択される。
再生予測誤差信号生成部155は、復号対象信号70から再生予測誤差信号57を生成する。なお、再生予測誤差信号生成部155の各々に付されている「#1」〜「#N」の記号は、互いに異なる再生規則#1〜#Nを表している。これらは、動画像符号化装置1の符号化情報生成部105で使用される前述の生成規則#1〜#Nに対応しており、生成規則#1〜#Nに従った処理の逆処理を再生予測誤差信号生成部155に行わせるものである。なお、再生予測誤差信号生成部155は、図2における逆量子化部33及び逆直交変換部34に対応する。
復号画像生成部156は、再生予測誤差信号57と予測信号54とから復号画像71を生成して出力する。なお、復号画像生成部156は、図2における復号画像生成部37に対応する。
参照画像蓄積部157は、復号画像生成部156が生成した復号画像71を格納して記憶しておく。この復号画像71は、後の符号化処理において参照画像として使用される。なお、参照画像蓄積部157は、図2における復号画像記憶部38に対応する。
更新部158は、選択部154により選択されて再生予測誤差信号生成部155において用いられている復号方式を更新する。この更新は、動き補償信号生成部152より生成される複数の動き補償信号53間の差分と再生予測誤差信号生成部155により生成される再生予測誤差信号57とに基づいて行われる。なお、動画像符号化装置1が更新部111を備えていない場合には、動画像復号装置2に更新部158は不要である。
動き補償信号生成部152、予測信号生成部153、選択部154、再生予測誤差信号生成部155、及び更新部158の構成は、動き補償信号生成部102、予測信号生成部103、選択部106、再生予測誤差信号生成部108、及び更新部111と同一である。また、これらの動作も同一である。すなわち、動画像符号化装置1と動画像復号装置2との双方において、同一の参照画像から同一の動き補償信号53が生成される。従って、動画像符号化装置1と動画像復号装置2とにおいて、動き補償信号53間の差分の分布から行う予測誤差信号55の分布の推定を同一のものとすることができる。つまり、この差分の分布に応じて動画像符号化装置1が符号化方法を切り替えれば、動画像復号装置2でも、同一の差分の分布に応じることで、使用された符号化方法に対応する復号方法を、動画像符号化装置1からの特別の通知を受けることなく選択できる。
次に、上述した構成を有する動画像復号装置2の動作について、図13を用いて更に説明する。
動画像復号装置2の動作は、基本的に、図7を用いて説明した動画像符号化装置1の動作と同じである。すなわち、前方向動き補償信号53−1と後方向動き補償信号53−2との差分を差分計算部159が計算することにより、動き補償信号間差分信号122が生成される。
なお、図12の説明においては、差分計算部159が行う計算を選択部154が行うとして説明した。このように、差分計算部159を選択部154が備えるように構成してもよい。
選択部154は、動き補償信号間差分信号122により表される画像ブロックにおける画素差分値の分布パターンを検出する。なお、図13の例では、画像ブロック内の右下領域の差分値が大きくなっている。そして、選択部154は、再生予測誤差信号生成部155に予め用意されている複数の基底(再生規則#0〜#15)の中から、この分布パターンに対応する基底を選択する。なお、分布パターンに応じた基底の選択手法は、動画像符号化装置1と同一のものであり、ここでは、図8を用いて説明した第一の例、若しくは図9A、図9B、図10A、及び図10Bを用いて説明した第二の例が用いられる。
再生予測誤差信号生成部155は、選択部154により選択された基底を用いて、復号対象信号70(符号化情報56)を直交変換して再生予測誤差信号57を生成する。このとき、動画像符号化装置1の符号化情報生成部105において実行される直交変換の逆変換が再生予測誤差信号生成部155によって実行される。この後、再生予測誤差信号57と予測信号54とを用いて、復号画像生成部156により復号画像が生成される。
更新部158は、動き補償信号生成部152により生成される複数の動き補償信号53間の差分と、再生予測誤差信号57とに基づいて、再生予測誤差信号生成部155において用いられる、選択部154が選択した復号方式を更新する。なお、復号方式の更新の手法は、動画像符号化装置1と同一のものが用いられる。
次に図14について説明する。図14は、動画像符号化処理の処理内容を図解したフローチャートである。この動画像符号化処理は、図6に図解した動画像符号化装置1により実行される。
動画像符号化装置1は、動画像の各フレームを複数の画像ブロックに分割したときの画像ブロック毎に、この動画像符号化処理を施す。
図14の処理が開始されると、まず、ステップS101において、動き推定部101が、双方向予測における動きベクトル52を探索する処理を行う。この処理により、前方向動きベクトルと後方向動きベクトルとの検出が行われる。
次に、ステップS102において、動き補償信号生成部102が、ステップS101の処理により検出された前方向動きベクトルと後方向動きベクトルとに基づき、動き補償信号53を生成する処理を行う。この処理により、前方向動き補償信号53−1と後方向動き補償信号53−2とが生成される。
次に、ステップS103において、選択部106(図7においては差分計算部121)が、動き補償信号53間の差分を計算する処理を行う。この処理により、前方向動き補償信号53−1と後方向動き補償信号53−2との差分を表す動き補償信号間差分信号122が生成される。
次に、ステップS104において、選択部106が、生成規則(直交変換基底)及び再生規則(逆直交変換基底)を選択する処理を行う。なお、この選択は、動き補償信号間差分信号122(すなわち、前方向動き補償信号53−1と後方向動き補償信号53−2との差分の分布)に基づいて行われる。
次に、ステップS105において、予測信号生成部103が、前方向動き補償信号53−1及び後方向動き補償信号53−2から予測信号54を生成する処理を行う。
次に、ステップS106において、予測誤差信号生成部104が、符号化対象信号51と予測信号54との誤差を表す予測誤差信号55を生成する処理を行う。
次に、ステップS107において、符号化情報生成部105が、ステップS104の処理により選択部106が選択した直交変換基底を用いて、予測誤差信号55を変換する処理を行う。
次に、ステップS108において、予測誤差信号55の変換後の信号を符号化情報生成部105が量子化し符号化情報56を生成する処理を行い、エントロピー符号化部107が符号化情報56をエントロピー変換しビットストリーム59を生成する処理を行う。
次に、ステップS109において、符号化情報56を再生予測誤差信号生成部108が逆量子化する処理を行う。この処理により、符号化情報56から、予測誤差信号55に直交変換が施された形の信号までの復号がなされる。
次に、ステップS110において、再生予測誤差信号生成部108が、ステップS104の処理により選択部106が選択した逆直交変換基底を用いて、予測誤差信号55に直交変換が施された形の信号から、再生予測誤差信号57を生成する処理を行う。
次に、ステップS111において、更新部111が、復号された再生予測誤差信号57と、動き補償信号間差分信号122とに基づき、直交変換基底及び逆直交変換基底を計算して生成する処理を行う。
次に、ステップS112において、更新部111が、符号化情報生成部105が用いている直交変換基底と再生予測誤差信号生成部108が用いている逆直交変換基底とを、ステップS111の処理により生成したものに更新する処理を行う。その後は、この動画像符号化処理が終了する。
なお、この図14のフローチャートにおいて、例えば、ステップS105及びS106の処理を、ステップS103の処理の前に実行するようにしてもよい。また、ステップS103及びS104の処理とステップS105及びS106の処理とを並行して実行するようにしてもよい。更に、ステップS011及びS012の処理を、複数のピクチャに跨って実行するようにしてもよい。
次に図15について説明する。図15は、動画像復号処理の処理内容を図解したフローチャートである。この動画像復号処理は、図12に図解した動画像復号装置2により実行される。
動画像復号装置2は、動画像の各フレームを複数の画像ブロックに分割したときの画像ブロック毎に、この動画像復号処理を施す。
図15の処理が開始されると、まず、ステップS201において、エントロピー復号部151が、ビットストリーム59に対してエントロピー復号処理を行って復号対象信号70(符号化情報56)を復元する処理を行う。更に、この復号対象信号70に対し、再生予測誤差信号生成部155が逆量子化する処理を行う。この処理により、符号化情報56から、予測誤差信号55に直交変換が施された形の信号までの復号がなされる。
次に、ステップS202において、動き補償信号生成部152が、ステップS101の処理によりエントロピー復号部151が復号対象信号70と共に復元した動きベクトル52の情報に基づき、動き補償信号53を生成する処理を行う。
次に、ステップS203において、選択部154(図13においては差分計算部159)が、動き補償信号53間の差分を計算する処理を行う。この処理により、前方向動き補償信号53−1と後方向動き補償信号53−2との差分を表す動き補償信号間差分信号122が生成される。
なお、上述したステップS202及びS203の処理は、それぞれ、動画像符号化装置1で実行される、図14のステップS102及びS103の処理と基本的には同一である。
次に、ステップS204において、選択部154は、動き補償信号間差分信号122(すなわち、前方向動き補償信号53−1と後方向動き補償信号53−2との差分の分布)に基づいて、再生規則(逆直交変換基底)を選択する処理を行う。
次に、ステップS205において、予測信号生成部153が、前方向動き補償信号53−1及び後方向動き補償信号53−2から予測信号54を生成する処理を行う。
次に、ステップS206において、再生予測誤差信号生成部155が、ステップS204の処理により選択部154が選択した逆直交変換基底を用いて、予測誤差信号55に直交変換が施された形の信号から、再生予測誤差信号57を生成する処理を行う。
次に、ステップS207において、復号画像生成部156が、予測信号54と再生予測誤差信号57とを加算して復号画像71を生成する処理を行う。
次に、ステップS208において、更新部158が、復号された再生予測誤差信号57と、動き補償信号間差分信号122とに基づき、逆直交変換基底を計算して生成する処理を行う。
次に、ステップS209において、更新部158が、再生予測誤差信号生成部155が用いている逆直交変換基底を、ステップS208の処理により生成したものに更新する処理を行う。その後は、この動画像復号処理が終了する。
なお、図14に示すフローチャートにおいて、例えば、ステップS205の処理を、ステップS203の処理の前に実行するようにしてもよい。また、ステップS203及びS204の処理とステップS205の処理とを並行して実行するようにしてもよい。更に、ステップS208及びS209の処理を、複数のピクチャに跨って実行するようにしてもよい。
このように、本実施形態に係る動画像符号化・復号では、複数の動き補償信号53間の差分値の分布と、予測誤差信号55の分布との間に相関があることを利用する。すなわち、動き補償信号53間の差分値の分布に基づいて、予測誤差信号55を符号化・復号するための規則の選択がされる。この選択が適切になされることによって、予測誤差の空間的な冗長性が効率的に削減され、結果として、符号化情報の情報量が小さくなる。更に、動き補償信号53間の差分値の分布に基づいて、再生予測誤差信号57を分類し、その分類に従って直交変換基底及び逆直交変換基底を算出することで、動画像のシーンに応じて直交基底及び逆直交変換基底を適応的に変更することができる。
また、動画像符号化装置1と動画像復号装置2とは、実質的に同一の動き補償信号53を生成する。従って、動画像符号化装置1から動画像復号装置2へ符号化方法を指示する情報を伝送することなく、動画像復号装置2が正しい復号方法を選択できる。
更に、動画像符号化装置1は、画像の性質に応じて適切な符号化方法(変換規則)を選択して符号化を行う。従って、予測誤差が大きいブロック(例えば、細かいテクスチャが存在する領域、あるいは動きの激しいシーン)であっても、符号化情報の情報量は小さくて済む。
なお、上述の実施形態では、前方向動き補償信号53−1と後方向動き補償信号53−2との間の差分の分布に応じて予測誤差信号55の変換規則・再生規則を選択し、また、この差分の分布と再生予測誤差信号57とに基づいて変換規則・再生規則を更新している。この代わりに、例えば、前方向動き補償信号53−1と後方向動き補償信号53−2との間の相関の分布を求め、変換規則・再生規則の選択については、この相関の分布に応じて行うようにしてもよい。
また、上述の実施形態では、選択部106が、予測誤差信号55を直交変換する変換規則の選択を行う。この代わりに、その直交変換後に行われる量子化演算の規則を、動き補償信号に応じて選択部106が選択するようにしてもよい。
次に図16について説明する。図16は、動画像符号化装置1として、また、動画像復号装置2として機能させることのできるコンピュータのハードウェア構成を図解したものである。
図16において、CPU1001は、メモリ1003を作業用記憶領域として利用して動画像符号化プログラム・動画像復号プログラムを実行する演算処理装置である。
記憶装置1002は、CPU1001により実行される符号化プログラム・復号プログラムを予め格納しておく例えばハードディスク装置である。なお、記憶装置1002は、このコンピュータについての外部記憶装置であってもよい。
メモリ1003は、例えば半導体メモリであり、RAM(Random Access Memory)としての領域とROM(Read Only Memory)としての領域とを含んで構成される。
読み取り装置1004は、CPU1001の指示に従って可搬型記録媒体1005にアクセスする。
可搬型記録媒体1005は、例えば、半導体デバイス、磁気的作用により情報が入出力される媒体、光学的作用により情報が入出力される媒体を含むものとする。
通信インタフェース1006は、CPU1001の指示に従って、通信ネットワークを介して各種のデータを送受信する。
入出力装置1007は、この実施例では、表示装置、ユーザからの指示を受け付けるデバイス等に相当する。
なお、動画像符号化プログラム及び動画像復号プログラムは、それぞれ、図14に図解した動画像符号化処理、及び図15に図解した動画像復号処理を図16のコンピュータに行わせるものである。この動画像符号化プログラム及び動画像復号プログラムは、例えば、下記の形態で提供される。
(1)記憶装置1002に予めインストールされている。
(2)可搬型記録媒体1005により提供される。
(3)プログラムサーバ1010からダウンロードする。
そして、上記構成のコンピュータで動画像符号化プログラムを実行することによって、図6に図解した動画像符号化装置1の各構成要素が有する機能がコンピュータにより提供されて、動画像符号化装置1が実現される。また、上記構成のコンピュータで動画像復号プログラムを実行することによって、図12に図解した動画像復号装置2の各構成要素が有する機能がコンピュータにより提供されて、動画像復号装置2が実現される。
なお、以上までに説明した実施形態に関し、更に以下の付記を開示する。
(付記1)
動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成部と、
該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成部と、
該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成部と、
該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う選択部と、
該選択部により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成部と、
該選択部により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該符号化情報生成部が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成部と、
該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号画像生成部と、
該復号画像生成部が出力した復号画像を蓄積する復号画像蓄積部と、
を有しており、
該動き補償信号生成部は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
ことを特徴とする動画像符号化装置。
(付記2)
付記1に記載の動画像符号化装置であって、
該符号化情報生成部が該符号化情報の生成において従っていた生成規則を、該再生予測誤差信号生成部が出力する再生予測誤差信号に基づき、該符号化情報の情報量が小さくなるように更新する更新部を更に有することを特徴とする動画像符号化装置。
(付記3)
付記1又は2に記載の動画像符号化装置であって、
該動き補償信号生成部は、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で前の参照画像とから第一の動き補償信号を生成すると共に、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で後の参照画像とから第二の動き補償信号を生成し、
該選択部は、該第一の動き補償信号と該第二の動き補償信号との差分に基づいて、該生成規則の選択を行う、
ことを特徴とする動画像符号化装置。
(付記4)
付記2に記載の動画像符号化装置であって、
該動き補償信号生成部は、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で前の参照画像とから第一の動き補償信号を生成すると共に、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で後の参照画像とから第二の動き補償信号を生成し、
該選択部は、該第一の動き補償信号と該第二の動き補償信号との差分に基づいて、該生成規則の選択を行い、
該更新部は、該再生予測誤差信号に基づくと共に、該第一の動き補償信号と該第二の動き補償信号との差分にも基づいて、該符号化情報生成部が該符号化情報の生成において従っていた生成規則を更新する、
ことを特徴とする動画像符号化装置。
(付記5)
付記3又は4に記載の動画像符号化装置であって、
該選択部は、該第一の動き補償信号で表される画像を構成する画素の画素値と、該第二の動き補償信号で表される画像において該画素に対応する位置の画素値との差分の各画素についての分布を、該第一の動き補償信号と該第二の動き補償信号との差分の信号から得て、該分布に予め対応付けられている生成規則を選択することを特徴とする動画像符号化装置。
(付記6)
付記4に記載の動画像符号化装置であって、
該選択部は、該第一の動き補償信号で表される画像を構成する画素の画素値と、該第二の動き補償信号で表される画像において該画素に対応する位置の画素値との差分の各画素についての分布を、該第一の動き補償信号と該第二の動き補償信号との差分の信号から得て、該分布に予め対応付けられている生成規則を選択し、
該更新部は、該第一の動き補償信号で表される画像を構成する画素の画素値と、該第二の動き補償信号で表される画像において該画素に対応する位置の画素値との差分の各画素についての分布を、該第一の動き補償信号と該第二の動き補償信号との差分の信号から得て、該分布に予め対応付けられている生成規則を更新する、
ことを特徴とする動画像符号化装置。
(付記7)
付記1から6のうちのいずれか一項に記載の動画像符号化装置であって、
該符号化情報をエントロピー符号化するエントロピー符号化部を更に有し、
該選択部は、該エントロピー符号化部によりエントロピー符号化された後の符号化情報の情報量が最も小さくなることが推定される生成規則を選択する、
ことを特徴とする動画像符号化装置。
(付記8)
付記2、4、及び6のうちのいずれか一項に記載の動画像符号化装置であって、
該符号化情報をエントロピー符号化するエントロピー符号化部を更に有し、
該選択部は、該エントロピー符号化部によりエントロピー符号化された後の符号化情報の情報量が最も小さくなることが推定される生成規則を選択し、
該更新部は、該符号化情報生成部が該符号化情報の生成において従っていた生成規則を、該エントロピー符号化部によりエントロピー符号化された後の符号化情報の情報量が最も小さくなるように更新する、
ことを特徴とする動画像符号化装置。
(付記9)
付記1に記載の動画像符号化装置から送られてくる、該符号化情報と該画像の動きを表している動きベクトル情報とに基づいて該符号化対象画像の復号画像を復号する動画像復号装置であって、
該符号化対象画像の復号画像を蓄積する復号装置側復号画像蓄積部と、
該復号装置側復号画像蓄積部から読み出した複数の該復号画像を複数の参照画像として用い、該複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する復号装置側動き補償信号生成部と、
該予測信号を、該復号装置側動き補償信号生成部が生成した複数の動き補償信号から生成する復号装置側予測信号生成部と、
該符号化情報生成部が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則を選択する復号装置側選択部と、
該選択部により選択された生成規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する復号装置側再生予測誤差信号生成部と、
該復号装置側予測信号生成部が生成した予測信号と該復号装置側再生予測誤差信号生成部が出力した再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号装置側復号画像生成部と、
を有しており、
該復号装置側復号画像蓄積部は、該復号装置側復号画像生成部が出力した該符号化対象画像の復号画像を蓄積する、
ことを特徴とする復号装置。
(付記10)
動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成し、
該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成し、
該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成し、
該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行い、
該選択により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成し、
該選択により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力し、
該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力し、
該出力された復号画像を復号画像蓄積部で蓄積し、
該動き補償信号の生成では、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
ことを特徴とする動画像符号化方法。
(付記11)
付記10に記載の動画像符号化方法により得られた該符号化情報と該画像の動きを表している動きベクトル情報とに基づいて該符号化対象画像の復号画像を復号する動画像復号方法であって、
該符号化対象画像の復号画像を復号側復号画像蓄積部が蓄積し、
該復号側復号画像蓄積部から読み出した複数の該復号画像を複数の参照画像として用い、該複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号の生成を復号側で行い、
該予測信号を、該復号側での生成により生成された複数の動き補償信号から復号側で生成し、
該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則の選択を復号側で行い、
該復号側での選択により選択された生成規則に従って、該符号化情報から該予測誤差信号の再生を復号側で行い、得られた信号を再生予測誤差信号とし、
該復号側での生成により生成された予測信号と該復号側での再生により得られた再生予測誤差信号とを用いて画像を生成し、生成された画像を復号側での該符号化対象画像の復号画像とし、
該復号装置側復号画像蓄積部には、該復号側での該符号化対象画像の復号画像を蓄積する、
ことを特徴とする動画像復号方法。
(付記12)
動画像の符号化をコンピュータに行わせるためのプログラムであって、
動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成処理と、
該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成処理と、
該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成処理と、
該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う選択処理と、
該選択処理により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成処理と、
該選択処理により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該符号化情報生成処理が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成処理と、
該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号画像生成処理と、
該復号画像生成処理が出力した復号画像を復号画像蓄積部に蓄積する復号画像蓄積処理と、
を該コンピュータに行わせ、
該動き補償信号生成処理は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
ことを特徴とする動画像符号化プログラム。
(付記13)
付記1に記載の動画像符号化装置から送られてくる、該符号化情報と該画像の動きを表している動きベクトル情報とに基づいて該符号化対象画像の復号画像を復号する処理コンピュータに行わせるためのプログラムであって、
該符号化対象画像の復号画像を復号装置側復号画像蓄積部に蓄積する復号装置側復号画像蓄積処理と、
該復号装置側復号画像蓄積部から読み出した複数の該復号画像を複数の参照画像として用い、該複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する復号装置側動き補償信号生成処理と、
該予測信号を、該復号装置側動き補償信号生成処理が生成した複数の動き補償信号から生成する復号装置側予測信号生成処理と、
該符号化情報生成処理が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則を選択する復号装置側選択処理と、
該選択処理により選択された生成規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する復号装置側再生予測誤差信号生成処理と、
該復号装置側予測信号生成処理が生成した予測信号と該復号装置側再生予測誤差信号生成処理が出力した再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号装置側復号画像生成処理と、
をコンピュータに行わせ、
該復号装置側復号画像蓄積処理は、該復号装置側復号画像生成処理が出力した該符号化対象画像の復号画像を該復号装置側復号画像蓄積部に蓄積する、
ことを特徴とする動画像復号プログラム。
(付記14)
動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成部と、
該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成部と、
該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成部と、
該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが推定される生成規則を該複数の動き補償信号を基に選択する選択部と、
該選択部により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成部と、
を有することを特徴とする動画像符号化装置。
(付記15)
付記14に記載の動画像符号化装置にて符号化された該符号化情報と該画像の動きを表す動きベクトル情報とを入力し、復号する動画像復号装置であって、
該復号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する動き補償信号生成部と、
該動き補償信号生成部が生成した複数の動き補償信号から予測信号を生成する予測信号生成部と、
該符号化情報生成部が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するための該再生規則を選択する復号装置側選択部と、
該選択部により選択された再生規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成部と、
該予測信号生成部が生成した予測信号と該再生予測誤差信号生成部が出力した再生予測誤差信号とを用いて画像を再生し復号画像として出力する復号画像生成部と、
を有する
ことを特徴とする復号装置。
1 動画像符号化装置
2 動画像復号装置
11、104 予測誤差信号生成部
12 直交変換部
13 量子化部
14 ジグザグスキャン部
15、107 エントロピー符号化部
16、33 逆量子化部
17、34 逆直交変換部
18、37、156 復号画像生成部
19、38 復号画像記憶部
20、35、102、152 動き補償信号生成部
21、36、103、153 予測信号生成部
31、151 エントロピー復号部
32 逆ジグザグスキャン部
40 符号化対象画像
40−1 符号化対象ブロック
40−2、51 符号化対象信号
40−3、54 予測信号
40−4、55 予測誤差信号
41 前方向参照画像
41−1 前方向予測ブロック
41−2 前方向動きベクトル
41−3、53−1 前方向動き補償信号
42 後方向参照画像
42−1 後方向予測ブロック
42−2 後方向動きベクトル
42−3、53−2 後方向動き補償信号
43 加算器
44 減算器
45 動き補償信号間差分信号算出器
46、122 動き補償信号間差分信号
52 動きベクトル
53 動き補償信号
56 符号化情報
57 再生予測誤差信号
58 局部復号画像
59 ビットストリーム
61 前方向動き補償ブロック
62 後方向動き補償ブロック
63 差分信号ブロック
70 復号対象信号
71 復号画像
101 動き推定部
105 符号化情報生成部
106、154 選択部
108、155 再生予測誤差信号生成部
109 局部復号画像生成部
110、157 参照画像蓄積部
111、158 更新部
121、159 差分計算部
123 参照画像
1001 CPU
1002 記憶装置
1003 メモリ
1004 読み取り装置
1005 可搬型記録媒体
1006 通信インタフェース
1007 入出力装置
1010 プログラムサーバ

Claims (10)

  1. 動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成部と、
    該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成部と、
    該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成部と、
    該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う選択部と、
    該選択部により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成部と、
    該選択部により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該符号化情報生成部が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成部と、
    該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号画像生成部と、
    該復号画像生成部が出力した復号画像を蓄積する復号画像蓄積部と、
    を有しており、
    該動き補償信号生成部は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
    ことを特徴とする動画像符号化装置。
  2. 請求項1に記載の動画像符号化装置であって、
    該符号化情報生成部が該符号化情報の生成において従っていた生成規則を、該再生予測誤差信号生成部が出力する再生予測誤差信号に基づき、該符号化情報の情報量が小さくなるように更新する更新部を更に有することを特徴とする動画像符号化装置。
  3. 請求項2に記載の動画像符号化装置であって、
    該動き補償信号生成部は、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で前の参照画像とから第一の動き補償信号を生成すると共に、該符号化対象画像と該複数の画像のうち該符号化対象画像に対し時間軸上で後の参照画像とから第二の動き補償信号を生成し、
    該選択部は、該第一の動き補償信号と該第二の動き補償信号との差分に基づいて、該生成規則の選択を行い、
    該更新部は、該再生予測誤差信号に基づくと共に、該第一の動き補償信号と該第二の動き補償信号との差分にも基づいて、該符号化情報生成部が該符号化情報の生成において従っていた生成規則を更新する、
    ことを特徴とする動画像符号化装置。
  4. 請求項3に記載の動画像符号化装置であって、
    該選択部は、該第一の動き補償信号で表される画像を構成する画素の画素値と、該第二の動き補償信号で表される画像において該画素に対応する位置の画素値との差分の各画素についての分布を、該第一の動き補償信号と該第二の動き補償信号との差分の信号から得て、該分布に予め対応付けられている生成規則を選択し、
    該更新部は、該第一の動き補償信号で表される画像を構成する画素の画素値と、該第二の動き補償信号で表される画像において該画素に対応する位置の画素値との差分の各画素についての分布を、該第一の動き補償信号と該第二の動き補償信号との差分の信号から得て、該分布に予め対応付けられている生成規則を更新する、
    ことを特徴とする動画像符号化装置。
  5. 請求項2から4のうちのいずれか一項に記載の動画像符号化装置であって、
    該符号化情報をエントロピー符号化するエントロピー符号化部を更に有し、
    該選択部は、該エントロピー符号化部によりエントロピー符号化された後の符号化情報の情報量が最も小さくなることが推定される生成規則を選択し、
    該更新部は、該符号化情報生成部が該符号化情報の生成において従っていた生成規則を、該エントロピー符号化部によりエントロピー符号化された後の符号化情報の情報量が最も小さくなるように更新する、
    ことを特徴とする動画像符号化装置。
  6. 請求項1に記載の動画像符号化装置から送られてくる、該符号化情報と該画像の動きを表している動きベクトル情報とに基づいて該符号化対象画像の復号画像を復号する動画像復号装置であって、
    該符号化対象画像の復号画像を蓄積する復号装置側復号画像蓄積部と、
    該復号装置側復号画像蓄積部から読み出した複数の該復号画像を複数の参照画像として用い、該複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する復号装置側動き補償信号生成部と、
    該予測信号を、該復号装置側動き補償信号生成部が生成した複数の動き補償信号から生成する復号装置側予測信号生成部と、
    該符号化情報生成部が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則を選択する復号装置側選択部と、
    該選択部により選択された生成規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する復号装置側再生予測誤差信号生成部と、
    該復号装置側予測信号生成部が生成した予測信号と該復号装置側再生予測誤差信号生成部が出力した再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号装置側復号画像生成部と、
    を有しており、
    該復号装置側復号画像蓄積部は、該復号装置側復号画像生成部が出力した該符号化対象画像の復号画像を蓄積する、
    ことを特徴とする復号装置。
  7. 動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成し、
    該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成し、
    該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成し、
    該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行い、
    該選択により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成し、
    該選択により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力し、
    該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力し、
    該出力された復号画像を復号画像蓄積部で蓄積し、
    該動き補償信号の生成では、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
    ことを特徴とする動画像符号化方法。
  8. 動画像の符号化をコンピュータに行わせるためのプログラムであって、
    動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成処理と、
    該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成処理と、
    該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成処理と、
    該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが該複数の動き補償信号から推定される生成規則の選択を行う選択処理と、
    該選択処理により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成処理と、
    該選択処理により選択された生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するためのものである該再生規則に従って、該符号化情報生成処理が生成した符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成処理と、
    該予測信号と該再生予測誤差信号とを用いて画像を生成し、生成された画像を該符号化対象画像の復号画像として出力する復号画像生成処理と、
    該復号画像生成処理が出力した復号画像を復号画像蓄積部に蓄積する復号画像蓄積処理と、
    を該コンピュータに行わせ、
    該動き補償信号生成処理は、該複数の参照画像として、該復号画像蓄積部に蓄積されている復号画像を用いる、
    ことを特徴とする動画像符号化プログラム。
  9. 動画像を構成する複数の画像のうちのひとつである符号化対象画像を表す符号化対象信号と、該複数の画像のうち該符号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像とに基づいて、画像の動きを表している動き補償信号を複数生成する動き補償信号生成部と、
    該複数の参照画像から予測される該符号化対象信号の予測値を表す予測信号を、該複数の動き補償信号から生成する予測信号生成部と、
    該符号化対象信号に対しての該予測信号の誤差を表す予測誤差信号を生成する予測誤差信号生成部と、
    該予測誤差信号から符号化情報を生成するための複数の生成規則から、該予測誤差信号が符号化されたときの情報量が最も小さくなることが推定される生成規則を該複数の動き補償信号を基に選択する選択部と、
    該選択部により選択された生成規則に従って、該予測誤差信号を符号化して符号化情報を生成する符号化情報生成部と、
    を有することを特徴とする動画像符号化装置。
  10. 請求項9に記載の動画像符号化装置にて符号化された該符号化情報と該画像の動きを表す動きベクトル情報とを入力し、復号する動画像復号装置であって、
    該復号化対象画像に対し時間軸上で前若しくは後の画像である複数の参照画像と該動きベクトル情報とに基づいて、該複数の動き補償信号を生成する動き補償信号生成部と、
    該動き補償信号生成部が生成した複数の動き補償信号から予測信号を生成する予測信号生成部と、
    該符号化情報生成部が該符号化情報の生成において従っていた生成規則に予め対応付けられている再生規則であって該生成規則に従って符号化された信号を再生するための該再生規則を選択する復号装置側選択部と、
    該選択部により選択された再生規則に従って、該符号化情報から該予測誤差信号の再生を行い、得られた信号を再生予測誤差信号として出力する再生予測誤差信号生成部と、
    該予測信号生成部が生成した予測信号と該再生予測誤差信号生成部が出力した再生予測誤差信号とを用いて画像を再生し復号画像として出力する復号画像生成部と、
    を有する
    ことを特徴とする復号装置。
JP2010065270A 2010-03-19 2010-03-19 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム Active JP5375697B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010065270A JP5375697B2 (ja) 2010-03-19 2010-03-19 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010065270A JP5375697B2 (ja) 2010-03-19 2010-03-19 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011199685A true JP2011199685A (ja) 2011-10-06
JP5375697B2 JP5375697B2 (ja) 2013-12-25

Family

ID=44877300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010065270A Active JP5375697B2 (ja) 2010-03-19 2010-03-19 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5375697B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016524409A (ja) * 2013-06-05 2016-08-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 残差差分パルスコード変調(dpcm)拡張ならびに変換スキップ、回転、および走査との調和

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63294086A (ja) * 1987-05-26 1988-11-30 Fujitsu Ltd フレ−ム間符号化方式
JPH07170523A (ja) * 1993-03-04 1995-07-04 Toshiba Corp 動画像符号化装置と動画像復号化装置
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63294086A (ja) * 1987-05-26 1988-11-30 Fujitsu Ltd フレ−ム間符号化方式
JPH07170523A (ja) * 1993-03-04 1995-07-04 Toshiba Corp 動画像符号化装置と動画像復号化装置
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016524409A (ja) * 2013-06-05 2016-08-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 残差差分パルスコード変調(dpcm)拡張ならびに変換スキップ、回転、および走査との調和
US11323747B2 (en) 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans

Also Published As

Publication number Publication date
JP5375697B2 (ja) 2013-12-25

Similar Documents

Publication Publication Date Title
US11070802B2 (en) Moving image coding device, moving image decoding device, moving image coding/decoding system, moving image coding method and moving image decoding method
TWI717586B (zh) 於視訊解碼器中導出運動向量資訊
RU2695776C1 (ru) Устройство прогнозирующего декодирования изображений, способ прогнозирующего декодирования изображений
KR101717510B1 (ko) 화상 예측 부호화 장치, 방법 및 프로그램, 화상 예측 복호 장치, 방법 및 프로그램, 및 부호화·복호 시스템 및 방법
JP5488613B2 (ja) 動画像符号化装置および動画像復号装置
US9055302B2 (en) Video encoder and video decoder
JP4993676B2 (ja) 画像符号化装置及び画像符号化方法
RU2734616C1 (ru) Способ декодирования видео с предсказанием и устройство декодирования видео с предсказанием
JP6459761B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6503014B2 (ja) 動画像符号化方法及び動画像復号化方法
JP6426648B2 (ja) 動画像予測復号方法及び動画像予測復号装置
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP5375697B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム
JP6992825B2 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP2020058075A (ja) 動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法及び記録媒体
JP5533885B2 (ja) 動画像符号化装置および動画像復号装置
JP6646125B2 (ja) 動画像予測復号方法及び動画像予測復号装置
JP4561701B2 (ja) 動画像符号化装置
JP6510084B2 (ja) 動画像復号化方法及び電子装置
KR20120075019A (ko) 움직임 벡터 부호화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130909

R150 Certificate of patent or registration of utility model

Ref document number: 5375697

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150