JP4971817B2 - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP4971817B2
JP4971817B2 JP2007026995A JP2007026995A JP4971817B2 JP 4971817 B2 JP4971817 B2 JP 4971817B2 JP 2007026995 A JP2007026995 A JP 2007026995A JP 2007026995 A JP2007026995 A JP 2007026995A JP 4971817 B2 JP4971817 B2 JP 4971817B2
Authority
JP
Japan
Prior art keywords
prediction
block
intra
prediction mode
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007026995A
Other languages
English (en)
Other versions
JP2008193501A (ja
Inventor
大輔 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007026995A priority Critical patent/JP4971817B2/ja
Publication of JP2008193501A publication Critical patent/JP2008193501A/ja
Application granted granted Critical
Publication of JP4971817B2 publication Critical patent/JP4971817B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像符号化装置に関する。
近年、マルチメディアに関連する情報のデジタル化が急進しており、それに伴い映像情報の高画質化に向けた要求が高まっている。具体的な例として、放送メディアにおいては、従来の720×480画素のSD(Standard Definition)方式から、1920×1080画素のHD(high definition)方式に移行が行われつつあることを挙げることができる。
しかしながら、この高画質への要求は、デジタルデータの増大を同時に引き起こす問題点がある。これを解消するために、従来の性能を上回る圧縮符号化技術及び復号化技術が求められている。これらの要求に対し、ITU−T SG16やISO/IEC JTC1/SC29/WG11の活動で、画像間の相関を利用したフレーム間予測を用いた符号化圧縮方式の標準化作業が進められている。
この中でも、現状最も高能率符号化を実現しているといわれる符号化方式にH.264/MPEG−4 PART10(AVC)(以下、H.264と呼ぶ)がある。また、この中で新たに導入された技術のひとつとして、フレーム内の相関を利用し、フレーム内画素値を用いて同一フレーム内の画素値を予測するイントラ予測が導入されている。
なお、イントラ予測には,複数の予測ブロックサイズ・予測方向(以下、イントラ予測モード)が存在する。例えば、「16×16画素」のブロックデータを基に予測方向を決定するイントラ16×16予測には4種類の予測方向がある。また、「4×4画素」のブロックデータを基に予測方向を決定するイントラ4×4予測には9種類の予測方向がある。
H.264では、これらのイントラ予測モードから最も適切なものを選択することにより、高能率な符号化を実現している。一般的には、一通りのイントラ予測処理を試行して、最適なイントラ予測モードを選択する手法が用いられている。さらには、特許文献1には撮影情報を用いて最適なイントラ予測モードを選択する方法が提案されている。また、特許文献2には、画像のパターンを判定して最適なイントラ予測モードを選択する方法がそれぞれ提案されている。
特開2006−217158号公報 特開2006−005659号公報
前述したように、前記のイントラ予測において最適なイントラ予測モードを求めるためには、最適なイントラ予測モードを選択する必要がある。このために、ITU−T SG16やISO/IECが提供するH.264のリファレンスソフトモデルJM(Joint Model)においては、全てのイントラ予測モードに対して演算を行い、最適なイントラ予測モードを選択している。
しかしながら、符号化対象ブロックに対してイントラ16×16予測、イントラ4×4予測で定められたすべてのイントラ予測モードに対して演算を行うためには膨大な処理時間を必要とする。このため、特にイントラ予測モードの選択の他に、動きベクトルを算出する必要があるPピクチャやBピクチャにおいては、リアルタイムで符号化処理を行うことは困難であった。
また、演算負荷の増大は消費電力の増大に結びつくので、ビデオカメラなどのモバイル機器の場合には、機器の動作可能時間が短くなってしまう問題があった。さらに、前記特許文献1の手法では、撮影情報の入手が必須であり、特許文献2の手法では、画像パターンを判定する手段が必要である問題点があった。
本発明は少ない演算負荷によって、符号化を行うことを目的とる。
本発明に係る画像符号化装置は、符号化が行われていない第1の画像を符号化するために、前記第1の画像に含まれる第1のブロックに対してイントラ予測処理を行う制御手段と、前記第1の画像から最も近い時間で符号化が行われた第2の画像に含まれる第2のブロックの位置、前記第2の画像に対する前記第1の画像の位置の差を示すグローバルベクトルに応じて移動させた位置にある第3のブロックを検出する第1の検出手段と、前記第3のブロックで用いられたイントラ予測処理を検出する第2の検出手段とを有し、前記制御手段は、前記第3のブロックで用いられたイントラ予測処理を前記第1のブロックにい、前記第2のブロックは、前記第2の画像において、前記第1のブロックの位置と同一の位置にあることを特徴とする。
本発明によれば、少ない演算負荷によって、符号化を行うことができる。
(第1の実施形態)
以下に図1〜図4を参照しながら、本発明にかかる画像符号化装置の好適な第1の実施形態について詳細に説明する。
図1は、本実施形態に係る画像符号化装置の構成例を説明するブロック図である。図1に示すように、本実施形態に係る画像符号化装置はフレームメモリ101、フィルタ後参照フレームメモリ102を備えている。
また、動き予測部103、動き補償部104、イントラ予測部105、直交変換部106、量子化部107、エントロピー符号化部108、逆量子化部109、逆直交変換部110、スイッチ111、減算器112、加算器113を備えている。また、フィルタ前参照フレームメモリ114、ループフィルタ115、イントラ予測モード保存部116とを備えている。
このように構成された本実施形態の画像符号化装置において、まず入力画像を符号化する方法について述べる。
フレームメモリ101には入力画像が表示順に保存され、符号化対象ブロックを動き予測部103、イントラ予測部105、減算器112に対して符号化順に並べ替えて順次送信する。
減算器112はフレームメモリ101から送信されてくる符号化対象ブロックからスイッチ111から送信されてくる予測画像ブロックを減算し、画像残差データを出力する。なお、予測画像ブロックの生成方法については後述する。
直交変換部106では減算器112から出力された画像残差データを直交変換処理して、変換係数を量子化部107に送信する。量子化部107は、直交変換部変換係数を所定の量子化パラメータを用いて量子化し、エントロピー符号化部108及び逆量子化部109に送信する。
エントロピー符号化部108は量子化部107で量子化された変換係数を入力し、CAVLC(Context-Based Adaptive Variable Length)、CABAC(Context-based Adaptive Binary Arithmetic Coding)などのエントロピー符号化を施して、符号化データとして出力する。続いて、量子化部107で量子化された変換係数を用いて参照画像データを生成する方法について述べる。
逆量子化部109は、量子化部107から送信されてくる量子化された変換係数を逆量子化する。逆直交変換部110は逆量子化部109で逆量子化された変換係数を逆直交変換し、復号残差データを生成し加算器113に送信する。
加算器113は復号残差データと後述する予測画像データとを加算し参照画像データを生成し、フィルタ前参照フレームメモリ114に保存する。また、ループフィルタ115に送信される。ループフィルタ115は、参照画像データをフィルタリングしてノイズを除去しフィルタ後の参照画像データをフィルタ後参照フレームメモリ102に保存する。
続いて、前記入力画像データ及び前記フィルタ前参照画像データ、前記フィルタ後参照画像データを用いて前記予測画像データを生成する方法について述べる。
動き予測部103は、フレームメモリ101から送信される符号化対象ブロック及びフィルタ後参照フレームメモリ102から送信されるフィルタ後参照画像データを用いて符号化対象ブロックのフィルタ後参照画像データでの動き量を表す動きベクトルを検出する。そして、検出した動きベクトルを、フィルタ後参照フレーム画像データ番号とともに動き補償部104に送信する。
動き補償部104は、動き予測部103から送られた動きベクトルを用いて、フィルタ後参照フレームメモリ102中のフィルタ後参照フレーム画像データ番号で示される参照フレーム画像を参照する。そして、各ブロックの予測画像データを生成し、スイッチ111に送信する。
一方、イントラ予測部105はフレームメモリ101から送信される符号化対象ブロック、及びフィルタ前参照フレームメモリ114から送信される、既に符号化済みの符号化対象ブロックの周辺画素を用いて画面内予測(イントラ予測)を行う。そして、複数のイントラ予測モードの中から適切なイントラ予測モードを選択して予測画像データを生成し、スイッチ111に送信するとともにイントラ予測モード保存部116に選択された予測モードの情報を保存する。なお、本実施形態の特徴である適切なイントラ予測モードを選択する方法については後に詳細に述べる。
スイッチ111は、動き補償部104及びイントラ予測部105から送信されてくる予測画像データのうち、適切な予測画像を選択して減算器112に送信する。なお、適切な予測画像を選択する方法は、例えば符号化対象ブロックと参照画像データの画像残差の絶対値和が小さい方を選択するなどの方法が挙げられるが、本実施形態の画像符号化装置では選択方法は問わない。
次に、イントラ予測部105で使用可能な予測モードによる予測画像の生成方法について図4を用いながら説明する。
まず、イントラ16×16予測で選択可能な予測モードによる予測画像の生成方法を説明する。ここで、符号化対象ブロックに属する画素データをP(x、y)とする。なお、x、yはブロックを構成するマトリクス状の画素データの行方向及び列方向の位置を示し、0〜15の整数である。
符号化対象ブロックに隣接する画素データを、P(x、-1)、P(-1、y)とする。また、画素データは、前記符号化対象ブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
(予測モード0):
予測モード0は、vertical(垂直)予測であり、P(x、-1)が「利用可能」である場合に適用される。この場合に、vertical(垂直)予測では、予測画像データPIの画素データPred(x、y)を数1のように生成する。
Figure 0004971817
(予測モード1):
予測モード1は、horizontal(水平)予測であり、P(-1、y)が「利用可能」である場合に適用される。この場合に、horizontal(水平)予測では、予測画像データPIの画素データPred(x、y)を数2のように生成する。
Figure 0004971817
(予測モード2):
予測モード2は、DC予測であり、イントラ16×16予測では、予測画像データPIの画素データPred(x、y)を式3のように生成する。先ず、P(x、-1)及びP(-1、y)の全てが「利用可能」である場合に、イントラ16×16予測では、予測画像データPIの画素データPred(x、y)を数3のように生成する。
Figure 0004971817
Figure 0004971817
Figure 0004971817
(予測モード3):
予測モード3は、plane予測であり、P(x、-1)、P(-1、y)の全てが前記「利用可能」である場合に適用される。この場合に、plane予測では、予測画像データPIの画素データPred(x、y)を数6のように生成する。
Figure 0004971817
続いて、図4を用いながら、イントラ4×4予測で選択可能な予測モードによる予測ブロックデータの生成方法を説明する。
図4は、イントラ4×4予測の符号化処理対象となる4×4のブロックに属する画素データa〜pと、当該ブロックデータの周囲に属する画素データA〜Mとの位置関係を説明するための図である。画素データa〜pの予測値によって、予測画像データPIが生成される。なお、画素データA〜Mは、前記処理対象のブロックと異なるピクチャあるいは異なるスライスに属する場合などに、「利用可能でない(unavailable) 」であると判断される。
(予測モード0):
予測モード0は、vertical(垂直)予測であり、図4に示す画素データA、B、C、Dの全てが前記「利用可能」である場合に適用される。この場合、vertical予測は、符号化対象ブロックの画素データa〜pの予測値を、画素データA、B、C、Dを用いて数7のように生成する。
Figure 0004971817
(予測モード1):
予測モード1は、horizontal(水平)予測であり、図4に示す画素データI、J、K、Lの全てが前記「利用可能」である場合に適用される。この場合、horizontal予測は、符号化対象ブロック画素データa〜pの予測値を、画素データI、J、K、Lを用いて数8のように生成する。
Figure 0004971817
(予測モード2):
予測モード2は、DC予測であり、図4に示す画素データA、B、C、D、I、J、K、Lの全てが前記「利用可能」である場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、Lを用いて数9のように生成する。
Figure 0004971817
また、図4に示す画素データA、B、C、Dの全てが前記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、Dを用いて数10のように生成する。
Figure 0004971817
また、図4に示す画素データI、J、K、Lの全てが前記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値を、画素データI、J、K、Lを用いて数11のように生成する。
Figure 0004971817
また、図4に示す画素データA、B、C、D、I、J、K、Lの全てが前記「利用可能」でない場合には、符号化対象ブロック画素データa〜pの予測値「128」を用いる。
(予測モード3):
予測モード3は、D、Iagonal_Down_Left予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。この場合、D、Iagonal_Down_Left予測は、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数12のように生成する。
Figure 0004971817
(予測モード4):
予測モード4は、D、Iagonal_Down_Right予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。
この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数13のように生成する。
Figure 0004971817
(予測モード5):
予測モード5は、D、Iagonal_Vertical_Right予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。
この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数14のように生成する。
Figure 0004971817
(予測モード6):
予測モード6は、Horizontal_Down予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数15のように生成する。
Figure 0004971817
(予測モード7):
予測モード7は、Vertical_Left予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数16のように生成する。
Figure 0004971817
(予測モード8):
予測モード8は、Horizontal_Up予測であり、図4に示す画素データA、B、C、D、I、J、K、L、Mの全てが前記「利用可能」である場合に適用される。この場合に、符号化対象ブロック画素データa〜pの予測値を、画素データA、B、C、D、I、J、K、L、Mを用いて数17のように生成する。
Figure 0004971817
なお、イントラ16×16予測のモード1は水平方向に高い相関(重み付け)を持たせたモードであり、モード0は垂直方向に高い相関(重み付け)を持たせたモードである。また、モード2、3は水平及び垂直方向の重み付けを殆ど行っていないモードである。
イントラ4×4予測のモード1、6、8は水平方向に高い相関(重み付け)を持たせたモードであり、モード0、5、7は垂直方向に高い相関(重み付け)を持たせたモードである。また、モード2、4、3は水平及び垂直方向の重み付けを殆ど行っていないモードである。
次に、本実施形態の最も特徴的な部分である前述のイントラ予測モードを選択するプロセスについて、図2のイントラ予測部のブロック図、図3のフローチャートを用いて説明する。なお、本実施形態ではリアルタイムで符号化を行うには全ての予測モードでの予測誤差演算を行えないものとする。
図2は、本実施形態に係るイントラ予測部105の構成例を示すブロック図である。図2に示すように、本実施形態に係るイントラ予測部105は、イントラ16×16予測部201、イントラ4×4予測部202、イントラ予測モード決定部203を備えている。更に、イントラ16×16モード別コスト保存部204、イントラ4×4モード別コスト保存部205、イントラ16×16ベストモード決定部206、イントラ4×4ベストモード決定部207、イントラベスト予測モード決定部208とを備えている。なお、ここでいう"コスト"とは、各モードに対する演算によって得られるいわゆる評価値である。
係る構成において、イントラ予測モードを選択するプロセスについて説明する。
最初に、イントラ予測部105外にあるイントラ予測モード保存部116に保存してある予測モードをイントラ16×16ブロックサイズ、イントラ4×4ブロックサイズ別にイントラ予測モード決定部203に送信する。なお、イントラ予測モード保存部116から送信する予測モードは、符号化して復号化済みの時間的に最も近いピクチャの同位置にあるブロックで用いられた予測モードである(図3のステップS301)。
時間的に近いピクチャ間の相関は高く同位置の画像データが大きく変化していない可能性が高い。そのため、符号化して復号化済みの時間的に最も近いピクチャの同位置にあるブロックで用いられた予測モードで符号化すると符号化効率が良い可能性が高い。以上の理由から、最初に選択するイントラ予測モードの候補として符号化して復号化済みの時間的に最も近いピクチャの同位置にあるブロックで用いられた予測モードが用いられる。
なお、一番初めのIピクチャ(スライス)など、符号化して復号化済みのピクチャが無い場合には任意の予測モードを最初に選択するイントラ予測モードの候補としてよい。あるいは、インター予測のする必要が無くP、Bピクチャ(スライス)に比べ、処理時間に余裕のあるIピクチャ(スライス)においてはP、Bピクチャより多くの予測モードを演算できるようにして補ってもよい。
イントラ予測モード決定部203は、イントラ予測モード保存部116から送信されてきた予測モードで予測誤差演算を行うようにイントラ16×16予測部201、イントラ4×4予測部202に指示する。また、イントラ予測部105外にあるフィルタ前参照フレームメモリ114に、イントラ予測モード保存部116から送信されてきた予測モードで必要となる画素データをイントラ16×16予測部201、イントラ4×4予測部202に送信するように指示する。
イントラ16×16予測部201、イントラ4×4予測部202はイントラ予測部105外にあるフィルタ前参照フレームメモリ114から送信されてくる予測画像データを用いて前記の方法で各々の予測ブロックデータを生成する。
続いて、イントラ予測部105外にあるフレームメモリ101から送信される符号化対象データ、更にエントロピー符号化部108で付加されるヘッダデータを用いて設定された予測モードでの予測誤差Costを、「数18」を用いて計算する。また、その時の予測サイズ別Cost、予測モードをイントラ16×16モード別コスト保存部204、イントラ4×4モード別コスト保存部205に送信して保存する(図3のステップS302)。
Figure 0004971817
なお、数18において「n」はイントラ16×16の予測か,イントラ4×4の予測かで「16」か「4」の値を取る。また、Org(i、j)は符号化対象データの左上を(0、0)として右下を(n、n)とした時の画素位置(i,j)の画素値、Pred(mode,i,j)は,同様に予測画像データの画素位置(i,j)の画素値である。また、SAD0(mode)はヘッダデータのビット数を表し、QP0は量子化パラメータQPと実際に量子化に用いられる量子化スケールを関連付ける係数である。
続いて、設定された予測モードの予測誤差演算が予め定めた所定の回数に達するまで、イントラ予測モード決定部203は選択された予測モードとは異なる予測モードをイントラ16×16予測部201、イントラ4×4予測部202に送信する。そして、前記ステップS302の処理を繰り返す(図3のテップS303、ステップS304)。但し、送信回数は、全ての予測モードでの予測誤差演算回数より少ない回数とする。また、前記予測モードについて、この場合は、符号化対象ピクチャから時間的に最も近い符号化済みピクチャにおける、符号化対象ブロックとの同位置にあるブロックで用いられた予測モードとする。
設定された予測モードの予測誤差演算が所定の回数に達したら、イントラ16×16モード別コスト保存部204、イントラ4×4モード別コスト保存部205は保存されている予測モード、予測誤差Costを送信する。本実施形態においては、イントラ16×16ベストモード決定部206、イントラ4×4ベストモード決定部207に送信する。
イントラ16×16ベストモード決定部206、イントラ4×4ベストモード決定部207は送信されてきた予測モードから最も予測誤差Costの小さいものを予測サイズ別ベストモードとして選択する。そして、予測誤差Costとともにイントラベスト予測モード決定部208に送信する(図3のステップS305)。また、イントラ予測モード保存部116に予測サイズ別に予測モードを同時に送信して保存する(図3のステップS306)。
イントラベスト予測モード決定部208は、イントラ4×4ベストモード決定部207から送信されてくる予測誤差Costを「16×16のブロックサイズ」に達するまで加算する(つまり、16×16/(4×4)=16回加算する)。その後、イントラ16×16ベストモード決定部206から送信されてきた予測誤差Costと、イントラ4×4ベストモード決定部207から送信されてきた16個の予測誤差Costの和とを比較する。そして、誤差値の小さい方の予測サイズのモードを最終的なイントラ予測モードとして決定する(ステップS307)。
以上、述べたように、本実施形態の画像符号化装置においては、符号化対象ピクチャ内に規定された複数の画素から成るブロックごとに複数種のイントラ予測モードの中から、予め定めた数だけ予測モードの候補を選択する。そして、予測誤差演算を行い、演算結果の誤差値が小さい予測モードを選択する予測モード選択手段を備える。前記予測モード選択手段は、符号化対象ピクチャから時間的に最も近い符号化済みピクチャにおける、符号化対象ブロックと同位置にあるブロックで、予測誤差値の最も小さい予測サイズのモードをイントラ予測モードとして選択する。前記予測モード選択手段は、前記符号化対象ピクチャから時間的に最も近い符号化済みピクチャの同位置にあるブロックで、最も予測誤差の小さかった予測モードを符号化対象ブロックのイントラ予測モードの候補として優先的に選択する。
本実施形態のように、時間的に最も近い符号化済みピクチャの同位置にあるブロックで用いられた予測モードで符号化すると符号化効率が良い可能性が高い。このため、本実施形態においては、時間的に最も近い符号化済みピクチャの同位置にあるブロックで用いられた予測モードを候補として優先的に選択する。これにより、全ての予測モードでの予測誤差演算をリアルタイムに行えない場合でも高い符号化効率を保つことができる。また、全ての予測モードでの予測誤差演算をリアルタイムに行える場合には、予測誤差演算の回数を減らすことが可能となり、画像符号化装置の消費電力を削減することが可能になる。
(第2の実施形態)
次に、図5のブロック図、図6のフローチャート、図7の特性図を参照しながら、本発明にかかる画像符号化装置のもう一つの実施形態について詳細に説明する。ただし、図5に示す第2の実施形態に係る画像符号化装置は第1の実施形態とほぼ同じ構造を有するが、グローバルベクトル演算部501を有する点が異なる。
また、第2の実施形態に係るイントラ予測部105は、第1の実施形態のものと同じ構造を有するが、本実施形態においては、グローバルベクトルを用いて予測モードの候補を選択する点が第1の実施形態と異なる。なお、イントラ予測部105、グローバルベクトル演算部501以外の構成の動作については第1の実施形態と同様のため説明を省く。
グローバルベクトル演算部501は、符号化済みでかつ復号済みで時間的に符号化対象ピクチャから最も近いピクチャ(以下、参照ピクチャ)をフィルタ後参照フレームメモリ102から受信し、同時に符号化対象ピクチャをフレームメモリ101から受信する。そして、符号化対象ピクチャの画素値全てと、参照ピクチャの画素値全てを用いて参照ピクチャに対する符号化対象ピクチャの空間的な位置の差を示すグローバルベクトルを演算する。例えば、次のようなMSE(Mean Square Error)(数19)、MAE(Mean Absolute Error)(数20)、あるいはMAD(Mean Absolute difference)などの評価関数を用いて演算する。
Figure 0004971817
Figure 0004971817
ここで、Scurは符号化対象ピクチャでの(m、n)番目の画素値、Srefは参照ピクチャでの(m、n)番目の画素値を示す。(i、j)は参照ピクチャに対する符号化対象ピクチャの空間的な位置をそれぞれ示している。
MAE値を例にした場合の、グローバルベクトルの選定方法の例を図7に示す。参照フレームを所定の方向に1画素ずつずらしていき、画素の移動距離ごとにMAE値の総和の平均を取る。そして平均MAE値が最小となるときの移動量がグローバルベクトルの選定基準となる。この処理を、例えば所定の方向と直交する他の方向についても実行し、この方向で平均MAE値が最小となる移動量が求まれば、2つの移動量とその移動方向からグローバルベクトルを決定することができる(図6のステップS601)。
本実施形態では、1ピクチャの画素値全てを用いて1つグローバルベクトルを算出した。この他に、例えばピクチャの縦方向を3等分、横方向を3等分し9つグのローバルベクトルを求めるなどピクチャを複数のエリアに分割し、各エリアでグローバルベクトルを算出してもよい。グローバルベクトル演算部501は算出したグローバルベクトルをイントラ予測モード保存部116に送信する。
イントラ予測モード保存部116は、保存してある予測モードを最初にイントラ16×16予測サイズ、イントラ4×4予測サイズ別にイントラ予測モード決定部203に送信する。なお、送信する予測モードは時間的に最も近い符号化済みピクチャの同位置にあるブロックからグローバルベクトル分ずらした位置にあるブロックで用いられた予測モードである(図6のステップS602)。
なお、時間的に近いピクチャであっても、例えば撮像装置がパンしている場合など大きな動きがある場合には、最も近いピクチャの同位置にあるブロックであっても相関が低くなってしまう。そのような場合にもグローバルベクトルを用いてピクチャ間の動き分だけ符号化対象ブロックの位置を補正することで、相関の高いブロックを選択することができる。
以上の理由から最初に選択するイントラ予測モードの候補として、時間的に最も近い符号化済みピクチャの同位置にあるブロックからグローバルベクトル分だけずらしたブロックで用いられた予測モードを用いる。
なお、一番、最初のIピクチャなど既に符号化済みのピクチャが無い場合には任意の予測モードを最初に選択するイントラ予測モードの候補としてもよい。あるいは、イントラ予測のする必要が無くP、Bピクチャ(スライス)に比べ、処理時間に余裕のあるIピクチャ(スライス)においてはP、Bピクチャより多くの予測モードを演算できるようにして補ってもよい。
また、グローバルベクトルの分だけ位置をずらした結果、ブロックの位置がピクチャ外を指し示すような場合には、例えば、第1の実施形態で挙げた時間的に最も近い符号化済みピクチャの同位置にあるブロックで用いた予測モードを用いてもよい。また、隣接するブロックで用いられた予測モードを用いてもよいが、方法は問わない。これ以降の処理は第1の実施形態と同様のため、説明を省く。
なお、本実施形態で用いた予測モードの他に、第1の実施形態で挙げた時間的に最も近い符号化済みピクチャの同位置にあるブロックで用いた予測モードを用いてもよい。その場合、本実施形態の予測モードと第1の実施形態の予測モードを選択する順番は問わない。当然、二つの手法で選択された予測モードが同じ場合には予測誤差演算以降の処理は一度行えばよい。
第1の実施形態の手法を併用することで本実施形態での効果に加え、第1の実施形態で挙げた効果も期待することができる。また、前記第1及び第2の実施形態の手法で選択された予測モード以外の予測モードを予測モードの候補として、必ず一つは選ぶようにするとよい。
第1及び第2の実施形態の手法で選択された予測モードだけで符号化を行っていると全てのピクチャで予測モードが二通りしか選ばれず、結果として符号化効率の低下に繋がる可能性がある。このように、予測モードを選択することで全てのピクチャで予測モードがずっと同じものになることを防ぐことができる。
(本発明に係る他の実施形態)
前述した本発明の実施形態における画像符号化装置を構成する予測モード選択手段及び予測モード決定手段は、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。また、画像符号化方法の予測モード選択工程及び予測モード決定工程も、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施形態も可能である。具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図3及び図6に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接されてもよい。あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどである。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)なども含む。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、前記ホームページから本発明のコンピュータプログラムそのものをダウンロードすることによっても供給できる。もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
本発明の第1実施形態における画像符号化装置の概略の構成を示すブロック図である。 本発明の第1実施形態における画像符号化装置のイントラ予測部の概略の構成を示すブロック図である。 本発明の第1実施形態に係る画像符号化装置のイントラ予測部の動作を説明するフローチャートである。 本発明の実施形態におけるイントラ予測の予測モードを説明するための図である。 本発明の第2実施形態における画像符号化装置の概略の構成を示すブロック図である。 本発明の第2実施形態に係る画像符号化装置のイントラ予測部の動作を説明するフローチャートである。 本発明の第2の実施形態に係るグローバルベクトルの決定方法を説明するための図である。
符号の説明
101 フレームメモリ
102 フィルタ後参照フレームメモリ
103 動き予測部
104 動き補償部
105 イントラ予測部
106 直交変換部
107 量子化部
108 エントロピー符号化部
109 逆量子化部
110 逆直交変換部
111 スイッチ
112 減算器
113 加算器
114 フィルタ前参照フレームメモリ
115 ループフィルタ
116 イントラ予測モード保存部
201 イントラ16×16予測部
202 イントラ4×4予測部
203 イントラ予測モード決定部
204 イントラ16×16モード別コスト保存部
205 イントラ4×4モード別コスト保存部
206 イントラ16×16ベストモード決定部
207 イントラ4×4ベストモード決定部
208 イントラベストモード決定部
501 グローバルベクトル演算部

Claims (5)

  1. 符号化が行われていない第1の画像を符号化するために、前記第1の画像に含まれる第1のブロックに対してイントラ予測処理を行う制御手段と、
    前記第1の画像から最も近い時間で符号化が行われた第2の画像に含まれる第2のブロックの位置、前記第2の画像に対する前記第1の画像の位置の差を示すグローバルベクトルに応じて移動させた位置にある第3のブロックを検出する第1の検出手段と、
    前記第3のブロックで用いられたイントラ予測処理を検出する第2の検出手段とを有し、
    前記制御手段は、前記第3のブロックで用いられたイントラ予測処理を前記第1のブロックにい、
    前記第2のブロックは、前記第2の画像において、前記第1のブロックの位置と同一の位置にあることを特徴とする画像符号化装置。
  2. 前記第3のブロックで用いられたイントラ予測処理が第1の処理である場合、前記制御手段は、前記第1の処理による前記第1のブロックの予測誤差と、前記第1の処理と異なる第2の処理による前記第1のブロックの予測誤差との比較に応じて、前記第1の処理及び前記第2の処理のいずれか一つを前記第1のブロックに行うことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記第3のブロックに行われたイントラ予測処理が前記第1の処理である場合、前記第1の処理による前記第1のブロックの予測誤差が、前記第2の処理による前記第1のブロックの予測誤差よりも小さいとき、前記制御手段は、前記第1の処理を前記第1のブロックに行うことを特徴とする請求項に記載の画像符号化装置。
  4. 前記第3のブロックに行われたイントラ予測処理が前記第1の処理である場合、前記第1の処理による前記第1のブロックの予測誤差が、前記第2の処理による前記第1のブロックの予測誤差よりも小さくないとき、前記制御手段は、前記第2の処理を前記第1のブロックに行うことを特徴とする請求項またはに記載の画像符号化装置。
  5. 前記第1のブロックは、所定の画素を含むことを特徴とする請求項1からのいずれか1項に記載の画像符号化装置。
JP2007026995A 2007-02-06 2007-02-06 画像符号化装置 Expired - Fee Related JP4971817B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007026995A JP4971817B2 (ja) 2007-02-06 2007-02-06 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007026995A JP4971817B2 (ja) 2007-02-06 2007-02-06 画像符号化装置

Publications (2)

Publication Number Publication Date
JP2008193501A JP2008193501A (ja) 2008-08-21
JP4971817B2 true JP4971817B2 (ja) 2012-07-11

Family

ID=39753142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007026995A Expired - Fee Related JP4971817B2 (ja) 2007-02-06 2007-02-06 画像符号化装置

Country Status (1)

Country Link
JP (1) JP4971817B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012042650A1 (ja) * 2010-09-30 2012-04-05 富士通株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、画像復号プログラム、及び画像符号化プログラム
JP5541364B2 (ja) * 2010-09-30 2014-07-09 富士通株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、画像復号プログラム、及び画像符号化プログラム
JPWO2013125171A1 (ja) * 2012-02-20 2015-07-30 日本電気株式会社 イントラ予測モード判定装置、イントラ予測モード判定方法、及びイントラ予測モード判定プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4216769B2 (ja) * 2004-06-02 2009-01-28 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2008193501A (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
JP5111127B2 (ja) 動画像符号化装置及びその制御方法、並びに、コンピュータプログラム
KR101473278B1 (ko) 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램
KR101952726B1 (ko) 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 복호 장치, 및 화상 예측 복호 방법
WO2010001916A1 (ja) 画像処理装置および方法
WO2010001917A1 (ja) 画像処理装置および方法
JP2010035137A (ja) 画像処理装置および方法、並びにプログラム
JP2007074725A (ja) 映像のイントラ予測符号化及び復号化方法、並びに装置
RU2602365C2 (ru) Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений
KR101615643B1 (ko) 픽처들의 압축
JP5195032B2 (ja) 符号化装置/復号化装置、符号化方法/復号化方法及びプログラム
JP4939273B2 (ja) 画像符号化装置及び画像符号化方法
KR100738075B1 (ko) 영상 부호화/복호화 장치 및 방법
JP2007013298A (ja) 画像符号化装置
JP2010183162A (ja) 動画像符号化装置
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP4971817B2 (ja) 画像符号化装置
JP4898415B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4958825B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP7332385B2 (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
JP2006295503A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JP2006295734A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JP2009049513A (ja) 動画像符号化装置及び動画像符号化方法
JP7396883B2 (ja) 符号化装置、復号装置、及びプログラム
JP5235818B2 (ja) 動画像符号化装置、動画像符号化装置の制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees