JP2012065176A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2012065176A
JP2012065176A JP2010208184A JP2010208184A JP2012065176A JP 2012065176 A JP2012065176 A JP 2012065176A JP 2010208184 A JP2010208184 A JP 2010208184A JP 2010208184 A JP2010208184 A JP 2010208184A JP 2012065176 A JP2012065176 A JP 2012065176A
Authority
JP
Japan
Prior art keywords
prediction
unit
prediction process
image
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010208184A
Other languages
English (en)
Other versions
JP5598199B2 (ja
Inventor
Yo So
楊 宋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010208184A priority Critical patent/JP5598199B2/ja
Publication of JP2012065176A publication Critical patent/JP2012065176A/ja
Application granted granted Critical
Publication of JP5598199B2 publication Critical patent/JP5598199B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ベスト予測モード選択のための演算量を削減した動画像符号化装置を提供する。
【解決手段】動画像符号化装置は、縮小画画像に基づいて動き予測を行なう縮小画動き予測部と、前記縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する予測処理選択部と、前記選択された1つの予測処理を縮小されていない画像に対して実行する予測部とを含む。
【選択図】図1

Description

本願開示は、一般に動画像符号化装置に関し、詳しくは予測符号化を用いた動画像符号化装置に関する。
動画データのフレーム間及びフレーム内の差分値に基づいてデータを圧縮し符号化する画像符号化技術が様々な分野で利用されている。ここでフレームとは、動画データを構成する時間軸上に並べられた一連の静止画像の各画像のことである。差分値に基づいてデータサイズを圧縮し符号化する画像符号化技術としてはH.264やMPEG(Moving Picture Experts Group)などがある。画像を圧縮符号化して動画データのデータサイズを小さくすることにより、限られた記憶容量を有する記憶媒体に、長時間で高画質の動画データを記憶させることができる。動画圧縮の機能を有する画像符号化装置は、例えばハンディカメラ等にも実装されている。
動画データを構成する各フレームは、それぞれが16×16画素のブロックである複数のマクロブロックからなる。フレーム間のインター予測処理においては、着目マクロブロックのフレームに隣接するフレームの画素情報に基づいて予測画素データを生成し、この予測画素データと着目マクロブロックの画素データとの差分を求めることにより画像予測を行なう。この際、予測誤差が最小になるように隣接フレームの画素情報を選択する動きベクトル検出処理が行なわれる。またフレーム内のイントラ予測処理においては、1つのフレーム内において着目マクロブロックに隣接する隣接画素情報に基づいて予測画素データを生成し、この予測画素データと着目マクロブロックの画素データとの差分を求めることにより画像予測を行なう。更に、フレーム間のインター予測の特別なケースとしてスキップモードが存在する。このスキップモードでは、予測誤差が最小になる動きベクトルを検出するのではなく、着目ブロックの周囲のブロックの情報から動きベクトルを予測し、この予測動きベクトルが示す位置にある隣接フレーム内のブロックが着目ブロックに等しいとして扱う。符号化後の情報には、着目ブロックがスキップモードであることを示す情報のみが含まれ、誤差の符号化情報や動きベクトルの情報は含まれない。
より詳細には、インター予測処理には、16×16画素、16×8画素、8×16画素、8×8画素、8×4画素、4×8画素、及び4×4画素の7種類の異なる大きさのブロックを用いる7種類の予測モードが規定されている。またイントラ予測処理には、合計で22種類の予測モードが規定されている。具体的には、4×4画素のブロックに対して異なる予測方向を用いた9種類の予測モード、8×8画素のブロックに対して異なる予測方向を用いた9種類の予測モード、16×16画素のブロックに対して異なる予測方向を用いた4種類の予測モードが規定されている。またPピクチャに対してスキップモードが規定されている。
H.264では、圧縮率を向上するために、マクロブロック毎に最適な予測モードを適用する。具体的には、上記の全ての予測モードのコストを求め、コストが一番小さい予測モードを、着目マクロブロックのベスト予測モードとして用いる。最初に、例えばインター予測処理の7種類の各予測モードのコストを計算し、ベストインター予測モードを決定する。次に、例えばイントラ予測処理の22種類の各予測モードのコストを計算し、ベストイントラ予測モードを判定する。最後に、例えばスキップモードのコストを計算する。着目マクロブロックの総合的なベスト予測モードとしては、ベストインター予測モードのコスト、ベストイントラ予測モードのコスト、及びスキップモードのコストを比較し、コストが最小の予測モードを選択する。
動き予測はインター予測のコア技術である。動き予測においては、着目マクロブロックと隣接フレームの探索範囲内にあるマクロブロックとの画素値の差分絶対値和等をコストとして計算すると共に、これらマクロブロック間の位置差分を動きベクトルとして計算する。コストが最小となる探索範囲内にあるマクロブロックの位置を求め、この位置に対応する動きベクトルをベスト動きベクトルとする。1つのマクロブロックには256画素(16×16)が含まれるので、1つの探索位置に対して少なくとも256回の差分計算が実行される。M×N画素の探索範囲に対し、M×N×256回の差分計算を行うので、莫大な演算量となる。
動き予測における演算量を削減するために、動き予測の計算を階層的に実行する階層動き予測技術が用いられる。階層動き予測の処理プロセスは、縮小画動き予測処理と同倍画動き予測処理との2つの処理を含む。縮小画動き予測処理では、着目マクロブロックと隣接ピクチャとを共に1/Pのサイズに縮小する。サイズがM×N/Pの探索範囲において、初期動きベクトルPME_MVと初期差分値コストPME_COSTとを求める。次の同倍画動き予測処理では、縮小していないマクロブロックと隣接ピクチャとを用い、初期動きベクトルPME_MVを探索中心として設定した小さい探索範囲R×S(R<<M、S<<N)内で、最終の動きベクトルと差分コストとを求める。縮小画動き予測処理における探索では、マクロブロックと探索範囲とを共に1/Pに縮小してあるので、演算量は従来の1/Pになる。同倍画動き予測処理では、縮小していない画像を用いるが、探索範囲が大幅に小さくなっているので、演算量が大幅に少なくなる。この階層動き予測技術は、高画質を維持しながらも演算量を大幅に削減できるので、高速な動き予測方法としてよく使われる。
しかしながら、階層動き予測技術においても、全ての予測モードのコストを求め、コストが最小の予測モードをマクロブロックのベスト予測モードとして選択している。合計で30(=7+22+1)種類の予測モードの計算には、莫大な量の演算が実行されることになり、演算のための回路面積と消費電力とが肥大化する。
Joint Video Team of ITU-Tand ISO/IEC JTC 1, "Draft ITU-T Recommendation and Final Draft International Standardof Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC),"document JVT-G050r1, May 2003; technical corrigendum 1 documents JVT-K050r1(non-integrated form) and JVT-K051r1 (integrated form), March 2004; andFidelity Range Extensions documents JVT-L047 (non-integrated form) and JVT-L050(integrated form), July 2004
以上を鑑みると、ベスト予測モード選択のための演算量を削減した動画像符号化装置が望まれる。
動画像符号化装置は、縮小画画像に基づいて動き予測を行なう縮小画動き予測部と、前記縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する予測処理選択部と、前記選択された1つの予測処理を縮小されていない画像に対して実行する予測部とを含む。
少なくとも1つの実施例によれば、縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択するので、ベスト予測モード選択のための演算量を削減することができる。
動画像符号化装置の構成の一例を示すブロック図である。 スキップモードを説明するための図である。 縮小画動き予測、予測処理選択動作、及びマクロブロックの予測処理動作の流れを示すフローチャートである。 差分絶対値と初期ベストコストとの組み合わせに対して何れのモードが選択されるのかを視覚的に表わした図である。 各閾値と動画圧縮率との関係を示す図である。 図1の動画像符号化装置により得られる画質を従来技術との比較において示す図である。 図1の動画像符号化装置を適用した動画像符号化システムの構成の一例を示す図である。
以下に、本発明の実施例を添付の図面を用いて詳細に説明する。
図1は、動画像符号化装置の構成の一例を示すブロック図である。図1において、各ボックスで示される各機能ブロックと他の機能ブロックとの境界は、基本的には機能的な境界を示すものであり、物理的な位置の分離、電気的な信号の分離、制御論理的な分離等に対応するとは限らない。ハードウェアの場合、各機能ブロックは、他のブロックと物理的にある程度分離された1つのハードウェアモジュールであってもよいし、或いは他のブロックと物理的に一体となったハードウェアモジュール中の1つの機能を示したものであってもよい。ソフトウェアの場合、各機能ブロックは、他のブロックと論理的にある程度分離された1つのソフトウェアモジュールであってもよいし、或いは他のブロックと論理的に一体となったソフトモジュール中の1つの機能を示したものであってもよい。
図1に示す動画像符号化装置1は、入力された動画データを圧縮し符号化する。動画像符号化装置1は、縮小画動き予測部2、予測処理選択部3、スキップモード予測部4、インター予測部5、イントラ予測部6、及び選択部7を含む。動画像符号化装置1は更に、DCT変換部8、量子化部9、可変長符号部10、逆量子化部11、逆DCT変換部12、フィルタ部13、減算部14、及び加算部15を有する。ここでDCTとは離散コサイン変換(Discrete Cosine Transform)であり、離散信号を周波数領域の信号に変換する処理である。
画像符号化装置1の入力は、原画像データ20及び参照画像データ21である。動画像符号化装置1の出力は符号化したストリーム23及びローカルデコード画像22である。ローカルデコード画像22は、あるフレームの符号化処理により生成された符号を復号化することにより再構成した画像であり、次のフレームを符号化処理する際に参照画像として用いられる。
縮小画動き予測部2は、縮小画画像に基づいて動き予測を行なう。詳しくは、縮小画動き予測部2は、まず、原画の入力画像20と参照画像21とをサイズ縮小する縮小処理を実行する。この縮小処理は、元の画像の画素を所定数毎に間引くことにより実行してよいし、また空間フィルタや時間フィルタをかけた後に画素を間引くことにより実行してもよい。縮小処理の縮小倍数は特に限定されない。また横方向の縮小率と縦方向の縮小率とは同一であってもよいし、異なっていてもよい。次に、縮小画動き予測部2は、縮小後の予測対象ブロック(縮小後の着目矩形領域)に対し、その前方、後方、或いはその両方のフレームの縮小後参照画像を用いて動き予測を行なう。具体的には、縮小画動き予測部2は、動きベクトルが示す位置にある参照画像中の画像ブロックと予測対象ブロックとの間の誤差(例えば画素毎の差分の絶対値和)を複数の動きベクトルに対して求め、この誤差が最小となる最適な動きベクトルを検出する。この最適な動きベクトル(初期ベスト動きベクトル)に対応する参照画像中の位置の画像ブロックと予測対象ブロックとの誤差(例えば画素毎の差分の絶対値和)が初期ベストコストである。このようにして、縮小画動き予測部2からは、初期ベスト動きベクトル及び初期ベストコストが出力される。
予測処理選択部3は、縮小画動き予測部2による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する。具体的には、予測処理選択部3は、縮小画動き予測部2による動き予測により得られた初期ベスト動きベクトル及び初期ベストコストに基づいて、予測対象ブロックに適用する1つの予測処理を選択する。予測処理選択部3は、例えばスイッチSW1を切り換えることにより、スキップモード予測部4、インター予測部5、及びイントラ予測部6のうちの選択された予測処理に対応する予測部を動作させる。この予測部が、選択された1つの予測処理を縮小されていない画像に対して実行する。
予測処理選択部3によりスキップモード予測処理が選択されると、スキップモード予測部4が、入力画像20と参照画像21とに基づいて、スキップモードでの予測処理を実行する。スキップモードでは、予測誤差が最小になる動きベクトルを検出するのではなく、着目ブロックの周囲のブロックの情報から動きベクトルを予測し、この予測動きベクトルが示す位置にある隣接フレーム内のブロックが着目ブロックに等しいとして扱う。符号化後の情報には、着目ブロックがスキップモードであることを示す情報のみが含まれ、誤差の符号化情報や動きベクトルの情報は含まれない。一般にスキップモードは、画像中で変化がない静止部分や、纏まった領域が一様に運動する単純な動きを示す部分等に適用される。
図2は、スキップモードを説明するための図である。符号化対象フレームNにおいて、着目マクロブロック31が予測対象ブロック即ち符号化対象ブロックである。この着目マクロブロック31の予測動きベクトル(MVP)35は、基本的に、着目マクロブロック31の左隣接のマクロブロック32、上隣接のマクロブロック33、及び右上隣接のマクロブロック34のそれぞれの動きベクトルから求められる。この予測動きベクトルを求める方法はH.264に規定されている。スキップモードでは、上記求めた予測動きベクトルが示す画面位置にある1つ前のフレームN−1のマクロブロック36が、フレームNの着目マクロブロック31に等しいものとして扱う。即ち、復号化側では、当該マクロブロック31がスキップモードであることを検出すると、予測動きベクトルが示す直前のフレームN−1のマクロブロック36をコピーして当該マクロブロック31とする。
図1に戻り、予測処理選択部2によりインター予測処理が選択されると、インター予測部5が、入力画像20と参照画像21とに基づいて、複数のインター予測モードのうちから最適なインター予測モードを選択して実行する。これにより、入力画像20の予測対象ブロックに対し、その前方、後方、或いはその両方のフレームの参照画像21から最も類似したブロックが抜き出され又は生成されて予測画像となる。具体的には、インター予測部5は、動きベクトルが示す位置にある参照画像21中の画像ブロックと予測対象ブロックとの間の誤差(例えば画素毎の差分の絶対値和)を複数の動きベクトルに対して求め、この誤差が最小となる最適な動きベクトルを検出する。この最適な動きベクトルに対応する参照画像21中の位置の画像ブロックと予測対象ブロックとの誤差(例えば画素毎の差分の絶対値和)がベストコストである。インター予測部5は、インター予測処理の複数の予測モードの各々に対して最適な動きベクトルとベストコストとを求め、ベストコストが最小となる予測モードを選択する。この選択された予測モードにおける最適な動きベクトルと予測画像とが、インター予測部5から出力される。なおインター予測部5は、最適な動きベクトルを探索する際に、参照画像21中の探索領域を、縮小画動き予測部2が求めた初期ベスト動きベクトルに応じた位置に設定してよい。これにより探索領域の大きさを狭め、効率的な動きベクトル探索を実現し、演算量を削減することができる。
また予測処理選択部2によりイントラ予測処理が選択されると、イントラ予測部6が、入力画像20と符号化済みの隣接ブロックの画素27とに基づいて、複数のイントラ予測モードのうちから最適なイントラ予測モードを選択して実行する。具体的には、イントラ予測部6は、入力画像20の予測対象ブロックに対し、それに隣接するブロックの画素27の値に基づいて予測画像を生成する。この際、異なるブロックサイズ及び異なる予測方向に対応して複数種類のイントラ予測モードが存在する。イントラ予測部6は、複数の予測モードの各々に対して予測画像を生成し、生成した予測画像と予測対象ブロックとの誤差(例えば画素毎の差分の絶対値和)が最小となる予測モードを選択する。この選択された予測モードにおける予測画像が、イントラ予測部6から出力される。
選択部7は、予測処理選択部3による選択結果に応じてスイッチSW2を切り換えることにより、スキップモード予測部4、インター予測部5、及びイントラ予測部6のうち選択された1つの予測処理の予測部の出力を受け取り、予測画像24を出力する。この予測画像24は、スキップ予測処理、インター予測処理、又はイントラ予測処理において隣接フレームのマクロブロックあるいは同一フレームの隣接マクロブロックに基づいて生成された画像である。なおスキップモードが選択された場合には、予測画像24を出力することなく、可変長符号部10が生成するストリーム23に当該予測対象ブロックがスキップモードであることを示す情報を含める等の適切な処理を実行するように動画像符号化装置1が動作してもよい。
差分器14は、入力画像20とその予測結果である予測画像24との差分を計算し、その差分値を予測誤差25として出力する。DCT変換部8は、離散コサイン変換を実行することにより、予測誤差25を周波数領域のデータであるDCT係数に変換する。量子化部9は、DCT係数を量子化ステップで除算して整数値に丸める処理を実行することにより、DCT係数を量子化する。可変長符号部10は、量子化後のDCT係数値のうち、出現頻度の高い情報を短い符号で表現し、出現頻度の低い情報を長い符号で表現することにより、全体として出力ビット数を減らす処理を行い、符号化データ23を出力する。
逆量子化部11は、量子化部9により量子化された予測誤差を逆量子化する。逆量子化した予測誤差は、逆DCT変換部12により逆変換され、DCT係数値に変換される前の予測誤差26が復元される。加算部15はスキップモード予測部4、インター予測部5、又はイントラ予測部6により生成された予測画像24と復元された予測誤差26とを加算し、画像27を再構成する。再構成された画像27は、フィルタ部13に入力される。フィルタ部13は、デブロッキング・フィルタとも呼ばれ、再構成画像27のブロック境界に現れるブロックひずみを減少させる処理を行ない、処理後の画像をローカルデコード画像22として出力する。ローカルデコード画像22は、外部のメモリに格納され、次のフレームを処理する時にスキップモード予測部4又はインター予測部5によるフレーム間予測処理のための参照画像として用いられる。
図3は、縮小画動き予測、予測処理選択動作、及びマクロブロックの予測処理動作の流れを示すフローチャートである。ステップS1で、縮小画動き予測部2が、縮小画を用いて動き予測を実行する。この動き予測の結果として、初期ベスト動きベクトルPME_MVと初期ベストコストPME_COSTとが求められる。
次のステップS2及びステップS3で、予測処理選択部3が、スキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択する。具体的には、予測処理選択部3は、まず、着目マクロブロックに隣接するマクロブロックの動きベクトルから予測動きベクトルMVPを求める。これは、図2を用いて説明した予測動きベクトルMVPを求める処理と同様である。予測処理選択部3は、次に、予測動きベクトルMVPと初期ベスト動きベクトルPME_MVとの差分絶対値PME_MVD(=|PME_MV−MVP|)を求める。予測処理選択部3は、更に、前記差分絶対値PME_MVDと複数の第1の閾値とを比較するとともに初期ベストコストPME_COSTと複数の第2の閾値とを比較する比較処理を実行し、前記比較処理の結果に基づいて1つの予測処理を選択する。
具体的には、ステップS2で、差分絶対値PME_MVDと初期ベストコストPME_COSTとが以下の式(1)の条件1を満たすか否かを判断する。
PME_MVD≦α1 & PME_COST≦β1 ・・・(1)
ここでα1及びβ1は、適宜設定された閾値であり、「&」はAND論理を示す。上記の式(1)の条件1を満たす場合には、ベクトルの差分絶対値が十分に小さく、且つ、初期ベストコストが十分に小さい。ベクトルの差分絶対値が十分に小さいということは、初期ベスト動きベクトルと周囲の隣接ブロックから求めた予測動きベクトルとの差が十分に小さいということである。即ち、当該マクロブロックが、周囲のマクロブロックと共に纏まった領域として一様に運動又は静止している可能性が高いことになる。この場合、スキップモードが適している状況である可能性がある。また、初期ベスト動きベクトルと予測動きベクトルとの差が十分に小さいということは更に、予測動きベクトルMVPが十分信頼できるものであり、予測動きベクトルMVPに基づいて予測するスキップモードが適していることになる。また更に、初期ベストコストが十分に小さいので、着目ブロックが参照画像に等しいそのままの画像であるとして扱うスキップモードが適していることになる。従って、ベクトルの差分絶対値が十分に小さく、且つ、初期ベストコストが十分に小さい場合には、スキップモードを予測モードとして選択する。
このようにステップS2で式(1)の条件1を満たす場合には、スキップモードを選択するとして、ステップS4に進む。ステップS4では、スキップモードでのベストコストを求める。即ち、スキップモードでの予測処理を実行する。その後ステップS8で、着目マクロブロックのベスト・モードの結果(この場合はスキップモードの結果)を予測結果として出力する。
ステップS2でスキップモードが選択されなかった場合、次にステップS3で、差分絶対値PME_MVDと初期ベストコストPME_COSTとが以下の式(2)の条件2を満たすか否かを判断する。
(PME_MVD≦α2 & PME_COST≦β3) OR (PME_COST≦β2 & PME_MVD≦α3)
・・・(2)
ここでα2、α3、β2、及びβ3は、適宜設定された閾値であり、「&」はAND論理を示し、「OR」はOR論理を示す。α1<α2<α3であり、β1<β2<β3である。上記の式(2)の条件2を満たす場合には、ベクトルの差分絶対値が小さく(≦α2)且つ初期ベストコストがそれ程大きくはない(≦β3)、又は、初期ベストコストが小さく(≦β2)且つベクトルの差分絶対値がそれ程大きくはない(≦α3)。
ベクトルの差分絶対値が小さい(≦α2)ということは、初期ベスト動きベクトルと周囲の隣接ブロックから求めた予測動きベクトルとの差が小さいということである。即ち、当該マクロブロックが、周囲のマクロブロックと共に纏まった領域として一様に運動又は静止している可能性が高いことになる。この場合、初期ベストコストがα1よりも大きい(ステップS2でスキップモードが選択されていない)ので、スキップモードのように着目ブロックが参照画像に等しいそのままの画像であるとして扱うことはできない。しかしながら初期ベストコストがそれ程大きくはない(≦β3)ので、動き予測が十分に信頼できるものであり、着目ブロックと参照画像との誤差を符号化するインター予測が適していると判断する。
また初期ベストコストが小さい(≦β2)ということは、初期ベスト動きベクトルに基づく動き予測が信頼できるということである。この場合、ベクトルの差分絶対値がα1よりも大きい(ステップS2でスキップモードが選択されていない)ので、予測動きベクトルMVPにそれ程信頼性がなく、スキップモードのように予測動きベクトルMVPに基づいて予測することは適切でない。しかしながらベクトルの差分絶対値がそれ程大きくはない(≦α3)ので、初期ベストコストが偶然に低い状況なのではなく、検出した初期ベスト動きベクトルが十分に信頼できるものであると考えられる。従って、探索範囲から最適な動きベクトルを検出して予測をするインター予測が適していると判断する。
このようにステップS3で式(2)の条件2を満たす場合には、インター予測処理を選択するとして、ステップS6に進む。ステップS6では、縮小されていない入力画像及び参照画像を用いて動き予測処理を実行する。次にステップS7で、複数のインター予測モードのうちのベストコストを求める。即ち、インター予測のうちのベストな予測モードを決定する。その後ステップS8で、着目マクロブロックのベスト・モードの結果(この場合はベストインター予測モードの結果)を予測結果として出力する。
ステップS3で式(2)の条件2を満たさない場合には、着目マクロブロックに対しては動き予測が適していないと判断して、イントラ予測処理を選択する。この場合、ステップS5で、複数のイントラ予測モードのうちのベストコストを求める。即ち、イントラ予測のうちのベストな予測モードを決定する。その後ステップS8で、着目マクロブロックのベスト・モードの結果(この場合はベストイントラ予測モードの結果)を予測結果として出力する。
図4は、差分絶対値と初期ベストコストとの組み合わせに対して何れのモードが選択されるのかを視覚的に表わした図である。図4には、横軸に差分絶対値PME_MVDをとり縦軸に初期ベストコストPME_COSTをとった平面が示されている。この平面上において、領域40の内部の点に対応する差分絶対値と初期ベストコストとの組み合わせに対しては、スキップモードが選択される。また領域40の外であり且つ領域41の内部の点に対応する差分絶対値と初期ベストコストとの組み合わせに対しては、インター予測モードが選択される。更に領域41の外の点に対応する差分絶対値と初期ベストコストとの組み合わせに対しては、イントラ予測モードが選択される。図4に示される例のように、例えば、α1を2、α2を6、α3を16、β1をQP、β2を4×QP、β3を8×QPに設定してよい。ここでα1乃至α3の単位は画素であってよい。この例では、β1乃至β3は、動画圧縮率QPの関数となっている。同様に、α1乃至α3についても、動画圧縮率QPの関数としてよい。
図5は、各閾値と動画圧縮率との関係を示す図である。図5の横軸は動画圧縮率QPを示し、縦軸は閾値α1乃至α3及びβ1乃至β3の値を示す。H.264では直交変換デ得られた係数に対して、量子ステップで除算した結果を整数値に丸める量子化処理が行なわれる。この量子化ステップの大きさを調整することにより、符号化したビット数を増減することができる。量子化ステップが小さい場合は、量子化誤差が小さく、復号画像の画質が高くなるが、符号化データの圧縮率が低い。逆に、量子化ステップが大きい場合は、量子化誤差が大きく、復号画像の画質が低いが、符号化データの圧縮率が高い。H.264では、量子化ステップの値は量子化パラメータQP(Quantization Parameter)から導出する。量子化パラメータQPが大きくなると、量子化ステップが大きくなり、量子化誤差が大きくなり、動画圧縮率が高くなる。図5の横軸は動画圧縮率として量子化パラメータQPの値をとっている。
一般に、スキップモードが最も圧縮率が高く、インター予測処理が次に圧縮率が高く、イントラ予測処理が最も圧縮率が低い。従って、動画圧縮率QPが大きい場合には、イントラ予測処理よりも、インター予測処理を選択するのが好ましく、更に、インター予測処理よりもスキップモード予測処理を選択するのが好ましい。従って、図5に示すように、動画圧縮率QPが大きくなるにつれて、閾値α2、α3、β2、β3が大きくなるように設定し、イントラ予測処理を選択するよりもインター予測処理を選択する割合が増加するように設定する。また動画圧縮率QPが大きくなるにつれて、閾値α1及びβ1が大きくなるように設定し、インター予測処理を選択するよりもスキップモードを選択する割合が増加するように設定する。このように、量子化部による量子化の誤差に応じて各閾値を変化させることで、適切な符号化を実現することができる。
図6は、図1の動画像符号化装置により得られる画質を従来技術との比較において示す図である。入力動画像シーケンスとしてHDTV_Parkjoyを用いた場合に、各復号量ビットレート(Mbps)に対して、復号画像の画質PSNR(ピーク信号対雑音比)がデシベル単位で示されている。特性曲線61が、図3に示す動画像符号化方法により得られた画像の画質を示し、特性曲線62が、全予測モードを計算してベスト予測モードを特定する従来の動画像符号化方法により得られた画像の画質を示す。図6に示されるように、図3の動画像符号化方法を用いた場合、同一の復号量ビットレートにおいて従来の動画像符号化方法に比較して約0.2dB程度しか画質が低下しておらず、実質的には略同程度の画質が得られていると言える。
図7は、図1の動画像符号化装置を適用した動画像処理システムの構成の一例を示す図である。図7に示す動画像処理システム71は、例えばデジタルカメラ或いはビデオレコーダであり、レンズ72、CCD又はCMOSのセンサ73、CPU又はDSPであるマイクロプロセッサ74、及びH.264に準拠したコーデック75を含む。動画像処理システム71は、内部メモリとして内蔵されるか或いは外部メモリとして取り外し可能なメモリ76と、外部メモリとして取り外し可能なメディア77とを備えている。
撮像対象からの入力光は、レンズ72を介してセンサ73に入射される。センサ73は画像を1枚ずつ生成し、生成された画像がコーデック75に順次入力される。コーデック75は、図1に示した動画像符号化装置を含むものであり、図3に示す動画像符号化方法により、順次入力される画像からなる動画像データを符号化して圧縮する。コーデック75が生成した符号化後のストリームは、外部メディア77に保存される。する。CPU或いはDSPであるマイクロプロセッサ74は、動画像処理システム71の全体の動作を制御する。コーデック75は、動画を圧縮する際にメモリ76をバッファメモリとして使用する。
以上、本発明を実施例に基づいて説明したが、本発明は上記実施例に限定されるものではなく、特許請求の範囲に記載の範囲内で様々な変形が可能である。
なお本願発明は以下の内容を含むものである。
(付記1)
縮小画画像に基づいて動き予測を行なう縮小画動き予測部と、
前記縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する予測処理選択部と、
前記選択された1つの予測処理を縮小されていない画像に対して実行する予測部と
を含むことを特徴とする動画像符号化装置。
(付記2)
前記予測部は、
前記予測処理選択部によりスキップモード予測処理が選択されると、スキップモードでの予測処理を実行するスキップ予測部と、
前記予測処理選択部によりインター予測処理が選択されると、複数のインター予測モードのうちから最適なインター予測モードを選択して実行するインター予測部と、
前記予測処理選択部によりイントラ予測処理が選択されると、複数のイントラ予測モードのうちから最適なイントラ予測モードを選択して実行するイントラ予測部と
を含むことを特徴とする付記1記載の動画像符号化装置。
(付記3)
前記予測処理選択部は、前記縮小画動き予測部による動き予測により得られた初期動きベクトル及び初期コストに基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択することを特徴とする付記1又は2記載の動画像符号化装置。
(付記4)
前記予測処理選択部は、着目矩形画像領域に隣接する矩形画像領域の動きベクトルから予測される予測動きベクトルと前記初期動きベクトルとの差分絶対値を求め、前記差分絶対値と複数の第1の閾値とを比較するとともに前記初期コストと複数の第2の閾値とを比較する比較処理を実行し、前記比較処理の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択することを特徴とする付記3記載の動画像符号化装置。
(付記5)
前記予測部が前記1つの予測処理を実行することにより得られた画像の予測誤差を係数に変換する変換部と、
前記変換部により得られた前記係数を量子化する量子化部と、
前記量子化部により得られた量子化後の前記係数を符号化する符号化部と
を更に含み、前記量子化部による量子化の誤差に応じて前記複数の第1の閾値及び前記複数の第2の閾値を変化させることを特徴とする付記4記載の動画像符号化装置。
(付記6)
縮小画画像に基づいて動き予測を行ない、
前記動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択し、
前記選択された1つの予測処理を縮小されていない画像に対して実行する
各段階を含むことを特徴とする動画像符号化方法。
(付記7)
前記選択された1つの予測処理を縮小されていない画像に対して実行する段階は、
スキップモード予測処理が選択されると、スキップモードでの予測処理を実行し、
インター予測処理が選択されると、複数のインター予測モードのうちから最適なインター予測モードを選択して実行し、
イントラ予測処理が選択されると、複数のイントラ予測モードのうちから最適なイントラ予測モードを選択して実行する
各段階を含むことを特徴とする付記6記載の動画像符号化方法。
(付記8)
前記1つの予測処理を選択する段階は、前記動き予測により得られた初期動きベクトル及び初期コストに基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択することを特徴とする付記6又はや記載の動画像符号化方法。
(付記9)
前記1つの予測処理を選択する段階は、
着目矩形画像領域に隣接する矩形画像領域の動きベクトルから予測される予測動きベクトルと前記初期動きベクトルとの差分絶対値を求め、
前記差分絶対値と複数の第1の閾値とを比較するとともに前記初期コストと複数の第2の閾値とを比較する比較処理を実行し、
前記比較処理の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択する
各段階を含むことを特徴とする付記8記載の動画像符号化方法。
(付記10)
前記1つの予測処理を実行することにより得られた画像の予測誤差を係数に変換し、
前記係数を量子化し、
量子化後の前記係数を符号化する
各段階を更に含み、前記量子化の誤差に応じて前記複数の第1の閾値及び前記複数の第2の閾値を変化させることを特徴とする付記9記載の動画像符号化装置。
(付記11)
動画像を撮像する撮像素子と、
前記動画像を符号化する符号化器と
を含み、前記符号化器は、
前記動画像を縮小して得られる縮小画画像に基づいて動き予測を行なう縮小画動き予測部と、
前記縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する予測処理選択部と、
前記選択された1つの予測処理を縮小されていない画像に対して実行する予測部と
を含むことを特徴とする動画像処理システム。
1 動画像符号化装置
2 縮小画動き予測部
3 予測処理選択部
4 スキップモード予測部
5 インター予測部
6 イントラ予測部
7 選択部
8 DCT変換部
9 量子化部
10 可変長符号部
11 逆量子化部
12 逆DCT変換部
13 フィルタ部
14 減算部
15 加算部

Claims (5)

  1. 縮小画画像に基づいて動き予測を行なう縮小画動き予測部と、
    前記縮小画動き予測部による動き予測の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つの予測処理を選択する予測処理選択部と、
    前記選択された1つの予測処理を縮小されていない画像に対して実行する予測部と
    を含むことを特徴とする動画像符号化装置。
  2. 前記予測部は、
    前記予測処理選択部によりスキップモード予測処理が選択されると、スキップモードでの予測処理を実行するスキップ予測部と、
    前記予測処理選択部によりインター予測処理が選択されると、複数のインター予測モードのうちから最適なインター予測モードを選択して実行するインター予測部と、
    前記予測処理選択部によりイントラ予測処理が選択されると、複数のイントラ予測モードのうちから最適なイントラ予測モードを選択して実行するイントラ予測部と
    を含むことを特徴とする請求項1記載の動画像符号化装置。
  3. 前記予測処理選択部は、前記縮小画動き予測部による動き予測により得られた初期動きベクトル及び初期コストに基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択することを特徴とする請求項1又は2記載の動画像符号化装置。
  4. 前記予測処理選択部は、着目矩形画像領域に隣接する矩形画像領域の動きベクトルから予測される予測動きベクトルと前記初期動きベクトルとの差分絶対値を求め、前記差分絶対値と複数の第1の閾値とを比較するとともに前記初期コストと複数の第2の閾値とを比較する比較処理を実行し、前記比較処理の結果に基づいてスキップモード予測処理、インター予測処理、及びイントラ予測処理の何れか1つを選択することを特徴とする請求項3記載の動画像符号化装置。
  5. 前記予測部が前記1つの予測処理を実行することにより得られた画像の予測誤差を係数に変換する変換部と、
    前記変換部により得られた前記係数を量子化する量子化部と、
    前記量子化部により得られた量子化後の前記係数を符号化する符号化部と
    を更に含み、前記量子化部による量子化の誤差に応じて前記複数の第1の閾値及び前記複数の第2の閾値を変化させることを特徴とする請求項4記載の動画像符号化装置。
JP2010208184A 2010-09-16 2010-09-16 動画像符号化装置 Expired - Fee Related JP5598199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010208184A JP5598199B2 (ja) 2010-09-16 2010-09-16 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010208184A JP5598199B2 (ja) 2010-09-16 2010-09-16 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2012065176A true JP2012065176A (ja) 2012-03-29
JP5598199B2 JP5598199B2 (ja) 2014-10-01

Family

ID=46060427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010208184A Expired - Fee Related JP5598199B2 (ja) 2010-09-16 2010-09-16 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP5598199B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9641850B2 (en) 2013-05-13 2017-05-02 Kabushiki Kaisha Toshiba Video compression device
JP2017513437A (ja) * 2014-03-28 2017-05-25 ソニー株式会社 データ符号化及び復号化
JP2017201777A (ja) * 2016-03-15 2017-11-09 アクシス アーベー ビデオストリームをエンコードするための方法及びシステム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1042300A (ja) * 1996-07-25 1998-02-13 Sanyo Electric Co Ltd 動きベクトル検出装置
JPH11298904A (ja) * 1998-04-13 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、および映像符号化プログラムを記録した記録媒体
JP2000261809A (ja) * 1999-03-05 2000-09-22 Kdd Corp 画像特徴に応じた画像符号化装置
JP2004179906A (ja) * 2002-11-26 2004-06-24 Matsushita Electric Ind Co Ltd 動きベクトル検出装置および動きベクトル検出方法
JP2006238046A (ja) * 2005-02-24 2006-09-07 Sanyo Electric Co Ltd 動きベクトル検出装置
JP2008301270A (ja) * 2007-05-31 2008-12-11 Canon Inc 動画像符号化装置及び動画像符号化方法
JP2009159541A (ja) * 2007-12-27 2009-07-16 Toshiba Corp 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2010074496A (ja) * 2008-09-18 2010-04-02 Fujitsu Ltd 動きベクトル検出処理装置本発明は、動画像情報をビデオストリームに符号化する動画像符号化処理における、演算量を削減した動きベクトル検出処理装置に関する。
JP2010166275A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1042300A (ja) * 1996-07-25 1998-02-13 Sanyo Electric Co Ltd 動きベクトル検出装置
JPH11298904A (ja) * 1998-04-13 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像符号化装置、および映像符号化プログラムを記録した記録媒体
JP2000261809A (ja) * 1999-03-05 2000-09-22 Kdd Corp 画像特徴に応じた画像符号化装置
JP2004179906A (ja) * 2002-11-26 2004-06-24 Matsushita Electric Ind Co Ltd 動きベクトル検出装置および動きベクトル検出方法
JP2006238046A (ja) * 2005-02-24 2006-09-07 Sanyo Electric Co Ltd 動きベクトル検出装置
JP2008301270A (ja) * 2007-05-31 2008-12-11 Canon Inc 動画像符号化装置及び動画像符号化方法
JP2009159541A (ja) * 2007-12-27 2009-07-16 Toshiba Corp 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2010074496A (ja) * 2008-09-18 2010-04-02 Fujitsu Ltd 動きベクトル検出処理装置本発明は、動画像情報をビデオストリームに符号化する動画像符号化処理における、演算量を削減した動きベクトル検出処理装置に関する。
JP2010166275A (ja) * 2009-01-15 2010-07-29 Canon Inc 画像符号化装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9641850B2 (en) 2013-05-13 2017-05-02 Kabushiki Kaisha Toshiba Video compression device
JP2017513437A (ja) * 2014-03-28 2017-05-25 ソニー株式会社 データ符号化及び復号化
JP2017201777A (ja) * 2016-03-15 2017-11-09 アクシス アーベー ビデオストリームをエンコードするための方法及びシステム

Also Published As

Publication number Publication date
JP5598199B2 (ja) 2014-10-01

Similar Documents

Publication Publication Date Title
US9930355B2 (en) Optimized image decoding device and method for a predictive encoded BIT stream
JP5289440B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP5413191B2 (ja) 動画像符号化方法及び装置並びに動画像復号装置
RU2680194C1 (ru) Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений
KR20170059040A (ko) 비디오 부호화기의 최적 모드 결정 장치 및 최적 모드 결정을 이용한 비디오 부호화 방법
WO2011121894A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2012098845A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
KR102555224B1 (ko) 초고해상도 영상을 부호화하는 장치 및 방법, 그리고 복호화 장치 및 방법
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
US8767830B2 (en) Neighbor management module for use in video encoding and methods for use therewith
JP5598199B2 (ja) 動画像符号化装置
JP5800077B2 (ja) 動画像復号方法
JP4561701B2 (ja) 動画像符号化装置
KR20110067648A (ko) 영상 부호화/복호화 방법 및 이를 수행하는 장치
KR20180041833A (ko) 화면 내 예측에 대한 참조 모드 리스트를 사용하는 비디오 코딩 방법 및 장치
JP5946980B1 (ja) 画像復号化方法
JP6181242B2 (ja) 画像復号化方法
JP5951915B2 (ja) 画像復号化方法
JP5911982B2 (ja) 画像復号化方法
KR102183366B1 (ko) 부호화 모드 결정 방법 및 그 장치
JP5790722B2 (ja) 動画像符号化方法
KR20170126817A (ko) 고속 영상 부호화 방법 및 장치
JP2012120086A (ja) 動画像符号化装置
JP2015035822A (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140318

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140728

R150 Certificate of patent or registration of utility model

Ref document number: 5598199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees