JP4519676B2 - 動き検出方法および動画像符号化方法 - Google Patents

動き検出方法および動画像符号化方法 Download PDF

Info

Publication number
JP4519676B2
JP4519676B2 JP2005043017A JP2005043017A JP4519676B2 JP 4519676 B2 JP4519676 B2 JP 4519676B2 JP 2005043017 A JP2005043017 A JP 2005043017A JP 2005043017 A JP2005043017 A JP 2005043017A JP 4519676 B2 JP4519676 B2 JP 4519676B2
Authority
JP
Japan
Prior art keywords
reference block
search center
error
pixels
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005043017A
Other languages
English (en)
Other versions
JP2005278156A (ja
Inventor
眞也 角野
陽司 柴原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2005043017A priority Critical patent/JP4519676B2/ja
Publication of JP2005278156A publication Critical patent/JP2005278156A/ja
Application granted granted Critical
Publication of JP4519676B2 publication Critical patent/JP4519676B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ピクチャ間の相関を利用して効率良く動画像信号を圧縮する画像符号化方法等で用いられる、動き検出方法に関する。
近年、音声,画像,その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア,つまり新聞,雑誌,テレビ,ラジオ,電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbit/sの伝送速度を持つサービス総合ディジタル網(ISDN : Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU-T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG-1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG-1は、動画像信号を1.5Mbit/sまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG-1規格では対象とする品質を伝送速度が主として約1.5Mbit/sで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG-2では、動画像信号を2〜15Mbit/sでTV放送品質を実現する。さらに現状では、MPEG-1,MPEG-2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11) によって、MPEG-1,MPEG-2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG-4が規格化された。MPEG-4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。更に、現在は、ISO/IECとITU-Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG-4 AVCおよびITU H.264 の標準化活動が進んでいる。2002年8月の時点で、次世代画像符号化方式はコミッティー・ドラフト(CD)と呼ばれるものが発行されている。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語である。
予測画像を作成せずに画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。
Pピクチャ又はBピクチャの符号化には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号化に動き補償を適用した符号化方式である。動き補償とは、単純に参照ピクチャの画素値から予測するのではなく、ピクチャ内の各部の動き量(以下、これを動きベクトルと呼ぶ)を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号化対象ピクチャ(以後、対象ピクチャと呼ぶ)の動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号化対象ピクチャとの予測残差を符号化することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号化されて記録又は伝送される。
動きベクトルはブロック単位で検出されており、具体的には、符号化対象ピクチャ側のブロックを固定しておき、参照ピクチャ側のブロックを探索範囲内で移動させ、対象ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。この動きベクトルを探索する処理を、動き検出と呼ぶ。
図15は動き検出を説明する概略図である。対象ブロックを参照ピクチャの任意の位置のブロックと比較し、最も似通ったブロックの位置を検出する。似通っているかどうかの判断としては、対象ブロックと参照ブロックの比較誤差を使用するのが一般的であり、特に絶対値差分和(SAD:Summed Absolute Difference)がよく用いられる。なお、参照ピクチャ全体の中で参照ブロックを探索すると演算量が膨大となるため、参照ピクチャの中で探索する範囲を絞り込み、その絞り込んだ範囲を探索範囲と呼ぶ。
動き検出は、動画像符号化処理の中で、最も演算量が多い処理として知られており、従来、この動き検出の演算量を削減する方法が多く検討されている。特に、携帯端末などの演算処理能力が低い機器では、演算量が少ない逐次探索方法がよく用いられる(例えば、特許文献1参照。)。
図16は従来の動き検出方法の探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図である。ここで、丸印は、参照ブロックの左上端画素の位置を示しており、各参照ブロックの位置を簡易的に示している。また、数字は、以下に説明する例における探索中心となる参照ブロックの移動に伴ってSADの計算を行う各参照ブロックの位置を示している。
1)まず探索開始位置Xとなる参照ブロックBaおよびこの参照ブロックBaから上下左右にそれぞれ1画素ずれた位置(以下、単に上下左右位置という)の参照ブロックBb、Bc、Bd、BeについてSADを計算し、例えば参照ブロックBa〜参照ブロックBeの中で右の参照ブロックBcのSADが1番小さければ探索中心を右に移動する。2)次に移動した探索中心となる参照ブロック(ここでは参照ブロックBc)の上下左右位置の参照ブロックについてSADを計算し、右の参照ブロックのSADが小さければ探索中心を右に移動する。3)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、右の参照ブロックのSADが小さければ探索中心を右に移動する。4)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、下の参照ブロックのSADが小さければ探索中心を下に移動する。5)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、下の参照ブロックのSADが小さければ探索中心を下に移動する。6)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、右の参照ブロックのSADが小さければ探索中心を右に移動する。7)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、右の参照ブロックのSADが小さければ探索中心を右に移動する。8)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、下の参照ブロックのSADが小さければ探索中心を下に移動する。9)次に移動した探索中心となる参照ブロックの上下左右位置の参照ブロックについてSADを計算し、探索中心となる参照ブロックのSADが小さければ探索を終了し、探索中心となる参照ブロックの位置YをSAD最小の位置、すなわち最適な動きベクトルとする。
特開2000−333184号公報
しかしながら、このような逐次探索では、1回の探索で高々1画素しか探索中心となる参照ブロックが移動しないため、大きな動きのあるピクチャで動き検出を行うためには探索中心となる参照ブロックの移動を多数回繰り返すことになり、高速な動き検出が実現できなくなる。
そこで、本発明は上記の事情に鑑みてなされたものであり、動き検出を高速に行うことができる動き検出方法および動き検出装置等を提供することを目的とする。
上記目的を達成するため、本発明に係る動き検出方法は、動画像を構成するピクチャの動き量を示す動きベクトルをブロック単位で検出する動き検出方法であって、動き検出を行う対象ピクチャの対象ブロックと、参照ピクチャ中における探索中心となる参照ブロックおよび探索中心となる前記参照ブロックの近傍に位置する参照ブロックとの誤差をそれぞれ計算する誤差計算ステップと、前記誤差計算ステップにより計算された前記誤差が最小となる参照ブロックを決定する誤差最小ブロック決定ステップと、動き検出を終了するか否かの判定を行う終了判定ステップと、前記誤差最小ブロック決定ステップにより決定された前記誤差が最小となる前記参照ブロックの位置に応じて、探索中心となる前記参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定し、再度前記誤差計算ステップを実行させる探索中心決定ステップと、前記終了判定ステップにより動き検出を終了すると判定された場合に、前記誤差最小ブロック決定ステップにより決定された前記参照ブロックの位置を示す動きベクトルを、求めるべき動きベクトルと決定する動きベクトル検出ステップとを含むことを特徴とする。
ここで、前記終了判定ステップでは、前記誤差最小ブロック決定ステップにより決定された前記参照ブロックの周囲に位置するすべての参照ブロックが、前回および今回の探索中心となる参照ブロックに基づいて、前記誤差計算ステップにより前記誤差が計算されている参照ブロックである、または、前記探索中心決定ステップにより決定された次回の探索中心となる前記参照ブロックが前回の探索中心となる参照ブロックと同じである場合に、動き検出を終了すると判定することが好ましい。
また、前記近傍に位置する参照ブロックは、前記探索中心となる参照ブロックから水平方向で左右それぞれにi画素(i:P以下の自然数、P:自然数)移動した参照ブロックと、垂直方向で上下それぞれにj画素(j:Q以下の自然数、Q:自然数)移動した参照ブロックと、水平方向で左右それぞれにi画素および垂直方向で上下それぞれにj画素移動した参照ブロックとであり、前記誤差計算ステップでは、前記探索中心となる参照ブロックおよび前記近傍に位置する参照ブロックの合計(2P+1)×(2Q+1)の参照ブロックに対する前記誤差を並列に計算してもよい。
これによって、探索中心となる参照ブロックの移動回数を削減することができるので、高速な動き検出が可能になり、例えば対象ブロックが大きな動きであっても所定の時間内で動き検出を行うことができる。また、探索中心となる参照ブロックおよび探索中心となる前記参照ブロックの近傍に位置する参照ブロックとに関して誤差計算を行っているので、探索中心となる参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定しても、誤差計算が行われずに飛ばされる参照ブロックが発生することもない。
なお、(2P+1)×(2Q+1)個の参照ブロックに対して誤差を並列に計算することになるので、従来と比べて1回の探索中心となる参照ブロックの移動に伴う演算量は多くなる。しかしながら、逐次探索で必要な時間は、画素値を読み出すための時間と誤差計算の時間であり、後者は演算器の個数を増加することで削減できるが、前者は削減することができない。すなわち、画素値を読み出すための時間が逐次探索の探索中心の移動にかかる時間のボトルネックとなり、所定の処理時間で大きな動きに追従するためには、本発明の構成が有益なことがわかる。
なお、本発明は、このような動き検出方法として実現することができるだけでなく、このような動き検出方法に含まれるステップを手段とする動き検出装置として実現したり、そのような動き検出方法を行う動画像符号化方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以上のように、本発明に係る動き検出方法によれば、探索中心となる参照ブロックの移動回数を削減することができ、高速な動き検出が可能になる。よって、例えば対象ブロックが大きな動きであっても所定の時間内で動き検出を行うことができることから、その実用的価値が高い。
以下、本発明の各実施の形態について、それぞれ図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る動き検出方法を用いた動画像符号化装置の構成を示すブロック図である。
動画像符号化装置は、ピクチャメモリ101、予測残差符号化部102、符号列生成部103、予測残差復号化部104、ピクチャメモリ105、動きベクトル検出部106、動き補償符号化部107、差分演算部108、加算演算部109、およびスイッチ110、111を備える。
ピクチャメモリ101は、表示時間順にピクチャ単位で入力された動画像を格納する。
動き補償符号化部107は、動きベクトル検出部106で検出された動きベクトルを用いてブロックの符号化モードを決定し、この符号化モードに基づいて予測画像データ(予測画素値)を生成する。例えば、2枚の参照ピクチャを用いたピクチャ間予測符号化モードの場合には、動き補償符号化部107は、動きベクトル検出部106で検出された動きベクトルを用いて2枚の参照ピクチャから2つの参照ブロックの画素値を求め、予測画像データを生成する。
差分演算部108は、ピクチャメモリ101より読み出された画像データと、動き補償符号化部107より入力された予測画像データとの差分を演算し、予測残差画像データを生成する。
予測残差符号化部102は、入力された予測残差画像データに対して周波数変換や量子化等の符号化処理を行い、符号化データを生成する。符号列生成部103は、入力された符号化データに対して可変長符号化等を行い、さらに動き補償符号化部107から入力された動きベクトルの情報、および符号化モードの情報等を付加することにより符号列を生成する。
予測残差復号化部104は、入力された符号化データに対して逆量子化や逆周波数変換等の復号化処理を行い、復号化差分画像データを生成する。加算演算部109は、予測残差復号化部104より入力された復号化差分画像データと、動き補償符号化部107より入力された予測画像データとを加算し、復号化画像データを生成する。ピクチャメモリ105は、生成された復号化画像データを格納する。
動きベクトル検出部106は、符号化済みの復号化画像データを参照ピクチャとして用いて、そのピクチャ内の探索領域において、入力された対象ブロックに最も近い画像領域の位置への動き量を示す動きベクトルの検出を行う。
図2は、動きベクトル検出部106の構成を示すブロック図である。
動きベクトル検出部106は、ブロックメモリ201、誤差計算部202、誤差最小ブロック決定部203、終了判定部204、探索中心決定部205、およびスイッチ206を備えている。
ブロックメモリ201は、入力される対象ピクチャVinをブロック単位に格納する。
誤差計算部202は、第1誤差計算部202a、第2誤差計算部202b、第3誤差計算部202c、…第9誤差計算部202iを有しており、ブロックメモリ201から入力される対象ブロックデータtar_imgと、ピクチャメモリ105から入力される9近傍の参照ブロックデータref_imga、参照ブロックデータref_imgb、参照ブロックデータref_imgc、…参照ブロックデータref_imgiとの誤差SAD1、誤差SAD2、誤差SAD3、…誤差SAD9をそれぞれ計算する。なお、本実施の形態では、探索中心となる参照ブロックおよびその周囲に上下左右ななめに1画素ずつずれた位置に位置する8つの参照ブロックの合計9つの参照ブロックを並列に計算を行っている。
誤差最小ブロック決定部203は、誤差計算部202により計算された誤差SAD1、誤差SAD2、誤差SAD3、…誤差SAD9の中で誤差が最小となる参照ブロック(以下、誤差最小ブロックという)を決定し、その位置の対象ブロックに対する動き量を示す動きベクトルmvminを出力する。
探索中心決定部205は、誤差最小ブロック決定部203により決定された誤差最小ブロックの位置に応じて、探索中心となる参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定する。
図3は、本発明に係る動き検出方法の探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図であり、(a)誤差最小ブロックが右中央の場合であり、(b)誤差最小ブロックが右上の場合である。図4は、同様に探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図であり、(a)誤差最小ブロックが右中央で、かつ探索範囲の境界がある場合であり、(b)(c)誤差最小ブロックが右上で、かつ探索範囲の境界がある場合である。ここで、丸印は、図15と同様に参照ブロックの左上端画素の位置を示しており、各参照ブロックの位置を簡易的に示している。
例えば、誤差最小ブロックが図3(a)に示すように右中央の場合には、探索中心決定部205は、探索中心となる参照ブロックを右に3画素移動する。また、誤差最小ブロックが例えば図3(b)に示すように右上端の場合には、探索中心となる参照ブロックを右に2画素、上に2画素移動する。
本実施の形態では、探索中心決定部205は、このような決定方法を例えば図7(a)に示すような変換表として保持しており、この変換表を参照して次回の探索中心となる参照ブロックを決定する。この変換表は、図7(a)に示すように誤差最小ブロックの動きベクトルmvminと今回の探索中心となる参照ブロックの動きベクトルmvcenterとの差分と、次回の探索中心となる参照ブロックの動きベクトルmvcenter(今回の探索中心となる参照ブロックの動きベクトルmvcenter+この動きベクトルmvcenterからの移動量)とを対応付けている。なお、この変換表は、少なくとも上記差分と上記移動量とを対応付けていればよい。
さらに、探索中心決定部205は、次回の探索中心となる参照ブロックを決定する際、次回の探索中心となる参照ブロックが所定の探索範囲内に含まれるように決定する。
例えば、誤差最小ブロックが図4(a)に示すように右中央で、かつ探索範囲の境界が2画素右にずれた位置にある場合には、探索中心決定部205は、探索中心となる参照ブロックを右に3画素移動した後、9つの参照ブロックの探索位置が全て探索範囲に収まるように探索中心となる参照ブロックを左に1画素移動する。従って、最終的には探索中心は右に2画素移動することになる。なお、図4における探索範囲の境界Wは、参照ブロックの左上端の画素を図4で示した位置にした場合にその参照ブロックが探索範囲を超えるかどうかを示したものである。
また、誤差最小ブロックが例えば図4(b)に示すように右上端で、かつ探索範囲の境界が1画素右にずれた位置にある場合には、探索中心決定部205は、探索中心となる参照ブロックを右に2画素、上に2画素移動した後、9つの参照ブロックの探索位置が全て探索範囲に収まるように探索中心となる参照ブロックを左に1画素移動する。従って、最終的には探索中心は右に1画素、上に2画素移動することになる。
また、誤差最小ブロックが例えば図4(c)に示すように右上端で、かつ現在の探索対象となる参照ブロックが探索範囲の境界である場合には、探索中心決定部205は、探索中心となる参照ブロックを右に2画素、上に2画素移動した後、9つの参照ブロックの探索位置が全て探索範囲に収まるように探索中心となる参照ブロックを左に2画素移動する。従って、最終的には探索中心は上に2画素移動することになる。
終了判定部204は、動き検出を終了するか否かの判定を行い、動き検出を終了する場合にはスイッチ206をONに、動き検出を終了しない場合にはスイッチ206をOFFに制御する。スイッチ206がONの状態である場合に、誤差最小ブロック決定部203から出力された動きベクトルmvminが、動きベクトル検出部106が検出した動きベクトルMVoutとして出力される。
終了判定部204は、誤差最小ブロックの周囲に位置するすべての参照ブロックが、前回および今回の誤差計算において誤差が計算されている参照ブロックであるか、または、探索中心決定部205により決定された次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じである場合に、動き検出を終了すると判定する。
図5は、本発明に係る動き検出方法の動き検出を終了する場合について示す概念図であり、(a)前回の誤差計算における誤差最小ブロックが右中央の場合であり、(b)前回の誤差計算における誤差最小ブロックが右上の場合である。
終了判定部204は、例えば図5(a)に示すように前回の誤差計算における誤差最小ブロックが右中央の参照ブロックであり、今回の誤差計算における誤差最小ブロックが今回の探索中心または左中央となる参照ブロックである場合には、動き検出を終了すると判定を行う。また、例えば図5(b)に示すように前回の誤差計算における誤差最小ブロックが右上端の参照ブロックであり、今回の誤差計算における誤差最小ブロックが今回の探索中心となる参照ブロックである場合には、動き検出を終了すると判定を行う。
次に、上記のように構成された動画像符号化装置の動きベクトル検出部106の動作について説明する。
図6(a)は動き検出を行う際の動作の流れを示すフローチャートであり、図6(b)はこの動作中の次回の探索中心となる参照ブロックの決定処理の動作の流れを示すフローチャートである。
まず、最小誤差SADminを∞に初期化し、探索中心となる参照ブロックの初期値mvPredを探索中心mvcenterに代入する(ステップa1)。次に、探索中心となる参照ブロックおよびその周囲に位置する参照ブロックであるN個の参照ブロックについて対象ブロックとの誤差計算を行う(ステップa2)。本実施の形態では、上記のように9個の参照ブロックについて対象ブロックとの誤差計算を行う。すなわち、誤差計算部202は、ブロックメモリ201から入力される対象ブロックデータtar_imgと、ピクチャメモリ105から入力される探索中心となる参照ブロックおよびその周囲に位置する参照ブロックの参照ブロックデータref_imga、参照ブロックデータref_imgb、参照ブロックデータref_imgc、…参照ブロックデータref_imgiとの誤差SAD1、誤差SAD2、誤差SAD3、…誤差SAD9をそれぞれ計算する。
次に、誤差最小ブロック決定部203は、誤差計算部202により計算された誤差SAD1、誤差SAD2、誤差SAD3、…誤差SAD9、および前回決定された最小誤差SADmin(初回の最小誤差SADminは∞)の中で誤差が最小となる誤差最小ブロックを決定し、その誤差SADcを最小誤差SADminとし、その位置の対象ブロックに対する動き量を示す動きベクトルmvcを動きベクトルmvminとして出力する(ステップa3)。
次に、終了判定部204は、誤差最小ブロックの周囲に位置するすべての参照ブロックが、前回および今回の誤差計算において誤差が計算されている参照ブロックであるか否かを判定する(ステップa4)。この判定の結果、誤差最小ブロックの周囲に位置するすべての参照ブロックが、前回および今回の誤差計算において誤差が計算されている参照ブロックである場合(ステップa4でYES)には、動き検出の処理を終了し、誤差最小ブロックの動きベクトルmvminを動きベクトル検出部106が検出した動きベクトルMVoutとして出力する(ステップa7)。
一方、上記判定の結果、誤差最小ブロックの周囲に位置するすべての参照ブロックが、前回および今回の誤差計算において誤差が計算されている参照ブロックでない場合(ステップa4でNO)には、探索中心決定部205は、次回の探索中心となる参照ブロックの決定処理を行う(ステップa5)。次に、終了判定部204は、探索中心決定部205により決定された次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じであるか否かを判定する(ステップa6)。この判定の結果、次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じである場合(ステップa6でYES)には、動き検出の処理を終了し、誤差最小ブロックの動きベクトルmvminを動きベクトル検出部106が検出した動きベクトルMVoutとして出力する(ステップa7)。
一方、上記判定の結果、次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じでない場合(ステップa6でNO)には、誤差計算および誤差最小ブロックの決定処理(ステップa2)から終了判定処理(ステップa6)を繰り返す。
次に、次回の探索中心となる参照ブロックの決定処理(ステップa5)について、詳しく説明する。
探索中心決定部205は、誤差最小ブロック決定部203により決定された誤差最小ブロックの位置に応じて、次回の探索中心となる参照ブロックを決定する(ステップb1)。すなわち、探索中心決定部205は、現時点の誤差最小ブロックの動きベクトルmvminと今回の探索中心となる参照ブロックの動きベクトルmvcenterとから図7(a)に示すような変換表を参照して次回の探索中心となる参照ブロックを決定する。
次に、探索中心決定部205は、決定した次回の探索中心となる参照ブロックの動きベクトルmvcenterの水平成分が探索範囲内に収まるように、この動きベクトルmvcenterの水平成分の値の丸め処理を行う(ステップb2)。次に、探索中心決定部205は、決定した次回の探索中心となる参照ブロックの動きベクトルmvcenterの垂直成分が探索範囲内に収まるように、この動きベクトルmvcenterの垂直成分の値の丸め処理を行う(ステップb3)。
以上のように、探索中心となる参照ブロックおよびその周囲に上下左右ななめに1画素ずつずれた位置に位置する8つの参照ブロックの合計9つの参照ブロックを並列に計算を行って誤差最小ブロックを求め、この誤差最小ブロックの位置に応じて、探索中心となる参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定しているので、探索中心となる参照ブロックの移動回数を削減することができ、高速な動き検出が可能になる。よって、例えば対象ブロックが大きな動きであっても所定の時間内で動き検出を行うことができる。
なお、本実施の形態では、誤差計算部202は、誤差の計算を探索中心となる参照ブロックとその周囲に上下左右ななめに1画素ずつずれた位置に位置する8つの参照ブロックを並列に計算を行っているが、これに限られるものではない。例えば、誤差計算部202は、探索中心となる参照ブロック、およびその周囲に上下左右ななめに1画素および2画素ずつずれた位置に位置する24の参照ブロックで合計25の参照ブロックを並列に計算を行う構成としても構わない。
この場合、探索中心決定部205は、誤差最小ブロックが例えば図3(c)に示すように右中央の場合には、探索中心となる参照ブロックを右に5画素移動する。また、誤差が最小となる参照ブロックが例えば図3(d)に示すように右上から2つ目の参照ブロックの場合には、探索中心となる参照ブロックを右に5画素、上に1画素移動する。また、誤差最小ブロックが例えば図3(e)に示すように右上端の場合には、探索中心となる参照ブロックを右に4画素、上に4画素移動する。すなわち、探索中心決定部205は、例えば図7(b)に示すような変換表を保持すればよい。
また、終了判定部204は、例えば図5(c)に示すように前回の誤差計算における誤差最小ブロックが右中央の参照ブロックであり、今回の誤差計算における誤差最小ブロックが今回と前回の誤差計算の対象の参照ブロックの端に位置しない参照ブロックである場合には、動き検出を終了すると判定を行う。また、例えば図5(d)に示すように前回の誤差計算における誤差最小ブロックが右上から2つ目の参照ブロックであり、今回の誤差計算における誤差最小ブロックが今回と前回の誤差計算の対象の参照ブロックの端に位置しない参照ブロックである場合には、動き検出を終了すると判定を行う。また、例えば図5(e)に示すように前回の誤差計算における誤差最小ブロックが右上端の参照ブロックであり、今回の誤差計算における誤差最小ブロックが今回の誤差計算の対象の参照ブロックの端に位置しない参照ブロックである場合には、動き検出を終了すると判定を行う。
また、本実施の形態では、誤差計算部202が第1誤差計算部202a、第2誤差計算部202b、第3誤差計算部202c、…第9誤差計算部202iを有し、探索中心となる参照ブロックとその周囲に位置する参照ブロックに関する誤差を並列に計算できる構成としているが、これに限られるものではない。ソフトウェアとして実装することも可能であり、例えば演算器を複数備えたプロセッサ等では有効である。
(実施の形態2)
上記実施の形態1では、終了判定部204が動き検出処理の終了を判定しているが、本実施の形態では、終了判定部204の終了判定に加えてカウンタを用いて動き検出処理の終了を行う場合について説明する。
図8は、図1に示す動きベクトル検出部106の構成を示すブロック図である。なお、図2と同様の部分については同じ符号を付し、詳細な説明を省略する。
動きベクトル検出部106は、実施の形態1の構成に加えて、カウンタ301を備えている。カウンタ301は、誤差最小ブロック決定部203から動きベクトルmvminが出力された回数、すなわち探索中心となる参照ブロックが更新された回数を計測する。そして、カウンタ301は、計測した回数が所定の閾値TH_me_cntになった場合に、スイッチ206をONに制御する。その結果、誤差最小ブロック決定部203から出力された動きベクトルmvminが、動きベクトル検出部106が検出した動きベクトルMVoutとして出力される。なお、カウンタ301は、計測した回数が所定の閾値TH_me_cnt未満の場合には、スイッチ206をOFFに制御する。
図9は、カウンタを用いて動き検出を行う際の動作の流れを示すフローチャートである。なお、図6(a)と同様の動作については同じ符号を付し、詳細な説明を省略する。
図6(a)に示す実施の形態1の動作との相違点は、まず、最小誤差SADminを∞に初期化し、探索中心となる参照ブロックの初期値mvPredを探索中心mvcenterに代入する動作に加えて、回数cntを0に初期化する(ステップc1)。
また、次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じであるか否かの判定処理(ステップa6)において、次回の探索中心となる参照ブロックが前回の探索中心となる参照ブロックと同じでない場合(ステップa6でNO)に、カウンタ301は回数cntを1つ増加(ステップc2)し、回数cntが回数が所定の閾値TH_me_cntになるまで、誤差計算および誤差最小ブロックの決定処理(ステップa2)から終了判定処理(ステップa6)を繰り返す。
一方、回数cntが回数が所定の閾値TH_me_cntになると、誤差計算および誤差最小ブロックの決定処理(ステップa2)から終了判定処理(ステップa6)を繰り返すのを終了し、その時点の誤差最小ブロックの動きベクトルmvminを動きベクトル検出部106が検出した動きベクトルMVoutとして出力する(ステップa7)。
以上のように、終了判定部204の終了判定に加えて、カウンタ301により計測された回数が所定の閾値TH_me_cntになった場合にも、動き検出を終了しているので、例えば所定の時間内で動き検出を終了する必要がある場合等に、所定の時間内で動き検出を終了することができる。
なお、上記各実施の形態では、対象ブロックと参照ブロックの比較誤差として絶対値差分和(SAD:Summed Absolute Difference)を用いているが、これに限られるものではない。例えば、対象ブロックと参照ブロックの比較誤差として差分2乗和等を用いても構わない。
(実施の形態3)
さらに、上記各実施の形態で示した動き検出方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図10は、上記各実施の形態の動き検出方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図10(b) は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図10 (a) は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図10(c) は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。動き検出方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内の動き検出方法を実現するプログラムにより上記動き検出方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
(実施の形態4)
さらにここで、上記実施の形態で示した動き検出方法の応用例とそれを用いたシステムを説明する。
図11は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図11のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を上記実施の形態同様に符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
このシステムを構成する符号化の中で使用される動き検出部には上記各実施の形態で示した動き検出を用いるようにすればよい。
その一例として携帯電話について説明する。
図12は、上記実施の形態で説明した動き検出方法を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図13を用いて説明する。携帯電話ex115は表示部ex202及び操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306及び音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROM及びRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話機ex115は、音声通話モード時にアンテナex201で受信した受信データを増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声データに変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303及びLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、本願発明で説明した動画像符号化装置を備えた構成であり、カメラ部ex203から供給された画像データを上記実施の形態で示した動画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話機ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信データを変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声データに変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図14に示すようにディジタル放送用システムにも上記実施の形態の動画像符号化装置を組み込むことができる。具体的には、放送局ex409では映像情報のビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置によりビットストリームを復号化してこれを再生する。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録したビットストリームを読み取り、復号化する再生装置ex403にも動画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に動画像復号化装置を実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に動画像復号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を上記実施の形態で示した動画像符号化装置で符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が動画像復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を再生し、モニタex408で表示することができる。
なお、カーナビゲーションex413の構成は例えば図13に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
このように、上記実施の形態で示した動き検出方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
また、本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
また、図1、図2、および図8に示したブロック図の各機能ブロックは典型的には集積回路であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
以上のように、本発明に係る動き検出方法および動画像符号化方法は、例えば携帯電話、DVD装置、およびパーソナルコンピュータ等で、動画像の動き検出を行ったり、動画像を構成する各ピクチャを符号化して符号列を生成したりするための方法等として有用である。
本発明の実施の形態1に係る動き検出方法を用いた動画像符号化装置の構成を示すブロック図である。 本発明の実施の形態1に係る動き検出方法を用いた動きベクトル検出部の構成を示すブロック図である。 本発明に係る動き検出方法の探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図であり、(a)9個の参照ブロックを並列に計算を行った際に誤差最小ブロックが右中央の場合であり、(b)9個の参照ブロックを並列に計算を行った際に誤差最小ブロックが右上の場合であり、(c)25個の参照ブロックを並列に計算を行った際に誤差最小ブロックが右端中央の場合であり、(d)25個の参照ブロックを並列に計算を行った際に誤差最小ブロックが右端上から2つ目の場合であり、(e)25個の参照ブロックを並列に計算を行った際に誤差最小ブロックが右上端の場合である。 本発明に係る動き検出方法の探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図であり、(a)誤差最小ブロックが右中央で、かつ探索範囲の境界がある場合であり、(b)(c)誤差最小ブロックが右上で、かつ探索範囲の境界がある場合である。 本発明に係る動き検出方法の動き検出を終了する場合について示す概念図であり、(a)9個の参照ブロックを並列に計算を行った際に前回の誤差計算における誤差最小ブロックが右中央の場合であり、(b)9個の参照ブロックを並列に計算を行った際に前回の誤差計算における誤差最小ブロックが右上の場合であり、(c)25個の参照ブロックを並列に計算を行った際に前回の誤差計算における誤差最小ブロックが右端中央の場合であり、(d)25個の参照ブロックを並列に計算を行った際に前回の誤差計算における誤差最小ブロックが右端上から2つ目の場合であり、(e)25個の参照ブロックを並列に計算を行った際に前回の誤差計算における誤差最小ブロックが右上端の場合である。 (a)動き検出を行う際の動作の流れを示すフローチャートであり、(b)はこの動作中の次回の探索中心となる参照ブロックの決定処理の動作の流れを示すフローチャートである。 探索中心決定部が保持する次回の探索中心となる参照ブロックを決定するための変換表の一例を示す図であり、(a)9個の参照ブロックについて対象ブロックとの誤差計算を行う場合、(b)25個の参照ブロックについて対象ブロックとの誤差計算を行う場合である。 本発明の実施の形態2に係る動き検出方法を用いた動きベクトル検出部の構成を示すブロック図である。 カウンタを用いて動き検出を行う際の動作の流れを示すフローチャートである。 各実施の形態の動き検出方法および動画像符号化方法をコンピュータシステムにより実現するためのプログラムを格納するための記録媒体についての説明図であり、(a) 記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示した説明図、(b) フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示した説明図、(c) フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示した説明図である。 コンテンツ供給システムの全体構成を示すブロック図である。 携帯電話の例を示す概略図である。 携帯電話の構成を示すブロック図である。 ディジタル放送用システムの例を示す図である。 動き検出を説明する概略図である。 従来の動き検出方法の探索位置となる参照ブロックおよび探索中心となる参照ブロックの移動について示す概念図である。
符号の説明
101 ピクチャメモリ
102 予測残差符号化部
103 符号列生成部
104 予測残差復号化部
105 ピクチャメモリ
106 動きベクトル検出部
107 動き補償符号化部
108 差分演算部
109 加算演算部
110、111 スイッチ
201 ブロックメモリ
202 誤差計算部
203 誤差最小ブロック決定部
204 終了判定部
205 探索中心決定部
206 スイッチ
301 カウンタ
Cs コンピュータ・システム
FD フレキシブルディスク
FDD フレキシブルディスクドライブ

Claims (9)

  1. 動画像を構成するピクチャの動き量を示す動きベクトルをブロック単位で検出する動き検出方法であって、
    動き検出を行う対象ピクチャの対象ブロックと、参照ピクチャ中における探索中心となる参照ブロックおよび探索中心となる前記参照ブロックから水平方向で左右それぞれにi画素(i:P以下の自然数、P:自然数)移動した参照ブロックと、垂直方向で上下それぞれにj画素(j:Q以下の自然数、Q:自然数)移動した参照ブロックと、水平方向で左右それぞれにi画素および垂直方向で上下それぞれにj画素移動した参照ブロックとの誤差をそれぞれ計算する誤差計算ステップと、
    前記誤差計算ステップにより計算された前記誤差が最小となる参照ブロックを決定する誤差最小ブロック決定ステップと、
    動き検出を終了するか否かの判定を行う終了判定ステップと、
    前記誤差最小ブロック決定ステップにより決定された前記誤差が最小となる前記参照ブロックの位置に応じて、探索中心となる前記参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定し、再度前記誤差計算ステップを実行させる探索中心決定ステップと、
    前記終了判定ステップにより動き検出を終了すると判定された場合に、前記誤差最小ブロック決定ステップにより決定された前記参照ブロックの位置を示す動きベクトルを、検出すべき動きベクトルと決定する動きベクトル検出ステップとを含み、
    前記探索中心決定ステップでは、前記誤差最小ブロック決定ステップにより決定された前記誤差が最小となる参照ブロックが、
    (1)前記探索中心となる参照ブロックから水平M画素(M:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (2)前記探索中心となる参照ブロックから垂直N画素(N:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから垂直2N+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (3)前記探索中心となる参照ブロックから水平M画素および垂直N画素移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M画素および垂直2N画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定する
    ことを特徴とする動き検出方法。
  2. 前記終了判定ステップでは、前記誤差最小ブロック決定ステップにより決定された前記参照ブロックの周囲に位置するすべての参照ブロックが、前回および今回の探索中心となる参照ブロックに基づいて、前記誤差計算ステップにより前記誤差が計算されている参照ブロックである、または、前記探索中心決定ステップにより決定された次回の探索中心となる前記参照ブロックが前回の探索中心となる参照ブロックと同じである場合に、動き検出を終了すると判定する
    ことを特徴とする請求項1記載の動き検出方法。
  3. 前記誤差計算ステップでは、前記誤差の計算対象である複数の前記参照ブロックと前記対象ブロックとのそれぞれの前記誤差を並列に計算する
    ことを特徴とする請求項1記載の動き検出方法。
  4. 前記探索中心決定ステップでは、前記誤差の計算対象である複数の前記参照ブロックが、所定の探索範囲内に含まれるように次回の探索中心となる参照ブロックを決定する
    ことを特徴とする請求項1〜のいずれか1項に記載の動き検出方法。
  5. 前記動き検出方法は、さらに、
    前記誤差計算ステップにおける前記誤差の計算回数を計数するカウントステップを備え、
    前記終了判定ステップでは、前記カウントステップにより計数された前記計算回数が所定の回数を超えた場合に、動き検出を終了すると判定する
    ことを特徴とする請求項1〜のいずれか1項に記載の動き検出方法。
  6. 動画像を構成するピクチャをブロック単位で符号化する動画像符号化方法であって、
    請求項1〜のいずれか1項に記載の動き検出方法によって動きベクトルを検出する動きベクトル検出ステップと、
    前記動きベクトル検出ステップにより検出された前記動きベクトルに基づいて、前記動画像を符号化する符号化ステップと
    を含むことを特徴とする動画像符号化方法。
  7. 動画像を構成するピクチャの動き量を示す動きベクトルをブロック単位で検出する動き検出装置であって、
    動き検出を行う対象ピクチャの対象ブロックと、参照ピクチャ中における探索中心となる参照ブロックおよび探索中心となる前記参照ブロックから水平方向で左右それぞれにi画素(i:P以下の自然数、P:自然数)移動した参照ブロックと、垂直方向で上下それぞれにj画素(j:Q以下の自然数、Q:自然数)移動した参照ブロックと、水平方向で左右それぞれにi画素および垂直方向で上下それぞれにj画素移動した参照ブロックとの誤差をそれぞれ計算する誤差計算手段と、
    前記誤差計算手段により計算された前記誤差が最小となる参照ブロックを決定する誤差最小ブロック決定手段と、
    動き検出を終了するか否かの判定を行う終了判定手段と、
    前記誤差最小ブロック決定手段により決定された前記誤差が最小となる前記参照ブロックの位置に応じて、探索中心となる前記参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定し、再度前記誤差計算手段に前記誤差の計算を実行させる探索中心決定手段と、
    前記終了判定手段により動き検出を終了すると判定された場合に、前記誤差最小ブロック決定手段により決定された前記参照ブロックの位置を示す動きベクトルを、検出すべき動きベクトルと決定する動きベクトル検出手段とを備え、
    前記探索中心決定手段は、前記誤差最小ブロック決定手段により決定された前記誤差が最小となる参照ブロックが、
    (1)前記探索中心となる参照ブロックから水平M画素(M:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (2)前記探索中心となる参照ブロックから垂直N画素(N:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから垂直2N+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (3)前記探索中心となる参照ブロックから水平M画素および垂直N画素移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M画素および垂直2N画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定する
    ことを特徴とする動き検出装置。
  8. 動画像を構成するピクチャの動き量を示す動きベクトルをブロック単位で検出するためのプログラムであって、
    請求項1〜のいずれか1項に記載の動き検出方法に含まれるステップをコンピュータに実行させる
    ことを特徴とするプログラム。
  9. 動画像を構成するピクチャの動き量を示す動きベクトルをブロック単位で検出する集積回路であって、
    動き検出を行う対象ピクチャの対象ブロックと、参照ピクチャ中における探索中心となる参照ブロックおよび探索中心となる前記参照ブロックから水平方向で左右それぞれにi画素(i:P以下の自然数、P:自然数)移動した参照ブロックと、垂直方向で上下それぞれにj画素(j:Q以下の自然数、Q:自然数)移動した参照ブロックと、水平方向で左右それぞれにi画素および垂直方向で上下それぞれにj画素移動した参照ブロックとの誤差をそれぞれ計算する誤差計算手段と、
    前記誤差計算手段により計算された前記誤差が最小となる参照ブロックを決定する誤差最小ブロック決定手段と、
    動き検出を終了するか否かの判定を行う終了判定手段と、
    前記誤差最小ブロック決定手段により決定された前記誤差が最小となる前記参照ブロックの位置に応じて、探索中心となる前記参照ブロックの移動量が2画素以上となるように、次回の探索中心となる参照ブロックを決定し、再度前記誤差計算手段に前記誤差の計算を実行させる探索中心決定手段と、
    前記終了判定手段により動き検出を終了すると判定された場合に、前記誤差最小ブロック決定手段により決定された前記参照ブロックの位置を示す動きベクトルを、検出すべき動きベクトルと決定する動きベクトル検出手段とを備え、
    前記探索中心決定手段は、前記誤差最小ブロック決定手段により決定された前記誤差が最小となる参照ブロックが、
    (1)前記探索中心となる参照ブロックから水平M画素(M:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (2)前記探索中心となる参照ブロックから垂直N画素(N:整数)移動した参照ブロックである場合には、前記探索中心となる参照ブロックから垂直2N+1画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定し、
    (3)前記探索中心となる参照ブロックから水平M画素および垂直N画素移動した参照ブロックである場合には、前記探索中心となる参照ブロックから水平2M画素および垂直2N画素移動した参照ブロックを次回の探索中心となる参照ブロックとして決定する
    ことを特徴とする集積回路。
JP2005043017A 2004-02-27 2005-02-18 動き検出方法および動画像符号化方法 Expired - Fee Related JP4519676B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005043017A JP4519676B2 (ja) 2004-02-27 2005-02-18 動き検出方法および動画像符号化方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004053588 2004-02-27
JP2005043017A JP4519676B2 (ja) 2004-02-27 2005-02-18 動き検出方法および動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2005278156A JP2005278156A (ja) 2005-10-06
JP4519676B2 true JP4519676B2 (ja) 2010-08-04

Family

ID=35177277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005043017A Expired - Fee Related JP4519676B2 (ja) 2004-02-27 2005-02-18 動き検出方法および動画像符号化方法

Country Status (1)

Country Link
JP (1) JP4519676B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4531006B2 (ja) * 2006-03-31 2010-08-25 富士通株式会社 動きベクトル検出装置
JP2007274366A (ja) * 2006-03-31 2007-10-18 Fujitsu Ltd 動画像符号化装置、動きベクトル検出方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355780A (ja) * 1998-06-12 1999-12-24 Sharp Corp 動き検出装置
JP2000188735A (ja) * 1998-12-21 2000-07-04 Hitachi Ltd 動きベクトル検出装置及びこれを用いた動画像符号化装置
JP2000333184A (ja) * 1999-03-17 2000-11-30 Matsushita Electric Ind Co Ltd 動きベクトル検出方法,動きベクトル検出装置,及びデータ記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355780A (ja) * 1998-06-12 1999-12-24 Sharp Corp 動き検出装置
JP2000188735A (ja) * 1998-12-21 2000-07-04 Hitachi Ltd 動きベクトル検出装置及びこれを用いた動画像符号化装置
JP2000333184A (ja) * 1999-03-17 2000-11-30 Matsushita Electric Ind Co Ltd 動きベクトル検出方法,動きベクトル検出装置,及びデータ記録媒体

Also Published As

Publication number Publication date
JP2005278156A (ja) 2005-10-06

Similar Documents

Publication Publication Date Title
KR101075270B1 (ko) 움직임 검출 방법 및 동화상 부호화 방법
JP4114859B2 (ja) 動きベクトル符号化方法および動きベクトル復号化方法
JP4130783B2 (ja) 動きベクトル符号化方法および動きベクトル復号化方法
JP5401530B2 (ja) 符号化復号化装置
KR100944851B1 (ko) 동화상 부호화 방법 및 동화상 복호화 방법
JP5085757B2 (ja) 画像復号化方法、画像復号化装置、プログラムおよび記録媒体
JP2004254327A (ja) 画像符号化方法および画像復号化方法
JP4519676B2 (ja) 動き検出方法および動画像符号化方法
JP2004120138A (ja) 動画像符号化方法および動画像復号化方法
JP2004040512A (ja) 画像符号化方法および画像復号方法
JP4628216B2 (ja) 画像復号化方法、画像復号化装置および画像復号化プログラム
JP2004364064A (ja) 動き推定方法および動画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100519

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees