JP2931789B2

JP2931789B2 - 動きベクトル探索装置

Info

Publication number: JP2931789B2
Application number: JP8637896A
Authority: JP
Inventors: 孝之小林; 豊岡田
Original assignee: GURAFUITSUKUSU KOMYUNIKEESHON RABORATORIIZU KK
Current assignee: GURAFUITSUKUSU KOMYUNIKEESHON RABORATORIIZU KK
Priority date: 1996-04-09
Filing date: 1996-04-09
Publication date: 1999-08-09
Anticipated expiration: 2016-04-09
Also published as: JPH09284768A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、動画像の動き補
償に用いられる動きベクトルを探索するための装置に関
する。

【０００２】

【従来の技術】膨大なデータ量を有する画像信号の伝送
または蓄積のためには、データ量を削減するデータ圧縮
技術が必要不可となる。画像データは、近燐画素間の相
関関係および人間の知覚特性などに起因するかなりの冗
長度を備える。このデータの冗長度を抑制して伝送デー
タ量を低減するデータ圧縮技術は高能率符号化と呼ばれ
る。この高能率符号化方式の１つに、フレーム間予測符
号化方式がある。このフレーム間予測符号化方式におい
ては、以下の処理が実行される。現在符号化しようとし
ている現フレームの各画素データと参照する前フレーム
の同じ位置にある各画素データとの差分である予測誤差
を算出する。この算出された予測誤差を以後の符号化に
用いる。この方法では、動きの少ない画像に関しては、
フレーム間の相関が大きいため高能率で符号化を行うこ
とができる。しかしながら、動きの大きな画像について
は、フレーム間の相関が小さいため誤差が大きくなり、
逆に伝送されるデータ量が増加するという欠点が生ず
る。

【０００３】上述の問題点を解決する方法として、動き
補償付フレーム間予測符号化方式がある。この方法で
は、以下の処理が行われる。すなわち、予測誤差を算出
する前に、予め現フレームと前フレームの画素データを
用いて動きベクトルを算出する。この算出された動きベ
クトルに従って前フレームの予測画像を移動させる。す
なわち前フレームの動きベクトルだけずれた位置の画素
データを参照画素とし、この参照画素を予測値として用
いる。次いでこの移動後の前フレームと現フレームとの
各画素の予測誤差を算出し、予測誤差と動きベクトルを
伝送する。

【０００４】図５８は、従来の動き補償付予測符号化方
式に従って画像データを符号化する符号器の全体の構成
を示すブロック図である。図５８において、符号器は、
入力された画像信号に対し所定の前処理を実行する前処
理回路９１０と、この前処理回路９１０により前処理さ
れた信号に対し冗長度の除去および入力信号の量子化を
実行するソース符号化回路９１２と、ソース符号化回路
９１２からの信号に対し所定のフォーマットに従った符
号化および予め定められたデータ構造の符号列に多重化
するビデオマルチプレクス符号化回路９１４とを含む。

【０００５】前処理回路９１０は、時間および空間フィ
ルタを用いて入力画像信号を共通の中間フォーマットに
（ＣＩＦ）に変換しかつノイズ防止のためフィルタ処理
を実行する。ソース符号化回路９１２は、与えられた信
号に対するたとえば離散コサイン変換（ＤＣＴ）などの
直交変換処理を行うとともに、入力信号に対する動き補
償を行ない、かつ直交変換された画像データを量子化す
る。

【０００６】ビデオマルチプレクス符号化回路９１４
は、与えられた画像信号に対し２次元可変長符号化を行
なうとともに、データ処理単位であるブロックの各種属
性（動きベクトルなど）も可変長符号化した後に、予め
定められたデータ構造の符号列に多重化する。符号器は
さらに、このビデオマルチプレクス符号化回路９１４か
らの画像データをバッファ処理する伝送バッファ９１６
と、伝送バッファ９１６からの画像データを伝送チャネ
ルに適合させるための伝送符号化回路９１８を含む。

【０００７】伝送バッファ９１６は、情報発生速度を一
定速度に平滑化する。伝送符号化回路９１８は誤り訂正
ビットの付加、音声信号の付加等を実行する。図５９は
図５８に示すソース符号化回路９１２の具体的構成の一
例を示す図である。図５９において、ソース符号化回路
は入力画像信号に対し動きベクトルを探索しかつ動きベ
クトルに従って動き補償された参照画素を生成する動き
補償予測器９２０と、動き補償予測器９２０からの参照
画素データに対しフィルタ処理を行なうループフィルタ
９２２と、ループフィルタ９２２の出力と入力画像信号
との差分を求める減算器９２４と、減算器９２４の出力
を直交変換する直交変換器９２６と、直交変換器９２６
により直交変換されたデータを量子化する量子化器９２
８を含む。

【０００８】動き補償予測器９２０の構成は後に詳細に
説明するが、１フレーム前の画素データを格納するフレ
ームメモリを含み、入力画像信号データとこのフレーム
メモリ内の画素データとに従って動きベクトルの探索お
よび動き補償された参照画素データの生成を行なう。ル
ープフィルタ９２２は、画質改善のために設けられる。
直交変換器９２６は、減算器９２４からのデータに対し
所定のブロック（通常８×８画素）を１つの単位として
ＤＣＴ変換などの直交変換を行なう。量子化器９２８は
この直交変換された画素データを量子化する。

【０００９】動き補償予測器９２０および減算器９２４
により動き補償付フレーム間予測が実行され、動画像信
号における時間的な冗長性が除去される。また、直交変
換器９２６による直交変換により動画像信号における空
間的な冗長性が除去される。ソース符号化回路はさら
に、量子化器９２８で量子化されたデータを量子化前の
信号状態に変換するための逆量子化器９３０と、この逆
量子化器９３０の出力に対し逆直交変換を行う逆直交変
換器９３２と、ループフィルタ９２２の出力と逆直交変
換器９３２の出力を加算する加算器９３４を含む。この
逆量子化器９３０および逆直交変換器９３２により次の
フレームに対するフレーム間予測に用いる画像が生成さ
れる。この生成された画像データは動き補償予測器９２
０に含まれるフレームメモリへ書き込まれる。入力画像
信号（フレーム間差分データ）が加算されるため、現フ
レームのデータが再生される。通常、一般にこの逆量子
化処理、逆直交変換処理および加算処理は局部復号過程
と呼ばれる。

【００１０】次に、動きベクトルの算出について具体的
に説明する。動きベクトルの算出には、一般にブロック
マッチング法が用いられる。図６０（Ａ）に示すよう
に、第（ｍ−１）フレームにおける画像Ａが第ｍフレー
ムにおいてはＡ′に移動した状態を考える。ブロックマ
ッチング法においては、画像（１フレーム）をＭ×Ｎ画
素のブロックに分割する（一般にはＭ＝Ｎ）。現フレー
ムにおいては着目するブロックに最も近似するブロック
を前フレームから探し出す。この着目ブロックから最も
近似する前フレームにおけるブロックへのずれを動きベ
クトルと称す。以下に、より詳細に説明する。

【００１１】図６０（Ｂ）に示すように、今第ｍフレー
ムを符号化対象フレームとする。フレームはＮ×Ｎ画素
のブロックに分割される。第ｍフレームにおけるＮ×Ｎ
画素のブロックにおける一番左上の画素位置（Ｎｋ，Ｎ
ｌ）における画素データの値をＸｍ（Ｎｋ，Ｎｌ）とす
る。画素位置を位置（ｉ，ｊ）だけずらした前フレーム
におけるブロックと現フレームにおけるブロックとの差
分の絶対値和を求める。次に、このずれ（ｉ，ｊ）を様
々な値に変え、それぞれの差分絶対値和を求める。その
最小値の差分絶対値和を与える位置（ｉ，ｊ）を動きベ
クトルと称す。

【００１２】動きベクトルは１ブロック画素当り一個伝
送する必要がある。ブロックサイズを小さくすると伝送
情報が増加し、効果的なデータ圧縮ができなくなる。一
方、ブロックサイズを大きくすると効果的な動き探索が
困難となる。そこで、ブロックサイズは１６×１６画
素、動きベクトル探索範囲（ｉ，ｊの最大変化幅）は−
１５〜＋１５とするのが一般的である。以下に、具体的
にブロックマッチング法による動きベクトルの算出につ
いて説明する。

【００１３】図６１はブロックマッチング法による動き
ベクトルの算出の方法を示す図である。今３５２ドット
×２８８ラインからなる画像９５０を考える。画像９５
０を、１６×１６の画素群を１ブロックとしてブロック
に分割する。このブロック単位で動きベクトルの探索が
実行される。探索処理の対象となるブロック（以下、現
画像ブロックと称す）９５２の同じ位置にある前フレー
ムにおけるブロック９５４を基準として水平方向および
垂直方向に±１６画素大きなブロック、すなわちブロッ
ク９５４を中心とする４８×４８画素により構成される
ブロック９５６を探索ブロック（以下、サーチエリアと
称す）とする。現画像ブロック９５２に対する動きベク
トルの探索はこのサーチエリア内において実行される。
ブロックマッチング法に従った動きベクトルの探索方法
は以下の処理ステップを備える。

【００１４】動きベクトルの候補に対応する変位を有す
る予測画像ブロック（図６１においては（ｉ，ｊ）で示
す）を求める。この求められたブロックと現画像ブロッ
クの対応の位置にある画素の差分絶対値和であるディス
トーションを求める。上述の動作を（ｉ，ｊ）が（−１
６、−１６）〜（＋１６、＋１６）のすべての変位に対
して実行する。すべての予測画像ブロックに対して評価
関数（評価値）を求めた後、この評価関数の値が最小と
なる予測画像ブロックを探索する。現画像ブロックと同
じ位置（以下、真裏と称す）のブロック（図６１におい
て（０，０）で示すブロック９５４）からディストーシ
ョンが最小となる予測画像ブロックに向かうベクトルを
この現画像ブロックに対する動きベクトルと決定する。

【００１５】このような動きベクトルをハードウエアで
求めるための構成が種々提案されている。図６２は、特
開平２−２１３２９１号公報に報告されているように従
来の動きベクトル探索装置の全体の構成を示す図であ
る。図６２において、動きベクトル探索装置は、サーチ
エリアの画素データをサーチエリアの一列分入力するた
めのサーチエリア入力レジスタ９６２と、現画像ブロッ
ク評価点と同一サイズの行および列のマトリックス状に
配置された複数のプロセッサエレメントを含むプロセッ
サアレイ９６６と、このプロセッサアレイに対しサーチ
エリアにおける同一列のデータを格納するサーチエリア
サイドレジスタ９６４ａおよび９６４ｂと、プロセッサ
アレイ９６６の演算結果に従って動きベクトルを探索す
る動きベクトル探索部９６８を含む。

【００１６】プロセッサアレイ９６６には、変位ベクト
ル（ｉ，ｊ）に対応してプロセッサエレメントが配置さ
れる。すなわち、第ｉ行、第ｊ列に配置されたプロセッ
サエレメントＰｉｊは、変位ベクトルＤ（ｉ，ｊ）を計
算する。図６３は、図６２に示すプロセッサアレイに含
まれるプロセッサエレメントの構成を示す図である。図
６３において、プロセッサエレメント９７０は、アレイ
の水平および垂直方向の３方向のプロセッサエレメント
から伝送されるサーチエリアデータを受け、選択信号Ｓ
ＥＬに応答してその１つの入力を通過させる３入力レジ
スタ９７２と、３入力レジスタ９７２からのサーチエリ
アデータＹと外部から与えられる現画像ブロックデータ
Ｘとに基づいてディストーション（差分絶対値和）を計
算するディストーション計算部９７４と、ディストーシ
ョン計算部９７４からのディストーションＤと水平方向
に隣接するプロセッサエレメントからのディストーショ
ンとを受け、選択信号Ｔｏに従って一方を選択的に通過
させる２入力レジスタ９７６を含む。

【００１７】このプロセッサエレメントは、図６２に示
すプロセッサアレイにおいて、サーチエリアにおいて動
きベクトルの候補となるすべてのディストーションに対
応して２次元状に配置される。プロセッサアレイ９６６
（図６２参照）の各プロセッサエレメント９７０へは、
全て同じ現画像ブロックデータＸが与えられる。このと
き、プロセッサエレメント９７０へは、参照画像ブロッ
クの対応のデータが与えられる。すなわち、たとえば現
画像ブロックデータＸが、Ｘ（ｍ，ｎ）の場合、プロセ
ッサエレメントＰｉｊに対しては参照画像ブロックデー
タＹ（ｉ＋ｍ，ｊ＋ｎ）が与えられる。サーチウインド
ウデータは、サーチエリアサイドレジスタ９６４ａおよ
び９６４ｂならびにプロセッサアレイ９６６の各プロセ
ッサエレメント９７０を介して転送される。外部から与
えられる現画像ブロックデータＸ（ｍ，ｎ）に対し、正
確に参照画像ブロックデータＹ（ｍ＋ｉ，ｎ＋ｊ）を与
えるために、現画像ブロックデータおよび参照画像ブロ
ックデータはある規則性をもってスキャンされなければ
ならない。

【００１８】図６４は、この現画像ブロックのデータの
スキャン方法を示す図である。図６４において、現画像
ブロックデータは、現画像ブロック９９９において図に
おいて矢印で示すように、まず同一列に沿って上方向か
ら下方向へスキャンされ、次いで１列隣のデータを下方
向から上方向へスキャンして生成される。このスキャン
方法を「スネークスキャン」と称す。この現画像ブロッ
クデータの「スネークスキャン」方法に従って、プロセ
ッサアレイに与えられる参照画像ブロックデータも同様
にスキャンされる。プロセッサエレメントは、その配置
位置に応じてサーチエリアデータを図の上下方向または
図６３の左方向へ転送する必要がある。このため３入力
レジスタ９７２が設けられる。

【００１９】２入力レジスタ９７６は、各ディストーシ
ョンが計算された後、動きベクトル探索部９６８におい
て最小のディストーションを与えるディストーションを
求めるために、プロセッサエレメントで計算されたディ
ストーションを動きベクトル探索部９６８へ伝送するた
めに設けられる。動きベクトル探索部９６８は、各プロ
セッサエレメントからのディストーションのうち最小の
ディストーションを探索し、その最小のディストーショ
ンを与えるプロセッサエレメントの位置、すなわち動き
ベクトルを求める。次に、この図６２に示す動きベクト
ル探索装置の動作について説明する。

【００２０】プロセッサエレメント９６６において第ｉ
行ｊ列に配置されたプロセッサエレメントＰｉｊは下記
の数式（Ｅ１）で表されるディストーションＤ（ｉ，
ｊ）を算出する。

【００２１】

【数１】

【００２２】ただし、‖ ‖はディストーションを演算
するためのノルムを表しており、ｄ（ｍ，ｎ）＝Ｘ
（ｍ，ｎ）−Ｙ（ｍ＋ｊ，ｎ＋ｊ）であり、位置的に対
応する画素データの差分、すなわち局所ディストーショ
ンを表している。上述のノルム演算としては、絶対値演
算、二乗演算等がよく用いられているが、絶対値演算が
最も頻繁に用いられている。総和Σは、ｍおよびｎに関
して行われる。ｍ、ｎの変化範囲は、サーチウインドウ
のサイズにより決定される。

【００２３】今、図６５に示すように、現画像ブロック
９８０としてＭ行Ｎ列に配置された画素を考える。最初
のサイクルにおいては、プロセッサアレイにおける各プ
ロセッサエレメントには参照符号９８２で示す参照画像
ブロックデータが格納される。外部からは現画像ブロッ
ク９８０における第１行第１列の画素Ｘ（１，１）がプ
ロセッサアレイのすべてのプロセッサエレメントに与え
られる。各プロセッサエレメントはそこに格納されてい
るサーチウインドウデータＹと与えられた現画像ブロッ
クデータＸとの差分絶対値を求めて累積する。

【００２４】次のサイクルにおいては、プロセッサアレ
イにおいてサーチエリアデータが図６５の下方向に１行
シフトされる。この状態で、次いで現画像ブロック９８
０から次の画素データＸ（２，１）が与えられる。プロ
セッサエレメント９７０において、格納されたサーチエ
リアデータはＹ（ｉ＋ｍ＋１，ｊ＋ｎ）である。これら
のデータを用いて再び差分絶対値がとられかつ累算され
る。この動作がＭ回繰り返される。

【００２５】Ｍ回上述の動作を繰り返すと、外部からサ
ーチエリアの１列のサーチエリア画素データが図６２に
示すサーチエリア入力レジスタ９６２を介して書き込ま
れる。不要となったサーチエリアの一列の画素データは
放出される。これにより、新しいサーチエリアデータが
サーチエリアサイドレジスタ９６４ａおよび９６４ｂお
よびプロセッサアレイ９６６に格納される。この動作が
繰り返し実行される。

【００２６】すなわち、図６６に示すように、最初はサ
ーチウインドウ９９０を用いて差分絶対値和の計算が実
行され、Ｍサイクル完了後、次のサーチウインドウ９９
２のデータを用いて再び同様の計算が実行され、以降、
サーチウインドウ９９４、・・・と同様の計算が繰り返
される。最終的にサーチエリア９９６すべてに対する画
素データに対する計算が実行されると、プロセッサエレ
メントＰｉｊにおいては、ディストーションＤ（ｉ，
ｊ）が求められ、保持される。

【００２７】この各プロセッサエレメントＰｉｊにおい
て求められたディストーションＤ（ｉ，ｊ）は動きベク
トル探索部９６８（図６２参照）へ伝送され、そこで最
小のディストーションが動きベクトルとして探索され
る。上述の動きベクトル探索装置は、サーチエリアの画
素データと現画像ブロックの画素データを用いて動きベ
クトルを探索している。

【００２８】また、図６７のようにデータを一方向のみ
に転送してディストーションを求める動きベクトル探索
装置に関わる発明が特開平６−１１３２９０に示されて
いる。現画像ブロックと各参照画像ブロックとのディス
トーションを求める際、現画像ブロックデータはプロセ
ッサエレメントに保持されており、所定の参照画像ブロ
ックとのディストーションを算出する際、参照画像ブロ
ックデータと現画像ブロックデータとの差分絶対値を算
出する作業をそれぞれ同時に行なう。

【００２９】なお、この発明は本発明に関係しているの
で転送およびディストーション算出方法等に関しては後
述する。

【００３０】

【発明が解決しようとする課題】従来動きベクトルを探
索する際、サーチエリアが広い場合あるいはより動きベ
クトル探索の精度が要求される場合においては、最初に
粗い動きベクトルの探索を行って最適な動きベクトルが
存在する範囲を把握した後に、改めてその範囲において
より精度の高い動きベクトルの探索を行なうことがなさ
れている。

【００３１】しかし、図６７のような従来の動きベクト
ル探索装置では粗い探索と精度の高い探索を行うために
は２種類の動きベクトル探索装置が必要となる。そこ
で、本発明は１つの動きベクトル探索装置で上記の効率
的な動きベクトル探索を行うことができるように、粗い
動きベクトルの探索を行う動きベクトル探索装置および
粗い探索と精度の高い探索の選択ができる動きベクトル
探索装置を提供することである。

【００３２】

【課題を解決するための手段】請求項１記載の発明は、
上記課題を解決するため、現画像よりも先に符号化され
る参照画像に含まれるサーチウインドウをそれぞれ部分
的に構成する複数の参照画像ブロックの中から、現画像
ブロックに最も類似した参照画像ブロックを選択するこ
とによって、前記現画像ブロックの現画像上の位置と選
択された参照画像ブロックの参照画像上の位置とにより
特定される動きベクトルを探索する動きベクトル探索装
置であって、前記現画像ブロックに含まれる画素データ
を出力する現画像ブロックデータ出力手段と、前記サー
チウインドウに含まれる画素データを出力するサーチウ
インドウデータ出力手段と、現画像ブロックと各参照画
像ブロックとの互いに位置的に対応する画素データ同士
の差の総和を表すディストーションを算出するディスト
ーション算出手段と、前記ディストーション算出手段に
より算出された前記ディストーションの中から前記現画
像ブロックに最も類似した参照画像ブロックを特定し、
動きベクトルを算出するディストーション特定手段と、
を備え、前記ディストーション算出手段は、前記現画像
ブロックデータ出力手段から画素データを入力して通過
させる現画像データ転送経路および前記サーチウインド
ウデータ出力手段から画素データを入力して通過させる
サーチウインドウデータ転送経路を有し、前記現画像デ
ータ転送経路上を転送中の画素データおよびサーチウイ
ンドウデータ転送経路上を転送中の画素データに基づい
て、現画像ブロックと各参照画像ブロックとの互いに位
置的に対応する画素データ同士の差を表す複数の局所デ
ィストーションを算出する局所ディストーション算出手
段と、前記局所ディストーション算出手段より算出され
た複数の局所ディストーションを総和する総和手段と、
を有し、前記サーチウインドウデータ転送経路が、第１
転送経路と第２転送経路とからなり、前記局所ディスト
ーション算出手段が、前記現画像データ転送経路上に配
置されて該現画像データ転送経路により直列に接続さ
れ、現画像データ転送経路を通過する画素データを一時
的に保持しながら転送する複数の現画像データ転送素子
と、前記サーチウインドウデータ転送経路上に配置され
て、サーチウインドウ転送経路を通過する画素データを
一時的に保持しながら転送する複数のサーチウインドウ
データ転送素子と、前記第１および前記第２転送経路の
何れかを選択する転送経路選択手段と、を有し、前記第
１転送経路は、全てのサーチウインドウデータ転送素子
を直列に接続し、前記第２転送経路は、サーチウインド
ウデータ転送素子を直列に接続する複数の転送経路から
なり、全てのサーチウインドウデータ転送素子のそれぞ
れは、前記複数の転送経路のいずれかに接続され、前記
転送経路選択手段により第１転送経路が選択されたと
き、第１転送経路により直列に接続された全てのサーチ
ウインドウデータ転送素子により前記サーチウインドウ
データの画素データが順次保持されながら転送され、前
記転送経路選択手段により第２転送経路が選択されたと
き、前記第２転送経路により接続されたサーチウインド
ウデータ転送素子により前記サーチウインドウデータの
画素データが順次保持されながら転送されることを特徴
とするものである。

【００３３】請求項２記載の発明は、上記課題を解決す
るため、請求項１記載の動きベクトル探索装置におい
て、Ｉ、Ｊ、Ｍ、Ｎ、ＰおよびＱを正の整数とし、Ｉは
Ｐより小さく、ＪはＱより小さく、ＰはＭより大きく、
ＱはＮより大きいとして、現画像ブロックがＭ行Ｎ列の
画素により構成され、サーチウインドウがＰ行Ｑ列の画
素により構成され、現画像データ転送素子が（Ｍ×Ｎ）
個で、Ｍ行Ｎ列のマトリックス状に配置され、サーチウ
インドウデータ転送素子が、（Ｐ×Ｎ）個でＰ行Ｎ列の
マトリックス状に配置され、前記第１転送経路は、サー
チウインドウデータ転送素子の各列の全ての素子を直列
に接続するとともに、各列の後端のサーチウインドウデ
ータ転送素子と隣の列の前端のサーチウインドウデータ
転送素子を接続し、全てのサーチウインドウデータ転送
素子を直列に転送する転送経路であり、前記第２転送経
路は、（Ｉ×Ｊ）個の転送経路からなり、サーチウイン
ドウデータ転送素子の各列をＩ個毎に直列に接続すると
ともに、各列の後端からＩ個のサーチウインドウデータ
転送素子のそれぞれと、Ｊ個隣の列の前端からＩ個のサ
ーチウインドウデータ転送素子のそれぞれを接続し、各
転送経路上のサーチウインドウデータ転送素子を直列に
転送する転送経路であることを特徴とするものである。

【００３４】請求項３記載の発明は、上記課題を解決す
るため、請求項１記載の動きベクトル探索装置におい
て、転送経路選択手段が、各サーチウインドウデータ転
送素子の第１転送経路および第２転送経路上に配置さ
れ、サーチウインドウデータ転送経路を選択するよう複
数のサーチウインドウデータ転送素子を接続するセレク
タであることを特徴とするものである。

【００３５】請求項４記載の発明は、上記課題を解決す
るため、請求項２記載の動きベクトル探索装置におい
て、局所ディストーション算出手段が、局所ディストー
ションを算出する演算子を有し、各現画像データ転送素
子、各サーチウインドウデータ転送素子および各演算素
子が、一つのプロセッサエレメントを構成し、（Ｍ×
Ｎ）個のプロセッサエレメントを有し、プロセッサエレ
メントと残りのサーチウインドウデータ転送素子が上下
のブロックに分かれることを特徴とするものである。

【００３６】請求項５記載の発明は、上記課題を解決す
るため、請求項１記載の動きベクトル探索装置におい
て、前記局所ディストーション算出手段は、前記サーチ
ウインドウに含まれる画素データと前記現画像ブロック
に含まれる画素データとの減算を行い、該減算結果を符
号を示す符号ビットと大きさを示す大きさビットとの組
合せで出力する減算手段と、前記減算手段の各大きさビ
ットと前記符号ビットとの加算を行い、前記減算結果の
差分絶対値を出力するゲート手段と、を有し、前記局所
ディストーション算出手段の出力は前記符号ビットと前
記差分絶対値との組で与えられることを特徴とするもの
である。

【００３７】請求項６記載の発明は、上記課題を解決す
るため、請求項５記載の動きベクトル探索装置におい
て、前記総和手段は、全出力が次段へ伝達され、ツリー
状となるよう複数段に配置した全加算回路を有し、前記
符号ビットは最下位ビットの前記全加算回路のキャリ入
力へ与えられることを特徴とするものである。

【００３８】

【発明の実施の形態】図１〜５７は本発明に関わる図面
である。図１は本発明の全体の構成の概略図である。本
発明は、現画像ブロックに含まれる画素データを出力す
る現画像ブロックデータ出力手段１１０と、サーチウイ
ンドウに含まれる画素データを出力するサーチウインド
ウデータ出力手段１２０と、現画像ブロックと各参照画
像ブロックとの互いに位置的に対応する画素データ同士
の差の総和を表すディストーションを算出するディスト
ーション算出手段１３０と、ディストーション算出手段
１３０により算出されたディストーションの中から現画
像ブロックに最も類似した参照画像ブロックを特定し、
動きベクトルを算出するディストーション特定手段１４
０と、を備えている。

【００３９】さらにディストーション算出手段１３０
は、局所ディストーション算出手段１３１および総和手
段１３２から構成される。局所ディストーション算出手
段１３１は、現画像ブロックデータ出力手段１１０から
画素データを入力して通過させる現画像データ転送経路
およびサーチウインドウデータ出力手段１２０から画素
データを入力して通過させるサーチウインドウデータ転
送経路を有している。また現画像データ転送経路上を転
送中の画素データおよびサーチウインドウデータ転送経
路上を転送中の画素データに基づいて、現画像ブロック
と各参照画像ブロックとの互いに位置的に対応する画素
データ同士の差を表す複数の局所ディストーションを算
出する。

【００４０】また総和手段１３２は、局所ディストーシ
ョン算出手段１３１より算出された複数の局所ディスト
ーションを総和する。図２は本発明の第１実施例におけ
る局所ディストーション算出手段１３１の構成例を示す
図である。その構成および作用は後述する。図３は本発
明の第２実施例における局所ディストーション算出手段
１３１の構成例を示す図である。その構成および作用は
後述する。図４は本発明の実施例における現画像ブロッ
ク２００とサーチウインドウ３００を示す図である。

【００４１】図７はプロセッサエレメントＰＥの構成例
を示す。プロセッサエレメントＰＥは、２段の縦続接続
されたサーチウインドウデータ保持用のレジスタ２５−
１および２５−２と、選択信号ＳＥＬ１に従ってレジス
タ２５−１および２５−２の一方の保持データを順次選
択するセレクタ６２と、現画像ブロックデータを保持す
るための２段の縦続接続されたレジスタ２６−１および
２６−２と、選択信号ＳＥＬ０に従ってレジスタ２６−
１および２６−２の一方の保持データを順次選択するセ
レクタ６０と、セレクタ６０および６２により選択され
たデータに対し局所ディストーションを求める差分絶対
値回路６４と、入力値としてプロセッサエレメントＰＥ
またはデータバッファＤＬから転送されるサーチウイン
ドウデータを選択信号ＳＳＷによって選択するセレクタ
２８と、を含む。レジスタ２５−１および２５−２は一
方のみを有してもよく、レジスタが２５−１または２５
−２の一方のみの場合セレクタ６２は不要である。また
レジスタ２６−１および２６−２の一方のみを有しても
よく、レジスタが２６−１または２６−２の一方のみの
場合セレクタ６０は不要である。レジスタが２５−１お
よび２５−２の２つを有し、かつ２６−１および２６−
２の２つを有する場合、同じクロック数で異なる２つの
動きベクトルを同時に求めることができる。

【００４２】次に、セレクタ２８の説明をする。セレク
タ２８は、プロセッサエレメントまたはデータバッファ
間を転送させる際に、縦方向および横方向とも跳ばしを
行わずに転送させるか、または縦方向のみ、横方向の
み、若しくは縦方向および横方向とも跳ばして転送させ
るかを選択できるように転送の仕方を切り替えるための
ものである。本実施例の場合、１つ跳びで転送させるの
でセレクタ２８は２入力セレクタとなっている。なお、
２つ跳びで転送させる場合はセレクタ２８は３入力セレ
クタとなり、同様にしてＩを自然数としてＩ個跳びで転
送させる場合はセレクタ２８は（Ｉ＋１）入力セレクタ
となる。

【００４３】例えば図２において、ＰＥ（０，０）は図
中の点線で示されており、点線内にセレクタ２８および
図７のセレクタ２８以外のものが斜線部で示されてい
る。図７のセレクタ２８は、選択信号ＳＳＷによってサ
ーチウインドウデータが、縦方向に対して隣接する１つ
下のプロセッサエレメントＰＥ若しくはデータバッファ
ＤＬ、または縦方向に対して２つ下のプロセッサエレメ
ントＰＥ若しくはデータバッファＤＬ、から転送される
かを切り替えることができる。セレクタ２８は、縦方向
および横方向とも跳ばしを行わずに動きベクトルの探索
を行なう場合、選択信号ＳＳＷの値を”０”とするとセ
レクタ２８の出力端子Ｙは入力端子Ａの値を選択し、一
方、縦方向に１つ跳びでサーチウインドウデータを転送
する場合、選択信号ＳＳＷの値を”１”とするとセレク
タ２８の出力端子Ｙは入力端子Ｂの値を選択する。

【００４４】具体的に説明すると、例えばＰＥ（０、
０）においては、選択信号ＳＳＷの入力値が”０”の場
合、セレクタ２８の出力端子Ｙは入力端子Ａの値、すな
わちＰＥ（０、１）に一時的に保存されているサーチウ
インドウデータを選択し、一方選択信号ＳＳＷの入力値
が”１”の場合、セレクタ２８の出力端子Ｙは入力端子
Ｂの値、すなわちＰＥ（０、２）に一時的に保持されて
いるサーチウインドウデータを選択する。

【００４５】図１０〜１６はデータバッファＤＬの構成
例を示す。図２および図３に示す７種類のデータバッフ
ァの構成を表す図である。すなわち、セレクタの有無お
よび種類に従って７種類のデータバッファに分類され
る。レジスタ３１〜３７はすべて共通のものであり、サ
ーチウインドウデータを一時的に保持するものである。
以下、７種類のデータバッファをレジスタの違いをもと
に説明する。

【００４６】図１０はデータバッファＤＬ（３，７）の
構成を示す図である。データバッファＤＬ（３，７）は
セレクタを有していない。レジスタ３１にはサーチウイ
ンドウデータ出力手段１２０から出力されるサーチウイ
ンドウデータが入力され一時的に保持される。ここで、
データバッファＤＬに記載されるａおよびｂは、それぞ
れ図２の第１実施例および図３の第２実施例の局所ディ
ストーション算出手段１３１の構成に係わることを表し
ている。

【００４７】図１１はデータバッファＤＬ（０，４），
ＤＬａ（０，５），ＤＬ（１，４），ＤＬａ（１，
５），ＤＬ（２，４），ＤＬａ（２，５），ＤＬ（３，
４），ＤＬ（３，５），ＤＬａ（３，６）の構成を示す
図である。セレクタ４１は２入力セレクタであり、出力
端子Ｙは選択信号Ｓ０の値によって入力端子Ａ、Ｂを選
択するものである。すなわち、選択信号Ｓ０の値が”
０”の場合、出力端子Ｙは入力値として入力端子Ａの信
号値を選択する。また、選択信号Ｓ０の値が”１”の値
の場合、出力端子Ｙは入力値として入力端子Ｂの信号値
を選択する。

【００４８】具体的に説明すると、例えばＤＬａ（１、
５）において、選択信号Ｓ０の値が”０”の場合、出力
端子Ｙは入力値として入力端子Ａの信号値を選択するの
で、ＤＬａ（１，６）に一時的に保持されているサーチ
ウインドウデータを入力値として選択する。この選択が
される場合、縦方向および横方向とも跳ばしを行わずに
動きベクトルの探索が行なわれる。

【００４９】また、選択信号Ｓ０の値が”１”の場合、
出力端子Ｙは入力値として入力端子Ｂの信号値を選択す
るので、ＤＬａ（１，７）に一時的に保持されているサ
ーチウインドウデータを入力値として選択する。この選
択がされる場合、縦方向に１つ跳ばしで動きベクトルの
探索が行なわれる。図１２はデータバッファＤＬａ
（０，７），ＤＬａ（１，７）の構成を示す図である。
セレクタ４２は４入力セレクタであり、出力端子Ｙは選
択信号Ｓ０およびＳ１の値によって入力端子Ａ、Ｂ、
Ｃ、Ｄを選択するものである。すなわち、選択信号Ｓ０
の値が”０”かつ選択信号Ｓ１の値が”０”の場合、出
力端子Ｙは入力値として入力端子Ａの信号値を選択す
る。また、選択信号Ｓ０の値が”０”かつ選択信号Ｓ１
の値が”１”の場合、出力端子Ｙは入力値として入力端
子Ｂの信号値を選択する。また、選択信号Ｓ０の値が”
１”かつ選択信号Ｓ１の値が”０”の場合、出力端子Ｙ
は入力値として入力端子Ｃの信号値を選択する。また、
選択信号Ｓ０の値が”１”かつ選択信号Ｓ１の値が”
１”の場合、出力端子Ｙは入力値として入力端子Ｄの信
号値を選択する。

【００５０】具体的に説明すると、例えばＤＬａ（１、
７）において、選択信号Ｓ０の値が”０”かつ選択信号
Ｓ１の値が”０”の場合、出力端子Ｙは入力値として入
力端子Ａの信号値を選択するので、ＰＥ（２，０）に一
時的に保持されているサーチウインドウデータを入力値
として選択する。この選択がされる場合、縦方向および
横方向とも跳ばしを行わずに動きベクトルの探索が行な
われる。

【００５１】また、選択信号Ｓ０の値が”０”かつ選択
信号Ｓ１の値が”１”の場合、出力端子Ｙは入力値とし
て入力端子Ｂの信号値を選択するので、ＰＥ（２，１）
に一時的に保持されているサーチウインドウデータを入
力値として選択する。この選択がされる場合、縦方向に
のみ１つ跳ばしで動きベクトルの探索が行なわれる。ま
た、選択信号Ｓ０の値が”１”かつ選択信号Ｓ１の値
が”０”の場合、出力端子Ｙは入力値として入力端子Ｃ
の信号値を選択するので、ＰＥ（３，０）に一時的に保
持されているサーチウインドウデータを入力値として選
択する。この選択がされる場合、横方向のみ１つ跳ばし
で動きベクトルの探索を行なわれる。

【００５２】また、選択信号Ｓ０の値が”１”かつ選択
信号Ｓ１の値が”１”の場合、出力端子Ｙは入力値とし
て入力端子Ｄの信号値を選択するので、ＰＥ（３，１）
に一時的に保持されているサーチウインドウデータを入
力値として選択する。この選択がされる場合、横方向お
よび縦方向とも１つ跳ばしで動きベクトルの探索が行な
われる。

【００５３】図１３はデータバッファＤＬａ（２，７）
の構成を示す図である。セレクタ４３は３入力セレクタ
であり、出力端子Ｙは選択信号Ｓ０およびＳ１の値によ
って入力端子Ａ、Ｂ、Ｃ／Ｄを選択するものである。す
なわち、選択信号Ｓ０の値が”０”かつ選択信号Ｓ１の
値が”０”の場合、出力端子Ｙは入力値として入力端子
Ａの信号値を選択する。また、選択信号Ｓ０の値が”
０”かつ選択信号Ｓ１の値が”１”の場合、出力端子Ｙ
は入力値として入力端子Ｂの信号値を選択する。また、
選択信号Ｓ０の値が”１”の場合、選択信号Ｓ１の値に
係わらず出力端子Ｙは入力値として入力端子Ｃ／Ｄの信
号値を選択する。

【００５４】具体的に説明すると、例えばＤＬａ（２、
７）において、選択信号Ｓ０の値が”０”かつ選択信号
Ｓ１の値が”０”の場合、出力端子Ｙは入力値として入
力端子Ａの信号値を選択するので、ＰＥ（３，０）に一
時的に保持されているサーチウインドウデータを入力値
として選択する。この選択がされる場合、縦方向および
横方向とも跳ばしを行わずに動きベクトルの探索が行な
われる。

【００５５】また、選択信号Ｓ０の値が”０”かつ選択
信号Ｓ１の値が”１”の場合、出力端子Ｙは入力値とし
て入力端子Ｂの信号値を選択するので、ＰＥ（３，１）
に一時的に保持されているサーチウインドウデータを入
力値として選択する。この選択がされる場合、縦方向に
のみ１つ跳ばしで動きベクトルの探索が行なわれる。ま
た、選択信号Ｓ０の値が”１”の場合、選択信号Ｓ１の
値にかかわらず、出力端子Ｙは入力値として入力端子Ｃ
／Ｄの信号値を選択するので、サーチウインドウデータ
出力手段１２０から入力口Ｉａ４を介して入力されるサ
ーチウインドウデータを入力値として選択する。この選
択がされる場合、横方向に１つ跳ばしで動きベクトルの
探索が行なわれる。

【００５６】図１４はデータバッファＤＬａ（０，
６），ＤＬａ（１，６），ＤＬａ（２，６）の構成を示
す図である。セレクタ４４は３入力セレクタであり、出
力端子Ｙは選択信号Ｓ０およびＳ１によって入力端子Ａ
／Ｃ、Ｂ、Ｄの値を選択するものである。すなわち、選
択信号Ｓ１の値が”０”の場合、選択信号Ｓ０の値にか
かわらず、出力端子Ｙは入力値として入力端子Ａ／Ｃの
信号値を選択する。また、選択信号Ｓ０の値が”０”か
つ選択信号Ｓ１の値が”１”の場合、出力端子Ｙは入力
値として入力端子Ｂの信号値を選択する。また、選択信
号Ｓ０の値が”１”かつ選択信号Ｓ１の値が”１”の値
の場合、出力端子Ｙは入力値として入力端子Ｄの信号値
を選択する。

【００５７】具体的に説明すると、例えばＤＬａ（１、
６）において、選択信号Ｓ１の値が”０”の場合、選択
信号Ｓ０の値にかかわらず、出力端子Ｙは入力値として
入力端子Ａ／Ｃの信号値を選択するので、ＤＬａ（１，
７）に一時的に保持されているサーチウインドウデータ
を入力値として選択する。この選択がされる場合、縦方
向に跳ばしを行わずに動きベクトルの探索が行なわれ
る。

【００５８】また、選択信号Ｓ０の値が”０”かつ選択
信号Ｓ１の値が”１”の場合、出力端子Ｙは入力値とし
て入力端子Ｂの信号値を選択するので、ＰＥ（２，０）
に一時的に保持されているサーチウインドウデータを入
力値として選択する。この選択がされる場合、縦方向に
のみ１つ跳ばしで動きベクトルの探索が行なわれる。ま
た、選択信号Ｓ０の値が”１”かつ選択信号Ｓ１の値
が”１”の場合、出力端子Ｙは入力値として入力端子Ｄ
の信号値を選択するので、ＰＥ（３，０）に一時的に保
持されているサーチウインドウデータを入力値として選
択する。この選択がされる場合、横方向および縦方向と
も１つ跳ばしで動きベクトルの探索が行なわれる。

【００５９】図１５はデータバッファＤＬｂ（０，
６），ＤＬｂ（１，６），ＤＬｂ（２，６），ＤＬｂ
（０，７），ＤＬｂ（１，７），ＤＬｂ（２，７）の構
成を示す図である。セレクタ４６は２入力セレクタであ
り、出力端子Ｙは選択信号Ｓ０の値によって入力端子
Ｂ、Ｄを選択するものである。すなわち、選択信号Ｓ０
の値が”０”の場合、出力端子Ｙは入力値として入力端
子Ｂの信号値を選択する。また、選択信号Ｓ０の値が”
１”の値の場合、出力端子Ｙは入力値として入力端子Ｄ
の信号値を選択する。ここで注意すべきは、縦方向の跳
ばしが行われない場合、後述するように、サーチウイン
ドウを拡大させるためにデータバッファ数を増加させる
必要がないため、本データバッファは使用されないとい
う点である。

【００６０】具体的に説明すると、例えばＤＬｂ（１、
６）において、選択信号Ｓ０の値が”０”の場合、出力
端子Ｙは入力値として入力端子Ｂの信号値を選択するの
で、ＰＥ（２，０）に一時的に保持されているサーチウ
インドウデータを入力値として選択する。この選択がさ
れる場合、縦方向のみ跳ばして転送され、動きベクトル
の探索が行なわれる。

【００６１】また、選択信号Ｓ０の値が”１”の場合、
出力端子Ｙは入力値として入力端子Ｄの信号値を選択す
るので、ＰＥ（３，０）に一時的に保持されているサー
チウインドウデータを入力値として選択する。この選択
がされる場合、縦方向および横方向ともに１つ跳ばしで
転送され、動きベクトルの探索が行なわれる。図１６は
データバッファＤＬｂ（０，５），ＤＬｂ（１，５），
ＤＬｂ（２，５）の構成を示す図である。セレクタ４５
は３入力セレクタであり、出力端子Ｙは選択信号Ｓ０お
よびＳ１の値によって入力端子Ａ、Ｂ、Ｃを選択するも
のである。すなわち、選択信号Ｓ０の値が”０”かつ選
択信号Ｓ１の値が”０”の場合、出力端子Ｙは入力値と
して入力端子Ａの信号値を選択する。また、選択信号Ｓ
０の値が”０”かつ選択信号Ｓ１の値が”１”の場合、
出力端子Ｙは入力値として入力端子Ｂの信号値を選択す
る。また、選択信号Ｓ０の値が”１”の場合、選択信号
Ｓ１の値にかかわらず出力端子Ｙは入力値として入力端
子Ｃの信号値を選択する。ここで注意すべきは、本デー
タバッファは、縦方向の跳ばしが行われない場合、後述
するようにデータバッファＤＬｂ（０，６），ＤＬｂ
（１，６），ＤＬｂ（２，６），ＤＬｂ（０，７），Ｄ
Ｌｂ（１，７），ＤＬｂ（２，７），ＤＬｂ（３，６）
およびＤＬｂ（３，７）が使用されないため、実際上、
局所ディストーション算出手段１３１の列の最後尾とし
て接続されている点である。

【００６２】具体的に説明すると、例えばＤＬｂ（２、
５）において、選択信号Ｓ０の値が”０”かつ選択信号
Ｓ１の値が”０”の場合、出力端子Ｙは入力値として入
力端子Ａの信号値を選択するので、ＰＥ（３，０）に一
時的に保持されているサーチウインドウデータを入力値
として選択する。この選択がされる場合、縦方向および
横方向とも跳ばしを行わずに動きベクトルの探索が行な
われる。

【００６３】また、選択信号Ｓ０の値が”０”かつ選択
信号Ｓ１の値が”１”の場合、出力端子Ｙは入力値とし
て入力端子Ｂの信号値を選択するので、ＤＬｂ（２，
７）に一時的に保持されているサーチウインドウデータ
を入力値として選択する。この選択がされる場合、縦方
向に１つ跳ばしで動きベクトルの探索が行なわれる。ま
た、選択信号Ｓ０の値が”１”の場合、選択信号Ｓ１の
値にかかわらず、出力端子Ｙは入力値として入力端子Ｃ
の信号値を選択するので、サーチウインドウデータ出力
手段１２０から入力されるサーチウインドウデータを入
力口Ｉｂ２を介して入力値として選択する。この選択が
される場合、横方向のみ１つ跳ばしで動きベクトルの探
索が行なわれる。

【００６４】図８は図７に示す差分絶対値回路６４の具
体的構成の一例を示す図である。差分絶対値回路６４は
図７のセレクタ６０からのサーチウインドウデータを負
入力（Ａ）に受け、かつセレクタ６２からの現画像ブロ
ックデータを正入力（Ｂ）に受ける減算器７０を含む。
減算器７０はその減算結果を符号付マルチビット表示す
る。符号ビットＳ（Ａ＞Ｂ）はサーチウインドウデータ
が現画像データより大きい場合には”１”となり、そう
でない場合に”０”となる。この減算器７０の出力が２
の補数表示されるものとする。

【００６５】差分絶対値回路６４はさらに、符号ビット
Ｓ（Ａ＞Ｂ）と減算器７０からの残りのビット（大きさ
ビットと称す）とを受けるＥｘＯＲ回路７２と、符号ビ
ットＳ（Ａ＞Ｂ）に応じてＥｘＯＲ回路７２の出力に１
を加算するインクリメンタ７４を含む。インクリメンタ
７４は、符号Ｓ（Ａ＞Ｂ）が”１”の場合にＥｘＯＲ回
路７２の出力に１を加算する。インクリメンタ７４は、
符号Ｓ（Ａ＞Ｂ）が”０”の場合にはＥｘＯＲ回路７２
の出力に１を加算せずにそのまま通過させる。ＥｘＯＲ
回路７２は、マルチビットの画素データに対して演算を
行なう。画素データの各ビットが符号ビットの値に従っ
て反転または非反転される。

【００６６】ＥｘＯＲ回路７２は、符号ビットＳ（Ａ＞
Ｂ）が”０”の場合には減算器７０からの大きさビット
（演算器７０の出力のうち符号ビットを除いた残りのビ
ット）をそのまま通過させる。符号ビットＳ（Ａ＞Ｂ）
が”１”の場合、ＥｘＯＲ回路７２は減算器７０の大き
さビットの各ビットを反転する。すなわち、ＥｘＯＲ回
路７２は減算器７０からの大きさビットの各ビットと符
号ビットＳ（Ａ＞Ｂ）とのモジュール２の加算を実行す
る。

【００６７】演算器７０は（Ｂ−Ａ）の演算を行なう。
この演算結果が正であれば符号ビットＳ（Ａ＞Ｂ）は”
０”であり、負の場合には符号ビットＳ（Ａ＞Ｂ）は”
１”である。減算器７０の出力は２の補数表示されてい
る。したがって、ＥｘＯＲ回路７２およびインクリメン
タ７４により符号ビットＳ（Ａ＞Ｂ）に従って演算器出
力のビット反転および１増分を選択的に行なうことによ
り|Ｂ−Ａ|の差分絶対値が出力される。このとき、各プ
ロセッサエレメントからそれぞれ求められた差分絶対値
が総和手段１３２へ入力され、その総和値が求められ
る。したがって、各動きベクトルに対するディストーシ
ョンが算出される。

【００６８】図９は図７に示す差分絶対値回路６４の他
の具体的構成例を示す図である。図９に示す差分絶対値
回路６４は、サーチウインドウデータと現画像データと
演算を行う減算器７０と、減算器７０の出力の大きさビ
ットと符号ビットＳ（Ａ＞Ｂ）を受けるＥｘＯＲ回路７
２を含んでいる。この図９に示す差分絶対値回路６４
は、図８に示す差分絶対値回路６４と異なりインクリメ
ンタ７４を含んでいない。インクリメンタ７４の機能
は、符号ビットＳ（Ａ＞Ｂ）が”１”のときにＥｘＯＲ
回路７２の出力に１を加算することである。図９に示す
差分絶対値回路６４では、この１を加算する動作は、実
行されず次の総和手段１３２で実行される。すなわち、
図９に示す差分絶対値回路６４は、差分絶対値ＰＥ＃と
符号ビットＳ＃を出力し、総和手段１３２に入力する。

【００６９】図１７は、図９に示す差分絶対値回路６４
を用いた場合の総和手段１３２の全体の構造を示すブロ
ック図である。図１７において総和手段１３２は、プロ
セッサエレメント数をｎとするとき、各プロセッサエレ
メントからそれぞれ差分絶対値ＰＥ＃１〜ＰＥ＃ｎと符
号ビットＳ＃１〜Ｓ＃ｎが入力され、その総和を算出す
る。差分絶対値ＰＥ＃１〜ＰＥ＃ｎはマルチビットデー
タであり、符号ビットＳ＃１〜Ｓ＃ｎは１ビットデータ
である。総和手段１３２の構成は、差分絶対値ＰＥ＃１
〜ＰＥ＃ｎを受ける、全加算器からなるコンプレッサで
構成される。符号ビットＳ＃１〜Ｓ＃ｎはこのコンプレ
ッサの最下位ビットのキャリ入力へ与えられる。これに
より加算操作の高速化および装置規模の低減が図られ
る。

【００７０】図１８は、図１７に示す総和手段１３２の
具体的構成の一例を示す図である。プロセッサエレメン
トの数に応じて構成が拡張される。図１８において、総
和手段１３２は、４つのプロセッサエレメントからの差
分絶対値に対応する値ＰＥ＃１〜ＰＥ＃４を入力Ａ、
Ｂ、ＣおよびＤにそれぞれ受けかつキャリ入力に符号ビ
ットＳ＃１を受けて加算を行い、その加算結果を２出力
ＥおよびＦから出力する４対２コンプレッサ１０２ａ
と、差分絶対値に対応する値ＰＥ＃５〜ＰＥ＃８を入力
Ａ、Ｂ、ＣおよびＤにそれぞれ受けかつキャリ入力に符
号ビットＳ＃２を受けて加算を行い、その加算結果を２
出力ＥおよびＦから出力する４対２コンプレッサ１０２
ｂと、４対２コンプレッサ１０２ａおよび１０２ｂの出
力をその４入力Ａ、Ｂ、ＣおよびＤに受け、かつその最
下位ビット位置に符号ビットＳ＃３、Ｓ＃４およびＳ＃
５を受ける４対２コンプレッサ１０２ｃを含んでいる。
４対２コンプレッサ１０２ｃが３ビットの符号ビットＳ
＃３、Ｓ＃４およびＳ＃５を受けることができるのは、
この４対２コンプレッサ１０２ｃが３段の全加算回路を
含んでいるためである。

【００７１】総和手段１３２はさらに、４対２コンプレ
ッサ１０２ｃの出力（ＥおよびＦ）をその入力Ａおよび
Ｂに受けかつ最下位ビットのキャリ入力に符号ビットＳ
＃６、Ｓ＃７およびＳ＃８を受ける加算器１０４を含
む。そして、加算器１０４から総和結果が出力される。
この総和手段１３２は、ワレスツリー（Ｗａｌｌａｃｅ
Ｔｒｅｅ）の構成を備え、キャリ伝搬遅延を最小にし
て高速で加算を実行することができる。ここで、図１８
の示す総和手段１３２は、累算器を備えていない。演算
速度がサーチウインドウデータ転送速度よりも早い場合
には、複数回の加算を実行する必要がある。このため、
プロセッサエレメントが複数の現画像データ転送素子を
備える場合、加算回路１０４の出力部に累算器が設けら
れる。各演算サイクル毎にプロセッサエレメントから差
分絶対値和データが総和手段１３２へ転送されてもよ
い。

【００７２】上述の構成においては、符号ビットを最下
位ビットのキャリ入力に与えているため、小さい回路規
模で高速で加算を実行することができる。次にこの４対
２コンプレッサの構成および総和手段１３２の具体的構
成について説明する。図１９は図１８に示す４対２コン
プレッサの具体的構成の一例を示す図である。図１９に
示す４対２コンプレッサは、与えられたデータが４ビッ
ト幅の場合に対する構成を備える。入力データのビット
幅が大きくなればこの図１９に示す構成が拡張される。

【００７３】図１９において、４対２コンプレッサ１０
２は、各々が入力ＡおよびＢと、キャリ入力Ｃｉｎと、
キャリ出力Ｃｏと、和出力Ｓとを備える並列に配列され
る全加算回路１１０ａ、１１０ｂ、１１０ｃおよび１１
０ｄを含む。全加算回路１１０ａ〜１１０ｄのＡ入力お
よびＢ入力に４ビット入力データＡ＜３；０＞およびＢ
＜３；０＞が与えられかつキャリ入力Ｃｉｎに入力デー
タＣ＜３；０＞が与えられる。ここで、「Ａ＜３；０
＞」はデータＡがビットＡ０を最下位ビットとしかつビ
ットＡ３を最上位ビットとする４ビットデータであるこ
とを示す。

【００７４】４対２コンプレッサ１０２はさらに、初段
の全加算回路１１０ａ〜１１０ｄの和出力Ｓおよびキャ
リ出力Ｃｏと入力データＤ＜３；０＞との加算を行う全
加算回路１１０ｅ、１１０ｆ、１１０ｇおよび１１０ｈ
を含む。全加算回路１１０ａ〜１１０ｄと全加算回路１
１０ｅ〜１１０ｈとは桁合わせして配置される。初段の
全加算回路１１０ａ〜１１０ｄの和出力Ｓは次段の対応
の全加算回路の入力（ＡまたはＢ）に与えられる。初段
の全加算回路１１０ａ〜１１０ｄのキャリ出力Ｃｏは次
段の全加算回路において１ビット上位の全加算回路のキ
ャリ入力へ与えられる。

【００７５】全加算回路（ＦＡ）において最下位ビット
の全加算回路１１０ｈのキャリ入力１０４には０が印加
される。すなわち全加算回路１１０ｈのキャリ入力は空
きキャリとなる。本実施例においてはこの空きキャリ１
０４へ符号ビットＳ＃を与える。４対２コンプレッサ１
０２からは５ビットデータＥ＜４；０＞およびＦ＜４；
０＞が出力される。全加算回路（ＦＡ）１１０ｅ〜１１
０ｈのキャリ出力がデータビットＥ＜４；０＞を与え
る。初段の全加算回路１１０ａのキャリ出力がデータビ
ットＦ＜４；０＞を与える。

【００７６】図１９に示す４対２コンプレッサ１０２の
構成においては、キャリ伝搬は存在しない。演算に要す
る遅延時間は全加算回路２段分だけである。これにより
高速で加算を実行することができる。また、空きキャリ
１０４へ符号ビットＳ＃を与える構成とするため、回路
規模を増加させることなく差分絶対値の加算を実行する
ことができる。

【００７７】図２０は、図１８に示す回路構成の具体的
接続形態を示す図である。この図２０に示す総和手段１
３２は図１９に示す４対２コンプレッサを利用する。
今、差分絶対値Ｐ＃ｉを（Ｐｉ３，Ｐｉ２，Ｐｉ１，Ｐ
ｉ０）で表す。４対２コンプレッサ１１０ａは差分絶対
値Ｐ＃１〜Ｐ＃３を加算する全加算回路ＦＡ１〜ＦＡ４
と、全加算回路ＦＡ１〜ＦＡ４の出力と差分絶対値Ｐ＃
４とを加算する全加算回路ＦＡ５、ＦＡ６、ＦＡ７およ
びＦＡ８を含む。全加算回路ＦＡ８のキャリ入力へ符号
ビットＳ＃１が与えられる。

【００７８】４対２コンプレッサ１０２ｂは差分絶対値
Ｐ＃５〜Ｐ＃７を加算する全加算回路ＦＡ９、ＦＡ１
０、ＦＡ１１およびＦＡ１２と、全加算回路ＦＡ９〜Ｆ
Ａ１２の出力と差分絶対値Ｐ＃８とを加算する全加算回
路ＦＡ１３、ＦＡ１４、ＦＡ１５およびＦＡ１６を含
む。全加算回路ＦＡ１６のキャリ入力へ符号ビットＳ＃
２が与えられる。

【００７９】４対２コンプレッサ１０２ｃは、４対２コ
ンプレッサ１０２ａの出力と、４対２コンプレッサ１０
２ａの一方出力（全加算回路ＦＡ１３〜ＦＡ１６の和出
力および全加算回路ＦＡ９のキャリ出力）とを加算する
全加算回路ＦＡ１７〜ＦＡ２１と、全加算回路ＦＡ１７
〜ＦＡ２１の出力と４対２コンプレッサ１０２ｂの他方
出力（全加算回路ＦＡ１３〜ＦＡ１６のキャリ出力）を
加算する全加算回路ＦＡ２２ないしＦＡ２６を含む。全
加算回路ＦＡ２６のキャリ入力および一方入力へ符号ビ
ットＳ＃４およびＳ＃５が与えられる。

【００８０】加算器１０４は、符号ビットＳ＃６ないし
Ｓ＃８を加算する全加算回路ＦＡ２７と、この全加算回
路ＦＡ２７の出力と４対２コンプレッサ１０２ｃの出力
とを加算する全加算回路ＦＡ２８ないしＦＡ３３と、全
加算回路ＦＡ２８ないしＦＡ３３の出力を受けて最終加
算結果を出力する全加算回路ＦＡ３４ないしＦＡ３９を
含む。全加算回路ＦＡ２８ないしＦＡ３３は３対２コン
プレッサを構成する。全加算回路ＦＡ３４〜ＦＡ３９は
リップキャリ型加算器を構成する。他の加算器の構成
（たとえば桁上げ先見型加算器）が利用されてもよい。

【００８１】このように、図２０に示すようにコンプレ
ッサを利用して加算を行うことによりキャリ伝搬に伴う
遅延を最小限に抑えることができ、高速で加算すること
ができる。図２１は図１に示すディストーション特定手
段１４０の具体的構成を示す図である。ディストーショ
ン特定手段１４０はディストーション算出手段１３０か
ら与えられるディストーションを格納するためのレジス
タラッチ１４１と、レジスタラッチ１４１に格納された
ディストーションとディストーション算出手段１３０か
ら新たに与えられるディストーションの大きさを比較す
る比較器１４２と、ディストーション算出サイクル数を
カウントするカウンタ１４３と、比較器１４２の出力に
応答してカウンタ１４３のカウント値を格納するレジス
タラッチ１４４を含む。レジスタラッチ１４４から動き
ベクトルがそのまま出力されてもよく、また図において
破線のブロック１５４で示すように、レジスタラッチ１
４４の出力を所定の形式でコード化するデコーダが設け
られてもよい。次に動作について説明する。

【００８２】１つの現画像ブロックに対する動きベクト
ルの動作開始時においてカウンタ１４３、レジスタラッ
チ１４１、およびレジスタラッチ１４４はリセットされ
る。レジスタラッチ１４１の初期設定値は最大ディスト
ーションよりも大きい値に設定される（例えば全ビッ
ト”１”）。１つのディストーションが与えられると、
比較器１４２はこのレジスタラッチ１４１に格納された
ディストーションとディストーション算出手段１３０か
ら新たに与えられるディストーションの大きさを比較す
る。比較器１４２は、ディストーション算出手段１３０
から新たに与えられるディストーションはレジスタラッ
チ１４１に格納されたディストーションより小さいとき
にはラッチ信号を発生する。レジスタラッチ１４１はこ
のラッチ指示信号に応答してディストーション算出手段
１３０から与えられるディストーションを格納する。同
様にレジスタラッチ１４４もカウンタ１４３のカウント
値を動きベクトルの候補としてラッチする。

【００８３】次のディストーションに対してカウンタ
は、カウンタに入力される制御信号に応答してカウント
値を１インクリメントする。ディストーション算出が完
了すると、比較器１４２はディストーション算出手段１
３０から新たに与えられたディストーションとレジスタ
ラッチ１４１に格納された値との大きさの比較を行な
う。新たに与えられたディストーションがレジスタラッ
チ１４１に格納されている値よりも大きい場合には、比
較器１４２はラッチ信号を発生しない。新たに与えられ
たディストーションがレジスタラッチ１４１に格納され
ている値よりも小さいときにはラッチ指示信号が発生さ
れる。この動作をすべてのディストーションに対して実
行する。これによりレジスタラッチ１４１には、すべて
のディストーションのうち最小のディストーションが格
納される。またレジスタラッチ１４４にはその最小のデ
ィストーションを与える動作サイクルを示すカウンタ１
４３のカウント値がラッチされる。このカウント値が動
きベクトルとして利用される。

【００８４】この動きベクトルが求められた後は再びカ
ウント１４３、レジスタラッチ１４１および１４４が初
期設定され、次の現画像ブロックに対する動きベクトル
の算出が実行される。画像データ格納のためのフレーム
メモリとしては、ダイナミック・ランダム・アクセス・
メモリまたはスタテック・ランダム・アクセス・メモリ
が用いられてもよい。ランダム・アクセス・メモリの場
合、連続データを読出す場合にページモードなどの高速
動作モードが利用される。

【００８５】次に本発明の実施例の特徴点の説明を行
う。《第１実施例》まず、本発明の第１実施例の説明を行
う。図２は本発明の第１実施例における局所ディストー
ション算出手段１３１の構成例を示す図である。

【００８６】本実施例において、プロセッサエレメント
ＰＥおよびデータバッファＤＬ内にあるそれぞれセレク
タ２８およびセレクタ４１〜４４によってプロセッサエ
レメントＰＥおよびデータバッファＤＬ間の接続を切り
替えることができる。すなわち、セレクタ２８およびセ
レクタ４１〜４４によって、第１転送経路と、プロセッ
サエレメントＰＥおよびデータバッファＤＬの縦方向の
みを１つ跳びに転送する第２転送経路と、横方向のみを
１つ跳びに転送する第２転送経路と、縦方向および横方
向とも１つ跳びに転送する第２転送経路と、の４種類の
サーチウインドウデータの転送経路を選択することがで
きる。

【００８７】前述のように、セレクタ２８およびセレク
タ４１〜４４にはこの４種類のサーチウインドウデータ
転送経路を選択するためのモード選択信号ＳＳＷ、Ｓ０
およびＳ１によって、入力されるサーチウインドウデー
タが保持されているプロセッサエレメントＰＥまたはデ
ータバッファＤＬが選択される。なお、モード選択信号
ＳＳＷ、Ｓ０およびＳ１は動きベクトル算出開始時に入
力されれば、モードを替えない限り同じ信号値である。

【００８８】セレクタ２８およびセレクタ４１〜４４
が、サーチウインドウデータ転送経路として、第１転送
経路、または上記３種類の何れかの第２転送経路を選択
した場合をそれぞれ第１モード、第２モード、第３モー
ドおよび第４モードとして以下説明する。なお、第１〜
４モードはプロセッサエレメントＰＥおよびデータバッ
ファＤＬの電気的接続が変化するだけで回路構成は同じ
である。＜第１モード＞図４０〜５７を参照して本発明に係わる
動きベクトル探索装置の第１実施例の第１モードを説明
する。本モードは、図６７に示すようにプロセッサエレ
メントＰＥおよびデータバッファＤＬがすべて直列に接
続された第１転送経路によってサーチウインドウデータ
が転送され動きベクトルを求めるものである。特開平６
−１１３２９０号公報には第１モードのみで探索する動
きベクトル探索装置が報告されている。本発明でも一つ
のモードとして選択できるので以下説明する。

【００８９】第１モードでは、図２において各プロセッ
サエレメントＰＥのセレクタ２８および各データバッフ
ァＤＬのセレクタ４１〜４４は、それぞれ選択信号ＳＳ
Ｗ，ＳＯ，Ｓ１の値をそれぞれ”０”、”０”、”０”
としているので出力端子Ｙは全て入力端子Ａを選択して
いる。したがって、セレクタ４１〜４４は、サーチウイ
ンドウデータの転送経路として第１転送経路を選択する
ことができるので、プロセッサエレメントＰＥおよびデ
ータバッファＤＬがすべて直列に接続される。

【００９０】本モードのデータの転送の仕方は、図４０
〜図５７に説明されており、プロセッサエレメントＰＥ
およびデータバッファＤＬのデータ保持状態を示してい
る。現画像ブロックデータ出力手段１１０とサーチウイ
ンドウデータ出力手段１２０はそれぞれ現画像ブロック
データおよびサーチウインドウデータをクロックパルス
信号の１パルス毎にパルスに同期して出力されるととも
にプロセサエレメントＰＥまたはデータバッファＤＬに
保持されているデータは次のプロセサエレメントＰＥま
たはデータバッファＤＬに転送される。以下、開始時か
らの１パルス毎のクロックパルス信号を１クロック、２
クロック、・・・と呼ぶ。

【００９１】図４０〜４４は、それぞれ１、３、５、８
および１２クロック目のデータ保持状態を示す図であ
る。現画像ブロックデータおよびサーチウインドウデー
タはそれぞれプロセサエレメントまたはデータバッファ
の列方向および行方向の１つ毎に転送されていることが
わかる。図４５は、１６クロック目のデータ保持状態を
示す図である。動きベクトルを探索する際の図４の現画
像ブロック２００のデータはすべてプロセサエレメント
に入力されていることがわかる。以下、この現画像ブロ
ックデータは探索範囲をすべて探索するまで同じプロセ
サエレメントに保持される。図４６は、２４クロック目
のデータ保持状態を示す図である。図４７〜５７は、そ
れぞれ３２、３３、３４、３５、３６、４０、４４、４
８、５６、６４および６８クロック目のデータ保持状態
を示す図である。図４７では、プロセサエレメントまた
はデータバッファにすべてサーチウインドウデータは保
持され、各プロセサエレメントはベクトル（−２，−
２）に対する局所ディストーションを算出し、その総和
が総和手段１３２で算出され、ベクトル（−２，−２）
に対応するディストーションが求まる。ここでサーチウ
インドウデータが参照画像ブロックとしてｂ（２，
２）、ｂ（３，２）、ｂ（４，２）、ｂ（５，２）、ｂ
（２，３）、ｂ（３，３）、ｂ（４，３）、ｂ（５，
３）、ｂ（２，４）、ｂ（３，４）、ｂ（４，４）、ｂ
（５，４）、ｂ（２，５）、ｂ（３，５）、ｂ（４，
５）、ｂ（５，５）を取る場合をベクトル（０，０）と
して定義している。

【００９２】以下同様にして、図４８〜５７でそれぞれ
ベクトル（−２，−１）、（−２，０）、（−２，
１）、（−２，２）、（−１，−２）、（−１，２）、
（０，−２）、（１，−２）、（２，−２）、（２，
２）のディストーションが求まる際のデータ保持状態を
示している。このようにして図４に示す現画像ブロック
２００に対してサーチウインドウ３００の範囲で取り得
るサーチウインドウブロックのディストーションがすべ
て求まり、この中から最小のディストーションが特定さ
れ、動きベクトルが求められる。動きベクトル算出の説
明は、前述の通りなので省略する。なお、本モードにお
いて、参照画像転送経路として、１個の第１転送経路を
とる。

【００９３】＜第２モード＞図５および図２２〜３１を
参照して本発明に係わる動きベクトル探索装置の第１実
施例の第２モードの説明をする。本モードは、プロセッ
サエレメントＰＥおよびデータバッファＤＬが縦方向に
跳ばして接続された第２転送経路によってサーチウイン
ドウデータが転送され動きベクトルを求めるものであ
る。なお、図２２〜３１には本モードとして縦方向に１
つ跳ばしで転送する一例が示されているが、セレクタの
選択数を増加させることにより縦方向の跳ばしを増加さ
せることができる。

【００９４】図５は第２モードにおける参照画像ブロッ
ク４１０〜４４０とサーチウインドウ３００の転送動作
を説明するための図である。本モードのサーチウインド
ウの探索範囲は、第１モードと同様ベクトルのｙ座標が
−２〜＋２の範囲である。図２７は、現画像ブロック２
００の現画像ブロックデータがプロセッサエレメントＰ
Ｅに保持され、参照画像ブロック４１０のサーチウイン
ドウデータがプロセッサエレメントＰＥに保持されてい
る状態を示している。このとき、ベクトル（−２，−
２）に対応するディストーションが算出される。図２８
は、図２７の保持状態から１クロック後の保持状態を示
している。現画像ブロック２００の現画像ブロックデー
タがプロセッサエレメントＰＥに保持され、参照画像ブ
ロック４２０のサーチウインドウデータがプロセッサエ
レメントＰＥに保持される状態を示している。このと
き、ベクトル（−２，０）に対応するディストーション
が算出される。この１クロックで、サーチウインドウデ
ータは縦方向に対して図５のＴＳ１の範囲まで探索され
たこととなる。

【００９５】図２９は、図２８の保持状態から１クロッ
ク後の保持状態を示している。現画像ブロック２００の
現画像ブロックデータがプロセッサエレメントＰＥに保
持され、参照画像ブロック４３０のサーチウインドウデ
ータがプロセッサエレメントＰＥに保持されている状態
を示している。このとき、ベクトル（−２，２）に対応
するディストーションが算出される。この１クロック
で、サーチウインドウデータは縦方向に対して図５のＴ
Ｓ２の範囲まで探索されたこととなる。

【００９６】このように、図５の斜線部が示すように各
プロセッサエレメントはサーチウインドウ３００を縦方
向に１つ跳びで探索するため、探索精度を粗くするかわ
りに探索時間を短くすることができる。すなわち、第１
モードによるサーチウインドウの縦方向の探索時間の１
／２の時間で探索することができる。したがって、縦方
向に跳ばしを行わない動きベクトル探索と比べて同一の
探索範囲を短時間で探索することができる。

【００９７】次にセレクタ４１〜４４がサーチウインド
ウデータの転送経路として第２転送経路を選択をする場
合のデータの転送の仕方を説明する。図２２〜図３１
は、動きベクトルを求める際のプロセッサエレメントＰ
ＥおよびデータバッファＤＬのデータ保持状態を示す図
である。図２２〜図３１において、各プロセッサエレメ
ントＰＥの左側および各データバッファＤＬにサーチウ
インドウデータが保持され、各プロセッサエレメントＰ
Ｅの右側に現画像ブロックデータが保持されているとし
て示されている。

【００９８】第２モードでは、図２において各プロセッ
サエレメントＰＥのセレクタ２８および各データバッフ
ァＤＬのセレクタ４１〜４４は、それぞれ選択信号ＳＳ
Ｗ，ＳＯ，Ｓ１の値をそれぞれ”１”、”０”、”１”
としているので出力端子Ｙは全て入力端子Ｂを選択して
いる。よって、プロセッサエレメントＰＥおよびデータ
バッファＤＬの縦方向のみを１つ跳びに転送する第２転
送経路を選択することができることが分かる。

【００９９】現画像ブロックデータ出力手段１１０と最
初に転送するプロセッサエレメントＰＥ（３，３）は電
気的に接続されており、現画像ブロックデータは現画像
ブロックデータ出力手段１１０から出力され、ＰＥ
（３，３）に入力される。各プロセッサエレメントＰＥ
および各データバッファＤＬの座標を図２のように設定
すると、現画像データ転送経路において、同じ列の各プ
ロセッサエレメントＰＥはそれぞれ電気的に接続されて
おり、列の一番上のＰＥ（１，０）、ＰＥ（２，０）お
よびＰＥ（３，０）は、それぞれ次の列のＰＥ（０，
３）、ＰＥ（１，３）およびＰＥ（２，３）に電気的に
接続されている。ＰＥ（０，０）は、ディストーション
を算出した後現画像ブロックデータを排出する。

【０１００】サーチウインドウデータ出力手段１２０と
データバッファＤＬ（３、６）およびＤＬ（３、７）は
それぞれ電気的に接続されており、サーチウインドウデ
ータ出力手段１２０から同時に出力されるサーチウイン
ドウデータはそれぞれＤＬ（３、６）およびＤＬ（３、
７）に入力する。同じ列の各プロセッサエレメントＰＥ
および各データバッファＤＬはそれぞれ縦方向に１つ跳
びに電気的に接続されている。列の一番上のＰＥ（１，
０）、ＰＥ（２，０）およびＰＥ（３，０）は、それぞ
れ次の列のＤＬａ（０，６）、ＤＬａ（１，６）および
ＤＬａ（２，６）に電気的に接続されている。また、Ｐ
Ｅ（１，１）、ＰＥ（２，１）およびＰＥ（３，１）
は、それぞれ次の列のＤＬａ（０，７）、ＤＬａ（１，
７）およびＤＬａ（２，７）に電気的に接続されてい
る。ＰＥ（０，０）およびＰＥ（０，１）は、ディスト
ーションを算出した後サーチウインドウデータを排出す
る。

【０１０１】図２２〜３１はその際のプロセッサエレメ
ントおよびデータバッファのデータ保持状態を示す図で
ある。ＰＥ（３，３）に現画像ブロックデータが入力さ
れ、ＤＬ（３、６）およびＤＬ（３、７）にサーチウイ
ンドウデータが同時に入力される。図２２〜２６はそれ
ぞれ１、２、５、７、１１クロック目のデータ保持状態
を示す図である。

【０１０２】例えば、図２５において、クロックパルス
信号の７クロック目に同期して、現画像ブロックデータ
ａ（０，０）はＰＥ（２，１）に保持されるが、８クロ
ック目に同期して、ａ（０，０）はＰＥ（２，０）に保
持され、９クロック目に同期して、ａ（０，０）はＰＥ
（１，３）に保持される。また、図２５において、クロ
ックパルス信号の７クロック目に同期して、サーチウイ
ンドウデータｂ（０，０）はＰＥ（２，２）に保持され
るが、８クロック目に同期して、ｂ（０，０）はＰＥ
（２，０）に保持され、９クロック目に同期して、ｂ
（０，０）はＤＬａ（１，６）に保持され、１０クロッ
ク目に同期して、ｂ（０，０）はＤＬ（１，４）に保持
される。同様にして他の現画像ブロックデータおよびサ
ーチウインドウデータは転送保持される。

【０１０３】図２７〜３１はそれぞれ１６、１７、１
８、２０、２４クロック目のデータ保持状態を示す図で
あり、それぞれベクトル（−２，−２）、（−２，
０）、（−２，２）、（−１，−２）および（０，−
２）のディストーションが求まる際のデータ保持状態を
示している。前述のサーチウインドウデータの転送経路
として第１転送経路を選択する場合と比べてベクトル
（２，−２）が求まるまでに要するクロック数は１／２
となっていることがわかる。したがって、サーチウイン
ドウデータの転送経路として第１転送経路を取る場合と
同じ探索範囲で探索を行う際、探索精度を粗くしている
ので１／２の処理時間で動きベクトルの探索を行うこと
ができる。したがって、縦方向に跳ばしを行わない動き
ベクトル探索と比べて同一の探索範囲を短時間で探索す
ることができる。

【０１０４】ここで、縦方向にサーチウインドウを広げ
て探索したい場合には、跳ばしによる探索処理速度の増
加分に対応してサーチウインドウデータ転送量の増大を
図るためにデータバッファＤＬを縦方向に余分に多くし
なければならない。このデータバッファＤＬの増加分に
基づいて縦方向の探索範囲が拡大する。ただし、この場
合データバッファＤＬを新たに設けなければならないた
め、再設計等により手間がかかり面倒である。そこで、
本実施例では通常データバッファＤＬの数を増加させな
いように同一構成の局所ディストーション算出手段１３
１により縦方向の探索処理を複数回繰り返すことにより
探索範囲を広げて探索される。なお、縦方向の跳ばしを
行わない探索と同一の探索時間でサーチウインドウを広
げて探索する場合は、後述の実施例２の第２モードとし
て説明される。

【０１０５】また、このモードにおいて、参照画像転送
経路として２個の第２転送経路をとる。＜第３モード＞本モードは、プロセッサエレメントＰＥ
およびデータバッファＤＬが横方向のみに跳ばして接続
された第２転送経路によってサーチウインドウデータが
転送され動きベクトルを求めるものである。なお、説明
では横方向に１つ跳ばしで転送する例を示すが、セレク
タの選択数を増加させることにより横方向の跳ばしを増
加させることができる。

【０１０６】本モードのサーチウインドウの探索範囲
は、第１モードと同様ベクトルのｙ座標が−２〜＋２の
範囲である。本モードは、横方向の探索精度を粗くして
いるので、図５の横方向の探索範囲を１／２の時間で探
索することができる。すなわち、同じ範囲の探索範囲を
短時間で探索することができる。セレクタがサーチウイ
ンドウデータの転送経路として第２転送経路を選択をす
る場合のデータの転送の仕方は、第１および第２モード
から容易にわかるので説明は省略する。

【０１０７】第３モードでは、図２において各プロセッ
サエレメントＰＥのセレクタ２８および各データバッフ
ァＤＬのセレクタ４１〜４４は、それぞれ選択信号ＳＳ
Ｗ，ＳＯ，Ｓ１の値をそれぞれ”０”、”１”、”０”
としているので、セレクタ２８およびセレクタ４１の出
力端子Ｙは入力端子Ａを選択し、セレクタ４２の出力端
子Ｙは入力端子Ｃを選択し、セレクタ４３の出力端子Ｙ
は入力端子Ｃ／Ｄを選択し、セレクタ４４の出力端子Ｙ
は入力端子Ａ／Ｃを選択している。よって、プロセッサ
エレメントＰＥおよびデータバッファＤＬの横方向のみ
を１つ跳びに転送する第２転送経路を選択することがで
きることが分かる。

【０１０８】現画像ブロックデータ出力手段１１０と最
初に転送するプロセッサエレメントＰＥ（２，３）およ
びＰＥ（３，３）とは電気的に接続されており、現画像
ブロックデータは現画像ブロックデータ出力手段１１０
から出力され、ＰＥ（２，３）およびＰＥ（３，３）に
入力される。現画像データ転送経路において、同じ列の
各プロセッサエレメントＰＥはそれぞれ電気的に接続さ
れており、列の一番上のＰＥ（２，０）およびＰＥ
（３，０）は、それぞれ次の列のＰＥ（０，３）および
ＰＥ（１，３）に電気的に接続されている。ＰＥ（０，
０）およびＰＥ（１，０）は、ディストーションを算出
した後現画像ブロックデータを排出する。

【０１０９】第２転送経路において、サーチウインドウ
データ出力手段１２０と、データバッファＤＬａ（２，
７）およびＤＬ（３，７）とはそれぞれ入力口Ｉａ２お
よびＩａ４を介して電気的に接続されており、サーチウ
インドウデータ出力手段１２０から同時に出力されるサ
ーチウインドウデータはそれぞれＤＬａ（２，７）およ
びＤＬ（３，７）に入力する。同じ列の各プロセッサエ
レメントＰＥおよび各データバッファＤＬはそれぞれ列
方向に電気的に接続されている。列の一番上のＰＥ
（２，０）およびＰＥ（３，０）は、それぞれ次の列の
ＤＬａ（０，７）およびＤＬａ（１，７）に電気的に接
続されている。ＰＥ（０，０）およびＰＥ（１，０）
は、ディストーションを算出した後サーチウインドウデ
ータを排出する。

【０１１０】なお、このモードにおいて、参照画像転送
経路として、２個の第２転送経路をとることが分かる。＜第４モード＞図６および図３２〜３９を参照して本発
明に係わる動きベクトル探索装置の第１実施例の第４モ
ードを説明する。

【０１１１】本モードは、図３２に示すようにプロセッ
サエレメントＰＥおよびデータバッファＤＬを横方向と
縦方向のどちらも１つ跳びに接続した第２転送経路を選
択して、サーチウインドウデータを転送し動きベクトル
を探索するものである。なお、図３２〜３９には本モー
ドとして縦方向と縦方向のどちらも１つ跳ばしで転送す
る一例が示されているが、セレクタの選択数を増加させ
ることにより縦方向および縦方向とも跳ばし数を増加さ
せることができる。

【０１１２】図６は第４モードにおける参照画像ブロッ
ク５１０〜５５０とサーチウインドウ３００の転送動作
を説明するための図である。本モードのサーチウインド
ウの探索範囲は、第１モードと同様ベクトルのｙ座標が
−２〜＋２の範囲である。図３６は、現画像ブロック２
００の現画像ブロックデータがプロセッサエレメントＰ
Ｅに保持され、参照画像ブロック５１０のサーチウイン
ドウデータがプロセッサエレメントＰＥに保持されてい
る状態を示している。このとき、ベクトル（−２，−
２）に対応するディストーションが算出される。

【０１１３】図３７は、図３６の保持状態から１クロッ
ク後の保持状態を示している。現画像ブロック２００の
現画像ブロックデータがプロセッサエレメントＰＥに保
持され、参照画像ブロック５２０のサーチウインドウデ
ータがプロセッサエレメントＰＥに保持される状態を示
している。このとき、ベクトル（−２，０）に対応する
ディストーションが算出される。この１クロックで、サ
ーチウインドウデータは縦方向に対して図６のＴＳ１の
範囲まで探索されたこととなる。

【０１１４】図３８は、図３７の保持状態から１クロッ
ク後の保持状態を示している。現画像ブロック２００の
現画像ブロックデータがプロセッサエレメントＰＥに保
持され、参照画像ブロック５３０のサーチウインドウデ
ータがプロセッサエレメントＰＥに保持されている状態
を示している。このとき、ベクトル（−２，２）に対応
するディストーションが算出される。この１クロック
で、サーチウインドウデータは縦方向に対して図６のＴ
Ｓ２の範囲まで探索されたこととなる。

【０１１５】このように、図６の斜線部が示すように各
プロセッサエレメントはサーチウインドウ３００を縦方
向および横方向とも１つ跳びで探索するため、探索精度
を粗くするかわりに探索時間を短くすることができる。
すなわち、第１モードによるサーチウインドウの縦方向
の探索時間の１／４の時間で探索することができる。し
たがって、縦方向および横方向とも同時に跳ばしを行わ
ない動きベクトル探索と比べて同一の探索範囲を短時間
で探索することができる。

【０１１６】次にセレクタがサーチウインドウデータの
転送経路として第２転送経路を選択をする場合のデータ
の転送の仕方を説明する。図３２〜図３９は、動きベク
トルを求める際のプロセッサエレメントＰＥおよびデー
タバッファＤＬのデータ保持状態を示す図である。図３
２〜図３９において、各プロセッサエレメントＰＥの左
側および各データバッファＤＬにサーチウインドウデー
タが保持され、各プロセッサエレメントＰＥの右側に現
画像ブロックデータが保持されているとして示されてい
る。

【０１１７】第４モードでは、図２において各プロセッ
サエレメントＰＥのセレクタ２８および各データバッフ
ァＤＬのセレクタ４１〜４４は、それぞれ選択信号ＳＳ
Ｗ，ＳＯ，Ｓ１の値をそれぞれ”１”、”１”、”１”
としているので、セレクタ２８およびセレクタ４１の出
力端子Ｙは入力端子Ｂを選択し、セレクタ４２の出力端
子Ｙは入力端子Ｄを選択し、セレクタ４３の出力端子Ｙ
は入力端子Ｃ／Ｄを選択し、セレクタ４４の出力端子Ｙ
は入力端子Ｄを選択している。よって、プロセッサエレ
メントＰＥおよびデータバッファＤＬの縦方向および横
方向とも１つ跳びに転送する第２転送経路を選択するこ
とができることが分かる。

【０１１８】次にセレクタがサーチウインドウデータの
転送経路として第４モードの第２転送経路を選択する場
合のデータの転送の仕方を説明する。図３２〜図３９
は、動きベクトルを求める際のプロセッサエレメントＰ
ＥおよびデータバッファＤＬのデータ保持状態を示す図
である。図３２〜図３９において、各プロセッサエレメ
ントＰＥの左側および各データバッファＤＬにサーチウ
インドウデータが保持され、各プロセッサエレメントＰ
Ｅの右側に現画像ブロックデータが保持されるとして示
されている。

【０１１９】現画像ブロックデータ出力手段１１０と最
初に転送するプロセッサエレメントＰＥ（２，３）およ
びＰＥ（３，３）とはそれぞれ電気的に接続されてお
り、現画像ブロックデータは現画像ブロックデータ出力
手段１１０から出力され、ＰＥ（２，３）およびＰＥ
（３，３）に入力される。現画像データ転送経路におい
て、同じ列の各プロセッサエレメントＰＥはそれぞれ電
気的に接続されており、列の一番上の、ＰＥ（２，０）
およびＰＥ（３，０）は、それぞれ横方向に一つ跳んだ
次の列のＰＥ（０，３）およびＰＥ（１，３）に電気的
に接続されている。ＰＥ（０，０）およびＰＥ（０，
１）は、局所ディストーションを算出した後現画像ブロ
ックデータを排出する。

【０１２０】第２転送経路において、サーチウインドウ
データ出力手段１２０とデータバッファＤＬａ（２，
６）、ＤＬａ（２，７）、ＤＬａ（３，６）およびＤＬ
（３，７）はそれぞれ入力口Ｉａ３、Ｉａ４、Ｉａ１お
よびＩａ２を介して電気的に接続されており、サーチウ
インドウデータ出力手段１２０から同時に出力されるサ
ーチウインドウデータはそれぞれＤＬａ（２，６）、Ｄ
Ｌａ（２，７）、ＤＬａ（３，６）およびＤＬ（３，
７）に入力する。同じ列の各プロセッサエレメントＰＥ
および各データバッファＤＬはそれぞれ縦方向に１つ跳
びに電気的に接続されている。列の一番上のＰＥ（２，
０）およびＰＥ（３，０）は、それぞれ横方向に１つ跳
んだ次の列のＤＬａ（０，６）およびＤＬａ（１，６）
に電気的に接続されている。また、ＰＥ（２，１）およ
びＰＥ（３，１）は、それぞれ横方向に１つ跳んだ次の
列のＤＬａ（０，７）およびＤＬａ（１，７）に電気的
に接続されている。ＰＥ（０，０）、ＰＥ（０，１）、
ＰＥ（１，０）およびＰＥ（１，１）は、局所ディスト
ーションを算出した後サーチウインドウデータを排出す
る。

【０１２１】第４モードでは、プロセッサエレメントＰ
ＥまたはデータバッファＤＬを横方向と縦方向のどちら
も１つ跳びに電気的に接続した第２転送経路を選択し
て、サーチウインドウデータを転送し動きベクトルを探
索できる。ＰＥ（２，３）およびＰＥ（３，３）に現画
像ブロックデータが入力され、ＤＬａ（２，６）、ＤＬ
ａ（２，７）、ＤＬａ（３，６）およびＤＬ（３，７）
にサーチウインドウデータが同時に入力される。

【０１２２】図３２〜３９はそれぞれ１、２、４、５、
８、９、１０、１２クロック目のデータ保持状態を示す
図である。例えば、図３３〜３５において、クロックパ
ルス信号の２クロック目に同期して、現画像ブロックデ
ータａ（０，０）はＰＥ（２，２）に保持されるが、３
クロック目に同期して、ａ（０，０）はＰＥ（２，１）
に保持され、４クロック目に同期して、ａ（０，０）は
ＰＥ（２，０）に保持され、５クロック目に同期して、
ａ（０，０）はＰＥ（０，３）に保持される。また、図
３３において、クロックパルス信号の２クロック目に同
期して、サーチウインドウデータｂ（０，０）はＤＬ
（２，４）に保持されるが、３クロック目に同期して、
ｂ（０，０）はＰＥ（２，２）に保持され、４クロック
目に同期して、ｂ（０，０）はＰＥ（２，０）に保持さ
れ、５クロック目に同期して、ｂ（０，０）はＤＬａ
（０，６）に保持される。同様にして他の現画像ブロッ
クデータおよびサーチウインドウデータは転送保持され
る。

【０１２３】また、図３６〜３９はそれぞれでベクトル
（−２，−２）、（−２，０）、（−２，２）、および
（０，−２）のディストーションが求まる際のデータ保
持状態を示している。前述のサーチウインドウデータの
転送経路として第１転送経路を選択する場合と比べてベ
クトル（０，−２）が求まるまでに要するクロック数は
１／４となっていることがわかる。したがって、縦方向
および横方向同時の跳ばしを行わない動きベクトル探索
と比べて同一の探索範囲を短時間で探索することができ
る。

【０１２４】ここで、縦方向にサーチウインドウを広げ
て探索したい場合には、跳ばしによる探索処理速度の増
加分に対応してサーチウインドウデータ転送量の増大を
図るためにデータバッファＤＬを縦方向に余分に多くし
なければならない。ただし、横方向の跳ばしに対しては
データバッファＤＬを余分に多くする必要はない。この
データバッファＤＬの増加分に基づいて縦方向の探索範
囲が拡大する。ただし、この場合、データバッファＤＬ
を新たに設けなければならないため、再設計等により手
間がかかり面倒である。そこで、本実施例では通常デー
タバッファＤＬの数を増加させないように同一構成の局
所ディストーション算出手段１３１により縦方向の探索
処理を複数回繰り返すことにより探索範囲を広げて探索
される。なお、縦方向の跳ばしを行わない探索と同一の
探索時間でサーチウインドウを広げて探索する場合は、
後述の実施例２の第４モードとして説明される。

【０１２５】また、本モードにおいて、参照画像転送経
路として４個の第２転送経路をとる。《第２実施例》次に第２実施例の説明を行う。図３は本
発明の第２実施例における局所ディストーション算出手
段１３１の構成例を示す図である。

【０１２６】第２実施例では、第１実施例において縦方
向の跳ばしを行わない探索と同一の探索時間でサーチウ
インドウを広げて探索したい場合にデータバッファＤＬ
を縦方向に新たに設けなければならないことに鑑み、縦
方向の跳ばしを行うときのみ使用されるデータバッファ
ＤＬを局所ディストーション算出手段１３１に予め構成
している。また、局所ディストーション算出手段１３１
が、セレクタ４１〜４４の替りにセレクタ４１、４５お
よび４６を有し、サーチウインドウデータの入力口Ｉｂ
１〜Ｉｂ６を有するように構成されている。

【０１２７】本実施例の特徴は、縦方向の跳ばしによる
探索処理速度の増加分に対応してサーチウインドウデー
タ転送量の増大を図るように予めデータバッファＤＬを
縦方向に余分に設けているので、容易に縦方向の跳ばし
を行わない探索と同一の探索時間でサーチウインドウを
広げて探索することができる。本実施例の一例として、
第１実施例とは異なり縦方向の跳ばし転送を行わない場
合のサーチウインドウの探索範囲はベクトルのｙ座標が
−１〜＋１の範囲であり、一方、縦方向の跳ばし転送を
行う場合の探索範囲はベクトルのｙ座標が−２〜＋２の
範囲である場合の局所ディストーション算出手段１３１
の構成が図３に示されている。なお、本実施例として縦
方向と縦方向のどちらも１つ跳ばしで転送する一例が示
されているが、セレクタの選択数を増加させることによ
り縦方向および縦方向のどちらも跳ばし数を増加させる
ことができる。セレクタがサーチウインドウデータの転
送経路として第２転送経路を選択をする場合のデータの
転送の仕方は第１実施例から容易にわかるので説明は省
略する。以下、本実施例の各モードの第１実施例との相
違点のみを説明する。

【０１２８】＜第１モード＞本モードは、第１実施例と
同様にプロセッサエレメントＰＥおよびデータバッファ
ＤＬがすべて直列に接続された第１転送経路によってサ
ーチウインドウデータが転送され動きベクトルを求める
ものである。このとき、サーチウインドウデータは入力
口Ｉｂ１を介して入力される。また、セレクタ４１およ
び４５は入力端子Ａを選択している。ここで、注意すべ
きは、ＤＬｂ（０，６），ＤＬｂ（１，６），ＤＬｂ
（２，６），ＤＬｂ（３，６），ＤＬｂ（０，７），Ｄ
Ｌｂ（１，７），ＤＬｂ（２，７）およびＤＬ（３，
７）は、何れも使用されていない点である。また、ＰＥ
（３，０）、ＰＥ（２，０）およびＰＥ（１，０）は、
それぞれＤＬｂ（２，５）、ＤＬｂ（１，５）およびＤ
Ｌｂ（０，５）と接続している。また、サーチウインド
ウの探索範囲はベクトルのｙ座標が−１〜＋１の範囲で
ある。

【０１２９】＜第２モード＞本モードは、第１実施例と
同様にプロセッサエレメントＰＥおよびデータバッファ
ＤＬが縦方向のみに跳ばして接続された第２転送経路に
よってサーチウインドウデータが転送され動きベクトル
を求めるものである。サーチウインドウデータは、入力
口Ｉｂ３およびＩｂ４を介して入力される。セレクタ４
１、４５および４６はいづれも入力端子Ｂを選択してい
る。

【０１３０】このように、第１モードよりデータバッフ
ァＤＬの数を２倍に増加させ、サーチウインドウデータ
を入力口Ｉｂ３およびＩｂ４を介して入力してサーチウ
インドウデータを縦方向に１つ跳びに転送することによ
り、縦方向を粗く探索することができる。したがって、
縦方向の跳ばしを行わない第１モードの探索と同一の探
索時間で探索範囲を２倍に広げて探索することができ
る。

【０１３１】＜第３モード＞本モードは、第１実施例と
同様にプロセッサエレメントＰＥおよびデータバッファ
ＤＬが横方向のみに跳ばして接続された第２転送経路に
よってサーチウインドウデータが転送され動きベクトル
を求めるものである。サーチウインドウデータは、入力
口Ｉｂ１およびＩｂ２を介して入力される。セレクタ４
５は入力端子Ｃを選択している。ここで、注意すべき
は、ＤＬｂ（０，６），ＤＬｂ（１，６），ＤＬｂ
（２，６），ＤＬｂ（３，６），ＤＬｂ（０，７），Ｄ
Ｌｂ（１，７），ＤＬｂ（２，７）およびＤＬ（３，
７）は、何れも使用されていない点である。また、ＰＥ
（３，０）、ＰＥ（２，０）およびＰＥ（１，０）は、
それぞれＤＬｂ（２，５）、ＤＬｂ（１，５）およびＤ
Ｌｂ（０，５）と接続している。また、サーチウインド
ウの探索範囲はベクトルのｙ座標が−１〜＋１の範囲で
ある。

【０１３２】このように、サーチウインドウデータを入
力口Ｉｂ１およびＩｂ２を介して入力してサーチウイン
ドウデータを横方向に１つ跳びに転送することにより、
横方向を粗く探索することができる。したがって、横方
向の跳ばしを行わない第１モードの探索と同一の探索時
間で探索範囲を２倍に広げて探索することができる。＜第４モード＞本モードは、第１実施例と同様にプロセ
ッサエレメントＰＥおよびデータバッファＤＬが縦方向
および横方向ともに跳ばして接続された第２転送経路に
よってサーチウインドウデータが転送され動きベクトル
を求めるものである。

【０１３３】本モードは、第１モードよりデータバッフ
ァＤＬの数を２倍に増加させ、サーチウインドウデータ
を入力口Ｉｂ３〜Ｉｂ５を介して入力してサーチウイン
ドウデータを縦方向および横方向とも１つ跳びに転送す
ることにより、縦方向および横方向とも粗く探索するこ
とができる。したがって、横方向および横方向の跳ばし
を行わない第１モードの探索と同一の探索時間で探索範
囲を４倍に広げて探索することができる。

【０１３４】なお、本実施例として上記の例を挙げた
が、Ｉ、Ｊ、Ｍ、Ｎ、ＰおよびＱを正の整数とし、Ｉは
Ｐより小さく、ＪはＱより小さく、ＰはＭより大きく、
ＱはＮより大きいとするとき、現画像ブロックはＭ行Ｎ
列の画素により構成され、サーチウインドウはＰ行Ｑ列
の画素により構成されており、現画像データ転送素子お
よびサーチウインドウデータ転送素子がそれぞれＭ行Ｎ
列およびＰ行Ｎ列のマトリックス状に配置されていると
ともに、第２転送経路が、サーチウインドウデータ転送
素子の縦方向および横方向にそれぞれＩ個毎、Ｊ個毎に
接続するとき、第２転送経路は（Ｉ×Ｊ）個からなって
いてもよい。

【０１３５】

【発明の効果】請求項１記載の発明によれば、サーチウ
インドウデータをサーチウインドウデータ転送素子の一
部を跳ばして転送することができる。また、跳ばしを行
わない第１転送経路による転送と、跳ばし転送を行う第
２転送経路との切り替えができる。さらに跳ばし転送を
行う場合、縦方向のみの跳ばし、横方向のみの跳ばし、
あるいは縦方向および横方向同時の跳ばしのいづれかを
選択することができる。このため、跳ばしを行わない通
常の探索と、跳ばしを行う探索とを、同一の動きベクト
ル探索装置で行うことができる。また、従来の動きベク
トル探索装置で転送する場合と比べて、同じ探索時間で
より広範囲の探索を行うことができる。また、従来の動
きベクトル探索装置で転送する場合と比べて、同じ探索
範囲を短時間で探索することができる。したがって、効
率的な動きベクトル探索を行うことができる。

【０１３６】請求項２記載の発明によれば、現画像デー
タ転送素子をＭ行Ｎ列、サーチウインドウデータ転送素
子をＰ行Ｎ列の行列で配列することができるため、現画
像データ転送素子およびサーチウインドウデータ転送素
子の数を最小にすることができる。したがって、占有面
積を小さくすることができ、動きベクトル探索の効率化
および消費電力の軽減を図ることができる。また、サー
チウインドウデータが、マトリックス状に配置されたサ
ーチウインドウデータ転送素子を、列方向のみ（Ｉ−
１）個跳ばして転送されるか、行方向のみ（Ｊ−１）個
跳ばして転送されるか、または行方向を（Ｉ−１）個お
よび列方向を（Ｊ−１）個跳ばして転送されるかのいづ
れかを選択して動きベクトル探索を行うことができる。
このため、跳ばしを行わない通常の探索と、跳ばしを行
う探索とを、同一の動きベクトル探索装置で行うことが
できる。また、サーチウインドウデータ転送素子の全て
を直列に接続する第１転送経路により転送される場合と
比べて、同じ探索時間でより広範囲の探索を行うことが
できる。また、サーチウインドウデータ転送素子の全て
を直列に接続する第１転送経路により転送される場合と
比べて、同じ探索範囲を短時間で探索することができ
る。したがって、効率的な動きベクトル探索を行うこと
ができる。

【０１３７】請求項３記載の発明によれば、請求項１記
載の発明において、セレクタへの転送選択信号を制御す
ることにより、第１転送経路による通常の転送と第２転
送経路による跳ばし転送とを容易に切り替えることでき
る。したがって、複数の動きベクトル探索装置を用いる
ことなく、跳ばしを行わない通常の探索と跳ばしを行う
探索とを、容易に選択できるので効率的な動きベクトル
探索を行うことができる。

【０１３８】請求項４記載の発明によれば、請求項２記
載の発明において、サーチウインドウ内の各画素データ
をプロセッサエレメントの各列において転送方向を上方
向または下方向のどちらかに転送するようにしている。
したがって、サーチウインドウ内の各画素データ転送バ
スを短くできる。また、回路構成を簡単にできる。した
がって、効率的な動きベクトル探索および消費電力軽減
をおこなうことができる。

【０１３９】請求項５記載の発明によれば、請求項１記
載の発明において、局所ディストーション算出手段が、
符号付減算結果を符号ビットと各大きさビットとの加算
を行って、符号ビットとこの差分絶対値に対応する値と
の組で出力しているため、２の補数表示における負数の
表示に必要とされるインクリメンタが不要となり、局所
ディストーション算出手段の回路規模の低減を図ること
ができる。また、単にゲート手段のみを用いて符号ビッ
トと差分絶対値に対応する値とを生成しているため高速
で演算結果を出力することができる。さらに、消費電力
を低減することができる。

【０１４０】請求項６記載の発明によれば、請求項５記
載の発明において、局所ディストーション算出手段の出
力の総和を算出する総和手段がツリー状に配置された複
数段の全加算回路で構成されており、全加算回路の最下
位ビットへ符号ビットが与えられるため、キャリ伝搬遅
延時間を大幅に低減することができ、高速で総和演算を
実行することができる。したがって、ディストーション
を高速で算出することができる。

【図面の簡単な説明】

【図１】本発明の全体の構成の概略図である。

【図２】本発明の第１実施例の局所ディストーション算
出手段の構成例を示す図である。

【図３】本発明の第２実施例の局所ディストーション算
出手段の構成例を示す図である。

【図４】現画像ブロックとサーチウインドウの具体例を
示す図である。

【図５】本発明の第２モードの実施例における参照画像
ブロック４１０〜４３０とサーチウインドウ３００の転
送動作を説明するための図である。

【図６】本発明の第４モードの実施例における参照画像
ブロック４１０〜４３０とサーチウインドウ３００の転
送動作を説明するための図である。

【図７】プロセッサエレメントの具体的構成例を示す図
である。

【図８】図７に示す差分絶対値回路の具体的構成例を示
す図である。

【図９】図７に示す差分絶対値回路の他の具体的構成例
を示す図である。

【図１０】図２に示すデータバッファＤＬ（３，７）の
構成を示す図である。

【図１１】図２に示すデータバッファＤＬ（０，４），
ＤＬａ（０，５），ＤＬ（１，４），ＤＬａ（１，
５），ＤＬ（２，４），ＤＬａ（２，５），ＤＬ（３，
４），ＤＬ（３，５），ＤＬａ（３，６）の構成を示す
図である。

【図１２】図２に示すデータバッファＤＬａ（０，
７），ＤＬａ（１，７）の構成を示す図である。

【図１３】図２に示すデータバッファＤＬａ（２，７）
の構成を示す図である。

【図１４】図２に示すデータバッファＤＬａ（０，
６），ＤＬａ（１，６），ＤＬａ（２，６）の構成を示
す図である。

【図１５】図３に示すデータバッファＤＬｂ（０，
６），ＤＬｂ（１，６），ＤＬｂ（２，６），ＤＬｂ
（０，７），ＤＬｂ（１，７），ＤＬｂ（２，７）の構
成を示す図である。

【図１６】図３に示すデータバッファＤＬｂ（０，
５），ＤＬｂ（１，５），ＤＬｂ（２，５）の構成を示
す図である。

【図１７】図９に示す差分絶対値回路を用いる場合の総
和手段の構成を示す図である。

【図１８】図１７に示す総和手段の具体的構成例を示す
図である。

【図１９】図１８に示す４対２コンプレッサの構成を示
す図である。

【図２０】図１８に示す総和手段の具体的構成例を示す
図である。

【図２１】図１に示すディストーション特定手段の構成
を示す図である。

【図２２】本発明の第１実施例の第２モードの１クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図２３】本発明の第１実施例の第２モードの２クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図２４】本発明の第１実施例の第２モードの５クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図２５】本発明の第１実施例の第２モードの７クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図２６】本発明の第１実施例の第２モードの１１クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図２７】本発明の第１実施例の第２モードの１６クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図２８】本発明の第１実施例の第２モードの１７クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図２９】本発明の第１実施例の第２モードの１８クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図３０】本発明の第１実施例の第２モードの２０クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図３１】本発明の第１実施例の第２モードの２４クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図３２】本発明の第１実施例の第４モードの１クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３３】本発明の第１実施例の第４モードの２クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３４】本発明の第１実施例の第４モードの４クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３５】本発明の第１実施例の第４モードの５クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３６】本発明の第１実施例の第４モードの８クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３７】本発明の第１実施例の第４モードの９クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図３８】本発明の第１実施例の第４モードの１０クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図３９】本発明の第１実施例の第４モードの１２クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４０】本発明の第１実施例の第１モードの１クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図４１】本発明の第１実施例の第１モードの３クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図４２】本発明の第１実施例の第１モードの５クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図４３】本発明の第１実施例の第１モードの８クロッ
ク目におけるプロセッサエレメントおよびデータバッフ
ァのデータ保持状態を示す図である。

【図４４】本発明の第１実施例の第１モードの１２クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４５】本発明の第１実施例の第１モードの１６クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４６】本発明の第１実施例の第１モードの２４クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４７】本発明の第１実施例の第１モードの３２クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４８】本発明の第１実施例の第１モードの３３クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図４９】本発明の第１実施例の第１モードの３４クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５０】本発明の第１実施例の第１モードの３５クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５１】本発明の第１実施例の第１モードの３６クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５２】本発明の第１実施例の第１モードの４０クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５３】本発明の第１実施例の第１モードの４４クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５４】本発明の第１実施例の第１モードの４８クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５５】本発明の第１実施例の第１モードの５６クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５６】本発明の第１実施例の第１モードの６４クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５７】本発明の第１実施例の第１モードの６８クロ
ック目におけるプロセッサエレメントおよびデータバッ
ファのデータ保持状態を示す図である。

【図５８】従来画像信号符号化回路の全体の構成を示す
図である。

【図５９】図５８に示すソース符号化回路９１２の全体
の構成を示す図である。

【図６０】画像の動き補償の操作を説明するための図で
ある。

【図６１】ブロックマッチング法による動き補償を行う
際のサーチウインドウおよび現画像ブロックの配置例お
よび動きベクトルの関係を示す図である。

【図６２】従来の動きベクトル探索装置の全体の構成を
示す図である。

【図６３】図６２に示すプロセッサアレイ内に含まれる
プロセッサエレメントの構成を示す図である。

【図６４】図６２に示す動きベクトル探索装置における
現画像ブロックのスキャンおよびサーチウインドウのス
キャン方法を示す図である。

【図６５】図６２に示す動きベクトル探索装置の動作を
示す図である。

【図６６】従来の動きベクトル探索装置の動作を説明す
るための図である。

【図６７】従来の動きベクトル探索装置の動作を説明す
るための図である。

【符号の説明】

２５−１レジスタ２５−２レジスタ２６−１レジスタ２６−２レジスタ２８セレクタ３１レジスタ３２レジスタ３３レジスタ３４レジスタ３５レジスタ３６レジスタ３７レジスタ４１セレクタ４２セレクタ４３セレクタ４４セレクタ４５セレクタ４６セレクタ６０セレクタ６２セレクタ６４差分絶対値回路７０減算器７２ＥｘＯＲ回路７４インクリメンタ１０２４対２コンプレッサ１０４全加算器１１０ａ〜１１０ｈ全加算回路１１０現画像ブロックデータ出力手段１２０サーチウインドウデータ出力手段１３０ディストーション算出手段１３１局所ディストーション算出手段１３２総和手段１４０ディストーション特定手段１４１レジスタラッチ１４２比較器１４３カウンタ１４４レジスタラッチ１４５デコーダ２００現画像ブロック３００サーチウインドウ４１０参照画像ブロック４２０参照画像ブロック４３０参照画像ブロック４４０参照画像ブロック５１０参照画像ブロック５２０参照画像ブロック５３０参照画像ブロック５４０参照画像ブロック５５０参照画像ブロック９１０前処理回路９１２ソース符号化回路９１４ビデオマルチプレクス符号化回路９１６伝送バッファ９１８伝送符号化回路９２０動き補償予測器９２２ループフィルタ９２４減算器９２６直交変換器９２８量子化器９３０逆量子化器９３２逆直交変換器９３４加算器９５０現画像９５２現画像ブロック９５４サーチエリアの中心に位置する参
照画像ブロック９５６サーチエリア９６２サーチエリア入力レジスタ９６４ａサーチエリアサイドレジスタ９６４ｂサーチエリアサイドレジスタ９６６プロセッサアレイ９６８動きベクトル検出部９７０プロセッサエレメント９７２３入力レジスタ９７４ディストーション計算部９７６３入力レジスタ９８０現画像ブロック９８２参照符号９８３参照符号９９０サーチウインドウ９９２サーチウインドウ９９４サーチウインドウ９９６サーチエリア９９９現画像ブロックａ現画像ブロックデータｂサーチウインドウデータＰＥプロセッサエレメントＤＬデータバッファＸ（ＴＰＤ）現画像ブロックデータＹ（ＳＷＤ）サーチウインドウデータＳＥＬ３入力レジスタ９７２への入力信
号ＳＥＬＯセレクタ６０への入力信号ＳＥＬ１セレクタ６２への入力信号ＳＳＷセレクタ２８の選択信号Ｓ０セレクタ４１〜４６の選択信号Ｓ１セレクタ４２〜４６の選択信号ｍｖ動きベクトルＴｏ３入力レジスタ９７６およびディ
ストーション計算部への入力信号

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平６−113290（ＪＰ，Ａ) 特開平７−250328（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁶，ＤＢ名) H04N 7/24 - 7/68

Claims

(57)【特許請求の範囲】

【請求項１】現画像よりも先に符号化される参照画像に
含まれるサーチウインドウをそれぞれ部分的に構成する
複数の参照画像ブロックの中から、現画像ブロックに最
も類似した参照画像ブロックを選択することによって、
前記現画像ブロックの現画像上の位置と選択された参照
画像ブロックの参照画像上の位置とにより特定される動
きベクトルを探索する動きベクトル探索装置であって、前記現画像ブロックに含まれる画素データを出力する現
画像ブロックデータ出力手段と、前記サーチウインドウに含まれる画素データを出力する
サーチウインドウデータ出力手段と、現画像ブロックと各参照画像ブロックとの互いに位置的
に対応する画素データ同士の差の総和を表すディストー
ションを算出するディストーション算出手段と、前記ディストーション算出手段により算出された前記デ
ィストーションの中から前記現画像ブロックに最も類似
した参照画像ブロックを特定し、動きベクトルを算出す
るディストーション特定手段と、を備え、前記ディストーション算出手段は、前記現画像ブロックデータ出力手段から画素データを入
力して通過させる現画像データ転送経路および前記サー
チウインドウデータ出力手段から画素データを入力して
通過させるサーチウインドウデータ転送経路を有し、前
記現画像データ転送経路上を転送中の画素データおよび
サーチウインドウデータ転送経路上を転送中の画素デー
タに基づいて、現画像ブロックと各参照画像ブロックと
の互いに位置的に対応する画素データ同士の差を表す複
数の局所ディストーションを算出する局所ディストーシ
ョン算出手段と、前記局所ディストーション算出手段より算出された複数
の局所ディストーションを総和する総和手段と、を有
し、前記サーチウインドウデータ転送経路が、第１転送経路
と第２転送経路とからなり、前記局所ディストーション算出手段が、前記現画像データ転送経路上に配置されて該現画像デー
タ転送経路により直列に接続され、現画像データ転送経
路を通過する画素データを一時的に保持しながら転送す
る複数の現画像データ転送素子と、前記サーチウインドウデータ転送経路上に配置されて、
サーチウインドウ転送経路を通過する画素データを一時
的に保持しながら転送する複数のサーチウインドウデー
タ転送素子と、前記第１および前記第２転送経路の何れかを選択する転
送経路選択手段と、を有し、前記第１転送経路は、全てのサーチウインドウデータ転
送素子を直列に接続し、前記第２転送経路は、サーチウ
インドウデータ転送素子を直列に接続する複数の転送経
路からなり、全てのサーチウインドウデータ転送素子の
それぞれは、前記複数の転送経路のいずれかに接続さ
れ、前記転送経路選択手段により第１転送経路が選択された
とき、第１転送経路により直列に接続された全てのサー
チウインドウデータ転送素子により前記サーチウインド
ウデータの画素データが順次保持されながら転送され、前記転送経路選択手段により第２転送経路が選択された
とき、前記第２転送経路により接続されたサーチウイン
ドウデータ転送素子により前記サーチウインドウデータ
の画素データが順次保持されながら転送されることを特
徴とする動きベクトル探索装置。
【請求項２】請求項１記載の動きベクトル探索装置にお
いて、Ｉ、Ｊ、Ｍ、Ｎ、ＰおよびＱを正の整数とし、Ｉ
はＰより小さく、ＪはＱより小さく、ＰはＭより大き
く、ＱはＮより大きいとして、現画像ブロックがＭ行Ｎ
列の画素により構成され、サーチウインドウがＰ行Ｑ列
の画素により構成され、現画像データ転送素子が（Ｍ×Ｎ）個で、Ｍ行Ｎ列のマ
トリックス状に配置され、サーチウインドウデータ転送
素子が、（Ｐ×Ｎ）個でＰ行Ｎ列のマトリックス状に配
置され、前記第１転送経路は、サーチウインドウデータ転送素子
の各列の全ての素子を直列に接続するとともに、各列の
後端のサーチウインドウデータ転送素子と隣の列の前端
のサーチウインドウデータ転送素子を接続し、全てのサ
ーチウインドウデータ転送素子を直列に転送する転送経
路であり、前記第２転送経路は、（Ｉ×Ｊ）個の転送経路からな
り、サーチウインドウデータ転送素子の各列をＩ個毎に
直列に接続するとともに、各列の後端からＩ個のサーチ
ウインドウデータ転送素子のそれぞれと、Ｊ個隣の列の
前端からＩ個のサーチウインドウデータ転送素子のそれ
ぞれを接続し、各転送経路上のサーチウインドウデータ
転送素子を直列に転送する転送経路であることを特徴と
する動きベクトル探索装置。
【請求項３】転送経路選択手段が、各サーチウインドウ
データ転送素子の第１転送経路および第２転送経路上に
配置され、サーチウインドウデータ転送経路を選択する
よう複数のサーチウインドウデータ転送素子を接続する
セレクタであることを特徴とする請求項１記載の動きベ
クトル探索装置。
【請求項４】局所ディストーション算出手段が、局所デ
ィストーションを算出する演算子を有し、各現画像データ転送素子、各サーチウインドウデータ転
送素子および各演算素子が、一つのプロセッサエレメン
トを構成し、（Ｍ×Ｎ）個のプロセッサエレメントを有
し、プロセッサエレメントと残りのサーチウインドウデ
ータ転送素子が上下のブロックに分かれることを特徴と
する請求項２記載の動きベクトル探索装置。
【請求項５】前記局所ディストーション算出手段は、前記サーチウインドウに含まれる画素データと前記現画
像ブロックに含まれる画素データとの減算を行い、該減
算結果を符号を示す符号ビットと大きさを示す大きさビ
ットとの組合せで出力する減算手段と、前記減算手段の各大きさビットと前記符号ビットとの加
算を行い、前記減算結果の差分絶対値を出力するゲート
手段と、を有し、前記局所ディストーション算出手段の
出力は前記符号ビットと前記差分絶対値との組で与えら
れることを特徴とする請求項１記載の動きベクトル探索
装置。
【請求項６】前記総和手段は、全出力が次段へ伝達され、ツリー状となるよう複数段に
配置した全加算回路を有し、前記符号ビットは最下位ビットの前記全加算回路のキャ
リ入力へ与えられることを特徴とする請求項５記載の動
きベクトル探索装置。