JP3667105B2

JP3667105B2 - 動きベクトル検出方法及びその方法を実施する装置

Info

Publication number: JP3667105B2
Application number: JP22994998A
Authority: JP
Inventors: 大作小宮; 上野山　　努; 山田　　和範
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1997-10-01
Filing date: 1998-08-03
Publication date: 2005-07-06
Anticipated expiration: 2018-08-03
Also published as: EP0907291A3; EP1503598A1; EP0907291A2; JPH11168731A; US6925121B1

Description

【０００１】
【発明の属する技術分野】
本発明は、映像信号の圧縮符号化に用いる動きベクトルを検出する方法と、それを実施する装置に関し、特に、高速且つ高精度で動きベクトルを検出することを可能にするものである。
【０００２】
【従来の技術】
近年、デジタル映像信号を扱う機器が増加し、また、それらの機器で扱うデジタル映像信号のデータ量を削減するための種々の圧縮符号化方式が定められている。
【０００３】
そうした方式の一つであるＭＰＥＧ１やＭＰＥＧ２は、コンピュータで利用する映像信号に多く用いられている。この方式では、ＤＣＴ（離散コサイン変換）によるフレーム内の空間的な冗長度の削減と、動き補償によるフレーム間の時間的な冗長度の削減とを組み合わせて、画像データが圧縮される。
【０００４】
なお、ＭＰＥＧ１については「ISO/IEC 11172-2 "Information technology - Coding of moving pictures and associated audio for digital strage media at up to about 1,5Mbit/s - Part 2: Video"」、ＭＰＥＧ２については「ISO/IEC 13818-2 "Information technology - Generic coding of moving Pictures and associated audio information - Part 2: Video"」にその内容が詳しく説明されている。
【０００５】
この動き補償による冗長度の削減は、現在のフレーム画像の対象ブロックを符号化する場合に、過去のフレーム画像から、そのブロックと最も相関度が大きいブロック（相関度最大ブロック）を探し出し、対象ブロック位置から相関度最大ブロック位置までの動きベクトルと、相関度最大ブロック及び対象ブロックの間の画像データの差分データとを求めて符号化することにより、データ量の削減を図るものである。ＭＰＥＧでは、マクロブロック（２×２ブロック）の単位でこの動きベクトルの検出が行なわれる。
【０００６】
この動き予測の処理における演算量は、符号化の演算量の相当部分を占めている。
【０００７】
従来の符号化装置は、図７に示すように、非圧縮画像71から動きベクトルを検出する動きベクトル検出部72と、検出された動きベクトルを用いてＭＰＥＧ方式の圧縮画像79を生成するエンコーダ部78とを備えており、動きベクトル検出部72は、非圧縮画像71からブロックを順番に読み出すブロック読出し手段74と、エンコーダ部78のデコード手段92でデコードされた予測画像を記憶するフレームメモリ75と、ブロック読出し手段74で読み出された対象ブロックとフレームメモリ75に記憶された予測画像とのマッチングを取り、動きベクトルを検出するマッチング手段76と、マッチング手段76で検出された動きベクトルをエンコーダ部78に出力する動きベクトル出力手段77と、ブロック読出し手段74及びマッチング手段76の動作を制御する動きベクトル検出部制御手段73とを具備し、また、エンコーダ部78は、非圧縮画像71及び動きベクトルから圧縮画像79を生成するエンコードカーネル91と、圧縮画像79をデコードしてフレームメモリ75に書き込むための予測画像を生成するデコード手段92とを具備している。
【０００８】
この装置では、ブロック読出し手段74が、ベクトル検出部制御手段73の制御を受けて、非圧縮画像71から、図８に示す、現在フレーム81の対象ブロック82を順番に読み出し、読み出されたブロックがマッチング手段76に出力される。
【０００９】
また、エンコーダ部78のデコード手段92は、エンコードカーネル91によりＤＣＴ、量子化された画像をデコードし、このデコードされた画像が予測画像としてフレームメモリ75に書き込まれる。
【００１０】
現在フレーム81の対象ブロック82が入力したマッチング手段76は、フレームメモリ75に記憶されている予測画像83を読出し、動きベクトル検出部制御手段73によって範囲が指定された探索領域84の全域に渡って、探索領域84の画像データと対象ブロック82の画像データとのマッチングを取り、探索領域84の中から、対象ブロック82と最も相関度が大きい相関度最大ブロック85を検出し、対象ブロック82の位置から相関度最大ブロック85の位置までの方向及び長さを表す動きベクトル86を算出する。
【００１１】
動きベクトル出力手段77は、マッチング手段76が求めた動きベクトル86をエンコーダ部78に出力する。
【００１２】
エンコーダ部78は、この動きベクトルに基づいて、入力する非圧縮画像71から、フレームメモリ75に蓄えられている予測画像の相関度最大ブロック85と現在フレーム81の対象ブロック82との画像データの差分を算出する。そして、その差分データにＤＣＴ変換、量子化、可変長符号化を施し、動きベクトルなどの情報とともにＭＰＥＧデータ79を生成して出力する。
【００１３】
この装置では、動きベクトルを検出するため、探索領域の全域に渡って全探索を実施しているが、この検出を高速化するために、高速化アルゴリズムを使用して、図９（ａ）に示すように、対象ブロックと探索領域とのマッチングを、探索領域の画素の１画素置きに実施したり、図９（ｂ）に示すように、対象ブロックからサンプリングしたデータを用いて探索領域とのマッチングを取ったり、図９（ｃ）に示すように、それらを組み合わせたり、探索領域の数画素置きにマッチングを実施するなど、図９（ａ）（ｂ）の方法をアレンジした方法なども行なわれている。
【００１４】
また、圧縮符号化方式には、この他、デジタルビデオカメラなどのデジタルビデオ機器向けの規格であるＤＶ方式が知られている。このＤＶ方式は、１９９６年に制定されたビデオカセットレコーダ向けの規格である、「Specifications of Consumer-Use Digital VCRs (HD Digital VCR Conference, 1996)」に準拠した規格であり、ブロック単位でＤＣＴ（離散コサイン変換）が施され、この処理によるフレーム内の空間的な冗長度の削減により、画像圧縮が図られている。
【００１５】
ＤＶ方式で圧縮された映像データのフレーム当たりの符号量は、標準的なＭＰＥＧ２方式の映像データの６倍程度に達する。そのため、ネットワークを通じて映像信号を伝送する場合には、ＭＰＥＧデータの方が適している。しかし、ＤＶデータは、フレームごとに独立しているため、フレーム単位のカット＆ペーストなどの映像の編集が容易であり、また、符号量が多い分、画質が優れているという利点がある。
【００１６】
そこで、本発明者等を含むグループでは、デジタルビデオカメラで撮影したＤＶデータの動画を編集し、映像信号の圧縮フォーマットをＭＰＥＧ方式に変換して、パソコン端末などに配信するシステムを開発し、実用化している。
【００１７】
このシステムでは、映像信号変換装置を用いてＤＶデータをＭＰＥＧデータに変換しているが、こうした変換では、一般的に、ＤＶ方式の映像データを復号して非圧縮のフレーム画像を生成し、次いで、非圧縮映像信号をＭＰＥＧ方式で圧縮符号化する処理が行なわれる。
【００１８】
このとき、動き予測の処理としては、図７の機構の下で、図８または図９で説明した各方法が行なわれている。
【００１９】
【発明が解決しようとする課題】
しかし、全探索による動きベクトルの検出は、演算量が膨大になり、処理速度が遅いという問題点がある。
【００２０】
また、高速化アルゴリズムの下に、探索領域や対象ブロックの画像データの一部を省略して行なう動きベクトルの検出は、解の精度が落ち、画質が低下するという問題点がある。
【００２１】
これは、非圧縮画像では全ての画素が同じ重さの情報量を持つからであり、動きベクトルの検出に使用する画素を減らして演算量を削減した場合には、その分、動きベクトルの検出精度が低下し、画質の劣化が避けられない。即ち、検出精度と検出速度とはトレードオフの関係にある。
【００２２】
本発明は、こうした従来の問題点を解決するものであり、高速且つ高精度で動きベクトルを検出することができる動きベクトル検出方法を提供し、その方法を実施する装置を提供することを目的としている。
【００２３】
【課題を解決するための手段】
そこで、本発明の動きベクトル検出方法では、画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから直流成分を含む１次元ＤＣＴ画像を取り出し、この１次元ＤＣＴ画像を逆変換して１次元非圧縮画像を生成する１次元非圧縮画像生成手順により、画像フレームの動き検出対象領域のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像を取り出してｘ方向１次元非圧縮画像を生成するとともに、直流成分を含むｙ方向１次元ＤＣＴ画像を取り出してｙ方向１次元非圧縮画像を生成し、動き検出対象領域のブロックのｘ方向１次元非圧縮画像と、探索領域のブロックから直流成分を含むｘ方向１次元ＤＣＴ画像を取り出して１次元非圧縮画像生成手順で生成したｘ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、動き検出対象領域のブロックのｙ方向１次元非圧縮画像と、探索領域のブロックから直流成分を含むｙ方向１次元ＤＣＴ画像を取り出して１次元非圧縮画像生成手順で生成したｙ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、このｘ成分とｙ成分とを合成して動きベクトルを定めるようにしている。
【００２４】
この方法では、情報量が集中している部分の画像データを動きベクトルの検出に使用しているため、演算量の削減量が多いにも拘わらず、２次元画像による全探索と殆ど変わらない検出精度を得ることができる。
【００２７】
また、本発明の動きベクトル検出装置では、画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像とｙ方向１次元ＤＣＴ画像とを抽出するＤＣＴ成分抽出手段と、ｘ方向１次元ＤＣＴ画像を逆変換してｘ方向１次元非圧縮画像を生成するｘ方向１次元逆ＤＣＴ手段と、ｙ方向１次元ＤＣＴ画像を逆変換してｙ方向１次元非圧縮画像を生成するｙ方向１次元逆ＤＣＴ手段と、生成されたｘ方向１次元非圧縮画像を順番に記憶するｘ方向１次元画像フレームメモリと、生成されたｙ方向１次元非圧縮画像を順番に記憶するｙ方向１次元画像フレームメモリと、動き検出対象領域のブロックから生成されたｘ方向１次元非圧縮画像と探索領域のブロックから生成されたｘ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、動き検出対象領域のブロックから生成されたｙ方向１次元非圧縮画像と探索領域のブロックから生成されたｙ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、動きベクトルのｘ成分及びｙ成分を合成して動きベクトルを求めるマッチング手段とを設けている。
【００２９】
この装置では、少ない演算量で、２次元画像による全探索と変わらない検出精度を得ることができる。
【００３５】
【発明の実施の形態】
本発明の請求項１に記載の発明は、映像信号の圧縮符号化に用いる動きベクトルの検出方法において、画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから直流成分を含む１次元ＤＣＴ画像を取り出し、この１次元ＤＣＴ画像を逆変換して１次元非圧縮画像を生成する１次元非圧縮画像生成手順により、画像フレームの動き検出対象領域のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像を取り出してｘ方向１次元非圧縮画像を生成するとともに、直流成分を含むｙ方向１次元ＤＣＴ画像を取り出してｙ方向１次元非圧縮画像を生成し、動き検出対象領域のブロックのｘ方向１次元非圧縮画像と、探索領域のブロックから直流成分を含むｘ方向１次元ＤＣＴ画像を取り出して１次元非圧縮画像生成手順で生成したｘ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、動き検出対象領域のブロックのｙ方向１次元非圧縮画像と、探索領域のブロックから直流成分を含むｙ方向１次元ＤＣＴ画像を取り出して１次元非圧縮画像生成手順で生成したｙ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、このｘ成分とｙ成分とを合成して動きベクトルを定めるようにしたものであり、情報量が集中している部分の画像データを選択して使用しているため、２次元画像による全探索と殆ど変わらない検出精度を得ながら、演算量を削減することができる。
【００３７】
請求項２に記載の発明は、１次元非圧縮画像生成手順において、ｘ方向ｎピクセル、ｙ方向ｎピクセルのｎ×ｎ行列（ｎは自然数）から成るブロックから、直流成分を含む１×ｍピクセル（ｍはｎ以下の自然数）のＤＣＴ係数を取り出し、逆変換してｘ方向１次元非圧縮画像を生成し、前記ブロックから直流成分を含むｍ×１ピクセルのＤＣＴ係数を取り出し、逆変換してｙ方向１次元非圧縮画像を生成するようにしたものであり、高速化に重点を置く場合に、こうした方法を取ることができる。
【００４４】
請求項３に記載の発明は、探索領域のブロックから生成したｘ方向１次元非圧縮画像の各々から、それらの中間に位置するｘ方向１次元非圧縮画像を補間し、探索領域のブロックから生成したｙ方向１次元非圧縮画像の各々から、それらの中間に位置するｙ方向１次元非圧縮画像を補間し、補間したｘ方向１次元非圧縮画像及びｙ方向１次元非圧縮画像を対象に含めて相関度を算出するようにしたものであり、動き予測の精度を高め、高画質化を実現することができる。
【００４５】
請求項４に記載の発明は、探索領域に含まれるブロックの中からｘ方向１次元非圧縮画像またはｙ方向１次元非圧縮画像の相関度が最も高いブロックを求めるとき、後から求めるブロックの探索領域上の探索範囲を、先に求めたブロックの周辺に限定するようにしたものであり、一方の成分の動きベクトル検出における検出結果を、他方の成分の検出の際に利用することにより、探索範囲を狭めることができ、高速に動きベクトルを求めることができる。
【００４９】
請求項５に記載の発明は、映像信号の圧縮符号化に用いる動きベクトルを検出する動きベクトル検出装置において、画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像とｙ方向１次元ＤＣＴ画像とを抽出するＤＣＴ成分抽出手段と、ｘ方向１次元ＤＣＴ画像を逆変換してｘ方向１次元非圧縮画像を生成するｘ方向１次元逆ＤＣＴ手段と、ｙ方向１次元ＤＣＴ画像を逆変換してｙ方向１次元非圧縮画像を生成するｙ方向１次元逆ＤＣＴ手段と、生成されたｘ方向１次元非圧縮画像を順番に記憶するｘ方向１次元画像フレームメモリと、生成されたｙ方向１次元非圧縮画像を順番に記憶するｙ方向１次元画像フレームメモリと、動き検出対象領域のブロックから生成されたｘ方向１次元非圧縮画像と探索領域のブロックから生成されたｘ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、動き検出対象領域のブロックから生成されたｙ方向１次元非圧縮画像と探索領域のブロックから生成されたｙ方向１次元非圧縮画像との相関度を算出し、探索領域に含まれるブロックの中から相関度が最も高いブロックを求め、動き検出対象領域のブロックの位置から探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、動きベクトルのｘ成分及びｙ成分を合成して動きベクトルを求めるマッチング手段とを設けたものであり、請求項２の方法を実施することができる。
【００５６】
以下、本発明の実施の形態について、図面を用いて説明する。
【００５７】
（第１の実施形態）
第１の実施形態の動きベクトル検出方法は、ＤＶ方式で符号化された映像信号をＭＰＥＧ方式の映像信号に変換する映像信号変換装置の中で実施されている。この映像信号変換装置は、図２に示すように、入力するＤＶデータ21を保持する、フレームメモリから成る入力手段22と、ＤＶデータを非圧縮の映像信号に復号するＤＶデコード部23と、ブロックごとにＤＣＴ変換されているＤＶデータを利用して動きベクトルを検出する動きベクトル検出部24と、検出された動きベクトルを用いて非圧縮映像信号をＭＰＥＧデータに符号化するエンコーダ部25と、符号化されたＭＰＥＧデータ27を出力する出力手段26とを備えている。
【００５８】
また、動きベクトル検出部24は、図１に示すように、入力手段（フレームメモリ）22からＤＣＴブロックを順番に読み出すＤＣＴブロック読出し手段11と、各ＤＣＴブロックからｘ方向及びｙ方向の各１次元ＤＣＴ画像を抽出するＤＣＴ成分抽出手段12と、ｙ方向の１次元ＤＣＴ画像に対して逆ＤＣＴを施すｙ方向１次元逆ＤＣＴ手段13と、ｘ方向の１次元ＤＣＴ画像に対して逆ＤＣＴを施すｘ方向１次元逆ＤＣＴ手段14と、デコードされたｙ方向の１次元画像を順番に記憶する１次元画像（ｙ）フレームメモリ15と、デコードされたｘ方向の１次元画像を順番に記憶する１次元画像（ｘ）フレームメモリ16と、デコードされた対象ブロックの１次元画像とそれに対応する過去フレームの探索領域の１次元画像とのマッチングを取り、動きベクトルを検出するマッチング手段17と、マッチング手段で求めた動きベクトルをエンコーダ部25に出力する動きベクトル出力手段18と、ＤＣＴブロック読出し手段11、ＤＣＴ成分抽出手段12及びマッチング手段17の動作を制御する動きベクトル検出部制御手段19とを備えている。
【００５９】
この映像信号変換装置の入力手段22には、各ブロックごとにＤＣＴ変換されているＤＶ画像21が入力し、このＤＶ画像は、入力手段22を介してＤＶデコード部23と動きベクトル検出部24とに入力する。ＤＶデコード部23は、ＤＶ画像を非圧縮画像にデコードしてエンコーダ部25に送る。また、動きベクトル検出部24は、ＤＶ画像を用いて、後述する方法により動きベクトルを検出し、エンコーダ部25に送る。エンコーダ部25では、送られて来る非圧縮画像と動きベクトルとを用いてＭＰＥＧエンコードを行ない、出力手段26を介してＭＰＥＧストリームを出力する。
【００６０】
動きベクトル検出部24は、次のような動作で動きベクトルを検出する。
【００６１】
動きベクトル検出部制御手段19は、ＤＣＴブロック読出し手段11、ＤＣＴ成分抽出手段12及びマッチング手段17の各々がフレーム中のどのブロックを処理しているかを把握し、各手段の動作を制御する。
【００６２】
ＤＣＴブロック読出し手段11は、入力手段（フレームメモリ）22からＤＣＴブロックを順番に読み出す。
【００６３】
ＤＣＴ成分抽出手段12は、図３に示すように、読み出された各ＤＣＴブロック31に対して、８×８の要素の内、第１行の要素だけが１でその他は０のマスク32を掛け、１×８ピクセルのＤＣＴ係数より成るｘ方向の１次元ＤＣＴ画像を生成してｘ方向１次元逆ＤＣＴ手段14に出力し、また、読み出された各ＤＣＴブロック31に対して、８×８の要素の内、第１列の要素だけが１でその他は０のマスク33を掛け、８×１ピクセルのＤＣＴ係数より成るｙ方向の１次元ＤＣＴ画像を生成してｙ方向１次元逆ＤＣＴ手段13に出力する。
【００６４】
ｘ方向１次元逆ＤＣＴ手段14は、入力したｘ方向１次元ＤＣＴ画像に対して、１次元逆ＤＣＴを施し、得られたｘ方向１次元画像34を１次元画像（ｘ）フレームメモリ16に出力する。また、ｙ方向１次元逆ＤＣＴ手段13は、入力したｙ方向１次元ＤＣＴ画像に対して、１次元逆ＤＣＴを施し、得られたｙ方向１次元画像35を１次元画像（ｙ）フレームメモリ15に出力する。
【００６５】
１次元画像フレームメモリ15、16は、デコードされた１次元画像を順番に記憶し、フレーム単位で蓄積する。この１次元画像フレームメモリ15、16は、過去数フレーム分の１次元画像を貯えることができる。
【００６６】
マッチング手段17は、１次元画像（ｘ）フレームメモリ16から、対象ブロックのｘ方向１次元画像と、それに対応する過去フレームの探索領域におけるｘ方向１次元画像とを読み出し、それらのマッチングを取る。このとき、ＭＰＥＧではマクロブロック単位で動きベクトルが検出されるため、対象ブロックとして二ブロックを合わせた１×１６のｘ方向１次元画像が読み出される。また、探索領域の範囲は動きベクトル検出部制御手段19から指示される。
【００６７】
このマッチングで動きベクトルを検出する方法を図４に示している。
【００６８】
現フレーム41のＤＣＴ画像に含まれる対象ブロック42のＤＣＴ係数からｘ方向１次元ＤＣＴ画像が抽出され、これに１次元逆ＤＣＴが施され、こうして得られたｘ方向１次元非圧縮画像を、図４では45で表している。
【００６９】
また、これまでに行なわれた同様の処理で得られたブロックごとのｘ方向１次元非圧縮画像は、１次元画像（ｘ）フレームメモリ15にフレーム単位で纏められており、これが、ＤＣＴ画像の過去フレーム43に対応するｘ方向１次元非圧縮画像となる。この内、探索領域のｘ方向１次元非圧縮画像を44で表している。
【００７０】
マッチングは、対象ブロック42のｘ方向１次元非圧縮画像45を、探索領域のｘ方向１次元非圧縮画像44の各行の上を１ピクセル分ずつｘ方向に移動し、そのときの両者の間の画像データの差分（ＳＡＤ：Sum of Absolute Difference）を演算することによって行なわれ、そのＳＡＤが最も小さい位置が検出される。
【００７１】
いま、46の位置でＳＡＤが最小であったとすると、対象ブロック42のｘ方向１次元非圧縮画像45の位置から46の位置までのｘ方向成分が動きベクトルｘ成分47として検出される。
【００７２】
マッチング手段17は、また、１次元画像（ｙ）フレームメモリ15から、対象ブロックのｙ方向１次元画像と、それに対応する過去フレームの探索領域におけるｙ方向１次元画像とを読み出し、同じように、それらのマッチングを取り、動きベクトルｙ成分を求める。
【００７３】
こうして求めた動きベクトルｘ成分と動きベクトルｙ成分とを合成したものが動きベクトルとなる。
【００７４】
動きベクトル出力手段18は、マッチング手段17が求めた動きベクトルをエンコーダ部25に出力する。
【００７５】
また、探索領域の１次元非圧縮画像については、補間画像を生成して加えることにより、動きベクトルの検出精度を高めることができる。例えば、ｘ方向１次元非圧縮画像の場合では、図４に示すように、それぞれ、２本のｘ方向１次元非圧縮画像からその中間の補間画像48を生成して、探索領域のｘ方向１次元非圧縮画像44に加える。こうして、ｘ方向１次元非圧縮画像をｙ方向に補間することにより、動きベクトルｘ成分を高精度に求めることができる。
【００７６】
また、ｙ方向についても同様であり、探索領域のｙ方向１次元非圧縮画像をｘ方向に補間することにより、動きベクトルｙ成分を高精度に求めることができる。
【００７７】
また、先の説明では、ＤＣＴ成分抽出手段12が、ＤＣＴブロックから、１×８ピクセルのＤＣＴ係数より成るｘ方向１次元ＤＣＴ画像と、８×１ピクセルのＤＣＴ係数より成るｙ方向１次元ＤＣＴ画像とを抽出しているが、高速検出の場合には、１×８、８×１の代わりに、１×６、６×１、あるいは１×４、４×１などを抽出するようにしてもよい。なお、ＤＣＴ成分抽出手段12で抽出するサイズの指定は動きベクトル検出部制御手段19によって行なわれる。
【００７８】
このように、この実施形態の動きベクトル検出では、ＤＣＴ変換された映像信号から得られる１次元非圧縮画像を用いて動きベクトルを検出している。この動き予測では、２次元の領域から各方向の成分（１次元）を抽出して、動き探索を行なっているため、２次元の領域を使って行なう全探索と同じ精度を得ることができる。一方、この検出に要する演算量は、全探索に比べて、大幅に削減することができる。
【００７９】
（第２の実施形態）
第２の実施形態では、粗い精度で、且つ高速度で動きベクトルを検出する動きベクトル検出方法と、それを実施する装置について説明する。この方法は、第１の実施形態と組み合わせることで、動きベクトルの検出を高速化することができる。ここでは、この装置が、図２の映像信号変換装置に組み込まれて使用される場合について説明する。
【００８０】
この動きベクトル検出装置は、図５に示すように、入力手段（フレームメモリ）22からＤＣＴブロックを順番に読み出すＤＣＴブロック読出し手段51と、各ＤＣＴブロックから４×４ピクセルサイズの２次元ＤＣＴ画像を抽出するＤＣＴ成分抽出手段52と、抽出された２次元ＤＣＴ画像に４×４ピクセルサイズの逆ＤＣＴを施して非圧縮画像を生成する逆ＤＣＴ手段53と、デコードされた非圧縮画像を順番に記憶する低解像度フレームメモリ54と、デコードされた対象ブロックの非圧縮画像とそれに対応する過去フレームの探索領域における非圧縮画像とのマッチングを取り、動きベクトルを検出するマッチング手段55と、マッチング手段55で求めた動きベクトルをエンコーダ部25に出力する動きベクトル出力手段56と、ＤＣＴブロック読出し手段51、ＤＣＴ成分抽出手段52及びマッチング手段55の動作を制御する動きベクトル検出部制御手段57とを備えている。
【００８１】
この装置の動きベクトル検出部制御手段57は、ＤＣＴブロック読出し手段51、ＤＣＴ成分抽出手段52及びマッチング手段55の各々がフレーム中のどのブロックを処理しているかを把握し、各手段の動作を制御する。
【００８２】
ＤＣＴブロック読出し手段51は、入力手段（フレームメモリ）22からＤＣＴブロックを順番に読み出す。
【００８３】
ＤＣＴ成分抽出手段52は、読み出された各ＤＣＴブロックから４×４ピクセルサイズの２次元ＤＣＴ画像を抽出して逆ＤＣＴ手段53に出力し、逆ＤＣＴ手段53は、入力した２次元ＤＣＴ画像に逆ＤＣＴを施して、図６（ａ）に示すように、低解像度の非圧縮画像を生成する。
【００８４】
この低解像度画像は、マッチング手段55と低解像度フレームメモリ54とに出力され、低解像度フレームメモリ54は、デコードされた低解像度画像を順番に記憶し、フレーム単位で蓄積する。この低解像度フレームメモリ54は、過去数フレーム分の低解像度画像を貯えることができる。
【００８５】
マッチング手段55は、対象ブロックの低解像度画像が入力すると、それに対応する過去フレームの探索領域における低解像度画像を低解像度フレームメモリ54から読み出し、それらのマッチングを取る。
【００８６】
このマッチングで動きベクトルを検出する方法を図６（ｂ）に示している。
【００８７】
現フレーム61のＤＣＴ画像に含まれる対象ブロック62のＤＣＴ係数から４×４ピクセルのＤＣＴ画像を抽出し、これに逆ＤＣＴを施して得られた低解像度非圧縮画像を64で表している。
【００８８】
また、これまでに行なわれた同様の処理で得られたブロックごとの低解像度非圧縮画像が、低解像度フレームメモリ54にフレーム単位で纏められており、これが、ＤＣＴ画像の過去フレーム63に対応する低解像度非圧縮画像となる。この内、探索領域の低解像度非圧縮画像を65で表している。
【００８９】
マッチングは、対象ブロック62の低解像度画像64と、探索領域の各ブロックの低解像度画像との間で画像データのＳＡＤを演算することによって行なわれ、そのＳＡＤが最も小さい探索領域上の位置を求め、対象ブロック62の低解像度画像64の位置からＳＡＤが最小の探索領域上の位置に至る動きベクトル66が検出される。
【００９０】
動きベクトル出力手段56は、マッチング手段55が求めた動きベクトルをエンコーダ部25に出力する。
【００９１】
なお、先の説明では、ＤＣＴ成分抽出手段52が４×４ピクセルサイズの２次元ＤＣＴ画像を抽出する場合について説明したが、２×２の２次元ＤＣＴ画像を抽出するようにしてもよい。
【００９２】
このように、この動きベクトル検出では、ＤＣＴ変換された映像信号から低周波成分のＤＣＴ画像だけを取り出して逆変換し、得られた非圧縮画像を用いて動きベクトルを検出している。そのため、マッチングの演算量が少なくて済み、全探索を行なう場合に比べて、凡そ１／３２の時間で動きベクトルを検出することができる。
【００９３】
しかし、この方法では、動きベクトルの方向や長さを、細かいステップで検出することができず、例えば４×４ピクセルのブロックを用いた場合では、全探索の２倍のステップ幅でしか動きベクトルを把握することができない。
【００９４】
従って、この方法は、動きベクトルの探索領域を絞り込むために使用する方が相応しく、この方法で動きベクトルを検出して、動きベクトルの探索領域を限定し、次いで、限定した狭い範囲の探索領域に、全探索や、あるいは第１の実施形態で示した、精度の高い動きベクトル検出方法を適用して、最終的な動きベクトルを検出する。こうすることにより、全体として、精度の高い動きベクトル検出を短時間で実施することが可能となる。
【００９５】
（第３の実施形態）
第３の実施形態では、第１の実施形態の方法を、演算量がさらに削減できるように改良した動きベクトル検出方法について説明する。
【００９６】
この動きベクトル検出方法が、第１の実施形態と同じ映像信号変換装置（図２）の動きベクトル検出部（図１）において実施される場合について説明する。この方法では、マッチング手段17の動作が第１の実施形態と違っているが、その他の各部の動作は全て同じである。
【００９７】
このマッチング手段17の動作を図１０により説明する。
【００９８】
マッチング手段17は、１次元画像（ｘ）フレームメモリ16から、対象ブロックのｘ方向１次元画像と、それに対応する過去フレームの探索領域におけるｘ方向１次元画像とを読み出し、それらのマッチングを取る。このとき、ＭＰＥＧではマクロブロック単位で動きベクトルが検出されるため、対象ブロックとして二ブロックを合わせた１×１６のｘ方向１次元画像が読み出される。また、探索領域の範囲は動きベクトル検出部制御手段19から指示される。
【００９９】
このマッチングで動きベクトルを検出する方法を図１０に示している。
【０１００】
現フレーム111のＤＣＴ画像に含まれる対象ブロック112のＤＣＴ係数からｘ方向１次元ＤＣＴ画像が抽出され、これに１次元逆ＤＣＴが施され、こうして得られたｘ方向１次元非圧縮画像を、図１０では115で表している。
【０１０１】
また、これまでに行なわれた同様の処理で得られたブロックごとのｘ方向１次元非圧縮画像は、１次元画像（ｘ）フレームメモリ15にフレーム単位で纏められており、これが、ＤＣＴ画像の過去フレーム113に対応するｘ方向１次元非圧縮画像となる。この内、探索領域のｘ方向１次元非圧縮画像を114で表している。
【０１０２】
同様に、現フレーム111のＤＣＴ画像に含まれる対象ブロック112のＤＣＴ係数からｙ方向１次元ＤＣＴ画像が抽出され、これに１次元逆ＤＣＴが施され、こうして得られたｙ方向１次元非圧縮画像を、図１０では119で表している。
【０１０３】
また、これまでに行なわれた同様の処理で得られたブロックごとのｙ方向１次元非圧縮画像は、１次元画像（ｙ）フレームメモリ16にフレーム単位で纏められており、これが、ＤＣＴ画像の過去フレーム113に対応するｙ方向１次元非圧縮画像となる。この内、探索領域のｙ方向１次元非圧縮画像を118で表している。
【０１０４】
マッチングは、まず、対象ブロック112のｘ方向１次元非圧縮画像115を、探索領域のｘ方向１次元非圧縮画像114の各行の上を１ピクセル分ずつｘ方向に移動し、そのときの両者の間の画像データのＳＡＤを演算することによって行なわれ、そのＳＡＤが最も小さい位置が検出される。ここまでの動作は第１の実施形態と同じである。
【０１０５】
いま、116の位置でＳＡＤが最小であったとすると、対象ブロック112のｘ方向１次元非圧縮画像115の位置から116の位置までのｘ方向成分が動きベクトルｘ成分117として検出される。そして、マッチング手段17は、116の位置（動きベクトルｘ成分117、ｙ方向の行数）をマッチング手段17の内部のメモリに一旦格納する。
【０１０６】
マッチング手段17は、次に、１次元画像（ｙ）フレームメモリ16から、対象ブロックのｙ方向１次元画像と、過去フレーム探索領域におけるｙ方向１次元画像とを読み出すが、このとき、探索領域のｙ方向１次元非圧縮画像118のすべてを読み出して探索領域とするのではなく、探索領域を探索範囲121に絞り込み、この探索範囲121に含まれるｙ方向１次元画像のみを１次元画像（ｙ）フレームメモリ16から読み出す。
【０１０７】
この探索範囲121は、動きベクトルｘ成分検出の際に、マッチング手段17の内部のメモリに保持しておいた116の位置を中心としたある一定の大きさを持つ正方形である。
【０１０８】
動きベクトルｙ成分を検出するためのマッチングは、対象ブロック112のｙ方向１次元非圧縮画像119と探索範囲121内のｙ方向１次元画像との間でＳＡＤを計算することによって行なわれ、そのＳＡＤが最も小さい位置が検出される。
【０１０９】
いま、120の位置でＳＡＤが最小であったとすると、対象ブロック112のｙ方向１次元非圧縮画像119の位置から120の位置までのｙ方向成分が動きベクトルｙ成分122として検出される。
【０１１０】
こうして求めた動きベクトルｘ成分と動きベクトルｙ成分とを合成したものが動きベクトルとなる。
【０１１１】
動きベクトル出力手段18は、マッチング手段17が求めた動きベクトルをエンコーダ部25に出力する。
【０１１２】
なお、この実施形態では、動きベクトルのｘ成分を先に検出し、動きベクトルのｙ成分の検出の際に、ｘ成分の検出結果を利用して探索範囲を狭めているが、この順序を逆にして、動きベクトルのｙ成分の検出を先に行ない、動きベクトルｘ成分の検出時に、ｙ成分の検出結果を利用して探索範囲を限定するようにしても同じ効果が得られる。
【０１１３】
このように、この実施形態の動きベクトル検出では、第１の実施形態と同様に、２次元の領域から各方向の成分（１次元）を抽出して、動き探索を行なっているため、２次元の領域を使って行なう全探索と同じ精度を得ることができる。また、第１の実施形態と違って、動きベクトルの一方の成分を検出する際に得られる位置情報を、他方の成分の検出時に利用して探索範囲を限定しているため、動きベクトル検出に要する演算量を削減することができ、第１の実施形態に比べて高速で動きベクトルを検出することができる。
【０１１４】
（第４の実施の形態）
第４の実施形態の動きベクトル検出方法は、非圧縮のデジタル映像信号をＭＰＥＧ方式の映像信号に符号化する場合に適用することができる。
【０１１５】
この方法を実施する映像符号化装置は、図１１に示すように、入力する非圧縮画像131を保持する、フレームメモリから成る入力手段144と、動きベクトル検出を行なう動きベクトル検出部132と、検出された動きベクトルを用いて非圧縮画像信号131をＭＰＥＧデータに符号化するエンコーダ（符号化）部139と、予測画像を格納しておくフレームメモリ142と、符号化されたＭＰＥＧデータ143を出力する出力手段145とを備えている。
【０１１６】
また、動きベクトル検出部132は、入力手段（フレームメモリ）144から画像をブロック単位で順番に読み出すブロック読出し手段134と、各ブロックの各行または各列の画素値の和をすべての行または列に対して求めるアキュムレータアレイ135と、アキュムレータアレイ135で計算された１次元画素列を順番に記憶する１次元画像フレームメモリ136と、動き検索対象ブロックの１次元画像とそれに対応する過去フレームの探索領域の１次元画像とのマッチングを取り、動きベクトルを検出するマッチング手段137と、マッチング手段で求めた動きベクトルをエンコーダ部139に出力する動きベクトル出力手段138と、ブロック読み出し手段134及びマッチング手段137の動作を制御する動きベクトル検出部制御手段133とを備えている。
【０１１７】
この非圧縮画像131は、入力手段144を介してエンコーダ部139と動きベクトル検出部132とに入力する。動きベクトル検出部132は、後述する方法により動きベクトルを検出して、エンコーダ部139に送る。エンコーダ部139では、送られて来る非圧縮画像と動きベクトルとフレームメモリ142に記憶してある予測画像とを用いてＭＰＥＧエンコードを行ない、出力手段145を介してＭＰＥＧストリームを出力する。
【０１１８】
動きベクトル検出部132は、次のような動作で動きベクトルを検出する。
【０１１９】
動きベクトル検出部制御手段133は、ブロック読出し手段134及びマッチング手段137の各々がフレーム中のどのブロックを処理しているかを把握し、各手段の動作を制御する。ブロック読出し手段134は、入力手段（フレームメモリ）144から画像をブロック単位で順番に読み出し、アキュムレータアレイ135へブロックを送る。
【０１２０】
アキュムレータアレイ135は、図１２に示すように、入力されたブロック151に対して、ｘ方向及びｙ方向に沿ってブロック151内の画素値の和を求め、１次元画像152、153をそれぞれ求める。ブロックの最上行を０行とし、ブロックの最左行を０列としｘ，ｙの増加する方向に行、列の番号が増加するものとする。アキュムレータアレイ135内部にはブロック内の全画素を記憶できるレジスタとアキュムレーション後の１次元画像を記憶できるレジスタとを備えている。また、アキュムレータアレイ135は、映像信号の画素に割り当てられたビット幅を一度に加算できるアキュムレータをブロックの１辺に含まれる画素の数だけ有する。
【０１２１】
アキュムレータアレイ135は、ｘ方向アキュムレーションの際、アキュムレータアレイ135の各アキュムレータがブロックの行を担当し、各行の画素の和を計算し、内部の１次元画像を保持しておくためのレジスタに結果を入れる。続いて、アキュムレータアレイ135は、ｙ方向アキュムレーションの際、アキュムレータアレイ135の各アキュムレータがブロックの列を担当し、各列の画素の和を計算し先ほどと同様に、内部の１次元画像を保持しておくためのレジスタに結果を入れる。
【０１２２】
こうして、アキュムレータアレイ135は、１次元画像152及び153を得た後、１次元フレームメモリ136にそれらを書き込む。
【０１２３】
このアキュムレータアレイ135から出力される１次元画像152及び153は、第１の実施形態において１次元逆ＤＣＴ手段によって得られる１次元画像と本質的に等価なものである。そのことを図１３の式を用いて説明する。
【０１２４】
式（１）は１次元ＤＣＴを示す。ここで、ｆは画素値、Ｆは変換されたＤＣＴ係数、Ｎは変換する領域、ｕは１次元方向の位置を示す。また、Ｃ（ｗ）は変換時の定数であり、式（２）に示すような値を持つ。
【０１２５】
式（３）は２次元ＤＣＴを示し、式（１）を２次元に拡張したものである。いま、ＤＣＴ係数の０列目に着目する。ＤＣＴ係数の０列目とは、式（３）でｖ＝０としたものであり、式（４）のようになる。ただし、式（４）の３行目で式（５）の置き換えを行なっている。式（４）の４行目のＧ（ｕ）はｇ（ｊ）を１次元ＤＣＴしたものである。ＤＣＴにおける定数は本質的な意味を持たないのでここでは考えないことにすると、式（４）から、ＤＣＴ係数０列目は、ｇを行方向に関して１次元ＤＣＴしたものであると言える。
【０１２６】
ここで、第１の実施形態のｙ方向１次元逆ＤＣＴ手段13によって得られるｙ方向１次元画像35（図３）に注目すると、このｙ方向１次元画像35は、式（４）で示されるＤＣＴ係数０列目、即ち、Ｆ（ｕ，０）を１次元逆ＤＣＴしたものである。Ｆ（ｕ，０）を１次元逆ＤＣＴしたものは、まさにｇ（ｊ）である。ｊはブロックの行を表すので、式（５）で表されるｇ（ｊ）はブロック内の画素値の行ごとの和を取ったものである。
【０１２７】
以上のことから、第１の実施形態のｙ方向１次元逆ＤＣＴ手段13によって得られるｙ方向１次元画像35とアキュムレータアレイ135が出力する１次元画像152とは本質的に等価であることが分かる。図１３では、ｙ方向に関して説明したが同様にしてｘ方向１次元画像も等価となる。
【０１２８】
１次元画像フレームメモリ136は、アキュムレータアレイ135から出力された１次元画像を順番に記憶し、フレーム単位で蓄積する。なお、この１次元画像フレームメモリ136は、ｘ方向１次元画像及びｙ方向１次元画像の両方を蓄えるのに十分な容量を有する。
【０１２９】
マッチング手段137は、１次元画像フレームメモリ136から、対象ブロックのｘ方向１次元画像と、それに対応する過去フレームの探索領域におけるｘ方向１次元画像とを読み出し、それらのマッチングを取る。このとき、ＭＰＥＧではマクロブロック単位で動きベクトルが検出されるため、対象ブロックとして二ブロックを合わせた１×１６のｘ方向１次元画像が読み出される。また、探索領域の範囲は動きベクトル検出部制御手段133から指示される。
【０１３０】
このマッチングで動きベクトルのｘ方向成分を、図４に示す第１の実施形態の検出方法と同じ方法で検出する。同様に、マッチング手段137は、１次元画像フレームメモリ136から、対象ブロックのｙ方向１次元画像と、それに対応する過去フレームの探索領域におけるｙ方向１次元画像とを読み出し、それらのマッチングを取り、動きベクトルｙ方向成分を検出する。このとき、第３の実施形態の検出方法（図１０）を採ることもできる。
【０１３１】
マッチング手段137は、こうして求めた動きベクトルｘ方向成分と動きベクトルｙ方向成分とを合成し、動きベクトルを得る。動きベクトル出力手段138は、マッチング手段137が求めた動きベクトルをエンコーダ部139に出力する。
【０１３２】
このように、この第４の実施形態の動きベクトル検出では、非圧縮映像信号から１次元画像を作成し、その１次元画像を用いて動きベクトルを検出している。この動き予測では、２次元の領域から各方向の代表成分（１次元）を作成して、動き探索を行なっているため、２次元の領域を使って行なう全探索と同じ精度を得ることができる。この第４の実施形態の動きベクトル検出部132のアキュムレータアレイ135が非圧縮画像から作成した１次元画像は、第１の実施形態の１次元逆ＤＣＴ手段13、14によって得られる１次元画像と同じものであり、第４の実施形態の動きベクトル検出方法は、非圧縮映像の入力に対して、少ない演算量で高精度に動きベクトルを検出することを可能にする。
【０１３３】
（第５の実施形態）
第５の実施形態の動きベクトル検出方法は、非圧縮のデジタル映像信号をＭＰＥＧ方式の映像信号に符号化する映像符号化装置に対して、より適合した動きベクトルを与えることができる。
【０１３４】
この動きベクトル検出では、非圧縮画像から第４の実施形態の方法を用いて対象ブロックの１次元画像を作成し、また、符号化の過程で作成されるＤＣＴ画像データから第１の実施形態の方法を用いて過去フレームの探索領域の１次元画像を作成し、これらの１次元画像により動きベクトルを検出している。
【０１３５】
この映像符号化装置は、図１４に示すように、入力する非圧縮画像171を保持する、フレームメモリから成る入力手段184と、動きベクトル検出を行なう動きベクトル検出部172と、検出された動きベクトルを用いて非圧縮画像信号171をＭＰＥＧデータに符号化するエンコーダ部179と、予測画像を格納しておくフレームメモリ182と、符号化されたＭＰＥＧデータ183を出力する出力手段185とを備えている。
【０１３６】
エンコーダ部179は、非圧縮画像及び動きベクトルから圧縮画像を生成するエンコードカーネル180と、圧縮画像をデコードしてフレームメモリ182に書き込むための予測画像を生成するデコード手段181とを具備し、また、動きベクトル検出部172は、入力手段（フレームメモリ）184から画像をブロック単位で順番に読み出すブロック読出し手段174と、各ブロックの各行または各列の画素値の和をすべての行または列に対して求めるアキュムレータアレイ175と、エンコーダ部179より出力されるＤＣＴブロックからｘ方向及びｙ方向の各１次元ＤＣＴ画像を抽出するＤＣＴ成分抽出手段186と、１次元ＤＣＴ画像に対して逆ＤＣＴを施す１次元逆ＤＣＴ手段187と、デコードされた１次元画像を予測画像として１次元画像フレームメモリ176に書き込む予測画像生成手段188と、１次元予測画像を順番に記憶する１次元画像フレームメモリ176と、動き検索対象ブロックの１次元画像とそれに対応する過去フレームの探索領域の１次元予測画像とのマッチングを取り、動きベクトルを検出するマッチング手段177と、マッチング手段177で求めた動きベクトルをエンコーダ部179に出力する動きベクトル出力手段178と、ブロック読み出し手段174、マッチング手段177及び予測画像生成手段188の動作を制御する動きベクトル検出部制御手段173とを具備している。
【０１３７】
このブロック読出し手段174、アキュムレータアレイ175、マッチング手段177、１次元画像フレームメモリ176及び動きベクトル出力手段178は、第４の実施形態と同じものであり、ＤＣＴ成分抽出手段186及び１次元逆ＤＣＴ手段187は、第１の実施形態と同じものである。
【０１３８】
この非圧縮画像171は、入力手段184を介してエンコーダ部179と動きベクトル検出部172とに入力する。動きベクトル検出部172は、後述する方法により動きベクトルを検出し、エンコーダ部179に送る。エンコーダ部179では、エンコードカーネル180が送られて来る非圧縮画像と動きベクトルとフレームメモリ182に記憶してある予測画像とを用いてＭＰＥＧエンコードを行ない、出力手段185を介してＭＰＥＧストリームを出力する。
【０１３９】
まず、エンコーダ部179の動作について図１５を用いて説明する。エンコーダ部179のエンコーダカーネル192は、減算器194、ＤＣＴ手段195、量子化手段196、可変長符号化手段197、及び動き情報符号化手段198を備え、また、デコード手段193は、逆量子化手段199、逆ＤＣＴ手段2000、及び加算器2001を備えている。また、図１５の非圧縮画像190、フレームメモリ2002、動きベクトル検出部2003、及びＭＰＥＧストリーム2004は図１４と同じものである。
【０１４０】
動きベクトル検出部2003は、非圧縮画像190のブロックに対して動き検出を行ない、動きベクトルが検出できたときは検出した動きベクトルをエンコーダカーネル192へ送る。図示していないエンコーダカーネル制御部は、動きベクトルがあるブロックに対しては減算器194及び加算器2001のステートをオンに、動きベクトルが無いブロックに対しては減算器194及び加算器2001のステートをオフにセットする。
【０１４１】
ＤＣＴ手段195は、減算器194のステートがオンの時は、非圧縮画像ブロックと予測画像との差分を得る。また、減算器194のステートがオフの時は、非圧縮画像ブロックを得る。ＤＣＴ手段195は、受け取ったブロックに対して二次元ＤＣＴを施し量子化手段196へ出力する。量子化手段196は、受け取ったＤＣＴブロックに対して量子化を施し可変長符号化手段及び逆量子化手段199へ出力する。逆量子化手段199は受け取った量子化データを逆量子化し、逆ＤＣＴ手段2000へ出力する。逆ＤＣＴ手段2000は受け取ったＤＣＴブロックに対して逆ＤＣＴを施し、加算器2001のステートがオンの時は、フレームメモリ2002から予測画像を読み出し、出力を加算した後、次のフレームの予測画像としてフレームメモリ2002の所定の位置へ書き込む。また、加算器2001のステートがオフの時は、逆ＤＣＴ手段2000は出力をそのままフレームメモリ2002の所定の位置へ書き込む。
【０１４２】
デコード手段193は、動きベクトル検出部2003で予測画像による動きベクトル検出が行なえるように、逆量子化手段199の出力であるＤＣＴブロックを動きベクトル検出手段2003に送る。また、それと同時に図示していないエンコーダカーネル制御部が、そのブロックに動きベクトルが存在するか否かという情報を動きベクトル検出手段2003に送る。
【０１４３】
動きベクトル検出部172は、次のような動作で動きベクトルを検出する。
【０１４４】
動きベクトル検出部制御手段173は、ブロック読出し手段174とマッチング手段177の各々がフレーム中のどのブロックを処理しているかを把握し、各手段の動作を制御する。また、動きベクトル検出部制御手段173は、エンコーダ部179から動きベクトルの存在情報を得て、予測画像生成手段188に通知する。
【０１４５】
ブロック読出し手段174は、入力手段（フレームメモリ）184から画像をブロック単位で順番に読み出し、アキュムレータアレイ175へブロックを送る。アキュムレータアレイ175は、入力されたブロックに対して、ｘ方向及びｙ方向に沿ってブロック内の画素値の和を求め、１次元画像をそれぞれ求める。
【０１４６】
ＤＣＴ成分抽出手段186は、デコード手段181からデコード中間データであるＤＣＴブロックを受け取り、そのＤＣＴブロックの最上行及び最左列のＤＣＴ成分を抽出し、１次元逆ＤＣＴ手段187に出力する。１次元逆ＤＣＴ手段187は、抽出された各々の１次元データに対して１次元逆ＤＣＴを施し予測画像生成手段188に出力する。予測画像生成手段188は、動きベクトル検出部制御手段173から通知された動きベクトル存在情報に基づき、もしそのブロックが動き補償されていれば、１次元画像フレームメモリ176から相当する１次元予測画像を読み出し、１次元逆ＤＣＴ手段187の出力に足し合わせ、次のフレームの予測画像として１次元画像フレームメモリ176の所定の位置へ書き込む。また、もしそのブロックが動き補償されていなければ、予測画像生成手段188は、１次元逆ＤＣＴ手段187の出力をそのまま１次元画像フレームメモリ176の所定の位置へ書き込む。なお、この１次元画像フレームメモリ176は、ｘ方向１次元画像とｙ方向１次元画像の両方を数フレーム分、蓄えるのに十分な容量を有する。
【０１４７】
マッチング手段177は、１次元アキュムレータアレイ175によって求められた対象ブロックのｘ方向１次元画像と、１次元画像フレームメモリ176から読み出した対応する過去フレームの探索領域におけるｘ方向１次元予測画像とを用いてマッチングを取る。このとき、ＭＰＥＧではマクロブロック単位で動きベクトルが検出されるため、対象ブロックとして二ブロックを合わせた１×１６のｘ方向１次元画像が読み出される。また、探索領域の範囲は動きベクトル検出部制御手段173から指示される。
【０１４８】
このマッチングで動きベクトルのｘ方向成分を検出する方法は、図４に示す第１の実施形態の検出方法と同じである。同様に、マッチング手段177は、１次元アキュムレータアレイ175によって求められた対象ブロックのｙ方向１次元画像と、１次元画像フレームメモリ176から読み出した対応する過去フレームの探索領域におけるｙ方向１次元予測画像とを用いてマッチングを取り、動きベクトルｙ方向成分を検出する。このとき、第３の実施形態の方法を採っても良い。
【０１４９】
マッチング手段177は、こうして求めた動きベクトルｘ方向成分と動きベクトルｙ方向成分とを合成し、動きベクトルとする。動きベクトル出力手段178は、マッチング手段177が求めた動きベクトルをエンコーダ部179に出力する。
【０１５０】
このように、この実施形態の動きベクトル検出では、非圧縮映像信号から１次元画像を作成して、それを動きベクトル検出参照ブロックとし、また、ＭＰＥＧエンコーダ部内のデコード手段のデコード中間データを用いて探索領域の１次元予測画像を作成し、両者のマッチングにより動きベクトルを検出している。
【０１５１】
この動き予測では、２次元の領域から各方向の代表成分（１次元）を作成して、動き探索を行なっているため、２次元の領域を使って行なう全探索と同じ精度を得ることができる。
【０１５２】
また、第４の実施形態では、動きベクトルの検出を行なう探索領域の１次元画像を原画像から求めているが、第５の実施形態の動きベクトル検出方法では、エンコーダ部内で圧縮データをデコードし、それを基に１次元予測画像を作成し、これを動き検出に用いているため、エンコーダ部でのブロック差分の画素値を小さく抑えることが可能となり、圧縮効率及び画質の向上が可能となる。
【０１５３】
また、第５の実施形態の動きベクトル検出方法では、１次元予測画像を作成するのに、エンコーダ部で作成された２次元予測画像を用いずに、エンコーダ部内のデコード手段のデコード中間データから直接計算している。そのため、大きな演算負荷を伴うこと無く、１次元予測画像を得ることができる。
【０１５４】
なお、この実施形態の動きベクトル検出部では、ＭＰＥＧエンコーダ部内のデコード手段のデコード中間データを用いて探索領域の１次元予測画像を作成しているが、その代わりに、二次元の予測画像を記憶するフレームメモリ2003から、動きベクトル検出部2003がブロックを受け取り、アキュムレータアレイ175で探索領域の１次元予測画像を作成し、動きベクトルを検出するようにすることもできる。
【０１５５】
【発明の効果】
以上の説明から明らかなように、本発明の動きベクトル検出方法は、直交変換された映像信号のブロックから、情報量が集中している直流成分を含むｘ方向１次元ＤＣＴ画像とｙ方向１次元ＤＣＴ画像とを取り出して用いているため、演算量の削減量が多いにも拘わらず、２次元画像による全探索と変わらない検出精度を得ることができる。
【０１５８】
また、この検出方法において、動きベクトルの一方の成分を検出する際に得られる位置情報を、他方の成分の検出時に利用して探索範囲を限定することによって、動きベクトル検出に要する演算量をさらに削減することができる。
【０１６０】
また、本発明の動きベクトル検出装置は、検出速度及び検出精度が共に優れた動きベクトル検出方法を実施することができる。
【図面の簡単な説明】
【図１】第１の実施形態における動きベクトル検出装置の構成を示すブロック図、
【図２】第１の実施形態の動きベクトル検出装置が組み込まれた映像信号変換装置の構成を示すブロック図、
【図３】第１の実施形態の動きベクトル検出方法での１次元画像の生成方法を説明する説明図、
【図４】第１の実施形態の動きベクトル検出方法でのマッチング方法を説明する説明図、
【図５】第２の実施形態における動きベクトル検出装置の構成を示すブロック図、
【図６】第２の実施形態の動きベクトル検出方法でのマッチング方法を説明する説明図、
【図７】従来の符号化装置の構成を示すブロック図、
【図８】従来の一般的な動きベクトル検出方法を説明する説明図、
【図９】従来の動きベクトルの高速検出方法を説明する説明図、
【図１０】第３の実施形態の動きベクトル検出方法でのマッチング方法を説明する説明図、
【図１１】第４の実施形態の動きベクトル検出装置が組み込まれた映像信号変換装置の構成を示すブロック図、
【図１２】第４の実施形態のアキュムレータアレイによる１次元画像の生成方法を説明する図、
【図１３】第１の実施形態の１次元画像と第３の実施形態の１次元画像が等価であることを説明する図、
【図１４】第５の実施形態の動きベクトル検出装置が組み込まれた映像信号変換装置の構成を示すブロック図、
【図１５】第５の実施形態のエンコーダ部が組み込まれた映像信号変換装置の構成を示すブロック図である。
【符号の説明】
11、51 ＤＣＴブロック読出し手段
12、52、186 ＤＣＴ成分抽出手段
13 ｙ方向１次元逆ＤＣＴ手段
14 ｘ方向１次元逆ＤＣＴ手段
15 １次元画像（ｙ）フレームメモリ
16 １次元画像（ｘ）フレームメモリ
17、55、76、137、177 マッチング手段
18、56、77、138、178 動きベクトル出力手段
19、57、73、133、173 動きベクトル検出部制御手段
21 ＤＶ圧縮画像
22、144、184 入力手段
23 ＤＶデコーダ部
24、132、172、2003 動きベクトル検出部
25、78、139、179、191 エンコーダ部
26、145、185 出力手段
27、143、183、2004 ＭＰＥＧ圧縮画像
31 ＤＣＴブロック
32、33 マスク
34 ｘ方向対象画像
35 ｙ方向対象画像
41、61、11 現フレーム
42、62、112 対象ブロック
43、63、113 過去フレーム
44、114 探索領域のｘ方向１次元画像
45、115 対象ブロックのｘ方向１次元画像
46、116、120 相関度最大位置
47、117 動きベクトルｘ成分
48 補間画像
53 逆ＤＣＴ手段
54 低解像度フレームメモリ
64 対象ブロックの低解像度画像
65 探索領域の低解像度画像
66、86 動きベクトル
71、131、171、190 非圧縮画像
72 動きベクトル検出部
74、134、174 ブロック読出し手段
75、142、182、2002 フレームメモリ
79 圧縮画像
81 現在フレーム
82 対象ブロック
83 過去フレーム
84 探索領域
85 相関度最大ブロック
91、140、 180、192 エンコードカーネル
92、141、181、193 デコード手段
119 対象ブロックのｙ方向１次元画像
121 探索範囲
122 動きベクトルｘ成分
135、175 アキュムレータアレイ
136、176 １次元画像フレームメモリ
151 ブロック
152 ｙ方向１次元画像
153 ｘ方向１次元画像
187 １次元逆ＤＣＴ手段
188 予測画像生成手段
195 ＤＣＴ手段
196 量子化手段
197 可変長符号化手段
198 動き情報符号化手段
199 逆量子化手段
2000 逆ＤＣＴ手段

Claims

映像信号の圧縮符号化に用いる動きベクトルの検出方法であって、
画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから直流成分を含む１次元ＤＣＴ画像を取り出し、前記１次元ＤＣＴ画像を逆変換して１次元非圧縮画像を生成する１次元非圧縮画像生成手順により、画像フレームの動き検出対象領域のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像を取り出してｘ方向１次元非圧縮画像を生成するとともに、直流成分を含むｙ方向１次元ＤＣＴ画像を取り出してｙ方向１次元非圧縮画像を生成し、前記動き検出対象領域のブロックのｘ方向１次元非圧縮画像と、探索領域のブロックから直流成分を含むｘ方向１次元ＤＣＴ画像を取り出して前記１次元非圧縮画像生成手順で生成したｘ方向１次元非圧縮画像との相関度を算出し、前記探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、前記動き検出対象領域のブロックの位置から前記探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、前記動き検出対象領域のブロックのｙ方向１次元非圧縮画像と、前記探索領域のブロックから直流成分を含むｙ方向１次元ＤＣＴ画像を取り出して前記１次元非圧縮画像生成手順で生成したｙ方向１次元非圧縮画像との相関度を算出し、前記探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、前記動き検出対象領域のブロックの位置から前記探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、前記ｘ成分と前記ｙ成分とを合成して動きベクトルを定めることを特徴とする動きベクトル検出方法。
前記１次元非圧縮画像生成手順において、ｘ方向ｎピクセル、ｙ方向ｎピクセルのｎ×ｎ行列（ｎは自然数）から成る前記ブロックから、直流成分を含む１×ｍピクセル（ｍはｎ以下の自然数）のＤＣＴ係数を取り出し、逆変換して前記ｘ方向１次元非圧縮画像を生成し、前記ブロックから直流成分を含むｍ×１ピクセルのＤＣＴ係数を取り出し、逆変換して前記ｙ方向１次元非圧縮画像を生成することを特徴とする請求項１記載の動きベクトル検出方法。
前記探索領域のブロックから生成した前記ｘ方向１次元非圧縮画像の各々から、それらの中間に位置するｘ方向１次元非圧縮画像を補間し、前記探索領域のブロックから生成した前記ｙ方向１次元非圧縮画像の各々から、それらの中間に位置するｙ方向１次元非圧縮画像を補間し、補間した前記ｘ方向１次元非圧縮画像及びｙ方向１次元非圧縮画像を対象に含めて前記相関度を算出することを特徴とする請求項１記載の動きベクトル検出方法。
前記探索領域に含まれるブロックの中から前記ｘ方向１次元非圧縮画像またはｙ方向１次元非圧縮画像の相関度が最も高いブロックを求めるとき、後から求めるブロックの探索領域上の探索範囲を、先に求めたブロックの周辺に限定することを特徴とする請求項１記載の動きベクトル検出方法。
映像信号の圧縮符号化に用いる動きベクトルを検出する動きベクトル検出装置において、
画像フレームのブロックごとにＤＣＴ変換されている映像信号のブロックから、直流成分を含むｘ方向１次元ＤＣＴ画像とｙ方向１次元ＤＣＴ画像とを抽出するＤＣＴ成分抽出手段と、
前記ｘ方向１次元ＤＣＴ画像を逆変換してｘ方向１次元非圧縮画像を生成するｘ方向１次元逆ＤＣＴ手段と、
前記ｙ方向１次元ＤＣＴ画像を逆変換してｙ方向１次元非圧縮画像を生成するｙ方向１次元逆ＤＣＴ手段と、
生成されたｘ方向１次元非圧縮画像を順番に記憶するｘ方向１次元画像フレームメモリと、
生成されたｙ方向１次元非圧縮画像を順番に記憶するｙ方向１次元画像フレームメモリと、
動き検出対象領域のブロックから生成されたｘ方向１次元非圧縮画像と探索領域のブロックから生成されたｘ方向１次元非圧縮画像との相関度を算出し、前記探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、前記動き検出対象領域のブロックの位置から前記探索領域で求めたブロックの位置までのｘ方向の変位を動きベクトルのｘ成分とし、動き検出対象領域のブロックから生成されたｙ方向１次元非圧縮画像と探索領域のブロックから生成されたｙ方向１次元非圧縮画像との相関度を算出し、前記探索領域に含まれるブロックの中から前記相関度が最も高いブロックを求め、前記動き検出対象領域のブロックの位置から前記探索領域で求めたブロックの位置までのｙ方向の変位を動きベクトルのｙ成分とし、前記動きベクトルのｘ成分及びｙ成分を合成して動きベクトルを求めるマッチング手段とを備えることを特徴とする動きベクトル検出装置。