WO2005117448A1

WO2005117448A1 - 移動物体検出装置および移動物体検出方法

Info

Publication number: WO2005117448A1
Application number: PCT/JP2005/009665
Authority: WO
Inventors: Daijiro Ichimura; Yoshimasa Honda
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-05-31
Filing date: 2005-05-26
Publication date: 2005-12-08
Also published as: JP2007266652A

Abstract

　移動物体の検出を高速かつ高精度かつ低処理負荷で行うことができる移動物体検出装置。本装置において、画像を縮小画像、水平方向成分、垂直方向成分および対角方向成分に分割する帯域分割方法、および、動き予測補償符号化を用いて映像符号化された映像ストリームから動きの情報を抽出する動き情報抽出手段（１０２）と、映像ストリームの最上位ビット平面から順に１以上のビット平面から水平方向成分、垂直方向成分および対角方向成分の情報を抽出するエッジ情報抽出手段（１０３）と、抽出した動き情報とエッジ情報とを用いて移動物体を検出し、その検出結果を出力する移動物体検出手段（１０６）とを有することにより、映像ストリームを復号化する必要がないので、高速かつ高精度かつ低処理負荷で移動物体を検出することができる。

Description

移動物体検出装置および移動物体検出方法

技術分野

[0001] 本発明は、映像を符号ィ匕して生成した映像ストリームカゝら移動物体を検出する移動物体検出装置および方法に関する。

背景技術

[0002] 従来より、この移動物体検出装置としては、例えば、特許文献 1に記載されているようなものがあった。

[0003] この移動物体検出装置は、映像ストリームを復号ィ匕することなぐ動き予測補償符号ィ匕方式に用いた動きベクトルを抽出し、動きベクトルをある領域内の物体の動きとみなして、高速に移動物体を検出するものである。図 1は、特許文献 1に記載された従来の移動物体検出装置を示すものである。

[0004] 図 1において、可変長復号部 1801で復号化された、画像ブロックの符号ィ匕モード、動き補償モードおよび動きベクトル情報と、模様情報検出部 1802で検出された模様情報とは、移動物体検出処理部 1803へ送られる。移動物体検出処理部 1803は、これらの情報を用いて、この画像ブロックが移動物体である力否かを判別する。この判別には、動きベクトル、空間的類似性判断、時間的類似性判断等を用いて行う。特許文献 1：特開平 10— 75457号公報

発明の開示

発明が解決しょうとする課題

[0005] し力しながら、上記従来の構成では、必ずしも物体の動きを正確に表して、な！/、動きベクトルのみに依存しているので、精度が良いとは言えな力つた。すなわち、動きべタトルの生成方法としては、符号化中の領域に対して前後の画像から符号化の圧縮率が高くなる参照領域を探索し、その探索した領域への参照を動きベクトルとすることが多い。このため、動きベクトルのみを用いた移動物体の検出は精度が良くなかつた。

[0006] 本発明の目的は、画像を縮小画像、水平方向成分、垂直方向成分および対角方向成分に分割する帯域分割方法、および、動き予測補償符号ィ匕を用いて映像符号ィ匕された映像ストリームから、移動物体の検出を高速かつ高精度かつ低処理負荷で行うことができる移動物体検出装置および方法を提供することである。

課題を解決するための手段

[0007] 本発明の移動物体検出装置は、映像を複数レイヤに分けて符号ィ匕する階層符号化および動き予測補償符号ィ匕を用いて映像符号化された映像ストリームから、動き情報を抽出する動き情報抽出手段と、前記映像ストリームからエッジ情報を抽出するエッジ情報抽出手段と、前記動き情報と前記エッジ情報とを用いて移動物体を検出し、当該検出結果を出力する移動物体検出手段とを有する構成をとる。

[0008] 本発明の移動物体検出方法は、映像ストリーム力移動物体を検出する方法であつて、前記移動物体を検出する移動物体検出装置が実行するところの、映像を複数レイヤに分けて符号ィ匕する階層符号化、および、動き予測補償符号化を用いて映像符号ィ匕された映像ストリーム力動き情報を抽出するステップと、前記映像ストリーム力エッジ情報を抽出するステップと、抽出した前記動き情報と前記エッジ情報とを用いて移動物体を検出するステップとを有するものである。発明の効果

[0009] 本発明によれば、画像を縮小画像、水平方向成分、垂直方向成分および対角方向成分に分割する帯域分割方法、および、動き予測補償符号ィ匕を用いて映像符号ィ匕された映像ストリームから、映像を復号ィ匕することなぐ高速、高精度かつ低処理負荷で移動する物体の輪郭を検出することが可能になる。また、それと同時に映像の復号ィ匕を行うことができる。

図面の簡単な説明

[0010] [図 1]従来の移動物体検出装置の構成を示す図

[図 2]本発明の実施の形態 1による映像復号ィ匕装置の構成を示す図

[図 3]本発明の実施の形態 1におけるビット平面符号ィ匕の概念図

[図 4]本発明の実施の形態 1による映像復号ィ匕装置の動作を示すフローチャート

[図 5]本発明の実施の形態 1による映像復号ィ匕装置の移動物体検出処理の動作を示すフローチャート [図 6]本発明の実施の形態 1における拡張レイヤのストリーム構造図

[図 7]本発明の実施の形態 1における拡張レイヤのビット平面 kのストリーム構造図

[図 8]本発明の実施の形態 1における拡張レイヤの領域 jのビット平面 kのストリーム構造図

[図 9]本発明の実施の形態 1における基本レイヤのストリーム構造図

[図 10]本発明の実施の形態 1における基本レイヤの領域 jのストリーム構造図

[図 11]図 11Aは、本発明の実施の形態 1における 8 X 8画素領域における水平方向成分の一例を表した図、図 11Bは、本発明の実施の形態 1における 8 X 8画素領域における水平方向成分の他の例を表した図、図 11Cは、本発明の実施の形態 1における 8 X 8画素領域における水平方向成分のさらに他の例を表した図

[図 12]本発明の実施の形態 2による映像監視システムの構成を示す図

[図 13]本発明の実施の形態 2による自動追尾カメラの構成を示す図

[図 14]本発明の実施の形態 2による映像符号ィ匕装置の構成を示す図

[図 15]本発明の実施の形態 2による自動追尾カメラの動作を示すフローチャート

[図 16]本発明の実施の形態 2による映像符号ィ匕装置の動作を示すフローチャート

[図 17]本発明の実施の形態 2による映像監視装置の動作を示すフローチャート

[図 18]本発明の実施の形態 2による映像監視システムの動作を示すシーケンス図

[図 19]本発明の実施の形態 3による映像復号ィ匕装置の構成を示す図

[図 20]本発明の実施の形態 3による映像復号ィ匕装置の動作を示すフローチャート発明を実施するための最良の形態

[0011] 以下、本発明の実施の形態について、図面を参照して詳細に説明する。

[0012] (実施の形態 1)

実施の形態 1は、本発明に係る移動物体検出方法および装置を、映像復号化装置に適用したものである。つまり、映像ストリームを復号ィ匕すると同時に、映像内にある移動物体を高速かつ高精度で検出できるようにしたものである。

[0013] 初めに、本実施の形態で用いる映像ストリームについて説明する。この映像ストリームは基本レイヤと拡張レイヤとからなり、基本レイヤは、単独で復号化し低解像度の映像を得ることができる。拡張レイヤは、基本レイヤの画質を向上して高解像度の映像を得ることが可能な付加情報であり、水平 ·垂直 ·対角方向のエッジ成分 (水平方向成分、垂直方向成分および対角方向成分)を含む。

[0014] 次に、この映像ストリームを生成する方法を説明する。

[0015] まず、入力画像を帯域分割して、縮小画像、水平成分、垂直成分、対角成分を生成する。また、縮小画像を動き予測補償符号化により、単独で映像を復号化可能な基本レイヤとして符号化する。そして水平方向成分、垂直方向成分および対角方向成分をビット平面符号ィ匕により、基本レイヤを復号ィ匕した映像を高画質ィ匕するための拡張レイヤとして符号化する。

[0016] ここで、帯域分割について説明する。帯域分割では、画像を縮小画像、水平成分、垂直成分、および対角成分の 4つの成分に分割する。この帯域分割は、ウェーブレツト変換や、ハイパスフィルタとローパスフィルタとダウンサンブラの組合せを用いるなどにより行う。また、帯域分割して得た、縮小画像 ·水平方向成分、垂直方向成分、および対角方向成分は、帯域合成によってもとの画像に復元することが可能である。この帯域分割によって得られる水平方向成分、垂直方向成分、および対角方向成分とは、数学的に計算可能な近隣画素との画素値の差であり、必ずしも、物体の輪郭を表す訳ではない。例えば、白黒の横縞模様は、その色の境目に強い垂直成分が横線となって現われる。

[0017] 図 2は、本発明の移動物体検出方法および装置を適用した実施の形態 1に係る映像復号ィ匕装置 100の構成を示すブロック図である。

[0018] 図 2において、映像復号ィ匕装置 100は、ストリーム入力部 101、基本レイヤ復号化 1

02、拡張レイヤ復号化部 103、帯域合成部 104、映像出力部 105、移動物体検出部 106、検出結果出力部 107を有する。

[0019] なお、基本レイヤ復号ィ匕部 102と拡張レイヤ復号ィ匕部 103と帯域合成部 104とが本発明の映像復号ィ匕手段に相当し、基本レイヤ復号化部 102が動き情報抽出手段に相当し、拡張レイヤ復号ィ匕部 103がエッジ情報抽出手段に相当し、移動物体検出部

106が移動物体検出手段に相当する。

[0020] ここで、映像復号化手段は、入力した映像ストリームを復号ィ匕して映像を生成して出力する。動き情報抽出手段は、入力した映像ストリーム力動き情報を抽出して移動物体検出手段に出力する。エッジ情報抽出手段は、入力した映像ストリーム力ェッジ情報を抽出して移動物体検出手段に出力する。移動物体検出手段は、入力したエッジ情報と動き情報力移動物体を検出する。

[0021] 次に、以上のように構成された映像復号ィ匕装置 100の動作を説明する。

[0022] 図 4は、図 2に示す実施の形態 1の映像復号ィ匕装置 100の動作を表すフローチヤートである。なお、図 4に示すフローチャートは、図示しない記憶装置（例えば ROM やフラッシュメモリなど）に格納された制御プログラムを、同じく図示しない CPUが実行することにより、プログラムの実行によりソフトウェア的に実行されるようにすることも可能である。

[0023] まず、ストリーム入力部 101が、映像復号ィ匕装置 100の外部から映像ストリームを入力し、映像ストリームの基本レイヤを基本レイヤ復号ィ匕部 102へ、拡張レイヤを拡張レィャ復号ィ匕部 103に出力する (ステップ S301)。

[0024] 次に、基本レイヤ復号ィ匕部 102が、ストリーム入力部 101から入力した基本レイヤから動き情報を抽出し移動物体検出部 106に出力する。また、拡張レイヤ復号化部 10 3が、ストリーム入力部 101から入力した拡張レイヤ力エッジ情報を抽出して移動物体検出部 106に出力する。そして、移動物体検出部 106が、基本レイヤ復号化部 10 2と拡張レイヤ復号ィ匕部 103から入力した動き情報とエッジ情報を用いて移動物体の検出を行い、移動物体検出結果を生成し検出結果出力部 107と帯域合成部 104〖こ出力する (ステップ S302)。

[0025] なお、映像は、移動物体を含むこともあれば含まないこともあり、また、含む場合にも移動物体が 1つであることもあれば複数であることもある。

[0026] 以下に、ステップ S302の移動物体検出処理について詳しく説明を行う。

[0027] 図 5は、図 4の移動物体検出処理の手順の一例を示すフローチャートである。

[0028] まず、ステップ S401では、エッジ情報の抽出処理を行う。具体的には、拡張レイヤ復号ィ匕部 103が、ストリーム入力部 101から入力した拡張レイヤ力も特定のビット平面までの情報を含む符号を抽出し、エッジ情報を生成して移動物体検出部 106に出力する。

[0029] ここで、ビット平面符号ィ匕について説明する。 [0030] このビット平面とは、 2進数で表された幾つかの数値データの同じビット位のみを並ベたビット列のことである。ビット平面ごとに符号ィ匕する方法をビット平面符号化とよび、 Weiping. Li, Overview of Fine Granularity scalability in MPEG— 4 Video Standard , IEEE Transaction on Circuits and Systems for Video Technology, vol.11, pp.301— 317, Mar.2001に記述されるようにデータの品質を調整する能力に優れて、る。

[0031] 図 3はビット平面符号ィ匕の概念を示した図であり、水平方向成分のある領域を表すものとして説明を進める。

[0032] 図 3において、 1列は、水平成分の 1画素を 2進数で表現したものを表す (画素 1、画素 2)。 1行は、水平方向成分のある領域におけるビット平面を表し (ビット平面 1、ビット平面 2)、すなわち、各画素の同じ位のビットのみを集めたものである。ビット平面は、上位のビット平面であるほど、水平方向成分の強いエッジを表現することが可能である。このビット平面のうち、最上位ビット平面力も特定のビット平面までの情報を並ベたものを符号化したものがエッジ情報である。例えば 8 X 8画素や 16 X 16画素の領域ごとの特定ビット平面までのビット平面ごとの符号量などの情報を含む。水平方向成分、垂直方向成分および対角方向成分は多くの「0」を含むので、ビット平面符号ィ匕は「0」が多い場合に符号長が短くなるように符号ィ匕する。よって、「1」を多く含むほど水平方向成分、垂直方向成分および対角方向成分の領域のビット平面は符号長が長くなる。

[0033] 図 6は本実施の形態の拡張レイヤのデータ構造を表すものである。図 6に示す拡張レイヤは、 1画像分の符号であり、 n個のビット平面と m個の領域の情報を含む。 1画像分の拡張レイヤは、画像のヘッダ情報 501、最上位のビット平面を表すビット平面 1力も最下位のビット平面 nの情報 502を保持する。

[0034] 図 7は図 6における拡張レイヤのビット平面 kのデータ構造を表し、拡張レイヤのビット平面 kはビット平面のヘッダ情報 601、領域 1〜領域 mのビット平面 kの符号 602を含む。

[0035] 図 8は図 7における拡張レイヤの領域 jのビット平面 kのデータ構造を表し、拡張レイャの領域 jのビット平面 kは該当する領域の画素成分の符号 701と、領域の符号が終了したことを表す終端信号 702を含む。 [0036] 以上のようなデータ構造により、ビット平面の情報の抽出は、最上位ビット平面から特定のビット平面まで、それら領域の終端信号を順に映像ストリーム内から検索し、領域の終端信号間の符号長を数えるだけでよい。このため、拡張レイヤ復号ィ匕部 10 3は高速にエッジ情報を生成することが可能である。

[0037] 次に、ステップ S402では、動き情報の抽出処理を行う。具体的には、基本レイヤ復号ィ匕部 102が、ストリーム入力部 101から入力した基本レイヤ力動きベクトルの情報を抽出し、動き情報を生成して移動物体検出部 106に出力する。

[0038] この動き情報は、基本レイヤの動き予測補償に用いるものであり、領域ごとの動き予測補償符号ィ匕であるか、フレーム内符号ィ匕である力の情報、動きべ外ルの大きさと方向、動きベクトルが参照する画像の情報、および画像全体が動き予測補償符号ィ匕であるか、フレーム内符号ィ匕であるかの情報などを含む。

[0039] 図 9は本実施の形態の基本レイヤのデータ構造を表すものである。図 9に示す基本レイヤは、 1画像分の符号であり、 m個の領域の情報を含む。すなわち、 1画像分の基本レイヤは、画像のヘッダ情報 801と、領域 1〜領域 mの情報 802とを含む。図 10 は図 9における基本レイヤの領域 pのデータ構造を表し、基本レイヤの領域 pは領域のヘッダ情報 901、動きベクトル 902、画素成分の符号 903、および、領域の符号が終了したことを表す終端信号 904を含む。

[0040] 動きベクトルの抽出は、それら領域のヘッダ情報 901や終端信号 904を映像ストリ一ムカも検索し、その位置力も定位置にある動きベクトル 902のみを復号ィ匕するだけでよい。これにより、基本レイヤ復号ィ匕部 102は高速に動き情報を生成することが可能である。

[0041] ステップ S403では、移動物体の輪郭の検出処理を行う。具体的には、移動物体検出部 106が、基本レイヤ復号ィ匕部 102と拡張レイヤ復号ィ匕部 103とから入力した動き情報とエッジ情報を用いて移動物体の輪郭の領域を検出し、結果を移動物体検出部 106に記憶する。

[0042] ここで、輪郭の領域の検出方法について、以下に説明する。

[0043] すなわち、ある領域に対する水平方向成分、垂直方向成分および対角方向成分のビット平面から求めた符号長、例えば最上位ビット平面から 3ビット平面までの各符号量の合計符号長が閾値 A以上であることを条件 1とする。なお、この閾値 Aは弱いェッジと判定する基準値である。

[0044] また、上記の領域の合計符号長が閾値 B以下であることを条件 2とする。この閾値 B は縞模様のようなエッジでない画像を識別するための基準値である。

[0045] そして、領域が含むエッジ情報が点力線か面を表すものであるか否かを判別し、上記の領域の合計符号長が、これら条件 1と条件 2とを満足するとき、物体の輪郭に現われる線であると判定する。以下に、具体的な例を、図 11を用いて説明する。

[0046] 図 11Aから図 11Cは、それぞれ、 8 X 8画素領域における水平方向成分の例を表したものである。説明を簡単にするため、画素値を 2値で表しており、最上位ビット平面力も特定のビット平面までに" 1 "を含むならばマスを黒くし、" 1 "を含まないものは白く表す。図 11 Aは領域内にノイズや小さヽ点などが存在する場合の水平方向成分を示し、図 11Bは領域内に縦線が存在する場合の水平方向成分を示し、図 11Cは領域内全てが例えば縞模様の一部である場合の水平方向成分を示す。図 11Aから図 11Cで表される領域をそれぞれ符号化すると、領域が含む 0以外の値の多さに応じて符号量は小さい順に図 11A、図 11B、図 11Cとなる。垂直方向成分と対角方向成分についても同様である。このとき、閾値 Aが 8、閾値 Bが 32とすると、閾値 Aく前記合計値 <閾値 Bの関係が成立する図 11Bに示す領域は物体の輪郭に現われる線を含むと判定することができる。なお、閾値 Aく閾値 Bである。

[0047] また、より簡便な輪郭抽出としては、閾値 Aのみを利用して、閾値 A<前記合計値の関係が成立する領域は、物体の輪郭に現れる線を含むと判定することもできる。

[0048] さらに、輪郭と判定したある領域が移動物体の輪郭である力否かは、次の条件 3あるいは条件 4を満たすか否かにより行う。

[0049] すなわち、条件 3は、領域の動きベクトルの大きさが閾値 C未満であることであり、対象とする移動物体の動きはある程度以上の動きをしている必要があるからである。

[0050] 条件 4は、領域の動きベクトルと、周囲の動きベクトルとの差分ベクトルの大きさが閾値 D未満であることである。これは、移動物体が周囲とは同じ動きをするか否かを判断する。なお、周囲の動きベクトルは一つでなくても良い。その場合の条件 4について説明する。まず、周囲の複数の動きベクトルを抽出し、周囲の動きベクトル毎に、領域の動きベクトルとの差分ベクトルの大きさを求める。この場合の条件 4は、差分べクトルの大きさの合計値が閾値 D未満であることである。

[0051] なお、条件 4について上記以外として次の条件も想定できる。例えば周囲の動きべタトルとして複数の動きベクトルを選択した場合、領域と周囲の領域の動きベクトルの X方向成分 (水平方向成分)の差分の 2乗和と、同じく Y方向成分 (垂直方法成分)の差分の 2乗和の合計で計算したもの (以下、分散)を基準とすることもできる。この場合の条件 4は、上記分散が閾値 D未満であることである。条件 4を満たせば、領域の動きベクトルは周囲と同じ方向や大きさを持つものとし、移動物体でないと判断する。また、分散の計算はこれに限らず、動きベクトルの大きさの差分の絶対値と角度の差分の絶対値の積を周囲領域で合計した値で計算しても良い。領域の動きベクトルが周囲の動きベクトルと異なる方向や大きさを持つかどうかを判断できるものであれば、これらに限らない。

[0052] そして、この条件 4あるいは条件 5を満たすとき、その領域は移動物体の領域でないと判定する。なお、画像全体をフレーム内符号ィ匕しているように、動きベクトルを含まな!/、フレームでは輪郭の判断をせずに、動きベクトルを含んで、るフレームを待つようにする。これは、動きベクトルのないフレームからは動きを検出することができない力である。

[0053] 移動物体検出部 106は、上記の条件 1と条件 2とから物体の輪郭と判定した領域のうち、条件 3、又は条件 4を満たす領域を、移動物体の輪郭ではないと判定する。これは、移動する物体の輪郭は、周囲と異なる速度をもって動くからである。

[0054] 次に、ステップ S404では、移動物体の内部の検出処理を行う。具体的には、移動物体検出部 106が、基本レイヤ復号ィ匕部 102から入力した動き情報と、前記記憶した移動物体の輪郭の検出結果を用いて、移動物体の内部の領域を検出する。内部の領域の検出結果を移動物体検出部 106に記憶する。

[0055] ここで、内部の領域を検出する方法について、以下に説明する。

[0056] すなわち、ある領域を移動物体の内部であると判定する条件は次に示す条件 5あるいは条件 6を満たす場合である。

[0057] 条件 5は、移動物体の輪郭または内部と判定した領域の近傍にあり、近傍の領域との動きベクトルの大きさと方向の分散が閾値 E未満であることであり、閾値 Eは移動物体の輪郭と内部とが同一速度で動くと判定するときの基準値である。

[0058] 条件 6は、移動物体の輪郭または内部と判定した領域に囲まれていることであり、これは移動物体の内部は輪郭で囲まれているものだ力である。

[0059] 次に、ステップ S405では、移動物体の誤検出を除去する処理を行う。具体的には

、移動物体検出部 106が、記憶してある移動物体の輪郭と内部の領域の検出結果から、誤検出した領域を除去し、移動物体検出結果を生成し検出結果出力部 107と帯域合成部 104に出力する。

[0060] この誤検出した領域であることの判定条件は、移動物体の輪郭または内部と判定した領域が周囲に少ないことであり、あまりに小さい移動物体を検出した場合には、誤検出の可能性が高いからである。

[0061] 移動物体検出部 106は、上記のようにして得た移動物体の領域力移動物体検出結果を生成する。移動物体検出結果は、例えば以下のようなものである。

[0062] 第 1に、移動物体の領域であるか、そうでないかを領域ごとに記述した情報であり、第 2に、 1つの移動物体に対してそれに外接する 1つ矩形や楕円を定義し、矩形や楕円ごとの座標や大きさを記述した情報である。

[0063] なお、移動物体の内部の情報を必要としない場合は、内部の検出の処理を省略しても良い。

[0064] また、移動物体の検出方法については、動きベクトルを用いた移動物体の検出方法に限らず、本発明のエッジ情報と組み合わせれば、他の方法を用いても良い。

[0065] 本実施の形態の移動物体検出方法によると、基本レイヤが動きベクトルを含み、拡張レイヤがあるビット位のビット平面までの符号さえ含んで、れば、伝送が低ビットレートであって、例え画質が悪くても、移動物体の検出を高速かつ高精度かつ低処理負荷に行うことが可能である。

[0066] 次に、ステップ S303では、移動物体を検出した結果を出力する。具体的には、検出結果出力部 107が、移動物体検出部 106から入力された移動物体の領域の座標を外部に出力する。

[0067] 次に、ステップ S 304では、基本レイヤ復号化処理を行う。具体的には、基本レイヤ復号ィ匕部 102が、ストリーム入力部 101から入力した映像ストリームの基本レイヤを、動き予測補償復号化して縮小画像を生成し、帯域合成部 104に出力する。

[0068] 次に、ステップ S 305では、拡張レイヤ復号化処理を行う。具体的には、拡張レイヤ復号ィ匕部 103が、ストリーム入力部 101から入力した映像ストリームの拡張レイヤをビット平面復号化して水平方向成分、垂直方向成分および対角方向成分を生成し、帯域合成部 104に出力する。

[0069] 次に、ステップ S306では、帯域合成処理を行う。具体的には、帯域合成部 104が、基本レイヤ復号ィ匕部 102から入力した縮小画像と拡張レイヤ復号ィ匕部 103から入力した水平方向成分、垂直方向成分および対角方向成分を帯域合成し復号画像を生成し、映像出力部 105に出力する。さらに、帯域合成部 104が、移動物体検出部 1 06から入力した移動物体検出結果を用いて、復号画像の移動物体を含む領域を強調しても良い。

[0070] ここで、この移動物体の領域の強調にっ、て説明する。例えば、帯域合成部 104 力移動物体の領域の部分だけ復号映像を着色する、または、移動物体の領域を枠で囲むなどの処理を行う。また、基本レイヤを復号ィ匕して得る縮小画像の全画素の値を「0」として帯域合成して輪郭のみ力もなる画像を生成し、さらに、移動物体の領域部分を強調しても良い。

[0071] このようにすると、輪郭力なる映像の中において移動物体のみが非常に目立ち、複数の監視映像を同時に見る監視者にとって異常や不審人物の発生を検知しやすい。また、通信速度の制限などにより基本レイヤのビットレートが非常に低ぐ画質の極端に悪い映像しか生成できないときには、輪郭のみの方がむしろ細部を認識できる場合がある。あるいは、複数のカメラ映像を表示する場合などの、処理能力が限られた環境においても、輪郭のみ表示する方が、低処理負荷で、監視上重要な領域を見やすくすることが可能になる。

[0072] 次に、ステップ S307では、映像出力処理を行う。具体的には、映像出力部 105が、帯域合成部 104から入力した復号映像を外部に出力する。

[0073] なお、復号ィ匕処理を行わずに移動物体の検出のみを行うことも可能であり、このとき、映像を得ることはできないが、基本レイヤ復号ィ匕処理 (ステップ S304)から映像出力処理 (ステップ S307)までの処理をしないので、更に高速かつ低処理負荷で移動物体を検出することが可能となる。

[0074] 次に、ステップ S308では、終了判定処理を行う。ストリーム入力部 101が、続く映像ストリームの有無を判定するなどして、映像復号ィ匕装置 100がこれ以上移動物体の検出を行う必要も映像を復号する必要もなければ処理を終了し、そうでなければステップ S 301に戻る。

[0075] なお、上記の説明では基本レイヤ復号化処理 (ステップ S304)乃至映像出力処理

(ステップ S307)を移動物体の検出処理 (ステップ S302とステップ S303)後に行つているが、これに限らず、基本レイヤや拡張レイヤの復号化処理と並列して、移動物体検出処理を行うことが可能である。

[0076] また、帯域分割を用いた他の符号ィ匕方法による映像ストリームの生成方法として、入力画像を動き予測補償した後に帯域分割を行って、ビット平面符号ィ匕する方法がある。しかし、この方法では、動き予測補償により前後の画像と差分をとつた画像を帯域分割しても、物体の輪郭に発生する水平方向成分、垂直方向成分および対角方向成分を得ることができない。この場合は、全体をフレーム内符号ィ匕した画像の水平方向成分、垂直方向成分および対角方向成分のみ用いることになる。

[0077] また、拡張レイヤに、水平方向成分、垂直方向成分および対角方向成分のみならず、縮小画像と基本レイヤを復号した画像の差分の情報を含めることも可能である。

[0078] 以上のように、本実施の形態 1によれば、入力画像を直接帯域分割して得る水平方向成分、垂直方向成分および対角方向成分の情報と、動き予測補償によって生成する動きベクトルを含む映像ストリームから、エッジの情報と動きの情報を抽出する手段を設けたことにより、動き予測符号ィヒを用いた基本レイヤと水平方向成分、垂直方向成分および対角方向成分のビット平面符号ィ匕を用いた拡張レイヤ力なる映像ストリームを復号ィ匕することなぐ高速かつ高精度かつ低処理負荷に移動物体を検出することができる。

[0079] また、実施の形態 1によれば、動き情報を基本レイヤの映像ストリームから、エッジ情報を拡張レイヤの映像ストリーム力抽出することが可能で、動き情報が動きのないことを示している場合にエッジ情報の抽出などの処理を中止して処理負荷を軽減することが可能であり、また、エッジ情報がエッジのないことを示している場合に動き情報の抽出などの処理を中止して処理負荷を軽減することが可能であり、高速に物体の輪郭を検出することができる。このとき、動き情報とエッジ情報の抽出はどちらを先に行っても良ぐまた、並列に行っても良い。

[0080] また、実施の形態 1によれば、移動物体の検出は、動きベクトルと一部のビット平面のエッジ情報のみで行うことができるので、通信速度が制限された状況など低ビットレートの映像ストリームであっても高速かつ高効率に移動物体の検出が可能である。

[0081] また、実施の形態 1では、移動物体の検出に必要なエッジ情報の抽出を拡張レイヤ復号ィ匕部 103が行い、動き情報の抽出を基本レイヤ復号ィ匕部 102が行うことにより、映像復号化処理と移動物体検出処理とがー部の手段や処理を共有することができるので、移動物体の検出と映像の復号化とを同時に、かつ高速に行うことが可能であり、また、装置全体の規模を小さくすることができる。

[0082] また、実施の形態 1によれば、拡張レイヤ復号ィ匕部 103が、映像ストリーム内にあるビット平面ヘッダ 601に含まれる開始信号や、 8 X 8画素などの領域ごとの終端信号 702を検索し識別信号間の符号長を数えるだけで、高速にエッジ情報を生成することが可能である。

[0083] また、実施の形態 1によれば、基本レイヤ復号ィ匕部 102が、映像ストリーム内の、例えば、 8 X 8画素などの領域ごとの識別信号を検索し、その識別信号力決まった位置にある動きベクトルを復号するだけで、高速に動き情報を生成することが可能である。

[0084] また、実施の形態 1によれば、移動物体検出部 106が、エッジ情報と動き情報による移動物体の輪郭の検出、動き情報や既に検出した結果による移動物体の内部の検出、および、誤検出の除去を行うことにより、移動物体の検出を高精度に行うことが可能である。

[0085] また、実施の形態 1では、帯域合成部 104が、復号ィ匕した映像の移動物体の領域を強調することや、基本レイヤを復号ィ匕した縮小映像を帯域合成しな、線画をもちヽることにより、移動物体の検出結果を監視者に検知しゃすくすることが可能である。

[0086] (実施の形態 2) 実施の形態 2は、本発明に係る移動物体検出方法および装置を映像監視システムに適用したものである。映像監視システムは、映像符号化装置を備えた自動追尾カメラを有する。つまり、映像を符号ィ匕し映像ストリームを生成すると同時に、映像内にある移動物体を高速かつ高精度かつ低処理負荷で検出し、その検出結果をもとに自動追尾カメラが移動物体を自動追尾し、効率的に映像監視できるようにしたものである。

[0087] 以下に、この映像監視システムについて具体的に説明する。

[0088] 図 12は、本発明の移動物体検出方法および装置を適用した実施の形態 2に係る映像監視システムの構成を示す図である。

[0089] この映像監視システムは、映像監視装置 1100、通信網 1110、 N台の自動追尾力メラ 1121〜112Nを有する。なお、自動追尾カメラは本発明の撮像装置に相当する

[0090] 図 13は、実施の形態 2に係る自動追尾カメラ 1121乃至 112Nの構成を示すブロック図である。図 13に示す自動追尾カメラは、図 12に示す映像監視システムにおける自動追尾カメラ 1121に対応する。

[0091] 図 13において、自動追尾カメラ 1121は、撮像部 1201、映像符号ィ匕部 1202、撮像制御部 1203を有する。他の自動追尾カメラ 1122〜 112Nにつ、ても同様の構成を有する。

[0092] なお、撮像部 1201が本発明の撮像手段に相当し、撮像制御部 1203が本発明の撮像制御手段に相当する。

[0093] ここで、撮像部 1201はパン'ティルト 'ズームなどの撮像機能動作を行って撮像した映像を映像符号ィ匕部 1202へ出力する。

[0094] 映像符号ィ匕部 1202は、入力した映像を帯域分割して、水平方向成分、垂直方向成分および対角方向成分の情報と、動き予測補償によって生成する動きベクトルを含む映像ストリームを生成する。

[0095] 撮像制御部 1203は、追尾する目標の情報と移動物体の検出の結果を入力し、撮像部 1201に対してパン'ティルト ·ズームを行うための制御信号を生成し出力する。

[0096] 図 14は、映像符号ィ匕部 1202の構成を示すブロック図であり、本発明の移動物体検出方法および装置を適用した映像符号化装置に相当する。

[0097] 図 14において、映像符号ィ匕部 1202は、映像入力部 1301、帯域分割部 1302、基本レイヤ符号ィ匕部 1303、拡張レイヤ符号ィ匕部 1304、ストリーム出力部 1305,移動物体検出部 1306、および検出結果出力部 1307を有する。

[0098] なお、帯域分割部 1302と基本レイヤ符号ィ匕部 1303と拡張レイヤ符号ィ匕部 1304とが本発明の映像符号ィ匕手段に相当し、基本レイヤ符号ィ匕部 1303が動き情報抽出手段に相当し、拡張レイヤ符号ィ匕部 1304がエッジ情報抽出手段に相当し、移動物体検出部 1306が移動物体検出手段に相当する。

[0099] ここで、映像符号化手段は、入力した映像を符号ィ匕して映像ストリームを生成して出力する。これを構成する帯域分割部 1302は、入力画像を帯域分割して、縮小画像、水平成分、垂直成分、および対角成分を生成したり、縮小画像を動き予測補償符号化により、単独で映像を復号ィ匕可能な基本レイヤとして符号ィ匕する。また、これら水平方向成分、垂直方向成分および対角方向成分をビット平面符号ィヒにより、拡張レイヤとして符号化する。基本レイヤ符号ィ匕部 1303は、生成した映像ストリームから動き情報を抽出して移動物体検出部 1306に出力する。拡張レイヤ符号化部 130 4は、生成した映像ストリーム力もエッジ情報を抽出して移動物体検出部 1306に出力する。移動物体検出部 1306は、入力したエッジ情報と動き情報力移動物体を検出する。なお、ストリーム出力部 1305と検出結果出力部 1307とが本発明の出力部に相当する。

[0100] 次に、本実施の形態に係る自動追尾カメラ 1121の動作を説明する。図 15は、図 1 3に示す自動追尾カメラ 1121の動作を表すフローチャートである。なお、図 15に示すフローチャートは、図示しない記憶装置 (例えば ROMやフラッシュメモリなど）に格納された制御プログラムを、同じく図示しない CPUが実行することにより、プログラムの実行によりソフトウェア的に実行されるようにすることも可能である。

[0101] まず、ステップ S1401により、撮像処理を行う。具体的には、撮像部 1201が、監視対象の映像を撮像し、入力画像を映像符号化部 1202の映像入力部 1301に出力する。また、撮像部 1201が、パン'ティルト 'ズームや設置場所の情報を映像符号ィ匕部 1202の検出結果出力部 1307に出力する。 [0102] 次に、ステップ S1402では、映像符号化処理を行う。映像符号ィ匕部 1202が、撮像部 1202から入力した入力映像を符号ィ匕して映像ストリームを生成し、同時に移動物体を検出して移動物体検出結果を生成する。これら生成した映像ストリームと移動物体検出結果とを、通信網 1110を介して映像監視装置 1100の受信部 1101に出力する。また、移動物体検出結果を撮像制御部 1203に出力する。

[0103] 次に、ステップ S1403では、撮像制御処理を行う。具体的には、撮像制御部 1203 力通信網 1100を介して映像監視装置 1100のカメラ群制御部 1102から入力した目標追尾命令と、映像符号ィ匕部カゝら入力した移動物体検出結果とにより、パン'ティルト 'ズームの制御信号を生成し撮像部 1201に出力する。撮像部 1201は、撮像制御部 1203から入力した制御信号に基づきパン'ティルト ·ズームを行う。

[0104] ここで、この制御信号について説明する。後述する映像監視装置 1100が生成した目標追尾命令が、例えば、補足すべき不審人物を撮影するための座標や拡大率などを指定して、る場合には、撮像制御部 1203はそれにあわせてパン'ティルト ·ズームさせる制御信号を生成する。補足すべき不審人物を撮影するための座標と、移動物体検出結果が示す移動物体の領域の座標にズレがある場合には、撮像制御部 1 203がズレを修正して制御信号を生成してもよい。また、追尾する移動物体が画面に対して常に一定の面積を占めるようにカメラをパンさせても良い。目標追尾命令が無いが移動物体検出結果がある場合、移動物体を映像の中心にして撮影する。また、複数の移動物体が全て映像に収まるように制御信号を生成しても良い。その他、特に目標追尾命令も移動物体検出結果も無い場合は、広範囲を撮影する目的で撮像部 1201に首振り運動させる制御信号を生成してもよ!/、。

[0105] 次に、ステップ S1404で、自動追尾カメラ 1121の電源が切られるなど、映像監視を行う必要がなければ終了し、そうでなければステップ S1401に戻る。

[0106] ここで、図 15におけるステップ S 1402の映像符号ィ匕処理について詳しく説明する。

[0107] 図 16は、映像符号ィ匕部 120の動作を表すフローチャートである。なお、図 16に示すフローチャートは、図示しない記憶装置 (例えば ROMやフラッシュメモリなど）に格納された制御プログラムを、同じく図示しない CPUが実行することにより、プログラムの実行によりソフトウェア的に実行することも可能である。 [0108] まず、ステップ S1501では、映像入力処理を行う。具体的には、映像入力部 1301 が、自動追尾カメラ 1121の撮像部 1201から入力画像を入力し帯域分割部 1302に出力する。

[0109] 次に、ステップ S1502では、帯域分割処理を行う。具体的には、帯域分割部 1302 力映像入力部 1301から入力した入力画像を帯域分割して縮小画像と水平方向成分、垂直方向成分および対角方向成分を生成し、縮小画像を基本レイヤ符号化部 1 303に、水平方向成分、垂直方向成分および対角方向成分を拡張レイヤ符号ィ匕部 1 304に出力する。

[0110] 次に、ステップ S1503では、基本レイヤ符号化処理を行う。具体的には、基本レイャ符号ィ匕部 1303が、帯域分割部 1302から入力した縮小画像を動き予測補償符号化して基本レイヤを生成し、ストリーム出力部 1305に出力する。また、動き予測補償の際に得る動き情報を移動物体検出部 1306に出力する。

[0111] 次に、ステップ S1504では、拡張レイヤ符号化処理を行う。具体的には、拡張レイャ符号ィ匕部 1304が、帯域分割部 1302から入力した水平方向成分、垂直方向成分および対角方向成分をビット平面符号ィ匕して拡張レイヤを生成し、ストリーム出力部 1 305に出力する。また、ビット平面符号ィ匕の際に得られるエッジ情報を移動物体検出部 1306に出力する。

[0112] 次に、ステップ S1505では、ストリーム出力処理を行う。具体的には、ストリーム出力部 1305が、基本レイヤ符号ィ匕部 1303から入力した基本レイヤと、拡張レイヤ符号化部 1304から入力した拡張レイヤを、通信網 1110を介して映像監視装置 1100の受信部 1101に出力する。

[0113] 次に、ステップ S1506では、移動物体検出処理を行う。具体的には、移動物体検出部 1306が、基本レイヤ符号ィ匕部 1303から入力した動き情報と、拡張レイヤ符号化部 1304から入力したエッジ情報とを用、て移動物体の検出を行、移動物体検出結果を生成し、検出結果出力部 1307に出力する。

[0114] なお、移動物体の検出の方法については実施の形態 1と同様であるので、ここでは詳しく述べない。

[0115] 次に、ステップ S1507では、検出結果出力処理を行う。具体的には、検出結果出力部 1307が、移動物体検出部 1306から入力した移動物体検出結果と、自動追尾カメラ 1121の撮像部 1201から入力したパン'ティルト ·ズームや設置位置などの情報を、通信網 1110を介して映像監視装置 1100の受信部 1101に出力する。

[0116] なお、実施の形態 1に述べた映像復号化装置と同様に、本実施の形態においても水平方向成分、垂直方向成分および対角方向成分の情報と、動き予測補償によつて生成する動きベクトルとを含んだ映像ストリームを生成することができれば、他の帯域分割方法を利用することも可能である。

[0117] 次に、本実施の形態に係る映像監視装置 1100の構成について以下に説明する。

[0118] 図 12において、映像監視装置 1100は、受信部 1101、画像認識部 1102、およびカメラ群制御部 1103を有する。

[0119] 画像認識部 1102は本発明の画像認識手段に相当し、映像ストリームと移動物体の検出結果を入力して、詳細な画像認識を行い、画像認識の結果をカメラ群制御部 1103に出力する。

[0120] カメラ群制御部 1103は本発明のカメラ群制御手段に相当し、画像認識の結果を入力し、カメラ 1121〜112Nに対して追尾する目標の情報を生成し出力する。

[0121] 次に、上記のように構成された映像監視装置 1100の動作を説明する。

[0122] 図 17は、映像監視装置 1100の動作を表すフローチャートである。

[0123] まず、ステップ S1601により、受信処理を行う。具体的には、受信部 1101が、通信網 1110を介して自動追尾カメラ 1121からの映像ストリームと移動物体検出結果とを入力し画像認識部 1102に出力する。

[0124] 次に、ステップ S1602では、画像認識処理を行う。具体的には、画像認識部 1102 力受信部 1101から入力した映像ストリームと移動物体検出結果を用いて映像ストリ一ムを復号化し、種々の公知の画像認識方法で人'顔 '物の検出や認証などを行い、その結果を生成しカメラ群制御部 1103に出力する。また、画像認識部 1102は、移動物体検出結果が含む移動物体の領域以外は画像認識を行わなヽようにすることにより、処理を高速ィ匕することが可能である。

[0125] 次に、ステップ S1603では、カメラ制御処理を行う。具体的には、カメラ群制御部 1 103が、画像認識部 1102から入力した画像認識結果を用いて自動追尾カメラ 1121 に対する目標追尾命令を生成し、通信網 1110を介して自動追尾カメラ 1121の撮像制御部 1203に出力する。また、自動追尾カメラ 1121に対する画像認識結果により、他の自動追尾カメラ 1122〜112Nに新たな追尾の必要が生じた場合、新たな目標追尾命令を生成し通信網 1110を介して該当する自動追尾カメラ 1122〜 112Nの撮像部 1203に出力する。

[0126] ここで、目標追尾命令について説明する。

[0127] 画像認識部 1102から入力した画像認識結果が、例えば、映像内に不審人物が存在することを示す場合、カメラ群制御部 1103はその不審人物を大きく撮影させるために座標や拡大率などを含む目標追尾命令を生成する。また、映像内に不審人物が存在するが自動追尾カメラ 1121では不審人物の顔を撮影することが不可能な場合、自動追尾カメラ 1122に対してその不審人物を撮影させる目標追尾命令を生成し、自動追尾カメラ 1121に対して不審人物を含む広い範囲を撮影させる目標追尾命令を生成する。

[0128] 次に、ステップ S 1604では、終了判定を行い、映像監視装置 1100の電源が切られるなど、映像監視を行う必要がなければ終了し、そうでなければステップ S 1601に戻る。

[0129] 以上のように構成された映像監視システムの動作について以下に説明する。

[0130] 図 18は本実施の形態の映像監視システムの動作を示すシーケンス図である。

[0131] まず、自動追尾カメラ 1121は監視対象を撮影すると、水平方向成分、垂直方向成分および対角方向成分の情報と、動き予測補償によって生成する動きべ外ルとを含んだ映像ストリームを生成すると共に、移動物体検出結果を求め、これらを通信網 11 10を介して、映像監視装置 1100へ送信する (ステップ S 1701)。

[0132] 映像監視装置 1100は受信した映像ストリームを復号し、移動物体検出結果の情報を用いて対象物体の認識を行う。そして、自動追尾カメラに対象物体を追尾するための目標追尾命令を送信する (ステップ S 1702)。

[0133] 自動追尾カメラ 1121はこれを受けて、撮像部を制御し対象物を追尾する。そして、このときの映像ストリームなどを映像監視装置 1100へ送信する（ステップ S 1703)。

[0134] 以降、上記のステップ S1702とステップ S1703とが繰り返される。なお、自動追尾カメラ 1121からの映像ストリーム等は映像監視装置 1100からの命令の有無にかかわらず、常時映像監視装置 1100へ送信される。

[0135] 以上のように、本実施の形態に係る映像監視システムは、通信網を介して自動追尾カメラから映像監視装置へ映像を送信するために、映像は符号化してデータ圧縮された映像ストリームとする必要がある。このとき、本発明によれば、映像ストリームを生成する過程で、同時に移動物体検出を行い、その結果情報を映像監視装置へ通知することができるので、映像監視装置はあらためて受信した映像ストリーム力移動物体の検出をする必要が無くなる。これにより、映像監視装置の処理を軽減することができる。

[0136] また、本実施の形態 2によれば、遠隔地にある自動追尾カメラが撮影した画像を受信して、映像監視装置で映像の監視と追尾を行う映像監視システムにおいて、自動追尾カメラが、一部の手段や処理を共有して、撮影した画像の水平方向成分、垂直方向成分および対角方向成分の情報と、動き予測補償によって生成する動きべタトルとを含んだ映像ストリームに映像符号化する処理と、移動物体検出処理とをすることができるので、高精度な移動物体の検出と映像の符号化とを同時に高速に行うことが可能であり、また、システム全体の規模を小さくすることもできる。

[0137] また、実施の形態 2によれば、自動追尾カメラは移動物体の検出結果をもとに求められた映像監視装置からの指示で、パン'ティルト 'ズームの撮像機能の制御を行うことができるので、移動物体、ひいては不審人物などを効率的に監視することが可能である。

[0138] また、実施の形態 2によれば、映像監視装置は上記の映像ストリームとともに入力する移動物体の検出結果をもとに移動物体の領域のみを画像認識するので、画像認識処理の負荷を軽減することができるとともに、画像認識の精度が向上する。また、これにより、より多くの自動追尾カメラを制御して効率的に監視することが可能な映像監視システムとすることができる。

[0139] (実施の形態 3)

実施の形態 3は、本発明に係る移動物体検出方法および装置である。

[0140] 本実施の形態では、実施の形態 1と同様に基本レイヤと拡張レイヤ力もなる映像ストリームのうち拡張レイヤの映像ストリームのみを用いて移動物体を検出する方法を述べる。本実施の形態で取り扱う拡張レイヤの映像ストリームは、 ISO/IEC 14496-2

Amendment 2に規定される MPEG— 4 FGS(Fine Granularity Scalable coding)の F

GST(FGSTemporal Scalability)のように拡張レイヤの映像ストリームのフレームの先頭に動きベクトル情報が含まれるものとする。

[0141] 図 19は、本発明の移動物体検出方法および装置を適用した実施の形態 1に係る移動物体検出装置 1900の構成を示すブロック図である。

[0142] 図 19において、移動物体検出装置 1900は、ストリーム入力部 1901、動き情報抽出部 1902、エッジ情報抽出部 1903、移動物体検出部 1904、検出結果出力部 190

5を有する。

[0143] 本実施の形態では、実施の形態 1と異なり、ストリーム入力部 1901は拡張レイヤの映像ストリームのみ入力する。

[0144] なお、動き情報抽出部 1902が動き情報抽出手段に相当し、エッジ情報抽出部 19

03がエッジ情報抽出手段に相当し、移動物体検出部 1904が移動物体検出手段に相当する。

[0145] ここで、動き情報抽出手段は、入力した拡張レイヤの映像ストリーム力も動き情報を抽出して移動物体検出手段に出力する。エッジ情報抽出手段は、入力した拡張レイャの映像ストリーム力もエッジ情報を抽出して移動物体検出手段に出力する。移動物体検出手段は、入力したエッジ情報と動き情報力移動物体を検出する。

[0146] 次に、以上のように構成された移動物体装置 1900の動作を説明する。

[0147] 図 20は、図 19に示す実施の形態 3の移動物体装置 1900の動作を表すフローチヤートである。なお、図 20に示すフローチャートは、図示しない記憶装置（例えば ROM やフラッシュメモリなど）に格納された制御プログラムを、同じく図示しない CPUが実行することにより、プログラムの実行によりソフトウェア的に実行されるようにすることも可能である。

[0148] まず、ストリーム入力部 1901が、移動物体検出装置 1900の外部から拡張レイヤの映像ストリームを入力し、動き情報抽出部 1902とエッジ情報抽出部 1903に出力する (ステップ S2001)。 [0149] 次に、動き情報抽出部 1902が、ストリーム入力部 1901から入力した拡張レイヤから動き情報を抽出し、移動物体検出部 1904に出力する (ステップ S2002)。

[0150] 次に、エッジ情報抽出部 1903が、ストリーム入力部 1902から入力した拡張レイヤ力もエッジ情報を抽出し、移動物体検出部 1904に出力する (ステップ S2003)。

[0151] ここで、 MPEG— 4 FGSで規定される FGSTでは、 1フレームの拡張レイヤの先頭にフレーム全領域の動きベクトルが格納され、それに続、てビット平面の情報が格納される。よって、ストリーム入力部 1901が動きベクトルの映像ストリームまでを入力し動き情報抽出部 1902が動き情報を生成し、フレーム内に動きがある場合のみビット平面の映像ストリームを入力してエッジ情報抽出部 1903に出力しても良い。これにより、フレーム内に動きがない場合に、ストリームの入力処理とエッジの抽出処理および移動物体の検出処理を省略し処理負荷を軽減することが可能である。

[0152] 次に、移動物体検出部 1904が、動き情報抽出部 1902から入力した動き情報とェッジ情報抽出部 1903から入力したエッジ情報を用いて移動物体の検出を行い、実施の形態 1と同様に、移動物体検出結果を生成し検出結果出力部 1905に出力する (ステップ S2004乃至ステップ S 2006)。

[0153] 次に、移動物体を検出した結果を出力する。具体的には、検出結果出力部 1905 力移動物体検出部 1904から入力された移動物体の領域の座標を外部に出力する (ステップ S2007)。

[0154] 次に、終了判定処理を行う。ストリーム入力部 1901が、続く映像ストリームの有無を判定するなどして、移動物体検出装置 1900がこれ以上移動物体の検出を行うがなければ処理を終了し、そうでなければステップ S 2001に戻る（ステップ S 2008)。

[0155] 以上のように、本実施の形態 3によれば、拡張レイヤの映像ストリームのみを入力し、動き情報抽出部 1902が動き情報を抽出し、エッジ情報抽出部 1903がエッジ情報を抽出することにより、高速かつ少ない映像ストリームで物体の輪郭を検出することができる。

[0156] 本発明の移動物体検出装置は、映像を複数レイヤに分けて符号ィ匕する階層符号化および動き予測補償符号ィ匕を用いて映像符号化された映像ストリームから、動き情報を抽出する動き情報抽出手段と、前記映像ストリームからエッジ情報を抽出するエッジ情報抽出手段と、前記動き情報と前記エッジ情報とを用いて移動物体を検出し、当該検出結果を出力する移動物体検出手段とを有する構成をとる。

[0157] この構成によれば、映像ストリームを復号ィ匕することなぐ物体輪郭を検出可能で、さらに、動きの情報から移動物体の検出が可能で、高速かつ高精度かつ低処理負荷で移動物体を検出することができる。

[0158] また、本発明の移動物体検出装置は、さらにエッジ情報抽出手段は、画像をビット平面符号化したビット平面情報のうち、最上位ビット平面カゝら N (Nは自然数)ビット位ビット平面までのビット平面情報を、前記映像ストリーム力もエッジ情報として抽出するものである。

[0159] この構成によれば、特定のビット平面まで情報を抽出することで特定の強度以上のエッジを検出することが可能で、高速に物体の輪郭を検出することができる。また、特定ビット位以上のビット平面だけで物体の輪郭の検出が可能で、特定ビット位未満のビット平面は必要なぐ映像ストリームを通信速度の遅、通信網を介して受信して、る場合も、低ビットレートで高精度な検出ができる。

[0160] また、本発明の移動物体検出装置は、さらに映像ストリームが複数の領域に分割されたものであって、移動物体検出手段は、前記領域内部のビット平面情報の符号長の合計が予め定めた第 1の値以上である場合に、前記領域を移動物体の輪郭領域と判定するものである。

[0161] この構成によれば、画像のある領域のある閾値のビット位までのビット平面の符号量を確認するだけで領域内に存在するエッジの多さを判定することが可能であり、高速に物体の輪郭を検出することができる。

[0162] また、本発明の移動物体検出装置おいて、さらに移動物体検出手段は、前記領域内部の前記ビット平面情報の符号長の合計が、予め定めた第 2の値以下である場合に、前記領域を移動物体の輪郭領域と判定するものである。

[0163] この構成によれば、物体の輪郭は線であるので、ある領域があまりに多くの水平方向成分、垂直方向成分および対角方向成分を含む場合、例えば、それは縞模様を含む領域であり、移動物体の輪郭ではないと判定し誤検出を防ぐことが可能である。

[0164] また、本発明の移動物体検出装置おいて、さらに動き情報抽出手段は、前記移動物体の輪郭領域と判断された領域カゝら動きベクトルを抽出し、移動物体検出手段は

、前記動きベクトルの大きさが予め定めた第 3の値以上である場合に、前記領域を移動物体の輪郭領域であると判定するものである。

[0165] この構成によれば、動、て、な、物体を移動物体でな、と判定し、移動物体の検出の精度を向上することができる。

[0166] また、本発明の移動物体検出装置において、さらに動き情報抽出手段は、移動物体の輪郭領域と判断された領域力第 1の動きベクトルを抽出するとともに、当該領域の近傍に位置する領域を選択し、選択した領域力第 2の動きベクトルを抽出し、前記移動物体検出手段は、前記第 1の動きベクトルと、前記第 2の動きベクトルとの差分ベクトルの大きさを測定値として算出し、前記測定値が予め定めた第 4の値以下である場合、前記選択された領域を移動物体の内部領域であると判定するものである。

[0167] この構成によれば、映像の中で移動物体の輪郭の領域は周囲の領域とは異なる速度を持つので、移動物体の輪郭以外の領域を移動物体の領域ではな!/、と判定し、移動物体の検出の精度を向上することができる。

[0168] また、本発明の移動物体検出装置において、さらに動き情報抽出手段は、複数の領域を選択し、それぞれの選択領域から動きベクトルを抽出し、移動物体検出手段は、前記選択領域毎に、前記第 1の動きベクトルと前記選択された領域の動きべタトルとの差分ベクトルの大きさを求め、全ての選択領域についての差分ベクトルの大きさの合計を前記測定値として算出するものである。

[0169] この構成によれば、映像の中で移動物体の輪郭の領域は周囲の領域とは異なる速度を持つので、移動物体の輪郭以外の複数の領域を移動物体の領域ではな!/、と判定し、移動物体の検出の精度を向上することができる。

[0170] また、本発明の移動物体検出装置において、さらに前記移動物体検出手段は、前記移動物体の内部領域であると判定された領域の動きベクトルと、前記領域の近傍に位置する領域の動きベクトルとの差分ベクトルの大きさが予め定めた第 5の値以下である場合、前記移動物体の領域の内部領域であると判定するものである。

[0171] この構成によれば、ある速度で移動する移動物体の、移動物体と判定していない領域を検出することが可能で、移動物体の検出の精度を向上することができる。

[0172] また、本発明の移動物体検出装置において、さらに移動物体検出手段は、前記移動物体の輪郭領域又前記移動物体の内部領域と判定された領域により囲まれた領域を、移動物体の内部領域であると判定するものである。

[0173] この構成によれば、移動物体の輪郭と判定した内部を移動物体の領域として検出することが可能で、移動物体の検出の精度を向上することができる。

[0174] また、本発明の移動物体検出装置において、さらに移動物体検出手段は、第 1の移動物体と判定された輪郭領域又は内部領域の近傍に、第 2の移動物体の輪郭領域又は内部領域であると判定された領域の数が、予め定めた第 6の値以上の場合、前記第 1の移動物体と判定された輪郭領域又は内部領域を第 1の移動物体であると再判定するものである。

[0175] この構成によれば、あまりに小さい領域を移動物体でないと判定することが可能で、移動物体検出の誤検出を低下することができる。

[0176] 本発明の移動物体検出方法は、映像ストリーム力移動物体を検出する方法であつて、前記移動物体を検出する移動物体検出装置が実行するところの、映像を複数レイヤに分けて符号ィ匕する階層符号化、および、動き予測補償符号化を用いて映像符号ィ匕された映像ストリーム力動き情報を抽出するステップと、前記映像ストリーム力エッジ情報を抽出するステップと、抽出した前記動き情報と前記エッジ情報とを用いて移動物体を検出するステップとを有するものである。

[0177] この方法によれば、映像ストリームを復号ィ匕することなぐ物体の輪郭を検出可能で、さらに、動きの情報から移動物体の検出が可能で、高速かつ高精度かつ低処理負荷で移動物体を検出することができる。

[0178] 本発明の移動物体検出プログラムは、映像ストリーム力移動物体を検出するためにコンピュータを、映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕を用いて映像符号化された映像ストリームカゝら動き情報を抽出するステツプと、前記映像ストリーム力エッジ情報を抽出するステップと、抽出した前記動き情報と前記エッジ情報とを用いて移動物体を検出するステップとを実行させるものである。 [0179] このプログラムによれば、映像ストリームを復号ィ匕することなぐ物体の輪郭を検出可能で、さらに、動きの情報から移動物体の検出が可能で、高速かつ高精度かつ低処理負荷で移動物体を検出することができる。

[0180] 本発明の映像復号ィ匕装置は、映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕により符号化した映像ストリームを復号ィ匕する映像復号化手段と、前記映像復号ィ匕手段が前記映像ストリームを復号ィ匕する際に抽出した動き情報およびエッジ情報から移動物体を検出する移動物体検出手段とを有するものである。

[0181] この構成によれば、映像復号装置と移動物体検出装置が、一部の処理や手段を共有することができ、映像の復号化と移動物体の検出とを同時に高速に行うことが可能で、かつ、装置全体の規模を小さくすることが可能である。

[0182] また、本発明の映像復号ィ匕装置において、映像ストリームは複数の領域に分割されたものであって、移動物体検出手段は、前記領域内部のビット平面情報の符号長の合計が予め定めた第 1の値以上である場合に、前記領域を移動物体の輪郭領域と判定するものである。

[0183] この構成によれば、例えば水平方向成分、垂直方向成分および対角方向成分のある領域のある閾値のビット位までのビット平面の符号量を確認するだけで領域内に存在するエッジの多さを判定することが可能であり、高速に物体の輪郭を検出することができる。

[0184] また、本発明の映像復号ィ匕装置おいて、さらに移動物体検出手段は、前記領域内部の前記ビット平面情報の符号長の合計が予め定めた第 2の値以下である場合に、前記領域を移動物体の輪郭領域と判定するものである。

[0185] この構成によれば、物体の輪郭は線であるので、ある領域があまりに多くの水平方向成分、垂直方向成分および対角方向成分を含む場合、例えば、それは縞模様を含む領域であり、移動物体の輪郭ではないと判定し誤検出を防ぐことが可能である。

[0186] 本発明の映像復号ィ匕装置において、さらに映像復号ィ匕手段は、移動物体検出手段の検出した移動物体の領域を強調した映像を生成するものである。

[0187] この方法によれば、監視者は容易に移動物体を検知することが可能である。 [0188] 本発明の映像復号ィ匕装置において、さらに前記映像復号化手段は、エッジ成分からなる映像を生成し、前記移動物体検出手段の検出した移動物体の領域のみを強調して表示すものである。

[0189] これにより、通信速度の制限などにより基本レイヤのビットレートが非常に低ぐ画質の極端に悪、映像しか生成できなヽときでも、輪郭のみの方が細部を認識できる場合がある。

[0190] また、輪郭力もなる映像の中において移動物体のみが非常に目立ち、複数の監視映像を同時に見る監視者にとって異常や不審人物の発生を検知しやすい。あるいは、複数のカメラ映像を表示する場合など、処理能力が限られた環境においても、低処理負荷で、監視上重要な領域を見やすく表示することが可能となる。

[0191] 本発明の映像符号ィ匕装置は、映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕を用いて符号ィ匕した映像ストリームを生成する映像符号化手段と、映像符号化手段が前記映像を符号化する際に動き情報と、映像のエッジ情報とを抽出して移動物体を検出する移動物体検出手段を有するものである。この構成によれば、映像符号化手段と移動物体検出手段とが、一部の処理や手段を共有することができ、映像の符号化と移動物体の検出とを同時に高速に行うことが可能で、かつ、装置全体の規模を小さくすることが可能である。

[0192] 本発明の撮像装置は、映像を入力する撮像手段と、この撮像手段の入力した映像を符号化する本発明に係る映像符号化装置と、移動物体検出手段が出力する移動物体の検出結果に基づき、撮像手段に対して撮像機能を制御する撮像制御手段と、映像ストリームと移動物体の検出結果とを出力する出力部とを有するものである。

[0193] この構成によって、遠隔地への映像送信のために生成する映像ストリームの生成過程で、移動物体の検出を行うことができるので、映像監視などにおいて、不審人物などを高速に移動物体として検出し撮影しつづけることが可能であるとともに、その映像を送信することができ、映像監視を効率的に行うことができる。

[0194] また、本発明の撮像装置において、撮像制御手段が、前記移動物体検出手段が出力する移動物体の領域の面積を入力映像の全面積に対して一定の割合となるように、撮像手段を制御するものである。 [0195] この構成によって、移動物体とその周囲の状況を映像に収めることが可能で、注目する移動物体の監視を効率的に行うことができる。

[0196] 本発明の映像監視システムは、本発明に係る撮像装置と、この撮像装置から受信した映像ストリームを復号ィ匕するとともに、移動物体の検出結果を用いて、検出した移動物体の領域の画像認識を行う映像監視装置とを有するものである。

[0197] この構成によって、遠隔地への映像送信のために生成する映像ストリームの生成過程で、移動物体の検出を行うことができ、また、移動物体以外の領域の画像認識処理を省略し高速かつ低処理負荷で画像認識することができるので、映像監視などにおいて、不審人物などを高速に移動物体として検出し撮影しつづけることが可能である。

[0198] なお、本発明において画像認識とは、移動物体の検出に限らず、人'顔 '物の認識や人の認証を含む、機械による画像を用いた自動判別手段をさす。

[0199] また、本発明の映像復号ィ匕装置において、さらに映像ストリームは、基本レイヤと拡張レイヤに階層化して符号化され、前記動き情報抽出手段は、前記基本レイヤの映像ストリーム力前記動き情報を抽出し、前記エッジ情報抽出手段は、前記拡張レイャの映像ストリーム力前記エッジ情報を抽出するものである。

[0200] この構成によれば、前記動き情報が動きのないことを示している場合に前記エッジ情報の抽出などの処理を中止して処理負荷を軽減することが可能であり、また、前記エッジ情報がエッジのな、ことを示して、る場合に前記動き情報の抽出などの処理を中止して処理負荷を軽減することが可能であり、高速に物体の輪郭を検出することができる。

[0201] また、本発明の映像復号ィ匕装置において、さらに映像ストリームは、基本レイヤと拡張レイヤに階層化して符号化され、前記動き情報抽出手段は、前記拡張レイヤの映像ストリーム力前記動き情報を抽出し、前記エッジ情報抽出手段は、拡張レイヤの映像ストリーム力前記エッジ情報を抽出するものである。

[0202] この構成によれば、移動物体の検出処理を、拡張レイヤの映像ストリームのみで行うことが可能で、高速かつ少ない映像ストリームで物体の輪郭を検出することができる [0203] 本明細書は、 2004年 5月 31日出願の特願 2004— 161053および 2005年 2月 14 日出願の特願 2005— 035627に基づく。これらの内容はすべてここに含めておく。産業上の利用可能性

[0204] 本発明は、映像を符号ィ匕して生成した映像ストリームカゝら移動物体を検出する移動物体検出装置に有用であり、映像ストリームを復号ィ匕することなく高速に移動物体を検出するのに適している。

Claims

請求の範囲

[1] 映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕を用いて映像符号化された映像ストリームから、動き情報を抽出する動き情報抽出手段と、

前記映像ストリーム力エッジ情報を抽出するエッジ情報抽出手段と、前記動き情報と前記エッジ情報とを用いて移動物体を検出し、当該検出結果を出力する移動物体検出手段と、

を有する移動物体検出装置。

[2] 前記エッジ情報抽出手段は、

画像をビット平面符号ィ匕したビット平面情報のうち、最上位ビット平面力も N (Nは自然数)ビット位ビット平面までのビット平面情報を、前記映像ストリームからエッジ情報として抽出する、

請求項 1記載の移動物体検出装置。

[3] 前記映像ストリームは、複数の領域に分割されたものであって、

前記移動物体検出手段は、

前記領域内部のビット平面情報の符号長の合計が予め定めた第 1の値以上である場合に、前記領域を移動物体の輪郭領域と判定する、

請求項 2記載の移動物体検出装置。

[4] 前記移動物体検出手段は、

前記領域内部の前記ビット平面情報の符号長の合計が、予め定めた第 2の値以下である場合に、前記領域を移動物体の輪郭領域と判定する、

請求項 3記載の移動物体検出装置。

[5] 前記動き情報抽出手段は、

前記移動物体の輪郭領域と判断された領域力動きベクトルを抽出し、前記移動物体検出手段は、

前記動きベクトルの大きさが予め定めた第 3の値以上である場合に、前記領域を移動物体の輪郭領域であると判定する、

請求項 3記載の移動物体検出装置。

[6] 前記動き情報抽出手段は、

前記移動物体の輪郭領域と判断された領域力第 1の動きベクトルを抽出するとともに、当該領域の近傍に位置する領域を選択し、選択した領域力第 2の動きべタトルを抽出し、

前記移動物体検出手段は、

前記第 1の動きベクトルと、前記第 2の動きベクトルとの差分ベクトルの大きさを測定値として算出し、前記測定値が予め定めた第 4の値以下である場合、前記選択された領域を移動物体の内部領域であると判定する、

請求項 3記載の移動物体検出装置。

[7] 前記動き情報抽出手段は、

複数の領域を選択し、それぞれの選択領域から動きベクトルを抽出し、前記移動物体検出手段は、

前記選択領域毎に、前記第 1の動きベクトルと前記選択された領域の動きベクトルとの差分ベクトルの大きさを求め、全ての選択領域についての差分ベクトルの大きさの合計を前記測定値として算出する、

請求項 6記載の移動物体検出装置。

[8] 前記移動物体検出手段は、

前記移動物体の内部領域であると判定された領域の動きベクトルと、前記領域の近傍に位置する領域の動きベクトルとの差分ベクトルの大きさが予め定めた第 5の値以下である場合、前記移動物体の領域の内部領域であると判定する、

請求項 6記載の移動物体検出装置。

[9] 前記移動物体検出手段は、

前記移動物体の輪郭領域又前記移動物体の内部領域と判定された領域により囲まれた領域を、前記移動物体の内部領域であると判定する、

請求項 3記載の移動物体検出装置。

[10] 前記移動物体検出手段は、

第 1の移動物体と判定された輪郭領域又は内部領域の近傍に、第 2の移動物体の輪郭領域又は内部領域であると判定された領域の数が、予め定めた第 6の値以上の場合、前記第 1の移動物体と判定された輪郭領域又は内部領域を第 1の移動物体であると再判定する、

請求項 3記載の移動物体検出装置。

[11] 映像ストリーム力移動物体を検出する方法であって、前記移動物体を検出する移動物体検出装置が実行するところの、

映像を複数レイヤに分けて符号ィ匕する階層符号化、および、動き予測補償符号ィ匕を用いて映像符号ィ匕された映像ストリーム力も動き情報を抽出するステップと、前記映像ストリーム力エッジ情報を抽出するステップと、

抽出した前記動き情報と前記エッジ情報とを用いて移動物体を検出するステップとを有する移動物体検出方法。

[12] 映像ストリームから移動物体を検出するためにコンピュータを、

映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕を用いて映像符号ィ匕された映像ストリームカゝら動き情報を抽出するステップと、前記映像ストリーム力エッジ情報を抽出するステップと、

抽出した前記動き情報と前記エッジ情報とを用いて移動物体を検出するステップとを実行させるための移動物体検出プログラム。

[13] 映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号化により符号ィ匕した映像ストリームを復号ィ匕する映像復号ィ匕手段と、

前記映像復号化手段が前記映像ストリームを復号化する際に抽出した動き情報およびエッジ情報力移動物体を検出する移動物体検出手段と、

を有する映像復号化装置。

[14] 前記映像ストリームは、複数の領域に分割されたものであって、

前記移動物体検出手段は、

請求項 13記載の映像復号化装置。

[15] 前記移動物体検出手段は、

前記領域内部の前記ビット平面情報の符号長の合計が予め定めた第 2の値以下である場合に、前記領域を移動物体の輪郭領域と判定する、

請求項 14記載の映像復号化装置。

[16] 前記映像復号化手段は、

前記移動物体検出手段の検出した移動物体の領域を強調した映像を生成する、請求項 15記載の映像復号化装置。

[17] 前記映像復号化手段は、

エッジ成分力なる映像を生成し、

前記移動物体検出手段の検出した移動物体の領域を強調して表示する、請求項 13記載の映像復号化装置。

[18] 映像を複数レイヤに分けて符号ィ匕する階層符号ィ匕および動き予測補償符号ィ匕を用いて符号ィ匕した映像ストリームを生成する映像符号ィ匕手段と、

前記映像符号化手段が前記映像を符号化する際に動き情報と、映像のエッジ情報とを抽出して移動物体を検出する移動物体検出手段と、

を含む映像符号化装置。

[19] 映像を入力する撮像手段と、

請求項 18記載の映像符号化装置と、

前記移動物体検出手段が出力する移動物体の検出結果に基づき、前記撮像手段に対して撮像機能を制御する撮像制御手段と、

前記映像ストリームと、前記移動物体の検出結果とを出力する出力部と、を有する撮像装置。

[20] 前記撮像制御手段が、前記移動物体検出手段が出力する移動物体の領域の面積を入力映像の全面積に対して一定の割合となるように、撮像手段を制御する、請求項 19記載の撮像装置。

[21] 請求項 19記載の撮像装置と、

前記撮像装置から受信した前記映像ストリームを復号化するとともに、前記移動物体の検出結果を用いて、検出した移動物体の領域の画像認識を行う映像監視装置と、

を有する映像監視システム。

[22] 前記映像ストリームは、基本レイヤと拡張レイヤに階層化して符号化され、前記動き情報抽出手段は、

前記基本レイヤの映像ストリームから前記動き情報を抽出し、前記エッジ情報抽出手段は、

前記拡張レイヤの映像ストリームから前記エッジ情報を抽出する、請求項 1記載の映像復号化装置。

[23] 前記映像ストリームは、基本レイヤと拡張レイヤに階層化して符号化され、前記動き情報抽出手段は、

前記拡張レイヤの映像ストリームから前記動き情報を抽出し、前記エッジ情報抽出手段は、

拡張レイヤの映像ストリームから前記エッジ情報を抽出する、

請求項 1記載の映像復号化装置。