WO2006008944A1

WO2006008944A1 - 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体

Info

Publication number: WO2006008944A1
Application number: PCT/JP2005/012282
Authority: WO
Inventors: Norimichi Ukita
Original assignee: National University Corporation Nara Institute Ofscience And Technology
Priority date: 2004-07-22
Filing date: 2005-06-28
Publication date: 2006-01-26
Also published as: EP1780673A1; JP2006039689A; EP1780673A4; US20080247640A1

Abstract

背景差分と色検出の統合により、画像中における複数の領域を正確に識別することができる画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供する。　まず、カメラ３により背景領域１のみが撮像された背景画像データが得られる。そして、構造化データ記憶部１３に、背景画像データの画素の座標と画素の色階調値とが識別空間内に構造化されて記憶され、背景色領域が形成される。続いて、カメラ３により背景領域１および対象領域２が撮像された入力画像データが得られる。そして、クラス識別部１４において、各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別部１４において、各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。

Description

明細書画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体技術分野

本発明は、画像中に含まれる複数の領域を識別する画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体に関するものである。背景技術

観測画像中から移動物体などの対象（ターゲット）を検出する問題は、コンピュー夕ビジョンの中でも重要な課題の一つとして挙げられる。その解決のために開発された方法の中でも、画像中の特定の色を検出する色検出と、あらかじめ用意した背景画像から変化した領域を検出する背景差分は、ターゲット検出の基本的な技術として用いられている。

色検出は、ターゲット色ごとに適切な閾値を設定できるので、微妙な色の違いを識別することが可能である。

また、背景差分は、ターゲットに関する事前知識を必要とせず、任意の夕一ゲットを検出可能であり、かつ画素ごとに背景色の変化をモデル化可能な方法である。このような利点を有するため、背景差分は、静止領域の検出が不可能なフレーム間差分や、事前に定義されたターゲットしか検出できない顔検出 · 肌色検出と比較して、多くの視覚システムで利用されている。特に、十分な背景情報を事前に学習可能な環境下であれば、優れた結果を期待することができる。

さらに最近は、背景変動に対して口パスト（頑健）であり、かつ背景と任意の夕一ゲットの微妙な色の差を検出可能とするために、これら背景差分と最近傍識別による色検出を有機的に統合することも行われている（例えば、非特許文献 1参照)。

この非特許文献 1に開示された方法においては、図 12に示したように、画素の色（色階調値）が 6次元の YUV色空間（識別空間）で表現される。具体的には、背景領域を撮像した背景画像データの座標（x_p， y_p) における画素の 3次元色が（Yb_p, Ub_p， Vb_p) であるとき、その背景色は、識別空間において（Yb_p, Ub_p, Vb_p, Yb_p， Ub_p， Vb_p) ^Tという 6次元べクトルで表現される（Tは、ベクトルの転置を表す。）。同様に、背景画像データの座標（x_Q, y_q) における画素の 3次元色が（Yb_q， Ub_q， Vb_q) であるとき、その背景色は、識別空間において（Yb_q， Ub_q, Vb_q, Yb_q, Ub_q ， Vb_g) ^Tという 6次元ベクトルで表現される。このように識別空間における 6次元ベクトルで表された背景画像データ（背景色ベクトル）は、背景色領域を形成する。

また、背景領域および対象領域を撮像した入力画像データの座標（x_s, y_s ) における画素の 3次元色が（Y i _s， U i _s, V i _s) であるとき、その入力された色は、識別空間において（Yb_s， Ub_s, Vb_s, Y i _s， U i _s, V i _s) ^Tという 6次元べクトルで表現される。このようにして得られた 6次元べクトルに対して、 6次元空間における最近傍識別を用いることで、入力された色が背景色領域または対象色（夕ーゲット色）領域に識別される。対象色領域に識別された 6次元ベクトル（Yb_s， Ub_s, Vb_s, Y i _s, U i _s, V i _s) ^Tは対象色べクトルと呼ばれ、背景色領域と対象色領域との境界は決定境界と呼ばれる。

この方法では、通常（3次元）に比べて次元数が大きいため、処理時間はかかるが、最近傍識別のためのキヤッシュの効率的利用により実時間動作が可能となっている。

しかしながら、背景差分は、照明変化（照明強度や照明色の変化）や影による背景物体の見えの変化、または、背景内に、例えば葉や旗の揺らぎなどの非静止領域がある場合には、背景とターゲットを正確に識別することができない。さらに、背景差分には、背景に似た色を有するターゲットの検出が困難であるという課題がある。

また、色検出は、背景画像の全画素に含まれる色集合と各ターゲット色の間の識別を行う方法であるため、膨大な種類の色集合を扱う識別問題となる。そのため、必然的に異なるクラス間の距離は小さくなり、識別性能が低下する（位置情報の欠落)。さらに、ターゲット色は人手により与えられているので、自律動作するターゲット検出システムにはそのまま適用することができない（非自律性）という課題を有する。

背景差分と色検出を統合した非特許文献 1に開示された方法においては、参照する背景画像が 1枚だけなので、照明変化に対応できないという課題がある。例え、様々な照明条件下における背景画像集合を記録していたとしても、現状の方法では、逐次参照する背景画像を選択する基準がない。また、背景情報は独立な YUV値として表現されているため、位置情報が欠落している。すなわち、近接画素間の共起性などは全く考慮されていない。さらに、適切な夕ーゲット色を指定するために人手を要しているという課題もある。

【非特許文献 1】加藤丈和、柴田智行、和田俊和：「最近傍識別器を用いた背景差分と色検出の統合」、情処研報 CVIM- 142-5， Vol.145, no.5, pp.31-36, Jan. 2004. 発明の開示

本発明は、上記課題に鑑みてなされたものであり、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供することを目的とする。

この目的のために本発明の一態様に係る画像処理装置は、所定の領域を撮像し、画像データに変換する撮像手段と、前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、前記撮像手段により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、を備えることが好ましい。

この態様によれば、まず、撮像手段により背景領域のみが撮像された背景画像データが得られる。そして、背景色記憶手段により、背景画像データの画素の座標と前記画素の色階調値とが識別空間内に構造化されて記憶される。この識別空間内における背景画像データの集合は、背景色領域と呼ばれる。続いて、撮像手段により背景領域および対象領域が撮像された入力画像デ一夕が得られる。そして、入力画像データの各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別手段により、入力画像データの各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。このクラス識別手段により各画素の色階調値が背景外色領域に属すると判断された場合には、対象色記憶手段により、各画素の色階調値と各画素の座標とが識別空間内に構造化して記憶される。つまり、複数枚の背景画像データを利用することができ、かつ画像データにおける画素の座標と画素の色階調値とが識別空間内に構造化して記憶されている。そのため、色情報だけでなく、位置情報も取り込まれている。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化に対しても対応でき、かつ背景色とターゲット色との小さな差分の検出も可能である。

また、この目的のために本発明の一態様に係る画像処理方法は、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像デ一夕における、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステツプの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、を含むことが好ましいこの態様によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色と夕ーゲット色の小さな差分の検出も可能である画像処理方法を提供することができる。また、この目的のために本発明の一態様に係る記録媒体は、所定の領域を撮像し、画像デ一夕に変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像デ一夕の前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステツプと、をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体であることが好ましい。

この態様によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色と夕ーゲット色の小さな差分の検出も可能である画像処理方法に関する、コンピュータが読み取り可能なプログラムが記録されていることを特徴とする記録媒体を提供することができる。

また、この目的のために本発明の一態様に係るプログラムは、所定の領域を撮像し、画像デ一夕に変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像デ一夕の前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステツプと、をコンピュータに実行させるためのプログラムであることが好ましい。

この態様によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色と夕ーゲット色の小さな差分の検出も可能である画像処理方法に関するプログラムを提供するこができる。

本発明の目的、特徴、局面、及び利点は、以下の詳細な説明と添付図面とによって、より明白となる。図面の簡単な説明

図 1は、本発明に係る画像処理装置の一実施形態における機能ブロック図である。

図 2は、本発明に係る画像処理装置の一実施形態における処理の流れを示すフローチャートである。（a ) は背景色領域形成、（b ) は対象領域検出の処理に関するものである。

図 3は、本発明の一実施形態における X y - YUV 5次元空間を表す模式図である。

図 4は、画素（x _p, y _p) における 3次元 YUV空間を示す模式図である。（ a ) はターゲット色学習時間が不十分、（b ) はターゲット色学習時間が十分行われた場合の結果である。

図 5は、 x y軸の画素、および YUV軸の階調をリサンプリングする一実施形態を示した模式図である。（a ) は画像データの画素、（b ) は空間リサンプリング後、（c ) は階調リサンプリング後、 ( d ) は空間重み付け後を表す。図 6は、実験を行った背景領域である。（a ) は照明オン時、（b ) は照明ォフ時である。

図 7は、背景差分による、照明オン時の入力画像を用いたターゲット検出結果である。（a ) は入力画像、（b ) は差分閾値小、（c ) は差分閾値犬の場合の結果である。

図 8は、背景差分による、照明オフ時の入力画像を用いたターゲット検出結果である。（a ) は入力画像、（b ) は差分閾値小、（c ) は差分閾値大、（d ) は差分閾値小、（e ) は差分閾値犬の場合の結果である。図 9は、ガウス混合モデルを用いた背景差分によるターゲット検出結果である。（a ) は照明オン時、（b ) は照明オフ直後、 ( c ) は照明オフ時の場合の結果である。

図 1 0は、本発明に係る画像処理方法による、照明オン時のターゲット検出結果である。（a ) はターゲット色未学習、（b ) はターゲット色学習量小、（c ) はターゲット色学習量大の場合の結果である。

図 1 1は、本発明に係る画像処理方法による、照明オフ時のターゲット検出結果である。（a ) はターゲット色未学習、（b ) はターゲット色学習量小、（c ) はターゲット色学習量大の場合の結果である。

図 1 2は、従来の画像処理方法における Y UV— Y UV 6次元空間を表す模式図である。発明を実施するための最良の形態 ' 以下、本発明の一実施形態について、図面を参照しながら説明する。

[本実施形態の概略]

本発明は背景差分を基本とした方法であり、夕一ゲット検出時に起こりうる背景変動はすべて事前に撮影された背景画像中の色分布そのものによつて表現される。したがって、ターゲット検出性能を上げるためには、起こりうる背景変動を可能な限りもれなく観測 ·収集しておく必要がある。し力、し、すべての移動対象物の写り込みや雲の移動による細かな影の変化なども含めた背景の見えのパターンは膨大であり、それらすベてを事前に観測することは不可能である。

したがって、背景情報のみに基づくターゲット検出時は、背景情報が不完全であることを考慮して、確実に背景外領域と見なせる領域を検出する。また、背景色とターゲット色を考慮したターゲット検出時は、ターゲット色学習後に、背景色とターゲット色が似通っていても、最近傍識別によって双方の等方的な誤差 ·変動に対して口バストな識別を行うことを可能とする。

[背景色領域形成]

図 1は、本発明に係る画像処理装置の一実施形態における機能プロック図である。所定の位置に固定されたカメラ 3は、矩形の点線で示された背景領域 1 、または背景領域 1および対象領域 2からなる領域を撮像する。このカメラ 3 は、制御部 4に接続され、制御部 4によって制御されるとともに、撮像した画像データなどを制御部 4に出力する。また、制御部 4にはドライブ 5が接続されており、制御部 4から出力された画像データなどを記録媒体に記録する。背景領域 1および対象領域 2は、本発明を高度道路交通システム（I T S ： Intelligent Transport System) に適用する場合には、例えば、高速道路を含めた所定の領域が背景領域 1であり、その道路を走行している車が対象領域 2に対応する。また、本発明を監視システムに適用する場合には、例えば、住居の入り口やエレベータホールなどが背景領域 1であり、その背景領域 1内を通過する人物が対象領域 2に対応する。

カメラ 3は、静止画撮影の場合には、例えばデジタルスチルカメラであり、動画撮影の場合には、例えばデジタルビデオカメラである。また、カメラ 3は、 C C D (Charge Coupled Devices) を撮像素子として備えるものである。力メラ 3は、制御部 4の指示に従って画像を撮像し、画素値 I ( x， y ) からなる画像データを制御部 4に出力する。本実施形態においては、この画素値 I ( X， y ) は、カラーデータであり、画像デ一夕の色階調値は YUV方式で表されているとする。 YUV方式は、輝度信号である Yと、色信号である Uおよび Vとで画像データの色を表現するものである。このように YUV方式では輝度と色の信号を分けているため、輝度信号（Y) により多くのデータ量を割り当てることで、少ない画質の劣化で高いデ一夕圧縮率を得ることができる。また、この YUV値（色階調値）は、光の三原色である R (赤）、 G (緑）および B (青）で画像データの色を表現する R G B方式における R G B値や、それ以外の色表現形式に容易に変換することができる。

また、本実施形態においては、 C C Dは単板式であり、各画素に YUV値が与えられているとして説明するが、カメラ 3の C C Dは、 3板式であっても、単板式であっても構わない。 3板式は、撮像された画像データの色を、例えば R、 G、 Bの三原色に分けて、それぞれに C C Dを割り当てる方式である。それに対して、単板式は、 R G Bなどの色をまとめて、それに 1つの C C Dを割り当てる方式である。

制御部 4は、カメラ 3で撮像された画像データを取り込み、その画像データに基づいて所定の処理を施す機能部である。また、制御部 4は、ドライブ 5に対して画像データなどのデ一夕を出力する。さらに、制御部 4は、ドライブ 5 を介して、種々の画像データやプログラムなどが記録された記録媒体から必要な情報をインストールし、その機能を実行することができる。

この制御部 4は、主制御部 1 0、背景画像データ記憶部 1 1、入力画像デー夕記憶部 1 2、構造化デ一夕記憶部 1 3、クラス識別部 1 4、閾値比較部 1 5 および周辺機器制御部 1 6を備える。

主制御部 1 0は、背景画像データ記憶部 1 1、入力画像データ記憶部 1 2、構造化データ記憶部 1 3、クラス識別部 1 4、閾値比較部 1 5および周辺機器制御部 1 6に接続され、これらの処理を制御するものである。

背景画像データ記憶部 1 1は、カメラ 3で撮像された背景領域 1のみの画像データ（背景画像データ）を記憶する機能部である。この背景画像データ記憶部 1 1においては、画素の座標（x， y ) に対応して、 YUV値が記憶されている。入力画像データ記憶部 1 2は、カメラ 3で撮像された背景領域 1および対象領域 2からなる画像デ一タを記憶する機能部である。この入力画像データ記憶部 1 2においても、背景画像データ記憶部 1 1と同様、画素の座標（x， y ) に対応して、 YUV値が記憶されている。

構造化データ記憶部 1 3は、画素の座標（X , y ) に対応して、背景画像デ —夕の YUV値を記.憶する。ただし、背景画像デ一夕記憶部 1 1とは異なり、画素の座標一つに対応して背景画像デ一夕枚数分の YUV値を構造化して記憶する。さらに、構造化データ記憶部 1 3は、入力画像データの各画素において、対象色領域に含まれると判断された画素の座標（x， y ) と YUV値とを構造化して記憶する。この画素の座標に対応して Y U V値が構造化されている色空間を、以後、識別空間と呼ぶ。また、構造化データ記憶部 1 3は、背景色記憶手段および対象色記憶手段として機能する。

クラス識別部 1 4は、入力画像データ記憶部 1 2に記憶された入力画像デ一夕の各画素の Y U V値が、識別空間において背景色領域と対象色領域のいずれに属するかを判別する機能部である。そして、 YUV値が対象色領域に属すると判別された場合に、クラス識別部 1 4は、その Y UV値を構造化データ記憶部 1 3に記憶させる。また、同時に、クラス識別部 1 4は、識別空間において各画素の YUV値と背景色領域の最近傍点までの距離とを求める。また、クラス識別部 1 4は、クラス識別手段として機能する。

閾値比較部 1 5は、クラス識別部 1 4で求められた、各画素の Y UV値と背景色領域の最近傍点までの距離と閾値 T h _bとを比較する機能部である。

周辺機器制御部 1 6は、例えば静止画撮影の場合に、カメラ 3に撮像信号を送出し、画像を撮像させるなど、カメラ 3を制御する機能を有する。また、周辺機器制御部 1 6は、画像データやプログラムをドライブ 5に出力し記録媒体に記録させ、逆に記録媒体に記録された画像データやプログラムをドライブ 5 を介して入力するなど、ドライブ 5を制御する機能を有する。

ドライブ 5は、制御部 4から.出力された画像データなどのデータを受け取り、そのデ一夕を種々の記録媒体に出力する。また、ドライブ 5は、記録媒体に記録された種々の画像デ一夕やプログラムなどを制御部 4に出力する。この記録媒体は、磁気ディスク（フロッピーディスクを含む） 2 1、光ディスク（C D： Compact Disk. D VD： Digital Versatile Diskを含む） 2 2、光磁気ディスク（MD： Mini-Diskを含む） 2 3または半導体メモリ 2 4などにより構成される。

図 2は、本発明に係る画像処理装置の一実施形態における処理の流れを示すフロ一チャートである。以下、この図 1および図 2を参照しながら、本発明に係る画像処理装置の一実施形態における機能および処理の流れを説明する。まず、背景画像データに基づいて、背景色領域形成を行う処理（図 2の S 1 0および S 11) について説明する。

最初に、照明条件などを変化させながら、背景領域 1のみがカメラ 3で複数枚撮像される（S 10)。得られた背景画像データは、制御部 4内の背景画像デ —夕記憶部 11に出力され、そこに記憶される。このとき、背景画像データ記憶部 11においては、背景画像データの各画素の座標（x， y) に対応して、 YUV値が記憶されている。また、背景画像データは複数枚撮像されているので、同じ画素の座標に複数個の YUV値が存在している。これを表現するために、本実施形態においては、 xy_YUV5次元空間（識別空間）を考え、その空間内に YUV値を記憶させる（S 11)。

図 3は、本発明の一実施形態における識別空間を表す模式図である。この図は、複数枚の背景画像データおよび入力画像データにおける、画素の座標と Y UV値とをどのように識別空間に配置させるかを示している。例えば、背景画像データにおける座標が（x_Q， y_q) である画素の YUV値が（Y_q， U_g, V_q ) のとき、この xy座標と YUV値とを合わせて 5次元ベクトル（x_Q， y_q， Y_q, U_q， V_q) ^T (背景色ベクトル）が構成される。そして、この 5次元べクトル（x_Q, y_q, Y_q, U_g, V_q) ^Tが、識別空間において「背景」とラベル付けされる。このとき、模式的には、各（x， y) 座標点にそれぞれ YUV軸が備わっていると考えることができる。つまり、背景画像データの画素の座標（

X_q, y_g) と画素の YUV値（色階調値）（Y_q, U_q, V_q) とが識別空間内に構造化（（X_Q， Yq, Y_q, U_q, V_q) ^T) され、背景色領域とラベル付けされることになる。この構造化された 5次元ベクトルは、構造化データ記憶部 13 に記憶される。

[対象領域検出]

前述した識別空間における背景色領域形成（背景学習）が終了すると、対象領域検出の準備が整ったことになる。対象領域中の色情報が未知の場合には、背景色情報のみから対象領域検出を行う。

以下、入力画像データが、背景色領域と対象色領域とのいずれに属するかを判別する処理（図2の320〜326) について説明する。

最初に、背景領域 1と対象領域 2とが重なった入力画像が力メラ 3で撮像される（S 20)。得られた入力画像データは、制御部 4内の入力画像データ記憶部 12に出力され、そこに記憶される。このとき、入力画像データ記憶部 12 においては、入力画像データの各画素の座標（x， y) に対応して、 YUV値が記憶されている。

続いて、入力画像データの画素（x_q, y_g) が選択され（S 21)、その画素の xy— YUV値が識別空間に投影される（S 22)。これは、クラス識別部 1 4が、入力画像データ記憶部 12から座標（x_q, y_q) の画素の YUV値を受け取り、さらに構造化データ記憶部 13から同じ座標（x_Q， y_n) の画素のすベての YUV値を受け取り、これらを比較することに相当する。

次に、クラス識別部 14において、画素（x_q， y_q) の YUV値に対して、最近傍識別が行われる（S 23)。本実施形態においては、簡単のため、識別すべきクラスは背景とターゲットの 2つだけとする。したがって、最近傍識別の結果、入力画像データの YUV値は、背景かターゲットかのいずれかのクラスに分けられる。また、クラス識別部 14において、最近接クラスが決定されると同時に、背景色領域に属する最近傍点までの距離が求められる。求められた最近傍点までの距離は、閾値比較部 15に出力される。

識別空間にターゲット色が全く記録されていない初期状態では、最近傍識別はすべての xy— YUV値を背景として識別してしまう。そこで、通常の背景差分のように閾値 Th_b (定数）を導入し、最近傍点までの距離が閾値 Th_bより大きい xy— YUV値を背景外色領域（本実施形態においては対象色領域）として検出するように構成する。

まず、図 2の最近傍識別（S 23) において、入力画像デ一夕の座標（x_q, y_q) の画素の YUV値が背景色領域に属すると識別された場合を説明する。まず、閾値比較部 15において、クラス識別部 14で求められた最近傍点までの距離と閾値 Th_bとが比較される（S 24)。そして、最近傍点までの距離が閾値 Th_bより小さければ（324で 0)、その入力画像データの YUV値は背景色領域に属すると識別され、入力画像データの次の画素の識別に移る（S 2 1)。

それに対して、閾値比較部 15において、最近傍点までの距離が閾値 Th_bより大きいと判断されれば（324で丫£3)、その入力画像デ一夕の YUV値は対象色領域に属すると識別される。また、このときの 5次元ベクトル（x_Q, y _g, Y_q, U_q, V_q) ^Tを、対象色ベクトルと呼ぶ。そして、識別空間の全画素の xy座標において、その YUV値が対象色領域として記憶され（S 26)、入力画像データの次の画素の識別に移る（S 21)。

このようにして、順次、対象色ベクトルが記憶されていくと、背景色領域と対象色領域とを分けている決定境界の形状も、それに応じて変化していく。次に、図 2の最近傍識別（S 23) において、入力画像デ一夕の座標（x_q， y_q) の画素の YUV値が対象色領域に属すると識別された場合を説明する。まず、閾値比較部 15において、クラス識別部 14で求められた最近傍点までの距離と閾値 Th_bとが比較される（S 25)。そして、最近傍点までの距離が閾値 Th_bより小さければ（S 25でNO)、その入力画像データの YUV値は背景色領域にも近いことになるために、識別空間内に記憶させることはせず、入力画像データの次の画素の識別に移る（S 21)。

つまり、本実施形態においては、「確実に背景外領域である」と判断された領域のみを切り出し、その領域中の色をターゲット色として記録し、以降の識別処理に利用する。

それに対して、閾値比較部 15において、最近傍点までの距離が閾値 Th_bより大きいと判断されれば（325で £3)、その入力画像データの YUV値は確実に対象色領域に属すると識別される。そして、識別空間の全画素の座標において、その YUV値が対象色領域として記憶され、入力画像デ一夕の次の画素の識別に移る（S 21)。

以上の処理を繰り返していくことにより、背景領域の中から対象領域を識別することができる。

以上説明したように本実施形態においては、入力画像デ一夕の YUV値が対象色領域に属すると識別されると、その YUV値が識別空間に記憶される。そのため、この識別に不具合が生ずると、以降の最近傍識別による誤検出が増加してしまう。これを避けるためには、識別時の閾値 Th_bを十分に大きくすることが好ましい。

この閾値 Th_bを十分に大きく取ってよい理由は以下の通りである。ある背景領域の色とそれに似た色の対象領域が重なったとき、閾値 Th_bが大きいと、その対象領域が全く検出されなくなってしまう。しかし、閾値 Th_bによる背景差分は、背景とターゲットの色が大きく異なる領域において確実に対象領域を検出し、その検出領域中の色を夕一ゲット色として識別空間に記録するための処理であり、類似した背景 ·夕ーゲット色間の識別は最近傍識別によって行われる。したがって、閾値 Th_bは適当に十分大きな値でよい。

また、本実施形態においては、閾値 Th_bを定数として説明したが、これは識別処理を高速化するためである。これにより、識別の実時間処理が可能となる。しかし、本発明はこれに限られることなく、背景領域の変動に応じた適切な閾値設定も可能である。

上記の識別処理においては、例えば（x_p， y_p， Y_p, U_p, V_p) ^Tが背景外色領域として識別されると、この（Y_p， U_p， V_p) が他の xy座標で観測されてもターゲット色として識別されるように、全 xy座標の（Y_p， U_p, V_p) をターゲット色にクラス分類する。しかし、他の x y座標（χ。， y_q) では、（X _q， y_q, Y_p, U_p, V_p) ^Tが背景色領域に分類されている可能性がある。このとき、（x_q， y_q, Yp, U_p， V_p) ^Tのクラスをターゲットに変更してしまうと、座標（x_q, y_q) を頻繁に誤検出してしまう。そこで、以下のターゲット色登録処理によってこの問題を回避することも可能である。

まず、ターゲット色として識別された YUV値（Yi, U Vi) を色成分に持つ全 xy— YUV値 {(X i, y；, Y₅, U_j; V;) ^τ} (ただし、 iは全画像座標を要素に持つ集合の要素）の最近傍識別を行う。

次に、最近傍識別の結果、最近傍点までの距離が閾値 Th_tより大きい場合のみ背景色との重なりがないとみなし、その xy— YUV値を夕一ゲットにクラス分類する。

ここで導入した閾値 Th _tは、識別空間における背景色領域が信頼できる場合は、 0 (ゼロ）でよい。つまり、 YUV値が完全に一致した場合のみ、ターゲッ卜にクラス分類するように構成してもよい。それは、本発明においては、背景領域の観測 ·学習はオフライン処理であるため、この処理の段階で識別空間における背景色領域の信頼性を十分に高めておくことが可能であるからである

[対象色領域の逐次更新]

夕一ゲット色が学習されると、閾値 Th_bによる閾値処理によってだけでなく、最近傍識別によってターゲットに識別される xy— YUV値（x_p， y_p, Y_p ， U_p, V_p) ^Tが現れる。図 4 (a) に、十分な背景学習が行われたため、識別空間における背景色領域は信頼できるが、ターゲット色学習が不十分な時点（時刻 T_pとする）の、画素（x_p， y_p) における 3次元 YUV空間を示す。この時刻 T_pにおいても、図 4 (a) ののように、最近傍識別によるターゲット色検出結果は信頼性が高い。したがって、画素（x_p, y_p) を対象領域として検出する。しかし、逆に、図 4 (a) の V₂のように、最近傍識別により背景色と識別された xy— YUV値が実際に背景に対応している可能性は必ずしも高くない。

図 4 (a) の例では、ターゲット色学習が不十分な時刻 T_pにおいて、少ないながらも学習済の対象色領域 Τ_Τρとの距離が小さいはターゲットとして識別されている。しかしながら、本来はターゲットに識別されるべき V₂は、背景に識別されている。この問題は、ターゲット色学習が進むにつれて自動的に解決できる。図 4 (b) に、十分なターゲット色学習が行われた時刻 T_qの、画素

(x_p， y_p) における 3次元 YUV空間を示す。この図からわかるように、、 V₂ともにターゲットとして識別されることになる。

これは、言い換えれば、背景領域と対象色領域を分けている境界である、決定境界の位置に依存する。図 4 (a) に示したように、不十分な学習しか行われていなければ、対象色領域に属するべクトルが少ないために、決定境界（不十分な学習） DB_Tpは、対象色領域側に近いところに位置している。そのため、本来はターゲットに識別されるべき V₂は、背景に識別されている。それに対して、学習が進んでいき時刻 T_qになると、決定境界（十分な学習） DB_Tqは、より背景色領域側に近いところに移動している。これにより、 V₂もターゲットとして識別されることになる。

また、最近傍識別によりある xy— YUV値が夕一ゲット色に識別されても、最近傍背景色領域との距離が大きい（確実にターゲット色であると確認できる）ことは保証されていない。そこで、最近傍識別によってターゲットに識別された xy— YUV値を、識別空間内に夕ーゲッ卜色として記憶する際にも、前述した夕一ゲット色登録処理を実行することが好ましい。

[他の好ましい実施形態]

前述した実施形態においては、画像データの色階調値は YUV方式で表されているとして説明した。しかし、本発明はそれに限られることなく、光の三原色である R (赤）、 G (緑）および B (青）で画像データの色を表現する RGB 方式における RGB値や、それ以外の色表現形式で表してもよい。また、例えばカメラから出力された YUV値を RGB値など、他の色表現形式に変換して本発明に係る画像処理を行ってもよいし、逆に、カメラから出力された RGB 値など、他の色表現形式のものを YUV値に変換して本発明に係る画像処理を行うように構成することも可能である。

また、本発明はカラ一画像に限られることなく、例えば、 8ビット 256階調のダレ一スケールで表された画像データに対しても、適用可能である。

さらに、本発明は、画素の座標を表す xy 2次元座標と色階調を表す YUV 3次元べクトルとの組み合わせに限られることなく、画素の座標と色階調を表すベクトルとの他の任意の組み合わせに対しても適応可能である。例えば、画素が 3次元的に配列されている場合であれば、画素の座標を表す xy z 3次元座標と色階調を表す任意の次元のべクトルとを組み合わせることも可能であるまた、以上の説明においては、識別すべきクラスは背景とターゲットの 2つだけとしたが、本発明はそ lに限られることなく、 3つ以上のクラスの識別においても有効である。

前述した実施形態においては、 1画素ごとにその YUV値を識別空間に投影し、ターゲット色検出を行った。しかし、近接画素間においては、 YUV値の生起確率には高い相関があり、またカメラの量子化誤差の影響で各 YUV値の下位ビットの値は信頼性が低い。そのため、 xy— YUV軸をそれぞれ観測可能な最大解像度（すなわち、 xy軸を 1画素ごと、 YUV軸を 1階調ごと）でサンプリングしても冗長性が高く、識別空間の巨大化に伴う識別の高精度化は期待できない。そこで、識別性能と計算コストとのトレードオフを考慮して、各軸のサンプリングレートを決めることが好ましい。

図 5は、 xy軸の画素、および YUV軸の階調をリサンプリングする一実施形態を示した模式図である。図 5 (a) は画像データの画素を表しており、（b ) は xy各軸をリサンプリングして得た YUV集合である（空間リサンプリング)。図 5 (a) では、 xy各軸をそれぞれ lZbにリサンプリングして、図 5 (b) の YUV集合 S_sを作製している。ここで、この例においては、 b = 4である。すなわち、 4X4ピクセルのブロック中の全 YUV値を識別空間中の一つの xy値（例えば、 4X4ピクセルの最も左上の座標など）に対応させている。続いて、 Y UV軸の各階調を l Z cにリサンプリングして、図 5 ( c ) に示した YUV集合 S _cを得ている（階調リサンプリング)。図中の記号 [ X ] は、 Xを超えない最大の整数を表す。

本発明においては、画像座標 x yと色階調 YUVという異なる情報量によつて、識別空間が構成されている。そのため、識別空間中の距離によって色を識別する際に、全軸間の距離を均一に評価してしまうことは、識別結果に悪影響を及ぼす可能性がある。そこで、前述のサンプリングレートを考慮した上で、各軸間の距離に重みを与えることにより、適切な識別が行われるように調整する。

図 5 ( d ) では、画像中の（x = n , y = n ) 番目のブロックからサンプリングされた YUV集合 S _cが、 X y— YUV空間の X y軸方向単位長に w倍の重みを与えられて、（x =wn , y =wn) に投影されている。この重みは、厳密には入力画像の複雑さによって変化させるべきであるが、一般的には x y— Y UV軸のサンプリングレートのみに応じて決定しても識別結果に大きな影響はない。

また、このリサンプリングは、識別空間のサイズを調整しているだけで、入力画像データのサイズを縮小している訳ではない。それでありながら、情報量をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。さらに、空間リサンプリングにおいては、例えある画素の色階調値がノイズにより本来の値から変動させられたとしても、隣接する画素と合わせたブロックに対して処理が行われるため、その変動の影響をほとんど受けずに済む。

ターゲット検出時は、全画素に対応する x y— YUV値が上記の背景学習と同様のルールで識別空間に投影され、それぞれ独立に、例えば画像が 6 4 0 X 4 8 0ピクセルであれば、 6 4 0 X 4 8 0回の最近傍識別が行われる。

以上説明した一連の画像処理は、ソフトウェアにより実行することができる。例えば、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータで実現される。これは、図 1において、制御部 4およびドライブ 5をコンビュ一夕とし、主制御部 1 0を専用のハードウェアとすることに相当する。

または、一連の画像処理は、記録媒体からソフトウェアを構成するプロダラムがィンストールされることにより、各種の機能を実行することが可能な汎用のコンピュータで実現される。これは、例えば、図 1において、制御部 4およびドライブ 5を汎用のコンピュータとし、磁気ディスク 2 1、光ディスク 2 2 、光磁気ディスク 2 3または半導体メモリ 2 4などを、プログラムを記録した記録媒体としたことに相当する。

【実施例 1】以下、照明の変化、背景物体の動きなどの背景領域の変動に対する、本発明の有効性を確認するための一実施例について説明する。

本実施例では、図 1の制御部 4およびドライブ 5として P e n t i um4 2. 4GHzの PC (パーソナルコンピュータ）と、図 1のカメラ 3として S ONY製 I E EE 1394カメラ DFW— VL 500とを用いた画像処理の一例を示す。入力画像データは、 640 X480ピクセルの YUV画像である。図 6に、実験を行った背景領域を示す。図 6 (a) は照明がオンの場合であり、図 6 (b) は照明がオフの場合である。日照変化により壁や床の陰影は微妙に変化している。また、画面左上のカーテンは風のため揺れている。

図 7および図 8は、定数閾値による背景差分の検出結果を示す。ただし、図 7 (b) および図 8 (b)、 (d) は、「極力全対象領域が検出されるように」手動で決められる閾値を小さく取った場合の検出結果である。また、図 7 (c) および図 8 (c)、 (e) は、逆に、「極力誤検出が小さくなるように」手動で決められる閾値を大きく取った場合の検出結果である。そして、全結果の閾値は互いに異なる値である。

図 7 (b)、（c) は、図 6 (a) (照明オン）と図 7 (a) の差分結果において、閾値を変えた結果である。適切な閾値によって、図 7 (c) のように比較的良好な結果を得ることもできるが、図 6 (a) と図 7 (a) において、カーテンが移動した分は誤検出されている。また、図 8 (b)、（c) は、図 6 (a ) (照明オン）と図 8 (a) の差分結果において、閾値を変えた結果である。入力画像の照明条件が急激に変化しているため、閾値を調節しても大きな誤検出が生じている。

一方、図 8 (d)、 (e) は、図 6 (b) (照明オフ）と図 8 (a) の差分結果において、閾値を変えた結果である。このように、仮に入力画像に適した静止背景画像が与えられたとしても、照明が消えて画像全体が暗い場合、背景色とターゲット色との差分が小さいため、閾値の小さな違いが検出結果に大きな影響を与えてしまう。

次に、図 9に、ガウス混合モデルを用いた背景差分の検出結果を示す。図 9 (a) は、図 7 (a) (照明オン）からの検出結果であり、照明状況に対して十分に背景モデルが適応した後の検出結果を示している。この図 9 (a) に示した結果は、全画素に対して定数の閾値処理が行われた図 7 (b)、 (c) と比べて、非静止背景物体の誤検出がほとんどない。しかし、図 9 (b) に示すように、照明オンに適応した背景モデルにより、図 8 (a) (照明オフ）からの検出を行うと、誤検出が生じてしまう。

これは、照明オフ直後には背景モデル更新が間に合わないために誤検出が生じることを意味する。照明オフの背景画像集合に合わせて十分に更新された背景モデルから検出閾値を決定すると、図 9 (c) に示すように単純な背景差分の結果（図 8 (b)、（c)、（d)、 (e)) と比べて良好な結果を得ることができる。

最後に、図 10 (照明オン）および図 1 1 (照明オフ）に、本発明に係る画像処理方法による検出結果を示す。 xy_YUV空間での最近傍識別には、ハッシュ表を用いた効率的キャッシングによる高速化を施した。八ッシュ表を用いると、データ量が大きくなつても、キーとなるオブジェクトから対応するォブジェク卜へ高速にアクセスできるため、高速な処理が可能となる。

また、 x、 y軸をそれぞれ 1/8に（X軸： 640ピクセル→80ピクセル、 y軸： 480ピクセル— 60ピクセル）、 YUV軸はそれぞれ階調を半分（2 56— 128) にリサンプリングし、 xy軸と YUV軸の単位長の比が 2 ： 1 になるように xy軸に 2倍の重みを与えた。つまり、前述の b、 cおよび wは、 b = 8、じ=2ぉょぴ^=2でぁる。

本実施例では、まず図 6に示したような照明オン ·オフ時の背景画像をそれぞれ 5種類ずつ事前に撮影し、計 10枚の画像中の全 xy— YUV値を一つの識別空間中に記録した。これらの画像において、壁や床の上の陰影は微妙に変化し、風で揺れるカーテンは様々な形状で撮影された。

本実施例においては、ターゲットは画像内を数往復し、その間に十分な夕一ゲット色学習が行われた。また、ターゲット色学習量に応じた検出結果の変化を確認するため、ある 1枚の入力画像に対して、（a) ターゲット色学習なし、

(b) ターゲット色学習量小、および（c) ターゲット色学習量大、という 3 つの異なる条件でターゲット検出を行った。その結果が、それぞれ、図 10ならびに図 1 1の（a)、 (b) および（c) である。すなわち、図 10 (a) と図 11 (a)、図 10 (b) と図 1 1 (b)、および図 10 (c) と図 11 (c ) は、それぞれ同一の背景色 ·ターゲット色データによる検出結果であり、照明オン ·オフ時のそれぞれに適した識別データを用意している訳ではない。図 7 (a) (照明オン）と図 8 (a) (照明オフ）からの検出結果を、それぞれ図 10および図 11に示す。ただし、本発明に係る画像処理方法には、図 7 および図 8に示した単純な背景差分のように、人間が適切な閾値を定めるような手動処理は一切含まれていない。つまり、本実施例においては自律動作によりターゲット検出を行わせている。

図 10 )、（b) や図 11 (a)、 (b) に示すように、ターゲット色の学習量が十分ではないときは、背景色と対象領域中の色が似ている領域（カーテンとシャツが重なる領域）での検出洩れが多い。しかし、図 10 (c)、図 11

(c) に示したように、十分な量のターゲット色を学習した後の検出結果では、背景色と類似した色の対象領域の検出率も向上し、他の方法と比べて極めて優れた結果が得られている。

また、図 10 (c) における検出洩れのほとんどは、照明によりターゲット色が完全に飽和している領域であり、色情報のみを参照して同じく色が完全に飽和した背景領域と識別することは不可能である。また、ターゲット色学習後の動作速度は、 P Cの性能に依存するが、現状 1 0 f p sに近い値が得られており、十分に実時間ターゲット検出が可能である。

以上説明したように、本発明によれば、背景差分とターゲット色検出を統合した、任意の対象領域における実時間ターゲット検出が可能な画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供できる。本発明においては、画像の x y軸と色の YUV軸からなる 5次元空間における最近傍識別によって、背景画像色の空間的分布とターゲット色の分布との両方を考慮した識別空間を構成することにより、背景差分の適切な閾値設定を実現している。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色と夕ーゲット色の小さな差分の検出も可能である。

[実施の形態の概要]

本発明に係る実施の形態の概要を以下に記載する。

( 1 ) 上記したように、本願発明に係る画像処理装置は、所定の領域を撮像し、画像データに変換する撮像手段と、前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、前記撮像手段により撮像された、背景領域および対象領域からなる入力画像デ一夕における、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、を備えることが好ましい。

この構成によれば、まず、撮像手段により背景領域のみが撮像された背景画像データが得られる。そして、背景色記憶手段により、背景画像データの画素の座標と前記画素の色階調値とが識別空間内に構造化されて記憶される。この識別空間内における背景画像データの集合は、背景色領域と呼ばれる。続いて、撮像手段により背景領域および対象領域が撮像された入力画像デ一夕が得られる。そして、入力画像データの各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別手段により、入力画像データの各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。このクラス識別手段により各画素の色階調値が背景外色領域に属すると判断された場合には、対象色記憶手段により、各画素の色階調値と各画素の座標とが識別空間内に構造化して記憶される。つまり、複数枚の背景画像データを利用することができ、かつ画像データにおける画素の座標と画素の色階調値とが識別空間内に構造化して記憶されている。そのため、色情報だけでなく、位置情報も取り込まれている。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化に対しても対応でき、かつ背景色と夕ーゲット色との小さな差分の検出も可能である。

( 2 ) 画像処理装置は、画像処理装置（1 ) であって、画像データの色階調値は YUV方式で表されていることが好ましい。

この構成によれば、輝度信号である Yと、色信号である Uおよび Vで画像デ一夕の色を表現する。そして、輝度信号（Y) により多くのデータ量を割り当てることで、少ない画質の劣化で高いデータ圧縮率を得ることができる。

( 3 ) 画像処理装置は、画像処理装置（1 ) であって、画像データの色階調値は R G B方式で表されていることが好ましい。

この構成によれば、光の三原色である R (赤）、 G (緑）および B (青）で画像デ一夕の色を表現する。 R G B方式はスキャナ、モニタ、デジタルカメラ、カラーテレビなどに使用されているので、汎用性が高い。また、例えば、フルカラ一であれば、 R G Bをそれぞれ 2 5 6階調に分けて色を表現するので、 1 6 7 7万 7 2 1 6色の色調表現が可能である。

( 4 ) 画像処理装置は、画像処理装置（1 ) であって、画像デ一夕の色階調値はダレ一スケールで表されていることが好ましい。

この構成によれば、明度差に基づいたグレースケールで画像データの色を表現する。つまり、画像を白から黒までの明暗だけで表現するため、カラ一画像に比べて色を指定するための情報量が少なくて済む。その結果、色を識別する処理が高速に行える。

( 5 ) 画像処理装置は、画像処理装置（1 ) 乃至（4 ) のいずれかであって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることが好ましい。この構成によれば、識別空間において、背景領域と背景外領域のいずれが、各画素の色階調値から最も近い点を有するのかが、最近傍識別により判断される。つまり、識別問題で典型的に用いられている最近傍識別により識別を行うので、これまでに開発された効率的なアルゴリズムなどを有効に活用することができる。

( 6 ) 画像処理装置は、画像処理装置（1 ) 乃至（5 ) のいずれかであって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることが好ましい。この構成によれば、キーとなるオブジェクトから対応するォブジェクトへの直接的なアクセスが可能となる。これにより、データ量が大きくなつても、キ —となるオブジェクトから対応するォブジェク卜へ高速にアクセスできるため、高速な処理が可能となる。

( 7 ) 画像処理装置は、画像処理装置（1 ) 乃至（6 ) のいずれかであって、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することが好ましい。

この構成によれば、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合であっても、各画素の色階調値と背景色領域の識別空間内における距離が所定の閾値より大きいときには、背景外色領域に含まれると判断し直される。つまり、閾値を変えることにより、識別の基準を制御することができる。そのため、背景領域の変動などがあった場合にも、閾値を調整することで、容易に最適な識別を行うことができる。

( 8 ) 画像処理装置は、画像処理装置（1 ) 乃至（7 ) のいずれかであって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することが好ましい。

この構成によれば、識別空間において、近接する複数の画素の色階調値をまとめて一つの画素の座標に構造化して記憶するので、画素の座標に関する情報をほとんど減らすことなく、 1箇所に集約する。これにより、画素の座標に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。

( 9 ) 画像処理装置は、画像処理装置（1 ) 乃至（8 ) のいずれかであって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することが好ましい。

この構成によれば、色階調に関する' I青報をほとんど減らすことなく、各画素の色階調値が圧縮される。これにより、色階調に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。

( 1 0 ) 画像処理装置は、画像処理装置（1 ) 乃至（9 ) のいずれかであつて、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することが好ましい。この構成によれば、画素の座標を指定する座標軸に所定の重みを掛けて、空間座標における距離を変更する。これにより、識別空間における、空間座標と色階調空間の距離の関係が修正される。つまり、画像座標 x yと色階調 YUV という異なる情報量による各軸間の距離に重みを与えて調整しているので、適切な識別が行われる。

( 1 1 ) 上記したように、本願発明に係る画像処理方法は、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステツプと、を含むことが好ましい。

この構成によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法を提供することができる。

( 1 2 ) 上記したように、本願発明に係る記録媒体は、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステツプと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体であることが好ましい。

この構成によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関する、コンピュータが読み取り可能なプログラムが記録されていることを特徴とする記録媒体を提供することができる。

( 1 3 ) 上記したように、本願発明に係るプログラムは、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像デ一夕における、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させるためのプログラムであることが好ましい。

この構成によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関するプログラムを提供することができる。

本発明は詳細に説明されたが、上記した説明は、全ての局面において、例示であって、本発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。

Claims

請求の範囲

【請求項 1】

所定の領域を撮像し、画像データに変換する撮像手段と、

前記撮像手段により撮像された背景領域のみからなる背景画像デー夕における各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、

前記撮像手段により撮像された、背景領域および対象領域からなる入力画像デ一夕における、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、

前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、

を備えることを特徴とする画像処理装置。

【請求項 2】

画像デ一夕の色階調値は YUV方式で表されていることを特徴.とする請求項 1記載の画像処理装置。

【請求項 3】

画像データの色階調値は R G B方式で表されていることを特徴とする請求項 1記載の画像処理装置。

【請求項 4】

画像データの色階調値はグレースケールで表されていることを特徴とする請求項 1記載の画像処理装置。

【請求項 5】

クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることを特徴とする請求項 1乃至 4のいずれかに記載の画像処理装置。

【請求項 6】

クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることを特徴とする請求項 1乃至 5のいずれかに記載の画像処理装置。

【請求項 7】

クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することを特徴とする請求項 1乃至 6のいずれかに記載の画像処理装置。

【請求項 8】

背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することを特徴とする請求項 1 乃至 7のいずれかに記載の画像処理装置。

【請求項 9】

背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することを特徴とする請求項 1乃至 8のいずれかに記載の画像処理装置。

【請求項 1 0】

背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することを特徴とする請求項 1乃至 9のいずれかに記載の画像処理装置。

【請求項 1 1】

所定の領域を撮像し、画像デ一夕に変換する撮像ステツプと、

前記撮像ステップの処理により撮像された背景領域のみからなる背景画像デ一夕における各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステツプと、

前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、

前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステツプと、

を含むことを特徴とする画像処理方法。

【請求項 1 2】

所定の領域を撮像し、画像デー夕に変換する撮像ステツプと、

前記撮像ステップの処理により撮像された背景領域のみからなる背景画像デ一夕における各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、

前記クラス識別ステツプの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステツプと、

をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。

【請求項 1 3】

所定の領域を撮像し、画像デー夕に変換する撮像ステップと、

をコンピュータに実行させるためのプログラム。