JP6162492B2

JP6162492B2 - 動体検出装置、動体検出方法及び制御プログラム

Info

Publication number: JP6162492B2
Application number: JP2013122537A
Authority: JP
Inventors: 健太西行; 彰彦江口
Original assignee: MegaChips Corp
Current assignee: MegaChips Corp
Priority date: 2013-06-11
Filing date: 2013-06-11
Publication date: 2017-07-12
Anticipated expiration: 2033-06-11
Also published as: JP2014241012A

Description

本発明は、画像に対する動体検出に関する。

非特許文献１〜３にも記載されているように、画像に対する動体検出に関して、従来から様々な技術が提案されている。

K.Kim,T.Chalidabhongse,D.Harwood,and L.Davis,"Real-time foreground-background segmentation using codebook model",Real-Time Imaging,vol.11,no.3,pp.172-185,Jun.2005. P.Guha,D.Palai,K.S.Venkatesh,and A.Mukerjee,"A Multiscale Co-linearity Statistic Based Approach To Robust Background Modeling.",ACCV,2006. R.Mester,T.Aach,and L.Dumbgen,"Illumination-invariant change detection using a statistical colinearity criterion",Proceedings of the 23rd DAGM-Symposium on Pattern Recognition,Springer-Verlag(2001)170-177

画像に対する動体検出では、その精度の向上が望まれている。

そこで、本発明は上述の点に鑑みて成されたものであり、画像に対する動体検出の精度を向上することが可能な技術を提供することを目的とする。

本発明に係る動体検出装置の一態様は、入力画像に対して動体検出を行う動体検出部と、入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う特定部と、前記動体検出の検出感度を調整する感度調整を行う感度調整部とを備え、前記感度調整部は、前記感度調整において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くする。

また、本発明に係る動体検出装置の一態様では、前記特定部は、前記特定処理において、前記撮像領域において前記第１及び第２動き領域よりも状態変化が小さい背景領域も特定し、前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる前記第１及び第２動き領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記背景領域の画像である背景領域画像に対する前記動体検出の検出感度よりも高くする。

また、本発明に係る動体検出装置の一態様では、前記特定部は、前記特定処理において、前記撮像領域において不規則に状態が変化するノイズ領域も特定し、前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記ノイズ領域の画像であるノイズ領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる前記第１動き領域画像、前記第２動き領域画像及び前記背景領域画像に対する前記動体検出の検出感度よりも低くする。

また、本発明に係る動体検出装置の一態様では、前記特定部は、前記特定処理において、前記撮像領域において不規則に状態が変化するノイズ領域も特定し、前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記ノイズ領域の画像であるノイズ領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる前記第１及び前記第２動き領域画像に対する前記動体検出の検出感度よりも低くする。

また、本発明に係る動体検出装置の一態様では、前記特定部は、前記第１入力画像よりも前に撮像された複数枚の第２入力画像に対する前記動体検出の結果に基づいて動体の動きベクトルを取得する動きベクトル取得部と、前記動きベクトルに基づいて、前記撮像領域に含まれる複数の部分撮像領域のそれぞれについて、当該部分撮像領域での動体の平均動き量を取得する取得部と、前記複数の部分撮像領域での前記平均動き量に基づいて前記特定処理を行う領域特定部とを有する。

また、本発明に係る動体検出装置の一態様では、前記特定部は、前記第１入力画像よりも前に撮像された複数枚の第２入力画像に対する前記動体検出の結果に基づいて動体の動きベクトルを取得する動きベクトル取得部と、前記動きベクトルに基づいて、前記撮像領域に含まれる複数の部分撮像領域のそれぞれについて、当該部分撮像領域での動体の平均動き量を取得するとともに、当該部分撮像領域での動体の動き量ばらつき度及び動き方向ばらつき度の少なくとも一方を取得する取得部と、前記複数の部分撮像領域での前記平均動き量と、前記複数の部分撮像領域での前記動き量ばらつき度及び前記動き方向ばらつき度の少なくとも一方とに基づいて、前記特定処理を行う領域特定部とを有する。

また、本発明に係る動体検出装置の一態様では、前記領域特定部は、前記複数の部分撮像領域での前記平均動き量、前記動き量ばらつき度及び前記動き方向ばらつき度に基づいて、前記特定処理を行う。

また、本発明に係る動体検出装置の一態様では、前記動体検出部は、入力画像に含まれる部分画像に対する前記動体検出において、当該部分画像が動体画像であるか否かを、調整パラメータを含む判定式を用いて判定し、前記感度調整部は、前記感度調整において、前記判定式に含まれる前記調整パラメータを調整する。

また、本発明に係る動体検出装置の一態様では、背景画像情報を含む背景モデルを記憶する第１記憶部と、第２記憶部と、前記背景モデルを更新する背景モデル更新部とがさらに設けられ、前記動体検出部は、入力画像に含まれる部分画像に対する前記動体検出では、当該部分画像から得られる画像情報と、前記背景モデル内の背景画像情報との比較に基づいて、当該部分画像が動体画像であるか否かを判定し、当該部分画像が動体画像であると判定すると当該画像情報を背景画像情報候補として前記第２記憶部に記憶し、前記背景モデル更新部は、判定期間において入力される複数枚の入力画像に基づいて、前記第２記憶部に記憶された背景画像情報候補を背景画像情報として前記背景モデルに登録するか否かを判定し、前記感度調整部は、前記感度調整において、前記判定期間を調整する。

また、本発明に係る動体検出方法の一態様は、（ａ）入力画像に対して動体検出を行う工程と、（ｂ）入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う工程と、（ｃ）前記動体検出の検出感度を調整する工程とを備え、前記工程（ｃ）において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くする。

また、本発明に係る制御プログラムの一態様は、入力画像に対して動体検出を行う動体検出装置を制御するための制御プログラムであって、前記動体検出装置に、（ａ）入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う工程と、（ｃ）前記動体検出の検出感度を調整する工程とを実行させ、前記工程（ｃ）において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くすることを実行させるためのものである。

本発明によれば、画像に対する動体検出の精度を向上することができる。

動体検出装置で行われる処理の概要を示す図である。動体検出装置の構成を示す図である。画像処理部の構成を示す図である。撮像領域の一例を示す図である。撮像領域において特定される領域の種類を示す図である。撮像領域において特定される領域と、動体検出の検出感度との関係を示す図である。背景モデルの一例を示す図である。コードワードの一例を示す図である。動体検出装置の動作を示すフローチャートである。動体検出装置の動作を示すフローチャートである。動体検出装置の動作を示すフローチャートである。動体検出装置の動作を説明するための図である。画像ベクトルと背景ベクトルとの関係を示す図である。動体検出装置の動作を示すフローチャートである。動体検出装置の動作を示すフローチャートである。動きベクトルの求め方を説明するための図である。撮像領域において特定される領域と、調整パラメータと、登録判定期間との関係を示す図である。動き量ヒストグラムの一例を示す図である。動き方向ヒストグラムの一例を示す図である。撮像領域において特定される領域と評価値との関係を示す図である。登録判定期間の初期値の調整方法を説明するための図である。

＜動体検出装置の動作の概要＞
図１は本実施形態に係る動体検出装置１の動作の概要を示す図である。動体検出装置１は、画像に対して動体検出を行って、当該画像に含まれる動体画像（動体を示す画像）を検出する。

図１に示されるように、本実施の形態では、動体検出装置１の動作段階として、準備段階と実動作段階とが存在する。動体検出装置１は、準備段階において、時系列で順次に入力される複数枚の入力画像を用いて、背景モデルの生成処理を実行する。背景モデルは、同一のシーン（被写体）を撮影して得られた複数枚の入力画像に含まれる情報が集められて構成されたモデルである。背景モデルは、後述の動体検出処理において、時系列で順次に入力される各入力画像から動体画像を検出する際に利用される。なお、背景モデルの生成処理が実行される準備段階は「学習段階」とも呼ばれる。以後、背景モデルの生成で使用される入力画像を「基準画像」と呼び、動体検出の対象となる入力画像を「検出対象画像」と呼ぶことがある。

動体検出装置１では、背景モデルの生成が完了すると、動作段階が準備段階から実動作段階へと移行する。動体検出装置１は、実動作段階において、入力画像に対して動体検出を行う動体検出処理と、動体検出の検出感度を調整する検出感度調整処理と、背景モデルを更新する背景モデル更新処理とを行う。本実施の形態では、検出対象の動体は例えば人である。なお、検出対象の動体は人以外であっても良い。

＜動体検出装置の構成＞
図２は動体検出装置１の構成を示すブロック図である。図２に示されるように、動体検出装置１は、画像入力部２と、画像処理部３と、検出結果出力部４と、背景モデル記憶部５と、キャッシュモデル記憶部６とを備えている。図３は画像処理部３の構成を示すブロック図である。

画像入力部２は、動体検出装置１の外部から入力される入力画像２００を画像処理部３に入力する。入力画像２００は撮像部で撮像された撮像画像である。図４は、入力画像２００に写る撮像領域１０、つまり入力画像２００を撮像する撮像部の撮像領域（視野範囲）１０の一例を示す図である。図４に示される撮像領域１０には、被写体として会議室１００が含まれている。したがって、この場合には、動体検出装置１に入力される入力画像２００は、会議室１００を示す画像となる。会議室１００では、複数の机１０１と複数の椅子１０２が床の中央部を取り囲むように並べられており、複数の机１０１の外側が通路１０３となっている。そして、会議室１００では、壁の一部にカーテン１０４が設けられている。本実施の形態に係る動体検出装置１は、例えば、会議室１００を示す入力画像２００に対して動体検出を行うことによって、会議室１００に存在する人を検出する。

画像処理部３は、画像入力部２から入力される入力画像２００に対して様々な画像処理を行う。画像処理部３は、ＣＰＵ３００と記憶部３１０を備えている。記憶部３１０は、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等を備えている。記憶部３１０には、動体検出装置１を制御するための制御プログラム３１１が記憶されている。ＣＰＵ３００が記憶部３１０内の制御プログラム３１１を実行することによって、画像処理部３には様々な機能ブロックが形成される。

図３に示されるように、画像処理部３には、背景モデル生成部３０、動体検出部３１、特定部３２、感度調整部３３及び背景モデル更新部３４等の複数の機能ブロックが形成される。なお、これらの機能ブロックは、ＣＰＵがプログラムを実行することによって実現されるのではなく、論理回路を用いたハードウェア回路で実現されても良い。

背景モデル生成部３０は、画像入力部２から順次入力される複数枚の入力画像２００（複数枚の基準画像２００）を用いて背景モデル５００を生成する。背景モデル生成部３０によって生成された背景モデル５００は背景モデル記憶部５に記憶される。

動体検出部３１は、画像入力部２から入力される入力画像２００と、背景モデル５００とを用いて、入力画像２００中の動体画像を検出する。

特定部３２は、入力画像２００に写る撮像領域１０において、第１動き領域と、第２動き領域と、ノイズ領域と、背景領域とを特定する特定処理を、動体検出部３１での動体検出の結果に基づいて行う。特定部３２は、動きベクトル取得部３２０と、評価値取得部３２１と、領域特定部３２２とを備えている。図５は特定部３２で特定される複数種類の領域を説明するための図である。

第１動き領域とは、検出対象の動体（本例では人）が動く領域であって、当該動体の動き量（動体が動く量）が小さい領域である。図４に示される撮像領域１０では、人が座る椅子１０２の周辺の領域等が第１動き領域となる。

第２動き領域とは、検出対象の動体が動く領域であって、当該動体の動き量が大きい領域である。図４に示される撮像領域１０では、人が通る通路１０３が存在する領域等が第２領域となる。

ノイズ領域は、撮像領域１０において不規則に状態が変化する領域である。図４に示される撮像領域１０では、風等によって揺れるカーテン１０４が存在する領域がノイズ領域となる。また、会議室１００に表示装置が置かれている場合には、当該表示装置の画面が存在する領域がノイズ領域となる。

背景領域は、撮像領域１０において第１動き領域、第２動き領域及びノイズ領域よりも状態変化が小さい領域、つまり状態がほとんど変化しない領域である。図４に示される撮像領域１０では、床が存在する領域や、カーテンの無い壁などが存在する領域が背景領域となる。

なお、背景領域を広い意味で捉えると、ノイズ領域も背景領域に含まれるが、ここでは、状態がほとんど変化しない領域を背景領域と呼び、ノイズ領域と背景領域とを区別している。特定部３２の動作については後で詳しく説明する。

感度調整部３３は、パラメータ調整部３３０と判定期間調整部３３１とを備えている。感度調整部３３は、動体検出部３１の動体検出の検出感度を調整する。具体的には、感度調整部３３は、特定部３２で特定された複数種類の領域のそれぞれについて、入力画像２００に含まれる当該領域の画像に対する動体検出の検出感度を個別に設定する。図６は、特定部３２で特定される複数種類の領域と、動体検出の検出感度との対応関係を示す図である。以後、単に「検出感度」と言えば、動体検出の検出感度を意味する。

本実施の形態では、入力画像２００に含まれる、第１動き領域の画像（以後、「第１動き領域画像」と呼ぶ）に対する動体検出の検出感度はとても高く設定される。図４に示される例では、第１動き領域画像は、例えば、人が座っている椅子１０２付近を示す画像となる。また、入力画像２００に含まれる、第２動き領域の画像（以後、「第２動き領域画像」と呼ぶ）に対する動体検出の検出感度は比較的高く設定される。図４に示される例では、第２動き領域画像は、例えば、人が通っている通路１０３を示す画像となる。また、入力画像２００に含まれる、ノイズ領域の画像（以後、「ノイズ領域画像」と呼ぶ）に対する動体検出の検出感度は比較的低く設定される。図４に示される例では、ノイズ領域画像は、例えば、揺れているカーテン１０４を示す画像となる。そして、入力画像２００に含まれる、背景領域の画像（以後、「背景領域画像」と呼ぶ）に対する動体検出の検出感度は中程度に設定される。図４に示される例では、背景領域画像は、例えば、床や天井を示す画像となる。

このように、感度調整部３３では、入力画像２００に含まれる第１動き領域画像に対する動体検出の検出感度が、入力画像２００に含まれる第２動き領域画像に対する動体検出の検出感度よりも高く設定される。また、感度調整部３３では、入力画像２００に含まれる第１及び第２動き領域画像に対する動体検出の検出感度が、入力画像２００に含まれる背景領域画像に対する動体検出の検出感度よりも高く設定される。そして、感度調整部３３では、入力画像２００に含まれるノイズ領域画像に対する動体検出の検出感度が、入力画像２００に含まれる第１動き領域画像、第２動き領域画像及び背景領域画像よりも低く設定される。感度調整部３３の動作については後で詳しく説明する。

背景モデル更新部３４は背景モデル５００の更新を行う。背景モデル記憶部５は、背景モデル生成部３０で生成される背景モデル５００を記憶する。キャッシュモデル記憶部６は、後述するキャッシュモデルを記憶する。背景モデル記憶部５及びキャッシュモデル記憶部６のそれぞれは、フラッシュメモリ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）またはハードディスク（ＨＤ）等の書き換え可能な記憶手段で構成される。なお本例では、背景モデル記憶部５とキャッシュモデル記憶部６とはハードウェア的に独立しているが、一つの記憶装置が有する記憶領域の一部を背景モデル記憶部５として使用し、当該記憶領域の他の一部をキャッシュモデル記憶部６として使用しても良い。

検出結果出力部４は、動体検出部３１での動体検出についての検出結果を外部に出力する。検出結果出力部４は、例えば、撮像領域１０に存在する被写体（図４の例では会議室１００）の様子をリアルタイムで表示する表示部を備えており、当該表示部において、動体が検出された領域を色等で表示することによって、動体検出の検出結果を外部に出力する。また、検出結果出力部４は、検出結果を音声等の音で外部に出力しても良い。また、検出結果出力部４は、検出結果を示す信号を、外部装置に対して出力することによって、当該検出結果を外部に出力しても良い。この場合には、外部装置は、検出結果に応じた動作を実行する。例えば、外部装置は、警報を発生する。あるいは、撮像領域１０が図４の会議室１００である場合には、外部装置は、会議室１００の照明器具を制御して、人が存在する領域だけ明るくする。また、外部装置は、会議室１００の空調機を制御して、人が存在する領域だけ冷却したり、暖めたりする。

＜準備段階（背景モデル生成処理）＞
次に動体検出装置１の準備段階で行われる背景モデル生成処理について説明する。図７は背景モデル５００を説明するための図である。本実施の形態では、撮像領域１０において人が存在しないとき（会議室１００が利用されていないとき）に撮像部で撮像された入力画像２００が、背景モデル５００の生成で使用される基準画像２００となっている。背景モデル生成処理では、Ａ枚（Ａ≧２）の基準画像２００に基づいて背景モデル５００が生成される。

本実施の形態では、撮像領域１０は、複数の矩形の撮像ブロック（部分撮像領域）に分割される。入力画像２００に含まれる、ある撮像ブロックの画像を示す領域を「画像ブロック」と呼ぶと、入力画像２００は、撮像領域１０を構成する複数の撮像ブロックの画像をそれぞれ示す複数の画像ブロックで構成される。本実施の形態では、一つの画像ブロックの大きさは、例えば、３画素×３画素となっている。以後、撮像ブロックと、入力画像２００における、当該撮像ブロックの画像を示す画像ブロックとに関して、当該撮像ブロックを、当該画像ブロックに対応する撮像ブロックと呼ぶことがある。

図７に示されるように、背景モデル５００には、複数の撮像ブロックＢＫにそれぞれ対応する複数のコードブック（Codebook）ＣＢが含まれる。各コードブックＣＢには、画像情報と、当該画像情報に関連する関連情報とを含むコードワード（Codeword）ＣＷが含まれている。コードブックＣＢに含まれるコードワードＣＷは、一枚の入力画像２００における、当該コードブックＣＢが対応する撮像ブロックＢＫの画像を示す画像ブロックに基づいて生成される。各コードブックＣＢには複数のコードワードＣＷが含まれている。以後、背景モデル５００中のコードワードＣＷに含まれる画像情報を「背景画像情報」と呼ぶことがある。

図７において砂地のハッチングが示されているコードブックＣＢには、３枚の基準画像２００ａ〜２００ｃに基づいてそれぞれ生成された３つのコードワードＣＷ１〜ＣＷ３が含まれている。コードブックＣＢに含まれるコードワードＣＷ１は、基準画像２００ａにおける、当該コードブックＣＢが対応する撮像ブロックＢＫの画像を示す画像ブロックに基づいて生成される。コードブックＣＢに含まれるコードワードＣＷ２は、基準画像２００ｂにおける、当該コードブックＣＢが対応する撮像ブロックＢＫの画像を示す画像ブロックに基づいて生成される。そして、コードブックＣＢに含まれるコードワードＣＷ３は、基準画像２００ｃにおける、当該コードブックＣＢが対応する撮像ブロックＢＫの画像を示す画像ブロックに基づいて生成される。

図８はコードワードＣＷを説明するための図である。コードワードＣＷには、当該コードワードＣＷを含むコードブックＣＢが対応する撮像ブロックの画像を示す画像ブロックの画像情報、つまり当該画像ブロックを構成する複数の画素の画素値ＰＶが、背景画像情報として含まれている。そして、コードワードＣＷには、関連情報として、最新一致時刻Ｔｅとコードワード生成時刻Ｔｉとが含まれている。後述するように、背景モデル５００に含まれるコードワードＣＷ中の画像情報については、検出対象画像２００から取得された画像情報と一致する否かが判定される。コードワードＣＷに含まれる最新一致時刻Ｔｅは、当該コードワードＣＷに含まれる画像情報と、検出対象画像２００から取得された画像情報とが一致すると判定された最新の時刻を示している。また、コードワードＣＷに含まれるコードワード生成時刻Ｔｉは、当該コードワードＣＷが生成された時刻を示している。

図９は、このような背景モデル５００が生成される背景モデル生成処理を示すフローチャートである。図９に示される背景モデル生成処理は、背景モデル記憶部５に背景モデル５００が記憶されていないときに実行される。

図９に示されるように、ステップｓ１において、背景モデル生成部３０は、画像入力部２から基準画像２００が画像処理部３に入力されると、ステップｓ２において、撮像領域１０のある撮像ブロックを注目撮像ブロックとし、注目撮像ブロックに対応するコードブックＣＢが背景モデル記憶部５に記憶されているか否かを判定する。

背景モデル生成部３０は、注目撮像ブロックに対応するコードブックＣＢが背景モデル記憶部５に記憶されていないと判定すると、ステップｓ３において、ステップｓ１で入力された基準画像２００に基づいて、注目撮像ブロックに対応するコードブックＣＢを生成して背景モデル記憶部５に記憶する。

具体的には、背景モデル生成部３０は、ステップｓ１で入力された基準画像２００における、注目撮像ブロックの画像を示す画像ブロックから画像情報を取得する。そして、背景モデル生成部３０は、取得した画像情報を背景画像情報として含むコードワードＣＷを生成し、当該コードワードＣＷを含むコードブックＣＢを背景モデル記憶部５に記憶する。このコードワードＣＷに含まれる最新一致時刻Ｔｅは、暫定的に、コードワード生成時刻Ｔｉと同じ時刻に設定される。

一方で、背景モデル生成部３０は、注目撮像ブロックに対応するコードブックＣＢが背景モデル記憶部５に記憶されていると判定すると、ステップｓ４において、ステップｓ１で入力された基準画像２００における、注目撮像ブロックの画像を示す画像ブロックから画像情報を取得する。そして、背景モデル生成部３０は、背景モデル記憶部５が記憶している、注目撮像ブロックに対応するコードブックＣＢに含まれる各コードワードＣＷ中の背景情報画像と、取得した画像情報とが一致するか否かを判定する。つまり、背景モデル生成部３０は、注目撮像ブロックに対応するコードブックＣＢに含まれるコードワードＣＷにおいて、取得した画像情報と一致する背景画像情報を含むコードワードＣＷが存在するか否かを判定する。

ステップｓ４での判定の結果、ステップｓ５において、注目撮像ブロックに対応するコードブックＣＢに含まれる各コードワードＣＷ中の背景情報画像と、取得した画像情報とが一致しない場合には、つまり、注目撮像ブロックに対応するコードブックＣＢに含まれるコードワードＣＷにおいて、取得した画像情報と一致する背景画像情報を含むコードワードＣＷが存在しない場合には、ステップｓ６において、背景モデル生成部３０は、ステップｓ４で基準画像２００から取得した画像情報を背景画像情報として含むコードワードＣＷを生成する。このコードワードＣＷに含まれる最新一致時刻Ｔｅは、暫定的に、コードワード生成時刻Ｔｉと同じ時刻に設定される。そして、背景モデル生成部３０は、生成したコードワードＣＷを、背景モデル記憶部５が記憶する、注目撮像ブロックに対応するコードブックＣＢに追加する。これにより、注目撮像ブロックに対応するコードブックＣＢには新しい背景画像情報が追加される。

一方で、ステップｓ５において、注目撮像ブロックに対応するコードブックＣＢに含まれるコードワードＣＷ中の背景情報画像と、取得した画像情報とが一致する場合には、つまり、注目撮像ブロックに対応するコードブックＣＢに含まれるコードワードＣＷにおいて、取得した画像情報と一致する背景画像情報を含むコードワードＣＷが存在する場合には、ステップｓ６は実行されずに、ステップｓ７が実行される。ステップｓ７において、背景モデル生成部３０は、撮像領域１０における全ての撮像ブロックについて処理が行われた否か、つまり、全ての撮像ブロックを注目撮像ブロックに設定したか否かを判定する。ステップｓ７での判定の結果、処理が行われていない撮像ブロックが存在する場合には、背景モデル生成部３０は、未だ処理が行われていない撮像ブロックを新たな注目撮像ブロックとして、ステップｓ２以降を実行する。

一方で、ステップｓ７での判定の結果、撮像領域１０における全ての撮像ブロックについて処理が行われている場合には、背景モデル生成部３０は、ステップｓ８において、Ａ枚の基準画像２００に対して同様の処理が行われたか否かを判定する。背景モデル生成部３０は、ステップｓ８での判定の結果、処理を行った基準画像２００の枚数がＡ枚よりも少ない場合には、ステップｓ１において画像処理部３に対して新たに入力される基準画像２００に対して、ステップｓ２以下の処理を実行する。背景モデル生成部３０は、ステップｓ８での判定の結果、処理を行った基準画像２００の枚数がＡ枚である場合には、背景モデル生成処理を終了する。これにより、上述のような背景モデル５００が背景モデル記憶部５内に生成される。

＜実動作段階＞
次に動体検出装置１の実動作段階での動作について説明する。図１０は、動体検出装置１の実動作段階での概略動作を示すフローチャートである。動体検出装置１では、背景モデル生成処理が終了すると、図１０に示される処理が実行される。

図１０に示されるように、ステップｓ１１において画像入力部２から入力画像２００が画像処理部３に入力されると、当該入力画像２００を処理対象として、ステップｓ１２〜ｓ１４までの一連の処理が実行される。

ステップｓ１２において、画像処理部３は、処理対象の入力画像２００に対して動体検出を行う動体検出処理を行う。そして、ステップｓ１３において、画像処理部３は、ステップｓ１２での動体検出処理の結果に基づいて、動体検出の検出感度を調整する検出感度調整処理を行う。その後、画像処理部３は、ステップｓ１４において、背景モデル記憶部５内の背景モデル５００を更新する背景モデル更新処理を行う。

その後、ステップｓ１１において、画像入力部２から画像処理部３に新たな入力画像２００（新たな検出対象画像２００）が入力されると、当該入力画像２００を新たな処理対象として、ステップｓ１２〜ｓ１４までの一連の処理が実行される。その後、画像処理部３は同様に動作する。

このように、本実施の形態に係る動体検出装置１では、入力画像２００が入力されるたびに、動体検出処理、検出感度調整処理及び背景モデル更新処理がこの順番で実行される。

＜動体検出処理＞
次にステップｓ１２での動体検出処理について詳しく説明する。図１１は動体検出処理を示すフローチャートである。図１１に示されるように、ステップｓ１２１において、動体検出部３１は、撮像領域１０のある撮像ブロック（例えば、撮像領域１０における左上の撮像ブロック）を注目撮像ブロックとし、上述のステップｓ１１で入力された処理対象の入力画像２００（検出対象画像２００）における、注目撮像ブロックの画像を示す画像ブロック（以後、「注目画像ブロック」と呼ぶことがある）に対して動体検出を行う。本実施の形態に係る動体検出では、入力画像２００中の注目画像ブロックから取得される画像情報と、背景モデル５００における、注目撮像ブロックに対応するコードブックＣＢに含まれる各コードワードＣＷ中の背景画像情報とが一致するか否かが判定されることによって、注目画像ブロックが動体画像であるか否かが判定される。以後、背景モデル５００における、注目撮像ブロックに対応するコードブックＣＢを「対応コードブックＣＢ」と呼ぶことがある。また、対応コードブックに含まれるコードワードＣＷを「対応コードワードＣＷ」と呼ぶことがある。動体検出の具体的手法については後述する。

ステップｓ１２１が実行されると、ステップｓ１２２において、動体検出部３１は、ステップｓ１２１での動体検出の結果を記憶する。そして、動体検出部３１は、ステップｓ１２３において、撮像領域１０における全ての撮像ブロックについて処理が行われた否か、つまり、全ての撮像ブロックを注目撮像ブロックに設定したか否かを判定する。ステップｓ１２３での判定の結果、処理が行われていない撮像ブロックが存在する場合には、動体検出部３１は、未だ処理が行われていない撮像ブロックを新たな注目撮像ブロックとして、ステップｓ１２１以降を実行する。一方で、ステップｓ１２３での判定の結果、撮像領域１０における全ての撮像ブロックについて処理が行われている場合には、つまり、入力画像２００の全領域に対して動体検出が完了している場合には、動体検出部３１は動体検出処理を終了する。これにより、動体検出部３１には、入力画像２００を構成する複数の画像ブロックに対する動体検出の結果が記憶される。この検出結果は、検出結果出力部４に入力される。

＜動体検出の詳細＞
次にステップｓ１２１での動体検出の具体的手法について図１２及び１３を用いて説明する。図１２は、入力画像２００の注目画像ブロック及び背景モデル５００の対応コードワードＣＷのそれぞれからベクトルを抽出する様子を表した図である。図１３は、入力画像２００の注目画像ブロックから抽出されたベクトルと、背景モデル５００の対応コードワードＣＷから抽出されたベクトルとの関係を示す図である。

本実施の形態では、入力画像２００中の注目画像ブロックの画像情報がベクトルとして扱われる。また、背景モデル５００中の各対応コードワードＣＷについて、当該対応コードワードＣＷに含まれる背景画像情報がベクトルとして扱われる。そして、注目画像ブロックの画像情報についてのベクトルと、各対応コードワードＣＷの背景画像情報についてのベクトルとが、同じ方向を向いているか否かに基づいて、注目画像ブロックが動体画像であるか否かが判定される。この２種類のベクトルが同じ方向を向いている場合には、注目画像ブロックの画像情報と、各対応コードワードＣＷの背景画像情報とは一致すると考えることができる。したがって、この場合には、入力画像２００中の注目画像ブロックは、背景を示す画像と変わらず、動体画像ではないと判定される。一方、２種類のベクトルが同じ方向を向いていない場合には、注目画像ブロックの画像情報と、各対応コードワードＣＷの背景画像情報とは一致しないと考えることができる。したがって、この場合には、入力画像２００中の注目画像ブロックは、背景を示す画像ではなく、動体画像であると判定される。

具体的には、動体検出部３１は、入力画像２００中の注目画像ブロックに含まれる複数の画素の画素値を成分とした画像ベクトルｘ_ｆを生成する。図１２には、９個の画素を有する注目画像ブロック２１０の各画素の画素値を成分とした画像ベクトルｘ_ｆが示されている。図１２の例では、各画素は、Ｒ（赤）、Ｇ（緑）及びＢ（青）の画素値を有しているため、画像ベクトルｘ_ｆは、２７個の成分で構成されている。

同様に、動体検出部３１は、背景モデル５００の対応コードブックＣＢに含まれる対応コードワードＣＷ中の背景画像情報を用いて、背景画像情報に関するベクトルである背景ベクトルを生成する。図１２に示される対応コードワードの背景画像情報５１０には、９個の画素についての画素値が含まれている。したがって、当該９個の画素についての画素値を成分とした背景ベクトルｘ_ｂが生成される。背景ベクトルｘ_ｂについては、対応コードブックＣＢに含まれる複数のコードワードＣＷのそれぞれから生成される。したがって、一つの画像ベクトルｘ_ｆに対して複数の背景ベクトルｘ_ｂが生成される。

上述のように、画像ベクトルｘ_ｆと各背景ベクトルｘ_ｂとが同じ方向を向いている場合、入力画像２００中の注目画像ブロックは、背景を示す画像と変わらないことになる。しかしながら、画像ベクトルｘ_ｆ及び各背景ベクトルｘ_ｂには、ある程度のノイズ成分が含まれていると考えられることから、画像ベクトルｘ_ｆと各背景ベクトルｘ_ｂとが完全に同じ方向を向いていなくても、入力画像２００中の注目画像ブロックは背景を示す画像であると判定することができる。

そこで、本実施の形態では、画像ベクトルｘ_ｆ及び各背景ベクトルｘ_ｂに、ある程度のノイズ成分が含まれていることを考慮して、画像ベクトルｘ_ｆと各背景ベクトルｘ_ｂとが完全に同じ方向を向いていない場合であっても、入力画像２００中の注目画像ブロックは背景を示す画像であると判定する。

画像ベクトルｘ_ｆ及び背景ベクトルｘ_ｂにノイズ成分が含まれていると仮定すると、真のベクトルｕに対する画像ベクトルｘ_ｆと背景ベクトルｘ_ｂとの関係は、図１３のように表すことができる。本実施の形態では、画像ベクトルｘ_ｆと背景ベクトルｘ_ｂとが、どの程度同じ方向を向いているかを示す評価値として、以下の（１）で表される評価値Ｄ^２を考える。

そして、行列Ｘを画像ベクトルｘ_ｆと背景ベクトルｘ_ｂとを用いて、式（２）のように表すと、評価値Ｄ^２は、２×２行列ＸＸ^Ｔの非ゼロの最小固有値となる。したがって、評価値Ｄ^２については解析的に求めることができる。なお、評価値Ｄ^２が２×２行列ＸＸ^Ｔの非ゼロの最小固有値となることについては、上記の非特許文献３に記載されている。

上述のように、一つの画像ベクトルｘ_ｆに対して複数の背景ベクトルｘ_ｂが生成されることから、画像ベクトルｘ_ｆと背景ベクトルｘ_ｂとを用いて表される評価値Ｄ^２の値も、背景ベクトルｘ_ｂの数と同じ数だけ得られることになる。

入力画像２００中の注目画像ブロックが動体画像であるか否かの判定は、評価値Ｄ^２の複数の値のうちの最小値Ｃと、評価値Ｄ^２の複数の値についての平均値μ及び標準偏差σとを用いて表される、以下の式（３）で示される動体判定式が用いられる。この動体判定式はチェビシェフ（Chebyshev）の不等式と呼ばれる。

ここで、式（３）のｋは定数であって、入力画像２００を撮像する撮像部の撮像環境（撮像部が設置される環境）等に基づいて定められる値である。定数ｋは実験等によって決定される。また、式（３）のαは変数であって、ステップｓ１３での検出感度調整処理で調整される。以後、変数αを「調整パラメータα」と呼ぶ。本実施の形態では、撮像ブロックごとに、当該撮像ブロックの画像を示す画像ブロックに対する動体検出で使用される動体判定式の調整パラメータαを調整することが可能となっている。

動体検出部３１は、動体判定式（不等式）を満たす場合、画像ベクトルｘ_ｆと各背景ベクトルｘ_ｂとが同じ方向を向いていないと考えて、注目画像ブロックは、背景を示す画像ではなく、動体画像であると判定する。一方で、動体検出部３１は、動体判定式を満たさない場合、画像ベクトルｘ_ｆと各背景ベクトルｘ_ｂとは同じ方向を向いていると考えて、注目画像ブロックは動体画像ではなく、背景を示す画像であると判定する。

このように、本実施の形態では、注目画像ブロックから得られた画像ベクトルの方向と、各対応コードワードＣＷから得られた背景ベクトルの方向とが、同じか否かに基づいて動体検出が行われているため、本実施の形態に係る動体検出手法は、日照変化あるいは照明変化などの撮像領域１０での明るさの変化に対して比較的頑健な動体検出手法である。

なお、式（３）を以下の式（４）に書き直すことによって、調整パラメータαはしきい値αとして見ることができる。式（４）の左辺に示される評価値がしきい値α以上であれば、注目画像ブロックは動体画像であると判定される。一方で、当該評価値がしきい値αよりも小さければ、注目画像ブロックは動体画像ではないと判定される。

＜背景モデル更新処理＞
次にステップｓ１４での背景モデル更新処理について説明する。背景モデル更新処理では、キャッシュモデルを記憶するキャッシュモデル記憶部６が使用される。キャッシュモデルには、背景モデル５００に登録される背景画像情報の候補である背景画像情報候補が含められる。

ここで、撮像領域１０では、日照変化あるいは照明変化などによって、明るさが変化することがある。撮像領域１０での明るさが変化すると、入力画像２００の画像情報が変化することから、動体検出部３１は、入力画像２００に含まれる、背景を示す画像ブロックを誤って動体画像であると判定する可能性がある。したがって、動体検出部３１において動体画像あると判定された画像ブロックの画像情報が、実際には背景の画像情報である可能性がある。

そこで、本実施の形態では、背景モデル更新部３４は、動体検出部３１において動体画像であると判定された画像ブロックの画像情報を背景画像情報候補として、いったんキャッシュモデルに登録する。そして、背景モデル更新部３４は、判定期間に入力される複数枚の入力画像２００に基づいて、キャッシュモデルに登録した背景候補画像情報が、背景の画像情報であるか否かを判定する。背景モデル更新部３４は、キャッシュモデルに登録した背景画像情報候補が背景の画像情報であると判定すると、当該背景画像情報候補を背景画像情報として背景モデル５００に登録する。つまり、背景モデル更新部３４は、判定期間に入力される複数枚の入力画像２００に基づいて、キャッシュモデル記憶部６に記憶した背景画像情報候補を背景画像情報として背景モデル５００に登録するか否かを判定する。この判定期間を「登録判定期間」と呼ぶ。

登録判定期間は、ステップｓ１３での検出感度調整処理で調整される。また、登録判定期間は、撮像ブロックごとに準備されている。ある撮像ブロックの画像を示す画像ブロックの画像情報が背景画像情報候補としてキャッシュモデルに登録され、当該背景画像情報候補が、背景画像情報として背景モデル５００に登録されるか否かが判定される際には、当該撮像ブロックに対応する登録判定期間が使用される。

図１４は背景モデル更新処理を示すフローチャートである。図１４に示されるように、ステップｓ１４１において、背景モデル更新部３４は、撮像領域１０のある撮像ブロックを注目撮像ブロックとし、上述のステップｓ１１で入力された処理対象の入力画像２００における、注目撮像ブロックの画像を示す画像ブロック（注目画像ブロック）が動体検出部３１において動体画像であると判定されてか否かを判定する。ステップｓ１４１において、注目画像ブロックが動体検出部３１において動体画像ではないと判定されたと判断されると、つまり、注目画像ブロックの画像情報が、背景モデル５００中の各対応コードワードＣＷの背景画像情報と一致すると判定されると、背景モデル更新部３４はステップｓ１４２を実行する。

ステップｓ１４２では、背景モデル更新部３４は、注目画像ブロックの画像情報と一致すると判定された背景画像情報を含む、背景モデル５００中のコードワードＣＷの最新一致時刻Ｔｅを現在時刻に変更する。

一方で、ステップｓ１４１において、注目画像ブロックが動体検出部３１において動体画像であると判定されたと判断されると、背景モデル更新部３４はステップｓ１４３を実行する。ステップｓ１４３では、キャッシュモデルの更新が行われる。具体的には、背景モデル更新部３４は、注目画像ブロックの画像情報が、キャッシュモデル記憶部６内のキャッシュモデルに含まれていない場合には、当該画像情報を背景画像情報候補として含むコードワードＣＷを生成してキャッシュモデルに登録する。このコードワードＣＷには、画像情報（背景画像情報候補）以外にも、最新一致時刻Ｔｅ及びコードワード生成時刻Ｔｉが含まれている。ステップｓ１４３で生成されたコードワードＣＷに含まれる最新一致時刻Ｔｅは、暫定的に、コードワード生成時刻Ｔｉと同じ時刻に設定される。また背景モデル更新部３４は、注目画像ブロックの画像情報が、キャッシュモデル記憶部６内のキャッシュモデルに含まれている場合には、つまり、注目画像ブロックの画像情報と一致する背景画像情報候補がキャッシュモデルに含まれている場合には、キャッシュモデルにおける、当該背景画像情報候補を含むコードワードＣＷ中の最新一致時刻Ｔｅを現在時刻に変更する。

このように、ステップｓ１４３では、不足している画像情報を含むコードワードＣＷのキャッシュモデルへの追加、あるいはキャッシュモデル中のコードワードＣＷの最新一致時刻Ｔｅの更新が行われる。

ステップｓ１４２あるいはステップｓ１４３が実行されると、ステップｓ１４４において、背景モデル更新部３４は、撮像領域１０における全ての撮像ブロックについて処理が行われた否か、つまり、全ての撮像ブロックを注目撮像ブロックに設定したか否かを判定する。ステップｓ１４４において、処理が行われていない撮像ブロックが存在すると判定された場合には、背景モデル更新部３４は、未だ処理が行われていない撮像ブロックを新たな注目撮像ブロックとして、ステップｓ１４１以降を実行する。一方で、ステップｓ１４４において、撮像領域１０における全ての撮像ブロックについて処理が行われたと判定されると、背景モデル更新部３４はステップｓ１４５を実行する。

ステップｓ１４５では、キャッシュモデルに含まれる、最新一致時刻Ｔｅが所定期間更新されていないコードワードＣＷが削除される。つまり、キャッシュモデル中のコードワードＣＷに含まれる画像情報が、ある程度の期間、入力画像２００から取得された画像情報と一致しない場合には、当該コードワードＣＷが削除される。コードワードＣＷに含まれる画像情報が、背景の画像情報である場合には、つまり入力画像２００に含まれる、背景を示す画像から取得された画像情報である場合には、当該コードワードＣＷ中の最新一致時刻Ｔｅは頻繁に更新されることから、最新一致時刻Ｔｅが所定期間更新されていないコードワードＣＷに含まれる画像情報については、入力画像２００に含まれる動体画像から取得された画像情報である可能性が高いと考えることができる。最新一致時刻Ｔｅが所定期間更新されていないコードワードＣＷがキャッシュモデルから削除されることによって、動体画像の画像情報がキャッシュモデルから削除される。以後、この所定期間を「削除判定用期間」と呼ぶことがある。削除判定用期間は、日照変化あるいは照明変化などの撮像領域１０での明るさの変化、及びポスターの設置あるいは机の配置変更などの環境の変化等による画像情報の変化と、検出対象とする人等の動体が動くときに生じる画像情報の変化とを区別するために予め設定される期間である。例えば、入力画像２００を撮像する撮像部の撮像フレームレートが３０ｆｐｓであり、撮像領域１０が会議室１００（図４参照）であるとすると、削除判定用期間は、数十フレーム分から数百フレーム分の入力画像２００が入力される期間に設定される。

ステップｓ１４５において、キャッシュモデルに含まれる、最新一致時刻Ｔｅが削除判定用期間更新されていないコードワードＣＷが削除されると、背景モデル更新部３４はステップｓ１４６を実行する。ステップｓ１４６では、背景モデル更新部３４は、キャッシュモデルに登録されているコードワードＣＷのうち、キャッシュモデルに登録されてから登録判定期間経過しているコードワードＣＷを、背景モデル記憶部５内の背景モデル５００に登録する。背景モデル５００に登録されたコードワードＣＷはキャッシュモデルから削除される。登録判定期間は削除判定用期間よりも大きな値に設定される。登録判定期間は、削除判定用期間よりも例えば数倍程度大きな値に設定される。本実施の形態では、登録判定期間はフレーム数で表されるものとする。登録判定期間が例えば“５００”であるとすると、登録判定期間は、５００フレーム分の入力画像２００が入力される期間となる。

ここで、背景モデル更新部３４が、キャッシュモデル内のコードワードＣＷ（背景画像情報候補）を、キャッシュモデルに登録してから登録判定期間経過するまでに削除するということは、背景モデル更新部３４が、登録判定期間において入力される複数枚の入力画像２００に基づいて、キャッシュメモリに登録したコードワードＣＷ（背景画像情報候補）を背景モデル５００に登録しないと判定したことを意味している。一方で、背景モデル更新部３４が、キャッシュモデル内のコードワードＣＷ（背景画像情報候補）を、キャッシュモデルに登録してから登録判定期間経過するまで削除しないということは、背景モデル更新部３４が、登録判定期間において入力される複数枚の入力画像２００に基づいて、キャッシュメモリに登録したコードワードＣＷ（背景画像情報候補）を背景モデル５００に登録すると判定したことを意味している。

また、背景モデル更新部３４は、キャッシュモデル内に存在しているコードワードＣＷが、キャッシュモデルに登録されてから登録判定期間経過しているか否かを判定する際には、当該コードワードＣＷに含まれる画像情報（背景画像情報候補）が取得された画像ブロックに対応する撮像ブロックに応じた登録判定期間が使用される。

なお、ステップｓ１４３では、コードワードＣＷが生成されると、当該コードワードＣＷはすぐにキャッシュメモリに登録されることから、コードワードＣＷがキャッシュモデル内に登録された時刻として、当該コードワードＣＷに含まれるコードワード生成時刻Ｔｉを使用することができる。

このように、背景モデル更新部３４は、判定期間において入力される複数枚の入力画像２００に基づいて、キャッシュモデルに登録された背景画像情報候補を背景画像情報として背景モデル５００に登録するか否かを判定していることから、動体検出部３１において動体画像であると誤って判定された画像ブロックの画像情報を、背景画像情報として背景モデル５００に登録することができる。よって、背景モデル５００を適切に更新することができ、動体検出部３１での動体検出の精度が向上する。

ステップｓ１４６が終了すると、ステップｓ１４７において、背景モデル更新部３４は、背景モデル５００に含まれるコードワードＣＷにおいて、入力画像２００の画像情報と所定期間にわたって一致しなかった背景画像情報を含むコードワードＣＷを削除する。つまり、背景モデル更新部３４は、背景モデル５００に含まれる、最新一致時刻Ｔｅが所定期間更新されていないコードワードＣＷを削除する。これにより、撮像領域１０において、時系列的な撮像環境の変化により既に背景ではなくなった撮像ブロックの画像から取得された画像情報を含むコードワードＣＷを背景モデル５００から削除することができる。よって、背景モデル５００の情報量を低減することができる。

このような背景モデルの更新処理を行うことによって、撮像領域１０での明るさの変化等の撮像環境の変化が生じた場合であっても、撮像環境の変化に追従した背景モデル５００を用いて動体検出を行うことができる。よって、動体検出の精度が向上する。

＜検出感度調整処理＞
次にステップｓ１３での検出感度調整処理について説明する。検出感度調整処理では、上記の式（３）で示される動体判定式に含まれる調整パラメータαが調整されることによって、動体検出部３１での動体検出の検出感度が調整される。調整パラメータαが小さくされると、動体判定式が満たされやすくなることから、画像ブロックが動体画像であると判定されやすくなる。つまり、検出感度が高くなる。一方で、調整パラメータαが大きくされると、動体判定式が満たされにくくなることから、画像ブロックが動体画像であると判定されにくくなる。つまり、検出感度が低くなる。

さらに、検出感度調整処理では、キャッシュモデルに登録したコードワードＣＷを背景モデル５００に登録するか否かを判定する登録判定期間が調整されることによって、動体検出部３１での動体検出の検出感度が調整される。登録判定期間が短くされると、登録判定期間に入力される入力画像２００が少なくなることから、少ない数の入力画像２００に基づいて、キャッシュモデルに登録したコードワードＣＷを背景モデル５００に登録するか否かを判定することになる。したがって、キャッシュモデル内の、動体画像から取得された画像情報を含むコードワードＣＷが誤って背景モデル５００に登録される可能性が高くなる。よって、背景モデル５００が用いられた動体検出の検出精度が低くなる。一方で、登録判定期間が長くされると、登録判定期間に入力される入力画像２００が多くなることから、多くの数の入力画像２００に基づいて、キャッシュモデルに登録したコードワードＣＷを背景モデル５００に登録するか否かを判定することになる。したがって、キャッシュモデル内の、動体画像から取得された画像情報を含むコードワードＣＷが誤って背景モデル５００に登録される可能性が低くなる。よって、背景モデル５００が用いられた動体検出の検出精度が高くなる。

図１５は検出感度調整処理を示すフローチャートである。以下の説明では、現在の処理対象の入力画像２００を「Ｎフレーム目の入力画像２００」と呼び、それよりもｍフレーム前（ｍ≧１）の入力画像２００を「（Ｎ−ｍ）フレーム目の入力画像２００」と呼ぶことがある。

図１５に示されるように、ステップｓ１３１において、特定部３２の動きベクトル取得部３２０は、動体検出部３１での動体検出の結果に基づいて、動体の動きベクトルを取得する。本実施の形態では、例えば、ＮＮ（Nearest Neighbor）法を用いた動体追跡が行われて、動きベクトルが求められる。ＮＮ法では、前後のフレーム画像の間において、距離が近い動体画像が同じ動体の画像であるとして動体追跡が行われる。以下にステップｓ１３１について詳細に説明する。

ステップｓ１３１では、動きベクトル取得部３２０は、まず、Ｎフレーム目の入力画像２００において動体画像であると判定された画像ブロック（以後、「動体画像ブロック」と呼ぶ）に対して４連結等を用いたラベリングを行って、隣接する複数の動体画像ブロックを連結して一つの動体画像領域とする。図１６には、Ｎフレーム目の入力画像２００での動体画像領域６００が実線で示されている。

次に動きベクトル取得部３２０は、Ｎフレーム目の入力画像２００での各動体画像領域６００の位置と、（Ｎ−１）フレーム目の入力画像２００での各動体画像領域６１０の位置とを比較して、互いに近い位置にある動体画像領域６００，６１０を、同じ動体の画像であるとして、互いに対応付ける。図１６には、（Ｎ−１）フレーム目の入力画像２００での動体画像領域６１０が破線で示されている。なお、（Ｎ−１）フレーム目の入力画像２００での動体画像領域６１０については、（Ｎ−１）フレーム目の入力画像２００を処理対象とする一つ前の検出感度調整処理で求められている。

次に動きベクトル取得部３２０は、互いに対応付けた動体画像領域６００，６１０について、当該動体画像領域６１０の重心６１０ａから、当該動体画像領域６００の重心６００に向かうベクトルを求めて、このベクトルを当該動体画像領域６００，６１０が示す動体の動きベクトル６２０とする（図１６参照）。以後、この動きベクトルを「Ｎフレーム目の動きベクトル」あるいは「Ｎフレーム目の動体画像領域の動きベクトル」と呼ぶことがある。

次に動きベクトル取得部３２０は、互いに対応付けた動体画像領域６００，６１０から求めたＮフレーム目の動きベクトル６２０を、当該動体画像領域６００を構成する複数の動体画像ブロックにそれぞれ対応する複数の撮像ブロックに対して対応付ける。これにより、動体画像であると判定された画像ブロックに対応する撮像ブロックには、Ｎフレーム目の動きベクトル６２０が対応付けられる。撮像ブロックに対応付けられたＮフレーム目の動きベクトルは、Ｎフレーム目の入力画像２００が撮像される際に当該撮像ブロックに存在する動体の動きベクトルであると言える。

このようにして、Ｎフレーム目の動きベクトルが求められて撮像ブロックに対応付けられる。なお、（Ｎ−ｍ）フレーム目の入力画像２００を処理対象とする検出感度調整処理においても、（Ｎ−ｍ）フレーム目の動きベクトルが求められて撮像ブロックに対応付けられている。

Ｎフレーム目の動きベクトルが求められて撮像ブロックに対応付けられると、ステップｓ１３２において領域特定処理が行われる。領域特定処理では、特定部３２が、撮像領域１０において、第１動き領域と、第２動き領域と、ノイズ領域と、背景領域とを特定する。本実施の形態では、特定部３２は、Ｎフレーム目から（Ｎ−Ｍ）フレーム目（Ｍ≧１）の動きベクトルのうちの複数の動きベクトルが対応付けられている各撮像ブロックについて、当該撮像ブロックに対応付けられている複数の動きベクトルに基づいて、当該撮像ブロックがどのような領域（第１動き領域あるいは第２動き領域など）であるのかを特定する。また、特定部３２は、Ｎフレーム目から（Ｎ−Ｍ）フレーム目の動きベクトルのいずれも対応付けられていない撮像ブロックを背景領域とする。Ｍは、例えば数十の値に設定される。ステップｓ１３２での領域特定処理については後で詳細に説明する。

ステップｓ１３２での領域特定処理が終了すると、ステップｓ１３３において、感度調整部３３は、動体検出部３１での動体検出の検出感度を調整する。感度調整部３３では、パラメータ調整部３３０が動体判定式に含まれる調整パラメータαを調整することによって、動体検出の検出感度を調整する。また、感度調整部３３では、判定期間調整部３３１が背景モデル更新処理で使用される登録判定期間を調整することによって、動体検出の検出感度を調整する。まず、パラメータ調整部３３０の動作について説明する。

本実施の形態では、調整パラメータαの初期値が準備されており、調整パラメータαの値がこの初期値から変更されることによって、調整パラメータαが調整される。パラメータ調整部３３０は、入力画像２００に含まれる、撮像領域１０の第１動き領域の画像（第１動き領域画像）に対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値−Ｑ１）とする（Ｑ１＞０）。つまり、パラメータ調整部３３０は、撮像領域１０の第１動き領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックに対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値−Ｑ１）とする。

また、パラメータ調整部３３０は、入力画像２００に含まれる、撮像領域１０の第２動き領域の画像（第２動き領域画像）に対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値−Ｑ２）とする（Ｑ１＞Ｑ２＞０）。つまり、パラメータ調整部３３０は、撮像領域１０の第２動き領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックに対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値−Ｑ２）とする。

また、パラメータ調整部３３０は、入力画像２００に含まれる、撮像領域１０のノイズ領域の画像（ノイズ領域画像）に対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値＋Ｑ３）とする（Ｑ３＞０）。つまり、パラメータ調整部３３０は、撮像領域１０のノイズ領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックに対する動体検出で使用される動体判定式の調整パラメータαの値を（初期値＋Ｑ３）とする。

そして、パラメータ調整部３３０は、入力画像２００に含まれる、撮像領域１０の背景領域の画像（背景領域画像）に対する動体検出で使用される動体判定式の調整パラメータαの値を初期値とする。つまり、パラメータ調整部３３０は、撮像領域１０の背景領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックに対する動体検出で使用される動体判定式の調整パラメータαの値を初期値とする。

これにより、図１７に示されるように、第１動き領域画像に対する動体検出での調整パラメータαの値が最も小さく、第２動き領域画像に対する動体検出での調整パラメータαの値が二番目に小さく、背景領域画像に対する動体検出での調整パラメータαの値が三番目に小さく、ノイズ領域画像に対する動体検出での調整パラメータαの値が最も大きくなる。上述のように、調整パラメータαが小さくされると、動体検出の検出感度が高くなることから、第１動き領域画像に対する動体検出の検出感度が一番高く、第２動き領域画像に対する動体検出の検出感度が二番目に高く、背景領域画像に対する動体検出の検出感度が三番目に高く、ノイズ領域画像に対する動体検出の検出精度が最も低くなっている（図６参照）。

このようにして調整された調整パラメータαは、（Ｎ＋１）フレーム目の入力画像２００を処理対象とする動体検出処理において使用される。なお、特定部３２が、撮像領域１０において、第１動き領域、第２動き領域、ノイズ領域及び背景領域のいずれにも該当しないと判定した不明領域については、当該不明領域に対する動体検出で使用される調整パラメータαは初期値に設定される。

次に判定期間調整部３３１の動作について説明する。本実施の形態では、登録判定期間の初期値が準備されており、登録判定期間がこの初期値から変更されることによって、登録判定期間が調整される。判定期間調整部３３１は、撮像領域１０の第１動き領域の画像（第１動き領域画像）から取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間（第１動き領域に対応する登録判定期間）を（初期値＋Ｔ１）とする（Ｔ１＞０）。つまり、判定期間調整部３３１は、撮像領域１０の第１動き領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックから取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間を（初期値＋Ｔ１）とする。

また、判定期間調整部３３１は、撮像領域１０の第２動き領域の画像（第２動き領域画像）から取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間（第２動き領域に対応する登録判定期間）を（初期値＋Ｔ２）とする（Ｔ１＞Ｔ２＞０）。つまり、判定期間調整部３３１は、撮像領域１０の第２動き領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックから取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間を（初期値＋Ｔ２）とする。

また、判定期間調整部３３１は、撮像領域１０のノイズ領域の画像（ノイズ領域画像）から取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間（ノイズ領域に対応する登録判定期間）を（初期値−Ｔ３）とする（Ｔ３＞０）。つまり、判定期間調整部３３１は、撮像領域１０のノイズ領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックから取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間を（初期値−Ｔ３）とする。

そして、判定期間調整部３３１は、撮像領域１０の背景領域の画像（背景領域画像）から取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間（背景領域に対応する登録判定期間）を初期値とする。つまり、判定期間調整部３３１は、撮像領域１０の背景領域を構成する複数の撮像ブロックの画像をそれぞれ示す、入力画像２００中の複数の画像ブロックのそれぞれについて、当該画像ブロックから取得された画像情報を含む、キャッシュモデル内のコードワードＣＷを背景モデル５００に登録するか否かの判定で使用される登録判定期間を初期値とする。

これにより、図１７に示されるように、第１動き領域に対応する登録判定期間（第１動き領域を構成する各撮像ブロックに対応する登録判定期間）が最も長くなり、第２動き領域に対する登録判定期間（第２動き領域を構成する各撮像ブロックに対応する登録判定期間）が二番目に長くなり、背景領域に対応する登録判定期間（背景領域を構成する各撮像ブロックに対応する登録判定期間）が三番目に長くなり、ノイズ領域（ノイズ領域を構成する各撮像ブロックに対応する登録判定期間）に対応する登録判定期間が最も短くなる。上述のように、登録判定期間が長くされると、背景モデル５００が用いられた動体検出の検出精度が高くなることから、上記のように登録判定期間を調整することによって、第１動き領域画像に対する動体検出の検出感度が一番高く、第２動き領域画像に対する動体検出の検出感度が二番目に高く、背景領域画像に対する動体検出の検出感度が三番目に高く、ノイズ領域画像に対する動体検出の検出精度が最も低くなる（図６参照）。

このようにして、ステップｓ１３の検出感度調整処理で調整された登録判定期間は、当該ステップｓ１３の次のステップｓ１４での背景モデル更新処理で使用される。なお、撮像領域１０における不明領域に対応する登録判定期間は初期値に設定される。

ステップｓ１３３において、調整パラメータα及び登録判定期間が調整されると、検出感度調整処理が終了する。

以上のように、本実施の形態では、感度調整部３３が、入力画像２００に含まれる第１動き領域画像に対する動体検出の検出感度を、入力画像２００に含まれる第２動き領域画像に対する動体検出の検出感度よりも高くしている。

ここで、第１動き領域は、会議室１００における、人が座る椅子１０２の周辺の領域のように、撮像領域１０における、動体の動き量が小さい領域である。したがって、入力画像２００に含まれる第１動き領域画像の画像情報は変化しにくい。よって、本実施の形態とは異なり、動体検出の検出感度を調整しない場合には、第１動き領域画像に対して動体検出を行うと、当該第１動き領域画像に含まれる動体画像を検出できない可能性がある。

本実施の形態では、画像情報が変化しにくい第１動き領域画像に対する動体検出の検出感度を高くしていることから、第１動き領域画像から動体画像が検出されやすくなる。よって、入力画像２００に対する動体検出の精度を向上することができる。

また、本実施の形態では、感度調整部３３は、入力画像２００に含まれる第１及び第２動き領域画像に対する動体検出の検出感度を、入力画像２００に含まれる背景領域画像に対する動体検出の検出感度よりも高くしている。つまり、本実施の形態では、撮像領域１０における、動体が動く領域（以後、「動き領域」と呼ぶ）の画像（以後、「動き領域画像」と呼ぶ）に対する動体検出の検出感度が高くされている。動き領域では、動体がゆっくりと動くことがあり、場合によっては、動体の動きが止まることもあり、このような場合には、動き領域画像の画像情報は変化しにくくなる。したがって、本実施の形態のように、動き領域画像に対する動体検出の検出感度を高くすることによって、動き領域画像に含まれる動体画像を検出しやすくなる。よって、入力画像２００に対する動体検出の精度が向上する。

また、本実施の形態では、感度調整部３３は、入力画像２００に含まれるノイズ領域画像に対する動体検出の検出感度を、入力画像２００に含まれる第１及び第２動き領域画像に対する動体検出の検出感度よりも低くしている。撮像領域１０のノイズ領域では、状態が不規則に変化することから、ノイズ領域画像の画像情報が変化しやすくなる。したがって、動体検出の検出感度を調整しない場合には、ノイズ領域画像に対して動体検出を行うと、ノイズ領域画像から誤って動体画像が検出される可能性がある。本実施の形態のように、ノイズ領域画像に対する動体検出の検出感度を低くすることによって、ノイズ領域画像から誤って動体画像が検出されにくくなり、入力画像２００に対する動体検出の精度が向上する。

なお、上記の例では、動体検出の感度を調整する際に、調整パラメータα及び登録判定期間の両方を調整したが、調整パラメータα及び登録判定期間のどちらか一方だけを調整しても良い。つまり、動体検出の感度を調整する際には、調整パラメータα及び登録判定期間の少なくとも一方を調整すれば良い。

また、動体検出部３１は、上記の式（３）で示される動体判定式の代わりに、以下の式（５）で示される動体判定式を使用しても良い。

ここで、式（５）中のｋ’は調整パラメータである。式（５）に示される動体判定式が使用される場合には、パラメータ調整部３３０は、調整パラメータαの代わりに調整パラメータｋ’を調整することによって動体検出の感度を調整する。調整パラメータｋ’が大きくなると、式（５）に示される動体判定式を満たしにくくなることから、動体検出の感度は低下する。一方で、調整パラメータｋ’が小さくなると、式（５）に示される動体判定式を満たしやすくなることから、動体検出の感度は向上する。

また、式（５）を以下の式（６）に書き直すことによって、調整パラメータｋ’はしきい値ｋ’として見ることができる。式（６）の左辺に示される評価値がしきい値ｋ’以上であれば、注目画像ブロックは動体画像であると判定される。一方で、当該評価値がしきい値ｋ’よりも小さければ、注目画像ブロックは動体画像ではないと判定される。

＜領域特定処理＞
次にステップｓ１３２の領域特定処理について詳細に説明する。本実施の形態では、平均動き量、動き量ばらつき度及び動き方向ばらつき度の３種類の評価値に基づいて、撮像領域１０において、第１動き領域と、第２動き領域と、ノイズ領域と、背景領域とが特定される。

特定部３２では、評価値取得部３２１が、Ｎフレーム目から（Ｎ−Ｍ）フレーム目の動きベクトルのうちの複数の動きベクトルが対応付けられている各撮像ブロックについて、当該撮像ブロックに対応付けられている複数の動きベクトルに基づいて、当該撮像ブロックでの動体についての平均動き量、動き量ばらつき度及び動き方向ばらつき度を求める。以後、Ｎフレーム目から（Ｎ−Ｍ）フレーム目の動きベクトルのうちの複数の動きベクトルが対応付けられている撮像ブロックを「対象撮像ブロック」と呼ぶことがある。

対象撮像ブロックでの動体の平均動き量は、対象撮像ブロックにおいて動体がどの程度の量、動くかを示している。また、対象撮像ブロックでの動体の動き量ばらつき度は、対象撮像ブロックにおいて動体の動き量がどの程度ばらつくのかを示している。つまり、対象撮像ブロックでの動体の動き量ばらつき度は、対象撮像ブロックにおいて動体が動く量のばらつきの度合いを示している。そして、対象撮像ブロックでの動体の動き方向ばらつき度は、対象撮像ブロックにおいて動体の動き方向（動体が動く方向）がどの程度ばらつくのかを示している。つまり、対象撮像ブロックでの動体の動き方向ばらつき度は、対象撮像ブロックにおいて動体が動く方向のばらつきの度合いを示している。以下に、平均動き量、動き量ばらつき度及び動き方向ばらつき度の算出方法の例について説明する。

＜平均動き量の算出方法＞
評価値取得部３２１は、対象撮像ブロックに対応付けられている複数の動きベクトルの大きさの平均値を算出し、当該平均値を平均動き量とする。動きベクトルの始点及び終点の座標がそれぞれ（０，０）及び（５，３）であるとすると、当該動きベクトルの大きさＶは、以下の式（７）で表される。

評価値取得部３２１は、撮像領域１０での各対象撮像ブロックについて平均動き量を算出する。

＜動き量ばらつき度の算出方法＞
評価値取得部３２１は、対象撮像ブロックに対応付けられている複数の動きベクトルのそれぞれについて、当該動きベクトルの大きさを求めて、当該大きさを動体の動き量とする。そして、評価値取得部３２１は、対象撮像ブロックについて算出した複数の動き量の分布を示す動き量ヒストグラムを生成する。

評価値取得部３２１は、動き量ヒストグラムを生成する際には、零から、求めた複数の動き量の最大値までの範囲を複数の部分範囲に区分して、各部分範囲を動きヒストグラムの階級とする。評価値取得部３２１は、複数の階級のそれぞれについて、当該階級に属する動き量を有する動きベクトルの数を求めて、当該数を当該階級の度数（頻度）とする。

図１８は対象撮像ブロックについて求められた動き量ヒストグラムの一例を示す図である。図１８の例では、零から、複数の動き量の最大値ＭＡＸまでの範囲が１０個の部分範囲に区分されており、各部分範囲が階級とされている。

評価値取得部３２１は、対象撮像ブロックについての動き量ヒストグラムを求めると、各階級について、当該階級の度数を、対象撮像ブロックに対応付けられている複数の動きベクトルの総数で割って得られた値を、当該階級の動き量を有する動きベクトルについての出現確率Ｐとする。そして、評価値取得部３２１は、動き量ヒストグラムの各階級について求めた出現確率Ｐを用いて、以下の式（８）で示される当該動き量ヒストグラムのエントロピーＨを求める。

ここで、式（８）中のＬは、動き量ヒストグラムの複数の階級の総数を示している。動き量ヒストグラムの複数の階級には、１番からＬ番までの番号が付与されており、Ｐｉはｉ番目の階級についての出現確率Ｐを意味している。

動き量ヒストグラムのエントロピーＨは、動き量のばらつきの度合いを示していることから、評価値取得部３２１は、対象撮像ブロックについて求めた動き量ヒストグラムのエントロピーＨを、対象撮像ブロックについての動き量ばらつき度として使用する。

このようにして、評価値取得部３２１は、撮像領域１０での各対象撮像ブロックについて動き量ばらつき度を求める。

＜動き方向ばらつき度の算出方法＞
動き方向ばらつき度については、動き量ばらつき度と同様にして求めることができる。まず、評価値取得部３２１は、対象撮像ブロックに対応付けられている複数の動きベクトルのそれぞれについて、当該動きベクトルが向く方向を求めて、当該方向を動体の動き方向とする。そして、評価値取得部３２１は、対象撮像ブロックについて求めた複数の動き方向の分布を示す動き方向ヒストグラムを生成する。

評価値取得部３２１は、動き方向ヒストグラムを生成する際には、０°〜３６０°の範囲を例えば３０°ごとに区分し、得られた１２個の部分範囲を動き方向ヒストグラムの階級とする。評価値取得部３２１は、複数の階級のそれぞれについて、当該階級に属する動き方向に対応する動きベクトルの数を求めて、当該数を当該階級の度数とする。図１９は対象撮像ブロックについて求められた動き方向ヒストグラムの一例を示す図である。

評価値取得部３２１は、対象撮像ブロックについての動き方向ヒストグラムを求めると、各階級について、当該階級の度数を、対象撮像ブロックに対応付けられている複数の動きベクトルの総数で割って得られた値を、当該階級の動き方向に対応する動きベクトルについての出現確率Ｐとする。そして、評価値取得部３２１は、動き方向ヒストグラムの各階級について求めた出現確率Ｐと、上記の式（８）とを用いて、当該動き方向ヒストグラムのエントロピーを求める。なお、ここでは、式（８）中のＬは、動き方向ヒストグラムの複数の階級の総数（本例では１２個）を示す。動き方向ヒストグラムの複数の階級にも、１番からＬ番までの番号が付与されており、Ｐｉはｉ番目の階級についての出現確率Ｐを意味している。

動き方向ヒストグラムのエントロピーは、動き方向のばらつきの度合いを示していることから、評価値取得部３２１は、対象撮像ブロックについての求めた動き方向ヒストグラムのエントロピーを、対象撮像ブロックについての動き方向ばらつき度として使用する。

このようにして、評価値取得部３２１は、撮像領域１０での各対象撮像ブロックについて動き方向ばらつき度を求める。

以上のようにして、評価値取得部３２１が、撮像領域１０での各対象撮像ブロックについて、平均動き量、動き量ばらつき度及び動き方向ばらつき度を求めると、領域特定部３２２は、撮像領域１０での各対象撮像ブロックについて、当該対象撮像ブロックがどのような領域であるかを特定する。図２０は、第１動き領域、第２動き領域、ノイズ領域及び背景領域と、平均動き量、動き量ばらつき度及び動き方向ばらつき度との関係を示す図である。

本実施の形態では、平均動き量に対して、２段階のしきいｔｈ１１，ｔｈ１２（ｔｈ１１＜ｔｈ１２）が準備されている。また、動き量ばらつき度に対して、２段階のしきいｔｈ２１，ｔｈ２２（ｔｈ２１＜ｔｈ２２）が準備されている。そして、動き方向ばらつき度に対して、２段階のしきいｔｈ３１，ｔｈ３２（ｔｈ３１＜ｔｈ３２）が準備されている。

領域特定部３２２は、対象撮像ブロックについて、平均動き量がしきい値ｔｈ１１以下であって、動き量ばらつき度がしきい値ｔｈ２１以下であって、動き方向ばらつき度がしきい値ｔｈ３１以下である場合には、対象撮像ブロックが背景領域であると判定する。つまり、領域特定部３２２は、対象撮像ブロックについて、平均動き量、動き量ばらつき度及び動き方向ばらつき度のすべてがかなり小さい場合には、対象撮像ブロックが、状態がほとんど変化しない背景領域であると判定する。

領域特定部３２２は、対象撮像ブロックについて、平均動き量がしきい値ｔｈ１１よりも大きくかつしきい値ｔｈ１２以下であって、動き量ばらつき度がしきい値ｔｈ２１よりも大きくかつしきい値ｔｈ２２以下であって、動き方向ばらつき度がしきい値ｔｈ３１よりも大きくかつしきい値ｔｈ３２以下である場合には、対象撮像ブロックが第１動き領域であると判定する。つまり、領域特定部３２２は、対象撮像ブロックについて、平均動き量、動き量ばらつき度及び動き方向ばらつき度のすべてがある程度小さい場合には、対象撮像ブロックが、動体が動く領域であってかつ動体の動き量が小さい第１動き領域であると判定する。

領域特定部３２２は、対象撮像ブロックについて、平均動き量がしきい値ｔｈ１２よりも大きく、動き量ばらつき度がしきい値ｔｈ２１よりも大きくかつしきい値ｔｈ２２以下であって、動き方向ばらつき度がしきい値ｔｈ３１よりも大きくかつしきい値ｔｈ３２以下である場合には、対象撮像ブロックが第２動き領域であると判定する。つまり、領域特定部３２２は、対象撮像ブロックについて、平均動き量が大きく、動き量ばらつき度及び動き方向ばらつき度のそれぞれがある程度小さい場合には、対象撮像ブロックが、動体が動く領域であってかつ動体の動き量が大きい第２動き領域であると判定する。

領域特定部３２２は、対象撮像ブロックについて、動き量ばらつき度がしきい値ｔｈ２２よりも大きく、動き方向ばらつき度がしきい値ｔｈ３２よりも大きい場合には、対象撮像ブロックがノイズ領域であると判定する。つまり、領域特定部３２２は、対象撮像ブロックについて、平均動き量の大きさにかかわらず、動き量ばらつき度及び動き方向ばらつき度のそれぞれが大きい場合には、対象撮像ブロックが、状態が不規則に変化するノイズ領域であると判定する。

なお、領域特定部３２２は、対象撮像ブロックが、第１動き領域、第２動き領域、ノイズ領域及び背景領域のいずれにも該当しない場合には、対象撮像ブロックを不明領域とする。

領域特定部３２２は、このようにして、撮像領域１０での各対象撮像ブロックについて、当該対象撮像ブロックがどのような領域であるかを特定する。領域特定部３２２において、撮像領域１０での各対象撮像ブロックがどのような領域であるかが特定されると、ステップｓ１３２の領域判定処理が終了し、その後、上述のステップｓ１３３において、特定された領域ごとに個別に検出感度が調整される。

このように、本実施の形態では、撮像領域１０での複数の対象撮像ブロックについての平均動き量、動き量ばらつき度及び動き方向ばらつき度に基づいて、撮像領域１０において、第１動き領域、第２動き領域、ノイズ領域及び背景領域が特定されていることから、第１動き領域、第２動き領域、ノイズ領域及び背景領域を精度良く特定することができる。よって、動体検出の検出感度を適切に設定することができ、その結果、動体検出の検出精度が向上する。特に、本実施の形態では、状態が不規則に変化するノイズ領域を精度良く特定することができることから、撮像領域１０において、カーテンの揺れ、あるいは表示装置の画面に映る映像の変化などが生じる場合であっても、そのような局所的なノイズの影響を受けることなく動体を適切に検出することができる。

本実施の形態では、動き量ばらつき度及び動き方向ばらつき度が使用されているが、動き量ばらつき度及び動き方向ばらつき度のどちらか一方だけが使用されても良い。つまり、平均動き量と、動き量ばらつき度及び動き方向ばらつき度の少なくとも一方とを用いて、撮像領域１０において、第１動き領域、第２動き領域、ノイズ領域及び背景領域を特定しても良い。本実施の形態のように、動き量ばらつき度及び動き方向ばらつき度の両方が使用される場合には、第１動き領域、第２動き領域、ノイズ領域及び背景領域を精度良く特定することができる。

また、撮像領域１０において、ノイズ領域は必ずしも特定しなくても良く、背景領域は必ずしも特定しなくても良い。つまり、撮像領域１０において、第１及び第２動き領域だけを特定しても良いし、第１動き領域、第２動き領域及びノイズ領域だけを特定しても良いし、第１動き領域、第２動き領域及び背景領域だけを特定しても良い。平均動き量だけでも第１動き領域、第２動き領域及び背景領域をある程度は特定することができることから、撮像領域１０において、第１及び第２動き領域だけが特定される場合、第１動き領域、第２動き領域及び背景領域だけが特定される場合には、動き量ばらつき度及び動き方向ばらつき度は使用されなくても良い。

＜各種変形例＞
＜第１変形例＞
上記の例のように、動き方向ヒストグラムが生成される際に、０°〜３６０°の範囲が複数の部分範囲に区分され、各部分範囲を動き方向ヒストグラムの階級とされる場合には、例えば、３０°の方向を向く動きベクトルと、２１０°の方向を向く動きベクトルとは区別されることになる。したがって、人が通る通路のように、撮像領域１０における、動体が直線的に往復するような領域についての動き方向ばらつき度は大きくなってしまう。その結果、撮像環境によっては、撮像領域１０において、動体が動く第１及び第２動き領域が特定しにくくなる可能性がある。

そこで、本変形例では、０°〜１８０°の範囲を複数の部分範囲に区分し（例えば３０°ごとに区分し）、各部分範囲を動き方向ヒストグラムの階級とする。そして、以下の式（９）を使用して、動きベクトルから動体の動き方向ＭＤを求める。

式（９）に示されるように、動きベクトルの方向ＶＤが０°以上１８０°以下であれば、当該動きベクトルに対応する動体の動き方向は、当該動きベクトルの方向ＶＤと一致する。一方で、動きベクトルの方向ＶＤが１８０°よりも大きく３６０°未満であれば、当該動きベクトルに対応する動体の動き方向は、当該動きベクトルの方向ＶＤから１８０°を差し引いて得られる値となる。これにより、動体が直線的に往復するような領域についての動き方向ばらつき度が大きくなることを抑制することができる。よって、第１及び第２動き領域が特定しやすくなる。

＜第２変形例＞
上記の例では、動き方向ヒストグラムのエントロピーが動き方向ばらつき度とされていたが、他の方法で動き方向ばらつき度が求められても良い。以下に、動き方向ばらつき度の他の求め方について説明する。

評価値取得部３２１は、まず、対象撮像ブロックに対応付けられている複数の動きベクトル（ただし、最も前に求められた動きベクトルを除く）のそれぞれを第１動きベクトルとする。そして、評価値取得部３２１は、各第１動きベクトルについて、対象撮像ブロックに対応付けられている複数の動きベクトルに含まれる、当該第１動きベクトルよりも前であって直近で求められた動きベクトルを、当該第１動きベクトルと対を成す第２動きベクトルとする。これにより、第１動きベクトルと第２動きベクトルとの組が複数組得られる。評価値取得部３２１は、第１及び第２動きベクトルの各組について、第１動きベクトルと、それと対を成す第２動きベクトルとのコサイン類似度Ｚを求める。第１動きベクトルをｚ１とし、それと対を成す第２動きベクトルをｚ２とすると、それらのコサイン類似度Ｚは以下の式（１０）を用いて求めることができる。なお、式（１０）中のθは、第１動きベクトルｚ１と第２動きベクトルｚ２との成す角度を示している。

評価値取得部３２１は、第１及び第２動きベクトルの各組について、第１動きベクトルと、それと対を成す第２動きベクトルとのコサイン類似度Ｚを求めると、求めた複数のコサイン類似度Ｚの平均値を求める。そして、評価値取得部３２１は、求めた平均値を動き方向ばらつき度とする。

このように、コサイン類似度Ｚの平均値を動き方向ばらつき度として採用する場合には、動き方向ヒストグラムのエントロピーを動き方向ばらつき度として採用する場合よりも、動き方向ばらつき度を求める際の処理量（演算量）を低減することができる。

ただし、コサイン類似度Ｚの算出には、互いに近いタイミングで求められた２つの動きベクトルが使用されることから、コサイン類似度Ｚの平均値を動き方向ばらつき度として採用した場合には、動きベクトルの角度が徐々に変化して、動体の動き方向がばらつくような撮像環境においては、動き方向ばらつき度は小さい値となってしまう。したがって、このような撮像環境においては、撮像領域１０においてノイズ領域が特定されにくくなる。動き方向ばらつき度として、コサイン類似度Ｚの平均値を採用するのか、動き方向ヒストグラムのエントロピーを採用するのかについては、動体検出について要求される精度と、許容される処理量とに基づいて適宜決定される。

＜第３変形例＞
上記の例では、Ｎフレーム目の入力画像２００の動体画像領域６００と、当該動体画像領域６００と対応付けられた、（Ｎ−１）フレーム目の入力画像２００の動体画像領域６１０とから求められたＮフレーム目の動きベクトル６２０が、当該動体画像領域６００を構成する複数の動体画像ブロックにそれぞれ対応する複数の撮像ブロックに対して対応付けられていたが、撮像ブロックに対しては他の方向で動きベクトルを対応付けても良い。

例えば、動きベクトル取得部３２０は、Ｎフレーム目の動体画像領域の動きベクトルを求めると、当該動きベクトルを、当該Ｎフレーム目の動体画像領域に対応付けられた（Ｎ−１）フレーム目の動体画像領域の動きベクトルと対応付ける。（Ｎ−１）フレーム目の動体画像領域の動きベクトルは、（Ｎ−１）フレーム目の入力画像２００に対する処理において、当該（Ｎ−１）フレーム目の動体画像領域に対応付けられた（Ｎ−２）フレーム目の動体画像領域の動きベクトルと対応付けられている。これより、Ｎフレーム目の動体画像領域の動きベクトルは、（Ｎ−１）フレーム目以前の複数枚の入力画像２００にそれぞれ含まれる複数の動体画像領域の動きベクトルと直接的にあるいは間接的に対応付けられる。動きベクトル取得部３２０は、Ｎフレーム目の動体画像領域の動きベクトルと、当該動きベクトルに対応付けられている、（Ｎ−１）フレーム目から（Ｎ−Ｍ）フレーム目までの動きベクトルとを、当該動体画像領域を構成する複数の画像ブロックにそれぞれ対応する複数の撮像ブロックに対して対応付ける。動きベクトル取得部３２０は、この処理を、Ｎフレーム目の入力画像２００に含まれる各動体画像領域について行う。

このようにして動きベクトルを撮像ブロックに対応付ける場合であっても、上記と同様にして、動きベクトルを使用して、撮像領域１０において第１動き領域及び第２動き領域等を特定することができる。

＜第４変形例＞
日照変化あるいは照明変化などによって、撮像領域１０での明るさが急に変化すると、入力画像２００の画像情報が急に変化する。したがって、入力画像２００に含まれる、背景を示す画像が動体画像であると誤って判定されて、当該背景を示す画像の画像情報がキャッシュモデルに登録されることがある。このような場合、背景モデル更新処理で使用される登録判定期間が長いと、キャッシュモデル内の背景の画像情報が長時間背景モデル５００に反映されなくなる。その結果、動体検出の精度が劣化する可能性がある。

そこで、本変形例では、判定期間調整部３３１が、ステップｓ１２とステップｓ１３との間において、登録判定期間の初期値の調整を行う。具体的には、判定期間調整部３３１は、登録判定期間の初期値を、ステップｓ１１で入力された処理対象の入力画像２００中の動体領域（動体検出部３１で動体画像であると判定された領域）の割合が大きいほど小さくする。これにより、入力画像２００中の動体領域の割合が大きい場合には、ステップｓ１４での背景モデル更新処理で使用される登録判定期間が短くなる。撮像領域１０での明るさが急に変化すると、入力画像２００全体で画像情報が急に変化することから、入力画像２００での動体領域の割合が大きくなる。よって、撮像領域１０での明るさが急に変化すると、背景モデル更新処理で使用される登録判定期間が短くなる。その結果、キャッシュモデル内の背景の画像情報をすぐに背景モデルに反映することが可能となり、動体検出の精度が向上する。

本変形例では、登録判定期間の初期値Ｄｔは、入力画像２００中の動体領域の割合をＲｄとすると、以下の式（１１）で表される。

ここで式（１１）中のａはしきい値であって、Ｄｉは定数である。

式（１１）で表される、初期値Ｄｔと入力画像２００中の動体領域の割合Ｒｄとの関係を図示すると図２１のようになる。図２１にも示されるように、式（１１）によれば、入力画像２００中の動体領域の割合Ｒｄが大きくなるほど、登録判定期間の初期値Ｄｔが小さくなる。特に、入力画像２００中の動体領域の割合Ｒｄが固定のしきい値ａを超えた場合、登録判定期間の初期値が例えば「１０」となる。つまり、登録判定期間の初期値は、１０フレーム分の入力画像２００が入力される期間となる。

なお、しきい値ａは、入力画像２００の何パーセント以上の領域が動体画像であると判定されると異常と考えられるか（撮像領域１０での明るさが急に変化した状態と考えられるか）という基準に基づいて予め設定される値であり、撮像領域１０での被写体に応じて設定されることになる。

また、入力画像２００中の動体領域の割合Ｒｄは、動体領域の画素数をＰｄ、入力画像２００の全画素数をＰaとすると、以下の式（１２）で表される。

動体領域の画素数Ｐｄは、動体画像である画像ブロックの数に、１つの画像ブロックに含まれる画素数を乗じることによって得ることができる。

＜その他の変形例＞
上記の例では、画像ブロックの大きさを、３画素×３画素としていたが、これに限定されず、画像ブロックの大きさは、４画素×４画素、または５画素×５画素としてもよい。

また、上記の例では、ある画像ブロックについてのコードワードＣＷには、当該ある画像ブロック内の全ての画素の画素値が画像情報として含まれている場合を例示したが、これに限定されず、コードワードＣＷには、画像情報として画像ブロック内の全ての画素の画素値が含まれていなくてもよい。具体的には、画像ブロックの大きさが、３画素×３画素であった場合、コードワードＣＷには、５画素分の画素値が画像情報として含まれていてもよい。このように、コードワードＣＷ内の情報量を減らすことによって、処理量を低減することができるので、動体検出処理を高速化することができる。

また、上記の例では、入力画像２００中の各画素が、Ｒ（赤）、Ｇ（緑）及びＢ（青）のそれぞれの画素値を有している場合を想定していたが、これに限定されない。具体的には、入力画像２００中の各画素の画素値は、ＲＧＢ以外の他の色空間を用いて表されていてもよい。例えば、入力画像２００がＹＵＶ形式の画像データである場合、輝度信号Ｙ並びに２つの色差信号Ｕ，Ｖが、各画素の画素値として用いられることになる。

以上のように、動体検出装置１は詳細に説明されたが、上記した説明は、全ての局面において例示であって、この発明がそれに限定されるものではない。また、上述した各種変形例は、相互に矛盾しない限り組み合わせて適用可能である。そして、例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。

１動体検出装置
５背景モデル記憶部
６キャッシュモデル記憶部
３１動体検出部
３２特定部
３３感度調整部
３４背景モデル更新部
３１１制御プログラム
３２０動きベクトル取得部
３２１評価値取得部
３２２領域特定部

Claims

入力画像に対して動体検出を行う動体検出部と、
入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う特定部と、
前記動体検出の検出感度を調整する感度調整を行う感度調整部と
を備え、
前記感度調整部は、前記感度調整において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くする、動体検出装置。
請求項１に記載の動体検出装置であって、
前記特定部は、前記特定処理において、前記撮像領域において前記第１及び第２動き領域よりも状態変化が小さい背景領域も特定し、
前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる前記第１及び第２動き領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記背景領域の画像である背景領域画像に対する前記動体検出の検出感度よりも高くする、動体検出装置。
請求項２に記載の動体検出装置であって、
前記特定部は、前記特定処理において、前記撮像領域において不規則に状態が変化するノイズ領域も特定し、
前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記ノイズ領域の画像であるノイズ領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる前記第１動き領域画像、前記第２動き領域画像及び前記背景領域画像に対する前記動体検出の検出感度よりも低くする、動体検出装置。
請求項１に記載の動体検出装置であって、
前記特定部は、前記特定処理において、前記撮像領域において不規則に状態が変化するノイズ領域も特定し、
前記感度調整部は、前記感度調整において、前記第１入力画像に含まれる、前記少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記ノイズ領域の画像であるノイズ領域画像に対する前記動体検出の検出感度を、前記第１入力画像に含まれる前記第１及び前記第２動き領域画像に対する前記動体検出の検出感度よりも低くする、動体検出装置。
請求項１及び請求項２のいずれか一つに記載の動体検出装置であって、
前記特定部は、
前記第１入力画像よりも前に撮像された複数枚の第２入力画像に対する前記動体検出の結果に基づいて動体の動きベクトルを取得する動きベクトル取得部と、
前記動きベクトルに基づいて、前記撮像領域に含まれる複数の部分撮像領域のそれぞれについて、当該部分撮像領域での動体の平均動き量を取得する取得部と、
前記複数の部分撮像領域での前記平均動き量に基づいて前記特定処理を行う領域特定部と
を有する、動体検出装置。
請求項１乃至請求項４のいずれか一つに記載の動体検出装置であって、
前記特定部は、
前記第１入力画像よりも前に撮像された複数枚の第２入力画像に対する前記動体検出の結果に基づいて動体の動きベクトルを取得する動きベクトル取得部と、
前記動きベクトルに基づいて、前記撮像領域に含まれる複数の部分撮像領域のそれぞれについて、当該部分撮像領域での動体の平均動き量を取得するとともに、当該部分撮像領域での動体の動き量ばらつき度及び動き方向ばらつき度の少なくとも一方を取得する取得部と、
前記複数の部分撮像領域での前記平均動き量と、前記複数の部分撮像領域での前記動き量ばらつき度及び前記動き方向ばらつき度の少なくとも一方とに基づいて、前記特定処理を行う領域特定部と
を有する、動体検出装置。
請求項６に記載の動体検出装置であって、
前記領域特定部は、前記複数の部分撮像領域での前記平均動き量、前記動き量ばらつき度及び前記動き方向ばらつき度に基づいて、前記特定処理を行う、動体検出装置。
請求項１乃至請求項７のいずれか一つに記載の動体検出装置であって、
前記動体検出部は、入力画像に含まれる部分画像に対する前記動体検出において、当該部分画像が動体画像であるか否かを、調整パラメータを含む判定式を用いて判定し、
前記感度調整部は、前記感度調整において、前記判定式に含まれる前記調整パラメータを調整する、動体検出装置。
請求項１乃至請求項７のいずれか一つに記載の動体検出装置であって、
背景画像情報を含む背景モデルを記憶する第１記憶部と、
第２記憶部と、
前記背景モデルを更新する背景モデル更新部と
をさらに備え、
前記動体検出部は、入力画像に含まれる部分画像に対する前記動体検出では、当該部分画像から得られる画像情報と、前記背景モデル内の背景画像情報との比較に基づいて、当該部分画像が動体画像であるか否かを判定し、当該部分画像が動体画像であると判定すると当該画像情報を背景画像情報候補として前記第２記憶部に記憶し、
前記背景モデル更新部は、判定期間において入力される複数枚の入力画像に基づいて、前記第２記憶部に記憶された背景画像情報候補を背景画像情報として前記背景モデルに登録するか否かを判定し、
前記感度調整部は、前記感度調整において、前記判定期間を調整する、動体検出装置。
（ａ）入力画像に対して動体検出を行う工程と、
（ｂ）入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う工程と、
（ｃ）前記動体検出の検出感度を調整する工程と
を備え、
前記工程（ｃ）において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くする、動体検出方法。
入力画像に対して動体検出を行う動体検出装置を制御するための制御プログラムであって、
前記動体検出装置に、
（ａ）入力画像に写る撮像領域において、検出対象の動体が動く第１動き領域と、検出対象の動体が動く領域であって、当該第１動き領域よりも動体の動き量が大きい第２動き領域とを特定する特定処理を、前記動体検出の結果に基づいて行う工程と、
（ｃ）前記動体検出の検出感度を調整する工程と
を実行させ、
前記工程（ｃ）において、第１入力画像に含まれる、当該第１入力画像よりも前に撮像された少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第１動き領域の画像である第１動き領域画像に対する前記動体検出の検出感度を、当該第１入力画像に含まれる、当該少なくとも一つの第２入力画像に対する前記動体検出の結果に基づいて特定された前記第２動き領域の画像である第２動き領域画像に対する前記動体検出の検出感度よりも高くすることを実行させるための制御プログラム。