JPWO2016143067A1

JPWO2016143067A1 - 映像解析装置

Info

Publication number: JPWO2016143067A1
Application number: JP2017504482A
Authority: JP
Inventors: 洋平板谷
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2015-03-10
Filing date: 2015-03-10
Publication date: 2017-06-29
Anticipated expiration: 2035-03-10
Also published as: WO2016143067A1; JP6415689B2

Abstract

動体領域検出部（３３０）は、映像データ（１１９）が表す映像を分割した複数のブロックのブロック毎に、周波数成分別の離散コサイン変換係数を取得する。動体領域検出部は、複数のブロックから、周波数閾値より大きい高周波数の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックを、動体が映っている動体ブロックとして特定する。動体領域検出部は、動体ブロックを含んだ動体領域を映像から検出する。

Description

本発明は、映像に映った動体を検出する技術に関するものである。

監視カメラから得られる映像データは、非圧縮の状態ではデータサイズが非常に大きい。そのため、映像データの蓄積に必要なハードディスク容量が増加する。
そこで、ＭＰＥＧ−４およびＨ．２６４等に代表される符号化アルゴリズムによって映像データは符号化される。そして、符号化によってデータサイズが削減された映像データがハードディスクに蓄積される。

しかし、符号化された状態の映像データから符号化前の情報を参照することはできない。そのため、符号化された映像データを復号する必要がある。例えば、コンピュータで映像を再生する際に、画像再生ツールによって復号処理が実施される。

監視者は、再生された映像を目視することよって、映像に映った動体を検出する。人物、動物および自動車は動体の一例である。
しかし、長期間に渡って映像データが蓄積された場合、動体を目視によって検出することは効率が悪く、現実的でない。

特許文献１は、符号化された映像データを復号する復号処理、および、監視対象を検索するための画像解析処理を演算装置で行う技術を開示している。
しかし、監視対象の検索に至るまでの効率が悪い。また、画像解析処理の処理量が非常に多いため、高機能な演算装置が必要になる。

特開２００３−２０４５４１号公報

本発明は、動体が映っている動体ブロックを映像データから特定できるようにすることを目的とする。

本発明の映像解析装置は、
映像データが表す映像を分割した複数のブロックのブロック毎に、周波数成分別の離散コサイン変換係数を取得するパラメータ取得部と、
前記複数のブロックから、周波数閾値より大きい高周波数の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックを、動体が映っている動体ブロックとして特定する動体ブロック特定部とを備える。

本発明によれば、動体が映っている動体ブロックを映像データから特定することができる。

実施の形態１における監視システム１００の構成図。実施の形態１における蓄積サーバ１２０の機能構成図。実施の形態１における監視カメラ１１０の機能構成図。実施の形態１における映像符号化装置２００の機能構成図。実施の形態１における映像解析装置３００の機能構成図。実施の形態１における解析実施判定部３２０の機能構成図。実施の形態１における動体領域検出部３３０の機能構成図。実施の形態１における対象体検出部３４０の機能構成図。実施の形態１における符号化パラメータ１３３の構成図。実施の形態１における監視カメラ１１０と被写体１０２との関係図。実施の形態１における映像１０３の領域と被写体領域１０４との関係図。実施の形態１におけるモデルデータベース４００の構成図。実施の形態１における映像解析装置３００および映像符号化装置２００のハードウェア構成図。実施の形態１における映像符号化方法のフローチャート。実施の形態１における映像解析方法のフローチャート。実施の形態１における解析実施判定処理（Ｓ２３０）のフローチャート。実施の形態１における動体領域検出処理（Ｓ２４０）のフローチャート。実施の形態１における動体領域特定処理（Ｓ２４７）のフローチャート。実施の形態１における対象体検出処理（Ｓ２５０）のフローチャート。実施の形態１における対象体検出処理（Ｓ２５０）のフローチャート。実施の形態２における監視システム１００の構成図。実施の形態２における監視カメラ１１０およびモデルサーバ１５０の機能構成図。

実施の形態１．
動体を監視する監視システム１００について、図１から図２０に基づいて説明する。

＊＊＊構成の説明＊＊＊
図１に基づいて、監視システム１００の構成について説明する。
監視システム１００は、監視空間１０１を監視するためのシステムである。
監視システム１００は、監視カメラ１１０と、蓄積サーバ１２０とを備える。
監視カメラ１１０は、監視空間１０１の斜め上方に設置されており、監視空間１０１を連続して撮影し、撮影毎に映像データを生成する。そして、監視カメラ１１０は、撮影毎に、映像データを用いて、符号化データ１３０と解析結果データ１４０とを生成する。
蓄積サーバ１２０は、撮影毎に、符号化データ１３０と解析結果データ１４０とを蓄積する。

映像データは監視空間１０１を映した映像を表す。映像は複数の画素を備え、それぞれの画素は色情報を有する。映像は連続した画像から成り、画像はフレームともいう。映像データは画像データまたはフレームデータともいう。色情報はＲＧＢ（Ｒｅｄ、Ｇｒｅｅｎ、Ｂｌｕｅ）形式で表される。
符号化データ１３０は符号化した映像を表す。
解析結果データ１４０は、監視空間１０１の映像に映った対象体に関する情報を含む。対象体は、検出する対象の動体である。

図２に基づいて、蓄積サーバ１２０の機能構成について説明する。
蓄積サーバ１２０は、データ受信部１２１と、符号化データ管理部１２２と、解析結果データ管理部１２３と、サーバ記憶部１２９とを備える。
データ受信部１２１は、監視カメラ１１０から送信される符号化データ１３０と解析結果データ１４０とを受信する。
符号化データ管理部１２２は、符号化データ１３０を時系列にサーバ記憶部１２９に蓄積する。
解析結果データ管理部１２３は、解析結果データ１４０を時系列にサーバ記憶部１２９に蓄積する。
サーバ記憶部１２９は、符号化データ１３０と解析結果データ１４０とを時系列に蓄積する。

解析結果データ管理部１２３は、解析結果データ１４０を符号化データ１３０に対応付けた解析結果テーブルを生成し、解析結果テーブルをサーバ記憶部１２９に記憶してもよい。
監視者は、解析結果データを参照することによって、符号化データ１３０が表す映像の解析結果データ１４０を検索することができる。

図３に基づいて、監視カメラ１１０の機能構成について説明する。
監視カメラ１１０は、データ受信部１１１と、映像符号化装置２００と、映像解析装置３００と、データ送信部１１２と、符号化データ記憶部１１３と、モデル記憶部１１４とを備える。なお、監視カメラ１１０は、ハードウェアである撮像素子を備える。撮像素子はイメージセンサともいう。
データ受信部１１１は、撮像素子から出力される映像データ１１９を受信する。
映像符号化装置２００は、映像データ１１９を用いて、符号化データ１３０と、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２とを生成する。ＤＣＴは離散コサイン変換の略称である。ＤＣＴ係数データ１３１と動きベクトルデータ１３２とについては後述する。
映像解析装置３００は、映像データ１１９と、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２と、モデルデータベース４００とを用いて、解析結果データ１４０を生成する。モデルデータベース４００については後述する。

符号化データ記憶部１１３は、符号化データ１３０と、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２とを記憶する。
ＤＣＴ係数データ１３１は、映像データ１１９が表す映像を分割した複数のブロックのブロック毎に、周波数成分別の離散コサイン変換係数を含む。ブロックはマクロブロックともいう。周波数成分は空間周波数成分ともいう。
動きベクトルデータ１３２は、映像データ１１９が表す映像を分割した複数のブロックのブロック毎に、動きベクトルを含む。動きベクトルは、ブロックに映っている被写体の動きを表す。

モデル記憶部１１４は、モデルデータベース４００を記憶する。
モデルデータベース４００は、映像データ１１９が表す映像を垂直方向に分割して得られる複数の分割領域のそれぞれに、異なる対象体モデルを対応付ける。対象体モデルは対象体の特徴を表すデータである。垂直方向は映像の縦方向を意味する。
モデルデータベース４００に含まれるそれぞれの対象体モデルは、サイズの範囲を示すサイズ情報を含む。
モデルデータベース４００に含まれるそれぞれの対象体モデルは、サイズ以外の特徴を表す特徴情報を含む。

図４に基づいて、映像符号化装置２００の機能構成について説明する。
映像符号化装置２００は、映像データ受付部２１０と、動きベクトル算出部２２０と、動き補償予測部２３０と、差分算出部２３１と、重ね合わせ部２３２と、前回データ記憶部２９０とを備える。
映像符号化装置２００は、ＤＣＴ部２４０と、量子化部２４１と、エントロピー符号化部２４２と、逆量子化部２４３と、逆ＤＣＴ部２４４とを備える。
映像符号化装置２００は、符号化データ管理部２５０を備える。

映像データ受付部２１０は映像データ１１９を受け付ける。
動きベクトル算出部２２０は、映像データ１１９と前回データ２９１とを用いて、動きベクトルデータ１３２を生成する。前回データ２９１は前回の映像を表す。
動き補償予測部２３０は、動きベクトルデータ１３２と前回データ２９１とを用いて、予測データ２３９を生成する。予測データ２３９は予測により生成される映像データである。

差分算出部２３１は、映像データ１１９と予測データ２３９とを用いて、差分データ２３８を生成する。差分データ２３８は、映像データ１１９が表す今回の映像と予測データ２３９が表す予測の映像との差分を表す。
重ね合わせ部２３２は、予測データ２３９と差分データ２４７とを用いて、今回の映像を表す映像データを生成する。生成された映像データは、次の映像データ１１９が受け付けられた際に、前回データ２９１として用いられる。
前回データ記憶部２９０は、前回データ２９１を記憶する。

ＤＣＴ部２４０は、差分データ２３８に対して離散コサイン変換（ＤＣＴ）を行い、ＤＣＴ係数データ１３１を生成する。
量子化部２４１は、ＤＣＴ係数データ１３１に対して量子化を行い、量子化係数データ２４９を生成する。量子化係数データ２４９は、映像のブロック毎に、周波数成分別の量子化係数を含む。量子化係数は量子化したＤＣＴ係数である。
エントロピー符号化部２４２は、量子化係数データ２４９に対してエントロピー符号化を行い、符号化データ１３０を生成する。

逆量子化部２４３は、量子化係数データ２４９に対して逆量子化を行い、ＤＣＴ係数データ２４８を生成する。ＤＣＴ係数データ２４８は周波数成分別のＤＣＴ係数を含む。
逆ＤＣＴ部２４４は、ＤＣＴ係数データ２４８に対して逆ＤＣＴ行い、差分データ２４７を生成する。差分データ２４７は今回の映像と予測の映像との差分を表す。

符号化データ管理部２５０は、符号化データ１３０と、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２とを、監視カメラ１１０の符号化データ記憶部１１３に記憶する。これらのデータを符号化データ記憶部１１３に記憶した後、符号化データ管理部２５０は完了通知を出力する。

図５に基づいて、映像解析装置３００の機能構成について説明する。
映像解析装置３００は、映像データ受付部３１０と、完了通知受付部３１１と、解析実施判定部３２０と、映像データ記憶部３９０とを備える。
映像解析装置３００は、動体領域検出部３３０と、対象体検出部３４０と、色情報生成部３５０と、解析結果生成部３６０とを備える。

映像データ受付部３１０は映像データ１１９を受け付ける。
第１の映像を表す映像データを第１の映像データといい、第２の映像を表す映像データを第２の映像データという。第２の映像は、第１の映像が撮影された時刻とは異なる時刻に撮影された映像である。
実施の形態１において、第１の映像データは映像データ１１９であり、第２の映像データは前回データ１１８である。前回データ１１８は、前回受け付けられた映像データ１１９である。

映像データ記憶部３９０は、映像データ１１９と、前回データ１１８とを記憶する。

完了通知受付部３１１は、映像符号化装置２００から出力される完了通知を受け付ける。

解析実施判定部３２０は、映像データ１１９と前回データ１１８とに基づいて、映像解析を実施するか判定する。
映像解析を実施すると判定された場合、動体領域検出部３３０、対象体検出部３４０、色情報生成部３５０および解析結果生成部３６０が動作する。

動体領域検出部３３０は、映像データ１１９を用いて、動体領域を表す動体領域データ３３９を生成する。動体領域は、映像データ１１９が表す映像の中で動体が映っている領域である。

対象体検出部３４０は、動体領域データ３３９を用いて、対象体検出データ３４９を生成する。
対象体検出データ３４９は、対象体領域の範囲を示す領域情報を含む。対象体領域は、対象体が映っている動体領域である。

色情報生成部３５０は、対象体検出データ３４９を用いて、色情報データ３５９を生成する。
色情報データ３５９は、対象体の特徴を表す色情報を含む。動体領域に映っている動体が対象体であると判定された場合、動体領域を構成する各画素の色情報に基づいて、色情報が生成される。

解析結果生成部３６０は、対象体検出データ３４９と色情報データ３５９とを用いて、解析結果データ１４０を生成する。
解析結果データ１４０は、対象体領域の範囲を示す領域情報と、対象体の色の特徴を表す色情報とを含む。

図６に基づいて、解析実施判定部３２０の機能構成について説明する。
解析実施判定部３２０は、変化量算出部３２１と、変化量判定部３２２と、解析指示部３２３とを備える。

変化量算出部３２１は、第１の映像を構成する各画素の画素値と、第２の映像を構成する各画素の画素値とに基づいて、第１の映像と第２の映像との変化量３２９を算出する。

変化量判定部３２２は、変化量３２９が変化量閾値より大きいか判定する。変化量閾値は利用者によって設定される。

解析指示部３２３は、変化量３２９が変化量閾値より大きい場合、動体領域検出部３３０に映像解析の開始を指示する。

図７に基づいて、動体領域検出部３３０の機能構成について説明する。
動体領域検出部３３０は、パラメータ取得部３３１と、動体ブロック特定部３３２と、動体領域特定部３３３とを備える。

パラメータ取得部３３１は、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２とを取得する。

動体ブロック特定部３３２は、ＤＣＴ係数データ１３１と動きベクトルデータ１３２とを用いて、動体ブロックデータ３３８を生成する。
動体ブロックデータ３３８は、動体が映っている動体ブロックの位置を示す。
動体ブロックは、今回の映像を分割した複数のブロックから特定されるブロックである。実施の形態１において、１つ以上の動体ブロックが特定される。
動体ブロックとして特定されるブロックは、高周波数の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックである。高周波数は周波数閾値よりも高い周波数である。周波数閾値は利用者によって設定される。

実施の形態１において、動体ブロックとして特定されるブロックは、高周波の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックのうち、動きベクトルの大きさが動き閾値以上であるブロックである。動き閾値は利用者によって設定される。

動体領域特定部３３３は、動体ブロックデータ３３８を用いて、動体領域を示す動体領域データ３３９を生成する。
動体領域は、１つ以上の動体ブロックそれぞれのブロック位置に基づいて、今回の映像から特定される領域である。
動体領域として特定される領域は、少なくとも１つの動体ブロックを含んだ領域である。

１つ以上の動体ブロックのうちの第１の動体ブロックに隣接するいずれのブロックも動体ブロックでない場合、第１の動体ブロックを含んだ第１の動体領域は、第１の動体ブロックである。
第１の動体ブロックに隣接するブロックのいずれかが１つ以上の動体ブロックのうちの第２の動体ブロックである場合、第１の動体領域は、第１の動体ブロックと第２の動体ブロックとを含んだ矩形領域である。
第２の動体ブロックに隣接するブロックのいずれかが１つ以上の動体ブロックのうちの第３の動体ブロックである場合、第１の動体領域は、第１の動体ブロックと第２の動体ブロックと第３の動体ブロックとを含んだ矩形領域である。

図８に基づいて、対象体検出部３４０の機能構成について説明する。
対象体検出部３４０は、モデル取得部３４１と、動体判定部３４２とを備える。

モデル取得部３４１は、動体領域データ３３９に基づいて、モデルデータベース４００から照合モデル３４８を取得する。
照合モデル３４８は、モデルデータベース４００に含まれる対象体モデルのうち、動体領域が属する分割領域に対応付いた対象体モデルである。

動体判定部３４２は、動体領域データ３３９と照合モデル３４８とに基づいて、動体領域に映っている動体が対象体であるか判定する。
動体判定部３４２は、照合モデル３４８に含まれるサイズ情報が示す範囲に動体領域のサイズが含まれることを条件として、動体領域に映っている動体が対象体であると判定する。
動体判定部３４２は、照合モデル３４８に含まれる特徴情報が表す特徴と動体領域の特徴との類似度が類似度閾値よりも高いことを条件として、動体領域に映っている動体が対象体であると判定する。類似度閾値は利用者によって設定される。

図９に基づいて、符号化パラメータ１３３の構成について説明する。
符号化パラメータ１３３は、動きベクトルデータ１３２と、符号化パラメータ１３３とを含む。
動きベクトルデータ１３２は、映像を分割したマクロブロックそれぞれの動きベクトルを含んでいる。１つのマクロブロックはｎ×ｎ画素の領域である。例えば、１つのマクロブロックは１６×１６画素の領域である。
ＤＣＴ係数データ１３１は、マクロブロック毎に、８×８個の周波数成分それぞれのＤＣＴ係数を含んでいる。

図１０に基づいて、監視カメラ１１０と被写体１０２との関係について説明する。
被写体１０２Ａ〜１０２Ｄは、監視カメラ１１０に近いほど大きく映り、監視カメラ１１０から遠いほど小さく映る。
図において、被写体１０２Ａ、被写体１０２Ｂ、被写体１０２Ｃ、被写体１０２Ｄの順に大きく映る。

図１１に基づいて、映像１０３の領域について説明する。
映像１０３を垂直方向に分割した場合、監視カメラ１１０に近い被写体は下段の分割領域に大きく映り、監視カメラ１１０から遠い被写体は上段の分割領域に小さく映る。垂直方向は縦方向を意味する。
実施の形態１において、映像１０３は３つの分割領域に分割される。３つの分割領域のうち、下段の分割領域は第１領域であり、中段の分割領域は第２領域であり、上段の分割領域は第３領域である。下段の分割領域ほど縦方向のサイズが大きい。
図において、各被写体領域１０４Ａ〜１０４Ｅは被写体が映っている矩形領域である。第１領域にある被写体領域１０４Ａおよび被写体領域１０４Ｂは大きく、第３領域にある被写体領域１０４Ｅは小さい。被写体領域１０４Ｃは第１領域と第２領域とにまたがっている。

図１２に基づいて、モデルデータベース４００の構成について説明する。
モデルデータベース４００は、第１領域データベース４１０と、第２領域データベース４２０と、第３領域データベース４３０とを備える。第１領域データベース４１０は第１領域用のモデルデータベースであり、第２領域データベース４２０は第２領域用のデータベースであり、第３領域データベース４３０は第３領域用のデータベースである。
各データベースは、複数の対象体それぞれの対象体モデルを備える。第１領域データベース４１０は第１の対象体モデル４１１と第２の対象体モデル４１２とを備え、第２領域データベース４２０は第１の対象体モデル４２１と第２の対象体モデル４２２とを備える。第３領域データベース４３０も同様である。対象体モデルは機械学習によって構築される学習モデルである。
各対象体モデルは、サイズ情報と特徴情報と対象体識別子とを含む。対象体識別子は対象体を識別する。対象体の種別および名称は対象体識別子の一例である。第１の対象体モデル４１１は、サイズ情報４１１Ａと特徴情報４１１Ｂと対象体識別子４１１Ｃとを含んでいる。他の対象体モデルも同様である。
サイズ情報は、対象体が映る矩形領域の大きさ（幅、高さ）の範囲を示す。
特徴情報は、対象体の大きさを除いて、対象体の特徴を表す特徴量を示す。形状及び明暗は対象体の特徴の一例である。
人物、動物および自動車は対象体の一例である。

図１３に基づいて、映像解析装置３００のハードウェア構成例について説明する。
映像解析装置３００は、プロセッサ９０１、補助記憶装置９０２、メモリ９０３、通信装置９０４、入力インタフェース９０５、出力インタフェース９０６といったハードウェアを備えるコンピュータである。
プロセッサ９０１は信号線９１０を介して他のハードウェアと接続されている。入力インタフェース９０５はケーブル９１１を介して入力装置９０７に接続されている。出力インタフェース９０６はケーブル９１２を介して出力装置９０８に接続されている。

プロセッサ９０１は、プロセッシングを行うＩＣであり、他のハードウェアを制御する。プロセッサ９０１の一例は、ＣＰＵ、ＤＳＰ、ＧＰＵである。ＩＣはＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔの略称である。ＣＰＵはＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略称であり、ＤＳＰはＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒの略称であり、ＧＰＵはＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略称である。
補助記憶装置９０２はデータを記憶する。補助記憶装置９０２の一例は、ＲＯＭ、フラッシュメモリ、ＨＤＤである。ＲＯＭはＲｅａｄＯｎｌｙＭｅｍｏｒｙの略称であり、ＨＤＤはＨａｒｄＤｉｓｋＤｒｉｖｅの略称である。
メモリ９０３はデータを記憶する。メモリ９０３の一例はＲＡＭである。ＲＡＭはＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙの略称である。
通信装置９０４は、データを受信するレシーバ９０４１と、データを送信するトランスミッタ９０４２とを備える。通信装置９０４の一例は、通信チップ、ＮＩＣである。ＮＩＣはＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄの略称である。
入力インタフェース９０５はケーブル９１１が接続されるポートであり、ポートの一例はＵＳＢ端子である。ＵＳＢはＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓの略称である。
出力インタフェース９０６はケーブル９１２が接続されるポートであり、ＵＳＢ端子およびＨＤＭＩ端子はポートの一例である。ＨＤＭＩ（登録商標）はＨｉｇｈＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅの略称である。
入力装置９０７はデータ、命令および要求を入力する。入力装置９０７の一例は、マウス、キーボード、タッチパネルである。
出力装置９０８はデータ、結果および応答を出力する。出力装置９０８の一例は、ディスプレイ、プリンタである。ディスプレイの一例はＬＣＤである。ＬＣＤはＬｉｑｕｉｄ
ＣｒｙｓｔａｌＤｉｓｐｌａｙの略称である。

補助記憶装置９０２にはＯＳが記憶されている。ＯＳはＯｐｅｒａｔｉｎｇＳｙｓｔｅｍの略称である。
また、補助記憶装置９０２には、映像解析装置３００に備わる「記憶部」を除いて、映像解析装置３００に備わる「部」の機能を実現するプログラムが記憶されている。
ＯＳの少なくとも一部はメモリ９０３にロードされ、プロセッサ９０１はＯＳを実行しながら「部」の機能を実現するプログラムを実行する。「部」の機能を実現するプログラムは、メモリ９０３にロードされ、プロセッサ９０１に読み込まれ、プロセッサ９０１によって実行される。
なお、映像解析装置３００が複数のプロセッサ９０１を備えて、複数のプロセッサ９０１が「部」の機能を実現するプログラムを連携して実行してもよい。

「部」の処理の結果を示すデータ、情報、信号値および変数値などは、メモリ９０３、補助記憶装置９０２、プロセッサ９０１内のレジスタ、または、プロセッサ９０１内のキャッシュメモリに記憶される。

「部」は「サーキットリ」で実装してもよい。「部」は「回路」、「工程」、「手順」または「処理」に読み替えてもよい。
「回路」及び「サーキットリ」は、プロセッサ９０１、ロジックＩＣ、ＧＡ、ＡＳＩＣ、ＦＰＧＡといった処理回路を包含する概念である。ＧＡはＧａｔｅＡｒｒａｙの略称であり、ＡＳＩＣはＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄ
Ｃｉｒｃｕｉｔの略称であり、ＦＰＧＡはＦｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙの略称である。

映像符号化装置２００のハードウェア構成は、映像解析装置３００のハードウェア構成と同様である。

＊＊＊動作の説明＊＊＊
映像解析装置３００の動作は映像解析方法に相当する。また、映像解析方法は映像解析プログラムの処理手順に相当する。
映像符号化装置２００の動作は映像符号化方法に相当する。また、映像符号化方法は映像符号化プログラムの処理手順に相当する。

図１４に基づいて、映像符号化方法について説明する。
Ｓ１１０は映像データ受付処理である。
Ｓ１１０において、映像データ受付部２１０は映像データ１１９を受け付ける。

Ｓ１２０は動きベクトル算出処理である。
Ｓ１２０において、動きベクトル算出部２２０は、映像データ１１９と前回データ２９１とを用いて、以下のように動きベクトルデータ１３２を生成する。
動きベクトル算出部２２０は、映像データ１１９が表す今回の映像を複数のマクロブロックに分割する。
動きベクトル算出部２２０は、マクロブロック毎に、今回の映像を前回データ２９１が表す前回の映像と比較する。
動きベクトル算出部２２０は、マクロブロック毎に、比較結果に基づいて、動きベクトルを算出する。
動きベクトル算出部２２０は、マクロブロック毎の動きベクトルを含んだ動きベクトルデータ１３２を生成する。

Ｓ１３０は動き補償予測処理である。
Ｓ１３０において、動き補償予測部２３０は、動きベクトルデータ１３２と前回データ２９１とを用いて、以下のように予測データ２３９を生成する。
動き補償予測部２３０は、前回データ２９１が表す前回の映像を複数のマクロブロックに分割する。
動き補償予測部２３０は、マクロブロック毎に、動きベクトルデータ１３２に含まれる動きベクトルに従って、前回の映像を動かす。これにより、予測の映像が生成される。
動き補償予測部２３０は、予測の映像を表す予測データ２３９を生成する。

Ｓ１３１は差分算出処理である。
Ｓ１３１において、差分算出部２３１は、映像データ１１９と予測データ２３９とを用いて、以下のように差分データ２３８を生成する。
差分算出部２３１は、映像データ１１９が表す今回の映像と予測データ２３９が表す予測の映像との差分を算出する。
差分算出部２３１は、差分の映像を表す差分データ２３８を生成する。

Ｓ１４０は離散コサイン変換処理である。
Ｓ１４０において、ＤＣＴ部２４０は、以下のようにＤＣＴ係数データ１３１を生成する。
ＤＣＴ部２４０は、差分データ２３８が表す差分の映像を複数のマクロブロックに分割する。
ＤＣＴ部２４０は、マクロブロック毎に、離散コサイン変換（ＤＣＴ）を行うことによって、周波数成分別のＤＣＴ係数を算出する。
ＤＣＴ部２４０は、マクロブロック毎に周波数成分別のＤＣＴ係数を含んだＤＣＴ係数データ１３１を生成する。

Ｓ１４１は量子化処理である。
Ｓ１４１において、量子化部２４１は、以下のように量子化係数データ２４９を生成する。量子化部２４１は、マクロブロック毎に、ＤＣＴ係数データ１３１に含まれる周波数成分別のＤＣＴ係数を量子化することによって、周波数成分別の量子化係数を算出する。
量子化部２４１は、マクロブロック毎に周波数成分別の量子化係数を含んだ量子化係数データ２４９を生成する。

Ｓ１４２はエントロピー符号化処理である。
Ｓ１４２において、エントロピー符号化部２４２は、以下のように符号化データ１３０を生成する。
エントロピー符号化部２４２は、マクロブロック毎に、量子化係数データ２４９に含まれる周波数成分別の量子化係数をエントロピー符号化することによって、周波数成分別のエントロピー符号を算出する。
エントロピー符号化部２４２は、マクロブロック毎に周波数成分別のエントロピー符号を含んだ符号化データ１３０を生成する。

Ｓ１５０は符号化データ管理処理である。
Ｓ１５０において、符号化データ管理部２５０は、符号化データ１３０と、ＤＣＴ係数データ１３１と、動きベクトルデータ１３２とを監視カメラ１１０の符号化データ記憶部１１３に記憶する。

Ｓ１６０は逆量子化処理および逆離散コサイン変換処理である。
Ｓ１６０において、逆量子化部２４３および逆ＤＣＴ部２４４は、以下のように差分データ２４７を生成する。
逆量子化部２４３は、マクロブロック毎に、量子化係数データ２４９に含まれる周波数成分別の量子化係数を逆量子化することによって、周波数成分別のＤＣＴ係数を算出する。
逆量子化部２４３は、マクロブロック毎に周波数成分別のＤＣＴ係数を含んだＤＣＴ係数データ２４８を生成する。
逆ＤＣＴ部２４４は、マクロブロック毎に、ＤＣＴ係数データ２４８に含まれる周波数成分別のＤＣＴ係数に対して逆離散コサイン変換（逆ＤＣＴ）を行う。これにより、差分の映像が生成される。
逆ＤＣＴ部２４４は、差分の映像を表す差分データ２４７を生成する。

Ｓ１７０は重ね合わせ処理である。
Ｓ１７０において、重ね合わせ部２３２は、以下のように生成した映像データを次回の映像データ１１９に対する前回データ２９１として前回データ記憶部２９０に記憶する。
重ね合わせ部２３２は、予測により生成された映像データである予測データ２３９が表す映像に、差分データ２４７が表す差分の映像を重ね合わせる。これにより、符号化後の今回の映像が生成される。
重ね合わせ部２３２は、符号化後の今回の映像を表す映像データを生成する。

図１５に基づいて、映像解析方法について説明する。
Ｓ２１０は映像データ受付処理である。
Ｓ２１０において、映像データ受付部３１０は映像データ１１９を受け付けて、映像データ１１９を映像データ記憶部３９０に記憶する。

Ｓ２２０は完了通知受付処理である。
Ｓ２２０において、完了通知受付部３１１は完了通知を受け付ける。

Ｓ２３０は解析実施判定処理である。
映像解析の指示があった場合、処理はＳ２４０に進む。
映像解析の指示がない場合、映像解析方法の処理は終了する。

図１６に基づいて、解析実施判定処理（Ｓ２３０）について説明する。
Ｓ２３１において、変化量算出部３２１は、映像データ１１９と前回データ１１８とを映像データ記憶部３９０から取得する。
映像データ１１９は今回の映像を表し、前回データ１１８は前回の映像を表す。

Ｓ２３２は変化量算出処理である。
Ｓ２３２において、変化量算出部３２１は、以下のように変化量３２９を算出する。
変化量算出部３２１は、今回の映像と前回の映像とを画素毎に比較し、画素毎に画素値の差を算出する。
変化量算出部３２１は、算出した画素値の差を合計した値を変化量３２９として算出する。

Ｓ２３３は変化量判定処理である。
Ｓ２３３において、変化量判定部３２２は、変化量３２９が変化量閾値より大きいか判定する。変化量３２９が大きい場合、動体が映像に映っている可能性が高い。
変化量３２９が変化量閾値より大きい場合、処理はＳ２３４に進む。
変化量３２９が変化量閾値より大きくない場合、解析実施判定処理（Ｓ２３０）は終了する。

Ｓ２３４は解析指示処理である。
Ｓ２３４において、解析指示部３２３は、映像解析の開始を動体領域検出部３３０に指示する。

図１５に戻り、Ｓ２４０から説明を続ける。
Ｓ２４０は動体領域検出処理である。
Ｓ２４０において、動体領域検出部３３０は動体領域データ３３９を生成する。

図１７に基づいて、動体領域検出処理（Ｓ２４０）について説明する。
Ｓ２４１はパラメータ取得処理である。
Ｓ２４１において、パラメータ取得部３３１は、ＤＣＴ係数データ１３１と動きベクトルデータ１３２とを監視カメラ１１０の符号化データ記憶部１１３から取得する。

Ｓ２４２からＳ２４６は、動体ブロック特定処理である。
Ｓ２４２において、動体ブロック特定部３３２は、ブロック位置の順番に、マクロブロックを一つ選択する。

Ｓ２４３において、動体ブロック特定部３３２は以下のように動作する。
動体ブロック特定部３３２は、選択されたマクロブロックの周波数成分別のＤＣＴ係数をＤＣＴ係数データ１３１から取得する。
動体ブロック特定部３３２は、周波数成分別のＤＣＴ係数から高周波成分のＤＣＴ係数を選択する。高周波成分は周波数閾値よりも高い周波数の周波数成分である。
動体ブロック特定部３３２は、高周波成分のＤＣＴ係数の少なくともいずれかがゼロでないか判定する。
動体が映っているマクロブロックでは、低周波数成分から高周波数成分まで、ゼロでないＤＣＴ係数が存在するためである。一方、動体が映っていないマクロブロックでは、ゼロでないＤＣＴ係数は低周波数成分には存在するが、高周波数成分には存在しない。
高周波成分のＤＣＴ係数の少なくともいずれかがゼロでない場合、処理はＳ２４４に進む。
高周波成分のＤＣＴ係数のいずれもゼロである場合、処理はＳ２４６に進む。

Ｓ２４４において、動体ブロック特定部３３２は以下のように動作する。
動体ブロック特定部３３２は、選択されたマクロブロックの動きベクトルを動きベクトルデータ１３２から取得する。
動体ブロック特定部３３２は、動きベクトルが動き閾値より大きいか判定する。動体が映っているマクロブロックでは、動きベクトルが大きいためである。
動きベクトルが動き閾値より大きい場合、処理はＳ２４５に進む。
動きベクトルが動き閾値より小さい場合、処理はＳ２４６に進む。

Ｓ２４５において、動体ブロック特定部３３２は、選択されたマクロブロックのブロック位置を動体ブロックのブロック位置として動体ブロックデータ３３８に登録する。

Ｓ２４６において、動体ブロック特定部３３２は、Ｓ２４２で選択していない未選択のマクロブロックがあるか判定する。
未選択のマクロブロックがある場合、処理はＳ２４２に戻る。
未選択のマクロブロックがない場合、処理はＳ２４７に進む。

Ｓ２４７は動体領域特定処理である。
Ｓ２４７において、動体領域特定部３３３は動体領域データ３３９を生成する。

図１８に基づいて、動体領域特定処理（Ｓ２４７）について説明する。
Ｓ２４７１において、動体領域特定部３３３は、動体ブロックデータ３３８に基づいて、ブロック位置の順番に、動体ブロックを１つ選択する。
選択された動体ブロックを含んだ動体領域が動体領域データ３３９に登録されていない場合、動体領域特定部３３３は、選択された動体ブロックを動体領域として動体領域データ３３９に登録する。動体領域の登録は、動体領域を識別する領域識別子と動体領域の範囲を示す領域情報との登録を意味する。。

Ｓ２４７２において、動体領域特定部３３３は、動体ブロックデータ３３８に基づいて、選択された動体ブロックに隣接する隣接ブロックの少なくともいずれかが動体ブロックであるか判定する。選択された動体ブロックが映像の縁部分に位置するマクロブロックでない場合、選択された動体ブロックの周囲に位置する８つのマクロブロックが隣接するマクロブロックである。
少なくともいずれかの隣接ブロックが動体ブロックである場合、処理はＳ２４７３に進む。
いずれの隣接ブロックも動体ブロックでない場合、処理はＳ２４７４に進む。

Ｓ２４７３において、動体領域特定部３３３は、選択された動体ブロックを含んだ動体領域を隣接ブロックを含んだ矩形領域に更新する。隣接ブロックは更新された動体領域の縁部分に位置する。

Ｓ２４７４において、動体領域特定部３３３は、Ｓ２４７１で選択していない未選択の動体ブロックがあるか判定する。
未選択の動体ブロックがある場合、処理はＳ２４７１に戻る。
未選択の動体ブロックがない場合、動体領域特定処理（Ｓ２４７）は終了する。

図１５に戻り、Ｓ２５０から説明を続ける。
Ｓ２５０は対象体検出処理である。
Ｓ２５０において、対象体検出部３４０は対象体検出データ３４９を生成する。

図１９および図２０に基づいて、対象体検出処理（Ｓ３４０）について説明する。
Ｓ２５１、Ｓ２５２およびＳ２５８はモデル取得処理である。
Ｓ２５１において、モデル取得部３４１は、動体領域データ３３９から未選択の動体領域を１つ選択する。
Ｓ２５２からＳ２５６は、選択された動体領域別に実行される。

Ｓ２５２において、モデル取得部３４１は、動体領域が属する分割領域用のデータベースをモデルデータベース４００から取得する。選択された動体領域が複数の分割領域にまたがる場合、その複数の分割領域のそれぞれの分割領域用のデータベースが取得される。

Ｓ２５３からＳ２５７は動体判定処理である。
Ｓ２５３において、動体判定部３４２は、取得されたデータベースから未選択の対象体モデルを一つ選択する。選択された対象体モデルを照合モデルという。

Ｓ２５４−１において、動体判定部３４２は、照合モデルに含まれるサイズ情報が示す範囲に動体領域のサイズが含まれるか判定する。動体領域のサイズは、動体領域の領域情報に基づいて算出される。
照合モデルに含まれるサイズ情報が示す範囲に動体領域のサイズが含まれる場合、処理はＳ２５４−２に進む。
照合モデルに含まれるサイズ情報が示す範囲に動体領域のサイズが含まれない場合、処理はＳ２５５に進む。

Ｓ２５４−２において、動体判定部３４２は、動体領域と照合モデルとの類似度を以下のように算出する。
動体判定部３４２は、動体領域を構成する各画素の画素値に基づいて、動体領域の特徴量を算出する。
動体判定部３４２は、動体領域の特徴量と照合モデルに含まれる特徴情報が示す特徴量との差を類似度として算出する。

Ｓ２５４−３において、動体判定部３４２は、動体領域と照合モデルとの類似度が最大類似度より大きいか判定する。最大類似度の初期値はゼロである。
類似度が最大類似度より大きい場合、処理はＳ２５４−４に進む。
類似度が最大類似度より大きくない場合、処理はＳ２５４−４に進む。

Ｓ２５４−４において、動体判定部３４２は、最大類似度を動体領域と照合モデルとの類似度に更新し、照合モデルのモデル識別子を記憶する。

Ｓ２５５において、動体判定部３４２は、Ｓ２５３で選択していない未選択の対象体モデルがあるか判定する。
未選択の対象体モデルがある場合、処理はＳ２５３に戻る。
未選択の対象体モデルがない場合、処理はＳ２５６に進む。

Ｓ２５６において、動体判定部３４２は、最大類似度が類似度閾値より大きいか判定する。
最大類似度が類似度閾値より大きい場合、処理はＳ２５７に進む。
最大類似度が類似度閾値より大きくない場合、処理はＳ２５８に進む。

Ｓ２５７において、動体判定部３４２は、以下のように対象体領域を対象体検出データ３４９に登録する。対象体領域の登録は、対象体領域の領域識別子と対象体領域の領域情報との登録を意味する。
動体判定部３４２は、最大類似度の照合モデルから対象体識別子を取得する。
動体判定部３４２は、動体領域を対象体領域として、対象体領域と対象体識別子とを互いに対応付けて対象体検出データ３４９に登録する。

Ｓ２５８において、モデル取得部３４１は、Ｓ２５１で選択していない未選択の動体領域があるか判定する。
未選択の動体領域がある場合、処理はＳ２５１に戻る。
未選択の動体領域がない場合、対象体検出処理（Ｓ２５０）は終了する。

図１５に戻り、Ｓ２６０から説明を続ける。
Ｓ２６０は色情報生成処理である。
Ｓ２６０において、色情報生成部３５０は以下のように色情報データ３５９を生成する。
色情報生成部３５０は、対象体検出データ３４９に登録された対象体領域毎に、対象体領域を構成する各画素の色情報に基づいて、対象体領域の色情報を生成する。
色情報生成部３５０は、対象体領域毎の色情報を色情報データ３５９に登録する。

対象体の色が赤である場合、赤を表すＲＧＢ値を有する画素が対象体領域に多く含まれる。したがって、赤を表すＲＧＢ値を有する画素が対象体領域に多く含まれる場合、対象体領域の色情報は赤を示す。
対象体領域の色情報を生成するために、Ｒ値とＧ値とＢ値と比較する色閾値、画素の数と比較する画素数閾値、ＲＧＢ値に各色を対応付けたカラーパレットテーブルなどが用いられてもよい。例えば、同じ色を表す画素の数が画素数閾値より多い場合、その色を示す色情報が対象体領域の色情報である。

Ｓ２７０は解析結果生成処理である。
Ｓ２７０において、解析結果生成部３６０は、対象体検出データ３４９と色情報データ３５９とを用いて、解析結果データ１４０を生成する。
解析結果データ１４０は、映像データ１１９が表す映像の撮影日時、映像を識別するフレーム番号、対象体が映っている動体領域の範囲、対象体を識別する対象体識別子、対象体の色の特徴を示す色情報などを含む。

＊＊＊効果の説明＊＊＊
符号化された映像データ１１９を復号せずに、映像に映っている対象体を検出することができる。
映像解析の対象になる映像データ１１９が表す映像のうちの対象領域を判定することによって、映像解析の処理量を削減することができる。但し、全ての映像データ１１９に対して映像解析が行われてもよいし、利用者によって選択された映像データ１１９に対して映像解析が行われてもよい。

実施の形態２．
監視カメラ１１０がモデル記憶部１１４を備えない形態について、図２１および図２２に基づいて説明する。但し、実施の形態１と重複する説明は省略する。

＊＊＊構成の説明＊＊＊
図２１に基づいて、監視システム１００の構成について説明する。
監視システム１００は、モデルデータベース４００を記憶するモデルサーバ１５０を備える。
監視カメラ１１０は、モデルサーバ１５０のモデルデータベース４００にアクセスすることによって、必要な対象体モデルを取得する。

図２２に基づいて、監視カメラ１１０およびモデルサーバ１５０の機能構成について説明する。
モデルデータベース４００を記憶するモデル記憶部１１４は、監視カメラ１１０の代わりに、モデルサーバ１５０に備わる。
映像解析装置３００は、モデルサーバ１５０のモデルデータベース４００にアクセスすることによって、必要な対象体モデルを取得する。

＊＊＊動作の説明＊＊＊
監視カメラ１１０、映像符号化装置２００および映像解析装置３００の動作は、実施の形態１と同じである。
但し、必要な対象体モデルは、モデルサーバ１５０のモデルデータベース４００にアクセスすることによって取得される。

＊＊＊効果の説明＊＊＊
モデルデータベース４００を記憶するためのハードディスクを監視カメラ１１０に備える必要がない。これにより、監視カメラ１１０の構成コストを削減することができる。
モデルサーバ１５０を設けることにより、大量の対象体モデルを備えるモデルデータベース４００を用意することができる。これにより、対象体を検出する精度が向上する。

各実施の形態は、好ましい形態の例示であり、本発明の技術的範囲を制限することを意図するものではない。各実施の形態は部分的に実施してもよい。
フローチャート等を用いて説明した処理手順は、映像解析装置、映像解析方法、映像解析プログラム、映像符号化装置、映像符号化方法および映像符号化プログラムの処理手順の一例である。

１００監視システム、１０１監視空間、１０２被写体、１０３映像、１０４被写体領域、１１０監視カメラ、１１１データ受信部、１１２データ送信部、１１３符号化データ記憶部、１１４モデル記憶部、１１９映像データ、１２０蓄積サーバ、１２１データ受信部、１２２符号化データ管理部、１２３解析結果データ管理部、１２９サーバ記憶部、１３０符号化データ、１３１ＤＣＴ係数データ、１３２動きベクトルデータ、１３３符号化パラメータ、１４０解析結果データ、１５０
モデルサーバ、２００映像符号化装置、２１０映像データ受付部、２２０動きベクトル算出部、２３０動き補償予測部、２３１差分算出部、２３２重ね合わせ部、２３９予測データ、２４０ＤＣＴ部、２４１量子化部、２４２エントロピー符号化部、２４３逆量子化部、２４４逆ＤＣＴ部、２４７差分データ、２４８ＤＣＴ係数データ、２４９量子化係数データ、２５０符号化データ管理部、２９０前回データ記憶部、３００映像解析装置、３１０映像データ受付部、３１１完了通知受付部、３２０解析実施判定部、３２１変化量算出部、３２２変化量判定部、３２３解析指示部、３３０動体領域検出部、３３１パラメータ取得部、３３２動体ブロック特定部、３３３動体領域特定部、３３８動体ブロックデータ、３３９動体領域データ、３４０対象体検出部、３４１モデル取得部、３４２動体判定部、３４８照合モデル、３４９対象体検出データ、３５０色情報生成部、３５９色情報データ、３６０解析結果生成部、３９０映像データ記憶部、４００モデルデータベース、４１０第１領域データベース、４１１第１の対象体モデル、４１１Ａサイズ情報、４１１Ｂ特徴情報、４１１Ｃ対象体識別子、４１２第２の対象体モデル、４２０第２領域データベース、４２１第１の対象体モデル、４２２第２の対象体モデル、４３０第３領域データベース、９０１プロセッサ、９０２補助記憶装置、９０３メモリ、９０４通信装置、９０４１レシーバ、９０４２トランスミッタ、９０５入力インタフェース、９０６出力インタフェース、９０７入力装置、９０８出力装置、９１０信号線、９１１ケーブル、９１２ケーブル。

Claims

映像データが表す映像を分割した複数のブロックのブロック毎に、周波数成分別の離散コサイン変換係数を取得するパラメータ取得部と、
前記複数のブロックから、周波数閾値より大きい高周波数の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックを、動体が映っている動体ブロックとして特定する動体ブロック特定部と
を備える映像解析装置。
前記パラメータ取得部は、前記複数のブロックのそれぞれに映っている被写体の動きを表す動きベクトルを取得し、
前記動体ブロック特定部は、前記高周波の周波数成分のうちの少なくともいずれかの周波数成分の離散コサイン変換係数がゼロでないブロックのうち、動きベクトルの大きさが動き閾値以上であるブロックを、前記動体ブロックとして特定する
請求項１に記載の映像解析装置。
前記動体ブロック特定部は、１つ以上の動体ブロックを特定し、
前記映像解析装置は、
前記１つ以上の動体ブロックのそれぞれのブロック位置に基づいて、前記映像から、少なくとも１つの動体ブロックを含んだ領域を動体領域として特定する動体領域特定部を備える
請求項１に記載の映像解析装置。
前記１つ以上の動体ブロックのうちの第１の動体ブロックに隣接するいずれのブロックも動体ブロックでない場合、前記第１の動体ブロックを含んだ第１の動体領域は、前記第１の動体ブロックであり、
前記第１の動体ブロックに隣接するブロックのいずれかが前記１つ以上の動体ブロックのうちの第２の動体ブロックである場合、前記第１の動体領域は、前記第１の動体ブロックと前記第２の動体ブロックとを含んだ矩形領域であり、
前記第２の動体ブロックに隣接するブロックのいずれかが前記１つ以上の動体ブロックのうちの第３の動体ブロックである場合、前記第１の動体領域は、前記第１の動体ブロックと前記第２の動体ブロックと前記第３の動体ブロックとを含んだ矩形領域である
請求項３に記載の映像解析装置。
検出する対象の動体である対象体の特徴を表す対象体モデルを照合モデルとして取得するモデル取得部と、
前記照合モデルに基づいて、前記動体領域に映っている動体が前記対象体であるか判定する動体判定部と
を備える請求項３に記載の映像解析装置。
前記モデル取得部は、前記照合モデルをモデルデータベースから取得し、
前記モデルデータベースは、前記映像を垂直方向に分割して得られる複数の分割領域のそれぞれに、異なる対象体モデルを対応付けたファイルであり、
前記照合モデルは、前記モデルデータベースに含まれる対象体モデルのうち、前記動体領域が属する分割領域に対応付いた対象体モデルである
請求項５に記載の映像解析装置。
前記モデルデータベースに含まれるそれぞれの対象体モデルは、領域のサイズの範囲を示すサイズ情報を含み、
前記動体判定部は、前記照合モデルに含まれるサイズ情報が示す範囲に前記動体領域のサイズが含まれることを条件として、前記動体領域に映っている動体が前記対象体であると判定する
請求項６に記載の映像解析装置。
前記モデルデータベースに含まれるそれぞれの対象体モデルは、サイズ以外の特徴を表す特徴情報を含み、
前記動体判定部は、前記照合モデルに含まれる特徴情報が表す特徴と前記動体領域の特徴との類似度が類似度閾値よりも高いことを条件として、前記動体領域に映っている動体が前記対象体であると判定する
請求項７に記載の映像解析装置。
前記動体領域に映っている動体が前記対象体であると判定された場合、前記動体領域を構成する各画素の色情報に基づいて、前記対象体の色の特徴を表す色情報を生成する色情報生成部を備える
請求項５に記載の映像解析装置。
前記動体領域の範囲を示す領域情報と、前記対象体の色の特徴を表す前記色情報と、を含んだ解析結果データを生成する解析結果生成部
を備える請求項９に記載の映像解析装置。
前記映像解析装置は、
第１の映像を表す第１の映像データと、前記第１の映像が撮影された時刻とは異なる時刻に撮影された第２の映像を表す第２の映像データと、を受け付ける映像データ受付部と、
前記第１の映像を構成する各画素の画素値と、前記第２の映像を構成する各画素の画素値とに基づいて、前記第１の映像と前記第２の映像との変化量を算出する変化量算出部とを備え、
前記動体ブロック特定部は、前記変化量が変化量閾値より大きい場合、前記第１の映像について前記動体ブロックを特定する
請求項１に記載の映像解析装置。