WO2022185569A1

WO2022185569A1 - 映像解析システム、及び映像解析方法

Info

Publication number: WO2022185569A1
Application number: PCT/JP2021/030403
Authority: WO
Inventors: 健一森田; 良起伊藤; 敦廣池
Original assignee: 株式会社日立製作所
Priority date: 2021-03-02
Filing date: 2021-08-19
Publication date: 2022-09-09
Also published as: JP2022133547A

Abstract

映像解析システムであって、映像中の生物の属性を抽出する生物属性推定部と、前記映像中の物体の属性を抽出する物体認識部と、前記映像中の生物の動きを認識する動き認識部と、前記各部の実行タイミングを制御するためのフレームレート調整部とを有し、前記フレームレート調整部は、前記動き認識部が処理する映像のフレームレートを、前記生物属性推定部及び前記物体認識部の少なくとも一方が処理する映像のフレームレートより高く設定することを特徴とする映像解析システム。

Description

映像解析システム、及び映像解析方法

参照による取り込み

　本出願は、令和３年（２０２１年）３月２日に出願された日本出願である特願２０２１－０３２２８１の優先権を主張し、その内容を参照することにより、本出願に取り込む。

　本発明は、映像解析技術に関する。

　防犯カメラの普及に伴い、複数地点で撮影された映像から特定の人物や車両を検出するニーズが高まっている。しかし、従来の防犯カメラシステムは、記録装置に蓄積された膨大なデータから所望のシーンの検索が困難である。

　映像解析機能は、リアルタイム検知機能と履歴検索機能に大別される。リアルタイム検知機能は、監視映像中に特定の対象（人物・物体・動物）や特定の動きの出現を検知し、ユーザに通知する。履歴検索機能は、特定の対象（人物、物体、動物など）の外見又は動きをクエリとして、過去の映像データの特徴量データベースを検索し、検索対象が映る映像を抽出する。

　本技術分野の背景技術として、特開２００１－１６７０９５号公報（特許文献１）及び国際公開第２０１７／０１７８０８号（特許文献２）がある。特開２００１－１６７０９５号公報には、入力画像データから画像特徴量を抽出し特徴記述子を生成する特徴記述子生成部と、生成された特徴記述子を入力画像データと対応づけて蓄積する画像情報蓄積部と、入力画像データに付随して入力する属性情報に基づいて属性リストを生成する属性リスト生成部と、属性情報に関する検索条件が入力すると前記属性リストを検索して当該検索条件に適合する属性情報を出力すると共に、特徴記述子に関する検索条件が入力すると前記画像情報蓄積部を検索して当該検索条件に適合する画像データを出力する画像検索部と、を備えることを特徴とする画像検索システムが記載されている（請求項１参照）。

　また、国際公開第２０１７／０１７８０８号公報には、プロセッサと前記プロセッサが実行するプログラムを格納する記憶装置とを含む、画像処理システムであって、前記プロセッサは、映像データから複数フレームを作成し、前記複数フレームにおいて移動物体を検出し、検出した前記移動物体それぞれの軌跡の特徴量を前記複数フレームから抽出してデータベースに記録し、前記複数フレームのそれぞれにおいて、移動物体の画像から特徴量を抽出して前記データベースに記録することを含む特徴登録処理、の内容を、予め定められた条件に従って決定し、前記複数フレームのそれぞれにおいて、決定した前記特徴登録処理の内容を実行する、画像処理システムが記載されている（請求項１参照）。

　映像解析機能のうち行動認識機能は、短時間での変化が小さい属性認識機能より、短い時間間隔で人物の動きを捉える必要がある。このため、行動認識機能は、大きな計算機リソースを使用し、計算コストが大きい。計算リソースが不十分な環境下では、処理の停滞によってリアルタイムの行動認識処理が困難となり、リアルタイムの行動検知や特徴量データベースの逐次更新が不可能となる。従って、履歴検索によって不特定の対象を準リアルタイムに特定することが不可能となり、履歴検索で特定した対象の情報を活用したリアルタイム検知も不可能となる。また、サーバ計算機あたりに取り扱える映像（すなわち、カメラの台数）が制限される。このように、行動認識機能は属性認識機能と取り扱いを変えることが望まれている。

　また、映像データベースの履歴検索で目撃情報を照会して不審者を発見することと、履歴検索機能とリアルタイム検知機能との連携強化による不審者の追跡に基づく不審者の確保と二次被害の防止が重要である。目撃情報に基づいてターゲットを発見するためには、履歴検索により特定したターゲットの情報を活用した高精度のリアルタイム検知が望まれている。

　そこで、本発明では、各処理で抽出される特徴量の継続性に着目して、処理によってフレームレートを調整する映像解析技術の提供を目的とする。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、映像解析システムであって、所定の処理を実行する演算装置と、前記演算装置に接続された記憶デバイスとを有する計算機によって構成され、前記演算装置は、映像中のオブジェクトの特徴量データを格納する特徴量データベースにアクセス可能であって、前記映像解析システムは、前記演算装置が、前記映像中の生物の属性を抽出する生物属性推定部と、前記演算装置が、前記映像中の物体の属性を抽出する物体認識部と、前記演算装置が、前記映像中の生物の動きを認識する動き認識部と、前記演算装置が、前記各部の実行タイミングを制御するためのフレームレート調整部とを有し、前記フレームレート調整部は、前記動き認識部が処理する映像のフレームレートを、前記生物属性推定部及び前記物体認識部の少なくとも一方が処理する映像のフレームレートより高く設定することを特徴とする。

　本発明の一態様によれば、映像解析に必要な計算機リソースを低減し、計算コストを低減できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。

本発明の実施例の映像解析システムの論理的な構成を示すブロック図である。本実施例の映像解析システムの物理的な構成を示すブロック図である。本実施例の特徴量データベースの構成例を示す図である。本実施例の特徴量ＤＢ構築処理のフローチャートである。本実施例の画像検索処理のフローチャートである。本実施例の画像検索処理のフローチャートである。本実施例の映像解析システムによる処理を示す図である。本実施例の検索画面の一例を示す図である。

　図１は、本発明の実施例の映像解析システム１００の構成を示すブロック図である。

　本実施例の映像解析システム１００は、映像取得部１１、骨格推定部１２、人物矩形抽出部１３、人物特徴抽出部１４、人物追跡部１５、時系列行動認識部１６、フレームレート調整部１７～１９、人物属性推定部２０、物体認識部２１、ＦＤＢ登録部２２、着目時間制御部２３、クエリ設定部２４、検索結果出力部２５、リアルタイム検知部２６及び検知ルールメモリ２７を有する。

　映像解析システム１００は、ＦＤＢサーバ２００と接続されており、映像から抽出された特徴量をＦＤＢサーバ２００に登録し、ＦＤＢサーバ２００を検索して検索結果を取得する。

　映像解析システム１００は、複数のカメラ３００と接続されており、カメラ３００から映像を取得する。

　映像取得部１１は、一つまたは複数のカメラ３００から映像を取得するインターフェースである。映像取得部１１は、着目時間制御部２３から出力されたフレームレート制御値に従って、カメラ３００にリクエストを送信し、所定のフレームレートの映像を取得する。また、映像取得部１１は、カメラ３００が撮影し、カメラ３００に設定されているフレームレートで配信する映像を受信し、受信した映像のフレームを間引いて、所定のフレームレートの映像を生成してもよい。映像取得部１１は、着目時間制御部２３から出力されるフレームレート制御値に従って、時系列行動認識部１６による行動認識に必要十分なフレームレートを調整して、所定のフレームレートの映像を出力する。例えば、カメラ３００が配信する映像が３０ｆｐｓである場合、例えば５ｆｐｓまで間引いてフレームレートを低くする。映像取得部１１は、カメラ３００から映像を直接取得せず、映像管理システム（Video Management System）やレコーダーを経由して映像を取得してもよい。映像取得部１１は、リアルタイムで撮影された映像ではなく、過去に撮影された映像をバッチ処理するために取得してもよい。なお、本明細書中に記載する映像は、連続するフレーム画像でもよい。映像取得部１１が取得したフレームには、フレームＩＤが付与される。

　骨格推定部１２は、取得した映像に写っている人物の骨格を推定し、骨格データを生成する。骨格推定部１２は、ＯｐｅｎｐｏｓｅやＯｐｅｎｐｉｆｐａｆなどの深層ネットワークモデルを活用したボトムアップ型の骨格推定手法を用いてもよいし、Ｙｏｌｏなどの人物検知を実施して各人物についてＨＲＮｅｔなどの深層ネットワークモデルを活用したトップダウン型の骨格推定手法を用いてもよいし、人物が身に着けているマーカーなどを検出することによる骨格推定手法を用いてもよい。なお、後段で時系列行動認識部１６による行動認識を行わない場合、骨格推定を行わず人物検知を行ってもよい。また、骨格推定部１２は、骨格推定と人物検知の両方を行ってもよい。骨格が推定されたオブジェクトは人物であると推定され、推定された人物毎に人物ＩＤが付与される。

　人物矩形抽出部１３は、映像から骨格推定によって得られた骨格モデルの外形を示す矩形であるバウンディングボックスを生成し、当該矩形でトリミングされた画像を人物特徴抽出部１４とフレームレート調整部１８に出力する。骨格推定部１２と人物矩形抽出部１３は一体であってもよく、たとえば、人物矩形であるバウンディングボックスの生成は、骨格推定と同時に行われてもよい。また、人物矩形抽出部１３は、当該矩形の抽出のみを行い、フレーム画像と人物矩形を送信してもよい。

　人物特徴抽出部１４は、骨格推定によって映像から得られた人物の画像特徴量を抽出する。例えば、人物矩形画像を入力とし、公知の一般物体認識用深層ネットワークモデルによる推論を実施し、その中間層のデータを画像特徴量としてもよい。また、公知の一般物体認識用深層ネットワークモデルによって、人物矩形抽出部１３及び人物特徴抽出部１４を一体に構成してもよく、この場合、骨格推定部１２が骨格推定した人物と人物特徴抽出を行った人物を紐づける処理を実施する。

　人物追跡部１５は、人物特徴抽出によって得られた人物の画像特徴を用いて、特徴量が近似する同一人物の時系列の位置情報を関連付けて、人物の軌跡にトラックＩＤを付与する。例えば、ＤｅｅｐＳＯＲＴなどの深層ネットワークモデルを活用したＲｅＩＤ手法によって追跡処理を実現してもよいし、映像中の各フレームにおいて最も近い位置にいる人物を関連付ける処理を行ってもよいし、位置情報と人物の画像特徴を含む特徴量距離が小さい人物を関連付ける処理を行ってもよい。さらに、人物追跡部１５は、当該軌跡の特徴量である軌跡特徴を抽出してもよい。軌跡特徴は、例えば、一つ又は複数の固定長のベクトルによって表現され、任意の公知の方法によって抽出できる。具体的には、同一の軌跡ＩＤに対応付けられた移動物体の画像のフレーム内の座標の時系列変化から軌跡特徴を計算できる。トラックＩＤが付与された軌跡のデータは、当該軌跡が終了するまで、内部変数としてメモリに一時的に記憶されており、当該軌跡が途切れた後に、軌跡テーブル２１４に格納される。

　時系列行動認識部１６は、人物特徴抽出によって得られた同一人物の過去数フレームの骨格推定結果を用いて、人物の行動の種類を識別する。あわせて識別結果の確信度を算出するとよい。例えば、ＧＣＮベースの行動識別器である深層ネットワークモデルによって、着目時間制御部２３から出力された識別用コマ数のフレームを含むスライディングウインドウを用いて、時系列に行動を識別するとよい。他の行動識別器やルールベースによって学習済みの行動を識別してもよい。時系列行動認識を行わず、１フレームの骨格推定結果に基づいて行動を識別してもよい。時系列行動認識部１６で識別される人物の行動は、立つ、歩く、走る、しゃがむ、倒れる、手を振る、指をさす、キョロキョロする、話す、物を受け渡す、柵を乗り越える、物を拾う、刃物を振り回すなどであり、各行動に一意のアクションＩＤが付与されている。アクションＩＤは、行動識別によって得られる識別クラスを示す数値でもよいし、識別クラスに対応するラベルでもよい。また、時系列行動認識部１６が複数の行動を同時に認識した場合、アクションＩＤは、複数の行動に関する識別結果を示す数値列や識別ラベルのリストでもよい。また、時系列行動認識部１６は、前述した生活における人物の行動の他、工場における制御盤などの設備の操作行動やワークに対する作業を識別してもよい。

　また、時系列行動認識部１６は、人物の行動における同時多発事象を識別する。すなわち、時系列行動認識部１６は、複数の人物が同時に同じ行動をとっており、同じアクションＩＤが付与される場合、撮影されている環境に異常が発生していると判定し、同時多発アラートを発生する。例えば、複数の人物が同時に倒れたことが検出されると、地震、火災、有毒ガスなどの異常が発生している可能性がある。また、大勢の人物が同時に同じ方向に走っていると、避難すべき事象が発生している可能性がある。同時多発事象は、完全に同じ時刻（同じフレーム）で識別されず、近い時間（前後のフレーム）や数秒間又は数分間などの一定の時間範囲内のフレームで識別される場合がある。このため、時系列行動認識部１６は、同時多発事象を識別する場合、所定の時間幅において同一行動が識別されるかを判定する。

　フレームレート調整部１７は、時系列行動認識部１６で識別された人物の行動種別のフレームレートを５ｆｐｓから１ｆｐｓに低下するように調整する。フレームレート調整部１７が調整するフレームレート（５ｆｐｓ、１ｆｐｓなど）は、本実施例における説明と異なるものでもよく、検出精度や用途によって、着目時間制御部２３から出力されるフレームレート制御値に従って調整される。人物の骨格の推定、特徴量の抽出、行動の認識、属性の推定などの処理の中で、行動の認識は最も高いフレームレートが必要であるが、他の処理は、その結果が急に変化する性質ではないため、低いフレームレートでもよい。各処理について必要十分なフレームレートに調整することによって、各処理で必要なフレームレートを最適化でき、少ないハードウェアリソースでリアルタイム処理又は準リアルタイム処理を実現できる。

　フレームレート調整部１８は、人物特徴抽出部１４で抽出された人物の画像特徴量のフレームレートを５ｆｐｓから１ｆｐｓに低下するように調整する。フレームレート調整部１８が調整するフレームレート（５ｆｐｓ、１ｆｐｓ）は、本実施例における説明と異なるものでもよく、検出精度や用途によって、着目時間制御部２３から出力されるフレームレート制御値に従って調整される。次段の人物属性推定部２０では、急に大きく変化しない人物属性を推定するために高いフレームレートを必要としないので、人物属性を推定するために必要十分なフレームレートへの低下によって、使用するハードウェアリソースを低減できる。

　人物属性推定部２０は、人物の年齢、性別、髪型、髪の色、着用しているアクセサリー、リュックや鞄や杖などの所有物、服装の色、服の種類などの外見から推定できる属性を推定し、各人物属性に一意に付与された人物属性ＩＤを出力する。あわせて推定結果の確信度を算出してもよい。人物属性ＩＤは、人物属性推定によって推定された属性を示す数値でもよいし、属性を示すラベルでもよい。また、人物属性推定部２０が複数の属性を同時に推定した場合、人物属性ＩＤは、複数の属性に関する推定結果でもよい。

　フレームレート調整部１９は、映像取得部１１が取得した映像のフレームレートを５ｆｐｓから１ｆｐｓに低下するようにフレームを間引く調整をする。フレームレート調整部１９が調整するフレームレート（５ｆｐｓ、１ｆｐｓ）は、本実施例における説明と異なるものでもよく、検出精度や用途によって、着目時間制御部２３から出力されるフレームレート制御値に従って調整される。次段の物体認識部２１では、急に大きく変化しない物体の種別を識別するために、高いフレームレートを必要としないので、物体を認識するために必要十分なフレームレートへの低下によって、使用するハードウェアリソースを低減できる。

　なお、フレームレート調整部１７～１８は、別のサブプログラムで構成しても、同じサブプログラムで構成してもよい。また、映像取得部１１やフレームレート調整部１７～１８が調整するフレームレートは、厳密に等間隔な時間調整をしなくてもよく、フレームレートに対し時間方向のゆらぎを持っていてもよい。つまり、例えば、５ｆｐｓで調整する場合、厳密に２００ｍｓ間隔のフレームを選択せず、１秒間に対して時間間隔が異なる５枚のフレームを選択してもよい。

　物体認識部２１は、映像取得部１１が取得した映像に写っている物体を識別し、当該物体の種別（人物が持っている鞄や傘、自走するロボット、自転車、スケートボード、人物が操作する設備）を識別して、各物体属性に一意に付与された物体属性ＩＤを出力する。例えば、物体の画像と種別で学習したＡＩエンジンを用いて物体の種別を識別できる。あわせて推定結果の確信度を算出してもよい。さらに、物体認識部２１は、識別された物体と映像から得られた人物の関係（例えば、識別された物体と所有者との関係）を推定する。あわせて推定結果の確信度を算出してもよい。

　本実施例では、人物属性推定部２０及び物体認識部２１の両方を設けているが、映像解析の用途に応じて、一方のみ設けてもよい。

　なお、映像解析システム１００は、人物だけでなく他の生物（例えば、熊、猪などの野生動物）を識別してもよく、生物ではないロボットや機械を識別してもよい。例えば、人型ロボットを人物として識別し、動物型ロボットや搬送車を物体として識別してもよい。

　ＦＤＢ登録部２２は、ＦＤＢサーバ２００へデータを登録するＦＤＢ登録処理を実行する。具体的には、人物追跡部１５から出力される人物の軌跡（トラックＩＤ）、時系列行動認識部１６から出力され、フレームレート調整部１７がフレームレートを調整した人物の行動の種類（アクションＩＤ）、人物属性推定部２０から出力される人物の属性（人物属性ＩＤ）、及び物体認識部２１から出力される物体の種別（物体属性ＩＤ）を、オブジェクトＩＤ、人物ＩＤ、及びトラックＩＤを用いて関連付けてＦＤＢサーバ２００へ登録する。

　着目時間制御部２３は、各フレームレート調整部１７～１９及び映像取得部１１が調整するフレームレートを制御する。着目時間制御部２３が出力するフレームレートの制御値は、時系列行動認識部１６で認識する行動の種別に従って決定されるとよい。着目時間制御部２３は、各処理におけるフレームレートの制御値をフレームレート調整部１７～１９に出力し、各処理の実行タイミング（実行間隔）を制御する。着目時間制御部２３は、行動を識別するための画像の間隔（フレームレート）とコマ数の組を時系列行動認識部１６に出力し、時系列行動認識処理の実行タイミング（実行間隔）を制御する。また、着目時間制御部２３の構成は、フレームレートの制御値を格納するテーブルでも、パラメータファイルでも、プログラムの内部変数でもよい。

　クエリ設定部２４は、履歴検索機能において、人物の属性、人物の行動、物体の属性の一つ以上を含む、特徴量データベース２１０を検索するための検索クエリを生成する。検索クエリは、例えば、図７に示す検索画面７００を操作して検索すべき属性を設定して、検索クエリを設定する。生成された検索クエリはＦＤＢサーバ２００に送信され、特徴量データベース２１０を検索した結果が映像解析システム１００に返送される。

　検索結果出力部２５は、クエリに該当する人物や物体が写っているフレームや映像クリップ（例えば、人物特徴抽出部１４が生成した人物矩形データ内の映像）を検索結果表示領域７５０に表示する検索画面７００（図７参照）を生成する。

　リアルタイム検知部２６は、映像認識結果又は映像から推定される検知対象を受け付け、検知ルールメモリ２７及び検知対象データベース２２０を参照して、リアルタイム検知処理を実行する。リアルタイム検知部２６は、例えば、リアルタイム検知条件を生成し、人物追跡部１５から出力される人物の軌跡、時系列行動認識部１６から出力される人物の行動の種類、人物属性推定部２０から出力される人物の属性、及び物体認識部２１から出力される物体の種別が検知条件にヒットすると、トラックＩＤを用いて軌跡を特定して人物を追跡し、当該トラックＩＤのデータをリアルタイム検知部２６内の一次記憶領域に格納して、検知結果をリアルタイムに画面出力する。リアルタイム検知部２６は、リアルタイム検知結果をＦＤＢ登録部２２に送って、クエリＩＤと人物ＩＤとを関連付け、特徴量データベース２１０に登録してもよい。リアルタイム検知処理は、ＦＤＢ登録部２２によるＦＤＢ登録処理と並列に実行されてもよい。

　検知ルールメモリ２７は、特徴量データベース２１０を検索した検索クエリのうち、ターゲットがヒットしなかったものが検知ルールとして登録される記憶領域である（図５のステップ１５８参照）。

　ＦＤＢサーバ２００は、映像解析システム１００による映像の解析結果が登録される特徴量データベース２１０と、検知対象データベース２２０によって構成される。特徴量データベース２１０の構成は、図３を参照して後述する。検知対象データベース２２０は、特徴量データベース２１０を検索した結果、ヒットしたターゲットの特徴量が登録され、後のリアルタイム検知において特徴量同士（すなわち、特徴量によるクエリと、ＦＤＢ登録部２２に入力される特徴量）を比較するために使用される。なお、特徴量データベース２１０と検知対象データベース２２０は独立のＦＤＢサーバとして稼働してもよいし、さらに、それぞれのデータベースが複数のデータベースに分割されて構成されてよく、分割されたデータベースが独立のＦＤＢサーバとして稼働してもよい。

　カメラ３００は、監視区域内を移動する人物を追跡可能なように、監視区域内に複数設置される。カメラ３００は、撮像素子、制御回路、及び通信インターフェースを有し、撮影した映像を通信インターフェースから映像解析システム１００に出力する。カメラ３００は、ＩＰネットワークに直接接続可能なネットワークカメラに限らず、いわゆるビデオカメラやスチルカメラでもよい。さらに、カメラ３００は、骨格推定機能を有するエッジ映像解析機能を有するＡＩカメラでもよく、この場合、骨格推定部１２は骨格推定を行わず人物ＩＤの発行のみを行ってもよいし、骨格推定部１２が省略され、映像取得部１１や人物特徴抽出部１４において人物ＩＤが発行されてもよい。

　図２は、本実施例の映像解析システム１００の物理的な構成を示すブロック図である。

　本実施形態の映像解析システム１００は、プロセッサ（ＣＰＵ）１、メモリ２、補助記憶装置３及び通信インターフェース４を有する計算機によって構成される。

　プロセッサ１は、メモリ２に格納されたプログラムを実行する。メモリ２は、不揮発性の記憶素子であるＲＯＭ及び揮発性の記憶素子であるＲＡＭを含む。ＲＯＭは、不変のプログラム（例えば、ＢＩＯＳ）などを格納する。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶素子であり、プロセッサ１が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。

　補助記憶装置３は、例えば、磁気記憶装置（ＨＤＤ）、フラッシュメモリ（ＳＳＤ）等の大容量かつ不揮発性の記憶装置であり、プロセッサ１が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置３から読み出されて、メモリ２にロードされて、プロセッサ１によって実行される。

　通信インターフェース４は、所定のプロトコルに従って、他の装置（ＦＤＢサーバ２００、カメラ３００など）との通信を制御するネットワークインターフェース装置である。

　映像解析システム１００は、入力インターフェース５及び出力インターフェース８を有してもよい。入力インターフェース５は、キーボード６やマウス７などが接続され、オペレータからの入力を受けるインターフェースである。出力インターフェース８は、ディスプレイ装置９やプリンタなどが接続され、プログラムの実行結果をオペレータが視認可能な形式で出力するインターフェースである。映像解析システム１００が入出力画面をウェブアプリやウェブ画面等としてサーバ経由で提供する場合、入力インターフェース５と出力インターフェース８は、入出力画面にアクセスするための映像解析システム１００とは異なる端末に搭載される。この場合、タブレットデバイスなどのように、入力インターフェース５と出力インターフェース８は一つのデバイスとして構成されてもよい。

　プロセッサ１が実行するプログラムは、リムーバブルメディア（ＣＤ－ＲＯＭ、フラッシュメモリなど）又はネットワークを介して映像解析システム１００に提供され、非一時的記憶媒体である不揮発性の補助記憶装置３に格納される。このため、映像解析システム１００は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。

　映像解析システム１００は、物理的に一つの計算機上で、又は、論理的又は物理的に構成された複数の計算機上で構成される計算機システムであり、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。映像解析システム１００の各機能部は異なる計算機上で実現されてもよい。

　図３は、特徴量データベース２１０の構成例を示す図である。

　特徴量データベース２１０は、フレームテーブル２１１、人物テーブル２１２、物体テーブル２１３及び軌跡テーブル２１４で構成される。特徴量データベース２１０を他のテーブル構成でもよく、テーブルではない形式、例えば、リストや辞書などの形式で構成してもよい。

　フレームテーブル２１１は、映像のフレームに関するデータが記録されるテーブルであって、フレームＩＤ、カメラＩＤ及び日時を含む。フレームＩＤは、フレームの識別情報である。カメラＩＤは、当該フレームを撮影したカメラ３００の一意の識別情報である。なお、カメラＩＤを明示的に設けず、特定の桁がカメラ３００を表すようにフレームＩＤを定義してもよい。日時は、当該フレームが撮影された日時、又は、カメラ３００が配信時に付与する日時、または、映像取得部１１が映像取得時に付与する日時である。フレームテーブル２１１の情報を人物テーブル２１２および物体テーブル２１３が保持してもよく、この場合フレームテーブル２１１は無くてもよい。

　人物テーブル２１２は、映像のフレームから認識された人物の情報が記録されるテーブルであって、人物ＩＤ、フレームＩＤ、トラックＩＤ、アクションＩＤ、人物属性ＩＤ、人物画像特徴、及び人物座標を含む。人物ＩＤは、人物であるオブジェクト（例えば骨格推定ができたオブジェクトは人物であると認識できる）に付与される一意の識別情報である。人物ＩＤは、同じ人物について複数のフレームにおいて同じ人物ＩＤが付与されてもよいし、同じ人物でもフレーム毎に異なる人物ＩＤが付与されてもよい。フレームＩＤは、フレームテーブル２１１のフレームＩＤと同じ識別情報が用いられる。トラックＩＤは、人物の移動の軌跡を一意に示す識別情報であり、同一人物の軌跡には一つのトラックＩＤが付与される。トラックＩＤは含まれなくてもよい。アクションＩＤは、人物の行動の種類を示す識別情報であり、時系列行動認識部１６で識別される人物の行動の種類に対応する。アクションＩＤは時系列行動認識部１６で識別された識別値でもよいし、識別値に対応するラベルでもよい。アクションＩＤは、識別時の確信度を含んでもよい。人物属性ＩＤは、当該人物の属性を示す識別情報であり、人物属性推定部２０で推定された属性に対応する。人物属性ＩＤは、人物属性推定部２０で識別された識別値であってもよいし、識別値に対応するラベルでもよい。人物属性ＩＤは、推定の確信度を含んでもよい。人物画像特徴は、人物特徴抽出部１４が出力する人物の画像特徴量である。人物座標は、当該人物が認識された範囲を示す人物のフレームにおける座標であり、骨格推定部１２における人物の骨格位置情報と、人物矩形抽出部１３から出力される人物の範囲を示す矩形情報との、いずれか、又は、両方である。人物座標は、いわゆる画像座標で表現されてもよいし、絶対座標などの被撮影者の３次元空間の位置を示す位置情報として表現されてもよい。

　物体テーブル２１３は、物体ＩＤ、フレームＩＤ、トラックＩＤ、人物ＩＤ、物体属性ＩＤ、及び物体座標を含む。物体ＩＤは、当該オブジェクトが認識された物体に付与される一意の識別情報である。フレームＩＤは、フレームテーブル２１１のフレームＩＤと同じ識別情報が用いられる。トラックＩＤは、物体を追跡して得られた軌跡を一意に示す識別情報であり、異なる物体ＩＤでも同一物体の移動には一つのトラックＩＤが付与される。人物ＩＤは、当該物体と共に移動していると推定される人物の識別情報である。トラックＩＤと人物ＩＤは省略されてもよい。物体属性ＩＤは、当該物体の属性（物体認識部２１で識別された物体の種類）を示す識別情報である。物体属性ＩＤは物体認識部２１における識別値でもよいし、識別値に対応するラベルでもよい。物体属性ＩＤは、物体認識部２１による識別の確信度を含んでもよい。物体座標は、物体認識部２１により物体が認識された画像上の位置又は領域（矩形や多角形など）を示す座標である。物体座標はいわゆる画像座標でもよいし、世界座標や物体が置かれている３次元空間上の位置情報でもよい。

　軌跡テーブル２１４は、トラックＩＤ、人物ＩＤ、物体ＩＤ及び軌跡特徴を含む。トラックＩＤは、人物追跡部１５により得られた人物又は物体の軌跡を一意に示す識別情報であり、人物テーブル２１２のトラックＩＤや物体テーブル２１３のトラックＩＤと同じ識別情報が用いられる。つまり、軌跡テーブル２１４は、軌跡情報に基づいて、複数のフレームに出現する同一の人物又は物体の関連付けを可能にする。人物ＩＤは、当該軌跡に沿って移動する人物の識別情報である。物体ＩＤは、当該軌跡に沿って移動する物体の識別情報である。軌跡属性ＩＤは、当該軌跡の特徴量である。

　このように、特徴量データベース２１０を構成する各テーブルは、フレームＩＤ、トラックＩＤ、人物ＩＤ、及び物体ＩＤで関連付けられており、クエリ設定部２４からの検索要求に対して、これらの識別情報によって他のテーブルのデータを取得できるように構成されている。

　図４は、特徴量ＤＢ構築処理のフローチャートである。

　まず、映像取得部１１が、複数のカメラ３００から映像を取得し、映像のフレームを間引いてフレームレートを低く（例えば３０ｆｐｓから５ｆｐｓに）する映像取得処理を実行する（１０１）。次に、骨格推定部１２が、取得した映像に写っている人物の骨格を推定し、骨格データを生成する骨格推定処理を実行する（１０２）。次に、人物矩形抽出部１３が、映像から骨格推定処理（１０２）によって映像から得られた骨格モデルの外形を示す矩形を生成する人物矩形抽出処理を実行する（１０３）。次に、人物特徴抽出部１４が、人物矩形抽出処理（１０３）によって映像から得られた矩形内で人物の画像特徴量を抽出しする人物特徴抽出処理を実行する（１０４）。次に、人物追跡部１５が、人物特徴抽出処理（１０４）によって得られた人物の画像特徴を用いて、同一人物の時系列の位置情報を関連付けて、人物の軌跡にトラックＩＤを付与し、当該軌跡の特徴を抽出する人物追跡処理を実行する（１０５）。ここで、ステップ１０２とステップ１０３、ステップ１０３とステップ１０４、ステップ１０２とステップ１０３とステップ１０４は、それぞれ、深層ネットワークモデルを含むプログラムによって同時に算出されてもよい。次に、ＦＤＢ登録部２２が、人物特徴抽出部１４から出力された人物画像特徴と、人物追跡部１５から出力される人物の軌跡とをＦＤＢサーバ２００へ登録するＦＤＢ登録処理を実行する（１０６）。

　次に、時系列行動認識部１６が、人物特徴抽出処理（１０４）によって得られた同一人物の過去数フレームの骨格推定結果を用いて、人物の行動の種類を識別する時系列行動認識処理を実行する（１０７）。次に、フレームレート調整部１７が、時系列行動認識部１６で識別された人物の行動種別のフレームレートを低く（例えば５ｆｐｓから１ｆｐｓに）するフレームレート調整処理を実行する（１０８）。次に、ＦＤＢ登録部２２が、フレームレートが調整された人物の行動の種類（アクションＩＤ）をＦＤＢサーバ２００へ登録するＦＤＢ登録処理を実行する（１０９）。

　また、フレームレート調整部１９が、映像取得部１１が取得した映像のフレームレートを低く（例えば５ｆｐｓから１ｆｐｓに）するフレームレート調整処理を実行する（１１１）。次に、物体認識部２１が、映像取得部１１が取得した映像に写っている物体を認識し、当該物体の種別を識別する物体認識処理を実行する（１１２）。次に、ＦＤＢ登録部２２が、物体認識処理（１１２）で識別された物体の種別（物体属性ＩＤ）をＦＤＢサーバ２００へデータを登録するＦＤＢ登録処理を実行する（１１３）。

　また、フレームレート調整部１８が、人物特徴抽出部１４で抽出された人物の画像特徴量のフレームレートを低く（例えば５ｆｐｓから１ｆｐｓ）するフレームレート調整処理を実行する（１２１）。次に、人物属性推定部２０が、人物の年齢、性別、髪型、髪の色、服装の色、服の種類など映像から推定できる属性を推定する人物属性推定処理を実行する（１２２）。次に、ＦＤＢ登録部２２が、人物属性推定処理（１２２）で推定された人物の属性（人物属性ＩＤ）をＦＤＢサーバ２００へ登録するＦＤＢ登録処理を実行する（１２３）。

　図５Ａは、リアルタイム検知処理のフローチャートである。

　リアルタイム検知処理では、特徴量データベース２１０にリアルタイムに登録される特徴量に、目撃情報（例えば、人物の外見、人物の行動、物体の外見などの属性）又は人物画像特徴量をクエリとして、ターゲットを検知する。なお、ステップ１５２～１５７の処理と、ステップ１５１、ステップ１６１～１６３の処理は並列に実行される。

　まず、リアルタイム検知部２６は、検知対象が検知対象データベース２２０に登録されているかを判定し（１５１）、これと並列または前後して、検知ルールメモリ２７に検知ルールが設定済みであるかを判定する（１５２）。

　ステップ１５１で、検知対象が検知対象データベース２２０に登録されていると判定されると、ステップ１６１に進む。一方、ステップＳ１５２で検知ルールメモリ２７に検知ルールが設定されていれば、ステップ１５３に進む。ステップ１５１とステップ１５２がともにＮｏであれば、検知対象が特徴量データベース２１０に登録されておらず、かつ検知ルールメモリ２７に検知ルールが設定されていないので、リアルタイム検知処理を終了する。

　ステップ１５１で、検知対象が検知対象データベース２２０に登録されていると判定されると、リアルタイム検知部２６は、人物特徴抽出部１４から取得した人物画像特徴をクエリにして、検知対象ＤＢ２２０に登録された人物の人物画像特徴に対する検索を実施し、類似度の高い人物が登録されているかを確認する（１６１）。類似度の高い人物が登録されていなければ（１６２でＮｏ）、リアルタイム検知処理を終了する。一方、類似度の高い人物が登録されていれば（１６２でＹｅｓ）、対象者発見の画面を生成し、ユーザに通知する（１６３）。このとき、類似度の高い人物に関連する軌跡があれば、当該軌跡のトラックＩＤから人物ＩＤ及び物体ＩＤを介して、当該人物及び当該人物と共にしている物体を追跡して、複数時点での人物の特徴と提示できる。

　ステップ１５２で、検知ルールメモリ２７に検知ルールが設定されていれば、属性推定や行動識別の結果が検知ルールメモリ２７に設定された検知ルールに該当するかを確認する（１５３）。属性推定及び行動識別のいずれの結果も検知ルールメモリ２７に設定された検知ルールに該当しなければ（１５４でＮｏ）、リアルタイム検知処理を終了する。一方、属性推定及び行動識別の結果が検知ルールメモリ２７に設定された検知ルールに該当すれば（１５４でＹｅｓ）、対象者発見の画面を生成し、ユーザに通知する（１５５）。このとき、発見された人物に関連する軌跡があれば、当該軌跡のトラックＩＤから人物ＩＤ及び物体ＩＤを介して、当該人物及び当該人物と共にしている物体を追跡して、複数時点での人物の特徴と提示できる。

　その後、ユーザが通知された映像を見て、対象者を発見したかを判定する（１５６）。なお、リアルタイム検知部２６がステップ１５６における判定を行ってもよい。ユーザが対象者を発見すれば（１５６でＹｅｓ）、発見した人物の特徴を検知対象データベース２２０に登録して（１５７）、リアルタイム検知処理を終了する。この際、該当の検知ルールを検知ルールメモリ２７から削除しもよい。ユーザが対象者を発見した場合（ステップ１５６でＹｅｓ）、ステップ１５７の処理により、対象者の人物画像が検知対象データベース２２０に登録され、次回のリアルタイム検知処理では、同一人物のリアルタイム検知方法が、ステップ１５１、ステップ１６１～１６３に移行する。

　図５Ｂは、ユーザによる映像検索処理のフローチャートである。

　図５Ｂに示す映像検索処理では、ユーザが任意のタイミングで、図７に示す検索画面７００を用いて映像検索処理を実施する（１７１）。ユーザが映像検索結果に対象者を発見した場合（１７２でＹｅｓ）、発見した人物の人物画像特徴を検知対象データベース２２０に登録して（１７３）、映像検索処理を終了する。一方、ユーザが対象者を発見しなれば、検索クエリを検知ルールとして検知ルールメモリ２７に設定する（１７４）。検索クエリから、場所や時間で変化する条件（すなわち、行動に関する属性）を除去し、場所や時間で変化しない条件（例えば、人物の年齢、性別、髪型、髪の色、着用しているアクセサリー、服装の色、服の種類など）を残した検知ルールを生成するとよい。その後、映像検索処理を終了する。

　図５Ｂに示す映像検索処理では、ユーザは、画面表示された検索結果を見て、目撃情報に該当する人物が存在するか否かを入力する。映像解析システム１００は、ユーザの入力に基づいて検知ルールを生成する。すなわち、目撃情報に該当する人物が発見された場合、その人物の画像特徴を、特徴量データベース２１０と別に設けられる検知対象データベース２２０に登録し、該特徴量を後のリアルタイム検知に利用可能とする。一方、目撃情報に該当する人物が発見されなかった場合、検索クエリから検知ルールを生成し検知ルールメモリ２７に設定する。このため、発見された人物の特徴量を用いて特徴量データベース２１０を検索でき、目撃情報に合致する人物を高精度に発見できる。

　図６は、本実施例の映像解析システム１００による処理を示す図である。

　本実施例の映像解析システム１００では、人物追跡部１５が特徴量が近似する人物を追跡し、軌跡毎に一意のトラックＩＤを付与する。

　骨格推定部１２は、フレーム（５ｆｐｓ）毎に骨格推定結果から人物を推定し、フレーム毎かつ人物毎に一意の人物ＩＤを付与する。時系列行動認識部１６は、フレーム（５ｆｐｓ）毎の骨格推定結果を複数用いて、人物の行動の種類を識別する。時系列行動認識部１６は、骨格推定部１２と同等のフレーム（５ｆｐｓ）毎に実施されてもよいが、図６では記載の都合上、骨格推定よりも間引いて表現している。

　人物属性推定部２０は、例えば１ｆｐｓに間引かれたフレーム映像から人物の属性を推定し、人物属性ＩＤを決定する。また、物体認識部２１は、例えば１ｆｐｓに間引かれたフレーム映像から物体の種別を識別し、物体属性ＩＤを決定する。

　このように、映像からの人物の属性や行動を認識する際、行動認識が最も高いフレームレートを必要とする。一方、人物の属性は急に変化する性質ではないため、行動認識に使用されない属性の認識は、低いフレームレートで実行する。

　図７は、検索画面７００の一例を示す図である。

　図７に示す検索画面７００は、検索指示ボタン７１０、カメラ指定欄７２０、日時指定欄７３０、属性指定欄７４０及び検索結果表示領域７５０を含む。

　検索指示ボタン７１０は、検索クエリをＦＤＢサーバ２００に送信するために操作されるボタンである。カメラ指定欄７２０は、検索対象とする映像を取得したカメラ３００、すなわち検索対象とする位置をプルダウンによって選択する欄である。日時指定欄７３０は、検索対象とする映像の日時の範囲を入力する欄である。属性指定欄７４０は、検索クエリに含める人物の属性、人物の行動、物体の属性の一つ以上の項目を設定するための欄である。検索結果表示領域７５０は、検索結果のフレーム映像を表示する領域である。検索結果として表示されたフレーム映像を選択操作すると、当該フレーム映像の近傍の動画像を再生するとよい。動画像の再生中は、ユーザが対象者を発見したかを入力できるボタンを表示するとよい。

　以上に本発明の実施例である、監視カメラ映像を解析する映像解析システムについて説明したが、工場の製造工程において、作業者による設備の操作行動やワークに対する作業を識別して、特定の行動や動きを識別することも可能である。

　以上に説明したように、本実施例の映像解析システムは、映像中の生物の属性を抽出する生物属性推定部（人物属性推定部２０）と、映像中の物体の属性を抽出する物体認識部２１と、映像中の生物の動きを認識する動き認識部（時系列行動認識部１６）と、前記各部による処理の実行タイミングを制御するためのフレームレート調整部１７～１９とを有し、フレームレート調整部１７～１９は、時系列行動認識部１６が処理する映像のフレームレート（処理の実行間隔）を、人物属性推定部２０及び物体認識部２１の少なくとも一方が処理する映像のフレームレート（処理の実行間隔）より高く設定する。すなわち、特徴量の継続性に着目して、属性推定と行動認識で異なるフレームレートで処理をするので、特徴量データベース２００の構築及びリアルタイム検知の計算コストを低減できる。

　また、フレームレート調整部１９が調整する処理の実行タイミングを出力する着目時間制御部２３を備え、フレームレート調整部１９は、着目時間制御部２３からの出力に従って時系列行動認識部１６における処理の実行間隔を制御するので、ユーザの要求や用途に応じて、フレームレートを適切に調整できる。

　また、属性及び動きの少なくとも一方をクエリとして特徴量データベース２１０を検索する検索部（クエリ設定部２４）と、人物又は物体の属性に関する特徴量を含む検索クエリが設定される検知ルール記憶部（検知ルールメモリ２７）と、検知ルールメモリ２７に設定された検索クエリが人物属性推定部２０、物体認識部２１、及び時系列行動認識部１６からの出力に合致するかを判定するリアルタイム検知部２６と備えるので、特徴量データベース２１０に対するリアルタイム検知機能と履歴検索機能を実現できる。

　また、リアルタイム検知部２６は、ユーザが検知クエリとして入力した属性によって得られた検索結果のうちユーザに選択された生物又は物体の特徴量が、人物属性推定部２０、物体認識部２１、及び時系列行動認識部１６からの出力に合致するかを判定するので、目撃情報のクエリを用いた履歴検索によって得られた対象の映像の特徴量をリアルタイム検知ルールとするので、迅速かつ正確にターゲットを発見できる。これによりターゲットの逃走やターゲットによって引き起こされる新たなトラブルを未然に防止できる。

　また、リアルタイム検知部２６は、ユーザが検知クエリとして入力した属性によって得られた検索結果のうちユーザに選択されたものがない場合、ユーザが入力した属性の検索クエリに基づいて検知ルールを生成するので、ターゲットがヒットしない場合でもリアルタイム検知を継続できる。

　また、前記映像中の生物を追跡して軌跡を生成する人物追跡部１５を備え、特徴量データベース２１０は、人物属性推定部２０、物体認識部２１、及び時系列行動認識部１６からの出力を生物識別子（人物ＩＤ）を用いて関連付けて登録し、クエリ設定部２４は、特定の生物の属性又は動きを人物ＩＤで関連付けて特徴量データベース２１０で検索するので、人物ＩＤを経由して間欠データを補完しながら検索結果、検知結果を取得できる。

　また、特徴量データベース２１０９は、人物属性推定部２０、物体認識部２１、及び時系列行動認識部１６からの出力を軌跡ＩＤを用いて関連付けて登録し、クエリ設定部２４は、特定の生物の属性又は動きを軌跡ＩＤで関連付けて特徴量データベース２１０を検索するので、軌跡ＩＤを経由して間欠データを補完しながら検索結果、検知結果を取得できる。

　また、時系列行動認識部１６は、人物の行動における同時多発事象を検出するので、環境の異常を速やかに検知できる。

　なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。

　また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

　各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記憶装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に格納することができる。

　また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

Claims

　映像解析システムであって、
　所定の処理を実行する演算装置と、前記演算装置に接続された記憶デバイスとを有する計算機によって構成され、
　前記演算装置は、映像中のオブジェクトの特徴量データを格納する特徴量データベースにアクセス可能であって、
　前記映像解析システムは、
　前記演算装置が、前記映像中の生物の属性を抽出する生物属性推定部と、
　前記演算装置が、前記映像中の物体の属性を抽出する物体認識部と、
　前記演算装置が、前記映像中の生物の動きを認識する動き認識部と、
　前記演算装置が、前記各部による処理の実行タイミングを制御するためのフレームレート調整部とを有し、
　前記フレームレート調整部は、前記動き認識部が処理する映像のフレームレートを、前記生物属性推定部及び前記物体認識部の少なくとも一方が処理する映像のフレームレートより高く設定することを特徴とする映像解析システム。
　請求項１に記載の映像解析システムであって、
　前記フレームレート調整部は、前記動き認識部における処理の実行間隔を、前記生物属性推定部及び前記物体認識部の少なくとも一方における処理の実行間隔より高く設定することを特徴とする映像解析システム。
　請求項１に記載の映像解析システムであって、
　前記フレームレート調整部が調整する処理の実行タイミングを出力する着目時間制御部を備え、
　前記フレームレート調整部は、前記着目時間制御部からの出力に従って動き認識部における処理の実行間隔を制御することを特徴とする映像解析システム。
　請求項１に記載の映像解析システムであって、
　前記演算装置が、前記属性及び動きの少なくとも一方をクエリとして前記特徴量データベースを検索する検索部と、
　人物又は物体の属性に関する特徴量を含む検索クエリが設定される検知ルール記憶部と、
　前記検知ルール記憶部に設定された検索クエリが前記生物属性推定部、前記物体認識部、及び前記動き認識部からの出力に合致するかを判定するリアルタイム検知部と備えることを特徴とする映像解析システム。
　請求項４に記載の映像解析システムであって、
　前記リアルタイム検知部は、ユーザが検知クエリとして入力した属性によって得られた検索結果のうちユーザに選択された生物又は物体の特徴量が、前記生物属性推定部、前記物体認識部、及び前記動き認識部からの出力に合致するかを判定することを特徴とする映像解析システム。
　請求項４に記載の映像解析システムであって、
　前記リアルタイム検知部は、ユーザが検知クエリとして入力した属性によって得られた検索結果のうちユーザに選択されたものがない場合、前記ユーザが入力した属性の検索クエリに基づいて検知ルールを生成することを特徴とする映像解析システム。
　請求項４に記載の映像解析システムであって、
　前記演算装置が、前記映像中の生物を追跡して軌跡を生成する追跡部を備え、
　前記特徴量データベースは、前記追跡部、前記生物属性推定部、及び前記動き認識部からの出力を生物識別子を用いて関連付けて登録し、
　前記検索部は、特定の生物の属性又は動きを前記生物識別子で関連付けて前記特徴量データベースで検索することを特徴とする映像解析システム。
　請求項７に記載の映像解析システムであって、
　前記特徴量データベースは、前記追跡部、前記生物属性推定部、前記物体認識部、及び前記動き認識部からの出力を軌跡識別子を用いて関連付けて登録し、
　前記検索部は、特定の生物の属性又は動きを前記軌跡識別子で関連付けて前記特徴量データベースを検索することを特徴とする映像解析システム。
　請求項１に記載の映像解析システムであって、
　前記動き認識部は、人物の行動における同時多発事象を検出することを特徴とする映像解析システム。
　映像解析方法であって、
　所定の処理を実行する演算装置と、前記演算装置に接続された記憶デバイスとを有する計算機によって実行され、
　前記演算装置は、映像中のオブジェクトの特徴量データを格納する特徴量データベースにアクセス可能であって、
　前記映像解析方法は、
　前記演算装置が、前記映像中の生物の属性を抽出する生物属性推定手順と、
　前記演算装置が、前記映像中の物体の属性を抽出する物体認識手順と、
　前記演算装置が、前記映像中の生物の動きを認識する動き認識手順と、
　前記演算装置が、前記各部の実行タイミングを制御するためのフレームレート調整手順とを有し、
　前記フレームレート調整手順では、前記動き認識手順において処理される映像のフレームレートを、前記生物属性推定手順及び前記物体認識手順の少なくとも一方において処理する映像のフレームレートより高く設定することを特徴とする映像解析方法。