WO2021260899A1

WO2021260899A1 - 追跡装置、追跡システム、追跡方法、および、追跡プログラム

Info

Publication number: WO2021260899A1
Application number: PCT/JP2020/025078
Authority: WO
Inventors: 彦俊中里; 健二阿部
Original assignee: 日本電信電話株式会社
Priority date: 2020-06-25
Filing date: 2020-06-25
Publication date: 2021-12-30
Also published as: US20230252647A1; JP7439925B2; JPWO2021260899A1

Abstract

追跡装置（２）は、追跡対象についての特徴量を１つ以上含む認識モデルが追跡対象ごとに格納される認識モデル格納部（２５）と、自身の監視カメラの撮影画像から認識モデルを用いて、追跡対象を抽出する候補検出部（２３）と、候補検出部（２３）が追跡対象を抽出するときに用いた認識モデルに対して、抽出した追跡対象から検出した新たな特徴量を追加することで認識モデル格納部（２５）内の認識モデルを更新するモデル作成部（２４）と、自身が更新した認識モデルを、自身の監視カメラから所定範囲内に位置する他の監視カメラをもとに監視を行う他装置に配布する通信部（２６）とを有する。

Description

追跡装置、追跡システム、追跡方法、および、追跡プログラム

　本発明は、追跡装置、追跡システム、追跡方法、および、追跡プログラムに関する。

　IoT（Internet of Things）デバイスの一つであるwebカメラの普及に伴い、webカメラの撮影画像から有益な情報を機械的に抽出するシステムが提案されている。
　非特許文献１には、蝶類画像の色・形状・テクスチャから構成される特徴ベクトルを自己組織化マップ（SOM：Self-Orgnanizing Map）に適用することで、蝶の種類を分別することが記載されている。
　非特許文献２には、畳み込みニューラルネットワーク（CNN：Convolutional Neural Network）とSOMとを組み合わせて、人の感情表現の画像を学習対象とし、ロボットにその感情表現を反映することが記載されている。

日向崇、西川郁子、「自己組織化マップを用いた蝶類標本画像データベースの構築」、日本ファジィ学会誌 Vol.14 No.1　pp74-81 2002、［online］、［2020年6月12日検索］、インターネット〈URL：https://www.jstage.jst.go.jp/article/jfuzzy/14/1/14_KJ00002088995/_pdf/-char/ja〉 Nikhil Churamani et al."Teaching Emotion Expressions to a Human Companion Robot using Deep Neural Architectures",DOI: 10.1109/IJCNN.2017.7965911 Conference: 2017 International Joint Conference on Neural Networks (IJCNN), At Anchorage, Alaska, USA、［online］、［2020年6月12日検索］、インターネット〈URL：https://www.researchgate.net/publication/318191605_Teaching_Emotion_Expressions_to_a_Human_Companion_Robot_using_Deep_Neural_Architectures〉

　街中のさまざまな場所に設置されたwebカメラの撮影画像からナイフを所持している人物などの特定の行動を起こした移動対象を追跡対象として検出し、その人物の移動軌跡をカメラを使って継続して捕捉する防犯システムを検討する。

　従来の追跡システムでは、撮影画像から移動対象を追跡するためには、追跡対象の認識モデルをあらかじめ学習させておく必要があった。そのため、突発的な強盗犯など事前学習がなされていない移動対象を追跡できなかった。

　そこで、本発明は、事前学習がなされていない移動対象を追跡することを主な課題とする。

　前記課題を解決するために、本発明の追跡システムは、以下の特徴を有する。
　本発明は、追跡対象についての特徴量を１つ以上含む認識モデルが追跡対象ごとに格納される認識モデル格納部と、
　自身の監視カメラの撮影画像から認識モデルを用いて、追跡対象を抽出する候補検出部と、
　前記候補検出部が追跡対象を抽出するときに用いた認識モデルに対して、抽出した追跡対象から検出した新たな特徴量を追加することで前記認識モデル格納部内の認識モデルを更新するモデル作成部と、
　自身が更新した認識モデルを、自身の監視カメラから所定範囲内に位置する他の監視カメラをもとに監視を行う他装置に配布する通信部とを有することを特徴とする。

　本発明によれば、事前学習がなされていない移動対象を追跡することができる。

本実施形態に係わる追跡対象画像と、その画像から抽出された特徴量とを示す説明図である。本実施形態に係わる図１の特徴量を抽出するときに使用されるCNNの説明図である。本実施形態に係わる図１の特徴量を抽出した結果をSOMとして表現した説明図である。本実施形態に係わる移動対象追跡システムの構成図である。本実施形態に係わる図１の追跡対象画像をもとに移動対象追跡システムが人物を追跡する処理を示すテーブルである。本実施形態に係わる図５に続いて、監視者が追跡対象画像から犯人を指定した後の処理を示すテーブルである。本実施形態に係わる図３のSOMについて、人物Pc1の派生モデルを示す説明図である。本実施形態に係わる移動対象追跡システムにおける監視オフによる省力化処理を示すテーブルである。本実施形態に係わる追跡装置のハードウェア構成図である。

　以下、本発明の一実施形態について、図面を参照して詳細に説明する。
　まず、導入として、図１～図３を参照して図４の移動対象追跡システム１００が行う追跡処理の概要を説明する。図４からは、本発明の構成を明らかにする。

　図１は、追跡対象が写る画像と、その画像から抽出された特徴量とを示す説明図である。本実施形態では、追跡対象の一例として、強盗犯の犯人を例示する。一方、移動対象追跡システム１００が扱う追跡対象は、人物に限定されず、ペットなどの動物や、車両などに適用してもよい。以下、地点Ａで発見された強盗犯の犯人が、地点Ｂ→地点Ｃに逃走したとする。
　図１上部に示すように、地点Ａを担当する追跡装置２（図４）は、地点Ａを監視するカメラから、１人分の移動対象（犯人）を検出した。具体的には、地点Ａの画像認識アプリケーションは、ナイフをかざす人物などの危険行動をカメラの映像から検出し、その人物の画像領域を追跡対象画像Pa1として切り取った。

　地点Ａの監視カメラが検出した追跡対象画像Pa1と、その追跡対象画像Pa1から即席的に構築された認識モデルMa1とが対応づけられている。認識モデルMa1には、追跡対象画像Pa1から抽出した特徴量として［人の輪郭C11］が含まれる。なお、地点Ａの初期発見時には、監視カメラの配置と対象の位置等様々な制約から、対象の様々な特徴を映像からすぐに検出できない。
　地点Ａで作成された認識モデルMa1は、地点Ａから周囲の地点Ｂに伝搬することで、追跡を継続する（認識モデルMa1から発する２つの矢印として図示）。

　図１中央部に示すように、地点Ｂを担当する追跡装置２は、地点Ｂを監視するカメラから、伝搬された認識モデルMa1の特徴量に合致する２人分の移動対象を検出した。
　１人目として、追跡対象画像Pb1と、その追跡対象画像Pb1から抽出された認識モデルMb1とが対応づけられている。認識モデルMb1には、１人目が合致する認識モデルMa1の［人の輪郭C11］に加えて、新たに追跡対象画像Pb1から抽出した特徴量［男の服装C21］が含まれる。
　２人目として、追跡対象画像Pb2と、その追跡対象画像Pb2から抽出された認識モデルMb2とが対応づけられている。認識モデルMb2には、２人目が合致する認識モデルMa1の［人の輪郭C11］に加えて、新たに追跡対象画像Pb2から抽出した特徴量［女の服装C22］が含まれる。
　地点Ｂで作成された認識モデルMb1,Mb2は、地点Ｂから周囲の地点Ｃに伝搬することで、追跡を継続する（認識モデルMb1,Mb2から発する合計３つの矢印として図示）。

　図１下部に示すように、地点Ｃを担当する追跡装置２は、地点Ｃを監視するカメラから、伝搬された認識モデルMb1の特徴量に合致する１人分の移動対象と、伝搬された認識モデルMb2の特徴量に合致する２人分の移動対象（つまり合計３人分）を検出した。
　１人目として、追跡対象画像Pc1と、その追跡対象画像Pc1から抽出された認識モデルMc1とが対応づけられている。認識モデルMc1には、１人目が合致する認識モデルMb1の［人の輪郭C11］および［男の服装C21］に加えて、新たに追跡対象画像Pc1から抽出した特徴量［犯人の顔C31］が含まれる。

　２人目として、追跡対象画像Pc2と、その追跡対象画像Pc2から抽出された認識モデルMc2とが対応づけられている。認識モデルMc2には、２人目が合致する認識モデルMb2の［人の輪郭C11］および［女の服装C22］に加えて、新たに追跡対象画像Pc2から抽出した特徴量［主婦の顔C32］が含まれる。
　３人目として、追跡対象画像Pc3と、その追跡対象画像Pc3から抽出された認識モデルMc3とが対応づけられている。認識モデルMc3には、３人目が合致する認識モデルMb2の［人の輪郭C11］および［女の服装C22］に加えて、新たに追跡対象画像Pc3から抽出した特徴量［学生の顔C33］が含まれる。

　このように、地点Ａ→地点Ｂ→地点Ｃと捕捉時間が増えることで、獲得できる特徴量も認識モデルに次々と追加されていく。これにより、追跡過程の映像で得られた特徴量を以降の過程で逐次認識モデルに反映させることで、監視カメラの映像に映る多数の人物から追跡対象候補を絞り込むことができる。図１では、以下の順序で、認識モデルが豊富になっていく例を示した。
　（地点Ａ）背後の輪郭のみ
　（地点Ｂ）着ている服装の特徴が判明
　（地点Ｃ）顔の詳細な特徴まで判明

　図２は、図１の特徴量を抽出するときに使用されるCNNの説明図である。
　CNN２００は、入力画像２０１を受け付ける入力層２１０と、隠れ層２２０と、入力画像２０１の判定結果を出力する出力層２３０とが接続されて構成される。
　隠れ層２２０は、畳み込み層２２１→プーリング層２２２→…→畳み込み層２２６→プーリング層２２７と交互に繰り返される。各畳み込み層では畳み込み処理（画像の抽象化）が行われ、各プーリング層では画像の位置移動に対する普遍性を獲得するためのプーリング処理が行われる。

　そして、プーリング層２２７からは、全結合層２２８，２２９に接続される。この全結合層直前（プーリング層２２７と全結合層２２８との境界）には、画像の色や形状など様々な特徴を内包する最終特徴量マップが含まれており、図１で抽出する認識モデルの特徴量として使用できる。
　つまり、図１の追跡対象画像Pa1などを入力画像２０１とし、その入力画像２０１から伝搬されるCNN２００の全結合層直前の最終特徴量マップ（高次元ベクトル）から特徴量を求めることができる。
　なお、図２のCNNは、特徴量を抽出するための手段の１つに過ぎず、他の手段を用いてもよい。例えば、CNNに限定されず、追跡対象の物体の画像の色や形状等の様々な特徴を内包して特徴量ベクトル化できる他の手段を、特徴量を抽出するために用いてもよい。または、追跡装置２の管理者は、認識モデルに加える特徴量として、輪郭、服装、眼鏡などの人物の特徴を個別に抽出できるアルゴリズムにより、明示的に個々の特徴量を抽出してもよい。

　図３は、図１の特徴量を抽出した結果をSOMとして表現した説明図である。図１と同様に、認識モデルMa1→認識モデルMb1などの図示した矢印は、認識モデルが配布される経路を示す。この経路情報は、各認識モデルに書き込まれることで、自身の認識モデルが他のどの認識モデルから配布（派生）したものかがわかる。
　SOMとは、高次元の観測データセットに対し、データ分布の位相的構造を保存しつつ、2次元空間へ写像したデータ構造であり、教師なし学習アルゴリズムに用いられる。SOM上で隣り合う者同士は観測空間でも互いに近いデータベクトルを持つ。
　例えば、認識モデルMb1には、［人の輪郭C11］と、［男の服装C21］とがSOM上で隣り合う。これは、［人の輪郭C11］という特徴量をもつ追跡対象から、新たに［男の服装C21］が検出されたことを意味する。

　なお、SOMでは、入力ベクトル間の二次元マップ上における位置関係からデータの分類が可能である。そのため、各入力情報の次元ごとの重みを伝播、学習を繰り返すことで入力空間でのサンプルの分布を写像するように学習される。
　各SOM（認識モデル）に対して、特徴量を追加する処理の詳細は、例えば、参考文献「新しいモデリング・ツールとしてのKohonenネットワーク」、［2020年6月12日検索］、インターネット〈URL：https://cicsj.chemistry.or.jp/15_6/funa.html〉に記載されている。

　この参考文献をもとに、図３のSOMを作成するには、射影した特徴量から得られる「勝者ニューロン」をもとに、「U-matrix法」によりベクトルから一定範囲以内の領域を割り出し、割り出された追跡対象のSOMマップ上における存在領域（特徴量）を、認識モデルに追加すればよい。
　「勝者ニューロン」とは、参照ベクトル(1入力ベクトル)と一番似た重みベクトルをもつニューロンである。勝者ニューロンcとその近隣のニューロンの重みベクトルを入力ベクトルに近づくように、重みベクトルの修正を行う。
　「U-matrix法」とは、隣接する出力層ニューロンの各ユニット間の距離情報をもとに、隣接するユニット間の類似性/非類似性を視覚的に確認できるようにした手法である。類似性の低い（距離的に遠い）ニューロンの間が「山」になって表現される。

　図４は、移動対象追跡システム１００の構成図である。
　移動対象追跡システム１００は、監視センタ内の監視者が用いる監視端末１と、街中などの各監視地点に配備される追跡装置２（地点Ａの追跡装置２Ａ、地点Ｂの追跡装置２Ｂ）とがネットワークで接続されて構成される。
　なお、追跡装置２は図４では２台を例示したが、１台以上でもよい。また、１つの地点を１台の追跡装置２が担当することとしてもよいし、複数の地点を１台の追跡装置２が担当することとしてもよい。
　追跡装置２は、画像報告部２１と、画像ファイル格納部２２と、候補検出部２３と、モデル作成部２４と、認識モデル格納部２５を記憶する記憶部と、通信部２６とを有する。
　地点Ａの追跡装置２Ａは、画像報告部２１Ａと、画像ファイル格納部２２Ａと、候補検出部２３Ａと、モデル作成部２４Ａと、認識モデル格納部２５Ａと、通信部２６Ａとを有する（符号の末尾「Ａ」）。
　地点Ｂの追跡装置２Ｂは、画像報告部２１Ｂと、画像ファイル格納部２２Ｂと、候補検出部２３Ｂと、モデル作成部２４Ｂと、認識モデル格納部２５Ｂと、通信部２６Ｂとを有する（符号の末尾「Ｂ」）。

　以下、図４に記載の各ステップ（Ｓ１１～Ｓ１９）を参照しつつ、追跡装置２の各構成要素を説明する。なお、図４に示したステップや矢印は、追跡装置２の各構成要素間の関係を示す一部のものを例示しただけであり、図示されていない他の構成要素間にも、適宜メッセージの通知が行われる。

　画像ファイル格納部２２Ａには、図示しない監視カメラから撮影された映像が格納される。画像報告部２１Ａは、危険行為検出等から発見した犯人候補の（追跡対象の）映像を画像ファイル格納部２２Ａから読み出して、監視端末１に送信し続ける（Ｓ１１）。つまり、各地点で検出された追跡対象候補の画像と、その検出に用いた認識モデルとの時系列情報が、刻々と監視センタに集約される。
　モデル作成部２４Ａは、画像ファイル格納部２２Ａ内の映像から候補検出部２３Ａが抽出した追跡対象画像（Ｓ１２）を画像解析し、その結果である認識モデル（例えば図３の認識モデルMa1）を作成する。認識モデルMa1は、認識モデル格納部２５Ａに格納される（Ｓ１３）。
　なお、モデル作成部２４Ａは、図２のCNNと、図３のSOMとを組み合わせて認識モデルを作成してもよいし、この組合せに限定せずに、認識モデルを作成してもよい。例えば、モデル作成部２４Ａは、図２のCNNにより抽出した特徴量をSOM以外のデータ構造に配置してもよいし、図２のCNN以外の方法で抽出した特徴量をSOMのデータ構造に配置してもよい。

　通信部２６Ａは、モデル作成部２４Ａが作成した認識モデルMa1を、隣接する地点Ｂの通信部２６Ｂに配布する（Ｓ１４）。なお、配布先は、隣接する地点に限定されず、例えば、対象検出時点から一定距離の範囲以内(ex.半径5km以内)の地点を担当する追跡装置２も該当する。
　通信部２６Ｂは、Ｓ１４で配布された地点Ａからの認識モデルMa1を自身の認識モデル格納部２５Ｂに反映しつつ（Ｓ１５）、候補検出部２３Ｂに通知する（Ｓ１６）。

　候補検出部２３Ｂは、認識モデルMa1をもとに地点Ｂの画像ファイル格納部２２Ｂ内の映像を監視し、認識モデルMa1に合致する２人の人物を追跡対象の候補として検出する。そして、画像報告部２１Ｂは、検出元の認識モデルMa1と、新たに検出された２人の人物が写る追跡対象画像とを監視端末１に通知する（Ｓ１７）。これにより、監視者は、現時点で最新の追跡状況を知ることができる。

　モデル作成部２４Ｂは、候補検出部２３Ｂから通知された検出元の認識モデルMa1に新たな特徴量を追加した２人の認識モデルMb1,Mb2を作成する（つまりMa1を更新する）。更新された認識モデルMb1,Mb2は、自身の認識モデル格納部２５Ｂに格納されるとともに（Ｓ１８）、通信部２６Ｂから他地点に配布される。
　なお、Ｓ１４の矢印の逆方向として、更新された認識モデルMb1,Mb2が地点Ａに戻されると（今回の配布先＝前回の配布元）、認識モデル格納部２５Ａ内の認識モデルMa1は、更新された認識モデルMb1,Mb2に差し替わる。換言すると、古い認識モデルMa1の特徴量が、新しい認識モデルMb1,Mb2の特徴量として引き継がれる。
　これにより、各地点の認識モデル格納部２５が保有する認識モデル数に比例して増加しなくなり、検出所要時間を削減できる。

　ここで、監視者は、Ｓ１７で通知された犯人候補映像から、目視確認で犯人だと断定できる場合に正解トリガを監視端末１に入力する。なお、追跡対象の候補数は検出地点から離れるにつれ爆発的に増加するため、監視者は正解フラグを早期に入力することが望ましい。
　監視端末１は、正解トリガとして入力された犯人の認識モデルを各モデル作成部２４に通知することで、犯人以外の認識モデルを各認識モデル格納部２５から削除させ、監視処理の軽量化を行う（Ｓ１９，詳細は図６，図７で後記）。

　図５は、図１の追跡対象画像をもとに移動対象追跡システム１００が人物を追跡する処理を示すテーブルである。テーブルの列は各追跡装置２が担当する地点Ａ～地点Ｃを示し、地点Ｂからは地点Ａおよび地点Ｃが近傍に位置するものの、地点Ａと地点Ｃとは近傍ではない。また、テーブルの行はテーブルの上から下に向かって経過する時刻を示す。
　地点Ａの追跡装置２は、犯人が映る追跡対象画像Pa1（以下、人物Pa1）を発見し（時刻t11）、その人物の認識モデルMa1を作成する（時刻t12）。
　地点Ｂの追跡装置２は、初期伝播として地点Ａの追跡装置２から認識モデルMa1の配布を受け、候補検出部２３の映像分析アプリを起動して監視を開始する（時刻t12）。
　地点Ａの追跡装置２は、認識モデルMc1に従い監視を継続するが、犯人が地点Ｂに逃走してしまう（時刻t13）。

　地点Ｂの追跡装置２は、初期伝播された認識モデルMa1から人物Pb1、Pb2の追跡対象画像を発見する（時刻t21）。そして、地点Ｂの追跡装置２は、更新前の認識モデルMa1の特徴量を維持しつつ、新たに検出された追跡対象候補の特徴量を追加することで、人物Pb1の認識モデルMb1と、人物Pb2の認識モデルMb2とを作成する（時刻t22）。地点Ｂの追跡装置２は、自身が更新した認識モデルMb1,Mb2を、拠点の周囲一定範囲内（ここでは地点Ａと地点Ｃ）へ再配布する。

　地点Ｃの追跡装置２は、地点Ｂの追跡装置２から認識モデルMb1,Mb2の配布を受け、候補検出部２３の映像分析アプリを起動して監視を開始する。地点Ａの追跡装置２は、地点Ｂの追跡装置２から認識モデルMb1,Mb2の配布を受けて認識モデルMa1を差し替え、監視を継続する。つまり、同一対象候補（同一犯人）に対する認識モデルの配布先と、その配布元とが一致する場合（ここでは地点Ａ）、配布元の古いマップが新しいマップに差し替えられる。
　ここで、犯人が地点Ｃに逃走してしまう（時刻t23）。

　地点Ｃの追跡装置２は、認識モデルMb1から人物Pc1を発見し、認識モデルMb2から人物Pc2、Pc3を発見する（時刻t31）。そして、地点Ｃの追跡装置２は、発見した人物Pc1の認識モデルMc1と、人物Pc2の認識モデルMc2と、人物Pc3の認識モデルMc3とをそれぞれ作成する（時刻t32）。地点Ｂの追跡装置２は、地点Ｃの追跡装置２から認識モデルMc1,Mc2,Mc3の配布を受け、認識モデルMb1,Mb2を差し替え、監視を継続する。
　地点Ｃの追跡装置２は、時刻t32で作成した認識モデルMc1,Mc2,Mc3に従い、監視を継続する（時刻t33）。

　図６は、図５に続いて、監視者が追跡対象画像から犯人を指定した後の処理を示すテーブルである。
　図５の時刻t33に続く図６の時刻t34では、地点Ａの追跡装置２が認識モデルMb1,Mb2に従い監視中であり、地点Ｂの追跡装置２が認識モデルMc1,Mc2,Mc3に従い監視中であり、地点Ｃの追跡装置２が認識モデルMc1,Mc2,Mc3に従い監視中である。

　ここで、監視者は、地点Ｃから通知された犯人候補映像（認識モデルMc1の人物Pc1、認識モデルMc2の人物Pc2、認識モデルMc3の人物Pc3）を目視確認し、認識モデルMc1の人物Pc1を犯人と断定する旨の正解トリガを監視端末１に入力する（時刻t41）。さらに、監視端末１（または各地点の追跡装置２）は、認識モデルMc1に対応づけられた配布履歴を参照して、人物Pc1の派生モデル「認識モデルMa1,Mb1,Mc1」を特定する。

　図７は、図３のSOMについて、人物Pc1の派生モデルを示す説明図である。破線１０１に示すように、地点Ａの認識モデルMa1→地点Ｂの認識モデルMb1→地点Ｃの認識モデルMc1の順に配布されているので、この配布経路を逆にたどることで、人物Pc1の派生モデル「認識モデルMa1,Mb1,Mc1」が得られる。このように、今後の監視対象を派生モデルに絞り込むことで、監視者の監視負担を軽減できる。

　なお、各地点の画像報告部２１が監視者に通知する（レコメンドする）映像（追跡対象画像）は、正解トリガの発見時刻から所定時間内に、正解トリガの発見地点から所定範囲内で捉えられた追跡対象候補のうち、派生モデルに該当する映像である。所定範囲内とは、発見時刻から所定時間内に発見地点から到達可能なエリアである。
　そのため、監視端末１は、（犯人の移動速度の限界値）×（所定時間）＝（移動距離）を計算し、発見地点を中心に（移動距離）の範囲内のエリアを到達可能なエリアとする。

　図６に戻り、監視端末１は、人物Pc1の派生モデル「認識モデルMa1,Mb1,Mc1」を各地点に通知する（時刻t42）。
　派生モデルの通知を受け、各地点の追跡装置２は、自身の監視対象となる認識モデル格納部２５から、派生モデルに該当しない認識モデル（Mb2,Mc2,Mc3など）を除外し、派生モデルを残す（時刻t43）。これにより、犯人とは別人を監視対象から除外することで、監視負荷を下げることができる。つまり、１台の追跡装置２あたりの保有する認識モデル格納部２５内のモデル数と、追跡対象候補との爆発的な増加を防ぐことができる。
　また、図６には該当例は存在しないが、派生モデルに該当しないマップを除外した結果、自身の保有する認識モデル格納部２５に登録されていた認識モデルが全て削除された場合には、その追跡装置２は、稼動を停止することにより、監視負荷を下げることができる。

　ここで、地点Ｃの追跡装置２は、認識モデルMc1の監視により犯人の人物Pc1を発見したとする（時刻t51）。このとき、地点Ａの追跡装置２は、犯人が発見された地点Ｃから遠い地点なので、認識モデル格納部２５Ａをクリア（認識モデルの全消去）にして監視を終了する（時刻t52）。一方、地点Ｂの追跡装置２は、犯人が発見された地点Ｃから近い地点なので、認識モデル格納部２５Ｂ内の認識モデルMc1を残して周囲の警戒を続ける。
　これにより、犯人が移動してくる範囲（前記の所定範囲）の外を監視対象から除外することで、監視者による対象特定のための映像確認時間を削減できる。

　図８は、移動対象追跡システム１００における監視オフによる省力化処理を示すテーブルである。
　前記した図６、図７の説明では監視者による正解トリガを手がかりに、今後の監視対象を絞り込む処理を述べた。一方、図８では、各地点の認識モデル格納部２５の更新頻度を手がかりに、今後の監視対象を絞り込む処理を述べる。

　時刻t1では、地点LAのモデル作成部２４は、同一エリア内（地点LA内）の同一カメラで継続して捉えられる対象人物の映像から、同一の認識モデルを生成する。つまり、対象人物が同一エリア内に居続ける場合には、次々に特徴量が検出できるので、認識モデルの作成処理も継続する。

　そして、地点LAで発見された人物の認識モデルMa1が、地点LAの近傍（半径5km以内など）に位置する地点LB,LC,LD,LEに対して初期伝播（配備）される。つまり、認識モデルにて新たに追跡対象候補を検出した時、検出したカメラから一定距離範囲以内のカメラの映像解析を担当する追跡装置２の候補検出部２３を起動させる。

　時刻t2では、地点LBで認識モデルMa1をもとに発見された人物の認識モデルMb1が、地点LBの近傍に位置する地点LA,LC,LFに対して初期伝播される。配布先の地点LA,LCでは認識モデルMa1を認識モデルMb1に更新し、配布先の地点LFでは認識モデルMb1が初期伝播（配備）される。
　時刻t3では、地点LCで認識モデルMb1をもとに発見された人物の認識モデルMc1が、地点LCの近傍に位置する地点LB,LFに対して配布される。配布先の地点LB,LFでは認識モデルMb1を認識モデルMc1に更新する。

　ここで、地点LD,LEに着目する。地点LD,LEでは、時刻t1で認識モデルMa1が配備された後、所定期間（例えば、t=2,t=3の合計２ターン）以上、自身の認識モデル格納部２５が更新されない。よって、認識モデルの更新がしばらく発生しない地点LD,LEは追跡対象候補が存在する可能性が少ないエリアであると推定される。よって、地点LD,LEそれぞれの追跡装置２（候補検出部２３）を監視オフにしてもよい。このように、追跡対象候補の移動に伴い、一定期間所有するすべての認識モデルが更新をうけない追跡装置２（候補検出部２３）を監視オフにする。

　図９は、追跡装置２のハードウェア構成図である。
　追跡装置２は、ＣＰＵ９０１と、ＲＡＭ９０２と、ＲＯＭ９０３と、ＨＤＤ９０４と、通信Ｉ／Ｆ９０５と、入出力Ｉ／Ｆ９０６と、メディアＩ／Ｆ９０７とを有するコンピュータ９００として構成される。
　通信Ｉ／Ｆ９０５は、外部の通信装置９１５と接続される。入出力Ｉ／Ｆ９０６は、入出力装置９１６と接続される。メディアＩ／Ｆ９０７は、記録媒体９１７からデータを読み書きする。さらに、ＣＰＵ９０１は、ＲＡＭ９０２に読み込んだプログラム（アプリケーションや、その略のアプリとも呼ばれる）を実行することにより、各処理部を制御する。そして、このプログラムは、通信回線を介して配布したり、ＣＤ－ＲＯＭ等の記録媒体９１７に記録して配布したりすることも可能である。

　以上説明した本実施形態では、追跡装置２が、監視カメラの映像をCNNに入力して得られる特徴量が時間経過により変動する過程で、新たな特徴量をSOMマップに追加することで認識モデル格納部２５を更新する処理について説明した。さらに、追跡装置２は、更新されたSOMマップを近傍の別地点へと伝播することで、追跡対象が逃げ回っても的確に追跡できる。

［効果］
　本発明の追跡装置２は、
　追跡対象についての特徴量を１つ以上含む認識モデルが追跡対象ごとに格納される認識モデル格納部２５と、
　自身の監視カメラの撮影画像から認識モデルを用いて、追跡対象を抽出する候補検出部２３と、
　候補検出部２３が追跡対象を抽出するときに用いた認識モデルに対して、抽出した追跡対象から検出した新たな特徴量を追加することで認識モデル格納部２５内の認識モデルを更新するモデル作成部２４と、
　自身が更新した認識モデルを、自身の監視カメラから所定範囲内に位置する他の監視カメラをもとに監視を行う他装置に配布する通信部２６とを有することを特徴とする。

　これにより、追跡対象の特徴量情報が増えるにつれて、対応する認識モデルが更新され、次々に他装置に配布される。よって、学習済の認識モデルをあらかじめ全地点でデプロイできない場合でも、初期で検出した対象の認識モデルを即席で作成し、後続カメラでの映像解析に活用できる。

　本発明は、認識モデル格納部２５には、自身が更新した認識モデルと、他装置が更新した認識モデルとが格納されており、
　通信部２６が、過去に他装置に配布した認識モデルが他装置により更新された後に、自身に再配布されたときには、認識モデル格納部２５から過去に他装置に配布した認識モデルを削除することを特徴とする。

　これにより、同一対象候補に対する認識モデルの配布先がその配布元である場合、更新した認識モデルに差し替えることで、１台あたりの所持する認識モデル数を削減し、追跡装置２の分析速度を向上できる。

　本発明は、モデル作成部２４が、追跡対象の画像の特徴を内包した特徴量ベクトルをもとに、監視カメラの撮影画像から追跡対象の特徴量を取得し、観測データセットに対しデータ分布の位相的構造を保存しつつ２次元空間へ写像したデータ構造上の領域に追跡対象の特徴量を配置することで、認識モデル格納部２５内の認識モデルを更新し、
　候補検出部２３が、監視カメラの撮影画像に映る追跡対象の特徴量が、前記データ構造上の領域に登録されている追跡対象の特徴量と近接する場合に、追跡対象を抽出することを特徴とする。

　これにより、追跡対象の特徴量を事前に定義しなくても、特徴量ベクトルから自動で抽出できる。

　本発明は、モデル作成部２４が、同一エリア内の同一カメラの映像から継続して捉えられる追跡対象から同一の認識モデルを生成し、
　候補検出部２３が、認識モデル格納部２５内の認識モデルが所定期間の間に更新されない場合、追跡対象を抽出する処理をオフにすることを特徴とする。

　これにより、追跡対象が存在する可能性がないエリアでの追跡処理をオフにすることで、追跡装置２のリソース消費を削減できる。

　本発明は、追跡装置２と、監視者が操作する監視端末１とを有する追跡システムであって、
　追跡装置が、さらに、候補検出部２３が抽出した追跡対象が映る撮影画像を監視端末１に送信する画像報告部２１を有し、
　監視端末１が、送信された撮影画像から正解の追跡対象を指定する入力を受け、正解の追跡対象を追跡装置に返信し、
　各追跡装置のモデル作成部２４が、正解の追跡対象以外の追跡対象の特徴量、および、正解の追跡対象の移動限界範囲の外にある追跡対象の特徴量を、それぞれ自身の記憶部内の認識モデルから削除するとともに、この削除に伴って認識モデルに追跡対象が存在しなくなった追跡装置については、追跡対象を抽出する処理をオフにすることを特徴とする。

　これにより、不正解の追跡対象を適切に除外することで、監視端末１に提案する追跡対象を抑制できる。

　１　　　監視端末
　２　　　追跡装置
　２１　　画像報告部
　２２　　画像ファイル格納部
　２３　　候補検出部
　２４　　モデル作成部
　２５　　認識モデル格納部
　２６　　通信部
　１００　移動対象追跡システム（追跡システム）

Claims

　追跡対象についての特徴量を１つ以上含む認識モデルが追跡対象ごとに格納される認識モデル格納部と、
　自身の監視カメラの撮影画像から認識モデルを用いて、追跡対象を抽出する候補検出部と、
　前記候補検出部が追跡対象を抽出するときに用いた認識モデルに対して、抽出した追跡対象から検出した新たな特徴量を追加することで前記認識モデル格納部内の認識モデルを更新するモデル作成部と、
　自身が更新した認識モデルを、自身の監視カメラから所定範囲内に位置する他の監視カメラをもとに監視を行う他装置に配布する通信部とを有することを特徴とする
　追跡装置。
　前記認識モデル格納部には、自身が更新した認識モデルと、他装置が更新した認識モデルとが格納されており、
　前記通信部は、過去に他装置に配布した認識モデルが他装置により更新された後に、自身に再配布されたときには、前記認識モデル格納部から過去に他装置に配布した認識モデルを削除することを特徴とする
　請求項１に記載の追跡装置。
　前記モデル作成部は、追跡対象の画像の特徴を内包した特徴量ベクトルをもとに、監視カメラの撮影画像から追跡対象の特徴量を取得し、観測データセットに対しデータ分布の位相的構造を保存しつつ２次元空間へ写像したデータ構造上の領域に追跡対象の特徴量を配置することで、前記認識モデル格納部内の認識モデルを更新し、
　前記候補検出部は、監視カメラの撮影画像に映る追跡対象の特徴量が、前記データ構造上の領域に登録されている追跡対象の特徴量と近接する場合に、追跡対象を抽出することを特徴とする
　請求項１または請求項２に記載の追跡装置。
　前記モデル作成部は、同一エリア内の同一カメラの映像から継続して捉えられる追跡対象から同一の認識モデルを生成し、
　前記候補検出部は、前記認識モデル格納部内の認識モデルが所定期間の間に更新されない場合、追跡対象を抽出する処理をオフにすることを特徴とする
　請求項１ないし請求項３のいずれか１項に記載の追跡装置。
　請求項１ないし請求項４のいずれか１項に記載の複数の追跡装置と、監視者が操作する監視端末とを有する追跡システムであって、
　各前記追跡装置は、さらに、前記候補検出部が抽出した追跡対象が映る撮影画像を前記監視端末に送信する画像報告部を有し、
　前記監視端末は、送信された撮影画像から正解の追跡対象を指定する入力を受け、正解の追跡対象を前記追跡装置に返信し、
　各前記追跡装置の前記モデル作成部は、正解の追跡対象以外の追跡対象の特徴量、および、正解の追跡対象の移動限界範囲の外にある追跡対象の特徴量を、それぞれ自身の記憶部内の認識モデルから削除するとともに、この削除に伴って認識モデルに追跡対象が存在しなくなった前記追跡装置については、追跡対象を抽出する処理をオフにすることを特徴とする
　追跡システム。
　追跡装置は、認識モデル格納部と、候補検出部と、モデル作成部と、通信部とを有しており、
　前記認識モデル格納部には、追跡対象についての特徴量を１つ以上含む認識モデルが追跡対象ごとに格納されており、
　前記候補検出部は、自身の監視カメラの撮影画像から認識モデルを用いて、追跡対象を抽出し、
　前記モデル作成部は、前記候補検出部が追跡対象を抽出するときに用いた認識モデルに対して、抽出した追跡対象から検出した新たな特徴量を追加することで前記認識モデル格納部内の認識モデルを更新し、
　前記通信部は、自身が更新した認識モデルを、自身の監視カメラから所定範囲内に位置する他の監視カメラをもとに監視を行う他装置に配布することを特徴とする
　追跡方法。
　コンピュータを、請求項１ないし請求項４のいずれか１項に記載の追跡装置として機能させるための追跡プログラム。