WO2023281559A1

WO2023281559A1 - 人物同定装置、及び人物同定方法

Info

Publication number: WO2023281559A1
Application number: PCT/JP2021/025259
Authority: WO
Inventors: 祐貴大西; 庭育李
Original assignee: 三菱電機株式会社
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2023-01-12

Abstract

人物同定装置（１）は、人物検出部（１２）が検出した人物を囲う領域を画像毎に分割する領域分割部（１０２）と、領域分割部（１０２）が分割した領域に基づいて、人物検出部（１２）が検出した人物の部分的な人物特徴量を画像毎に抽出する領域特徴量抽出部（１０３）と、領域特徴量抽出部（１０３）が画像毎に抽出した部分的な人物特徴量を比較することにより、人物検出部（１２）が画像毎に検出した人物が同一人物であるか否かを判定する領域特徴量比較部（１０４）と、を備えている。

Description

人物同定装置、及び人物同定方法

　本開示は、人物同定装置に関する。

　従来、複数のカメラが撮影した各動画に映った人物が同一人物であるか否かを判定することにより、例えば、人物の移動経路の自動取得、又は不審者の追跡等を行う人物同定技術が提案されている。

　非特許文献１には、視野が重複していない複数のカメラが撮影した各動画に映った人物が同一人物であるか否かを判定する技術が記載されている。当該技術では、当該各動画の現フレーム及び前フレームから連続する複数のフレームを抜き出し、抜き出した複数のフレームを用いて人物の人物特徴量を動画毎に抽出し、動画毎に抽出した人物特徴量を比較することにより、人物の同一性を判定する。

Jones, M.J., Rambhatla, S., "Body Part Alignment and Temporal Attention for Video-Based Person Re-Identification", British Machine Vision Conference (BMVC), September 2019.

　非特許文献１の技術では、時間的に連続したフレームの中で観測される人物の向きは、一方向に偏りやすいため、人物の限られた側面の人物特徴量しか抽出できない。よって、例えば、複数のカメラが撮影した各画像に映った人物の向きが異なる場合には、人物の異なる側面の人物特徴量を比較することになり、人物の同一性を判定する判定精度が低下してしまうという問題がある。
　本開示は、上記のような問題点を解決するためになされたものであり、画像に映った人物の向きに起因した人物同一性の判定精度の低下を防ぐ技術を提供する。

　本開示に係る人物同定装置は、複数のカメラがそれぞれ撮影した画像に映った人物が同一人物であるか否かを判定する人物同定装置であって、カメラ毎の画像に基づいて、人物を検出する人物検出部と、人物検出部が検出した人物を囲う領域を画像毎に分割する領域分割部と、領域分割部が分割した領域に基づいて、人物検出部が検出した人物の部分的な人物特徴量を画像毎に抽出する領域特徴量抽出部と、領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を比較することにより、人物検出部が画像毎に検出した人物が同一人物であるか否かを判定する領域特徴量比較部と、領域特徴量比較部によって、人物検出部が画像毎に検出した人物が同一人物であると判定された場合、領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を統合する人物特徴量統合部と、を備えている。

　本開示によれば、画像に映った人物の向きに起因した人物同一性の判定精度の低下を防ぐことができる。

実施の形態１に係る人物同定システムの構成を示すブロック図である。実施の形態１に係る人物同定装置による人物同定方法を示すフローチャートである。実施の形態１に係る領域分割部による分割方法を示す図である。実施の形態１に係る領域特徴量抽出部による人物特徴量抽出方法を示す図である。実施の形態１に係る人物同定装置による人物検索方法を示すフローチャートである。図６Ａは、実施の形態１に係る人物同定装置の機能を実現するハードウェア構成を示すブロック図である。図６Ｂは、実施の形態１に係る人物同定装置の機能を実現するソフトウェアを実行するハードウェア構成を示すブロック図である。

　以下、本開示をより詳細に説明するため、本開示を実施するための形態について、添付の図面に従って説明する。
実施の形態１．
　図１は、実施の形態１に係る人物同定システム１１０の構成を示すブロック図である。図１が示すように、人物同定システム１１０は、人物同定装置１、監視カメラ２、画像記録装置３、及び監視端末４を備えている。人物同定装置１は、人物特徴量生成部１０、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、記憶部１４、人物特徴読込部１５、及び人物特徴量比較部１６を備えている。人物特徴量生成部１０は、人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４、及び人物特徴量統合部１０５を備えている。

　監視カメラ２は、人物を撮影することにより画像を取得する。ここにおける画像は、静止画像、動画像、又は映像を意味する。監視カメラ２は、取得した画像を画像記録装置３及び人物同定装置１に出力する。

　なお、図１では、１台の監視カメラ２のみを示すが、人物同定システム１１０は、複数の監視カメラ２を備え、当該複数の監視カメラ２は、それぞれ、取得した画像を画像記録装置３及び人物同定装置１に出力するものとする。また、実施の形態１では、複数の監視カメラ２の各視野は、重複しているものとする。
　実施の形態１では、監視カメラ２を用いた構成について説明するが、監視カメラ２の代わりに、監視カメラ２の上記の機能と同様の機能を有する別の種類のカメラを用いてもよい。

　画像記録装置３は、複数の監視カメラ２が取得した画像を記録する。画像記録装置３は、記録した画像を人物同定装置１及び監視端末４に出力する。
　監視端末４は、画像に映った特定の人物に対する指定をユーザから受け付ける。例えば、ユーザは、画像を参照して、監視端末４に当該特定の人物を指定する。監視端末４は、ユーザによる人物の指定に基づいて、人物同定装置１に人物同定処理を要求する。また、監視端末４は、人物同定装置１による人物同定処理の結果を画像で表示する。

　人物同定装置１は、複数の監視カメラ２又は画像記録装置３から、複数の監視カメラ２がそれぞれ撮影した画像を取得する。人物同定装置１は、取得した画像毎に、人物を検出し、検出した人物に対して、人物特徴量抽出処理を画像毎に実行し、抽出した人物特徴量を記憶部１４の人物特徴量データベースに格納する。人物特徴量抽出処理の詳細については後述する。

　人物同定装置１は、監視端末４からの人物同定処理の指示に基づいて、記憶部１４の人物特徴量データベースから、ユーザによって指定された人物が映った画像から抽出された第１の人物特徴量、及び任意の第２の人物特徴量を読み込む。人物同定装置１は、読み込んだ第１の人物特徴量と第２の人物特徴量とを比較することにより、ユーザによって指定された人物と同一の人物が映った画像を検索し、同一人物に該当する人物を提示する。

　以下で、人物同定装置１の構成について、より詳細に説明する。
　画像読込部１１は、複数の監視カメラ２がそれぞれ撮影した画像、又は画像記録装置３に記録された監視カメラ２毎の画像を読込み、読み込んだ監視カメラ２毎の画像を人物検出部１２に出力する。

　人物検出部１２は、監視カメラ２毎の画像に基づいて、人物を検出する。より詳細には、実施の形態１では、人物検出部１２は、画像読込部１１が読み込んだ監視カメラ２毎の画像に基づいて、人物を検出する。例えば、人物検出部１２は、ＣＮＮ（Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）を利用した機械学習により、当該各画像からの人物の検出を学習する。実施の形態１では、人物検出部１２は、当該各画像に基づいて、人物を検出し、検出した人物を囲う矩形の位置情報と、当該矩形に含まれる人物画像のＲＧＢ情報を人物特徴量抽出部１３に出力する。

　人物特徴量抽出部１３は、人物検出部１２が検出した人物の人物特徴量を画像毎に抽出する。より詳細には、実施の形態１では、人物検出部１２が出力した位置情報及びＲＧＢ情報に基づいて、人物特徴量を画像毎に抽出する。例えば、人物特徴量抽出部１３は、ＣＮＮを利用した機械学習技術によって、人物特徴量の抽出を学習する。人物特徴量抽出部１３は、抽出した人物特徴量を人物特徴量生成部１０に出力する。

　人物特徴量生成部１０は、統合された人物特徴量を生成する。より詳細には、実施の形態１では、人物特徴量生成部１０は、人物検出部１２が出力した位置情報及びＲＧＢ情報、及び人物特徴量抽出部１３が抽出した人物特徴量を入力として、統合された人物特徴量を生成する。
　人物特徴量生成部１０の人数計測部１０１は、人物検出部１２が検出した人物の人数を画像毎に計測する。

　人物特徴量生成部１０の領域分割部１０２は、人物検出部１２が検出した人物を囲う領域を画像毎に分割する。より詳細には、実施の形態１では、領域分割部１０２は、人物検出部１２が検出した人物を囲う矩形の領域を画像毎に分割する。さらに詳細には、実施の形態１では、領域分割部１０２は、画像毎に、人物検出部１２が検出した人物を囲う領域を、水平方向に並ぶ複数の領域に分割する。

　さらに詳細には、実施の形態１では、領域分割部１０２は、複数の監視カメラ２の各視野が重複しているか否かを判定し、複数の監視カメラ２の各視野が重複していると判定した場合に、人物検出部１２が検出した人物を囲う領域を画像毎に分割する。

　さらに詳細には、実施の形態１では、領域分割部１０２は、人数計測部１０１が計測した人数が複数の場合に、画像毎に、人物検出部１２が検出した人物を囲う矩形の領域を、水平方向に並ぶ所定の数の領域に分割し、分割した各領域の位置情報を画像毎に算出する。領域分割部１０２は、算出した位置情報を領域特徴量抽出部１０３に出力する。

　人物特徴量生成部１０の領域特徴量抽出部１０３は、領域分割部１０２が分割した領域に基づいて、人物検出部１２が検出した人物の部分的な人物特徴量を画像毎に抽出する。より詳細には、実施の形態１では、領域特徴量抽出部１０３は、領域分割部１０２が出力した位置情報に基づいて、人物検出部１２が検出した人物の部分的な人物特徴量を画像毎に抽出する。領域特徴量抽出部１０３は、抽出した部分的な人物特徴量を領域特徴量比較部１０４に出力する。

　人物特徴量生成部１０の領域特徴量比較部１０４は、領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を比較することにより、人物検出部１２が画像毎に検出した人物が同一人物であるか否かを判定する。より詳細には、実施の形態１では、領域特徴量比較部１０４は、人物特徴量抽出部１３が画像毎に抽出した人物特徴量をさらに比較することにより、人物検出部１２が画像毎に検出した人物が同一人物であるか否かを判定する。領域特徴量比較部１０４は、判定結果を人物特徴量統合部１０５に出力する。

　人物特徴量生成部１０の人物特徴量統合部１０５は、領域特徴量比較部１０４によって、人物検出部１２が画像毎に検出した人物が同一人物であると判定された場合、領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を統合する。より詳細には、実施の形態１では、人物特徴量統合部１０５は、領域特徴量比較部１０４によって、人物検出部１２が画像毎に検出した人物が同一人物であると判定された場合、人物特徴量抽出部１３が画像毎に抽出した人物特徴量をさらに統合する。人物特徴量統合部１０５は、統合した人物特徴量を人物毎に記憶部１４の人物特徴量データベースに格納する。

　記憶部１４は、人物特徴量統合部１０５が統合した人物特徴量を記憶する。より詳細には、記憶部１４は、人物特徴量統合部１０５が統合した人物特徴量を人物特徴量データベースに格納する。記憶部１４の例として、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＥＰＲＯＭ（Ｅｌｅｃｔｒｉｃａｌｌｙ－ＥＰＲＯＭ）などの不揮発性又は揮発性の半導体メモリ、又はハードディスク等が挙げられる。

　人物特徴読込部１５は、記憶部１４が記憶する人物特徴量を読み込み、読み込んだ人物特徴量を人物特徴量比較部１６に出力する。
　人物特徴量比較部１６は、記憶部１４が記憶する人物特徴量を比較することにより、ユーザによって指定された人物と同一の人物を検索する。より詳細には、人物特徴量比較部１６は、記憶部１４が記憶する人物特徴量を比較することにより、ユーザが監視端末４を用いて指定した人物と同一の人物を検索する。監視端末４は、人物特徴量比較部１６による検索結果を画像として出力する。

　以下で、実施の形態１に係る人物同定装置１の動作について図面を参照して説明する。図２は、実施の形態１に係る人物同定装置１による人物同定方法を示すフローチャートである。なお、以下の各ステップが実行される前に、複数の監視カメラ２は、それぞれ、人物を撮影することにより画像を取得し、取得した画像を画像記録装置３及び人物同定装置１に出力したものとする。

　図２が示すように、画像読込部１１は、複数の監視カメラ２がそれぞれ撮影した画像、又は画像記録装置３に記録された監視カメラ２毎の画像を読込む（ステップＳＴ１）。画像読込部１１は、読み込んだ監視カメラ２毎の画像を人物検出部１２に出力する。画像読込部１１が人物検出部１２に出力する画像のメタデータの例として、監視カメラ番号、監視カメラ２の視野の重複の有無、撮影時間、又は画像のRGB情報等が挙げられる。

　人物検出部１２は、画像読込部１１が読み込んだ画像のＲＧＢ情報に基づいて、画像に映った人物を画像毎に検出する（ステップＳＴ２）。人物検出部１２は、人物検出結果として、検出した人物の位置情報、及び検出した人物を囲む矩形の領域に含まれるＲＧＢ情報を人物特徴量抽出部１３に出力する。

　人物特徴量抽出部１３は、人物検出部１２が出力したＲＧＢ情報に基づいて、人物特徴量を画像毎に抽出する（ステップＳＴ３）。人物特徴量抽出部１３は、抽出した人物特徴量を人物特徴量生成部１０に出力する。

　領域分割部１０２は、複数の監視カメラ２の各視野が重複しているか否かを判定する（ステップＳＴ４）。領域分割部１０２によって、複数の監視カメラ２の各視野が重複していると判定された場合（ステップＳＴ４のＹＥＳ）、人物同定装置１は、ステップＳＴ５の処理に進む。領域分割部１０２によって、複数の監視カメラ２の各視野が重複していないと判定された場合（ステップＳＴ４のＮＯ）、人物同定装置１は、ステップＳＴ１１の処理に進む。

　ステップＳＴ５において、人数計測部１０１は、人物検出部１２が検出した人物の人数を画像毎に計測する。人数計測部１０１は、計測した人数を領域分割部１０２に出力する。
　領域分割部１０２は、人数計測部１０１が計測した人数が複数であるか否かを判定する（ステップＳＴ６）。

　領域分割部１０２によって、人数計測部１０１が計測した人数が複数であると判定された場合（ステップＳＴ６のＹＥＳ）、人物同定装置１は、ステップＳＴ７の処理に進む。領域分割部１０２によって、人数計測部１０１が計測した人数が複数ではないと判定された場合（ステップＳＴ６のＮＯ）、人物同定装置１は、ステップＳＴ１０の処理に進む。

　ステップＳＴ７において、領域分割部１０２は、画像毎に、人物検出部１２が検出した人物を囲う領域を、水平方向に並ぶ複数の領域に分割する。領域分割部１０２は、分割した各領域の位置情報を領域特徴量抽出部１０３に出力する。図３は、領域分割部１０２による分割方法を示す図である。図３が示すように、領域分割部１０２は、垂直方向の線によって、人物を囲う矩形の領域を、水平方向に並ぶ複数の領域に分割する。

　領域特徴量抽出部１０３は、領域分割部１０２が分割した各領域から、人物検出部１２が検出した人物の部分的な人物特徴量を画像毎に抽出する（ステップＳＴ８）。領域特徴量抽出部１０３は、抽出した人物特徴量を領域特徴量比較部１０４に出力する。図４は、領域特徴量抽出部１０３による人物特徴量抽出方法を示す図である。図４が示すように、領域特徴量抽出部１０３は、領域分割部１０２が分割した領域毎に、部分的な人物特徴量を抽出する。

　領域特徴量比較部１０４は、領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を比較し、人物特徴量抽出部１３が画像毎に抽出した人物特徴量をさらに比較することにより、人物検出部１２が画像毎に検出した人物が同一人物であるか否かを判定する（ステップＳＴ９）。なお、ここでは、領域特徴量比較部１０４は、人物検出部１２が画像毎に検出した人物が同一人物であると判定したものとする。

　人物特徴量統合部１０５は、領域特徴量比較部１０４によって、同一人物であると判定された人物に関して、人物特徴量抽出部１３が画像毎に抽出した人物特徴量、及び領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を統合する（ステップＳＴ１０）。人物特徴量統合部１０５は、統合した人物特徴量を記憶部１４に出力する。なお、人物特徴量統合部１０５は、ステップＳＴ６の次のステップとしてステップＳＴ１０を行う場合は、ステップＳＴ３において人物特徴量抽出部１３が画像毎に抽出した人物特徴量をそのまま記憶部１４に出力する。
　記憶部１４は、人物特徴量統合部１０５が統合した人物特徴量を人物特徴量データベースに登録する（ステップＳＴ１１）。

　なお、上記の人物同定装置１による人物同定方法の例では、ステップＳＴ４において、複数の監視カメラ２の各視野が重複しているか否かを判定する構成を説明したが、人物同定装置１は、ステップＳＴ４を行わなくてもよい。つまり、複数の監視カメラ２の各視野が重複しているか否かにかかわらず、上記の各ステップを行うことにより、複数の監視カメラ２がそれぞれ撮影した画像に映った人物が同一人物であるか否かを判定することができる。

　以下で、実施の形態１に係る人物同定装置１による人物検索方法について図面を参照して説明する。図５は、実施の形態１に係る人物同定装置１による人物検索方法を示すフローチャートである。
　図５が示すように、人物同定装置１は、監視端末４から、ユーザによって指定された人物に関する人物同定処理の要求を受け付ける（ステップＳＴ１２）。人物同定装置１による人物同定処理の対象となる人物は、記憶部１４の人物特徴量データベースに登録されている人物であればよく、監視端末４が人物同定処理を要求する方法は特に限定されない。例えば、監視端末４は、監視カメラ２のＩＤ、撮影時間及び人物位置により、人物同定処理の対象となる人物を人物同定装置１に指定する。監視端末４は、人物同定処理の対象となる人物を検索する画像の検索範囲を人物同定装置１に指定してもよい。

　人物特徴読込部１５は、記憶部１４から、監視端末４が指定した人物に該当する人物の人物特徴量を読み込む（ステップＳＴ１３）。監視端末４が検索範囲を指定した場合、人物特徴読込部１５は、監視端末４が指定した検索範囲に基づいて、記憶部１４から人物特徴量を読み込む。

　人物特徴量比較部１６は、人物特徴読込部１５が読み込んだ人物特徴量と、記憶部１４が記憶する別の人物特徴量とを比較することにより、ユーザによって指定された人物と同一の人物を検索する（ステップＳＴ１４）。なお、ここにおける別の人物特徴量は、人物特徴読込部１５が読み込んだ人物特徴量を得るために行われた上述のステップＳＴ１からステップＳＴ１１の各処理の試行とは別の試行によって得られた人物特徴量を意味する。

　人物特徴量比較部１６は、人物特徴読込部１５が読み込んだ人物特徴量と類似する人物特徴量に対応する人物の位置情報を監視端末４に出力する。監視端末４は、人物特徴量比較部１６が出力した位置情報に基づいて、ユーザによって指定された人物が映った画像を表示する。

　人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各機能は、処理回路により実現される。すなわち、人物同定装置１は、図２及び図５に示した各ステップの処理を実行するための処理回路を備える。この処理回路は、専用のハードウェアであってもよいが、メモリに記憶されたプログラムを実行するＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であってもよい。

　図６Ａは、人物同定装置１の機能を実現するハードウェア構成を示すブロック図である。図６Ｂは、人物同定装置１の機能を実現するソフトウェアを実行するハードウェア構成を示すブロック図である。

　上記処理回路が図６Ａに示す専用のハードウェアの処理回路１１１である場合、処理回路１１１は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）又はこれらを組み合わせたものが該当する。

　人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各機能を別々の処理回路で実現してもよいし、これらの機能をまとめて１つの処理回路で実現してもよい。

　上記処理回路が図６Ｂに示すプロセッサ１１２である場合、人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各機能は、ソフトウェア、ファームウェア又はソフトウェアとファームウェアとの組み合わせによって実現される。
　なお、ソフトウェア又はファームウェアは、プログラムとして記述されてメモリ７２に記憶される。

　プロセッサ１１２は、メモリ１１３に記憶されたプログラムを読み出して実行することにより、人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各機能を実現する。すなわち、人物同定装置１は、これらの各機能がプロセッサ１１２によって実行されるときに、図２及び図５に示した各ステップの処理が結果的に実行されるプログラムを記憶するためのメモリ１１３を備える。

　これらのプログラムは、人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各手順又は方法をコンピュータに実行させる。メモリ１１３は、コンピュータを、人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６として機能させるためのプログラムが記憶されたコンピュータ可読記憶媒体であってもよい。

　プロセッサ１１２には、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、処理装置、演算装置、プロセッサ、マイクロプロセッサ、マイクロコンピュータ、またはＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）などが該当する。

　メモリ１１３には、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＥＰＲＯＭ（Ｅｌｅｃｔｒｉｃａｌｌｙ－ＥＰＲＯＭ）などの不揮発性又は揮発性の半導体メモリ、ハードディスク、フレキシブルディスク等の磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）などが該当する。

　人物同定装置１における、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）、画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６の各機能について一部を専用のハードウェアで実現し、一部をソフトウェア又はファームウェアで実現してもよい。

　例えば、人物特徴量生成部１０（人数計測部１０１、領域分割部１０２、領域特徴量抽出部１０３、領域特徴量比較部１０４及び人物特徴量統合部１０５）の機能は、専用のハードウェアとしての処理回路で機能を実現する。画像読込部１１、人物検出部１２、人物特徴量抽出部１３、人物特徴読込部１５及び人物特徴量比較部１６については、プロセッサ１１２がメモリ１１３に記憶されたプログラムを読み出して実行することにより機能を実現してもよい。
　このように、処理回路は、ハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせにより上記機能のそれぞれを実現することができる。

　以上のように、実施の形態１に係る人物同定装置１は、複数の監視カメラ２がそれぞれ撮影した画像に映った人物が同一人物であるか否かを判定する人物同定装置１であって、カメラ毎の画像に基づいて、人物を検出する人物検出部１２と、人物検出部１２が検出した人物を囲う領域を画像毎に分割する領域分割部１０２と、領域分割部１０２が分割した領域に基づいて、人物検出部１２が検出した人物の部分的な人物特徴量を画像毎に抽出する領域特徴量抽出部１０３と、領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を比較することにより、人物検出部１２が画像毎に検出した人物が同一人物であるか否かを判定する領域特徴量比較部１０４と、領域特徴量比較部１０４によって、人物検出部１２が画像毎に検出した人物が同一人物であると判定された場合、領域特徴量抽出部１０３が画像毎に抽出した部分的な人物特徴量を統合する人物特徴量統合部１０５と、を備えている。

　例えば、視野が重複している複数の監視カメラ２が撮影した各画像に映った人物が同一人物であるか否かを判定する場合、従来技術では、人物の位置情報又は輪郭形状情報を算出するために、監視カメラ２毎に異なる視野を較正するためのカメラキャリブレーションを行う必要がある。しかし、実施の形態１に係る人物同定装置１の上記の構成によれば、部分的な人物特徴量を比較することにより、カメラキャリブレーションを行うことなく、人物の同一性を判定することが可能である。

　または、例えば、視野が重複していない複数の監視カメラ２が撮影した各画像に映った人物が同一人物であるか否かを判定する場合に、複数の監視カメラ２が撮影した各画像に映った人物の向きが異っている状況でも、実施の形態１に係る人物同定装置１の上記の構成によれば、部分的な人物特徴量を比較することにより、人物の同一性を判定することが可能である。

　つまり、実施の形態１に係る人物同定装置１の上記の構成によれば、画像に映った人物の向きに起因した人物同一性の判定精度の低下を防ぐことができる。
　なお、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。

　より詳細には、実施の形態１に係る人物同定装置１の領域分割部１０２は、画像毎に、人物検出部１２が検出した人物を囲う領域を、水平方向に並ぶ複数の領域に分割する。
　上記の構成によれば、複数の監視カメラ２が撮影した各画像に映った人物の向きが異っている状況でも、水平方向に並ぶ複数の領域のうちの少なくとも１つの領域から抽出した部分的な人物特徴量を比較することにより、人物の同一性を判定することが可能である。

　なお、実施の形態１では、上記のように領域分割部１０２が、人物検出部１２が検出した人物を囲う領域を水平方向に並ぶ複数の領域に分割する構成について説明したが、領域分割部１０２による分割方法は、当該構成に限定されない。領域分割部１０２による領域の分割によって、各画像間で類似した部分的な人物特徴量を得られればよく、その分割方法は、特に限定されない。

　本開示に係る人物同定装置は、画像に映った人物の向きに起因した人物同一性の判定精度の低下を防ぐことができるため、複数のカメラが撮影した各画像に映った人物が同一人物であるか否かを判定する技術に利用可能である。

　１　人物同定装置、２　監視カメラ、３　画像記録装置、４　監視端末、１０　人物特徴量生成部、１１　画像読込部、１２　人物検出部、１３　人物特徴量抽出部、１４　記憶部、１５　人物特徴読込部、１６　人物特徴量比較部、１０１　人数計測部、１０２　領域分割部、１０３　領域特徴量抽出部、１０４　領域特徴量比較部、１０５　人物特徴量統合部、１１０　人物同定システム、１１１　処理回路、１１２　プロセッサ、１１３　メモリ。

Claims

　複数のカメラがそれぞれ撮影した画像に映った人物が同一人物であるか否かを判定する人物同定装置であって、
　前記カメラ毎の画像に基づいて、人物を検出する人物検出部と、
　前記人物検出部が検出した人物を囲う領域を画像毎に分割する領域分割部と、
　前記領域分割部が分割した領域に基づいて、前記人物検出部が検出した人物の部分的な人物特徴量を画像毎に抽出する領域特徴量抽出部と、
　前記領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を比較することにより、前記人物検出部が画像毎に検出した人物が同一人物であるか否かを判定する領域特徴量比較部と、
　前記領域特徴量比較部によって、前記人物検出部が画像毎に検出した人物が同一人物であると判定された場合、前記領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を統合する人物特徴量統合部と、を備えていることを特徴とする、人物同定装置。
　前記人物検出部が検出した人物の人物特徴量を画像毎に抽出する人物特徴量抽出部をさらに備え、
　前記領域特徴量比較部は、前記人物特徴量抽出部が画像毎に抽出した人物特徴量をさらに比較することにより、前記人物検出部が画像毎に検出した人物が同一人物であるか否かを判定し、
　前記人物特徴量統合部は、前記領域特徴量比較部によって、前記人物検出部が画像毎に検出した人物が同一人物であると判定された場合、前記人物特徴量抽出部が画像毎に抽出した人物特徴量をさらに統合することを特徴とする、請求項１に記載の人物同定装置。
　前記領域分割部は、前記複数のカメラの各視野が重複しているか否かを判定し、前記複数のカメラの各視野が重複していると判定した場合に、前記人物検出部が検出した人物を囲う領域を画像毎に分割することを特徴とする、請求項１に記載の人物同定装置。
　前記領域分割部は、画像毎に、前記人物検出部が検出した人物を囲う領域を、水平方向に並ぶ複数の領域に分割することを特徴とする、請求項１に記載の人物同定装置。
　前記人物特徴量統合部が統合した人物特徴量を記憶する記憶部と、
　前記記憶部が記憶する人物特徴量を比較することにより、ユーザによって指定された人物と同一の人物を検索する人物特徴量比較部をさらに備えていることを特徴とする、請求項１に記載の人物同定装置。
　複数のカメラがそれぞれ撮影した画像に映った人物が同一人物であるか否かを判定する人物同定装置による人物同定方法であって、
　人物検出部が、前記カメラ毎の画像に基づいて、人物を検出する人物検出ステップと、
　領域分割部が、前記人物検出部が検出した人物を囲う領域を画像毎に分割する領域分割ステップと、
　領域特徴量抽出部が、前記領域分割部が分割した領域に基づいて、前記人物検出部が検出した人物の部分的な人物特徴量を画像毎に抽出する領域特徴量抽出ステップと、
　領域特徴量比較部が、前記領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を比較することにより、前記人物検出部が画像毎に検出した人物が同一人物であるか否かを判定する領域特徴量比較ステップと、
　人物特徴量統合部が、前記領域特徴量比較部によって、前記人物検出部が画像毎に検出した人物が同一人物であると判定された場合、前記領域特徴量抽出部が画像毎に抽出した部分的な人物特徴量を統合する人物特徴量統合ステップと、を含むことを特徴とする、人物同定方法。