WO2020188898A1

WO2020188898A1 - 処理装置、処理方法及びプログラム

Info

Publication number: WO2020188898A1
Application number: PCT/JP2019/046990
Authority: WO
Inventors: 健全劉; 諭史吉田
Original assignee: 日本電気株式会社
Priority date: 2019-03-15
Filing date: 2019-12-02
Publication date: 2020-09-24
Also published as: JPWO2020188898A1; US20220189199A1; JP7251609B2; US11823491B2

Abstract

本発明は、第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定部（１１）と、第１の代表顔画像と第１の顔画像群の中の他の顔画像各々との類似度、及び、第２の代表顔画像と第２の顔画像群の中の他の顔画像各々との類似度に基づき、代表顔画像と顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、第１の顔画像群及び第２の顔画像群毎に判定する顔画像群内判定部（１２）と、第１の条件を満たし、かつ、第１の顔画像群及び第２の顔画像群いずれも第２の条件を満たすと判定された場合、第１の顔画像群及び第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤ（identifier）を紐付ける処理部（１３）と、を有する処理装置（１０）を提供する。

Description

処理装置、処理方法及びプログラム

　本発明は、処理装置、処理方法及びプログラムに関する。

　非特許文献１は、映像に含まれる同一物体を追跡する物体追跡技術を開示している。特許文献１及び２は、同一人物の複数の顔画像どうしでまとめてグループ化するためのインデックスデータの生成方法を開示している。

国際公開第２０１４／１０９１２７号特開２０１５－４９５７４号公報

"Object Tracking: A Survey"、「online」、「平成２９年１２月２６日検索」、インターネット＜ＵＲＬ：http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.8588&rep=rep1&type=pdf＞

　複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士で効率的にグループ化する技術が望まれている。物体追跡技術を利用して同一人物を追跡することで、同一カメラで連続的に撮影された同一人物の顔画像をグループ化できる。しかし、物体追跡技術の場合、異なるカメラで撮影された同一人物の顔画像や、一度フレームアウトした後にフレームインした同一人物の顔画像等をグループ化することが難しい。

　本発明は、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士で効率的にグループ化する技術を提供することを課題とする。

　本発明によれば、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤ（identifier）を紐付ける処理手段と、
を有する処理装置が提供される。

　また、本発明によれば、
　コンピュータが、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定工程と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定工程と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理工程と、
を実行する処理方法が提供される。

　また、本発明によれば、
　コンピュータを、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理手段、
として機能させるプログラムが提供される。

　本発明によれば、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士で効率的にグループ化する技術が実現される。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

本実施形態の処理装置が行う処理の概要を説明するための図である。本実施形態の処理装置のハードウエア構成の一例を示す図である。本実施形態の処理装置の機能ブロック図の一例を示す図である。本実施形態の処理装置が処理する情報の一例を模式的に示す図である。本実施形態の処理装置が処理する情報の一例を模式的に示す図である。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の機能ブロック図の一例を示す図である。本実施形態の処理装置が生成するインデックスデータの一例を模式的に示す図である。本実施形態の処理装置が生成するインデックスデータの一例を模式的に示す図である。本実施形態の処理装置が生成するインデックスデータの一例を模式的に示す図である。

＜第１の実施形態＞
　まず、本実施形態の処理装置が行う処理の概要を説明する。処理装置は、図１に示すように、第１の顔画像群と第２の顔画像群とを処理対象とする。第１の顔画像群は任意の手段で同一人物の顔画像と推定された複数の顔画像からなる。また、第２の顔画像群は任意の手段で同一人物の顔画像と推定された複数の顔画像からなる。

　処理装置は、第１の顔画像群と第２の顔画像群とが同一人物の顔画像の集まりか否かを判定する。処理装置は、当該判定を、「代表画像を用いた顔画像群間の類似度の判定」及び「顔画像群内における代表画像と他の画像との類似度の判定」という２つの判定を用いて行う。

　具体的には、処理装置は、第１の顔画像群の中の代表である第１の代表顔画像と、第２の顔画像群の中の代表である第２の代表顔画像との類似度が第１の条件を満たすか、すなわち所定レベル以上類似するか否かを判定する。

　また、処理装置は、第１の代表顔画像と第１の顔画像群の中の他の顔画像各々との類似度に基づき、第１の代表顔画像と第１の顔画像群の中の他の画像との関係が第２の条件を満たすか、すなわち第１の代表顔画像と第１の顔画像群の中の他の画像とが所定レベル以上類似するか否かを判定する。

　さらに、処理装置は、第２の代表顔画像と第２の顔画像群の中の他の顔画像各々との類似度に基づき、第２の代表顔画像と第２の顔画像群の中の他の画像との関係が第２の条件を満たすか、すなわち第２の代表顔画像と第２の顔画像群の中の他の画像とが所定レベル以上類似するか否かを判定する。

　そして、処理装置は、第１の代表顔画像と第２の代表顔画像との間の関係が第１の条件を満たし（第１の代表顔画像と第２の代表顔画像とが所定レベル以上類似する）、第１の顔画像群が第２の条件を満たし（第１の代表顔画像と第１の顔画像群の他の顔画像とが所定レベル以上類似する）、かつ、第２の顔画像群が第２の条件を満たす（第２の代表顔画像と第２の顔画像群の他の顔画像とが所定レベル以上類似する）場合、第１の顔画像群及び第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける。

　次に、処理装置の構成を詳細に説明する。まず、処理装置のハードウエア構成の一例を説明する。処理装置が備える各機能部は、任意のコンピュータのＣＰＵ（Central Processing Unit）、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット（あらかじめ装置を出荷する段階から格納されているプログラムのほか、ＣＤ（Compact Disc）等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる）、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。

　図２は、本実施形態の処理装置のハードウエア構成を例示するブロック図である。図２に示すように、処理装置は、プロセッサ１Ａ、メモリ２Ａ、入出力インターフェイス３Ａ、周辺回路４Ａ、バス５Ａを有する。周辺回路４Ａには、様々なモジュールが含まれる。処理装置は周辺回路４Ａを有さなくてもよい。なお、処理装置は物理的に分かれた複数の装置で構成されてもよい。この場合、複数の装置各々が上記ハードウエア構成を備えることができる。

　バス５Ａは、プロセッサ１Ａ、メモリ２Ａ、周辺回路４Ａ及び入出力インターフェイス３Ａが相互にデータを送受信するためのデータ伝送路である。プロセッサ１Ａは、例えばＣＰＵ、ＧＰＵ（Graphics Processing Unit）などの演算処理装置である。メモリ２Ａは、例えばＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などのメモリである。入出力インターフェイス３Ａは、入力装置、外部装置、外部サーバ、外部センサ、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ１Ａは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。

　次に、処理装置の機能構成を説明する。図３の処理装置１０の機能ブロック図の一例を示す。図示するように、処理装置１０は、顔画像群間判定部１１と、顔画像群内判定部１２と、処理部１３とを有する。

　顔画像群間判定部１１は、第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する。第１の条件は、例えば「類似度が基準値以上（第１の代表顔画像と第２の代表顔画像が基準レベル以上類似）」である。

　第１の顔画像群は任意の手段で同一人物の顔画像と推定された複数の顔画像からなる。また、第２の顔画像群は任意の手段で同一人物の顔画像と推定された複数の顔画像からなる。例えば、第１の顔画像群は、物体追跡技術により、複数のフレームに跨って同一物体として追跡された人物（物体）の複数のフレーム各々における顔画像の集まりであってもよい。同様に、第２の顔画像群は、物体追跡技術により、複数のフレームに跨って同一物体として追跡された人物（物体）の複数のフレーム各々における顔画像の集まりであってもよい。物体追跡技術は従来のあらゆる技術を採用できる。複数の顔画像は、同一カメラで生成された動画データに含まれる複数フレーム各々から抽出された顔画像であってもよいし、複数のカメラで生成された複数の動画データに含まれる複数フレーム各々から抽出された顔画像であってもよいし、その他であってもよい。なお、第１の顔画像群及び第２の顔画像群は、その他の手段で同一人物の顔画像と推定された複数の顔画像の集まりであってもよい。

　第１の代表顔画像は、第１の顔画像群の中の１つの顔画像である。第２の代表顔画像は、第２の顔画像群の中の１つの顔画像である。本実施形態では、顔画像群の中から代表顔画像を決定する方法は特段制限されない。２つの顔画像間の類似度の算出は従来のあらゆる技術を採用できる。

　顔画像群内判定部１２は、第１の代表顔画像と第１の顔画像群の中の他の顔画像各々との類似度に基づき、第１の代表顔画像と第１の顔画像群の中の他の画像との関係が第２の条件を満たすか判定する。また、顔画像群内判定部１２は、第２の代表顔画像と第２の顔画像群の中の他の顔画像各々との類似度に基づき、第２の代表顔画像と第２の顔画像群の中の他の画像との関係が第２の条件を満たすか判定する。

　第２の条件は、例えば「顔画像群の中に代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する」である。

　顔画像群内判定部１２は、図４に示すように、第１の顔画像群及び第２の顔画像群各々において、代表顔画像と他の顔画像各々との類似度を算出し、算出結果に基づき、第１の画像群及び第２の画像群各々が第２の条件を満たすか判定する。

　図１の例の場合、第１の代表顔画像はＭ３であるので、図４に示す例では、第１の顔画像群において、代表顔画像Ｍ３と第１の顔画像群の他の顔画像各々とのペア毎に、類似度を算出している。また、図１の例の場合、第２の代表顔画像はＮ１であるので、図４に示す例では、第２の顔画像群において、代表顔画像Ｎ１と第２の顔画像群の他の顔画像各々とのペア毎に、類似度を算出している。

　顔画像群内判定部１２は、類似度が第２の条件で定められた所定レベル以上であるペアの数をペアの総数で割ることで、顔画像群の中に存在する代表顔画像との類似度が所定レベル以上の顔画像の割合を算出する。そして、顔画像群内判定部１２は、算出した割合が第２の条件で定められた所定割合以上か否かを判定できる。

　処理部１３は、第１の条件を満たし、かつ、第１の顔画像群及び第２の顔画像群いずれも第２の条件を満たすと判定された場合、第１の顔画像群及び第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける。図５に、処理部１３が処理する情報の一例を模式的に示す。図示する例では、複数の顔画像各々を識別する顔画像ＩＤと、画像に写っていた複数の人物各々を識別する人物ＩＤとが互いに対応付けられている。

　次に、図６のフローチャートを用いて、処理装置１０の処理の流れの一例を説明する。

　まず、処理装置１０は、処理対象とする第１の顔画像群及び第２の顔画像群を決定する（Ｓ１０）。第１の顔画像群及び第２の顔画像群の決定手法は特段制限されないが、以下の実施形態で一例を説明する。

　次いで、処理装置１０は、第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する（Ｓ１１）。第１の条件は、例えば「類似度が基準値以上（第１の代表顔画像と第２の代表顔画像が基準レベル以上類似）」である。

　Ｓ１１の判定の結果がＹｅｓである場合、処理装置１０は、第１の代表顔画像と第１の顔画像群の中の他の顔画像各々との類似度に基づき、第１の代表顔画像と第１の顔画像群の中の他の画像との関係が第２の条件を満たすか判定する（Ｓ１２）。第２の条件は、例えば「顔画像群の中に代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する」である。

　Ｓ１２の判定の結果がＹｅｓである場合、処理装置１０は、第２の代表顔画像と第２の顔画像群の中の他の顔画像各々との類似度に基づき、第２の代表顔画像と第２の顔画像群の中の他の画像との関係が第２の条件を満たすか判定する（Ｓ１３）。第２の条件は、例えば「顔画像群の中に代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する」である。

　Ｓ１３の判定の結果がＹｅｓである場合、処理装置１０は、第１の顔画像群及び第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける（Ｓ１４）。

　一方、Ｓ１１の判定の結果がＮｏである場合、Ｓ１２の判定の結果がＮｏである場合、又は、Ｓ１３の判定の結果がＮｏである場合、処理装置１０は、第１の顔画像群に含まれる複数の顔画像と、第２の顔画像群に含まれる複数の顔画像とに異なる人物ＩＤを紐付ける（Ｓ１５）。

　なお、Ｓ１１乃至Ｓ１３の判定順は図示する例に限定されない。

　ここで、変形例を説明する。Ｓ１１の判定の結果がＮｏである場合、Ｓ１２の判定の結果がＮｏである場合、又は、Ｓ１３の判定の結果がＮｏである場合、Ｓ１５の前に、第１の代表顔画像及び第２の代表顔画像の少なくとも一方を他の顔画像に変更した後、Ｓ１１乃至Ｓ１３の処理を実行してもよい。そして、同様の処理を所定回数繰り返してもＳ１４に進めない場合、Ｓ１５に進んでもよい。

　以上説明した本実施形態の処理装置１０は、「代表画像を用いた顔画像群間の類似度の判定」及び「顔画像群内における代表画像と他の画像との類似度の判定」という２つの判定を用いて、２つの顔画像群が同一人物の顔画像の集まりか否か判定する。

　「顔画像群内における代表画像と他の画像との類似度の判定」を行うことで、代表画像として適切な顔画像が指定されているか判定できる。同一人物と判定された顔画像の集まりであっても、顔の向き、表情などは互いに異なり得る。代表顔画像は、そのような多様な顔画像に共通する顔画像の特徴を十分に表したものであるのが好ましい。当該判定により、顔画像群内における多様な顔画像に共通する顔画像の特徴を十分に表した顔画像が代表画像として指定されているか判定できる。

　そして、「代表画像を用いた顔画像群間の類似度の判定」を行うことで、第１の顔画像群と第２の顔画像群とが同一物と判定できるほど類似するかを判定できる。

　このような処理装置１０によれば、効率的かつ高精度に、２つの顔画像群が同一人物の顔画像の集まりか否かを判定することができる。結果、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士で効率的にグループ化することが可能となる。

＜第２の実施形態＞
　本実施形態は、複数の顔画像で階層構造のインデックスデータを生成し、当該インデックスデータを利用して、第１の実施形態で説明した処理を実行する点で、第１の実施形態と異なる。以下、詳細に説明する。

　処理装置１０のハードウエア構成の一例は、第１の実施形態と同様である。

　処理装置１０の機能ブロック図の一例は、図７で示される。図示するように、処理装置１０は、顔画像群間判定部１１と、顔画像群内判定部１２と、処理部１３と、インデックスデータ生成部１４と、物体追跡部１５とを有する。

　物体追跡部１５は、物体追跡技術を用いて複数のフレームに跨って同一物体として追跡した人物（物体）の複数のフレーム各々における顔画像をまとめてグループ化する。画像上の物体が人物か否か判定する技術や物体追跡技術は従来のあらゆる技術を採用できる。

　インデックスデータ生成部１４は、複数の顔画像で階層構造のインデックスデータを生成する。複数の顔画像で階層構造のインデックスデータを生成する処理の詳細は特許文献１及び２に開示されているが、以下、簡単に説明する。

　図８に、階層構造のインデックスデータの一例を示す。顔画像ＩＤ：「Ｆ○○○－○○○○」は、各フレームの画像から抽出された顔画像各々に付される識別情報である。Ｆ○○○がフレームＩＤであり、ハイフン以下が各フレームから抽出された顔画像各々のＩＤである。同一人物の顔画像が異なるフレームから抽出された場合、各々に異なる顔画像ＩＤが付されることとなる。

　最下層には、処理された全ての顔画像ＩＤが配置される。そして、最下層に配置された複数の顔画像ＩＤは、顔画像の類似度が第１の閾値以上のもの同士でまとめてグループ化される。

　第１の層には、最下層の複数のグループ各々から選択された１つの顔画像ＩＤ（代表）が配置される。第１の層の顔画像ＩＤ各々は、最下層に位置する選択元のグループ（自身が所属するグループ）に紐付けられる。そして、第１の層に配置された複数の顔画像ＩＤは、顔画像の類似度が第２の閾値以上のもの同士でまとめてグループ化される。なお、第２の閾値は、上記第１の閾値よりも低い。

　第２の層には、第１の層の複数のグループ各々から選択された１つの顔画像ＩＤ（代表）が配置される。第２の層の顔画像ＩＤ各々は、第１の層に位置する選択元のグループ（自身が所属するグループ）に紐付けられる。

　当該インデックスデータは、次のようにして更新される。新たな顔画像ＩＤが処理対象とされると、まず、インデックスデータ生成部１４は、第２の層に位置する複数の顔画像ＩＤ各々を、新たな顔画像ＩＤとの比較対象とする。すなわち、インデックスデータ生成部１４は、新たな顔画像ＩＤと、第２の層に位置する複数の顔画像ＩＤ各々とでペアを作成する。そして、インデックスデータ生成部１４は、ペア毎に顔画像の類似度（外観の特徴量の類似度）を算出し、算出した類似度が第２の閾値以上であるか判定する。

　第２の層に、類似度が第２の閾値以上である顔画像ＩＤが存在しない場合、インデックスデータ生成部１４は、処理対象の新たな顔画像ＩＤを第２の層、第１の層及び最下層に追加し、それらを互いに紐付ける。第１の層及び最下層においては、追加された新たな顔画像ＩＤより新たなグループが生成される。

　一方、第２の層に、類似度が第２の閾値以上である顔画像ＩＤが存在する場合、インデックスデータ生成部１４は、比較対象を第１の層に移す。具体的には、「類似度が第２の閾値以上であると判定された第２の層の顔画像ＩＤ」に紐付けられた第１の層のグループを、比較対象とする。

　そして、インデックスデータ生成部１４は、処理対象の新たな顔画像ＩＤと、第１の層の比較対象のグループに含まれる複数の顔画像ＩＤ各々とでペアを作成する。次いで、インデックスデータ生成部１４は、ペア毎に顔画像の類似度を算出し、算出した類似度が第１の閾値以上であるか判定する。なお、第１の閾値は、第２の閾値よりも高い。

　第１の層の比較対象のグループに、類似度が第１の閾値以上である顔画像ＩＤが存在しない場合、インデックスデータ生成部１４は、処理対象の新たな顔画像ＩＤを第１の層及び最下層に追加し、それらを互いに紐付ける。第１の層においては、処理対象の新たな顔画像ＩＤは比較対象のグループに追加される。最下層においては、処理対象の新たな顔画像ＩＤにより新たなグループが生成される。

　一方、第１の層の比較対象のグループに、類似度が第１の閾値以上である顔画像ＩＤが存在する場合、インデックスデータ生成部１４は、処理対象の新たな顔画像ＩＤを最下層に追加し、類似度が第１の閾値以上である顔画像ＩＤと同じグループに属させる。

　このように、インデックスデータ生成部１４は、全ての顔画像（顔画像ＩＤ）を最下層に位置させ、最下層において、類似度が第１の閾値以上の顔画像同士でまとめたグループを生成する。そして、インデックスデータ生成部１４は、最下層の各グループから１つの顔画像を抽出し、抽出した顔画像を第１の層に位置させ、第１の層に位置する顔画像と各顔画像が属する最下層に位置するグループとを紐付ける。

　また、インデックスデータ生成部１４は、第１の層において、類似度が第１の閾値より低い第２の閾値以上の顔画像同士でまとめたグループを生成する。そして、インデックスデータ生成部１４は、第１の層の各グループから１つの顔画像を抽出し、抽出した顔画像を第２の層に位置させ、第２の層に位置する顔画像と各顔画像が属する第１の層に位置するグループとを紐付ける。インデックスデータ生成部１４は、当該処理により、少なくとも最下層と、第１の層と、第２の層とを有する階層構造のインデックスデータを生成する。なお、層の数はここまでに説明した３層構造に限定されず、その他の数の層構造としてもよい。

　本実施形態のインデックスデータ生成部１４は、図９に示すように、物体追跡部１５が生成したグループ毎に（物体追跡技術を用いて同一人物と判定された顔画像のグループ毎に）、各グループに属する複数の顔画像で階層構造のインデックスデータを生成する。すなわち、インデックスデータ生成部１４は、物体追跡部１５が生成したグループの数と同数のインデックスデータを生成する。

　そして、顔画像群間判定部１１、顔画像群内判定部１２及び処理部１３は、図９に示すように、１つの階層構造のインデックスデータに含まれる顔画像を第１の顔画像群とし、他の階層構造のインデックスデータに含まれる顔画像を第２の顔画像群として、第１の実施形態で説明した処理を実行する。すなわち、顔画像群間判定部１１、顔画像群内判定部１２及び処理部１３は、物体追跡技術を用いて同一人物と判定した顔画像をまとめた１つのグループに属する顔画像を第１の顔画像群とし、物体追跡技術を用いて生成された他のグループに属する顔画像を第２の顔画像群として、第１の実施形態で説明した処理を実行する。

　なお、顔画像群間判定部１１及び顔画像群内判定部１２は、階層構造のインデックスデータの最上層に位置する顔画像を代表顔画像とすることができる。このように代表顔画像を決定することで、適切な代表顔画像を容易に決定できる。

　顔画像群間判定部１１、顔画像群内判定部１２及び処理部１３のその他の構成は、第１の実施形態と同様である。

　以上説明した本実施形態の処理装置１０によれば、第１の実施形態と同様な作用効果を実現できる。

　ところで、複数の顔画像間の類似度のみに基づき、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士でグループ化する手段も考えられる。しかし、当該手段の場合、画像における各人物の顔の向きや表情や鮮明度等に起因して、同一人物の顔画像であっても類似度が低くなり、同一人物と判定されない不都合が発生し得る。一方で、物体追跡技術のみに基づき、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士でグループ化する場合、上述の通り、異なるカメラで撮影された同一人物の顔画像や、一度フレームアウトした後にフレームインした同一人物の顔画像等をグループ化することが難しいという不都合が発生し得る。

　本実施形態では、物体追跡技術で同一人物を追跡し、各フレームから抽出したその人物の顔画像をグループ化した後、複数の顔画像間の類似度に基づき複数の顔画像群同志をグループ化する。このような本実施形態の処理装置１０によれば、高精度に、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士でグループ化することができる。

　また、本実施形態の処理装置１０によれば、物体追跡技術を用いて同一人物と判定した顔画像をまとめた顔画像群同志を、第１の実施形態で説明した技術を用いてグループ化するので、効率的かつ高精度にグループ化することができる。

　結果、本実施形態の処理装置１０によれば、複数のフレーム各々から抽出された顔画像を同一人物の顔画像同士で効率的かつ高精度にグループ化することが可能となる。

＜第３の実施形態＞
　本実施形態は、複数の顔画像で階層構造のインデックスデータを生成し、当該インデックスデータを利用して、第１の実施形態で説明した処理を実行する点で、第１の実施形態と異なる。また、インデックスデータの利用方法が、第２の実施形態と異なる。以下、詳細に説明する。

　処理装置１０のハードウエア構成の一例は、第１及び第２の実施形態と同様である。

　処理装置１０の機能ブロック図の一例は、図７で示される。図示するように、処理装置１０は、顔画像群間判定部１１と、顔画像群内判定部１２と、処理部１３と、インデックスデータ生成部１４と、物体追跡部１５とを有する。物体追跡部１５の構成は、第２の実施形態と同様である。

　インデックスデータ生成部１４は、画像から抽出された複数の顔画像で１つの階層構造のインデックスデータを生成する。すなわち、第２の実施形態では、物体追跡技術を用いて同一人物と判定された顔画像のグループ毎に階層構造のインデックスデータを生成したが（図９参照）、本実施形態ではこのようなグループ分けをせず、抽出された複数の顔画像の全てを用いて１つの階層構造のインデックスデータを生成する（図１０参照）。インデックスデータの生成方法は第２の実施形態で説明した通りである。

　そして、顔画像群間判定部１１、顔画像群内判定部１２及び処理部１３は、インデックスデータ生成時に用いる各層に対応して設定された顔画像のグループ化に用いる閾値（第１の閾値及び第２の閾値等）が基準値以上の所定の層に位置する第１の画像に紐付けられた複数の顔画像を第１の顔画像群とし、上記所定の層に位置し、第１の画像と同じグループに属する第２の画像に紐付けられた複数の顔画像を第２の顔画像群として、第１の実施形態で説明した処理を実行する。

　なお、顔画像群間判定部１１及び顔画像群内判定部１２は、上記所定の層に位置する第１の画像を第１の代表画像とし、上記所定の層に位置する第２の画像を第２の代表画像とすることができる。このように代表顔画像を決定することで、適切な代表顔画像を容易に決定できる。

　例えば、図１０の例の場合、第１の層が、閾値が基準値以上の所定の層として決定されている。顔画像Ｔ１及び顔画像Ｕ５は類似度が閾値以上であり、上記所定の層において同一のグループに属する。

　この例の場合、顔画像Ｔ１及び顔画像Ｔ１に紐付けられたそれよりも下位層の顔画像が第１の顔画像群となる。そして、顔画像Ｕ５及び顔画像Ｕ５に紐付けられたそれよりも下位層の顔画像が第２の顔画像群となる。顔画像Ｔ１が第１の代表画像であり、顔画像Ｕ５が第２の代表画像である。

　なお、図１０においては、物体追跡技術を用いて同一人物と判定された顔画像に同一のアルファベットを付している。すなわち、Ｔのアルファベットを付された複数の顔画像は、物体追跡技術を用いて同一人物と判定された顔画像の集まりである。同様に、Ｓ、Ｐ、Ｑ、Ｕ等のアルファベット各々を付された複数の顔画像は、物体追跡技術を用いて同一人物と判定された顔画像の集まりである。

　この例の場合の第２の条件（顔画像群の中に代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する）の判定は、顔画像群の中の物体追跡技術を用いて代表顔画像と同一人物と判定された顔画像のみを用いて行ってもよい。すなわち、図１０の第１の顔画像群においては、第２の条件の判定は、アルファベットＴが付された顔画像のみを用いて行ってもよい。同様に、図１０の第２の顔画像群においては、第２の条件の判定は、アルファベットＵが付された顔画像のみを用いて行ってもよい。なお、顔画像群に含まれるすべての顔画像を用いて、第２の条件の判定を行ってもよい。

　以上説明した本実施形態の処理装置１０によれば、第１及び第２の実施形態と同様な作用効果を実現できる。また、本実施形態によれば、顔画像群の中から、他の画像の全てと所定レベル以上類似する画像を代表顔画像として選択することができる。すなわち、本実施形態によれば、効率的に、代表顔画像とするのに好ましい顔画像を決定することができる。

　以下、参考形態の例を付記する。
１．　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤ（identifier）を紐付ける処理手段と、
を有する処理装置。
２．　１に記載の処理装置において、
　前記第２の条件は、「前記顔画像群の中に前記代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する」である処理装置。
３．　１又は２に記載の処理装置において、
　物体追跡技術を用いて同一人物と判定した顔画像をまとめてグループ化する物体追跡手段をさらに有し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び前記処理手段は、前記物体追跡技術を用いて生成された１つのグループに属する顔画像を前記第１の顔画像群とし、前記物体追跡技術を用いて生成された他のグループに属する顔画像を前記第２の顔画像群とする処理装置。
４．　３に記載の処理装置において、
　複数の顔画像で階層構造のインデックスデータを生成するインデックスデータ生成手段をさらに有し、
　前記インデックスデータ生成手段は、
　　全ての顔画像を最下層に位置させ、
　　前記最下層において、類似度が第１の閾値以上の顔画像同士でまとめたグループを生成し、各グループから１つの顔画像を抽出して第１の層に位置させ、前記第１の層に位置する顔画像と各顔画像が属する前記最下層に位置する前記グループとを紐付け、
　　前記第１の層において、類似度が前記第１の閾値より低い第２の閾値以上の顔画像同士でまとめたグループを生成し、各グループから１つの顔画像を抽出して第２の層に位置させ、前記第２の層に位置する顔画像と各顔画像が属する前記第１の層に位置する前記グループとを紐付けることで、少なくとも前記最下層と、前記第１の層と、前記第２の層とを有する前記階層構造のインデックスデータを生成する処理装置。
５．　４に記載の処理装置において、
　前記インデックスデータ生成手段は、物体追跡技術を用いて同一人物と判定された顔画像のグループ毎に、前記階層構造のインデックスデータを生成し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び処理手段は、１つの前記階層構造のインデックスデータに含まれる顔画像を前記第１の顔画像群とし、他の前記階層構造のインデックスデータに含まれる顔画像を前記第２の顔画像群とする処理装置。
６．　５に記載の処理装置において、
　前記顔画像群間判定手段及び前記顔画像群内判定手段は、最上層に位置する顔画像を前記代表顔画像とする処理装置。
７．　４に記載の処理装置において、
　前記インデックスデータ生成手段は、画像から抽出された複数の顔画像で前記階層構造のインデックスデータを生成し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び前記処理手段は、前記閾値が基準値以上の所定の層に位置する第１の画像に紐付けられた複数の顔画像を前記第１の顔画像群とし、前記所定の層に位置し、前記第１の画像と同じグループに属する第２の画像に紐付けられた複数の顔画像を前記第２の顔画像群とする処理装置。
８．　７に記載の処理装置において、
　前記顔画像群間判定手段及び前記顔画像群内判定手段は、前記第１の画像を前記第１の代表顔画像とし、前記第２の画像を前記第２の代表顔画像とする処理装置。
９．　コンピュータが、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定工程と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定工程と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理工程と、
を実行する処理方法。
１０．　コンピュータを、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理手段、
として機能させるプログラム。

　この出願は、２０１９年３月１５日に出願された日本出願特願２０１９－０４８４５４号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤ（identifier）を紐付ける処理手段と、
を有する処理装置。
　請求項１に記載の処理装置において、
　前記第２の条件は、「前記顔画像群の中に前記代表顔画像との類似度が所定レベル以上の顔画像が所定割合以上存在する」である処理装置。
　請求項１又は２に記載の処理装置において、
　物体追跡技術を用いて同一人物と判定した顔画像をまとめてグループ化する物体追跡手段をさらに有し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び前記処理手段は、前記物体追跡技術を用いて生成された１つのグループに属する顔画像を前記第１の顔画像群とし、前記物体追跡技術を用いて生成された他のグループに属する顔画像を前記第２の顔画像群とする処理装置。
　請求項３に記載の処理装置において、
　複数の顔画像で階層構造のインデックスデータを生成するインデックスデータ生成手段をさらに有し、
　前記インデックスデータ生成手段は、
　　全ての顔画像を最下層に位置させ、
　　前記最下層において、類似度が第１の閾値以上の顔画像同士でまとめたグループを生成し、各グループから１つの顔画像を抽出して第１の層に位置させ、前記第１の層に位置する顔画像と各顔画像が属する前記最下層に位置する前記グループとを紐付け、
　　前記第１の層において、類似度が前記第１の閾値より低い第２の閾値以上の顔画像同士でまとめたグループを生成し、各グループから１つの顔画像を抽出して第２の層に位置させ、前記第２の層に位置する顔画像と各顔画像が属する前記第１の層に位置する前記グループとを紐付けることで、少なくとも前記最下層と、前記第１の層と、前記第２の層とを有する前記階層構造のインデックスデータを生成する処理装置。
　請求項４に記載の処理装置において、
　前記インデックスデータ生成手段は、物体追跡技術を用いて同一人物と判定された顔画像のグループ毎に、前記階層構造のインデックスデータを生成し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び処理手段は、１つの前記階層構造のインデックスデータに含まれる顔画像を前記第１の顔画像群とし、他の前記階層構造のインデックスデータに含まれる顔画像を前記第２の顔画像群とする処理装置。
　請求項５に記載の処理装置において、
　前記顔画像群間判定手段及び前記顔画像群内判定手段は、最上層に位置する顔画像を前記代表顔画像とする処理装置。
　請求項４に記載の処理装置において、
　前記インデックスデータ生成手段は、画像から抽出された複数の顔画像で前記階層構造のインデックスデータを生成し、
　前記顔画像群間判定手段、前記顔画像群内判定手段及び前記処理手段は、前記閾値が基準値以上の所定の層に位置する第１の画像に紐付けられた複数の顔画像を前記第１の顔画像群とし、前記所定の層に位置し、前記第１の画像と同じグループに属する第２の画像に紐付けられた複数の顔画像を前記第２の顔画像群とする処理装置。
　請求項７に記載の処理装置において、
　前記顔画像群間判定手段及び前記顔画像群内判定手段は、前記第１の画像を前記第１の代表顔画像とし、前記第２の画像を前記第２の代表顔画像とする処理装置。
　コンピュータが、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定工程と、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定工程と、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理工程と、
を実行する処理方法。
　コンピュータを、
　第１の顔画像群の中の第１の代表顔画像と、第２の顔画像群の中の第２の代表顔画像との類似度が第１の条件を満たすか判定する顔画像群間判定手段、
　前記第１の代表顔画像と前記第１の顔画像群の中の他の顔画像各々との類似度、及び、前記第２の代表顔画像と前記第２の顔画像群の中の他の顔画像各々との類似度に基づき、前記代表顔画像と前記顔画像群の中の他の画像との関係を定めた第２の条件を満たすか、前記第１の顔画像群及び前記第２の顔画像群毎に判定する顔画像群内判定手段、
　前記第１の条件を満たし、かつ、前記第１の顔画像群及び前記第２の顔画像群いずれも前記第２の条件を満たすと判定された場合、前記第１の顔画像群及び前記第２の顔画像群に含まれる複数の顔画像に同一の人物ＩＤを紐付ける処理手段、
として機能させるプログラム。