JP7419142B2 - 表示制御装置、表示制御方法及びプログラム - Google Patents

表示制御装置、表示制御方法及びプログラム Download PDF

Info

Publication number
JP7419142B2
JP7419142B2 JP2020065924A JP2020065924A JP7419142B2 JP 7419142 B2 JP7419142 B2 JP 7419142B2 JP 2020065924 A JP2020065924 A JP 2020065924A JP 2020065924 A JP2020065924 A JP 2020065924A JP 7419142 B2 JP7419142 B2 JP 7419142B2
Authority
JP
Japan
Prior art keywords
cluster
sub
image
similarity
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020065924A
Other languages
English (en)
Other versions
JP2021163310A (ja
Inventor
廣大 齊藤
雄土 山地
修 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020065924A priority Critical patent/JP7419142B2/ja
Priority to US17/179,709 priority patent/US12032625B2/en
Publication of JP2021163310A publication Critical patent/JP2021163310A/ja
Application granted granted Critical
Publication of JP7419142B2 publication Critical patent/JP7419142B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/7625Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明の実施形態は表示制御装置、表示制御方法及びプログラムに関する。
データをカテゴリごとに分類するクラスタリング方法が従来から知られている。例えば、監視映像に含まれる顔画像データの場合は個人ごとにデータをクラスタに分類することで、通行者の履歴の目視確認をより容易に行うことができる。
特開平10-162020号公報
しかしながら、従来の技術では、カテゴリ間の類似関係については把握することができるが、同一カテゴリ内の画像どうしの関係性については把握することが難しかった。
実施形態の表示制御装置は、クラスタリング部とサブクラスタリング部と表示制御部とを備える。クラスタリング部は、画像の類似度と第1閾値とに基づいて、前記画像を複数のクラスタに分類する。サブクラスタリング部は、前記類似度と、前記第1閾値よりも高い第2閾値とに基づいて、前記クラスタ内の前記画像を、複数のサブクラスタに更に分類する。表示制御部は、前記クラスタに含まれる画像の代表を示すクラスタ代表と、前記サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を、表示部に表示する。前記サブクラスタリング部によって分類された複数の画像は、前記クラスタ代表に最も類似するサブクラスタ代表を根とし、前記クラスタ代表との類似度が高い順にサブクラスタ代表同士が第1方向に接続され、第1の前記サブクラスタ代表を持つ第1の前記サブクラスタに含まれる画像は、前記第1のサブクラスタ代表との類似度が高い順に第2方向に接続される木構造を有する。前記サブクラスタリング部は、新たな画像を分類するときに、前記第1のサブクラスタ代表との類似度が前記第2閾値を超えない場合は、前記第1のサブクラスタに含まれる画像と、前記新たな画像との類似度計算を行わない。
第1実施形態の表示制御装置の機能構成の例を示す図。 第1実施形態のクラスタリング部の処理の例を示すフローチャート。 第1実施形態のサブクラスタリング部の処理の例を示すフローチャート。 サブクラスタに分類された複数の画像のデータ構造の例を示す図。 第1実施形態の表示情報の例を示す図。 第2実施形態の表示制御装置の機能構成の例を示す図。 第2実施形態の修正前の表示情報の例を示す図。 第2実施形態の修正後の表示情報の例を示す図。 第2実施形態の変形例の表示制御装置の機能構成の例を示す図。 第2実施形態の変形例の登録制御部の動作を説明するための図。 第2実施形態の変形例の検索部の動作を説明するための図。 第2実施形態の変形例の表示情報の例を示す図。 第1及び第2実施形態の表示制御装置のハードウェア構成の例を示す図。
以下に添付図面を参照して、表示制御装置、表示制御方法及びプログラムの実施形態を詳細に説明する。
(第1実施形態)
はじめに、第1実施形態の表示制御装置の機能構成の例について説明する。第1実施形態では、顔画像認識技術によって、顔の検出や個人識別のための特徴量計算を用いる場合について述べるが、人物の全身を検出して個人識別のための特徴量を用いる方法にも適用することができる。
[機能構成の例]
図1は第1実施形態の表示制御装置10の機能構成の例を示す図である。第1実施形態の表示制御装置10は、計算部100、クラスタリング部101、第1閾値設定部102、サブクラスタリング部103、第2閾値設定部104、表示制御部105及び表示部106を備える。
計算部100は、画像間の類似度を算出する。具体的には、計算部100は、例えば画像を当該画像の特徴を示す特徴量に変換し、当該特徴量のユークリッド距離やコサイン類似度に基づいて類似度を算出する。
クラスタリング部101は、画像の類似度と、第1閾値とに基づいて、画像を複数のクラスタ(クラス)に分類する。例えば、クラスタリング部101は、クラスに含まれる画像の特徴量(例えば特徴ベクトル)の平均(例えば平均ベクトル)と、分類対象の画像の特徴量との類似度が第1閾値を超えた場合、分類対象の画像を当該クラスに分類する。類似度が高い画像同士ほど同一クラスである可能性が高く、類似度が低い画像同士ほど別クラスである可能性が高い。第1実施形態では、人物を含む画像を分類する場合について説明する。
第1閾値設定部102は、クラスタリング部101による分類処理に使用される第1閾値を設定する。第1閾値設定部102は、例えば画像とクラスとが与えられているデータを使用して、同一クラス内での画像の類似度と、異なるクラス間の画像での類似度とに基づいて第1閾値を決定する。
サブクラスタリング部103は、上述の類似度と、第1閾値よりも高い第2閾値とに基づいて、クラスタ内の画像を、複数のサブクラスタに更に分類する。これにより、各クラスタ内において酷似したデータを集約することでき、同一カテゴリ(クラスタ)に含まれる多様なデータを選別して表示可能にすることができる。
第2閾値設定部104は、サブクラスタリング部103による分類処理に使用される第2閾値を設定する。第2閾値は、例えばあらかじめ正解を準備しておいたデータ(画像とクラスとが関連付けられたデータ)から決めることができる。サブクラスタリング部103の目的は同一クラス(クラスタ)内の画像を分類することである。そのため、第2閾値設定部104は、画像を異なるクラスに分類するクラスタリング部101の第1閾値よりも、第2閾値を高い値に設定する。
また例えば、この第2閾値は、表示制御部105により表示部106に表示された分類結果に基づいて調整されてもよい。この場合、第2閾値設定部104は、分類結果に基づいて調整された第2閾値をユーザから受け付け、当該第2閾値をサブクラスタリング部103に設定する。そして、サブクラスタリング部103が、処理を再度実行し、必要に応じて第2閾値の再設定、及び、サブクラスタリング処理の再実行を繰り返す。
表示制御部105は、例えば、クラスタに含まれる画像の代表を示すクラスタ代表と、サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を、表示部106に表示する。
表示部106は、例えば液晶ディスプレイ及びタッチパネル等により実現される。なお、表示部106は、表示制御装置10に備えられていてもよいし、表示制御装置10の外部の装置により実現されていてもよい。
[クラスタリング部の処理の例]
図2は第1実施形態のクラスタリング部101の処理の例を示すフローチャートである。はじめに、クラスタリング部101が、クラスタに分類される画像xを受け付ける(ステップS1)。次に、クラスタリング部101は、クラスタ数>0であるか否かを判定する(ステップS2)。
クラスタ数>0である場合(ステップS2,Yes)、クラスタリング部101は、各クラスタに含まれる画像の特徴量の平均と、画像xの特徴量との類似度を計算する(ステップS3)。
類似度が第1閾値より大きい場合(ステップS4,Yes)、クラスタリング部101は、クラスタに画像xを追加し(ステップS5)、当該クラスタの平均を更新する(ステップS6)。具体的には、クラスタリング部101は、クラスタc毎に、平均m(c)とデータ数n(c)とを管理し、平均m(c)と画像xとの類似度が第1閾値を超えた場合は、画像xがクラスタcに所属すると判定する。画像xの追加処理は、例えば、m(c)=(n(c)m(c)+x)/(n(c)+1),n(c)=n(c)+1として各クラスタのデータを更新すればよい。なお、平均m(c)及びデータ数n(c)の初期値はいずれも0とする。
クラスタ数>0でない場合(ステップS2,Yes)、又は、類似度が第1閾値以下の場合(ステップS4,No)、クラスタリング部101は、画像xを含む新しいクラスタを作成し(ステップS7)、当該新しいクラスタの平均を画像xの特徴量とする(ステップS8)。
[サブクラスタリング部の処理の例]
図3は第1実施形態のサブクラスタリング部103の処理の例を示すフローチャートである。図4はサブクラスタに分類された複数の画像のデータ構造の例を示す図である。図4に示すように、サブクラスタに分類された複数の画像は木構造になっている。木に含まれる各ノードを接続する枝は縦方向(第1方向)、横方向(第2方向)の2種類がある。図3のフローチャートの処理により、類似度が第2閾値より大きい画像同士は横方向の枝で接続されるように木が構築される。これにより、同一階層(図4の横方向のノード)には、画像同士の類似度がより高い画像が集まるようになる。
サブクラスタリング部103は、木の根(root)の位置(図4の例では、サブクラスタ-1のサブクラスタ代表が記憶されるノード)から画像xの追加処理を開始する。
はじめに、サブクラスタリング部103が、サブクラスタに分類される画像xを受け付ける(ステップS21)。次に、サブクラスタリング部103は、木の終端であるか否かを判定する(ステップS22)。終端である場合(ステップS22,Yes)、ステップS30の処理に進む。
終端でない場合(ステップS22,No)、サブクラスタリング部103は、サブクラスタ代表ノードとの類似度を計算する(ステップS23)。次に、サブクラスタリング部103は、類似度が第2閾値より大きいか否かを判定する(ステップS24)。
類似度が第2閾値以下の場合(ステップS24,No)、比較対象を縦方向の枝のノードへ移動する(ステップS25)。すなわち、サブクラスタリング部103は、新たな画像を分類するときに、サブクラスタ代表との類似度が第2閾値を超えない場合は、当該サブクラスタに含まれる画像と、新たな画像との類似度計算を行わない。これにより、冗長な類似度計算を削減することができ、画像xの追加(分類)に係る処理を高速化できる。ステップS25の実行後、処理はステップS22に戻る。
類似度が第2閾値より大きい場合(ステップS24,Yes)、比較対象を横方向の枝のノードへ移動する(ステップS26)。次に、サブクラスタリング部103は、木の終端であるか否かを判定する(ステップS27)。終端である場合(ステップS27,Yes)、ステップS30の処理に進む。
終端でない場合(ステップS27,No)、サブクラスタリング部103は、ステップS23の処理により計算された類似度が、サブクラスタ代表と比較ノードの画像との類似度よりも大きいか否かを判定する(ステップS28)。ステップS23の処理により計算された類似度が、サブクラスタ代表と比較ノードの画像との類似度以下の場合(ステップS28,No)、処理はステップS26に戻る。ステップS23の処理により計算された類似度が、サブクラスタ代表と比較ノードの画像との類似度より大きい場合(ステップS28,Yes)、サブクラスタリング部103は、画像xを記憶するノードを作成し、当該ノードを比較ノードよりも前に挿入することにより、画像xを木に追加し(ステップS29)、処理はステップS31に進む。
終端である場合(ステップS22,S27,Yes)、サブクラスタリング部103は、画像xを記憶する終端ノードを作成し、画像xを木に追加する(ステップS30)。
次に、サブクラスタリング部103は、画像xが追加されたサブクラスタのサブクラスタ代表を更新する(ステップS31)。例えば、サブクラスタリング部103は、画像xが追加されたサブクラスタの平均を更新し、当該平均に最も近い画像を当該サブクラスタのサブクラスタ代表として選択する。
次に、サブクラスタリング部103は、縦方向の枝(サブクラスタ代表同士が接続された枝)の接続順序を、サブクラスタを含むクラスタのクラスタ代表との類似度が高い順に並べ変える(ステップS32)。
上述の図3のフローチャートの処理によって、クラスタ代表に最も類似するサブクラスタ代表を根とし、クラスタ代表との類似度が高い順にサブクラスタ代表同士が縦方向(第1方向)に接続され、サブクラスタに含まれる画像は、サブクラスタ代表との類似度が高い順に横方向(第2方向)に接続された木構造が形成される。
なお、上述の図3のフローチャートは一例であり、クラスタ内で複数のサブクラスタに分類された画像を記憶する木構造を、他の処理方法に従って形成してもよい。
[表示情報の例]
図5は第1実施形態の表示情報の例を示す図である。図5に示すように、クラスタリング部101で得られたクラスタ毎に、クラスタ代表と、サブクラスタ代表と、サブクラスタ内の画像とを含む表示情報が表示部106に表示される。
表示制御部105が、各サブクラスタ代表を、クラスタ代表との類似度が高い順番に表示することで、平均的な画像(クラスタ代表を示す画像)に近い順にデータを目視確認することができる。また、表示制御部105が、サブクラスタ内の画像をサブクラスタ代表との類似度が近い順に、所定の数、表示することで、サブクラスタに含まれる画像の傾向を確認することができる。サブクラスタ代表の画像、及び、サブクラスタ内の画像が、図5に示すように表示されることで、例えば外れ画像(クラスタ代表との類似度がより低い画像)を目視確認することも容易になる。
また、表示制御部105が、表示される画像の個数を制御することで、画像確認の網羅性と確認作業との効率を調節することもできる。なお、表示される画像の個数は0個に設定されてもよい。この場合、クラスタリング部101で得られたクラスタ毎に、クラスタ代表と、サブクラスタ代表とを含む表示情報が表示部106に表示される。
以上、説明したように、第1実施形態の表示制御装置10では、クラスタリング部101が、画像の類似度と第1閾値とに基づいて、画像を複数のクラスタに分類する。サブクラスタリング部103が、類似度と、第1閾値よりも高い第2閾値とに基づいて、クラスタ内の画像を、複数のサブクラスタに更に分類する。そして、表示制御部105が、クラスタに含まれる画像の代表を示すクラスタ代表と、サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を表示部106に表示する。
これにより第1実施形態の表示制御装置10によれば、カテゴリ(クラスタ)間の類似関係だけでなく、同一カテゴリ内の画像どうしの関係性についても、より容易に把握することができる。具体的には、例えば、顔画像の場合には同一カテゴリ内、すなわち、ある個人の顔画像データの集合においても、人物の顔の向き、表情、マスク・サングラスなどの装着物の有無などといった差異がある。これらの画像を類似した画像ごとにサブクラスタに分類し、当該サブクラスタのサブクラスタ代表を参照することによって、冗長な顔画像を除外しつつ、多様な条件の顔画像を得ることができる。
(第2実施形態)
次に第2実施形態について説明する。第2実施形態の説明では、第1実施形態と同様の説明については省略し、第1実施形態と異なる箇所について説明する。第2実施形態では、サブクラスタリング部103の処理によって冗長な人物画像をまとめることによって、動画中の人物画像を要約する場合を例にして説明する。第2実施形態では、顔画像認識技術によって、顔の検出や個人識別のための特徴量計算を用いる場合について述べるが、人物の全身を検出して個人識別のための特徴量を用いる方法にも適用することができる。
[機能構成の例]
図6は第2実施形態の表示制御装置10-2の機能構成の例を示す図である。第2実施形態の表示制御装置10-2は、計算部100、クラスタリング部101、第1閾値設定部102、サブクラスタリング部103、第2閾値設定部104、表示制御部105、表示部106、検出部200、抽出部201及び修正部202を備える。第2実施形態では、第1実施形態の構成に、更に検出部200、抽出部201及び修正部202が追加されている。
検出部200は、画像から顔を検出する。抽出部201は、検出部200により検出された顔の特徴を示す特徴量を抽出する。
修正部202は、表示情報から選択された1以上の画像の削除、又は、表示情報から選択された1以上の画像を含むクラスタ又はサブクラスタの変更を行う。
[表示情報の例]
図7は第2実施形態の修正前の表示情報の例を示す図である。第2実施形態では、登録修正画面210が追加されている。図7の表示情報は、クラスタID=1のクラスタと、クラスタID=2のクラスタとを含む。図7の例のように、人物がサングラス等を身に付けている場合、同一人物が別々のクラスタに分類されてしまうエラー(誤分類)が発生する場合がある。このような場合を想定し、表示情報に、登録修正画面210を設けておくことによって、ユーザが適宜、分類結果を修正することができる。図7の例は、登録修正画面210で、画像211の選択と、当該画像211に対する氏名「○○さん」の設定とを受け付ける場合を示す。
図8は第2実施形態の修正後の表示情報の例を示す図である。図8の例は、クラスタ代表の画像211を含むクラスタID=2のクラスタが、クラスタID=1のクラスタのサブクラスタに変更されている。図7の登録修正画面210で、画像211の選択と、当該画像211に対する氏名「○○さん」の設定とを受け付けると、修正部202が、クラスタ代表の画像211を含むクラスタID=2のクラスタを、氏名「○○さん」を有するクラスタID=1のクラスタのサブクラスタ(ID=3)として、クラスタID=1のクラスタに統合する。
なお、修正部202によりクラスタの統合が行われた場合、追加された画像と統合先のクラスタの画像との類似度は、元々、統合先に含まれていた画像同士の類似度よりも低いため、クラスタの平均(クラスタ代表を示す画像)を更新しなくてもよい。追加された画像を外れ値とみなし、当該外れ値を用いて画像の平均を更新しないことにより、より適切に画像のクラスタリングを行うことができる。
また例えば、図7の例とは逆に、同一人物毎のクラスタに、別の人物が含まれているエラー(誤分類)があった場合にも、ユーザは、表示部106に表示された表示情報を確認し、登録修正画面210から分類結果を修正できる。修正部202が、登録修正画面210での入力に応じて、別の人物を別のクラスタに分ける修正をすることにより、例えば分類結果から、映像中の人物を見つけるときの人物の見逃しを防ぐことができる。
(第2実施形態の変形例)
次に第2実施形態の変形例について説明する。変形例の説明では、第2実施形態と同様の説明については省略し、第2実施形態と異なる箇所について説明する。変形例では、表示制御部105により表示された表示情報を、人物検索DB(データベース)に利用する場合について説明する。
[機能構成の例]
図9は第2実施形態の変形例の表示制御装置10-3の機能構成の例を示す図である。変形例の表示制御装置10-3は、計算部100、クラスタリング部101、第1閾値設定部102、サブクラスタリング部103、第2閾値設定部104、表示制御部105、表示部106、検出部200、抽出部201、修正部202、登録制御部203、人物検索DB204及び検索部205を備える。変形例では、第2実施形態の構成に、更に登録制御部203、人物検索DB204及び検索部205が追加されている。
クラスタリング部101及びサブクラスタリング部103は、既存の画像に対してクラスタリング処理及びサブクラスタリング処理を行い、クラスタ代表及びサブクラスタ代表を決定する。
表示制御部105は、サブクラスタ代表をユーザに提示する表示情報を表示部106に表示する。
登録制御部203は、表示制御部105により表示された表示情報から選択された1以上の画像を、ID及び付加情報(属性情報)等とともに人物検索DB204に登録する。サブクラスタリングによって得られた表示情報から、人物検索DB204に登録する画像を選択可能にすることにより、同一クラス(クラスタ)内で様々な変動を有する画像から、人物検索に適切な画像を選別することが容易になり、検索精度の向上が期待できる。
人物検索DB204には、例えば画像、ID及び付加情報が関連付けて記憶される。画像は、例えば顔を含む人物画像である。IDは画像を識別する情報である。付加情報は、例えば性別、年齢、人種、表情、眼鏡など着用物の有無、髪型及び服装などの付加的な情報である。
検索部205は、監視カメラ等により撮像された撮像画像に含まれる人物を、人物検索DB204から検索する。例えば、検索部205は、撮像画像に含まれる人物と、人物検索DB204の画像に含まれる人物との類似度に基づいて、人物検索DB204から人物を検索する。
図10は第2実施形態の変形例の登録制御部203の動作を説明するための図である。図10の例では、サブクラスタ代表を示す4つの画像を含む表示情報が表示制御部105によって表示されている。図10の例では、表示情報から画像212が選択され、登録制御部203によって、画像212が人物検索DB204に登録されている。
図11は第2実施形態の変形例の検索部の動作を説明するための図である。図11の例では、検索部205が、監視カメラにより撮像された人物214を含む画像に類似する画像を、人物検索DB204から検索する場合を示す。図11の例は、表示制御部105が、人物214との類似度が高い順に画像212及び213を、検索結果として表示する場合を示す。
図12は第2実施形態の変形例の表示情報の例を示す図である。図12は、サブクラスタ代表を示す表示情報の例である。サブクラスタ代表を示す画像に、別の人物の画像(図12では画像220)が含まれている場合でも、別の人物の画像の選択し、上述の登録修正画面210で修正することによって、別の人物の画像を別のクラスタに分けることができる。
最後に、第1及び第2実施形態の表示制御装置10のハードウェア構成の例について説明する。
[ハードウェア構成の例]
図13は第1及び第2実施形態の表示制御装置10のハードウェア構成の例を示す図である。
表示制御装置10は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
制御装置301は、補助記憶装置303から主記憶装置302に読み出されたプログラムを実行する。主記憶装置302は、ROM(Read Only Memory)、及び、RAM(Random Access Memory)等のメモリである。補助記憶装置303は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及び、メモリカード等である。
表示装置304は表示情報を表示する。表示装置304は、例えば液晶ディスプレイ等である。入力装置305は、コンピュータを操作するためのインタフェースである。入力装置305は、例えばキーボードやマウス等である。コンピュータがスマートフォン及びタブレット型端末等のスマートデバイスの場合、表示装置304及び入力装置305は、例えばタッチパネルである。通信装置306は、他の装置と通信するためのインタフェースである。
コンピュータで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、メモリカード、CD-R及びDVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
またコンピュータで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。またコンピュータで実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
またコンピュータで実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
コンピュータで実行されるプログラムは、上述の表示制御装置10の機能構成(機能ブロック)のうち、プログラムによっても実現可能な機能ブロックを含むモジュール構成となっている。当該各機能ブロックは、実際のハードウェアとしては、制御装置301が記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置302上にロードされる。すなわち上記各機能ブロックは主記憶装置302上に生成される。
なお上述した各機能ブロックの一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
また複数のプロセッサを用いて各機能を実現する場合、各プロセッサは、各機能のうち1つを実現してもよいし、各機能のうち2つ以上を実現してもよい。
また表示制御装置10を実現するコンピュータの動作形態は任意でよい。例えば、表示制御装置10を1台のコンピュータにより実現してもよい。また例えば、表示制御装置10を、ネットワーク上のクラウドシステムとして動作させてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100 計算部
101 クラスタリング部
102 第1閾値設定部
103 サブクラスタリング部
104 第2閾値設定部
105 表示制御部
106 表示部
200 検出部
201 抽出部
202 修正部
203 登録制御部
204 人物検索DB
205 検索部
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス

Claims (15)

  1. 画像の類似度と第1閾値とに基づいて、前記画像を複数のクラスタに分類するクラスタリング部と、
    前記類似度と、前記第1閾値よりも高い第2閾値とに基づいて、前記クラスタ内の前記画像を、複数のサブクラスタに更に分類するサブクラスタリング部と、
    前記クラスタに含まれる画像の代表を示すクラスタ代表と、前記サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を、表示部に表示する表示制御部と、を備え、
    前記サブクラスタリング部によって分類された複数の画像は、前記クラスタ代表に最も類似するサブクラスタ代表を根とし、前記クラスタ代表との類似度が高い順にサブクラスタ代表同士が第1方向に接続され、第1の前記サブクラスタ代表を持つ第1の前記サブクラスタに含まれる画像は、前記第1のサブクラスタ代表との類似度が高い順に第2方向に接続される木構造を有し、
    前記サブクラスタリング部は、新たな画像を分類するときに、前記第1のサブクラスタ代表との類似度が前記第2閾値を超えない場合は、前記第1のサブクラスタに含まれる画像と、前記新たな画像との類似度計算を行わない、
    表示制御装置。
  2. 前記表示制御部は、前記第1のサブクラスタに含まれる画像を、前記第1のサブクラスタ代表との類似度が高い順に所定の数、表示する、
    請求項に記載の表示制御装置。
  3. 前記画像は人物を含み、
    前記クラスタリング部は、前記画像に含まれる前記人物の類似度と、前記第1閾値とに基づいて、前記画像を前記人物毎に前記複数のクラスタに分類し、
    前記サブクラスタリング部は、前記画像に含まれる前記人物の類似度と、前記第2閾値とに基づいて、前記画像を前記複数のサブクラスタに分類する、
    請求項1又は2に記載の表示制御装置。
  4. 前記表示情報から選択された1以上の画像を、人物検索データベースに登録する登録制御部、
    を更に備える請求項に記載の表示制御装置。
  5. 前記表示情報から選択された1以上の画像の削除、又は、前記表示情報から選択された1以上の画像を含むクラスタ又はサブクラスタの変更を行う修正部、
    を更に備える請求項1乃至のいずれか1項に記載の表示制御装置。
  6. 表示制御装置が、画像の類似度と第1閾値とに基づいて、前記画像を複数のクラスタに分類するステップと、
    前記表示制御装置が、前記類似度と、前記第1閾値よりも高い第2閾値とに基づいて、前記クラスタ内の前記画像を、複数のサブクラスタに更に分類するステップと、
    前記表示制御装置が、前記クラスタに含まれる画像の代表を示すクラスタ代表と、前記サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を、表示部に表示するステップと、を含み、
    前記複数のサブクラスタに更に分類するステップによって分類された複数の画像は、前記クラスタ代表に最も類似するサブクラスタ代表を根とし、前記クラスタ代表との類似度が高い順にサブクラスタ代表同士が第1方向に接続され、第1の前記サブクラスタ代表を持つ第1の前記サブクラスタに含まれる画像は、前記第1のサブクラスタ代表との類似度が高い順に第2方向に接続される木構造を有し、
    複数のサブクラスタに更に分類するステップは、新たな画像を分類するときに、前記第1のサブクラスタ代表との類似度が前記第2閾値を超えない場合は、前記第1のサブクラスタに含まれる画像と、前記新たな画像との類似度計算を行わない、
    表示制御方法。
  7. 前記表示するステップは、前記第1のサブクラスタに含まれる画像を、前記第1のサブクラスタ代表との類似度が高い順に所定の数、表示する、
    請求項に記載の表示制御方法。
  8. 前記画像は人物を含み、
    前記複数のクラスタに分類するステップは、前記画像に含まれる前記人物の類似度と、前記第1閾値とに基づいて、前記画像を前記人物毎に前記複数のクラスタに分類し、
    前記複数のサブクラスタに更に分類するステップは、前記画像に含まれる前記人物の類似度と、前記第2閾値とに基づいて、前記画像を前記複数のサブクラスタに分類する、
    請求項6又は7に記載の表示制御方法。
  9. 前記表示情報から選択された1以上の画像を、人物検索データベースに登録するステップ、
    を更に含む請求項に記載の表示制御方法。
  10. 前記表示情報から選択された1以上の画像の削除、又は、前記表示情報から選択された1以上の画像を含むクラスタ又はサブクラスタの変更を行うステップ、
    を更に含む請求項乃至のいずれか1項に記載の表示制御方法。
  11. コンピュータを、
    画像の類似度と第1閾値とに基づいて、前記画像を複数のクラスタに分類するクラスタリング部と、
    前記類似度と、前記第1閾値よりも高い第2閾値とに基づいて、前記クラスタ内の前記画像を、複数のサブクラスタに更に分類するサブクラスタリング部と、
    前記クラスタに含まれる画像の代表を示すクラスタ代表と、前記サブクラスタに含まれる画像の代表を示すサブクラスタ代表とを含む表示情報を、表示部に表示する表示制御部、として機能させ、
    前記サブクラスタリング部によって分類された複数の画像は、前記クラスタ代表に最も類似するサブクラスタ代表を根とし、前記クラスタ代表との類似度が高い順にサブクラスタ代表同士が第1方向に接続され、第1の前記サブクラスタ代表を持つ第1の前記サブクラスタに含まれる画像は、前記第1のサブクラスタ代表との類似度が高い順に第2方向に接続される木構造を有し、
    前記サブクラスタリング部は、新たな画像を分類するときに、前記第1のサブクラスタ代表との類似度が前記第2閾値を超えない場合は、前記第1のサブクラスタに含まれる画像と、前記新たな画像との類似度計算を行わない、
    プログラム。
  12. 前記表示制御部は、前記第1のサブクラスタに含まれる画像を、前記第1のサブクラスタ代表との類似度が高い順に所定の数、表示する、
    請求項11に記載のプログラム。
  13. 前記画像は人物を含み、
    前記クラスタリング部は、前記画像に含まれる前記人物の類似度と、前記第1閾値とに基づいて、前記画像を前記人物毎に前記複数のクラスタに分類し、
    前記サブクラスタリング部は、前記画像に含まれる前記人物の類似度と、前記第2閾値とに基づいて、前記画像を前記複数のサブクラスタに分類する、
    請求項11又は12に記載のプログラム。
  14. 前記表示情報から選択された1以上の画像を、人物検索データベースに登録する登録制御部、
    として更に機能させる請求項13に記載のプログラム。
  15. 前記表示情報から選択された1以上の画像の削除、又は、前記表示情報から選択された1以上の画像を含むクラスタ又はサブクラスタの変更を行う修正部、
    として更に機能させる請求項11乃至14のいずれか1項に記載のプログラム。
JP2020065924A 2020-04-01 2020-04-01 表示制御装置、表示制御方法及びプログラム Active JP7419142B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020065924A JP7419142B2 (ja) 2020-04-01 2020-04-01 表示制御装置、表示制御方法及びプログラム
US17/179,709 US12032625B2 (en) 2020-04-01 2021-02-19 Display control apparatus, display control method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020065924A JP7419142B2 (ja) 2020-04-01 2020-04-01 表示制御装置、表示制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021163310A JP2021163310A (ja) 2021-10-11
JP7419142B2 true JP7419142B2 (ja) 2024-01-22

Family

ID=77922123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020065924A Active JP7419142B2 (ja) 2020-04-01 2020-04-01 表示制御装置、表示制御方法及びプログラム

Country Status (2)

Country Link
US (1) US12032625B2 (ja)
JP (1) JP7419142B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7239623B2 (ja) * 2021-02-26 2023-03-14 Necパーソナルコンピュータ株式会社 情報処理装置及び画像検出方法
CN114120410A (zh) * 2021-11-26 2022-03-01 北京百度网讯科技有限公司 用于生成标签信息的方法、装置、设备、介质和产品
KR20240011957A (ko) * 2022-07-20 2024-01-29 한양대학교 산학협력단 디자인 이미지 클러스터링 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010003021A (ja) 2008-06-18 2010-01-07 Sony Corp 画像処理装置、画像処理方法およびプログラム
US20100271395A1 (en) 2008-10-06 2010-10-28 Kuniaki Isogai Representative image display device and representative image selection method
JP2014016786A (ja) 2012-07-09 2014-01-30 Canon Inc 画像処理装置、画像処理方法、及びプログラム
WO2014132841A1 (ja) 2013-02-28 2014-09-04 株式会社日立国際電気 人物検索方法及びホーム滞留人物検索装置
JP2014186580A (ja) 2013-03-25 2014-10-02 Canon Inc 認証装置、撮像装置、認証用データの登録方法、プログラム、および、記憶媒体
JP2016071412A (ja) 2014-09-26 2016-05-09 キヤノン株式会社 画像分類装置、画像分類システム、画像分類方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162020A (ja) 1996-12-03 1998-06-19 Ricoh Co Ltd 画像データベースのブラウジング方法
JP5259670B2 (ja) 2010-09-27 2013-08-07 株式会社東芝 コンテンツ要約装置およびコンテンツ要約表示装置
US10713229B2 (en) * 2013-01-11 2020-07-14 Nec Corporation Index generating device and method, and search device and search method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010003021A (ja) 2008-06-18 2010-01-07 Sony Corp 画像処理装置、画像処理方法およびプログラム
US20100271395A1 (en) 2008-10-06 2010-10-28 Kuniaki Isogai Representative image display device and representative image selection method
JP2014016786A (ja) 2012-07-09 2014-01-30 Canon Inc 画像処理装置、画像処理方法、及びプログラム
WO2014132841A1 (ja) 2013-02-28 2014-09-04 株式会社日立国際電気 人物検索方法及びホーム滞留人物検索装置
JP2014186580A (ja) 2013-03-25 2014-10-02 Canon Inc 認証装置、撮像装置、認証用データの登録方法、プログラム、および、記憶媒体
JP2016071412A (ja) 2014-09-26 2016-05-09 キヤノン株式会社 画像分類装置、画像分類システム、画像分類方法、及びプログラム

Also Published As

Publication number Publication date
US20210311984A1 (en) 2021-10-07
JP2021163310A (ja) 2021-10-11
US12032625B2 (en) 2024-07-09

Similar Documents

Publication Publication Date Title
JP7419142B2 (ja) 表示制御装置、表示制御方法及びプログラム
CN108229322B (zh) 基于视频的人脸识别方法、装置、电子设备及存储介质
JP6853379B2 (ja) 対象人物の検索方法および装置、機器、プログラム製品ならびに媒体
US11423076B2 (en) Image similarity-based group browsing
US11436272B2 (en) Object based image based search
US9881226B1 (en) Object relation builder
US10176198B1 (en) Techniques for identifying visually similar content
US8416997B2 (en) Method of person identification using social connections
JP5963609B2 (ja) 画像処理装置、画像処理方法
CN108288051B (zh) 行人再识别模型训练方法及装置、电子设备和存储介质
US10380461B1 (en) Object recognition
US11341770B2 (en) Facial image identification system, identifier generation device, identification device, image identification system, and identification system
US8379939B1 (en) Efficient and scalable face recognition in photo albums
AU2018354105B2 (en) Genealogical entity resolution system and method
TW201921270A (zh) 針對一感興趣的人與一使用者介接以促進影像搜尋之方法及系統
JP6941966B2 (ja) 人物認証装置
US20120314957A1 (en) Information processing apparatus, information processing method, and program
JP5180922B2 (ja) 画像検索システム及び画像検索方法
CN109872406A (zh) 一种渐进式的判断更新方法、装置和人脸打卡系统
US20230298348A1 (en) Clothing standardization detection method and apparatus
US11762900B2 (en) Customized selection of video thumbnails to present on social media webpages
JP7133085B2 (ja) データベース更新方法及び装置、電子機器、並びにコンピュータ記憶媒体
US20230131717A1 (en) Search processing device, search processing method, and computer program product
JP7524106B2 (ja) 映像解析システム、及び映像解析方法
JP2024029418A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240110

R150 Certificate of patent or registration of utility model

Ref document number: 7419142

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150