JP7013135B2 - 情報処理装置の制御方法およびプログラム - Google Patents

情報処理装置の制御方法およびプログラム Download PDF

Info

Publication number
JP7013135B2
JP7013135B2 JP2017045413A JP2017045413A JP7013135B2 JP 7013135 B2 JP7013135 B2 JP 7013135B2 JP 2017045413 A JP2017045413 A JP 2017045413A JP 2017045413 A JP2017045413 A JP 2017045413A JP 7013135 B2 JP7013135 B2 JP 7013135B2
Authority
JP
Japan
Prior art keywords
images
image
representative image
similarity
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017045413A
Other languages
English (en)
Other versions
JP2018151705A (ja
Inventor
由里恵 宇野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017045413A priority Critical patent/JP7013135B2/ja
Publication of JP2018151705A publication Critical patent/JP2018151705A/ja
Application granted granted Critical
Publication of JP7013135B2 publication Critical patent/JP7013135B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンテンツをカテゴリに分類し、その代表コンテンツを選択するための技術に関する。
従来、コンテンツが大量に存在する場合に、ユーザーが手動でコンテンツを選択してカテゴリに振り分けることは非常に手間がかかっていた。そこで、コンテンツの属性を算出し、それに基づいて各コンテンツを最適なカテゴリに自動的に分類することが行われている(特許文献1参照)。
特開2007-102362号公報
しかしながら、コンテンツが分類されたカテゴリを識別するための名称を付与する場合、ユーザーは、各カテゴリに振り分けられたすべての画像を閲覧して、その傾向や特徴を把握し、最適な名称を決めなければならなかった。例えば、Aさんの運動会で撮影された複数の画像が、撮影日時や撮影場所に基づいて1つのカテゴリに分類されている場合に、Aさんが写っている1枚の画像で判断すると、カテゴリにAさんの名称を付与する可能性が高くなる。そうすると、そのカテゴリにAさん以外の同級生の画像も含まれていることが分からなくなってしまうため、ユーザーは、最適な名称を付与するためには、カテゴリに含まれる多くの写真を確認しなければならなかった。
そこで、本発明は、コンテンツを自動的にカテゴリに分類した場合に、ユーザーが各カテゴリに振り分けられた画像の傾向や特徴を確認するのにかかる手間を低減することを目的とする。
本願に係る発明の1つは、情報処理装置であって、複数の画像をそのメタデータにしたがってカテゴリに分類する分類手段と、前記画像の被写体の認識結果に基づき、第1のカテゴリに分類された第1の画像同士の類似度を算出する算出手段と、複数の前記第1の画像の中から、前記第1の画像同士の類似度の平均値が最大の画像を、第1の代表画像として選択する第1の選択手段と、前記複数の第1の画像のうち、前記第1の代表画像との類似度の算出結果が閾値より小さい第2の画像が所定枚数より多ければ、複数の前記第2の画像のうち少なくとも1つを第2の代表画像として選択する第2の選択手段を備え、前記第2の選択手段は、前記第2の画像が所定枚数より少なければ、前記第2の代表画像を選択しないことを特徴とする。
本発明によれば、画像をそのメタデータにしたがって自動的にカテゴリに分類した場合に、ユーザーが各カテゴリに振り分けられた画像の傾向や特徴を確認するのにかかる手間を低減することができるという効果が得られる。
本発明の一実施形態に係る画像分類装置の構成の一例を示すブロック図である。 本発明の一実施形態に係る画像分類装置の動作の一例を示すフローチャート図である。 本発明の一実施形態に係るカテゴリを管理するためのテーブルの一例を示す図である。 本発明の一実施形態に係る類似度マトリックスの一例を示す図である。 本発明の一実施形態に係る画像分類装置の動作の一例を示すフローチャート図である。 本発明の一実施形態に係るカテゴリ入力画面の一例を示す図である。
以下に、図面を参照して、この発明の好適な実施の形態を例示的に詳しく説明する。ただし、この実施形態に記載されている構成要素はあくまで例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。
(第1の実施形態)
本実施例の画像分類装置100を実現するコンピュータ装置(情報処理装置)の構成について、図1のブロック図を参照して説明する。画像分類装置100は単一のコンピュータ装置で実現してもよいし、必要に応じた複数のコンピュータ装置に各機能を分散して実現するようにしてもよい。複数のコンピュータ装置で構成される場合は、互いに通信可能なようにLocal Area Network(LAN)などで接続されている。
図1において、制御部101は画像分類装置100全体を制御し、例えばCentral Processing Unit(CPU)である。Read Only Memory(ROM)102は変更を必要としないプログラムやパラメータを格納する。Random Access Memory(RAM)103は外部装置などから供給されるプログラムやデータを一時記憶する。外部記憶装置104は画像分類装置100に固定して設置されたハードディスクドライブ(HDD)、フラッシュメモリで構成されるソリッドステートドライブ(SSD)、ハードディスクとフラッシュメモリを併用したハイブリッドドライブやメモリカード等である。外部記憶装置104はOperating System(OS)などのプログラムを記憶する。また、外部記憶装置104は、本実施例の自動分類アプリケーションプログラムソフトウエア(以下、自動分類アプリと言う)を記憶したり、画像ファイルや音楽ファイルを記憶したりする。
操作入力インターフェイス105はユーザーの操作を受付け、データを入力するポインティングデバイスやキーボード、タッチパネルなどの操作入力装置109と接続する。Video RAM(VRAM)106は、表示装置111に表示する為の画像を描画する。このVRAM106に生成した画像を、所定の規定に従って表示装置111に送信し、これにより表示装置111は画像を表示する。なお、メモリ間(例えば、VRAM106と他のメモリとの間)や、メモリと各I/Oデバイス(例えば、ネットワークインターフェイス107)間のデータ転送はBit Move Unit(BMU)により制御される。画像分類装置100はデータ入力インターフェイス108を介してデータ入力装置112から画像ファイルや音楽ファイル等のデータの入力を受け付ける。ネットワークインターフェイス107はインターネットなどのネットワーク回線110に接続する。システムバス113は101~108の各ユニットを通信可能に接続する。
本実施形態の画像分類装置100において、複数の画像ファイルを自動的にカテゴリに分類し、各カテゴリの代表画像を表示して、カテゴリに付与される名称の入力を受け付ける動作について、図2および図5のフローチャートを参照して説明する。以下で説明する動作は、画像分類装置100の制御部101が、自動分類アプリをHDD104から読み出して起動し、上述の図1の各モジュールを制御することによって実現される。
まず、図2のフローチャートを参照して、画像ファイルを各カテゴリへ分類する動作について説明する。本動作は画像ファイルが新規にHDD104に記憶されるたびに自動的に実行されてもよいし、ユーザーの操作に応答して、実行されてもよい。
制御部101は、画像ファイルをHDD104から読み込み(S201)、画像ファイルに含まれる画像データに対して画像解析を行い、画像データの属性として、特徴量を取得する(S202)。ステップS202において、制御部101は、画像データの被写体の人物や物体を認識したり、画像データの明るさや色味を検出したりして、これらに基づく特徴量を取得する。また、制御部101は画像ファイルに含まれる画像データのメタデータ(撮影日時や撮影場所、カメラの機種、撮影者など)に基づく特徴量を取得する。
そして、制御部101は、画像ファイルをその特徴量に基づき、予め定められたルールにしたがってカテゴリに分類し、分類されたカテゴリに関連付けて記憶する。(S203)。例えば、ルールが、撮影場所または被写体の人物またはそれらの組合せ毎のカテゴリに分類するものであった場合、制御部101は、画像ファイルをその撮影場所または被写体の人物またはそれらの組合せと対応する各カテゴリに分類する。ここで、画像ファイルをカテゴリに関連付けて記憶するためのテーブルの一例を図3に示す。図3のテーブルでは、画像ファイル1~11が、カテゴリA、B、Cに分類され、関連付けて記憶されていることを示す。また、1つの画像ファイルは該当する複数のカテゴリに関連付けて記憶され、例えば、画像ファイル6は、カテゴリAとBに関連付けられている。なお、画像ファイルを分類するカテゴリが画像分類テーブル300に存在しなければ、その都度、新しいカテゴリが追加される。
制御部101は、画像ファイルと、当該画像ファイルの属するカテゴリに関連付けられた他の画像ファイルとの類似度をそれぞれの特徴量に基づき算出する(S204)。また、ステップS204で算出された他の画像ファイルとの類似度の平均値を算出する(S205)。そして、ステップS204およびS205での算出結果を画像ファイルに関連付けて記憶する。ここで、各カテゴリに属する画像ファイルの他の画像ファイルの類似度とその平均値を記憶するためのテーブルの一例を図4に示す。図4の類似度マトリックス400はカテゴリAにおいて、被写体の認識結果の特徴量に基づき、カテゴリ内の画像ファイル同士の類似度を算出した場合を示す。縦軸と横軸それぞれにカテゴリ内に含まれるすべての画像ファイルが割り当てられ、縦軸と横軸の交点に互いの類似度を示す値が格納されている。図4では、例えば、画像ファイル3と画像ファイル4の類似度として、「0.2」が格納されている。また、画像ファイルそれぞれの他の画像ファイルとの類似度の平均値が類似度平均として格納される。
次に、各カテゴリの代表画像を選択して、表示し、カテゴリに付与される名称の入力を受け付ける動作を図5のフローチャートを参照して説明する。なお、以下のフローはカテゴリ毎に繰り返し実行される。また、本動作は画像ファイルが所定数以上記憶されるなど所定の条件を満たすと自動的に実行されるようにしてもよいし、ユーザーの操作に応答して、実行されてもよい。
制御部101は、カテゴリに関連付けて記憶された画像ファイルを抽出し(S501)、抽出された画像ファイルのうち、類似度平均値が最大のものを第1代表画像として選択し(S502)、表示装置111に表示するよう表示制御する(S510)。そして、制御部101は、抽出された画像ファイルのうち、第1代表画像との類似度が所定の閾値以下のもの(第2代表画像候補)が存在するかを判定する(S503)。
第2代表画像候補が存在すれば(S503でYes)、その枚数が所定数以上であるかどうかを判定する(S504)。例えば、類似度の所定の閾値が「0.2」、第2代表画像候補の所定枚数が「3」枚の時、図4の類似度マトリックス400で、第1代表画像として選択された画像ファイル3との類似度が閾値「0.2」以下の画像ファイルは「2」、「4」、「6」の3枚である。よって、ステップS504でYesと判断される。第2代表画像候補が所定数以上であれば(S504でYes)、第2代表画像候補同士の類似度を、類似度マトリックス400を参照して取得する(S505)。そして、制御部101は、取得された類似度が所定の閾値以上の第2代表画像候補の組合せ毎にグループに分類し(S506)、これらのグループのうち所定数以上の第2代表画像候補が存在するグループをさらに選択する(S507)。例えば、類似度の所定の閾値が「0.5」、グループ内の所定枚数が「2」枚の時、画像ファイル「2」と「4」の類似度は「0.8」なので、画像ファイル「2」と「4」の2枚で構成されたグループが選択される。
そして、制御部101は、類似度マトリックス400を参照して、選択されたグループに属する第2代表画像候補それぞれと第1代表画像の類似度を取得する(S508)。ステップS507で選択されたグループに属する第2代表画像候補のうち、他のグループに存在しない第2代表画像候補の中で、第1代表画像との類似度が最低のものを第2代表画像として選択する(S509)。そして、第1代表画像と第2代表画像を表示装置111に表示するよう表示制御する(S510)。例えば、第1代表画像として選択された画像ファイル3と、画像ファイル「2」および「4」それぞれの類似度は「0」と「0.2」であるため、類似度の低い画像ファイル「2」が第2代表画像として選択され、第1代表画像とともに表示装置111に表示される。
ステップS510で、第1代表画像および第2代表画像が表示装置111に表示される様子の一例を図6に示す。図6では、カテゴリAの第1代表画像601および第2代表画像602が、カテゴリ入力画面600に表示されている。図6に示す入力ボックス603には、現在、カテゴリ名が未登録であることが示されている。
なお、ステップS503において、制御部101は、第2代表画像候補が存在しないと判定すれば、第2代表画像なしで、第1代表画像を表示装置111に表示するよう表示制御する(S510)。また、ステップS504において、制御部101は、第2代表画像候補が所定の枚数未満であると判定すれば、第2代表画像なしで、第1代表画像を表示装置111に表示するよう表示制御する(S510)。これらの場合、カテゴリ名入力画面200には第2代表画像602なしで、第1代表画像601が表示される。
ユーザーによる操作入力装置109への操作に応答して、カテゴリを識別するためのカテゴリ名を示す文字列が入力され、入力ボックス603に表示される。その後、ユーザーの操作に応答してOKボタン604が押下されると(S511でYes)、図3(b)のカテゴリ名テーブル310に示すように、入力されたカテゴリ名をカテゴリAに関連付けて記憶し(S512)、本処理を終了する。一方、キャンセルボタン605が押下されると(S511でNo)、カテゴリ名の入力処理を中止し、カテゴリ入力画面600を非表示にして本処理を終了する。
以上のように、本実施形態によれば、ユーザーは同じカテゴリに分類された複数の画像のうち、他の画像と互いに最も類似している第1代表画像と、第1代表画像とは似ていない第2代表画像とを選択して表示する。これにより、ユーザーは同じカテゴリに分類された複数の画像の傾向や特徴を少ない枚数の画像で確認することができ、適切なカテゴリ名を速やかに決定して付与することができる。
なお、本実施形態では第1代表画像と第2代表画像をそれぞれ1枚ずつ選択する場合について説明した。しかしながら、これに限らず、ステップS502で類似度平均値が高いものから順に所定枚数の画像ファイルを第1代表画像として選択してもよいし、類似度平均値が閾値より高いものを選択してもよい。また、ステップS509で第1代表画像との類似度が低いものから順に所定枚数の第2代表画像候補を第2代表画像として選択してもよいし、類似度平均値が閾値より低いものを選択してもよい。
また、第1代表画像として、他のカテゴリにも分類された画像ファイルが選択されている場合は、その旨をカテゴリ入力画面600に表示して通知するようにしてもよい。
また、ステップS502において、他のカテゴリに分類されてない画像の中から、類似度平均値が最も高いものを第1代表画像として選択し、そのカテゴリだけに分類されている画像ファイルを代表画像として表示するようにしてもよい。
また、ステップS509で他のカテゴリにも属している画像ファイルの中から、第1代表画像との類似度が最も低いものを第2代表画像として選択し、他のカテゴリにも分類されている画像ファイルを代表画像として表示するようにしてもよい。
また、ステップS205では、類似度の平均値を算出するようにしたが、これに限らず、例えば、標準偏差などを算出するようにしてもよい。
また、本実施形態では、画像ファイルをカテゴリに分類し、代表画像を選択して表示する例を説明したが、音楽ファイルやテキストファイルなど他のコンテンツのファイルを分類し、代表コンテンツを選択して表示することも同様にして実現できる。
(他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (7)

  1. 複数の画像をそのメタデータにしたがってカテゴリに分類する分類手段と、
    前記画像の被写体の認識結果に基づき、第1のカテゴリに分類された第1の画像同士の類似度を算出する算出手段と、
    複数の前記第1の画像の中から、前記第1の画像同士の類似度の平均値が最大の画像を、第1の代表画像として選択する第1の選択手段と、
    前記複数の第1の画像のうち、前記第1の代表画像との類似度の算出結果が閾値より小さい第2の画像が所定枚数より多ければ、複数の前記第2の画像のうち少なくとも1つを第2の代表画像として選択する第2の選択手段を備え、
    前記第2の選択手段は、前記第2の画像が所定枚数より少なければ、前記第2の代表画像を選択しないことを特徴とする情報処理装置。
  2. 前記算出手段により算出された前記第2の画像同士の第2の類似度が閾値より大きい第2の画像の組み合わせをグループに分類する第2の分類手段をさらに備え、
    前記第2の選択手段は、前記グループ毎に、前記グループに属する複数の第2の画像のうち、前記第1の代表画像との類似度の算出結果が最低の第2の画像を前記第2の代表画像として選択することを特徴とする請求項1に記載の情報処理装置。
  3. 前記第2の選択手段は、前記複数の第2の画像のうち、前記第1のカテゴリとは異なる第2のカテゴリに分類されていない第2の画像を前記第2の代表画像として選択することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記メタデータは、撮影日時、撮影場所、撮影装置の種類および撮影者のうち少なくとも1つであることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記第1の代表画像および前記第2の代表画像を表示装置に表示するよう制御する表示制御手段をさらに備えたことを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 情報処理装置により実行される制御方法であって、
    複数の画像をそのメタデータにしたがってカテゴリに分類するステップと、
    前記画像の被写体の認識結果に基づき、第1のカテゴリに分類された第1の画像同士の類似度を算出するステップと、
    複数の前記第1の画像の中から、前記第1の画像同士の類似度の平均値が最大の画像を、第1の代表画像として選択するステップと、
    前記複数の第1の画像のうち、前記第1の代表画像との類似度の算出結果が閾値より小さい第2の画像が所定枚数より多ければ、複数の前記第2の画像のうち少なくとも1つを第2の代表画像として選択するステップを備え、
    前記第2の画像が所定枚数より少なければ、前記第2の代表画像は選択されないことを特徴とする制御方法。
  7. コンピュータを請求項1乃至5のいずれか一項に記載の情報処理装置の各手段として機能させるプログラム。
JP2017045413A 2017-03-09 2017-03-09 情報処理装置の制御方法およびプログラム Active JP7013135B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017045413A JP7013135B2 (ja) 2017-03-09 2017-03-09 情報処理装置の制御方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017045413A JP7013135B2 (ja) 2017-03-09 2017-03-09 情報処理装置の制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018151705A JP2018151705A (ja) 2018-09-27
JP7013135B2 true JP7013135B2 (ja) 2022-01-31

Family

ID=63680409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017045413A Active JP7013135B2 (ja) 2017-03-09 2017-03-09 情報処理装置の制御方法およびプログラム

Country Status (1)

Country Link
JP (1) JP7013135B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010041377A (ja) 2008-08-05 2010-02-18 Sharp Corp 無線通信システム、基地局装置、移動局装置及び無線通信方法
JP2010118943A (ja) 2008-11-13 2010-05-27 Noritsu Koki Co Ltd 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
JP5551741B2 (ja) 2012-09-06 2014-07-16 エヌ・ティ・ティ・コムウェア株式会社 機器同定装置、機器同定システム、機器同定方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010041377A (ja) 2008-08-05 2010-02-18 Sharp Corp 無線通信システム、基地局装置、移動局装置及び無線通信方法
JP2010118943A (ja) 2008-11-13 2010-05-27 Noritsu Koki Co Ltd 画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
JP5551741B2 (ja) 2012-09-06 2014-07-16 エヌ・ティ・ティ・コムウェア株式会社 機器同定装置、機器同定システム、機器同定方法、及びプログラム

Also Published As

Publication number Publication date
JP2018151705A (ja) 2018-09-27

Similar Documents

Publication Publication Date Title
US10742823B2 (en) Image processing apparatus and image processing method
US8514245B2 (en) Image selection device and control method thereof
US10943376B2 (en) Image processing apparatus for laying out image on template and image processing method
JP2017224184A (ja) 機械学習装置
US9851873B2 (en) Electronic album creating apparatus and method of producing electronic album
US9298716B2 (en) Information processing apparatus, method for controlling the same, and storage medium storing program for displaying a tag added to a content file
JP6876914B2 (ja) 情報処理装置
US11107260B2 (en) Image processing apparatus, control method, and storage medium
JP2022159514A (ja) 画像処理装置,画像処理方法ならびに画像処理プログラムおよびそのプログラムを格納した記録媒体
WO2018040762A1 (zh) 数据挖掘方法及装置
US20230112555A1 (en) Image processing apparatus, control method, and storage medium
JP2014016790A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2016085534A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
US11775618B2 (en) Image processing device, image processing method, and image processing program for deciding a similarity between a captured image and a sample image
JP2020140555A (ja) 画像処理装置、制御方法、及びプログラム
JP7013135B2 (ja) 情報処理装置の制御方法およびプログラム
JP6441142B2 (ja) 検索装置、方法及びプログラム
US11356570B2 (en) Image processing apparatus, image processing method, and storage medium
US11743396B2 (en) Electronic album generating apparatus, electronic album generating method, and non-transitory computer-readable storage medium
US20190005038A1 (en) Method and apparatus for grouping documents based on high-level features clustering
JP6357754B2 (ja) ファイル管理装置及びシステム並びにプログラム
US9189497B2 (en) Information processing apparatus, control method therefor, and program for classifying a plurality of data
JP6704680B2 (ja) 表示装置、情報処理プログラムおよび情報処理方法
KR102388307B1 (ko) 대화방 제공 방법 및 단말
JP2014089516A (ja) 映像コンテンツ管理プログラム及び映像コンテンツ管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220119