JP6822484B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6822484B2
JP6822484B2 JP2018561169A JP2018561169A JP6822484B2 JP 6822484 B2 JP6822484 B2 JP 6822484B2 JP 2018561169 A JP2018561169 A JP 2018561169A JP 2018561169 A JP2018561169 A JP 2018561169A JP 6822484 B2 JP6822484 B2 JP 6822484B2
Authority
JP
Japan
Prior art keywords
objects
face
search
feature
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018561169A
Other languages
English (en)
Other versions
JPWO2018131132A1 (ja
Inventor
テイテイ トウ
テイテイ トウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018131132A1 publication Critical patent/JPWO2018131132A1/ja
Application granted granted Critical
Publication of JP6822484B2 publication Critical patent/JP6822484B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。特に、データの検索を実行する、情報処理装置、情報処理方法及びプログラムに関する。
情報取得手段と記憶技術の進展に伴い、ユーザが利用できる情報は膨大かつ多様化してきている。例えば、インターネット上の文書、画像データ、防犯カメラで撮影した映像データ、GPS(Global Positioning System;全地球測位システム)センサーから取得した位置情報等、様々なデータが容易に入手でき、活用できる状況下にある。
さらに、これらのデータから複数種類の情報(複数種類の特徴、特徴量)が利用できる、又は、抽出できる。例えば、メタデータとしての文書情報や撮影場所としての位置情報、撮影時刻としての時間情報などが付随している画像データから、複数種類の情報が利用等できる。具体的には、メタデータから直接位置情報等を抽出するだけでなく、画像データからRGB(Red Green Blue)等の画素情報を抽出でき、顔画像認識等に利用できる(顔などの属性情報も認識できる)。
このように、情報量の増大に伴い、それらの情報を管理する機能(とりわけ、検索機能)が非常に重要となってきた。そのため、多種多様な情報が混在したマルチメディアデータを対象とした様々な検索方法と装置が提案されている。例えば、特許文献1には、侵入者検知などの映像監視のために、映像データの画像から同一人物の異なる特徴量を取得し、ユーザ指定または人物追跡の方法により人物特徴を複数指定し、指定した条件に合致する画像を検索する技術が開示されている。
大規模な複数種類の情報を含むデータから、ユーザが望んでいる情報を効率的に取り出すために、ユーザに分かりやすく簡潔に結果情報を提示することも重要である。つまり、ユーザからの検索要求を処理する際に、検索条件に合致する、又は、類似する結果を並べるだけでは不十分である。重複又は類似している結果同士を整理して、代表的な結果を提示することで、ユーザが検索結果を確認する又は検索結果から所望の情報を得る時間を短縮することが望まれる。
特許文献2には、表示パターン候補を設定し、検索条件に基づき検索結果として得られたマルチメディアデータを、ユーザが選択した表示パターンに基づき分類し、分類されたグループ間の関係に従って、検索結果をユーザに提示する技術が開示されている。
特許文献3には、番組などのメタデータが含まれる画像に対し、検索文とメタデータに含まれる文との文書間距離に基づき画像のグループ分け行う技術が開示されている。さらに、当該技術では、各グループから画像特徴量の統計的ばらつきに基づき代表画像を選択し、距離の近いメタデータに対応づけられた代表画像を候補として選出して表示する。
特許文献4には、電子アルバム等の画像集合において、ユーザが画像集合の全体内容を迅速に把握するために、各画像の文書特徴または視覚特徴に基づき、全画像の内容を代表する1つまたは複数の代表画像を表示する技術が開示されている。
特許文献5には、入力手段を介して選択された情報と記憶手段に蓄積されている情報との類似度に基づいて算出される適応度に基づいて、次回提示する候補情報を決定する技術が開示されている。
また、検索結果の候補に対し特徴量を抽出してクラスタリングを行い、各クラスタから代表的な結果を選択するような方法も存在する(非特許文献1を参照)。あるいは、文書データや位置データなど、単一種類の情報があるデータを対象に、検索結果の多様化手法で代表的な結果を選択する方法も存在する(非特許文献2、3を参照)。
特開2009−27393号公報 特開2006−139382号公報 特開2013−114507号公報 特開2011−192273号公報 特開2004−259061号公報
Reinier H. van Leuken, Lluis Garcia, Ximena Olivares and Roelof van Zwol, "Visual Diversification of Image Search Results", Proceedings of the 18th International Conference on World Wide Web (WWW), pp. 341-350, 2009 Gabriele Capannini, Franco Maria Nardini, Raffaele Perego and Fabrizio Silvestri, "Efficient Diversification of Web Search Results", Proceedings of the 37th International Conference on Very Large Data Bases (VLDB), Vol. 4, No. 7, pp. 451-459, 2011 Marina Drosou and Evaggelia Pitoura, "DisC Diversity: Result Diversification based on Dissimilarity and Coverage", Proceedings of the 39th International Conference on Very Large Data Bases (VLDB), Vol. 6, No. 1, pp. 13-24, 2013
なお、上記先行技術文献の各開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明者らによってなされたものである。
特許文献1のような手法により、複数種類の情報(複数種類の特徴量)があるデータを扱うことができる。しかし、当該手法は、検索条件との適合性に基づき検索結果を一覧表示するので、検索結果が重複又は類似することがある。ユーザが、これらの検索結果を把握する場合、頭の中で重複又は類似している結果の差異を整理し、大量な結果を一つずつ確認することで、望んでいる情報を見つけ出す必要がある。そのため、ユーザには大きな負担(労力、時間)がかかる。
さらに、ユーザが対象データを把握していないときに問題が生じ得る。具体的には、ユーザによる検索条件の設定が不適切又は間違いがある場合に、結果が少ない又は結果が得られない場合がある。その他、マルチメディアデータから複数種類の情報又は特徴量を抽出して検索処理を行う場合、上記手法では、抽出方法の精度が低い又はデータに欠損があるなどにより、抽出した特徴量の質が低くなる問題がある。このような場合も、ユーザが望んでいる検索結果が得られないこととなる。例えば、動画データから人物の顔や服の色、場所などの特徴量を抽出する場合を考える。この場合、ユーザは、それぞれ顔と服の色と場所に関する条件を指定して検索することになる。指定した服の色と場所に合う人物の顔が首尾良く取得又は抽出しできなかった場合、ユーザが指定した条件に合う結果が得られないことになる。これらの場合、ユーザは何度も検索条件を調整する必要がある。このような検索条件の再調整も、ユーザには大きな負担となる。例えば、上記問題は、特許文献5の技術にて生じ得る。特許文献5では、情報検索装置から提示される候補情報のなかにユーザが要求情報を発見できない場合には、ユーザからの検索要求が実質的に存在ないことと等価であり、ユーザは何度も検索条件を調整する必要がある。
一方、特許文献2、3の手法では、単一種類の情報があるデータが対象であり、且つ、その種類の情報に特有の性質に基づくため、他の種類の情報と複数種類の情報があるデータに適用できないという問題がある。具体的には、特許文献2では、ユーザが選択した表示パターンに基づき検索結果を分類するため、表示パターンの候補が設定されていない場合には適用できない。特許文献3では、入力された検索文と画像のメタデータに含まれる文との類似度に基づき画像を選択するため、検索条件に文書がない場合や対象データに文書情報がない場合には適用できない。さらに、特許文献4では、文書情報や視覚情報も考慮し、文書情報は多様性を確保する情報として、視覚情報はその中での頻度により代表を選択する情報として利用している。情報の種類ごとに予め分類や選択の軸が決められているため、文書情報では多様性が低く、視覚情報では頻度が同程度である場合、効果的な結果をユーザに提示することができないという問題がある。
また、クラスタリング方法には、検索を処理する際に必要となる計算量が多いため、検索要求に対応するのが困難であるのと、代表的な結果の選定はクラスタリングのパラメータ設定に依存するため調整が困難であるという2つの問題点がある。
本発明は、多種多様な情報が含まれるオブジェクトにおいて、ユーザが望んでいる情報を効率的に検索し、提供できる、情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
本発明の第1の視点によれば、複数のオブジェクトそれぞれから抽出された複数の特徴量に対し、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量に基づいて、前記複数のオブジェクトのうち前記検索条件に適合する代表的な結果オブジェクトを選択する、検索処理部と、少なくとも前記代表的な結果オブジェクトをユーザに提示する、結果提示部と、を備える、情報処理装置が提供される。
本発明の第2の視点によれば、複数のオブジェクトそれぞれから抽出された複数の特徴量に対し、前記抽出された特徴量それぞれの重要度を示す表現力と特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す独立力を計算する、表現力及び独立力計算部と、ユーザからの検索条件に基づいて、前記複数のオブジェクトそれぞれについて前記検索条件を満たす度合を示す類似性スコアの計算と、前記表現力と前記独立力と前記類似性スコアに基づき他のオブジェクトとの差異度を示す多様性スコアの計算と、を行う検索結果多様化部と、を備え、前記検索結果多様化部は、前記多様性スコアに基づき、前記複数のオブジェクトから代表的な結果を選択する、情報処理装置が提供される。
本発明の第3の視点によれば、複数のオブジェクトそれぞれから抽出された複数の特徴量に対し、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量に基づいて、前記複数のオブジェクトのうち前記検索条件に適合する代表的な結果オブジェクトを選択するステップと、少なくとも前記代表的な結果オブジェクトをユーザに提示するステップと、を含む、情報処理方法が提供される。
本発明の第4の視点によれば、複数のオブジェクトそれぞれから抽出された複数の特徴量に対し、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量に基づいて、前記複数のオブジェクトのうち前記検索条件に適合する代表的な結果オブジェクトを選択する処理と、少なくとも前記代表的な結果オブジェクトをユーザに提示する処理と、をコンピュータに実行させるプログラムが提供される。
なお、このプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。本発明は、コンピュータプログラム製品として具現することも可能である。
本発明の各視点によれば、多種多様な情報が含まれるオブジェクトにおいて、ユーザが望んでいる情報を効率的に検索し、提供できることに寄与する、情報処理装置、情報処理方法及びプログラムが提供される。
一実施形態の概要を説明するための図である。 第1の実施形態に係る情報処理装置の処理構成の一例を示す図である。 検索処理部の内部構成の一例を示す図である。 検索結果の多様化と要約の詳細を説明するためのフローチャートである。 第1の実施形態に係る具体例を説明するための図である。 第1の実施形態に係る具体例を説明するための図である。 第1の実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。 検索処理部の内部構成の他の一例を示す図である。
初めに、一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。
上述のように、ユーザが大量の検索結果を一つずつ確認して、望んでいる情報を見つける労力と時間の増加を解消する装置(システム)が望まれている。また、検索条件の設定が不適切又は間違いがあった際に、検索結果が少ない又は検出結果が得られない場合等が生じた際の手間を削減する装置が望まれている。
一実施形態に係る情報処理装置100は、検索処理部101と、結果提示部102と、を備える。検索処理部101は、ユーザからの検索条件により指定される第1の特徴量と検索条件により指定されない第2の特徴量に基づいて、複数のオブジェクトのうち検索条件に適合する代表的な結果オブジェクトを選択する。結果提示部102は、少なくとも代表的な結果オブジェクトをユーザに提示する。
情報処理装置100は、例えば、画像データ等のデータであって、顔情報(顔画像)や服の色に関する情報を含むマルチメディアデータ等を処理対象(オブジェクト)として扱う。情報処理装置100は、ユーザが検索を希望する内容を「検索条件」として入力する。例えば、ユーザは、検索したい顔画像や人物画像(服を着ている人物の画像)等の画像や検索したい服の色、あるいは、検索結果として取得したいオブジェクトの数等を「検索条件」として入力する。情報処理装置100は、複数の特徴量のうち、検索条件として指定される特徴量だけでなく、指定されない特徴量も使用して検索条件に適合するオブジェクトをユーザに提示する代表的なオブジェクト(結果オブジェクト)として選択する。
その結果、複数種類の情報が含まれるオブジェクト(例えば、マルチメディアデータ)において、ユーザからの検索条件に対し、オブジェクトから多様化した代表的な結果を選択可能ととなり、重複又は類似している検索結果をまとめて代表的な結果に従属させ、代表的な結果と従属結果を、ユーザに理解しやすく、簡潔に提示することができる。さらに、ユーザからの指定される検索条件だけではなく、オブジェクトに内在する各種情報(検索条件により指定されない情報)を利用して検索処理を行うことで、ユーザが検索条件を調整する手間を削減できる。以上により、ユーザが検索結果を確認する又は検索結果から所望の情報を得られる時間を短縮できる。このように、情報処理装置100は、多種多様な情報が含まれるマルチメディアデータ等に対する検索結果の多様化と要約の機能を実現する。
以下に具体的な実施の形態について、図面を参照してさらに詳しく説明する。なお、各実施形態において同一構成要素には同一の符号を付し、その説明を省略する。また、各図におけるブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号(データ)の流れを模式的に示すものであり、双方向性を排除するものではない。
[第1の実施形態]
第1の実施形態について、図面を用いてより詳細に説明する。
図2は、第1の実施形態に係る情報処理装置10の処理構成の一例を示す図である。図2を参照得すると、情報処理装置10は、データ取得部11と、特徴量抽出部12と、記憶部13と、検索受信部14と、検索変換部15と、検索処理部16と、結果提示部17と、を含んで構成される。
データ取得部11は、文書、音声、時間、位置、画素、属性等の複数種類の情報を含むオブジェクト(例えば、画像データや動画像データ等のマルチメディアデータ)を取得する手段である。
特徴量抽出部12は、複数のオブジェクト(検索対象及び被検索対象のオブジェクト;例えば、マルチメディアデータ)それぞれから複数の特徴量を抽出する手段である。具体的には、特徴量抽出部12は、情報処理装置10が取得したオブジェクトを対象として、種々の情報抽出方法又は認識エンジン等を使って、特徴量を計算する。例えば、特徴量抽出部12は、画像データの各画像に対して、撮影場所から位置情報である座標を計算したり、顔認識エンジンにより顔の特徴量を抽出したりする。
記憶部13は、抽出された特徴量を記憶する手段である。
検索受信部14は、ユーザからの検索要求を受け取る手段である。検索条件には、例示情報や指定条件、パターンなどが考えられる。例えば、ユーザがサンプル画像又は音声を入力する、撮影場所と撮影時間を指定する、顔画像を入力し顔の類似度の閾値を指定する、指定文書が現れた回数を指定する等が例示される。
検索変換部15は、受け取った検索要求を特徴量と各特徴量に関する検索条件に変換する手段である。例えば、ユーザから検索対象として顔画像を受け取った場合には、検索変換部15は、当該取得した画像から顔を抽出し、その特徴量を計算する。なお、検索変換部15を省略し、ユーザから検索条件が直接入力されてもよい。
検索処理部16は、変換した検索要求を処理し、検索結果を計算する手段である。より具体的には、検索処理部16は、ユーザからの検索条件により指定される第1の特徴量と検索条件により指定されない第2の特徴量に基づいて、複数のオブジェクトのうち検索条件に適合する代表的な結果オブジェクトを選択する。例えば、ユーザが「顔」に関する情報に限り情報処理装置10に入力したとしても、検索処理部16は、「顔」以外の情報(例えば、服の色)も加味して、ユーザに提示するのに適切な(ユーザの要求に適合する)代表的な結果を選択する。
結果提示部17は、少なくとも上記代表的な結果(結果オブジェクト)をユーザに提示する手段である。
[検索処理部及び結果提示部]
続いて、第1の実施形態に係る検索処理部16と結果提示部の詳細について説明する。
図3は、検索処理部16の内部構成の一例を示す図である。図3を参照すると、検索処理部16は、表現力&独立力計算部201と、検索結果多様化部202と、検索結果要約部203と、からなるサブモジュールを含む。
表現力&独立力計算部201は、特徴量の表現力と独立力を計算する手段である。
検索結果多様化部202は、代表的な検索結果の検出と検索結果の多様化を行う手段である。
検索結果要約部203は、検索結果の要約を行う手段である。検索結果要約部203により、代表的な結果に従属する従属オブジェクトが算出される。
多様化された代表的な結果と要約された従属オブジェクトは、結果提示部17によりユーザに提示される(代表的な結果と従属オブジェクトが表示される)。なお、代表的な結果、従属オブジェクト等の詳細は後述する。
特徴量の表現力は、特徴量の重要度を示す指標である。換言すると、特徴量の表現力は、データからデータを構成するオブジェクトを特定する際の当該特徴量の重要度を示す。特徴量の表現力は、オブジェクトから抽出される複数の特徴量それぞれに関して計算される。また、特徴量の表現力とは、「特徴量でオブジェクトを表現できる可能性」と捉えることもできる。例えば、世の中に顔が似ている人は少ないのに対し、年齢が近い人は多いという事実がある。このことから、年齢より顔で人を識別する方が容易である、又は、人を表現できる可能性が高いと言うことができる。つまり、年齢より顔の表現力の方が高いと言える。
従って、画像データから指定した顔と年齢の人に関する画像を検索する場合、年齢よりも表現力が高い顔を優先して、指定した顔と類似している画像を検索結果の上位に提示する方がよい。このような提示により、ユーザは、検索結果から望んでいる画像を発見する可能性が高く、より早く必要な情報を見つけ出せる。表現力&独立力計算部201は、上記状況を加味して、各特徴量の表現力を計算する。なお、表現力の具体的計算例は後述する。
特徴量の独立力は、特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す指標である。特徴量の独立力とは、「ある特徴量は他の特徴量に相関されない可能性」と捉えることもできる。例えば、顔が似ている人の年齢と性別も似ている可能性は高いのに対し、年齢と性別が似ている人の顔が似ているとは限らないという事実がある。当該事実は、年齢、性別は顔から推定できる、又は、年齢、性別は顔に相関される可能性が高いと言うことができる。つまり、顔に対して、年齢と性別の独立力は低い。逆に、年齢と性別に対して、顔の独立力は高い。似ている顔同士は、お互いの独立力が低い。
画像データから指定した年齢と性別を持つ人に関する画像を検索する場合、年齢と性別が近い異なる顔を持つ画像を検索結果として提示する方がよい。このような提示により、ユーザが検索結果から望んでいる画像を発見できる可能性が高くなり、より早く必要な情報を見つけ出せる。さらに、検索結果にある画像と重複又は類似している画像の各特徴量(例えば、年齢、性別及び顔)は、既存の結果画像の各特徴量に対する独立力が低いので、代表的な結果とする優先度が低い。
表現力&独立力計算部201は、上記状況を加味して、各特徴量の独立力を計算する。例えば、詳細については後述するが、特徴量Aに対する特徴量Bの独立力は、特徴量Aとの類似度が閾値以上である画像のうち、特徴量Bとの類似度が閾値以下である画像の割合により計算する。
なお、上記特徴量の表現力と独立力は、一般の常識ではなく対象のデータ集合により変化する。例えば、顔が似ている人の画像データ集合の場合、顔よりも年齢や性別などの表現力と独立力が高い。
その後、検索結果多様化部202は、各画像の特徴量に関し、公知の類似度定義により各特徴量間の類似度(特徴量の類似性スコア)を計算する。つまり、複数種類の特徴量が1つのオブジェクト(検索対象データ、被検索対象データ)から得られる場合に、検索結果多様化部202は、同種の特徴量間の類似度を類似性スコアとして計算する。
特徴量の類似性スコアが計算されると、検索結果多様化部202は、各オブジェクト(例えば、画像データ)間の類似度を(オブジェクトの類似性スコア)を計算する。例えば、オブジェクトの類似性スコアは、各オブジェクトそれぞれから抽出される各特徴量の類似性スコアの合計として計算される。その後、検索結果多様化部202は、特徴量の類似性スコアと表現力と独立力を多様性スコアの計算に利用する。なお、特徴量とオブジェクトの2つの類似性スコアと多様性スコアの具体的計算例は後述する。
第1の実施形態に係る情報処理装置10は、データ集合の統計的な情報など隠れた知識を利用し、各特徴量の表現力と独立力を計算して、できるだけユーザが望んでいる情報を含むように多様化した代表的な結果をユーザに提示する。その結果、ユーザの情報検索が加速する。
ここで、既存の技術では、ユーザからの検索要求を変換した各特徴量に対応する検索条件に対して、指定した特徴量との適合性を示す類似性スコアに基づき検索結果を計算する。本願開示では、類似性スコアだけではなく、指定した特徴量の表現力と独立力も考慮し、類似性スコアが高く、且つ、表現力と独立力が高い特徴量を持つ結果を優先する(代表的な検索結果とする)。その結果、重複又は類似している結果が排除され、代表的な結果が選択される。
さらに、本願開示では、指定されていない特徴量の表現力と独立力も考慮することで、検索条件に柔軟に対応でき、ユーザが検索条件を調整する労力を省略することができる。例えば、ユーザによる検索条件の設定が不適切又は間違いである場合や、抽出方法の精度が低い又はデータに欠損があるなどにより、抽出した特徴量の質が低い場合などがある。このような場合であっても、データ集合の隠れた知識である特徴量の表現力と独立力を考慮することで、自動的に検索条件が調整される。さらに、指定しない特徴量の表現力と独立力を考慮することで、検索条件が調整されるだけではなく、指定しない特徴量を持つ探索的な結果を提示することで、検索条件に対する誘導も可能となる。つまり、検索処理部16は、ユーザからの検索条件により指定されない第2の特徴量であって、代表的な結果オブジェクトの選択に使用された特徴量を結果提示部17に出力してもよい。そして、結果提示部17は、出力された第2の特徴量をユーザに提示すればよい。例えば、ユーザが検索条件として「服の色」を指定したが、特徴量の表現力と独立力を考慮した結果、「服の色」とは異なる「顔」に係る特徴量を結果オブジェクトの選択に使用する場合には、「顔」や「顔の特徴量」をユーザに提示してもよい。
さらに、検索処理部16は、ユーザから検索条件として特徴量が指定されない場合には、特徴量抽出部12により抽出された複数の特徴量の全てに基づき、代表的な結果オブジェクトを選択してもよい。例えば、ユーザから画像データだけが検索条件として入力され、「顔」や「服の色」等が指定されていなくとも、当該画像データから「顔」や「服の色」に係る特徴量が抽出できる場合には、これらの特徴量を用いて代表的な結果オブジェクトを選択してもよい。
また、本願開示では、各特徴量の類似性スコアと表現力と独立力に基づき、オブジェクトの代表性と他のオブジェクトとの相違度(差異度)を示す多様性スコアを定義する。その上で、各オブジェクトの多様性スコアにより、検索結果の多様化と要約が行われる。
なお、特徴量の類似性スコアについて、指定特徴量との類似度や指定特徴量に関する閾値が存在する場合、閾値を重みとして類似度に付与したものなどが考えられる。オブジェクトの類似性スコアは、各特徴量の類似性スコアの集約(例えば、和、最大、最小、平均など)で定義できる。
特徴量の表現力について、特徴量が稀であるほど重要であるとする場合、この特徴量を持つオブジェクトの数の逆数により定義できる。特徴量の独立力について、特徴量Aに対する特徴量Bの独立力は、特徴量Aを持つオブジェクトのうち、特徴量Bを持たないオブジェクトの割合で定義することが例示される。
オブジェクトの多様性スコアの定義例としては、指定した各特徴量における類似度と表現力と独立力の掛け算を集約し、さらに、指定しない各特徴量における表現力と独立力の掛け算を集約して、それらを合計することが例示される。
特に、本願開示では、指定されていない特徴量を利用し、それらの特徴量を持つ結果を提示することで、代表的な結果を選択する。つまり、ユーザが把握していない情報を利用し、類似性スコアが高い類似オブジェクトと多様性スコアが高い多様オブジェクトが代表的な結果オブジェクトとして選択される。
さらに、本願開示では、多様性スコアが低いオブジェクトをまとめて、代表的な結果に従属させ要約する。具体的には、情報処理装置10は、代表的な結果に従属するオブジェクト(従属オブジェクト)を生成し、ユーザに提示する。
[動作の説明]
次に、図4を参照しつつ、検索結果の多様化と要約の詳細を説明する。
ステップS01において、検索処理部16は、スコア変数Sと、オブジェクトOと、候補オブジェクト集合Cと、オブジェクト集合Tと、結果オブジェクト集合Rの初期化を行う。なお、上記初期化されるスコア変数S等は、検索結果を計算するために使用する変数(中間変数)等である。
上記初期化の後、検索処理部16は、類似オブジェクトの計算と、多様オブジェクトの計算と、オブジェクトの要約と、を順番に行う。また、検索処理部16は、k件の結果を計算することとする。
検索結果多様化部202は、類似オブジェクトを計算する。類似オブジェクトの計算では、検索対象となるオブジェクト(例えば、画像等のデータ)に対して類似性スコアが最大のオブジェクトが計算される。
初めに、記憶部13からオブジェクトO(iはサフィックスであり、以下同様)が取得(ステップS101)され、オブジェクトOが取得できた場合には(ステップS102、No分岐)、変換した検索条件に対する類似性スコアSIMが計算される(ステップS103)。
スコア変数SとオブジェクトOで最大の類似性スコアSIMと対応するオブジェクトOが保持される。具体的には、計算された類似性スコアSIMがスコア変数Sより大きい場合(ステップS104、Yes分岐)、スコア変数Sは類似性スコアSIMに、オブジェクトOはオブジェクトOに、それぞれ更新される(ステップS105)。
類似性スコアSIMがスコア変数S以下の場合(ステップS104、No分岐)には、オブジェクトOは候補オブジェクト集合Cに挿入され保持される(ステップS106)。
上記処理は、類似性スコアSIMが最大のオブジェクトが発見されるまで繰り返される。つまり、記憶部13の全てのオブジェクトに関する類似性スコアの計算が終了すると(ステップS102、Yes分岐)、類似性スコアの計算は終了する。また、類似オブジェクトが発見された時点で反復は終了し、記憶部13の全てのオブジェクトに対する計算は省略できる。
類似性スコアの計算が終了すると(ステップS102、Yes分岐)、計算された類似オブジェクトが結果オブジェクト集合Rに挿入され保持される(ステップS107)。また、その際、次の計算に用いるため、スコア変数SとオブジェクトOが初期化される。
なお、第1の実施形態では、類似性スコアSIMが最大のオブジェクトを1件計算するが、複数の類似オブジェクトが計算され、結果オブジェクト集合Rに保持されても良い。例えば、複数の類似性スコアを定義し、複数の類似オブジェクトを計算してもよい。
検索結果多様化部202は、多様オブジェクトを計算する。多様オブジェクトの計算では、多様性スコアが最大のオブジェクトが計算される。
候補オブジェクトC集合又は記憶部13からオブジェクトOが取得され(ステップS201)、オブジェクトOが取得できた場合には(ステップS202、No分岐)、結果オブジェクト集合Rのオブジェクトに対する多様性スコアDIVが計算される(ステップS203)。
スコア変数SとオブジェクトOで最大の多様性スコアと対応するオブジェクトが保持される。計算した多様性スコアDIVがスコア変数Sよりも大きい場合(ステップS204、Yes分岐)、スコア変数Sは多様性スコアDIVに、オブジェクトOはオブジェクトOに、それぞれ更新される(ステップS205)。多様性スコアDIVがスコア変数S以下の場合(ステップS204、No分岐)、オブジェクトOはオブジェクト集合Tに挿入され保持される(ステップS206)。
上記処理は、多様性スコアDIVが最大のオブジェクトが発見されるまで繰り返される。つまり、候補オブジェクトC又は記憶部13の全てのオブジェクトに関する多様性スコアの計算が終了すると(ステップS202、Yes分岐)、多様性スコアの計算は終了する。また、多様オブジェクトが発見された時点で反復は終了し、候補オブジェクト集合C又は記憶部13の全てのオブジェクトに対する計算は省略できる。
多様性スコアの計算が終了すると(ステップS202、Yes分岐)、計算された多様オブジェクトは、結果オブジェクト集合Rに挿入され、保持される(ステップS207)。
結果オブジェクト集合Rの件数がk件に達し(ステップS208、Yes分岐)、検索結果の要約を行わない場合には、検索処理部16から結果オブジェクト集合Rが出力(ステップS02)され、処理が終了する。また、結果オブジェクト集合Rの件数がk件に達し、検索結果の要約を行う場合、スコア変数SとオブジェクトOが初期化され、オブジェクトの要約に処理が移る。
結果オブジェクト集合Rの件数がk件に達しない場合(ステップS208、No分岐)には、候補オブジェクト集合Cはオブジェクト集合Tに更新され、スコア変数SとオブジェクトOとオブジェクト集合Tは初期化(ステップS209)され、次の多様オブジェクトの計算が実行される。
検索結果要約部203は、オブジェクトの要約(代表的な結果に対する従属オブジェクトの生成)を行う。オブジェクトの要約では、オブジェクト集合T又は記憶部13に残ったオブジェクトを結果オブジェクト集合Rの結果オブジェクトに対する多様化性スコアが最小の結果オブジェクトに割り当てる。
初めに、オブジェクト集合T又は記憶部13からオブジェクトOが取得される(ステップS301)。
その後、オブジェクトOが取得できた場合には(ステップS302、No分岐)、スコア変数SとオブジェクトOが初期化され(ステップS303)、結果オブジェクト集合Rの結果オブジェクトR(jはサフィックス、以下同様)が取得される(ステップS304)。なお、ステップS301においてオブジェクトOが取得できない場合(ステップS302、Yes分岐)には、オブジェクトの要約処理が終了する。
結果オブジェクトRが取得できた場合には(ステップS305、No分岐)、結果オブジェクトRに対する多様性スコアDIVが計算される(ステップS306)。結果オブジェクトRが取得できない場合には(ステップS305、Yes分岐)、オブジェクトOがオブジェクトOに割り当てられ(ステップS307)、次のオブジェクトの要約が実行される。
スコア変数SとオブジェクトOで最小の多様性スコアDIVと対応するオブジェクトが保持される。計算された多様性スコアDIVがスコア変数Sよりも小さい場合(ステップS308、Yes分岐)、スコア変数Sは多様性スコアDIVに、オブジェクトOは結果オブジェクトRにそれぞれ更新される(ステップS309)。
計算された多様性スコアDIVがスコア変数S以上の場合(ステップS308、No分岐)、結果オブジェクト集合Rの次のオブジェクトに計算対象が移る。
上記処理は、多様性スコアDIVが最小の結果オブジェクトが発見されるまで繰り返される。また、多様性スコアDIVが最小の結果オブジェクトが発見された時点で反復を終了し、結果オブジェクト集合Rの全てのオブジェクトに対して計算しなくともよい。場合によっては、オブジェクト集合Tや記憶部13に残る全てのオブジェクトを要約しなくともよい。
オブジェクトの要約が終了すると、検索処理部16は、結果オブジェクト集合Rを結果提示部17に出力する(ステップS02)。
以上のように、検索処理部16は、複数のオブジェクト(例えば、検索対象の画像データ及び被検索対象の画像データ)それぞれについて検索条件(例えば、顔や服の色)に対する類似度を示す類似性スコアを計算する。その後、検索処理部16は、複数のオブジェクトから、検索条件により指定される検索対象のオブジェクトに類似する類似オブジェクトを類似性スコアに基づき選択する(例えば、被検索対象の画像データから検索条件に似ている画像データを選択する)。さらに、検索処理部16は、複数のオブジェクトのうち類似オブジェクト以外のオブジェクトの類似オブジェクトに対する相違度を示す多様性スコアを計算し、多様性スコアに基づき代表的な結果オブジェクトを選択する。つまり、検索処理部16は、代表的な結果オブジェクトを、抽出された特徴量における多様性スコアに基づき選択し、その際の多様性スコアの計算は、表現力と独立力と類似性スコアに基づき行われる。また、検索処理部16による従属オブジェクトの選択は、代表的な結果オブジェクトに対する他のオブジェクトの多様性スコアに基づき行われる。つまり、複数のオブジェクトのなかから代表的な結果オブジェクトに従属する従属オブジェクトが決定される。
結果提示部17による検索結果の提示には種々の形態が考えられる。例えば、結果提示部17は、代表的な結果オブジェクトと従属オブジェクトが視覚的に区別可能な態様にて、代表的な結果オブジェクトと従属オブジェクトをユーザに提示する。その際、結果提示部17は、多様化した代表的な結果と要約した従属オブジェクトを表示してもよいし、多様化した代表的な結果に限り表示してもよい。前者の場合、代表的な結果と従属オブジェクトを視覚的に分かるように提示するのが好ましい。例えば、代表的な結果を大きく表示し、従属オブジェクトを小さく表示しつつ、代表的な結果の周りに従属オブジェクトを表示してもよい。あるいは、代表的な結果に従属オブジェクトの数などに関する情報を提示し、代表的な結果がクリックされた場合に従属オブジェクトを表示してもよい。さらに、代表的な結果の提示について、結果を表示するとともに、類似性スコアが高い特徴量や多様性スコアが高い特徴量など、検索結果につながる情報(関連情報)を表示してもよい。
[具体例]
次に、具体例1、2により第1の実施形態の動作を説明する。
本具体例では、情報処理装置10が画像データから顔と服の色の特徴量を抽出し、ユーザは例示画像を入力し、特徴量に関する閾値と結果件数kを指定することとする。
図5a〜図5dは対象データ(被検索データ)である画像4件(画像1、2、3、4)であり、図5eは、検索入力(検索対象)である画像Qを示す。
情報処理装置10は、各画像から顔と服の色の認識エンジンを用いて、顔及び服の色の特徴量をそれぞれ抽出する。情報処理装置10は、各画像の特徴量に関し、コサイン(cosine)など公知の類似度定義により顔と服の色の類似度を計算する。例えば、図6に示すような画像間の顔(face)と服の色(color)に関する類似度が計算される。
図6において、画像iと画像jにおける顔の類似度と服の色の類似度はそれぞれSIMi、j(face)とSIMi、j(color)により表記されている。例えば、画像1と画像Qにおける顔の類似度はSIM1、Q(face)により表され、その値は0.95である。
本具体例では、顔に関する閾値SIMτ(face)=0.8、服の色に関する閾値SIMτ(color)=0.6、結果件数k=3と、ユーザにより指定されるものとする。
特徴量の類似性スコアは、指定された特徴量(指定特徴量)に関する閾値を重みとし、指定特徴量と類似度の掛け算により定義する。画像の類似性スコアSIMは、各指定特徴量の類似性スコアの合計により定義する。例えば、入力画像Qに対して、顔と服の色を指定した場合、画像1の類似性スコアは、
SIM1、Q
=SIMτ(face)*SIM1、Q(face)+SIMτ(color)*SIM1、Q(color)
=0.8*0.95+0.6*0.98=1.348
となる。
特徴量の表現力(RP:Representation Power)について、当該特徴量との類似度が閾値以上である画像の数の逆数により定義する。例えば、画像1の顔faceとの間の類似度が閾値以上である画像は3件(画像1、2、3)あるため、画像1の顔の表現力はRP(face)=1/3となる。
特徴量の独立力(IP:Independence Power)について、特徴量Aに対する特徴量Bの独立力IP(B;A)は、特徴量Aとの類似度が閾値以上である画像のうち、特徴量Bとの類似度が閾値以下である画像の割合により定義する。例えば、画像1の服の色との間の類似度が閾値以上である画像3件(画像1、2、4)のうち、画像2の顔との類似度が閾値以下である画像は1件(画像4)ある。従って、画像1の服色colorに対して、画像2の顔faceの独立力は、IP(face;color)=1/3となる。
また、同じ特徴量間の独立力は、画像同士間の当該特徴量における非類似度で定義する。例えば、画像1の顔faceに対して、画像2の顔faceの独立力は、IP(face;face)=1−0.92=0.08となる。
さらに、複数種類の特徴量に対する特徴量の独立力は、各特徴量に対する特徴量の独立力の掛け算により定義する。例えば、画像1の顔faceと服の色colorに対して、画像2の顔faceの独立力は、
IP(face;face、color
=IP(face;face)*IP(face;color
=0.08*1/3≒0.027
となる。
さらに、複数画像の特徴量に対する特徴量の独立力は、各画像の特徴量に対する特徴量の独立力の最小値で定義する。例えば、画像1の顔faceと服の色colorと、画像3の顔faceと服の色colorに対して、画像2の顔faceの独立力は、
IP(face;face,color,face,color
=min{IP(face;face,color),IP(face;face,color)}
=min{0.08*1/3,0.18*0/3}=0
となる。
画像の多様性スコアDIVは、指定した各特徴量における類似度と表現力と独立力の掛け算の合計と、指定しない各特徴量における表現力と独立力の掛け算の合計と、の和(総和)と定める。また、指定しない各特徴量における類似度を1とし、画像の多様性スコアDIVは、各特徴量における類似度と表現力と独立力の掛け算を合計したものとしてもよい。
例えば、顔を指定した場合、画像1に対して、画像2の多様性スコアDIV(2;1)は、
DIV(2;1)=Sim2,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.9*1/3*0.08*1/3+1/3*1/3*0.02≒0.01
となる。
[具体例1]
具体例1は顔を指定した場合である。
具体例1では、入力画像Qの顔faceQと顔に関する閾値SIMτ(face)=0.8という検索条件に基づき、結果k=3件を出力する。なお、具体例1では、入力画像Qに関する服の色は指定されていない。
初めに、図4のフローチャートに示すように、各画像間の類似性スコアが計算され、類似性スコアが最大となる類似画像が選択される。
類似性スコアを計算すると以下のとおりとなる。
SIM1,Q=Simτ(face)*Sim1,Q(face)
=0.8*0.95=0.76
SIM2,Q=Simτ(face)*Sim2,Q(face)
=0.8*0.9=0.72
SIM3,Q=Simτ(face)*Sim3,Q(face)
=0.8*0.8=0.64
SIM4,Q=Simτ(face)*Sim4,Q(face)
=0.8*0.6=0.48
従って、画像1が類似画像として選択される。
次に、画像1に対して、他の画像の多様性スコアが計算され、多様性スコアが最大である多様画像が選択される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;1)=Sim2,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.9*1/3*0.08*1/3+1/3*1/3*0.02≒0.01
DIV(3;1)=Sim3,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.8*1/3*0.19*1/3+1/1*2/3*0.9≒0.62
DIV(4;1)=Sim4,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.6*1/1*0.42*2/3+1/3*1/3*0.11≒0.18
従って、画像3が多様画像として選択される。
続いて、画像1と3に対して、他の画像の多様性スコアが計算され、多様性スコアが最大である多様画像が選択される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;1,3)=Sim2,Q(face)*RP(face)*IP(face;face,color,face,color)+RP(color)*IP(color;face,color,face,color
=0.9*1/3*min{0.08*1/3,0.18*0/3}+1/3*min{1/3*0.02,1/3*0.9}≒0.002
DIV(4;1,3)=Sim4,Q(face)*RP(face)*IP(face;face,color,face,color)+RP(color)*IP(color;face,color,face,color
=0.6*1/1*min{0.42*2/3,0.5*1/1}+1/3*min{1/3*0.11,1/3*0.9}≒0.18
従って、画像4が多様画像として選択される。
以上のように結果画像3件が計算される。つまり、類似画像である画像1と、多様画像である画像3、4が代表的な結果画像(結果オブジェクト)として選択される。
最後に、結果画像1、3、4に対する画像2の多様性スコアを比較し、画像2は多様性スコアが最小である結果画像(結果オブジェクト)に要約される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;3)=Sim2,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.9*1/3*0.18*0/3+1/3*1/3*0.9
=0.1>DIV(2;1)
DIV(2;4)=Sim2,Q(face)*RP(face)*IP(face;face,color)+RP(color)*IP(color;face,color
=0.9*1/3*0.44*1/3+1/3*1/1*0.1
≒0.08>DIV(2;1)
従って、画像2は結果画像1に要約される。
[具体例2]
具体例2は顔と服の色を指定した場合である。
具体例2では、入力画像Qの顔と服の色であるface、colorと、顔と服の色に関する閾値であるSIMτ(face)=0.8、SIMτ(color)=0.6という検索条件に基づき、結果k=3を出力する。
初めに、図4のフローチャートに示すように、各画像の類似性スコアが計算される。
類似性スコアを計算すると以下のとおりとなる。
SIM1,Q=Simτ(face)*Sim1,Q(face)+Simτ(color)*Sim1,Q(color)
=0.8*0.95+0.6*0.98=1.348
SIM2,Q=Simτ(face)*Sim2,Q(face)+Simτ(color)*Sim2,Q(color)
=0.8*0.9+0.6*0.96=1.296
SIM3,Q=Simτ(face)*Sim3,Q(face)+Simτ(color)*Sim3,Q(color)
=0.8*0.8+0.6*0.1=0.7
SIM4,Q=Simτ(face)*Sim4,Q(face)+Simτ(color)*Sim4,Q(color)
=0.8*0.6+0.6*0.9=1.02
従って、画像1が類似画像として選択される。
次に、画像1に対して、他の画像の多様性スコアが計算され、多様性スコアが最大である多様画像が選択される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;1)=Sim2,Q(face)*RP(face)*IP(face;face,color)+Sim2,Q(color)*RP(color)*IP(color;face,color
=0.9*1/3*0.08*1/3+0.96*1/3*1/3*0.02
≒0.01
DIV(3;1)=Sim3,Q(face)*RP(face)*IP(face;face,color)+Sim3,Q(color)*RP(color)*IP(color;face,color
=0.8*1/3*0.19*1/3+0.1*1/1*2/3*0.9
≒0.08
DIV(4;1)=Sim4,Q(face)*RP(face)*IP(face;face,color)+Sim4,Q(color)*RP(color)*IP(color;face,color
=0.6*1/1*0.42*2/3+0.9*1/3*1/3*0.11
≒0.18
従って、画像4が多様画像として選択される。
次に、画像1、4に対して、他の画像の多様性スコアが計算され、多様性スコアが最大である多様画像が選択される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;1,4)=Sim2,Q(face)*RP(face)*IP(face;face,color,face,color)+Sim2,Q(color)*RP(color)*IP(color;face,color,face,color
=0.9*1/3*min{0.08*1/3,0.44*1/3}+0.96*1/3*min{1/3*0.02,1/1*0.9}≒0.01
DIV(3;1,4)=Sim3,Q(face)*RP(face)*IP(face;face,color,face,color)+Sim3,Q(color)*RP(color)*IP(color;face,color,face,color
=0.8*1/3*min{0.19*1/3,0.5*1/3}+0.1*1/1* min{2/3*0.9,1/1*0.9}≒0.08
従って、画像3が多様画像として選択される。
以上のように結果画像3件が計算される。
最後に、結果画像1、4、3に対する画像2の多様性スコアを比較し、画像2は多様性スコアが最小である結果画像に要約される。多様性スコアを計算すると以下のとおりとなる。
DIV(2;3)=Sim2,Q(face)*RP(face)*IP(face;face,color)+Sim2,Q(color)*RP(color)*IP(color;face,color
=0.9*1/3*0.18*0/3+0.96*1/3*1/3*0.9
=0.096>DIV(2;1)
DIV(2;4)=Sim2,Q(face)*RP(face)*IP(face;face,color)+Sim2,Q(color)*RP(color)*IP(color;face,color
=0.9*1/3*0.44*1/3+0.96*1/3*1/1*0.1
=0.076>DIV(2;1)
従って、画像2は結果画像1に要約される。
[ハードウェア構成]
続いて、第1の実施形態に係る情報処理装置10のハードウェア構成について説明する。
図7は、第1の実施形態に係る情報処理装置10のハードウェア構成の一例を示すブロック図である。情報処理装置10は、所謂、コンピュータであり、図7に例示する構成を備える。例えば、情報処理装置10は、内部バスにより相互に接続される、CPU(Central Processing Unit)21、メモリ22、入出力インターフェイス23及び通信手段であるNIC(Network Interface Card)24等を備える。
なお、図7に示す構成は、情報処理装置10のハードウェア構成を限定する趣旨ではない。情報処理装置10は、図示しないハードウェアを含んでもよい。あるいは、情報処理装置10に含まれるCPU等の数も図7の例示に限定する趣旨ではなく、例えば、複数のCPUが含まれていてもよい。
メモリ22は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)である。
入出力インターフェイス23は、図示しない表示装置や入力装置のインターフェイスとなる手段である。表示装置は、例えば、液晶ディスプレイ等である。入力装置は、例えば、キーボードやマウス等のユーザ操作を受け付ける装置である。
第1の実施形態に係る情報処理装置10の各種機能(上述の処理モジュール)は、例えば、メモリ22に格納されたプログラムをCPU21が実行することで実現される。また、そのプログラムは、ネットワークを介してダウンロードするか、あるいは、プログラムを記憶した記憶媒体を用いて、更新することができる。さらに、上記処理モジュールは、半導体チップにより実現されてもよい。即ち、上記処理モジュールが行う機能を何らかのハードウェア、及び/又は、ソフトウェアで実行する手段があればよい。
さらに、情報処理装置10の全ての構成要素が、一つのクライアントコンピュータにより実装されてもよいし、一つのサーバコンピュータに実装されてもよい。あるいは、情報処理装置10の構成要素を複数のクライアント又はサーバに実装してもよいし、一部の要素をクライアントに実装し、他の要素をサーバに実装してもよい。例えば、検索処理部16の検索結果多様化部202を一つのサーバに、検索結果要約部203を他のサーバに、結果提示部17をクライアントに実装してもよい。あるいは、検索処理部16をサーバに、結果提示部17をクライアントに実装してもよい。このように、本願開示の実施形態は、様々なコンピュータ環境に対応できる。
なお、上記実施形態にて説明した情報処理装置10の構成及び動作は例示であって、種々の変形が可能である。例えば、図8に示すように、検索結果要約部を省略してもよい。つまり、検索処理部16は、表現力と独立力を計算し、検索結果の多様化を行い、結果提示部は多様化された代表的な結果を表示してもよい。
また、本願開示の実施形態は、内容が相反しない範囲で組み合わせることができる。つまり、図3、図8の処理モジュール構成と当該処理モジュールの実装形式を種々組み合わせることができる。
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、実施形態で実行される工程の実行順序は、その記載の順番に制限されない。実施形態では、例えば各処理を並行して実行する等、図示される工程の順番を内容的に支障のない範囲で変更することができる。
以上のように、第1の実施形態では、特徴量の表現力と独立力を定義し、検索条件により指定された特徴量の類似性スコアだけではなく、特徴量の表現力と独立力に基づき定義された多様性スコアに基づき検索結果の多様化と要約を行う。その結果、代表的な結果が選択されると、重複又は類似している結果はまとめられる。さらに、指定されていない特徴量の表現力と独立力も考慮することで、検索条件に柔軟に対応でき、ユーザが検索条件を調整する労力を低減することができる。さらに、結果提示部17が検索結果をユーザに提示する際、視覚的に分り易く、且つ、簡潔に提示することができるので、ユーザが検索結果を確認する、又は、検索結果から所望の情報を得るための時間を短縮できる。さらに、特徴量に関する検索条件がない場合、全ての特徴量を考慮し、データ集合に対するクラスタリングもできる。
上記の説明により、本発明の産業上の利用可能性は明らかであるが、本発明は、文書や音声、時間、位置、画素、属性など複数種類の情報があるマルチメディアデータに対する情報検索などに好適に適用可能である。また、マルチメディアデータに対するクラスタリングにも好適に適用可能である。
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
上述の第1の視点に係る情報処理装置のとおりである。
[付記2]
前記検索処理部は、前記複数のオブジェクトのなかから前記代表的な結果オブジェクトに従属する従属オブジェクトを決定し、
前記結果提示部は、前記代表的な結果オブジェクトと前記従属オブジェクトが視覚的に区別可能な態様にて、前記代表的な結果オブジェクトと前記従属オブジェクトをユーザに提示する、付記1の情報処理装置。
[付記3]
前記検索処理部は、前記検索条件により指定されない第2の特徴量であって、前記代表的な結果オブジェクトの選択に使用された特徴量を前記結果提示部に出力し、
前記結果提示部は、前記出力された第2の特徴量をユーザに提示する、付記1又は2の情報処理装置。
[付記4]
前記検索処理部は、ユーザから前記検索条件として特徴量が指定されない場合には、前記複数の特徴量に基づき、前記代表的な結果オブジェクトを選択する、付記1乃至3のいずれか一に記載の情報処理装置。
[付記5]
前記検索処理部は、
前記複数のオブジェクトそれぞれについて前記検索条件に対する類似度を示す類似性スコアを計算し、前記複数のオブジェクトから、前記検索条件により指定される検索対象のオブジェクトに類似する類似オブジェクトを前記類似性スコアに基づき選択し、
さらに、前記複数のオブジェクトのうち前記類似オブジェクト以外のオブジェクトの前記類似オブジェクトに対する相違度を示す多様性スコアを計算し、前記多様性スコアに基づき前記代表的な結果オブジェクトを選択する、付記2乃至4のいずれか一に記載の情報処理装置。
[付記6]
前記検索処理部は、
前記複数の特徴量それぞれに関し、特徴量の重要度を示す表現力と特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す独立力を計算し、
さらに、前記表現力と前記独立力と前記類似性スコアに基づき、前記多様性スコアを計算する、付記5の情報処理装置。
[付記7]
前記検索処理部は、
前記代表的な結果オブジェクトを、前記抽出された特徴量における前記多様性スコアに基づき選択する、付記5又は6の情報処理装置。
[付記8]
前記検索処理部は、前記代表的な結果オブジェクトに対する他のオブジェクトの前記多様性スコアに基づき、前記従属オブジェクトを選択する、付記5乃至7のいずれか一に記載の情報処理装置。
[付記9]
前記オブジェクトは、画像データ又は動画像データである、付記1乃至8のいずれか一に記載の情報処理装置。
[付記10]
上述の第2の視点に係る情報処理装置のとおりである。
[付記11]
上述の第3の視点に係る情報処理方法のとおりである。
[付記12]
上述の第4の視点に係るプログラムのとおりである。
なお、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。
10、100 情報処理装置
11 データ取得部
12 特徴量抽出部
13 記憶部
14 検索受信部
15 検索変換部
16、101 検索処理部
17、102 結果提示部
21 CPU(Central Processing Unit)
22 メモリ
23 入出力インターフェイス
24 NIC(Network Interface Card)
201 表現力&独立力計算部
202 検索結果多様化部
203 検索結果要約部

Claims (10)

  1. 複数のオブジェクトからそれぞれ抽出された特徴量それぞれの重要度を示す表現力と特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す独立力を計算する、表現力及び独立力計算部と、
    ユーザからの検索条件に基づいて、前記複数のオブジェクトそれぞれについて前記検索条件を満たす度合を示す類似性スコアの計算と、前記表現力と前記独立力と前記類似性スコアに基づき他のオブジェクトとの差異度を示す多様性スコアの計算と、を行う検索結果多様化部と、
    を備え、
    前記検索結果多様化部は、前記多様性スコアに基づき、前記複数のオブジェクトから代表的な結果を選択する、情報処理装置。
  2. 前記特徴量、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量とを含み
    少なくとも前記代表的な結果オブジェクトをユーザに提示する、請求項1の情報処理装置。
  3. 記複数のオブジェクトのなかから前記代表的な結果オブジェクトに従属する従属オブジェクトを決定し、
    記代表的な結果オブジェクトと前記従属オブジェクトが視覚的に区別可能な態様にて、前記代表的な結果オブジェクトと前記従属オブジェクトをユーザに提示する、請求項の情報処理装置。
  4. 記検索条件により指定されない第2の特徴量であって、前記代表的な結果オブジェクトの選択に使用された特徴量を前記代表的な結果オブジェクトに併せてユーザに提示する、請求項又はの情報処理装置。
  5. 複数のオブジェクトからそれぞれ抽出された特徴量それぞれの重要度を示す表現力と特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す独立力を計算するステップと、
    ユーザからの検索条件に基づいて、前記複数のオブジェクトそれぞれについて前記検索条件を満たす度合を示す類似性スコアの計算と、前記表現力と前記独立力と前記類似性スコアに基づき他のオブジェクトとの差異度を示す多様性スコアの計算と、を行うステップと、
    記多様性スコアに基づき、前記複数のオブジェクトから代表的な結果を選択するステップと
    を含む、情報処理方法
  6. 前記特徴量、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量を含む、請求項5の情報処理方法。
  7. 記複数のオブジェクトのなかから前記代表的な結果オブジェクトに従属する従属オブジェクトを決定するステップと
    記代表的な結果オブジェクトと前記従属オブジェクトが視覚的に区別可能な態様にて、前記代表的な結果オブジェクトと前記従属オブジェクトをユーザに提示するステップと
    を含む、請求項の情報処理方法。
  8. 複数のオブジェクトからそれぞれ抽出された特徴量それぞれの重要度を示す表現力と特徴量間の相関により別の特徴量からある特徴量を推定できないことを示す独立力を計算する処理と、
    ユーザからの検索条件に基づいて、前記複数のオブジェクトそれぞれについて前記検索条件を満たす度合を示す類似性スコアの計算と、前記表現力と前記独立力と前記類似性スコアに基づき他のオブジェクトとの差異度を示す多様性スコアの計算と、を行う処理と、
    記多様性スコアに基づき、前記複数のオブジェクトから代表的な結果を選択する処理と
    をコンピュータに実行させるプログラム
  9. 前記特徴量、ユーザからの検索条件により指定される第1の特徴量と前記検索条件により指定されない第2の特徴量とを含む請求項8のプログラム。
  10. 記複数のオブジェクトのなかから前記代表的な結果オブジェクトに従属する従属オブジェクトを決定する処理と
    記代表的な結果オブジェクトと前記従属オブジェクトが視覚的に区別可能な態様にて、前記代表的な結果オブジェクトと前記従属オブジェクトをユーザに提示する処理と
    をコンピュータに実行させることをさらに含む、請求項プログラム
JP2018561169A 2017-01-13 2017-01-13 情報処理装置、情報処理方法及びプログラム Active JP6822484B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/000962 WO2018131132A1 (ja) 2017-01-13 2017-01-13 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2018131132A1 JPWO2018131132A1 (ja) 2019-11-14
JP6822484B2 true JP6822484B2 (ja) 2021-01-27

Family

ID=62839384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018561169A Active JP6822484B2 (ja) 2017-01-13 2017-01-13 情報処理装置、情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US11080338B2 (ja)
JP (1) JP6822484B2 (ja)
WO (1) WO2018131132A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102457568B1 (ko) * 2017-09-29 2022-10-21 삼성전자주식회사 입력된 정보와 관련된 이미지를 제공하기 위한 전자 장치 및 그의 동작 방법
US10592782B2 (en) * 2018-01-22 2020-03-17 International Business Machines Corporation Image analysis enhanced related item decision
CN111949864B (zh) 2020-08-10 2022-02-25 北京字节跳动网络技术有限公司 一种搜索方法、装置、电子设备及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004259061A (ja) 2003-02-26 2004-09-16 Intec Web & Genome Informatics Corp 情報検索装置、情報検索方法、及び情報検索プログラム
JP2006139382A (ja) 2004-11-10 2006-06-01 Canon Inc 情報処理装置及びその制御方法、プログラム
US9654447B2 (en) * 2006-08-29 2017-05-16 Digimarc Corporation Customized handling of copied content based on owner-specified similarity thresholds
JP5358083B2 (ja) 2007-11-01 2013-12-04 株式会社日立製作所 人物画像検索装置及び画像検索装置
JP2009027393A (ja) 2007-07-19 2009-02-05 Hitachi Ltd 映像検索システムおよび人物検索方法
US9129008B1 (en) * 2008-11-10 2015-09-08 Google Inc. Sentiment-based classification of media content
US8352494B1 (en) * 2009-12-07 2013-01-08 Google Inc. Distributed image search
CN102193934B (zh) 2010-03-11 2013-05-29 株式会社理光 用于寻找图像集合中的代表性图像的系统和方法
US8543521B2 (en) * 2011-03-30 2013-09-24 Microsoft Corporation Supervised re-ranking for visual search
US10475100B1 (en) * 2011-07-11 2019-11-12 Fred Herz Patents, LLC Online marketing service system
US9009147B2 (en) * 2011-08-19 2015-04-14 International Business Machines Corporation Finding a top-K diversified ranking list on graphs
JP5834815B2 (ja) 2011-11-22 2015-12-24 株式会社リコー 情報処理装置、プログラムおよび文書を検索するための方法
JP2013114507A (ja) 2011-11-29 2013-06-10 Toshiba Corp 情報処理装置、画像選択方法およびプログラム
US9507867B2 (en) * 2012-04-06 2016-11-29 Enlyton Inc. Discovery engine
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US9659214B1 (en) * 2015-11-30 2017-05-23 Yahoo! Inc. Locally optimized feature space encoding of digital data and retrieval using such encoding
WO2017115420A1 (ja) * 2015-12-28 2017-07-06 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US10891019B2 (en) * 2016-02-29 2021-01-12 Huawei Technologies Co., Ltd. Dynamic thumbnail selection for search results
US10410043B2 (en) * 2016-06-24 2019-09-10 Skusub LLC System and method for part identification using 3D imaging
US20180060954A1 (en) * 2016-08-24 2018-03-01 Experian Information Solutions, Inc. Sensors and system for detection of device movement and authentication of device user based on messaging service data from service provider
US10558692B2 (en) * 2016-09-26 2020-02-11 International Business Machines Corporation Minimum coordination passage scoring

Also Published As

Publication number Publication date
JPWO2018131132A1 (ja) 2019-11-14
US20190370287A1 (en) 2019-12-05
US11080338B2 (en) 2021-08-03
WO2018131132A1 (ja) 2018-07-19

Similar Documents

Publication Publication Date Title
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
CN108694223B (zh) 一种用户画像库的构建方法及装置
US9323785B2 (en) Method and system for mobile visual search using metadata and segmentation
JP4337064B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR102021057B1 (ko) 문서 내 문단 추출 장치 및 방법
EP2587826A1 (en) Extraction and association method and system for objects of interest in video
CN111062871A (zh) 一种图像处理方法、装置、计算机设备及可读存储介质
WO2017080173A1 (zh) 基于自然信息识别的推送系统和方法及一种客户端
CN106951571B (zh) 一种给应用标注标签的方法和装置
KR20190069920A (ko) 동영상 콘텐츠 내의 인물을 인식하는 장치 및 방법
CN111198939B (zh) 语句相似度的分析方法、装置及计算机设备
JP6822484B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN107590150A (zh) 基于关键帧的视频分析实现方法及装置
US20150161094A1 (en) Apparatus and method for automatically generating visual annotation based on visual language
US9549162B2 (en) Image processing apparatus, image processing method, and program
CN104520848A (zh) 按照出席者搜索事件
US20210182566A1 (en) Image pre-processing method, apparatus, and computer program
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
US8868571B1 (en) Systems and methods for selecting interest point descriptors for object recognition
US9699501B2 (en) Information processing device and method, and program
WO2018120575A1 (zh) 网页主图识别方法和装置
CN107133644B (zh) 数字化图书馆内容分析系统及方法
KR20160029603A (ko) 검색 서비스 제공 장치, 시스템, 방법 및 컴퓨터 프로그램
JP7109414B2 (ja) 識別装置、識別方法及び識別プログラム
KR100981125B1 (ko) 동영상 처리 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201221

R150 Certificate of patent or registration of utility model

Ref document number: 6822484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150