JP2015225669A - 注釈表示支援装置及び注釈表示支援方法 - Google Patents

注釈表示支援装置及び注釈表示支援方法 Download PDF

Info

Publication number
JP2015225669A
JP2015225669A JP2015106022A JP2015106022A JP2015225669A JP 2015225669 A JP2015225669 A JP 2015225669A JP 2015106022 A JP2015106022 A JP 2015106022A JP 2015106022 A JP2015106022 A JP 2015106022A JP 2015225669 A JP2015225669 A JP 2015225669A
Authority
JP
Japan
Prior art keywords
image
group
annotation
images
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015106022A
Other languages
English (en)
Other versions
JP2015225669A5 (ja
Inventor
バボン,フレデリツク
Babon Frederic
サルバテイエラ,ホアキン セペーダ
Zepeda Salvatierra Joaquin
サルバテイエラ,ホアキン セペーダ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2015225669A publication Critical patent/JP2015225669A/ja
Publication of JP2015225669A5 publication Critical patent/JP2015225669A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • G06F18/41Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】画像分類用トレーニング・セットを容易に準備できるようにユーザを支援する装置及び方法を提供する。
【解決手段】注釈表示支援装置100は、検索ワードとの関係で第1のグループに含まれる可能性のある画像を表示する表示処理部14と、表示処理部によって表示される画像のうちで検索ワードとの関係で第2のグループに含まれるべきである画像の選択を受け付ける入力受付部12と、表示処理部によって表示される画像のうちで第2のグループに属する可能性のある画像を、第2のグループに含まれるべきであるとして選択された画像に基づいて、画像に関連付けられた注釈を付加するために検出する注釈付加部18と、を備える。
【選択図】図1

Description

本発明は、注釈表示支援装置及び注釈表示支援方法に関する。
各々の画像に「羊」又は「猫」のような所定のビジュアル・コンセプト(視覚的概念)が存在しているか否かを示す画像分類器(classifier)によって画像を分類する技術がある。画像分類器は、上記視覚的概念を含有するポジティブ画像と上記視覚的概念を含有しないネガティブ画像とを含むトレーニング・セットを用いる学習アルゴリズムによって作成される。一般的な学習アルゴリズムとしては、Support Vector Machine(サポート・ベクトル・マシン)(SVM)アルゴリズムが知られており、そこでは、結果として得られる分類器は、画像の特徴(画像から抽出されるヒストグラムのような高次元ベクトル)の空間において分離超平面(separating hyper-plane)を規定する線形分類器である。
また、米国特許第7890443号には、弱分類器を、あるいは、組み合わせ分類器の「フィーチャ(feature)(特徴)」をトレーニングするための「マルチプル・インスタンス・プルーニング(multiple instance pruning)」(MIP)が開示されている。
しかしながら、各ユーザにとってトレーニング・セットを準備することは難しい。例えば、視覚的概念を表すポジティブ画像とネガティブ画像の大量のセット(集合)を手動で準備するには時間がかかる。したがって、各ユーザが集めることができる視覚的概念の量は限られる。
この問題に取り組むために、1つの技術が提案されており、そこでは、グーグル画像検索(GIS)を用いてポジティブ画像を取得し、各々のポジティブ画像についてデスクリプタ(記述子)を算出し、ポジティブ画像の記述子と、予め算出された記述子を有するネガティブ画像のプールとを用いて線形SVM分類器をトレーニングして重みベクトルを取得し、その分類器によってデータ・セットをランク付けする(K. Chatfield、 A. Zisserman、“VISOR: Towards On-the-Fly Large-Scale Object Category Retrieval”、 Asian Conference on Computer Vision、2012)。
しかしながら、ウェブ(web)の広汎性、及び、一部の単語が曖昧であることに因り、GISによって返されるポジティブ・セットは、視覚的概念(検索ワード)を正確に表していないことが時々ある。このため、各ユーザが、更に、視覚的概念を正確に表していない画像をマーキングすることによって、返されたポジティブ画像を手動で訂正する必要がある。したがって、画像分類の結果のクオリティを改善するために、トレーニング・セットを準備することにおける困難性に係る上述の問題を解決する必要がある。
本発明は、上述の問題に鑑みて為されたものであり、画像分類用トレーニング・セットを容易に準備できるようにユーザを支援する技術を提供する。
一実施形態に従えば、注釈表示支援装置であって、検索ワードとの関係で第1のグループに含まれる可能性のある画像を表示する表示処理部と、上記表示処理部によって表示される画像のうち検索ワードとの関係で第2のグループに含まれるべきである画像の選択をユーザから受け付ける入力受付部と、上記表示処理部によって表示される画像であって、上記第2のグループに含まれるべきであるとしてユーザによって選択された画像以外の、上記表示処理部によって表示される画像のうち、第2のグループに属する可能性のある画像を、上記第2のグループに含まれるべきであるとしてユーザによって選択された画像に基づいて、上記画像に注釈を付加するために検出する注釈付加部と、を有し、上記表示処理部が、注釈付加部によって第2のグループに属する可能性があるとして検出された画像についての注釈を表示し、上記注釈が、上記画像が第2のグループに属する可能性があることを示す、注釈表示支援装置が提供される。
別の一実施形態に従えば、注釈表示支援方法であって、検索ワードとの関係で第1のグループに含まれる可能性のある画像を表示する処理と、上記表示する処理において上記表示される画像のうち検索ワードとの関係で第2のグループに含まれるべきである画像の選択をユーザから受け付ける処理と、上記表示する処理において表示される画像であって、上記第2のグループに含まれるべきであるとしてユーザによって選択された画像以外の、上記表示する処理において表示される画像のうち第2のグループに属する可能性のある画像を、上記第2のグループに含まれるべきであるとしてユーザによって選択された画像に基づいて、上記画像に注釈を付加するために検出する処理と、上記検出する処理において第2のグループに属する可能性があるとして検出された画像についての注釈を表示する処理と、を有し、上記注釈が、上記画像が第2のグループに属する可能性があることを示す、注釈表示支援方法が提供される。
尚、上述の構成要素の任意の組み合わせと、本発明における方法、装置、システムなどの間で行われる表現の任意の取り替えとは、本発明の実施形態として法的に有効である。
本発明のその他の目的、特徴及び利点は、添付図面と組み合わせて読まれる以下の詳細な説明から更に明らかになるであろう。
一実施形態の注釈表示支援装置の機能的構造の一例を示すブロック図である。 一実施形態の注釈表示支援装置のハードウェア構造の一例を示すブロック図である。 一実施形態の表示処理装置によって表示される画面の一例を示す図である。 一実施形態の表示処理装置によって表示される画面の別の一例を示す図である。 一実施形態の処理工程の一例を示すフローチャートである。
ここでは、実例となる実施形態を参照して、本発明を説明する。当業者であれば、本発明の開示事項を用いて多数の代替実施形態を実現できること、及び、本発明が、例として示されたこれらの実施形態に限定されないことが判るであろう。
尚、図面の説明においては、同一の構成要素には同一の参照番号が与えられており、説明の繰り返しはしない。
図1は、一実施形態の注釈表示支援装置100の機能的構造の一例を示すブロック図である。
注釈表示支援装置100は、例えばインターネット等のようなネットワーク400を介して、例えばグーグル・イメージ・サーチ(Google Image Search)(GIS)等のような画像検索エンジンを備えた外部画像検索システム300と通信できる。
注釈表示支援装置100の機能的構造を詳細に説明する前に、注釈表示支援装置100のハードウェア構造を説明する。
図2は、上記一実施形態の注釈表示支援装置100のハードウェア構造の一例を示す図である。ここでは、注釈表示支援装置100が例えばスマートフォン、あるいは、携帯電話などのような携帯端末である例を説明する。
注釈表示支援装置100には、電力供給システム251と、プロセッサ253、メモリ・コントローラ254及び周辺インタフェース255を含むメイン・システム252と、記憶部256と、外部ポート257と、高周波回路258と、アンテナ259と、音声回路260と、スピーカー261と、マイクロホン262と、センサ263と、表示コントローラ265、光学センサ・コントローラ266及び入力コントローラ267を含むI/O(入出力)サブ・システム264と、タッチ・パネル表示システム268と、光学センサ269と、入力部270と、が含まれている。詳細には示されていないが、センサ263には、近接センサ、全地球位置把握システム(Global Positioning System)(GPS)回路、加速度計、ジャイロスコープ、磁力計、光度センサなどが含まれていてもよい。
あるいは、注釈表示支援装置100は、例えばパーソナル・コンピュータなどのような端末装置であってもよい。
図1に戻ると、注釈表示支援装置100には、入力受付部12、表示処理部14、注釈付加部18、画像取得部16、及び、画像データ記憶装置20が含まれている。
入力受付部12は、注釈表示支援装置100におけるユーザの種々の入力操作を受け付ける。特に、入力受付部12は、ユーザから視覚的概念のテキスト指定(以下、「検索ワード」という)を受け付ける。ユーザが、羊に関する画像を取得したい場合、検索ワードは、例えば「羊」であってもよい。
画像取得部16は、外部検索エンジンを用いて、ユーザによって入力された検索ワードに基づいて、第1のグループに含まれる可能性のある画像を取得する。
画像取得部16は、検索ワードとの関係で第1のグループに含まれる可能性があり、検索ワードに基づいて外部画像検索システム300によって検索され発見された画像を取得(ダウンロード)する。この実施形態において、第1のグループとは、検索ワードに対してポジティブ(肯定的)な画像(以下、「検索ワードに対するポジティブ画像」という)のグループである。したがって、厳密に述べると、画像取得部16は、検索ワードに対してポジティブである可能性のある画像(以下、「検索ワードに対してポジティブの可能性のある画像」という)であり、且つ、検索ワードに基づいて外部画像検索システム300によって検索され発見された画像を取得(ダウンロード)する。
表示処理部14は、例えばタッチ・パネル表示システムなどのような表示装置上に種々の情報要素を表示する。具体的には、表示処理部14は、画像取得部16によって取得された、検索ワードに対してポジティブの可能性のある画像の一覧を表示する。
入力受付部12は、ユーザから、表示処理部14によって表示される画像のうち、検索ワードとの関係で第2のグループに含まれるべき画像の選択を受け付ける。この実施形態において、第2のグループとは、検索ワードに対してネガティブな画像(以下、「検索ワードに対するネガティブ画像」という)のグループである。したがって、厳密に述べると、入力受付部12は、ユーザから、表示処理部14によって表示されるポジティブの可能性のある画像のうち、検索ワードに対してネガティブな画像の選択を受け付ける。
例えば、表示処理部14は、検索ワードに対してポジティブの可能性のある画像を個々のチェック・ボックスとともに表示してもよい。次に、ユーザは、検索ワードなどによって定められた視覚的概念を含まない画像に付随するチェック・ボックスを手動でマークする又はチェックすることによって、検索ワードに対してネガティブな画像を選択してもよい。ユーザがチェック・ボックスをチェックすると、表示処理部14は、そのチェック・ボックスが付随する画像に、例えば、×印のようなネガティブのアイコンを表示することによって、それが実際にネガティブ画像であることを示してもよい。
注釈付加部18は、ユーザによって選択されたネガティブ画像に基づいて、表示処理部14によって表示される残りのポジティブの可能性のある画像のうちで、検索ワードに対してネガティブである可能性のある画像(以下、「検索ワードに対してネガティブの可能性のある画像」という)を検出する。この時、注釈付加部18は、選択されたネガティブ画像をクエリ画像として使用して、表示処理部14によって表示される残りのポジティブの可能性のある画像を検索ワードに対してネガティブの可能性のある画像として示唆するか否かを自動的に判定するアルゴリズムを実行してもよい。この時、注釈付加部18は、類似性に基づく比較、あるいは、分類に基づく比較などを用いてもよい。
類似性に基づく比較が用いられる場合、注釈付加部18は、表示処理部14によって表示される残りのポジティブの可能性のある画像の各々を選択されたネガティブ画像と比較する。この比較は、例えば、整合記述子の幾何学的検証に採用されるスケール不変特徴量変換(Scale Invariant Feature Transform)(SIFT)のような局所記述子を用いて、実施してもよい。
分類に基づく比較が用いられる場合、注釈付加部18は、例えば、選択されたネガティブ画像をネガティブ画像として、残りのポジティブの可能性のある画像をポジティブ画像として、使用して、画像分類器を形成する。
表示処理部14は、注釈付加部18によって検出されたネガティブの可能性のある画像上に、その画像が検索ワードに対してネガティブである可能性があることを示す注釈を表示する。その画像がネガティブである可能性があることを示す注釈は、例えばクエスチョン・マークのようなネガティブを示唆するアイコンであってもよい。
このようにして、ユーザは、表示処理部14によって表示される画像に付随するネガティブを示唆するアイコンを参照することによって、検索ワードに対する別のネガティブ画像を容易に選択できる。入力受付部12は、ユーザから、検索ワードに対するこのネガティブ画像の選択を受け付ける。
ユーザが検索ワードに対するネガティブ画像を選択すると、その結果が、画像データ記憶装置20に記憶される。具体的には、画像取得部16によって取得された各々の画像の画像データと、検索ワードと、それぞれの画像がユーザによって検索ワードに対するネガティブ画像として選択されたか否かを示す情報とが、互いに対応付けられて、画像データ記憶装置20に記憶される。
更に、画像取得部16が、外部画像検索システム300によって検索され発見された、検索ワードに対してポジティブの可能性のある画像を新たに取得すると、注釈付加部18は、それらの新たに取得されたポジティブの可能性のある画像と、画像データ記憶装置20に記憶されている画像とを比較してもよい。次に、注釈付加部18は、画像データ記憶装置20に記憶されている画像に基づいて、新たに取得された画像のうち、検索ワードに対してネガティブの可能性のある画像を検出してもよい。
図3及び図4は、表示処理部14によって表示される画面500の一例を示す図である。
図3において、外部画像検索システム300によって提供された検索ウェブ・サイトの検索ワード・ボックス502に検索ワードの「羊」が入力されたと仮定する。次に、画像取得部16は、外部画像検索システム300から、検索ワードの「羊」に対してポジティブの可能性のある複数の画像を取得する。その次に、表示処理部14は、取得された画像の一覧を表示する。図3には、そのような検索ワードの「羊」に対してポジティブの可能性のある画像が例示されている。
更に、破線510内の画像は、ユーザによって、以前、取得され検証された画像と同じものであると仮定する。例えば、画像504aが、以前、ユーザによってチェックされて検索ワードの「羊」に対してネガティブであるとされ、その結果が画像データ記憶装置20に記憶されたと仮定する。したがって、ネガティブのアイコンである×印506aが、画像504aと共に表示されている。
このような状況下で、ユーザが、検索ワードの「羊」に対してネガティブであると思う画像のうちの1つに、例えば、画像504bにカーソル514を移動すると、ボックス512が表示される。あるいは、ボックスが、元から全ての画像にそれぞれ表示されていてもよい。次に、ユーザがボックス512をチェックすると、×印506bが、図4に例示されているように画像504bと共に表示される。
次に、注釈付加部18は、ユーザによって選択されたネガティブな画像504a及び504bと残りのポジティブの可能性のある画像とに基づいて、残りのポジティブの可能性のある画像のうちで検索ワードの「羊」に対してネガティブの可能性のある画像を検出する。
この場合、例えば、図4に例示されているように、ネガティブを示唆するアイコンであるクエスチョン・マーク506c及び506dが、それぞれ、画像504c及び504dと共に表示される。
この構成により、ユーザは、クエスチョン・マーク506c及び506dを見ることによって、検索ワードの「羊」に対してネガティブの可能性のある画像を容易に確認できる。
図5は、本実施形態の処理工程の一例を示すフローチャートである。
先ず、入力受付部12が、検索ワードを受け付ける(ステップS102)。次に、画像取得部16が、外部画像検索システム300から、検索ワードに対してポジティブの可能性のある複数の画像を取得する(ステップS104)。
その後、注釈付加部18が、取得された画像と、以前取得された画像であって、検索ワードに対してネガティブであると検証又はチェックされ、画像データ記憶装置20に記憶された画像とを比較する(ステップS106)。次に、表示処理部14が、画像取得部16によって取得された画像を、ネガティブのアイコン(以前の注釈)などと共に、表示する(ステップS108)。
その後、入力受付部12が、ユーザから、検索ワードに対するネガティブ画像の選択(手動の注釈)を受け付ける(ステップS110)。この時、表示処理部14が、ユーザによってネガティブであると選択された画像に対して、ネガティブのアイコンを表示する。
その後、注釈付加部18が、ユーザによって、今回及び以前に検索ワードに対してネガティブであると選択された画像と、残りのポジティブの可能性のある画像とに基づいて、検索ワードに対してネガティブの可能性のある画像(ネガティブの候補)を検出する(ステップS112)。
次に、表示処理部14が、検索ワードに対してネガティブの可能性があると検出された画像と共に、ネガティブを示唆するアイコンを表示する(ステップS114)。
その後、注釈処理工程を終了するか否かが決定される(ステップS116)。注釈処理工程を終了しない場合(ステップS116でNOの場合)、本処理工程は、ステップS106に戻り、同じステップが繰り返される。注釈処理工程を終了する場合(ステップS116でYESの場合)、注釈付加部18が、画像取得部16によって取得された各々の画像を、検索ワードと共に、更に、それぞれの画像がユーザによって検索ワードに対するネガティブ画像として選択されたか否かを示す情報と共に、画像データ記憶装置20に記憶する(ステップS118)。
あるいは、ステップS116において、注釈処理工程を終了するか否かを、ユーザによって検索ワードに対するポジティブ画像であると確認された画像の数が目標数に達しているか否かによって、決定してもよい。具体的には、ステップS116において、検索ワードに対するポジティブ画像であると確認された画像の数が目標数に達すると、注釈処理工程を終了することを決定する。これに対して、ステップS116において、検索ワードに対するポジティブ画像であると確認された画像の数が目標数に達していない場合、本処理工程は、ステップS104に戻り、新たな画像がダウンロードされてもよい。
本実施形態に従えば、ユーザが、検索ワードに対してネガティブである画像を選択する度に、検索ワードに対してネガティブの可能性のある画像が検出される。その際、新たなネガティブの可能性のある画像が検出されると、それぞれの画像が検索ワードに対してネガティブの可能性があることを示すネガティブ示唆アイコンのような注釈が表示される。ここで、注釈付加部18は、検索ワードに対してネガティブの可能性のある画像を検出すると、そのネガティブの可能性のある画像(それぞれネガティブ示唆アイコンが付いた画像)を、デフォルトで、実際にネガティブの画像として、処理してもよい。
したがって、ユーザは、ネガティブ示唆アイコンを見ることによって検索ワードに対してネガティブな画像を速やかに選択できるので、トレーニング・セットを容易に準備できる。
その結果として、オリジナルのオンザフライ(即座)の画像分類システムのポジティブ・セットの注釈がスピード・アップ(加速)され、且つ、より人間工学的になる。未検証画像のうちでネガティブ画像が自動的に示唆されることによって、ポジティブ・セットの注釈付けが速まり、ユーザ・エクスペリエンス(ユーザ体験)がより柔軟になる。
上述の実施形態では、注釈処理工程がポジティブの可能性のある画像のデータ・セットについて実施される一例を説明した。別の一例として、同じ論理とシステムをネガティブの可能性のある画像のデータ・セットについて用いてもよい。これは、第1のグループと第2のグループが、それぞれ、検索ワードに対してネガティブである画像のグループと、検索ワードに対してポジティブである画像のグループとであってもよいことを意味している。
例えば、最も影響力のあるネガティブ画像(分離超平面により近い画像)に手動で注釈を付けることは、有効である。そのような場合、表示処理部14は、ネガティブの可能性のある画像を表示してもよい。次に、ユーザは、ネガティブの可能性のある画像のうちで検索ワードに対してポジティブである画像を選択してもよい。その後、表示処理部14は、ユーザによってポジティブであると選択された画像と共に、ポジティブのアイコンを表示してもよい。
次に、注釈付加部18は、ユーザによって選択されたポジティブ画像と残りのネガティブの可能性のある画像とに基づいて、表示処理部14によって表示される残りのネガティブの可能性のある画像のうち、ポジティブの可能性のある画像を検出してもよい。次に、表示処理部14は、ポジティブを示唆するアイコンを、ポジティブの可能性のあるそれぞれの画像と共に、表示してもよい。その結果、ユーザは、ポジティブを示唆するアイコンを見ることによって、検索ワードに対してポジティブである画像を容易に選択できる。
更に、例えばGISのような外部画像検索システム300からダウンロードされた画像は重複が多い場合もあるかもしれない。このように重複が多いことに因り、注釈処理工程が不必要に労を要する。したがって、同一の視覚的情報を含む画像は、クラスタ化して(一塊にして)検出し、スタック化(積層化又は積重ね)状態で表示してもよい。このクラスタ化処理は、既に詳しく説明したように類似性に基づく比較によって実施してもよい。このような構成によって、ユーザは、より広範囲の画像に対して、より速やかに、注釈を付けることができる。より大きなトレーニング・セットは、処理結果に重要な良い影響を及ぼすことが知られている。この場合、オプションとして、ユーザは、スタック化画像を拡張して画像クラスタを検証できるようにしてもよい。
注釈表示支援装置100の個別の構成要素は、ハードウェアとソフトウェアの任意の組み合わせ、その代表例として、任意のコンピュータのCPUと、メモリと、図面に例示された構成要素を具現化するために上記メモリにロードされたプログラムと、例えばハード・ディスクのような上記プログラムを記憶する記憶装置と、ネットワーク接続用インタフェースとの任意の組み合わせによって具現化してもよい。当業者であれば、本実施形態における方法及び装置について、様々な修正、調整及び変更などが可能であることが判るであろう。
本発明は、ここに具体的に開示した実施形態に限定されず、変形実施形態及び修正実施形態などを、本発明の有効範囲から逸脱することなく、実施できる。

Claims (7)

  1. 注釈表示支援装置であって、
    検索ワードとの関係で第1のグループに含まれる可能性のある画像を表示する表示処理部と、
    前記表示処理部によって表示される画像のうち前記検索ワードとの関係で第2のグループに含まれるべきである画像の選択を受け付ける入力受付部と、
    前記第2のグループに属する可能性のある画像をその画像に注釈を付加するために検出する注釈付加部であって、前記第2のグループに属する可能性のある画像は、前記第2のグループに含まれるべきであるとして選択された画像以外の、前記表示処理部によって表示される画像から、前記第2のグループに含まれるべきであるとして選択された画像に基づいて検出される、前記注釈付加部と、
    を備え、
    前記表示処理部が、前記注釈付加部によって前記第2のグループに属する可能性があるとして検出された画像に関連付けられた前記注釈を表示し、前記注釈が、前記画像が前記第2のグループに属する可能性があることを示す、前記注釈表示支援装置。
  2. 前記第1のグループ及び前記第2のグループが、それぞれ、前記検索ワードに対してポジティブである画像のグループ、及び、前記検索ワードに対してネガティブである画像のグループであるか、あるいは、前記第1のグループ及び前記第2のグループが、それぞれ、前記検索ワードに対してネガティブである画像のグループ、及び、前記検索ワードに対してポジティブである画像のグループである、請求項1に記載の注釈表示支援装置。
  3. 前記第1のグループに含まれる可能性のある画像を、入力された前記検索ワードに基づいて、外部検索エンジンによって、取得する画像取得部を更に備え、
    前記表示処理部が、前記画像取得部によって取得された画像を表示する、請求項1に記載の注釈表示支援装置。
  4. 前記注釈付加部が、前記表示処理部によって表示される残りの画像のうちで前記第2のグループに属する可能性のある画像を、前記第2のグループに含まれるべきであるとして以前に選択された画像と前記第2のグループに含まれるべきであるとして今回選択された画像とに基づいて、検出する、請求項1に記載の注釈表示支援装置。
  5. 前記表示処理部が、クラスタ化処理によって同一の視覚的情報を含む画像として検出された画像をスタック化状態で表示する、請求項1に記載の注釈表示支援装置。
  6. 注釈表示支援方法であって、
    検索ワードとの関係で第1のグループに含まれる可能性のある画像を表示することと、
    前記表示することにおいて表示される画像のうちで前記検索ワードとの関係で第2のグループに含まれるべきである画像の選択を受け付けることと、
    前記第2のグループに属する可能性のある画像をその画像に注釈を付加するために検出することであって、前記第2のグループに属する可能性のある画像は、前記第2のグループに含まれるべきであるとして選択された画像以外の、前記表示することによって表示される画像から、前記第2のグループに含まれるべきであるとして選択された画像に基づいて検出される、前記画像に注釈を付加するために検出することと、
    前記検出することにおいて前記第2のグループに属する可能性があるとして検出された画像に関連付けられた前記注釈を表示することと、
    を有し、前記注釈が、前記画像が前記第2のグループに属する可能性があることを示す、前記注釈表示支援方法。
  7. 前記第1のグループ及び前記第2のグループが、それぞれ、前記検索ワードに対してポジティブである画像のグループ、及び、前記検索ワードに対してネガティブである画像のグループであるか、あるいは、前記第1のグループ及び前記第2のグループが、それぞれ、前記検索ワードに対してネガティブである画像のグループ、及び、前記検索ワードに対してポジティブである画像のグループである、請求項6に記載の注釈表示支援方法。
JP2015106022A 2014-05-28 2015-05-26 注釈表示支援装置及び注釈表示支援方法 Pending JP2015225669A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14305797.4A EP2950224A1 (en) 2014-05-28 2014-05-28 Annotation display assistance device and method of assisting annotation display
EP14305797.4 2014-05-28

Publications (2)

Publication Number Publication Date
JP2015225669A true JP2015225669A (ja) 2015-12-14
JP2015225669A5 JP2015225669A5 (ja) 2016-02-12

Family

ID=50933108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015106022A Pending JP2015225669A (ja) 2014-05-28 2015-05-26 注釈表示支援装置及び注釈表示支援方法

Country Status (6)

Country Link
US (1) US20150347369A1 (ja)
EP (2) EP2950224A1 (ja)
JP (1) JP2015225669A (ja)
KR (1) KR20150137006A (ja)
CN (1) CN105302849A (ja)
TW (1) TW201546636A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878021B2 (en) 2015-08-17 2020-12-29 Adobe Inc. Content search and geographical considerations
US10475098B2 (en) 2015-08-17 2019-11-12 Adobe Inc. Content creation suggestions using keywords, similarity, and social networks
US10366433B2 (en) 2015-08-17 2019-07-30 Adobe Inc. Methods and systems for usage based content search results
US11048779B2 (en) 2015-08-17 2021-06-29 Adobe Inc. Content creation, fingerprints, and watermarks
US20170053365A1 (en) * 2015-08-17 2017-02-23 Adobe Systems Incorporated Content Creation Suggestions using Keywords, Similarity, and Social Networks
US10592548B2 (en) 2015-08-17 2020-03-17 Adobe Inc. Image search persona techniques and systems
CN107766349B (zh) * 2016-08-16 2022-03-01 阿里巴巴集团控股有限公司 一种生成文本的方法、装置、设备及客户端
CN107832662B (zh) * 2017-09-27 2022-05-27 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
US10853983B2 (en) 2019-04-22 2020-12-01 Adobe Inc. Suggestions to enrich digital artwork

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US6748398B2 (en) * 2001-03-30 2004-06-08 Microsoft Corporation Relevance maximizing, iteration minimizing, relevance-feedback, content-based image retrieval (CBIR)
US7869647B2 (en) * 2004-04-02 2011-01-11 Agilent Technologies, Inc. System and method for processing training data for a statistical application
US20070098303A1 (en) * 2005-10-31 2007-05-03 Eastman Kodak Company Determining a particular person from a collection
US8726144B2 (en) * 2005-12-23 2014-05-13 Xerox Corporation Interactive learning-based document annotation
JP2007286864A (ja) * 2006-04-17 2007-11-01 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
US7890443B2 (en) 2007-07-13 2011-02-15 Microsoft Corporation Learning classifiers using combined boosting and weight trimming
US9002100B2 (en) * 2008-04-02 2015-04-07 Xerox Corporation Model uncertainty visualization for active learning
US20090287655A1 (en) * 2008-05-13 2009-11-19 Bennett James D Image search engine employing user suitability feedback
US8676803B1 (en) * 2009-11-04 2014-03-18 Google Inc. Clustering images
US8724908B2 (en) * 2010-09-03 2014-05-13 Adobe Systems Incorporated System and method for labeling a collection of images
US10142441B2 (en) * 2010-09-24 2018-11-27 Google Llc Search result annotations
US9092529B1 (en) * 2011-11-11 2015-07-28 Google Inc. Social search endorsements
JP5895777B2 (ja) * 2012-09-06 2016-03-30 富士ゼロックス株式会社 情報分類プログラム及び情報処理装置

Also Published As

Publication number Publication date
EP2950224A1 (en) 2015-12-02
KR20150137006A (ko) 2015-12-08
US20150347369A1 (en) 2015-12-03
TW201546636A (zh) 2015-12-16
CN105302849A (zh) 2016-02-03
EP2950239A1 (en) 2015-12-02

Similar Documents

Publication Publication Date Title
JP2015225669A (ja) 注釈表示支援装置及び注釈表示支援方法
CA3022944C (en) System and method for displaying search results for a trademark query in an interactive graphical representation
US7769771B2 (en) Searching a document using relevance feedback
EP2612263B1 (en) Sketch-based image search
US8577882B2 (en) Method and system for searching multilingual documents
US8868569B2 (en) Methods for detecting and removing duplicates in video search results
US11461386B2 (en) Visual recognition using user tap locations
US20180276896A1 (en) System and method for augmented reality annotations
US8892594B1 (en) System and method for search with the aid of images associated with product categories
US10210181B2 (en) Searching and annotating within images
US10528649B2 (en) Recognizing unseen fonts based on visual similarity
JP2014112283A (ja) 情報処理装置、情報処理方法、およびプログラム
EP3037985A1 (en) Search method and system, search engine and client
CN110598123B (zh) 基于画像相似性的信息检索推荐方法、装置及存储介质
US10698971B2 (en) Method and apparatus for storing access log based on keyword
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
US20160364458A1 (en) Methods and Systems for Using Field Characteristics to Index, Search For, and Retrieve Forms
JP2009271671A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2013225207A (ja) 特許調査支援装置、特許調査支援方法、およびプログラム
US11080319B2 (en) System and method for providing image search result online using device information
JP2008234226A (ja) 検索装置および検索方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20151021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151222

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20160603

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160610