JP2011154687A - 画像データセットをナビゲートするための方法、装置、及びプログラム - Google Patents

画像データセットをナビゲートするための方法、装置、及びプログラム Download PDF

Info

Publication number
JP2011154687A
JP2011154687A JP2011012909A JP2011012909A JP2011154687A JP 2011154687 A JP2011154687 A JP 2011154687A JP 2011012909 A JP2011012909 A JP 2011012909A JP 2011012909 A JP2011012909 A JP 2011012909A JP 2011154687 A JP2011154687 A JP 2011154687A
Authority
JP
Japan
Prior art keywords
image
feature
user
images
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011012909A
Other languages
English (en)
Inventor
Sandra Skaff
スカッフ サンドラ
Luca Marchesotti
マルケゾッティ ルカ
Tommaso Colombino
コロンビーノ トンマーゾ
Ana Fucs
フクス アナ
Gabriela Csurka
クスルカ ガブリエラ
Yanal Wazaefi
ワザエフィ ヤナル
Marco Bressan
ブレッサン マルコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2011154687A publication Critical patent/JP2011154687A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Abstract

【課題】本発明は、コンテンツだけでなく様々な特徴を用いることによって、画像データセットをナビゲートするための方法、及び装置を提供することを目的とする。
【解決手段】この方法は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴の受信し、利用可能な特徴セットからユーザが選択した第2特徴の受信し、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に同時に配列して表示する、ことを含む。この画像の配列は、第1特徴のみが選択された場合、第1特徴の異なるレベルを反映し、第1及び第2特徴が選択された場合、第1及び第2特徴のレベルの異なる組み合わせを反映する。
【選択図】図3

Description

本発明は、画像検索及び選択に関する。本発明は、特に、画像データベースを探索するナビゲーションシステム、及び方法に関する。
様々な用途(例えば、商業デザイン、編集作業、専門的デジタル写真、及び資産管理)において、後日使用するため、多数のデジタル画像が取得されて格納される。従来の探索技法による画像の検索は、時間のかかることが多い。例えば、画像コレクションが適切にタグ付けされている場合、ユーザは、テキストクエリ(例えば、「花」)を入力して、このクエリに応答する多数の画像(例えば、花を含むものとして手動でタグ付けされた画像)を検索する。他の検索方法は、特徴抽出技法に基づく。例えば、自動システムは、抽出された特徴の類似度に基づいて、手動でラベル付けされた画像のタグを、ラベル付けされていない画像に広めても良い。或いは、ユーザが花の画像を入力し、この入力画像の特徴と格納されている画像の特徴とを比較することによって、類似した画像が自動的に検索されてもよい。
画像探索は、通常、明確な基準を用いることによって探索空間を狭く定めて区切ることと、十分に多くの利用可能画像サンプルをブラウズして、最も適した又は美的な魅力のある画像を確実に逃さないようにすることとの間における、妥協を伴う。これにより、ユーザには、比較的多くの画像サブセットが残される。従って、ブラウジングは、依然として、第1の画像選択方法である。
現在のシステム(例えば、グーグルイメージズ(Google Images(登録商標))及びフリッカー(FLICKR(登録商標))は、コンテンツに基づいて画像探索を行い、美的な絞り込みをするための非常に基本的な選択肢を提供する。しかしながら、これらのシステムは、特徴を組み合わせて探索するためのツールを提供しない。これらのシステムにおいて、ユーザは、絞り込み基準シーケンスを選択して、繋ぎ合わせるのがせいぜいである。例えば、グーグルイメージズ(登録商標)では、ユーザは、例えば「空」というクエリのようなコンテンツによって探索し、次に、「青」というボックスをクリックすることによって、青空の画像を得ることができる。このようなタイプのブラウジングでは、選択された特徴の絞り込みと、非実際的特徴の異なる組み合わせの探査との間を、行ったり来たりすることとなる。
米国特許出願公開第2007/0005356号明細書 米国特許出願公開第2007/0258648号明細書 米国特許出願公開第2008/0069456号明細書 米国特許出願公開第2006/0164664号明細書 米国特許第5,357,352号明細書 米国特許第5,363,209号明細書 米国特許第5,371,615号明細書 米国特許第5,414,538号明細書 米国特許第5,450,217号明細書 米国特許第5,450,502号明細書 米国特許第5,802,214号明細書 米国特許第5,347,374号明細書 米国特許第7,031,534号明細書
本発明は、コンテンツだけでなく様々な特徴を用いることによって、画像データセットをナビゲートするための方法、及び装置を提供することを目的とする。
本発明の実施形態の一態様によれば、画像データセットをナビゲートするためのユーザ支援方法が提供される。この方法は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴の受信し、利用可能な特徴セットからユーザが選択した第2特徴の受信する、ことを含む。この方法は、検索された画像のうちの少なくともいくつかを、グラフィカルユーザインタフェース上に同時に配列して表示することを更に含む。この画像の配列は、第1特徴のみが選択された場合、第1特徴の異なるレベルを反映する。また、この画像の配列は、第1及び第2特徴が選択された場合、ユーザが選択した第1特徴及び第2特徴のレベルの異なる組み合わせを反映する。
この方法において、前記表示することは、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に同時にグループで表示することを含んでもよい。表示された各画像グループは、ユーザが選択した第1特徴及び第2特徴のレベルの異なる組み合わせに対応する。
表示された画像グループは、選択された特徴の値に応じて順序付けされてもよい。
前記表示することは、画像グループを二次元配列で表示することを含んでもよい。第1特徴は第1次元においてレベルが上昇し、第2特徴は第2次元においてレベルが上昇する。
ディスプレイにおける各画像グループは、第1及び第2特徴の量子化値の組み合わせが、その他の各グループと異なってもよい。
この方法は、第1特徴セットから第1特徴を選択する第1セレクタと、第2特徴セットから第2特徴を選択する第2セレクタとを、グラフィカルユーザインタフェース上に表示することを含んでもよい。
第1特徴は美的特徴であり、第2特徴は感情的特徴であってもよい。
この方法は、ユーザが第3特徴セットから第3特徴を選択できるようにすることを含んでもよい。表示された画像は、第1、第2、及び第3特徴から選択された少なくとも2つに応じてグループ化されている。
特徴セットにおける各特徴に関し、異なる特徴値に対応する複数の量子化レベルが設けられると共に、画像データセットにおける各画像は、各特徴の量子化レベルのそれぞれと関連付けられる。
特徴セットにおける各特徴に関し、少なくとも3つの量子化レベルがあってもよい。
前記ユーザが選択した第1及び第2特徴の受信をもたらすことは、ユーザがグラフィカルユーザインタフェースを介して選択したものの受信をもたらすことを含んでもよい。
この方法は、ユーザが選択した画像又は画像グループに対する最も近い画像及びほぼ同じ画像のうちの少なくとも1つを検索し、この最も近い画像及びほぼ同じ画像のうちの少なくとも1つをグラフィカルユーザインタフェース上に表示する、ことを含んでもよい。
画像は、写真を含んでもよい。
この方法は、データセットにおける画像の少なくとも一部をコンテンツに応じて自動的に分類することを含んでもよい。前記テキストクエリに応答する画像を検索することは、このような画像のコンテンツ分類に基づいてもよい。
この方法は、画像を受容する収納ホルダを備えたドキュメントを、ユーザが選択した画像グループと同時に表示することを含んでもよい。ユーザは、この表示された画像グループから、収納ホルダに挿入する画像を選択することができる。
表示された画像は、格納されているデータセットにおける対応する画像から取り出されたサムネイル画像であってもよい。
前記表示することは、検索された画像の配列を表示することを含んでもよい。この配列における画像の位置は、特徴レベルの組み合わせに対応する。
コンピュータプログラム製品は、コンピュータによって実行されると上述したような方法を行う命令を符号化する有形媒体を含んでもよい。
ナビゲーションシステムは、上述したような方法を行う命令を格納するメモリと、この命令を実行するためにメモリと通じているプロセッサとを含んでもよい。
別の態様では、画像データセットをナビゲートする装置は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を関連する画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴を受信し、利用可能な特徴セットからユーザが選択した第2特徴を受信し、検索された画像を選択された特徴のレベルに基づいてグループに区分化し、検索された画像のグループのうちの少なくともいくつかを関連するグラフィカルユーザインタフェース上に表示するための、メモリに格納された命令を含む、ナビゲーションシステムを含む。メモリと通じているプロセッサが、この命令を実行する。
命令は、第1特徴セットから第1特徴を選択する第1セレクタと第2特徴セットから第2特徴を選択する第2セレクタとを表示するための命令を更に含んでもよい。
この表示するための命令は、画像グループを二次元配列で表示するための命令を含んでもよい。第1特徴は第1次元において値が上昇し、第2特徴は第2次元において値が上昇する。ディスプレイにおける各画像グループは、第1及び第2特徴値の組み合わせが、その他の各グループと異なる。
第1特徴セット及び第2特徴セットにおける各特徴に関し、異なる特徴値に対応する複数の量子化レベルが設けられると共に、画像データセットにおける各画像は、各特徴の量子化レベルのそれぞれと関連付けられてもよい。
別の態様では、ドキュメントに画像を追加する方法は、画像を受容する少なくとも1つの収納ホルダを備えたドキュメントを格納し、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索する、ことを含み、データセットにおける各画像は、コンテンツに応じて分類されると共に、特徴セットのそれぞれに対する特徴値と関連付けられる。この方法は、特徴セットからユーザが選択した第1特徴及び第2特徴を受信し、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に表示し(表示された画像は、ユーザが選択した第1及び第2特徴に応じてグループ化される)、表示された画像グループから収納ホルダのうちの1つに挿入する画像をユーザが選択できるようにする、ことを更に含む。
画像ナビゲーションシステム及び方法の一例の概要を示すブロック図である。 画像ナビゲーション装置の機能ブロック図である。 画像ナビゲーションのユーザ支援方法の一例を示すフローチャートである。 図2の装置のグラフィカルユーザインタフェースのスクリーンショットの一例を示す図であって、コンテンツベースのクエリに応答する画像を表示している。 図2の装置のグラフィカルユーザインタフェースのスクリーンショットを示す図であって、画像を区分化する2つの特徴F1及びF2の選択に従って、二次元配列で画像を表示している。 図2の装置のグラフィカルユーザインタフェースのスクリーンショットを示す図であって、図5の配列の区分のうちの1つからの画像セットと、これらの画像のうちの選択されたもので充填される隣接したテンプレートとを示している。
本発明の例示的実施形態は、画像のデータベースをナビゲートして探索するシステム、装置、及び方法に関する。このシステム、装置、及び方法では、コンテンツベースの探索技法と特徴ベースの探索とを組み合わせることができる。選択される特徴は、美的特徴及び/又は感情的特徴である。画像のデータセットをナビゲートする際、このシステムは、ユーザが、テキストクエリによって特定の意味的カテゴリ(例えば、花)を選択し、次に、この選択されたカテゴリにおいて、特徴の異なる組み合わせを用い、繰り返して少なくとも1つの画像サブセットを探査できるようにすることによって、探索空間を作成しやすくする。この例示的実施形態では、ユーザは、美的特徴(光、コントラスト、ぼやけ、色など)及び感情的特徴(例えば、感謝(appreciation)、活動)を含む特徴セットから選択することができる。
異なる細分性(クラスタ、ほぼ同じ画像(near-duplicates)の探査など)によって画像データベースをナビゲートし、適切な画像によってドキュメントドラフトを繰り返し作成するために、様々な可視化戦略(クラスタ化、モザイクなど)がユーザに提供される。
図1を参照すると、この例としてのシステム及び方法の概要が示されている。このシステム及び方法は、多数(例えば、何百、何千、又は何百万)の画像(例えば、写真画像及び/又はグラフィック画像)コレクションのような、資産を含むデータベース10に依存している。特徴抽出12では、コンテンツベースの特徴14、感情的特徴16、及び美的特徴18のうちの1つ以上に基づいて、データベース10から画像を選択することができる。探索空間作成20では、このデータベースから画像サブセットを得て、これらの画像を、特徴の組み合わせに基づいてクラスタ化して表示できるように、カテゴリ化22、クラスタ化24、及び検索26方法/コンポーネントのうちの1つ以上を用いて区分化する。可視化28では、この画像サブセットの少なくとも一部の表示を、ユーザ30が見るために生成する。
図2を参照すると、ユーザが画像データセットをナビゲートするのを支援する装置40が、デジタル処理デバイス(例えば、コンピュータ)の形態で示されている。このコンピュータ40は、デジタルプロセッサ42(例えば、コンピュータのCPU)と、これに関連付けられたメモリ(ここでは、メインメモリ44及びデータメモリ46として示されている)と、を含む。
このコンピュータ40は、入力インタフェース50及び出力インタフェース52を含み、これらのインタフェースは、結合されていても分離されていてもよい。インタフェース50は、データベース10として機能するデータメモリ46に格納されている電子データオブジェクト54(画像)のデータセットを受信する。当然のことながら、このデータベース10は、コンピュータ40から遠隔配置され、適した通信リンクによってアクセスされてもよい。データセット10における画像54の全部又は一部56は、コンテンツタグによってラベル付けされている。このコンテンツタグは、ユーザによるその画像コンテンツに関する記述及び/又はその画像に関する何らかのコメントを含んでもよい。例えば、1つの画像54は、「春の花」という記述と「3月の華やいだ我が庭」のようなコメントによってタグ付けされる。画像がテキストで囲まれている場合には、この囲んでいるテキストからコンテンツタグを取り出すことができる。自動タグ付け方法を用いて、ラベル付けされていない画像にタグを広めてもよい。
データベース10における画像54は、あらゆるファイルフォーマット(例えば、JPEG、TIFFなど)であってよい。これらの画像は、個別画像であってもビデオ画像であってもよい。通常、各デジタル画像は、その画像を形成するピクセル配列に対する画像データを含む。この画像データは、色分解セット(例えば、RGB)のそれぞれに対する色材値(例えば、グレースケール値)を含む、或いは、異なる色を表現することのできる別の色空間で表される。通常、「グレースケール」とは、どのように表されるにしても(RGB、YCbCrなど)、あらゆる単色チャネルの光学濃度値を指す。
また、インタフェース50又は別個のインタフェースは、データベース10から1つ以上の画像を受容する収納ホルダ(空間)60を備えたドキュメント58(例として、テンプレート)を受信するように構成されてもよい。
インタフェース52は、選択画像54が追加された修正ドキュメント62を出力する。
例としての入力インタフェース50及び出力インタフェース52は、有線及び無線ネットワークインタフェース(例えば、モデム)、又は、ローカルインタフェース(例えば、USBポート、ディスクドライブなど)を含む。コンピュータのこれらのコンポーネント42、44、46、50、52は、データ/制御バス64によって、通信するように相互接続されている。
グラフィカルユーザインタフェース(GUI)70は、表示画面72(例えば、カラーモニタ又は液晶ディスプレイ画面)と、テキストクエリを入力するためのユーザ入力デバイス(例えば、キーボード74、キーパッド、タッチスクリーンデバイス、カーソル制御デバイス76、音声テキスト変換器が関連付けられたマイクロホン、又はこれらの組み合わせ)と、を含む。このGUI70は、1つ以上の有線又は無線リンク78を介して、コンピュータ40と通信するように繋がれている。GUI70は、この例示的実施形態では、コンピュータ40にローカル接続されているが、別の実施形態では、クライアントコンピュータ(図示せず)に繋がれて、次に、このクライアントコンピュータが、ウェブブラウザ、有線又は無線ネットワーク、或いはその他の通信リンクを介して、コンピュータ40に繋がれてもよい。
デジタルプロセッサ42は、例えば、シングルコアプロセッサ、デュアルコアプロセッサ(又は、より一般的には、マルチコアプロセッサ)、デジタルプロセッサ及びこれと連動する数値演算コプロセッサ、デジタルコントローラなどによって、様々に実施されてよい。コンピュータ40は、1つ以上の専用又は汎用計算デバイス(例えば、サーバコンピュータ、デスクトップ若しくはラップトップコンピュータ、パームトップコンピュータ、携帯端末(PDA)、カメラ、又は、この例としての方法を行う命令を実行することのできるその他の計算デバイス)を含んでもよい。
メモリ44及び46は、分離されていても結合されていてもよく、あらゆるタイプのコンピュータ可読媒体(例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気ディスク若しくはテープ、光ディスク、フラッシュメモリ、又はホログラムメモリ)を含んでもよい。一実施形態では、これらのメモリ44及び46は、ランダムアクセスメモリと読み出し専用メモリの組み合わせから成る。
コンピュータ40は、画像ナビゲーションシステム80を実施するのに適したプログラミング及び/又はハードワイヤードファームウェアによって構成されている。この例としてのナビゲーションシステム80は、この例としての方法を行うソフトウェア命令(メモリ44に格納されてプロセッサ42によって実行される)の形態をしている。
このナビゲーションシステム80は、特徴抽出コンポーネント12、探索空間作成コンポーネント20、及び可視化コンポーネント28を含み、これらのコンポーネントはそれぞれ、(図1に示されているように)1つ以上の別個のソフトウェアツールを含んでいてもよいし、1つのツールとして結合されていてもよい。
特徴抽出コンポーネント12は、ユーザの探索要求が入力される前に、格納されている画像54を処理することができる。この例示的実施形態では、特徴抽出コンポーネント12のコンテンツ特徴抽出器14(図1)は、ラベル付けされていない画像54にコンテンツベースのタグ(意味ラベル)を付与するように訓練(trained)された分類器(又は、二値分類器セット)を含む。この訓練は、ラベル付けされた画像(例えば、データセットにおけるタグ付き画像56)から成る訓練セットに基づいてもよい。これらのラベルは、画像の分類に関する先験的情報、例えば、手動で付与された種類ラベル、を表す。厳格な二値分類では、ラベルは、例えば、オブジェクトが特定の種類に割り当てられる場合には「+1」、そうでない場合には「−1」であってもよい。寛大な二値分類では、ラベルは、例えば、その種類に入る可能性を示す範囲[0,1]内の値であってもよい。別の実施形態では、データセット10全体がコンテンツ特徴によってタグ付けされてもよく、これにより、分類器は必要でなくなる。コンテンツタグは、その画像に関連付けられたテキストコンテンツから、更に又は代わりに抽出されてもよい。
感情的特徴抽出器16は、感情に関連付けられた特徴を画像から抽出し、利用可能な感情的特徴セットのそれぞれに対する特徴値に対応して画像にラベルを付与する。
美的特徴抽出器18は、美に関連付けられた特徴を画像から抽出し、利用可能な美的特徴セットのそれぞれに対する特徴値に対応して画像にラベルを付与する。
図3を参照すると、図2の装置によって行われるコンピュータ実施方法が示されている。この方法は、S100において開始する。
S102において、画像54のデータセット10が入力され、処理中、このデータセットは、コンピュータメモリ46に格納されてもよい。
S104(特徴抽出)において、特徴(例えば、コンテンツ、美的、及び感情的特徴)が、データベースにおける各画像に対して抽出され、例えば、関連付けられたメタデータ又はその他のタグとして格納される。
S106において、GUI70を介してユーザのテキストクエリが受信され、このクエリに応答するデータセット画像のサブセット(例えば、クエリ語に対応する「コンテンツ」ラベルによってタグ付けされた画像)が検索される。
S108(探索空間作成)において、ユーザのコンテンツ選択に基づいて、探索空間が作成され、図4のスクリーンショット84に示されているように表示される。検索される全画像が、このときに表示されてもよい。
S110において、ユーザ30が選択可能な美的/感情的特徴のうちのいくつかを選択され、ユーザが選択した美的及び/又は感情的特徴が、GUI70を介して受信される。当然のことながら、このようなコンテンツ、美的、及び/又は感情的特徴の選択は、どんな順序で進められてもよい。
S112において、ユーザが選択したコンテンツ、美的、及び/又は感情的特徴に基づいて、探索空間が区分化され、これにより画像がグループ化される。画像は、ソフトウェアツール(例えば、K平均法など)のセットを用いて処理されてグループ化されてもよく、これにより、視覚的に一貫性のある探索空間が作成される。このような画像のグループ化は、以下に説明するように、ユーザが選択した特徴に応じて探索空間をクラスタ化又は区分化する、K平均法を用いて行うことができる。
S114(可視化)において、ユーザが特徴を選択することによって作成した探索空間が可視化される。探索空間を可視化するには、様々な様式(例えば、クラスタ、モザイク、又はその他のタイプのグループ)を利用してもよい。この例示的実施形態では、図5のスクリーンショット86に示されているように、可視化段階において、二次元配列されたn=9の画像グループ92、94、96(空きグループ)、98、100、102、104、106、及び108が、2つの選択された特徴に対して作成される。当然のことながら、検索画像が区分化されて表示されるグループの数nは、あらゆる適切な数(例えば、4、6、8、9、10、12、又はそれ以上)であってよい。グループの数がより多い場合には、これらのグループをカスケード表示してもよく、ユーザは、選択されたグループセットをクリックして又は別の方法で選択して見ることができる。各グループは、例えば、画面の異なる領域に配置されることによって、且つ/又は、目に見える境界線87が間に設けられることによって、その他のグループと視覚的に区別されてもよい。一実施形態では、これらのグループは単にクラスタ配列されるだけでもよく、間の境界線ははっきりとしないが、各特徴レベルの順序は互いに垂直な方向においてほぼ保たれる。3つ以上の特徴が選択される場合には、ユーザがこれらのグループを見ることのできるその他の方法(例えば、階層表示)がより適切であってもよい。
S116において、ユーザは、関心のある1つ以上の画像(後でGUIに表示される)を含むものとして、クラスタのうちの1つを選択してもよい。ユーザは、より詳しく調べるために、例えば、その画像グループ又はその画像グループが配置されている領域をクリックすることによって、画像グループのうちの1つを選択することができる。次に、この選択された画像グループが、画面の一領域に表示される。残りの画像グループは、ディスプレイから削除されてもよい。
レイアウトドラフトボタン142を選択することによって、例えば、表示された画像グループの近くで、ドキュメントテンプレート58を同時に見られるようにしてもよい。図6のスクリーンショット88に示されているように、ユーザは、表示画像のうちの選択した画像を、このテンプレート上の適切な収納ホルダ60内にドラッグアンドドロップすることができる。或いは又は更に、選択画像は、まずライトボックス110にドラッグすることができ、ユーザがこのライトボックス内の画像のうちの1つ以上をテンプレート58上にドラッグアンドドロップすることに決めるまで、このライトボックスに表示される。このライトボックス110は、より早い段階で保存された、以前のあらゆる選択画像も収容することができる。
ユーザの選択において、この方法は、ユーザが美的/感情的特徴の異なる組み合わせを選択する場合にはS110へ戻ってもよいし、新たなコンテンツ探索が入力される場合には、S106へ戻ってもよい。
S118において、ユーザは、選択グループ内に表示されている画像のうちの1つ以上に類似した画像を見たいと望んでもよい。一実施形態では、ユーザは、データベースからK個の最も近い画像(nearest neighbors)を検索するように選択するか、或いは、ほぼ同じ画像を探すように要求することができる。これらの近い画像/同じ画像は、表示グループ内の画像とは異なる基準に基づいて、データベースから選択される。このようにして、同じコンテンツベースのタグによってタグ付けされていない画像が、検索されて表示されてもよい。例えば、最も近い画像は、色ヒストグラムの類似度に基づいて検索されてもよい。その結果、コンテンツは全く異なっていたとしても、色は類似した画像が表示される。ほぼ同じ画像は、そのグループ内の1つ又は全部の画像との低レベル又は高レベル特徴の類似度に基づいて識別することができる。
K個の最も近い画像(K-nearest neighbor(KNN))を識別するには、様々な方法がある。例えば、色ヒストグラムを用いることができる。例えば、赤、緑、及び青チャネルのそれぞれの範囲は、16ビン(bin)に量子化される。画像のヒストグラムは、この量子化空間で得られる。K個の最も近い画像は、ヒストグラムの類似度に基づいて得られる。最も近い画像を識別する方法については、例えば、マシュー ギヨーマン(Matthieu Guillaumin)、外、「TagProp:画像に自動的に注釈付けするための最も近いモデルにおける識別メトリック学習(TagProp: Discriminative metric learning in nearest neighbor models for image auto-annotation)」、コンピュータビジョン国際会議(ICCV:International Conference on Computer Vision)、2009年に説明されている。
S120において、ユーザがドキュメントテンプレートに満足すると、この埋められた(filled template)テンプレート62は、例えば、プリンタ、ディスプレイ72、又はその他の出力デバイスに出力されるか、或いは、後日検索するためにメモリに格納される。ユーザが単に1つの画像又は画像セットを選択しているだけの場合、この画像は、後日検索するために特定のタグによってタグ付けされてもよいし、システムから出力されてもよい。
この方法は、S122において終了する。
この例としての方法は、1つ以上の汎用コンピュータ、専用コンピュータなどにおいて実施されてもよい。
図3に示した方法は、コンピュータにおいて実行される有形で非一時的なコンピュータプログラム製品で実施されてもよい。このコンピュータプログラム製品は、制御プログラムが記録されている有形で非一時的なコンピュータ可読記録媒体(例えば、この方法を行うように構成されたディスク、ハードドライブなど)であってもよい。
次に、この方法及び装置の様々な態様について、より詳細に説明する。
上述したように、この例としてのシステム80、方法、及びグラフィカルユーザインタフェース70は、創造的資産54のデータベース10をナビゲートして探索できるようにする。既存のシステムに勝るこのシステム80の1つの利点は、既存のコンテンツベースの探索技法と美的/感情的特徴とを組み合わせることができるという点である。ユーザは、特定の意味的カテゴリ(例えば、花)を選択し、このカテゴリにおいて、美的及び/又は感情的特徴(例えば、光、コントラスト、ぼやけ、色、感謝、活動)の異なる組み合わせを用い、繰り返して画像を探査することによって、探索空間を作成することができる。
このシステム80の例示的実施形態では、これらの特徴は、オフラインで(即ち、ユーザがクエリを出す前に)計算される。一例として、以下のような特徴が使用される。
1.コンテンツベースの特徴
この例示的実施形態では、ユーザは、意味的コンテンツに基づいて最初の探索を行い、次に、様々な特徴(例えば、画像の美又は感情)によって検索画像をブラウズすることができる。
コンテンツベースの特徴に関する種類ラベルとしては、一般的な可視オブジェクトカテゴリ(例えば、花、風景、海景、空、乗り物、人、建物、動物など)、及び/又は特定のテーマ(例えば、パーティー、結婚式、スポーツイベント、夏、冬など)が挙げられる。一実施形態では、これらの種類は、グラフィックデザイナーが関心のある特定分野に対応するように調整されてもよい。コンテンツベースの種類の数は、限定されないが、少なくとも2つであり、例えば、約5〜50、又はそれ以上であってもよい。
通常、画像コンテンツに基づいたカテゴリ化技法には、入力画像を一般的に理解される記述に変換する作業セットが含まれてもよい。高レベルコンテンツに基づいて、画像にキーワードを付与する自動化技法が開発されてきた。このような技法では、全景を解析するか又は画像内のオブジェクトに重点をおくことができる。キーワードの付与は、信頼値と関連付けられる。次に、画像は、信頼値が閾値を超えるキーワードによってラベル付けされる。
テキストベースの探索に適した画像にタグ付けする一例としては、画像表現(例えば、フィッシャー表現(Fisher representations))が、視覚的な一般分類器(generic visual classifier(GVC))によって用いられてもよく、これにより、画像は、予め定義及び訓練されたカテゴリによって自動的に注釈付けされる。
この方法では、画像のパッチセットのそれぞれに対し、低レベル画像記述子が、例えば特徴ベクトルとして抽出される。この抽出された低レベル画像記述子に基づいて、各パッチに対し、表現(例えば、フィッシャーベクトル(Fisher vector))が、例えば連結によって生成されてもよい。このパッチ表現又は低レベル画像記述子に基づいて、その画像の高レベル表現が抽出される。この例示的実施形態では、この高レベル表現は、ベクトル(例えば、フィッシャーベクトル)である。
一実施形態では、各特徴タイプに対し、ガウス混合モデル(Gaussian Mixture Models(GMM))を用いて視覚的語彙が構築される。このようなGMMを用いた特徴空間における視覚的語彙の作成は、F.ペロニン(F. Perronnin)らによる「視覚的な一般カテゴリ化に適応させた語彙(Adapted Vocabularies for Generic Visual Categorization)」(コンピュータビジョン欧州会議(ECCV:European Conference on Computer Vision)2006)に説明されている方法によって行われてもよい。ある方法では、訓練セット全体に関して広く構築された1つの視覚的語彙が用いられるが、別の実施形態では、カテゴリ特有画像を用いて、訓練セット全体に関して(普遍的に)訓練された視覚的語彙を各カテゴリに適応させることによって、性能が向上する。次に、二部ヒストグラムセット(1カテゴリに1つ)によって画像が特徴付けられ、各ヒストグラムは、その画像コンテンツが普遍的語彙又は対応するカテゴリ語彙によって最適に作成されているかどうかを説明している。特許文献1を参照されたい。
画像の高レベル表現を生成するには、例えば、特許文献1、特許文献2、特許文献3、G.チュルカ(G. Csurka)らによる「バッグオブキーポインツによる視覚的なカテゴリ化(Visual Categorization with Bag of Keypoints)」(コンピュータビジョンにおける統計学習に関するECCVワークショップ(ECCV workshop on Statistical Learning in Computer Vision)2004)、及び、F.ペロニンらによる「画像をカテゴリ化するための視覚的語彙に関するフィッシャーカーネル(Fisher kernel on visual vocabularies for image categorization)」(コンピュータビジョン及びパターン認識に関する電気電子技術者協会(IEEE:Institute of Electrical and Electronics Engineers)会議(CVPR)の会報 (Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition (CVPR))2007)に開示されているような、本明細書中で使用される様々な方法がある。上記最後のF.ペロニンらによる参照文献及び特許文献2には、フィッシャーベクトルに基づいたフィッシャーカーネル(FK)表現が説明されている。
バッグオブビジュアルワーズ(Bag-of-Visual Words(BOVW))表現では、画像は、まず視覚的ワード数のヒストグラムによって特徴付けられる。視覚的語彙は、画像の訓練セットから自動的に構築される。
これらの方法全てにおいてパッチから抽出される低レベル画像記述子は、一般的に、各パッチの様相を要約する又は特徴付ける定量値(例えば、空間周波数成分、平均輝度、色特性(カラー画像の場合)、階調度値、及び/又はその他の特性値)である。低レベル画像記述子は、関心領域(ROI:regions of interest)において局所的に抽出される。このROIは、画像をセグメント化することによって、特定関心ポイント検出器を利用することによって、規則的な格子を考慮することによって、或いは、単に画像パッチを無作為に抽出することによって、得ることができる。ある実施形態では、各パッチから少なくとも約50の低レベル画像記述子が抽出されるが、抽出することのできる画像記述子は、いずれの特定の数又はタイプにも限定されず、例えば、計算能力によっては、1000又は百万の低レベル画像記述子が抽出されてもよい。この例示的実施形態では、低レベル画像記述子は、局所的な(例えば、ピクセルの)色の統計及び/又はテクスチャを含む。色の統計に関しては、局所的なRGB統計(例えば、平均及び標準偏差)が計算されてもよい。テクスチャに関しては、(色の変化を表す)階調の向きが、各パッチに対しヒストグラム(スケール不変特徴変換(Scale Invariant Feature Transform(SIFT))のような特徴)として計算されてもよい。この例示的実施形態では、2つ(又はそれ以上)のタイプの低レベル画像記述子(例えば、色及びテクスチャ)が別々に抽出され、高レベル表現は、2つのフィッシャーベクトル(各特徴タイプに対して1つ)の組み合わせに基づいている。別の実施形態では、(ロウ(Lowe)による「局所的なスケール不変特徴からのオブジェクト認識(Object Recognition From Local Scale-Invariant Features)」(ICCV、1999)によって説明されているような)SIFT記述子が、各パッチに関して計算される。
分類器(二値分類器セットから成っていてもよい)は、画像表現(例えば、フィッシャーベクトル)及び訓練画像56のラベルに関して訓練される。一実施形態では、例えばサポートベクトルマシン(Support Vector Machine(SVM))分類器のように、機械学習分類方法が用いられる。別の実施形態では、訓練される分類器は、あらゆる識別分類器(即ち、種類境界を作成する分類器)(例えば、フィッシャーカーネル(FK)又はニューラルネットワーク)であってよい。次に、この訓練された分類器を用いて、ラベル付けされていない画像に、その画像がある種類に属する確率を表すラベルが付与される。或いは、この分類器は、このような確率値を閾値処理することによって生成されるイエス/ノー二値ラベルを付与してもよい。
この例示的実施形態では、ユーザがクエリを入力する前にコンテンツベースのタグ付けが行われるが、ユーザが例えばオンラインデータベースから画像グループを選択することによって、テキストクエリの入力後にデータセットが作られることもある、と考えられる。この場合、カテゴリに応じた画像のコンテンツベースのタグ付けは、テキストクエリが入力された後に行われてもよい。
2.感情的及び美的特徴
その他の特徴のそれぞれに関し、画像のデータセット10が量子化されてもよい(即ち、その特徴に対する値の範囲をカバーする区分セットのうちの1つに割り当てられてもよい)。所定の特徴に対する区分がそれぞれ同数の画像を収容してもよいし、或いは、特徴空間が特徴値に応じてその他の方法で区分化されてもよい。例えば、色特徴「赤」に関し、コレクションにおける全ての画像に、例えば(RGB色空間における)平均ピクセル赤色相に基づいて、赤さの値が付与される。画像が区分化される量子化レベルの数に応じて、赤さのスコアが最も高い画像が第1レベルに、次にスコアが高い画像セットが第2レベルに、というように割り当てられる。量子化レベルの数は、特徴によって異なっていてもよいし、全ての特徴に対して同じであってもよい。1つの特徴に対する量子化レベルの数は、データセットにおける画像の数及び選択可能な特徴の数に応じて、約2〜10(例えば、少なくとも3)が有用に用いられてもよい。例えば、二次元配列に関して、2つの特徴が選択される場合、各次元において3つの量子化レベルがあると、3×3の配列(9グループ)が生成される。
この例示的実施形態では、感情的又は美的概念分類器を学習する必要なく、画像データから直接的に感情的及び美的特徴が決定される。これらの感情的及び美的概念は、非常に主観的で、学習するのが困難である。このような概念による画像のタグ付けに関して強い意思決定を行うには、限界がある。従って、この例示的実施形態では、タグ付けの代わりに、感情的又は美的概念が高レベル特徴と考えられる(即ち、画像自体から抽出された低レベル特徴に基づく)。このような高レベル特徴に基づいて、画像(後で量子化される)にスコアが付与される。
この例としての方法により、美的又は感情的カテゴリ化が高精度である必要なく、或いは、異なる様相を1つの画像値にまとめる必要なく、これらの特徴の異なる組み合わせによって探索できる柔軟性が提供される。
2A.美的特徴
使用される美的特徴の例としては、明度、コントラスト、ぼやけ、色相、画像サイズなどが挙げられる。タイプによって、まず1つの特徴グループが選択可能である。例えば、全般的な特徴タイプ「色」に関し、選択可能な特徴としては、赤、青、緑などが挙げられる。画像の特徴値を量子化するには、様々な方法があり、これらの方法は、最初はピクセル色材値の分析に基づいてもよい。例えば、特許文献4を参照されたい。
美的特徴を決定する技法については、例えば、特許文献5、特許文献6、特許文献7、特許文献8、特許文献9、特許文献10、特許文献11、特許文献12、及び特許文献13に説明されており、これらの技法には、統計値(例えば、ノイズ測定量、又は、低解像度バージョンの画像に関する輝度及び色度分布)を生成することが含まれてもよい。例えば、特許文献8を参照されたい。
明度とは、画像の輝度を指す。これは、1つの画像における全ピクセルの明度値の平均である。各明度値は、ピクセルのRGBから濃淡値を算出するか、或いは、ピクセルのRGBを輝度色空間(例えば、HSV(Vの値は明度))に変換することにより、計算することができる。
コントラストとは、ダイナミックレンジの有効利用を指す。(例えば、特許文献7、及び、ヤンケ(Yan Ke)らによる「写真品質評価のための高レベル特徴の設計(The Design of High-Level Features for Photo Quality Assessment)」(CVPR06)を参照されたい。)
彩度とは、画像におけるカラーオブジェクトの鮮やかさを指す。グレーの多い色ほど、彩度が低いと見なされるのに対し、入っているグレーが非常に少ない明るい色は、彩度が高いと見なされる。色の彩度は、画像に対する感情的反応に影響を与える。このシステムは、例えば、特許文献9に説明されているように、HSV空間における色彩度値を検出して、各画像に対し量子化平均彩度値をもたらす。
画像のぼやけは、一般的には、カメラとオリジナルシーンとの相対運動又は焦点の外れた光学系によって生じる、帯域幅低減の一形態である。画像のぼやけは、ガウスフィルタ(Gaussian filter)によって画像を平滑化してぼやけた画像を得ることにより計算できる。このぼやけは、ぼやけた画像の二次元フーリエ変換を閾値処理することによって得られる画像の最大周波数に比例する。例えば、上記ヤンケらによる「写真品質評価のための高レベル特徴の設計」(CVPR06)を参照されたい。
色相とは、目が検出する色の第1特性を指す。色相は、ピクセルのRGB値をHSVに変換した後の、ピクセルのHSV色空間表現におけるHの値と考えられる。
画像サイズとは、1つの画像におけるピクセルの数を指す。画像サイズは、1つの画像のピクセル幅とピクセル高さとをかけることによって計算される。
露出量とは、写真の撮影中にカメラセンサに当たる光の量を指す。露出量は、明度と同じであると考えられる。
例えば、画像のダイナミクス、遠近感、及びコンポジションのような、他の特徴が考えられる。
2B.感情的特徴
感情的特徴の例としては、感謝及び活動が挙げられる。
一実施形態では、色と感情との関係を利用することによって、画像をその主色に基づいた様々な感情的特徴に応じて量子化することができる(例えば、L.C.ウー(L.C. Ou)らによる「色の感情及び色の好みの研究(A study of colour emotion and colour preference)」(カラーリサーチアンドアプリケーション(COLOR research and application)29、2004、p.232〜240)、M.ソリー(M. Solli)及びR.レンツ(R. Lenz)による「カラー画像検索における感情的満足(Emotional Satisfaction In Color Image Retrieval)」(画像解析に関するスウェーデンシンポジウム2008会報(Proc. Swedish Symposium on Image Analysis 2008)、並びに、M.ソリー及びR.レンツによる「画像の分類及び検索に対する色の感情(Color Emotions for Image Classification and Retrieval)」(グラフィックス、イメージング、及びビジョンにおける色に関する会議(CGIV:Conference on Colour in Graphics, Imaging and Vision)2008)参照)。
別の実施形態では、画像のあらゆる人々の顔の表情が、様々な感情的特徴(例えば、嬉しい/悲しい、怒った/落ち着いた、など)に応じて識別されて量子化される(例えば、B.ファゼル(B. Fasel)及びJ.ルーティン(J. Luettin)による「顔の表情の自動解析:概説(Automatic Facial Expression Analysis: a survey)」(パターン認識(Pattern Recognition)第36巻、p.259〜275、2003)、並びに、M.パンティック(M. Pantic)及びL.J.M ロスクランツ(L. J. M Rothkrantz)による「顔の表情を自動解析するエキスパートシステム(Expert system for automatic analysis of facial expressions)」(エルゼビア(ELSEVIER)社、イメージアンドビジョンコンピューティング(Image and Vision Computing)第18巻、p.881〜905、2000)参照)。
(例えば、テレゲン−ワトソン−クラークモデル(Tellegen-Watson-Clark model)を用いる)別の実施形態では、複数の感情的特徴のそれぞれに対して個別の分類器モデルが訓練され、各特徴は、ラベル付けされたデータセットのタグ及び画像から抽出された記述子を用いて、1組の相反する感情(愉快−不愉快、従事(engagement)−解放(disengagement)など)を表す。訓練された分類器は、各特徴に対するスコアを各画像に出力する(例えば、各特徴に対する量子化値又は順位をデータセットにおける画像に付与する)ことができ、このスコアを用いることによって画像をグループ化することができる。
別の方法では、標準的な低レベル特徴(色、ガボール特徴(Gabor features)、SIFT特徴)を用いることによって、手動で注釈付けされたデータから感情を予測することができる。
可視化
付与されたコンテンツ、美的、及び感情的特徴に基づいて、ユーザは、特徴を単独で又は組み合わせて選択することにより、探索空間を作成することができる。表示される画像グループの数は、選択される各特徴の量子化レベル及び選択される特徴の数によって決まる。
一般的な探索ワークフローは、(1)1つ以上の特徴(例えば、コンテンツ、コンテンツ+美的など)を用いて、探索空間を作成し(S108)、(2)この探索空間を他の特徴に基づいて大まかに再編成することによって、視覚的一貫性を高め(S112)と、(3)ほぼ同じ画像又は最も近い画像を可視化することによって、的を絞って探索空間を探査すること(S118)と、を含んでもよい。
ブラウジング処理を容易にするため、この例としてのシステム80は、(例えば、テキスト探索クエリの結果の)探索空間を、異なる組み合わせ及び異なる数の特徴で絞り込むことができる。例えば、ユーザが、見る人に好感を与える青空の画像を探索している場合、テキストクエリ「空」と2つの特徴「青」及び「感謝」を選択すると、空の画像が検索されて視覚的に一貫するように表示される。更に、この例としてのユーザインタフェースは、創造的資産のナビゲーションを容易にするだけでなく、(最終的に画像収納ホルダを含む)作業ドラフトドキュメントと代わりの選択画像とを「組み合わせて」可視化することにより視覚的コンテンツの作成も支援する。
この例示的実施形態の範囲を限定するよう意図することなく、以下の実施例は、ドキュメントを作成するための、このシステム80の一使用法を説明する。
図4を参照すると、データセット10における画像は、最大350のサムネイル画像(データベースに格納されているオリジナル画像から生成される、ピクセル解像度を下げた且つ/又は切り取られた画像であってもよい)が同じページに提示されるように、コンパクトに可視化されて提示される。ユーザは、まず、探索ボックス120にキーワードを入力するか、或いは、メニュー(例えば、GUIに表示されるドロップダウンメニュー)からキーワードを選択することによって、テキストクエリを入力する。次に、コンテンツ探索空間が生成される。例えば、図4に示されているように、ユーザは、テキスト入力ボックス120に探索クエリ(例えば、「花」)を入力し、セレクタ122を用いて、検索する画像の数(例えば、150)を選択することができる。分類器が確率的なものである場合、このシステム80は、花の画像である確率が最も高く付与された150の画像を検索して、これらの画像をGUIディスプレイ72に表示する。例えば、図4は、テキストクエリ「花」によって得られた画像サブセットの一部を示している。
例えば、検索した数が、ディスプレイ上で一度にすぐに見られる数より多い場合、ユーザは、スクロールバー124を用いて、検索した画像セット全体をスクロールダウンすることができる。
クエリを絞り込むため、ユーザは、複数の特徴セレクタ126、128、130のうちの1つ以上を作動させることにより、美的及び感情的特徴から選択することができる。ユーザは、例えば、赤の色特徴を用いて画像をグループ化することに決め、色特徴セレクタ126を用いて赤の色特徴を選択してもよい。赤の色特徴によって赤さが高いものから低いものへ減少順に一次元において仕分けされた画像グループは、GUI上に、例えば、左から右へ且つ/又は上から下へ、同時に表示される。この例示的実施形態では、6つのグループが同時に配列表示される。
次に、ユーザは、第2の特徴(例えば、別の美的特徴)を追加することに決め、例えば、美的特徴セレクタ128を用いて明度特徴を選択してもよい。図5のスクリーンショット86に示されているように、二次元において(即ち、明度の美的特徴F1で横に且つ赤の色特徴F2で縦に)仕分けされた画像グループが、GUIディスプレイ72に同時に表示される。特徴F2も選択されている場合には、表示グループを適切な数に維持するため、特徴F1の量子化レベルは自動的に削減されてもよい。例えば、データベースにおける画像がラベル付けされている第1の特徴に対して6つの量子化レベルがある場合、隣接した量子化レベルの組を合わせて、3つの量子化レベルにしてもよい。
図5から明らかであるように、ディスプレイの各領域は、異なる画像グループを示しており、各グループは、選択された第1及び第2の特徴の量子化レベルの異なる組み合わせに対応している。従って、選択された特徴の量子化レベルに当てはまる画像が、ディスプレイの適切な領域に表示される。この例としての配列では、左から右へ且つ上から下へ特徴値の高い順になっており、即ち、最も赤くて明るい画像が左上のグループ92にあり、最も赤くなくて明るくない画像が右下のグループ108にある。例えば、ディスプレイの左上にある領域132は、赤さの量子化レベルが1で明度の量子化レベルが1である(即ち、赤さが高く明度が高い)画像を含む。全ての領域に画像が含まれるわけではない。例えば、領域134は、データベース10におけるカテゴリ「花」に、特徴「明度」の量子化レベルが3で特徴「赤さ」の量子化レベルが1である画像がないため、空いている。図4に示されている画像に関し、1グループに多くの画像がありすぎて一度に表示できない場合には、画像グループを個別にスクロールすることができる。
この例示的実施形態では、一度に最大1つの色特徴(例えば、赤、緑、及び青のうちの1つ)を選択することができる。第2の特徴に関しては、別の美的特徴或いは感情的特徴を選択することができる。
次に、例えば、感情的特徴セレクタ130を用いて、第3の特徴を選択し、三次元配列又はその適切な二次元表現を生成してもよい。或いは、ユーザは、第1及び第2の特徴の一方又は両方を変更して二次元表示を変更することに決めてもよい。
ユーザは、画像グループが分けて示されるのではなく、選択された特徴を反映するように単純に順序付けされる(例えば、最も赤い画像が配列の左上にあるグループにクラスタ化され、最も明るくない画像が右下にあるグループにクラスタ化され、グループ間の境界線は表示されない)よう、要求することができる。ユーザは、順序セレクタ136をクリックして、画像をこのように表示させることができる。当然のことながら、これらの画像は、特徴(例えば、「赤さ」及び「コントラスト」)の様々な組み合わせによって、容易にグループ化して順序付けすることができる。
次に、ユーザは、表示されたグループのうちの1つにおける画像の色及び明度が特定のドキュメントに対して適切であると判断し、そのグループをクリックする(クリックすると、そのグループがディスプレイに表示される)。ユーザは、ライトボックスアイコン138をクリックして、ライトボックス110を呼び出してもよく、このライトボックス110の中には、選択画像のうちの選択されたものを最終選択の候補画像としてドラッグして入れることができる。ユーザは、レイアウトドラフトセレクタボタン142をクリックすることができ、これにより、ディスプレイに表示されるドキュメント58にアクセスできるようになる(図6)。スクリーンショット88に示されているように、選択された画像グループ、ライトボックス110、及びドキュメントテンプレート58が同時に表示される。ユーザは、最も近い画像/同じ画像セレクタ146をクリックすることによって、最も近い画像又はほぼ同じ画像が表示されるよう選択することができる。或いは、このような最も近い画像/ほぼ同じ画像は、画像のうちの選択されたものをクリックすることによって検索されてもよい。
ユーザは、画像のうちの選択されたものを(例えば、ライトボックス110から)ドキュメント58上にドラッグアンドドロップして、その画像がデザインニーズを満たすかどうか確かめてもよい。この選択画像54は、より早い段階で保存された、以前のあらゆる選択画像を収容する、ドキュメントテンプレート58に追加される。ユーザは、より多くの画像を探すためにこの処理を1回以上繰り返した後、レイアウトドラフトセレクタ142をクリックして、図2及び図6に示されているような埋められたドキュメント62の完成を確認してもよい。
テキスト探索クエリに依存した既存の探索方法に対し、このシステムは、クエリをパラメータ化することによって探索を絞り込むことができる。例えば、ユーザは、明度及び/又は赤さのレベルを設定することができる。また、探索結果の視覚的一貫性が高く、探索空間の探査が非常に簡単であるため、ユーザは、関心のある画像が最もありそうなグループだけを選択して、そのグループにおける画像のサムネイルをスクロールするか、或いは、その選択された画像グループでディスプレイを満たすことができる。ユーザが特定のサムネイルに関心がある場合、対応する画像がその最も近い画像と共に表示される。
このナビゲーションシステムは、選択された美的、色、及び感情的特徴によって導かれる非常に大きな画像データベースをナビゲートするインタフェースを、グラフィックデザイナーに提供する。
64 データ/制御バス
70 GUI
72 表示画面
76 カーソル制御デバイス
78 リンク
84、86、88 スクリーンショット
87 境界線
110 ライトボックス
120 探索ボックス
122、126、128、130、136、138、142、146 セレクタ
124 スクロールバー
132、134 領域

Claims (4)

  1. 画像データセットのナビゲートにおいてユーザ支援方法であって、
    前記ユーザのテキストクエリを受信し、
    前記テキストクエリに応答する画像を、画像データセットから検索し、
    利用可能な特徴のセットから前記ユーザが選択した第1特徴を受信し、
    前記利用可能な特徴のセットから前記ユーザが選択した第2特徴を受信し、
    検索された前記画像のうちの少なくともいくつかを、グラフィカルユーザインタフェース上に同時に配列して表示する、
    ことを含む、方法であって、
    前記画像の配列は、第1特徴のみが選択された場合、前記第1特徴の異なるレベルを反映し、第1特徴及び第2特徴が選択された場合、前記ユーザが選択した前記第1及び第2特徴のレベルの異なる組み合わせを反映する、
    方法。
  2. 前記表示することは、検索された前記画像のうちの少なくともいくつかを、前記グラフィカルユーザインタフェース上に同時にグループで表示することを含み、表示された前記各画像グループは、前記ユーザが選択した前記第1特徴及び第2特徴のレベルの異なる組み合わせに対応する、請求項1に記載の方法。
  3. コンピュータに、請求項1に記載の方法を実行させるためのプログラム。
  4. 画像データセットをナビゲートするための装置であって、
    ユーザのテキストクエリを受信し、
    前記クエリに応答する画像を、関連する画像データセットから検索し、
    利用可能な特徴セットから前記ユーザが選択した第1特徴を受信し、
    前記利用可能な特徴セットから前記ユーザが選択した第2特徴を受信し、
    検索された前記画像のうちの少なくともいくつかを、関連するグラフィカルユーザインタフェース上に表示し、表示された前記画像が、選択された前記第1及び第2特徴のレベルに応じてグループ化する、
    ためのメモリに格納された命令を含む、ナビゲーションシステムと、
    前記命令を実行するための、前記メモリと通じているプロセッサと、
    を備える、装置。
JP2011012909A 2010-01-26 2011-01-25 画像データセットをナビゲートするための方法、装置、及びプログラム Pending JP2011154687A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/693,795 US8775424B2 (en) 2010-01-26 2010-01-26 System for creative image navigation and exploration
US12/693,795 2010-01-26

Publications (1)

Publication Number Publication Date
JP2011154687A true JP2011154687A (ja) 2011-08-11

Family

ID=44279036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011012909A Pending JP2011154687A (ja) 2010-01-26 2011-01-25 画像データセットをナビゲートするための方法、装置、及びプログラム

Country Status (4)

Country Link
US (1) US8775424B2 (ja)
JP (1) JP2011154687A (ja)
DE (1) DE102011003201A1 (ja)
FR (1) FR2955681A1 (ja)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013136637A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
JP2013206470A (ja) * 2012-03-27 2013-10-07 Fujitsu Ltd 画像のラベル付け方法と装置
JP2014175733A (ja) * 2013-03-06 2014-09-22 Nikon Corp 画像再生装置および画像再生プログラム
JP2015036684A (ja) * 2013-08-09 2015-02-23 ゼロックス コーポレイションXerox Corporation フィッシャー及びプロファイル署名を使用したレーザスキャナからの車両分類
JP2017522660A (ja) * 2014-06-26 2017-08-10 アマゾン テクノロジーズ インコーポレイテッド 色パレットを使用した自動的な画像ベースの推奨
KR20180041401A (ko) * 2016-10-14 2018-04-24 에스케이텔레콤 주식회사 동영상 생성 장치 및 방법
US9996579B2 (en) 2014-06-26 2018-06-12 Amazon Technologies, Inc. Fast color searching
US10049466B2 (en) 2014-06-26 2018-08-14 Amazon Technologies, Inc. Color name generation from images and color palettes
US10073860B2 (en) 2014-06-26 2018-09-11 Amazon Technologies, Inc. Generating visualizations from keyword searches of color palettes
US10120880B2 (en) 2014-06-26 2018-11-06 Amazon Technologies, Inc. Automatic image-based recommendations using a color palette
JP2018536248A (ja) * 2015-10-05 2018-12-06 ピンタレスト,インコーポレイテッド 動的検索入力選択
US10169803B2 (en) 2014-06-26 2019-01-01 Amazon Technologies, Inc. Color based social networking recommendations
US10186054B2 (en) 2014-06-26 2019-01-22 Amazon Technologies, Inc. Automatic image-based recommendations using a color palette
US10223427B1 (en) 2014-06-26 2019-03-05 Amazon Technologies, Inc. Building a palette of colors based on human color preferences
US10235389B2 (en) 2014-06-26 2019-03-19 Amazon Technologies, Inc. Identifying data from keyword searches of color palettes
US10242396B2 (en) 2014-06-26 2019-03-26 Amazon Technologies, Inc. Automatic color palette based recommendations for affiliated colors
US10255295B2 (en) 2014-06-26 2019-04-09 Amazon Technologies, Inc. Automatic color validation of image metadata
US10402917B2 (en) 2014-06-26 2019-09-03 Amazon Technologies, Inc. Color-related social networking recommendations using affiliated colors
US10430857B1 (en) 2014-08-01 2019-10-01 Amazon Technologies, Inc. Color name based search
US10691744B2 (en) 2014-06-26 2020-06-23 Amazon Technologies, Inc. Determining affiliated colors from keyword searches of color palettes
US10831819B2 (en) 2014-09-02 2020-11-10 Amazon Technologies, Inc. Hue-based color naming for an image
US11055343B2 (en) 2015-10-05 2021-07-06 Pinterest, Inc. Dynamic search control invocation and visual search
US11126653B2 (en) 2017-09-22 2021-09-21 Pinterest, Inc. Mixed type image based search results
US11841735B2 (en) 2017-09-22 2023-12-12 Pinterest, Inc. Object based image search

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8463053B1 (en) 2008-08-08 2013-06-11 The Research Foundation Of State University Of New York Enhanced max margin learning on multimodal data mining in a multimedia database
US9554111B2 (en) 2010-03-08 2017-01-24 Magisto Ltd. System and method for semi-automatic video editing
US9502073B2 (en) 2010-03-08 2016-11-22 Magisto Ltd. System and method for semi-automatic video editing
US9189137B2 (en) * 2010-03-08 2015-11-17 Magisto Ltd. Method and system for browsing, searching and sharing of personal video by a non-parametric approach
US8948515B2 (en) 2010-03-08 2015-02-03 Sightera Technologies Ltd. Method and system for classifying one or more images
US8675957B2 (en) 2010-11-18 2014-03-18 Ebay, Inc. Image quality assessment to merchandise an item
US20120254790A1 (en) * 2011-03-31 2012-10-04 Xerox Corporation Direct, feature-based and multi-touch dynamic search and manipulation of image sets
US8774515B2 (en) 2011-04-20 2014-07-08 Xerox Corporation Learning structured prediction models for interactive image labeling
US9495698B2 (en) * 2011-06-01 2016-11-15 Theodore Michael Evers Continuum-based selection of product choice
US8813111B2 (en) 2011-08-22 2014-08-19 Xerox Corporation Photograph-based game
US8533204B2 (en) 2011-09-02 2013-09-10 Xerox Corporation Text-based searching of image data
US8699789B2 (en) 2011-09-12 2014-04-15 Xerox Corporation Document classification using multiple views
US8903182B1 (en) * 2012-03-08 2014-12-02 Google Inc. Image classification
US8666992B2 (en) 2012-06-15 2014-03-04 Xerox Corporation Privacy preserving method for querying a remote public service
US20130346920A1 (en) * 2012-06-20 2013-12-26 Margaret E. Morris Multi-sensorial emotional expression
US9014509B2 (en) * 2012-06-29 2015-04-21 Intellectual Ventures Fund 83 Llc Modifying digital images to increase interest level
US9014510B2 (en) * 2012-06-29 2015-04-21 Intellectual Ventures Fund 83 Llc Method for presenting high-interest-level images
US8873812B2 (en) 2012-08-06 2014-10-28 Xerox Corporation Image segmentation using hierarchical unsupervised segmentation and hierarchical classifiers
US8879796B2 (en) 2012-08-23 2014-11-04 Xerox Corporation Region refocusing for data-driven object localization
US20150278298A1 (en) * 2012-11-06 2015-10-01 Nokia Corporation Apparatus and method for displaying image-based representations of geographical locations in an electronic text
US20140164988A1 (en) * 2012-12-06 2014-06-12 Microsoft Corporation Immersive view navigation
US9008429B2 (en) 2013-02-01 2015-04-14 Xerox Corporation Label-embedding for text recognition
US8879103B2 (en) 2013-03-04 2014-11-04 Xerox Corporation System and method for highlighting barriers to reducing paper usage
US10187667B1 (en) 2013-03-15 2019-01-22 Cox Communications, Inc. Simultaneously optimizing transport bandwidth and client device performance
US9582610B2 (en) * 2013-03-15 2017-02-28 Microsoft Technology Licensing, Llc Visual post builder
CN103268338B (zh) * 2013-05-16 2016-03-30 北京京东尚科信息技术有限公司 一种提供图像的方法和服务器装置以及终端装置
US9874749B2 (en) 2013-11-27 2018-01-23 Magic Leap, Inc. Virtual and augmented reality systems and methods
US9439565B1 (en) * 2013-07-08 2016-09-13 Dermatopathology Laboratory of Central States, Inc. Wireless viewing of digital pathology specimens
US9082047B2 (en) 2013-08-20 2015-07-14 Xerox Corporation Learning beautiful and ugly visual attributes
US9412031B2 (en) 2013-10-16 2016-08-09 Xerox Corporation Delayed vehicle identification for privacy enforcement
US9235602B2 (en) * 2013-10-25 2016-01-12 Parham Aarabi Method, system and computer program for interactive spatial link-based image searching, sorting and/or displaying
US10386993B2 (en) * 2013-12-03 2019-08-20 Autodesk, Inc. Technique for searching and viewing video material
US9779284B2 (en) 2013-12-17 2017-10-03 Conduent Business Services, Llc Privacy-preserving evidence in ALPR applications
US9443169B2 (en) 2014-02-21 2016-09-13 Xerox Corporation Object classification with constrained multiple instance support vector machine
US9158971B2 (en) 2014-03-03 2015-10-13 Xerox Corporation Self-learning object detectors for unlabeled videos using multi-task learning
US9734869B2 (en) * 2014-03-11 2017-08-15 Magisto Ltd. Method and system for automatic learning of parameters for automatic video and photo editing based on user's satisfaction
KR102316846B1 (ko) * 2014-04-09 2021-10-25 삼성전자 주식회사 미디어 컨텐츠를 선별하는 방법 및 이를 구현하는 전자장치
US9639806B2 (en) 2014-04-15 2017-05-02 Xerox Corporation System and method for predicting iconicity of an image
US10409822B2 (en) 2014-05-06 2019-09-10 Shutterstock, Inc. Systems and methods for presenting ranked search results
JP2017532925A (ja) * 2014-09-12 2017-11-02 ティーエムエム,インコーポレイティド サブジェクト指向圧縮システムおよび方法
US9697439B2 (en) 2014-10-02 2017-07-04 Xerox Corporation Efficient object detection with patch-level window processing
WO2016053342A1 (en) * 2014-10-02 2016-04-07 Hewlett-Packard Development Company, L.P. Intent based clustering
US9443164B2 (en) 2014-12-02 2016-09-13 Xerox Corporation System and method for product identification
JP6419560B2 (ja) * 2014-12-05 2018-11-07 株式会社東芝 検索装置、方法及びプログラム
US9216591B1 (en) 2014-12-23 2015-12-22 Xerox Corporation Method and system for mutual augmentation of a motivational printing awareness platform and recommendation-enabled printing drivers
US9367763B1 (en) 2015-01-12 2016-06-14 Xerox Corporation Privacy-preserving text to image matching
US9626594B2 (en) 2015-01-21 2017-04-18 Xerox Corporation Method and system to perform text-to-image queries with wildcards
US10509800B2 (en) * 2015-01-23 2019-12-17 Hewlett-Packard Development Company, L.P. Visually interactive identification of a cohort of data objects similar to a query based on domain knowledge
US10152804B2 (en) * 2015-02-13 2018-12-11 Smugmug, Inc. System and method for dynamic color scheme application
US10180734B2 (en) 2015-03-05 2019-01-15 Magic Leap, Inc. Systems and methods for augmented reality
CN107533233B (zh) 2015-03-05 2021-01-29 奇跃公司 用于增强现实的系统和方法
US10838207B2 (en) 2015-03-05 2020-11-17 Magic Leap, Inc. Systems and methods for augmented reality
US9600738B2 (en) 2015-04-07 2017-03-21 Xerox Corporation Discriminative embedding of local color names for object retrieval and classification
CN104794220A (zh) * 2015-04-28 2015-07-22 百度在线网络技术(北京)有限公司 信息搜索方法和信息搜索装置
US10249061B2 (en) 2015-11-11 2019-04-02 Adobe Inc. Integration of content creation and sharing
US10783431B2 (en) * 2015-11-11 2020-09-22 Adobe Inc. Image search using emotions
US10389804B2 (en) 2015-11-11 2019-08-20 Adobe Inc. Integration of content creation and sharing
US10198590B2 (en) 2015-11-11 2019-02-05 Adobe Inc. Content sharing collections and navigation
AU2016365422A1 (en) * 2015-12-04 2018-06-28 Magic Leap, Inc. Relocalization systems and methods
EP3405932A1 (en) * 2016-01-29 2018-11-28 KiwiSecurity Software GmbH Methods and apparatus for using video analytics to detect regions for privacy protection within images from moving cameras
US9852361B1 (en) 2016-02-11 2017-12-26 EMC IP Holding Company LLC Selective image backup using trained image classifier
US9846840B1 (en) * 2016-05-25 2017-12-19 Adobe Systems Incorporated Semantic class localization in images
CN117741956A (zh) 2016-08-02 2024-03-22 奇跃公司 固定距离虚拟和增强现实系统及方法
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US11004131B2 (en) 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11176189B1 (en) * 2016-12-29 2021-11-16 Shutterstock, Inc. Relevance feedback with faceted search interface
US11036764B1 (en) * 2017-01-12 2021-06-15 Parallels International Gmbh Document classification filter for search queries
US10812936B2 (en) 2017-01-23 2020-10-20 Magic Leap, Inc. Localization determination for mixed reality systems
AU2018236457B2 (en) 2017-03-17 2021-04-29 Magic Leap, Inc. Mixed reality system with virtual content warping and method of generating virtual content using same
IL303275B1 (en) 2017-03-17 2024-04-01 Magic Leap Inc A mixed reality system with the assembly of multi-source virtual content and a method for creating virtual content using it
CA3055218A1 (en) 2017-03-17 2018-09-20 Magic Leap, Inc. Mixed reality system with color virtual content warping and method of generating virtual content using same
US10846328B2 (en) * 2017-05-18 2020-11-24 Adobe Inc. Digital asset association with search query data
US10942966B2 (en) 2017-09-22 2021-03-09 Pinterest, Inc. Textual and image based search
CN107993125A (zh) * 2017-11-29 2018-05-04 重庆猪八戒网络有限公司 基于多级细化的创意设计交易孵化系统及方法
JP7159608B2 (ja) * 2018-05-14 2022-10-25 コニカミノルタ株式会社 操作画面の表示装置、画像処理装置及びプログラム
CN117711284A (zh) 2018-07-23 2024-03-15 奇跃公司 场顺序显示器中的场内子码时序
EP3827299A4 (en) 2018-07-23 2021-10-27 Magic Leap, Inc. SYSTEM OF MIXED REALITY WITH VIRTUAL CONTENT DISTORTION AND PROCESS FOR GENERATING VIRTUAL CONTENT WITH IT
US11157549B2 (en) * 2019-03-06 2021-10-26 International Business Machines Corporation Emotional experience metadata on recorded images
JP7243333B2 (ja) * 2019-03-15 2023-03-22 富士通株式会社 情報処理方法、情報処理プログラム、および情報処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249352A (ja) * 1995-03-15 1996-09-27 Omron Corp 画像検索方法及び装置
JPH11175535A (ja) * 1997-12-08 1999-07-02 Hitachi Ltd 画像検索方法およびその装置およびこれを利用した検索サービス
JP2003006227A (ja) * 2001-06-26 2003-01-10 Barbalogue Kk 特徴量座標による情報検索方法、情報検索装置及び情報検索プログラム
US20070192698A1 (en) * 2006-02-06 2007-08-16 Samsung Electronics Co., Ltd. Apparatus and method of browsing contents
JP2008181460A (ja) * 2007-01-26 2008-08-07 Ricoh Co Ltd 文書画像検索装置および文書画像検索方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US540217A (en) 1895-05-28 pescheux
JP3234064B2 (ja) * 1993-09-02 2001-12-04 キヤノン株式会社 画像検索方法並びにその装置
US5357352A (en) * 1993-10-04 1994-10-18 Xerox Corporation Image-dependent color shifting of strongly color shifted images
US5414538A (en) * 1993-10-07 1995-05-09 Xerox Corporation Image-dependent exposure enhancement
US5450502A (en) * 1993-10-07 1995-09-12 Xerox Corporation Image-dependent luminance enhancement
US5371615A (en) * 1993-10-22 1994-12-06 Xerox Corporation Image-dependent color correction using black point and white point in a natural scene pictorial image
US5363209A (en) * 1993-11-05 1994-11-08 Xerox Corporation Image-dependent sharpness enhancement
US5347374A (en) * 1993-11-05 1994-09-13 Xerox Corporation Cascaded image processing using histogram prediction
US5450217A (en) * 1994-05-23 1995-09-12 Xerox Corporation Image-dependent color saturation correction in a natural scene pictorial image
US5802214A (en) * 1995-12-08 1998-09-01 Xerox Corporation Method for determining and loading an image-dependent look-up table for generating an enhanced image representation
US5899999A (en) * 1996-10-16 1999-05-04 Microsoft Corporation Iterative convolution filter particularly suited for use in an image classification and retrieval system
US6121969A (en) * 1997-07-29 2000-09-19 The Regents Of The University Of California Visual navigation in perceptual databases
US6594383B1 (en) * 1999-11-16 2003-07-15 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an images database based on a color query
JP3676259B2 (ja) * 2000-05-26 2005-07-27 エルジー電子株式会社 Hmmdカラースペースに基づいたカラー量子化方法とマルチメディア
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
SE524007C2 (sv) * 2000-11-24 2004-06-15 Comintell Holding Ab Sökmotor samt ett förfarande för en sökmotor där sökresultatet presenteras i en matris
JP4527322B2 (ja) * 2001-07-25 2010-08-18 日本電気株式会社 画像検索装置、画像検索方法、及び画像検索用プログラム
US7031534B2 (en) * 2001-10-31 2006-04-18 Xerox Corporation Enhancement of compressed image data
US7383499B2 (en) * 2004-12-30 2008-06-03 Microsoft Corporation System and method for dynamically creating a destination template
US7756341B2 (en) * 2005-06-30 2010-07-13 Xerox Corporation Generic visual categorization method and system
US7680341B2 (en) * 2006-05-05 2010-03-16 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
US20080046424A1 (en) * 2006-06-23 2008-02-21 Horton Richard B System and method of selecting images according to color content
US20080046410A1 (en) * 2006-08-21 2008-02-21 Adam Lieb Color indexing and searching for images
US7885466B2 (en) * 2006-09-19 2011-02-08 Xerox Corporation Bags of visual context-dependent words for generic visual categorization
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images
US20080240572A1 (en) * 2007-03-26 2008-10-02 Seiko Epson Corporation Image Search Apparatus and Image Search Method
US7898696B2 (en) * 2007-05-09 2011-03-01 Xerox Corporation Print job aesthetics enhancements detection and modeling through combined user activity analysis and content matching
US7933454B2 (en) * 2007-06-25 2011-04-26 Xerox Corporation Class-based image enhancement system
US7885794B2 (en) * 2007-11-30 2011-02-08 Xerox Corporation Object comparison, retrieval, and categorization methods and apparatuses
US8009921B2 (en) * 2008-02-19 2011-08-30 Xerox Corporation Context dependent intelligent thumbnail images
US8340452B2 (en) * 2008-03-17 2012-12-25 Xerox Corporation Automatic generation of a photo guide
US8190604B2 (en) * 2008-04-03 2012-05-29 Microsoft Corporation User intention modeling for interactive image retrieval
US8285059B2 (en) * 2008-05-20 2012-10-09 Xerox Corporation Method for automatic enhancement of images containing snow
US8094947B2 (en) * 2008-05-20 2012-01-10 Xerox Corporation Image visualization through content-based insets
US20090313239A1 (en) * 2008-06-16 2009-12-17 Microsoft Corporation Adaptive Visual Similarity for Text-Based Image Search Results Re-ranking
US8194992B2 (en) * 2008-07-18 2012-06-05 Xerox Corporation System and method for automatic enhancement of seascape images
WO2010151255A1 (en) * 2009-06-24 2010-12-29 Hewlett-Packard Development Company, L.P. Image album creation
US20110029860A1 (en) * 2009-07-30 2011-02-03 Ptucha Raymond W Artistic digital template for image display

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249352A (ja) * 1995-03-15 1996-09-27 Omron Corp 画像検索方法及び装置
JPH11175535A (ja) * 1997-12-08 1999-07-02 Hitachi Ltd 画像検索方法およびその装置およびこれを利用した検索サービス
JP2003006227A (ja) * 2001-06-26 2003-01-10 Barbalogue Kk 特徴量座標による情報検索方法、情報検索装置及び情報検索プログラム
US20070192698A1 (en) * 2006-02-06 2007-08-16 Samsung Electronics Co., Ltd. Apparatus and method of browsing contents
JP2007213574A (ja) * 2006-02-06 2007-08-23 Samsung Electronics Co Ltd コンテンツ検索方法および装置
JP2008181460A (ja) * 2007-01-26 2008-08-07 Ricoh Co Ltd 文書画像検索装置および文書画像検索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200900623017; 長田 茂美: 'パラのミック検索モデルに基づくインタラクティブなマルチメディア検索/マイニングシステム"MIRACL' 電子情報通信学会論文誌(J92-D) 第J92-D巻,第11号, 20091101, page 1987-1999, 社団法人電子情報通信学会 *
JPN6014021774; 長田 茂美: 'パラのミック検索モデルに基づくインタラクティブなマルチメディア検索/マイニングシステム"MIRACL' 電子情報通信学会論文誌(J92-D) 第J92-D巻,第11号, 20091101, page 1987-1999, 社団法人電子情報通信学会 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013136637A1 (ja) * 2012-03-14 2013-09-19 パナソニック株式会社 コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
JPWO2013136637A1 (ja) * 2012-03-14 2015-08-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America コンテンツ表示処理装置、コンテンツ表示処理方法、プログラム、及び集積回路
JP2013206470A (ja) * 2012-03-27 2013-10-07 Fujitsu Ltd 画像のラベル付け方法と装置
JP2014175733A (ja) * 2013-03-06 2014-09-22 Nikon Corp 画像再生装置および画像再生プログラム
JP2015036684A (ja) * 2013-08-09 2015-02-23 ゼロックス コーポレイションXerox Corporation フィッシャー及びプロファイル署名を使用したレーザスキャナからの車両分類
US10402917B2 (en) 2014-06-26 2019-09-03 Amazon Technologies, Inc. Color-related social networking recommendations using affiliated colors
US10169803B2 (en) 2014-06-26 2019-01-01 Amazon Technologies, Inc. Color based social networking recommendations
US9996579B2 (en) 2014-06-26 2018-06-12 Amazon Technologies, Inc. Fast color searching
US10049466B2 (en) 2014-06-26 2018-08-14 Amazon Technologies, Inc. Color name generation from images and color palettes
US10073860B2 (en) 2014-06-26 2018-09-11 Amazon Technologies, Inc. Generating visualizations from keyword searches of color palettes
US10120880B2 (en) 2014-06-26 2018-11-06 Amazon Technologies, Inc. Automatic image-based recommendations using a color palette
US11216861B2 (en) 2014-06-26 2022-01-04 Amason Technologies, Inc. Color based social networking recommendations
US10691744B2 (en) 2014-06-26 2020-06-23 Amazon Technologies, Inc. Determining affiliated colors from keyword searches of color palettes
US10186054B2 (en) 2014-06-26 2019-01-22 Amazon Technologies, Inc. Automatic image-based recommendations using a color palette
US10223427B1 (en) 2014-06-26 2019-03-05 Amazon Technologies, Inc. Building a palette of colors based on human color preferences
US10235389B2 (en) 2014-06-26 2019-03-19 Amazon Technologies, Inc. Identifying data from keyword searches of color palettes
US10242396B2 (en) 2014-06-26 2019-03-26 Amazon Technologies, Inc. Automatic color palette based recommendations for affiliated colors
US10255295B2 (en) 2014-06-26 2019-04-09 Amazon Technologies, Inc. Automatic color validation of image metadata
JP2017522660A (ja) * 2014-06-26 2017-08-10 アマゾン テクノロジーズ インコーポレイテッド 色パレットを使用した自動的な画像ベースの推奨
US10430857B1 (en) 2014-08-01 2019-10-01 Amazon Technologies, Inc. Color name based search
US10831819B2 (en) 2014-09-02 2020-11-10 Amazon Technologies, Inc. Hue-based color naming for an image
US11055343B2 (en) 2015-10-05 2021-07-06 Pinterest, Inc. Dynamic search control invocation and visual search
JP2018536248A (ja) * 2015-10-05 2018-12-06 ピンタレスト,インコーポレイテッド 動的検索入力選択
US11609946B2 (en) 2015-10-05 2023-03-21 Pinterest, Inc. Dynamic search input selection
KR20180041401A (ko) * 2016-10-14 2018-04-24 에스케이텔레콤 주식회사 동영상 생성 장치 및 방법
US11126653B2 (en) 2017-09-22 2021-09-21 Pinterest, Inc. Mixed type image based search results
US11841735B2 (en) 2017-09-22 2023-12-12 Pinterest, Inc. Object based image search

Also Published As

Publication number Publication date
DE102011003201A1 (de) 2011-12-15
FR2955681A1 (fr) 2011-07-29
US8775424B2 (en) 2014-07-08
US20110184950A1 (en) 2011-07-28

Similar Documents

Publication Publication Date Title
JP2011154687A (ja) 画像データセットをナビゲートするための方法、装置、及びプログラム
US8837820B2 (en) Image selection based on photographic style
US9639806B2 (en) System and method for predicting iconicity of an image
US8594385B2 (en) Predicting the aesthetic value of an image
JP5782404B2 (ja) 画質評価
US8391618B1 (en) Semantic image classification and search
US8369616B2 (en) Chromatic matching game
US8842882B2 (en) Individualizing generic communications
US20090150376A1 (en) Mutual-Rank Similarity-Space for Navigating, Visualising and Clustering in Image Databases
US20120294514A1 (en) Techniques to enable automated workflows for the creation of user-customized photobooks
US8731308B2 (en) Interactive image selection method
US20120163710A1 (en) Image ranking based on abstract concepts
US11531840B2 (en) Systems, methods, and storage media for training a model for image evaluation
CN103988202A (zh) 基于索引和搜索的图像吸引力
Ip et al. Saliency-assisted navigation of very large landscape images
EP3044731A1 (en) Image searching method and apparatus
CN102132318A (zh) 图像收藏集的可缩放的相关性排序表示的自动创建
US9002120B2 (en) Interactive image selection method
JP2010507139A (ja) 顔に基づく画像クラスタリング
US8270731B2 (en) Image classification using range information
Männistö et al. Automatic image content extraction: Operationalizing machine learning in humanistic photographic studies of large visual archives
Pflüger et al. Sifting through visual arts collections
Nath et al. A Survey on Personal Image Retrieval Systems
Cavalcanti et al. A survey on automatic techniques for enhancement and analysis of digital photography
Doukim et al. State of the art of content-based image classification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150317