JP2010073114A6 - 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム - Google Patents

画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム Download PDF

Info

Publication number
JP2010073114A6
JP2010073114A6 JP2008242575A JP2008242575A JP2010073114A6 JP 2010073114 A6 JP2010073114 A6 JP 2010073114A6 JP 2008242575 A JP2008242575 A JP 2008242575A JP 2008242575 A JP2008242575 A JP 2008242575A JP 2010073114 A6 JP2010073114 A6 JP 2010073114A6
Authority
JP
Japan
Prior art keywords
image
information
search
text
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008242575A
Other languages
English (en)
Other versions
JP2010073114A (ja
JP5353148B2 (ja
Inventor
ドゥヌ ローラン
アドコック ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/924,518 external-priority patent/US20090112830A1/en
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2010073114A publication Critical patent/JP2010073114A/ja
Publication of JP2010073114A6 publication Critical patent/JP2010073114A6/ja
Application granted granted Critical
Publication of JP5353148B2 publication Critical patent/JP5353148B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】既存の画像検索システムは利用者が個々のプレゼンテーション資料中に存在する個々の画像を効率的に検索する機能を提供すること。
【解決手段】本発明の画像情報検索方法は、少なくとも1つのドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出し、少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成し、少なくとも1つの画像あるいは少なくとも1つのドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成し、識別情報およびメタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持させ、テキスト検索エンジンに識別子を用いて記憶領域に対する情報の検索実行を指示する入力を行うことを特徴とする。
【選択図】図2

Description

本発明は主に情報検索システムに関わり、特にプレゼンテーション資料や他のドキュメント中のイメージを検索するシステムに関する。
マイクロソフト(登録商標)社製のパワーポイント(登録商標)といった、マルチメディアを用いたプレゼンテーションは、21世紀の組織において主要なコミュニケーションメディアになってきている。このコミュニケーションメディアは、視覚的にユニークなものであり、写真や図表といった、多様な視覚的な対象物を含んでいる場合が多い。この視覚的な対象物はコミュニケーションにおいて高い価値をもっており、ある組織内では複数のプレゼンテーションで再利用されることも多い。しかし、コミュニケーションにおいて価値が高まる一方で、写真や図表は文字情報と比較して、準備に要する時間やスキルといった点ではコストを増加させてしまう。このため、写真の再利用は特に重要である。加えて、プレゼンテーションのスライドには大量のテキストは大抵の場合含まれておらず、再利用のために既存のスライドの検索をテキスト検索に依存して行うことは効果的ではない。また、スライドはそもそも高い視覚的特徴を持っているので、ユーザは以前見た写真に基づいて過去に見た情報を容易に認識できる場合もある。
現在さまざまな画像検索エンジンが存在するが、それはファイル名、埋め込まれたテキスト、画像の周囲に存在するテキストを用いて、画像の検索を行うものである。しかし、既存の画像検索エンジンは、ユーザが効率的に必要な情報を探し出す上で必要となる、画像や画像を含むドキュメントを順位付けするための機能を通常提供しない。たとえば、この分野でよく知られている、LADIの画像検索システムは、グーグル(登録商標)デスクトップ検索エンジンにより検索されたドキュメントのページサムネイルを表示する。しかし、このLADIシステムの画像はページ全体のプレビューであって、それぞれのページに含まれる個々の画像の検索を可能とするものではないため、利用者が個々の画像を検索することができない。
「グーグル、デスクトップ検索に一番乗り--Google Desktop Searchを公開」、[online]、 平成16年10月15日、シーネットネットワークスジャパン株式会社(CNET JAPAN)、[平成20年9月5日検索]、インターネット<URL:http://japan.cnet.com/news/media/story/0,2000056023,20075166,00.htm> デノウエ(Denoue)等、「プロジェクタボックス:教室をキャプチャするシームレスなプレゼンテーション」(" ProjectorBox: Seamless presentation capture for classrooms")、イー・ラーン2005(E-Learn 2005)、企業、政府、医療、及び高等教育におけるイー・ラーニングの国際会議( World Conference on E-Learning in Corporate, Government, Healthcare, & Higher Education)、2005年10月24日
このため、既存の画像検索システムは利用者が個々のプレゼンテーション資料中に存在する個々の画像を効率的に検索する機能を提供できていない。
本発明は、プレゼンテーションや他のドキュメント中の画像検索用の既存手法が抱える、上述の課題の一部あるいは複数の課題を解決するための方法あるいはシステムに関するものである。
本発明の画像情報検索方法は、ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出し、前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成し、前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成し、前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持させ、前記テキスト検索エンジンに前記識別子を用いて前記記憶領域に対する情報の検索実行を指示する入力を行うことを特徴とする。
また、本発明の画像情報検索装置は、ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出する検出手段と、前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成する識別情報生成手段と、前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成するメタ情報生成手段と、前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持する保持手段と、前記テキスト検索エンジンに前記識別子に基づく前記記憶領域に対する情報の検索実行を指示する検索指示手段とを備えることを特徴とする。
本発明の画像情報検索用のコンピュータプログラムは、コンピュータに、ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出し、前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成し、前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成し、前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持させ、前記テキスト検索エンジンに前記識別子を用いて前記記憶領域に対する情報の検索実行を指示する入力を行うことを実行させるためコンピュータプログラムである。
以下の詳細な説明において、対応する図面中の符号は、同じ機能要素については同様の番号を付してある。これらの図面は例示であって、その手法を限定するものではなく、個々の実施形態と適用例は今回の発明の原理を示すためのものである。これらの適用例は当業者が実施可能な程度に十分な詳細が記載されており、他の適用例への適用、構成の変更や各構成要素の変更および/または置き換えが、本発明の範囲および思想から逸脱することなく適用できることは理解されるだろう。従って、以下の詳細な説明は限定的に解釈されるものではない。加えて、記述される多様な実施形態は、一般用のコンピュータ上で動作するソフトウェアの形態、専用のハードウェアから成る形態、あるいはソフトウェアとハードウェアの組み合わせにより実現されるものである。
本発明に関わる画像検索装置は、先に述べたプレゼンテーション中の画像の検索のために提供されるものである。図1は本発明に関わる画像検索システムの処理手順の一例100を示す。まず、ステップ101で、本発明の画像検索システムに関わる実施形態では、プレゼンテーションスライド中に配置された個々の画像を識別する。本発明にかかわる多様な画像検索システムにより、多様なプレゼンテーションスライドの形式に対してこの画像識別を実行させることができ、例えば、Pbox(非特許文献2)のような、プレゼンテーション中に自動的に会議をキャプチャーするシステムを用いて取得した構造化されていないスライドの画像や、プレゼンテーションスライドを含んだ、パワーポイントプレゼンテーションファイルのような、構造化されたデジタルプレゼンテーションドキュメントから抽出された画像に対して適用することができる。このPboxとパワーポイントシステムは、よく知られたものである。プレゼンテーション用のドキュメントは有効な例であるが、文と写真とを含んだ他の種類の文書に対してもこの発明を適用することができる。その場合には、この後に記述されるプレゼンテーションおよびスライドという言葉を、それぞれドキュメントおよびページと置き換えて考えればよい。
続いて、ステップ102で、本発明に関する画像検索装置の実施形態は、同じ画像の組(もしくはほぼ同じ)に対して一意のトークン(文字情報から構成される識別コード)を割り当てる。例えば、特定の絵が異なる二つのプレゼンテーションで再利用されている場合には、本実施形態では同じトークンをもちいてそれを表す。本発明に関するシステムの実施形態においては、1またはそれ以上の同じ画像を表す前述のトークンは、スライドを文字情報のみで表現したテキスト表現とした情報に対して、あたかもスライド中にある単語のように、挿入される。こうすることで、後の画像検索において、基本的なテキストインデックス検索技術を、画像検索に用いることができる利点がある。
次に、本発明に関する画像検索システムの実施形態では、図1のステップ103において、プレゼンテーションスライド、画像およびその中のテキストに関連する多様なメタ属性情報を生成し記憶する。例えば、スライド中の画像とテキスト部分の位置関係、画像とテキスト部分の幅と高さ、スライド全体のサイズに対する画像のサイズ、あるいはこのスライドがキャプチャーされた日時といったものである。なお列挙したメタ属性に限らず、他の適当な画像もしくはスライド属性も同様に決定し記憶させることができることは明らかであろう。
画像および/またはテキスト、そしてスライドから、前述のトークンとメタ属性情報を生成したのち、ステップ104では、その生成されたデータを、テキストベースのサーチエンジン、例えばグーグルデスクトップや広く利用されているLuceneオープンソースリトリーブライブラリ、に渡す、もしくは、サーチエンジンが検索に利用可能な状態に置く(例えば、アクセス可能な記憶領域に保持もしくはサーチエンジンによるアクセスを許可し、サーチエンジンが生成されたデータの保持されたデータ領域を検索対象とするように設定する)。このグーグル(Google)デスクトップとLuceneオープンソースリトリーブライブラリは当業者によく知られたものである。ステップ105で、ユーザにより前述のテキストベース検索エンジンに対して検索クエリを用いた検索指示がなされ、ステップ106では、画像の検索が行われる。この検索は、生成されたトークンまたはメタ属性情報に基づいてなされる。
検索の間に、ユーザが検索したい対象画像を表す一以上の検索語を入力する。ステップ106では、検索条件を満たすよう、本発明に関するシステムの実施形態では、例えば、その特定のキーワードを含むすべてのプレゼンテーションスライドを検索する。本実施形態では、スライド中に含まれる画像だけを検索し、複製された画像は例示としてひとつだけを表示する。 前述のように、複製された画像は、同じ一意のトークン識別子に対応付けられる。ステップ107で、本発明の実施形態では、画像検索システムが、例えば従来のテキスト情報検索法で用いられる、tf−idf値(Term−Frequency Inverse−document−frequency値)に基づいて、画像を順位付けする。 tf−idf値は、ひとつのドキュメントあるいは関連するドキュメントのサブセット中である単語が出現した回数に比例するとともに、コーパス全体の単語の出現頻度には反比例する。このtf−idfスコアを用いた画像ランキングは当業者に良く知られており、詳細は後述する。本発明に関するシステムでは、それぞれの画像をテキスト検索における単純なキーワードとなる、トークンを用いて表現しているため、tf−idf法を用いた画像ランキングが可能となる。
図2は、本発明の手法に関する一実施形態における他の処理手順の例を示すものである。ステップ201では、プレゼンテーションのような、画像とそれに伴うテキストの両方を含んだドキュメントが供給される。ステップ202では、本発明の実施形態は複数のドキュメントから複数の画像を検出する。ステップ203では、重複する画像を検出するとともに取り除き、後述するように画像を表すトークンが生成される。ステップ205で、画像のトークンデータは画像のメタデータとともにインデックス(索引情報)に追加される。 ステップ204では、本実施形態のシステムは、画像に付随するテキストもドキュメントから抽出する。ステップ205では、抽出されたテキストと関連するメタデータをともにインデックスに格納する。テキストおよび画像インデックス205は、ドキュメントコーパス中のテキストと画像のトークンの生成記録を保持しており、それぞれの生成についてのコンテキスト情報は、関連するメタデータとして記述される。ステップ212における検索時にユーザはキーワードを入力し、ステップ206では、適合するドキュメントの一群を見つけるために、ステップ205で生成されたテキストインデックスに対してこのキーワードを利用する。適合するドキュメントがステップ210で返され、ステップ209で適合するドキュメントに対応する画像のトークンが取得される。ステップ207では、前述の画像トークンにより対応付けられた検索結果の画像が、ステップ205で作られたテキストおよび画像インデックスに基づく情報を用いて、所定の基準で順位付けされる。最後に、ステップ208に順位付けの結果が示される。
本発明の技術に関する例示的な実施形態における、画像検索システムは画像の1以上の特徴となる値、および/または、スライドの1以上の特徴となる値を組み合わせて画像検索結果のソートを行う。例えば、画像および/またはスライドの特徴は、特に限定されるものではないが、画像のtf−idfスコア、スライドのサイズに対する画像のサイズの比率、スライド中の画像の数の逆数、画像とユーザが検索したキーワードとのスライド中での距離をスライドの対角線の長さで割った値、などがある。
前述のtf−idfスコアを計算する上で、最初のtf部分は検索結果中の画像の検出数に正に相関し、次のidf部分は全画像コーパス中での画像の検出数に負に相関する。なおこのtf−idfが本発明に関する画像検索システムでの画像検索結果の順位付けに用いることができる唯一の評価手法ではない。本発明の趣旨に基づいて、多様な他の良く知られた再順位付け手法を同様に適用することができる。例えば、そうした例としては次の文献が挙げられる(非特許文献3)。すなわち、本発明は特定の評価手法や順位付け方法に限定されるものではない。
シュー・ジェイ(Xu, J.)、クロフト・ダブリュー・ビー(Croft, W. B. )、「エー・シー・エム 情報システムトランザクション(第18巻、第1号)ローカルコンテキスト分析で検索される情報の有効性の改善」(ACM Trans. Inf. Syst "Improving the effectiveness of information retrieval with local context analysis." )、2000年1月、p.79-112
本発明に関する例示的な実施形態としては、ユーザが画像検索結果リスト中の検索画像上にポインティングデバイスのポインタを当てたときに、この画像が使用されたスライドを表示するようにしてもよい。例えば、画像の背景情報(コンテクスト)としては、検索画像の元となる、1または複数のスライド、1または複数のプレゼンテーションがある。さらには、本発明に関する実施形態のシステムとしては、好ましくはスライド画像の近傍に、図3に示すような、検索された画像が利用された時を示す、ヒストグラムを表示させてもよい。この図では本発明に関する画像検索システムのユーザインターフェースの一例を示しており、ユーザには画像301のコンテクスト302が示され、それとともにプレゼンテーション中のその画像301が何回、いつ利用されたのかを示すヒストグラム303が表示される。他の実施例としては、プレゼンテーション中の検索された画像の全ての利用頻度を短時間で参照できるように一覧表示させても良い。
いったん画像が検索されると、ユーザはこのユーザインターフェースを介して1以上の検索された画像を選択でき、新たな検索クエリを作成したり既存の検索クエリを補強するために、選択した画像を利用することができる。このようにすることでユーザは、クエリとして、キーワードの代わりにもしくはキーワードとともに画像を用いて、スライド検索を継続することができる。コーパス中の画像にトークンを付加したため、検索エンジンにおいて画像トークンがテキストと同様に機能することとなる。こうした検索手法は画像を有するスライドが、不可欠なキーワードが含まれていない、あるいは、OCRシステムが単語を適切に認識できなかったために、一番最初の段階で検索されないときに有効である。例えば、ユーザが“FlyCam”という語を検索しているなら、本発明に関するシステムは、“FlyCam”という語を含む一つのスライドを、2つの画像とともに検索することができる。そして、ユーザは検索されたスライド中に含まれる1以上の画像を含む他のスライドを、さらに関連するスライドとして検索することもできるようになる。
以下、本発明に関する画像検索システム詳細な実施形態と、各構成要素について説明する。
スライド画像からの写真の抽出
良く知られているように、多様な周知の方法でプレゼンテーションのスライドはキャプチャーすることができ、例えばPboxシステムを用いることができる。キャプチャー後、スライドは文字認識エンジン(OCR)にかけられ、スライドに含まれるテキスト情報を抽出し、抽出されたテキスト情報をテキストベースの検索エンジンで利用できるように蓄積する。続いて、スライドから画像部分が抽出される。
図1のステップ101で、キャプチャされたスライド画像から写真を抽出するために、本システムの実施形態では、例えば図4に示すように、一連のスライドが、たとえ枚数が3枚しかなくても、同じ背景の画像テンプレートを通常有しているという事実を利用する。図において、スライド401,402,403はそれぞれが類似した背景画像を有している。周知の画像とビデオの背景領域の推測手法を用いて、本実施形態のシステムは、画像の抽出過程において、変化のない背景部分を除外する。可能であれば、本システムは前述のOCRエンジンにより検出されたテキスト領域の境界を利用して、画像の抽出される候補領域からテキスト情報を含む領域をできるだけ除外する。背景とテキスト領域を除外した残りの領域が画像抽出候補の領域として扱われる。さらにそれぞれの画像を囲む四角形を割り当てるため、本実施形態の手法では、個々の四角領域を識別するための周知の手法である、Hough変換と角検出法(corner detection)を用いた。候補領域の妥当性を保障するため、抽出前に小さすぎるあるいはあり得ない縦横比の領域は除外される。
電子ファイルからの写真の抽出
パワーポイントのようなプレゼンテーション用の電子ファイルから写真を抽出するために、このプレゼンテーションファイルを作成するときに使われた編集アプリケーションのドキュメントオブジェクトモデル(DOM:Document Object Model)を利用する例を示す。例えば、パワーポイントではプレゼンテーション中の多様なメディア要素の位置を取得するために、ドキュメントオブジェクトモデルを調べることを認めている。加えて、他の形態としては、プレゼンテーションドキュメントを、例えばPDF形式のような、所定のファイル形式に変換し、画像変換ユーティリティを用いて、この所定のファイル形式(PDF)の抽出画像からプレゼンテーションスライドの画像を生成して用いる方法がある。この種のユーティリティの例としては、XPDFソフトウェアパッケージの一部として流通しているPDF2IMAGE.EXE tool がある。
図5は、本発明の手法に関する実施形態の処理手順500を示すもので、プレゼンテーションスライドから得られた画像に対してトークンを生成する処理を示すものである。
写真のTF-IDFスコアの計算
画像抽出ステップで抽出されるそれぞれの画像について、本実施形態では抽出された全ての画像のセット中に、同じ画像の複製されたバージョンがあるかを識別し、画像の全ての複製されたバージョンにはテキストインデキシングに適するよう、一意に識別可能なトークンを割り当てる。画像の比較を行うために、本発明に関する画像検索システムでは、図5のステップ501で示すように、それぞれの画像のサイズが同じとなるようにサイズを調整し、例えば128×128ピクセルとする。サイズ調整後、ステップ502で示すように、画像は離散コサイン変換(DCT)が施され、画像は空間領域から周波数領域へと変換される。DCTにより、周波数領域で画像を表現するDCT係数のセットが得られる。その後、ステップ503では、サイズ調整された画像のDCT係数の一部を切り捨てたものの比較が行われる。このようにすることでユーザが異なるスライドに、画像を異なるサイズや異なる縦横比で埋め込んだ場合でも、類似画像を見つけることができる。ステップ504では、もしDCT係数が既存の画像のDCT係数に十分に近似している場合には、これらの画像に近似する既存の画像のトークンを検索する。2つの画像のDCT係数の比較方法の一例としては、それぞれのDCT係数のベクトル間のコサイン距離を用いる周知の方法がある。さらにあるいはこの代わりに、実施形態としては、複製あるいはほぼ複製された画像の識別を公知の多様な手法を用いて行うこともでき、特定の手法に限られるものではない。
ステップ505で示すように、それぞれの一意の画像は、その画像があったスライドのテキストインデックス中に、画像に対応する一意のトークンを用いて表現される。このトークンは一意で、通常のテキストとは区別でき、テキストインデキシングシステムで取り扱えるトークンである。一例としては、トークン生成工程では、数文字からなるひとつのランダムで一意なプリフィックス(接頭文字)を生成し、その画像のインデックスを画像データベース中の画像に付加することで、画像に対して指標化可能なトークンを割り当てる。ステップ503では、新しい画像が検出されるとそれは基準サイズに調整される。そのDCT係数が計算され、その係数が過去に指標付けした画像の係数と十分に近い場合には、その画像は過去に指標付けされた画像のトークンが割り当てられる。そうで無い場合には、ステップ505に示されるように、画像が画像データベースに引き渡され、新しい一意の識別用トークンが割り当てられる。本発明に関する実施例の手法では、画像データベースに継続的に画像を追加する、Pboxのような、プレゼンテーションに用いたスライドの自動キャプチャー装置を用いることができる。ステップ506は、トークンは、テキストインデキシング装置およびテキスト検索エンジンに供される。
単語の出現頻度(tf)とドキュメント頻度の逆数(idf)の値を計算するうえで、コーパス全体での単語の頻度を計数するときに考慮されるべきドキュメントの本文を決定するために、本実施形態では、入手できるプレゼンテーションの内容、もしスライドに時間の情報が含まれているなら、時間、日にち、週あるいは月といった情報を用いて、ドキュメントを数段階の粒度にグループ分けをする。言い換えると、本実施形態では、プレゼンテーションでの画像の利用について、時間、日数、週、月といった期間を考慮に入れる。Pboxのようなプレゼンテーションの自動記録装置では、いく種類ものスライドを用いて統計的に単語の頻度を計算する場合、粒度を月単位とするのが妥当である。しかし、情報検索を行う時点で適当な粒度を決定しても良く、システムで固定しておく必要はない。
これまでのウェブベースの画像検索エンジンでは、画像をテキスト検索するために画像にキーワードを付与するため、画像のファイル名、あるいはHTMLのIMGタグに関連付けられたHTMLのALT部分を用いている。この場合、そのドキュメントがきちんと構築されていなければ、その情報を入手することはできない。このようにドキュメントが構築されておらず、そうした情報の入手が困難である場合を想定したとき、本実施形態では、画像のサイズ、スライドのサイズに対する画像のサイズの比、スライド中に存在する画像の数、そしてキャプチャーされたスライド中もしくはドキュメント中の画像とキーワードの距離を代わりに用いることができる。このキーワードはテキストを用いた検索条件で類似した画像を検索するためにユーザが用いるものである。クエリに用いた単語に対する画像の類似度は、ドキュメント中でよりその画像に近い単語は大きく、画像が大きいほど大きく、そしてより少ない数の他の画像と共に表示される場合には大きくする。他の実施形態としては、前述の出現頻度に基づいたtf−idf法とともに、全体の画像スコアを単純な掛け算もしくは足し算で求め、これをその全体スコア画像の検索結果の個々の画像をソートするのに用いる。他の例としては、全体スコアを前述の類似度を用いて計算するもので、異なる手法により得られる値には異なる重み付けをし、加算して用いる。例えば、画像に適合した単語の近接度は、ある場合には最も重要と考えられ、その場合は他の手法による値より支配的な重み付けを与える。当業者であればわかることであるが、後者の方が画像検索結果のランキングを調整するうえではより柔軟性がある手法である。この重みのパラメータは実験結果に基づいて選択もしくは調整される。なお、もっとも好適な重み付けの組み合わせは対象となるプレゼンテーションやドキュメントによって異なる。つまり、異なるグループの編集者が異なる基準により異なる背景情報に基づいて作成した異なるコーパスでは、最適な重み付けは異なる結果となる。ある設定では、 画像に対する単語の近接度が検索結果のランキングに最も重要である。他の設定では、画像のサイズの設定が最も重要である。このように異なるランキング要因について、設定を異ならせて結果を調整することができることは当業者であれば自明であろう。
では、以下に本発明の画像検索システムに関する実施形態の適用例を示す。
電子ペーパーの写真検索で使用例
日本からの研究者が電子ペーパーに関する講演をし、あるユーザがその機構を説明した画像をみたことを覚えているとする。ユーザはその画像を探したいと考え、本発明に関する画像検索システムにクエリを出して検索を行う。そのクエリには「電子ペーパ」という単語が含まれている。電子ペーパの画像が含まれているか含まれていないかわからない全てのスライドの画像をユーザに見せる代わりに、本発明に関するシステムでは説明したように「電子ペーパ」という単語がスライドに埋め込まれた全画像を簡略表示でユーザに提示する。検索結果のいずれかにマウスのポインタを重ねると、システムはその図が実際に埋め込まれたスライドをユーザに提示する。
ユーザが依然として探している画像を見つけられないときには、ユーザはシステムに関連するスライドを提示するように要求する。このスライドとしては、例えば過去に検索した画像の中で、当初の検索で用いた「電子ペーパ」という単語を含まないものである。
応用:関連画像を見つける
ユーザが探していた写真が見つかった後、ユーザは同じトピックを扱う新しいプレゼンテーションを作成する。しかし、ユーザは以前彼が見つけた関連する写真を見つけたいとする。ユーザはシステムに画像をクエリとして送り、検索に用いた写真が見つかったプレゼンテーションに埋め込まれている全ての画像を検索する。 この作業に関わる全ての画像の全体像がすぐに生成されて示される。
応用:ユーザのメディア資産管理
あるユーザはグループの人達にプレゼンテーションをしようとしている。ユーザが新しいプレゼンテーションに画像を埋め込むときに、その画像が多く使われたのか使われたことがないのか、この画像をクエリとして使って過去に作成されたプレゼンテーションを検索することで知ることができる。結果を評価する場合には、特に図2に示すように、画像の使用頻度のヒストグラムを表示させることで、ユーザは即座にその資料の見栄えが古いと思われるかどうかを判断することが可能となる。
コンピュータによる実現例
図6は、本発明の実施形態に関わるコンピュータ/サーバーシステム600の実現例を例示したものである。このシステム600には、コンピュータ/サーバプラットフォーム601、周辺装置602とネットワークリソース603を含んで構成される。
コンピュータプラットフォーム601は、情報をコンピュータプラットフォーム601内の多様なモジュールとの間で通信するためのデータバス604あるいは他の通信機構を有している。そして、プロセッサ605は、情報処理や他の計算および制御処理を行うために、バス604と接続されている。コンピュータプラットフォーム601はさらに、多様な情報やプロセッサ605で処理される命令を記憶する、ランダムアクセスメモリ(RAM)や他の動的記憶装置のような揮発性記憶領域606がバス604に接続されている。揮発性記憶領域606はプロセッサ605の処理において仮の変数や中間情報を記憶するのに用いてもよい。コンピュータプラットフォーム601には、プロセッサ605の処理において統計情報や、基本入出力システム(BIOS)のような命令を記憶するために、バス604に接続されたリードオンリーメモリ(ROM)や他の静的記憶装置を備えても良い。 磁気ディスクあるいはフラッシュメモリのような不揮発性記憶装置608は情報や命令を記憶するためにバス604に接続される。
コンピュータプラットフォーム601には、システム管理者あるいはユーザに情報を提示するために、CRT、プラズマ、あるいは液晶ディスプレイが、バス604に接続されている。入力装置610はアルファベットと他のキーを備えており、プロセッサ605との通信や指示のためにバス604に接続されている。他のユーザ用入力装置としては、方向に関する情報を通信し、ディスプレイ609上でのカーソルの動きを制御するために、マウス、トラックボールあるいはカーソル方向キーのようなカーソル制御装置611がある。この入力装置は通常2軸での自由度をもっており、第1の軸(例えばx)および第2の軸(例えばy)を持つことで平面状での位置をそのデバイスで特定できることとなる。
外部記憶装置612は拡張あるいは取り外し可能なデータ蓄積装置はバス604を介してコンピュータプラットフォーム601に接続してもよい。コンピュータシステム600の例で、外付けのリムーバルメモリを他のコンピュータシステムとのデータ交換を用意にするために用いてもよい。
本発明は、ここに記述された技術を実現するためのコンピュータシステム600の使い方に関連するものである。実施形態として、コンピュータプラットフォーム601のような機械上に、本発明に関するシステムを搭載する。本発明の一形態としては、ここで記載された技術を、揮発性メモリ606中の1以上の命令による1以上の処理をプロセッサ605に処理させることで実現させる。こうした命令を不揮発性記憶領域608のような他のコンピュータ読取可能な媒体から、揮発性メモリ606に読み出してもよい。揮発性メモリ606中に保持された一連の命令をプロセッサ605に実行させることで、ここに述べた処理ステップを実現させる。他の形態としては、ハードウェアの電子回路を、発明を実現するソフトウェアと、一部置き換え、あるいは、組み合わせてもよい。なお、本発明は特定のスペックを有するハードウェアやソフトウェアの組み合わせに限定されるものではない。
ここで、コンピュータ可読媒体とは、プロセッサ605が実行するための命令を提供するのに用いられるあらゆる媒体を指す。コンピュータ可読媒体は機械読取可能媒体の一例であり、ここで述べた、いかなる方法もしくは技術を実現するための命令を保持することができるものである。このような媒体は多様な形態をとり、不揮発性媒体、揮発性媒体、そして通信媒体といったものに限られない。不揮発性メディアとしては、例えば、記憶装置608のような、光、磁気ディスクが含まれる。揮発性媒体としては、例えば揮発性記憶装置606のような動的メモリを含む。通信媒体は、同軸ケーブル、銅線あるいは光ファイバーを含み、データバス604を構成する配線を含む。通信媒体は、電磁波や赤外光データ通信のような、音波や光を利用したものも含む。
例えば、フロッピー(登録商標)ディスク、ハードディスク、磁気テープあるいは他の磁気媒体、CD-ROMあるいは他の光記憶媒体、パンチカード、紙テープなどの穴の配置を用いる媒体、RAM、ROM、EPROM、フラッシュEPROM、フラッシュドライブ、メモリーカードなどのメモリチップやカートリッジ、ここで述べた通信波、あるいはコンピュータが読むことができる他の媒体、といった通常のコンピュータ可読媒体を含む。
さまざまな形態のコンピュータ可読媒体が、プロセッサ605で処理される1以上の処理を実行させるために用いることができる。例えば、その命令が最初はリモートコンピュータから磁気ディスクに保持されてもよい。あるいは、リモートコンピュータがその命令を動的記憶装置にロードして、これをモデムを用いた電話回線を通じて送信してもよい。コンピュータシステム600に接続されたモデムは、電話回線を通じてデータを受け取るともに、データを赤外線信号に変換して赤外線として伝送するようにしてもよい。赤外線検出装置は、赤外線信号に重畳されたデータを受信し、適当な回路がそのデータをデータバス604に伝送する。バス604は揮発性記憶領域606にデータを伝送し、プロセッサ605がその命令を参照して実行できる状態におく。揮発メモリ606から受け取った命令はプロセッサ605により処理される前あるいは後に不揮発性記憶装置608に保存されるようにしてもよい。命令は、周知のネットワークデータ通信プロトコルのいずれかで、インターネットを介してコンピュータプラットフォーム601にダウンロードするようにしてもよい。
コンピュータプラットフォーム601は、データバス604に結合したネットワークインターフェースカード613のような通信インターフェースも有する。通信インターフェース613はローカルネットワーク615に接続されたネットワークリンク614に接続し、双方向のデータ通信が可能とされる。例えば、通信インターフェース613はISDNカードやモデムと一体化され、対応する電話回線でのデータ通信を行わせるようにしてもよい。他の例としては、LANや802.11a, 802.11b, 802.11g として周知の無線LANリンクに適合したデータ通信接続を行うローカルエリアネットワークインターフェースカード(LAN NIC)としたり、Bluetooth(登録商標)を用いて実現してもよい。いずれの場合でも、通信インターフェース613は、様々なタイプの情報を表すデジタルデータ列を伝送する、電気、電磁、あるいは光信号を送受信する。
ネットワークリンク613は、1以上の他のネットワークとデータ通信を通常可能とする。例えば、ネットワークリンク614は、ローカルネットワーク615を介して、ホストコンピュータ616やネットワークストレージやサーバー617への接続を提供する。加えて、あるいは代替として、ネットワークリンク613は、インターネットのような、広域あるいはグローバルネットワーク618にゲートウェイ/ファイアウォール617を通じて接続する。そしてコンピュータプラットフォーム601はインターネット618上のどこかにある、例えばリモートネットワークストレージ/サーバーといった、ネットワークリソースにもアクセスすることが可能となる。一方、コンピュータプラットフォーム601は、ローカルエリアネットワーク615および/またはインターネット618上のいかなる位置にいるクライアントからもアクセスできるようにしてもよい。ネットワーククライアント620と621は、プラットフォーム601と同様のコンピュータプラットフォームに基づいて構築しても良い。
ローカルネットワーク615とインターネット618は、共に電気、電磁、あるいは光信号をデータ信号列を伝播するのに用いる。なお、デジタルデータをコンピュータプラットフォーム601に入出させる、多様なネットワークを通じた信号、ネットワークリンク614上や、コミュニケーションインターフェース613を介した信号は情報伝送の伝送波の例示的な形態である。
コンピュータプラットフォーム601は、メッセージの送信、プログラムコードを含むデータの受信を、インターネット618およびLAN615を含む多様なネットワーク、ネットワークリンク614および通信インターフェース613を介して行うことができる。インターネットの例では、システム601はネットワークサーバとして機能し、クライアント620および/または621で実行されるアプリケーションプログラム用の、リクエストコードやデータを、インターネット618、ゲートウェイ/ファイアウォール617、ローカルエリアネットワーク615および通信インターフェース613を介して伝送する。同様に、他のネットワークリソースからコードを受信してもよい。
受信したコードはプロセッサ605によって受信時に実行されるか、不揮発記憶装置608あるいは揮発記憶装置606に保存する、あるいは他の不揮発性記憶領域に記憶して、後で実行してもよい。このようにしてコンピュータ601は伝送波からアプリケーションコードを取得できる。
最後に、ここに記載した方法や技法は、特定の装置固有に成り立つものでなく、いかなる適当な構成要素の組み合わせによっても実現できることを理解されたい。また、この開示の示唆に従って、多様な一般用途の装置を用いてもよい。 またここで開示した手法を実現する専用の装置を作成することも有効である。この発明は特定の例示に基づいて記述されているが、それらは全て限定的にするためではなく、例示するためのものである。当業者であれば、ハードウェア、ソフトウェアおよびファームウェアの多くの異なる組み合わせが本発明を実施するのに適当であることは理解されうることであろう。例えば、ソフトウェアの記述は、アセンブラ, C/C++, perl, shell, PHP, Java(登録商標)といった多様なプログラムあるいはスクリプト言語を用いて実現できる。
さらに、ここに開示された本発明の明細書および実施例に基づいて、本発明の他の改良もまた当業者には明らかであろう。実施形態に記述された多様な観点や構成は、このコンピュータにより実現される画像検索システムを単独もしくは組み合わることによりを利用することができる。
本発明に関わる検索システムの処理手順の一例を示すものである。 本発明に関わる検索システムの処理手順の他の一例を示すものである。 本発明に関わる画像検索システムのユーザインターフェースの一例を示すものである。 同じ背景テンプレートの一連のプレゼンテーション用のスライドを示すものである。 本発明の手法の実施形態の一例を示すものである。 本発明のシステムを備えるコンピュータプラットフォームの一例を示すものである。
符号の説明
200 画像情報検索装置
301 抽出画像
302 プレゼンテーションスライド
303 ヒストグラム
401,402,403 プレゼンテーションスライド
600 コンピュータシステム
601 コンピュータプラットフォーム
602 周辺装置
603 ネットワークリソース

Claims (19)

  1. ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出し、
    前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成し、
    前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成し、
    前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持させ、
    前記テキスト検索エンジンに前記識別情報を用いて前記記憶領域に対する情報の検索実行を指示する入力を行う
    ことを特徴とする画像情報検索方法。
  2. 前記識別情報の生成は、画像の重複を判別する工程をさらに含み、前記重複を判定する工程は、
    判定対象となる画像を所定のサイズに調整し、
    前記調整後の画像を周波数成分により表現するための周波数変換を施し、
    前記画像を表現する第1の周波数成分と、比較対照される画像を表現する周波数成分とに基づいて、所定の基準により前記画像が前記比較対照される画像と同じあるいは類似する画像と評価される場合には、前記識別情報として、前記比較対照される画像に付与された識別情報を割り当てて前記記憶領域に保持させる
    ことを含むことを特徴とする請求項1記載の画像情報検索方法。
  3. 更に、前記ドキュメントファイルからテキスト情報を抽出し、前記抽出されたテキスト情報を前記テキスト検索エンジンが検索可能な前記記憶領域に保持させることを特徴とする請求項1記載の画像情報検索方法。
  4. さらに、前記検索実行の指示により得られる検索結果が複数の画像情報であり、所定の基準に基づいて前記複数の画像情報のランキングを行うことを特徴とする請求項3記載の画像情報検索方法。
  5. 更に、前記ドキュメントファイルからテキスト情報を抽出し、前記抽出されたテキスト情報を前記テキスト検索エンジンが検索可能な前記記憶領域に保持させ、前記所定の基準が、前記記憶領域に記憶された前記識別情報および前記テキスト情報に基づいて算出されたtf−idf値に基づいて計算されることを特徴とする請求項4記載の画像情報検索方法。
  6. 前記画像が類似もしくは一致する場合には前記識別情報を同一とすることを特徴とする請求項1記載の画像情報検索方法。
  7. 前記メタ属性が、前記ドキュメントファイル中の前記画像の埋め込まれたページ上における前記画像の位置、前記画像の高さ及び幅、前記ドキュメントファイル中の前記画像の埋め込まれたページに対する前記画像の大きさの比、あるいは前記ドキュメントファイル中の前記画像の埋め込まれたページに埋め込まれた画像の数、の少なくともひとつであることを特徴とする請求項1記載の画像情報検索方法。
  8. 更に、ドキュメント中のページから少なくとも1つの前記画像を抽出することを特徴とする請求項1記載の画像情報検索方法。
  9. 更に、前記検索の指示入力の結果出力された検索結果に対応する画像を表示装置上に表示させ、前記表示手段に表示された画像を選択手段で選択させ、前記選択手段により選択された画像に対応する前記識別情報を用いて前記テキスト検索エンジンにより前記記憶領域の検索を行わせる、ことを特徴とする請求項8記載の画像情報検索方法。
  10. ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出する検出手段と、
    前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成する識別情報生成手段と、
    前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成するメタ情報生成手段と、
    前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持する保持手段と、
    前記テキスト検索エンジンに前記識別情報に基づく前記記憶領域に対する情報の検索実行を指示する検索指示手段と
    を備えることを特徴とする画像情報検索装置。
  11. 前記識別情報生成手段は、画像の重複を判別する重複判定手段をさらに含み、前記重複判定手段は、
    判定対象となる画像を所定のサイズに調整する調整手段と、
    前記調整後の画像を周波数成分により表現するための周波数変換を施す周波数変換手段と、
    前記画像を表現する第1の周波数成分と、比較対照される画像を表現する周波数成分とに基づいて、所定の基準により前記画像が前記比較対照される画像と同じあるいは類似する画像と評価される場合には、前記識別情報として、前記比較対照される画像に付与された識別情報を割り当てて前記記憶領域に保持させる重複画像識別符号付与手段と
    を含むことを特徴とする請求項10記載の画像情報検索装置。
  12. 前記保持手段は、前記ドキュメントファイルからテキスト情報を抽出し、前記抽出されたテキスト情報を前記テキスト検索エンジンが検索可能な前記記憶領域に保持させることを特徴とする請求項10記載の画像情報検索装置。
  13. 前記検索エンジンは、前記検索実行の指示により得られる検索結果として、所定の基準に基づくランキングで複数の画像情報を表示することを特徴とする請求項10記載の画像情報検索装置。
  14. 前記保持手段は、前記ドキュメントファイルからテキスト情報を抽出し、前記抽出されたテキスト情報を前記テキスト検索エンジンが検索可能な前記記憶領域に保持させ、前記所定の基準が、前記記憶領域に記憶された前記識別情報および前記テキスト情報に基づいて算出されたtf−idf値に基づいて計算されることを特徴とする請求項13記載の画像情報検索装置。
  15. 前記識別情報生成手段が、前記画像が類似もしくは一致する場合には前記識別情報を同一とすることを特徴とする請求項10記載の画像情報検索装置。
  16. 前記メタ属性が、前記ドキュメントファイル中の前記画像の埋め込まれたページ上における前記画像の位置、前記画像の高さ及び幅、前記ドキュメントファイル中の前記画像の埋め込まれたページに対する前記画像の大きさの比、あるいは前記ドキュメントファイル中の前記画像の埋め込まれたページに埋め込まれた画像の数、の少なくともひとつであることを特徴とする請求項10記載の画像情報検索装置。
  17. 更に、ドキュメント中のページから少なくとも1つの前記画像を抽出する画像抽出手段を有することを特徴とする請求項10記載の画像情報検索装置。
  18. 更に、前記検索の指示入力の結果出力された検索結果に対応する画像を表示装置上に表示させ、前記表示手段に表示された画像を選択手段で選択させ、前記選択手段により選択された画像に対応する前記識別情報を用いて前記テキスト検索エンジンにより前記記憶領域の検索を行わせる入出力手段を備えることを特徴とする請求項17記載の画像情報検索装置。
  19. コンピュータに、
    ドキュメントファイルに含まれるページ中に埋め込まれた少なくとも1つの画像を検出し、
    前記少なくとも1つの画像を一意に識別するための文字情報を含む識別情報を生成し、前記少なくとも1つの画像あるいは前記ドキュメントファイルに関する情報に基づいて前記少なくとも1つの画像に関する属性としてのメタ属性を生成し、
    前記識別情報および前記メタ属性をテキスト検索エンジンによる検索が可能な記憶領域に保持させ、
    前記テキスト検索エンジンに前記識別情報を用いて前記記憶領域に対する情報の検索実行を指示する入力を行う
    ことを実行させるための画像情報検索用のコンピュータプログラム。
JP2008242575A 2007-10-25 2008-09-22 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム Active JP5353148B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/924,518 2007-10-25
US11/924,518 US20090112830A1 (en) 2007-10-25 2007-10-25 System and methods for searching images in presentations

Publications (3)

Publication Number Publication Date
JP2010073114A JP2010073114A (ja) 2010-04-02
JP2010073114A6 true JP2010073114A6 (ja) 2011-03-10
JP5353148B2 JP5353148B2 (ja) 2013-11-27

Family

ID=40584174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008242575A Active JP5353148B2 (ja) 2007-10-25 2008-09-22 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム

Country Status (2)

Country Link
US (1) US20090112830A1 (ja)
JP (1) JP5353148B2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645397B1 (en) * 2006-11-30 2014-02-04 At&T Intellectual Property Ii, L.P. Method and apparatus for propagating updates in databases
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
US10210179B2 (en) * 2008-11-18 2019-02-19 Excalibur Ip, Llc Dynamic feature weighting
US8078617B1 (en) * 2009-01-20 2011-12-13 Google Inc. Model based ad targeting
US8634644B2 (en) * 2009-08-25 2014-01-21 Fuji Xerox Co., Ltd. System and method for identifying pictures in documents
US8503767B2 (en) * 2009-09-16 2013-08-06 Microsoft Corporation Textual attribute-based image categorization and search
JP5641743B2 (ja) * 2010-02-02 2014-12-17 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
US8861844B2 (en) 2010-03-29 2014-10-14 Ebay Inc. Pre-computing digests for image similarity searching of image-based listings in a network-based publication system
US9405773B2 (en) * 2010-03-29 2016-08-02 Ebay Inc. Searching for more products like a specified product
US9792638B2 (en) 2010-03-29 2017-10-17 Ebay Inc. Using silhouette images to reduce product selection error in an e-commerce environment
US9177057B2 (en) * 2010-06-08 2015-11-03 Microsoft Technology Licensing, Llc Re-ranking search results based on lexical and ontological concepts
US8412594B2 (en) 2010-08-28 2013-04-02 Ebay Inc. Multilevel silhouettes in an online shopping environment
US8792728B2 (en) 2010-09-27 2014-07-29 Hewlett-Packard Development Company, L.P. Near-duplicate image detection
WO2013062599A1 (en) * 2011-10-26 2013-05-02 Box, Inc. Enhanced multimedia content preview rendering in a cloud content management system
US11232481B2 (en) 2012-01-30 2022-01-25 Box, Inc. Extended applications of multimedia content previews in the cloud-based content management system
CN102902758B (zh) * 2012-09-24 2016-02-10 百度在线网络技术(北京)有限公司 利用搜索引擎获取网络图片的壁纸设置方法及装置
WO2015017525A1 (en) * 2013-07-30 2015-02-05 Haiku Deck, Inc. Automatically evaluating content to create multimedia presentation
US20150112976A1 (en) * 2013-10-17 2015-04-23 Nicole Lang Beebe Relevancy ranking information retrieval system and method of using the same
CN103685498B (zh) * 2013-12-06 2018-01-19 北京奇虎科技有限公司 一种壁纸的加载方法和浏览器装置
US9253511B2 (en) * 2014-04-14 2016-02-02 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for performing multi-modal video datastream segmentation
US9852049B2 (en) * 2014-05-27 2017-12-26 International Business Machines Corporation Screenshot validation testing
US20160154802A1 (en) * 2014-12-02 2016-06-02 Nec Laboratories America, Inc. Quality control engine for complex physical systems
CN106227788A (zh) * 2016-07-20 2016-12-14 浪潮软件集团有限公司 一种以Lucene为基础的数据库查询方法
CN110555114A (zh) 2018-03-29 2019-12-10 北京字节跳动网络技术有限公司 一种媒体检索方法及装置
US11113447B2 (en) * 2018-08-01 2021-09-07 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of slide presentation content
US11681760B2 (en) 2018-08-01 2023-06-20 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of content
US11182538B2 (en) 2018-08-01 2021-11-23 Microsoft Technology Licensing, Llc Conversational user interface logic for cross-application ingestion and restructuring of content
US11295073B2 (en) 2018-08-01 2022-04-05 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of spreadsheet content
CN109697239B (zh) * 2018-11-23 2022-05-31 南京尚网网络科技有限公司 用于生成图文信息的方法
US11625429B2 (en) 2020-01-31 2023-04-11 Walmart Apollo, Llc Image searching using a full-text search engine
US11302048B2 (en) * 2020-08-31 2022-04-12 Yahoo Assets Llc Computerized system and method for automatically generating original memes for insertion into modified messages
CN114327170B (zh) * 2021-12-31 2023-12-05 北京安博盛赢教育科技有限责任公司 交流群组的生成方法、装置、介质和电子设备

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113272A (ja) * 1985-11-12 1987-05-25 Canon Inc 画像フアイルシステム
CA2066559A1 (en) * 1991-07-29 1993-01-30 Walter S. Rosenbaum Non-text object storage and retrieval
JPH06119404A (ja) * 1992-10-09 1994-04-28 Toshiba Medical Eng Co Ltd 画像表示装置
JPH06176082A (ja) * 1992-12-10 1994-06-24 Hitachi Ltd 画像検索装置および方法
JPH0944515A (ja) * 1995-07-28 1997-02-14 Hitachi Ltd 情報処理システム
US5995978A (en) * 1997-09-24 1999-11-30 Ricoh Company, Ltd. Navigation system for document image database
US6181342B1 (en) * 1998-07-06 2001-01-30 International Business Machines Corp. Computer file directory system displaying visual summaries of visual data in desktop computer documents for quickly identifying document content
US6728752B1 (en) * 1999-01-26 2004-04-27 Xerox Corporation System and method for information browsing using multi-modal features
US6721802B1 (en) * 1999-08-12 2004-04-13 Point2 Technologies Inc. Method, apparatus and program for the central storage of standardized image data
US7028253B1 (en) * 2000-10-10 2006-04-11 Eastman Kodak Company Agent for integrated annotation and retrieval of images
US6522780B1 (en) * 2000-12-15 2003-02-18 America Online, Inc. Indexing of images and/or text
US6522782B2 (en) * 2000-12-15 2003-02-18 America Online, Inc. Image and text searching techniques
FR2825814B1 (fr) * 2001-06-07 2003-09-19 Commissariat Energie Atomique Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique
JP3948249B2 (ja) * 2001-10-30 2007-07-25 日本電気株式会社 類似性判定装置及び類似性判定方法並びにプログラム
US20030210803A1 (en) * 2002-03-29 2003-11-13 Canon Kabushiki Kaisha Image processing apparatus and method
JP2004030122A (ja) * 2002-06-25 2004-01-29 Fujitsu Ltd 図面検索支援装置および図面検索方法
US8064650B2 (en) * 2002-07-10 2011-11-22 Hewlett-Packard Development Company, L.P. File management of digital images using the names of people identified in the images
US7509345B2 (en) * 2004-09-29 2009-03-24 Microsoft Corporation Method and system for persisting and managing computer program clippings
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US7542610B2 (en) * 2005-05-09 2009-06-02 Like.Com System and method for use of images with recognition analysis
US7945099B2 (en) * 2005-05-09 2011-05-17 Like.Com System and method for use of images with recognition analysis
US7433895B2 (en) * 2005-06-24 2008-10-07 Microsoft Corporation Adding dominant media elements to search results
US20070035780A1 (en) * 2005-08-02 2007-02-15 Kabushiki Kaisha Toshiba System and method for defining characteristic data of a scanned document
JP4977452B2 (ja) * 2006-01-24 2012-07-18 株式会社リコー 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム
JP2007200014A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
US20080097981A1 (en) * 2006-10-20 2008-04-24 Microsoft Corporation Ranking images for web image retrieval
US20080281793A1 (en) * 2007-01-11 2008-11-13 Anup Kumar Mathur Method and System of Information Engine with Make-Share-Search of consumer and professional Information and Content for Multi-media and Mobile Global Internet
US7844116B2 (en) * 2007-04-30 2010-11-30 Xerox Corporation Method for identifying images after cropping

Similar Documents

Publication Publication Date Title
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US8577882B2 (en) Method and system for searching multilingual documents
US8495049B2 (en) System and method for extracting content for submission to a search engine
US7606797B2 (en) Reverse value attribute extraction
JP2013541793A (ja) マルチモード検索クエリー入力手法
US8931002B2 (en) Explanatory-description adding apparatus, computer program product, and explanatory-description adding method
JP6932360B2 (ja) オブジェクト検索方法、装置およびサーバ
JP2011028747A (ja) サーチ・タームを生成するシステムと方法
CN106372231A (zh) 一种搜索方法及装置
US8320667B2 (en) Automatic and scalable image selection
JP4894253B2 (ja) メタデータ生成装置およびメタデータ生成方法
EP2887239A2 (en) Method and system of audio retrieval and source separation
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
RU2608873C2 (ru) Способ связывания метаданных цифрового контента с цифровым контентом (варианты), электронное устройство (варианты), машиночитаемый носитель (варианты)
JP6140835B2 (ja) 情報検索システムおよび情報検索方法
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置
JP2009217741A (ja) メタデータ付与方法及び装置、並びにメタデータ付与プログラム
JP2009217742A (ja) メタデータ付与方法及び装置、並びにメタデータ付与プログラム
JP5223293B2 (ja) 位置表現抽出装置、方法及びプログラム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
JP2011054006A (ja) 画像のキーワード決定システム
JP2002082969A (ja) 自動索引ロボットシステム及びそれを利用した処理方法
JP2009217367A (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム