JP2005115721A - 画像検索方法、画像検索装置及び画像検索プログラム - Google Patents

画像検索方法、画像検索装置及び画像検索プログラム Download PDF

Info

Publication number
JP2005115721A
JP2005115721A JP2003350374A JP2003350374A JP2005115721A JP 2005115721 A JP2005115721 A JP 2005115721A JP 2003350374 A JP2003350374 A JP 2003350374A JP 2003350374 A JP2003350374 A JP 2003350374A JP 2005115721 A JP2005115721 A JP 2005115721A
Authority
JP
Japan
Prior art keywords
image
search
text information
character string
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003350374A
Other languages
English (en)
Inventor
Yukio Uematsu
幸生 植松
Hiroshi Takeno
浩 竹野
Shunsuke Konagai
俊介 小長井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003350374A priority Critical patent/JP2005115721A/ja
Publication of JP2005115721A publication Critical patent/JP2005115721A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】画像に関連付けられたテキスト情報を使って画像を検索するときにあって、検索候補となる画像を網羅できるようにすることで、ユーザの必要とする画像を見逃すことなく検索できるようにする新たな画像検索技術の提供を目的とする。
【解決手段】検索文字列を指定して画像の検索要求が発行されると、先ず最初に、検索対象となる画像に関連付けられたテキスト情報を保存するテキスト情報保存手段に保存されるテキスト情報を検索することで、検索文字列をテキスト情報に含む画像を検索して、その検索した画像の中から類似画像検索に用いる画像を選択する。続いて、検索対象となる画像の中で、その選択した画像に類似する画像を検索して、その中から処理対象の画像を選択する。そして、その選択した処理対象画像の持つテキスト情報が検索文字列を含むことになるようにと、テキスト情報保存手段に保存されるテキスト情報を変更する。
【選択図】図1

Description

本発明は、画像に関連付けられたテキスト情報を使って画像を検索する画像検索方法及びその装置と、その画像検索方法の実現に用いられる画像検索プログラムとに関し、特に、検索候補となる画像を網羅できるようにすることで、ユーザの必要とする画像を見逃すことなく検索できるようにする画像検索方法及びその装置と、その画像検索方法の実現に用いられる画像検索プログラムとに関する。
画像検索装置とは、コンピュータ上で動作する画像を検索するシステムのことで、他のコンピュータから入力された情報を元に画像を検索する技術を指す。
図6に、従来の画像検索装置1のシステム構成を示す。この図に示すように、従来の画像検索装置1は、ネットワーク3を介してユーザの操作するクライアント端末2と接続されており、画像検索部10と、画像データベース11と、画像インデックス12と、クライアント入力受付部13と、クライアント出力部14とを備える。
従来の画像検索装置1では、画像検索部10で、文字列を使って画像を検索する方法(以下、文字列画像検索と称する)と、類似する画像を検索する方法(以下、類似画像検索と称する)のいずれか一方を使って、画像データベース11に保存される画像の中から検索要求のある画像を検索するようにしている。
ここで、文字列画像検索を使って画像を検索する場合には、画像インデックス12として、画像データベース11に保存される画像に関連付けられたテキスト情報を保存する文字列インデックスデータベースが用意されることになる。一方、類似画像検索を使って画像を検索する場合には、画像インデックス12が用意されることはない。
画像検索部10で文字列画像検索を使って画像を検索する場合には、クライアント入力受付部13は、検索要求で指定される検索文字列を入力すると、それを画像検索部10に転送し、これを受けて、画像検索部10は、画像インデックス12(文字列インデックスデータベース)に保存されているテキスト情報の中から、転送されてきた検索文字列を含むものを検索して(この検索方法については一般の画像検索サービスに用いられている)、クライアント出力部14に対して、その検索したテキスト情報に対応付けられる画像の一覧を提示する画面を転送する。
ここで、画像検索装置1が検索対象とする画像とは、ネットワーク3を介して取得可能な電子的な画像を指す。WWW上の画像にリンクしているWEBページの文章から、その画像に関する画像検索用のテキスト情報を自動的に作成し、その画像に関連付けられたテキスト情報として、画像インデックス12(文字列インデックスデータベース)に保存する機構が用意されている。
一方、画像検索部10で類似画像検索を使って画像を検索する場合には、クライアント入力受付部13は、検索要求で指定される画像を入力すると、それを画像検索部10に転送し、これを受けて、画像検索部10は、画像データベース11に保存される画像の中から、転送されてきた画像に類似した画像を検索して(この検索方法については、例えば、特許文献1,2,3参照)、クライアント出力部14に対して、その検索した画像の一覧を提示する画面を転送する。
特開2000−250943(特願平11−056276号) 特開平10−240765号公報(特願平9−047579号) 特開平11−025271号公報(特願平9−184051号)
このように、従来の画像検索装置1では、文字列画像検索か類似画像検索のいずれか一方を使って検索要求のある画像を検索するようにしている。
これから、従来技術に従っていると、ユーザは、文字列画像検索で画像検索を行った場合に、その検索結果の中に所望の画像が含まれていない場合には(あるいは、もっと適切な画像があるのではないかと考える場合には)、続いて、類似画像検索で画像検索を行うようにしている。
すなわち、従来技術では、文字列画像検索で指定された検索文字列と、類似画像検索で検索された画像に関連付けられたテキスト情報との間に、何の関係付けも行っていないことから、類似画像検索で検索された画像に関連付けられたテキスト情報の中に、文字列画像検索で指定された検索文字列が含まれていないことが起こり、このような場合には、類似画像検索で検索される画像であっても文字列画像検索では検索されないことになる。
その他の場合として、文字列画像検索で指定された検索文字列の言語と、類似画像検索で検索された画像に関連付けられたテキスト情報の言語とが異なる場合にも、類似画像検索で検索される画像であっても文字列画像検索では検索されないことになる。
このようなことが起こることから、従来技術に従っていると、ユーザは、文字列画像検索で画像検索を行った場合に、その検索結果の中に所望の画像が含まれていない場合には(あるいは、もっと適切な画像があるのではないかと考える場合には)、続いて、類似画像検索で画像検索を行わなければならないのである。
これから、従来技術に従っていると、所望の画像を検索するために、文字列画像検索と類似画像検索の2ステップが必要となり、ユーザは煩雑な作業を強いられるという問題点がある。
そして、従来技術に従っていると、最初のステップである文字列画像検索が検索対象となる画像の範囲を狭めていることから、再現率(画像データベース11に保存されている画像の中で検索文字列に対応した画像の中で網羅できた割合)が低いという問題点がある。
本発明はかかる事情に鑑みてなされたものであって、画像に関連付けられたテキスト情報を使って画像を検索するときにあって、検索候補となる画像を網羅できるようにすることで、ユーザの必要とする画像を見逃すことなく検索できるようにする新たな画像検索技術の提供を目的とする。
この目的を達成するために、本発明の画像検索装置は、入力した検索文字列を基に画像を検索する処理を行うときにあって、(イ)検索対象となる画像に関連付けられたテキスト情報を保存するテキスト情報保存手段に保存されるテキスト情報を検索することで、検索文字列をテキスト情報に含む画像を検索する第1の検索手段と、(ロ)第1の検索手段の検索した画像の中から類似画像検索に用いる画像を選択する第1の選択手段と、(ハ)検索対象となる画像の中で、第1の選択手段の選択した画像に類似する画像を検索する第2の検索手段と、(ニ)第2の検索手段の検索した類似画像の中から処理対象の画像を選択する第2の選択手段と、(ホ)第2の選択手段の選択した処理対象画像の持つテキスト情報が検索文字列を含むことになるようにと、テキスト情報保存手段に保存されるテキスト情報を変更する変更手段とを備えるように構成する。
このように構成されるときにあって、変更手段は、(i)処理対象画像の持つテキスト情報に検索文字列を追加することで、処理対象画像の持つテキスト情報が検索文字列を含むように処理したり、(ii)検索対象となる画像に関連付けられたテキスト情報の抽出範囲を拡大して、その拡大した抽出範囲でテキスト情報の抽出を行うことで、処理対象画像の持つテキスト情報が検索文字列を含むように処理することがある。
以上の各処理手段が動作することで実現される本発明の画像検索方法はコンピュータプログラムで実現できるものであり、このコンピュータプログラムは、半導体メモリなどのような適当な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
このように構成される本発明の画像検索装置では、検索文字列を指定して画像の検索要求が発行されると、先ず最初に、テキスト情報保存手段に保存されるテキスト情報を検索することで、検索文字列をテキスト情報に含む画像を検索して、その検索した画像の中から類似画像検索に用いる画像を選択する。
続いて、検索対象となる画像の中で、その選択した画像に類似する画像を検索して、その中から処理対象の画像を選択する。そして、その選択した処理対象画像の持つテキスト情報が検索文字列を含むことになるようにと、テキスト情報保存手段に保存されるテキスト情報を変更する。
本発明によれば、画像に関連付けられたテキスト情報に検索文字列が含まれるのかを検索することにより画像を検索するときにあって、テキスト情報に検索文字列を含まない類似画像に対して、その検索文字列を追加することで、この後、その検索文字列による検索を可能にすることができるようになる。
これから、一度類似画像検索を行った画像については、再度検索を行った際に文字列画像検索の段階で要求する画像と適合することになり、従来技術に従っていると文字列画像検索と類似画像検索という2ステップで画像を検索していたものが、本発明によれば文字列画像検索のみの1ステップで済むようになる。
また、本発明によれば、入力する検索文字列は言語に依存することがない。要するに、類似画像検索においては文字列情報を全く考慮していないために、他の言語で作られたWEBページの画像に関しても、検索文字列の言語に容易に関連付けを行うことができるようになる。
その結果として、本発明によれば、他の言語の画像を検索することが可能になるために再現率を向上できるようになる。
このようにして、本発明によれば、画像に関連付けられたテキスト情報を使って画像を検索するときにあって、検索候補となる画像を網羅できるようになることで、ユーザの必要とする画像を見逃すことなく検索できるようになるのである。
以下、実施の形態に従って本発明を詳細に説明する。
本発明の画像検索装置はクライアント端末からの入力を利用する。クライアント端末から入力される情報としては、(イ)画像を検索するための検索文字列、(ロ)本発明の画像検索装置が提示した文字列画像検索結果の画像一覧の中から選択される画像の情報(この画像に類似する画像を検索することになる)、(ハ)本発明の画像検索装置が提示した類似画像検索結果の画像一覧の中から選択される画像の情報という3つであり、それらの情報に基づいて、最終的に選択された画像(この(ハ)で選択された画像)に関連付けられたテキスト情報を変更する。
入力した検索文字列が最終的に選択された画像に関連付けられたテキスト情報に含まれていない場合には、例えば、その入力した検索文字列をメタ情報として追加することで、最終的に選択された画像に関連付けられたテキスト情報を変更するのである。
このメタ情報の追加処理に従って、この後、同じ検索文字列を指定して画像検索の要求が発行されると、今度は、その検索文字列をメタ情報として登録している画像についても、文字列画像検索により検索できるようになる。
次に、このような処理を行う本発明の画像検索装置について詳細に説明する。
図1に、本発明の画像検索装置1の一実施形態例を図示する。
この図に示すように、本発明の画像検索装置1は、ネットワーク3を介してユーザの操作するクライアント端末2と接続されているとともに、WEBページ収集ロボット4と接続されており、文字列画像検索部100と、類似画像検索部101と、文字列比較・登録部102と、画像データベース103と、文字列インデックスデータベース104と、クライアント入力受付部105と、クライアント出力部106とを備えるという構成を採る。
文字列インデックスデータベース104及び画像データベース103については、WEBページ収集ロボット4が収集してきた情報を基にして、以下に示すように自動的に作成することになる。
WEBページ収集ロボット4は、URL(Uniform Resource Locator)を入力として、そのURLの指すWEBページがリンクするWEBページを収集する。ここで、WEBページとは、HTTP(Hyper Text Transfer Protocol)経由で入手可能なデータを指す。また、WEBページがリンクするとは、HTML(Hyper Text Markup Language)によって記述されるタグの中で、Aタグ及びIMGタグ等の他のWEBページを指しているポインタのことを言う。
WEBページ収集ロボット4は、あるWEBページから文字列インデックスデータベース104に保存するためのデータを自動的に生成する。文字列インデックスデータベース104には、図2に示されるようなデータ構造でもって、URL情報やテキスト情報が保存されている。
ここで、図2において、「画像URL」とは、収集した画像のURLを示し、「画像ファイル名」とは、その画像につけられたファイル名を示し、「WEBページのURL」とは、HTMLで記述されるタグによってその画像をリンクするWEBページ(リンク元のWEBページ)のURLを示し、「WEBページタイトル」とは、HTMLのtitle タグで囲まれた文字列を示し、「周辺テキスト」とは、その画像へのリンクについて記述するタグの前後100バイトの文字列を示し、「メタ情報」とは、その他の単語を登録する為の保存場所を示す。
タグの前後どの程度の文字列を周辺テキストとして登録するのかについては、あらかじめ文字列画像検索部100に設定しておく。また、画像のURLはユニークであるので、このURLが画像データベース103のキーとなる。
WEBページ収集ロボット4は、収集したWEBページからは該当する項目が存在する場合にのみ収集を行う。よって、メタ情報の部分には、この時点ではなにも入力されない。
図3に、WEBページ収集ロボット4の実行するフローチャートを図示する。次に、このフローチャートに従って、文字列インデックスデータベース104及び画像データベース103の作成処理について、さらに詳細に説明する。
WEBページ収集ロボット4は、図3のフローチャートに示すように、先ず最初に、ステップ100で、WEBページの取得先のURLを入力し、続くステップ101で、入力したURLの指すWEBページのデータを取得する。ここで、WEBページのデータを取得するとは、URLで示された電子データをダウンロードすることを意味する。
続いて、ステップ102で、その取得したWEBページのHTMLの解析を行い必要なデータを抽出する。HTMLでは、タグと呼ばれる<>で囲まれた文字列を解釈するよう設計されている。この中で、<title ></title>タグで囲まれた文字列を図2のWEBページタイトルとして抽出する。また、画像に関係する<IMG>もしくは<A>タグが記述されている場合には、その<IMG>もしくは<A>タグ内で記述されるファイル名の絶対パスを抽出する。すなわち、その画像のURLをそのWEBページからみた相対的なパスではない絶対パスのURLに変換するのである。
続いて、ステップ103で、ステップ102の解析処理に従って画像が存在するのか否かを判断して、画像が存在しないことを判断する場合には(画像に関係するタグが記述されていない場合には)、次のWEBページを処理すべくステップ100に戻る。
一方、画像が存在することを判断する場合には、ステップ104に進んで、絶対パスで表現されたURLの指す画像を取得して画像データベース103に保存する。
続いて、ステップ105で、画像に関係する<A>もしくは<IMG>タグの周辺テキストを抽出する。例えば、画像に関係するタグの前後100バイトのタグ情報を除いた文字列のみを周辺テキストとして抽出するのである。ここで、100バイトに満たない場合には、その時点で周辺テキストの抽出を終了することになる。
続いて、ステップ106で、ステップ102,105で抽出したテキスト情報を文字列インデックスデータベース104に保存し、続くステップ107で、取得対象となる全てのWEBページについて処理を終了したのか否かを判断して、全てのWEBページについて処理を終了していないことを判断する場合には、次のWEBページを処理すべくステップ100に戻り、全てのWEBページについて処理を終了したことを判断する場合には、処理を終了する。
このようにして、WEBページ収集ロボット4の処理に従って、文字列インデックスデータベース104及び画像データベース103が自動的に作成されることになるのである。
次に、図1のように構成される本発明の画像検索装置1の実行する処理について説明する。
図1のように構成される本発明の画像検索装置1では、先ず最初に、文字列画像検索部100が動作して、クライアント入力受付部105を介してユーザの指定する検索文字列を受け取ると、その検索文字列を基に文字列インデックスデータベース104を検索することで、その検索文字列をテキスト情報に含む画像を検索して、クライアント出力部106を介して、その検索した画像の一覧をユーザに提示する。
この画像一覧の中に要求する画像が存在する場合には、ユーザは、その画像を選択して、画像検索が終了することになる。一方、ユーザは、提示された画像に類似する画像を検索したい場合には、提示された画像一覧の中からポインティングデバイスなどを使って画像を選択して、類似画像の検索を要求することになる。
この類似画像の検索要求を受けて、続いて、類似画像検索部101が動作して、クライアント入力受付部105を介してユーザの選択した画像を受け取ると、その画像を基に画像データベース103を検索することで、その画像に類似する画像を検索して、クライアント出力部106を介して、その検索した画像の一覧をユーザに提示する。
この画像一覧の中に要求する画像が存在しない場合には、文字列を使った検索に戻るべく、文字列画像検索部100の表示する画面に戻る。一方、この画像一覧の中に要求する画像が存在する場合には、ユーザは、その画像を選択して、画像検索が終了することになる。
このような画像検索処理を行うときにあって、文字列比較・登録部102は、類似画像検索部101がユーザに提示した類似画像の一覧の中から、ユーザが画像を選択すると、クライアント入力受付部105を介してどの画像を選択したのかを受け取って、文字列インデックスデータベース104の保存するその画像のテキスト情報の中に、検索文字列(複数の単語で構成されていることがある)が存在するのかを比較して、存在しない文字列(単語)がある場合には、その画像のメタ情報として、その存在しない文字列を文字列インデックスデータベース104に登録する処理を行う。
この文字列比較・登録部102の処理に従って、この後、同じ検索文字列を指定して画像検索の要求が発行されると、今度は、その検索文字列をメタ情報として登録する画像についても、文字列画像検索により検索できるようになる。
図4及び図5に、図1のように構成される本発明の画像検索装置1の実行するフローチャートを図示する。次に、このフローチャートに従って、本発明の画像検索装置1の検索処理について、さらに詳細に説明する。
本発明の画像検索装置1は、図4及び図5のフローチャートに示すように、先ず最初に、ステップ200で、スペースで区切られた検索文宇列を入力し、続くステップ201で、その入力したスペースで区切られた文字列を複数の単語W1 〜Wn (n≧1)として取得して、メモリ上に一時保存する。
続いて、ステップ202で、その取得した文字列が文字列インデックスデータベース104のテキスト情報の中に存在するのかを検索して、その取得した文字列の存在するテキスト情報がない場合には、ステップ200に戻り、その取得した文字列の存在するテキスト情報がある場合には、ステップ203に進んで、そのテキスト情報を持つ画像の一覧を検索結果としてユーザに提示する。
続いて、ステップ204で、その検索結果の画像一覧の提示に対するユーザからの入力に従って、その提示した画像一覧の中にユーザの要求する画像が存在するのかを判断して、ユーザの要求する画像が存在する場合には、この時点で画像検索を終了する。
一方、ステップ204で、ユーザの要求する画像が文字列を使った検索では得られなかったことを判断する場合には、ステップ205に進んで、ユーザに類似画像検索を行うのかを問い合わせて、類似画像検索の要求がない場合には、文字列を使った検索を続行すべくステップ200に戻る。
一方、ステップ205で、ユーザが類似画像検索を行うことを要求する場合には、ステップ206に進んで、ユーザにより操作されるポインティングデバイスの操作を検出することで、ユーザに提示した画像一覧の中から類似画像検索に用いる画像を選択する。
続いて、ステップ207で、その入力した画像に類似する画像が画像データベース103に存在するのかを検索して、類似する画像が存在しない場合には、ステップ205に戻り、類似する画像が存在する場合には、ステップ208に進んで、その検索した類似画像の一覧を検索結果としてユーザに提示する。
ここで、類似画像検索の仕組みについてはどのようなものを用いてもよく、例えば、特開2001-160057(特願平11-344338 号)に開示されている検索方法を利用することができる。
続いて、ステップ209で、その検索結果の画像一覧の提示に対するユーザからの入力に従って、その提示した画像一覧の中にユーザの要求する画像が存在するのかを判断して、ユーザの要求する画像が存在しない場合には、ステップ205に戻り、ユーザの要求する画像が存在する場合には、ステップ210に進んで、ユーザにより操作されるポインティングデバイスの操作を検出することで、ユーザに提示した類似画像一覧の中から処理対象となる画像を選択する。
例えば、クライアント出力部106を介して、1つの画面に検索結果の類似画像を10枚ずつ表示するとともに、クライアント入力受付部105を介して、次の10枚の検索結果の類似画像の表示を要求するボタンの操作を検出すると、クライアント出力部106を介して、次の10枚の検索結果の類似画像を表示するようにして、その表示に応答して、ユーザがポインティングデバイスを使って処理対象となる画像を選択すると、そのポインティングデバイスの操作を検出することで、処理対象となる画像を選択するのである。ここで、1つの画面に出力する類似画像の枚数に関しては事前にクライアント出力部106に設定することによって変更することができる。
続いて、ステップ211で、その選択した画像のURLをキーにして文字列インデックスデータベース104を参照することで、その選択した画像の持つテキスト情報を取得する。このとき取得するテキスト情報とは、図2で説明した画像ファイル名、WEBページタイトル、周辺テキスト及びメタ情報である。
続いて、ステップ212で、ステップ201で一時保存した検索文字列を構成する文字列(上述のW1 〜Wn )を読み出し、続くステップ213で、その読み出した文字列と文字列インデックスデータベース104から取得したテキスト情報とを比較することで、その読み出した文字列が文字列インデックスデータベース104から取得したテキスト情報に存在するのかを判断する。
この判断処理に従って、その読み出した文字列が文字列インデックスデータベース104から取得したテキスト情報に存在することを判断する場合には、そのまま処理を終了し、存在しないことを判断する場合には、ステップ214に進んで、検索文字列を構成する文字列(W1 〜Wn )の中に含まれるその存在しない文字列Wi を、ステップ210で選択した画像に関連付けられた文字列インデックスデータベース104のメタ情報の部分に追加する。
続いて、ステップ215で、追加保存したメタ情報を基に文字列インデックスデータベース104のテキスト情報を変更する場合には、その変更を行って、処理を終了する。
例えば、追加保存したメタ情報を基に周辺テキストを変更する。例えば、追加保存したメタ情報が出てくる文まで周辺テキストを拡張するような変更を行う。本発明の画像検索装置1は周辺テキストの拡張方法に依存しないので、様々な周辺テキストの変更方法を利用することが可能である。
ここで、図4及び図5のフローチャートでは、ステップ214とステップ215の両方の処理を行うことで、メタ情報に検索文字列を追加するとともに、周辺テキストについても拡張することで周辺テキストに検索文字列が含まれることになるようにしているが、この2つの処理についてはいずれか一方だけを実行するようにしてもよい。
ただし、周辺テキストを拡張しても、追加保存したメタ情報が出てくる文が出現するとは限らないので、そのような場合には、ステップ214の処理を実行することで、メタ情報に検索文字列を追加するように処理することになる。
このようにして、本発明の画像検索装置1は、ユーザの指定する検索文字列を基に文字列インデックスデータベース104を検索することで、その検索文字列をテキスト情報に含む画像を検索して、その検索した画像の一覧をユーザに提示し、その提示に応答して、ユーザがその画像一覧の中から画像を選択して類似画像の検索を要求すると、画像データベース103を検索することで、その画像に類似する画像を検索して、その検索した画像の一覧をユーザに提示するように処理するのである。
そして、この画像検索処理を実行するときにあって、ユーザに提示した類似画像の中からユーザが画像を選択すると、文字列インデックスデータベース104の保存するその画像のテキスト情報の中に検索文字列が存在するのかを判断して、存在しない場合には、その画像のメタ情報として検索文字列を登録したり、そのテキスト情報の抽出範囲を拡大することにより、その画像のテキスト情報の中に検索文字列が含まれることになるようにと処理するのである。
この処理に従って、この後、同じ検索文字列を指定して画像検索の要求が発行されると、最初の文字列画像検索では検索されなかった画像であっても、今度は、その検索文字列をテキスト情報に含むことになることで文字列画像検索により検索することができるようになる。
ここで、実施形態例では説明しなかったが、本発明の画像検索装置1は、例えば、ユーザに対して、サムネイルと呼ばれる画像のサンプルを使って画像検索結果として提示するようにして、このサムネイルから画像を選択させるようにしている。この提示形態を用いると、通常の全検索結果を提示する形態に比べて、ユーザの選択に対する目的が明確であり、信頼度が高いことにより精度向上も見込まれる。
また、実施形態例では、インターネットのWEBサーバ上で動作する画像検索プログラムがハードディスクなどの記憶媒体に保存され、それが動作することで本発明の画像検索装置1を実現することを想定している。よって、ユーザはネットワークを介してWEBブラウザを利用して本発明の画像検索装置1にアクセスして、クライアント入力受付部105及びクライアント出力部106を通して画像を検索することになるが、本発明はこのような実現形態に限られるものでなくて、スタンドアローンなシステムにもそのまま対応できることは言うまでもない。
本発明の画像検索装置の装置構成の一実施形態例である。 文字列インデックスデータベースのデータ構造の説明図である。 WEBページ収集ロボットの実行するフローチャートである。 本発明の画像検索装置の実行するフローチャートである。 本発明の画像検索装置の実行するフローチャートである。 従来の画像検索装置の装置構成図である。
符号の説明
1 画像検索装置
2 クライアント端末
3 ネットワーク
100 文字列画像検索部
101 類似画像検索部
102 文字列比較・登録部
103 画像データベース
104 文字列インデックスデータベース
105 クライアント入力受付部
106 クライアント出力部

Claims (7)

  1. 入力した検索文字列を基に画像を検索する画像検索方法であって、
    検索対象となる画像に関連付けられたテキスト情報を保存するテキスト情報保存手段に保存されるテキスト情報を検索することで、上記検索文字列をテキスト情報に含む画像を検索する過程と、
    上記検索した画像の中から類似画像検索に用いる画像を選択する過程と、
    検索対象となる画像の中で、上記選択した画像に類似する画像を検索する過程と、
    上記検索した類似画像の中から処理対象の画像を選択する過程と、
    上記処理対象画像の持つテキスト情報が上記検索文字列を含むことになるようにと、上記テキスト情報保存手段に保存されるテキスト情報を変更する過程とを備えることを、
    特徴とする画像検索方法。
  2. 請求項1に記載の画像検索方法において、
    上記変更する過程では、上記処理対象画像の持つテキスト情報に上記検索文字列を追加することで、上記処理対象画像の持つテキスト情報が上記検索文字列を含むように処理することを、
    特徴とする画像検索方法。
  3. 請求項1に記載の画像検索方法において、
    上記変更する過程では、検索対象となる画像に関連付けられたテキスト情報の抽出範囲を拡大して、その拡大した抽出範囲でテキスト情報の抽出を行うことで、上記処理対象画像の持つテキスト情報が上記検索文字列を含むように処理することを、
    特徴とする画像検索方法。
  4. 入力した検索文字列を基に画像を検索する画像検索装置であって、
    検索対象となる画像に関連付けられたテキスト情報を保存するテキスト情報保存手段に保存されるテキスト情報を検索することで、上記検索文字列をテキスト情報に含む画像を検索する手段と、
    上記検索した画像の中から類似画像検索に用いる画像を選択する手段と、
    検索対象となる画像の中で、上記選択した画像に類似する画像を検索する手段と、
    上記検索した類似画像の中から処理対象の画像を選択する手段と、
    上記処理対象画像の持つテキスト情報が上記検索文字列を含むことになるようにと、上記テキスト情報保存手段に保存されるテキスト情報を変更する手段とを備えることを、
    特徴とする画像検索装置。
  5. 請求項4に記載の画像検索装置において、
    上記変更する手段は、上記処理対象画像の持つテキスト情報に上記検索文字列を追加することで、上記処理対象画像の持つテキスト情報が上記検索文字列を含むように処理することを、
    特徴とする画像検索装置。
  6. 請求項4に記載の画像検索装置において、
    上記変更する手段は、検索対象となる画像に関連付けられたテキスト情報の抽出範囲を拡大して、その拡大した抽出範囲でテキスト情報の抽出を行うことで、上記処理対象画像の持つテキスト情報が上記検索文字列を含むように処理することを、
    特徴とする画像検索装置。
  7. 請求項1ないし3のいずれか1項に記載の画像検索方法の実現に用いられる処理をコンピュータに実行させるための画像検索プログラム。
JP2003350374A 2003-10-09 2003-10-09 画像検索方法、画像検索装置及び画像検索プログラム Pending JP2005115721A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003350374A JP2005115721A (ja) 2003-10-09 2003-10-09 画像検索方法、画像検索装置及び画像検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003350374A JP2005115721A (ja) 2003-10-09 2003-10-09 画像検索方法、画像検索装置及び画像検索プログラム

Publications (1)

Publication Number Publication Date
JP2005115721A true JP2005115721A (ja) 2005-04-28

Family

ID=34541948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003350374A Pending JP2005115721A (ja) 2003-10-09 2003-10-09 画像検索方法、画像検索装置及び画像検索プログラム

Country Status (1)

Country Link
JP (1) JP2005115721A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090365A (ja) * 2006-09-29 2008-04-17 Casio Comput Co Ltd 画像検索装置、画像検索プログラム及び画像検索方法
JP2010092476A (ja) * 2008-10-09 2010-04-22 Xerox Corp 表示方法、システムおよび格納媒体
JP2010186296A (ja) * 2009-02-12 2010-08-26 Yahoo Japan Corp 画像検索装置
JP2011210000A (ja) * 2010-03-30 2011-10-20 Yahoo Japan Corp 画像検索装置
JP2014074941A (ja) * 2012-10-02 2014-04-24 Nippon Telegr & Teleph Corp <Ntt> 文字追加プログラム、文字追加方法および情報処理装置
JP2020115321A (ja) * 2018-12-03 2020-07-30 アクセンチュア グローバル ソリューションズ リミテッド テキストドメイン画像検索

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090365A (ja) * 2006-09-29 2008-04-17 Casio Comput Co Ltd 画像検索装置、画像検索プログラム及び画像検索方法
JP2010092476A (ja) * 2008-10-09 2010-04-22 Xerox Corp 表示方法、システムおよび格納媒体
JP2010186296A (ja) * 2009-02-12 2010-08-26 Yahoo Japan Corp 画像検索装置
JP2011210000A (ja) * 2010-03-30 2011-10-20 Yahoo Japan Corp 画像検索装置
JP2014074941A (ja) * 2012-10-02 2014-04-24 Nippon Telegr & Teleph Corp <Ntt> 文字追加プログラム、文字追加方法および情報処理装置
JP2020115321A (ja) * 2018-12-03 2020-07-30 アクセンチュア グローバル ソリューションズ リミテッド テキストドメイン画像検索
US11080324B2 (en) 2018-12-03 2021-08-03 Accenture Global Solutions Limited Text domain image retrieval
JP2022103227A (ja) * 2018-12-03 2022-07-07 アクセンチュア グローバル ソリューションズ リミテッド テキストドメイン画像検索

Similar Documents

Publication Publication Date Title
US20060149700A1 (en) System and method for automatic geospatial web network generation via metadata transformation
US20100114854A1 (en) Map-based websites searching method and apparatus therefor
US20060101007A1 (en) Information processing apparatus and method, and recording medium
JP2010128928A (ja) 検索システム及び検索方法
JP5627332B2 (ja) データ検索装置及びその制御方法、コンピュータプログラム
US20050149853A1 (en) Document display program and method
CN110874254A (zh) 包括计算设备的系统、可读介质及生成帮助系统的方法
US20120120436A1 (en) Remote printing
JP2007114942A (ja) メタデータ生成装置およびメタデータ生成方法
JP2009175775A (ja) 施設検索装置およびこれを用いたカーナビゲーションシステム
US20160117352A1 (en) Apparatus and method for supporting visualization of connection relationship
JP2007128367A (ja) 情報検索ノウハウ管理システム
JP2005115721A (ja) 画像検索方法、画像検索装置及び画像検索プログラム
KR101267918B1 (ko) 인터넷 리소스에 연결된 태그 정보에 관한 검색 결과를제공하는 장치, 방법 및 이를 구현할 수 있는 컴퓨터로읽을 수 있는 기록 매체
JPH10289250A (ja) Wwwブラウザにおけるurl登録及び表示方式
US20080114786A1 (en) Breaking documents
JP2008102773A (ja) データを共通のフォーマットに変換する方法
JP5297295B2 (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP5380874B2 (ja) 情報検索方法、プログラム及び装置
JP2008204198A (ja) 情報提供システム、及び、情報提供プログラム
JP2006309631A (ja) ウェブページデータの検索
JP2005115684A (ja) コンテンツ検索装置及びコンテンツ検索方法
US10789245B2 (en) Semiconductor parts search method using last alphabet deletion algorithm
JP4715031B2 (ja) 構造化文書変換システム及び構造化文書変換プログラム
JP2001350794A (ja) データベース検索用キーワードに基づくコミュニケーション装置及び方法並びに記録媒体