JP4313738B2 - Image search apparatus and method, program thereof, and recording medium - Google Patents

Image search apparatus and method, program thereof, and recording medium Download PDF

Info

Publication number
JP4313738B2
JP4313738B2 JP2004238768A JP2004238768A JP4313738B2 JP 4313738 B2 JP4313738 B2 JP 4313738B2 JP 2004238768 A JP2004238768 A JP 2004238768A JP 2004238768 A JP2004238768 A JP 2004238768A JP 4313738 B2 JP4313738 B2 JP 4313738B2
Authority
JP
Japan
Prior art keywords
image
character string
information storage
storage means
index information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004238768A
Other languages
Japanese (ja)
Other versions
JP2006059036A (en
Inventor
幸生 植松
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004238768A priority Critical patent/JP4313738B2/en
Publication of JP2006059036A publication Critical patent/JP2006059036A/en
Application granted granted Critical
Publication of JP4313738B2 publication Critical patent/JP4313738B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webに存在する画像を検索するための画像検索装置および方法、そのプログラム及び記録媒体に関する。   The present invention relates to an image search apparatus and method for searching for an image existing on the Web, a program thereof, and a recording medium.

従来において、画像検索装置とは、コンピュータ上で動作する画像(画像データ、画像情報)を検索するシステムのことで、他のコンピュータから入力された情報を元に画像を提示する技術を指している。こうした画像検索装置の一つの例として、図6に従来技術による画像検索装置のシステム構成例を示す。   2. Description of the Related Art Conventionally, an image search device is a system for searching for images (image data and image information) that operate on a computer, and refers to a technique for presenting an image based on information input from another computer. . As an example of such an image search apparatus, FIG. 6 shows a system configuration example of an image search apparatus according to the prior art.

この図6に示す、画像検索装置20は、画像インデックス21と、画像検索部22と、クライアント出力部23と、クライアント入力受付部24と、を備えている。さらに画像検索装置20は、インターネットなどのネットワーク4に接続しており、このネットワーク4を介してクライアント2も接続している。   The image search device 20 shown in FIG. 6 includes an image index 21, an image search unit 22, a client output unit 23, and a client input reception unit 24. Further, the image search device 20 is connected to a network 4 such as the Internet, and the client 2 is also connected via the network 4.

こうした図6に示す従来技術による画像検索装置においては、文字列画像検索と類似画像検索の2種類の検索方法がある。   In the image search apparatus according to the prior art shown in FIG. 6, there are two types of search methods: a character string image search and a similar image search.

まず、文字列画像検索の場合は、画像インデックス21には、Web(ネットワーク4)上の画像をリンクしているページの文章から画像に関連付ける文字列情報を自動的に生成し、これを保存している。   First, in the case of character string image search, the image index 21 automatically generates character string information to be associated with an image from text on a page linked to an image on the Web (network 4), and stores this information. ing.

クライアント入力受付部24よりクライアント2からの画像検索要求に伴う検索文字列が転送され、その文字列について、画像インデックス21に保存されている画像と関連付けられた文字列情報内に当該文字列が存在するか否かが、画像検索部22によって判断される。   A search character string accompanying an image search request from the client 2 is transferred from the client input receiving unit 24, and the character string exists in the character string information associated with the image stored in the image index 21 for the character string. Whether or not to do so is determined by the image search unit 22.

画像検索部22は、検索文字列が文字列情報内に存在する画像の一覧を提示する画面を、クライアント出力部23に転送する。この方法は一般のWeb画像検索サービスに用いられている。   The image search unit 22 transfers a screen that presents a list of images in which the search character string exists in the character string information to the client output unit 23. This method is used for a general Web image search service.

次に、図7に従来技術によるWebページ収集ロボット(Webページ収集手段)が画像インデックスを作成するためのフローチャートを示す。   Next, FIG. 7 shows a flowchart for the Web page collection robot (Web page collection means) according to the prior art to create an image index.

従来技術によるWebページ収集ロボットは、シード(seed)と呼ばれるWebページを収集するための種となるURI(uniform resource identifier)を出発点としてWebページを取得する。   A web page collection robot according to the prior art acquires a web page from a URI (uniform resource identifier) which is a seed for collecting a web page called a seed.

まず、ステップ20:S20でWebページの収集が開始され、ステップ21:S21において、そのシードのWebページをHTTP(Hypertext Transfer Protocol)などのプロトコルを利用してネットワーク上から取得する。   First, collection of web pages is started in step 20: S20, and in step 21: S21, the seed web page is acquired from the network using a protocol such as HTTP (Hypertext Transfer Protocol).

次に、ステップ22:S22において、取得したWebページの内容がテキストなのか、あるいは画像なのかをデータ分類するために、そのWebページを判定する。画像であると判定された場合(YES)は、ステップ27:S27において、その画像を一時保存したあと、画像特徴量やテキスト情報を抽出して保存する。   Next, in step 22: S22, the Web page is determined in order to classify whether the content of the acquired Web page is text or an image. If it is determined that the image is an image (YES), in step 27: S27, after temporarily storing the image, the image feature amount and text information are extracted and stored.

一方、ステップ22:S22においてNoと判定されると、ステップ23:S23において、HTML(Hypertext Mark-up language)等で記述される文字列を解析して、そのWebページがリンクするURIを取得してタグの要素を抽出する。リンクするURIは次の収集時に利用される。   On the other hand, if it is determined No in step 22: S22, a character string described in HTML (Hypertext Markup Language) or the like is analyzed in step 23: S23, and a URI to which the Web page links is obtained. To extract tag elements. The linked URI is used at the next collection.

次に、ステップ24:S24において、そのWebページからタグを取り除いたテキスト情報を抽出する。   Next, in step 24: S24, text information obtained by removing the tag from the Web page is extracted.

次に、ステップ25:S25において、抽出したテキスト情報を保存する。   Next, in step 25: S25, the extracted text information is stored.

この後に、ステップ26:S26において、収集すべきすべてのWebページを取得し終わったことが判定されて、YESの場合は終了となり、NOの場合は再びステップ21:S21へ処理が戻る。   Thereafter, in step 26: S26, it is determined that all Web pages to be collected have been acquired. If YES, the process ends. If NO, the process returns to step 21: S21 again.

なお、更に異なる従来技術である類似画像検索では、画像からあらかじめ画像特徴量(テクスチャ、色等)を抽出し画像インデックスに保存している。画像検索部ではクライアント入力受付部より転送されてきた画像の特徴量を抽出して、その特徴量と画像インデックスに保存される特徴量を比較し、類似していると推測される画像を自動的に判断し、その画像の一覧を提示する画面をクライアント出力部に転送する。(特許文献1〜4を参照)
特開2000−250943 特開平10−240765 特開平11−025271 特開平11−224256
In a similar image search, which is a different conventional technique, image feature amounts (texture, color, etc.) are extracted from an image in advance and stored in an image index. The image search unit extracts the feature amount of the image transferred from the client input reception unit, compares the feature amount with the feature amount stored in the image index, and automatically selects an image that is assumed to be similar. And a screen presenting a list of the images is transferred to the client output unit. (See Patent Documents 1 to 4)
JP 2000-250943 A JP-A-10-240765 JP 11-025271 JP-A-11-224256

上述した従来技術における画像検索装置では、文字列画像検索を行った検索結果の画像を入力として類似画像検索を行う場合、インターネット上のWebページにあるような様々な大きさや画質を対象とした検索をするには、類似画像検索に使用する画像特徴量の次元数が数百次元という大量のデータを必要とし、このため計算量が膨大になっていた。   In the above-described conventional image search apparatus, when similar image search is performed using an image of a search result of character string image search as an input, search for various sizes and image quality as in a Web page on the Internet is performed. In order to do this, a large amount of data in which the number of dimensions of the image feature amount used for the similar image search is several hundred dimensions is required, and the amount of calculation has been enormous.

また、類似画像を自動的に判断する処理の計算量増大に伴うコストが膨大となり、実用的な速度を保ったシステムの構築が難しいという課題があった。   In addition, there is a problem that the cost associated with an increase in the amount of calculation for automatically determining similar images is enormous, and it is difficult to construct a system that maintains a practical speed.

本発明は、これらの課題に鑑みてなされたもので、その目的とするところは、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することにある。   The present invention has been made in view of these problems, and an object of the present invention is to classify information stored in an image index in advance with text information and image feature amounts of Web pages including images. Another object of the present invention is to provide an image search apparatus and method, a program thereof, and a recording medium that can limit the search target of the image search and reduce the calculation amount related to the image search.

課題を解決するために、請求項1に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、前記画像検索要求を発するためのクライアント情報端末と、前記Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、前記Webページ収集手段が抽出した前記
画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に
対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するための文字列画像検索手段と、前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するための類似画像検索手段と、を備え
る。
In order to solve the problem, the present invention according to claim 1 is a client information terminal for issuing an image search request in an image search apparatus for searching for an image contained in a Web page in response to an image search request. Web page collection means for collecting information constituting the web page and extracting images and character strings; and the images and character strings extracted by the web page collection means in advance for classification. Category classification means for associating with set index information for each category, and image index information storage for classifying and storing similar images similar to the image for each category together with the image as an index for search And the image index information storage means, and the character string classified for each category is displayed as the similar image. The character string index information storage means for storing as an index for searching in association with the character string index information storage means, using the character string included in the image search request as a clue, and the character string index information storage means In the meaning of the character string retrieved from the image index information storage means
Character string image search means for presenting the similar image as a plurality of corresponding candidates to the client information terminal, and the similar image selected from the similar images presented to the client information terminal Inquires of the image index information storage means to acquire the image feature amount, and inquires of the character string index information storage means according to the selected similar image to acquire the category information. The image feature amount and the category information And a similar image search means for searching and acquiring an image stored in the image index information storage means and presenting it to the client information terminal again.

また、請求項2に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で処理する画像検索方法において、前記画像検索装置により、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。
According to a second aspect of the present invention, there is provided an image search method for processing an image search apparatus for searching for an image contained in a Web page in response to an image search request, wherein the image search apparatus is used by a client information terminal. The step of issuing the image search request, the step of collecting information constituting the Web page by the Web page collection unit and extracting the image and the character string, and the image extracted by the Web page collection unit by the category classification unit And a step of associating the character string with index information for each category set in advance for classification, and a similar image similar to the image as an index for searching by the image index information storage means together with the image A step of classifying and storing each, and character string index information storage means A step of storing the character string classified for each category in association with the similar image as an index for searching in association with the image index information storage unit; The character string index information storage means is queried using the character string contained therein as a clue, and the character string index information storage means becomes a plurality of candidates corresponding to the meaning of the character string retrieved from the image index information storage means. A step of presenting a similar image to the client information terminal, and an image obtained by inquiring the image index information storage unit according to the similar image selected from the similar images presented to the client information terminal by the similar image retrieval unit. Get the feature value and also the selected similarity The query character string index information storage unit acquires category information, acquires the image feature amount and the category information as a search condition the image index information storage means searches the stored image according to the image, Again presenting to the client information terminal.

また、請求項3に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムにおいて、前記画像検索装置に、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。
According to a third aspect of the present invention, there is provided an image search program to be executed by an image search device for searching for an image included in a Web page in response to an image search request. The step of issuing the image search request by the terminal, the step of collecting the information constituting the Web page by the Web page collection unit and extracting the image and the character string, and the Web page collection unit extracted by the category classification unit A step of associating the image and the character string with index information for each category set in advance for classification; and a similar image similar to the image by the image index information storage means as an index for searching together with the image Categorizing and storing each category, and character string index information Storing the character string classified for each category in association with the similar image and storing it as an index for search in association with the image index information storage unit by a storage unit; and the image search by a character string image search unit Querying the character string index information storage means using the character string included in the request as a clue, and a plurality of candidates corresponding to the meaning of the character string retrieved from the image index information storage means by the character string index information storage means Presenting the similar image to the client information terminal, and inquiring the image index information storage unit according to the similar image selected from the similar images presented to the client information terminal by the similar image search unit To obtain the image feature amount and select Is in accordance with the similar image query to retrieve the category information to the character string index information storage means has, by searching an image stored in the image index information storage means the image feature amount and the category information as a search condition Obtaining and presenting it again to the client information terminal.

また、請求項4に記載の本発明は、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムを記録した記録媒体において、前記画像検索装置に、クライアント情報端末により前記画像検索要求を発するステップと、Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、を有する。 According to a fourth aspect of the present invention, there is provided a recording medium storing an image search program to be executed by an image search device for searching for an image included in a web page in response to an image search request. A step of issuing an image search request to a device by a client information terminal; a step of collecting information constituting the Web page by a Web page collection unit to extract an image and a character string; and a Web page by a category classification unit A step of associating the image extracted by the collecting means and the character string with index information for each category set in advance for classification; and a similar image similar to the image by the image index information storage means for searching A step of classifying and storing together with the image as an index for each category; A column index information storage unit linked with the image index information storage unit, and storing the character strings classified for each category in association with the similar images as a search index; and a character string image search unit A plurality of characters corresponding to the meaning of the character string retrieved from the image index information storage means by the character string index information storage means by querying the character string index information storage means using the character string included in the image search request as a clue. Presenting the similar image as a candidate for the client information terminal to the client information terminal, and storing the image index information according to the similar image selected from the similar images presented to the client information terminal by the similar image search means acquiring an image feature quantity contact the unit Also query acquires category information to the character string index information storage means according to the selected similar image, stored in the image index information storage means the image feature amount and the category information as a search condition Retrieving and obtaining an image, and again presenting the image to the client information terminal.

本発明によれば、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することができる。   According to the present invention, it is possible to classify in advance the information stored in the image index with the text information and the image feature amount of the Web page including the image, it is possible to limit the search target of the image search, and the image search It is possible to provide an image search apparatus and method that can reduce the amount of calculation, a program thereof, and a recording medium.

本発明は、Web(ネットワーク)にある画像(画像データ、画像情報)に対し、所定の文字列(文字列情報)について、その画像に関連付けられたテキスト情報を保存するデータベースに存在するか否かを判断して画像の検索を行う文字列画像検索プログラムと、及び、所定の画像から類似した画像を検索する類似画像検索プログラムと、を組み合わせて構成される画像検索装置および方法、そのプログラム及び記録媒体である。   In the present invention, for an image (image data, image information) on the Web (network), whether or not a predetermined character string (character string information) exists in a database that stores text information associated with the image. Image search apparatus and method, a program and a record thereof, which are a combination of a character string image search program that searches for an image by determining the image and a similar image search program that searches for a similar image from a predetermined image It is a medium.

図1には、本発明の画像検索装置の実施の形態に係る、全体構成を説明するための構成図を示す。   FIG. 1 is a configuration diagram for explaining the overall configuration according to an embodiment of an image search apparatus of the present invention.

この図1には、画像検索装置1が示されており、この画像検索装置1にはインターネット(www)などのネットワーク3およびネットワーク4と、このネットワーク4を介して接続しているクライアント(クライアント情報端末)2と、が接続している。   FIG. 1 shows an image search apparatus 1, and the image search apparatus 1 is connected to a network 3 and a network 4 such as the Internet (www) and a client (client information) connected via the network 4. Terminal) 2 is connected.

画像検索装置1は、その内部にネットワーク4と接続してクライアント2からの入力を受付するためのクライアント入力受付部10と、クライアント2へ情報を出力するためのクライアント出力部9と、ネットワーク3に接続してWebページを収集するためのWebページ収集ロボット(Webページ収集手段)11と、Webページ収集ロボット11が収集したWebページを所定のカテゴリで分類するためのカテゴリ分類部(カテゴリ分類手段)12と、このカテゴリ分類部12で分類された情報を記憶するための画像インデックス(画像インデックス情報記憶手段)5と、および画像インデックス5に連係して動作する文字列インデックス(文字列インデックス情報記憶手段)6と、類似画像画像検索部(類似画像検索手段)7と、文字列画像検索部(文字列画像検索手段)8と、を備えている。   The image search apparatus 1 includes a client input receiving unit 10 for receiving an input from the client 2 connected to the network 4 therein, a client output unit 9 for outputting information to the client 2, and a network 3 A web page collection robot (web page collection means) 11 for connecting and collecting web pages, and a category classification unit (category classification means) for classifying the web pages collected by the web page collection robot 11 into predetermined categories. 12, an image index (image index information storage means) 5 for storing information classified by the category classification unit 12, and a character string index (character string index information storage means) operating in conjunction with the image index 5 ) 6, a similar image image search unit (similar image search means) 7, String image search section includes a (character string image retrieval unit) 8, a.

こうした構成による本発明の画像検索装置1を使って、クライアント2から発せられる画像検索要求に応じて画像検索が実行される。なお、クライアント2は画像検索を行うための検索要求や、あるいは検索した画像を取得して画像表示するための情報端末によって構成されている。また画像とは、画像を構成するための画像データならびに画像情報を含むものである。   An image search is executed in response to an image search request issued from the client 2, using the image search apparatus 1 of the present invention having such a configuration. The client 2 is constituted by a search request for performing an image search or an information terminal for acquiring the searched image and displaying the image. An image includes image data and image information for forming an image.

クライアント2から発せられた画像検索要求は、ネットワーク4を介してクライアント入力受付部10により受付される。このクライアント入力受付部10により受付された画像検索要求は、文字列画像検索部8と類似画像画像検索部7を通して、文字列インデックス6と画像インデックス5に送られて、ここで、要求する画像に関して問い合わせを行う。   An image search request issued from the client 2 is received by the client input receiving unit 10 via the network 4. The image search request received by the client input receiving unit 10 is sent to the character string index 6 and the image index 5 through the character string image search unit 8 and the similar image image search unit 7. Make an inquiry.

この問い合わせに対して、文字列インデックス6は要求された画像に関係する文字列に基づいて、その文字列の意味に関連する複数の候補となる類似画像を、連係して動作する画像インデックス5の中から検索して取得する。   In response to this inquiry, the character string index 6 is based on a character string related to the requested image, and a plurality of candidate similar images related to the meaning of the character string are linked to each other. Search from inside to get.

取得された複数の類似画像は、クライアント出力部9を介してクライアント2に提示され、ここで、クライアント2を操作する図示しない操作者により選択され、この選択指示が入力される。選択された類似画像に基づいて類似画像画像検索部7は画像インデックス5の中から該当する画像を検索して取得する。類似画像検索部7にて取得された画像は、クライアント出力部9を介してクライアント2に提示される。   The acquired plurality of similar images are presented to the client 2 via the client output unit 9, and are selected by an operator (not shown) who operates the client 2, and this selection instruction is input. Based on the selected similar image, the similar image search unit 7 searches and acquires the corresponding image from the image index 5. The image acquired by the similar image search unit 7 is presented to the client 2 via the client output unit 9.

なお、画像インデックス5と文字列インデックス6にそれぞれ記憶されている文字列情報と画像情報(類似画像を含む)とは、インターネットなどのネットワーク3を介して収集された情報である。こうした情報収集はWebページ収集ロボット11により実行される。Webページ収集ロボット11による情報収集は、クライアント2からの画像要求の都度に行ってもよく、あるいは所定の周期で収集してもよい。   The character string information and image information (including similar images) stored in the image index 5 and the character string index 6 are information collected via the network 3 such as the Internet. Such information collection is executed by the web page collection robot 11. Information collection by the Web page collection robot 11 may be performed each time an image is requested from the client 2 or may be collected at a predetermined cycle.

このようなWebページ収集ロボット11により収集された情報は、カテゴリ分類部12により予め設定されたカテゴリ毎に分類される。カテゴリ毎に分類された画像情報は、自身が分類されたカテゴリを示すインデックス情報(索引情報)が付与され、同様に文字列情報にも自身のカテゴリを示すインデックス情報が付与される。その後に、画像インデックス5と文字列インデックス6にそれぞれ整理されて記憶され保存される。   The information collected by the web page collection robot 11 is classified for each preset category by the category classification unit 12. Image information classified for each category is assigned index information (index information) indicating the category into which the image information is classified, and similarly, index information indicating its own category is also assigned to the character string information. Thereafter, the image index 5 and the character string index 6 are organized, stored, and saved.

図2に、本発明の画像検索装置の実施の形態に係る、Webページ収集ロボット11とカテゴリ分類部12とが、文字列インデックス6および画像インデックス5へ記憶する情報を作成するまでのフローチャートを示す。   FIG. 2 shows a flowchart until the Web page collection robot 11 and the category classification unit 12 create information to be stored in the character string index 6 and the image index 5 according to the embodiment of the image search apparatus of the present invention. .

まず、ステップ1:S1にてインターネットなどのネットワーク3に存在するWebページから画像情報の収集が開始される。   First, in step 1: S1, collection of image information is started from a Web page existing on the network 3 such as the Internet.

次に、ステップ2:S2にて、インターネット上のWebページからWebページの情報を取得する。この情報取得において、Webページ収集ロボット11はシード(seed)と呼ばれるWebページを収集するための種となるURI(uniform resource identifier)を出発点としてWebページの情報を取得する。Webページ収集ロボット11は、シードのWebページをHTTP(Hypertext Transfer Protocol)などのプロトコルを利用し、ネットワーク3(インターネット)上のWebページからHTML形式で目的の情報を取得する。   Next, in step 2: S2, Web page information is acquired from a Web page on the Internet. In this information acquisition, the Web page collection robot 11 acquires Web page information from a URI (uniform resource identifier), which is a seed for collecting Web pages called seeds. The web page collection robot 11 uses the protocol such as HTTP (Hypertext Transfer Protocol) for the seed web page, and acquires the target information in the HTML format from the web page on the network 3 (Internet).

次に、ステップ3:S3において、Webページから取得したHTMLを解析し、リンク情報を抽出する。リンク情報にはURIで記述される他のHTMLへのポインタや、画像へのリンクが含まれる。   Next, in step 3: S3, HTML acquired from the Web page is analyzed, and link information is extracted. The link information includes a pointer to another HTML described by a URI and a link to an image.

次に、ステップ4:S4において、Webページから取得したHTMLの解析の結果で得られたリンクの中で、このリンク先が画像であるもののすべてを一時保存する。さらに、こうして一時保存された画像データの中から画像特徴量を抽出する。抽出された画像特徴量は画像インデックス5に保存される。画像インデックス5は、その画像のURIを主キーとして問い合わせを行うことができる。   Next, in step 4: S4, all of the links obtained as a result of the HTML analysis acquired from the Web page whose link destination is an image are temporarily stored. Further, the image feature amount is extracted from the image data temporarily stored in this way. The extracted image feature amount is stored in the image index 5. The image index 5 can make an inquiry using the URI of the image as a primary key.

次に、ステップ5:S5において、入力されたHTMLからテキスト情報を抽出し、次のステップ6:S6にて文字列インデックス6に保存する。なお、ここでいうテキスト情報とは、HTMLから抜き出したテキストや、画像をリンクするタグの近傍のテキスト意味している。なお、本発明では保存する文字列情報を限定するものではない。   Next, in step 5: S5, text information is extracted from the input HTML, and stored in the character string index 6 in next step 6: S6. Note that the text information here means text extracted from HTML or text in the vicinity of a tag to which an image is linked. In the present invention, the character string information to be stored is not limited.

次に、ステップ7:S7において、抽出された画像特徴量とテキスト情報を基にURIが属するカテゴリを自動的に判断し文字列インデックス6のデータベースに保存する。カテゴリ分類を行う方法は様々だが、Naive Bayes、c4.5、SVMなどの機械学習を用いた分類を行ってもよい。   Next, in step 7: S7, the category to which the URI belongs is automatically determined based on the extracted image feature quantity and text information, and stored in the database of the character string index 6. There are various methods for performing category classification, but classification using machine learning such as Naive Bayes, c4.5, and SVM may be performed.

また、その場合には学習器を作るためにカテゴリ情報を事前に付与したデータが必要となる。それ以外の場合では、EMやK-Meansなどを利用したクラスタリングを行い、分類しても構わない。   In that case, in order to create a learning device, data to which category information is given in advance is required. In other cases, clustering using EM or K-Means may be performed for classification.

また、カテゴリ情報を限定するものではないが、カテゴリ情報を事前に付与したデータを与える場合のカテゴリとしては(アイドル、風景、乗り物、食べ物)などに分類してもよい。また、分類できなかったものに関しては、“分類なし”というカテゴリを作る。   Further, the category information is not limited, but the category in the case of giving data with category information given in advance may be classified into (idol, landscape, vehicle, food) and the like. For those that could not be classified, a category of “no classification” is created.

また、前述のWeb画像検索においては、例えば分類に関しては、画像をリンクする元のページを親ページとすると、その親ページの分類を行い、さらにそのWebページに属する画像は親ページが分類されたカテゴリとしてもよいし、画像の周辺テキストを利用して画像そのものをカテゴリ分類してもよい。   In the Web image search described above, for example, regarding the classification, if the original page to which the image is linked is the parent page, the parent page is classified, and the parent page is classified for the images belonging to the Web page. A category may be used, or the image itself may be classified into categories using text around the image.

分類するための情報に、親ページで分類する場合には親ページに属する画像を入力してもよい。ここで自動的に分類されたカテゴリ情報を文字列インデックス6に保存する。   In the case of classification on the parent page, images belonging to the parent page may be input as the information for classification. The category information automatically classified here is stored in the character string index 6.

次に、ステップ8:S8において、収集するすべてのWebページに対してステップ2:S2〜ステップ7:S7までの処理が終了したか否かが判断される。ここで、処理がすべて終了したと判断されると(YES)、ステップ9:S9にてWebページのデータ収集に関する、すべての処理が終了する。一方、処理が終了していないと判断されると(NO)、再び処理はステップ2:S2へ戻り繰り返される。   Next, in step 8: S8, it is determined whether or not the processing from step 2: S2 to step 7: S7 has been completed for all Web pages to be collected. Here, if it is determined that all the processes have been completed (YES), all the processes relating to the data collection of the Web page are completed in step 9: S9. On the other hand, if it is determined that the process has not ended (NO), the process returns to step 2: S2 and is repeated.

図3には、本発明の画像検索装置の実施の形態に係る、文字列インデックス6に記憶し保存されるデータのデータベース15の構成を説明するための説明図を示している。   FIG. 3 is an explanatory diagram for explaining the configuration of the database 15 of data stored and stored in the character string index 6 according to the embodiment of the image search apparatus of the present invention.

この図3に示すデータベース15は、画像URIと、この画像URIを主キーとして分類されたカテゴリ情報と、親ページのURIと、その他のテキスト情報(1)・・・(n)が互いに対応付けされて整理され記憶されている。なお、その他のテキスト情報(1)・・・(n)とは、Webページのタイトルやリンク近傍のテキストを意味している。   The database 15 shown in FIG. 3 associates an image URI, category information classified using the image URI as a primary key, a URI of a parent page, and other text information (1). Have been organized and memorized. The other text information (1)... (N) means the title of the Web page or text near the link.

また、図4には、本発明の画像検索装置の実施の形態に係る、画像インデックス5に記憶し保存されるデータのデータベース16の構成を説明するための説明図を示している。   FIG. 4 is an explanatory diagram for explaining the configuration of the database 16 of data stored and stored in the image index 5 according to the embodiment of the image search device of the present invention.

この画像インデックス5に保存されたデータベース16は、画像URIと、この画像URIを主キーとして関連付けされたカラーヒストグラム(Color Histogram)と、テクスチャ(Texture)と、FEATURE(n)などの種々の画像特徴量が保存されている。   The database 16 stored in the image index 5 includes various image features such as an image URI, a color histogram associated with the image URI as a primary key, a texture, and FEATURE (n). The amount is preserved.

次に示す図5は、本発明の画像検索装置の実施の形態に係る、画像検索方法のフローチャートである。この画像検索方法は、図1に示した画像検索装置1において実行される。   FIG. 5 shown next is a flowchart of the image search method according to the embodiment of the image search apparatus of the present invention. This image search method is executed in the image search apparatus 1 shown in FIG.

まず、ステップ10:S10において、画像検索が開始される。   First, in step 10: S10, an image search is started.

次に、ステップ11:S11において、クライアント入力受付部10より転送されてきたクライアント2からの画像要求に係る文字列を手がかりに、文字列インデックス6に問い合わせを行う。この問い合わせを受けて文字列インデックス6は画像インデックス5に記憶された画像を検索し、クライアント出力部9を通じてクライアント2に画像を提示する。なお、ここで検索されクライアント2に提示される画像は、文字列の意味に類似する類似画像であり、文字列の意味する内容に応じて複数個の類似画像がクライアント2へ提示される。   Next, in step 11: S11, an inquiry is made to the character string index 6 using the character string related to the image request from the client 2 transferred from the client input receiving unit 10 as a clue. In response to this inquiry, the character string index 6 searches the image stored in the image index 5 and presents the image to the client 2 through the client output unit 9. Note that the image retrieved here and presented to the client 2 is a similar image similar to the meaning of the character string, and a plurality of similar images are presented to the client 2 according to the content meant by the character string.

次に、ステップ12:S12において、クライアント出力部9より出力されクライアント2に提示された画像(類似画像)の中から、検索要求した所望の画像に最も近い類似画像をクライアント2を操作する図示しない操作者が選択入力する。   Next, in step 12: S12, the client 2 is operated to operate the similar image closest to the desired image requested to be searched from the images (similar images) output from the client output unit 9 and presented to the client 2. The operator selects and inputs.

次に、ステップ13:S13において、提示された画像のURIから画像インデックス5に問い合わせて画像特徴量を取得する。また、提示された画像URIから文字列インデックス6に問い合わせてカテゴリ情報を取得する。   Next, in step 13: S13, an image feature quantity is acquired by inquiring of the image index 5 from the URI of the presented image. Further, the category information is obtained by inquiring the character string index 6 from the presented image URI.

次に、ステップ14:S14において、文字列インデックス6に問い合わせた結果、カテゴリ情報が“分類なし”(NO)ではなく、存在する(YES)カテゴリだった場合、は、次にステップ16:S16へ処理が進む。   Next, in step 14: S14, if the category information is not “no classification” (NO) but an existing (YES) category as a result of the inquiry to the character string index 6, then the process goes to step 16: S16. Processing proceeds.

このステップ16:S16では、類似画像画像検索部7による類似画像検索の検索条件にカテゴリ情報を加える。例えば、カテゴリ情報に“乗り物”とあった場合、乗り物というカテゴリの中を検索し、こうして画像インデックス5から検索した画像をクライアント2へ提示する。   In this step 16: S16, category information is added to the search conditions for the similar image search by the similar image search unit 7. For example, if the category information is “vehicle”, the vehicle category is searched, and the image searched from the image index 5 is presented to the client 2.

一方、ステップ15:S15では、カテゴリ情報が空欄か、あるいは“分類なし”(NO)であった場合に特にカテゴリ情報を付与せずに画像インデックス5の中から類似画像検索を行い、クライアント出力部9よりクライアント2へ検索した画像を提示する。   On the other hand, in step 15: S15, when the category information is blank or “no classification” (NO), a similar image search is performed from the image index 5 without particularly adding category information, and the client output unit 9 shows the searched image to the client 2.

次に、ステップ17:S17にてクライアント2への画像提示がすべて終了する。   Next, in step 17: S17, all of the image presentation to the client 2 is completed.

以上説明した本発明の実施の形態によれば、画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、画像検索要求を発するためのクライアント情報端末と、Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、Webページ収集手段が抽出した画像と文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、画像に類似する類似画像を検索のためのインデックスとして画像と共にカテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、画像インデックス情報記憶手段と連係し、カテゴリ毎に分類された文字列を類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、画像検索要求に含まれる文字列に対応する類似画像を文字列インデックス情報記憶手段を介して画像インデックス情報記憶手段から検索し、クライアント情報端末へ類似画像を提示するための文字列画像検索手段と、クライアント情報端末に提示された類似画像のうちから選択された類似画像に応じて画像インデックス情報記憶手段に記憶された画像を検索して取得し、再びクライアント情報端末へ提示するための類似画像検索手段と、を備えた画像検索装置を提供することができる。   According to the embodiment of the present invention described above, in an image search apparatus for searching for an image included in a Web page in response to an image search request, a client information terminal for issuing an image search request, and a Web page Web page collection means for collecting constituent information and extracting images and character strings, and image and character strings extracted by the Web page collection means are converted into index information for each category set in advance for classification. In association with category classification means for associating, image index information storage means for classifying and storing similar images similar to images for each category as an index for search, and image index information storage means, To store character strings classified by category in association with similar images as an index for search To retrieve a similar image corresponding to the character string included in the character string index information storage means and the character search request from the image index information storage means via the character string index information storage means, and present the similar image to the client information terminal The image stored in the image index information storage unit is retrieved and acquired in accordance with the similar image selected from the similar image displayed on the client information terminal and the similar image presented on the client information terminal, and again to the client information terminal An image search apparatus comprising similar image search means for presenting can be provided.

また、クライアント情報端末にて選択された類似画像と、文字列インデックス情報記憶手段に記憶されたカテゴリ情報と、を類似画像検索手段の検索条件に含む画像検索装置を提供することができる。   Further, it is possible to provide an image search apparatus that includes the similar image selected by the client information terminal and the category information stored in the character string index information storage unit as search conditions of the similar image search unit.

また、本発明の実施の形態による画像検索装置は、インターネットのWebサーバ上で動作する画像検索プログラムが、ハードディスクなどの記録媒体に保存され、実行されることを想定している。よって、クライアント側はネットワークを介してWebプラウザを利用して画像検索装置1にアクセスし、クライアント入力受付部10及びクライアント出力部9を通じて画像を検索する。この画像検索方法は、ネットワーク3等に接続しない独立のスタンドアローン(stand alone)なコンピュータシステムにも適用することが可能である。   The image search apparatus according to the embodiment of the present invention assumes that an image search program that operates on a Web server on the Internet is stored in a recording medium such as a hard disk and executed. Therefore, the client side accesses the image search apparatus 1 using a Web browser via the network, and searches for an image through the client input reception unit 10 and the client output unit 9. This image retrieval method can also be applied to an independent stand-alone computer system that is not connected to the network 3 or the like.

また、上記本発明の実施の形態における画像検索装置では、この画像検索装置にて実行される情報処理及び構成要素の動作をコンピュータプログラムに置き換えて構築し、例えばCDやDVD、FDなどの記録媒体に記録してもよい。これらの記録媒体をコンピュータシステムに組み込んだり、または記録媒体に記録されたプログラムを通信回線を介してコンピュータシステムにダウンロードしたり、または記録媒体からインストールし、該プログラムでコンピュータシステムを作動させることにより、画像検索装置、および画像検索方法の実現手段として機能させることができるのは勿論であり、このような記録媒体を用いることにより、その流通性を高めることができるものである。   In the image search device according to the embodiment of the present invention, the information processing executed by the image search device and the operation of the constituent elements are replaced with a computer program, and a recording medium such as a CD, DVD, or FD is constructed. May be recorded. By incorporating these recording media into a computer system, or downloading a program recorded on the recording medium to a computer system via a communication line, or installing from the recording medium and operating the computer system with the program, Needless to say, it can function as an image retrieval apparatus and a means for realizing an image retrieval method, and by using such a recording medium, it is possible to improve its distribution.

このように、以上説明した本発明の実施の形態によれば、画像を含むWebページのテキスト情報や画像特徴量をもって画像インデックスに保存される情報を事前に分類することができ、画像検索の検索対象を限定することができ、画像検索に係る計算量を軽減可能な画像検索装置および方法、そのプログラム及び記録媒体を提供することができる。   As described above, according to the embodiment of the present invention described above, the information stored in the image index can be classified in advance with the text information and the image feature amount of the Web page including the image. It is possible to provide an image search apparatus and method, a program, and a recording medium that can limit the target and reduce the amount of calculation related to the image search.

本発明の画像検索装置の実施の形態に係る、全体構成を説明するための構成図を示す。The block diagram for demonstrating the whole structure based on embodiment of the image search device of this invention is shown. 本発明の画像検索装置の実施の形態に係る、Webページ収集ロボット11とカテゴリ分類部12とが、文字列インデックス6および画像インデックス5へ記憶する情報を作成するまでのフローチャートを示す。The flowchart until the web page collection robot 11 and the category classification | category part 12 create the information memorize | stored in the character string index 6 and the image index 5 based on embodiment of the image search device of this invention is shown. 本発明の画像検索装置の実施の形態に係る、文字列インデックス6に記憶し保存されるデータのデータベース15の構成を説明するための説明図を示す。An explanatory view for explaining a configuration of a database 15 of data stored and stored in a character string index 6 according to an embodiment of an image search device of the present invention is shown. 本発明の画像検索装置の実施の形態に係る、画像インデックス5に記憶し保存されるデータのデータベース16の構成を説明するための説明図を示す。An explanatory view for explaining a configuration of a database 16 of data stored and stored in an image index 5 according to an embodiment of an image search device of the present invention is shown. 本発明の画像検索装置の実施の形態に係る、画像検索方法のフローチャートを示す。3 shows a flowchart of an image search method according to an embodiment of an image search apparatus of the present invention. 従来技術のシステム構成を示す。The system structure of a prior art is shown. 従来技術のWebページ収集ロボットが画像インデックスを作成するためのフローチャートを示す。6 shows a flowchart for creating an image index by a prior art web page collection robot.

符号の説明Explanation of symbols

1 画像検索装置
2 クライアント
3 ネットワーク(インターネット)
4 ネットワーク
5 画像インデックス
6 文字列インデックス
7 類似画像画像検索部
8 文字列画像検索部
9 クライアント出力部
10 クライアント入力受付部
11 Webページ収集ロボット(Webページ収集手段)
12 カテゴリ分類部(カテゴリ分類手段)
1 Image search device 2 Client 3 Network (Internet)
DESCRIPTION OF SYMBOLS 4 Network 5 Image index 6 Character string index 7 Similar image image search part 8 Character string image search part 9 Client output part 10 Client input reception part 11 Web page collection robot (Web page collection means)
12 Category classification part (category classification means)

Claims (4)

画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置において、
前記画像検索要求を発するためのクライアント情報端末と、
前記Webページを構成する情報を収集して画像と文字列とを抽出するためのWebページ収集手段と、
前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするためのカテゴリ分類手段と、
前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するための画像インデックス情報記憶手段と、
前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するための文字列インデックス情報記憶手段と、
前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するための文字列画像検索手段と、
前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するための類似画像検索手段と、
を備えることを特徴とする画像検索装置。
In an image search apparatus for searching for an image included in a web page in response to an image search request,
A client information terminal for issuing the image search request;
Web page collection means for collecting information constituting the Web page and extracting images and character strings;
Category classification means for associating the image and the character string extracted by the Web page collection means with index information for each category set in advance for classification;
Image index information storage means for classifying and storing similar images similar to the image as an index for searching together with the image for each category;
Character string index information storage means for linking with the image index information storage means and storing the character strings classified for each category in association with the similar images as an index for search;
A plurality of characters corresponding to the meaning of the character string retrieved from the image index information storage means by the character string index information storage means by querying the character string index information storage means using the character string included in the image search request as a clue. A character string image search means for presenting the similar image as a candidate to the client information terminal;
The image index information storage means is inquired according to the similar image selected from the similar images presented to the client information terminal to acquire the image feature amount, and the image information is acquired according to the selected similar image. Inquires the character string index information storage means to acquire category information, searches and acquires the image stored in the image index information storage means using the image feature quantity and the category information as a search condition , and again the client information terminal Similar image search means for presenting to
An image search apparatus comprising:
画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で処理する画像検索方法において、
前記画像検索装置により、
クライアント情報端末により前記画像検索要求を発するステップと、
Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
を有することを特徴とする画像検索方法。
In an image search method processed by an image search device for searching for an image included in a web page in response to an image search request,
By the image search device,
Issuing the image search request by a client information terminal;
Collecting information constituting the web page by a web page collection means and extracting an image and a character string;
Associating the image and the character string extracted by the web page collection means by category classification means with index information for each category set in advance for classification;
Classifying and storing similar images similar to the image by the image index information storage means together with the image for each category as an index for searching;
Correlating with the image index information storage means by a character string index information storage means, and storing the character strings classified for each category in association with the similar images as a search index;
The character string image search means inquires of the character string index information storage means for a character string included in the image search request, and the character string retrieved from the image index information storage means by the character string index information storage means. Presenting the similar image as a plurality of candidates corresponding to the meaning of the client information terminal;
The image index information storage means is inquired according to the similar image selected from the similar images presented to the client information terminal by the similar image search means to acquire the image feature amount, and the selected similarity Inquires the character string index information storage means according to the image to obtain category information, retrieves and obtains the image stored in the image index information storage means using the image feature amount and the category information as a search condition , Again presenting to the client information terminal;
An image search method characterized by comprising:
画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムにおいて、
前記画像検索装置に、
クライアント情報端末により前記画像検索要求を発するステップと、
Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
を実行させることを特徴とする画像検索プログラム。
In an image search program to be executed by an image search device for searching for an image included in a web page in response to an image search request,
In the image search device,
Issuing the image search request by a client information terminal;
Collecting information constituting the web page by a web page collection means and extracting an image and a character string;
Associating the image and the character string extracted by the web page collection means by category classification means with index information for each category set in advance for classification;
Classifying and storing similar images similar to the image by the image index information storage means together with the image for each category as an index for searching;
Linking with the image index information storage means by a character string index information storage means, and storing the character strings classified for each category in association with the similar images as an index for searching;
The character string image search means inquires of the character string index information storage means for a character string included in the image search request, and the character string retrieved from the image index information storage means by the character string index information storage means. Presenting the similar image as a plurality of candidates corresponding to the meaning of the client information terminal;
The image index information storage unit is inquired according to the similar image selected from the similar images presented to the client information terminal by the similar image search unit to acquire the image feature amount, and the selected similarity Inquires the character string index information storage means according to the image to obtain category information, retrieves and obtains the image stored in the image index information storage means using the image feature amount and the category information as a search condition , Again presenting to the client information terminal;
An image search program characterized in that
画像検索要求に応じてWebページに含まれる画像を検索するための画像検索装置で実行させるための画像検索プログラムを記録した記録媒体において、
前記画像検索装置に、
クライアント情報端末により前記画像検索要求を発するステップと、
Webページ収集手段により前記Webページを構成する情報を収集して画像と文字列とを抽出するステップと、
カテゴリ分類手段により前記Webページ収集手段が抽出した前記画像と前記文字列とを分類のために予め設定されたカテゴリ毎のインデックス情報に関連付けするステップと、
画像インデックス情報記憶手段により前記画像に類似する類似画像を検索のためのインデックスとして前記画像と共に前記カテゴリ毎に分類して記憶するステップと、
文字列インデックス情報記憶手段により前記画像インデックス情報記憶手段と連係し、前記カテゴリ毎に分類された前記文字列を前記類似画像に関連付けて検索のためのインデックスとして記憶するステップと、
文字列画像検索手段により前記画像検索要求に含まれる文字列を手がかりに前記文字列インデックス情報記憶手段に問い合わせ、当該文字列インデックス情報記憶手段によって前記画像インデックス情報記憶手段から検索取得された当該文字列の意味に対応する複数の候補となる前記類似画像を前記クライアント情報端末へ提示するステップと、
類似画像検索手段により前記クライアント情報端末に提示された前記類似画像のうちから選択された類似画像に応じて前記画像インデックス情報記憶手段に問い合わせて画像特徴量を取得し、また、当該選択された類似画像に応じて前記文字列インデックス情報記憶手段に問い合わせてカテゴリ情報を取得し、当該画像特徴量と当該カテゴリ情報を検索条件として前記画像インデックス情報記憶手段に記憶された画像を検索して取得し、再び前記クライアント情報端末へ提示するステップと、
を実行させることを特徴とする画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。
In a recording medium on which an image search program to be executed by an image search device for searching for an image included in a web page in response to an image search request is recorded.
In the image search device,
Issuing the image search request by a client information terminal;
Collecting information constituting the web page by a web page collection means and extracting an image and a character string;
Associating the image and the character string extracted by the web page collection means by category classification means with index information for each category set in advance for classification;
Classifying and storing similar images similar to the image by the image index information storage means together with the image for each category as an index for searching;
Linking with the image index information storage means by a character string index information storage means, and storing the character strings classified for each category in association with the similar images as an index for searching;
The character string image search means inquires of the character string index information storage means for a character string included in the image search request, and the character string retrieved from the image index information storage means by the character string index information storage means. Presenting the similar image as a plurality of candidates corresponding to the meaning of the client information terminal;
The image index information storage unit is inquired according to the similar image selected from the similar images presented to the client information terminal by the similar image search unit to acquire the image feature amount, and the selected similarity Inquires the character string index information storage means according to the image to obtain category information, retrieves and obtains the image stored in the image index information storage means using the image feature amount and the category information as a search condition , Again presenting to the client information terminal;
A computer-readable recording medium on which an image search program is recorded.
JP2004238768A 2004-08-18 2004-08-18 Image search apparatus and method, program thereof, and recording medium Expired - Lifetime JP4313738B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004238768A JP4313738B2 (en) 2004-08-18 2004-08-18 Image search apparatus and method, program thereof, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004238768A JP4313738B2 (en) 2004-08-18 2004-08-18 Image search apparatus and method, program thereof, and recording medium

Publications (2)

Publication Number Publication Date
JP2006059036A JP2006059036A (en) 2006-03-02
JP4313738B2 true JP4313738B2 (en) 2009-08-12

Family

ID=36106469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004238768A Expired - Lifetime JP4313738B2 (en) 2004-08-18 2004-08-18 Image search apparatus and method, program thereof, and recording medium

Country Status (1)

Country Link
JP (1) JP4313738B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8085995B2 (en) * 2006-12-01 2011-12-27 Google Inc. Identifying images using face recognition
KR100940365B1 (en) * 2008-04-11 2010-02-04 엔에이치엔(주) Method, apparatus and computer-readable recording medium for tagging image contained in web page and providing web search service using tagged result
EP2300941A1 (en) * 2008-06-06 2011-03-30 Thomson Licensing System and method for similarity search of images
JP5094918B2 (en) * 2010-06-29 2012-12-12 ヤフー株式会社 User authentication support apparatus and method
JP6727097B2 (en) * 2016-10-24 2020-07-22 ヤフー株式会社 Information processing apparatus, information processing method, and program
JP2020144612A (en) * 2019-03-06 2020-09-10 日本電信電話株式会社 Labeling support method, labeling support device, and program

Also Published As

Publication number Publication date
JP2006059036A (en) 2006-03-02

Similar Documents

Publication Publication Date Title
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
KR101450358B1 (en) Searching structured geographical data
EP0964341A2 (en) Integrated retrieval scheme for retrieving semi-structured documents
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US20060101007A1 (en) Information processing apparatus and method, and recording medium
US9971782B2 (en) Document tagging and retrieval using entity specifiers
WO2018125984A1 (en) Systems and methods for harvesting data associated with fraudulent content in a networked environment
JPH11224256A (en) Information retrieving method and record medium recording information retrieving program
CN107025261B (en) Topic network corpus
JP4313738B2 (en) Image search apparatus and method, program thereof, and recording medium
JP5232054B2 (en) Information provision device
JP5959068B2 (en) Apparatus and method for supporting visualization of connection relation
JP2007128367A (en) Information retrieval knowhow management system
US8131752B2 (en) Breaking documents
JP4606349B2 (en) Topic image extraction method, apparatus, and program
JP4544047B2 (en) Web image search result classification presentation method and apparatus, program, and storage medium storing program
JP5396845B2 (en) Document group detection method and document group detection apparatus
JP5297295B2 (en) WWW information browsing system and method, and Web browser and program
JP2002049638A (en) Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program
JP2007034464A5 (en)
JP5416023B2 (en) Reading terminal and method
JP2005115721A (en) Method, device and program for searching for image
JP3955069B2 (en) Patent application data analysis support system
JP4842921B2 (en) Search system and method
JP2004264928A (en) In-web site retrieval method and device, in-web site retrieval program, and storage medium recording the program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090311

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090515

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4313738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120522

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130522

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140522

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350