JP2009295104A - ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法 - Google Patents

ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法 Download PDF

Info

Publication number
JP2009295104A
JP2009295104A JP2008150755A JP2008150755A JP2009295104A JP 2009295104 A JP2009295104 A JP 2009295104A JP 2008150755 A JP2008150755 A JP 2008150755A JP 2008150755 A JP2008150755 A JP 2008150755A JP 2009295104 A JP2009295104 A JP 2009295104A
Authority
JP
Japan
Prior art keywords
image
website
search
images
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008150755A
Other languages
English (en)
Inventor
Yuko Matsui
優子 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2008150755A priority Critical patent/JP2009295104A/ja
Publication of JP2009295104A publication Critical patent/JP2009295104A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザの希望に該当する画像を数多く保有するウェブサイトを検索する。
【解決手段】予めウェブ上から収集した画像についてキーワードを抽出し、抽出したキーワードと画像情報をウェブサイト毎にデータベースに記録しておく。ユーザが検索サイトにおいて検索キーワードを入力すると、検索キーワードとデータベースに記録されたキーワードに基づいて、ウェブサイト毎の評価値を算出し、評価値が高いウェブサイト順に表示する。
【選択図】図5

Description

本発明はウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法に係り、特にユーザの希望に該当する画像を数多く保有するウェブサイトを検索するウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法に関する。
従来より、ユーザの希望に最も合致する画像データを検索する装置が数多く考えられてきた。例えば、特許文献1には、検索クエリをインターネット上にある複数のサードパーティ画像検索エンジンに送り、サードパーティ画像検索エンジンからの応答を解析することで、最も合致する画像を出力する装置が記載されている。特許文献1に記載の装置によれば、メタ検索の効率が向上し、ユーザが真に要求している画像データを迅速かつ的確に提示することができる。
特開2002−132832号公報
一方、ウェブ上の画像検索を利用する側のニーズには、さまざまなものがある。デスクトップ画像、自分のホームページ素材、資料に使う素材など、画像自体が目的である場合だけでなく、たくさんの画像を保有するウェブサイトを知りたい場合もある。例えば猫好きの人には、猫を被写体として撮影を続けるカメラマンのウェブサイトや猫に特化したウェブログサイトを簡単に見つけられれば、それらのウェブサイトをお気に入りに登録し、定期的に訪れたり、コメント機能などを利用してサイト運営者とのコミュニケーションが始まったりするであろう。
しかしながら、一般のキーワード入力によるサイト検索では、ウェブサイト内に画像が存在するか否かを判別することはできない。また、画像検索はユーザの望む画像1枚を探し出すことを目的としているため、画像を数多く保有するウェブサイトを探し出すことはできない。このように、ある種類の画像を数多く保持するウェブサイトを探す場合には、有効な手段が存在しないという問題点があった。
本発明はこのような事情に鑑みてなされたもので、ユーザの希望に該当する画像を数多く保有するウェブサイトを検索するウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法を提供することを目的とする。
前記目的を達成するために請求項1に記載のウェブサイト検索装置は、ウェブサイト上に公開されている画像から画像情報を抽出する抽出手段と、前記ウェブサイトと前記画像情報とを関連付けて記憶する記憶手段と、ユーザ端末から送信された検索条件をネットワークを介して受信する手段と、前記受信した検索条件に基づいて前記記憶手段を検索し、ウェブサイト毎の評価値を算出する評価値算出手段と、前記算出した評価値に基づいた検索結果を前記ユーザ端末にネットワークを介して送信する手段とを備えたことを特徴とする。
このように、予めウェブサイト上に公開されている画像について画像情報を収集しておき、検索条件に基づいて画像情報からウェブサイト毎の評価値を算出するので、ユーザの希望に該当する画像を数多く保有するウェブサイトを検索することができる。
請求項2に示すように請求項1に記載のウェブサイト検索装置において、前記抽出手段は、前記画像情報として前記画像に関するキーワードを抽出することを特徴とする。
これにより、簡単に画像情報を得ることができる。
請求項3に示すように請求項2に記載のウェブサイト検索装置において、前記抽出手段は、前記画像を解析することにより前記画像に関するキーワードを抽出することを特徴とする。
これにより、簡単に画像のキーワードを抽出することができる。
請求項4に示すように請求項2に記載のウェブサイト検索装置において、前記抽出手段は、前記画像が掲載されているウェブページのテキスト情報に基づいて前記画像に関するキーワードを抽出することを特徴とする。
これにより、簡単に画像のキーワードを抽出することができる。
請求項5に示すように請求項1から4のいずれかに記載のウェブサイト検索装置において、前記検索条件は、前記ユーザ端末から入力された文字列であることを特徴とする。
これにより、簡単に記憶手段の画像情報を検索することができる。
請求項6に示すように請求項1から4のいずれかに記載のウェブサイト検索装置において、前記検索条件は、前記ユーザ端末から入力された画像から抽出した文字列であることを特徴とする。
これにより、簡単に記憶手段の画像情報を検索することができる。
請求項7に示すように請求項1から4のいずれかに記載のウェブサイト検索装置において、前記検索条件は、前記ユーザ端末から入力されたURLに基づいた画像から抽出した文字列であることを特徴とする。
これにより、簡単に記憶手段の画像情報を検索することができる。
請求項8に示すように請求項1から7のいずれかに記載のウェブサイト検索装置において、前記検索条件は、前記文字列に基づいたキーワード検索式であることを特徴とする。
これにより、検索の精度を上げることができる。
請求項9に示すように請求項8に記載のウェブサイト検索装置において、前記キーワード検索式は、シソーラスを用いて生成されることを特徴とする。
これにより、簡単にキーワード検索式を生成することができる。
請求項10に示すように請求項1に記載のウェブサイト検索装置において、前記抽出手段は、前記画像情報として前記画像の特徴量を抽出することを特徴とする。
これにより、簡単に画像情報を得ることができる。
請求項11に示すように請求項1又は10に記載のウェブサイト検索装置において、前記検索条件は、前記ユーザ端末から入力された画像から抽出した該画像の特徴量であることを特徴とする。
これにより、簡単に記憶手段の画像情報を検索することができる。
請求項12に示すように請求項1、10、11に記載のウェブサイト検索装置において、前記検索条件は、前記ユーザ端末から入力されたURLに基づいた画像から抽出した該画像の特徴量であることを特徴とする。
これにより、簡単に記憶手段の画像情報を検索することができる。
請求項13に示すように請求項10、11、12に記載のウェブサイト検索装置において、前記画像の特徴量は、所定のハッシュ関数に基づいて画像から算出したハッシュ値であることを特徴とする。
これにより、簡単に画像情報を得ることができる。
請求項14に示すように請求項10、11、12に記載のウェブサイト検索装置において、前記抽出手段は、画像から被写体である人物の顔を抽出し、前記抽出した顔から人物を特定する手段を備え、前記画像の特徴量は、前記画像の被写体の人物であることを特徴とする。
これにより、ユーザの希望に該当する人物が被写体の画像を数多く保有するウェブサイトを検索することができる。
請求項15に示すように請求項1から14のいずれかに記載のウェブサイト検索装置において、前記評価値算出手段は、ウェブサイト毎の前記検索条件に合致する画像の数と前記検索条件に合致する画像が占める割合から評価値を算出することを特徴とする。
これにより、適切な評価値を算出することができる。
請求項16に示すように請求項1から15のいずれかに記載のウェブサイト検索装置において、前記検索結果は、前記評価値の高い順にソートされたウェブサイトのリストであることを特徴とする。
これにより、ユーザはわかりやすい検索結果を得ることができる。
請求項17に示すように請求項1から16のいずれかに記載のウェブサイト検索装置において、前記検索結果は、ウェブサイトの名前と共に該ウェブサイトに掲載されている代表画像を含むことを特徴とする。
これにより、ユーザはわかりやすい検索結果を得ることができる。
請求項18に示すように請求項1から17のいずれかに記載のウェブサイト検索装置において、前記検索条件に、さらに画像のファイル形式、画像のサイズ、画像のファイル容量、画像の内容、画像の利用目的のうち少なくとも1つを含むことを特徴とする。
これにより、検索条件を限定することができ、精度良くウェブサイトを検索することができる。
前記目的を達成するために請求項19に記載の画像情報収集サーバは、ウェブサイト上に公開されている画像から画像情報を抽出する抽出手段と、前記ウェブサイトと前記画像情報とを関連付けて記憶する記憶手段とを備えたことを特徴とする。
これにより、簡単にウェブサイト上の画像の画像情報を収集することができ、収集した結果をウェブサイト検索に用いることができる。
前記目的を達成するために請求項20に記載のウェブサイト検索方法は、ウェブサイト上に公開されている画像から画像情報を抽出する抽出工程と、前記ウェブサイトと前記画像情報とを関連付けて記憶手段に記憶する記憶工程と、ユーザ端末から送信された検索条件をネットワークを介して受信する工程と、前記受信した検索条件に基づいて前記記憶手段を検索し、ウェブサイト毎の評価値を算出する工程と、前記算出した評価値に基づいた検索結果を前記ユーザ端末にネットワークを介して送信する工程とを備えたことを特徴とする。
これにより、ユーザの希望に該当する画像を数多く保有するウェブサイトを検索することができる。
本発明によれば、ウェブサイト上に公開されている画像に基づいて評価値を算出するので、ユーザの希望に該当する画像を数多く保有するウェブサイトを検索することが可能となる。
以下、添付図面に従って本発明を実施するための最良の形態について説明する。
<第1の実施の形態>
図1は、本発明が適用されたウェブサイト検索装置10とその使用環境を示す構成図である。同図に示すように、ウェブサイト検索装置10の他、不特定多数のパソコン100、不特定多数のウェブサーバ200がそれぞれ図示しないルータを介してインターネットに接続されている。このように、ウェブサイト検索装置10、パソコン100、ウェブサーバ200は、インターネット300を介した通信が可能となっている。
図2は、ウェブサイト検索装置10の電気的構成を示すブロック図である。同図に示すように、ウェブサイト検索装置10は、クローリング部21、データベース22、データベース管理部23、キーワード抽出部24、画像管理部25、シソーラス26、検索式決定部27、制御部28、入出力部29、メモリ管理部30、及び画像デコーダ/エンコーダ31から構成されている。
入出力部29は、インターネット300とのインターフェースであり、所定のプロトコルを用いて、インターネット300を介してパソコン100やウェブサーバ200と通信を行う。また、ウェブサイト検索装置10は、ウェブサーバとしての機能を備えており、パソコン100のウェブブラウザからのページ要求に対して、必要な情報からウェブページを作成し、これを応答として返すことができる。
クローリング部21は、各ウェブサーバ200から、ウェブ上に公開されている画像とその画像に関連するURL等の情報をインターネット300を介して収集する。
クローリング部21が収集した画像や、ユーザのパソコン100から入出力部29を介して入力された画像は、画像管理部25に送られる。画像管理部25に記憶された画像は、画像デコーダ/エンコーダ31においてデコードされ、キーワード抽出部24は、このデコードされた画像信号を解析し、画像のキーワードを抽出する。なお、キーワードの抽出は、画像が掲載されているウェブサイトのHTMLソース内のテキストから収集してもよい。
データベース管理部23は、クローリング部21が収集した画像のURLとその画像についてキーワード抽出部24が抽出したキーワードを関連付けてデータベース22に記録する。また、入出力部29からの指示に従い、データベース22に記録されたデータの読み出しを行う。
検索式決定部27は、入出力部29から入力された検索ワードから、シソーラス26を用いて検索式を決定する。
メモリ管理部30は、図示しないメモリの資源を以上の各部に割り当てる等、図示しないメモリの管理を行う。
制御部28は、各部を統括制御する。
次に、ウェブサイト検索装置10の動作について説明する。まず、データベース作成の動作について図3を用いて説明する。
最初に、クローリング部21が、各ウェブサーバ200にアップロードされ、ウェブ上に公開されている画像、又は画像のインデックス情報を収集する(ステップS1)。ここで、画像のインデックス情報とは、画像のサムネイルを指す。収集された画像はそれぞれ画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、キーワード抽出部24がこのデコード信号を解析してキーワードを抽出する(ステップS2)。キーワードは1つに限られず、複数抽出される場合もある。
キーワードを抽出すると、データベース管理部23は、抽出したキーワード、画像又は画像のインデックス情報のID等の情報を、画像が掲載されているウェブサイトのURL毎に関連付けてデータベース22に記録する(ステップS3)。以上の処理をクローリングの終了指示があるまで(ステップS4)繰り返す。
このように、ウェブサイト検索装置10は、ウェブ上に公開されている画像を収集し、データベース22を作成する。図4は、データベース22に記録されたデータの一例を示す図である。同図に示すように、データベース22は、URL別にソートすることが望ましい。
次に、ウェブサイト検索装置10の、ウェブサイト検索の動作について図5を用いて説明する。
ユーザがパソコン100を用いてウェブサイト検索装置10が運営する検索サイトにアクセスすると、ウェブサイト検索装置10は、制御部28により検索サイトのHTMLソースを作成し、入出力部29を介してユーザのパソコン100に送信する。これを受信したユーザのパソコン100には、ブラウザによって検索サイトが表示される。この検索サイトは、入力された情報に基づいて、入力情報に関連した画像についての評価値が高いウェブサイトを検索結果として表示する。
ユーザは、この検索サイトにおいて、所望の検索ワードや画像を入力する(ステップS11)。検索ワードは、文字列を入力する。画像を入力する場合は、ユーザのパソコン100のハードディスク等に記録された画像や、パソコン100に接続された記録メディア内部に記録された画像を指定する他、ウェブ上に公開されている画像のURLを指定してもよい。
ユーザが入力した検索ワードや画像は、入出力部29を介してウェブサイト検索装置10に入力される。制御部28は、この入力情報の種類について判定する(ステップS12)。
ユーザが検索ワードを入力した場合は、検索式決定部27は、入力された検索ワードとシソーラス26に基づいてキーワード検索式を決定する(ステップS14)。例えば、入力された検索ワードが「携帯電話」であった場合に、シソーラス26に基づいてキーワード検索式を「携帯電話orケータイor携帯orモバイル」のように決定する。なお、キーワード検索式は、入力されたキーワードだけを用いてもよい。
ユーザが画像を入力した場合は、入力された画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、キーワード抽出部24がこのデコード信号からキーワードを抽出する(ステップS13)。さらに検索式決定部27は、抽出されたキーワードとシソーラス26に基づいてキーワード検索式を決定する(ステップS14)。
ユーザが画像のURLを入力した場合は、入力された画像URLに基づいて、データベース管理部23がデータベース22を参照し、既にデータベース22に登録されている画像か否かを判定する(ステップS15)。
既にデータベース22に登録されている画像の場合は、この画像と関連付けられてデータベース22に記録されているキーワードを読み出し(ステップS18)、検索式決定部27は、読み出したキーワードとシソーラス26に基づいてキーワード検索式を決定する(ステップS14)。
データベース22に登録されていない画像の場合は、制御部28は、入出力部29を介して該当するURLのウェブサーバから画像を取得する。取得した画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、キーワード抽出部24はこのデコード信号からキーワードを抽出する(ステップS16)。データベース管理部23は、取得した画像と抽出したキーワードをデータベース22に登録し(ステップS17)、さらに、検索式決定部27は、抽出されたキーワードとシソーラス26に基づいてキーワード検索式を決定する(ステップS14)。
このように決定されたキーワード検索式に基づいて、データベース22の検索を行う。データベース管理部23は、データベース22に記録されたキーワードと、キーワード検索式とが合致した画像情報を抽出する。また、抽出した画像情報について、画像が掲載されているウェブサイトのURL毎に集計し、ウェブサイト毎の抽出画像数と、ウェブサイト内の全画像における抽出画像数の割合を算出する。
この画像数と割合からウェブサイト毎の評価値を算出する(ステップS19)。評価値の算出は、下記のように予め定められた式を用いて行う。
評価値=f(抽出画像数、抽出画像の割合)…式1
例えば、図6(a)、図6(b)に示すように、画像数から評価値aを、画像割合から評価値bを求め、aとbを加算してもよいし、これらを重み付けして加算してもよい。
制御部28は、算出した評価値の高い順に、ウェブサイトのURL、代表画像、該当する画像の数、該当する画像の割合等を表示するための検索結果ページのHTMLソースを作成し(ステップS20)、入出力部29を介して検索を行ったユーザのパソコン100に送信する。
図7(a)は、検索結果ページのHTMLソースに基づいた、ユーザのパソコン100のブラウザの表示を示す図である。同図は、「猫」という検索ワードに基づいた検索結果を示している。
401は、該当するウェブサイトの数を示しており、同図の例では「猫」に関連する画像を保有しているウェブサイトが1260個見つかったことを示している。402は、該当する1260個のウェブサイトのうち、「猫」という検索ワードについての評価値の順位を示している。前述したように、評価値はウェブサイト内における該当する画像数と画像割合から算出される。
403は、ウェブサイト名を示している。同図の例では、評価値が1位のウェブサイトが「CAT WORLD」というウェブサイトであることを示している。
404は、ウェブサイト内の総画像数と該当する画像数についてバー表示を用いて示したものであり、405は、ウェブサイト内の総画像数と該当する画像数について数値で示したものである。この例では、ウェブサイト「CAT WORLD」内には250枚の画像が存在し、検索ワード「猫」に関連する画像が224枚であることが示されている。したがって、バー表示404全体が母数の250枚を示し、バー表示404の塗りつぶした部分が関連画像の224枚を示している。このようにバー表示を用いることで、画像数と関連する画像の割合を視覚的に確認することが可能となる。
また、406は、そのサイトの代表画像のサムネイル画像である。この例では、ウェブサイト「CAT WORLD」内の代表画像のサムネイル画像が4枚表示されている。代表画像は、データベース22内の関連付けられたキーワードが検索ワードと一致しているものを優先的に表示する。関連付けられたキーワードが多い場合は、被写体が多い画像である可能性があり、関連付けられたキーワードが少ない画像ほど一致度が高くなる。また、キーワードと検索ワードとが一致している画像が多数存在する場合には、ファイル名順や撮影時刻の新しい順などで表示してもよい。また、それぞれの画像について明るさ評価やボケ・ブレ評価を行い、画像の明るさの評価値やピントが合っている評価値の高い画像を優先的に表示してもよいし、画像アノテーションを行って、評価値の高い画像を優先的に表示してもよい。どのキー項目に基づいて表示させるのかを、ユーザが選択できるようにしてもよい。
制御部28は、代表画像に選ばれた画像を該当するウェブサーバ200から取得し、サムネイル画像を作成し、HTMLソースとともにユーザのパソコン100に送信する。なお、サムネイル画像については、クローリング部21が収集した画像のURLとその画像についてキーワード抽出部24が抽出したキーワードを関連付けてデータベース22に記録する際に、同時にデータベース22に記録しておいてもよい。
ウェブサイト名403は、該当ウェブサイトの紹介ページへのリンクが張られ、クリッカブルに構成されている。ユーザがウェブサイト名403にマウスのポインタを置いてマウスをクリックすると、この情報を受けた制御部28は、該当ウェブサイトの紹介ページ用のHTMLソースを作成し、入出力部29を介してユーザのパソコン100に送信する。なお、ウェブサイト名403は、該当ウェブサイトのトップページへリンクを張ってもよい。
パソコン100のブラウザでは、図7(b)に示すように、該当ウェブサイトの紹介ページが表示される(ステップS21)。この紹介ページには、多数の代表画像のサムネイル画像406の他、全画像数、該当画像数、評価値である総合評価を含むウェブサイト紹介412、該当ウェブサイトへのリンクボタン411が表示される。
代表画像のサムネイル画像406については、検索結果ページと同様に、制御部28が該当するウェブサーバ200から画像データを取得してサムネイル画像を作成し、HTMLソースとともにユーザのパソコン100に送信する。
該当ウェブサイトへのリンクボタン411は、該当ウェブサイトのトップページにリンクが張られており、ユーザは、リンクボタン411にマウスのポインタを置いてマウスをクリックすることにより、該当ウェブサイトのトップページへ移動することが可能である。
ウェブサイト紹介412は、全画像数、該当画像数、評価値の他、該当するウェブサイトのテキスト情報が表示される。このテキスト情報は、制御部28が該当するウェブサイトのHTMLソースを取得し、取得したソースのmetaタグのテキスト情報を解析することにより取得する。
紹介ページでは、それぞれの代表画像のサムネイル画像406もクリッカブルに構成され、ユーザが所望の代表画像のサムネイル画像406にマウスのポインタを置いてマウスをクリックすると、図7(c)に示すように、選択された画像ページが表示される。
図7(c)に示すような選択画像ページのHTMLソースは、制御部28により作成されて送信されるが、HTML内の選択画像のリンク先については該当画像のURLとなっており、ユーザのパソコン100のブラウザは、選択画像407についてはウェブサーバ200から取得する。また、選択画像ページにおいても、リンクボタン411が表示される。選択画像ページにおけるリンクボタン411は、選択画像407が掲載されているページにリンクが張られており、ユーザがリンクボタン411にマウスのポインタを置いてマウスをクリックすると、選択画像407が掲載されているページに直接移動することができる。なお、ここでのリンクボタン411についても、紹介ページのリンクボタン411と同様に該当ウェブサイトのトップページにリンクを張ってもよい。
このように、ユーザの希望する画像を数多く含むウェブサイトやユーザの希望する画像の割合が高いウェブサイトを検索することが可能になる。また、キーワード検索を利用することにより、高速に処理することができる。
さらに、ユーザは、該当するウェブサイトにアクセスすることなく、希望する画像を多く保有するウェブサイトの画像のサムネイル画像を閲覧することができる。
本実施の形態では、クローリング部21においてクローリングした結果を記録するデータベースと、検索に用いるデータベースを同一に構成したが、別々に構成してもよい。この場合は、それぞれのデータベースについて定期的に同期を取ればよい。
<第2の実施の形態>
本発明の第2の実施の形態について説明する。第2の実施の形態のウェブサイト検索装置10は、画像の特徴量を用いて希望する画像を多く含むウェブサイトを検索する。
図8は、本実施の形態のウェブサイト検索装置10の電気的構成を示すブロック図である。なお、図2に示すブロック図と共通する部分には同一の符号を付し、その詳細な説明は省略する。
同図に示すように、第2の実施の形態のウェブサイト検索装置10は、特徴量抽出部32、人物データベース33、人物データベース管理部34を備えている。
特徴量抽出部32は、画像デコーダ/エンコーダ31によりデコードされた画像信号から、所定の法則を用いて算出した数値を取得する等の手法を用いて、画像の特徴量を抽出する。
人物データベース33は、著名な人物等、様々な人物の顔特徴量が記憶されているデータベースである。人物データベース管理部34は、入力された画像の顔について、人物データベース33の全ての顔とマッチングさせることで、人物を特定することができる。
次に、ウェブサイト検索装置10の動作について説明する。まず、データベース作成の動作について図9を用いて説明する。
最初に、クローリング部21が、各ウェブサーバ200にアップロードされ、ウェブ上に公開されている画像、又は画像のインデックス情報を収集する(ステップS1)。収集された画像はそれぞれ画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32がこのデコード信号から特徴量を抽出する(ステップS31)。
特徴量を抽出すると、データベース管理部23は、抽出した特徴量、画像又は画像のインデックス情報のID等の情報を関連付けて、画像が掲載されているウェブサイトのURL毎にデータベース22に記録する(ステップS32)。以上の処理をクローリングの終了指示があるまで(ステップS4)繰り返す。図10は、データベース22に記録されたデータの一例を示す図である。
次に、ウェブサイト検索装置10の、ウェブサイト検索の動作について図11を用いて説明する。
第1の実施の形態と同様に、ユーザのパソコン100のブラウザには検索サイトが表示される。ここで、ユーザは、所望の画像を入力する(ステップS41)。制御部28は、この入力情報の種類について判定する(ステップS12)。
ユーザが画像を直接入力した場合は、入力された画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32がこのデコード信号から特徴量を抽出する(ステップS42)。
ユーザが画像のURLを入力した場合は、入力された画像URLに基づいて、データベース管理部23がデータベース22を参照し、既にデータベース22に登録されている画像か否かを判定する(ステップS15)。既にデータベース22に登録されている画像の場合は、この画像と関連付けられてデータベース22に記録されている特徴量を読み出す(ステップS45)。
データベース22に登録されていない画像の場合は、制御部28は、入出力部29を介して該当するURLのウェブサーバから画像を取得する。取得した画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32はこのデコード信号から画像の特徴量を抽出する(ステップS43)。さらに、データベース管理部23は、取得した画像と抽出した特徴量をデータベース22に登録する(ステップS44)。
このように抽出された特徴量に基づいて、データベース22の検索を行う。データベース管理部23は、データベース22に記録されたそれぞれの画像の特徴量と、いま抽出された特徴量との適合度を算出する。なお、特徴量が合致するか否かを判定してもよい。この適合度から、ウェブサイト毎の評価値を下記の式を用いて算出する(ステップS19)。
評価値=f(全画像数、全画像の適合度の和)…式2
なお、ステップS19において各画像の特徴量が合致するか否かを判定した場合は、ウェブサイト毎の評価値は、下記の式を用いてを算出する。
評価値=f(全画像数、該当画像数)…式3
これらの式の具体的な式は、適宜決めればよい。
各ウェブサイトの評価値を算出すると、第1の実施の形態と同様に、制御部28は、算出した評価値の高い順に、検索結果ページをユーザのパソコン100に送信する(ステップS20)。
このように、画像特徴量を利用することで、より限定した、精度の高い検索が可能となる。
なお、ハッシュ関数により画像のハッシュ値を求め、このハッシュ値を画像の特徴量としてもよい。
<第2の実施の形態の変形例>
本発明の第2の実施の形態の変形例について説明する。第2の実施の形態の変形例のウェブサイト検索装置10は、所望の人物が被写体の画像を多く含むウェブサイトを検索する。
まず、ウェブサイト検索装置10のデータベース作成の動作について、図17を用いて説明する。なお、図9に示すフローチャートと共通する部分には同一の符号を付し、その詳細な説明は省略する。
最初に、クローリング部21が、ウェブ上に公開されている画像、又は画像のインデックス情報を収集する(ステップS1)。収集された画像はそれぞれ画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32はこのデコード信号からその画像の被写体の人物の顔の特徴量を抽出する。さらに、抽出した顔の特徴量に基づいて、人物データベース管理部34は、人物データベース33からこの顔の人物名を特定する(ステップS61)。
被写体の人物名を特定すると、データベース管理部23は、特定した人物名、画像又は画像のインデックス情報のID等の情報を関連付けて、画像が掲載されているウェブサイトのURL毎にデータベース22に記録する(ステップS62)。以上の処理をクローリングの終了指示があるまで(ステップS4)繰り返す。
次に、ウェブサイト検索装置10のウェブサイト検索の動作について、図18を用いて説明する。なお、図11に示すフローチャートと共通する部分には同一の符号を付し、その詳細な説明は省略する。
ユーザが、所望の人物の画像を入力する(ステップS63)。制御部28は、この入力情報の種類について判定する(ステップS12)。
ユーザが画像を直接入力した場合は、入力された画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32がこのデコード信号から画像の被写体の人物の顔の特徴量を抽出する。この抽出された顔の特徴量に基づいて、人物データベース管理部34は人物データベース33から人物名を特定する(ステップS64)。
ユーザが画像のURLを入力した場合は、入力された画像URLに基づいて、データベース管理部23がデータベース22を参照し、既にデータベース22に登録されている画像か否かを判定する(ステップS15)。既にデータベース22に登録されている画像の場合は、この画像と関連付けられてデータベース22に記録されている人物名を読み出す(ステップS66)。
データベース22に登録されていない画像の場合は、制御部28は、入出力部29を介して該当するURLのウェブサーバから画像を取得する。取得した画像は画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、特徴量抽出部32はこのデコード信号から被写体の人物の顔の特徴量を抽出し、この抽出された顔の特徴量に基づいて、人物データベース管理部34は人物データベース33から人物名を特定する(ステップS65)。さらに、データベース管理部23は、取得した画像と特定した人物名をデータベース22に登録する(ステップS44)。
このように特定された人物名に基づいて、データベース22の検索を行う。データベース管理部23は、データベース22に記録された人物名と、ユーザが入力した画像から特定した人物名とが合致した画像情報を抽出する。また、抽出した画像情報について、画像が掲載されているウェブサイトのURL毎に集計し、ウェブサイト毎の抽出画像数と、ウェブサイト内の全画像における抽出画像数の割合を算出する。さらに、この画像数と割合からウェブサイト毎の評価値を算出する(ステップS67)。
各ウェブサイトの評価値を算出すると、第1の実施の形態と同様に、制御部28は、算出した評価値の高い順に、検索結果ページをユーザのパソコン100に送信する(ステップS20)。
このように、被写体の人物の顔の特徴量から人物名を特定することで、ユーザが入力した画像の被写体と同一人物が被写体である画像を多く保有するウェブサイトの検索が可能となる。なお、本実施の形態のようにデータベース22に画像情報として被写体の人物名が記録されている場合は、ユーザが検索ワードとして人物名を文字列で入力してもよい。この場合は、入力された人物名に基づいて、データベース管理部23がデータベース22の検索を行う。
また、人物データベース33を用いずに、特徴量抽出部32が抽出した被写体の顔の特徴量をデータベース22に記録してもよい。この場合は、ユーザが入力した画像から特徴量抽出部32が被写体の顔の特徴量を抽出し、データベース22に記録された顔の特徴量と比較することにより、同一人物が被写体の画像情報を抽出する。
<第3の実施の形態>
本発明の第3の実施の形態について説明する。第3の実施の形態のウェブサイト検索装置10は、収集した画像についてカテゴリ分類し、ウェブサイト検索のキーワードにカテゴリを用いる。
図12は、本実施の形態のウェブサイト検索装置10の電気的構成を示すブロック図である。なお、図2に示すブロック図と共通する部分には同一の符号を付し、その詳細な説明は省略する。
同図に示すように、第3の実施の形態のウェブサイト検索装置10は、カテゴリ決定部35を備えている。カテゴリ決定部35は、キーワード抽出部24が抽出した画像のキーワードに基づいて、シソーラス26を用いてこの画像のカテゴリを決定する。
次に、ウェブサイト検索装置10の動作について説明する。まず、データベース作成の動作について図13を用いて説明する。
最初に、クローリング部21が、各ウェブサーバ200にアップロードされ、ウェブ上に公開されている画像、又は画像のインデックス情報を収集する(ステップS1)。収集された画像はそれぞれ画像管理部25に記憶された後画像デコーダ/エンコーダ31によりデコードされ、キーワード抽出部24がこのデコード信号を解析してキーワードを抽出する(ステップS2)。
この抽出されたキーワードに基づいて、カテゴリ決定部35は、シソーラス26を用いて画像のカテゴリを決定する(ステップS51)。カテゴリは、予め定められた言葉として意味のある名称をカテゴリ名としており、1つの画像が複数のカテゴリに属してもよい。
カテゴリは主に、「被写体」「時間」「場所」の3つに分けられている。「被写体」のカテゴリには、例えば、花、食べ物、車、人、海、などが含まれ、「時間」のカテゴリには、例えば、春、夏、秋、冬、ひな祭り、お正月、2008年、2007年などが含まれる。また、「場所」のカテゴリには、例えば、日本、フランス、オーストラリア、海、山、レストラン、などが含まれる。これらのカテゴリは一例であり、どのようなカテゴリに分類してもよく、またカテゴリを階層構造としてもよい。
カテゴリが決定すると、データベース管理部23は、決定したカテゴリ、画像又は画像のインデックス情報のID等の情報を関連付けて、画像が掲載されているウェブサイトのURL毎にデータベース22に記録する(ステップS52)。以上の処理をクローリングの終了指示があるまで(ステップS4)繰り返す。
図14は、データベース22に記録されたデータの一例を示す図である。なお、データベース22には、図15に示すように記録してもよい。図15に示す場合は、各画像が属する複数のカテゴリについて、各カテゴリの和が1となるように重み付けされている。この重み付けは、キーワード抽出部24がデコード信号を解析してキーワードを抽出する際に、被写体の画像に占める割合などから算出する。
なお、適切なカテゴリが見つからない場合や、見つかったが関連度が低い場合には、アラートを出し、システム管理者に告知し、カテゴリの追加等を促してもよい。
次に、ウェブサイト検索装置10の、ウェブサイト検索の動作について図16を用いて説明する。
まず、ユーザのパソコン100のブラウザに、検索サイトが表示される。この検索サイトは、サイト内に表示されたカテゴリの中からユーザが所望のカテゴリを選択することにより、選択したカテゴリに関連する画像を多く含むウェブサイトを検索することが可能となっている。
まず、ユーザが検索サイトに表示されたカテゴリの中から、所望のカテゴリを選択する(ステップS51)。制御部28は、選択されたカテゴリに基づいて、データベース22の検索を行う。データベース管理部23は、データベース22に記録されたキーワードと、選択されたカテゴリとが合致した画像情報を抽出する。また、制御部28は、抽出した画像情報について、画像が掲載されているウェブサイトのURL毎に集計し、ウェブサイト毎の抽出画像数と、ウェブサイト内の全画像における抽出画像数の割合を算出する。
さらに、制御部28は、この画像数と割合からウェブサイト毎の評価値を算出する(ステップS52)。評価値の算出は、前述の式1を用いる。
なお、図15に示すように、各画像について複数のカテゴリが重み付けされて記録されている場合は、ウェブサイト毎の評価値は下記の式を用いて算出する。
評価値=f(全画像数、全画像の関連度の和)…式4
各ウェブサイトの評価値を算出すると、第1の実施の形態と同様に、制御部28は、算出した評価値の高い順に、検索結果ページをユーザのパソコン100に送信する(ステップS20)。
このように、ユーザにカテゴリを選択させることで、検索に不慣れなユーザにも簡単にウェブサイト検索を行うことができ、さらにユーザの希望する画像を多く含む、または割合を高く含むウェブサイトを検索することが可能となる。
第1〜第3の実施の形態では、希望する画像の検索ワードや画像、カテゴリを指定したが、これらの他に、画像の種類を限定できるように構成してもよい。例えば、JPEGやGIFなどのファイル形式、人物写真・風景写真・イラスト・地図等の特殊データなどの画像の内容、画像サイズ、画像の容量、携帯電話への送付・ウェブページの素材・デスクトップ背景などの画像利用の目的、等の条件を指定できるように、ウェブサイト検索サイトの入力項目として用意しておく。
図19は、画像の種類を限定可能に構成した場合のデータベース22に記録されたデータの一例を示す図である。同図に示すように、画像のURLと共に、画像サイズ、画像容量、画像内容、最適な画像利用の目的を記録している。画像内容については、図示しない画像内容判別部により写真、イラスト、地図データ等の判別を行う。また、最適な画像利用の目的については、画像管理部25において画像サイズに基づいて携帯電話での表示に適しているか、パソコンのデスクトップ画像に適しているか等を判別し、また、画像が存在するサイト内の「フリー素材」等のテキスト情報から、ウェブサイト素材に適していることを判定する。
このようにデータベース22に記録しておき、ウェブサイト検索サイトにおいて、検索条件として画像の種類を限定された場合には、これらの項目に基づいて検索すればよい。
以上のように、画像の種類を限定できるように構成することにより、ユーザの希望する条件に適合した画像を多く含むウェブサイトを検索することが可能となる。
図1は、ウェブサイト検索装置10とその使用環境を示す構成図である。 図2は、ウェブサイト検索装置10の電気的構成を示すブロック図である。 図3は、ウェブサイト検索装置10のデータベース作成の動作について示したフローチャートである。 図4は、データベース22に記録されたデータの一例を示す図である。 図5は、ウェブサイト検索装置10のウェブサイト検索の動作について示したフローチャートである。 図6は、ウェブサイト内の全画像数と評価値a、及び該当画像割合と評価値bの関係について示した図である。 図7は、検索結果ページのHTMLソースに基づいた、ユーザのパソコン100のブラウザの表示を示す図である。 図8は、本実施の形態のウェブサイト検索装置10の電気的構成を示すブロック図である。 図9は、第2の実施の形態のウェブサイト検索装置10のデータベース作成の動作について示したフローチャートである。 図10は、第2の実施の形態のデータベース22に記録されたデータの一例を示す図である。 図11は、第2の実施の形態のウェブサイト検索装置10のウェブサイト検索の動作について示したフローチャートである。 図12は、第3の実施の形態のウェブサイト検索装置10のデータベース作成の動作について示したフローチャートである。 図13は、第3の実施の形態のウェブサイト検索装置10のデータベース作成の動作について示したフローチャートである。 図14は、第3の実施の形態のデータベース22に記録されたデータの一例を示す図である。 図15は、第3の実施の形態のデータベース22に記録されたデータの別の一例を示す図である。 図16は、第3の実施の形態のウェブサイト検索装置10のウェブサイト検索の動作について示したフローチャートである。 図17は、第2の実施の形態の変形例のウェブサイト検索装置10のデータベース作成の動作について示したフローチャートである。 図18は、第2の実施の形態の変形例のウェブサイト検索装置10のウェブサイト検索の動作について示したフローチャートである。 図19は、画像の種類を限定可能に構成した場合のデータベース22に記録されたデータの一例を示す図である。
符号の説明
10…ウェブサイト検索装置、21…クローリング部、22…データベース、23…データベース管理部、24…キーワード抽出部、25…画像管理部、26…シソーラス、27…検索式決定部、28…制御部、29…入出力部、32…特徴量抽出部、33…人物データベース、34…人物データベース管理部、35…カテゴリ決定部、100…パソコン、200…ウェブサーバ、300…インターネット、403…ウェブサイト名、404…バー表示、406…代表画像のサムネイル画像、411…リンクボタン

Claims (20)

  1. ウェブサイト上に公開されている画像から画像情報を抽出する抽出手段と、
    前記ウェブサイトと前記画像情報とを関連付けて記憶する記憶手段と、
    ユーザ端末から送信された検索条件をネットワークを介して受信する手段と、
    前記受信した検索条件に基づいて前記記憶手段を検索し、ウェブサイト毎の評価値を算出する評価値算出手段と、
    前記算出した評価値に基づいた検索結果を前記ユーザ端末にネットワークを介して送信する手段と、
    を備えたことを特徴とするウェブサイト検索装置。
  2. 前記抽出手段は、前記画像情報として前記画像に関するキーワードを抽出することを特徴とする請求項1に記載のウェブサイト検索装置。
  3. 前記抽出手段は、前記画像を解析することにより前記画像に関するキーワードを抽出することを特徴とする請求項2に記載のウェブサイト検索装置。
  4. 前記抽出手段は、前記画像が掲載されているウェブページのテキスト情報に基づいて前記画像に関するキーワードを抽出することを特徴とする請求項2に記載のウェブサイト検索装置。
  5. 前記検索条件は、前記ユーザ端末から入力された文字列であることを特徴とする請求項1から4のいずれかに記載のウェブサイト検索装置。
  6. 前記検索条件は、前記ユーザ端末から入力された画像から抽出した文字列であることを特徴とする請求項1から4のいずれかに記載のウェブサイト検索装置。
  7. 前記検索条件は、前記ユーザ端末から入力されたURLに基づいた画像から抽出した文字列であることを特徴とする請求項1から4のいずれかに記載のウェブサイト検索装置。
  8. 前記検索条件は、前記文字列に基づいたキーワード検索式であることを特徴とする請求項1から7のいずれかに記載のウェブサイト検索装置。
  9. 前記キーワード検索式は、シソーラスを用いて生成されることを特徴とする請求項8に記載のウェブサイト検索装置。
  10. 前記抽出手段は、前記画像情報として前記画像の特徴量を抽出することを特徴とする請求項1に記載のウェブサイト検索装置。
  11. 前記検索条件は、前記ユーザ端末から入力された画像から抽出した該画像の特徴量であることを特徴とする請求項1又は10に記載のウェブサイト検索装置。
  12. 前記検索条件は、前記ユーザ端末から入力されたURLに基づいた画像から抽出した該画像の特徴量であることを特徴とする請求項1、10、11に記載のウェブサイト検索装置。
  13. 前記画像の特徴量は、所定のハッシュ関数に基づいて画像から算出したハッシュ値であることを特徴とする請求項10、11、12に記載のウェブサイト検索装置。
  14. 前記画像の特徴量は、前記画像の被写体の顔の特徴量であることを特徴とする請求項10、11、12に記載のウェブサイト検索装置。
  15. 前記評価値算出手段は、ウェブサイト毎の前記検索条件に合致する画像の数と前記検索条件に合致する画像が占める割合から評価値を算出することを特徴とする請求項1から14のいずれかに記載のウェブサイト検索装置。
  16. 前記検索結果は、前記評価値の高い順にソートされたウェブサイトのリストであることを特徴とする請求項1から15のいずれかに記載のウェブサイト検索装置。
  17. 前記検索結果は、ウェブサイトの名前と共に該ウェブサイトに掲載されている代表画像を含むことを特徴とする請求項1から16のいずれかに記載のウェブサイト検索装置。
  18. 前記検索条件に、さらに画像のファイル形式、画像のサイズ、画像のファイル容量、画像の内容、画像の利用目的のうち少なくとも1つを含むことを特徴とする請求項1から17のいずれかに記載のウェブサイト検索装置。
  19. ウェブサイト上に公開されている画像から画像情報を抽出する抽出手段と、
    前記ウェブサイトと前記画像情報とを関連付けて記憶する記憶手段と、
    を備えたことを特徴とする画像情報収集サーバ。
  20. ウェブサイト上に公開されている画像から画像情報を抽出する抽出工程と、
    前記ウェブサイトと前記画像情報とを関連付けて記憶手段に記憶する記憶工程と、
    ユーザ端末から送信された検索条件をネットワークを介して受信する工程と、
    前記受信した検索条件に基づいて前記記憶手段を検索し、ウェブサイト毎の評価値を算出する工程と、
    前記算出した評価値に基づいた検索結果を前記ユーザ端末にネットワークを介して送信する工程と、
    を備えたことを特徴とするウェブサイト検索方法。
JP2008150755A 2008-06-09 2008-06-09 ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法 Pending JP2009295104A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008150755A JP2009295104A (ja) 2008-06-09 2008-06-09 ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008150755A JP2009295104A (ja) 2008-06-09 2008-06-09 ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法

Publications (1)

Publication Number Publication Date
JP2009295104A true JP2009295104A (ja) 2009-12-17

Family

ID=41543203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008150755A Pending JP2009295104A (ja) 2008-06-09 2008-06-09 ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法

Country Status (1)

Country Link
JP (1) JP2009295104A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138512A (ja) * 2009-12-29 2011-07-14 Nhn Corp 重複画像除去時の代表画像の選択方法及びシステム
WO2011105607A1 (ja) * 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
KR20200061858A (ko) * 2018-11-26 2020-06-03 (주)아이티 노매즈 홈페이지 내 비정형 이미지 파일의 개인정보 검출/차단 시스템 및 그 부하 저감 방법
KR102350111B1 (ko) * 2021-04-02 2022-01-12 (주)광개토연구소 사용자의 특정 입력 데이터로부터 추출되는 적어도 하나의 특정 식별어구 및 이에 대응되는 적어도 하나의 도킹결과데이터에 접근할 수 있는 적어도 하나의 위치지정자를 포함한 복합웹페이지를 발행하는 방법 및 이를 이용한 복합웹페이지발행서버

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138512A (ja) * 2009-12-29 2011-07-14 Nhn Corp 重複画像除去時の代表画像の選択方法及びシステム
WO2011105607A1 (ja) * 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
WO2011105608A1 (ja) * 2010-02-26 2011-09-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
CN102782680A (zh) * 2010-02-26 2012-11-14 乐天株式会社 信息处理装置、信息处理方法、记录了信息处理程序的记录介质
JP5075291B2 (ja) * 2010-02-26 2012-11-21 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
JP5259876B2 (ja) * 2010-02-26 2013-08-07 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
US8825670B2 (en) 2010-02-26 2014-09-02 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
US8949267B2 (en) 2010-02-26 2015-02-03 Rakuten, Inc. Information processing device, information processing method, and recording medium that has recorded information processing program
CN102782680B (zh) * 2010-02-26 2016-01-20 乐天株式会社 信息处理装置、信息处理方法、记录了信息处理程序的记录介质
KR20200061858A (ko) * 2018-11-26 2020-06-03 (주)아이티 노매즈 홈페이지 내 비정형 이미지 파일의 개인정보 검출/차단 시스템 및 그 부하 저감 방법
KR102134210B1 (ko) * 2018-11-26 2020-07-15 (주)아이티 노매즈 홈페이지 내 비정형 이미지 파일의 개인정보 검출/차단 시스템 및 그 부하 저감 방법
KR102350111B1 (ko) * 2021-04-02 2022-01-12 (주)광개토연구소 사용자의 특정 입력 데이터로부터 추출되는 적어도 하나의 특정 식별어구 및 이에 대응되는 적어도 하나의 도킹결과데이터에 접근할 수 있는 적어도 하나의 위치지정자를 포함한 복합웹페이지를 발행하는 방법 및 이를 이용한 복합웹페이지발행서버
WO2022211163A1 (ko) * 2021-04-02 2022-10-06 (주)광개토연구소 사용자의 특정 입력 데이터로부터 추출되는 적어도 하나의 특정 식별어구 및 이에 대응되는 적어도 하나의 도킹결과데이터에 접근할 수 있는 적어도 하나의 위치지정자를 포함한 복합웹페이지를 발행하는 방법 및 이를 이용한 복합웹페이지발행서버

Similar Documents

Publication Publication Date Title
JP6448606B2 (ja) 検索エンジンの結果ページ内に目的別アプリケーションを提供する装置、方法、プログラム、及びシステム
US7657504B2 (en) User interface for displaying images of sights
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
JP4936401B2 (ja) ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム
KR101347407B1 (ko) 시각적 주석에 기초하여 검색 결과를 모으는 것에 의한 디지털 이미지 검색
CN100495393C (zh) 用于定制搜索结果的系统和方法
JP5371480B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR101653268B1 (ko) 태그 정보의 처리방법 및 이를 구현하는 클라이언트-서버시스템
US20180004850A1 (en) Method for inputting and processing feature word of file content
JP2010506335A (ja) 場所に関するサイトの識別
JP4868245B2 (ja) 検索システム、検索装置、および検索方法
KR100509276B1 (ko) 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치
KR20080091821A (ko) 휴먼 원조 마이닝 및 자세한 결과들의 캡쳐를 위한 자동화된 툴
JP2005182804A (ja) コンテンツ情報を処理する方法、システム、及びプログラム
CN101751428A (zh) 信息搜索方法及装置
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
JP2009295104A (ja) ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法
JP2007164633A (ja) コンテンツ検索方法及び装置及びプログラム
JP5466133B2 (ja) 画像付文書検索装置及び画像付文書検索プログラム
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP2006268771A (ja) 検索結果提供装置
KR101180371B1 (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム