JP2003141155A - Webページ検索システムおよびWebページ検索プログラム - Google Patents
Webページ検索システムおよびWebページ検索プログラムInfo
- Publication number
- JP2003141155A JP2003141155A JP2001340535A JP2001340535A JP2003141155A JP 2003141155 A JP2003141155 A JP 2003141155A JP 2001340535 A JP2001340535 A JP 2001340535A JP 2001340535 A JP2001340535 A JP 2001340535A JP 2003141155 A JP2003141155 A JP 2003141155A
- Authority
- JP
- Japan
- Prior art keywords
- search
- web page
- keyword
- search keyword
- operations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 従来、Webページ検索システムは対象とな
るWebページの内容をチェックし、検索キーワードが
タイトルか、また本文中に頻繁に出てくるかを抽出し数
値化することで検索キーワードの適合度を算出し、We
bページを算出した適合度が高い順に表示するようにし
ている。しかし、Webページの収集者と検索者との間
にはキーワードに対する認識の違いが生じるため、検索
結果で表示されるWebページが検索者の期待するもの
と異なるという問題点があった。 【解決手段】 Webページ検索システムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてDBに格
納し、検索結果を表示するとき検索キーワードに関連付
けられた所定操作の操作回数をDBから取得し、その所
定操作の操作回数をもとにして検索キーワードの適合度
を求めてWebページを適合度に順じて表示する手段を
設ける。
るWebページの内容をチェックし、検索キーワードが
タイトルか、また本文中に頻繁に出てくるかを抽出し数
値化することで検索キーワードの適合度を算出し、We
bページを算出した適合度が高い順に表示するようにし
ている。しかし、Webページの収集者と検索者との間
にはキーワードに対する認識の違いが生じるため、検索
結果で表示されるWebページが検索者の期待するもの
と異なるという問題点があった。 【解決手段】 Webページ検索システムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてDBに格
納し、検索結果を表示するとき検索キーワードに関連付
けられた所定操作の操作回数をDBから取得し、その所
定操作の操作回数をもとにして検索キーワードの適合度
を求めてWebページを適合度に順じて表示する手段を
設ける。
Description
【0001】
【発明の属する技術分野】この発明は、インターネット
にあるWebページの情報収集とデータベースへの登録
と、検索者(ユーザ)が入力した検索キーワードを分析
し、分析結果に基づいてデータベースから検索キーワー
ドに合致するWebページを抽出するWebページ検索
システムおよびWebページ検索プログラムに関し、特
に、検索により抽出されたWebページ上で検索者が行
う所定操作の操作回数を検索キーワードと関連付けてデ
ータベースに格納し、検索結果を表示するとき、検索キ
ーワードに関連付けられた所定操作の操作回数をデータ
ベースから取得し、その所定の操作回数をもとにして検
索キーワードの適合度を求め、Webページを適合度に
順じて表示する手段を設けるWebページ検索システム
およびWebページ検索プログラムに関する。
にあるWebページの情報収集とデータベースへの登録
と、検索者(ユーザ)が入力した検索キーワードを分析
し、分析結果に基づいてデータベースから検索キーワー
ドに合致するWebページを抽出するWebページ検索
システムおよびWebページ検索プログラムに関し、特
に、検索により抽出されたWebページ上で検索者が行
う所定操作の操作回数を検索キーワードと関連付けてデ
ータベースに格納し、検索結果を表示するとき、検索キ
ーワードに関連付けられた所定操作の操作回数をデータ
ベースから取得し、その所定の操作回数をもとにして検
索キーワードの適合度を求め、Webページを適合度に
順じて表示する手段を設けるWebページ検索システム
およびWebページ検索プログラムに関する。
【0002】なお、この明細書において、「検索キーワ
ードの適合度」という用語はWebページを検索すると
きに指定する文字列に合致するまたは関連する度合(程
度)を指す。
ードの適合度」という用語はWebページを検索すると
きに指定する文字列に合致するまたは関連する度合(程
度)を指す。
【0003】
【従来の技術】図8を参照して、従来のWebページ検
索システムについて説明する。図8はWebページ例図
である。従来のWebページ検索システムは、対象とな
るWebページの内容をきめ細かくチェックし、例えば
図8(a)または図8(b)のように検索キーワード
「AAA」がタイトルだったり、検索キーワード「AA
A」が本文中に頻繁に出てくれば、Webページの内容
が検索キーワードと合致していると判定している。こう
した要素を抽出して数値化し、検索キーワードの適合度
を算出している。
索システムについて説明する。図8はWebページ例図
である。従来のWebページ検索システムは、対象とな
るWebページの内容をきめ細かくチェックし、例えば
図8(a)または図8(b)のように検索キーワード
「AAA」がタイトルだったり、検索キーワード「AA
A」が本文中に頻繁に出てくれば、Webページの内容
が検索キーワードと合致していると判定している。こう
した要素を抽出して数値化し、検索キーワードの適合度
を算出している。
【0004】そして、この検索キーワードの適合度を用
いることで、検索結果におけるWebページの表示順番
を決めたり、各Webページに適合度を付与したりし
て、検索者(ユーザ)の利便性および満足度を高めるよ
うにしている。
いることで、検索結果におけるWebページの表示順番
を決めたり、各Webページに適合度を付与したりし
て、検索者(ユーザ)の利便性および満足度を高めるよ
うにしている。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
Webページ検索システムは、Webページの収集者
(情報提供者)とWebページの検索者(情報検索者)
との間にはキーワードに対する認識の違いが生じるた
め、検索結果で表示されるWebページが検索者の期待
するものでなかったり、または検索結果でキーワードに
合致するものがなかったりするという問題点があった。
Webページ検索システムは、Webページの収集者
(情報提供者)とWebページの検索者(情報検索者)
との間にはキーワードに対する認識の違いが生じるた
め、検索結果で表示されるWebページが検索者の期待
するものでなかったり、または検索結果でキーワードに
合致するものがなかったりするという問題点があった。
【0006】なお、この問題点を改善するためにWeb
ページ毎にキーワードを付けたり、Webページを分類
別に分けたりする方法があるが、キーワードを付ける作
業および分類する作業に多くのコストが掛かってしま
う。
ページ毎にキーワードを付けたり、Webページを分類
別に分けたりする方法があるが、キーワードを付ける作
業および分類する作業に多くのコストが掛かってしま
う。
【0007】
【課題を解決するための手段】この発明は上記のような
問題点を考慮してなされたもので、Webページ検索シ
ステムおよびWebページ検索プログラムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてデータベ
ースに格納し、検索結果を表示するとき、検索キーワー
ドに関連付けられた所定操作の操作回数をデータベース
から取得し、その所定の操作回数をもとにして検索キー
ワードの適合度を求め、適合度に順じてWebページを
表示する手段を設ける。これにより、検索キーワードに
合致するWebページの検索精度を向上させることがで
き、また検索キーワードに合致するWebページを検索
者が迅速かつ容易に取得することが可能となる。
問題点を考慮してなされたもので、Webページ検索シ
ステムおよびWebページ検索プログラムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてデータベ
ースに格納し、検索結果を表示するとき、検索キーワー
ドに関連付けられた所定操作の操作回数をデータベース
から取得し、その所定の操作回数をもとにして検索キー
ワードの適合度を求め、適合度に順じてWebページを
表示する手段を設ける。これにより、検索キーワードに
合致するWebページの検索精度を向上させることがで
き、また検索キーワードに合致するWebページを検索
者が迅速かつ容易に取得することが可能となる。
【0008】
【発明の実施の形態】(1)インターネットにあるWe
bページの情報収集とデータベースへの登録と、検索者
が入力した検索キーワードを分析し、分析結果に基づい
てデータベースから検索キーワードに合致するWebペ
ージを抽出するWebページ検索システムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてデータベ
ースに格納する手段と、検索結果を表示するとき、検索
キーワードに関連付けられた所定操作の操作回数をデー
タベースから取得し、取得した所定の操作回数から検索
キーワードの適合度を算出し、算出した適合度に順じて
Webページを表示する手段とを設ける。これにより、
検索キーワードに合致するWebページの検索精度を向
上させることが可能となる。
bページの情報収集とデータベースへの登録と、検索者
が入力した検索キーワードを分析し、分析結果に基づい
てデータベースから検索キーワードに合致するWebペ
ージを抽出するWebページ検索システムにおいて、検
索により抽出されたWebページ上で検索者が行う所定
操作の操作回数を検索キーワードと関連付けてデータベ
ースに格納する手段と、検索結果を表示するとき、検索
キーワードに関連付けられた所定操作の操作回数をデー
タベースから取得し、取得した所定の操作回数から検索
キーワードの適合度を算出し、算出した適合度に順じて
Webページを表示する手段とを設ける。これにより、
検索キーワードに合致するWebページの検索精度を向
上させることが可能となる。
【0009】(2)(1)記載のWebページ検索シス
テムにおいて、ファイルダウンロードする操作の操作回
数から検索キーワードの適合度を取得する手段を設け
る。これにより、検索キーワードに合致するWebペー
ジの検索精度を向上させることが可能となる。
テムにおいて、ファイルダウンロードする操作の操作回
数から検索キーワードの適合度を取得する手段を設け
る。これにより、検索キーワードに合致するWebペー
ジの検索精度を向上させることが可能となる。
【0010】(3)(1)または(2)記載の検索シス
テムにおいて、HTML文書を保存する操作の操作回数
から検索キーワードの適合度を取得する手段を設ける。
これにより、検索キーワードに合致するWebページの
検索精度を向上させることが可能となる。
テムにおいて、HTML文書を保存する操作の操作回数
から検索キーワードの適合度を取得する手段を設ける。
これにより、検索キーワードに合致するWebページの
検索精度を向上させることが可能となる。
【0011】(4)(1)、(2)または(3)記載の
Webページ検索システムにおいて、お気に入りに追加
する(ブックマークする)操作の操作回数から検索キー
ワードの適合度を取得する手段を設ける。これにより、
検索キーワードに合致するWebページの検索精度を向
上させることが可能となる。
Webページ検索システムにおいて、お気に入りに追加
する(ブックマークする)操作の操作回数から検索キー
ワードの適合度を取得する手段を設ける。これにより、
検索キーワードに合致するWebページの検索精度を向
上させることが可能となる。
【0012】(5)(1)、(2)、(3)または
(4)記載のWebページ検索システムにおいて、HT
ML文書を印刷する操作の操作回数から検索キーワード
の適合度を取得する手段を設ける。これにより、検索キ
ーワードに合致するWebページの検索精度を向上させ
ることが可能となる。
(4)記載のWebページ検索システムにおいて、HT
ML文書を印刷する操作の操作回数から検索キーワード
の適合度を取得する手段を設ける。これにより、検索キ
ーワードに合致するWebページの検索精度を向上させ
ることが可能となる。
【0013】(6)(1)、(2)、(3)、(4)ま
たは(5)記載のWebページ検索システムにおいて、
HTML文書の一部を複写する(カット・アンド・ペー
ストする)操作の操作回数から検索キーワードの適合度
を取得する手段を設ける。これにより、検索キーワード
に合致するWebページの検索精度を向上させることが
可能となる。
たは(5)記載のWebページ検索システムにおいて、
HTML文書の一部を複写する(カット・アンド・ペー
ストする)操作の操作回数から検索キーワードの適合度
を取得する手段を設ける。これにより、検索キーワード
に合致するWebページの検索精度を向上させることが
可能となる。
【0014】(7)コンピュータを、インターネットに
あるWebページの情報収集とデータベースへの登録を
行う手段と、検索者が入力した検索キーワードを分析
し、分析結果に基づいてデータベースから検索キーワー
ドに合致するWebページを抽出する手段として機能さ
せるためのWebページ検索プログラムにおいて、検索
により抽出されたWebページ上で検索者が行う所定操
作の操作回数を検索キーワードと関連付けてデータベー
スに格納する手段と、検索結果を表示するとき、検索キ
ーワードに関連付けられた所定操作の操作回数をデータ
ベースから取得し、取得した所定の操作回数から検索キ
ーワードの適合度を算出し、算出した適合度に順じてW
ebページを表示する手段とを設ける。これにより、検
索キーワードに合致するWebページの検索精度を向上
させることが可能となる。
あるWebページの情報収集とデータベースへの登録を
行う手段と、検索者が入力した検索キーワードを分析
し、分析結果に基づいてデータベースから検索キーワー
ドに合致するWebページを抽出する手段として機能さ
せるためのWebページ検索プログラムにおいて、検索
により抽出されたWebページ上で検索者が行う所定操
作の操作回数を検索キーワードと関連付けてデータベー
スに格納する手段と、検索結果を表示するとき、検索キ
ーワードに関連付けられた所定操作の操作回数をデータ
ベースから取得し、取得した所定の操作回数から検索キ
ーワードの適合度を算出し、算出した適合度に順じてW
ebページを表示する手段とを設ける。これにより、検
索キーワードに合致するWebページの検索精度を向上
させることが可能となる。
【0015】
【実施例】図1に、本発明のWebページ検索システム
の構成ブロック例図を示す。図中、1は検索サーバ、2
は検索サーバ1にネットワークを介して接続されるクラ
イアントである。
の構成ブロック例図を示す。図中、1は検索サーバ、2
は検索サーバ1にネットワークを介して接続されるクラ
イアントである。
【0016】検索サーバ1にはWWWサーバ14と検索
エンジン11とが設けられ、クライアント2にはWWW
ブラウザ21が設けられている。
エンジン11とが設けられ、クライアント2にはWWW
ブラウザ21が設けられている。
【0017】また検索サーバ1には、検索により抽出さ
れたWebページの参照回数やそのWebページ上で検
索者が行う所定操作の操作回数を検索キーワードと関連
付けて記憶するためのファイル情報テーブル31および
キーワードテーブル32が設けられたデータベース3が
接続されている。
れたWebページの参照回数やそのWebページ上で検
索者が行う所定操作の操作回数を検索キーワードと関連
付けて記憶するためのファイル情報テーブル31および
キーワードテーブル32が設けられたデータベース3が
接続されている。
【0018】また、WWWブラウザ21は、検索により抽
出されたWebページ上で検索者が行う所定操作の操作
回数を検索キーワードとともに検索エンジン11に通知
する操作情報通知部22が設けられている。
出されたWebページ上で検索者が行う所定操作の操作
回数を検索キーワードとともに検索エンジン11に通知
する操作情報通知部22が設けられている。
【0019】また、検索エンジン11は、WWWブラウ
ザ21から通知される検索キーワードとその検索キーワ
ードで抽出されるWebページ上で検索者が行う所定操
作の操作回数とをデータベース3に設けられたファイル
情報テーブル31とキーワードテーブル32とに記憶す
る操作情報更新部13と、検索結果を表示するときに検
索キーワードに関連付けられた所定操作の操作回数をデ
ータベース3のファイル情報テーブル31およびキーワ
ードテーブル32から取得し、取得した所定操作の操作
回数をもとに検索キーワードの適合度を算出する適合度
算出部12とが設けられている。
ザ21から通知される検索キーワードとその検索キーワ
ードで抽出されるWebページ上で検索者が行う所定操
作の操作回数とをデータベース3に設けられたファイル
情報テーブル31とキーワードテーブル32とに記憶す
る操作情報更新部13と、検索結果を表示するときに検
索キーワードに関連付けられた所定操作の操作回数をデ
ータベース3のファイル情報テーブル31およびキーワ
ードテーブル32から取得し、取得した所定操作の操作
回数をもとに検索キーワードの適合度を算出する適合度
算出部12とが設けられている。
【0020】図2〜図7を参照して、本発明のWeb検
索システムの検索処理について説明する。図2は検索処
理の動作説明例図(1)、図3は検索処理の動作説明例
図(2)、図4はファイル情報テーブルとキーワードテ
ーブルの一実施例の構成図、図5は検索処理の表示画面
例図(1)、図6は検索処理の表示画面例図(2)、図
7は検索処理の表示画面例図(3)である。
索システムの検索処理について説明する。図2は検索処
理の動作説明例図(1)、図3は検索処理の動作説明例
図(2)、図4はファイル情報テーブルとキーワードテ
ーブルの一実施例の構成図、図5は検索処理の表示画面
例図(1)、図6は検索処理の表示画面例図(2)、図
7は検索処理の表示画面例図(3)である。
【0021】なお、図4はこの検索処理動作が始まる前
のファイル情報テーブルとキーワードテーブルのデータ
が示されたものである。この例ではファイル情報テーブ
ルの構成は今まで検索処理で参照されたWebページの
ファイル名と、参照回数と、そのWebページを検索し
参照したときのキーワードとWebページを参照してい
るときに所定操作を行った操作回数が格納されるキーワ
ードテーブルへのテーブルポインタとで構成されてい
る。
のファイル情報テーブルとキーワードテーブルのデータ
が示されたものである。この例ではファイル情報テーブ
ルの構成は今まで検索処理で参照されたWebページの
ファイル名と、参照回数と、そのWebページを検索し
参照したときのキーワードとWebページを参照してい
るときに所定操作を行った操作回数が格納されるキーワ
ードテーブルへのテーブルポインタとで構成されてい
る。
【0022】また、この例では所定操作を、ファイルを
ダウンロードする操作、HTML文書を保存する操作、
お気に入りに追加する(ブックマークする)操作、HT
ML文書を印刷する操作、HTML文書の一部を複写す
る(カット・アンド・ペーストする)操作としている。
ダウンロードする操作、HTML文書を保存する操作、
お気に入りに追加する(ブックマークする)操作、HT
ML文書を印刷する操作、HTML文書の一部を複写す
る(カット・アンド・ペーストする)操作としている。
【0023】以下、図2および図3のフローにしたがっ
てある検索キーワードにおける検索処理動作を説明す
る。なお、図2および図3の左側はクライアントの動作
が示され、右側は検索サーバの動作が示されている。
てある検索キーワードにおける検索処理動作を説明す
る。なお、図2および図3の左側はクライアントの動作
が示され、右側は検索サーバの動作が示されている。
【0024】ステップS201:クライアントは検索者
が指示する検索サーバをWWWブラウザでアクセスし、
検索キーワードを検索サーバに送信する。図5は検索サ
ーバをアクセスしたとき、WWWブラウザ上に表示される
画面であり、この例では検索キーワードとして「フリー
ソフト」を取得し、検索処理を実行している。
が指示する検索サーバをWWWブラウザでアクセスし、
検索キーワードを検索サーバに送信する。図5は検索サ
ーバをアクセスしたとき、WWWブラウザ上に表示される
画面であり、この例では検索キーワードとして「フリー
ソフト」を取得し、検索処理を実行している。
【0025】ステップS202:検索サーバはクライア
ントから指示された検索キーワードが含まれるWebペ
ージをデータベースから抽出する。この例では検索キー
ワード「フリーソフト」が含まれるWebページとし
て、AAA、BBB、CCCのファイルが抽出されたも
のとしている。
ントから指示された検索キーワードが含まれるWebペ
ージをデータベースから抽出する。この例では検索キー
ワード「フリーソフト」が含まれるWebページとし
て、AAA、BBB、CCCのファイルが抽出されたも
のとしている。
【0026】ステップS203:抽出したWebページ
毎に検索キーワードに対応した所定操作の操作回数と参
照回数をデータベースから取得し、所定操作の操作回数
の合計を参照回数で除算した値を適合度として設定す
る。
毎に検索キーワードに対応した所定操作の操作回数と参
照回数をデータベースから取得し、所定操作の操作回数
の合計を参照回数で除算した値を適合度として設定す
る。
【0027】なお、図4に示される各ファイルのデータ
から各Webページの適合度は、 AAAの適合度=(4+2)/10=0.6 BBBの適合度=(3+2)/10=0.5 CCCの適合度=(1+1)/5=0.4 となる。
から各Webページの適合度は、 AAAの適合度=(4+2)/10=0.6 BBBの適合度=(3+2)/10=0.5 CCCの適合度=(1+1)/5=0.4 となる。
【0028】ステップS204:抽出したWebページ
を算出した適合度が高い順に並べた検索結果のHTML
文書を作成する。なお、作成されるHTML文書は図6
(a)のようになる。
を算出した適合度が高い順に並べた検索結果のHTML
文書を作成する。なお、作成されるHTML文書は図6
(a)のようになる。
【0029】ステップS205:検索を要求したクライ
アントに作成したHTML文書を送信する。
アントに作成したHTML文書を送信する。
【0030】ステップS206:検索サーバから送信さ
れた検索結果のHTML文書を表示部に表示する。
れた検索結果のHTML文書を表示部に表示する。
【0031】ステップS207:検索者により選択され
たWebページを表示する。検索者が例えば、図6
(a)の矢印Aで示されるBBBを選択したとすると、
図6(b)に示されるようなBBBのページが表示され
る。なお、このBBBのページは用途別のフリーソフト
の一覧を示すページであり、下線部分の文字列はフリー
ソフトのプログラムをダウンロードできるようにリンク
されているものとする。
たWebページを表示する。検索者が例えば、図6
(a)の矢印Aで示されるBBBを選択したとすると、
図6(b)に示されるようなBBBのページが表示され
る。なお、このBBBのページは用途別のフリーソフト
の一覧を示すページであり、下線部分の文字列はフリー
ソフトのプログラムをダウンロードできるようにリンク
されているものとする。
【0032】ステップS208:検索者が選択したWe
bページ上で行う所定操作(ファイルをダウンロードす
る、HTML文書を保存する、お気に入りに追加する、
HTML文書を印刷する、HTML文書の一部を複写す
る)を監視し、いずれかの操作が行われたとき、検索キ
ーワード、Webページ、操作などの操作情報を検索サ
ーバに通知する。
bページ上で行う所定操作(ファイルをダウンロードす
る、HTML文書を保存する、お気に入りに追加する、
HTML文書を印刷する、HTML文書の一部を複写す
る)を監視し、いずれかの操作が行われたとき、検索キ
ーワード、Webページ、操作などの操作情報を検索サ
ーバに通知する。
【0033】なお、この例では図6(b)のWebペー
ジで矢印Bで示されるaaaプログラムのファイルダウ
ンロードとこのWebページをお気に入りに追加する操
作を行ったものとする。
ジで矢印Bで示されるaaaプログラムのファイルダウ
ンロードとこのWebページをお気に入りに追加する操
作を行ったものとする。
【0034】ステップS209:検索サーバはクライア
ントからの操作情報の通知を受付け、通知される操作情
報(Webページ=BBB、検索キーワード=フリーソ
フト、操作=ファイルダウンロードとお気に入りの追
加)に対応するキーワードテーブルの操作回数およびフ
ァイル情報テーブルの参照回数を更新する。
ントからの操作情報の通知を受付け、通知される操作情
報(Webページ=BBB、検索キーワード=フリーソ
フト、操作=ファイルダウンロードとお気に入りの追
加)に対応するキーワードテーブルの操作回数およびフ
ァイル情報テーブルの参照回数を更新する。
【0035】この処理により、図4の矢印Cで示される
ファイル情報テーブルのBBBページの参照回数は10
から11に、またBBBページのキーワードテーブルに
おけるファイルダウンロードの操作回数は3から4に、
お気に入りの追加の操作回数は2から3に更新される。
ファイル情報テーブルのBBBページの参照回数は10
から11に、またBBBページのキーワードテーブルに
おけるファイルダウンロードの操作回数は3から4に、
お気に入りの追加の操作回数は2から3に更新される。
【0036】ステップS210:検索者が検索結果の表
示に戻る操作を行ったかを判定する。検索結果に戻る操
作を行ったならばステップS207に戻り、検索結果に
戻る操作を行わなかったならば処理を終了する。
示に戻る操作を行ったかを判定する。検索結果に戻る操
作を行ったならばステップS207に戻り、検索結果に
戻る操作を行わなかったならば処理を終了する。
【0037】このような処理を行うことで、このあと他
の検索者が同じ検索キーワード「フローソフト」で検索
処理を実行したとすると、ステップS203で行われる
各Webページの適合度は AAAの適合度=(4+2)/10=0.6 BBBの適合度=(4+3)/11=0.63 CCCの適合度=(1+1)/5=0.4 となり、ステップS204で作成される検索結果のHT
ML文書は図7のようにBBBがAAAより先に表示さ
れるようになる。
の検索者が同じ検索キーワード「フローソフト」で検索
処理を実行したとすると、ステップS203で行われる
各Webページの適合度は AAAの適合度=(4+2)/10=0.6 BBBの適合度=(4+3)/11=0.63 CCCの適合度=(1+1)/5=0.4 となり、ステップS204で作成される検索結果のHT
ML文書は図7のようにBBBがAAAより先に表示さ
れるようになる。
【0038】なお、この例ではWebページの適合度
は、所定操作の操作回数を単純に合計し、参照回数で除
算するようにしたが、所定操作毎に重み付けの係数を設
けるようにしてもよい。
は、所定操作の操作回数を単純に合計し、参照回数で除
算するようにしたが、所定操作毎に重み付けの係数を設
けるようにしてもよい。
【0039】
【発明の効果】この発明は、上記に説明したような形態
で実施され、以下の効果がある。
で実施され、以下の効果がある。
【0040】検索キーワードに合致するWebページの
検索精度を向上させることが可能となる。また、検索者
は検索キーワードに合致するWebページを迅速かつ容
易に取得することが可能となる。
検索精度を向上させることが可能となる。また、検索者
は検索キーワードに合致するWebページを迅速かつ容
易に取得することが可能となる。
【図1】 本発明のWebページ検索システムの構成ブ
ロック例図である。
ロック例図である。
【図2】 検索処理の動作説明例図(1)である。
【図3】 検索処理の動作説明例図(2)である。
【図4】 ファイル情報テーブルとキーワードテーブル
の一実施例の構成図である。
の一実施例の構成図である。
【図5】 検索処理の表示画面例図(1)である。
【図6】 検索処理の表示画面例図(2)である。
【図7】 検索処理の表示画面例図(3)である。
【図8】 Webページ例図である。
1 検索サーバ
2 クライアント
3 データベース
11 検索エンジン
12 適合度算出部
13 操作情報更新部
14 WWWサーバ
21 WWWブラウザ
22 操作情報通知部
31 ファイル情報テーブル
32 キーワードテーブル
Claims (7)
- 【請求項1】 インターネットにあるWebページの情
報収集とデータベースへの登録と、検索者が入力した検
索キーワードを分析し、分析結果に基づいてデータベー
スから検索キーワードに合致するWebページを抽出す
るWebページ検索システムにおいて、 検索により抽出されたWebページ上で検索者が行う所
定操作の操作回数を検索キーワードと関連付けてデータ
ベースに格納する手段と、 検索結果を表示するとき、検索キーワードに関連付けら
れた所定操作の操作回数をデータベースから取得し、取
得した所定の操作回数から検索キーワードの適合度を算
出し、算出した適合度に順じてWebページを表示する
手段とを設けることを特徴とするWebページ検索シス
テム。 - 【請求項2】 請求項1記載のWebページ検索システ
ムにおいて、 ファイルダウンロードする操作の操作回数から検索キー
ワードの適合度を取得する手段を設けることを特徴とす
るWebページ検索システム。 - 【請求項3】 請求項1または2記載の検索システムに
おいて、 HTML文書を保存する操作の操作回数から検索キーワ
ードの適合度を取得する手段を設けることを特徴とする
検索システム。 - 【請求項4】 請求項1、2または3記載のWebペー
ジ検索システムにおいて、 お気に入りに追加する操作の操作回数から検索キーワー
ドの適合度を取得する手段を設けることを特徴とするW
ebページ検索システム。 - 【請求項5】 請求項1、2、3または4記載のWeb
ページ検索システムにおいて、 HTML文書を印刷する操作の操作回数から検索キーワ
ードの適合度を取得する手段を設けることを特徴とする
Webページ検索システム。 - 【請求項6】 請求項1、2、3、4または5記載のW
ebページ検索システムにおいて、 HTML文書の一部を複写する操作の操作回数から検索
キーワードの適合度を取得する手段を設けることを特徴
とするWebページ検索システム。 - 【請求項7】 コンピュータを、インターネットにあ
るWebページの情報収集とデータベースへの登録を行
う手段と、検索者が入力した検索キーワードを分析し、
分析結果に基づいてデータベースから検索キーワードに
合致するWebページを抽出する手段として機能させる
ためのWebページ検索プログラムにおいて、 検索により抽出されたWebページ上で検索者が行う所
定操作の操作回数を検索キーワードと関連付けてデータ
ベースに格納する手段と、 検索結果を表示するとき、検索キーワードに関連付けら
れた所定操作の操作回数をデータベースから取得し、取
得した所定の操作回数から検索キーワードの適合度を算
出し、算出した適合度に順じてWebページを表示する
手段とを設けることを特徴とするWebページ検索プロ
グラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001340535A JP2003141155A (ja) | 2001-11-06 | 2001-11-06 | Webページ検索システムおよびWebページ検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001340535A JP2003141155A (ja) | 2001-11-06 | 2001-11-06 | Webページ検索システムおよびWebページ検索プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003141155A true JP2003141155A (ja) | 2003-05-16 |
Family
ID=19154715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001340535A Pending JP2003141155A (ja) | 2001-11-06 | 2001-11-06 | Webページ検索システムおよびWebページ検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003141155A (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008511057A (ja) * | 2004-08-19 | 2008-04-10 | クラリア コーポレイション | エンドユーザの情報要求に応答するための方法及び装置 |
KR100900467B1 (ko) | 2008-01-16 | 2009-06-02 | 넷다이버(주) | 개인 미디어 검색 서비스 시스템 및 방법 |
JP2010061178A (ja) * | 2008-08-05 | 2010-03-18 | Ricoh Co Ltd | 情報処理装置、情報検索システム、情報処理方法およびプログラム |
JP2011054189A (ja) * | 2005-05-06 | 2011-03-17 | Nhn Corp | 個人化検索方法および個人化検索システム |
US8073866B2 (en) | 2005-03-17 | 2011-12-06 | Claria Innovations, Llc | Method for providing content to an internet user based on the user's demonstrated content preferences |
JP2011248730A (ja) * | 2010-05-28 | 2011-12-08 | Ntt Docomo Inc | サーバ装置、ジャンルスコア算出方法およびプログラム |
US8078602B2 (en) | 2004-12-17 | 2011-12-13 | Claria Innovations, Llc | Search engine for a computer network |
US8086697B2 (en) | 2005-06-28 | 2011-12-27 | Claria Innovations, Llc | Techniques for displaying impressions in documents delivered over a computer network |
US8170912B2 (en) | 2003-11-25 | 2012-05-01 | Carhamm Ltd., Llc | Database structure and front end |
US8255413B2 (en) | 2004-08-19 | 2012-08-28 | Carhamm Ltd., Llc | Method and apparatus for responding to request for information-personalization |
US8316003B2 (en) | 2002-11-05 | 2012-11-20 | Carhamm Ltd., Llc | Updating content of presentation vehicle in a computer network |
US8689238B2 (en) | 2000-05-18 | 2014-04-01 | Carhamm Ltd., Llc | Techniques for displaying impressions in documents delivered over a computer network |
US9495446B2 (en) | 2004-12-20 | 2016-11-15 | Gula Consulting Limited Liability Company | Method and device for publishing cross-network user behavioral data |
-
2001
- 2001-11-06 JP JP2001340535A patent/JP2003141155A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8689238B2 (en) | 2000-05-18 | 2014-04-01 | Carhamm Ltd., Llc | Techniques for displaying impressions in documents delivered over a computer network |
US8316003B2 (en) | 2002-11-05 | 2012-11-20 | Carhamm Ltd., Llc | Updating content of presentation vehicle in a computer network |
US8170912B2 (en) | 2003-11-25 | 2012-05-01 | Carhamm Ltd., Llc | Database structure and front end |
JP2008511057A (ja) * | 2004-08-19 | 2008-04-10 | クラリア コーポレイション | エンドユーザの情報要求に応答するための方法及び装置 |
US8255413B2 (en) | 2004-08-19 | 2012-08-28 | Carhamm Ltd., Llc | Method and apparatus for responding to request for information-personalization |
US8078602B2 (en) | 2004-12-17 | 2011-12-13 | Claria Innovations, Llc | Search engine for a computer network |
US9495446B2 (en) | 2004-12-20 | 2016-11-15 | Gula Consulting Limited Liability Company | Method and device for publishing cross-network user behavioral data |
US8073866B2 (en) | 2005-03-17 | 2011-12-06 | Claria Innovations, Llc | Method for providing content to an internet user based on the user's demonstrated content preferences |
JP2011054189A (ja) * | 2005-05-06 | 2011-03-17 | Nhn Corp | 個人化検索方法および個人化検索システム |
US8086697B2 (en) | 2005-06-28 | 2011-12-27 | Claria Innovations, Llc | Techniques for displaying impressions in documents delivered over a computer network |
KR100900467B1 (ko) | 2008-01-16 | 2009-06-02 | 넷다이버(주) | 개인 미디어 검색 서비스 시스템 및 방법 |
JP2010061178A (ja) * | 2008-08-05 | 2010-03-18 | Ricoh Co Ltd | 情報処理装置、情報検索システム、情報処理方法およびプログラム |
JP2011248730A (ja) * | 2010-05-28 | 2011-12-08 | Ntt Docomo Inc | サーバ装置、ジャンルスコア算出方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6145003A (en) | Method of web crawling utilizing address mapping | |
KR101775883B1 (ko) | 정보 스트림의 정보를 처리하는 방법 및 시스템 | |
US8583808B1 (en) | Automatic generation of rewrite rules for URLs | |
US6272490B1 (en) | Document data linking apparatus | |
US20070067304A1 (en) | Search using changes in prevalence of content items on the web | |
JP3803961B2 (ja) | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム | |
JP2003141155A (ja) | Webページ検索システムおよびWebページ検索プログラム | |
US20080140613A1 (en) | Direct navigation for information retrieval | |
JP4875911B2 (ja) | コンテンツ特定方法及び装置 | |
US20030018669A1 (en) | System and method for associating a destination document to a source document during a save process | |
JPH10143519A (ja) | Url順序付け方法およびその装置 | |
US7895337B2 (en) | Systems and methods of generating a content aware interface | |
JP2001060165A (ja) | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 | |
JP2003271609A (ja) | 情報監視装置及び情報監視方法 | |
JP2005018530A (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
US20080256058A1 (en) | Highlighting of Search Terms in a Meta Search Engine | |
JP3186960B2 (ja) | 情報検索方法およびその装置 | |
JP2004206492A (ja) | ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 | |
JP2002149668A (ja) | インターネット補助ソフトウェア及び該プログラムを記録した記録媒体 | |
JP3666638B2 (ja) | 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2003006221A (ja) | 予測分析型検索システム、予測分析型検索方法およびコンピュータプログラム | |
JP2000227886A (ja) | 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体 | |
JP2000172680A (ja) | 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム | |
EP0953921A2 (en) | Device and method for information processing and storage medium containing a control program for information processing | |
KR100371805B1 (ko) | 관련 웹 사이트 제공 방법 및 시스템 |