JP2004264928A - Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 - Google Patents
Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2004264928A JP2004264928A JP2003052316A JP2003052316A JP2004264928A JP 2004264928 A JP2004264928 A JP 2004264928A JP 2003052316 A JP2003052316 A JP 2003052316A JP 2003052316 A JP2003052316 A JP 2003052316A JP 2004264928 A JP2004264928 A JP 2004264928A
- Authority
- JP
- Japan
- Prior art keywords
- site
- search
- page
- terminal device
- internal structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】サイト検索において、検索者に対して、サイト内構造を可視化し、分かりやすいサイト内ナビゲーションを行う。
【解決手段】事前にWebページを収集してサイト分けし各サイト木構造を推定して、各Webページとサイトの関係と共にDB3に保存しておく。サイト検索エンジン1は、サイト検索要求に基づいてヒットしたWebページについてDB3に対しサイト検索を行う。サイト検索結果生成・ナビゲーション部2は、サイト内部構造を提示するためのナビゲーションボタンをリンクとして持つサイト検索結果を生成しサイト検索端末装置に送信し、サイト検索端末装置から該リンクが送信された場合には、当該サイトのサイト木構造をDB3から取得して当該サイト検索端末装置に送信する。これを基にサイト検索端末装置は、ヒットページを示唆するハイライト表示を行って初期サイトマップを生成、描画する。
【選択図】 図1
【解決手段】事前にWebページを収集してサイト分けし各サイト木構造を推定して、各Webページとサイトの関係と共にDB3に保存しておく。サイト検索エンジン1は、サイト検索要求に基づいてヒットしたWebページについてDB3に対しサイト検索を行う。サイト検索結果生成・ナビゲーション部2は、サイト内部構造を提示するためのナビゲーションボタンをリンクとして持つサイト検索結果を生成しサイト検索端末装置に送信し、サイト検索端末装置から該リンクが送信された場合には、当該サイトのサイト木構造をDB3から取得して当該サイト検索端末装置に送信する。これを基にサイト検索端末装置は、ヒットページを示唆するハイライト表示を行って初期サイトマップを生成、描画する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、WWW(ワールド・ワイド・ウェブ)上のWeb情報をサイト単位で検索者に提供するためのWeb情報の検索方法および装置に係り、特にサイト検索結果においてサイト内ナビゲーションを行う機能を持つサイト内検索方法および装置に関する。
【0002】
【従来の技術】
WWWは、Webページ集合をリンク関係を持たせたハイパーメディア情報として蓄積しており、検索者はURL(ユニバーサル・リソース・ロケータ)で規定されるWebサーバにたどり着き、Webページの検索とそのリンク関係を辿ることで目的とするWebページ集合の情報を取得することができる。
【0003】
上記のURLが不明な場合や検索範囲を拡張する場合のWeb情報の提供システムとして、検索エンジンを利用したサービスがある。検索エンジンは、WWWページを自動収集するロボット型検索エンジンにより、ハイパーテキストのリンクを辿りながら多数のWebページを収集しサイトに分けてデータベースを構築しておき、Webサイトの情報を検索者にサービス提供している。
【0004】
このようにして検索されたWebサイト内を参照する技術としては、下記の特許文献1および2の例がある。特許文献1は、特定Webサーバの検索結果をサイトマップの一部として提示する技術である。特許文献2は、サイトの各ページが有する属性に基づきサイトマップを動的に作成する技術である。
【0005】
【特許文献1】
特開2001−125931号公報
【0006】
【特許文献2】
特開2000−305835号公報
【0007】
【発明が解決しようとする課題】
しかしながら、上記特許文献1の技術における問題点は、検索者はサイト内でヒットしたページの周辺部分の構造を参照することしかできないため、サイト内ナビゲーションツールとしての利用には不適である点である。
【0008】
また、上記特許文献2の技術における問題点は、特定の属性を選択するためにはその属性を持つページを見つけて選択する必要がありキーワード検索のように特定の属性を指定することが容易でない点、またサイトマップ上で指定属性を含む全ページ(葉ノード)を表示するため、属性次第ではサイトマップ表示が煩雑になり、却って求める情報の所在が分かり難くなる点である。
【0009】
本発明は、サイト検索において、検索者に対して、サイト内構造を可視化し、分かりやすいサイト内ナビゲーションを提供することができる技術を提供することが課題である。
【0010】
【課題を解決するための手段】
上記の課題を解決するため、本発明は、事前にWebページを収集してサイトに分け、各サイト内の親子関係を表現する木構造(以下、サイト木構造)を推定し、各Webページとサイトの関係および前記サイト木構造をデータベースに保存しておく過程と、サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う過程と、前記サイト検索端末装置にサイト内部構造情報を提示するためのリンクを持つサイト検索結果を生成する過程と、前記生成したサイト検索結果を前記サイト検索端末装置へ送信する過程と、前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する過程と、前記取得したサイト木構造を基にサイト内部構造情報を生成する過程と、前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有することを特徴とするサイト内検索方法を、その解決の手段とする。
【0011】
あるいは、上記のサイト内検索方法において、前記サイト内部構造情報を生成する過程では、サイト内検索のリンクを持たせ、前記サイト内部構造情報を前記サイト検索端末装置へ送信する過程の後に、前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に前記サイト木構造を基に再検索したサイト内部構造情報を生成する過程と、前記再検索したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有することを特徴とするサイト内検索方法を、その解決の手段とする。
【0012】
あるいは、上記のサイト内検索方法において、前記サイト内部構造情報を生成する過程では、サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードと識別可能に提示することを特徴とするサイト内検索方法を、その解決の手段とする。
【0013】
あるいは、事前にWebページを収集してサイトに分けられ推定された各サイト木構造、および各Webページとサイトの関係を保存しておくデータベースと、サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う手段と、前記サイト木構造を提示するためのリンクを持つサイト検索結果を生成する手段と、前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する手段と、前記取得したサイト木構造を基にサイト内部構造情報を生成する手段と、前記生成したサイト検索結果、および前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する手段と、を有することを特徴とするサイト内検索装置を、その解決の手段とする。
【0014】
あるいは、上記のサイト内検索装置において、前記サイト内部構造情報を生成する手段は、サイト内検索のリンクを持たせるものであり、前記サイト内部構造情報を生成する手段は、前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に再検索したサイト内部構造情報を生成するものであり、前記サイト検索端末装置へ送信する手段は、再検索したサイト内部構造情報をも前記サイト検索端末装置へ送信するものであることを特徴とするサイト内検索装置を、その解決の手段とする。
【0015】
あるいは、上記のサイト内検索装置において、前記サイト内部構造情報を生成する手段は、サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードから識別可能に提示するものであることを特徴とするサイト内検索装置を、その解決の手段とする。
【0016】
あるいは、上記のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとしたことを特徴とするWebサイト内検索プログラムを、その解決の手段とする。
【0017】
あるいは、上記のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとし、前記プログラムを、前記コンピュータが読み取りできる記録媒体に記録したことを特徴とするWebサイト内検索プログラムを記録した記録媒体を、その解決の手段とする。
【0018】
本発明では、サイト検索において、サイト検索やサイト内ページ検索とサイト内部構造の提示を組み合わせて、検索者に通常のサイト検索結果を提示した後、検索者がサイト内部構造を提示するためのリンクを送信した場合には、事前に決定しておいたサイト木構造を基にサイト内の親子関係を木構造を用いて可視化することにより、さらにはサイト内部構造におけるノードの表示において、ヒットしたページのノードまたはをヒットしたページ含むノードをハイライト表示するなど他のノードから目立つようにすることにより、検索者に分かりやすいサイト内ナビゲーションを可能にする。
【0019】
【発明の実施の形態】
以下、本発明の実施の形態について図を用いて詳細に説明する。
【0020】
図1に、本実施形態例によるサイト内検索システムの構成を示す。本システムは、サイト内検索装置の主要部として、サイト検索エンジン1と、サイト検索結果生成・ナビゲーション部2と、データベース(以下、DBと記す)3とを有する。
【0021】
サイト検索エンジン1は、図略のサイト検索端末装置からの検索要求に応じてヒットしたWebページについてサイトとWebページの関係を保存するDB3に対してサイト検索を行い、ヒットページIDとそのページのサイトIDを含む複数のサイト検索情報をサイト検索結果生成・ナビゲーション部2に渡す。
【0022】
サイト検索結果生成・ナビゲーション部2は、サイト検索エンジン1からサイト検索された複数のサイトIDを含むサイト検索情報を受け取る手段と、サイト木構造を基にサイト内部構造情報を提示するためのリンクであるサイトナビゲーションボタンを持つサイト検索結果を生成する手段と、検索要求を行ったサイト検索端末装置からサイトナビゲーションのリンクが送信された場合に、サイト木構造を保存するDB3から当該サイトのサイト木構造を取得する手段と、取得したサイト木構造を基にサイト内部構造情報を示すとともにサイト内検索のリンクを持たせたサイトマップを生成する手段と、前記生成したサイト検索結果、およびサイトマップを当該サイト検索端末装置に送信する送信手段とを備える。前記サイトマップを生成する手段は、サイト検索端末装置からサイト内検索のリンクが送信された場合には、再検索したサイト内部構造を示すサイトマップを生成し、送信手段により当該サイト検索端末装置に送信させる。
【0023】
なお、サイト検索端末装置としては、検索者の検索要求に基づいてサイト検索エンジン1に対して検索要求を行う手段と、表示装置に表示されたサイト検索結果に提示されているサイト内ナビゲーションボタン等をクリックするなどしてサイトマップを提示するためのリンクや、それによって表示装置に表示されたサイトマップに提示されているサイト内検索ボタン等をクリックするなどして再検索されたサイトマップを提示するためのリンクをサイト内検索装置に送信する手段と、サイト検索結果生成・ナビゲーション部2で生成されたサイト検索結果やサイトマップを受信し表示装置等の出力装置に提示する提示手段等を備える。
【0024】
DB3は、事前にサイト分けされたサイトのトップページをルートとするページ集合の情報と、推定された当該サイトの木構造とを保存し、サイト検索エンジン1やサイト検索結果生成・ナビゲーション部2からの求めに応じてそれらの情報を提供する。このサイト分けと木構造の推定の処理は、必要なデータを取得することにより、サイト検索エンジン1を含むサイト内検索装置が行う例が考えられるが、その他の装置が行っても構わない。
【0025】
次に、本システムで実行される本実施形態例によるWebサイト内検索方法の処理手順を示す。
【0026】
本方法は、事前処理と、サイト検索およびサイト内検索時の処理とからなる。以下、図1を参照しながら各処理手順を説明する。
【0027】
<事前処理>
図2は、本実施形態例によるWebサイト内検索方法における事前処理の処理手順を示すフローチャートである。S11〜S15は処理のステップを表す。事前処理は、サイト検索時の処理の前に独立に行われる。
【0028】
まず、事前処理を行うサーバ等の装置により、大量のWebページを収集する(S11)。本例では、事前処理を行うサーバ等の装置として、サイト検索エンジン1を含むサイト内検索装置が行うこととする。
【0029】
サイト内検索装置は、収集したWebページをサイト別に分ける(S12)。このサイト分けは、大量のWebページ集合から、Webサイトのトップページを推定し、この推定トップページと、それにリンクしたページからなるページ集合をサイトと決定する。サイト分けされたサイトとサイトを構成するトップページをルートとするページ集合の情報はDB3に格納される。
【0030】
これらトップページ推定とサイト決定には、例えば、本願出願人が既に提案している技術(例えば、特願2001−389447、特願2001−389448)を利用することができる。
【0031】
サイトのトップページ推定は、検索したWebページをサーバ別に分類しておき、メタ情報とページタイプからページクラスを抽出したページ分類木を獲得しておき、この分類木を基に各ページのページタイプの分類尤度を抽出しておき、同じサーバに属するページについて、ディレクトリ階層が0に位置するページを最優先でトップページとして推定し、階層0にトップページが存在しない場合にはトップページタイプの分類尤度を基にトップページが存在するディレクトリ階層を決定し、このディレクトリ階層に所属して下位階層にファイルが存在し、かつページタイプへの分類尤度が最大さらには閾値以上のページをトップページとして推定する。
【0032】
また、サイトの決定は、検索したWebページ集合の各ページ、リンクについてメタ情報とリンク分類木を利用してリンクの各リンクタイプへの分類尤度を獲得しておき、さらにメタ情報とページタイプからページクラスを抽出したページ分類木を獲得して各ページのページタイプの分類尤度を抽出しておき、その後、Webページが属する全てのサーバについて、上記の分類尤度を基にしてWebサイトのトップページ候補集合を得てそれらの親ページを推定し、この推定でも親ページが未決のページ集合の中からディレクトリの最も浅い階層に存在しかつトップページ、インデックスページ、メニューページ尤度の和が最大のページをトップページ候補としてそれらの親ページを推定し、これら推定した親ページとこれにリンクするページ集合をサイトとする。
【0033】
続いて、各サイトの木構造を推定する(S13)。サイト木構造は、トップページからのリンクにより、各サイトのページのリンクの親子関係から推定される。推定された各サイト木構造はDB3に格納される。
【0034】
次に、各サイト内ページに対し、pre−orderの番号(以後、番号)を付与し(S14)、最後に、各サイト内ページに対し、サイト木構造中で葉ノードか否かのフラグを付与する(S15)。葉ノードでないノードは直下に葉ノードを持つ中間ノードである。
【0035】
なお、サイト内検索装置は、サイト内のページ情報をローカルデータベースに格納しておく。これにより、検索者は通常の検索と特定のサイトの内部のナビゲーションが可能になる。
【0036】
<サイト検索、サイト内検索時の処理>
図3は、本実施形態例によるWebサイト内検索方法におけるサイト検索、サイト内検索時の処理を説明するフローチャートである。図中、S21〜S26は処理のステップを表す。
【0037】
まず、サイト検索エンジン1は、サイト検索端末装置からの検索要求に応じて、ヒットするWebページを収集し、各WebページについてDB3に対するサイト検索を行うことで(S21)、検索要求に適合しているサイト単位の検索情報を取得する(S22)。このサイト検索には、例えば、本願出願人が既に提案している技術(例えば、特願2001−389446等)を利用することができる。
【0038】
このサイト検索では、ページ情報を基にDB3を検索し、ページ単位にサイトIDとそのトップページのURLを得るとともに、各ページ単位に検索要求への適合度合いを表すものとして検索スコアを求め、サイト検索情報としてサイト検索結果生成・ナビゲーション部2に渡す。各ページ毎の検索スコアは、サイトマップの生成において、ノードのハイライト表示に必要となる数値である。ここでの検索スコアの計算例では、ページ毎に検索キーワードの重みを考慮して得られる原スコアとサイト木構造を基にして計算される。なお、ページ毎の検索スコアをサイト毎に加算したものがサイトの検索スコアとなり、サイトの検索スコアの高い順にサイトをランキングして出力することもできる。
【0039】
検索のスコア計算例として具体的には、まず、そのページに含まれるキーワードの数と、検索対象となるページ集合のうち、キーワードを含むページ数の逆数との積により原スコアs(p)を計算する(「情報検索と言語処理」、徳永健伸著、東京大学出版会ISBN4−13−065405−5、pp.26−32)。次に、ページ毎にDB3等から各ページの属するサイトIDとサイト木構造におけるルート(トップページ)からの深さd(p)を得る。次に、ページ毎に、次式によりキーワードへの適合度合いとして検索スコアscore(p)を計算する。なお、サイトの検索スコアはscore(p)をサイト毎に加算する。
【0040】
【数1】
score(p)=f(s(p))×(1/(α+(d(p))2×β))
ただし、α,βは0より大で1より小の定数を表し、f(s(p))はs(p)が高い場合にはscore(p)も高くなるような任意の関数を表す。
【0041】
なお、本例では、サイト検索エンジン1が検索スコアを計算する場合を示したが、サイト検索エンジン1からは原スコアを取得してサイト検索結果生成・ナビゲーション部2やその他の装置で計算してもよい。また、各ページの検索スコアとして、上記原スコアをそのまま検索スコアとして用いる例も考えられる。
【0042】
次に、サイト検索結果生成・ナビゲーション部2は、サイト検索情報を基に、サイト検索結果を生成し、前記サイト検索要求を発したサイト検索端末装置に送信する(S23)。生成するサイト検索情報には以下を併せて示す。
【0043】
1)サイトを代表するトップページ情報、単数の検索キーワードまたは複数の検索キーワードのand/or論理によりヒットしたサイト内ページ情報、
2)サイト内ナビゲーションを行うためのリンク(見た目はボタン等いろいろあり得る)。
【0044】
次に、検索者が表示されたサイト検索結果において、サイト内ナビゲーションボタンをクリックするなどによりサイト検索端末装置からサイト内ナビゲーションを行うためのリンクが送信されたかを検出し(S24)、検出された場合、DB3にアクセスして、当該サイトの木構造の情報を取得し(S25)、当該サイト検索端末装置に送信する。当該サイト検索端末装置は、受信した情報を基に、後述する図4により、サイト内ナビゲーションを行うために初期サイトマップを生成、描画する(S26)。この初期サイトマップには、サイト内検索のためのリンク(見た目はボタン等いろいろあり得る)が提示される。
【0045】
次に、検索者が表示された検索結果において、サイト内ナビゲーションボタンをクリックするなどによりサイト検索端末装置からサイト内ナビゲーションを行うためのリンクが送信されたかを検出し(S27)、検出された場合、追加キーワードによる絞り込みの再検索を行い、再検索結果として各ページの検索スコアを取得し、当該サイト検索端末装置に送信する。当該サイト検索端末装置は、受信した情報および前記取得したサイト木構造の情報を基にサイトマップを再生成する(S28)。
【0046】
図4に、サイト内ナビゲーションボタンがクリックされた際の処理手順(S26)、およびサイト内検索ボタンがクリックされた際の処理手順(S28)の詳細を示す。図中、S31〜S39は処理のステップである。
【0047】
まず、サイト内各ページp(1〜n)におけるD(p)、O(p)、S(p)、L(p)、T(p)、U(p)、の情報をサイト検索エンジン1から得、図略のDB(サイト内ナビゲーション利用者側に作成され、異なるサイト内の検索が行われる度に作成されるDB:以下、利用者側DB)に格納する(S31)。但し、
n:サイト内ページの総数、
D(p):ページpのサイトの木構造中の深さ、
O(p):ページpのサイトの木構造における親ページの番号、
S(p):ページpの検索スコア、
L(p):ページpが、サイトの木構造中で葉ノードであるか否かを示すフラグであり、ページpが葉ノードならL(p)=1、それ以外なら0、
T(p):ページpのタイトル文字列、
U(p):ページpのURL文字列である。
【0048】
次に、ループ1として、深さdについて、d=Nから0まで、以下の処理を繰り返す。但し、Nはサイトの木構造の深さの最大値である。ループ1では、始めに深さdのページのリストを利用者側DBから取得して(S32)、ループ2の処理を行う。
【0049】
ループ2の処理では、ページpについて、p=1からMまで、以下の処理を繰り返す。但し、Mはサイトの木構造における深さdのページ数である。始めに、ノードが葉ノード(L(p)=1)か否か判定する(S33)。この判定で葉ノードであれば、ページpの検索スコアS(p)をページpのノードスコアNs(p)とし(S34)、サイトマップにおけるページpの画像描画の際のハイライト値H(p)をFl(Ns(p))により計算する(S35)。但し、Fl(Ns(p))は、ページpが葉ノードの場合の、ノードスコアNs(p)におけるページpの画像のハイライト値を得るための関数(例えば、段階関数)である。S33の判定で葉ノードではなく中間ノード(直下のノードの親ノード)であれば、直下のノードスコアの和ΣO(k)=pNs(k)をページpのノードスコアNs(p)とし(S36)、サイトマップにおけるページpの画像描画の際のハイライト値H(p)をFn(Ns(p))により計算する(S35)。但し、Fn(Ns(p))は、ページpが中間ノードの場合の、ノードスコアNs(p)におけるページpの画像のハイライト値を得るための関数(例えば、段階関数)である。これにより、サイト内探索装置におけるサイトマップは、検索スコアやノードスコアに応じて描画するノードの色の濃淡等が設定される。以上のループ2の処理で得られたH(p)は、ページp毎に利用者側DBに格納される(S38)。
【0050】
ループ1の処理を終えると、上記ノードのハイライト表示処理を含む初期サイトマップを描画する(S39)。ここで、初期サイトマップとは、利用者に対して最初に提示するサイトマップである。サイトマップによるサイト内部ナビゲーションの際の表示方法としては、サイトの内部構造が木構造であることから、既知の木構造表示技術(ディレクトリツリー表示技術、円錐状表示技術等)を用いて表示する。
【0051】
なお、サイト内検索ボタンがクリックされた場合の処理は、本フローチャートと同様の処理を行う。但し、図4の※部分の処理において、サイト検索エンジン1から得る情報は、各ページpの検索スコアS(p)のみであり、利用者側DBの当該部分のみを書き換える。
【0052】
図5に、ページpに対応するノードの描画(ハイライト表示)処理の処理手順を示す。S41〜S44は処理のステップである。
【0053】
まず、L(p)、H(p)を利用者側DBより取得し(S41)、ハイライト表示するページpが葉ノード(L(p)=1)か否か判定する(S33)。この判定で葉ノードであれば、葉ノードを示す画像を、H(p)に対応させてハイライト表示し、葉ノードではなく中間ノードであれば、中間ノードを示す画像を、H(p)に対応させてハイライト表示する。H(p)の値とハイライト色の設定方法の一つは、図6のような対応表を用意しておくことである。これにより、検索にヒットしたページを検索にヒットした度合いに応じてハイライト表示することが可能となる。
【0054】
図7に、本発明によるサイト内部ナビゲーションの表示例を示す。まず、検索条件を「紳士靴」とし、この条件に合ったサイトとして「Aシューズショップ」が検索されて(a)に示すようなサイト検索結果が表示される。このサイト検索結果には、「サイト内ナビ」のリンクボタンが表示される。
【0055】
(a)のサイト検索結果の表示において、「サイト内ナビ」ボタンをクリックすると、(b)に示すような初期サイトマップが表示される。この初期サイトマップにより、サイトの内部構造(木構造)を可視化し、ヒットしたページのノードまたはヒットしたページを含むノードをハイライト表示するとともに、ハイライト表示を色の濃淡で行って、葉ノードであれば検索スコアの大小を、中間ノードであればヒットページ数を示唆する。この初期サイトマップ、あるいは以降のサイトマップには、キーワード追加による絞り込み検索のために「サイト内検索」ボタンが設けられる。
【0056】
(b)に示すようなサイトマップ表示において、キーワードを追加して「サイト内検索」ボタンをクリックすると、(c)に示すような絞り込み検索結果を示すサイトマップが初期サイトマップと同様に表示される。
【0057】
一方、(b)に示すようなサイトマップ表示において、中間ノードをクリックすると、(d)に示すようにクリックした中間ノードのリンク先ノードが展開されるとともに、そのノードが葉ノードであればヒットページの画像上の記号(この例では☆印)がハイライト色の濃淡で表示されて検索スコアの大小が示唆される。
【0058】
なお、図1で示した各部の機能実現手段をコンピュータのプログラムで構成したり、あるいは図2〜図5で示した処理のステップをコンピュータのプログラムで構成したりして、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラム、あるいは、コンピュータにその処理のステップを実行させるためのプログラムを、そのコンピュータが読み取りできる記録媒体、例えば、フレキシブルディスクや、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。これらの記録媒体からコンピュータに前記のプログラムをインストールすることにより、あるいはネットワークからダウンロードしてコンピュータに前記のプログラムをインストールすることにより、本発明を実施することが可能となる。
【0059】
【発明の効果】
以上の説明で明らかなように、本発明によれば、
(1)サイト検索において、サイト運営者は、(通常の検索結果ページオープンだけでなく)自分のサイト内のナビゲーションに誘導できる。
(2)サイト検索において、検索者は、(通常の検索結果ページオープンだけでなく)サイト内のナビゲーションを行える。
(3)サイト内ナビゲーションにおいては木構造を辿る分かり易いナビゲーションができる。
【図面の簡単な説明】
【図1】本発明の一実施形態例によるサイト内検索装置の構成を示す図である。
【図2】本実施形態例によるWebサイト検索方法における事前処理を説明するフローチャートである。
【図3】本実施形態例によるWebサイト検索方法におけるサイト検索、サイト内検索時の処理を説明するフローチャートである。
【図4】図3において、サイト内ナビゲーションボタンがクリックされた際の処理手順、およびサイト内検索ボタンがクリックされた際の処理手順の詳細を示すフローチャートである。
【図5】ページpに対応するノードの描画(ハイライト表示)処理の処理手順を示すフローチャートである。
【図6】ハイライト色の設定方法の一例を示す対応表を表す図である。
【図7】本発明によるサイト内部ナビゲーションの表示例を示す図である。
【符号の説明】
1…サイト検索エンジン
2…サイト検索結果生成・ナビゲーション部
3…データベース(DB)
【発明の属する技術分野】
本発明は、WWW(ワールド・ワイド・ウェブ)上のWeb情報をサイト単位で検索者に提供するためのWeb情報の検索方法および装置に係り、特にサイト検索結果においてサイト内ナビゲーションを行う機能を持つサイト内検索方法および装置に関する。
【0002】
【従来の技術】
WWWは、Webページ集合をリンク関係を持たせたハイパーメディア情報として蓄積しており、検索者はURL(ユニバーサル・リソース・ロケータ)で規定されるWebサーバにたどり着き、Webページの検索とそのリンク関係を辿ることで目的とするWebページ集合の情報を取得することができる。
【0003】
上記のURLが不明な場合や検索範囲を拡張する場合のWeb情報の提供システムとして、検索エンジンを利用したサービスがある。検索エンジンは、WWWページを自動収集するロボット型検索エンジンにより、ハイパーテキストのリンクを辿りながら多数のWebページを収集しサイトに分けてデータベースを構築しておき、Webサイトの情報を検索者にサービス提供している。
【0004】
このようにして検索されたWebサイト内を参照する技術としては、下記の特許文献1および2の例がある。特許文献1は、特定Webサーバの検索結果をサイトマップの一部として提示する技術である。特許文献2は、サイトの各ページが有する属性に基づきサイトマップを動的に作成する技術である。
【0005】
【特許文献1】
特開2001−125931号公報
【0006】
【特許文献2】
特開2000−305835号公報
【0007】
【発明が解決しようとする課題】
しかしながら、上記特許文献1の技術における問題点は、検索者はサイト内でヒットしたページの周辺部分の構造を参照することしかできないため、サイト内ナビゲーションツールとしての利用には不適である点である。
【0008】
また、上記特許文献2の技術における問題点は、特定の属性を選択するためにはその属性を持つページを見つけて選択する必要がありキーワード検索のように特定の属性を指定することが容易でない点、またサイトマップ上で指定属性を含む全ページ(葉ノード)を表示するため、属性次第ではサイトマップ表示が煩雑になり、却って求める情報の所在が分かり難くなる点である。
【0009】
本発明は、サイト検索において、検索者に対して、サイト内構造を可視化し、分かりやすいサイト内ナビゲーションを提供することができる技術を提供することが課題である。
【0010】
【課題を解決するための手段】
上記の課題を解決するため、本発明は、事前にWebページを収集してサイトに分け、各サイト内の親子関係を表現する木構造(以下、サイト木構造)を推定し、各Webページとサイトの関係および前記サイト木構造をデータベースに保存しておく過程と、サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う過程と、前記サイト検索端末装置にサイト内部構造情報を提示するためのリンクを持つサイト検索結果を生成する過程と、前記生成したサイト検索結果を前記サイト検索端末装置へ送信する過程と、前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する過程と、前記取得したサイト木構造を基にサイト内部構造情報を生成する過程と、前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有することを特徴とするサイト内検索方法を、その解決の手段とする。
【0011】
あるいは、上記のサイト内検索方法において、前記サイト内部構造情報を生成する過程では、サイト内検索のリンクを持たせ、前記サイト内部構造情報を前記サイト検索端末装置へ送信する過程の後に、前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に前記サイト木構造を基に再検索したサイト内部構造情報を生成する過程と、前記再検索したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有することを特徴とするサイト内検索方法を、その解決の手段とする。
【0012】
あるいは、上記のサイト内検索方法において、前記サイト内部構造情報を生成する過程では、サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードと識別可能に提示することを特徴とするサイト内検索方法を、その解決の手段とする。
【0013】
あるいは、事前にWebページを収集してサイトに分けられ推定された各サイト木構造、および各Webページとサイトの関係を保存しておくデータベースと、サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う手段と、前記サイト木構造を提示するためのリンクを持つサイト検索結果を生成する手段と、前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する手段と、前記取得したサイト木構造を基にサイト内部構造情報を生成する手段と、前記生成したサイト検索結果、および前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する手段と、を有することを特徴とするサイト内検索装置を、その解決の手段とする。
【0014】
あるいは、上記のサイト内検索装置において、前記サイト内部構造情報を生成する手段は、サイト内検索のリンクを持たせるものであり、前記サイト内部構造情報を生成する手段は、前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に再検索したサイト内部構造情報を生成するものであり、前記サイト検索端末装置へ送信する手段は、再検索したサイト内部構造情報をも前記サイト検索端末装置へ送信するものであることを特徴とするサイト内検索装置を、その解決の手段とする。
【0015】
あるいは、上記のサイト内検索装置において、前記サイト内部構造情報を生成する手段は、サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードから識別可能に提示するものであることを特徴とするサイト内検索装置を、その解決の手段とする。
【0016】
あるいは、上記のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとしたことを特徴とするWebサイト内検索プログラムを、その解決の手段とする。
【0017】
あるいは、上記のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとし、前記プログラムを、前記コンピュータが読み取りできる記録媒体に記録したことを特徴とするWebサイト内検索プログラムを記録した記録媒体を、その解決の手段とする。
【0018】
本発明では、サイト検索において、サイト検索やサイト内ページ検索とサイト内部構造の提示を組み合わせて、検索者に通常のサイト検索結果を提示した後、検索者がサイト内部構造を提示するためのリンクを送信した場合には、事前に決定しておいたサイト木構造を基にサイト内の親子関係を木構造を用いて可視化することにより、さらにはサイト内部構造におけるノードの表示において、ヒットしたページのノードまたはをヒットしたページ含むノードをハイライト表示するなど他のノードから目立つようにすることにより、検索者に分かりやすいサイト内ナビゲーションを可能にする。
【0019】
【発明の実施の形態】
以下、本発明の実施の形態について図を用いて詳細に説明する。
【0020】
図1に、本実施形態例によるサイト内検索システムの構成を示す。本システムは、サイト内検索装置の主要部として、サイト検索エンジン1と、サイト検索結果生成・ナビゲーション部2と、データベース(以下、DBと記す)3とを有する。
【0021】
サイト検索エンジン1は、図略のサイト検索端末装置からの検索要求に応じてヒットしたWebページについてサイトとWebページの関係を保存するDB3に対してサイト検索を行い、ヒットページIDとそのページのサイトIDを含む複数のサイト検索情報をサイト検索結果生成・ナビゲーション部2に渡す。
【0022】
サイト検索結果生成・ナビゲーション部2は、サイト検索エンジン1からサイト検索された複数のサイトIDを含むサイト検索情報を受け取る手段と、サイト木構造を基にサイト内部構造情報を提示するためのリンクであるサイトナビゲーションボタンを持つサイト検索結果を生成する手段と、検索要求を行ったサイト検索端末装置からサイトナビゲーションのリンクが送信された場合に、サイト木構造を保存するDB3から当該サイトのサイト木構造を取得する手段と、取得したサイト木構造を基にサイト内部構造情報を示すとともにサイト内検索のリンクを持たせたサイトマップを生成する手段と、前記生成したサイト検索結果、およびサイトマップを当該サイト検索端末装置に送信する送信手段とを備える。前記サイトマップを生成する手段は、サイト検索端末装置からサイト内検索のリンクが送信された場合には、再検索したサイト内部構造を示すサイトマップを生成し、送信手段により当該サイト検索端末装置に送信させる。
【0023】
なお、サイト検索端末装置としては、検索者の検索要求に基づいてサイト検索エンジン1に対して検索要求を行う手段と、表示装置に表示されたサイト検索結果に提示されているサイト内ナビゲーションボタン等をクリックするなどしてサイトマップを提示するためのリンクや、それによって表示装置に表示されたサイトマップに提示されているサイト内検索ボタン等をクリックするなどして再検索されたサイトマップを提示するためのリンクをサイト内検索装置に送信する手段と、サイト検索結果生成・ナビゲーション部2で生成されたサイト検索結果やサイトマップを受信し表示装置等の出力装置に提示する提示手段等を備える。
【0024】
DB3は、事前にサイト分けされたサイトのトップページをルートとするページ集合の情報と、推定された当該サイトの木構造とを保存し、サイト検索エンジン1やサイト検索結果生成・ナビゲーション部2からの求めに応じてそれらの情報を提供する。このサイト分けと木構造の推定の処理は、必要なデータを取得することにより、サイト検索エンジン1を含むサイト内検索装置が行う例が考えられるが、その他の装置が行っても構わない。
【0025】
次に、本システムで実行される本実施形態例によるWebサイト内検索方法の処理手順を示す。
【0026】
本方法は、事前処理と、サイト検索およびサイト内検索時の処理とからなる。以下、図1を参照しながら各処理手順を説明する。
【0027】
<事前処理>
図2は、本実施形態例によるWebサイト内検索方法における事前処理の処理手順を示すフローチャートである。S11〜S15は処理のステップを表す。事前処理は、サイト検索時の処理の前に独立に行われる。
【0028】
まず、事前処理を行うサーバ等の装置により、大量のWebページを収集する(S11)。本例では、事前処理を行うサーバ等の装置として、サイト検索エンジン1を含むサイト内検索装置が行うこととする。
【0029】
サイト内検索装置は、収集したWebページをサイト別に分ける(S12)。このサイト分けは、大量のWebページ集合から、Webサイトのトップページを推定し、この推定トップページと、それにリンクしたページからなるページ集合をサイトと決定する。サイト分けされたサイトとサイトを構成するトップページをルートとするページ集合の情報はDB3に格納される。
【0030】
これらトップページ推定とサイト決定には、例えば、本願出願人が既に提案している技術(例えば、特願2001−389447、特願2001−389448)を利用することができる。
【0031】
サイトのトップページ推定は、検索したWebページをサーバ別に分類しておき、メタ情報とページタイプからページクラスを抽出したページ分類木を獲得しておき、この分類木を基に各ページのページタイプの分類尤度を抽出しておき、同じサーバに属するページについて、ディレクトリ階層が0に位置するページを最優先でトップページとして推定し、階層0にトップページが存在しない場合にはトップページタイプの分類尤度を基にトップページが存在するディレクトリ階層を決定し、このディレクトリ階層に所属して下位階層にファイルが存在し、かつページタイプへの分類尤度が最大さらには閾値以上のページをトップページとして推定する。
【0032】
また、サイトの決定は、検索したWebページ集合の各ページ、リンクについてメタ情報とリンク分類木を利用してリンクの各リンクタイプへの分類尤度を獲得しておき、さらにメタ情報とページタイプからページクラスを抽出したページ分類木を獲得して各ページのページタイプの分類尤度を抽出しておき、その後、Webページが属する全てのサーバについて、上記の分類尤度を基にしてWebサイトのトップページ候補集合を得てそれらの親ページを推定し、この推定でも親ページが未決のページ集合の中からディレクトリの最も浅い階層に存在しかつトップページ、インデックスページ、メニューページ尤度の和が最大のページをトップページ候補としてそれらの親ページを推定し、これら推定した親ページとこれにリンクするページ集合をサイトとする。
【0033】
続いて、各サイトの木構造を推定する(S13)。サイト木構造は、トップページからのリンクにより、各サイトのページのリンクの親子関係から推定される。推定された各サイト木構造はDB3に格納される。
【0034】
次に、各サイト内ページに対し、pre−orderの番号(以後、番号)を付与し(S14)、最後に、各サイト内ページに対し、サイト木構造中で葉ノードか否かのフラグを付与する(S15)。葉ノードでないノードは直下に葉ノードを持つ中間ノードである。
【0035】
なお、サイト内検索装置は、サイト内のページ情報をローカルデータベースに格納しておく。これにより、検索者は通常の検索と特定のサイトの内部のナビゲーションが可能になる。
【0036】
<サイト検索、サイト内検索時の処理>
図3は、本実施形態例によるWebサイト内検索方法におけるサイト検索、サイト内検索時の処理を説明するフローチャートである。図中、S21〜S26は処理のステップを表す。
【0037】
まず、サイト検索エンジン1は、サイト検索端末装置からの検索要求に応じて、ヒットするWebページを収集し、各WebページについてDB3に対するサイト検索を行うことで(S21)、検索要求に適合しているサイト単位の検索情報を取得する(S22)。このサイト検索には、例えば、本願出願人が既に提案している技術(例えば、特願2001−389446等)を利用することができる。
【0038】
このサイト検索では、ページ情報を基にDB3を検索し、ページ単位にサイトIDとそのトップページのURLを得るとともに、各ページ単位に検索要求への適合度合いを表すものとして検索スコアを求め、サイト検索情報としてサイト検索結果生成・ナビゲーション部2に渡す。各ページ毎の検索スコアは、サイトマップの生成において、ノードのハイライト表示に必要となる数値である。ここでの検索スコアの計算例では、ページ毎に検索キーワードの重みを考慮して得られる原スコアとサイト木構造を基にして計算される。なお、ページ毎の検索スコアをサイト毎に加算したものがサイトの検索スコアとなり、サイトの検索スコアの高い順にサイトをランキングして出力することもできる。
【0039】
検索のスコア計算例として具体的には、まず、そのページに含まれるキーワードの数と、検索対象となるページ集合のうち、キーワードを含むページ数の逆数との積により原スコアs(p)を計算する(「情報検索と言語処理」、徳永健伸著、東京大学出版会ISBN4−13−065405−5、pp.26−32)。次に、ページ毎にDB3等から各ページの属するサイトIDとサイト木構造におけるルート(トップページ)からの深さd(p)を得る。次に、ページ毎に、次式によりキーワードへの適合度合いとして検索スコアscore(p)を計算する。なお、サイトの検索スコアはscore(p)をサイト毎に加算する。
【0040】
【数1】
score(p)=f(s(p))×(1/(α+(d(p))2×β))
ただし、α,βは0より大で1より小の定数を表し、f(s(p))はs(p)が高い場合にはscore(p)も高くなるような任意の関数を表す。
【0041】
なお、本例では、サイト検索エンジン1が検索スコアを計算する場合を示したが、サイト検索エンジン1からは原スコアを取得してサイト検索結果生成・ナビゲーション部2やその他の装置で計算してもよい。また、各ページの検索スコアとして、上記原スコアをそのまま検索スコアとして用いる例も考えられる。
【0042】
次に、サイト検索結果生成・ナビゲーション部2は、サイト検索情報を基に、サイト検索結果を生成し、前記サイト検索要求を発したサイト検索端末装置に送信する(S23)。生成するサイト検索情報には以下を併せて示す。
【0043】
1)サイトを代表するトップページ情報、単数の検索キーワードまたは複数の検索キーワードのand/or論理によりヒットしたサイト内ページ情報、
2)サイト内ナビゲーションを行うためのリンク(見た目はボタン等いろいろあり得る)。
【0044】
次に、検索者が表示されたサイト検索結果において、サイト内ナビゲーションボタンをクリックするなどによりサイト検索端末装置からサイト内ナビゲーションを行うためのリンクが送信されたかを検出し(S24)、検出された場合、DB3にアクセスして、当該サイトの木構造の情報を取得し(S25)、当該サイト検索端末装置に送信する。当該サイト検索端末装置は、受信した情報を基に、後述する図4により、サイト内ナビゲーションを行うために初期サイトマップを生成、描画する(S26)。この初期サイトマップには、サイト内検索のためのリンク(見た目はボタン等いろいろあり得る)が提示される。
【0045】
次に、検索者が表示された検索結果において、サイト内ナビゲーションボタンをクリックするなどによりサイト検索端末装置からサイト内ナビゲーションを行うためのリンクが送信されたかを検出し(S27)、検出された場合、追加キーワードによる絞り込みの再検索を行い、再検索結果として各ページの検索スコアを取得し、当該サイト検索端末装置に送信する。当該サイト検索端末装置は、受信した情報および前記取得したサイト木構造の情報を基にサイトマップを再生成する(S28)。
【0046】
図4に、サイト内ナビゲーションボタンがクリックされた際の処理手順(S26)、およびサイト内検索ボタンがクリックされた際の処理手順(S28)の詳細を示す。図中、S31〜S39は処理のステップである。
【0047】
まず、サイト内各ページp(1〜n)におけるD(p)、O(p)、S(p)、L(p)、T(p)、U(p)、の情報をサイト検索エンジン1から得、図略のDB(サイト内ナビゲーション利用者側に作成され、異なるサイト内の検索が行われる度に作成されるDB:以下、利用者側DB)に格納する(S31)。但し、
n:サイト内ページの総数、
D(p):ページpのサイトの木構造中の深さ、
O(p):ページpのサイトの木構造における親ページの番号、
S(p):ページpの検索スコア、
L(p):ページpが、サイトの木構造中で葉ノードであるか否かを示すフラグであり、ページpが葉ノードならL(p)=1、それ以外なら0、
T(p):ページpのタイトル文字列、
U(p):ページpのURL文字列である。
【0048】
次に、ループ1として、深さdについて、d=Nから0まで、以下の処理を繰り返す。但し、Nはサイトの木構造の深さの最大値である。ループ1では、始めに深さdのページのリストを利用者側DBから取得して(S32)、ループ2の処理を行う。
【0049】
ループ2の処理では、ページpについて、p=1からMまで、以下の処理を繰り返す。但し、Mはサイトの木構造における深さdのページ数である。始めに、ノードが葉ノード(L(p)=1)か否か判定する(S33)。この判定で葉ノードであれば、ページpの検索スコアS(p)をページpのノードスコアNs(p)とし(S34)、サイトマップにおけるページpの画像描画の際のハイライト値H(p)をFl(Ns(p))により計算する(S35)。但し、Fl(Ns(p))は、ページpが葉ノードの場合の、ノードスコアNs(p)におけるページpの画像のハイライト値を得るための関数(例えば、段階関数)である。S33の判定で葉ノードではなく中間ノード(直下のノードの親ノード)であれば、直下のノードスコアの和ΣO(k)=pNs(k)をページpのノードスコアNs(p)とし(S36)、サイトマップにおけるページpの画像描画の際のハイライト値H(p)をFn(Ns(p))により計算する(S35)。但し、Fn(Ns(p))は、ページpが中間ノードの場合の、ノードスコアNs(p)におけるページpの画像のハイライト値を得るための関数(例えば、段階関数)である。これにより、サイト内探索装置におけるサイトマップは、検索スコアやノードスコアに応じて描画するノードの色の濃淡等が設定される。以上のループ2の処理で得られたH(p)は、ページp毎に利用者側DBに格納される(S38)。
【0050】
ループ1の処理を終えると、上記ノードのハイライト表示処理を含む初期サイトマップを描画する(S39)。ここで、初期サイトマップとは、利用者に対して最初に提示するサイトマップである。サイトマップによるサイト内部ナビゲーションの際の表示方法としては、サイトの内部構造が木構造であることから、既知の木構造表示技術(ディレクトリツリー表示技術、円錐状表示技術等)を用いて表示する。
【0051】
なお、サイト内検索ボタンがクリックされた場合の処理は、本フローチャートと同様の処理を行う。但し、図4の※部分の処理において、サイト検索エンジン1から得る情報は、各ページpの検索スコアS(p)のみであり、利用者側DBの当該部分のみを書き換える。
【0052】
図5に、ページpに対応するノードの描画(ハイライト表示)処理の処理手順を示す。S41〜S44は処理のステップである。
【0053】
まず、L(p)、H(p)を利用者側DBより取得し(S41)、ハイライト表示するページpが葉ノード(L(p)=1)か否か判定する(S33)。この判定で葉ノードであれば、葉ノードを示す画像を、H(p)に対応させてハイライト表示し、葉ノードではなく中間ノードであれば、中間ノードを示す画像を、H(p)に対応させてハイライト表示する。H(p)の値とハイライト色の設定方法の一つは、図6のような対応表を用意しておくことである。これにより、検索にヒットしたページを検索にヒットした度合いに応じてハイライト表示することが可能となる。
【0054】
図7に、本発明によるサイト内部ナビゲーションの表示例を示す。まず、検索条件を「紳士靴」とし、この条件に合ったサイトとして「Aシューズショップ」が検索されて(a)に示すようなサイト検索結果が表示される。このサイト検索結果には、「サイト内ナビ」のリンクボタンが表示される。
【0055】
(a)のサイト検索結果の表示において、「サイト内ナビ」ボタンをクリックすると、(b)に示すような初期サイトマップが表示される。この初期サイトマップにより、サイトの内部構造(木構造)を可視化し、ヒットしたページのノードまたはヒットしたページを含むノードをハイライト表示するとともに、ハイライト表示を色の濃淡で行って、葉ノードであれば検索スコアの大小を、中間ノードであればヒットページ数を示唆する。この初期サイトマップ、あるいは以降のサイトマップには、キーワード追加による絞り込み検索のために「サイト内検索」ボタンが設けられる。
【0056】
(b)に示すようなサイトマップ表示において、キーワードを追加して「サイト内検索」ボタンをクリックすると、(c)に示すような絞り込み検索結果を示すサイトマップが初期サイトマップと同様に表示される。
【0057】
一方、(b)に示すようなサイトマップ表示において、中間ノードをクリックすると、(d)に示すようにクリックした中間ノードのリンク先ノードが展開されるとともに、そのノードが葉ノードであればヒットページの画像上の記号(この例では☆印)がハイライト色の濃淡で表示されて検索スコアの大小が示唆される。
【0058】
なお、図1で示した各部の機能実現手段をコンピュータのプログラムで構成したり、あるいは図2〜図5で示した処理のステップをコンピュータのプログラムで構成したりして、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラム、あるいは、コンピュータにその処理のステップを実行させるためのプログラムを、そのコンピュータが読み取りできる記録媒体、例えば、フレキシブルディスクや、MO、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。これらの記録媒体からコンピュータに前記のプログラムをインストールすることにより、あるいはネットワークからダウンロードしてコンピュータに前記のプログラムをインストールすることにより、本発明を実施することが可能となる。
【0059】
【発明の効果】
以上の説明で明らかなように、本発明によれば、
(1)サイト検索において、サイト運営者は、(通常の検索結果ページオープンだけでなく)自分のサイト内のナビゲーションに誘導できる。
(2)サイト検索において、検索者は、(通常の検索結果ページオープンだけでなく)サイト内のナビゲーションを行える。
(3)サイト内ナビゲーションにおいては木構造を辿る分かり易いナビゲーションができる。
【図面の簡単な説明】
【図1】本発明の一実施形態例によるサイト内検索装置の構成を示す図である。
【図2】本実施形態例によるWebサイト検索方法における事前処理を説明するフローチャートである。
【図3】本実施形態例によるWebサイト検索方法におけるサイト検索、サイト内検索時の処理を説明するフローチャートである。
【図4】図3において、サイト内ナビゲーションボタンがクリックされた際の処理手順、およびサイト内検索ボタンがクリックされた際の処理手順の詳細を示すフローチャートである。
【図5】ページpに対応するノードの描画(ハイライト表示)処理の処理手順を示すフローチャートである。
【図6】ハイライト色の設定方法の一例を示す対応表を表す図である。
【図7】本発明によるサイト内部ナビゲーションの表示例を示す図である。
【符号の説明】
1…サイト検索エンジン
2…サイト検索結果生成・ナビゲーション部
3…データベース(DB)
Claims (8)
- 事前にWebページを収集してサイトに分け、各サイト木構造を推定し、各Webページとサイトの関係および前記サイト木構造をデータベースに保存しておく過程と、
サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う過程と、
前記サイト検索端末装置にサイト内部構造情報を提示するためのリンクを持つサイト検索結果を生成する過程と、
前記生成したサイト検索結果を前記サイト検索端末装置へ送信する過程と、
前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する過程と、
前記取得したサイト木構造を基にサイト内部構造情報を生成する過程と、
前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有する
ことを特徴とするサイト内検索方法。 - 前記サイト内部構造情報を生成する過程では、サイト内検索のリンクを持たせ、
前記サイト内部構造情報を前記サイト検索端末装置へ送信する過程の後に、
前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に前記サイト木構造を基に再検索したサイト内部構造情報を生成する過程と、
前記再検索したサイト内部構造情報を前記サイト検索端末装置へ送信する過程と、を有する
ことを特徴とする請求項1に記載のサイト内検索方法。 - 前記サイト内部構造情報を生成する過程では、
サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードと識別可能に提示する
ことを特徴とする請求項1または2に記載のサイト内検索方法。 - 事前にWebページを収集してサイトに分けられ推定された各サイト木構造、および各Webページとサイトの関係を保存しておくデータベースと、
サイト検索端末装置からのサイト検索要求に基づいてヒットしたWebページについて前記データベースに対してサイト検索を行う手段と、
前記サイト木構造を提示するためのリンクを持つサイト検索結果を生成する手段と、
前記サイト検索端末装置から前記リンクが送信された場合に前記データベースから当該サイトのサイト木構造を取得する手段と、
前記取得したサイト木構造を基にサイト内部構造情報を生成する手段と、
前記生成したサイト検索結果、および前記生成したサイト内部構造情報を前記サイト検索端末装置へ送信する手段と、を有する
ことを特徴とするサイト内検索装置。 - 前記サイト内部構造情報を生成する手段は、サイト内検索のリンクを持たせるものであり、
前記サイト内部構造情報を生成する手段は、前記サイト検索端末装置から前記サイト内検索のリンクが送信された場合に再検索したサイト内部構造情報を生成するものであり、
前記サイト検索端末装置へ送信する手段は、再検索したサイト内部構造情報をも前記サイト検索端末装置へ送信するものである
ことを特徴とする請求項4に記載のサイト内検索装置。 - 前記サイト内部構造情報を生成する手段は、
サイト木構造におけるヒットしたページのノードまたはヒットしたページを含むノードを他のノードから識別可能に提示するものである
ことを特徴とする請求項4または5に記載のサイト内検索装置。 - 請求項1乃至3のいずれかに記載のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとした
ことを特徴とするWebサイト内検索プログラム。 - 請求項1乃至3のいずれかに記載のWebサイト内検索方法における過程を、コンピュータに実行させるためのプログラムとし、
前記プログラムを、前記コンピュータが読み取りできる記録媒体に記録した
ことを特徴とするWebサイト内検索プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003052316A JP2004264928A (ja) | 2003-02-28 | 2003-02-28 | Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003052316A JP2004264928A (ja) | 2003-02-28 | 2003-02-28 | Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004264928A true JP2004264928A (ja) | 2004-09-24 |
Family
ID=33117216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003052316A Pending JP2004264928A (ja) | 2003-02-28 | 2003-02-28 | Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004264928A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008269392A (ja) * | 2007-04-23 | 2008-11-06 | Yahoo Japan Corp | ウェブページ情報処理装置、ウェブページ情報処理方法、及びウェブページ情報処理プログラム |
JP2010117925A (ja) * | 2008-11-13 | 2010-05-27 | Internatl Business Mach Corp <Ibm> | 文書データを検索する装置及び方法 |
JP2010231525A (ja) * | 2009-03-27 | 2010-10-14 | Mitsubishi Space Software Kk | 検索リスト提供サーバ及び検索リスト提供方法及びプログラム |
JP2011519456A (ja) * | 2008-04-23 | 2011-07-07 | マイクロソフト コーポレーション | 的確な判断による自動完了 |
JP2015162022A (ja) * | 2014-02-26 | 2015-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 接続関係の可視化を支援する装置及び方法 |
JP2017068482A (ja) * | 2015-09-29 | 2017-04-06 | 株式会社エヌ・ティ・ティ・データ | 情報処理装置、情報処理方法、およびプログラム |
-
2003
- 2003-02-28 JP JP2003052316A patent/JP2004264928A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008269392A (ja) * | 2007-04-23 | 2008-11-06 | Yahoo Japan Corp | ウェブページ情報処理装置、ウェブページ情報処理方法、及びウェブページ情報処理プログラム |
JP2011519456A (ja) * | 2008-04-23 | 2011-07-07 | マイクロソフト コーポレーション | 的確な判断による自動完了 |
JP2010117925A (ja) * | 2008-11-13 | 2010-05-27 | Internatl Business Mach Corp <Ibm> | 文書データを検索する装置及び方法 |
JP2010231525A (ja) * | 2009-03-27 | 2010-10-14 | Mitsubishi Space Software Kk | 検索リスト提供サーバ及び検索リスト提供方法及びプログラム |
JP2015162022A (ja) * | 2014-02-26 | 2015-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 接続関係の可視化を支援する装置及び方法 |
US9990444B2 (en) | 2014-02-26 | 2018-06-05 | International Business Machines Corporation | Apparatus and method for supporting visualization of connection relationship |
JP2017068482A (ja) * | 2015-09-29 | 2017-04-06 | 株式会社エヌ・ティ・ティ・データ | 情報処理装置、情報処理方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4762063B2 (ja) | 計算機システム、プログラム及び検索エンジン検索方法 | |
JP4936401B2 (ja) | ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム | |
JP5340751B2 (ja) | 文書処理装置および文書処理方法 | |
JP5084858B2 (ja) | サマリ作成装置、サマリ作成方法及びプログラム | |
JP2007507801A (ja) | ウェブ検索の個人化 | |
JP5425906B2 (ja) | リサーチセッションの検出に基づくリサーチツールへのアクセス | |
JP2003178092A (ja) | 情報検索システム、情報提供装置及び情報検索方法並びにプログラム | |
KR100359233B1 (ko) | 웹 정보 추출 방법 및 시스템 | |
JP2006285526A (ja) | 画像データに応じた情報検索 | |
JP2010128928A (ja) | 検索システム及び検索方法 | |
JP2005107688A (ja) | 情報表示方法及びシステム及び情報表示プログラム | |
JP5959068B2 (ja) | 接続関係の可視化を支援する装置及び方法 | |
KR100557874B1 (ko) | 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 | |
JP4824070B2 (ja) | クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム | |
JP2004264928A (ja) | Webサイト内検索方法と装置、Webサイト内検索プログラムおよびこのプログラムを記録した記録媒体 | |
JP2000331020A (ja) | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 | |
JP4189387B2 (ja) | 知識検索システム、知識検索方法及びプログラム | |
JP2010286888A (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
JP4120597B2 (ja) | 部分コンテンツ作成方法及び装置及びプログラム | |
JP2004220267A (ja) | 画像検索方法および装置と画像検索プログラムおよび該プログラムを記録した記録媒体 | |
JP2011039743A (ja) | WWW情報閲覧システムと方法およびWebブラウザとプログラム | |
JP4567581B2 (ja) | 操作検索方法及び装置及びコンピュータ読み取り可能な記録媒体 | |
JP3604069B2 (ja) | 文書間関連度計算装置、その方法およびその記録媒体 | |
JP2003186901A (ja) | Webサイト検索方法とシステム、並びに、この方法の実行プログラムとこの方法の実行プログラムを記録した記録媒体 | |
JP5519406B2 (ja) | サーバ装置、ジャンルスコア算出方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070508 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071211 |